(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023134170
(43)【公開日】2023-09-27
(54)【発明の名称】記憶媒体管理装置、記憶媒体管理方法および記憶媒体管理プログラム
(51)【国際特許分類】
G06F 3/06 20060101AFI20230920BHJP
【FI】
G06F3/06 540
G06F3/06 304R
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022039539
(22)【出願日】2022-03-14
(71)【出願人】
【識別番号】000227205
【氏名又は名称】NECプラットフォームズ株式会社
(74)【代理人】
【識別番号】100106909
【弁理士】
【氏名又は名称】棚井 澄雄
(74)【代理人】
【識別番号】100134544
【弁理士】
【氏名又は名称】森 隆一郎
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(72)【発明者】
【氏名】柴 和一
(57)【要約】
【課題】故障リスクが高い記憶媒体をより正確に予測し、リビルド時間を短縮する。
【解決手段】HDD情報収集部211は、RAIDアレイを構成する複数の物理ディスクHDD1~HDD3の動作状態を収集する。統計情報解析部212は、収集された複数の物理ディスクHDD1~HDD3の動作状態に相対的な差異があるか否かを判断する。故障HDD予測部213は、動作状態の相対的な差異に基づいて、故障リスクが最も高い物理ディスクを予測する。HDDコピー制御部214は、予測された故障リスクが最も高い物理ディスクのデータを、スタンバイディスクSHDDにコピーする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
RAIDアレイを構成する複数の記憶媒体の動作状態を収集する収集手段と、
前記収集手段により収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断する動作状態判断手段と、
前記動作状態判断手段による判断結果に基づいて、故障リスクが最も高い記憶媒体を予測する予測手段と、
前記予測手段によって予測された、前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするコピー制御手段と、
を備えることを特徴とする記憶媒体管理装置。
【請求項2】
前記コピー制御手段は、データの書き込み要請があった場合、前記予測された記憶媒体にデータを書き込むとともに、前記スタンバイ記憶媒体にも同じデータを書き込むことを特徴とする請求項1に記載の記憶媒体管理装置。
【請求項3】
前記コピー制御手段は、前記故障リスクが最も高い記憶媒体が故障した場合、前記故障リスクが最も高い記憶媒体に替えて、前記スタンバイ記憶媒体を前記複数の記憶媒体の1つとして組み込むことを特徴とする請求項2記載の記憶媒体管理装置。
【請求項4】
前記コピー制御手段は、前記動作状態判断手段により動作状態に差異がないと判断された場合、前記複数の記憶媒体のうち、任意の記憶媒体のデータを、前記スタンバイ記憶媒体にコピーすることを特徴とする請求項3に記載の記憶媒体管理装置。
【請求項5】
前記動作状態は、前記複数の記憶媒体の各々の稼働時間、応答速度、エラーレート、および代替えセクタ登録数の少なくとも1つを含む、ことを特徴とする請求項1乃至4のいずれか一項に記載の記憶媒体管理装置。
【請求項6】
RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理方法であって、
前記複数の記憶媒体の動作状態を収集するステップと、
前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、
前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、
前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、
を含むことを特徴とする記憶媒体管理方法。
【請求項7】
RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理装置のコンピュータに、
前記複数の記憶媒体の動作状態を収集するステップと、
前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、
前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、
前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、
を実行させることを特徴とする記憶媒体管理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、記憶媒体管理装置、記憶媒体管理方法および記憶媒体管理プログラムに関する。
【背景技術】
【0002】
近年、RAID(Redundant Arrays of Inexpensive Disks、または Redundant Arrays of Independent Disks)システムにおいて、物理ディスクの容量増加に伴い、物理ディスクが故障した際、RAIDのリビルド(再構築)処理に多大な時間を要している。そこで、リビルド処理時間を短縮するために、例えば、エラー統計値が所定の閾値を越えた場合に被疑ディスク装置と判定した復元モード設定中の装置からのアクセス空き時間に、被疑ディスク装置のアドレス範囲を指定しながらデータを予備ディスクへ順次コピーして復元する技術が提案されている(例えば、特許文献1)。なおリビルド処理は、複数のHDD等の物理ディスクを使ってRAIDシステムを構築して運用しており、そのRAIDシステムにおいてあるディスクが故障してしまった場合に故障していない他のHDDから故障したディスク内のデータを復元・再構築し直すことなどの処理をいう。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1による方法では、ディスク装置(記憶媒体)の各種の故障、例えばモータストップ、媒体欠陥エラー、モードエラーなどのエラー種別について、予め加算値を設定しておき、エラー発生ごとに対応する加算値をエラー統計加算値とし、該エラー統計加算値が所定の閾値を越えたディスク装置を被疑ディスク装置として特定している。しかしながら、エラー統計加算値が所定の閾値を超えたからといって、その被疑ディスク装置が将来故障するとは限らなかった。ゆえに、将来故障するリスクが高いディスク装置を正確に特定できず、他のディスク装置が故障してしまう可能性があり、結果として、リビルド処理に多大な時間を要してしまうという問題がった。
【0005】
そこで本発明は、故障リスクが高い記憶媒体をより正確に予測し、リビルド時間を短縮する記憶媒体管理装置、記憶媒体管理方法および記憶媒体管理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
上述した課題を解決するために、本発明の一態様は、RAIDアレイを構成する複数の記憶媒体の動作状態を収集する収集手段と、前記収集手段により収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断する動作状態判断手段と、前記動作状態判断手段による判断結果に基づいて、故障リスクが最も高い記憶媒体を予測する予測手段と、前記予測手段によって予測された、前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするコピー制御手段と、を備えることを特徴とする。
【0007】
また、本発明の一態様は、RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理方法であって、前記複数の記憶媒体の動作状態を収集するステップと、前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、を含むことを特徴とする。
【0008】
また、本発明の一態様は、RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理装置のコンピュータに、前記複数の記憶媒体の動作状態を収集するステップと、前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、を実行させることを特徴とする。
【発明の効果】
【0009】
以上説明したように、故障リスクが高い記憶媒体をより正確に予測し、リビルド時間を短縮することができるという利点が得られる。
【図面の簡単な説明】
【0010】
【
図1】本発明の本実施形態によるRAIDコントローラ(記憶媒体管理装置)20を適用したサーバシステムの構成を示すブロック図である。
【
図2】本実施形態によるRAIDコントローラ20が定期的に実行する動作を説明するためのフローチャートである。
【
図3】本実施形態によるRAIDコントローラ20の通常時の動作を説明するためのフローチャートである。
【
図4】本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【
図5】本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【
図6】本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【
図7】本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【
図8】本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【
図9】本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【
図10】本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【
図11】本実施形態による記憶媒体管理装置の最小構成を示すブロック図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施の形態を、図面を参照して説明する。
【0012】
A.実施形態
図1は、本実施形態によるRAIDコントローラ(記憶媒体管理装置)を適用したサーバシステムの構成を示すブロック図である。サーバシステム1は、OS(Operating System)10、RAIDコントローラ20、およびディスクアレイ30から構成される。OS10は、RAIDドライバ11およびRAID管理ユーティリティ12からなる。RAIDドライバ11は、ディスクアレイ30との間でデータを送受信(読み出し/書き込み)するためのソフトウェアである。RAID管理ユーティリティ12は、OSレベルで、ディスクアレイ30との間でデータを読み出し/書き込みを管理するために用いられるソフトウェアである。
【0013】
RAIDコントローラ20は、RAIDファームウェア21を含み、RAIDファームウェア21は、HDD情報収集部211、統計情報解析部212、故障HDD予測部213、およびHDDコピー制御部214を備えている。ディスクアレイ30は、RAID5を構成する物理ディスクHDD1、HDD2、HDD3、およびスタンバイディスクSHDDを有する。RAID5は、複数の外部記憶装置(ハードディスクなど)をまとめて一台の装置として管理する技術である。本実施形態において、物理ディスクHDD1、HDD2、HDD3、およびスタンバイディスクSHDDは、ハードディスクを想定しているが、これに限らず、SSD(Solid State Drive)などの半導体記憶媒体であってもよい。
【0014】
HDD情報収集部211は、定期的に、ディスクアレイ30の各物理ディスクHDD1~HDD3の統計情報を収集する。統計情報は、稼働時間、応答速度、エラーレート、代替えセクタ登録数などの少なくとも1つの動作状態を示す情報である。統計情報解析部212は、収集した物理ディスクHDD1~HDD3の稼働時間、応答速度、エラーレート、代替えセクタ登録数などの少なくとも1つの動作状態を含む統計情報を解析する。解析方法については後述する。
【0015】
故障HDD予測部213は、統計情報解析部212により解析された、物理ディスクHDD1~HDD3の統計情報の解析結果に基づいて、RAIDコントローラ20に接続された複数の物理ディスクHDD1~HDD3の中から今後故障するリスクの最も高いHDDm(m=1、2、or3)を特定する。HDDコピー制御部214は、特定された今後故障するリスクの最も高いHDDmのデータをスタンバイディスクSHDDにコピーする。
【0016】
B.実施形態の動作
図2は、本実施形態によるRAIDコントローラ20が定期的に実行する動作を説明するためのフローチャートである。
図4~
図6は、本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【0017】
図2に示すフローチャートは、定期的(例えば、1週間毎)に実行される。HDD情報収集部211は、ディスクアレイ30の各物理ディスクHDD1~HDD3の稼働時間、応答速度、エラーレート、代替えセクタ登録数などの統計情報を収集する(ステップS10)。統計情報解析部212は、収集した物理ディスクHDD1~HDD3の稼働時間、応答速度、エラーレート、代替えセクタ登録数を示す統計情報を解析し、物理ディスクHDD1~HDD3の動作状態に今後故障するリスクがあることを十分に予測し得るだけの差異があるか否かを判断する(ステップS12)。例えば、論理ドライブを構成するメンバーの物理ディスクHDD1~HDD3の統計情報を解析し、僅かでも稼働時間が長い、応答速度が遅い、エラーレートが大きい、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異(劣化を示す差異)があるか否かを判断する。
【0018】
そして、収集した物理ディスクHDD1~HDD3のそれぞれの統計情報に含まれる少なくとも1つの動作状態に差異がない場合には(ステップS14のNO)、HDDコピー制御部214は、任意の物理ハードディスクHDDn(n=1、2、or3)を選定し(例えば、HDD2)、物理ハードディスクHDDnのデータをスタンバイディスクSHDDにコピーする(ステップS16)。例えば、
図4に示すように、物理ディスクHDD2を選定し、物理ディスクHDD2のデータをスタンバイディスクSHDDにコピーする。その後、当該処理を終了する。
【0019】
一方、収集した物理ディスクHDD1~HDD3のそれぞれの統計情報に含まれる少なくとも1つの動作状態に、今後故障するリスクがあることを十分に予測し得るだけの差異がある場合には(ステップS14のYES)、故障HDD予測部213は、統計情報解析部212により解析された解析結果、すなわち、物理ディスクHDD1~HDD3の少なくとも1つの動作状態(稼働時間、応答速度、エラーレート、代替えセクタ登録数など)の相対的な差異に基づいて、RAIDコントローラ20に接続された複数の物理ディスクHDD1~HDD3の中から今後故障するリスクの最も高い物理ディスクHDDm(m=1、2、or3)を特定する(ステップS18)。
【0020】
例えば、故障HDD予測部213は、論理ドライブを構成するメンバーの物理ディスクHDD1~HDD3のうち、僅かでも稼働時間が長い、応答速度が遅い、エラーレートが大きい、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異がある物理ハードディスクを、故障するリスクの最も高い物理ディスクHDDmとして特定する。例えば、
図5に示すように、物理ディスクHDD2が他の物理ディスクに対して僅かでも稼働時間が長い、応答速度が遅い、代替えセクタ登録数が多いという差異がある場合には、物理ディスクHDD2が、今後故障するリスクの最も高いと予測される物理ディスクHDDmとして特定される。
【0021】
なお、「僅か」については「差異」に対して予め閾値を設定し、当該閾値を超えた場合に、その物理ディスクを、今後故障するリスクが最も高い物理ディスクHDDmと予測してもよい。また、稼働時間、応答速度、代替えセクタ登録数のうち、どの動作状態を用いて判断するかについては、それぞれの動作状態に重み付けしてもよいし、優先順位を設定するようにしてもよい。また、稼働時間、応答速度、代替えセクタ登録数のうち、少なくとも1つを判断条件としてもよいし、2つ以上を組み合わせて判断条件としてもよい。
【0022】
次に、故障HDD予測部213は、前回特定した故障リスクの高い物理ディスクHDDp(p=1、2、or3)よりも、今回特定した故障リスクの高い物理ディスクHDDmの方が、故障リスクが高いか否かを判断する(ステップS20)。故障リスクが高いか低いかは、それぞれの稼働時間、応答速度、代替えセクタ登録数などの大小に基づいて判断すればよい。そして、今回特定した故障リスクの高い物理ディスクHDDmの故障リスクの方が、前回特定した故障リスクの高い物理ディスクHDDpよりも低い場合には(ステップS20のNO)、何もせずに当該処理を終了する。
【0023】
一方、今回特定した故障リスクの高い物理ディスクHDDmの方が、故障リスクが前回特定した故障リスクの高い物理ディスクHDDpよりも高い場合には(ステップS20のYES)、HDDコピー制御部214は、今回特定された故障するリスクの最も高い物理ディスクHDDmのデータをスタンバイディスクSHDDにコピーする(ステップS22)。
【0024】
例えば、今回物理ディスクHDD3が故障リスクの高い物理ディスクHDDmとして特定された場合、稼働時間が長い、応答速度が遅い、代替えセクタ登録数が多いなど、当該物理ディスクHDD3の故障リスクの方が前回特定した故障リスクの高い物理ディスクHDD2よりも高ければ、
図6に示すように、物理ディスクHDD2から物理ディスクHDD3に切り替え、今回特定された故障するリスクの最も高い物理ディスクHDD3のデータをスタンバイディスクSHDDにコピーする。その後、当該処理を終了する。
【0025】
図3は、本実施形態によるRAIDコントローラ20の通常時の動作を説明するためのフローチャートである。また、
図7~
図10は、本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
【0026】
図3に示すフローチャートは、上位のOS10や、アプリケーションなどから書き込み要求が入った場合に実行される。RAIDコントローラ20では、上位のOS10や、アプリケーションなどから書き込み要求が入った場合、HDDコピー制御部214が、故障するリスクが高いと特定された物理ディスクHDDmにデータを書き込むとともに、スタンバイディスクSHDDにも同じデータを書き込む(ステップS30)。例えば、故障するリスクの最も高い物理ディスクが物理ディスクHDD2である場合、
図7に示すように、物理ディスクHDD2にデータを書き込むとともに、スタンバイディスクSHDDにも同じデータを書き込む。
【0027】
次に、RAIDコントローラ20は、故障するリスクが高いと特定された物理ディスクHDDmが実際に故障したか否かを判断する(ステップS32)。そして、故障するリスクが高いと特定された物理ディスクHDDmがまだ故障していない場合には(ステップS32のNO)、何もせずに当該処理を終了する。
【0028】
一方、故障するリスクが高いと特定された物理ディスクHDDmが実際に故障した場合には(ステップS32のYES)、RAIDコントローラ20は、故障した物理ディスクHDDmを切り離し、当該故障した物理ディスクHDDmと同じデータを書き込んでいたスタンバイディスクSHDDを新たにハードディスク装置(RAID)に組み込む(ステップS34)。例えば、
図8に示すように、故障するリスクが高いと特定された物理ディスクHDD2が実際に故障した場合、故障した物理ディスクHDD2を切り離し、当該故障した物理ディスクHDD2と同じデータを書き込んでいたスタンバイディスクSHDDを物理ディスクHDD2としてRAIDに組み込む。ゆえに、リビルド作業が不要になるため、システムダウンやデータロストの発生を防止できる。その後、当該処理を終了する。
【0029】
なお、故障HDD予測部213によって故障リスクが高いと予測した物理ディスクHDD2ではなく、他の物理ディスク、例えば、物理ディスクHDD1が故障した場合には、
図9に示すように、残りの物理ディスクHDD2および物理ディスクHDD3からスタンバイディスクSHDDにデータを書き込む動作、所謂リビルド処理が行われる。この場合には、リビルド処理が必要となる。
【0030】
しかしながら、上述したように、本実施形態では、僅かでも稼働時間が長い、応答速度が遅い、エラーレートが大きい、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異がある物理ハードディスクを、故障するリスクの最も高い物理ディスクHDDmとして特定している。したがって、本実施形態によれば、単に一意に設定した閾値を超えたことを判断基準とする方法に比べ、今後故障するリスクの最も高い物理ディスクHDDmをより正確に予測することができるので、リビルド処理が必要となる状況は発生しにくい。
【0031】
故障した物理ディスクHDD2を新たな物理ディスクHDD2new交換すると、
図10に示すように、物理ディスクHDD2newは、自動的にスタンバイディスクSHDDに設定される。スタンバイディスクSHDDの設定が完了した後、RAIDコントローラ20は、
図2に示すフローチャートを実行し、物理ディスクHDD1~HDD3の中から今後故障リスクが最も高い物理ディスクHDDmを特定し、スタンバイディスクSHDD(HDD2new)にデータがコピーされる。
【0032】
上述した実施形態によれば、僅かでも稼働時間が長い、応答速度が遅い、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異がある物理ハードディスクを、故障するリスクの最も高い物理ディスクHDDmとして特定するので、今後故障するリスクの最も高い物理ディスクをより正確に予測することができる。そして、故障するリスクの最も高い物理ディスクHDDmのデータを、故障する前に予めスタンバイディスクSHDDにデータをコピーしておくことで、実際に故障した場合であっても、故障した物理ディスクに切り替えてスタンバイディスクSHDDをRAIDに組み込むようにしたので、リビルド時間を短縮することができる。
【0033】
図11は、本実施形態による記憶媒体管理装置の最小構成を示すブロック図である。
本実施形態による記憶媒体管理装置50は、少なくとも、RAIDアレイ51を構成する複数の記憶媒体52~54、スタンバイ記憶媒体55、収集手段56、動作状態判断手段57、予測手段58、コピー制御手段59を備えればよい。複数の記憶媒体52~54は、RAIDアレイ(RAID5)を構成する。収集手段56は、複数の記憶媒体52~54の動作状態を収集する。動作状態判断手段57は、収集された複数の記憶媒体52~54の動作状態に相対的な差異があるか否かを判断する。予測手段58は、動作状態判断手段57による判断結果に基づいて、故障リスクが最も高い記憶媒体を予測する。コピー制御手段59は、予測手段58によって予測された、故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体55にコピーする。
【0034】
なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより特典情報の制御処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0035】
また、上述した機能の一部または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。上述した各機能は個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
【符号の説明】
【0036】
1 サーバシステム
10 OS
11 RAIDドライバ
12 RAID管理ユーティリティ
20 RAIDコントローラ
21 RAIDファームウェア
211 HDD情報収集部
212 統計情報解析部
213 故障HDD予測部
214 HDDコピー制御部
30 ディスクアレイ
HDD1~HDD3 物理ディスク
SHDD スタンバイディスク
【手続補正書】
【提出日】2023-07-12
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
RAIDアレイを構成する複数の記憶媒体の動作状態を収集する収集手段と、
前記収集手段により収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断する動作状態判断手段と、
前記動作状態判断手段による判断結果に基づいて、故障リスクが最も高い記憶媒体を予測する予測手段と、
前記予測手段によって予測された、前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするコピー制御手段と、
を備え、
前記コピー制御手段は、故障リスクが最も高いと予測した記憶媒体が前回と異なる場合に、故障リスクが最も高いと今回予測した記憶媒体のデータを前記スタンバイ記憶媒体にコピーする
ことを特徴とする記憶媒体管理装置。
【請求項2】
前記コピー制御手段は、データの書き込み要請があった場合、前記予測された記憶媒体にデータを書き込むとともに、前記スタンバイ記憶媒体にも同じデータを書き込むことを特徴とする請求項1に記載の記憶媒体管理装置。
【請求項3】
前記コピー制御手段は、前記故障リスクが最も高い記憶媒体が故障した場合、前記故障リスクが最も高い記憶媒体に替えて、前記スタンバイ記憶媒体を前記複数の記憶媒体の1つとして組み込むことを特徴とする請求項2記載の記憶媒体管理装置。
【請求項4】
前記コピー制御手段は、前記動作状態判断手段により動作状態に差異がないと判断された場合、前記複数の記憶媒体のうち、任意の記憶媒体のデータを、前記スタンバイ記憶媒体にコピーすることを特徴とする請求項3に記載の記憶媒体管理装置。
【請求項5】
前記動作状態は、前記複数の記憶媒体の各々の稼働時間、応答速度、エラーレート、および代替えセクタ登録数の少なくとも1つを含む、ことを特徴とする請求項1乃至4のいずれか一項に記載の記憶媒体管理装置。
【請求項6】
RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理装置の記憶媒体管理方法であって、
前記複数の記憶媒体の動作状態を収集するステップと、
前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、
前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、
前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、
故障リスクが最も高いと予測した記憶媒体が前回と異なる場合に、故障リスクが最も高いと今回予測した記憶媒体のデータを前記スタンバイ記憶媒体にコピーするステップと、
を含むことを特徴とする記憶媒体管理方法。
【請求項7】
RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理装置のコンピュータに、
前記複数の記憶媒体の動作状態を収集するステップと、
前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、
前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、
前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、
故障リスクが最も高いと予測した記憶媒体が前回と異なる場合に、故障リスクが最も高いと今回予測した記憶媒体のデータを前記スタンバイ記憶媒体にコピーするステップと、
を実行させることを特徴とする記憶媒体管理プログラム。