特開2024-133932 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立情報通信エンジニアリングの特許一覧

特開2024-133932ストレージシステム、ストレージシステムの制御方法、及び記憶デバイス

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3A
3B
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024133932

(43)【公開日】2024-10-03

(54)【発明の名称】ストレージシステム、ストレージシステムの制御方法、及び記憶デバイス

(51)【国際特許分類】

G06F 3/06 20060101AFI20240926BHJP

G06F 11/07 20060101ALI20240926BHJP

【ＦＩ】

G06F3/06 305C

G06F3/06 304N

G06F3/06 540

G06F11/07 196

【審査請求】未請求

【請求項の数】15

【出願形態】ＯＬ

(21)【出願番号】P 2023043962

(22)【出願日】2023-03-20

(71)【出願人】

【識別番号】000233295

【氏名又は名称】株式会社日立情報通信エンジニアリング

(74)【代理人】

【識別番号】110001678

【氏名又は名称】藤央弁理士法人

(72)【発明者】

【氏名】小村和久

(72)【発明者】

【氏名】川瀬昭雄

【テーマコード（参考）】

5B042

【Ｆターム（参考）】

5B042GA34

5B042KK17

(57)【要約】

【課題】記憶デバイスの一時的な負荷の上昇によるＩ／Ｏ処理の低下に伴う記憶デバイスの閉塞を回避する。
【解決手段】ストレージシステムは、複数の記憶デバイス及びストレージコントローラを有する。記憶デバイスは、複数の不揮発性記憶素子を有し、複数の記憶デバイスは、データ及びパリティの書き込みを伴うＲＡＩＤを構成する。ストレージコントローラは、第１記憶デバイスから、一時的な負荷の高まりによってＩ／Ｏ処理が遅延する可能性が発生したことを示す遅延リスク通知情報を取得し、遅延リスク通知情報の受信後、第１記憶デバイスに格納されるデータのリードを伴うリード処理を実行する場合、ＲＡＩＤを構成する他の記憶デバイスに格納されるパリティ及びデータを読み出し、パリティ及びデータを用いて、第１記憶デバイスから読み出すデータを生成し、他の記憶デバイスから読み出されたデータ及び生成されたデータを応答する。
【選択図】図３Ｂ

【特許請求の範囲】

【請求項1】

複数の記憶デバイス及び少なくとも一つのストレージコントローラを備えるストレージシステムであって、
前記複数の記憶デバイスの各々は、複数の不揮発性記憶素子を有し、
前記複数の記憶デバイスは、データ及びパリティの書き込みを伴うＲＡＩＤを構成し、
前記少なくとも一つのストレージコントローラは、
第１記憶デバイスから、一時的な負荷の高まりによってＩ／Ｏ処理が遅延する可能性が発生していることを示す第１遅延リスク通知情報を取得し、
前記第１遅延リスク通知情報の受信後、前記第１記憶デバイスに格納されるデータのリードを伴うリード処理を実行する場合、前記ＲＡＩＤを構成する他の前記記憶デバイスに格納されるパリティ及びデータを読み出し、
読み出された前記パリティ及び読み出された前記データを用いて、前記第１記憶デバイスから読み出すデータを生成し、
他の前記記憶デバイスから読み出されたデータ及び生成された前記データを応答することを特徴とするストレージシステム。

【請求項2】

請求項１に記載のストレージシステムであって、
前記少なくとも一つのストレージコントローラは、前記第１記憶デバイスに対するリード処理の実行要求の応答、前記第１記憶デバイスに対するライト処理の実行要求の応答、及び前記第１記憶デバイスの状態を監視するためのコマンドの応答の少なくともいずれかに含まれる、前記第１遅延リスク通知情報を取得することを特徴とするストレージシステム。

【請求項3】

請求項１に記載のストレージシステムであって、
前記少なくとも一つのストレージコントローラは、前記第１記憶デバイスに対するライト処理の実行要求の応答、及び、前記第１記憶デバイスの状態を監視するためのコマンドの応答の少なくともいずれかに含まれる、前記可能性が発生していないことを示す第２遅延リスク通知情報を取得することを特徴とするストレージシステム。

【請求項4】

請求項３に記載のストレージシステムであって、
前記少なくとも一つのストレージコントローラは、前記第１記憶デバイスから、前記第１遅延リスク通知情報を取得してから所定時間内に前記第２遅延リスク通知情報を取得できなかった場合、前記第１記憶デバイスを閉塞することを特徴とするストレージシステム。

【請求項5】

請求項４に記載のストレージシステムであって、
前記第１遅延リスク通知情報は、一時的な負荷の高まりの要因を示す情報を含み、
前記要因毎に、前記所定時間が異なることを特徴とするストレージシステム。

【請求項6】

複数の記憶デバイス及び少なくとも一つのストレージコントローラを有するストレージシステムの制御方法であって、
前記複数の記憶デバイスの各々は、複数の不揮発性記憶素子を有し、
前記複数の記憶デバイスは、データ及びパリティの書き込みを伴うＲＡＩＤを構成し、
前記ストレージシステムの制御方法は、
前記少なくとも一つのストレージコントローラが、第１記憶デバイスから、一時的な負荷の高まりによってＩ／Ｏ処理が遅延する可能性が発生していることを示す第１遅延リスク通知情報を取得する第１のステップと、
前記少なくとも一つのストレージコントローラが、前記第１遅延リスク通知情報の受信後、前記第１記憶デバイスに格納されるデータのリードを伴うリード処理を実行する場合、前記ＲＡＩＤを構成する他の前記記憶デバイスに格納されるパリティ及びデータを読み出す第２のステップと、
前記少なくとも一つのストレージコントローラが、読み出された前記パリティ及び読み出された前記データを用いて、前記第１記憶デバイスから読み出すデータを生成する第３のステップと、
前記少なくとも一つのストレージコントローラが、他の前記記憶デバイスから読み出されたデータ及び生成された前記データを応答する第４のステップと、を含むことを特徴とするストレージシステムの制御方法。

【請求項7】

請求項６に記載のストレージシステムの制御方法であって、
前記第１のステップは、前記少なくとも一つのストレージコントローラが、前記第１記憶デバイスに対するリード処理の実行要求の応答、前記第１記憶デバイスに対するライト処理の実行要求の応答、及び前記第１記憶デバイスの状態を監視するためのコマンドの応答の少なくともいずれかに含まれる、前記第１遅延リスク通知情報を取得するステップを含むことを特徴とするストレージシステムの制御方法。

【請求項8】

請求項６に記載のストレージシステムの制御方法であって、
前記少なくとも一つのストレージコントローラが、前記第１記憶デバイスに対するライト処理の実行要求の応答、及び、前記第１記憶デバイスの状態を監視するためのコマンドの応答の少なくともいずれかに含まれる、前記可能性が発生していないことを示す第２遅延リスク通知情報を取得するステップを含むことを特徴とするストレージシステムの制御方法。

【請求項9】

請求項８に記載のストレージシステムの制御方法であって、
前記少なくとも一つのストレージコントローラが、前記第１記憶デバイスから、前記第１遅延リスク通知情報を受信してから所定時間内に前記第２遅延リスク通知情報を受信しなかった場合、前記第１記憶デバイスを閉塞するステップを含むことを特徴とするストレージシステムの制御方法。

【請求項10】

請求項９に記載のストレージシステムの制御方法であって、
前記第１遅延リスク通知情報は、一時的な負荷の高まりの要因を示す情報を含み、
前記要因毎に、前記所定時間が異なることを特徴とするストレージシステムの制御方法。

【請求項11】

記憶デバイスであって、
デバイスコントローラと、複数の不揮発性記憶素子を備え、
一時的な負荷の高まりによってＩ／Ｏ処理が遅延する可能性が発生したことを検知した場合、前記可能性が発生したことを通知するための第１遅延リスク通知情報を生成し、
前記第１遅延リスク通知情報を出力することを特徴とする記憶デバイス。

【請求項12】

請求項１１に記載の記憶デバイスであって、
リード処理の実行要求の応答、ライト処理の実行要求の応答、及び状態を監視するためのコマンドの応答の少なくともいずれかに、前記第１遅延リスク通知情報を含めることを特徴とする記憶デバイス。

【請求項13】

請求項１１に記載の記憶デバイスであって、
前記可能性の発生が検知されていない場合、前記可能性が発生していないことを通知するための第２遅延リスク通知情報を生成し、
前記第２遅延リスク通知情報を出力することを特徴とする記憶デバイス。

【請求項14】

請求項１３に記載の記憶デバイスであって、
ライト処理の実行要求の応答、及び状態を監視するためのコマンドの応答の少なくともいずれかに、前記第２遅延リスク通知情報を含めることを特徴とする記憶デバイス。

【請求項15】

請求項１１に記載の記憶デバイスであって、
前記第１遅延リスク通知情報は、一時的な負荷の高まりの要因を示す情報を含むことを特徴とする記憶デバイス。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、不揮発性記憶素子を有する記憶デバイスを搭載するストレージシステムの制御技術に関する。

【背景技術】

【0002】

ＮＡＮＤ型フラッシュメモリ等の不揮発性記憶素子を有する記憶デバイスを搭載するストレージシステムの導入が進んでいる。本明細書では、「記憶デバイス」は不揮発性記憶素子を有する記憶デバイスを表すものとする。

【0003】

ストレージシステムでは、耐障害性を高めるためにＲＡＩＤを構成する。ＲＡＩＤグループを構成する一つの記憶デバイスについて、Ｉ／Ｏ処理の遅延が所定時間以上、継続した場合、ストレージシステムは、記憶デバイスの障害と判定し、当該記憶デバイスを閉塞する。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１９－１６０１２４号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

記憶デバイスは、不揮発性記憶素子の特性に起因するデータの移動及び復旧等の処理を実行する。前述の処理によって、記憶デバイスの負荷が一時的に増大する。記憶デバイスが前述の処理の実行中にＩ／Ｏ処理の実行要求を受け付けた場合、Ｉ／Ｏ処理の遅延が所定時間以上、継続し、閉塞される可能性がある。記憶デバイスの閉塞に伴って、データ復旧及び記憶デバイスの交換等の保全作業が必要となり、運用への影響が大きい。

【0006】

記憶デバイスの容量の増加に伴って、前述の処理に起因して一時的に負荷が高くなるケースが増加することが予測される。したがって、一時的な負荷の上昇によってＩ／Ｏ処理の遅延が発生した場合でも、記憶デバイスを閉塞せず、使用を継続することが重要である。

【0007】

前述のような記憶デバイスの閉塞は、ストレージシステムのコントローラが記憶デバイスの状態を把握できないことが要因である。この課題に対して、特許文献１に記載の技術が知られている。特許文献１には「ストレージ装置の状態情報の受信結果に基づき前記ストレージ装置の種類を識別する識別部２４と、識別した種類が第１のストレージ装置である場合、第１のストレージ装置から、前記第１のストレージ装置の第１の性能情報を受信し、前記第１の性能情報を、受信した期間ごとに対応づけたテーブルのデータとしてデータベース２１に格納する、第１の処理を実行する第１処理部２ａと、識別した種類が第２のストレージ装置である場合、第２のストレージ装置から、前記第２のストレージ装置の第２の性能情報を受信してテキスト形式のファイルのデータとして記憶部２２に格納する、第２の処理を実行する第２処理部２ｂと、識別した種類に応じて、前記第１の処理の実行、又は、前記第２の処理の実行、を切り替える切替部２４と、をそなえる。」ことが記載されている。

【0008】

特許文献１に記載の技術を用いることによって、記憶デバイスの性能情報を取得することができる。しかし、特許文献１に技術を用いて取得される性能情報を用いても、記憶デバイスの一時的な負荷の上昇を把握することは難しい。

【0009】

本発明は、記憶デバイスの一時的な負荷の上昇によるＩ／Ｏ処理の低下に伴う記憶デバイスの閉塞を回避する技術を提供する。

【課題を解決するための手段】

【0010】

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、複数の記憶デバイス及び少なくとも一つのストレージコントローラを備えるストレージシステムであって、前記複数の記憶デバイスの各々は、複数の不揮発性記憶素子を有し、前記複数の記憶デバイスは、データ及びパリティの書き込みを伴うＲＡＩＤを構成し、前記少なくとも一つのストレージコントローラは、第１記憶デバイスから、一時的な負荷の高まりによってＩ／Ｏ処理が遅延する可能性が発生したことを示す第１遅延リスク通知情報を取得し、前記第１遅延リスク通知情報の受信後、前記第１記憶デバイスに格納されるデータのリードを伴うリード処理を実行する場合、前記ＲＡＩＤを構成する他の前記記憶デバイスに格納されるパリティ及びデータを読み出し、前記パリティ及び前記データを用いて、前記第１記憶デバイスから読み出すデータを生成し、他の前記記憶デバイスから読み出されたデータ及び生成された前記データを応答する。

【発明の効果】

【0011】

本発明によれば、ストレージシステムは、記憶デバイスの一時的な負荷の上昇によるＩ／Ｏ処理の低下に伴う記憶デバイスの閉塞を回避することができる。

【図面の簡単な説明】

【0012】

【図1】実施例１のシステムの一例を示す図である。

【図2】実施例１の状態管理情報のデータ構造の一例を示す図である。

【図3A】実施例１のストレージシステムのリード処理の流れを説明するシーケンス図である。

【図3B】実施例１のストレージシステムのリード処理の流れを説明するシーケンス図である。

【図4】実施例１のストレージコントローラが実行するリード制御処理の一例を説明するフローチャートである。

【図5】実施例１のストレージコントローラが実行する状態管理情報の更新処理の一例を説明するフローチャートである。

【図6】実施例１のストレージシステムのライト処理の流れを説明するシーケンス図である。

【図7】実施例１のストレージコントローラが実行する閉塞判定処理の一例を説明するフローチャートである。

【発明を実施するための形態】

【0013】

以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。

【0014】

以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。

【0015】

本明細書等における「第１」、「第２」、「第３」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。

【0016】

図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。

【実施例0017】

図１は、実施例１のシステムの一例を示す図である。

【0018】

システムは、ストレージシステム１００及び複数のホスト計算機１０１を含む。ホスト計算機１０１は、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、又はＳＡＮ（ＳｔｏｒａｇｅＡｒｅａＮｅｔｗｏｒｋ）等のネットワークを介して、ストレージシステム１００と接続する。なお、本発明は、ストレージシステム１００に接続するホスト計算機１０１の数に限定されない。

【0019】

ホスト計算機１０１はストレージシステム１００を利用する計算機である。ホスト計算機１０１は、ストレージシステム１００が提供するボリュームに対してデータのライト及びデータのリードを行う。

【0020】

ストレージシステム１００は、ストレージコントローラ１１０及び記憶デバイス１１１を有する。図１では、ストレージコントローラ１１０は一つであるが、二つ以上でもよい。ストレージシステム１００は、複数の記憶デバイス１１１からＲＡＩＤ（ＲｅｄｕｎｄａｎｔＡｒｒａｙｓｏｆＩｎｅｘｐｅｎｓｉｖｅＤｉｓｋｓ）グループを生成し、ＲＡＩＤグループからボリュームを生成し、ホスト計算機１０１に提供する。ボリュームは、例えば、ＬＤＥＶである。なお、複数のＬＤＥＶから構成されるボリュームでもよい。

【0021】

ストレージコントローラ１１０は、ストレージシステム１００全体を制御する。例えば、ストレージコントローラ１１０は、ＲＡＩＤグループの管理、ボリュームの管理、及びＩ／Ｏ処理の制御等を行う。ストレージコントローラ１１０は、図示しない、プロセッサ、メモリ、ホストＩＦ、及びドライブＩＦを有する。メモリは、ストレージシステム１００を制御するためのプログラムを格納し、また、キャッシュメモリとしても用いられる。

【0022】

記憶デバイス１１１は、ＮＡＮＤ型フラッシュメモリ等の不揮発性記憶素子を有する記憶デバイスである。記憶デバイス１１１は、デバイスコントローラ１２０及び複数のフラッシュメモリ（ＦＭ）チップ１２１を有する。

【0023】

デバイスコントローラ１２０は、記憶デバイス１１１全体を制御する。デバイスコントローラ１２０は、図示しないプロセッサ、メモリ、ストレージコントローラ１１０と接続するＩＦ、及びＦＭチップ１２１と接続するＩＦを有する。デバイスコントローラ１２０は、ストレージシステム１００に提供する論理アドレス空間と、ＦＭチップ１２１の物理アドレスとの対応関係を管理する。論理アドレス空間は、例えば、ページ単位で管理される。記憶デバイス１１１は、複数のページから構成されるブロック単位でデータの削除を行い、ページ単位でデータのライト及びリードを行う。

【0024】

ＦＭチップ１２１は、複数のメモリセルを有する。メモリセルは１ビット又は複数ビットのデータを格納する。デバイスコントローラ１２０は、ＦＭチップ１２１の記憶領域を所定のサイズのページに分割し、管理する。

【0025】

デバイスコントローラ１２０は、Ｉ／Ｏ処理が遅延する可能性（遅延リスク）が発生している場合、ストレージコントローラ１１０に遅延リスクが発生していることを通知するための情報を生成する機能を有する。具体的には、デバイスコントローラ１２０は、（状態１）空きブロックの減少、（状態２）ＦＭチップ１２１の故障、（状態３）ブロックの書き込み回数に偏り、が発生した場合、遅延リスクが発生していると判定する。

【0026】

状態１の遅延リスクが発生した場合、デバイスコントローラ１２０は、空きブロックを確保するために、他のブロックにデータを移動する。状態２の遅延リスクが発生した場合、デバイスコントローラ１２０は、故障したＦＭチップ１２１を閉塞し、当該ＦＭチップ１２１に格納されるデータを他のＦＭチップ１２１に移動する。状態３の遅延リスクが発生した場合、デバイスコントローラ１２０は、書き込み回数が少ないブロックに格納されるデータを、書き込み回数が多いブロックに移動する。前述したいずれの処理も記憶デバイス１１１の負荷が高いため、Ｉ／Ｏ処理が遅延する可能性がある。

【0027】

また、デバイスコントローラ１２０は、遅延リスクが発生していないことを通知するための情報を生成する機能を有する。

【0028】

実施例１のデバイスコントローラ１２０は、遅延リスクの発生の有無を通知するための情報として３ビットのデータを生成する。１ビット目を状態１の遅延リスクの発生有無を示すビットとし、２ビット目を状態２の遅延リスクの発生有無を示すビットとし、３ビット目を状態３の遅延リスクの発生有無を示すビットとする。遅延リスクが発生していない場合、ビットには「０」が設定され、遅延リスクが発生している場合、ビットには「１」が設定される。以下の説明では、３ビットのデータを遅延リスク通知情報とも記載する。デバイスコントローラ１２０は、応答に遅延リスク通知情報を付加する。

【0029】

なお、前述した遅延リスクの発生要因は例示であってこれに限定されない。

【0030】

ストレージコントローラ１１０は、遅延リスクが発生している記憶デバイス１１１を管理するための状態管理情報２００を保持する。図２は、実施例１の状態管理情報２００のデータ構造の一例を示す図である。

【0031】

状態管理情報２００は、デバイスＩＤ２０１、タイムスタンプ２０２、及び状態種別２０３を含むエントリを格納する。

【0032】

デバイスＩＤ２０１は、記憶デバイス１１１のＩＤを格納するフィールドである。タイムスタンプ２０２は、遅延リスクの発生が通知された時刻を格納するフィールドである。状態種別２０３は、遅延リスクの種別を格納するフィールドである。状態種別２０３には、状態１、状態２、及び状態３に対応する値が格納される。

【0033】

図３Ａ及び図３Ｂは、実施例１のストレージシステム１００のリード処理の流れを説明するシーケンス図である。図４は、実施例１のストレージコントローラ１１０が実行するリード制御処理の一例を説明するフローチャートである。図５は、実施例１のストレージコントローラ１１０が実行する状態管理情報２００の更新処理の一例を説明するフローチャートである。

【0034】

ここでは、ストレージシステム１００に四つの記憶デバイス１１１－１、１１１－２、１１１－３、１１１－４が搭載されているものとする。四つの記憶デバイス１１１－１、１１１－２、１１１－３、１１１－４はＲＡＩＤレベル「５」のＲＡＩＤを構成するものとする。データのライトでは、例えば、ストレージコントローラ１１０は、一つのデータを、三つのブロックデータに分割し、また、一つのパリティを生成し、三つの記憶デバイス１１１の各々のブロックデータを書き込み、ブロックデータを書き込んだ記憶デバイス１１１とは異なる一つの記憶デバイス１１１にパリティを書き込む。なお、ＲＡＩＤレベルは一例であり、データ及びパリティの書き込みを伴うＲＡＩＤであればよい。記憶デバイス１１１－１では、空きブロックが減少し（状態１の遅延リスクが発生し）、空きブロックを増やすための処理が実行されているものとする。また、状態管理情報２００は空であるものとする。

【0035】

まず、図３Ａを用いて遅延リスクが通知されていない場合のリード処理を説明する。ストレージコントローラ１１０は、ホスト計算機１０１から、三つの記憶デバイス１１１－１、１１１－２、１１１－３に格納されるデータを取得するためのリード要求を受信した場合（ステップＳ１０１）、リード対象のデータを読み出す記憶デバイス１１１を決定するためのリード制御処理を実行する（ステップＳ１０２）。ここで、図４を用いてリード制御処理について説明する。

【0036】

ストレージコントローラ１１０は、リード対象のデータが格納される記憶デバイス１１１を特定する（ステップＳ２０１）。リード対象のデータは、ストレージコントローラ１１０が保持するボリューム及びＲＡＩＤグループに関する情報等に基づいて特定される。

【0037】

ストレージコントローラ１１０は、特定された記憶デバイス１１１のループ処理を開始する（ステップＳ２０２）。具体的には、ストレージコントローラ１１０は、特定された記憶デバイス１１１の中から一つの記憶デバイス１１１を選択する。以下の説明では、選択された記憶デバイス１１１をターゲット記憶デバイス１１１と記載する。

【0038】

ストレージコントローラ１１０は、状態管理情報２００を参照して、ターゲット記憶デバイス１１１のエントリが存在するか否かを判定する（ステップＳ２０３）。

【0039】

状態管理情報２００にターゲット記憶デバイス１１１のエントリが存在しない場合、ストレージコントローラ１１０は、ターゲット記憶デバイス１１１からデータを取得するためのリード要求の送信を決定する（ステップＳ２０４）。その後、ストレージコントローラ１１０はステップＳ２０６に進む。

【0040】

状態管理情報２００にターゲット記憶デバイス１１１のエントリが存在する場合、ストレージコントローラ１１０は、ターゲット記憶デバイス１１１に格納されるデータのパリティを格納する記憶デバイス１１１を特定し、当該記憶デバイス１１１からパリティを取得するためのリード要求の送信を決定する（ステップＳ２０５）。その後、ストレージコントローラ１１０はステップＳ２０６に進む。

【0041】

ステップＳ２０６では、ストレージコントローラ１１０は、特定された全ての記憶デバイス１１１について処理が完了したか否かを判定する（ステップＳ２０６）。

【0042】

特定された全ての記憶デバイス１１１について処理が完了していない場合、ストレージコントローラ１１０はステップＳ２０２に戻り、同様の処理を実行する。

【0043】

特定された全ての記憶デバイス１１１について処理が完了した場合、ストレージコントローラ１１０はリード制御処理を終了する。以上がリード制御処理の説明である。

【0044】

図３Ａの説明に戻る。ステップＳ１０２では、状態管理情報２００は空であるため、ストレージコントローラ１１０は、各記憶デバイス１１１－１、１１１－２、１１１－３からデータを取得するためのリード要求を送信することを決定する。したがって、ストレージコントローラ１１０は、記憶デバイス１１１－１、１１１－２、１１１－３にデータを取得するためのリード要求を送信する（ステップＳ１０３、ステップＳ１０４、ステップＳ１０５）。

【0045】

記憶デバイス１１１－１は、リード対象のデータと、状態１の遅延リスクの発生を通知するための遅延リスク通知情報と含む応答をストレージコントローラ１１０に送信する（ステップＳ１０６）。例えば、遅延リスク通知情報としてビット列（１，０，０）が送信される。記憶デバイス１１１－２、１１１－３は、リード対象のデータと、いずれの種類の遅延リスクも発生していないことを通知するための遅延リスク通知情報とを含む応答をストレージコントローラ１１０に送信する（ステップＳ１０７、ステップＳ１０８）。例えば、遅延リスク通知情報としてビット列（０，０，０）が送信される。

【0046】

ストレージコントローラ１１０は、各記憶デバイス１１１－１、１１１－２、１１１－３から取得したデータを応答としてホスト計算機１０１に送信する（ステップＳ１０９）。また、ストレージコントローラ１１０は、状態管理情報２００の更新処理を実行する（ステップＳ１１０）。ここで、図５を用いて状態管理情報２００の更新処理について説明する。

【0047】

ストレージコントローラ１１０は、遅延リスク通知情報のループ処理を開始する（ステップＳ３０１）。具体的には、ストレージコントローラ１１０は、受信した遅延リスク通知情報の中から一つの遅延リスク通知情報を選択する。

【0048】

ストレージコントローラ１１０は、遅延リスクの種別のループ処理を開始する（ステップＳ３０２）。具体的には、ストレージコントローラ１１０は、状態１、状態２、及び状態３の中から一つの状態を選択する。

【0049】

ストレージコントローラ１１０は、選択した種別の遅延リスクが発生しているか否かを判定する（ステップＳ３０３）。具体的には、遅延リスク通知情報の対応するビットの値が「１」であるか否かが判定される。遅延リスク通知情報の対応するビットの値が「１」である場合、ストレージコントローラ１１０は、選択した種別の遅延リスクが発生していると判定する。

【0050】

選択した種別の遅延リスクが発生している場合、ストレージコントローラ１１０は、状態管理情報２００に、デバイスＩＤ２０１に遅延リスク通知情報を送信した記憶デバイス１１１のＩＤが設定され、かつ、状態種別２０３に選択した種別が設定されるエントリが存在するか否かを判定する（ステップＳ３０４）。

【0051】

条件を満たすエントリが状態管理情報２００に存在する場合、ストレージコントローラ１１０はステップＳ３０８に進む。

【0052】

条件を満たすエントリが状態管理情報２００に存在しない場合、ストレージコントローラ１１０は、状態管理情報２００にエントリを追加し（ステップＳ３０５）、その後、ステップＳ３０８に進む。

【0053】

ステップＳ３０３において、選択した種別の遅延リスクが発生していない場合、ストレージコントローラ１１０は、状態管理情報２００に、デバイスＩＤ２０１に遅延リスク通知情報を送信した記憶デバイス１１１のＩＤが設定され、かつ、状態種別２０３に選択した種別が設定されるエントリが存在するか否かを判定する（ステップＳ３０６）。

【0054】

条件を満たすエントリが状態管理情報２００に存在しない場合、ストレージコントローラ１１０はステップＳ３０８に進む。

【0055】

条件を満たすエントリが状態管理情報２００に存在する場合、ストレージコントローラ１１０は、状態管理情報２００からエントリを削除し（ステップＳ３０７）、その後、ステップＳ３０８に進む。

【0056】

ステップＳ３０８では、ストレージコントローラ１１０は、全ての遅延リスクの種別について処理が完了したか否かを判定する（ステップＳ３０８）。

【0057】

全ての遅延リスクの種別について処理が完了していない場合、ストレージコントローラ１１０はステップＳ３０２に戻り、同様の処理を実行する。

【0058】

全ての遅延リスクの種別について処理が完了した場合、ストレージコントローラ１１０は、受信した全ての遅延リスク通知情報について処理が完了したか否かを判定する（ステップＳ３０９）。

【0059】

受信した全ての遅延リスク通知情報について処理が完了していない場合、ストレージコントローラ１１０はステップＳ３０１に戻り、同様の処理を実行する。

【0060】

受信した全ての遅延リスク通知情報について処理が完了した場合、ストレージコントローラ１１０は状態管理情報２００の更新処理を終了する。以上が状態管理情報２００の更新処理の説明である。

【0061】

図３Ａの説明に戻る。ステップＳ１１０では、ストレージコントローラ１１０は、状態管理情報２００に、記憶デバイス１１１－１に状態１の遅延リスクが発生したことを示すエントリを追加する。

【0062】

次に、図３Ｂを用いて遅延リスクが通知されている場合のリード処理を説明する。ストレージコントローラ１１０は、ホスト計算機１０１から、三つの記憶デバイス１１１－１、１１１－２、１１１－３に格納されるデータを取得するためリード要求を受信した場合（ステップＳ１１１）、リード制御処理を実行する（ステップＳ１１２）。リード制御処理は図４で説明したものと同一である。

【0063】

状態管理情報２００に記憶デバイス１１１－１のエントリが登録されている。そのため、ステップＳ１１２では、ストレージコントローラ１１０は、記憶デバイス１１１－１に格納されるデータのパリティを格納する記憶デバイス１１１からパリティを取得するためのリード要求の送信を決定する。ここでは、記憶デバイス１１１－４に格納されるパリティを読み出すものとする。また、ストレージコントローラ１１０は、記憶デバイス１１１－２、１１１－３からデータを取得するためのリード要求の送信を決定する。したがって、ストレージコントローラ１１０は、記憶デバイス１１１－２、１１１－３にデータを取得するためのリード要求を送信し（ステップＳ１１３、ステップＳ１１４）、記憶デバイス１１１－４にパリティを取得するためのリード要求を送信する（ステップＳ１１５）。

【0064】

記憶デバイス１１１－２、１１１－３は、リード対象のデータと、遅延リスクが発生していないことを通知するための遅延リスク通知情報とを含む応答をストレージコントローラ１１０に送信し（ステップＳ１１６、ステップＳ１１７）、記憶デバイス１１１－４は、パリティと、遅延リスクが発生していないことを通知するための遅延リスク通知情報とを含む応答をストレージコントローラ１１０に送信する（ステップＳ１１８）。

【0065】

ストレージコントローラ１１０は、読み出したデータ及びパリティを用いて、記憶デバイス１１１－１に格納されるリード対象のデータを生成し、当該データ及び記憶デバイス１１１－２、１１１－３から取得したデータをホスト計算機１０１に応答として送信する（ステップＳ１１９）。また、ストレージコントローラ１１０は、状態管理情報２００の更新処理を実行する（ステップＳ１２０）。状態管理情報２００の更新処理は図５で説明したものと同一である。なお、ステップＳ１２０では、状態管理情報２００へのエントリの追加及び削除は行われない。

【0066】

図６は、実施例１のストレージシステム１００のライト処理の流れを説明するシーケンス図である。

【0067】

ここでは、ストレージシステム１００に四つの記憶デバイス１１１－１、１１１－２、１１１－３、１１１－４が搭載されているものとする。四つの記憶デバイス１１１－１、１１１－２、１１１－３、１１１－４はＲＡＩＤレベル「５」のＲＡＩＤを構成するものとする。記憶デバイス１１１－１では、空きブロックの減少が発生し、空きブロックを増やすための処理が実行されているものとする。また、状態管理情報２００は空であるものとする。

【0068】

ストレージコントローラ１１０は、ホスト計算機１０１から、四つの記憶デバイス１１１－１、１１１－２、１１１－３、１１１－４から構成されるボリュームへデータを書き込むためのライト要求を受信した場合（ステップＳ４０１）、ストレージコントローラ１１０のメモリに書き込むデータを保持し、一つのパリティを生成する。ストレージコントローラ１１０は、ホスト計算機１０１にライト要求の応答を送信する（ステップＳ４０２）。

【0069】

ストレージコントローラ１１０は、ボリュームを構成する記憶デバイス１１１－１、１１１－２、１１１－３、１１１－４を特定する。ストレージコントローラ１１０は、特定された記憶デバイス１１１－１、１１１－２、１１１－３、１１１－４のいずれかの三つにデータを書き込むためのライト要求を送信し、また、データを書き込む記憶デバイス１１１とは別の一つの記憶デバイス１１１にパリティを書き込むためのライト要求を送信する（ステップＳ４０３、ステップＳ４０４、ステップＳ４０５、ステップＳ４０６）。例えば、記憶デバイス１１１－１、１１１－２、１１１－３にデータを書き込むためのライト要求が送信され、記憶デバイス１１１－４にパリティを書き込むためのライト要求が送信される。なお、記憶デバイス１１１へのデータの書き込みは非同期に実行される。

【0070】

記憶デバイス１１１－１は、データの書き込みが完了した場合、状態１の遅延リスクが発生していることを通知するための遅延リスク通知情報を含む応答をストレージコントローラ１１０に送信する（ステップＳ４０７）。記憶デバイス１１１－２、１１１－３、１１１－４は、データの書き込みが完了した場合、いずれの種類の遅延リスクも発生していないことを通知するための遅延リスク通知情報を含む応答をストレージコントローラ１１０に送信する（ステップＳ４０８、ステップＳ４０９、ステップＳ４１０）。

【0071】

ストレージコントローラ１１０は、状態管理情報２００の更新処理を実行する（ステップＳ４１１）。状態管理情報２００の更新処理は図５で説明したものと同一である。ステップＳ４１１では、ストレージコントローラ１１０は、状態管理情報２００に、記憶デバイス１１１－１に状態１の遅延リスクが発生したことを示すエントリを追加する。

【0072】

ライト処理では、記憶デバイス１１１へのデータのライトとは独立に、ホスト計算機１０１にライト要求に対する応答が送信される。ホスト計算機１０１からは遅延の発生は検知されないため、ライト処理では、遅延リスクの発生に伴う制御は特に行われない。

【0073】

記憶デバイス１１１は、リード要求及びライト要求の応答に、遅延リスクの発生の有無を通知するための遅延リスク通知情報を含めることができる。

【0074】

ストレージコントローラ１１０は、周期的に、ＳＥＮＳＥコマンド等を用いた記憶デバイス１１１の状態監視を実行する。デバイスコントローラ１２０は、遅延リスクの発生の有無を通知するための遅延リスク通知情報を生成し、ＳＥＮＳＥコマンドの応答に当該遅延リスク通知情報を含めことができる。

【0075】

ストレージコントローラ１１０は、遅延リスク通知情報を含む応答を受信した場合、状態管理情報２００の更新処理を実行する。

【0076】

実施例１では、遅延リスクの発生が検知された記憶デバイス１１１にはリード要求が送信されない。そのため、記憶デバイス１１１は、ライト要求の応答又はＳＥＮＳＥコマンドの応答を介して、遅延リスクが解消し、遅延リスクが発生していないことを通知する。

【0077】

実施例１のストレージコントローラ１１０は、周期的に、状態管理情報２００を用いて閉塞判定処理を実行する。図７は、実施例１のストレージコントローラ１１０が実行する閉塞判定処理の一例を説明するフローチャートである。

【0078】

ストレージコントローラ１１０は、閉塞デバイスリストを初期化し（ステップＳ５０１）、状態管理情報２００のエントリのループ処理を開始する（ステップＳ５０２）。具体的には、ストレージコントローラ１１０は、状態管理情報２００のエントリを一つ選択する。閉塞デバイスリストは、閉塞する記憶デバイス１１１のＩＤのリストである。

【0079】

ストレージコントローラ１１０は、選択したエントリに対応する記憶デバイス１１１が閉塞デバイスリストに登録されているか否かを判定する（ステップＳ５０３）。

【0080】

選択したエントリに対応する記憶デバイス１１１が閉塞デバイスリストに登録されている場合、ストレージコントローラ１１０はステップＳ５０７に進む。

【0081】

選択したエントリに対応する記憶デバイス１１１が閉塞デバイスリストに登録されていない場合、ストレージコントローラ１１０は、選択されたエントリのタイムスタンプ２０２及び現在時刻に基づいて、遅延リスクの継続時間を算出する（ステップＳ５０４）。

【0082】

ストレージコントローラ１１０は、継続時間が閾値より大きいか否かを判定する（ステップＳ５０５）。閾値は予め設定されているものとする。なお、遅延リスクの種別毎に異なる閾値を設定してもよい。

【0083】

継続時間が閾値以下の場合、ストレージコントローラ１１０はステップＳ５０７に進む。

【0084】

継続時間が閾値より大きい場合、ストレージコントローラ１１０は、選択したエントリに対応する記憶デバイス１１１を閉塞デバイスリストに登録し（ステップＳ５０６）、その後、ステップＳ５０７に進む。

【0085】

ステップＳ５０７では、ストレージコントローラ１１０は、状態管理情報２００の全てのエントリについて処理が完了したか否かを判定する（ステップＳ５０７）。

【0086】

状態管理情報２００の全てのエントリについて処理が完了していない場合、ストレージコントローラ１１０はステップＳ５０２に戻り、同様の処理を実行する。

【0087】

状態管理情報２００の全てのエントリについて処理が完了した場合、ストレージコントローラ１１０は、閉塞デバイスリストに登録されている記憶デバイス１１１の閉塞処理を実行し（ステップＳ５０８）、その後、閉塞判定処理を終了する。

【0088】

本発明によれば、記憶デバイス１１１のＩ／Ｏ処理が遅延する可能性がある場合、ストレージコントローラ１１０は、当該記憶デバイス１１１からのデータリードを抑止することによって、記憶デバイス１１１の閉塞を回避することができる。

【0089】

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、置換をすることが可能である。

【符号の説明】

【0090】

１００ストレージシステム
１０１ホスト計算機
１１０ストレージコントローラ
１１１記憶デバイス
１２０デバイスコントローラ
１２１ＦＭチップ
２００状態管理情報

【図1】

【図2】

【図3A】

【図3B】

【図4】

【図5】

【図6】

【図7】

IP Force 特許公報掲載プロジェクト 2022.1.31 β版