特開2023-93215 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特開2023-93215ストレージ管理システム、及びストレージ管理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023093215

(43)【公開日】2023-07-04

(54)【発明の名称】ストレージ管理システム、及びストレージ管理方法

(51)【国際特許分類】

G06F 13/14 20060101AFI20230627BHJP

G06F 13/10 20060101ALI20230627BHJP

G06F 3/06 20060101ALI20230627BHJP

G06F 11/34 20060101ALI20230627BHJP

G06F 9/50 20060101ALI20230627BHJP

【ＦＩ】

G06F13/14 330E

G06F13/10 340A

G06F13/14 330B

G06F3/06 301E

G06F3/06 301X

G06F11/34 176

G06F9/50 120Z

【審査請求】有

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2021208703

(22)【出願日】2021-12-22

(71)【出願人】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110000279

【氏名又は名称】弁理士法人ウィルフォート国際特許事務所

(72)【発明者】

【氏名】東郷一輝

(72)【発明者】

【氏名】出口彰

(72)【発明者】

【氏名】柴山司

(72)【発明者】

【氏名】鈴木貴敦

【テーマコード（参考）】

5B042

【Ｆターム（参考）】

5B042GA34

5B042MA05

5B042MA14

5B042MC25

5B042MC29

(57)【要約】

【課題】ストレージシステムの性能を迅速に適切に調整することができるようにする。
【解決手段】複数のストレージノード１００で構成されたストレージシステム１０００と、管理装置２００とを有するストレージ管理システム１において、ストレージノード１００は、ストレージデバイスと、仮想的にリソースが割り当てられ、ストレージデバイスに対するアクセス制御を行うインスタンスとを有し、ストレージ管理システム１は、ストレージノード１００のインスタンスを管理するインスタンス管理ノード６００を有し、管理装置２００を、ストレージノード１００のインスタンスに対して割り当てられるリソースの構成の変更の要否を判定し、リソースの構成の変更が必要である場合に、インスタンス管理ノード６００にインスタンスに割り当てるリソース構成を変更させるように構成する。
【選択図】図１

【特許請求の範囲】

【請求項1】

複数のストレージノードで構成されたストレージシステムと、管理装置とを有するストレージ管理システムであって、
前記ストレージノードは、ストレージデバイスと、仮想的にリソースが割り当てられ、前記ストレージデバイスに対するアクセス制御を行うインスタンスとを有し、
前記ストレージ管理システムは、前記ストレージノードのインスタンスを管理するインスタンス管理ノードを有し、
前記管理装置は、
前記ストレージノードの前記インスタンスに対して割り当てられるリソースの構成の変更の要否を判定し、
前記リソースの構成の変更が必要である場合に、前記インスタンス管理ノードに前記インスタンスに割り当てるリソース構成を変更させる
ストレージ管理システム。

【請求項2】

前記管理装置は、
前記リソースの構成を変更する所定の契機であるかを判定し、
所定の契機となった場合に、前記インスタンス管理ノードに変更指示を送信し、
前記インスタンス管理ノードは、変更指示を受け取った場合に、インスタンスのリソース構成を変更する
請求項１に記載のストレージ管理システム。

【請求項3】

前記管理装置は、
前記リソースの構成を変更する際に、前記インスタンスが処理を担当するホスト計算機からのＩ／Ｏ処理を他のストレージノードのインスタンスに実行させるように切り替え、その後、前記リソース構成の変更を行わせる
請求項１に記載のストレージ管理システム。

【請求項4】

前記インスタンスが処理を担当するＩ／Ｏ処理の代替が可能な機能を有するインスタンスが他のストレージノードに備えられており、
前記管理装置は、
前記リソースの構成を変更する際に、ホスト計算機からのＩ／Ｏ処理を、代替が可能な機能を有するインスタンスを有するストレージノードに切り替える
請求項３に記載のストレージ管理システム。

【請求項5】

複数の前記ストレージノードの各インスタンスは、自身のＩ／Ｏ処理を実行する機能と、他の一のストレージノードが担当するＩ／Ｏ処理の代替が可能な機能とを有するように構成されている、
請求項４に記載のストレージ管理システム。

【請求項6】

前記管理装置は、
前記ストレージシステムから前記ストレージシステムの稼働情報を収集し、前記稼働情報に基づいて、前記ストレージシステムのインスタンスの性能のネックとなり、構成を変更させる必要があるリソースを特定し、
特定した前記リソースを増加させるように前記インスタンスのリソース構成を変更させる
請求項１に記載のストレージ管理システム。

【請求項7】

前記インスタンスとして利用可能なリソース構成の違うインスタンスタイプが管理されており、
前記管理装置は、
特定した前記リソースを増加させることのできるインスタンスタイプを特定し、
前記特定したインスタンスタイプのリソース構成に変更させる
請求項６に記載のストレージ管理システム。

【請求項8】

前記管理装置は、
前記リソースを増加させた場合に新たにネックとなる他のリソースを特定し、前記他のリソースについても増加させるようにインスタンスのリソース構成を変更させる
請求項６に記載のストレージ管理システム。

【請求項9】

特定された前記リソースによる稼働性能が所定の基準値を満たす前記リソース量である増強リソース量を特定し、
前記増強リソース量以上のリソース量となるようにインスタンスのリソース構成を変更させる
請求項６に記載のストレージ管理システム。

【請求項10】

複数のストレージノードで構成されたストレージシステムと、管理装置とを有するストレージ管理システムによるストレージ管理方法であって、
前記ストレージノードは、ストレージデバイスと、仮想的にリソースが割り当てられ、前記ストレージデバイスに対するアクセス制御を行うインスタンスとを有し、
前記ストレージ管理システムは、前記ストレージノードのインスタンスを管理するインスタンス管理ノードを有し、
前記管理装置は、前記ストレージノードの前記インスタンスに対して割り当てられるリソースの構成の変更の要否を判定し、
前記リソースの構成の変更が必要である場合に、前記インスタンス管理ノードに前記インスタンスに割り当てるリソース構成を変更させる
ストレージ管理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ストレージシステムを構成するストレージノードにおける、ストレージデバイスに対するアクセスを制御するインスタンスを管理する技術に関する。

【背景技術】

【0002】

Ｃａｐｅｘ（ＣａｐｉｔａｌＥｘｐｅｎｄｉｔｕｒｅ）低減のために、パブリッククラウドを利用するユーザが増加している。ストレージベンダは、このような動向へ対応し、ハイブリッドクラウド実現のために、パブリッククラウドで動作可能なストレージシステムを開発している。クラウドでは、リソースを動的に割り当て、変更することが容易であり、ストレージシステムを少ないコストで効率的に運用できる可能性がある。

【0003】

ストレージシステムの性能を向上する技術として、例えば、特許文献１には、ストレージシステムにストレージノードを追加することにより、各ストレージノードの負荷を軽減して、ストレージシステムの性能を向上する技術（スケールアウト技術）が開示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１９－１０１７０３号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

例えば、スケールアウト技術を利用する場合、ストレージシステムでの性能問題を解決するためには、ストレージシステムにおけるネックの検出、ノード増設による対処という流れになる。

【0006】

例えば、ストレージシステムのＣＰＵがネックとなる場合、ノードを増設し、過負荷のノードから増設したノードにボリュームを移動するという対処の流れが必要となり、ボリュームの移動に長時間を要するので性能ネックを解消するために長時間を要してしまい、その間のストレージシステムの性能低下が問題となる。

【0007】

また、ノードを増設する場合には、ＣＰＵがネックにもかかわらず、ＣＰＵだけではなく、ネックに関わらないメモリ、ネットワーク等の他のリソースが追加されることとなるので、リソースの使用効率が悪くなる問題が生じる。このような問題は、ＣＰＵ以外のリソースがネックとなる場合も同様に生じる。

【0008】

また、性能ネックを解消する対処を行う際には、ノード増設や、ボリューム移行等を実際に行うための計画を検討しなければならず、ストレージシステムの運用面でも複雑な問題が生じる。

【0009】

本発明は、上記事情に鑑みなされたものであり、その目的は、ストレージシステムの性能を迅速に適切に調整することのできる技術を提供することにある。

【課題を解決するための手段】

【0010】

上記目的を達成するため、一観点に係るストレージ管理システムは、複数のストレージノードで構成されたストレージシステムと、管理装置とを有するストレージ管理システムであって、前記ストレージノードは、ストレージデバイスと、仮想的にリソースが割り当てられ、前記ストレージデバイスに対するアクセス制御を行うインスタンスとを有し、前記ストレージ管理システムは、前記ストレージノードのインスタンスを管理するインスタンス管理ノードを有し、前記管理装置は、前記ストレージノードの前記インスタンスに対して割り当てられるリソースの構成の変更の要否を判定し、前記リソースの構成の変更が必要である場合に、前記インスタンス管理ノードに前記インスタンスに割り当てるリソース構成を変更させる。

【発明の効果】

【0011】

本発明によれば、ストレージシステムの性能を迅速に適切に調整することができる。

【図面の簡単な説明】

【0012】

【図1】図１は、一実施形態に係るストレージ管理システムの全体構成図である。

【図2】図２は、一実施形態に係るストレージノードの構成図である。

【図3】図３は、一実施形態に係る管理装置の構成図である。

【図4】図４は、一実施形態に係るストレージ管理システムの処理概要を説明する図である。

【図5】図５は、一実施形態に係る管理装置のメモリの構成図である。

【図6】図６は、一実施形態に係るインスタンス管理テーブルの構成図である。

【図7】図７は、一実施形態に係る稼働情報管理テーブルの構成図である。

【図8】図８は、一実施形態に係るホストＩ／Ｏ管理テーブルの構成図である。

【図9】図９は、一実施形態に係る性能ネック管理テーブルの構成図である。

【図10】図１０は、一実施形態に係るインスタンスタイプ管理テーブルの構成図である。

【図11】図１１は、一実施形態に係る対処実行管理テーブルの構成図である。

【図12】図１２は、一実施形態に係る情報収集処理のフローチャートである。

【図13】図１３は、一実施形態に係る性能ネック分析処理のフローチャートである。

【図14】図１４は、一実施形態に係る性能ネック解消方法決定処理のフローチャートである。

【図15】図１５は、一実施形態に係る対処実行処理のフローチャートである。

【図16】図１６は、一実施形態に係るストレージシステムのストレージノードの構成例である。

【図17】図１７は、一実施形態に係る保守閉塞処理のフローチャートである。

【図18】図１８は、一実施形態に係る保守回復処理のフローチャートである。

【発明を実施するための形態】

【0013】

実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。

【0014】

以下の説明では、「ＡＡＡテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「ＡＡＡテーブル」を「ＡＡＡ情報」と呼ぶことができる。

【0015】

また、以下の説明では、プログラムを動作の主体として処理を説明する場合があるが、プログラムは、プロセッサ（例えばＣＰＵ）によって実行されることで、定められた処理を、適宜に記憶資源（例えばメモリ）及び／又は通信インターフェースデバイス（例えばＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ））を用いながら行うため、処理の主体がプロセッサとされてもよい。プログラムを動作の主体として説明された処理は、プロセッサ或いはそのプロセッサを有する計算機（システム）が行う処理としてもよい。

【0016】

また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

【0017】

また、以下の説明では、「インスタンス」は、物理的な１台以上のコンピュータ上のリソースを用いてソフトウェアによって構成された仮想的な計算機（仮想計算機）を示し、パブリッククラウド上で構成されてもよいし、プライベートクラウド上で構成されてもよい。

【0018】

また、以下の説明では、「インスタンスタイプ」は、ＣＰＵ周波数、コア数、メモリ速度、メモリ容量、ネットワークインターフェース（Ｉ／Ｆ）帯域などのリソースのスペック値の組み合わせで決められ、インスタンスの構成の種類を示している。なお、スペックの値は、ＣＰＵ周波数、コア数、メモリ速度、メモリ容量、ネットワークＩ／Ｆ帯域であってもよく、それ以外の値であってもよい。

【0019】

図１は、一実施形態に係るストレージ管理システムの全体構成図である。

【0020】

ストレージ管理システム１は、ストレージシステム１０００と、管理装置２００と、１以上のホスト計算機３００と、インスタンス管理ノード６００とを備える。ストレージシステム１０００は、１以上のストレージノード１００を備える。本実施形態では、インスタンス管理ノード６００と、ストレージシステム１０００とは、クラウド１０に設けられ、クラウド１０の１以上の物理計算機により構成されている。

【0021】

ストレージノード１００と、管理装置２００と、ホスト計算機３００と、インスタンス管理ノード６００とは、ネットワーク４００を介して接続されている。ネットワーク４００は、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）やＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）等であってよい。

【0022】

ホスト計算機３００は、例えば業務システムの中核をなすコンピュータ、ファイルサーバ等で構成され、ストレージシステム１０００に対してリード/ライトを要求する。ホスト計算機３００は、物理計算機であってもよいし、仮想計算機であってもよい。ホスト計算機３００は、例えば、複数のストレージノード１００がクラスタを構成している場合には、クラスタを構成しているストレージノードとの間でマルチパスが設定される。なお、マルチパスの設定は、例えば、Ｌｉｎｕｘ（登録商標）を用いている場合にはｍｕｌｔｉｐａｔｈ－ｔｏｏｌｓを用いることができ、ホスト計算機３００がＷｉｎｄｏｗｓ（登録商標）ｓｅｒｖｅｒである場合には、ＭＰＩＯサービスを用いることができる。

【0023】

管理装置２００は、例えば、ＣＰＵ、メモリ、ネットワークＩ／Ｆ等のハードウェア資源と、管理プログラムなどのソフトウェア資源とを備えたコンピュータである。管理装置２００は、物理計算機であってもよし、仮想計算機であってもよい。管理装置２００は、管理プログラムによってストレージシステム１０００から情報を取得し、ユーザインターフェース（ＧＵＩ（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｆａｃｅ）、ＣＬＩ（ＣｏｍｍａｎｄＬｉｎｅＩｎｔｅｒｆａｃｅ））を介して情報を表示する。管理装置２００は、ユーザインターフェースを介して、システム管理者によって入力された指示をストレージシステム１０００に送信する機能を有する。管理装置２００は、オンプレミス上の装置であってもよいし、クラウド上の装置であってもよい。

【0024】

インスタンス管理ノード６００は、クラウド１０におけるインスタンスを管理するノードである。

【0025】

ストレージノード１００は、ホスト計算機３００で使用されるユーザデータを管理する。

【0026】

次に、ストレージノード１００について詳細に説明する。

【0027】

図２は、一実施形態に係るストレージノードの構成図である。

【0028】

ストレージノード１００は、１以上のインスタンス１１０と、１以上のストレージデバイス１２０とを含む。

【0029】

インスタンス１１０は、クラウド１０の物理計算機のリソースを用いてソフトウェアによって構成された仮想的な計算機である。インスタンス１１０は、仮想マシン（ＶｉｒｔｕａｌＭａｃｈｉｎｅ）でもよい。

【0030】

インスタンス１１０は、ＣＰＵ１１１と、メモリ１１２と、ネットワークＩ／Ｆ１１３とを含む。インスタンス１１０におけるＣＰＵ１１１と、メモリ１１２と、ネットワークＩ／Ｆ１１３とのリソース量は、予め決められたインスタンスタイプに対応するリソース量となっている。ＣＰＵ１１１は、クラウド１０の物理計算機の物理的なＣＰＵが仮想的に割り当てられた仮想的なＣＰＵである。ＣＰＵ１１１は、メモリ１１２に格納されたプログラムや管理情報に基づいて、ストレージデバイス１２０に対するアクセス制御等の処理を行う。メモリ１１２は、クラウド１０の物理計算機の物理的なメモリが仮想的に割り当てられた仮想的なメモリである。メモリ１１２は、ＣＰＵ１１１により実行されるプログラムと、ＣＰＵ１１１により参照または更新される管理情報とを格納する。ネットワークＩ／Ｆ１１３は、ネットワーク４００を介して、ストレージデバイス１２０、他のストレージノード１００、管理装置２００、ホスト計算機３００、及びインスタンス管理ノード６００と通信するためのＩ／Ｆである。

【0031】

ストレージデバイス１２０は、物理的もしくは仮想的な記憶デバイスであり、典型的には、不揮発性の記憶デバイスでよい。ストレージデバイス１２０は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）またはＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）でよい。ストレージデバイス１２０は、ホスト計算機３００で利用するユーザデータを格納する。

【0032】

次に、管理装置２００について詳細に説明する。

【0033】

図３は、一実施形態に係る管理装置の構成図である。

【0034】

管理装置２００は、ＣＰＵ２１０と、メモリ２２０と、ネットワークＩ／Ｆ２３０とを含む。ＣＰＵ２１０は、メモリ２２０に格納されたプログラムや管理情報に基づいて、ストレージノード１００やストレージシステム１０００全体を制御する処理を行う。メモリ２２０は、ＣＰＵ２１０により実行されるプログラムと、ＣＰＵ２１０により参照または更新される管理情報とを格納する。ネットワークＩ／Ｆ２３０は、ネットワーク４００を介して、ストレージノード１００、ホスト計算機３００、及びインスタンス管理ノード６００と通信するためのＩ／Ｆである。

【0035】

次に、ストレージ管理システム１の処理概要について説明する。

【0036】

図４は、一実施形態に係るストレージ管理システムの処理概要を説明する図である。

【0037】

ストレージ管理システム１の管理装置２００は、ストレージノード１００から稼働情報５００を収集する処理（情報収集処理：Ｓ４１００）を行う（図４（１））。ここで、稼働情報５００は、ストレージシステム１０００に対するホスト計算機３００からのＩ／Ｏ情報（Ｉ／Ｏレスポンス時間、Ｉ／Ｏスループット)や、各ストレージノード１００のハードウェア稼働率（ＣＰＵ稼働率、メモリ使用量、ネットワーク使用帯域）などのストレージシステム１０００の性能やストレージシステムの使用状況を把握するために必要な情報である。稼働情報５００は、ストレージノード１００で定期的に記録され、ストレージノード１００のインスタンス１１０のメモリ１１２、又は、インスタンス１１０が通信可能なストレージデバイス１２０に格納される。

【0038】

図４（１）においては、管理装置２００がストレージノード１００に対して、情報収集要求を出すことによって、ストレージノード１００から稼働情報５００を収集してもよいし、ストレージノード１００が定期的に自発的に管理装置２００に稼働情報５００を送信することで、管理装置２００が稼働情報５００を収集してもよい。

【0039】

管理装置２００は、収集した稼働情報５００を、メモリ２２０に格納する。なお、管理装置２００は、収集した稼働情報５００を接続された不揮発性のストレージデバイスに格納してもよい。

【0040】

次いで、管理装置２００は、稼働情報５００を監視・分析することで、ストレージシステム１０００での性能問題を検出し、性能問題を検出した場合、稼働情報５００と管理情報５１０とを分析することで、ストレージシステム１０００での性能のネックとなる部位（性能ネック部位）の検出する処理（性能ネック分析処理：ステップＳ４２００）を行う（図４（２））。管理情報５１０は、ストレージシステム１０００、ストレージノード１００に対する設定情報や性能分析に必要な静的な情報であり、インスタンス１１０に対して設定している現在のインスタンスタイプの情報や、ストレージシステム１０００のボリューム構成、圧縮・重複排除機能の適用有無などの論理構成情報や、ストレージシステム１０００の現在のスペックに対する目標Ｉ／Ｏ性能情報である。図４（２）の性能ネック分析処理では、管理装置２００は、ストレージノード１００のインスタンス１１０内のどのリソース（ＣＰＵ，メモリ、ネットワークＩ／Ｆ）が足りていないか、すなわち、性能ネック部位がどこかを検出する。

【0041】

次いで、管理装置２００は、検出した性能ネック部位について、性能ネックを解消する方法を決定する処理（ネック解消方法決定処理：Ｓ４３００）を行う（図４（３））。例えば、管理装置２００は、或るストレージノード１００のインスタンス１１０のＣＰＵ１１１のスペックが足りないことで、ストレージシステム１０００の目標Ｉ／Ｏ性能（基準値）が達成できていないと判明した場合、管理装置２００は、ＣＰＵ１１１のスペックを向上させることのできるインスタンスタイプを変更後のインスタンスタイプとして決定する。また、管理装置２００は、性能ネック解消のためのインスタンスタイプの変更の契機（タイプ変更契機）の決定を行う。例えば、管理装置２００は、ホスト計算機３００のＩ／Ｏへの影響を少なくするために、Ｉ／Ｏが少ない深夜の時間帯をタイプ変更契機として決定する。

【0042】

次いで、管理装置２００は、インスタンスタイプを変更すべきストレージノード１００にタイプ変更指示を送信し（図４（４））、インスタンス管理ノード６００にタイプ変更指示を送信する（図４（５））ための処理（対処実行処理：ステップＳ４４００）を実行する。タイプ変更指示は、ストレージノード１００に対して、インスタンスタイプの変更可能な状態への推移を行う指示をしてから、インスタンスタイプの変更、ストレージノード１００の定常運用状態への推移を行う指示をするようにしてもよい。ここで、インスタンスタイプ変更可能な状態とは、ストレージノード１００が保守閉塞している状態であってもよいし、ストレージノード１００が停止している状態であってもよい。ストレージノード１００の定常運用状態への推移を行う指示は、保守回復指示であってもよいし、ノード起動指示であってもよい。

【0043】

また、タイプ変更対象のインスタンスを有するストレージノード１００が２以上ある場合、管理装置２００は、ストレージシステム１０００の冗長性を保つために、１つのストレージノード毎にタイプ変更の処理を行ってもよい。１つのストレージノードずつ変更処理を実行するために、あるストレージノード１００に対するインスタンスのタイプ変更を行う処理の実行が正常に完了するまで、他のストレージノード１００に対するインスタンスのタイプ変更指示を待機する。そして、すべての変更対象のストレージノード１００に対するインスタンスのタイプ変更処理が完了したとき、対処実行処理を終了する。

【0044】

次に、管理装置２００のメモリ２２０の構成について説明する。

【0045】

図５は、一実施形態に係る管理装置のメモリの構成図である。

【0046】

管理装置２００のメモリ２２０は、プログラム２０００と、管理テーブル３０００とを格納する。

【0047】

プログラム２０００は、稼働情報収集プログラム２１００と、性能ネック分析プログラム２２００と、性能ネック解消方法決定プログラム２３００と、対処実行プログラム２４００とを含む。

【0048】

管理テーブル３０００は、インスタンス管理テーブル３１００と、稼働情報管理テーブル３２００と、ホストＩ／Ｏ管理テーブル３３００と、性能ネック管理テーブル３４００と、インスタンスタイプ管理テーブル３５００と、対処実行管理テーブル３６００とを含む。

【0049】

稼働情報収集プログラム２１００は、ストレージノード１００から稼働情報５００を収集し、稼働情報管理テーブル３２００とホストＩ／Ｏ管理テーブル３３００にデータを記録する。

【0050】

性能ネック分析プログラム２２００は、ホストＩ／Ｏ管理テーブル３３００を分析して性能問題の発生を検出し、稼働情報管理テーブル３２００を分析して性能ネック部位を検出する。性能ネック分析プログラム２２００は、分析により得られた性能ネック部位に関する情報を、性能ネック管理テーブル３４００に記録する。

【0051】

性能ネック解消方法決定プログラム２３００は、性能ネック管理テーブル３４００の情報に基づいて、性能ネックを解消するために、どのストレージノード１００に対して変更を加えるか、ストレージノード１００のインスタンス１１０をどのインスタンスタイプに変更するか、及びホストＩ／Ｏへの影響を最小化するために、どの契機で変更を加えるかを決定し、決定した情報を、対処実行管理テーブル３６００に記録する。また、性能ネック解消方法決定プログラム２３００は、ストレージノード１００をどのインスタンスタイプに変更するか決定する際に、インスタンスタイプ管理テーブル３５００を参照し、性能ネックを解消するために性能ネックとなるリソースに十分なスペックを有するインスタンスタイプを選択する。

【0052】

対処実行プログラム２４００は、対処実行管理テーブル３６００の情報に基づいて、決められた変更契機に、ストレージノード１００へインスタンスタイプ変更指示を送信し、また、インスタンス管理ノード６００へインスタンスタイプ変更指示を送信する。

【0053】

次に、インスタンス管理テーブル３１００について説明する。

【0054】

図６は、一実施形態に係るインスタンス管理テーブルの構成図である。

【0055】

インスタンス管理テーブル３１００は、ストレージシステム１０００のストレージノード１００に形成されているインスタンス１１０の情報を管理するテーブルである。インスタンス管理テーブル３１００は、ストレージシステム１０００のインスタンス１１０毎のエントリーを格納する。インスタンス管理テーブル３１００のエントリーは、ノードＩＤ３１０１と、ＣＰＵ周波数３１０２と、ＣＰＵコア数３１０３と、メモリ容量３１０４と、ネットワーク帯域３１０５とのフィールドを含む。

【0056】

ノードＩＤ３１０１には、エントリーに対応するインスタンス１１０を有するストレージノード１００の識別番号（ノードＩＤ）が格納される。ＣＰＵ周波数３１０２には、エントリーに対応するインスタンス１１０に割り当てられているＣＰＵ１１１の周波数が格納される。ＣＰＵコア数３１０３には、エントリーに対応するインスタンス１１０に割り当てられているＣＰＵ１１１のコア数が格納される。メモリ容量３１０４には、エントリーに対応するインスタンス１１０に割り当てられているメモリの容量が格納される。ネットワーク帯域３１０５には、エントリーに対応するインスタンス１１０に割り当てられているネットワークＩ／Ｆ１１３の帯域が格納される。

【0057】

次に、稼働情報管理テーブル３２００について説明する。

【0058】

図７は、一実施形態に係る稼働情報管理テーブルの構成図である。

【0059】

稼働情報管理テーブル３２００は、ストレージノード１００の稼働状態に関する情報を管理するテーブルであり、ストレージノード１００毎のエントリーを格納する。稼働情報管理テーブル３２００のエントリーは、ノードＩＤ３２０１と、情報収集時刻３２０２と、ＣＰＵ稼働率３２０３と、メモリ使用量３２０４と、ネットワーク使用帯域３２０５とのフィールドを含む。

【0060】

ノードＩＤ３２０１には、エントリーに対応するストレージノード１００の識別番号（ノードＩＤ）が格納される。情報収集時刻３２０２には、エントリーに対応する情報をストレージノード１００から収集して格納した時刻（日時）が格納される。ＣＰＵ稼働率３２０３には、エントリーに対応するストレージノード１００におけるＣＰＵ１１１の負荷の大きさを示す稼働率が格納される。メモリ使用量３２０４には、エントリーに対応するストレージノード１００におけるメモリ１１２の使用量（メモリ使用量）が格納される。ネットワーク使用帯域３２０５には、エントリーに対応するストレージノード１００のネットワークＩ／Ｆ１１３により使用されているネットワーク帯域（ネットワーク使用帯域）が格納される。

【0061】

次に、ホストＩ／Ｏ管理テーブル３３００について説明する。

【0062】

図８は、一実施形態に係るホストＩ／Ｏ管理テーブルの構成図である。

【0063】

ホストＩ／Ｏ管理テーブル３３００は、ストレージシステム１０００に対するホスト計算機３００によるＩ／Ｏ情報を管理するテーブルであり、Ｉ／Ｏ情報の取得時刻毎のエントリーを格納する。ホストＩ／Ｏ管理テーブル３３００のエントリーは、情報収集時刻３３０１と、ＩＯＰＳ３３０２と、転送速度３３０３とのフィールドを含む。情報収集時刻３３０１には、エントリーに対応する情報を取得し、格納した時刻（情報取得時刻）が格納される。ＩＯＰＳ３３０２には、ストレージシステム１０００に対する単位時間当たりのＩ／Ｏ数（ＩＯＰＳ：Ｉｎｐｕｔ／ＯｕｔｐｕｔＰｅｒＳｅｃｏｎｄ）が格納される。転送速度３３０３には、ストレージシステム１０００に対する単位時間当たりのデータ転送量（転送速度）が格納される。

【0064】

次に、性能ネック管理テーブル３４００について説明する。

【0065】

図９は、一実施形態に係る性能ネック管理テーブルの構成図である。

【0066】

性能ネック管理テーブル３４００は、性能のネックに関する情報を管理するテーブルであり、検出された性能ネック毎のエントリーを格納する。性能ネック管理テーブル３４００のエントリーは、ネックＩＤ３４０１と、情報記録時刻３４０２と、ノードＩＤ３４０３と、性能ネック部位３４０４と、必要リソース増強割合３４０５と、ネック解消方法決定済み３４０６とのフィールドを含む。

【0067】

ネックＩＤ３４０１には、検出された性能ネックを一意に識別するための識別番号（ネックＩＤ）が格納される。情報記録時刻３４０２には、検出された性能ネックの情報を登録した時刻が格納される。ノードＩＤ３４０３には、エントリーに対応する性能ネックにおける性能ネックとなる部位（性能ネック部位）を有するストレージノード１００のノードＩＤが格納される。性能ネック部位３４０４には、エントリーに対応する性能ネックにおけるストレージノード１００の性能ネック部位を示す情報が格納される。性能ネック部位３４０４には、例えば、ストレージノード１００のインスタンス１１０の構成要素（リソース）である、ＣＰＵ、メモリ、ネットワークＩ／Ｆ等が格納される。必要リソース増強割合３４０５には、エントリーに対応する性能ネックを解消するために必要なリソースの割合が格納される。例えば、現在のインスタンス１１０のＣＰＵコア数が１６コアであり、性能ネックがＣＰＵであり、性能ネックを解消するためにＣＰＵコア数が３２コア以上必要である場合は、必要リソース増強割合３４０５には、２倍が格納される。ネック解消方法決定済み３４０６には、エントリーに対応する性能ネックに対する解消方法（性能ネック解消方法）が決定済みか否かを示す情報が格納される。例えば、性能ネック解消方法が決定されている場合は、ネック解消方法決定済み３４０６には、Ｔｒｕｅが格納される。

【0068】

次に、インスタンスタイプ管理テーブル３５００について説明する。

【0069】

図１０は、一実施形態に係るインスタンスタイプ管理テーブルの構成図である。

【0070】

インスタンスタイプ管理テーブル３５００は、インスタンスとして使用可能なタイプ（インスタンスタイプ）を管理するテーブルであり、インスタンスタイプ毎のエントリーを格納する。インスタンスタイプ管理テーブル３５００のエントリーは、インスタンスタイプＩＤ３５０１と、ＣＰＵ周波数３５０２と、ＣＰＵコア数３５０３と、メモリ容量３５０４と、ネットワーク帯域３５０５とのフィールドを含む。

【0071】

インスタンスタイプＩＤ３５０１には、エントリーに対応するインスタンスタイプを一意に識別する識別番号（インスタンスタイプＩＤ）が格納される。ＣＰＵ周波数３５０２には、エントリーに対応するインスタンスタイプで割り当てられるＣＰＵの周波数が格納される。ＣＰＵコア数３５０３には、エントリーに対応するインスタンスタイプで割り当てられるＣＰＵのコア数が格納される。メモリ容量３５０４には、エントリーに対応するインスタンスタイプで割り当てられるメモリの容量（メモリ容量）が格納される。ネットワーク帯域３５０５には、エントリーに対応するインスタンスタイプで割り当てられるネットワークＩ／Ｆの帯域（ネットワーク帯域）が格納される。なお、インスタンスタイプ管理テーブル３５００のインスタンスタイプとしては、いずれか一つのリソースの値（例えば、ＣＰＵコア数）のみが違う複数のインスタンスタイプが含まれていてもよい。

【0072】

次に、対処実行管理テーブル３６００について説明する。

【0073】

図１１は、一実施形態に係る対処実行管理テーブルの構成図である。

【0074】

対処実行管理テーブル３６００は、性能ネックに対する対処に関する情報を管理するテーブルであり、対処毎のエントリーを格納する。対処実行管理テーブル３６００のエントリーは、対処実行ＩＤ３６０１と、ノードＩＤ３６０２と、変更後インスタンスタイプＩＤ３６０３と、変更契機３６０４と、対処実行完了３６０５とのフィールドを含む。

【0075】

対処実行ＩＤ３６０１には、エントリーに対応する対処の実行に対して一意に与えられる識別番号が格納される。ノードＩＤ３６０２には、エントリーに対応する対象を実行する対象のストレージノード１００のノードＩＤが格納される。変更後インスタンスタイプＩＤ３６０３には、エントリーに対応する対処により変更されたインスタンスのインスタンスタイプの識別番号（インスタンスタイプＩＤ）が格納される。変更契機３６０４には、エントリーに対応する対処を実行してインスタンスのインスタンスタイプを変更する契機（変更契機）が格納される。変更契機は、或る特定の日時であってもよく、特定の曜日であってもよく、特定の時間帯であってもよい。対処実行完了３６０５には、エントリーに対応する対処の実行を完了したか否かが格納される。本実施形態では、対処実行完了３６０５には、対処の実行が完了した場合には、Ｔｒｕｅが格納され、実行が完了していない場合には、Ｆａｌｓｅが格納される。

【0076】

次に、管理装置２００による情報収集処理（ステップＳ４１００）について説明する。

【0077】

図１２は、一実施形態に係る情報収集処理のフローチャートである。

【0078】

情報収集処理は、管理装置２００により、例えば定期的に実行される。情報収集処理の実行周期は、例えば、ストレージシステム１０００の特性に基づいて決定された、ストレージシステム１０００の性能問題の検出、ネック部位の分析に必要な周期であってもよい。

【0079】

管理装置２００の稼働情報収集プログラム２１００（厳密には、稼働情報収集プログラム２１００を実行するＣＰＵ２１０）は、ストレージシステム１０００に対して、ストレージノード１００の稼働情報及びホスト計算機３００からのＩ／Ｏ情報を取得するための情報取得要求を送信する（ステップＳ４１０１）。ここで、情報取得要求は、ストレージシステム１０００の各ストレージノード１００に対して送信し、それに対応して、各ストレージノード１００から稼働情報及びＩ／Ｏ情報を送信させるようにしてもよいし、ストレージシステム１０００の代表となるストレージノード１００に対して送信し、代表となるストレージノード１００により、各ストレージノード１００の稼働情報及びＩ／Ｏ情報を取得させ、まとめた情報を送信させるようにしてもよい。

【0080】

次いで、稼働情報収集プログラム２１００は、ストレージシステム１０００から送信される稼働情報及びＩ／Ｏ情報を受信する（ステップＳ４１０２）。なお、稼働情報及びＩ／Ｏ情報を、１回の通信で受信してもよいし、複数回の通信で受信してもよい。

【0081】

次いで、稼働情報収集プログラム２１００は、受信した稼働情報及びＩ／Ｏ情報を管理テーブル３０００に格納する（ステップＳ４１０３）。具体的には、稼働情報収集プログラム２１００は、稼働情報（例えば、ＣＰＵ稼働率、メモリ使用量、ネットワーク使用帯域等）を稼働情報管理テーブル３２００に格納し、Ｉ／Ｏ情報をホストＩ／Ｏ管理テーブル３３００に格納する。

【0082】

次に、管理装置２００による性能ネック分析処理（ステップＳ４２００）について説明する。

【0083】

図１３は、一実施形態に係る性能ネック分析処理のフローチャートである。

【0084】

性能ネック分析処理は、管理装置２００により、例えば定期的に実行される。性能ネック分析処理の実行周期は、例えば、ストレージシステム１０００の特性に基づいて決定された、ストレージシステム１０００の性能問題の検出、ネック部位の分析に必要な周期であってもよい。

【0085】

管理装置２００の性能ネック分析プログラム２２００（厳密には、性能ネック分析プログラム２２００を実行するＣＰＵ２１０）は、稼働情報管理テーブル３２００からストレージシステム１０００の各ストレージノード１００の稼働情報を取得する（ステップＳ４２０１）。ここで、取得した複数の稼働情報に対して、ストレージノード１００毎に、或る一定期間の各値の平均を取るなどの集計処理をしてもよい。

【0086】

次いで、性能ネック分析プログラム２２００は、取得した稼働情報に基づいて、ストレージノード１００のインスタンス１１０のリソースの稼働率（使用率：稼働性能）が推奨される稼働率（推奨稼働率：基準値）の上限を超えるか否かを判定する（ステップＳ４２０２）。なお、ステップＳ４２０２～Ｓ４２０８の処理は、稼働情報に含まれる各リソースの稼働率及びリソースの使用率のそれぞれを判定対象として実行してもよい。また、各リソースの推奨稼働率の上限は、テーブルにより管理してもよいし、他のデータ構造体で管理してもよい。これらの推奨稼働率の上限は、ストレージシステム１０００の起動時に予め格納しておき、性能ネック分析処理において参照できるようにしてもよい。

【0087】

この結果、リソースの稼働率（使用率）が推奨される稼働率（使用率）の上限を超えないと判定された場合（ステップＳ４２０２：Ｎｏ）には、ストレージシステム１０００において性能ネックとなっている部位が存在しないことを意味しているので、性能ネック分析プログラム２２００は、性能ネック分析処理を終了する。

【0088】

一方、リソースの稼働率（使用率）が推奨される所定の稼働率（使用率）の上限を超えると判定された場合（ステップＳ４２０２：Ｙｅｓ）には、ストレージシステム１０００において判定対象の部位（リソース）が性能ネックとなっていることを意味しているので、性能ネック分析プログラム２２００は、性能問題が定常的であるか否か、すなわち、リソースの稼働率（使用率）が推奨される所定の稼働率（使用率）の上限を超えることが定常的か否かを判定する（ステップＳ４２０３）。ここで、性能問題が定常的であるか否かは、稼働情報管理テーブル３２００の過去の稼働情報を参照することにより判定できる。また、性能問題が定常的であるか否かは、例えば、どの程度の期間、性能問題が持続したかの情報に基づいて判定してもよいが、定常と判定するための期間の閾値は、ストレージシステム１０００の特性に基づいて決定してもよい。

【0089】

この結果、性能問題が定常的でないと判定された場合（ステップＳ４２０３：Ｎｏ）には、一時的な性能問題であり、対処の必要がないと考えられるので、性能ネック分析プログラム２２００は、性能ネック分析処理を終了する。

【0090】

一方、性能問題が定常的であると判定された場合（ステップＳ４２０３：Ｙｅｓ）には、性能ネック分析プログラム２２００は、定常的に推奨稼働率上限を超えているストレージノード１００のリソースを性能ネック部位と決定する（ステップＳ４２０４）。ここで、性能ネック部位として決定されるストレージノード１００のリソースとは、例えば、インスタンス１１０のＣＰＵ１１１や、メモリ１１１２や、ネットワークＩ／Ｆ１１３である。

【0091】

次いで、性能ネック分析プログラム２２００は、決定された性能ネック部位の性能ネックを解消するために必要なリソース増強の割合（増強リソース量）を決定する（ステップＳ４２０５）。例えば、性能ネックを解消するために必要なリソース増強の割合は、稼働情報管理テーブル３２００と推奨稼働率とに基づいて決定すればよい。例えば、現在のＣＰＵ稼働率が７０％であり、ＣＰＵの推奨稼働率が５０％である場合、ＣＰＵのリソースを１．４倍にすると、ＣＰＵの稼働率が５０％となり、性能ネックを解消できるので、増強リソース量を１．４倍としてもよく、また、インスタンスタイプとしてとり得る倍率を考慮して、１．４倍を超え、且つ、とり得るリソースの最低の倍率（例えば、２倍）としてもよい。例えば、現在のインスタンス１１０のＣＰＵのコア数が１６コアであり、性能ネックがＣＰＵであり、性能ネックを解消するためにＣＰＵのコア数が３２コア以上必要である場合は、ネック解消に必要なリソース増強割合は２倍となる。

【0092】

次に、性能ネック分析プログラム２２００は、性能ネック部位をステップＳ４２０５で決定されたリソース増強の割合でリソースの増強を行い、性能ネックを解消した場合に、他のリソースが性能ネックとなるか否かを判定する（ステップＳ４２０６）。ここで、他のリソースは、ステップＳ４２０４で決定した性能ネック部位が存在するインスタンス１１０と同じインスタンス１１０内の他のリソースであってもよいし、性能ネック部位が存在するストレージノード１００と異なるストレージノード１００のリソースであってもよい。また、他の性能ネック部位を検出する際は、ストレージシステム１０００のボリューム構成や機能設定、各ストレージノード１００間の通信量などの情報に基づいて検出してもよい。

【0093】

例えば、或るストレージノード１００のＣＰＵの性能ネックを解消すると、そのストレージノード１００のＣＰＵの処理量が増加する。この場合、ＣＰＵの処理は、他のストレージノードとの通信も含まれるため、ネットワーク帯域の使用量が増加する。また、複数のストレージノードでクラスタを構成しており、複数のストレージノードで協調動作をするため、他のストレージノードのＣＰＵの稼働率も増加する。このような状況を考慮し、例えば、或るストレージノードのＣＰＵの性能ネックを解消する時には、このストレージノードのネットワーク帯域が所定の閾値以上である場合には、ネットワーク帯域が性能ネックとなると判定し、また、他のストレージノードのＣＰＵ稼働率が所定の閾値以上である場合に、他のストレージノードのＣＰＵが性能ネックとなると判定してもよい。

【0094】

この結果、他のリソースが性能ネックとなる場合（ステップＳ４２０６：Ｙｅｓ）には、性能ネック分析プログラム２２００は、性能ネックとなる他のリソースに対して、性能ネックを解消するために必要なリソース増強の割合を決定し（ステップＳ４２０７）、処理をステップＳ４２０６に進める。なお、性能ネックを解消のために必要なリソース増強の割合の決定方法は、ステップＳ４２０５と同様の方法でよい。

【0095】

一方、他のリソースが性能ネックとならない場合（ステップＳ４２０６：Ｎｏ）には、性能ネック分析プログラム２２００は、性能ネック部位の情報を性能ネック管理テーブル３４００に格納し（ステップＳ４２０８）、処理を終了する。具体的には、性能ネック分析プログラム２２００は、ステップＳ４２０４とＳ４２０６で検出した性能ネック部位と、ステップＳ４２０５とＳ４２０７で決定した必要なリソース増強の割合などの性能ネック部位の情報を性能ネック管理テーブル３４００に格納する。

【0096】

性能ネック分析処理によると、ストレージシステム１０００におけるインスタンス１１０における性能ネック部位を検出することができるとともに、性能ネック部位の性能ネックを解消するために必要なリソースを適切に検出することができる。

【0097】

次に、管理装置２００による性能ネック解消方法決定処理（ステップＳ４３００）について説明する。

【0098】

図１４は、一実施形態に係る性能ネック解消方法決定処理のフローチャートである。

【0099】

性能ネック解消方法決定処理は、例えば、定期的に、又は、性能ネック分析処理（ステップＳ４２００）の終了直後に実行される。

【0100】

管理装置２００の性能ネック解消方法決定プログラム２３００（厳密には、性能ネック解消方法決定プログラム２３００を実行するＣＰＵ２１０）は、性能ネック管理テーブル３４００にネック解消方法が決定されていない、すなわち、ネック解消方法決定済み３４０６がＦａｌｓｅとなっている性能ネックのエントリーが存在するか否かを判定する（ステップＳ４３０１）。

【0101】

この結果、該当するエントリーが存在しない場合（ステップＳ４３０１：Ｎｏ）には、性能ネック解消方法決定プログラム２３００は、性能ネック解消方法決定処理を終了する一方、該当するエントリーが存在する場合（ステップＳ４３０１：Ｙｅｓ）には、性能ネック解消方法決定プログラム２３００は、性能ネック管理テーブル３４００から、該当するエントリーを取得する（ステップＳ４３０２）。

【0102】

次いで、性能ネック解消方法決定プログラム２３００は、取得したエントリーの性能ネックを解消するために十分なリソースを含むインスタンスタイプを、取得したエントリーの情報と、インスタンス管理テーブル３１００の情報と、インスタンスタイプ管理テーブル３５００の情報とに基づいて決定する（ステップＳ４３０３）。本実施形態では、性能ネック解消方法決定プログラム２３００は、性能ネックとなるリソースについて性能ネックが解消されるリソース量となり、他のリソースについては、変更前から変更されない、又は増加されるリソース量が最も少ないインスタンスタイプを決定する。これにより、性能ネックと関係ないリソースが無駄にインスタンスに割り当てられてしまうことを適切に防止できる。

【0103】

次いで、性能ネック解消方法決定プログラム２３００は、決定したインスタンスタイプに変更する契機（変更契機）を決定する（ステップＳ４３０４）。変更契機は、ホストＩ／Ｏへの影響を最小化するために、ホストＩ／Ｏが少ない時間帯や曜日であってもよいし、予め計画された保守作業のタイミングとしてもよい。ホストＩ／Ｏが少ない時間帯や曜日を変更契機として選択する場合は、例えば、性能ネック解消方法決定プログラム２３００は、ホストＩ／Ｏ管理テーブル３３００の情報を分析し、ホストＩ／Ｏの周期性を見つけることで、ホストＩ／Ｏの少ないタイミングを契機として選択する。

【0104】

性能ネック解消方法決定プログラム２３００は、性能ネックが存在していたノードのノードＩＤと、決定した性能ネック解消のための変更後のインスタンスタイプと、決定した変更契機とを含むエントリーを対処実行管理テーブル３６００に格納する（ステップＳ４３０５）。

【0105】

次いで、性能ネック解消方法決定プログラム２３００は、性能ネック管理テーブル３４００の対応するエントリーのネック解消方法決定済み３４０６に性能ネック解消方法を決定したことを示すＴｒｕｅを記録し（ステップＳ４３０６）、処理を終了する。

【0106】

上記した性能ネック解消方法処理によると、性能ネックを解消するために必要なリソースを有するインスタンスタイプを決定でき、適切な変更契機を決定することができる。

【0107】

次に、管理装置２００による対処実行処理（ステップＳ４４００）について説明する。

【0108】

図１５は、一実施形態に係る対処実行処理のフローチャートである。

【0109】

対処実行処理は、例えば、定期的に実行される。対処実行プログラム２４００（厳密には、対処実行プログラム２４００を実行するＣＰＵ２１０）は、対処実行管理テーブル３６００から実行していない対処のエントリー、すなわち、対処実行完了３６０５がＦａｌｓｅであるエントリーを取得する（ステップＳ４４０１）。

【0110】

対処実行プログラム２４００は、取得したエントリー（対象エントリー）の変更契機を満たしているか否か判定する（ステップＳ４４０２）。この結果、対象エントリーの変更契機を満たしていない場合（ステップＳ４４０２：Ｎｏ）には、対処実行プログラム２４００は、処理をステップＳ４４０８に進める。

【0111】

一方、対象エントリーの変更契機を満たしている場合（ステップＳ４４０２：Ｙｅｓ）には、対処実行プログラム２４００は、対象エントリーに対応する変更対象のストレージノード１００、すなわち、対象エントリーのノードＩＤ３６０２のノードＩＤのストレージノード１００に対する保守のための閉塞指示（保守閉塞指示）を所定のストレージノード１００（例えば、クラスタの代表となるストレージノード１００）に送信する（ステップＳ４４０３）。この結果、保守閉塞指示を受け取ったストレージノード１００は、保守閉塞処理（図１７参照）を実行する。対処実行プログラム２４００は、保守閉塞指示をした後、ストレージノード１００の保守閉塞処理が完了するまで待機する。

【0112】

次いで、ストレージノード１００の保守閉塞処理が完了した後、対処実行プログラム２４００は、変更対象ストレージノードのインスタンスを取得エントリーの変更後インスタンスタイプＩＤ３６０３に対応するインスタンスタイプへ変更する指示（変更指示）を、インスタンス管理ノード６００に送信する（ステップＳ４４０４）。これにより、インスタンス管理ノード６００は、変更対象ストレージノードのインスタンスを変更後のインスタンスタイプに変更することができ、性能ネックを解消することができる。対処実行プログラム２４００は、変更指示をした後、ストレージノード１００のインスタンス１１０のインスタンスタイプの変更が完了するまで待機する。

【0113】

次いで、ストレージノード１００のインスタンス１１０のインスタンスタイプの変更が完了した後、対処実行プログラム２４００は、変更対象ストレージノードに対する保守から回復する指示（保守回復指示）を所定のストレージノード１００（例えば、クラスタの代表となるストレージノード１００）に送信する（ステップＳ４４０５）。この結果、保守回復指示を受け取ったストレージノード１００は、保守回復処理（図１８参照）を実行する。対処実行プログラム２４００は、保守回復指示をした後、ストレージノード１００の保守回復処理が完了するまで待機する。

【0114】

次いで、ストレージノード１００の保守回復処理が完了した後、対処実行プログラム２４００は、インスタンス管理テーブル３１００の変更対象ストレージノードに対応するエントリーの情報を、変更後インスタンスタイプのリソースのスペック情報に更新する（ステップＳ４４０６）。ここで、変更後インスタンスタイプのスペック情報は、対象エントリーの変更後インスタンスタイプＩＤ３６０３をキーとして、インスタンスタイプ管理テーブル３５００から取得したエントリーから取得できる。

【0115】

次いで、対処実行プログラム２４００は、対処実行管理テーブル３６００の対象エントリーの対処実行完了３６０５にＴｒｕｅを記録し（ステップＳ４４０７）、処理をステップＳ４４０８に進める。

【0116】

ステップＳ４４０８では、対処実行プログラム２４００は、対処実行管理テーブル３６００に、対処実行完了３６０５がＦａｌｓｅであり、且つ、変更契機の判定（ステップＳ４４０２）での対象となっていないエントリーが存在するか否かを判定する。

【0117】

この結果、対処実行完了３６０５がＦａｌｓｅであり、且つ、変更契機の判定（ステップＳ４４０２）での対象となっていないエントリーが存在する場合（ステップＳ４４０８：Ｙｅｓ）には、対処実行プログラム２４００は、処理をステップＳ４４０１に進めて、存在するエントリーを対象として後続の処理を行う。

【0118】

一方、対処実行完了３６０５がＦａｌｓｅであり、且つ、変更契機の判定（ステップＳ４４０２）での対象となっていないエントリーが存在しない場合（ステップＳ４４０８：Ｎｏ）には、対処実行プログラム２４００は、対処実行処理を終了する。

【0119】

次に、ストレージシステム１０００のストレージノードの構成について説明する。

【0120】

図１６は、一実施形態に係るストレージシステムのストレージノードの構成例である。

【0121】

ストレージシステム１０００においては、１つ以上の制御部クラスタ１６０を有する。制御部クラスタ１６０は、アクティブ状態であるストレージ制御部１５０Ａ（アクティブストレージ制御部ともいう）と、スタンバイ状態であるストレージ制御部１５０Ｓ（スタンバイストレージ制御部ともいう）とを含む。ストレージ制御部１５０Ａは、ホスト計算機３００がＩ／Ｏ可能なボリュームを提供する。ストレージ制御部１５０Ａは、提供するボリュームを指定したＩ／Ｏ要求をホスト計算機３００から受け付けた場合、指定されたボリュームに対するＩ／Ｏ処理を行う。ストレージ制御部１５０Ｓは、制御部クラスタ１６０を構成しているストレージ制御部１５０Ａが停止した場合、フェイルオーバーが行われて、アクティブ状態となり、ストレージ制御部１５０Ａに代わって、ボリュームのＩ／Ｏ処理を行う。同一の制御部クラスタ１６０のストレージ制御部１５０Ａとストレージ制御部１５０Ｓとは、別のストレージノード１００に構成されている。ストレージシステム１０００においてクラスタ１６０の中の代表となるストレージノード１００は、クラスタコントローラ１７０を有する。また、各ストレージノード１００は、ノードコントローラ１８０を有する。クラスタコントローラ１７０は、クラスタ１６０全体の状態を把握し、各ストレージノード１００の構成を制御する。ノードコントローラ１８０は、クラスタコントローラ１７０にストレージノード１００の情報を通知し、クラスタコントローラ１７０の指示に従って、ストレージノード１００の構成を制御する。本実施形態では、ストレージノード１００は、ストレージ制御部１５０Ａと、別の制御部クラスタ１６０のストレージ制御部１５０Ｓと、クラスタコントローラ１７０と、ノードコントローラ１８０と、をインスタンス１１０により構成している。

【0122】

次に、保守閉塞処理（ステップＳ４５００）について説明する。

【0123】

図１７は、一実施形態に係る保守閉塞処理のフローチャートである。

【0124】

保守閉塞処理は、ストレージノード１００のクラスタコントローラ１７０が管理装置２００から保守閉塞指示を受け取った場合に実行される。

【0125】

ストレージノード１００のクラスタコントローラ１７０は、対象のストレージノード１００が保守閉塞可能か否かの事前チェックを行う（ステップＳ４５０１）。例えば、クラスタコントローラ１７０は、処理の引継先のストレージノード、すなわち、閉塞するストレージ制御部１５０Ａに対応するストレージ制御部１５０Ｓを備えるストレージノード（引継先ノードともいう）で、処理の引継ぎができないような障害が発生しているか否かをチェックする。なお、障害が発生している場合には、保守閉塞処理を終了する。

【0126】

次いで、クラスタコントローラ１７０は、保守閉塞対象のストレージノード１００（この処理の説明において、保守閉塞ノードともいう）のノードコントローラ１８０に、ホスト計算機３００と通信するためのポートを閉塞させる指示を行い、指示を受けてノードコントローラ１８０は、指示に従ってポートを閉塞する（ステップＳ４５０２）。ポートが閉塞されると、ホスト計算機３００では、マルチパスの設定に従って、Ｉ／Ｏ要求の送信先が引継先ノードに切り替わる。

【0127】

次いで、クラスタコントローラ１７０は、引継先ノードのノードコントローラ１８０に、ホストＩ／Ｏの受付を一時停止させる指示を行い、指示を受けてノードコントローラ１８０は、ホストＩ／Ｏの受付を一時停止する（ステップＳ４５０３）。

【0128】

次いで、クラスタコントローラ１７０は、保守閉塞ノード１００のノードコントローラ１８０に、アクティブのストレージ制御部１５０Ａを停止させる指示を行い、指示を受けてノードコントローラ１８０は、ストレージ制御部１５０Ａを停止する（ステップＳ４５０４）。

【0129】

次いで、クラスタコントローラ１７０は、引継先ノード１００のノードコントローラ１８０に、スタンバイのストレージ制御部１５０Ｓをアクティブに切り替えさせる（動作させる）指示を行い、指示を受けてノードコントローラ１８０は、ストレージ制御部１５０Ｓをアクティブに切り替える（ステップＳ４５０５）。

【0130】

次いで、クラスタコントローラ１７０は、引継先ノードのノードコントローラ１８０に、ホストＩ／Ｏの停止を解除させる指示を行い、指示を受けてノードコントローラ１８０は、ホストＩ／Ｏの停止を解除する（ステップＳ４５０６）。これにより、引継先ノードのストレージ制御部１５０Ｓは、ホストＩ／Ｏを処理することができるようになる。

【0131】

次いで、クラスタコントローラ１７０は、保守閉塞ノード１００のノードコントローラ１８０に、保守閉塞ノード１００を停止させる指示を行い、指示を受けてノードコントローラ１８０は、指示に従って保守閉塞ノード１００を停止し（ステップＳ４５０７）、保守閉塞処理を終了する。

【0132】

次に、保守回復処理（ステップＳ４６００）について説明する。

【0133】

図１８は、一実施形態に係る保守回復処理のフローチャートである。

【0134】

保守回復処理は、ストレージノード１００のクラスタコントローラ１７０が管理装置２００から保守回復指示を受け取った場合に実行される。

【0135】

ストレージノード１００のクラスタコントローラ１７０は、保守回復の対象のストレージノード１００（保守回復ノード）の電源をオンし、ノードコントローラ１８０を起動させる（ステップＳ４６０１）。この時、クラスタコントローラ１７０は、保守回復ノード１００の起動ステータスを監視する。

【0136】

次いで、クラスタコントローラ１７０は、保守回復ノード１００のノードコントローラ１８０に、ストレージ制御部１５０Ａ、１５０Ｓをスタンバイとして起動させる指示を行い、指示を受けてノードコントローラ１８０は、ストレージ制御部１５０Ａ、１５０Ｓをスタンバイとして起動する（ステップＳ４６０２）。

【0137】

次いで、クラスタコントローラ１７０は、引継先ノードのノードコントローラ１８０に、ホストＩ／Ｏの受付を一時停止させる指示を行い、指示を受けてノードコントローラ１８０は、ホストＩ／Ｏの受付を一時停止する（ステップＳ４６０３）。

【0138】

次いで、クラスタコントローラ１７０は、保守回復ノード１００のノードコントローラ１８０に、スタンバイのストレージ制御部１５０Ａをアクティブに切り替えさせる（動作させる）指示を行い、指示を受けてノードコントローラ１８０は、ストレージ制御部１５０Ａをアクティブに切り替える（ステップＳ４６０４）。

【0139】

次いで、クラスタコントローラ１７０は、引継先ノードのノードコントローラ１８０に、ホストＩ／Ｏの停止を解除させる指示を行い、指示を受けてノードコントローラ１８０は、ホストＩ／Ｏの停止を解除する（ステップＳ４６０５）。

【0140】

次いで、クラスタコントローラ１７０は、引継先ノード１００のノードコントローラ１８０に、アクティブのストレージ制御部１５０Ｓをスタンバイに切り替えさせる（動作させる）指示を行い、指示を受けてノードコントローラ１８０は、ストレージ制御部１５０Ｓをスタンバイに切り替える（ステップＳ４５０６）。

【0141】

次いで、クラスタコントローラ１７０は、保守回復ノード１００のノードコントローラ１８０に、ホスト計算機３００と通信するためのポートを回復させる指示を行い、指示を受けてノードコントローラ１８０は、指示に従ってポートを回復する（ステップＳ４６０７）。ポートを回復すると、ホスト計算機３００では、マルチパスの設定に従って、Ｉ／Ｏ要求の送信先が保守回復ノードに切り替わる。

【0142】

次いで、クラスタコントローラ１７０は、保守回復ノード１００と冗長度を作るためのグループになっている全てのストレージノード１００のノードコントローラ１８０に、冗長度を回復させる指示を行い、指示を受けて各ノードコントローラ１８０は、指示に従って冗長度を回復する処理を実行し（ステップＳ４６０８）、保守回復処理を終了する。これにより、ストレージ制御部１５０Ａは、変更されたインスタンスタイプのインスタンスにより構成されることとなり、性能ネックが発生しなくなる。

【0143】

なお、本発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。

【0144】

例えば、上記実施形態において、性能ネックを分析し、性能ネックとなるリソースのリソース量を増加させるようにインスタンスの構成を変更するようにしていたが、例えば、ユーザからリソース量を増加させるインスタンスの指定を受け付けて、その指定を受けたことにより、リソースの構成の変更が必要であると判定し、リソース量を増加させるようにインスタンスの構成を変更するようにしてもよい。

【0145】

また、上記実施形態において、ＣＰＵが行っていた処理の一部又は全部を、ハードウェア回路で行うようにしてもよい。また、上記実施形態におけるプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア（例えば可搬型の記憶メディア）であってもよい。

【符号の説明】

【0146】

１…ストレージ管理システム、１０…クラウド、１００…ストレージノード、１１０…インスタンス、１１１…ＣＰＵ、１１２…メモリ、１１３…ネットワークＩ／Ｆ、１２０…ストレージデバイス、２００…管理装置、３００…ホスト計算機、６００…インスタンス管理ノード、１０００…ストレージシステム

【図1】