IP Force 特許公報掲載プロジェクト 2022.1.31 β版

ホーム > 特許ランキング > 日立ヴァンタラ株式会社

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立ヴァンタラ株式会社の特許一覧

特開2024-131157複数のストレージノードを有するストレージシステムのスケーリング管理装置及びスケーリング管理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024131157

(43)【公開日】2024-09-30

(54)【発明の名称】複数のストレージノードを有するストレージシステムのスケーリング管理装置及びスケーリング管理方法

(51)【国際特許分類】

G06F 9/50 20060101AFI20240920BHJP

【ＦＩ】

G06F9/50 120Z

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2023041249

(22)【出願日】2023-03-15

(71)【出願人】

【識別番号】524132520

【氏名又は名称】日立ヴァンタラ株式会社

(74)【代理人】

【識別番号】110002365

【氏名又は名称】弁理士法人サンネクスト国際特許事務所

(72)【発明者】

【氏名】林真一

(72)【発明者】

【氏名】大平良徳

(72)【発明者】

【氏名】佐藤功人

(57)【要約】

【課題】コンピュート設定変更の不要とノード障害時やノード過負荷時の影響範囲の局所化との少なくとも一つを適切に実現する。
【解決手段】ストレージシステムが有する一つ又は複数のストレージノードの各々が、コンピュートに提供されるボリュームとそのボリュームの性能に影響し得るコンポーネントとを有する。コンピュータが、いずれかのストレージノードにおける既存のボリュームの負荷が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、ストレージシステムのスケーリング方法として垂直スケーリングを選択する、及び／又は、いずれかのストレージノードのボリュームの数が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、ストレージシステムのスケーリング方法として水平スケーリングを選択する。
【選択図】図１

【特許請求の範囲】

【請求項1】

それぞれコンピュートに提供されるボリュームとそのボリュームの性能に影響し得るコンポーネントと有する一つ又は複数のストレージノードを含み選択されたスケーリング方法が実施されるストレージシステムのスケーリング管理装置であって、
記憶装置とプロセッサとを備え、
前記記憶装置が、
当該一つ又は複数のストレージノードの各々について当該ストレージノードが有するコンポーネントの負荷を表す情報であるコンポーネント負荷情報と、
当該一つ又は複数のストレージノードの各々について当該ストレージノードが有するボリュームの負荷を表す情報であるボリューム負荷情報と
を記憶し、
前記プロセッサが、
前記コンポーネント負荷情報及び前記ボリューム負荷情報を参照し、
いずれかのストレージノードにおける既存のボリュームの負荷が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又は増減すると判定した場合には、前記ストレージシステムのスケーリング方法として、前記ストレージシステムのストレージノードを増減せずそのコンポーネントを有するストレージノードに割り当てられるリソースを増減することである垂直スケーリングを選択する、及び／又は、いずれかのストレージノードのボリュームの数が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又は増減すると判定した場合には、前記ストレージシステムのスケーリング方法として、前記ストレージシステムのストレージノードを増減することである水平スケーリングを選択する、
スケーリング管理装置。

【請求項2】

前記プロセッサが、
いずれかのストレージノードにおけるコンポーネントの負荷が所定の閾値を超えるか否かを判定し、
その判定の結果が真の場合、そのストレージノードのボリューム毎の負荷を予測し、
そのストレージノードの各ボリュームの予測される負荷が増加傾向にある場合、前記垂直スケーリングとしてスケールアップを選択する、
請求項１に記載のスケーリング管理装置。

【請求項3】

前記プロセッサが、
いずれかのストレージノードにおけるコンポーネントの負荷が所定の閾値を超えるか否かを判定し、
その判定の結果が真の場合、そのストレージノードのボリューム毎の負荷を予測し、
そのストレージノードの各ボリュームの予測される負荷が増加傾向にない場合、前記水平スケーリングとしてスケールアウトを選択する、
請求項１に記載のスケーリング管理装置。

【請求項4】

前記プロセッサが、
前記一つ又は複数のストレージノードの各々について、過去の所定期間の開始から終了まで存在していたボリューム毎の負荷を基に当該ストレージノードのコンポーネントの負荷を計算し、
当該計算された負荷が閾値を超えたストレージノードがある場合、前記垂直スケーリングとして当該ストレージノードのスケールアップを選択する、
請求項１に記載のスケーリング管理装置。

【請求項5】

前記プロセッサが、
過去の所定期間において追加されたボリュームの数が所定の閾値を超えるストレージノードがある場合には、前記水平スケーリングとしてスケールアウトを選択する、
請求項１に記載のスケーリング管理装置。

【請求項6】

前記過去の所定期間は、前回のスケーリング方法選択又はスケーリング実施から現在までの期間である、
請求項５に記載のスケーリング管理装置。

【請求項7】

前記ストレージシステムが、複数の冗長グループを有し、
前記複数の冗長グループの各々が、二つ以上のストレージノードで構成され、
前記複数の冗長グループの各々について、当該冗長グループにおけるいずれかのストレージノードに格納されるデータは、当該冗長グループにおけるストレージノード間で冗長化され、
既存のボリュームの負荷が増減した又はすることによりコンポーネントの負荷が増減した又は増減するストレージノードがある場合、前記プロセッサは、そのストレージノードを含む冗長グループについて前記垂直スケーリングを選択する、
請求項１に記載のスケーリング管理装置。

【請求項8】

物理的にそれぞれが独立した複数のゾーンがあり、
前記複数のゾーンの各々に、前記複数の冗長グループの各々におけるいずれかのストレージノードが属しており、
前記複数の冗長グループの各々について、当該冗長グループにおける二つ以上のストレージノードが前記複数のゾーンのうちの異なる二つ以上のゾーンにそれぞれ属しており、
前記垂直スケーリングが選択される二つ以上の冗長グループがある場合、前記プロセッサが、当該二つ以上の冗長グループのうち同一ゾーンに属する二つ以上のストレージノードを並行して前記垂直スケーリングをすることを選択する、
請求項７に記載のスケーリング管理装置。

【請求項9】

それぞれコンピュートに提供されるボリュームとそのボリュームの性能に影響し得るコンポーネントとを有する一つ又は複数のストレージノードを含み選択されたスケーリング方法が実施されるストレージシステムのスケーリング管理方法であって、
コンピュータが、コンポーネント負荷情報及びボリューム負荷情報を参照し、
前記コンポーネント負荷情報は、当該一つ又は複数のストレージノードの各々について当該ストレージノードが有するコンポーネントの負荷を表す情報であり、
前記ボリューム負荷情報は、当該一つ又は複数のストレージノードの各々について当該ストレージノードが有するボリュームの負荷を表す情報であり、
コンピュータが、いずれかのストレージノードにおける既存のボリュームの負荷が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、前記ストレージシステムのスケーリング方法として、前記ストレージシステムのストレージノードを増減せずそのコンポーネントを有するストレージノードに割り当てられるリソースを増減することである垂直スケーリングを選択し、
コンピュータが、いずれかのストレージノードのボリュームの数が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、前記ストレージシステムのスケーリング方法として、前記ストレージシステムのストレージノードを増減することである水平スケーリングを選択する、
スケーリング管理方法。

【請求項10】

コンポーネント負荷情報及びボリューム負荷情報を参照し、
前記コンポーネント負荷情報は、それぞれコンピュートに提供されるボリュームとそのボリュームの性能に影響し得るコンポーネントと有する一つ又は複数のストレージノードを含んだストレージシステムに関し、当該一つ又は複数のストレージノードの各々について当該ストレージノードが有するコンポーネントの負荷を表す情報であり、
前記ボリューム負荷情報は、当該一つ又は複数のストレージノードの各々について当該ストレージノードが有するボリュームの負荷を表す情報であり、
いずれかのストレージノードにおける既存のボリュームの負荷が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、前記ストレージシステムのスケーリング方法として、前記ストレージシステムのストレージノードを増減せずそのコンポーネントを有するストレージノードに割り当てられるリソースを増減することである垂直スケーリングを選択し、
いずれかのストレージノードのボリュームの数が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、前記ストレージシステムのスケーリング方法として、前記ストレージシステムのストレージノードを増減することである水平スケーリングを選択する、
ことをコンピュータに実行させるコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、概して、ストレージシステムのスケーリングに関する。

【背景技術】

【0002】

従量課金型であるクラウドサービスとしてのストレージシステムの登場により、負荷に応じて必要な時に必要なだけのリソースをストレージシステムに割り当てることで、ピーク負荷に合わせたサイジングが不要になり、インフラコスト削減が可能である。

【0003】

Ｓｏｆｔｗａｒｅ－ＤｅｆｉｎｅｄＳｔｏｒａｇｅ（ＳＤＳ）としてのストレージシステム（以下、ＳＤＳシステム）についても、変動する負荷に応じて適切にリソースをストレージシステムに割り当てる必要がある。ＳＤＳシステムへのリソース割当てとして、垂直スケーリングと水平スケーリングが挙げられる。「垂直スケーリング」は、ＳＤＳシステムを構成するストレージノードのリソースを増減させることであり、リソースを増加させることを「スケールアップ」と呼び、リソースを減少させることを「スケールダウン」と呼ぶ。「水平スケーリング」は、ＳＤＳシステムを構成するストレージノードの数を増減させることであり、ノード数を増加させることを「スケールアウト」と呼び、ノード数を減少させることを「スケールイン」と呼ぶ。垂直スケーリングの特徴は、ＳＤＳシステムにアクセスするコンピュート（例えば物理的又は仮想的な計算機）の設定変更が不要であり、既存ボリュームの性能増減を短時間でできることである。水平スケーリングの特徴は、ノード数が増えることで、ノード障害時や過負荷時の影響範囲を局所化できることである。

【0004】

特許文献１では、ロードバランサ配下の仮想サーバが動作している物理サーバに空きリソースがある場合はその仮想サーバがスケールアップされる。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】JP5378946

【発明の概要】

【発明が解決しようとする課題】

【0006】

ロードバランサが使用される場合には、ロードバランサが過負荷になる場合があり、故に、ロードバランサそれ自体の垂直スケーリングや水平スケーリングが必要となる。

【0007】

そこで、ロードバランサ無しのスケーリングの実施が考えられる。

【0008】

しかし、ロードバランサが使用されない場合に水平スケーリングが実施されると、ボリュームの再配置に伴いコンピュートの設定変更が必要になる場合がある。コンピュート設定変更を避けるために垂直スケーリングだけが繰り返し実施されると、ノード障害時やノード過負荷時の影響が広がる場合がある。

【課題を解決するための手段】

【0009】

ストレージシステムが有する一つ又は複数のストレージノードの各々が、コンピュートに提供されるボリュームとそのボリュームの性能に影響し得るコンポーネントと有する。コンピュータが、いずれかのストレージノードにおける既存のボリュームの負荷が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、ストレージシステムのスケーリング方法として垂直スケーリング（ストレージシステムのストレージノードを増減せずそのコンポーネントを有するストレージノードに割り当てられるリソースを増減すること）を選択する、及び／又は、いずれかのストレージノードのボリュームの数が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又はすると判定した場合には、ストレージシステムのスケーリング方法として水平スケーリング（ストレージシステムのストレージノードを増減すること）を選択する。

【発明の効果】

【0010】

コンピュート設定変更の不要とノード障害時やノード過負荷時の影響範囲の局所化との少なくとも一つを適切に実現することができる。

【図面の簡単な説明】

【0011】

【図1】実施例１に係るシステム全体の構成の一例を示す。

【図2】コンピュートノード２の一例を示す。

【図3】ストレージノード４の一例を示す。

【図4】ストレージ構成情報２６の一例を示す。

【図5】ストレージノード性能情報２７の一例を示す。

【図6】ボリューム性能情報２８の一例を示す。

【図7】コンポーネント使用率情報４２の一例を示す。

【図8】スケーリング情報４３の一例を示す。

【図9】ノードサイズ情報４４の一例を示す。

【図10】適正閾値情報４５の一例を示す。

【図11】ストレージクラスタ３と冗長グループ１４１とストレージノード４の関係の一例を示す。

【図12】スケーリング選択処理の流れの一例を示す。

【図13】スケールアップ処理の流れの一例を示す。

【図14】スケールアウト処理の流れの一例を示す。

【図15】スケールアップ提案画面３６１の一例を示す。

【図16】スケールアウト提案画面３７１の一例を示す。

【図17】ゾーン１５１と冗長グループ１４１とストレージノード４の関係の一例を示す。

【図18】ドライブアクセス情報４６の一例を示す。

【発明を実施するための形態】

【0012】

以下の説明では、「インターフェース装置」は、一つ以上のインターフェースデバイスでよい。当該一つ以上のインターフェースデバイスは、下記のうちの少なくとも一つでよい。
・一つ以上のＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）インターフェースデバイス。Ｉ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）インターフェースデバイスは、Ｉ／Ｏデバイスと遠隔の表示用計算機とのうちの少なくとも一つに対するインターフェースデバイスである。表示用計算機に対するＩ／Ｏインターフェースデバイスは、通信インターフェースデバイスでよい。少なくとも一つのＩ／Ｏデバイスは、ユーザインターフェースデバイス、例えば、キーボード及びポインティングデバイスのような入力デバイスと、表示デバイスのような出力デバイスとのうちのいずれでもよい。
・一つ以上の通信インターフェースデバイス。一つ以上の通信インターフェースデバイスは、一つ以上の同種の通信インターフェースデバイス（例えば一つ以上のＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ））であってもよいし二つ以上の異種の通信インターフェースデバイス（例えばＮＩＣとＨＢＡ（ＨｏｓｔＢｕｓＡｄａｐｔｅｒ））であってもよい。

【0013】

また、以下の説明では、「メモリ」は、一つ以上の記憶デバイスの一例である一つ以上のメモリデバイスであり、典型的には主記憶デバイスでよい。メモリにおける少なくとも一つのメモリデバイスは、揮発性メモリデバイスであってもよいし不揮発性メモリデバイスであってもよい。

【0014】

また、以下の説明では、「永続記憶装置」は、一つ以上の記憶デバイスの一例である一つ以上の永続記憶デバイスでよい。永続記憶デバイスは、典型的には、不揮発性の記憶デバイス（例えば補助記憶デバイス）でよく、具体的には、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、ＮＶＭＥ（Ｎｏｎ－ＶｏｌａｔｉｌｅＭｅｍｏｒｙＥｘｐｒｅｓｓ）ドライブ、又は、ＳＣＭ（ＳｔｏｒａｇｅＣｌａｓｓＭｅｍｏｒｙ）でよい。

【0015】

また、以下の説明では、「プロセッサ」は、一つ以上のプロセッサデバイスでよい。少なくとも一つのプロセッサデバイスは、典型的には、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）のようなマイクロプロセッサデバイスでよいが、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）のような他種のプロセッサデバイスでもよい。少なくとも一つのプロセッサデバイスは、シングルコアでもよいしマルチコアでもよい。少なくとも一つのプロセッサデバイスは、プロセッサコアでもよい。少なくとも一つのプロセッサデバイスは、処理の一部又は全部を行うハードウェア記述言語によりゲートアレイの集合体である回路（例えばＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、ＣＰＬＤ（ＣｏｍｐｌｅｘＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）又はＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ））といった広義のプロセッサデバイスでもよい。

【0016】

また、以下の説明では、「ｙｙｙ機能」の表現にて機能を説明することがあるが、機能は、１つ以上のコンピュータプログラムがプロセッサによって実行されることで実現されてもよいし、１つ以上のハードウェア回路（例えばＦＰＧＡ又はＡＳＩＣ）によって実現されてもよいし、それらの組合せによって実現されてもよい。プログラムがプロセッサによって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び／又はインターフェース装置等を用いながら行われるため、機能はプロセッサの少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機又は計算機が読み取り可能な記録媒体（例えば非一時的な記録媒体）であってもよい。各機能の説明は一例であり、複数の機能が１つの機能にまとめられたり、１つの機能が複数の機能に分割されたりしてもよい。「ｙｙｙ機能」は、「ｙｙｙ部」と呼ばれてもよい。

【0017】

また、以下の説明では「ボリューム」（ＶＯＬ）は、ストレージの記憶領域を示し、これらは物理的な記憶デバイス又は論理的な記憶デバイスによって実装されていてよい。また、ＶＯＬは、実体的なＶＯＬであってもよいし、仮想的なＶＯＬ（ＶＶＯＬ）であってもよい。「ＲＶＯＬ」は、そのＲＶＯＬを有するストレージノードが有する物理的な記憶資源に基づくＶＯＬでよい。「ＶＶＯＬ」は、外部接続ＶＯＬ（ＥＶＯＬ）と、容量拡張ＶＯＬ（ＴＰＶＯＬ）と、スナップショットＶＯＬとのうちのいずれでもよい。ＥＶＯＬは、外部のストレージの記憶空間（例えばＶＯＬ）に基づいており、ストレージ仮想化技術に従うＶＯＬでよい。ＴＰＶＯＬは、複数の仮想領域（仮想的な記憶領域）で構成されており容量仮想化技術（典型的にはＴｈｉｎＰｒｏｖｉｓｉｏｎｉｎｇ）に従うＶＯＬでよい。スナップショットＶＯＬは、ＶＯＬのスナップショットとしてのＶＯＬでよい。

【0018】

また、以下の説明では、同種の要素を区別しないで説明する場合には、参照符号のうちの共通符号を使用し、同種の要素を区別して説明する場合には、参照符号を使用することがある。

【実施例0019】

図１は、実施例１に係るシステム全体の構成の一例を示す。

【0020】

システムはクラウド１上に構築される。クラウド１はパブリッククラウドでもプライベートクラウドでもよい。パブリッククラウドは、不特定多数の企業や組織が使用するクラウドである。プライベートクラウドは、特定の企業や組織のみが使用するクラウドである。クラウド１は、物理的な計算機システム（例えば、複数の物理的な計算リソースを有する複数の物理計算機）に基づく。

【0021】

システムは、一つ又は複数のコンピュートノード２、ストレージノード４、コントローラノード５、ＡＰＩエンドポイント６、スケーリング管理ノード７、管理端末８、仮想ネットワーク９を含む。

【0022】

コンピュートノード２は、クラウド１上で動作する仮想マシンであり、ストレージノード４のボリュームにデータをライトし、ストレージノード４のボリュームからデータをリードするノードである。コンピュートノード２は、クラウド１の外に存在してよく、物理的な計算機でもよい。

【0023】

ストレージノード４は、クラウド１上で動作する仮想マシンであり、コンピュートノード２からの要求に応じてデータをリード／ライトするノードである。ストレージノード４はストレージクラスタ３を構成する。ストレージクラスタ３は、ストレージシステムの一例である。ストレージクラスタ３は、ＳＤＳシステムであり、一つ又は複数のストレージノード４を含む。

【0024】

コントローラノード５は、ＡＰＩエンドポイント６にアクセスするためのノードである。コントローラノード５は、垂直スケーリング機能３１及び水平スケーリング機能３２を含む。垂直スケーリング機能３１は、同一ストレージクラスタ３内のストレージノード４のリソース量を増減させる機能、つまり、垂直スケーリングを実施する機能である。水平スケーリング機能３２は、同一ストレージクラスタ３への新しいストレージノード４の追加や同一ストレージクラスタ３内のストレージノード４を削除する機能、つまり、水平スケーリングを実施する機能である。

【0025】

ＡＰＩエンドポイント６は、クラウド上のリソースを制御するためのＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ）である。

【0026】

スケーリング管理ノード７は、ストレージクラスタ３のスケーリングを管理するノードである。スケーリング管理ノード７は、仮想マシンであり、仮想ネットワークＩ／Ｆ１１１、仮想メモリ１１４及び仮想ＣＰＵ１１２を有する。仮想ネットワークＩ／Ｆ１１１は、物理的なインターフェース装置が割り当てられた仮想的なリソースであり、仮想ネットワーク９を介した通信を行う。仮想メモリ１１４（記憶装置の一例）は、物理的なメモリが割り当てられた仮想的なリソースであり、例えば、コンポーネント使用率情報４２、スケーリング情報４３、ノードサイズ情報４４、適正閾値情報４５を含む。仮想ＣＰＵ１１２（プロセッサの一例）は、物理的なＣＰＵが割り当てられた仮想リソースであり、コンピュータプログラムを実行することでスケーリング管理機能４１を実現する。なお、スケーリング管理ノード７は、物理的な装置であってもよく、仮想ネットワークＩ／Ｆ１１１、仮想メモリ１１４及び仮想ＣＰＵ１１２に代えてそれぞれ物理的なリソース（物理的なインターフェース装置、物理的な記憶装置及び物理的なプロセッサ）が採用されてもよい。スケーリング管理ノード７は、クラウド１の外に存在してもよい。また、スケーリング管理ノード７は、垂直スケーリング機能３１及び水平スケーリング機能３２のうちの少なくとも一つ有してよい。

【0027】

管理端末８は、スケーリング管理ノード７が提案した内容をユーザ（例えば管理者）が確認し、スケーリングの実行を指示するための端末である。管理端末８が無く、スケーリング管理ノード７が選択したスケーリング方法がコントローラノード５で実施されてよい。

【0028】

仮想ネットワーク９は、物理的なネットワークが割り当てられた仮想的なリソースであり、コンピュートノード２、ストレージノード４、コントローラノード５、ＡＰＩエンドポイント６、スケーリング管理ノード７及び管理端末８を相互に接続するためのネットワークである。

【0029】

図２は、コンピュートノード２の一例を示す。

【0030】

コンピュートノード２は、仮想ネットワークＩ／Ｆ１１、仮想ＣＰＵ１２、仮想ボリューム１３（ボリュームの一例）、及び、仮想メモリ１４を含む。

【0031】

仮想ネットワークＩ／Ｆ１１は、仮想ネットワーク９に接続するための仮想的なインターフェースである。

【0032】

仮想ＣＰＵ１２は、仮想メモリ１４上の機能を実行する仮想的なＣＰＵである。

【0033】

仮想ボリューム１３は、データを格納するための仮想的なボリュームである。仮想ボリューム１３にデータをライトすることで、ストレージノード４にデータをライトすることができる。仮想ボリューム１３からデータをリードすることで、ストレージノード４からデータをリードすることができる。

【0034】

仮想メモリ１４は、仮想ＣＰＵ１２が実行する機能やその機能が必要とするデータを記憶する仮想的なメモリである。仮想メモリ１４は、データベース機能１５、マルチパス機能１６及びストレージ接続情報１７を含む。

【0035】

データベース機能１５は、データを管理する機能であり、管理するデータをストレージノード４に保存する。データベース機能１５に代えて又は加えて、仮想ボリューム２３にデータをリード／ライトする他の機能が採用されてもよい。マルチパス機能１６は、ストレージクラスタ３上のある仮想ボリュームに複数のストレージノード４を経由して接続することで、あるストレージノードに障害が発生した場合においてもアクセスを継続できるようにする機能である。マルチパス機能１６は、異なる経路で接続した仮想ボリュームを１つの仮想ボリュームとしてデータベース機能１５に提供する。ストレージ接続情報１７は、ストレージに接続するために使用する情報である。ストレージ接続情報１７は、ストレージＩＰアドレス５１、ストレージｉＳＣＳＩ名５２を含む。ストレージＩＰアドレス５１は、ストレージノードのＩＰアドレスを示す。ストレージｉＳＣＳＩ名５２は、ストレージのターゲットの名前を示す。

【0036】

図３は、ストレージノード４の一例を示す。

【0037】

ストレージノード４は、仮想ネットワークＩ／Ｆ２１、仮想ＣＰＵ２２、仮想ボリューム２３、及び、仮想メモリ２４を含む。

【0038】

仮想ネットワークＩ／Ｆ２１は、仮想ネットワーク９に接続するための仮想的なインターフェースである。

【0039】

仮想ＣＰＵ２２は、仮想メモリ２４上の機能を実行する仮想的なＣＰＵである。

【0040】

仮想ボリューム２３は、データを格納する仮想的なボリュームであり、クラウド１が提供するサービスである。例えば、仮想ボリューム２３は、コンピュートノード２に提供され認識されてよい。コンピュートノード２が認識した仮想ボリューム２３がコンピュートノード２において仮想ボリューム１３として管理されてよい。すなわち、コンピュートノード２において仮想ボリューム１３に対するリード／ライトが生じた場合、リード又はライトのリクエスト（仮想ボリューム２３を指定したリクエスト）がストレージノード４に送信され、ストレージノード４のストレージ制御機能２５が、そのリクエストに応答して、指定された仮想ボリューム２３に対するリード／ライトを行ってよい。

【0041】

仮想メモリ２４は、ストレージ制御機能２５、ストレージ構成情報２６、ストレージノード性能情報２７及びボリューム性能情報２８を含む。

【0042】

ストレージ制御機能２５は、コンピュートノード２からのライトリクエストに基づき仮想ボリューム２３と同一ストレージクラスタ３のストレージノード４上の仮想ボリューム２３にデータをライトし、リードリクエストに基づき仮想ボリューム２３や同一ストレージクラスタのストレージノード４上の仮想ボリューム２３からデータをリードし、その結果をコンピュートノード２に返す機能である。ストレージノード４が停止した場合においても、他のストレージノード４のストレージ制御機能２５が機能を引き継げるようにストレージ制御機能２５は、冗長化されている。また、ストレージノード４が停止した場合においてもデータにアクセスできるように、ストレージ制御機能２５は、同一ストレージノード４内と他のストレージノード４内の仮想ボリューム２３にそれぞれデータをライトする。

【0043】

ストレージ構成情報２６は、同一ストレージクラスタ３のストレージノード４の構成情報である。

【0044】

ストレージノード性能情報２７は、同一ストレージクラスタ３のストレージノード４の性能情報である。

【0045】

ボリューム性能情報２８は、同一ストレージクラスタ３の仮想ボリューム２３の性能情報である。

【0046】

図４は、ストレージ構成情報２６の一例を示す。

【0047】

ストレージ構成情報２６は、ストレージノード４毎に、ストレージノードＩＤ６１、冗長グループ６２、データ保護種別６３及びノードサイズ６４といった情報を含む。

【0048】

ストレージノードＩＤ６１は、ストレージノード４のＩＤを示す。冗長グループ６２は、ストレージノード４が属する冗長グループのＩＤを示す。データ保護種別６３は、データ保護の種別を示す。データ保護種別６３が「Ｍｉｒｒｏｒ」の場合は、データが２台のストレージノードに保存される。データ保護種別６３が「ｍＤｎＰ」（ｍおよびｎは整数）の場合は、ｍ台のストレージノード４にデータが保存され、ｎ台のストレージノード４にパリティデータが保存される。データ保護は、例えばＥＣ（ＥｒａｓｕｒｅＣｏｄｉｎｇ）により実現されてもよいしＲＡＩＤ（ＲｅｄｕｎｄａｎｔＡｒｒａｙｏｆＩｎｄｅｐｅｎｄｅｎｔ（ｏｒＩｎｅｘｐｅｎｓｉｖｅ）Ｄｉｓｋｓ）により実現されてもよい。ノードサイズ６４はストレージノード４のサイズを示す。

【0049】

以下の説明では、ＩＤが「Ｘ」である要素ｅを、「ｅＸ」と記載することがある（つまり、参照符号に代えてＩＤを使用することがある）。図４が示す例によれば、ストレージノードＳＮ１～ＳＮ３が同一の冗長グループＲＧ１を構成し、ストレージノードＳＮ１にライトされるデータがストレージノードＳＮ２にミラーリングされ、ストレージノードＳＮ２にライトされるデータがストレージノードＳＮ３にミラーリングされ、ストレージノードＳＮ３にライトされるデータがストレージノードＳＮ１にミラーリングされる。

【0050】

図５は、ストレージノード性能情報２７の一例を示す。

【0051】

ストレージノード性能情報２７は、取得されたノード性能情報毎に（例えばストレージ制御機能２５により取得されたノード性能情報毎に）、ストレージノードＩＤ７１、日時７２、ＣＰＵ使用率７３、ネットワークスループット７４、ドライブＩＯＰＳ７５及びドライブスループット７６といった情報を含む。「ＩＯＰＳ」は、ＩＯＰｅｒＳｅｃｏｎｄの略である。

【0052】

ストレージノードＩＤ７１は、ノード性能情報が取得されたストレージノード４のＩＤを示す。日時７２は、ノード性能情報が取得された日時を示す。

【0053】

ＣＰＵ使用率７３は、ノード性能情報が示すＣＰＵ使用率（仮想ＣＰＵ２２の使用率）を示す。ネットワークスループット７４は、ノード性能情報が示すネットワークスループット（仮想ネットワーク９を通じて仮想ネットワークＩ／Ｆ２１が送受信する単位時間当たりのデータ量）を示す。ドライブＩＯＰＳ７５は、ノード性能情報が示すドライブＩＯＰＳ（ストレージノード４内の全ての仮想ボリューム２３への単位時間当たりのアクセス数（ＩＯ数））を示す。ドライブスループット７６は、ノード性能情報が示すドライブスループット（ストレージノード４内の全ての仮想ボリューム２３に入出力される単位時間当たりのデータ量（アクセススループット））を示す。

【0054】

図６は、ボリューム性能情報２８の一例を示す。

【0055】

ボリューム性能情報２８は、取得されたボリューム性能情報毎に（例えばストレージ制御機能２５により取得されたボリューム性能情報毎に）、ボリュームＩＤ８１、アクティブストレージノードＩＤ８２、スタンバイストレージノードＩＤ８３、日時８４、リードＩＯＰＳ８５、ライトＩＯＰＳ８６、リードスループット８７及びライトスループット８８といった情報を含む。

【0056】

ボリュームＩＤ８１は、仮想ボリューム２３のＩＤを示す。アクティブストレージノードＩＤ８２は、仮想ボリューム２３の処理を担当するストレージノードのＩＤを示す。コンピュートノード２からライトされたデータは、アクティブストレージノード４内の仮想ボリューム２３にライトされる。スタンバイストレージノードＩＤ８３は、アクティブストレージノード４が停止している場合にそのアクティブストレージノード４が担当していた仮想ボリューム２３の処理を担当するストレージノード４のＩＤを示す。コンピュートノード２からライトされたデータは、スタンバイストレージノード４内の仮想ボリューム２３にもライトされる。日時８４は、ボリューム性能情報が取得された日時を示す。

【0057】

リードＩＯＰＳ８５は、ボリューム性能情報が示すリードＩＯＰＳ（コンピュートノード２が仮想ボリューム２３からリードした単位時間当たりのリード回数）を示す。ライトＩＯＰＳ８６は、ボリューム性能情報が示すライトＩＯＰＳ（コンピュートノード２が仮想ボリューム２３にライトした単位時間当たりのライト回数）を示す。リードスループット８７は、ボリューム性能情報が示すリードスループット（コンピュートノード２が仮想ボリューム２３からリードしたときのスループット（単位時間当たりのリードデータ量））を示す。ライトスループット８８は、ボリューム性能情報が示すライトスループット（コンピュートノード２が仮想ボリューム２３にライトしたときのスループット（単位時間当たりのライトデータ量））を示す。

【0058】

図７は、コンポーネント使用率情報４２の一例を示す。

【0059】

コンポーネント使用率情報４２は、取得されたコンポーネント使用率（コンポーネント負荷の一例）毎に、クラスタＩＤ９１、ストレージノードＩＤ９２、日時９３、ＣＰＵ使用率９４、ネットワーク使用率９５、ドライブＩＯＰＳ使用率９６及びドライブスループット使用率９７といった情報を含む。

【0060】

クラスタＩＤ９１は、ストレージクラスタ３のＩＤを示す。ストレージノードＩＤ９２は、ストレージノード４のＩＤを示す。日時９３は、ノード性能情報が取得された日時を示す。コンポーネント使用率は、ノード性能情報から特定可能である。コンポーネント使用率として、例えば、ＣＰＵ使用率、ネットワーク使用率、ドライブＩＯＰＳ使用率、及び、ドライブスループット使用率がある。本実施例において、「コンポーネント」とは、仮想ボリューム２３の性能に影響し得る要素（つまり仮想ボリューム２３とは別の要素）である。

【0061】

ＣＰＵ使用率９４は、仮想ＣＰＵ２２の使用率を示す。ネットワーク使用率９５は、ストレージノード４の仮想ネットワークＩ／Ｆ２１の使用率を示す。ドライブＩＯＰＳ使用率９６は、ストレージノード４内の全ての仮想ボリューム２３への最大アクセス数に対するアクセス数（ノード性能情報から特定されたアクセス数（ドライブＩＯＰＳ））の割合を示す。ドライブスループット使用率９７は、ストレージノード４内の全ての仮想ボリューム２３への最大スループットに対するスループット（ノード性能情報から特定されたスループット（ドライブスループット））の割合を示す。最大アクセス数及び最大スループットは、それぞれ、所定値でもよいし、所定の方法により計算された値でもよい。

【0062】

図８は、スケーリング情報４３の一例を示す。

【0063】

スケーリング情報４３は、ＣＰＵ使用率閾値１０１、ネットワーク使用率閾値１０２、ドライブ使用率閾値１０３、上限ＣＰＵコア数１０４、上限ストレージノード数１０５、標準ノードサイズ１０６及び上限ストレージノードコスト１０７といった情報を含む。

【0064】

ＣＰＵ使用率閾値１０１は、ＣＰＵ使用率（ストレージノード４の仮想ＣＰＵ２２の使用率）の閾値を示す。ＣＰＵ使用率がこの閾値が超過したときにスケーリングがされる。

【0065】

ネットワーク使用率閾値１０２は、ネットワーク使用率（ストレージノード４の仮想ネットワークＩ／Ｆ２１の使用率）の閾値を示す。ネットワーク使用率がこの閾値を超過したときにスケーリングされる。

【0066】

ドライブ使用率閾値１０３は、ドライブ使用率（ストレージノード４の全ての仮想ボリューム２３へのアクセス使用率）の閾値を示す。ドライブ使用率がこの閾値を超過したときにスケーリングがされる。

【0067】

上限ＣＰＵコア数１０４は、ストレージノード４がスケールアップできる最大のＣＰＵコア数を示す。上限ストレージノード数１０５はストレージクラスタ３がスケールアウトできる最大のストレージノード数を示す。標準ノードサイズ１０６は、標準的に用いるストレージノードのサイズを示す。上限ストレージノードコスト１０７は、上限となるストレージノードのコストを示す。

【0068】

図９は、ノードサイズ情報４４の一例を示す。

【0069】

ノードサイズ情報４４は、ノードサイズ毎に、ノードサイズ５１１、ＣＰＵコア数５１２、メモリ容量５１３、ネットワークスループット５１４、ドライブＩＯＰＳ５１５、ドライブスループット５１６及び価格５１７といった情報を含む。

【0070】

ノードサイズ５１１は、ノードのサイズを示す。ＣＰＵコア数５１２は、ノードに割り当てられるＣＰＵコア数を示す。メモリ容量５１３は、ノードに割り当てられるメモリの容量を示す。ネットワークスループット５１４は、ノードに割り当てられるネットワークスループットの上限値を示す。ドライブＩＯＰＳ５１５は、ノードに接続された全ての仮想ドライブへのアクセス数の上限値を示す。ドライブスループット５１６は、ノードに接続された全ての仮想ドライブへのアクセスのスループットの上限値を示す。価格５１７は、ノードを使用時に課金される１時間当たりの価格を示す。

【0071】

図１０は、適正閾値情報４５の一例を示す。

【0072】

適正閾値情報４５は、コンポーネント１２１、適正閾値１２２を含む。コンポーネント１２１は、ストレージノード４を構成しボリューム性能のボトルネックになり得る要素を示す。適正閾値１２２は、コンポーネントごとの適正な使用率の上限値を示す。なお、適正閾値１２２が、スケーリング情報４３における閾値１０１～１０３と同じ場合、適正閾値情報４５が無くてもよいし、或いは、スケーリング情報４３のうち閾値１０１～１０３は無くてもよい。また、適正閾値１２２は、管理端末８から変更されてもよく、その場合、適正閾値１２２がスケーリング情報４３における閾値１０１～１０３に反映されて、スケーリングの契機が変更されてもよい。

【0073】

図１８は、ドライブアクセス情報４６の一例を示す。

【0074】

ドライブアクセス情報４６は、データ保護種別毎に、データ保護種別１３１、リードＩＯＰＳ増幅係数１３２、ライトＩＯＰＳ増幅係数１３３、リードスループット増幅係数１３４及びライトスループット増幅係数１３５といった情報を示す。

【0075】

データ保護種別１３１は、データ保護種別を示す。リードＩＯＰＳ増幅係数１３２は、リードＩＯＰＳの増幅係数を示す。ライトＩＯＰＳ増幅係数１３３は、ライトＩＯＰＳの増幅係数を示す。リードスループット増幅係数１３４は、リードスループットの増幅係数を示す。ライトスループット増幅係数１３５は、ライトスループットの増幅係数を示す。

【0076】

ドライブアクセス情報４６は、仮想ボリューム２３へのＩＯＰＳやスループットが、コンピュートノード２からのアクセスのＩＯＰＳやスループットの何倍になるかをデータ保護種別ごとにリードとライト別に記録した情報である。

【0077】

図１１は、ストレージクラスタ３と冗長グループ１４１とストレージノード４の関係の一例を示す。

【0078】

ストレージクラスタ３は、複数の冗長グループ１４１を含む。複数の冗長グループ１４１の各々が、二つ以上のストレージノード４で構成される。複数の冗長グループ１４１の各々について、当該冗長グループ１４１におけるいずれかのストレージノード４に格納されるデータは、当該冗長グループにおけるストレージノード４間で冗長化される。データの冗長化は、データ保護種別６３（図４参照）に依存する。

【0079】

図１１が示す例によれば、ストレージクラスタ３は、冗長グループ１４１ａと冗長グループ１４１ｂを含む。冗長グループ１４１ａは、ストレージノード４ａ、ストレージノード４ｂ及びストレージノード４ｃを含む。冗長グループ１４１ｂは、ストレージノード４ｄ、ストレージノード４ｅ及びストレージノード４ｆを含む。冗長グループ１４１は、ストレージ制御機能２５によりデータが冗長化される範囲である。

【0080】

図１７は、ストレージクラスタ３と冗長グループ１４１とストレージノード４とゾーン１５１との関係の一例を示す。

【0081】

物理的にそれぞれが独立した複数のゾーン１５１（例えば、ゾーン１５１ａ～１５１ｃ）がある。具体的には、例えば、各ゾーン１５１は、サーバ、ネットワーク、電源などが他のいずれのゾーン１５１からも独立しており、他のゾーン１５１において障害が発生した場合においてもストレージノード４は処理を継続できる。同一冗長グループ１４１内の複数のストレージノード４は異なる複数のゾーン１５１に配置される。例えば、冗長グループ１４１ａを構成するストレージノード４ａ～４ｃは、ゾーン１５１ａ～１５１ｃにそれぞれ属する。ゾーン１５１は、例えば、サーバラックでよい。

【0082】

データ保護種別が「Ｍｉｒｒｏｒ」の場合は、データが２台のストレージノード４に保存される。そして、各ゾーン１５１には、同一の冗長グループ１４１における２台以上のストレージノード４は無く、異なる複数の冗長グループ１４１の複数のストレージノード４が属する。このため、あるゾーン１５１において障害が発生し、そのゾーン１５１に属する２台以上のストレージノード４が停止しても、停止したストレージノード４と異なるゾーン１５１のストレージノード４にデータが冗長化されているため、データへのアクセスを継続することができる。

【0083】

以下、本実施例で行われる処理の例を説明する。

【0084】

図１２は、スケーリング選択処理の流れの一例を示す。

【0085】

スケーリング選択処理では、スケーリング管理機能４１が、スケーリング方法を選択し、選択したスケーリング方法を提案する。スケーリング管理機能４１は、１週間に１度などの頻度で定期的にスケーリング選択処理を実行してよい。

【0086】

ステップ２０１において、スケーリング管理機能４１は、各ストレージノード４から、ストレージ構成情報２６、ストレージノード性能情報２７、及びボリューム性能情報２８を取得する。

【0087】

ステップ２０２において、スケーリング管理機能４１は、ストレージノード性能情報２７とノードサイズ情報４４を用いてコンポーネント使用率（各種の使用率）を計算し、そのコンポーネント使用率をコンポーネント使用率情報４２に記録する。具体的には、例えば、以下の式を用いて各種の使用率が計算される。
・ネットワーク使用率９５＝ネットワークスループット７４÷ネットワークスループット５１４
・ドライブＩＯＰＳ使用率９６＝ドライブＩＯＰＳ７５÷ドライブＩＯＰＳ５１５
・ドライブスループット使用率９７＝ドライブスループット７６÷ドライブスループット５１６

【0088】

仮想ＣＰＵ２２についてはストレージノード４から使用率を取得できるため、スケーリング管理機能４１は、取得されたＣＰＵ使用率７３をＣＰＵ使用率９４としてコンポーネント使用率情報４２に記録する。

【0089】

ステップ２０３において、スケーリング管理機能４１は、コンポーネント使用率情報４２の各コンポーネントの時系列の使用率に基づき、将来のコンポーネントの時系列の使用率を予測し、その結果をコンポーネント使用率情報４２に記録する。なお、過去の時系列情報に基づき将来の時系列情報を予測する方法として、回帰分析やＡＲＩＭＡ（ＡｕｔｏｒｅｇｒｅｓｓｉｖｅＩｎｔｅｇｒａｔｅｄＭｏｖｉｎｇＡｖｅｒａｇｅ）モデルを用いる方法などが挙げられる。

【0090】

ステップ２０４において、スケーリング管理機能４１は、ステップ２０３において予測した将来のコンポーネント使用率が、閾値を超過しているか否かを判定する（例えば、コンポーネント使用率におけるいずれかの種類の使用率が、適正閾値１２２又は閾値１０１～１０３のうちのその使用率種類に対応の閾値を超過しているか否かを判定する）。例えば、この判定は、コンポーネント使用率が将来の一定期間内に（例えば現在から３か月以内に）閾値を超えるか否かの判定である。この判定の結果が真の場合は、処理がステップ２０５に進む。そうでない場合は、処理が終了する。

【0091】

ステップ２０５において、スケーリング管理機能４１は、ボリューム性能情報２８の各仮想ボリューム２３の時系列のリードＩＯＰＳ８５、ライトＩＯＰＳ８６、リードスループット８７及びライトスループット８８に基づき、将来の各仮想ボリューム２３の時系列のリードＩＯＰＳ８５、ライトＩＯＰＳ８６、リードスループット８７及びライトスループット８８をそれぞれ予測し、その結果をボリューム性能情報２８に記録する。

【0092】

ステップ２０６において、スケーリング管理機能４１は、ステップ２０５において予測した結果に基づき、ステップ２０４において閾値を超過すると判定されたコンポーネントの使用率を計算する。例えば、スケーリング管理機能４１は、ＣＰＵ使用率を以下の式により計算する。なお、処理並列度、リードＩＯＰＳ処理時間、ライトＩＯＰＳ処理時間、リード転送時間、ライト転送時間はあらかじめ定められた値である。
・ＣＰＵ使用率９４＝（リードＩＯＰＳ８５＋ライトＩＯＰＳ８６）÷最大アクセス数
・最大アクセス数＝処理並列度÷（アクセス処理時間＋データ転送時間）
・アクセス処理時間＝（リードＩＯＰＳ処理時間×リードＩＯＰＳ８５＋ライトＩＯＰＳ処理時間×ライトＩＯＰＳ８６）÷（リードＩＯＰＳ８５＋ライトＩＯＰＳ８６）
・データ転送時間＝リード転送時間×リードスループット８７÷リードＩＯＰＳ８５＋ライト転送時間×ライトスループット８８÷ライトＩＯＰＳ８６

【0093】

例えば、スケーリング管理機能４１は、ネットワーク使用率を以下の式により計算する。
・ネットワーク使用率９５＝リードスループット８７×リードスループット増幅係数１３４＋ライトスループット８８×ライトスループット増幅係数１３５

【0094】

例えば、スケーリング管理機能４１は、ドライブＩＯＰＳ使用率を以下の式により計算する。
・ドライブＩＯＰＳ使用率９６＝（リードＩＯＰＳ８５×リードＩＯＰＳ増幅係数１３２＋ライトＩＯＰＳ８６×ライトＩＯＰＳ増幅係数１３３）÷ドライブ使用率閾値１０３

【0095】

例えば、スケーリング管理機能４１は、ドライブスループット使用率を以下の式により計算する。
・ドライブスループット使用率９７＝（リードスループット８７×リードスループット増幅係数１３４＋ライトスループット８８×ライトスループット増幅係数１３５）÷ドライブ使用率閾値１０３

【0096】

ステップ２０７において、スケーリング管理機能４１は、ステップ２０６において計算したコンポーネント使用率が、閾値を超過しているか否かを判定する（例えば、コンポーネント使用率におけるいずれかの種類の使用率が、適正閾値１２２又は閾値１０１～１０３のうちのその使用率種類に対応の閾値を超過しているか否かを判定する）。この判定の結果が真の場合は、処理がステップ２０８に進む。そうでない場合は、処理がステップ２０９に進む。

【0097】

ステップ２０８において、スケーリング管理機能４１は、コンポーネント使用率が閾値（適正閾値１２２又は閾値１０１～１０３）を超過しないように、変更するノードサイズを決定する。具体的には、例えば、スケーリング管理機能４１は、ノードサイズ情報４４の中から、ステップ２０４において閾値を超過すると判定されたコンポーネントの数値が大きいノードサイズを選択し、ステップ２０６の通りコンポーネント使用率を計算し、そのコンポーネント使用率が閾値を超過するか確認する。スケーリング管理機能４１は、閾値を超過しなかったノードサイズの中のいずれのノードサイズ（例えば、価格５１７が最小となるノードサイズ又は最も大きいノードサイズ）を選択する。

【0098】

ステップ２０９において、スケーリング管理機能４１は、データ保護種別に基づき追加するノード数を決定する。例えば、以下の式に基づき追加ノード数を求める。例えば、データ保護種別が「Ｍｉｒｒｏｒ」の場合は、追加ノード数は「３」でよい。
・適正ノード数＝（現在のストレージノード数）×（ステップ２０４において閾値を超過したコンポーネントの閾値）÷（ステップ２０４において閾値を超過したコンポーネントの使用率）
・追加ノード数＝（適正ノード数以上となる最小の整数）－（現在のストレージノード数）

【0099】

ステップ２１０において、スケーリング管理機能４１は、スケールアップを提案する（例えば、後述する図１５のスケールアップ提案画面３６１を管理端末８に表示する）。

【0100】

ステップ２１１において、スケーリング管理機能４１は、スケールアウトを提案する（例えば、後述する図１６のスケールアウト提案画面３７１を管理端末８に表示する）。

【0101】

図１３は、スケールアップ処理の流れの一例を示す。

【0102】

スケールアップ処理では、ストレージノード４のスケールアップが実施される。

【0103】

ステップ２２１において、スケーリング管理機能４１は、ステップ２０４において閾値を超過したコンポーネントを持つストレージノード４が属するストレージクラスタ３内の全てのストレージノード４を、ステップ２０８において決定したノードサイズにスケールアップすることを垂直スケーリング機能３１に指示する。なお、スケールアップ対象として、スケーリング管理機能４１は、ストレージクラスタ３の代わりに、閾値を超過したコンポーネントを持つストレージノード４が属する冗長グループ１４１を指定してもよいし、閾値を超過したコンポーネントを持つストレージノード４とそのペアとなるスタンバイストレージノード４とを指定してもよいし、閾値を超過したコンポーネントを持つストレージノード４のみを指定してもよい。冗長グループ単位の垂直スケーリングについては後述する。

【0104】

ステップ２２２において、垂直スケーリング機能３１は、スケールアップするストレージノード４を１台選択する。

【0105】

ステップ２２３において、垂直スケーリング機能３１は、ステップ２２２において選択したストレージノード４のストレージ制御機能２５を停止し、ストレージノード４を停止する。

【0106】

ステップ２２４において、垂直スケーリング機能３１は、ステップ２２３において停止したストレージノード４を、ステップ２２１において指示されたノードサイズに変更することをＡＰＩエンドポイント６に指示する。ＡＰＩエンドポイント６は、その指示を受けて、指示されたストレージノード４を、指示されたノードサイズに変更する。

【0107】

ステップ２２５において、垂直スケーリング機能３１は、ステップ２２３において停止したストレージノード４を起動することをＡＰＩエンドポイント６に指示する。ＡＰＩエンドポイント６は、その指示を受けて、指示されたストレージノード４を起動する。垂直スケーリング機能３１は、起動したストレージノード４がストレージ制御機能２５を起動させ、ストレージノード４が停止中に書き出せなかったデータの他のストレージノード４からのコピーが完了するまで待機する。

【0108】

ステップ２３１において、垂直スケーリング機能３１は、指示された全てのストレージノードをスケールアップできたか否かを判定する。この判定の結果が真の場合は処理が終了する。そうでない場合は、処理がステップ２２２に戻る。

【0109】

図１４は、スケールアウト処理の流れの一例を示す。

【0110】

スケールアウト処理では、ストレージクラスタ３のスケールアウトが実施される。

【0111】

ステップ２４１において、スケーリング管理機能４１は、ステップ２０４において閾値を超過したコンポーネントのストレージノード４が属するストレージクラスタ３に、標準ノードサイズ１０６において定められたノードサイズであり、ステップ２０９において決定した台数のノードを追加することを水平スケーリング機能３２に指示する。

【0112】

ステップ２４２において、水平スケーリング機能３２は、ステップ２４１において指示されたノードサイズのストレージノードをステップ２４１において指示された台数分作成することをＡＰＩエンドポイント６に指示する。ＡＰＩエンドポイント６は、この指示に基づきストレージノード４を作成する。

【0113】

ステップ２４３において、水平スケーリング機能３２は、ステップ２４２において作成されたストレージノード４をストレージクラスタ３に追加する。具体的には、水平スケーリング機能３２は、ストレージ構成情報２６に、ステップ２４２において作成されたストレージノード４の情報を追記する。追加されたストレージノード４が属する冗長グループ１４１は、既存の冗長グループとは異なり新たに作成される。

【0114】

図１５は、スケールアップ提案画面３６１の一例を示す。

【0115】

スケールアップ提案画面３６１は、ステップ２１０において、スケーリング管理機能４１により作成される。スケールアップ提案画面３６１は、スケーリング要否判定３６２、既存ボリュームの推移予測３６３、スケーリング方法の判定根拠３６４、提案内容３６５を含む。スケールアップ提案画面３６１は、管理端末８に表示される。

【0116】

スケーリング要否判定３６２は、スケーリング要否の根拠を示すグラフ、例えば、ステップ２０３において予測した将来のコンポーネントの時系列の使用率を表すグラフを含む。

【0117】

既存ボリュームの推移予測３６３は、各既存ボリュームの将来のＩＯＰＳやスループットを示すグラフ、例えば、ステップ２０５において予測した将来のボリュームの時系列のリードＩＯＰＳ、ライトＩＯＰＳ、リードスループット及び／又はライトスループットを表すグラフを含む。

【0118】

スケーリング方法の判定根拠３６４は、スケーリング方法の判定根拠を示すグラフであり、例えば、ステップ２０６において計算した将来のコンポーネント使用率を表すグラフを含む。

【0119】

提案内容３６５は、スケールアップ後のノードサイズを示し、ステップ２０８において決定したノードサイズを示す。

【0120】

ユーザが「スケールアップする」ボタンを押せば（例えば、クリック又はタップすれば）、提案が承認されたことになり、提案通りのスケールアップが実施される（そのスケールアップの実施のための指示が、スケーリング管理機能４１から垂直スケーリング機能３１に送信される）。

【0121】

図１６は、スケールアウト提案画面３７１の一例を示す。

【0122】

スケールアウト提案画面３７１は、ステップ２１１において、スケーリング管理機能４１により作成される。スケールアウト提案画面３７１は、スケーリング要否判定３７２、既存ボリュームの推移予測３７３、スケーリング方法の判定根拠３７４、提案内容３７５を含む。スケールアウト提案画面３７１は、管理端末８に表示される。

【0123】

スケーリング要否判定３７２は、スケーリング要否判定３６２と同じである。既存ボリュームの推移予測３７３は、既存ボリュームの推移予測３６３と同じである。スケーリング方法の判定根拠３７４は、スケーリング方法の判定根拠３６４と同じである。

【0124】

提案内容３７５は、スケールアウト後のノード数を示し、ステップ２０９において決定したノード数を示す。

【0125】

ユーザが「スケールアウトする」ボタンを押せば（例えば、クリック又はタップすれば）、提案が承認されたことになり、提案通りのスケールアウトが実施される（そのスケールアウトの実施のための指示が、スケーリング管理機能４１から水平スケーリング機能３２に送信される）。

【実施例0126】

実施例２を説明する。その際、実施例１との相違点を主に説明し、実施例１との共通点については説明を省略又は簡略する（実施例３についても同様）。

【0127】

実施例２では、スケーリング管理機能４１は、将来のコンポーネントの稼働率を予測せずにスケーリング方法を選択する。具体的には、ステップ２０６において、スケーリング管理機能４１は、現在から過去一定期間までの期間としての分析期間（例えば過去１か月間）を定義し、その分析期間に追加された仮想ボリューム２３を除いてその分析期間でのコンポーネント使用率を計算する。このコンポーネント使用率は、分析期間の開始から終了までに存在していた各仮想ボリューム２３の性能情報を基に計算される。計算の結果、コンポーネント使用率が閾値を超過する場合は、スケーリング管理機能４１はスケールアップを選択する。そうでない場合は、スケーリング管理機能４１はスケールアウトを選択する。

【実施例0128】

実施例３では、スケーリング管理機能４１は、仮想ボリューム２３の個数の推移に基づきスケーリング方法を選択する。スケーリング管理機能４１は、過去にスケールアップもしくはスケールアウトしてから作成したボリューム数を仮想メモリ１１４に記録しておく。ステップ２０７において、スケーリング管理機能４１は、その数があらかじめ定められた閾値を超過したか否かを判定する。この判定の結果が真の場合は、スケーリング管理機能４１は、スケールアウトを選択する。そうでない場合は、スケーリング管理機能４１は、スケールアップを選択する。

【0129】

以上、幾つかの実施例を説明したが、これらは本発明の説明のための例示であって、本発明の範囲をこれらの実施例にのみ限定する趣旨ではない。例えば、いずれかのストレージノード４がコントローラノード５及び／又はスケーリング管理ノード７を兼ねてもよい。また、例えば、スケールダウン処理の図示はされていないが、スケールダウン処理は、スケールアップ処理の流れと実質的に同じ流れで行われてよい（違いは、ストレージノード４に割り当てられるリソースの増加ではなくリソースの削減であること）。また、例えば、スケールイン処理の図示もされていないが、スケールイン処理は、スケールアウト処理の流れと実質的に同じ流れで行われてよい（違いは、ストレージノードの作成は不要で、ストレージノードが削減されること）。

【0130】

以上の説明を、例えば、下記のように総括することができる。下記の総括は、上述の説明の補足説明や、変形例の説明を含んでよい。

【0131】

それぞれコンピュート（例えばコンピュートノード２）に提供されるボリューム（例えば仮想ボリューム２３）とそのボリュームの性能に影響し得るコンポーネントと有する一つ又は複数のストレージノード（例えばストレージノード４）を含み選択されたスケーリング方法が実施されるストレージシステム（例えばストレージクラスタ３）のスケーリング管理装置（例えばスケーリング管理ノード７）が構築される。「選択されたスケーリング方法が実施される」とは、スケーリング管理装置により選択されたスケーリング方法（又は、スケーリング管理装置により選択されユーザに提案されその提案が承認されたスケーリング方法）が、自動で（例えば、スケーリング管理装置、コントローラノード５又はその他の装置により）実施されることであってもよいし手動で実施されることであってもよい。

【0132】

スケーリング管理装置が、記憶装置（例えば仮想メモリ１４４）とプロセッサ（例えば仮想ＣＰＵ１１２）とを備える。

【0133】

記憶装置が、コンポーネント負荷情報（例えばコンポーネント使用率情報４２）と、ボリューム負荷情報（例えば、取得されたボリューム性能情報２８）とを記憶する。コンポーネント負荷情報は、一つ又は複数のストレージノードの各々について当該ストレージノードが有するコンポーネントの負荷（例えば使用率）を表す情報である。ボリューム負荷情報は、一つ又は複数のストレージノードの各々について当該ストレージノードが有するボリュームの負荷（例えば性能）を表す情報である。

【0134】

プロセッサが、コンポーネント負荷情報及びボリューム負荷情報を参照する。プロセッサは、いずれかのストレージノードにおける既存のボリュームの負荷が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又は増減すると判定した場合には、ストレージシステムのスケーリング方法として垂直スケーリング（ストレージシステムのストレージノードを増減せずそのコンポーネントを有するストレージノードに割り当てられるリソースを増減すること）を選択する、及び／又は、いずれかのストレージノードのボリュームの数が増減した又はすることによりそのストレージノードにおけるコンポーネントの負荷が増減した又は増減すると判定した場合には、ストレージシステムのスケーリング方法として水平スケーリング（ストレージシステムのストレージノードを増減すること）を選択する。

【0135】

これにより、コンピュート設定変更の不要とノード障害時やノード過負荷時の影響範囲の局所化との少なくとも一つを適切に実現することができる。なお、例えば、スケールアウトの際のコンピュート設定変更は、ノード増減に伴い追加又は再配置されたボリュームについて、そのボリュームのＩＤ及び又はそのボリュームが属するポートのＩＤをコンピュートに設定することを含んでよい。

【0136】

プロセッサが、いずれかのストレージノードにおけるコンポーネントの負荷が所定の閾値を超えるか否かを判定してよい（例えばステップ２０４）。その判定の結果が真の場合（例えば、予測される将来の負荷が閾値を超えるコンポーネントがある場合（例えばステップ２０４がＹｅｓの場合））、そのストレージノードのボリューム毎の負荷を予測してよい。そのストレージノードの各ボリュームの予測される負荷が増加傾向にある場合（例えば、各ボリュームの予測される将来の負荷に基づきいずれかのコンポーネントの負荷（将来の予測される負荷）が閾値を超える場合（例えばステップ２０７がＹｅｓの場合））、プロセッサは、垂直スケーリングとしてスケールアップを選択してよい。これにより、コンピュート設定変更の不要を適切に実現することができる。また、負荷が閾値を超えるコンポーネントを持つストレージノードの各ボリュームの予測される負荷が増加傾向にない場合（例えば、各ボリュームの予測される将来の負荷に基づきいずれのコンポーネントの負荷（将来の予測される負荷）も閾値以下の場合（例えばステップ２０７がＮｏの場合））、プロセッサは、水平スケーリングとしてスケールアウトを選択してよい。これにより、ノード障害時やノード過負荷時の影響範囲の局所化を適切に実現することができる。

【0137】

なお、プロセッサは、いずれかのストレージノードにおけるコンポーネントの負荷（例えば予測される将来の負荷）が所定の閾値より低い別の閾値未満となるか否かを判定してよい。この判定の結果が真の場合、プロセッサは、そのコンポーネントを持つストレージノードのボリューム毎の負荷を予測してよい。そのストレージノードの各ボリュームの予測される負荷が減少傾向にある場合（例えば、各ボリュームの予測される将来の負荷に基づきいずれかのコンポーネントの負荷（将来の予測される負荷）が別の閾値（例えば適正閾値より低い閾値）未満となる場合）、プロセッサは、垂直スケーリングとしてスケールダウンを選択してよい。一方、そのストレージノードの各ボリュームの予測される負荷が減少傾向にない場合（例えば、各ボリュームの予測される将来の負荷に基づきいずれのコンポーネントの負荷も上記別の閾値未満にならない場合）、プロセッサは、水平スケーリングとしてスケールインを選択してよい。

【0138】

プロセッサが、一つ又は複数のストレージノードの各々について、過去の所定期間（例えば上述の分析期間）の開始から終了まで存在していたボリューム毎の負荷を基に当該ストレージノードのコンポーネントの負荷を計算してよい（例えば、ステップ２０５無しに、過去の所定期間の既存ボリュームについてステップ２０６を実施してよい）。当該計算された負荷が閾値を超えたストレージノードがある場合（つまり、ボリュームの追加とは異なる理由で負荷が閾値を超えるコンポーネントがある場合）、プロセッサは、垂直スケーリングとして当該ストレージノードのスケールアップを選択してよい。これにより、コンピュート設定変更の不要を適切に実現することができる。なお、過去の所定期間の開始から終了まで存在していたボリューム毎の負荷を基に当該ストレージノードのコンポーネントの負荷を計算しその負荷が閾値を超えているか否かを判定することは、いずれかのストレージノードにおけるコンポーネントの予測される将来の負荷が所定の閾値を超えるか否かの判定の結果が真の場合（例えばステップ２０４がＹｅｓの場合）に行われてよい。また、プロセッサは、計算された負荷が閾値を超えたストレージノードが無い場合、プロセッサは、水平スケーリングとしてスケールアウトを選択してよい。

【0139】

プロセッサが、過去の所定期間において追加されたボリュームの数が所定の閾値を超えるストレージノードがある場合には、水平スケーリングとしてスケールアウトを選択してよい。これにより、ノード障害時やノード過負荷時の影響範囲の局所化を適切に実現することができる。この段落の「過去の所定期間」は、前回のスケーリング方法選択又はスケーリング実施から現在までの期間でよい。このため、例えば、スケーリング管理機能４１は、少なくとも初回では、実施例１又は実施例２に基づくスケーリング方法選択を実施し、次回以降では、実施例３に基づくスケーリング方法選択を実施してよい。これにより、スケーリング方法選択の計算負荷を削減しつつ、ノード障害時やノード過負荷時の影響範囲の局所化を適切に実現することができる。

【0140】

既存のボリュームの負荷が増減した又はすることによりコンポーネントの負荷が増減した又は増減するストレージノードがある場合、プロセッサは、複数の冗長グループ（例えば複数の冗長グループ１４１）のうち、そのストレージノードを含む冗長グループについて垂直スケーリングを選択してよい（例えば、その冗長グループに属する各ストレージノードが垂直スケーリングの対象とされてよい）。これにより、垂直スケーリングの対象を適切に絞り込むことができ、以って、コンピュート設定変更の不要をより適切に実現することができる。

【0141】

垂直スケーリングが選択される二つ以上の冗長グループがある場合、プロセッサが、当該二つ以上の冗長グループのうち同一ゾーンに属する二つ以上のストレージノードを並行して垂直スケーリングをすることを選択してよい。例えば、ステップ２０７がＹｅｓに該当するコンポーネントを持つストレージノードとして、ストレージノード４ａ及び４ｅがあるとする（図１７参照）。この場合、スケールアップが選択される二つ以上の冗長グループは、冗長グループ１４１ａ及び１４１ｂである。スケーリング管理機能４１は、異なるゾーン１５１ａ～１５１ｃに属する２台以上のストレージノードを並行してスケールアップすることは選択しない。スケーリング管理機能４１は、同一ゾーン１５１に属する２台以上のストレージノードを並行してスケールアップすることを選択する。具体的には、例えば、ゾーン１５１ａに属するストレージノード４ａ及び４ｄが並行してスケールアップされ、次に、ゾーン１５１ｂに属するストレージノード４ｂ及び４ｅが並行してスケールアップされ、最後に、ゾーン１５１ｃに属するストレージノード４ｃ及び４ｆが並行してスケールアップされてよい。つまり、スケールアップは、ゾーン単位で行われてよく、二つ以上のゾーンについてスケールアップが並行して実施されない。なお、スケールダウンについても、同様に、同一ゾーン１５１に属する２台以上のストレージノードを並行してスケールダウンすることがされてもよい。また、このような垂直スケーリングの制御は、スケーリング管理機能４１による選択を基にされてもよいし（つまりスケーリング管理機能４１によりされてもよいし）、垂直スケーリング機能３１によりされてもよい。