IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特開2024-134595リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム
<>
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図1
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図2
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図3
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図4
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図5
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図6
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図7
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図8
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図9
  • 特開-リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024134595
(43)【公開日】2024-10-04
(54)【発明の名称】リソース管理装置、リソース管理システム、リソース管理方法、およびプログラム
(51)【国際特許分類】
   G06Q 10/20 20230101AFI20240927BHJP
   G06F 9/50 20060101ALI20240927BHJP
【FI】
G06Q10/20
G06F9/50 120Z
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023044864
(22)【出願日】2023-03-22
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100181135
【弁理士】
【氏名又は名称】橋本 隆史
(72)【発明者】
【氏名】後藤 忍
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC15
(57)【要約】
【課題】リソース(デバイス)の特性に基づいて、サービスレベルを満たすリソースの払い出しを行うことのできるリソース管理装置を提供する。
【解決手段】リソース管理装置は、動的構成可能ノード装置を制御するため、リソース属性記憶部とリソース管理部とを備える。リソース属性記憶部は、リソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性を記憶する。リソース管理部は、サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、リソース属性記憶部を参照することによってサービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように動的構成可能ノード装置を制御する。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理装置であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、
を備えるリソース管理装置。
【請求項2】
前記リソース管理部は、構築した前記ノードを解体する要求を受け付け、当該解体するノードに割り当てられていた前記リソースを解放する処理を行うとともに、当該ノードを解体するように前記動的構成可能ノード装置を制御する、
請求項1に記載のリソース管理装置。
【請求項3】
前記リソース属性記憶部は、前記リソース属性のうちの、型式に共通な属性情報を型式属性として記憶する型式属性記憶部、を含む、
請求項1に記載のリソース管理装置。
【請求項4】
前記ノード構築の要求は、前記リソースの規模を表す規模情報に関する条件を含み、
前記リソース属性記憶部は、前記規模情報を含む前記リソース属性を記憶し、
前記リソース管理部は、前記ノード構築の要求に含まれる前記規模情報に基づいて、前記リソース属性記憶部を参照することによって、前記規模情報に関する条件に合う前記リソースを、構築するノードに割り当てる、
請求項1に記載のリソース管理装置。
【請求項5】
前記サービスレベルは、構築されるノードに含まれる前記リソースの許容故障率の情報を含み、
前記リソース属性記憶部は、前記リソースの故障率または前記リソースが属する型式の故障率、を記憶し、
前記リソース管理部は、前記リソース属性記憶部を参照することによって、前記ノード構築の要求に含まれる前記許容故障率以下の故障率のリソースを、構築するノードに割り当てる、
請求項1に記載のリソース管理装置。
【請求項6】
前記リソース管理部は、前記動的構成可能ノード装置から受け取る個々の前記リソースの故障のイベントの通知に基づいて統計処理を行うことにより、前記リソース属性記憶部が記憶する前記故障率を更新する、
請求項5に記載のリソース管理装置。
【請求項7】
前記サービスレベルは、構築されるノードの最低稼働時間の情報を含み、
前記リソース属性記憶部は、個々の前記リソースごとの過去の累積の稼働時間と、前記リソースの製品としての耐久時間または前記リソースが属する型式の製品としての耐久時間と、を記憶し、
前記リソース管理部は、前記過去の累積の稼働時間と前記最低稼働時間との和が、前記耐久時間を超えないように、リソースを選択し、選択された前記リソースをノードに割り当てる、
請求項1に記載のリソース管理装置。
【請求項8】
動的構成可能ノード装置と、リソース管理装置と、を含むリソース管理システムであって、
前記動的構成可能ノード装置は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する装置であり、
前記リソース管理装置は、
前記動的構成可能ノード装置を制御するためのリソース管理装置であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、
を備えるリソース管理装置である、
リソース管理システム。
【請求項9】
複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理方法であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部に記憶し、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理過程、
を含んだリソース管理方法。
【請求項10】
リソース管理装置としてコンピューターを機能させるためのプログラムであって、
前記リソース管理装置は、
複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理装置であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、
を備える、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、リソース管理装置、リソース管理システム、リソース管理方法、およびプログラムに関する。
【背景技術】
【0002】
近年、データセンター管理の領域においてハードウェアの動的構成を可能とするインフラストラクチャーが注目を浴びている。この分野においては、DMTFのRedfish Composabilityなど、業界団体による標準化が進められている。このような特徴を有するインフラストラクチャーにおいて、複数のデバイスから構成されるノードのサービスレベルやライフサイクルを適切に管理するためには、個々のデバイスの使用実績や型式ごとの特性を元に信頼性を評価し、与えられた基準を満たす信頼性を有するデバイス(部品)同士でノードを構成することが重要である。
【0003】
CPU(中央演算処理装置)や主記憶装置や二次記憶装置などといったデバイスを、要求等に基づいて結合することで計算機のインスタンス、即ちノードを動的に構成する機能を有するハードウェア装置が存在し、また、上記のようなハードウェア装置におけるノードの構成を管理するためのシステムがある。そのシステムは、上記のようなハードウェア装置に搭載されたデバイスの集合、即ちノードを構成するためのデバイスの集合を、リソース(資源)の集合(即ち、リソースプール)として抽象化して管理する。そのシステムは、クライアントからの要求にしたがってリソースプールから必要なリソースを払い出すことによってノードを構築する。以下においては、このようなシステムをリソース管理システムと呼称する。
【0004】
一般に、クライアント側からのリソース管理システムに対する要求には、構築対象のノードの諸元の情報が含まれる。ここでノードの諸元の情報とは、即ちCPUのコア数や、主記憶装置のサイズや、二次記憶装置のサイズや、ネットワークインターフェースカードのポート数などといった、ノードを構成するリソースの種別ごとのスペックおよび数量の情報を含むものである。
【0005】
一方、クライアント側からリソース管理システムに対する要求として、付加情報を含めることのできるリソース管理システムもある。ここで付加情報とは、ノードが提供するサービスに関する要件の情報を含む。具体的には、付加情報は、ノードの品質やライフサイクルを指定するための情報であり、サービスレベルに関する情報やサービス期間に関する情報を含む。サービスレベルは、サービスの業務上の重要度の水準を表すものである。ノードの重要度に応じた信頼性を有するリソースを適切に払い出してノードを構築することが求められる。また、サービス期間は、サービスを提供する期間を事前に指定するものである。
【0006】
リソースの実体はデバイス、即ちハードウェアである。ハードウェアであるデバイスの故障率は、使用実績によって変動するという特性がある。例えば、長期間使用されたデバイスは老朽化により故障しやすい(故障率が相対的に高い)という傾向がある。また、初めて利用されるデバイスにおいては初期不良が起きやすく、その分故障率が高まるという傾向がある。さらに、デバイスを製造するメーカーやデバイスの型式(型番)によっても故障率が異なるという特性もある。
【0007】
特許文献1の段落0013には、「システム配置決定システムは、システム配置決定装置10を備える。さらに、システム配置決定装置10は、SLA解析手段1と、構成決定手段2と、パターンDB記憶手段3と、台数決定手段4とを備える。」という記載がある。また、特許文献1の段落0021-0022には、「パターンDB記憶手段3は、構築対象システムへの採用候補となる各サーバに関する情報をデータベースとして記憶する記憶装置である。」という記載や、「採用候補となる個々のサーバ毎に、「サーバ名」、「故障率」、・・・を記憶する。」という記載がある。また、特許文献1の段落0030-0031には、「構成決定手段2は、故障率が、SLAから導出された故障率未満となっているサーバであって、構築対象システム以外のシステムで未だ使用されていないサーバのリストを作成する。」という記載や、「台数決定手段4は、・・・SLA11で規定された要求処理量を満たす台数を計算し」という記載がある。
【0008】
特許文献2の段落0060には、「通常、コンポーザブルインフラストラクチャのサーバーの1つは、アドミニストレーターとして動作するように構成(プログラム)される。一般的な実施形態では、アドミニストレーターは、ストレージグループメンバーシップに従ってシステムのサーバーにドライブを割り当てることや、通常は、ドライブが割り当てられているサーバーのデータ配置ポリシーを実行することを含む、管理プロセスを実行するアプリケーションを実行するようにプログラムされている。」という記載がある。
【0009】
特許文献3の段落0016には、「取得部101は、サーバ300ごとのハードウェア監視情報、稼働情報、及び、動作環境に関する情報を取得する。ハードウェア監視情報は、サーバ300内部の各部品の異常傾向を判定するためのハードウェア監視データを示す。稼働情報は、例えば初期配置からの稼働時間、または使用年数など、サーバ300の稼働状況を示す。・・・さらに、取得部101は、算出部102が算出した、各サーバ300のハードウェア、稼働情報、及び、動作環境に基づく個体故障率を取得する。」という記載がある。
【0010】
特許文献4の段落0023には、「図1は、本発明の第1の実施形態におけるリソース割り当てシステム200の構成例を示すブロック図である。リソース割り当てシステム200は、1つまたは複数の物理インフラストラクチャ27から通信サービス要求に最適量のリソースを割り当てる役割を担う。」という記載がある。また、特許文献4の段落0024には、「通信サービス要求は、サービス要求とともにユーザによって指定された全てのサービスレベルに関する約束および性能期待を満たす。」という記載がある。また、特許文献4の段落0047には、「本実施形態によれば、リソース割り当てシステム200は、サービスに対する信頼性の期待を満たすのに十分なだけの信頼性を割り当てることによって、信頼性のあるリソースの最適な利用を実現できる。」という記載がある。
【0011】
特許文献5の段落0024には、「リソースプール3は、1または複数の物理サーバであるサーバ4と、リソースプール管理サーバ5を含んで構成される。・・・リソースプール管理サーバ5は、サービス運用端末6を介してオペレータの操作を受付け、その指示によって各サーバ4に仮想マシンを具現化する。」という記載がある。また、特許文献5の段落0029には、「集計部58は、サーバ状態管理データベース57を参照して、VMイメージファイル541毎にハードウェア仕様と稼働時間の分布を集計する。これにより、リソースプール3の運用者は、ハードウェア(仕様情報)とソフトウェア(VMイメージ)の各組み合わせにおける各稼働率を把握し、それら特定の組み合わせにおける稼働率の低下も把握することができる。」という記載がある。
【先行技術文献】
【特許文献】
【0012】
【特許文献1】国際公開第2011/052149号
【特許文献2】特表2022-517890号公報
【特許文献3】特開2022-087371号公報
【特許文献4】特表2020-504552号公報
【特許文献5】特開2015-215857号公報
【発明の概要】
【発明が解決しようとする課題】
【0013】
背景となる関連技術では、リソースプールにおいて様々なリソース(デバイス)が混在して管理されるため、要求されるサービスレベルに対して適切な信頼性をもつリソースを払い出すことが難しいという課題があった。また、デバイスのメーカーによってはデバイスのサポート期間や耐久年数を定めているケースがあるが、これらのデバイスの属性を考慮せずにリソースとして払い出してしまうと、ノードのサービス期間内にサポート切れあるいは耐久年数を迎えてしまう可能性があり、サービスの信頼性の低下につながるという問題もあった。
【0014】
本発明は、上記のような事情を考慮して為されたものであり、個々のデバイスの属性や、デバイスの型式ごとの特性(メーカーが定めたサポート期間あるいは耐用年数や、当該型式(あるいはそのロット)の製品(デバイス)が実際にどの程度の時期に故障するか)を考慮して、SLA(サービスレベルアグリーメント)を満たすリソースの払い出しを行うが解決すべき課題である。
【0015】
そこでこの発明は、上述の課題を解決するリソース管理装置、リソース管理システム、リソース管理方法、およびプログラムを提供することを目的としている。
【課題を解決するための手段】
【0016】
[1]上記の課題を解決するため、本発明の一態様は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理装置であって、個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、1と、を備えるリソース管理装置である。
【0017】
[8]また、本発明の一態様は、動的構成可能ノード装置と、リソース管理装置と、を含むリソース管理システムであって、前記動的構成可能ノード装置は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する装置であり、前記リソース管理装置は、前記動的構成可能ノード装置を制御するためのリソース管理装置であって、個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、を備えるリソース管理装置である、リソース管理システムである。
【0018】
[9]また、本発明の一態様は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理方法であって、個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部に記憶し、前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理過程、を含んだリソース管理方法である。
【0019】
[10]また、本発明の一態様は、リソース管理装置としてコンピューターを機能させるためのプログラムであって、前記リソース管理装置は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理装置であって、個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、を備える、プログラムである。
【発明の効果】
【0020】
本発明によれば、個々のリソースの属性に基づいて、要求されるサービスレベルを満足するノードを構築するように、リソースの割り当てを行うことができる。
【図面の簡単な説明】
【0021】
図1】本発明の第1実施形態によるリソース管理システムの概略機能構成を示すブロック図である。
図2】同実施形態によるリソース管理サーバー装置のリソース管理部が管理する型式テーブルの概略構成を示す概略図である。
図3】同実施形態によるリソース管理サーバー装置のリソース管理部が管理するリソーステーブルの概略構成を示す概略図である。
図4】同実施形態によるリソース管理サーバー装置のリソース管理部が管理するサービスレベルテーブルの概略構成を示す概略図である。
図5】同実施形態によるリソース管理サーバー装置のリソース管理部が、クライアント装置からの要求に基づいてノードの構築を行う処理の手順を示すフローチャートである。
図6】同実施形態によるリソース管理サーバー装置のリソース管理部が、特定の種別のリソース(デバイス)のリソースIDを取得する処理の手順を示すフローチャートである。
図7】同実施形態によるリソース管理サーバー装置のリソース管理部が、クライアント装置からの要求に基づいてノードの解体を行う処理の手順を示すフローチャートである。
図8】同実施形態によるリソース管理サーバー装置のリソース管理部が、CDI装置から受け取るイベント通知に基づいて、リソース(デバイス)の故障に対応する処理の手順を示すフローチャートである。
図9】第2実施形態によるリソース管理システムの概略機能構成を示すブロック図である。
図10】第3実施形態によるリソース装置の最小構成の例を示す機能ブロック図である。
【発明を実施するための形態】
【0022】
次に、本発明の複数の実施形態について、図面を参照しながら説明する。
【0023】
実施形態は、動的構成可能ノード装置の存在を前提とする。以下において、この動的構成可能ノード装置を「CDI装置」とも呼ぶ。CDI装置は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する装置である。CDI装置において1つまたは複数のノードが同時並行的に稼働し得る。ノードは、所謂コンピューターの機能を有し、通常は、演算装置と主記憶装置とネットワークインターフェース装置とを含んで構成される。また、ノードは、多くの場合に二次記憶装置を含んで構成される。
【0024】
演算装置は、下の実施形態において説明する種別として、CPU、DSP、FPGA、およびGPU等と呼ばれるものを含む。複数の種別の演算装置が協調して動作するようにノードを構成する場合もある。主記憶装置は、種別として、DIMM、DRAM、およびNVDIMM等と呼ばれるものを含む。二次記憶装置は、種別として、SSD、およびHDD等と呼ばれるものを含む。ネットワークインターフェース装置は、種別として、NIC等と呼ばれるものを含む。ノードを構築するための要求としてリソース管理サーバー装置が受け取る情報としては、どの種別のリソースを含んでノードを構成するかという構成情報が含まれる。各種別の個々のリソースは、リソース属性記憶部が記憶する情報(リソース属性)を用いて管理され得る。また、リソースには型式IDが存在してよい。リソース属性のうち、型式内で共通の属性は、型式属性として管理される場合もある。型式の属性は、型式属性記憶部によって記憶される。
【0025】
リソースは、ノードを構成するためのデバイス(ハードウェアコンポーネント、ハードウェア構成要素、ハードウェア部品)を抽象的に呼ぶ呼び方である。未使用のリソースはリソースプールに属するリソースとして管理される。ノードを構築する際には、リソースプール内から選ばれたリソースをノードに割り当てる。ノードを解体する際には、リソースはその割り当てから解放され、リソースプールに戻される。
【0026】
リソース等を管理するためのデータを、下の実施形態では、リレーショナルモデルに基づいて表現している。リレーショナルモデルにおいて、テーブルに属する1つの行(レコードと呼んでもよい)は、実体(エンティティ)に対応する。テーブルは、通常において、エンティティを識別するためのキーと、そのエンティティの属性情報とを格納する。テーブルに対する操作として、行の挿入や、行のデータの更新や、行の削除等が可能である。こういった操作は、例えばSQL文を用いて行われ得る。SQL文の条件節において操作対象の行に関する条件を記述することが可能である。これにより条件に合う行のみを操作対象とすることできる。また、SQL文のCOUNT関数を用いることにより、所定の条件に該当する行の数をカウントすることができる。なお、SQL以外の方法でデータにアクセスするようにしてもよい。また、リレーショナルモデル以外のモデルを用いてデータを表現してもよい。
【0027】
[第1実施形態]
図1は、第1実施形態によるリソース管理システムの概略機能構成を示すブロック図である。図示するように、リソース管理システム1000は、リソース管理サーバー装置1と、CDI装置2と、クライアント装置3とを含んで構成される。リソース管理サーバー装置1とCDI装置2とクライアント装置3のそれぞれの少なくとも一部の機能は、コンピューターとプログラムとで実現することが可能である。またこれらの装置のそれぞれは、必要に応じて、記憶手段を有する。記憶手段は、例えば、プログラム上の変数や、プログラムの実行によりアロケーションされるメモリーである。また、必要に応じて、磁気ハードディスク装置やソリッドステートドライブ(SSD)といった不揮発性の記憶手段を用いるようにしてもよい。また、上に挙げた装置の少なくとも一部の機能を、プログラムではなく専用の電子回路として実現してもよい。
【0028】
リソース管理サーバー装置1は、リソース管理システムの管理を行うためのサーバーである。リソース管理サーバー装置1は、主に、CDI装置2内におけるノードを構築したり解体したりする機能を持つ。言い換えれば、リソース管理サーバー装置1は、CDI装置2を制御するための装置である。リソース管理サーバー装置1は、リソース管理部11と、構成情報データベース12と、を含んで構成される。なお、リソース管理サーバー装置1は、「リソース管理装置」とも呼ばれる。
【0029】
リソース管理部11は、例えば、コンピューターの演算装置上でリソース管理プログラムを実行させることによって実現される。リソース管理部11は本実施形態の中核の機能である。リソース管理部11は、クライアント装置3からの要求を受信する。また、リソース管理部11は、クライアント装置からの要求等に基づいてCDI装置2を制御することによって、CDI装置2内におけるノードの構築や、ノードの構成変更や、ノードの解体を実施する。また、CDI装置2内におけるリソースに障害が発生した場合には、CDI装置2から通知されるイベントを受信することによって、リソース管理部11は、そのリソースに障害(故障等)が発生したことを認識する。
【0030】
リソース管理部11は、サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、リソース属性記憶部(型式テーブル4やリソーステーブル5)を参照することによってサービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するようにCDI装置2を制御する。また、リソース管理部11は、構築したノードを解体する要求を受け付け、当該解体するノードに割り当てられていたリソースを解放する処理を行うとともに、当該ノードを解体するようにCDI装置2を制御する。
【0031】
また、リソース管理部11は、ノード構築の要求に含まれる規模情報(例えば、CPUのコア数や、主記憶装置あるいは2次記憶装置の容量や、ネットワークインターフェース数などといった情報)に基づいて、リソース属性記憶部を参照することによって、規模情報に関する条件に合うリソースを、構築するノードに割り当てる。
【0032】
また、リソース管理部11は、リソース属性記憶部(型式テーブル4やリソーステーブル5)を参照することによって、ノード構築の要求に含まれる許容故障率(このとき、要求されるサービスレベルは、構築されるノードに含まれるリソースの許容故障率の情報を含む。許容故障率は、サービスレベルテーブル6に記録されているものであってよい。)以下の故障率のリソースを、構築するノードに割り当てるようにしてもよい。また、リソース属性記憶部は、前記リソースの故障率または前記リソースが属する型式の故障率、を記憶する。
【0033】
また、リソース管理部11は、CDI装置2から受け取る個々のリソース(デバイス)の故障のイベントの通知に基づいて統計処理を行うことにより、リソース属性記憶部(例えば型式テーブル4)が記憶する故障率を更新するものであってよい。リソース管理部11が故障の統計処理を行って型式テーブルを更新する処理の手順については、後で図8を参照しながら説明する。
【0034】
また、リソース管理部11は、リソースの過去の累積の稼働時間と、要求されるノードの最低稼働時間との和が、リソースの耐久時間を超えないように、リソースを選択し、選択されたリソースをノードに割り当てるようにしてよい。このとき、構築されるノードの最低稼働時間は、サービスレベルの少なくとも一部として定義される。また、リソース属性記憶部(型式テーブル4やリソーステーブル5)は、個々のリソースごとの過去の累積の稼働時間と、リソースの製品としての耐久時間またはリソースが属する型式の製品としての耐久時間と、を記憶するようにしておく。
【0035】
構成情報データベース12は、リソース管理部11が構成情報を格納するために利用するデータベースである。構成情報データベース12には、個々のリソースの状態や、ノードへの割り当て状況、型式ごとの属性情報が格納される。具体的には、構成情報データベース12は、少なくとも、型式テーブル4と、リソーステーブル5と、サービスレベルテーブル6とを保持する。これら型式テーブル4、リソーステーブル5、およびサービスレベルテーブル6の構成およびデータ例については、後で別の図を参照しながら説明する。なお、型式テーブル4は、型式に特有の属性を格納するテーブルであり、「型式属性記憶部」とも呼ばれる。また、型式テーブル4およびリソーステーブル5とは、リソースの属性(個々のリソース(個体)に特有の属性と、型式に共通な属性とを含む)を格納するテーブルであり、「リソース属性記憶部」とも呼ばれる。つまり、リソース属性記憶部(型式テーブル4およびリソーステーブル5)は、リソース属性のうちの、型式に共通な属性情報を型式属性として記憶する型式属性記憶部(型式テーブル4)を含む。また、サービスレベルテーブル6を、サービスレベル記憶部と呼んでもよい。つまり、リソース属性記憶部は、サービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶する。サービスレベルは、個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだものである。
【0036】
CDI装置2は、計算機とデバイスとの分離および結合を特徴とするインフラストラクチャーを具現化する装置である。CDIは、「Composable Disaggregated Infrastructure」の略であり、構成可能な、分離されたデバイスリソースによるインフラストラクチャーを意味する。CDI装置2は、複数の種別のデバイスリソースを共有可能なリソースプールに集約しておき、要求に応じてそのリソースプールから必要なデバイスリソースを払い出して割り当てる機能を持つ。つまり、CDI装置2は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する。
これにより、CDI装置2は、リモートからの要求に応じて動的にノードを構築したり解体したりする。このように構築されるノードは、適用領域においてサーバーコンピューター等として機能する。CDI装置2は、リソースを動的に割り当てることによって1つまたは複数のノードを構成して稼働させることが可能な装置であり、「動的構成可能ノード装置」とも呼ばれる。
【0037】
本実施形態のCDI装置2は、CPU(Central Processing Unit、中央演算処理装置)、DIMM(Dual Inline Memory Module、ディム、基盤の両面に例えばDRAMを搭載したメモリーモジュール)、SSD(Solid State Drive、半導体ドライブ)、NIC(Network Interface Card、ネットワークインターフェースカード)などといった種別のデバイスを複数有している。図1に示す構成では、CDI装置2は、CPU201,202,203,・・・と、DIMM211,212,213,・・・と、SSD221,222,223,・・・と、NIC231,232,233,・・・とを備える。なお、CDI装置2自体は、既存の技術を用いて実現され得る。
【0038】
リソース管理サーバー装置1上のリソース管理部11は、CDI装置2上の個々のデバイスをリソースとして管理するとともに、これらのリソースの集合をリソースプールとして管理する。図1に示す状況の例では、リソースプールから払い出された複数のリソース(本例では、CPU202と、DIMM212と、SSD222と、NIC232)を結合することによってノード21が構築されている。
【0039】
クライアント装置3は、CDI装置2上で構築されるノードに関する要求を、リソース管理サーバー装置1に対して行うための端末装置である。クライアント装置3は、その利用者の操作等に基づいて、ノードの構築や、ノードの構成変更や、ノードの解体などといった事項に関する要求を、リソース管理サーバー装置1のリソース管理部11に送信することができる。また、これらの要求には、ノードのサービスレベルやサービス期間などといった付加情報が含まれる場合もある。
【0040】
図2は、リソース管理サーバー装置1のリソース管理部11が管理する型式テーブル4の概略構成を示す概略図である。この型式テーブルは、リソース(デバイス)の型式ごとの属性(特性)に関する情報を保持するテーブルである。図示するように、型式テーブルは、例えば表形式のデータとして実現され得る。ただし、この型式テーブルと等価な情報を他の形式のデータとして保持するようにしてもよい。この型式テーブルは、構成情報データベース12に格納され得る。この型式テーブルの各行は、リソース(デバイス)の形式に対応する。つまり、特定のメーカーが製造する特定の型番のデバイスの属性が、型式テーブルの1行に保持される。ただし、型番は異なっていても類似の複数の型式のデバイスの情報を、型式テーブルの1行の中に記述してもよい。また、一つの型番のデバイスをさらに複数のタイプに分けてそれぞれのタイプの情報を型式テーブルの1行の中に記述してもよい。前述の通り、型式テーブル4は、リソース属性記憶部の一部であり、且つ型式属性記憶部の全部または一部である。
【0041】
図2に示すように、型式テーブル4は、型式ID、種別、数量、耐久時間、故障率というそれぞれの列(データ項目)を有する。耐久時間および故障率は、その型式のリソースがサービスレベルを満足するか否かを決定するサービスレベル決定要因である。また、数量は、リソースの規模(CPUのコア数、記憶容量、ネットワークインターフェース数等のスペックを表す数値)を表す規模情報である。つまり、リソース属性記憶部は、規模情報を含むリソース属性を記憶する。
【0042】
型式IDは、型式をユニークに識別するためのID(識別情報)である。型式IDは、型式IDテーブルにおける主キーである。つまり、型式IDは、特定のメーカーの特定の型式に対応する情報である。型式IDの値自体は、例えばメーカー名+型番として構成される値であってもよい。また、あるいは、型式IDは、ここに示す例(CPU-1、CPU-2、・・・等)のように、リソース管理システム1000において独自に定めるIDであってもよい。図2に示すデータの例では、CPU-1、CPU-2、DIMM-1、DIMM-2、SSD-1、SSD-2、NIC-1といった型式IDを用いている。なお、型式IDを、例えば「製品ID」などと呼んでもよい。
【0043】
種別は、リソース(デバイス)の種別を表す情報である。本例では、型式データの種別として、CPU、DIMM、SSD、NICといった値を含む。ただし、ここに例示した種別以外の値を使用するようにしてもよい。本例では、種別が「CPU」(中央演算処理装置)であるリソースとして、型式ID「CPU-1」および「CPU-2」を含む。また、種別が「DIMM」(主記憶装置)であるリソースとして、型式ID「DIMM-1」および「DIMM-2」を含む。また、種別が「SSD」(二次記憶装置)であるリソースとして、型式ID「SSD-1」および「SSD-2」を含む。また、種別が「NIC」(ネットワークインターフェースカード)であるリソースとして、型式ID「NIC-1」を含む。本例において、例えば、型式ID「SSD-1」および「SSD-2」は、同一の諸元(数量、耐久時間、および故障率)を有するが、これら2つの型式は別々のものとして区別され、異なる型式IDを用いて管理される。
【0044】
数量は、そのリソース(デバイス)の製品としてのスペックを表す数値の情報である。
この数量が表す数値の意味は、デバイスの種別ごとに異なる。例えば、種別「CPU」においては、数量はコア数を表す。即ち、型式ID「CPU-1」のリソース(デバイス)のコア数は8であり、型式ID「CPU-2」のリソース(デバイス)のコア数は16であり、また、種別「DIMM」や種別「SDD」においては、数量はデータ容量(単位は例えばギガバイト(GB))を表す。即ち、形式ID「DIMM-1」のリソース(デバイス)のデータ容量は64ギガバイトである。また、形式ID「DIMM-2」のリソース(デバイス)のデータ容量は128ギガバイトである。また、形式ID「SSD-1」および「SSD-2」のそれぞれのデータ容量は8192ギガバイトである。また、種別「NIC」においては、数量はネットワークインターフェース数を表す。即ち、形式ID「NIC-1」においては、ネットワークインターフェース数が2である。
【0045】
耐久時間は、そのリソース(デバイス)に関して型式IDごとにメーカーが定める耐久時間を表す数値である。図示する例では、数値の単位は時間(hours)である。例えば、形式ID「CPU-1」のリソース(デバイス)に関して、耐久時間は43800時間(約5年)である。
【0046】
故障率は、そのリソース(デバイス)の故障率を表す数値である。故障率は、例えば、ある型式IDのリソース(デバイス)のうちの故障状態にあるリソース(デバイス)の個体の数を、その型式IDのリソース(デバイス)の全体の個体の数で除した値として算出され得る。つまり、故障率は、統計処理によって算出され得る。図示するデータ例では、形式ID「SSD-2」のリソース(デバイス)に関して故障率は0.5であり、その他のリソース(デバイス)に関して故障率は0.0である。
【0047】
なお、変形例として、上記の定義による故障率の他にも、故障の発生の頻度等に関する別の定義による数値を用いて故障の発生度合いを管理するようにしてもよい。例えば、1年あたりの平均故障回数を故障率して管理に用いてもよい。また、他の値(例えば、MTBF(mean time between failures)等)で故障を管理するようにしてもよい。
【0048】
図3は、リソース管理サーバー装置1のリソース管理部11が管理するリソーステーブル5の概略構成を示す概略図である。このリソーステーブルは、リソース(デバイス)ごとの属性に関する情報を保持するテーブルである。図示するように、リソーステーブルは、例えば表形式のデータとして実現され得る。ただし、このリソーステーブルと等価な情報を他の形式のデータとして保持するようにしてもよい。このリソーステーブルは、構成情報データベース12に格納され得る。このリソーステーブルの各行は、リリース管理サーバー装置1が管理対象とするリソース(デバイス)のそれぞれに対応する。
【0049】
図3に示すように、リソーステーブル5は、リソースID、型式ID、ノードID、状態、開始時刻、稼働時間というそれぞれの列(データ項目)を有する。状態、開始時刻、および稼働時間は、そのリソースがサービスレベルを満足するか否かを決定するサービスレベル決定要因である。
【0050】
リソースIDは、それぞれのリソース(デバイス)をユニークに識別するID(識別情報)である。図示する例では、それぞれのリソース(デバイス)には、整数値によるリソースIDが付与されている。ただし、整数値以外をリソースIDとして用いてもよい。
【0051】
型式IDは、図2において説明したものである。つまり、型式IDは、その行のリソース(デバイス)の型式を特定する情報である。図3のリソーステーブル5における型式IDは、図2の型式テーブル4における型式IDと関連付けられる。図示する例では、リソースIDが「1」であるリソース(デバイス)の型式IDは「CPU-1」である。また、リソースIDが「2」であるリソース(デバイス)の型式IDは「CPU-2」である。以下同様であり、ここでは説明を省略する。
【0052】
ノードIDは、その行のリソース(デバイス)が割り当てられている先のノードをユニークに識別するためのID(識別情報)である。図示する例では、ノードIDとしては、整数値(「1」等)が用いられている。ただし、整数値以外をノードIDとして用いてもよい。なお、その行のリソース(デバイス)がノードに割り当てられていない状態である場合には、当該行のノードIDの値は未割当であることを表す特別な値(本例におけるNULL等)である。図示する例では、リソースIDが「1」と「3」と「5」と「9」であるそれぞれのリソース(デバイス)は、ノードIDが「1」であるノードに割り当てられている。また、リソースIDが「2」と「4」と「6」と「7」と「8」と「10」であるそれぞれのリソース(デバイス)のノードIDはNULL(ノードに割り当てられていない空きリソース)である。
【0053】
状態は、その行のリソース(デバイス)が正常であるか故障であるかの状態を表すデータである。正常状態である場合、そのリソース(デバイス)は正常に稼働する。故障状態である場合、そのリソース(デバイス)には何らかの故障が発生しており正常に稼働しない。リソース(デバイス)をノードに割り当てようとする際に、この状態を参照することにより、故障状態のリソース(デバイス)をノードに割り当ててしまうといった事態を回避することができる。つまり、故障状態のリソース(デバイス)をノードに割り当てないようにすることができる。
【0054】
開始時刻は、その行のリソース(デバイス)が最後にノードに割り当てられた時刻(日時)を表すデータである。開始時刻は、例えば、「YYYY/MM/DD hh:mm:ss」(年・月・日、時・分・秒)の形式で表わされる。なお、そのリソース(デバイス)が一度もノードに割り当てられていない状態である場合には、この開始時刻の値はNULLである。
【0055】
稼働時間は、その行のリソース(デバイス)がそれまでにおいてノードに割り当てられていた(ノードを構成する要素として稼働していた)累積の時間を表すデータである。稼働時間は、一例として、時間(hours)の単位で表現され得る。なお、リソースIDが「10」であるリソース(デバイス)は、それまでにノードに割り当てられたことがなく(開始時刻がNULL)、その累積稼働時間も「0」(hours)である。
【0056】
図4は、リソース管理サーバー装置1のリソース管理部11が管理するサービスレベルテーブル6の概略構成を示す概略図である。このサービスレベルは、サービスレベルごとのサービス要件に関する情報を保持するテーブルである。図示するように、サービスレベルテーブルは、例えば表形式のデータとして実現され得る。ただし、このサービスレベルテーブルと等価な情報を他の形式のデータとして保持するようにしてもよい。このサービスレベルテーブルは、構成情報データベース12に格納され得る。このサービスレベルテーブルの各行は、それぞれのサービスレベルに対応する。
【0057】
図4に示すように、サービスレベルテーブル6は、サービスレベル名、最低稼働時間、許容故障率というそれぞれの列(データ項目)を有する。
【0058】
サービスレベル名は、サービスレベルを表す名前(文字列)のデータである。図示する例では、「基幹サーバー」、「部門サーバー」、および「検証用サーバー」の3種類のサービスレベルの名前が定義されている。
【0059】
最低稼働時間は、その行のサービスレベルが個々のリソース(デバイス)に要求する最低稼働時間を表す数値である。最低稼働時間の単位は、時間(hours)である。このデータ項目を持つことにより、あるサービスレベルがノードに対して要求される場合に、そのサービスレベルで規定する最低稼働時間に満たない稼働実績しか有さないリソース(デバイス)を、そのノードの構築には使用しないようにすることができる。最低稼働時間に基づいてリソースを選択することにより、初期不良の発生確率が所定レベル以上のリソースをノードの構築のために割り当てないようにすることができる。
【0060】
許容故障率は、その行のサービスレベルが個々のリソース(デバイス)に要求する故障率の上限値を表す数値である。故障率の算出方法については既に説明した通りである。このデータ項目を持つことにより、あるサービスレベルがノードに対して要求される場合に、そのサービスレベルで規定する許容故障率を超えるような故障率を持つリソース(デバイス)を、そのノードの構築には使用しないようにすることができる。
【0061】
次に、フローチャート(図5図6図7図8)を参照しながら、リソース管理サーバー装置1の動作手順について説明する。
【0062】
図5は、リソース管理サーバー装置1のリソース管理部11が、クライアント装置3からの要求に基づいてノードの構築を行う処理の手順を示すフローチャートである。以下、このフローチャートに沿って説明する。
【0063】
ステップS500において、リソース管理サーバー装置1のリソース管理部11は、クライアント装置3からCDI装置2上でのノード構築の要求を受けた際に、ノードのスペック情報と、サービス期間と、サービスレベル名とを、パラメーターとして受け取る。ここでノードのスペック情報とは、CPUのコア数や、DIMMの容量(ギガバイト数)や、SSDの容量(ギガバイト数)や、NICのインターフェース数などといった情報のセットである。つまり、スペック情報は、構築しようとするノードに関して、使用するリソース(デバイス)の種別やその数的規模などを表す情報である。また、サービス期間とは、構築されたノードがサービスを提供する期間である。サービス期間のパラメーター値は、期間の長さを表す数値(例えば、日数や月数など)として与えられてもよいし、サービス期間の終了の時刻(例えば、年・月・日および時・分・秒)として与えられてもよい。サービスレベル名は、構築しようとするノードに要求されるサービスレベルを表す名前であり、例えば、「基幹サーバー」、「部門サーバー」、「検証用サーバー」などといった文字列として表わされる。但し、サービスレベル名は、ここに例示した名前に限られるものではない。サービスレベル名として指定されるのは、図4を参照しながら説明したサービスレベルテーブル6が持つサービスレベル名である。リソース管理部11が受け取る上記のパラメーターの値は、ノードを構築するために割り当てるリソース(デバイス)を選択する際の条件として用いられ得るものである。
【0064】
次にステップS501において、リソース管理部11は、ステップS500において受け取ったパラメーターとして指定されたサービスレベル名をキーとして、サービスレベルテーブル6を検索する。これにより、リソース管理部11は、指定されたサービスレベル名に対応する最低稼働時間と許容故障率との情報を取得する。なお、サービスレベルテーブルが、サービスレベルの定義に関する他の情報を持っていてもよい。
【0065】
次に、ステップS502からS505までの各ステップにおいて、リソース管理部11は、要求されているノードを構築するために使用するそれぞれの種別のリソースのリソースIDを取得する。具体的には、リソース管理部11は、ステップS502においてCPUのリソースIDを取得する。また、リソース管理部11は、ステップS503においてDIMMのリソースIDを取得する。また、リソース管理部11は、ステップS504においてSSDのリソースIDを取得する。また、リソース管理部11は、ステップS505においてNICのリソースIDを取得する。ステップS502からS505までの各ステップにおいて、リソース管理部11を実現するプログラムが、それぞれの種別のリソースのリソースIDを取得するためのサブルーチンを呼び出す形態としてもよい。なお、ステップS502からS505までの各ステップの処理の詳細については、後で図6のフローチャートを参照しながら説明する。
【0066】
ステップS502からS505までの各ステップにおいては、リソース管理部11は、要求として与えられた情報に基づき、条件に合致するリソース(デバイス)のリソースIDを取得する。ここでの条件とは、ステップS500で受け取ったパラメーター(ノードのスペック情報、サービス期間、およびサービスレベル名)によって定まる条件である。
【0067】
なお、ここでは、リソース(デバイス)の種別として、CPU、DIMM、SSD、およびNICの4種類を想定した。代わりに、リソース(デバイス)の種別の別の集合に基づいて、リソース管理部11が、それらの種別のリソースIDを取得するようにしてもよい。
【0068】
例えば、主記憶装置として用いるリソース(デバイス)として、DRAMおよびNVDIMMの2つの種別を用いるようにしてもよい。この場合、ノードを構成する主記憶装置としては、DRAMおよびNVDIMMのいずれか一方あるいは両方を用いるようにすることができる。なお、DRAMは、「Dynamic Random Access Memory」の略であり、半導体素子を利用した揮発性の記憶装置である。また、NVDIMMは、「Non-volatile DIMM」であり、不揮発性の記憶装置である。
【0069】
また、例えば、二次記憶装置として用いるリソース(デバイス)の種別として、SSDの他にHDDを用いてもよい。この場合、ノードを構成する二次記憶装置としては、SSDおよびHDDのいずれか一方あるいは両方を用いるようにすることができる。なお、HDDは、「Hard Disk Drive」の略であり、磁気記録を利用した磁気ディスク装置である。
【0070】
さらに他のリソース(デバイス)の種別として、DSPや、FPGAや、GPUなどといったリソース(デバイス)を用いてノードを構成することができるようにしてもよい。DSPは、「Digital Signal Processor」(デジタル信号処理装置)の略である。FPGAは、「Field Programmable Gate Array」(フィールド・プログラマブル・ゲート・アレイ)の略であり、現場でプログラム可能(書き換え可能)な論理ゲート配列である。GPUは、「Graphics Processing Unit」(グラフィクス処理装置)の略である。これらのDSPや、FPGAや、GPUは、演算処理を行うためのリソース(デバイス)である。
【0071】
また、ここに例示・列挙した以外の種別のリソース(デバイス)を用いてノードを構築することができるようにしてもよい。
【0072】
フローチャートに戻り、ステップS506において、リソース管理部11は、必要な全種別(CPU、DIMM、SSD、およびNICの全種別。あるいは、必要に応じてその他の種別も。)のリソースIDがステップS502からS506までの処理で取得できたか否かを判断する。必要な全種別のリソースIDを取得できた場合(S506:YES)には、次のステップS507に進む。必要な種別のうちの何らかの種別のリソースIDを取得できなかった場合(S506:NO)には、要求されているノードを構築することができないため、本フローチャート全体の処理を終了する。
【0073】
ステップS506からステップS507に進んだ場合には、ステップS507において、リソース管理部11は、ノードIDを生成する。ここで生成するノードIDは、ノードをユニークに識別するための、新たなノードのノードIDである。例えば、所定のロジックを用いて未使用のノードIDを生成するようにする。
【0074】
次にステップS508において、リソース管理部11は、新たに構築するノードのために使用するリソース(デバイス)に関して、リソーステーブル5を更新する。具体的には、リソース管理部11は、ステップS502からS505までにおいて取得したCPUとDIMMとSSDとNICのリソースID(また、さらに、必要に応じて他の種別のリソースのリソースIDも)のそれぞれについて、リソーステーブル5上のレコードの、ノードIDの列の値と、開始時刻の列の値とを、更新する。具体的には、リソース管理部11は、ノードIDとしては、ステップS507で生成したノードIDの値(即ち、新たに構築するノードのノードIDの値)を設定する。また、リソース管理部11は、開始時刻としては、現在時刻(日付および時刻)の値を設定する。つまり、本ステップにおいて更新後のデータは、これらのリソース(デバイス)が現在時刻において新たなノードとして使用され始めていることを意味する。なお、現在時刻は、リソース管理サーバー装置1が備える不図示のクロック機能を参照することによって取得され得る。
【0075】
次にステップS509において、リソース管理部11は、それらのリソース(ステップS508の処理において更新したレコードに対応するリソース(デバイス))を指定して、CDI装置2に対して、ノードの構築を実行するよう制御する。このとき、リソース管理部11は、必要に応じて、新たなノードのノードID(ステップS507において生成したノードID)をCDI装置2に渡してよい。
【0076】
CDI装置2におけるノードの構築が完了すると、ステップS510において、リソース管理部11は、新たなノードのノードID(ステップS507において生成したノードID)をクライアント装置3に戻す。
【0077】
図6は、リソース管理サーバー装置1のリソース管理部11が、特定の種別のリソース(デバイス)のリソースIDを取得する処理の手順を示すフローチャートである。図6に示す特定のリソースのリソースIDを取得する処理は、例えば、図5のステップS502からS505のそれぞれにおいて実行される処理である。なお、CPU、DIMM、SSD、あるいはNIC以外の種別のリソース(デバイス)についても、図6に示す処理は実行され得る。以下、図6のフローチャートに沿って説明する。
【0078】
まずステップS600において、リソース管理部11は、型式を種別で絞り込む。つまり、リソース管理部11は、型式テーブル4が持つデータのうち、求められている種別(一例として、「CPU」)のデータのみを抽出する。
【0079】
ステップS601において、リソース管理部11は、型式を数量で絞り込む。
つまり、リソース管理部11は、ステップS600において絞り込まれたデータのうち、数量の条件に合致する型式のデータのみを抽出する。ここでの数量の条件は、例えば図5のステップS500の処理において受け取るパラメーターによって定まる条件である。例えば、種別が「CPU」である場合に、リソース管理部11がパラメーターとして受け取るスペック情報の一部において「CPUのスペックとしてコア数が16(あるいは16以上)である」という要件が記述される。あるいは、例えば、種別が「DIMM」である場合に、リソース管理部11がパラメーターとして受け取るスペック情報の一部において「DIMMのスペックとして記憶容量が128ギガバイトである」という要件が記述される。その他の種別のリソース(デバイス)についても同様である。
【0080】
次にステップS602において、リソース管理部11は、許容故障率以下の型式を絞り込む。つまり、リソース管理部11は、ステップS601において絞り込まれた型式のデータ(図2を参照)のうち、その故障率の列の値が、基準となる許容故障率以下である形式のデータのみを抽出する。許容故障率は、パラメーターとして指定されたサービスレベル名に対応して図5のステップS501の処理において取得された値である。リソース管理部11は、本ステップにおいて絞り込まれた型式IDを持つリソースを、ノードに割り当てることとする。
【0081】
次にステップS603において、リソース管理部11は、ステップS602で絞り込まれた型式IDの集合を用いて、リソーステーブル5(図3を参照)に含まれるリソースの絞り込みを行う。つまり、リソース管理部11は、リソーステーブル5に含まれるリソース(デバイス)のデータのうち、ステップS602において絞り込まれた型式IDのいずれかを有するリソース(デバイス)のデータを抽出する。つまり、本ステップでは、リソース管理部11は、リソーステーブル5を検索して、ステップS600からS603までにおいて絞り込みに用いた条件に適合するリソース(デバイス)のデータを絞り込む。
【0082】
次にステップS604において、リソース管理部11は、ノードに未割当のリソースを絞り込む。つまり、リソース管理部11は、ステップS603において絞り込まれたリソース(デバイス)のデータのうち、リソーステーブル5におけるノードIDの列の値がノードへの未割当を表している(図3の例の場合には、NULL値)であるリソース(デバイス)のデータのみを絞り込む。つまり、本ステップの処理によって、既に他のノードに割り当てられているリソース(デバイス)のデータは除外される。
【0083】
次にステップS605において、リソース管理部11は、状態が正常であるリソース(デバイス)への絞り込みを行う。つまり、リソース管理部11は、ステップS604において絞り込まれたリソース(デバイス)のデータのうち、リソーステーブル5(図3を参照)における状態の列の値が「正常」であるリソース(デバイス)のデータのみを絞り込む。つまり、本ステップの処理によって、故障(異常)状態のリソース(デバイス)のデータは除外される。
【0084】
ステップS606において、リソース管理部11は、サービスレベルで指定された最低稼働時間以上の稼働時間で、リソース(デバイス)の絞り込みを行う。つまり、リソース管理部11は、要求として指定されたサービスレベル名に対応するリソース(デバイス)最低稼働時間を把握する。この最低稼働時間の値は、図5のステップS501の処理においてリソース管理部11によって既に取得されている。そして、リソース管理部11は、ステップS605において絞り込まれたリソース(デバイス)のデータのうち、リソーステーブル5(図3を参照)における状態の稼働時間の列の値が上記の最低稼働時間の値以上であるリソース(デバイス)のデータのみを絞り込む。つまり、本ステップの処理によって、稼働時間が最低稼働時間未満であるリソース(デバイス)のデータは除外される。言い換えれば、本ステップの処理によって、初期不良による異常が発生する可能性のあるリソース(デバイス)のデータは除外される。
【0085】
ステップS607において、リソース管理部11は、ノードのサービス期間内に耐久時間を迎えないリソース(デバイス)のデータへの絞り込みを行う。つまり、リソース管理部11は、ステップS606において絞り込まれたリソース(デバイス)のデータの各行について次の処理を行う。即ち、その行のリソース(デバイス)の形式IDの列のデータを取得する。そして、型式テーブル4(図2を参照)を検索して、その型式IDに対応する耐久時間の値を取得する。そして、取得された耐久時間の値から、リソーステーブル5の当該リソースの行が持つ稼働時間の値を減じて、その差を算出する。この差が、当該行が表すリソース(デバイス)の残りの耐久時間である。リソース管理部は、サービスレベル名に基づいて取得されたサービス期間(即ち、図5のステップS501で取得した、図4のサービスレベルテーブル6の最低稼働時間)が、上記残りの耐久時間以下であるようなリソース(デバイス)のデータのみを絞り込む。本ステップの処理によって、サービスレベルに対応して規定される最低稼働時間よりも上記残りの耐久時間のほうが小さい(短い)リソース(デバイス)のデータが除外される。
【0086】
以上、ステップS600からS607までの一連の処理によって絞り込まれた結果として残ったリソース(デバイス)のデータが、ノードに割り当てるのに適したリソース(デバイス)のデータである。絞り込みの結果として条件に合うリソースがある場合には、リソース管理部11は、そのリソースIDを特定する。即ち、ステップS608以下の処理を行う。
【0087】
ステップS608において、リソース管理部11は、絞り込まれた結果のリソースのデータが1行以上存在するか否かを判定する。絞り込まれた結果のリソースのデータが存在する場合(当該種別のリソースあり; ステップS608:YES)には、次のステップS609に進む。絞り込まれた結果のリソースのデータが存在しない場合(当該種別のリソースなし; ステップS608:NO)には、本フローチャート全体の処理を終了する。
そして、絞り込まれたリソースの個数が1以上であった場合は(S608)、絞り込み結果から任意のリソースを1つ選択し(S609)、そのリソースIDを返却する(S610)。
【0088】
ステップS609において、リソース管理部11は、ステップS607までの一連の処理によって絞り込まれた結果として存在する1行以上のデータうちの1行のデータ(1つのリソース(デバイス))を選択する。本ステップでの選択のしかたは任意である。複数行のデータから選択する場合には、例えば、要求されるスペックを満たす最小スペックのリソース(デバイス)を選ぶようにしてもよい。あるいは、例えば、複数行のデータの中からランダムに1行のデータを選ぶようにしてもよい。その他の選び方を行ってもよい。
【0089】
次にステップS610において、リソース管理部11は、ステップS609において選択した1つのリソース(デバイス)のリソースIDを呼び出し元の処理に返す。
【0090】
以上説明したように、図6に示した処理手順により、リソース管理部11は、渡された条件に合うリソース(デバイス)を絞り込み、絞り込んだ結果のうちの1つのリソース(デバイス)のリソースIDを呼び出し元の処理に返す。
【0091】
なお、図6に示した処理手順においては、ステップS600からS607までの各ステップにおいて順次絞り込みを行うことによって、最終的に所望のリソース(デバイス)に対応するデータを特定し、リソースIDを決定した。このように順次絞り込みを行う代わりに、ステップS600からS607までに含まれる条件を例えば1文のSQL文の中に記述して、そのSQLを実行することによって一気にデータの絞り込みを行うようにしてもよい。いかなる手順によってデータの絞り込みを行うかに関わらず、データを選択する条件の宣言的意味付けは同じである。
【0092】
図7は、リソース管理サーバー装置1のリソース管理部11が、クライアント装置3からの要求に基づいてノードの解体を行う処理の手順を示すフローチャートである。以下、このフローチャートに沿って説明する。
【0093】
ステップS700において、リソース管理部11は、ノードIDをパラメーターとして受け取る。このノードIDは、解体対象のノードを識別する情報として、クライアント装置3から送信されたものである。
【0094】
次にステップS701において、リソース管理部11は、ステップS700で受け取ったノードIDに基づいて、そのノードIDを有するノードに割り当てられているリソースを絞り込む。つまり、リソース管理部11は、ステップS700で受け取ったノードIDをキーとしてリソーステーブル5(図3を参照)を検索して、当該ノードIDを有するリソース(デバイス)のデータの集合を取得する。
【0095】
ステップS702において、リソース管理部11は、ステップS701における絞り込み(検索)の結果として1行以上のデータがあったか否かを判定する。1行以上のデータがあった(1個以上のリソース(デバイス)が該当した)場合(ステップS702:YES)には、次のステップS703に進む。絞り込みの結果としてデータがなかった(0件であった)場合(ステップS702:NO)には、本フローチャート全体の処理を終了する。
【0096】
ステップS703に進んだ場合には、同ステップにおいて、リソース管理部11は、CDI装置2におけるノードの解体を実行する。具体的には、リソース管理部11は、ステップS700において受け取ったノードIDを指定することによって、CDI装置2がそのノードを解体するよう制御する。あるいは、リソース管理部11が、ステップS701において絞り込まれた結果のリソースIDを指定することによってCDI装置2がそのノードを解体するように制御してもよい。いずれの場合にも、本ステップの処理により、CDI装置2におけるノードが解体される。また、そのノードに割り当てられていたリソース(デバイス)は解放され、他のノードに割り当て可能なリソース(デバイス)としてリソースプールに戻される。
【0097】
ステップS704において、リソース管理部11は、リソーステーブル5上のリソース(デバイス)ごとの稼働時間の値を更新する。具体的には、リソース管理部11は、リソーステーブル5上の、解体対象のノードに割り当てられていたリソース(デバイス)の集合の各要素に対応する行において、稼働時間の列の値に、(現在時刻-開始時刻)の演算結果を加算して更新する。ここでの開始時刻(日時)とは、前述の通り、そのリソース(デバイス)がノードに割り当てられた時刻である。本ステップで更新対象となる行は、ステップS701の処理において絞り込まれたリソースIDを有するすべての行である。
【0098】
ステップS705において、リソース管理部11は、解放されたリソース(デバイス)のノードIDをNULLに設定する。つまり、リソース管理部11は、リソーステーブル5上の、解体対象のノードに割り当てられていたリソース(デバイスの集合の各要素に対応する行において、ノードIDの列の値をNULLにリセットする。本ステップで更新対象となる行は、ステップS701の処理において絞り込まれたリソースIDを有するすべての行である。
【0099】
以上、ステップS700からS705までの処理により、指定されたノードIDを有するノードがCDI装置2上で解体され、そのノードに属していたリソース(デバイス)が解放される。また、ノードの解体に合わせて、リソーステーブル5上において必要な個所が更新される。解放されたリソース(デバイス)は、以後、別のノードを構築する際にそのノードに割り当てられ得る。
【0100】
図8は、リソース管理サーバー装置1のリソース管理部11が、CDI装置2から受け取るイベント通知に基づいて、リソース(デバイス)の故障に対応する処理の手順を示すフローチャートである。このフローチャートの処理が実行されるのは、CDI装置2からリソース管理サーバー装置1に対してイベントが通知されたときである。以下、このフローチャートに沿って説明する。
【0101】
まずステップS800において、リソース管理サーバー装置1のリソース管理部11は、CDI装置2から通知されたイベントから、リソースIDの情報を抽出する。CDI装置2からのイベントは、そのリソースIDを有するリソース(デバイス)の故障を通知するものである。CDI装置2は、特定のリソース(デバイス)の故障を検知したときに、その故障に関する情報(リソースIDを含む)をリソース管理サーバー装置1に対して通知する機能を備えている。
【0102】
ステップS801において、リソース管理部11は、当該リソース(デバイス)の状態を故障に設定する。つまり、リソース管理部11は、ステップS800において受け取ったリソースIDをキーとしてリソーステーブル5(図3を参照)を検索する。そして、リソース管理部11は、該当する行にける状態の列の値を「故障」に更新する。
【0103】
次にステップS802において、リソース管理部11は、今回故障したリソース(デバイス)と同一の型式のリソース(デバイス)の数をカウントする。具体的には、リソース管理部11は、リソーステーブル5上の、通知を受けたリソースIDの行のデータの型式IDを読み取り、特定する。この型式IDが、今回故障したリソース(デバイス)の型式である。そして、リソース管理部11は、リソーステーブル5上で、当該型式IDを持つ行の数をカウントする。
【0104】
次にステップS803において、リソース管理部11は、今回故障したリソース(デバイス)と同一の型式で且つ故障状態のリソース(デバイス)のリソース(デバイス)数をカウントする。具体的には、リソース管理部11は、リソーステーブル5上で、ステップS802において特定した型式IDを持ち、且つ状態の列の値が「故障」である行の数をカウントする。
【0105】
ステップS804において、リソース管理部11は、今回故障したリソース(デバイス)と同じ型式IDを持つリソース(デバイス)の故障率を算出する。故障率は、一例として、上のステップS802およびS803でそれぞれ求めた数値を用いて、「(当該型式IDを有し且つ故障状態のリソース(デバイス)の個体数)/(当該型式IDを有するリソース(デバイス)の個体数)」という数式によって算出される。
【0106】
ただし、リソース管理部11は、他の定義の数式によって故障に関する統計を算出するようにしてもよい。
【0107】
そして、ステップS805において、リソース管理部11は、ステップS804で算出した故障率の数値を構成情報データベースに格納する。つまり、リソース管理部11は、型式テーブル4(図2を参照)において、当該型式IDを有する行の、故障率の列の値を、ステップS804で算出した故障率の数値で更新する。
【0108】
以上のステップS800からS805までの処理はCDI装置2から故障のイベントが通知される都度実行される。これにより、リソーステーブル5上の各リソースにおける状態の列の値が適切に更新される。また、型式テーブル4上の各型式IDについての故障率の値が適切に更新される。つまり、CDI装置2からのイベントの通知を受けてテーブルを更新することにより、リソース管理部11は、常に最新の状態(リソースIDごとの状態の値、および型式IDごとの故障率の数値)に基づいて、新たに構築するノードに割り当てるリソース(デバイス)を適切に選択することができる。
【0109】
[第2実施形態]
次に、本発明の第2実施形態について説明する。なお、前実施形態において既に説明した事項については以下において説明を省略する場合がある。ここでは、本実施形態に特有の事項を中心に説明する。本実施形態の特徴は、リソース管理部11Aが、リソース(デバイス)における故障の発生の時期および頻度についての分析機能を持つことである。
【0110】
図9は、第2実施形態によるリソース管理システムの概略機能構成を示すブロック図である。図示するように、リソース管理システム1000Aは、リソース管理サーバー装置1Aと、CDI装置2と、クライアント装置3とを含んで構成される。リソース管理サーバー装置1Aは、リソース管理部11Aと、構成情報データベース12とを含んで構成される。本実施形態の特徴として、リソース管理部11Aは、分析機能部17を持つ。
【0111】
分析機能部17は、リソース(デバイス)の故障に関するデータを分析する機能を持つ。分析機能部17による分析の方法は、次の通りである。
【0112】
[故障率曲線のグラフの管理]
第1に、分析機能部17は、リソース(デバイス)の型式ごとの故障率曲線のグラフを管理する。故障率曲線のグラフは、リソース(デバイス)個体の稼働時間と、その稼働時間における型式ごとの故障率との関係の集合である。言い換えれば、故障率曲線のグラフは、リソース(デバイス)の型式ごとの、稼働時間に対する故障率の推移を表す。分析機能部17は、例えば、ある特定の型式について、その型式に属する個々のリソース(デバイス)の、所定の稼働時間経過ごと(例えば、1時間ごと、あるいは24時間ごと等)の状態が「正常」であるか「故障」であるかの情報を蓄積することによって、上記の故障率曲線のグラフのデータを生成することができる。つまり、分析機能部17は、CDI装置2から通知されるイベントの情報を蓄積して加工することによって故障率曲線のデータを生成できる。なお、分析機能部17は、その他の方法を用いて故障率曲線のグラフのデータを生成し、管理してもよい。
【0113】
第1実施形態においては、リソース管理部11は型式ごとの故障率の単一の数値を型式テーブル4に格納して管理していた。それと比べて、第2実施形態では、より豊富な情報に基づいてリソースを管理することができるようになる。
【0114】
第1実施形態においては、サービスレベルを定義するために、サービスレベルごとの最低稼働時間の数値を管理していた。一方で、第2実施形態では、稼働時間に対する故障率の推移を型式ごとに管理することができる。言い換えれば、例えば、初期不良の発生が収束する稼働時間や、老朽化に伴って故障率が上昇し始める稼働時間を、統計に基づいて型式ごとに管理できる。つまり、型式ごとの故障発生の特性は、故障率曲線のデータに反映されている。このため、サービスレベルの定義としては、最低稼働時間を指定する代わりに、許容故障率を指定すれば十分である。そして、第1実施形態においては特定の種別のリソース(デバイス)のすべての型式に対して一律の最低稼働時間を要求していたのに対して、第2実施形態では、型式ごとの初期不良の特性をリソースの払い出し基準に反映させることができるという利点もある。
【0115】
[耐久時間に関する情報の収集と分析]
本実施形態の分析機能部17は、型式ごとの耐久時間に関する情報を収集する機能を備える。具体的には、分析機能部17は、リソース(デバイス)のメーカーやその他の事業体が提供(例えば、ウェブに公開)する耐久時間に関する情報を、ウェブの巡回によって収集する。ウェブを巡回する手法自体としては、既存のクローリング技術を利用することができる。また、収集したデータを分析する機能としては、既存のビッグデータの分析技術を用いることができる。具体的には、分析機能部17は、CPU等の特定の型式のハードウェアのエラッタの情報や、リソース(デバイス)を制御するファームウェアのバグの情報を、ウェブ巡回により収取する。これらは、リソース(デバイス)の障害(故障)の要因となり得る障害要因情報である。分析機能部17は、例えば、それらの障害要因情報をウェブで検出した場合に、対象の型式の耐久時間(型式テーブル4)を短縮するように更新したり、耐久時間の値をゼロ以下の値に設定したりするなどして、リソースの払い出しを無効化するようにしてもよい。
【0116】
[第3実施形態]
次に、本発明の第3実施形態について説明する。なお、前実施形態において既に説明した事項については以下において説明を省略する場合がある。ここでは、本実施形態に特有の事項を中心に説明する。
【0117】
図10は本実施形態によるリソース装置の最小構成を示す機能ブロック図である。この最小構成は、前述の課題を解決する機能を備える。本実施形態によるリソース管理装置1Bは少なくともリソース属性記憶部120と、リソース管理部11と、の構成を備えればよい。リソース管理装置1Bは、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置(CDI装置)を制御するための装置である。リソース属性記憶部120は、個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するものである。第1実施形態における型式テーブル4およびリソーステーブル5は、本実施形態のリソース属性記憶部120に含まれる。個々のリソースの属性であるリソース属性のうちの、型式に共通な属性を型式属性として型式テーブル4に格納することができる。なお、リソース属性記憶部120は、第1実施形態において説明した構成情報データベース12の一部分である。リソース管理部11は、前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、ものである。
【0118】
第1実施形態、第2実施形態、あるいは第3実施形態のリソース管理システムを実現するために利用されるコンピューター(リソース管理サーバー装置やクライアント装置等)は、例えば、中央処理装置と、RAM(主記憶装置)と、入出力ポートと、入出力デバイス等と、バスとを含んで構成される。コンピューター自体は、既存技術を用いて実現可能である。中央処理装置は、RAM等から読み込んだプログラムに含まれる命令を実行する。中央処理装置は、各命令にしたがって、RAMにデータを書き込んだり、RAMからデータを読み出したり、算術演算や論理演算を行ったりする。RAMは、データやプログラムを記憶する。RAMに含まれる各要素は、アドレスを持ち、アドレスを用いてアクセスされ得るものである。なお、RAMは、「ランダムアクセスメモリー」の略である。入出力ポートは、中央処理装置が外部の入出力デバイス等とデータのやり取りを行うためのポートである。入出力デバイスは、入出力ポートを介して中央処理装置との間でデータをやりとりする。バスは、コンピューター内部で使用される共通の通信路である。例えば、中央処理装置は、バスを介してRAMのデータを読んだり書いたりする。また、例えば、中央処理装置は、バスを介して入出力ポートにアクセスする。
【0119】
なお、上述した実施形態におけるリソース管理部や構成情報データベースの少なくとも一部の機能をコンピューターおよびプログラムで実現することができる。その場合、この機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM、DVD-ROM、USBメモリー等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。つまり、「コンピューター読み取り可能な記録媒体」とは、非一過性の(non-transitory)コンピューター読み取り可能な記録媒体であってよい。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、一時的に、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0120】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0121】
以上説明したように、いずれかの実施形態によれば、デバイスの使用実績や型式ごとの特性を元に、サービス要件を満たす信頼性をもつデバイスを選択し、ノードを構成することが可能となる。つまり、実施形態によれば、リソースごとの使用実績、および型式ごとの耐久年数や故障率といった属性を基に、クライアント装置から要求されたサービスレベルやサービス期間に対して適切なリソースを払い出すことで、サービスの信頼性を向上させることができる。その理由は、リソースごとの稼働時間、および型式ごとの故障率や耐久時間をリソース払い出しの判断材料とすることで、適切なリソースを選定できるためである。
【0122】
上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、以下には限られない。
【0123】
(付記1)
複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理装置であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、
を備えるリソース管理装置。
【0124】
(付記2)
前記リソース管理部は、構築した前記ノードを解体する要求を受け付け、当該解体するノードに割り当てられていた前記リソースを解放する処理を行うとともに、当該ノードを解体するように前記動的構成可能ノード装置を制御する、
付記1に記載のリソース管理装置。
【0125】
(付記3)
前記リソース属性記憶部は、前記リソース属性のうちの、型式に共通な属性情報を型式属性として記憶する型式属性記憶部、を含む、
付記1または2に記載のリソース管理装置。
【0126】
(付記4)
前記ノード構築の要求は、前記リソースの規模を表す規模情報に関する条件を含み、
前記リソース属性記憶部は、前記規模情報を含む前記リソース属性を記憶し、
前記リソース管理部は、前記ノード構築の要求に含まれる前記規模情報に基づいて、前記リソース属性記憶部を参照することによって、前記規模情報に関する条件に合う前記リソースを、構築するノードに割り当てる、
付記1から3までのいずれか1つに記載のリソース管理装置。
【0127】
(付記5)
前記サービスレベルは、構築されるノードに含まれる前記リソースの許容故障率の情報を含み、
前記リソース属性記憶部は、前記リソースの故障率または前記リソースが属する型式の故障率、を記憶し、
前記リソース管理部は、前記リソース属性記憶部を参照することによって、前記ノード構築の要求に含まれる前記許容故障率以下の故障率のリソースを、構築するノードに割り当てる、
付記1から4までのいずれか1つに記載のリソース管理装置。
【0128】
(付記6)
前記リソース管理部は、前記動的構成可能ノード装置から受け取る個々の前記リソースの故障のイベントの通知に基づいて統計処理を行うことにより、前記リソース属性記憶部が記憶する前記故障率を更新する、
付記5に記載のリソース管理装置。
【0129】
(付記7)
前記サービスレベルは、構築されるノードの最低稼働時間の情報を含み、
前記リソース属性記憶部は、個々の前記リソースごとの過去の累積の稼働時間と、前記リソースの製品としての耐久時間または前記リソースが属する型式の製品としての耐久時間と、を記憶し、
前記リソース管理部は、前記過去の累積の稼働時間と前記最低稼働時間との和が、前記耐久時間を超えないように、リソースを選択し、選択された前記リソースをノードに割り当てる、
付記1から6までのいずれか1つに記載のリソース管理装置。
【0130】
(付記8)
動的構成可能ノード装置と、リソース管理装置と、を含むリソース管理システムであって、
前記動的構成可能ノード装置は、複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する装置であり、
前記リソース管理装置は、
前記動的構成可能ノード装置を制御するためのリソース管理装置であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、
を備えるリソース管理装置である、
リソース管理システム。
【0131】
(付記9)
複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理方法であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部に記憶し、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理過程、
を含んだリソース管理方法。
【0132】
(付記10)
リソース管理装置としてコンピューターを機能させるためのプログラムであって、
前記リソース管理装置は、
複数の種別のリソースを動的に組み合わせてノードを構築する機能を有する動的構成可能ノード装置を制御するためのリソース管理装置であって、
個々のリソースごとに、最低稼働時間または許容される故障に関する統計情報である許容故障情報の少なくともいずれかを含んだサービスレベルを決定する要因であるサービスレベル決定要因を含んだリソース属性、を記憶するリソース属性記憶部と、
前記サービスレベル決定要因についての条件を含んだノード構築の要求を受け付け、前記リソース属性記憶部を参照することによって前記サービスレベル決定要因の条件を満たすように複数のリソースをノードに割り当てる処理を行い、当該割り当てたリソースを用いてノードを構築するように前記動的構成可能ノード装置を制御する、リソース管理部と、
を備える、
プログラム。
【0133】
(付記11)
前記ノードを構築するための前記複数のリソースは、演算装置と主記憶装置とネットワークインターフェース装置とを少なくとも含む、
付記1に記載にリソース管理装置。
【0134】
(付記12)
前記ノードを構築するための前記複数のリソースは、二次記憶装置をさらに含む、
付記11に記載のリソース管理装置。
【産業上の利用可能性】
【0135】
本発明は、例えば、計算リソースを提供する産業(いわゆるデータセンター業やクラウドサーバー提供業)等において利用することができる。但し、本発明の利用範囲はここに例示したものには限られない。
【符号の説明】
【0136】
1,1A,1B リソース管理サーバー装置(リソース管理装置)
2 CDI装置(動的構成可能ノード装置)
3 クライアント装置
4 型式テーブル(リソース属性記憶部,型式属性記憶部)
5 リソーステーブル(リソース属性記憶部)
6 サービスレベルテーブル(サービスレベル記憶部)
11,11A リソース管理部
12 構成情報データベース
17 分析機能部
120 リソース属性記憶部
201,202,203,・・・ CPU
211,212,213,・・・ DIMM
221,222,223,・・・ SSD
231,232,233,・・・ NIC
1000,1000A リソース管理システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10