【文献】
山市 良,「システム監視の鉄則 鉄則2 [監視対象]サーバ 警告機能でパフォーマンスを監視せよ」,Windows Server World,日本,(株)IDGジャパン,2007年 2月 1日,第12巻 第2号
(58)【調査した分野】(Int.Cl.,DB名)
複数の仮想サーバにリソースを提供する複数の物理サーバと、該複数の物理サーバに接続されて複数の仮想サーバに記憶領域を提供する複数のストレージと、前記複数の物理サーバのリソースを監視するリソース監視機能部と、インシデント情報を格納するインシデント情報データベースを含むインシデント管理機能部と、管理者によって物理サーバのリソースの予測情報を参照する操作端末とに接続され、前記物理サーバのリソース量を制御する仮想サーバリソース制御システムであって、
最新及び最古日付の仮想サーバのメモリサイズ及びディスクサイズを格納する仮想サーバ構成情報データベースと、
最新及び最古日付の物理サーバメモリサイズ及びディスクサイズを格納する物理サーバ構成情報データベースと、
過去に発生した仮想サーバ毎のインシデント種別を含むインシデント情報と物理サーバのメモリ閾値及び日毎の増加率を含むメモリ予測情報と物理サーバのディスク閾値及び日毎の増加率を含むディスク予測情報と物理サーバ毎のメモリ及びディスク利用率並びに閾値を含む閾値情報と物理サーバ及びリソース毎のインシデントの種別に対するインシデント重み付け情報とから成るリソース予測情報を格納する物理サーバリソース予測情報データベースと、
物理サーバのリソースが過不足する可能性のある時期を物理サーバリソース予測情報データベースに登録する物理サーバリソース予測部とを備え、
該物理サーバリソース予測部が、
所定の日時毎に仮想サーバ構成情報テーブルから物理サーバ毎のメモリの1日あたりの増加率を求める第1工程と、
物理サーバ上の仮想サーバの過去所定期間内のメモリ超過のインシデント数を抽出する第2工程と、
該第2工程により算出したインシデント数の重みをかけたメモリ増加率を求める第3工程と、
該第3工程により求めたメモリ増加率から物理サーバのメモリ利用率の閾値を超過する日付を求める第4工程と、
該第4工程により求めた閾値超過日付をメモリ予測情報に格納する第5工程とを行ってメモリリソース状況予測処理を実行し、
所定の日時毎に仮想サーバ構成情報テーブルからストレージ毎のディスクの1日あたりの増加率を求める第6工程と、
ストレージの所定期間内のディスク超過のインシデント数を抽出する第7工程と、
該第7工程により抽出したインシデント数の重みをかけたディスク増加率を求める第8工程と、
該第8工程により算出したディスク増加率からストレージのディスク利用率の閾値を超過する日付を求める第9工程と、
該第9工程により求めた閾値超過日付をディスク予測情報に格納する第10工程とを行ってディスクリソース状況予測処理を実行する仮想サーバリソース制御システム。
複数の仮想サーバにリソースを提供する複数の物理サーバと、該複数の物理サーバに接続されて複数の仮想サーバに記憶領域を提供する複数のストレージと、前記複数の物理サーバのリソースを監視するリソース監視機能部と、インシデント情報を格納するインシデント情報データベースを含むインシデント管理機能部と、管理者によって物理サーバのリソースの予測情報を参照する操作端末とに接続され、前記物理サーバのリソース量を制御するコンピュータシステムの仮想サーバリソース制御方法であって、
最新及び最古日付の仮想サーバのメモリサイズ及びディスクサイズを格納する仮想サーバ構成情報データベースと、
最新及び最古日付の物理サーバメモリサイズ及びディスクサイズを格納する物理サーバ構成情報データベースと、
過去に発生した仮想サーバ毎のインシデント種別を含むインシデント情報と物理サーバのメモリ閾値及び日毎の増加率を含むメモリ予測情報と物理サーバのディスク閾値及び日毎の増加率を含むディスク予測情報と物理サーバ毎のメモリ及びディスク利用率並びに閾値を含む閾値情報と物理サーバ及びリソース毎のインシデントの種別に対するインシデント重み付け情報とから成るリソース予測情報を格納する物理サーバリソース予測情報データベースと、
物理サーバのリソースが過不足する可能性のある時期を物理サーバリソース予測情報データベースに登録する物理サーバリソース予測部とを設け、
該物理サーバリソース予測部に、
所定の日時毎に仮想サーバ構成情報テーブルから物理サーバ毎のメモリの1日あたりの増加率を求める第1工程と、
物理サーバ上の仮想サーバの過去所定期間内のメモリ超過のインシデント数を抽出する第2工程と、
該第2工程により算出したインシデント数の重みをかけたメモリ増加率を求める第3工程と、
該第3工程により求めたメモリ増加率から物理サーバのメモリ利用率の閾値を超過する日付を求める第4工程と、
該第4工程により求めた閾値超過日付をメモリ予測情報に格納する第5工程とを行ってメモリリソース状況予測処理を実行し、
所定の日時毎に仮想サーバ構成情報テーブルからストレージ毎のディスクの1日あたりの増加率を求める第6工程と、
ストレージの所定期間内のディスク超過のインシデント数を抽出する第7工程と、
該第7工程により抽出したインシデント数の重みをかけたディスク増加率を求める第8工程と、
該第8工程により算出したディスク増加率からストレージのディスク利用率の閾値を超過する日付を求める第9工程と、
該第9工程により求めた閾値超過日付をディスク予測情報に格納する第10工程とを行ってディスクリソース状況予測処理を実行させる仮想サーバリソース制御方法。
【背景技術】
【0002】
一般にコンピュータの仮想化技術は1台の物理サーバのリソース(CPU・メモリ・HDD他のハードウェア資源)を複数の仮想サーバに提供するものであって、コンピュータシステムの設置スペース・消費電力・ハードウェア投資コストの削減につながるため、近年データセンターのサービスでの利用が拡大しており、仮想サーバに提供するリソースの構成は構成情報と呼ばれている。
【0003】
この仮想化技術は、予め想定される仮想サーバのリソース量に応じて物理的ハードウェアを構築するものであるが、サービス利用の拡大に伴って仮想サーバの台数の増加やユーザ数の増大した場合、物理サーバのディスクやメモリなどのリソースが枯渇してしまう可能性があり、リソース不足では利用ユーザに最適なサービスを提供することが困難になり、逆に余剰リソースが多い場合は余分なコストがかさむという不具合がある。
【0004】
このため、仮想化技術においては、物理サーバに対する適切な時期且つ適切なリソースを増強するためのリソース増強計画が必要であり、このリソース増強計画に関する技術が記載された文献としては下記の特許文献が挙げられ
る。特許文献1には、データセンターのシステム構成のスナップショット及びデータセンターの稼働時のスループットを取得し、スナップショット情報とスループット情報とを関連付けて構成DBに保存する構成保存部と、データセンターにおけるスループットの予測状況に基づいて構成DBから処理可能なシステム構成を有するスナップショットを検索する構成検索部と、検索されたスナップショットのシステム構成に基づいてプログラミングインタフェースを用いてデータセンターを構築もしくはデータセンターのシステム構成を変更する構成変更部とを備え
る。特許文献2には、仮想計算機に保証するリソース量を一度に確保できないと判定する場合は、仮想計算機の起動開始までに仮想計算機に保証するリソース量を継続的に確保できるか否かを判定し、確保できると判定したとき、確保したリソースの合計量を仮想計算機に割当てて物理計算機にデプロイすることによって、物理計算機のリソースの仮想計算機に対する割当てを効率的に実行する技術が記載されている。
【発明を実施するための形態】
【0011】
以下、本発明による仮想サーバリソース制御方法を実現する仮想サーバリソース制御システムの一実施形態を図面を参照して詳細に説明する。
[構成]
本実施形態による仮想サーバリソース制御システム112は、
図1に示す如く、次の部位を備える。
(1)複数の仮想サーバ132〜134他にCPU及びメモリ等のハードウェアを提供する複数の物理サーバ130及び131他
。
(2)該物理サーバ130他に接続されて複数の仮想サーバ132〜134他に記憶領域を提供する複数のストレージ(磁気ディスク装置)135及び136
。
(3)前記複数の物理サーバ130他のリソースを監視するリソース監視機能部122
。
(4)インシデント(解決すべき案件や課題。本実施形態では閾値を越えたことの警告。)情報を格納するインシデント情報データベース121を含むインシデント管理機能部120
。
(5)管理者によって物理サーバのリソースの予測情報を参照する操作端末111とに接続され、前記仮想サーバ132他のメモリサイズ及びディスクサイズを格納する仮想サーバ構成情報データベース(DB)114
。
(6)前記物理サーバ130他のメモリサイズ及びディスクサイズを格納する物理サーバ構成情報データベース(DB)115
。
(7)物理サーバのリソースが不足する可能性のある時期を算出するためのリソース予測情報を格納する物理サーバリソース予測情報データベース(DB)116
。
(8)前記仮想サーバ132他のメモリサイズ及びディスクサイズを取得し、仮想サーバ構成情報データベース(DB)114に登録する仮想サーバ構成情報管理部117
。
(9)仮想サーバ構成情報データベース114と物理サーバ構成情報データベース115とインシデント情報データベース121とを参照し、物理サーバのリソースが不足する可能性のある時期を物理サーバリソース予測情報データベース116に登録する物理サーバリソース予測部113
。
【0012】
前記仮想サーバ構成情報データベース114は、仮想サーバ132〜134他毎の構成情報を格納するものであって、この仮想サーバ構成情報は、
図2Aの符号200に示す如く、仮想サーバの構成情報を取得した年月日と、仮想サーバの識別名と、該仮想サーバに割り当てられているメモリ容量と、該仮想サーバに割り当てられているディスク容量と、該メモリ及びディスクを割り当てている物理サーバ名と、該ディスクのストレージ名の各項目情報とから成
る。例えば、年月日「2011/5/13 0:00」に収集された仮想サーバ名「VirtualServerA」の仮想サーバに対するメモリ容量が1024MB、ディスク容量が100GB、割り当てられている物理サーバがServerA、ストレージ名がStrageAであり、年月日「2011/5/13 0:00」に収集された仮想サーバ名「VirtualServerB」の仮想サーバに対するメモリ容量が1024MB、ディスク容量が100GB、割り当てられている物理サーバがServerA、ストレージ名がStrageAであることが格納されている。
【0013】
前記物理サーバ構成情報データベース115は、物理サーバ130他毎のメモリ構成情報テーブル及びディスク構成情報テーブルを格納するものであって、このメモリ構成情報テーブルは、
図2Bの符号201に示す如く、物理サーバのメモリ容量を取得した年月日と、物理サーバの識別名と、該物理サーバに割り当てられているメモリ容量との各項目情報とから成
る。例えば、年月日「2013/1/17 0:00」に収集された(この時点の)物理サーバ名「ServerA」の物理サーバのメモリ容量が16348MBであり、年月日「2013/1/17 0:00」に収集された物理サーバ名「ServerB」の物理サーバのメモリ容量が16348MBであることが格納され
る。ディスク構成情報テーブルは、
図2Cの符号202に示す如く、物理サーバのディスク容量を取得した年月日と、物理サーバの識別名と、該物理サーバに割り当てられているディスク容量との各項目情報とから成
る。例えば、年月日「2013/1/17 0:00」に収集された物理サーバ名「ServerA」の物理サーバのディスク容量が1024GBであり、年月日「2013/1/17 0:00」に収集された物理サーバ名「ServerB」の物理サーバのディスク容量が2048MBであることが格納され、年月日「2013/1/18 0:00」に収集された物理サーバ名「ServerA」の物理サーバのディスク容量が2048GBであることが格納されている。
【0014】
前記物理サーバリソース予測情報データベース116は、仮想サーバ及び物理サーバの過去のインシデント並びにメモリ及びストレージの閾値に基づいて物理サーバのリソースが不足する可能性のある時期を算出するためのリソース予測情報を格納する
ものであ
る。このリソース予測情報は、過去に発生したインシデントの情報を格納するインシデント情報テーブル203(
図2D)と、物理サーバのメモリ超過の予測日時を予測するためのメモリ予測情報を格納するメモリ予測情報テーブル204(
図2E)と、物理サーバのディスク超過の予測日時を予測するためのディスク予測情報を格納するディスク予測情報テーブル205(
図2F)と、物理サーバ毎のメモリ及びディスク利用率並びに閾値を格納する閾値情報テーブル206(
図2G)と、物理サーバ及びリソース種別インシデントの種別に対するインシデント重み付けテーブル207(
図2H)とが格納されている。
【0015】
前記インシデント情報テーブル203は、仮想サーバの過去1か月分のメモリ超過インシデント種別を格納するものである。この
インシデント情報テーブル203は、図2Dの符号203に示す如く、インシデントが発生した年月日と、該インシデントが発生した仮想サーバの発生元識別名と、該シンシデントの種別との各項目情報を格納し、例えば、日時「2013/1/15 12:32」に発生元識別名「VirtualServerC」の仮想サーバに「メモリ閾値超過」のインシデントが発生したこと、日時「2013/1/15 23:43」に発生元識別名「VirtualServerC」の仮想サーバに「メモリ閾値超過」のインシデントが発生したこと、日時「2013/1/16 1:32」に発生元識別名「VirtualServerA」の仮想サーバに「ディスク閾値超過」のインシデントが発生したことを格納している。
【0016】
前記メモリ予測情報テーブル204は、
図2Eの符号204に示す如く、メモリ超過が予測される年月日である超過予測日時と、予測対象の物サーバ名と、メモリに対して予め設定されたインシデント(警告)を発する上限基準値であるメモリ閾値と、日毎の増加率との各項目情報とから成
る。例えば、物理サーバ「ServerA」が予測日時「2013/9/16 0:00」にメモリ閾値「13107MB」を超過し、日毎の増加率が「11.9MB」であり、物理サーバ「ServerB」が予測日時「2013/12/3 0:00」にメモリ閾値「14746MB」を超過し、月毎の増加率が「12.3MB」であることを格納している。
【0017】
前記ディスク予測情報テーブル205は、
図2Fの符号205に示す如く、ディスク超過が予測される年月日である超過予測日時と、予測対象のストレージ名と、ディスクに対して予め設定されたインシデント(警告)を発する上限基準値であるディスク閾値と、日毎の増加率との各項目情報とから成
る。例えば、ストレージ「StrageA」が予測日時「2013/10/31 0:00」にディスク閾値「924GB」を超過し、日毎の増加率が「0.97GB」であり、ストレージ「StrageB」が予測日時「2014/1/12 0:00」にディスク閾値「1638GB」を超過し、日毎の増加率が「0.83GB」であることを格納している。
【0018】
前記閾値情報テーブル206は、物理サーバ又はストレージかを表す閾値種別及び予め設定されたインシデント(警告)を発する上限基準値である閾値の項目情報を格納するものであって、
図2Gの符号206に示す如く、物理サーバ「ServerA」の閾値種別「メモリ利用率」の閾値が「80%」であり、物理サーバ「ServerB」の閾値種別「メモリ利用率」の閾値が「85%」であり、ストレージ「StrageA」の閾値種別「ディスク利用率」の閾値が「90%」であり、ストレージ「StrageB」の閾値種別「ディスク利用率」の閾値が「90%」であることを格納している。
【0019】
前記インシデント重み付けテーブル207は、
図2Hの符号207に示す如く、物理サーバ又はストレージ等の対象機器及びリソース種別に対する「重み値」並びに「重み値」の最小最大値の範囲値を格納するものであ
る。例えば、対象機器「ServerA」の種別「メモリ」の重み値が「0.8」、最小最大範囲が「0〜10」であり、対象機器「ServerB」の種別「メモリ」の重み値が「1.0」、最小最大範囲が「11〜20」であり、対象機器「ServerC」の種別「メモリ」の重み値が「0.2」、最小範囲が「21」であり、対象機器「StrageA」の種別「ディスク」の重み値が「0.8」、最小最大範囲が「0〜20」であり、対象機器「StrageB」の種別「ディスク」の重み値が「0.8」、最小範囲が「21」であることを格納している。
【0020】
[動作]
さて、このように構成された仮想サーバリソース制御システム112の動作を次に説明する。
[メモリリソース状況予測]
本実施形態による仮想サーバリソース制御システム112のメモリのリソース状況予測処理は、
図3に示す如く
、次の各ステップを実行することによって物理サーバ台数分のメモリリソースの予測を行うように動作する。
(1)日次(例えば所定時刻/日)で以降の処理を開始するステップ301
。
(2)物理サーバの台数分以降の処理を開始するステップ302
。
(3)仮想サーバ構成情報テーブル200から物理サーバ毎のメモリの1日あたりの増加率aを求めるステップ303
。例えば、今日が2013/1/20とすると、仮想サーバ構成情報テーブル200から物理サーバServerAの最新の仮想サーバのメモリサイズの合計は10240MBと分かり、最古の日付2011/5/13の仮想サーバのメモリサイズは1024MBであることから、増加率aは10240−1024÷[2013/1/20−2011/5/13]=14.9として算出する
ステップ。
(4)対象物理サーバ上の仮想サーバの過去所定期間内のメモリ超過のインシデント数を算出するステップ304(
図2Dに示したインシデント情報テーブル203の場合、メモリ超過2件を抽出する処理。)
。
(5)該ステップ203により算出したインシデント数の重みをかけたメモリ増加率a’を求めるステップ305
。例えば、インシデント数に対する重みは
図2Hのインシデント重みテーブル207から求め、物理サーバServerAのメモリに対する重みがインシデント件数が0以上10以下の場合は0.8、11以上20以下の場合は1.0、21以上の場合は1.2であることから、インシデント件数2に対する重みは0.8となり、重みづけしたメモリ増加率a’は、[14.9×0.8]=11.9と求める
ステップ。
(6)該ステップ305により求めたメモリ増加率a’から物理サーバのメモリ利用率の閾値を超過する日付を求めるステップ306
。例えば、図2Gの閾値情報テーブル206から物理サーバServerAのメモリ利用率の閾値bは80%であり、
図2Bの物理サーバ構成情報テーブル201から物理サーバServerAの最新の物理サーバのメモリサイズは16348MBであることから、超過予測日cは、[16348×80%−10240]÷11.9+2013/1/20=2013/9/16である。求めたデータはメモリ予測情報テーブル204に登録する
ステップ。
(7)以上のステップ303〜306迄のステップを物理サーバの台数分繰り返したと判定したときに終了するステップ307
。
(8)ステップ301により開始したメモリリソース状況予測処理を終了するステップ308
。
【0021】
[ディスクリソース状況予測]
次いで、本実施形態による仮想サーバリソース制御システム112は、
図4に示す如く、
次の各ステップを実行することによってストレージ台数分のディスクリソースの予測を行うように動作する。
(1)日次(例えば所定時刻/日)で以降の処理を開始するステップ401
。
(2)ストレージの台数分以降の処理を開始するステップ402
。
(3)仮想サーバ構成情報テーブル200からストレージ毎のディスクの1日あたりの増加率aを求めるステップ403
。例えば、今日が2013/1/20の場合、
図2Aの仮想サーバ構成情報テーブル200からストレージStorageAの最新の仮想サーバのディスクサイズの合計が700GBと分かり、最古の日付2011/5/13の仮想サーバのディスクサイズが100GBであることから、増加率aは700−100÷[2013/1/20−2011/5/13]=0.97として算出する
ステップ。
(4)対象物ストレージの仮想サーバの過去1か月分のディスク超過のインシデント数を算出するステップ404
。例えば、図2Dのインシデント情報テーブル203から算出すると対象は1件と抽出する
ステップ。
(5)該ステップ404により算出したインシデント数の重みをかけたディスク増加率a’を求めるステップ405
。例えば、インシデント数に対する重みを
図2Hのインシデント重みテーブル207から求め、ストレージStorageAのディスクに対する重みがインシデント件数が0以上20以下の場合は0.8、21以上の場合は1.0であることから、インシデント件数1に対する重みは0.8となり、重みづけしたメモリ増加率a’は、0.97×0.8=0.78と算出する
ステップ。
(6)該ステップ405により算出したディスク増加率a’からストレージのディスク利用率の閾値を超過する日付を求めるステップ406
。例えば、図2Hの閾値情報テーブル206からストレージStorageAのディスク利用率の閾値bは90%であり、
図2Cのストレージ構成情報テーブル202からストレージStorageAの最新のストレージのディスクサイズは1024GBであり、これにより超過予測日cは[1024×90%−700]÷0.78+2013/1/20=2013/10/31と算出する
ステップ。
(7)以上のステップ403〜406迄のステップをストレージの台数分繰り返したと判定したときに終了するステップ407
。
(8)ステップ401により開始したディスクリソース状況予測処理を終了するステップ408
。
【0022】
[レポート画面]
本実施形態による仮想サーバリソース制御システム112は、前述のメモリ及びディスクリソース予測処理の結果であるレポート画面500を操作端末111の表示部に表示するものである
。このレポート画面500は、
図5(a)に示す如く、メモリとディスクの現在の利用率を表示する現在の状況欄501と、各物理サーバ、ストレージで最早となる日付を表示する閾値超過予測日欄502と、閾値超過予測日が最早の物理サーバのメモリ利用状況がグラフ表示されるメモリ利用状況欄503と、閾値超過予測日が最早のストレージのディスク利用状況がグラフ表示されるディスク利用状況欄504とから成り、前記現在の状況欄501又は閾値超過予測日欄502の「詳細」リンクをクリックしたときに
図5(b)に示した詳細表示欄505が表示される。
【0023】
前記現在の状況欄501に表示した利用率はすべての物理サーバのメモリ、すべてのストレージのディスクで求めた割合であり、「詳細」リンクをクリックすることにより各物理サーバ、ストレージ毎の利用率を表示し、「詳細」リンクをクリックすると各物理サーバ、ストレージ毎の閾値超過予測日が表示される。
【0024】
前記詳細表示欄505は、メモリの利用状況詳細欄506とディスク利用状況詳細欄507とが表示される。前記メモリ利用状況詳細
欄506は、物理サーバ毎の現在の利用率、閾値超過予測日、メモリ閾値、増加率が表示され、現在の利用率が最大、閾値超過予測日が最早のデータは赤字で強調表示され、物理サーバ名をクリックすると、クリックした物理サーバのグラフがメモリ状況利用欄503と同じ形式で表示される。前記ディスク利用状況詳細欄507は、ストレージ毎の現在の利用率、閾値超過予測日、ディスク閾値、増加率が表示され、現在の利用率が最大、閾値超過予測日が最早のデータは赤字で強調表示され、ストレージ名をクリックすると、クリックしたストレージのグラフがディスク利用状況欄504と同じ形式で表示される。
【0025】
尚、前述の実施形態においては物理サーバのリソース不足に対応するため、物理サーバのリソース(ハードウェア)を増加させるための基準として上限の閾値を用いる例を説明したが、本発明は、これに限られるものではな
い。例えば、図2E〜
図2Gに示したメモリ予測情報テーブル204とディスク予測情報テーブル205と閾値情報テーブル206とに下限値を設定する欄を設け、この下限閾値を下回ることが多い物理サーバは仮想サーバに対する物理サーバのリソースが過剰と判定し、物理サーバのリソースが過剰な可能性のある時期を物理サーバリソース予測部113が物理サーバリソース予測情報データベースに登録し、このリソース過剰と判定した物理サーバに対して他の仮想サーバを追加することや、他のリソース不足の物理サーバと仮想サーバを入れ替えることによって、過剰物理サーバのリソース量を最適にすることができる。
【符号の説明】
【0026】
111 操作端末、112 仮想サーバリソース制御システム、
113 物理サーバリソース予測部、114 仮想サーバ構成情報データベース、
115 物理サーバ構成情報データベース、
116 物理サーバリソース予測情報データベース、
117 仮想サーバ構成情報管理部、120 インシデント管理機能部、
121 インシデント情報データベース、122 リソース監視機能部、
130 物理サーバ、132〜134 仮想サーバ、
135〜136 ストレージ、200 仮想サーバ構成情報テーブル、
201 物理サーバ構成情報テーブル、202 ストレージ構成情報テーブル、
203 インシデント情報テーブル、204 メモリ予測情報テーブル、
205 ディスク予測情報テーブル、206 閾値情報テーブル、
207 インシデント重みテーブル、500 レポート画面、
501 現在の状況欄、502 閾値超過予測日欄、503 メモリ利用状況
欄、
504 ディスク利用状況欄、505 詳細表示欄、
506 メモリ利用状況詳細
欄、507 ディスク利用状況詳細欄