【実施例1】
【0023】
以下、実施例1について、データセンタの物理リソースを仮想化したクラウド環境に対して、運用作業者により過去に実施された仮想リソースに関する運用作業を分析・把握するケースを例にとって説明する。仮想リソースの運用作業の分析は、本実施例を具現化した運用作業分析サーバにより行われ、ログデータを基に、過去の運用作業を特定・把握する処理である。なお、実施例1で示すクラウド環境は本実施例適用箇所の一形態であり、適用先として、複数のデータセンタにまたがり構築されるクラウド環境も含む。
【0024】
図1は、第一実施例における運用作業分析システムの全体構成を示したものである。本実施例における運用作業分析システムの構成要素には、データセンタ101、データセンタ外ネットワーク102、仮想環境接続用端末103、運用作業分析サーバ104を含み、ユーザ105が運用作業を分析する。ユーザ105は運用作業分析サーバを操作して運用作業を把握することができる。
【0025】
本実施例が運用作業分析対象とするクラウド環境はデータセンタ101に構築されている。データセンタ101内の構成要素は、データセンタ内ネットワーク111、仮想環境管理サーバ112a−c、仮想リソース構成管理サーバ113、ネットワーク機器114、仮想化サーバ115a−d、SAN(Storage Area Network) 116、ストレージ117a−cを含む。
【0026】
データセンタ内ネットワーク111は、各種サーバ間の通信やデータセンタ外ネットワーク102との通信のための経路を提供している。
【0027】
SAN116は、FC(Fibre Channel)スイッチなどのSAN装置により構成され、ストレージ117a−cと仮想化サーバ115a−d間のストレージI/O(Input Output)の通信経路を提供する。
【0028】
仮想化サーバ115a−dは、前述のネットワーク機器114を介して相互に接続し、また、データセンタ101の外部に接続する。また、後述のように、FCスイッチ等により実装されたSAN116を介して、ストレージ117a−cにアクセスする。仮想化サーバ115a−dは、NIC(Network Interface Card)やHBA(Host Bus Adapter)あるいはCNA(Converged Network Adapter)を搭載し、LANおよびSANにアクセスする。
【0029】
仮想化サーバ115a−dは、仮想化ソフトウェアであるVMM(Virtual Machine Monitor)や、LPAR(Logical Partitioning)が搭載され、仮想化ソフトウェアにより複数の仮想マシン(VM)が生成される。各仮想マシンは、vNIC(Virtual Network Interface Card)、vHBA(Virtual Host Bus Adaptor)、vCNA(Virtual Converged Network Adapter)などの仮想的なインターフェースにより、同一仮想化サーバ上の他VMや、他仮想化サーバ、あるいはストレージ117にアクセスする。仮想化サーバ115a−dに搭載される仮想化ソフトウェアとして、VMware ESXi(登録商標)、Microsoft Hyper−V(登録商標)、Linux(登録商標) KVM(Kernel−based Virtual Machine)、Citrix Xen(登録商標)などを含む。
【0030】
ストレージ117a−cは、SAN116を介して、仮想化サーバ115a−cに外部記憶領域を提供する。ストレージ117a−cは、ストレージアクセスする物理ポートを仮想化するためのNPIV(N_Port ID Virtualization)、物理ストレージに構成された論理ボリュームであるLU(Logical Unit)を含む。ストレージ117a−cは、ストレージのポートと、LUおよびサーバを対応付けるLUN(Logical Unit Number)マスキングなどの機能を備えていてもよい。
【0031】
仮想環境管理サーバ112a−cは、仮想化サーバ115a−dやストレージ117a−cなどの物理リソースや、それら物理リソースを活用して生成された仮想マシンや仮想ストレージなどの仮想リソースを管理する。仮想環境管理サーバ112a−cの機能を実現するソフトウェアの例として、VMware vCenter(登録商標)、Microsoft(登録商標) System Center Virtual Machine Manager、OpenStack(登録商標)などを含む。
【0032】
仮想リソース構成管理サーバ113は、VM(Virutal Machine)やvNIC(Virtual Network Interface Card))やvDisk(Virtual Disk)などを含む、仮想リソースを対象に、仮想リソースの設定変更内容や、仮想リソース間の接続関係の更新などを、時系列的に収集・管理する機能を備えた構成管理サーバである。本実施例では、仮想リソース構成情報管理サーバ113はデータセンタ101内に存在するが、仮想リソース構成情報管理サーバ113の設置場所は問わない。仮想化ソフトウェアや仮想環境管理サーバに対して定期的に構成情報収集コマンドを発行して構成情報を収集してもよいし、あるいは仮想化ソフトウェアや仮想環境管理サーバから構成変更イベントに応じてオンデマンドで構成情報を収集してもよい。これらの収集した構成情報を時刻とともに履歴情報として管理できれば、いずれの方法を利用してもよい。
【0033】
実施例1で取り上げるデータセンタ101上に構築されたクラウド環境は、上述の全ての機器を含む必要は無い。例えば、本実施例では、外部記憶領域として、SAN接続されたストレージ117a−cを想定したが、サーバ内蔵ディスクであってもよい。また、仮想環境管理サーバがない場合も想定される。以上が、データセンタ101内の構成要素である。
【0034】
データセンタ外ネットワーク102は、データセンタ内ネットワーク111のようにデータセンタ外に設置されたL2スイッチやL3スイッチ、ファイアウォール、ルータ等により(非図示)、データセンタ外ネットワーク102に接続された端末からデータセンタ101へ接続する役割を持つ。データセンタ外ネットワーク102はインターネットなどの広域網に接続されていてもよい。また、上述のネットワーク機器の機能を用いて、データセンタ内外の接続にアクセス制御などの制限が掛けられていても良い。
【0035】
仮想環境接続端末103は、仮想環境管理サーバ112a−cへアクセスしてクラウド環境の運用作業を実施したり、仮想化ソフトウェアや仮想環境管理サーバが出力したログデータを収集したりする。
【0036】
運用作業分析サーバ104は、クラウド環境に分散して保持されるログデータを収集して、ログデータを分析し、運用作業を可視化する。運用作業分析サーバ104は、運用作業可視化部121、ログデータ分析部122、クラウド構成情報管理部123、ログデータ管理部124を備える。これら機能部の説明は
図2で行う。なお、
図1では、運用作業分析サーバ104は仮想環境接続用端末103に直接接続されているが、データセンタ外ネットワーク102またはデータセンタ内ネットワーク111に接続し、クラウド環境に分散して保持されるログデータを収集するように構成してもよい。
【0037】
以上が、データセンタ101外の構成要素の例である。
【0038】
図2は、運用作業分析サーバ104の構成例である。
図2において、運用作業分析サーバ104は、構成要素として、運用作業可視化部121、ログデータ分析部122、クラウド構成情報管理部123、ログデータ管理部124、運用作業傾向分析部125、ログデータ管理テーブル211、クラウド構成情報管理テーブル212、運用作業管理テーブル213、傾向分析部214を有する。
【0039】
運用作業分析サーバ104は、運用作業可視化部121を介してユーザ105からの運用分析開始要求を受ける。これを受け、運用作業可視化部121はログデータ管理部124による分析対象のログデータ取得を実行する。また、取得したログデータと、クラウド構成情報管理部123が管理する情報に対するログデータ分析部122の分析処理も実行する。分析結果は運用作業管理テーブル213に格納され、分析終了後は運用作業管理テーブル213の情報を運用作業可視化部121がユーザ105に提示する。また、各ログデータに対する運用作業分析の結果は、傾向分析部214に蓄えられ、各運用作業の頻度分析などの集計を行う。
【0040】
図2、
図3では説明のために、機能を一つのブロックとして実施例の構成を表している。運用作業分析サーバ104など、実施例中でサーバと呼称される構成は、一般のコンピュータと同様に、入力装置、出力装置、処理装置(プロセッサまたはCPU)、記憶装置_(メモリ)を備えている。このような実施例の物理的な構成は、後に
図16で説明する。本実施例では計算、処理、制御等の機能は、記憶装置に格納されたプログラムがプロセッサによって実行されることで、定められた処理を必要に応じて他のハードウェアと協働して実現する。実行するプログラムまたはその機能を実現する構成を、明細書や図面中では「機能」、「手段」、「部」、「モジュール」「ユニット」等と呼ぶ場合がある。
【0041】
また以後の説明では「〜テーブル」、「〜リスト」、「〜DB(Database)」、「〜キュー」等の表現にて実施例の情報を説明することがあるが、これら情報はテーブル、リスト、DB、キュー、等のデータ構造以外で表現されてデータ相互の関係を定義していてもよい。そのため、データ構造に依存しないことを示すために「〜テーブル」、「〜リスト」、「〜DB」、「〜キュー」等について「〜情報」と呼ぶことがある。また、データ相互の関係が保たれている限り、一つのテーブル等を分割してもよいし、複数のテーブル等を統合してもよい。
【0042】
なお、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ID(IDentification)」という表現を用いるが、「識別情報」、「識別子」、「ID」は、任意の情報に固有かつ不変な識別符号であるが、「名」、「名称」は可変な識別符号である。また、「識別情報」、「識別子」、「ID」はお互いに置換が可能である。「名」、「名称」についてもお互いに置換が可能である。移行の説明における「ID」と「名」の差異を示す具体名例として、VM名とVM IDが挙げられる。VM名は、対象のVMを管理する運用者が、VMの用途などを考慮して自由に変更可能であり、同一クラウド環境での重複が許される場合がある。一方、VM IDは、同一クラウド環境で一意に対象を特定する為の情報である為、固有かつ不変である。
【0043】
運用作業分析サーバ104の各構成要素についての説明は以下のとおりである。
【0044】
運用作業可視化部121は、上述のように、運用作業分析サーバ104とユーザ105のインターフェースの役割を果たす機能部である。運用作業可視化部121は、ユーザ105からの運用作業分析要求として、ログデータの収集要求、または、ログデータの入力を受ける。運用作業可視化部121はこの情報をログデータ管理部124に渡し、ログデータ管理部124によるログ取得・管理を開始する。ログデータの取得が終わると、運用作業可視化部はログデータ分析部122の処理実行を開始する。ログデータ分析部122による分析が完了すると、運用作業分析結果をユーザ105に提示する。このように、ユーザ105は、データ取得要求部223に他端末からのログデータ収集要求やユーザ保持ログデータの入力を行い、また、運用作業フロー表示部225により運用作業フローを可視化して提示される。
【0045】
ログデータ分析部122は、分析対象となるログデータに対する種々の分析を実施する機能部である。運用作業可視化部121からの分析開始要求を受けると、ログデータ管理部からの124ログデータ参照、クラウド構成情報管理部123からのクラウド構成情報参照を実施する。次に、参照した情報を基に、ログデータからの処理イベント抽出や、抽出結果からの運用作業の検出・特定を行う。特定した運用作業の情報を運用作業管理テーブル213に格納する。
【0046】
クラウド構成情報管理部123は、分析対象のクラウド環境を有するデータセンタ101にある仮想リソース構成管理サーバ113から、仮想リソースの設定や、仮想リソース間の接続関係の変更を収集し、任意の時刻のクラウドの構成情報を管理する。
【0047】
管理する構成情報は、ログデータ分析部122から参照されログデータから運用作業を特定する処理で利用される。クラウド構成情報管理部123は、仮想リソース構成管理サーバ113による構成情報変更処理に連動して更新してもよい。あるいはデータ取得要求部223からのデータ取得要求において、明示的に構成情報を更新してもよい。クラウド構成情報が最新のものになるように管理されれば、いずれの方法を用いてもかまわない。
【0048】
ログデータ管理部124は、運用作業の特定に用いるログデータの収集及び管理を行う。
【0049】
ログデータ管理テーブル211は、運用作業分析処理に利用するログデータの収集及び管理を行う。外部ネットワークを経由して取得した、または、ユーザ105が入力した分析対象ログデータに関して、ログデータの種類やログデータへのファイルパスなどを保持する。ログデータ管理テーブル211は
図4A,
図4Bにおいて説明する。
【0050】
クラウド構成情報管理テーブル212は、クラウド構成情報管理部123が収集する仮想リソースの設定情報や接続関係を保持するテーブルである。クラウド構成情報管理テーブル212は
図9で説明する。
【0051】
運用作業管理テーブル213は、ログデータ分析部によって検出・特定された運用作業情報を格納する。運用作業管理テーブル213に格納された情報は、運用作業分析が完了した後に、運用作業可視化部121により参照され、可視化される。運用作業管理テーブル213については
図10において説明する。
【0052】
傾向分析部214は、運用作業分析サーバ104が実施した運用作業分析結果を蓄積し、分析結果に対する集計処理や傾向分析処理などを実施する。集計処理や傾向分析は、例えば、ユーザ毎、運用作業ごとなど、設定した項目に従い数を集計したり、2つ以上の運用作業が連続して実施された場合を集計し、関連性の強い運用作業の組を推定したりする処理などである。
【0053】
(運用作業可視化部121)
運用作業可視化部121は、設定情報編集部221、傾向分析表示部222、データ取得要求部223、分析開始要求部224、運用作業フロー表示部225を含む。運用作業分析処理は、データ取得要求部223がユーザ105から分析対象ログデータの指定を受け取りログデータの取得を開始し、ログデータ取得後に分析開始要求部224がログデータ分析部122の分析処理を実行する。また、分析処理の終了後、運用作業フロー表示部225が分析結果を表示する。設定情報編集部221、傾向分析表示部222は運用分析処理の実行には直接関与しない。
【0054】
設定情報編集部221は、ログデータの分析に必要な設定情報(ログフォーマット管理テーブル243、運用作業マッピングテーブル237のインタラクティブな編集を可能とするユーザインタフェースを提供する(
図14の1413に運用作業マッピングテーブル237の編集画面の例を記載する)。
【0055】
分析開始要求部224は、ログデータに対する分析処理をログデータ分析部233に要求する。
【0056】
データ取得要求部223は、ユーザ105からのログデータ分析要求を受け、分析に必要な各データの収集要求を発行する。ログデータ管理部に対して、ユーザが保持するログデータがユーザインタフェースに入力された際には、ログデータ受付部232にこのログデータを入力し、ログデータが入力されなかった際には、ユーザからの入力情報(ログデータを持つリモートサーバへのアクセス情報1421など)を含むログデータ取得要求をログデータ収集部231に発行する。また、クラウド構成情報管理部123に対しては、クラウド構成情報の収集要求を発行する。
【0057】
傾向分析表示部222は、傾向分析部214による分析結果を表示する機能である。表示例は
図14の1412である。
【0058】
運用作業フロー表示部225は、ログデータ分析部233による分析結果が格納される運用作業管理テーブル213を参照し、得られた分析結果を表示する機能を提供する。
【0059】
(ログデータ管理部124)
ログデータ管理部124は、運用作業分析処理に利用するログデータの収集及び管理を行う。ログデータ管理部124は、ログデータ収集部231とログデータ受付部232を有する。データ取得要求部223からの要求内容に応じて、ログデータ収集部231による運用作業分析サーバ外からのログデータ収集か、ログデータ受付部232によるユーザ105が入力したログデータの受付を行う。
【0060】
ログデータ受付部232はユーザ105が運用作業可視化部121を介して入力した分析対象のログデータを受け付ける。受け付けたログデータはログデータ管理テーブル211に格納される。
【0061】
ログデータ収集部231は、データ取得要求部223において、ユーザから入力された分析対象(リモートサーバへのアクセス情報1421や取得対象のログファイル指定(非図示))に基づき、仮想環境管理端末103などの運用作業分析サーバ外に存在するログデータの収集や、クラウド環境に対する直接的なログデータ収集を行う。収集したログデータはログデータ管理テーブル211に格納される。
【0062】
(ログデータ分析部122)
ログデータ分析部122は、処理イベント抽出部233、運用作業検出部234、運用作業マッピングテーブル管理部235、処理イベント管理テーブル236、運用作業マッピングテーブル237を有する。
【0063】
ログデータ分析部122では、処理イベント抽出部233が、データ管理部124からの分析対象ログデータの参照や、ログデータからの処理イベント抽出、抽出処理イベントの処理イベント管理テーブル236へ格納する。格納された処理イベントを参照し、運用作業マッピングテーブル管理部235が管理する運用作業マッピングテーブル237の情報に従って、運用作業検出部234が運用作業を特定する。また、運用作業検出部234は、運用作業と処理イベントの対応関係を特定すると、特定結果を順じ運用作業管理テーブル213に格納する。
【0064】
処理イベント抽出部233は、分析対象のログデータから、処理イベントと処理イベントに付随するパラメータを抽出する。抽出処理イベントとは仮想リソースの運用作業者による運用操作に応じて、仮想環境管理サーバ112、若しくは、仮想化サーバ115による内部処理単位である。運用作業者の1つの運用操作により1つ以上の処理イベントが処理され、処理結果はテキスト形式でログデータに出力される。処理イベントに付随するパラメータには、例えば、処理イベントの処理対象である仮想リソースの識別子(VMやvDiskの識別子など)を含む。
【0065】
運用作業検出部234は、処理イベント抽出部233により抽出した処理イベントから運用作業を特定し、特定した運用作業情報を、運用作業管理テーブル213に保持する。
【0066】
運用作業マッピングテーブル管理部235は、運用作業マッピングテーブル237が保持する運用作業と処理イベントのマッピングする情報の参照・編集を行う。運用作業マッピングテーブル237が保持する運用作業と処理イベントのマッピング情報は、ユーザ105による情報追記や新規作成などの編集作業が可能である。本実施例では、設定情報編集部221がユーザ105とのインターフェースを果たし、GUI画面(1413)への入力内容が運用作業マッピングテーブル管理部235に渡されて運用作業マッピングテーブル237が編集される。別の実施形態として、GUIを利用せず、ユーザ105が運用分析サーバ104以外の環境で作成したテクストファイルなどを読み込み、運用作業マッピングテーブル237の編集や新規作成などが実施可能であってもよい。
【0067】
処理イベント管理テーブル236は、処理イベント抽出部233により抽出した処理イベントと処理イベントに付随するパラメータを保持し、運用作業検出部234により参照される。処理イベント管理テーブル236の構成については、
図6で説明する。
【0068】
運用作業マッピングテーブル237は、処理イベント列と運用作業の対応づけ情報を保持し、運用作業検出部234により参照される。運用作業マッピングテーブル237の構成については、
図8で説明する。
【0069】
(処理イベント抽出部233)
処理イベント抽出部233は、処理イベント把握部241、パラメータ抽出部242、ログフォーマット管理テーブル243を有する。処理イベント抽出部233は、分析対象ログデータのフォーマットに合わせた分析処理情報をログフォーマット管理テーブル243から参照する。この情報を基に、処理イベント把握部241が分析対象ログデータからの処理イベント把握し、パラメータ抽出部242が把握した各処理イベントのパラメータを抽出する。
【0070】
処理イベント把握部241は、分析対象のログデータから、運用作業に関係のある処理イベントを検出する。
【0071】
パラメータ抽出部242は、処理イベント把握部241が検出した処理イベント毎に、処理イベントに付随するパラメータを抽出する。
【0072】
ログフォーマット管理テーブル243は、処理イベント把握部241とパラメータ抽出部242で実行されるログデータに対する処理内容を管理する。ログフォーマット管理テーブル243については
図5で説明する。
【0073】
処理イベント抽出部233の詳細処理については
図12で説明する。
【0074】
(運用作業検出部234)
運用作業検出部234は、処理イベントグルーピング部251、運用作業特定部252、処理イベントグループ管理テーブル253を有する。運用作業検出部234は、処理イベント管理テーブル236に格納された処理イベントのデータ集合に対して、処理イベントグルーピング部によるグルーピング処理を行い、グループ化した処理イベント列を処理イベント管理テーブル253に格納する。運用作業特定部252は、各グループ化処理イベント列に対して、処理イベントの部分列と運用作業のマッピング処理を行う
処理イベントグルーピング部251は、処理イベント管理テーブル236に格納されている処理イベントのデータ集合とクラウド構成情報管理部123に格納されているクラウド構成情報を参照する。クラウド構成情報から、VMやシステムの識別子情報を取得し、この識別子情報を基に処理イベントのデータ集合をグルーピングする。そして、グルーピング結果を処理イベントグループ管理テーブル253に格納する。
【0075】
運用作業特定部252は、始めに運用作業マッピングテーブル237を参照する。処理イベントグルーピング部251によりグループ化された処理イベント列ごとに、参照した運用作業マッピング情報を基に処理イベントの部分列と運用作業のマッピング箇所を検出する。検出したマッピング情報は運用作業管理テーブル213に格納する。
【0076】
処理イベントグループ管理テーブル253は、処理イベントグルーピング部251によりグループ化された処理イベント列に対して、各グループを識別する情報を付加して処理イベントグループを管理する。運用作業検出部234のより詳細な説明は
図3にて行う。
【0077】
(運用作業検出部234)
図3に運用作業検出部234の構成を示す。運用作業検出部234は、処理イベントグルーピング部251、運用作業特定部252、処理イベントグループ管理テーブル253、を有する。また、運用作業検出部234は、一時的な情報として、各VM構成情報管理テーブル311a−cを含む。
【0078】
(処理イベントグルーピング部251)
処理イベントグルーピング部251は、クラウド内VM構成情報参照部321、VM関連機器ID取得部322、処理イベントグルーピング抽出部323を有する。
【0079】
処理イベントグルーピング部251は、クラウド内VM構成情報参照部321により、クラウド構成情報管理テーブル212をVMごとに参照する。VM関連機器ID取得部322が、参照したVM単位の構成情報から任意のVMとVMに接続された機器の識別子情報を取得し、取得した識別子をキー情報に処理イベント管理テーブル236を参照し、参照結果をグループ化して処理イベントグループ管理テーブル253に格納する。
【0080】
クラウド内VM構成情報参照部321は、クラウド構成情報管理テーブル212のテーブル情報をVM毎に参照する。処理イベントグルーピング部251は、処理イベントをVM毎にグルーピングする為に、各VMの構成情報テーブル311a−cに管理されているVM IDとVMに関連する機器IDを利用する。各VM構成情報テーブル311a−cは、
図9のクラウド構成管理テーブルが有する情報について、VM ID911の値が共通する行データを同一VMの構成情報テーブル311a−cとして取得したものである。
【0081】
VM関連機器ID取得部322は、各VM構成情報テーブル311a−cから処理イベントグループ抽出部323の処理で必要な情報(VMや関連機器の識別子情報や、構成情報変更時刻など)を抽出し、処理イベントグループ抽出部323に入力する。
【0082】
処理イベントグループ抽出部323は、VM関連機器ID取得部322から入力された情報をキー情報として、処理イベント管理テーブル236から参照する。参照結果には、VMに対する処理イベントのほか、関連機器に対する処理イベントも含まれている。上記の参照結果は、グループ識別子としてVM識別子を新たに付加して、処理イベントグループ管理テーブル253に格納する。
【0083】
(運用作業特定部252)
運用作業特定部252は運用作業マッピングテーブル参照部331、処理イベントグループ参照部332、運用作業マッピング処理部333を有する。
【0084】
運用作業特定部252は、運用作業マッピングテーブル参照部331が運用作業マッピングテーブル237を参照する。次に、処理イベントグループ参照部332が処理イベントグループ管理テーブル253から各処理イベントグループを参照する。運用作業マッピング処理部333は、参照した処理イベントグループの処理イベント列から、運用作業マッピングテーブルに定義された運用作業と処理イベント列のマッピング情報に合致する処理イベント部分列を検出し、検出結果を運用作業管理テーブル213に格納する。
【0085】
運用作業マッピングテーブル参照部331は運用作業マッピングテーブル237を参照する。
【0086】
処理イベントグループ参照部332は、処理イベントグループ管理テーブル253に格納された処理イベントから、グループID711の値が共通する行データを1つの処理イベントグループとし、処理イベントグループ毎に参照する。
【0087】
運用作業マッピング処理部333は、処理イベントグループ参照部332が参照した各処理イベントグループと、運用作業マッピングテーブル237を基に作業マッピング処理を実施する。
【0088】
処理イベントグループ管理テーブル253は、処理イベントグルーピング部251によりグループ化された処理イベント列に対して、各グループを識別する情報を付加して処理イベントグループを管理する。処理イベントグループ管理テーブル253の詳細については
図7で説明する。運用作業検出部234の処理フローの詳細は
図13で説明する。
【0089】
(ログデータ管理テーブル211)
図4Aはログデータ管理テーブル211の構成例を示す。ログデータ管理テーブル211は、運用作業分析に用いられる個々のログデータ(本実施例ではファイルとして管理されるものとする)について、ログデータ種別411、ログデータ取得ID412、取得日時413、ログデータ参照情報414を管理する。また、各行431、432、433はそれぞれ1つのログデータファイルを管理する。
【0090】
ログデータ種別411は、各ログデータファイルのクラウド環境種421、ログファイル種422を有する。ログデータの書式は、クラウド環境を実現する為の仮想化ソフトウェアや仮想環境管理サーバ、システムログやイベントログなどのログ規格毎に異なっており、ログデータを利用した運用作業分析処理には、ログファイル毎に適切な処理を選択的に実施する必要がある。
【0091】
クラウド環境種421、ログファイル種422の情報は、分析に用いるログ種別にログフォーマット管理テーブル243を選択するために用いる。
【0092】
ログデータ取得ID412は、ログデータ管理テーブル211のログデータ間の関連性を識別する為の情報である。本実施例の適用による1回の運用作業分析では、単一のクラウド環境に対する運用作業分析であっても、複数種類のログデータを用いる場合があり、ログデータ取得ID412はこれらを関連付ける。ログデータ収集部231、若しくは、ログデータ受付部232が1回のログデータ取得で得た複数種類のログデータファイルは、同じログデータ取得ID412をキー情報として保持する。
【0093】
取得日時413は各ログデータファイルの取得日時を示す。ログデータ参照情報414は、取得したログデータファイルを参照する為のファイルパス情報である。行データ431の414で対応付けられたログデータファイルの例を441に示す。
【0094】
図4Bにログデータの一例を示す。ログデータは、システムを構成するデバイスやソフトウェアによって生成される。ログデータは運用作業の実行の結果、クラウド基盤上で実行された処理イベントの実行履歴である。ログデータは通常、デバイスやソフトウェア上で実行された処理イベントについて、処理イベントの実行結果・経過を1行単位のテキストデータに、複数行にわたり記される。ログデータは1行単位で記される情報として、実行結果や中間状態がログデータとして記された時刻データや処理イベントの名称(vm.startVmやvolume.ExportDiskなど)、処理イベントのID(本実施例ではopID=xxxと表記される)等が含まれる。ログデータに含まれる情報は、仮想環境管理サーバや仮想化サーバ内部で実行された処理イベント情報が含まれているが、運用作業を直接示唆する情報(VMの定時バックアップなど)は含まれていない。
【0095】
(ログフォーマット管理テーブル243)
図5はログフォーマット管理テーブル243の構成を示したものである。ログフォーマット管理テーブル243は、運用作業分析のために収集したログデータから、仮想化サーバ115a−d、または、仮想環境管理サーバ103で実行された処理イベントを抽出するために必要なテーブルである。ログフォーマット管理テーブル243は、イベント検出情報511と詳細パラメータ検出情報512を有する。
【0096】
イベント検出情報511は主に処理イベント把握部241に参照され、イベント把握に利用される。詳細パラメータ検出情報512は、処理イベント把握部241で把握された各処理イベントについて、処理イベントに付随するパラメータを取得するために、パラメータ抽出部242で参照される。
【0097】
イベント検出情報511は、対象ログ種521、イベント種特定ログ行検出キー522、処理イベント種別523を有する。対象ログ種521は、クラウド環境種531、ログファイル種532を有する。イベント検出情報511は、分析対象ログファイルに対して処理イベントに関するログ行を検出する為のイベント種特定ログ行検出キー532を一意に決定するために利用され、処理イベント把握部241にログデータファイルが入力された際に、当該ログファイルに付随するログデータ種別411と合致するイベント検出情報511を持つ行が選択される。処理イベント把握部241は、選択されたログ行に含まれるイベント種特定ログ行検出キー522を用いて、入力ログデータ内から、処理イベントの有無を検出し、なおかつ、検出した各処理イベントのイベント種別が含まれるログ行を取得する。
【0098】
(詳細パラメータ検出情報512)
詳細パラメータ検出情報512は、抽出対象パラメータ524、抽出方法525、対象ログファイル種526、パラメータ抽出処理雛形情報527を有する。処理イベント把握部241が検出した処理イベント毎に、その処理イベントの処理イベント種別に応じて、取得すべきパラメータについての抽出方法525、パラメータ情報が含まれる対象ログファイル種526、対象ログファイルに対するパラメータ抽出処理雛形情報527が定義されている。抽出方法525は、収集したログ行からのキーバリュー値の検出のほか、特定のログ行間の差分比較やクラウド構成情報212の参照など、処理イベントに関連したログ行以外への処理が規定されていても良い。
【0099】
詳細パラメータ検出情報512で規定可能な処理情報について、543によるパラメータ抽出を例とすれば、仮想リソースの設定情報変更の処理イベントなどにおいて、処理イベントを検出したログファイル以外のログファイルに対するパラメータ抽出処理が規定されていても良い。抽出方法についても、特定ログ行のキーバリュー値取得だけでなく、複数のログ行におけるキーバリュー値の差分や比較により、パラメータの抽出処理が規定されていても良い。
【0100】
ログフォーマット管理テーブル243は、システムの管理者が手作業等で作成し、運用作業分析サーバ104の記憶装置に格納しておくことができる。ログフォーマット管理テーブル243のイベント検出情報511を利用することで、ログファイルから処理イベントとその種類を検出することができる。
【0101】
また、ログフォーマット管理テーブル243の詳細パラメータ検出情報512が示すルールを用いることにより、処理イベントに関連する詳細パラメータを抽出することができる。例えば、ルールには、処理イベントに対応して、抽出すべきパラメータの種類あるいはパラメータ名、抽出方法、対象となるログファイル種、パラメータ抽出処理の雛形等の少なくとも一つを含む。対象となるログファイル種を規定しておくことで、抽出すべきパラメータが別のファイルにあるような場合でも、処理イベント種別に対応する詳細パラメータを、ログファイルから抽出することができる。具体的な抽出処理は、ルールが保持する情報の文字列とログファイル中の文字列のマッチング処理によって、ログファイル中の文字列パターンである、詳細パラメータ文字列パターンを抽出することにより実行することができる。
【0102】
(処理イベント管理テーブル236)
図6は処理イベント管理テーブル236の構成を示したものである。処理イベント管理テーブル236は、処理イベント抽出部233によって抽出された各処理イベントをテーブル形式で構造化し、行単位で管理するものである。処理イベント管理テーブル236は、各処理イベントに関する情報として、実行時間611、処理イベント種別612、処理イベントパラメータ613を有する。
【0103】
実行時間611は、処理イベント抽出部233により抽出された各処理イベントの実行時刻の情報である。処理イベント種別612は各処理イベントの処理イベント種名である。処理イベントパラメータ613は、各処理イベント毎に、パラメータ抽出部242が取得した各パラメータが、パラメータ名とパラメータの値と対応付けられて格納されたものである。処理イベント毎のパラメータ数は固定長である必要はなく、可変長であってもよい。パラメータ名としてはリソースの種別(Disk IDなど)や変更対象項目の種別(メモリサイズなど)があり、パラメータとしてはリソースの識別子(Disk−23など)や変更対象項目の変更後の設定値(4096 MBなど)がある。
【0104】
(処理イベントグループ管理テーブル253)
図7は処理イベントグループ管理テーブル253の構成を示したものである。処理イベントグループ管理テーブル253は、処理イベントグルーピング部251によってグルーピングされた処理イベントを有する。処理イベントグループ管理テーブル253によって管理される処理イベントグループは、VM ID711をグループIDとして有する。この他、実行時間611、処理イベント種別612、処理イベントパラメータ613を有するが、これらの情報は処理イベント管理テーブル236と同様の列データである。処理イベントグループ管理テーブル253においても、各行が1つの処理イベントに対応している。処理イベントグループ管理テーブル253から1つの処理イベントグループを参照する際は、VM ID711を検索キー情報として用いることにより参照できる。
【0105】
(運用作業マッピングテーブル237)
図8は、運用作業マッピングテーブル237の構成を示したものである。運用作業マッピングテーブル管理部235が管理する運用作業マッピングテーブル237は、運用作業特定部252から参照され、処理イベントと運用作業の対応関係を特定する処理に用いられる。運用作業マッピングテーブル237は、マッピング優先度811、運用作業名812、運用作業識別子813、処理イベント列814、順序性815、関連付け時間範囲817、重複818に対する定義情報を有する。
【0106】
マッピング優先度811は、運用作業特定処理において、優先的にマッピングされる必要のある作業を定義する。異なる運用作業のマッピング情報を示す821、824を例にとると、同様の処理イベント814に対して、異なる運用作業が対応付けの候補となる場合がある。これを解決するために、優先的にマッピングされるべき処理イベントと運用作業を指定する情報がマッピング優先度811であり、運用作業特定処理は、マッピング優先度811が高い運用作業から順に実施される(本実施例では優先度の数値が小さい運用作業から順に実施される)。
【0107】
運用作業名812、運用作業識別子813は運用作業を識別する為の情報である。処理イベント列814は、運用作業に該当する処理イベント部分列を定義したものである。順序性815は、運用作業に対応する処理イベント列において、各処理イベントの登場するべき順序を定義する。815で定義された順序で処理イベントが出現しない処理イベント列は運用作業と対応付けない。機器ID種816は、各処理イベントが対象としていた仮想リソース種を定義する。
【0108】
関連付け時間範囲817は、運用作業に対応する処理イベント部分列について、先頭の処理イベントから終端の処理イベントまでが完了するまでの時間範囲の上限を定めたものである。関連付け時間範囲817の情報に基づいて、時間的に大きく離れた異なる複数のイベントが、1つの運用作業として特定されないようにすることもできる。
図8の例では、運用作業名812に対応して関連付け時間範囲817を定めているが、機器ID種816に対応して定めてもよい。機器ID種816に対応して定める方式では、例えば、ハードディスク容量に機種ごとの差があるような場合に有効である。また、関連付け時間範囲817は固定値としてもよいし、オペレータによる操作等により可変としてもよい。
【0109】
重複818は、運用作業に対応する処理イベント列の中で重複が許されるかを定義するものである。1回のみ出現すべきイベントに対しては「無」を、1回以上繰り返し出現してもよいイベントに対しては「有」のフラグを立てる。重複818の情報を用いることで、ひとつの運用作業が作業内容に応じて異なる個数の処理イベントを発生させる場合であっても、システムログから適切に運用作業を検出することができる。
【0110】
後に
図13で説明するように、本実施例における具体的な運用作業特定処理は、処理イベントグループ管理テーブル253(
図7)に格納された処理イベントグループ内の処理イベントを、実行時間611により時系列順序に並べた処理イベント列から、運用作業マッピングテーブル237(
図8)に規定する順序性や時間範囲などの制約条件に従って、処理イベント列814を検出する処理である。検出した結果は、運用作業管理テーブル213(
図10)に格納される。
【0111】
(クラウド構成情報管理テーブル212)
図9は、クラウド構成情報管理テーブル212の構成を示したものである。クラウド構成情報管理テーブル212は、データセンタ101内のクラウド環境に存在するVMや仮想DIskなどの仮想リソースの構成情報を有する。本実施例のクラウド構成情報テーブルの例では、個々のVMに対して関連付けられる機器は固定長である必要は無く可変であってもよい。クラウド構成情報管理テーブル212は、各VMについて、時系列に沿った構成情報の変化を保持する。
【0112】
クラウド構成情報管理テーブル212はVM ID911、912構成情報有効期間開始時刻912、構成情報有効期間終了時刻913、及び、914に示した関連機器接続情報を有する。各行はそれぞれ、該当するVMにおける、構成情報有効期間開始時間912から構成情報有効期間終了時刻913まで取っていた構成情報を示す(両者の時刻情報を必ずしも持つ必要はなく、任意の過去の時刻における構成情報を検索できればよい)。
【0113】
931−933は当該VMに対して2度の構成変更が行われたことを示す。クラウド構成情報管理テーブル212は、VM ID911を有しており、個別のVMについて、構成情報及びその変化を参照する場合には、VM ID911をキー情報として参照することができる。クラウド構成情報管理テーブル212の関連機器接続情報914は、例えばリソースの識別子を用いて、リソース相互の関連性を示すことができる。関連機器接続情報914のリソースの識別子に基づいて、処理イベント管理テーブル236(
図6)に格納された複数の処理イベントから、関連するリソースの識別子を持つ処理イベントを抽出し、グルーピングすることができる。グルーピング結果は、処理イベントグループ管理テーブル253(
図7)として格納する。
【0114】
(運用作業管理テーブル213)
図10は、運用作業管理テーブル213の構成を示す。運用作業管理テーブル213は、VM ID711、実行時間611、運用作業識別子1011、処理イベント種別612、処理イベントパラメータ613を有している。運用作業管理テーブル213は、運用作業検出部234によって処理イベントグループから特定した運用作業情報を管理し、運用作業フロー表示部225から参照される。
【0115】
運用作業管理テーブル213は、処理イベントグループ管理テーブル253に格納されている処理イベント列に対して、運用作業を対応付けた情報が格納されるため、VM ID711、実行時間611、処理イベント種別612、処理イベントパラメータ613については、
図7の処理イベントグループ管理テーブルで説明した情報と同等の情報を有している。
【0116】
運用作業識別子1011については、各処理イベント列について、対応付けられた運用作業を識別する為の識別子情報である。
図10の例では、上から3行目までの処理イベントが、同一の運用作業の一連のイベントであることが分かる。
【0117】
(運用作業分析サーバ104における全体処理フロー)
図11は、運用作業分析サーバ104における、ログデータ取得から運用作業フローの表示までの全体処理フローを示したものである。運用作業分析サーバ104は、ユーザ105の入力によりログデータ取得を実施する(S1111)。ログデータ取得の例として、ログデータ収集の為にアクセスする外部端末接続情報入力とログデータ収集要求の発信か、ユーザ105が持つログデータファイルの入力受けつけにより運用作業分析が実施される。
【0118】
他端末からのログデータ収集を行う場合は、ログデータ収集部231がユーザ入力済みの接続先情報(IPアドレスやログインユーザ名・パスワードなど)を基に他端末からのログデータ取得を行い、取得したログデータはログデータ管理テーブル211に格納する(S1121)。端末からのログデータ取得の方法については、仮想環境管理端末上に既に取得されたログデータをファイル転送などで取得する方法や、仮想環境管理端末103を経由してデータセンタ101の仮想環境管理サーバに接続し、ログデータを取得する方法などを含む。
【0119】
ユーザが保持するログデータを入力として運用作業分析を実施する場合は、ユーザにより入力されたログデータをログデータ受付部232がログデータ管理テーブル211へ格納する(S1122)。
【0120】
本実施例では、クラウド構成情報管理部123が仮想リソース構成管理サーバ113と連携して最新のクラウド構成情報を保持しているが、クラウド構成情報の連携を行っていない、若しくは、最新のクラウド構成情報を保持していない場合は、仮想リソース構成管理サーバ113からクラウド構成情報を取得し、クラウド管理情報管理テーブル212に格納する(S1112)。
【0121】
次に、ステップS1121、または、ステップS1122で取得したログデータとログフォーマット管理テーブル243を用いて、処理イベントの抽出及び処理イベント管理テーブルへの格納を行う(S1113)。ステップS1113の処理フローの詳細は
図12で説明する。
【0122】
次に、処理イベントグルーピング部251が、クラウド構成情報管理テーブル212に管理されているクラウド構成情報を用いて、S1113で抽出した処理イベントをVM単位にグルーピングして処理イベントグループ管理テーブル253に格納する(S1114)。ステップS1114の処理フローの詳細は
図13で説明する。
【0123】
次に、運用作業特定部252は、処理イベントグループ管理テーブル253にて管理される各処理イベントグループに対して、運用作業マッピングテーブル237を用いて運用作業特定を行い、その結果を運用作業管理テーブル213に格納する(S1115)。ステップS1115の処理フローの詳細は
図13で説明する。
【0124】
最後に、運用作業フロー表示部225は、運用作業管理テーブル213に格納されている運用作業情報について、処理イベントグループ(VM)毎に参照し、時系列順に並び替えたものを描画する(S1116)。以上が全体処理フローの流れである。
【0125】
(処理イベント抽出処理のフロー)
図12は、処理イベント抽出部233における、ログデータからの処理イベント抽出処理のフローを示したものである。処理イベント抽出処理では、ログデータ管理部124からログデータのログ種別を参照し、分析対象ログデータ種に合致するイベント検出情報をログフォーマット管理テーブル243から読み込む(S1211)。
【0126】
次に、ログデータの先頭行から順に、S1211で読み込んだログフォーマット管理テーブル243に定義されている、イベント種特定ログ行検出キー522を含むログ行を検出する(S1221)。
【0127】
検出したログ行について、対象ログ行内の特定のフィールドデータ抽出や、既知の処理イベント種別523との文字列マッチング処理などにより処理イベント種を特定し、ログフォーマット管理テーブル243上に、対象ログ種521、処理イベント種523毎に定義されている、詳細パラメータ検出情報512を読み込む(S1222)。
【0128】
詳細パラメータ検出情報512に定義されている抽出対象パラメータ毎に抽出処理を実行する(S1231−1233)。抽出処理は詳細パラメータ検出情報512に定義されている対象ログファイル526を読み込み、パラメータ抽出処理雛形情報527を用いて実施する。抽出対象のパラメータによっては、S1221で処理イベントの検出を行ったログファイルとは異なるファイルを利用する場合がある(543−544)。
【0129】
抽出した処理イベントは、処理イベント名(S1222)、抽出パラメータ(S1231−S1233で抽出)、時刻情報(S1222の検出ログ行のタイムスタンプなど)を処理イベント管理テーブル236に格納する(S1223)。以上が、処理イベント抽出部233における、ログデータからの処理イベント抽出処理のフローである。
【0130】
(運用作業検出処理のフロー)
図13は、運用作業検出部234における運用作業検出処理フローを示したものである。運用作業検出処理では、クラウド内VM構成情報参照部321が、クラウド構成情報管理テーブル212からVM毎の構成情報テーブル311a−cを取得する(S1311)。
【0131】
次にS1311で取得した構成情報311a−cを1つずつ読み込み、それぞれに対して下記のS1331−S1335の処理を繰り返し実行する(S1321)。
【0132】
VM関連機器ID取得部322は、構成情報311毎に、テーブルエントリを1行読み込む。各行は、対象のVM ID911をもつVMが構成情報有効期間内(912、913)に取っていた構成情報を示している。処理イベントグループ抽出部323は、関連機器接続情報914に定義された機器IDとVM ID911を取得し(S1332)する。
【0133】
処理イベント管理テーブル236に格納されている処理イベントから、構成情報有効期間内(912、913)の実行時間611を持ち、且つ、S1332で取得した機器IDやVM IDを持つ処理イベントを検出する(S1333)。
【0134】
S1333で検出した処理イベントを、S1332で取得したVM IDを処理イベントグループのグループID711と関連付けて処理イベント管理テーブル253に格納する(S1334)。
【0135】
S1332−S1334の処理を全てのテーブルエントリ行に対して実施する(S1335)。
【0136】
次に、運用作業特定部252が、運用作業マッピングテーブル237を読み込み(S1312)、処理イベントグループ参照部332は、処理イベントグループ管理テーブル253から1つの処理イベントグループを参照する(S1341)。
【0137】
S1312で読み込んだ運用作業マッピング情報について、マッピング優先度811が高いものから1つずつ読み込み(S1351)、運用作業マッピング処理部333による、運用作業と処理イベントグループ内の処理イベント列のマッピング処理を行う(S1352)。マッピング処理は、処理イベントグループ内の処理イベント列の中から、各運用作業に対応する処理イベント列814の検出を行う。処理イベント列の検出は例えばBrute forceアルゴリズムの適用により実現するが、この方法に限らず適宜の方法を用いればよい。
【0138】
検出した処理イベント部分列は運用作業識別子と共に、運用作業管理テーブルへ格納する(S1353)。
【0139】
S1352−S1353の処理を、各処理イベントグループに対して、運用作業マッピング情報の優先度順に、マッピング作業を繰り返す(S1354)ことで、処理イベントグループの処理イベント列を運用作業で置換した運用作業情報を得る(S1342)。以上が運用作業検出部234における運用作業検出処理フローである。本実施例では、
図13の運用作業検出処理は、自動生成された
図6の処理イベント管理テーブルの情報に対して行うものとした。他の方法としては、処理イベント管理テーブルの処理イベント種別や処理イベントパラメータを、オペレータが手動で入力したデータを基に処理を行ってもよい。
【0140】
(GUI画面1401)
図14は、運用作業フロー可視化部121が、ユーザ105に対して提示するGUI(Graphical User Interface)画面1401の一例である。GUI画面1401は、例えば、運用作業分析操作部1411、運用作業傾向分析表示部1412、設定情報入力部1413を含む。
【0141】
運用作業分析操作部1411は、運用作業分析の結果として取得した運用作業フローを表示や操作を実行する。
【0142】
運用作業傾向分析表示部1412は、運用作業分析結果に対する運用作業毎の頻度分析などを表示する。また運用作業傾向分析表示部は過去に実施した運用作業分析結果に対する分析処理を提供しても良い。
【0143】
設定情報入力部1413は、ログデータに対する分析処理に利用する設定情報(例えば、ログフォーマット管理テーブル243や運用作業マッピングテーブル237)に対する変更入力を受け付ける機能部であり、変更内容は設定情報編集部221を通じて各テーブルに反映される。分析対象のクラウド環境かログデータファイルを指定し、ログデータ収集及び分析を開始する。
【0144】
運用作業分析操作部1411は、分析対象ログデータ取得情報入力部1421、運用作業フロー表示パネル操作部1422、運用作業フロー表示パネル部1423を有する。
【0145】
分析対象ログデータ取得情報入力部1421は、分析処理に利用するログデータ取得のために、ログ収集部231が接続する他端末接続情報や、ログ受付部232へ渡すログデータのファイルパスを受け付ける機能部である。
【0146】
運用作業フロー表示パネル操作部1422は、運用作業表示パネル1423に表示されたフローチャートの表示内容を操作する。操作内容の例は、運用作業を把握したいVMの指定の有無や、運用作業フローを表示する期間の指定などである。
【0147】
運用作業フロー表示パネル部1423は、分析結果として、運用作業管理テーブル213に管理される運用作業情報をVM ID711毎に参照し、参照した運用作業情報の時刻情報611を基に順序整形フローチャート状に表示する。なお、順序性0は順序性を持たないことを表す。
【0148】
このように、本実施例では情報処理システムで実施された仮想リソースに対する運用作業を特定し表示する管理方法について、情報処理システムは一つ以上のシステムログデータを生成し、システムログデータの指定を入力として、情報処理システム環境における仮想リソースの識別子を含む構成情報に関する1つ以上のパラメータに基づいて、1つ以上の処理イベント情報、または、1つ以上の運用作業情報を特定し、処理イベント情報または運用作業情報を表示することで、作業効率を高めることができる。
【0149】
(データセンタ運用作業のシーケンス図)
図15は、運用作業分析サーバを利用したデータセンタ運用作業の把握により、既存の運用作業状況の振り返りや改善策検討をする一連のシーケンス図である。分析対象のログデータは、データセンタ運用者による日々のクラウド環境の運用作業によって自動的に生成されている。ログデータは、ログデータ収集部231によりネットワーク経由で取得する、あるいは運用作業分析実施者が予めデータセンタ運用者から渡されたログデータをログデータ受付部232に入力することにより、分析処理を行う。分析結果として得られる運用作業フローは、現状の運用作業実施状況を示している。この情報を基に、データセンタ運用者と運用作業分析実施者が、頻繁に実行される運用作業の自動化による運用作業改善策検討などを行う。
【0150】
(運用作業分析サーバ104の装置構成)
図16に、運用作業分析サーバ104の装置構成の例を示す。
図16において、運用作業分析サーバ104は、CPU1621、メモリ1622、補助記憶装置1623を備える一般的な計算機を用いて実現できる。さらに、各装置を構成するそれぞれの機能は、CPUが補助記憶装置に格納されているプログラムを実行することにより、上記計算機上に具現化される。各プログラムは、あらかじめ、上記計算機内の補助記憶装置1623に格納されていてもよい。あるいは、各プログラムは、必要なときにLANインターフェースなどの通信インターフェース1624やメディアインターフェース1625を経由して上記計算機が利用可能な媒体を介し、他の装置から上記記憶装置に導入されてもよい。媒体とは、たとえば、通信媒体(すなわち有線、無線、光などのネットワーク、または当該ネットワークを伝搬する搬送波やディジタル信号)、またはメディアインターフェース1625に着脱可能な外部記憶媒体1613を指す。なお、運用作業分析サーバ104は、入出力装置1626を介してコンソール1633に接続している。
【0151】
この際、外部記憶装置(補助記憶装置)1623は、ネットワーク1631を解して接続される仮想環境接続端末103を介して取得したログデータ211やクラウド構成情報管理テーブル212を始め、運用作業分析過程で利用されるログフォーマット管理テーブル243、処理イベント管理テーブル236、処理イベントグループ管理テーブル253、運用作業マッピングテーブル237を格納する記憶装置として機能する。CPU1621は、運用作業分析で用いられる上述の情報を管理すると共に、運用作業フロー可視化部121、ログデータ分析部122、クラウド構成情報管理部123、ログデータ管理部124を構成するコントローラとして機能する。また、コンソール1633は、コントローラ(CPU1621)の制御対象であって、CPU1621の指示による情報を表示する表示装置として機能する。
【0152】
以上説明した実施例によれば、クラウド環境に対する運用作業に応じて、仮想化ソフトウェアや仮想環境管理サーバにより自動生成されたシステムログデータから、運用作業者が過去に実施した運用作業を特定可能できる。また、特定した運用作業を時系列に表示できるため、クラウド環境に対する運用作業の実態調査を迅速、正確に行える。
【0153】
すなわち、仮想化技術を適用する情報処理システムで実施された仮想リソースの運用作業を管理する管理サーバにおいて、クラウド環境における一つ以上の仮想化ソフトウェアや仮想環境管理サーバが生成したシステムログから、操作に関わる一つ以上の処理イベントを特定することができる。
【0154】
また、仮想化技術を適用する情報処理システムで実施された仮想リソースの運用作業を管理する管理サーバにおいて、操作に関わる一つ以上の処理イベントから、処理イベントのもととなる運用作業を特定することができる。
【0155】
以上の実施例で説明した構成において各サーバは、単体のコンピュータで構成してもよいし、あるいは、入力装置、出力装置、処理装置、記憶装置の任意の部分が、ネットワークで接続された他のコンピュータで構成されてもよい。
【0156】
本実施例中、ソフトウェアで構成した機能と同等の機能は、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)などのハードウェアでも実現できる。そのような態様も本願発明の範囲に含まれる。
【0157】
本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることが可能である。また、各実施例の構成の一部について、他の実施例の構成の追加・削除・置換をすることが可能である。
【0158】
(補足)
本明細書に含まれる発明概念を以下に示す。
【0159】
(発明1)
入力装置、出力装置、処理装置、および記憶装置を有し、情報処理システムのリソースを用いた処理イベントにより実行される運用作業を管理する管理サーバにおいて、
前記記憶装置は、
前記情報処理システムで実行された複数の処理イベントを、当該処理イベントに用いられた前記リソースを識別する識別子等を含むパラメータと対応付けて管理する処理イベント管理情報と、
前記識別子を用いて前記リソース相互の関連性を示す構成情報管理情報を格納し、
前記処理装置は、
前記構成情報管理情報を参照し、前記複数の処理イベントを関連性のある処理イベントごとにグループ分けして、処理イベントグループ管理情報として前記記憶装置に格納する、処理イベントグルーピング部を備える、
管理サーバあるいはそれを用いた管理方法。
【0160】
(発明2)
前記記憶装置は、
前記運用作業に対応して、複数の処理イベントを順序情報とともに格納する運用作業マッピング情報を格納し、
前記処理装置は、
前記運用作業マッピング情報を参照し、処理イベントグループ管理情報の同一グループに属する処理イベントを、異なる前記運用作業に対応付け、運用作業管理情報として前記記憶装置に格納する運用作業特定部を備える、
発明1に記載の管理サーバあるいはそれを用いた管理方法。
【0161】
(発明3)
前記構成情報管理情報は、リソースである仮想リソース間の接続関係情報を含み、
前記処理イベントグルーピング部は、
前記仮想リソース間の接続関係情報に基づき接続関係にある1つ以上の仮想リソースを特定する、
発明2に記載の管理サーバあるいはそれを用いた管理方法。
【0162】
(発明4)
前記仮想リソース間の接続関係情報は、複数の時点における仮想リソース間の接続関係情報を含み、
前記処理イベント管理情報は、各処理イベントの実行時間情報を含み、
前記処理イベントグルーピング部は、さらに、
前記実行時間情報に対する前記仮想リソース間の接続関係情報を特定する、
発明3に記載の管理サーバあるいはそれを用いた管理方法。
【0163】
(発明5)
仮想化技術が適用された情報処理システムで実施された少なくとも仮想マシンを含む仮想リソースに関する運用作業を管理する管理サーバである。この管理サーバは、情報処理システムで実行された1つ以上の処理イベントを管理する処理イベント管理テーブルと、1つ以上の処理イベントと、情報処理システムで実施された運用作業と、を対応付ける運用作業マッピングテーブルと、情報処理システムで実施された運用作業対象の仮想リソースに関するシステム構成情報を備え、処理イベント管理テーブルは、さらに、各処理イベントが処理対象とした仮想リソース識別子を備える。この管理サーバは、処理イベント管理テーブル内の処理イベントに対して、システム構成情報に含まれる1つ以上の仮想リソース識別子と運用作業マッピングテーブルが指定する1つ以上の処理イベントに基づいてマッチング処理を行う運用作業検出部を備え、処理イベントから1つ以上の運用作業を特定する。