(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-19
(45)【発行日】2024-01-29
(54)【発明の名称】監視装置、監視システム及び監視プログラム
(51)【国際特許分類】
G06F 9/455 20180101AFI20240122BHJP
【FI】
G06F9/455
(21)【出願番号】P 2019208092
(22)【出願日】2019-11-18
【審査請求日】2022-09-06
(73)【特許権者】
【識別番号】319011546
【氏名又は名称】株式会社アイ・アイ・エム
(74)【代理人】
【識別番号】100165179
【氏名又は名称】田▲崎▼ 聡
(74)【代理人】
【識別番号】100126664
【氏名又は名称】鈴木 慎吾
(74)【代理人】
【識別番号】100161207
【氏名又は名称】西澤 和純
(72)【発明者】
【氏名】加藤 俊也
(72)【発明者】
【氏名】岩田 知範
(72)【発明者】
【氏名】丹野 直子
【審査官】渡辺 一帆
(56)【参考文献】
【文献】特開2019-075691(JP,A)
【文献】特開2018-101831(JP,A)
【文献】特開2010-271863(JP,A)
【文献】特開2014-182596(JP,A)
【文献】特開2018-194988(JP,A)
【文献】特開2015-207148(JP,A)
【文献】特開2014-153722(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 9/455
(57)【特許請求の範囲】
【請求項1】
仮想統合環境に複数接続されるサーバ機器上で動作する仮想マシンの識別情報を取得する第1の識別情報取得部と、
複数のホストから構成されるコンピュータシステムのうち1つのホストが動作する前記仮想マシンの識別情報を取得する第2の識別情報取得部と、
前記第1の識別情報取得部が取得する識別情報と、前記仮想マシンを示す情報との対応関係を第1の対応関係として記憶する第1の記憶部と、
前記第2の識別情報取得部が取得する識別情報と、前記ホストを示す情報との対応関係を第2の対応関係として記憶する第2の記憶部と、
前記第1の記憶部に記憶される前記第1の対応関係と、前記第2の記憶部に記憶される前記第2の対応関係とを突合し、同一の識別情報を有する前記仮想マシンと前記ホストとを突合済情報として特定する突合部と、
前記突合部が突合した結果特定される突合済情報を出力する出力部と
、
コンピュータシステム内においてやり取りされる情報伝達の実行単位であるトランザクションを識別する情報であり、前記トランザクションの宛先であるアプリケーションを示す宛先情報と前記コンピュータシステム内のホストを識別するホスト情報とを含むトランザクション情報を取得するトランザクション情報取得部と、
前記トランザクション情報に含まれる宛先情報とアプリケーショングループとの対応関係を示すアプリケーショングループ情報を取得するアプリケーショングループ情報取得部と、
前記トランザクション情報に含まれるホスト情報と論理サーバグループとの対応関係を示す論理サーバグループ情報を取得する論理サーバグループ情報取得部と、
前記アプリケーショングループ情報取得部が取得する前記アプリケーショングループ情報と、前記論理サーバグループ情報取得部が取得する前記論理サーバグループ情報とに基づき、前記トランザクション情報取得部が取得する前記トランザクション情報が示すトランザクションの属する前記アプリケーショングループ又は前記論理サーバグループのうち少なくともいずれか一方を判定するグループ判定部とを備え、
前記出力部は、前記グループ判定部が判定する結果を出力する
監視装置。
【請求項2】
前記識別情報とは、UUID(Universally Unique Identification)である
請求項1に記載の監視装置。
【請求項3】
前記第1の識別情報取得部は、所定期間ごとに前記識別情報を取得する
請求項1又は請求項2に記載の監視装置。
【請求項4】
前記第2の識別情報取得部は、前記ホストの起動時に前記識別情報を取得する
請求項1から請求項3のいずれか一項に記載の監視装置。
【請求項5】
前記突合部が突合した結果特定される前記突合済情報を記憶する突合済情報記憶部を更に備え、
前記出力部は、前記突合済情報記憶部に記憶される前記突合済情報を出力する
請求項1から請求項4のいずれか一項に記載の監視装置。
【請求項6】
前記出力部は、
前記ホストの前記識別情報と同一の前記識別情報を有する前記仮想マシンが存在しなかった場合、対応する前記仮想マシンが存在しないことを示す情報を前記対応関係として出力する
請求項1から請求項5のいずれか一項に記載の監視装置。
【請求項7】
請求項1から請求項
6のいずれか一項に記載の監視装置と、
前記仮想統合環境に備えられ、前記第1の識別情報取得部に前記識別情報を提供する第1のエージェントと、
前記ホストに備えられ、前記第2の識別情報取得部に前記識別情報を提供する第2のエージェントと
を備える監視システム。
【請求項8】
コンピュータに
、
仮想統合環境に複数接続されるサーバ機器上で動作する仮想マシンの識別情報を取得する第1の識別情報取得ステップと、
複数のホストから構成されるコンピュータシステムのうち1つのホストが動作する前記仮想マシンの識別情報を取得する第2の識別情報取得ステップと、
前記第1の識別情報取得ステップにより取得された識別情報と前記仮想マシンを示す情報との対応関係と、前記第2の識別情報取得ステップにより取得された識別情報と前記ホストを示す情報との対応関係とを突合し、同一の識別情報を有する前記仮想マシンと前記ホストとを突合済情報として特定する突合ステップと、
前記突合ステップにより突合された結果特定される突合済情報を出力する出力ステップと
、
コンピュータシステム内においてやり取りされる情報伝達の実行単位であるトランザクションを識別する情報であり、前記トランザクションの宛先であるアプリケーションを示す宛先情報と前記コンピュータシステム内のホストを識別するホスト情報とを含むトランザクション情報を取得するトランザクション情報取得ステップと、
前記トランザクション情報に含まれる宛先情報とアプリケーショングループとの対応関係を示すアプリケーショングループ情報を取得するアプリケーショングループ情報取得ステップと、
前記トランザクション情報に含まれるホスト情報と論理サーバグループとの対応関係を示す論理サーバグループ情報を取得する論理サーバグループ情報取得ステップと、
前記アプリケーショングループ情報取得ステップにより取得される前記アプリケーショングループ情報と、前記論理サーバグループ情報取得ステップにより取得される前記論理サーバグループ情報とに基づき、前記トランザクション情報取得ステップが取得する前記トランザクション情報が示すトランザクションの属する前記アプリケーショングループ又は前記論理サーバグループのうち少なくともいずれか一方を判定するグループ判定ステップと
を実行させる監視プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、監視装置、監視システム及び監視プログラムに関する。
【背景技術】
【0002】
従来、コンピュータシステム全体を監視し、評価する方法が知られている。(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
多数のアプリケーションオンラインサービスを提供する分散コンピュータ環境では、多くの物理サーバにおいて仮想技術を利用して構築された仮想マシン上でホストOSが稼動し、それらが、様々な役割を持つ仮想サーバとして構成されている。また、当該アプリケーションが、前記分散コンピュータ環境で実行される。このような複雑なコンピュータシステムの性能管理では、アプリケーションと、その稼働環境としてのサーバ、および物理環境を仮想化してサーバを仮想マシンにホストするインフラの3つの観点での管理が必要とされるが、これらを個別に管理することは容易ではなく、従来では、アプリケーションとサーバ、サーバとインフラの対応関係を構成表などのドキュメント化を通じて人手で管理される運用が行われている。
例えば、このような手法では、アプリケーションや、サーバ、およびインフラの構成変更があるたびにその対応関係を更新しなければならず、時間と手間がかかるという問題が発生していた。
すなわち、従来手法によると、企業システムは、アプリ管理者とサーバ管理者およびインフラ管理者がそれぞれで管理している構成の対応関係を容易に特定することができないという問題があった。
【0005】
本発明は、このような状況に鑑みてなされたものであり、アプリケーションとその稼働環境である論理サーバとの対応関係の特定をしたり、論理サーバを構成するホストとそれを稼働させるインフラ(仮想マシンと物理サーバ)との対応関係の特定をしたり、アプリケーションと論理サーバとインフラとの対応関係の特定をしたりすることを容易にすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の一態様に係る監視装置は、仮想統合環境に複数接続されるサーバ機器上で動作する仮想マシンの識別情報を取得する第1の識別情報取得部と、複数のホストから構成されるコンピュータシステムのうち1つのホストが動作する前記仮想マシンの識別情報を取得する第2の識別情報取得部と、前記第1の識別情報取得部が取得する識別情報と、前記仮想マシンを示す情報との対応関係を第1の対応関係として記憶する第1の記憶部と、前記第2の識別情報取得部が取得する識別情報と、前記ホストを示す情報との対応関係を第2の対応関係として記憶する第2の記憶部と、前記第1の記憶部に記憶される前記第1の対応関係と、前記第2の記憶部に記憶される前記第2の対応関係とを突合し、同一の識別情報を有する前記仮想マシンと前記ホストとを突合済情報として特定する突合部と、前記突合部が突合した結果特定される突合済情報を出力する出力部と、コンピュータシステム内においてやり取りされる情報伝達の実行単位であるトランザクションを識別する情報であり、前記トランザクションの宛先であるアプリケーションを示す宛先情報と前記コンピュータシステム内のホストを識別するホスト情報とを含むトランザクション情報を取得するトランザクション情報取得部と、前記トランザクション情報に含まれる宛先情報とアプリケーショングループとの対応関係を示すアプリケーショングループ情報を取得するアプリケーショングループ情報取得部と、前記トランザクション情報に含まれるホスト情報と論理サーバグループとの対応関係を示す論理サーバグループ情報を取得する論理サーバグループ情報取得部と、前記アプリケーショングループ情報取得部が取得する前記アプリケーショングループ情報と、前記論理サーバグループ情報取得部が取得する前記論理サーバグループ情報とに基づき、前記トランザクション情報取得部が取得する前記トランザクション情報が示すトランザクションの属する前記アプリケーショングループ又は前記論理サーバグループのうち少なくともいずれか一方を判定するグループ判定部とを備え、前記出力部は、前記グループ判定部が判定する結果を出力する。
【0007】
また、本発明の一態様に係る監視装置において、前記識別情報とは、UUID(Universally Unique Identification)である。
【0008】
また、本発明の一態様に係る監視装置において、前記第1の識別情報取得部は、所定期間ごとに前記識別情報を取得する。
【0009】
また、本発明の一態様に係る監視装置において、前記第2の識別情報取得部は、前記ホストの起動時に前記識別情報を取得する。
【0010】
また、本発明の一態様に係る監視装置において、前記突合部が突合した結果特定される前記突合済情報を記憶する突合済情報記憶部を更に備え、前記出力部は、前記突合済情報記憶部に記憶される前記突合済情報を出力する。
【0011】
また、本発明の一態様に係る監視装置において、前記出力部は、前記ホストの前記識別情報と同一の前記識別情報を有する前記仮想マシンが存在しなかった場合、対応する前記仮想マシンが存在しないことを示す情報を前記対応関係として出力する。
【0013】
本発明の一態様に係る監視システムは、上述した監視装置と、前記仮想統合環境に備えられ、前記第1の識別情報取得部に前記識別情報を提供する第1のエージェントと、前記ホストに備えられ、前記第2の識別情報取得部に前記識別情報を提供する第2のエージェントとを備える。
【0014】
本発明の一態様に係る監視プログラムは、コンピュータに、仮想統合環境に複数接続されるサーバ機器上で動作する仮想マシンの識別情報を取得する第1の識別情報取得ステップと、複数のホストから構成されるコンピュータシステムのうち1つのホストが動作する前記仮想マシンの識別情報を取得する第2の識別情報取得ステップと、前記第1の識別情報取得ステップにより取得された識別情報と前記仮想マシンを示す情報との対応関係と、前記第2の識別情報取得ステップにより取得された識別情報と前記ホストを示す情報との対応関係とを突合し、同一の識別情報を有する前記仮想マシンと前記ホストとを突合済情報として特定する突合ステップと、前記突合ステップにより突合された結果特定される突合済情報を出力する出力ステップと、コンピュータシステム内においてやり取りされる情報伝達の実行単位であるトランザクションを識別する情報であり、前記トランザクションの宛先であるアプリケーションを示す宛先情報と前記コンピュータシステム内のホストを識別するホスト情報とを含むトランザクション情報を取得するトランザクション情報取得ステップと、前記トランザクション情報に含まれる宛先情報とアプリケーショングループとの対応関係を示すアプリケーショングループ情報を取得するアプリケーショングループ情報取得ステップと、前記トランザクション情報に含まれるホスト情報と論理サーバグループとの対応関係を示す論理サーバグループ情報を取得する論理サーバグループ情報取得ステップと、前記アプリケーショングループ情報取得ステップにより取得される前記アプリケーショングループ情報と、前記論理サーバグループ情報取得ステップにより取得される前記論理サーバグループ情報とに基づき、前記トランザクション情報取得ステップが取得する前記トランザクション情報が示すトランザクションの属する前記アプリケーショングループ又は前記論理サーバグループのうち少なくともいずれか一方を判定するグループ判定ステップとを実行させる。
【発明の効果】
【0015】
本発明によれば、アプリケーションとその稼働環境である論理サーバとの対応関係の特定をしたり、論理サーバを構成するホストとそれを稼働させるインフラ(仮想マシンと物理サーバ)との対応関係の特定をしたり、アプリケーションと論理サーバとインフラとの対応関係の特定をしたりすることを容易にすることができる。
【図面の簡単な説明】
【0016】
【
図1】実施形態におけるシステム監視装置の概要の一例を示す図である。
【
図2】実施形態におけるシステム監視装置の機能構成の一例を示す図である。
【
図3】実施形態におけるグループの一例を示す図である。
【
図4】実施形態におけるシステム監視装置が備える制御部の機能構成の一例を示す図である。
【
図5】実施形態におけるシステム監視装置の画面構成の一例を示す図である。
【
図6】実施形態におけるトランザクション統計処理動作の一例を示す図である。
【
図7】実施形態におけるグループの統計情報表示動作の一例を示す図である。
【
図8】実施形態におけるシステムの性能を測る指標を比較し、警告を行う動作の一例を示す図である。
【
図9】第2の実施形態における監視対象システムとシステム監視装置の概要の一例を示す図である。
【
図10】第2の実施形態におけるデータセンタの機能構成の一例を示す図である。
【
図11】第2の実施形態における監視システムの構成の一例を示す図である。
【
図12】第2の実施形態における仮想マシン情報記憶部が記憶する仮想マシン情報の一例を示す図である。
【
図13】第2の実施形態におけるホスト情報記憶部が記憶するホスト情報の一例を示す図である。
【
図14】第2の実施形態における突合済情報記憶部が記憶する突合済情報の一例を示す図である。
【
図15】第2の実施形態における仮想マシンの識別情報を取得するタイミングについての一例を示す図である。
【
図16】第2の実施形態におけるホストの識別情報を取得するタイミングについての一例を示す図である。
【
図17】第2の実施形態におけるシステム監視装置の一連の動作の一例を示す図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について、図面を参照しながら説明する。
[システム監視装置1の概要]
図1は、実施形態におけるシステム監視装置の概要の一例を示す図である。
システム監視装置1は、監視対象システム2の監視を行う。この一例において監視とは、監視対象システム2の性能に関する情報をリアルタイムに、または一定時間ごとに計測し、提示することをいう。監視対象システム2の処理能力は、特定のホスト3又は特定のアプリケーション4にかかる負荷が変化することにより、変化する場合がある。
例えば、監視対象システム2の処理能力は、特定のホスト3又は特定のアプリケーション4にかかる負荷が大きくなると、低下することがある。そこでシステム監視装置1は、監視対象システム2にかかる負荷が大きくなることにより処理能力が低下しているホスト3又はアプリケーション4を特定するべく、監視対象システム2を監視する。システム監視装置1を監視装置とも記載する。
【0018】
監視対象システム2は、ホスト3と、アプリケーション4とを備える。
ホスト3は、物理サーバに備えられるアプリケーション4が動作するためのシステムである。1つの物理サーバに対して1つのホスト3が備えられてもよいし、1つの物理サーバに対して複数のホスト3が備えられてもよいし、複数の物理サーバに1つのホスト3が備えられていてもよい。
アプリケーション4は、ホスト3上で動作するプログラム等である。1つのホスト3上で1つのアプリケーション4が動作してもよいし、1つのホスト3上で複数のアプリケーション4が動作してもよいし、複数のホスト3上で1つのアプリケーション4が動作してもよい。
【0019】
この一例でホスト3は、ウェブアプリケーションサーバ(以下、APサーバとする。)、オペレーションシステム(以下、OSとする。)、仮想マシン(以下、VMとする。)、仮想サーバ、物理サーバ、ネットワーク、データベースマネジメントシステム(以下、DBMSとする。)等を含む。
また、この一例でアプリケーション4は、WUI(ウェブユーザーインターフェース)、ウェブアプリケーション、サービスインターフェース、ビジネスロジック、インテグレーションロジック、データベースリソース等を含む。
つまり、この一例で監視対象システム2は、複数の論理サーバであるホスト3とホスト3上で動作する複数のアプリケーション4とを含んで構成される。
【0020】
[システム監視装置1の機能構成]
図2は、実施形態におけるシステム監視装置の機能構成の一例を示す図である。
システム監視装置1は、トランザクション情報取得部100と、グループ判定部200と、制御部300と、出力部400と、操作検出部5とを備える。
【0021】
操作検出部5は、ユーザからの操作を検出するデバイス(不図示)を備えており、ユーザの操作に応じた情報を取得する。ユーザの操作を検出するデバイスには、スイッチ、キーボード、ポインティングデバイス、音声認識デバイスなどが含まれていてもよい。
ここで、ユーザとは、例えばシステム監視装置1を使用する者である。監視対象システム2を使用する事業者の従業員であってもよいし、監視対象システム2のメンテナンスを担当する者であってもよい。
【0022】
トランザクション情報取得部100は、監視対象システム2よりトランザクション情報TXIを取得する。トランザクション情報TXIとは、トランザクションを識別する情報である。トランザクションとは、システム内においてやり取りされる情報伝達の実行単位である。
トランザクション情報TXIは、トランザクションの宛先であるアプリケーションを示す宛先情報を含む。また、トランザクション情報TXIは、複数のホストのうち一のホストを識別するホスト情報を含む。つまりトランザクションとは監視対象システム2内で行われた処理であり、当該処理が行われたホスト3とアプリケーション4を特定する情報を含む。
トランザクション情報取得部100は、監視対象システム2より取得したトランザクション情報TXIを、グループ判定部200及び制御部300に提供する。
【0023】
グループ判定部200は、論理サーバグループ情報取得部210と、論理サーバグループ情報記憶部220と、アプリケーショングループ情報取得部230と、アプリケーショングループ情報記憶部240と、判定部250とを備える。
【0024】
ここでグループとは、監視対象システム2を装置単位や機能単位などに基づき分割した1単位である。この一例でグループには、論理サーバに基づく単位で分割した論理サーバグループと、アプリケーションに基づく単位で分割したアプリケーショングループとがある。
図3は、実施形態におけるグループの一例を示す図である。この図に示した一例において監視対象システム2は、論理サーバごとに分割したサーバV100とサーバV200とを備える。サーバV100は、ホストV110とホストV120とを備える。サーバV200は、ホストV210とホストV220とを備える。このように監視対象システム2は、階層を分けて論理サーバごとにグループ化される。つまり、論理サーバグループ情報VSGIは、複数のホスト情報で構成されるコンピュータシステムを一のグループとして定義した第一の論理サーバグループと、複数の第一の論理サーバグループを一のグループとして定義した第二の論理サーバグループとを備える。
【0025】
また、この図に示した一例において監視対象システム2は、アプリケーションごとに分割したドメインA100とドメインA200とを備える。
ドメインA100は中機能レベルA110と中機能レベルA120とを備える。中機能レベル110は、小機能レベル111を備える。中機能レベル210は、小機能レベルA211と、小機能レベルA212とを備える。このように監視対象システム2は、階層を分けてアプリケーションごとにグループ化される。つまり、アプリケーショングループ情報は、複数の宛先情報を持つコンピュータシステムを一のグループとして定義した第一のアプリケーショングループと、複数の第一のアプリケーショングループを一のグループとして定義した第二のアプリケーショングループと、複数の第二のアプリケーショングループを一のグループとして定義した第三のアプリケーショングループと、複数の第三のアプリケーショングループを一のグループとして定義した第四のアプリケーショングループとを備える。
【0026】
図2に戻り、判定部250は、トランザクション情報取得部100からトランザクション情報TXIを取得し、取得したトランザクション情報TXIを論理サーバグループ情報取得部210及びアプリケーショングループ情報取得部230に提供する。
【0027】
論理サーバグループ情報記憶部220は、ホスト情報と複数のホスト情報を一のグループとして定義した論理サーバグループとの対応関係を示す論理サーバグループ情報を記憶する。つまり論理サーバグループ情報記憶部220は、ホスト情報をグループ化し、それぞれのホスト情報がどのグループに属するかの情報を記憶する。
【0028】
論理サーバグループ情報取得部210は、判定部250から取得するトランザクション情報TXIに基づいて、当該トランザクションが属する論理サーバグループを論理サーバグループ情報記憶部220から取得する。論理サーバグループ情報取得部210は、当該トランザクションが属する論理サーバグループを論理サーバグループ情報VSGIとして判定部250に提供する。
【0029】
アプリケーショングループ情報記憶部240は、宛先情報と複数の宛先情報を一のグループとして定義したアプリケーショングループとの対応関係を示すアプリケーショングループ情報を記憶する。つまり、アプリケーショングループ情報記憶部240は、宛先情報をグループ化し、それぞれの宛先情報がどのグループに属するかの情報を記憶する。
【0030】
アプリケーショングループ情報取得部230は、判定部250から取得するトランザクション情報TXIに基づいて、当該トランザクションが属するアプリケーショングループをアプリケーショングループ情報記憶部240から取得する。アプリケーショングループ情報取得部230は、当該トランザクションが属するアプリケーショングループをアプリケーショングループ情報APGIとして、判定部250に提供する。
【0031】
グループ情報取得部260は論理サーバグループ情報取得部210とアプリケーショングループ情報取得部230とを備える。グループ情報取得部260は宛先情報と複数の宛先情報を一のグループとして定義したアプリケーショングループとの対応関係を示すアプリケーショングループ情報APGIを記憶するアプリケーショングループ情報記憶部240、及びホスト情報と複数のホスト情報を一のグループとして定義した論理サーバグループとの対応関係を示す論理サーバグループ情報VSGIを記憶する論理サーバグループ情報記憶部220のうちの少なくとも一方から、トランザクション情報取得部100が取得するトランザクション情報TXIが属するグループについてのグループ情報を取得する。
【0032】
判定部250は、アプリケーショングループ情報取得部230が取得するアプリケーショングループ情報と、論理サーバグループ情報取得部210が取得する論理サーバグループ情報とに基づき、当該トランザクション(すなわち、トランザクション情報取得部100が取得するトランザクション情報TXIが示すトランザクション)の属するアプリケーショングループ又は論理サーバグループの両方を判定する。
具体的には、判定部250は、トランザクションがどのアプリケーショングループに属するのか、また、該当トランザクションが実行されるホストがどの論理サーバグループに属するのかについて判定する。判定部250によるアプリケーショングループ及び論理サーバグループの判定結果を、総称してグループ判定結果とも称する。
【0033】
なお、判定部250は、アプリケーショングループと論理サーバグループのうち、いずれか一方のみについて判定するようにしてもよい。
判定部250は、当該トランザクションが属する論理サーバグループと、アプリケーショングループとの情報(つまり、グループ判定結果)を、トランザクション情報TXIに付加し、トランザクショングループ情報TXGIとして制御部300に提供する。判定部250は、論理サーバグループ情報取得部210から取得する論理サーバグループ情報VSGI及びアプリケーショングループ情報取得部230から取得するアプリケーショングループ情報APGIを制御部300に提供する。
以下、制御部300の機能構成の詳細について
図4を参照して説明する。
【0034】
[システム監視装置1が備える制御部300の機能構成]
図4は、実施形態におけるシステム監視装置が備える制御部300の機能構成の一例を示す図である。
【0035】
制御部300は、トランザクション情報取得部100よりトランザクション情報TXIを取得し、グループ判定部200より、トランザクショングループ情報TXGIを取得する。また、制御部300は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、警告情報ALIとを出力部400に提供する。
制御部300は、計測部310と、統計部320と、グループ選択情報取得部330と、比較部340と、警告部350と、閾値情報取得部360と表示選択部370とを備える。
【0036】
計測部310は、システムの性能を測る指標を計測する。
システムの性能を測る指標には、トランザクション情報TXIに基づくシステムの性能を測る指標と、トランザクション情報TXIに基づかないシステムの性能を測る指標とがある。
【0037】
トランザクション情報TXIに基づくシステムの性能を測る指標とは、例えば、応答時間、単位時間当たりのトランザクション数(以下、TRX要求件数とする。)等である。
計測部310は、トランザクション情報TXIに基づいて、システムの性能を測る指標を計測する。
具体的には、計測部310は、トランザクション情報取得部100からトランザクション情報TXIを取得する。計測部310は、取得したトランザクション情報TXIが示すトランザクションに基づいて、性能情報SPIを計測する。ここで性能情報SPIとは、システムの性能を測る指標についての情報である。この一例において性能情報SPIとは、応答時間、TRX要求件数等である。
【0038】
トランザクション情報TXIに基づかないシステムの性能を測る指標とは、例えば、OSやミドルウェア(OLTPやDBMS)等の活動やリソース情報に基づくシステムの性能を測る指標である。トランザクション情報TXIに基づかないシステムの性能を測る指標は、例えば、単位時間当たりのOSの単位時間当たりのページングやOLTPのメモリ管理処理等の活動指標であったり、CPU使用率、メモリ使用率等のリソース利用状況指標等である。
【0039】
計測部310は、不図示のリソース情報取得部が監視対象システム2から取得するリソース情報に基づいて、システムの性能を測る指標を計測する。
リソース情報取得部は、監視対象システム2が備えるOS、ミドルウェア、アプリケーション、ソフトウェア等からリソース情報を取得する。
リソース情報は、監視対象システム2が備える物理的リソース及び論理的リソースの使用状況を示す情報を含む。つまり、リソース情報取得部は、監視対象システム2が備えるリソースの使用状況を示す情報を含むリソース情報を取得する。
具体的には、計測部310は、リソース情報取得部からリソース情報を取得する。計測部310は、取得したリソース情報に基づいて、性能情報SPIを計測する。ここで性能情報SPIとは、システムの性能を測る指標についての情報である。この一例において性能情報SPIとは、CPU使用率、メモリ使用率、TPS等である。
計測部310は、計測した性能情報SPIを、比較部340および統計部320に提供する。
【0040】
閾値情報取得部360は、ユーザにより設定されたシステムの性能を測る指標に対する閾値を取得する。
具体的には、閾値情報取得部360は、操作検出部5がユーザの操作を検出することにより、閾値情報THIを取得する。ここで閾値情報THIとは、システムの性能を測る指標に対してユーザが設定する閾値である。閾値情報THIは、システムの性能を測る指標ごとに設定することができる。例えば、応答時間がシステムの性能を測る指標となるシステムの場合、任意の時間を閾値情報THIとして設定することができる。同様に、TRX要求件数、CPU使用率、メモリ使用率等を閾値情報THIとして設定できる。
【0041】
また、グループ毎に閾値情報THIを設定することも可能である。具体的には、閾値情報THIは、宛先、ホスト、アプリケーショングループ又は論理サーバグループ毎に設定可能である。例えば、ある特定のアプリケーションについて監視したい場合、当該アプリケーションに対して閾値情報THIを設定することで、当該アプリケーションの監視をすることができる。
閾値情報取得部360は、比較部340に対して、閾値情報THIを提供する。
【0042】
比較部340は、閾値情報取得部360が取得する閾値と、計測部310が計測するシステムの性能を測る指標とを比較する。
具体的には、比較部340は、閾値情報取得部360より閾値情報THIを、計測部310より性能情報SPIを取得する。比較部340は、取得した閾値情報THIと、性能情報SPIとを比較する。例えばユーザが、監視対象システム2の応答時間について、任意の時間を閾値情報THIとして設定したとする。比較部340は、計測部310が計測する応答時間と、閾値情報取得部360が取得する閾値情報THIを比較する。比較部340は、計測部310により計測される応答時間が、閾値情報取得部360により取得される閾値情報THIの範囲内にある場合、正常状態であると判定する。また、応答時間が閾値情報THIの範囲外にある場合、異常状態であると判定する。つまり比較部340は、計測部310が計測するシステムの性能を測る指標である性能情報SPIに基づき、性能情報SPIが閾値情報THIを超えるか否かの比較を行う。
比較部340は、比較した結果を比較性能情報CPIとして警告部350及び統計部320に提供する。
【0043】
グループ選択情報取得部330は、ユーザにより選択されたグループを操作検出部5から取得する。
【0044】
統計部320は、計測部310が計測するシステムの性能を測る指標についての統計処理を行う。例えば、統計部320は、システムの性能を測る指標についての単位時間ごとの平均値等を求める統計処理を行う。
具体的には、統計部320は、比較部340より比較性能情報CPIを取得し、計測部310より性能情報SPIを取得し、グループ判定部200よりトランザクショングループ情報TXGIを取得する。統計部320は、取得した情報(例えば、比較性能情報CPI、性能情報SPI及びトランザクショングループ情報TXGI)に基づき、統計処理を行う。
【0045】
一例として、統計部320は、性能情報SPIに基づき、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを算出する。
累計性能情報ASPIとは、性能情報SPIについて統計処理を行った結果である。より具体的には、この一例において累計性能情報ASPIとは、X軸に時間を取り、Y軸に性能情報SPIをとった2次元のグラフで表される情報である。
統計後性能情報SSPIとは、性能情報SPIと、比較性能情報CPIとに基づき、統計処理を行った結果である。より具体的には、この一例において統計後性能情報SSPIとは、X軸に時間を取り、Y軸に性能情報SPIが閾値の範囲外にあった回数をとった2次元のグラフで表される情報である。
グループ別統計情報GSPIとは、トランザクショングループ情報TXGIに基づき、グループ毎に性能情報SPIについて統計処理を行った結果である。より具体的には、この一例においてグループ別統計情報GSPIとは、X軸に時間を取り、Y軸に特定のグループの性能情報SPIをとった2次元のグラフで表される情報である。上述した通り、グループには、論理サーバグループ及びアプリケーショングループが存在し、またそれぞれのグループは複数のグループを備えることがある。したがって、グループ別統計情報GSPIは、論理サーバグループ情報記憶部220及びアプリケーショングループ情報記憶部240に記憶されているグループごとに分かれている。つまり統計部320は、グループ判定部200が判定するトランザクショングループ情報TXGIに基づき、トランザクション情報TXIが示すトランザクションについての統計演算を行う。
統計部320は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを表示選択部370に提供する。
【0046】
グループ選択情報取得部330は、操作検出部5がユーザの操作を検出することにより、グループ選択情報SGIを取得する。ここでグループ選択情報SGIとは、ユーザが選択するグループの情報である。ユーザは監視対象システム2に異常が発生していることを発見した場合、その異常を引き起こす異常状態発生箇所の特定を行う。システム監視装置1において、システムの性能を測る指標は、グループごとに表示することが可能である。選択されるグループの一例について、
図3に戻って説明を行う。
例えば監視対象システム2の応答時間が、ユーザが設定する閾値情報THIを超えている状況において、ユーザが異常発生個所の特定を行う場合について説明する。この一例においてユーザは操作検出部5を通じて、サーバV100を選択する。グループ選択情報取得部330はサーバV100が選択されたことをグループ選択情報SGIとして取得し、表示選択部370に提供する。表示選択部370は、ユーザにより選択されたサーバV100の応答時間を出力部400に提供する。もし、サーバV100の応答時間が監視対象システム2の応答時間と同様に閾値情報THIで設定した範囲を超えていた場合、原因はサーバV100にあることが推定される。さらにユーザは、サーバV100を構成するホストV110やホストV120等のグループを選択し、応答時間を確かめることにより、異常発生箇所の特定を行うことが可能となる。
【0047】
またユーザは、操作検出部5を通じて、アプリケーションについても特定する事が可能である。この一例において、監視対象システム2の応答時間が閾値情報THIの範囲外にある場合、異常の発生原因がハードウェアによるものか、ソフトウェアによるものかの判断が難しい場合がある。そこで、ソフトウェアによる異常発生箇所を特定するため、アプリケーションごとのアプリケーショングループを選択することにより、アプリケーションに問題がある場合の異常発生箇所も特定が可能である。この一例においてユーザは操作検出部5を通じて、ドメインA100を選択する。グループ選択情報取得部330はドメインA100が選択されたことをグループ選択情報SGIとして取得し、表示選択部370に提供する。表示選択部370は、ユーザにより選択されたドメインA100の応答時間を出力部400に提示させる。もし、ドメインA100の応答時間が監視対象システム2の応答時間と同様に閾値情報THIで設定した範囲を超えていた場合、原因はドメインA100にあることが推定される。さらにユーザは、ドメインA100を構成するドメインA110やドメインA120等のグループを選択し、応答時間を確かめることにより、異常が発生しているアプリケーションの特定を行うことが可能となる。
つまり、グループ選択情報SGIとは、統計部320が行った統計演算の結果が出力部400から出力されることに応じて選択されるアプリケーショングループまたは論理サーバグループを選択するグループ選択情報である。
グループ選択情報取得部330は、取得したグループ選択情報SGIを、表示選択部370に提供する。
【0048】
表示選択部370は、統計部320が統計処理を行った結果について、出力部400に提供する情報を選択する。
具体的には、表示選択部370は、統計部320より性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを取得し、グループ選択情報取得部330よりグループ選択情報SGIを取得する。表示選択部370は、グループ選択情報SGIに基づき、統計部320が行った統計演算の結果の中から、(前記出力部による)出力対象の統計演算の結果を選択する。表示選択部370は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを提供する。
【0049】
警告部350は、比較部340が比較した結果、システムの性能を測る指標が閾値を超えた場合に、警告を行う。
具体的には、警告部350は、比較部340より比較性能情報CPIを取得する。警告部350は、性能情報SPIが閾値情報THIを超えていた場合に、警告情報ALIを出力部400に提供する。警告部350は、比較性能情報CPIが示す閾値を超えた性能情報SPIの値と、宛先又はホストと、アプリケーショングループ又は論理サーバグループとを、出力部に提示させる。
【0050】
ここで性能情報SPIは、瞬間的に比較性能情報CPIを超える場合がある。ユーザが異常箇所の特定や原因の特定を目的としている場合において、警告の閾値を超えたとしても、その期間が非常に短い場合(例えば、瞬間的なノイズなどの場合)には、システム監視装置1はユーザに対する警告の必要がない場合がある。そこで、警告部350は、性能情報SPIが閾値情報THIを超えている時間が所定の判定時間を超える場合に出力部400に対して警告情報ALIを提供する。
性能情報SPIが閾値情報THIを超えている時間が所定の判定時間を超えるか否かの判定には、時間を測定する方法と、回数を測定する方法とがある。
時間を測定する方法とは、性能情報SPIが閾値情報THIを上回った時点から、性能情報SPIが閾値情報THIを下回った時点までの時間が、所定の判定時間を超えるか否かの判定を行う方法である。警告部350は、性能情報SPIが閾値情報THIを上回っている時間が所定の判定時間を超えた場合に、出力部400に対して警告情報ALIを提供する。
回数を測定する方法とは、所定の時間ごとに性能情報SPIが閾値情報THIを超えているか否かを測定し、性能情報SPIが閾値情報THIを超えた回数が、所定回数に達したか否かの判定を行う方法である。警告部350は、性能情報SPIが閾値情報THIを超えた回数が、所定回数に達した場合に、出力部400に対して警告情報ALIを提供する。
時間を測定する方法と、回数を測定する方法とは、いずれも性能情報SPIが閾値情報THIを超えている時間を測定している。警告部350は、所定の判定時間を超える場合に出力部400に対して警告情報ALIを提供する。
すなわち、警告部350は、瞬間的に性能情報SPIが悪化した場合などのノイズによって警告が行われてしまう頻度を低減することができる。
【0051】
出力部400は、制御部300の表示選択部370より、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIと、警告情報ALIとを取得する。出力部400は、取得した性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIと、警告情報ALIとを、出力する。一例として、出力部400は、性能情報SPIと、累計性能情報ASPIと、警告情報ALIと統計後性能情報SSPIと、グループ別統計情報GSPIとを表示部(不図示)に出力することで、表示させる。表示部は、例えば液晶表示面である。表示部は、画像表示装置であるとして説明するが、これに限られず、プリンタ装置やスピーカ装置などの情報出力装置として構成されていてもよい。
すなわち、出力部400は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIと、警告情報ALIとを出力する。
【0052】
[システム監視装置1の画面構成]
図5は、実施形態におけるシステム監視装置の画面構成の一例を示す図である。この一例では、出力部400は、同図に示すダッシュボード画面D900を、不図示の表示部に表示させる。ダッシュボード画面D900は、累積性能情報画像D100と、性能情報画像D300と、選択情報画像D500とを画面の構成要素として備える。
【0053】
累積性能情報画像D100は、累積平均応答時間表示画像D110と、累積TRX要求件数表示画像D120と、累積CPU使用率表示画像D130とを画面の構成要件として備えている。累積平均応答時間表示画像D110、累積TRX要求件数表示画像D120、及び累積CPU使用率表示画像D130は、累計性能情報ASPIに基づいて表示される。
この一例において累積平均応答時間表示画像D110は、横軸(以後、X軸とする。)に時間を、縦軸(以後、Y軸とする。)に平均応答時間をとっている。つまり累積平均応答時間表示画像D110は、時間ごとの平均応答時間を示している。
累積TRX要求件数表示画像D120は、X軸に時間を、Y軸にTRX要求件数をとっている。つまり、累積TRX要求件数表示画像D120は、時間ごとのTRX要求件数を示している。
累積CPU使用率表示画像D130は、X軸に時間を、Y軸にCPU使用率をとっている。つまり、累積CPU使用率表示画像D130は、時間ごとのCPU使用率を示している。
【0054】
累積平均応答時間表示画像D110、累積TRX要求件数表示画像D120、及び累積CPU使用率表示画像D130は、時間が経過するごとに更新されてもよい。この一例において、X軸は画面左側が古い時点における情報であり、画面右側は新しい時点における情報である。累積平均応答時間表示画像D110、累積TRX要求件数表示画像D120、及び累積CPU使用率表示画像D130は、単位時間経過に伴う更新時において、表示されている値は全体が画面左にシフトし、画面左側の最も古い情報が非表示となる。画面右側の空いた箇所に新しい情報が表示される。つまり、値が時間と共にスクロールすることで、ユーザはシステムの性能を測る指標をリアルタイムに監視することができる。
【0055】
性能情報画像D300は、平均応答時間表示画像D310と、TRX要求件数表示画像D320と、CPU使用率表示画像D330と、メモリ使用率表示画像D340と、TPS表示画像D350とを画面の構成要件として備えている。平均応答時間表示画像D310、TRX要求件数表示画像D320、CPU使用率表示画像D330、メモリ使用率表示画像D340、及びTPS表示画像D350は、性能情報SPIに基づいて表示される。平均応答時間表示画像D310は、応答時間の単位時間当たりの平均値を示している。TRX要求件数表示画像D320は、TRX要求件数の単位時間当たりの平均値を示している。CPU使用率表示画像D330は、CPU使用率の単位時間当たりの平均値を示している。メモリ使用率表示画像D340は、メモリ使用率の単位時間当たりの平均値を示している。TPS表示画像D350は、TPSの単位時間当たりの平均値を示している。単位時間は任意に設定可能である。この一例においての単位時間は、累積性能情報画像D100で示されるX軸の時間と同一の時間を用いている。
【0056】
また別の実施例として、性能情報画像D300は、瞬時値を示してもいい。その場合、累積性能情報画像D100が備える瞬時値計測バーによりどの時点の値を表示するかを決定する。累積平均応答時間表示画像D110は、平均応答時間瞬時値計測バーD111を備えている。平均応答時間瞬時値計測バーD111は、操作検出部5により検出したユーザの操作により、移動される。操作検出部5が検出した操作は、不図示の計測バー操作取得部により取得され、表示選択部370に提供される。表示選択部370は、平均応答時間瞬時値計測バーD111が示す時点の瞬時値を、平均応答時間表示画像D310として、出力部400に出力する。
【0057】
累積平均応答時間表示画像D110と同様に、累積TRX要求件数表示画像D120は、TRX要求件数瞬時値計測バーD121を備えている。表示選択部370は、TRX要求件数瞬時値計測バーD121の操作により検出された時点の瞬時値を、TRX要求件数表示画像D320として、出力部400に出力する。
同様に、累積CPU使用率表示画像D130は、CPU使用率瞬時値計測バーD131を備えている。CPU使用率瞬時値計測バーD131の操作により検出された時点の瞬時値を、CPU使用率表示画像D330として、出力部400に出力する。
【0058】
選択情報画像D500は、応答時間分布画像D510と、サーバグループ別CPU使用率表示画像D520と、アプリ閾値違反件数表示画像D530と、インフラ閾値違反件数表示画像D540とを画面の構成要件として備える。
応答時間分布画像D510は、応答時間の分布を示している。X軸には時間の範囲が示され、Y軸には該当するトランザクションの件数を百分率で表している。応答時間分布画像D510は、累計性能情報ASPIに含まれる情報を使用している。統計部320は、性能情報SPIに含まれる応答時間について統計処理を行い、統計後性能情報SSPIとして表示選択部370に提供する。ユーザは、応答時間分布画像D510により、累積平均応答時間表示画像D110と比較して、より統計的にシステムの性能を監視することができる。
【0059】
サーバグループ別CPU使用率表示画像D520は、グループ別にCPU使用率及びメモリ使用率を表示したものである。グループ選択情報取得部330は、操作検出部5がユーザから取得したグループ選択情報SGIを取得する。グループ選択情報取得部330は表示選択部370にグループ選択情報SGIを提供する。表示選択部370はグループ選択情報SGIに基づき、表示するグループを選択する。表示選択部370は、グループ別統計情報GSPIとして出力部400に出力する。この一例では、論理サーバグループごとにCPU使用率及びメモリ使用率を表示している。グループ選択情報SGIにより選択されているグループは、グループ1、グループ2、及びグループ3である。
アプリ閾値違反件数表示画像D530、及びインフラ閾値違反件数表示画像D540は、閾値情報取得部360が取得した閾値の範囲を、性能情報SPIが超えた場合の件数を表示している。アプリ閾値違反件数表示画像D530は、特定のアプリケーショングループが閾値を超えた件数を示しており、インフラ閾値違反件数表示画像D540は、特定の論理サーバグループが閾値を超えた件数を示している。
【0060】
なお、選択情報画像D500に表示する画像の種類は、不図示のダッシュボード表示情報取得部が操作検出部5からユーザの操作を検出することにより、表示選択部370が選択する。つまり、選択情報画像D500はユーザにより任意で決めることが可能である。
【0061】
[トランザクション統計処理動作の一例]
図6は、実施形態におけるトランザクション統計処理動作の一例を示す図である。
図6を参照して、監視対象システム2からトランザクション情報TXIを取得し、統計処理を行う流れについて説明する。
(ステップS110)トランザクション情報取得部100は、複数のホスト3上で動作する複数のアプリケーション4を含んで構成される監視対象システム2において、やり取りされる情報伝達の実行単位であるトランザクション情報TXIを取得する。ここでトランザクション情報取得部100が取得するトランザクション情報TXIは、複数のホストのうち情報伝達が行われたホストを識別するホスト情報と、情報伝達が行われたアプリケーションを識別する宛先情報とを含む。
トランザクション情報取得部100は、取得したトランザクション情報TXIを計測部310及び判定部250に提供する。
【0062】
(ステップS120)計測部310は、トランザクション情報取得部100からトランザクション情報TXIを取得する。計測部310は、トランザクション情報TXIに基づいて、システムの性能を測る指標を計測する。この一例でシステムの性能を測る指標とは、応答時間、TRX要求件数、CPU使用率、メモリ使用率、TPS等である。システムの性能を測る指標を、性能情報SPIとして統計部320に提供する。
(ステップS130)一方、判定部250はトランザクション情報取得部100からトランザクション情報TXIを取得する。判定部250は、取得したトランザクション情報TXIを論理サーバグループ情報取得部210及びアプリケーショングループ情報取得部230に提供する。
論理サーバグループ情報取得部210は、トランザクション情報TXIに含まれるホスト情報が属するグループの情報について、論理サーバグループ情報記憶部220を検索する。論理サーバグループ情報取得部210は、検索により得たトランザクション情報TXIに含まれるホスト情報が属するグループの情報を、論理サーバグループ情報VSGIとして、判定部250に提供する。
アプリケーショングループ情報取得部230は、トランザクション情報TXIに含まれる宛先情報が属するグループの情報について、アプリケーショングループ情報記憶部240を検索する。アプリケーショングループ情報取得部230は、検索により得たトランザクション情報TXIに含まれる宛先情報が属するグループの情報を、アプリケーショングループ情報APGIとして、判定部に提供する。
判定部250は、論理サーバグループ情報取得部210より論理サーバグループ情報VSGIを取得し、アプリケーショングループ情報取得部230より、アプリケーショングループ情報APGIを取得する。判定部250は、トランザクション情報TXIに論理サーバグループ情報VSGIとアプリケーショングループ情報APGIを付加し、トランザクショングループ情報TXGIとして、統計部320に提供する。
【0063】
(ステップS140)統計部320は、計測部310より性能情報SPIを取得し、判定部250よりトランザクショングループ情報TXGIを取得する。統計部320は取得した情報に基づき、統計処理を行う。この一例において統計部320は、統計処理により、累計性能情報ASPIと、グループ別統計情報GSPIと、統計後性能情報SSPIとを算出する。
累計性能情報ASPIは、性能情報SPIにより示される瞬時値を、積算して得られる情報である。
グループ別統計情報GSPIとは、性能情報SPIとトランザクショングループ情報TXGIに基づき、性能情報SPIにより示される瞬時値を、グループ毎に積算して得られる情報である。
統計後性能情報SSPIとは、上述した統計処理以外により統計処理された情報である。この一例において統計部320は閾値情報取得部360が取得する閾値情報THIに基づいて、閾値で指定された範囲を超える性能情報SPIを積算して得られる情報である。
統計部320は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを表示選択部370に提供する。
【0064】
(ステップS150)表示選択部370は、統計部320より、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを取得する。表示選択部370は取得した情報を出力部400に出力する。
【0065】
[グループ選択動作の一例]
図7は、実施形態におけるグループの統計情報表示動作の一例を示す図である。
図7を参照して、ユーザにより選択されたグループを取得し、選択されたグループのグループ別統計情報GSPIを提示する流れについて説明する。
(ステップS210)統計部320はトランザクショングループ情報TXGIをグループ判定部200から取得し、表示選択部370に提供する。表示選択部370は、トランザクショングループ情報TXGIを出力部400に出力する。
【0066】
(ステップS220)ユーザは、グループ情報をドリルダウンにより、選択することができる。
ここで、ドリルダウンとは、グループを上位の階層から下位の階層に向けて順次(例えば、一階層ずつ)選択していくことをいう。例えば、
図3の例において、ドリルダウンによりグループが選択される流れを説明する。下段に示されるアプリケーショングループを選択されるとする。ユーザによりドメインA100又はドメインA200の選択が行われる。この時点では中機能レベル及び小機能レベルの下位の階層は提示されていない。操作検出部5がドメインA100の選択を検出すると、出力部400は、中機能レベルA110及び中機能レベルA120の提示を行う。この時点では下位の階層である小機能レベルは提示されていない。操作検出部5が中機能レベルA110の選択を検出すると、出力部400は小機能レベルA111を提示する。このように、ユーザはドリルダウンにより階層を一階層ずつ下げてグループを選択していく。
図7に戻り、操作検出部5はユーザによるグループ情報の選択動作を検出し、選択されたグループをグループ選択情報SGIとしてグループ選択情報取得部330に提供する。
【0067】
(ステップS230)表示選択部370は、グループ選択情報取得部330よりグループ選択情報SGIを取得し、統計部320よりグループ別統計情報GSPIを取得する。表示選択部370は、グループ選択情報SGIにより示されたグループのグループ別統計情報GSPIを出力部400に提供する。出力部400はグループ別統計情報GSPIを出力する。
【0068】
[比較・警告動作の一例]
図8は、実施形態におけるシステムの性能を測る指標を比較し、警告を行う動作の一例を示す図である。
(ステップS310)閾値情報取得部360は、操作検出部5により閾値情報THIを取得する。閾値情報取得部360は、取得した閾値情報THIを比較部340に提供する。
(ステップS320)比較部340は、閾値情報取得部360より閾値情報THIを取得し、計測部310より性能情報SPIを取得する。比較部340は取得した閾値情報THIと性能情報SPIとを比較する。
【0069】
(ステップS330)比較部340は、性能情報SPIが閾値情報THIで示される範囲の範囲外である場合、すなわち(ステップS330;YES)の場合、処理をステップS340に進める。比較部340は、性能情報SPIが閾値情報THIで示される範囲の範囲内である場合、すなわち(ステップS330;NO)の場合、処理をステップS320に進める。比較部340は、計測部310から性能情報SPIを取得するたびに、性能情報SPIと閾値情報THIとの比較を行う。
【0070】
(ステップS340)警告部350は、比較部340から、性能情報SPIが閾値情報THIの範囲外にあることを示す、比較性能情報CPIを取得する。警告部350は、警告情報ALIを出力部400に提供する。出力部400は、警告情報ALIを取得すると、警告情報ALIを提示する。
警告情報ALIは、ユーザに対して警告を行うことを目的しているので、手段は問わない。例えばユーザのディスプレイに表示されるポップアップウィンドウのようなものでもよいし、SNMPTrapなどのネットワークを利用したイベント通知でもよいし、音声デバイスによるアナウンスでもよいし、システムを管理する関係者に電子メールが送信されても良い。
【0071】
[第2の実施形態におけるシステム監視装置1の概要]
図17は、第2の実施形態における監視対象システム2とシステム監視装置1の概要の一例を示す図である。
図1と同様の構成については、同様の符号を付して、説明を省略する。
システム監視装置1は、監視対象システム2から識別情報IDを取得する。この一例において、システム監視装置1は、監視対象システム2から識別情報IDを取得することにより、仮想マシンとホスト3との対応関係を特定する。
【0072】
[データセンタD100の概要]
図10は、第2の実施形態におけるデータセンタD100の概要を示す図である。同図に示すデータセンタD100が備える構成をインフラとも記載する。
データセンタD100は、複数の仮想統合環境D200を備える。この一例において、データセンタD100は、仮想統合環境D210と、仮想統合環境D220とを備える。以降の説明において、データセンタD100が備える複数の仮想統合環境を区別しない場合には、仮想統合環境D200と記載する。
仮想統合環境D200は、具体的には、複数のサーバ機器を一元的に管理するサーバ管理ソフトウェアである。例えば、仮想統合環境D210と、仮想統合環境D220とは、同じ種類のサーバ管理ソフトウェアであってもよいし、それぞれ異なる種類のサーバ管理ソフトウェアであってもよい。
【0073】
仮想統合環境D200は、複数のサーバ機器D400を管理する。この一例において、仮想統合環境D210は、サーバ機器D410、サーバ機器D411、サーバ機器D420、サーバ機器D421及びサーバ機器D422を管理する。サーバ機器D410と、サーバ機器D411とは、仮想統合環境D210に接続される。サーバ機器D420と、サーバ機器D421と、サーバ機器D422とは、クラスタ構成となっている。具体的には、仮想統合環境D210にはクラスタD310が接続されている。クラスタD310には、サーバ機器D420と、サーバ機器D421と、サーバ機器D422とが接続されている。
以降、それぞれのクラスタを区別しない場合には、クラスタD300と記載する。それぞれのサーバ機器を区別しない場合には、サーバ機器D400と記載する。
【0074】
サーバ機器D400の環境下では、複数の仮想マシンD500が動作する。例えば、この一例において、仮想マシンD510と、仮想マシンD511とは、サーバ機器410の環境で動作する。以降、それぞれの仮想マシンを区別しない場合には、仮想マシンD500と記載する。
【0075】
仮想マシンD500は、それぞれ固有の識別情報IDを有する。
例えば、識別情報IDとは、UUID(Universally Unique Identification)であってもよい。UUIDとは、時刻やMACアドレス等から生成される128ビットの識別子である。この一例においては、一の仮想マシンD500と、他の仮想マシンD500とを一意に区別するため、仮想マシン同士の識別情報が一致する可能性が極めて小さいUUIDを使用している。しかしながら、本実施形態では、この一例に限定されず、他の識別情報を使用してもよい。
識別情報IDは、仮想マシンD500を一意に識別できる識別情報であればよい。
【0076】
以上説明したデータセンタD100に備えられるインフラは、インフラ上で動作するアプリケーションの概念から構成を説明することもできる。この一例において、データセンタD100に備えられるインフラは、コンピュータシステムC110と、コンピュータシステムC120とから構成される。コンピュータシステムC110と、コンピュータシステム120とは、コンピュータシステムC100の具体例である。
例えば、コンピュータシステムC110は、ホスト3a1と、ホスト3a2と、ホスト3a3とにより論理サーバSV1を構成している。また、コンピュータシステムC110は、ホスト3b1と、ホスト3b2と、ホスト3b3とにより論理サーバSV2を構成している。ホスト3a1からホスト3a3、ホスト3b1からホスト3b3は、ホスト3の具体例である。
【0077】
この一例において、ホスト3は、それぞれ固有の識別情報IDを有する。例えば、識別情報IDとは、UUIDであってもよい。
【0078】
図11は、第2の実施形態におけるシステム監視システム70の構成の一例を示す図である。同図を参照しながら、システム監視装置1の機能構成について説明する。以降、システム監視システム70を監視システムとも記載する。
[システム監視装置1の機能構成]
システム監視装置1は、第1の識別情報取得部10と、第1の記憶部11と、第2の識別情報取得部20と、第2の記憶部21と、突合部30と、出力部40とを備える。
【0079】
第1の識別情報取得部10は、仮想マシンD500の識別情報IDを取得する。仮想マシンD500は、仮想統合環境D200に複数接続されるサーバ機器D400上で動作する。つまり、第1の識別情報取得部10は、仮想統合環境D200に複数接続されるサーバ機器D400上で動作する仮想マシンD500の識別情報IDを取得する。
この場合に、システム監視システム70は、第1のエージェント60を備えることにより、仮想マシンD500の識別情報IDを取得するよう構成してもよい。
【0080】
第1のエージェント60は、仮想統合環境D200に配布される。仮想統合環境D200は、仮想統合環境D200の環境下に備えられる、それぞれの仮想マシンD500の識別情報IDを取得する。第1のエージェント60は、仮想統合環境D200が取得するそれぞれの仮想マシンD500の識別情報IDを取得する。第1のエージェント60は、取得した仮想マシンD500の識別情報IDを、第1の識別情報取得部10に提供する。以降、第1の識別情報取得部10を仮想統合環境側UUID取得部と、第1のエージェント60を仮想統合環境側エージェントとも記載する。
【0081】
第1の識別情報取得部10は、取得した識別情報IDと仮想マシンD500の情報とを、対応付けて、第1の記憶部11に記憶させる。
第1の記憶部11は、第1の識別情報取得部10が取得する識別情報IDと、仮想マシンD500を示す情報との対応関係を、第1の対応関係I1として記憶する。以降、第1の対応関係I1を、仮想マシン情報とも記載する。
【0082】
図12は、第2の実施形態における仮想マシン情報記憶部が記憶する仮想マシン情報の一例を示す図である。第1の記憶部11には、仮想マシン名とUUIDとが対応付けられて記憶されている。一例として、第1の記憶部11には、仮想マシン名について“VM-0001”と、UUIDについて“UUID-1001”とが対応付けられて、第1の対応関係I1として記憶されている。以降、第1の記憶部11を仮想マシン情報記憶部とも記載する。
【0083】
図11に戻り、第2の識別情報取得部20は、ホスト3の識別情報IDを取得する。コンピュータシステムC100は、複数のホスト3から構成される。また、ホスト3は、仮想マシンD500上で動作する。つまり、第2の識別情報取得部20は、複数のホスト3から構成されるコンピュータシステムのうち1つのホスト3が動作する仮想マシンD500の識別情報IDを取得する。以降、ホスト3が動作する仮想マシンD500の識別情報IDを、ホスト3の識別情報IDとも記載する。
この場合に、システム監視システム70は、第2のエージェント61を備えることにより、ホスト3の識別情報IDを取得するよう構成してもよい。
【0084】
第2のエージェント61は、それぞれのホスト3に配布される。第2のエージェント61は、それぞれのホスト3に配布されるため、自身が配布されたホスト3の識別情報IDを取得することができる。第2のエージェント61は、取得したホスト3の識別情報IDを、第2の識別情報取得部20に提供する。以降、第2の識別情報取得部20をホスト側UUID取得部と、第2のエージェント61をホスト側エージェントとも記載する。
【0085】
第2の識別情報取得部20は、取得した識別情報IDとホスト3の情報を、対応付けて、第2の記憶部21に記憶させる。
第2の記憶部21は、第2の識別情報取得部20が取得する識別情報IDと、ホスト3を示す情報との対応関係を、第2の対応関係I2として記憶する。以降、第2の対応関係I2を、ホスト情報とも記載する。
【0086】
図13は、第2の実施形態におけるホスト情報記憶部が記憶するホスト情報の一例を示す図である。第2の記憶部21には、ホスト名とUUIDとが対応付けられて記憶されている。一例として、第2の記憶部21には、ホスト名について“Host-0001”と、UUIDについて“UUID-1001”とが対応付けられて、第2の対応関係I2として記憶されている。以降、第2の記憶部21をホスト情報記憶部とも記載する。
【0087】
突合部30は、第1の記憶部11に記憶される第1の対応関係I1と、第2の記憶部21に記憶される第2の対応関係I2とを突合し、同一の識別情報IDを有する仮想マシンD500とホスト3とを突合済情報I3として特定する。
突合部30は、突合済情報I3を出力部40に提供する。
【0088】
出力部40は、突合部30から突合部30が突合した結果特定される突合済情報I3を取得する。出力部40は、取得した突合済情報I3を出力する。
なお、この一例において、システム監視システム70は、表示部50を備えていてもよい。システム監視システム70が、表示部50を備える場合、出力部40は、表示部50に突合済情報I3を出力する。
【0089】
なお、システム監視装置1は、突合済情報記憶部31を備えていてもよい。その場合、突合部30は、第1の記憶部11に記憶される第1の対応関係I1と、第2の記憶部21に記憶される第2の対応関係I2とを突合し、突合した結果を突合済情報I3として突合済情報記憶部31に記憶させる。
突合済情報記憶部31は、突合部30が突合した結果特定される突合済情報I3を記憶する。この場合、出力部40は、突合済情報記憶部31に記憶される突合済情報I3を出力するよう構成してもよい。
【0090】
図14は、第2の実施形態における突合済情報記憶部31が記憶する突合済情報I3の一例を示す図である。突合済情報記憶部31には、UUIDと、仮想マシン名と、ホスト名とが、対応付けられて記憶されている。一例として、突合済情報記憶部31には、UUIDについて“UUID-1001”と、仮想マシン名について“VM-0001”と、ホスト名について“Host-0001”とが対応付けられて、突合済情報I3として記憶されている。この場合、仮想マシン名“VM-0001”に示される仮想マシンD500と、ホスト名“Host-0001”に示されるホスト3とは、同一のサーバ機器D400上で動作していると特定される。
【0091】
一方、突合済情報記憶部31には、UUIDについて“UUID-1004”と、仮想マシン名について“-”と、ホスト名について“Host-0004”とが対応付けられて、突合済情報I3として記憶されている。この場合、ホスト名“Host-0004”は、対応する仮想マシンD500が特定されないため、ホスト名“Host-0004”が物理マシン上で動作している場合や、管理対象外のサーバである場合等が考えられる。
このように、ホスト名“Host-0004”に対応する仮想マシンD500が特定されない場合、出力部40は、対応する仮想マシンD500が存在しないことを示す情報を出力する。
このように、ホスト3の識別情報IDと同一の識別情報IDを有する仮想マシンD500が存在しなかった場合、出力部40は、対応する仮想マシンD500が存在しないことを示す情報を出力するよう構成してもよい。
【0092】
第1の識別情報取得部10及び第2の識別情報取得部20が、識別情報IDを取得するタイミングについて、
図15及び
図16を参照しながら説明する。
[識別情報IDを取得するタイミング]
図15は、第2の実施形態における第1の識別情報取得部10が仮想マシンD500の識別情報IDを取得するタイミングについての一例を示す図である。同図には、仮想マシンD500の状態と、仮想マシンD500の識別情報IDと、第1の記憶部11に記憶される識別情報IDとを、横軸を時間として示す。同図において、“仮想マシンの状態”は、仮想マシンD500が起動状態であるか停止状態であるかを、“仮想マシンのUUID”は、仮想マシンD500が有する識別情報IDの値を、“仮想マシン情報記憶部のUUID”は、第1の記憶部11に記憶される識別情報IDを示す。
【0093】
例えば、第1のエージェント60が仮想統合環境D200に配布される場合、第1のエージェント60は、仮想統合環境D200の環境下に存在するそれぞれの仮想マシンD500の識別情報IDを取得する。
この場合、第1の識別情報取得部10は、仮想統合環境D200が仮想マシンD500の識別情報IDを取得する周期に合わせて、所定期間ごとに識別情報IDを取得するよう構成してもよい。ここで言う識別情報IDを取得する周期とは、例えば
図15に示す周期T1である。
図15に示す一例では、第1のエージェント60は、時刻ta1、ta2、ta3及びta4において、仮想統合環境D200の環境下に存在するそれぞれの仮想マシンD500の識別情報IDを取得する。なお、この場合における第1のエージェント60が仮想マシンD500の識別情報IDを取得する周期T1は、例えば、5分から10分に設定してもよい。
【0094】
同図に示す一例では、仮想マシンD500の状態は、時刻t11以前において、“起動”状態である。仮想マシンD500の識別情報IDは、時刻t11以前において、“UUID11”である。
仮想マシンD500の状態は、時刻t11において、“起動”状態から“停止”状態に切り替わる。この一例において、時刻t11から時刻t12の間に、仮想マシンD500の入れ替え作業が行われる。仮想マシンD500の入れ替え作業とは、例えば、仮想マシンD500が接続されるサーバ機器D400を変更する作業である。
同図は、仮想マシンD500が入れ替えされる際に再作成された場合を示している。仮想マシンD500の再作成をした場合には、新たなUUIDが発行される。仮想マシンD500の再作成とは、サーバ機器D400仮想マシンD500を削除し、再度同名の仮想マシンD500を作成する場合である。仮想マシンD500の再作成がされると、仮想マシンD500の識別情報IDは変更される。なお、仮想マシンが再作成されず、単に停止、起動された場合にはUUIDは変更されない。また、本実施形態では仮想マシンが入れ替えされる際に再作成される場合について説明したが、これに限られず、仮想マシンが再作成された場合には都度新たなUUIDが発行される。
【0095】
仮想マシンD500の状態は、時刻t12において、“停止”状態から“起動”状態に切り替わる。仮想マシンD500の識別情報IDは、時刻t12において仮想マシンD500が起動される際、“UUID12”に変更されている。
第1のエージェント60が時刻ta4において取得する仮想マシンD500の識別情報IDは、“UUID12”である。第1のエージェント60は、時刻ta4において、仮想マシンD500の識別情報IDである“UUID12”を、第1の識別情報取得部10に提供する。第1の識別情報取得部10は、第1のエージェント60から、仮想マシンD500の識別情報IDである“UUID12”を取得し、第1の記憶部11に記憶させる。
したがって、第1の記憶部11に記憶される識別情報IDは、時刻ta4において、“UUID11”から“UUID12”に変更される。
【0096】
なお、その他の一例として、仮想統合環境D200が仮想マシンD500の識別情報IDが変更したことを検出する場合、第1のエージェント60は、仮想マシンD500の識別情報IDが変更する毎に第1の識別情報取得部10に識別情報IDを提供するよう構成してもよい。
【0097】
図16は、第2の実施形態における第2の識別情報取得部20がホスト3の識別情報IDを取得するタイミングについての一例を示す図である。同図には、ホスト3の状態と、ホスト3の識別情報IDと、第2の記憶部21に記憶される識別情報IDとを、横軸を時間として示す。同図において、“ホストの状態”は、ホスト3が起動状態であるか停止状態であるかを、“ホストのUUID”は、ホスト3が有する識別情報IDの値を、“ホスト情報記憶部のUUID”は、第2の記憶部21に記憶される識別情報IDを示す。
なお、同図においても
図15の場合と同様に、仮想マシンD500が入れ替えされる際に再作成された場合を示している。
【0098】
ホスト3は、仮想マシンD500の上で動作する。したがって、ホスト3の識別情報IDと仮想マシンD500の識別情報IDとの組み合わせが変更される場合には、ホスト3が再起動される。したがって、第2のエージェント61は、ホスト3の起動時に識別情報IDを取得するよう構成してもよい。その場合、第2の識別情報取得部20は、ホスト3の起動時に識別情報IDを取得する。
図16に示す一例では、第2のエージェント61は、ホスト3の起動時である時刻t22において、識別情報IDを取得する。
【0099】
同図に示す一例では、ホスト3の状態は、時刻t21以前において、“起動”状態である。ホスト3の識別情報IDは、時刻t21以前において、“UUID21”である。
ホスト3の状態は、時刻t21において、“起動”状態から“停止”状態に切り替わる。この一例において、時刻t21から時刻t22の間に、ホスト3の入れ替え作業が行われる。ホスト3の入れ替え作業とは、例えば、ホスト3がインストールされる仮想マシンD500を入れ替える作業である。
ここで、ホスト3を削除し、再度別の仮想マシンD500上に同名のホスト3を作成する場合には、ホスト3がインストールされる仮想マシンD500が変更されるため、ホスト3の識別情報IDは変更される。
【0100】
ホスト3の状態は、時刻t22において、“停止”状態から“起動”状態に切り替わる。ホスト3の識別情報IDは、時刻t22において起動される際、“UUID22”に変更されている。
第2のエージェント61は、ホスト3が再起動される時刻t22において、ホスト3の識別情報IDを取得する。時刻t22において、第2のエージェント61が取得するホスト3の識別情報IDは、“UUID22”である。第2のエージェント61は、時刻t22において、ホスト3の識別情報IDである“UUID22”を、第2の識別情報取得部20に提供する。第2の識別情報取得部20は、第2のエージェント61から、仮想マシンD500の識別情報IDである“UUID22”を取得し、第2の記憶部21に記憶させる。
したがって、第2の記憶部21に記憶される識別情報IDは、時刻22において、“UUID21”から“UUID22”に変更される。
【0101】
図17は、第2の実施形態におけるシステム監視装置1の一連の動作の一例を示す図である。システム監視装置1が行う一連の動作について、同図を参照しながら説明する。
[システム監視装置1が行う一連の動作]
(ステップS10)第1の識別情報取得部10は、仮想マシンD500の識別情報IDを取得する。なお、上述したように、第1の識別情報取得部10は、所定時間ごとに識別情報IDを取得するよう構成してもよい。
(ステップS20)第2の識別情報取得部20は、ホスト3の識別情報IDを取得する。なお、上述したように、第2の識別情報取得部20は、ホスト3の起動時に識別情報IDを取得するよう構成してもよい。
【0102】
(ステップS30)突合部30は、仮想マシンD500の識別情報IDと、ホスト3の識別情報IDとを突合する。具体的には、突合部30は、第1の記憶部11に記憶される仮想マシンD500の識別情報IDと、第2の記憶部21に記憶されるホスト3の識別情報IDとを突合するよう構成してもよい。
(ステップS40)突合部30は、突合の結果、仮想マシンD500の識別情報IDと、ホスト3の識別情報IDとが一致した場合(ステップS40;YES)には、ホスト3と同一の識別情報IDを有する仮想マシンD500が存在するとして、処理をステップS50に進める。
突合部30は、突合の結果、仮想マシンD500の識別情報IDと、ホスト3の識別情報IDとが一致しない場合(ステップS40;NO)には、ホスト3と同一の識別情報IDを有する仮想マシンD500が存在しないとして、処理をステップS60に進める。
【0103】
(ステップS50)出力部40は、仮想マシンD500とホスト3との対応を示す情報を出力して、処理を終了する。
(ステップS60)出力部40は、ホスト3と対応する仮想マシンD500が存在しないことを示す情報を出力して、処理を終了する。なお、この場合に、出力部40は、対応する仮想マシンD500が存在しないホスト3は、物理マシン上で動作していることを示す情報を出力するよう構成してもよい。
【0104】
[実施形態の効果のまとめ]
以上説明したように、本実施形態のシステム監視装置1は、第1の識別情報取得部10と、第2の識別情報取得部20とを備えることにより、仮想統合環境D500及びホスト3の双方から識別情報IDを取得する。突合部30は、双方の識別情報IDを突合することにより、仮想マシンD500と、ホスト3との関係を特定する。
したがって、本実施形態のシステム監視装置1によれば、仮想マシンD500と、ホスト3との関係を容易に特定することができる。
【0105】
また、上述した実施形態によれば、記識別情報IDとは、UUIDである。システム監視装置1は、UUIDにより、それぞれ仮想マシンD500及びそれぞれのホスト3を識別する。UUIDは、仮想マシン同士の識別情報が一致する可能性が極めて小さいため、他の仮想マシン同士を一意に区別することができる。
したがって、本実施形態のシステム監視装置1によれば、仮想マシンD500と、ホスト3との関係を一意に特定する事ができる。
【0106】
また、上述した実施形態によれば、第1の識別情報取得部10は、所定期間ごとに識別情報IDを取得する。
第1の識別情報取得部10は、所定期間ごとに識別情報IDを取得することにより、仮想統合環境D200の環境下で動作するそれぞれの仮想マシンD500の識別情報IDを一括して取得することができる。
【0107】
また、上述した実施形態によれば、第2の識別情報取得部20は、ホスト3の起動時に識別情報IDを取得する。
ホスト3は、仮想マシンD500の上で動作するため、ホスト3の識別情報IDと仮想マシンD500の識別情報IDとの組み合わせが変更される場合には、ホスト3が再起動される。つまり、ホスト3の識別情報IDと仮想マシンD500の識別情報IDとの組み合わせが変更される機会は、ホスト3が再起動される場合のみであるため、ホスト3が再起動される場合のみを検知できればよい。
したがって、第2の識別情報取得部20は、ホスト3の起動時にホスト3の識別情報IDを取得することにより、識別情報IDを取得する回数を減らすことができる。
【0108】
また、上述した実施形態によれば、システム監視装置1は、第1の記憶部11に記憶される仮想マシン情報と、第2の記憶部21に記憶されるホスト情報とを突合した結果である突合済情報I3を記憶する突合済情報記憶部31を更に備える。
システム監視装置1は、突合済情報記憶部31を備えることにより、仮想マシンD500とホスト3との組み合わせを記憶する。したがって、本実施形態のシステム監視装置1によれば、仮想マシンD500とホスト3との組み合わせが変わったことを検知することができる。
【0109】
また、上述した実施形態によれば、出力部40は、ホスト3の識別情報IDと、同一の識別情報IDを有する仮想マシンD500が存在しなかった場合、対応する仮想マシンD500が存在しないことを示す情報を対応関係として出力する。
ここで、仮想マシンD500上で動作していないホスト3は、物理マシン上で動作している可能性がある。したがって、本実施形態のシステム監視装置1によれば、ホスト3と対応する仮想マシンD500が存在しないことを示す情報を出力することにより、物理マシン上で動作しているホスト3を特定することができる。
【0110】
また、上述した実施形態によれば、システム監視装置1は、トランザクション情報取得部100と、アプリケーショングループ情報取得部230と、論理サーバグループ情報取得部220と、グループ判定部200とを更に備える。
グループ判定部200は、取得されたトランザクション情報TXIのアプリケーショングループと、論理サーバグループとの少なくとも一方を判定することにより、アプリケーションとその稼働環境である論理サーバとの対応関係の特定をすることができる。
また、システム監視装置1は、突合部30を備えることにより、仮想マシンD500と、ホスト3との関係を特定することができる。したがって、本実施形態のシステム監視装置1によれば、論理サーバを構成するホストとそれを稼働させるインフラ(仮想マシンと物理サーバ)との対応関係の特定をすることができる。
よって、システム監視装置1は、アプリケーションと論理サーバとインフラとの対応関係の特定をすることができる。
【0111】
また、上述した実施形態によれば、システム監視システム70は、第1のエージェント60と、第2のエージェント61とを備える。第1のエージェント60は、仮想マシンD500に配布され、仮想統合環境D200の環境下で動作する仮想マシンD500の識別情報IDを第1の識別情報取得部10に提供する。第2のエージェント61は、ホスト3に配布され、ホスト3の識別情報IDを第2の識別情報取得部20に提供する。
システム監視システム70は、第1のエージェント60と、第2のエージェント61とを備える構成とすることにより、仮想統合環境D200に接続されるサーバ機器D400、クラスタD300又は仮想マシンD500の構成が変化した場合にも、容易に対応することができる。
【0112】
なお、上述した実施形態におけるシステム監視装置1が備える各部の機能の全体あるいはその機能の一部は、これらの機能を実現するためのプログラムをコンピュータにより読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0113】
また、「コンピュータにより読み取り可能な記録媒体」とは、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶部のことをいう。さらに、「コンピュータにより読み取り可能な記録媒体」とは、インターネット等のネットワークを介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0114】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の趣旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0115】
1…システム監視装置、2…監視対象システム、3…ホスト、4…アプリケーション、5…操作検出部、100…トランザクション情報取得部、200…グループ判定部、300…制御部、400…出力部、210…論理サーバグループ情報取得部、220…論理サーバグループ情報記憶部、230…アプリケーショングループ情報取得部、240…アプリケーショングループ情報記憶部、250…判定部、310…計測部、320…統計部、330…グループ選択情報取得部、340…比較部、350…警告部、360…閾値情報取得部、370…表示選択部、TXI…トランザクション情報、TXGI…トランザクショングループ情報、VSGI…論理サーバグループ情報、APGI…アプリケーショングループ情報、SGI…グループ選択情報、SPI…性能情報、SSPI…統計後性能情報、THI…閾値情報、CPI…比較性能情報、ALI…警告情報、10…第1の識別情報取得部、11…第1の記憶部、20…第2の識別情報取得部、21…第2の記憶部、30…突合部、31…突合済情報記憶部、40…出力部、50…表示部、60…第1のエージェント、61…第2のエージェント、70…システム監視システム、ID…識別情報