(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-08
(45)【発行日】2024-05-16
(54)【発明の名称】ログレベル調整装置、ログレベル調整方法及びプログラム
(51)【国際特許分類】
G06F 11/34 20060101AFI20240509BHJP
G06F 11/30 20060101ALI20240509BHJP
【FI】
G06F11/34 176
G06F11/30 140A
G06F11/30 172
(21)【出願番号】P 2020040625
(22)【出願日】2020-03-10
【審査請求日】2023-02-03
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】谷岡 凌
【審査官】武田 広太郎
(56)【参考文献】
【文献】特開2010-182030(JP,A)
【文献】特開2000-069122(JP,A)
【文献】特開2012-064103(JP,A)
【文献】中国特許出願公開第109918260(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/34
G06F 11/30
H04L 41/00
(57)【特許請求の範囲】
【請求項1】
エラーが発生したことを示すエラー情報を複数の被監視装置から受信する受信部と、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出する集計部と、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出する算出部と、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する制御部と、を備えるログレベル調整装置。
【請求項2】
前記複数の構成要素から所定数の第1構成要素を選択する選択部をさらに備え、
前記算出部は、前記所定数の第1構成要素に含まれる要素値に対する前記算出されたエラー数に基づいて、前記第1優先度を算出する、請求項1に記載のログレベル調整装置。
【請求項3】
前記算出部は、前記算出されたエラー数に基づいて、前記所定数の第1構成要素に含まれる要素値毎に第1重み係数を算出し、前記算出された第1重み係数と、前記システム構成情報とに基づいて、前記第1優先度を算出する、請求項2に記載のログレベル調整装置。
【請求項4】
前記算出部は、前記算出されたエラー数に基づいて、前記所定数の第1構成要素の各々に対して第2重み係数を算出し、前記算出されたエラー数と、前記算出された第2重み係数とに基づいて、前記第1重み係数を算出する、請求項3に記載のログレベル調整装置。
【請求項5】
前記算出部は、前記所定数の第1構成要素の各々について、前記算出されたエラー数の平均値及び最大値に基づいて、前記第2重み係数を算出する、請求項4に記載のログレベル調整装置。
【請求項6】
前記算出部は、前記所定数の第1構成要素の各々について、前記算出されたエラー数を各要素とするベクトルの単位ベクトルと、前記算出された第2重み係数とに基づいて、前記第1重み係数を算出する、請求項4又は5に記載のログレベル調整装置。
【請求項7】
前記選択部は、前記算出されたエラー数に基づいて、前記所定数の第1構成要素の各々に対して第2優先度を算出し、前記算出された
第2優先度に基づいて、前記複数の構成要素から前記第1構成要素を選択する、請求項2~6のいずれか1項に記載のログレベル調整装置。
【請求項8】
前記制御部は、前記複数の被監視装置のログファイルを保存する記憶装置の保存容量と、ログレベル毎のログ情報と、前記算出された第1優先度とに基づいて、前記複数の被監視装置のログレベルを変更する、請求項1~7のいずれか1項に記載のログレベル調整装置。
【請求項9】
エラーが発生したことを示すエラー情報を複数の被監視装置から受信し、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出し、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出し、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する、ログレベル調整装置におけるログレベル調整方法。
【請求項10】
エラーが発生したことを示すエラー情報を複数の被監視装置から受信し、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出し、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出し、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する、処理をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ログレベル調整装置、ログレベル調整方法及びプログラムに関する。
【背景技術】
【0002】
業務システム等の情報処理システムにおいて、例えば、業務データのバックアップ処理で障害等のエラーが発生した場合、情報システム内のサーバ装置が出力するログを用いて、エラー原因を特定し、エラーを解消することが一般的に行われている。
【0003】
エラー原因を特定する技術として、情報処理システム内の複数の被監視装置の情報に基づいてエラー要因を特定する技術が知られている(例えば、特許文献1及び2)。特許文献1には、サーバ運用管理装置が、被監視サーバの稼働状況、各種の運用情報についての性能指標値を収集し、性能指標値と、各モデルデータとの比較結果に基づいて、複数の性能指標のうち異常な性能指標を検出することが開示されている。特許文献2には、システム障害要因特定支援装置が、システムを構成する各ノードの複数の要素に対する状態値が異常であるか否かに基づいて、障害発生要因となっている要素を特定することが開示されている。
【0004】
ところで、サーバ装置は、出力されるログの詳細度が異なる複数のログレベルを調整可能に構成されており、ログレベルが高ければ高いほど、詳細なログが取得できる。一方、ログレベルが高ければ高いほど、出力されるログのデータ出力量も大きくなる。そのため、情報処理システムの管理者又は運用者は、サーバ装置が正常に動作している場合、当該サーバ装置のログレベルを低く設定して、ログのデータ出力量が膨大になることを抑制する。一方、情報処理システムの管理者又は運用者は、エラーが発生したサーバ装置、又はエラーが発生する傾向が現れてきたサーバ装置に対して、ログレベルを正常動作時よりも高く設定する。
【0005】
情報処理システムの管理者又は運用者が、情報処理システム内の各サーバ装置のログレベルを調整する場合、ログレベルを調整するために相当な稼働がとられてしまう。そのため、情報処理システム内のサーバ装置のログレベルを自動的に制御する技術が検討されている(例えば、特許文献3)。特許文献3には、ログ収集サーバが、ある端末からエラーログを収集したことをトリガとして、当該端末のログレベルを上げるように制御することが開示されている。
【先行技術文献】
【特許文献】
【0006】
【文献】国際公開第2011/083687号
【文献】特開2000-305914号公報
【文献】国際公開第2013/161522号
【発明の概要】
【発明が解決しようとする課題】
【0007】
一般的に、サーバ装置がログを出力するログ出力処理は高負荷な処理であることに加えて、出力されるログのデータ出力量も非常に大きい。特許文献1及び2のように、情報システム内の全てのサーバ装置から各種情報を収集してエラー原因を分析すると、情報処理システム内のネットワーク等のリソース消費量が高くなってしまうため好ましくない。
【0008】
また、特許文献3に開示された技術では、ログ収集サーバは、各端末からエラーログが収集された場合に、各端末のログレベルを調整する。そのため、特許文献3に開示された技術を用いた場合、情報処理システム内の全てのサーバのログレベルが上がってしまう可能性がある。
【0009】
情報処理システム内において発生した障害を特定する場合、障害を特定するために必要なログは、障害が発生したサーバ、及び当該サーバに関連するサーバが出力したログであることが多い。情報処理システム内の全てのサーバのログレベルが正常運用時よりも高く設定されてしまうと、情報処理システム内のリソースが多く使用されてしまい、余剰なリソースが使用されてしまう虞がある。さらに、発生した障害の再現性が低く、いつ再発するか分からないような障害の場合には、全てのサーバに対して詳細なログを出力し続けてしまう虞がある。
【0010】
本開示の目的の1つは、上述した課題を鑑み、情報処理システム内のリソース消費量を抑制することが可能なログレベル調整装置、ログレベル調整方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0011】
本開示にかかるログレベル調整装置は、
エラーが発生したことを示すエラー情報を複数の被監視装置から受信する受信部と、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出する集計部と、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出する算出部と、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する制御部と、を備える。
【0012】
本開示にかかるログレベル調整方法は、
エラーが発生したことを示すエラー情報を複数の被監視装置から受信し、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出し、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出し、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する、ログレベル調整装置におけるログレベル調整方法である。
【0013】
本開示にかかるプログラムは、
エラーが発生したことを示すエラー情報を複数の被監視装置から受信し、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出し、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出し、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する、処理をコンピュータに実行させるプログラムである。
【発明の効果】
【0014】
本開示によれば、情報処理システム内のリソース消費量を抑制することが可能なログレベル調整装置、ログレベル調整方法及びプログラムを提供できる。
【図面の簡単な説明】
【0015】
【
図1】実施の形態1にかかるログレベル調整装置の構成例を示す図である。
【
図2】実施の形態2にかかる情報処理システムの構成例を示す図である。
【
図3】システム構成管理テーブルの一例を示す図である。
【
図7】実施の形態2にかかるサーバ装置の動作例を示すフローチャートである。
【
図8】実施の形態2にかかるログレベル調整装置の動作例を示すフローチャートである。
【
図9】実施の形態2にかかるログレベル調整装置の動作例を示すフローチャートである。
【
図10】実施の形態2の効果を説明するための図である。
【
図11】実施の形態2の効果を説明するための図である。
【
図12】実施の形態2の効果を説明するための図である。
【
図13】実施の形態3にかかる情報処理システムの構成例を示す図である。
【
図15】実施の形態3にかかるログレベル調整装置の動作例を示すフローチャートである。
【
図16】本開示の各実施の形態にかかるログレベル調整装置等のハードウェア構成を例示するブロック図である。
【発明を実施するための形態】
【0016】
以下、図面を参照して本開示の実施の形態について説明する。なお、以下の記載及び図面は、説明の明確化のため、適宜、省略及び簡略化がなされている。また、以下の各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
【0017】
(実施の形態1)
図1を用いて、実施の形態1にかかるログレベル調整装置1の構成例について説明する。
図1は、実施の形態1にかかるログレベル調整装置の構成例を示す図である。ログレベル調整装置1は、ネットワークを介して接続される複数の被監視装置(不図示)のログレベルを制御する装置である。ログレベル調整装置1は、受信部2と、集計部3と、算出部4と、制御部5とを備える。
【0018】
受信部2は、複数の被監視装置においてエラーが発生した場合、エラーが発生したことを示すエラー情報を複数の被監視装置から受信する。
【0019】
集計部3は、複数の被監視装置から受信されたエラー情報と、複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、複数の構成要素に含まれる要素値毎に、単位装置当たりのエラー数を算出する。単位装置当たりのエラー数は、各要素値に一致する要素値を有する被監視装置から受信したエラー情報数を、各要素値に一致する要素値を有する被監視装置の数で除算した値である。
【0020】
複数の構成要素は、例えば、被監視装置にインストールされたOS(Operation System)、被監視装置にインストールされたソフトウェアのソフトウェアバージョン、被監視装置にインストールされたソフトウェアのソフトウェア種類を含んでもよい。複数の構成要素は、例えば、被監視装置にセキュリティパッチが適用されているか否かを示すセキュリティパッチ適用情報、被監視装置が所属するドメイン、被監視装置の機種、被監視装置のメモリサイズを含んでもよい。
【0021】
算出部4は、算出されたエラー数と、システム構成情報とに基づいて、複数の被監視装置の第1優先度を算出する。第1優先度は、ログレベルの変更が必要な優先度を示すログレベル変更優先度である。
【0022】
制御部5は、算出された第1優先度に基づいて、複数の被監視装置のログレベルを制御する。
【0023】
ログレベル調整装置1は、上記構成を有するため、エラーが発生したことを示すエラー情報に基づいて、第1優先度を算出し、第1優先度に基づいて複数の被監視装置のログレベルを制御する。特許文献1~3に開示された技術では、被監視装置から各種情報を収集する必要があるため、情報処理システム内のリソース消費量が高くなってしまう可能性がある。これに対して、ログレベル調整装置1は、エラーが発生したことを示すエラー情報を複数の被監視装置から受信することでログレベルの調整を行うことができる。したがって、実施の形態1にかかるログレベル調整装置1によれば、報処理システム内のリソース消費量を抑制できる。
【0024】
(実施の形態2)
続いて、実施の形態2について説明する。実施の形態2は、実施の形態1を具体的にした実施の形態である。
【0025】
<情報処理システムの構成例>
図2を用いて、実施の形態2にかかる情報処理システム100の構成例について説明する。
図2は、実施の形態2にかかる情報処理システムの構成例を示す図である。情報処理システム100は、サーバ装置10_1~10_N(N:2以上の整数)と、ログレベル調整装置20とを備える。なお、サーバ装置10_1~10_Nを総称して、単にサーバ装置10と記載することがある。
【0026】
サーバ装置10_1~10_Nは、ネットワークを介して、ログレベル調整装置20と接続及び通信可能に構成される。サーバ装置10_1~10_Nは、ログレベル調整装置20に監視される被監視対象装置である。サーバ装置10_1~10_Nはそれぞれ同様の構成をしている。
【0027】
サーバ装置10_1~10_Nは、それぞれ自装置においてエラーが発生した場合、エラーが発生したことを示すエラー情報をログレベル調整装置20に送信する。サーバ装置10_1~10_Nは、ログレベル調整装置20からログレベルの変更を要求する変更命令を受信した場合、変更命令に応じて、自装置のログレベルを変更する。
【0028】
ログレベル調整装置20は、実施の形態1のログレベル調整装置1に対応する。ログレベル調整装置20は、サーバ装置10_1~10_Nの監視を行う監視装置である。ログレベル調整装置20は、ネットワークを介して、サーバ装置10_1~10_Nと接続及び通信可能に構成される。ログレベル調整装置20は、エラー情報をサーバ装置10_1~10_Nから受信する。
【0029】
ログレベル調整装置20は、サーバ装置10_1~10_Nを構成する複数の構成要素の要素値に関するシステム構成情報を記憶する。複数の構成要素は、サーバ装置10_1~10_NにインストールされたOS、サーバ装置10_1~10_Nにインストールされたソフトウェアのソフトウェアバージョンを含んでもよい。複数の構成要素は、サーバ装置10_1~10_Nにインストールされたソフトウェアのソフトウェア種類を含んでもよい。複数の構成要素は、サーバ装置10_1~10_Nにセキュリティパッチが適用されているか否かを示すセキュリティパッチ適用情報、サーバ装置10_1~10_Nが所属するドメイン名を含んでもよい。複数の構成要素は、サーバ装置10_1~10_Nの機種、サーバ装置10_1~10_Nのメモリサイズを含んでもよい。なお、以降の説明では、複数の構成要素は、OS、ソフトウェアバージョン、ソフトウェア種類、セキュリティパッチ適用情報、ドメイン、機種、及びメモリサイズであるとして説明する。
【0030】
要素値は、各構成要素に関する情報である。例えば、構成要素が「OS」である場合、構成要素「OS」の要素値は、「Windows7」、「Windows8」及び「RHEL6.5」等が挙げられる。「Windows7」、「Windows8」及び「RHEL6.5」のそれぞれが、構成要素が「OS」の要素値となる。なお、要素値は、属性値又は構成値と称されてもよい。
【0031】
システム構成情報は、サーバ装置10_1~10_Nの複数の構成要素の要素値に関する情報である。サーバ装置10_1~10_Nの各々についての複数の構成要素の要素値に関する情報をサーバ構成情報と定義すると、システム構成情報は、サーバ装置10_1~10_Nのサーバ構成情報をまとめた情報として定義できる。
【0032】
ログレベル調整装置20は、サーバ装置10_1~10_Nから受信したエラー情報と、システム構成情報とに基づいて、サーバ装置10_1~10_Nのログレベルを決定する。ログレベル調整装置20は、サーバ装置10_1~10_Nに対して、決定したログレベルに調整することを要求する変更命令を送信することにより、サーバ装置10_1~10_Nのログレベルを制御する。
【0033】
<サーバ装置の構成例>
次に、サーバ装置10の構成例について説明する。サーバ装置10_1~10_Nは同様の構成をしている。サーバ装置10_1は、ジョブ実行部11と、ログ格納部12と、エラー情報送信部13と、ログレベル変更部14とを備える。
【0034】
ジョブ実行部11は、サーバ装置10において実行される任意のソフトウェアアプリケーションのジョブを実行する。ジョブ実行部11は、ジョブを実行する場合、実行状況を記録した実行ログを生成し出力する。ジョブ実行部11は、出力した実行ログをログ格納部12に格納する。ジョブ実行部11は、実行しているジョブの実行結果を判定する。ジョブ実行部11は、実行しているジョブが正常終了した場合、ジョブの実行を継続する。一方、ジョブ実行部11は、実行しているジョブが正常終了しなかった場合、エラーが発生したことを示すエラー情報を生成する。ジョブ実行部11は、生成したエラー情報をログレベル調整装置20に送信するエラー情報送信命令をエラー情報送信部13に出力する。エラー情報は、サーバ装置名、エラーが発生したジョブの実行日時等を含む。
【0035】
ログ格納部12は、ジョブ実行部11が出力した実行ログを格納する。
エラー情報送信部13は、エラー情報送信命令に応じて、ジョブ実行部11が生成したエラー情報をログレベル調整装置20に送信する。
【0036】
ログレベル変更部14は、ログレベルの変更を要求する変更命令をログレベル調整装置20から受信する。変更命令は、ログレベル調整装置20が決定したログレベルを含むことができる。ログレベル変更部14は、変更命令に応じて、ジョブ実行部11のログレベルを変更する。ログレベル変更部14は、例えば、変更命令を待ち受けるタイマを発行し、当該タイマが満了するまでに変更命令を受信しなかった場合、ログレベルを正常運用時のログレベルに変更する。
【0037】
<ログレベル調整装置の構成例>
次に、ログレベル調整装置20の構成例について説明する。ログレベル調整装置20は、エラー情報受信部21と、選択部22と、集計部23と、記憶部24と、算出部25と、ログレベル制御部26と、変更命令送信部27と、エラー測定部28とを備える。
【0038】
エラー情報受信部21は、実施の形態1における受信部2に対応する。エラー情報受信部21は、サーバ装置10_1~10_Nからエラー情報を受信する。エラー情報受信部21は、受信したエラー情報を集計部23及びエラー測定部28に転送する。
【0039】
選択部22は、選択処理を実行し、複数の構成要素から所定数の構成要素を選択する。選択部22は、ログレベル調整装置20が起動した直後である場合、選択処理により、複数の構成要素からランダムに所定数の構成要素を選択する。また、選択部22は、所定数の構成要素が選択されている場合、選択処理により、新たに所定数の構成要素を再選択する。選択処理の詳細については後述する。
【0040】
集計部23は、実施の形態1における集計部3に対応する。集計部23は、サーバ装置10_1~10_Nから受信したエラー情報と、システム構成情報が管理されたシステム構成管理テーブルT1とを用いて、選択された各構成要素に含まれる要素値毎にエラー数をカウントする。集計部23は、エラー情報を受信したサーバ装置が有している要素値をシステム構成管理テーブルT1から取得し、取得された要素値のそれぞれのエラー数をインクリメントする。集計部23は、選択された各構成要素に含まれる要素値毎のエラー数をエラー集計テーブルT2に設定する。
【0041】
集計部23は、システム構成管理テーブルT1を用いて、選択部22が選択した各構成要素に含まれる要素値毎にサーバ装置数をカウントして、カウントしたサーバ装置数をエラー集計テーブルT2に設定する。集計部23は、システム構成管理テーブルT1に設定された要素値のそれぞれに対して、カウント対象の要素値を有するサーバ装置をカウントすることにより、要素値毎にサーバ装置数をカウントする。
【0042】
集計部23は、カウントしたエラー数と、サーバ装置数とに基づいて、選択部22が選択した各構成要素に含まれる要素値毎に、単位装置当たりのエラー数を算出する。集計部23は、算出した単位装置当たりのエラー数をエラー集計テーブルT2に設定する。なお、後述する算出部25が、単位装置当たりのエラー数を算出してもよい。
【0043】
ここで、
図3及び
図4を用いて、システム構成管理テーブルT1、及びエラー集計テーブルT2について説明する。
図3を用いて、システム構成情報を管理するシステム構成管理テーブルT1について説明する。
図3は、システム構成管理テーブルの一例を示す図である。システム構成管理テーブルT1は、システム構成情報を管理するテーブルであり、後述する記憶部24のシステム構成管理DB(Database)241に格納される。システム構成情報は、上述したように、情報処理システム100に含まれるサーバ装置10_1~10_Nのサーバ構成情報を含む。
【0044】
図3に示すように、システム構成管理テーブルT1は、サーバ装置10_1~10_Nに割り当てられたホスト名と、複数の構成要素の各々の要素値とが設定される。
図3の各行(各レコード)は、サーバ装置10_1~10_Nのそれぞれのサーバ構成情報に対応する。システム構成管理テーブルT1は、各サーバ構成情報について、ホスト名と、OSと、ソフトウェアバージョンと、ソフトウェア種類と、セキュリティパッチ適用情報と、ドメインと、機種、及びメモリサイズが設定される。
【0045】
ホスト名には、サーバ装置10_1~10_Nのそれぞれを特定する名称が設定される。
OSには、サーバ装置10_1~10_NのそれぞれにインストールされたOSが設定される。
図3において、「Windows7」、「Windows8」及び「RHEL6.5」のそれぞれが、構成要素「OS」の要素値である。
【0046】
ソフトウェアバージョンには、サーバ装置10_1~10_Nのそれぞれにインストールされたソフトウェアのソフトウェアバージョンが設定される。
【0047】
ソフトウェア種類には、サーバ装置10_1~10_Nのソフトウェアのソフトウェア種類が設定される。例えば、サーバ装置10_1には、クライアントとして動作するソフトウェアがインストールされているとすると、ソフトウェア種類は、「クライアント」となる。例えば、サーバ装置10_Nには、マスターとして動作するソフトウェアがインストールされているとすると、ソフトウェア種類は、「マスター」となる。
【0048】
セキュリティパッチ適用情報には、サーバ装置10_1~10_Nにセキュリティパッチが適用されているか否かが設定される。
ドメインには、サーバ装置10_1~10_Nが所属するドメイン名が設定される。
【0049】
機種には、サーバ装置10_1~10_Nの機種を特定する情報が設定される。
メモリサイズには、サーバ装置10_1~10_Nのメモリサイズが設定される。
【0050】
次に、
図4を用いて、エラー集計テーブルT2について説明する。
図4は、エラー集計テーブルの一例を示す図である。エラー集計テーブルT2は、集計部23が、選択部22が選択した構成要素に含まれる要素値毎にカウントしたエラー数を設定するテーブルであり、後述する記憶部24のエラー集計DB242に格納される。
【0051】
図4に示すように、エラー集計テーブルT2には、構成要素、要素値、マシン数、エラー数、単位装置当たりのエラー数が設定される。
【0052】
構成要素には、選択部22が選択した構成要素が設定される。
図4は、選択部22は、複数の構成要素から、OS、ソフトウェア種類、ソフトウェアバージョン、及びセキュリティパッチ適用情報を選択した場合の一例を示している。そのため、エラー集計テーブルT2の構成要素には、OS、ソフトウェア種類、ソフトウェアバージョン、及びセキュリティパッチ適用情報が設定されている。
【0053】
要素値には、選択部22が選択した構成要素として取り得る値が設定される。要素値には、システム構成管理テーブルT1において、選択部22が選択した構成要素に含まれる要素値が設定される。例えば、構成要素「OS」であれば、システム構成管理テーブルT1のOS列に含まれる要素値が設定される。具体的には、システム構成管理テーブルT1のOS列に「Windows7」、「Windows8」、及び「RHEL6.5」が設定されているとする。この場合、エラー集計テーブルT2の構成要素「OS」の要素値には、「Windows7」、「Windows8」、及び「RHEL6.5」が設定される。
【0054】
マシン数には、エラー集計テーブルT2に設定された要素値と一致する要素値を有するサーバ装置の数が設定される。例えば、「Windows7」を要素値として有するサーバ装置が10台あれば、集計部23は、要素値「Windows7」のサーバ装置の数を10とカウントし、エラー集計テーブルT2のマシン数に10を設定する。
【0055】
エラー数には、エラー集計テーブルT2の要素値と一致する要素値を有するサーバ装置から受信したエラー情報数が設定される。例えば、エラー情報受信部21が、「Windows7」を要素値として有するサーバ装置からエラー情報を受信した場合、集計部23は、エラー集計テーブルT2の要素値「Windows7」のエラー数を1加算してエラー集計テーブルT2を更新する。
【0056】
単位装置当たりのエラー数には、単位サーバ装置数あたりのエラー数が設定され、エラー集計テーブルT2のエラー数をマシン数で除算した値が設定される。
【0057】
次に、
図3及び
図4を参照して、エラー数のカウントする計数処理の具体例について説明する。例えば、ホスト名が「client001a」であるサーバ装置においてエラーが発生し、エラー情報受信部21は、ホスト名が「client001a」であるサーバ装置からエラー情報を受信したとする。集計部23は、エラー集計テーブルT2に設定された構成要素を確認する。
図4のように、エラー集計テーブルT2に設定された構成要素が、OS、ソフトウェア種類、ソフトウェアバージョン、及びセキュリティパッチ適用情報であったとする。集計部23は、システム構成管理テーブルT1を参照して、ホスト名が「client001a」であるサーバ装置のサーバ構成情報から、構成要素「OS」、「ソフトウェア種類」、「ソフトウェアバージョン」、及び「セキュリティパッチ適用情報」の要素値を確認する。
【0058】
システム構成管理テーブルT1が
図3のように設定されているとすると、集計部23は、ホスト名が「client001a」であるサーバ装置の構成要素「OS」の要素値として「Windows7」を取得する。同様に、集計部23は、構成要素「ソフトウェア種類」の要素値として「クライアント」を取得し、構成要素「ソフトウェアバージョン」の要素値として「8.1」を取得し、構成要素「セキュリティパッチ適用情報」の要素値として「パッチ未適用」を取得する。
【0059】
集計部23は、構成要素「OS」の要素値「Windows7」に対してエラー数を1加算する。集計部23は、構成要素「ソフトウェア種類」の要素値「クライアント」に対してエラー数を1加算する。集計部23は、構成要素「ソフトウェアバージョン」の要素値「8.1」に対してエラー数を1加算する。集計部23は、構成要素「セキュリティパッチ適用情報」の要素値「パッチ未適用」に対してエラー数を1加算する。
【0060】
図2に戻り、記憶部24について説明する。記憶部24は、システム構成管理DB241と、エラー集計DB242とを記憶する。記憶部24は、ログレベル調整装置20の各機能ブロックが行う処理で用いられる各種情報を記憶する。システム構成管理DB241は、システム構成管理テーブルT1を管理する。エラー集計DB242は、エラー集計テーブルT2を管理する。
【0061】
算出部25は、実施の形態1における算出部4に対応する。算出部25は、集計部23が算出した要素値毎の単位装置当たりのエラー数と、システム構成情報とに基づいて、サーバ装置10_1~10_Nのログレベル変更優先度を算出する。算出部25は、以下に示す算出処理を実行することにより、サーバ装置10_1~10_Nのログレベル変更優先度を算出する。
【0062】
<算出部の算出処理>
算出部25が行う算出処理について説明する。まず、算出処理において使用する変数を定義する。なお、定義する変数は、以降の説明においても使用される。
【0063】
サーバ装置10_1~10_Nのうち、あるサーバ装置のログレベル変更優先度をPとする。nは、エラー集計テーブルT2に設定された構成要素の番号を示す変数とする。なお、n=1~(選択部22が選択した構成要素の数)である。
図4に示すエラー集計テーブルT2であれば、n=1が構成要素「OS」を特定する番号であり、n=2が構成要素「ソフトウェア種類」を特定する番号と定義できる。また、n=3が構成要素「ソフトウェアバージョン」を特定する番号であり、n=4が構成要素「セキュリティパッチ適用情報」を特定する番号と定義できる。なお、便宜的に説明を行うために、「選択部22が選択した構成要素の数」を単に「選択構成要素数」として記載することがある。
【0064】
エラー集計テーブルT2の各構成要素の各要素値に対して重み付けを行うために、重みベクトルanを導入(定義)する。重みベクトルanは、n番目の構成要素について、要素値単位の重み係数を要素とするベクトルである。例えば、重みベクトルa1の場合、構成要素「OS」の要素値「Windows7」、「Windows8」及び「RHEL6.5」のそれぞれの重み係数を要素とするベクトルである。
【0065】
また、重みベクトルanを用いて計算が行えるように、要素値ベクトルxnを導入(定義)する。要素値ベクトルxnは、サーバ装置10_1~10_Nのうち、あるサーバ装置のn番目の構成要素に対する値を示すベクトルである。あるサーバ装置の構成要素「OS」の要素値が「Windows7」であったとすると、要素値ベクトルx1は、「Windows7」に対応する要素の値に1が設定され、その他の要素に0が設定される。
【0066】
次に、算出部25が行う算出処理について説明する。
算出部25は、エラー集計テーブルT2に設定された各構成要素について、単位装置当たりのエラー数の平均値を算出し、単位装置当たりのエラー数の最大数を決定する。算出部25は、決定した最大値と算出した平均値との差分を、各構成要素についての構成要素単位の重み係数として決定する。
【0067】
算出部25は、各構成要素について、当該構成要素に含まれる要素値毎の単位装置当たりのエラー数を各要素とするベクトルの単位ベクトルに、構成要素単位の重み係数を乗算して、重みベクトルanを算出する。ここで、単位装置当たりのエラー数の最大値と平均値との差分は、単位装置当たりのエラー数のばらつき度合いを表しているとも言える。そのため、構成要素単位の重み係数は、単位装置当たりのエラー数のばらつき度合いに基づく重み係数と言える。算出部25は、各構成要素についての単位装置当たりのエラー数のばらつき度合いに基づいて、重みベクトルanを算出すると言える。
【0068】
このように、算出部25は、各構成要素について、単位装置当たりのエラー数のばらつき度合いを構成要素単位の重み係数として、重みベクトルanを算出する。そのため、各構成要素について、単位装置当たりのエラー数に偏りがある場合、最大値と平均値との差分が大きくなり、重みベクトルanの各要素の値が大きな値をとり、ログレベル変更優先度Pへの寄与が大きくなる。一方、差分が小さい場合、つまり、各構成要素について、単位装置当たりのエラー数が均等である場合、重みベクトルanの各要素の値が小さくなり、ログレベル変更優先度Pへの寄与が小さくなる。
【0069】
算出部25は、重みベクトルanと、システム構成情報とに基づいて、サーバ装置10_1~10_Nのログレベル変更優先度Pを算出する。具体的には、算出部25は、各構成要素に含まれる要素毎の重み係数と、システム構成情報とに基づいて、サーバ装置10_1~10_Nのログレベル変更優先度Pを算出する。
【0070】
ログレベル変更優先度Pを式で表すと、式(1)のように表すことができる。算出部25は、式(1)を用いて、サーバ装置10_1~10_Nのログレベル変更優先度を算出する。
【数1】
【0071】
次に、
図4を用いて、算出部25の算出処理の具体例について説明する。なお、集計部23が要素値毎に、単位装置当たりのエラー数を算出し、エラー集計テーブルT2が
図4のようになっていることを前提として説明する。また、構成要素「OS」の重みベクトルをa
1、構成要素「ソフトウェア種類」の重みベクトルをa
2、構成要素「ソフトウェアバージョン」の重みベクトルをa
3、構成要素「セキュリティパッチ適用情報」の重みベクトルをa
4として説明する。なお、算出処理において、算出部25は、計算過程では小数第2位を四捨五入して計算し、最終結果を、小数第3位を四捨五入して算出することとして説明する。
【0072】
算出部25は、各構成要素について、要素値毎の単位装置当たりのエラー数の平均値を算出し、最大値を決定する。算出部25は、各構成要素について、決定した最大値と算出した平均値との差分を算出して、構成要素単位の重み係数を算出する。
【0073】
構成要素「OS」の場合、要素値「Windows7」の単位装置当たりのエラー数は4であり、要素値「Windows8」の単位装置当たりのエラー数は3.5であり、要素値「RHEL6.5」の単位装置当たりのエラー数は2.5である。算出部25は、構成要素「OS」について、単位装置当たりのエラー数の平均値を、(4+3.5+2.5)/3=3.33と算出する。また、算出部25は、構成要素「OS」について、単位装置当たりのエラー数の最大値を要素値「Windows7」の4と決定する。算出部25は、構成要素「OS」について、決定した最大値と算出した平均値との差分を4-3.3=0.66と算出する。算出部25は、算出した差分である0.66を構成要素「OS」の構成要素単位の重み係数とする。
【0074】
次に、算出部25は、構成要素「OS」について、重みベクトルa
1を算出する。算出部25は、構成要素単位の重み係数である0.66に、構成要素「OS」に含まれる各要素値の単位装置当たりのエラー数を各要素とするベクトルの単位ベクトルに乗算して重みベクトルa
1を算出する。算出部25は、以下の計算を行うことにより、重みベクトルa
1を算出する。
【数2】
なお、重みベクトルa
1の各要素は、上から順に、要素値「Windows7」、「Windows8」、「RHEL6.5」に対応する。つまり、重みベクトルa
1の各要素は、要素値「Windows7」の要素値単位の重み係数、要素値「Windows8」の要素値単位の重み係数、要素値「RHEL6.5」の要素値単位の重み係数となる。
【0075】
算出部25は、同様に、重みベクトルa
2~a
4を以下の計算を行うことにより算出する。なお、重みベクトルa
2~a
4の各要素の順番は、
図4のエラー集計テーブルT2において、重みベクトルa
2~a
4に対応する構成要素に含まれる要素値の設定順に対応する。
【数3】
【0076】
次に、算出部25は、サーバ装置10_1~10_Nの各々について、各構成要素の重みベクトルanと、各構成要素の要素値ベクトルxnとに基づいて、ログレベル変更優先度Pを算出する。
【0077】
サーバ装置10_1~10_Nのうち、ホスト名が「client001a」であるサーバ装置のログレベル変更優先度Pを算出する場合、構成要素「OS」の要素値は「Windows7」である。そのため、要素値ベクトルx
1は、
【数4】
と表すことができる。同様に、要素値ベクトルx
2、x
3及びx
4はそれぞれ、
【数5】
と表すことができる。
【0078】
また、サーバ装置10_1~10_Nのうち、ホスト名が「servera」であるサーバ装置の場合、要素値ベクトルx
1~x
4はそれぞれ、
【数6】
と表すことができる。
【0079】
構成要素「OS」で要素値「Windows7」の要素値単位の重み係数は0.45、構成要素「ソフトウェア種類」で要素値「クライアント」の要素値単位の重み係数は0.15である。また、構成要素「ソフトウェアバージョン」で要素値「8.1」の要素値単位の重み係数は0.26、構成要素「セキュリティパッチ適用情報」で要素値「未適用」の要素値単位の重み係数は0.19である。そのため、算出部25は、ホスト名が「client001a」であるサーバ装置について、各構成要素及び各要素値単位の重み係数を加算して、ログレベル変更優先度Pを1.05と算出する。
【0080】
算出部25は、同様に、ホスト名が「servera」であるサーバ装置について、当該サーバ装置が有する要素値単位の重み係数を加算して、ログレベル変更優先度Pを0.45+0.13+0.26+0.19=1.03と算出する。算出部25は、その他のサーバ装置についても同様に、ログレベル変更優先度Pを算出する。
【0081】
図2に戻り、ログレベル制御部26について説明する。ログレベル制御部26は、実施の形態1における制御部5に対応する。ログレベル制御部26は、サーバ装置10_1~10_Nのそれぞれに対して、算出部25が算出したログレベル変更優先度Pに基づいて、サーバ装置10_1~10_Nのそれぞれのログレベルを制御する。
【0082】
ログレベル制御部26は、サーバ装置10_1~10_Nのそれぞれに対して算出されたログレベル変更優先度Pの高い方から順に所定数のサーバ装置を、ログレベルを変更するサーバ装置として選択する。
【0083】
ログレベル制御部26は、選択したサーバ装置のリストを作成する。ログレベル制御部26は、リストに含まれるサーバ装置に対して、ログレベルを最高レベルに変更することを要求する変更命令を作成する。なお、ログレベル制御部26は、リストに含まれるサーバ装置のログレベルを最高レベルとせずに、ログレベルを変更しないサーバ装置のログレベルより高くするようにしてもよい。
【0084】
ログレベル制御部26は、変更命令送信部27を介して、作成したリストに含まれるサーバ装置の各々に変更命令を送信することにより、変更命令を送信したサーバ装置のログレベルを制御する。ログレベル制御部26は、作成したリストを変更命令送信部27及びエラー測定部28に送信し、作成した変更命令を変更命令送信部27に送信する。
【0085】
変更命令送信部27は、ログレベルを最高レベルに変更することを要求する変更命令をログレベル制御部26が作成したリストに含まれるサーバ装置の各々に送信する。
【0086】
エラー測定部28は、選択部22の選択処理において、ログレベル制御部26が作成したリストと、サーバ装置10_1~10_Nから受信したエラー情報と、システム構成情報とに基づいて、エラー数及びサーバ装置数を測定(カウント)する。
【0087】
<選択部の選択処理>
ここで、
図5及び
図6を用いて、選択部22が実行する選択処理について説明しつつ、エラー測定部28の構成について説明する。
図5及び
図6は、選択処理を説明するための図である。
【0088】
選択部22は、ログレベル調整装置20が起動した直後であり、所定数の構成要素が選択されていない場合、複数の構成要素から所定数の構成要素をランダムに選択する。選択部22は、所定数の構成要素が選択されている場合、第i回目(i=1以上の整数)の選択処理において選択した所定数の構成要素と異なる所定数の構成要素を、システム構成情報に含まれる構成要素からランダムに選択する。具体的には、選択部22は、システム構成情報に含まれる全ての構成要素から第i回目の選択処理において選択した構成要素を除外した構成要素の中から所定数の構成要素をランダムに選択する。なお、第i回目の選択処理において選択した構成要素と、ランダムに選択した構成要素とを区別するために、第i回目の選択処理において選択した構成要素を選択済み構成要素とし、ランダムに選択した構成要素を候補構成要素として説明する。
【0089】
エラー測定部28は、ログレベル制御部26が作成したリストに含まれるサーバ装置を取得し、取得したサーバ装置について、構成要素決定用エラー集計テーブルT3を作成する。エラー測定部28は、記憶部24に構成要素決定用エラー集計テーブルT3を格納する。
図5は、エラー測定部28が作成した構成要素決定用エラー集計テーブルT3の一例を示す図である。
【0090】
構成要素決定用エラー集計テーブルT3には、ログレベル制御部26がログレベル変更優先度Pに基づいて選択した所定数のサーバ装置が、ログレベル変更優先度Pが高い順に設定される。なお、以降の説明では、所定数は、20であるとして説明する。
【0091】
構成要素決定用エラー集計テーブルT3には、項番、選択済み構成要素、及びログレベル変更優先度Pが設定される。なお、選択済み構成要素は、「OS」、「ソフトウェア種類」、「ソフトウェアバージョン」及び「セキュリティパッチ情報」である。また、構成要素決定用エラー集計テーブルT3には、ログレベル変更優先度Pの右側に候補構成要素、エラー数、ホスト名、IPアドレスが設定される。なお、候補構成要素は、「ドメイン」、「機種」及び「メモリサイズ」である。
【0092】
エラー測定部28は、選択済み構成要素及び候補構成要素を対象にして、集計部23と同様にして、要素値毎にエラー数をカウントする。また、エラー測定部28は、システム構成管理テーブルT1を参照して、選択済み構成要素及び候補構成要素を対象にして、要素値毎にサーバ装置数もカウントする。
【0093】
選択部22は、エラー測定部28がエラー数と、サーバ装置数とをカウントした後、選択済み構成要素及び候補構成要素に含まれる要素値毎に、単位装置当たりのエラー数を算出する。また、選択部22は、選択済み構成要素及び候補構成要素の各々に対して、重みベクトルanを算出する。選択部22は、算出部25と同様にして、単位装置当たりのエラー数を算出し、重みベクトルanを算出する。
【0094】
選択部22は、重みベクトルa
nに基づいて、選択済み構成要素及び候補構成要素の各々の選択優先度を算出する。選択優先度は、複数の構成要素から所定数の構成要素を選択するために使用される優先度である。選択部22は、選択済み構成要素及び候補構成要素の各々の重みベクトルa
nの絶対値を、選択済み構成要素及び候補構成要素の各々の選択優先度として算出する。選択部22が算出した、単位装置当たりのエラー数、選択済み構成要素及び候補構成要素の各々についての選択優先度を図示すると、
図6のようになる。
【0095】
なお、選択部22は、算出部25と同様に、選択済み構成要素及び候補構成要素の各々について、要素値毎の単位装置当たりのエラー数の最大値と平均値との差分を、選択優先度として用いてもよい。
【0096】
選択部22は、選択済み構成要素及び候補構成要素の各々についての選択優先度のうち、選択優先度の高い方から所定数の構成要素を、第(i+1)回目の選択処理の出力とする。つまり、選択部22は、選択済み構成要素が選択されている場合、選択済み構成要素及び候補構成要素の各々に対する選択優先度に基づいて、ログレベル変更優先度の算出に使用する構成要素として再選択する。
【0097】
算出された選択優先度が
図6のようになり、選択される所定数の構成要素が4つの構成要素であるとすると、選択部22は、構成要素「機種」、「ドメイン」、「OS」、「セキュリティパッチ適用情報」を選択する。そして、算出部25は、構成要素「機種」、「ドメイン」、「OS」、「セキュリティパッチ適用情報」を用いて、サーバ装置10_1~10_Nのログレベル変更優先度を算出する。
【0098】
選択部22は、構成要素を再選択した場合、エラー集計テーブルT2の構成要素を、再選択した構成要素に置き換えて再定義し、算出部25に再選択した構成要素を出力する。このように、選択部22は、ログレベル変更優先度の算出に使用する構成要素がログレベル変更優先度に高い影響度を与える構成要素を自動的に選択していく。すなわち、選択部22は、情報処理システム100の運用者又は管理者が行うエラー発生原因調査の精度が高くなるような構成要素を自動的に選択していく。
【0099】
なお、選択部22は、ログレベル調整装置20が起動した直後である場合にも、選択優先度を算出し、選択優先度に基づいて構成要素を選択してもよい。この場合、選択済み構成要素は無い状態でログレベル調整装置20が起動するが、選択部22は、選択済み構成要素をランダムに選択し、さらに、候補構成要素もランダムに選択してもよい。そして、選択部22は、選択済み構成要素及び候補構成要素の各々に対して変更優先度を算出し、所定数の構成要素を選択してもよい。もしくは、ログレベル調整装置20が起動した直後の選択処理では、全ての構成要素に対して選択優先度を算出して、選択優先度に基づいて所定数の構成要素を選択してもよい。
【0100】
<サーバ装置の動作例>
続いて、
図7を用いて、サーバ装置10_1~10_Nの動作例について説明する。
図7は、実施の形態2にかかるサーバ装置の動作例を示すフローチャートである。サーバ装置10_1~10_Nは、同様の動作を行うため、サーバ装置10_1を用いて、動作例を説明する。
【0101】
ジョブ実行部11は、ジョブを実行し(ステップS1)、実行ログを出力する(ステップS2)。ジョブ実行部11は、出力した実行ログをログ格納部12に格納する。
【0102】
ジョブ実行部11は、実行したジョブが正常終了したか否かを判定する(ステップS3)。
実行したジョブが正常終了した場合(ステップS3のYES)、ステップS1に戻る。
【0103】
一方、実行したジョブが正常終了しなかった場合(ステップS3のNO)、ジョブ実行部11は、エラー情報を生成し、エラー情報送信部13を介して、エラー情報をログレベル調整装置20に送信する(ステップS4)。実行したジョブが正常終了しなかった場合、ジョブ実行部11は、エラー情報を生成するとともに、エラー情報送信命令をエラー情報送信部13に出力する。エラー情報送信部13は、エラー情報送信命令に応じて、エラー情報をログレベル調整装置20に送信する。
【0104】
ログレベル変更部14は、ログレベル調整装置20から変更命令を受信し(ステップS5)、変更命令に応じて、ログレベルを変更する(ステップS6)。
図7では、ステップS5及びS6は、ステップS4の後に実行されるように図示されているが、ステップS5及びS6は、ステップS1~S4と並列に実行されてもよい。ログレベル変更部14は、サーバ装置10_1が起動すると、変更命令を待ち受ける状態に遷移し、変更命令がログレベル調整装置20から送信された場合、変更命令を受信する。ログレベル変更部14は、変更命令を受信すると、変更命令に応じて、ログレベルを最大ログレベルに変更する。
【0105】
<ログレベル調整装置の動作例>
続いて、
図8及び
図9を用いて、ログレベル調整装置20の動作例について説明する。
図8及び
図9は、実施の形態2にかかるログレベル調整装置の動作例を示すフローチャートである。
まず、
図8について説明する。
図8は、ログレベル調整装置20の全体動作を示すフローチャートである。
【0106】
エラー情報受信部21は、エラー情報を受信する(ステップS11)。エラー情報受信部21は、ログレベル調整装置20が起動した後、エラー情報受信待ち状態に遷移する。エラー情報受信部21は、エラー情報をサーバ装置10_1~10_Nが送信した場合、エラー情報を受信する。なお、ステップS11は、ステップS12~S17と平行に実行され、繰り返し実行される。
【0107】
選択部22は、選択処理を実行し、複数の構成要素から所定数の構成要素を選択する(ステップS12)。
【0108】
集計部23は、選択部22が選択した構成要素に含まれる要素値毎にエラー数及びサーバ装置数をカウントし、エラー集計テーブルT2に設定する(ステップS13)。集計部23は、サーバ装置10_1~10_Nから受信したエラー情報と、システム構成管理テーブルT1とを用いて、選択された各構成要素に含まれる要素値毎にエラー数をカウントする。集計部23は、選択された各構成要素に含まれる要素値毎のエラー数をエラー集計テーブルT2に設定する。また、集計部23は、システム構成管理テーブルT1を用いて、選択された各構成要素に含まれる要素値毎にサーバ装置数をカウントして、カウントしたサーバ装置数をエラー集計テーブルT2に設定する。
【0109】
算出部25は、選択部22が選択した各構成要素について、重みベクトルanを算出する(ステップS14)。集計部23は、エラー集計テーブルT2に設定された要素値毎に、単位装置当たりのエラー数を算出する。集計部23は、エラー集計テーブルT2に設定された各構成要素について、単位装置当たりのエラー数の平均値を算出し、単位装置当たりのエラー数の最大数を決定する。算出部25は、各構成要素について、決定した最大値と算出した平均値との差分を構成要素単位の重み係数として決定する。算出部25は、各構成要素について、当該構成要素に含まれる要素値毎の単位装置当たりのエラー数を各要素とするベクトルの単位ベクトルに、構成要素単位の重み係数を乗算して、重みベクトルanを算出する。
【0110】
算出部25は、サーバ装置10_1~10_Nのログレベル変更優先度Pを算出する(ステップS15)。算出部25は、重みベクトルanと、システム構成情報とに基づいて、サーバ装置10_1~10_Nのログレベル変更優先度Pを算出する。具体的には、算出部25は、重みベクトルanと、システム構成情報に基づく要素値ベクトルxnとに基づいて、サーバ装置10_1~10_Nのログレベル変更優先度Pを算出する。
【0111】
ログレベル制御部26は、ログレベル変更優先度Pに基づいて、サーバ装置10_1~10_Nのログレベルを制御する(ステップS16)。ログレベル制御部26は、サーバ装置10_1~10_Nのうち、ログレベル変更優先度Pの高い方から順に所定数のサーバ装置を、ログレベルを変更するサーバ装置として選択する。ログレベル制御部26は、選択したサーバ装置のリストを作成する。ログレベル制御部26は、ログレベルを最高レベルに変更することを要求する変更命令を作成する。
【0112】
変更命令送信部27は、ログレベル制御部26が作成した変更命令を、ログレベル制御部26が作成したリストに含まれるサーバ装置の各々に送信する(ステップS17)。ログレベル調整装置20は、ステップS17を実行すると、ステップS12に戻り、ステップS12以降の動作が実行される。
【0113】
次に、
図9を用いて、
図8のステップS12の選択処理について説明する。
選択部22は、所定数の構成要素が選択済みであるか否かを判定する(ステップS121)。選択部22は、ログレベル調整装置20が起動した直後であり、システム構成情報に含まれる複数の構成要素から所定数の構成要素が選択された状態であるか否かを判定する。
【0114】
所定数の構成要素が選択されている場合(ステップS121のYES)、選択部22は、システム構成情報に含まれる複数の構成要素のうち、選択済み構成要素を除外した構成要素から候補構成要素をランダムに選択する(ステップS122)。選択部22は、所定数の構成要素が選択され、
図8のステップS17が実行されていると判定する場合、ログレベル制御部26に対して、ログレベル制御部26が作成したリストの送信を要求する。ログレベル制御部26は、当該要求に応じて、作成したリストを選択部22に送信し、選択部22は、当該リストを受信する。選択部22は、システム構成情報に含まれる複数の構成要素のうち、選択済み構成要素を除外した構成要素から候補構成要素をランダムに選択する。
【0115】
エラー測定部28は、エラー数及びサーバ装置数をカウントする(ステップS123)。エラー測定部28は、ログレベル制御部26が作成したリストに含まれるサーバ装置を取得し、取得したサーバ装置について、構成要素決定用エラー集計テーブルT3を作成する。エラー測定部28は、選択済み構成要素及び候補構成要素を対象にして、集計部23と同様にして、要素値毎にエラー数をカウントする。また、エラー測定部28は、システム構成管理テーブルT1を参照して、選択済み構成要素及び候補構成要素を対象にして、要素値毎にサーバ装置数をカウントする。
【0116】
選択部22は、選択済み構成要素及び候補構成要素の各々に対して、重みベクトルanを算出する(ステップS124)。選択部22は、算出部25と同様にして、選択済み構成要素及び候補構成要素に含まれる要素値毎に、単位装置当たりのエラー数を算出する。選択部22は、算出部25と同様にして、選択済み構成要素及び候補構成要素の各々に対して、重みベクトルanを算出する。
【0117】
選択部22は、重みベクトルanに基づいて、選択済み構成要素及び候補構成要素の各々の選択優先度を算出する(ステップS125)。選択部22は、選択済み構成要素及び候補構成要素の各々の重みベクトルanの絶対値を、選択済み構成要素及び候補構成要素の各々の選択優先度として算出する。
【0118】
選択部22は、選択済み構成要素及び候補構成要素の各々の選択優先度に基づいて、構成要素を選択する(ステップS126)。選択部22は、選択済み構成要素及び候補構成要素の各々についての選択優先度のうち、選択優先度の高い方から所定数の構成要素を選択して選択処理を終了する。
【0119】
ステップS121において、所定数の構成要素が選択されていない場合(ステップS121のNO)、選択部22は、システム構成情報に含まれる複数の構成要素から所定数の構成要素をランダムに選択し(ステップS127)、選択処理を終了する。選択部22は、所定数の構成要素が選択されていない場合、システム構成情報に含まれる複数の構成要素から所定数の構成要素を選択する。
【0120】
次に、本実施の形態の効果について説明する。
本実施の形態においても、実施の形態1と同様に、ログレベル調整装置20は、サーバ装置10からエラーが発生したことを示すエラー情報を受信して、当該エラー情報に基づいてログレベルを変更するサーバ装置を決定する。すなわち、ログレベル調整装置20は、サーバ装置10から実行ログ自体を取得しなくてもログレベルを制御できる。すなわち、ログレベル調整装置20を用いることにより、情報処理システム100内の通信リソースやログを保存するための保存容量が大量に消費されてしまうことを抑制できる。したがって、実施の形態2にかかるログレベル調整装置20によれば、報処理システム内のリソース消費量を抑制できる。
【0121】
また、ログレベル調整装置20は、選択部22を有しており、ログレベル変更優先度の算出処理に、全ての構成要素を用いずに、所定数の構成要素のみを用いる。特許文献1及び2に開示された技術では、異常な性能指標又は障害発生要因となっている要素を特定するために、被監視対象装置の各種情報を用いるため、複雑な計算を行う必要が生じてしまう。そのため、特許文献1及び2に開示された技術を用いると、異常な性能指標又は障害発生要因となっている要素を特定するために装置内のメモリ使用量等のリソースを大量に消費してしまう虞がある。これに対して、ログレベル調整装置20は、所定数の構成要素のみを用いて、ログレベル変更優先度を算出するので、装置内のメモリ使用量等のリソース消費量を抑制できる。
【0122】
さらに、ログレベル調整装置20は、ログレベル変更優先度に基づいて、複数の被監視装置である、サーバ装置10_1~10_Nのうち、ログレベルの変更が必要なサーバ装置から順にログレベルを変更する。したがって、ログレベル調整装置20を用いることにより、特許文献3のように、情報処理システム内の全てのサーバ装置10のログレベルが上がってしまうことを抑制できる。
【0123】
またさらに、本実施の形態では、要素値毎の単位装置当たりのエラー数のばらつき度合い(分散値)に基づいて構成要素単位の重み係数を算出する。つまり、単位装置当たりのエラー数の最大値と平均値との乖離を構成要素単位の重み係数とする。そのため、エラー原因に直結する構成要素に対して高い重み付けを行うことで、エラー原因調査が必要でログレベルを高くする必要があるサーバ装置を効果的に絞りこむことができる。
【0124】
例えば、
図4に示したように、単位装置当たりのエラー数は、ほぼ、3から4の間の値であるため、一見すると大きな差が見られない。しかし、構成要素「OS」では、要素値「Windows7」の単位装置当たりのエラー数が4であるのに対して、要素値「RHEL6.5」の単位装置当たりのエラー数が2.5で、他の構成要素に比較してばらつき度合いが大きい。
【0125】
図10~
図12を用いて、具体例を挙げて説明する。
図10~
図12は、実施の形態2の効果を説明するための図である。構成要素が「OS」、「ソフトウェア種類」、「ソフトウェアバージョン」及び「セキュリティパッチ適用情報」について、システム構成情報に含まれる要素値を基に、全ての組み合わせを求めてみると、
図10の組み合わせが挙げられる。なお、
図10を説明に用いるために、1列目に項番が設けられている。
【0126】
図4の単位装置当たりのエラー数に基づいて、
図10の各組み合わせに対するログレベル変更優先度Pを仮に算出したとすると、各組み合わせと、ログレベル変更優先度Pとの関係は、
図11のようになる。
【0127】
単位装置当たりのエラー数に基づいてログレベル変更優先度Pを算出した場合、構成要素「OS」には、要素値「RHEL6.5」があり、構成要素「セキュリティパッチ適用情報」より大きな偏り(ばらつき度合い)がみられる。しかし、単位装置当たりのエラー数に基づきログレベル変更優先度Pを算出する場合、項番9及び18と、項番13及び22とに見られるように、OSとセキュリティパッチ適用情報とが、共に差が0.5である。そして、項番9及び18のログレベル変更優先度Pと、項番13及び22のログレベル変更優先度Pとに対して、構成要素の重み付けが反映されず、同じログレベル変更優先度となってしまう。
【0128】
これに対して、本実施の形態のように、要素値毎の単位装置当たりのエラー数に基づく重みベクトルa
nを導入した場合、
図12のようになる。
図12は、
図11に対応する図である。
図12に示すように、項番9と、項番18との構成要素「セキュリティパッチ適用情報」(a
4・x
4)の差が、0.03であるのに対して、構成要素「OS」(a
1・x
1)の要素値「Windows7」と「Windows8」との差が0.06となる。そして、項番9は項番18よりも高いログレベル変更優先度となる。また、同様に、項番13は項番22より高いログレベル変更優先度となる。このように、本実施の形態のように、重みベクトルa
nを導入することで、エラー発生状況の偏りを理想的に数値化することができ、単位装置当たりのエラー数に偏りがある構成要素をログレベル変更優先度に大きく影響させられる点で有意となる。
【0129】
また、本実施の形態では、ログレベルを高く設定し、詳細なログが必要なサーバ装置を自動的に選択する。そのため、エラー発生原因を特定するための調査時間を短縮できる。さらに、ログレベルを変更するサーバ装置の選択を、情報処理システム100の管理者又は運用者が実施しなくてよいため、管理者又は運用者の稼働を削減できる。
【0130】
さらに、本実施の形態では、選択部22が選択優先度に基づいて、ログレベル変更優先度の算出に用いる構成要素を自動的に変更して行く。したがって、本実施の形態によれば、ログレベル変更優先度に用いる構成要素の選択を自動化でき、障害調査を効率化することができる。
【0131】
(実施の形態3)
続いて、実施の形態3について説明する。実施の形態3は、実施の形態2の改良例である。実施の形態2では、ログレベル調整装置20は、ログレベル変更優先度に基づいて、所定数のサーバ装置のログレベルを最大ログレベルに変更することで説明した。
【0132】
一般的に、サーバ装置10にエラーが発生した場合、情報処理システム100内に、サーバ装置10の実行ログを収集する記憶装置を設け、情報処理システム100の運用者又は管理者が、記憶装置に保存された実行ログを分析する。しかし、記憶装置の保存容量には限りがあり、全てのサーバ装置10の実行ログを収集できないことも想定される。本実施の形態では、サーバ装置10の実行ログを収集する記憶装置の保存容量を考慮して、サーバ装置10_1~10_Nのログレベルを柔軟に制御することを目的とする。
【0133】
<情報処理システムの構成例>
図13を用いて、情報処理システム200について説明する。
図13は、実施の形態3にかかる情報処理システムの構成例を示す図である。情報処理システム200は、サーバ装置10_1~10_Nと、ログレベル調整装置30とを備える。情報処理システム200は、実施の形態2におけるログレベル調整装置20がログレベル調整装置30に置き換わった構成である。サーバ装置10_1~10_Nについては、実施の形態2と同様であるため、説明を適宜割愛する。
【0134】
<ログレベル調整装置の構成例>
次に、ログレベル調整装置30の構成例について説明する。ログレベル調整装置30は、エラー情報受信部21と、選択部22と、集計部23と、記憶部31と、算出部25と、ログレベル制御部32と、変更命令送信部27と、エラー測定部28とを備える。ログレベル調整装置30は、実施の形態2における記憶部24及びログレベル制御部26が、それぞれ記憶部31及びログレベル制御部32に置き換わった構成である。エラー情報受信部21、選択部22、集計部23、算出部25、変更命令送信部27、及びエラー測定部28は、実施の形態2と同様であるため、説明を適宜割愛する。
【0135】
記憶部31は、システム構成管理DB241及びエラー集計DB242に加えて、ログ容量管理DB311を記憶する。
ログ容量管理DB311は、サーバ装置10_1~10_Nが出力する実行ログを収集する記憶装置(不図示)のログ保存容量と、ログレベル毎のログ情報とを管理するログ管理テーブルT4を管理する。ログ情報は、ログレベル毎の実行ログの1日あたりのファイルサイズと、ログレベル毎の割当可能な容量を示す割当容量とを含む。
【0136】
ここで、
図14を用いて、ログ管理テーブルT4について説明する。
図14は、ログ管理テーブルの一例を示す図である。
図14に示すように、ログ管理テーブルT4には、ログ保存容量と、ログレベル毎のファイルサイズと、ログレベル毎の割当容量とが設定される。本実施の形態において、割当容量を設けている理由は、サーバ装置10_1~10_Nのうち、ログレベルを正常運用時よりも高くするサーバを選択しつつ、サーバ装置10_1~10_Nの実行ログが記憶装置に記憶できるようにするためである。なお、本実施の形態では、ログレベルは、ログレベル0~ログレベル5を含むとして説明するが、取り得るログレベルは任意に設定されてもよい。
【0137】
ログ保存容量は、サーバ装置10_1~10_Nが出力する実行ログを収集する記憶装置(不図示)において、実行ログが保存可能な容量が設定される。本実施の形態では、ログ保存容量は10TB(Tera Byte)であるとする。
【0138】
ログレベル毎のファイルサイズには、ログレベル0~ログレベル5のそれぞれの実行ログのファイルサイズが設定される。本実施の形態では、ログレベル0~ログレベル5のファイルサイズはそれぞれ1GB(Giga Byte)、10GB、100GB、200GB、500GB及び1TBであるとする。
【0139】
ログレベル毎の割当容量には、ログレベル毎の割当可能な容量が設定される。具体的には、全てのサーバ装置10がログレベル0(最小ログレベル)で実行ログを出力し、全てのサーバ装置10の実行ログを記憶装置に保存した場合のログ保存容量の空き容量に対して、ログレベル1~5の実行ログに割り当てられる割当容量が設定される。
【0140】
図14に示す一例を用いて説明すると、例えば、サーバ装置10が100台であるとする。ログレベル保存容量が10TBであるため、100台のサーバ装置10がログレベル0の実行ログを出力すると実行ログの総ファイルサイズは100GBとなる。そのため、ログレベル保存容量のうち、空き容量は9.9TBとなる。ログレベル5の割当容量が40%であるため、空き容量である9.9TBのうち、40%の容量である3.9TBをログレベル5の実行ログに割り当てられることを表している。
【0141】
同様に、ログレベル4の割当容量が30%であるため、空き容量である9.9TBの30%の容量である2.9TBをログレベル4の実行ログに割り当てられることを表している。ログレベル1~3についても同様である。
【0142】
図13に戻り、ログレベル制御部32について説明する。ログレベル制御部32は、算出部25が算出したログレベル変更優先度と、ログ管理テーブルT4とに基づいて、ログレベル決定処理を行い、サーバ装置10_1~10_Nの各々のログレベルを設定する。具体的には、ログレベル制御部32は、記憶装置(不図示)のログ保存容量と、ログレベル毎のファイルサイズと、ログレベル毎の割当容量とに基づいて、サーバ装置10_1~10_Nの各々のログレベルを設定する。
【0143】
ログレベル制御部32は、サーバ装置10_1~10_Nの各々に対して設定したログレベルに変更することを要求する変更命令を生成する。ログレベル制御部32は、変更命令送信部27を介して、サーバ装置10_1~10_Nの各々に対して、設定したログレベルに変更する変更命令を送信して、サーバ装置10_1~10_Nの各々のログレベルを制御する。ログレベル制御部32は、サーバ装置10_1~10_Nのうち、ログレベル変更優先度が高い方から所定数のサーバ装置のリストを作成し、エラー測定部28に送信する。
【0144】
<ログレベル制御部のログレベル決定処理>
ここで、
図14を用いて、ログレベル制御部32が実行するログレベル決定処理について説明する。
【0145】
ログレベル制御部32は、サーバ装置10_1~10_Nのログレベル変更優先度が決定されると、システム構成管理テーブルT1からサーバ装置の数を取得し、ログ保存容量から空き容量を算出する。ログレベル制御部32は、空き容量と、ログレベル1~5の割当容量とに基づいて、ログレベル1~5の実行ログに割り当てられる容量を算出する。ログレベル制御部32は、空き容量と、ログレベル1~5のファイルサイズとに基づいて、ログレベル1~5に設定可能なサーバ装置数をそれぞれ算出する。ログレベル制御部32は、ログレベル1~5に設定可能なサーバ装置数を算出すると、ログレベル変更優先度が高い方から順に、ログレベル5から順に設定するサーバ装置を決定し、決定したサーバ装置のログレベルを設定する。
【0146】
例えば、サーバ装置10が100台であると仮定する。この場合、上述したように、記憶装置(不図示)の空き容量は9.9TBとなる。ログレベル制御部32は、空き容量と、ログレベル1~5の割当容量とに基づいて、ログレベル1~5の実行ログに割り当てられる容量を算出する。空き容量は9.9TBであり、ログレベル1~5の割当容量はそれぞれ5%、10%、15%、30%及び40%である。ログレベル制御部32は、ログレベル1~5に割り当てられる容量をそれぞれ0.4TB、0.9TB、1.4TB、2.9TB、3.9TBと算出する。ログレベル1~5のファイルサイズがそれぞれ10GB、100GB、200GB、500GB、1TBであるため、ログレベル制御部32は、ログレベル1~5として設定可能なサーバ装置数をそれぞれ4台、4台、7台、5台、3台と決定する。ログレベル制御部32は、ログレベル変更優先度が高い方から3台をログレベル5に設定する。同様に、ログレベル制御部32は、ログレベル変更優先度が高い方から順に、ログレベル4、3、2、1になるようにログレベルを設定する。
【0147】
<ログレベル調整装置の動作例>
図15を用いて、ログレベル調整装置30の動作例について説明する。ログレベル調整装置30の動作例は、実施の形態2と基本的に同様であり、
図8のステップS16が実施の形態2と異なる。
図8のステップS11~S15及びS17は、実施の形態2と同様であるため、説明を割愛する。
【0148】
図15は、
図8のステップS16の詳細を示すフローチャートである。
図15は、実施の形態3にかかるログレベル調整装置の動作例を示すフローチャートである。
ログレベル制御部32は、ログ保存容量のうち、空き容量を算出する(ステップS161)。ログレベル制御部32は、システム構成管理テーブルT1からサーバ装置10_1~10_Nの数を取得する。ログレベル制御部32は、ログ管理テーブルT3からログレベル0のファイルサイズを取得して、サーバ装置10_1~10_Nがログレベル0で実行ログを出力した場合の実行ログの合計ファイルサイズを算出する。ログレベル制御部32は、ログ保存容量から、合計ファイルサイズを減算して、記憶装置のログ保存容量のうち、空き容量を算出する。
【0149】
ログレベル制御部32は、ログレベル1~5の割当可能容量を算出する(ステップS162)。ログレベル制御部32は、空き容量と、ログレベル1~5の割当容量とに基づいて、ログレベル1~5の実行ログに割り当てられる容量を算出する。
【0150】
ログレベル制御部32は、ログレベル1~5の設定可能サーバ装置数を算出する(ステップS163)。ログレベル制御部32は、空き容量と、ログレベル1~5のファイルサイズとに基づいて、ログレベル1~5に設定可能なサーバ装置数をそれぞれ算出する。
【0151】
ログレベル制御部32は、ログレベル1~5に設定するサーバ装置を決定する(ステップS164)。ログレベル制御部32は、ログレベル変更優先度が高い方から順に、ステップS163において求めたログレベル毎の設定可能なサーバ装置数になるように、ログレベル1~5のサーバ装置を決定し、決定したサーバ装置のログレベルを設定する。
【0152】
以上説明したように、本実施の形態にかかるログレベル調整装置30によれば、記憶装置のログ保存容量の中で、ログレベル変更優先度が高いサーバ装置から順に高いログレベルを設定でき、かつ全てのサーバ装置10の実行ログを収集できる。したがって、実施の形態3にかかるログレベル調整装置30によれば、限られたリソースの中で柔軟にログレベルを変更するサーバ装置を選択しつつ、情報処理システム200全体の実行ログを取得することが可能になる。
【0153】
(他の実施の形態)
上述した実施の形態において説明したログレベル調整装置1、20、30及びサーバ装置10_1~10_N(以下、ログレベル調整装置1等と称する)は、次のようなハードウェア構成を有していてもよい。
図16は、本開示の各実施の形態にかかるログレベル調整装置等のハードウェア構成を例示するブロック図である。
【0154】
図16を参照すると、ログレベル調整装置1等は、ネットワーク・インターフェース1201、プロセッサ1202及びメモリ1203を含む。ネットワーク・インターフェース1201は、通信機能を有する他の装置と通信するために使用される。ネットワーク・インターフェース1201は、例えば、IEEE(Institute of Electrical and Electronics Engineers) 802.11 series、IEEE 802.3 series等を含む通信方式に準拠したネットワークインターフェースカード(NIC)を含んでもよい。
【0155】
プロセッサ1202は、メモリ1203からソフトウェア(コンピュータプログラム)を読み出して実行することで、上述の実施形態においてフローチャートを用いて説明されたログレベル調整装置1等の処理を行う。プロセッサ1202は、例えば、マイクロプロセッサ、MPU(Micro Processing Unit)、又はCPU(Central Processing Unit)であってもよい。プロセッサ1202は、複数のプロセッサを含んでもよい。
【0156】
メモリ1203は、揮発性メモリ及び不揮発性メモリの組み合わせによって構成される。メモリ1203は、プロセッサ1202から離れて配置されたストレージを含んでもよい。この場合、プロセッサ1202は、図示されていないI/Oインターフェースを介してメモリ1203にアクセスしてもよい。
【0157】
図16の例では、メモリ1203は、ソフトウェアモジュール群を格納するために使用される。プロセッサ1202は、これらのソフトウェアモジュール群をメモリ1203から読み出して実行することで、上述の実施形態において説明されたログレベル調整装置1等の処理を行うことができる。
【0158】
図16を用いて説明したように、ログレベル調整装置1等が有するプロセッサの各々は、図面を用いて説明されたアルゴリズムをコンピュータに行わせるための命令群を含む1または複数のプログラムを実行する。
【0159】
上述の例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)を含む。さらに、非一時的なコンピュータ可読媒体の例は、CD-ROM(Read Only Memory)、CD-R、CD-R/Wを含む。さらに、非一時的なコンピュータ可読媒体の例は、半導体メモリを含む。半導体メモリは、例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0160】
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施の形態によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、本開示は、それぞれの実施の形態を適宜組み合わせて実施されてもよい。
【0161】
また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
エラーが発生したことを示すエラー情報を複数の被監視装置から受信する受信部と、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出する集計部と、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出する算出部と、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する制御部と、を備えるログレベル調整装置。
(付記2)
前記複数の構成要素から所定数の第1構成要素を選択する選択部をさらに備え、
前記算出部は、前記所定数の第1構成要素に含まれる要素値に対する前記算出されたエラー数に基づいて、前記第1優先度を算出する、付記1に記載のログレベル調整装置。
(付記3)
前記算出部は、前記算出されたエラー数に基づいて、前記所定数の第1構成要素に含まれる要素値毎に第1重み係数を算出し、前記算出された第1重み係数と、前記システム構成情報とに基づいて、前記第1優先度を算出する、付記2に記載のログレベル調整装置。
(付記4)
前記算出部は、前記算出されたエラー数に基づいて、前記所定数の第1構成要素の各々に対して第2重み係数を算出し、前記算出されたエラー数と、前記算出された第2重み係数とに基づいて、前記第1重み係数を算出する、付記3に記載のログレベル調整装置。
(付記5)
前記算出部は、前記所定数の第1構成要素の各々について、前記算出されたエラー数の平均値及び最大値に基づいて、前記第2重み係数を算出する、付記4に記載のログレベル調整装置。
(付記6)
前記算出部は、前記所定数の第1構成要素の各々について、前記算出されたエラー数を各要素とするベクトルの単位ベクトルと、前記算出された第2重み係数とに基づいて、前記第1重み係数を算出する、付記4又は5に記載のログレベル調整装置。
(付記7)
前記選択部は、前記算出されたエラー数に基づいて、前記所定数の第1構成要素の各々に対して第2優先度を算出し、前記算出された選択優先度に基づいて、前記複数の構成要素から前記第1構成要素を選択する、付記2~6のいずれか1項に記載のログレベル調整装置。
(付記8)
前記選択部は、前記第1構成要素が選択されている場合、前記第1構成要素と異なる第2構成要素を前記複数の構成要素から選択し、前記第1構成要素及び前記第2構成要素の各々についての前記第2優先度に基づいて第1構成要素を再選択する、付記7に記載のログレベル調整装置。
(付記9)
前記制御部は、前記算出された第1優先度に基づいて、前記複数の被監視装置のうち、所定数の被監視装置のログレベルを他の被監視装置より高くする、付記1~8のいずれか1項に記載のログレベル調整装置。
(付記10)
前記制御部は、前記複数の被監視装置のログファイルを保存する記憶装置の保存容量と、ログレベル毎のログ情報と、前記算出された第1優先度とに基づいて、前記複数の被監視装置のログレベルを変更する、付記1~8のいずれか1項に記載のログレベル調整装置。
(付記11)
エラーが発生したことを示すエラー情報を複数の被監視装置から受信し、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出し、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出し、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する、ログレベル調整装置におけるログレベル調整方法。
(付記12)
エラーが発生したことを示すエラー情報を複数の被監視装置から受信し、
前記受信されたエラー情報と、前記複数の被監視装置を構成する複数の構成要素の要素値に関するシステム構成情報とに基づいて、前記要素値毎に、単位装置当たりのエラー数を算出し、
前記算出されたエラー数と、前記システム構成情報とに基づいて、前記複数の被監視装置の第1優先度を算出し、
前記算出された第1優先度に基づいて、前記複数の被監視装置のログレベルを制御する、処理をコンピュータに実行させるプログラム。
【符号の説明】
【0162】
1、20、30 ログレベル調整装置
2 受信部
3、23 集計部
4、25 算出部
5 制御部
10_1~10_N サーバ装置
21 エラー情報受信部
22 選択部
24、31 記憶部
26、32 ログレベル制御部
27 変更命令送信部
28 エラー測定部
100 情報処理システム
241 システム構成管理DB
242 エラー集計DB
311 ログ容量管理DB