(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】情報処理装置及び障害検出方法
(51)【国際特許分類】
G06F 11/07 20060101AFI20240528BHJP
G06F 11/30 20060101ALI20240528BHJP
【FI】
G06F11/07 190
G06F11/07 140A
G06F11/30 151
(21)【出願番号】P 2020142534
(22)【出願日】2020-08-26
【審査請求日】2023-05-11
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110004185
【氏名又は名称】インフォート弁理士法人
(74)【代理人】
【識別番号】100121083
【氏名又は名称】青木 宏義
(74)【代理人】
【識別番号】100138391
【氏名又は名称】天田 昌行
(74)【代理人】
【識別番号】100074099
【氏名又は名称】大菅 義之
(72)【発明者】
【氏名】中山 等
【審査官】武田 広太郎
(56)【参考文献】
【文献】特開2012-003647(JP,A)
【文献】特開2016-012193(JP,A)
【文献】特開2015-115018(JP,A)
【文献】特開2001-344130(JP,A)
【文献】米国特許出願公開第2012/0030346(US,A1)
【文献】米国特許出願公開第2011/0314138(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/07
G06F 11/30
(57)【特許請求の範囲】
【請求項1】
情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を記憶するとともに、前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を記憶する記憶部と、
前記情報処理装置において発生した障害を示す入力情報を受け付ける受付部と、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する特定部と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記特定部は、前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに重みを付与し、前記入力情報が示す障害に対応する1つ又は複数の調査対象を前記重みに従って画面上に表示する情報を、前記調査支援情報として出力し、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記構成変更に対応する調査対象に付与された前記重みは、前記構成変更に対応することを示す重みを含むことを特徴とする請求項1記載の情報処理装置。
【請求項3】
前記障害調査情報は、前記情報処理装置に含まれる1つ又は複数の調査対象それぞれに対応付けられた障害発生部分を示す情報をさらに含み、
前記入力情報は、前記情報処理装置において発生した障害の障害発生部分を示す情報をさらに含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記入力情報に含まれる前記障害発生部分に対応する調査対象に付与された前記重みは、前記入力情報に含まれる前記障害発生部分に対応することを示す重みを含むことを特徴とする請求項2記載の情報処理装置。
【請求項4】
前記記憶部は、前記情報処理装置の構成を示す第1構成情報をさらに記憶し、
前記情報処理装置は、前記情報処理装置の構成を示す第2構成情報を取得し、前記第2構成情報と前記第1構成情報との差分を抽出し、前記差分を表す構成変更に対応する調査対象を前記構成変更情報に付加する抽出部をさらに備えることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
【請求項5】
情報処理装置において発生した障害を示す入力情報を受け付け、
前記情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を取得し、
前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を取得し、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、
特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する、
処理を前記情報処理装置が実行することを特徴とする障害検出方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、障害検出技術に関する。
【背景技術】
【0002】
情報処理装置(コンピュータ)における障害発生時のトラブルシューティングを実施する場合、作業者は、システムイベントログ(System Event Log,SEL)に表示された障害内容及び障害発生箇所から関連する被疑箇所を推定し、障害原因を調査する。被疑箇所は、ハードウェア又はソフトウェアである。ソフトウェアには、ファームウェアも含まれる。
【0003】
情報処理装置のトラブルシューティングに関連して、IT(Information Technology)システムのトラブルの症状を入力すると症状に対する対処を出力するトラブル対処システムが知られている(例えば、特許文献1を参照)。
【0004】
このトラブル対処システムは、ITシステムの構成情報を集めた第1データベース、トラブルの症状と症状を解決する対処を含むトラブル事例を集めた第2データベース、第1記憶部、構成情報類似度算出部、及び出力部を含む。
【0005】
第1記憶部は、第1データベースと第2データベースとから構成情報をキーにトラブル事例の構成情報を導出して格納する。構成情報類似度算出部は、入力されたトラブルを発生したITシステムの構成情報とトラブル事例の構成情報との間の類似度を算出する。出力部は、トラブルを発生したITシステムに対する対処を類似度と共に提示する。
【0006】
計算機システムの構成が変化を示すイベントが検出された場合、必要なイベントについてのみ障害解析に用いるための情報を生成する管理方法も知られている(例えば、特許文献2を参照)。
【先行技術文献】
【特許文献】
【0007】
【文献】国際公開第2009/122525号パンフレット
【文献】国際公開第2012/131868号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0008】
情報処理装置において、SELに表示されない障害が発生した場合、被疑箇所を推定するための情報が存在しないため、障害原因の調査に長い時間が費やされることがある。
【0009】
なお、かかる問題は、SELに表示されない障害が発生した場合に限らず、様々な障害が発生した場合に生ずるものである。
【0010】
1つの側面において、本発明は、情報処理装置において発生した障害の調査を支援することを目的とする。
【課題を解決するための手段】
【0011】
1つの案では、情報処理装置は、記憶部、受付部、及び特定部を含む。記憶部は、障害調査情報及び構成変更情報を記憶する。
【0012】
障害調査情報は、情報処理装置における障害を示す障害情報と、情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた情報である。構成変更情報は、情報処理装置において行われた構成変更に対応する調査対象を示す情報である。
【0013】
受付部は、情報処理装置において発生した障害を示す入力情報を受け付ける。特定部は、障害調査情報及び構成変更情報に基づいて、入力情報が示す障害に対応する1つ又は複数の調査対象のうち、構成変更に対応する調査対象を特定し、特定された構成変更に対応する調査対象を含む調査支援情報を出力する。
【発明の効果】
【0014】
1つの側面によれば、情報処理装置において発生した障害の調査を支援することができる。
【図面の簡単な説明】
【0015】
【
図9】SELに基づいて対象項目を特定する処理を示す図である。
【
図10】対象項目を含む調査支援情報を示す図である。
【
図11】入力情報に基づいて調査対象を特定する処理を示す図である。
【
図12】調査対象を含む調査支援情報を示す図である。
【
図13】構成変更情報を生成する生成処理のフローチャートである。
【
図14A】調査対象特定処理のフローチャート(その1)である。
【
図14B】調査対象特定処理のフローチャート(その2)である。
【発明を実施するための形態】
【0016】
以下、図面を参照しながら、実施形態を詳細に説明する。
【0017】
情報処理装置において障害が発生し、SELに基づいて障害原因が特定された場合、作業者は、障害原因に対する対処を行い、対処方法をトラブル事例として蓄積する。新たな障害が発生した場合、作業者は、蓄積されたトラブル事例の中から、SELに表示された障害と類似するトラブル事例を検索することで、障害原因を推定して対処方法を決定することができる。
【0018】
しかしながら、SELに表示されない障害については、障害原因を推定することが難しい。SELに表示されない障害としては、AC(Alternating Current)電源が入らない、ログインできない、ブートできない、OS(Operating System)パニック、FAN高速回転等の現象が挙げられる。
【0019】
SELに表示されない障害が発生した場合、被疑箇所を推定するための情報が存在しないため、どこから調査を開始すればよいかが分からないことがある。この場合、障害原因の調査の方針を決めて再現試験を行い、被疑箇所を推定する作業に、長い時間が費やされる。例えば、1箇所の障害の調査に1週間以上かかることもある。
【0020】
図1は、実施形態の情報処理装置の機能的構成例を示している。
図1の情報処理装置101は、記憶部111、受付部112、及び特定部113を含む。記憶部111は、障害調査情報121及び構成変更情報122を記憶する。
【0021】
障害調査情報121は、情報処理装置101における障害を示す障害情報と、情報処理装置101に含まれる1つ又は複数の調査対象とを対応付けた情報である。構成変更情報122は、情報処理装置101において行われた構成変更に対応する調査対象を示す情報である。受付部112及び特定部113は、障害調査情報121及び構成変更情報122を用いて、障害検出処理を行う。
【0022】
図2は、
図1の情報処理装置101が行う障害検出処理の例を示すフローチャートである。まず、受付部112は、情報処理装置101において発生した障害を示す入力情報を受け付ける(ステップ201)。
【0023】
次に、特定部113は、記憶部111から障害調査情報121を取得し(ステップ202)、記憶部111から構成変更情報122を取得する(ステップ203)。次に、特定部113は、障害調査情報121及び構成変更情報122に基づいて、入力情報が示す障害に対応する1つ又は複数の調査対象のうち、構成変更に対応する調査対象を特定する(ステップ204)。そして、特定部113は、特定された構成変更に対応する調査対象を含む調査支援情報を出力する(ステップ205)。
【0024】
図1の情報処理装置101によれば、情報処理装置101において発生した障害の調査を支援することができる。
【0025】
図3は、
図1の情報処理装置101に対応するサーバのハードウェア構成例を示している。
図3のサーバ301は、SB(System Board)311、通信部312、及びDU(Disk Unit)313を含む。通信部312は、
図1の受付部112に対応する。
【0026】
サーバ301は、不図示のMMB(Management Board)、IOU(Input/Output Unit)、AC電源、FAN、PCI(Peripheral Component Interconnect)カード等をさらに含む。PCIカードは、PCI Expressバス用のFC(Fibre Channel)カード又はLAN(Local Area Network)カードであってもよい。
【0027】
SB311は、BMC(Baseboard Management Controller)321、CPU(Central Processing Unit)322-1、CPU322-2、メモリ323-1、及びメモリ323-2を含む。CPU322-1及びCPU322-2は、プロセッサと呼ばれることもある。
【0028】
CPU322-1は、メモリ323-1を利用してプログラムを実行することで情報処理を行う。CPU322-2は、メモリ323-2を利用してプログラムを実行することで情報処理を行う。DU313は、情報処理に用いられるプログラム及びデータを記憶する。
【0029】
メモリ323-1及びメモリ323-2は、DIMM(Dual Inline Memory Module)であってもよく、DU313は、RAID(Redundant Arrays of Inexpensive Disks)であってもよい。RAIDは、複数のHDD(Hard Disk Drive)を含む。
【0030】
BIOS(Basic Input/Output System)又はUEFI(Unified Extensible Firmware Interface)は、CPU322-1又はCPU322-2によって実行される。OSもCPU322-1又はCPU322-2によって実行される。
【0031】
BMC321は、サーバ301に含まれるハードウェアの監視及び管理を行う。BMC321は、IRMC(Integrated Remote Management Controller)であってもよい。作業者は、端末装置302を用いて、サーバ301において発生した障害の調査を行う。端末装置302は、コンソールPC(Personal Computer)であってもよい。通信部312は、通信ネットワークを介して端末装置302と通信する。サーバ301は、複数のSB311を含んでいてもよい。
【0032】
図4は、
図3のBMC321の機能的構成例を示している。
図4のBMC321は、記憶部411、抽出部412、及び特定部413を含む。記憶部411及び特定部413は、
図1の記憶部111及び特定部113にそれぞれ対応する。記憶部411は、ハードウェア構成情報421、ソフトウェア構成情報422、構成変更情報423、及び障害調査情報424を記憶する。
【0033】
ハードウェア構成情報421及びソフトウェア構成情報422は、第1構成情報の一例である。構成変更情報423及び障害調査情報424は、
図1の構成変更情報122及び障害調査情報121にそれぞれ対応する。
【0034】
ハードウェア構成情報421は、サーバ301のハードウェア構成を表し、例えば、次のような情報を含む。
【0035】
(H1)サーバ301の種類
(H2)サーバ301に含まれる部品
(H3)各部品の種類及びシリアル番号
(H4)各部品のファームウェア版数
【0036】
ソフトウェア構成情報422は、サーバ301のソフトウェア構成を表し、例えば、次のような情報を含む。
【0037】
(S1)OSの種類
(S2)OS版数
(S3)PCIカードのファームウェア版数
(S4)PCIカードのドライバ版数
(S5)PCIカードのシリアル番号
【0038】
構成変更情報423は、サーバ301において過去に行われた構成変更に対応する調査対象を示す情報である。調査対象は、サーバ301に含まれるハードウェア又はソフトウェアを表す。
【0039】
図5は、構成変更情報423の例を示している。
図5の構成変更情報423は、検出日、対象項目、調査対象、ハードウェア種類、ファームウェア種類、OS種類、ドライバ種類、搭載箇所、変更前搭載箇所、変更後搭載箇所、及び型名を含む。構成変更情報423は、変更前シリアル番号、変更後シリアル番号、変更前ファームウェア版数、変更後ファームウェア版数、変更前ドライバ版数、変更後ドライバ版数、及び変更内容をさらに含む。
【0040】
検出日は、構成変更が検出された日を表し、対象項目は、構成変更が行われた調査対象の詳細情報を表し、調査対象は、構成変更が行われた調査対象の名称を表す。ハードウェア種類は、調査対象のハードウェアの種類を表し、ファームウェア種類は、調査対象のファームウェアの種類を表し、OS種類は、調査対象のOSの種類を表し、ドライバ種類は、調査対象のドライバの種類を表す。
【0041】
搭載箇所は、調査対象が搭載されている部分を表す。変更前搭載箇所は、変更前の調査対象が搭載されていた部分を表し、変更後搭載箇所は、変更後の調査対象が搭載されている部分を表す。変更前搭載箇所及び変更後搭載箇所は、調査対象の搭載箇所が変更された場合に記録される。型名は、調査対象の型名を表す。
【0042】
変更前シリアル番号は、変更前の調査対象のシリアル番号を表し、変更後シリアル番号は、変更後の調査対象のシリアル番号を表す。変更前シリアル番号及び変更後シリアル番号は、調査対象がハードウェアであり、かつ、そのハードウェアが交換された場合に記録される。
【0043】
変更前ファームウェア版数は、変更前の調査対象のファームウェア版数を表し、変更後ファームウェア版数は、変更後の調査対象のファームウェア版数を表す。変更前ファームウェア版数及び変更後ファームウェア版数は、調査対象がファームウェアであり、かつ、そのファームウェアが交換された場合に記録される。
【0044】
変更前ドライバ版数は、変更前の調査対象のドライバ版数を表し、変更後ドライバ版数は、変更後の調査対象のドライバ版数を表す。変更前ドライバ版数及び変更後ドライバ版数は、調査対象がドライバであり、かつ、そのドライバが交換された場合に記録される。変更内容は、検出された構成変更の内容を表す。
【0045】
図5の“ハード”はハードウェアを表し、“ファーム”はファームウェアを表す。例えば、“2019/12/10”に検出された構成変更の変更内容は“RAID交換”であり、調査対象は“RAIDハード”である。“2019/12/20”に検出された構成変更の変更内容は“RAIDファームバージョンアップ”であり、調査対象は“RAIDファーム”である。
【0046】
サーバ301において構成変更が行われた場合、その構成変更に起因して何らかの障害が発生することがある。例えば、RAID交換又はRAIDファームバージョンアップが行われた場合、そのRAIDを含むDUにおいてエラーが発生することがある。また、CPU交換、MMBファームバージョンアップ、又はBIOSファームバージョンアップが行われた場合、その構成変更に起因してブートができなくなることがある。
【0047】
そこで、構成変更情報423を利用して、過去に行われた構成変更に対応する調査対象の中から、被疑箇所の候補を選択することで、構成変更に起因する障害の原因を効率良く特定することができる。
【0048】
障害調査情報424は、サーバ301における障害を示す障害情報と、サーバ301に含まれる調査対象とを対応付けた情報である。
【0049】
図6は、障害調査情報424の例を示している。
図6の障害調査情報424は、現象、対象箇所、障害内容(キーワード)、調査対象、及び資料を含む。現象は、障害情報の一例であり、障害の発生に伴って現れる現象を表す。対象箇所は、調査対象が搭載されている部分を表す。
【0050】
障害内容は、障害原因を表し、障害内容の右側に併記された括弧内のキーワードは、障害発生部分を表す単語である。キーワードは、対象箇所を表す単語であってもよい。調査対象は、被疑箇所の候補となる調査対象の名称を表し、資料は、障害原因の調査において確認すべき情報を表す。
【0051】
例えば、“AC電源が入らない”という現象に対して対応付けられている調査対象は、“電源ハード”、“PSU(Power Supply Unit)ハード”、“MMBファーム”、及び“MMBハード”である。
【0052】
図7は、
図3のサーバ301が行う障害検出処理の例を示している。抽出部412は、以下のような手順で構成変更情報423を生成する。
【0053】
P1:抽出部412は、所定のタイミングで、BIOSの装置ログ701からハードウェア構成情報を取得するとともに、OSのログ702からソフトウェア構成情報を取得する。所定のタイミングは、1日1回であってもよく、2日以上の期間に1回であってもよい。装置ログ701は、configdataであってもよい。
【0054】
P2:抽出部412は、取得されたハードウェア構成情報と、記憶部411が記憶するハードウェア構成情報421とを比較し、両者の差分を抽出することで、その差分を表す構成変更を検出する。そして、抽出部412は、変更後の構成をハードウェア構成情報421に記録することで、ハードウェア構成情報421を更新する。
【0055】
P3:抽出部412は、取得されたソフトウェア構成情報と、記憶部411が記憶するソフトウェア構成情報422とを比較し、両者の差分を抽出することで、その差分を表す構成変更を検出する。そして、抽出部412は、変更後の構成をソフトウェア構成情報422に記録することで、ソフトウェア構成情報422を更新する。
【0056】
P4:抽出部412は、検出された構成変更に対応する調査対象を含む情報を、構成変更情報423に付加する。
【0057】
このように、装置ログ701のハードウェア構成情報をハードウェア構成情報421と比較し、OSのログ702のソフトウェア構成情報をソフトウェア構成情報422と比較することで、構成変更情報423を生成することができる。
【0058】
サーバ301における障害の発生を示すSEL703をBMC321が採取した場合、特定部413は、以下のような手順で対象項目を特定する。
【0059】
P11:特定部413は、メッセージ仕様書の情報を用いて、SEL703のメッセージから1つ又は複数の対象項目を特定する。対象項目は、調査対象の詳細情報を表す。メッセージ仕様書には、複数のSELそれぞれのメッセージに対応する1つ又は複数の対象項目が記載されている。
【0060】
P12:特定部413は、記憶部411から構成変更情報423を取得する。そして、特定部413は、構成変更情報423から、特定された対象項目を検索し、構成変更情報423に記録されている対象項目を、構成変更に対応する対象項目として特定する。
【0061】
P13:特定部413は、構成変更に対応する対象項目を含む調査支援情報425を生成して、記憶部411に格納する。
【0062】
P14:特定部413は、通信部312を介して、調査支援情報425を端末装置302へ送信することで、調査支援情報425を端末装置302へ出力する。端末装置302は、受信した調査支援情報425を画面上に表示する。
【0063】
図8は、SEL703のメッセージの例を示している。SEL801は、“IOU#1”に関連する障害を示し、SEL802は、“IOU#0”に関連する障害を示し、SEL803は、“DU#0”に関連する障害を示す。対象項目は、メッセージ仕様書に記載されている対象項目を表し、搭載箇所は、対象項目が示す調査対象が搭載されている部分を表す。
【0064】
図9は、
図8のSEL803に基づいて対象項目を特定する処理の例を示している。
図9(a)は、SEL803のメッセージから特定される搭載箇所及び対象項目を示している。SEL803のメッセージから特定される対象項目は、“DU#0_RAID#1_RAIDハード”及び“DU#0_RAID#1_RAIDファーム”であり、これらの対象項目の搭載箇所は“DU#0_RAID#1”である。
【0065】
図9(b)は、
図5の構成変更情報423において、
図9(a)の“DU#0_RAID#1_RAIDハード”を対象項目として含む情報と、“DU#0_RAID#1_RAIDファーム”を対象項目として含む情報を示している。
図9(c)は、
図9(b)の情報に含まれる対象項目を示している。
【0066】
特定部413は、
図5の構成変更情報423から
図9(a)の対象項目を検索し、
図9(b)の情報を抽出する。そして、特定部413は、
図9(b)の情報から
図9(c)の対象項目を特定し、特定された対象項目を含む調査支援情報425を生成する。
【0067】
図10は、端末装置302の画面上に表示された、
図9(c)の対象項目を含む調査支援情報425の例を示している。
図10の調査支援情報425は、
図9(c)の対象項目以外に、搭載箇所、型名、シリアル番号、版数、検出日、及び変更内容を含んでいる。対象項目以外の情報は、ハードウェア構成情報421、ソフトウェア構成情報422、又は構成変更情報423から取得される。
図10の2個の対象項目は、メッセージ仕様書に記載されている順序で表示されている。
【0068】
作業者は、表示された対象項目の中から何れかの対象項目を選択し、障害原因を調査する。そして、障害原因が特定された場合、作業者は、メッセージ仕様書及びメンテナンスマニュアルを参照しながら、障害原因に対する対処を行う。
【0069】
サーバ301において障害が発生し、かつ、SEL703が採取されなかった場合、特定部413は、以下のような手順で調査対象を特定する。
【0070】
P21:作業者は、端末装置302を用いて、発生した障害を示す入力情報704を入力し、通信部312は、端末装置302から入力情報704を受信することで、入力情報704を受け付ける。
【0071】
P22:特定部413は、記憶部411から構成変更情報423及び障害調査情報424を取得する。次に、特定部413は、障害調査情報424から、入力情報704が示す障害の現象を検索し、その現象に対応付けられた1つ又は複数の調査対象を特定する。そして、特定部413は、構成変更情報423から、特定された調査対象を検索し、構成変更情報423に記録されている調査対象を、構成変更に対応する調査対象として特定する。
【0072】
P23:特定部413は、構成変更に対応する調査対象を含む調査支援情報425を生成して、記憶部411に格納する。
【0073】
P24:特定部413は、通信部312を介して、調査支援情報425を端末装置302へ送信することで、調査支援情報425を端末装置302へ出力する。端末装置302は、受信した調査支援情報425を画面上に表示する。
【0074】
入力情報704としては、例えば、
図6に示した現象及びキーワードの組み合わせが用いられる。キーワードが不明である場合、入力情報704は、現象のみを含んでいてもよい。例えば、「UEFIブートできない」という入力情報704の場合、“ブートできない”が現象に対応し、“UEFI”がキーワードに対応する。
【0075】
図11は、この入力情報704に基づいて調査対象を特定する処理の例を示している。
図11(a)は、
図6の障害調査情報424において、“ブートできない”に対応付けられた6個の調査対象を示している。“ブートできない”に対応する調査対象は、“MMBファーム”、“MMBハード”、“BIOSファーム”、“CPUハード”、“HDDハード”、及び“OS情報”である。
【0076】
特定部413は、
図6の障害調査情報424から、“ブートできない”という現象を検索し、
図11(a)の6個の調査対象を特定する。そして、特定部413は、各調査対象のポイントとして“1”を付与する。調査対象に付与されたポイントは、調査対象に付与された重みの一例であり、調査対象の優先順位を表す。
【0077】
図11(b)は、
図11(a)の6個の調査対象のうち、障害調査情報424のキーワードに“UEFI”が含まれている2個の調査対象に、ポイントを加算した結果を示している。キーワードに“UEFI”が含まれている調査対象は、“BIOSファーム”及び“CPUハード”である。
【0078】
特定部413は、
図6の障害調査情報424から、“UEFI”というキーワードを検索し、“BIOSファーム”及び“CPUハード”を特定する。そして、特定部413は、“BIOSファーム”及び“CPUハード”のポイントに“1”を加算する。これにより、“BIOSファーム”及び“CPUハード”のポイントが“2”に変更される。
【0079】
図11(c)は、
図5の構成変更情報423において、
図11(a)の何れかの調査項目を含む情報を示している。
図11(a)の6個の調査対象のうち、
図5の構成変更情報423に含まれる調査対象は、“MMBファーム”、“BIOSファーム”、及び“CPUハード”である。
【0080】
図11(d)は、
図11(a)の6個の調査対象のうち、
図5の構成変更情報423に含まれている3個の調査対象にポイントを加算した結果を示している。
【0081】
特定部413は、
図5の構成変更情報423から
図11(a)の各調査対象を検索し、
図11(c)の情報を抽出して、“MMBファーム”、“BIOSファーム”、及び“CPUハード”を特定する。そして、特定部413は、“MMBファーム”、“BIOSファーム”、及び“CPUハード”のポイントに“1”を加算する。これにより、“MMBファーム”のポイントが“2”に変更され、“BIOSファーム”及び“CPUハード”のポイントが“3”に変更される。
【0082】
特定部413は、
図11(d)の調査対象と、各調査対象に付与されたポイントとを含む、調査支援情報425を生成する。調査対象及びポイントを含む調査支援情報425は、調査対象を重みに従って画面上に表示する情報の一例である。
【0083】
図12は、端末装置302の画面上に表示された、
図11(d)の調査対象を含む調査支援情報425の例を示している。
図12の調査支援情報425は、
図11(d)の調査対象及びポイント以外に、変更有無、搭載箇所、型名、シリアル番号、版数、検出日、及び変更内容を含んでいる。
【0084】
変更有無の“有り”は、構成変更情報423に含まれている調査対象を示し、“無し”は、構成変更情報423に含まれていない調査対象を示す。調査対象、ポイント、及び変更有無以外の情報は、ハードウェア構成情報421、ソフトウェア構成情報422、又は構成変更情報423から取得される。
図12の6個の調査対象は、ポイントの降順に表示されている。この場合、変更有無が“有り”である調査対象の順位は、変更有無が“無し”である調査対象の順位よりも高くなっている。
【0085】
作業者は、表示された調査対象の中から何れかの調査対象を選択し、障害原因を調査する。そして、障害原因が特定された場合、作業者は、メッセージ仕様書及びメンテナンスマニュアルを参照しながら、障害原因に対する対処を行う。
【0086】
図3のサーバ301によれば、SELに表示されない障害が発生した場合であっても、被疑箇所の候補となる調査対象が提示されるため、作業者は、障害原因の調査を直ちに開始することができる。被疑箇所の候補として、構成変更に対応する調査対象を提示することで、障害原因の調査が効率化される。
【0087】
さらに、複数の調査対象をポイントの降順に表示することで、優先度の高い調査対象を容易に認識することができるため、調査時間が短縮される。調査対象のポイントとして、入力情報704の現象に対するポイント、入力情報704のキーワードに対するポイント、及び構成変更情報423の構成変更に対するポイントの総和を用いることで、複数の調査対象の優先順位を異ならせることができる。
【0088】
図13は、
図4のBMC321が構成変更情報423を生成する生成処理の例を示すフローチャートである。まず、抽出部412は、所定のタイミングで、BIOSの装置ログ701からハードウェア構成情報を取得し(ステップ1301)、OSのログ702からソフトウェア構成情報を取得する(ステップ1302)。
【0089】
次に、抽出部412は、取得されたハードウェア構成情報と、記憶部411が記憶するハードウェア構成情報421とを比較し、取得されたソフトウェア構成情報と、記憶部411が記憶するソフトウェア構成情報422とを比較する。そして、抽出部412は、ハードウェア構成又はソフトウェア構成に変更が有るか否かをチェックする(ステップ1303)。
【0090】
ハードウェア構成又はソフトウェア構成に変更が無い場合(ステップ1303,NO)、抽出部412は、ステップ1301以降の処理を繰り返す。
【0091】
ハードウェア構成又はソフトウェア構成に変更が有る場合(ステップ1303,YES)、抽出部412は、変更後の構成をハードウェア構成情報421又はソフトウェア構成情報422に記録する(ステップ1304)。これにより、ハードウェア構成情報421又はソフトウェア構成情報422が更新される。次に、抽出部412は、構成変更に対応する調査対象を含む情報を、構成変更情報423に付加する(ステップ1305)。
【0092】
図14A及び
図14Bは、
図4のBMC321が行う調査対象特定処理の例を示すフローチャートである。まず、特定部413は、SEL703が採取されたか否かをチェックする(ステップ1401)。SEL703が採取された場合(ステップ1401,YES)、特定部413は、SEL703を取得し(ステップ1402)、メッセージ仕様書の情報を用いて、SEL703のメッセージから1つ又は複数の対象項目を特定する(ステップ1403)。
【0093】
次に、特定部413は、構成変更情報423から各対象項目を検索し、構成変更情報423に何れかの対象項目が存在するか否かをチェックする(ステップ1404)。構成変更情報423に何れかの対象項目が存在する場合(ステップ1404,YES)、特定部413は、その対象項目を含む調査支援情報425を生成する(ステップ1405)。そして、特定部413は、通信部312を介して、調査支援情報425を端末装置302へ送信する(ステップ1406)。
【0094】
SEL703が採取されていない場合(ステップ1401,NO)、特定部413は、端末装置302から入力情報704を受信したか否かをチェックする(ステップ1407)。入力情報704を受信していない場合(ステップ1407,NO)、特定部413は、処理を終了する。
【0095】
入力情報704を受信した場合(ステップ1407,YES)、特定部413は、障害調査情報424から、入力情報704に含まれる現象を検索し、障害調査情報424に現象が存在するか否かをチェックする(ステップ1408)。
【0096】
障害調査情報424に現象が存在する場合(ステップ1408,YES)、特定部413は、現象に対応する1つ又は複数の調査対象を特定する(ステップ1409)。そして、特定部413は、各調査対象のポイントとして“1”を付与する(ステップ1410)。
【0097】
次に、特定部413は、障害調査情報424から、入力情報704に含まれるキーワードを検索し、そのキーワードが、特定された各調査対象に対応付けられているか否かをチェックする(ステップ1411)。キーワードが何れかの調査対象に対応付けられている場合(ステップ1411,YES)、特定部413は、その調査対象のポイントに“1”を加算する(ステップ1412)。
【0098】
次に、特定部413は、構成変更情報423から、特定された各調査対象を検索し、構成変更情報423に何れかの調査対象が存在するか否かをチェックする(ステップ1413)。構成変更情報423に何れかの調査対象が存在する場合(ステップ1413,YES)、特定部413は、その調査対象のポイントに“1”を加算する(ステップ1414)。
【0099】
次に、特定部413は、ポイントが付与された調査対象を含む調査支援情報425を生成し(ステップ1405)、調査支援情報425を端末装置302へ送信する(ステップ1406)。
【0100】
障害調査情報424に現象が存在しない場合(ステップ1408,NO)、特定部413は、通信部312を介して、障害調査情報424の修正を指示する修正依頼を端末装置302へ送信する(ステップ1415)。
【0101】
端末装置302は、受信した修正依頼を画面上に表示し、作業者は、修正依頼に従って、入力情報704に対応する補充情報を入力する。補充情報は、現象、対象箇所、障害内容(キーワード)、調査対象、及び資料を含む。通信部312は、入力された補充情報を端末装置302から受信し、特定部413は、受信した補充情報を障害調査情報424に追加する。そして、特定部413は、ステップ1408以降の処理を繰り返す。
【0102】
入力情報704にキーワードが含まれていない場合、又はキーワードが何れの調査対象にも対応付けられていない場合(ステップ1411,NO)、特定部413は、ステップ1415以降の処理を行う。入力情報704にキーワードが含まれていない場合、又はキーワードが何れの調査対象にも対応付けられていない場合、特定部413は、ステップ1415以降の処理の代わりに、ステップ1413以降の処理を行ってもよい。
【0103】
構成変更情報423に何れの調査対象も存在しない場合(ステップ1413,NO)、特定部413は、ステップ1405以降の処理を行う。構成変更情報423に何れの対象項目も存在しない場合(ステップ1404,NO)、特定部413は、ステップ1407以降の処理を行う。
【0104】
図1の情報処理装置101及び
図3のサーバ301の構成は一例に過ぎず、情報処理装置101又はサーバ301の用途又は条件に応じて、一部の構成要素を省略又は変更してもよい。例えば、
図3のサーバ301は、複数のSBを含んでいてもよく、各SBは、CPU及びメモリ以外のハードウェアを含んでいてもよい。
【0105】
図4のBMC321の構成は一例に過ぎず、サーバ301の構成又は条件に応じて、一部の構成要素を省略又は変更してもよい。
【0106】
図2、
図13、
図14A、及び
図14Bのフローチャートは一例に過ぎず、情報処理装置101又はサーバ301の構成又は条件に応じて一部の処理を省略又は変更してもよい。例えば、
図14A及び
図14Bの調査対象特定処理において、入力情報704にキーワードが含まれていない場合は、ステップ1411及びステップ1412の処理を省略することができる。
【0107】
図5に示した構成変更情報423及び
図6に示した障害調査情報424は一例に過ぎず、構成変更情報423及び障害調査情報424は、サーバ301の構成に応じて変化する。
図7に示した障害検出処理は一例に過ぎず、BMC321は、別の手順で障害検出処理を行ってもよい。
【0108】
図8に示したSELのメッセージは一例に過ぎず、SELのメッセージは、発生した障害に応じて変化する。
図9及び
図10に示した対象項目は一例に過ぎず、特定される対象項目は、SELに応じて変化する。
図11及び
図12に示した調査対象は一例に過ぎず、特定される調査対象は、入力情報に応じて変化する。
【0109】
図15は、
図3のBMC321のハードウェア構成例を示している。
図15のBMC321は、CPU1511及びメモリ1512を含む。
【0110】
メモリ1512は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリであり、処理に用いられるプログラム及びデータを格納する。メモリ1512は、
図4の記憶部411として動作する。
【0111】
CPU1511は、例えば、メモリ1512を利用してプログラムを実行することにより、
図4の抽出部412及び特定部413として動作する。
【0112】
オペレータ又はユーザは、不図示の可搬型記録媒体にプログラム及びデータを格納しておき、それらをメモリ1512にロードして使用することができる。可搬型記録媒体としては、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等が用いられる。可搬型記録媒体は、CD-ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USBメモリ等であってもよい。
【0113】
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1512又は可搬型記録媒体のような、物理的な(非一時的な)記録媒体である。
【0114】
なお、
図15のBMC321の構成は一例に過ぎず、サーバ301の構成又は条件に応じて一部の構成要素を省略又は変更してもよい。
【0115】
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
【0116】
図1乃至
図15を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を記憶するとともに、前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を記憶する記憶部と、
前記情報処理装置において発生した障害を示す入力情報を受け付ける受付部と、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する特定部と、
を備えることを特徴とする情報処理装置。
(付記2)
前記特定部は、前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに重みを付与し、前記入力情報が示す障害に対応する1つ又は複数の調査対象を前記重みに従って画面上に表示する情報を、前記調査支援情報として出力し、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記構成変更に対応する調査対象に付与された前記重みは、前記構成変更に対応することを示す重みを含むことを特徴とする付記1記載の情報処理装置。
(付記3)
前記障害調査情報は、前記情報処理装置に含まれる1つ又は複数の調査対象それぞれに対応付けられた障害発生部分を示す情報をさらに含み、
前記入力情報は、前記情報処理装置において発生した障害の障害発生部分を示す情報をさらに含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記入力情報に含まれる前記障害発生部分に対応する調査対象に付与された前記重みは、前記入力情報に含まれる前記障害発生部分に対応することを示す重みを含むことを特徴とする付記2記載の情報処理装置。
(付記4)
前記記憶部は、前記情報処理装置の構成を示す第1構成情報をさらに記憶し、
前記情報処理装置は、前記情報処理装置の構成を示す第2構成情報を取得し、前記第2構成情報と前記第1構成情報との差分を抽出し、前記差分を表す構成変更に対応する調査対象を前記構成変更情報に付加する抽出部をさらに備えることを特徴とする付記1乃至3の何れか1項に記載の情報処理装置。
(付記5)
前記障害情報に含まれる前記調査対象及び前記構成変更情報に含まれる前記調査対象は、前記情報処理装置に含まれるハードウェア又はソフトウェアであることを特徴とする付記1乃至4の何れか1項に記載の情報処理装置。
(付記6)
情報処理装置において発生した障害を示す入力情報を受け付け、
前記情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を取得し、
前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を取得し、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、
特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する、
処理を前記情報処理装置が実行することを特徴とする障害検出方法。
(付記7)
前記構成変更に対応する調査対象を特定する処理は、前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに重みを付与する処理を含み、
前記調査支援情報を出力する処理は、前記入力情報が示す障害に対応する1つ又は複数の調査対象を前記重みに従って画面上に表示する情報を、前記調査支援情報として出力する処理を含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記構成変更に対応する調査対象に付与された前記重みは、前記構成変更に対応することを示す重みを含むことを特徴とする付記6記載の障害検出方法。
(付記8)
前記障害調査情報は、前記情報処理装置に含まれる1つ又は複数の調査対象それぞれに対応付けられた障害発生部分を示す情報をさらに含み、
前記入力情報は、前記情報処理装置において発生した障害の障害発生部分を示す情報をさらに含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記入力情報に含まれる前記障害発生部分に対応する調査対象に付与された前記重みは、前記入力情報に含まれる前記障害発生部分に対応することを示す重みを含むことを特徴とする付記7記載の障害検出方法。
(付記9)
前記情報処理装置の構成を示す第1構成情報を取得し、
前記情報処理装置の構成を示す第2構成情報を取得し、
前記第2構成情報と前記第1構成情報との差分を抽出し、
前記差分を表す構成変更に対応する調査対象を前記構成変更情報に付加する、
処理を前記情報処理装置がさらに実行することを特徴とする付記6乃至8の何れか1項に記載の障害検出方法。
(付記10)
前記障害情報に含まれる前記調査対象及び前記構成変更情報に含まれる前記調査対象は、前記情報処理装置に含まれるハードウェア又はソフトウェアであることを特徴とする付記6乃至9の何れか1項に記載の障害検出方法。
【符号の説明】
【0117】
101 情報処理装置
111、411 記憶部
112 受付部
113、413 特定部
121、424 障害調査情報
122、423 構成変更情報
301 サーバ
302 端末装置
311 SB
312 通信部
313 DU
321 BMC
322-1、322-2、1511 CPU
323-1、323-2、1512 メモリ
412 抽出部
421 ハードウェア構成情報
422 ソフトウェア構成情報
425 調査支援情報
701 装置ログ
702 OSのログ
703、801~803 SEL
704 入力情報