(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022133745
(43)【公開日】2022-09-14
(54)【発明の名称】情報処理装置の故障、障害再現方法、再現プログラム、および再現装置
(51)【国際特許分類】
G06F 11/36 20060101AFI20220907BHJP
G06F 11/30 20060101ALI20220907BHJP
G06F 11/34 20060101ALI20220907BHJP
G06F 11/22 20060101ALI20220907BHJP
【FI】
G06F11/36 196
G06F11/30 158
G06F11/34 176
G06F11/22 675E
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021032611
(22)【出願日】2021-03-02
(71)【出願人】
【識別番号】000227205
【氏名又は名称】NECプラットフォームズ株式会社
(74)【代理人】
【識別番号】100106909
【弁理士】
【氏名又は名称】棚井 澄雄
(74)【代理人】
【識別番号】100134544
【弁理士】
【氏名又は名称】森 隆一郎
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(72)【発明者】
【氏名】金丸 利彦
【テーマコード(参考)】
5B042
5B048
【Fターム(参考)】
5B042HH26
5B042MA08
5B042MA14
5B042MC38
5B042MC40
5B048CC17
(57)【要約】
【課題】情報処理装置の故障、障害の再現を正確に行う。
【解決手段】本願の故障、障害再現方法は、複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現方法であって、故障、障害のデータをその発生タイミングとともに記録する工程S1と、前記ケーブルの振動を検出する工程S2と、検出された振動を発生タイミングとともに記録する工程S3と、記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する工程S4とを有する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現方法であって、
故障、障害のデータをその発生タイミングとともに記録する工程と、
前記ケーブルの振動を検出する工程と、
検出された振動を発生タイミングとともに記録する工程と、
記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する工程と、
を有する情報処理装置の故障、障害再現方法。
【請求項2】
故障、障害を再現する工程は、前記故障、障害が発生したモジュールを前記情報処理装置から取り外して、代替する新モジュールに交換した後、取り外した前記モジュールを前記故障、障害のデータに基づいて動作させることにより行われる、
請求項1に記載の情報処理装置の故障、障害再現方法。
【請求項3】
前記情報処理装置を構成するモジュールの実装状況、障害検出時の動作環境条件、障害検出時のテストパターン、テストシーケンス、前記障害が検出されたモジュール内に保存されている障害再現試験情報、の少なくともいずれかを利用して再現試験を行う、
請求項2に記載の情報処理装置の故障、障害再現方法。
【請求項4】
前記振動の検出は、前記ケーブルに設けられた振動センサにより行われる、請求項1~3のいずれか1項に記載の情報処理装置の故障、障害再現方法。
【請求項5】
検出される振動は、前記ケーブルに設けられたコネクタを前記モジュールに挿入し、あるいは前記モジュールから抜く際に発生した振動である、
請求項1~4のいずれか1項に記載の情報処理装置の故障、障害再現方法。
【請求項6】
複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現プログラムであって、
LOG記録部が、故障、障害のデータをその発生タイミングとともに記録する工程と、
振動記録部が、センサにより検出された前記ケーブルの振動を発生タイミングとともに記録する工程と、
再現装置が、前記LOG記録部に記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する工程と、
を有する情報処理装置の故障、障害再現プログラム。
【請求項7】
複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現装置であって、
故障、障害のデータをその発生タイミングともに記録したLOG記録部と、
振動センサに検出された前記ケーブルの振動を発生タイミングとともに記録した振動記録部と、
前記LOG記録部に記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する再現装置と、
を有する情報処理装置の故障、障害再現装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置の故障、障害再現方法、再現プログラム、および再現装置に関する。
【背景技術】
【0002】
CPU(Central Processing Unit)、メモリ、インターフェイス等の機能を持ち、保守交換単位毎に分割された複数のモジュールによって構成された情報処理装置の運用にあっては、ユーザーへ納入して初期設置段階での試験等を経て運用を開始した後、実際の運用に伴って発生した故障や障害を解消し、あるいは未然に防止するための定期的な保守作業を実施することが行われている。
【0003】
この初期設置時や定期的な保守作業において、故障、障害が検出された場合には、故障、障害再現試験結果として、障害被疑部位のモジュールを特定し、特定した障害被疑部位の一のモジュールを同機能の他の正常なモジュールに交換するのみならず、取り外された前記一のモジュールを製造元等の工場の保守部門に変換して故障原因を分析することがある。
【0004】
本願に関連する特許文献1に開示された再現試験では、前記情報処理装置が設置された現地において、障害発生の際のLOG情報、前記一のモジュール自体に記録された情報から採取された該当する障害情報、情報処理装置の構成/モジュール実装状況、障害検出時の動作環境条件(温度、電源電圧等)、及び障害検出時のテストパターン、テストシーケンスを利用して再現試験を行なう。この再現試験により、戻されてきた前記一のモジュールの障害を確認し、その原因を分析して、モジュール自体のあるいは使用環境の改善に利用することが行われている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2012-128489号公報
【特許文献2】特開2018-151710号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、前記特許文献1に記載されているような障害再現技術においては、工場の保守部門において、前記情報処理装置自体で取得することができる動作環境に関する情報には限りがあり、この特許文献1に例示された温度、動作電圧のみでは、必ずしも正確に障害を再現することができるものではない。
【0007】
また本願に関連する特許文献2には、情報処理装置が備えるコネクタの挿抜が情報処理装置に与える影響を判定する技術として、一のコネクタの振動が他のコネクタに与える影響を推定する技術が開示されているが、単にコネクタの振動を検出するだけでは、本願の目的とする再現試験に利用することができるものではない。
【0008】
本発明は、かかる問題に鑑みてなされたものであり、モジュールの故障、障害を再現して行われる試験の再現性を向上することを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本願の第1の態様にかかる情報処理装置の故障、障害再現方法は、複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現方法であって、故障、障害のデータをその発生タイミングとともに記録する工程と、前記ケーブルの振動を検出する工程と、検出された振動を発生タイミングとともに記録する工程と、記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する工程とを有する。
【0010】
また、本願の第2の態様にかかる故障、障害再現プログラムは、複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現プログラムであって、LOG記録部が、故障、障害のデータをその発生タイミングとともに記録する工程と、振動記録部が、センサにより検出された前記ケーブルの振動を発生タイミングとともに記録する工程と、再現装置が、前記LOG記録部に記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する工程とを有する。
【0011】
また、本願の第3の態様にかかる情報処理装置の故障、障害再現装置は、複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現装置であって、故障、障害のデータをその発生タイミングともに記録したLOG記録部と、振動センサに検出された前記ケーブルの振動を発生タイミングとともに記録した振動記録部と、前記LOG記録部に記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する再現装置とを有する。
【発明の効果】
【0012】
本発明では、モジュールの故障再現試験の再現性を向上することができる。
【図面の簡単な説明】
【0013】
【
図1】本発明の最少構成にかかる故障、障害再現方法の流れ図である。
【
図2】本発明の最少構成にかかる故障、再現装置のブロック図である。
【
図3】本発明の一実施形態により故障、障害再現される対象となる情報処理装置のブロック図である。
【
図5】本発明の一実施形態にかかる故障、障害再現方法の各工程を示す流れ図である。
【発明を実施するための形態】
【0014】
図1は、本願の情報処理装置の故障、障害再現方法の最少構成例を示すものである。この方法は、複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現方法であって、故障、障害のデータをその発生タイミングとともに記録する工程S1と、前記ケーブルの振動を検出する工程S2と、検出された振動を発生タイミングとともに記録する工程S3と、記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する工程S4とを有する。
【0015】
上記構成によれば、発生タイミングとともにケーブルの振動が記録されているから、故障、障害のデータに基づいてモジュールの動作を再現するに際し、故障、障害の発生タイミングとともに、同発生タイミング、あるいはその前後のケーブルの振動にかかるデータを参照することによって、当該モジュールに故障、障害が発生した状態にケーブルあるいはケーブルに直結したコネクタ等への振動の影響を加味した再現ができる。
【0016】
本願の情報処理装置の故障、障害再現プログラムは、
図1、2に示すように、複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現プログラムであって、LOG記録部1が、故障、障害のデータをその発生タイミングとともに記録する工程S1と、振動記録部2が、工程S2においてセンサにより検出された前記ケーブルの振動を発生タイミングとともに記録する工程S3と、再現装置3が、前記LOG記録部に記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する工程S4とを有する。
【0017】
上記構成によれば、LOG記録部1と振動記録部2とに記録されたデータに基づいて、前記モジュールが実際に動作した状態を再現することができる。
【0018】
また、本願の第3の態様にかかる情報処理装置の故障、障害再現装置は、
図2に示すように、複数のモジュールと、これらのモジュールの間を接続するケーブルとを備える情報処理装置の故障、障害再現装置であって、故障、障害のデータをその発生タイミングともに記録したLOG記録部1と、振動センサに検出された前記ケーブルの振動を発生タイミングとともに記録した振動記録部2と、前記LOG記録部に記録された故障、障害のデータと、これら故障、障害の発生タイミングのデータと、前記振動記録部に記録された振動のデータと、その発生タイミングのデータと、をリンクして、前記故障、障害を再現する再現装置3とを有する。
【0019】
上記構成によれば、LOG記録部1に記録されたLOGと、振動記録部2とに記録された振動とを発生タイミングとともに読み出すことにより、前記モジュールが実際に動作した状態を再現することができる。
【0020】
図3~
図5を参照して本発明の一実施形態を説明する。
図3は、本発明にかかる故障、障害再現方法が適用される情報処理装置10の構成例を示すものである。
この情報処理装置10は、CPU(Central Processing Unit)が搭載された(第1の)CPUモジュール11、(第2の)CPUモジュール12、これらと他の機器との間でデータを授受するインターフェイス機能を有する(第1の)IOモジュール13、(第2の)IOモジュール14、(第1の)メモリモジュール15(第2の)メモリモジュール16、(第1の)電源17、(第2の)電源18、(第1の)ファン19、(第2の)ファン20を主要な構成としている。
【0021】
前記各モジュールは、例えば、情報処理装置10のマザーボードに挿入、取り外し自在な回路基板に電子部品を搭載した構成を有する。なお前記電源17、18、ファン19、20は、前記CPUモジュール11、12、IOモジュール13、14、メモリモジュール15、16と同様にマザーボードに挿抜自在な基板に搭載した構造、あるいは、筐体に格納した構造のいずれであっても良い。
【0022】
ケーブル101は、前記(第1の)CPUモジュール11を前記(第1および第2の)IOモジュール13、14に接続する。ケーブル102は、前記(第1の)CPUモジュール11と(第2の)CPUモジュール12とを接続する。振動センサ111は、例えば加速度センサであって、前記ケーブル101の中間部(ケーブルの両端から離れた個所)に設けられていて、外力等によってケーブル101に加わる加速度を検出することにより、振動を検出する。振動センサ112は、前記振動センサ111と同様の構成であって、ケーブル102の中間部に生じる振動を検出する。
【0023】
ケーブル201は、前記(第1の)メモリモジュール15を(第1の)IOモジュール13に接続する。ケーブル202は、前記(第1の)メモリモジュール15を(第2の)IOモジュール14に接続する。ケーブル301は、前記(第2の)メモリモジュール16を(第1の)IOモジュール13に接続する。ケーブル302は、前記(第2の)メモリモジュール16を(第2の)IOモジュール14に接続する。振動センサ221は、前記ケーブル201の振動を検出し、振動センサ222は、前記ケーブル202の振動を検出する。
【0024】
ケーブル301は、前記(第2の)メモリモジュール16を(第1の)IOモジュール13に接続する。ケーブル302は、前記(第2の)メモリモジュール16を(第2の)IOモジュール14に接続する。
【0025】
ケーブル401、402は、前記電源17を前記CPUモジュール11、12に供給する。ケーブル501、502は、前記電源18を前記CPUモジュール11、12に供給する。ケーブル601、602は、前記電源17、18をファン19に供給する。ケーブル701、702は、前記電源17、18をファン20に供給する。
【0026】
通信系統801は、前記前記振動センサ111、112、221、222が検出した振動データを発生タイミング情報とともにエッジ情報採取装置A01へ供給し、通信系統901は、前記CPUモジュール11、12、IOモジュール13、14、メモリモジュール15、16で発生した障害、故障を含むLOGデータを発生タイミング情報とともに前記エッジ情報採取装置A01へ供給する。前記エッジ情報採取装置A01は、前記振動データ、LOGデータを回収し発生タイミングとともに記録、保存する。なお
図3では、便宜上、通信系統801と901とを別々の系として説明したが、共通であっても良いのはもちろんである。
【0027】
前記各モジュールを接続するケーブル101、102、201、202、301、302には、各モジュールに対して着脱可能なコネクタが設けられている。
このコネクタの構成の一例として、ケーブル201についての
図4を参照して説明する。
図4は、前記(第1の)メモリモジュール15とIOモジュール13、14との接続状態の詳細を示すものである。
前記IOモジュール14とメモリモジュール15とを接続するケーブル201は、一端にコネクタ251を有し、他端にコネクタ252を有する。前記コネクタ251は、IOモジュール14に設けられたコネクタ231の嵌合部241に着脱自在に接続されている。前記コネクタ252は、前記メモリモジュール15に設けられたコネクタ232の嵌合部242に着脱自在に接続されている。なお
図4にあっては、説明の便宜上、電気的な接続個所としての接点電極等を有するコネクタ231、232と、機械的な接続個所としてのケーシングや凹凸の嵌め合い構造を有する嵌合部241,242とを別々の位置に表現したが、実際の装置における構造が
図4に限定されるものでないのはもちろんである。
【0028】
前記振動センサ222は、前記IOモジュール14とメモリモジュール15とを結ぶケーブル201の途中の位置で、該ケーブル201に生じた振動を検出する。
以上、前記IOモジュール14とメモリモジュール15との間を結ぶケーブル201の振動センサ222の接続状態を拡大図である
図4にしたがって説明したが、他のモジュール間を接続するケーブル(例えば101、102、201、202等)についても、同様に両端または一端にコネクタを備え、このコネクタによって接続が行われている。
【0029】
図5を参照して、
図3のケーブル202で接続された、IOモジュール14とメモリモジュール15との間で故障、又は障害が発生して、通信速度を低下させたデグレード運用に移行した場合の動作とともに、故障、障害再現方法、プログラムの各工程を説明する。
ステップS11
あるユーザーで使用中の情報処理装置において、IOモジュール14とメモリモジュール15との間で故障、又は障害が発生すると、振動センサ222で検出された振動の検出値が、センサ情報として通信系統801を経由してエッジ情報採取装置A01に格納される。また故障、障害に関するLOG情報は、通信系統901を経由してエッジ情報採取装置A01に格納される。またエッジ情報採取装置A01は、回収したLOG情報を設定し、振動センサの情報が“有”の場合は、“勘合不正に着目した試験”を実施して再現させることで効率的に被疑特定につなげる。
ステップS12
故障、障害が検出されたモジュール(例えばIOモジュール14とメモリモジュール15)について、IOモジュール14、メモリモジュール15、およびこれらを接続するケーブル201の少なくともいずれかを取り外すとともに、故障、障害についてのLOG、振動センサ222に検出されたデータ等のエッジ情報としてエッジ情報採取装置A01へ送信する。
ステップS13
IOモジュール14、メモリモジュール15、およびこれらを接続するケーブル201のいずれかを同機能の正常な他のモジュール、ケーブルに交換する。交換の後、停止あるいは低速での動作から、通常の速度での動作へ戻す。
【0030】
故障、障害が発生した情報処理装置における処理が終了すると、前記エッジ情報採取装置A01に採取された装置から必要なデータを取り出し、オフラインまたはオンラインにて再現装置へデータを転送し、前記ステップS12で取り外したモジュールに対して、以下のステップによる再現試験を行う。
【0031】
ステップS14
再現試験装置にLOG、振動のデータをロードする。
ステップS15
振動についてのセンサ情報の有無を判定し、振動が検出されていれば次のステップS16へ、検出されていなければ、ステップS20へ進む。
ステップS16
振動に起因する障害、例えばケーブル201の両端のコネクタ251、252(プラグおよびまたはジャック)あるいはその相手側のコネクタ231、232(プラグおよびまたはジャック)の嵌合不良、あるいはケーブル201の断線やコネクタとの接続不良に基づくデータの欠落、通信の中断等に起因する故障、障害と判断し、例えば、振動の発生タイミングとLOG上の故障、障害の発生タイミングとが一致していれば、IOモジュール14とメモリモジュール15自身に起因する故障、障害ではないことを疑い、これらを動作させる。
ステップS17
モジュールの動作に故障、障害が再現されたか否かを判定し、再現されなければ、振動に起因する故障、障害と判断して、ステップS18へ進み、再現されれば、これらのIOモジュール14とメモリモジュール15のなくともいずれかの障害と判断してステップS23へ進む。
ステップS18
IOモジュール14あるいはメモリモジュール15に故障がないと判断して、もとの情報処理装置へ戻して再使用するか、もとの情報処理装置の予備として保管する。
【0032】
前記ステップS15において、センサ情報なしと判断した場合には、以下の処理を実行する。
ステップS20
前記ステップS17と同様にモジュールをLOGに基づいて動作させ、同様の故障が再現されたか否かを判定し、再現されなければ、振動に起因する故障、障害と判断して、ステップS21へ進み、再現されれば、振動に起因する故障、障害ではないと判断して、ステップS22へ進む。
ステップS21
振動に起因する故障、障害であるから、IOモジュール14あるいはメモリモジュール15に故障がないと判断して、もとの情報処理装置へ戻して再使用するか、もとの情報処理装置の予備として保管する。
ステップS22
振動に起因する故障、障害ではないと判断して、当該モジュールの修理、回路パターンの修復や実装部品の交換などを行った後、もとの情報処理装置へ戻して再利用するか、もとの情報処理装置の予備として保管する。
【0033】
一方、前記ステップS17において、故障、障害が再現されたと判断した場合には、以下の処理を実行する。
ステップS23
振動に起因する故障、障害ではないと判断して、当該モジュールの修理、回路パターンの修復や実装部品の交換などを行った後、もとの情報処理装置へ戻して再利用するか、もとの情報処理装置の予備として保管する。
【0034】
一実施形態にあっては、振動センサ111、112等を有しているので、ケーブル101、102等に生じた断線や接続不良に起因して故障、障害、機能/スピード低下が発生したか否かについて、交換したモジュールを動作させて行う再現試験の判断条件に取り込んだ上でモジュールの動作を試験するから、モジュール自体の不良に起因する故障、障害を的確に判定することができる。
【0035】
なお、一実施形態では、振動センサに検出された振動の発生タイミングを考慮したが、終了タイミング、あるいは継続時間を考慮して再現試験を行うようにしても良い。またあるケーブルに生じる振動には、自身に直接加わる振動(当該ケーブルに設けた振動センサにより検出された振動)のみならず、他のケーブルに加わった振動からいわゆる共振現象によって間接的に生じる振動も生じ得る。したがって、自身の振動センサのみならず、他のケーブルの振動センサに検出された振動の発生タイミング、終了タイミングを考慮して再現試験を行うようにしても良い。
本発明を適用して実行することができる再現試験の対象となる情報処理装置を構成するモジュールの機能、数、振動センサを設ける位置、数は一実施形態に限定されるものではなく、情報処理装置の構成、据え置きか移動体に設けられるか等の設置条件、再現試験に求められる精度、に応じて変更して実施しても良いのはもちろんである。
【0036】
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【産業上の利用可能性】
【0037】
本発明は、情報処理装置の故障、障害再現方法、再現プログラム、および再現装置に利用することができる。
【符号の説明】
【0038】
1 LOG記録部
2 振動記録部
3 再現装置
10 情報処理装置
11、12 CPUモジュール
13、14 IOモジュール
15、16 メモリモジュール
17、18 電源
19、20 ファン
101、102、201、202、301、302、401、402、501、502、601、602、701,702 ケーブル
111、112、221、222 振動センサ
231、232、251、252 コネクタ
241、242 嵌合部
801、901 通信系統