IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECプラットフォームズ株式会社の特許一覧

特開2023-136144情報提供システム、情報提供方法およびプログラム
<>
  • 特開-情報提供システム、情報提供方法およびプログラム 図1
  • 特開-情報提供システム、情報提供方法およびプログラム 図2
  • 特開-情報提供システム、情報提供方法およびプログラム 図3
  • 特開-情報提供システム、情報提供方法およびプログラム 図4
  • 特開-情報提供システム、情報提供方法およびプログラム 図5
  • 特開-情報提供システム、情報提供方法およびプログラム 図6
  • 特開-情報提供システム、情報提供方法およびプログラム 図7
  • 特開-情報提供システム、情報提供方法およびプログラム 図8
  • 特開-情報提供システム、情報提供方法およびプログラム 図9
  • 特開-情報提供システム、情報提供方法およびプログラム 図10
  • 特開-情報提供システム、情報提供方法およびプログラム 図11
  • 特開-情報提供システム、情報提供方法およびプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023136144
(43)【公開日】2023-09-29
(54)【発明の名称】情報提供システム、情報提供方法およびプログラム
(51)【国際特許分類】
   G06F 11/07 20060101AFI20230922BHJP
   G06F 11/34 20060101ALI20230922BHJP
   G06F 16/908 20190101ALI20230922BHJP
【FI】
G06F11/07 151
G06F11/34 176
G06F16/908
【審査請求】有
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2022041608
(22)【出願日】2022-03-16
(71)【出願人】
【識別番号】000227205
【氏名又は名称】NECプラットフォームズ株式会社
(74)【代理人】
【識別番号】100106909
【弁理士】
【氏名又は名称】棚井 澄雄
(74)【代理人】
【識別番号】100134544
【弁理士】
【氏名又は名称】森 隆一郎
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(72)【発明者】
【氏名】戸成 健
(72)【発明者】
【氏名】鈴木 亮
【テーマコード(参考)】
5B042
5B175
【Fターム(参考)】
5B042JJ29
5B042MA08
5B042MA11
5B042MA14
5B175DA10
5B175FA01
5B175FB03
5B175HA01
(57)【要約】
【課題】ある事象について参考にする過去の事象を検索する際、時間的な情報も含めて事象を検索できるようにする。
【解決手段】情報提供システムが、情報機器システムが生成したログデータを取得するログ取得手段と、前記ログデータの特徴量を抽出する特徴抽出手段と、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出する検出手段と、得られた情報を出力する出力手段と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
情報機器システムが生成したログデータを取得するログ取得手段と、
前記ログデータの特徴量を抽出する特徴抽出手段と、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出する検出手段と、
得られた情報を出力する出力手段と、
を備える情報提供システム。
【請求項2】
前記特徴抽出手段は、前記ログデータの特徴量としてTF-IDFベクトルを算出し、
前記検出手段は、前記ログデータの特徴量としてのTF-IDFベクトルと、前記履歴情報に含まれる情報の特徴量として示されるTF-IDFベクトルとの類似度に基づいて、前記履歴情報から情報を検出する、
請求項1に記載の情報提供システム。
【請求項3】
前記特徴抽出手段は、前記情報機器システムの障害発生の所定時間前から障害発生時までのログデータの特徴量を抽出する、
請求項1または請求項2に記載の情報提供システム。
【請求項4】
前記検出手段は、前記特徴量に基づいて、前記情報機器システムの障害の被疑部品を推定する、
請求項1から3の何れか一項に記載の情報提供システム。
【請求項5】
過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加える前処理手段と、
前記学習データの各ログから抽出される特徴量のクラス分類を学習するモデル生成手段と、
をさらに備える、請求項1から4の何れか一項に記載の情報提供システム。
【請求項6】
クラス分類のための学習データに含まれる障害ログの特徴ベクトルに、正常系のログの特徴ベクトルの逆ベクトルを加算する学習データ特徴抽出手段と、
前記正常系のログの特徴ベクトルの逆ベクトルを加算された障害ログの特徴ベクトルを用いて前記クラス分類の学習を行うモデル生成手段と、
をさらに備える、請求項1から4の何れか一項に記載の情報提供システム。
【請求項7】
ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習するモデル生成手段をさらに備え、
前記検出手段は、前記モデルに基づいて、障害発生の予兆を検知する、
請求項1から4の何れか一項記載の情報提供システム。
【請求項8】
情報機器システムの障害発生事象に対する参考事象の、障害発生事象と特徴量の類似度とを示す情報を出力する出力手段
を備える情報提供システム。
【請求項9】
情報機器システムが生成したログデータを取得し、
前記ログデータの特徴量を抽出し、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、
得られた情報を出力する、
ことを含む情報提供方法。
【請求項10】
コンピュータに、情報機器システムが生成したログデータを取得することと、
前記ログデータの特徴量を抽出することと、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出することと、
得られた情報を出力することと、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報提供システム、情報提供方法およびプログラムに関する。
【背景技術】
【0002】
情報機器システムの保守作業を支援する技術が提案されている。
例えば、特許文献1に記載の障害対応支援システムは、障害メールサーバからの障害メッセージに基づいて、類似する過去の障害対応から対応内容の候補を抽出することで、対応内容を取得する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2018-136656号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ある事象について参考にする過去の事象を検索する際、時間的な情報も含めて事象を検索できれば、より適切な事象を検出できることが期待される。
【0005】
本発明の目的の一例は、上述の課題を解決することのできる情報提供システム、情報提供方法およびプログラムを提供することである。
【課題を解決するための手段】
【0006】
本発明の第1の態様によれば、情報提供システムは、情報機器システムが生成したログデータを取得するログ取得手段と、前記ログデータの特徴量を抽出する特徴抽出手段と、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出する検出手段と、得られた情報を出力する出力手段と、を備える。
【0007】
本発明の第2の態様によれば、情報提供方法は、情報機器システムが生成したログデータを取得し、前記ログデータの特徴量を抽出し、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、得られた情報を出力する、ことを含む。
【0008】
本発明の第3の態様によれば、プログラムは、コンピュータに、情報機器システムが生成したログデータを取得することと、前記ログデータの特徴量を抽出することと、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出することと、得られた情報を出力することと、を実行させるためのプログラムである。
【発明の効果】
【0009】
本発明によれば、ある事象について参考にする過去の事象を検索する際、時間的な情報も含めて事象を検索することができる。
【図面の簡単な説明】
【0010】
図1】実施形態に係る保守管理システムの構成の例を示す図である。
図2】実施形態に係る学習部がログのクラス分類を学習する処理手順の例を示す図である。
図3】実施形態に係る前処理部が共通前処理を行う処理手順の例を示す図である。
図4】実施形態に係る特徴抽出部が、障害ログから正常系の影響を排除または軽減する処理の手順の例を示す図である。
図5】実施形態に係る情報機器システムで障害が発生した際に保守管理システムが類似事象をリコメンドする処理の手順の例を示す図である。
図6】実施形態に係るコサイン類似度を使用したリコメンドの出力の第1の例を示す図である。
図7】実施形態に係るコサイン類似度を使用したリコメンドの出力の第2の例を示す図である。
図8】実施形態に係るコサイン類似度を使用したリコメンドの出力の第3の例を示す図である。
図9】実施形態に係る情報提供システムの構成の例を示す図である。
図10】実施形態に係る情報提供システムの構成の、もう1つの例を示す図である。
図11】実施形態に係る情報提供方法における処理の手順の例を示す図である。
図12】少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0012】
図1は、実施形態に係る保守管理システムの構成の例を示す図である。図1に示す構成で、保守管理システム10は、学習部100と、リコメンド部200と、応対部門システム300と、応対履歴記憶部400とを備える。学習部100は、ログ情報記憶部110と、前処理部120と、特徴抽出部130と、モデル生成部140と、モデル記憶部150とを備える。リコメンド部200は、ログ取得部210と、前処理部220と、特徴抽出部230と、分析部240と、分析結果出力部250とを備える。
【0013】
また、図1には、保守作業端末装置40と、N個(Nは正の整数)の情報機器システム20とが示されている。情報機器システム20は、ログ情報記憶部21を備える。情報機器システム20は、例えば保守サービス提供対象顧客のシステムなど、障害発生時に保守管理システム10による情報提供の対象となるシステムである。
【0014】
情報機器システム20を区別する場合、情報機器システム20-1、・・・、情報機器システム20-Nと記載する。情報機器システム20が記憶するログ情報記憶部21を区別する場合、情報機器システム20-1、・・・、情報機器システム20-Nに応じてログ情報記憶部21-1、・・・、21-Nと表記する。
保守作業端末装置40は、保守作業者が使用する端末装置である。保守作業端末装置40は、例えば、情報機器システムからログ等の情報を取得して保守管理システム10へ転送するために用いられる。
【0015】
保守管理システム10は、障害受付やログ情報などの保守情報を収集する。また、保守管理システム10は、障害発生時に類似事象の情報を選択し提供する。情報を選択し提供することをリコメンドとも称する。
保守管理システム10は、情報提供システムの例に該当する。
【0016】
学習部100は、過去事象を学習し、学習結果を記録する。
ログ情報記憶部110は、過去の障害ログを記憶する。特に、ログ情報記憶部110は、過去の障害ログと、障害ログのクラス分類の正解を示す目標ラベルとが紐付けられた学習データを記憶する。ここでいう障害ログは、障害発生時を含む時間帯で記録されたログである。
なお、保守管理システム10の構成は、物理的なサーバを用いる構成に限定されない。保守管理システム10が、クラウド上の仮想サーバを用いて構成されていてもよい。
【0017】
前処理部120は、タイムスタンプ付きのログをボキャブラリーに分解するなど、特徴抽出の前処理を行う。ここでいうボキャブラリーは、単語または文節など文を構成する部品である。
また、前処理部120は、ログ情報記憶部が記憶する学習データについて、目標ラベルに示されるクラスのうちデータの個数(そのクラスに分類される障害ログの個数)が少ないクラスの有無を判定する。データの個数が少ない(例えば、所定の個数以下の)クラスがあると判定した場合、前処理部120は、そのクラスに分類されるデータ(目標ラベル付き障害ログ)を、ログの採取時間帯を変更してコピーし、学習データに加える。
前処理部120は、前処理手段の例に該当する。
【0018】
特徴抽出部130は、ログごとのボキャブラリーをTF-IDF(Term Frequency - Inverse Document Frequency)ベクトル化するなど、ログに対する特徴抽出を行う。
特に、特徴抽出部130は、障害ログのTF-IDFベクトル(特徴ベクトル)に、正常系ログのTF-IDFベクトルの逆ベクトルを加算する。ここでいう正常系は、正常な状態または動作である。正常系は、正常時の状態または動作であってもよいが、障害発生時であっても正常状態または正常動作を抽出したものであってもよい。正常系のログは、正常時のログであってもよいが、障害発生時のログから正常状態または正常動作によるログメッセージを抽出したものであってもよい。
特徴抽出部130は、学習データ特徴抽出手段の例に該当する。
特徴ベクトルは、TF-IDFベクトルに限定されるものではなく、BERT(Bidirectional Encoder Representations from Transformers)など文章をベクトル化できるものなら他の手法でもかまわない。
【0019】
モデル生成部140は、TF-IDFベクトルなどの特徴量の、目標ラベルによる障害のクラス分類を学習する。特徴量のクラス分類は、その特徴量の抽出元のログのクラス分類、または、そのログの記録の際に発生した障害のクラス分類と捉えることもできる。
目標ラベルとして、例えば、障害事象(障害の種類)または被疑部品、あるいはこれらの組み合わせを用いることができる。
モデル生成部140は、モデル生成手段の例に該当する。
モデル記憶部150は、特徴量のクラス分類の学習結果として得られたモデルを記憶する。
【0020】
リコメンド部200は、情報機器システム20で障害が発生した場合に障害ログを取得し、過去の類似事象をリコメンドする。
ログ取得部210は、情報機器システム20で障害が発生した場合にログを取得する。情報機器システム20で障害が発生した場合、障害が発生した情報機器システム20内のログ情報記憶部21へ障害ログが格納される。ログ取得部210は、この障害ログを取得する。
ログ取得部210は、ログ取得手段の例に該当する。
【0021】
情報機器システム20からログ取得部210へのログの伝送方法は特定の方法に限定されない。例えば、保守作業者が情報機器システム20の保守作業を行い、保守作業端末装置40または外付けの記録媒体を用いてログを採取し、保守作業端末装置40または外付けの記録媒体をログ取得部210へ持ち運ぶようにしてもよい。あるいは、情報機器システム20が、通信回線を用いて応対部門システム300にログを自動送信するようにしてもよい。あるいは、自動または人手によってメール添付などで送付されたログが、ログ取得部210に入力されるようにしてもよい。
【0022】
前処理部220は、ログ取得部210が取得したログに対して、前処理部120と同様の前処理を行う。
特徴抽出部230は、前処理部220が前処理を行ったログに対して、特徴抽出部130の場合と同様の特徴抽出を行う。特徴抽出部230は、ログごとにボキャブラリーをTF-IDFベクトル化する。
特徴抽出部230は、特徴抽出手段の例に該当する。
【0023】
分析部240は、特徴抽出部230が算出したTF-IDFベクトルに基づいて、情報機器システム20に関する履歴情報から、障害発生事象の類似事象を検出する。具体的には、分析部240は、情報機器システム20の過去のログデータから算出されたTF-IDFベクトルと、特徴抽出部230が算出したTF-IDFベクトルとのコサイン類似度に基づいて類似事象を検出し、検出した類似事象の情報を取得する。
【0024】
また、分析部240は、モデル記憶部150からモデルをロードし、TF-IDFベクトルをモデルに入力して、障害事象または被疑部品、あるいはこれらの組み合わせを推定する。
分析部240は、検出手段の例に該当する。
分析結果出力部250は、類似事象の情報を出力(提供)する。
分析結果出力部250は、出力手段の例に該当する。
【0025】
応対部門システム300は、コールセンターなどのオペレータや障害対応WebシステムなどにおけるChatbotなどの自動会話プログラムなどを指す。
応対履歴記憶部400は、保守作業者が応対した障害に対する障害発生時刻、発生事象、障害発生装置、障害部品、処置内容などを記憶する。
【0026】
リコメンド結果に類似度の低い事象しかリコメンドできていない場合、または、類似度上位数個で選択した事象が障害発生事象と異なる場合、保守管理システム10が、人手によるログ解析と再学習要求を提案するようにしてもよい。保守管理システム10は、再学習を要求されたログに対して、障害対応結果から正解の発生事象区分、障害部品区分のラベルを付けて学習データに加え、学習を再度行い、データベースとクラス分類モデルを更新する。
【0027】
図2は、学習部100がログのクラス分類を学習する処理手順の例を示す図である。図2の処理の前に、ログ情報記憶部110が、過去に発生した障害のログ情報を蓄積しておく。学習部100は、蓄積された障害ログを用いて、図2の処理による学習を実施する。
図2の処理で、学習部100は、ログ情報記憶部110から学習用として過去に発生した障害ログを取り出し、前処理部120に引き渡す(ステップS101)。
【0028】
前処理部120は、学習時および障害発生時に共通の前処理を行う(ステップS102)。この前処理を共通前処理とも称する。
共通前処理の後、前処理部120は、希少事象の有無を判定する(ステップS202)。具体的には、前処理部120は、学習データに対する目標ラベルを確認する。目標ラベルとして、障害事象または被疑部品、あるいはこれらの組み合わせを用いることができる。目標ラベルは、学習データとしての障害ログに、正解(教師データ)として紐付けられているものとする。
目標ラベルに対して学習データ数が一定数以下の事象を希少事象とし、前処理部120は、希少事象が存在するかを判断する。
【0029】
希少事象が存在すると判定した場合(ステップS202:YES)、前処理部120は、希少事象の学習データを取得する(ステップS111)。
そして、前処理部120は、取得した希少事象の学習データについて、障害発生からどれくらい前までのログデータを切り出すかを決める所定時間を変更する(ステップS112)。
ステップS112の後、処理がステップS102へ戻る。
【0030】
この場合、学習部100は、新たに取得したデータについて、ステップS112で決定した指定時間のログデータをステップS102で切り出す。学習部100は、切り出し後のデータを、希少事象と判定された元のデータとは別の前処理済みデータとして扱う。学習部100は、希少事象が存在しなくなるまで、ステップS103、S111、S112、S102のループを繰り返す。
【0031】
一方、ステップS202で、希少事象が存在しないと前処理部120が判定した場合(ステップS202:NO)、特徴抽出部130は、各学習データに対してTF-IDFベクトルを計算する(ステップS121)。
そして、特徴抽出部130は、正常系の影響を排除または軽減する処理を行う(ステップS122)。
特徴抽出部130は、正常系の影響を排除または軽減したTF-IDFベクトルをモデル記憶部150に記憶させる(ステップS123)。
【0032】
次に、モデル生成部140は、TF-IDFベクトルを特徴量とし、障害事象または被疑部品、あるいはこれらの組み合わせを目標ラベルとしてクラス分類の学習を実施する(ステップS124)。ここでのクラス分類モデルは、特定のものに限定されない。例えば、モデル生成部140が、サポートベクターマシン(Support Vector Machine;SVM)、または、深層学習(Deep Learning)を用いるようにしてもよいが、これに限定されない。
モデル生成部140は、学習で得られたクラス分類モデルをモデル記憶部150に記憶させる(ステップS125)。
ステップS125の後、学習部100は、図2の処理を終了する。
【0033】
図3は、前処理部120が共通前処理を行う処理手順の例を示す図である。前処理部120は、図2のステップS102で図3の処理を行う。
図3の処理で、前処理部120は、ログデータから、障害発生時刻の所定時間前から障害発生時刻までのログを取り出す(ステップS201)。
【0034】
そして前処理部120は、ログをボキャブラリーに分割する(ステップS202)。前処理部120がログをボキャブラリーに分割する方法は、特定の方法に限定されない。ここでは、前処理部120が形態素解析を行う場合を例に説明する。他にも、タイムスタンプ以外のログメッセージをトークンに分割し、クラスタリングアルゴリズムを適用して分類する方法などが考えられる。
ステップS202の後、前処理部120は、図3の処理を終了する。
【0035】
図4は、特徴抽出部130が、障害ログから正常系の影響を排除または軽減する処理の手順の例を示す図である。特徴抽出部130は、図2のステップS122で図4の処理を行う。
図4の処理で、特徴抽出部130は、ログ情報記憶部110から正常系のログを取得する(ステップS301)。
【0036】
そして、特徴抽出部130は、取得した正常系ログに対して、共通前処理を実施する(ステップS302)。ステップS302は、ステップS102と同様であり、特徴抽出部130は、ステップS302で図3の処理を行う。この場合、上記の図3の処理の説明で、前処理部120を特徴抽出部130と読み替える。
【0037】
次に、特徴抽出部130は、前処理が完了した正常系のログに対してTF-IDFベクトルを計算する(ステップS303)。
そして、特徴抽出部130は、正常系の影響を排除または軽減したい障害ログのTF-IDFベクトルに正常系ログのTF-IDFベクトルの逆ベクトルを加算する(ステップS304)。
ステップS304の後、特徴抽出部130は、図4の処理を終了する。
【0038】
図5は、情報機器システム20で障害が発生した際に保守管理システム10が類似事象をリコメンドする処理の手順の例を示す図である。
図5の処理で、ログ取得部210は、情報機器システム20の障害ログを取得する(ステップS401)。情報機器システム20での障害発生を契機にログ情報記憶部21に障害ログが格納される。ログ取得部210は、この障害ログを取得する。上記のように、情報機器システム20からログ取得部210へのログの伝送方法は特定の方法に限定されない。
【0039】
次に、前処理部220は、共通前処理を行う(ステップS402)。ステップS402は、ステップS102と同様であり、前処理部220は、ステップS402で図3の処理を行う。この場合、上記の図3の処理の説明で、前処理部120を前処理部220と読み替える。
【0040】
また、リコメンド部200は、モデル記憶部150からTF-IDFベクトルをロードしておく(ステップS403)。
次に、特徴抽出部230は、障害ログのTF-IDFベクトル計算を実行する(ステップS404)。
【0041】
そして、特徴抽出部230は、正常系の影響を排除または軽減する処理を行う(ステップS405)。ステップS405は、ステップS122と同様であり、特徴抽出部230は、ステップS405で図4の処理を行う。この場合、上記の図4の処理の説明で、特徴抽出部130を特徴抽出部230と読み替える。
【0042】
次に、分析部240は、正常系の影響を排除または軽減された障害ログのTF-IDFベクトルと、ステップS403でロードされた学習TF-IDFとの類似度を計算する(ステップSS406)。ここでの類似度は、特定のものに限定されない。例えば、分析部240が、類似度としてユークリッドノルムまたはコサイン類似度(Cosine Similarity)を計算するようにしてもよいが、これらに限定されない。
【0043】
次に、分析部240は、モデル記憶部150からクラス分類モデルをロードする(ステップS407)。
そして、分析部240は、障害ログのTF-IDFベクトルをクラス分類モデルに入力してクラス分類を実施する(ステップS408)。
【0044】
分析結果出力部250は、ステップS406で得られた類似度上位の過去事象、ステップS408で得られたクラス分類結果、および、直接ログ確認の必要性を示すメッセージをリコメンドとしてまとめ、生成したリコメンドを出力する(ステップS409)。
ステップS409の後、リコメンド部200は、図5の処理を終了する。
【0045】
図6は、コサイン類似度を使用したリコメンドの出力の第1の例を示す図である。図6は、保守管理システム10が、障害発生事象と同一事象を高い類似度でリコメンドできている場合の例を示す。具体的には、保守管理システム10がリコメンドしている事象は何れも、障害発生事象と同じ「ディスク障害」となっている。また、保守管理システム10がリコメンドしている事象と障害発生事象とのコサイン類似度は、0.89から0.92の範囲と比較的高い類似度となっている。
【0046】
保守管理システム10が、図6に例示されるリコメンドの出力に、それぞれの事象の保守業務日誌のリンクを張るなど、各事象の関連書類を紐付けて保守作業者に提示するようにしてもよい。保守作業者は、関連書類を参照して、障害発生事象への対応の参考にすることができる。
【0047】
図7は、コサイン類似度を使用したリコメンドの出力の第2の例を示す図である。図7は、保守管理システム10が、障害発生事象と同一事象をリコメンドできているが、類似度が低い場合の例を示す。図6の場合と同様、図7でも保守管理システム10は、障害発生事象と同じ「ディスク障害」をリコメンドしている。一方、保守管理システム10がリコメンドしている事象のコサイン類似度は、0.30から0.42の範囲と比較的低い類似度になっている。
【0048】
このような場合、保守管理システム10が、人手によるログ解析と再学習要求を提案するようにしてもよい。再学習要求を受けた保守管理システム10は、目標ラベルとなっている障害事象または被疑部品、あるいはこれらの組み合わせを確認し、新たにラベルを付け学習データに加えて再学習を実施する。保守管理システム10は、例えば、図2に示す処理手順にて再学習を実施する。
【0049】
図8は、コサイン類似度を使用したリコメンドの出力の第3の例を示す図である。図8は、保守管理システム10が、障害発生事象と異なる事象をリコメンドしている場合の例を示す。図8の例では、保守管理システム10がリコメンドしている事象は「ディスク障害」、「経路障害」および「電圧異常」となっている。
【0050】
このように、リコメンドする事象がバラバラになっている場合、保守管理システム10は、障害発生事象と異なる事象をリコメンドしていると判定することができる。
図8の例のように、保守管理システム10が、障害発生事象と異なる事象をリコメンドしている場合も、図7の例の場合と同様、保守管理システム10が、人手によるログ解析と再学習要求を提案するようにしてもよい。
【0051】
保守管理システム10が、障害発生時刻の所定時間前から障害発生時刻までのログをさらに時間分割して、時間毎のログ同士の順序性、または、シーケンスの類似度もリコメンドするようにしてもよい。例えば、保守管理システム10が、障害発生30分前から障害発生時刻までのログを取り出し、さらに1分間隔で30個のログに分割する。これにより、保守管理システム10が、タイムスタンプ付き操作ログにおける操作誤り(操作漏れ、順序誤り)についてもリコメンドできると期待される。
【0052】
保守管理システム10が、障害発生時の情報提供に加えて、あるいは代えて、障害の予兆検知を行うようにしてもよい。例えば、tを時刻とし、Δtを時間幅として、時間区間1はtからt-Δtまで、時間区間2はt-Δtからt-2Δまで、時間区間3はt-2Δtからt-3Δtまで、…と時間区間を設定する。
【0053】
保守管理システム10は、学習用の障害ログを時間区間ごとに分割し、それぞれのログと区間に対して、上述した方法で学習を行う。例えば、特徴抽出部130が、学習用の障害ログが分割された時間区間ごとに、その時間区間における特徴量を抽出しておく。特徴抽出部130は、障害ごと(障害の種類ごと)、かつ、時間区間ごとに、特徴量を抽出しておく。そして、モデル生成部は、障害ごと、かつ、時間区間ごとに、モデルに入力される特徴量が、その障害、かつ、その時間区間のクラスに分類される尤度(特徴量の類似度)を算出するモデルを、学習にて生成し、モデル記憶部150に記憶させておく。ここでの時間区間ごとは、障害発生までの予測時間に対応付けることができる。
【0054】
そして、保守管理システム10は、新規のログに対して上述した方法と同様の方法で類似度を算出し、どの障害のどの区間と類似度が高いか判定する。例えば、特徴抽出部230は、ログ取得部210が取得したログのうち、特徴抽出部130の場合と同じ時間幅の直近分(ログでの最新の時刻から時間幅分)の特徴量を算出する。分析部240は、特徴抽出部230が算出した類似度をモデルに入力し、クラス分類の尤度(特徴量の類似度)が最も高いクラス(障害かつ時間区間)の尤度を算出する。算出した尤度が所定の閾値以上に大きい場合、分析部240は、そのクラス(尤度がもっとも高いクラス)の障害が、そのクラスの時間区間が示す時間経過後に発生する予兆を検出したと判定する。
【0055】
これにより保守管理システム10は、特定の部品が故障する何分前や何日前と類似しているかをリコメンドすることができ、保守管理システム10のリコメンドを、障害予兆のリコメンドとしても使用できる。
あるいは、学習部100が、複数の時間区間分のログに基づいて、障害の予兆検知を行うようにしてもよい。例えば、モデル生成部140が、複数の時間区間分の特徴量の入力を受けるモデルを生成するようにしてもよい。
【0056】
情報機器システム20によっては、セキュリティ等の関係でログを持ち出せないことが考えられる。このような場合、保守管理システム10が学習したクラス分類モデルとリコメンド部200とをお客さまサイトに設置するようにしてもよい。これにより、ログを持ち出せない環境下においても、保守管理システム10へログを伝送する場合と同様のリコメンドを実現できる。
【0057】
保守管理システム10は、例えば、情報処理システム、情報処理機器、ソフトウェア、あるいは、それらの構成要素の保守運用におけるインシデント・障害の被疑、障害予兆の特定・解析支援に用いることができる。
また、保守管理システム10は、情報機器システムの障害に対するリコメンドに限らず、タイムスタンプ付きのログを取得できるいろいろなものを対象とすることがでる。例えば、保守管理システム10が、ある時間幅の間に表れた症状を電子カルテなどから読み取り、その症状から推定される重大な症状、および、発症が予想される時期を示す情報を出力するようにしてもよい。さらに例えば、保守管理システム10が、肩こり、言葉が出ない、めまいなどの症状を電子カルテから読み取って、「脳梗塞を発症する3日前の症状と類似しています」といったメッセージを医師に提示するようにしてもよい。
【0058】
以上のように、ログ取得部210は、情報機器システム20が生成したログデータを取得する。特徴抽出部230は、ログデータの特徴量を抽出する。分析部240は、情報機器システム20に関する履歴情報から、特徴量に基づいて情報を検出する。分析結果出力部250は、得られた情報を出力する。
【0059】
保守管理システム10によれば、情報機器システム20のログデータを用いて事象を検索することで、ログが記録されている時間分の情報を用いて事象を検索することができる。保守管理システム10によれば、このように、ある事象について参考にする過去の事象を検索する際、時間的な情報も含めて事象を検索することができる。
【0060】
また、保守管理システム10によれば、ログデータを使用することで主観や表記ゆれなどを排除することができ、リコメンド精度を向上させることができる。
また、保守管理システム10では、障害発生時から所定時間前までの時間幅のログデータを用いている。これにより一つの装置で過去に複数回障害が発生している場合に一度のログ採取で障害回数分の学習データを採取でき、学習データ収集を効率化させることができる。
【0061】
保守管理システム10によれば、情報処理システム、情報処理装置、ソフトウェア、あるいは、それらの構成要素における保守管理・インシデント管理において、応対履歴から障害被疑の解析支援をすることができる。
【0062】
また、保守管理システム10の機能を実行可能な環境があれば、どのような情報処理システム、情報処理装置、ソフトウェアにおいても情報を提供することができる。例えば、セキュリティ等の関係でログを持ち出せないような環境でも、その環境内で保守管理システム10の機能を実行して情報を提供することができる。
【0063】
また、保守管理システム10によれば、障害解析に限らず、インシデント発生前に異常と判定したものをインシデントの予兆として扱うことができ、障害発生前に対処を促すことができる。
また、保守管理システム10では、特徴抽出部130がログの特徴量を抽出した後は、ログ情報記憶部110が記憶するログ情報を削除することができる。保守管理システム10によれば、この点で、保持する情報量を削減することもできる。
【0064】
また、特徴抽出部230は、ログデータの特徴量としてTF-IDFベクトルを算出する。分析部240は、ログデータの特徴量としてのTF-IDFベクトルと、履歴情報に含まれる情報の特徴量として示されるTF-IDFベクトルとの類似度に基づいて、履歴情報から情報を検出する。
【0065】
これにより、保守管理システム10では、ログにおける単語などボキャブラリーの個数ないし頻度に基づいて類似度を算出することができ、ログ内でのボキャブラリーの位置の違いの類似度への影響を除外することができる。保守管理システム10によれば、この点で、障害事象の類似度を高精度に判定できると期待される。
【0066】
また、特徴抽出部230は、情報機器システム20の障害発生の所定時間前から障害発生時までのログデータの特徴量を抽出する。
保守管理システム10によれば、ログのすべてを用いるのではなく、障害発生時から所定時間前までの時間幅のログデータを用いることで、障害が発生する前の予兆が特徴量に現れ易いことが期待される。保守管理システム10によれば、この点で、リコメンド精度を向上させることができる。
【0067】
また、分析部240は、特徴量に基づいて、情報機器システム20の障害の被疑部品を推定する。
これにより、保守管理システム10では、TF-IDFベクトルの類似度だけでなく、障害の被疑部品の情報も用いて参考の事象を検索することができ、この点で、より高精度なリコメンドを実施することができる。
【0068】
また、分析部240は、特徴量に基づいて、情報機器システム20の障害発生事象を推定する。
これにより、保守管理システム10では、TF-IDFベクトルの類似度だけでなく、障害発生事象の情報も用いて参考の事象を検索することができ、この点で、より高精度なリコメンドを実施することができる。
【0069】
また、前処理部120は、過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加える。モデル生成部140は、学習データの各ログから抽出される特徴量のクラス分類を学習する。
保守管理システム10によれば、クラス分類の学習の際に、希少事象のデータを、ログの時間幅を変えて複数用意する点で、単純にデータをコピーする場合と比較してデータの揺らぎが生じる点で、より精度よく学習を行えることが期待される。
【0070】
また、特徴抽出部139は、クラス分類のための学習データに含まれる障害ログの特徴ベクトルに、正常系のログの特徴ベクトルの逆ベクトルを加算する。モデル生成部140は、正常系のログの特徴ベクトルの逆ベクトルを加算された障害ログの特徴ベクトルを用いてクラス分類の学習を行う。
保守管理システム10によれば、正常系のログの特徴ベクトルの逆ベクトルを障害ログの特徴ベクトルに加算することで正常系ログ記載の影響を排除または軽減することができ、この点で、リコメンド精度を向上させることができる。
【0071】
また、分析結果出力部250は、情報機器システム20の障害発生事象に対する参考事象の、障害発生事象と特徴量の類似度とを示す情報を出力する。
これにより、保守作業者など情報を参照する者は、情報を提示される事象と保守対象の障害発生事象との類似の程度を確認することができる。
【0072】
以上のことから、保守管理システム10によれば、過去の応対履歴によるインシデント・障害の被疑/発生原因/対処を高い精度で特定・リコメンドでき、障害予兆を高い精度で特定・リコメンドできる。
【0073】
図9は、実施形態に係る情報提供システムの構成の例を示す図である。図9に示す構成で、情報提供システム610は、ログ取得部611と、特徴抽出部612と、検出部613と、出力部614とを備える。
かかる構成で、ログ取得部611は、情報機器システムが生成したログデータを取得する。特徴抽出部612は、ログデータの特徴量を抽出する。検出部613は、情報機器システムに関する履歴情報から、特徴量に基づいて情報を検出する。出力部614は、得られた情報を出力する。
【0074】
ログ取得部611は、ログ取得手段の例に該当する。特徴抽出部612は、特徴抽出手段の例に該当する。検出部613は、検出手段の例に該当する。出力部614は、出力手段の例に該当する。
【0075】
情報提供システム610によれば、情報機器システムのログデータを用いて事象を検索することで、ログが記録されている時間分の情報を用いて事象を検索することができる。情報提供システム610によれば、このように、ある事象について参考にする過去の事象を検索する際、時間的な情報も含めて事象を検索することができる。
【0076】
また、情報提供システム610によれば、ログデータを使用することで主観や表記ゆれなどを排除することができ、リコメンド精度を向上させることができる。
また、情報提供システム610では、障害発生時から所定時間前までの時間幅のログデータを用いている。これにより一つの装置で過去に複数回障害が発生している場合に一度のログ採取で障害回数分の学習データを採取でき、学習データ収集を効率化させることができる。
【0077】
図10は、実施形態に係る情報提供システムの構成の、もう1つの例を示す図である。図10に示す構成で、情報提供システム620は、出力部621を備える。
かかる構成で、出力部621は、情報機器システムの障害発生事象に対する参考事象の、障害発生事象と特徴量の類似度とを示す情報を出力する。
出力部621は、出力手段の例に該当する。
【0078】
情報提供システム620によれば、保守作業者など情報を参照する者は、情報を提示される事象と保守対象の障害発生事象との類似の程度を確認することができる。
【0079】
図11は、実施形態に係る情報提供方法における処理の手順の例を示す図である。図11に示す情報提供方法は、ログを取得すること(ステップS611)と、特徴を抽出すること(ステップS612)と、情報を検出すること(ステップS613)と、情報を出力すること(ステップS614)とを含む。
ログを取得すること(ステップS611)では、情報機器システムが生成したログデータを取得する。特徴を抽出すること(ステップS612)では、取得したログデータの特徴量を抽出する。情報を検出すること(ステップS613)では、情報機器システムに関する履歴情報から、特徴量に基づいて情報を検出する。情報を出力すること(ステップS614)では、得られた情報を出力する。
【0080】
図11に示す情報提供方法によれば、情報機器システムのログデータを用いて事象を検索することで、ログが記録されている時間分の情報を用いて事象を検索することができる。図11に示す情報提供方法によれば、このように、ある事象について参考にする過去の事象を検索する際、時間的な情報も含めて事象を検索することができる。
【0081】
また、図11に示す情報提供方法によれば、ログデータを使用することで主観や表記ゆれなどを排除することができ、リコメンド精度を向上させることができる。
また、図11に示す情報提供方法では、障害発生時から所定時間前までの時間幅のログデータを用いている。これにより一つの装置で過去に複数回障害が発生している場合に一度のログ採取で障害回数分の学習データを採取でき、学習データ収集を効率化させることができる。
【0082】
図12は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
図16に示す構成で、コンピュータ700は、CPU710と、主記憶装置720と、補助記憶装置730と、インタフェース740と、不揮発性記録媒体750とを備える。
【0083】
上記の保守管理システム10、情報提供システム610、および、情報提供システム620の機能のうち何れか1つ以上またはその一部が、コンピュータ700に実装されてもよい。その場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。また、CPU710は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置720に確保する。各装置と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って通信を行うことで実行される。また、インタフェース740は、不揮発性記録媒体750用のポートを有し、不揮発性記録媒体750からの情報の読出、および、不揮発性記録媒体750への情報の書込を行う。
【0084】
保守管理システム10がコンピュータ700に実装される場合、保守管理システム10の各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0085】
また、CPU710は、プログラムに従って、保守管理システム10が処理を行うための記憶領域を主記憶装置720に確保する。保守管理システム10と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って動作することで実行される。保守管理システム10とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0086】
情報提供システム610がコンピュータ700に実装される場合、情報提供システム610の各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0087】
また、CPU710は、プログラムに従って、情報提供システム610が処理を行うための記憶領域を主記憶装置720に確保する。情報提供システム610と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って動作することで実行される。情報提供システム610とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0088】
情報提供システム620がコンピュータ700に実装される場合、情報提供システム620の各部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。
【0089】
また、CPU710は、プログラムに従って、情報提供システム620が処理を行うための記憶領域を主記憶装置720に確保する。情報提供システム620と他の装置との通信は、インタフェース740が通信機能を有し、CPU710の制御に従って動作することで実行される。情報提供システム620とユーザとのインタラクションは、インタフェース740が表示装置および入力デバイスを備え、CPU710の制御に従って各種画像の表示を行い、ユーザ操作を受け付けることで実行される。
【0090】
上述したプログラムのうち何れか1つ以上が不揮発性記録媒体750に記録されていてもよい。この場合、インタフェース740が不揮発性記録媒体750からプログラムを読み出すようにしてもよい。そして、CPU710が、インタフェース740が読み出したプログラムを直接実行するか、あるいは、主記憶装置720または補助記憶装置730に一旦保存して実行するようにしてもよい。
【0091】
なお、保守管理システム10、情報提供システム610、および、情報提供システム620が行う処理の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0092】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0093】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0094】
(付記1)
情報機器システムが生成したログデータを取得するログ取得手段と、
前記ログデータの特徴量を抽出する特徴抽出手段と、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出する検出手段と、
得られた情報を出力する出力手段と、
を備える情報提供システム。
【0095】
(付記2)
前記特徴抽出手段は、前記ログデータの特徴量としてTF-IDFベクトルを算出し、
前記検出手段は、前記ログデータの特徴量としてのTF-IDFベクトルと、前記履歴情報に含まれる情報の特徴量として示されるTF-IDFベクトルとの類似度に基づいて、前記履歴情報から情報を検出する、
付記1に記載の情報提供システム。
【0096】
(付記3)
前記特徴抽出手段は、前記情報機器システムの障害発生の所定時間前から障害発生時までのログデータの特徴量を抽出する、
付記1または付記2に記載の情報提供システム。
【0097】
(付記4)
前記検出手段は、前記特徴量に基づいて、前記情報機器システムの障害の被疑部品を推定する、
付記1から3の何れか一つに記載の情報提供システム。
【0098】
(付記5)
前記検出手段は、前記特徴量に基づいて、前記情報機器システムの障害発生事象を推定する、
付記1から4の何れか一つに記載の情報提供システム。
【0099】
(付記6)
過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加える前処理手段と、
前記学習データの各ログから抽出される特徴量のクラス分類を学習するモデル生成手段と、
をさらに備える、付記1から5の何れか一つに記載の情報提供システム。
【0100】
(付記7)
クラス分類のための学習データに含まれる障害ログの特徴ベクトルに、正常系のログの特徴ベクトルの逆ベクトルを加算する学習データ特徴抽出手段と、
前記正常系のログの特徴ベクトルの逆ベクトルを加算された障害ログの特徴ベクトルを用いて前記クラス分類の学習を行うモデル生成手段と、
をさらに備える、付記1から5の何れか一つに記載の情報提供システム。
【0101】
(付記8)
ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習するモデル生成手段をさらに備え、
前記検出手段は、前記モデルに基づいて、障害発生の予兆を検知する、
付記1から5の何れか一つ記載の情報提供システム。
【0102】
(付記9)
情報機器システムの障害発生事象に対する参考事象の、障害発生事象と特徴量の類似度とを示す情報を出力する出力手段
を備える情報提供システム。
【0103】
(付記10)
情報機器システムが生成したログデータを取得し、
前記ログデータの特徴量を抽出し、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、
得られた情報を出力する、
ことを含む情報提供方法。
【0104】
(付記11)
コンピュータに、情報機器システムが生成したログデータを取得することと、
前記ログデータの特徴量を抽出することと、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出することと、
得られた情報を出力することと、
を実行させるためのプログラム。
【符号の説明】
【0105】
10 保守管理システム
100 学習部
110 ログ情報記憶部
120、220 前処理部
130、230 特徴抽出部
140 モデル生成部
150 モデル記憶部
210 ログ取得部
240 分析部
250 分析結果出力部
300 応対部門システム
400 応対履歴記憶部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【手続補正書】
【提出日】2023-07-18
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加える前処理手段と、
前記学習データの各ログから抽出される特徴量のクラス分類を学習するモデル生成手段と、
情報機器システムが生成したログデータを取得するログ取得手段と、
前記ログデータの特徴量を抽出する特徴抽出手段と、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出する検出手段と、
得られた情報を出力する出力手段と、
を備える情報提供システム。
【請求項2】
前記特徴抽出手段は、前記ログデータの特徴量としてTF-IDFベクトルを算出し、 前記検出手段は、前記ログデータの特徴量としてのTF-IDFベクトルと、前記履歴情報に含まれる情報の特徴量として示されるTF-IDFベクトルとの類似度に基づいて、前記履歴情報から情報を検出する、
請求項1に記載の情報提供システム。
【請求項3】
前記特徴抽出手段は、前記情報機器システムの障害発生の所定時間前から障害発生時までのログデータの特徴量を抽出する、
請求項1または請求項2に記載の情報提供システム。
【請求項4】
前記検出手段は、前記特徴量に基づいて、前記情報機器システムの障害の被疑部品を推定する、
請求項1から3の何れか一項に記載の情報提供システム。
【請求項5】
クラス分類のための学習データに含まれる障害ログの特徴ベクトルに、正常系のログの特徴ベクトルの逆ベクトルを加算する学習データ特徴抽出手段
をさらに備え、
前記モデル生成手段は、前記正常系のログの特徴ベクトルの逆ベクトルを加算された障害ログの特徴ベクトルを用いて前記クラス分類の学習を行う
請求項1から4の何れか一項に記載の情報提供システム。
【請求項6】
前記モデル生成手段は、ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習し、
前記検出手段は、前記モデルに基づいて、障害発生の予兆を検知する、
請求項1からの何れか一項記載の情報提供システム。
【請求項7】
過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加え、
前記学習データの各ログから抽出される特徴量のクラス分類を学習し、
情報機器システムが生成したログデータを取得し、
前記ログデータの特徴量を抽出し、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、
得られた情報を出力する、
ことを含む情報提供方法。
【請求項8】
コンピュータに、
過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加えることと、
前記学習データの各ログから抽出される特徴量のクラス分類を学習することと、
情報機器システムが生成したログデータを取得することと、
前記ログデータの特徴量を抽出することと、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出することと、
得られた情報を出力することと、
を実行させるためのプログラム。
【請求項9】
ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習するモデル生成手段と、
情報機器システムが生成したログデータを取得するログ取得手段と、
前記ログデータの特徴量を抽出する特徴抽出手段と、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、前記モデルに基づいて、障害発生の予兆を検知する検出手段と、
得られた情報を出力する出力手段と、
を備える情報提供システム。
【請求項10】
前記特徴抽出手段は、前記ログデータの特徴量としてTF-IDFベクトルを算出し、 前記検出手段は、前記ログデータの特徴量としてのTF-IDFベクトルと、前記履歴情報に含まれる情報の特徴量として示されるTF-IDFベクトルとの類似度に基づいて、前記履歴情報から情報を検出する、
請求項9に記載の情報提供システム。
【請求項11】
前記特徴抽出手段は、前記情報機器システムの障害発生の所定時間前から障害発生時までのログデータの特徴量を抽出する、
請求項9または請求項10に記載の情報提供システム。
【請求項12】
前記検出手段は、前記特徴量に基づいて、前記情報機器システムの障害の被疑部品を推定する、
請求項9から11の何れか一項に記載の情報提供システム。
【請求項13】
過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加える前処理手段
をさらに備え、
前記モデル生成手段は、前記学習データの各ログから抽出される特徴量のクラス分類を学習する、
請求項9から12の何れか一項に記載の情報提供システム。
【請求項14】
クラス分類のための学習データに含まれる障害ログの特徴ベクトルに、正常系のログの特徴ベクトルの逆ベクトルを加算する学習データ特徴抽出手段
をさらに備え、
前記モデル生成手段は、前記正常系のログの特徴ベクトルの逆ベクトルを加算された障害ログの特徴ベクトルを用いて前記クラス分類の学習を行う、
請求項9から13の何れか一項に記載の情報提供システム。
【請求項15】
ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習し、
情報機器システムが生成したログデータを取得し、
前記ログデータの特徴量を抽出し、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、前記モデルに基づいて、障害発生の予兆を検知し、
得られた情報を出力する、
ことを含む情報提供方法。
【請求項16】
コンピュータに、
ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習することと、
情報機器システムが生成したログデータを取得することと、
前記ログデータの特徴量を抽出することと、
情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、前記モデルに基づいて、障害発生の予兆を検知することと、
得られた情報を出力することと、
を実行させるためのプログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正の内容】
【0006】
本発明の第1の態様によれば、情報提供システムは、過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加える前処理手段と、前記学習データの各ログから抽出される特徴量のクラス分類を学習するモデル生成手段と、情報機器システムが生成したログデータを取得するログ取得手段と、前記ログデータの特徴量を抽出する特徴抽出手段と、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出する検出手段と、得られた情報を出力する出力手段と、を備える。
本発明の第2の態様によれば、情報提供システムは、ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習するモデル生成手段と、情報機器システムが生成したログデータを取得するログ取得手段と、前記ログデータの特徴量を抽出する特徴抽出手段と、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、前記モデルに基づいて、障害発生の予兆を検知する検出手段と、得られた情報を出力する出力手段と、を備える。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正の内容】
【0007】
本発明の第の態様によれば、情報提供方法は、過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加え、前記学習データの各ログから抽出される特徴量のクラス分類を学習し、情報機器システムが生成したログデータを取得し、前記ログデータの特徴量を抽出し、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、得られた情報を出力する、ことを含む。
本発明の第4の態様によれば、情報提供方法は、ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習し、情報機器システムが生成したログデータを取得し、前記ログデータの特徴量を抽出し、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、前記モデルに基づいて、障害発生の予兆を検知し、得られた情報を出力する、ことを含む。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】
本発明の第の態様によれば、プログラムは、コンピュータに、過去の障害ログとクラス分類における正解クラスとが紐付けられた学習データについて、前記クラス分類におけるクラスのうちデータの個数が所定の条件よりも少ないクラスがあると判定した場合、そのクラスに分類されるデータを、ログの採取時間帯を変更してコピーし、学習データに加えることと、前記学習データの各ログから抽出される特徴量のクラス分類を学習することと、情報機器システムが生成したログデータを取得することと、前記ログデータの特徴量を抽出することと、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出することと、得られた情報を出力することと、を実行させるためのプログラムである。
本発明の第6の態様によれば、プログラムは、コンピュータに、ログを障害の種類ごと、かつ、障害発生までの時間を分割した時間区間ごとにクラス分類する尤度を算出するモデルを学習することと、情報機器システムが生成したログデータを取得することと、前記ログデータの特徴量を抽出することと、情報機器システムに関する履歴情報から、前記特徴量に基づいて情報を検出し、前記モデルに基づいて、障害発生の予兆を検知することと、得られた情報を出力することと、を実行させるためのプログラムである。