(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-10
(45)【発行日】2023-10-18
(54)【発明の名称】学習装置、学習方法、コンピュータプログラム及び記録媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20231011BHJP
【FI】
G06N20/00
(21)【出願番号】P 2021506243
(86)(22)【出願日】2020-02-17
(86)【国際出願番号】 JP2020006039
(87)【国際公開番号】W WO2020189132
(87)【国際公開日】2020-09-24
【審査請求日】2021-08-18
(31)【優先権主張番号】P 2019051063
(32)【優先日】2019-03-19
(33)【優先権主張国・地域又は機関】JP
【前置審査】
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【氏名又は名称】江上 達夫
(72)【発明者】
【氏名】飯澤 洋平
【審査官】渡辺 順哉
(56)【参考文献】
【文献】塚田 峰登 ほか,FPGAを用いたオンライン逐次学習による教師無し異常検知のための高効率化と安定化手法,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2018年07月23日,Vol. 118, No. 165,pp. 217-222(CPSY2018-30),ISSN 2432-6380
【文献】MALHOTRA, Pankaj ほか,Long Short Term Memory Networks for Anomaly Detection in Time Series,Proceedings of the 23rd European Symposium on Artificial Neural Networks,European Symposium on Artificial Neural Networks,2015年,pp. 89-94,[retrieved on 2020.03.31], Retrieved from the Internet: <URL: https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2015-56.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
時系列数値データを入力データとして機械学習を行う学習装置であって、
前記入力データとしての正常状態を示す時系列数値データである正常データを用いて前記機械学習を行うことにより、入力された時系列数値データに続く時系列数値データを予測して出力する学習モデルを生成する生成手段と、
前記正常データのうち第1期間の正常データを前記学習モデルに入力することにより、前記学習モデルにより予測された正常データである前記第1期間に続く第2期間の予測正常データと、前記正常データのうち前記第2期間の正常データとを比較して、前記第2期間の正常データと前記予測正常データとのずれの程度を示す第1の外れ度を取得する第1取得手段と、
異常状態を示す時系列数値データである異常データのうち第3期間の異常データを前記学習モデルに入力することにより、前記学習モデルにより予測された異常データである前記第3期間に続く第4期間の予測異常データと、前記異常データのうち前記第4期間の異常データとを比較して、前記第4期間の異常データと前記予測異常データとのずれの程度を示す第2の外れ度を取得する第2取得手段と、
前記第1の外れ度及び前記第2の外れ度に基づいて、前記正常データに係る正常状態を示す時系列パターンのうち、不足している時系列パターンを検出する検出手段と、
を備えることを特徴とする学習装置。
【請求項2】
前記検出された不足している時系列パターンを提示する提示手段を備えることを特徴とする請求項1に記載の学習装置。
【請求項3】
時系列数値データを入力データとして機械学習を行う学習方法であって、
学習装置が、前記入力データとしての正常状態を示す時系列数値データである正常データを用いて前記機械学習を行うことにより、入力された時系列数値データに続く時系列数値データを予測して出力する学習モデルを生成し、
前記学習装置が、前記正常データのうち第1期間の正常データを前記学習モデルに入力することにより、前記学習モデルにより予測された正常データである前記第1期間に続く第2期間の予測正常データと、前記正常データのうち前記第2期間の正常データとを比較して、前記第2期間の正常データと前記予測正常データとのずれの程度を示す第1の外れ度を取得し、
前記学習装置が、異常状態を示す時系列数値データである異常データのうち第3期間の異常データを前記学習モデルに入力することにより、前記学習モデルにより予測された異常データである前記第3期間に続く第4期間の予測異常データと、前記異常データのうち前記第4期間の異常データとを比較して、前記第4期間の異常データと前記予測異常データとのずれの程度を示す第2の外れ度を取得し、
前記学習装置が、前記第1の外れ度及び前記第2の外れ度に基づいて、前記正常データに係る正常状態を示す時系列パターンのうち、不足している時系列パターンを検出する、
ことを特徴とする学習方法。
【請求項4】
コンピュータに、
時系列数値データを入力データとして機械学習を行う学習方法であって、
前記入力データとしての正常状態を示す時系列数値データである正常データを用いて前記機械学習を行うことにより、入力された時系列数値データに続く時系列数値データを予測して出力する学習モデルを生成する生成工程と、
前記正常データのうち第1期間の正常データを前記学習モデルに入力することにより、前記学習モデルにより予測された正常データである前記第1期間に続く第2期間の予測正常データと、前記正常データのうち前記第2期間の正常データとを比較して、前記第2期間の正常データと前記予測正常データとのずれの程度を示す第1の外れ度を取得する第1取得工程と、
異常状態を示す時系列数値データである異常データのうち第3期間の異常データを前記学習モデルに入力することにより、前記学習モデルにより予測された異常データである前記第3期間に続く第4期間の予測異常データと、前記異常データのうち前記第4期間の異常データとを比較して、前記第4期間の異常データと前記予測異常データとのずれの程度を示す第2の外れ度を取得する第2取得工程と、
前記第1の外れ度及び前記第2の外れ度に基づいて、前記正常データに係る正常状態を示す時系列パターンのうち、不足している時系列パターンを検出する検出工程と、
を含む学習方法を実行させるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習方法、コンピュータプログラム及び記録媒体の技術分野に関する。
【背景技術】
【0002】
例えばディープラーニングに代表される機械学習の技術の進展により、例えば機器に取り付けられたセンサから出力される時系列数値データ(以降、適宜“時系列データ”と称する)に基づいて、該機器の異常を自動検出することに対するニーズが増えてきている。
【0003】
ところで、機械学習の技術では、高い精度を出すためには大量の教師データが必要である。機械学習により、上述した機器の異常を自動検出する学習モデルを構築するためには、教師データとしての、正常状態を示す時系列データ(以降、適宜“正常データ”と称する)と、異常状態を示す時系列データ(以降、適宜“異常データ”と称する)との両方を十分に収集する必要がある。しかしながら、実際には、機器の故障等に起因する異常データは、正常データに比べて非常に少ない。このため、上記学習モデルを構築するために十分な量の異常データを収集することが困難であるという技術的問題点がある。この問題点に対して、正常データのみを用いた機械学習により、正常データにより示される時系列パターンである正常パターンを学習させた後、学習された正常パターンに対する時系列データの逸脱度から異常を検出する技術が提案されている(特許文献1参照)。その他関連する技術として、特許文献2乃至7が挙げられる。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2018-124937号公報
【文献】国際公開第2017/94267号
【文献】国際公開第2014/132611号
【文献】特開2018-148350号公報
【文献】特開2017-91278号公報
【文献】特開2017-10111号公報
【文献】特開2004-94437号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
正常データのみを用いた機械学習により構築される学習モデルは精度が比較的低くなることが多い。なぜなら、様々な正常パターンを示す正常データを、網羅的且つ大量に収集することが実際には難しいからである。人手により、既に収集された正常データを分析して、不足している正常パターンを特定し、該特定された正常パターンを示す正常データを収集することは、膨大な時間やコストがかかり得策ではない。
【0006】
本発明は、上記問題点に鑑みてなされたものであり、機械学習に不足している正常パターンを検出することができる学習装置、学習方法、コンピュータプログラム及び記録媒体を提供することを課題とする。
【課題を解決するための手段】
【0007】
本発明の学習装置の一の態様は、時系列数値データを入力データとして機械学習を行う学習装置であって、前記入力データとしての正常状態を示す時系列数値データである正常データを用いて前記機械学習を行うことにより、入力された時系列数値データに対応する時系列数値データを予測して出力する学習モデルを生成する生成手段と、前記正常データのうち第1期間の正常データを前記学習モデルに入力することにより、前記学習モデルにより予測された正常データである前記第1期間に対応する第2期間の予測正常データと、前記正常データのうち前記第2期間の正常データとを比較して、前記第2期間の正常データと前記予測正常データとのずれの程度を示す第1の外れ度を取得する第1取得手段と、異常状態を示す時系列数値データである異常データのうち第3期間の異常データを前記学習モデルに入力することにより、前記学習モデルにより予測された異常データである前記第3期間に対応する第4期間の予測異常データと、前記異常データのうち前記第4期間の異常データとを比較して、前記第4期間の異常データと前記予測異常データとのずれの程度を示す第2の外れ度を取得する第2取得手段と、前記第1の外れ度及び前記第2の外れ度に基づいて、前記正常データに係る正常状態を示す時系列パターンのうち、不足している時系列パターンを検出する検出手段と、を備える。
【0008】
本発明の学習方法の一態様は、時系列数値データを入力データとして機械学習を行う学習装置における学習方法であって、前記入力データとしての正常状態を示す時系列数値データである正常データを用いて前記機械学習を行うことにより、入力された時系列数値データに対応する時系列数値データを予測して出力する学習モデルを生成する生成工程と、前記正常データのうち第1期間の正常データを前記学習モデルに入力することにより、前記学習モデルにより予測された正常データである前記第1期間に対応する第2期間の予測正常データと、前記正常データのうち前記第2期間の正常データとを比較して、前記第2期間の正常データと前記予測正常データとのずれの程度を示す第1の外れ度を取得する第1取得工程と、異常状態を示す時系列数値データである異常データのうち第3期間の異常データを前記学習モデルに入力することにより、前記学習モデルにより予測された異常データである前記第3期間に対応する第4期間の予測異常データと、前記異常データのうち前記第4期間の異常データとを比較して、前記第4期間の異常データと前記予測異常データとのずれの程度を示す第2の外れ度を取得する第2取得工程と、前記第1の外れ度及び前記第2の外れ度に基づいて、前記正常データに係る正常状態を示す時系列パターンのうち、不足している時系列パターンを検出する検出工程と、を含む。
【0009】
本発明のコンピュータプログラムの一の態様は、コンピュータに、上述した学習方法の一の態様を実行させる。
【0010】
本発明の記録媒体の一の態様は、上述したコンピュータプログラムの一の態様が記録された記録媒体である。
【発明の効果】
【0011】
上述した学習装置、学習方法、コンピュータプログラム及び記録媒体のそれぞれの一の態様によれば、機械学習に不足している正常パターンを検出することができる。
【図面の簡単な説明】
【0012】
【
図1】実施形態に係る学習装置のハードウェア構成を示すブロック図である。
【
図2】実施形態に係るCPU内で実現される機能ブロックを示すブロック図である。
【
図4】実施形態に係る学習動作を示すフローチャートである。
【
図5】実施形態に係る検証動作を示すフローチャートである。
【
図6】不足データの検出方法の概念を示す概念図である。
【
図7】変形例に係るCPU内で実現される機能ブロックを示すブロック図である。
【
図8】変形例に係る検証動作を示すフローチャートである。
【発明を実施するための形態】
【0013】
学習装置、学習方法、コンピュータプログラム及び記録媒体の実施形態を図面に基づいて説明する。以下では、教師データとしての正常データに不足している正常パターンを有する正常データ(以降、適宜“不足データ”と称する)を検出する学習装置1を用いて、学習装置、学習方法、コンピュータプログラム及び記録媒体の実施形態について説明する。
【0014】
(構成)
先ず、実施形態に係る学習装置1のハードウェア構成について
図1を参照して説明する。
図1は、実施形態に係る学習装置1のハードウェア構成を示すブロック図である。
【0015】
図1において、学習装置1は、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、記憶装置14、入力装置15及び出力装置16を備えている。CPU11、RAM12、ROM13、記憶装置14、入力装置15及び出力装置16は、データバス17を介して相互に接続されている。
【0016】
CPU11は、コンピュータプログラムを読み込む。例えば、CPU11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込んでもよい。例えば、CPU11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。CPU11は、ネットワークインタフェースを介して、学習装置1の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。CPU11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。当該実施形態では特に、CPU11が読み込んだコンピュータプログラムを実行すると、CPU11内には、不足データを検出するための論理的な機能ブロックが実現される。つまり、CPU11は、不足データを検出するためのコントローラとして機能可能である。尚、CPU11内で実現される機能ブロックの構成については、後に
図2を参照しながら詳述する。
【0017】
RAM12は、CPU11が実行するコンピュータプログラムを一時的に記憶する。RAM12は、CPU11がコンピュータプログラムを実行している際にCPU11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic RAM)であってもよい。
【0018】
ROM13は、CPU11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable ROM)であってもよい。
【0019】
記憶装置14は、学習装置1が長期的に保存するデータを記憶する。記憶装置14は、CPU11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
【0020】
入力装置15は、学習装置1のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。
【0021】
出力装置16は、学習装置1に関する情報を外部に対して出力する装置である。例えば、出力装置16は、学習装置1に関する情報を表示可能な表示装置であってもよい。
【0022】
次に、CPU11内で実現される機能ブロックの構成について
図2を参照して説明する。
図2は、CPU11内で実現される機能ブロックを示すブロック図である。
【0023】
図2に示すように、CPU11内には、不足データを検出するための論理的な機能ブロックとして、外れ度計算部111と、不足データ検出部112とが実現される。外れ度計算部111は、正常データを教師データとして、機械学習により学習モデルを構築(生成)する。その後、外れ度計算部111は、機械学習に用いられた正常データとは異なる検証用の正常データを用いて上記学習モデルを検証した結果を、正常データ外れ度として記憶装置14に保存する。外れ度計算部111は更に、異常データを用いて上記学習モデルを検証した結果を、異常データ外れ度として記憶装置14に保存する。不足データ検出部112は、正常データ外れ度及び異常データ外れ度に基づいて不足データを検出する。
【0024】
(動作)
次に、外れ度計算部111における機械学習について
図3及び
図4を参照して説明する。ここで、
図3に示す時系列データの実測値は、上述の正常データの一例に相当するものとする。外れ度計算部111は、例えば
図3に示す時系列データの実測値のうち第1の時間区間の時系列データを読み込み、該第1の時間区間に続く第2の時間区間の時系列データを予測(再現)して出力する学習モデルを構築する。このとき、予測された第2の時間区間の時系列データと、時系列データの実測値うち第2の時間区間の時系列データ(教師データに相当)とが比較されることによって、学習モデルの精度向上が図られる。
【0025】
図4のフローチャートにおいては、外れ度計算部111は、先ず、記憶装置14に保存されている正常データのうち学習用の正常データを取得する(ステップS101)。次に、外れ度計算部111は、ステップS101の処理において取得された学習用の正常データから、学習モデルに入力される第1の時間区間の時系列データと、教師データとなる第2の時間区間の時系列データとの組を複数生成する(
図3参照)。その後、外れ度計算部111は、該生成された複数の時系列データの組を用いた機械学習を行い、学習モデルを構築する(ステップS102)。
【0026】
学習モデルを構築する具体的な方法としては、例えば、ディープラーニングにおけるオートエンコーダ等の入力を再現可能な方法、再帰型ニューラルネットワーク等の時系列データから時系列データを出力可能な方法、が挙げられる。尚、学習用の正常データが、センサ出力としての時系列データである場合であって、複数のセンサ各々から出力された複数の時系列データが存在する場合、外れ度計算部111は、該複数の時系列データを用いて一の学習モデルを構築してもよいし、センサ毎に学習モデルを構築してもよい。「外れ度計算部111」は、後述する付記における「生成手段」の一例に相当する。
【0027】
次に、上述の如く構築された学習モデルの検証について
図3及び
図5を参照して説明する。
図3に示す時系列データの実測値が、検証用の正常データの一例に相当するものとして、該正常データを用いた学習モデルの検証について説明する。外れ度計算部111は、例えば
図3に示す時系列データの実測値のうち第1の時間区間の時系列データを、学習モデルに入力して、該学習モデルにより予測された、該第1の時間区間に続く第2の時間区間の時系列データである予測時系列データを取得する。その後、外れ度計算部111は、予測時系列データと、時系列データの実測値のうち第2の時間区間の時系列データとの差分を予測差分として計算する。
【0028】
外れ度計算部111は、第2の時間区間の時系列データの実測値からの予測時系列データの外れ度合い(言い換えれば、ずれの程度)を示す指標である外れ度を、予測差分に基づいて計算する。検証用の正常データを用いた学習モデルの検証時に計算された外れ度が、正常データ外れ度として記憶装置14に保存される。
【0029】
異常データを用いた学習モデルの検証時にも、上述した工程と同様の工程により外れ度が計算される。異常データを用いた学習モデルの検証時に計算された外れ度が、異常データ外れ度として記憶装置14に保存される。
【0030】
尚、検証用の正常データに係る「第1の時間区間」及び「第2の時間区間」が、夫々、後述する付記における「第1期間」及び「第2期間」の一例に相当する。異常データに係る「第1の時間区間」及び「第2の時間区間」が、夫々、後述する付記における「第3期間」及び「第4期間」の一例に相当する。
【0031】
外れ度は、例えば予測差分の絶対値の平均値として表されてもよいし、予測差分をベクトルとしたときの該ベクトルが線形結合として表されたものであってもよい。或いは、外れ度は、予測差分をベクトルとしたときのユークリッド距離やマハラノビス距離で表されてもよい。いずれにしても、外れ度は、実測値からのずれの大きさを数値で表現するものであればよい。
【0032】
不足データ検出部112は、異常データ外れ度により示される外れ度を基準として、該基準よりも大きな外れ度を示す正常データ外れ度を特定する。不足データ検出部112は、該特定された正常データ外れ度の基となった正常データ(即ち、特定された正常データ外れ度の基となった予測差分が計算されたときに用いられた正常データ)により示される正常パターンから不足データを検出する。
【0033】
図5のフローチャートにおいては、外れ度計算部111は、先ず、記憶装置14に保存されている正常データのうち検証用の正常データと、異常データとを取得する(ステップS201)。次に、外れ度計算部111は、ステップS201の処理において取得された検証用の正常データ及び異常データ各々から、学習モデルに入力される第1の時間区間の時系列データと、第2の時間区間の時系列データとの組を複数生成する(
図3参照)。
【0034】
その後、外れ度計算部111は、検証用の正常データのうち第1の時間区間の時系列データを学習モデルに入力して、該学習モデルにより予測された予測時系列データを取得する。外れ度計算部111は、予測時系列データと、検証用の正常データのうち第2の時間区間の時系列データとの差分を予測差分として計算する。外れ度計算部111は、該計算された予測差分に基づいて正常データ外れ度を計算する。同様に、外れ度計算部111は、異常データのうち第1の時間区間の時系列データを学習モデルに入力して、該学習モデルにより予測された予測時系列データを取得する。外れ度計算部111は、予測時系列データと、異常データのうち第2の時間区間の時系列データとの差分を予測差分として計算する。外れ度計算部111は、該計算された予測差分に基づいて異常データ外れ度を計算する(ステップS202)。
【0035】
不足データ検出部112は、異常データ外れ度により示される外れ度を基準として、該基準よりも大きな外れ度を示す正常データ外れ度を特定する。不足データ検出部112は、該特定された正常データ外れ度に基づいて不足データを検出する(ステップS203)。「外れ度計算部111」は、後述する付記における「第1取得手段」及び「第2取得手段」の一例に相当し、「不足データ検出部112」は、後述する付記における「検出手段」の一例に相当する。
【0036】
ここで、不足データの検出概念について
図6を参照して説明を加える。
図6は、センサ1及びセンサ2各々から出力された時系列データに基づく正常データ及び異常データを用いて計算された外れ度を図示したものである。センサ1及びセンサ2の対象は相互に関連しており、ある時刻に生じた一のイベントによって、センサ1及びセンサ2各々から出力される時系列データが影響を受けるものとする。ここでは、外れ度が、予測差分をベクトルとしたときのマハラノビス距離で表されている。予測差分が小さいデータ(即ち、正常データ及び異常データ)ほど、原点Oの近くにプロットされる。異常データ外れ度(
図6のバツ印参照)の最小値を基準とした場合、破線円C1で囲われた正常データ外れ度は、該基準より外れ度が小さいので、学習モデルが構築される際に十分な機械学習が行われた正常パターンを有する正常データであると言える。他方、破線円C2で囲われた正常データ外れ度は、上記基準より外れ度が大きいので、学習モデルが構築される際の機械学習が不十分な正常パターンを有する正常データであると言える。
【0037】
機械学習が十分であれば、学習モデルにより予測される予測時系列データは、時系列データの実測値に近いので、予測差分は比較的小さくなり、結果として外れ度も比較的小さくなる。他方で、機械学習が不十分であれば、学習モデルにより予測される予測時系列データは、時系列データの実測値から比較的大きくずれるので、予測差分は比較的大きくなり、結果として外れ度も比較的大きくなる。当該学習装置1では、学習用の正常データを用いた機械学習により(即ち、正常データだけを用いた機械学習により)学習モデルが構築される。このため、機械学習に用いられない異常データを用いた学習モデルの検証時に計算された異常データ外れ度は、当然ながら比較的大きくなる。従って、異常データ外れ度よりも大きな外れ度となる正常データは、機械学習が十分ではないと言える。
【0038】
尚、異常データ外れ度の最小値が基準とされなくてもよく、例えば、異常データ外れ度の平均値、中央値又は最大値等が基準とされてよい。或いは、異常データ外れ度の最小値と、該最小値より小さい複数の正常データ外れ度のうちの正常データ外れ度の最大値との中間の値が基準とされてもよい。
【0039】
(技術的効果)
当該学習装置1によれば、機械学習に不足している正常パターンを有する正常データ(即ち、不足データ)を自動的に検出することができる。このため、検出された不足データに相当する学習用の正常データを追加すれば、学習モデルの精度を比較的容易に向上させることができる。この結果、機械学習に用いる異常データを十分には収集できない場合であっても、正常データだけを用いて比較的精度の良い学習モデルを構築することができる。加えて、人手により、既に収集された正常データを分析して、不足データを特定する必要がないので、学習モデルを構築するための工数を大幅に低減することができる。
【0040】
ここで、不足データを検出するために用いられる学習モデルと、時系列データに基づいて、対象機器の異常を自動検出するために用いられる学習モデルとは、同一であってもよいし、互いに異なっていてもよい。いずれにしても、上記検出された不足データに相当する学習用の正常データを追加して再学習を行えば、対象機器の異常を自動検出するために用いられる学習モデルの精度を向上させることができる。この結果、該再学習された学習モデルを用いて対象機器の異常を精度よく検出することができる。
【0041】
<変形例>
(1)
図7に示すように、CPU11内には、外れ度計算部111及び不足データ検出部112に加えて、ユーザ提示部113が実現されてよい。ユーザ提示部113は、
図8に示すように、ステップS203の処理の後、該ステップS203の処理において検出された不足データが当該学習装置1のユーザに提示されるように出力装置16(
図1参照)を制御してよい。このとき、例えば
図5に示すような画像が、ユーザに提示されてよい。
【0042】
尚、対象が相互に関連するセンサの数が4以上で、ユークリッド距離やマハラノビス距離により外れ度が表される場合は、次元数が4以上になってしまうので、例えば2次元や3次元のグラフが複数個提示されることが望ましい。複数のセンサの対象が相互に関連しない場合(例えば、一のセンサの対象に生じたイベントによって、該一のセンサとは異なる他のセンサから出力される時系列データが影響を受けない場合)には、1次元のグラフが複数個提示されてよい。「ユーザ提示部113」は、後述する付記における「提示手段」の一例に相当する。
【0043】
(2)上述した実施形態では、時系列データのうち第1の時間区間の時系列データから、第1の時間区間に続く第2の時間区間の時系列データを予測する学習モデルが構築されたが、これに限られるものではない。例えば、入力された時系列データに係る時間区間と同一の時間区間の時系列データを予測する学習モデルが構築されてもよい。
【0044】
<付記>
以上説明した実施形態に関して、更に以下の付記を開示する。
【0045】
(付記1)
付記1に記載の学習装置は、時系列数値データを入力データとして機械学習を行う学習装置であって、前記入力データとしての正常状態を示す時系列数値データである正常データを用いて前記機械学習を行うことにより、入力された時系列数値データに対応する時系列数値データを予測して出力する学習モデルを生成する生成手段と、前記正常データのうち第1期間の正常データを前記学習モデルに入力することにより、前記学習モデルにより予測された正常データである前記第1期間に対応する第2期間の予測正常データと、前記正常データのうち前記第2期間の正常データとを比較して、前記第2期間の正常データと前記予測正常データとのずれの程度を示す第1の外れ度を取得する第1取得手段と、異常状態を示す時系列数値データである異常データのうち第3期間の異常データを前記学習モデルに入力することにより、前記学習モデルにより予測された異常データである前記第3期間に対応する第4期間の予測異常データと、前記異常データのうち前記第4期間の異常データとを比較して、前記第4期間の異常データと前記予測異常データとのずれの程度を示す第2の外れ度を取得する第2取得手段と、前記第1の外れ度及び前記第2の外れ度に基づいて、前記正常データに係る正常状態を示す時系列パターンのうち、不足している時系列パターンを検出する検出手段と、を備えることを特徴とする学習装置である。
【0046】
(付記2)
付記2に記載の学習装置は、前記検出された不足している時系列パターンを提示する提示手段を備えることを特徴とする付記1に記載の学習装置である。
【0047】
(付記3)
付記3に記載の学習方法は、時系列数値データを入力データとして機械学習を行う学習装置における学習方法であって、前記入力データとしての正常状態を示す時系列数値データである正常データを用いて前記機械学習を行うことにより、入力された時系列数値データに対応する時系列数値データを予測して出力する学習モデルを生成する生成工程と、前記正常データのうち第1期間の正常データを前記学習モデルに入力することにより、前記学習モデルにより予測された正常データである前記第1期間に対応する第2期間の予測正常データと、前記正常データのうち前記第2期間の正常データとを比較して、前記第2期間の正常データと前記予測正常データとのずれの程度を示す第1の外れ度を取得する第1取得工程と、異常状態を示す時系列数値データである異常データのうち第3期間の異常データを前記学習モデルに入力することにより、前記学習モデルにより予測された異常データである前記第3期間に対応する第4期間の予測異常データと、前記異常データのうち前記第4期間の異常データとを比較して、前記第4期間の異常データと前記予測異常データとのずれの程度を示す第2の外れ度を取得する第2取得工程と、前記第1の外れ度及び前記第2の外れ度に基づいて、前記正常データに係る正常状態を示す時系列パターンのうち、不足している時系列パターンを検出する検出工程と、を含むことを特徴とする学習方法である。
【0048】
(付記4)
付記4に記載のコンピュータプログラムは、コンピュータに、付記3に記載の学習方法を実行させるコンピュータプログラムである。
【0049】
(付記5)
付記5に記載の記録媒体は、付記4に記載のコンピュータプログラムが記録された記録媒体である。
【0050】
本発明は、請求の範囲及び明細書全体から読み取るこのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う学習装置、学習方法、コンピュータプログラム及び記録媒体もまた本発明の技術思想に含まれる。
【0051】
この出願は、2019年3月19日に出願された日本出願特願2019-051063を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【符号の説明】
【0052】
1…学習装置、111…外れ度計算部、112…不足データ検出部、113…ユーザ提示部