特許7015405 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 東京エレクトロンデバイス株式会社の特許一覧

特許7015405学習モデルの生成方法、プログラム、情報処理装置及び学習用データの生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2022-01-25

(45)【発行日】2022-02-02

(54)【発明の名称】学習モデルの生成方法、プログラム、情報処理装置及び学習用データの生成方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20220126BHJP

【ＦＩ】

G06N20/00 130

【請求項の数】 12

(21)【出願番号】P 2021075232

(22)【出願日】2021-04-27

【審査請求日】2021-05-07

【早期審査対象出願】

(73)【特許権者】

【識別番号】500323188

【氏名又は名称】東京エレクトロンデバイス株式会社

(74)【代理人】

【識別番号】100114557

【弁理士】

【氏名又は名称】河野英仁

(74)【代理人】

【識別番号】100078868

【弁理士】

【氏名又は名称】河野登夫

(72)【発明者】

【氏名】岡田大輝

【審査官】金木陽一

(56)【参考文献】

【文献】特開２０２０－０７０１６４（ＪＰ，Ａ）

【文献】特開２０１９－０１８３５１（ＪＰ，Ａ）

【文献】国際公開第２０２０／２１７９８７（ＷＯ，Ａ１）

【文献】特開２０２０－０６４２５３（ＪＰ，Ａ）

【文献】特開２０２０－０９１６９４（ＪＰ，Ａ）

【文献】特開２０１４－０４４５１０（ＪＰ，Ａ）

【文献】特開２０００－１３１２８９（ＪＰ，Ａ）

【文献】特開２０１８－０７４７５７（ＪＰ，Ａ）

【文献】PREUVENEERS, D., et al.，Resource Usage and Performance Trade-offs for Machine Learning Models in Smart Environments，Sensors，Vol.20, No.4，2020年02月

【文献】KDD-OpenSource，agots Anomaly Generator on Time Series [online]，GitHub，2019年11月21日，Internet: <URL: https://github.com/KDD-OpenSource/agots>，[検索日 2021.07.02]

【文献】jetnew，TSAG - Time Series Anomaly Generator [online]，GitHub，2019年06月27日，Internet: <URL: https://github.com/jetnew/tsag>，[検索日 2021.07.02]

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

コンピュータが、
正常と判断された複数の時系列データを取得し、
取得した複数の時系列データの実効値をそれぞれ算出し、
算出したそれぞれの実効値から最大の実効値を取得し、
前記複数の時系列データにおける代表時系列データの実効値を算出し、
取得した最大実効値と、算出した代表時系列データの実効値との比を算出し、
算出した実効値の比に基づいて、前記複数の時系列データにおける代表時系列データを補正し、
補正した代表時系列データに基づいて異常データを生成し、
正常と判断された前記時系列データ及び前記時系列データに対しラベル付けされた正常ラベルと、生成した異常データ及び前記異常データに対しラベル付けされた異常ラベルとに基づき、時系列データを入力した場合に、異常に関する情報を出力する学習モデルを生成する
処理を実行する学習モデルの生成方法。

【請求項2】

補正後の前記代表時系列データに周期的な変動を加えた前記異常データを生成する
請求項１に記載の学習モデルの生成方法。

【請求項3】

補正後の前記代表時系列データを時間の変化に伴い継続して増加または減少させる前記異常データを生成する
請求項１又は２に記載の学習モデルの生成方法。

【請求項4】

補正後の前記代表時系列データに、単位時間内の値が突発的に閾値を超えるスパイクを加えた前記異常データを生成する
請求項１から３までのいずれかひとつに記載の学習モデルの生成方法。

【請求項5】

補正後の前記代表時系列データの波形の位相をずらすことにより、前記異常データを生成する
請求項１から４までのいずれかひとつに記載の学習モデルの生成方法。

【請求項6】

異常データの生成方法を示す複数の生成方法を選択可能に出力し、
出力した生成方法の選択を受け付け、
受け付けた生成方法に基づき、前記異常データを生成する
請求項１から５までのいずれかひとつに記載の学習モデルの生成方法。

【請求項7】

異常データの生成方法を示す複数の生成方法と、各生成方法を組み合わせた組み合わせ方法とを選択可能に出力し、
出力した生成方法のいずれか、または、組み合わせ生成方法を受け付け、
受け付けた生成方法または組み合わせ生成方法に基づき、前記異常データを生成する
請求項１から５までのいずれかひとつに記載の学習モデルの生成方法。

【請求項8】

前記異常データにカラードノイズを加えた第２異常データを生成する
請求項１から７までのいずれかひとつに記載の学習モデルの生成方法。

【請求項9】

前記時系列データに対する複数種類の異常データの生成方法を、異なるタイミングで前記時系列データに適用することにより異常データを生成する
請求項１から８までのいずれかひとつに記載の学習モデルの生成方法。

【請求項10】

正常と判断された複数の時系列データを取得し、
取得した複数の時系列データの実効値をそれぞれ算出し、
算出したそれぞれの実効値から最大の実効値を取得し、
前記複数の時系列データにおける代表時系列データの実効値を算出し、
取得した最大実効値と、算出した代表時系列データの実効値との比を算出し、
算出した実効値の比に基づいて、前記複数の時系列データにおける代表時系列データを補正し、
補正した代表時系列データに基づいて異常データを生成し、
正常と判断された前記時系列データ及び前記時系列データに対しラベル付けされた正常ラベルと、生成した異常データ及び前記異常データに対しラベル付けされた異常ラベルとに基づき、時系列データを入力した場合に、異常に関する情報を出力する学習モデルを生成する
処理をコンピュータに実行させるプログラム。

【請求項11】

正常と判断された複数の時系列データを取得する第１取得部と、
取得した複数の時系列データの実効値をそれぞれ算出する第１算出部と、
算出したそれぞれの実効値から最大の実効値を取得する第２取得部と、
前記複数の時系列データにおける代表時系列データの実効値を算出する第２算出部と、
取得した最大実効値と、算出した代表時系列データの実効値との比を算出する第３算出部と、
算出した実効値の比に基づいて、前記複数の時系列データにおける代表時系列データを補正する補正部と、
補正した代表時系列データに基づいて異常データを生成する第１生成部と、
正常と判断された前記時系列データ及び前記時系列データに対しラベル付けされた正常ラベルと、生成した異常データ及び前記異常データに対しラベル付けされた異常ラベルとに基づき、時系列データを入力した場合に、異常に関する情報を出力する学習モデルを生成する第２生成部と
を備える情報処理装置。

【請求項12】

コンピュータが、
正常と判断された複数の時系列データを取得し、
取得した複数の時系列データの実効値をそれぞれ算出し、
算出したそれぞれの実効値から最大の実効値を取得し、
前記複数の時系列データにおける代表時系列データの実効値を算出し、
取得した最大実効値と、算出した代表時系列データの実効値との比を算出し、
算出した実効値の比に基づいて、前記複数の時系列データにおける代表時系列データを補正し、
補正した代表時系列データに基づき異常データを生成し、
生成した異常データに異常ラベルを対応付けて、前記時系列データに正常ラベルを対応付けて、前記異常データ及び前記時系列データを学習用データとして記憶する
処理を実行する学習用データの生成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習モデルの生成方法、プログラム、情報処理装置及び学習用データの生成方法に関する。

【背景技術】

【0002】

近年では、異常検出を行うために機械学習のアルゴリズムが利用されている。例えば特許文献１には、複数のデータから異常を精度良く検知可能な異常検知装置が開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２１－０３８９４６号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、学習モデルの精度を向上させるためには、正常及び異常双方に関する大量の訓練データが必要となるという問題がある。

【0005】

一つの側面では、異常訓練データの準備負担を軽減することが可能な学習モデルの生成方法等を提供することを目的とする。

【課題を解決するための手段】

【0006】

一つの側面に係る学習モデルの生成方法は、コンピュータが、正常と判断された複数の時系列データを取得し、取得した複数の時系列データの実効値をそれぞれ算出し、算出したそれぞれの実効値から最大の実効値を取得し、前記複数の時系列データにおける代表時系列データの実効値を算出し、取得した最大実効値と、算出した代表時系列データの実効値との比を算出し、算出した実効値の比に基づいて、前記複数の時系列データにおける代表時系列データを補正し、補正した代表時系列データに基づいて異常データを生成し、正常と判断された前記時系列データ及び前記時系列データに対しラベル付けされた正常ラベルと、生成した異常データ及び前記異常データに対しラベル付けされた異常ラベルとに基づき、時系列データを入力した場合に、異常に関する情報を出力する学習モデルを生成する処理を実行させることを特徴とする。

【発明の効果】

【0007】

一つの側面では、異常訓練データの準備負担を軽減することが可能となる。

【図面の簡単な説明】

【0008】

【図1】サーバの構成例を示すブロック図である。

【図2】訓練データ管理ＤＢ及び学習モデル管理ＤＢのレコードレイアウトの一例を示す説明図である。

【図3】複数の時系列データの平均を求める処理を説明する説明図である。

【図4】異常データの生成方法を説明する説明図である。

【図5】複数パターンの異常データを生成する処理を説明する説明図である。

【図6】異常データの生成方法の受付画面の一例を示す説明図である。

【図7】異常検知モデルを生成する際の処理手順を示すフローチャートである。

【図8】異常データを生成する処理のサブルーチンの処理手順を示すフローチャートである。

【図9】補正処理を行う処理を説明する説明図である。

【図10】最大実効値と平均実効値との比を算出する説明図である。

【図11】実施形態２の異常データを生成する処理のサブルーチンの処理手順を示すフローチャートである。

【図12】実施形態３のサーバの構成例を示すブロック図である。

【図13】生成モデルの学習処理に関する説明図である。

【図14】生成モデルを生成する際の処理手順を示すフローチャートである。

【図15】実施形態３の異常検知モデルを生成する際の処理手順を示すフローチャートである。

【発明を実施するための形態】

【0009】

以下、本発明をその実施形態を示す図面に基づいて詳述する。

【0010】

（実施形態１）
実施形態１は、正常と判断された時系列データと、該時系列データに基づいて生成された異常データとに基づき、時系列データを入力した場合に異常に関する情報を出力する学習モデルを生成する形態に関する。時系列データは、連続的な複数の時刻のそれぞれにおける計測値が時系列に配列されたデータ、またはその集合である。

【0011】

本実施形態のシステムは、情報処理装置１を含む。情報処理装置１は、種々の情報に対する処理、記憶及び送受信を行う情報処理装置である。情報処理装置１は、例えばサーバ装置、パーソナルコンピュータまたは汎用のタブレットＰＣ（パソコン）等である。本実施形態において、情報処理装置１は、時系列データに基づいて異常を検知するパーソナルコンピュータであるものとし、以下では簡潔のためコンピュータ１と読み替える。

【0012】

本実施形態に係るコンピュータ１は、正常と判断された時系列データを取得し、取得した時系列データに基づいて異常データを生成する。コンピュータ１は、正常と判断された時系列データに対して正常ラベルを付与し、異常データに対して異常ラベルを付与する。コンピュータ１は、正常と判断された時系列データ及び該時系列データに対しラベル付けされた正常ラベルと、異常データ及び該異常データに対しラベル付けされた異常ラベルとに基づき、時系列データを入力した場合に、異常に関する情報を出力する学習モデルを生成する。生成された学習モデルはコンピュータ１、または工作機械等に付属する情報系端末装置もしくはコントローラ（図示なし）にデプロイされる。

【0013】

図１は、コンピュータ１の構成例を示すブロック図である。コンピュータ１は、制御部１１、記憶部１２、入力部１３、表示部１４、読取部１５及び大容量記憶部１６を含む。各構成はバスＢで接続されている。

【0014】

制御部１１はＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）、ＧＰＵ（Graphics Processing Unit）等の演算処理装置を含み、記憶部１２に記憶された制御プログラム１Ｐを読み出して実行することにより、コンピュータ１に係る種々の情報処理、制御処理等を行う。なお、図１では制御部１１を単一のプロセッサであるものとして説明するが、マルチプロセッサであっても良い。

【0015】

記憶部１２はＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等のメモリ素子を含み、制御部１１が処理を実行するために必要な制御プログラム１Ｐ又はデータ等を記憶している。また、記憶部１２は、制御部１１が演算処理を実行するために必要なデータ等を一時的に記憶する。

【0016】

入力部１３は、マウス、キーボード、タッチパネル、ボタン等の入力デバイスであり、受け付けた操作情報を制御部１１へ出力する。表示部１４は、液晶ディスプレイ又は有機ＥＬ（electroluminescence）ディスプレイ等であり、制御部１１の指示に従い各種情報を表示する。

【0017】

読取部１５は、ＣＤ（Compact Disc）－ＲＯＭ又はＤＶＤ（Digital Versatile Disc）－ＲＯＭを含む可搬型記憶媒体１ａを読み取る。制御部１１が読取部１５を介して、制御プログラム１Ｐを可搬型記憶媒体１ａより読み取り、大容量記憶部１６に記憶しても良い。また、ネットワーク等を介して他のコンピュータから制御部１１が制御プログラム１Ｐをダウンロードし、大容量記憶部１６に記憶しても良い。さらにまた、半導体メモリ１ｂから、制御部１１が制御プログラム１Ｐを読み込んでも良い。

【0018】

大容量記憶部１６は、例えばＨＤＤ（Hard disk drive:ハードディスク）、ＳＳＤ(Solid State Drive:ソリッドステートドライブ)等の記録媒体を備える。大容量記憶部１６は、異常検知モデル１６１、訓練データ管理ＤＢ（database）１６２、学習モデル管理ＤＢ１６３及び訓練データファイル１６４を含む。

【0019】

異常検知モデル１６１は、時系列データに基づいて異常に関する情報を出力する異常検知器であり、機械学習により生成された学習済みモデルである。訓練データ管理ＤＢ１６２は、異常検知モデル１６１を構築（作成）するための訓練データ（学習用データ）の管理情報を記憶している。学習モデル管理ＤＢ１６３は、学習済みの異常検知モデル１６１に関する情報を記憶している。訓練データファイル１６４は、訓練データを記憶している。

【0020】

なお、本実施形態において記憶部１２及び大容量記憶部１６は一体の記憶装置として構成されていても良い。また、大容量記憶部１６は複数の記憶装置により構成されていても良い。更にまた、大容量記憶部１６はコンピュータ１に接続された外部記憶装置であっても良い。

【0021】

コンピュータ１は、種々の情報処理及び制御処理等をコンピュータ単体で実行しても良いし、複数のコンピュータで分散して実行しても良いし、仮想マシンで分散して実行しても良い。なお、コンピュータ１に係る種々の情報処理及び制御処理等が、通信環境を有するサーバ装置等で実行されても良い。

【0022】

図２は、訓練データ管理ＤＢ１６２及び学習モデル管理ＤＢ１６３のレコードレイアウトの一例を示す説明図である。
訓練データ管理ＤＢ１６２は、訓練ＩＤ列、ファイル名称列及び登録日時列を含む。訓練ＩＤ列は、各訓練データを識別するために、一意に特定される訓練データのＩＤを記憶している。ファイル名称列は、時系列データを含むファイルの名称を記憶している。なお、ファイル名称列には、ファイルの名称がファイルのパスと合わせて記憶されても良い。登録日時列は、訓練データを登録した日時情報を記憶している。

【0023】

学習モデル管理ＤＢ１６３は、モデルＩＤ列、学習モデル列及び生成日時列を含む。モデルＩＤ列は、各学習済みの異常検知モデル１６１を識別するために、一意に特定される異常検知モデル１６１のＩＤを記憶している。学習モデル列は、学習済みの異常検知モデル１６１のファイルを記憶している。生成日時列は、異常検知モデル１６１を生成した日時情報を記憶している。

【0024】

なお、上述した各ＤＢの記憶形態は一例であり、データ間の関係が維持されていれば、他の記憶形態であっても良い。

【0025】

訓練データファイル１６４は、異常検知モデル１６１を構築するための訓練データを記憶している。具体的には、訓練データファイル１６４には、時系列データ、及び該時系列データに対し付けられたラベルの種類等が記憶される。ラベルの種類は、例えば「正常」及び「異常」を含む。なお、ラベルの種類は、「正常」及び「異常」に限定せず、実際に生じる異常種類により詳細化されても良い。訓練データファイル１６４は、例えば、拡張子であるＸＬＳ若しくはＸＬＳＸ等のＥＸＣＥＬ（登録商標）ファイルであっても良く、またはユーザにより定義されたユーザ定義ファイルであっても良い。

【0026】

続いて、時系列データに基づいて異常に関する情報を出力する処理を説明する。本実施形態では、異常検知モデル１６１を用いて異常に関する情報を出力する。異常検知モデル１６１は、例えばＯｎｅＣｌａｓｓＳＶＭ（One Class Support Vector Machine）である機械学習のアルゴリズムを用いて生成される。ＯｎｅＣｌａｓｓＳＶＭは、教師なしで学習した良品の学習値からの離れ値（outliers）を検出するアルゴリズムであり、正常データを非負値に、異常データを負値に写像（射影）するモデルである。

【0027】

ＯｎｅＣｌａｓｓＳＶＭではすべての訓練データをクラスタ１とし、原点のみをクラスタ－１に属するようにカーネルトリックと呼ばれる手法を用いて、高次元空間の特徴空間へデータを写像する。このとき、訓練データは原点から遠くに配置されるように写像されるため、もとの訓練データと類似していない時系列データは原点の近くに集まるようになる。この性質を用いて正常および異常データの区別をすることができる。

【0028】

コンピュータ１は、訓練データを用いて機械学習を行う異常検知モデル１６１を生成する。コンピュータ１は、機械学習のアルゴリズムとしてＯｎｅＣｌａｓｓＳＶＭを用いて、正常データ（正常時の時系列データ）と異常データ（異常時の時系列データ）とを訓練データとして機械学習させることで異常値との識別境界を決定する。コンピュータ１は、当該識別境界を基準として異常の検出が可能な異常検知モデル１６１を生成する。

【0029】

具体的には、コンピュータ１は、ＯｎｅＣｌａｓｓＳＶＭを用いて、正常・異常の２クラスの分離超平面を教師なし学習する。機械学習のアルゴリズムは、ハイパーパラメータと称されるパラメータを有する。ハイパーパラメータは、ニュー（ν）及びガンマ（γ）をパラメータとして含む。パラメータνは、訓練データに含まれる異常データの割合に関連するパラメータである。パラメータγは、境界面の複雑さを決定するパラメータであり、ガンマが大きくなると境界面の複雑さが増す。

【0030】

ＯｎｅＣｌａｓｓＳＶＭでは、パラメータνによって学習データにおける外れ値が占める割合を指定し、特徴量空間において正常データと原点の間のマージンを最大化する分離超平面を学習する。また、パラメータγを伴うＲＢＦカーネル(Radial basis function kernel)により特徴量空間を写像することで、非線形の分離超平面を得ることができる。

【0031】

なお、ＯｎｅＣｌａｓｓＳＶＭ等の外れ値検知アルゴリズムを利用する場合は、学習時に生成された異常データをニューなどのパラメータで指定する割合で含めても良いし、自然界で取得されるデータには外れ値データをその割合で含んでいることを仮定して、正常データだけを用いて、分離超平面を学習しても良い。また同様に自然界のデータには一定割合外れ値を含むとして、ブートストラップサンプリングを繰り返すことでサンプルデータに外れ値の割合を調整しても良い。

【0032】

コンピュータ１は、取得した正常データと異常データとを含む訓練データに基づいて、異常検知モデル１６１のハイパーパラメータを探索によって最適化する。ハイパーパラメータを最適化することで、コンピュータ１は、異常を検知する際の精度をさらに向上させることができる。

【0033】

コンピュータ１は、タイムスロットごとの特徴量ベクトルを受け取り、それぞれに対する正常・異常の検知結果を出力する。具体的には、コンピュータ１は、正常である検知結果に対して１を出力し、異常である検知結果に対して－１を出力する。なお、コンピュータ１は、検知結果の計算の過程で求めた実数値が０以上である場合に１を出力し、実数値が０未満である場合に－１を出力しても良い。

【0034】

なお、本実施の形態では異常検知モデル１６１がＯｎｅＣｌａｓｓＳＶＭであるものとして説明するが、異常検知モデル１６１はＯｎｅＣｌａｓｓＳＶＭに限定されず、アイソレーションフォレスト（Isolation Forest）、ＬＯＦ（Local Outlier Factor；局所外れ値因子）、ＣＮＮ（Convolutional Neural Network）、ＲＮＮ（Recurrent Neural Network）、ベイジアンネットワークまたは回帰木等の任意の学習アルゴリズムで構築された学習済みモデルであって良い。その他、ＬＴＳＭ（Long-Short Term Memory）に係るニューラルネットワーク、トランスフォーマー（Transformer）等を用いても良い。

【0035】

続いて、訓練データの作成処理を説明する。本実施形態では、コンピュータ１は、正常と判断された時系列データを取得し、取得した時系列データに基づいて異常データを生成する。なお、異常データの生成処理に関しては後述する。コンピュータ１は、正常と判断された時系列データに対して正常ラベルを付与し、異常データに対して異常ラベルを付与する。

【0036】

正常ラベルは、例えば、異常なしを示す「正常」であっても良い。異常ラベルは、例えば、異常ありを示す「異常」であっても良く、または、異常の種類応じて分類される異常名称であっても良い。コンピュータ１は、複数の時系列データにおいて、それぞれの時系列データに対してラベリングすることで、異常検知モデル１６１を学習するための訓練データを作成（生成）する。

【0037】

続いて、時系列データに基づく異常データの生成処理を詳しく説明する。先ず、コンピュータ１は、複数の時系列データの代表データを求める。代表データは、例えば、複数の時系列データの平均値、複数の時系列データの中央値、または複数の時系列データの最頻値（時系列データの中で頻度が最も高い値）等である。なお、複数の時系列データの中でユーザが指定した最も正常を示すデータが代表データとして利用されても良い。なお、本実施形態では、代表データが複数の時系列データの平均である例を説明するが、ほかの種類の代表データ、その代表データが複数ある場合にも同様に適用することができる。

【0038】

図３は、複数の時系列データの平均を求める処理を説明する説明図である。図３Ａは、元データとなった複数の時系列データを説明する説明図である。コンピュータ１は、元データとなった複数の時系列データを取得する。時系列データは、例えば、工作機械に取り付けられた３軸加速度センサのデータである。なお、時系列データは、その他、温度、圧力、速度、血圧、売上等のデータであっても良い。３軸加速度センサは、Ｘ軸とＹ軸とＺ軸の３方向の加速度を検出し、加速度信号を出力する。図示のように、取得されたＸ軸の加速度センサのデータ、Ｙ軸の加速度センサのデータ及びＺ軸の加速度センサのデータが、グラフ１１ａに示されている。グラフ１１ａの横軸は、時間を示し、矢印の先端に向かって時間が経過している。グラフ１１ａの縦軸は加速度の大きさを示す。また、３軸の加速度センサのデータそれぞれが、異なる時間帯（例えば、ｔ０～ｔ１、ｔ２～ｔ３及びｔ４～ｔ５）で複数取得される。

【0039】

コンピュータ１は、取得した各軸の複数の加速度センサのデータの平均を算出する。具体的には、コンピュータ１は、Ｘ軸の各時間帯の加速度センサのデータの平均を算出し、Ｙ軸の各時間帯の加速度センサのデータの平均を算出し、Ｚ軸の各時間帯の加速度センサのデータの平均を算出する。図示のように、算出された３軸の各時間帯の加速度センサのデータの平均が、グラフ１１ｂに示されている。なお、グラフ１１ｂの横軸及び縦軸は、グラフ１１ａと同様であるため、説明を省略する。
以上の処理に従って、複数の時系列データの平均を求めることができる。

【0040】

続いて、コンピュータ１は、複数の時系列データの平均に基づいて異常データを生成する処理を説明する。なお、本実施形態では、複数の時系列データの平均（以下、平均データという）を用いて説明するが、時系列データそのものに基づいて異常データを生成する処理にも同様に適用することができる。

【0041】

異常データの生成方法は、第１生成方法、第２生成方法、第３生成方法及び第４生成方法を含む。第１生成方法は、平均データに対し、周期的な変動を加えた異常データを生成する生成方法である。第２生成方法は、平均データを時間の変化に伴い継続して増加または減少させることにより、異常データを生成する生成方法である。第３生成方法は、平均データに単位時間内の値が突発的に閾値を超えるスパイク（spike）を加えた異常データを生成する生成方法である。第４生成方法は、平均データの波形の位相をずらすことにより、異常データを生成する生成方法である。

【0042】

平均データに対し、第１生成方法、第２生成方法、第３生成方法、第４生成方法のうちの少なくとも一つまたはこれらの組み合わせに基づいて、異常データを生成することができる。

【0043】

図４は、異常データの生成方法を説明する説明図である。図４Ａは、第１生成方法に基づく異常データの生成処理を説明する説明図である。平均データに所定のタイミング（時点）で周期的な変動を加えることにより、異常データを生成することができる。周期的な変動は、時間的に連続して同じ間隔で生じる変動であっても良いし、周期的な変動の周期を長くまたは短くすることにより生じる変動であっても良い。また、周期的な変動は、周期的な変動の振幅を大きくまたは小さくすることにより生じる変動であっても良い。

【0044】

例えば、コンピュータ１は、異常の発生開始タイミング（例えば、５５０ｍｓ）から異常の発生終了タイミング（例えば、１０００ｍｓ）までに、所定の周期（例えば、２０ｍｓ）で繰り返しても良い。または、コンピュータ１は、異常の発生開始タイミングから異常の発生終了タイミングまでに、正常な変動の振幅を０．５倍に小さくしても良い。

【0045】

図４Ｂは、第２生成方法に基づく異常データの生成処理を説明する説明図である。平均データを時間の変化に伴い継続して増加(上昇)または減少（下降）させることにより、異常データを生成することができる。図示のように、コンピュータ１は、異常の発生開始タイミング（例えば、６００ｍｓ）から異常の発生終了タイミング（例えば、１０００ｍｓ）までに、所定の傾き係数で平均データに減少傾向を加えて異常データを生成する。なお、増加傾向と減少傾向との組み合わせに基づいて異常データが生成されても良い。

【0046】

図４Ｃは、第３生成方法に基づく異常データの生成処理を説明する説明図である。平均データに単位時間内の値が突発的に閾値を超えるスパイクを付加することにより、異常データを生成することができる。図示のように、コンピュータ１は平均データに対し、異常発生タイミングｔ１に所定の第１スパイク幅でスパイク（突起形状）を正の位置に加えて、異常発生タイミングｔ２に所定の第２スパイク幅でスパイクを正の位置に加える。異なるタイミングでのスパイクの付加によりスパイク状の歪みが生じ、異常データが生成される。

【0047】

なお、スパイクの付加位置は正の位置に限るものではない。例えばコンピュータ１は、複数のスパイクを負の位置に加えることにより、異常データを生成しても良いし、または、複数のスパイクを正の位置と負の位置との両方に加えることにより、異常データを生成しても良い。

【0048】

このように、異常発生タイミング、スパイク幅及びスパイクの数のうちの少なくとも一つまたはこれらの組み合わせに基づいて、第３生成方法に基づく複数のパターンの異常データを生成することができる。

【0049】

図４Ｄは、第４生成方法に基づく異常データの生成処理を説明する説明図である。時系列データの波形の位相をずらすことにより、異常データを生成することができる。位相は、周期的に変動する波の位置情報である。図示のように、コンピュータ１は平均データに対し、時間を示す横軸に沿って、所定のずらし量（例えば、５００ｍｓ）で波形の位相をずらすことで異常データを生成する。

【0050】

なお、コンピュータ１は、ユーザによる各異常データの生成方法を実行するためのパラメータの設定を受け付けても良い。例えばコンピュータ１は、ユーザによる第１生成方法のパラメータ（時点、周期及び振幅等）の設定を受け付ける。コンピュータ１は、受け付けた第１生成方法のパラメータに基づき、異常データを生成する。

【0051】

また、第１生成方法、第２生成方法、第３生成方法、第４生成方法の任意の組み合わせに基づいて、異常データを生成することができる。例えばコンピュータ１は、第１生成方法と第２生成方法との組み合わせに基づいて、異常データを生成しても良い。具体的には、コンピュータ１は、第１生成方法に基づいて、異常の発生開始タイミングｔ１から異常の発生終了タイミングｔ２までに、平均データに所定の周期（例えば、２０ｍｓ）で繰り返す変動を加えて中間の異常データを生成する。コンピュータ１は、第２生成方法に基づいて、異常の発生開始タイミングｔ３から異常の発生終了タイミングｔ４までに、生成した中間の異常データに所定の傾き係数で増加傾向または減少傾向を加える処理を行い、最終的な異常データを生成する。

【0052】

また、生成された異常データにカラードノイズ（Colors of Noise）を加えることにより、該異常データとは異なるパターンの異常データ（第２異常データ）を生成することができる。カラードノイズは、パワースペクトル密度（Power Spectral Density）が平坦でないノイズである。例えば、パワースペクトルの大きさが周波数に反比例するピンクノイズ、または、パワースペクトルの大きさが周波数の二乗に反比例するブラウンノイズ等のカラードノイズを加えて第２異常データを生成する。なお、カラードノイズに限らず、異常データに平坦なパワースペクトルを示すホワイトノイズ(White noise)を加えて、第２異常データを生成しても良い。

【0053】

更にまた、平均データに対する複数種類の異常データの生成方法を、異なるタイミングで平均データに適用することにより異常データを生成することができる。

【0054】

図５は、複数パターンの異常データを生成する処理を説明する説明図である。なお、図５では、第３生成方法に基づいて異常データを生成する例を説明するが、他の生成方法にも同様に適用することができる。

【0055】

第３生成方法は、平均データに単位時間内の値が突発的に閾値を超えるスパイクを付加することにより、異常データを生成する生成方法である。例えばコンピュータ１は、平均データに対し、一部の時間範囲にスパイク１２ａ及びスパイク１２ｂを付加して第１パターンの異常データを生成する。そして、コンピュータ１は、生成した第１パターンの異常データに、スパイク１２ａ及びスパイク１２ｂを付加した時間範囲をお互いにずらすことにより、第２パターンの異常データ及び第３パターンの異常データを生成する。

【0056】

図６は、異常データの生成方法の受付画面の一例を示す説明図である。該画面は、生成方法選択欄１３ａ及び設定ボタン１３ｂを含む。生成方法選択欄１３ａは、単一または複数の異常データの生成方法の選択を受け付ける欄である。設定ボタン１３ｂは、異常データの生成方法を設定するボタンである。

【0057】

コンピュータ１は、第１生成方法、第２生成方法、第３生成方法、第４生成方法、及び、各生成方法を組み合わせた組み合わせ生成方法を選択可能な受付画面を生成する。コンピュータ１は、生成した受付画面を表示する。図示のように、第１生成方法（周波数変化）、第２生成方法（トレンド）、第３生成方法（スパイク）、第４生成方法（位相変化）、及び組み合わせ生成方法（複合変化）が、生成方法選択欄１３ａに表示される。

【0058】

コンピュータ１は、生成方法選択欄１３ａの選択操作を受け付けた場合、異常データの生成方法の選択を受け付ける。コンピュータ１は、設定ボタン１３ｂのタッチ（クリック）操作を受け付けた場合、生成方法選択欄１３ａにより選択された生成方法を記憶部１２または大容量記憶部１６に記憶する。そして、異常データの生成処理の際には、記憶された生成方法を利用する。

【0059】

図７は、異常検知モデル１６１を生成する際の処理手順を示すフローチャートである。コンピュータ１の制御部１１は、正常と判断された複数の時系列データを入力部１３により取得する（ステップＳ１０１）。制御部１１は、異常データの生成方法の選択を入力部１３により受け付ける（ステップＳ１０２）。制御部１１は、取得した複数の時系列データと、受け付けた異常データの生成方法とに基づいて、異常データを生成する処理のサブルーチンを実行する（ステップＳ１０３）。なお、異常データの生成処理のサブルーチンに関しては後述する。

【0060】

制御部１１は、複数の時系列データと、生成した異常データとに基づき、訓練データを作成する（ステップＳ１０４）。具体的には、制御部１１は、時系列データに対して正常ラベル（例えば、「正常」）を付与し、異常データに対して異常ラベル（例えば、「異常」）を付与する。

【0061】

制御部１１は、複数の時系列データと、生成した異常データとを訓練データ（学習用データ）として訓練データファイル１６４に記憶する（ステップＳ１０５）。具体的には、制御部１１は、訓練データファイル１６４を生成する。制御部１１は、各時系列データに対してラベル名称（例えば、「正常」）を付与し、時系列データとラベル名称とを対応付けて訓練データファイル１６４に書き込む。制御部１１は、各異常データに対してラベル名称（例えば、「異常」）を付与し、時系列データとラベル名称とを対応付けて訓練データファイル１６４に書き込む。制御部１１は、時系列データとラベル名称とを対応付けて書き込んだファイルを大容量記憶部１６に記憶する。

【0062】

制御部１１は、訓練データファイル１６４を管理するための管理情報を大容量記憶部１６の訓練データ管理ＤＢ１６２に記憶する（ステップＳ１０６）。具体的には、制御部１１は、訓練ＩＤを割り振り、訓練データが含まれているファイルの名称及び登録日時を一つのレコードとして訓練データ管理ＤＢ１６２に記憶する。

【0063】

制御部１１は、作成した訓練データを用いて異常検知モデル１６１を生成する（ステップＳ１０７）。具体的には、制御部１１は、ＯｎｅＣｌａｓｓＳＶＭを用いて、訓練データである複数の時系列データを機械学習させることにより、異常値との識別境界を決定し、当該識別境界を基準として異常の検出が可能な異常検知モデル１６１を生成する。

【0064】

制御部１１は、生成した異常検知モデル１６１を大容量記憶部１６の学習モデル管理ＤＢ１６３に記憶し（ステップＳ１０８）、一連の処理を終了する。具体的には、制御部１１は、生成した異常検知モデル１６１に対してモデルＩＤを割り振り、割り振ったモデルＩＤに対応付けて、異常検知モデル１６１のファイル及び生成日時を一つのレコードとして学習モデル管理ＤＢ１６３に記憶する。

【0065】

図８は、異常データを生成する処理のサブルーチンの処理手順を示すフローチャートである。コンピュータ１の制御部１１は、複数の時系列データの平均を算出する（ステップＳ１１）。例えば、時系列データが３軸加速度センサのデータである場合、制御部１１は、Ｘ軸の加速度センサのデータの平均、Ｙ軸の加速度センサのデータの平均及びＺ軸の加速度センサのデータの平均をそれぞれ算出する。

【0066】

制御部１１は、受信した異常データの生成方法を取得する（ステップＳ１２）。制御部１１は、取得した生成方法を用いて、算出した複数の時系列データの平均に基づいて異常データを生成する（ステップＳ１３）。例えば、異常データの生成方法が第１生成方法である場合、制御部１１は第１生成方法を用いて、複数の時系列データの平均に所定のタイミングで周期的な変動を加えて異常データを生成する。制御部１１は、異常データの生成処理のサブルーチンを終了してリターンする。

【0067】

なお、本実施形態では、正常データと、正常データに基づいて生成された異常データとを用いる異常検知モデル１６１の生成処理の例を説明したが、これに限るものではない。例えば、コンピュータ１はユーザから複数の異常データを直接取得した場合、取得した複数の異常データと正常データとに基づいて訓練データを作成しても良い。または、コンピュータ１は、ユーザから取得された複数の異常データと、正常データに基づいて生成された異常データとを併用し、正常データと合わせて訓練データを作成しても良い。異常検知モデル１６１の生成または学習の際には、作成された訓練データを用いる。

【0068】

本実施形態によると、時系列データを入力した場合に異常に関する情報を出力する異常検知モデル１６１を生成することが可能となる。

【0069】

本実施形態によると、正常と判定された時系列データに基づいて異常データを生成することが可能となる。

【0070】

本実施形態によると、異常データの生成方法を示す複数の生成方法、または各生成方法を組み合わせた組み合わせ方法を利用することにより、多様な異常データを生成することが可能となる。

【0071】

本実施形態によると、正常データしか取得できない場合または異常データの取得が困難である場合に、異常データを自動的に生成することにより、異常検知モデル１６１の生成に役立つことが可能となる。

【0072】

（実施形態２）
実施形態２は、複数の時系列データの代表データに対して補正処理を行う形態に関する。なお、実施形態１と重複する内容については説明を省略する。なお、本実施形態では、代表データが複数の時系列データの平均である例を説明するが、ほかの種類の代表データ、その代表データが複数ある場合にも同様に適用することができる。

【0073】

図９は、補正処理を行う処理を説明する説明図である。図９Ａは、複数の時系列データの平均を説明する説明図である。時系列データは、例えば３軸加速度センサのデータである。コンピュータ１は、複数の３軸加速度センサのデータに基づき、各軸の加速度センサのデータの平均を取得する。なお、加速度センサのデータの平均を求める処理に関しては、図３と同様であるため、説明を省略する。図示のように、Ｘ軸の加速度センサのデータの平均、Ｙ軸の加速度センサのデータの平均及びＺ軸の加速度センサのデータの平均がグラフ１４ａに示されている。グラフ１４ａの横軸は、時間を示す。グラフ１４ａの縦軸は加速度の大きさを示す。

【0074】

図９Ｂは、第１補正後の加速度センサのデータを説明する説明図である。コンピュータ１は、各軸の複数の加速度センサのデータの平均に対して補正処理を行う。具体的には、先ず、コンピュータ１は、各軸の複数の加速度センサのデータの平均に対し、平均を０に揃える処理を行い、平均を０にした各軸の第１補正後の加速度センサのデータを生成する。図示のように、生成されたＸ軸の第１補正後の加速度センサのデータ、Ｙ軸の第１補正後の加速度センサのデータ及びＺ軸の第１補正後の加速度センサのデータが、グラフ１４ｂに示されている。なお、グラフ１４ｂの横軸及び縦軸は、グラフ１４ａと同様であるため、説明を省略する。

【0075】

図９Ｃは、第２補正後の加速度センサのデータを説明する説明図である。コンピュータ１は、各軸の第１補正後の加速度センサのデータに対し、実効値に基づいて各軸の第２補正後の加速度センサのデータを生成する。

【0076】

先ず、コンピュータ１は、各軸の最大実効値と平均実効値との比を算出する。図１０は、最大実効値と平均実効値との比を算出する説明図である。実効値は、二乗平均平方根（ＲＭＳ：root mean square）であり、時間と共に変化する信号の実効的な大きさを示す値である。図示のように、変量ｘのデータであるｘｉ（ｉ＝１，２，…，ｎ）に対して、ｘの二乗平均平方根ＲＭＳ（ｘ）は式１５ａで定義される。変量ｘは、例えばＸ軸の加速度センサのデータである。

【0077】

コンピュータ１は、異なる時間帯（例えば、ｔ０～ｔ１、ｔ２～ｔ３及びｔ４～ｔ５）でのＸ軸の加速度センサのデータを複数取得する。図示のように、取得された各時間帯の加速度センサのデータがグラフ１５ｂに表示される。グラフ１５ｂの横軸は、時間を示す。グラフ１５ｂの縦軸は、Ｘ軸の加速度の大きさを示す。コンピュータ１は、取得した各時間帯の加速度センサのデータの実効値をそれぞれ算出する。具体的には、コンピュータ１は、「ｔ０～ｔ１」時間帯の加速度センサのデータの実効値を算出し、「ｔ２～ｔ３」時間帯の加速度センサのデータの実効値を算出し、「ｔ４～ｔ５」時間帯の加速度センサのデータの実効値を算出する。コンピュータ１は、算出したそれぞれの実効値から最大の実効値を取得する。

【0078】

コンピュータ１は、取得した各時間帯の加速度センサのデータの平均を算出する。図示のように、算出された各時間帯の加速度センサのデータの平均が、グラフ１５ｃに示されている。なお、グラフ１５ｃの横軸及び縦軸は、グラフ１５ｂと同様であるため、説明を省略する。コンピュータ１は、各時間帯の加速度センサのデータの平均の実効値を算出する。

【0079】

コンピュータ１は、取得したＸ軸の加速度センサのデータの最大実効値と、算出したＸ軸の加速度センサのデータの平均実効値との比を算出する。例えば、最大実効値と平均実効値との比が「１：０．９７８」である。なお、図１０では、Ｘ軸の加速度センサのデータの例を説明するが、Ｙ軸の加速度センサのデータ及びＺ軸の加速度センサのデータにも同様に適用することができる。

【0080】

続いて、図９Ｃに戻り、コンピュータ１は、各軸の第１補正後の加速度センサのデータ（図９Ｂ）に対し、算出した各軸の最大実効値と平均実効値との比を乗算する。コンピュータ１は乗算処理を通じて、各軸の第１補正後の加速度センサのデータ（図９Ｂ）の位置（平均を０にした）を、元の各軸の複数の加速度センサのデータの平均（図９Ａ）の位置に戻し、第２補正後の加速度センサのデータを生成する。図示のように、生成されたＸ軸の第２補正後の加速度センサのデータ、Ｙ軸の第２補正後の加速度センサのデータ及びＺ軸の第２補正後の加速度センサのデータが、グラフ１４ｃに示されている。なお、グラフ１４ｃの横軸及び縦軸は、グラフ１４ａと同様であるため、説明を省略する。

【0081】

図１１は、実施形態２の異常データを生成する処理のサブルーチンの処理手順を示すフローチャートである。コンピュータ１の制御部１１は、複数の時系列データの平均を算出する（ステップＳ２１）。なお、複数の時系列データの平均の算出処理に関しては、図８のステップＳ１１の処理と同様であるため、説明を省略する。

【0082】

制御部１１は、算出した複数の時系列データの平均に対し、平均を０に揃える処理を行い、第１補正後の時系列データを生成する（ステップＳ２２）。制御部１１は、各時系列データの実効値を算出し（ステップＳ２３）、算出した各実効値から最大の実効値を取得する（ステップＳ２４）。制御部１１は、複数の時系列データの平均の実効値を算出する（ステップＳ２５）。

【0083】

制御部１１は、取得した最大実効値と、算出した平均実効値との比を算出する（ステップＳ２６）。制御部１１は、第１補正後の時系列データに対し、算出した最大実効値と平均実効値との比を乗算することにより、第２補正後の時系列データを生成する（ステップＳ２７）。

【0084】

制御部１１は、受信した異常データの生成方法を取得する（ステップＳ２８）。制御部１１は、取得した生成方法を用いて、生成した第２補正後の時系列データに基づいて異常データを生成する（ステップＳ２９）。制御部１１は、異常データの生成処理のサブルーチンを終了してリターンする。

【0085】

本実施形態によると、実効値を用いて、複数の時系列データの代表データ、または代表データの集合に対して補正処理を行うことが可能となる。

【0086】

（実施形態３）
実施形態３は、人工知能を用いて、正常と判断された時系列データ（以下、正常データという）から、異常用の時系列データ（以下、異常データという）を生成する形態に関する。なお、実施形態１～２と重複する内容については説明を省略する。

【0087】

図１２は、実施形態３のコンピュータ１の構成例を示すブロック図である。なお、図１と重複する内容については同一の符号を付して説明を省略する。大容量記憶部１６には、生成モデル１６５が記憶されている。生成モデル１６５は、正常データに基づいて異常データを生成する生成器であり、機械学習により生成された学習済みモデルである。

【0088】

コンピュータ１は、複数の正常データ及び複数の異常データを取得した場合、取得した複数の正常データ及び複数の異常データを用いて生成モデル１６５を生成する。

【0089】

図１３は、生成モデル１６５の学習処理に関する説明図である。本実施の形態でコンピュータ１は、ＧＡＮ（Generative Adversarial Network）の手法を用いて正常データ及び異常データを学習し、生成モデル１６５を生成する。図１３では、ＧＡＮの構成を概念的に図示している。

【0090】

ＧＡＮは、入力データから出力データを生成する生成器（Generator）１６ａと、生成器１６ａが生成したデータの真偽を識別する識別器（Discriminator）１６ｂとから構成される。生成器１６ａは、ランダムなノイズ（潜在変数）の入力を受け付け、出力データを生成する。識別器１６ｂは、学習用に与えられる真のデータと、生成器１６ａから与えられるデータとを用いて、入力データの真偽を学習する。ＧＡＮでは生成器１６ａ及び識別器１６ｂが競合して学習を行い、最終的に生成器１６ａの損失関数が最小化し、かつ、識別器１６ｂの損失関数が最大化するようにネットワークを構築する。

【0091】

なお、本実施の形態では、生成モデル１６５の生成（学習）手法としてＧＡＮを用いるが、生成モデル１６５はＧＡＮに係る学習済みモデルに限定されず、その他Ｕ－ＮＥＴ（Ｕ字型のニューラルネットワーク）等の深層学習、決定木等の学習手法による学習済みモデルであっても良い。

【0092】

コンピュータ１は、正常データと異常データとを含む訓練データに基づいて、生成モデル１６５を生成（構築）する。具体的には、コンピュータ１は、正常と判断された時系列データまたはランダムなノイズデータを生成器１６ａに入力する。生成器１６ａは、偽の異常データを生成する。さらに、コンピュータ１は、予め入手した複数の真の異常データまたは偽の異常データを識別器１６ｂに入力する。これにより、生成器１６ａ及び識別器１６ｂに深層学習を行わせる。

【0093】

コンピュータ１は、生成器１６ａと識別器１６ｂを交互に学習させる。まず、これら２つのネットワークのパラメータを乱数で初期化する。そして、コンピュータ１は、生成器１６ａに入力した時系列データまたはランダムなノイズデータを用いて、生成器１６ａに偽の異常データを生成させる。コンピュータ１は、真の異常データか、生成器１６ａで生成された偽の異常データのいずれかを識別器１６ｂに入力して識別を行う。

【0094】

学習の初期段階では、逆誤差伝播法を用いて、識別器１６ｂの学習が行われ、識別器１６ｂのパラメータが調整される。誤差逆伝搬法は、入力層、中間層、出力層からなるネットワークに対し、出力層から入力層にかけて誤差の勾配を逆伝搬させることで各層の重みフィルタとバイアスといったパラメータを更新する教師付き学習アルゴリズムである。

【0095】

識別器１６ｂの識別誤差が小さくなると、コンピュータ１は、同じように逆誤差伝播法を用いて、生成器１６ａの学習を行う。コンピュータ１は、生成器１６ａの学習と識別器１６ｂの学習とを繰り返し行うことで、識別器１６ｂの識別力を向上させつつ、生成器１６ａの偽の異常データの生成能力も向上させる。このように、正常と判断された時系列データを入力した場合に異常データを出力することが可能な生成モデル１６５が生成される。

【0096】

なお、学習の初期段階では、予め入手した複数の真の異常データ、正常と判断された時系列データに基づいて生成された異常データ（実施形態１）、または両者の組み合わせが利用されても良い。生成器１６ａの偽の異常データの生成能力の向上に伴い、予め入手した複数の真の異常データのみが利用されても良い。

【0097】

図１４は、生成モデル１６５を生成する際の処理手順を示すフローチャートである。コンピュータ１の制御部１１は、学習用の訓練データ群であって、複数の正常データ及び複数の異常データを入力部１３により取得する（ステップＳ１１１）。制御部１１は、取得した複数の正常データ及び複数の異常データを用いて、正常データを入力した場合に異常データを出力する生成モデル１６５を生成する（ステップＳ１１２）。具体的には上述の如く、制御部１１は、ＧＡＮの手法を用いて生成モデル１６５を生成する。制御部１１は、生成した生成モデル１６５を大容量記憶部１６の学習モデル管理ＤＢ１６３に記憶し（ステップＳ１１３）、一連の処理を終了する。

【0098】

図１５は、実施形態３の異常検知モデル１６１を生成する際の処理手順を示すフローチャートである。コンピュータ１の制御部１１は、複数の正常データを入力部１３により取得する（ステップＳ１２１）。制御部１１は、正常データを入力した場合に異常データを出力する生成モデル１６５を用いて、取得した各正常データに対して異常データを生成する（ステップＳ１２２）。制御部１１は、ステップＳ１２３～Ｓ１２７の処理を実行する。なお、ステップＳ１２３～Ｓ１２７の処理に関しては、図７のステップＳ１０４～１０８の処理と同様であるため、詳細な説明を省略する。

【0099】

本実施形態によると、生成モデル１６５を用いて、正常と判断された時系列データから異常データを生成することが可能となる。

【0100】

本実施形態によると、生成モデル１６５を用いて生成された異常データを用いて、異常検知モデル１６１を生成することが可能となる。なお、本実施形態における異常データの生成方法も実施形態１で述べた複数の異常データの生成方法の選択肢の一つとして、利用することができる。
以上の実施の形態１乃至３を含む実施形態に関し、さらに以下の付記を開示する。
（付記１）
データを入力した場合に、異常データを生成するよう学習された生成モデルに、データを入力して異常データを生成する。
（付記２）
前記生成モデルは、前記データ及び予め入手した真の異常データを用いて学習されている。

【0101】

今回開示された実施形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0102】

１情報処理装置（コンピュータ）
１１制御部
１２記憶部
１３入力部
１４表示部
１５読取部
１６大容量記憶部
１６１異常検知モデル
１６２訓練データ管理ＤＢ
１６３学習モデル管理ＤＢ
１６４訓練データファイル
１６５生成モデル
１ａ可搬型記憶媒体
１ｂ半導体メモリ
１Ｐ制御プログラム

【要約】

【課題】異常訓練データの準備負担を軽減することが可能な学習モデルの生成方法等を提供すること。
【解決手段】一つの側面に係る学習モデルの生成方法は、正常と判断された時系列データを取得し、取得した時系列データに基づいて異常データを生成し、正常と判断された時系列データ及び前記時系列データに対しラベル付けされた正常ラベルと、生成した異常データ及び前記異常データに対しラベル付けされた異常ラベルとに基づき、時系列データを入力した場合に、異常に関する情報を出力する学習モデルを生成する処理を実行させることを特徴とする。
【選択図】図７