IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧 ▶ NECプラットフォームズ株式会社の特許一覧

特開2024-165067学習モデル生成装置および学習モデル生成方法
<>
  • 特開-学習モデル生成装置および学習モデル生成方法 図1
  • 特開-学習モデル生成装置および学習モデル生成方法 図2
  • 特開-学習モデル生成装置および学習モデル生成方法 図3
  • 特開-学習モデル生成装置および学習モデル生成方法 図4
  • 特開-学習モデル生成装置および学習モデル生成方法 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024165067
(43)【公開日】2024-11-28
(54)【発明の名称】学習モデル生成装置および学習モデル生成方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20241121BHJP
   G06F 18/2433 20230101ALI20241121BHJP
【FI】
G06N20/00
G06F18/2433
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023080904
(22)【出願日】2023-05-16
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(71)【出願人】
【識別番号】000227205
【氏名又は名称】NECプラットフォームズ株式会社
(74)【代理人】
【識別番号】100103090
【弁理士】
【氏名又は名称】岩壁 冬樹
(74)【代理人】
【識別番号】100124501
【弁理士】
【氏名又は名称】塩川 誠人
(72)【発明者】
【氏名】鴇田 翔哉
(72)【発明者】
【氏名】堺 淳
(72)【発明者】
【氏名】竹内 俊樹
(72)【発明者】
【氏名】原山 理佳
(72)【発明者】
【氏名】濱田 毅
(72)【発明者】
【氏名】下田 智大
(57)【要約】
【課題】学習モデルのサイズ減らすことができ、かつ、学習に際して用意すべきメモリのサイズを小さくする。
【解決手段】学習モデル生成装置10は、それぞれが特徴量を示す複数の特徴量データをグループ分けするデータ分割手段11と、データ分割手段11によって形成された複数のグループのうちの第1のグループに属する特徴量データ、または、第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する学習モデル生成手段12とを含む。
【選択図】図5
【特許請求の範囲】
【請求項1】
それぞれが特徴量を示す複数の特徴量データをグループ分けするデータ分割手段と、
前記データ分割手段によって形成された複数のグループのうちの第1のグループに属する特徴量データ、または、前記第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する学習モデル生成手段と
を備えた学習モデル生成装置。
【請求項2】
収集されたデータの各々から特徴量を抽出する特徴量抽出手段を備え、
前記データ分割手段は、前記特徴量抽出手段によって抽出された特徴量を示す複数の特徴量データをグループ分けする
請求項1記載の学習モデル生成装置。
【請求項3】
前記学習モデル生成手段が生成した前記学習モデルを用いて、前記他のグループに属する特徴量データが異常データであるか否かを判定する異常判定手段を備え、
前記学習モデル生成手段は、前記異常判定手段によって異常データであると判定された特徴量データを、前記他のグループに属する特徴量データの一部として、前記学習モデルを再学習させる
請求項2記載の学習モデル生成装置。
【請求項4】
前記異常判定手段は、全ての前記他のグループについて、特徴量データが異常データであるか否かの判定を実行し、
前記学習モデル生成手段は、全ての前記他のグループについて、前記学習モデルを再学習させる
請求項3記載の学習モデル生成装置。
【請求項5】
前記異常判定手段は、異常データであると判定した特徴量データを異常データ記憶部に格納し、
前記学習モデル生成手段は、前記異常データ記憶部に格納されている異常データを、前記他のグループに属する特徴量データの一部とする
請求項1から請求項4のうちのいずれか1項に記載の学習モデル生成装置。
【請求項6】
それぞれが特徴量を示す複数の特徴量データをグループ分けし、
形成された複数のグループのうちの第1のグループに属する特徴量データ、または、前記第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する
学習モデル生成方法。
【請求項7】
収集されたデータの各々から特徴量を抽出し、
抽出された特徴量を示す複数の特徴量データをグループ分けする
請求項6記載の学習モデル生成方法。
【請求項8】
生成された前記学習モデルを用いて、前記他のグループに属する特徴量データが異常データであるか否かを判定し、
異常データであると判定された特徴量データを、前記他のグループに属する特徴量データの一部として、前記学習モデルを再学習させる
請求項7記載の学習モデル生成方法。
【請求項9】
コンピュータに、
それぞれが特徴量を示す複数の特徴量データをグループ分けする処理と、
形成された複数のグループのうちの第1のグループに属する特徴量データ、または、前記第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する処理と
を実行させるための学習モデル生成プログラム。
【請求項10】
コンピュータに、
収集されたデータの各々から特徴量を抽出する処理と、
抽出された特徴量を示す複数の特徴量データをグループ分けする処理と
を実行させる請求項9記載の学習モデル生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、異常検知のための学習モデルを生成する学習モデル生成装置および学習モデル生成方法に関する。
【背景技術】
【0002】
電波を用いた無線通信が、様々な分野で利用されている。それに応じて、電波干渉や無線通信システムの障害の検知を行うこと、すなわち、異常検知が重要視される。そして、機械学習を利用して異常検知が行われることがある(例えば、特許文献1,2参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2019-159957号公報
【特許文献2】特開2022-182844号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
対象の異常データを収集することは困難であるが、正常データは比較的容易に収集できる。そこで、機械学習を利用して異常検知を行う場合、正常データを学習データとして、モデル(機械学習モデル。以下、学習モデルという。)が教師なし機械学習で学習されることが多い。なお、正常データは、電波干渉や障害等がないときに得られるデータである。異常データは、電波干渉または障害等が存在するときに得られるデータである。
【0005】
正常データのみで学習を行う場合には、学習済みの学習モデルを用いるときに、正常と判定すべきデータを異常と判定してしまう過検出が発生する可能性がある。また、検知漏れが生ずる可能性がある。
【0006】
過検出および検知漏れの発生の可能性を減らすために、様々な状況で収集された大量の学習データが必要になる。また、学習モデルのサイズが大きくなる。
【0007】
大量の学習データが使用されるので、用意すべきメモリのサイズが大きくなる。また、学習モデルのサイズが大きくなるので、学習モデルを実現するための計算機に求められる性能が高くなる。換言すれば、高価な計算機が必要になる。
【0008】
本発明は、学習モデルのサイズ減らすことができ、かつ、学習に際して用意すべきメモリのサイズを小さくすることができる学習モデル生成装置および学習モデル生成方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明による学習モデル生成装置は、それぞれが特徴量を示す複数の特徴量データをグループ分けするデータ分割手段と、データ分割手段によって形成された複数のグループのうちの第1のグループに属する特徴量データ、または、第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する学習モデル生成手段とを含む。
【0010】
本発明による学習モデル生成方法は、それぞれが特徴量を示す複数の特徴量データをグループ分けし、形成された複数のグループのうちの第1のグループに属する特徴量データ、または、第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する。
【0011】
本発明による学習モデル生成プログラムは、コンピュータに、それぞれが特徴量を示す複数の特徴量データをグループ分けする処理と、形成された複数のグループのうちの第1のグループに属する特徴量データ、または、第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する処理とを実行させる。
【発明の効果】
【0012】
本発明によれば、学習モデルのサイズ減らすことができ、かつ、学習に際して用意すべきメモリのサイズを小さくすることができる。
【図面の簡単な説明】
【0013】
図1】学習モデル生成装置の一実施形態の構成を示すブロック図である。
図2】学習モデル生成部の処理を説明するための説明図である。
図3】学習モデル生成装置の動作を示すフローチャートである。
図4】学習モデル生成装置の機能を実現可能な情報処理装置の構成例を示すブロック図である。
図5】学習モデル生成装置の主要部を示すブロック図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態を図面を参照して説明する。
【0015】
図1は、異常検知のための学習モデルを生成する学習モデル生成装置の一実施形態の構成を示すブロック図である。図1に示す学習モデル生成装置100は、特徴量検出部110、データ記憶部(特徴量記憶部)120、データ分割部130、分割データセット記憶部140、学習モデル200を生成する学習モデル生成部150、異常判定部160、および異常データ記憶部170とを備えている。なお、図1における矢印は、信号(データ)の流れの方向を端的に示すが、双方向性を排除するものではない。このことは、他のブロック図についても同様である。
【0016】
学習モデル200は、生成後すなわち学習済み後に、入力されたデータが正常データであるのか異常データであるのかを推定する推定モデルである。すなわち、学習済み後の学習モデル200は、異常検知を行うための推定モデルとして使用可能である。
【0017】
異常検知は、入力されたデータが正常であるのか異常であるのかを判定することである。以下、電波を利用する無線通信分野において、電波干渉や障害(例えば、システムや機器等の故障や不具合)などが生じているか否か判定する場合を例にする。その場合、異常データは、電波干渉や障害などが生じている場合に取得されるデータである。また、電波干渉や障害などが生じていない場合に取得されるデータが正常データである。
【0018】
異常検知の運用時に、すなわち、推定フェーズにおいて、学習済みの学習モデル200は、入力されたデータが正常であるのか異常であるのかの推定結果を示す推定データを出力するために使用される。推定データに基づいて、異常検知処理が実行される。異常検知処理は、例えば、電波干渉や障害が生じていることを検知する処理である。
【0019】
特徴量検出部110には、収集されたデータが入力される。電波干渉や障害などが生じているか否か判定する場合には、入力されるデータは受信データである。受信データは、例えば、無線電波を受信する受信部(図示せず)から出力されるデータである。
【0020】
特徴量検出部110は、入力されたデータの各々から特徴量を抽出する。電波干渉や障害などが生じているか否か判定する場合には、特徴量は、電波干渉を受けているか否か判定するための特徴量や、障害が生じているか否か判定するための特徴量などである。具体的には、特徴量は、例えば、周波数方向および時間方向の情報を含む統計的な情報を示す量である。一例として、特徴量として、振幅確率分布(APD:Amplitude Probability Distribution)、累積分布関数(CDF:Cumulative Distribution Function)、振幅ヒストグラム、周波数スペクトラムを使用可能である。
【0021】
特徴量検出部110は、抽出した複数の特徴量を、複数の特徴量データとしてデータ記憶部120に格納する。
【0022】
データ分割部130は、データ記憶部120に格納されている特徴量データ群を、複数のグループに分割する。以下、グループに含まれるデータの集まりを、分割データセットという。データ分割部130は、分割データセットを、分割データセット記憶部140に格納する。
【0023】
学習モデル200は、学習データ(訓練データ)を用いて機械学習を繰り返すことで生成される。機械学習は、ランダムフォレスト、サポートベクトルマシン、ニューラルネットワーク(Neural Network)、ディープニューラルネットワーク(Deep Neural Network)などである。学習モデル生成部150は、分割データセット記憶部140に格納されている分割データセットを学習データとして使用して学習モデル200を生成する。なお、学習モデル生成部150は、学習モデル200を生成するときに、分割データセットに加えて、異常データを使用することがある。
【0024】
以下、学習モデル200の学習時に使用される異常データを「学習用異常データ」といい、学習モデル200による推定結果が異常である場合の特徴量データを、「判定された異常データ」という。
【0025】
異常判定部160は、判定された異常データの集まりである異常データ群を、異常データ記憶部170に格納する。なお、学習モデル200は正常/異常の判定結果を出力するので、学習モデル200は異常判定部160の一部であると捉えることもできる。
【0026】
図2は、学習モデル生成部150の処理(学習フェーズ)を説明するための説明図である。
【0027】
図2に示すx~xは、それぞれ、分割データセットを示す。なお、分割データセットの数すなわち入力データの分割数n(n≧2)は任意であるが、図2には、n=4の場合が例示されている。
【0028】
図2に示す例では、学習モデル生成部150は、まず、分割データセットxに含まれる特徴量データを学習データとして学習モデル200を学習させる。学習完了後の学習モデル200を学習モデルyとする(図2における(1)参照)。なお、本実施形態において、学習として教師なし学習が想定されるが、学習は、教師なし学習に限定されない。また、教師なし学習として、一般的な、主成分分析、クラスター分析、自己組織化マップ(SOM: self-organizing map)などを使用できる。
【0029】
異常判定部160は、学習モデルyを用いて、分割データセットxに含まれる特徴量データの異常判定を行う。異常判定部160は、異常と判定された特徴量データ群すなわち判定された異常データ群を異常データ記憶部170に格納する。
【0030】
次に、学習モデル生成部150は、分割データセットxに含まれる特徴量データと異常データ記憶部170に格納されている異常データ群に含まれる特徴量データとを学習データとして学習モデルyを学習させる。学習完了後の学習モデル200を学習モデルy1-2とする(図2における(2)参照)。
【0031】
なお、学習モデルyを学習させる時点で、異常データ記憶部170に格納されている異常データ群は、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データである。また、図2において、分割データセットxに含まれる特徴量データと、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データとの集まりが、x1-2で示されている。
【0032】
異常判定部160は、学習モデルy1-2を用いて、分割データセットxに含まれる特徴量データの異常判定を行う。異常判定部160は、異常と判定された特徴量データ群すなわち判定された異常データ群を異常データ記憶部170に格納する。
【0033】
次に、学習モデル生成部150は、分割データセットx1-2に含まれる特徴量データと異常データ記憶部170に格納されている異常データ群に含まれる特徴量データとを学習データとして学習モデルy1-2を学習させる。学習完了後の学習モデル200を学習モデルy1-3とする(図2における(3)参照)。
【0034】
なお、学習モデルy1-2を学習させる時点で、異常データ記憶部170に格納されている異常データ群は、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データである。また、図2において、分割データセットxに含まれる特徴量データと、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データと、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データとの集まりが、x1-3で示されている。
【0035】
異常判定部160は、学習モデルy1-3を用いて、分割データセットxに含まれる特徴量データの異常判定を行う。異常判定部160は、異常と判定された特徴量データ群すなわち判定された異常データ群を異常データ記憶部170に格納する。
【0036】
次に、学習モデル生成部150は、分割データセットx1-3に含まれる特徴量データと異常データ記憶部170に格納されている異常データ群に含まれる特徴量データとを学習データとして学習モデルy1-3を学習させる。学習完了後の学習モデル200を学習モデルy1-4とする(図2における(4)参照)。
【0037】
なお、学習モデルy1-3を学習させる時点で、異常データ記憶部170に格納されている異常データ群は、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データである。また、図2において、分割データセットxに含まれる特徴量データと、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データと、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データと、分割データセットxに含まれる特徴量データのうち異常と判定された特徴量データとの集まりが、x1-4で示されている。
【0038】
図2に示された例では、分割数は4である。分割数が4を超える場合(n>4の場合)には、学習モデル生成部150および異常判定部160が、分割データセットに含まれる特徴量データと、それまでの処理で得られた異常データとを学習データとして学習モデル200を学習させる処理と、未だ使用されていない分割データセットに含まれる特徴量データの異常検知処理とを、繰り返し実行すればよい。そして、最終的に、学習モデルy1-nが得られる。
【0039】
学習モデルy1-nを得る場合に、学習フェーズにおいて、入力されたデータの全てを学習データとする訳ではない。つまり、n個の分割データセットに含まれる特徴量データの全てが学習データとして使用される訳ではない。図2に示す例では、最初の分割データセットxに含まれる特徴量データのみが、学習データとして使用される。
【0040】
分割データセットx以外の分割データセットx,x,xについては、異常データであると判定された特徴量データのみが学習データとして使用される。したがって、過検出等を防止することを目的として大量の特徴量データの全てを学習データとして使用する場合に比べて、学習データとして使用される特徴量データの数は少なくなる。したがって、学習モデルのサイズを小さくすることができる。また、学習フェーズにおいて用意されるべきメモリのサイズを小さくすることができる。
【0041】
また、正常データであると判定された、分割データセットx,x,xに含まれる特徴量データは、互いに類似している特徴量データである可能性がある。類似する多数の特徴量データを学習データとして使用しても、学習モデルの精度は上がらない。つまり、本実施形態では、学習モデルを生成するときに、学習データの数は少なくなっているが、大量の特徴量データの全てを学習データとして使用する場合と同程度の精度の学習モデル(学習済みの学習モデル)が得られることが期待される。
【0042】
次に、図3のフローチャートを参照して、学習モデル生成装置100の動作を説明する。
【0043】
特徴量検出部110は、入力されたデータから特徴量を抽出する(ステップS101)。特徴量検出部110は、抽出した特徴量を示す特徴量データをデータ記憶部120に格納する。
【0044】
データ分割部130は、データ記憶部120に格納されている特徴量データ群を、複数のグループ(分割データセット)に分割する(ステップS102)。データ分割部130は、分割データセットを、分割データセット記憶部140に格納する。
【0045】
学習モデル生成部150は、変数kに1をセットする(ステップS103)。
【0046】
学習モデル生成部150は、図2に示すように、k番目(この場合には、1番目)の分割データセットと異常データ記憶部170に格納されている異常データ(学習用異常データ)とを学習モデル200に与えて、学習モデル200を学習させる(ステップS104)。なお、k=1の場合には、異常データ記憶部170に異常データは格納されていない。よって、k=1の場合、学習モデル200は、1番目の分割データセット(図2におけるxに相当)のみを用いて学習を行う。
【0047】
なお、k≧2であるときに実行される学習は、再学習であるともいえる。
【0048】
学習モデル生成部150は、変数kの値を1増やす(ステップS105)。変数kの値がn(分割数)に達している場合には、処理を終了する(ステップS106)。
【0049】
変数kの値がn未満である場合には、異常判定部160は、学習モデルy(k-1)を用いて、次の分割データセット(分割データセットx)に含まれる特徴量データの異常判定を行う(ステップS107)。異常判定部160は、判定された異常データ群を、学習用異常データとして異常データ記憶部170に格納する(ステップS108)。そして、ステップS104の処理に戻る。
【0050】
図3に示された処理によって、学習済みの学習モデル200が得られる。具体的には、ステップS106において変数kの値がn(分割数)に達していると判定されたときに、そのときの学習モデル200は、最終的な学習済みの学習モデルになる。
【0051】
なお、本実施形態では、主として、電波干渉や障害等に起因する異常の検知に用いられる学習モデルを生成する場合を例にした。しかし、本実施形態の学習モデル生成装置100は、電波干渉や障害等に起因する異常に限られず、他の要因に基づく異常の検知に用いられる学習モデルを生成することもできる。他の要因に基づく異常の検知の一例として、IoT(Internet of Things)での外れ値の検出、マルウェアの検出、製品の良品判定などがある。
【0052】
推定フェーズでは、学習済みの学習モデル200を用いて、異常検知が実行される。すなわち、異常検知の対象である入力データの特徴量すなわち特徴量データが、学習モデル200に入力される。学習モデル200は、特徴量データが正常なデータであるのか異常なデータであるのかの推定結果を出力する。
【0053】
図4は、上記の実施形態の学習モデル生成装置100の機能を実現可能な情報処理装置(コンピュータ)の構成例を示すブロック図である。図4に示す情報処理装置は、1つまたは複数のCPU(Central Processing Unit )などのプロセッサ、プログラムメモリ1002およびメモリ1003を含む。図4には、1つのプロセッサ1001を有する情報処理装置が例示されている。
【0054】
プログラムメモリ1002は、例えば、非一時的なコンピュータ可読媒体(non-transitory computer readable medium )である。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium )を含む。例えば、プログラムメモリ1002として、フラッシュROM(Read Only Memory)などの半導体記憶媒体やハードディスク等の磁気記憶媒体が使用可能である。プログラムメモリ1002は、上記の実施形態の学習モデル生成装置100における各ブロック(特徴量検出部110、データ分割部130、学習モデル生成部150、および異常判定部160)の機能を実現するための学習モデル生成プログラムが格納される。
【0055】
プロセッサ1001は、プログラムメモリ1002に格納されている学習モデル生成プログラムに従って処理を実行することによって、学習モデル生成装置100の機能を実現する。複数のプロセッサが搭載されている場合には、複数のプロセッサが共働して学習モデル生成装置100の機能を実現することもできる。
【0056】
メモリ1003として、例えば、RAM(Random Access Memory)が使用可能である。メモリ1003には、学習モデル生成装置100が処理を実行しているときに発生する一時的なデータなどが記憶される。メモリ1003に学習モデル生成プログラムが転送され、プロセッサ1001がメモリ1003内の画像処理プログラムに基づいて処理を実行するような形態も想定しうる。なお、プログラムメモリ1002とメモリ1003とは、一体であってもよい。
【0057】
データ記憶部120、分割データセット記憶部140、および異常データ記憶部170は、メモリ1003に構築可能である。学習モデル200は、例えば、メモリ1003において構築される。学習済みの学習モデル200を、他の情報処理装置に移植することができる。すなわち、あるコンピュータにおいて生成された学習モデルを、別のコンピュータで用いることができる。
【0058】
図5は、学習モデル生成装置の主要部を示すブロック図である。図5に示す学習モデル生成装置10は、それぞれが特徴量を示す複数の特徴量データをグループ分けするデータ分割手段(データ分割部)11(実施形態では、データ分割部130で実現される。)と、データ分割手段11によって形成された複数のグループ(例えば、分割データセットx~x)のうちの第1のグループ(例えば、分割データセットx)に属する特徴量データ、または、第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する学習モデル生成手段(学習モデル生成部)12(実施形態では、学習モデル生成部150で実現される。)とを備えている。
【0059】
学習モデル生成装置10は、収集されたデータの各々から特徴量を抽出する特徴量抽出手段(実施形態では、特徴量抽出部110で実現される。)を備え、データ分割手段11は、特徴量抽出手段によって抽出された特徴量を示す複数の特徴量データをグループ分けするように構成されていてもよい。
【0060】
学習モデル生成装置10は、学習モデル生成手段12が生成した学習モデルを用いて、他のグループに属する特徴量データが異常データであるか否かを判定する異常判定手段(実施形態では、異常判定部160で実現される。)を備え、学習モデル生成手段12は、異常判定手段によって異常データであると判定された特徴量データを、他のグループに属する特徴量データの一部として、学習モデルを再学習させるように構成されていてもよい。
【0061】
上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、本発明は、以下の構成に限定されるわけではない。
【0062】
(付記1)それぞれが特徴量を示す複数の特徴量データをグループ分けするデータ分割手段と、
前記データ分割手段によって形成された複数のグループのうちの第1のグループに属する特徴量データ、または、前記第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する学習モデル生成手段と
を備えた学習モデル生成装置。
【0063】
(付記2)収集されたデータの各々から特徴量を抽出する特徴量抽出手段を備え、
前記データ分割手段は、前記特徴量抽出手段によって抽出された特徴量を示す複数の特徴量データをグループ分けする
付記1記載の学習モデル生成装置。
【0064】
(付記3)前記学習モデル生成手段が生成した前記学習モデルを用いて、前記他のグループに属する特徴量データが異常データであるか否かを判定する異常判定手段を備え、
前記学習モデル生成手段は、前記異常判定手段によって異常データであると判定された特徴量データを、前記他のグループに属する特徴量データの一部として、前記学習モデルを再学習させる
付記2記載の学習モデル生成装置。
【0065】
(付記4)前記異常判定手段は、全ての前記他のグループについて、特徴量データが異常データであるか否かの判定を実行し、
前記学習モデル生成手段は、全ての前記他のグループについて、前記学習モデルを再学習させる
付記3記載の学習モデル生成装置。
【0066】
(付記5)前記異常判定手段は、異常データであると判定した特徴量データを異常データ記憶部に格納し、
前記学習モデル生成手段は、前記異常データ記憶部に格納されている異常データを、前記他のグループに属する特徴量データの一部とする
付記1から付記4のうちのいずれか1項に記載の学習モデル生成装置。
【0067】
(付記6)それぞれが特徴量を示す複数の特徴量データをグループ分けし、
形成された複数のグループのうちの第1のグループに属する特徴量データ、または、前記第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する
学習モデル生成方法。
【0068】
(付記7)収集されたデータの各々から特徴量を抽出し、
抽出された特徴量を示す複数の特徴量データをグループ分けする
付記6記載の学習モデル生成方法。
【0069】
(付記8)生成された前記学習モデルを用いて、前記他のグループに属する特徴量データが異常データであるか否かを判定し、
異常データであると判定された特徴量データを、前記他のグループに属する特徴量データの一部として、前記学習モデルを再学習させる
付記7記載の学習モデル生成方法。
【0070】
(付記9)コンピュータに、
それぞれが特徴量を示す複数の特徴量データをグループ分けする処理と、
形成された複数のグループのうちの第1のグループに属する特徴量データ、または、前記第1のグループに属する特徴量データと他のグループに属する特徴量データの一部とを学習データとして学習モデルを生成する処理と
を実行させるための学習モデル生成プログラム。
【0071】
(付記10)コンピュータに、
収集されたデータの各々から特徴量を抽出する処理と、
抽出された特徴量を示す複数の特徴量データをグループ分けする処理と
を実行させる付記9記載の学習モデル生成プログラム。
【0072】
(付記11)コンピュータに、
生成された前記学習モデルを用いて、前記他のグループに属する特徴量データが異常データであるか否かを判定する処理を実行させ、
異常データであると判定された特徴量データを、前記他のグループに属する特徴量データの一部として、前記学習モデルを再学習させる
付記10記載の学習モデル生成プログラム。
【符号の説明】
【0073】
10,100 学習モデル生成装置
11 データ分割手段
12 学習モデル生成手段
110 特徴量検出部
120 データ記憶部
130 データ分割部
140 分割データセット記憶部
150 学習モデル生成部
160 異常判定部
170 異常データ記憶部
200 学習モデル
1001 プロセッサ
1002 プログラムメモリ
1003 メモリ
図1
図2
図3
図4
図5