特開2025-99163 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ローム株式会社の特許一覧

特開2025-99163異常度生成装置、プログラム、および異常度生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2025099163

(43)【公開日】2025-07-03

(54)【発明の名称】異常度生成装置、プログラム、および異常度生成方法

(51)【国際特許分類】

G06F 18/213 20230101AFI20250626BHJP

G06N 3/02 20060101ALI20250626BHJP

【ＦＩ】

G06F18/213

G06N3/02

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2023215602

(22)【出願日】2023-12-21

(71)【出願人】

【識別番号】000116024

【氏名又は名称】ローム株式会社

(74)【代理人】

【識別番号】110001933

【氏名又は名称】弁理士法人佐野特許事務所

(72)【発明者】

【氏名】浜地健次

(57)【要約】（修正有）

【課題】異常を効果的に検知するための新規な指標としての異常度を生成可能とする異常度生成装置を提供する。
【解決手段】異常度生成装置１は、機械学習モデルにおける中間層の中間層ベクトルから、中間層平均ベクトルを求め、前記中間層平均ベクトルに対する前記中間層ベクトルの正規化距離を表す第１異常度を算出するように構成される第１異常度算出部４を備える。前記正規化距離は、共分散行列を用いて正規化された距離である。さらに、前記中間層ベクトルを算出するためのパラメータに関する乱数行列を生成する乱数行列生成部と、生成された前記乱数行列と、正常データおよび異常データに基づいて前記第１異常度算出部によって算出される前記第１異常度に基づき前記乱数行列を評価し、前記乱数行列を初期値として決定するように構成される初期値決定部と、を備える、
【選択図】図４

【特許請求の範囲】

【請求項1】

入力層と出力層との間に配置される少なくとも１つの中間層を含む機械学習モデルにおける前記中間層の中間層ベクトルを

【数24】

とし、
中間層平均ベクトルを

【数25】

【数26】

として、
前記中間層平均ベクトルに対する前記中間層ベクトルの正規化距離を表す第１異常度を算出するように構成される第１異常度算出部を備える、異常度生成装置。

【請求項2】

前記正規化距離は、

【数27】

で表される共分散行列を用いて正規化された距離である、請求項１に記載の異常度生成装置。

【請求項3】

前記第１異常度算出部は、下記式で表される前記第１異常度を算出する、請求項２に記載の異常度生成装置。

【数28】

【請求項4】

前記中間層ベクトルを算出するためのパラメータに関する乱数行列を生成するように構成される乱数行列生成部と、
生成された前記乱数行列と、正常データおよび異常データに基づいて前記第１異常度算出部によって算出される前記第１異常度に基づき前記乱数行列を評価し、前記乱数行列を初期値として決定するように構成される初期値決定部と、
を備える、請求項１に記載の異常度生成装置。

【請求項5】

前記初期値決定部は、前記乱数行列生成部による所定回数の前記乱数行列の生成によって生成された前記乱数行列のうち、最も適切と評価した前記乱数行列を前記初期値として決定する、請求項４に記載の異常度生成装置。

【請求項6】

前記第１異常度算出部は、複数の前記中間層のそれぞれについて前記第１異常度を算出する、請求項１に記載の異常度生成装置。

【請求項7】

コンピュータにおけるソフトウェア処理によって実現される、請求項１から請求項６のいずれか１項に記載の異常度生成装置。

【請求項8】

前記コンピュータを請求項７に記載の異常度生成装置として機能させるためのプログラム。

【請求項9】

前記機械学習モデルを保持するように構成されるモデル保持部と、
入力データを記憶するように構成されるデータ記憶部と、
前記機械学習モデルと前記入力データに基づいて教師なし学習を実行するように構成される学習演算部と、
前記機械学習モデルと前記入力データに基づいて推論を実行するように構成される推論演算部と、
前記推論演算部による推論結果と前記入力データに基づいて損失関数による第２異常度を算出するように構成される第２異常度算出部と、
前記第１異常度と第１閾値との比較、および前記第２異常度と第２閾値との比較に基づいて異常を検知するように構成される異常検出部と、
を備える、請求項１に記載の異常度生成装置。

【請求項10】

コンピュータを用いて実行される異常度生成方法であって、
入力層と出力層との間に配置される少なくとも１つの中間層を含む機械学習モデルにおける前記中間層の中間層ベクトルを

【数29】

として算出する第１ステップと、
中間層平均ベクトルを

【数30】

【数31】

として算出する第２ステップと、
前記中間層平均ベクトルに対する前記中間層ベクトルの正規化距離を表す異常度を算出する第３ステップと、
を備える異常度生成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、異常度生成装置に関する。

【背景技術】

【0002】

従来、産機分野の工場設備保全に関して、機械システムの状態管理保全（Condition Based Maintenance）に対してＡＩ（人工知能）の適用が進んでいる（例えば特許文献１）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】国際公開第２０１９／０３５２７９号

【0004】

［概要］
機械システム等の異常を検知するための指標として、従来、ＡＩが生成する損失関数（誤差関数）の値が異常度として用いられる。しかしながら、従来の損失関数による指標では、検知しにくい異常が存在する場合があった。

【0005】

上記状況に鑑み、本開示は、異常を効果的に検知するための新規な指標としての異常度を生成可能とする異常度生成装置を提供することを目的とする。

【0006】

本開示の一態様に係る異常度生成装置は、
入力層と出力層との間に配置される少なくとも１つの中間層を含む機械学習モデルにおける前記中間層の中間層ベクトルを

【数1】

とし、
中間層平均ベクトルを

【数2】

【数3】

として、
前記中間層平均ベクトルに対する前記中間層ベクトルの正規化距離を表す第１異常度を算出するように構成される第１異常度算出部を備える構成としている。

【0007】

また、本開示の一態様に係る異常度生成方法は、
コンピュータを用いて実行される異常度生成方法であって、
入力層と出力層との間に配置される少なくとも１つの中間層を含む機械学習モデルにおける前記中間層の中間層ベクトルを

【数4】

として算出する第１ステップと、
中間層平均ベクトルを

【数5】

【数6】

として算出する第２ステップと、
前記中間層平均ベクトルに対する前記中間層ベクトルの正規化距離を表す異常度を算出する第３ステップと、を備える。

【図面の簡単な説明】

【0008】

【図1】図１は、３層ニューラルネットワークを示す図である。

【図2】図２は、隠れ層ベクトルｈを第１主成分軸ｈ_ｐ１と第２主成分軸ｈ_ｐ２において示した模式図である。

【図3】図３は、コンピュータの構例成を示す図である。

【図4】図４は、異常度生成装置の構成例を示す図である。

【図5】図５は、初期値決定部による初期値決定処理に関するフローチャートである。

【図6】図６は、正常データと異常データの時系列データの例を示す図である。

【図7】図７は、正常データと異常データの時系列データと、異常度の例を示す図である。

【図8】図８は、正常データと異常データの時系列データと、異常度の例を示す図である。

【図9】図９は、本開示の例示的な実施形態に係る機械学習装置の構成を示す図である。

【図10】図１０は、第１変形例に係る機械学習装置の構成を示す図である。

【図11】図１１は、第２変形例に係る機械学習装置の構成を示す図である。

【図12】図１２は、４層ニューラルネットワークを示す図である。

【0009】

[詳細な説明]
以下、本開示の例示的な実施形態について、図面を参照して説明する。

【0010】

＜異常度について＞
ここでは、本開示に係る新規な指標である異常度について説明する。図１は、機械学習モデルの一例としての３層ニューラルネットワーク５０を示す図である。

【0011】

図１に示すように、３層ニューラルネットワーク５０は、入力層５０Ａと、隠れ層５０Ｂと、出力層５０Ｃと、を有するＡＩモデルである。隠れ層は、中間層とも称される。一般に、３層ニューラルネットワーク５０において、バッチサイズｋのｎ次元の入力データｘ∈Ｒ^ｋ×ｎに対して、ｎ’次元の推論結果ｙ∈Ｒ^ｋ×ｎ’は、ｙ＝Ｇ（ｘ・α＋ｂ）βとして得られる。ここで、α∈Ｒ^ｎ×ｍは入力層５０Ａと隠れ層５０Ｂとを結合する重みであり、β∈Ｒ^ｍ×ｎ’は隠れ層５０Ｂと出力層５０Ｃとを結合する重みである。また、ｂ∈Ｒ^ｍは、隠れ層５０Ｂのバイアスであり、Ｇは隠れ層５０Ｂの活性化関数である。活性化関数は、例えばＳｉｇｍｏｉｄあるいはＲｅＬＵなどを用いることが可能である。

【0012】

本実施形態では、３層ニューラルネットワーク５０を任意のバッチサイズで逐次的に学習できるアルゴリズムを用いる。バッチサイズｋ_ｉのｉ番目の学習データ｛ｘ_ｉ∈Ｒ^ｋi×ｎ, ｔ_ｉ∈Ｒ^ｋi×ｎ’｝が得られた場合、下記（１）式で示される誤差を最小化するβ_ｉを求める必要がある。

【数7】

なお、ｉ番目の隠れ層行列Ｈ_ｉ＝Ｇ（ｘ_ｉ・α＋ｂ）である。また、ｔは、推論結果ｙに対応する教師データである。

【0013】

最適化された重みβ_ｉは、下記（２）式により計算される。
Ｐ_ｉ＝Ｐ_ｉ－１－Ｐ_ｉ－１Ｈ_ｉ ^T（Ｉ＋Ｈ_ｉＰ_ｉ－１Ｈ_ｉ ^T）^－１Ｈ_ｉＰ_ｉ－１
β_ｉ＝β_ｉ－１＋Ｐ_ｉＨ_ｉ ^T（ｔ_ｉ－Ｈ_ｉβ_ｉ－１）（２）

【0014】

ここで、Ｐ_０とβ_０については、下記（３）式により得られる。
Ｐ_０＝（Ｈ_０ ^TＨ_０）^－１
β_０＝Ｐ_０Ｈ_０ ^Tｔ_０（３）

【0015】

学習のアルゴリズムは次のようになる。
（１）重みα、およびバイアスｂの値を乱数により初期化する。
（２）ｘ_０に対するＨ_０を算出し、Ｐ_０およびβ_０を算出する。
（３）バッチサイズｋ_ｉのｉ番目の学習データが得られるたびに、Ｐ_ｉおよびβ_ｉを逐次算出する。なお、（３）式におけるβ_０の算出式を用いずに、乱数により初期化した値をβ_０としてもよい。

【0016】

上記（２）式における計算量的ボトルネックは、（Ｉ＋Ｈ_ｉＰ_ｉ－１Ｈ_ｉ ^T）^－１であるが、（Ｉ＋Ｈ_ｉＰ_ｉ－１Ｈ_ｉ ^T）の行列サイズはｋ×ｋであるため、ｋ＝１の場合、逆行列演算を逆数演算に置き換えることができる。従って、バッチサイズをｋ＝１に固定することで、マイコン程度の演算装置であっても演算が容易となる。

【0017】

また、本実施形態では、オートエンコーダを用いた学習を行う。オートエンコーダは、入力データをそのまま教師データとして流用し、入力データを推論結果として再構成できるように学習する。すなわち、上記でいえば、ｔ＝ｘとして学習する。オートエンコーダは、別個に教師データを作成する必要がないので、教師なし学習アルゴリズムの一種となる。また、隠れ層のノード数を入力層と出力層のノード数よりも小さくすることで、入力データと推論結果との誤差が収束した場合に隠れ層行列を入力データの次元圧縮形式とみなすことができる。すなわち、入力データｘのエンコード結果はＨ＝Ｇ（ｘ・α＋ｂ）であり、Ｈのデコード結果はｙ＝Ｈ・βとして得られる。

【0018】

このようなアルゴリズムによれば、エッジデバイスにおいてマイコン程度の演算装置により学習が可能となる。すなわち、オンデバイス学習が可能となる。オートエンコーダでは学習したことがない特徴を有する入力データに対しては誤差が増加するため、異常検知モデルとして用いることができる。すなわち、まずオートエンコーダで正常データのみを入力データとして学習を行う。すると、正常データとは異なる特徴のデータ（異常データ）が入力されると、誤差が増加するため、誤差に対して閾値を設ければ異常を検知できる。

【0019】

３層ニューラルネットワーク５０では、推論結果ｙと教師データｔとの誤差を表す損失関数Ｌ（ｙ，ｔ）により異常度が計算される。損失関数には、例えばＭＡＥ（Mean Absolute Error）あるいはＭＳＥ（Mean Squared Error）が用いられる。損失関数がＭＡＥの場合、損失関数Ｌは、下記（４）式のように表される。

【数8】

また、損失関数がＭＳＥの場合、損失関数Ｌは、下記（５）式のように表される。

【数9】

【0020】

オートエンコーダを用いて学習を行うので、損失関数Ｌ（ｙ，ｔ）＝Ｌ（ｙ，ｘ）として異常度が計算される。学習完了後の推論時に異常度を算出して閾値と比較することで異常を検知できる。

【0021】

隠れ行列Ｈに含まれる１バッチ分のｍ次元の隠れ層ベクトルを

【数10】

とする。
図２は、学習または推論において算出される隠れ層ベクトルｈを第１主成分軸ｈ_ｐ１と第２主成分軸ｈ_ｐ２において示した模式図であり、ここでは種々の入力データごとの隠れ層ベクトルｈのデータＤＴを示す。なお、厳密には図２に示す平面は活性化関数のために紙面奥行／手前方向に非線形に歪んでいるが、それは無視して紙面を真上から視ている。

【0022】

上記のような損失関数による異常度が大きい場合は、データＤＴから第１主成分軸ｈ_ｐ１への垂線の長さが長くなる。例えば、図２に示すデータＤＴの一つであるデータＤＴＡのような場合に、データＤＴＡに対する垂線ＶＬが長くなる。データＤＴＡは異常な入力データに対して得られるため、上記異常度によって異常を検知できる。しかしながら、ｚ２に示すデータＤＴＢのように、第１主成分軸ｈ_ｐ１への垂線の第１主成分軸ｈ_ｐ１との交点と、正常な入力データに対して得られるデータＤＴの平均のデータＤＴＣとの間の距離Ｌが長いが、第１主成分軸ｈ_ｐ１への垂線は短い場合、上記異常度ではデータＤＴＢに対応する異常を検知できない。

【0023】

そこで、本開示では下記のような新規の指標である異常度を提供する。

【数11】

ただし、

【数12】

【数13】

【0024】

上記の異常度Ｔ_ＡＥ ^２は、主成分分析（ＰＣＡ）またはそれを利用した多変量統計プロセス管理（ＭＳＰＣ）などで用いられるＴ^２（Ｔスクエア）を隠れ層に適用した統計的指標である。異常度Ｔ_ＡＥ ^２の算出式において、ｈｈ^Ｔは共分散行列であり、ｍ－１は自由度である。なお、自由度で除算することは必須ではない。また、

【数14】

は、活性関数による非線形のため、中心化を行っている。

【0025】

上記の異常度Ｔ_ＡＥ ^２は、隠れ層ベクトルｈの下記隠れ層平均ベクトル（中間層平均ベクトル）

【数15】

に対する距離を正規化した正規化距離とも表現できる。

【0026】

このような異常度Ｔ_ＡＥ ^２を正常データに対して算出した値からの乖離が大きい場合を異常度Ｔ_ＡＥ ^２が大きいと表現するとする。損失関数による異常度が小さく、かつ異常度Ｔ_ＡＥ ^２が小さい場合は、データＤＴが平均データＤＴＣの近くに位置するありふれたデータであることを示す。損失関数による異常度が小さく、かつ異常度Ｔ_ＡＥ ^２が大きい場合は、データＤＴＢのように学習したデータ（正常データ）の傾向はあるが、かなりイレギュラーなデータであることを示す。従って、例えば、正常データの時系列データに対して少しのトゲのようなノイズが生じた場合、または正常データの時系列データが異常な倍率で振幅が増加されたような場合などに、損失関数による異常度では異常を検知しにくいが、異常度Ｔ_ＡＥ ^２では異常を検知できる場合がある。

【0027】

＜初期乱数行列の評価＞
上記のように、３層ニューラルネットワーク５０によるオンライン学習では、入力層と隠れ層とを結合する重みαの初期値を乱数行列によって決定する。しかしながら、初期値を乱数によって決めているため、適切な乱数があてがわれていない場合が生じる。そのような場合に、ＡＩのパラメータ設定（活性化関数、隠れ層のノード数、入力層のノード数、忘却率など）を検討し、学習データを吟味するなど、最適解のない検討を繰り返すこととなり、非効率である。

【0028】

そこで、本開示では、ＡＩのパラメータの初期値を乱数行列によって決定した段階で、その乱数行列の良し悪しを判断できる評価方法を上記の異常度Ｔ_ＡＥ ^２を利用することで提供する。

【0029】

図３は、上記評価方法に用いるコンピュータ１００の構成を示す図である。コンピュータ１００は、後述する異常度生成装置として機能する。コンピュータ１００は、例えばＰＣ（パソコン）である。コンピュータ１００がＰＣである場合、デスクトップ型であるかノート型であるかなどは問わない。

【0030】

コンピュータ１００は、ＣＰＵ（Central Processing Unit）１００Ａと、メモリ１００Ｂと、補助記憶装置１００Ｃと、操作入力部１００Ｄと、表示部１００Ｅと、を備える。

【0031】

ＣＰＵ１００Ａは、制御装置と演算装置（いずれも図示せず）を有する。制御装置は、プログラムの指令を解釈し、コンピュータ１００の各部を制御する。演算装置は、演算処理を行う装置である。

【0032】

メモリ１００Ｂは、プログラムあるいはデータを一時的に格納する半導体記憶装置である。メモリ１００Ｂに記憶された情報は、コンピュータ１００の電源がオフとされると消去される。

【0033】

補助記憶装置１００Ｃは、ＨＤＤ（Hard Disk Drive）あるいはＳＳＤ（Solid State Drive）などにより構成され、プログラムあるいはデータが格納される。補助記憶装置１００Ｃに格納されたプログラムは、メモリ１００Ｂに読み込まれる。ＣＰＵ１００Ａは、メモリ１００Ｂに読み込まれたプログラムを実行する。

【0034】

操作入力部１００Ｄは、キーボードあるいはマウスなどにより構成され、コンピュータ１００に操作入力を与える装置である。操作入力部１００Ｄから入力された情報は、メモリ１００Ｂに送られる。

【0035】

表示部１００Ｅは、例えば液晶ディスプレイなどにより構成され、メモリ１００Ｂから取得された情報を画像に変換して出力する。

【0036】

図４は、コンピュータ１００によって実現される異常度生成装置１の構成を示す図である。

【0037】

異常度生成装置１は、データ記憶部２と、乱数行列生成部３と、異常度算出部４と、初期値決定部５と、を備える。コンピュータ１００の補助記憶装置１００Ｃに格納されたプログラムＰ（図３）は、コンピュータ１００を異常度生成装置１として機能させるためのプログラムである。

【0038】

データ記憶部２は、正常データ２１および異常データ２２を記憶し、補助記憶装置１００Ｃ（図３）により構成される。乱数行列生成部３は、ＡＩパラメータである上記重みαの初期値としての乱数行列を生成する。なお、乱数行列生成部３は、重みαに加えてバイアスｂの初期値としての乱数行列を生成してもよい。

【0039】

異常度算出部４は、乱数行列生成部３によって生成された乱数行列、および正常データ２１または異常データ２２に基づいて異常度Ｔ_ＡＥ ^２を算出する。具体的には、乱数行列生成部３によって生成された乱数行列としての重みαと、正常データ２１または異常データ２２による入力データｘに基づいて隠れ層ベクトルｈを算出する。そして、算出された隠れ層ベクトルｈと、上記の算出式に基づいて異常度Ｔ_ＡＥ ^２を算出する。異常度Ｔ_ＡＥ ^２の算出には逆行列の演算が必要であるが、ソフトウェアによって演算するため、演算が容易となる。

【0040】

初期値決定部５は、異常度算出部４によって算出された異常度Ｔ_ＡＥ ^２に基づいて乱数行列の良し悪しを判断し、乱数行列（初期値）を決定する。ここで、図５は、初期値決定部５による初期値決定処理に関するフローチャートである。ステップＳ１で、乱数行列生成部３によって乱数行列が生成される。ステップＳ２に進み、異常度算出部４によって異常度Ｔ_ＡＥ ^２が算出される。異常度Ｔ_ＡＥ ^２は、正常データ２１と異常データ２２のそれぞれに対して算出される。

【0041】

ステップＳ３に進み、初期値決定部５は、乱数発生が所定回数に達したかを判定する。もし達していない場合は（ステップＳ３のＮ）、ステップＳ１に戻り、再度、乱数行列が生成される。ステップＳ３で、所定回数に達している場合は（ステップＳ３のＹ）、ステップＳ４に進み、所定回数分生成された異常度Ｔ_ＡＥ ^２のうち、最も適切な異常度Ｔ_ＡＥ ^２となる乱数行列を初期値として決定する。具体的には、正常データ２１に対して算出された異常度Ｔ_ＡＥ ^２と異常データ２２に対して算出された異常度Ｔ_ＡＥ ^２の乖離量が最も大きければ、乱数行列は最も適切であると判断する。例えば、正常データ２１に対して算出された異常度Ｔ_ＡＥ ^２と異常データ２２に対して算出された異常度Ｔ_ＡＥ ^２のそれぞれの平均値の乖離量が大きければ、乱数行列は適切であると判断する。ステップＳ４の後、処理終了となる。

【0042】

このように異常度生成装置１によれば、異常度Ｔ_ＡＥ ^２に基づいて適切な初期値を自動的に決定できる。なお、このような実施形態に限らず、初期値決定部５は設けず、異常度算出部４によって算出された異常度Ｔ_ＡＥ ^２をグラフ表示などにより表示部１００Ｅ（図３）に表示させ、ユーザが確認することで乱数行列が適切でないと判断した場合は、ユーザが操作入力部１００Ｄによる指令によって乱数行列生成部３に乱数を新たに生成させてもよい。このようにすれば、ユーザが異常度Ｔ_ＡＥ ^２を確認しながら適切な初期値を決定できる。また、ユーザは、操作入力部１００Ｄによる指令によって活性化関数の設定を変更して異常度Ｔ_ＡＥ ^２を異常度算出部４に算出させてもよい。これにより、適切な活性化関数の設定が可能となる。

【0043】

＜データ例＞
図６は、上方に正常データと異常データの時系列データの一例を示す図である。前半が正常データであり、後半が異常データである。図６の下方には、正常データの拡大図（左方）と異常データの拡大図（右方）を示す。正常データは、Ｓｉｎ波に近い信号波形において周期ごとに振幅が変化する。異常データは、正常データと同様の信号波形において、振幅に対して同じ比率でノイズＮが生じるデータである。

【0044】

図７は、上段に図６と同様の正常データと異常データを示す。中段には或る乱数行列（初期値）での算出される損失関数による異常度を示し、下段には同じ乱数行列での算出される異常度Ｔ_ＡＥ ^２を示す。正常データの途中まで学習を行い、そこから推論を行っている。

【0045】

図７の場合は、損失関数による異常度と異常度Ｔ_ＡＥ ^２ともに、異常データに対して反応している。ただし、損失関数による異常度は、データの特徴／異常モードをとらえているのではなく、最終的な出力層での推論結果と入力データの乖離をみている。すなわち、振幅が小さいと相対的に異常の特徴による乖離も小さくなり、異常度が小さくなる。逆に振幅が大きいと同じ程度の特徴であっても異常度が大きくなる。これに対し、異常度Ｔ_ＡＥ ^２は、特徴／異常モードに対しての値を出すので、特徴が検知されれば、一気に値が跳ね上がっている。

【0046】

図８は、上段に図７と同様の時系列データを示し、中段及び後段にはそれぞれ図７とは別の乱数行列によって算出された損失関数による異常度と異常度Ｔ_ＡＥ ^２を示す。図８では、損失関数による異常度が正常データに対して大きな値となっており、学習が適切に行われていない。また、異常度Ｔ_ＡＥ ^２は正常データと異常データとにわたってフラットであり、乱数行列が適切でないことがわかる。

【0047】

＜機械学習装置＞
図９は、本開示の例示的な実施形態に係る機械学習装置６の構成を示す図である。機械学習装置６は、ＭＣＵ（マイコン）により構成される。先述したように異常度Ｔ_ＡＥ ^２の算出には逆行列の演算が必要なため、ソフトウェアによってコンピュータ１００（異常度生成装置１）によって適切な乱数行列（初期値）を決定し、決定された乱数行列がＭＣＵによる機械学習装置６に設定される。

【0048】

機械学習装置６は、例えば機械システム（モータ装置など）の異常をリアルタイムに検知可能である。機械学習装置６は、データ記憶部７と、モデル保持部８と、演算部９と、異常検出部１０と、を備える。なお、機械学習装置６は、異常度生成装置と捉えることもできる。

【0049】

データ記憶部７は、入力データ７１および初期値データ７２を記憶している。入力データ７１については、例えば機械システムなどから出力される時系列データが入力データ７１として機械学習装置６に入力される。上記時系列データには、必要に応じて正規化処理またはＦＦＴなどの前処理を行ってもよい。初期値データ７２には、先述したようにコンピュータ１００（異常度生成装置１）において決定された初期値が設定される。

【0050】

モデル保持部８は、機械学習モデル８０を保持する。機械学習モデル８０は、３層ニューラルネットワーク５０（図１）として構成される。

【0051】

演算部９は、学習演算部９１と、推論演算部９２と、異常度算出部９３と、を有する。学習演算部９１は、機械学習モデル８０と、入力データ７１および初期値データ７２を用いて学習（教師なし学習）を行う。推論演算部９２は、機械学習モデル８０と、入力データ７１および初期値データ７２を用いて推論を行う。推論は、学習時と学習完了後に行うことができる。

【0052】

異常度算出部９３は、入力データ７１と推論結果に基づいて損失関数による異常度ＡＳ１を算出する。異常検出部１０は、異常度ＡＳ１を閾値と比較することで異常の有無を判断する。適切な初期値データ７２が設定されるため、異常度ＡＳ１を適切な値に算出することができる。

【0053】

図１０は、図９に示す構成の変形例に係る機械学習装置６０の構成を示す図である。図１０に示す構成では、演算部９において、異常度算出部９４が追加されている。異常度算出部９４は、機械学習モデル８０と、入力データ７１および初期値データ７２を用いて異常度Ｔ_ＡＥ ^２である異常度ＡＳ２を算出する。異常検出部１０は、異常度ＡＳ２を閾値と比較することで異常を検知できる。これにより、異常度ＡＳ１では検知しにくい特徴／異常モードを検知できる。なお、異常度ＡＳ２（Ｔ_ＡＥ ^２）は、正負の値をとりうる指標であり、異常モードが異なると、異なる値をとる場合がある。そこで、異常検出部１０で設定される閾値を異なる異常モードごとに異なる値に設定してもよい。

【0054】

図１１は、図１０に示す構成の変形例に係る機械学習装置６００の構成を示す図である。図１１に示す機械学習装置６００は、図１０に示す構成に加えて、先述した図４に示す異常度生成装置１の構成を組み込んでいる。すなわち、異常度生成装置１による初期値決定の機能をＭＣＵに内蔵させている。具体的には、機械学習装置６００は、初期値決定部５と、乱数行列生成部３を備える。

【0055】

データ記憶部７には、正常データ７３と異常データ７４が記憶されている。これにより、異常度算出部９４は、乱数行列生成部３で生成された乱数行列と、機械学習モデル８０と、正常データ７３および異常データ７４に基づいて異常度ＡＳ２を算出する。初期値決定部５は、算出された異常度ＡＳ２に基づいて乱数行列の良し悪しを判断する。初期値決定部５によって決定された初期値は、初期値データ７２として設定される。

【0056】

このような構成により、１つのＭＣＵによって初期値の決定と、学習／推論と、異常度ＡＳ１，ＡＳ２の算出による異常検知が可能となる。

【0057】

＜ＡＩモデルの変形例＞
図１２は、変形例に係るＡＩモデルの構成を示す図である。図１２に示すＡＩモデルは、４層ニューラルネットワーク５００である。４層ニューラルネットワーク５００は、先述した３層ニューラルネットワーク５０の構成に加えて、隠れ層５０Ｄを有する。すなわち、隠れ層として５０Ｂと５０Ｄの複数の隠れ層を有する。

【0058】

隠れ層５０Ｂにおいてはバイアスｂ１と活性化関数Ｇ１が定義され、隠れ層５０Ｄにおいてはバイアスｂ２と活性化関数Ｇ２が定義される。また、隠れ層５０Ｂと５０Ｄの間を結合する重みγが定義される。

【0059】

これにより、隠れ層５０Ｂにおける隠れ層ベクトルはＨ１＝Ｇ１（ｘ・α＋ｂ１）に含まれ、隠れ層５０Ｄにおける隠れ層ベクトルはＨ２＝Ｇ２（Ｈ１・γ＋ｂ２）に含まれる。すなわち、複数の隠れ層５０Ｂ，５０Ｄのそれぞれについて隠れ層ベクトルが算出される。これにより、それぞれの隠れ層ベクトルに基づいてそれぞれの異常度Ｔ_ＡＥ ^２が算出可能である。隠れ層５０Ｂ，５０Ｄのそれぞれの異常度Ｔ_ＡＥ ^２によって、異なる異常モードを検知できる場合がある。

【0060】

＜その他＞
なお、本明細書中に開示されている種々の技術的特徴は、上記実施形態のほか、その技術的創作の主旨を逸脱しない範囲で種々の変更を加えることが可能である。すなわち、上記実施形態は、全ての点で例示であって制限的なものではないと考えられるべきであり、本発明の技術的範囲は、上記実施形態に限定されるものではなく、特許請求の範囲と均等の意味および範囲内に属する全ての変更が含まれると理解されるべきである。

【0061】

例えば、本開示に係る異常検知技術は、機械システムの状態保全などに限らず、製品の品質解析などに適用してもよい。

【0062】

＜付記＞
以上のように、本開示の一態様に係る異常度生成装置（１）は、
入力層（５０Ａ）と出力層（５０Ｃ）との間に配置される少なくとも１つの中間層（５０Ｂ）を含む機械学習モデル（５０）における前記中間層の中間層ベクトルを

【数16】

とし、
中間層平均ベクトルを

【数17】

【数18】

として、
前記中間層平均ベクトルに対する前記中間層ベクトルの正規化距離を表す第１異常度を算出するように構成される第１異常度算出部（４）を備える構成としている（第１の構成、図４）。

【0063】

また、上記第１の構成において、前記正規化距離は、

【数19】

で表される共分散行列を用いて正規化された距離である構成としてもよい（第２の構成）。

【0064】

また、上記第２の構成において、前記第１異常度算出部は、下記式で表される前記第１異常度を算出する構成としてもよい（第３の構成）。

【数20】

【0065】

また、上記第１から第３のいずれかの構成において、前記中間層ベクトルを算出するためのパラメータに関する乱数行列を生成するように構成される乱数行列生成部（３）と、
生成された前記乱数行列と、正常データ（２１）および異常データ（２２）に基づいて前記第１異常度算出部によって算出される前記第１異常度に基づき前記乱数行列を評価し、前記乱数行列を初期値として決定するように構成される初期値決定部（５）と、を備える構成としてもよい（第４の構成）。

【0066】

また、上記第４の構成において、前記初期値決定部は、前記乱数行列生成部による所定回数の前記乱数行列の生成によって生成された前記乱数行列のうち、最も適切と評価した前記乱数行列を前記初期値として決定する構成としてもよい（第５の構成）。

【0067】

また、上記第１から第５のいずれかの構成において、前記第１異常度算出部は、複数の前記中間層（５０Ｂ，５０Ｄ）のそれぞれについて前記第１異常度を算出する構成としてもよい（第６の構成、図１２）。

【0068】

また、上記第１から第６のいずれかの構成の異常度生成装置は、コンピュータ（１００）におけるソフトウェア処理によって実現されることとしてもよい（第７の構成）。

【0069】

また、本開示の一態様に係るプログラム（Ｐ）は、前記コンピュータを上記第７の構成の異常度生成装置として機能させるためのプログラムである（第８の構成）。

【0070】

また、上記第１から第７のいずれかの構成とした異常度生成装置（６０）は、前記機械学習モデル（８０）を保持するように構成されるモデル保持部（８）と、
入力データ（７１）を記憶するように構成されるデータ記憶部（７）と、
前記機械学習モデルと前記入力データに基づいて教師なし学習を実行するように構成される学習演算部（９１）と、
前記機械学習モデルと前記入力データに基づいて推論を実行するように構成される推論演算部（９２）と、
前記推論演算部による推論結果と前記入力データに基づいて損失関数による第２異常度（ＡＳ１）を算出するように構成される第２異常度算出部（９３）と、
前記第１異常度と第１閾値との比較、および前記第２異常度と第２閾値との比較に基づいて異常を検知するように構成される異常検出部（１０）と、を備える構成としている（第９の構成、図１０）。

【0071】

また、本開示の一態様は、コンピュータを用いて実行される異常度生成方法であって、
入力層と出力層との間に配置される少なくとも１つの中間層を含む機械学習モデルにおける前記中間層の中間層ベクトルを

【数21】

として算出する第１ステップと、
中間層平均ベクトルを

【数22】

【数23】

として算出する第２ステップと、
前記中間層平均ベクトルに対する前記中間層ベクトルの正規化距離を表す異常度を算出する第３ステップと、を備える（第１０の構成）。

【産業上の利用可能性】

【0072】

本開示は、例えば、各種用途の異常検知に利用することができる。

【符号の説明】

【0073】

１異常度生成装置
２データ記憶部
３乱数行列生成部
４異常度算出部
５初期値決定部
６機械学習装置
７データ記憶部
８モデル保持部
９演算部
１０異常検出部
２１正常データ
２２異常データ
５０３層ニューラルネットワーク
５０Ａ入力層
５０Ｂ隠れ層
５０Ｃ出力層
５０Ｄ隠れ層
６０機械学習装置
７１入力データ
７２初期値データ
７３正常データ
７４異常データ
８０機械学習モデル
９１学習演算部
９２推論演算部
９３異常度算出部
９４異常度算出部
１００コンピュータ
１００ＡＣＰＵ
１００Ｂメモリ
１００Ｃ補助記憶装置
１００Ｄ操作入力部
１００Ｅ表示部
５００４層ニューラルネットワーク
６００機械学習装置
Ｐプログラム

【図1】