IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝デジタルエンジニアリング株式会社の特許一覧

特許7012928状態変動検出装置及び状態変動検出用プログラム
<>
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図1
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図2
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図3
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図4
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図5
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図6
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図7
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図8
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図9
  • 特許-状態変動検出装置及び状態変動検出用プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-21
(45)【発行日】2022-01-31
(54)【発明の名称】状態変動検出装置及び状態変動検出用プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20220124BHJP
【FI】
G06N20/00 130
【請求項の数】 12
(21)【出願番号】P 2019080556
(22)【出願日】2019-04-19
(65)【公開番号】P2020177542
(43)【公開日】2020-10-29
【審査請求日】2020-01-08
(73)【特許権者】
【識別番号】521514059
【氏名又は名称】東芝デジタルエンジニアリング株式会社
(74)【代理人】
【識別番号】100090169
【弁理士】
【氏名又は名称】松浦 孝
(74)【代理人】
【識別番号】100074147
【弁理士】
【氏名又は名称】本田 崇
(74)【代理人】
【識別番号】100124497
【弁理士】
【氏名又は名称】小倉 洋樹
(72)【発明者】
【氏名】鈴木 俊和
(72)【発明者】
【氏名】牧野 真一
【審査官】今城 朋彬
(56)【参考文献】
【文献】特開2018-116545(JP,A)
【文献】米国特許出願公開第2018/0203439(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-20/00
(57)【特許請求の範囲】
【請求項1】
教師データに基づき説明変数から目的変数を予測する予測モデルを作成する予測モデル作成手段と、
予め設定された閾値より低い重要度の説明変数である所定範囲重要度説明変数を前記予測モデルにおいて求める所定範囲重要度説明変数検索手段と、
前記所定範囲重要度説明変数を用いて教師データの幾何学的距離を求める教師データ幾何学的距離算出手段と、
前記教師データの幾何学的距離の算出に用いた各説明変数の平均値と分散共分散行列の逆行列を用いて解析対象データの幾何学的距離を求める解析対象データ幾何学的距離算出手段と、
前記教師データの幾何学的距離の分布と前記解析対象データの幾何学的距離の分布に基づき、前記解析データの状態変動を検出する状態変動検出手段と
を具備することを特徴とする状態変動検出装置。
【請求項2】
前記状態変動検出手段は、前記教師データの幾何学的距離の分布範囲を求め、この分布範囲を超えた前記解析対象データの幾何学的距離の分布の割合に基づき前記解析データの状態変動を検出することを特徴とする請求項1に記載の状態変動検出装置。
【請求項3】
前記状態変動検出手段は、前記教師データの幾何学的距離の分布範囲を求め、この分布範囲から前記解析対象データの幾何学的距離の分布が離れている程度に基づき前記解析データの状態変動を検出することを特徴とする請求項1または2に記載の状態変動検出装置。
【請求項4】
前記予測モデル作成手段が作成する予測モデルは、分類器により分岐を行って機械学習による予測を行うものであることを特徴とする請求項1乃至3のいずれか1項に記載の状態変動検出装置。
【請求項5】
前記予測モデル作成手段が作成する予測モデルは、ランダムフォレストにより予測を行うものであることを特徴とする請求項1乃至4のいずれか1項に記載の状態変動検出装置。
【請求項6】
前記教師データ幾何学的距離算出手段は、教師データの幾何学的距離として教師データのマハラノビス距離を求め、
前記解析対象データ幾何学的距離算出手段は、解析対象データの幾何学的距離として解析対象データのマハラノビス距離を求めることを特徴とする請求項1乃至5のいずれか1項に記載の状態変動検出装置。
【請求項7】
コンピュータを、
教師データに基づき説明変数から目的変数を予測する予測モデルを作成する予測モデル作成手段、
予め設定された閾値より低い重要度の説明変数である所定範囲重要度説明変数を前記予測モデルにおいて求める所定範囲重要度説明変数検索手段、
前記所定範囲重要度説明変数を用いて教師データの幾何学的距離を求める教師データ幾何学的距離算出手段、
前記教師データの幾何学的距離の算出に用いた各説明変数の平均値と分散共分散行列の逆行列を用いて解析対象データの幾何学的距離を求める解析対象データ幾何学的距離算出手段、
前記教師データの幾何学的距離の分布と前記解析対象データの幾何学的距離の分布に基づき、前記解析データの状態変動を検出する状態変動検出手段
として機能させることを特徴とする状態変動検出用プログラム。
【請求項8】
前記コンピュータを前記状態変動検出手段として、前記教師データの幾何学的距離の分布範囲を求め、この分布範囲を超えた前記解析対象データの幾何学的距離の分布の割合に基づき前記解析データの状態変動を検出するように機能させることを特徴とする請求項7に記載の状態変動検出用プログラム。
【請求項9】
前記コンピュータは前記状態変動検出手段として、前記教師データの幾何学的距離の分布範囲を求め、この分布範囲から前記解析対象データの幾何学的距離の分布が離れている程度に基づき前記解析データの状態変動を検出することを特徴とする請求項7または8に記載の状態変動検出用プログラム。
【請求項10】
前記コンピュータが前記予測モデル作成手段として作成する予測モデルは、分類器により分岐を行って機械学習による予測を行うものであることを特徴とする請求項7乃至9のいずれか1項に記載の状態変動検出用プログラム。
【請求項11】
前記コンピュータが前記予測モデル作成手段として作成する予測モデルは、ランダムフォレストにより予測を行うものであることを特徴とする請求項7乃至10のいずれか1項に記載の状態変動検出用プログラム。
【請求項12】
前記コンピュータを前記教師データ幾何学的距離算出手段として、教師データの幾何学的距離として教師データのマハラノビス距離を求めるように機能させ、
前記コンピュータを前記解析対象データ幾何学的距離算出手段として、解析対象データの幾何学的距離として解析対象データのマハラノビス距離を求めるように機能させることを特徴とする請求項7乃至11のいずれか1項に記載の状態変動検出用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、状態変動検出装置及び状態変動検出用プログラムに関するものである。
【背景技術】
【0002】
例えば、機械の電流と電圧と振動とを測定して、異常等の状態変動を検出する場合に、一般的には、人による過去の経験等に基づき異常の判定を行う。即ち、状態変動の閾値は人が設定するものであり、異常データを持っていない機械が状態変動を行うことはほぼ不可能であった。
【0003】
特許文献1には、電波の異常伝搬が発生した場合の当該電波の到来状況を予測するシステムが開示されている。このシステムは、気象情報を取り込む気象情報取込手段と、この気象情報取込手段で取り込んだ気象情報から、高度毎の気温に関する情報、高度毎の気圧に関する情報、高度毎の湿度に関する情報の少なくとも1つを、気象データとして抽出する気象データ抽出手段を備える。更に、上記気象データ抽出手段で上記気象データが抽出された日にちの電波到来に関し、予め蓄積された測定データに基づき算出された上記電波の異常伝搬を予測するための予測関数を蓄積しており、蓄積されている予測関数に、上記気象データ抽出手段で抽出した気象データを入力して、上記電波の異常伝搬が発生する発生確率である予測値を決定するものである。
【0004】
特許文献2には、生産物を生産可能な機械設備から、上記生産物の所定の生産単位ごとに上記機械設備の有するセンサの時系列データを取得する取得工程、前記時系列データを複数の分割データに分割した分割データ群を生成する分割工程、上記分割データ群に含まれる所定の正常品質分に対し、故障がないことを示す付加情報である第1付加情報を対応付けると共に、上記分割データ群に含まれる直近生産分に対し、故障があることを示す第2付加情報を無条件に対応付ける設定工程を備える品質異常検知方法が開示されている。
【0005】
この品質異常検知方法は、更に、上記正常品質分及び上記直近生産分を混在させた2グループを形成するグループ化工程、上記2グループのうちの一方を用いた学習により、入力データに対応する上記付加情報を予測する予測モデルを生成する生成工程、上記2グループのうちの他方を上記入力データとすることによって得られる上記予測モデルの予測結果において、上記付加情報が上記第2付加情報であると予測される確率を算出する算出工程を有しており、上記確率に基づいて上記生産物の品質異常を判定すると言うものである。
【0006】
また、特許文献3には過去の実績に基づいて将来を予測するデータ予測方法が開示されている。このデータ予測方法では、予測モデルは、予測対象日における少なくとも一つの特徴量について予測値を出力する第1の予測モデルと、この第1の予測モデルから出力される予測値を入力因子に含み、予測対象日の所定時間ごとの予測値を出力する第2の予測モデルと、から構成されるものである。
【0007】
そして、特許文献3のデータ予測方法では、収集された至近実績データ及び過去実績データを用いて予測モデルを構築する予測モデル構築手段と、構築された予測モデルに予測用入力データを入力して予測を実行し、予測値を得る予測実行手段と、収集された至近実績データと予測値とから予測誤差またはモデル誤差を計算する予測誤差計算手段と、予測誤差またはモデル誤差に基づいて前記予測値を補正する補正係数又は補正量を算出し、軸方向補正予測値を得るものである。
【0008】
一方、ランダムフォレストでは、図1(A)に示されるような領域の境界線によって、正常な場合を「1」により示し、異常な場合を「2」で示すようにした状態変動検出装置が知られている。即ち、この状態変動検出装置では縦軸方向の値が160以上で横軸方向の値が45より小さい領域は全て正常の「1」であり、縦軸の値が160より小さい領域では、横軸方向の値が30より小さければ正常の「1」であり、横軸方向の値が30以上であれば異常の「2」となる。また、縦軸方向の値が160以上で横軸方向の値が45より大きい領域は、縦軸方向の値が260より小さければ異常の「2」であり、縦軸方向の値が260以上であれば正常の「1」となる。図1(A)において、白無地の領域が正常の「1」であり、梨地模様の領域が異常の「2」である。
【0009】
以上のような領域を分けて異常と正常の判定を行う場合には、分類器により(例えばツリー構造で)分岐を行って予測を行う機械学習による状態変動検出装置を実現できる。このような状態変動検出装置において、例えば、図1(B)に示すような解析対象データDが生じた場合には、図1(A)の領域に関する状態変動検出装置によると、縦軸方向の値が160以上で横軸方向の値が45より小さい領域に該当し、図示のように正常の「1」に分類されてしまう。しかしながら、縦軸方向の値が概ね10000であるから、通常の縦軸の値400などから矢印で示すように大きく離れており、明らかに異常の「2」に分類しなければならない解析対象データであり、誤分類が生じている。
【0010】
また、図2に示すような決定木構成の分類器によるランダムフォレストの状態変動検出装置においては、円によって示すところで分岐を行う。この図2では、分岐のところで用いる説明変数をA、B、C、D、Eとして示している。例えば、説明変数Aは年齢であり、説明変数Bは体重であり、説明変数Cは身長であり、説明変数Dは「性」、・・・という如くに設定されている。このような状態変動検出装置においては、重要度の低い説明変数は結果に影響を与えない。具体的には、健康と不健康が結果となる装置とすれば、説明変数Dの「性」は結果に影響を与えにくいと言える。すべての説明変数A、B、C、D、Eにおいて、結果に影響を与えない説明変数を重要度が低い説明変数とし、その説明変数の値が大きく変動しても、結果が変わらないということである。この場合、各説明変数A、B、C、D、E毎に値をランダムに入れ替えてどれだけの誤差が生じるかを算出し、重要度を決定している。
【0011】
図1に示した例によっては、適切な分類ができない場合が生じることがあることが判り、また、図2に示した例によっても、重量度が低い説明変数は結果に対する影響が低いために、誤差が生じる確率が低いものの、判定装置全体では精度が低下させられていることがある。
【0012】
特許文献4では、信号を取得する空間として二次元平面を考え、機械学習と識別に利用するデータは、平面内の分布情報とスペクトル情報との合計で三次元の構造をした多次元的情報と呼ばれるもので、この多次元的情報を用いた場合の、機械学習と識別の手順は、スペクトルデータを用いた場合と本質的には同様としている。更に、この場合には、データのパターンを記述するのに適切な特徴量を複数取得した上で、それを特徴ベクトルとし、機械学習及び識別処理に用いることもできること、特徴量の代表的例としては、体積や曲率、空間勾配、HLAC(高次局所自己相関)等があることが述べられている。
【0013】
そして、機械学習に用いる特徴量を事前に選別することも可能であり、この場合、例えば、マハラノビス距離を算出して、識別に用いる特徴量を選別すれば良いことが述べられている。マハラノビス距離が大きければ、識別がより容易になるため、注目する各群間のマハラノビス距離が大きくなる様な特徴量を優先的に選別することもできるとしている。
【0014】
つまり、上記特許文献4に記載されているのは、機械学習及び識別処理をより容易にする特徴量の選定を行う場合にマハラノビス距離が大きくなる様な特徴量を選択することを述べている。
【0015】
更に、特許文献5の第0117欄には、「上記所定のアルゴリズムとして決定木を利用した場合には、ランダムフォレスト法等により、各特徴量(説明変数)の関連度(重要度又は寄与度とも称しても良い)を算出することができる。具体的には、決定木を作成する際には、ジニ係数、交差エントロピー等で示される不純度が小さくなるように、各特徴量(説明変数)からノード(分岐)の選択が行われる。そのため、各特徴量(説明変数)をノードに選択した際の不純度の減少量をその特徴量(説明変数)の重要度として利用することができる。上記ステップS102では、この重要度を利用して、複数種類の特徴量の中から異常発生の予測に有効な特徴量を選択するようにしてもよい。」と記載がなされており、基本的には図2を用いて説明したような重要度による選択が示されている。
【先行技術文献】
【特許文献】
【0016】
【文献】特開2005-315753号公報
【文献】特開2018-147406号公報
【文献】特開2004-94437号公報
【文献】特開2015-52581号公報
【文献】特開2018-116545号公報
【発明の概要】
【発明が解決しようとする課題】
【0017】
本発明は、教師データに基づき作成した予測モデルを用いた状態変動検出において行った予測に対して行う検証や補正或いは結果の変更などに使用可能であり、上記予測モデルにおいて誤分類が生じる度合いを減少させることも可能であり、また、精度が低下をカバーすることが可能な状態変動検出装置及び状態変動検出用プログラムを提供する。
【課題を解決するための手段】
【0018】
本実施形態に係る状態変動検出装置は、教師データに基づき説明変数から目的変数を予測する予測モデルを作成する予測モデル作成手段と、予め設定された閾値より低い重要度の説明変数である所定範囲重要度説明変数を前記予測モデルにおいて求める所定範囲重要度説明変数検索手段と、前記所定範囲重要度説明変数を用いて教師データの幾何学的距離を求める教師データ幾何学的距離算出手段と、前記教師データの幾何学的距離の算出に用いた各説明変数の平均値と分散共分散行列の逆行列を用いて解析対象データの幾何学的距離を求める解析対象データ幾何学的距離算出手段と、前記教師データの幾何学的距離の分布と前記解析対象データの幾何学的距離の分布に基づき、前記解析データの状態変動を検出する状態変動検出手段とを具備することを特徴とする。


【図面の簡単な説明】
【0019】
図1】ランダムフォレストにより状態変動検出を行う場合の手法を示すための説明図。
図2】ランダムフォレストにより状態変動検出を行う場合に用いられる決定木の一例を示す図。
図3】本発明の実施形態に係る状態変動検出装置を実現するコンピュータシステムの構成図。
図4】本発明の実施形態に係る状態変動検出装置の機能ブロック図。
図5】本発明の実施形態に係る状態変動検出装置に用いられる教師データの一例を示す図。
図6図5に示した教師データのマハラノビス距離と、これをヒストグラムにより示した図。
図7】測定対象データのマハラノビス距離と、これをヒストグラムにより示した図。
図8】本発明の実施形態に係る状態変動検出装置の動作を示すフローチャート。
図9】本発明の実施形態に係る状態変動検出装置の動作によって求められた説明変数の重要度と、重要度の割合及びその累計値の一例を示す図。
図10】教師データのマハラノビス距離の分布図と解析対象データのマハラノビス距離の分布図ACとに対し、横軸を一致させて縦方向に並べた図であって、本発明の実施形態に係る状態変動検出装置による状態変動検出の手法を説明するための説明図。
【発明を実施するための形態】
【0020】
以下添付図面を参照して、本発明に係る状態変動検出装置及び状態変動検出用プログラムの実施形態を説明する。各図において、同一の構成要素には同一の符号を付して重複する説明を省略する。本発明の実施形態に係る状態変動検出装置は、例えば図3に示されるようなパーソナルコンピュータやワークステーション、その他のコンピュータシステムにより構成することができる。このコンピュータシステムは、CPU10が主メモリ11に記憶されている或いは主メモリ11に読み込んだプログラムやデータに基づき各部を制御し、必要な処理を実行することにより状態変動検出装置として動作を行うものである。
【0021】
CPU10には、バス12を介して外部記憶インタフェース13、入力インタフェース14、表示インタフェース15、データ入力インタフェース16が接続されている。外部記憶インタフェース13には、状態変動検出用プログラム等のプログラムと必要なデータ等が記憶されている外部記憶装置23が接続されている。入力インタフェース14には、コマンドやデータを入力するための入力装置としてのキーボードなどの入力装置24とポインティングデバイスとしてのマウス22が接続されている。
【0022】
表示インタフェース15には、LEDやLCDなどの表示画面を有する表示装置25が接続されている。データ入力インタフェース16には、測定データを得るためのセンサ26-1、26-2、・・・、26-mが接続されている。このコンピュータシステムには、他の構成が備えられていても良く、また、図3の構成は一例に過ぎない。
【0023】
上記において、CPU10には、外部記憶装置23内の状態変動検出用プログラムによって図4に記載の各手段等が実現される。即ち、予測モデル作成手段31、所定範囲重要度説明変数検索手段32、教師データ幾何学的距離算出手段33、解析対象データ幾何学的距離算出手段34、状態変動検出手段35が実現される。また、外部記憶装置23内には、教師データTが記憶されている。予測モデル作成手段31は、教師データを用いて予測モデル30を作成するものである。
【0024】
予測モデル30は、機械学習により説明変数から目的変数を予測するものである。ここに、機械学習のアルゴリズムとしては、パターンマイ二ングのランダムフォレストを挙げることができるが、これ以外に、分類木や回帰木などのように分類器により(例えばツリー構造で)分岐を行って予測を行う機械学習によるアリゴリズムを採用することができる。
【0025】
所定範囲重要度説明変数検索手段32は、上記予測モデル30において予め設定された閾値より低い重要度の説明変数である所定範囲重要度説明変数を求めるものである。所定範囲重要度説明変数検索手段32は、教師データの説明変数の取得元毎に重要度を求め、所定閾値よりも低い値の重要度を有している取得元の説明変数を所定範囲重要度説明変数として求める。ここで、取得元とは、説明変数を幾つかのセンサを用いて取得・収集している場合に、その各センサを取得元と言う。また、説明変数を幾つかの装置を用いて取得・収集している場合に、その各装置を取得元と言う。つまり、目的変数や説明変数を取得する元となるところと言う意味で、取得元を用いる。
【0026】
例えば、教師データは、図5により示すように、センサAにより得られるべき目的変数のデータと、センサBにより得られる1つ目の説明変数のデータと、センサCにより得られる2つ目の説明変数のデータと、センサDにより得られる3つ目の説明変数のデータと、センサEにより得られる4つ目の説明変数のデータと、センサFにより得られる5つ目の説明変数のデータとにより構成される。データの取得回数(図5の縦方向のデータ数)は任意である。本実施形態では、所定閾値よりも低い値の重要度を有している説明変数の取得元は、センサEとセンサFであるものとし、所定範囲重要度説明変数は図5のセンサEとセンサFの欄に記載されている値となる。
【0027】
教師データ幾何学的距離算出手段33は、上記で求めた所定範囲重要度説明変数を用いて教師データの幾何学的距離を求めるものである。教師データの幾何学的距離としては、マハラノビス距離を用いることができる。
【0028】
解析対象データ幾何学的距離算出手段34は、前記教師データの幾何学的距離の算出に用いた各説明変数の平均値と分散共分散行列の逆行列を用いて解析対象データの幾何学的距離を求めるものである。解析対象データの幾何学的距離としては、マハラノビス距離を用いることができる。
【0029】
上記のように解析対象データの幾何学的距離を求める場合に、上記教師データの幾何学的距離の算出に用いた各説明変数の平均値と分散共分散行列の逆行列を用いている結果、教師データのデータ平均から解析対象データまでの幾何学的距離が求まることになる。
【0030】
状態変動検出手段35は、上記教師データ幾何学的距離の分布と上記解析対象データ幾何学的距離の分布に基づき、上記解析データの状態変動を検出するものである。具体的には、図6(A)に示すように教師データのマハラノビス距離(MD)が求まり、これをヒストグラムにした場合に図6(B)のようになったものとする。また、図7(A)に示すように解析対象データのマハラノビス距離(MD)が求まり、これをヒストグラムにした場合に図7(B)のようになったものとする。なお、解析データは、図5に示した教師データの説明変数の取得元であるセンサB~Fによって状態変動検出する対象として収集されたデータであり、図示しないが図5に示したような値(勿論、実測値であるから通常は図5のものと同一ではない)を持つものである。
【0031】
教師データのマハラノビス距離(MD)の分布では、最大値が4.00であり、これより大きな値は現れていない。従って、教師データのマハラノビス距離(MD)の最大値より大きなマハラノビス距離(MD)が現れる解析対象データは、状態変動が生じていると結論することができる。そして、教師データのマハラノビス距離(MD)の最大値からの距離が大きな位置にマハラノビス距離(MD)の値を持つ場合には状態変動の度合いが大きいと結論することができる。従って、教師データのマハラノビス距離(MD)の分布範囲が正常であれば、教師データのマハラノビス距離(MD)の最大値からの距離が大きな位置では異常の度合いが大きいと結論付けることができる。
【0032】
つまり、状態変動検出手段35は、上記教師データ幾何学的距離の分布範囲を求め、この分布範囲を超えた上記解析対象データ幾何学的距離の分布の割合に基づき上記解析データの状態変動を検出することができる。上記の動作は、上記状態変動検出手段35が、教師データ幾何学的距離の分布範囲を求め、この分布範囲から前記解析対象データ幾何学的距離の分布が離れている程度に基づき上記解析データの状態変動を検出することができることを示している。
【0033】
以上のような手段等によって構成される状態変動検出装置は、図8に示すフローチャートによって処理動作を実行するので、このフローチャートを参照して動作説明を行う。
【0034】
最初に教師データを用いて予測モデル30を作成する(STEP1)。教師データは、既に図示したデータであり、センサAにより得られるべき目的変数のデータと、センサBからセンサFにより得られる説明変数のデータとにより構成される。斯して、図5の教師データTが用いられて予測モデル作成手段31により予測モデル30が作成される。なお、ここで作成される予測モデル30は、ランダムフォレストにより予測を行うものとするが、分類器により(例えばツリー構造で)分岐を行って機械学習による予測を行うものであれば、ランダムフォレスト以外の手法を用いるものであっても良い。
【0035】
次に、上記で作成された予測モデル30における説明変数の重要度を取得する(STEP2)。説明変数の取得元は、センサB~Fであるから、この取得元毎に重要度の値を求める。重要度の求め方は、ランダムフォレストの予測モデルを作成する場合に重要度を求めて適切な決定木を作成するなどに用いる手法など、公知の手法を用いることができる。
【0036】
上記のSTEP2において求めた取得元毎に重要度の値を図9(A)に示す。本実施形態では、STEP2に続いて、予め設定された範囲の重要度に属する所定範囲重要度説明変数を上記予測モデルにおいて求める(STEP3)。このために、取得元毎に重要度の値によって割合を求め、重要度の値が低い側から割合の値を累積し累積値を求めたものを図9(B)に示す。本実施形態では、閾値として累積値が「1.0」を採用し、この「1.0」より少ない範囲の取得元の説明変数を求める。閾値として累積値「1.0」は、一例に過ぎず、使用するシステムや使用する場面によって適宜変更されるものである。本実施形態では、図9(B)から取得元がセンサEとセンサFの説明変数が該当する説明変数となる。
【0037】
上記STEP3の次に、上記で求めた所定範囲重要度説明変数を用いて教師データの幾何学的距離であるマハラノビス距離を求める(STEP4)。ここに、マハラノビス距離を求める対象は、教師データ中の目的変数を除く説明変数についてである。上記で求められた教師データについてのマハラノビス距離は、図6(A)にMDとして示すようであり、これを度数分布グラフとすると図6(B)のようになる。
【0038】
STEP4に続いて解析対象データの幾何学的距離であるマハラノビス距離を求める(STEP5)。この場合に、上記教師データの幾何学的距離の算出に用いた各説明変数の平均値と分散共分散行列の逆行列を用いて解析対象データのマハラノビス距離を求める。この結果、教師データのデータ平均から解析対象データまでの幾何学的距離が求まることになる。
【0039】
解析対象データが前述の通り図示しないが、図5に示したような値に準じた値であるとする。これに対し、解析対象データについてのマハラノビス距離は、図7(A)にMDとして示すようであり、これを度数分布グラフとすると図7(B)のようになる。解析対象データについてのマハラノビス距離とその分布は、取得元毎に求められる。
【0040】
STEP5に続いて、上記教師データ幾何学的距離であるマハラノビス距離の分布と上記解析対象データ幾何学的距離であるマハラノビス距離の分布に基づき、上記解析対象データの状態変動を検出する(STEP6)。上記教師データ幾何学的距離であるマハラノビス距離の分布は、図6(B)のようである。また、上記解析対象データ幾何学的距離であるマハラノビス距離の分布は、図7(B)のようである。
【0041】
図6(B)に示されている教師データのマハラノビス距離の分布TCと図7(B)に示されている解析対象データのマハラノビス距離の分布ACとに対し横軸を一致させて縦方向に並べると、図10のようである。教師データのマハラノビス距離の最大値T-MAXを通る縦線分Lを引くと明らかなように、解析対象データのマハラノビス距離は教師データのマハラノビス距離の最大値T-MAXよりの大きな値の領域にも存在している。
【0042】
教師データのマハラノビス距離の分布TCが状態変動なし(または、正常)の範囲であるとすると、解析対象データのマハラノビス距離における分布の内、縦線分Lを超える領域(図ではLより右側の領域)の分布は、状態変動あり(または、異常)、と言うことになる。
【0043】
そして、状態変動あり(または、異常)は、例えば、教師データのマハラノビス距離の最大値T-MAXと解析対象データのマハラノビス距離の最大値A-MAXの差が所定閾値以上であるか否かにより判定することができる。また、縦に延びる線分Lを超える領域(図では線分Lより右側の領域)の全領域に対する割合(異常率とも言える)が、所定閾値を超えているか否かに基づき、状態変動あり(または、異常発生)などを判定することができる。このように、状態変動検出手段35は、上記教師データ幾何学的距離の分布範囲を求め、この分布範囲を超えた上記解析対象データ幾何学的距離の分布の割合に基づき上記解析データの状態変動を検出する。
【0044】
また、教師データのマハラノビス距離の分布TCの平均値と解析対象データのマハラノビス距離の分布ACの平均値との差や、上記2つの平均の比が所定閾値を超えているか否かに基づき、状態変動あり(または、異常発生)などを判定することができる。上記の判定は、取得元毎に行われることから、取得元毎に得られる判断結果の多数決をとるなど統計的処理を行って解析対象データに状態変動あり(または、異常発生)などを判定することができる。
【0045】
以上では、状態変動あり(または、異常)か、または状態変動なし(または、正常)であるかの二者択一の判断を行ったが、閾値をいくつか設けて状態変動(または、異常)の可能性を大中小の3段階や、可能性大、可能性中の大、可能性中の小、可能性小の4段階など更に段階の多い多段階で判断することもできる。
【0046】
なお、上記実施形態では、所定範囲重要度説明変数検索手段32は、予め設定された閾値より低い重要度の説明変数を求めること示しているために、ランダムフォレストなどの低い重要度の説明変数を用いない状態変動検出装置とは異なる結論が得られることが期待され、本実施形態による結果をランダムフォレストなどによる結果を補正する場合などに用いることができ、状態変動検出の精度向上を図ることができる。例えば、本実施形態の判断の閾値を高くして状態変動あり(または、異常)となり難く設定を行っておき、それでも状態変動あり(または、異常)との判定結果が本実施形態で得られるのであれば、本実施形態の判断を優先するなどの手法を採用できる。なお、補正などの対象である結果を得る装置であるランダムフォレストによる状態変動検出装置は、本願出願人が出願した特願2018-40531に記載の装置、特願2019-55609に記載の装置、特願2019-55615に記載の装置などを挙げることができる。
【0047】
また、上記実施形態では、所定範囲重要度説明変数検索手段32は、予め設定された閾値より低い重要度の説明変数を求めるようにしているが、ランダムフォレストなどによる結果を追認するものとして用いることもできる。その場合には、所定範囲重要度説明変数検索手段32は、予め設定された閾値より低い重要度の説明変数を除いた説明変数を求め、これを用いて幾何学的距離を求めるようにしても良い。或いは、所定範囲重要度説明変数検索手段32は、予め設定された第1の閾値より低く、この第1の閾値よりも大きな第2の閾値に挟まれる重要度の説明変数を求め(つまり重要度の中間の説明変数を求め)、これを用いて幾何学的距離を求めるようにしても良い。
【0048】
また、上記実施形態では、幾何学的距離を求める手法として、マハラノビス距離を求める良く知られたMT法と称される手法を用いるものである。しかしながら、近時においてはMT法が有している問題点を解決すべく、MTA法、T(3)法(RT法)などが提案されている。本実施形態においては、上記の提案されたMTA法、T(3)法(RT法)の手法を採用しても良い。
【符号の説明】
【0049】
10 CPU
11 主メモリ
12 バス
13 外部記憶インタフェース
14 入力インタフェース
15 表示インタフェース
16 データ入力インタフェース
22 マウス
23 外部記憶装置
24 入力装置
25 表示装置
26-1~26-m センサ
30 予測モデル
31 予測モデル作成手段
32 所定範囲重要度説明変数検索手段
33 教師データ幾何学的距離算出手段
34 解析対象データ幾何学的距離算出手段
35 状態変動検出手段
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10