(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6961312
(24)【登録日】2021年10月15日
(45)【発行日】2021年11月5日
(54)【発明の名称】状態変動検出補助装置、状態変動検出装置、状態変動検出補助用プログラム、及び状態変動検出用プログラム
(51)【国際特許分類】
G05B 23/02 20060101AFI20211025BHJP
G06N 20/00 20190101ALI20211025BHJP
G06F 17/18 20060101ALI20211025BHJP
【FI】
G05B23/02 302V
G05B23/02 T
G06N20/00 130
G06F17/18 Z
【請求項の数】14
【全頁数】16
(21)【出願番号】特願2019-160751(P2019-160751)
(22)【出願日】2019年9月3日
(65)【公開番号】特開2021-39565(P2021-39565A)
(43)【公開日】2021年3月11日
【審査請求日】2020年2月21日
(73)【特許権者】
【識別番号】391016358
【氏名又は名称】東芝情報システム株式会社
(74)【代理人】
【識別番号】100090169
【弁理士】
【氏名又は名称】松浦 孝
(74)【代理人】
【識別番号】100074147
【弁理士】
【氏名又は名称】本田 崇
(74)【代理人】
【識別番号】100124497
【弁理士】
【氏名又は名称】小倉 洋樹
(72)【発明者】
【氏名】松村 久
(72)【発明者】
【氏名】牧野 真一
【審査官】
山村 秀政
(56)【参考文献】
【文献】
国際公開第2017/221856(WO,A1)
【文献】
特開2010−211684(JP,A)
【文献】
特開2013−013045(JP,A)
【文献】
国際公開第2015/145500(WO,A1)
【文献】
特開2017−174390(JP,A)
【文献】
特許第6164311(JP,B1)
【文献】
国際公開第2019/111866(WO,A1)
【文献】
特開2017−228086(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 23/02
G06N 20/00
G06F 17/18
(57)【特許請求の範囲】
【請求項1】
第1目的変数データと第1説明変数データを含む第1機械学習用データについて、前記第1機械学習用データ中の前記第1目的変数データとは異なるデータを第2目的変数データとし、前記第1機械学習用データ中の前記第1説明変数データとは異なるデータを第2説明変数データとした第2機械学習用データを作成する第2機械学習用データ作成手段と、
説明変数から目的変数を予測する、教師データを用いて生成された第1予測モデルと、
説明変数から目的変数を予測する、前記教師データから前記第2機械学習用データ作成手段によって作成された第2教師データを用いて生成された第2予測モデルと、
複数の取得元から取得された第1目的変数データと第1説明変数データを含む第1解析対象データを前記第1予測モデルに適用し、第1予測値データを得る第1予測値取得手段と、
前記第1解析対象データを前記第2機械学習用データ作成手段に適用して得られる第2解析対象データを前記第2予測モデルに適用し、第2予測値データを得る第2予測値取得手段と、
前記第1解析対象データ中の前記第1目的変数データと前記第1予測値データとの差である第1予測誤差値と、前記第2解析対象データ中の前記第2目的変数データと前記第2予測値データとの差である第2予測誤差値と、を求める予測誤差値算出手段と、
前記予測誤差値算出手段により算出された結果を出力手段へ出力する出力制御手段と
を具備することを特徴とする状態変動検出補助装置。
【請求項2】
前記第2機械学習用データ作成手段は、前記取得された第1解析対象データを、時間経過を示す表題情報を縦方向に複数並べ、取得元を示す取得元情報を横方向に複数並べて、各表題情報と各取得元情報の交差する位置に取得された値情報を配置した第1の行列として、この第1の行列を転置して転置行列を作成し第2解析対象データとすることを特徴とする請求項1に記載の状態変動検出補助装置。
【請求項3】
前記第1予測モデルの第1重要度を求めて、この第1重要度で前記第1予測誤差値に伸長を図る処理を行うと共に、前記第2予測モデルの第2重要度を求めて、この第2重要度で前記第2予測誤差値を伸長する処理を行う誤差値伸長手段を具備し、
前記出力制御手段は、前記誤差値伸長手段による誤差値伸長の結果を出力することを特徴とする請求項1または2に記載の状態変動検出補助装置。
【請求項4】
前記目的変数の数値及び/または前記説明変数の数値をダミー数値へ変更し、前記目的変数の数値と前記説明変数の数値を近接させるダミー数値変更手段を具備することを特徴とする請求項1乃至3のいずれか1項に記載の状態変動検出補助装置。
【請求項5】
第1解析対象データにおいて、時間経過を示す表題情報が所定時間間隔で繰り返される情報であり、
前記出力手段は、前記表題情報を第1の軸とし、前記取得元を示す取得元情報を第2の軸とし、時間を第3の軸として、3次元の出力を行うことを特徴とする請求項1乃至4のいずれか1項に記載の状態変動検出補助装置。
【請求項6】
請求項1乃至4のいずれか1項に記載の状態変動検出補助装置と、
前記状態変動検出補助装置の前記出力制御手段から出力される結果について統計処理を行って、予め設定された判定条件情報に基づき状態変動の有無を判定する状態変動判定手段と、
を具備する特徴とする状態変動検出装置。
【請求項7】
前記状態変動判定手段は、前記出力制御手段から出力される結果について単位ブレ距離を求め、求めた単位ブレ距離の平均値と偏差値を求め、偏差値に基づき状態変動の有無を判定することを特徴とする請求項6に記載の状態変動検出装置。
【請求項8】
コンピュータを、
第1目的変数データと第1説明変数データを含む第1機械学習用データについて、前記第1機械学習用データ中の前記第1目的変数データとは異なるデータを第2目的変数データとし、前記第1機械学習用データ中の前記第1説明変数データとは異なるデータを第2説明変数データとした第2機械学習用データを作成する第2機械学習用データ作成手段、
説明変数から目的変数を予測する、教師データを用いて生成された第1予測モデル、
説明変数から目的変数を予測する、前記教師データから前記第2機械学習用データ作成手段によって作成された第2教師データを用いて生成された第2予測モデル、
複数の取得元から取得された第1目的変数データと第1説明変数データを含む第1解析対象データを前記第1予測モデルに適用し、第1予測値データを得る第1予測値取得手段、
前記第1解析対象データを前記第2機械学習用データ作成手段に適用して得られる第2解析対象データを前記第2予測モデルに適用し、第2予測値データを得る第2予測値取得手段、
前記第1解析対象データ中の前記第1目的変数データと前記第1予測値データとの差である第1予測誤差値と、前記第2解析対象データ中の前記第2目的変数データと前記第2予測値データとの差である第2予測誤差値と、を求める予測誤差値算出手段、
前記予測誤差値算出手段により算出された結果を出力手段へ出力する出力制御手段
として機能させることを特徴とする状態変動検出補助用プログラム。
【請求項9】
前記コンピュータを前記第2機械学習用データ作成手段として、前記取得された第1解析対象データを、時間経過を示す表題情報を縦方向に複数並べ、取得元を示す取得元情報を横方向に複数並べて、各表題情報と各取得元情報の交差する位置に取得された値情報を配置した第1の行列として、この第1の行列を転置して転置行列を作成し第2解析対象データとするように機能させることを特徴とする請求項8に記載の状態変動検出補助用プログラム。
【請求項10】
前記コンピュータを更に、
前記第1予測モデルの第1重要度を求めて、この第1重要度で前記第1予測誤差値に伸長を図る処理を行うと共に、前記第2予測モデルの第2重要度を求めて、この第2重要度で前記第2予測誤差値を伸長する処理を行う誤差値伸長手段として機能させ、
前記コンピュータを前記出力制御手段として、前記誤差値伸長手段による誤差値伸長の結果を出力するように機能させることを特徴とする請求項8または9に記載の状態変動検出補助用プログラム。
【請求項11】
前記コンピュータを更に、前記目的変数の数値及び/または前記説明変数の数値をダミー数値へ変更し、前記目的変数の数値と前記説明変数の数値を近接させるダミー数値変更手段として機能させることを特徴とする請求項8乃至10のいずれか1項に記載の状態変動検出補助用プログラム。
【請求項12】
第1解析対象データにおいて、時間経過を示す表題情報が所定時間間隔で繰り返される情報であり、前記コンピュータを前記出力手段として、前記表題情報を第1の軸とし、前記取得元を示す取得元情報を第2の軸とし、時間を第3の軸として、3次元の出力を行うように機能させることを特徴とする請求項8乃至11のいずれか1項に記載の状態変動検出補助用プログラム。
【請求項13】
コンピュータを、
第1目的変数データと第1説明変数データを含む第1機械学習用データについて、前記第1機械学習用データ中の前記第1目的変数データとは異なるデータを第2目的変数データとし、前記第1機械学習用データ中の前記第1説明変数データとは異なるデータを第2説明変数データとした第2機械学習用データを作成する第2機械学習用データ作成手段、
説明変数から目的変数を予測する、教師データを用いて生成された第1予測モデル、
説明変数から目的変数を予測する、前記教師データから前記第2機械学習用データ作成手段によって作成された第2教師データを用いて生成された第2予測モデル、
複数の取得元から取得された第1目的変数データと第1説明変数データを含む第1解析対象データを前記第1予測モデルに適用し、第1予測値データを得る第1予測値取得手段、
前記第1解析対象データを前記第2機械学習用データ作成手段に適用して得られる第2解析対象データを前記第2予測モデルに適用し、第2予測値データを得る第2予測値取得手段、
前記第1解析対象データ中の前記第1目的変数データと前記第1予測値データとの差である第1予測誤差値と、前記第2解析対象データ中の前記第2目的変数データと前記第2予測値データとの差である第2予測誤差値と、を求める予測誤差値算出手段、
前記予測誤差値算出手段により算出された結果を出力手段へ出力する出力制御手段、
前記出力制御手段から出力される結果について統計処理を行って、予め設定された判定条件情報に基づき状態変動の有無を判定する状態変動判定手段、
として機能させることを特徴とする状態変動検出用プログラム。
【請求項14】
前記コンピュータを前記状態変動判定手段として、前記出力制御手段から出力される結果について単位ブレ距離を求め、求めた単位ブレ距離の平均値と偏差値を求め、偏差値に基づき状態変動の有無を判定するように機能させることを特徴とする請求項13に記載の状態変動検出用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、状態変動検出補助装置、状態変動検出装置、状態変動検出補助用プログラム、及び状態変動検出用プログラムに関するものである。
【背景技術】
【0002】
例えば、機械の電流と電圧と振動とを測定して、異常等の状態変動を検出する場合に、一般的には、人による過去の経験等に基づき異常の判定を行う。即ち、状態変動の閾値は人が設定するものであり、異常データを持っていない機械が状態変動の検出を行うことはほぼ不可能であった。
【0003】
特許文献1には、電波の異常伝搬が発生した場合の当該電波の到来状況を予測するシステムが開示されている。このシステムは、気象情報を取り込む気象情報取込手段と、この気象情報取込手段で取り込んだ気象情報から、高度毎の気温に関する情報、高度毎の気圧に関する情報、高度毎の湿度に関する情報の少なくとも1つを、気象データとして抽出する気象データ抽出手段を備える。更に、上記気象データ抽出手段で上記気象データが抽出された日にちの電波到来に関し、予め蓄積された測定データに基づき算出された上記電波の異常伝搬を予測するための予測関数を蓄積しており、蓄積されている予測関数に、上記気象データ抽出手段で抽出した気象データを入力して、上記電波の異常伝搬が発生する発生確率である予測値を決定するものである。
【0004】
特許文献2には、生産物を生産可能な機械設備から、上記生産物の所定の生産単位ごとに上記機械設備の有するセンサの時系列データを取得する取得工程、前記時系列データを複数の分割データに分割した分割データ群を生成する分割工程、上記分割データ群に含まれる所定の正常品質分に対し、故障がないことを示す付加情報である第1付加情報を対応付けると共に、上記分割データ群に含まれる直近生産分に対し、故障があることを示す第2付加情報を無条件に対応付ける設定工程を備える品質異常検知方法が開示されている。
【0005】
この品質異常検知方法は、更に、上記正常品質分及び上記直近生産分を混在させた2グループを形成するグループ化工程、上記2グループのうちの一方を用いた学習により、入力データに対応する上記付加情報を予測する予測モデルを生成する生成工程、上記2グループのうちの他方を上記入力データとすることによって得られる上記予測モデルの予測結果において、上記付加情報が上記第2付加情報であると予測される確率を算出する算出工程を有しており、上記確率に基づいて上記生産物の品質異常を判定すると言うものである。
【0006】
また、特許文献3には過去の実績に基づいて将来を予測するデータ予測方法が開示されている。このデータ予測方法では、予測モデルは、予測対象日における少なくとも一つの特徴量について予測値を出力する第1予測モデルと、この第1予測モデルから出力される予測値を入力因子に含み、予測対象日の所定時間ごとの予測値を出力する第2予測モデルと、から構成されるものである。
【0007】
そして、特許文献3のデータ予測方法では、収集された至近実績データ及び過去実績データを用いて予測モデルを構築する予測モデル構築手段と、構築された予測モデルに予測用入力データを入力して予測を実行し、予測値を得る予測実行手段と、収集された至近実績データと予測値とから予測誤差またはモデル誤差を計算する予測誤差計算手段と、予測誤差またはモデル誤差に基づいて前記予測値を補正する補正係数又は補正量を算出し、軸方向補正予測値を得るものである。
【0008】
図1(A)、(B)は、ランダムフォレストにより状態変動検出を行う場合の手法を示すための説明図である。一方、ランダムフォレストでは、
図1(A)に示されるような領域の境界線によって、正常な場合を「1」により示し、異常な場合を「2」で示すようにした状態変動検出装置が知られている。即ち、この状態変動検出装置では縦軸方向の値が160以上で横軸方向の値が45より小さい領域は全て正常の「1」であり、縦軸の値が160より小さい領域では、横軸方向の値が30より小さければ正常の「1」であり、横軸方向の値が30以上であれば異常の「2」となる。また、縦軸方向の値が160以上で横軸方向の値が45より大きい領域は、縦軸方向の値が260より小さければ異常の「2」であり、縦軸方向の値が260以上であれば正常の「1」となる。
図1(A)において、白無地の領域が正常の「1」であり、梨地模様の領域が異常の「2」である。
【0009】
以上のような領域を分けて異常と正常の判定を行う場合には、分類器により(例えばツリー構造で)分岐を行って予測を行う機械学習による状態変動検出装置を実現できる。このような状態変動検出装置において、例えば、
図1(B)に示すような解析対象データDが生じた場合には、
図1(A)の領域に関する状態変動検出装置によると、縦軸方向の値が160以上で横軸方向の値が45より小さい領域に該当し、図示のように正常の「1」に分類されてしまう。しかしながら、縦軸方向の値が概ね10000であるから、通常の縦軸の値400などから矢印で示すように大きく離れており、明らかに異常の「2」に分類しなければならない解析対象データであり、誤分類が生じている。
【0010】
また、
図2(A)、(B)は、ランダムフォレストにより状態変動検出を行う場合の手法の問題点を示すための説明図である。
図2(A)と
図2(B)に示すような領域が境界線によって分けられている場合において、目的変数が
図2(A)に示す如くのダミー変数により規定されているとする。即ち、白無地の領域ではダミー変数が「1」であり、梨地模様の領域ではダミー変数が「99」であり、灰色無地の領域ではダミー変数が「100」であるときに、
図2(B)に示すような解析対象データが得られたとする。
【0011】
図2(B)の場合の各領域の数値の平均と誤差は、
図2(B)に記載の通りである。即ち、白無地の領域では数値平均が「43.4」で誤差が「42.4」であり、梨地模様の領域では数値平均が「99.4」で誤差が「0.4」であり、灰色無地の領域では数値平均が「100.0」で誤差が「0」である。このようにダミー変数に大小差があると、誤差が大きく異なってしまう。従って、誤差の比較によって状態変動を捕えようとしても適切な検出を行うことができないという問題がある。
【0012】
特許文献4では、信号を取得する空間として二次元平面を考え、機械学習と識別に利用するデータは、平面内の分布情報とスペクトル情報との合計で三次元の構造をした多次元的情報と呼ばれるもので、この多次元的情報を用いた場合の、機械学習と識別の手順は、スペクトルデータを用いた場合と本質的には同様でとしている。更に、この場合には、データのパターンを記述するのに適切な特徴量を複数取得した上で、それを特徴ベクトルとし、機械学習及び識別処理に用いることもできること、特徴量の代表的例としては、体積や曲率、空間勾配、HLAC(高次局所自己相関)等があることが述べられている。
【0013】
そして、機械学習に用いる特徴量を事前に選別することも可能であり、この場合、例えば、マハラノビス距離を算出して、識別に用いる特徴量を選別すれば良いことが述べられている。マハラノビス距離が大きければ、識別がより容易になるため、注目する各群間のマハラノビス距離が大きくなる様な特徴量を優先的に選別することもできるとしている。
【0014】
つまり、上記特許文献4に記載されているのは、機械学習及び識別処理をより容易にする特徴量の選定を行う場合にマハラノビス距離が大きくなる様な特徴量を選択することを述べている。
【0015】
更に、特許文献5の第0117欄には、「上記所定のアルゴリズムとして決定木を利用した場合には、ランダムフォレスト法等により、各特徴量(説明変数)の関連度(重要度又は寄与度とも称しても良い)を算出することができる。具体的には、決定木を作成する際には、ジニ係数、交差エントロピー等で示される不純度が小さくなるように、各特徴量(説明変数)からノード(分岐)の選択が行われる。そのため、各特徴量(説明変数)をノードに選択した際の不純度の減少量をその特徴量(説明変数)の重要度として利用することができる。上記ステップS102では、この重要度を利用して、複数種類の特徴量の中から異常発生の予測に有効な特徴量を選択するようにしてもよい。」と記載がなされており、基本的には
図2を用いて説明したような重要度による選択が示されている。
【0016】
特許文献6には、計算されたマハラノビスの距離D2iの計算値が"1+3*σ"以内であれば、危険率0.3% で製造装置の状態に変化無し、と判断され、一方、"1+3*σ"以上であれば、危険率0.3% で製造装置状態に変化有り或いはその動作が異常の兆候有りと判断することが開示されている。このシステムは、D2INIの値を基準空間の標準偏差σより3σから3.5σの範囲とするものである。
【先行技術文献】
【特許文献】
【0017】
【特許文献1】特開2005−315753号公報
【特許文献2】特開2018−147406号公報
【特許文献3】特開2004−94437号公報
【特許文献4】特開2015−52581号公報
【特許文献5】特開2018−116545号公報
【特許文献6】特開2000−252179号公報
【発明の概要】
【発明が解決しようとする課題】
【0018】
本実施形態は、解析対象データを取得する取得元の数が少ない場合にも、取得元の数が多いときに匹敵するような精度で状態変動を検出することを可能とする状態変動検出補助装置、状態変動検出装置、状態変動検出補助用プログラム、状態変動検出用プログラムを提供することを目的とする。
【課題を解決するための手段】
【0019】
本実施形態に係る状態変動検出補助装置は、第1目的変数データと第1説明変数データを含む第1機械学習用データについて、前記第1機械学習用データ中の前記第1目的変数データとは異なるデータを第2目的変数データとし、前記第1機械学習用データ中の前記第1説明変数データとは異なるデータを第2説明変数データとした第2機械学習用データを作成する第2機械学習用データ作成手段と、説明変数から目的変数を予測する、教師データを用いて生成された第1予測モデルと、説明変数から目的変数を予測する、前記教師データから前記第2機械学習用データ作成手段によって作成された第2教師データを用いて生成された第2予測モデルと、複数の取得元から取得された第1目的変数データと第1説明変数データを含む第1解析対象データを前記第1予測モデルに適用し、第1予測値データを得る第1予測値取得手段と、前記第1解析対象データを前記第2機械学習用データ作成手段に適用して得られる第2解析対象データを前記第2予測モデルに適用し、第2予測値データを得る第2予測値取得手段と、前記第1解析対象データ中の前記第1目的変数データと前記第1予測値データとの差である第1予測誤差値と、前記第2解析対象データ中の前記第2目的変数データと前記第2予測値データとの差である第2予測誤差値と、を求める予測誤差値算出手段と、前記予測誤差値算出手段により算出された結果を出力手段へ出力する出力制御手段とを具備することを特徴とする。
【図面の簡単な説明】
【0020】
【
図1】ランダムフォレストにより状態変動検出を行う場合の手法を示すための説明図。
【
図2】ランダムフォレストにより状態変動検出を行う場合の手法の問題点を示すための説明図。
【
図3】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bを実現するコンピュータシステムの構成図。
【
図4】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bの機能ブロック図。
【
図5】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる第2機械学習用データ作成手段による処理を説明するための図。
【
図6】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる第2機械学習用データ作成手段による別の処理手法を説明するための図。
【
図7】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる誤差伸長を行った結果を示す図。
【
図8】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる3次元の出力を行った結果を示す図。
【
図9】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる第1予測モデルと第2予測モデルとの生成に係る処理及び第1重要度と第2重要度を求める処理を示すフローチャート。
【
図10】本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる処理を示すフローチャート。
【発明を実施するための形態】
【0021】
以下添付図面を参照して本発明に係る状態変動検出補助装置1A、状態変動検出装置1B、状態変動検出補助用プログラム、及び状態変動検出用プログラムの実施形態を説明する。各図において同一の構成要素には、同一の符号を付して重複する説明を省略する。
図3は、本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bを実現するコンピュータシステムの構成図である。本発明の実施形態に係る状態変動検出補助装置1A及び状態変動検出装置1Bは、例えば
図3に示されるようなパーソナルコンピュータやワークステーション、その他のコンピュータシステムにより構成することができる。このコンピュータシステムは、CPU10が主メモリ11に記憶されている或いは主メモリ11に読み込んだプログラムやデータに基づき各部を制御し、必要な処理を実行することにより状態変動検出補助装置1Aや状態変動検出装置として動作を行うものである。
【0022】
CPU10には、バス12を介して外部記憶インタフェース13、入力インタフェース14、表示インタフェース15、データ入力インタフェース16が接続されている。外部記憶インタフェース13には、状態変動検出用プログラム等のプログラムと必要なデータ等が記憶されている外部記憶装置23が接続されている。入力インタフェース14には、コマンドやデータを入力するための入力装置としてのキーボードなどの入力装置24とポインティングデバイスとしてのマウス22が接続されている。
【0023】
表示インタフェース15には、LEDやLCDなどの表示画面を有する表示装置25が接続されている。データ入力インタフェース16には、測定データを得るためのセンサ26−1、26−2、・・・、26−mが接続されている。このコンピュータシステムには、他の構成が備えられていても良く、また、
図3の構成は一例に過ぎない。
【0024】
図4は、本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bの機能ブロック図である。上記において、CPU10では、外部記憶装置23内の状態変動検出補助用プログラムによって
図4に記載の各手段等が実現される。即ち、予測モデル作成手段31、第2機械学習用データ作成手段32、第1予測値取得手段33、第2予測値取得手段34、予測誤差値算出手段35、出力制御手段36、誤差値伸長手段37、ダミー数値変更手段38が実現される。また、外部記憶装置23内には、教師データTが記憶されている。予測モデル作成手段31は、教師データTを用いて第1予測モデル30Aを作成するものである。また、予測モデル作成手段31は、本実施形態では、第1予測モデル30Aを作成するために予測モデル作成手段31を備えるが、他の装置やプログラムによって作成された第1予測モデル30Aを用いるものであっても良く、この場合には、予測モデル作成手段31を備えていなくともよい。
【0025】
第1予測モデル30Aは、機械学習により説明変数から目的変数を予測するものである。ここに、機械学習のアルゴリズムとしては、パターンマイニングのランダムフォレストを挙げることができるが、これ以外に、分類木や回帰木などのように分類器により(例えばツリー構造で)分岐を行って予測を行う機械学習によるアリゴリズムを採用することができる。また、第1予測モデル30Aは、重回帰分析による機械学習を行うものであっても良い。
【0026】
第2機械学習用データ作成手段32は、第1目的変数データと第1説明変数データを含む第1機械学習用データについて、上記第1機械学習用データ中の前記第1目的変数データとは異なるデータを第2目的変数データとし、前記第1機械学習用データ中の上記第1説明変数データとは異なるデータを第2説明変数データとした第2機械学習用データを作成するものである。
【0027】
また、第2機械学習用データ作成手段32は、与えられた第1機械学習用データが、第1目的変数データと第1説明変数データを含む教師データTである場合に、この教師データT中の上記第1目的変数データとは異なるデータを第2目的変数データとし、上記教師データT中の上記第1説明変数データとは異なるデータを第2説明変数データとする。そして第2機械学習用データ作成手段32は、上記第2説明変数データから上記第2目的変数データに対応する予測値が前記第2予測モデルにより導き出せる関係の上記第2目的変数データと上記第2説明変数データとを含む第2機械学習用データを作成するものである。この第2機械学習用データは新たな教師データである。従って、第2機械学習用データ作成手段32は、上記教師データTを第1教師データとして新たな第2教師データを作成するものと言える。
【0028】
更に、第2機械学習用データ作成手段32は、第1機械学習用データが複数の取得元から取得された第1目的変数データと第1説明変数データを含む第1解析対象データである場合に、上記第1解析対象データ中の上記第1目的変数データとは異なるデータを第2目的変数データとし、上記第1解析対象データ中の上記第1説明変数データとは異なるデータを第2説明変数データとして、新たな第2解析対象データを次のようにして作成する。即ち、第2機械学習用データ作成手段32は、上記第2説明変数データから上記第2目的変数データに対応する予測値が上記第2予測モデルにより導き出せる関係の上記第2目的変数データと上記第2説明変数データとを含む新たな第2解析対象データを作成するものである。
【0029】
ここで、取得元とは、説明変数を幾つかのセンサを用いて取得・収集している場合に、その各センサを取得元と言う。また、説明変数を幾つかの装置を用いて取得・収集している場合に、その各装置を取得元と言う。つまり、目的変数や説明変数を取得する元となるところと言う意味で、取得元を用いる。
【0030】
上記第2機械学習用データ作成手段32によって、第1解析対象データから第2解析対象データを作成する具体例を説明する。例えば、「ある物」を製造する装置があり、時系列的にStep1〜Step4による4Stepで「ある物」を製造し完成するものとする。この製造装置にセンサ1、センサ2、センサ3、センサ4が設けられ、各Stepのときに検出したデータ値を取得する。センサ1〜4が取得するデータは、例えば、温度、湿度、電圧、電流、圧力など、「ある物」の生産時に製造装置から取得できる通常は、物理量である。勿論、センサを人の五感などとし、熱い、ぬるい、冷たいなどの感覚的な情報であっても良い。
【0031】
以上のようなセンサ1〜4による測定によって、
図5(A)に示す如くの第1解析対象データであるデータが得られたものとする。
図5(A)は、本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる第2機械学習用データ作成手段による処理を説明するための図である。この
図5(A)では、取得された第1解析対象データを、時間経過を示す表題情報である「Step1〜Step4」を縦方向に複数並べ、取得元を示す取得元情報である「センサ1〜4」を横方向に複数並べて、各表題情報と各取得元情報の交差する位置に取得された値情報を配置した第1の行列としたものである。
【0032】
予測モデル作成手段31は、上記第2機械学習用データ作成手段32によって教師データTから作成された第2教師データを用いて、第2予測モデル30Bを作成するものである。また、本実施形態では、第2予測モデル30Bを作成するために予測モデル作成手段31を備えるが、他の装置やプログラムによって作成された第2予測モデル30Bを用いるものであっても良く、この場合には、予測モデル作成手段31は不要である。
【0033】
第2予測モデル30Bは、機械学習により説明変数から目的変数を予測するものである。ここに、機械学習のアルゴリズムとしては、パターンマイニングのランダムフォレストを挙げることができるが、これ以外に、分類木や回帰木などのように分類器により(例えばツリー構造で)分岐を行って予測を行う機械学習によるアリゴリズムを採用することができる。また、第2予測モデル30Bは、重回帰分析による機械学習を行うものであっても良い。
【0034】
上記第2機械学習用データ作成手段32は、上記第1の行列を転置して転置行列を作成し第2解析対象データとする。
図5(B)は、本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる第2機械学習用データ作成手段による処理を説明するための図であって、上記転置行列を示す。上記第1の行列においては、「Step1〜Step4」が目的変数であるのに対し、転置行列では「センサ1〜4」が目的変数となっている。
【0035】
図6(A)〜
図6(C)は、本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる第2機械学習用データ作成手段による別の処理手法を説明するための図である。上記第2機械学習用データ作成手段32において、上記のように転置行列を作成する以外に、
図6(A)の如き第1解析対象データが得られたとする。この場合に、第2機械学習用データ作成手段32は、「センサ1〜4」の各縦方向の列に係るデータを一つの塊として、例えば、最も左の縦方向1列のデータ「センサ1」のデータを目的変数とし、「センサ2〜4」の縦方向の各1列のデータを説明変数として、第2解析対象データを作成する。つまり、3列存在する説明変数の中から1列を取り出し、目的変数である1列のデータと位置を交換する。これにより、例えば、
図6(B)の如き第2解析対象データを得る。
【0036】
更に、説明変数の位置を変えて
図6(B)の如き第2解析対象データを得るようにしても良い。即ち、
図6(A)は、センサ1の縦一列とセンサ2の縦一列を交代させたものであるのに対し、
図6(C)は、
図6(B)の状態においてセンサ3の一列とセンサ4の一列の位置を交代したものとなっている。このようにして得た第2解析対象データは、重回帰分析による機械学習を行う場合に好適である。
【0037】
第1予測値取得手段33は、複数の取得元から取得された第1目的変数データと第1説明変数データを含む第1解析対象データを上記第1予測モデル30Aに適用し、第1予測値データを得るものである。第2予測値取得手段34は、上記第1解析対象データを上記第2機械学習用データ作成手段32に適用して得られる第2解析対象データを上記第2予測モデル30Bに適用し、第2予測値データを得るものである。予測誤差値算出手段35は、上記第1解析対象データ中の上記第1目的変数データと上記第1予測値データとの差である第1予測誤差値と、上記第2解析対象データ中の上記第2目的変数データと上記第2予測値データとの差である第2予測誤差値と、を求めるものである。
【0038】
出力制御手段36は、上記予測誤差値算出手段35により算出された結果を出力手段へ出力するものである。ここで出力手段は、既に説明した表示装置25とすることができる。また、表示装置25以外にプリンタなどであっても良い。以上のように実際に取得元から取得した第1解析対象データに基づき得られる第1予測誤差値だけでなく、第2機械学習用データ作成手段32が作成した第2解析対象データに基づき得られる第2予測誤差値を得ているので、取得元の数が多いときに匹敵するデータによって状態変動検出補助を行うことになり状態変動検出の確率が上がることが期待される。しかも、第2解析対象データは、第2説明変数データから前記第2目的変数データに対応する予測値が前記予測モデルにより導き出せる関係の前記第2目的変数データと前記第2説明変数データとを含むものであるから、上記期待は十分大きなものと言える。
【0039】
誤差値伸長手段37は、上記第1予測モデル30Aの第1重要度を求めて、この第1重要度で上記第1予測誤差値に伸長を図る処理を行う共に、上記第2予測モデル30Bの第2重要度を求めて、この第2重要度で上記第2予測誤差値を伸長する処理を行うものである。重要度の求め方は、ランダムフォレストの予測モデルを作成する場合に重要度を求めて適切な決定木を作成するなどに用いる手法など、公知の手法を用いることができる。また、「伸長を図る処理」は、重要度の値を掛ける(乗算する)手法を挙げることができるが、重要度の値によっては除算を行うことも可能である。
【0040】
図7は、本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる誤差伸長を行った結果を示す図である。即ち
図7(A)には、
図5(A)に示された第1解析対象データから得られた上記第1誤差値に伸長を図る処理を行った結果を示し、7(B)には、
図5(B)に示された第2解析対象データから得られた上記第2誤差値に伸長を図る処理を行った結果を示す。
図7(A)における楕円DAにより示す部分には、他の部分よりも差異が大きく強調された誤差値が見られ、伸長の成果と考えることができる。また、
図7(B)における楕円DBにより示す部分には、他の部分よりも差異が大きく強調された誤差値が見られ、伸長の成果と考えることができる。しかも、これは
図5(B)に示された第2解析対象データから得られた上記第2誤差値に伸長を図る処理を行った結果であり、
図7(A)と比較して差異が大きく、「第2予測誤差値を得ているので、取得元の数が多いときに匹敵するデータによって状態変動検出補助を行うことになり状態変動検出の確率が上がることが期待される。」と前述した効果が立証されている。
【0041】
第1解析対象データにおいて、時間経過を示す表題情報が所定時間間隔で繰り返される情報であり、上記出力手段は、上記表題情報を第1の軸とし、上記取得元情報を第2の軸とし、時間を第3の軸として、3次元の出力を行うものとすることができる。しかも、上記3軸を移動させて多方面から見た如くに出力(表示)することができる。
図8は、本発明の実施形態に係る状態変動検出補助装置1Aと状態変動検出装置1Bによる3次元の出力を行った結果を示す図である。
図8(A)は、横方向が時間軸、上下方向が先の例で「ステップ」とした表題情報の軸(第1の軸)、図の手前から奥へ延びる軸が取得元情報を割り当てた第2の軸である。この表示で、他の部分よりも差異が大きな部分(楕円で囲って示すP1)が識別されないが、
図8(B)に示すように3軸を移動させることにより、他の部分よりも差異が大きな部分(楕円で囲って示すP1)が明瞭になり、オペレータが目視して状態変動検出を行う場合の補助に寄与することができる。
【0042】
ダミー数値変更手段38は、上記目的変数の数値及び/または上記説明変数の数値をダミー数値へ変更し、上記目的変数の数値と上記説明変数の数値を近接させるものである。ダミー変数に大小差があると、誤差が大きく異なってしまうという問題については、
図2を用いて説明した。ダミー数値変更手段38は、目的変数の数値及び/または上記説明変数の数値を比較して他と所定以上の差がある場合に、数値の近接を行う。例えば、既に説明した「ステップ」の数値が、1、13、21、22、31などと例えば、「1」以上の差がある場合には、10001、10002、10003、10004、10005と値を変更し、近接させる。これによって、ダミー変数の数値自体が大きくても、誤差値を得て比較を行う場合には、誤差が飛び抜けて大きな値を採ることが無くなり、状態変動検出を行う場合に好適となる。
【0043】
図4において、破線よりも上に記載の手段は、状態変動検出補助用プログラム及び状態変動検出用プログラムの双方で実現されるものであり、破線よりも下に記載の手段は、状態変動検出用プログラムのみで実現されるものである。CPU10では、外部記憶装置23内の状態変動検出用プログラムによって
図4に記載の各手段等が実現される。状態変動検出用プログラムのみで実現されるものは、状態変動判定手段41である。
【0044】
状態変動判定手段41は、上記状態変動検出補助装置1A上記出力制御手段から出力される結果について統計処理を行って、予め設定された判定条件情報に基づき状態変動の有無を判定するものである。「統計処理を行って、予め設定された判定条件情報に基づき状態変動の有無を判定する」ことの具体的一例として、上記状態変動判定手段41は、上記出力制御手段から出力される結果について単位ブレ距離を求め、求めた単位ブレ距離の平均値と偏差値を求め、偏差値に基づき状態変動の有無を判定する基礎情報を求めるという手法を挙げることができる。
【0045】
更に具体的には、第1解析対象データから得られた偏差値と第2解析対象データから得られた偏差値が共に所定値以上であることを状態変動の有無を判定する基礎情報とすることができる。そして、第1解析対象データの取得が前述の「ステップ」毎に得られたとき、1回分の基礎情報を得るものとし、基礎情報が複数回分得られるまでデータ取得を行う。このように複数の基礎情報を得た場合において、基礎情報が、「連続してN回状態変動有り」となったときに状態変動有りと最終的に判定するようにしても良い。
【0046】
以上のような手段等によって構成される状態変動検出補助装置1Aと状態変動検出装置1Bは、
図9、
図10に示すフローチャートによって処理動作を実行するので、このフローチャートを参照して動作説明を行う。
図9のフローチャートは、第1予測モデル30Aと第2予測モデル30Bとの生成に係る処理及び第1重要度と第2重要度を求める処理を示すものであり、CPU10が行う処理である。与えられている教師データTを用いて第2機械学習用データ作成手段32による第2教師データ生成を行う(S11)。第2教師データ生成は、転置行列を求める処理によることができる。次に教師データTを用いて第1予測モデル30Aを生成する(S12)。このステップS12においては、ダミー数値変更手段38による目的変数の数値及び/または上記説明変数の数値をダミー数値へ変更を必要に応じて行うことができる。
【0047】
更に、第2教師データ生成を用いて第2予測モデル30Bを生成する(S13)。このステップS13においても、ダミー数値変更手段38による目的変数の数値及び/または上記説明変数の数値をダミー数値へ変更を必要に応じて行うことができる。次に、教師データと第1予測モデル30Aを用いて第1重要度データを求める(S14)。また、第2教師データと第2予測モデル30Bを用いて第2重要度データを求める(S15)。上記ステップS14、S15の処理において、重要度の求め方は、ランダムフォレストの予測モデルを作成する場合に重要度を求めて適切な決定木を作成するなどに用いる手法など、公知の手法を用いることができる。
【0048】
図10のフローチャートは、状態変動検出に到るまでの処理を示すものであり、CPU10が行う処理である。第1目的変数データと第1説明変数データを含む第1解析対象データを複数の取得元から取得し、第1解析対象データから第2機械学習用データ作成手段32の処理によって第2解析対象データを求める(S21)。第1解析対象データを第1予測モデル30Aに適用して第1予測値を求め(S22)、第2解析対象データを第2予測モデル30Bに適用して第2予測値を求める(S23)。上記ステップS22、S23において、ダミー数値変更手段38による目的変数の数値及び/または上記説明変数の数値をダミー数値へ変更を必要に応じて行うことができる。
【0049】
第1解析対象データの第1目的変数データと上記第1予測値との差により第1予測誤差値を求め、第2解析対象データの第2目的変数データと上記第2予測値との差により第2予測誤差値を求める(S24)。第1予測誤差値に第1重要度を掛けて第1伸長誤差値を求め、第2予測誤差値に第2重要度を掛けて第2伸長誤差値を求める(S25)。第1伸長誤差値から第1単位ブレ距離を算出し、第2伸長誤差値から第2単位ブレ距離を算出する(S26)。ここに、ブレ距離では、ユークリッド距離、マハラノビス距離などを用いることができる。
【0050】
第1単位ブレ距離の平均と偏差から第1偏差値を求め、第2単位ブレ距離の平均と偏差から第2偏差値を求める(S27)。第1単位ブレ距離に関する分布の標準偏差をσAとしたとき第1偏差値が例えば3σA以上であり、且つ、第2単位ブレ距離に関する分布の標準偏差をσBとしたとき第2偏差値が例えば3σB以上である測定対象データをbx=1、それ以外の測定対象データをbx=0とする(S28)。このbx=1、bx=0は、前述の基礎情報とすることができる。時系列で取得する測定対象データ(この測定対象データは、
図5において、いずれか1つの「ステップ」といずれか1つの「センサ」によって特定されるデータである。)について基礎情報がbx=1であることが所定回連続したときに状態変動有りと判定する(S29)。
【0051】
ステップS27以降の処理及び判定は一例に過ぎず、3σB以上は、σB以上、2σB以上、4σB以上、・・・とすることもできる。また、所定回連続しなくとも、発生頻度が所定割合以上に多くなることを条件とすることもできる。
【0052】
以上のように本実施形態は、実際に取得元から取得した第1解析対象データに基づき得られる第1予測誤差値だけでなく、第2機械学習用データ作成手段32が作成した第2解析対象データに基づき得られる第2予測誤差値を得ているので、取得元の数が多いときに匹敵するデータによって状態変動検出補助を行うことになり状態変動検出の確率が上がることが期待されるものである。
【0053】
本発明に係る複数の実施形態を説明したが、これらの実施形態は例として提示するものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0054】
1A…状態変動検出補助装置、1B…状態変動検出装置、10…CPU、11…主メモリ、12…バス、13…外部記憶インタフェース、14…入力インタフェース、15…表示インタフェース、16…データ入力インタフェース、22…マウス、23…外部記憶装置、24…入力装置、25…表示装置、26…センサ、30A、30B…予測モデル、31…予測モデル作成手段、32…第2機械学習用データ作成手段、33…第1予測値取得手段、34…第2予測値取得手段、35…予測誤差値算出手段、36…出力制御手段、37…誤差値伸長手段、38…ダミー数値変更手段、41…状態変動判定手段。