(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-22
(45)【発行日】2022-08-30
(54)【発明の名称】要因分析装置および要因分析方法
(51)【国際特許分類】
G05B 23/02 20060101AFI20220823BHJP
【FI】
G05B23/02 302Y
(21)【出願番号】P 2020101653
(22)【出願日】2020-06-11
【審査請求日】2020-06-11
(73)【特許権者】
【識別番号】390033042
【氏名又は名称】ダイハツディーゼル株式会社
(74)【代理人】
【識別番号】100106518
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100183232
【氏名又は名称】山崎 敏行
(72)【発明者】
【氏名】谷本 寿人
【審査官】堀内 亮吾
(56)【参考文献】
【文献】特開2018-116545(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 23/02
(57)【特許請求の範囲】
【請求項1】
n次元データ(nは2以上の整数)で表される特定の第1測定点の集合に基づいて、新たに入力されるn次元データで表される第2測定点の異常度を算出する算出部と、
上記算出部により算出された上記第2測定点の異常度が所定のしきい値以上か否かを判定する判定部と、
n次元空間において、上記判定部により上記異常度が上記所定のしきい値以上と判定された上記第2測定点のベクトルと、上記第1測定点の集合における上記第2測定点からk‐近傍の
任意の第1測定点のベクトルとの差分ベクトルに基づいて、上記差分ベクトルの各要素のうち最も大きな値を示す要素を当該測定点の異常の要因とする分析部と
を備え、
上記特定の第1測定点の集合は、予め得られた正常なn次元データ群であり、
上記算出部は、上記第2測定点を標本pとし、上記第1測定点の集合における上記第2測定点からk‐近傍の第1測定点を標本0とするとき、以下の(式1)により算出されたLOF
k(p)を上記異常度とすることを特徴とする要因分析装置。
【数1】
ただし、k : 2以上の整数
│N
k(p)│ : 標本pのk‐近傍の集合N
k(p)内の標本の数
lrd
k(0) : 標本0の局所到達可能性密度
lrd
k(p) : 標本pの局所到達可能性密度
reach‐dist
k(p,0) : 標本pの標本0からの到達可能性距離
ここで、標本0のk番目の近傍までの距離(k‐近傍距離)をk‐distance(0)、標本pと標本0との間の距離をd(p,0)とするとき、reach‐dist
k(p,0)は、次式により算出され、
【数2】
次式により標本pの全ての標本0からの到達可能性距離を算出してlrd
k(p)を得ると共に、
【数3】
標本0’∈N
k(p)\{0}について、reach‐dist
k(0,0’)を次式により算出し、
【数4】
さらに、次式により標本0の全ての標本0’からの到達可能性距離を算出してlrd
k(0)を得る。
【数5】
【請求項2】
請求項1に記載された要因分析装置において、
予め特定のn次元データを学習データとして用いて学習することにより上記n次元データで表される特定の第1測定点の集合を得る機械学習部を備えることを特徴とする要因分析装置。
【請求項3】
n次元データ(nは2以上の整数)で表される特定の第1測定点の集合に基づいて、新たに入力されるn次元データで表される第2測定点の異常度を算出部により算出する第1ステップと、
上記第1ステップで上記算出部により算出された上記第2測定点の異常度が所定のしきい値以上か否かを判定部により判定する第2ステップと、
n次元空間において、上記第2ステップで上記判定部により上記異常度が上記所定のしきい値以上と判定された上記第2測定点のベクトルと、上記第1測定点の集合における上記第2測定点からk‐近傍の
任意の第1測定点のベクトルとの差分ベクトルに基づいて、分析部により上記差分ベクトルの各要素のうち最も大きな値を示す要素を当該測定点の異常の要因とする第3ステップと
を有し、
上記特定の第1測定点の集合は、予め得られた正常なn次元データ群であり、
上記算出部は、上記第2測定点を標本pとし、上記第1測定点の集合における上記第2測定点からk‐近傍の第1測定点を標本0とするとき、以下の(式1)により算出されたLOF
k(p)を上記異常度とすることを特徴とする要因分析方法。
【数6】
ただし、k : 2以上の整数
│N
k(p)│ : 標本pのk‐近傍の集合N
k(p)内の標本の数
lrd
k(0) : 標本0の局所到達可能性密度
lrd
k(p) : 標本pの局所到達可能性密度
reach‐dist
k(p,0) : 標本pの標本0からの到達可能性距離
ここで、標本0のk番目の近傍までの距離(k‐近傍距離)をk‐distance(0)、標本pと標本0との間の距離をd(p,0)とするとき、reach‐dist
k(p,0)は、次式により算出され、
【数7】
次式により全ての標本pの標本0からの到達可能性距離を算出してlrd
k(p)を得ると共に、
【数8】
標本0’∈N
k(0)\{0}について、reach‐dist
k(0,0’)を次式により算出し、
【数9】
さらに、次式により全ての標本0の標本0’からの到達可能性距離を算出してlrd
k(0)を得る。
【数10】
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、要因分析装置および要因分析方法に関する。
【背景技術】
【0002】
従来、外れ値検出手法としてLOF(Local Outlier Factor)を用いたデータ識別部を備えた情報処理装置がある(例えば、特開2016-85704号公報(特許文献1)参照)。
【0003】
上記情報処理装置では、データ識別部によって、学習データに基づき予め学習されたモデル等に基づき、識別対象データが異常値データであるか否かを判定する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記情報処理装置では、外れ値の度合いを数値として算出できるが、測定データのどの項目が要因で外れ値の度合いが上昇しているかを把握することができない。例えば、外れ値の度合いを異常度として異常検知を行うシステムでは、異常な状態であるかどうかは知ることはできても、測定データのどの項目が起因で異常を発生しているかは把握できない。
【0006】
そこで、この発明の課題は、異常を示した測定点とその測定点の異常の要因を特定できる要因分析装置および要因分析方法を提供することにある。
【課題を解決するための手段】
【0007】
この発明の要因分析装置は、
n次元データ(nは2以上の整数)で表される特定の第1測定点の集合に基づいて、新たに入力されるn次元データで表される第2測定点の異常度を算出する算出部と、
上記算出部により算出された上記第2測定点の異常度が所定のしきい値以上か否かを判定する判定部と、
n次元空間において、上記判定部により上記異常度が上記所定のしきい値以上と判定された上記第2測定点のベクトルと、上記第1測定点の集合における上記第2測定点からk‐近傍の第1測定点のベクトルとの差分ベクトルに基づいて、上記差分ベクトルの各要素のうち最も大きな値を示す要素を当該測定点の異常の要因とする分析部と
を備え、
上記算出部は、上記第2測定点を標本pとし、上記第1測定点の集合における上記第2測定点からk‐近傍の第1測定点を標本0とするとき、以下の(式1)により算出されたLOF
k(p)を上記異常度とすることを特徴とする。
【数1】
ただし、k : 2以上の整数
│N
k(p)│ : 標本pのk‐近傍の集合N
k(p)内の標本の数
lrd
k(0) : 標本0の局所到達可能性密度
lrd
k(p) : 標本pの局所到達可能性密度
reach‐dist
k(p,0) : 標本pの標本0からの到達可能性距離
ここで、標本0のk番目の近傍までの距離(k‐近傍距離)をk‐distance(0)、標本pと標本0との間の距離をd(p,0)とするとき、reach‐dist
k(p,0)は、次式により算出され、
【数2】
次式により標本pの全ての標本0からの到達可能性距離を算出してlrd
k(p)を得ると共に、
【数3】
標本0’∈N
k(p)\{0}について、reach‐dist
k(0,0’)を次式により算出し、
【数4】
さらに、次式により標本0の全ての標本0’からの到達可能性距離を算出してlrd
k(0)を得る。
【数5】
【0008】
上記構成によれば、例えば、機器の異常検知として適用した場合、通常のLOF(local outlier factor:局所外れ値因子法)で異常を検知し、上述の要因分析で異常を示した測定点を特定することができると共に、機器の異常箇所を特定でき、早期復旧に寄与することができる。
【0009】
また、一実施形態の要因分析装置では、
予め特定のn次元データを学習データとして用いて学習することにより上記n次元データで表される特定の第1測定点の集合を得る機械学習部を備える。
【0010】
上記実施形態によれば、予め特定のn次元データを学習データとして用いて機械学習部により学習するので、常に適切なn次元データで表される特定の第1測定点の集合を得ることができる。
【0011】
また、この発明の要因分析方法は、
n次元データ(nは2以上の整数)で表される特定の第1測定点の集合に基づいて、新たに入力されるn次元データで表される第2測定点の異常度を算出部により算出する第1ステップと、
上記第1ステップで上記算出部により算出された上記第2測定点の異常度が所定のしきい値以上か否かを判定部により判定する第2ステップと、
n次元空間において、上記第2ステップで上記判定部により上記異常度が上記所定のしきい値以上と判定された上記第2測定点のベクトルと、上記第1測定点の集合における上記第2測定点からk‐近傍の第1測定点のベクトルとの差分ベクトルに基づいて、分析部により上記差分ベクトルの各要素のうち最も大きな値を示す要素を当該測定点の異常の要因とする第3ステップと
を有し、
上記算出部は、上記第2測定点を標本pとし、上記第1測定点の集合における上記第2測定点からk‐近傍の第1測定点を標本0とするとき、以下の(式1)により算出されたLOF
k(p)を上記異常度とすることを特徴とする。
【数6】
ただし、k : 2以上の整数
│N
k(p)│ : 標本pのk‐近傍の集合N
k(p)内の標本の数
lrd
k(0) : 標本0の局所到達可能性密度
lrd
k(p) : 標本pの局所到達可能性密度
reach‐dist
k(p,0) : 標本pの標本0からの到達可能性距離
ここで、標本0のk番目の近傍までの距離(k‐近傍距離)をk‐distance(0)、標本pと標本0との間の距離をd(p,0)とするとき、reach‐dist
k(p,0)は、次式により算出され、
【数7】
次式により全ての標本pの標本0からの到達可能性距離を算出してlrd
k(p)を得ると共に、
【数8】
標本0’∈N
k(0)\{0}について、reach‐dist
k(0,0’)を次式により算出し、
【数9】
さらに、次式により全ての標本0の標本0’からの到達可能性距離を算出してlrd
k(0)を得る。
【数10】
【0012】
上記構成によれば、例えば、機器の異常検知として適用した場合、通常のLOFで異常を検知し、上述の要因分析で異常を示した測定点を特定することができると共に、機器の異常箇所を特定でき、早期復旧に寄与することができる。
【発明の効果】
【0013】
以上より明らかなように、この発明によれば、異常を示した測定点とその測定点の異常の要因を特定できる要因分析装置および要因分析方法を実現することができる。
【図面の簡単な説明】
【0014】
【
図1】この発明の実施の一形態の要因分析装置の構成を示すブロック図である。
【
図2】n次元空間における正常運転時のn次元データ群(第1測定点の集合)と新たな第2測定点の運転データ(n次元データ)としての標本pを説明する図である。
【
図3】n次元空間における標本pの標本0からの到達可能性距離を説明する図である。
【
図4】n次元空間における差分ベクトルを説明する図である。
【
図5】上記要因分析装置の動作を説明するフローチャートである。
【発明を実施するための形態】
【0015】
以下、この発明の要因分析装置および要因分析方法を図示の実施の形態により詳細に説明する。なお、図面において、同一の参照番号は、同一部分または相当部分を表わすものである。
【0016】
図1は、この発明の実施の一形態の要因分析装置10のブロック図である。要因分析装置10は、一例として発電機用エンジンの異常時の要因を分析する。
【0017】
この要因分析装置10は、
図1に示すように、n次元データで表される特定の第1測定点の集合を得る学習モデル部10aと、学習モデル部10aにより学習された特定の第1測定点の集合に基づいて、新たに入力されるn次元データの第2測定点の異常度を算出する異常度算出部10bと、異常度算出部10bにより算出された第2測定点の異常度を判定する異常度判定部10cと、第2測定点の異常の要因とする要因分析部10dとを有する。
【0018】
学習モデル部10aは機械学習部の一例であり、異常度算出部10bは算出部の一例であり、異常度判定部10cは判定部の一例であり、要因分析部10dは分析部の一例である。
【0019】
<異常度の算出>
この要因分析装置10では、非特許文献1(Markus M. Breunig, Hans-Peter Kriegel, Raymond T. Ng and Jorg Sander, "LOF: Identifying Density-Based Local Outliers," in Proc. ACM SIGMOD, 2000, pp. 93-104.)に示されたLOF(local outlier factor:局所外れ値因子法)により異常度を算出する。この実施の形態では、例として異常度を算出する近傍の標本の数kを3とする。
【0020】
図2は、n次元空間における正常運転時のn次元データ群(第1測定点の集合)と、新たな第2測定点の運転データ(n次元データ)である標本pとを説明する図である。
【0021】
図2に示す正常なn次元データ群は、要因分析装置10の学習モデル部10aによって、予め正常運転時の運転データを学習データとして用いて学習することにより正常運転時のn次元データ群(学習モデル)が得られる。ここで、新たな第2測定点である標本pの運転データ(n次元データ)が異常度算出部10bに入力されると、異常度算出部10bにおいて標本pのk-近傍の集合N
k(p)が得られる。この集合N
k(p)に標本0が属する(標本0∈N
k(p))。
【0022】
ここで、標本pのk-近傍とは、正常運転時のn次元データ群(第1測定点の集合)のうち、標本pに最も近い1番目からk番目までの運転データ(n次元データ)である。
【0023】
次に、
図3に従ってn次元空間における標本pの標本0からの到達可能性距離について説明する。
【0024】
図3に示すように、集合N
k(p)内の任意の標本0において、標本0のk番目の近傍までの距離(k‐近傍距離)をk‐distance(0)、標本pと標本0との間の距離をd(p,0)とする。このとき、標本pの標本0からの到達可能性距離reach‐dist
k(p,0)は、
【数11】
により算出される。
【0025】
そこで、
【数12】
により、標本pの全ての標本0からの到達可能性距離を算出して、標本pの局所到達可能性密度lrd
k(p)を得る。
【0026】
さらに、標本0’∈N
k(p)\{0}について、標本0の標本0’からの到達可能性距離reach‐dist
k(0,0’)が、
【数13】
により算出される。
【0027】
次に、
【数14】
により、標本0の全ての標本0’からの到達可能性距離を算出して、標本0の局所到達可能性密度lrd
k(0)を得る。
【0028】
そして、以下の(式1)により異常度LOF
k(p)を算出する。
【数15】
ただし、k : 2以上の整数(この実施の形態ではk=3)
│N
k(p)│ : 標本pのk‐近傍の集合N
k(p)内の標本の数
【0029】
このように、異常度算出部10bは、n次元データで表される正常運転時の第1測定点の集合(正常運転時のn次元データ群)に基づいて、新たに入力される第2測定点の運転データ(n次元データ)としての標本pの異常度LOFk(p)を算出する。
【0030】
上記標本pの異常度LOFk(p)が1に近い値であるとき、標本pはその近傍と同程度であって外れ値ではなく、異常度LOFk(p)<1であるとき、標本pは密度が高い領域に位置する。そして、異常度LOFk(p)>1であるとき、外れ値である。
【0031】
<異常度の判定>
異常度判定部10cは、異常度算出部10bにより算出された標本pの異常度LOFk(p)が所定のしきい値a以上か否かを判定する。ここで、しきい値aは1以上の値であって、故障時のデータに基づいてしきい値を設定する(例えば1.5)。
【0032】
<要因分析>
次に、要因分析部10dは、n次元空間において、標本pの異常度LOF
k(p)が所定のしきい値a以上と判定された標本pのベクトルと、正常運転時のn次元データ群(第1測定点の集合)において標本pからk‐近傍のうちの任意の第1測定点である標本0のベクトルとの差分ベクトル(
図4に示す)に基づいて、当該差分ベクトルの各要素のうち最も大きな値を示す要素を標本pの異常の要因とする。
【0033】
上記構成の要因分析装置10によれば、例えば、n種類の計測データのうち、入力される第2測定点の運転データのm番目(mはn以下の整数)に異常が起こった際には、差分ベクトルの要素のうちのm番目の成分に比較的大きな値が観測されることが期待される。
【0034】
また、n種類の計測データのうち、複数種類の計測データに大きな値(つまりは外れ値)が観測された場合、差分ベクトルの方向に故障の原因特定に重要な情報が含まれる。例えば、差分ベクトルで、排ガス温度に該当する成分と、エンジンの冷却水温度に該当する成分とに大きな値が観測されたことがわかれば、インタークーラーの冷却効率が低下しているのが原因で排気温度が高くなっていることがわかる。
【0035】
なお、差分ベクトルの方向と不具合の内容を、予め機械学習やドメイン知識で対応付けするようにしてもよい。この場合、自動で計測点の異常からエンジンの故障箇所を特定する診断機能を実現することができる。
【0036】
図5は、上記要因分析装置10の動作を説明するフローチャートである。
【0037】
まず、処理がスタートすると、ステップS1で第2測定点の運転データ(n次元データ)の入力する。
【0038】
次に、ステップS2に進み、学習モデル部10aによって、予め学習により得られた正常運転時のn次元データ群(第1測定点の集合)を学習モデルとして用いて、第2測定点の運転データ(n次元データ)の異常度を異常度算出部10bにより算出する。
【0039】
次に、ステップS3に進み、異常度算出部10bにより算出された異常度が所定のしきい値a以上か否かを異常度判定部10cにより判定する。そして、上記異常度が所定のしきい値a以上のとき、ステップS4に進む一方、異常度が所定のしきい値a未満のとき、ステップS1に戻り、ステップS1~S3を繰り返す。
【0040】
ステップS4では、第2測定点の運転データ(n次元データ)について要因分析部10dにより異常の要因を分析する。
【0041】
次に、ステップS5に進み、分析結果を出力した後、ステップS1に戻り、ステップS1~S5を繰り返す。
【0042】
上記構成の要因分析装置10および要因分析方法によれば、例えば、機器の異常検知として適用した場合、通常のLOF(local outlier factor:局所外れ値因子法)で異常を検知し、上述の要因分析で異常を示した測定点を特定することができると共に、機器の異常箇所を特定でき、早期復旧に寄与することができる。
【0043】
また、予め特定のn次元データを学習データとして用いて機械学習部により学習するので、常に適切なn次元データで表される特定の第1測定点の集合を得ることができる。
【0044】
上記実施の形態では、発電機用エンジンの異常時の要因を分析する要因分析装置10について説明したが、他の構成の装置の異常時の要因を分析する要因分析装置にこの発明を適用してもよい。
【0045】
この発明の具体的な実施の形態について説明したが、この発明は上記実施の形態に限定されるものではなく、この発明の範囲内で種々変更して実施することができる。
【符号の説明】
【0046】
10…要因分析装置
10a…学習モデル部
10b…異常度算出部
10c…判定異常度判定部
10d…要因分析部