(58)【調査した分野】(Int.Cl.,DB名)
前記特徴因子抽出手段は、前記正常データの主成分分析を行い、P(Pは自然数)<Mを満たすP個の主成分を抽出し、前記独立成分を前記主成分の重み付き線形和によって表現する
ことを特徴とする請求項3に記載の異常診断装置。
前記異常要因解析手段は、前記特徴因子ごとの前記評価データと前記再構成データとの差分に基づいて、前記特徴因子ごとの異常に対する寄与度を算出し、前記寄与度が1番目に大きい系列と2番目に大きい系列の組を高寄与度系列組として抽出し、前記評価データの全サンプルにおける前記高寄与度系列組の出現回数を集計し、出現回数が多い順に前記高寄与度系列組を出力する
ことを特徴とする請求項1乃至請求項6のいずれかに記載の異常診断装置。
前記異常要因解析手段は、前記特徴因子ごとの前記評価データと前記再構成データとの差分に基づいて、前記特徴因子ごとの異常に対する寄与度を算出し、前記寄与度が1番目に大きい系列と2番目に大きい系列の組を高寄与度系列組として抽出し、前記高寄与度系列組の再構成誤差の合計が最大となる前記評価データのサンプルを出力する
ことを特徴とする請求項1乃至請求項6のいずれかに記載の異常診断装置。
【背景技術】
【0002】
近年、車両に搭載される車載システムは、大規模化、複雑化の傾向にある。車載システムでは、複数のECU(「Electronic Control Unit」の略)が、CAN(「Controller
Area Network」の略)等の車載ネットワークを介して互いにデータの送受信を行い、協調して動作を行っている。このような車載システムでは、車両の動作データ(以下、「車両データ」と省略する。)を時系列データとして保存しておき、車両の異常診断に利用している。
【0003】
システムの異常診断を行う技術の一例として、例えば、特許文献1には、統計的品質管理手法を用いた製造プロセスの監視装置が開示されている。特許文献1に記載の監視装置によれば、製品のバッチ式製造装置から入力された時系列の装置ログデータをウェーブレット変換し、各周波数成分が正常であるか異常であるかを判定する。そして、正常と判定された周波数成分のウェーブレット係数の値を0とすると共に異常と判定された周波数成分のウェーブレット係数の値はそのままとした一組の採用ウェーブレット係数を生成する。次に、この一組の採用ウェーブレット係数を逆ウェーブレット変換して再生波形データを求め、この再生波形データを主成分分析してホッテリングT2と残差Qの2つの統計量を求め、この2つの統計量に上限閾値を設定し、その上限閾値を超えているかいないかによって、そのバッチ式製造プロセスが正常であるか異常であるかを判定する。
【0004】
また、例えば、特許文献2には、複数の監視対象機器からの物理量を受けての異常の有無を監視対象機器毎に診断する異常診断装置が開示されている。特許文献2に記載の異常診断装置によれば、3つのセンサと、3つのセンサのそれぞれからの信号を、前処理装置を介して信号として間接的に受ける独立成分分析処理装置とを備える。独立成分分析処理装置は、独立成分分析を用いて信号から空間的、時間的および周波数的に独立な成分を分離して抽出した後、この分離して抽出した信号をそれぞれ異常判定装置に出力する。異常判定装置は、それぞれの信号に基づいて機械の異常の有無の診断を行う。
【0005】
また、例えば、特許文献3には、製品の製造における品質への影響要因を解析する方法が開示されている。特許文献3に記載の方法によれば、製品の製造における種々の条件を示す互いに相関があるN種類の条件データを、互いに無相関なN>PであるP種類の成分へ変換し、P種類の成分の夫々の品質への影響を示すP個の影響指標を多変量解析により計算し、P個の影響指標を、N種類の条件データの夫々の品質への影響を示すN個の影響データへ変換する。
【0006】
また、例えば、特許文献4には、空調機、発電機などの複数の設備を遠隔監視する遠隔監視システムが開示されている。特許文献4に記載の遠隔監視システムによれば、設備から送信される複数のセンサで検知された実測センサ値を随時取得し、設備が正常運転をしている際に複数のセンサで検知された実測センサ値に基づいて、複数のセンサで検知される複数の実測センサ値間の相関関係を主成分分析によって求め、この相関関係を予測モデルとして格納し、複数のセンサの実測センサ値を取得した際に実測センサ値と予測モデルとから複数のセンサの予測センサ値を求め、実測センサ値と予測センサ値との差異に基づいて設備の故障兆候を検知する。
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1〜4の技術を車載システムの異常診断に適用する場合、以下に示す技術的な課題が存在する。
【0009】
車両データでは通常の時間領域におけるデータの分布に基づいた異常診断のニーズが存在するが、特許文献1に記載の技術は周波数領域を対象にしているため、このニーズに応えることができない。また、車両データは主成分分析では捉えきれない特徴を内包している可能性が高く、特許文献1に記載の技術のように、主成分分析のみに基づく車両データの監視では、異常の検出能力及び要因解析能力の性能が不十分である。
【0010】
特許文献2に記載の技術では、独立成分分析によって抽出される特徴量を用いて異常検出を行うため、異常検出に用いる特徴量と元のデータ系列との関係が複雑であり、要因解析を行うことが難しい。また、特許文献2に記載の技術では、元のデータ系列の数と比較して異常検出に用いる特徴量の数が多くないため、異常の検出能力の性能が不十分である。
【0011】
特許文献3に記載の技術では、異常の影響指標を計算する際、教師データとして正常データ及び異常データを与えているが、車両データにおいては異常データが得られることは稀であり、車載システムの異常診断に適用することが困難である。また、特許文献2に記載の技術と同様、元のデータ系列の数と比較して異常の影響指標の数が多くないため、異常の検出能力の性能が不十分である。
【0012】
特許文献4に記載の技術では、主成分分析で得られるモデルとの差異に基づき故障兆候を検知しているが、主成分分析のみによって得られるモデルとの差異の傾向は、各異常現象に基づいて計算されるものではないため、無関係のノイズが入りやすく、異常の検出能力の性能が不十分である。また、特許文献1に記載の技術と同様、主成分分析のみに基づく車両データの監視では、異常の検出能力及び要因解析能力の性能が不十分である。
【0013】
本発明は、前述した問題点に鑑みてなされたものであり、その目的とすることは、車載システムの異常診断において、異常の検出能力及び要因解析能力が十分な性能を持つ異常診断装置等を提供することである。
【課題を解決するための手段】
【0014】
前述した目的を達成するための第1の発明は、多系列の時系列データである車両データに基づいて車両の異常を診断する異常診断装置であって、前記車両データのうち、正常であることが既知の正常データを取得する正常データ取得手段と、前記正常データから複数の特徴因子を抽出する特徴因子抽出手段と、前記特徴因子のデータ分布を学習し、監視モデルを生成する
監視モデル生成手段と、前記車両データのうち、異常診断の評価対象となる評価データを取得する評価データ取得手段と、前記評価データから前記特徴因子を抽出し、前記監視モデルに基づいて異常判定を行う異常判定手段と、前記異常判定手段によって正常と判断された前記特徴因子のみによって、前記特徴因子の空間のデータを前記車両データと同一の空間に逆変換し、再構成データを生成する再構成データ生成手段と、前記評価データと前記再構成データとの差分に基づいて異常の要因解析を行う異常要因解析手段と、を備えることを特徴とする異常診断装置である。
【0015】
第1の発明によって、車載システムの異常診断において、異常の検出能力及び要因解析能力が十分な性能を持つ異常診断装置を提供することができる。特に、第1の発明によれば、異常に直接寄与したデータ系列を明らかにできる。また、各データサンプルが正常か否かについてはっきりと判定できないものに対してでも、要因解析により詳細な解析を行い、精密な異常判定の支援を行うことができる。
【0016】
第1の発明において、前記車両データの系列数をM(Mは自然数)とするとき、前記特徴因子抽出手段は、K(Kは自然数)>Mを満たすK個の前記特徴因子を抽出することが望ましい。これによって、たくさんの状態を持つ複雑な入力系列に対して、多くの特徴因子で正確に表現することができる。例えば、前記特徴因子抽出手段は、前記正常データの過完備な独立成分分析を行い、K個の独立成分を抽出し、前記特徴因子とする。また、例えば、前記特徴因子抽出手段は、前記正常データの主成分分析を行い、P(Pは自然数)<Mを満たすP個の主成分を抽出し、前記独立成分を前記主成分の重み付き線形和によって表現する。
【0017】
また、第1の発明における前記監視モデル生成手段は、前記監視モデルに基づいて前記特徴因子ごとの判定閾値を設定し、前記異常判定手段は、前記監視モデルに基づいて前記評価データにおける前記特徴因子の尤度を算出し、前記特徴因子の尤度が前記判定閾値より小さい前記特徴因子の数を異常度とし、前記異常度に基づいて異常判定を行うことが望ましい。これによって、異常な振る舞いをしている特徴因子の数を異常判定の基準とすることができ、ノイズに強い異常検出が可能となる。例えば、前記監視モデル生成手段は、カーネル密度推定によって前記特徴因子のデータ分布を学習する。
【0018】
また、例えば、第1の発明における前記異常要因解析手段は、前記特徴因子ごとの前記評価データと前記再構成データとの差分に基づいて、前記特徴因子ごとの異常に対する寄与度を算出し、前記寄与度が1番目に大きい系列と2番目に大きい系列の組を高寄与度系列組として抽出し、前記評価データの全サンプルにおける前記高寄与度系列組の出現回数を集計し、出現回数が多い順に前記高寄与度系列組を出力する。これによって、全体的な異常を捉えることができる。
【0019】
また、例えば、第1の発明における前記異常要因解析手段は、前記特徴因子ごとの前記評価データと前記再構成データとの差分に基づいて、前記特徴因子ごとの異常に対する寄与度を算出し、前記寄与度が1番目に大きい系列と2番目に大きい系列の組を高寄与度系列組として抽出し、前記高寄与度系列組の再構成誤差の合計が最大となる前記評価データのサンプルを出力する。これによって、突発的な異常を捉えることができる。
【0020】
第2の発明は、コンピュータを、多系列の時系列データである車両データに基づいて車両の異常を診断する異常診断装置として機能させるためのプログラムであって、前記車両データのうち、正常であることが既知の正常データを取得する正常データ取得手段と、前記正常データから複数の特徴因子を抽出する特徴因子抽出手段と、前記特徴因子のデータ分布を学習し、監視モデルを生成する
監視モデル生成手段と、前記車両データのうち、異常診断の評価対象となる評価データを取得する評価データ取得手段と、前記評価データから前記特徴因子を抽出し、前記監視モデルに基づいて異常判定を行う異常判定手段と、前記異常判定手段によって異常と判断された前記特徴因子の数を異常度として計算する異常度計算手段と、前記異常判定手段によって正常と判断された前記特徴因子のみによって、前記特徴因子の空間のデータを前記車両データと同一の空間に逆変換し、再構成データを生成する再構成データ生成手段と、前記評価データと前記再構成データとの差分に基づいて異常の要因解析を行う異常要因解析手段と、を備える異常診断装置として機能させるためのプログラムである。第2の発明をコンピュータにインストールすることによって、第1の発明の異常診断装置を得ることができる。
【発明の効果】
【0021】
本発明により、車載システムの異常診断において、異常の検出能力及び要因解析能力が十分な性能を持つ異常診断装置等を提供することができる。
【発明を実施するための形態】
【0023】
以下図面に基づいて、本発明の実施形態を詳細に説明する。
図1は、異常診断システムの概要を示す図である。
図1に示すように、異常診断システム1は、異常診断装置2と車両3とから構成される。車両3には、異常診断対象となる車載電子制御システム4が搭載される。車載電子制御システム4には、データロガー装置5が設けられる。
【0024】
車載電子制御システム4は、複数の実行パスが並行して動作する制御システムである。車載電子制御システム4では、複数のECUが並行動作したり、単一のECUが複数の変数の値を同時に出力したりする。
【0025】
データロガー装置5は、車両3の動作データ(車両データ)を記録する。データロガー装置5は、無線又は有線の通信手段によって、車両データを異常診断装置2に送信する。
【0026】
異常診断装置2は、データロガー装置5から送信される車両データに基づいて、車載電子制御システム4の異常を診断する。異常診断装置2は、後述するように、正常データ学習処理(
図3参照)と評価データ診断処理(
図4参照)を実行する。
【0027】
尚、
図1では、単一の車両3のみを図示したが、異常診断システム1には、複数の車両3を含めても良い。例えば、異常診断装置2は、同一の制御プログラムに従う車載電子制御システム4を同一の評価対象とし、複数のデータロガー装置5から複数の車両データを受信しても良い。
【0028】
また、
図1では、単一の異常診断装置2のみを図示したが、正常データ学習処理と評価データ診断処理を別々のコンピュータが実行しても良い。すなわち、異常診断装置2は、複数のコンピュータから構成されても良い。
【0029】
図2は、異常診断装置のハードウエア構成図である。尚、
図2のハードウエア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
図2に示すように、異常診断装置2は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等が、バス18を介して接続される。
【0030】
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等によって構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、異常診断装置2が行う後述する処理を実現する。ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
【0031】
記憶部12は、HDD(Hard Disk Drive)等であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(Operating System)等が格納される。プログラムに関しては、OSに相当する制御プログラムや、後述する処理をコンピュータに実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
【0032】
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。通信制御部14は、通信制御装置、通信ポート等を有し、コンピュータとネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他のコンピュータ間との通信制御を行う。ネットワークは、有線、無線を問わない。
【0033】
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、コンピュータに対して、操作指示、動作指示、データ入力等を行うことができる。表示部16は、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携してコンピュータのビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。尚、入力部15及び表示部16は、タッチパネルディスプレイのように、一体となっていても良い。
【0034】
周辺機器I/F(Interface)部17は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部17を介してコンピュータは周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USB(Universal Serial Bus)やIEEE1394やRS−232C等によって構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
【0035】
図3は、正常データ学習処理の流れを示すフローチャートである。
図3に示すように、異常診断装置2の制御部11は、データロガー装置
5から車両データを入力し、車両データのうち、正常であることが既知の正常データを取得する(ステップS1)。
【0036】
車両データは、多系列(「多変数」や「多変量」とも言う。)の時系列データである。以下、車両データの系列数をM(Mは自然数)とする。正常データは、例えば、車両3が市場に投入される前に、テストドライバによる車両3の運転において、正常であると判断された車両データである。
【0037】
次に、制御部11は、ステップS1において取得された正常データを、平均0、分散1となるように各系列を標準化する(ステップS2)。制御部11は、このときに得られる標準化された正常データとともに、標準化に用いた正常データの平均および標準偏差の値も記憶部12に記憶する。
【0038】
次に、制御部11は、ステップS2において標準化された正常データの主成分分析を行う(ステップS3)。主成分分析とは、直交回転を用いて、変数間に相関がある元の観測値を、相関の無い主成分と呼ばれる値に変換するための手法である。制御部11は、このときに得られる主成分への変換モデル(変換の表現行列)を主成分分析モデルとして記憶部12に記憶する。
【0039】
主成分分析によって抽出される主成分は、不要なノイズが除去された主要な相関関係を代表しており、互いに無相関である。主成分の数をP(Pは自然数)とすると、制御部11は、例えば、相関行列の固有値の値や累積寄与率などに基づく抽出基準によって、P<Mを満たすP個の主成分を抽出する。
【0040】
次に、制御部11は、ステップS3において抽出された主成分を用いて、過完備独立成分分析を行う(ステップS4)。ここで抽出される独立成分が、正常データの特徴を示す特徴因子である。制御部11は、このときに得られる独立成分への変換モデル(変換の表現行列)を過完備独立成分分析モデルとして記憶部12に記憶する。
【0041】
一般に、2つの成分が互いに独立とは、両者に相関関係がない、すなわち、片方の値が変動した際、もう片方がある決まった法則に従って連動しないことを意味する。この定義を利用し、本実施の形態における独立成分分析では、抽出すべきK(Kは自然数)個の系列の独立成分を、P個の系列の主成分の線形変換(重み付き線形和)によって表現する。
【0042】
但し、実際の問題では、独立の定義を完全に満たす独立成分を抽出することは困難である。そこで、制御部11は、最適化計算を行い、可能な限り独立の定義を満たすP個の系列の主成分の線形変換を反復計算によって算出する。反復計算による探索的な手法であるため、最終的に得られる独立成分は、厳密には独立にならないことがほとんどである。従って、本実施の形態における独立成分分析では、制御部11は、近似的に独立に近い成分を独立成分として算出している。
【0043】
また、過完備とは、通常の独立成分分析と異なり、独立成分の数が元の系列数よりも多い、すなわち、K>Pを満たすことを意味する。特に、本実施の形態では、K>Mを満たすK個の独立成分を抽出することが望ましい。例えば、制御部11は、車両データの時系列数(=M)が数十個に対して、独立成分の個数(=K)が数百個となるように、独立成分を抽出する。これによって、後述する独立成分に基づく監視モデルの表現力が向上し、異常の検出能力及び要因解析能力の性能が向上する。
【0044】
過完備化のメリットは、その表現能力にある。本実施の形態では、独立成分は入力系列に対する重み付き線形和として算出される。このことは、逆に言えば、入力系列が独立成分の重み付き線形和によって表されることを意味する。今、入力系列を独立成分の重み付き線形和で表すことを考えると、独立成分の数が少なければ、その表現能力に制限がかかる。特に、入力系列が複雑な関係を持つ場合に問題となる。そこで、本実施の形態では、過完備化によって多くの独立成分を抽出しておき、その表現能力を向上させる。各独立成分は、近似的な独立性の制約を課しているため、ほぼ互いに独立な情報を持つことになるので、入力系列が持つ様々な局所的情報を手分けして持つことになる。つまり、入力系列のある瞬間的な局所状態を表現する際には、その状態に対応した少ない独立成分だけを用いて表現することができるとともに、たくさんの状態を持つ複雑な入力系列に対しては、過完備化によって多くの独立成分で正確に表現することができる。
【0045】
尚、制御部11は、主成分分析及び独立成分分析とは異なる手法で特徴因子を抽出しても良いが、K>Mを満たすK個の特徴因子を抽出することが望ましい。
【0046】
次に、制御部11は、独立成分(特徴因子)のデータ分布を学習し、監視モデルを生成する(ステップS5)。制御部11は、独立成分ごとにデータ分布を学習し、独立成分(特徴因子)ごとに監視モデルを生成する。制御部11は、このときに得られる独立成分(特徴因子)ごとの監視モデルを記憶部12に記憶する。
【0047】
例えば、制御部11は、カーネル密度推定によって独立成分(特徴因子)のデータ分布を学習し、監視モデル(確率密度関数)を生成する。カーネル密度推定とは、確率変数の確率密度関数を推定する手法の一つであり、有限の標本から全体の分布を推定することができる。
【0048】
次に、制御部11は、ステップS5において生成された監視モデルを用いて、ステップS4において得られた各独立成分(特徴因子)の尤度を算出する(ステップS6)。ここで、各独立成分(特徴因子)の尤度とは、監視モデルにより各データの独立成分(特徴因子)上の確率密度を計算した値であって、データがモデルから見てどの程度尤もらしいか、適合しているかを示す値である。尤度が低い程、異常度が大きいとみなすことができる。
【0049】
次に、制御部11は、ステップS6において算出された各独立成分(特徴因子)の尤度の最小値を、独立成分(特徴因子)ごとの判定閾値として設定する(ステップS7)。
【0050】
図4は、評価データ診断処理の流れを示すフローチャートである。
図4に示すように、異常診断装置2の制御部11は、データロガー装置
5から車両データを入力し、異常診断の評価対象となる評価データを取得する(ステップS11)。評価データは、例えば、車両3が市場に投入された後、ユーザによる車両3の運転において、正常か否か不明な車両データである。
【0051】
次に、制御部11は、ステップS2における標準化に用いた正常データの平均および標準偏差の値を用いて、ステップS11において取得された評価データの各系列を標準化する(ステップS12)。
【0052】
次に、制御部11は、ステップS3において得られる主成分分析モデルを用いて、ステップS12において標準化された評価データを主成分に変換する(ステップS13)。
【0053】
次に、制御部11は、ステップS4において得られる過完備独立成分分析モデルに基づいて、ステップS13において変換された成分の線形変換を独立成分(特徴因子)として抽出する(ステップS14)。尚、正常データ学習処理において、主成分分析及び独立成分分析とは異なる手法で特徴因子を抽出した場合、制御部11は、ステップS13及びステップS14においても同様の手法で特徴因子を抽出する。
【0054】
次に、制御部11は、ステップS5において生成された監視モデルを用いて、ステップS14において得られた各独立成分(特徴因子)の尤度を算出する(ステップS15)。
【0055】
次に、制御部11は、ステップS15において算出される独立成分(特徴因子)の尤度が、ステップS7において設定される判定閾値よりも小さい独立成分(特徴因子)の数に基づいて異常判定を行う(ステップS16)。例えば、制御部11は、独立成分(特徴因子)の尤度が判定閾値よりも小さい独立成分(特徴因子)の数を異常度として表示部16に表示したり、異常度が所定の値を超えた場合に異常と判定したりする。制御部11は、評価データのサンプル単位で異常度を算出しても良いし、評価データの全サンプルについて独立成分単位で異常度を算出しても良い。
【0056】
次に、制御部11は、尤度が判定閾値以上の独立成分(特徴因子)のみを用いて、再構成データを生成する(ステップS17)。具体的には、制御部11は、主成分分析モデルの逆変換と、尤度が判定閾値以上の独立成分のみの過完備独立成分分析モデルの逆変換を用いて、独立成分(特徴因子)の空間のデータを車両データと同一の空間に逆変換し、再構成データを生成する。
【0057】
図5は、再構成データ生成処理を説明する図である。元データ(車両データ)の空間の表現行列をX(低次元)、主成分分析モデルおよび過完備独立成分分析モデルによる変換の表現行列をW、独立成分の空間の表現行列をY(高次元)とする。このとき、Y=WXが成り立つ。行列Wについては、主成分分析モデルの表現行列をA、過完備独立成分分析モデルの表現行列をBとすると、W=BAによって求められる。
【0058】
制御部11は、ステップS17において、独立成分の空間のデータYに対し、尤度が判定閾値以上の各独立成分の値を0としたデータY’を用い、元データ(車両データ)と同一の空間に再構成し(再構成の表現行列をW’とする。)、再構成データX’を生成する。このとき、X’=W’Y’が成り立つ。再構成行列W’については、過完備独立成分分析モデルの表現行列Bに対する擬似逆行列をB’、主成分分析モデルの表現行列Aに対する転置行列をA
Tとすると、W’=A
TB’と求められる。
【0059】
図4の説明に戻る。次に、制御部11は、ステップS12において標準化された評価データと、ステップS17において生成された再構成データとの差分を算出し、差分データを生成する(ステップS18)。本実施の形態では、この差分データの値が大きい順に、異常に対する寄与度(以下、「寄与度」と省略する。)が高い系列であるとみなす。そして、寄与度が高い系列ほど、異常の真の原因との関連が強いものとして解釈する。例えば、制御部11は、寄与度が高い系列のリストを表示部16に表示する。
【0060】
図6は、差分データ生成処理を説明する図である。
図6(a)は、再構成データと元データ(ステップS12において標準化された評価データ)の関係を示している。簡略化のため、元データの系列数が2、元データの空間が2次元とし、正常な独立成分で張られる空間を直線(1次元)で示している。再構成データは、正常な独立成分で張られる空間上に位置する。一方、元データは、再構成データ(正常な値)からずれた場所に位置する。
【0061】
図6(b)は、再構成誤差に対する各系列の寄与度の例を示している。
図6(b)の例では、寄与度が高い順に、5つの系列の寄与度を示している。再構成誤差は、例えば、再構成データと元データの差分の絶対値である。この場合、制御部11は、系列ごとの差分の絶対値を、全ての系列に対する差分の絶対値の合計値で割った値を、系列ごとの寄与度とする。また、再構成誤差は、再構成データと元データの差分の二乗和としても良い。この場合、制御部11は、系列ごとの差分の二乗和を、全ての系列に対する差分の二乗和の合計値で割った値を、系列ごとの寄与度とする。
【0062】
図4の説明に戻る。次に、制御部11は、異常の要因解析を行う(ステップS19)。要因解析手法は、例えば、以下の2通りが挙げられる。
【0063】
まず、第1の要因解析手法について説明する。制御部11は、評価データのサンプル毎の各系列について、ステップS18において得られる寄与度が1番目に大きい系列と2番目に大きい系列の組を「高寄与度系列組」とし、それぞれ、評価データの全サンプルにおける出現回数を集計する。そして、制御部11は、出現回数が多い順に、「高寄与度系列組」を表示部16に表示する。
【0064】
第1の要因解析手法では、評価データ全体を通して、正常な値から頻繁にずれている系列の組を抽出している。これによって、全体的な異常を捉えることができる。
【0065】
次に、第2の要因解析手法について説明する。制御部11は、評価データのサンプル毎の各系列について、ステップS18において得られる寄与度が1番目に大きい系列と2番目に大きい系列の組を「高寄与度系列組」とし、高寄与度系列組の再構成誤差の合計を算出する。再構成誤差の合計は、差分の絶対値の合計でも良いし、差分の二乗和の合計でも良い。そして、制御部11は、高寄与度系列組の再構成誤差の合計が最大のサンプル及びその高寄与度系列組を表示部16に表示する。
【0066】
第2の要因解析手法では、評価データ全体を通して、一番大きくずれているサンプル及び系列の組を抽出している。これによって、突発的な異常を捉えることができる。
【実施例】
【0067】
以下、本実施の形態の異常診断装置2による実施例を説明する。本実施例は、「通常走行」及び「緩やか走行」の2つの走行条件における車両データを用いた。また、「通常走行」を正常データ、「緩やか走行」を評価データとし、異常診断装置2が、
図3に示す正常データ学習処理及び
図4に示す評価データ診断処理を実行した。そして、学習した監視モデルによって、評価データにおける走行条件の変化をどの程度検出できるかについて解析を行った。
【0068】
一方、比較例1では、「通常走行」を正常データ、「緩やか走行」を評価データとし、主成分分析のみによる正常データ学習処理及び評価データ診断処理を実行した。また、比較例2では、「通常走行」を正常データ、「緩やか走行」を評価データとし、独立成分分析(但し、独立成分の個数K≦車両データの系列数M)のみによる正常データ学習処理及び評価データ診断処理を実行した。
【0069】
図7は、比較例1、比較例2及び実施例によって算出されたサンプル単位の全体異常度の算出結果を示す図である。全体異常度とは、独立成分ごとの異常度ではなく、全ての独立成分を加味した異常の度合を意味する。
図7に示す全体異常度は、各独立成分の尤度の積を取り、負の対数で表したもの(負の対数尤度)である。
図7(a)が比較例1、
図7(b)が比較例2、
図7(c)が実施例である。いずれも、横軸がサンプル識別番号、縦軸が全体異常度であり、正常データと評価データの区分線の左側が正常データのサンプル群、右側が評価データのサンプル群である。尚、縦軸の目盛の最大値は、それぞれ、
図7(a)が「60」、
図7(b)が「30」、
図7(c)が「12」である。
【0070】
図7(a)及び
図7(b)を参照すると、比較例1及び比較例2は、正常データと評価データの走行条件の違いが、全体異常度の値によって明確に検出されていない。本来であれば、評価データのサンプルの全体異常度が高くなるはずであるが、むしろ、評価データのサンプルよりも全体異常度が高い正常データのサンプルも散見される。
正常データに全体異常度の高いサンプルが多いということは、正常であるのに異常と判断することが多いということであり、誤検出が多いといえる。一方、評価データに全体異常度の低いサンプルが多いということは、異常であるのに正常と判断することが多いということであり、検出漏れが多いといえる。すなわち、比較例1及び比較例2では、誤検出や検出漏れが多く、異常の検出能力の性能が低いことを示している。
【0071】
一方、
図7(c)を参照すると、実施例は、正常データと評価データの走行条件の違いが、全体異常度の値によって明確に検出されている。正常データでは、全体異常度が「5」以上のサンプルがほとんど存在しないのに対し、評価データでは、全体異常度が「5」以上のサンプルが数多く存在する。これは、正常データ(「通常走行」)に基づいて学習した実施例の監視モデルによって、走行条件が異なる評価データ(「緩やか走行」)との違いが数多く検出されていることを示している。
つまり、正常データに全体異常度の高いサンプルが少ないということは、正常であるのに異常と判断することが少ないということであり、誤検出が少ないといえる。一方、評価データに全体異常度の低いサンプルが少ないということは、異常であるのに正常と判断することが少ないということであり、検出漏れが少ないといえる。すなわち、実施例によって算出された全体異常度は、誤検出や検出漏れが少なく、異常の検出能力の性能が高いことを示している。
【0072】
図8は、設定された閾値による独立成分単位での異常判定処理を説明する模式図である。横軸が各独立成分、縦軸が各独立成分の異常度(負の対数尤度)である。この例では、5つの独立成分が異常度閾値を超えていた。異常度閾値は、正常データに基づいて設定される。
図8に示すように、異常と判断されるデータでは、多くの独立成分が異常な振る舞いをしている。尚、
図8に示す異常度閾値は、全ての独立成分について同一の値となっているが、実際には独立成分ごとに異なる値となる。
【0073】
図9は、比較例1、比較例2及び実施例によって算出された異常因子数の算出結果を示す図である。異常因子とは、異常度が異常度閾値を超えた特徴因子(独立成分)のことを意味する。この場合、異常度は、特徴因子(独立成分)単位で算出される。
図9(a)が比較例1、
図9(b)が比較例2、
図9(c)が実施例である。いずれも、横軸がサンプル識別番号、縦軸が異常因子数であり、正常データと評価データの区分線の左側が正常データのサンプル群、右側が評価データのサンプル群である。尚、縦軸の目盛の最大値は、それぞれ、
図9(a)が「2」、
図9(b)が「8」、
図9(c)が「120」である。
【0074】
図9(a)及び
図9(b)を参照すると、比較例1及び比較例2は、正常データと評価データの走行条件の違いが、異常因子数によって明確に検出されていない。
正常データに異常因子数の多いサンプルが多いということは、正常であるのに異常と判断することが多いということであり、誤検出が多いといえる。一方、評価データに異常因子数の少ないサンプルが多いということは、異常であるのに正常と判断することが多いということであり、検出漏れが多いといえる。すなわち、比較例1及び比較例2では、誤検出や検出漏れが多く、異常の検出能力の性能が低いことを示している。
【0075】
一方、
図9(c)を参照すると、実施例は、正常データと評価データの走行条件の違いが、異常因子数によって明確に検出されている。正常データでは、異常因子数が「30」以上のサンプルがほとんど存在しないのに対し、評価データでは、異常
因子数が「30」以上のサンプルが数多く存在する。これは、正常データ(「通常走行」)に基づいて学習した実施例の監視モデルによって、走行条件が異なる評価データ(「緩やか走行」)との違いが数多く検出されていることを示している。
つまり、正常データに異常因子数の多いサンプルが少ないということは、正常であるのに異常と判断することが少ないということであり、誤検出が少ないといえる。一方、評価データに異常因子数の少ないサンプルが少ないということは、異常であるのに正常と判断することが少ないということであり、検出漏れが少ないといえる。すなわち、実施例によって算出された異常因子数は、誤検出や検出漏れが少なく、異常の検出能力の性能が高いことを示している。
【0076】
図10は、比較例1による要因解析の結果を示す図である。
図11は、実施例による要因解析の結果を示す図である。実施例であれば、要因解析は、
図4のステップS19において実行される。
図10及び
図11に示す例は、第1の要因解析手法による解析結果である。
【0077】
図10を参照すると、比較例1の場合、出現回数が多い系列の組は相関がないものが多い。一方、
図11を参照すると、実施例の場合、出現回数が多い系列の組は相関があるものが多い。例えば、
図11に示す「出現回数1位」の散布図では、緩やか走行による変化を精度良く表現できている。
【0078】
実際に車両の異常診断を行う場合、相関がある系列の組において、その相関関係がどのように崩れたのかを観測したいというニーズがある。これは、相関関係の崩れが、異常の要因になり得るからである。独立成分は、元データが持つ局所的な特徴(相関関係)を表していることから、異常な独立成分を見つけることは、相関関係の崩れを見つけることを意味する。従って、本実施例では、相関関係がどのように崩れたのかを観測したいというニーズを満たす解析結果を提示できると言える。一方、主成分分析では、相関関係がどのように崩れたのかを観測することができない。
【0079】
ここで、本実施の形態の異常診断装置2による効果及びその効果が生じる理由について説明する。第1の効果は、異常に直接寄与したデータ系列を明らかにできることである。第2の効果は、各データサンプルが正常か否か判定できなくても、要因解析を行うことができることである。第3の効果は、異常な特徴因子数を異常度とし、異常度に従って異常判定を行うことで、ノイズに強い異常検出が可能となることである。第4の効果は、車両データの系列数よりも多い特徴因子を抽出することで、異常の検出能力及び要因解析能力の性能が向上することである。
【0080】
まず、第1の効果が生じる理由について説明する。元のデータ系列ではなく特徴因子を監視する場合、特徴因子が異常と判定されても、元のデータ系列との関連が複雑なため、従来の手法では要因解析を行うことが難しい。そこで、本実施の形態の異常診断装置2では、正常な特徴因子のみで逆変換を行い、再構成データを生成し、異常な振る舞いの特徴因子によって形作られる元の評価データと再構成データとの差分データを生成し、差分データを用いて要因解析を行う。これによって、特徴因子上ではなく、元のデータ系列上で解析を行うことができ、要因解析が容易になる。また、関係のないノイズに影響されず、直接寄与した部分のみを差分データという形で参照できる。従って、異常に直接寄与したデータ系列を明らかにすることができる。
【0081】
次に、第2の効果が生じる理由について説明する。従来手法では、異常検出のプロセスにおいて異常判定を行い、少量の異常候補を検出した後、それらの異常候補のみに対して要因解析を行う。しかし、現状、その異常候補を正しく抽出することは難しく、誤検出や検出漏れが多い。特に、異常がはっきり顕在化しにくい早期段階の異常検出では、この傾向が顕著になる。そこで、本実施の形態の異常診断装置2では、異常判定によって解析対象のデータを極端に限定することなく、要因解析を行う。これによって、診断者は、異常度や事前知識等に基づいて解析したいデータ範囲を指定することができ、各データサンプルが正常か否か判定できなくても、要因解析を行うことができる。
【0082】
各サンプルにおいて、寄与度が1番目に大きい系列と2番目に大きい系列の組(高寄与度系列組)のみに注目し、出現回数や誤差の大きさの観点で統計的な処理を行うことで、包括的に要因解析を行うことができる。診断者は、指定したデータ全体を通して誤差に寄与した回数の多い系列の組や、誤差が一番大きくなった系列の組を簡単に知ることができる。
【0083】
また、抽出された高寄与度系列組は、散布図を用いて容易に解析可能である。散布図は、統計に詳しくない診断者に対しても、直感的で分かり易いため、有用性が高い。注目したい系列の組がある場合、診断者は、例えば、その系列の組に対して正常データと評価データをそれぞれプロットし、その差異を確認することで、より詳細な違いを解析することができる。
【0084】
尚、統計的手法を用いた要因解析は、様々な条件で行うことが望ましい。例えば、最初の解析結果で得た知見に基づき、解析対象のデータの範囲や系列を限定し、再度要因解析を行うことで、解析精度を向上させることができる。
【0085】
次に、第3の効果が生じる理由について説明する。従来手法では、1つでも特徴因子が閾値を超えたデータは全て異常とみなすことが多い。一方、本実施の形態の異常診断装置2では、異常な振る舞いと判定された特徴因子の数を全体の異常度とし、異常度の値が大きい場合には車両が異常であると判断する。細かいノイズ等が原因で少量の特徴因子が異常な振る舞いと判定される場合があるが、そのような特徴因子の数が少ない場合、全体の異常度が大きくならないため、異常の誤検出を回避することができ、ノイズに強い異常検出が可能となる。
【0086】
次に、第4の効果が生じる理由について説明する。特徴因子の数が少ない場合、再構成データの表現の柔軟性が低く、元のデータが本来持つ細かい特徴まで表現することができない。そこで、本実施の形態のように、再構成データを生成する場合、出来る限り多くの特徴因子を抽出し、再構成データの表現力を向上させている。特に、過完備独立成分分析を用いて特徴因子を抽出したことによって、各特徴因子は互いにほぼ独立となり、同じ特徴を持たない。これによって、抽出される特徴因子が多いほど、多様な特徴を表現することができ、異常の検出能力及び要因解析能力の性能が向上する。
【0087】
以上、添付図面を参照しながら、本発明に係る異常診断装置等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。