特許6510931 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社神戸製鋼所の特許一覧

特許6510931データ解析方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6510931

(24)【登録日】2019年4月12日

(45)【発行日】2019年5月8日

(54)【発明の名称】データ解析方法

(51)【国際特許分類】

G06F 17/16 20060101AFI20190422BHJP

【ＦＩ】

G06F17/16 Z

【請求項の数】1

【全頁数】10

(21)【出願番号】特願2015-161938(P2015-161938)

(22)【出願日】2015年8月19日

(65)【公開番号】特開2017-41063(P2017-41063A)

(43)【公開日】2017年2月23日

【審査請求日】2018年4月27日

(73)【特許権者】

【識別番号】000001199

【氏名又は名称】株式会社神戸製鋼所

(74)【代理人】

【識別番号】100061745

【弁理士】

【氏名又は名称】安田敏雄

(74)【代理人】

【識別番号】100120341

【弁理士】

【氏名又は名称】安田幹雄

(72)【発明者】

【氏名】西田吉晴

(72)【発明者】

【氏名】友近信行

(72)【発明者】

【氏名】江口徹

(72)【発明者】

【氏名】山近拓也

【審査官】小林哲雄

(56)【参考文献】

【文献】特開２００３−２９６７３４（ＪＰ，Ａ）

【文献】特開２００７−３３４７６６（ＪＰ，Ａ）

【文献】特開２０１５−０２２１１２（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１０／００２１０６７（ＵＳ，Ａ１）

【文献】米国特許出願公開第２００８／０２８１５４５（ＵＳ，Ａ１）

【文献】松田博義、滝口哲也、有木康雄，「３次キュムラントのＢｉｓｐｅｃｔｒｕｍとＭＦＣＣの統合による音声区間検出の検討」，情報処理学会研究報告，東京：社団法人情報処理学会，２００６年１２月２１日，Vol.2006,No.136，pp.89-94，ISSN 0919-6072

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／１６

(57)【特許請求の範囲】

【請求項1】

サンプリングして得られる複数のデータを基に、主成分ベクトルを算出するデータ解析方法において、
サンプリングして得られる前記データに対して、ハイパスフィルタ処理を行い、
ハイパスフィルタ処理後の前記データを用いた漸化計算を行うことで、主成分ベクトルを算出するものであって、
サンプリング時間ごとに、得られる前記データに対してハイパスフィルタ処理を行い、
ハイパスフィルタ処理後のデータａ_ｆ（ｉ，ｊ）を用いた、以下に示す式（９）及び式（１０）〜（１２）で表されるＡ^Ｔ・Ａ行列に対して漸化計算を行うことで、サンプリング時間ごとに前記主成分ベクトルを算出する
ことを特徴とするデータ解析方法。

【数1】

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、サンプリングなどにより得られた多数のデータを解析する技術に関するものであり、特に、膨大な量のデータに対する主成分分析を行う技術に関する。

【背景技術】

【0002】

例えば、工場等の生産施設においては、各種モータやポンプが数多く稼働している。また、製品の組み立てや溶接においては、多関節ロボットを用いた作業が広く行われている。このような多関節ロボットは、各軸に電動モータと減速機を有するものとなっている。
上記したようなモータやポンプ、減速機などの動力伝達状況、言い換えれば、回転機器の動力伝達状況を把握することは、回転機器の稼働状況を把握したり、故障診断を行う上で重要となる。

【0003】

回転機器における動力伝達状況のデータを取得して、その取得したデータを解析して故障診断を行う手法は、種々存在する。そのデータ解析方法の一例として、主成分分析手法がある。
主成分分析手法（principal component analysis：PCA）は、直交回転を用いて変数間に相関がある元の観測値を、相関の無い主成分とよばれる値に変換するための数学的な手法のことである。この技術に関する先行文献としては、特許文献１に示すものがある。

【0004】

すなわち、特許文献１には、計算量を削減することができ、かつ、計算量の削減に伴う計算精度の低下が従来よりも小さな主成分分析方法（カーネル主成分分析方法）が開示されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２０１１−２２９１２号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、特許文献１などに開示された従来からの主成分分析手法を用いて、多数のデータを解析するに際しては、以下のような問題点が存在する。
すなわち、長期の時間に亘って取得したデータの解析にあたり、主成分分析手法を用いようとした場合、長期の時間に亘って取得したデータは、膨大なデータ量となり、この膨大なデータ量を用いた行列計算などを行う必要があるため、主成分分析を行うために多くの時間がかかってしまう虞がある。

【0007】

例えば、回転機器における動力伝達状況のデータを１秒に１回、１年間に亘り取得して、その取得したデータを解析して故障診断を行うにあたっては、測定した全ての周波数成分のサンプルデータｙ_１〜ｙ_Ｍと、そのときの回転位相（回転角）ｐ_１〜ｐ_Ｍとが、約３０００万個（≒３６００秒×２４時間×３６５日）存在することになり、これら膨大な数のデータを基に、主成分の計算を実施する必要がある。

【0008】

このような莫大な計算量の処理をオンライン上で行うと、計算処理の負荷がデータ解析装置に重くのし掛かり、主成分分析を行うことに多くの時間がかかってしまう虞がある。
本発明は、上述の問題点に鑑みてなされたものであり、サンプリングして得られる大量のデータを少ない計算量で計算処理して主成分を算出するデータ解析方法を提供することを目的とする。

【課題を解決するための手段】

【0009】

上記課題を解決するため、本発明においては以下の技術的手段を講じた。
本発明のデータ解析方法は、サンプリングして得られる複数のデータを基に、主成分ベクトルを算出するデータ解析方法において、サンプリングして得られる前記データに対して、ハイパスフィルタ処理を行い、ハイパスフィルタ処理後の前記データを用いた漸化計算を行うことで、主成分ベクトルを算出するものであって、サンプリング時間ごとに、得られる前記データに対してハイパスフィルタ処理を行い、ハイパスフィルタ処理後のデータａ_ｆ（ｉ，ｊ）を用いた、以下に示す式（９）及び式（１０）〜（１２）で表されるＡ^Ｔ・Ａ行列に対して漸化計算を行うことで、サンプリング時間ごとに前記主成分ベクトルを算出することを特徴とする。

【0010】

【数10】

【発明の効果】

【0011】

本発明のデータ解析方法によれば、サンプリングして得られる大量のデータを少ない計算量で計算処理して主成分を算出することができる。

【図面の簡単な説明】

【0012】

【図1】従来の手法を用いて、データを解析する方法を示す図である。

【図2】主成分分析手法を用いて、データを解析する方法を示す図である。

【発明を実施するための形態】

【0013】

以下、本発明にかかるデータ解析方法を、図面に基づき詳しく説明する。
本発明のデータ解析方法は、主成分分析手法（principal component analysis：PCA）と呼ばれる技術を用いるものである。主成分分析手法（以降、単に主成分分析と呼ぶこともある）は、直交回転を用いて変数間に相関がある元の観測値を、相関の無い主成分とよばれる値に変換するための数学的な手法のことである。

【0014】

まず、本発明の主成分分析手法を説明する前に、従来の主成分分析手法について説明する。
図１に示すように、サンプリングなどにより取得したデータ（信号１，信号２）に対して閾値判定（データの異常判定）を行おうとした場合、正常とされるデータの範囲が、図１中の破線で囲まれる範囲に設定されるようになっていたとする。

【0015】

しかしながら、実際に得られる正常なデータの分布は、図１中の傾斜した楕円で囲まれる範囲であり、設定された正常とされるデータの範囲よりかなり狭い範囲である。それ故、上記の方法で閾値判定を行った場合、本来異常と判定されるデータが、図１中の破線で囲まれる範囲内であり、且つ実際に得られるデータの分布の外側に位置することとなり、正常なデータと誤判定されてしまうことがある。つまり、通常の閾値判定では、精確な閾値判定を行うことができなかった。

【0016】

このような、閾値の誤判定を防止するために、主成分分析手法を用いた閾値判定、すなわち主成分分析手法を用いたデータ解析方法が行われている。
図２に示すように、主成分分析手法を用いた従来のデータ解析方法は、サンプリングなどにより多数のデータを、長期の時間に亘って取得する。例えば、ある項目ｉ（ｉ＝１〜Ｍ）に関するａ（ｉ，ｊ）を長期間に亘って取得する。ここで、ｊは時刻であり、ｊ＝１〜Ｎである。データ取得の時刻を１秒に１回、１年間亘るとすれば、Ｎ＝３６００秒×２４時間×３６５日＝３１，５３６，０００となる。つまり、取得したａ（ｉ，ｊ）は、膨大なデータ量となる。

【0017】

そして、取得した膨大な数のデータ列ａ（ｉ，ｊ）の平均値を式（１）にて、算出する。

【0018】

【数1】

【0019】

項目ｉの時刻ｊにおけるデータ列ａ（ｉ，ｊ）から算出した平均値（ａバー（ｉ））をデータ列ａ（ｉ，ｊ）から減算する。

【0020】

【数2】

【0021】

次に、算出されたデータｂ（ｉ，ｊ）の分散を求める。

【0022】

【数3】

【0023】

求めた分散σ（ｉ）^２を用いて、データｂ（ｉ，ｊ）をノルマライズ（正規化）する。

【0024】

【数4】

【0025】

そして、以下に示す式（５）〜式（８）を用いて、主成分を算出する。

【0026】

【数5】

【0027】

ここで、abs(λ_１)≧abs(λ_２)≧…≧abs(λ_ｋ)≧…≧abs(λ_Ｍ)とすると、図２に示すように、ｕ_１が第１主成分ベクトル、ｕ_２が第２主成分ベクトル、ｕ_ｋが第ｋ主成分ベクトルとなり、その方向が各主成分となる。なお、第２主成分ベクトルｕ_２は、第１主成分ベクトルｕ_１の重心に対して直交している。
以上の算出過程を経ることで、主成分ｕ_ｋを算出することができる。

【0028】

そして、図２に示すように、これら第１主成分ベクトルｕ_１、第２主成分ベクトルｕ_２ごとに閾値を設定すると、実際に得られる正常データの分布（図２中の傾斜した楕円で囲まれる範囲）に近い範囲に設定することができる。
なお、図２の例は、信号１，２の２次元のデータに関する主成分分析の例である。このデータは２次元のため、主成分ベクトルもｕ_１、ｕ_２の２つになるが、データ項目数がＭの場合、主成分ベクトルもｕ_１、ｕ_２、…、ｕ_ＭのＭ個になる。

【0029】

ところが、以上述べた方法で主成分ｕ_ｋを算出してデータを解析する方法では、以下に述べる問題が生じる。
上記した従来手法の主成分分析方法（データ解析方法）では、項目毎に平均を差し引いた分散あるいは最大値、最小値などによって、項目を正規化してから固有値を求め、主成分ベクトルを計算していた。しかし、データが更新される毎に主成分分析処理を行うには、蓄積された膨大なデータを用いて平均値および分散を求め、その上で平均値と分散でノルマイライズされたＣを用いて、Ｃ^Ｔ・Ｃを（逐次計算することなく）毎回一括計算で算出する必要があるため、計算処理に多くの時間がかかっていた。

【0030】

このように、計算処理に多くの時間がかかるため、オンライン上での逐次計算などができず、また解析装置の制御ＣＰＵなどの「処理速度の遅いＣＰＵ」では、膨大なデータを一括処理することができなかった。それ故、解析装置本来のＣＰＵなどに加え、別にＣＰＵを追加して計算処理を行う必要がある。また、オンライン上での計算処理がでないため、常に近況の主成分分析を得ることができなかった。

【0031】

例えば、項目数Ｍのデータを１秒ごとにサンプリングした１年間のデータを、計算処理しようとすると、そのデータ数は３１５４万（＝Ｎ）×Ｍ個となる。ここで、データ項目数Ｍ＝１００とし、例えばWindows（登録商標）8(64bit)（microsoft社製）で、前述の膨大なデータのうち一つを、float型浮動小数点変数で確保すると、２５ＧＢと大量のメモリが必要となる。

【0032】

また、このデータに加えて、データの平均値を減算したデータや、分散でノルマライズしたデータなども合わせて保持する必要があるため、この一つのデータに関して少なくとも１００ＧＢ近いメモリが消費されてしまうこととなる。
加えて、上記の膨大なデータからＣ^Ｔ・Ｃ行列を一括処理するためには、６４０×１０^９回以上の浮動小数点演算が必要となってくる。この計算処理を現在市販されているパソコンなどで使用されているCore i7（Intel社製、93GFLOPS）の１コアを使用して（仮に、この計算処理以外を行わないとして）計算処理しても、５０秒以上の処理時間が必要である。かかる状況により、１秒毎に得られるデータに対して、１秒ごとに計算処理することはできない。

【0033】

さらに、自動車やロボットなどの高速処理が必要な組み込み系コントローラのＣＰＵとして使用されているＳＨマイコン（ルネサス社製）の、例えばＣＰＵ（型番：ＳＨ７７６４）を使用した場合では、計算処理時間が非常に遅くなる。例えば、Ｃ^Ｔ・Ｃ行列を一括処理だけを行ったとしても、５分の程度の計算時間が必要となってくる。
また、組み込み系コントローラのＣＰＵでは、他にもオンライン処理を行う必要があるため、実際には１０〜２０分以上の計算時間になるものと想定され、解析装置に組み込まれたＣＰＵでは、従来のアルゴリズムでは全く処理できない。

【0034】

そこで、本願発明者らは、上記の問題を鑑みて鋭意研究を重ねた結果、サンプリングして得られる大量のデータを少ない計算量で計算処理して主成分を算出するデータ解析方法（逐次主成分分析手法）を発明した。
本発明のデータ解析方法は、サンプリングなどにより取得した膨大なデータに対してハイパスフィルタ処理を行い、ハイパスフィルタ処理後のデータを用いたＡ^Ｔ・Ａ行列を逐次的に計算して主成分を算出する（漸化式計算）。

【0035】

具体的には、まずサンプリングなどにより取得した膨大なデータａ（ｉ，ｊ）に対して、ハイパスフィルタ処理を行って、データａｆ（ｉ，ｊ）を導出する。なお、ハイパスフィルタ処理を行うので、ａｆ（ｉ，ｊ）の各項目の平均値は０となる。
そして、ハイパスフィルタ処理後のデータａｆ（ｉ，ｊ）を用いて、Ａ（ｋ）を計算する。

【0036】

【数6】

【0037】

このとき、Ａ(ｋ)^Ｔ・Ａ(ｋ) 行列（＝ＡＡ(ｋ)）は、式（１０）〜式（１２）で与えられる。

【0038】

【数7】

【0039】

このようにすることで、逐次的に、Ａ(Ｎ)^Ｔ・Ａ(Ｎ)（＝ＡＡ(Ｎ)）まで計算することができる。
また、Ａ(Ｎ)^Ｔ・Ａ(Ｎ)（＝ＡＡ(Ｎ)）の対角項ｄ(ｋ)は、第ｋ項目の分散σ_ｋ^２となっている。そして、ＡＡ(Ｎ)のｋ行とｋ列をσ_ｋ^２で割り込んで、ノルマライズする。ノルマライズされた行列をＸとすると、式（１３）のように表現できる。

【0040】

【数8】

【0041】

このように、式（１３）の行列Ｘを固有値分解することで、主成分分析を行う、すなわち主成分を算出することができる。
従来手法ではデータが更新されるたびに、Ｃ^Ｔ・Ｃを（逐次計算することなく）一から一括計算しなければならなかったが、本発明ではＣ^Ｔ・Ｃに相当するＸを逐次計算の結果を用いて簡単に算出することができる。

【0042】

以上述べた算出過程を経ることで、逐次的に主成分を算出することができる。つまり、従来の手法で行われていた膨大なデータａ（ｉ，ｊ）の平均値算出（一括計算処理）をしなくても、容易に且つ少ない計算量で主成分を算出することが可能となる。
また、式（１０）に対して、忘却係数ρ（≪１）を導入し、Ａ(Ｎ)^Ｔ・Ａ(Ｎ)を、式（１４）にて逐次計算を行うと、過去のデータに対して直近のデータの重みを大きくした際の（直近のデータにウェイトを置いた）主成分分析を行うことができる。

【0043】

【数9】

【0044】

［実施例］
以上述べた本発明のデータ解析方法は、様々な機器の制御や故障診断に適用可能である。
例えば、モータやポンプ、減速機など回転機器の故障診断を行う場合、まず回転機器における動力伝達状況のデータ、例えば、入力軸の回転位相ａ（１，ｊ）と、出力軸の回転位相ａ（２，ｊ）とを時刻ｊにて順次取得する。取得時間としては、例えば、１秒に１回とする。

【0045】

取得されたデータは順次ハイパスフィルタ回路などに入力され、データに対するハイパスフィルタ処理を行って、データａｆ（１，ｊ）、ａｆ（２，ｊ）を導出する。
そして、ハイパスフィルタ処理後のデータａｆ（１，ｊ）、ａｆ（２，ｊ）と、漸化式である式（１０）を用いることにより、データ取得時間ｊ毎に、１つ前の時間に計算されたＡ(ｊー１)^Ｔ・Ａ(ｊー１)を基にしてＡ(ｊ)^Ｔ・Ａ(ｊ)を求める。

【0046】

求まったＡ(ｊ)^Ｔ・Ａ(ｊ)を、式（１２）、式（１３）に適用することによって、データａｆ（１，ｊ）、ａｆ（２，ｊ）の主成分ｕ_１，ｕ_２を算出することができる。
得られた主成分ｕ_１，ｕ_２の変動量や閾値を超えるか否かを判定することで、回転機器の故障診断を行うことができる。
なお、回転機器の診断解析などでは、項目の絶対値よりも高周波域（ハイパスフィルタ処理）に異常データが顕著に出現するため、本発明のデータ解析方法においては、上記したハイパスフィルタ処理を行っても異常データを検出することが可能であるので、回転機器の診断処理においても、大きな問題とはならない。

【0047】

また、本発明のデータ解析方法を圧延機の稼働状況を把握する場合に適用することも可能である。例えば、圧延機における圧延荷重データａ（１，ｊ）と、圧延時のモータ電流値ａ（２，ｊ）とをｊ毎に順次取得する。ｊの取得タイミングとしては、各圧延パス時とする。
取得されたデータは順次ハイパスフィルタ回路などに入力され、データに対するハイパスフィルタ処理を行って、データａｆ（１，ｊ）、ａｆ（２，ｊ）を導出する。

【0048】

そして、ハイパスフィルタ処理後のデータａｆ（１，ｊ）、ａｆ（２，ｊ）と、漸化式である式（１０）、及び式（１２）、式(１３)を用いることにより、データａｆ（１，ｊ）、ａｆ（２，ｊ）の主成分ｕ_１，ｕ_２を算出することができる。
得られた主成分ｕ_１，ｕ_２の変動量や閾値を超えるか否かを判定することで、圧延機のの状況診断や故障診断を行うことができる。

【0049】

なお、今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。
本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。特に、今回開示された実施形態において、明示的に開示されていない事項、例えば、運転条件や操業条件、各種パラメータ、構成物の寸法、重量、体積などは、当業者が通常実施する範囲を逸脱するものではなく、通常の当業者であれば、容易に想定することが可能な値を採用している。

【図1】

【図2】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6510931号(P6510931)IP Force 特許公報掲載プロジェクト 2022.1.31 β版