(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024000285
(43)【公開日】2024-01-05
(54)【発明の名称】解析装置、解析方法及び解析プログラム
(51)【国際特許分類】
G06F 17/18 20060101AFI20231225BHJP
G06N 20/00 20190101ALI20231225BHJP
【FI】
G06F17/18 Z
G06N20/00 160
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022098998
(22)【出願日】2022-06-20
(71)【出願人】
【識別番号】000006208
【氏名又は名称】三菱重工業株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】安田 秀策
(72)【発明者】
【氏名】佐々木 俊也
(72)【発明者】
【氏名】井川 芳克
【テーマコード(参考)】
5B056
【Fターム(参考)】
5B056BB81
5B056BB83
(57)【要約】
【課題】複数のパラメータの時系列データを適切に解析する。
【解決手段】解析装置は、解析対象から検出した複数のパラメータの時系列データを取得するデータ取得部と、データ取得部で取得した複数のパラメータの時系列データを標準化する処理を行う前処理部と、前処理部で処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理部と、グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
解析対象から検出した複数のパラメータの時系列データを取得するデータ取得部と、
前記データ取得部で取得した複数のパラメータの時系列データを標準化する処理を行う前処理部と、
前記前処理部で処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理部と、
グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析部と、を備える解析装置。
【請求項2】
前記前処理部は、前記時系列データの周期変動を検出し、周期変動を除去する処理を行う請求項1に記載の解析装置。
【請求項3】
前記前処理部は、前記時系列データの正規分布性を検出し、正規分布性が条件を満たさない時系列データの正規分布性を補正する請求項1に記載の解析装置。
【請求項4】
前記前処理部は、前記時系列データの外れ値を検出し、外れ値を検出した場合、直前の値に置換する補正する請求項1に記載の解析装置。
【請求項5】
前記前処理した時系列データから特徴量を抽出し、特徴量と時間の関係のデータを作成して前記クラスタリング処理部に供給する特徴量抽出部を有する請求項1から請求項4に記載の解析装置。
【請求項6】
前記特徴量抽出部は、特徴量毎に次元圧縮処理を行う請求項5に記載の解析装置。
【請求項7】
解析対象から検出した複数のパラメータの時系列データを取得するデータ取得ステップと、
前記データ取得ステップで取得した複数のパラメータの時系列データを標準化する処理を行う前処理ステップと、
前記前処理ステップで処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理ステップと、
グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析ステップと、を備える解析方法。
【請求項8】
解析対象から検出した複数のパラメータの時系列データを取得するデータ取得ステップと、
前記データ取得ステップで取得した複数のパラメータの時系列データを標準化する処理を行う前処理ステップと、
前記前処理ステップで処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理ステップと、
グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析ステップと、をコンピュータに実行させる解析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、解析装置、解析方法及び解析プログラムに関するものである。
【背景技術】
【0002】
取得したデータを処理し、解析するために、取得したデータに対して変換処理を行い、データ量を低減する技術がある。例えば、特許文献1には、降水量の変化を予測する装置として、2次元画像情報を面積と強度についての1次元時系列信号に変換して降水域の変化を少ないメモリで高速に予測する技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載の装置は、2つの時系列データの相関に基づいて処理することで、演算量の低減ができるが、3つ以上の多変数の解析には対応していない。例えば、プラント等の施設に設置したセンサ等の時系列データの場合、時間ずれが生じた多数のセンサの情報が取得される。時間ずれした多数のセンサ情報の相関の解析には時間を要する。また、多数のセンサの情報は、運転変動や異常でデータが非線形で変化する場合がある。データが非線形の変化を伴うような場合、現実的な時間での処理が困難である。そのため、センサ情報の分析結果を必要な時点でフィードバックすることができない。
【0005】
本開示は、上記に鑑みてなされたものであり、多変数の時系列データを適切に解析できる解析装置、解析方法及び解析プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示に係る解析装置は、解析対象から検出した複数のパラメータの時系列データを取得するデータ取得部と、前記データ取得部で取得した複数のパラメータの時系列データを標準化する処理を行う前処理部と、前記前処理部で処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理部と、グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析部と、を備える。
【0007】
本開示に係る解析方法は、解析対象から検出した複数のパラメータの時系列データを取得するデータ取得ステップと、前記データ取得ステップで取得した複数のパラメータの時系列データを標準化する処理を行う前処理ステップと、前記前処理ステップで処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理ステップと、グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析ステップと、を備える。
【0008】
本開示に係る解析プログラムは、解析対象から検出した複数のパラメータの時系列データを取得するデータ取得ステップと、前記データ取得ステップで取得した複数のパラメータの時系列データを標準化する処理を行う前処理ステップと、前記前処理ステップで処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理ステップと、グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析ステップと、をコンピュータに実行させる。
【発明の効果】
【0009】
本開示によれば、多変数の時系列データを適切に解析できる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、本実施形態の解析装置を示すブロック図である。
【
図2】
図2は、解析装置の処理の一例を示すフローチャートである。
【
図3】
図3は、前処理部の処理の一例を示すフローチャートである。
【
図4】
図4は、前処理部で処理した時系列データの一例を示す模式図である。
【
図5】
図5は、クラスタリング処理部で処理した時系列データの一例を示す模式図である。
【
図6】
図6は、特徴量処理部の処理の一例を示す説明図である。
【
図7】
図7は、特徴量処理部の処理の一例を示す説明図である。
【
図8】
図8は、特徴量処理部の処理の一例を示す説明図である。
【
図9】
図9は、特徴量処理部の処理の一例を示す説明図である。
【発明を実施するための形態】
【0011】
以下に図面を参照して、本開示の好適な実施形態を詳細に説明する。なお、この実施形態により本開示が限定されるものではなく、また、実施形態が複数ある場合には、各実施形態を組み合わせて構成するものも含むものである。また、実施形態における構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。
【0012】
図1は、本実施形態の解析装置を示すブロック図である。解析装置10は、解析対象、例えばボイラやガスタービン等のプラントの各部で取得した複数のパラメータの時系列データを解析する。ここで、複数のパラメータは、各部に設置したセンサのデータ等である。
【0013】
解析装置10は、入力部12と、出力部14と、通信部16と、演算部18と、記憶部20と、を含む。入力部12は、キーボード及びマウス、タッチパネル、またはオペレータからの発話を集音するマイク等の入力装置を含み、オペレータが入力装置に対して行う操作に対応する信号を演算部18へ出力する。出力部14は、ディスプレイ等の表示装置を含み、演算部18から出力される表示信号に基づいて、処理結果や処理対象の画像等、各種情報を含む画面を表示する。また、出力部14は、データを記録媒体で出力する記録装置を含んでもよい。通信部16は、通信インターフェースを用いて、データの送信を行う。通信部16は、解析対象のセンサ等と通信を行い、計測データの受信等を行う。通信部16は、外部機器と通信を行い取得した各種データ、プログラムを記憶部16に送り、保存する。通信部は、有線の通信回線で外部機器と接続しても、無線の通信回線で外部機器と接続してもよい。
【0014】
演算部18は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の集積回路(プロセッサ)と、作業領域となるメモリとを含み、これらのハードウェア資源を用いて各種プログラムを実行することによって各種処理を実行する。具体的に、演算部18は、記憶部18に記憶されているプログラムを読み出してメモリに展開し、メモリに展開されたプログラムに含まれる命令をプロセッサに実行させることで、各種処理を実行する。演算部18は、データ取得部22と、前処理部24と、特徴量抽出部26と、クラスタリング処理部28と、解析部30と、を含む。演算部18の各部の説明の前に記憶部20について説明する。
【0015】
記憶部20は、磁気記憶装置や半導体記憶装置等の不揮発性を有する記憶装置からなり、各種のプログラムおよびデータを記憶する。記憶部20は、前処理部プログラム32と、解析プログラム34と、検出データ36と、プラントデータ38と、条件テーブル40と、を含む。
【0016】
記憶部18に記憶されるプログラムとしては、前処理プログラム32と、解析プログラム34と、が含まれる。前処理部プログラム32は、前処理部24と、特徴量抽出部26の機能を実現するプログラムである。解析プログラム34は、クラスタリング処理部28、解析部30の処理を実現するプログラムである。本実施形態では、プログラムを2つとしたが、前処理部プログラム32と、解析プログラム34とを1つのプログラム(解析プログラム)としてもよいし、前処理部24と、特徴量抽出部26と、クラスタリング処理部28と、解析部30の機能ごとのプログラムとしてもよい。また、前処理部24を複数のプログラムの組み合わせとしてもよい。
【0017】
記憶部20に記憶されるデータとしては、検出データ36と、プラントデータ38と、条件テーブル40と、が含まれる。検出データ36は、解析対象で取得した複数のパラメータの時系列データである。プラントデータ38は、解析対象であり、時系列データを取得する対象の情報である。プラントデータ38には、対象のプラントの構造、性能の情報が含まれる。また、プラントデータ38には、検出データ36の時系列データを取得するプラント上の位置や、データを取得するセンサの情報も含まれる。条件テーブル40は、前処理プログラム32、解析プロブラム34で実行する処理に必要な各種条件、閾値の情報を含む。
【0018】
演算部18の各部の機能について説明する。演算部18の各部は、記憶部20に記憶されるプログラムを実行することで、実行することができる。データ取得部22は、解析対象で計測した時系列データを取得する。データ取得部22は、通信部16や、入力部12を介してデータを取得する。データ取得部22は、取得したデータを記憶部20に記憶させる。データ取得部22は、プラントデータ38、条件テーブル40の情報も取得して記憶部20に記憶させる。
【0019】
前処理部24は、前処理プログラム32を実行することで実現される機能である。前処理部24は、データ取得部22で取得した複数のパラメータの時系列データを処理する。前処理部24は、クラスタリング処理部28での処理を効率化できる各種処理を、複数のパラメータの時系列データに対して行う。具体的には、前処理部24は、複数のパラメータの時系列データを標準化させる処理を行う。つまり、計測された単位が異なるパラメータの次元を無次元化する処理を行う。
【0020】
特徴量抽出部26は、前処理部24で処理した時系列データのそれぞれに対して、特徴量を抽出する処理を行う。特徴量抽出部26は、時系列値から時間合わせに利用可能な情報を取り出すために、時系列の情報を複数の方法で縮約する処理を行う。特徴量は、クラスタリング処理部28で時系列データを分類する処理の基準の1つとして用いられる値である。
【0021】
クラスタリング処理部28は、特徴量抽出部26で処理した複数のパラメータの時系列データを処理して、時間軸に対する傾向が類似する時系列データ毎に分類して、グループ化する。クラスタリング処理部28は、例えば、K-means、Ward階層クラスタリング及び混合ガウス等で、グループ化の処理を行う。クラスタリング処理部28は、距離関数を利用する場合、時系列データの値に応じて任意に変更してもよい。クラスタリング処理部28は、1つのグループに含まれる複数の時系列データから代表時系列データを選定する。クラスタリング処理部28は、全ての時系列データをグループに分類しなくてもよい。つまり、グループに含まれない時系列データがあってもよい。言い換えると、1つのグループが1つの時系列データで構成されるグループを含んでいてもよい。
【0022】
なお、本実施形態では、特徴量抽出部26で特徴量を抽出したが、これに限定されない。解析装置10は、特徴量抽出部26を備えない構成として、前処理部24で処理した時系列データを、クラスタリング処理部28で処理してグループ化してもよい。
【0023】
解析部30は、クラスタリング処理部28でグループ化した複数のパラメータの時系列データを処理して、時系列データを解析する。解析部30は、それぞれのグループの代表時系列データを抽出して、代表時系列データを比較処理することで、複数のパラメータの時系列データの時間ずれを評価する。ここで、「時間ずれ」とは、センサの物理的制約から生じる伝播の時差等である。例えば、プラントの流体が流れる配管において、流体の流れに変動が生じると、流体の流速と距離との関係に基づいた時間遅れを生じて変動が上流から下流に順番に発生する。時間ずれは、同じ原因に対して生じる変動のタイミングのずれ(時間のずれ)である。
【0024】
図2から
図9を用いて、時間ずれの解析方法について説明する。
図2は、解析装置の処理の一例を示すフローチャートである。
図3は、前処理部の処理の一例を示すフローチャートである。
図4は、前処理部で処理した時系列データの一例を示す模式図である。
図5は、クラスタリング処理部で処理した時系列データの一例を示す模式図である。
図6から
図9は、それぞれ特徴量処理部の処理の一例を示す説明図である。
【0025】
図2を用いて、解析装置10で実行する解析方法について説明する。解析装置10は、データ取得部22で複数のパラメータの時系列データを取得する(ステップS12)。
【0026】
解析装置10は、前処理部24で、取得した複数のパラメータの時系列データに対して前処理を実行する(ステップS14)。前処理部24は、複数のパラメータの時系列データに対して各種処理を行い、標準化する。各種処理としては、ノイズ除去、周期性除去、正規分布化、外れ値除去等である。また、標準化の処理としては、平均を引き、標準偏差で割る処理が例示される。
【0027】
図3を用いて、前処理部の一例を説明する。解析装置10の前処理部24は、時系列データを取得し(ステップS30)、取得した時系列データに対して、周期変動検出処理を行う(ステップS32)。前処理部24は、周期変動検出処理の前に、ノイズ除去を行ってもよい。前処理部24は、周期変動の検出処理として、例えば、時系列データのピリオドグラムに対してカイ二乗検定することで、周期変動の検出を行う。
【0028】
前処理部24は、周期変動検出処理を行った後、周期変動があるかを判定する(ステップS34)前処理部24は、周期変動があると判定した場合(ステップS34でYes)、周期変動成分を除去して(ステップS36)、ステップS38に進む。前処理部24は、時系列データから所定間隔での移動平均を算出し、時系列データから移動平均を除去することで、周期変動成分を除去する。前処理部24は、周期変動がないと判定した場合(ステップS34でNo)、ステップS38に進む。
【0029】
前処理部24は、ステップS34でNoと判定した場合、または、ステップS36の処理を実行した後、正規分布性検出処理を行う(ステップS38)。正規分布性検出には、例えば、コルモゴロフ―スミルノフ検定を用いる。
【0030】
前処理部24は、正規分布性検出処理を行った後、正規分布性が許容範囲内であるかを判定する(ステップS40)。ここで、許容範囲は、予め設定した値を用いればよい。また、許容範囲は、解析のために補正が必要か否かの正規分布性と境界とすればよい。
【0031】
前処理部24は、正規分布性が許容範囲内であると判定した場合(ステップS40でYes)、ステップS44に進む。前処理部24は、正規分布性が許容範囲内ではないと判定した場合(ステップS40でNo)、時系列データの分布を補正し(ステップS42)、ステップS44に進む。前処理部24は、時系列データが正規分布に近づくように、補正を行う。補正には、例えばジョンソン変換を用いる。前処理部24は、時系列データを補正することで、許容範囲内の正規分布性を有するデータとする。
【0032】
前処理部24は、ステップS40でYesと判定した場合、または、ステップS42の補正処理を実行した後、外れ値検出処理を行う(ステップS44)。時系列データに外れ値が含まれているかの判定を行う。外れ値の判定には、例えば、スミルノフ・グラブス検定を用いる。
【0033】
前処理部24は、外れ値検出処理を行った結果、外れ値があるかを判定する(ステップS46)。解析装置10は、外れ値がないと判定した場合(ステップS46でNo)、本処理を終了する。解析装置10は、外れ値があると判定した場合(ステップS46でYes)、外れ値を除去して(ステップS48)して、本処理を終了する。。前処理部24は、
図3に示す処理を行った時系列データに対して標準化処理を行い、無次元化した時系列データを作成する。
【0034】
図2に戻り、解析装置10の処理を説明する。解析装置10は、前処理部24で処理した時系列データに対して、特徴量抽出処理を行う(ステップS16)。解析装置10は、特徴量抽出部26で時系列データを処理して、特徴量を抽出する。特徴量抽出部26は、特徴量として、ピークや、変動が大きい時点の情報を抽出する。
【0035】
解析装置10は、特徴量抽出部26で特徴量を抽出した時系列データを、クラスタリング処理部28でグループに分類する(ステップS18)。各時系列データの特徴量と特徴量が検出された時刻との関係に基づいて、傾向が類似する時系列データをグループに分類する。つまり、特徴量が検出されるタイミングが類似する時系列データを同じグループとする。なお、本実施形態では特徴量抽出部26で処理した時系列データをグループに分類したが、特徴量を抽出せずに前処理部24で処理した時系列データをグループ化してもよい。
【0036】
解析装置10は、クラスタリング処理部28でグループ毎の代表時系列データを特定する(ステップS20)。クラスタリング処理部28は、それぞれのグループから、1つの時系列データを代表時系列データとする。代表時系列データの特定方法は特に限定されず、グループに含まれる時系列データの平均値に近い時系列データを選定しても、ランダムに選定してもよい。
【0037】
解析装置10は、解析部30で、代表時系列データを比較する(ステップS22)。解析部30は、代表時系列データを比較することで、グループごとの傾向の差を検出する。解析部30は、グループごとの傾向の差を検出することで、グループに含まれる時系列データそれぞれの傾向の差を検出する。
【0038】
解析装置10は、解析部30で、比較した結果に基づいて、時系列データの時間ずれを算出する(ステップS24)。解析部30は、代表時系列データの比較結果に基づいて、各時系列データの時間ずれを算出する。
【0039】
解析装置10は、時系列データ毎の時間ずれの状況を把握することで、同じ原因で生じた各位置での変動の関連性を把握することができる。これにより、変動の状況から原因を推定することが可能となる。また、時系列データの時間ずれを把握できることで、本来生じるはずの変動が生じていない箇所の把握も可能となる。これにより、解析対象の状況を、時間ずれも加味して正確に把握することができる。
【0040】
解析装置10は、クラスタリング処理部28で時系列データをグループ化し、グループの代表データを比較することで、比較するデータを少なくすることができる。これにより、時間ずれの解析時に、演算が発散して収束しない可能性を低減でき、演算量も低減できる。したがって、時間ずれの解析を高速化できる。
【0041】
例えば、ボイラやガスタービンなどのプラントでは、ある箇所で機器故障等による異常が生じた場合、その影響が配管等の後流に伝播する。ここで、運転データとして多変量の時系列値が計測され、性能向上のための分析やトラブル要因分析などに用いられている。多変量の時系列値の活用では、解析のために、時間ずれの補正、つまり、時系列の時間合わせを行う。時系列値の時間合わせとしては、センサ値のトレンドグラフを描画し、プラントの設計知見と比較する方式で、人間が手動で行うことが感がられる。しかしながら、プラントのデジタル化に伴いセンサ数が増加することで、作業量がセンサの数に対しべき級数的に増加し、手動での時間合わせが困難である。また、系列の時間合わせを自動的に行う場合、非線形な関係を含む時系列値の時間合わせについては、多量の計算リソースを必要とすることから現実的な時間で計算できる手法が確立できない。そのため、性能向上のための分析やトラブル要因分析が不十分となったり、ソフトセンサや制御システムにおいて、システム運用中の精度低下やトラブルを引き起こしたりする可能性がある。これに対して、本実施形態の解析装置10は、上記処理を行うことで、自動的に、上流・中流・下流などのセンサや弁等のアクチュエータ設置位置に応じて、プラント各所に設置してあるセンサ指示値やアクチュエータ指令値等の時系列値の時刻を調整し、タイミングを合わることができる。これにより、異常事象の発生検知や原因推定、分析の正確性を高くすることができる。
【0042】
図4に示す表は、ピアソン積率相関のみで時系列値の時間ずれを推定した場合の組み合わせである。つまり、前処理を行ったのみの時系列データを解析した場合の処理である。
図4で数値が記載されている領域は、相関を算出できたデータである。数値は一例である。
【0043】
図5に示す表は、クラスタリング処理部28でグループ化処理した後のデータである。
図5に示す表のG2からG5は、グループの代表データである。
図5に示す様に、グループ化することで、データを比較した場合の時系列データの数を低減することができる。また、グループ化する際の処理で、相関を把握することができ、解析部で、比較くする場合の解析対象を低減することができる。例えば、
図5の太線で囲った領域は、グループ化処理の段階で、相関が既知の場合、ハッチングで示す領域を計算対象とすることができる。
【0044】
また、解析装置10は、前処理部24で各種処理を行うことで、クラスタリング処理部28で高い精度で時間ずれの傾向が類似する時系列データをグループ化することができる。具体的には、解析装置10は、前処理部24で、周期変動を除去し、正規分布に補正し、外れ値を除去することで、クラスタリング処理部28で高い精度で時間ずれの傾向が類似する時系列データをグループ化することができる。
【0045】
解析装置10は、特徴量抽出部26で、特徴量抽出の処理を行うことで、グループ化処理をより簡単に行うことができる。時系列データから特徴量として抽出する値は1つに限定されず、並列で複数の処理を行い、それぞれのパラメータを特徴量として抽出することができる。以下、特徴量の抽出処理について説明する。
【0046】
特徴量抽出部26は、時系列データを高速フーリエ変換し、検出した位相情報を特徴量として用いることができる。このようにすることで、角周波数の余弦波の位相をどの程度ずらして合成すれば、元の時系列を表現できるかを示すことができる。また、周波数ごとの時間ずれを得ることができ、時間ずれを効率的に表現できる。
【0047】
特徴量抽出部26は、時系列データを所定時間で分割し、各時間帯(各窓)の最大値を特徴量とすることができる。ここで、時系列データは、計測間隔が一定の場合、データの点数に基づいて各時間帯を区画することができる。特徴量抽出部26は、
図6に示すように、時系列データ100を、一定時間ごとで区画する。例えば、
図6では、時系列データ100を、100レコード(100個の計測値)を1つの窓とする。特徴量抽出部26は、時系列データ100の、100レコード毎の最大値を各窓の値とする。これにより、処理後時系列データ110に示すように、各窓の最大値を特徴量とするデータとすることができる。なお、
図6では、最大値としたが、最小値としてもよい。このように、時間窓ごとの最大値の位置を示すことで、時系列の波形の局所トレンドや局所最大値の位置情報をとらえることができ、時間ずれを効率的に表現できる。
【0048】
特徴量抽出部26は、時系列データを所定時間で分割し、各時間帯(各窓)の極値(極大値または極小値)を特徴量とすることができる。特徴量抽出部26は、
図7に示すように、時系列データ120を、一定時間ごとで区画する。
図7では、時系列データ100を、100レコード(100個の計測値)を1つの窓とする。特徴量抽出部26は、時系列データ100の、100レコード毎の極地を各窓の値とする。これにより、処理後時系列データ130に示すように、各窓の最大値を特徴量とするデータとすることができる。このように、極値の位置を示すことで、時系列波形の形状を特徴づける極値の位置情報を捉えることができ、時間ずれを効率的に表現できる。
【0049】
特徴量抽出部26は、上記の特徴量をそれぞれ使用しても、任意に組み合わせて使用してもよい。また、主成分分析(Principal Component Analysis)やUMAP(Uniform Manifold Approximation and Projection)などを用いて、次元削減をしてもよい。
【0050】
特徴量抽出部26は、特徴量を抽出した後、抽出結果に対して次元圧縮処理行うことが好ましい。解析装置10は、特徴量抽出部26で抽出した特徴量毎に次元圧縮処理を行うことで、グループ化する時系列データとその他の時系列データとを分離することができる。ここで、次元圧縮処理は、時間ずれが既知の時系列(例えば、異なるプラントの、類似系統の時系列など)を用いて圧縮処理の基準を選定する。
【0051】
特徴量抽出部26は、例えば時間をそれぞれ変数とし、それぞれの特徴量についてXY座標に変換する。特徴量抽出部26は、特徴量毎に、PCAやUMAP等の次元圧縮処理を行う。
図8は、次元圧縮前の特徴量を示す図である。
図9は、次元圧縮処理を行った特徴量を示す図である。特徴量抽出部26は、次元圧縮処理を行うことで、同じグループにする時系列データと、他の時系列データとの値の距離を広くすることができ、クラスタリンスする対象を特定しやすくできる。
【0052】
本開示は、以下の発明を開示している。なお、下記に限定されない。
(1)解析対象から検出した複数のパラメータの時系列データを取得するデータ取得部と、
前記データ取得部で取得した複数のパラメータの時系列データを標準化する処理を行う前処理部と、
前記前処理部で処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理部と、
グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析部と、を備える解析装置。
(2)前記前処理部は、前記時系列データの周期変動を検出し、周期変動を除去する処理を行う(1)に記載の解析装置。
(3)前記前処理部は、前記時系列データの正規分布性を検出し、正規分布性が条件を満たさない時系列データの正規分布性を補正する(1)または(2)に記載の解析装置。
(4)前記前処理部は、前記時系列データの外れ値を検出し、外れ値を検出した場合、直前の値に置換する補正する(1)から(3)のいずれかに記載の解析装置。
(5)前記前処理した時系列データから特徴量を抽出し、特徴量と時間の関係のデータを作成して前記クラスタリング処理部に供給する特徴量抽出部を有する(1)から(4)のいずれかに記載の解析装置。
(6)前記特徴量抽出部は、特徴量毎に次元圧縮処理を行う(5)に記載の解析装置。
(7)解析対象から検出した複数のパラメータの時系列データを取得するデータ取得ステップと、
前記データ取得ステップで取得した複数のパラメータの時系列データを標準化する処理を行う前処理ステップと、
前記前処理ステップで処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理ステップと、
グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析ステップと、を備える解析方法。
(8)解析対象から検出した複数のパラメータの時系列データを取得するデータ取得ステップと、
前記データ取得ステップで取得した複数のパラメータの時系列データを標準化する処理を行う前処理ステップと、
前記前処理ステップで処理した時系列データの特徴量に基づいて、特徴量の発生する時点が許容範囲以内の差となる時系列データをグループ化するクラスタリング処理ステップと、
グループ化した時系列データから代表時系列データを特定し、各グループの代表時系列データに基づいて、各グループの時間ずれを算出する解析ステップと、をコンピュータに実行させる解析プログラム。
【符号の説明】
【0053】
10 解析装置
12 入力部
14 出力部
16 通信部
18 演算部
20 記憶部
22 データ取得部
24 前処理部
26 特徴量抽出部
28 クラスタリング処理部
30 解析部
32 前処理プログラム
34 解析プログラム
36 検出データ
38 プラントデータ
40 条件テーブル