特開2019-220105(P2019-220105A)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アズビル株式会社の特許一覧
特開2019-220105データ抽出方法およびデータ抽出装置
<>
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000003
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000004
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000005
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000006
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000007
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000008
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000009
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000010
  • 特開2019220105-データ抽出方法およびデータ抽出装置 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2019-220105(P2019-220105A)
(43)【公開日】2019年12月26日
(54)【発明の名称】データ抽出方法およびデータ抽出装置
(51)【国際特許分類】
   G05B 23/02 20060101AFI20191129BHJP
【FI】
   G05B23/02 Z
【審査請求】未請求
【請求項の数】6
【出願形態】OL
【全頁数】10
(21)【出願番号】特願2018-119235(P2018-119235)
(22)【出願日】2018年6月22日
(71)【出願人】
【識別番号】000006666
【氏名又は名称】アズビル株式会社
(74)【代理人】
【識別番号】110001461
【氏名又は名称】特許業務法人きさ特許商標事務所
(72)【発明者】
【氏名】宮本 晋太郎
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA01
3C223BA03
3C223CC02
3C223DD03
3C223EB01
3C223EB02
3C223FF03
3C223FF13
3C223FF15
3C223HH03
(57)【要約】
【課題】正常値のデータを精度よく且つ容易に抽出することができるデータ抽出方法およびデータ抽出装置を提供することを目的とする。
【解決手段】データ抽出方法において、グラフを表示するステップと、表示されたグラフ上で、外れ値を除く正常範囲、または外れ値のみを含む外れ範囲を選択するステップと、正常範囲が選択された場合は、正常範囲内のデータを抽出し、外れ範囲が選択された場合は、外れ範囲外のデータを抽出するステップと、を含むものとした。
【選択図】図3
【特許請求の範囲】
【請求項1】
グラフを表示するステップと、
表示された前記グラフ上で、外れ値を除く正常範囲、または外れ値のみを含む外れ範囲を選択するステップと、
前記正常範囲が選択された場合は、前記正常範囲内のデータを抽出し、前記外れ範囲が選択された場合は、前記外れ範囲外のデータを抽出するステップと、
を含むことを特徴とするデータ抽出方法。
【請求項2】
前記正常範囲または前記外れ範囲は、矩形、矩形以外の多角形または閉曲線であることを特徴とする請求項1に記載のデータ抽出方法。
【請求項3】
表示された前記グラフ上で、複数の前記正常範囲または複数の前記外れ範囲が選択されることを特徴とする請求項1または2に記載のデータ抽出方法。
【請求項4】
前記正常範囲または前記外れ範囲の大きさまたは形状は変更可能であることを特徴とする請求項1〜3の何れか一項に記載のデータ抽出方法。
【請求項5】
前記抽出したデータをファイル出力するステップをさらに備えることを特徴とする請求項1〜4の何れか一項に記載のデータ抽出方法。
【請求項6】
グラフを表示する表示部と、
前記表示部に表示された前記グラフ上での、外れ値を除く正常範囲、または外れ値のみを含む外れ範囲の選択に用いられる操作部と、
前記操作部を用いて選択された前記正常範囲内または前記外れ範囲外のデータを抽出する制御部と、を備えることを特徴とするデータ抽出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、外れ値を除去したデータを抽出するデータ抽出方法およびデータ抽出装置に関する。
【0002】
従来、データに統計的な処理を行う際に、機器故障などに起因する外れ値を除去して、正常値のデータのみを抽出することが知られている。例えば、特許文献1では、プラントモデルを作成する際に、プラントの運転データに対して外れ値処理を行うことが開示されている。特許文献1の外れ値処理では、まず運転データがマハラノビス距離に変換され、マハラノビス距離を用いて確率密度関数を求められる。そして、確率密度関数からχ2乗分布が作成され、閾値が算出される。その後、全てのデータのマハラノビス距離がチェックされ、閾値を超えるデータが外れ値として運転データから除去される。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2017−91056号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されるように、機械による演算によって外れ値処理を行う場合は、閾値との比較という単純な判定しか行うことができない。そのため、運転データの変化などにより、設定された閾値が適切でなくなった場合には、実際は外れ値であるにもかかわらず、外れ値と判断されないなどの問題が生じてしまう。
【0005】
また、人が運転データを確認し、外れ値であるか否かを判定してデータを抽出することで、抽出精度は向上する。この場合は、例えば運転データを示すトレンドグラフ上で外れ値を確認した後、トレンドグラフ全体のデータをファイルに出力し、別のシステムを使って、出力されたファイルから該当するデータを除くという手順を踏む。しかしながら、一般的に、トレンドグラフには数百点以上のデータが含まれるため、上記の手順を行うと、作業が非常に煩雑になってしまう。
【0006】
本発明は、上記従来技術における課題に鑑みてなされたものであり、正常値のデータを精度よく且つ容易に抽出することができるデータ抽出方法およびデータ抽出装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明のデータ抽出方法は、グラフを表示するステップと、表示されたグラフ上で、外れ値を除く正常範囲、または外れ値のみを含む外れ範囲を選択するステップと、正常範囲が選択された場合は、正常範囲内のデータを抽出し、外れ範囲が選択された場合、外れ範囲外のデータを抽出するステップと、を含む。
【0008】
本発明のデータ抽出装置は、グラフを表示する表示部と、表示部に表示されたグラフ上での、外れ値を除く正常範囲、または外れ値のみを含む外れ範囲の選択に用いられる操作部と、操作部を用いて選択された正常範囲内または外れ範囲外のデータを抽出する制御部と、を備える。
【発明の効果】
【0009】
本発明によれば、表示されたグラフ上で、外れ値を除く正常範囲、または外れ値のみを含む外れ範囲を選択し、正常範囲が選択された場合は、正常範囲内のデータを抽出し、外れ範囲が選択された場合、外れ範囲外のデータを抽出することで、正常値のデータを精度よく且つ容易に抽出することができる。
【図面の簡単な説明】
【0010】
図1】実施の形態1における制御システムの概略構成図である。
図2】実施の形態1におけるクライアントコンピュータの構成を示すブロック図である。
図3】実施の形態1における矩形を用いた正常範囲の選択を説明する図である。
図4】実施の形態1における多角形を用いた正常範囲の選択を説明する図である。
図5】実施の形態1における複数の正常範囲の選択を説明する図である。
図6】レイキャスティング法を用いたデータ抽出を説明する図である。
図7】データ抽出部により出力されるデータの一例を示す図である。
図8】実施の形態1におけるデータ抽出方法のフローチャートである。
図9】実施の形態2における外れ範囲の選択を説明する図である。
【発明を実施するための形態】
【0011】
実施の形態1.
以下、本発明に係るデータ抽出方法を実施する制御システム100の実施の形態について、図面を参照して説明する。図1は、実施の形態1における制御システム100の概略構成図である。制御システム100は、プラントまたは工場における運転データを収集および蓄積し、情報管理および制御を行うシステムである。図1に示すように、制御システム100は、制御装置1と、制御システムGW(ゲートウェイ)2と、制御装置マンマシン3と、ヒストリサーバコンピュータ4と、クライアントコンピュータ5と、を備える。
【0012】
制御装置1は、信号線6を介して流量計11および圧力計12に接続され、流量計11および圧力計12の測定結果、すなわち、流体の流量、流体の流れの圧力を取得する。なお、流量計11および圧力計12に替えて、または加えて、温度等を検出する各種センサ、流量または圧力制御弁等の各種バルブを制御するバルブポジショナ、ポンプまたはファン等を動作させる各種アクチュエータ等が制御装置1に接続されてもよい。また、図1では、1つの制御装置1が示されるが、複数の制御装置1を備えてもよい。
【0013】
制御システムGW2は、制御システムネットワーク7を介して制御装置1に接続される。制御システムGW2は、制御システムネットワーク7と、上位システムネットワーク8などの制御システムネットワーク7以外のシステムとを中継接続し、相互のデータ通信を可能とする。制御システムGW2は、例えばOPC(OLE for Process Control)サーバである。
【0014】
制御装置マンマシン3は、制御システムネットワーク7を介して、制御システムGW2および制御装置1と接続される。制御装置マンマシン3は、プラントを管理する管理者(ユーザ)と、制御システム100を構成する各種装置とのインターフェースの役割を担うものであり、制御装置マンマシン3によって制御装置1が操作される。
【0015】
ヒストリサーバコンピュータ4は、上位システムネットワーク8に接続されるとともに、制御システムGW2を介して、制御システムネットワーク7に接続される。ヒストリサーバコンピュータ4は、制御システムGW2を介して、所定の周期、または任意のタイミングで、流量計11および圧力計12などの測定機器によって測定される測定値を含む運転データを収集する。収集されたデータは、測定機器毎に所定の期間の連続ヒストリとして蓄積される。連続ヒストリに含まれるデータは、測定機器による測定値、当該測定値の測定日時(タイムスタンプ)および測定機器の識別情報などを含む。
【0016】
クライアントコンピュータ5は、ヒストリサーバコンピュータ4と上位システムネットワーク8を介して接続される。クライアントコンピュータ5は、本発明における「データ抽出装置」に相当し、ヒストリサーバコンピュータ4に蓄積されるデータに対して外れ値処理を行い正常値のデータを抽出する。
【0017】
図2は、本実施の形態におけるクライアントコンピュータ5の構成を示すブロック図である。図2に示すように、クライアントコンピュータ5は、制御部51と、表示部52と、操作部53と、記憶部54とを備える。制御部51は、記憶部54に格納されるプログラムを実行するCPU(Central Processing Unit)、マイクロコンピュータ、またはGPU(Graphics Processing Unit)などで構成される。なお、制御部51を単一または複合回路などのハードウェアで構成してもよい。
【0018】
表示部52は、LCD(Liquid Crystal Display)などのディスプレイである。操作部53は、マウスまたはスタイラスペンなどのポインティングデバイスである。操作部53は、さらにキーボードを含んでもよい。また、表示部52および操作部53をタッチパネルで構成してもよい。記憶部54は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)またはフラッシュメモリ等の、不揮発性または揮発性の半導体メモリである。記憶部54には、制御部51で実行される各種プログラム、および後述する正常値のデータなどが記憶される。
【0019】
制御部51は、プログラムを実行することにより実現される機能部として、データ取得部511と、トレンドグラフ生成部512と、範囲選択部513と、データ抽出部514と、を有する。データ取得部511は、ヒストリサーバコンピュータ4に蓄積される連続ヒストリ毎にデータを取得する。トレンドグラフ生成部512は、データ取得部511が取得したデータに基づき、トレンドグラフを生成する。トレンドグラフ生成部512により生成されたトレンドグラフは、表示部52に表示される。範囲選択部513は、操作部53を用いた正常範囲の選択を受け付ける。範囲選択部513により選択された正常範囲は、トレンドグラフ上に表示される。
【0020】
操作部53を用いた正常範囲の選択について、図3図5を参照して説明する。本実施の形態では、操作部53を用いて、表示部52に表示されるトレンドグラフ上で、外れ値を除いた正常範囲が選択される。トレンドグラフ上での正常範囲の選択方法としては、矩形を用いた選択と、矩形以外の多角形を用いた選択がある。なお、以下の説明において、矩形以外の多角形を単に多角形と称する。
【0021】
図3は、本実施の形態における矩形を用いた正常範囲の選択を説明する図である。図3に示すように、表示部52には、トレンドグラフ生成部512により生成されたトレンドグラフT1が表示される。トレンドグラフT1は、ヒストリサーバコンピュータ4の連続ヒストリに含まれるデータに基づき生成されたものであり、横軸が時間(測定日時)を示し、縦軸が測定値を示す。そして、矩形を用いて正常範囲の選択を行う場合は、トレンドグラフ上で、外れ値以外のデータを含む矩形の対角となる2点が選択される。
【0022】
図3に示す例の場合、ユーザは、操作部53を用いて点P1と点P2とを選択する。具体的には、操作部53がマウスの場合、点P1と点P2とをクリックする。そして、選択完了の操作をすることで、点P1および点P2を対角とした矩形の領域が正常範囲501として選択される。選択完了の操作は、終点のP2をダブルクリックすること、または操作部53がキーボードを含む場合は、キーボードの実行キーを押すことなどである。さらに、表示部52に選択ボタンを表示し、当該選択ボタンが押されることを選択完了の操作としてもよい。
【0023】
続いて、図4は、本実施の形態における多角形を用いた正常範囲の選択を説明する図である。図4に示すように、時間によって測定値が変化するトレンドグラフT2の場合、矩形での選択を行うと、外れ値が正常範囲に含まれてしまう。そこで、この場合には、トレンドグラフ上の外れ値以外のデータを含む多角形の頂点が選択される。
【0024】
図4に示す例の場合、ユーザは、操作部53を用いて点P1、点P2、点P3および点P4を選択する。具体的には、操作部53がマウスの場合、点P1と、点P2と、点P3と点P4とをクリックする。そして、選択完了の操作をすることで、点P1、点P2、点P3および点P4を結ぶ多角形の領域が正常範囲502として選択される。選択完了の操作は、矩形を用いた場合と同様であり、終点のP4をダブルクリックすることなどである。
【0025】
また、範囲選択部513は、一つのトレンドグラフに対して、複数の正常範囲の選択を受け付けてもよい。図5は、本実施の形態における複数の正常範囲の選択を説明する図である。図5に示すように、運転の休止と再開を含むトレンドグラフT3では、スタートアップ時の測定値の変動が大きくなるため、これらを外れ値として除外することが望まれる。そこで、この場合には、トレンドグラフ上の外れ値を除いた複数の正常範囲が選択される。
【0026】
図5に示す例の場合、まず、ユーザは、操作部53を用いて点P1と点P2とを選択する。そして、選択完了の操作をすることで、点P1および点P2を対角とした矩形の領域が、運転休止前の正常値を含む正常範囲503として選択される。また、ユーザは、操作部53を用いて、スタートアップ時の変動している値、すなわち外れ値を除く多角形の頂点である点P3、点P4、点P5、点P6および点P7を選択する。そして、選択完了の操作をすることで、点P3、点P4、点P5、点P6および点P7を結ぶ多角形の領域が、スタートアップ後の正常値を含む正常範囲504として選択される。
【0027】
図2に戻って、データ抽出部514は、データ取得部511が取得した連続ヒストリに含まれるデータのうち、範囲選択部513で選択された正常範囲内のデータを抽出する。データの測定値が正常範囲内にあるか否かの判定には、例えばレイキャスティング法(Ray Casting Algorithm)が用いられる。図6は、レイキャスティング法を用いたデータ抽出を説明する図である。本方法では、まず、選択された正常範囲505の外側から、判定対象となるデータの測定値に対して直線Lを引く。そして、正常範囲505の辺と、直線Lとの交点の数が奇数の場合は、当該測定値は正常範囲内にあると判定され、偶数の場合は、当該測定値は正常範囲外にあると判定される。
【0028】
図6の例では、交点が1つの測定値D1および交点が3つの測定値D2は、正常範囲内にあると判定され、交点が2つの測定値D2は、正常範囲外にあると判定される。そして、データ抽出部514は、正常範囲内にあると判定された測定値を含むデータのみを抽出し、ファイル出力する。このときのファイル形式は、例えばcsv(Comma Separated Value)形式である。データ抽出部514により出力されるファイルは、記憶部54に記憶される。
【0029】
図7は、データ抽出部514により出力されるデータの一例を示す図である。図7では、図3に示すトレンドグラフT1において、正常範囲501が選択された場合に抽出されるデータを示す。図7に示すように、図3において正常範囲501の外側にあるデータ(100,240)は、外れ値として除去され、正常値を含むデータのみが抽出される。
【0030】
これにより、クライアントコンピュータ5の記憶部54には、外れ値を除外した正常値のデータが蓄積される。記憶部54に蓄積されるデータは、制御システム100の正常な振る舞いを学習するモデルを生成するためなどに用いられる。このモデルは、設備の不調または故障などによる通常とは異なる動きを早期に検知し、管理者に知らせるために用いられる。なお、モデルの生成は、クライアントコンピュータ5で行ってもよいし、クライアントコンピュータ5に接続されるその他の機器にて行ってもよい。その他の機器にてモデルの生成を行う場合には、データ抽出部514にて抽出されたデータを直接その他の機器に出力してもよい。
【0031】
図8は、本実施の形態におけるデータ抽出方法のフローチャートである。データ抽出方法は、制御部51が記憶部54に記憶されるデータ抽出プログラムを実行することにより実施される。まず、トレンドグラフ生成部512により、トレンドグラフが生成され、表示部52に表示される(S1)。
【0032】
そして、表示部52に表示されるトレンドグラフに対して、選択完了の操作が行われたか否かが判断される(S2)。選択完了の操作が行われるまでは、表示部52にトレンドグラフを表示した状態で待機する(S2:NO)。そして、選択完了の操作が行われた場合(S2:YES)、選択された点の数に応じて処理が行われる(S3)。まず、選択された点が2点未満の場合は(S3:2点未満)、表示部52に、正常範囲が選択されなかったことを示すエラー表示が行われ(S4)、本処理を終了する。
【0033】
また、2点が選択されている場合は(S3:2点)、選択された2点を対角とした矩形の領域が正常範囲として選択される(S5)。さらに、2点以上が選択されている場合は(S3:2点以上)、選択された点を頂点とする多角形の領域が正常範囲として選択される(S6)。
【0034】
そして、追加の正常範囲の選択があるか否かが判断され(S7)、追加の選択がある場合は(S7:YES)、ステップS2に戻って以降の処理を繰り返すことで、追加の正常範囲が選択される。追加の正常範囲の選択があるか否かは、前回の選択完了からの所定の時間内の点の選択の有無で判断する。または、表示部52に追加の選択の有無を確認するダイアログボックスを表示させて確認してもよい。一方、追加の正常範囲の選択がない場合は(S7:NO)、選択された正常範囲内のデータが抽出される(S8)。そして、抽出されたデータがファイル出力され(S9)、本処理を終了する。
【0035】
以上のように、本実施の形態によれば、表示部52に表示されたトレンドグラフ上で、操作部53を介して正常範囲が選択されることにより、抽出すべきデータを判別することができる。これにより、トレンドグラフ上で外れ値を除いた正常範囲を選択するだけで、容易に正常値のデータを抽出することができ、手間の削減となる。また、ユーザがトレンドグラフを確認して外れ値を判断することで、正常値のデータを精度よく抽出することができる。特に、正常値データを機械学習に用いる場合には、人による直感的な判断を機械学習に反映させることができ、学習精度が向上する。また、任意の形状の正常範囲を選択できることで、単純な条件式では抽出できない範囲を選択することができる。
【0036】
実施の形態2.
次に、本発明の実施の形態2について説明する。実施の形態1では、トレンドグラフ上で正常範囲を選択する構成としたが、実施の形態2では、トレンドグラフ上で外れ値のみを含む外れ範囲を選択する点において、実施の形態1と相違する。本実施の形態における制御システム100の構成およびクライアントコンピュータ5の構成は、実施の形態1と同じである。
【0037】
図9は、実施の形態2における外れ範囲の選択を説明する図である。本実施の形態における外れ範囲の選択方法は、実施の形態1と同様に、矩形を用いた選択と、矩形以外の多角形を用いた選択がある。そして、矩形を用いて選択を行う場合は、トレンドグラフ上で、外れ値のみを含む矩形の対角となる2点が選択される。図9に示す例の場合、ユーザは、操作部53を用いて点P1と点P2とを選択する。そして、選択完了の操作をすることで、点P1および点P2を対角とした矩形の領域が、外れ範囲601として選択される。
【0038】
また、多角形を用いて選択を行う場合は、トレンドグラフ上の外れ値のみを含む多角形の頂点が選択される。さらに、本実施の形態においても、複数の外れ範囲が選択されてもよい。
【0039】
本実施の形態のデータ抽出部514は、上記のように選択された外れ範囲外のデータを抽出する。具体的には、データ抽出部514は、実施の形態1と同様に、レイキャスティング法を用いて、各測定値が外れ範囲外にあるか否かを判定し、外れ範囲外にあると判定された測定値を含むデータのみを抽出し、ファイル出力する。これにより、実施の形態1と同様に、正常値のみを含むデータが抽出される。
【0040】
本実施の形態においても、実施の形態1と同様の効果を得ることができる。また、正常範囲が多数あり、外れ範囲が少数ある場合には、範囲を選択する手間を削減することができ、作業効率が向上する。
【0041】
以上が本発明の実施の形態の説明であるが、本発明は、上記の実施の形態に限定されるものではなく、本発明の主旨を逸脱しない範囲で種々に変形することが可能である。例えば、上記実施の形態では、クライアントコンピュータ5の制御部51において、データ取得部511およびトレンドグラフ生成部512を備える構成としたが、これらは省略してもよい。この場合は、ヒストリサーバコンピュータ4がトレンドグラフ生成部512を備える構成とし、ヒストリサーバコンピュータ4にてトレンドグラフを生成し、クライアントコンピュータ5に送信し、表示部52に表示してもよい。
【0042】
また、上記実施の形態では、トレンドグラフにおける正常値のデータを抽出する場合について説明したが、これに限定されるものではなく、2系列のデータの相関または変化を示すその他のグラフのデータ抽出にも適用可能である。さらに、本発明は、2軸グラフだけでなく、3軸グラフからのデータ抽出に適用してもよい。3軸のグラフにおいて、正常範囲または外れ範囲を選択する場合には、2軸毎に範囲を選択し、総合的な外れ値を除去すればよい。
【0043】
また、正常範囲または外れ範囲は、矩形または多角形に限定されるものではなく、円形または閉曲線などの任意の形状としてもよい。また、選択方法についても、上記実施の形態の例に限定されるものではなく、マウスをドラッグさせて範囲を選択する構成、またはスタイラスペンで範囲を囲んで選択する構成としてもよい。さらに、トレンドグラフ上で、既に選択した正常範囲を変更可能としてもよい。例えば、正常範囲を選択した後に、選択した正常範囲の大きさを拡大または縮小してもよい。または、正常範囲を選択した後に、さらに新たな頂点を選択し、多角形の形状を変更してもよい。
【0044】
また、実施の形態1と実施の形態2とを組み合わせ、正常範囲と外れ範囲の何れを選択するかを事前に選択できる構成としてもよい。これにより、トレンドグラフに応じて、最適な範囲を選択することができる。
【符号の説明】
【0045】
1 制御装置、2 制御システムGW、3 制御装置マンマシン、4 ヒストリサーバコンピュータ、5 クライアントコンピュータ、6 信号線、7 制御システムネットワーク、8 上位システムネットワーク、11 流量計、12 圧力計、51 制御部、52 表示部、53 操作部、54 記憶部、100 制御システム、511 データ取得部、512 トレンドグラフ生成部、513 範囲選択部、514 データ抽出部。
図1
図2
図3
図4
図5
図6
図7
図8
図9