IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士電機株式会社の特許一覧

<>
  • 特許-予測装置、予測方法及びプログラム 図1
  • 特許-予測装置、予測方法及びプログラム 図2
  • 特許-予測装置、予測方法及びプログラム 図3
  • 特許-予測装置、予測方法及びプログラム 図4
  • 特許-予測装置、予測方法及びプログラム 図5
  • 特許-予測装置、予測方法及びプログラム 図6
  • 特許-予測装置、予測方法及びプログラム 図7
  • 特許-予測装置、予測方法及びプログラム 図8
  • 特許-予測装置、予測方法及びプログラム 図9
  • 特許-予測装置、予測方法及びプログラム 図10
  • 特許-予測装置、予測方法及びプログラム 図11
  • 特許-予測装置、予測方法及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-11
(45)【発行日】2024-11-19
(54)【発明の名称】予測装置、予測方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20241112BHJP
   G06F 18/00 20230101ALI20241112BHJP
   G06F 123/02 20230101ALN20241112BHJP
【FI】
G06N20/00
G06F18/00
G06F123:02
【請求項の数】 10
(21)【出願番号】P 2024080054
(22)【出願日】2024-05-16
【審査請求日】2024-05-16
【早期審査対象出願】
(73)【特許権者】
【識別番号】000005234
【氏名又は名称】富士電機株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】増田 達矢
(72)【発明者】
【氏名】石橋 直人
(72)【発明者】
【氏名】池川 聖悟
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特開2023-122124(JP,A)
【文献】国際公開第2022/113273(WO,A1)
【文献】金子 弘昌,k最近傍法(k-Nearest Neighbor, k-NN)でクラス分類・回帰分析・モデルの適用範囲(適用領域)の設定をしよう!,データ化学工学研究室(金子研究室)@明治大学 理工学部 応用化学科[online],2018年04月14日,[retrieved on 2024.08.15], Retrieved from the Internet: <URL: https://datachemeng.com/knn/>
【文献】k近傍法,ウィキペディア[online],2023年11月07日,[retrieved on 2024.08.15], Retrieved from the Internet: <URL: https://ja.wikipedia.org/wiki/K%E8%BF%91%E5%82%8D%E6%B3%95>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 18/00
G06F 123/02
(57)【特許請求の範囲】
【請求項1】
複数の変数を含む複数の時系列データを取得するように構成されている取得部と、
前記複数の変数それぞれの重要度に基づいて1以上の説明変数を選択するように構成されている変数選択部と、
前記複数の時系列データのうち2個の前記時系列データの間の類似度を要素とする行列を前記説明変数ごとに計算するように構成されている行列計算部と、
前記説明変数ごとの行列に基づいて、前記時系列データごとの特徴データを計算するように構成されている特徴計算部と、
前記時系列データごとの特徴データに基づいて、前記複数の時系列データのうち予測対象とする前記時系列データに類似する類似データを探索するように構成されている探索部と、
前記類似データに基づいて、所定の目的変数の時系列データを予測するように構成されている予測部と、
を備える予測装置。
【請求項2】
前記行列計算部は、前記時系列データの波形に基づく前記類似度を計算するように構成されている、
請求項1に記載の予測装置。
【請求項3】
前記行列計算部は、動的時間伸縮法により前記類似度を計算するように構成されている、
請求項に記載の予測装置。
【請求項4】
前記特徴計算部は、固有値分解により前記行列を次元圧縮した前記特徴データを計算するように構成されている、
請求項1から3のいずれかに記載の予測装置。
【請求項5】
前記探索部は、前記特徴データを配置した特徴空間において、前記類似データを探索するように構成されている、
請求項1から3のいずれかに記載の予測装置。
【請求項6】
前記目的変数の時系列データを含む予測結果を可視化するように構成されている可視化部をさらに備える、
請求項1から3のいずれかに記載の予測装置。
【請求項7】
前記予測結果は、前記目的変数の予測に用いた情報を含む、
請求項に記載の予測装置。
【請求項8】
前記予測に用いた情報は、前記説明変数の変数重要度、前記特徴データの散布図、又は前記類似データの波形の少なくとも1つを含む、
請求項に記載の予測装置。
【請求項9】
コンピュータが、
複数の変数を含む複数の時系列データを取得する手順と、
前記複数の変数それぞれの重要度に基づいて1以上の説明変数を選択する手順と、
前記複数の時系列データのうち2個の前記時系列データの間の類似度を要素とする行列を前記説明変数ごとに計算する手順と、
前記説明変数ごとの行列に基づいて、前記時系列データごとの特徴データを計算する手順と、
前記時系列データごとの特徴データに基づいて、前記複数の時系列データのうち予測対象とする前記時系列データに類似する類似データを探索する手順と、
前記類似データに基づいて、所定の目的変数の時系列データを予測する手順と、
を実行する予測方法。
【請求項10】
コンピュータに、
複数の変数を含む複数の時系列データを取得する手順と、
前記複数の変数それぞれの重要度に基づいて1以上の説明変数を選択する手順と、
前記複数の時系列データのうち2個の前記時系列データの間の類似度を要素とする行列を前記説明変数ごとに計算する手順と、
前記説明変数ごとの行列に基づいて、前記時系列データごとの特徴データを計算する手順と、
前記時系列データごとの特徴データに基づいて、前記複数の時系列データのうち予測対象とする前記時系列データに類似する類似データを探索する手順と、
前記類似データに基づいて、所定の目的変数の時系列データを予測する手順と、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、予測装置、予測方法及びプログラムに関する。
【背景技術】
【0002】
機械学習を用いて予測モデルを構築する技術が知られている。例えば、特許文献1には、実測値を示す点を複数のクラスタに分割し、予測モデルのパラメータを複数のクラスタごとに最適化し、パラメータが最適化された予測モデルが出力する予測値と実測値との差分をクラスタの数ごとに評価し、評価の結果に基づきクラスタの数を決定する装置が開示されている。また、特許文献2には、プロセスの将来状態を予測するにあたって、プロセスの時系列データベースから過去のプロセスの状態類似事例を検索する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第6637206号
【文献】特許第5176206号
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、時系列データを精度よく予測することが困難である。
【0005】
本開示は、時系列データを精度よく予測可能な技術を提供する。
【課題を解決するための手段】
【0006】
本開示の一態様による予測装置は、1以上の説明変数を含む複数の時系列データを取得する取得部と、複数の時系列データのうち2個の時系列データの間の類似度を要素とする行列を説明変数ごとに計算する行列計算部と、説明変数ごとの行列に基づいて、時系列データごとの特徴データを計算する特徴計算部と、時系列データごとの特徴データに基づいて、複数の時系列データのうち予測対象とする時系列データに類似する類似データを探索する探索部と、類似データに基づいて、所定の目的変数の時系列データを予測する予測部と、を備える。
【発明の効果】
【0007】
本開示の一態様によれば、時系列データを精度よく予測できる。
【図面の簡単な説明】
【0008】
図1】予測システムの全体構成の一例を示すブロック図である。
図2】コンピュータのハードウェア構成の一例を示すブロック図である。
図3】予測システムの機能構成の一例を示すブロック図である。
図4】予測方法の一例を示すフローチャートである。
図5】バッチプロセスデータの一例を示す図である。
図6】データベースの一例を示す図である。
図7】変数重要度の一例を示す図である。
図8】距離行列の一例を示す図である。
図9】固有ベクトルの一例を示す図である。
図10】近傍探索の一例を示す図である。
図11】予測データの一例を示す図である。
図12】表示画面の一例を示す図である。
【発明を実施するための形態】
【0009】
以下、本開示の各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0010】
[実施形態]
本開示の一実施形態は、予測対象に関する所定の目的変数を予測する予測システムである。本実施形態に係る予測対象は、所定のバッチプロセスを実行する。一例として、予測対象が鉄鋼又は化学等のプラントであれば、バッチプロセスは1回の操業に相当する。予測対象は、バッチプロセスと解釈可能な連続プロセスを実行してもよい。例えば、電力又は熱等の需要量、株価又は電力価格等の価格、若しくは河川又はダム等の流入量等は連続プロセスデータであるが、所定の時間区間(例えば、1日、1週間又は1か月等)で分割すれば、バッチプロセスとして解釈できる。
【0011】
目的変数は、予測対象で取得可能な変数であれば、任意の変数を用いてよい。本実施形態では、一例として、プラントに設けられた温度センサで測定される温度を目的変数とする。ただし、目的変数はプラントの温度に限定されるものではなく、例えば材料の量、圧力、電力又は熱等、用途に応じて様々な変数を目的変数として用いてよい。また、目的変数は、実測可能な変数でなくてもよく、例えば所定の情報処理により取得、計算又は予測できる変数であってもよい。
【0012】
例えば工場又はプラント等に設けられたセンサで測定されたデータを収集し、例えば機械学習を用いて予測モデルを構築する技術が知られている。機械学習による予測は、例えば熱又は電力等の需要量、株価又は電力価格等の価格、若しくは河川又はダム等への流入量等を予測対象とする様々な場面で注目されている。工場又はプラント等では、どのような操作をすべきかを事前に判断するために、将来の値を予測することが行われる。
【0013】
しかしながら、従来技術では、時系列データを精度よく予測することが困難である。例えば、特許文献1では、予め構築した予測モデルを用いて予測するため、運用するに連れて予測モデルが陳腐化し、予測精度が低下する。特許文献2では、一時点の変数を予測するため、予測対象の時間区間に含まれる時点ごとに、類似するプロセスデータの探索及び予測モデルの構築を行うため、波形の特徴を考慮した予測ができない。
【0014】
本実施形態は、所定の目的変数の時系列データを精度よく予測することを目的とする。そのために、本実施形態は、1以上の説明変数を含む2個の時系列データの間の類似度を要素とする行列を説明変数ごとに計算し、説明変数ごとの行列に基づいて計算された特徴データに基づいて、予測対象とする時系列データに類似する類似データを探索し、類似データに基づいて、所定の目的変数の時系列データを予測する。
【0015】
一の側面では、本実施形態によれば、逐次的に予測対象データと類似する時系列データを探索するため、所定の目的変数を精度よく予測できる。他の側面では、本実施形態によれば、時系列データの間の類似度に基づいて予測対象データと類似する時系列データを探索するため、波形の特徴を考慮しながら時系列データを予測できる。したがって、本実施形態によれば、所定の目的変数の時系列データを精度よく予測できる。
【0016】
<全体構成>
本実施形態における予測システムの全体構成について、図1を参照しながら説明する。図1は、予測システムの全体構成の一例を示すブロック図である。
【0017】
図1に示されているように、予測システム1000は、予測対象10、予測装置20及び1台以上の端末装置30を含む。予測対象10、予測装置20及び端末装置30は、LAN(Local Area Network)又はインターネット等の通信ネットワークNを介してデータ通信可能に接続されている。
【0018】
予測対象10は、バッチプロセスを実行する対象物の一例である。予測対象10は、一例として、工場又はプラント、若しくはそれらに設置された設備、機器又は装置等でもよい。予測対象10は、複数の工場、プラント、設備、機器又は装置を含んでもよい。
【0019】
予測対象10は、バッチプロセスの実行中に、バッチプロセスデータを生成する。バッチプロセスデータは、予測対象10の状態を示す変数の時間変化を示す時系列データである。バッチプロセスデータは、1つの予測対象10で取得された複数の変数を含んでもよい。バッチプロセスデータは、複数の予測対象10それぞれで取得された複数の変数を含んでもよい。
【0020】
予測装置20は、所定の目的変数の時系列データを予測するパーソナルコンピュータ、ワークステーション、サーバ等の情報処理装置の一例である。予測装置20は、予測対象10からバッチプロセスデータを取得する。予測装置20は、バッチプロセスデータに基づいて、目的変数の時系列データを予測し、その予測結果を端末装置30に送信する。
【0021】
端末装置30は、予測システム1000の利用者が操作するパーソナルコンピュータ、タブレット端末、スマートフォン等の情報処理端末の一例である。端末装置30は、ユーザの操作に応じて、予測装置20に目的変数の予測を要求する。端末装置30は、予測装置20から予測結果を受信し、利用者に対して出力する。
【0022】
なお、図1に示した予測システム1000の全体構成は一例であって、用途や目的に応じて様々なシステム構成例があり得る。例えば、予測対象10、予測装置20及び端末装置30の1つ以上が、予測システム1000に複数台含まれていてもよい。例えば、予測装置20は、複数台のコンピュータにより実現してもよいし、クラウドコンピューティングのサービスとして実現してもよい。図1に示す予測対象10、予測装置20、端末装置30のような装置の区分は一例である。
【0023】
<ハードウェア構成>
予測システム1000に含まれる各装置のハードウェア構成について、図2を参照しながら説明する。予測システム1000に含まれる予測装置20及び端末装置30は、例えばコンピュータにより実現される。図2は、コンピュータのハードウェア構成の一例を示すブロック図である。
【0024】
図2に示されているように、コンピュータ500は、CPU(Central Processing Unit)501、ROM(Read Only Memory)502、RAM(Random Access Memory)503、HDD(Hard Disk Drive)504、入力装置505、表示装置506、通信I/F(Interface)507及び外部I/F508を有する。CPU501、ROM502及びRAM503は、いわゆるコンピュータを形成する。コンピュータ500の各ハードウェアは、バスライン509を介して相互に接続されている。なお、入力装置505及び表示装置506は外部I/F508に接続して利用する形態であってもよい。
【0025】
CPU501は、ROM502又はHDD504等の記憶装置からプログラムやデータをRAM503上に読み出し、処理を実行することで、コンピュータ500全体の制御や機能を実現する演算装置である。コンピュータ500は、CPU501に加えて又はCPU501に代えて、GPU(Graphics Processing Unit)を有していてもよい。
【0026】
ROM502は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)の一例である。ROM502は、HDD504にインストールされている各種プログラムをCPU501が実行するために必要な各種プログラム、データ等を格納する主記憶装置として機能する。具体的には、ROM502には、コンピュータ500の起動時に実行されるBIOS(Basic Input/Output System)、EFI(Extensible Firmware Interface)等のブートプログラムや、OS(Operating System)設定、ネットワーク設定等のデータが格納されている。
【0027】
RAM503は、電源を切るとプログラムやデータが消去される揮発性の半導体メモリ(記憶装置)の一例である。RAM503は、例えば、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等である。RAM503は、HDD504にインストールされている各種プログラムがCPU501によって実行される際に展開される作業領域を提供する。
【0028】
HDD504は、プログラムやデータを格納している不揮発性の記憶装置の一例である。HDD504に格納されるプログラムやデータには、コンピュータ500全体を制御する基本ソフトウェアであるOS、及びOS上において各種機能を提供するアプリケーション等がある。なお、コンピュータ500はHDD504に替えて、記憶媒体としてフラッシュメモリを用いる記憶装置(例えばSSD:Solid State Drive等)を利用するものであってもよい。
【0029】
入力装置505は、ユーザが各種信号を入力するために用いるタッチパネル、操作キーやボタン、キーボードやマウス、音声等の音データを入力するマイクロホン等である。
【0030】
表示装置506は、画面を表示する液晶や有機EL(Electro-Luminescence)等のディスプレイ、音声等の音データを出力するスピーカ等で構成されている。
【0031】
通信I/F507は、通信ネットワークに接続し、コンピュータ500がデータ通信を行うためのインタフェースである。
【0032】
外部I/F508は、外部装置とのインタフェースである。外部装置には、ドライブ装置510等がある。
【0033】
ドライブ装置510は、記録媒体511をセットするためのデバイスである。ここでいう記録媒体511には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体511には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。これにより、コンピュータ500は外部I/F508を介して記録媒体511の読み取り及び/又は書き込みを行うことができる。
【0034】
なお、HDD504にインストールされる各種プログラムは、例えば、配布された記録媒体511が外部I/F508に接続されたドライブ装置510にセットされ、記録媒体511に記録された各種プログラムがドライブ装置510により読み出されることでインストールされる。あるいは、HDD504にインストールされる各種プログラムは、通信I/F507を介して、通信ネットワークとは異なる他のネットワークよりダウンロードされることでインストールされてもよい。
【0035】
<機能構成>
予測システム1000の機能構成について、図3を参照しながら説明する。図3は、予測システムの機能構成の一例を示すブロック図である。
【0036】
図3に示されているように、予測装置20は、取得部110、データ記憶部120、変数選択部130、行列計算部140、特徴計算部150、探索部160、予測部170及び可視化部180を備える。
【0037】
取得部110、変数選択部130、行列計算部140、特徴計算部150、探索部160、予測部170及び可視化部180は、図2に示されているHDD504からRAM503上に展開されたプログラムがCPU501に実行させる処理によって実現される。
【0038】
データ記憶部120は、図2に示されているHDD504によって実現される。
【0039】
取得部110は、予測対象10からバッチプロセスデータを取得する。取得部110は、予測対象10が出力したバッチプロセスデータを予測対象10から受信してもよい。取得部110は、端末装置30に入力されたバッチプロセスデータを端末装置30から受信してもよい。取得部110は、予測装置20の入力装置505に入力されたバッチプロセスデータを受け付けてもよい。
【0040】
データ記憶部120には、取得部110が取得したバッチプロセスデータが記憶される。データ記憶部120には、予測装置20が処理に用いる他のデータ又は処理途中のデータ等が記憶されてもよい。
【0041】
データ記憶部120には、過去に取得されたバッチプロセスデータが蓄積されていてもよい。データ記憶部120に記憶されたバッチプロセスデータは、所定の時間が経過したときに削除されてもよい。ここでは、データ記憶部120にm個のバッチプロセスデータが記憶されているものとする。ただし、mは2以上の整数である。
【0042】
変数選択部130は、データ記憶部120から読み出したバッチプロセスデータに含まれる複数の変数から、所定の目的変数を適切に予測可能な1以上の説明変数を選択する。変数選択部130は、予め定められた変数を説明変数として選択してもよい。変数選択部130は、複数の変数それぞれの重要度に基づいて説明変数を選択してもよい。重要度は、一例として、決定木から計算可能な変数重要度でもよい。変数重要度は、目的変数との相関関係に基づいて重み付けしてもよい。
【0043】
行列計算部140は、変数選択部130が選択した説明変数ごとに、データ記憶部120から読み出したバッチプロセスデータのうち、2個のバッチプロセスデータの間の類似度を要素とする行列を計算する。以下、行列計算部140が計算する行列を「距離行列」と呼ぶ。
【0044】
行列計算部140は、バッチプロセスデータの波形に基づく類似度を計算してもよい。行列計算部140は、一例として、ユークリッド距離、相互相関関数、シェイプレット、又は動的時間伸縮法を用いて類似度を計算してもよい。行列計算部140は、他の一例として、各バッチプロセスデータの波形図を画像認識技術によって識別し、類似度を計算してもよい。類似度は、距離として定義可能な計算であれば任意の指標を用いることができる。類似度は、距離の公理に従うものであればよく、所定の距離を変換したものでもよい。類似度は、例えば、相関係数等を用いてもよい。
【0045】
特徴計算部150は、行列計算部140が計算した距離行列に基づいて、バッチプロセスデータごとの特徴データを計算する。特徴計算部150は、固有値分解により距離行列を次元圧縮した特徴データを計算してもよい。固有値分解とは、解析の対象となる行列に対する固有値方程式から固有値を求め、固有値に対応する固有ベクトルを求める手法である。固有ベクトルは、特徴データの一例である。固有ベクトルの次元数は、1以上m以下となる。
【0046】
探索部160は、特徴計算部150が計算した特徴データに基づいて、データ記憶部120から読み出したバッチプロセスデータのうち、予測対象データに類似するバッチプロセスデータ(以下、「類似データ」とも呼ぶ)を探索する。類似データは、予測対象データの特徴データに類似する特徴データに対応する1以上のバッチプロセスデータを含む。
【0047】
予測部170は、探索部160が探索した類似データに基づいて、目的変数の時系列データ(以下、「予測データ」とも呼ぶ)を予測する。予測部170は、類似データに含まれる目的変数の時系列データに基づいて、予測データを計算してもよい。
【0048】
予測部170は、類似データから目的変数の時系列データを取り出し、目的変数の時系列データの各時点の平均値を計算することで、予測データを計算してもよい。予測部170は、類似データに基づいて統計モデル又は機械学習モデルを構築し、当該モデルに基づいて予測データを推論してもよい。予測部170は、類似データが1個であれば、当該類似データに含まれる目的変数の時系列データを予測データとして出力してもよい。
【0049】
可視化部180は、予測部170による予測結果を出力する。可視化部180は、予測結果を可視化する表示画面を端末装置30の表示装置506に表示させてもよい。可視化部180は、予測結果を可視化する表示画面を予測装置20の表示装置506に表示してもよい。
【0050】
予測結果は、予測部170が計算した予測データを含む。予測結果は、予測データの予測に用いた情報を含んでもよい。予測に用いた情報は、一例として、変数選択部130が計算した重要度並びに重み、行列計算部140が計算した距離行列、特徴計算部150が計算した特徴データ、及び探索部160が探索した類似データを含んでもよい。
【0051】
<処理手順>
予測システム1000が実行する予測方法の処理手順について、図4を参照しながら説明する。図4は、予測方法の一例を示すフローチャートである。
【0052】
ステップS1において、予測対象10は、バッチプロセスを実行する。予測対象10は、バッチプロセスの実行中にバッチプロセスデータを生成する。予測対象10は、生成したバッチプロセスデータを予測装置20に送信する。
【0053】
バッチプロセスデータは、予測対象10の運転データ又はセンサデータを含んでもよい。運転データは、工場、プラント、設備、機器又は装置に関する正常範囲又は異常範囲、若しくは、操業又は設備点検等のイベント情報等を含んでもよい。センサデータは、予測対象10に設けられた種々のセンサで計測されたセンサ値を含んでもよい。
【0054】
図5は、バッチプロセスデータの一例を示す図である。図5には、実行した時刻が異なる2つのバッチプロセスA,Bで生成されたバッチプロセスデータが示されている。図5に示したバッチプロセスデータは、n+1個の変数(Y,X1,・・・,Xn)を含む。ただし、nは自然数である。各変数Y,X1,・・・,Xnは、時間変化を伴う変数であり、横軸を時刻(time)とし、縦軸を変数の値としたグラフで表現可能な時系列データである。なお、変数Yは目的変数であり、変数X1,・・・,Xnは目的変数以外の変数である。
【0055】
本実施形態では、目的変数Yは温度でもよい。また、変数X1,・・・,Xnは、湿度、二酸化炭素濃度1、二酸化炭素濃度2、酸素濃度1、酸素濃度2、材料Aの量、材料Bの量、圧力1、圧力2、及び外気温等を含んでもよい。二酸化炭素濃度、酸素濃度、材料の量又は圧力等は、測定箇所の数等に応じて複数の変数を含んでもよい。
【0056】
図4に戻って説明する。ステップS2において、予測装置20の取得部110は、予測対象10からバッチプロセスデータを受信する。取得部110は、受信したバッチプロセスデータをデータ記憶部120に記憶する。
【0057】
データ記憶部120には、バッチプロセスデータを格納するためのデータベースが構築されていてもよい。取得部110は、バッチプロセスを識別する識別情報を関連付けて、バッチプロセスデータをデータベースに格納してもよい。識別情報は、バッチプロセスを実行した時点を示す時間情報でもよい。
【0058】
図6は、データベースの一例を示す図である。図6に示すように、データベースは、データ項目として、ラベルDATE、目的変数Y、及びn個の説明変数X1,・・・,Xnを含む。ラベルDATEは、識別情報の一例である。目的変数Y及び説明変数X1,・・・,Xnは、バッチプロセスデータである。
【0059】
本実施形態では、1日の操業をバッチプロセスとして、同じ日に測定された複数時点のセンサ値を1つのバッチプロセスデータとして取り扱う。図6に示す例では、ラベル20240101-1から20240101-10までの10レコードが1つのバッチプロセスデータに対応する。最も新しい日付のバッチプロセスに対応するバッチプロセスデータは、予測対象とするバッチプロセスデータ(以下、「予測対象データ」とも呼ぶ)となる。
【0060】
予測対象データは、現在実行中のバッチプロセスに関するバッチプロセスデータでもよく、将来実行するバッチプロセスに関するバッチプロセスデータでもよい。将来実行するバッチプロセスに関するバッチプロセスデータに含まれる説明変数は、学習済みモデルに基づいて予測された値でもよい。
【0061】
図4に戻って説明する。ステップS3において、端末装置30のユーザは、目的変数の予測を要求するための操作を行う。端末装置30は、ユーザの操作に応じて、目的変数の予測要求を予測装置20に送信する。予測装置20は、端末装置30から予測要求を受信する。
【0062】
予測装置20の変数選択部130は、端末装置30からの予測要求に応じて、データ記憶部120からバッチプロセスデータを読み出す。変数選択部130は、バッチプロセスデータに含まれる複数の変数から1以上の説明変数を選択する。本実施形態では、変数選択部130は、決定木により計算される変数重要度に基づいて、1以上の説明変数を選択する。変数選択部130は、選択した説明変数を行列計算部140に送る。
【0063】
図7は、変数重要度の一例を示す図である。図7に示されるように、決定木により計算される変数重要度は、説明変数X1,・・・,Xnにより異なる。変数選択部130は、変数重要度が所定の閾値以上の変数を説明変数として選択してもよく、変数重要度が高い順に所定数の変数を説明変数として選択してもよい。
【0064】
図6に示したように、バッチプロセスデータは、複数時点で取得された変数を含む時系列データである。変数選択部130は、時点ごとに変数重要度を算出し、時点ごとの変数重要度を統合してもよい。本実施形態では、決定木による変数重要度を統合した結果、目的変数である温度に対して、二酸化炭素濃度1、酸素濃度2、材料Aの量、材料Bの量、及び外気温の変数重要度が高いことが判明したものとする。
【0065】
図4に戻って説明する。ステップS4において、予測装置20の行列計算部140は、変数選択部130から1以上の説明変数を受け取る。行列計算部140は、データ記憶部120からm個のバッチプロセスデータを読み出す。行列計算部140は、m個のバッチプロセスデータのうち、2個のバッチプロセスデータの間の類似度を要素とする行列を、説明変数ごとに計算する。行列計算部140は、説明変数ごとの距離行列を特徴計算部150に送る。
【0066】
本実施形態では、行列計算部140は、m個のバッチプロセスデータのうち、2個のバッチプロセスデータの組み合わせすべてについて、動的時間伸縮法を用いて類似度を計算する。行列計算部140は、説明変数ごとに、すべての組み合わせで計算した類似度を要素とする距離行列を生成する。
【0067】
図8は、距離行列の一例を示す図である。図8に示されるように、距離行列は、バッチプロセスデータの間の距離を要素とする説明変数ごとの行列を含む。距離行列は、縦軸及び横軸がm個のバッチプロセスデータに対応するm×m行列である。距離行列の各要素は、横軸のバッチプロセスデータと縦軸のバッチプロセスデータとの間の距離を示す。なお、距離行列の対角要素は、同じバッチプロセスデータの組み合わせになるため、距離は0となる。
【0068】
図4に戻って説明する。ステップS5において、予測装置20の特徴計算部150は、行列計算部140から説明変数ごとの距離行列を受け取る。特徴計算部150は、説明変数ごとの距離行列に基づいて、バッチプロセスデータごとの特徴データを計算する。特徴計算部150は、バッチプロセスデータごとの特徴データを探索部160に送る。
【0069】
本実施形態では、特徴計算部150は、多次元尺度構成法に基づいて、固有ベクトルを計算する。多次元尺度構成法は、類似度に基づく行列が距離行列である場合に、固有値分解を用いる手法である。多次元尺度構成法は、複数のデータのうち任意の2つのデータ間の距離が与えられた場合に、距離が近い2つのデータは互いに近く、距離が遠い2つのデータは互いに遠く配置されるように、各データの座標を求める方法である。多次元尺度構成法により求まる座標間の距離の遠近は、m個のバッチプロセスデータ間の相対的な距離の長さに対応する。
【0070】
図9は、固有ベクトルの一例を示す図である。図9に示されるように、固有ベクトルは、バッチプロセスデータごとに、バッチプロセスを識別するラベルDATEと、2つの変数X1,X2を含む。変数X1,X2は、特徴データの一例である。ラベルDATEは、バッチプロセスデータのラベルDATEに対応する。したがって、最も新しい日付の固有ベクトルは、予測対象データに対応する。固有ベクトルは、変数X1,X2をXY座標とする二次元空間の座標と解釈できる。なお、二次元空間は特徴空間の一例である。特徴空間の次元数は、固有ベクトルの次元数と一致する。
【0071】
図4に戻って説明する。ステップS6において、予測装置20の探索部160は、特徴計算部150からバッチプロセスデータごとの特徴データを受け取る。探索部160は、特徴データに基づいて、予測対象データと類似するバッチプロセスデータを探索する。探索部160は、探索されたバッチプロセスデータを類似データとして予測部170に送る。
【0072】
具体的には、探索部160は、バッチプロセスデータごとの特徴データを特徴空間に配置する。探索部160は、特徴空間において、予測対象データの特徴データとの距離が短い特徴データを探索する。探索部160は、予測対象データの特徴データとの距離が所定の閾値以下の特徴データを探索してもよい。探索部160は、予測対象データの特徴データとの距離が短い順に所定数の特徴データを探索してもよい。
【0073】
探索部160は、探索された特徴データに対応するバッチプロセスデータをデータ記憶部120から読み出す。探索部160は、固有値分解により次元圧縮された特徴データを探索するが、特徴データから目的変数を予測することはできないため、特徴データに対応するバッチプロセスデータを取得する必要がある。図9に示したように、特徴データには、バッチプロセスデータと共通する識別情報(ラベル)が関連付けられている。探索部160は、探索された特徴データと同じ識別情報が関連付けられたバッチプロセスデータをデータ記憶部120から読み出すことで、予測対象データに類似するバッチプロセスデータを取得できる。
【0074】
探索部160は、特徴データ間の距離に基づく近傍探索により、類似データを探索してもよい。近傍探索に用いる距離は、一例として、ユークリッド距離でもよく、マハラノビス距離でもよい。探索部160は、特徴空間に配置した特徴データをクラスタに分割し、予測対象データの特徴データが含まれるクラスタを類似データとして扱ってもよい。
【0075】
図10は、近傍探索の一例を示す図である。図10に示されるように、二次元空間である特徴空間FSには、バッチプロセスデータに対応する特徴データが配置される。図10には、予測対象データD1から近傍探索を行うことで、4個の特徴データD2~D5が探索された様子が示されている。
【0076】
図4に戻って説明する。ステップS7において、予測装置20の予測部170は、探索部160から類似データを受け取る。予測部170は、類似データに基づいて、予測データを計算する。予測部170は、予測データを可視化部180に送る。
【0077】
本実施形態では、予測部170は、類似データに含まれる複数のバッチプロセスデータから目的変数の時系列データを取り出し、取り出した目的変数の時系列データを平均することで、予測データを計算する。具体的には、予測部170は、バッチプロセスデータの各時点で、バッチプロセスデータに含まれる目的変数の平均値を計算し、目的変数の平均値を時間順に配列することで、予測データを生成する。
【0078】
図11は、予測データの一例を示す図である。図11には、4個の類似データが探索されたときに、4個の類似データに含まれる温度を各時点で平均し、温度の平均値の時系列データを、予測データとして出力する様子が示されている。
【0079】
図4に戻って説明する。ステップS8において、予測装置20の可視化部180は、予測部170から予測データを受け取る。可視化部180は、予測データを含む予測結果を可視化する表示画面を生成する。可視化部180は、予測データの波形図を予測結果として表示画面に含めてもよい。可視化部180は、表示画面を表示するための画面データを端末装置30に送信する。
【0080】
可視化部180は、予測結果と共に、予測に用いた情報を表示画面に含めてもよい。可視化部180は、一例として、変数選択部130から重要度及び重みを取得し、重要度及び重みを示すグラフを表示画面に含めてもよい。可視化部180は、一例として、行列計算部140から距離行列を取得し、距離行列を示す表を表示画面に含めてもよい。可視化部180は、一例として、特徴計算部150から特徴データが配置された特徴空間を取得し、特徴データの散布図を表示画面に含めてもよい。可視化部180は、一例として、探索部160から類似データを取得し、類似データの波形図を表示画面に含めてもよい。類似データに多数のバッチプロセスデータが含まれる場合、予測対象データとの距離が近い順に所定数のバッチプロセスデータのみを取得してもよい。
【0081】
端末装置30は、予測装置20から表示画面の画面データを受信する。端末装置30は、画面データに基づいて、表示画面を表示装置506に表示する。
【0082】
図12は、表示画面の一例を示す図である。図12に示されるように、表示画面600は、説明変数の変数重要度610、特徴データの散布図620、類似データの波形図630、及び予測データの波形図640を表示する。表示画面600は、予測装置20が予測に用いた任意の情報をさらに表示してもよい。
【0083】
説明変数の変数重要度610が可視化されることで、その説明変数を用いた理由をユーザに明示できる。特徴データの散布図620及び類似データの波形図630が可視化されることで、予測結果の根拠について説明性を持たせることができる。
【0084】
端末装置30のユーザは、表示画面600に表示された予測結果に基づいて、予測対象10の操作内容を検討してもよい。例えば、端末装置30のユーザは、温度の予測結果を参照することで、温度制御に関する操作を行ってもよい。また、端末装置30のユーザは、予測に用いた情報を参照することで、予測結果の妥当性を容易に判断できる。
【0085】
<実施形態の効果>
本実施形態に係る予測装置20は、1以上の説明変数を含む2個のバッチプロセスデータの間の類似度を要素とする行列を説明変数ごとに計算し、説明変数ごとの行列に基づいて計算された特徴データに基づいて、予測対象とする時系列データに類似する類似データを探索し、類似データに基づいて、所定の目的変数の時系列データを予測する。
【0086】
一の側面では、本実施形態によれば、目的変数の時系列データを精度よく予測できる。例えば、本実施形態は、逐次的に予測対象データと類似する類似データを探索し、類似データに基づいて予測モデルを構築できる。そのため、予測モデルが陳腐化することなく、高精度に目的変数を予測できる。また、例えば、本実施形態は、バッチプロセスデータの間の類似度に基づく特徴データに基づいて類似データを探索するため、波形の特徴を失うことなく時系列データ全体を予測できる。そのため、類似データの波形の特徴を考慮しながら、目的変数の時系列データを精度よく予測できる。
【0087】
予測装置20は、複数の変数から説明変数を選択してもよい。予測装置20は、複数の変数それぞれの重要度に基づいて説明変数を選択してもよい。一の側面では、本実施形態によれば、目的変数を予測可能な説明変数を適切に選択するため、目的変数を精度よく予測できる。
【0088】
予測装置20は、時系列データの波形に基づく類似度を計算してもよい。予測装置20は、動的時間伸縮法により類似度を計算してもよい。一の側面では、本実施形態によれば、波形の特徴を考慮しながら予測対象データと類似する類似データを精度よく探索できる。
【0089】
予測装置20は、固有値分解により行列を次元圧縮した特徴データを計算してもよい。予測装置20は、特徴データを配置した特徴空間において、類似データを探索してもよい。一の側面では、本実施形態によれば、特徴空間で特徴データの近傍探索を行えるため、少ない計算量で類似データを探索できる。
【0090】
予測装置20は、目的変数の時系列データを含む予測結果を可視化してもよい。予測結果は、目的変数の予測に用いた情報を含んでもよい。予測に用いた情報は、説明変数の変数重要度、特徴データの散布図、又は類似データの波形の少なくとも1つを含んでもよい。一の側面では、本実施形態によれば、予測データと共に予測の根拠を示すため、ユーザが予測の妥当性を容易に判断できる。
【0091】
[補足]
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等の機器を含むものとする。
【0092】
以上、本発明の実施の形態について詳述したが、本発明はこれらの実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形又は変更が可能である。
【符号の説明】
【0093】
1000:予測システム
10:予測対象
20:予測装置
30:端末装置
110:取得部
120:データ記憶部
130:変数選択部
140:行列計算部
150:特徴計算部
160:探索部
170:予測部
180:可視化部
【要約】
【課題】時系列データを精度よく予測する。
【解決手段】予測装置が、1以上の説明変数を含む複数の時系列データを取得する取得部と、複数の時系列データのうち2個の時系列データの間の類似度を要素とする行列を説明変数ごとに計算する行列計算部と、説明変数ごとの行列に基づいて、時系列データごとの特徴データを計算する特徴計算部と、時系列データごとの特徴データに基づいて、複数の時系列データのうち予測対象とする時系列データに類似する類似データを探索する探索部と、類似データに基づいて、所定の目的変数の時系列データを予測する予測部と、を備える。
【選択図】図3
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12