IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士電機株式会社の特許一覧

特開2024-79938運転支援装置、運転支援方法及びプログラム
<>
  • 特開-運転支援装置、運転支援方法及びプログラム 図1
  • 特開-運転支援装置、運転支援方法及びプログラム 図2
  • 特開-運転支援装置、運転支援方法及びプログラム 図3
  • 特開-運転支援装置、運転支援方法及びプログラム 図4
  • 特開-運転支援装置、運転支援方法及びプログラム 図5
  • 特開-運転支援装置、運転支援方法及びプログラム 図6
  • 特開-運転支援装置、運転支援方法及びプログラム 図7
  • 特開-運転支援装置、運転支援方法及びプログラム 図8
  • 特開-運転支援装置、運転支援方法及びプログラム 図9
  • 特開-運転支援装置、運転支援方法及びプログラム 図10
  • 特開-運転支援装置、運転支援方法及びプログラム 図11
  • 特開-運転支援装置、運転支援方法及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024079938
(43)【公開日】2024-06-13
(54)【発明の名称】運転支援装置、運転支援方法及びプログラム
(51)【国際特許分類】
   G05B 23/02 20060101AFI20240606BHJP
【FI】
G05B23/02 X
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022192645
(22)【出願日】2022-12-01
(11)【特許番号】
(45)【特許公報発行日】2023-11-21
(71)【出願人】
【識別番号】000005234
【氏名又は名称】富士電機株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】桐生 智志
(72)【発明者】
【氏名】島崎 祐一
(72)【発明者】
【氏名】石橋 直人
(72)【発明者】
【氏名】川口 繭子
(72)【発明者】
【氏名】金田 龍哉
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA01
3C223AA11
3C223BA03
3C223CC02
3C223DD03
3C223EB01
3C223EB07
3C223FF02
3C223FF03
3C223FF05
3C223FF12
3C223FF13
3C223FF17
3C223FF22
3C223FF26
3C223FF42
3C223FF43
3C223GG01
3C223HH02
3C223HH03
3C223HH08
3C223HH29
(57)【要約】
【課題】最適に近い多様な操作量系列を提示できる技術を提供すること。
【解決手段】本開示の一態様による運転支援装置は、過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、前記操作変数の最適特徴量に少なくとも類似する複数の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データを抽出するように構成されている時系列抽出部と、を有する。
【選択図】図2
【特許請求の範囲】
【請求項1】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、
前記操作変数の最適特徴量に少なくとも類似する複数の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データを抽出するように構成されている時系列抽出部と、
を有する運転支援装置。
【請求項2】
前記時系列抽出部は、
過去の時間区間における前記操作変数の特徴量と、前記過去の時間区間における操作変数の時系列データとが対応付けられている実績データの集合から前記複数の時系列データを抽出するように構成されている請求項1に記載の運転支援装置。
【請求項3】
前記時系列抽出部は、
前記操作変数の最適特徴量に類似する複数の特徴量を前記実績データから抽出し、
前記複数の特徴量の集合をクラスタリング手法により複数のクラスタに分割し、
前記クラスタ毎に、前記クラスタの代表点と最も類似する特徴量に対応付けられている時系列データを前記実績データから抽出することで、前記複数の時系列データを抽出するように構成されている請求項2に記載の運転支援装置。
【請求項4】
前記時系列抽出部は、
前記実績データに設定されているタグ毎に、前記操作変数の最適特徴量と最も類似する特徴量に対応付けられている時系列データを前記実績データから抽出することで、前記複数の時系列データを抽出するように構成されている請求項2に記載の運転支援装置。
【請求項5】
前記タグは、前記実績データに含まれる時系列データによって表される操作系列を操作したオペレータを識別する情報である、請求項4に記載の運転支援装置。
【請求項6】
前記時系列抽出部によって抽出された複数の時系列データを所定の出力先に出力するように構成されている出力部を更に有する請求項1乃至5の何れか一項に記載の運転支援装置。
【請求項7】
前記過去の時間区間における操作変数の時系列データと、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを対象から収集するように構成されている収集部と、
前記過去の時間区間における操作変数の時系列データの平均値又は合計を、前記過去の時間区間における操作変数の特徴量として算出するように構成されている特徴量変換部と、を更に有する請求項6に記載の運転支援装置。
【請求項8】
前記学習部は、
前記過去の時間区間における操作変数の特徴量と前記過去の時間区間における環境変数の特徴量とを入力して、前記過去の時間区間における状態変数の特徴量の予測精度が高くなるように前記予測モデルを学習するように構成されている、請求項7に記載の運転支援装置。
【請求項9】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習する学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出する最適化手順と、
前記操作変数の最適特徴量に少なくとも類似する複数の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データを抽出する時系列抽出手順と、
をコンピュータが実行する運転支援方法。
【請求項10】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習する学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出する最適化手順と、
前記操作変数の最適特徴量に少なくとも類似する複数の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データを抽出する時系列抽出手順と、
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、運転支援装置、運転支援方法及びプログラムに関する。
【背景技術】
【0002】
近年、産業分野では熟練オペレータの不足等を背景に、AI(Artificial Intelligence)や機械学習技術等を活用したプラント運転支援システムへのニーズが高まっている。一般に、発電プラント、鉄鋼プラント、化学プラント等といったプラントでは、その時の環境に応じて、オペレータが過去の知見から将来の製品品質に寄与する状態変数が目標値となるように最適な操作量を計画した上で、その操作量によりプラントを運転している。これに対して、予測技術等を利用したプラント運転支援システムが従来から提案されている(例えば、特許文献1~4等)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2012-74007号公報
【特許文献2】特開2006-120131号公報
【特許文献3】特開2020-140253号公報
【特許文献4】特許第7081728号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来では、将来の時間区間における操作量の時系列をオペレータ等に提示する際に、最適に近い多様な操作量の時系列を提示することができなかった。以下、操作量の時系列を「操作量系列」ともいう。
【0005】
例えば、特許文献1では、時系列データを扱うことができないため、操作量系列を得ることはできない。また、例えば、特許文献2では、最適化技術を用いておらず、最適な操作量系列が得られるとは限らない。また、例えば、特許文献3では、将来の一定期間における運転指標の時系列を得る際にその期間の各時刻で最適化技術を用いて運転指標を計算しており、最適な運転指標の時系列は提示できる一方で多様な操作量系列を提示することはできない。更に、例えば、特許文献4では、最適な操作量系列は提示できる一方で多様な操作量系列を提示することはできない。
【0006】
本開示は、上記の点に鑑みてなされたもので、最適に近い多様な操作量系列を提示できる技術を提供する。
【課題を解決するための手段】
【0007】
本開示の一態様による運転支援装置は、過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、前記操作変数の最適特徴量に少なくとも類似する複数の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データを抽出するように構成されている時系列抽出部と、を有する。
【発明の効果】
【0008】
最適に近い多様な操作量系列を提示できる技術が提供される。
【図面の簡単な説明】
【0009】
図1】本実施形態に係る運転支援装置のハードウェア構成の一例を示す図である。
図2】本実施形態に係る運転支援装置の機能構成の一例を示す図である。
図3】本実施形態に係るデータ収集処理の一例を示すフローチャートである。
図4】本実施形態に係るモデル学習処理の一例を示すフローチャートである。
図5】本実施形態に係る操作量系列出力処理の一例を示すフローチャートである。
図6】本実施形態に係る操作量系列抽出処理(実施例1)の一例を示すフローチャートである。
図7】近傍集合の抽出の一例を示す図である。
図8】クラスタリングの一例を示す図である。
図9】クラスタ毎に抽出対象となる実績操作特徴量の一例を示す図である。
図10】本実施形態に係る操作量系列抽出処理(実施例2)の一例を示すフローチャートである。
図11】実績操作特徴量のタグ付けの一例を示す図である。
図12】タグ毎に抽出対象となる実績操作特徴量の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明の一実施形態について説明する。以下の実施形態では、プラント、設備、機器、装置等といったものを対象として、その対象の状態変数値を目標値に近付けるような多様な操作量系列であって、かつ、最適に近い操作量系列をオペレータ等に提示することにより当該対象の運転を支援することができる運転支援装置10について説明する。ここで、本実施形態に係る運転支援装置10には、(1)予測モデルを学習するためのデータを収集するデータ収集フェーズ、(2)予測モデルを学習するモデル学習フェーズ、(3)予測モデルと最適化技術により、対象に対する操作量系列として、最適に近く、かつ、多様な操作量系列を出力する運転支援フェーズ、3つのフェーズがある。
【0011】
なお、対象とは、オペレータ等が操作するプラント、設備、機器、装置等のことである。対象には各種センサが設置されており、これらのセンサにより当該対象の状態や環境、当該対象に対する操作等が計測される。状態の具体例としては、例えば、或る時点の温度、圧力、流量等が挙げられる。環境の具体例としては、例えば、或る時点の外気温、設備番号等が挙げられる。操作の具体例としては、例えば、対象の空気弁や燃料バルブ等に対する開閉量、空気弁の開閉によって制御される酸素量等が挙げられる。このような状態を表す変数を状態変数、環境を表す変数を環境変数、操作を表す変数を操作変数という。
【0012】
以下、操作変数の総数をI、状態変数の総数をJ、環境変数の総数をKとする。また、操作変数値(なお、操作変数値は操作量とも呼ばれる。)は時系列データとして得られるものとし、或る時間区間T=[t,t]におけるi(1≦i≦I)番目の操作変数値の時系列データをX={Xit|t∈T}とする。ここで、tは時間区間Tの開始時刻、tは時間区間Tの終了時刻、Xitは時刻tの操作変数値である。なお、操作変数値の時系列データは操作量の時系列を表しているため、以下では、操作変数値の時系列データを「操作量系列」ともいう。一方で、状態変数値はその時間区間における特徴量データとして得られるものとし、時間区間Tにおけるj(1≦j≦J)番目の状態変数値をyとする。同様に、環境変数値はその時間区間における特徴量データとして得られるものとし、時間区間Tにおけるk(1≦k≦K)番目の環境変数値をzとする。
【0013】
上記の時間区間Tは予め決められた任意の時間区間としてよいが、例えば、対象がバッチプラントである場合には1バッチの時間区間をTとすることが考えられる。これ以外にも、例えば、1つの製品が製造される時間区間、1つの作業工程を表す時間区間、何等かの分析単位とする時間区間等をTとすることが可能である。以下では、複数の時間区間Tを考える場合は、m番目の時間区間をT(m)と表す。また、m番目の時間区間T(m)におけるi番目の操作変数値の時系列データをX (m)={Xit|t∈T(m)}、j番目の状態変数値をy (m)、k番目の環境変数値をz (m)と表す。
【0014】
例えば、対象として鉄鋼プラントを想定した場合、m番目の時間区間T(m)はm番目のバッチ、X (m)はm番目のバッチにおける酸素量の時系列データ、y (m)はm番目のバッチの溶綱温度、z (m)はm番目のバッチの炉番号等とすることが考えられる。
【0015】
<運転支援装置10のハードウェア構成例>
本実施形態に係る運転支援装置10のハードウェア構成例を図1に示す。図1に示すように、本実施形態に係る運転支援装置10は、入力装置101と、表示装置102と、外部I/F103と、通信I/F104と、RAM(Random Access Memory)105と、ROM(Read Only Memory)106と、補助記憶装置107と、プロセッサ108とを有する。これらの各ハードウェアは、それぞれがバス109を介して通信可能に接続される。
【0016】
入力装置101は、例えば、キーボード、マウス、タッチパネル、物理ボタン等である。表示装置102は、例えば、ディスプレイ、表示パネル等である。なお、運転支援装置10は、例えば、入力装置101及び表示装置102のうちの少なくとも一方を有していなくてもよい。
【0017】
外部I/F103は、記録媒体103a等の外部装置とのインタフェースである。記録媒体103aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
【0018】
通信I/F104は、運転支援装置10を通信ネットワークに接続するためのインタフェースである。RAM105は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。ROM106は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。補助記憶装置107は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の不揮発性の記憶装置であり、プログラムやデータが格納される。プロセッサ108は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の各種演算装置である。
【0019】
なお、図1に示すハードウェア構成は一例であって、運転支援装置10は、他のハードウェア構成を有していてもよい。例えば、運転支援装置10は、複数の補助記憶装置107や複数のプロセッサ108を有していてもよいし、図示したハードウェア以外の種々のハードウェアを有していてもよい。
【0020】
<運転支援装置10の機能構成例>
本実施形態に係る運転支援装置10の機能構成例を図2に示す。図2に示すように、本実施形態に係る運転支援装置10は、入力部201と、特徴量変換部202と、モデル学習部203と、最適化部204と、時系列抽出部205と、出力部206とを有する。これら各部は、例えば、運転支援装置10にインストールされた1以上のプログラムがプロセッサ108等に実行させる処理により実現される。また、本実施形態に係る運転支援装置10は、記憶部207を有する。記憶部207は、例えば、補助記憶装置107等により実現される。なお、記憶部207は、例えば、運転支援装置10と通信ネットワークを介して接続されるデータベースサーバ等といった記憶装置により実現されてもよい。
【0021】
入力部201は、データ収集フェーズにおいて、過去の時間区間における操作量系列と状態変数値と環境変数値とを対象から取得する。
【0022】
また、入力部201は、モデル学習フェーズにおいて、予測モデルの学習に用いるデータ(後述する学習用データ)を記憶部207から取得する。
【0023】
更に、入力部201は、運転支援フェーズにおいて、最適に近い多様な操作量系列を提示したい将来の時間区間における環境変数値と状態変数の目標値を記憶部207から取得する。
【0024】
特徴量変換部202は、データ収集フェーズにおいて、操作量系列を特徴量データに変換する。具体的には、特徴量変換部202は、m番目の時間区間T(m)における操作量系列X (m)(i=1,・・・,I)を特徴量データx (m)(i=1,・・・,I)に変換する。ここで、x (m)はX (m)の特徴量を表しており、例えば、Xit(t∈T(m))の平均値や合計値等といった統計量である。m番目の時間区間T(m)における操作量系列X (m)(i=1,・・・,I)とその特徴量データx (m)と(i=1,・・・,I)と状態変数値y (m)(j=1,・・・,J)と環境変数値z (m)(k=1,・・・,K)は対応付けられてm番目の時間区間T(m)における実績データとして記憶部207に保存される。すなわち、m番目の時間区間T(m)における実績データは(X (m),・・・,X (m),x (m),・・・,x (m),y (m),・・・,y (m),z (m),・・・,z (m))と表される。以下、m番目の時間区間T(m)における実績データのことをm番目の実績データともいう。また、以下、操作変数の時系列データ(操作量系列)の特徴量データのことを「操作特徴量」ともいう。
【0025】
モデル学習部203は、モデル学習フェーズにおいて、学習用データを用いて、操作特徴量と環境変数値から状態変数値を予測する予測モデルを学習する。すなわち、モデル学習部203は、各j=1,・・・,Jに対してy=f(x,・・・,x,z,・・・,z)により状態変数値を予測する予測モデルf=(f,・・・,f)を学習する。このような予測モデルは、例えば、ニューラルネットワーク等を用いたDL(Deep Learning)、PLS(Partial Least squares Regression)等といった手法により学習すればよい。ここで、学習用データとは実績データから操作特徴量と状態変数値と環境変数値を抽出したデータであり、m番目の学習用データは(x (m),・・・,x (m),y (m),・・・,y (m),z (m),・・・,z (m))と表される。
【0026】
最適化部204は、運転支援フェーズにおいて、予測モデルfを用いて、将来の時間区間における環境変数値と状態変数の目標値から最適な操作特徴量(以下、最適操作特徴量ともいう。)を算出する。すなわち、最適化部204は、将来の時間区間における環境変数値をz'、当該時間区間における状態変数の目標値をy'として、f(x,・・・,x,z',・・・,z')がy'に近くなるような操作特徴量x,・・・,xを最適操作特徴量として算出する。より具体的には、最適化部204は、例えば、j=1,・・・,Jに関する|f(x,・・・,x,z',・・・,z')-y'|の和(つまり、j=1,・・・,Jに関する絶対誤差の和)を最小化するような操作特徴量x,・・・,xを最適操作特徴量として算出する。これは、例えば、一般的な数理計画法やメタヒューリスティックス等により算出することができる。なお、絶対誤差は一例であって、これに限られず、例えば、二乗誤差等が用いられてもよい。
【0027】
時系列抽出部205は、最適化部204によって算出された最適操作特徴量を用いて、オペレータ等への提示対象とする複数の操作量系列(つまり、最適に近い多様な操作量系列)を実績データの集合から抽出する。
【0028】
出力部206は、時系列抽出部205によって抽出された複数の操作量系列を予め決められた任意の出力先(例えば、表示装置102、記憶部207、オペレータ等が利用する端末等)に出力する。以下、一例として、出力部206の出力先はオペレータ等が利用する端末を想定する。これにより、例えば、オペレータ等は、当該時間区間における最適に近い多様な操作量系列(つまり、対象の状態変数値を目標値に近付けるような複数の操作量系列)を得ることができる。したがって、オペレータ等は、例えば、これらの複数の操作量系列を候補として自身の経験則等に照らして妥当な操作量系列を選択した上で、選択した操作量系列により対象を運転したり、対象の運転計画を策定したりすることができる。
【0029】
記憶部207は、データ収集フェーズで収集された実績データを記憶する。また、記憶部207は、モデル学習フェーズで学習された予測モデルf、運転支援フェーズで用いられる状態変数の目標値等を記憶する。これら以外にも、記憶部207には、様々なデータ(例えば、予測モデルfを学習する際の途中の計算結果、最適操作特徴量を算出する際の途中の計算結果等)が記憶されてもよい。
【0030】
<データ収集処理>
以下、データ収集フェーズで予測モデルを学習するためのデータを収集するデータ収集処理について、図3を参照しながら説明する。図3のステップS101~ステップS103は、例えば、各m∈M(ただし、Mはデータ収集対象の時間区間の番号の集合)毎に繰り返し実行される。以下では、或るm番目の時間区間のデータを収集する場合について説明する。
【0031】
入力部201は、m番目の時間区間における操作量系列X (m)(i=1,・・・,I)と状態変数値y (m)(j=1,・・・,J)と環境変数値z (m)(k=1,・・・,K)とを対象から取得する(ステップS101)。
【0032】
次に、特徴量変換部202は、操作量系列X (m)(i=1,・・・,I)を操作特徴量x (m)(i=1,・・・,I)に変換する(ステップS102)。
【0033】
そして、入力部201は、(X (m),・・・,X (m),x (m),・・・,x (m),y (m),・・・,y (m),z (m),・・・,z (m))をm番目の実績データとして記憶部207に保存する(ステップS103)。
【0034】
以上のステップS101~ステップS103が各m∈M毎に繰り返し実行されることで、実績データ集合{(X (m),・・・,X (m),x (m),・・・,x (m),y (m),・・・,y (m),z (m),・・・,z (m))|m∈M}が得られる。なお、各操作特徴量x (m)、各状態変数値y (m)及び各環境変数値z (m)は、例えば、0以上1以下の値となるように正規化されてもよい。
【0035】
<モデル学習処理>
以下、モデル学習フェーズで予測モデルを学習するモデル学習処理について、図4を参照しながら説明する。
【0036】
入力部201は、学習用データを記憶部207から取得する(ステップS201)。すなわち、入力部201は、学習用データ集合{(x (m),・・・,x (m),y (m),・・・,y (m),z (m),・・・,z (m))|m∈M}を記憶部207から取得する。ここで、Mは学習用データに対応する実績データの番号の集合であり、M⊂Mである。なお、M=Mであってもよい。
【0037】
次に、モデル学習部203は、学習用データ集合に含まれる各学習用データを用いて、予測モデルfを学習する(ステップS202)。すなわち、モデル学習部203は、f(x (m),・・・,x (m),z (m),・・・,z (m))がy (m)を精度良く予測するように予測モデルf=(f,・・・,f)を学習する。
【0038】
そして、モデル学習部203は、学習済みの予測モデルfを記憶部207に保存する(ステップS203)。
【0039】
<操作量系列出力処理>
以下、運転支援フェーズで最適に近い多様な操作量系列を出力してオペレータ等に提示する操作量系列出力処理について、図5を参照しながら説明する。以下では、将来の或る時間区間Tにおける最適に近い多様な操作量系列を出力する場合について説明する。
【0040】
まず、入力部201は、当該時間区間Tにおける環境変数値z'(k=1,・・・,K)と状態変数の目標値y'(j=1,・・・,J)を記憶部207から取得する(ステップS301)。なお、例えば、各実績データに含まれる操作特徴量x (m)、状態変数値y (m)及び環境変数値z (m)が0以上1以下の値となるように正規化されている場合は、環境変数値z'(k=1,・・・,K)と状態変数の目標値y'(j=1,・・・,J)も同様に正規化されているものとする。
【0041】
次に、最適化部204は、学習済みの予測モデルfを用いて、当該時間区間Tの最適操作特徴量を算出する(ステップS302)。例えば、最適化部204は、j=1,・・・,Jに関する|f(x,・・・,x,z',・・・,z')-y'|の和を最小化するような操作特徴量x,・・・,xを最適操作特徴量として算出する。以下、本ステップで算出された最適操作特徴量を(x',・・・,x')とする。
【0042】
次に、時系列抽出部205は、最適操作特徴量(x',・・・,x')を用いて、オペレータ等への提示対象とする複数の操作量系列を実績データ集合{(X (m),・・・,X (m),x (m),・・・,x (m),y (m),・・・,y (m),z (m),・・・,z (m))|m∈M}から抽出する(ステップS303)。なお、本ステップの処理(操作量系列抽出処理)の詳細については後述する。以下、本ステップで抽出された複数の操作量系列を{(X (m),・・・,X (m))|m∈M}とする。ここで、Mは本ステップで抽出された操作量系列が含まれる実績データの番号の集合であり、M⊂Mである。
【0043】
そして、出力部206は、上記のステップS303で抽出された複数の操作量系列{(X (m),・・・,X (m))|m∈M}を、オペレータ等が利用する端末に出力(例えば、当該端末のディスプレイ等に表示)する(ステップS304)。これにより、オペレータは、当該時間区間Tにおける最適に近い多様な操作量系列{(X (m),・・・,X (m))|m∈M}を得ることができ、例えば、その中から選択した操作量系列によって対象を運転したり、対象の運転計画を策定したりすることが可能となる。
【0044】
<操作量系列抽出処理>
図5のステップS303における操作量系列抽出処理の一例として、以下では実施例1と実施例2について説明する。以下では、実績データ集合を構成する各実績データに含まれる操作量系列及び操作特徴量のことをそれぞれ「実績操作量系列」及び「実績操作特徴量」ともいうことにする。
【0045】
≪操作量系列抽出処理(実施例1)≫
実施例1における操作量系列抽出処理について、図6を参照しながら説明する。
【0046】
まず、時系列抽出部205は、実績操作特徴量(x (m),・・・,x (m))(m∈M)のうち、最適操作特徴量(x',・・・,x')の近傍にある実績操作特徴量の集合を近傍集合として抽出する(ステップS401)。
【0047】
例えば、時系列抽出部205は、予め決められた2以上の整数をNとして、i=1,・・・,Iに関する|x'-x (m)|の和が小さい順にN個の実績操作特徴量(x (m),・・・,x (m))を抽出し、これらN個の実績操作特徴量(x (m),・・・,x (m))の集合を近傍集合とすればよい。以下、近傍集合をRで表す。一例として、I=2、N=12である場合の近傍集合Rを図7に示す。図7に示す例では、破線1000で囲まれた部分に含まれる実績操作特徴量が近傍集合Rに属する実績操作特徴量である。
【0048】
なお、上記の近傍集合Rの抽出方法は一例であって、これに限られるものではない。例えば、時系列抽出部205は、j=1,・・・,Jに関する|f(x',・・・,x',z',・・・,z')-y (m)|の和と、i=1,・・・,Iに関する|x'-x (m)|の和と、k=1,・・・,Kに関する|z'-z (m)|の和との総和が小さい順にN個の実績操作特徴量(x (m),・・・,x (m))を抽出し、これらN個の実績操作特徴量(x (m),・・・,x (m))の集合を近傍集合Rとしてもよい。
【0049】
また、例えば、予め決められた制約条件を満たす実績操作特徴量(x (m),・・・,x (m))の中から近傍集合Rを抽出してもよい。このような制約条件としては、例えば、或る特定の実績操作特徴量x (m)が最適操作特徴量x'よりも小さい(又は、大きい)といったものが挙げられる。
【0050】
次に、時系列抽出部205は、近傍集合Rに含まれる実績操作特徴量(x (m),・・・,x (m))をクラスタリングし、L個のクラスタに分割する(ステップS402)。また、このとき、時系列抽出部205は、各クラスタの代表点を計算する。なお、クラスタリング手法としては、例えば、k-means法等を用いればよい。以下、各クラスタの代表点をμ(l)=(μ (l),・・・,μ (l))(l=1,・・・,L)とする。また、l番目のクラスタに属する実績操作特徴量(x (m),・・・,x (m))の集合をVとする。一例として、図7の破線1000で示した近傍集合Rをクラスタリングした結果を図8に示す。図8に示す例では、L=3の場合を示しており、破線1100、破線1200、破線1300でそれぞれ囲まれた部分に含まれる実績操作特徴量が各クラスタに属する実績操作特徴量である。また、図8に示す例では、各クラスタの代表点も示されている。
【0051】
次に、時系列抽出部205は、クラスタ毎に、そのクラスタに属する実績操作特徴量(x (m),・・・,x (m))の中から当該クラスタの代表点μ(l=1,・・・,L)に最も近い実績操作特徴量(x (m),・・・,x (m))を抽出する(ステップS403)。
【0052】
例えば、時系列抽出部205は、l=1,・・・,Lに対して、(x (m),・・・,x (m))∈Vのうち、i=1,・・・,Iに関する|μ (l)-x (m)|の和が最も小さい実績操作特徴量(x (m),・・・,x (m))を抽出する。これにより、最適操作特徴量(x',・・・,x')に近い範囲内で多様性を持つL個の実績操作特徴量が抽出される。一例として、図8の破線1100~1300で示した各クラスタから抽出される実績操作特徴量を図9に示す。図9に示すように、各クラスタの代表点に最も近い実績操作特徴量が抽出対象となっている。
【0053】
なお、上記の実績操作特徴量の抽出方法は一例であって、これに限られるものではない。例えば、時系列抽出部205は、l=1,・・・,Lに対して、(x (m),・・・,x (m))∈Vのうち、j=1,・・・,Jに関する|f(x',・・・,x',z',・・・,z')-y (m)|の和と、i=1,・・・,Iに関する|μ (l)-x (m)|の和と、k=1,・・・,Kに関する|z'-z (m)|の和との総和が最も小さい実績操作特徴量(x (m),・・・,x (m))を抽出してもよい。又は、例えば、時系列抽出部205は、l=1,・・・,Lに対して、(x (m),・・・,x (m))∈Vのうち、j=1,・・・,Jに関する|f(μ (l),・・・,μ (l),z',・・・,z')-y (m)|の和と、i=1,・・・,Iに関する|μ (l)-x (m)|の和と、k=1,・・・,Kに関する|z'-z (m)|の和との総和が最も小さい実績操作特徴量(x (m),・・・,x (m))を抽出してもよい。
【0054】
そして、時系列抽出部205は、上記のステップS403で抽出したL個の実績操作特徴量にそれぞれ対応するL個の実績操作量系列を、提示対象の操作量系列として実績データ集合から抽出する(ステップS404)。これにより、最適な操作量系列に近い範囲内で多様性を持つL個の操作量系列{(X (m),・・・,X (m))|m∈M}(ただし、|M|=L)が得られる。
【0055】
≪操作量系列抽出処理(実施例2)≫
実施例2における操作量系列抽出処理について、図10を参照しながら説明する。
【0056】
まず、時系列抽出部205は、実績データ集合に含まれる各実績データに対してタグを付与する(ステップS501)。ここで、タグとは、実績データを何等かの基準で識別するための識別情報である。例えば、タグとしてオペレータ名やオペレータID等を用いることが考えられる。この場合、時系列抽出部205は、各実績データに対して、その実績データに含まれる操作量系列が得られたときに操作を行っていたオペレータを示すタグを設定(付与)する。なお、このとき、時系列抽出部205は、例えば、オペレータの勤務情報やログイン情報等を参照して、各実績データに含まれる操作量系列が得られたときに操作を行っていたオペレータを特定すればよい。一例として、I=2であり、オペレータAを示すタグA、オペレータBを示すタグB、オペレータCを示すタグCのいずれかのタグが実績データに付与された場合の実績操作特徴量を図11に示す。図11に示す例では、タグAが付与された実績データに含まれる実績操作特徴量と、タグBが付与された実績データに含まれる実績操作特徴量と、タグCが付与された実績データに含まれる実績操作特徴量と、最適操作特徴量とが示されている。
【0057】
次に、時系列抽出部205は、上記のステップS501で付与したタグの中から抽出対象とする複数のタグを選択する(ステップS502)。なお、時系列抽出部205は、上記のステップS501で付与したタグのすべてを抽出対象に選択してもよいし、一部のタグのみを抽出対象に選択してもよい。以下では、本ステップで選択されたタグ数をWとする。
【0058】
次に、時系列抽出部205は、上記のステップS502で選択したタグ毎に、そのタグが付与された実績データに含まれる実績操作特徴量の中から最適操作特徴量に最も近い実績操作特徴量を抽出する(ステップS503)。
【0059】
例えば、タグrが付与された実績データに含まれる実績操作特徴量の集合をVとすれば、時系列抽出部205は、タグr毎に、i=1,・・・,Iに関する|x'-x (m)|の和が最も小さい実績操作特徴量(x (m),・・・,x (m))∈Vを抽出すればよい。一例として、図11に示す例において、上記のステップS502でタグA、タグB、タグCが選択された場合に抽出対象となる実績操作特徴量を図12に示す。図12に示すように、タグ毎に、最適操作特徴量と最も近い実績操作特徴量が抽出対象となる。これにより、例えば、タグがオペレータ名やオペレータID等を示す場合には、W人のオペレータの好み等を考慮したW個の多様な実績操作特徴量が抽出される。
【0060】
なお、上記の実績操作特徴量の抽出方法は一例であって、これに限られるものではない。例えば、時系列抽出部205は、タグr毎に、j=1,・・・,Jに関する|f(x',・・・,x',z',・・・,z')-y (m)|の和と、i=1,・・・,Iに関する|μ (l)-x (m)|の和と、k=1,・・・,Kに関する|z'-z (m)|の和との総和が最も小さい実績操作特徴量(x (m),・・・,x (m))∈Vを抽出してもよい。
【0061】
そして、時系列抽出部205は、上記のステップS503で抽出したW個の実績操作特徴量にそれぞれ対応するW個の実績操作量系列を、提示対象の操作量系列として実績データ集合から抽出する(ステップS504)。これにより、最適な操作量系列に近い範囲内で多様性を持つW個の操作量系列{(X (m),・・・,X (m))|m∈M}(ただし、|M|=W)が得られる。
【0062】
<まとめ>
以上のように、本実施形態に係る運転支援装置10は、操作変数の特徴量と環境変数値から状態変数値を予測する予測モデルを学習した上で、この予測モデルにより状態変数値が目標値に近付くような最適な操作変数の特徴量を算出する。そして、本実施形態に係る運転支援装置10は、この最適な操作変数の特徴量を時系列に変換した際の操作量系列(つまり、最適な操作量系列)に近い範囲内にある多様な操作量系列をオペレータ等のユーザに出力する。これにより、過去の実績データにはない最適な操作変数の特徴量が最適解として得られ、その最適解に類似する範囲内の特徴量に対応する多様な操作量系列をオペレータ等のユーザに提示することができる。このため、オペレータ等のユーザは、これらの多様な操作量系列を候補として自身の経験則等に照らして妥当な操作量系列を選択し、選択した操作量系列により対象を運転したり、対象の運転計画を策定したりすることができる。
【0063】
なお、例えば、オペレータ等のユーザによって選択された操作量系列により対象が運転された場合、その運転結果は実績データとして得られる。同様に、例えば、オペレータ等のユーザによって選択された操作量系列を参考に運転計画が策定された場合、この運転計画に従って対象が運転され、その運転結果は実績データとして得られる。したがって、このような実績データを用いて、上記のモデル学習処理を実行し、予測モデルfを再学習してもよい。
【0064】
<変形例>
上記の実施形態の変形例をいくつか説明する。
【0065】
≪変形例1≫
上記の実施形態では、最適な操作量系列に近い多様な操作量系列をオペレータ等のユーザに提示したが、これらの多様な操作量系列に加えて、最適な操作量系列(つまり、最適操作特徴量に対応する操作量系列)もオペレータ等のユーザに提示してもよい。
【0066】
≪変形例2≫
上記の操作量系列抽出処理の実施例2では、ステップS502で選択したタグ毎に、そのタグが付与された実績データに含まれる実績操作特徴量の中から最適操作特徴量に最も近い実績操作特徴量を抽出したが、実施例1と同様に、クラスタリングしてもよい。すなわち、ステップS502で選択したタグ毎に、そのタグが付与された実績データに含まれる実績操作特徴量をクラスタリングした複数のクラスタに分割した上で、実施例1と同様に、クラスタの代表点と最も近い実績操作特徴量を抽出してもよい。これにより、ステップS502で選択されたタグを{1,・・・,W}、タグr∈{1,・・・,W}が付与された実績データに含まれる実績操作特徴量をクラスタリングしたときのクラスタ数をnとすれば、n+・・・+n個の実績操作特徴量が抽出され、その結果、これらの実績操作特徴量にそれぞれ対応するn+・・・+n個の実績操作量系列が、提示対象の操作量系列として得られる。
【0067】
≪変形例3≫
最適な操作量系列(つまり、最適操作特徴量に対応する操作量系列)の精度が十分に高い場合には、多様な操作量系列をオペレータ等のユーザに提示すると共に、最適な操作量系列により対象が自動運転されてもよい。
【0068】
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
【符号の説明】
【0069】
10 運転支援装置
101 入力装置
102 表示装置
103 外部I/F
103a 記録媒体
104 通信I/F
105 RAM
106 ROM
107 補助記憶装置
108 プロセッサ
109 バス
201 入力部
202 特徴量変換部
203 モデル学習部
204 最適化部
205 時系列抽出部
206 出力部
207 記憶部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【手続補正書】
【提出日】2023-03-08
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、
過去の時間区間における前記操作変数の複数の特徴量のうち、前記操作変数の最適特徴量に少なくとも類似するn(ただし、nは予め決められた2以上の整数)個の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データとして、前記n個の特徴量のうちのいずれかの特徴量にそれぞれ対応するn'(ただし、n'は、n'≦nを満たす2以上の整数)個の時系列データを抽出するように構成されている時系列抽出部と、
を有する運転支援装置。
【請求項2】
前記時系列抽出部は、
過去の時間区間における前記操作変数の複数の特徴量と、前記過去の時間区間における操作変数の時系列データとが対応付けられている実績データの集合から前記n'個の時系列データを抽出するように構成されている請求項1に記載の運転支援装置。
【請求項3】
前記時系列抽出部は、
前記操作変数の最適特徴量に類似するn個の特徴量を前記実績データから抽出し、
前記n個の特徴量の集合をクラスタリング手法によりn'個のクラスタに分割し、
前記クラスタ毎に、前記クラスタの代表点と最も類似する特徴量に対応付けられている時系列データを前記実績データから抽出することで、前記n'個の時系列データを抽出するように構成されている請求項2に記載の運転支援装置。
【請求項4】
前記実績データには、n'個のタグのうちのいずれかのタグが設定されており、
前記時系列抽出部は、
前記実績データに設定されているタグ毎に、前記操作変数の最適特徴量と最も類似する特徴量に対応付けられている時系列データを前記実績データから抽出することで、前記n'個の時系列データを抽出するように構成されている請求項2に記載の運転支援装置。
【請求項5】
前記タグは、前記実績データに含まれる時系列データによって表される操作系列を操作したオペレータを識別する情報である、請求項4に記載の運転支援装置。
【請求項6】
前記時系列抽出部によって抽出されたn'個の時系列データを所定の出力先に出力するように構成されている出力部を更に有する請求項1乃至5の何れか一項に記載の運転支援装置。
【請求項7】
前記過去の時間区間における操作変数の時系列データと、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを対象から収集するように構成されている収集部と、
前記過去の時間区間における操作変数の時系列データの平均値又は合計を、前記過去の時間区間における操作変数の特徴量として算出するように構成されている特徴量変換部と、を更に有する請求項6に記載の運転支援装置。
【請求項8】
前記学習部は、
前記過去の時間区間における操作変数の特徴量と前記過去の時間区間における環境変数の特徴量とを入力して、前記過去の時間区間における状態変数の特徴量の予測精度が高くなるように前記予測モデルを学習するように構成されている、請求項7に記載の運転支援装置。
【請求項9】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習する学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出する最適化手順と、
過去の時間区間における前記操作変数の複数の特徴量のうち、前記操作変数の最適特徴量に少なくとも類似するn(ただし、nは予め決められた2以上の整数)個の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データとして、前記n個の特徴量のうちのいずれかの特徴量にそれぞれ対応するn'(ただし、n'は、n'≦nを満たす2以上の整数)個の時系列データを抽出するように構成されている時系列抽出手順と、
をコンピュータが実行する運転支援方法。
【請求項10】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習する学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出する最適化手順と、
過去の時間区間における前記操作変数の複数の特徴量のうち、前記操作変数の最適特徴量に少なくとも類似するn(ただし、nは予め決められた2以上の整数)個の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データとして、前記n個の特徴量のうちのいずれかの特徴量にそれぞれ対応するn'(ただし、n'は、n'≦nを満たす2以上の整数)個の時系列データを抽出するように構成されている時系列抽出手順と、
をコンピュータに実行させるプログラム。
【手続補正書】
【提出日】2023-07-14
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における操作変数の時系列データとが対応付けられている実績データの集合を記憶する記憶部と、
過去の時間区間における前記操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、
前記記憶部に記憶されている実績データに含まれる操作変数の特徴量のうち、前記操作変数の最適特徴量に少なくとも類似するn(ただし、nは予め決められた2以上の整数)個の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データとして、前記n個の特徴量のうちのいずれかの特徴量にそれぞれ対応するn'(ただし、n'は、n'≦nを満たす2以上の整数)個の時系列データを前記記憶部から抽出するように構成されている時系列抽出部と、
を有する運転支援装置。
【請求項2】
前記時系列抽出部は、
前記操作変数の最適特徴量に類似するn個の特徴量を前記実績データから抽出し、
前記n個の特徴量の集合をクラスタリング手法によりn'個のクラスタに分割し、
前記クラスタ毎に、前記クラスタの代表点と最も類似する特徴量に対応付けられている時系列データを前記実績データから抽出することで、前記n'個の時系列データを抽出するように構成されている請求項に記載の運転支援装置。
【請求項3】
前記実績データには、n'個のタグのうちのいずれかのタグが設定されており、
前記時系列抽出部は、
前記実績データに設定されているタグ毎に、前記操作変数の最適特徴量と最も類似する特徴量に対応付けられている時系列データを前記実績データから抽出することで、前記n'個の時系列データを抽出するように構成されている請求項に記載の運転支援装置。
【請求項4】
前記タグは、前記実績データに含まれる時系列データによって表される操作系列を操作したオペレータを識別する情報である、請求項に記載の運転支援装置。
【請求項5】
前記時系列抽出部によって抽出されたn'個の時系列データを所定の出力先に出力するように構成されている出力部を更に有する請求項1乃至の何れか一項に記載の運転支援装置。
【請求項6】
前記過去の時間区間における操作変数の時系列データと、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを対象から収集するように構成されている収集部と、
前記過去の時間区間における操作変数の時系列データの平均値又は合計を、前記過去の時間区間における操作変数の特徴量として算出するように構成されている特徴量変換部と、を更に有する請求項に記載の運転支援装置。
【請求項7】
前記学習部は、
前記過去の時間区間における操作変数の特徴量と前記過去の時間区間における環境変数の特徴量とを入力して、前記過去の時間区間における状態変数の特徴量の予測精度が高くなるように前記予測モデルを学習するように構成されている、請求項に記載の運転支援装置。
【請求項8】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における操作変数の時系列データとが対応付けられている実績データの集合を記憶部に記憶させる記憶手順と、
過去の時間区間における前記操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化手順と、
前記記憶部に記憶されている実績データに含まれる操作変数の特徴量のうち、前記操作変数の最適特徴量に少なくとも類似するn(ただし、nは予め決められた2以上の整数)個の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データとして、前記n個の特徴量のうちのいずれかの特徴量にそれぞれ対応するn'(ただし、n'は、n'≦nを満たす2以上の整数)個の時系列データを前記記憶部から抽出するように構成されている時系列抽出手順と、
をコンピュータが実行する運転支援方法。
【請求項9】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における操作変数の時系列データとが対応付けられている実績データの集合を記憶部に記憶させる記憶手順と、
過去の時間区間における前記操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化手順と、
前記記憶部に記憶されている実績データに含まれる操作変数の特徴量のうち、前記操作変数の最適特徴量に少なくとも類似するn(ただし、nは予め決められた2以上の整数)個の特徴量を用いて、前記将来の時間区間における操作変数の複数の時系列データとして、前記n個の特徴量のうちのいずれかの特徴量にそれぞれ対応するn'(ただし、n'は、n'≦nを満たす2以上の整数)個の時系列データを前記記憶部から抽出するように構成されている時系列抽出手順と、
をコンピュータに実行させるプログラム。