(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-05-30
(45)【発行日】2022-06-07
(54)【発明の名称】運転支援装置、運転支援方法及びプログラム
(51)【国際特許分類】
G05B 23/02 20060101AFI20220531BHJP
【FI】
G05B23/02 X
(21)【出願番号】P 2022007145
(22)【出願日】2022-01-20
【審査請求日】2022-01-20
【早期審査対象出願】
(73)【特許権者】
【識別番号】000005234
【氏名又は名称】富士電機株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】川口 繭子
(72)【発明者】
【氏名】石橋 直人
(72)【発明者】
【氏名】島崎 祐一
【審査官】黒田 暁子
(56)【参考文献】
【文献】特開2020-140253(JP,A)
【文献】特開2021-174352(JP,A)
【文献】特開2022-007859(JP,A)
【文献】特開平08-087303(JP,A)
【文献】特開2003-084805(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 23/02
(57)【特許請求の範囲】
【請求項1】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、
前記操作変数の最適特徴量を、前記将来の時間区間における前記操作変数の時系列データに変換するように構成されている時系列変換部と、
を有する運転支援装置。
【請求項2】
前記将来の時間区間における前記操作変数の時系列データを所定の出力先に出力するように構成されている出力部を更に有する請求項1に記載の運転支援装置。
【請求項3】
前記過去の時間区間における操作変数の時系列データと、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを対象から収集するように構成されている収集部と、
前記過去の時間区間における操作変数の時系列データの平均値又は合計を、前記過去の時間区間における操作変数の特徴量として算出するように構成されている特徴量変換部と、を更に有する請求項1又は2に記載の運転支援装置。
【請求項4】
前記時系列変換部は、
前記操作変数の最適特徴量を、前記最適特徴量に前記
操作変数の特徴量が類似する過去の時間区間における前記操作変数の時系列データに変換するように構成されている、請求項3に記載の運転支援装置。
【請求項5】
前記時系列変換部は、
前記操作変数の最適特徴量を、前記最適特徴量に前記操作変数の特徴量が類似し、かつ、前記予測モデルにより予測された値に前記状態変数の特徴量が類似し、かつ、前記将来の時間区間における前記環境変数の特徴量に前記環境変数の特徴量が類似する過去の時間区間における前記操作変数の時系列データに変換するように構成されている、請求項3又は4に記載の運転支援装置。
【請求項6】
前記学習部は、
前記過去の時間区間における操作変数の特徴量と前記過去の時間区間における環境変数の特徴量とを入力して、前記過去の時間区間における状態変数の特徴量の予測精度が高くなるように前記予測モデルを学習するように構成されている、請求項1乃至5の何れか一項に記載の運転支援装置。
【請求項7】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習する学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出する最適化手順と、
前記操作変数の最適特徴量を、前記将来の時間区間における前記操作変数の時系列データに変換する時系列変換手順と、
をコンピュータが実行する運転支援方法。
【請求項8】
過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習する学習手順と、
将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出する最適化手順と、
前記操作変数の最適特徴量を、前記将来の時間区間における前記操作変数の時系列データに変換する時系列変換手順と、
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、運転支援装置、運転支援方法及びプログラムに関する。
【背景技術】
【0002】
近年、産業分野では熟練オペレータの不足等を背景に、AI(Artificial Intelligence)や機械学習技術等を活用したプラント運転支援システムへのニーズが高まっている。一般に、発電プラント、鉄鋼プラント、化学プラント等といったプラントでは、その時の環境に応じて、オペレータが過去の知見から将来の製品品質に寄与する状態変数が目標値となるように最適な操作量を計画した上で、その操作量によりプラントを運転している。これに対して、予測技術等を利用したプラント運転支援システムが従来から提案されている。
【0003】
例えば、過去の計測データから運転指標を予測する予測モデルを作成し、その運転指標を最適化する運転条件を求めるプラントの運転条件最適化システムが提案されている(例えば、特許文献1)。
【0004】
また、例えば、過去の操業因子を入力として、それに対する操業結果を予測する操業結果予測方法が提案されている(例えば、特許文献2)。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2012-74007号公報
【文献】特開2006-120131号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、必ずしも最適な操作量の時系列を得ることができなかった。例えば、特許文献1では、時系列データを扱うことができないため、操作量の時系列を得ることはできない。また、例えば、特許文献2では、最適化技術を用いておらず、必ずしも最適ではない操作量の時系列が得られる可能性がある。
【0007】
本発明の一実施形態は、上記の点に鑑みてなされたもので、最適な操作量の時系列を得ることを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するため、一実施形態に係る運転支援装置は、過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、前記操作変数の最適特徴量を、前記将来の時間区間における前記操作変数の時系列データに変換するように構成されている時系列変換部と、を有する。
【発明の効果】
【0009】
最適な操作量の時系列を得ることができる。
【図面の簡単な説明】
【0010】
【
図1】本実施形態に係る運転支援装置のハードウェア構成の一例を示す図である。
【
図2】本実施形態に係る運転支援装置の機能構成の一例を示す図である。
【
図3】本実施形態に係るデータ収集処理の一例を示すフローチャートである。
【
図4】本実施形態に係るモデル学習処理の一例を示すフローチャートである。
【
図5】本実施形態に係る最適操作系列出力処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本発明の一実施形態について説明する。本実施形態では、プラント、設備、機器、装置等といったものを対象として、その対象の状態変数値が目標値となるような最適な操作量の時系列を得ることにより当該対象の運転を支援することができる運転支援装置10について説明する。ここで、本実施形態に係る運転支援装置10には、(1)予測モデルを学習するためのデータを収集するデータ収集フェーズ、(2)予測モデルを学習するモデル学習フェーズ、(3)予測モデルと最適化技術により対象に対する最適な操作量の時系列(以下、最適操作系列ともいう)を出力する運転支援フェーズ、の3つのフェーズがある。
【0012】
なお、対象とは、オペレータ等が操作するプラント、設備、機器、装置等のことである。対象には各種センサが設置されており、これらのセンサにより当該対象の状態や環境、当該対象に対する操作等が計測される。状態の具体例としては、例えば、或る時点の温度、圧力、流量等が挙げられる。環境の具体例としては、例えば、或る時点の外気温、設備番号等が挙げられる。操作の具体例としては、例えば、対象の空気弁や燃料バルブ等に対する開閉量、空気弁の開閉によって制御される酸素量等が挙げられる。このような状態を表す変数を状態変数、環境を表す変数を環境変数、操作を表す変数を操作変数という。
【0013】
以下、操作変数の総数をI、状態変数の総数をJ、環境変数の総数をKとする。また、操作変数値は時系列データとして得られるものとし、或る時間区間T=[ts,te]におけるi(1≦i≦I)番目の操作変数の時系列データをXi={Xit|t∈T}とする。ここで、tsは時間区間Tの開始時刻、teは時間区間Tの終了時刻、Xitは時刻tの操作変数値である。一方で、状態変数値はその時間区間における特徴量データとして得られるものとし、時間区間Tにおけるj(1≦j≦J)番目の状態変数値をyjとする。同様に、環境変数値はその時間区間における特徴量データとして得られるものとし、時間区間Tにおけるk(1≦k≦K)番目の環境変数値をzkとする。
【0014】
上記の時間区間Tは予め決められた任意の時間区間としてよいが、例えば、対象がバッチプラントである場合には1バッチの時間区間をTとすることが考えられる。これ以外にも、例えば、1つの製品が製造される時間区間、1つの作業工程を表す時間区間、何等かの分析単位とする時間区間等をTとすることが可能である。以下では、複数の時間区間Tを考える場合は、m番目の時間区間をT(m)と表す。また、m番目の時間区間T(m)におけるi番目の操作変数の時系列データをXi
(m)={Xit|t∈T(m)}、j番目の状態変数値をyj
(m)、k番目の環境変数値をzk
(m)と表す。
【0015】
例えば、対象として鉄鋼プラントを想定した場合、m番目の時間区間T(m)はm番目のバッチ、Xi
(m)はm番目のバッチにおける酸素量の時系列データ、yj
(m)はm番目のバッチの溶綱温度、zk
(m)はm番目のバッチの炉番号等とすることが考えられる。
【0016】
<運転支援装置10のハードウェア構成例>
本実施形態に係る運転支援装置10のハードウェア構成例を
図1に示す。
図1に示すように、本実施形態に係る運転支援装置10は、入力装置101と、表示装置102と、外部I/F103と、通信I/F104と、RAM(Random Access Memory)105と、ROM(Read Only Memory)106と、補助記憶装置107と、プロセッサ108とを有する。これらの各ハードウェアは、それぞれがバス109を介して通信可能に接続される。
【0017】
入力装置101は、例えば、キーボード、マウス、タッチパネル、物理ボタン等である。表示装置102は、例えば、ディスプレイ、表示パネル等である。なお、運転支援装置10は、例えば、入力装置101及び表示装置102のうちの少なくとも一方を有していなくてもよい。
【0018】
外部I/F103は、記録媒体103a等の外部装置とのインタフェースである。記録媒体103aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
【0019】
通信I/F104は、運転支援装置10を通信ネットワークに接続するためのインタフェースである。RAM105は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。ROM106は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。補助記憶装置107は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の不揮発性の記憶装置であり、プログラムやデータが格納される。プロセッサ108は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の各種演算装置である。
【0020】
なお、
図1に示すハードウェア構成は一例であって、運転支援装置10は、他のハードウェア構成を有していてもよい。例えば、運転支援装置10は、複数の補助記憶装置107や複数のプロセッサ108を有していてもよいし、図示したハードウェア以外の種々のハードウェアを有していてもよい。
【0021】
<運転支援装置10の機能構成例>
本実施形態に係る運転支援装置10の機能構成例を
図2に示す。
図2に示すように、本実施形態に係る運転支援装置10は、入力部201と、特徴量変換部202と、モデル学習部203と、最適化部204と、時系列変換部205と、出力部206とを有する。これら各部は、例えば、運転支援装置10にインストールされた1以上のプログラムがプロセッサ108等に実行させる処理により実現される。また、本実施形態に係る運転支援装置10は、記憶部207を有する。記憶部207は、例えば、補助記憶装置107等により実現される。なお、記憶部207は、例えば、運転支援装置10と通信ネットワークを介して接続されるデータベースサーバ等といった記憶装置により実現されてもよい。
【0022】
入力部201は、データ収集フェーズにおいて、過去の時間区間における操作変数の時系列データと状態変数値と環境変数値とを対象から取得する。
【0023】
また、入力部201は、モデル学習フェーズにおいて、予測モデルの学習に用いるデータ(後述する学習用データ)を記憶部207から取得する。
【0024】
更に、入力部201は、運転支援フェーズにおいて、最適操作系列を求めたい将来の時間区間における環境変数値と状態変数の目標値を記憶部207から取得する。
【0025】
特徴量変換部202は、データ収集フェーズにおいて、操作変数の時系列データを特徴量データに変換する。具体的には、特徴量変換部202は、m番目の時間区間T(m)における操作変数の時系列データXi
(m)(i=1,・・・,I)を特徴量データxi
(m)(i=1,・・・,I)に変換する。ここで、xi
(m)はXi
(m)の特徴量を表しており、例えば、Xit(t∈T(m))の平均値や合計値等といった統計量である。m番目の時間区間T(m)における操作変数の時系列データXi
(m)(i=1,・・・,I)とその特徴量データxi
(m)と(i=1,・・・,I)と状態変数値yj
(m)(j=1,・・・,J)と環境変数値zk
(m)(k=1,・・・,K)は対応付けられてm番目の時間区間T(m)における実績データとして記憶部207に保存される。すなわち、m番目の時間区間T(m)における実績データは(X1
(m),・・・,XI
(m),x1
(m),・・・,xI
(m),y1
(m),・・・,yJ
(m),z1
(m),・・・,zK
(m))と表される。以下、m番目の時間区間T(m)における実績データのことをm番目の実績データともいう。また、以下、操作変数の時系列データの特徴量データのことを「操作特徴量」ともいう。
【0026】
モデル学習部203は、モデル学習フェーズにおいて、学習用データを用いて、操作特徴量と環境変数値から状態変数値を予測する予測モデルを学習する。すなわち、モデル学習部203は、各j=1,・・・,Jに対してyj=fj(x1,・・・,xI,z1,・・・,zK)と状態変数値を予測する予測モデルf=(f1,・・・,fJ)を学習する。このような予測モデルとしては、例えば、ニューラルネットワーク等を用いたDL(Deep Learning)、PLS(Partial Least squares Regression)等といった手法により学習すればよい。ここで、学習用データとは実績データから操作特徴量と状態変数値と環境変数値を抽出したデータであり、m番目の学習用データは(x1
(m),・・・,xI
(m),y1
(m),・・・,yJ
(m),z1
(m),・・・,zK
(m))と表される。
【0027】
最適化部204は、運転支援フェーズにおいて、予測モデルfを用いて、将来の時間区間における環境変数値と状態変数の目標値から最適な操作特徴量を算出する。すなわち、最適化部204は、将来の時間区間における環境変数値をz'k、当該時間区間における状態変数の目標値をy'jとして、fj(x1,・・・,xI,z'1,・・・,z'K)がy'jに近くなるような操作特徴量x1,・・・,xIを最適な操作特徴量として算出する。より具体的には、最適化部204は、例えば、j=1,・・・,Jに関する|fj(x1,・・・,xI,z'1,・・・,z'K)-y'j|の和(つまり、j=1,・・・,Jに関する絶対誤差の和)を最小化するような操作特徴量x1,・・・,xIを最適な操作特徴量として算出する。これは、例えば、一般的な数理計画法やメタヒューリスティックス等により算出することができる。なお、絶対誤差は一例であって、これに限られず、例えば、二乗誤差等が用いられてもよい。
【0028】
時系列変換部205は、最適化部204によって算出された最適な操作特徴量を時系列データに変換する。すなわち、時系列変換部205は、最適な操作特徴量をx'1,・・・,x'Iとして、最適な操作特徴量x'i(i=1,・・・,I)、環境変数値z'k(k=1,・・・,K)及び状態変数の予測値fj(x'1,・・・,x'I,z'1,・・・,z'K)(j=1,・・・,J)に類似する実績データを特定した上で、最適な操作特徴量x'iを、当該実績データに含まれる時系列データXi
(m)に変換する。より具体的には、時系列変換部205は、例えば、j=1,・・・,Jに関する|fj(x'1,・・・,x'I,z'1,・・・,z'K)-yj
(m)|の和と、i=1,・・・,Iに関する|x'i-xi
(m)|の和と、k=1,・・・,Kに関する|z'k-zk
(m)|の和との総和を最小化するようなm番目の実績データを特定した上で、最適な操作特徴量x'iを、当該実績データに含まれる時系列データXi
(m)に変換する。なお、上記では類似の評価尺度としてマンハッタン距離を用いたが、これは一例であって、例えば、ユークリッド距離等が用いられてもよい。また、絶対誤差は一例であって、これに限られず、例えば、二乗誤差等が用いられてもよい。
【0029】
出力部206は、時系列変換部205によって得られた操作変数の時系列データXi
(m)を最適操作系列Xiとして予め決められた任意の出力先(例えば、表示装置102、記憶部207、オペレータが利用する端末等)に出力する。これにより、例えば、オペレータは、当該時間区間の最適操作系列(つまり、対象の状態変数値が目標値となるような最適な操作量の時系列)を得ることができる。したがって、オペレータは、例えば、この最適操作系列を参考に対象の最適な運転計画を策定し、この運転計画により対象を運転させることが可能となる。
【0030】
記憶部207は、データ収集フェーズで収集された実績データを記憶する。また、記憶部207は、モデル学習フェーズで学習された予測モデルf、運転支援フェーズで用いられる状態変数の目標値等を記憶する。これら以外にも、記憶部207には、様々なデータ(例えば、予測モデルfを学習する際の途中の計算結果、最適な操作特徴量を算出する際の途中の計算結果等)が記憶されてもよい。
【0031】
<データ収集処理>
以下、データ収集フェーズで予測モデルを学習するためのデータを収集するデータ収集処理について、
図3を参照しながら説明する。
図3のステップS101~ステップS103は、例えば、各m∈M(ただし、Mはデータ収集対象の時間区間の番号の集合)毎に繰り返し実行される。以下では、或るm番目の時間区間のデータを収集する場合について説明する。
【0032】
入力部201は、m番目の時間区間における操作変数の時系列データXi
(m)(i=1,・・・,I)と状態変数値yj
(m)(j=1,・・・,J)と環境変数値zk
(m)(k=1,・・・,K)とを対象から取得する(ステップS101)。
【0033】
次に、特徴量変換部202は、時系列データXi
(m)(i=1,・・・,I)を操作特徴量xi
(m)(i=1,・・・,I)に変換する(ステップS102)。
【0034】
そして、入力部201は、(X1
(m),・・・,XI
(m),x1
(m),・・・,xI
(m),y1
(m),・・・,yJ
(m),z1
(m),・・・,zK
(m))をm番目の実績データとして記憶部207に保存する(ステップS103)。
【0035】
以上のステップS101~ステップS103が各m∈M毎に繰り返し実行されることで、実績データ集合{(X1
(m),・・・,XI
(m),x1
(m),・・・,xI
(m),y1
(m),・・・,yJ
(m),z1
(m),・・・,zK
(m))|m∈M}が得られる。なお、各操作特徴量xi
(m)、各状態変数値yj
(m)及び各環境変数値zk
(m)は、例えば、0以上1以下の値となるように正規化されてもよい。
【0036】
<モデル学習処理>
以下、モデル学習フェーズで予測モデルを学習するモデル学習処理について、
図4を参照しながら説明する。
【0037】
入力部201は、学習用データを記憶部207から取得する(ステップS201)。すなわち、入力部201は、学習用データ集合{(x1
(m),・・・,xI
(m),y1
(m),・・・,yJ
(m),z1
(m),・・・,zK
(m))|m∈M'}を記憶部207から取得する。ここで、M'は学習用データに対応する実績データの番号の集合であり、M'⊂Mである。なお、M'=Mであってもよい。
【0038】
次に、モデル学習部203は、学習用データ集合に含まれる各学習用データを用いて、予測モデルfを学習する(ステップS202)。すなわち、モデル学習部203は、fj(x1
(m),・・・,xI
(m),z1
(m),・・・,zK
(m))がyj
(m)を精度良く予測するように予測モデルf=(f1,・・・,fJ)を学習する。
【0039】
そして、モデル学習部203は、学習済みの予測モデルfを記憶部207に保存する(ステップS203)。
【0040】
<最適操作系列出力処理>
以下、運転支援フェーズで最適操作系列を出力する最適操作系列出力処理について、
図5を参照しながら説明する。以下では、将来の或る時間区間Tにおける最適操作系列を出力する場合について説明する。
【0041】
まず、入力部201は、当該時間区間Tにおける環境変数値z'k(k=1,・・・,K)と状態変数の目標値y'j(j=1,・・・,J)を記憶部207から取得する(ステップS301)。なお、例えば、各実績データに含まれる操作特徴量xi
(m)、状態変数値yj
(m)及び環境変数値zk
(m)が0以上1以下の値となるように正規化されている場合は、環境変数値z'k(k=1,・・・,K)と状態変数の目標値y'j(j=1,・・・,J)も同様に正規化されているものとする。
【0042】
次に、最適化部204は、学習済みの予測モデルfを用いて、当該時間区間Tの最適な操作特徴量を算出する(ステップS302)。例えば、最適化部204は、j=1,・・・,Jに関する|fj(x1,・・・,xI,z'1,・・・,z'K)-y'j|の和を最小化するような操作特徴量x1,・・・,xIを最適な操作特徴量として算出する。以下、本ステップで算出された最適な操作特徴量をx'1,・・・,x'Iとする。
【0043】
次に、時系列変換部205は、最適な操作特徴量x'i(i=1,・・・,I)と環境変数値z'k(k=1,・・・,K)と状態変数の予測値fj(x'1,・・・,x'I,z'1,・・・,z'K)(j=1,・・・,J)に類似する実績データを特定する(ステップS303)。例えば、時系列変換部205は、j=1,・・・,Jに関する|fj(x'1,・・・,x'I,z'1,・・・,z'K)-yj
(m)|の和と、i=1,・・・,Iに関する|x'i-xi
(m)|の和と、k=1,・・・,Kに関する|z'k-zk
(m)|の和との総和を最小化するようなm番目の実績データを類似する実績データとして特定する。
【0044】
次に、時系列変換部205は、最適な操作特徴量x'i(i=1,・・・,I)を、特定したm番目の実績データに含まれる時系列データXi
(m)(i=1,・・・,I)に変換する(ステップS304)。
【0045】
そして、出力部206は、変換後の時系列データXi
(m)(i=1,・・・,I)を最適操作系列Xi(i=1,・・・,I)として予め決められた任意の出力先に出力する(ステップS305)。これにより、オペレータは、当該時間区間の最適操作系列Xi(i=1,・・・,I)を得ることができる。
【0046】
<まとめ>
以上のように、本実施形態に係る運転支援装置10は、操作変数の特徴量と環境変数値から状態変数値を予測する予測モデルを学習した上で、この予測モデルにより状態変数が目標値となる最適な操作変数の特徴量を算出する。そして、本実施形態に係る運転支援装置10は、この最適な操作変数の特徴量を時系列に変換した最適操作系列をオペレータ等のユーザに出力する。これにより、過去の実績データにはない最適な操作変数の特徴量が最適解として得られ、その最適解に類似する過去の操作変数の特徴量に対応する時系列データを抽出することが可能となる。
【0047】
なお、例えば、運転支援フェーズで得られた最適操作系列Xi(i=1,・・・,I)を参考にオペレータによって運転計画が作成され、この運転計画に従って対象が運転されるが、その運転結果は実績データとして得られる。したがって、このような実績データを用いて、上記のモデル学習処理を実行し、予測モデルfを再学習してもよい。
【0048】
また、一般に運転支援フェーズで得られた最適操作系列Xi(i=1,・・・,I)を参考にオペレータによって運転計画が作成されるが、例えば、最適操作系列Xi(i=1,・・・,I)の精度が十分に高い場合にはその最適操作系列(i=1,・・・,I)により対象が自動運転されてもよい。
【0049】
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
【符号の説明】
【0050】
10 運転支援装置
101 入力装置
102 表示装置
103 外部I/F
103a 記録媒体
104 通信I/F
105 RAM
106 ROM
107 補助記憶装置
108 プロセッサ
109 バス
201 入力部
202 特徴量変換部
203 モデル学習部
204 最適化部
205 時系列変換部
206 出力部
207 記憶部
【要約】
【課題】最適な操作量の時系列を得ること。
【解決手段】一実施形態に係る運転支援装置は、過去の時間区間における操作変数の特徴量と、前記過去の時間区間における状態変数の特徴量と、前記過去の時間区間における環境変数の特徴量とを用いて、前記操作変数の特徴量と前記環境変数の特徴量から前記状態変数の特徴量を予測する予測モデルを学習するように構成されている学習部と、将来の時間区間における前記環境変数の特徴量と、前記将来の時間区間における前記状態変数の目標特徴量とを用いて、前記予測モデルにより前記将来の時間区間における前記操作変数の最適特徴量を算出するように構成されている最適化部と、前記操作変数の最適特徴量を、前記将来の時間区間における前記操作変数の時系列データに変換するように構成されている時系列変換部と、を有する。
【選択図】
図2