(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024063678
(43)【公開日】2024-05-13
(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム
(51)【国際特許分類】
G06N 99/00 20190101AFI20240502BHJP
G05B 23/02 20060101ALI20240502BHJP
【FI】
G06N99/00 180
G05B23/02 Z
G05B23/02 X
G05B23/02 301N
G05B23/02 301V
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022171829
(22)【出願日】2022-10-26
(11)【特許番号】
(45)【特許公報発行日】2024-01-18
(71)【出願人】
【識別番号】399035766
【氏名又は名称】エヌ・ティ・ティ・コミュニケーションズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】伊藤 浩二
(72)【発明者】
【氏名】泉谷 知範
(72)【発明者】
【氏名】藤原 大悟
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA01
3C223BA03
3C223BB02
3C223BB11
3C223CC02
3C223DD03
3C223FF02
3C223FF03
3C223FF12
3C223FF13
3C223FF17
3C223FF22
3C223FF26
3C223FF33
3C223FF42
3C223FF52
3C223FF53
3C223HH02
3C223HH03
3C223HH05
3C223HH08
3C223HH17
3C223HH29
(57)【要約】
【課題】操作対象の自動運転の停止後における当該自動運転の再開のタイミングの判断を容易にする。
【解決手段】情報処理装置100は、学習モデルに基づき推論される操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出し、誤差が所定の条件を満たす場合に、自動運転を停止した操作対象について自動運転の開始が可能であると判定を行い、判定結果に基づき、操作対象の自動運転に関する情報を出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
学習モデルに基づき推論される操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出する算出部と、
前記誤差が所定の条件を満たす場合に、自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をする判定部と、
前記判定部の判定結果に基づき、前記操作対象の自動運転に関する情報を出力する出力部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記判定部は、前記所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、該誤差が所定の回数を超えて所定の値を連続して下回る場合に、前記操作対象の自動運転の稼働についての判定として前記自動運転の開始が可能であると判定をする、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記判定部は、前記所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、所定の期間における該誤差の平均値が所定の値を下回る場合に、前記操作対象の自動運転の稼働についての判定として前記自動運転の開始が可能であると判定をする、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記出力部は、前記操作対象の自動運転に関する情報として、前記判定部の判定に基づいて前記自動運転の開始に関する情報を出力する、
ことを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記出力部は、前記操作対象の自動運転に関する情報として、前記判定部の判定に基づいて前記自動運転の開始の指示に関する情報を出力する、
ことを特徴とする請求項2に記載の情報処理装置。
【請求項6】
学習モデルに基づき推論される操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出する工程と、
前記誤差が所定の条件を満たす場合に、自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をする工程と、
判定部の判定結果に基づき、前記操作対象の自動運転に関する情報を出力する工程と、
を含むことを特徴とする情報処理方法。
【請求項7】
学習モデルに基づき推論される操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出するステップと、
前記誤差が所定の条件を満たす場合に、自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をするステップと、
判定部の判定結果に基づき、前記操作対象の自動運転に関する情報を出力するステップと、
をコンピュータに実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
【背景技術】
【0002】
人間の行動に関する情報を用いて、人間による行動を模倣する機械学習モデルを作る模倣学習という技術が知られている。そして、前述の模倣学習の実現方法として、例えば、教師あり学習が知られている。さらに、教師あり学習の1つの手法として、観測されたデータを大量に蓄積しておき、蓄積されたデータの中から要求点の近傍のデータを抽出し、当該抽出したデータを用いてモデルの逐次学習を行うJust-In-Time(JIT)法という技術が知られている(例えば、非特許文献1を参照)。
【0003】
また、近年では運転データ等を入力とする学習モデルを用いて、操作対象となる設備や工場、プラント等の自動運転を行う技術が知られている。例えば、従来技術として、取得したデータを入力とする学習モデルを用いることで、機器の制御において実環境を対象とした最適制御を簡易かつ精度よく実行する技術が知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【非特許文献1】山本 茂、「Just-In-Time予測制御:蓄積データに基づく予測制御」、計測と制御 第 52 巻 第 10 号 2013 年 10 月号(https://www.jstage.jst.go.jp/article/sicejl/52/10/52_878/_pdf/-char/ja)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来技術では、操作対象の自動運転の停止後における当該自動運転の再開のタイミングの判断が困難である、という問題があった。
【0007】
具体的には、従来技術では、操作対象の自動運転の精度低下等により自動運転を停止した場合に、運転精度の低下が解消されているかどうかや、自動運転の再開をしても問題が発生しないか、等といった判断をすることが難しい場合がある。そのため、適切なタイミングで自動運転の再開を判断することが難しい場合があった。
【課題を解決するための手段】
【0008】
そこで、上記の課題を解決し目的を達成するために、本発明の情報処理装置は、学習モデルに基づき推論される操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出する算出部と、前記誤差が所定の条件を満たす場合に、自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をする判定部と、前記判定部の判定結果に基づき、前記操作対象の自動運転に関する情報を出力する出力部と、を有することを特徴とする。
【発明の効果】
【0009】
本発明は、操作対象の自動運転の停止後における当該自動運転の再開のタイミングの判断を容易とする、という効果を奏する。
【図面の簡単な説明】
【0010】
【
図1】
図1は、実施形態に係る情報処理の概要の一例を示す図である。
【
図2】
図2は、実施形態に係る学習モデルの推論の一例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置の装置構成の一例を示す図である。
【
図4】
図4は、実施形態に係る情報処理の全体概要の一例を示す図である。
【
図5】
図5は、実施形態に係る自動運転管理画面の一例を示す図である。
【
図6】
図6は、実施形態に係る自動運転管理画面の一例を示す図である。
【
図7】
図7は、実施形態に係る自動運転管理画面の一例を示す図である。
【
図8】
図8は、実施形態に係る自動運転管理画面の一例を示す図である。
【
図9】
図9は、実施形態に係る自動運転管理画面の一例を示す図である。
【
図10】
図10は、実施形態に係る自動運転管理画面の一例を示す図である。
【
図11】
図11は、実施形態1に係る情報処理のフローチャートの一例を示す図である。
【
図12】
図12は、実施形態2に係る情報処理のフローチャートの一例を示す図である。
【
図13】
図13は、実施形態3に係る情報処理装置の装置構成の一例を示す図である。
【
図14】
図14は、実施形態3に係る情報処理のフローチャートの一例を示す図である。
【
図15】
図15は、従来技術における情報処理の概要の一例を示す図である。
【
図16】
図16は、実施形態に係る情報処理装置が実現されるコンピュータの一例を示す図である。
【発明を実施するための形態】
【0011】
以下、図面を参照しながら、本実施形態を実施するための形態(以下、「実施形態」)について説明する。なお、本実施形態は、以下に記載する内容に限定されない。
【0012】
〔1.概要〕
まず、本実施形態における情報処理装置100による情報処理の概要を、
図1を用いて説明する。本実施形態において情報処理装置100は、操作対象10の運転データDb(例えば、温度、圧力、流量、原料投入量、生成量等)と類似、または関係する過去の履歴データDa(例えば、温度、圧力、流量、原料投入量、生成量等、ユーザによる操作履歴等)を用いて学習モデル20を学習する(
図1の(1)を参照)。
【0013】
次に、ユーザU(操作対象10を操作するオペレータ)は、情報処理装置100に対して、自動運転の条件を入力する(
図1の(2)を参照)。情報処理装置100の自動運転制御部139は、ユーザUが入力する自動運転の条件と、運転データDbを入力とする前述の学習モデル20に基づき推論される推奨値RDを用いて、操作対象10に対して自動運転(以降は、操作対象10に対する自動運転を単に「自動運転」と表記)を実施する(
図1の(3)および(4)を参照)。
【0014】
そして、何らかの要因により自動運転を停止する必要が生じた場合(例えば、自動運転の精度低下等)、情報処理装置100は、自動運転を停止する(
図1の(5)を参照)。そして、情報処理装置100は、ユーザUによる手動運転が行われている間、操作対象10の自動運転の精度に関するデータ(例えば、推奨値RD等)を取得し、自動運転の精度の変化を判定する。その結果、自動運転の精度が所定の条件を満たすと判定される場合、情報処理装置100は、ユーザUに対して、自動運転の再開が可能であることを通知するための表示を行う(
図1の(6)を参照)。そして、ユーザUは、情報処理装置100の表示に基づき、自動運転の再開のための操作を行う(
図1の(7)を参照)。
【0015】
〔1-1.学習モデルによる推奨値の推論〕
続いて、
図1で説明した学習モデル20について、更に説明を行う。
図2に示すように、情報処理装置100は、操作対象10aから運転データDbを受け付ける。次に、情報処理装置100は、受け付けた運転データDbと類似する履歴データDaを用いて推奨値RDを推論するための学習モデル20の学習(訓練)を行う。
【0016】
そして、情報処理装置100は、学習(訓練)済みの学習モデル20に基づき推奨値RDの推論を行う。具体的には、情報処理装置100は、操作対象10aに対して実際にユーザUが行った操作等の情報である履歴データDaを用いて学習モデル20を学習することで、模倣学習を行う。その結果、情報処理装置100は、学習モデル20に運転データDbを入力することにより推論される推奨値RDを用いて、操作対象10bに対しての自動運転を実現する。
【0017】
例えば、操作対象10がプラントの場合、学習モデル20は、特定の工程における過去にユーザUが投入した原材料の投入量を学習する。そして、学習モデル20は、現在の運転データから、推奨値RDとして原材料の投入量を出力する。ユーザUは、学習モデル20に基づき推論される推奨値RDに従って原材料の投入量を設定することで、過去のユーザ(例えば、ユーザUやユーザU以外のオペレータ)の操作を模倣することができる。
【0018】
〔2.情報処理装置の構成〕
ここから、本実施形態に係る情報処理装置100の構成について、
図3を用いて説明する。
図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130と、を有する。なお、図示していないが、情報処理装置100は、各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、ディスプレイ等)を備えてもよい。続いて、以下に各部の詳細な機能について記載する。
【0019】
(通信部110)
通信部110は、NIC(Network Interface Card)等で実現され、LAN(Local Area Network)やインターネット等の電気通信回線を介して通信を制御する。そして、通信部110は、必要に応じてネットワークと有線または無線で接続され、双方向に情報の送受信を行うことができる。なお、本実施形態においては、外部の装置等(例えば、操作対象10等)との通信は、通信部110を介して実施される前提とする。
【0020】
(記憶部120)
記憶部120は、制御部130による各種処理に必要なデータおよびプログラムを格納する。また、記憶部120は、履歴データ記憶部121と、モデル記憶部122と、推奨値記憶部123と、誤差情報記憶部124と、を有する。そして、記憶部120は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置等で実現する。
【0021】
(履歴データ記憶部121)
履歴データ記憶部121は、操作対象10の過去の運転に関する情報として、履歴データを記憶する。例えば、履歴データ記憶部121が記憶する履歴データには、操作対象10の過去の説明変数(例えば、時刻、温度、圧力、二酸化炭素濃度等のセンサデータ)や、目的変数(例えば、ユーザによる操作履歴)を記憶し、運転データDbと説明変数が類似する履歴データDaが含まれるまた、前述した情報はあくまで一例であり、履歴データ記憶部121は、履歴データの範疇であれば限定無く記憶できる。
【0022】
(モデル記憶部122)
モデル記憶部122は、操作対象10の履歴データDaを用いて学習させる学習モデル20を記憶する。
【0023】
(推奨値記憶部123)
推奨値記憶部123は、学習モデル20によって推論される推奨値RDを記憶する。
【0024】
(誤差情報記憶部124)
誤差情報記憶部124は、算出部135が算出する操作対象10の自動運転に関する推奨値RDと、目的変数(実測値)の間の誤差に関する情報を記憶する。なお、誤差情報記憶部124は、判定部136が操作対象10の自動運転の開始の可否を判定するために用いる誤差に関する情報の範疇であれば、限定無く記憶できる。例えば、誤差情報記憶部124は、後述の算出部135が算出する過去一定期間の推論値の分散や標準偏差を記憶してよい。
【0025】
(制御部130)
制御部130は、取得部131と、学習部132と、更新部133と、推論部134と、算出部135と、判定部136と、出力部137と、表示部138と、自動運転制御部139を有する。そして、制御部130は、各種の処理手順等を規定したプログラムや処理データを一時的に格納するための内部メモリを有し、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等の電子回路、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路によって実現される。
【0026】
(取得部131)
取得部131は、操作対象10の運転に関するデータを取得する。具体的には、取得部131は、操作対象10の運転に関するデータとして、操作対象10の運転データDb(例えば、操作対象10が収集するセンサデータのうち説明変数として用いているもの等)を取得する。
【0027】
さらに、取得部131は、操作対象10の運転に関するデータとして、履歴検索用キー(現在の操作対象10のセンサデータで、以降は単に「履歴検索用キー」と記載)を用いて、操作対象10の運転実施時点における運転データDbと類似の履歴データDa(類似するセンサデータおよびユーザによる操作履歴を含む)を、履歴データ記憶部121から取得する。なお、取得部131は、前述した情報以外にも、操作対象10の運転に関するデータの範疇であれば、限定無く情報を取得できる。
【0028】
(学習部132)
学習部132は、取得部131が取得する操作対象10の履歴データDaを用いて、説明変数(センサデータ)および目的変数(ユーザによる操作履歴)学習データとして学習モデル20の学習(訓練)を行う。例えば、学習部132は、操作対象10がプラントである場合、特定の状況において過去にユーザUが投入した原材料の投入量等を履歴データDaとして用いて、学習モデル20を学習できる。
【0029】
なお、学習モデル20がアンサンブルモデルの場合は、学習部132は、バギングや、ブースティングや、スタッキング等の手法で学習を行ってよい。
【0030】
(更新部133)
更新部133は、学習部132の学習に基づき学習モデル20を更新する。さらに、更新部133は学習モデル20について、学習部132の学習に基づき更新を行う。なお、学習モデル20はアンサンブルモデルである場合には、情報処理装置100は複数の学習モデル20を有していてよい。
【0031】
(推論部134)
推論部134は、取得部131が操作対象10から取得する運転データDb(例えば、説明変数等)を入力とする学習モデル20に基づき、推奨値RDを推論する。なお、学習モデル20が複数存在するアンサンブルモデルの場合に、推論部134は、推論される推奨値RDを複数の学習モデル20の多数決や平均等によって推論してよい。
【0032】
(算出部135)
算出部135は、学習モデル20に基づき推論される操作対象10の自動運転に関する推奨値RDと、目的変数(実測値)の間の誤差を算出する。なお、算出部135が算出する誤差の具体例は、後述の実施形態1および実施形態2の項目で説明する。また、算出部135は、過去一定期間の推論値の分散や標準偏差を算出してよい。
【0033】
(判定部136)
判定部136は、誤差が所定の条件を満たす場合に、自動運転を停止した操作対象10について自動運転の開始が可能であると判定をする。なお、算出部135が算出する誤差の具体例は、後述の実施形態1および実施形態2の項目で説明する。また、判定部136は、算出部135が算出する過去一定期間の推論値の分散や標準偏差に基づいて、推論値RDが安定してきたと判定し、自動運転の開始が可能であると判定をしてよい。
【0034】
(出力部137)
出力部137は、判定部136の判定結果に基づき、操作対象10の自動運転に関する情報を出力する。具体的には、出力部137は、操作対象10の自動運転に関する情報として、判定部136の判定に基づいて自動運転の開始に関する情報を出力する。例えば、出力部137は、判定部136が自動運転の再開が可能であると判定する場合には、後述の
図8の表示SC4の「自動運転利用可能」といった表示を、表示部138が行うための自動運転の開始または停止に関する情報を出力してよい。
【0035】
(表示部138)
表示部138は、判定部136が操作対象10の自動運転の開始が可能であると判定した場合に、出力部137の出力する自動運転の開始に関する情報に基づき、ユーザUに対して操作対象10の自動運転が開始可能であることを表示する。なお、表示部138は、ユーザUに当該情報を表示する方法として、例えば、テキストや音声等、ユーザUが知覚できる方法を用いてよい。
【0036】
(自動運転制御部139)
自動運転制御部139は、運転データDb(説明変数)を入力とする学習モデル20に基づき推論する推奨値RDを用いて、操作対象10に対して自動運転を実施する。
【0037】
〔3.実施形態に係る情報処理の全体像〕
ここから、本実施形態における情報処理装置100が行う情報処理の全体像について、
図4を用いて説明する。
図4では、情報処理装置100が、後述する実施形態1および実施形態2の方法を用いて、自動運転の開始が可能かどうかを判定する手順を説明する。なお、情報処理装置100は、実施形態1および実施形態2について、それぞれ単独で実施してもよいし、任意の実施形態を組み合わせて実施してもよい。
【0038】
まず、取得部131は、履歴検索用キーを用いて履歴データ記憶部121から、操作対象10の運転データDbと類似または関係する過去の履歴データDaを取得する(
図4の(1)を参照)。続けて、学習部132は、取得した履歴データDaを用いて、学習モデル20を学習する(
図4の(2)を参照)。
【0039】
そして、更新部133は、学習モデル20を更新する(
図4の(3)を参照)。なお、
図4では学習モデル20は1つで表記しているが、1つに限定されず必要に応じて異なる数の学習モデル20があってよい。
【0040】
推論部134は、取得部131が取得する運転データDb(説明変数)を入力として(
図4の(4)を参照)、推奨値RDを推論する(
図4の(5)を参照)。なお、本実施形態においては、推論部134は、1つの学習モデル20に基づき推奨値RDを推論するが、複数の学習モデル20に基づく推論を行い場合には、複数の学習モデル20による多数決や平均によって算出してよい。
【0041】
算出部135は、操作対象10が収集する目的変数(実測値)と推論部134が推論する推奨値RDの間の誤差を算出する(
図4の(6)を参照)。次に、判定部136は、算出部135が算出する誤差に関する情報に基づき、所定の誤差判定を行う(
図4の(7)を参照)。
【0042】
ここから、判定部136による各種判定基準に基づく誤差の判定について説明する。判定部136は、所定の誤差判定として(
図4の(7)を参照)、推奨値RDと操作対象10の運転に関する実測値である目的変数の間の誤差について、前述の誤差が所定の回数を超えて所定の値を下回る場合に、自動運転の開始が可能であると判定をする。なお、上述の誤差判定方法については、実施形態1として以降の項目で説明する。
【0043】
判定部136は、所定の誤差判定として(
図4の(7)を参照)、推奨値RDと操作対象10の運転に関する実測値である目的変数の間の誤差について、所定の期間における前述の誤差の平均値が所定の値を下回る場合に、自動運転の開始が可能であると判定をする。なお、上述の誤差判定方法については、実施形態2として以降の項目で説明する。
【0044】
そして、表示部138は、判定部136が自動運転の開始が可能であるという判定する場合、ユーザUに対して自動運転の開始が可能であることを表示する(
図4の(8)を参照)。そして、ユーザUは、操作対象10に対して自動運転の開始の操作を実施する(
図4の(9)を参照)。
【0045】
他方で、判定部136が自動運転の開始が不可であると判定する場合(
図4の(10)を参照)や、ユーザUの操作により自動運転が終了した場合(
図4の(11)を参照)には、データ収集に戻り、誤差が解消されるまで処理を継続する(
図4の(12)および(13)を参照)。
【0046】
ここから、
図5から
図10を用いて、
図4の(8)で前述したユーザUに対して自動運転の開始が可能であることを表示する方法の一例を説明する。まず、
図5を用いて、ユーザUの操作する端末装置等に表示するシステム画面を説明する。なお、本項目で説明するシステム画面はあくまで一例であり、表示形式、表示内容、画面の配置、構成、組み合わせ等は限定されず、必要に応じて変更してよい。
【0047】
図5の画面SAは、自動運転における運転に関するデータの変動について視覚化した情報を表している。画面SAには、自動運転により逐次変動するデータを時系列方向に連続して表示される。一方で画面SBには、自動運転における運転に関するデータの一覧が表示される。なお、画面SAに表示される項目は、情報処理装置100が自動的に選択してもよいし、ユーザUが自身で選択してもよい。ユーザUが自身で選択する場合は、画面SBに表示されている項目に基づき画面SAの表示が切り替えられてよい。
【0048】
図5の表示SC1には、自動運転の稼働状況に関する情報が表示される。例えば、
図5の場合、表示部138は、自動運転が稼働中の場合、表示SC1に「自動運転稼働中」のテキストを表示する。そして、自動運転が停止した場合に、表示部138は、
図6の表示SC2に「自動運転停止中」のテキストを表示する。なお、前述したテキスト内容についてはあくまで一例であり、表示部138は、ユーザUに運転状況を表示するために必要に応じてその他のテキスト、画像、音声等のユーザが五感で知覚できる出力方法を用いることができる。
【0049】
また、情報処理装置100は、前述した誤差判定に基づき、操作対象10の自動運転の開始が不可である表示として、
図7の表示SC3に「自動運転利用不可」といった表示をする。そして、情報処理装置100は、操作対象10の運転精度の低下が解消し、自動運転を開始できると判定する場合には、
図8の表示SC4に「自動運転利用可能」といった表示をする。
【0050】
なお、ユーザUは、
図9の表示SC4および
図10の表示SC5に示す通り、表示部138が表示するテキスト付近に存在する「停止」と「稼働開始」のダイアログを操作して、自動運転の停止と再開を切り替えることができる。また、ユーザUは、情報処理装置100が連携する他システム(例えば、情報処理装置100が他システムに自動運転の開始または停止に関する情報を出力し、他システムが前述の情報を受け付ける場合等)の表示する自動運転の開始または停止に関する情報に基づいて、自動運転の切り替えを実施してもよい。
【0051】
〔4.実施形態1:Counterによる判定〕
ここから、前述してきた目的変数と推奨値RD間の誤差の判定方法について、実施形態1および実施形態2として、それぞれ「概要」と、「情報処理装置100の構成」と、「処理手順」と、という順番で説明する。なお、情報処理装置100は、実施形態1および実施形態2について、それぞれ単独で実施してもよいし、複数の実施形態を組み合わせて実施してもよい。まず、実施形態1として「Counterによる判定」について説明する。
【0052】
推論部134は、操作対象10が収集する運転データDb(説明変数)を入力とする学習モデル20に基づき推論を行うことで、推奨値RDを算出する。そして、自動運転制御部139は、推論された推奨値RDを用いて、操作対象10に対して自動運転を実施する。しかし、操作対象10の運転状況は経時的に変化する場合があり、それに伴い自動運転精度(推奨値RDの精度)が低下して自動運転の継続が困難になる場合がある。
【0053】
さらに、自動運転精度(推奨値RDの精度)の低下により自動運転が終了する場合には、自動運転の精度低下の解消後でなければ自動運転を開始することが難しい。従って、情報処理装置100は、自動運転の開始判断のために、前述の誤差を用いて開始可否の判定を行う。なお、前述した内容は実施形態1および実施形態2で共通であるため、以降の記載は省略する。
【0054】
前述したように、操作対象10の自動運転の再開可否の判断のための誤差判定として、実施形態1の判定部136は、算出部135により繰り返し算出される目的変数と推奨値RDの誤差の値が所定の閾値を連続して下回る回数に基づいて、自動運転の開始の可否を判定する。
【0055】
〔4-1.実施形態1の情報処理装置の構成〕
実施形態1における情報処理装置100の装置構成は、前述の情報処理装置100と同様である。したがって、本項目では差異として判定部136の付加的機能のみ説明し、それ以外の詳細な説明は省略する。
【0056】
(判定部136)
実施形態1における判定部136は、所定の条件として、操作対象10の運転に関する履歴データDaを用いた学習モデル20に基づき推論される推奨値RDと、操作対象10の運転に関する実測値である目的変数の間の誤差について、該誤差が所定の回数を超えて所定の値を連続して下回る場合に、操作対象10の自動運転の稼働についての判定として自動運転の開始が可能であると判定をする。
【0057】
例えば、判定部136は、所定の条件の一例として、算出部135が繰り返し算出する前述の誤差の値が所定の閾値を超えた際に計数情報(誤差の値が所定の閾値以下の場合に順次減算する値で、以降は「Counter」と表記)を所定の値(例えば、「10」等)に設定する。判定部136は、誤差の値が所定の閾値以下となった場合にCounterの値を減算する。そして、判定部136は、Counterの値が0になった場合に自動運転の開始が可能である、と判定する。
【0058】
なお、前述した条件はあくまで一例であり、判定部136は、Counterに設定される値、前述の所定の閾値、Counterの値から減算する値、等を必要に応じて変更して判定を行ってよい。また、実施形態1における誤差の算出方法は、誤差を判定できる手法であれば限定せず使用することができる。例えば、実施形態1の判定部136は、誤差の算出方法として、絶対誤差(AE:Absolute Error)等を用いることができる。
【0059】
〔4-2.実施形態1の処理手順〕
次に、実施形態1における情報処理装置100の情報処理方法の手順について、
図11を用いて説明する。まず、操作対象10は、運転データDbを収集する(ステップS101)。次に、取得部131は、履歴検索用キーを用いて、操作対象10の運転実施時点における運転データDbと類似の履歴データDaを履歴データ記憶部121から取得する(ステップS102)。
【0060】
学習部132は、取得部131が取得した類似の履歴データDaを用いて学習モデル20の学習を実施する(ステップS103)。続けて、更新部133は、学習モデル20を更新する(ステップS104)。そして、推論部134は、運転データDb(説明変数)を入力とする更新された学習モデル20に基づき推奨値RDを推論する(ステップS105)。
【0061】
算出部135は、目的変数と推奨値RDの誤差を算出する(ステップS106)。そして、判定部136は、算出部135が算出する誤差が所定の閾値を超えると判定する(ステップ107のYes)。その場合、判定部136は、Counterを所定の値に設定し(ステップS108)、工程を最初から繰り返す。
【0062】
他方、判定部136は、算出部135が算出する誤差が所定の閾値を超えていないと判定し(ステップS107のNo)、かつCounterの値が0より大きいと判定する(ステップS109のYes)。その場合は、判定部136は、Counterの値を所定の数だけ減算する(ステップS110)。
【0063】
そして、判定部136は、算出部135が算出する誤差が所定の閾値を超えていないと判定し(ステップS107のNo)、かつCounterの値が0である判定する(ステップS109のNo)か、減算の結果Counterの値が0になったと判定する(ステップS111のYes)場合には、更に自動運転の開始が可能であると判定する(ステップS112)。
【0064】
そして、出力部137は自動運転の開始可能に関する情報を出力する(ステップS113)。続けて、表示部138は、出力部137の出力する情報に基づき、ユーザUに自動運転の開始が可能である表示を行い(ステップS114)、工程が終了する。
【0065】
一方で、判定部136は、Counterの値を所定の数だけ減算するが、Counterの値が0より大きいと判定する(ステップS111のNo)場合には、工程を最初から繰り返す。
【0066】
〔5.実施形態2:誤差の平均値による判定〕
次に、実施形態2として「誤差の平均値による判定」について説明する。前述したように、操作対象10の自動運転の再開可否の判断のための誤差判定として、実施形態2の判定部136は、算出部135により繰り返し算出される目的変数と推奨値RDの誤差の所定の期間の平均値が、所定の値を下回るか否かに基づいて、自動運転の開始の可否を判定する。
【0067】
〔5-1.実施形態2の情報処理装置の構成〕
実施形態2における情報処理装置100の装置構成は、前述の情報処理装置100と同様である。したがって、本項目では差異として、判定部136の付加的機能のみ説明し、それ以外の詳細な説明は省略する。
【0068】
(判定部136)
実施形態2における判定部136は、所定の条件として、操作対象10の運転に関する履歴データDaを用いた学習モデル20に基づき推論される推奨値RDと、操作対象10の運転に関する実測値である目的変数の間の誤差について、所定の期間における該誤差の平均値が所定の値を下回る場合に、操作対象10の自動運転の稼働についての判定として自動運転の開始が可能であると判定をする。
【0069】
なお、前述した誤差の平均値の算出方法は特に限定されず、例えば、平均値の算出方法が平均絶対誤差の場合には、相加平均を用いて平均値の算出を行ってよい。なお、その場合、平均絶対誤差の計算時の幅については、所定の条件(例えば、過去30分間、過去1時間等)を任意に設定することができる。
【0070】
〔5-2.実施形態2の処理手順〕
次に、実施形態2における情報処理装置100の情報処理方法の手順について、
図12を用いて説明する。まず、操作対象10は、運転データDbを収集する(ステップS201)。次に、取得部131は、履歴検索用キーを用いて、操作対象10の運転実施時点における運転データDbと類似の履歴データDaを履歴データ記憶部121から取得する(ステップS202)。
【0071】
学習部132は、取得部131が取得した類似の履歴データDaを用いて学習モデル20の学習を実施する(ステップS203)。続けて、更新部133は、学習モデル20を更新する(ステップS204)。そして、推論部134は、運転データDb(説明変数)を入力とする更新された学習モデル20に基づき推奨値RDを推論する(ステップS205)。
【0072】
算出部135は、目的変数と推奨値RDの誤差を算出する(ステップS206)。そして、判定部136は、算出部135が算出する誤差の所定の期間における平均値が所定の値を超えないと判定する(ステップ207のNo)。その場合、判定部136は、操作対象10の自動運転の開始が可能であると判定する(ステップS208)。そして、出力部137は操作対象10の自動運転の開始可能に関する情報を出力する(ステップS209)。続けて、表示部138は、出力部137の出力する情報に基づき、ユーザUに操作対象10の自動運転の開始が可能である表示を行い(ステップS210)、工程が終了する。
【0073】
一方で、判定部136は、算出部135が算出する誤差の所定の期間における平均値が所定の値を超えると判定する(ステップ207のYes)場合には、工程を最初から繰り返す。
【0074】
〔6.実施形態3:自動運転の開始指示〕
ここから、更に異なる実施形態3として、「自動運転の開始指示」について説明する。前述したように、実施形態1および実施形態2において、情報処理装置100は、異なる方法で目的変数と推奨値RDの誤差の発生を判定し、更に操作対象10の運転の開始が可能であるか否かを判定し、ユーザUに表示する。
【0075】
他方で、実施形態3は、誤差の判定後にユーザUに対する操作対象10の自動運転の開始が可能であることの表示ではなく、操作対象10に対して自動運転の開始を指示する実施形態である。なお、実施形態3における誤差の判定方法は、実施形態1または実施形態2のいずれか1つまたは両方を必要に応じて用いることが可能である。
【0076】
〔6-1.実施形態3の情報処理装置の構成〕
ここから、実施形態3に係る情報処理装置100の構成について、
図13を用いて説明する。
図13に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130と、を有する。なお、実施形態3における情報処理装置100の装置構成は、表示部138を含まないという点以外、実施形態1および実施形態2の情報処理装置100と同様の構成である。したがって、本項目では差異として、出力部137および自動運転制御部139のみ説明し、それ以外の詳細な説明は省略する。
【0077】
(出力部137)
出力部137は、操作対象10の自動運転に関する情報として、判定部136の判定に基づいて自動運転の開始の指示に関する情報を自動運転制御部139に出力する。
【0078】
(自動運転制御部139)
自動運転制御部139は、出力部137の出力する自動運転の開始の指示に関する情報に基づき、操作対象10の自動運転を開始する。
【0079】
〔6-2.実施形態3の処理手順〕
次に、実施形態3における情報処理装置100の情報処理方法の手順について、
図14を用いて説明する。まず、操作対象10は、運転データDbを収集する(ステップS301)。次に、取得部131は、履歴検索用キーを用いて、操作対象10の運転実施時点における運転データDbと類似の履歴データDaを履歴データ記憶部121から取得する(ステップS302)。
【0080】
学習部132は、取得部131が取得した類似の履歴データDaを用いて学習モデル20の学習を実施する(ステップS303)。続けて、更新部133は、学習モデル20を更新する(ステップS304)。そして、推論部134は、運転データDb(説明変数)を入力とする更新された学習モデル20に基づき推奨値RDを推論する(ステップS305)。
【0081】
算出部135は、目的変数と推奨値RDを比較して、所定の誤差に関する情報を算出する(ステップS306)。そして、判定部136は、算出部135が算出する所定の誤差に関する情報が所定の基準を満たすと判定する(ステップ307のYes)。その場合、判定部136は、自動運転の開始が可能であると判定する(ステップS308)。そして、出力部137は自動運転の開始の指示に関する情報を出力する(ステップS309)。続けて、自動運転制御部139は、出力部137の出力する情報に基づき、自動運転を開始し(ステップS310)、工程が終了する。
【0082】
一方で、判定部136は、算出部135が算出する所定の誤差に関する情報が所定の基準を満たさないと判定する(ステップ307のNo)場合には、工程を最初から繰り返す。
【0083】
〔7.効果〕
従来技術では、ユーザUは、運転データDbを入力とする学習モデル20に基づき推論される推奨値RDを用いて、操作対象10を手動で操作する。ここで、
図15を用いて、従来技術による推奨値RDの提示と、ユーザUによる操作対象10の手動操作について説明を行う。
【0084】
図15では、従来技術における情報処理装置1は、操作対象10の運転データDb(例えば、温度、圧力、流量、原料投入量、生成量等)と類似、または関係する過去の履歴データDa(例えば、温度、圧力、流量、原料投入量、生成量等、ユーザによる操作履歴等)を用いて学習モデル20を学習する(
図15の(1)を参照)。次に、情報処理装置1は、運転データDbを入力とする(
図15の(2)を参照)、前述の学習モデル20に基づき推論される推奨値RDをガイダンス画面30に表示し、ユーザUに対してレコメンドする(
図15の(3)を参照)。そして、ユーザUは、情報処理装置1からの表示に基づき、手動で操作対象10を操作する(
図15の(4)を参照)。
【0085】
前述したように、従来技術では、ユーザUが提示される推奨値RDに基づいて操作対象10を手動操作するため、推奨値RDの精度が変化している際でも、ユーザU自身が手動で操作を行うことで運転の継続や停止を行うことが可能であった。しかしながら、ユーザUを介さない自動運転時には、推奨値RDの精度低下等により、一度自動運転を停止した後に、適切なタイミングで再度自動運転への切り替えを判断することが難しい場合があった。
【0086】
前述してきたように、情報処理装置100は、学習モデル20に基づき推論される操作対象10の自動運転に関する推奨値RDと、目的変数の間の誤差を算出し、誤差が所定の条件を満たす場合に、自動運転を停止した操作対象10について自動運転の開始が可能であると判定を行い、判定部136の判定結果に基づき、操作対象10の自動運転に関する情報を出力する。そのため、本実施形態によれば、情報処理装置100は、下記の効果を奏する。
【0087】
情報処理装置100は、操作対象10の自動運転の停止後における当該自動運転の再開のタイミングの判断を容易とする、という効果を奏する。
【0088】
さらに、情報処理装置100は、操作対象10の運転に関するデータに基づいて、動的に自動運転の開始可否を判定することにより、ユーザUの経験や熟練度、スキル等に左右されずに、安全な自動運転の開始が可能となる、という効果を奏する。
【0089】
〔8.ハードウェア構成〕
図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
【0090】
また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を公知の方法で手動的に行うこともできる。この他、図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0091】
[プログラム]
一実施形態として、情報処理装置100は、パッケージソフトウェアやオンラインソフトウェアとして、前述した情報処理方法を実行する情報処理プログラムを、所望のコンピュータにインストールさせることによって実装できる。例えば、上記の情報処理プログラムを情報処理装置に実行させることにより、情報処理装置100として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
【0092】
図16は、情報処理装置100が実現されるコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
【0093】
メモリ1010は、ROM(Read Only Memory)1011およびRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
【0094】
ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、情報処理装置100の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、情報処理装置100における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
【0095】
また、前述した実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020は、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、前述した実施形態の処理を実行する。
【0096】
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093およびプログラムデータ1094は、ネットワーク(LAN、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093およびプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
【0097】
〔9.その他〕
以上、本実施形態について説明したが、本実施形態は、開示の一部をなす記述および図面により限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例および運用技術等は全て本実施形態の範疇に含まれる。
【符号の説明】
【0098】
1 情報処理装置
10 操作対象
10a 操作対象
10b 操作対象
20 学習モデル
30 ガイダンス画面
100 情報処理装置
110 通信部
120 記憶部
121 履歴データ記憶部
122 モデル記憶部
123 推奨値記憶部
130 制御部
131 取得部
132 学習部
133 更新部
134 推論部
135 算出部
136 判定部
137 出力部
138 表示部
139 自動運転制御部
U ユーザ
Da 履歴データ
Db 運転データ
RD 推奨値
SA 画面
SB 画面
SC1 表示
SC2 表示
SC3 表示
SC4 表示
SC5 表示
1000 コンピュータ
1010 メモリ
1011 ROM
1012 RAM
1020 CPU
1030 ハードディスクドライブインタフェース
1040 ディスクドライブインタフェース
1050 シリアルポートインタフェース
1060 ビデオアダプタ
1070 ネットワークインタフェース
1080 バス
1090 ハードディスクドライブ
1091 OS
1092 アプリケーションプログラム
1093 プログラムモジュール
1094 プログラムデータ
1100 ディスクドライブ
1110 マウス
1120 キーボード
【手続補正書】
【提出日】2023-12-04
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
学習モデルに基づき推論される推奨値である操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出する算出部と、
前記誤差が所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、該誤差が所定の回数を超えて所定の値を連続して下回る場合に、前記操作対象の自動運転の稼働についての判定として自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をする判定部と、
前記判定部の判定結果に基づき、前記操作対象の自動運転に関する情報を出力する出力部と、
を有することを特徴とする情報処理装置。
【請求項2】
学習モデルに基づき推論される推奨値である操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出する算出部と、
前記誤差が所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、所定の期間における該誤差の平均値が所定の値を下回る場合に、前記操作対象の自動運転の稼働についての判定として自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をする判定部と、
前記判定部の判定結果に基づき、前記操作対象の自動運転に関する情報を出力する出力部と、
を有することを特徴とする情報処理装置。
【請求項3】
前記出力部は、前記操作対象の自動運転に関する情報として、前記判定部の判定に基づいて前記自動運転の開始に関する情報を出力する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記出力部は、前記操作対象の自動運転に関する情報として、前記判定部の判定に基づいて前記自動運転の開始の指示に関する情報を出力する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
情報処理装置により実行される情報処理方法であって、
学習モデルに基づき推論される推奨値である操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出する工程と、
前記誤差が所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、該誤差が所定の回数を超えて所定の値を連続して下回る場合に、前記操作対象の自動運転の稼働についての判定として自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をする工程と、
判定工程の判定結果に基づき、前記操作対象の自動運転に関する情報を出力する工程と、
を含むことを特徴とする情報処理方法。
【請求項6】
学習モデルに基づき推論される推奨値である操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出するステップと、
前記誤差が所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、該誤差が所定の回数を超えて所定の値を連続して下回る場合に、前記操作対象の自動運転の稼働についての判定として自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をするステップと、
判定ステップの判定結果に基づき、前記操作対象の自動運転に関する情報を出力するステップと、
をコンピュータに実行させることを特徴とする情報処理プログラム。
【請求項7】
情報処理装置により実行される情報処理方法であって、
学習モデルに基づき推論される推奨値である操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出する工程と、
前記誤差が所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、所定の期間における該誤差の平均値が所定の値を下回る場合に、前記操作対象の自動運転の稼働についての判定として自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をする工程と、
判定工程の判定結果に基づき、前記操作対象の自動運転に関する情報を出力する工程と、
を含むことを特徴とする情報処理方法。
【請求項8】
学習モデルに基づき推論される推奨値である操作対象の自動運転に関する推奨値と、目的変数の間の誤差を算出するステップと、
前記誤差が所定の条件として、前記操作対象の運転に関する履歴データを用いた学習モデルに基づき推論される前記推奨値と、前記操作対象の運転に関する実測値である前記目的変数の間の誤差について、所定の期間における該誤差の平均値が所定の値を下回る場合に、前記操作対象の自動運転の稼働についての判定として自動運転を停止した前記操作対象について自動運転の開始が可能であると判定をするステップと、
判定ステップの判定結果に基づき、前記操作対象の自動運転に関する情報を出力するステップと、
をコンピュータに実行させることを特徴とする情報処理プログラム。