IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ JFEエンジニアリング株式会社の特許一覧

特許7484653情報処理装置、情報処理方法、運転管理装置、および運転管理方法
<>
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図1
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図2
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図3
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図4
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図5
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図6
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図7
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図8
  • 特許-情報処理装置、情報処理方法、運転管理装置、および運転管理方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-08
(45)【発行日】2024-05-16
(54)【発明の名称】情報処理装置、情報処理方法、運転管理装置、および運転管理方法
(51)【国際特許分類】
   G06N 3/02 20060101AFI20240509BHJP
【FI】
G06N3/02
【請求項の数】 12
(21)【出願番号】P 2020175752
(22)【出願日】2020-10-20
(65)【公開番号】P2022067185
(43)【公開日】2022-05-06
【審査請求日】2023-02-27
(73)【特許権者】
【識別番号】000004123
【氏名又は名称】JFEエンジニアリング株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】長田 翔
【審査官】坂庭 剛史
(56)【参考文献】
【文献】米国特許出願公開第2019/0156183(US,A1)
【文献】中国特許出願公開第111242319(CN,A)
【文献】特開平04-328669(JP,A)
【文献】米国特許出願公開第2020/0285896(US,A1)
【文献】特開平06-336982(JP,A)
【文献】特開2019-113005(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/02- 3/10
G06N 20/00-99/00
F04B 23/02
F04D 15/00
(57)【特許請求の範囲】
【請求項1】
少なくとも1つの入力データを取得して、前記入力データに基づいてニューラルネットワークを用いて推論結果データを出力する制御部を備えた情報処理装置であって、
前記制御部は、
取得した前記入力データを記憶部に格納し、
前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、
前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、
前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する
情報処理装置。
【請求項2】
前記互いに異なる複数のノイズは、正規分布に基づいて選択されたノイズである
請求項1に記載の情報処理装置。
【請求項3】
前記制御部は、
前記複数のノイズ付加推論結果データのそれぞれに対してシミュレートを行って、前記複数のノイズ付加推論結果データのそれぞれに対応した複数の評価値を出力し、
前記複数の評価値に基づいて、前記複数のノイズ付加推論結果データから選択した少なくとも1つのノイズ付加推論結果データを、前記推論結果データとして出力する
請求項1または2に記載の情報処理装置。
【請求項4】
前記制御部は、
前記複数のノイズ付加推論結果データに対してアンサンブル学習を行い、
前記アンサンブル学習によって得られた出力を、前記推論結果データとして出力する
請求項1または2に記載の情報処理装置。
【請求項5】
前記入力データは、離散値を含むデータである
請求項1~4のいずれか1項に記載の情報処理装置。
【請求項6】
液体を貯留する少なくとも1槽の貯留部と、前記貯留部に前記液体を供給可能な少なくとも1台の送液部と、を備える貯留設備に対して、前記送液部を制御して前記貯留部内の液位を管理する運転制御部を備えた運転管理装置であって、
前記運転制御部は、
前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、
取得した前記液位情報を含む情報を貯留入力データとして、請求項1~5のいずれか1項に記載の情報処理装置に入力し、前記貯留入力データに対応して前記情報処理装置から出力された推論結果データを、貯留推論結果データとして取得し、
前記貯留推論結果データに基づいて、前記送液部を制御する
運転管理装置。
【請求項7】
前記貯留推論結果データは、前記送液部の発停を切り替える液位の情報を含む
請求項6に記載の運転管理装置。
【請求項8】
前記貯留入力データは、所定時間において、前記貯留部から前記液体が排出される量の時刻に沿った予測値の情報を含む
請求項6または7に記載の運転管理装置。
【請求項9】
前記送液部は、発停の切り換えが制御されるポンプから構成され、
前記貯留入力データは、所定時刻における前記ポンプの発停の情報を含む
請求項6~8のいずれか1項に記載の運転管理装置。
【請求項10】
前記送液部は、電力によって駆動するポンプから構成され、
前記貯留入力データは、所定時間における前記電力の料金単価および消費電力の情報を含む
請求項6~9のいずれか1項に記載の運転管理装置。
【請求項11】
少なくとも1つの入力データを取得して、前記入力データに基づいてニューラルネットワークを用いて推論結果データを出力する情報処理装置が実行する情報処理方法であって、
取得した前記入力データを記憶部に格納し、
前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、
前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、
前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する
情報処理方法。
【請求項12】
液体を貯留する少なくとも1槽の貯留部と、前記貯留部に前記液体を供給可能な少なくとも1台の送液部と、を備える貯留設備に対して、前記送液部を制御して前記貯留部内の液位を管理する運転管理装置が実行する運転管理方法であって、
前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、
取得した前記液位情報を含む情報を貯留入力データとして、請求項1に記載の情報処理方法に基づいて、前記貯留入力データに対応して得られた貯留推論結果データを取得し、
前記貯留推論結果データに基づいて、前記送液部を制御する
運転管理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、運転管理装置、および運転管理方法に関する。
【背景技術】
【0002】
分類、回帰、または方策関数の出力などのニューラルネットワークによる推論は、ニューラルネットワークの自由度の高さから、一定程度の過学習に起因した推論結果の不安定さが存在する。そこで、過学習の低減のために種々の正則化方法が提案されている。ところが、過学習を低減させるための正則化は、パラメータの調整が難しく、設定によっては学習時間が膨大になったり、汎化性能が得られなかったりすることがある。さらに、ニューラルネットワークは一般的に、ノイズに対して脆弱であることが知られている。ニューラルネットワークは実用上、計測誤差などの影響によって誤った推論結果が出力される可能性があった。非特許文献1,2には、学習用データの水増しや汎化性能の向上のために、学習時において、学習用ノイズを付加する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-032659号公報
【非特許文献】
【0004】
【文献】“Noisy Networks for Exploration” Meire Fortunato et al (2018)
【文献】“Creating artificial neural networks that generalize” Jocelyn Sietsma, Robert J.F.Dow (1991)
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した従来技術においては、精度の向上には限界があった。そこで、入力データをニューラルネットワークに入力させて得られる推論結果の精度をさらに向上させる技術の開発が求められていた。
【0006】
本発明は、上記に鑑みてなされたものであって、その目的は、入力データをニューラルネットワークに入力させて得られる推論結果の精度を向上させることができる情報処理装置、情報処理方法、運転管理装置、および運転管理方法を提供することにある。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明の一態様に係る情報処理装置は、少なくとも1つの入力データを取得して、前記入力データに基づいてニューラルネットワークを用いて推論結果データを出力する制御部を備えた情報処理装置であって、前記制御部は、取得した前記入力データを記憶部に格納し、前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する。
【0008】
本発明の一態様に係る情報処理装置は、上記の発明において、前記互いに異なる複数のノイズは、正規分布に基づいて選択されたノイズである。
【0009】
本発明の一態様に係る情報処理装置は、上記の発明において、前記制御部は、前記複数のノイズ付加推論結果データのそれぞれに対してシミュレートを行って、前記複数のノイズ付加推論結果データのそれぞれに対応した複数の評価値を出力し、前記複数の評価値に基づいて、前記複数のノイズ付加推論結果データから選択した少なくとも1つのノイズ付加推論結果データを、前記推論結果データとして出力する。
【0010】
本発明の一態様に係る情報処理装置は、上記の発明において、前記制御部は、前記複数のノイズ付加推論結果データに対してアンサンブル学習を行い、前記アンサンブル学習によって得られた出力を、前記推論結果データとして出力する。
【0011】
本発明の一態様に係る情報処理装置は、上記の発明において、前記入力データは、離散値を含むデータである。
【0012】
本発明の一態様に係る運転管理装置は、液体を貯留する少なくとも1槽の貯留部と、前記貯留部に前記液体を供給可能な少なくとも1台の送液部と、を備える貯留設備に対して、前記送液部を制御して前記貯留部内の液位を管理する運転制御部を備えた運転管理装置であって、前記運転制御部は、前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、取得した前記液位情報を含む情報を貯留入力データとして、上記の発明の情報処理装置に入力し、前記貯留入力データに対応して前記情報処理装置から出力された推論結果データを、貯留推論結果データとして取得し、前記貯留推論結果データに基づいて、前記送液部を制御する。
【0013】
本発明の一態様に係る運転管理装置は、上記の発明において、前記貯留推論結果データは、前記送液部の発停を切り替える液位の情報を含む。
【0014】
本発明の一態様に係る運転管理装置は、上記の発明において、前記貯留入力データは、所定時間において、前記貯留部から前記液体が排出される量の時刻に沿った予測値の情報を含む。
【0015】
本発明の一態様に係る運転管理装置は、上記の発明において、前記送液部は、発停の切り換えが制御されるポンプから構成され、前記貯留入力データは、所定時刻における前記ポンプの発停の情報を含む。
【0016】
本発明の一態様に係る運転管理装置は、上記の発明において、前記送液部は、電力によって駆動するポンプから構成され、前記貯留入力データは、所定時間における前記電力の料金単価および消費電力の情報を含む。
【0017】
本発明の一態様に係る情報処理方法は、少なくとも1つの入力データを取得して、前記入力データに基づいてニューラルネットワークを用いて推論結果データを出力する情報処理装置が実行する情報処理方法であって、取得した前記入力データを記憶部に格納し、前記記憶部から読み出した1つの前記入力データに対して、互いに異なる複数のノイズを付加した、複数のノイズ付加データを生成し、前記複数のノイズ付加データを前記ニューラルネットワークに入力して、前記複数のノイズ付加データに対応した複数のノイズ付加推論結果データを出力し、前記複数のノイズ付加推論結果データに基づいて、前記推論結果データを出力する。
【0018】
本発明の一態様に係る運転管理方法は、液体を貯留する少なくとも1槽の貯留部と、前記貯留部に前記液体を供給可能な少なくとも1台の送液部と、を備える貯留設備に対して、前記送液部を制御して前記貯留部内の液位を管理する運転管理装置が実行する運転管理方法であって、前記貯留設備から前記貯留部内の液位を含む液位情報を取得し、取得した前記液位情報を含む情報を貯留入力データとして、上記の発明による情報処理方法に基づいて、前記貯留入力データに対応して得られた貯留推論結果データを取得し、前記貯留推論結果データに基づいて、前記送液部を制御する。
【発明の効果】
【0019】
本発明に係る情報処理装置、情報処理方法、運転管理装置、および運転管理方法は、入力データをニューラルネットワークに入力させて得られる推論結果の精度を向上させることが可能となる。
【図面の簡単な説明】
【0020】
図1図1は、本発明の一実施形態による情報処理装置を適用した運転管理システムの構成を示すブロック図である。
図2図2は、本発明の一実施形態による、入力データから推論結果を導出する方法を説明するための図である。
図3図3は、本発明の一実施形態による配水池系の運転管理方法を説明するためのフローチャートである。
図4図4は、本発明の一実施形態による配水池系の運転管理方法による、運転時間に沿った制御継続時間を示すグラフである。
図5図5は、従来技術による配水池系の運転管理方法による、運転時間に沿った制御継続時間を示すグラフである。
図6図6は、本発明の一実施形態による配水池系の運転管理方法による、運転時間に沿った制御スコアを示すグラフである。
図7図7は、従来技術による配水池系の運転管理方法による、運転時間に沿った制御スコアを示すグラフである。
図8図8は、本発明の一実施形態の変形例による、入力データから推論結果を導出する方法を説明するための図である。
図9図9は、従来技術によるニューラルネットワークの全体構成を模式的に示す図である。
【発明を実施するための形態】
【0021】
以下、本発明の一実施形態について図面を参照しつつ説明する。なお、以下の一実施形態の全図においては、同一または対応する部分には同一の符号を付す。また、本発明は以下に説明する一実施形態によって限定されるものではない。
【0022】
図1は、本発明の一実施形態による情報処理装置を適用した運転管理システムの構成を示すブロック図である。図1に示すように、本発明の一実施形態による運転管理システム1は、ネットワーク2を介して互いに通信可能な、学習装置10と運転管理装置20とを有する。なお、運転管理装置20が学習装置10を備えても良い。運転管理装置20は、ネットワーク2を介して配水池系30から各種情報を収集可能に構成される。
【0023】
ネットワーク2は、例えば、インターネットなどの公衆通信網であって、例えばLAN(Local Area Network)、WAN(Wide Area Network)、携帯電話などの電話通信網や公衆回線、VPN(Virtual Private Network)、および専用線などの一または複数の組み合わせからなる。ネットワーク2は、有線通信および無線通信が適宜組み合わされている。
【0024】
(配水池系)
貯留設備としての配水池系30は、複数の配水池31,32、および複数の配水ポンプ33,34を備える。複数の配水ポンプ33,34は、それぞれの配水池31,32ごとに、1台または複数台設けられる。具体的に例えば、貯留部としての配水池31、32が30箇所程度の場合、送液部としての配水ポンプ33,34は40台程度備えられる。配水池31,32からは、水を必要とする需要家35,36に水が供給される。
【0025】
本実施形態において、機械学習装置としての学習装置10は、配水池系30の推移などの環境条件、配水ポンプ33,34の発停状態や消費電力、所定時間における需要家35,36の単位時間当たりの電気料金(以下、電気料金単価)、時刻などの所定のデータを入力パラメータとし、配水池系30における複数の配水ポンプ33,34の発停を切り替える水位を出力パラメータとする強化学習を行う。
【0026】
(学習装置)
学習装置10は、通信部(図示せず)を有する複数の配水池系30から送信された種々の情報を、ネットワーク2を介して収集するデータ収集処理を実行する。学習装置10は、収集した種々の情報によって機械学習を実行可能である。学習装置10は、制御部11、記憶部12、通信部13、出力部14、および入力部15を備える。
【0027】
制御部11は、具体的に、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field-Programmable Gate Array)などのプロセッサ、およびRAM(Random Access Memory)やROM(Read Only Memory)などの主記憶部(いずれも図示せず)を備える。
【0028】
記憶部12は、物理的には、RAM等の揮発性メモリ、ROM等の不揮発性メモリ、EPROM(Erasable Programmable ROM)、ハードディスクドライブ(HDD、Hard Disk Drive)、ソリッドステートドライブ(SSD、Solid State Drive)、およびリムーバブルメディアなどから選ばれた記憶媒体から構成される。なお、リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、または、CD(Compact Disc)、DVD(Digital Versatile Disc)、またはBD(Blu-ray(登録商標) Disc)のようなディスク記録媒体である。また、外部から装着可能なメモリカードなどのコンピュータ読み取り可能な記録媒体を用いて記憶部12を構成してもよい。記憶部12には、学習装置10の動作を実行するための、オペレーティングシステム(Operating System :OS)、各種プログラム、各種テーブル、各種データベースなどが記憶可能である。各種プログラムには、本実施形態による学習モデルやニューラルネットワークも含まれる。これらの各種プログラムは、ハードディスク、フラッシュメモリ、CD-ROM、DVD-ROM、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に記録して広く流通させることも可能である。
【0029】
本実施形態において、制御部11は、記憶部12に記憶されたプログラムを主記憶部の作業領域にロードして実行し、プログラムの実行を通じて各構成部などを制御することで、所定の目的に合致した機能を実現できる。具体的に、制御部11は、プログラムの実行によって、学習部111、判定部112、行動選択部113、状態入力部114、環境部115、演算部116、シミュレータ部117の機能を実現できる。
【0030】
制御部11によるプログラムの実行によって、学習部111の機能が実行される。学習部111は、学習装置10が受信した入出力データセットをもとに機械学習を行うことができる。学習部111は、学習した結果を学習モデル121として記憶部12に書き込んで記憶させる。学習部111は、学習を行っているニューラルネットワークとは別に、所定のタイミングで、当該タイミングにおける最新の学習モデルを、記憶部12に記憶させてもよい。記憶部12に記憶させる際には、古い学習モデル121を削除して最新の学習モデル121を記憶させる更新でもよいし、古い学習モデル121の一部または全部を保存したまま最新の学習モデル121を記憶させる蓄積でもよい。
【0031】
通信部13は、例えば、LAN(Local Area Network)インターフェースボードや、無線通信のための無線通信回路などである。LANインターフェースボードや無線通信回路は、ネットワーク2に接続される。通信部13は、ネットワーク2に接続して、運転管理装置20や配水池系30との間で通信を行う。
【0032】
出力手段としての出力部14は、制御部11による制御に従って、液晶ディスプレイやプラズマディスプレイなどのディスプレイの画面上に、文字や図形などを表示したり、スピーカから音声を出力したりして、所定の情報を外部に通知するように構成される。さらに、出力部14は、印刷用紙などに所定の情報を印刷することによって出力するプリンタを含む。記憶部12に格納された各種情報は、例えば所定の事務所などに設置された出力部14のモニタなどで確認することができる。
【0033】
入力手段としての入力部15は、例えば、キーボードや出力部14の内部に組み込まれて表示パネルのタッチ操作を検出するタッチパネル式キーボード、または外部との間の通話を可能とする音声入力デバイスなどから構成される。なお、出力部14および入力部15を一体化させて、例えばタッチパネルディスプレイやスピーカマイクロホンなどの入出力部としても良い。
【0034】
(運転管理装置)
運転管理装置20は、ネットワーク2を介して通信可能な構成を有する。運転管理装置20は、制御部21、記憶部22、通信部23、出力部24、および入力部25を備える。制御部21、記憶部22、通信部23、出力部24、および入力部25はそれぞれ、物理的および機能的には、上述した制御部11、記憶部12、通信部13、出力部14、および入力部25と同様の構成を有する。
【0035】
本実施形態において制御部21は、記憶部22に記憶されたプログラムを主記憶部の作業領域にロードして実行することによって、具体的に、運転計画部211および運転制御部212の機能を実現できる。
【0036】
記憶部22には、運転計画部211により生成された運転計画情報が検索可能な運転計画データベース221、および運転制御部212が取得した配水池系30の運転情報が検索可能な運転情報データベース222が格納されている。運転計画データベース221に格納された運転計画情報は、例えば配水ポンプ33,34の発停に関するタイミングの計画情報を含む。運転制御部212は、運転計画情報に基づいて、配水池系30における配水ポンプ33,34の発停を制御する。運転情報データベース222における運転情報は、例えば、所定時点における配水ポンプ33,34のオンオフの情報(以下、発停情報)や、配水池31,32に貯留された水の水位の情報(以下、水位情報)を含む。なお、配水池系30に関する情報は、これらの情報に限定されない。
【0037】
通信部23は、ネットワーク2に接続して、学習装置10および配水池系30との間で通信可能である。通信部23は、制御部21による制御に基づいて出力される指令信号によって、配水池31,32の液位情報としての水位情報や発停情報などの各種情報を収集する。なお、通信部23によって送受信される情報は、これらの情報に限定されない。本実施形態において運転管理装置20は、ネットワーク2を介して通信可能なクラウドサーバとして機能させることもできる。
【0038】
ここで、本発明者は、情報処理装置としての学習装置10に関して、従来技術によるニューラルネットワークを用いた情報処理方法について検討を行った。図9は、従来技術によるニューラルネットワークの全体構成を模式的に示す図である。図9に示すニューラルネットワーク300は、例えば順伝播型ニューラルネットワークであり、入力層301、中間層302、および出力層303を有する。入力層301は複数のノードからなり、各ノードには互いに異なる入力パラメータが入力される。中間層302は入力層301からの出力が入力される。中間層302は、入力層301からの入力を受ける複数のノードからなる層を含む多層の構造を有する。出力層303は、中間層302からの出力が入力され、出力パラメータを出力する。中間層302が多層構造、例えば3~5層構造を有するニューラルネットワークを用いた機械学習は、深層学習(ディープラーニング)と呼ばれる。図9に示す例では、入力パラメータが所定の入力データ310であり、出力パラメータが、目的とする推論結果データ320である。
【0039】
ニューラルネットワーク300において、教師あり学習や半教師あり学習によって所定の学習モデルを生成する際には、学習用入力パラメータおよび学習用出力パラメータの入出力データセットが用いられる。入力データ110に対して所定の推論結果データ120を出力する制御部11における学習部111は、学習用入力パラメータおよび学習用出力パラメータを教師データとして、図9に示すニューラルネットワークを用いたディープラーニングなどの機械学習によって、学習モデル121を生成できる。学習装置10の制御部11は、学習部111によって生成された学習モデルに基づいて、入力データ310から推論結果データ320を導出する。
【0040】
また、ニューラルネットワーク300を強化学習に用いた場合、状態sや行動aなどの入力データ310をニューラルネットワーク300に入力して、推論結果データ320を出力する。推論結果データ320としては、状態s、行動a、状態行動価値(Q値)などが出力される。
【0041】
本発明者は、従来のニューラルネットワーク300に対して、種々検討を行った結果、出力される推論結果の精度を向上させるためには、推論時、すなわちニューラルネットワーク300に入力する際に、入力データに互いに異なる複数のノイズを加える方法を案出した。すなわち、本発明者は、推論時の入力データにノイズを加えて、複数のパターンの入力データを生成し、生成された複数の入力データのそれぞれをニューラルネットワーク300に入力したことによって得られた複数の推論結果に基づいて、少なくとも1つの水路結果を選択または生成することによって、高精度で評価値の高い出力を得られることを想到した。以下に説明する本発明およびその一実施形態は、本発明者による以上の鋭意検討によって案出されたものである。
【0042】
図2は、本発明の一実施形態による情報処理装置としての学習装置10が実行する情報処理方法を説明するための図である。図2に示すように、一実施形態による情報処理方法においては、演算部116が、1つの入力データ310に対して、第1ノイズを付加することにより、第1ノイズ付加データ311-1を生成する。同様に、演算部116が、1つの入力データ310に対して第1ノイズとは異なる第2ノイズを付加することにより、第2ノイズ付加データ311-2を生成する。さらに、演算部116は、入力データに対して第1ノイズとも第2ノイズとも異なる第3ノイズを付加することにより、第3ノイズ付加データ311-3を生成する。これらの互いに異なるノイズの付加は、1つの入力データ310に対してn個(nは2以上の自然数)のノイズを付加するまで実行される。入力データ310に対して付加される第1ノイズから第nノイズまでのn個のノイズは、互いに相関がない、互いに異なるノイズである。これらの互いに異なる第1ノイズ~第nノイズまでの複数のノイズは、例えば正規分布、いわゆるガウス雑音に基づいて選択されるが、他の分布に基づいたノイズを選択することも可能である。これにより、同じ入力データ310に基づいて、互いに異なる第1ノイズ付加データ311-1~第nノイズ付加データ311-nが、演算部116により生成される。生成された第1ノイズ付加データ311-1~第nノイズ付加データ311-nは、記憶部12に格納される。
【0043】
学習部111は、記憶部12からニューラルネットワーク122のプログラムを読み込んでニューラルネットワーク300の処理を実行する。すなわち、学習部111は、第1ノイズ付加データ311-1~第nノイズ付加データ311-nのそれぞれを、ニューラルネットワーク300に入力する。ニューラルネットワーク300は、それぞれの第1ノイズ付加データ311-1~第nノイズ付加データ311-nに対応して、それぞれの第1推論結果データ321-1、第2推論結果データ321-2、第3推論結果データ321-3、…、第n推論結果データ321-nを出力する。出力された複数のノイズ付加推論結果データとしての、第1推論結果データ321-1~第n推論結果データ321-nは、記憶部12に格納される。
【0044】
続いて、制御部11のシミュレータ部117によって実行されるシミュレータ340は、ニューラルネットワーク300から出力された第1推論結果データ321-1~第n推論結果データ321-nのそれぞれに対して、個別にシミュレートを実行する。シミュレータ340は、第1推論結果データ321-1に基づいてシミュレートを実行した結果として、第1評価値330-1を出力する。同様にシミュレータ部117は、第2推論結果データ321-2、第3推論結果データ321-3、…、および第n推論結果データ321-nに基づいてシミュレートを実行した結果としてそれぞれ、第2評価値330-2、第3評価値330-3、…、および第n評価値330-nを出力する。出力された第1評価値330-1~第n評価値330-nは記憶部12に格納される。
【0045】
シミュレータ部117が出力した第1評価値330-1~第n評価値330-nは、評価値を選択するセレクタ350の機能を有する制御部11の判定部112に入力される。判定部112は、セレクタ350によって、最適な評価値を選択する。制御部11の判定部112は、第1評価値330-1~第n評価値330-nから選択した評価値に対応する推論結果データを選択して、出力する。以上により、入力データ310に対する、推論結果データ320が出力される。
【0046】
以上のように、強化学習などの、いわゆる制御方法や評価値を出力するニューラルネットワーク300であって、シミュレータ部117によって事前にシミュレート可能である場合には、複数の推論結果データ(第1~第n推論結果データ)から複数の評価値(第1~第n評価値)を取得して、最適な評価値となった推論結果データを選択することにより、推論結果データの精度を向上させることができる。また、入力データに複数の異なるノイズを付加することによって、ニューラルネットワーク300に入力するデータをノイズの付加数分だけ増加させることができるので、ノイズ付加による入力の水増しにより、方策を出力する強化学習などにおいては、シミュレータと組み合わせることによって、より評価値の高い制御の方策を得ることができる。
【0047】
なお、評価値に対して所定の閾値を設定し、全ての第1評価値330-1~第n評価値330-nが所定の閾値未満であった場合に、第1評価値330-1~第n評価値330-nのうちの少なくとも1つ、または複数の評価値が所定の閾値以上になるまで、入力データ310に対してさらにノイズを付加するようにしても良い。以上説明した一実施形態による情報処理方法は、ニューラルネットワークを用いて情報処理を実行可能なあらゆる処理に適用可能である。
【0048】
(配水池系の運転管理方法)
次に、以上の一実施形態による情報処理方法に基づいた、配水池の運転管理方法について説明する。
【0049】
まず、一実施形態による運転管理方法の理解を容易にするために、配水池系の運転管理方法における従来技術の問題点について説明する。すなわち、従来、浄水場、配水池31,32と、需要家35,36との間で液体である水道水などを輸送するための配水ポンプ33,34は、オンオフ制御しかできない場合が多い。この場合、配水ポンプ33,34に使用する電力量や、配水ポンプ33,34の発停回数を低減するための運転計画を生成することが困難であった。これは、連続値の解を許容する線形計画問題であれば、最適値を現実的な時間で計算できるのに対し、離散値(整数)の解のみを許容する整数計画問題や、離散値と連続値とが混在する混合整数計画問題では、膨大なパターンを計算する必要があるため、現実的な処理時間で演算が終了しないためである。換言すると、連続値ではなく一部または全ての変数の解として離散値のみ許容する最適化問題は、膨大なパターンを試行することによって最適解を導出する必要があるため、一般的には最適解にたどり着くことが困難であり、代替として最適解に近い解を許容される時間内で導出している。
【0050】
しかしながら、本発明者の知見によれば、離散値のみを許容する問題においては、膨大な場合分けが必要になり、対象ごとに特殊な事情が存在する場合には、対象ごとに場合分けをする枝刈り探索法を変更するのはかなり煩雑な作業となる。そのため、配水池系などにおいて、繁雑な処理を低減でき、最適な運転管理を行う技術が求められていた。
【0051】
そこで、本発明者は、運転計画の生成において、機械学習における例えばDQN(Deep Q-Network)などの強化学習を採用する方法について検討を行った。すなわち、操作そのものの評価ではなく、操作の結果の評価を用いた制御方法として、機械学習における強化学習を採用することを想到した。これにより、膨大な場合分けが不要になり、シミュレータを作成する際に、対象ごとの特殊事情を考慮すれば、制御に反映させることが可能になる。
【0052】
さらに本発明者は、強化学習における報酬として、配水池31,32における制約条件である、水位の上限および下限、すなわち水位の許容範囲からの逸脱具合である、水位の許容範囲の上限または下限からの乖離の大きさに応じた報酬を想到した。具体的には、水位が、許容範囲から逸脱した乖離の大きさが大きくなるほど、報酬を小さくし、さらには報酬として負の絶対値が大きくなるようにした。これにより、配水池31,32の水位が、許容範囲内に収まれば報酬を大きくして、学習を進みやすくできる。これは、上述した制御方法において、制約条件から逸脱した時に一律の罰則を与えて、強化学習における学習の繰り返しの単位であるエピソードを停止した場合、逸脱した度合いが大きい場合も小さい場合も同じ罰則を与えることになる。そのため、制御方法を更新する際に制御方法をいずれの方向に更新すればよいかが明確にならない。そこで、制約条件からの逸脱の程度に応じて、例えば単調増加な関数を用いた罰則を与えることによって、制約条件から逸脱した場合に、逸脱した度合いが小さい方の報酬が逸脱した度合いが大きい方の報酬よりも大きくなるような勾配を生成できるため、勾配に従って強化学習を行うことによって、制約条件を満たす方策を学習できることになる。
【0053】
また、配水ポンプ33,34の発停ではなく、配水ポンプ33,34をオンまたはオフにするための水位の閾値を最適化することによって、離散値の最適化の問題から、連続値の最適化の問題に変更することで、現実的な処理時間で演算を終了可能とした。すなわち、単純に、設定時刻において配水ポンプ33,34の発停を計画する場合、配水ポンプ33,34のオンとオフとの2通りに対して、時間の刻み数と、配水ポンプ33,34の数との累乗で算出される数の操作から、いずれの操作を選ぶかが選択される。しかしながら、所定の発停状態にある配水ポンプ33,34に対して、次に配水ポンプ33,34の発停操作を行う配水池31,32の水位(以下、発停水位)を決定するように制御する。これにより、オンオフの離散値の最適化問題を、配水池31,32の水位の連続値の最適化問題に変更できる。そのため、ニューラルネットワーク300による推論ごとに水位を決定すれば良いことになるので、従来に比して短時間で最適解に近い解を導出できる。さらに、配水池31,32のそれぞれにおける水位を所定の許容範囲内に設定していることにより、制約条件からの逸脱を低減できる。さらに、連続値から所定の制御を選択する場合、離散値から所定の制御を選択する場合に比して、推論ごとのばらつきが少なくなるため、安定した運転計画をたてることができる。
【0054】
以下に説明する本実施形態による配水池の運転管理方法は、本発明者による以上の鋭意検討によって案出されたものである。図3は、本実施形態による配水池の運転管理方法を説明するためのフローチャートである。なお、運転管理装置20は、ネットワーク2を通じて、常時または適時、配水池31,32から水位情報を取得しているとともに、配水ポンプ33,34から発停情報を取得し、取得した水位情報および発停情報を記憶部22に格納している。また、学習装置10と運転管理装置20と配水池系30との間における情報の送受信、供給、または取得は、ネットワーク2を介して行われるが、都度の説明は省略する。
【0055】
図3に示すように、ステップST1において学習装置10の制御部11における状態入力部114は、配水池系30に関する情報を貯留入力データとして取得する。入力データの一例としての貯留入力データは、例えば配水ポンプ33,34のオンオフなどの離散値を含む。具体的に、状態入力部114は、運転管理装置20から、水位情報および発停情報を取得する。状態入力部114は、運転管理装置20の制御部21における運転計画部211によって、運転計画データベース221から、所定時間、例えば48時間におけるそれぞれの需要家35,36が使用する水道水の量の予測値の情報(以下、需要予測情報)を取得する。需要予測情報は、換言すると、時刻に沿った、配水池31,32から排出される水道水の排出量の予測値である。状態入力部114は、適時、所定の電力供給事業者などの事業者サーバから、具体的に配水ポンプ33,34に電力を供給している電力供給事業者の事業者サーバ(図示せず)から、所定時刻における電力料金単価の情報(以下、料金情報)を取得する。状態入力部114は、常時または適時、所定の時刻サーバ(図示せず)から現在時刻の情報(以下、時刻)を取得する。なお、状態入力部114は、水位情報、発停情報、需要予測情報、料金情報、および時刻のうちの、全ての情報を取得しても、水位情報を含む一部の情報のみを取得しても良い。さらに、その他の情報を取得することも可能である。
【0056】
次に、ステップST2に移行して制御部11の演算部116は、取得したデータに対して、複数の互いに異なるノイズを付加する。具体的には、図2に示すように、演算部116は、例えば取得した複数の配水池31,32における複数の水位情報のうちの、少なくとも1つの水位情報に対して、互いに異なる複数のノイズを付加する。本実施形態においては、これらのノイズは、正規分布、いわゆるガウス雑音に基づいて選択されるが、例えば一様分布などの他の分布に基づいたノイズ、他の分布に基づいて選択することも可能である。水位情報に対して互いに異なる複数のノイズを付加することにより、1つの水位情報に対して複数のノイズ付加データが、ノイズ付加水位情報として生成される。同様に、取得した複数の配水ポンプ33,34における複数の発停情報のうちの、少なくとも1つの発停情報に対して、互いに異なる複数のノイズを付加する。これにより、1つの発停情報に対して複数のノイズ付加データが、ノイズ付加発停情報として生成される。さらに、需要予測情報に対しても同様に、少なくとも1つの需要予測情報に対して、複数のノイズ付加需要予測情報が生成される。なお、演算部116による情報に対するノイズの付加は、水位情報、発停情報、および需要予測情報の全ての情報に対して行っても良く、これらの情報から選択した情報に対してのみ行っても良い。また、演算部116は、必要に応じて、料金情報や時刻に対しても、複数の互いに異なるノイズを付加して、複数のノイズ付加料金情報や、複数のノイズ付加時刻を生成しても良い。すなわち、状態入力部114が取得した種々の情報のうちの、少なくとも1つの情報に対してノイズを付加すれば良い。
【0057】
次に、図3のステップST3に移行して、学習装置10の制御部11における学習部111は、記憶部12からニューラルネットワーク122を読み出し、複数のノイズ付加データをニューラルネットワーク122に入力する。なお、学習部111は、強化学習による機械学習によって生成された学習モデル121を読み出して、複数のノイズ付加データを学習モデル121に入力しても良い。学習モデル121またはニューラルネットワーク122によって、制御部11の学習部111は、入力した複数のノイズ付加データにそれぞれ対応した、複数の推論結果データ321を出力する(図2参照)。
【0058】
その後、ステップST4に移行して、複数の推論結果データ321がシミュレータ部117によって実行されるシミュレータ340(図2参照)に入力される。シミュレータ340は、複数の推論結果データ321に対応した複数の評価値330を出力する。複数の評価値330は、制御部11の判定部112によって実行されるセレクタ350に入力される。セレクタ350は、複数の評価値330から、例えば、最も評価値が高い評価値330、または所定の評価値に最も近い評価値330などの所定条件に基づいて、少なくとも1つの評価値330を選択する。なお、複数の評価値330が所定条件を満たしていない場合には、ステップST2に復帰してノイズの付加を改めて行っても良い。続いて、制御部11の行動選択部113は、複数の推論結果データ321から、セレクタ350が選択した評価値に対応した少なくとも1つの推論結果データ321を最終の推論結果データ320として選択する。ここで、最終の推論結果データ320は、それぞれの配水ポンプ33,34の発停の切り換えを行うタイミングであったり、発停の切り換えを行う配水池31,32の水位であったり、それぞれの配水ポンプ33,34の発停のパターンであったりする。
【0059】
続いて、ステップST5に移行して学習装置10の通信部13は、制御部11によって導出された最終の推論結果データ320を、貯留推論結果データとして運転管理装置20に送信する。運転管理装置20の運転制御部212は、取得した貯留推論結果データ(最終の推論結果データ320)に基づいて、配水池系30の配水ポンプ33,34の運転、すなわち発停を制御する。配水池系30における配水ポンプ33,34の発停によって得られるそれぞれの配水池31,32の水位は、水位情報として常時または適時、運転管理装置20に送信される。同様に、配水ポンプ33,34の動作のオンオフも、発停情報として常時または適時、運転管理装置20に送信される。運転管理装置20が取得したそれぞれの配水池31,32の水位情報や、それぞれの配水ポンプ33,34の発停情報は、運転管理装置20の記憶部22における運転情報データベース222に格納される。
【0060】
次に、ステップST6に移行して、運転制御部212は、取得したそれぞれの配水池31,32における水位情報に基づいて、それぞれの配水池31,32の水位が許容範囲内であるか否かを判定する。なお、それぞれの配水池31,32の水位の許容範囲は、配水池31,32ごとにそれぞれ設定されている。運転制御部212は、配水ポンプ33,34の発停に応じたそれぞれの配水池31,32における水位が、許容範囲から逸脱したか否かを配水池31,32ごとに確認する。また、運転制御部212は、許容範囲から逸脱した場合には、許容範囲からどの程度逸脱したか、すなわち、それぞれの配水池31,32の水位が、許容範囲の上限よりどの程度高いか、許容範囲の下限よりどの程度低いかを、逸脱レベルとして導出する。同様に、運転制御部212は、配水ポンプ33,34の発停回数や使用電力料金が、許容範囲からどの程度逸脱したかに応じて、逸脱レベルを導出する。運転制御部212によって導出された逸脱レベルは、運転管理装置20から、学習装置10に送信される。
【0061】
学習装置10の環境部115は、取得した逸脱レベルに基づいて、強化学習の報酬に関する罰則を導出する。具体的に環境部115は、取得した逸脱レベルが大きいほど、線形的に減点が大きくなるように、換言すると報酬が少なくなるように、報酬を設定する。また、環境部115は、配水池31,32の制約条件である水位の許容範囲を維持しつつ、運転を所定時間、例えば1時間継続できた場合に、正の報酬を設定する。さらに、環境部115は、配水池系30の配水ポンプ33,34の発停回数や使用電力料金に応じて、逸脱レベルが大きくなるに従って罰則が大きくなるように、報酬を設定する。
【0062】
次に、ステップST7に移行して、学習部111は、環境部115が設定した報酬を取得して、強化学習における報酬とする。これにより、学習部111の強化学習における機械学習が進み、配水池系30の運転制御に関して、より適切な推論結果、すなわち配水ポンプ33,34の発停のパターンを最適化させることができる。
【0063】
図4は、上述した入力データにノイズを付加した一実施形態による配水池系の運転管理方法による、運転時間に沿った制御継続時間を示すグラフである。図5は、比較例としての入力データにノイズを付加することなく、強化学習を用いた従来技術による配水池系の運転管理方法による、運転時間に沿った制御継続時間を示すグラフである。なお、制御継続時間とは、配水池31,32の水位を、水位の許容範囲内に維持した状態で運転を継続できた時間であり、図4および図5に示す例では、運転継続時間の上限を24時間(1日)とした。
【0064】
図4から、一実施形態による運転管理方法においては、配水池31,32の水位を所定の水位の許容範囲内に維持した状態で、1900時間程度まで配水池系30の運転を継続することができたことが分かる。図4に示す例では、約1900時間の運転において、配水池31,32の制約条件、すなわち水位の許容範囲を維持した運転ができたことが確認された。これに対し、図5から、従来技術による運転管理方法においては、配水池31,32の水位が、所定の水位の許容範囲から逸脱していることが分かる。図5に示す例では、約1900時間の運転において、110時間程度、水位の許容範囲を逸脱して、配水池31,32の制約条件を逸脱した運転になったことが確認された。
【0065】
すなわち、従来技術においては、安定して運転できたのは、((1900-110)/1900=)94.2%程度である。このように、強化学習によって生成された学習モデルや、教師あり学習または半教師あり学習などによって生成された学習モデルを、より精度良く構築したとしても、安定した運転を100%継続することは極めて困難であるのに対し、入力データにノイズを付加する本実施形態による運転管理方法によれば、配水池系30の運転を安定して行うことができる。なお、入力データにノイズを付加することによって、出力される推論結果の精度を向上させる対象としては、配水池系30などに限定されず、貯留ピットおよび焼却炉などを備えた廃棄物処理施設や、橋梁などの建築構造物など、種々の対象に適用可能である。
【0066】
図6は、一実施形態による配水池系の運転管理方法による、運転時間に沿った制御スコアを示すグラフである。なお、一実施形態による運転管理方法においては、セレクタ350によって例えば20未満の評価値の推論結果を排除している。図7は、比較例としての従来技術による配水池系の運転管理方法による、運転時間に沿った制御スコアを示すグラフである。なお、図6および図7に示す制御スコアは、上述した制約条件である水位の許容範囲内での運転を継続できたか否かの運転継続性、使用電力料金、配水ポンプ33,34の発停回数に基づいて算出される。例えば、運転継続性は、水位の許容範囲内での運転を1時間継続した場合に1点とし、継続できなかった場合には水位の許容範囲から逸脱した大きさ応じた点数を減点した。また、発停回数が所定回数を超えたり、使用電力料金が所定の料金を超えたりした場合には、超えた回数や金額に応じた点数を減点した。なお、減点は、水位の許容範囲から逸脱した大きさに応じて、線形的な点数が好ましいが、指数的な点数や、対数的な点数や、多項式的な点数としても良い。また、制御スコアは、報酬または評価値とも言われる。
【0067】
図6から、一実施形態による配水池系30の運転管理方法においては、制御スコアを20点以上23点以下の範囲に収めることが可能であることが分かる。これに対し、図7から、従来技術による配水池系30の管理方法においては、制御スコアが20未満、さらには-10程度まで低下することが分かる。すなわち、上述した一実施形態による運転管理方法によれば、従来に比して配水池系30の運転のさらなる最適化を実現可能であることが分かる。
【0068】
(変形例)
次に、上述した一実施形態による情報処理方法の変形例について説明する。図8は、一実施形態の変形例による、入力データから推論結果を導出する方法を説明するための図である。図8に示すように、変形例による運転管理方法においては、上述した一実施形態と異なり、ニューラルネットワークが第1推論結果データ321-1~第n推論結果データ321-nを出力した後、これらの第1推論結果データ321-1~第n推論結果データ321-nは、アンサンブル360に入力される。アンサンブル360は、例えばバギング、ブースティング、またはスタッキングなどのアルゴリズムに基づいて学習部111により実行され、複数の推論結果データ321を組み合わせて多数決的に推論を行う。分類や回帰など推定問題においては、複数の出力を用いたアンサンブル学習によって精度を向上させることができる。一実施形態の変形例の場合、ノイズを付加した複数のノイズ付加入力データ311-1~311-nから、それらのデータに対応した複数の推論結果データ321-1~321-nを取得し、アンサンブル学習によってより精度の高い推論結果を得る最終の推論結果データ320として得ることができる。その他の情報処理方法については、一実施形態と同様である。なお、アンサンブル学習以外の学習型の対象物認識アルゴリズムを用いることも可能である。
【0069】
以上説明した一実施形態によれば、入力データに互いに異なる複数のノイズを付加して複数のノイズ付加データを生成し、複数のノイズ付加データをニューラルネットワークに入力して、複数のノイズ付加データのそれぞれに対応した複数の推論結果データを取得し、取得した複数の推論結果データに基づいて、最終の推論結果データを出力していることにより、入力データをニューラルネットワークに入力させて得られる推論結果データの精度をさらに向上させることが可能となる。
【0070】
(記録媒体)
上述の一実施形態において、学習装置10や運転管理装置20が実行する処理方法を実行させるプログラムを、コンピュータその他の機械やウェアラブルデバイスなどの装置(以下、コンピュータなど、という)が読み取り可能な記録媒体に記録することができる。コンピュータなどに、この記録媒体のプログラムを読み込ませて実行させることにより、当該コンピュータなどが移動体制御装置として機能する。ここで、コンピュータなどが読み取り可能な記録媒体とは、データやプログラムなどの情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータなどから読み取ることができる非一時的な記録媒体をいう。このような記録媒体のうちのコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、BD、DAT、磁気テープ、フラッシュメモリなどのメモリカードなどがある。また、コンピュータなどに固定された記録媒体としてハードディスク、ROMなどがある。さらに、SSDは、コンピュータなどから取り外し可能な記録媒体としても、コンピュータなどに固定された記録媒体としても利用可能である。
【0071】
また、一実施形態による学習装置10、および運転管理装置20に実行させるプログラムは、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。
【0072】
(その他の実施形態)
一実施形態においては、上述した「部」を、「回路」などに読み替えることができる。例えば、制御部は、制御回路に読み替えることができる。
【0073】
なお、本明細書におけるフローチャートの説明では、「まず」、「次に」、「その後」、「続いて」などの表現を用いてステップ間の処理の前後関係を明示していたが、本実施の形態を実施するために必要な処理の順序は、それらの表現によって一意的に定められるわけではない。すなわち、本明細書で記載したフローチャートにおける処理の順序は、矛盾のない範囲で変更することができる。
【0074】
さらなる効果や変形例は、当業者によって容易に導き出すことができる。本開示のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付のクレームおよびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
【符号の説明】
【0075】
1 運転管理システム
2 ネットワーク
10 学習装置
11,21 制御部
12,22 記憶部
13,23 通信部
14,24 出力部
15,25 入力部
20 運転管理装置
30 配水池系
31,32 配水池
33,34 配水ポンプ
35,36 需要家
111 学習部
112 判定部
113 行動選択部
114 状態入力部
115 環境部
116 演算部
117 シミュレータ部
121 学習モデル
122,300 ニューラルネットワーク
211 運転計画部
212 運転制御部
221 運転計画データベース
222 運転情報データベース
301 入力層
302 中間層
303 出力層
310 入力データ
311-1 第1ノイズ付加データ
311-2 第2ノイズ付加データ
311-3 第3ノイズ付加データ
311-n 第nノイズ付加データ
320,321 推論結果データ
321-1 第1推論結果データ
321-2 第2推論結果データ
321-3 第3推論結果データ
321-n 第n推論結果データ
330 評価値
330-1 第1評価値
330-2 第2評価値
330-3 第3評価値
330-n 第n評価値
340 シミュレータ
350 セレクタ
360 アンサンブル
図1
図2
図3
図4
図5
図6
図7
図8
図9