IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱重工業株式会社の特許一覧

特許7478297情報処理システム、情報処理方法、学習システム、および学習方法
<>
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図1
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図2
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図3
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図4
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図5
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図6
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図7
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図8
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図9
  • 特許-情報処理システム、情報処理方法、学習システム、および学習方法 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-04-23
(45)【発行日】2024-05-02
(54)【発明の名称】情報処理システム、情報処理方法、学習システム、および学習方法
(51)【国際特許分類】
   F23G 5/50 20060101AFI20240424BHJP
【FI】
F23G5/50 G
F23G5/50 L
F23G5/50 N
F23G5/50 Q
F23G5/50 R
【請求項の数】 10
(21)【出願番号】P 2023146237
(22)【出願日】2023-09-08
【審査請求日】2023-10-24
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006208
【氏名又は名称】三菱重工業株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(74)【代理人】
【識別番号】100161702
【弁理士】
【氏名又は名称】橋本 宏之
(74)【代理人】
【識別番号】100189348
【弁理士】
【氏名又は名称】古都 智
(74)【代理人】
【識別番号】100196689
【弁理士】
【氏名又は名称】鎌田 康一郎
(72)【発明者】
【氏名】池田 孝
(72)【発明者】
【氏名】佐々木 俊也
(72)【発明者】
【氏名】小柴 勇紀
(72)【発明者】
【氏名】馬場 由羽貴
(72)【発明者】
【氏名】瀬戸口 稔彦
【審査官】古川 峻弘
(56)【参考文献】
【文献】特開2007-272646(JP,A)
【文献】特開2021-008991(JP,A)
【文献】特開2023-040645(JP,A)
【文献】特開2019-197315(JP,A)
【文献】特開2023-023455(JP,A)
【文献】国際公開第2019/159883(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
F23G 5/00-5/50
F22B 1/00-37/78
G05B 1/00-99/00
(57)【特許請求の範囲】
【請求項1】
燃焼設備用の情報処理システムであって、
前記燃焼設備の状態量に関する情報である状態量情報を取得する取得部と、
前記状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習が行われた学習モデルを用いて、前記取得部により取得された前記状態量情報を入力し、入力した前記状態量情報に応じた前記供給装置の操作内容を導出する操作内容導出部と、
を備え
前記状態量は、低位発熱量、排出物質の濃度、前記被焼却物の供給量、または蒸気量のうち2つ以上であり、
前記状態量情報は、前記燃焼設備の状態量に関する値を、所定の時間長さにおいて統計処理することで得られる代表値であり、
前記所定の時間長さは、前記供給装置により前記被焼却物の供給が行われる時点と、当該供給に応じて前記状態量に変動が生じる時点との時間差を含む時間長さであり、前記供給装置の操作量の変動と前記状態量の変動の相関値が最大となる時間ずれとして計算される、
情報処理システム。
【請求項2】
前記供給装置の操作内容は、前記供給装置の第1操作要素の操作量と、前記第1操作要素とは異なる前記供給装置の第2操作要素の操作量と、前記供給装置の停止時間とのうち2つ以上の組み合わせにより規定される内容である、
請求項1に記載の情報処理システム。
【請求項3】
前記供給装置は、往復式または回転式のフィーダであり、
前記供給装置の操作内容は、前記フィーダのストロークと、前記フィーダの速度と、前記フィーダの停止時間とのうち2つ以上の組み合わせにより規定される内容である、
請求項1または請求項2に記載の情報処理システム。
【請求項4】
前記報酬は、前記状態量情報に含まれる少なくとも1つの指標の検出値と、前記指標の目標値との差分の大きさに基づいて導出される、
請求項1または請求項2に記載の情報処理システム。
【請求項5】
前記取得部により取得された前記状態量情報と、前記供給装置の操作内容と、前記報酬との対応関係に基づいて前記学習モデルの強化学習を行う学習部をさらに備えた、
請求項1または請求項2に記載の情報処理システム。
【請求項6】
前記学習モデルは、前記状態量情報と、運転員の操作履歴から得られた前記供給装置の操作内容との対応関係に少なくとも基づく事前学習により生成された初期モデルを基礎として、前記取得部により取得された前記状態量情報と、前供給装置の操作内容と、前記報酬との対応関係に基づく強化学習が行われて得られる、
請求項1または請求項2に記載の情報処理システム。
【請求項7】
前記学習モデルは、別の設備における前記状態量情報と、前記別の設備における前記供給装置の操作内容との対応関係に少なくとも基づく事前学習により生成された初期モデルを基礎として、前記取得部により取得された前記状態量情報と、前供給装置の操作内容と、前記報酬との対応関係に基づく強化学習が行われて得られる、
請求項1または請求項2に記載の情報処理システム。
【請求項8】
燃焼設備に関連した情報処理方法であって、
前記燃焼設備の状態量に関する情報である状態量情報を取得し、
前記状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習が行われた学習モデルを用いて、前記状態量情報を入力し、入力した前記状態量情報に応じた前記供給装置の操作内容を導出する、
ことを含み、
前記状態量は、低位発熱量、排出物質の濃度、前記被焼却物の供給量、または蒸気量のうち2つ以上であり、
前記状態量情報は、前記燃焼設備の状態量に関する値を、所定の時間長さにおいて統計処理することで得られる代表値であり、
前記所定の時間長さは、前記供給装置により前記被焼却物の供給が行われる時点と、当該供給に応じて前記状態量に変動が生じる時点との時間差を含む時間長さであり、前記供給装置の操作量の変動と前記状態量の変動の相関値が最大となる時間ずれとして計算される、
情報処理方法。
【請求項9】
燃焼設備用の学習システムであって、
前記燃焼設備の状態量に関する情報である状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習モデルの強化学習を行う学習部
を備え
前記状態量は、低位発熱量、排出物質の濃度、前記被焼却物の供給量、または蒸気量のうち2つ以上であり、
前記状態量情報は、前記燃焼設備の状態量に関する値を、所定の時間長さにおいて統計処理することで得られる代表値であり、
前記所定の時間長さは、前記供給装置により前記被焼却物の供給が行われる時点と、当該供給に応じて前記状態量に変動が生じる時点との時間差を含む時間長さであり、前記供給装置の操作量の変動と前記状態量の変動の相関値が最大となる時間ずれとして計算される、
学習システム。
【請求項10】
燃焼設備用の学習方法であって、
前記燃焼設備の状態量に関する情報である状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習モデルの強化学習を行う、
ことを含み、
前記状態量は、低位発熱量、排出物質の濃度、前記被焼却物の供給量、または蒸気量のうち2つ以上であり、
前記状態量情報は、前記燃焼設備の状態量に関する値を、所定の時間長さにおいて統計処理することで得られる代表値であり、
前記所定の時間長さは、前記供給装置により前記被焼却物の供給が行われる時点と、当該供給に応じて前記状態量に変動が生じる時点との時間差を含む時間長さであり、前記供給装置の操作量の変動と前記状態量の変動の相関値が最大となる時間ずれとして計算される、
学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理システム、情報処理方法、学習システム、および学習方法に関する。
【背景技術】
【0002】
特許文献1には、燃焼設備における複数の燃焼プロセス測定値および複数の制御値のうちの少なくとも1つを含むプロセスデータを取得し、燃焼設備に設けられて燃焼設備内を撮像する撮像部が撮像した熱画像情報に基づいた画像データを取得または生成し、上記プロセスデータおよび上記画像データに基づいて所定の予測時間後の蒸気発生量を予測し、予測した蒸気発生量予測値に基づいて廃棄物焼却炉を制御する情報処理装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2021-188813号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の情報処理装置では、蒸気発生量予測値を得ることまではできるが、蒸気発生量予測値と、その蒸気発生量予測値に応じて行うべき燃焼設備の操作内容との対応関係を求めることが難しい場合があった。
【0005】
本開示は、上記課題を解決するためになされたものであって、燃焼設備に関連した適切な操作内容を導出することができる情報処理システム、情報処理方法、学習システム、および学習方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本開示に係る情報処理システムは、燃焼設備用の情報処理システムであって、前記燃焼設備の状態量に関する情報である状態量情報を取得する取得部と、前記状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習が行われた学習モデルを用いて、前記取得部により取得された前記状態量情報を入力し、入力した前記状態量情報に応じた前記供給装置の操作内容を導出する操作内容導出部と、を備える。
【0007】
本開示に係る情報処理方法は、燃焼設備に関連した情報処理方法であって、前記燃焼設備の状態量に関する情報である状態量情報を取得し、前記状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習が行われた学習モデルを用いて、前記状態量情報を入力し、入力した前記状態量情報に応じた前記供給装置の操作内容を導出する、ことを含む。
【0008】
本開示に係る学習システムは、燃焼設備用の学習システムであって、前記燃焼設備の状態量に関する情報である状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習モデルの強化学習を行う学習部を備える。
【0009】
本開示に係る学習方法は、燃焼設備用の学習方法であって、前記燃焼設備の状態量に関する情報である状態量情報と、前記燃焼設備に被焼却物を供給する供給装置の操作内容と、前記燃焼設備の状態に応じた報酬との対応関係に基づいて学習モデルの強化学習を行う、ことを含む。
【発明の効果】
【0010】
本開示の情報処理システム、情報処理方法、学習システム、および学習方法によれば、燃焼設備に関連した適切な操作内容を導出することができる。
【図面の簡単な説明】
【0011】
図1】本開示の実施形態に係る燃焼設備の全体を示す概略構成図である。
図2】本開示の実施形態に係る燃焼設備の機能構成を示すブロック図Iである。
図3】本開示の実施形態に係る強化学習におけるニューラルネットワークの構成変化を模式的に示す図である。
図4】本開示の実施形態に係る強化学習における出力層に紐づいた操作内容の一例を示す図である。
図5】本開示の実施形態に係る強化学習におけるニューラルネットワークの構成変化に関する報酬値の一例を示す図である。
図6】本開示の実施形態に係る情報処理方法を示すフローチャートである。
図7】本開示の実施形態に係る学習方法を示すフローチャートIである。
図8】本開示の実施形態に係る燃焼設備の機能構成を示すブロック図IIである。
図9】本開示の実施形態に係る学習方法を示すフローチャートIIである。
図10】本開示の実施形態に係るコンピュータの構成を示すハードウェア構成図である。
【発明を実施するための形態】
【0012】
以下、本開示の実施形態の制御装置を、図面を参照して説明する。以下の説明では、同一または類似の機能を有する構成に同一の符号を付す。そして、それら構成の重複する説明は省略する場合がある。本開示で「XXに基づく」とは、「少なくともXXに基づく」ことを意味し、XXに加えて別の要素に基づく場合も含み得る。また「XXに基づく」とは、XXを直接に用いる場合に限定されず、XXに対して演算や加工が行われたものに基づく場合も含み得る。本開示で「XXまたはYY」とは、XXとYYのうちいずれか一方の場合に限定されず、XXとYYの両方の場合も含み得る。これは選択的要素が3つ以上の場合も同様である。「XX」および「YY」は、任意の要素(例えば任意の情報)である。
【0013】
本出願で「取得する」とは、送信要求を送信して能動的に取得する場合に限定されず、他の装置から送信される情報を受動的に受信することで取得する場合も含み得る。また「取得」とは、目的の情報(取得対象の情報)を外部から直接取得する場合に限定されず、外部から得られた情報に対して演算または加工などを行うことで、目的の情報を生成して取得する場合も含み得る。
【0014】
(第一実施形態)
<1.焼却設備の全体構成>
図1は、実施形態に係る燃焼設備SFの全体構成を示す概略構成図である。燃焼設備SFは、例えば、都市ごみ、産業廃棄物、またはバイオマスなどを被焼却物Gとするストーカ炉である。以下では説明の便宜上、「被焼却物G」を「ごみG」と称する。なお、燃焼設備SFは、ストーカ炉に限定されるものではなく、別タイプの焼却設備でもよい。本実施形態では、燃焼設備SFは、例えば、クレーン1、焼却炉2、排熱回収ボイラ3、減温塔4、集塵装置5、煙道6、煙突7、および情報処理システム100を備える。
【0015】
クレーン1は、ごみピットに貯留されたごみGを、後述する焼却炉2のホッパ11まで運んでホッパ11に投入する。クレーン1は、ごみGを把持する把持部1aと、把持部1aに設けられた重量センサ1bとを含む。重量センサ1bは、例えば、ロードセルである。重量センサ1bは、ごみGが把持部1aに把持されて持ち上げられた状態で、把持部1aに把持されたごみGの重量を検出する。重量センサ1bの検出結果は、情報処理システム100の取得部110によって取得可能な状態にある。
【0016】
焼却炉2は、後述するホッパ11に投入されたごみGを搬送しながら燃焼させる炉である。焼却炉2内でのごみGの燃焼に伴って焼却炉2では排ガスが発生する。発生した排ガスは、焼却炉2の上部に設けられた排熱回収ボイラ3に送られる。排熱回収ボイラ3は、焼却炉2で発生した排ガスと水との間で熱交換を行うことで水を加熱して蒸気を発生させる。
【0017】
排熱回収ボイラ3を通過した排ガスは、減温塔4で冷却された後、集塵装置5に送られる。排ガスは、集塵装置5でススや塵埃が除去された後、煙道6および煙突7を通じて大気中に排出される。煙道6には、ガス濃度センサ6aが設けられている。ガス濃度センサ6aは、煙道6を流れる排ガスに含まれる各種気体の濃度(例えばCO濃度)を検出する。なお、ガス濃度センサ6aの検出結果は、CO濃度に代えて/加えて、酸素濃度、NOx濃度、およびSOx濃度のうち1つ以上を含み得る。ガス濃度センサ6aの検出結果は、情報処理システム100の取得部110に送信される。
【0018】
<2.焼却炉>
次に、焼却炉2について詳しく説明する。焼却炉2は、例えば、供給機構10、炉本体20、ストーカ30、風箱41、排出シュート42、火炉43、および送風機構50を有する。
【0019】
<2.1 供給機構>
供給機構10は、クレーン1によって運ばれたごみGを、一時的に貯留するとともに、後述する炉本体20の処理空間Vに向けて順次供給する機構である。供給機構10は、例えば、ホッパ11、フィーダ12、押出装置13、物体計測器14、および水分計測器15を有する。
【0020】
ホッパ11は、炉本体20の内部へごみGを供給するために設けられた貯留部である。ホッパ11には、クレーン1によって運ばれたごみGが投入される。ホッパ11は、入口部11aと、出口部11bとを有する。入口部11aは、ごみGが外部から投入されるための入口部分である。入口部11aは、例えば鉛直方向に延びている。入口部11aに投入されたごみGは、重力によって下方に移動する。出口部11bは、入口部11aの下方に設けられている。出口部11bは、入口部11aから供給されるごみGを、後述する炉本体20内の処理空間Vに向けて導く出口部分である。出口部11bは、例えば水平方向に延びている。
【0021】
フィーダ12は、炉本体20にごみGを供給する装置である。フィーダ12は、「供給装置」の一例である。以下では、往復運動を行うことで炉本体20にごみGを供給する往復式のフィーダ12を例に説明する。なお、フィーダ12は、往復式に限らず、回転運動を行うことでごみGを供給する回転式のフィーダ12でもよい。
【0022】
フィーダ12は、ホッパ11の出口部11bに設けられている。フィーダ12は、ホッパ11の出口部11bの底部に沿う板状であり、ホッパ11の出口部11bの底部に沿って配置されている。フィーダ12は、ホッパ11の出口部11bから炉本体20の処理空間Vに向かう方向に沿って往復移動可能である。フィーダ12は、押出装置13によって駆動され、ホッパ11の内部(例えばホッパ11の出口部11b)に堆積したごみGを炉本体20の処理空間Vに向けて押し出す。ごみGの供給量に関する、フィーダ12のストローク、フィーダ12の移動速度、およびフィーダ12の停止時間は、押出装置13によって制御される。
【0023】
物体計測器14は、クレーン1によってホッパ11に投入されるごみGの高さを検出する計測器である。物体計測器14は、例えば、LiDAR(Light Detection and Ranging)である。物体計測器14は、例えばホッパ11の入口部11aに設けられ、ホッパ11の入口部11aを通過するごみGの高さを検出する。なお、物体計測器14は、ごみGの高さに代えて、3次元測定によりごみGの体積を直接に検出してもよい。物体計測器14の検出結果は、情報処理システム100の取得部110に送信される。
【0024】
水分計測器15は、ホッパ11に投入されるごみGに含まれる水分に関する値(例えば水分率または水分量)を検出する計測器である。本実施形態では、水分計測器15は、ホッパ11に設けられた照射部および検出部と、解析部とを有する。照射部は、ホッパ11内に堆積するごみGに所定の周波数帯域の電磁波を照射する。検出部は、照射部から照射されて、ごみGを透過したまたはごみGで反射した電磁波を受信する。解析部は、例えば、電磁波の特性変化(例えば振幅の変化または位相の変化)と水分率との関係を示す相関関係情報を予め記憶している。解析部は、照射部と検出部との間での電磁波の特性変化と、上記相関関係情報とに基づき、ごみGに含まれる水分率を検出する。
【0025】
本実施形態では、水分計測器15の照射部および検出部は、フィーダ12の少し上側に設けられ、フィーダ12の上面に堆積するごみGの水分率を検出する。水分計測器15の検出結果は、情報処理システム100の取得部110によって取得可能な状態にある。
【0026】
<2.2 炉本体>
炉本体20は、ホッパ11に隣接して設けられ、ごみGを搬送しながら燃焼させる設備である。以下では、燃焼設備SFにおけるごみGの搬送方向を「搬送方向D」と称する。炉本体20は、搬送方向Dにおける上流側から下流側に向けて、乾燥段20a、燃焼段20b、および後燃焼段20cをこの順に有する。乾燥段20aは、燃焼段20bおよび後燃焼段20cよりも上流側に位置し、ホッパ11から供給されたごみGを、ストーカ30上での燃焼に先立って乾燥させる領域である。燃焼段20bおよび後燃焼段20cは、乾燥段20aを通過して乾燥した状態のごみGをストーカ30上で燃焼させる領域である。燃焼段20bでは、ごみGから発生する熱分解ガスによる拡散燃焼が起き、輝炎Fが生じる。後燃焼段20cでは、ごみGの拡散燃焼後の固定炭素燃焼が起きるため、輝炎Fは生じない。燃焼段20bおよび後燃焼段20cは、ごみGを燃焼させる処理空間Vの一例である。乾燥段20aは、搬送方向Dにおいて処理空間Vよりも上流側の領域の一例である。
【0027】
本実施形態では、炉本体20は、可視光カメラ21と、赤外カメラ22とを有する。可視光カメラ21および赤外カメラ22は、搬送方向Dにおいて処理空間Vよりも下流側に配置され、当該下流側から搬送方向Dの上流側を撮像する。本実施形態では、可視光カメラ21および赤外カメラ22は、搬送方向Dにおける炉本体20の下流側の端部(以下「炉尻」と称する)に設けられている。例えば、可視光カメラ21および赤外カメラ22は、炉本体20の炉尻に設けられた窓部を通じて、当該下流側から搬送方向Dの上流側を撮像する。例えば、可視光カメラ21および赤外カメラ22は、互いに上下または左右で隣り合う位置に配置されている。
【0028】
可視光カメラ21は、炉本体20の炉尻から、輝炎Fを撮像する。可視光カメラ21の撮像結果は、情報処理システム100の取得部110によって取得可能な状態にある。
【0029】
赤外カメラ22は、炉本体20の炉尻から、輝炎Fを透過して炉本体20の乾燥段20a(すなわち、処理空間Vよりも上流側)に堆積したごみGを撮像する。また本実施形態では、赤外カメラ22は、炉本体20の炉尻から、輝炎Fを透過してホッパ11の出口部11bを撮像する。例えば、赤外カメラ22は、ホッパ11の出口部11bにおいて、フィーダ12上に堆積したごみGを含む画像(ごみGの堆積状態を示す画像)を撮像する。赤外カメラ22の撮像結果は、情報処理システム100の取得部110によって取得可能な状態にある。
【0030】
なお本実施形態では、1つの赤外カメラ22によって、炉本体20の乾燥段20aおよびホッパ11の出口部11b(例えばフィーダ12上に堆積したごみG)の両方を含む画像が撮像される。これに代えて、炉本体20は、炉本体20の乾燥段20aを撮像する第1赤外カメラと、ホッパ11の出口部11b(例えばフィーダ12上に堆積したごみG)を撮像する第2赤外カメラとを別々に備えてもよい。また、赤外カメラ22は、炉本体20の炉尻に代えて、別の位置に設けられてもよい。
【0031】
<2.3 ストーカ>
ストーカ30は、複数の火格子31と、火格子駆動装置32(不図示)とを含む。複数の火格子31は、炉本体20の底面(例えば処理空間Vの底面)となるストーカ面30aを形成している。ストーカ面30aには、供給機構10によってごみGが層状に供給される。ストーカ面30aは、上述した乾燥段20a、燃焼段20b、および後燃焼段20cに亘り設けられている。複数の火格子31は、固定火格子と、可動火格子とを含む。固定火格子は、後述する風箱41の上面に固定されている。可動火格子は、一定の速度で搬送方向Dに沿って往復移動することで、可動火格子と固定火格子の上(ストーカ面30a上)にあるごみGを攪拌混合しながら下流側へ搬送する。
【0032】
<2.4 風箱、排出シュート、火炉>
風箱41は、ストーカ30の下方に設けられ、ストーカ30を通じて炉本体20の内部に燃焼用の空気を供給する。風箱41は、搬送方向Dに複数配列されている。風箱41は、風箱圧力センサ41aを有する。風箱圧力センサ41aは、風箱41の内部の圧力を検出する。風箱41の内部の圧力は、後述する一次空気ライン52を通じて炉本体20の内部に供給される燃焼空気の圧力に相当する。風箱圧力センサ41aの検出結果は、情報処理システム100の取得部110によって取得可能な状態にある。
【0033】
排出シュート42は、燃焼を終えて灰となったごみGを炉本体20よりも下方に位置する灰押出装置へ落下させる装置である。排出シュート42は、炉本体20の炉尻に設けられている。
【0034】
火炉43は、炉本体20の上部から上方に向けて延びている。処理空間V内でごみGが燃焼することで生じた排ガスは、火炉43を通じて排熱回収ボイラ3に送られる。
【0035】
<2.5 送風機構>
送風機構50は、炉本体20の内部に空気(例えば燃焼空気)を供給する。送風機構50は、例えば、送風機51、一次空気ライン52、空気予熱器53、二次空気ライン54、ダンパ55、および空気流量センサ56を有する。
【0036】
送風機51は、炉本体20の内部に空気(例えば燃焼空気)を圧送する押込送風機である。送風機51は、例えば、第1送風機51Aと、第2送風機51Bとを含む。第1送風機51Aは、一次空気ライン52および風箱41を通じて炉本体20の内部(例えば処理空間V)に燃焼空気を圧送する。第2送風機51Bは、二次空気ライン54を通じて、火炉43の内部に燃焼空気を圧送する。
【0037】
一次空気ライン52は、第1送風機51Aと風箱41とを接続している。一次空気ライン52の途中には、1つ以上(例えば複数)の一次空気ダンパ55Aが設けられている。一次空気ダンパ55Aは、一次空気ダンパ55Aの開度によって一次空気ライン52を流れる燃焼空気の流量を変更する。
【0038】
空気予熱器53は、第1送風機51Aから圧送される空気を予熱する熱交換器である。例えば、空気予熱器53は、一次空気ライン52の途中に設けられている。
【0039】
二次空気ライン54は、第2送風機51Bと火炉43とを接続している。火炉43内に供給された二次空気は、ストーカ30の上方からごみGに向かう。二次空気ライン54の途中には、1つ以上(例えば複数)の二次空気ダンパ55Bが設けられている。二次空気ダンパ55Bは、二次空気ダンパ55Bの開度によって二次空気ライン54を流れる燃焼空気の流量を変更する。以下では説明の便宜上、一次空気ダンパ55Aと二次空気ダンパ55Bとを合わせて「ダンパ55」と称する。
【0040】
空気流量センサ56は、炉本体20の内部に供給される空気(例えば燃焼空気)の流量を検出する。空気流量センサ56は、例えば、第1空気流量センサ56Aと、第2空気流量センサ56Bとを含む。第1空気流量センサ56Aは、一次空気ライン52の途中に設けられ、一次空気ライン52を通じて供給される空気の流量を検出する。第2空気流量センサ56Bは、二次空気ライン54の途中に設けられ、二次空気ライン54を通じて供給される空気の流量を検出する。以下の説明で「空気流量センサ56の検出結果」とは、例えば、第1空気流量センサ56Aの検出結果と、第2空気流量センサ56Bの検出結果とを含む。
【0041】
<3.排熱回収ボイラ>
次に、排熱回収ボイラ3について説明する。排熱回収ボイラ3は、例えば、ボイラ本体61、管路62、放射温度センサ(赤外線温度センサ)63、炉内圧力センサ64、給水流量センサ65、および過熱器減温器流量センサ(蒸気量センサ)66を含む。
【0042】
ボイラ本体61は、焼却炉2の火炉43に接続されている。ボイラ本体61の内部には、焼却炉2で発生した排ガスが流入する。放射温度センサ63および炉内圧力センサ64は、ボイラ本体61に設けられている。放射温度センサ63は、ボイラ本体61の内部の温度を検出する。炉内圧力センサ64は、ボイラ本体61の内部の圧力を検出する。放射温度センサ63の検出結果は、情報処理システム100の取得部110に送信される。炉内圧力センサ64の検出結果は、情報処理システム100の取得部110によって取得可能な状態にある。
【0043】
管路62は、ボイラ本体61の内部を延びている。管路62には、複数の過熱器および複数の減温器が設けられている。管路62の入口部には、給水部から水が供給される。管路62を流れる水の少なくとも一部は、ボイラ本体61の内部で熱交換により加熱され、主蒸気となって外部機器(例えばタービン)に向けて流れる。なお、本開示における「蒸気量」とは、管路62から外部機器(例えばタービン)に向けて流れる主蒸気の量を意味する。
【0044】
給水流量センサ65は、管路62の入口部に設けられており、管路62に給水される水の流量を検出する。過熱器減温器流量センサ66は、管路62の途中に設けられており、管路62を流れる流体(例えば蒸気)の流量を検出する。例えば、過熱器減温器流量センサ66は、一次減温器を通過する流体の流量(一次過熱器減温器流量)を検出する第1過熱器減温器流量センサ66Aと、二次減温器を通過する流体の流量(二次過熱器減温器流量)を検出する第2過熱器減温器流量センサ66Bとを含む。以下の説明で「過熱器減温器流量センサ66の検出結果」とは、例えば、第1過熱器減温器流量センサ66Aの検出結果と、第2過熱器減温器流量センサ66Bの検出結果とを含む。給水流量センサ65および過熱器減温器流量センサ66の検出結果は、情報処理システム100の取得部110に送信される。
【0045】
<4.情報処理システム>
次に、情報処理システム100について説明する。
図2は、実施形態に係る燃焼設備SFの機能構成を示すブロック図である。情報処理システム100は、燃焼設備SFを統括的に制御する。例えば、情報処理システム100は、炉本体20の処理空間VでのごみGの燃焼制御を行う。本実施形態では、情報処理システム100は、例えば、取得部110、記憶部120、操作内容導出部130、制御部140、および学習システム160、を備える。また、情報処理システム100は通知部150を備えていてもよい。あるいは、情報処理システム100は、制御部140に代えて、通知部150を備えていてもよい。本開示において、情報処理システム100による制御対象の装置は、上述した押出装置13(フィーダ12)である。
以下に述べる情報処理システム100における各部の動作は、本開示の情報処理方法および学習方法の一部に該当する。
【0046】
<4.1 取得部>
取得部110は、燃焼設備SFに含まれる上述した各種センサにより検出された検出結果などを取得する。例えば、取得部110は、重量センサ1bの検出結果(ごみ重量)、物体計測器14の検出結果(ごみ高さ)、放射温度センサ63の検出結果(炉内温度)、過熱器減温器流量センサ66の検出結果(過熱器減温器流量)、およびガス濃度センサ6aの検出結果(CO濃度など)を取得する。過熱器減温器流量センサ66の検出結果(過熱器減温器流量は、「蒸気量」の一例である。
【0047】
また、水分計測器15の検出結果(ごみ水分検出結果)、可視光カメラ21の撮像結果(燃焼火炎画像)、赤外カメラ22の撮像結果(ごみ層画像)、風箱圧力センサ41aの検出結果(風箱圧力)、空気流量センサ56の検出結果(押込空気流量)、炉内圧力センサ64の検出結果(炉内圧力)、および給水流量センサ65の検出結果(給水流量)は、取得部110によって取得可能な状態にある。
【0048】
取得部110によって、取得あるいは取得可能なこれらの情報は、燃焼設備SFの状態量に関する値である。本開示において、情報処理システム100は、燃焼設備SFの状態量に関するこれらの値を用いて、押出装置13(フィーダ12)の制御を行う。取得部110は、取得した状態量を記憶部120に状態量の履歴(状態量履歴122と称す)として書き込み、記憶させる。
【0049】
取得部110は、さらに、燃焼設備SFの状態量に関するこれらの値を、所定の時間長さにおいて統計処理することで、状態量情報を取得する。本開示における「状態量情報」は、燃焼設備SFの状態量に関するこれらの値を、所定の時間長さにおいて統計処理することで得られる代表値である。例えば、状態量情報は、上記所定の時間長さにおける燃焼設備SFの状態量に関する値の平均値である。なお、状態量情報は、平均値に限定されず、中央値でもよく、最頻出値でもよい。
【0050】
上記所定の時間長さは、押出装置13(フィーダ12)によりごみGの供給が行われる時点と、当該供給に応じて燃焼設備SFの状態量(例えば蒸気量)に変動が生じる時点との時間差を含む時間長さである。例えば、上記所定の時間長さは、押出装置13(フィーダ12)によりごみGの供給が行われる時点と、当該供給に応じて燃焼設備SFの状態量(例えば蒸気量)に変動が最も顕著に相関を持つ時点との時間差を含む時間長さである。また別の観点で見ると、上記所定の時間長さは、フィーダ12が一往復する時間よりも長い時間長さである。上記所定の時間長さは、例えば、20分である。
【0051】
また、取得部110は、記憶部120より、操作内容導出部130が導出した操作内容(導出操作内容121と称す)、後述する学習モデルM、および蒸気量の制御目標値SVをそれぞれ取得する。
【0052】
<4.2 記憶部>
記憶部120には、導出操作内容121、学習モデルM、蒸気量の制御目標値SV、および状態量履歴122が書き込まれ、記憶される。
【0053】
<4.3 操作内容導出部>
操作内容導出部130は、学習モデルMを用いて、取得部110により取得された状態量情報を、学習モデルMに入力し、入力した状態量情報に応じた押出装置13(フィーダ12)の操作内容を導出する。本開示において、操作内容導出部130に搭載された学習モデルを学習モデルMと称する。学習モデルMでは、取得部110により取得された状態量情報と、当該状態量情報が取得された場合に対応する押出装置13の操作内容(フィーダ12の操作内容)と、上記押出装置13の操作内容(フィーダ12の操作内容)の結果として生じる燃焼設備SFの状態(例えば蒸気量)に応じた報酬との対応関係に基づいて学習が行われている。上記押出装置13の操作内容(フィーダ12の操作内容)の結果として生じる燃焼設備SFの状態とは、上記押出装置13の操作内容の操作から所定時間後(例えば20分後)の燃焼設備SFの状態(例えば蒸気量)を意味する。
【0054】
その後、操作内容導出部130は、導出した導出操作内容を、制御部140に出力する。また、操作内容導出部130は、導出した導出操作内容を、通知部150に出力してもよい。なお、操作内容導出部130は、学習モデルMから、記憶部120に記憶された学習モデルMへの更新を、所定のタイミングにて行う。
【0055】
<4.4 制御部および通知部>
制御部140は、操作内容導出部130が出力する導出操作内容に基づき、処理空間Vの燃焼制御を行う。具体的には、制御部140は、操作内容導出部130が出力する導出操作内容に基づき、押出装置13(フィーダ12)に制御指示値を出力し、フィーダ12を制御する。制御部140は、燃焼を促進する場合にごみGの供給量を増加させる。一方で、制御部140は、燃焼を抑制する場合にごみGの供給量を減少させる。
【0056】
例えば、情報処理システム100に通知部150が備わる場合、通知部150は、操作内容導出部130が出力する導出操作内容を作業者(燃焼設備SFの運転員)に通知する。通知部150は、例えば、操作内容導出部130が出力する導出操作内容を表示する表示画面を有した表示装置である。作業者は、通知された導出操作内容を基に、押出装置13(フィーダ12)に手動で制御指示値を入力し、フィーダ12を制御してもよい。
【0057】
<4.5 学習システム>
学習システム160は、学習部161を備える。学習システム160の学習部161は、記憶部120に記憶された学習モデルMの強化学習を、取得部110を介して学習モデルMを取得した後に行う。例えば、学習部161は、状態量情報と、押出装置13(フィーダ12)の操作内容と、報酬との対応関係に基づいて学習モデルMの強化学習を行う。
【0058】
<5 学習モデルの処理の概要>
ここでは、本開示における学習モデルMの概要を図3から図5を用いて示す。操作内容導出部130には、学習モデルMが存在し、この学習モデルMに対して、取得部110によって取得された状態量情報が入力される。学習モデルMは、図3に示すような、順伝播型ニューラルネットワークである。この学習モデルMに対し、統計処理後の状態量情報が入力層として入力されると、学習モデルMは、押出装置13(フィーダ12)の複数の操作内容候補の各々に対する期待値を、出力層に出力する。入力される状態量は、取得部110によって、取得あるいは取得可能な、燃焼設備SFの状態量に関する値である。入力される状態量として、低位発熱量(LHV:Lower Heating Value)、排出物質の濃度(CO濃度)、ごみGの供給量、および蒸気量を例に挙げる。学習モデルMに入力される状態量は、これらのうち2つ以上である。本実施形態では、入力される状態量は、低位発熱量(LHV)、排出物質の濃度(CO濃度)、ごみGの供給量、および蒸気量の各々の上記所定の時間長さにおける代表値(例えば平均値)である。
【0059】
なお、入力される状態量情報は、上述した状態量の一部または全部に代えて、水分計測器15の検出結果(ごみ水分検出結果)、可視光カメラ21の撮像結果(燃焼火炎画像)、赤外カメラ22の撮像結果(ごみ層画像)、風箱圧力センサ41aの検出結果(風箱圧力)、空気流量センサ56の検出結果(押込空気流量)、炉内圧力センサ64の検出結果(炉内圧力)、および給水流量センサ65の検出結果(給水流量)の各々の上記所定時間における代表値(または代表する画像)でもよい。
【0060】
学習モデルMの出力層に出力される期待値(押出装置13(フィーダ12)の複数の操作内容候補の各々に対する期待値)の中で、最も大きな期待値に対応する操作内容候補が、導出操作内容として、操作内容導出部130によって、制御部140または通知部150に出力される。
【0061】
取得部110は、統計処理とは別に、以下の推定を行ってもよい。取得部110が行った推定は、状態量として扱われる。すなわち本実施形態では、以下の推定が行われた状態量に関する値が学習モデルMに入力される。
【0062】
取得部110は、重量センサ1bの検出結果(ごみ重量)と、物体計測器14の検出結果(ごみ高さ)とを取得する。取得部110により、ごみ重量と、ごみ高さ、および押出装置13(供給装置)の操作内容から、状態量としてごみGの供給量が推定される。ただし、ごみGの供給量の推定方法は、上記に限定されない。
【0063】
取得部110は、重量センサ1bの検出結果(ごみ重量)と、物体計測器14の検出結果(ごみ高さ)と、放射温度センサ63の検出結果(炉内温度)とを取得する。取得部110により、検出結果と、押出装置13(供給装置)の操作内容とからごみGの供給量(推定量)に応じた炉内温度が求まり、これらに基づいて燃焼データを逆算することにより、状態量としてLHVが推定される。
【0064】
図4に示すように、押出装置13(供給装置)の操作内容は、フィーダ12の第1操作要素の操作量と、第1操作要素とは異なるフィーダ12の第2操作要素の操作量と、フィーダ12の停止時間とのうち2つ以上の組み合わせにより規定される内容である。例えば、フィーダ12が往復式のフィーダである場合、第1操作要素は、フィーダ12のストローク(フィーダストロークST)である。第2操作要素は、フィーダ12の速度(フィーダ速度SD)である。
【0065】
図4の操作内容に関する2次元マップにおいて、第1操作要素をフィーダストロークSTとし、第2操作要素を、フィーダ速度SDとしている。第1操作要素と第2操作要素との組み合わせは、図4において、フィーダ速度SDの5パターンと、フィーダストロークSTの8パターンとから40パターン存在する。これら40パターンは、学習モデルMの出力層に設定される押出装置13(フィーダ12)の複数の操作内容候補である。すなわち、学習モデルMの出力層には、40パターンの操作内容候補が離散的に設定される。学習モデルMの出力層に出力される期待値の中で、最も大きな期待値に対応する操作内容は、図4の40パターン中、フィーダストロークST:αと、フィーダ速度SD:βとの組み合わせである。なお、操作内容は、この2次元マップに限定されず、第1操作要素と第2操作要素との組み合わせに対し、停止時間が追加された三次元マップでもよい。
【0066】
こうして出力された導出操作内容を基に、フィーダ12が制御された後に、学習システム160の学習部161は、学習モデルMの強化学習を行う。上記所定時間後に、フィーダ12によりごみGの供給に応じて燃焼設備SFの状態量に変動が生じると、学習部161は、導出された操作内容実施後の状態量情報(検出値とも称する)と、制御目標値とを取得部110から受け取る。制御目標値は、状態量情報に含まれる少なくとも1つの指標の検出値に対応する目標値である。報酬は、この検出値と、制御目標値との差分の大きさに基づいて導出される。例えば、学習部161は、操作内容実施後の状態量情報(検出値)に含まれる指標の1つである蒸気量の検出値PVと、蒸気量の制御目標値SVとを用いる。
【0067】
図5に示すように、学習部161によって、蒸気量の検出値PVと、蒸気量の制御目標値SVとの差分の大きさに基づいて報酬が導出される。報酬は、段階的に区分されている。例えば、報酬は、学習モデルMに対してあらかじめ設定されていてもよい。あるいは、報酬は、記憶部120に記憶されており、取得部110により取得された後に、学習部161によって学習モデルMに入力されてもよい。
【0068】
後述するステップST24において、学習部161は、報酬を基に期待値に関する重みづけの変更を行う。学習部161は、入力層から出力層までにある各ノード間の結合重みを更新することで、期待値に関する重みづけの変更を行う。強化学習が幾度となく繰り返されることで、学習モデルMは、状態量に対して報酬が高くなる操作内容を学習していく。なお、学習部161は、所定のタイミングにて、学習モデルMの強化学習を行う。
【0069】
<6 処理の流れ>
次に、上述した情報処理システム100における処理の流れの一例について説明する。ただし、以下に説明する処理の順番は、以下の例に限定されず、適宜入れ替えられてもよい。
【0070】
<6.1 情報処理方法>
まず、燃焼設備SFに関連した情報処理方法について説明する。
本実施形態における情報処理方法は、図6に示すフローチャートに従って実施される。まず、情報処理システム100の取得部110は、各検出結果から状態量を取得する(ステップST11)。次に、情報処理システム100の取得部110は、取得した状態量を、記憶部120の状態量履歴122として書き込む(ステップST12)。次に、情報処理システム100の取得部110は、ステップST11にて取得した状態量を統計処理する(ステップST13)。これにより、取得部110は、燃焼設備SFの状態量に関する情報である状態量情報を取得する。次に、情報処理システム100の操作内容導出部130は、取得部110から状態量が統計処理された状態量情報を受け取り、状態量情報を学習モデルMに入力する(ステップST14)。次に、情報処理システム100の操作内容導出部130は、入力した状態量情報に応じた押出装置13(フィーダ12)の操作内容を導出し(ステップST15)、制御部140または通知部150に、導出された操作内容を出力する(ステップST16)。
【0071】
<6.2 学習方法>
次に、燃焼設備SF用の学習方法について説明する。
本実施形態における学習方法は、図7に示すフローチャートに従って実施される。以下に説明する学習方法は、焼却設備SFの運転段階においても並行して実行される。
【0072】
まず、情報処理システム100の取得部110は、記憶部120の状態量履歴122に基づき操作内容実施後の状態量情報(検出値)を取得するとともに、記憶部120の導出操作内容121から押出装置13(フィーダ12)の操作内容を取得する(ステップST21)。その際、取得部110は、前もって操作内容実施後の状態量を統計処理する(ステップST21a)。次に、情報処理システム100の取得部110は、記憶部120から制御目標値SVを取得する(ステップST22)。
【0073】
次に、情報処理システム100の、学習システム160の学習部161は、取得部110から操作内容実施後の状態量情報(検出値PV)および制御目標値SVを受け取り、検出値PVと、制御目標値SVとから報酬を導出する(ステップST23)。次に、学習システム160の学習部161は、記憶部120の導出操作内容121から押出装置13(フィーダ12)の操作内容と、その操作内容に対応する報酬を基に期待値に関する重みづけを変更する(ステップST24)。
【0074】
これにより、学習部161は、燃焼設備SFの状態量に関する情報である状態量情報と、燃焼設備SFに被焼却物を供給する供給装置の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づいて学習モデルの強化学習を行う。次に、学習システム160の学習部161は、重みづけが変更されて更新された学習モデルMを記憶部120に書き込む(ステップST25)。
【0075】
<7.作用効果>
上記構成の情報処理システム100および情報処理方法によれば、燃焼設備SFの状態量に対して報酬が高くなる操作内容を学習していく学習モデルMを用いることができる。これにより、本実施形態の情報処理システム100および情報処理方法は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFの蒸気量の変動量を抑制することができる。
【0076】
また、上記構成の学習システム160および学習方法によれば、学習モデルMが、燃焼設備SFの状態量に対して報酬が高くなる操作内容を学習していくことができる。これにより、本実施形態の学習システム160および学習方法は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFの蒸気量の変動量を抑制することができる。
【0077】
また、蒸気量は、ごみGの供給状態やごみGの性状によって大きく変動する場合がある。ごみGの性状における、燃焼学的性状(LHVなど)および粉体工学的性状(付着量など)は、季節や気候の影響を強く受けるため、蒸気量などの制御対象パラメータの感度も時々刻々と変化することがある。例えば、蒸気量の予測に基づく供給装置の制御を行う場合には、蒸気量の予測値に対応した制御ロジックの構築が必要となる。ルールベースのロジックを用いると、蒸気量の予測値に対応した分岐処理の数が膨大な量となってしまい、季節変動をすべて加味することは難しい。
【0078】
上記構成の情報処理システム100および情報処理方法によれば、燃焼設備SFの状態量に対して報酬が高くなる操作パターンを学習していく学習モデルMを用いることができる。これにより、本実施形態の情報処理システム100および情報処理方法は、季節変動を加味した上で、燃焼設備SFに関連した適切な操作内容を導出するロジックを自動的に構築することができる。その結果、燃焼設備SFの蒸気量の変動量を抑制することができる。
【0079】
また、上記構成の学習システム160および学習方法によれば、学習モデルMが、燃焼設備SFの状態量に対して報酬が高くなる操作パターンを学習していくことができる。これにより、本実施形態の学習システム160および学習方法は、季節変動を加味した上で、燃焼設備SFに関連した適切な操作内容を導出するロジックを自動的に構築することができる。その結果、燃焼設備SFの蒸気量の変動量を抑制することができる。
【0080】
(第二実施形態)
<8.情報処理システム>
以下、第二実施形態として本開示に係る情報処理システム100Bの実施形態について、図8を用いて説明する。第一実施形態と共通の構成要素には同一の符号を付して詳細説明を省略する。
【0081】
本実施形態では、情報処理システム100Bは、例えば、取得部110、記憶部120B、操作内容導出部130、制御部140、および学習システム160B、を備える。また、情報処理システム100Bは通知部150を備えていてもよい。あるいは、情報処理システム100Bは、制御部140に代えて、通知部150を備えていてもよい。本開示においても、情報処理システム100による制御対象の装置は、上述した押出装置13(供給装置)である。
【0082】
また、本実施形態における、学習モデルMは、状態量情報と、運転員の過去の操作履歴から得られた押出装置13(フィーダ12)の操作内容との対応関係に基づく事前学習により生成された初期モデルに基づいて生成される。この初期モデルを基礎として、取得部110により取得された状態量情報と、押出装置13(フィーダ12)の操作内容と、運転員の操作履歴に応じた報酬との対応関係に基づく事前学習が行われる。その後に、第一実施形態で述べた取得部110により取得された状態量情報と、供給装置の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づく強化学習が行われる。以下に述べる情報処理システム100Bにおいて追加された各部の動作は、本開示の情報処理方法および学習方法の一部に該当する。
【0083】
情報処理システム100Bでは、記憶部120Bは、新たに、運転員による押出装置13(フィーダ12)の操作履歴(運転員操作履歴123と称す)を記憶する。
【0084】
情報処理システム100Bでは、学習部161Bは、第一実施形態で述べた強化学習に加え、事前学習としての強化学習を行うことで、学習モデルMの初期モデルを生成する。本実施形態では、情報処理システム100Bには、学習システム160Bに、いくつかの機能を加えた生成部162が備えられている。生成部162は、状態量情報と、運転員の操作履歴から得られた押出装置13(フィーダ12)の操作内容との対応関係に基づく事前学習により、学習モデルMの初期モデルを生成する。
【0085】
本実施形態における学習方法は、図9に示すフローチャートに従って実施される。以下に説明する学習方法も同様に、焼却設備SFの運転段階においても並行して実行される。
【0086】
まず、情報処理システム100Bの生成部162は、学習前の初期モデルを設定する(ステップST20B)。この初期モデルを学習モデルMとして、情報処理システム100Bの操作内容導出部130は、取得部110により状態量が統計処理された状態量情報を受け取り、状態量情報を学習モデルMに入力する。その後、操作内容導出部130は、入力した状態量情報に応じた押出装置13(フィーダ12)の操作内容を導出する(ステップST21B)。
【0087】
次に、情報処理システム100Bの取得部110は、記憶部120から運転員による操作履歴(運転員操作履歴123)を取得する(ステップST22B)。次に、情報処理システム100Bの、学習システム160Bの学習部161Bは、過去の状態量情報と、当該状態量情報が取得された場合に対応する学習モデルMを用いて導出された押出装置13(フィーダ12)の操作内容と、当該状態量情報が取得された場合に実際に行われた運転員の操作に基づく報酬との対応関係に基づき、学習モデルMを事前学習させる。具体的には、上記事前学習では、学習部161Bによって、学習モデルMを用いて導出された押出装置13(フィーダ12)の操作内容と、運転員操作履歴123との一致度に基づいて報酬が導出される(ステップST23B)。
【0088】
なお、学習モデルMの事前学習としては、学習モデルMを用いて導出された押出装置13の操作内容と運転員操作履歴123との一致度に代えて/加えて、過去に取得された状態量情報と、当該状態量情報が取得された場合に対応する運転員操作履歴123に含まれる運転員の操作内容と、当該運転員の操作内容の結果として生じる燃焼設備SFの状態(例えば蒸気量)に応じた報酬との対応関係に基づく強化学習が行われてもよい。例えば本実施形態では、事前学習における報酬は、運転員操作履歴123に含まれる運転員の操作内容と、当該運転員の操作内容に応じて燃焼設備SFの状態量に含まれる少なくとも1つの指標の検出値と制御目標値との差分の大きさが反映されて導出される。
【0089】
次に、学習システム160の学習部161は、報酬を基に期待値に関する重みづけを変更する(ステップST24)。これにより、学習部161は、この初期モデルを基礎として、取得部110により取得された状態量情報と、押出装置13(フィーダ12)の操作内容と、運転員の操作履歴に応じた報酬との対応関係に基づく事前学習としての強化学習を行う。次に、学習システム160Bの学習部161Bは、重みづけが変更されて更新された学習モデルを記憶部120に書き込む(ステップST24)。
【0090】
学習システム160Bの学習部161Bは、学習モデルMを用いて導出された押出装置13(フィーダ12)の操作内容と、運転員操作履歴123とから導出された報酬を基に初期モデルの事前学習としての強化学習を行った後に、第一実施形態と同様の強化学習を行う。すなわち、取得部110により取得された状態量情報と、当該状態量情報が取得された場合に対応する押出装置13の操作内容(フィーダ12の操作内容)と、上記押出装置13の操作内容(フィーダ12の操作内容)の結果として生じる燃焼設備SFの状態(例えば蒸気量)に応じた報酬との対応関係に基づいて学習モデルMの強化学習が行われる。以上により、初期モデルを基礎として、学習モデルMが得られる。あるいは、学習部161Bは、初期モデルに対し、事前学習としての強化学習と、第一実施形態の強化学習とを適宜選択して強化学習を行い、学習モデルを得てもよい。
【0091】
<9.作用効果>
上記構成の情報処理システム100Bおよび情報処理方法によれば、燃焼設備SFの状態量に対して報酬が高くなる操作パターンを学習していく学習モデルMを用いることができる。これにより、本実施形態の情報処理システム100Bおよび情報処理方法は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFの目的の状態に維持しやすくなる。
【0092】
また、上記構成の学習システム160Bおよび学習方法によれば、学習モデルが、燃焼設備SFの状態量に対して報酬が高くなる操作パターンを学習していくことができる。これにより、本実施形態の学習システム160Bおよび学習方法は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFの蒸気量の変動量を抑制することができる。
【0093】
さらに、上記構成の情報処理システム100Bおよび情報処理方法によれば、運転員操作履歴123との一致度に基づいて学習させているため、状態量情報に基づいて供給装置の制御を行っている運転員と、同様の操作パターンを取るようなロジックを自動的に構築することができる。これにより、既存の他の情報処理システムとの連携も考慮した操作パターンが構築されるため、本開示における情報処理システム100Bの導入時に安定した押出装置13(フィーダ12)の制御を行うことができる。したがって、本実施形態の情報処理システム100Bおよび情報処理方法は、燃焼設備SFに関連した適切な操作内容を、運転員の操作パターンを反映した上で、導出することができる。
【0094】
また、上記構成の学習システム160Bおよび学習方法によれば、運転員操作履歴との一致度に基づいて学習させているため、状態量情報に基づいて押出装置13(フィーダ12)の制御を行っている運転員と、同様の操作パターンを取るようなロジックを自動的に構築することができる。これにより、既存の他の情報処理システムとの連携も考慮した操作パターンが構築されるため、本開示における情報処理システム100Bの導入時に安定した供給装置の制御を行うことができる。したがって、本実施形態の学習システム160Bおよび学習方法は、燃焼設備SFに関連した適切な操作内容を、運転員の操作パターンを反映した上で、導出することができる。その結果、燃焼設備SFの蒸気量の変動量を抑制することができる。
【0095】
<10.その他の実施形態>
以上、本開示の実施の形態について図面を参照して詳述したが、具体的な構成はこの実施の形態に限られるものではなく、本開示の要旨を逸脱しない範囲の設計変更等も含まれる。本開示における初期モデルとしては、燃焼設備SFとは別の設備における状態量情報と、別の設備における供給装置の操作内容との対応関係に基づく事前学習により生成された初期モデルであってもよい。例えば、学習システム160Bの学習部161Bは、過去の状態量情報と、当該状態量情報が取得された場合に対応する学習モデルMを用いて導出された押出装置13(フィーダ12)の操作内容と、当該状態量情報が取得された場合に別の設備で実施された押出装置13(フィーダ12)の操作内容との対応関係に基づき、学習モデルMを学習させる。この場合、学習部161Bによって、学習モデルMを用いて導出された押出装置13(フィーダ12)の操作内容と、別の設備で実施された押出装置13(フィーダ12)の操作内容との一致度に基づいて報酬が導出される。
【0096】
なお、押出装置13(フィーダ12)の操作内容は、情報処理システム100が設けられた燃焼設備1と、別の設備との大きさの違いを考慮するため、燃焼設備1と別の設備との大きさの比率に基づく補正が行われた状態で学習されてもよい。
【0097】
この場合、変形例の初期モデルに対し、事前学習としての強化学習が行われた後に、検出値と、制御目標値とから導出された報酬に基づく第一実施形態の強化学習に移行してもよい。あるいは、変形例の初期モデルに対し、事前学習としての強化学習と、第一実施形態の強化学習とが適宜選択されて強化学習が行われ、学習モデルが得られてもよい。
【0098】
このような構成によれば、本変形例は、燃焼設備SFに関連した適切な操作内容を、別の設備における操作パターンを反映した上で、導出することができる。
【0099】
図10は、本実施形態に係るコンピュータ1100の構成を示すハードウェア構成図である。コンピュータ1100は、例えば、プロセッサ1110、メインメモリ1120、ストレージ1130、インターフェース1140を備える。
【0100】
上述の情報処理システム100あるいは情報処理システム100Bの各機能部は、コンピュータ1100に実装される。そして、上述した各機能部の動作は、プログラムの形式でストレージ1130に記憶されている。プロセッサ1110は、プログラムをストレージ1130から読み出してメインメモリ1120に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ1110は、プログラムに従って、上述した各機能部が使用する記憶領域をメインメモリ1120に確保する。
【0101】
プログラムは、コンピュータ1100に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、ストレージ1130に既に記憶されている他のプログラムとの組み合わせ、または他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。また、コンピュータ1100は、上記構成に加えて、又は上記構成に代えてPLD(Programmable Logic Device)などのカスタムLSI(Large Scale Integrated Circuit)を備えてもよい。PLDの例としては、PAL(Programmable Array Logic)、GAL(Generic Array Logic)、CPLD(Complex Programmable Logic Device)、FPGA(Field Programmable Gate Array)が挙げられる。この場合、プロセッサ1110によって実現される機能の一部または全部が当該集積回路によって実現されてよい。
【0102】
ストレージ1130の例としては、磁気ディスク、光磁気ディスク、半導体メモリなどが挙げられる。ストレージ1130は、コンピュータ1100のバスに直接接続された内部メディアであってもよいし、インターフェース1140又は通信回線を介してコンピュータ1100に接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ1100に配信される場合、配信を受けたコンピュータ1100が当該プログラムをメインメモリ1120に展開し、上記処理を実行してもよい。また、当該プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、前述した機能をストレージ1130に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0103】
<付記>
各実施形態に記載の情報処理システム100あるいは情報処理システム100Bは、例えば以下のように把握される。
【0104】
(1)第1の態様に係る情報処理システム100は、焼却設備SF用の情報処理システムであって、燃焼設備SFの状態量に関する情報である状態量情報を取得する取得部110と、状態量情報と、燃焼設備SFに被焼却物Gを供給する供給装置(フィーダ12)の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づいて学習が行われた学習モデルを用いて、取得部110により取得された状態量情報を入力し、入力した状態量情報に応じた供給装置の操作内容を導出する操作内容導出部130と、を備える。
【0105】
このような構成によれば、燃焼設備SFの状態量に対して報酬が高くなる操作内容を学習していく学習モデルを用いることができる。これにより、第1の態様に係る情報処理システム100は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFを目的の状態に維持しやすくなる。
【0106】
(2)第2の態様に係る情報処理システム100は、(1)の情報処理システム100であって、上記状態量情報は、燃焼設備SFの状態量に関する値を、所定の時間長さにおいて統計処理することで得られる代表値である。
【0107】
このような構成によれば、状態量を所定の時間長さにおいて統計処理を行うことで、瞬時に変動し得る状態量に関して瞬間的に大きくなる(または小さくなる)状態量の検出値の影響を小さくすることができる。これにより、第2の態様に係る情報処理システム100は、燃焼設備SFに関連したさらに適切な操作内容を導出することができる。
【0108】
(3)第3の態様に係る情報処理システム100は、(2)の情報処理システム100であって、上記所定の時間長さは、供給装置(フィーダ12)により被焼却物Gの供給が行われる時点と、当該供給に応じて状態量に変動が生じる時点との時間差を含む時間長さである。
【0109】
このような構成によれば、上記のような比較的長い時間である所定の時間長さにおいて状態量の統計処理を行うことで、被焼却物Gの供給後に瞬時に変動し得る状態量に関して瞬間的に大きくなる(または小さくなる)状態量の検出値の影響を小さくすることができる。これにより、第3の態様に係る情報処理システム100は、燃焼設備SFに関連したさらに適切な操作内容を導出することができる。
【0110】
(4)第4の態様に係る情報処理システム100は、(1)から(3)のうちいずれか1つに記載の情報処理システム100であって、上記供給装置(フィーダ12)の操作内容は、供給装置の第1操作要素の操作量と、第1操作要素とは異なる供給装置の第2操作要素の操作量と、供給装置の停止時間とのうち2つ以上の組み合わせにより規定される内容である。
【0111】
このような構成によれば、供給装置(フィーダ12)の操作内容を詳細に規定することができる。これにより、第4の態様に係る情報処理システム100は、燃焼設備SFに関連したさらに適切な操作内容を導出することができる。
【0112】
(5)第5の態様に係る情報処理システム100は、(1)から(4)のうちいずれか1つに記載の情報処理システム100であって、上記供給装置(フィーダ12)は、往復式または回転式のフィーダであり、上記供給装置の操作内容は、フィーダ12のストローク(フィーダストロークST)と、フィーダ12の速度(フィーダ速度SD)と、フィーダ12の停止時間とのうち2つ以上の組み合わせにより規定される。
【0113】
このような構成によれば、供給装置(フィーダ12)の操作内容を詳細に規定することで、被焼却物Gの供給を制御できる。これにより、第5の態様に係る情報処理システム100は、燃焼設備SFに関連したさらに適切な操作内容を導出することができる。
【0114】
(6)第6の態様に係る情報処理システム100は、(1)から(5)のうちいずれか1つに記載の情報処理システム100であって、上記報酬は、状態量情報に含まれる少なくとも1つの指標の検出値と、指標の目標値との差分の大きさに基づいて導出される。
【0115】
このような構成によれば、操作内容実施後の状態量(検出値)と、制御目標値との差分の大きさに基づいて、報酬が高くなる操作内容を導出することができる。これにより、第6の態様に係る情報処理システム100は、燃焼設備SFに関連したさらに適切な操作内容を導出することができる。
【0116】
(7)第7の態様に係る情報処理システム100は、(1)から(6)のいずれか1つに記載の情報処理システム100であって、上記状態量は、低位発熱量、排出物質の濃度、被焼却物の供給量、または蒸気量のうち2つ以上である。
【0117】
このような構成によれば、燃焼設備SFに被焼却物Gを供給することで変化し得る状態量を入力することができる。これにより、第7の態様に係る情報処理システム100は、燃焼設備SFに関連したさらに適切な操作内容を導出することができる。
【0118】
(8)第8の態様に係る情報処理システム100は、(1)から(7)のいずれか1つに記載の情報処理システム100であって、上記取得部により取得された状態量情報と、供給装置の操作内容と、報酬との対応関係に基づいて学習モデルの強化学習を行う学習部をさらに備える。
【0119】
このような構成によれば、強化学習によって、供給装置の操作内容と、報酬との対応関係に基づいて各操作内容における期待値に関する重みづけを変更することができる。これにより、第8の態様に係る情報処理システム100は、燃焼設備SFに関連したさらに適切な操作内容を導出することができる。
【0120】
(9)第9の態様に係る情報処理システム100Bは、(1)から(8)のいずれか1つに記載の情報処理システム100Bであって、上記学習モデルは、状態量情報と、運転員の操作履歴から得られた供給装置の操作内容との対応関係に少なくとも基づく事前学習により生成された初期モデルを基礎として、取得部110により取得された状態量情報と、給装置の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づく強化学習が行われて得られる。
【0121】
このような構成によれば、第9の態様に係る情報処理システム100Bは、燃焼設備SFに関連した適切な操作内容を、運転員の操作パターンを反映した上で、導出することができる。これにより、初期モデルの段階で、ある程度の精度を確保することができる。
【0122】
(10)第10の態様に係る情報処理システム100Bは、(1)から(9)のいずれか1つに記載の情報処理システム100Bであって、上記学習モデルは、別の設備における状態量情報と、別の設備における供給装置の操作内容との対応関係に少なくとも基づく事前学習により生成された初期モデルを基礎として、取得部110により取得された状態量情報と、給装置の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づく強化学習が行われて得られる。
【0123】
このような構成によれば、第10の態様に係る情報処理システム100Bは、燃焼設備SFに関連した適切な操作内容を、別の設備における操作内容を反映した上で、導出することができる。これにより、初期モデルの段階で、ある程度の精度を確保することができる。
【0124】
(11)第11の態様に係る情報処理方法は、燃焼設備SFに関連した情報処理方法であって、燃焼設備SFの状態量に関する情報である状態量情報を取得し、状態量情報と、燃焼設備SFに被焼却物Gを供給する供給装置(フィーダ12)の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づいて学習が行われた学習モデルを用いて、状態量情報を入力し、入力した状態量情報に応じた供給装置の操作内容を導出する、ことを含む。
【0125】
このような構成によれば、燃焼設備SFの状態量に対して報酬が高くなる操作内容を学習していく学習モデルを用いることができる。これにより、第11の態様に係る情報処理方法は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFの目的の状態に維持しやすくなる。
【0126】
(12)第12の態様に係る学習システム160は、燃焼設備SF用の学習システムであって、燃焼設備SFの状態量に関する情報である状態量情報と、燃焼設備SFに被焼却物Gを供給する供給装置(フィーダ12)の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づいて学習モデルの強化学習を行う学習部を備える。
【0127】
このような構成によれば、学習モデルが、燃焼設備SFの状態量に対して報酬が高くなる操作内容を学習していくことができる。これにより、第12の態様に係る学習システム160は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFを目的の状態に維持しやすくなる。
【0128】
(13)第13の態様に係る学習方法は、燃焼設備SF用の学習方法であって、燃焼設備SFの状態量に関する情報である状態量情報と、燃焼設備SFに被焼却物Gを供給する供給装置(フィーダ12)の操作内容と、燃焼設備SFの状態に応じた報酬との対応関係に基づいて学習モデルの強化学習を行う、ことを含む。
【0129】
このような構成によれば、学習モデルが、燃焼設備SFの状態量に対して報酬が高くなる操作内容を学習していくことができる。これにより、第13の態様に係る学習方法は、燃焼設備SFに関連した適切な操作内容を導出することができる。その結果、燃焼設備SFを目的の状態に維持しやすくなる。
【符号の説明】
【0130】
SF…焼却設備、G…被焼却物(ごみ)、1…クレーン、1a…把持部、1b…重量センサ、2…焼却炉、3…排熱回収ボイラ、4…減温塔、5…集塵装置、6…煙道、6a…ガス濃度センサ、7…煙突、10…供給機構、11…ホッパ、12…フィーダ、13…押出装置、14…物体計測器、15…水分計測器、20…炉本体、21…可視光カメラ、22…赤外カメラ、30…ストーカ、31…火格子、32…火格子駆動装置、41…風箱、41a…風箱圧力センサ、42…排出シュート、43…火炉、50…送風機構、51…送風機、52…一次空気ライン、53…空気予熱器、54…二次空気ライン、55…ダンパ、56…空気流量センサ、56A…第1空気流量センサ、56B…第2空気流量センサ、61…ボイラ本体、62…管路、63…放射温度センサ(赤外線温度センサ)、63…放射温度センサ、64…炉内圧力センサ、65…給水流量センサ、66…過熱器減温器流量センサ(蒸気量センサ)、66…過熱器減温器流量センサ、66A…第1過熱器減温器流量センサ、66B…第2過熱器減温器流量センサ、100…情報処理システム、100B…情報処理システム、110…取得部、120…記憶部、120B…記憶部、130…操作内容導出部、140…制御部、150…通知部、160…学習システム、160B…学習システム、161…学習部、161B…学習部、162…生成部、1100…コンピュータ、1110…プロセッサ、1120…メインメモリ、1130…ストレージ、1140…インターフェース
【要約】
【課題】燃焼設備に関連した適切な操作内容を導出することができる情報処理システム、情報処理方法、学習システム、および学習方法を提供する。
【解決手段】本開示に係る情報処理システムは、燃焼設備用の情報処理システムであって、燃焼設備の状態量に関する情報である状態量情報を取得する取得部と、状態量情報と、燃焼設備に被焼却物を供給する供給装置の操作内容と、燃焼設備の状態に応じた報酬との対応関係に基づいて学習が行われた学習モデルを用いて、取得部により取得された状態量情報を入力し、入力した状態量情報に応じた供給装置の操作内容を導出する操作内容導出部と、を備える。
【選択図】図2
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10