(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023138425
(43)【公開日】2023-10-02
(54)【発明の名称】機械学習装置および排熱回収システム
(51)【国際特許分類】
F27D 19/00 20060101AFI20230922BHJP
F27D 17/00 20060101ALI20230922BHJP
【FI】
F27D19/00 Z
F27D17/00 101A
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023038359
(22)【出願日】2023-03-13
(31)【優先権主張番号】202210259215.X
(32)【優先日】2022-03-16
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】000000974
【氏名又は名称】川崎重工業株式会社
(74)【代理人】
【識別番号】110000556
【氏名又は名称】弁理士法人有古特許事務所
(72)【発明者】
【氏名】雪岡 敦史
(72)【発明者】
【氏名】宮内 寛太
(72)【発明者】
【氏名】竹中 幸弘
(72)【発明者】
【氏名】槇 健良
(72)【発明者】
【氏名】山本 修示
(72)【発明者】
【氏名】野副 拓朗
(72)【発明者】
【氏名】田中 寿典
(72)【発明者】
【氏名】李 朝暉
(72)【発明者】
【氏名】陳 鳳銀
(72)【発明者】
【氏名】肖 杰玉
(72)【発明者】
【氏名】趙 峰娃
(72)【発明者】
【氏名】考 傳利
(72)【発明者】
【氏名】張 皓
(72)【発明者】
【氏名】李 娜
(72)【発明者】
【氏名】汪 寧
(72)【発明者】
【氏名】葛 海根
(72)【発明者】
【氏名】方 偉
(72)【発明者】
【氏名】周 健
【テーマコード(参考)】
4K056
【Fターム(参考)】
4K056AA12
4K056CA08
4K056DA02
4K056DA13
4K056DA39
4K056FA06
(57)【要約】
【課題】セメント焼成設備で発生した排ガスをボイラへ導く排ガスラインと、ボイラを迂回して排ガスラインに合流するバイパスラインの各ラインを流れる排ガス流量を最適化する。
【解決手段】排熱回収システムにおいて運転値の決定を機械学習する機械学習装置であって、機械学習装置は、運転値を制御器に出力する運転値出力部と、ボイラ入口ガス温度、ボイラからの蒸気流量および蒸気タービン発電機の発電出力値を含む状態値を取得する状態観測部と、運転値に基づき少なくとも1つのダンパを動作させた後に取得された状態値に含まれる発電出力値に関連する所定のエネルギ値に基づいて、報酬を計算する報酬計算部と、運転値と状態値と報酬とに基づいて、現在の状態値から制御器に出力する運転値を決定することを機械学習する学習部と、を備える。
【選択図】
図4
【特許請求の範囲】
【請求項1】
排熱回収システムにおいて運転値の決定を機械学習する機械学習装置であって、
前記排熱回収システムは、
セメント原料を焼成する過程で排ガスを発生する排ガス発生部を有するセメント焼成設備と、
前記セメント焼成設備の外部において前記排ガスを大気に放出する放出設備と、
ボイラおよび排風機が設けられ、前記排ガス発生部で発生した排ガスの一部を、前記ボイラを通過させて前記放出設備へ導く排ガスラインと、
前記排ガス発生部で発生した排ガスの残りを、前記ボイラを迂回させて、前記排ガスラインにおける前記ボイラと前記放出設備の間に導くバイパスラインと、
前記排ガスラインおよび前記バイパスラインの少なくとも一方に設けられた少なくとも1つのダンパと、
前記運転値に基づき前記少なくとも1つのダンパを動作させる制御器と、
前記ボイラにおいて発生した蒸気により発電する蒸気タービン発電機と、を備え、
前記機械学習装置は、
前記運転値を前記制御器に出力する運転値出力部と、
前記ボイラへ流入する排ガスの温度と、前記ボイラから前記蒸気タービン発電機へ送る蒸気の流量と、前記蒸気タービン発電機の発電出力値と、を含む状態値を取得する状態観測部と、
前記運転値に基づき前記少なくとも1つのダンパを動作させた後に取得された前記状態値に含まれる前記発電出力値に関連する所定のエネルギ値に基づいて、報酬を計算する報酬計算部と、
前記運転値と、前記状態値と、前記報酬とに基づいて、現在の前記状態値から前記制御器に出力する前記運転値を決定することを機械学習する学習部と、を備える、機械学習装置。
【請求項2】
前記排熱回収システムは、前記蒸気タービン発電機により生成した電力を使用して稼働する補機を備え、
前記補機は、少なくとも前記排風機を含み、
前記エネルギ値は、前記蒸気タービン発電機の発電出力値から、前記補機の消費電力値を引いた値であり、
前記報酬計算部は、前記エネルギ値が所定の閾値を上回る場合にはプラスの報酬を計算し、前記エネルギ値が所定の閾値を下回る場合にはマイナスまたはゼロの報酬を計算する、請求項1に記載の機械学習装置。
【請求項3】
前記エネルギ値は、前記発電出力値自体であり、
前記報酬計算部は、前記エネルギ値が所定の閾値を上回る場合にはプラスの報酬を計算し、前記エネルギ値が所定の閾値を下回る場合にはマイナスまたはゼロの報酬を計算する、請求項1に記載の機械学習装置。
【請求項4】
前記セメント焼成設備は、セメント原料を予熱するプレヒータ(以下、PH)と、前記プレヒータで予熱された前記セメント原料を焼成するキルンと、前記キルンから出た焼成物を搬送しつつ急冷するエアクエンチングクーラ(以下、AQC)とを有し、前記排ガス発生部は前記AQCであり、前記排ガスラインの上流側端部は、前記AQCの所定の高温部と接続されており、前記バイパスラインの上流側端部は、前記高温部よりも焼成物の搬送方向下流側に位置する前記AQCの低温部と接続されている、請求項1~3のいずれか1項に記載の機械学習装置。
【請求項5】
前記放出設備はAQC用放出設備であり、前記ボイラはAQC用ボイラであり、前記排風機はAQC用排風機であり、前記排ガスラインはAQC用排ガスラインであり、前記バイパスラインはAQC用バイパスラインであり、前記ダンパは入口ダンパであり、
前記排熱回収システムは、
前記セメント焼成設備の外部において前記排ガスを大気に放出するPH用放出設備と、
PH用ボイラおよびPH用排風機が設けられ、前記PHで発生した排ガスの一部を、前記PH用ボイラを通過させて前記PH用放出設備へ導くPH用排ガスラインと、
前記PHで発生した排ガスの残りを、前記PH用ボイラを迂回させて、前記排ガスラインにおける前記PH用ボイラと前記PH用放出設備の間に導くPH用バイパスラインと、
前記PH用排ガスラインおよび前記PH用バイパスラインの少なくとも一方に設けられた、開度変更可能な少なくとも1つのPH用ダンパと、を更に備え、
前記蒸気タービン発電機は、前記AQC用ボイラおよび前記PH用ボイラにおいて発生した蒸気により発電し、
前記運転値は、前記少なくとも1つのPH用ダンパの開度を含む、請求項4に記載の機械学習装置。
【請求項6】
前記セメント焼成設備は、セメント原料を予熱するプレヒータ(以下、PH)と、前記プレヒータで予熱された前記セメント原料を焼成するキルンと、前記キルンから出た焼成物を搬送しつつ急冷するエアクエンチングクーラ(以下、AQC)とを有し、前記排ガス発生部は前記PHであり、前記排ガスラインの上流側端部は、前記PHと接続されており、前記バイパスラインの上流側端部は、前記排ガスラインにおける前記ボイラより上流側と接続されている、請求項1~3のいずれか1項に記載の機械学習装置。
【請求項7】
前記学習部は、前記状態観測部が取得した前記状態値から特定された状態と、当該状態における前記運転値の決定とを引数で表現した価値関数を用いて、前記報酬が最大となるように前記価値関数を更新する、請求項1~3のいずれか1項に記載の機械学習装置。
【請求項8】
請求項1~3のいずれか1項に記載の機械学習装置を備える、前記排熱回収システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、セメント製造プロセスの排ガスから熱を回収する排熱回収システムで用いられる機械学習装置および排熱回収システムに関する。
【背景技術】
【0002】
セメント製造プロセスは、大きく分けて、セメント原料を乾燥・粉砕・調合する原料工程、原料から中間製品であるクリンカを焼成する焼成工程、および、クリンカに石こうを加えて粉砕してセメントに仕上げる仕上げ工程から成る。このうち焼成工程では、セメント原料は、先ず、プレヒータ(以下、「PH」とも称する)で予熱され、次いで、仮焼炉で仮焼され、続いて、キルン炉で焼成され、最後に、エアクエンチングクーラ(以下、「AQC」とも称する)で冷却される。従来から、PHやAQCで発生した排ガス熱を回収し、回収した熱で発電する排熱回収システムが知られている。
【0003】
例えば特許文献1の
図3に開示された排熱回収システムは、AQCで発生した排ガスから熱を回収するAQCボイラが設けられた、AQCの高温部から煙突へ延びる排ガスラインと、AQCの低温部から延び、AQCボイラを迂回するバイパスラインとを備える。排ガスラインは、AQC内の比較的高温(例えば平均360℃)の排ガスを排出し、バイパスラインは、AQC内の比較的低温(例えば平均110℃)の排ガスを排出する。排ガスラインを通じてAQCから排出された排ガスは、AQCボイラへ導かれる。AQCボイラでは、排ガスの熱によって過熱蒸気が発生し、過熱蒸気は、蒸気タービン発電機での発電に利用される。AQCボイラで熱が回収された排ガスは、バイパスラインにおいてAQCから排出された排ガスと合流した後、集塵機を通過し、煙突から大気に放出される。
【0004】
また、この排熱回収システムは、AQCボイラを通過する排ガスラインおよびAQCボイラを迂回するバイパスラインとは別に、PHボイラを通過する排ガスラインと、PH排ガスラインから分岐してPHボイラを迂回するバイパスラインも備えている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述のような排熱回収システムは、できるだけ大きなエネルギを生成するよう最適化されることが望ましい。このような方法としては、高温で且つ大量の排ガスがボイラに送られるように、例えばバイパスライン等に設けたダンパの開度を調節することなどが考えられる。ところが、ボイラへ流入する排ガスの流量および温度は、一方を上昇させると他方が低減し得る関係にある。
【0007】
例えば、AQCボイラを迂回するバイパスラインに開度調整可能なダンパが設けられている場合、ダンパの開度を減少させれば、このバイパスラインを通じてAQCから排出される排ガス量は減少し、排ガスラインを通じてAQCから排出される排ガス量は上昇する。しかし、バイパスラインを通じて比較的低温の排ガスがAQCから排出されにくくなることで、AQC内の温度分布が変動し、排ガスラインを通じてAQCボイラへ流入する排ガスの温度は低下する。逆に、バイパスラインのダンパの開度を増大することで、AQCボイラに流入する排ガスの流量は減少するが、AQCボイラに流入する排ガスの温度は上昇する。さらに、キルンからAQCへ供給されるクリンカ量は時々刻々と変動しており、その結果、AQC内の排ガスの温度分布にも変動が生じている。このため、排ガスラインおよびバイパスラインを流れる排ガスの流量をどのように調節すれば最適なシステムを実現できるかを把握することは非常に困難であった。また、システムを最適化することの必要性は、PHボイラを通過する排ガスラインとPHボイラを迂回するバイパスラインでも生じ得る。
【0008】
そこで、本発明は、セメント焼成設備で発生した排ガスをボイラへ導く排ガスラインと、ボイラを迂回して排ガスラインに合流するバイパスラインとを備える排熱回収システムにおいて、排ガスラインおよびバイパスラインを流れる排ガス流量の最適化するための機械学習装置および排熱回収システムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明の一態様に係る機械学習装置は、排熱回収システムにおいて運転値の決定を機械学習する機械学習装置であって、
前記排熱回収システムは、セメント原料を焼成する過程で排ガスを発生する排ガス発生部を有するセメント焼成設備と、前記セメント焼成設備の外部において前記排ガスを大気に放出する放出設備と、ボイラおよび排風機が設けられ、前記排ガス発生部で発生した排ガスの一部を、前記ボイラを通過させて前記放出設備へ導く排ガスラインと、前記排ガス発生部で発生した排ガスの残りを、前記ボイラを迂回させて、前記排ガスラインにおける前記ボイラと前記放出設備の間に導くバイパスラインと、前記排ガスラインおよび前記バイパスラインの少なくとも一方に設けられた少なくとも1つのダンパと、運転値に基づき、前記少なくとも1つのダンパを動作させる制御器と、前記ボイラにおいて発生した蒸気により発電する蒸気タービン発電機と、を備え、
前記機械学習装置は、前記運転値を前記制御器に出力する運転値出力部と、前記ボイラへ流入する排ガスの温度と、前記ボイラから前記蒸気タービン発電機へ送る蒸気の流量と、前記蒸気タービン発電機の発電出力値と、を含む状態値を取得する状態観測部と、前記運転値に基づき前記少なくとも1つのダンパを動作させた後に取得された前記状態値に含まれる前記発電出力値に関連する所定のエネルギ値に基づいて、報酬を計算する報酬計算部と、前記運転値と、前記状態値と、前記報酬とに基づいて、現在の前記状態値から前記制御器に出力する前記運転値を決定することを機械学習する学習部と、を備える。
【0010】
また、本発明の一態様に係る排熱回収システムは、上記の機械学習装置を備えた前記排熱回収システムである。
【0011】
上記の機械学習装置および排熱回収システムによれば、できるだけ大きなエネルギを生成するような運転値を決定することを機械学習することができる。従って、機械学習装置の学習結果を用いて、現在の排熱回収システムの状態から決定した運転値に基づき、排ガスラインおよびバイパスラインの少なくとも一方に設けられた少なくとも1つのダンパを動作させることにより、排ガスからできるだけ大きなエネルギを生成するシステムを実現できる。
【発明の効果】
【0012】
本発明によれば、セメント焼成設備で発生した排ガスをボイラへ導く排ガスラインと、ボイラを迂回して排ガスラインに合流するバイパスラインとを備える排熱回収システムに対して、排ガスラインおよびバイパスラインを流れる排ガス流量の最適化するための機械学習装置および排熱回収システムを提案することができる。
【図面の簡単な説明】
【0013】
【
図1】
図1は、本発明の一実施形態に係る排熱回収システムの概略構成図である。
【
図2】
図2は、排熱回収システムにおける制御系のブロック図である。
【
図3】
図3は、強化学習アルゴリズムの基本的な概念を説明する図である。
【
図4】
図4は、機械学習装置の機能ブロック図である。
【
図5】
図5は、機械学習装置が行う機械学習(強化学習)の流れを示すフローチャートである。
【発明を実施するための形態】
【0014】
[排熱回収システム]
以下、本発明の一実施形態に係る排熱回収システムについて図面を参照しながら説明する。排熱回収システム1では、セメント製造設備2においてセメントを製造する過程で発生する排ガスから熱を回収するシステムである。本実施形態に係る排熱回収システム1は、セメント製造設備2および発電設備3を備える。
【0015】
[セメント製造設備]
上述したように、セメント製造プロセスは、原料工程、焼成工程および仕上げ工程から成る。
図1に示すように、セメント製造設備2は、原料工程を担う原料生成設備10と、焼成工程を担う焼成設備20を有する。
【0016】
原料生成設備10は、石灰石、粘土などのセメント原料を乾燥・粉砕・調合して得られた粉体原料を生成する設備である。原料生成設備10は、原料ミル11、セパレータ12およびサイロ13を含む。原料ミル11では、石灰石、粘土などが粉砕および乾燥される。なお、原料ミル11には、後述するPHボイラ30からの排ガスが流入され、セメント原料の乾燥に利用される。原料ミル11で粉砕および乾燥されたセメント原料は、排ガスに同伴して排出されて、セパレータ12へ流入する。セパレータ12では、セメント原料が排ガスから分離されるとともに分級される。セパレータ12で分離・分級されたセメント原料は、サイロ13で混合および貯蔵され、サイロ13から焼成設備20へ供給される。なお、後述するように、セパレータ12内の排ガスは、集塵機14へと送られる。
【0017】
焼成設備20は、原料生成設備10にて得た粉体原料から、中間製品であるクリンカを焼成する設備である。焼成設備20は、プレヒータ(PH)21、仮焼炉22、ロータリキルン23、およびAQC24を備える。
【0018】
PH21は、直列的に接続された複数段のサイクロン集塵器を備える。PH21では、ロータリキルン23からの排熱が最下段のサイクロン集塵器から最上段のサイクロン集塵器へ向けて順に移動し、セメント原料が最上段のサイクロン集塵器から最下段のサイクロン集塵器へ向けて順に移動する。PH21の最下段のサイクロン集塵器は、仮焼炉22と接続されている。
【0019】
仮焼炉22では、PH21を出たセメント原料が、約900℃の雰囲気で仮焼される。仮焼炉22には、AQC24から仮焼炉22へ排熱を送る仮焼炉用抽気ライン22aと、燃料等を仮焼炉22へ供給する燃料供給ライン22bとが接続されている。仮焼炉22の出口は、ロータリキルン23の入口と接続されている。
【0020】
ロータリキルン23は、横長の円筒型の回転窯であって、原料入口から原料出口へ向かって僅かに下る勾配を付けて設置されている。ロータリキルン23では、PH21および仮焼炉22で予熱・仮焼されたセメント原料を、AQC24の排熱およびバーナ25の燃焼ガスによって焼成する。ロータリキルン23の出口は、AQC24の入口24aと接続されている。
【0021】
AQC24では、ロータリキルン23から出た高温(例えば約1400℃)の焼成物が急冷される。具体的には、ロータリキルン23の出口からAQC24内に落下投入された焼成物は、AQC24内の図示しないコンベアにより出口24bへ向かって搬送される。焼成物は、コンベアで搬送される間、コンベアの下方から冷却用空気が吹きつけられることによって冷却される。AQC24にて冷却された焼成物、すなわちクリンカは、出口24bから出た後、図示しないクリンカコンベヤによりクリンカサイロへ送られる。
【0022】
AQC24内で高温の焼成物に対し吹き付けられた冷却用空気は、高温の排ガスとなる。AQC24内のガス温度は、焼成物の搬送方向に沿って出口24bに近づくにつれ低くなる分布を形成している。例えば、AQC24の入口24a近傍のガス温度は、約1350℃となっており、AQC24の出口24b近傍のガス温度は、約100℃となっている。ただし、AQC24へのクリンカ供給量には振れ幅があるため、AQC24内の排ガスの温度に変動が生じている。また、AQC24内(より詳しくはAQC24内における高温部24cよりも焼成物の搬送方向上流側)には、排ガスの温度を計測する温度計81が設けられている。
【0023】
[発電設備]
発電設備3は、プレヒータボイラ(以下、「PHボイラ」とも称する)30、エアクエンチングクーラボイラ(以下、「AQCボイラ」とも称する)40、および蒸気タービン発電機50を備える。
【0024】
(PHボイラ)
PHボイラ30は、PH21で発生した排ガスを加熱媒体とするボイラである。PHボイラ30は、ガス入口およびガス出口を有するボイラ本体31を備える。ボイラ本体31内には、熱交換器である過熱器32および蒸発器33が、ボイラ本体31におけるガス入口からガス出口に向かってこの順に設置されている。また、ボイラ本体31には、蒸気ドラム34が付属されている。
【0025】
PHボイラ30は、PH21から放出設備16に延びる排ガスライン61(PH用排ガスライン)に設けられている。具体的に、ロータリキルン23の高温の排ガスが、仮焼炉22およびPH21の順に流れ、その後、排ガスライン61を通じてPHボイラ30に導かれる。
【0026】
排ガスライン61におけるPHボイラ30より下流側には、排風機35が設けられている。また、排ガスライン61には、PHボイラ30を迂回させるバイパスライン62(PH用バイパスライン)が接続されている。バイパスライン62の上流側端部は、排ガスライン61におけるPHボイラ30より上流側に接続されており、バイパスライン62の下流側端部は、排ガスライン61におけるPHボイラ30と排風機35との間に接続されている。
【0027】
排ガスライン61におけるバイパスライン62の上流側端部とPHボイラ30との間に、入口ダンパ61aが設けられている。バイパスライン62には、バイパスダンパ62aが設けられている。また、排ガスライン61におけるPHボイラ30より上流側、より詳しくはバイパスライン62の上流側端部より上流側には、排ガスの温度を計測する温度計82が設けられている。また、排ガスライン61におけるPHボイラ30より下流側、より詳しくはPHボイラ30とバイパスライン62の下流側端部との間には、排ガスの温度を計測する温度計83が設けられている。
【0028】
PHボイラ30で熱交換された後の排ガスおよびバイパスライン62を流れる排ガスは、排風機35により上述した原料ミル11へ送られ、原料ミル11の熱源として利用される。原料ミル11へ供給されるセメント原料(被乾燥物)と、原料ミル11から排出されるセメント原料(乾燥物)とが定期的にサンプリングされ、夫々の質量が測定される。原料ミル11に供給されるセメント原料の水分量(水分率)は原料ミル11における被乾燥物の質量と乾燥物の質量との差、即ち、原料ミル11で減少した質量に基づいて求めることができる。本実施形態では、これらのセメント原料の質量測定器を、セメント原料の水分量を測定するための水分測定装置17とする。但し、水分測定装置17は上記に限定されない。また、排ガスライン61における原料ミル11とセパレータ12との間には、原料ミル11から流出する排ガスの温度を計測する温度計87が設けられている。
【0029】
排ガスライン61におけるセパレータ12と放出設備16との間には、集塵機14および排風機15が、排ガスの流れの上流から下流に向けてこの順番で設けられている。原料ミル11でセメント原料の乾燥に利用された排ガスは、セパレータ12へ送られた後、集塵機14へ送られる。セパレータ12から集塵機14へ送られた排ガスは、集塵機14で粉塵が分離されたのち、排風機15により放出設備16としての煙突へ送られて、大気に放出される。
【0030】
(AQCボイラ)
AQCボイラ40は、AQC24で発生した排ガスを加熱媒体とするボイラである。AQCボイラ40は、ガス入口およびガス出口を有するボイラ本体41を備える。ボイラ本体41内には、熱交換器である過熱器42、蒸発器43、および予熱器(エコノマイザ)44が、ガス入口からガス出口に向かってこの順に設置されている。また、ボイラ本体41には、蒸気ドラム45が付属されている。
【0031】
AQCボイラ40は、AQC24の高温部24cから放出設備48に延びる排ガスライン63(AQC用排ガスライン)が接続されている。AQC24の高温部24cとは、AQC24における排ガス温度が比較的高温(例えば約350℃)である箇所である。例えば、AQC24の高温部24cの平均温度は、AQCボイラ40の許容温度範囲内にある。排ガスライン63の上流側端部がAQC24の高温部24cに位置することで、比較的高温な排ガスが、排ガスライン63を通じてAQC24からAQCボイラ40に導かれ、AQCボイラ40の加熱媒体として利用される。
【0032】
なお、AQC24には、上述した仮焼炉用抽気ライン22aが接続されている。仮焼炉用抽気ライン22aは、排ガスライン63とAQC24との接続位置よりも焼成物の搬送方向上流側でAQC24と接続している。このため、仮焼炉用抽気ライン22aからは、排ガスライン63を通じて排出される排ガスの温度よりも高い温度(例えば約600℃)の排ガスが抽気される。
【0033】
排ガスライン63におけるAQCボイラ40と放出設備48との間には、集塵機46および排風機47が、排ガスの流れの上流から下流に向けてこの順番で設けられている。AQC24の低温部24dからは、AQCボイラ40を迂回させるバイパスライン64(AQC用バイパスライン)が延びている。AQC24の低温部24dとは、AQC24における排ガス温度が比較的低温(例えば約150℃)である箇所であり、AQC24における高温部24cよりも焼成物搬送方向下流側に位置している。バイパスライン64の上流側端部は、AQC24の低温部24dに接続されており、バイパスライン64の下流側端部は、排ガスライン63におけるAQCボイラ40と集塵機46との間に接続されている。バイパスライン64の上流側端部がAQC24の低温部24dに位置することで、比較的低温な排ガスが、バイパスライン64を通じてAQC24から排出される。
【0034】
排ガスライン63におけるAQCボイラ40より上流側には、入口ダンパ63aが設けられている。バイパスライン64には、バイパスダンパ64aが設けられている。排ガスライン63の上流側端部とAQCボイラ40(ボイラ本体41の入口)との間には、排ガスの温度を計測する温度計84が設けられている。排ガスライン63におけるAQCボイラ40(ボイラ本体41の出口)とバイパスライン64の下流側端部との間には、排ガスの温度を計測する温度計88が設けられている。
【0035】
AQCボイラ40から流出した排ガスおよびバイパスライン64を流れる排ガスは、排風機47により集塵機46へ送られ、その後放出設備16としての煙突へ送られて、大気に放出される。
【0036】
(蒸気タービン発電機)
蒸気タービン発電機50は、蒸気タービン51と発電機52とを備える。蒸気タービン51は、供給される蒸気によって駆動される。蒸気タービン51は、多段式蒸気タービンであり、例えば、蒸気タービン51の高圧段には高圧蒸気が供給され、蒸気タービン51の低圧段には低圧蒸気が供給される。発電機52は、蒸気タービン51の回転軸の運動エネルギを電気エネルギに変換する。蒸気タービン発電機50で生成した電力は、排熱回収システム1における補機(例えば排風機15,35,47)の稼働に利用される。
【0037】
蒸気タービン51で使用された蒸気は、冷却塔53から送られる冷却水によって復水器54で凝縮される。復水器54で生成された復水は、ポンプ55によりAQCボイラ40に送られる。AQCボイラ40に供給された水は、予熱器44で排ガスから熱を与えられて加熱される。予熱器44で加熱された水は、AQCボイラ40の蒸気ドラム45、PHボイラ30の蒸気ドラム34および高圧段フラッシャ56に分配される。
【0038】
AQCボイラ40の蒸気ドラム45に供給された水は、蒸発器43で加熱された後に蒸気ドラム45に戻って気液分離する。蒸気ドラム45の蒸気は、過熱器42で飽和温度以上に加熱された後、蒸気タービン51に導かれる。
【0039】
PHボイラ30の蒸気ドラム34に供給された水は、蒸発器33で加熱された後に蒸気ドラム34に戻って気液分離する。蒸気ドラム34の蒸気は、過熱器32で飽和温度以上に加熱された後、蒸気タービン51に導かれる。
【0040】
予熱器44で加熱された水のうち、蒸気ドラム34,45に供給されなかった残りの水が高圧段フラッシャ56に送られる。高圧段フラッシャ56は、予熱器44から送られる水を気液分離する。高圧段フラッシャ56で生成された蒸気は、蒸気タービン51(より詳しくは蒸気タービン51の中圧段)に供給され、残った熱水は、低圧段フラッシャ57に送られる。低圧段フラッシャ57は、高圧段フラッシャ56から送られる水を気液分離する。低圧段フラッシャ57で生成された蒸気は、蒸気タービン51(より詳しくは蒸気タービン51の低圧段)に供給され、残った水は、復水器54からの復水とともに予熱器44に送られる。
【0041】
また、発電設備3は、PHボイラ30から蒸気タービン51へ送る蒸気の流量を計測する蒸気流量計85と、AQCボイラ40から蒸気タービン51へ送る蒸気の流量を計測する蒸気流量計86を備える。
【0042】
(制御装置)
本実施形態に係る排熱回収システム1は制御装置7を備える。
図2は、排熱回収システム1における制御系のブロック図である。
図2に示すように、温度計81,82,83,84,88で計測した温度、蒸気流量計85,86で計測した蒸気流量、および蒸気タービン発電機50での発電出力値が、制御装置7へ送られる。排風機15,35,47には、それぞれ、排風機15,35,47の消費電力値を計測する消費電力計測器15a,35a,47aが設けられている。消費電力計測器15a,35a,47aで計測した消費電力値が、制御装置7へ送られる。
【0043】
また、制御装置7は、制御器71および機械学習器72を備える。制御器71および機械学習器72は、それぞれ、CPU等の演算処理部と、不揮発性および揮発性の記憶部とを備える。制御器71および機械学習器72とは、情報の送受信が可能となるように電気的に接続される。なお、機械学習器72は、制御器71と分離して制御器71の外部に設けられてもよく、この場合、機械学習器72は、制御器71とネットワーク等を介して接続されてもよい。
【0044】
制御器71は、ダンパ61a,62a,63a,64aおよび排風機15,35,47を制御する。なお、制御器71は、ダンパ61a,62a,63a,64aを制御する制御ユニットと、排風機15,35,47を制御する制御ユニットとを含んでもよい。機械学習器72は、排熱回収システム1においてできるだけ大きなエネルギを生成するための機械学習を行なう。機械学習器72は、ダンパ61a,62a,63a,64aの開度の少なくとも1つを含む運転値を決定することを機械学習する。すなわち、制御対象であるダンパ61a,62a,63a,64aおよび排風機15,35,47のうちの一部が、機械学習器72により出力される運転値に基づき制御され、残りは、記憶部に予め記憶されたプログラムおよび/またはデータに基づき制御される。
【0045】
以下に説明する例では、制御対象のうちバイパスダンパ62a,64aが、機械学習器72により出力される運転値に基づき制御されるものとして説明する。この場合、例えば、入口ダンパ61a,63aは、セメント製造設備2が稼働する間、予め定めた設定開度(例えば開度100%)となるよう制御器71により制御される。また、排風機15,35,47は、セメント製造設備2が稼働する間、予め定めた設定回転数(排風量)で稼働するよう制御器71により制御される。
【0046】
排熱回収システム1の状態に対して、単純な演算式等を用いて、バイパスダンパ62a,64aの開度をどのように調節すれば最適なシステムを実現できるのかを明示的に示すことは困難である。そこで、人工知能としての機械学習器72は、報酬を与えるだけで目標到達のための行動を自動的に学習する強化学習のアルゴリズムを採用する。以下、機械学習器72が行う機械学習について説明する。
【0047】
-機械学習方法-
図3は、強化学習アルゴリズムの基本的な概念を説明する図である。
図3に示すように、強化学習では、学習する主体となるエージェント(制御装置7)と、制御対象となる環境(セメント製造設備2および発電設備3)とのやり取りにより、エージェントの学習が進行する。より具体的には、エージェントの学習に際し、次の(1)~(4)が繰り返される。
(1)エージェントが時刻tにおける環境の状態s
tを観測すること。
(2)エージェントが観測結果と過去の学習に基づいて自分が取れる行動a
tを選択して、行動a
tを実行すること。
(3)行動a
tが実行されることで、環境の状態s
tが次の状態s
t+1へと変化し、この状態の変化に基づいて、エージェントが報酬r
t+1を受け取ること。
(4)エージェントが状態s
t、行動a
t、報酬r
t+1および過去の学習の結果に基づいて学習を進めること。
【0048】
上記の(4)における学習では、エージェントは将来取得できる報酬rの量を判断するための基準となる情報として、状態st,行動at,報酬rt+1のマッピングを獲得する。例えば、各時刻において取り得る状態の個数がm、取り得る行動の個数がnとすると、行動を繰り返すことによって状態stと行動atの組に対する報酬rt+1を記憶するm×nの2次元配列が得られる。そして、上記得られたマッピングに基づいて現在の状態や行動がどのくらい良いのかを示す関数である価値関数(評価関数)を用い、行動を繰り返す中で価値関数を更新していくことにより状態に対する最適な行動を学習していく。
【0049】
価値関数の一つとして知られる状態行動価値関数Q(st,at)は、ある状態stにおいて行動atがどのくらい良い行動であるのかを示す。状態行動価値関数Q(st,at)は、状態と行動を引数とする関数として表現される。状態行動価値関数Q(st,at)は、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、行動により移行する未来の状態における行動の価値などに基づいて更新される。状態行動価値関数Q(st,at)の更新式は強化学習のアルゴリズムに応じて定義されており、例えば、代表的な強化学習アルゴリズムの1つであるQ学習においては、状態行動価値関数Q(st,at)の更新式は、以下の数1で定義される。
【0050】
【0051】
そして、上記の(2)における行動atの選択においては、過去の学習によって作成された価値関数を用いて現在の状態stにおいて将来にわたっての報酬(rt+1+rt+2+…)が最適となる行動at(状態stにおいて最も価値の高い行動at)を選択する。Q学習においては、報酬(rt+1+rt+2+…)が最適となる行動atは、報酬(rt+1+rt+2+…)が最大となる行動atに相当し得る。
【0052】
強化学習のアルゴリズムとしては、Q学習、SARSA法、TD学習、AC法など様々な手法が周知であるが、本発明に適用する方法としていずれの強化学習アルゴリズムが採用されてもよい。これらの強化学習アルゴリズムは周知であるから、本明細書における各アルゴリズムの更なる詳細な説明は省略する。
【0053】
また、価値関数の更新方法として、現在の状態stに対して或る行動atを適用することにより状態stが新たな状態st+1に移行するたびに、価値関数の更新を行う学習方法(いわゆるオンライン学習)を採用しなくてもよい。例えば、現在の状態stに対して或る行動atを適用することにより状態stが新たな状態st+1に移行するということを繰り返して、それら状態および行動を学習用データとして蓄積し、蓄積した学習用データを用いて価値関数を更新する、いわゆるバッチ学習やミニバッチ学習を採用してもよい。
【0054】
図4は、機械学習器72の機能ブロック図である。
図4に示す機械学習器72は、状態観測部91、状態値記憶部92、報酬計算部93、学習部94、学習結果記憶部95、および運転値出力部96を備える。
【0055】
状態観測部91は、セメント製造設備2および発電設備3の状態に関する様々な種類の値を、状態値として取得する。状態値記憶部92は、状態観測部91が取得した状態値を記憶し、記憶した状態値を、報酬計算部93および学習部94に出力する。
【0056】
状態値には、例えば、温度計81の計測値(AQC24内上流側の排ガスの温度)、温度計82の計測値(PHボイラ30へ流入する排ガスの温度)、温度計83の計測値(PHボイラ30から流出した排ガスの温度)、温度計84の計測値(AQCボイラ40へ流入する排ガスの温度)、温度計88の計測値(AQCボイラ40から流出した排ガスの温度)、温度計87の計測値(原料ミル11の出口の排ガス温度)、蒸気流量計85の計測値(PHボイラ30の蒸気流量)、蒸気流量計86の計測値(AQCボイラ40の蒸気流量)、蒸気タービン発電機50の発電出力値、消費電力計測器15a,35a,47aの消費電力値などが含まれ得る。状態値には、排風機15,35,47の入口または出口の排ガスの温度が含まれてもよい。状態値には、最新の運転で取得した値の他、過去の運転で取得した値が含まれてもよい。例えば状態値には、予め制御装置7に記憶された値が含まれてもよい。例えば状態値には、水分測定装置17で計測したセメント原料の水分量が含まれてもよいし、入口ダンパ61a,63aの設定開度が含まれてもよいし、排風機15,35,47の各設定回転数(排風量)が含まれてもよい。状態値には、排風機15,35,47の入口の排ガス温度が含まれてもよい。
【0057】
なお、
図4に状態値の例が示されているが、状態値はこれに限定されない。すなわち、状態値記憶部92に記憶される状態値に、
図4に示した値の全てが含まれなくてもよいし、
図4に示した値とは別の値を含んでもよい。
【0058】
報酬計算部93は、予め設定された報酬条件に基づいて、状態値記憶部92から取得した状態値を分析して報酬を計算する。報酬計算部93は、計算した報酬を学習部94に出力する。
【0059】
報酬条件は、強化学習における報酬を与える条件である。報酬条件は、操作者などによって予め機械学習器72に設定される。例えば、報酬条件は、排熱回収システム1において生成されるエネルギが大きいと判定される場合には、生成されるエネルギが小さいと判定される場合に比べて大きい報酬を与えるように設定される。報酬には、例えば、プラスの報酬やマイナスの報酬、報酬なし(報酬ゼロ)などがある。
【0060】
本実施形態では、報酬条件に、排熱回収システム1において生成されるエネルギを評価する指標に応じた報酬を与えるように設定されている。具体的には、評価指標として、蒸気タービン発電機50の発電出力値から、排熱回収システム1における補機の消費電力値を引いた値を用いる。つまり、排熱回収システム1において生成されるエネルギ値として、蒸気タービン発電機50の発電出力値自体ではなく、発電出力値から補機の消費電力を引いた正味のエネルギ値が評価指標として設定されている。
【0061】
報酬計算部93は、評価指標としてのエネルギ値が所定の閾値を上回る場合にはプラスの報酬を計算し、エネルギ値が所定の閾値を下回る場合にはマイナスまたはゼロの報酬を計算する。例えば、報酬計算部93は、エネルギ値が所定の第1閾値より低く且つ別の第2閾値より高い場合にゼロの報酬を計算し、エネルギ値が第2閾値より低い場合にマイナスの報酬を計算してもよい。閾値は、シミュレーションや過去の運転結果などにより決定され、制御装置7の記憶部に予め記憶されている。
【0062】
ここで、評価指標の計算、すなわち報酬の計算には、蒸気タービン発電機50により生成した電力を使用して稼働する全ての補機の消費電力が用いられなくてもよい。例えば、蒸気タービン発電機50により生成した電力を使用して稼働する全ての補機の中で、消費電力が比較的大きい装置のみ報酬の計算に用いられてもよい。本例では、報酬の計算には、他の補機に比べて消費電力の大きい排風機15,35,47の消費電力が用いられる。
【0063】
学習部94は、状態値記憶部92から取得した状態値および報酬計算部93から取得した報酬に基づいて、運転値の決定を機械学習(強化学習)する。より詳しくは、学習部94は、状態観測部91が取得した状態値から特定された状態(状態値の組み合わせにより定義される状態st)と、当該状態における運転値の決定とを引数で表現した価値関数(状態行動価値関数Q(st,at))を用いて、得られる報酬が最大となるように価値関数を更新する。
【0064】
学習結果記憶部95は、学習部94が学習した結果を記憶する。なお、学習結果としての価値関数を記憶する方法としては、近似関数を用いる方法や、配列を用いる方法を一般的に用いられる。但し、これらの方法以外にも、例えば状態が多くの状態を取るような場合には状態st、行動atを入力として価値を出力する多値出力のSVMやニューラルネットワーク等の教師あり学習器を用いる方法などが用いられてもよい。
【0065】
運転値出力部96は、学習部94が学習した結果と現在の状態値とに基づき、運転値を決定し、決定された運転値を制御器71に出力する。
【0066】
なお、本例では、運転値はバイパスダンパ62a,64aの開度であるが、運転値はこれに限定されない。上述したように、運転値は、ダンパ61a,62a,63a,64aの開度の少なくとも1つを含んでいればよい。例えば、
図4に運転値の例を示したように、運転値には、バイパスダンパ62a,64aの開度に加えてまたは代わりに、入口ダンパ61a,63aの各開度および排風機15,35,47の各回転数の一部または全部が含まれ得る。
【0067】
次に、機械学習器72が行う機械学習(強化学習)の流れを、
図5を参照して説明する。
【0068】
機械学習が開始されると、状態観測部91は環境(状態st)を特定するための情報を状態値として取得する(ステップS01)。状態値記憶部92は、取得した状態値を記憶する(ステップS02)。学習部94は、状態観測部91が取得した状態値に基づいて、現在の状態stを特定する(ステップS03)。学習部94は、過去の学習結果とステップS03で特定した状態stとに基づいて行動atを選択する(ステップS04)。行動atとは、定義された状態stに応じた運転値の決定である。ここで、例えば、複数の運転値を選択可能な行動として用意しておき、過去の学習結果に基づいて将来に得られる報酬rが最も大きくなる行動aを選択するようにしてもよい。運転値出力部96は、ステップS04で選択された行動atに基づいて、出力すべき運転値を決定し、決定された運転値を制御器71へ出力する。制御器71によって行動atが実行され(ステップS05)、これに応じてセメント製造設備2および発電設備3が運転する。
【0069】
行動atが実行されて状態が移行した後、状態観測部91が環境(状態st+1)を特定するための情報を取得し(ステップS06)、状態値記憶部92がそれを状態値として記憶する(ステップS07)。この段階においては、セメント製造設備2および発電設備3の状態は、時刻tから時刻t+1への時間的推移と共に、実行された行動atによって変化している。報酬計算部93は、設定された報酬条件に基づいて、時刻t+1の状態値から報酬rt+1を求める(ステップS08)。学習部94は、ステップS03で特定した状態st、ステップS04で選択した行動at、および、ステップS08で算出した報酬rt+1に基づいて機械学習を進める(ステップS09)。学習に用いられる価値関数については、適用する学習アルゴリズムに応じて決定する。学習結果記憶部95は、学習部94が学習した結果を記憶し(ステップS10)、処理はステップS03へ戻る。
【0070】
上述の通り、機械学習器72では、機械学習(強化学習)を繰り返す。機械学習器72による学習は、エネルギの生成に関して最適なシステムが実現されたことが確認された段階で(例えば、所定の期間、所定のエネルギを生成することが確認された段階で)完了させてもよい。
【0071】
学習が完了した学習データを用いて実際に排熱回収システム1の運転値を決定する際には、機械学習器72は新たな学習を行なわないようにして、学習完了時の学習データをそのまま使用して繰り返し運転をするようにしてもよい。この場合、運転値出力部96は、学習部94が学習した結果(即ち、学習結果記憶部95に記憶されている学習結果)と現在の状態値とに基づいて運転値を決定し、それを制御器71へ出力する。
【0072】
以上に説明した通り、本実施形態に係る排熱回収システム1は、機械学習器72(機械学習装置)を備えており、機械学習器72は、運転値を制御器71に出力する運転値出力部96と、AQCボイラ40へ流入する排ガスの温度と、AQCボイラ40から流出する排ガスの温度と、PHボイラ30へ流入する排ガスの温度と、PHボイラ30から流出する排ガスの温度と、蒸気タービン発電機50の発電出力値と、を含む状態値を取得する状態観測部91と、運転値に基づきバイパスダンパ62a,64aを動作させた後に取得された状態値に含まれる発電出力値に関連する所定のエネルギ値に基づいて、報酬を計算する報酬計算部93と、運転値、状態値および報酬とに基づいて、現在の状態値から制御器71に出力する運転値を決定することを機械学習する学習部94と、を備える。
【0073】
本実施形態によれば、できるだけ大きなエネルギを生成するような運転値を決定することを機械学習することができる。従って、機械学習器72の学習結果を用いて、現在の排熱回収システム1の状態から決定した運転値に基づき、バイパスライン62,64に夫々設けられたバイパスダンパ62a,64aを動作させることにより、排ガスからできるだけ大きなエネルギを生成するシステムを実現できる。
【0074】
学習部94は、状態観測部91が取得した状態値から特定された状態と、当該状態における運転値の決定とを引数で表現した価値関数(状態行動価値関数Q(st,at))を用いて、報酬が最大となるように価値関数を更新するように構成されてよい。
【0075】
また、本実施形態では、機械学習器72が、AQCボイラ40およびPHボイラ30の双方について、流入する排ガス量を調節する運転値の決定を学習する。このため、システム全体の最適化を図ることができる。
【0076】
また、機械学習器72の報酬計算部93は、報酬を計算するための評価指標として、蒸気タービン発電機50の発電出力値から、排熱回収システム1における補機の消費電力値を引いた値を用いる。このため、正味の発電効率を向上することができる。
【0077】
以上に本発明の好適な実施の形態を説明したが、本発明の精神を逸脱しない範囲で、上記実施形態の具体的な構造および/又は機能の詳細を変更したものも本発明に含まれ得る。上記の排熱回収システム1の構成は、例えば、以下のように変更することができる。
【0078】
上記実施形態では、機械学習器72が、AQCボイラ40およびPHボイラ30の双方について、流入する排ガス量を調節する運転値の決定を学習したが、本発明はこれに限定されない。
【0079】
例えば、上記実施形態では、機械学習器72が、PH用バイパスダンパ62aの開度とAQC用バイパスダンパ64aの開度を含む運転値の決定を学習したが、機械学習器72は、PH用入口ダンパ61aの開度および/またはPH用バイパスダンパ62aの開度を含む運転値の決定を機械学習してもよい。つまり、AQCボイラ40およびPHボイラ30全体ではなく、PHボイラ30単体の熱回収率の向上を図る運転値の決定を機械学習してもよい。この場合、状態値には、PHボイラ30へ流入する排ガスの温度と、PHボイラ30から蒸気タービン発電機50へ送る蒸気の流量と、蒸気タービン発電機50の発電出力値とが含まれ得る。また、この場合、状態値には、PHボイラ30から流出する排ガスの温度が含まれ得る。
【0080】
また、例えば、機械学習器72は、AQC用入口ダンパ63aの開度および/またはAQC用バイパスダンパ64aの開度を含む運転値の決定を機械学習してもよい。つまり、AQCボイラ40およびPHボイラ30全体ではなく、AQCボイラ40単体の熱回収率の向上を図る運転値の決定を機械学習してもよい。この場合、状態値には、AQCボイラ40へ流入する排ガスの温度と、AQCボイラ40から蒸気タービン発電機50へ送る蒸気の流量と、蒸気タービン発電機50の発電出力値とが含まれ得る。また、この場合、状態値には、AQCボイラ40から流出する排ガスの温度が含まれ得る。
【0081】
また、上記実施形態では、評価指標としてのエネルギ値は、蒸気タービン発電機50の発電出力値から、補機の消費電力値を引いた値であったが、評価指標としてのエネルギ値はこれに限られない。例えば、評価指標としてのエネルギ値は、蒸気タービン発電機50の発電出力値自体であってもよい。
【符号の説明】
【0082】
1 :排熱回収システム
2 :セメント製造設備
3 :発電設備
7 :制御装置
15 :排風機
16 :放出設備
20 :焼成設備(セメント焼成設備)
21 :プレヒータ(PH)
22 :仮焼炉
22a :仮焼炉用抽気ライン
22b :燃料供給ライン
23 :ロータリキルン
24 :エアクエンチングクーラ(AQC)
30 :PHボイラ
35 :排風機
40 :AQCボイラ
47 :排風機
48 :放出設備
50 :蒸気タービン発電機
61 :排ガスライン
61a :入口ダンパ
62 :バイパスライン
62a :バイパスダンパ
63 :排ガスライン
63a :入口ダンパ
64 :バイパスライン
64a :バイパスダンパ
71 :制御器
72 :機械学習器(機械学習装置)
91 :状態観測部
92 :状態値記憶部
93 :報酬計算部
94 :学習部
95 :学習結果記憶部
96 :運転値出力部