(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022153923
(43)【公開日】2022-10-13
(54)【発明の名称】高炉操業用機械学習装置、それに用いられるプログラム、高炉操業予測モデルの生成方法及び高炉の操業方法
(51)【国際特許分類】
C21B 7/24 20060101AFI20221005BHJP
C21B 5/00 20060101ALI20221005BHJP
【FI】
C21B7/24
C21B5/00 323
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021056703
(22)【出願日】2021-03-30
(71)【出願人】
【識別番号】000006655
【氏名又は名称】日本製鉄株式会社
(74)【代理人】
【識別番号】100087398
【弁理士】
【氏名又は名称】水野 勝文
(74)【代理人】
【識別番号】100128783
【弁理士】
【氏名又は名称】井出 真
(74)【代理人】
【識別番号】100128473
【弁理士】
【氏名又は名称】須澤 洋
(72)【発明者】
【氏名】松崎 眞六
(72)【発明者】
【氏名】夏井 琢哉
(72)【発明者】
【氏名】若山 陽之介
【テーマコード(参考)】
4K015
【Fターム(参考)】
4K015KA01
(57)【要約】
【課題】予測精度の高い高炉操業モデルを提供する。
【解決手段】高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一するデータ事前処理部と、高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択部と、選択した説明変数に対応する高炉の操業データと目的変数に対応する高炉の操業データとを教師データとした機械学習を行うことで高炉操業予測モデルを生成するモデル生成部と、を有することを特徴とする高炉操業用機械学習装置。
【選択図】
図2
【特許請求の範囲】
【請求項1】
高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一するデータ事前処理部と、
高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択部と、
選択した説明変数に対応する高炉の操業データと目的変数に対応する高炉の操業データとを教師データとした機械学習を行うことで高炉操業予測モデルを生成するモデル生成部と、
を有することを特徴とする高炉操業用機械学習装置。
【請求項2】
前記データ事前処理部は、非正規分布データを正規分布データに変換する前に、各操業データに含まれる外れ値を除去する除去処理を行うことを特徴とする請求項1に記載の高炉操業用機械学習装置。
【請求項3】
前記データ事前処理部は、下記の式(1)に基づくHampel Identifiere法にしたがって前記の除去処理を行うことを特徴とする請求項2に記載の高炉操業用機械学習装置。
median(xi)±cMAD(xi)・・・・・・・・式(1)
ただし、MAD(xi)=median(|xi-median(xi)|)であり、medianは中央値であり、cは3以上5以下(ただし、整数に限らない)の範囲から選ばれるパラメータである。
【請求項4】
前記データ種別選択部は、高炉の操業データに取得タイミングが互いに異なる同種の操業データが含まれている場合に、これらの操業データのデータ種別を互いに異なるデータ種別として説明変数の選択を行うことを特徴とする請求項1乃至3のうちいずれか一つに記載の高炉操業用機械学習装置。
【請求項5】
請求項1乃至4のうちいずれか一つ高炉操業用機械学習装置を用いて高炉の操業状態を予測し、
この予測結果に基づくアクションを実行することにより高炉を操業することを特徴とする高炉の操業方法。
【請求項6】
請求項5に記載のアクションを実施した後に得られる高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一するデータ事前処理部と、
高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択部と、
選択した説明変数に対応する高炉の操業データと目的変数に対応する高炉の操業データとを教師データとした機械学習を行うことで高炉操業予測モデルを生成するモデル生成部と、
を有することを特徴とする高炉操業用機械学習装置。
【請求項7】
高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一する変換ステップと、
高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択ステップと、
前記データ種別選択ステップで選択した説明変数に対応する高炉の操業データと前記目的変数に対応する高炉の操業データとを教師データとして機械学習により高炉操業予測モデルを生成するモデル生成ステップと、
をコンピュータに実行させることを特徴とする高炉操業用機械学習装置に用いられるプログラム。
【請求項8】
高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一する変換工程と、
高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択工程と、
前記データ種別選択工程で選択した説明変数に対応する高炉の操業データと前記目的変数に対応する高炉の操業データとを教師データとして機械学習により高炉操業予測モデルを生成するモデル生成工程と、
を有することを特徴とする高炉操業予測モデルの生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、高炉操業用の機械学習装置等に関するものである。
【背景技術】
【0002】
高炉の操業を予測・制御するシステムとして、物理モデルを利用したシステム(例えば、非定常モデルを用いて溶銑温度を予測するシステム)が知られている。この物理モデルを利用した予測システムは、境界条件が明確である場合には高い予測精度が得られるが、境界条件が不明な場合(例えば、原燃料の成分が不明の場合、炉内における充填層の充填状況が不明な場合が該当する)には予測精度が低下する。
【0003】
また、別の予測システムとして、ルールによって表現された知識ベースに基づき予測を行うエキスパートモデルが知られている。エキスパートモデルの場合、ルール作成時から時間が経過して操業条件が変化している場合には、ルールの見直しが必要となる。
【0004】
これらの問題点の解決方法として、直近の過去データから類似例を検索し、類似例に対して局所統計モデルを生成することにより、将来予測を行う方法が知られている。しかしながら、このモデルには、従来とは異なる操業状況で操業した時の予測が難しいことや、局所統計モデルの精度を保証するだけの十分な過去類似例が蓄積されていない場合には、予測精度が低下する問題があった。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2017-095761号公報
【特許文献2】特開2018-193579号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明者等は、高炉のプロセスコンピュータが日々蓄積する操業データに着目し、これらの操業データを教師データとした機械学習により高炉操業の予測モデルを生成する方法を検討した。しかしながら、高炉の操業データは、必ずしも正規分布ではなく、偏った分布を呈するものも多い。機械学習に基づくモデルは、教師データを正規分布で仮定したものが多く、非正規分布の操業データを教師データとして選択すると、予測精度が低下する。そこで、本発明は、予測精度の高い高炉操業予測モデル等を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明に係る高炉操業用機械学習装置は、高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一するデータ事前処理部と、高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択部と、選択した説明変数に対応する高炉の操業データと目的変数に対応する高炉の操業データとを教師データとした機械学習を行うことで高炉操業予測モデルを生成するモデル生成部と、を有することを特徴とする。
【0008】
(2)前記データ事前処理部は、非正規分布データを正規分布データに変換する前に、各操業データに含まれる外れ値を除去する除去処理を行うことを特徴とする上記(1)に記載の高炉操業用機械学習装置。
【0009】
(3)前記データ事前処理部は、下記の式(1)に基づくHampel Identifiere法にしたがって前記の除去処理を行うことを特徴とする上記(2)に記載の高炉操業用機械学習装置。
median(xi)±cMAD(xi)・・・・・・・・式(1)
ただし、MAD(xi)=median(|xi-median(xi)|)であり、medianは中央値であり、cは3以上5以下(ただし、整数に限らない)の範囲から選ばれるパラメータである。
【0010】
(4)前記データ種別選択部は、高炉の操業データに取得タイミングが互いに異なる同種の操業データが含まれている場合に、これらの操業データのデータ種別を互いに異なるデータ種別として説明変数の選択を行うことを特徴とする上記(1)乃至(3)のうちいずれか一つに記載の高炉操業用機械学習装置。
【0011】
(5)上記(1)乃至(4)のうちいずれか一つ高炉操業用機械学習装置を用いて高炉の操業状態を予測し、この予測結果に基づくアクションを実行することにより高炉を操業することを特徴とする高炉の操業方法。
【0012】
(6)上記(5)に記載のアクションを実施した後に得られる高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一するデータ事前処理部と、高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択部と、選択した説明変数に対応する高炉の操業データと目的変数に対応する高炉の操業データとを教師データとした機械学習を行うことで高炉操業予測モデルを生成するモデル生成部と、を有することを特徴とする高炉操業用機械学習装置。
【0013】
(7)高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一する変換ステップと、高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択ステップと、前記データ種別選択ステップで選択した説明変数に対応する高炉の操業データと前記目的変数に対応する高炉の操業データとを教師データとして機械学習により高炉操業予測モデルを生成するモデル生成ステップと、をコンピュータに実行させることを特徴とする高炉操業用機械学習装置に用いられるプログラム。
【0014】
(8)高炉の操業データのうち、歪度が歪度閾値を超える非正規分布データを正規分布データに変換することにより、前記の高炉の操業データを正規分布データに統一する変換工程と、高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択するデータ種別選択工程と、前記データ種別選択工程で選択した説明変数に対応する高炉の操業データと前記目的変数に対応する高炉の操業データとを教師データとして機械学習により高炉操業予測モデルを生成するモデル生成工程と、を有することを特徴とする高炉操業予測モデルの生成方法。
【発明の効果】
【0015】
本発明によれば、予測精度の高い高炉操業予測モデルを提供することができる。
【図面の簡単な説明】
【0016】
【
図1】高炉操業用機械学習装置のブロック図である。
【
図2】高炉操業予測モデルの構築方法等を説明するためのフローチャートである。
【
図5】異なるパラメータcで溶銑温度の予測を行ったときの相対RMSEである。
【
図6】ソリューションロスカーボン量の頻度分布である。
【
図7】一定期間に取得した全ての操業データの歪度の頻度分布である。
【
図10】歪度閾値と相対RMSEとの関係図である。
【
図11】微粉炭吹込み量の変化量と溶銑温度の変化の関係図である。
【
図12】各比較例及び実施例の溶銑温度の予測値の相対RMSEである。
【
図13】各比較例及び実施例のコークス比の変動係数である。
【発明を実施するための形態】
【0017】
図1は、本実施形態の高炉操業用機械学習装置のブロック図である。同図を参照して、高炉操業用機械学習装置1は、データ事前処理部10、データ種別選択部20、学習モデル生成部30及び記憶媒体40を含み、高炉2から取得した操業データに対して所定のデータ処理を施した後、高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択し、この選択した説明変数に対応する高炉の操業データと目的変数に対応する高炉の操業データを教師データとする機械学習を行うことにより予測精度の高い高炉操業予測モデルを構築する。高炉操業予測モデルの構築方法について、
図2のフローチャートを参照しながら詳細に説明する。
【0018】
(ステップS1:データの前処理)
ステップS1において、データ事前処理部10は、高炉2から取得した操業データの事前処理を行う。操業データの事前処理には、外れ値除去、補間処理(ステップS1-1)と正規分布化処理(ステップS1-2)とが含まれる。ただし、ステップS1―1は、省略することもできる。この場合、取得した操業データの処理フローは、ステップS2から開始される。
【0019】
(ステップS1-1:外れ値除去及び補間処理)
高炉の操業データは、高炉の操業中(休風中を含む)に高炉から取得される情報及び当該取得した情報から算出される情報が含まれる。高炉の操業データには、様々な理由(例えば、システムの不具合)でデータが欠損したり、外れ値が存在したりする。操業データの中に外れ値が含まれていたり、操業データの一部が欠損していたりする場合には、教師データの選択、予測モデルによる予測精度に影響が及ぶ。したがって、所定の条件にしたがって、外れ値を取り除いたり(「外れ値除去」に相当する)、欠損している操業データの一部を補間したりする(「補間処理」に相当する)ことが望ましい。所定の条件については、後述する。
【0020】
ここで、操業データには、例えば高炉の操業条件、装入原燃料条件、出銑滓データ、センサデータ、ソリューションロスカーボン、羽口上熱バランス等のデータが含まれる。
高炉の操業条件には、羽口からの送風量、羽口から吹き込む酸素富化空気の酸素富化率(酸素富化率:(送風中酸素量+富化酸素量)/(送風量)×100-送風中酸素濃度(%))、羽口から吹き込まれるガスの送風温度、羽口から吹き込まれるガスの送風圧力、微粉炭の吹込み量、炉頂圧力等が含まれる。
装入原燃料条件には、高炉原料の装入量、高炉原料の成分等が含まれる。高炉原料には、鉱石層の形成に用いられる鉱石層装入原料、コークス層の形成に用いられるコークス層装入原料が含まれる。鉱石層装入原料には、焼結鉱、ペレット、塊鉱石、非焼成含炭塊成鉱が含まれる。また、鉱石層装入原料には、鉱石以外のもの(例えば小塊コークス等の還元補助材)が含まれていてもよい。コークス層装入原料には、フェローコークスが含まれていてもよい。
出銑滓とは高炉の出銑口から取り出された高温溶融物のことであり、出銑滓データには、溶銑排出量、溶銑温度、溶銑成分、滓排出量、滓成分等が含まれる。
センサデータとは、高炉に備え付けられたセンサから直接検出されるデータのことであり、炉頂ガスの温度データ、炉頂ガス成分(CO、CO2、N2、H2等)の分析データ、ステーブの温度データ、炉底側壁温度の温度データ、炉底温度の温度データ、シャフト圧力のデータ等が含まれる。
羽口上熱バランスとは、所定のインプット熱量(羽口から吹込むガスの送風顕熱、炉内で燃焼するカーボンの燃焼熱)と所定のアウトプット熱量(羽口から吹込むガスの送風湿分の分解熱、直接還元反応及びソリューションロス反応による反応熱)との差分であり、炉内の熱バランスを逐次評価するための指標である。
【0021】
外れ値を除去する処理は、例えば「Hampel Identifiere法」等を用いて行うことができる。以下の式(1)は「Hampel Identifiere法」において、外れ値を除去するために用いられる式である。
【数1】
ただし、MAD(x
i)=median(|x
i-median(x
i)|)であり、medianは中央値であり、cは3以上5以下(ただし、整数に限らない。以下、同様である)の範囲から選ばれるパラメータである。
「Hampel Identifiere法」では、「median(x
i)-cMAD(x
i)」~「median(x
i)+cMAD(x
i)」の範囲から外れた値を、「外れ値」として扱う。
【0022】
式(1)から明らかなように、パラメータcは外れ値の決定に関わる重要なパラメータであり、本発明者等は、このパラメータcを所定範囲に設定することにより、予測精度が向上することを知見した。所定範囲は、好ましくは、3以上5以下(以下、「好ましい範囲」ともいう)である。頻度が比較的少ない操業状態を予測することを主目的とする場合には、パラメータcは相対的に大きく設定する必要があり、比較的安定した操業状態を予測することを主目的とする場合には、パラメータcを相対的に小さく設定する必要がある。
【0023】
外れ値を除去することによって高炉の操業データの一部が欠損した場合には、補間処理を行うことが望ましい。欠損した操業データの補間処理の手法は特に限定しないが、例えば、前回値や前後値の平均値を用いて補間する方法、前後値に基づく線形補間等の手法を用いることができる。
【0024】
なお、「Hampel Identifiere法」は、上述の通り平均値ではなく中央値からの「外れ度合い」に基づき外れ値であるかどうかを判別する方法であるため、必ずしも正規分布に従わないデータであっても、外れ値を判別することができる。この点において「Hampel Identifiere法」は、高炉の操業データを処理する手段として優れている。
【0025】
パラメータcの決定方法について、具体例を示しながら、より詳細に説明する。
図3は、所定の操業条件で操業する高炉(炉容積:5000m
3級)から取得した炉頂COガス利用率(%)(以下、「ηCO」という)の頻度分布である。頻度は、相対頻度で表わしている。相対頻度は、それぞれの区間の頻度を全ての区間の頻度の総和で除したものである。相対頻度の定義は、
図4、
図6~
図9も同様である。所定の操業条件は、還元材比:500kg/pig-t、コークス比:330kg/pig-t、出銑比:2.2である。横軸がηCOであり、縦軸が相対頻度である。なお、高炉操業において、ηCOが外れ値となる頻度は少ないため、縦軸は対数で表示している。パラメータcを2~6の範囲で変化させたときの外れ値の閾値を同図から看取することができる。すなわち、縦軸に平行に延びる点線と横軸との交点が、それぞれのパラメータcに対応する外れ値の閾値となる。例えば、パラメータcを2に設定した場合、c=2に対応する一対の点線によって挟まれた領域の外側(矢印で示している)の数値が外れ値と判別される。
【0026】
ただし、パラメータcを2に設定すると、約20%のデータが外れ値に分類され、外れ値の閾値が過度に大きくなる。また、パラメータcを6に設定すると、外れ値に分類されるデータが僅か0.3%程度になり、看過できない外れ値を見逃す可能性がある。したがって、上述の通り、パラメータcは3以上5以下が好ましく、基本的にはパラメータcを「好ましい範囲」の中間値である4に設定することが考えられる。
【0027】
ただし、予測する領域に応じて、以下の考え方に基づきパラメータcを「好ましい範囲」の中で変化させることができる。具体的には中央値近傍の予測を行う場合には、パラメータcの値を3程度に設定することにより、概ね頻度が90%以上のデータを正常値として扱うことができる。頻度が比較的少ない操業状態の予測精度を向上させたい場合には、パラメータcを5程度に設定することが望ましい。これにより、頻度が0.3%~1%程度の頻度が比較的少ない操業データも利用することができる。このように、「好ましい範囲」の中で予測目的に応じて適切にパラメータcを設定することにより、予測精度を向上させることができる。
【0028】
図4は、高炉(炉容積:5000m
3級)から取得した溶銑温度(℃)の頻度分布であり、操業条件は
図3と同じである。横軸が溶銑温度であり、縦軸が相対頻度である。なお、高炉操業において、溶銑温度が外れ値となる頻度は少ないため、縦軸は対数で表示している。パラメータcを2~6で変化させたときの外れ値の閾値を同図から看取することができる。この点については、
図3のηCOの場合と同様である。
【0029】
パラメータcを2に設定すると、約20%の操業データが外れ値に分類され、外れ値の閾値が過度に大きくなる。また、パラメータcを6に設定すると、外れ値に分類される操業データが僅か0.3%程度になり、看過できない外れ値を見逃す可能性がある。したがって、ηCOの場合と同様に、パラメータcは3以上5以下が好ましく、基本的にはパラメータcを「好ましい範囲」の中間値である4に設定することが考えられる。ηCOの場合と同様に、予測目的に応じて、パラメータcを「好ましい範囲」の中で変えることができるが、この点については説明を繰り返さない。
【0030】
パラメータcの値を変えて、溶銑温度の予測を行ったときの相対RMSEを
図5に示す。
図5は、横軸がパラメータcであり、縦軸が相対RMSEである。「RMSE」は予測誤差の指標であり、平均平方二乗誤差とも称される。相対RMSEは、基準となるRMSE(
図5ではc=2の時のRMSEであり、
図10では頻度閾値が0の時のRMSE)を1として規格化したものである。RMSEの一般式については後述する。相対RMSEが小さくなると、予測精度が向上する。同図から、パラメータcを4近傍に設定したときに、相対RMSEが最小となり、予測精度が最も高くなることがわかる。
【0031】
図6は、高炉(炉容積:5000m
3級)から取得したソリューションロスカーボン量(kg/pt)の頻度分布であり、操業条件は
図3と同じである。横軸がソリューションロスカーボン量(kg/pt)、縦軸が相対頻度である。なお、高炉操業において、ソリューションロスカーボン量が外れ値となる頻度は少ないため、縦軸は対数で表示している。高炉では羽口から吹き込まれたガスによりコークスや微粉炭が燃焼してCOガスが発生し、この発生したCOガスが炉内上昇中に鉄原料を還元することによりCO
2ガスが生成される。そして、この生成されたCO
2ガスが炉内のコークスと反応して再度COガスに戻る現象が起こる。この再度生成されたCOガスは、鉄原料の還元に用いられずに炉外に排出される場合があり、本明細書では、このCOガスに含まれるカーボンの量をソリューションロスカーボン量と定義する。ソリューションロスカーボン量の単位は上述の通り「kg/tp」であり、出銑量1トン当たりのカーボン量で表すことができる。
【0032】
パラメータcを2~6で変化させたときの外れ値の閾値を同図から看取することができる。すなわち、縦軸に平行に延びる点線と横軸との交点が、それぞれのパラメータcにおける外れ値の閾値である。
【0033】
パラメータcを2に設定すると、約20%のデータが外れ値に分類され、外れ値の閾値が過度に大きくなる。また、パラメータcを6に設定すると、外れ値に分類されるデータが僅か0.3%程度になり、看過できない外れ値を見逃す可能性がある。したがって、ηCOの場合と同様に、パラメータcは3以上5以下が好ましく、基本的にはパラメータcを「好ましい範囲」の中間値である4に設定することが考えられる。ηCOの場合と同様に、予測目的に応じて、パラメータcを「好ましい範囲」の中で変えることができるが、この点については説明を繰り返さない。
【0034】
このように、パラメータcの「好ましい範囲」は、異なる種類の操業データであっても3以上5以下であるため、全ての操業データについて同じ値のパラメータcを設定することができる。ただし、処理は煩雑となるが、操業データの種類に応じて異なるパラメータcを設定することもできる。
【0035】
(ステップS1-2:正規分布化処理)
上述の通り、高炉の操業データには、必ずしも正規分布ではなく偏った分布を呈するものも多い。高炉操業予測モデルは、機械学習用の教師データとして用いる操業データを正規分布で仮定したものが多く、非正規分布のデータを用いると、適切なモデルの構築(所望の予測精度を満足するモデルの構築)ができない。そこで、本ステップS1-2では、非正規分布を正規分布に変換する処理(変換工程及び変換ステップに相当する)を行う。なお、正規分布を用いて学習モデルを構築したほうが、予測精度が向上することは技術常識である。なお、正規分布に従う操業データについては、正規分布化処理が不要であることはいうまでもない。
【0036】
具体的には、データ事前処理部10は、取得した高炉の操業データのうち、歪度の絶対値が閾値(以下、歪度閾値ともいう)よりも大きいか否かを判別する。歪度の絶対値が歪度閾値を超える場合には、当該操業データを正規分布に近づける処理(以下、正規分布化処理ともいう)を行う。正規分布化処理には、例えば「Box-Cox変換」、「Yeo-Johson変換」等を用いることができる。「Box-Cox変換」及び「Yeo-Johson変換」それぞの一般式を数(2)及び数(3)に示す。
【数2】
【数3】
【0037】
図7は、一定期間に取得した全ての操業データの歪度の頻度分布である。この頻度分布から明らかなように、歪度が0に近い(つまり、分布が正規分布に近い)操業データもあれば、歪度の絶対値が0から離れている(つまり、非正規分布)操業データもある。
図8は炉頂平均温度(℃)の頻度分布であり、横軸が炉頂平均温度(℃)であり、縦軸が頻度である。炉頂平均温度(℃)の場合、歪度の絶対値が0.01であり、概ね正規分布に従っているため、正規分布化処理を行う必要がない。
図9は高炉熱負荷(kW)の頻度分布であり、横軸が高炉熱負荷(kW)であり、縦軸が頻度である。高炉熱負荷(kW)の場合、歪度の絶対値が0.53であり、分布の偏りが大きいため、正規分布化処理を行うことが望ましい。
【0038】
正規分布化処理を行うべきか否かの判断基準となる「歪度閾値」の設定方法について、具体例を示しながら詳細に説明する。溶銑温度の予測結果に関して、歪度閾値を変化させながら歪度閾値と相対RMSEとの関係を
図10に示した。RMSEの一般式を以下に示す。
【数4】
ただし、nは溶銑温度のデータ総数であり、yiは溶銑温度の測定値、fiは溶銑温度の予測値のデータである。
【0039】
同図に示すように、歪度閾値が0.35~0.4程度に達すると急激に相対RMSEが増大する。したがって、このデータについては、歪度閾値を0.35~0.4の範囲で適宜(例えば0.38)設定すればよい。歪度閾値は操業データの種類によって異なるものであり、一意に定まるものではない。
【0040】
(ステップS2:説明変数の選択)
ステップS1を実施することにより、取得した操業データが全て正規分布データに統一され、多数の正規分布データからなる正規分布データ群を取得することができる。この正規分布データ群には、正規分布化処理が不要と判別された操業データ(つまり、元々正規分布にしたがっている操業データ)も含まれていることは上述の通りである。
【0041】
ステップS2において、データ種別選択部20は、高炉の操業データに含まれる個々の操業データのデータ種別に基づいて、予め定められた目的変数に対応した説明変数を選択する(選択ステップ及び選択工程に相当する)。ここで、データ種別とは、各操業データのカテゴリーのことであり、操業データそのものを表す数値とは異なる概念である。したがって、本明細書における説明変数及び目的変数はいずれも操業データのカテゴリーを意味する。例えば、ユーザが目的変数として「微粉炭比」というデータ種(カテゴリー)を設定した場合、データ種別選択部20は、この「微粉炭比」に対応する説明変数として「微粉炭吹込み量」というデータ種(カテゴリー)を選択することができる。ここで、説明変数を選択する際に、経時的要素も考慮することができる。すなわち、取得タイミングが互いに異なる操業データはデータ種別としては異なるものとして扱うことができる。例えば、「〇時~△時の微粉炭吹込み量」と「△時~×時の微粉炭吹込み量」は互いに異なるデータ種であり、それぞれ独立した説明変数として扱うことができるため、これらが同時に説明変数として選択されることもあり得る。
【0042】
説明変数を選択するに際して、目的変数を説明するのに有意かつ独立した説明変数を自動で選択する(自動選択方法)ことができる。自動選択方法には、例えば公知のRandom Forest (RF)、LASSO法、EN法など用いることができる。
Random Forest (RF):Random Forest (RF)の変数の重要度に基づき変数選択を行う手法であり、RFを実行した後の変数の重要度が大きい変数を選択する。
LASSO法:LASSOは「Least Absolute Shrinkage and Selection Operator 」の略語であり、この方法ではモデルに寄与しない変数の標準回帰係数の値が0になりやすいため、標準回帰係数の値が0でない変数のみ選択する。
EN法:ENは「Elastic Net」の略語であり、LASSO法と同様に標準回帰係数の値が0になりやすい。したがって、0でない変数を選択する。
【0043】
(ステップS3:高炉操業予測モデルの構築)
学習モデル生成部30は、ステップS2で選択した説明変数に対応する操業データと予め定められた目的変数に対応する操業データとを教師データとした教師あり機械学習によって高炉操業予測モデル(言い換えると、ニューラルネットワーク)を生成する。これらの操業データは、上述した正規分布データ群から選ばれることは言うまでもない。機械学習とは、所定のデータを入力とすることで所定のデータ分析手法に基づいた予測を実現する人工知能(AI)技術の一つである。データ分析手法とは、データを分析するための分析アルゴリズムを指す。したがって、高炉操業予測モデルは、ユーザが予め定めた目的変数毎に生成され、それぞれの目的変数に応じた分析アルゴリズムに沿って、機械学習技術を用いた高炉操業予測モデルが生成される。生成した高炉操業予測モデルは、適宜チューニングすることができる。以下、チューニング方法について、説明する。教師データとして選択した操業データとは時系列の異なる同種の操業データを入力値及び実績値と定義する。そして、この入力値から高炉操業予測モデルに基づく予測値を求め、この予測値と実績値との差が所定誤差以上ある場合には、高炉予測モデルのチューニングが行われる。チューニングとは、例えばハイパーパラメータを調整することである。ハイパーパラメータは、例えばオープンソースとして公開された種々の方法を用いて調整することができる。
【0044】
この時系列性を考慮する手法として、以下の2つの方法が考えられる。1つ目は、過去数時間(例えば、8時間)前までのデータを別の変数と扱い、最適な教師データを選択する方法である。2つ目は、ニューラルネットワークを構築する際に教師データとして、過去の時系列情報(例えば1時間~8時間前)の情報も導入し、RNN(Recurrent Neural Network)構造として、ニューラルネットワークを構築する方法である。時系列情報とは、操業データを取得した時間のことである。これらの2つの方法のうちいずれか一方を用いて、時系列性を考慮することができる。
【0045】
ニューラルネットワークを構築する際に、以下の方法(公知の方法)によって、過学習を回避してもよい。すなわち、ニューラルネットワークの重み係数が説明変数より多くなると過学習となるため、適宜重み係数ネットを消去する。これにより、過学習が避けられ、かつニューラルネットワークの重み係数の計算が軽減される。例えば、ドロップアウト、忘却付き構造学習を適用することによって、過学習を避けることができる。
【0046】
消去する係数ネットの選択は、例えば、ブートストラップ-LASSO法により、係数が0となる頻度の高い変数を選択して、その結合係数を0にする手法を用いることができる。これによって、過学習が避けられ、より効率的に学習モデルを構築することができる。なお、消去する係数ネットの選択をランダムに行う方法を採用してもよい。
【0047】
(ステップS4:アクション決定モデルの構築)
ステップS3を実施することにより、高炉操業予測モデルが構築される。この高炉操業予測モデルを用いることによって、高炉の操業状態(例えば、溶銑温度の変化等)を予測することができる。溶銑温度の変化を予測することにより、
図11に図示するように、溶銑温度の変化と微粉炭吹込み量の変化量との関係情報を作成することができる。
図11の縦軸が溶銑温度の変化であり、横軸が微粉炭吹込み量の変化量である。微粉炭吹込み量の変化量は、過去の操業実績から導出できる。高炉の操業を監視する作業者は、
図11の関係に基づき適切な吹込み量を決定し、高炉の操業を行うことができる。
【0048】
図11に示すように、溶銑温度の変化と微粉炭吹込み量の変化量との間には概ね正の相関があるが、溶銑温度の変化に対して操業アクションを一意に決定するのは難しい。そこで、溶銑温度の変化に対するアクションを種々変化させて微粉炭吹込みのアクションを最適化するための最適アクション決定モデルを強化学習により構築し、構築した最適アクション決定モデルを用いて最適なアクションを決定してもよい。最適アクション決定モデルの構築は、学習モデル生成部30が行ってもよい。
【0049】
ここで、強化学習とは、状態(State)Sの時に、戦略(Policy)n(s)にしたがって、行動(Actions) A (s)を実行することであり、その際に報酬(Reward)R(s)が最大となるように戦略を決定することである。高炉操業において、状態Sは現在の操業状態のことであり、例えば溶銑温度が低下している等の操業状態が含まれる。なお、状態Sを監視するために、溶銑温度を常に監視していることは言うまでもない。行動A (s)とは、操業状態の変化に対応して起こすアクションであり、例えば、溶銑温度が低下している場合には、増加させるべき微粉炭の吹込み量を決定することに対応する。報酬は、例えば予測した溶銑温度と、実際のアクション後の結果である溶銑温度の差から決定することができる。
例えば、溶銑温度を目的変数として予め定めたときには、溶銑温度の予測値とアクション後の結果の差が0の時を1とし、目標変数の分布の1σ相当となったときを報酬が0として例えば線形補完し、それ以下であればマイナスの値としてもよい。
【0050】
そのうえで、一定期間、溶銑温度が目標値から外れた時に、吹込み量を種々調整した微粉炭吹込みアクションを試行し、その後は報酬の期待値の高いアクション(微粉炭の吹込み量の決定)を実施する。強化学習により最適アクション決定モデルを構築する場合には、モデルパラメータの更新のためには多いほうがよく、6か月程度は要する。その後は、逐次パラメータの更新を行うことにより、目的変数とアクションの対応関係の精度を向上させることにより、目的変数の制御性を向上させることができる。また制御因子や制御目的が複数ある場合には、戦略(Policy)、行動(Actions)A(s)、報酬(Reward)R(s)をテンソルとすることにより、モデル構築が可能となる。なお、ステップS4を実行する際に、操業データを記憶しておくことが望ましい。
【0051】
(ステップS5:予測モデルの再構築)
アクション決定モデル(ステップS4)に基づいて決定された最適アクションを用いて高炉操業を行うことによって取得された操業データは、過去の操業データ(ステップS1で用いた操業データ)に比べて、外れ値が少ない。したがって、このような操業データを用いてステップS1~S3を実行し、再度予測モデルを構築することとしてもよい。また、予測モデルを再構築するだけでなく、ステップS3で構築した予測モデルに対して、ステップS4で記録した新たな操業データを教師データとして教師あり学習を再度実行することによって、構築済の予測モデルをチューニングしてもよい。
【0052】
ステップS1~S5で説明した処理は、プログラムによって実現することができる。すなわち、各種処理を実現するために予め用意されたプログラムが記憶媒体40に格納され、CPU等のコンピュータが記憶媒体40に格納された当該プログラムを実行することで、実現することができる。
【実施例0053】
実施例を示しながら本発明について具体的に説明する。以下の比較例1~3及び実施例1を実施して、溶銑温度の予測値の相対RMSEと、コークス比の変動係数とを評価した。評価結果を
図12及び
図13に示した。
【0054】
(比較例1)
従来の知識ベースによる溶銑温度予測に基づき、オペレータが推定した結果に基づいて最適アクション(吹込み量)を決定した。内容積5000m3クラスの高炉で、還元材比約500kg/t、コークス比約340kg/t、出銑比約2.0の操業条件下での操業を比較のベースとした。この操業では、高炉操業のオペレータが、知識ベースのガイダンスシステムが指示する溶銑温度の予測値に従って、作業標準に基づき微粉炭吹込み量を調整することにより、溶銑温度を目標値に近づける操業を行った。
【0055】
(比較例2)
ステップS1をスキップして(言い換えると、外れ値の除去及び正規分布化処理をせずに)ステップS2及びS3のみで構築した予測モデルを用いて溶銑温度を推定した。オペレータが最適アクション(吹込み量)を決定した。従来の操業をベースに、ニューラルネットワークによる予測モデルを用いて、溶銑温度を予測し、その予測値に従って、作業標準に基づき微粉炭吹込み量を調整することにより、溶銑温度を目標値に制御するように操業した。
【0056】
(比較例3)
ステップS1~S3のうちステップS1の「正規分布化処理」を除いて予測モデルを構築した。ニューラルネットワーク予測モデルによる比較例2の操業をベースに、ニューラルネットワークによる予測モデルに外れ値処理機能を追加したモデルを用いて、溶銑温度を予測し、その予測値に従って、作業標準に基づき微粉炭吹込み量を調整することにより、溶銑温度を目標値に制御するような操業を行った。ただし、本モデルの実施時には、分布の正規分布化処理を行う機能は組み込まなかった。
【0057】
(実施例1)
ステップS3で構築した予測モデルに、正規分布化処理機能を追加した。ニューラルネットワーク予測モデルによる比較例3の操業をベースに、ニューラルネットワークによる予測モデルに外れ値処理機能と分布の正規分布化処理機能を追加したモデルを用いて、溶銑温度を予測し、その予測値に従って、作業標準に基づき微粉炭吹込み量を調整することにより、溶銑温度を目標値に制御するような操業を行った。
図12及び
図13に示す通り、溶銑温度の予測値の相対RMSEの低減と、コークス比の変動係数のより一層の低減を実現することができた。