(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024173466
(43)【公開日】2024-12-12
(54)【発明の名称】連続鋳造機の制御方法
(51)【国際特許分類】
B22D 46/00 20060101AFI20241205BHJP
B22D 11/16 20060101ALI20241205BHJP
【FI】
B22D46/00
B22D11/16 104B
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2023091905
(22)【出願日】2023-06-02
(71)【出願人】
【識別番号】000006655
【氏名又は名称】日本製鉄株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】關 翼人
【テーマコード(参考)】
4E004
【Fターム(参考)】
4E004MA05
4E004NC01
4E004PA07
(57)【要約】
【課題】連続鋳造機を用いて連続鋳造を行ったときに得られる実績データを利用して、連続鋳造機の制御に必要な未来の情報を予測できるようにする。
【解決手段】連続鋳造機の制御方法は、第1の時刻(t’)における観測量(X
t’)を特徴量(Z
t’)に変換する第1の状態推定モデルE(・)と、観測量(X
t’)と第1の時刻における操作量(a
t’)と第2の時刻(t’+p)における観測量(X
t’+p)とに基づき状態遷移モデル(F
1(・))を構築する状態遷移モデル推定ステップと、第3の時刻(t)における観測量(X
t)を取得する観測量取得ステップと、状態遷移モデルと観測量(X
t)と任意の操作量(a)とに基づき、第4の時刻(t+p)の状況に起因する目的値の推定値(Y
t+p)を算出し、推定値(Y
t+p)に基づいて連続鋳造機を制御する制御ステップと、を有する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
連続鋳造機を制御する制御方法であって、
前記連続鋳造機の鋳型上の複数箇所の温度を観測量として、
過去の第1の時刻における観測量を第1の時刻における特徴量に変換する第1の状態推定モデルと、第1の時刻における特徴量を第1の時刻の状況に起因する目的値に変換する第2の状態推定モデルが既知である場合に、
第1の時刻における観測量と、第1の時刻における操作量と、第1の時刻から所定の時間が経過した過去の第2の時刻における観測量とに基づき、状態遷移モデルを構築する、状態遷移モデル推定ステップと、
過去又は現在の時刻である第3の時刻における観測量を取得する観測量取得ステップと、
前記状態遷移モデルと、第3の時刻における観測量と、任意の操作量とに基づき、第3の時刻から前記所定の時間が経過した将来の第4の時刻の状況に起因する目的値の推定値を算出し、算出した第4の時刻の状況に起因する目的値の推定値に基づいて、前記連続鋳造機を制御する、制御ステップと、
を有する、連続鋳造機の制御方法。
【請求項2】
前記状態遷移モデル推定ステップは、
第2の時刻における観測量と、
第1の時刻における観測量及び第1の時刻における操作量を学習前の第1の状態遷移モデルに適用することで得られた第2の時刻における観測量の計算値と、
の差が最小となるように、学習前の第1の状態遷移モデルを最適化することで、第1状態遷移モデルを構築し、
前記制御ステップは、
前記第1状態遷移モデルに、第3の時刻における観測量及び任意の操作量を適用することで、第4の時刻における観測量の推定値を算出し、
算出した観測量の推定値に、前記第1の状態推定モデルを適用し、更に、前記第2の状態推定モデルを適用することで、第4の時刻の状況に起因する目的値の推定値を算出し、
算出した第4の時刻の状況に起因する目的値の推定値に基づいて、前記連続鋳造機を制御する、請求項1に記載の連続鋳造機の制御方法。
【請求項3】
前記状態遷移モデル推定ステップは、
第2の時刻における観測量を第1の状態推定モデルに適用することで得られた第2の時刻における特徴量の計算値と、
第1の時刻における観測量を第1の状態推定モデルに適用して得られた第1の時刻における特徴量及び第1の時刻における操作量を、学習前の第2の状態遷移モデルに適用することで得られた第2の時刻における特徴量の計算値と、
の差が最小となるように、学習前の第2の状態遷移モデルを最適化することで、第2状態遷移モデルを構築し、
前記制御ステップは、
前記第2状態遷移モデルに、第3の時刻における観測量を第1の状態推定モデルに適用して得られた第3の時刻における特徴量及び任意の操作量を適用することで、第4の時刻における特徴量の推定値を算出し、
算出した第4の時刻の特徴量の推定値に、前記第2の状態推定モデルを適用することで、第4の時刻の状況に起因する目的値の推定値を算出し、
算出した第4の時刻の状況に起因する目的値の推定値に基づいて、前記連続鋳造機を制御する、請求項1に記載の連続鋳造機の制御方法。
【請求項4】
前記第1の時刻における特徴量及び前記第2の時刻における特徴量は、それぞれ、前記第1の時刻における観測量及び前記第2の時刻における観測量に比べて次元数が少なく、
前記第3の時刻における特徴量及び前記第4の時刻における特徴量は、それぞれ、前記第3の時刻における観測量及び前記第4の時刻における観測量に比べて次元数が少ない、請求項1~3のいずれか1項に記載の連続鋳造機の制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、連続鋳造機の制御方法に関する。
【背景技術】
【0002】
連続鋳造における鋳型内部の溶鋼流動状態は、鋳造する鋳片の品質に影響する。しかし、鋳型内の溶鋼流動状態を直接観測して操業することは困難である。そこで、観測可能な鋳型の温度分布から溶鋼流動状態や鋳片の品質を推定する各種技術が提案されている。例えば特許文献1~3には、鋳型温度分布パターンに基づく偏流状態認識と制御に関する技術について記載されている。また、特許文献4には、鋳型流動状態制御にデータ同化やシミュレーションを用い強化学習を用いた制御を行う技術について記載されている。また、特許文献5には、過去実績データとの乖離度や過去品質欠陥との類似度に基づく品質監視装置について記載されている。また、特許文献6には、3次元リアルタイム流動状態推定装置および過去の鋳片表面欠陥実績に基づく推定装置について記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020‐006424号公報
【特許文献2】特開2020‐171945号公報
【特許文献3】特開2021‐109203号公報
【特許文献4】特開2021‐102223号公報
【特許文献5】特開2018‐067051号公報
【特許文献6】特開2022‐014435号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
鋳片の品質(鋳型内の溶鋼流動状態)は、連続鋳造機の操業条件を調節することによって変化する。この操業条件をどう変えると鋳片の品質がどのように変化するのかを予め知っておくことができれば、鋳片の品質向上に大きく寄与することになる。しかしながら、特許文献1~3に記載された技術は、物理的な知見や強化学習(報酬の形式に縮約された時系列情報の活用)に基づくものであり、未来の溶鋼流動状態や鋳片の品質を予測することはできない。また、特許文献4に記載された技術は、予測までの全ての処理を強化学習というブラックボックス内で完結させてしまっているため解釈性が低く、精度の高い制御への適用が困難である。また、特許文献4に記載された技術は、物理モデルを用いており、連続鋳造機を用いて連続鋳造を行ったときに得られる実績データを利用するものではない。また、特許文献5、6に記載された技術は、判定結果を出力するだけにとどまるものであり、連続鋳造機を制御するためのものではない。
【0005】
そこで、本発明は、連続鋳造機を用いて連続鋳造を行ったときに得られる実績データを利用して、連続鋳造機の制御に必要な未来の情報を予測できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本発明の一態様に係る連続鋳造機の制御方法は、連続鋳造機を制御する制御方法であって、前記連続鋳造機の鋳型上の複数箇所の温度を観測量として、過去の第1の時刻における観測量を第1の時刻における特徴量に変換する第1の状態推定モデルと、第1の時刻における特徴量を第1の時刻の状況に起因する目的値に変換する第2の状態推定モデルが既知である場合に、第1の時刻における観測量と、第1の時刻における操作量と、第1の時刻から所定の時間が経過した過去の第2の時刻における観測量とに基づき、状態遷移モデルを構築する、状態遷移モデル推定ステップと、過去又は現在の時刻である第3の時刻における観測量を取得する観測量取得ステップと、前記状態遷移モデルと、第3の時刻における観測量と、任意の操作量とに基づき、第3の時刻から前記所定の時間が経過した将来の第4の時刻の状況に起因する目的値の推定値を算出し、算出した第4の時刻の状況に起因する目的値の推定値に基づいて、前記連続鋳造機を制御する、制御ステップと、を有する。
【0007】
また、本発明の第二態様に係る連続鋳造機の制御方法は、第一態様に係る連続鋳造機の制御方法において、前記状態遷移モデル推定ステップは、第2の時刻における観測量と、第1の時刻における観測量及び第1の時刻における操作量を学習前の第1の状態遷移モデルに適用することで得られた第2の時刻における観測量の計算値と、の差が最小となるように、学習前の第1の状態遷移モデルを最適化することで、第1状態遷移モデルを構築し、前記制御ステップは、前記第1状態遷移モデルに、第3の時刻における観測量及び任意の操作量を適用することで、第4の時刻における観測量の推定値を算出し、算出した観測量の推定値に、前記第1の状態推定モデルを適用し、更に、前記第2の状態推定モデルを適用することで、第4の時刻の状況に起因する目的値の推定値を算出し、算出した第4の時刻の状況に起因する目的値の推定値に基づいて、前記連続鋳造機を制御する。
【0008】
また、本発明の第三態様に係る連続鋳造機の制御方法は、第一態様に係る連続鋳造機の制御方法において、前記状態遷移モデル推定ステップは、第2の時刻における観測量を第1の状態推定モデルに適用することで得られた第2の時刻における特徴量の計算値と、第1の時刻における観測量を第1の状態推定モデルに適用して得られた第1の時刻における特徴量及び第1の時刻における操作量を、学習前の第2の状態遷移モデルに適用することで得られた第2の時刻における特徴量の計算値と、の差が最小となるように、学習前の第2の状態遷移モデルを最適化することで、第2状態遷移モデルを構築し、前記制御ステップは、前記第2状態遷移モデルに、第3の時刻における観測量を第1の状態推定モデルに適用して得られた第3の時刻における特徴量及び任意の操作量を適用することで、第4の時刻における特徴量の推定値を算出し、算出した第4の時刻の特徴量の推定値に、前記第2の状態推定モデルを適用することで、第4の時刻の状況に起因する目的値の推定値を算出し、算出した第4の時刻の状況に起因する目的値の推定値に基づいて、前記連続鋳造機を制御する。
【0009】
また、本発明の第四態様に係る連続鋳造機の制御方法は、第一~第三態様に係る連続鋳造機の制御方法において、前記第1の時刻における特徴量及び前記第2の時刻における特徴量は、それぞれ、前記第1の時刻における観測量及び前記第2の時刻における観測量に比べて次元数が少なく、前記第3の時刻における特徴量及び前記第4の時刻における特徴量は、それぞれ、前記第3の時刻における観測量及び前記第4の時刻における観測量に比べて次元数が少ない。
【発明の効果】
【0010】
本発明によれば、連続鋳造機を用いて連続鋳造を行ったときに得られる実績データを利用して、連続鋳造機の制御に必要な未来の情報を予測することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施形態に係る制御装置の構成を示す図である。
【
図2】本発明の第一実施形態に係る制御装置の処理の流れを示す概念図である。
【
図3】本発明の第一実施形態に係る制御装置の処理フローを示す図である。
【
図4】本発明の第二実施形態に係る制御装置の処理の流れを示す概念図である。
【
図5】本発明の第二実施形態に係る制御装置の処理フローを示す図である。
【発明を実施するための形態】
【0012】
<経緯>
まず、本発明の着想から課題解決に至るまでの経緯について説明する。
【0013】
溶鋼から鋼片を製造する連続鋳造機において溶鋼を連続的に凝固させて所定の断面形状の鋳片を作る工程では、タンディッシュ底部から鋳型に溶鋼が注がれる。鋳型は水冷されており、溶鋼は鋳型に接する外側から冷却されることによって微細な結晶からなる薄い凝固殻を作りはじめ、微細な結晶がつながりあって大きな樹枝状晶へと成長する。表面が凝固した状態の鋳片は鋳型底部から引き抜かれ、ローラーを用いて搬送されながら、さらに冷却されて完全に凝固する。
【0014】
鋳片の品質は、鋳型に注がれた溶鋼の流動状態(以下溶鋼流動状態)に左右されやすい。例えば、鋳型内湯面付近の幅方向溶鋼流速であるメニスカス流速がよどむ箇所、すなわちメニスカス流速が鋳型の幅方向において逆流している箇所では、流速が低下することで介在物や気泡の捕捉が起きるため、鋳片欠陥が発生しやすい。メニスカス流速の範囲と鋳片欠陥の関係性は、例えば「連鋳鋳片の大型介在物と柱状晶成長方向との関係」(岡野忍ら、「鉄と鋼」第61年第14号、2982-2990頁、1975年)などの研究によって明らかになっている。こうした研究により、鋳片欠陥が発生しにくいメニスカス流速の範囲についての知見が得られている。上記のようなメニスカス流速は鋳造中に直接計測することが困難であるが、凝固後鋳片の断面におけるデンドライト傾角から算出することができる。ただし、デンドライト傾角は鋳造後の鋳片を切断しなければ計測することができないためリアルタイムでの計測は困難である。また、実際上、連続鋳造で製造される大量の鋳片の中でデンドライト傾角を計測できるのはごく一部に限られる。
【0015】
一方、リアルタイムで、かつ大量に利用可能なデータとして、鋳型に複数設置された熱電対によって観測される鋳型温度分布がある。鋳型温度分布は、溶鋼の鋼種や鋳造速度による鋳型における抜熱量、すなわち溶鋼から鋳型に流れる単位時間当たりの熱量の違いや、溶鋼の流速による熱伝達係数の変動によって変化する。そこで、本発明の発明者らは、観測された鋳型温度分布とメニスカス流速との関係性を示す実績に基づいて、鋳型温度分布からメニスカス流速を予測するモデルを構築することを検討した。これによって、多変量解析に基づく異常検知手法または物理モデルに依存しない鋳型内の溶鋼流動の状態推定を実現できる。
【0016】
しかし、リアルタイムで大量に得られる鋳型温度分布データは、自動で蓄積される枠組みを利用することで、操業中に数多く取得できるのに対して、凝固後鋳片のデンドライト傾角から算出されるメニスカス流速の実績値のデータは、費用と時間をかけて取得するためデータ数が限られる。鋳型温度分布データは、鋳型に取り付ける熱電対の数を増やすことによって高次元化することが可能であるが、鋳型温度分布データの次元数に対して、メニスカス流速データとセットで利用できる鋳型温度分布データの数(次元数)が少ないと、過学習(過剰適合)によりモデルの予測精度向上には寄与しなくなることがある。この点に鑑み、発明者らは、メニスカス流速が観測されていない操業時の鋳型温度分布データを活用することを検討した。具体的には、予測モデルで取り扱うデータの次元数、即ち、特徴量の(種類の)数を、予測精度向上に寄与する特徴量だけに限定することで、取り扱うデータの次元を圧縮することを意図し、メニスカス流速が観測されていない操業時を含む鋳型温度分布から、当該鋳型温度分布に比べて次元数が少ない低次元特徴量を抽出するための第1の状態推定モデルE(・)を構築することを検討した。また、第1の状態推定モデルE(・)により抽出された低次元特徴量に基づいて、メニスカス流速のよどみの有無を推定する第2の状態推定モデルf(・)を構築することを検討した。
【0017】
任意の時刻tにおけるメニスカス流速のよどみ有無Ytを、同時刻tにおける鋳型温度分布(鋳型上の複数箇所の温度)Xtを用いて推定するモデルM(・)を下記数1のように定義する。下記数1において、Ytは、任意の時刻tにおける湯面付近の溶鋼流動によどみが存在する確率を示す0から1の範囲内の変数である。また、Xtは、鋳型に複数設置された各熱電対で観測された時刻tの各温度をベクトル化した多次元の変数である。
【0018】
(数1)
Yt=M(Xt)
【0019】
鋳型温度分布Xtは、鋳型内の溶鋼流動状態(潜在状態Stともいう)に応じて変動するが、ここでは、鋳型温度分布Xtを、溶鋼流動状態を定めるいくつかの要素(例えば、鋼種、鋳型幅、鋳造速度、溶鋼流速など)のうち、鋳型温度分布Xtに関係する(影響を与える)要素のみから構成される多次元の変数をSt|X(St|Y⊆St)で表す。また、よどみ有無Ytも鋳型内の溶鋼流動状態(潜在状態St)に応じて変動するが、ここでは、よどみ有無Ytを、よどみ有無Ytに関係する(影響を与える)要素のみから構成される多次元の変数をSt|Y(St|X⊆St)で表す。このとき、鋳型内の溶鋼流動状態(潜在状態St)は、因果モデルH(・)および観測モデルG(・)を用いて下記数2のように定義される。
【0020】
(数2)
Yt=H(St|Y)
Xt=G(St|X)
【0021】
すなわち、よどみ有無Ytは、よどみ有無Ytに関係する要素St|Yのみから因果モデルH(・)によって決定され、鋳型温度分布Xtは、鋳型温度分布Xtに関係する要素St|Xのみから観測モデルG(・)によって決定される。ただし、因果モデルH(・)および観測モデルG(・)は不明である。このため、ここでは、因果モデルH(・)および観測モデルG(・)を用いる代わりに、まず、St|Xに相当する特徴量であると期待される値Ztを鋳型温度分布Xtから推定する第1の状態推定モデルE(・)を構築する(Zt=E(Xt))。そして、下記数3のようになる第2の状態推定モデルf(・)を構築する。このとき、Ztを鋳型温度分布Xtに比べて次元数が少ない低次元特徴量とすることで、少ないデータセットでも過学習を起こさずに第2の状態推定モデルf(・)を構築することができる。
【0022】
(数3)
Yt=M(Xt)=f(Zt)
【0023】
また、発明者らは、第2の状態推定モデルf(・)の予測対象を、よどみの有無Ytに限らず、例えば鋳片表面のピンホールの有無等、溶鋼流動状態の変化に伴って生じる鋳型温度分布Xtに対応する事象全般に拡大することを考えた。
【0024】
[第1の状態推定モデル]
上記の経緯から得られた本実施形態に係る第1の状態推定モデルE(・)は、過去の複数時刻における実測の観測量Xtと、低次元特徴量Ztとの関係性に基づいて構築されている。これにより、第1の状態推定モデルE(・)は、任意の時刻における観測量Xtに基づいて、当該観測量Xtの低次元特徴量Ztを推定することができる。低次元特徴量Ztは、観測量Xtに比べて次元数が少ないデータである。
【0025】
第1の状態推定モデルE(・)としては様々なモデルが利用可能であるが、本実施形態では教師なし学習により構築された生成モデルを用いる。生成モデルとしては主成分分析(PCA)、非負値行列分解(NMF)およびオートエンコーダ(AE)など様々な手法を用いることができるが、本実施形態では非線形、または確率的な生成モデルの一つである変分オートエンコーダ(以下、VAE)を用いる。VAEは確率的な生成モデルであるため、鋼種や鋳造速度、溶鋼流速などによって定まる鋳型内の状態から、冗長性とノイズの影響を受けて各熱電対の観測量Xtが得られる過程をモデル化するのに適していると考えられる。このため、本実施形態に係る第1の状態推定モデルE(・)によって抽出された低次元特徴量Ztは、それぞれの次元(ベクトルである低次元特徴量Ztのそれぞれの要素)で独立であり、観測量Xtに関係する要素St|Xに相当した特徴量であると期待される。また、鋳型内における溶鋼流動は複雑であるため、熱電対の観測量Xtの間の関係性も非線形になることが想定されるが、VAEは非線形な生成モデルであるため、各熱電対の観測量Xtの間の非線形な関係性を考慮することが可能である。従って、非線形なVAEを用いることで少ない次元数で予測精度の高いモデルを構築することが期待される。VAEが非線形であることによって、鋳型における熱電対の配置を等間隔にする必要がなくなり、情報をより多く得たい領域で熱電対の密度を高くするなど自由に配置することもできる。
【0026】
具体的には、第1の状態推定モデルE(・)は、下記数4のように構築されたVAEのエンコーダE(・)である。このVAEのエンコーダE(・)は、観測量Xtが適用されると低次元特徴量Ztを出力するように構築されている。また、このVAEのデコーダD(・)は、低次元特徴量Ztが適用されると、再構成値Xtを出力するように構築されている。この再構成値Xtは、観測量Xtと同様に鋳型の温度分布を示す。
【0027】
(数4)
Zt=E(Xt)
Xt=D(Zt)
Xt+p=D(Zt+p)=D(E(Xt+p))
Yt=f(Zt)
【0028】
なお、低次元特徴量Ztの次元数が多くなるほど、鋳型内溶鋼流動を表す情報量が増え、正確な予測に寄与することになる。一方、低次元特徴量Ztの次元数が多くなるほど、第2の状態推定モデルf(・)の学習に必要なデータ数が増えて第2の状態推定モデルf(・)の構築が困難になるという問題が顕在化してくる。すなわち、低次元特徴量Ztの次元数(予測の正確さ)と、第2の状態推定モデルf(・)の構築のし易さとは、トレードオフの関係にある。このため、低次元特徴量Ztの次元数は、学習・予測を行う際の調整対象(パラメータ)であると言える。
【0029】
[第2の状態推定モデル]
また、上記の経緯から得られた第2の状態推定モデルf(・)は、過去の複数時刻における複数の低次元特徴量Ztと、各時刻の状況に起因する目的値Ytとの関係性に基づいて構築されている。これにより、第2の状態推定モデルf(・)は、任意の時刻tにおける低次元特徴量Ztに基づいて、同時刻の状況に起因する目的値Ytを推定することができる。
【0030】
第2の状態推定モデルf(・)には、任意のロジスティック回帰モデルを利用可能であるが、例えばラッソ回帰(LASSO)またはランダムフォレスト(RF)を用いることができる。上記の通り、学習に用いることのできる鋳型温度分布およびメニスカス流速のデータセットの数は少ないが、上記のようなモデルを用いることによって過学習を起きにくくすることができる。
【0031】
なお、第2の状態推定モデルf(・)は、特徴量選択機能をもったモデルであってもよい。LASSOにおけるλのような回帰モデルのハイパーパラメータは、例えば交差検証法を用いて学習用データをさらに分割することで決定される。鋳型温度分布の観測量Xtに関係する潜在状態Stの要素St|Xと、目的値Ytに関係する潜在状態Stの要素St|Yとは、共通の要素St|Y∥Xと独立な要素St|Y⊥Xとを含む。そのため、第1の状態推定モデルE(・)によって観測量Xtから抽出された低次元特徴量Ztにも、独立な要素St|Y⊥Xに対応する特徴量、すなわち目的値Ytには関係しない特徴量が含まれると考えられる。そこで、第2の状態推定モデルf(・)に特徴量選択機能をもった第2の状態推定モデルf(・)を用いることによって、独立な要素St|Y⊥Xに対応する特徴量を、第2の状態推定モデルf(・)に適用する低次元特徴量Ztから除くことができる。
【0032】
上記第1の状態推定モデルE(・)、および第2の状態推定モデルf(・)を用いることで、現在の鋳型温度分布から鋳型内の現在の溶鋼流動状態について推定することが可能となる。そして、これにより、手動かつ試行錯誤的な操作により、鋳型内の溶鋼流動状態を望ましい状態(メニスカス流速のよどみが無いなど溶鋼流動が安定した状態、ピンホールが発生しないなど鋳片品質が高い状態)に操作することができる。しかし、これだけでは、連続鋳造機の制御の自動化や、制御の最適化は困難である。この点に鑑み、発明者らは、観測された温度と、溶鋼流動状態を表すデータ(メニスカス流速のよどみの有無、ピンホール発生有無、等)との関係性を示す実績データから、鋳型内の溶鋼流動状態推定モデルと同時に、状態遷移を予測するモデル(鋳型内の未来の状態を推定するモデル、以下状態遷移モデル)を構築することを検討した。状態遷移モデルを実績データのみから構築することができれば、構築された状態遷移モデルを用い、例えば、次の(1)~(3)のようなことが可能となる。(1)溶鋼流動状態PID制御等のパラメータの調整。(2)溶鋼流動状態のモデル予測制御器の構築。(3)実操業ラインを用いない、強化学習によるモデル予測制御器の構築。これらが実現することにより、連続鋳造機の制御の自動化や、(自動、手動を含む)制御の最適化が可能となる。また操業条件の変更による溶鋼流動状態変化の傾向を解析することで、対象プロセスに関する知見を蓄積することができる。
【0033】
<第1実施形態>
次に、上記の経緯から得られた本発明の第1実施形態について説明する。
【0034】
図1に、本発明の第一実施形態に係る制御装置の構成を示す。制御装置30は、溶鋼から鋼片を製造する連続鋳造機を制御する装置であり、制御装置30は、
図1に示すように、測温装置10、観測装置20、入力部40及び出力部50に接続されており、また、制御装置30は、操作量設定部31、観測量取得部33、目的値取得部35、記憶部37、状態遷移モデル推定部39、操作量算出部41を有している。制御装置30は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(ハードディスクドライブ)といった、公知の演算装置や記憶装置を用いて実現することができる。
【0035】
操作量設定部31は、連続鋳造機(の図示しないコントローラ)に接続されており、各種のパラメータ(操作量)を保持することで、そうした操作量に基づいて連続鋳造機の動作を制御している。例えば、操作量設定部31は、鋳型から鋳片(又は凝固シェル)を引き出す速度や、鋳型内溶鋼の湯面高さや、電磁力装置(攪拌装置、ブレーキ装置)の電流値等のような種々な設定可能な値に関して、操作量の値を保持しており、当該操作量に基づいて連続鋳造機の制御を行っている。逆にいえば、操作量設定部31は、連続鋳造機の制御のための操作量を把握しているともいえるので、操作量設定部31は、連続鋳造機に関する操作量を容易に取得することができる。そのため、操作量設定部31は、後述する記憶部37から過去の操業データを読み出し、読み出した操業データの中から、過去の任意の時刻である第1の時刻(t’)における連続鋳造機への操作量(at’)を抽出し取得する。また、操作量設定部31は、別途、入力部40を介してオペレータが入力する任意の操作量(a)についても取得する。操作量設定部31は、取得した第1の時刻における操作量(at’)を、記憶部37や状態遷移モデル推定部39に出力し、取得した任意の操作量(a)を、記憶部37や操作量算出部41に出力する。
【0036】
観測量取得部33は、変換装置15を介して、連続鋳造機の鋳型M上の複数個所に設けられた熱電対13に接続されている。複数の熱電対13は、鋳型Mの表面の略全周に亘って深さ方向に並ぶように配置されており、鋳型M表面上を格子状に網羅的にカバーしている。観測量取得部33は、連続鋳造機が操業している際には、熱電対13からの電気信号を変換装置15によって温度に変換しながら、熱電対13が配置された鋳型M上の複数個所の温度を、繰り返し取得し続ける。観測量取得部33は、後述する記憶部37から過去の操業データを読み出し、読み出した操業データの中から、各熱電対13の位置に対応する、過去の任意の時刻である第1の時刻(t’)における温度と、第1の時刻(t’)から所定の時間(p)が経過した過去の第2の時刻(t’+p)における温度を、それぞれ、第1の時刻における観測量(Xt’)と第2の時刻における観測量(Xt’+p)として取得する。また、観測量取得部33は、過去又は現在の時刻である第3の時刻(t)における温度を、過去の操業データに基づいて、又は、現に行われている操業中に取得している温度の値に基づいて、第3の時刻における観測量(Xt)として取得する。観測量取得部33は、取得した第1の時刻における観測量(Xt’)、第2の時刻における観測量(Xt’+p)及び第3の時刻における観測量(Xt)を、記憶部37、状態遷移モデル推定部39及び操作量算出部41に出力する。
【0037】
なお、温度測定デバイスとして熱電対13を用いる場合を例に説明しているが、鋳型Mの表面の複数個所の温度が安定して測定できるのであれば、熱電対13である必要はなく、熱電対13に代えて、例えば、光ファイバを用いたFBG(Fiber Bragg Grating)測温装置等、他の温度測定デバイスを用いるようにしても良い。
【0038】
目的値取得部35は、状態値Yのデータを生成する。本実施形態に係る制御装置30は、連続鋳造機への任意の操作量aに基づく将来(後述する第4の時刻(t+p))の状態値Yt+pを予測し、予測される状態値Yが適正な値となるように、連続鋳造機に対する操作量aを調整し、調整後の操作量aを用いることで、連続鋳造機を適正に制御することを目的としているため、状態値Yは、そのときどきの時刻の状況に起因する目的値であるともいえる。従って、状態値Yは、目的値Yや、所定の時刻の状況に起因する目的値Yのようにも表現する。目的値取得部35は、カメラ23と、解析装置25と、を備えている。カメラ23は、鋳片Sの表面または断面、もしくは鋳型Mの湯面を撮影して画像データを生成する。解析装置25は、画像データを解析し、状態値Ytを生成する。状態値Ytは、鋳型M内の溶鋼流動状態を判定するための流動状態データと、鋳片表面のピンホールの数を示すピンホール数データと、を含む。
【0039】
流動状態データは、メニスカス流速データを含む。メニスカス流速データは、カメラ23が生成した鋳片Sのエッチプリントから解析装置25がデンドライト傾角を計測し、それをメニスカス流速に変換したものである。ここで、エッチプリントからは鋳型Mの幅方向および深さ方向(エッチプリントでは外縁部から中心部に向かう方向)に複数のデンドライト傾角が計測可能であるが、本実施形態ではこのうちメニスカス流速に対応する深さ方向のデータを用いる。メニスカス流速は、例えば「連鋳鋳片の大型介在物と柱状晶成長方向との関係」(岡野忍ら、「鉄と鋼」第61年第14号、2982-2990頁、1975年)に記載された下記数4によって算出される。数5において、vはメニスカス流速(cm/sec)、θはデンドライト傾角(度)、fは凝固速度(cm/sec)である。
【0040】
【0041】
ピンホール数データは、鋳片表面のピンホールの数を示すデータである。具体的には、カメラ23が生成した鋳片Sの表面の画像から解析装置25がピンホールを検出し、それを計数したものである。ピンホールは鋳片Sの表面に生じるもので、比較的容易に検出することができる。このため、目的値Yをピンホール数データとすれば、目的値Yの取得が容易になる。
【0042】
このような一の鋳片Sについての目的値Yのデータ数は、通常、当該鋳片Sの鋳造中に得られる観測量Xのデータ数よりも少なくなる。これは、目的値Yの取得が容易でないことによる。取得が容易でない理由の一つには、鋳造中の任意のタイミングで取得可能な観測量Xとは異なり、目的値Yが事象の発生時(限られたタイミング)に収集されるデータであることがある。また、理由のもう一つには、比較的容易に取得可能な観測量Xとは異なり、目的値Yが能動的にコストをかけて取得する必要のあるデータであることがある。
【0043】
目的値取得部35が取得した目的値Yと観測量X(と、別途取得した特徴量Z)に基づいて、第1の状態推定モデルE(・)や第2の状態遷移モデルF2(・)を推定することができる。第1の状態推定モデルE(・)と第2の状態遷移モデルF2(・)が既知である場合には、目的値取得部35は省略することもできる。
目的値取得部35は、取得した目的値Yや観測量Xを、記憶部37等に出力する。
【0044】
記憶部37は、連続鋳造機の過去の操業データ(少なくとも、観測量X、操作量aを含む)や、(関数系や係数等が既知となった)第1の状態推定モデルE(・)及び第2の状態遷移モデルF2(・)や、(学習前又は本発明を通じて学習後の)第1の状態遷移モデルF1(・)及び第2の状態遷移モデルF2(・)や、それらを処理するためのプログラム等のような各種情報を記憶する機能部である。記憶部37には、入力部40を通じて新たな情報を書き込んだり、記憶部37に記憶した情報やプログラムを使用することができる。また、記憶部37に記憶された情報は、他の機能部(31、33、35、39、41)が読み出して使用することができ、出力部50を通じて、操作者等に情報を表示することもできる。
【0045】
第一実施形態に係る状態遷移モデル推定部39は、過去の第1の時刻t’における観測量(Xt’)と、過去の第1の時刻における操作量at’と、第1の時刻から所定の時間(p)が経過した過去の第2の時刻(t’+p)における観測量Xt’+pとに基づき、状態遷移モデルを構築する機能部である。より具体的には、状態遷移モデル推定部39は、(i)第2の時刻における観測量(Xt’+p)と、(ii)第1の時刻における観測量(Xt’)及び第1の時刻における操作量at’を学習前の第1の状態遷移モデルF1(・)に適用することで得られた第2の時刻における観測量(Xt’+p)の計算値と、の差が最小となるように、学習前の第1の状態遷移モデルF1(・)を最適化することで、第1の状態遷移モデルF1(・)を構築する機能部である。即ち、状態遷移モデル推定部39は、学習前の深層学習モデルを用い、その関数形や係数の値を、取得した過去の操業データに基づく値を用いて最適化し、第1の状態遷移モデルF1(・)を推定し、構築する。なお、第1の状態遷移モデルF1(・)には、任意の深層学習モデルを利用可能であるが、例えばResnet(Residual neural network)やLSTM(Long Short Term Memory)を用いることができる。その結果、ある時刻の観測量Xと操作量aを、構築された第1の状態遷移モデルF1(・)に入力すると、当該時刻から所定時間(p)経過した後の観測量を算出することができるようになる。状態遷移モデル推定部39は、構築した第1の状態遷移モデルF1(・)を、記憶部37や操作量算出部41に出力する。
【0046】
第一実施形態に係る操作量算出部41は、第1の状態遷移モデルF1(・)と、現在又は過去の第3の時刻(t)における観測量Xtと、任意の操作量aとに基づき、第3の時刻から前記所定の時間(p)が経過した将来の第4の時刻(t+p)の状況に起因する目的値Yt+pの推定値を算出し、算出した第4の時刻の状況に起因する目的値Yt+pの推定値に基づいて、前記連続鋳造機を制御する機能部である。より具体的には、操作量算出部41は、第1の状態遷移モデルF1(・)に、第3の時刻における観測量Xt及び任意の操作量aを適用することで、第4の時刻における観測量Xt+pの推定値を算出し、算出した観測量Xt+pの推定値に、前記第1の状態推定モデルE(・)を適用し、更に、第2の状態推定モデルf(・)を適用することで、第4の時刻の状況に起因する目的値Yt+pの推定値を算出し、算出した第4の時刻の状況に起因する目的値Yt+pの推定値に基づいて、前記連続鋳造機を制御する機能部である。操作量算出部41は、状態遷移モデル推定部39が過去の操業データ同士の関係から第1の状態遷移モデルF1(・)構築しているのとは異なり、現在の時刻(第3の時刻。但し過去の時刻であっても良い)を基準として、任意の操作量aに対する、第3の時刻から所定時間(p)(pは、状態遷移モデル推定部39でも、操作量算出部41でも同じ値となる)が経過した、将来の第4の時刻(t+p)における観測量Xt+pを算出する。第4の時刻における観測量Xt+pが求まれば、既知の第1の状態推定モデルE(・)を用いて、任意の操作量(a)に対する(第4の時刻における)特徴量Zt+pの推定値が求まり、更に、任意の操作量に対する(第4の時刻における)特徴量Zt+pの推定値を第2の状態推定モデルf(・)に適用することで、任意の操作量に対する(第4の時刻の状況に起因する)目的値Yt+pの推定値を求めることができる。
【0047】
ここで求まった、第4の時刻の状況に起因する目的値Yt+pの推定値は、適宜決めた任意の操作量aに対応する値であり、実際に、現在の連続鋳造機を当該操作量aで制御すると、将来の第4の時刻(t+p)には、求めた目的値Yt+pに対応する品質の鋳片が得られることになる。通常、操業上どのような品質の鋳片が製造されるべきか(品質の最低基準)は予め決まっているため、その品質に見合う目的値の値も決まっている。品質上予め決められた目的値と、算出した第4の時刻の状況に起因する目的値Yt+pの推定値とを比較し、予め決められた目的値を満たさない場合には、任意の操作量aの値を変えて、再度計算を行う。そして、予め決められた目的値を満たす、任意の操作量aを把握する。この再計算には、モデル予測制御等の公知の方法により最適化可能である。操作量算出部41は、把握した予め決められた目的値を満たす任意の操作量aを、操作量設定部31に出力し、操作量設定部31に当該操作量aを設定することで連続鋳造機を制御する。そうすることで、将来の(第4の時刻に代表される)任意の時刻においても、連続鋳造機が最低限の品質が担保された鋳片を製造できるように、連続鋳造機を制御することができる。
【0048】
入力部40は、キーボードやタッチパネル等のような公知のインターフェースで構成され、制御装置30と有線又は無線によって接続されている。入力部40は、操作者の操作を受付け、必要な情報を適宜制御装置30に入力することができる。例えば、入力部40を介して、任意の操作量aを、操作量算出部41や記憶部37に入力することができる。
【0049】
出力部50は、ディスプレイやプリンタ等のような公知のインターフェースで構成され、制御装置30と有線又は無線によって接続されている。出力部50は、連続鋳造機や制御装置30の状態、状態遷移モデル推定部39や操作量算出部41の演算結果等、を操作者に表示し、操作者の判断を促すことができる。
【0050】
次に、本発明を実施するための第一実施形態に係る連続鋳造機の制御装置30の動作について、
図2及び
図3を用いて説明する。
図2に、本発明の第一実施形態に係る制御装置30の処理の流れを示す概念図を示す。
図2では、横軸で時間の経過を示し、時間の経過に対する観測量X、特徴量Z、状況に応じた目的値Yの間の相互の関係を概念的に示している。また、
図3に、本発明の第一実施形態に係る制御装置30の処理フローを示す。なお、
図2、
図3及び以下の説明では、過去の第1の時刻を(t’)で、第1の時刻から所定時間(p)だけ経過した過去の第2の時刻を(t’+p)で、現在又は過去の第3の時刻を(t)で、第3の時刻から所定時間(p)だけ経過した将来の第4の時刻を(t+p)で表し、また、それぞれの時刻を添え字として、観測量をX、特徴量をZ、その時の状況に起因する目的値をYで表している。また、前提として、
図2に破線211で示すように、第1の時刻における観測量X
t’を適用することで、第1の時刻における特徴量Z
t’を算出する、第1の状態推定モデルE(・)と、破線213で示すように、第1の時刻における特徴量Z
t’を適用することで、第1の時刻の状態に起因する目的値Y
t’を算出する、第2の状態推定モデルf(・)とは、既知となっているものとする。
【0051】
<ステップS11>
先ず、制御装置30は、処理を開始すると、記憶部37に記憶された過去の操業データに基づいて、操作量設定部31で第1の時刻における操作量at’を取得し、観測量取得部33で第1の時刻における観測量Xt’を取得する。また、観測量取得部33で第2の時刻における観測量Xt’+pを取得する。取得された第1の時刻における操作量at’、第1の時刻における観測量Xt’及び第2の時刻における観測量Xt’+pは、記憶部37、状態遷移モデル推定部39及び操作量算出部41に出力される。
【0052】
<ステップS12>
状態遷移モデル推定部39は、線215に示すように、取得した第1の時刻における操作量at’及び第1の時刻における観測量Xt’を、学習前の深層学習モデル(学習前の第1の状態遷移モデルF1(・))に適用し、線217に示すように、その出力結果と、取得した第2の時刻における観測量Xt’+pとを比較する。深層学習の手法に従い、この比較において、出力結果と第2の時刻における観測量Xt’+pとの差が最小となるように、深層学習モデルを繰り返し最適化する。そして、最適化が完了することで構築された深層学習モデルを、第1の状態遷移モデルF1(・)とする。
【0053】
<ステップS13>
次に、観測量取得部33で第3の時刻における観測量Xtを取得する。第3の時刻は、現在の時刻であっても、過去の時刻であっても良いため、第3の時刻が過去の時刻である場合には、過去の操業データから第3の時刻における観測量Xtを取得し、第3の時刻が現在の時刻である場合には現在操業中の連続鋳造機のデータとして、リアルタイムで、観測量取得部33から第3の時刻における観測量Xtを取得することができる。取得された第3の時刻における観測量Xtは、記憶部37、状態遷移モデル推定部39及び操作量算出部41に出力される。
【0054】
<ステップS14>
状態遷移モデル推定部39は、線231に示すように、取得した第3の時刻における任意の操作量a及び第3の時刻における観測量Xtを、構築された第1の状態遷移モデルF1(・)に適用する。その結果、第4の時刻における観測量Xt+pの推定値を算出することができる。
【0055】
<ステップS15>
操作量算出部41は、線233に示すように、第4の時刻における観測量Xt+pの推定値を、既知の第1の状態推定モデルE(・)に適用することで、第4の時刻における特徴量Zt+pの推定値を算出する。更に、線235に示すように、算出した第4の時刻における特徴量Zt+pの推定値を、既知の第2の状態推定モデルf(・)に適用することで、第4の時刻の状況に起因する目的値Yt+pの推定値を算出する。
【0056】
<ステップS16>
通常、操業上どのような品質の鋳片が製造されるべきか(品質の最低基準)は予め決まっているため、その品質に見合う目的値の値も決まっている。品質上予め決められた目的値と、算出した第4の時刻の状況に起因する目的値Yt+pの推定値とを比較し、予め決められた目的値を満たさない場合には、任意の操作量aの値を変えて、再度計算を行う。そして、予め決められた目的値を満たす、任意の操作量aを把握する。この再計算には、モデル予測制御等の公知の方法により最適化可能である。操作量算出部41は、把握した予め決められた目的値を満たす任意の操作量aを、操作量設定部31に出力し、操作量設定部31に当該操作量aを設定することで連続鋳造機を制御する。そうすることで、将来の(第4の時刻に代表される)任意の時刻においても、連続鋳造機が最低限の品質が担保された鋳片を製造できるように、連続鋳造機を制御することができる。
【0057】
以上に説明したように、本発明の第一実施形態に係る連続鋳造機の製造方法によれば、すでに利用可能となった、過去の(大量に準備できる)第1の時刻と第2の時刻の操業データを用いることで、精度の高い第1の状態遷移モデルF1(・)を構築することができ、そうした精度の高い第1の状態遷移モデルF1(・)を用いて、例えば現在(第3の時刻)正に起こっている操業の状況を踏まえて、将来(第4の時刻)にどのような品質の鋳片が製造されるかを推定し、品質が悪くなりそうであれば、高精度に今の操業に反映させることができるようになる。
【0058】
<第二実施形態>
次に、本発明の第二実施形態について、以下に説明する。なお、説明の便宜上、上記第一実施形態にて説明したステップと同じ内容のステップや、上記第一実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
本発明の第二実施形態は、第一実施形態に比べて状態遷移モデル推定部39と操作量算出部41での処理が異なるので、それらを中心に説明を行う。
【0059】
第二実施形態に係る状態遷移モデル推定部39は、過去の第1の時刻(t)における観測量Xt’と、過去の第1の時刻における操作量at’と、第1の時刻から所定の時間(p)が経過した過去の第2の時刻(t’+p)における観測量Xt’+pとに基づき、状態遷移モデルを構築する機能部である。より具体的には、状態遷移モデル推定部39は、(iii)第2の時刻における観測量Xt’+pを第1の状態推定モデルE(・)に適用することで得られた第2の時刻における特徴量Zt’+pの計算値と、(iv)第1の時刻における観測量Xt’を状態推定モデルE(・)に適用して得られた第1の時刻における特徴量Zt’及び第1の時刻における操作量at’を、学習前の第2の状態遷移モデルF2(・)に適用することで得られた第2の時刻における特徴量Zt’+pの計算値と、の差が最小となるように、学習前の第2の状態遷移モデルF2(・)を最適化することで、第2の状態遷移モデルF2(・)を構築する機能部である。即ち、状態遷移モデル推定部39は、学習前の深層学習モデルを用い、その関数形や係数の値を、取得した過去の操業データに基づく値を用いて最適化し、第2の状態遷移モデルF2(・)を推定し、構築する。なお、第2の状態遷移モデルF2(・)には、任意の深層学習モデルを利用可能であるが、例えばDMM(Data Management Maturity Model)や、RSSM(Recurrent State Space Model)を用いることができる。その結果、ある時刻の観測量Xを第1の状態推定モデルE(・)に適用して得られた、当該時刻における特徴量Zと、当該時刻における操作量aを、構築された第2の状態遷移モデルF2(・)に入力すると、当該時刻から所定時間(p)経過した後の特徴量を算出することができるようになる。状態遷移モデル推定部39は、構築した第2の状態遷移モデルF2(・)を、記憶部37や操作量算出部41に出力する。
【0060】
第二実施形態に係る操作量算出部41は、第2の状態遷移モデルF2(・)と、現在又は過去の第3の時刻(t)における観測量Xtを第1の状態推定モデルE(・)に適用して得られた第3の時刻における特徴量Ztと、任意の操作量aとに基づき、第3の時刻から前記所定の時間(p)が経過した将来の第4の時刻(t+p)の状況に起因する目的値Yt+pの推定値を算出し、算出した第4の時刻の状況に起因する目的値Yt+pの推定値に基づいて、前記連続鋳造機を制御する機能部である。より具体的には、操作量算出部41は、第2の状態遷移モデルF2(・)に、第3の時刻における観測量Xt第1の状態推定モデルE(・)に適用して得られた第3の時刻における特徴量Zt、及び、任意の操作量(a)を適用することで、第4の時刻における特徴量Zt+pの推定値を算出し、更に、前記第2の状態推定モデルf(・)を適用することで、第4の時刻の状況に起因する目的値Yt+pの推定値を算出し、算出した第4の時刻の状況に起因する目的値Yt+pの推定値に基づいて、前記連続鋳造機を制御する機能部である。操作量算出部41は、状態遷移モデル推定部39が過去の操業データ同士の関係から第1の状態遷移モデルF1(・)構築しているのとは異なり、現在の時刻(第3の時刻。但し過去の時刻であっても良い)を基準として、任意の操作量aに対する、第3の時刻から所定時間(p)(pは、状態遷移モデル推定部39でも、操作量算出部41でも同じ値となる)が経過した、将来の第4の時刻(t+p)における特徴量Zt+pを算出する。第4の時刻における特徴量Zt+pが求まれば、第4の時刻における特徴量Zt+pを既知の第2の状態推定モデルf(・)に適用することで、任意の操作量に対する(第4の時刻の状況に起因する)目的値Yt+pの推定値を求めることができる。
【0061】
ここで求まった、第4の時刻の状況に起因する目的値Yt+pの推定値は、適宜決めた任意の操作量aに対応する値であり、実際に、現在の連続鋳造機を当該操作量aで制御すると、将来の第4の時刻(t+p)には、求めた目的値Yt+pに対応する品質の鋳片が得られることになる。通常、操業上どのような品質の鋳片が製造されるべきか(品質の最低基準)は予め決まっているため、その品質に見合う目的値の値も決まっている。品質上予め決められた目的値と、算出した第4の時刻の状況に起因する目的値Yt+pの推定値とを比較し、予め決められた目的値を満たさない場合には、任意の操作量aの値を変えて、再度計算を行う。そして、予め決められた目的値を満たす、任意の操作量aを把握する。操作量算出部41は、把握した予め決められた目的値を満たす任意の操作量aを、操作量設定部31に出力し、操作量設定部31に当該操作量aを設定することで連続鋳造機を制御する。そうすることで、将来の(第4の時刻に代表される)任意の時刻においても、連続鋳造機が最低限の品質が担保された鋳片を製造できるように、連続鋳造機を制御することができる。
【0062】
次に、本発明を実施するための第二実施形態に係る連続鋳造機の制御装置30の動作について、
図4及び
図5を用いて説明する。
図4に、本発明の第二実施形態に係る制御装置30の処理の流れを示す概念図を示す。
図4では、横軸で時間の経過を示し、時間の経過に対する観測量X、特徴量Z、状況に応じた目的値Yの間の相互の関係を概念的に示している。また、
図5に、本発明の第二実施形態に係る制御装置30の処理フローを示す。なお、
図4、
図5及び以下の説明では、過去の第1の時刻を(t’)、第1の時刻から所定時間(p)だけ経過した過去の第2の時刻を(t’+p)、現在又は過去の第3の時刻を(t)、第3の時刻から所定時間(p)だけ経過した将来の第4の時刻を(t+p)で表し、また、それぞれの時刻を添え字として、観測量をX、特徴量をZ、その時の状況に起因する目的値をYで表している。また、前提として、
図4に破線253で示すように、第1の時刻における観測量X
t’を適用することで、第1の時刻における特徴量Z
t’を算出する、第1の状態推定モデルE(・)と、破線255で示すように、第1の時刻における特徴量Z
t’を適用することで、第1の時刻の状態に起因する目的値Y
t’を算出する、第2の状態推定モデルf(・)とは、既知となっているものとする。
【0063】
<ステップS21>
先ず、制御装置30は、処理を開始すると、記憶部37に記憶された過去の操業データに基づいて、操作量設定部31で第1の時刻における操作量at’を取得し、観測量取得部33で第1の時刻における観測量Xt’を取得する。また、観測量取得部33で第2の時刻における観測量Xt’+pを取得する。そして、線251で示すように、第2の時刻における観測量Xt’+pを、既知の第1の状態推定モデルE(・)に適用することで、第2の時刻における特徴量Zt’+pを算出し、また、線253で示すように、第1の時刻における観測量Xt’を、既知の第1の状態推定モデルE(・)に適用することで、第1の時刻における特徴量Zt’を算出する。取得された第1の時刻における操作量at’、算出された第1の時刻における特徴量Zt’及び第2の時刻における特徴量(Zt’+p)は、記憶部37、状態遷移モデル推定部39及び操作量算出部41に出力される。
【0064】
<ステップS22>
状態遷移モデル推定部39は、線257に示すように、取得した第1の時刻における操作量at’及び算出した第1の時刻における特徴量Zt’を、学習前の深層学習モデル(学習前の第2の状態遷移モデルF2(・))に適用し、線259に示すように、その出力結果と、算出した第2の時刻における特徴量Zt’+pとを比較する。深層学習の手法に従い、この比較における差が最小となるように、深層学習モデルを繰り返し最適化する。そして、最適化が完了することで構築された深層学習モデルを、第2の状態遷移モデルF2(・)とする。
【0065】
<ステップS23>
次に、観測量取得部33で第3の時刻における観測量Xtを取得する。そして、線271に示すように、第3の時刻における観測量Xtを、既知の第1の状態推定モデルE(・)に適用することで、第3の時刻における特徴量Ztを算出する。第3の時刻は、現在の時刻であっても、過去の時刻であっても良いため、第3の時刻が過去の時刻である場合には、過去の操業データから第3の時刻における観測量Xtを取得し、第3の時刻が現在の時刻である場合には現在操業中の連続鋳造機のデータとして、リアルタイムで、観測量取得部33から第3の時刻における観測量Xtを取得することができる。取得された第3の時刻における観測量Xtと、算出された第3の時刻における特徴量Ztは、記憶部37、状態遷移モデル推定部39及び操作量算出部41に出力される。
【0066】
<ステップS24>
状態遷移モデル推定部39は、線273に示すように、取得した第3の時刻における任意の操作量a及び算出した第3の時刻における特徴量Ztを、構築された第2の状態遷移モデルF2(・)に適用する。その結果、第4の時刻における特徴量Zt+pの推定値を算出することができる。
【0067】
<ステップS25>
操作量算出部41は、線275に示すように、第4の時刻における特徴量Zt+pの推定値を、既知の第2の状態推定モデルf(・)に適用することで、第4の時刻の状況に起因する目的値Yt+pの推定値を算出する。
【0068】
<ステップS26>
通常、操業上どのような品質の鋳片が製造されるべきか(品質の最低基準)は予め決まっているため、その品質に見合う目的値の値も決まっている。品質上予め決められた目的値と、算出した第4の時刻の状況に起因する目的値Yt+pの推定値とを比較し、予め決められた目的値を満たさない場合には、任意の操作量aの値を変えて、再度計算を行う。そして、予め決められた目的値を満たす、任意の操作量aを把握する。操作量算出部41は、把握した予め決められた目的値を満たす任意の操作量aを、操作量設定部31に出力し、操作量設定部31に当該操作量aを設定することで連続鋳造機を制御する。そうすることで、将来の(第4の時刻に代表される)任意の時刻においても、連続鋳造機が最低限の品質が担保された鋳片を製造できるように、連続鋳造機を制御することができる。
【0069】
以上に説明したように、本発明の第二実施形態に係る連続鋳造機の製造方法によれば、すでに利用可能となった、過去の(大量に準備できる)第1の時刻と第2の時刻の操業データを用いることで、精度の高い第2の状態遷移モデルF2(・)を構築することができ、そうした精度の高い第2の状態遷移モデルF2(・)を用いて、例えば現在(第3の時刻)正に起こっている操業の状況を踏まえて、将来(第4の時刻)にどのような品質の鋳片が製造されるかを推定し、品質が悪くなりそうであれば、高精度に今の操業に反映させることができるようになる。
【実施例0070】
次に、本発明の実施例について説明する。
【0071】
まず、実データを用いて、深層学習モデルから第1の状態遷移モデルF1(・)、および第2の状態遷移モデルF2(・)をそれぞれ構築した。ここでは、第1の状態遷移モデルF1(・)を構築するための深層学習モデルとして、Resnetと、LSTMの2種類を用いた。以下、Resnetを用いて構築された第1の状態遷移モデルF1(・)を実施例1、LSTMを用いて構築された第1の状態遷移モデルF1(・)を実施例2とする。また、第2の状態遷移モデルF2(・)を構築するための深層学習モデルとして、DMMと、RSSMの2種類を用いた。以下、DMMを用いて構築された第2の状態遷移モデルF2(・)を実施例3、LSTMを用いて構築された第2の状態遷移モデルF2(・)を実施例4とする。
【0072】
そして、構築した実施例1,2をK分割交差検証により評価した。データの分割数は5とし、キャストを単位として検証した。p,t等のパラメータは任意に設定することができる。このため、ここでは、p=10とした場合の予測結果について、平均誤差、標準偏差、および差分を算出した。そして、実施例1,2の平均誤差を、パーシステントモデル(以下、比較例)と比較した。パーシステントモデルは、Xt+p=Xtとしたモデルである。比較の結果、下記表1に示したように、実施例1,2の平均誤差は、比較例に比べて小さかった。また、実施例1,2から算出した各値を用いてt検定を行った(p値を算出した)。下記表1に示したように、得られたp値は非常に小さく、実施例1,2と比較例との平均誤差の差は、有意な差という結果になった。このことから、実施例1,2は、比較例よりも、未来の観測量Xt+pを高精度で予測できるものであることが示された。
未来の観測量Xt+pを高精度で予測できていることは第1の状態遷移モデルF1(・)が適切に学習できていることを示しており、Yt+pの予測値を利用した制御が実施可能であることが確認できたといえる。
【0073】
【0074】
次に、実施例3,4を、実施例1,2と同様に、K分割交差検証により評価した。データの分割数は5とし、キャストを単位として検証した。ここでは、p=10とした場合の予測結果について、平均誤差、標準偏差、および差分を算出した。そして、実施例3,4の平均誤差を、比較例と比較した。比較の結果、下記表1に示したように、実施例3,4の平均誤差は、比較例に比べて小さかった。また、実施例3,4から算出した各値を用いてt検定を行った(p値を算出した)。下記表2に示したように、得られたp値は非常に小さく、実施例3,4と比較例との平均誤差の差は、有意な差という結果になった。このことから、実施例3,4も、実施例1,2と同様に、比較例よりも、未来の観測量Xt+pを高精度で予測できるものであることが示された。
未来の観測量Xt+pを高精度で予測できていることは第2の状態遷移モデルF2(・)が適切に学習できていることを示しており、Yt+pの予測値を利用した制御が実施可能であることが確認できたといえる。
【0075】
【0076】
<その他>
制御装置30の機能は、当該装置としてコンピュータを機能させるためのプログラム(モデル作成プログラムおよび予測プログラム)であって、当該装置の各機能部31、33、35、37、39、41としてコンピュータを機能させるためのプログラムにより実現することができる。この場合、上記装置は、上記プログラムを実行するためのハードウェアとして、少なくとも1つのプロセッサと少なくとも1つの記憶装置(例えばメモリ)を有するコンピュータを備えている。このプロセッサと記憶装置により上記プログラムを実行することにより、上記各実施形態で説明した各機能が実現される。上記プログラムは、一時的ではなく、コンピュータ読み取り可能な、1または複数の記録媒体に記録されていてもよい。この記録媒体は、上記装置が備えていてもよいし、備えていなくてもよい。後者の場合、上記プログラムは、有線または無線の任意の伝送媒体を介して上記装置に供給されてもよい。また、上記各機能部の機能の一部または全部は、論理回路により実現することも可能である。例えば、上記各機能部として機能する論理回路が形成された集積回路も本発明の範疇に含まれる。この他にも、例えば量子コンピュータにより上記各機能部の機能を実現することも可能である。
【0077】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はこれらの例に限定されない。本発明の属する技術の分野の当業者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0078】
なお、以上の説明では特徴量Zは、観測量Xに比べデータの次元が少ないものとして説明した。例えば、1の時刻における特徴量Zt’及び第2の時刻における特徴量Zt’+pは、それぞれ、第1の時刻における観測量Xt’及び第2の時刻における観測量Xt’+pに比べて次元数が少なく、第3の時刻における特徴量Zt及び第4の時刻における特徴量Zt+pは、それぞれ、第3の時刻における観測量Xt及び第4の時刻における観測量Xt+pに比べて次元数が少ないものとした。しかしながら、本発明における次元数の関係は、このような場合に限定されるものではなく、次元数の大小関係は適宜変更することができる。
【0079】
また、第二実施形態において、第1の状態推定モデルE(・)は既知としていたが、未知であって良い。この場合、第1の状態推定モデルE(・)と第2の状態遷移モデルF2(・)を同時に学習する。既知の第1の状態推定モデルE(・)を初期値としても良い。これは、特徴量Zが観測量Xや目的値Y、操作量aと異なり、処理上算出される計算値であることに起因する。特徴量Zには、鋳型内部の溶鋼流動状態を表し予測に有用な表現となるよう期待しているが、同時に学習することで、状態遷移を仮定した表現となるよう制約を加えることが可能となる。同時に学習する場合、第1の状態推定モデルE(・)と第2の状態遷移モデルF2(・)のそれぞれの目的関数(学習時に最小化する関数)を、重みβ、1-βの加重和とすれば良い。
【0080】
また、以上の説明ではpは単独の値として表記していたが、任意の操作量aの決定にあたり複数のpについて計算しても良い。この場合、状態遷移モデルF1(・)、F2(・)を再帰的に適応し、p、2p、3pを計算しても良いし、p、2p、3pに応じ状態遷移モデルF1(・)、F2(・)を複数学習してもよい。