(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022185786
(43)【公開日】2022-12-15
(54)【発明の名称】演算装置、演算方法およびプログラム
(51)【国際特許分類】
G05B 23/02 20060101AFI20221208BHJP
B22D 11/16 20060101ALI20221208BHJP
B22D 11/18 20060101ALI20221208BHJP
【FI】
G05B23/02 R
B22D11/16 104B
B22D11/18 Z
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021093622
(22)【出願日】2021-06-03
(71)【出願人】
【識別番号】000006655
【氏名又は名称】日本製鉄株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】特許業務法人樹之下知的財産事務所
(72)【発明者】
【氏名】關 翼人
(72)【発明者】
【氏名】北田 宏
【テーマコード(参考)】
3C223
4E004
【Fターム(参考)】
3C223AA05
3C223BA01
3C223CC01
3C223EB01
3C223EB02
3C223FF22
3C223FF26
3C223GG01
3C223HH03
3C223HH08
3C223HH23
4E004MA05
4E004MB20
4E004MC22
4E004NA01
4E004NB01
4E004NB02
4E004NC01
4E004PA07
4E004SB01
4E004SC07
(57)【要約】
【課題】モデルの自由度に対して利用可能な観測データと結果データとのデータセットが少ない場合であっても過学習を抑制して予測モデルを構築する。
【解決手段】時系列で取得された観測データのうち、対応付けられる結果データが存在する第1の観測データ、および結果データに基づいて予測モデルを学習する予測モデル学習部と、観測データのうち、第1の観測データ、および対応付けられる結果データが存在しない第2の観測データに基づいて算出される、過学習を抑制するための評価指標に基づいて予測モデルの学習を制御する学習制御部とを備える演算装置が提供される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
時系列で取得された観測データのうち、対応付けられる結果データが存在する第1の観測データ、および前記結果データに基づいて予測モデルを学習する予測モデル学習部と、
前記観測データのうち、前記第1の観測データ、および対応付けられる結果データが存在しない第2の観測データに基づいて算出される、過学習を抑制するための評価指標に基づいて前記予測モデルの学習を制御する学習制御部と
を備える演算装置。
【請求項2】
前記時系列上で前記第1の観測データの前後に位置する前記第2の観測データに対して、前記結果データを時間的に拡張することによって得られる拡張結果データを対応付けるデータ拡張部をさらに備え、
前記予測モデル学習部は、前記第1および第2の観測データ、ならびに前記結果データおよび前記拡張結果データに基づいて前記予測モデルを学習し、
前記学習制御部は、前記評価指標に基づいて前記予測モデルの学習に用いる前記第2の観測データおよび前記拡張結果データの数を決定する、請求項1に記載の演算装置。
【請求項3】
前記データ拡張部は、前記時系列上で前記第1の観測データの前後に位置する所定の数の前記第2の観測データに、前記所定の数の前記拡張結果データをそれぞれ対応付け、
前記学習制御部は、前記評価指標が所定の条件を満たさない場合に、前記所定の数を増加させて前記データ拡張部の処理および前記予測モデル学習部による前記予測モデルの学習を再実行させる、請求項2に記載の演算装置。
【請求項4】
前記学習制御部は、前記評価指標に相当する前記予測モデルの正則化項を算出し、
前記予測モデル学習部は、前記第1の観測データから予測される予測値の前記結果データに対する損失関数、および前記正則化項の和が最小化されるように前記予測モデルを学習する、請求項1に記載の演算装置。
【請求項5】
前記予測モデルは、前記結果データのうち上位の結果データが存在する確率を示す第1の存在確率を予測する第1の予測モデルと、前記結果データのうち下位の結果データが存在する第2の存在確率を予測する第2の予測モデルとを含み、
前記下位の結果データを発生させる事象は、前記上位の結果データを発生させる事象に包含され、
前記評価指標は、前記第1および第2の観測データを含む一連の前記観測データを前記第1の予測モデルおよび前記第2の予測モデルにそれぞれ入力したときに、前記第1の存在確率と前記第2の存在確率との大小関係が逆転する時刻の比率に基づいて算出される、請求項1から請求項4のいずれか1項に記載の演算装置。
【請求項6】
前記評価指標は、前記第1および第2の観測データを含む一連の前記観測データを前記予測モデルに入力したときに出力される時系列の予測値の時間変化率に基づいて算出される、請求項1から請求項5のいずれか1項に記載の演算装置。
【請求項7】
前記観測データは、連続鋳造機の鋳型に配置された複数の測温装置による温度観測値を示す要素を含み、
前記結果データは、前記連続鋳造機で鋳造された鋳片の観察によって特定される前記温度観測値の観測時における前記鋳型内の溶鋼流動状態を示す要素を含む、請求項1から請求項6のいずれか1項に記載の演算装置。
【請求項8】
新たな観測データを前記予測モデルに入力することによって予測値を得る予測部をさらに備える、請求項1から請求項7のいずれか1項に記載の演算装置。
【請求項9】
時系列で取得された観測データのうち、対応付けられる結果データが存在する第1の観測データ、および前記結果データに基づいて予測モデルを学習するステップと、
前記観測データのうち、前記第1の観測データ、および対応付けられる結果データが存在しない第2の観測データに基づいて算出される、過学習を抑制するための評価指標に基づいて前記予測モデルの学習を制御するステップと
を含む演算方法。
【請求項10】
時系列で取得された観測データのうち、対応付けられる結果データが存在する第1の観測データ、および前記結果データに基づいて予測モデルを学習する予測モデル学習部と、
前記観測データのうち、前記第1の観測データ、および対応付けられる結果データが存在しない第2の観測量データに基づいて算出される、過学習を抑制するための評価指標に基づいて前記予測モデルの学習を制御する学習制御部と
を備える演算装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、演算装置、演算方法およびプログラムに関する。
【背景技術】
【0002】
連続鋳造における鋳型内部の溶鋼流動は、鋳造する鋳片の品質に影響する。しかし、鋳型内の溶鋼流動を直接観測して操業することは困難である。そこで、観測可能な鋳型の温度に基づき、物理モデルを利用して溶鋼流動の状態を推定する技術が種々提案されている。例えば特許文献1には、鋳型に設置した熱電対を用いて測定した温度を主成分分析して得られる主成分スコアを指標としてスラブ表面の欠陥発生有無を判定する技術が記載されている。具体的には、主成分スコアの次元ごとに設定した閾値によって異常、つまり欠陥が発生したことを判定する。欠陥が発生したと判定された場合は、表面欠陥を除去してからスラブを圧延工程へ搬送する。
【0003】
また、特許文献2には、鋳型湯面付近に設置した熱電対を用いて測定した温度に基づいて湯面形状を表す湯面流動パターンを検出し、湯面流動のパターンの一致性から鋳片の欠陥有無、欠陥位置及び欠陥原因などを予測し、鋳片の欠陥が予測される場合には鋼片の表面に生じた傷や不純物を燃料ガスと酸素で熱化学的に溶削するスカーフィングなどの処理を行う技術が記載されている。特許文献3には、鋳型に設置した熱電対を用いて測定した温度を算出式に代入して、凝固シェル界面の溶鋼流速や偏流度(溶鋼流速のばらつきの大きさを表す、複数点で算出される溶鋼流速の最大値と最小値の差、最大流速と平均流速の差、または流速分布の標準偏差などの値)を算出する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2015-160239号公報
【特許文献2】特表2015-522428号公報
【特許文献3】特開2012-66278号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記の例のような溶鋼流動状態の予測技術では、予測にあたっての教師データになる溶鋼流動状態がリアルタイムには測定できないことから、鋳型温度などの観測により得られる観測データと、製造された鋳片の観察などによって特定される溶鋼流動状態を示す結果データとのデータセットを用意する必要があるが、大量に用意することは難しい。その一方で、鋳型温度が多数の点で測定される場合は観測量の次元が高く、従ってモデルの自由度も高くなる。結果として、予測モデルが学習に用いたデータセットに過剰適合し、新たな観測データに対する予測では精度が低くなる、いわゆる過学習が生じやすい。しかしながら、上記の例のような従来の技術では、このような過学習に対する対策は講じられていない。
【0006】
そこで、本発明は、モデルの自由度に対して利用可能な観測データと結果データとのデータセットが少ない場合であっても過学習を抑制して予測モデルを構築することが可能な演算装置、演算方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明のある観点によれば、時系列で取得された観測データのうち、対応付けられる結果データが存在する第1の観測データ、および結果データに基づいて予測モデルを学習する予測モデル学習部と、観測データのうち、第1の観測データ、および対応付けられる結果データが存在しない第2の観測データに基づいて算出される、過学習を抑制するための評価指標に基づいて予測モデルの学習を制御する学習制御部とを備える演算装置が提供される。
【0008】
本発明の別の観点によれば、時系列で取得された観測データのうち、対応付けられる結果データが存在する第1の観測データ、および結果データに基づいて予測モデルを学習するステップと、観測データのうち、第1の観測データ、および対応付けられる結果データが存在しない第2の観測データに基づいて算出される、過学習を抑制するための評価指標に基づいて予測モデルの学習を制御するステップとを含む演算方法が提供される。
【0009】
本発明のさらに別の観点によれば、時系列で取得された観測データのうち、対応付けられる結果データが存在する第1の観測データ、および結果データに基づいて予測モデルを学習する予測モデル学習部と、観測データのうち、第1の観測データ、および対応付けられる結果データが存在しない第2の観測データに基づいて算出される、過学習を抑制するための評価指標に基づいて予測モデルの学習を制御する学習制御部とを備える演算装置としてコンピュータを機能させるためのプログラムが提供される。
【0010】
上記の構成によれば、対応する結果データが存在する観測データのみではなく、対応する結果データが存在しない観測データも用いて、予測モデルの過学習を抑制するための評価指標を算出し、その評価指標に基づいて予測モデルの学習を制御する。そのため、モデルの自由度に対して利用可能な観測データと結果データとのデータセットが少ない場合であっても過学習を抑制して予測モデルを構築することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の第1の実施形態におけるシステム構成を示す図である。
【
図2】メニスカス流速のよどみについて説明するための図である。
【
図3】本発明の第1の実施形態における処理の例を示すフローチャートである。
【
図4】
図3に示された処理を概念的に示す図である。
【
図5】
図3に示された処理を概念的に示す図である。
【
図6】本発明の第2の実施形態におけるシステム構成を示す図である。
【
図7】本発明の第2の実施形態における処理の例を示すフローチャートである。
【
図8】
図7に示された処理を概念的に示す図である。
【
図9A】本発明の実施例において、データ拡張部におけるデータ拡張幅を変化させた場合の過学習の評価指標の変化を示すグラフである。
【
図9B】本発明の実施例において、データ拡張部におけるデータ拡張幅を変化させた場合の過学習の評価指標の変化を示すグラフである。
【
図10】本発明の実施例において、データ拡張部におけるデータ拡張幅を変化させた場合の予測精度の変化を示すグラフである。
【
図11A】本発明の実施例において、データ拡張部におけるデータ拡張幅を変化させた場合の予測確率値の変化を示すグラフである。
【
図11B】本発明の実施例において、データ拡張部におけるデータ拡張幅を変化させた場合の予測確率値の変化を示すグラフである。
【発明を実施するための形態】
【0012】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0013】
(第1の実施形態)
本発明の第1の実施形態では、連続鋳造における鋳型内の溶鋼流動状態を、鋳型温度分布から予測する予測モデルを構築する。連続鋳造機において溶鋼を連続的に凝固させて所定の断面形状の鋳片を作る工程では、タンディッシュ底部から鋳型に溶鋼が注がれる。鋳型は水冷されており、溶鋼は鋳型に接する外側から冷却されることによって微細な結晶からなる薄い凝固殻を作りはじめ、微細な結晶はつながりあって大きな樹枝状晶へと成長する。表面が凝固した状態の鋳片は鋳型底部から引き抜かれ、ローラーを用いて搬送されながら、さらに冷却されて完全に凝固する。
【0014】
本実施形態では、鋳型内の溶鋼流動状態の例として、鋳型内湯面付近の幅方向溶鋼流速であるメニスカス流速を予測対象とする。メニスカス流速の範囲と鋳片欠陥の関係性は、例えば「連鋳鋳片の大型介在物と柱状晶成長方向との関係」(岡野忍ら,「鉄と鋼」第61年第14号,2982-2990頁,1975年)などの研究によって明らかになっている。より具体的には、鋳片欠陥が発生しにくいメニスカス流速の範囲の知見が存在する。メニスカス流速のよどみ、すなわちメニスカス流速が鋳型の幅方向において反転している箇所では、流速が低下しており介在物や気泡の捕捉が起きるため、鋳片欠陥が発生しやすい。
【0015】
メニスカス流速は鋳造中に直接計測することが困難であるが、凝固後鋳片の断面におけるデンドライト傾角から算出することができる。ただし、デンドライト傾角は鋳造後の鋳片を切断しなければ計測することができないためリアルタイムでの計測は困難であり、また実際上、連続鋳造で製造される大量の鋳片の中でデンドライト傾角を計測できるのはごく一部に限られる。一方、リアルタイムで、かつ大量に利用可能なデータとして、鋳型に複数設置された熱電対によって観測される鋳型温度分布がある。鋳型温度分布は、溶鋼の鋼種や鋳造速度による鋳型における抜熱量、すなわち溶鋼から鋳型に流れる単位時間当たりの熱量の違いや、溶鋼の流速による熱伝達係数の変動によって変化する。
【0016】
そこで、観測された鋳型温度分布とメニスカス流速との関係性を示す実績に基づいて、鋳型温度分布からメニスカス流速を予測するモデルを学習する。これによって、物理モデルに依存しない鋳型内の溶鋼流動の状態推定を実現できる。この場合、時系列で取得された観測データは鋳型温度分布を示す要素を含み、観測データに対応付けられる結果データは鋳型温度分布の観測時におけるメニスカス流速を示す要素を含む。ただし、鋳型温度分布がリアルタイムで大量に取得できるのに対して、上述のようにデンドライト傾角から算出されるメニスカス流速のデータ数は限られる。従って、鋳型に取り付ける熱電対の数を増やすことによって鋳型温度分布データを高次元化してモデルの自由度を高めても、鋳型温度分布データとセットで利用できるメニスカス流速データの数が少ないために過学習が生じ、予測モデルの精度向上には寄与しない。
【0017】
上記の点に鑑み、本発明者らは、以下に例示するような予測モデルの過学習を抑制するための評価指標を、対応する結果データが存在する観測データのみではなく、対応する結果データが存在しない観測データも用いて算出し、その評価指標に基づいて予測モデルの学習を制御することによって、モデルの自由度を高めつつ過学習を抑制して予測モデルを構築することを検討した。
【0018】
(評価指標1:上位データおよび下位データの存在確率の大小関係)
観測データに対応付けられる結果データについては、上位および下位の関係を定義することができる。以下では、相対的に上位の関係にある結果データを上位データと称し、下位の関係にある結果データを下位データと称する。例えば、メニスカス流速のよどみが小さい結果データを上位データとし、メニスカス流速のよどみが大きい結果データを下位データとすることができる。メニスカス流速の大小は、例えば後述する例のように所定の閾値を用いて判定できる。ここで、下位データを発生させる事象は、上位データを発生させる事象に包含される。つまり、下位データが発生したときには必ず上位データが発生しているが、上位データが発生している場合には下位データが発生しているとは限らない。この場合、予測モデルによって算出される上位データおよび下位データの存在確率の間には、(下位データの存在確率)≦(上位データの存在確率)という大小関係が成り立つ。上位データおよび下位データの存在確率をそれぞれ予測する予測モデルを学習した場合に、上位データの存在確率と下位データの存在確率との大小関係が逆転している、すなわち(下位データの存在確率)>(上位データの存在確率)である場合は、過学習によって予測モデルと対象の物理現象としての性質とが乖離していると推測できる。従って、例えば、時系列で取得された観測量を予測モデルに入力したときに、上位データの存在確率と下位データの存在確率との大小関係が逆転する時刻の比率に基づいて過学習を抑制するための評価指標を算出することができる。なお、上位データおよび下位データは、例えば教師ラベルのような離散値についても、連続量についても定義できる。
【0019】
(評価指標2:予測値の時間変化率)
予測モデルによって観測データから算出される予測値が物理量である場合、予測値の時系列変化は物理現象の状態変化を表す。従って、予測値の物理現象としての性質によって、予測値の時間変化率には妥当な範囲が存在する。例えばメニスカス流速のような流体の挙動の場合、物理現象としての状態変化は連続的であるため、物理現象としての性質に基づく予測値の時間変化率の妥当な範囲が存在する。時間変化率が妥当な範囲を超える場合、すなわち予測値の変化が物理現象としての性質に照らして激しすぎる場合、過学習によって予測モデルと対象の物理現象としての性質とが乖離していると推測できる。従って、例えば、時系列で取得された観測データを予測モデルに入力したときに、予測値の時間変化率に基づいて過学習を抑制するための評価指標を算出することができる。
【0020】
図1は、本発明の第1の実施形態におけるシステム構成を示す図である。図示された例において、システム10は、データベース100と、演算装置200とを含む。データベース100には、鋳型M内の溶鋼流動状態を判定することが可能なデータが格納される。本実施形態では、計測装置101を用いて鋳片Sのエッチプリントから計測されたデンドライト傾角をメニスカス流速に変換したメニスカス流速データ110が格納される。ここで、エッチプリントからは鋳型Mの幅方向および深さ方向(エッチプリントでは外縁部から中心部に向かう方向)に複数のデンドライト傾角が計測可能であるが、本実施形態ではこのうちメニスカス流速に対応する深さ方向のデータを用いる。メニスカス流速は、例えば「連鋳鋳片の大型介在物と柱状晶成長方向との関係」(岡野忍ら,「鉄と鋼」第61年第14号,2982-2990頁,1975年)に記載された以下の式(1)によって算出される。式(1)において、vはメニスカス流速(cm/sec)、θはデンドライト傾角(度)、fは凝固速度(cm/sec)である。なお、fは定数であり、製造条件によって定められるシェル厚みDと凝固係数Kとの関係性(D=K×t
1/2)の微分から算出される事前に定められた値が式(1)に代入される。
【0021】
【0022】
また、データベース100には、鋳型Mに配置された複数の測温装置、具体的には熱電対102によって時系列で取得された温度観測値である鋳型温度分布データ120が格納される。熱電対102は、例えば鋳型Mの各面で、周方向および鋳造方向(鋳型Mの深さ方向)に配列され、鋳型Mを構成する銅板の温度を測定する。熱電対に代えて、光ファイバを用いたFBG(Fiber Bragg Grating)測温装置などを用いてもよい。熱電対102は、例えば鋳型Mの各面の垂直方向中心線について対称に、かつ対向する各面の間で対応する位置に配置してもよい。上述の通り、鋳型温度分布データ120については、メニスカス流速データ110が存在しない操業についても取得可能であるため、メニスカス流速データ110よりもデータ数が多い。
【0023】
演算装置200は、CPU(Central Processing Unit)、記憶装置、通信装置、入出力手段などを備え、プログラムに従って各種の演算を実行するコンピュータである。プログラムは、記憶装置に格納されるか、またはリムーバブル記憶媒体に格納されて演算装置200に読み込まれる。演算装置200は、CPUがプログラムに従って動作することによって実装される機能部分として、教師ラベル設定部210、前処理部220、データ拡張部230、予測モデル学習部240、学習制御部250、予測部260および出力部270を備える。なお、上記の機能部分は、PLC(Programmable Logic Controller)であってもよいし、ASIC(Application Specific Integrated Circuit)などの専用のハードウェアによって実装されてもよい。
【0024】
教師ラベル設定部210は、データベース100から取得した鋳型M内の溶鋼流動状態を示すデータに基づいて、溶鋼流動状態に関する教師ラベルを設定する。具体的には、教師ラベル設定部210は、データベース100から取得したメニスカス流速データ110に基づいて、メニスカス流速のよどみの有無を示す教師ラベルを設定する。よどみの有無は、連続鋳造機で鋳造された鋳片の観察によって特定される、温度観測値の観測時における鋳型内の溶鋼流動状態の例であり、鋳型幅方向のメニスカス流速の分布によって特定される。具体的には、教師ラベル設定部210は、
図2に示されるように鋳片Sを鋳型幅方向に所定数に等分した領域ごとに鋳型幅方向のメニスカス流速を平均化し、平均流速vが反転する領域(
図2に示す例では破線で囲まれた箇所)が存在する場合に、よどみYが発生していることを示す教師ラベルを設定する。
【0025】
本実施形態において、教師ラベル設定部210は、互いに上位および下位の関係にある複数の教師ラベルを設定する。以下では上位ラベルおよび下位ラベルの2つの教師ラベルが設定される例について説明するが、3つ以上の種類の教師ラベルが設定されてもよい。また、既に述べたように、上位データおよび下位データは例えば教師ラベルのような離散値についても連続量についても定義できるため、他の実施形態では教師ラベル設定部210に代えて連続量について上位および下位を定義する機能部分が実装されてもよい。具体的には、教師ラベル設定部210は、
図2に示されるように鋳片Sを鋳型幅方向に10等分した領域の中で平均流速vが反転した領域が存在する場合に、「小さなよどみ」を示す上位ラベルを設定する。また、教師ラベル設定部210は、下位ラベルとして、鋳片Sを鋳型幅方向に3等分した領域の中で平均流速vが反転した領域が存在する場合に、「大きなよどみ」を示す下位ラベルを設定する。「大きなよどみ」が発生している場合には「小さなよどみ」が発生しているのに対して、「小さなよどみ」が発生している場合に「大きなよどみ」が発生しているとは限らないことから、これらの教師ラベルは上述した過学習を抑制するための評価指標における上位データおよび下位データとして利用可能である。
【0026】
前処理部220は、データベース100から取得した鋳型温度分布データ120の前処理を実行する。具体的には、前処理部220は、鋳型温度分布データ120を操業条件ごとに層別し、層ごとに正規化する。層別条件として、例えば鋼種、鋳型幅および鋳造速度が用いられる。正規化処理では、事前に層別した鋳型温度分布データ120に含まれる温度観測値xの平均μおよび分散σ2を層ごとに求めておき、例えば下記の式(2)において正規化対象の温度観測値xが属する層の平均μおよび分散σ2を用いてその温度観測値xを正規化された値x’に変換する。上記の通り、前処理は必須ではないが、モデルの精度向上に寄与する。
【0027】
【0028】
データ拡張部230は、結果データとセットになっている観測データに対して時系列上で前後に位置する観測データについて、当該結果データを時間的に拡張することによって得られる拡張結果データを対応付けるデータ拡張(Data Augmentation)を実行する。具体的には、データ拡張部230は、ある時刻のメニスカス流速データ110を複製して、当該時刻の前後の所定時間内に取得された、メニスカス流速データ110に対応付けられていない鋳型温度分布データ120に対応付ける。メニスカス流速データ110によって示される実測されたメニスカス流速は、鋳型内における瞬間的な状態ではなくその前後を含む時間範囲内の状態を表現する結果と捉えられるため、上記のようなデータ拡張は溶鋼流動状態の物理現象としての性質に照らして妥当である。データ拡張の時間範囲内でも観測データには微小な変化が生じており、従ってデータ拡張によって拡張結果データに対応付けられた観測データを予測モデルの学習に用いるデータに加えることによってデータセットの数が見かけ上増加し、過学習の抑制が期待される。なお、データの拡張幅、すなわち元の結果データと観測データとのセットに対して追加した拡張結果データと前後の観測データのセットの数は、後述するように学習制御部250によって決定される。
【0029】
予測モデル学習部240は、メニスカス流速データ110と、鋳型温度分布データ120とに基づいて予測モデルを学習する。本実施形態ではデータ拡張部230によってデータが拡張されているため、予測モデル学習部240が用いるデータは、結果データに対応付けられる第1の観測データだけではなく、拡張結果データに対応付けられる第2の観測データをも含む。また、本実施形態では教師ラベル設定部210がメニスカス流速データ110に基づいて上位ラベルおよび下位ラベルを設定するため、予測モデル学習部240は上位ラベルおよび下位ラベルのそれぞれの存在確率を予測する予測モデルを学習する。具体的には、予測モデル学習部240は、鋳型温度分布データ120から「小さなよどみ」を示す上位ラベルの存在確率を予測する第1の予測モデルと、鋳型温度分布データ120から「大きなよどみ」を示す下位ラベルの存在確率を予測する第2の予測モデルとを学習する。予測モデル学習部240は、例えばそれぞれの教師ラベルの存在確率を出力するロジスティック回帰モデルを学習してもよい。他の例において、連続量である結果データについて上位および下位の関係が定義される場合、予測モデル学習部240はロジスティック回帰モデルではなく通常の回帰モデルを用いてもよい。予測モデル学習部240は、学習された予測モデル241を記憶装置に格納する。あるいは、予測モデル学習部240は、学習された予測モデルのパラメータを通信装置で外部装置に送信してもよいし、リムーバブル記憶媒体に書き込んでもよい。
【0030】
学習制御部250は、過学習を抑制するための評価指標に基づいて、予測モデル学習部240における予測モデルの学習を制御する。なお、過学習を抑制するための評価指標は、対応する結果データが存在する観測データのみではなく、対応する結果データが存在しない観測データも用いて算出される。ここで、評価指標は、必ずしもデータベース100に格納された鋳型温度分布データ120の全てを用いて算出されなくてもよく、所定の時間範囲において時系列で取得され、予測モデルの学習に用いられる鋳型温度分布データ120について、メニスカス流速データ110に対応付けられるものも対応づけられないものも含む一連の鋳型温度分布データ120から評価指標が算出されてもよい。本実施形態において、学習制御部250は、第1の評価指標として以下の式(3)で表されるような上位データおよび下位データの存在確率の大小関係が逆転する時刻の比率に基づく評価指標d1を算出する。なお、I(・)は条件が満たされる場合には1、条件が満たされない場合には0を出力とする判定関数、y^t
upperは時刻tにおける上位データの存在確率、y^t
lowerは時刻tにおける下位データの存在確率である。また、学習制御部250は、第2の評価指標として以下の式(4)で表されるような、予測モデルを用いて予測された予測値の時間変化率に基づく評価指標d2を算出する。なお、zt’は時刻tにおける予測値(予測量)y^tと時刻t-1における予測値(予測量)y^t-1との差分、すなわち時間変化率であり、σzおよびσy^はそれぞれ時間変化率zt’および予測値(予測量)y^tの標準偏差である。ここで、t’=t-1(2≦t≦T,1≦t’≦T-1)である。
【0031】
【0032】
本実施形態では、後述する例のように学習制御部250が評価指標d1,d2の両方に基づいて予測モデルの学習を制御するが、他の例では学習制御部250が評価指標d1,d2のいずれか一方のみに基づいて予測モデルの学習を制御してもよい。式(3),(4)から明らかなように、それぞれの評価指標は互いに独立して算出可能である。なお、上位データおよび下位データの存在確率に関する評価指標d1が用いられない場合、教師ラベル設定部210は複数種の教師ラベルを設定しなくてもよい。評価指標d1が用いられる場合、教師ラベル設定部210は、最終的な予測対象である教師ラベル(以下、対象ラベルともいう)に加えて、その上位ラベルまたは下位ラベルの少なくともいずれかを設定する。対象ラベルと上位ラベルまたは下位ラベルの少なくともいずれかとの間で評価指標d1を算出することによって、対象ラベルについての予測モデルの過学習の有無を評価することができる。従って、例えば教師ラベル設定部210が3つ以上の教師ラベルを設定する場合、学習制御部250は対象ラベルの上位ラベルでも下位ラベルでもない教師ラベルについては評価指標d1を算出しなくてよい。
【0033】
予測部260は、新たな温度観測値である鋳型温度分布データ120を予測モデル241に入力することによって、新たな予測値として未知のメニスカス流速のよどみの存在確率を得る。この際、前処理部220は、新たな鋳型温度分布データ120について、学習時と同様に正規化などの前処理を実行してもよい。出力部270は、予測部260による予測の結果に応じて通知を出力する。例えば、出力部270は、予測されたよどみの存在確率が閾値を超えたら、オペレータに向けて表示による視覚的な通知、または音声による聴覚的な通知を出力してもよい。あるいは、出力部270は、操業条件を制御する制御装置(図示せず)に制御信号として通知を出力してもよい。通知を受け取ったオペレータまたは制御装置は、予測結果を指標にしてメニスカス流速のよどみが解消するように操業条件を変更する。具体的には、鋳造速度を変更したり、電磁ブレーキや電磁撹拌の制御値を変更したりすることができる。出力部270によって、予測の結果を反映させて操業条件を改善させることができる。
【0034】
なお、上記の予測部260および出力部270は、必ずしも演算装置200に含まれなくてもよい。既に述べたように学習された予測モデルは外部装置に送信したりリムーバブル記憶媒体に書き込んだりすることが可能であるため、演算装置200は予測モデルの学習までを実行すればよく、必ずしも予測モデルを用いた溶鋼流動状態の予測までが同じ装置で実行されなくてもよい。
【0035】
図3は本発明の第1の実施形態における予測モデルの構築処理の例を示すフローチャートである。
図4および
図5は
図3に示された処理を概念的に示す図である。
図3に示された例では、教師ラベル設定部210は、上位ラベルy
upper
tyoおよび下位ラベルy
lower
tyoを設定する(ステップS101)。具体的には、教師ラベル設定部210は、まず、時刻t
yoの時点での溶鋼流動状態(正確には時刻t
yo周辺における平均的な溶鋼流動状態)を示す結果データ、すなわちメニスカス流速データ110をデータベース100から読み出す。ここで、時刻t
yoは、鋳片Sからエッチプリントを取得した鋳込長位置(エッチプリントの計測位置)から断面外周部までの距離(深さ)を時間に換算することで得られる。教師ラベル設定部210は、読みだした各時刻t
yoのメニスカス流速データ110のそれぞれについて、よどみの小さい上位データの存在確率を示す上位ラベルy
upper
tyo(
図4左側のy
upper
tyoが指す実線の矩形)と、よどみの大きい下位データの存在確率を示す下位ラベルy
lower
tyo(
図4左側のy
lower
tyoが指す実線の矩形)とを設定する。上位ラベルy
upper
tyoには、
図2に示されるように鋳片Sを鋳型幅方向に10等分し、鋳型の上下面それぞれの領域(つまり20個の領域)の中で平均流速vが反転した領域が1つでも存在する場合はよどみありとして1が、1つも含まれない場合はよどみなしとして0が格納される。また、下位ラベルy
lower
tyoには、鋳片Sを鋳型幅方向に3等分した領域に関して同様の方法で求めることで得られる値が格納される。
【0036】
一方、データ拡張部230は、必要に応じて前処理部220による前処理を経て、時刻tについて時系列で取得された温度観測値x
tとして鋳型温度分布データ120を取得する(ステップS102)。
図4では、温度観測値x
t,dがD次元のデータ(1≦d≦D)であり、時刻Tまでの範囲で取得される(1≦t≦T)ものとして図示されている(
図4右側のx
t,dが指す実線の矩形)。ここで、Dは、鋳型Mに配置された測温装置(例えば熱電対102)の個数に対応する。
図4に示すとおり、メニスカス流速データ110が存在する時刻t
yoにおいては、メニスカス流速データ(上位ラベルy
upper
tyoおよび下位ラベルy
lower
tyo)110と鋳型温度分布データ(温度観測値x
tyo,d)120とが対応付けて格納されるが、時刻t
yo以外の時刻tの鋳型温度分布データ(温度観測値x
t,d)120に対しては、対応付けられるメニスカス流速データ(上位ラベルy
upper
tおよび下位ラベルy
lower
t)110が存在しない。
【0037】
次に、データ拡張部230において、データ拡張幅τが初期化される(ステップS103)。図示された例ではデータ拡張幅τが0に初期化されているが、0以外の値に初期化されてもよい。データ拡張部230は、データ拡張幅τに従ってデータを拡張する。具体的には、
図5に示されるように、データ拡張部230は、上位ラベルy
upper
tyoおよび下位ラベルy
lower
tyoをそれぞれデータ拡張幅τだけ時間的に拡張した所定の数の拡張上位ラベルy
upper
tyo(τ)および拡張下位ラベルy
lower
tyo(τ)を生成し(
図5のハッチングされた部分)、これらをそれぞれ温度観測値x
tyo(τ)に対応付ける(ステップS104)。なお、拡張上位ラベルy
upper
tyo(τ)および拡張下位ラベルy
lower
tyo(τ)には、それぞれ、時刻t
yoの上位ラベルy
upper
tyoおよび下位ラベルy
lower
tyoの値が複製される。
【0038】
次に、予測モデル学習部240は、データ拡張部230によって拡張されたデータに基づいて予測モデルMを学習する。具体的には、予測モデル学習部240は、上位ラベルおよび下位ラベルのそれぞれの存在確率を予測する予測モデルMのパラメータθupper,θlowerを、データ拡張の時間範囲内(tyo(τ))で、予測値y^upper
tyo(τ),y^lower
tyo(τ)の結果データyupper
tyo(τ),ylower
tyo(τ)に対する損失関数L(・)が最小化されるように決定する(ステップS105)。なお、損失関数L(・)には、予測値y^upper
tyo(τ),y^lower
tyo(τ)と、結果データyupper
tyo(τ),ylower
tyo(τ)との誤差を計算する式を含むような公知の関数が用いられる。
【0039】
次に、学習制御部250は、過学習の評価指標に用いられる値を算出する。具体的には、学習制御部250は、すべての時刻tの範囲内(1<t≦T)で温度観測値x
tを予測モデルMに入力して予測値y^
upper
t,y^
lower
tを得る(ステップS106)。なお、予測モデルMは、ステップS106において上位データ用の予測モデルM
upperと下位データ用の予測モデルM
lowerとが別個に構築されており、ステップS107では同一の温度観測値x
tが各予測モデルM
upper,M
lowerに入力される。その後、学習制御部250は、ステップS106において得られた予測値y^
upper
t,y^
lower
tを、
図5に示すように、同時刻tの鋳型温度分布データ(温度観測値x
t,d)120に対応付けて格納する。
【0040】
また、学習制御部250は、予測モデルMにより予測した予測値の時間変化率zupper
t’,zlower
t’を算出する(ステップS107)。ここで、t’=t-1である。学習制御部250は、算出されたこれらの値を用いて過学習の評価指標を算出して閾値と比較する。具体的には、学習制御部250は、予測値y^upper
t,y^lower
tに基づいて上記で式(3)に示した評価指標d1を算出し、閾値th1と比較する(ステップS108)。評価指標が閾値th1を超えている場合(ステップS108:YES)、学習制御部250はデータ拡張部230の処理および予測モデル学習部240による予測モデルの学習を再実行させる。具体的には、データ拡張幅τを拡大し(ステップS109)、ステップS104以降の処理が再実行される。なお、図示された例ではデータ拡張幅τが1だけ拡大されているが、1以外の量で拡大されてもよい。
【0041】
上記の第1の評価指標を用いた判定(ステップS108)において評価指標が閾値th1以下であった場合(ステップS108:NO)、さらに、学習制御部250は、時間変化率zupper
t’,zlower
t’および予測値y^upper
t,y^lower
tに基づいて上記で式(4)に示したような評価指標d2を、上位データ、下位データ別に算出し(d2
upper,d2
lower)、閾値th2と比較する(ステップS110)。評価指標d2
upper,d2
lowerの少なくともいずれかが閾値th2を超えている場合(ステップS110:YES)、学習制御部250は、データ拡張幅τを拡大し(ステップS109)、ステップS104以降の処理を再実行させる。ステップS108およびステップS110の判定で、いずれも評価指標が閾値以下である場合(ステップS110:NO)、その時点で予測モデル学習部240が学習している予測モデルMupper,Mlowerが記憶装置、通信装置、またはリムーバブル記憶媒体に出力される(ステップS111)。
【0042】
以上で説明したような本発明の第1の実施形態によれば、予測モデルの過学習を抑制するための評価指標d1,d2に基づいてデータ拡張幅τが決定されるため、予測モデルのバイアスとバリアンスのトレードオフの観点で最適な範囲でデータ拡張を実行することによって予測モデルの精度を向上させることができる。メニスカス流速データ110が取得されていない時刻を含めたすべての時刻tの範囲内で温度観測値xtから評価指標d1,d2が算出されるため、予測モデルの自由度(鋳型温度分布データ120の次元)に対して利用可能な観測データと結果データとのデータセット(メニスカス流速データ110と鋳型温度分布データ120とのセット)が少ない場合であっても過学習を抑制して予測モデルを構築することができる。
【0043】
(第2の実施形態)
図6は、本発明の第2の実施形態におけるシステム構成を示す図である。図示された例において、システム20は、データベース100と、演算装置300とを含む。演算装置300は、CPU、記憶装置、通信装置、入出力手段などを備え、プログラムに従って各種の演算を実行するコンピュータである。プログラムは、記憶装置に格納されるか、またはリムーバブル記憶媒体に格納されて演算装置300に読み込まれる。演算装置300は、CPUがプログラムに従って動作することによって実装される機能部分として、教師ラベル設定部210、前処理部220、予測モデル学習部340、学習制御部350、予測部260および出力部270を備える。なお、演算装置300の予測モデル学習部340および学習制御部350以外について、本実施形態の構成は上述した第1の実施形態と同様であるため、重複した説明は省略する。
【0044】
本実施形態における予測モデル学習部340および学習制御部350の機能について、
図7および
図8を合わせて参照しながら説明する。
図7は本発明の第2の実施形態における予測モデルの構築処理の例を示すフローチャートであり、
図8は
図7に示された処理を概念的に示す図である。
図7に示された例では、教師ラベル設定部210は、上位ラベルy
upper
tyoおよび下位ラベルy
lower
tyoを設定する(ステップS201)。ステップS201の処理は、上述のステップS101と同様の処理であり、
図8に示されるように、データベース100から読み出されたメニスカス流速データ110について、上位ラベルy
upper
tyoおよび下位ラベルy
lower
tyoが設定される。
【0045】
一方、データ拡張部230は、必要に応じて前処理部220による前処理を経て、時刻tについて時系列で取得された温度観測値x
tとして鋳型温度分布データ120を取得する(ステップS202)。ステップS202の処理は、上述のステップS102と同様の処理であり、
図8に示されるように、温度観測値x
t,dはD次元のデータ(1≦d≦D)であり、時刻Tまでの範囲で取得される(1≦t≦T)。
図8に示すとおり、メニスカス流速データ110が存在する時刻t
yoにおいては、メニスカス流速データ(上位ラベルy
upper
tyoおよび下位ラベルy
lower
tyo)110と鋳型温度分布データ(温度観測値x
tyo,d)120が対応付けて格納されるが、時刻t
yo以外の時刻tの鋳型温度分布データ(温度観測値x
t,d)120に対しては、対応付けられるメニスカス流速データ(上位ラベルy
upper
tおよび下位ラベルy
lower
t)110が存在しない。
【0046】
予測モデル学習部340は、上記のデータを用いて予測モデルMを学習する。本実施形態ではデータ拡張が実行されないため、予測モデル学習部340が用いるデータは、結果データと結果データに対応付けられる第1の観測データとを含む。結果データに対応付けられていない第2の観測データについては、後述する正則化項の算出によって予測モデルMに反映される。具体的には、予測モデル学習部340は、上位ラベルおよび下位ラベルのそれぞれの存在確率を予測する予測モデルMのパラメータθ
upper,θ
lowerを、教師ラベルが存在する時刻t
yoにおける予測値y^
upper
tyoの結果データy
upper
tyoに対する損失関数L(・)と、
図7に数式で示されるような2つの正則化項との和が最小化されるように決定する(ステップS203)。そのために、予測モデル学習部340は、まず、すべての時刻tの範囲内(1<t≦T)で温度観測値x
tを予測モデルMに入力して予測値y^
upper
t,y^
lower
tを得る。その後、予測モデル学習部340は、ここで得られた予測値y^
upper
t,y^
lower
tを、
図8に示すように、同時刻tの鋳型温度分布データ(温度観測値x
t,d)120に対応付けて格納する。そして、学習制御部350は、教師ラベルが存在する時刻t
yoにおける予測値y^
upper
tyo,y^
lower
tyoと結果データy
upper
tyo,y
lower
tyo(
図8の実線で囲まれた範囲のデータ)とを用いて損失関数L(・)の項を算出する。さらに、学習制御部350は、所定の正則化パラメータλ
1,λ
2に従って上記の2つの正則化項を算出する。具体的には、2つの正則化項は、それぞれ上記で説明された評価指標d
1,d
2に相当し、メニスカス流速データ110が存在する時刻t
yo以外の時刻を含むすべての時刻tの範囲内(1<t≦T)のデータ(
図8の破線で囲まれた範囲のデータ)を用いて算出される。θ
upper,θ
lowerは各々の損失関数L(・)に互いを含んでいるが、最小化では同時最適化・交互最適化など方法は問わない。最終的に、予測モデル学習部340で損失関数L(・)と評価指標d
1,d
2を含む正則化項との和が最小化されるように学習された予測モデルM
upper,M
lowerが記憶装置、通信装置、またはリムーバブル記憶媒体に出力される(ステップS204)。
【0047】
以上で説明したような本発明の第2の実施形態によれば、予測モデルの過学習を抑制するための評価指標d1,d2が予測モデルの正則化項として取り込まれるため、過学習が抑制された予測モデルを学習することができる。第1の実施形態と同様に、メニスカス流速データ110が取得されていない時刻を含めたすべての時刻tの範囲内で温度観測値xtから評価指標d1,d2が算出されるため、予測モデルの自由度(鋳型温度分布データ120の次元)に対して利用可能な観測データと結果データとのデータセット(メニスカス流速データ110と鋳型温度分布データ120とのセット)が少ない場合であっても過学習を抑制して予測モデルを構築することができる。
【実施例0048】
続いて、本発明の実施例について説明する。上記で説明した第1の実施形態に係るシステム10を用いて、鋳型温度分布からメニスカス流速のよどみの有無を推定した。鋳型に取り付けた熱電対の数は268であり、従って鋳型温度分布データの温度観測値xtは268次元(D=268)である。本実施例では、鋳型全体に熱電対を配置したが、湯面付近には他の部分よりも高い密度で熱電対を配置した。取得されたメニスカス流速の観測データ数は30であり、そのうちよどみが発生していると判定されたデータ数は12であった。これらのメニスカス流速の観測データについては、セットになる鋳型温度分布のデータも取得されている。メニスカス流速を観測していない場合における鋳型温度分布のデータ数は176256000である。予測モデルにはラッソ回帰(LASSO)を用いた。
【0049】
図9Aおよび
図9Bは、データ拡張部におけるデータ拡張幅を変化させた場合の過学習の評価指標の変化を示すグラフである。
図3に示された例のデータ拡張幅τの初期値を0(初回はデータを拡張しない)とし、閾値判定はせずにデータ拡張幅τを10[sec]ずつ、40[sec]まで拡大した場合の、各回で算出された過学習の評価指標d
1,d
2を記録した。ここで、上位ラベルは鋳片Sを鋳型幅方向に10等分した領域で平均流速vが反転する「小さなよどみ」が発生している場合に設定され、下位ラベルは鋳片Sを鋳型幅方向に3等分した領域で平均流速vが反転する「大きなよどみ」が発生している場合に設定される。
図9Aに示されるように、予測値における上位ラベルおよび下位ラベルの存在確率の大小関係に基づいて算出される評価指標d
1は、データ拡張幅τを0から20[sec]まで拡大させることで有意に低下する。
【0050】
一方、
図9Bに示されるように、「小さなよどみ」および「大きなよどみ」のそれぞれの予測値における単位時間あたりの変化量に基づいて算出される評価指標d
2は、破線で示す「小さなよどみ」についてはデータ拡張幅τを0から20[sec]まで拡大させることで有意に低下する。なお、実線で示す「大きなよどみ」については、評価指標d
2はデータ拡張幅τに関わらず低い値になった。上記の結果から、データ拡張のように結果データに対応付けられていない観測データを予測モデルの学習に利用することで、過学習を抑制するための評価指標を改善できることがわかる。
【0051】
図10は、データ拡張部におけるデータ拡張幅を変化させた場合の予測精度の変化を示すグラフである。予測精度の評価は、メニスカス流速データが取得されている時刻t
yoの温度観測値x
tyo、教師ラベルy
upper
tyo,y
lower
tyoおよび予測値y^
upper
tyo,y^
lower
tyoを用いて実行した。
図10に示された結果ではデータ拡張幅τが20[sec]の場合に最も精度が高くなっている。これは、データ拡張の適応は訓練誤差の観点では精度が悪化するが、予測の観点では精度が向上することがありうるためである。つまり、過学習の抑制、すなわちデータ拡張の適応によってバイアスが大きくなることで訓練誤差は悪化するが、同時にバリアンスが抑制されることで予測精度は向上することがありうる。グラフに示された例では、データ拡張幅20[sec]がバイアスとバリアンスのトレードオフの観点で最適であり、データ拡張幅40[sec]になるとバイアスが大きいために「小さいよどみ」における予測精度が低下している。
【0052】
図11Aおよび
図11Bは、データ拡張部におけるデータ拡張幅を変化させた場合の予測確率値の変化を示すグラフである。
図11Aに示すデータ拡張なし(±0[sec])の場合の予測モデルでは、「小さなよどみ」の存在確率が「大きなよどみ」の存在確率を下回っている時刻が存在し、また存在確率自体の変化も激しいことから、予測モデルが上述したような溶鋼流動の物理現象としての性質に沿っていないと考えられる。一方、
図11Bに示すデータ拡張あり(±20[sec])の場合の予測モデルでは、データ拡張なしの場合とは異なり「小さなよどみ」および「大きなよどみ」の存在確率の逆転は生じず、また存在確率の変化も比較的緩やかになっていることから、予測モデルがより溶鋼流動の物理現象としての性質に沿っていると考えられる。これらの結果から、データ拡張のように結果データに対応付けられていない観測データを予測モデルの学習に利用することで、過学習による予測モデルと対象の物理現象としての性質との乖離が抑制され、予測モデルの妥当性が改善されることがわかる。
【0053】
なお、上記で説明した本発明の実施形態および実施例では連続鋳造における予測モデルについて説明したが、本発明の他の実施形態では連続鋳造における予測モデル以外への適用も可能である。例えば、大量の観測データに対して少量の結果データが存在する場合であって、結果データにおいて上位および下位が定義可能であるか、または結果データについて時系列的な連続性を仮定できる場合に本発明を適用することができる。例えば上述したデータ拡張、または正則化項の導入によって結果データに対応付けられていない観測データを予測モデルの学習に用いる場合において、上記のような上位データおよび下位データの存在確率の大小関係、または予測値の時間変化率に基づいて評価指標を算出することによって、過学習を抑制した予測モデルの学習が実現できる。
【0054】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はこれらの例に限定されない。本発明の属する技術の分野の当業者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
10,20…システム、100…データベース、101…計測装置、102…熱電対、110…メニスカス流速データ、120…鋳型温度分布データ、200,300…演算装置、210…教師ラベル設定部、220…前処理部、230…データ拡張部、240,340…予測モデル学習部、241…予測モデル、250,350…学習制御部、260…予測部、270…出力部。