特許第6233423号(P6233423)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝三菱電機産業システム株式会社の特許一覧

<>
  • 特許6233423-圧延プロセスの学習制御装置 図000004
  • 特許6233423-圧延プロセスの学習制御装置 図000005
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6233423
(24)【登録日】2017年11月2日
(45)【発行日】2017年11月22日
(54)【発明の名称】圧延プロセスの学習制御装置
(51)【国際特許分類】
   G05B 13/02 20060101AFI20171113BHJP
   B21B 37/00 20060101ALI20171113BHJP
【FI】
   G05B13/02 L
   B21B37/00 261B
【請求項の数】4
【全頁数】13
(21)【出願番号】特願2015-562674(P2015-562674)
(86)(22)【出願日】2014年2月17日
(86)【国際出願番号】JP2014053622
(87)【国際公開番号】WO2015122010
(87)【国際公開日】20150820
【審査請求日】2016年7月11日
(73)【特許権者】
【識別番号】501137636
【氏名又は名称】東芝三菱電機産業システム株式会社
(74)【代理人】
【識別番号】100082175
【弁理士】
【氏名又は名称】高田 守
(74)【代理人】
【識別番号】100106150
【弁理士】
【氏名又は名称】高橋 英樹
(72)【発明者】
【氏名】久保 直博
【審査官】 稲垣 浩司
(56)【参考文献】
【文献】 特開平7−200005(JP,A)
【文献】 特開平8−132108(JP,A)
【文献】 特開平10−31505(JP,A)
【文献】 特許第2839746(JP,B2)
【文献】 特開2000−263110(JP,A)
【文献】 国際公開第2013/171862(WO,A1)
【文献】 国際公開第2014/006681(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/02
B21B 37/00
G06F 15/18
G06N 3/00 − 99/00
(57)【特許請求の範囲】
【請求項1】
圧延条件を区分する複数のセルから構成されるデータベースを有し、圧延プロセスの設定計算に用いるモデル式の学習係数を前記データベースにて管理する学習制御装置において、
前記圧延プロセスで計測された実績値と前記モデル式を用いて算出された実績再計算値とのズレに基づいて前記学習係数の瞬時値を算出し、当該圧延条件に該当するセルに対して前記瞬時値を学習日時とともに記録する瞬時値算出記録手段と、
前記瞬時値と前記学習係数の当該圧延条件での前回値とに基づいて前記学習係数の更新値を算出し、当該圧延条件に該当するセルに対して前記更新値を学習日時とともに記録する更新値算出記録手段と、
前記データベースに記憶された前記更新値の履歴情報に基づき、前記複数のセルのそれぞれについて前記学習係数の最新度を評価する最新度評価手段と、
前記データベースに記憶された前記更新値の履歴情報に基づき、前記複数のセルのそれぞれについて前記学習係数の飽和度を評価する飽和度評価手段と、
前記データベースに記憶された前記瞬時値の履歴情報に基づき、前記複数のセルのそれぞれについて前記学習係数の安定度を評価する安定度評価手段と、
前記最新度、飽和度、及び、安定度の各評価結果が基準を満たすセルの中から、圧延条件を座標軸とする空間において、次圧延条件に該当する対象セルとの空間距離が近い所定個数の近傍セルを選定する近傍セル選定手段と、
選定した前記所定個数の近傍セルにおける前記学習係数の代表値をそれぞれ決定し、前記対象セルの座標と選定した前記所定個数の近傍セルの座標及び前記代表値とに基づいて、多項式補間により前記対象セルにおける前記学習係数の推定値を算出する推定値算出手段と、
前記対象セルにおける前記学習係数の最新更新値を前記推定値で補正し、次圧延条件での前記学習係数の使用値として決定する使用値決定手段と、
備えることを特徴とする圧延プロセスの学習制御装置。
【請求項2】
前記使用値決定手段は、
前記最新更新値と前記推定値との加重平均によって前記使用値を算出する手段と、
前記対象セルに対する前記最新度、飽和度、及び安定度の評価結果が高いほど前記最新更新値の重みが大きくなり、前記評価結果が低いほど前記推定値の重みが大きくなるように、前記評価結果に応じて前記加重平均の重み係数を変化させる手段と、
を含むことを特徴とする請求項1に記載の圧延プロセスの学習制御装置。
【請求項3】
前記データベースは、セルを共通にする第1の層別テーブルと第2の層別テーブルとを含み、
前記瞬時値算出記録手段は、前記瞬時値を前記第1の層別テーブルに記録するように構成され、
前記更新値算出記録手段は、前記更新値を前記第2の層別テーブルに記録するように構成されることを特徴とする請求項1又は2に記載の圧延プロセスの学習制御装置。
【請求項4】
前記データベースは、前記第1の層別テーブル及び第2の層別テーブルとセルを共通にする第3の層別テーブルと第4の層別テーブルと第5の層別テーブルとをさらに含み、
前記最新度評価手段は、前記最新度の評価結果を前記第3の層別テーブルに記録するように構成され、
前記飽和度評価手段は、前記飽和度の評価結果を前記第4の層別テーブルに記録するように構成され、
前記安定度評価手段は、前記安定度の評価結果を前記第5の層別テーブルに記録するように構成されることを特徴とする請求項3に記載の圧延プロセスの学習制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、圧延プロセスの制御において、圧延現象を予測するモデル式の学習係数を実績データに基づき算出して圧延条件ごとに管理する学習制御装置、に関する。
【背景技術】
【0002】
圧延プロセスの制御とは、製造完了後の圧延材が所望の寸法や温度になるように圧延することである。圧延プロセス制御は、一般に設定制御とダイナミック制御からなる。設定制御では、圧延現象をモデル式により予測し、圧延材が所望の寸法や温度になるように、圧延速度、冷却水の水量、及び、圧延機のロールギャップなど、圧延設備の機器の設定値を決定する。ただし、モデル式は、圧延プロセスで起こる物理現象を完全に表現することができない。また、計算負荷の軽減、調整の利便性などの理由で、モデルを表す計算式は簡素化されている。このため、センサにより計測した実績値とモデル式で計算した予測値との間には偏差が発生する。そこで、従来の圧延プロセスの設定制御では、圧延現象の予測精度の向上と安定を図るべく、モデル式に学習係数を設けて、この学習係数を実績データに基づき自動調整する学習制御が行われている。実績データには仕上げ温度や圧延荷重が含まれ、これらは設定計算の狙い点について収集される。
【0003】
ここで、一般的な圧延プロセスの学習制御の概要について説明する。学習制御は複数の処理から成り、その1つが実績再計算である。実績再計算では、モデル式を使って実績データに基づくモデル予測値を算出する。これを一般に実績再計算値と呼ぶ。実績再計算値は実績データに含まれる実績値と比較されて、実績値に対する実績再計算値の誤差、すなわち、モデル誤差が算出される。例えば、圧延機のロールギャップの設定制御の場合、ロードセルにて計測された圧延荷重の実績値と、モデル式を用いて実績データから計算された圧延荷重の実績再計算値とが比較され、圧延荷重のモデル誤差が算出される。
【0004】
そして、モデル誤差に基づいて学習係数が算出される。このとき算出された学習係数を学習係数の瞬時値と言う。ただし、モデル誤差がモデル式を簡素化して構築する上で無視された要因の内、どの要因に起因しているかが不明であること、また、学習に使う実績データ自体に外乱や誤差が含まれていることから、モデル誤差から算出した学習係数の瞬時値をそのまま次の圧延材に適用することはできない。そこで、学習係数の瞬時値を平滑フィルターに通すことが行われる。学習係数の瞬時値を平滑化して得られる値が学習係数の更新値として用いられる。
【0005】
以下の式は、学習係数の瞬時値から更新値を算出する平滑フィルターの式の具体例である。学習係数の瞬時値と学習係数の前回値(更新値の前回値)との偏差に更新ゲインを乗じ、それに学習係数の前回値を加算することによって、学習係数の更新値が算出される。
Znew = Zuse*(1-α) + Zcur*α
ここで、Znew: 学習係数更新値
Zcur: 学習係数(瞬時値)
Zuse: 学習係数(前回値)
α : 学習係数更新ゲイン(フィルターの時定数)
【0006】
算出された学習係数の更新値は、一般的に、層別テーブルに記録される。層別とは、圧延材の厚み、幅、歪、歪速度、温度といった圧延条件を区分する概念である。例えば、厚みをm区分、幅をn区分する場合、層別テーブルはm×n個のセルから構成される。当該材の圧延が終わる毎に学習係数の更新値が算出され、当該材の圧延条件に一致するセルに記録される。学習係数の記録に層別テーブルを用いることで、圧延条件毎に異なる学習係数を適切に管理することができ、圧延現象の予測制度が向上する。つまり、層別テーブルを用いた学習制御は、モデル式の圧延現象の予測精度を確保し、成品の品質精度と圧延の安定性を確保するために重要な機能である。
【0007】
ただし、層別テーブルを用いた学習制御には問題もある。層別テーブルで学習係数を管理することで、学習係数は層別テーブルの内、該当する1つのセルで管理され、そのセル毎に平滑化されて更新される。このため、1つのセルの学習係数が飽和するのに多数の圧延機会(圧延本数)が必要となる。また、圧延条件が少しでも異なるセル番号が選択されるため、学習係数は異なるセルについて新たに更新されていくことになる。このため、層別テーブルを構成する全てのセルについて、セル毎に多数の圧延機会が必要となる。
【0008】
必要な圧延機会を少なくする1つの案として、1つのセルの学習係数を更新するときに、隣接するセルの学習係数も同時に更新する方法が考えられる。この学習方法では、以下の式に示すように、当該圧延条件に対応する当該セル(i,j)に対しては、前述と同じ方法で学習係数を計算する。なお、(i,j)は層別テーブルにおける当該セルの座標を示している。
Znew(i,j) = Zuse(i,j)*(1-α) + Zcur(i,j)*α
ここで、Znew(i,j): 当該セルの学習係数更新値
Zcur(i,j): 当該セルの学習係数(瞬時値)
Zuse(i,j): 当該セルの学習係数(前回値)
α : 当該セルの学習係数更新ゲイン(フィルターの時定数)
【0009】
隣接するセル(p,q)に対しては、以下の式にて学習係数を計算する。なお、(p,q)は層別テーブルにおける隣接するセルの座標を示し、これには(i-1,j)、(i,j-1)、(i+1,j)、及び、(i+1,j)が含まれる。
Znew(p,q) = Zuse(p,q)*(1-α’) + Zcur(i,j)*α’
ここで、Znew(p,q): 隣接するセルの学習係数更新値
Zcur(i,j): 当該材セルの学習係数(瞬時値)
Zuse(p,q): 隣接するセルの学習係数(前回値)
α’ : 隣接するセルの学習係数更新ゲイン(フィルターの時定数)
【0010】
この学習方法によると、隣接するセルの学習係数をできるだけ少ない圧延機会で飽和させることができる。しかし、隣接するセルは学習が進むものの、当該セルから少し離れたセルの学習係数は更新することができない。つまり、この学習方法では、圧延機会を少なくすることに関して限定的な効果しか得ることができない。また、当該セルの学習係数が不安定で更新の度に変動が大きい場合、隣接するセルの学習係数もその影響を受けることになってしまう。
【0011】
さらに、層別テーブルを用いた学習制御には上記とは別の問題もある。その問題とは、セルが細分化されているために圧延プロセスの経時変化に追従しにくいと言うことである。あるセルに該当する圧延条件についてしばらくの間圧延がない場合、その間に圧延プロセスが変化する可能性がある。ここで言う圧延プロセスの変化には、熱延における温度レベルの変化などの能動的な変化と設備の劣化などの受動的な変化の双方が含まれる。圧延プロセスが変化すれば、真の学習係数にも変化が生じる。このため、層別テーブルに記録されている学習係数の更新値が古いままとなっている場合、その値は適切ではないおそれがある。適切な値でない学習係数をモデル式に適用した場合には、モデル予測値に含まれる誤差が大きくなり、機器の設定値の精度を低下させてしまう。
【0012】
このように、従来一般的に用いられている層別テーブルを用いた学習制御には種々の問題がある。一方、層別テーブルを用いた学習制御には、下記の特許文献1,2に開示される提案も存在する。
【0013】
特許文献1に開示されている提案は、モデルと現象とのズレに含まれる時系列的な変動によるズレを時系列学習係数として分離すると言う方法である。当該圧延条件に対応する学習係数を圧延現象に依存するグループ別学習係数と時間変化に依存する時系列学習係数とに分けて計算し、これら2種類の学習係数に基づいてモデル予測値を修正することでその精度を向上させている。具体的には、モデル誤差から計算した学習係数の瞬時値と、当該圧延条件での圧延現象に関わる学習係数の使用値とに基づき、平滑フィルターを用いて時系列学習係数の更新値が算出される。そして、学習係数の瞬時値から時系列学習係数の更新値を取り去った後に残った値に基づき、平滑フィルターを用いて当該圧延条件での圧延現象に関わる学習係数の更新値が算出される。
【0014】
特許文献1で提案されている学習方法によれば、プロセスラインの時系列的な変動によるズレを時系列学習係数として抽出することができる。しかし、この学習方法でも圧延現象に依存するグループ別学習係数はセル毎に行われている。このため、ある圧延条件による圧延が暫く行われない間に圧延プロセスに変化があり、それによって当該圧延条件でのモデルと現象とのズレに変動が生じたとしても、それは当該圧延条件のセルに記録された学習係数には反映されない。よって、圧延プロセスの変化後の当該圧延条件での1本目の圧延では、モデルと現象との間のズレを適切に修正した学習係数を得ることができない。
【0015】
特許文献2に開示されている提案は、圧延材の区分に対応するロット(セル)毎にモデル式の学習項を記録するものにおいて、ロットが変更されるごとに次のロットに対応する学習項の習熟度を判定し、習熟度が基準よりも低い場合には、習熟度が高い他のロットの学習項を使用して次のロットの学習項を補正すると言う方法である。具体的には、次のロットの学習項の学習回数が基準回数以上かどうかと、次のロットに対応する学習項の最新の所定回の標準偏差が基準値以下かどうかを基準にして、次のロットの学習項の習熟度が判定される。そして、習熟度が基準よりも低い場合には、テーブル上で当該ロットに隣接する各ロットの学習項と、その習熟度に応じて決定される補正係数とに基づき、平滑化フィルターを用いて当該ロットの学習項の補正が行われる。
【0016】
特許文献2で提案されている学習方法によれば、次のロットの学習項が未習熟であっても、隣接する習熟したロットの学習項を使用して未習熟のロットの学習項を最適化することができる。しかし、必ずしも隣接するロットの学習項が次のロットの学習項よりも習熟しているとは限らない。次のロットの学習項が未習熟であり、隣接するロットの学習項も未習熟であった場合には、次のロットに関しては未習熟な学習項に基づいて設定計算を行わざるを得なくなる。また、隣接するロットの学習項が不安定である場合、つまり、更新の度に値が大きく変動するような場合は、それを用いて補正される次のロットの学習項も不安定になってしまう。さらに、圧延が暫く無い間の圧延プロセスの変化によって隣接するロットの学習項の精度が経時劣化している場合には、それを用いて補正される次のロットの学習項の精度も低くなってしまう。
【先行技術文献】
【特許文献】
【0017】
【特許文献1】日本特許第2839746号公報
【特許文献2】日本特開2000−263110号公報
【発明の概要】
【発明が解決しようとする課題】
【0018】
以上述べたように、特許文献1,2で提案されている何れの学習方法であっても、前述の課題の全てを解決できる訳ではない。つまり、学習係数の飽和度が低い場合の問題(飽和度の問題)、学習係数が不安定で変動が大きい場合の問題(安定度の問題)、そして、圧延が暫く無い間の圧延プロセスの変化によって学習係数が古くなったときの問題(最新度の問題)は、現在においても十分に解決されているとは言えない。
【0019】
本発明は、上記の課題に鑑みなされたものであり、設定計算に用いるモデル式の学習係数を圧延条件ごとに学習し管理する学習制御装置において、各圧延条件において飽和度、安定度、最新度の何れも満足する学習係数を得られるようにすることを目的とする。
【課題を解決するための手段】
【0020】
本発明に係る学習制御装置は、圧延条件を区分する複数のセルから構成されるデータベースを有し、圧延プロセスの設定計算に用いるモデル式の学習係数をデータベースにて管理する学習制御装置であって、上記目的を達成するために以下のように構成される。
【0021】
本発明に係る学習制御装置は、学習係数を算出してデータベースに記録する手段として、瞬時値算出記録手段と更新値算出記録手段とを備える。瞬時値算出記録手段は、圧延プロセスで計測された実績値とモデル式を用いて算出された実績再計算値とのズレに基づいて学習係数の瞬時値を算出し、そして、算出した瞬時値を当該圧延条件に該当するセルに対して学習日時とともに記録するように構成される。瞬時値算出記録手段のこのような構成により、データベースにはセルごとに瞬時値の履歴情報が記録される。更新値算出記録手段は、瞬時値算出手段が算出した学習係数の瞬時値と学習係数の当該圧延条件での前回値とに基づいて学習係数の更新値を算出し、そして、算出した更新値を当該圧延条件に該当するセルに対して学習日時とともに記録するように構成される。更新値算出記録手段のこのような構成により、データベースにはセルごとに更新値の履歴情報が記録される。
【0022】
なお、セルにより区分される圧延条件が2項目の場合、瞬時値と更新値のそれぞれの履歴情報を層別テーブルにて管理してもよい。つまり、データベースをセルを共通にする第1の層別テーブルと第2の層別テーブルとを含むように構成し、瞬時値算出記録手段による瞬時値の記録は第1の層別テーブルに対して行い、更新値算出記録手段による更新値の記録は第2の層別テーブルに対して行うようにしてもよい。
【0023】
本発明に係る学習制御装置は、学習係数の最新度を評価する最新度評価手段、学習係数の飽和度を評価する飽和度評価手段、そして、学習係数の安定度を評価する安定度評価手段を備える。最新度評価手段は、データベースに記録された更新値の履歴情報に基づき、複数のセルのそれぞれについて学習係数の最新度を評価するように構成される。飽和度評価手段は、データベースに記録された更新値の履歴情報に基づき、複数のセルのそれぞれについて学習係数の飽和度を評価するように構成される。安定度評価手段は、データベースに記録された瞬時値の履歴情報に基づき、複数のセルのそれぞれについて学習係数の安定度を評価するように構成される。
【0024】
なお、瞬時値と更新値の各履歴情報と同様に、最新度、飽和度、及び、安定度のそれぞれの評価結果についても層別テーブルにて管理することができる。この場合、データベースは、第1及び第2の層別テーブルとセルを共通にする第3ないし第5の層別テーブルをさらに含むように構成すればよい。そして、最新度評価手段による最新度の評価結果の記録は第3の層別テーブルに対して行い、飽和度評価手段による飽和度の評価結果の記録は第4の層別テーブルに対して行い、安定度評価手段による安定度の評価結果の記録は第5の層別テーブルに対して行うようにすればよい。
【0025】
さらに、本発明に係る学習制御装置は、近傍セル選定手段、推定値算出手段、及び、使用値決定手段を備える。近傍セル選定手段は、最新度、飽和度、及び、安定度のそれぞれの評価結果が基準を満たすセルの中から、圧延条件を座標軸とする空間において、次圧延条件に該当する対象セルとの空間距離が近い所定個数の近傍セルを選定するように構成される。推定値算出手段は、選定した所定個数の近傍セルにおける学習係数の代表値をそれぞれ決定し、対象セルの座標と選定した所定個数の近傍セルの座標及び代表値とに基づいて、多項式補間により、対象セルにおける学習係数の推定値を算出するように構成される。そして、使用値決定手段は、対象セルにおける学習係数の最新更新値を推定値で補正し、次圧延条件での学習係数の使用値として決定するように構成される。
【0026】
好ましくは、使用値決定手段は、最新更新値と推定値との加重平均によって使用値を算出するように構成される。対象セルに対する最新度、飽和度、及び、安定度の評価結果が高いほど最新更新値の重みが大きくなり、評価結果が低いほど推定値の重みが大きくなるように、評価結果に応じて加重平均の重み係数を変化させることがより好ましい。
【発明の効果】
【0027】
以上のように構成される本発明に係る学習制御装置によれば、次材の圧延条件が該当するセルについて、最新で、飽和度が高く、安定度が高い学習係数を適用することができる。これにより、設定制御におけるモデル予測値の精度を向上させ、ひいては、成品品質の精度、及び、操業の安定性を改善することができる。
【図面の簡単な説明】
【0028】
図1】本発明の実施の形態に係る圧延プロセスの学習制御装置の構成と処理のフローを示す図である。
図2】学習係数の推定値の算出方法を説明する図である。
【発明を実施するための形態】
【0029】
以下、図面を参照して、本発明の実施の形態を説明する。
【0030】
本実施の形態に係る圧延プロセスの学習制御装置の構成と処理のフローを図1に示す。本学習制御装置1は、学習装置10、記憶装置20、及び、設定計算装置30を備える。学習装置10は、設定計算に用いるモデル式の学習係数を圧延プロセスの実績データに基づいて学習する装置である。記憶装置20は、モデル式の学習係数及びそれに関連する情報をデータベースに記憶する装置である。このデータベースは、圧延条件を区分する複数のセルから構成されている。より詳しくは、セルを共通にする5つの層別テーブル21,22,23,24,25から構成されている。なお、セルを共通にするとは、テーブル間においてセルの座標が同一であれば該当する圧延条件も同じであり、座標が同一のセルはテーブル間で紐付けされていることを意味する。本実施の形態では、圧延条件は圧延材の厚みと幅の2項目であり、各層別テーブルには厚みと幅を軸とするテーブルが用いられている。厚みの番号が“i”、幅の番号が“j”である場合、(i,j)が各層別テーブルにおけるセルの座標となる。設定計算装置30は、データベースに記憶された学習係数を用いてモデル予測値を計算し、モデル予測値に基づいて圧延装置の機器の設定値を決定する装置である。
【0031】
まず、学習装置10の詳細について説明する。処理ユニット11は、圧延プロセスの実績データに基づいて、モデル予測値の実績再計算を行う。処理ユニット12は、処理ユニット11で算出された実績再計算値と実績データに含まれる実績値との間のモデル誤差に基づいて、学習係数の瞬時値を算出する。処理ユニット13は、処理ユニット12で算出された学習係数の瞬時値を平滑フィルターに通すことによって、学習係数の更新値を算出する。学習係数の瞬時値及び更新値の算出方法は、「背景技術」にて説明した従来の学習制御における内容と同じである。
【0032】
本学習制御装置は、1本の圧延材の圧延が完了した後、その材の圧延条件が該当するセルに学習係数の瞬時値と更新値をそれぞれ記録する。詳しくは、学習係数の瞬時値は、第1の層別テーブル21に記録される。処理ユニット12は、第1の層別テーブル21を構成する複数のセルの中から当該圧延条件に該当するセルを選択する。そして、選択したセルに対して、算出した瞬時値を時系列に記録していくことによって、第1の層別テーブル21に瞬時値の履歴情報を記憶させる。より詳しくは、第1の層別テーブル21には、個々のセル毎に、過去N本分の圧延材について、学習係数の瞬時値が学習日時とともに履歴情報として記憶される。記憶された情報は、新しいものから番号が付される。すなわち、新しく記憶された情報を1番目とし、情報が追加される度にi番目の情報にはi+1番の番号が新たに付される。また、情報が追加されるときに既にN本分の情報が記憶されていれば、最も古いN番目の情報を破棄し、N-1番目の情報に新たにN番の番号が付される。
【0033】
学習係数の更新値は、第2の層別テーブル22に記録される。処理ユニット13は、第2の層別テーブル22を構成する複数のセルの中から当該圧延条件に該当するセルを選択する。そして、選択したセルに対して、算出した更新値を時系列に記録していくことによって、第2の層別テーブル22に更新値の履歴情報を記憶させる。より詳しくは、第2の層別テーブル22には、個々のセル毎に、過去M本分の圧延材について、学習係数の更新値が学習日時とともに履歴情報として記憶される。記憶された情報は、学習係数の瞬時値に関する履歴情報と同じく、新しいものから番号が付される。すなわち、新しく記憶された情報を1番目としてi番目の情報にはi+1番の番号が新たに付され、既にM本分の情報が記憶されていれば、最も古いM番目の情報を破棄してM-1番目の情報に新たにM番の番号が付される。
【0034】
本学習制御装置は、学習係数の更新値と瞬時値のそれぞれの履歴情報を更新した後、学習係数に関して3つの評価を行う。第1の評価は学習係数の最新度の評価であって、これは全てのセルについて行う。第2の評価は学習係数の飽和度の評価であって、これは当該材の圧延条件に対応する当該セル、つまり、今回の処理で履歴情報の更新が行われたセルについて行う。第3の評価は学習係数の安定度の評価であって、これも当該セルについて行う。
【0035】
学習係数の最新度の評価は処理ユニット14が行う。処理ユニット14は、第2の層別テーブル22に記憶された学習係数の更新値の履歴情報に基づき、第2の層別テーブル22の各セルの学習係数の更新値が新しいものであることを評価する。各セルの更新が一定日時以降に更新されていれば、その学習係数の更新値を新しいものと判断できる。この判断には以下の式が用いられる。
ε(k,l) < εtime
ここで、(k,l): セルの座標(ただし、k,lは全ての圧延条件の組合せ)
ε(k,l): 当該材の学習係数の更新日時とセル(k,l)の更新日時の時間差
εtime: 最新度の判定基準値
【0036】
上記の式が満たされた場合、処理ユニット14は、セル(k,l)が記憶している学習係数の更新値は最新であると判断し、FCZtime(k,l)を1とする。上記の式が満たされない場合、処理ユニット14は、セル(k,l)が記憶している学習係数の更新値は最新でないと判断し、FCZtime(k,l)を0とする。なお、FCZtime(k,l)は学習係数の更新値の最新度の評価結果を示す数値であり、1ならば最新、0ならば最新でないことを意味する。処理ユニット14は、上記の式による判断を全てのセルについて行う。
【0037】
処理ユニット14によってセル毎に決定された最新度評価値FCZtime(k,l)は、第3の層別テーブル23の対応するセルに記録される。
【0038】
学習係数の飽和度の評価は処理ユニット15が行う。処理ユニット15は、第2の層別テーブル22に記憶された学習係数の更新値の履歴情報に基づき、当該セルについて、その学習係数の更新値が飽和していることを評価する。学習係数の更新値の1番目からm番目(m=<M)の値について、m番目からm-1番目、i番目からi-1番目、2番目から1番目と各々の学習係数の更新値の変化量を算出し、その変化量が0に向かって収斂していれば、当該セルの学習係数の更新値は飽和していると判断できる。この判断には以下の式が用いられる。
CZmdf(r,s) < εmdf
ここで、(r,s): 当該セルの座標
CZmdf(r,s): 当該セルの学習係数の更新値の変化量の平均値
εmdf: 飽和度の判定基準値
更新値の変化量の平均値CZmdf(r,s)は、次の式によって算出される。
【数1】
ここで、Zmdf(r,s)(i): 学習係数の更新値のi番目の記憶値
【0039】
上記の式が満たされた場合、処理ユニット15は、当該セル(r,s)が記憶している学習係数の更新値は飽和している判断し、FCZmdf(r,s)を1とする。上記の式が満たされない場合、処理ユニット15は、当該セル(r,s)が記憶している学習係数の更新値は飽和していないと判断し、FCZmdf(r,s)を0とする。また、M<mの場合、処理ユニット15は、FCZmdf(r,s)を0とする。なお、FCZmdf(r,s)は学習係数の更新値の飽和度の評価結果を示す数値であり、1ならば飽和している、0ならば飽和していないことを意味する。
【0040】
処理ユニット15によって決定された飽和度評価値FCZmdf(r,s)は、第4の層別テーブル24の当該セル(r,s)に記録される。
【0041】
学習係数の安定度の評価は処理ユニット16が行う。処理ユニット16は、第1の層別テーブル21に記憶された学習係数の瞬時値の履歴情報に基づき、当該セルについて、その学習係数の瞬時値が安定していることを評価する。学習係数の瞬時値の1番目からn番目(n=<N)の値について、その変動量が小さければ、当該セルの学習係数の瞬時値は安定していると判断できる。この判断には以下の式が用いられる。
CZcur(r,s) < εcur
ここで、(r,s): 当該セルの座標
CZcur(r,s): 当該セルの学習係数の瞬時値の変化量の標準偏差
εcur: 安定度の判定基準値
瞬時値の変化量の標準偏差CZcur(r,s)は、次の式によって算出される。
【数2】
ここで、Zcur(r,s)(i): 学習係数の瞬時値のi番目の記憶値
【0042】
上記の式が満たされた場合、処理ユニット16は、当該セル(r,s)が記憶している学習係数の瞬時値は安定している判断し、FCZcur(r,s)を1とする。上記の式が満たされない場合、処理ユニット16は、当該セル(r,s)が記憶している学習係数の瞬時値は安定していないと判断し、FCZcur(r,s)を0とする。また、N<nの場合、処理ユニット16は、FCZcur(r,s)を0とする。なお、FCZcur(r,s)は学習係数の瞬時値の安定度の評価結果を示す数値であり、1ならば安定している、0ならば安定していないことを意味する。
【0043】
処理ユニット16によって決定された安定度評価値FCZcur(r,s)は、第5の層別テーブル25の当該セル(r,s)に記録される。
【0044】
以上の処理により、当該材の圧延条件に該当するセルについて学習係数の瞬時値と更新値が記憶される。さらに、全てのセルについて学習係数の最新度が評価され、また、当該セルについて学習係数の飽和度及び安定度が評価され、それらの評価値もまた、対応するセルに記憶される。
【0045】
次に、設定計算装置30の詳細について説明する。設定計算装置30は、次材の圧延条件が該当するセル、すなわち、モデル式を用いたモデル予測の対象となる対象セルについて2つの方法で学習係数を求め、これらから次材の圧延時に適用する学習係数の使用値を算出する。1つの方法は、第2の層別テーブル22に記憶されている学習係数の更新値の履歴情報から、次材の圧延条件が該当するセルの最新の更新値を索引して読み出す方法である。この方法に係る処理は処理ユニット33によって行われる。ここで、次材のセルの座標を(t,u)とし、処理ユニット33によって読み出された学習係数の更新値をZmod(t,u)とする。
【0046】
もう1つの方法は、次材のセルの近傍のセルの学習係数を使って、次材のセルにおける学習係数の推定値を算出する方法である。この方法に係る処理は処理ユニット31,32によって行われる。具体的には、まず、処理ユニット31が次材のセルの近傍のセルの中から所定の条件を満たすセルを選定する。その条件とは以下の3つの条件である、
1)比較的新しいデータで学習更新がなされている。
2)学習係数の更新値が飽和している。
3)学習係数の瞬時値が安定している。
【0047】
処理ユニット31は、第3の層別テーブル23、第4の層別テーブル24、及び、第5の層別テーブル25の全てにおいて評価結果が1と判定されているセルを選択する。そして、選択したセルの中から、次材が該当するセル(t,u)に空間距離が近いセルを順に3つ抽出する。ここで、選択した3つのセルをセルA(ta,ua)、セルB(tb,ub)、セルC(tc,uc)とする。
【0048】
処理ユニット32は、処理ユニット31が選択したセルA(ta,ua)、セルB(tb,ub)、セルC(tc,uc)について、第1の層別テーブル21に記憶された瞬時値の履歴情報に基づき、最新K個の瞬時値を代表する代表値(例えば、最新K個の平均値又は中央値、或いは、最新K個から最大値と最小値とを除いたK-2個の平均値又は中央値、等)を算出する。ここでは、セルA(ta,ua)の代表値をZestm(ta,ua)、セルB(tb,ub)の代表値をZestm(tb,ub)、セルC(tc,uc)の代表値をZestm(tc,uc)とする。
【0049】
処理ユニット32は、これらの3つの学習係数の代表値を用いて、選択したセルA(ta,ua)、セルB(tb,ub)、セルC(tc,uc)の各座標とそれらの各代表値との間に成り立つ1次多項式を特定する。つまり、図2に示すように、圧延条件である幅及び厚さと学習係数とをそれぞれ軸とする3次元空間において、3つの座標点(ta,ua,Zestm(ta,ua))、(tb,ub,Zestm(tb,ub))、(tc,uc,Zestm(tc,uc))を通る平面を求める。この平面は以下の式を満たすものとして求めることができる。
Zestm(t,u)= a*t+b*u+c
ここで、上記平面の式の係数a,b,cは、以下の条件を満たすものとして計算される。
Zestm(ta,ua)= a*ta+b*ua+c
Zestm(tb,ub)= a*tb+b*ub+c
Zestm(tc,uc)= a*tc+b*uc+c
【0050】
上記の式で特定される平面上では、学習係数の最新度、飽和度、及び、安定度の各基準が満たされることが経験により確認されている。処理ユニット32は、次材が該当するセル(t,u)に対して、上記式を用いた多項式補間によって学習係数を算出することにより、最新度、飽和度、及び、安定度を満たす学習係数の推定値を算出する。ここで、処理ユニット34によって算出された学習係数の推定値をZestm(t,u)とする。
【0051】
以上の手順により、次材が該当するセル(t,u)について、学習係数の更新値Zmod(t,u)と学習係数の推定値Zestm(t,u)が得られる。処理ユニット35は、これら2つの学習係数に基づいて、次材の圧延条件での学習係数の使用値を算出する。より詳しくは、以下の加重平均の式により、学習係数の更新値Zmod(t,u)を学習係数の推定値Zestm(t,u)で補正することによって、学習係数の使用値を決定する。
Zuse(t,u)=β*Zmod(t,u) + (1−β)*Zestm(t,u)
ここで、Zuse(t,u): 学習係数の使用値。
β: 重み係数(0 =< β =< 1)
【0052】
処理ユニット35は、学習係数の更新値Zmod(t,u)の最新度、飽和度、安定度が良好であれば、重み係数βの値を大きくすることで学習係数の更新値Zmod(t,u)に重みを与える。逆に、学習係数の推定値Zestm(t,u)の最新度、飽和度、安定度が良好であれば、重み係数βの値を小さくすることで学習係数の推定値Zestm(t,u)に重みを与えることができる。重み係数βの決定方法の例を以下に示す。
β=1.0 (更新値Zmod(t,u)が最新度、飽和度、安定度とも満たす場合)
β=0.6 (更新値Zmod(t,u)が最新度、飽和度、安定度の2つを満たす場合)
β=0.4 (更新値Zmod(t,u)が最新度、飽和度、安定度の1つを満たす場合)
β=0.0 (更新値Zmod(t,u)が最新度、飽和度、安定度の1つも満たさない場合)
【0053】
処理ユニット36は、処理ユニット35によって算出された学習係数の使用値によってモデル式を補正する。これにより、モデル式による予測計算の精度向上が図られる。そして、補正されたモデル式を用いて設定計算を行い、圧延装置の機器の設定値を決定する。このようにして決定された設定値に従って各機器を走査することにより、成品品質の精度、及び、操業の安定性を改善することができる。
【0054】
以上、本発明の実施の形態について説明した。ただし、本発明は上述の実施の形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。例えば、セルにより区分される圧延条件は2項目より多くても良い。上述の実施の形態では圧延条件は幅と厚さの2項目としているが、圧延条件を3項目以上として3次元以上の多次元データベースによって学習係数を管理することもできる。圧延条件が3項目であれば、圧延条件を軸とする3次元空間において、最新度、飽和度、及び、安定度が基準を満たすセルの中から対象セルに空間距離が近いセルを順に4つ選択することにより、多項式補間によって対象セルにおける学習係数の推定値を算出することができる。
【0055】
なお、上述の実施の形態では、処理ユニット12が瞬時値算出記録手段に相当し、処理ユニット13が更新値算出記録手段に相当し、処理ユニット14が最新度評価手段に相当し、処理ユニット15が飽和度評価手段に相当し、処理ユニット16が安定度評価手段に相当する。また、処理ユニット31が近傍セル選定手段に相当し、処理ユニット32が推定値算出手段に相当し、処理ユニット34,35が使用値決定手段に相当する。本学習制御装置1を構成するコンピュータのメモリには、各処理ユニットに対応するルーチンが1つのプログラムとなって記憶されている。そのプログラムがコンピュータのプロセッサにより実行されることにより、コンピュータは各処理ユニットとして機能する。
【符号の説明】
【0056】
1 学習制御装置
10 学習装置
20 記憶装置(データベース)
21,22,23,24,25 層別テーブル
30 設定計算装置
図1
図2