(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-06
(45)【発行日】2022-12-14
(54)【発明の名称】金属材料生産システムおよび金属材料生産方法
(51)【国際特許分類】
G05B 19/418 20060101AFI20221207BHJP
G06Q 50/04 20120101ALI20221207BHJP
【FI】
G05B19/418 Z
G06Q50/04
(21)【出願番号】P 2019001383
(22)【出願日】2019-01-08
【審査請求日】2021-09-22
(73)【特許権者】
【識別番号】000005290
【氏名又は名称】古河電気工業株式会社
(74)【代理人】
【識別番号】100114292
【氏名又は名称】来間 清志
(74)【代理人】
【識別番号】100205659
【氏名又は名称】齋藤 拓也
(72)【発明者】
【氏名】磯松 岳己
(72)【発明者】
【氏名】笠原 正靖
(72)【発明者】
【氏名】曹 勇
【審査官】石田 宏之
(56)【参考文献】
【文献】特開2017-042882(JP,A)
【文献】米国特許出願公開第2013/0178952(US,A1)
【文献】特開2011-258113(JP,A)
【文献】特開平09-258804(JP,A)
【文献】特開2017-030152(JP,A)
【文献】特開平06-145930(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 19/418
G06Q 50/04
(57)【特許請求の範囲】
【請求項1】
金属材料生産部と機械学習部とを有する金属材料生産システムであって、
前記機械学習部は、
前記金属材料生産部において実行中の金属材料生産に関する物理量を観測する状態観測部[A]と、
前記状態観測部[A]で観測した前記物理量を、データとして記憶する物理量データ記憶部[B]と、
機械学習における報酬条件を設定する報酬条件設定部[C]と、
前記状態観測部[A]で観測した前記物理量のデータ、および前記報酬条件設定部[C]で設定された前記報酬条件に基づいて報酬を算出する報酬計算部[D]と、
前記報酬計算部[D]で算出した前記報酬、前記物理量データ、および前記金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行う生産条件学習部[E]と、
前記生産条件学習部[E]で機械学習した学習結果を記憶する学習済み条件記憶部[F]と、
前記生産条件学習部[E]での前記学習結果に基づいて、前記金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する生産条件出力部[G]と、を備え
、
前記物理量データ記憶部[B]、前記報酬条件設定部[C]、前記報酬計算部[D]、前記生産条件学習部[E]および前記学習済み条件記憶部[F]の少なくともいずれか1つに、前記金属材料生産部で製造された金属材料を用いて測定した金属材料の表面状態、形状、材料強度および曲げ加工性からなる外部データとして入力し、前記生産条件学習部[E]の学習に使用することを特徴とする、金属材料生産システム。
【請求項2】
前記学習済み記憶部[F]に記憶された学習結果を前記生産条件学習部[E]の学習に使用することを特徴とする、請求項
1に記載の金属材料生産システム。
【請求項3】
前記生産条件学習部[E]で学習した結果を、前記生産条件出力部[G]に反映させて、前記金属材料生産部の制御ユニットに指示を出すことを特徴とする、請求項
1または2に記載の金属材料生産システム。
【請求項4】
前記報酬計算部[D]は、前記物理量のデータにあらかじめ許容範囲が設定され、前記物理量のデータの数値が、前記許容範囲内に収まると、プラスの報酬を与えるように算出することを特徴とする、請求項
1~3のいずれか1つに記載の金属材料生産システム。
【請求項5】
前記報酬計算部[D]は、前記物理量のデータにあらかじめ許容範囲値が設定され、前記物理量のデータの数値が、前記許容範囲外になると、前記許容範囲の限界値からの前記物理量のデータの数値のずれ幅に応じてマイナスの報酬を与えるように算出することを特徴とする、請求項
1~4のいずれか1つに記載の金属材料生産システム。
【請求項6】
金属材料を生産するに際し、
状態観測部[A]により、実行中の金属材料生産に関する物理量を観測する工程と、
物理量データ記憶部[B]に前記物理量をデータとして記憶する工程と、
報酬条件設定部[C]により、機械学習における報酬条件を設定する工程と、
報酬計算部[D]により、前記状態観測部[A]で観測した前記物理量のデータ、および前記報酬条件設定部[C]で設定された前記報酬条件に基づいて報酬を算出する工程と、
生産条件学習部[E]により、前記報酬計算部[D]が算出した前記報酬、前記物理量データ、および前記金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行う工程と、
学習済み条件記憶部[F]に前記生産条件学習部[E]で機械学習した学習結果を記憶する工程と、
生産条件出力部[G]により、前記生産条件学習部[E]での前記学習結果に基づいて、前記金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する工程と、を備え
、
前記物理量データ記憶部[B]、前記報酬条件設定部[C]、前記報酬計算部[D]、前記生産条件学習部[E]および前記学習済み条件記憶部[F]の少なくともいずれか1つに、前記金属材料生産部で製造された金属材料を用いて測定した金属材料の表面状態、形状、材料強度および曲げ加工性からなる外部データとして入力し、前記生産条件学習部[E]の学習に使用することを特徴とする、金属材料生産方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、金属材料生産部と機械学習部とを有する金属材料生産システムおよび金属材料生産方法に関し、特に、金属材料生産部を構成する複数の設備において、各設備の生産条件を、熟練オペレータ(人)による調整を行なわなくても、常に最適な生産条件で安定して金属材料を製造することができる金属材料生産システムを実現する。
【背景技術】
【0002】
金属材料を製造するには、金属材料に求められる機械特性、電気的特性、形状、表面状態などの品質に応じて、その製造時における複数の設備に無数に存在する生産条件の中から、1つの生産条件を選択して製造する必要がある。また、その材質、幅、板厚などの設計も考慮して、生産条件(例えば圧延、熱処理、表面処理時などの条件)を決定する必要がある。したがって、製造する金属材料ごとに、生産条件の最適な値を決定する条件出し作業を行う必要がある。しかしながら、各工程の最適な生産条件を見出すには、熟練オペレータ(人)が、経験に基づいて加工後の形状や表面状態を、検出器や目視にて状況を確認しながら各種操作条件を調整し、最適になるよう操作する必要がある。そのため、オペレータが時間をかけて最適の生産条件を決定する必要がある。また、経験の少ないオペレータが、熟練オペレータのように各設備の最適な生産条件を決定できるようになるには、長期間の教育が必要であった。
【0003】
オペレータによる最適操作条件の条件出し作業を軽減するための従来技術として、一般に、検出器で検知した数値が規定を外れるとアラームが鳴る技術や、検出器で検出した表面欠陥部のサイズや位置をモニターで示す技術がある。
【0004】
また、特許文献1は、射出成形機の条件出し作業において、成形条件を変更した際にその変更した条件の履歴を保持しておき、適切な成形を達成していた特定の時点における過去の成形条件を再生する場合において、その変更履歴を現在から特定の時点の時点まで遡って読み出す技術が開示されている。このような技術によれば、過去の射出成形条件をデータの容量を小さくして、容易に再生することができる。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
以上のような技術では、条件出し作業を軽減し得るものではあるが、作業を行うオペレータの技術レベルによっては、最適な操作条件を算出するまでに長時間を要することがある。また、複数のオペレータ同士でも、それぞれ最適な操作条件にずれ(差)が生じることがあり、オペレータが異なる場合には、同じ操作条件で同様の品質が担保されないこともある。
【0007】
本発明は、以上のような実情に鑑みなされたものであり、特に、金属材料生産部を構成する複数の設備において、各設備の生産条件を、熟練オペレータ(人)による調整を行なわなくても、常に最適な生産条件で安定して金属材料を製造することができる金属材料生産システムおよび金属材料生産方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明者らは、上述した課題を解決すべく鋭意検討を重ねた。その結果、金属材料生産部と機械学習部とを有する金属材料生産システムであって、前記機械学習部は、前記金属材料生産部において実行中の金属材料生産に関する物理量を観測する状態観測部[A]と、前記状態観測部[A]で観測した前記物理量を、データとして記憶する物理量データ記憶部[B]と、機械学習における報酬条件を設定する報酬条件設定部[C]と、前記状態観測部[A]で観測した前記物理量のデータ、および前記報酬条件設定部[C]で設定された前記報酬条件に基づいて報酬を算出する報酬計算部[D]と、前記報酬計算部[D]で算出した前記報酬、前記物理量データ、および前記金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行う生産条件学習部[E]と、前記生産条件学習部[E]で機械学習した学習結果を記憶する学習済み条件記憶部[F]と、前記生産条件学習部[E]での前記学習結果に基づいて、前記金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する生産条件出力部[G]と、を備えることにより、特に、金属材料生産部を構成する複数の設備において、各設備の生産条件を、熟練オペレータ(人)による調整を行なわなくても、常に最適な生産条件で安定して金属材料を製造することができる金属材料生産システムを提供することができることを見出し、本発明を完成するに至った。
【0009】
すなわち、本発明の要旨構成は以下のとおりである。
[1]金属材料生産部と機械学習部とを有する金属材料生産システムであって、前記機械学習部は、前記金属材料生産部において実行中の金属材料生産に関する物理量を観測する状態観測部[A]と、前記状態観測部[A]で観測した前記物理量を、データとして記憶する物理量データ記憶部[B]と、機械学習における報酬条件を設定する報酬条件設定部[C]と、前記状態観測部[A]で観測した前記物理量のデータ、および前記報酬条件設定部[C]で設定された前記報酬条件に基づいて報酬を算出する報酬計算部[D]と、前記報酬計算部[D]で算出した前記報酬、前記物理量データ、および前記金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行う生産条件学習部[E]と、前記生産条件学習部[E]で機械学習した学習結果を記憶する学習済み条件記憶部[F]と、前記生産条件学習部[E]での前記学習結果に基づいて、前記金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する生産条件出力部[G]と、を備え、前記物理量データ記憶部[B]、前記報酬条件設定部[C]、前記報酬計算部[D]、前記生産条件学習部[E]および前記学習済み条件記憶部[F]に、前記金属材料生産部で製造された金属材料を用いて測定した金属材料の表面状態、形状、材料強度および曲げ加工性からなる外部データとして入力し、前記生産条件学習部[E]の学習に使用することを特徴とする、金属材料生産システム。
[2]前記学習済み記憶部[F]に記憶された学習結果を前記生産条件学習部[E]の学習に使用することを特徴とする、[1]に記載の金属材料生産システム。
[3]前記生産条件学習部[E]で学習した結果を、前記生産条件出力部[G]に反映させて、前記金属材料生産部の制御ユニットに指示を出すことを特徴とする、[1]または[2]に記載の金属材料生産システム。
[4]前記報酬計算部[D]は、前記物理量のデータにあらかじめ許容範囲が設定され、前記物理量のデータの数値が、前記許容範囲内に収まると、プラスの報酬を与えるように算出することを特徴とする、[1]~[3]のいずれか1つに記載の金属材料生産システム。
[5]前記報酬計算部[D]は、前記物理量のデータにあらかじめ許容範囲値が設定され、前記物理量のデータの数値が、前記許容範囲外になると、前記許容範囲の限界値からの前記物理量のデータの数値のずれ幅に応じてマイナスの報酬を与えるように算出することを特徴とする、[1]~[4]のいずれか1つに記載の金属材料生産システム。
[6]金属材料を生産するに際し、状態観測部[A]により、実行中の金属材料生産に関する物理量を観測する工程と、物理量データ記憶部[B]に前記物理量をデータとして記憶する工程と、報酬条件設定部[C]により、機械学習における報酬条件を設定する工程と、報酬計算部[D]により、前記状態観測部[A]で観測した前記物理量のデータ、および前記報酬条件設定部[C]で設定された前記報酬条件に基づいて報酬を算出する工程と、生産条件学習部[E]により、前記報酬計算部[D]が算出した前記報酬、前記物理量データ、および前記金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行う工程と、学習済み条件記憶部[F]に前記生産条件学習部[E]で機械学習した学習結果を記憶する工程と、生産条件出力部[G]により、前記生産条件学習部[E]での前記学習結果に基づいて、前記金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する工程と、を備え、前記物理量データ記憶部[B]、前記報酬条件設定部[C]、前記報酬計算部[D]、前記生産条件学習部[E]および前記学習済み条件記憶部[F]に、前記金属材料生産部で製造された金属材料を用いて測定した金属材料の表面状態、形状、材料強度および曲げ加工性からなる外部データとして入力し、前記生産条件学習部[E]の学習に使用することを特徴とする、金属材料生産方法。
【発明の効果】
【0010】
本発明によれば、特に、金属材料生産部を構成する複数の設備において、各設備の生産条件を、熟練オペレータ(人)による調整を行なわなくても、常に最適な生産条件で安定して金属材料を製造することができる。
【図面の簡単な説明】
【0011】
【
図1】本実施形態に係る金属材料生産システムの概略模式図である。
【
図2】本実施形態に係る金属材料生産部の概略模式図である。
【
図3】機械学習モデルを説明するための概略図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態を、図面を参照しながら詳細に説明するが、本発明は以下の実施形態に何ら限定されるものではない。
【0013】
<金属材料生産システム>
本実施形態の金属材料生産システムは、金属材料生産部と機械学習部とを有する金属材料生産システムであって、前記機械学習部は、前記金属材料生産部において実行中の金属材料生産に関する物理量を観測する状態観測部[A]と、前記状態観測部[A]で観測した前記物理量を、データとして記憶する物理量データ記憶部[B]と、機械学習における報酬条件を設定する報酬条件設定部[C]と、前記状態観測部[A]で観測した前記物理量のデータ、および前記報酬条件設定部[C]で設定された前記報酬条件に基づいて報酬を算出する報酬計算部[D]と、前記報酬計算部[D]で算出した前記報酬、前記物理量データ、および前記金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行う生産条件学習部[E]と、前記生産条件学習部[E]で機械学習した学習結果を記憶する学習済み条件記憶部[F]と、前記生産条件学習部[E]での前記学習結果に基づいて、前記金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する生産条件出力部[G]と、を備えることを特徴とするものである。
図1は、本実施形態に係る金属材料生産システムの概略模式図である。
【0014】
このような金属材料生産システムによれば、特に、金属材料生産部を構成する複数の設備において、各設備の生産条件を、熟練オペレータ(人)による調整を行なわなくても、常に最適な生産条件で安定して金属材料を製造することができる。また、条件出し作業が少なくなることから、金属材料の原料のロスが低減され、また、製造される金属材料の物性のばらつきも小さくなるため、コスト面での利点も非常に大きい。
【0015】
〔金属材料生産部〕
金属材料生産部は、金属材料の生産を行うシステムである。このような金属材料生産システムは、例えば溶解・鋳造、均質化熱処理、熱間圧延、表面切削(面削)、冷間圧延、熱処理、表面研磨、防錆処理などを行うことができるそれぞれの工程を有している。そして、これらの装置には、各々多種の条件が存在する。しかも、製造すべき金属材料の機械特性、電気的特性、形状、表面状態などの品質や、材質、幅、板厚などの設計も考慮して、その条件を設計する必要があることから、通常、金属材料の最適な生産条件を決定するには多大な労力やコストを要するが、後述する機械学習部により、各生産工程における最適な生産条件についての機械学習を行うことにより、金属材料の最適な生産条件を決定することができる。
【0016】
具体的に、金属材料生産部において、Cu-Ni-Si合金の製造を行う場合について
図2を用いて説明する。
図2は、本実施形態に係る金属材料生産部の概略模式図である。Cu-Ni-Si合金の生産方法を構成する工程は、まずCuに対してNiを1.0~5.0質量%、Siを0.25~1.25質量%添加して、溶解鋳造[1]し、その後、保持温度900℃以上で均質化熱処理[2]を行う。次いで、熱間圧延[3]を行い、鋳塊の約1/10の板厚に圧延後、水焼き入れ[4]する。次に、表面の酸化膜を除去する面削[5]を行った後、合計の加工率が70%以上となるよう冷間圧延[6]し、保持温度700~1000℃で1秒~60分の溶体化熱処理[7]を施して急冷を行う。次に、保持温度400~600℃で10分~12時間の時効析出熱処理[8]を行い、析出強化を行う。その度、表面の酸洗および研磨工程[9]、仕上冷間圧延[10]、調質焼鈍[11]の順に行い、0.05~0.8mm程度の板厚に仕上げて金属材料製品とする。このようなCu-Ni-Si合金を製造する金属材料生産部は、11の生産工程が存在する。そして、ほぼ全ての生産工程における生産条件により、生産される金属材料の品質が変化する。
【0017】
本実施形態の金属材料生産システムで製造する金属材料としては、特に限定されず、多種の金属を製造することができる。特に段取り替えが多い生産工程では、段取り替えごとに生産条件の条件出しが必要となるため、本実施形態の金属材料生産システムの導入による、労力やコストの削減効果が大きい。したがって、本実施形態の金属材料生産システムは、少品種大量生産よりも中品種中量生産、ロット生産および多品種少量生産において効果をより発揮し得る。ただし、段取り替えが少ない工程では、オペレータの教育の機会も少なくなるために、生産条件の条件出し作業にかえって大幅な時間を要することが想定される。このような場合などには、本実施形態の金属材料生産システムを導入することで一定の効果が得られる。
【0018】
具体的に、金属材料生産部は、例えば銅合金材料の生産を行うことが好ましい。銅合金材料の製造は、一般に成分系の異なる合金(例えばりん青銅、純銅、Cu-Ni-Si系合金等)を同じ設備で量産する。多品種少量生産であるため、特定の製品専用の製造ラインを作らずに共通の設備で順番や条件を変更して量産している。したがって、段取り替えが必然的に多くなり、本実施形態の金属材料生産システムの導入による、労力やコストの削減効果が大きい。一方で、例えば、鉄鋼材料の製造は、溶解鋳造から最終の板材に至るまで一貫して連続的に行われる。鉄鋼材料の製造では1つの品種の生産数量が極めて多いために、鋳造機から圧延機などの設備を特定の製品専用の連続製造ライン(単一ライン)として用いて、少品種大量生産を行っている。このような生産では段取り替えは多くない。
【0019】
〔機械学習部〕
機械学習部は、金属材料生産部において実行中の金属材料生産に関する物理量を観測する状態観測部[A]と、状態観測部[A]で観測した物理量を、データとして記憶する物理量データ記憶部[B]と、機械学習における報酬条件を設定する報酬条件設定部[C]と、状態観測部[A]で観測した物理量のデータ、および報酬条件設定部[C]に設定された報酬条件に基づいて報酬を算出する報酬計算部[D]と、報酬計算部[D]で算出した報酬、物理量データ、および金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行う生産条件学習部[E]と、生産条件学習部[E]で機械学習した学習結果を記憶する学習済み条件記憶部[F]と、生産条件学習部[E]での学習結果に基づいて、金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する生産条件出力部[G]と、を備えるものである。この機械学習部により、上述した金属材料生産部の各設備における生産条件を機械学習して、最適な生産条件を決定することができる。以下、各部の動作について説明する。
【0020】
(状態観測部[A])
状態観測部[A]は、金属材料生産部において実行中の金属材料生産に関する物理量を観測するものである。
【0021】
状態観測部[A]は、物理量のデータを送信可能な状態で物理量データ記憶部[B]に接続される。また、状態観測部[A]は、物理量のデータを送信可能な状態で報酬計算部[D]および生産条件学習部[E]に接続されてもよい。
【0022】
ここで、物理量は、各設備における処理対象の材料の物性値であればよく、例えば処理対象の材料の形状、寸法、厚さ、表面状態、板材のテンション等が挙げられる。状態観測部[A]においては、これらをセンサー等により測定する。測定したデータは、後述する物理量データ記憶部[B]に送信されるとともに、報酬計算部[D]、生産条件学習部[E]にも送信される。物理量のデータを報酬計算部[D]、生産条件学習部[E]に送信する場合において、物理量データ記憶部[B]を経由してもしなくてもよい。
【0023】
(物理量データ記憶部[B])
物理量データ記憶部[B]は、前記状態観測部[A]で観測した前記物理量を、データとして記憶するものである。物理量データ記憶部は、例えば各種記録媒体(各種メモリ等)であってもよい。
【0024】
物理量データ記憶部[B]は、物理量のデータを受信可能な状態で状態観測部[A]に接続される。また、物理量データ記憶部[B]は、物理量のデータを送信可能な状態で報酬計算部[D]および生産条件学習部[E]に接続されてもよい。
【0025】
(報酬条件設定部[C])
報酬条件設定部[C]は、機械学習における報酬条件を設定するものである。この報酬条件設定部[C]で設定した報酬条件を基に、後述する報酬計算部[D]で報酬が計算され、その報酬を基に、生産条件学習部[E]において生産条件を学習して、最適な生産条件を決定する。
【0026】
報酬条件設定部[C]は、報酬条件を送信可能な状態で少なくとも報酬計算部[D]に接続される。
【0027】
報酬条件としては、例えば、処理対象の材料の形状、寸法、厚さ、表面状態、板材のテンションなど物理量のデータの許容範囲や、それらのばらつきの許容範囲などが挙げられる。なお、報酬条件は、例えば寸法、厚さ、テンションなどの定量的なデータに基づくものであってもよく、また、例えば表面状態の画像データによる良否など定性的なデータに基づくものであってもよい。
【0028】
また、報酬条件は、例えば金属加工を行う際に金属材料を用いて測定した金属材料の表面状態、形状、材料強度および曲げ加工性などの外部データに基づいて判断される条件を更に加えてもよい。ここで、「外部データ」とは、当該金属材料生産システムの内部すなわち状態観測部[A]で測定されるような材料の物性とは異なるものであり、その金属材料生産システムで生産し終えた後の金属材料の物性である。
【0029】
なお、報酬条件設定部における報酬条件の設定は、作業者のこれまでの経験やこれまで機械学習した結果に基づいて、作業者による手入力又は自動入力で設定を行う。
【0030】
(報酬計算部[D])
報酬計算部[D]は、前記状態観測部[A]で観測した前記物理量のデータ、および前記報酬条件設定部[C]に設定された前記報酬条件に基づいて報酬を算出するものである。すなわち、報酬計算部[D]は、前記状態観測部[A]で観測した前記物理量のデータが、前記報酬条件設定部[C]で設定された前記報酬条件の充足の成否を判断し、または報酬条件の充足・不足の程度を算出し、そしてその報酬条件の充足の成否、または充足・不足の程度に応じてあらかじめ設定された報酬を与えるように算出する。なお、報酬計算部[D]における報酬の決定方法の詳細は後述する。
【0031】
報酬計算部[D]は、物理量のデータを受信可能な状態で状態観測部[A]または物理量データ記憶部[B]に接続される。また、報酬計算部[D]は、報酬条件を受信可能な状態で報酬条件設定部[D]に接続される。さらに、報酬計算部[D]は、報酬を送信可能な状態で生産条件学習部[E]に接続される。
【0032】
報酬計算部[D]は、例えば、前記物理量のデータにあらかじめ許容範囲が設定され、前記物理量のデータの数値が、前記許容範囲内に収まると、プラスの報酬を与えるように算出し、一方で、前記物理量のデータの数値が、前記許容範囲外になると、前記許容範囲の限界値からの前記物理量のデータの数値のずれ幅に応じてマイナスの報酬を与えるように算出することができる。
【0033】
報酬計算部[D]は、例えば、良好な表面状態の画像データ、厚さのばらつきが小さいデータおよび板材のテンションのばらつきが小さいデータのうちの少なくとも1つのデータを、その寄与の程度に応じてプラスの報酬を与えるように算出する。一方で、報酬計算部[D]が、表面状態の粗い画像データ、厚さのばらつきが大きいデータおよび板材のテンションのばらつきが大きいデータのうちの少なくとも1つのデータを、その寄与の程度に応じてマイナスの報酬を与えるように算出する。
【0034】
(生産条件学習部[E])
生産条件学習部[E]は、報酬計算部[D]で算出した報酬、物理量データ、および金属材料生産部で設定されている生産条件に基づいて生産条件調整の機械学習を行うものである。このようにして、生産条件学習部[E]は、報酬計算部[D]で重みづけした報酬の計算結果と、物理量データ記憶部で記憶したデータを基に、その金属材料を生産したときの生産条件によって機械学習を行う。
【0035】
生産条件学習部[E]は、物理量のデータを受信可能な状態で状態観測部[A]または物理量データ記憶部[B]に接続される。また、生産条件学習部[E]は、報酬を受信可能な状態で報酬計算部[D]に接続される。さらに、生産条件学習部[E]は、学習結果を送信可能な状態で学習済み条件記憶部[F]および生産条件出力部[G]に接続される。なお、生産条件学習部[E]は、学習結果を送信可能な状態で学習済み条件記憶部[F]に受信可能な状態で報酬計算部[D]に接続されてもよい。
【0036】
前記物理量データ記憶部[B]、前記報酬条件設定部[C]、前記報酬計算部[D]、前記生産条件学習部[E]および前記学習済み条件記憶部[F]の少なくともいずれか1つに、前記金属材料生産部で製造された金属材料を用いて測定した金属材料の表面状態、形状、材料強度および曲げ加工性からなる外部データとして入力し、前記生産条件学習部[E]の学習に使用することもできる。
【0037】
また、下記で説明する学習済み記憶部[F]に記憶された学習結果を前記生産条件学習部[E]の学習に使用することができる。
【0038】
なお、金属材料の生産時において、状態観測部[A]の物理量の観測にともなう生産条件の更新は、逐次に行ってもよく、また、一定の時期に行ってもよい。
【0039】
(学習済み条件記憶部[F])
学習済み条件記憶部[F]は、前記生産条件学習部[E]で機械学習した学習結果を記憶するものである。また、好ましくは、前記生産条件学習部[E]に学習結果を送信して、反映させることができるものである。学習済み条件記憶部[F]は、例えば各種記録媒体(各種メモリ等)であってよい。また、学習済み条件記憶部[F]は、物理量データ記憶部[B]と同一のものであってもよい。
【0040】
学習済み条件記憶部[F]は、学習結果を受信可能な状態で少なくとも生産条件学習部[E]に接続される。また、学習済み条件記憶部[F]は、学習結果を送信可能な状態で少なくとも生産条件学習部[E]に接続されてもよい。
【0041】
学習済み条件記憶部において記憶するデータは、生産された金属材料の報酬の計算結果と、物理量データ記憶部と、その金属材料を生産したときに金属材料生産部に設定されている生産条件の対応関係であってよい。
【0042】
(生産条件出力部[G])
生産条件出力部[G]は、前記生産条件学習部[E]での前記学習結果に基づいて、前記金属材料生産部で製造される金属材料の生産条件の調整量を決定して出力するものである。
【0043】
生産条件出力部[G]は、学習結果を受信可能な状態で少なくとも生産条件学習部[E]に接続される。また、生産条件出力部[G]は、生産条件の調整量を送信可能な状態で金属材料生産部の各工程の設備に接続される。
【0044】
この生産条件出力部[G]は、金属材料生産部の制御ユニットと通信可能な状態で接続するなどして、前記金属材料生産部の制御ユニットに指示を出すように構成してもよい。このような構成とすることで、金属材料生産システムの自動化を達成することができる。
【0045】
なお、機械学習部の状態観測部[A]、物理量データ記憶部[B]、報酬条件設定部[C]、報酬計算部[D]、生産条件学習部[E]、学習済み条件記憶部[F]および生産条件出力部[G]は、各々が通信可能な状態で接続されていてよい。
【0046】
〔機械学習〕
以下、本実施形態の金属材料生産システムにおける報酬条件設定部[C]、報酬計算部[D]および生産条件学習部[E]で行う機械学習について、状態価値関数と行動価値関数を使用して説明する。
【0047】
強化学習では、環境から得られる最終的な累積報酬を最大化することで学習を行う。累積報酬は下記の式で与えられる。
図3は、機械学習モデルを説明するための概略図である。
【数1】
(ここで、Tは最終時刻、γは遠い将来に得られる報酬ほど割り引いて評価するための割引率であり、0≦γ≦1である。)
【0048】
強化学習では、報酬を評価してその評価を最大化することで学習を行う。ここでは、現在の状態がどのくらい良いのかを測る関数として価値関数を考える。どのくらい良いのか、ということを、将来にわたって得られる報酬によって定義する。
【0049】
方策πは、状態s∈Sで行動a∈A(s)をとることであり、π(s,a)と表す。
方策πのもとで、状態sの価値は下記の状態価値関数(state value function for policy π)で定式化できる。
【数2】
【0050】
状態価値関数Vπ(s)は、ある状態sがどのくらい良い状態であるのかを示す価値関数である。状態価値関数は、状態を引数とする関数として表現され、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、該行動により移行する未来の状態の価値などに基づいて更新される。
【0051】
方策πのもとで、状態sにおいて行動aをとることの価値は、下記の行動価値関数(action value function for policy π)によって定義できる。
【数3】
【0052】
行動価値関数Qπ(s,a)は、ある状態sにおいて行動aがどのくらい良い行動であるのかを示す価値関数である。行動価値関数は、状態と行動を引数とする関数として表現され、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、該行動により移行する未来の状態における行動の価値などに基づいて更新される。
【0053】
個の価値関数を記憶する方法としては、近似関数を用いる方法や、配列を用いる方法以外にも、例えば状態sが多くの状態をとるような場合には状態st、行動atを入力として価値(評価)を出力する多値出力のサポートベクターマシン(SVM)やニューラルネットワークなどの教師あり学習器を用いるようにしてもよい。
【0054】
機械学習は、以下の(1)~(5)の繰り返しによって進められる。
(1)環境の状態s(sを観測)
(2)行動a(観測結果と過去の学習に基づいて自分が取れる行動atを選択して行動atを実行)
(3)環境の状態sの変化(行動atが実行されることで、環境の状態stが次の状態st+1へ変化)
(4)報酬r(行動atの結果としての状態変化に基づいて、機械学習器が報酬rt+1を受け取る)
(5)報酬rに基づく学習(エージェントが状態st、行動at、報酬rt+1および過去の学習結果に基づいて学習を進める。)
【0055】
ある環境において、学習が終了した後に、新たな環境に置かれた場合でも追加の学習を行うことでその環境に適応するように学習を進めることができる。よって、本発明のように生産設備(金属材料生産部)の最適条件の算出に適応することで、これまでにないような金属材料の厚さ、長さ、幅、硬さ、表面状態などから最適な加工条件を条件出しなどによって決める必要がなくなり、大幅な時間短縮が可能となる。
【0056】
そして、以上のような金属材料生産システムにおいては、金属材料の生産時には、金属材料生産部の各工程で測定した物理量データを観測する状態観測部[A]によって機械学習を行う。また、生産終了後出荷前の最終製品の引張試験の結果や表面状態からなる外部データや、出荷後の金属材料加工後の金属材料の表面状態、形状、材料強度(引張試験の結果など)および曲げ加工性からなる外部データを用いて機械学習を行う。このようにしてより多くのデータを用いることで、設備履歴と性能、表面状態などのパラメータが追加され、より最適な加工条件を算出することができ、製造時間とオフゲージを大幅に低減することができる。なお、このような場合において、物理量データや外部データは一度物理量データ記憶部[B]に保存してもよい。また、外部データは逐次にインターネットを経由して金属材料生産システムの各部で授受してもよい。
【0057】
〔金属材料生産システムの動作の具体例〕
上述したCu-Ni-Si合金の工程を一例として、本実施形態の金属材料生産システムの動作をより具体的に説明する。
【0058】
金属材料生産システムの導入前において、工場の作業日誌または設備の端末に記録したデータ、すなわち入力溶解鋳造[1]の溶解温度、均質化熱処理[2]の測定温度および保持時間、熱間圧延[3]の圧延速度および各圧延パスの圧延加工率、水焼き入れ[4]時の水の流量、面削[5]の回数および面削寸法、冷間圧延[6]の圧延加工率、圧延パス数および圧延速度、溶体化熱処理[7]の昇温速度、到達温度および冷却速度、時効析出熱処理[8]の到達温度、保持時間および冷却速度、研磨工程[9]の研磨速度および研磨紙の番手、仕上冷間圧延[10]の圧延加工率、圧延パス数および圧延速度、ならびに調質焼鈍[11]の昇温速度および到達温度について、機械学習させる。生産条件学習済み記憶部から生産条件をオンラインまたはオフラインのいずれかで各設備に指示し、条件をセットし、金属材料生産を行う。
【0059】
このようにして金属材料生産を行なっている際に、例えば冷間圧延[6]における圧延後の形状や板厚(物理量)が不均一となった場合に、この変化を複数のセンサー(状態観測部[A])で読み取り、報酬計算部[D]および生産条件学習部[E]に伝達する。報酬計算部[D]では、圧延後の形状や板厚の不均一性に対しマイナスの報酬を与えるように算出し、生産条件学習部[E]に送信する。生産条件学習部[E]では、報酬、圧延後の形状や板厚の不均一性および冷間圧延[6]を行ったときに設定されている圧延条件(圧延機やその他設備の設定)に基づいて機械学習を行い、最適化する。より具体的には、冷間圧延では、板材の幅方向の張力や幅方向での圧延ロールのギャップなどを微調整することで、最適な形状の金属材料を得ることができる。主に圧延速度や圧延ロールの幅方向でのギャップ制御を最適化する。そしてこの最適化後の生産条件を、圧延機やその他設備にフィードバックし、次の製造ロットから条件を最適化する。ここで、生産条件学習部[E]においては、金属材料の表面状態、形状、材料強度、曲げ加工性からなる外部データをさらに用いてもよい。
【0060】
次に、同一の金属材料生産システムで、Cu-Ni-Si合金とは異なる組成の銅合金を生産する場合について説明する。Cu-Ni-Si合金を例に説明したことと同様に、工場の作業日誌または設備の端末に記録したデータ(検査成績のデータ)を学習する。このような学習を複数種の組成・添加元素の合金で繰り返すことにより、各工程の最適な生産条件を機械学習するとともに、それぞれの合金の組成・添加元素の分量をその差異的な生産条件と関連付け、その結果を学習済み条件記憶部[F]に記憶することができる。そして、生産開始後、合金の組成および添加元素の分量を報酬条件設定部[C]に入力し、その合金の組成および添加元素の分量のデータより、学習済み条件記憶部[F]に最も近い学習済み生産条件を呼び出す。学習済み条件記憶部から生産条件をオフラインまたはオンラインのいずれかで各設備に指示し、生産条件をセットし、金属材料生産を行う。
【0061】
<金属材料生産方法>
本実施形態の金属材料生産方法は、金属材料を生産するに際し、状態観測部[A]により、実行中の金属材料生産に関する物理量を観測する工程と、物理量データ記憶部[B]に物理量をデータとして記憶する工程と、報酬条件設定部[C]により、機械学習における報酬条件を設定する工程と、報酬計算部[D]により、状態観測部[A]で観測した物理量のデータ、および報酬条件設定部[C]に設定された報酬条件に基づいて報酬を算出する工程と、生産条件学習部[E]により、報酬計算部[D]が算出した報酬、物理量データ、および金属材料生産部に設定されている生産条件に基づいて生産条件調整の機械学習を行う工程と、学習済み条件記憶部[F]に生産条件学習部[E]で機械学習した学習結果を記憶する工程と、生産条件出力部[G]により、生産条件学習部[E]での学習結果に基づいて、金属材料生産部を構成する各設備の生産条件の調整量を決定して出力する工程と、を備えることを特徴とするものである。
【0062】
すなわち、このような金属材料生産方法によれば、上記の金属材料生産システムにより、金属材料の生産工程において、金属材料の最適な生産条件を決定することができ、人間による生産条件の調整の手間を抑制することができる。また、条件出し作業が少なくなることから、金属材料の原料のロスが低減され、また、製造される金属材料の物性のばらつきも小さくなるため、コスト面での利点も非常に大きい。
【実施例】
【0063】
次に、本発明の効果をさらに明確にするために、本発明例について説明するが、本発明はこれら実施例に限定されるものではない。
【0064】
金属材料メーカーA社では、
図2に示す金属材料生産部を用いてCu-Ni-Si合金を断続的に製造している。Cu-Ni-Si合金の生産工程は、まずCuに対してNiを1.0~5.0質量%、Siを0.25~1.25質量%添加して、溶解鋳造[1]し、その後、保持温度900℃以上で均質化熱処理[2]を行う。次いで、熱間圧延[3]を行い、鋳塊の約1/10の板厚に圧延後、水焼き入れ[4]する。次に、表面の酸化膜を除去する面削[5]を行った後、合計の加工率が70%以上となるよう冷間圧延[6]し、保持温度700~1000℃で1秒~60分の溶体化熱処理[7]を施して急冷を行う。次に、保持温度400~600℃で10分~12時間の時効析出熱処理[8]を行い、析出強化を行う。その度、表面の酸洗および研磨工程[9]、仕上冷間圧延[10]、調質焼鈍[11]の順に行い、0.05~0.8mm程度の板厚に仕上げて金属材料製品とする。
【0065】
A社は、このCu-Ni-Si合金以外にも同一の設備で複数のCu系合金を製造しており、Cu-Ni-Si合金の製造開始にあたっては、都度、製造工程の条件出し作業を行っている。
【0066】
本発明の金属材料生産システムの導入前、A社では、製造工程の条件出し作業として、各条件についてオペレータが確認を行っていた。この場合における、Cu-Ni-Si合金の製造開始から出荷までの合計時間は平均して8日間であった。また、各設備での条件出し時に発生する材料の端部の材料ロス(オフゲージ)は5%であった。さらに、オペレータにより生産条件に大きな差異が生じていた。
【0067】
その後、金属材料メーカーA社では、本発明の金属材料生産システムを導入した。この金属材料生産システムでは、外部データを使用せずに、これまでの工場の作業日誌または設備の端末に記録したデータ、すなわち入力溶解鋳造[1]の溶解温度、均質化熱処理[2]の測定温度および保持時間、熱間圧延[3]の圧延速度および各圧延パスの圧延加工率、水焼き入れ[4]時の水の流量、面削[5]の回数および面削寸法、冷間圧延[6]の圧延加工率、圧延パス数および圧延速度、溶体化熱処理[7]の昇温速度、到達温度および冷却速度、時効析出熱処理[8]の到達温度、保持時間および冷却速度、研磨工程[9]の研磨速度および研磨紙の番手、仕上冷間圧延[10]の圧延加工率、圧延パス数および圧延速度、ならびに調質焼鈍[11]の昇温速度および到達温度について、機械学習させた。生産条件学習済み記憶部から生産条件をオンラインで各設備に指示し、条件をセットし、金属材料生産を行った。
【0068】
この結果、製造工程の条件出し作業としての、溶体化熱処理[7]や冷間圧延[6]の条件についてオペレータによる目視での確認作業や台帳を見て過去の条件との詳細な確認作業、手作業による圧延ロールギャップや焼鈍速度の調整の条件についての検出器による確認作業が短縮され、Cu-Ni-Si合金の製造開始から出荷までの合計時間は平均して7日間に短縮された。また、各設備での条件出し時に発生する材料の端部の材料ロス(オフゲージ)が4%に減少した。さらに、オペレータにより生産条件に大きな差異が生じなかった。
【0069】
その後、金属材料メーカーA社では、さらに金属材料の表面、金属材料の形状、材料強度および曲げ加工性のデータを外部データとして用いて、金属材料の生産を行なった。この結果、製造工程の条件出し作業としての、Cu-Ni-Si合金の製造開始から出荷までの合計時間は平均して4日間に短縮された。また、各設備での条件出し時に発生する材料の端部の材料ロス(オフゲージ)が1%に減少した。さらに、オペレータにより生産条件に大きな差異が生じなかった。