(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023062867
(43)【公開日】2023-05-09
(54)【発明の名称】機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置
(51)【国際特許分類】
B30B 11/00 20060101AFI20230427BHJP
G06N 3/02 20060101ALI20230427BHJP
G06N 20/00 20190101ALI20230427BHJP
【FI】
B30B11/00 Z
G06N3/02
G06N20/00
B30B11/00 B
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021173018
(22)【出願日】2021-10-22
(71)【出願人】
【識別番号】000001199
【氏名又は名称】株式会社神戸製鋼所
(74)【代理人】
【識別番号】100115381
【弁理士】
【氏名又は名称】小谷 昌崇
(74)【代理人】
【識別番号】100178582
【弁理士】
【氏名又は名称】行武 孝
(72)【発明者】
【氏名】伊藤 洋行
(72)【発明者】
【氏名】南野 友哉
(72)【発明者】
【氏名】白樫 浩
(72)【発明者】
【氏名】岸 新和
(72)【発明者】
【氏名】溝上 忠孝
(72)【発明者】
【氏名】宮下 泰秀
(57)【要約】
【課題】被処理物に対する適切なCIP処理条件を容易に決定する。
【解決手段】被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数に基づいて、等方圧加圧処理条件の決定結果に対する報酬を計算し、状態変数から少なくとも1つの等方圧加圧処理条件を決定するための関数を、報酬に基づいて更新し、関数の更新を繰り返すことによって、報酬が最も多く得られる等方圧加圧処理条件を決定する。等方圧加圧処理条件は、被処理物に関する第1パラメータと、等方圧加圧処理の前工程に関する第2パラメータと、等方圧加圧装置の運転条件に関する第3パラメータとのうちの少なくとも1つであり、少なくとも1つの物理量は、被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである。
【選択図】
図1
【特許請求の範囲】
【請求項1】
被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの等方圧加圧処理条件を機械学習装置が決定する機械学習方法であって、
前記等方圧加圧システムは、
前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記等方圧加圧装置を制御する制御装置と、を備え、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を取得し、
前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算し、
前記少なくとも1つの等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、
前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定し、
前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記等方圧加圧処理の前工程に関する第2パラメータと、
前記等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである、
機械学習方法。
【請求項2】
前記少なくとも1つの等方圧加圧処理条件は、前記第1パラメータを含み、
前記第1パラメータは、前記被処理物の化学成分、組成比、処理量、配置、形状、寸法、かさ密度、真密度の少なくとも1つである、
請求項1記載の機械学習方法。
【請求項3】
前記少なくとも1つの等方圧加圧処理条件は、前記第2パラメータを含み、
前記第2パラメータは、予熱温度、予熱時間、真空包装時の真空度の少なくとも1つである、
請求項1又は2記載の機械学習方法。
【請求項4】
前記少なくとも1つの等方圧加圧処理条件は、前記第3パラメータを含み、
前記第3パラメータは、前記等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無の少なくとも1つである、
請求項1乃至3のいずれか1項に記載の機械学習方法。
【請求項5】
前記等方圧加圧装置は、前記圧力容器内の圧媒の温度を調整することが可能な温度調整機構を更に備え、
前記制御装置は、前記温度調整機構を更に制御することが可能である、
請求項1乃至4のいずれか1項に記載の機械学習方法。
【請求項6】
前記等方圧加圧装置は、前記圧力容器内の圧媒の温度を調整することが可能な温度調整機構を更に備え、
前記制御装置は、前記温度調整機構を更に制御することが可能であり、
前記第3パラメータは、前記等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無、処理温度、処理中昇温速度、処理中降温速度、温度分布の少なくとも1つである、
請求項1乃至4の何れか1項に記載の機械学習方法。
【請求項7】
前記関数は深層強化学習を用いて更新される、
請求項1乃至6の何れか1項に記載の機械学習方法。
【請求項8】
前記報酬の計算では、前記少なくとも1つの物理量が各物理量に対応する所定の基準値に近づいている場合、前記報酬を増大させる、
請求項1乃至7の何れか1項に記載の機械学習方法。
【請求項9】
被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの等方圧加圧処理条件を決定する機械学習装置であって、
前記等方圧加圧システムは、
前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記等方圧加圧装置を制御する制御装置と、を備え、
前記機械学習装置は、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を取得する状態取得部と、
前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算する報酬計算部と、
前記少なくとも1つの等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新する更新部と、
前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定する決定部と、を備え、
前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記等方圧加圧処理の前工程に関する第2パラメータと、
前記等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである、
機械学習装置。
【請求項10】
被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの等方圧加圧処理条件を決定する機械学習装置の学習プログラムであって、
前記等方圧加圧システムは、
前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記等方圧加圧装置を制御する制御装置と、を備え、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を取得する状態取得部と、
前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算する報酬計算部と、
前記少なくとも1つの等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新する更新部と、
前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定する決定部としてコンピュータを機能させ、
前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記等方圧加圧処理の前工程に関する第2パラメータと、
前記等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである、
機械学習プログラム。
【請求項11】
被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの等方圧加圧処理条件を機械学習する際の前記等方圧加圧システムの制御装置の通信方法であって、
前記等方圧加圧システムは、
前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記制御装置と、を備え、
前記制御装置は、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を観測し、
前記制御装置は、前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの等方圧加圧処理条件を前記サーバから受信し、
前記少なくとも1つの等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定することによって生成されたものであり、
前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記等方圧加圧処理の前工程に関する第2パラメータと、
前記等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである、
通信方法。
【請求項12】
被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの制御装置であって、
前記等方圧加圧システムは、
前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を観測する状態観測部と、
前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの等方圧加圧処理条件を前記サーバから受信する通信部と、を備え、
前記少なくとも1つの等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定することによって生成されたものであり、
前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記等方圧加圧処理の前工程に関する第2パラメータと、
前記等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである、
制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、等方圧加圧装置の等方圧加圧条件を機械学習する技術に関するものである。
【背景技術】
【0002】
従来、超硬セラミックなどの粉体からなる被処理物を加圧して圧縮成形することを目的として、CIP法(Cold Isostatic Pressing法:冷間等方圧加圧方法)やWIP法(Warm Isostatic Pressing法:温間等方圧加圧方法)を用いて、被処理物に加圧処理を施す加圧装置(CIP装置:等方圧加圧装置)が知られている(例えば、特許文献1)。このような加圧装置では、筒状の圧力容器内に被処理物が収容され、前記圧力容器内に水などの圧力媒体が封入されることで、加圧処理が施される。このような加圧処理において高品質なCIP処理品を得るためには、加圧条件等のCIP処理条件を適切に決定することが要求される。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来、CIP処理条件は、蓄積された実験データをもとに決定されているため、被処理物に対する適切なCIP処理条件を容易に決定することが困難であった。
【0005】
本発明の目的は、被処理物に対する適切なCIP処理条件を効率的に導くことができる機械学習方法などを提供することにある。
【課題を解決するための手段】
【0006】
本発明の一態様に係る機械学習方法は、被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの等方圧加圧処理条件を機械学習装置が決定する機械学習方法であって、前記等方圧加圧装置は、前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、前記圧力容器に前記圧媒を供給するための圧縮機と、前記圧力容器内の圧力を調整することが可能な圧力調整機構と、前記等方圧加圧装置を制御する制御装置と、を備え、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を取得し、前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定し、前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、前記等方圧加圧処理の前工程に関する第2パラメータと、前記等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである。
【0007】
本態様によれば、被処理物に関する第1パラメータと、等方圧加圧処理の前工程に関する第2パラメータと、等方圧加圧装置の運転条件に関する第3パラメータとのうちの少なくとも1つが状態変数として取得される。さらに、被処理物について緻密化および圧粉体化に関する物理量のうちの少なくとも1つの物理量が状態変数として取得される。
【0008】
そして、取得された状態変数に基づいて、等圧加圧処理条件の決定結果に対する報酬が計算され、計算された報酬に基づいて、状態変数から等方圧加圧処理条件を決定するための関数が更新され、この更新が繰り返されて報酬が最も多く得られる等方圧加圧処理条件が学習される。このため、等方圧加圧処理条件を効率的に導くことができる。
【0009】
上記機械学習方法において、前記少なくとも1つの等方圧加圧処理条件は、前記第1パラメータを含み、前記第1パラメータは、前記被処理物の化学成分、組成比、処理量、配置、形状、寸法、かさ密度、真密度の少なくとも1つであってもよい。
【0010】
本態様によれば、前記第1パラメータとして、前記被処理物の化学成分、組成比、処理量、配置、形状、寸法、かさ密度、真密度の少なくとも1つが被処理物に関する状態変数として取得されて機械学習が行われるため、被処理物の状態を考慮に入れて適切な等方圧加圧処理条件を決定できる。
【0011】
上記機械学習方法において、前記少なくとも1つの等方圧加圧処理条件は、前記第2パラメータを含み、前記第2パラメータは、予熱温度、予熱時間、真空包装時の真空度の少なくとも1つであってもよい。
【0012】
本態様によれば、前記第2パラメータとして、予熱温度、予熱時間、真空包装時の真空度の少なくとも1つが前工程に関する状態変数として取得されて機械学習が行われるため、等方圧加圧処理の前工程の状態を考慮に入れて適切な等方圧加圧処理条件を決定できる。
【0013】
上記機械学習方法において、前記少なくとも1つの等方圧加圧処理条件は、前記第3パラメータを含み、前記第3パラメータは、前記等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無の少なくとも1つであってもよい。
【0014】
本態様によれば、前記第3パラメータとして、等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無の少なくとも1つが運転条件に関する状態変数として取得されて機械学習が行われるため、運転条件を考慮に入れて適切な等方圧加圧処理条件を決定できる。
【0015】
上記機械学習方法において、前記等方圧加圧装置は、前記圧力容器内の圧媒の温度を調整することが可能な温度調整機構を更に備え、前記制御装置は、前記温度調整機構を更に制御することが可能であってもよい。また、前記第3パラメータは、前記等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無、処理温度、処理中昇温速度、処理中降温速度、温度分布の少なくとも1つであってもよい。
【0016】
本態様によれば、温度調整機構によって圧力容器内の温度を調整することで、被処理物の特性を好適に変化させることができる。また、第3パラメータとして、処理温度、処理中昇温速度、処理中降温速度、温度分布の少なくとも1つが運転条件に関する状態変数として取得されて機械学習が行われる場合には、当該運転条件を考慮に入れて適切な等方圧加圧処理条件を決定できる。
【0017】
上記機械学習方法において、前記関数は深層強化学習を用いて更新されてもよい。
【0018】
本態様によれば、関数の更新が深層強化学習を用いて行われるため、当該関数の更新を正確かつ速やかに行うことができる。このため、等方圧加圧処理条件をより効率的に導くことができる。
【0019】
上記機械学習方法において、前記報酬の計算では、前記少なくとも1つの物理量が各物理量に対応する所定の基準値に近づいている場合、前記報酬を増大させてもよい。
【0020】
この構成によれば、物理量が基準値に近づくにつれて報酬が増大されるため、物理量を速やかに基準値に到達させることができる。
【0021】
なお、本発明において、上記の機械学習方法が備える各処理は機械学習装置に実装されてもよいし、機械学習プログラムとして実装されて流通されてもよい。この機械学習装置は、サーバで構成されてもよいし、等方圧加圧装置で構成されてもよい。
【0022】
本発明の別の一態様に係る通信方法は、被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの等方圧加圧処理条件を機械学習する際の前記等方圧加圧装置の制御装置の通信方法であって、前記等方圧加圧装置は、前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、前記圧力容器に前記圧媒を供給するための圧縮機と、前記圧力容器内の圧力を調整することが可能な圧力調整機構と、前記制御装置と、を備え、前記制御装置は、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を観測し、前記制御装置は、前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの等方圧加圧処理条件を前記サーバから受信し、前記少なくとも1つの等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定することによって生成されたものであり、前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、前記等方圧加圧処理の前工程に関する第2パラメータと、前記等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化関する物理量のうちの少なくとも1つである。
【0023】
本態様によれば、等方圧加圧処理条件を機械学習する際に必要な情報が提供される。このような通信方法は、等方圧加圧装置にも実装可能である。
【0024】
また、本発明の別の一態様に係る制御装置は、被処理物に圧媒を用いて等方圧加圧処理を行う等方圧加圧システムの制御装置であって、前記等方圧加圧装置は、前記被処理物を格納する圧力容器を含み、冷間等方圧加圧装置または温間等方圧加圧装置からなる等方圧加圧装置と、前記圧力容器に前記圧媒を供給するための圧縮機と、前記圧力容器内の圧力を調整することが可能な圧力調整機構と、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの等方圧加圧処理条件とを含む状態変数を観測する状態観測部と、前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの等方圧加圧処理条件を前記サーバから受信する通信部と、を備え、前記少なくとも1つの等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定することによって生成されたものであり、前記少なくとも1つの等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、前記等方圧加圧処理の前工程に関する第2パラメータと、前記等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、前記少なくとも1つの物理量は、前記被処理物の緻密化および圧粉体化に関する物理量のうちの少なくとも1つである。
【発明の効果】
【0025】
本発明によれば被処理物に対する適切な等方圧加圧処理条件を効率的に導くことができる。
【図面の簡単な説明】
【0026】
【
図1】本発明の一実施形態において学習対象となるCIPシステムの全体構成図である。
【
図2】本発明の一実施形態におけるCIPシステムを機械学習させる機械学習システムの全体構成図である。
【
図4】CIP処理中の圧力容器内の圧力及び温度の推移の一例を示すグラフである。
【
図8】
図2に示す機械学習システムにおける処理の一例を示すフローチャートである。
【
図9】本発明の変形実施形態に係る機械学習システムの全体構成図である。
【発明を実施するための形態】
【0027】
以下、図面を参照して、本発明の一実施形態に係るCIP装置100(等方圧加圧装置、冷間等方圧加圧装置、温間等方圧加圧装置)を含むCIPシステム100Sについて説明する。
図1は、本発明の一実施形態において学習対象となるCIPシステム100Sの全体構成図である。
図2は、本実施形態におけるCIPシステム100Sを機械学習させる機械学習システムの全体構成図である。CIPシステム100Sは、被処理物に対して圧力媒体を用いて等方圧加圧処理を行う。特に、本実施形態では、CIPシステム100Sは、湿式冷間等方圧加圧処理を行う。
【0028】
なお、以下の説明では、処理対象である被処理物をセラミックスなどの粉体としているが、被処理物は、このような粉体以外のものであってもよい。
【0029】
CIPシステム100Sは、圧力容器1を含むCIP装置100と、給排水ユニット31と、ポンプユニット32と、加熱ジャケット33と、後記の制御装置800とを備える。
【0030】
CIP装置100は、冷間等方圧加圧装置または温間等方圧加圧装置からなる。圧力容器1は、被処理物を格納する。CIP装置100は、被処理物Wに対して、等方圧加圧処理を施す。圧力容器1は、筒形状を有しており、単一の円筒体、あるいは、内・外多重の円筒体を焼嵌め等して構成される。圧力容器1は、その胴部が架台2に固着されて上下方向に沿って縦置きとされている。圧力容器1の上下端部はそれぞれ開口されており、上開口部1A、下開口部1Bが形成されている。上開口部1Aおよび下開口部1Bにはそれぞれ液密パッキンを有する上蓋3および下蓋4が嵌合され、圧力容器1内に処理室5(処理空間)が画定されている。
【0031】
給排水ユニット31は、この処理室5内に液体(水)の圧力媒体を導入するとともに、処理室5から液体を排出する。本実施形態では、圧力媒体として水、冷水、温水が使用される。給排水ユニット31は、本発明の圧縮機として機能する。具体的に、給排水ユニット31は、供給用の供給用ポンプ31Aと、排出用ポンプ31Bを備え、その回路途中に切換弁31Cを有している。処理室5内には被処理物Wが収容されており、該被処理物Wはポンプユニット32(
図2)の駆動による加圧で圧力媒体により等方的に加圧可能であるとともに、該加圧時に上蓋3および下蓋4に発生する軸力をプレスフレーム8で担持可能としている。
【0032】
本実施形態では、処理室5に圧力媒体が供給されると同時に、ポンプユニット32によって圧力媒体が加圧される。ポンプユニット32は、本発明の圧力調整機構として機能する。ポンプユニット32は、圧力容器1内の圧力を調整することが可能である。
【0033】
なお、被処理物Wはこれがセラミックス等の粉体のときはゴム型に詰込まれている。プレスフレーム8は上蓋3および下蓋4に対して係脱自在であり、
図1では、伸縮シリンダ9によってレール10上を往復走行する台車11に、開口を有するフレーム要素8Aを積層してタイロッド8Bで締結したプレスフレーム8が例示されている。
【0034】
また、プレスフレーム8の上部には上蓋3の開閉用に伸縮シリンダ12が備えられ、該シリンダ12の伸縮動作で上蓋3は上開口部1Aに対して嵌脱自在とされる。このため、プレスフレーム8の上部内周端板13と上蓋3の上端面との間に周外のシリンダによって出入自在なコッター部材14が備えられ、ここに、該コッター部材14を退出した状態で上蓋3を上開口部1Aより抜出し、プレスフレーム8を
図1の鎖線で示すように離脱可能であり、被処理物Wを処理室5に収めた後は、プレスフレーム8を再び進出させ、かつ、コッター部材14を介入することでプレス軸力が担持可能とされる。
【0035】
加熱ジャケット33(
図2)は、圧力容器1の外側に配置されており、外部の加熱ユニットにて加熱された熱媒体を加熱ジャケット33に循環させて圧力容器1内の圧力媒体を加熱することで、被処理物Wに対する加圧処理前または加圧処理中に、被処理物を予熱または加熱することができる。また、加熱ジャケット33に循環させる熱媒体の温度は、熱媒体を加熱する不図示の加熱ユニットの熱電対にて測温可能であり、その温度検出結果に応じて発熱量が調整可能とされている。加熱ジャケット33は、本発明の温度調整機構として機能する。すなわち、加熱ジャケット33は、圧力容器1内の圧力媒体の温度を調整することが可能である。なお、本実施形態において圧力容器1内の圧力媒体の温度は、公知のHIP(Hot Isostatic Pressing)装置における圧媒の温度(数100度~2000度の高温)よりは低く、一例として100度以下である。圧力媒体として、常温の水が使用される場合は、一例として、その温度は20度前後である。
【0036】
制御装置800は、給排水ユニット31、ポンプユニット32、加熱ジャケット33、CIP装置100の駆動機構、駆動シリンダおよび加熱ユニットなどの動作を制御する。制御装置800は、不図示の操作パネルを有している。制御装置800は、コンピュータで構成され、CIP装置100の全体制御を司る。
【0037】
上記のようなCIP装置100において、被処理物Wに対して等方圧加圧処理を施す場合、まず、圧力容器1含むCIP装置100が準備される(準備工程)。作業者は、圧力容器1内にセラミックス粉体などの被処理物Wを収容する(被処理物収容工程)。この際、加熱ジャケット33によって圧力容器1内の圧媒(または被処理物)をたとえば80℃前後に加温(予熱)してもよい。
【0038】
次に、作業者の操作指令を受けて制御装置800が給排水ユニット31を制御し、給排水ユニット31から圧力容器1の処理室5内に常温(たとえば20℃)の水が供給される。水は、圧力容器1の処理室5を満たすまで充填される。
【0039】
次に、制御装置800は、ポンプユニット32を制御して、処理空間内の水を加圧する(等方圧加圧処理、加圧処理工程)。この際、加圧により処理空間内の水の体積が減少するため、常温の水が追加補給されることが望ましい。圧力容器1内の被処理物Wに高い圧力が所定の時間付与されることで、セラミックスの粉体がゴム型の形状に応じて成形される。なお、上記の加圧中に、加熱ジャケット33によって圧力容器1内の圧媒(被処理物)を加温してもよい。
【0040】
加圧処理が終了すると、処理空間に対する減圧処理が施される。具体的に、圧力容器1から圧力媒体が排出され、圧力容器1内が減圧される(減圧処理工程)。
【0041】
その後、プレスフレーム8が、
図1の二点鎖線の位置に移動され、作業者は、圧力容器1から加圧処理後の被処理物Wを取り出す。
【0042】
図2を参照して、機械学習システム(機械学習装置)は、
図1で説明した制御装置800に加えてサーバ900(管理装置)及び通信装置700を含む。サーバ900及び通信装置700はネットワークNT1を介して相互に通信可能に接続されている。通信装置700及び制御装置800はネットワークNT2を介して相互に通信可能に接続されている。ネットワークNT1は、例えばインターネットなどの広域通信網である。ネットワークNT2は、例えばローカルエリアネットワークである。サーバ900は、例えば1以上のコンピュータで構成されるクラウドサーバである。通信装置700は、例えば制御装置800を使用するユーザが所持するコンピュータである。通信装置700は、制御装置800をネットワークNT1に接続するゲートウェイとして機能する。通信装置700は、ユーザ自身が所持するコンピュータに専用のアプリケーションソフトウェアをインストールすることで実現される。或いは通信装置700は、CIP装置100の製造メーカがユーザに提供する専用の装置であってもよい。制御装置800は、前述のように
図1で説明したCIP装置100を制御する制御装置である。
【0043】
以下、各装置の構成を具体的に説明する。サーバ900は、プロセッサ910及び通信部920を含む。プロセッサ910は、CPUなどを含む制御装置である。プロセッサ910は、報酬計算部911、更新部912、決定部913、及び学習制御部914を含む。プロセッサ910が備える各ブロックは、コンピュータを機械学習システムにおけるサーバ900として機能させる機械学習プログラムをプロセッサ910が実行することで実現されてもよいし、専用の電気回路で実現されてもよい。
【0044】
報酬計算部911は、状態観測部821が観測した状態変数に基づいて、少なくとも1つのCIP処理条件の決定結果に対する報酬を計算する。
【0045】
更新部912は、状態観測部821が観測した状態変数からCIP処理条件を決定するための関数を、報酬計算部911によって計算された報酬に基づいて更新する。関数としては、後述の行動価値関数が採用される。
【0046】
決定部913は、少なくとも1つのCIP処理条件を変更しながら、関数の更新を繰り返すことによって、報酬が最も多く得られるCIP処理条件を決定する。
【0047】
学習制御部914は、機械学習の全体制御を司る。本実施の形態の機械学習システムは強化学習によってCIP処理条件を学習する。強化学習とは、エージェント(行動主体)が環境の状況に基づいてある行動を選択し、選択した行動に基づいて環境を変化させ、環境変化に伴う報酬をエージェントに与えることにより、エージェントにより良い行動の選択を学習させる機械学習手法である。強化学習としては、Q学習及びTD学習が採用できる。以下の説明では、Q学習を例に挙げて説明する。本実施形態では、報酬計算部911、更新部912、決定部913、学習制御部914、及び後述する状態観測部821がエージェントに相当する。本実施形態において、通信部920は、状態変数を取得する状態取得部の一例である。
【0048】
通信部920は、サーバ900をネットワークNT1に接続する通信回路で構成される。通信部920は、状態観測部821により観測された状態変数を通信装置700を介して受信する。通信部920は、決定部913が決定したCIP処理条件を通信装置700を介して制御装置800に送信する。
【0049】
通信装置700は、送信器710及び受信器720を含む。送信器710は、制御装置800から送信された状態変数をサーバ900に送信すると共に、サーバ900から送信されたCIP処理条件を制御装置800に送信する。受信器720は、制御装置800から送信された状態変数を受信すると共に、サーバ900から送信されたCIP処理条件を受信する。
【0050】
制御装置800は、通信部810、プロセッサ820、センサー部830、入力部840、及びメモリ850を含む。
【0051】
通信部810は、制御装置800をネットワークNT2に接続するための通信回路である。通信部810は、状態観測部821によって観測された状態変数をサーバ900に送信する。通信部810は、サーバ900の決定部913が決定したCIP処理条件を受信する。通信部810は、学習制御部914が決定した後述するCIP処理実行コマンドを受信する。
【0052】
プロセッサ820は、CPUなどを含むコンピュータである。プロセッサ820は、状態観測部821、処理実行部822、及び入力判定部823を含む。通信部810は、状態観測部821が取得した状態変数をサーバ900に送信する。プロセッサ820が備える各ブロックは、例えばCPUが機械学習システムの制御装置800として機能させる機械学習プログラムを実行することで実現される。
【0053】
状態観測部821は、CIP処理実行後において、センサー部830が検出した物理量を取得する。状態観測部821は、CIP処理実行後において被処理物Wに関する少なくとも1つの物理量と、少なくとも1つのCIP処理条件とを含む状態変数を観測する。具体的には、状態観測部821は、センサー部830の計測値に基づいてCIP処理条件を取得する。また、状態観測部821は、センサー部830の計測値などに基づいて物理量を取得する。本実施形態において、被処理物Wに関する少なくとも1つの物理量は、緻密化および圧粉体化に関する物理量である。
【0054】
図3は、CIP処理条件の一例を示す図である。CIP処理条件は、大きく中分類に分類される。中分類には、被処理物に関する第1パラメータと、CIP処理の前工程に関する第2パラメータと、CIP装置100の運転条件に関する第3パラメータとのうちの少なくとも1つが含まれる。表中の学習制御の欄において、「1」と記載されたパラメータはユーザが入力部840を操作することによって値を指定するパラメータであり、機械学習によって学習されるパラメータではない。したがって、本実施の形態では「1」と記載された以外、すなわち「2」と記載されたパラメータが学習対象となる。なお、「3」と記載された「かさ密度」は、CIP装置100の装置構成に応じて学習対象とされる場合がある。但し、これらの分類は一例であり、「1」と記載されたパラメータのうちのいずれか1つ又は複数のパラメータが学習対象とされてもよい。
【0055】
第1パラメータは、小分類として、処理品の化学成分、処理品の組成比、処理量、配置、形状、寸法、かさ密度、真密度の少なくとも1つを含む。処理品の化学成分および組成比は、被処理物Wを構成する材料の化学成分、組成比を示す。たとえば、化学成分はTi、Al、Feなどである。また、たとえば、組成比は、Ti:80wt%、Al:10wt%、Fe:10wt%などのように設定される。処理量は、1バッチあたり処理する量、すなわち、1度のCIP処理において圧力容器1に収容される被処理物Wの量を示す。配置は、圧力容器1内で被処理物Wをどのように配置するかを示している。形状は、被処理物Wの外形状である。前述のように、被処理物Wがセラミックスの粉体の場合は、ゴム型の型形状を示す。例えば、形状としては、円筒、円柱、直方体、球体、円錐台、多角柱といった情報が採用できる。このように、形状をCIP処理条件に加えたのは、被処理物Wの形状によってCIP処理の結果が変わる可能性があるからである。寸法は、被処理物Wが直方体の場合、幅、高さ、及び奥行き等の情報が採用され、被処理物Wが円筒形の場合、平均直径及び高さ等の情報が採用される。かさ密度は、被処理物Wが粉体の場合における、かさ密度を意味する。真密度は、被処理物Wの実際の密度を示す。なお、他の実施形態において、被処理物の形状や寸法を機械学習によって学習されるパラメータとする場合には、例えば、カメラ又は3次元測定器等を用いてこれらを観測することができる。
【0056】
前述のように、化学成分、組成比、処理量、配置、形状、寸法、かさ密度および真密度は、それぞれ、ユーザによって入力部840を介して入力される。したがって、状態観測部821は、これらのパラメータを入力部840から取得すればよい。
【0057】
第2パラメータは、小分類として、予熱温度、予熱時間、真空包装時の真空度を含む。予熱温度は被処理物Wに対してCIP処理(加圧処理)前に行われる予熱処理における温度を示す。同様に、予熱時間は被処理物Wに対してCIP処理前に行われる予熱処理における時間を示す。真空包装時の真空度は、被処理物Wを真空包装する場合の真空度を示す。これらの第2パラメータは、それぞれ、ユーザによって入力部840を介して入力される。したがって、状態観測部821はこれらのパラメータを入力部840から取得すればよい。なお、前工程である予熱工程は、被処理物Wを圧力容器1の内部に格納して行うものでもよいし、被処理物Wに対して圧力容器1の外部で行うものでもよい。いずれの場合においても、予熱温度、予熱時間は、本発明の第2パラメータを構成する。
【0058】
第3パラメータは、小分類として、処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無、処理温度、昇温速度(処理中)、降温速度(処理中)、温度分布を含む。処理圧力は、CIP処理中の圧力容器1内の圧力を示す。昇圧速度および減圧速度は、CIP処理前後の圧力の変化における速度を示す。なお、減圧速度は、二次減圧も含んでいる。すなわち、予め設定される二次減圧設定値以下で、減圧速度が変化する。圧力保持時間は、被処理物Wに対してCIP処理を行う時間を示す。段階昇圧の有無は、CIP処理時に一定の処理圧力に到達するまでの昇圧を段階的に行うか否かを示す。同様に、段階減圧の有無は、CIP処理時に一定の処理圧力からの減圧を段階的に行うか否かを示す。処理温度は、CIP処理中の圧力容器1内の温度を示す。昇温速度(処理中)は、CIP処理中の圧力容器1内の温度上昇の速度を示す。同様に、降温速度(処理中)は、CIP処理中の圧力容器1内の温度低下の速度を示す。温度分布は、圧力容器1内の所定の方向に沿って複数の加熱ジャケット33が配置された場合に、各加熱ジャケット33の発熱量を調整することで形成される圧力容器1内の温度分布を示す。
【0059】
図4は、CIP処理中の圧力容器1内の圧力及び温度の推移の一例を示すグラフである。
図4において縦軸は圧力及び温度を示し、横軸は時間を示す。この例では、圧力及び温度の推移は共に台形状である。圧力及び温度はそれぞれ最大圧力及び最高温度になるまで一定の傾きで増大し、一定時間最大圧力(処理圧力)及び最高温度(処理温度)を維持した後、一定の傾きで減少する。圧力について、前述のように処理圧力、昇圧時の傾き(昇圧速度)、降圧時の傾き(減圧速度)、最大圧力の維持時間(圧力保持時間)、段階昇圧、段階減圧の有無などが変化されて機械学習が行われる。また、温度について、処理温度、増大時の傾き(昇温速度)、減少時の傾き(降温速度)、最高温度の維持期間、温度分布などが変化されて機械学習が行われる。圧力に関する運転条件は入力部840を介してユーザが入力したデータが採用されてもよいし、給排水ユニット31が有する圧力センサー(不図示)の計測値が採用されてもよい。上記のその他のパラメータは、入力部840を介してユーザにより入力されたデータが採用される。
【0060】
図5、
図6および
図7は、被処理物Wの物理量の一例を示す図である。物理量は、大分類として、緻密化および圧粉体化に関する物理量とがある。
【0061】
緻密化は大きく分けて機械的特性、形状的特性、形態情報、光学的特性、電気的特性、物理的特性の中分類に分類される。
【0062】
機械的特性の中分類は、処理目的に応じて、複数の小分類に分類される。当該小分類には、内部欠陥、引張強度、疲労寿命、靭性、クリープ強度、摩耗速度、硬度が含まれる。これらの機械的特性の各小分類は、対象素材を選ばず、各素材に共通して適用可能な分類である。
【0063】
内部欠陥の小分類は、加圧処理を受けた被処理物Wの内部欠陥の有無を示す。内部欠陥は、公知のUT法(超音波探傷試験法)、RT法(放射線透過法)、MT法(磁粉探傷試験法)を採用することができる。
【0064】
引張強度の小分類は、加圧処理を受けた被処理物Wの引張強度を示す。引張強度は、公知の引張試験機で試験することができる。
【0065】
疲労寿命の小分類は、加圧処理を受けた被処理物Wの疲労寿命を示す。疲労寿命は、公知の疲労試験機で試験することができる。
【0066】
靭性の小分類は、加圧処理を受けた被処理物Wの靭性を示す。靭性は、公知の引張試験機で試験することができる。
【0067】
クリープ強度の小分類は、加圧処理を受けた被処理物Wのクリープ強度を示す。クリープ強度は、公知のクリープ試験機で試験することができる。
【0068】
摩耗速度の小分類は、加圧処理を受けた被処理物Wの摩耗速度を示す。摩耗速度は、公知の摩耗試験機で試験することができる。
【0069】
硬度の小分類は、加圧処理を受けた被処理物Wの硬度を示す。硬度は、公知の硬度計で測定することができる。
【0070】
形状的特性の中分類は、形状変化の小分類を含む。形状変化の小分類は、加圧処理を受けた被処理物Wの形状の変化を意味する。形状変化は、公知の3D寸法測定器によって、その経時的な形状変化を測定することができる。
【0071】
形態情報の中分類は、電極材料厚み、誘電体厚み、活物質-固体電解質間コート層厚み、活物質-固体電解質間コート層の被膜状態、正極合剤/固体電解質の分散性、正極合剤/固体電解質の配合比率、正極合剤/固体電解質の偏在度、空隙の有無、活物質の繋がり(分布)、活物質/固体電解質の接触面積の小分類に分類される。
【0072】
電極材料厚みの小分類は、主に被処理物Wが金属である場合に採用され、公知の膜厚測定器、断面SEM(走査電子顕微鏡)、AFM(原子間力顕微鏡)によって測定することができる。
【0073】
誘電体厚みの小分類は、主に被処理物Wがセラミックス、樹脂である場合に採用され、同様に、公知の膜厚測定器、断面SEM(走査電子顕微鏡)、AFM(原子間力顕微鏡)によって測定することができる。
【0074】
活物質-固体電解質間コート層厚みの小分類は、主に被処理物Wがセラミックスである場合に採用され、同様に、公知の膜厚測定器、断面SEM(走査電子顕微鏡)、AFM(原子間力顕微鏡)によって測定することができる。
【0075】
活物質-固体電解質間コート層の被膜状態の小分類は、主に被処理物Wがセラミックスである場合に採用され、公知の飛行時間型二次イオン質量分析装置、TEM-EDX(エネルギー分散型X線分光法)、低速イオン散乱分光法によって測定することができる。
【0076】
正極合剤/固体電解質の分散性、正極合剤/固体電解質の配合比率、正極合剤/固体電解質の偏在度、空隙の有無、活物質の繋がり(分布)、活物質/固体電解質の接触面積の各小分類は、主に被処理物Wがセラミックスである場合に採用され、公知の3D-SEMによって測定することができる。なお、活物質/固体電解質の接触面積は、3D-SEMに画像解析を組み合わせることで測定することができる。
【0077】
光学的特性の中分類は、透明度の小分類を含む。透明度は、主に被処理物Wがセラミックス、ガラス、樹脂などの場合に採用され、公知の分光光度計によって測定することができる。
【0078】
図6を参照して、電気的特性の中分類は、電気抵抗、誘電率、静電容量、インピーダンス、充放電時の平均電位、充放電容量、充放電効率、電流密度(レート)特性、サイクル寿命の各小分類に分類される。
【0079】
電気抵抗の小分類は、加圧処理を受けた被処理物Wの電気抵抗を意味し、共通の対象素材に対して適用可能である。電気抵抗は、公知の導電率計によって測定することができる。
【0080】
誘電率の小分類は、加圧処理を受けた被処理物Wの誘電率を意味し、共通の対象素材に対して適用可能である。誘電率も、公知の誘電率計によって測定することができる。
【0081】
静電容量の小分類は、加圧処理を受けた被処理物Wの静電容量を意味し、対象素材が積層セラミックスコンデンサの場合に適用される。静電容量は、公知のLCRメータ、インピーダンスアナライザによって測定することができる。
【0082】
インピーダンスの小分類は、加圧処理を受けた被処理物Wのインピーダンスを意味し、主に被処理物Wがセラミックスの場合に適用される。インピーダンスは、公知のインピーダンスアナライザによって測定することができる。
【0083】
充放電時の平均電位、充放電容量、充放電効率の各小分類は、主に対象素材が二次電池の場合に適用される。これらは、充放電試験機(バッテリーテスター)によって測定することができる。
【0084】
電流密度(レート)特性、サイクル寿命の各小分類も、主に対象素材が二次電池の場合に適用される。電流密度特性は、放電レート特性試験によって取得することができる。また、サイクル寿命は、充放電サイクル試験によって測定することができる。
【0085】
物理的特性の中分類は、真密度(体積減少率)、イオン伝導率、成形性、密度の均一性(配向性)の各小分類に分類され、いずれもどのような対象部材にも適用可能である。
【0086】
真密度(体積減少率)は、真密度測定装置によって測定することができる。イオン伝導率は、交流インピーダンス測定装置、FFTアナライザ、FRA法によって測定することができる。また、成形性は、3D寸法測定器によって測定することができる。更に、密度の均一性は、真密度測定装置を用いて被処理物Wの複数箇所で測定することで取得することができる。
【0087】
図7を参照して、圧粉体化の大分類は、機械的特性、電気的特性、物理的特性の各中分類に分類される。機械的特性の中分類は、引張強度、疲労寿命、靭性、クリープ強度、摩耗速度、硬度など、電機的特性の中分類は、誘電率、電気抵抗など、物理的特性の中分類は、真密度、イオン伝導率などの各小分類に分類される。なお、これらの小分類は、前述の緻密化の大分類に含まれるものと同様であるため、その説明を省略する。
【0088】
図2に参照を戻す。処理実行部822は、CIP装置100によるCIP処理の実行を制御する。入力判定部823は、量産工程であるか否かを自動又は手動により判定する。入力判定部823は、量産工程であるか否かを自動で判定する場合、入力部840に入力された条件番号の入力回数が基準回数を超えた場合、CIP装置100は量産工程にあると判定する。条件番号とは、ある1つのCIP処理条件を特定するための識別番号である。条件番号により特定されるCIP処理条件は、少なくとも
図3に示すCIP処理条件のうち「1」と記載されたCIP処理条件を含む。
【0089】
入力判定部823は、量産工程であるか否かを手動により判定する場合において、入力部840に量産工程である旨のデータが入力された場合、CIP装置100は量産工程にあると判定する。量産工程にある場合、制御装置800は機械学習を行わない。
【0090】
メモリ850は、例えば不揮発性の記憶装置であり、最終的に決定された最適なCIP処理条件などを記憶する。
【0091】
センサー部830は、
図3に例示されたCIP処理条件及び
図5、
図6、
図7に例示された被処理物Wの物理量の計測に用いられる各種センサーである。具体的には、センサー部830は、圧力容器1内の温度を計測する温度センサー、圧力センサー等を含む。また、センサー部830は、被処理物Wに対するCIP処理の終了後、圧力容器1から取り出された被処理物Wに前述の各種の測定試験を行うためのセンサーを含む。
図2では、センサー部830は、制御装置800の内部に設けられているが、これは一例であり、制御装置800の外部に設けられていてもよく、センサー部830の設置場所は特に限定されない。入力部840は、キーボード、及びマウスなどの入力装置である。
【0092】
図8は、
図2に示す機械学習システムが実行する処理の一例を示すフローチャートである。ステップS1では、学習制御部914は、入力部840を用いてユーザにより入力された、CIP処理条件の入力値を取得する。ここで取得される入力値は、
図3に列記されたCIP処理条件のうち、「1」と記載されたCIP処理条件に対する入力値である。
【0093】
ステップS2では、学習制御部914は、少なくとも1つのCIP処理条件とCIP処理条件に対する設定値とを決定する。ここで、設定対象となるCIP処理条件は、
図3に列挙されたCIP処理条件のうち、「2」または「3」と記載されたCIP処理条件であって、設定値が設定可能な少なくとも1つのCIP処理条件である。ここで、決定されるCIP処理条件の設定値は強化学習における行動に相当する。
【0094】
具体的には、学習制御部914は、設定対象となるCIP処理条件のそれぞれについて設定値をランダムに選択する。ここで、設定値は、CIP処理条件のそれぞれについて所定の範囲内からランダムに選択される。CIP処理条件の設定値の選択方法としては、例えばε-greedy法が採用できる。
【0095】
ステップS3では、学習制御部914は、制御装置800にCIP処理実行コマンドを送信することで、制御装置800を通じてCIP装置100にCIP処理を開始させる。CIP処理実行コマンドが通信部810により受信されると、処理実行部822は、CIP処理実行コマンドにしたがってCIP処理条件を設定し、CIP処理を開始する。CIP処理実行コマンドには、ステップS1で設定されたCIP処理条件の入力値及びステップS2で決定されたCIP処理条件の設定値などが含まれる。
【0096】
CIP処理が終了すると、状態観測部821は、状態変数を観測する(ステップS4)。具体的には、状態観測部821は、
図5、
図6、
図7に記載された緻密化・圧粉体化に関する物理量と、
図3に記載されたCIP処理条件のうちセンサー部830などによって状態が観測されるCIP処理条件とを状態変数として取得する。物理量は、例えばユーザが入力部840を操作することによって制御装置800に入力されてもよいし、物理量を計測する計測器と制御装置800とが通信することで制御装置800に入力されてもよい。状態観測部821は、取得した状態変数を通信部810を介してサーバ900に送信する。
【0097】
ステップS5では、決定部913は、物理量を評価する。ここで、決定部913は、ステップS4で取得された物理量のうち評価対象となる物理量(以下、対象物理量と呼ぶ。)が所定の基準値に到達しているか否かを判定することで物理量を評価する。対象物理量は、
図5、
図6、
図7に列記された物理量のうち1又は複数の物理量である。対象物理量が複数の場合、基準値は、各対象物理量に対応する複数の基準値が存在することになる。基準値は、例えば、対象物理量が一定の基準に到達していることを示す予め定められた値が採用できる。
【0098】
例えば、緻密化の引張強度について機械学習が行われる場合は、基準値は引張強度について予め定められた値が採用され、靭性について機械学習が行われる場合は、基準値は靭性について予め定められた値が採用される。基準値は、例えば上限値と下限値とを含む値であってもよい。この場合、対象物理量が上限値と下限値との範囲内に入った場合、基準値に到達したと判定される。基準値は一つの値であってもよい。この場合、対象物理量が基準値を超えた場合、又は基準値を下回った場合に一定の基準を満たすと判定される。
【0099】
決定部913は、対象物理量が基準値に到達していると判定した場合(ステップS6でYES)、ステップS2で設定したCIP処理条件を最終的なCIP処理条件として出力する(ステップS7)。一方、決定部913は、物理量が基準値に到達していないと判定した場合(ステップS6でNO)、処理をステップS8に進める。なお、対象物理量が複数の場合、決定部913は、全ての対象物理量が基準値に到達したとき、ステップS6でYESと判定すればよい。
【0100】
ステップS8では、報酬計算部911は、対象物理量が基準値に近づいているか否かを判定する。対象物理量が基準値に近づいている場合(ステップS8でYES)、報酬計算部911は、エージェントに対する報酬を増大させる(ステップS9)。一方、対象物理量が基準値に近づいていない場合(ステップS8でNO)、報酬計算部911は、エージェントに対する報酬を減少させる(ステップS10)。この場合、報酬計算部911は、予め定められた報酬の増減値にしたがって報酬を増減させればよい。なお、対象物理量が複数の場合、報酬計算部911は、複数の対象物理量のそれぞれについて、ステップS8の判定を行えばよい。この場合、報酬計算部911は、複数の対象物理量のそれぞれについて、ステップS8の判定結果に基づいて報酬を増減させればよい。また、報酬の増減値は対象物理量に応じて異なる値が採用されてもよい。
【0101】
また、対象物理量が基準値に近づいていない場合(ステップS8でNO)、報酬を減少させる処理(ステップS10)は省かれてもよい。この場合、対象物理量が基準値に近づいている場合にのみ報酬が与えられることになる。
【0102】
ステップS11では、更新部912は、エージェントに付与した報酬を用いて行動価値関数を更新する。本実施の形態で採用されるQ学習は、ある環境状態sの下で、行動aを選択することへの価値であるQ値(Q(s,a))を学習する方法である。なお、環境状態stは、上記のフローの状態変数に相当する。そして、Q学習では、ある環境状態sのときに、Q(s,a)の最も高い行動aが選択される。Q学習では、試行錯誤により、ある環境状態sの下で様々な行動aをとり、そのときの報酬を用いて正しいQ(s,a)が学習される。行動価値関数Q(st,at)の更新式は以下の式(1)で示される。
【0103】
【数1】
ここで、s
t,a
tは、それぞれ、時刻tにおける環境状態と行動とを表す。行動a
tにより、環境状態はs
t+1に変化し、その環境状態の変化によって、報酬r
t+1が算出される。また、maxの付いた項は、環境状態s
t+1の下で、その時に分かっている最も価値の高い行動aを選んだ場合のQ値(Q(s
t+1,a))にγを掛けたものである。ここで、γは割引率であり、0<γ≦1(通常は0.9~0.99)の値をとる。αは学習係数であり、0<α≦1(通常は0.1程度)の値をとる。
【0104】
この更新式は、状態sにおける行動aのQ値であるQ(st,at)よりも、行動aによる次の環境状態st+1における最良の行動をとったときのQ値に基づくγ・maxQ(st+1,a)の方が大きければ、Q(st,at)を大きくする。一方、この更新式は、Q(st,at)よりもγ・maxQ(st+1,a)の方が小さければ、Q(st,at)を小さくする。つまり、ある状態stにおけるある行動aの価値を、それによる次の状態st+1における最良の行動の価値に近づけるようにしている。これにより、最適なCIP処理条件が決定される。
【0105】
ステップS11の処理が終了すると、処理はステップS2に戻り、CIP処理条件の設定値が変更され、同様にして行動価値関数が更新される。更新部912は、行動価値関数を更新したが、本発明はこれに限定されず、行動価値テーブルを更新してもよい。
【0106】
Q(s,a)は、全ての状態と行動とのペア(s,a)に対する値がテーブル形式で保存されてもよい。或いは、Q(s,a)は、全ての状態と行動とのペア(s,a)に対する値を近似する近似関数によって表されてもよい。この近似関数は多層構造のニューラルネットワークにより構成されてもよい。この場合、ニューラルネットワークは、実際にCIP装置100を動かして得られたデータをリアルタイムで学習し、次の行動に反映させるオンライン学習を行えばよい。これにより、深層強化学習が実現される。
【0107】
具体的に、強化学習では、機械学習システムが、所定の環境の中で目的として設定された報酬(スコア)を最大化するための行動を学習する。一方、深層学習(ディープラーニング)では、ニューラルネットワークの中間層を複数にすることで、機械学習システムが自ら学習データから特徴量を抽出し、予測モデルを構築する表現学習が可能となる。したがって、本実施形態における強化学習に深層学習を応用した深層強化学習では、
図3に示されるCIP処理条件(第1パラメータ、第2パラメータ、第3パラメータ)および
図5、
図6、
図7に示される被処理物Wの物理量の中から、機械学習システムが好適な特徴量を抽出することができる。この際、
図3の運転条件における処理圧力および処理温度のように互いに影響しあう(交互作用)特徴量に対しては、これらを含む新たな特徴量(たとえば圧力/温度の比)を機械学習システムが抽出し、当該特徴量を変化させてもよい。このような構成によれば、高い報酬を得ることが可能なCIP処理条件をより早く効率的に得ることができる。また、上記のような深層強化学習が量産工程に対して事前に実行されることで、望ましいCIP処理条件に基づく量産工程を実現することができる。
【0108】
従来、CIP装置においては、高品質なCIP処理品が得られるようにCIP処理条件を変化させることによってCIP処理条件の開発が行われてきた。良好なCIP処理条件を得るためには、被処理物Wの評価とCIP処理条件との関係性を見出すことが要求される。しかし、
図3に示されるようにCIP処理条件の種類は膨大であるため、このような関係性を規定するには極めて多くの物理モデルが必要となり、物理モデルによってこのような関係性を記述するのは困難であるとの知見が得られた。さらに、このような物理モデルを構築するには、どのパラメータがどの被処理物Wの評価に影響を与えているのかを人為的に見いだすことも要求され、この構築は困難である。
【0109】
本実施形態によれば、上述した第1~第3のパラメータのうちの少なくとも1つのパラメータと、緻密化・圧粉体化に関する物理量のうちの少なくとも1つの物理量とが状態変数として観測される。そして、観測された状態変数に基づいて、CIP処理条件の決定結果に対する報酬が計算され、計算された報酬に基づいて、状態変数からCIP処理条件を決定するための行動価値関数が更新され、この更新が繰り返されて報酬が最も多く得られるCIP処理条件が学習される。このように、本実施形態は、上述の物理モデルを用いることなく、機械学習によりCIP処理条件が決定される。この結果、本実施形態は、適切なCIP処理条件を、熟練した技術者による長年の経験を頼らずに、効率的かつ容易に決定することができる。
【0110】
特に、水などを圧力媒体として圧力容器1内に流入させ、被処理物Wに対してCIP処理を施す場合には、
図3に示される各種の処理条件が相互に関連しながら、被処理物Wの物理量(
図5、
図6、
図7)が変化する。たとえば、被処理物Wに関する第1パラメータとして圧力容器1内における被処理物Wの配置、形状、寸法などを変化させると、同じ処理圧力(運転条件、第3パラメータ)であっても、各被処理物Wに対する圧力の作用が変化する結果、空隙の有無(
図5、形態情報)に差が生じる可能性がある。このような各物理量の影響を多くの物理モデルによって見出すことは困難である。一方、本実施形態によれば、機械学習システムが行動価値関数を更新しながら、より報酬の高いCIP処理条件を学習することで、効率的に望ましいCIP処理条件を決定することができる。この際、前述のように機械学習システムに深層強化学習を適用することによって、システムが自ら新たな物理量を抽出し、適切なCIP処理条件をより早く効率的に導き出すことができる。
【0111】
以上のように、本実施形態では、制御装置800は、前記状態変数をネットワークを介してサーバ上に送信し、機械学習済みの少なくとも1つの等方圧加圧処理条件を前記サーバから受信する。また、前記少なくとも1つの等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる等方圧加圧処理条件を決定することによって生成されたものである。
【0112】
なお、本発明は以下の変形実施形態を採用することができる。
【0113】
(1)
図9は、本発明の変形実施形態に係る機械学習システムの全体構成図である。この変形実施形態に係る機械学習システムは、制御装置800A単体で構成されている。制御装置800Aは、プロセッサ820A、入力部880、及びセンサー部890を含む。プロセッサ820Aは、機械学習部860、及びCIP処理部870を含む。機械学習部860は、報酬計算部861、更新部862、決定部863、及び学習制御部864を含む。報酬計算部861~学習制御部864は、それぞれ、
図2に示す報酬計算部911~学習制御部914と同じである。CIP処理部870は、状態観測部871、処理実行部872、及び入力判定部873を含む。状態観測部871~入力判定部873は、それぞれ
図2に示す状態観測部821、処理実行部822、及び入力判定部823と同じである。入力部880及びセンサー部890は、それぞれ
図2に示す入力部840及びセンサー部830と同じである。本変形例において状態観測部821は、状態情報を取得する状態取得部の一例である。なお、センサー部890は、制御装置800Aの内部に設けられていてもよいし、制御装置800Aの外部に設けられていてもよく、センサー部890の設置場所は特に限定されない。
【0114】
このように、この変形実施形態に係る機械学習システムによれば、制御装置800A単体で最適なCIP処理条件を学習させることができる。
【0115】
(2)上記の
図8に示されるフローでは、CIP処理の終了後に状態変数が観測されていたが、これは一例であり、1回のCIP処理中に状態変数が複数観測されてもよい。例えば、状態変数が瞬時に計測可能なパラメータのみで構成されている場合、1回のCIP処理中に複数の状態変数を観測できる。これにより、学習時間の短縮が図られる。また、
図8のステップS7においてCIP処理が開始されると、その処理の中で状態変数の観測、物理量の評価を並行して行うことで、同CIP処理の最終段階における被処理物Wの物理量をより基準値に近づけるように、処理中のCIP処理条件を変化させることもできる。すなわち、本発明に係る機械学習システムが実行する機械学習方法には、複数回のCIP処理を通じて報酬が最も多く得られる等方圧加圧処理条件を決定するもののみならず、所定のCIP処理中に最終的な報酬が最も多く得られる等方圧加圧処理条件を決定するものも含まれる。
【0116】
(3)本発明に係る通信方法は、
図2に示す制御装置800がサーバ900と通信する際の各種処理によって実行される。また、本発明に係る学習プログラムは
図2に示すサーバ900としてコンピュータを機能させるプログラムによって実現される。
【符号の説明】
【0117】
1 圧力容器
100 CIP装置
31 給排水ユニット
31A 供給用ポンプ
31B 排出用ポンプ
31C 切換弁
32 ポンプユニット
33 ヒーター
700 通信装置
710 送信器
720 受信器
800、800A 制御装置
810 通信部
820、820A プロセッサ
821 状態観測部
822 処理実行部
823 入力判定部
830 センサー部
840 入力部
850 メモリ
860 機械学習部
861 報酬計算部
862 更新部
863 決定部
864 学習制御部
870 CIP処理部
871 状態観測部
872 処理実行部
873 入力判定部
880 入力部
890 センサー部
900 サーバ
910 プロセッサ
911 報酬計算部
912 更新部
913 決定部
914 学習制御部
920 通信部