IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社神戸製鋼所の特許一覧

特開2023-62866機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置
<>
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図1
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図2
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図3
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図4
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図5
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図6
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図7
  • 特開-機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023062866
(43)【公開日】2023-05-09
(54)【発明の名称】機械学習方法、機械学習装置、機械学習プログラム、通信方法、及び制御装置
(51)【国際特許分類】
   A23L 3/015 20060101AFI20230427BHJP
   G06N 20/00 20190101ALI20230427BHJP
   G06N 3/02 20060101ALI20230427BHJP
   A23L 5/10 20160101ALI20230427BHJP
【FI】
A23L3/015
G06N20/00
G06N3/02
A23L5/10 Z
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021173017
(22)【出願日】2021-10-22
(71)【出願人】
【識別番号】000001199
【氏名又は名称】株式会社神戸製鋼所
(74)【代理人】
【識別番号】100115381
【弁理士】
【氏名又は名称】小谷 昌崇
(74)【代理人】
【識別番号】100178582
【弁理士】
【氏名又は名称】行武 孝
(72)【発明者】
【氏名】伊藤 洋行
(72)【発明者】
【氏名】南野 友哉
(72)【発明者】
【氏名】白樫 浩
(72)【発明者】
【氏名】岸 新和
(72)【発明者】
【氏名】溝上 忠孝
(72)【発明者】
【氏名】宮下 泰秀
【テーマコード(参考)】
4B021
4B035
【Fターム(参考)】
4B021LP07
4B021LT01
4B021LT06
4B035LC16
4B035LP44
4B035LP55
4B035LP59
4B035LT20
(57)【要約】
【課題】被処理物に対する適切なCIP処理条件を容易に決定する。
【解決手段】取得した状態変数に基づいて、冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、状態変数から少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、報酬に基づいて更新し、関数の更新を繰り返すことによって、報酬が最も多く得られる冷間等方圧加圧処理条件を決定し、冷間等方圧加圧処理条件は、被処理物に関する第1パラメータと、冷間等方圧加圧処理の前工程に関する第2パラメータと、冷間等方圧加圧装置の運転条件に関する第3パラメータとのうちの少なくとも1つであり、少なくとも1つの物理量は、被処理物の殺菌・不活性化、脱殻、味・風味改善、食感・栄養改善のうちの少なくとも1つである。
【選択図】図1
【特許請求の範囲】
【請求項1】
被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧装置の冷間等方圧加圧処理条件を機械学習装置が決定する機械学習方法であって、
前記冷間等方圧加圧装置は、
前記被処理物を格納する圧力容器と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記冷間等方圧加圧装置を制御する制御装置と、を備え、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を取得し、
前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、
前記少なくとも1つの冷間等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、
前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定し、
前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記冷間等方圧加圧処理の前工程に関する第2パラメータと、
前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである、
機械学習方法。
【請求項2】
前記少なくとも1つの冷間等方圧加圧処理条件として、前記第1パラメータを含み、
前記第1パラメータは、前記被処理物の処理量、配置、形状、寸法、包装有無、真密度、包装材の成分吸着性及び包装材の容積の少なくとも1つである、
請求項1記載の機械学習方法。
【請求項3】
前記少なくとも1つの冷間等方圧加圧処理条件として、前記第2パラメータを含み、
前記第2パラメータは、予熱温度、予熱時間、真空包装時の真空度の少なくとも1つである、
請求項1又は2記載の機械学習方法。
【請求項4】
前記少なくとも1つの冷間等方圧加圧処理条件として、前記第3パラメータを含み、
前記第3パラメータは、前記冷間等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無の少なくとも1つである、
請求項1~3のいずれか1項に記載の機械学習方法。
【請求項5】
前記冷間等方圧加圧装置は、前記圧力容器内の圧媒の温度を調整することが可能な温度調整機構を更に備え、
前記制御装置は、前記温度調整機構を更に制御することが可能である、
請求項1乃至4のいずれか1項に記載の機械学習方法。
【請求項6】
前記冷間等方圧加圧装置は、前記圧力容器内の圧媒の温度を調整することが可能な温度調整機構を更に備え、
前記制御装置は、前記温度調整機構を更に制御することが可能であり、
前記第3パラメータは、前記冷間等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無、処理温度、処理中昇温速度、処理中降温速度、温度分布の少なくとも1つである、
請求項4に記載の機械学習方法。
【請求項7】
前記関数は深層強化学習を用いて更新される、
請求項1~6のいずれか1項に記載の機械学習方法。
【請求項8】
前記報酬の計算では、前記少なくとも1つの物理量が各物理量に対応する所定の基準値に近づいている場合、前記報酬を増大させる、
請求項1~7のいずれか1項に記載の機械学習方法。
【請求項9】
被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧装置の冷間等方圧加圧処理条件を決定する機械学習装置であって、
前記冷間等方圧加圧装置は、
前記被処理物を格納する圧力容器と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記冷間等方圧加圧装置を制御する制御装置と、を備え、
前記機械学習装置は、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を取得する状態取得部と、
前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算する報酬計算部と、
前記少なくとも1つの冷間等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新する更新部と、
前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定する決定部と、を備え、
前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記冷間等方圧加圧処理の前工程に関する第2パラメータと、
前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである、
機械学習装置。
【請求項10】
被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧装置の冷間等方圧加圧処理条件を決定する機械学習装置の学習プログラムであって、
前記冷間等方圧加圧装置は、
前記被処理物を格納する圧力容器と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記冷間等方圧加圧装置を制御する制御装置と、を備え、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を取得する状態取得部と、
前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算する報酬計算部と、
前記少なくとも1つの冷間等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新する更新部と、
前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定する決定部としてコンピュータを機能させ、
前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記冷間等方圧加圧処理の前工程に関する第2パラメータと、
前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである、
機械学習プログラム。
【請求項11】
被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧装置の冷間等方圧加圧処理条件を機械学習する際の前記冷間等方圧加圧装置の制御装置の通信方法であって、
前記冷間等方圧加圧装置は、
前記被処理物を格納する圧力容器と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記制御装置と、を備え、
前記制御装置は、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を観測し、
前記制御装置は、前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの冷間等方圧加圧処理条件を前記サーバから受信し、
前記少なくとも1つの冷間等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの冷間等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定することによって生成されたものであり、
前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記冷間等方圧加圧処理の前工程に関する第2パラメータと、
前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである、
通信方法。
【請求項12】
被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧装置の制御装置であって、
前記冷間等方圧加圧装置は、
前記被処理物を格納する圧力容器と、
前記圧力容器に前記圧媒を供給するための圧縮機と、
前記圧力容器内の圧力を調整することが可能な圧力調整機構と、
前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を観測する状態観測部と、
前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの冷間等方圧加圧処理条件を前記サーバから受信する通信部と、を備え、
前記少なくとも1つの冷間等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの冷間等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定することによって生成されたものであり、
前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、
前記冷間等方圧加圧処理の前工程に関する第2パラメータと、
前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、
のうちの少なくとも1つであり、
前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである、
制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、冷間等方圧加圧装置の冷間等方圧加圧条件を機械学習する技術に関するものである。
【背景技術】
【0002】
従来、食品などの被処理物に付着する微生物の殺菌を目的として、CIP法(Cold Isostatic Pressing法:冷間等方圧加圧方法)を用いて、被処理物に加圧処理を施す加圧装置(CIP装置:冷間等方圧加圧装置)が知られている(例えば、特許文献1)。このような加圧装置では、筒状の圧力容器内に被処理物が収容され、前記圧力容器内に圧力媒体が封入されることで、加圧処理が施される。このような加圧処理は、高温の加熱処理と比較して、食品の味、食感や風味などが損なわれることが少ないため有効である。高品質なCIP処理品を得るためには、加圧条件等のCIP処理条件を適切に決定することが要求される。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-4692号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来、CIP処理条件は、この蓄積された研究データをもとに決定されているため、被処理物に対する適切なCIP処理条件を容易に決定することが困難であった。
【0005】
本発明の目的は、被処理物に対する適切なCIP処理条件を効率的に導くことができる機械学習方法などを提供することにある。
【課題を解決するための手段】
【0006】
本発明の一態様に係る機械学習方法は、被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧の冷間等方圧加圧処理条件を機械学習装置が決定する機械学習方法であって、前記冷間等方圧加圧装置は、前記被処理物を格納する圧力容器と、前記圧力容器に前記圧媒を供給するための圧縮機と、前記圧力容器内の圧力を調整することが可能な圧力調整機構と、前記冷間等方圧加圧装置を制御する制御装置と、を備え、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を取得し、前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの冷間等方圧加圧処理条件を変更しながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定し、前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、前記冷間等方圧加圧処理の前工程に関する第2パラメータと、前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである。
【0007】
本態様によれば、被処理物に関する第1パラメータと、冷間等方圧加圧処理の前工程に関する第2パラメータと、冷間等方圧加圧装置の運転条件に関する第3パラメータとのうちの少なくとも1つが状態変数として取得される。さらに、被処理物について殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つの物理量が状態変数として取得される。
【0008】
そして、取得された状態変数に基づいて、冷間等圧加圧処理条件の決定結果に対する報酬が計算され、計算された報酬に基づいて、状態変数から冷間等方圧加圧処理条件を決定するための関数が更新され、この更新が繰り返されて報酬が最も多く得られる冷間等方圧加圧処理条件が学習される。このため、冷間等方圧加圧処理条件を効率的に導くことができる。
【0009】
上記機械学習方法において、前記少なくとも1つの冷間等方圧加圧処理条件として、前記第1パラメータを含み、前記第1パラメータは、前記被処理物の処理量、配置、形状、寸法、包装有無、真密度、包装材の成分吸着性及び包装材の容積の少なくとも1つであってもよい。
【0010】
本態様によれば、前記第1パラメータとして、前記被処理物の処理量、配置、形状、寸法、包装有無、真密度の少なくとも1つが被処理物に関する状態変数として取得されて機械学習が行われるため、被処理物の状態を考慮に入れて適切な冷間等方圧加圧処理条件を決定できる。
【0011】
上記機械学習方法において、前記少なくとも1つの冷間等方圧加圧処理条件として、前記第2パラメータを含み、前記第2パラメータは、予熱温度、予熱時間、真空包装時の真空度の少なくとも1つであってもよい。
【0012】
本態様によれば、前記第2パラメータとして、予熱温度、予熱時間、真空包装時の真空度の少なくとも1つが前工程に関する状態変数として取得されて機械学習が行われるため、冷間等方圧加圧処理の前工程の状態を考慮に入れて適切な冷間等方圧加圧処理条件を決定できる。
【0013】
上記機械学習方法において、前記少なくとも1つの冷間等方圧加圧処理条件として、前記第3パラメータを含み、前記第3パラメータは、前記冷間等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無の少なくとも1つであってもよい。
【0014】
本態様によれば、前記第3パラメータとして、冷間等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無の少なくとも1つが運転条件に関する状態変数として取得されて機械学習が行われるため、運転条件を考慮に入れて適切な冷間等方圧加圧処理条件を決定できる。
【0015】
上記機械学習方法において、前記冷間等方圧加圧装置は、前記圧力容器内の圧媒の温度を調整することが可能な温度調整機構を更に備え、前記制御装置は、前記温度調整機構を更に制御することが可能であってもよい。また、前記第3パラメータは、前記冷間等方圧加圧処理における処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無、処理温度、処理中昇温速度、処理中降温速度、温度分布の少なくとも1つであってもよい。
【0016】
本態様によれば、温度調整機構によって圧力容器内の温度を調整することで、被処理物の特性を好適に変化させることができる。また、第3パラメータとして、処理温度、処理中昇温速度、処理中降温速度、温度分布の少なくとも1つが運転条件に関する状態変数として取得されて機械学習が行われる場合には、当該運転条件を考慮に入れて適切な冷間等方圧加圧処理条件を決定できる。
【0017】
上記機械学習方法において、前記関数は深層強化学習を用いて更新されてもよい。
【0018】
本態様によれば、関数の更新が深層強化学習を用いて行われるため、当該関数の更新を正確かつ速やかに行うことができる。このため、冷間等方圧加圧処理条件をより効率的に導くことができる。
【0019】
上記機械学習方法において、前記報酬の計算では、前記少なくとも1つの物理量が各物理量に対応する所定の基準値に近づいている場合、前記報酬を増大させてもよい。
【0020】
この構成によれば、物理量が基準値に近づくにつれて報酬が増大されるため、物理量を速やかに基準値に到達させることができる。
【0021】
なお、本発明において、上記の機械学習方法が備える各処理は機械学習装置に実装されてもよいし、機械学習プログラムとして実装されて流通されてもよい。この機械学習装置は、サーバで構成されてもよいし、冷間等方圧加圧装置で構成されてもよい。
【0022】
本発明の別の一態様に係る通信方法は、被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧装置の冷間等方圧加圧処理条件を機械学習する際の前記冷間等方圧加圧装置の制御装置の通信方法であって、前記冷間等方圧加圧装置は、前記被処理物を格納する圧力容器と、前記圧力容器に前記圧媒を供給するための圧縮機と、前記圧力容器内の圧力を調整することが可能な圧力調整機構と、前記制御装置と、を備え、前記制御装置は、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を観測し、前記制御装置は、前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの冷間等方圧加圧処理条件を前記サーバから受信し、前記少なくとも1つの冷間等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの冷間等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定することによって生成されたものであり、前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、前記冷間等方圧加圧処理の前工程に関する第2パラメータと、前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである。
【0023】
本態様によれば、冷間等方圧加圧処理条件を機械学習する際に必要な情報が提供される。このような通信方法は、冷間等方圧加圧装置にも実装可能である。
【0024】
また、本発明の別の一態様に係る制御装置は、被処理物に圧媒を用いて冷間等方圧加圧処理を行う冷間等方圧加圧装置の制御装置であって、前記冷間等方圧加圧装置は、前記被処理物を格納する圧力容器と、前記圧力容器に前記圧媒を供給するための圧縮機と、前記圧力容器内の圧力を調整することが可能な圧力調整機構と、前記被処理物に関する少なくとも1つの物理量と、少なくとも1つの冷間等方圧加圧処理条件とを含む状態変数を観測する状態観測部と、前記状態変数をネットワークを介してサーバに送信し、機械学習済みの少なくとも1つの冷間等方圧加圧処理条件を前記サーバから受信する通信部と、を備え、前記少なくとも1つの冷間等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの冷間等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定することによって生成されたものであり、前記少なくとも1つの冷間等方圧加圧処理条件は、前記被処理物に関する第1パラメータと、前記冷間等方圧加圧処理の前工程に関する第2パラメータと、前記冷間等方圧加圧装置の運転条件に関する第3パラメータと、のうちの少なくとも1つであり、前記少なくとも1つの物理量は、前記被処理物の殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量のうちの少なくとも1つである。
【発明の効果】
【0025】
本発明によれば被処理物に対する適切な冷間等方圧加圧処理条件を効率的に導くことができる。
【図面の簡単な説明】
【0026】
図1】本発明の一実施形態において学習対象となるCIP装置の全体構成図である。
図2】本発明の一実施形態におけるCIP装置を機械学習させる機械学習システムの全体構成図である。
図3】CIP処理条件の一例を示す図である。
図4】CIP処理中の圧力容器内の圧力及び温度の推移の一例を示すグラフである。
図5】被処理物の物理量の一例を示す図である。
図6】被処理物の物理量の一例を示す図である。
図7図2に示す機械学習システムにおける処理の一例を示すフローチャートである。
図8】本発明の変形実施形態に係る機械学習システムの全体構成図である。
【発明を実施するための形態】
【0027】
以下、図面を参照して、本発明の一実施形態に係るCIP装置100(冷間等方圧加圧装置、等方圧加圧装置)について説明する。図1は、本発明の実施の形態において学習対象となるCIP装置100の全体構成図である。CIP装置100は、被処理物に対して圧力媒体を用いて等方圧加圧処理を行う。
【0028】
なお、以下の説明では、処理対象である被処理物を食品としているが、被処理物は、食品以外の製品(例えば飲料)であってもよい。
【0029】
本発明の一実施形態に係るCIP装置100は、圧力容器2と、収容容器50と、プレスフレーム10と、搬入用レール11と、搬出用レール12と、移動用レール13と、給排水ユニット31(圧媒供給機構)と、ポンプユニット32(加圧機構)と、ヒーター33(図2)と、制御装置800とを備える。
【0030】
圧力容器2は、内部に被処理物を収容し、被処理物に対して等方圧加圧処理を施す。圧力容器2は、容器本体20と、第1蓋部21と、第2蓋部22と、を有する。圧力容器2は、高い耐圧性を備えるためにステンレスなどの金属材料から構成される。
【0031】
容器本体20は、水平方向に沿って延びる中心軸回りに形成された円筒状の内周面を備える。容器本体20の内部には、前記内周面によって画定される処理空間が形成されているとともに、前記内周面の軸方向の両端部がそれぞれ開口されている(図1)。
【0032】
第1蓋部21および第2蓋部22は、容器本体20の前記軸方向の両端部にそれぞれ装着され処理空間を封止する。
【0033】
第1蓋部21および第2蓋部22は、不図示の給排水路を有する。給排水路は各蓋部の外部と処理空間とを連通し、加圧処理後の圧力媒体が給排水路を通じて処理空間から排出される。また、給排水路は、不図示の流路を介して、給排水ユニット31、ポンプユニット32に連通しており、当該給排水路を通じて圧力媒体が処理空間に流入する。給排水路には必要に応じて開閉可能な不図示の弁が配置されている。
【0034】
収容容器50は、被処理物を収容するとともに圧力容器2の処理空間に配置される(図1の矢印参照)。本実施形態では、収容容器50の内部には、被処理物を収容することが可能な収容空間が形成されている。
【0035】
また、本実施形態では、収容容器50は、圧力容器2よりも熱伝導率が低い材料から構成されている。具体的に、収容容器50は、塩化ビニル、MCナイロン、テフロン(登録商標)などから構成されればよい。また、収容容器50の一部に、これらの材料が使用される態様でもよい。このような構成によれば、収容容器50の保温性を高く維持することができる。一方、圧力容器2は、加圧処理を施すために高い耐圧性を備えた金属材料から構成される。
【0036】
プレスフレーム10(図1)は、圧力容器2の両端蓋に働く軸力を支持する機能を有する。プレスフレーム10は、枠構造を有し、枠内の加圧位置Pに圧力容器2が配置されると、圧力容器2内の被処理物に等方圧加圧処理が施される。
【0037】
移動用レール13は、圧力容器2の容器本体20を加圧位置Pと待機位置Tとの間で移動可能なように容器本体20を案内する。容器本体20は不図示の駆動機構の駆動力を受けて加圧位置Pと待機位置Tとの間を移動する。図1に示すように、待機位置Tは、加圧位置Pから離間した位置である。なお、圧力容器2の第1蓋部21および第2蓋部22は、常に加圧位置Pに配置されている。容器本体20が加圧位置Pに配置されると、不図示の駆動シリンダが第1蓋部21および第2蓋部22を軸方向に沿って移動させ容器本体20の両端部に装着する。
【0038】
搬入用レール11は、加圧処理前に待機位置Tにおいて待機する容器本体20の内部に向かって収容容器50を案内する。一方、搬出用レール12は、加圧処理後に待機位置Tに移動された容器本体20から収容容器50を引き出すように収容容器50を案内する。
【0039】
給排水ユニット31は、タンク31Aを含み、圧力容器2の処理空間に圧力媒体(圧媒)を供給する。本実施形態では、圧力媒体として水、温水が使用される。給排水ユニット31は、本発明の圧縮機として機能する。
【0040】
ポンプユニット32は、処理空間に封入された前記圧力媒体を加圧する。本実施形態では、処理空間に圧力媒体が供給されると同時に、ポンプユニット32によって圧力媒体が加圧される。ポンプユニット32は、本発明の圧力調整機構として機能する。ポンプユニット32は、圧力容器2内の圧力を調整することが可能である。
【0041】
ヒーター33(図2)は、圧力容器2の内部に配置されており、被処理物に対する加圧処理前または加圧処理中に、被処理物を予熱または加熱する。ヒーター33は、収容容器50内に配置されてもよい。また、ヒーター33は、不図示の熱電対を含み、その温度検出結果に応じて発熱量が調整可能とされている。ヒーター33は、本発明の温度調整機構として機能する。ヒーター33は、圧力容器2内の圧力媒体の温度を調整することが可能である。なお、本実施形態において圧力容器2内の圧媒の温度は、公知のHIP(Hot Isostatic Pressing)装置における圧媒の温度(数100度~2000度の高温)よりは低く、一例として100度以下である。
【0042】
制御装置800は、給排水ユニット31、ポンプユニット32、ヒーター33、前記駆動機構および前記駆動シリンダの動作を制御する。制御装置800は、不図示の操作パネルを有している。制御装置800は、コンピュータで構成され、CIP装置100の全体制御を司る。
【0043】
上記のようなCIP装置100において、被処理物に対して等方圧加圧処理を施す場合、まず、圧力容器2および収容容器50を含むCIP装置100が準備される(準備工程)。前述のように、圧力容器2の容器本体20は、移動用レール13上の待機位置Tに配置され、圧力容器2の第1蓋部21および第2蓋部22は、プレスフレーム10に配置されている。また、収容容器50は、搬入用レール11上に配置される。作業者は、収容容器50の不図示の蓋部を開放し、収容容器50内に食品などの被処理物を収容する(被処理物収容工程)。この際、ヒーター33によって収容容器50内の圧媒(または被処理物)をたとえば80℃前後に加温(予熱)してもよい。
【0044】
次に、作業者が搬入用レール11に沿って収容容器50を容器本体20の内部に挿入する(収容容器配置工程)。また、作業者は、制御装置800を操作し、容器本体20を移動用レール13に沿ってプレスフレーム10内の加圧位置Pに設置する。移動用レール13上の加圧位置Pでは、第1蓋部21および第2蓋部22が容器本体20に対向して配置されている。そして、容器本体20が加圧位置Pに配置されると、不図示の駆動シリンダが伸長し、不図示の受圧盤を介して、第1蓋部21および第2蓋部22がそれぞれ容器本体20に装着される。この結果、圧力容器2の処理空間が密閉状態とされる。
【0045】
次に、作業者の操作指令を受けて制御装置800が給排水ユニット31を制御し、給排水ユニット31から圧力容器2の処理空間内に常温(たとえば20℃)の水が供給される。水は、圧力容器2の処理空間および収容容器50の収容空間を満たすまで充填される。
【0046】
次に、制御装置800は、ポンプユニット32を制御して、処理空間内の水を加圧する(等方圧加圧処理、加圧処理工程)。この際、加圧により処理空間内の水の体積が減少するため、常温の水が追加補給される。加圧時には、処理空間の圧力が約600MPaに設定される。収容容器50内の被処理物に高い圧力が所定の時間付与されることで、収容容器50内の被処理物に対する高い殺菌作用などが発現される。なお、上記の加圧中に、ヒーター33によって収容容器50内の圧媒(被処理物)をたとえば80℃前後に加温してもよい。
【0047】
加圧処理が終了すると、処理空間に対する減圧処理が施される。具体的に、第1蓋部21および第2蓋部22の給排水路から水が排出される。この際、処理空間から水が排出されていくと、処理空間と収容空間との間に生じる差圧に伴って収容空間から処理空間に圧力媒体が排出され、収容空間内が大気圧に近づきながら、圧力容器内が減圧される(減圧処理工程)。
【0048】
その後、不図示の駆動シリンダが受圧盤を介して第1蓋部21および第2蓋部22を容器本体20から脱離させる。その後、収容容器50を含む容器本体20が再び、待機位置Tに移動される(図1)。そして、搬出用レール12に沿って収容容器50が容器本体20から引き出され、収容容器50から加圧処理後の被処理物が取り出される。
【0049】
図2は、本実施形態におけるCIP装置100を機械学習させる機械学習システムの全体構成図である。機械学習システム(機械学習装置)は、図1で説明した制御装置800に加えてサーバ900(管理装置)及び通信装置700を含む。サーバ900及び通信装置700はネットワークNT1を介して相互に通信可能に接続されている。通信装置700及び制御装置800はネットワークNT2を介して相互に通信可能に接続されている。ネットワークNT1は、例えばインターネットなどの広域通信網である。ネットワークNT2は、例えばローカルエリアネットワークである。サーバ900は、例えば1以上のコンピュータで構成されるクラウドサーバである。通信装置700は、例えば制御装置800を使用するユーザが所持するコンピュータである。通信装置700は、制御装置800をネットワークNT1に接続するゲートウェイとして機能する。通信装置700は、ユーザ自身が所持するコンピュータに専用のアプリケーションソフトウェアをインストールすることで実現される。或いは通信装置700は、CIP装置100の製造メーカがユーザに提供する専用の装置であってもよい。制御装置800は、前述のように図1で説明したCIP装置100を制御する制御装置である。
【0050】
以下、各装置の構成を具体的に説明する。サーバ900は、プロセッサ910及び通信部920を含む。プロセッサ910は、CPUなどを含む制御装置である。プロセッサ910は、報酬計算部911、更新部912、決定部913、及び学習制御部914を含む。プロセッサ910が備える各ブロックは、コンピュータを機械学習システムにおけるサーバ900として機能させる機械学習プログラムをプロセッサ910が実行することで実現されてもよいし、専用の電気回路で実現されてもよい。
【0051】
報酬計算部911は、状態観測部821が観測した状態変数に基づいて、少なくとも1つのCIP処理条件の決定結果に対する報酬を計算する。
【0052】
更新部912は、状態観測部821が観測した状態変数からCIP処理条件を決定するための関数を、報酬計算部911によって計算された報酬に基づいて更新する。関数としては、後述の行動価値関数が採用される。
【0053】
決定部913は、少なくとも1つのCIP処理条件を変更しながら、関数の更新を繰り返すことによって、報酬が最も多く得られるCIP処理条件を決定する。
【0054】
学習制御部914は、機械学習の全体制御を司る。本実施の形態の機械学習システムは強化学習によってCIP処理条件を学習する。強化学習とは、エージェント(行動主体)が環境の状況に基づいてある行動を選択し、選択した行動に基づいて環境を変化させ、環境変化に伴う報酬をエージェントに与えることにより、エージェントにより良い行動の選択を学習させる機械学習手法である。強化学習としては、Q学習及びTD学習が採用できる。以下の説明では、Q学習を例に挙げて説明する。本実施形態では、報酬計算部911、更新部912、決定部913、学習制御部914、及び後述する状態観測部821がエージェントに相当する。本実施形態において、通信部920は、状態変数を取得する状態取得部の一例である。
【0055】
通信部920は、サーバ900をネットワークNT1に接続する通信回路で構成される。通信部920は、状態観測部821により観測された状態変数を通信装置700を介して受信する。通信部920は、決定部913が決定したCIP処理条件を通信装置700を介して制御装置800に送信する。
【0056】
通信装置700は、送信器710及び受信器720を含む。送信器710は、制御装置800から送信された状態変数をサーバ900に送信すると共に、サーバ900から送信されたCIP処理条件を制御装置800に送信する。受信器720は、制御装置800から送信された状態変数を受信すると共に、サーバ900から送信されたCIP処理条件を受信する。
【0057】
制御装置800は、通信部810、プロセッサ820、センサー部830、入力部840、及びメモリ850を含む。
【0058】
通信部810は、制御装置800をネットワークNT2に接続するための通信回路である。通信部810は、状態観測部821によって観測された状態変数をサーバ900に送信する。通信部810は、サーバ900の決定部913が決定したCIP処理条件を受信する。通信部810は、学習制御部914が決定した後述するCIP処理実行コマンドを受信する。
【0059】
プロセッサ820は、CPUなどを含むコンピュータである。プロセッサ820は、状態観測部821、処理実行部822、及び入力判定部823を含む。通信部810は、状態観測部821が取得した状態変数をサーバ900に送信する。プロセッサ820が備える各ブロックは、例えばCPUが機械学習システムの制御装置800として機能させる機械学習プログラムを実行することで実現される。
【0060】
状態観測部821は、CIP処理実行後において、センサー部830が検出した物理量を取得する。状態観測部821は、CIP処理実行後において被処理物に関する少なくとも1つの物理量と、少なくとも1つのCIP処理条件とを含む状態変数を観測する。具体的には、状態観測部821は、センサー部830の計測値に基づいてCIP処理条件を取得する。また、状態観測部821は、センサー部830の計測値などに基づいて物理量を取得する。本実施形態において、被処理物に関する少なくとも1つの物理量は、殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量、食感・栄養改善に関する物理量である。
【0061】
図3は、CIP処理条件の一例を示す図である。CIP処理条件は、大きく中分類に分類される。中分類には、被処理物に関する第1パラメータと、CIP処理の前工程に関する第2パラメータと、CIP装置100の運転条件に関する第3パラメータとのうちの少なくとも1つが含まれる。表中の学習制御において、「1」と記載されたパラメータはユーザが入力部840を操作することによって値を指定するパラメータであり、機械学習によって学習されるパラメータではない。したがって、本実施の形態では「1」と記載された以外、すなわち「2」と記載されたパラメータが学習対象となる。但し、これは一例であり、「1」と記載されたパラメータのうちのいずれか1つ又は複数のパラメータが学習対象とされてもよい。
【0062】
第1パラメータは、小分類として、処理量、配置、形状、寸法、包装有無、真密度、包装材の成分吸着性及び包装材の容積の少なくとも1つを含む。処理量は、1バッチあたり処理する量、すなわち、1度のCIP処理において収容容器50に収容される被処理物の量を示す。配置は、収容容器50内で被処理物をどのように配置するかを示している。形状は、被処理物の外形状である。例えば、形状としては、球、長楕円体、偏楕円体、直方体、立方体、円筒形といった情報が採用できる。このように、形状をCIP処理条件に加えたのは、被処理物の形状によってCIP処理の結果が変わる可能性があるからである。寸法は、被処理物が直方体の場合、幅、高さ、及び奥行き等の情報が採用され、被処理物が円筒形の場合、平均直径及び高さ等の情報が採用される。包装有無は、処理時に被処理物を包装するか否かを示すものであり、例えば真空パックの有無などを意味する。真密度は、被処理物の密度を示す。包装材の成分吸着性は、被処理物を入れる包装材表面の吸着性(吸着しやすさ)を示す。また、包装材の容積は、被処理物を入れる包装材の容積を示す。なお、他の実施形態において、被処理物の形状や寸法を機械学習によって学習されるパラメータとする場合には、例えば、カメラ又は3次元測定器等を用いてこれらを観測することができる。
【0063】
前述のように、処理量、配置、形状、寸法、包装有無および真密度は、それぞれ、ユーザによって入力部840を介して入力される。したがって、状態観測部821は、これらのパラメータを入力部840から取得すればよい。
【0064】
第2パラメータは、小分類として、予熱温度、予熱時間、真空包装時の真空度を含む。予熱温度は被処理物に対してCIP処理(加圧処理)前に行われる予熱処理における温度を示す。同様に、予熱時間は被処理物に対してCIP処理前に行われる予熱処理における時間を示す。真空包装時の真空度は、被処理物を真空包装する際の真空度を示す。これらの第2パラメータは、それぞれ、ユーザによって入力部840を介して入力される。したがって、状態観測部821はこれらのパラメータを入力部840から取得すればよい。
【0065】
第3パラメータは、小分類として、処理圧力、昇圧速度、減圧速度、圧力保持時間、段階昇圧の有無、段階減圧の有無、処理温度、昇温速度(処理中)、降温速度(処理中)、温度分布を含む。処理圧力は、CIP処理中の圧力容器2内の圧力を示す。昇圧速度および減圧速度は、CIP処理前後の圧力の変化における速度を示す。なお、減圧速度は、二次減圧も含んでいる。予め設定される二次減圧設定値以下で、減圧速度が変化する。圧力保持時間は、被処理物に対してCIP処理を行う時間を示す。段階昇圧の有無は、CIP処理時に一定の処理圧力に到達するまでの昇圧を段階的に行うか否かを示す。同様に、段階減圧の有無は、CIP処理時に一定の処理圧力からの減圧を段階的に行うか否かを示す。処理温度は、CIP処理中の圧力容器2内の温度を示す。昇温速度(処理中)は、CIP処理中の圧力容器2内の温度上昇の速度を示す。同様に、降温速度(処理中)は、CIP処理中の圧力容器2内の温度低下の速度を示す。温度分布は、圧力容器2内の所定の方向に沿って複数のヒーター33が配置された場合に、各ヒーター33の発熱量を調整することで形成される圧力容器2内の温度分布を示す。
【0066】
図4は、CIP処理中の圧力容器2内の圧力及び温度の推移の一例を示すグラフである。図4において縦軸は圧力及び温度を示し、横軸は時間を示す。この例では、圧力及び温度の推移は共に台形状である。圧力及び温度はそれぞれ最大圧力及び最高温度になるまで一定の傾きで増大し、一定時間最大圧力(処理圧力)及び最高温度(処理温度)を維持した後、一定の傾きで減少する。圧力について、前述のように処理圧力、昇圧時の傾き(昇圧速度)、降圧時の傾き(減圧速度)、最大圧力の維持時間(圧力保持時間)、段階昇圧、段階減圧の有無などが変化されて機械学習が行われる。また、温度について、処理温度、増大時の傾き(昇温速度)、減少時の傾き(降温速度)、最高温度の維持期間、温度分布などが変化されて機械学習が行われる。圧力に関する運転条件は入力部840を介してユーザが入力したデータが採用されてもよいし、給排水ユニット31が有する圧力センサー(不図示)の計測値が採用されてもよい。上記のその他のパラメータは、入力部840を介してユーザにより入力されたデータが採用される。
【0067】
図5および図6は、被処理物の物理量の一例を示す図である。物理量は、大分類として、殺菌・不活性化に関する物理量と、脱殻に関する物理量と、味・風味改善に関する物理量と、食感・栄養改善に関する物理量とがある。
【0068】
殺菌・不活性化は大きく分けて殺菌および不活性化に分類される。殺菌の中分類は、処理目的に応じて、複数の小分類に分類される。当該小分類には、サルモネラ属菌、ビブリオ属菌、腸管出血性大腸菌、芽胞菌(セレウス菌、クロストリジウム属菌、ボツリヌス菌など)、カンピロバクター・ジェジュニ/コリ、リステリア・モノサイトゲネス、黄色ブドウ球菌の菌数が含まれる。また、不活性化の中分類も、処理目的の詳細に応じて、複数の小分類に分類される。当該小分類には、ノロウイルス、サポウイルス、A型肝炎ウイルス、E型肝炎ウイルスのウイルス数が含まれる。
【0069】
サルモネラ属菌の小分類は、同菌の殺菌を目的とするものであり、一例として、卵、鶏肉などを対象とする。サルモネラ属菌の測定には、ISO6579に準拠した試験法、国立医薬品食品衛生研究所が定めるサルモネラ属菌標準試験法NIHSJ-01などがあげられる。
【0070】
ビブリオ属菌の小分類は、同菌の殺菌を目的とするものであり、一例として、魚介類を対象とする。ビブリオ属菌の測定には、ISO21872に準拠した試験法、国立医薬品食品衛生研究所が定める腸炎ビブリオ標準試験法NIHSJ-07などがあげられる。
【0071】
腸管出血性大腸菌の小分類は、同菌の殺菌を目的とするものであり、食品全般を対象とする。腸管出血性大腸菌の測定には、ISO16654に準拠した試験法、又は厚生労働省が定める「腸管出血性大腸菌O26、O103、O111、O121、O145及びO157の検査法」などがあげられる。
【0072】
芽胞菌の小分類は、同菌(セレウス菌、クロストリジウム属菌、ボツリヌス菌など)の殺菌を目的とするものであり、一例として、セレウス菌については、魚肉ねり製品などの製造に使用する砂糖、でん粉、香辛料などを対象とし、クロストリジウム属菌については、特定加熱食肉製品、包装後加熱食肉製品、ミネラルウォーター類の原水などを対象とする。これらの菌の測定には、セレウス菌の場合には、検体の前処理として沸騰水浴中で10分加熱し、標準寒天培地において30度で48時間の好気培養を行う。また、クロストリジウム属菌の場合には、前処理として70度で20分加熱し、クロストリジウム測定用培地(嫌気性パウチ)において35度で24時間の培養を行う。いずれも、1グラム当たり1000個以下の菌数を基準に判定することができる。
【0073】
カンピロバクター・ジェジュニ/コリの小分類は、同菌の殺菌を目的とするものであり、一例として、食肉(特に鶏肉)、飲料水、サラダなどを対象とする。これらの菌の測定には、ISO10272に準拠した試験法、国立医薬品食品衛生研究所が定めるカンピロバクター標準試験法NIHSJ-02などがあげられる。
【0074】
リステリア・モノサイトゲネスの小分類は、同菌の殺菌を目的とするものであり、一例として、乳、乳製品、食肉加工品、サラダ、魚介類加工品などを対象とする。これらの菌の測定には、ISO11290に準拠した試験法、厚生労働省が定める「リステリア・モノサイトゲネス定量試験法」、国立医薬品食品衛生研究所が定めるリステリア・モノサイトゲネス標準試験法NIHSJ-09などがあげられる。
【0075】
黄色ブドウ球菌の小分類は、同菌の殺菌を目的とするものであり、一例として、にぎりめし、寿司、肉、卵、乳などの調理加工品及び菓子類など多岐にわたる対象があげられる。当該菌の測定には、ISO6888に準拠した試験法、国立医薬品食品衛生研究所が定める黄色ブドウ球菌標準試験法NIHSJ-03、NIHSJ-05などがあげられる。
【0076】
ノロウイルスの小分類は、同ウイルスの不活性化を目的とするものであり、一例として、二枚貝などを対象とする。同ウイルスの測定には、ISO15216に準拠した試験法、厚生労働省が定める「ノロウイルスの検出方法(リアルタイムPCR法)」などがあげられる。
【0077】
サポウイルスの小分類は、同ウイルスの不活性化を目的とするものであり、一例として、二枚貝などを対象とする。同ウイルスの測定には、リアルタイムPCR法があげられる。
【0078】
A型肝炎ウイルスの小分類は、同ウイルスの不活性化を目的とするものであり、一例として、井戸水、二枚貝、野菜などを対象とする。同ウイルスの測定には、ISO15216に準拠した試験法、国立医薬品食品衛生研究所が定める「A型肝炎ウイルス検出法(リアルタイムPCR法)」などがあげられる。
【0079】
E型肝炎ウイルスの小分類は、同ウイルスの不活性化を目的とするものであり、一例として、水、ブタ、イノシシ、シカなどを対象とする。同ウイルスの測定には、公知の細胞培養法、遺伝子検査法、血清検査法などがあげられる。
【0080】
脱殻の物理量は、いずれもタンパク質性変性の中分類に対応する。当該中分類は、処理目的に応じて、処理できた個数、むけ量の小分類に分類される。
【0081】
処理できた個数およびむけ量に関する小分類は、一例として二枚貝・甲殻類などを対象とする。当該分類の測定方法として、タンパク質の変性による脱殻処理が達成できた被処理物の個数をカウントするとともに、むけた面積を測定する。
【0082】
味・風味改善の物理量はいずれも味・風味改善の中分類に対応する。当該中分類は、処理目的に応じて、酸味、塩味、旨味、苦味、渋味、甘味、匂いの小分類に分類される。これらはいずれも食品全般を対象とし、酸味、塩味、旨味、苦味、渋味、甘味の測定は味覚センサーを用い、匂いの測定は匂いセンサーを用いることができる。なお、匂いについては、特にジャムなどの食品を対象とすることができる。
【0083】
食感・栄養改善の物理量は大きく中分類に分類される。当該中分類には、タンパク質変性、含浸、組織破壊、酵素失活、酵素反応促進が含まれる。タンパク質変性の中分類は、処理目的に応じて、ゲル化、色調の小分類に分類される。同様に、含浸の中分類は、油分量、アルコール量、リモネンの小分類に分類される。組織破壊の中分類は、水分量(保水性)、弾力性、硬さ、粘り、糊化度(α化度)、イノシン酸、ペプチド、アミノ酸、光沢、形状変化、消化性、製造時間の小分類に分類される。酵素失活の中分類は、リコピン、ケルセチン、核酸、アリシン、ビタミンCの小分類に分類される。酵素反応促進の中分類は、GABA(Gamma-Amino Butyric Acid)の小分類に相当する。
【0084】
ゲル化の小分類は、タンパク質変性に伴う被処理物のゲル化の度合いを測るものであり、一例として、ジャムなどの食品を対象とする。ゲル化の測定には公知のレオメーターを用いることができる。
【0085】
色調の小分類は、グロビンタンパク質部の変性に伴う色素分子プロトヘムの遊離を測るものであり、一例として、食肉などを対象とする。色調の測定には、色彩計、分光測色計などを用いることができる。
【0086】
油分量、アルコール量およびリモネンの小分類は、いずれも食品全般を対象とする。油分量の測定には、赤外線多成分計、油分濃度計を用いることができる。アルコール量の測定には、酵素法、液体クロマトグラフィー、比重法、酸化法、ガスクロマトグラフィー、エタノールセンサーなどを用いることができる。また、リモネンの測定には、ガスクロマトグラフィーを用いることができる。
【0087】
水分量(保水性)、弾力性、硬さ、粘り、糊化度(α化度)の小分類は、いずれも細胞壁が破壊され、水分が侵入しやすくなることによって変化する特性を測るものである。水分量の小分類は、食肉などを対象とし、水分計によって測定することができる。同様に、弾力性の小分類は、食肉などを対象とし、レオメーターによって測定することができる。また、硬さの小分類は、食肉、無菌化包装米飯などを対象とし、クリープメーター、テクスチュロメーターによって測定することができる。粘りの小分類は、無菌化包装米飯などを対象とし、レオメーターによって測定することができる。また、糊化度(α化度)の小分類は、無菌化包装米飯などを対象とし、グルコアミラーゼ第2法、グルコアミラーゼ法、ジアスターゼ法、β-アミラーゼ・ブルラナーゼ法などによって測定することができる。
【0088】
イノシン酸、ペプチド、アミノ酸の小分類は、いずれも細胞壁の破壊によるタンパク質分解酵素の溶出によって変化する特性を測るものである。イノシン酸の小分類は、一例として、食肉を対象とし、ダイレクトUV検出法、蛍光プローブ、高速液体クロマトグラフィーによって測定することができる。ペプチドの小分類は、主に食肉、大豆などを対象とし、蛍光法、高感度酵素免疫測定法によって測定することができる。アミノ酸の小分類は、食肉、昆布などを対象とし、アミノ酸自動分析装置によって測定することができる。
【0089】
光沢の小分類は、細胞壁の破壊により水分を吸収しやすくなることによって変化する特性を測るものであり、主に無菌化包装米飯などを対象とする。光沢の測定には、公知の光沢測定装置を用いることができる。形状変化の小分類は、被処理物の細胞壁の破壊をその形状を保ったまま行うことができるか否かを測るものであり、主に無菌化包装米飯などを対象とする。当該形状の測定には、公知の3次元形状測定装置などを用いることができる。消化性の小分類は、被処理物の細胞壁の破壊により消化しやすくなることを測るものであり、主に無菌化包装米飯などを対象とする。当該消化性の測定には、官能試験を用いることができる。製造時間の小分類は、細胞壁の破壊により水分を吸収しやすくなることによって変化する特性を測るものであり、主に無菌化包装米飯などを対象とする。製造時間は、被処理物の吸水時間によって測ることができる。
【0090】
リコピン、ケルセチン、核酸、アリシンおよびビタミンCの小分類は、それぞれ、酵素の失活による機能性成分の変化を測るものである。リコピンは、トマトなどの食品を対象とし、液体クロマトグラフィー、可視・近赤外分光法によって測定することができる。ケルセチンは、玉ねぎなどの食品を対象とし、試料細断後、メタノールで抽出し吸光度測定を行う方法や液体クロマトグラフィーなどの測定方法を用いることができる。
【0091】
核酸は、シイタケなどの食品を対象とし、吸光分光法、蛍光分析法、液体クロマトグラフィー同位体希釈質量分析法などを用いて測定することができる。アリシンは、ニンニクなどの食品を対象とし、液体クロマトグラフィーを用いて測定することができる。ビタミンCは、じゃがいも、アボカドなどの食品を対象とし、ヒドラジン法を用いて測定することができる。
【0092】
GABAは、酵素反応の促進によって変化する特性を測るものであり、玄米などを対象とし、アミノ酸自動分析装置によって測定することができる。
【0093】
図2に参照を戻す。処理実行部822は、CIP装置100によるCIP処理の実行を制御する。入力判定部823は、量産工程であるか否かを自動又は手動により判定する。入力判定部823は、量産工程であるか否かを自動で判定する場合、入力部840に入力された条件番号の入力回数が基準回数を超えた場合、CIP装置100は量産工程にあると判定する。条件番号とは、ある1つのCIP処理条件を特定するための識別番号である。条件番号により特定されるCIP処理条件は、少なくとも図3に示すCIP処理条件のうち「1」と記載されたCIP処理条件を含む。
【0094】
入力判定部823は、量産工程であるか否かを手動により判定する場合において、入力部840に量産工程である旨のデータが入力された場合、CIP装置100は量産工程にあると判定する。量産工程にある場合、制御装置800は機械学習を行わない。
【0095】
メモリ850は、例えば不揮発性の記憶装置であり、最終的に決定された最適なCIP処理条件などを記憶する。
【0096】
センサー部830は、図3に例示されたCIP処理条件及び図5図6に例示された被処理物の物理量の計測に用いられる各種センサーである。具体的には、センサー部830は、圧力容器2内の温度を計測する温度センサー、圧力センサー等を含む。また、センサー部830は、被処理物に対するCIP処理の終了後、収容容器50から取り出された被処理物に各種の測定試験を行うためのセンサーを含む。図2では、センサー部830は、制御装置800の内部に設けられているが、これは一例であり、制御装置800の外部に設けられていてもよく、センサー部830の設置場所は特に限定されない。入力部840は、キーボード、及びマウスなどの入力装置である。
【0097】
図7は、図2に示す機械学習システムが実行する処理の一例を示すフローチャートである。ステップS1では、学習制御部914は、入力部840を用いてユーザにより入力された、CIP処理条件の入力値を取得する。ここで取得される入力値は、図3に列記されたCIP処理条件のうち、「1」と記載されたCIP処理条件に対する入力値である。
【0098】
ステップS2では、学習制御部914は、少なくとも1つのCIP処理条件とCIP処理条件に対する設定値とを決定する。ここで、設定対象となるCIP処理条件は、図3に列挙されたCIP処理条件のうち、「2」と記載されたCIP処理条件であって、設定値が設定可能な少なくとも1つのCIP処理条件である。ここで、決定されるCIP処理条件の設定値は強化学習における行動に相当する。
【0099】
具体的には、学習制御部914は、設定対象となるCIP処理条件のそれぞれについて設定値をランダムに選択する。ここで、設定値は、CIP処理条件のそれぞれについて所定の範囲内からランダムに選択される。CIP処理条件の設定値の選択方法としては、例えばε-greedy法が採用できる。
【0100】
ステップS3では、学習制御部914は、制御装置800にCIP処理実行コマンドを送信することで、制御装置800を通じてCIP装置100にCIP処理を開始させる。CIP処理実行コマンドが通信部810により受信されると、処理実行部822は、CIP処理実行コマンドにしたがってCIP処理条件を設定し、CIP処理を開始する。CIP処理実行コマンドには、ステップS1で設定されたCIP処理条件の入力値及びステップS2で決定されたCIP処理条件の設定値などが含まれる。
【0101】
CIP処理が終了すると、状態観測部821は、状態変数を観測する(ステップS4)。具体的には、状態観測部821は、図5図6に記載された殺菌・不活性化、脱殻、味・風味改善、食感・栄養改善に関する物理量と、図3に記載されたCIP処理条件のうちセンサー部830などによって状態が観測されるCIP処理条件とを状態変数として取得する。物理量は、例えばユーザが入力部840を操作することによって制御装置800に入力されてもよいし、物理量を計測する計測器と制御装置800とが通信することで制御装置800に入力されてもよい。状態観測部821は、取得した状態変数を通信部810を介してサーバ900に送信する。
【0102】
ステップS5では、決定部913は、物理量を評価する。ここで、決定部913は、ステップS4で取得された物理量のうち評価対象となる物理量(以下、対象物理量と呼ぶ。)が所定の基準値に到達しているか否かを判定することで物理量を評価する。対象物理量は、図5図6に列記された物理量のうち1又は複数の物理量である。対象物理量が複数の場合、基準値は、各対象物理量に対応する複数の基準値が存在することになる。基準値は、例えば、対象物理量が一定の基準に到達していることを示す予め定められた値が採用できる。
【0103】
例えば、サルモネラ属菌について機械学習が行われる場合は、基準値はサルモネラ属菌について予め定められた値が採用され、ゲル化について機械学習が行われる場合は、基準値はゲル化について予め定められた値が採用される。基準値は、例えば上限値と下限値とを含む値であってもよい。この場合、対象物理量が上限値と下限値との範囲内に入った場合、基準値に到達したと判定される。基準値は一つの値であってもよい。この場合、対象物理量が基準値を超えた場合、又は基準値を下回った場合に一定の基準を満たすと判定される。
【0104】
決定部913は、対象物理量が基準値に到達していると判定した場合(ステップS6でYES)、ステップS2で設定したCIP処理条件を最終的なCIP処理条件として出力する(ステップS7)。一方、決定部913は、物理量が基準値に到達していないと判定した場合(ステップS6でNO)、処理をステップS8に進める。なお、対象物理量が複数の場合、決定部913は、全ての対象物理量が基準値に到達したとき、ステップS6でYESと判定すればよい。
【0105】
ステップS8では、報酬計算部911は、対象物理量が基準値に近づいているか否かを判定する。対象物理量が基準値に近づいている場合(ステップS8でYES)、報酬計算部911は、エージェントに対する報酬を増大させる(ステップS9)。一方、対象物理量が基準値に近づいていない場合(ステップS8でNO)、報酬計算部911は、エージェントに対する報酬を減少させる(ステップS10)。この場合、報酬計算部911は、予め定められた報酬の増減値にしたがって報酬を増減させればよい。なお、対象物理量が複数の場合、報酬計算部911は、複数の対象物理量のそれぞれについて、ステップS8の判定を行えばよい。この場合、報酬計算部911は、複数の対象物理量のそれぞれについて、ステップS8の判定結果に基づいて報酬を増減させればよい。また、報酬の増減値は対象物理量に応じて異なる値が採用されてもよい。
【0106】
また、対象物理量が基準値に近づいていない場合(ステップS8でNO)、報酬を減少させる処理(ステップS10)は省かれてもよい。この場合、対象物理量が基準値に近づいている場合にのみ報酬が与えられることになる。
【0107】
ステップS11では、更新部912は、エージェントに付与した報酬を用いて行動価値関数を更新する。本実施の形態で採用されるQ学習は、ある環境状態sの下で、行動aを選択することへの価値であるQ値(Q(s,a))を学習する方法である。なお、環境状態sは、上記のフローの状態変数に相当する。そして、Q学習では、ある環境状態sのときに、Q(s,a)の最も高い行動aが選択される。Q学習では、試行錯誤により、ある環境状態sの下で様々な行動aをとり、そのときの報酬を用いて正しいQ(s,a)が学習される。行動価値関数Q(s,a)の更新式は以下の式(1)で示される。
【0108】
【数1】
ここで、s,aは、それぞれ、時刻tにおける環境状態と行動とを表す。行動aにより、環境状態はst+1に変化し、その環境状態の変化によって、報酬rt+1が算出される。また、maxの付いた項は、環境状態st+1の下で、その時に分かっている最も価値の高い行動aを選んだ場合のQ値(Q(st+1,a))にγを掛けたものである。ここで、γは割引率であり、0<γ≦1(通常は0.9~0.99)の値をとる。αは学習係数であり、0<α≦1(通常は0.1程度)の値をとる。
【0109】
この更新式は、状態sにおける行動aのQ値であるQ(s,a)よりも、行動aによる次の環境状態st+1における最良の行動をとったときのQ値に基づくγ・maxQ(st+1,a)の方が大きければ、Q(s,a)を大きくする。一方、この更新式は、Q(s,a)よりもγ・maxQ(st+1,a)の方が小さければ、Q(s,a)を小さくする。つまり、ある状態sにおけるある行動aの価値を、それによる次の状態st+1における最良の行動の価値に近づけるようにしている。これにより、最適なCIP処理条件が決定される。
【0110】
ステップS11の処理が終了すると、処理はステップS2に戻り、CIP処理条件の設定値が変更され、同様にして行動価値関数が更新される。更新部912は、行動価値関数を更新したが、本発明はこれに限定されず、行動価値テーブルを更新してもよい。
【0111】
Q(s,a)は、全ての状態と行動とのペア(s,a)に対する値がテーブル形式で保存されてもよい。或いは、Q(s,a)は、全ての状態と行動とのペア(s,a)に対する値を近似する近似関数によって表されてもよい。この近似関数は多層構造のニューラルネットワークにより構成されてもよい。この場合、ニューラルネットワークは、実際にCIP装置100を動かして得られたデータをリアルタイムで学習し、次の行動に反映させるオンライン学習を行えばよい。これにより、深層強化学習が実現される。
【0112】
具体的に、強化学習では、機械学習システムが、所定の環境の中で目的として設定された報酬(スコア)を最大化するための行動を学習する。一方、深層学習(ディープラーニング)では、ニューラルネットワークの中間層を複数にすることで、機械学習システムが自ら学習データから特徴量を抽出し、予測モデルを構築する表現学習が可能となる。したがって、本実施形態における強化学習に深層学習を応用した深層強化学習では、図3に示されるCIP処理条件(第1パラメータ、第2パラメータ、第3パラメータ)および図5図6に示される被処理物の物理量の中から、機械学習システムが好適な特徴量を抽出することができる。この際、図3の運転条件における処理圧力および処理温度のように互いに影響しあう(交互作用)特徴量に対しては、これらを含む新たな特徴量(たとえば圧力/温度の比)を機械学習システムが抽出し、当該特徴量を変化させてもよい。このような構成によれば、高い報酬を得ることが可能なCIP処理条件をより早く効率的に得ることができる。また、上記のような深層強化学習が量産工程に対して事前に実行されることで、望ましいCIP処理条件に基づく量産工程を実現することができる。
【0113】
従来、CIP装置においては、高品質なCIP処理品が得られるようにCIP処理条件を変化させることによってCIP処理条件の開発が行われてきた。良好なCIP処理条件を得るためには、被処理物の評価とCIP処理条件との関係性を見出すことが要求される。しかし、図3に示されるようにCIP処理条件の種類は膨大であるため、このような関係性を規定するには極めて多くの物理モデルが必要となり、物理モデルによってこのような関係性を記述するのは困難であるとの知見が得られた。さらに、このような物理モデルを構築するには、どのパラメータがどの被処理物の評価に影響を与えているのかを人為的に見いだすことも要求され、この構築は困難である。
【0114】
本実施形態によれば、上述した第1~第3のパラメータのうちの少なくとも1つのパラメータと、殺菌・不活性化に関する物理量、脱殻に関する物理量、味・風味改善に関する物理量および食感・栄養改善に関する物理量のうちの少なくとも1つの物理量とが状態変数として観測される。そして、観測された状態変数に基づいて、CIP処理条件の決定結果に対する報酬が計算され、計算された報酬に基づいて、状態変数からCIP処理条件を決定するための行動価値関数が更新され、この更新が繰り返されて報酬が最も多く得られるCIP処理条件が学習される。このように、本実施形態は、上述の物理モデルを用いることなく、機械学習によりCIP処理条件が決定される。この結果、本実施形態は、適切なCIP処理条件を、熟練した技術者による長年の経験を頼らずに、効率的かつ容易に決定することができる。
【0115】
特に、水などを圧力媒体として圧力容器2内に流入させ、被処理物に対してCIP処理を施す場合には、図3に示される各種の処理条件が相互に関連しながら、被処理物の物理量(図5図6)が変化する。たとえば、被処理物に関する第1パラメータとして圧力容器2(収容容器50)内における無菌化包装米飯の配置、形状、寸法などを変化させると、同じ処理圧力(運転条件、第3パラメータ)であっても、各包装米飯に対する圧力の作用が変化する結果、粘り(図6、食感・栄養改善)に差が生じる可能性がある。このような各物理量の影響を多くの物理モデルによって見出すことは困難である。一方、本実施形態によれば、機械学習システムが行動価値関数を更新しながら、より報酬の高いCIP処理条件を学習することで、効率的に望ましいCIP処理条件を決定することができる。この際、前述のように機械学習システムに深層強化学習を適用することによって、システムが自ら新たな物理量を抽出し、適切なCIP処理条件をより早く効率的に導き出すことができる。
【0116】
以上のように、本実施形態では、制御装置800は、前記状態変数をネットワークを介してサーバ上に送信し、機械学習済みの少なくとも1つの冷間等方圧加圧処理条件を前記サーバから受信する。また、前記少なくとも1つの冷間等方圧加圧処理条件は、前記サーバが、前記状態変数に基づいて、前記少なくとも1つの冷間等方圧加圧処理条件の決定結果に対する報酬を計算し、前記少なくとも1つの冷間等方圧加圧処理条件を変更させながら、前記状態変数から前記少なくとも1つの冷間等方圧加圧処理条件を決定するための関数を、前記報酬に基づいて更新し、前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる冷間等方圧加圧処理条件を決定することによって生成されたものである。
【0117】
なお、本発明は以下の変形実施形態を採用することができる。
【0118】
(1)図7は、本発明の変形実施形態に係る機械学習システムの全体構成図である。この変形実施形態に係る機械学習システムは、制御装置800A単体で構成されている。制御装置800Aは、プロセッサ820A、入力部880、及びセンサー部890を含む。プロセッサ820Aは、機械学習部860、及びCIP処理部870を含む。機械学習部860は、報酬計算部861、更新部862、決定部863、及び学習制御部864を含む。報酬計算部861~学習制御部864は、それぞれ、図2に示す報酬計算部911~学習制御部914と同じである。CIP処理部870は、状態観測部871、処理実行部872、及び入力判定部873を含む。状態観測部871~入力判定部873は、それぞれ図2に示す状態観測部821、処理実行部822、及び入力判定部823と同じである。入力部880及びセンサー部890は、それぞれ図2に示す入力部840及びセンサー部830と同じである。本変形例において状態観測部821は、状態情報を取得する状態取得部の一例である。なお、センサー部890は、制御装置800Aの内部に設けられていてもよいし、制御装置800Aの外部に設けられていてもよく、センサー部890の設置場所は特に限定されない。
【0119】
このように、この変形実施形態に係る機械学習システムによれば、制御装置800A単体で最適なCIP処理条件を学習させることができる。
【0120】
(2)上記の図7に示されるフローでは、CIP処理の終了後に状態変数が観測されていたが、これは一例であり、1回のCIP処理中に状態変数が複数観測されてもよい。例えば、状態変数が瞬時に計測可能なパラメータのみで構成されている場合、1回のCIP処理中に複数の状態変数を観測できる。これにより、学習時間の短縮が図られる。また、図7のステップS7においてCIP処理が開始されると、その処理の中で状態変数の観測、物理量の評価を並行して行うことで、同CIP処理の最終段階における被処理物の物理量をより基準値に近づけるように、処理中のCIP処理条件を変化させることもできる。すなわち、本発明に係る機械学習システムが実行する機械学習方法には、複数回のCIP処理を通じて報酬が最も多く得られる冷間等方圧加圧処理条件を決定するもののみならず、所定のCIP処理中に最終的な報酬が最も多く得られる冷間等方圧加圧処理条件を決定するものも含まれる。
【0121】
(3)本発明に係る通信方法は、図2に示す制御装置800がサーバ900と通信する際の各種処理によって実行される。また、本発明に係る学習プログラムは図2に示すサーバ900としてコンピュータを機能させるプログラムによって実現される。
【符号の説明】
【0122】
10 プレスフレーム
100 CIP装置
11 搬入用レール
12 搬出用レール
13 移動用レール
2 圧力容器
20 容器本体
20A 第1開口部
20B 第2開口部
21 第1蓋部
22 第2蓋部
31 給排水ユニット
31A タンク
32 ポンプユニット
33 ヒーター
50 収容容器
700 通信装置
710 送信器
720 受信器
800、800A 制御装置
810 通信部
820、820A プロセッサ
821 状態観測部
822 処理実行部
823 入力判定部
830 センサー部
840 入力部
850 メモリ
860 機械学習部
861 報酬計算部
862 更新部
863 決定部
864 学習制御部
870 CIP処理部
871 状態観測部
872 処理実行部
873 入力判定部
880 入力部
890 センサー部
900 サーバ
910 プロセッサ
911 報酬計算部
912 更新部
913 決定部
914 学習制御部
920 通信部
P 加圧位置
T 待機位置
図1
図2
図3
図4
図5
図6
図7
図8