(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-26
(45)【発行日】2024-07-04
(54)【発明の名称】押出成形装置及びその制御方法
(51)【国際特許分類】
B29C 48/92 20190101AFI20240627BHJP
B28B 3/22 20060101ALI20240627BHJP
B29C 48/395 20190101ALI20240627BHJP
B29C 48/365 20190101ALI20240627BHJP
B29C 48/37 20190101ALI20240627BHJP
B29C 48/80 20190101ALI20240627BHJP
G05B 13/02 20060101ALI20240627BHJP
【FI】
B29C48/92
B28B3/22
B29C48/395
B29C48/365
B29C48/37
B29C48/80
G05B13/02 L
(21)【出願番号】P 2020205659
(22)【出願日】2020-12-11
【審査請求日】2023-09-07
(73)【特許権者】
【識別番号】000004215
【氏名又は名称】株式会社日本製鋼所
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】前西 隆一郎
(72)【発明者】
【氏名】田中 蒼麻
【審査官】関口 貴夫
(56)【参考文献】
【文献】特開2020-152097(JP,A)
【文献】特開2003-001696(JP,A)
【文献】特開2008-023847(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B29C 48/00-48/96
(57)【特許請求の範囲】
【請求項1】
投入された樹脂原料を溶融させて押し出す押出機と、
前記押出機から押し出された溶融樹脂を吸入し、吐出するポンプと、
前記ポンプの吸入側における前記溶融樹脂の圧力を測定する圧力センサと、
前記圧力センサによって測定される測定圧力を目標圧力に近付けるように、前記ポンプの回転数をフィードバック制御する制御部と、を備え、
前記制御部は、
前記測定圧力と前記目標圧力との差に基づいて、現在の状態と以前に選択した行動に対する報酬とを決定し、
状態と行動との組み合わせである制御条件を前記報酬に基づいて更新すると共に、更新された制御条件から前記現在の状態に対応した最適な行動を選択し、
前記最適な行動に基づいて、前記ポンプの回転数を制御する、
押出成形装置。
【請求項2】
前記行動が、前記ポンプの動力源の出力の変更である、
請求項1に記載の押出成形装置。
【請求項3】
前記制御部は、前記ポンプの動力源の出力を制御する第1のPIDコントローラを含み、
前記行動が、前記第1のPIDコントローラのパラメータの変更による前記ポンプの動力源の出力の変更である、
請求項2に記載の押出成形装置。
【請求項4】
前記押出機は、
シリンダと、
前記シリンダに収容されると共に、前記シリンダに投入された前記樹脂原料を混練しつつ押し出すスクリューと、を含み、
前記制御部は、
前記ポンプの回転数の制御結果に基づいて、前記ポンプの動力源の出力を固定した後、
前記圧力センサによって測定される測定圧力を目標圧力に近付けるように、前記スクリューの回転数をさらにフィードバック制御し、
前記スクリューの回転数をフィードバック制御する際、
前記測定圧力と前記目標圧力との差に基づいて、現在の状態と以前に選択した行動に対する報酬とを決定し、
状態と行動との組み合わせである制御条件を前記報酬に基づいて更新すると共に、更新された制御条件から前記現在の状態に対応した最適な行動を選択し、
前記最適な行動に基づいて、前記スクリューの回転数を制御する、
請求項1~3のいずれか一項に記載の押出成形装置。
【請求項5】
前記スクリューの回転数をフィードバック制御する際の前記行動が、前記スクリューの動力源の出力の変更である、
請求項4に記載の押出成形装置。
【請求項6】
前記制御部は、前記スクリューの動力源の出力を制御する第2のPIDコントローラを含み、
前記スクリューの回転数をフィードバック制御する際の前記行動が、前記第2のPIDコントローラのパラメータの変更による前記スクリューの動力源の出力の変更である、
請求項5に記載の押出成形装置。
【請求項7】
シリンダと、前記シリンダに収容されたスクリューと、を備え、前記シリンダに投入された樹脂原料を加熱して溶融させると共に、前記スクリューによって混練しつつ押し出す押出機と、
前記押出機から押し出された溶融樹脂を吸入し、吐出するポンプと、
前記ポンプの吸入側における前記溶融樹脂の圧力を測定する圧力センサと、
前記圧力センサによって測定される測定圧力を目標圧力に近付けるように、前記スクリューの回転数をフィードバック制御する制御部と、を備え、
前記制御部は、
前記測定圧力と前記目標圧力との差に基づいて、現在の状態と以前に選択した行動に対する報酬とを決定し、
状態と行動との組み合わせである制御条件を前記報酬に基づいて更新すると共に、更新された制御条件から前記現在の状態に対応した最適な行動を選択し、
前記最適な行動に基づいて、前記スクリューの回転数を制御する、
押出成形装置。
【請求項8】
前記行動が、前記スクリューの動力源の出力の変更である、
請求項7に記載の押出成形装置。
【請求項9】
前記制御部は、前記スクリューの動力源の出力を制御するPIDコントローラを含み、
前記行動が、前記PIDコントローラのパラメータの変更による前記スクリューの動力源の出力の変更である、
請求項8に記載の押出成形装置。
【請求項10】
前記ポンプが、ギヤポンプである、
請求項1~9のいずれか一項に記載の押出成形装置。
【請求項11】
投入された樹脂原料を溶融させて押し出す押出機と、
前記押出機から押し出された溶融樹脂を吸入し、吐出するポンプと、
前記ポンプの吸入側における前記溶融樹脂の圧力を測定する圧力センサと、
前記圧力センサによって測定される測定圧力を目標圧力に近付けるように、前記ポンプの回転数をフィードバック制御する制御部と、を備えた押出成形装置の制御方法であって、
前記制御部が、
工程(a)前記測定圧力と前記目標圧力との差に基づいて、現在の状態と以前に選択した行動に対する報酬とを決定
する工程、
工程(b)状態と行動との組み合わせである制御条件を前記報酬に基づいて更新すると共に、更新された制御条件から前記現在の状態に対応した最適な行動を選択
する工程、
工程(c)前記最適な行動に基づいて、前記ポンプの回転数を制御する
工程、
を実行する、
押出成形装置の制御方法。
【請求項12】
前記工程(b)において選択する前記行動が、前記ポンプの動力源の出力の変更である、
請求項11に記載の押出成形装置の制御方法。
【請求項13】
前記制御部は、前記ポンプの動力源の出力を制御する第1のPIDコントローラを含み、
前記工程(b)において選択する前記行動が、前記第1のPIDコントローラのパラメータの変更による前記ポンプの動力源の出力の変更である、
請求項12に記載の押出成形装置の制御方法。
【請求項14】
前記押出機は、
シリンダと、
前記シリンダに収容されると共に、前記シリンダに投入された前記樹脂原料を混練しつつ押し出すスクリューと、を含み、
前記制御部は、
前記ポンプの回転数の制御結果に基づいて、前記ポンプの動力源の出力を固定した後、
前記圧力センサによって測定される測定圧力を目標圧力に近付けるように、前記スクリューの回転数をさらにフィードバック制御し、
前記スクリューの回転数をフィードバック制御する際、
工程(e)前記測定圧力と前記目標圧力との差に基づいて、現在の状態と以前に選択した行動に対する報酬とを決定
する工程、
工程(f)状態と行動との組み合わせである制御条件を前記報酬に基づいて更新すると共に、更新された制御条件から前記現在の状態に対応した最適な行動を選択
する工程、
工程(g)前記最適な行動に基づいて、前記スクリューの回転数を制御する
工程、
を実行する、
請求項11~13のいずれか一項に記載の押出成形装置の制御方法。
【請求項15】
前記工程(f)において選択する前記行動が、前記スクリューの動力源の出力の変更である、
請求項14に記載の押出成形装置の制御方法。
【請求項16】
前記制御部は、前記スクリューの動力源の出力を制御する第2のPIDコントローラを含み、
前記工程(f)において選択する前記行動が、前記第2のPIDコントローラのパラメータの変更による前記スクリューの動力源の出力の変更である、
請求項15に記載の押出成形装置の制御方法。
【請求項17】
シリンダと、前記シリンダに収容されたスクリューと、を備え、前記シリンダに投入された樹脂原料を加熱して溶融させると共に、前記スクリューによって混練しつつ押し出す押出機と、
前記押出機から押し出された溶融樹脂を吸入し、吐出するポンプと、
前記ポンプの吸入側における前記溶融樹脂の圧力を測定する圧力センサと、
前記圧力センサによって測定される測定圧力を目標圧力に近付けるように、前記スクリューの回転数をフィードバック制御する制御部と
、を備えた押出成形装置の制御方法であって、
前記制御部は、
工程(e)前記測定圧力と前記目標圧力との差に基づいて、現在の状態と以前に選択した行動に対する報酬とを決定
する工程、
工程(f)状態と行動との組み合わせである制御条件を前記報酬に基づいて更新すると共に、更新された制御条件から前記現在の状態に対応した最適な行動を選択
する工程、
工程(g)前記最適な行動に基づいて、前記スクリューの回転数を制御する
工程、
を実行する、
押出成形装置の制御方法。
【請求項18】
前記工程(f)において選択する前記行動が、前記スクリューの動力源の出力の変更である、
請求項17に記載の押出成形装置の制御方法。
【請求項19】
前記制御部は、前記スクリューの動力源の出力を制御するPIDコントローラを含み、
前記工程(f)において選択する前記行動が、前記PIDコントローラのパラメータの変更による前記スクリューの動力源の出力の変更である、
請求項18に記載の押出成形装置の制御方法。
【請求項20】
前記ポンプが、ギヤポンプである、
請求項11~19のいずれか一項に記載の押出成形装置の制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は押出成形装置及びその制御方法に関する。
【背景技術】
【0002】
特許文献1に示すように、発明者らは、機械学習を用いた押出成形装置及びその制御方法を開発してきた。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
発明者は、押出成形装置及びその制御方法の開発に際し、様々な課題を見出した。
その他の課題と新規な特徴は、本明細書の記述及び添付図面から明らかになるだろう。
【課題を解決するための手段】
【0005】
一実施の形態に係る押出成形装置では、圧力センサによって測定される測定圧力を目標圧力に近付けるように、ポンプの回転数をフィードバック制御する制御部が、測定圧力と目標圧力との差に基づいて、現在の状態と以前に選択した行動に対する報酬とを決定し、状態と行動との組み合わせである制御条件を報酬に基づいて更新すると共に、更新された制御条件から現在の状態に対応した最適な行動を選択し、最適な行動に基づいて、ポンプの回転数を制御する。
【発明の効果】
【0006】
前記一実施の形態によれば、優れた樹脂フィルムの製造装置を提供することができる。
【図面の簡単な説明】
【0007】
【
図1】実施の形態1に係る押出成形装置の全体構成を示す模式的断面図である。
【
図3】Tダイ20の下側(リップ側)の部分斜視図である。
【
図4】実施の形態1に係る制御部70の構成を示すブロック図である。
【
図5】実施の形態1に係る押出成形装置の制御方法の全体を示すフローチャートである。
【
図6】ギヤポンプGPの回転数の調整工程(ステップS2)の詳細を示すフローチャートである。
【
図7】製品製造時のスクリュー12の回転数の制御工程(ステップS3)の詳細を示すフローチャートである。
【
図8】実施の形態2に係る制御部70の構成を示すブロック図である。
【発明を実施するための形態】
【0008】
以下、具体的な実施の形態について、図面を参照しながら詳細に説明する。但し、以下の実施の形態に限定される訳ではない。また、説明を明確にするため、以下の記載及び図面は、適宜簡略化されている。
【0009】
(実施の形態1)
<押出成形装置の全体構成>
まず、
図1を参照して、実施の形態1に係る押出成形装置の全体構成について説明する。
図1は、実施の形態1に係る押出成形装置の全体構成を示す模式的断面図である。本実施の形態に係る押出成形装置は、樹脂フィルム製造装置である。
【0010】
なお、当然のことながら、
図1及びその他の図面に示した右手系xyz直交座標は、構成要素の位置関係を説明するための便宜的なものである。通常、z軸正向きが鉛直上向き、xy平面が水平面であり、図面間で共通である。
また、本明細書において、樹脂フィルムは樹脂シートを含む。
【0011】
図1に示すように、実施の形態1に係る押出成形装置は、押出機10、Tダイ20、冷却ロール30、搬送ロール群40、巻取機50、厚みセンサ60、制御部70を備えている。実施の形態1に係る押出成形装置は、押出機10に連結されたTダイ20のリップ間の隙間からフィルム状の溶融樹脂82aを押し出す押出成形タイプの樹脂フィルム製造装置である。
【0012】
押出機10は、例えばスクリュー式押出機である。
図1に例示した押出機10では、x軸方向に延設されたシリンダ11の内部にx軸方向に延設されたスクリュー12が収容されている。シリンダ11のx軸負方向側端部の上側に、樹脂フィルム83の原料である樹脂ペレット81を投入するためのホッパ13が設けられている。
スクリュー12の根元には、モータM1が連結される。モータM1は、スクリュー12を駆動する駆動源である。
なお、スクリュー12は、単数でも複数でもよい。例えば、スクリュー12が1本の押出機10は単軸押出機、スクリュー12が2本の押出機10は二軸押出機と呼ばれる。
【0013】
ホッパ13から供給された樹脂ペレット81は、モータM1によって回転するスクリュー12の根元から先端に向かって、すなわちx軸正方向に押し出される。樹脂ペレット81は、シリンダ11の内部において、加熱されると共に回転するスクリュー12によって圧縮され、溶融樹脂82に変化する。
【0014】
図1に示すように、Tダイ20は、押出機10の先端部(x軸正方向側端部)からx軸正方向に延設され、さらに下向き(z軸負方向)に延設されたL字状の配管の下端に連結されている。Tダイ20の下端に位置するリップの隙間からフィルム状の溶融樹脂82aが下向き(z軸負方向)に押し出される。ここで、Tダイ20のリップ間隔は調整可能である。詳細には後述するように、製造される樹脂フィルム83の幅方向(y軸方向)における厚みが均一になるように、リップの長手方向(y軸方向)に沿った複数箇所において、Tダイ20のリップ間隔が調整可能である。
【0015】
ここで、
図1に示すように、押出機10とTダイ20とを接続する配管の水平部にはギヤポンプGPが設けられている。ギヤポンプGPは、押出機10から押し出された溶融樹脂を吸入し、Tダイ20に吐出する。ギヤポンプGPは、例えば互いに噛み合う一対のギヤから構成される。ギヤポンプGPの一方のギヤがモータM2により駆動される。
なお、押出機10から押し出された溶融樹脂を吸入し、Tダイ20に吐出するポンプは、ギヤポンプに限らず、他の種類のポンプでもよい。
【0016】
図1に示すように、押出機10とTダイ20とを接続する配管におけるギヤポンプGPの吸入側には、圧力センサPSが設けられている。圧力センサPSは、ギヤポンプGPの吸入側における溶融樹脂の圧力を測定する。圧力センサPSによって測定される測定圧力は、制御部70に入力される。
【0017】
冷却ロール30は、Tダイ20から押し出されたフィルム状の溶融樹脂82aを冷却しつつ、フィルム状の溶融樹脂82aが固化した樹脂フィルム83を搬出する。冷却ロール30から搬出された樹脂フィルム83は、搬送ロール群40を介して搬送され、巻取機50によって巻き取られる。
図1の例では、搬送ロール群40は、8個の搬送ロール41~48を備えている。搬送ロールの個数、配置は適宜決定される。
【0018】
厚みセンサ60は、例えば非接触式の厚みセンサであって、冷却ロール30から搬出された搬送中の樹脂フィルム83の幅方向の厚み分布を測定する。
図1の例では、厚みセンサ60は、搬送ロール44、45の間において水平に搬送される樹脂フィルム83を上下から挟むように配置されている。厚みセンサ60は、非接触式であるため、樹脂フィルム83の幅方向(y軸方向)に走査させることができる。そのため、コンパクトな厚みセンサ60によって、樹脂フィルム83の幅方向の厚み分布を測定することができる。また、樹脂フィルム83が水平に搬送されているため、厚みセンサ60を走査させても精度良く厚み分布を測定することができる。
【0019】
図1に示すように、制御部70は、圧力センサPSによって測定される測定圧力を目標圧力に近付けるように(維持するように)、スクリュー12及びギヤポンプGPの回転数を個別にフィードバック制御する。具体的には、スクリュー12及びギヤポンプGPの駆動源であるモータM1、M2の出力をフィードバック制御する。ギヤポンプGPの吸入側における溶融樹脂の圧力を目標圧力に維持することによって、Tダイ20に流入する溶融樹脂の量を一定に維持できる。
【0020】
モータM1によって駆動されるスクリュー12の回転数を高くすると、ギヤポンプGPに向かって押し出される溶融樹脂の量が増え、ギヤポンプGPの吸入側における溶融樹脂の圧力は上昇する。反対に、スクリュー12の回転数を低くすると、ギヤポンプGPに向かって押し出される溶融樹脂の量が減り、ギヤポンプGPの吸入側における溶融樹脂の圧力は低下する。
【0021】
そのため、制御部70がスクリュー12の回転数をフィードバック制御する際、圧力センサPSによる測定圧力が目標圧力よりも低い場合、スクリュー12の回転数(すなわちモータM1の出力)を増加させる。反対に、測定圧力が目標圧力よりも高い場合、スクリュー12の回転数(すなわちモータM1の出力)を減少させる。
【0022】
他方、モータM2によって駆動されるギヤポンプGPの回転数を高くすると、ギヤポンプGPによって吸入される溶融樹脂の量が増え、ギヤポンプGPの吸入側における溶融樹脂の圧力は低下する。反対に、ギヤポンプGPの回転数を低くすると、ギヤポンプGPによって吸入される溶融樹脂の量が減り、ギヤポンプGPの吸入側における溶融樹脂の圧力は上昇する。
【0023】
そのため、制御部70がギヤポンプGPの回転数をフィードバック制御する際、圧力センサPSによる測定圧力が目標圧力よりも低い場合、ギヤポンプGPの回転数(すなわちモータM2の出力)を減少させる。反対に、測定圧力が目標圧力よりも高い場合、スクリュー12の回転数(すなわちモータM2の出力)を増加させる。
【0024】
また、
図1に示すように、制御部70は、厚みセンサ60から取得した樹脂フィルム83の厚み分布に基づいて、Tダイ20のリップ間隔をフィードバック制御する。より具体的には、制御部70は、樹脂フィルム83の幅方向において厚みが均一になるように、Tダイ20のリップ間隔を制御する。
なお、制御部70のより詳細な構成及び動作については、後述する。
【0025】
<Tダイ20の構成>
ここで、
図2、
図3を参照して、Tダイ20の構成についてより詳細に説明する。
図2は、Tダイ20の断面図である。また、
図3は、Tダイ20の下側(リップ側)の部分斜視図である。
【0026】
図2、
図3に示すように、Tダイ20は、突き合わせられた一対のダイブロック21、22からなる。突き合わせられた一対のダイブロック21、22は、いずれも外側面から内側面(突き合わせ面)に向かって下方向に傾斜したテーパー部が設けられている。すなわち、ダイブロック21、22の突き合わせ面の下端部には、薄肉のリップ21a、22aが設けられている。
【0027】
一対のダイブロック21、22の突き合わせ面には、導入口20a、マニホールド20b、及びスリット20cが形成されている。導入口20aは、Tダイ20の上面から下方向(z軸負方向)に延設されている。マニホールド20bは、導入口20aの下端からy軸正方向及びy軸負方向に延設されている。このように、Tダイ20では、導入口20aとマニホールド20bとがT字状に形成されている。
【0028】
さらに、マニホールド20bの底面からTダイ20の下面に至るスリット20cがy軸方向に延設されている。溶融樹脂82は、導入口20a及びマニホールド20bを介してスリット20c(すなわちリップ21a、22aの隙間)から下方向に押し出される。
【0029】
ここで、リップ21aは動かない固定リップであるのに対し、リップ22aはヒートボルト23に連結された可動リップである。リップ22aには、外側面から突き合わせ面に向かって斜め上方向に切り欠き溝22bが形成されている。リップ22aは、ヒートボルト23によって押し引きされ、切り欠き溝22bの底部を支点として動くことができる。このように、リップ22aのみが可動リップであるため、簡易な構成によって容易にリップ間隔を調整することができる。
【0030】
ヒートボルト23は、ダイブロック22のテーパー部に沿って、斜め上方向に延設されている。ヒートボルト23は、ダイブロック22に固定されたホルダー25a、25bによって支持されている。より詳細には、ヒートボルト23は、ホルダー25aに形成されたねじ穴にねじ止めされている。ヒートボルト23の締め込み量は適宜調整することができる。他方、ヒートボルト23は、ホルダー25bに形成された貫通孔に挿通されているが、ホルダー25bには固定されてない。なお、ホルダー25a、25bは、ダイブロック22と別体でなく、一体に形成されていてもよい。
【0031】
ここで、
図3に示すように、複数のヒートボルト23が、リップ21a、22aの長手方向(y軸方向)に沿って並べられている。リップ21a、22aの長手方向は、樹脂フィルムの幅方向に対応する。
図3の例では、模式的に3本のヒートボルト23が設けられているが、通常はより多くのヒートボルト23が設けられている。
【0032】
ヒータ24は、ヒートボルト23を加熱するためにヒートボルト23毎に設けられている。
図2、
図3に示した例では、ホルダー25a、25bの間において、各ヒートボルト23の外周面を覆うように、ヒータ24が設けられている。ヒートボルト23を締め込むことによって、ヒートボルト23の下端面によってリップ22aを押すことができる。さらに、ヒートボルト23の下端部は、リップ22aに固定された断面U字状の連結部材26によってリップ22aに連結されている。そのため、ヒートボルト23を緩めることによって、連結部材26を介してリップ22aを引くこともできる。
【0033】
ヒートボルト23の締め込み量によってリップ21a、22aの間隔を調整することができる。具体的には、ヒートボルト23の締め込み量を増加させると、ヒートボルト23がリップ22aを押し、リップ21a、22aの間隔が狭くなる。反対に、ヒートボルト23の締め込み量を減少させると、リップ21a、22aの間隔が広くなる。ヒートボルト23の締め込み量は、例えば手動により調整される。
【0034】
さらに、ヒータ24によるヒートボルト23の熱膨張量によって、リップ21a、22aの間隔を微調整することができる。具体的には、ヒータ24の加熱温度を上昇させると、ヒートボルト23の熱膨張量が増加するため、ヒートボルト23がリップ22aを押し、リップ21a、22aの間隔が狭くなる。反対に、ヒータ24の加熱温度を低下させると、ヒートボルト23の熱膨張量が減少するため、リップ21a、22aの間隔が広くなる。各ヒートボルト23の熱膨張量すなわち各ヒータ24の加熱は、制御部70によって制御される。
【0035】
<比較例に係る制御部70の構成>
比較例に係る押出成形装置は、
図1に示した実施の形態1に係る押出成形装置と同様の全体構成を有している。比較例では、制御部70が、PID制御を用いて、圧力センサPSによって測定される測定圧力に基づいて、スクリュー12及びギヤポンプGPの回転数を個別にフィードバック制御する。PID制御の場合、プロセス条件を変更する度に、パラメータを調整する必要がある。通常、作業者が試行錯誤してパラメータを調整するため、パラメータ調整に多大な時間及び樹脂材料を要するという問題があった。
【0036】
<実施の形態1に係る制御部70の構成>
次に、
図4を参照して、実施の形態1に係る制御部70の構成についてより詳細に説明する。
図4は、実施の形態1に係る制御部70の構成を示すブロック図である。
図4に示すように、実施の形態1に係る制御部70は、状態観測部71、制御条件学習部72、記憶部73、制御信号出力部74を備えている。
【0037】
制御部70は、スクリュー12及びギヤポンプGPの駆動源であるモータM1、M2の出力を個別にフィードバック制御する。
図4には、ギヤポンプGPの駆動源であるモータM2の回転数を制御する場合のみを示しているが、スクリュー12の駆動源であるモータM1についても同様に制御される。すなわち、スクリュー12の駆動源であるモータM1の回転数を制御する場合、
図4におけるモータM1をモータM2に置き換えればよい。
【0038】
なお、制御部70を構成する各機能ブロックは、ハードウェア的には、CPU(Central Processing Unit)、メモリ、その他の回路で構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現することができる。従って、各機能ブロックは、コンピュータのハードウェアやソフトウェアやそれらの組み合わせによって色々な形態で実現できる。
【0039】
状態観測部71は、圧力センサPSによって測定される測定圧力pvから制御偏差errを算出する。制御偏差errは、測定圧力pvと目標圧力との差である。
そして、状態観測部71は、算出した制御偏差errに基づいて、現在の状態stと以前(例えば前回)に選択した行動acに対する報酬rwとを決定する。
【0040】
状態stは、無限に取り得る制御偏差errの値を有限個に区分するために予め設定されている。説明のための簡易な例としては、制御偏差をerrとして、-4.0MPa≦err<-3.0MPaを状態st1、-3.0MPa≦err<-2.0MPaを状態st2、-2.0MPa≦err<-1.0MPaを状態st3、-1.0MPa≦err<+1.0MPaを状態st4、+1.0MPa≦err<+2.0MPaを状態st5、+2.0MPa≦err<+3.0MPaを状態st6、+3.0MPa≦err<+4.0MPaを状態st7、+4.0MPa≦err≦+5.0MPaを状態st8などと設定される。実際には、より細分化された多数の状態stが設定される場合が多い。
【0041】
報酬rwは、以前の状態stにおいて選択した行動acを評価するための指標である。
具体的には、算出した現在の制御偏差errの絶対値が、以前の制御偏差errの絶対値よりも小さくなっていれば、状態観測部71は、以前に選択した行動acが適切であると判断し、例えば報酬rwを正の値とする。換言すると、以前と同じ状態stにおいて前回選択した行動acが再度選択され易くなるように、報酬rwが決定される。
【0042】
反対に、算出した現在の制御偏差errの絶対値が、以前の制御偏差errの絶対値よりも大きくなっていれば、状態観測部71は、以前に選択した行動acが不適切であると判断し、例えば報酬rwを負の値とする。換言すると、以前と同じ状態stにおいて前回選択した行動acが再度選択され難くなるように、報酬rwが決定される。
なお、報酬rwの具体例については後述する。また、報酬rwの値は適宜決定することができる。例えば、報酬rwの値が常に正の値であってもよく、報酬rwの値が常に負の値であってもよい。
【0043】
制御条件学習部72は、モータM1、M2のそれぞれについて、強化学習を行う。具体的には、制御条件学習部72は、制御条件(学習結果)を報酬rwに基づいて更新すると共に、更新された制御条件から現在の状態stに対応した最適な行動acを選択する。制御条件は、状態stと行動acとの組み合わせである。上述の状態st1~st8に対応した簡易な制御条件(学習結果)を表1に示す。
図4の例では、制御条件学習部72は、更新した制御条件ccを例えばメモリである記憶部73に格納すると共に、記憶部73から制御条件ccを読み出して更新する。
【0044】
表1は、強化学習の一例であるQ学習による制御条件(学習結果)を示している。表1の最上行には上述の8つの状態st1~st8が示されている。すなわち、2~9列目の各列が8つの状態st1~st8を示している。他方、表1の最左列には5つの行動ac1~ac5が示されている。すなわち、2~6列目の各行が、5つの行動ac1~ac5を示している。
【0045】
【0046】
ここで、表1の例では、
図4に示したモータM2の出力を1.0%減らす行動を行動ac1(出力変化:-1%)と設定している。モータM2の出力を0.5%減らす行動を行動ac2(出力変化:-0.5%)と設定している。モータM2の出力を維持する行動を行動ac3(出力変化:0%)と設定している。モータM2の出力を0.5%増やす行動を行動ac4(出力変化:+0.5%)と設定している。モータM2の出力を1.0%増やす行動を行動ac5(出力変化:+1.0%)と設定している。表1の例は、あくまでも説明のための簡易な例であって、実際には、より細分化された多数の行動acが設定される場合が多い。
【0047】
表1において状態stと行動acとの組み合わせから定まる値は、価値Q(st、ac)と呼ばれる。価値Qは、初期値が与えられた後、公知の更新式を利用して報酬rwに基づいて順次更新される。価値Qの初期値は、例えば
図4に示す学習条件に含まれる。学習条件は、例えば作業者によって入力される。価値Qの初期値は記憶部73に格納されていてもよく、例えば過去の学習結果を初期値として用いてもよい。また、
図4に示す学習条件には、例えば表1に示した状態st1~st8及び行動ac1~ac5も含まれる。
【0048】
表1における状態st7を例に、価値Qについて説明する。状態st7では、制御偏差errが+3.0MPa以上+4.0MPa未満であるため、測定圧力pvが目標圧力よりも高く、ギヤポンプGPの回転数が低過ぎる。すなわち、ギヤポンプGPを駆動するモータM2の出力が低過ぎるため、モータM2の出力を増加させる必要がある。従って、制御条件学習部72による学習の結果、モータM2の出力を増加させる行動ac4、ac5の価値Qが大きくなっている。一方、モータM2の出力を減少させる行動ac1、ac2の価値Qは小さくなっている。
【0049】
表1の例において、例えば制御偏差errが+3.5MPaである場合、状態stは状態st7である。そのため、制御条件学習部72は、状態st7において価値Qが最大であって最適な行動ac4を選択し、制御信号出力部74へ出力する。
制御信号出力部74は、入力された行動ac4に基づいて、モータM2の出力を0.5%増加させる制御信号ctrをモータM2へ出力する。
【0050】
そして、次回の制御偏差errの絶対値が今回の制御偏差errの絶対値3.5MPaよりも小さければ、状態観測部71は、今回の状態st7における行動ac4の選択が適切であると判断し、正の値の報酬rwを出力する。そのため、制御条件学習部72は、状態st7における行動ac4の価値+3.6を報酬rwに応じて増やすように制御条件を更新する。その結果、状態st7の場合、制御条件学習部72は、引き続き行動ac4を選択する。
【0051】
一方、次回の制御偏差errの絶対値が今回の制御偏差errの絶対値3.5MPaよりも大きければ、状態観測部71は、今回の状態st7における行動ac4の選択が不適切であると判断し、負の値の報酬rwを出力する。そのため、制御条件学習部72は、状態st7における行動ac4の価値+3.6を報酬rwに応じて減らすように制御条件を更新する。その結果、状態st7における行動ac4の価値が行動ac5の価値+2.6よりも小さくなると、状態st7の場合、制御条件学習部72は、行動ac4に代えて行動ac5を選択する。
【0052】
なお、制御条件を更新するタイミングは、次回に限らず、タイムラグなどを考慮して適宜決定すればよい。また、学習初期段階では、学習を促進するために、ランダムに行動acを選択してもよい。さらに、表1では、簡易なQ学習による強化学習について説明したが、学習アルゴリズムについては、Q学習、AC(Actor-Critic)法、TD学習、モンテカルロ法など様々あるが、何ら限定されるものではない。例えば、状態st及び行動acの数が増えて組み合わせ爆発が発生する場合は、AC法などを用いるなど状況によって選定すればよい。
【0053】
また、AC法では、方策関数として確率分布関数を用いる場合が多い。その確率分布関数は、正規分布関数に限らず、例えば、簡単化を目的としてシグモイド関数、ソフトマックス関数などを用いてもよい。シグモイド関数は、ニューラルネットワークで最も使用される関数である。強化学習は、ニューラルネットワークと同じ機械学習の1つであるため、シグモイド関数を採用できる。また、シグモイド関数は、関数自体も簡単であり、扱い易いという利点もある。
以上の通り、学習アルゴリズムや用いる関数は様々であるが、プロセスに対して最適なものを適宜選定すればよい。
【0054】
以上に説明した通り、実施の形態1に係る押出成形装置では、PID制御を用いていないため、そもそもプロセス条件の変更に伴うパラメータ調整が不要である。また、制御部70が、強化学習によって、制御条件(学習結果)を報酬rwに基づいて更新すると共に、更新された制御条件から現在の状態stに対応した最適な行動acを選択する。そのため、プロセス条件を変更した場合でも、比較例に比べ、調整に要する時間及び樹脂材料を抑制することができる。
【0055】
なお、実施の形態1に係る押出成形装置によって製造される製品は、樹脂フィルムに限定されず、パイプ材、棒材、ワイヤ等の被覆材等でもよい。さらには、実施の形態1に係る押出成形装置をブロー成形用のパリソンの押出成形に用いてもよい。
【0056】
<押出成形装置の制御方法の全体>
次に、
図5を参照して、実施の形態1に係る押出成形装置の制御方法の全体について説明する。
図5は、実施の形態1に係る押出成形装置の制御方法の全体を示すフローチャートである。
図5の説明においては、
図1も適宜参照する。
【0057】
まず、
図5に示すように、押出成形装置を起動したら、スクリュー12及びギヤポンプGPの回転数をそれぞれ手動で設定する(ステップS1)。具体的には、スクリュー12及びギヤポンプGPの回転数を、それぞれ製造時の標準値まで徐々に高くする。それに伴い、ホッパ13から供給する樹脂ペレット81の量も徐々に増加させる。
【0058】
次に、
図5に示すように、スクリュー12の回転数を上記標準値に固定し、ギヤポンプGPの回転数を機械学習により調整する(ステップS2)。具体的には、制御部70が、圧力センサPSによって測定される測定圧力を目標圧力に近付けるように(維持するように)、ギヤポンプGPの回転数を機械学習によりフィードバック制御し、調整する。なお、ステップS2においては、スクリュー12の回転数を固定するため、ホッパ13から供給する樹脂ペレット81の量も固定する。
【0059】
次に、
図5に示すように、ギヤポンプGPの回転数を調整された値に固定し、スクリュー12の回転数を機械学習により制御しつつ、樹脂フィルムを製造する(ステップS3)。具体的には、ステップS2において、スクリュー12の回転数が安定したら、ギヤポンプGPの回転数をその調整された値に固定する。そして、制御部70が、圧力センサPSによって測定される測定圧力を目標圧力に近付けるように(維持するように)、スクリュー12の回転数を機械学習によりフィードバック制御しつつ、樹脂フィルムを製造する。なお、ステップS3においては、スクリュー12の回転数に合わせて、ホッパ13から供給する樹脂ペレット81の量も変動させる。
【0060】
樹脂フィルム83の製造が終了していなければ(ステップS4NO)、ステップS3に戻って制御を継続する。一方、樹脂フィルム83の製造が終了したら(ステップS4YES)、制御を終了する。すなわち、樹脂フィルム83の製造が終了するまで、ステップS3を繰り返す。
図5において、ステップS1、S2は、製品である樹脂フィルムを製造するための準備工程であり、ステップS3は、製品である樹脂フィルムの製造工程である。
【0061】
<ステップS2の詳細>
次に、
図6を参照して、ギヤポンプGPの回転数の調整工程(ステップS2)の詳細について説明する。
図6は、ギヤポンプGPの回転数の調整工程(ステップS2)の詳細を示すフローチャートである。
図6の説明においては、
図4も適宜参照する。
【0062】
まず、
図6に示すように、
図4に示した制御部70の状態観測部71は、ギヤポンプGPの入口側における溶融樹脂の測定圧力と目標圧力との差(制御偏差err)に基づいて、現在の状態stと以前に選択した行動acに対する報酬rwとを決定する(ステップS21)。なお、制御開始時には、以前(例えば前回)に選択した行動acが存在せず、報酬rwを決定することができないため、現在すなわち制御開始時の状態stのみを決定する。
【0063】
次に、制御部70の制御条件学習部72は、状態stと行動acとの組み合わせである制御条件を報酬rwに基づいて更新する。そして、更新された制御条件から現在の状態stに対応した最適な行動acを選択する(ステップS22)。なお、制御開始時には、制御条件は初期値のまま更新されないが、制御開始時の状態stに対応した最適な行動acを選択する。
そして、制御部70の制御信号出力部74は、制御条件学習部72が選択した最適な行動acに基づいて、ギヤポンプGPのモータM2に制御信号ctrを出力する(ステップS23)。
【0064】
ギヤポンプGPの回転数が安定せずに、ギヤポンプGPの回転数の調整が終了していなければ(ステップS24NO)、ステップS21に戻ってギヤポンプGPの回転数の調整を継続する。一方、ギヤポンプGPの回転数が安定したら、ギヤポンプGPの回転数の調整を終了する(ステップS24YES)。すなわち、ギヤポンプGPの回転数の調整が終了するまで、ステップS21~S23を繰り返す。ギヤポンプGPの回転数の調整が終了したら、すなわちステップS2が終了したら、
図5に示したステップS3に移行する。
【0065】
以上に説明した通り、実施の形態1に係る押出成形装置では、ギヤポンプGPの回転数の調整において、PID制御を用いていないため、そもそもプロセス条件の変更に伴うパラメータ調整が不要である。また、コンピュータを用いた強化学習によって、制御条件(学習結果)を報酬rwに基づいて更新すると共に、更新された制御条件から現在の状態stに対応した最適な行動acを選択する。そのため、プロセス条件を変更した場合でも、比較例に比べ、ギヤポンプGPの回転数の調整に要する時間及び樹脂材料を抑制することができる。
【0066】
<ステップS3の詳細>
次に、
図7を参照して、製品製造時のスクリュー12の回転数の制御工程(ステップS3)の詳細について説明する。
図7は、製品製造時のスクリュー12の回転数の制御工程(ステップS3)の詳細を示すフローチャートである。
図7の説明においては、
図4も適宜参照する。その際、
図4におけるモータM1をモータM2に置き換えるものとする。
【0067】
まず、
図7に示すように、
図4に示した制御部70の状態観測部71は、ギヤポンプGPの入口側における溶融樹脂の測定圧力と目標圧力との差(制御偏差err)に基づいて、現在の状態stと以前に選択した行動acに対する報酬rwとを決定する(ステップS31)。なお、制御開始時には、以前(例えば前回)に選択した行動acが存在せず、報酬rwを決定することができないため、現在すなわち制御開始時の状態stのみを決定する。
【0068】
次に、制御部70の制御条件学習部72は、状態stと行動acとの組み合わせである制御条件を報酬rwに基づいて更新する。そして、更新された制御条件から現在の状態stに対応した最適な行動acを選択する(ステップS32)。なお、制御開始時には、制御条件は初期値のまま更新されないが、制御開始時の状態stに対応した最適な行動acを選択する。
そして、制御部70の制御信号出力部74は、制御条件学習部72が選択した最適な行動acに基づいて、スクリュー12のモータM1に制御信号ctrを出力する(ステップS33)。
【0069】
樹脂フィルム83の製造が終了していなければ(ステップS4NO)、ステップS31に戻って制御を継続する。一方、樹脂フィルム83の製造が終了したら(ステップS4YES)、制御を終了する。すなわち、樹脂フィルム83の製造が終了するまで、ステップS31~S33を繰り返す。
【0070】
以上に説明した通り、実施の形態1に係る押出成形装置では、製品製造時のスクリュー12の回転数の制御において、PID制御を用いていないため、そもそもプロセス条件の変更に伴うパラメータ調整が不要である。また、コンピュータを用いた強化学習によって、制御条件(学習結果)を報酬rwに基づいて更新すると共に、更新された制御条件から現在の状態stに対応した最適な行動acを選択する。そのため、比較例に比べ、プロセス条件を変更した場合における製品の歩留まりを向上させられると共に、製品製造時における外的要因による溶融樹脂の圧力変動にも柔軟に対応できる。
【0071】
(実施の形態2)
次に、
図8を参照して、実施の形態2に係る押出成形装置について説明する。実施の形態2に係る押出成形装置の全体構成は、
図1に示した実施の形態1に係る押出成形装置の全体構成と同様であるため、説明を省略する。実施の形態2に係る押出成形装置は、制御部70の構成が実施の形態1に係る押出成形装置と異なる。
【0072】
図8は、実施の形態2に係る制御部70の構成を示すブロック図である。
図8に示すように、実施の形態2に係る制御部70は、状態観測部71、制御条件学習部72、記憶部73、PIDコントローラ74aを備えている。すなわち、実施の形態2に係る制御部70は、
図4に示した実施の形態1に係る制御部70における制御信号出力部74として、ギヤポンプGPの駆動源であるモータM2の出力を制御するPIDコントローラ(第1のPIDコントローラ)74aを備えている。PIDコントローラ74aも制御信号出力部の一形態である。
【0073】
状態観測部71は、実施の形態1と同様に、圧力センサPSによって測定される測定圧力pvと目標圧力との差(制御偏差err)に基づいて、現在の状態stと以前に選択した行動acに対する報酬rwとを決定する。そして、状態観測部71は、現在の状態stと報酬rwとを制御条件学習部72に出力する。さらに、実施の形態2に係る状態観測部71は、算出した制御偏差errをPIDコントローラ74aに出力する。
【0074】
制御条件学習部72も、実施の形態1と同様に、モータM1、M2のそれぞれについて、強化学習を行う。具体的には、制御条件学習部72は、制御条件(学習結果)を報酬rwに基づいて更新すると共に、更新された制御条件から現在の状態stに対応した最適な行動acを選択する。ここで、実施の形態1では、制御条件学習部72が選択する行動acの内容が、モータM2の出力を直接変更することである。これに対し、実施の形態2では、制御条件学習部72が選択する行動acの内容が、モータM2の出力を制御するPIDコントローラ74aのパラメータを変更することである。
【0075】
図8に示すように、制御条件学習部72から出力された行動acに基づいて、PIDコントローラ74aのパラメータが逐次変更される。他方、PIDコントローラ74aは、入力された制御偏差errに基づいて、モータM2へ制御信号ctrを出力する。
【0076】
以上に説明した通り、実施の形態2に係る押出成形装置では、PID制御を用いているため、プロセス条件の変更に伴うパラメータ調整が必要である。実施の形態2に係る押出成形装置では、制御部70が、強化学習によって、制御条件(学習結果)を報酬rwに基づいて更新すると共に、更新された制御条件から現在の状態stに対応した最適な行動acを選択する。ここで、強化学習における行動acが、モータM2の出力を制御するPIDコントローラ74aのパラメータの変更である。そのため、プロセス条件を変更した場合でも、比較例に比べ、パラメータ調整に要する時間及び樹脂材料を抑制することができる。
【0077】
その他の構成は、実施の形態1と同様であるから説明を省略する。また、スクリュー12の駆動源であるモータM1の出力を制御するPIDコントローラ(第2のPIDコントローラ)のパラメータの制御についても同様である。
【0078】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は既に述べた実施の形態に限定されるものではなく、その要旨を逸脱しない範囲において種々の変更が可能であることはいうまでもない。
【符号の説明】
【0079】
10 押出機
11 シリンダ
12 スクリュー
13 ホッパ
20 Tダイ
20a 導入口
20b マニホールド
20c スリット
21、22 ダイブロック
21a、22a リップ
22b 切り欠き溝
23 ヒートボルト
24 ヒータ
25a、25b ホルダー
26 連結部材
30 冷却ロール
40 搬送ロール群
41~48 搬送ロール
50 巻取機
60 厚みセンサ
70 制御部
71 状態観測部
72 制御条件学習部
73 記憶部
74 制御信号出力部
74a PIDコントローラ
81 樹脂ペレット
82 溶融樹脂
82a フィルム状の溶融樹脂
83 樹脂フィルム
GP ギヤポンプ
M1、M2 モータ
PS 圧力センサ
ac 行動
cc 制御条件
ctr 制御信号
err 制御偏差
pv 測定圧力
rw 報酬
st 状態