IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ジェイテクトの特許一覧

特許7225626研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置
<>
  • 特許-研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置 図1
  • 特許-研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置 図2
  • 特許-研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置 図3
  • 特許-研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-13
(45)【発行日】2023-02-21
(54)【発明の名称】研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置
(51)【国際特許分類】
   B24B 49/00 20120101AFI20230214BHJP
   G05B 19/4155 20060101ALI20230214BHJP
【FI】
B24B49/00
G05B19/4155 V
【請求項の数】 8
(21)【出願番号】P 2018175569
(22)【出願日】2018-09-20
(65)【公開番号】P2020044620
(43)【公開日】2020-03-26
【審査請求日】2021-08-17
(73)【特許権者】
【識別番号】000001247
【氏名又は名称】株式会社ジェイテクト
(74)【代理人】
【識別番号】110000648
【氏名又は名称】弁理士法人あいち国際特許事務所
(74)【代理人】
【識別番号】110000604
【氏名又は名称】弁理士法人 共立特許事務所
(72)【発明者】
【氏名】増田 祐生
(72)【発明者】
【氏名】河原 徹
(72)【発明者】
【氏名】村上 慎二
【審査官】山内 康明
(56)【参考文献】
【文献】特開平04-138504(JP,A)
【文献】特開2014-226741(JP,A)
【文献】特開2001-147912(JP,A)
【文献】特開2018-041208(JP,A)
【文献】特開2017-045300(JP,A)
【文献】特開2017-030067(JP,A)
【文献】中国特許出願公開第109249300(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
B24B 49/00
G05B 19/4155
(57)【特許請求の範囲】
【請求項1】
研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、
前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、
前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記工作物の加工変質層、前記工作物の表面性状、または前記工作物のびびり模様状態を、前記工作物の研削品質として、推定するための第一学習モデルを生成する第一学習モデル生成部と、
を備える、研削加工に関する学習モデル生成装置。
【請求項2】
研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、
前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、
前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記砥石車に目つぶれ、目詰まり、または目こぼれが生じている状態である前記砥石車の表面状態を推定するための第二学習モデルを生成する第二学習モデル生成部と、
を備える、研削加工に関する学習モデル生成装置。
【請求項3】
前記サンプリングデータ取得部は、前記実動作データ、前記第一実測データおよび前記第二実測データの中から、研削抵抗に関するデータとおよび単位時間当たりの切込量に関するデータとを取得し、
前記研削特性演算部は、前記研削抵抗に関するデータおよび前記単位時間当たりの切込量に関するデータに基づいて、前記研削特性を表す値として、前記砥石車の切れ味または前記研削点に供給されるクーラントの動圧を演算する、請求項1または2に記載の研削加工に関する学習モデル生成装置。
【請求項4】
前記サンプリングデータ取得部は、前記実動作データ、前記第一実測データおよび前記第二実測データの中から、研削抵抗に関するデータとおよび前記工作物の撓み量に関するデータとを取得し、
前記研削特性演算部は、前記研削抵抗に関するデータおよび前記工作物の撓み量に関するデータに基づいて、前記研削特性を表す値として、前記工作物の静剛性を演算する、請求項1または2に記載の研削加工に関する学習モデル生成装置。
【請求項5】
前記研削特性演算部は、前記所定期間分における複数種の前記サンプリングデータの関係を近似関係式で表すことにより、前記研削特性を表す値を演算する、請求項1~4のいずれか1項に記載の研削加工に関する学習モデル生成装置。
【請求項6】
請求項1に記載の前記学習モデル生成装置により生成された前記第一学習モデルを記憶する第一学習モデル記憶部と、
前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第一学習モデルとを用いて、前記新たな工作物の前記研削品質を推定する研削品質推定部と、
を備える、研削加工に関する推定装置。
【請求項7】
請求項2に記載の前記学習モデル生成装置により生成された前記第二学習モデルを記憶する第二学習モデル記憶部と、
前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第二学習モデルとを用いて、前記新たな工作物の研削を行った場合における前記砥石車の表面状態を推定する表面状態推定部と、
を備える、研削加工に関する推定装置。
【請求項8】
研削盤にて砥石車により工作物の研削を行う際において、前記研削盤の制御装置への動作指令データを前記工作物毎に取得する動作指令データ取得部と、
前記工作物毎に、前記工作物の研削品質または前記砥石車の表面状態に応じて前記動作指令データに対する報酬を決定する報酬決定部と、
複数の前記工作物に関する前記動作指令データおよび前記報酬を用いた機械学習により、前記報酬を多くするように前記動作指令データを調整するための第三学習モデルを記憶する第三学習モデル記憶部と、
前記工作物と同種の新たな工作物の研削に関する前記動作指令データと、請求項またはに記載の前記推定装置により推定された前記研削品質または前記表面状態、前記報酬と、前記第三学習モデルとを用いて、前記動作指令データの調整を行う動作指令データ調整部と、
を備える、研削加工に関する動作指令データ更新装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置に関するものである。
【背景技術】
【0002】
研削盤にて砥石車による工作物の研削において、工作物の研削品質が所定条件を満たすようにすることが求められる。例えば、工作物に加工変質層が生じないようにすること、工作物の表面性状(例えば表面粗さ)が所定値以内であること、工作物にびびり模様が生じないようにすること等が求められる。
【0003】
作業者が、研削後の工作物の検査を行うことで、研削品質が所定条件を満たすか否かを確認し、所定条件を満たす場合に良品とすることが行われている。また、特許文献1には、研削を行っている際において測定した研削負荷に基づいて、工作物に加工変質層が生じているか否かを判定することが記載されている。
【0004】
また、研削盤にて砥石車による工作物の研削において、砥石車の切れ味を維持するために、砥石車の表面のツルーイングおよびドレッシングが行われる。砥石車の切れ味が低下すると、工作物の品質が低下するおそれがある。そこで、ツルーイングおよびドレッシングは、研削した工作物の数が所定数に達した度に行われており、工作物の品質が低下しないように所定数が決定されている。しかし、作業者によって決定されるため、切れ味が低下したにも関わらず、研削が継続して行われるおそれがあり、工作物の品質の低下のおそれがあった。
【0005】
そこで、特許文献2には、主軸ヘッドに取り付けられた振動検出器によって主軸ヘッドの振動を検出し、主軸の振幅が工作物の研削面の研削精度に応じて予め設定された設定値に達した後に、研削作業を停止して砥石車のドレッシングを行うことが記載されている。
【0006】
ところで、近年コンピュータの処理速度の向上に伴い、人工知能が急速に発展しており、例えば、特許文献3には、機械学習により、レーザ加工条件データを生成することが記載されている。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2013-129028号公報
【文献】特開2002-307304号公報
【文献】特開2017-164801号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかし、特許文献1に記載されているように、研削負荷を用いるだけでは、加工変質層の有無を高精度に判定することができない。加工変質層が生じる要因には、種々の要因が存在するためである。種々の要因の中には、センサによる計測や機器からのデータ取得が容易なものとは異なり、計測自体が困難な要因もある。そこで、種々の要因を考慮して、加工変質層の有無等の工作物の研削品質を取得することが求められる。さらに、工作物の研削品質が良好となるような研削条件を得ることが求められる。
【0009】
また、特許文献2に記載されているように、主軸ヘッドの振動が設定値に達したか否かだけでは、砥石車の切れ味を十分に判定できない。その結果、砥石車の修正(ツルーイングおよびドレッシング)のタイミングを適切に判定できない。そこで、瞬間的な振動情報のみではなく、より多くの情報を用いて、砥石車の表面状態を判定することが求められる。
【0010】
本発明は、工作物の研削品質を取得することができる学習モデル生成装置、および、工作物の研削品質を推定する推定装置を提供することを目的の一つとする。また、本発明は、研削品質を向上させることができるように動作指令データを更新する動作指令データ更新装置を提供することを目的の一つとする。
【0011】
また、本発明は、砥石車の表面状態を取得することができる学習モデル生成装置、および、砥石車の表面状態を推定する推定装置を提供することを目的の一つとする。また、本発明は、砥石車の表面状態を良好とすることができるように動作指令データを更新する動作指令データ更新装置を提供することを目的の一つとする。
【課題を解決するための手段】
【0012】
(1.第一の学習モデル生成装置)
第一の学習モデル生成装置は、研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記工作物の加工変質層、前記工作物の表面性状、または前記工作物のびびり模様状態を、前記工作物の研削品質として、推定するための第一学習モデルを生成する第一学習モデル生成部とを備える。
【0013】
(2.第二の学習モデル生成装置)
第二の学習モデル生成装置は、研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記砥石車に目つぶれ、目詰まり、または目こぼれが生じている状態である前記砥石車の表面状態を推定するための第二学習モデルを生成する第二学習モデル生成部とを備える。
【0014】
(3.第一の推定装置)
第一の推定装置は、上記第一の学習モデル生成装置により生成された前記第一学習モデルを記憶する第一学習モデル記憶部と、前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第一学習モデルとを用いて、前記新たな工作物の前記研削品質を推定する研削品質推定部とを備える。
【0015】
(4.第二の推定装置)
第二の推定装置は、上記第二の学習モデル生成装置により生成された前記第二学習モデルを記憶する第二学習モデル記憶部と、前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第二学習モデルとを用いて、前記新たな工作物の研削を行った場合における前記砥石車の表面状態を推定する表面状態推定部とを備える。
【0016】
(5.動作指令データ更新装置)
動作指令データ更新装置は、研削盤にて砥石車により工作物の研削を行う際において、前記研削盤の制御装置への動作指令データを前記工作物毎に取得する動作指令データ取得部と、前記工作物毎に、前記工作物の研削品質または前記砥石車の表面状態に応じて前記動作指令データに対する報酬を決定する報酬決定部と、複数の前記工作物に関する前記動作指令データおよび前記報酬を用いた機械学習により、前記報酬を多くするように前記動作指令データを調整するための第三学習モデルを記憶する第三学習モデル記憶部と、前記工作物と同種の新たな工作物の研削に関する前記動作指令データと、上記第一の推定装置または第二の推定装置により推定された前記研削品質または前記表面状態、前記報酬と、前記第三学習モデルとを用いて、前記動作指令データの調整を行う動作指令データ調整部とを備える。
【0017】
(6.効果)
第一、第二学習モデルは、機械学習により生成されている。機械学習における第一学習用入力データは、所定期間分のサンプリングデータのみならず、所定期間分のサンプリングデータから演算された研削特性を表す値を含んでいる。所定期間分のサンプリングデータは、データ群(多数のデータの集合体)であり、種々の影響を受けている可能性がある。一方、研削特性を表す値は、サンプリングデータに基づいて整理されたデータにできる。また、研削特性を表す値は、直接的な計測が困難である。
【0018】
つまり、第一、第二学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。このように、整理された研削特性を表す値を用いることにより、第一、第二学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、推定される研削品質または砥石車の表面状態は、研削特性を十分に考慮した結果となり、より高精度な結果となる。さらに、直接的な計測が困難な研削特性を、サンプリングデータからの演算により把握している。計測だけでは得ることが難しい研削特性を学習データとして活用することで、より高精度な研削品質が得られる。
【0019】
また、動作指令データ更新装置は、上述により推定された研削品質または砥石車の表面状態を用いて処理される。つまり、研削特性を十分に考慮した結果としての研削品質または砥石車の表面状態を用いて、動作指令データの調整を行うための第三学習モデルを生成し、動作指令データの更新を行うことができる。従って、工作物の研削品質または砥石車の表面状態に応じて、動作指令を適切に更新することができる。
【図面の簡単な説明】
【0020】
図1】研削盤を示す平面図である。
図2】機械学習装置の概要構成を示す機能ブロック図である。
図3】機械学習装置の第一、第二学習フェーズの詳細構成を示す機能ブロック図である。
図4】機械学習装置の推定フェーズおよび更新フェーズの詳細構成を示す機能ブロック図である。
【発明を実施するための形態】
【0021】
(1.研削盤の構成)
研削盤1の構成について、図1を参照して説明する。研削盤1は、工作物Wを研削するための機械である。研削盤1は、円筒研削盤、カム研削盤等、種々の構成の研削盤を適用できる。本実施形態においては、研削盤1は、砥石台トラバース型の円筒研削盤を例にあげる。ただし、研削盤1は、テーブルトラバース型を適用することもできる。
【0022】
研削盤1は、主として、ベッド11、主軸台12、心押台13、トラバースベース14、砥石台15、砥石車16、定寸装置17、砥石車修正装置18、クーラント装置19、および、制御装置20を備える。
【0023】
ベッド11は、設置面上に固定されている。主軸台12は、ベッド11の上面において、X軸方向の手前側(図1の下側)且つZ軸方向の一端側(図1の左側)に設けられている。主軸台12は、工作物WをZ軸回りに回転可能に支持する。工作物Wは、主軸台12に設けられたモータ12aの駆動により回転される。心押台13は、ベッド11の上面において、主軸台12に対してZ軸方向に対向する位置、すなわち、X軸方向の手前側(図1の下側)且つZ軸方向の他端側(図1の右側)に設けられている。つまり、主軸台12および心押台13が、工作物Wを回転可能に両端支持する。
【0024】
トラバースベース14は、ベッド11の上面において、Z軸方向に移動可能に設けられている。トラバースベース14は、ベッド11に設けられたモータ14aの駆動により移動する。砥石台15は、トラバースベース14の上面において、X軸方向に移動可能に設けられている。砥石台15は、トラバースベース14に設けられたモータ15aの駆動により移動する。砥石車16は、砥石台15に回転可能に支持されている。砥石車16は、砥石台15に設けられたモータ16aの駆動により回転する。砥石車16は、複数の砥粒をボンド材により固定されて構成されている。
【0025】
定寸装置17は、工作物Wの寸法(径)を測定する。砥石車修正装置18は、砥石車16の形状を修正する。砥石車修正装置18は、砥石車16のツルーイングとドレッシングの何れか一方を行う装置である。さらに、砥石車修正装置18は、砥石車16の寸法(径)を測定する機能も有する。
【0026】
ここで、ツルーイングは、形直し作業であり、研削によって砥石車16が摩耗した場合に工作物Wの形状に合わせて砥石車16を成形する作業、片摩耗によって砥石車16の振れを取り除く作業等である。ドレッシングは、目直し(目立て)作業であり、砥粒の突き出し量を調整したり、砥粒の切れ刃を創成したりする作業である。ドレッシングは、目つぶれ、目詰まり、目こぼれ等を修正する作業であって、通常ツルーイング後に行われる。また、ツルーイングとドレッシングは、特段区別することなく実施される場合もある。
【0027】
クーラント装置19は、砥石車16による工作物Wの研削点にクーラントを供給する。クーラント装置19は、回収したクーラントを、所定温度に冷却して、再度研削点に供給する。
【0028】
制御装置20は、工作物Wの形状、加工条件、砥石車16の形状、クーラントの供給タイミング情報等の動作指令データに基づいて生成されたNCプログラムに基づいて、各駆動装置を制御する。すなわち、制御装置20は、動作指令データを入力し、動作指令データに基づいてNCプログラムを生成し、NCプログラムに基づいて各モータ12a,14a,15a,16aおよびクーラント装置19等を制御することにより工作物Wの研削を行う。特に、制御装置20は、定寸装置17により測定される工作物Wの径に基づいて、工作物Wが仕上げ形状となるまで研削を行う。また、制御装置20は、砥石車16を修正するタイミングにおいて、各モータ14a,15a,16a、および、砥石車修正装置18等を制御することにより、砥石車16の修正(ツルーイングおよびドレッシング)を行う。
【0029】
また、図1には一部を図示しないが、研削盤1は、後述する各種センサ21,22,23(図3等に示す)を備えている。例えば、研削盤1は、各モータ等の実動作データ、研削盤1を構成する構造部材の状態を示すデータを検出するセンサ、定寸装置17、砥石径センサ、温度センサ等を備える。なお、各種センサ等の詳細は、後述する。
【0030】
(2.機械学習装置100の概要)
機械学習装置100の概要について、図2を参照して説明する。機械学習装置100は、以下の、(a)-(f)を行う。
(a)工作物Wの研削品質を推定するための第一学習モデルを生成すること。
(b)第一学習モデルを用いて工作物Wの研削品質を推定すること。
(c)砥石車16の表面状態を推定するための第二学習モデルを生成すること。
(d)第二学習モデルを用いて砥石車16の表面状態を推定すること。
(e)研削品質が良好となるように、且つ、砥石車16の修正または交換の頻度を少なくするように、研削盤1の動作指令データを調整するための第三学習モデルを生成すること。
(f)第三学習モデルを用いて、研削品質が良好となるように、且つ、砥石車16の修正または交換の頻度を少なくするように、研削盤1の動作指令データを更新すること。
【0031】
機械学習装置100は、研削盤1とは別の装置として構成することもできるし、研削盤1の制御装置20等に組み込まれた装置として構成することもできる。本実施形態においては、機械学習装置100は、研削盤1とネットワーク線により接続されており、各種データの送受信を行う。
【0032】
(2-1.第一学習フェーズ101の概要)
上記(a)(c)に対応する第一学習フェーズ101について説明する。機械学習装置100は、図2に示すように、第一学習モデルおよび第二学習モデルを生成する第一学習フェーズ101において機能する要素101a,101b,101c,101d,101eを備える。機械学習装置100は、第一学習フェーズ101において機能する要素として、第一学習用入力データを取得する要素101a、第一教師データを取得する要素101b、第一学習モデルの生成を行う要素101c、第二教師データを取得する要素101d、および、第二学習モデルの生成を行う要素101eを備える。
【0033】
要素101aにおいて取得される第一学習用入力データは、機械学習に用いられる入力データであって、研削盤1の制御装置20への動作指令データ、工作物W毎の所定期間分の複数種のサンプリングデータ、および、複数種のサンプリングデータから演算される研削特性を表す値である。サンプリングデータは、例えば、実動作データ、第一実測データ(構造部材の状態を表すデータ)、第二実測データ(研削部位に関するデータ)等である。
【0034】
要素101bにおいて取得される第一教師データは、教師有り学習における機械学習に用いられる教師データである。第一教師データは、工作物Wの研削品質データであって、例えば、工作物Wの加工変質層データ、工作物Wの表面性状データ、工作物Wのびびり模様データ等である。
【0035】
要素101cにおいて生成される第一学習モデルは、第一学習用入力データおよび第一教師データに基づいて、機械学習のうち教師有り学習を行うことによって工作物Wの研削品質を推定するためのモデル(関数)である。ただし、第一学習モデルは、研削品質の分類分けを行うことを目的として、教師無し学習を適用することにより生成することもできる。ただし、教師有り学習を適用する場合には、高精度に研削品質を取得することができる。
【0036】
要素101dにおいて取得される第二教師データは、教師有り学習における機械学習に用いられる教師データである。第二教師データは、砥石車16の表面状態を表すデータ(砥石車16の表面状態データ)である。砥石車16の表面状態データは、例えば、目つぶれ、目詰まり、目こぼれ等が生じている状態に関するデータ、目立てすぎの状態に関するデータ等である。
【0037】
砥石車16の表面は、工作物Wの研削品質に影響を及ぼす。すなわち、砥石車16の表面状態とは、工作物Wの研削品質に影響を及ぼす程度である。砥石車16の表面状態とは、例えば、目つぶれ、目詰まり、目こぼれ等が生じている状態、目立てすぎの状態等である。そして、砥石車16の表面状態が良好でない場合には、工作物Wの研削品質が低下するおそれがある。従って、砥石車16の表面状態を把握することが求められる。
【0038】
砥石車16の表面状態が、目つぶれ、目詰まり、目こぼれ等が生じている場合には、ドレッシングを行ったり、ツルーイングにより成形した後にドレッシングを行ったりすることが必要となる。また、砥石車16の表面状態が、目立てすぎの状態であれば、ツルーイングを行うことが必要となる。通常、ツルーイング後には、ドレッシングが行われる。そして、ツルーイング回数が所定回数に到達した場合には、または、ツルーイングにより所定量成形した場合には、砥石車16の交換を行う必要がある。
【0039】
そして、砥石車16の寿命を向上するためには、ツルーイングおよびドレッシングを行う回数を少なくすることが求められる。さらに、ツルーイング、ドレッシングおよび砥石車16の交換を行うと、これらに要する時間によって、研削サイクル時間が長くなることになる。当然に、研削サイクル時間を短くすることが求められる。この観点においても、砥石車16の表面状態を把握することが求められる。そこで、要素101dは、砥石車16の表面状態データを第二教師データとして取得することとしている。なお、砥石車16の表面状態データとは、工作物の研削品質に影響を及ぼす程度を示すデータである。
【0040】
要素101eにおいて生成される第二学習モデルは、第一学習用入力データおよび第二教師データに基づいて、機械学習のうち教師有り学習を行うことによって砥石車16の表面状態を推定するためのモデル(関数)である。ただし、第二学習モデルは、砥石車16の表面状態の分類分けを行うことを目的として、教師無し学習を適用することにより生成することもできる。ただし、教師有り学習を適用する場合には、高精度に、砥石車16の表面状態を取得することができる。
【0041】
(2-2.第二学習フェーズ102の概要)
上記(e)に対応する第二学習フェーズ102について説明する。機械学習装置100は、図2に示すように、第三学習モデルを生成する第二学習フェーズ102において機能する要素102a,102b,102c,102dを備える。機械学習装置100は、第二学習フェーズ102において機能する要素として、第二学習用入力データを取得する要素102a、第一評価結果データを取得する要素102b、第二評価結果データを取得する要素102c、および、第三学習モデルの生成を行う要素102dを備える。
【0042】
要素102aにおいて取得される第二学習用入力データは、機械学習に用いられる入力データであって、例えば、動作指令データ等である。要素102bにおいて取得される第一評価結果データは、強化学習における機械学習に用いられる報酬を導き出すための評価結果データである。第一評価結果データは、工作物Wの研削品質データであって、例えば、工作物Wの加工変質層データ、工作物Wの表面性状データ、工作物Wのびびり模様データ等である。
【0043】
要素102cにおいて取得する第二評価結果データは、強化学習における機械学習に用いられる報酬を導き出すための評価結果データである。第二評価結果データは、砥石車16の表面状態データである。要素102dにおいて生成される第三学習モデルは、第二学習用入力データ、第一評価結果データおよび第二評価結果データに基づいて、機械学習のうち強化学習を行うことによって研削盤1の動作指令データを調整するためのモデル(関数)である。
【0044】
(2-3.推定フェーズ103の概要)
上記(b)(d)に対応する推定フェーズ103について説明する。機械学習装置100は、図2に示すように、推定フェーズ103において機能する要素として、推定用入力データを取得する要素103a、研削品質の推定および工作物Wの良否の判別を行う要素103bを備える。さらに、機械学習装置100は、推定フェーズ103において機能する要素として、砥石車16の表面状態の推定、並びに、砥石車16のツルーイングの実行、砥石車16のドレッシングの実行、および、砥石車16の交換の実行を判別する要素103cを備える。
【0045】
要素103aにおいて取得される推定用入力データは、第一学習用入力データと同種のデータであって、学習に用いた工作物Wとは異なる工作物W(新しい工作物W)に関して取得されるデータである。つまり、推定用入力データは、複数種のサンプリングデータと研削特性を表す値を含む。要素103bは、推定用入力データと第一学習モデルとを用いて研削品質を推定すると共に、推定された研削品質に基づいて工作物Wの良否を判別する。要素103bにて用いる第一学習モデルは、第一学習フェーズ101において機械学習によって生成される第一学習モデルである。
【0046】
要素103cは、推定用入力データと第二学習モデルとを用いて砥石車16の表面状態を推定すると共に、推定された砥石車16の表面状態に基づいて、砥石車16のツルーイングの実行、砥石車16のドレッシングの実行、および、砥石車16の交換の実行を判別する。要素103cにて用いる第二学習モデルは、第一学習フェーズ101において機械学習によって生成される第二学習モデルである。
【0047】
(2-4.更新フェーズ104の概要)
上記(f)に対応する更新フェーズ104について説明する。機械学習装置100は、動作指令データを更新する更新フェーズ104において機能する要素として、更新用入力データを取得する要素104a、並びに、動作指令データの更新を行う要素104bを備える。要素104aにおいて取得される更新用入力データは、第二学習用入力データと同種のデータであって、学習に用いた工作物Wとは異なる工作物W(新しい工作物W)に関して取得されるデータである。
【0048】
要素104bは、更新用入力データ、第三学習モデル、推定された研削品質、および、推定された砥石車16の表面状態を用いて、動作指令データを更新する。要素104bにて用いる第三学習モデルは、第二学習フェーズ102において機械学習によって生成される第三学習モデルである。また、推定された研削品質は、推定フェーズ103において推定された研削品質である。推定された砥石車16の表面状態は、推定フェーズ103において推定された砥石車16の表面状態である。
【0049】
(3.第一学習フェーズ101の詳細構成)
機械学習装置100の第一学習フェーズ101の詳細構成について、図3を参照して説明する。第一学習フェーズ101の構成は、研削加工に関する学習モデル生成装置を構成する。第一学習フェーズ101の構成は、第一入力データ取得部130と、研削特性演算部140、教師データ取得部150と、第一学習モデル生成部160と、第一学習モデル記憶部170と、第二学習モデル生成部180と、第二学習モデル記憶部190とを備えて構成される。
【0050】
第一学習フェーズ101において用いる第一学習用入力データ、第一教師データおよび第二教師データは、表1に示すとおりである。
【0051】
【表1】
【0052】
第一入力データ取得部130は、動作指令データ取得部110と、サンプリングデータ取得部120とを備える。動作指令データ取得部110は、制御装置20への動作指令データを、機械学習の第一学習用入力データとして取得する。動作指令データは、表1に示すように、工程毎の指令切込速度、工程切替時の移動体14,15の指令位置、砥石車16の指令回転速度、工作物Wの指令回転速度、クーラントの供給情報等である。ここで、工作物Wの研削は、例えば、粗研、精研、微研、スパークアウト等の複数の研削工程によって行われる。
【0053】
サンプリングデータ取得部120は、複数の工作物Wに関する所定期間分の複数種のサンプリングデータを、機械学習の第一学習用入力データとして取得する。サンプリングデータとは、工作物W毎に、所定のサンプリング周期におけるデータ群を構成する。サンプリングデータ取得部120は、制御装置20により制御される駆動装置12a等の実動作データをセンサ21から取得する実動作データ取得部121、第一実測データをセンサ22から取得する第一実測データ取得部122、第二実測データをセンサ23から取得する第二実測データ取得部123を備える。
【0054】
実動作データは、表1に示すように、モータ12a等の駆動電流、モータ12a等の実位置等である。実動作データ取得部121は、工作物W毎に所定期間分の実動作データを取得する。所定期間分とは、例えば、研削初期から研削終期まで、粗研の初期から粗研の終期まで等である。なお、研削が非定常状態の時には、不安定であるため、定常状態のみを対象としてデータを取得することも可能である。
【0055】
第一実測データは、砥石車16により工作物Wの研削を行っている際の実測データであって、構造部材15等の振動、構造部材15等の変形量等である。第二実測データは、砥石車16により工作物Wの研削を行う際の実測データであって、工作物Wの寸法(径)、研削点温度等である。
【0056】
第一実測データ取得部122は、第一実測データを、工作物W毎に所定期間分取得する。また、第二実測データ取得部123も、第二実測データを、工作物W毎に所定期間分取得する。第一実測データおよび第二実測データは、上述した実動作データと同一の所定期間の分だけ取得される。所定期間は、上述したように、例えば、研削初期から研削終期まで、粗研の初期から粗研の終期まで等である。
【0057】
研削特性演算部140は、第一入力データ取得部130により取得された動作指令データおよびサンプリングデータに基づいて、研削特性を表す値を演算する。特に、研削特性演算部140は、複数種のサンプリングデータに基づいて、研削特性を表す値を演算する。研削特性を表す値は、表1に示すように、動作指令データおよびサンプリングデータと同様に、第一学習用入力データとなる。
【0058】
例えば、研削特性演算部140は、所定期間分における複数種のサンプリングデータの関係を近似関係式で表すことにより、研削特性を表す値を演算する。近似関係式は、例えば、2種類のパラメータにより表されており、一次式、二次式または三次式等、比較的低次の関係式である。もちろん、近似関係式は、3種類以上のパラメータにより表されるようにしてもよい。
【0059】
研削特性を表す値は、近似関係式における微分値、極値、所定の軸成分がゼロである値等である。例えば、近似関係式が2種類のサンプリングデータにより一次式で表される場合には、研削特性を表す値は、当該一次の近似関係式の傾き(微分値)等である。つまり、サンプリングデータは、所定時間分のデータ群であるのに対して、研削特性を表す値は、一つの数値である。研削特性を表す値は、データ群(多数のデータの集合体)であるサンプリングデータとは異なり、サンプリングデータに基づいて整理されたデータとなる。
【0060】
研削特性を表す値の具体例として、砥石車16の切れ味、研削点に供給されるクーラントの動圧、工作物Wの静剛性等である。研削特性を表す値として、上記3種類の何れか一つを適用してもよいし、3種類全てを適用してもよい。さらに、研削特性を表す値として、上記3種類以外を含むようにすることもできる。
【0061】
砥石車16の切れ味およびクーラントの動圧は、砥石車16の状態を表す指標である。砥石車16の切れ味は、研削抵抗と単位時間当たり(工作物Wの1回転当たり)の切込量とをパラメータとする2次元座標系において、当該2種類のサンプリングデータ(データ群)の関係から得られる値である。砥石車16の切れ味は、当該切込量に代えて、単位時間当たり(工作物Wの1回転当たり)の工作物Wの除去体積をパラメータとしてもよい。
【0062】
クーラントの動圧も、砥石車16の切れ味と同様のパラメータを用いることができる。すなわち、クーラントの動作は、研削抵抗と単位時間当たり(工作物Wの1回転当たり)の切込量とをパラメータとする2次元座標系において、当該2種類のサンプリングデータ(データ群)の関係から得られる値である。クーラントの動圧は、当該切込量に代えて、単位時間当たり(工作物Wの1回転当たり)の工作物Wの除去体積をパラメータとしてもよい。
【0063】
工作物Wの静剛性は、研削抵抗と工作物Wの撓み量とをパラメータとする2次元座標系において、当該2種類のサンプリングデータ(データ群)の関係から得られる値である。工作物Wの撓み量は、砥石車16の送り位置や工作物Wの径から得ることも可能である。ここで、工作物Wが例えばクランクシャフト等の複雑形状である場合において、クランクピンの研削加工におけるクランクシャフトの静剛性を得ることができる。
【0064】
教師データ取得部150は、研削品質データを取得する研削品質データ取得部151と、砥石車16の表面状態データを取得する砥石車表面状態データ取得部152とを備える。
【0065】
研削品質データ取得部151は、外部装置2によって取得された複数の工作物Wに関する研削品質データを、教師有り学習の第一教師データとして取得する。つまり、研削品質データ取得部151は、例えば、加工変質層データ(研削焼け、研削による軟化層等に関するデータ)、表面性状データ(表面粗さ等のデータ)、びびり模様データ等を、第一教師データとして取得する。
【0066】
砥石車表面状態データ取得部152は、工作物W毎に研削後における砥石車16の表面状態データを、機械学習の第二教師データとして取得する。砥石車表面状態データ取得部152は、外部装置2によって取得された工作物Wの研削品質データに対応する砥石車16の表面状態データを取得する。
【0067】
砥石車16の表面状態データは、工作物Wの加工変質層の状態に対応する第一表面状態データ、工作物Wの表面性状に対応する第二表面状態データ、および、工作物Wのびびり模様状態に対応する第三表面状態データを含む。ただし、第一表面状態データは、加工変質層データそのものとしてもよいし、加工変質層データに基づいて演算したデータとしてもよい。また、第二表面状態データは、工作物Wの表面性状データそのものとしてもよいし、表面性状データに基づいて演算したデータとしてもよい。第三表面状態データは、びびり模様データそのものとしてもよいし、びびり模様データに基づいて演算したデータとしてもよい。
【0068】
第一学習モデル生成部160は、教師有り学習を行って、第一学習モデルを生成する。詳細には、第一学習モデル生成部160は、第一入力データ取得部130が取得した動作指令データおよびサンプリングデータ、並びに、研削特性演算部140により演算された研削特性を表す値を、第一学習用入力データとして取得する。また、第一学習モデル生成部160は、研削品質データ取得部151が取得した複数の工作物Wに関する研削品質データを、第一教師データとして取得する。そして、第一学習モデル生成部160は、第一学習用入力データおよび第一教師データを用いた機械学習により、工作物Wの研削品質を推定するための第一学習モデルを生成する。
【0069】
つまり、第一学習モデル生成部160は、動作指令データ、実動作データ、第一実測データ、第二実測データおよび研削特性を表す値を第一学習用入力データとし、且つ、研削品質データを第一教師データとする機械学習により、第一学習モデルを生成する。第一学習モデルは、第一学習用入力データと第一教師データとの関係を示すモデルである。
【0070】
ここで、サンプリングデータとしての、実動作データ、第一実測データおよび第二実測データは、工作物W毎の所定期間分のデータ群である。従って、1つの工作物Wに関するサンプリングデータだけでも、多量のデータとなる。さらに、複数の工作物Wに関するサンプリングデータとなれば、極めて多量のデータとなる。しかし、第一学習モデルは、機械学習を用いることによって、複数の工作物Wに関する多数のサンプリングデータを用いるとしても、容易に生成することができる。従って、後述するが、工作物Wの研削品質に影響を及ぼす多数のサンプリングデータを考慮して第一学習モデルを生成することで、結果として、工作物Wの研削品質を取得することができる。
【0071】
ただし、所定期間分のサンプリングデータは、データ群(多数のデータの集合体)であるため、種々の影響を受けている可能性がある。そこで、第一学習用入力データは、所定期間分のサンプリングデータのみならず、所定期間分のサンプリングデータから演算された研削特性を表す値を含んでいる。研削特性を表す値は、サンプリングデータに基づいて整理されたデータである。また、研削特性を表す値は、直接的な計測が困難である。
【0072】
つまり、第一学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。このように、整理された研削特性を表す値を用いることにより、第一学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、研削品質を推定する際において、推定される研削品質は、研削特性を十分に考慮した結果となり、より高精度な結果となる。さらに、直接的な計測が困難な研削特性を、サンプリングデータからの演算により把握している。計測だけでは得ることが難しい研削特性を学習データとして活用することで、より高精度な研削品質が得られる。
【0073】
ここで、第一学習モデルは、工作物Wの研削品質として、例えば、工作物Wの加工変質層の状態、工作物Wの表面性状、および、工作物Wのびびり模様状態を推定するためのモデルである。ただし、第一学習モデルは、これら全ての研削品質を推定する場合に限られず、これらの一部のみの研削品質を推定するようにしてもよい。そして、第一学習モデル生成部160によって生成された第一学習モデルは、第一学習モデル記憶部170に記憶される。
【0074】
また、取得する所定期間が、研削初期から研削終期までである場合には、第一学習モデルは、全ての研削工程を考慮したモデルとなる。一方、取得する所定期間が、例えば粗研の初期から粗研の終期までである場合には、第一学習モデルは、粗研工程のみを考慮した学習モデルとなる。研削品質に影響を及ぼす工程を特定したい場合には、工程毎に第一学習モデルを取得するようにしてもよい。
【0075】
第二学習モデル生成部180は、教師有り学習を行って、第二学習モデルを生成する。詳細には、第二学習モデル生成部180は、第一入力データ取得部130が取得した動作指令データおよびサンプリングデータ、並びに、研削特性演算部140により演算された研削特性を表す値を、第一学習用入力データとして取得する。また、第二学習モデル生成部180は、砥石車表面状態データ取得部152が取得した工作物W毎の砥石車16の表面状態データを、第二教師データとして取得する。第二学習モデル生成部180は、第一学習用入力データおよび第二教師データを用いた機械学習により、砥石車16の表面状態を推定するための第二学習モデルを生成する。
【0076】
つまり、第二学習モデル生成部180は、動作指令データ、実動作データ、第一実測データ、第二実測データおよび研削特性を表す値を第一学習用入力データとし、且つ、砥石車表面状態データを第二教師データとする機械学習により、第二学習モデルを生成する。第二学習モデルは、第一学習用入力データと第二教師データとの関係を示すモデルである。多数のサンプリングデータが存在するとしても、機械学習を適用することにより第二学習モデルの生成が可能となる。また、整理された研削特性を表す値を用いることにより、第二学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、砥石車16の表面状態を推定する際において、推定される表面状態は、研削特性を十分に考慮した結果となり、より高精度な結果となる。
【0077】
第二学習モデルは、砥石車16の表面状態として、工作物の研削品質に影響を及ぼす程度を推定するためのモデルである。この第二学習モデルは、砥石車16の表面状態として、砥石車16の目つぶれ、目詰まり、目こぼれ等が生じている状態、砥石車16の目立てすぎの状態等を推定するためのモデルである。
【0078】
例えば、第二学習モデルは、砥石車16の表面状態として、工作物Wの加工変質層の状態に対応する第一表面状態、工作物Wの表面性状に対応する第二表面状態、および、工作物Wのびびり模様状態に対応する第三表面状態を推定するためのモデルである。ただし、第二学習モデルは、これら全ての表面状態を推定する場合に限られず、これらの一部のみの表面状態を推定するようにしてもよい。そして、第二学習モデル生成部180によって生成された第二学習モデルは、第二学習モデル記憶部190に記憶される。
【0079】
(4.第二学習フェーズ102の詳細構成)
機械学習装置100の第二学習フェーズ102の詳細構成について、図3を参照して説明する。第二学習フェーズ102の構成は、動作指令データ取得部110と、研削品質データ取得部151と、砥石車表面状態データ取得部152と、研削サイクル時間演算部210と、砥石車形状情報取得部220と、報酬決定部230と、第三学習モデル生成部240と、第三学習モデル記憶部250とを備えて構成される。
【0080】
第二学習フェーズ102において用いる第二学習用入力データ、第一評価結果データおよび第二評価結果データは、表2に示すとおりである。
【0081】
【表2】
【0082】
動作指令データ取得部110は、複数の工作物Wに関する動作指令データを、機械学習の第二学習用入力データとして取得する。また、研削品質データ取得部151は、当該複数の工作物Wに関する研削品質データを、機械学習の第一評価結果データとして取得する。砥石車表面状態データ取得部152は、工作物W毎の研削後における砥石車16の表面状態データを、機械学習の第二評価結果データとして取得する。ここで、表2に示すように、第二学習用入力データは、多数のデータとしているが、表2に示す全てのデータを用いる必要はなく、一部のデータのみを用いるようにしてもよい。
【0083】
研削サイクル時間演算部210は、1個の工作物W当たりの研削サイクル時間を演算する。研削サイクル時間には、複数の工作物Wの研削に要する時間、前記研削において砥石車16の交換に要する時間、前記研削において砥石車16のドレッシングに要する時間、および、前記研削において砥石車16のツルーイングに要する時間の合計を、工作物Wの数で除算した値である。つまり、砥石車16の交換回数が少ないほど、砥石車16のドレッシングの回数が少ないほど、さらには、砥石車16のツルーイングの回数が少ないほど、研削サイクル時間が短くなる。
【0084】
砥石車形状情報取得部220は、砥石車16の形状情報を取得する。砥石車形状情報取得部220は、砥石車修正装置18により測定された砥石車16の寸法(径)を取得する。つまり、砥石車形状情報取得部220は、砥石車修正装置18によって、砥石車16のツルーイングまたはドレッシングが行われるときに取得される。さらに、砥石車形状情報取得部220は、砥石車16の形状情報として、砥石車16の寸法変化、および、砥石車16の形崩れを取得することができる。
【0085】
報酬決定部230は、第二学習用入力データである動作指令データ、第一評価結果データである研削品質データ、および、第二評価結果データである砥石車16の表面状態データを取得して、研削品質データおよび表面状態データに応じて、動作指令データに対する報酬を決定する。ここで、報酬は、強化学習において、動作指令データの組み合わせに対する報酬である。
【0086】
そして、報酬決定部230において、当該動作指令データに対応する研削品質データが望ましい結果を導き出した時に、当該動作指令データに対して多くの報酬が付与され、望ましくない結果を導き出した時に、当該動作指令データに対して少ない報酬(マイナスの報酬を含む)が付与される。
【0087】
例えば、報酬決定部230は、工作物Wの加工変質層データにおいて、加工変質層が無い場合に報酬を多くし、加工変質層が有る場合に報酬を少なくする。また、報酬決定部230は、工作物Wの表面性状データが所定閾値以下の場合に報酬を多くし、表面性状データが所定閾値より大きい場合に報酬を少なくする。さらに、報酬決定部230は、工作物Wのびびり模様データにおいて、びびり模様が無しの場合に報酬を多くし、びびり模様が有りの場合に報酬を少なくする。なお、報酬決定部230は、加工変質層データ、表面性状データ、および、びびり模様データの全てに基づいて報酬を決定してもよいし、これらの何れかのみに基づいて報酬を決定してもよい。
【0088】
さらに、報酬決定部230において、当該動作指令データに対応する表面状態データが望ましい結果を導き出した時に、当該動作指令データに対して多くの報酬が付与され、望ましくない結果を導き出した時に、当該動作指令データに対して少ない報酬が付与される。
【0089】
例えば、報酬決定部230は、第一表面状態データに対応する加工変質層が無い場合に報酬を多くし、加工変質層が有る場合に報酬を少なくする。また、報酬決定部230は、第二表面状態データに対応する工作物Wの表面性状データが所定閾値以下の場合に報酬を多くし、表面性状が所定閾値より大きい場合に報酬を少なくする。また、報酬決定部230は、第三表面状態データに対応するびびり模様が無しの場合に報酬を多くし、びびり模様が有りの場合に報酬を少なくする。
【0090】
さらに、報酬決定部230は、研削サイクル時間演算部210によって演算された研削サイクル時間を取得し、研削サイクル時間に応じて、動作指令データに対する報酬を決定する。詳細には、報酬決定部230は、研削サイクル時間が短くなるほど報酬を多くする。つまり、報酬決定部230は、砥石車16の交換に要する時間、砥石車16のドレッシングに要する時間、および、砥石車16のツルーイングに要する時間の少なくとも一つが短くなるほど、報酬を多くする。
【0091】
さらに、報酬決定部230は、砥石車形状情報取得部220が取得した砥石車16の形状情報に基づいて、報酬を決定する。詳細には、報酬決定部230は、砥石車16の寸法変化が小さくなるほど、砥石車16の形崩れが小さくなるほど、報酬を多くする。
【0092】
第三学習モデル生成部240は、機械学習により、報酬を多くするように動作指令データを調整するための第三学習モデルを生成する。第三学習モデル生成部240において、強化学習として、例えば、Q学習、Sarsa、モンテカルロ法等が適用される。
【0093】
ここで、調整前の動作指令データが、第一の工作物Wに関するデータであり、調整後の動作指令データが、第二の工作物Wに関するデータであるとする。第一の工作物Wに関する動作指令データと当該第一の工作物Wの研削品質データとの関係を、第一データ関係とする。第二の工作物Wの動作指令データと当該第二の工作物Wの研削品質データとの関係を、第二データ関係とする。
【0094】
そして、第三学習モデルは、調整前である第一データ関係と調整後である第二データ関係との相互関係を表すモデルである。第三学習モデル生成部240は、調整後である第二の工作物Wの研削品質データが調整前である第一の工作物Wの研削品質データより良好となるように、すなわち報酬が多くなるように、調整前である第一の工作物Wの動作指令データから調整後である第二の工作物Wの動作指令データへの調整方法を学習する。
【0095】
ただし、調整後の動作指令データは、調整前の動作指令データに対して、予め設定された制約の範囲内で調整可能とされている。例えば、調整可能なパラメータの一つである指令切込速度においては、調整後の指令切込速度は、調整前の指令切込速度に対して所定割合(例えば±3%)内に制限されている。所定割合は、任意に設定可能である。その他の調整可能なパラメータについても同様である。また、調整可能なパラメータを設定することも可能である。そして、生成された第三学習モデルは、第三学習モデル記憶部250に記憶される。
【0096】
また、第三学習モデルにおいて、砥石車16の表面状態データについても、研削品質データと同様に用いられる。すなわち、第三学習モデル生成部240は、調整後である第二の工作物Wの研削を行った場合の砥石車16の表面状態データが、調整前である第一の工作物Wの研削を行った場合の砥石車16の表面状態データより良好となるように、すなわち報酬が多くなるように、調整前である第一の工作物Wの動作指令データから調整後である第二の工作物Wの動作指令データへの調整方法を学習する。
【0097】
なお、第三学習モデル生成部240は、後述する更新フェーズ104においても第三学習モデルを学習することも可能である。この場合、第一評価結果データである研削品質データは、推定フェーズ103により得られた研削品質データを用いる。また、第二評価結果データである砥石車16の表面状態データは、推定フェーズ103により得られた表面状態データを用いる。
【0098】
(5.推定フェーズ103の詳細構成)
機械学習装置100の推定フェーズ103の詳細構成について、図4を参照して説明する。推定フェーズ103の構成が、研削加工に関する推定装置に相当する。推定フェーズ103の構成は、第一入力データ取得部130と、第一学習モデル記憶部170と、第二学習モデル記憶部190と、推定部310と、判別部320とを備えて構成される。
【0099】
推定部310は、研削品質推定部311および砥石車表面状態推定部312を備える。研削品質推定部311は、新たな工作物Wの研削を行っている際の所定期間分の第一入力データ、および、研削特性演算部140により演算される研削特性を表す値を、推定用入力データとして取得する。つまり、推定用入力データは、動作指令データ、サンプリングデータ、および、研削特性を表す値を含む。そして、研削品質推定部311は、推定用入力データを入力し、第一学習モデル記憶部170に記憶されている第一学習モデルを用いることで、新たな工作物Wの研削品質を推定する。
【0100】
ここで、第一学習モデルは、上述したように、第一学習用入力データと、第一教師データとの関係を示すモデルである。そして、第一学習モデルは、第一教師データである研削品質データとして、工作物Wの加工変質層の状態、工作物Wの表面性状、および、工作物Wのびびり模様状態に関するモデルである。
【0101】
そこで、研削品質推定部311は、研削品質として、工作物Wの加工変質層の状態、工作物Wの表面性状、および、工作物Wのびびり模様状態を推定する。ただし、研削品質推定部311は、当該全ての研削品質を推定するのではなく、一部の研削品質のみを推定するようにしてもよい。例えば、研削品質推定部311は、加工変質層の状態のみを推定するようにしてもよい。この場合、第一学習モデルが、加工変質層の状態のみを推定するようなモデルとして生成されていることになる。
【0102】
第一学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。整理された研削特性を表す値を用いることにより、第一学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、推定される研削品質は、研削特性を十分に考慮した結果となり、より高精度な結果となる。
【0103】
砥石車表面状態推定部312は、新たな工作物Wの研削を行っている際の所定期間分の第一入力データ、および、研削特性演算部140により演算される研削特性を表す値を、推定用入力データとして取得する。つまり、推定用入力データは、動作指令データ、サンプリングデータ、および、研削特性を表す値を含む。そして、砥石車表面状態推定部312は、推定用入力データを入力し、第二学習モデル記憶部190に記憶されている第二学習モデルを用いることで、新たな工作物Wの研削を行った場合の砥石車16の表面状態を推定する。ここで、第二学習モデルは、上述したように、第一学習用入力データと、第二教師データとの関係を示すモデルである。
【0104】
そこで、砥石車表面状態推定部312は、砥石車16の表面状態として、工作物Wの研削品質に影響を及ぼす程度を推定する。例えば、砥石車表面状態推定部312は、砥石車16の表面状態として、工作物Wの加工変質層の状態に対応する第一表面状態、工作物Wの表面性状に対応する第二表面状態、および、工作物Wのびびり模様状態に対応する第三表面状態を推定する。ただし、砥石車表面状態推定部312は、当該全ての砥石車16の表面状態を推定するのではなく、一部の表面状態のみを推定するようにしてもよい。例えば、砥石車表面状態推定部312は、第一表面状態のみを推定するようにしてもよい。この場合、第二学習モデルが、第一表面状態のみを推定するようなモデルとして生成されていることになる。
【0105】
第二学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。このように、整理された研削特性を表す値を用いることにより、第二学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、推定される砥石車16の表面状態は、研削特性を十分に考慮した結果となり、より高精度な結果となる。
【0106】
判別部320は、研削品質推定部311により推定された工作物Wの研削品質に基づいて工作物Wの良否を判別する。例えば、判別部320は、推定された加工変質層の状態に基づいて、工作物Wに加工変質層が存在している(所定条件を満たしていない)と判別された場合には、当該工作物Wは不良品と判別する。また、判別部320は、推定された表面性状が所定条件を満たしていないと判別された場合には、当該工作物Wは不良品と判別する。また、判別部320は、推定されたびびり模様状態に基づいて、びびり模様が存在している(所定条件を満たしていない)と判別された場合には、当該工作物Wは不良品と判別する。
【0107】
一方、判別部320は、加工変質層の状態、表面性状、および、びびり模様状態に関して各条件を満たす場合に、当該工作物Wは良品と判別する。このように、機械学習を適用して生成された第一学習モデルを用いることにより、複数の条件について、容易に判別することができる。
【0108】
さらに、判別部320は、砥石車表面状態推定部312により推定された砥石車16の表面状態に基づいて、砥石車16のツルーイングの実行、砥石車16のドレッシングの実行、および、砥石車16の交換の実行の少なくとも一つを判別する。例えば、判別部320は、推定された加工変質層の状態に対応する第一表面状態に基づいて、工作物Wに加工変質層が存在している(所定条件を満たしていない)と判別された場合には、砥石車16のドレッシングを実行するべきと判別する。また、判別部320は、推定された表面性状に対応する第二表面状態が所定条件を満たしていないと判別された場合には、砥石車16のツルーイングを実行するべきと判別する。また、判別部320は、推定されたびびり模様状態に対応する第三表面状態に基づいて、びびり模様が存在している(所定条件を満たしていない)と判別された場合には、砥石車16のドレッシングを実行するべきと判別する。
【0109】
一方、判別部320は、第一表面状態、第二表面状態および第三表面状態に関して各条件を満たす場合に、砥石車16は良好な状態であると判別する。この場合、砥石車16に対してドレッシングおよびツルーイングは不要であると判別されることになる。このように、機械学習を適用して生成された第二学習モデルを用いることにより、複数の条件について、容易に判別することができる。
【0110】
(6.更新フェーズ104の詳細構成)
機械学習装置100の更新フェーズ104の詳細構成について、図4を参照して説明する。更新フェーズ104の構成が、研削加工に関する動作指令データ更新装置に相当する。更新フェーズ104の構成は、動作指令データ取得部110と、研削品質推定部311と、砥石車表面状態推定部312と、研削サイクル時間演算部210と、砥石車形状情報取得部220と、報酬決定部230と、第三学習モデル記憶部250と、動作指令データ調整部330とを備えて構成される。
【0111】
動作指令データ取得部110は、新たな工作物Wの研削における各データを取得し、第二学習フェーズ102において説明した内容と実質的に同一である。また、研削サイクル時間演算部210、および、砥石車形状情報取得部220も、第二学習フェーズ102において説明した内容と実質的に同一である。また、研削品質推定部311、および、砥石車表面状態推定部312は、推定フェーズ103にて説明した内容と同一である。すなわち、研削品質推定部311、および、砥石車表面状態推定部312は、新たな工作物Wの研削における工作物Wの研削品質および砥石車16の表面状態を推定する。
【0112】
報酬決定部230は、新たな工作物Wの研削において取得した動作指令データ、研削品質、および、砥石車16の表面状態を用いて、報酬を決定する。すなわち、報酬決定部230は、新たな工作物Wの研削に関して、研削品質および砥石車16の表面状態に応じて、動作指令データに対する報酬を決定する。さらに、報酬決定部230は、研削サイクル時間および砥石車16の形状情報に応じて、動作指令データに対する報酬を決定する。第三学習モデル記憶部250は、第二学習フェーズ102において説明したように、第三学習モデル生成部240によって生成された第三学習モデルを記憶する。
【0113】
動作指令データ調整部330は、新たな工作物Wの研削に関する動作指令データ、推定された新たな工作物Wの研削品質、新たな工作物Wの研削を行った場合の推定された砥石車16の表面状態、報酬、および、第三学習モデルを用いて、動作指令データの調整方法を決定し、決定した調整方法に基づいて動作指令データの調整を行う。ここで、第三学習モデルは、報酬が多くなるように、調整前の動作指令データから調整後の動作指令データへの調整方法を学習することによって生成されたモデルである。
【0114】
詳細には、動作指令データ調整部330は、現在の動作指令データを調整前の動作指令データとして取得し、そのときの報酬を取得する。この場合に、動作指令データ調整部330は、現在の動作指令データと、現在の動作指令データに対する報酬と、第三学習モデルとを用いて、調整すべき動作指令データを決定する。つまり、調整すべき動作指令データは、現在の動作指令データにおける報酬よりも多くの報酬となるような動作指令データとなる。
【0115】
動作指令データ調整部330の処理において、調整すべき動作指令データとして、報酬が同等となる複数の候補が出力される場合がある。この場合には、例えば、動作指令データ調整部330は、調整するパラメータの優先順位を設定することにより、複数の候補に対して順位付けを行うことができる。例えば、調整するパラメータの優先順位とは、第一位を指令切込速度とし、第二位を工作物Wの指令回転速度とする等である。
【0116】
そして、動作指令データ調整部330は、第一位の候補を、調整すべき動作指令データと決定し、現在の動作指令データを当該調整すべき動作指令データに更新する。そうすると、研削盤1は、更新された動作指令データに基づいて工作物Wの研削を行う。そして、機械学習装置100の更新フェーズ104において、当該工作物Wの研削における各データに基づいて、再び、次の研削における動作指令データを調整する。なお、動作指令データの調整の頻度を設定することもできる。例えば、設定数の工作物Wを研削した後に、動作指令データを調整するようにしてもよい。
【0117】
つまり、機械学習装置100の機械学習により生成された第三学習モデルを用いて動作指令データが更新される。そのため、研削状態が変化したとしても、動作指令データが現在の研削状態に応じて更新されていく。このように動作指令データが更新されることによって、工作物Wの研削品質を良好とすることができる。
【0118】
さらに、動作指令データが更新されることによって、砥石車16の表面状態に応じた研削を行うことができる。すなわち、動作指令データが更新されることによって、砥石車16の表面状態が良好となる。砥石車16の表面状態を良好とすることにより、工作物Wの研削品質を向上させることにつながる。さらに、動作指令データが更新されることによって、砥石車16の交換に要する時間、砥石車16のドレッシングに要する時間、および、砥石車16のツルーイングに要する時間が少なくなる。結果として、研削サイクル時間が短くなる。さらに、動作指令データが更新されることによって、砥石車16の寸法変化が小さくなり、砥石車16の形崩れが小さくなる。
【0119】
特に、更新フェーズ104においては、推定フェーズ103にて推定された工作物Wの研削品質および砥石車16の表面状態を用いて処理される。つまり、研削特性を十分に考慮した結果としての研削品質または砥石車の表面状態を用いて、動作指令データの調整を行うための第三学習モデルを生成し、動作指令データの更新を行うことができる。従って、工作物Wの研削品質および砥石車の表面状態に応じて、動作指令を適切に更新することができる。
【0120】
(7.その他)
上記の機械学習装置100は、第一学習モデルの生成、第二学習モデルの生成、工作物Wの研削品質の推定、工作物Wの良否の判別、砥石車16の表面状態の推定、砥石車16のツルーイングの実行の判別、砥石車16のドレッシングの実行の判別、砥石車16の交換の実行の判別、動作指令データの更新の全てを行う場合について説明した。この他に、機械学習装置100は、上記処理の何れかの要素のみを行う装置として適用することもできる。その場合、機械学習装置100は、当該要素に対応する構成のみを備える。
【符号の説明】
【0121】
1:研削盤、2:外部装置、12:主軸台(構造部材)、12a,14a,15a,16a:モータ(駆動装置)、13:心押台(構造部材)、14:トラバースベース(構造部材、移動体)、15:砥石台(構造部材、移動体)、16:砥石車、17:定寸装置(駆動装置)、18:砥石車修正装置(駆動装置)、19:クーラント装置、20:制御装置、21,22,23:センサ、100:機械学習装置、101:第一学習フェーズ(学習モデル生成装置)、102:第二学習フェーズ(学習モデル生成装置)、103:推定フェーズ(推定装置)、104:更新フェーズ(更新装置)、110:動作指令データ取得部、120:サンプリングデータ取得部、121:実動作データ取得部、122:第一実測データ取得部、123:第二実測データ取得部、130:第一入力データ取得部、140:研削特性演算部、150:教師データ取得部、151:研削品質データ取得部、152:砥石車表面状態データ取得部、160:第一学習モデル生成部、170:第一学習モデル記憶部、180:第二学習モデル生成部、190:第二学習モデル記憶部、210:研削サイクル時間演算部、220:砥石車形状情報取得部、230:報酬決定部、240:第三学習モデル生成部、250:第三学習モデル記憶部、310:推定部、311:研削品質推定部、312:砥石車表面状態推定部、320:判別部、330:動作指令データ調整部、W:工作物
図1
図2
図3
図4