特許7225626 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ジェイテクトの特許一覧

特許7225626研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-02-13

(45)【発行日】2023-02-21

(54)【発明の名称】研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置

(51)【国際特許分類】

B24B 49/00 20120101AFI20230214BHJP

G05B 19/4155 20060101ALI20230214BHJP

【ＦＩ】

B24B49/00

G05B19/4155 V

【請求項の数】 8

(21)【出願番号】P 2018175569

(22)【出願日】2018-09-20

(65)【公開番号】P2020044620

(43)【公開日】2020-03-26

【審査請求日】2021-08-17

(73)【特許権者】

【識別番号】000001247

【氏名又は名称】株式会社ジェイテクト

(74)【代理人】

【識別番号】110000648

【氏名又は名称】弁理士法人あいち国際特許事務所

(74)【代理人】

【識別番号】110000604

【氏名又は名称】弁理士法人共立特許事務所

(72)【発明者】

【氏名】増田祐生

(72)【発明者】

【氏名】河原徹

(72)【発明者】

【氏名】村上慎二

【審査官】山内康明

(56)【参考文献】

【文献】特開平０４－１３８５０４（ＪＰ，Ａ）

【文献】特開２０１４－２２６７４１（ＪＰ，Ａ）

【文献】特開２００１－１４７９１２（ＪＰ，Ａ）

【文献】特開２０１８－０４１２０８（ＪＰ，Ａ）

【文献】特開２０１７－０４５３００（ＪＰ，Ａ）

【文献】特開２０１７－０３００６７（ＪＰ，Ａ）

【文献】中国特許出願公開第１０９２４９３００（ＣＮ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｂ２４Ｂ４９／００

Ｇ０５Ｂ１９／４１５５

(57)【特許請求の範囲】

【請求項1】

研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、
前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、
前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記工作物の加工変質層、前記工作物の表面性状、または前記工作物のびびり模様状態を、前記工作物の研削品質として、推定するための第一学習モデルを生成する第一学習モデル生成部と、
を備える、研削加工に関する学習モデル生成装置。

【請求項2】

研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、
前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、
前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記砥石車に目つぶれ、目詰まり、または目こぼれが生じている状態である前記砥石車の表面状態を推定するための第二学習モデルを生成する第二学習モデル生成部と、
を備える、研削加工に関する学習モデル生成装置。

【請求項3】

前記サンプリングデータ取得部は、前記実動作データ、前記第一実測データおよび前記第二実測データの中から、研削抵抗に関するデータとおよび単位時間当たりの切込量に関するデータとを取得し、
前記研削特性演算部は、前記研削抵抗に関するデータおよび前記単位時間当たりの切込量に関するデータに基づいて、前記研削特性を表す値として、前記砥石車の切れ味または前記研削点に供給されるクーラントの動圧を演算する、請求項１または２に記載の研削加工に関する学習モデル生成装置。

【請求項4】

前記サンプリングデータ取得部は、前記実動作データ、前記第一実測データおよび前記第二実測データの中から、研削抵抗に関するデータとおよび前記工作物の撓み量に関するデータとを取得し、
前記研削特性演算部は、前記研削抵抗に関するデータおよび前記工作物の撓み量に関するデータに基づいて、前記研削特性を表す値として、前記工作物の静剛性を演算する、請求項１または２に記載の研削加工に関する学習モデル生成装置。

【請求項5】

前記研削特性演算部は、前記所定期間分における複数種の前記サンプリングデータの関係を近似関係式で表すことにより、前記研削特性を表す値を演算する、請求項１～４のいずれか１項に記載の研削加工に関する学習モデル生成装置。

【請求項6】

請求項１に記載の前記学習モデル生成装置により生成された前記第一学習モデルを記憶する第一学習モデル記憶部と、
前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第一学習モデルとを用いて、前記新たな工作物の前記研削品質を推定する研削品質推定部と、
を備える、研削加工に関する推定装置。

【請求項7】

請求項２に記載の前記学習モデル生成装置により生成された前記第二学習モデルを記憶する第二学習モデル記憶部と、
前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第二学習モデルとを用いて、前記新たな工作物の研削を行った場合における前記砥石車の表面状態を推定する表面状態推定部と、
を備える、研削加工に関する推定装置。

【請求項8】

研削盤にて砥石車により工作物の研削を行う際において、前記研削盤の制御装置への動作指令データを前記工作物毎に取得する動作指令データ取得部と、
前記工作物毎に、前記工作物の研削品質または前記砥石車の表面状態に応じて前記動作指令データに対する報酬を決定する報酬決定部と、
複数の前記工作物に関する前記動作指令データおよび前記報酬を用いた機械学習により、前記報酬を多くするように前記動作指令データを調整するための第三学習モデルを記憶する第三学習モデル記憶部と、
前記工作物と同種の新たな工作物の研削に関する前記動作指令データと、請求項６または７に記載の前記推定装置により推定された前記研削品質または前記表面状態、前記報酬と、前記第三学習モデルとを用いて、前記動作指令データの調整を行う動作指令データ調整部と、
を備える、研削加工に関する動作指令データ更新装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、研削加工に関する学習モデル生成装置、推定装置および動作指令データ更新装置に関するものである。

【背景技術】

【0002】

研削盤にて砥石車による工作物の研削において、工作物の研削品質が所定条件を満たすようにすることが求められる。例えば、工作物に加工変質層が生じないようにすること、工作物の表面性状（例えば表面粗さ）が所定値以内であること、工作物にびびり模様が生じないようにすること等が求められる。

【0003】

作業者が、研削後の工作物の検査を行うことで、研削品質が所定条件を満たすか否かを確認し、所定条件を満たす場合に良品とすることが行われている。また、特許文献１には、研削を行っている際において測定した研削負荷に基づいて、工作物に加工変質層が生じているか否かを判定することが記載されている。

【0004】

また、研削盤にて砥石車による工作物の研削において、砥石車の切れ味を維持するために、砥石車の表面のツルーイングおよびドレッシングが行われる。砥石車の切れ味が低下すると、工作物の品質が低下するおそれがある。そこで、ツルーイングおよびドレッシングは、研削した工作物の数が所定数に達した度に行われており、工作物の品質が低下しないように所定数が決定されている。しかし、作業者によって決定されるため、切れ味が低下したにも関わらず、研削が継続して行われるおそれがあり、工作物の品質の低下のおそれがあった。

【0005】

そこで、特許文献２には、主軸ヘッドに取り付けられた振動検出器によって主軸ヘッドの振動を検出し、主軸の振幅が工作物の研削面の研削精度に応じて予め設定された設定値に達した後に、研削作業を停止して砥石車のドレッシングを行うことが記載されている。

【0006】

ところで、近年コンピュータの処理速度の向上に伴い、人工知能が急速に発展しており、例えば、特許文献３には、機械学習により、レーザ加工条件データを生成することが記載されている。

【先行技術文献】

【特許文献】

【0007】

【文献】特開２０１３－１２９０２８号公報

【文献】特開２００２－３０７３０４号公報

【文献】特開２０１７－１６４８０１号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかし、特許文献１に記載されているように、研削負荷を用いるだけでは、加工変質層の有無を高精度に判定することができない。加工変質層が生じる要因には、種々の要因が存在するためである。種々の要因の中には、センサによる計測や機器からのデータ取得が容易なものとは異なり、計測自体が困難な要因もある。そこで、種々の要因を考慮して、加工変質層の有無等の工作物の研削品質を取得することが求められる。さらに、工作物の研削品質が良好となるような研削条件を得ることが求められる。

【0009】

また、特許文献２に記載されているように、主軸ヘッドの振動が設定値に達したか否かだけでは、砥石車の切れ味を十分に判定できない。その結果、砥石車の修正（ツルーイングおよびドレッシング）のタイミングを適切に判定できない。そこで、瞬間的な振動情報のみではなく、より多くの情報を用いて、砥石車の表面状態を判定することが求められる。

【0010】

本発明は、工作物の研削品質を取得することができる学習モデル生成装置、および、工作物の研削品質を推定する推定装置を提供することを目的の一つとする。また、本発明は、研削品質を向上させることができるように動作指令データを更新する動作指令データ更新装置を提供することを目的の一つとする。

【0011】

また、本発明は、砥石車の表面状態を取得することができる学習モデル生成装置、および、砥石車の表面状態を推定する推定装置を提供することを目的の一つとする。また、本発明は、砥石車の表面状態を良好とすることができるように動作指令データを更新する動作指令データ更新装置を提供することを目的の一つとする。

【課題を解決するための手段】

【0012】

（１．第一の学習モデル生成装置）
第一の学習モデル生成装置は、研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記工作物の加工変質層、前記工作物の表面性状、または前記工作物のびびり模様状態を、前記工作物の研削品質として、推定するための第一学習モデルを生成する第一学習モデル生成部とを備える。

【0013】

（２．第二の学習モデル生成装置）
第二の学習モデル生成装置は、研削盤にて砥石車により工作物の研削を行う際におけるサンプリングデータであって、前記研削盤の駆動装置の駆動電流または駆動位置に関する実動作データ、前記研削盤の構造部材の振動または変形量を表す第一実測データ、および、研削時の前記工作物の寸法または研削点温度に関する第二実測データの少なくとも一つである前記サンプリングデータを、前記工作物毎に所定期間分取得するサンプリングデータ取得部と、前記所定期間分の前記サンプリングデータに基づいて、前記砥石車の切れ味、研削点に供給されるクーラントの動圧、または前記工作物の静剛性を、研削特性を表す値として演算する研削特性演算部と、前記所定期間分の前記サンプリングデータおよび前記研削特性を表す値を第一学習用入力データとする機械学習により、前記砥石車に目つぶれ、目詰まり、または目こぼれが生じている状態である前記砥石車の表面状態を推定するための第二学習モデルを生成する第二学習モデル生成部とを備える。

【0014】

（３．第一の推定装置）
第一の推定装置は、上記第一の学習モデル生成装置により生成された前記第一学習モデルを記憶する第一学習モデル記憶部と、前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第一学習モデルとを用いて、前記新たな工作物の前記研削品質を推定する研削品質推定部とを備える。

【0015】

（４．第二の推定装置）
第二の推定装置は、上記第二の学習モデル生成装置により生成された前記第二学習モデルを記憶する第二学習モデル記憶部と、前記工作物と同種の新たな工作物の研削を行っている際の所定期間分の前記サンプリングデータである推定用入力データと前記第二学習モデルとを用いて、前記新たな工作物の研削を行った場合における前記砥石車の表面状態を推定する表面状態推定部とを備える。

【0016】

（５．動作指令データ更新装置）
動作指令データ更新装置は、研削盤にて砥石車により工作物の研削を行う際において、前記研削盤の制御装置への動作指令データを前記工作物毎に取得する動作指令データ取得部と、前記工作物毎に、前記工作物の研削品質または前記砥石車の表面状態に応じて前記動作指令データに対する報酬を決定する報酬決定部と、複数の前記工作物に関する前記動作指令データおよび前記報酬を用いた機械学習により、前記報酬を多くするように前記動作指令データを調整するための第三学習モデルを記憶する第三学習モデル記憶部と、前記工作物と同種の新たな工作物の研削に関する前記動作指令データと、上記第一の推定装置または第二の推定装置により推定された前記研削品質または前記表面状態、前記報酬と、前記第三学習モデルとを用いて、前記動作指令データの調整を行う動作指令データ調整部とを備える。

【0017】

（６．効果）
第一、第二学習モデルは、機械学習により生成されている。機械学習における第一学習用入力データは、所定期間分のサンプリングデータのみならず、所定期間分のサンプリングデータから演算された研削特性を表す値を含んでいる。所定期間分のサンプリングデータは、データ群（多数のデータの集合体）であり、種々の影響を受けている可能性がある。一方、研削特性を表す値は、サンプリングデータに基づいて整理されたデータにできる。また、研削特性を表す値は、直接的な計測が困難である。

【0018】

つまり、第一、第二学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。このように、整理された研削特性を表す値を用いることにより、第一、第二学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、推定される研削品質または砥石車の表面状態は、研削特性を十分に考慮した結果となり、より高精度な結果となる。さらに、直接的な計測が困難な研削特性を、サンプリングデータからの演算により把握している。計測だけでは得ることが難しい研削特性を学習データとして活用することで、より高精度な研削品質が得られる。

【0019】

また、動作指令データ更新装置は、上述により推定された研削品質または砥石車の表面状態を用いて処理される。つまり、研削特性を十分に考慮した結果としての研削品質または砥石車の表面状態を用いて、動作指令データの調整を行うための第三学習モデルを生成し、動作指令データの更新を行うことができる。従って、工作物の研削品質または砥石車の表面状態に応じて、動作指令を適切に更新することができる。

【図面の簡単な説明】

【0020】

【図1】研削盤を示す平面図である。

【図2】機械学習装置の概要構成を示す機能ブロック図である。

【図3】機械学習装置の第一、第二学習フェーズの詳細構成を示す機能ブロック図である。

【図4】機械学習装置の推定フェーズおよび更新フェーズの詳細構成を示す機能ブロック図である。

【発明を実施するための形態】

【0021】

（１．研削盤の構成）
研削盤１の構成について、図１を参照して説明する。研削盤１は、工作物Ｗを研削するための機械である。研削盤１は、円筒研削盤、カム研削盤等、種々の構成の研削盤を適用できる。本実施形態においては、研削盤１は、砥石台トラバース型の円筒研削盤を例にあげる。ただし、研削盤１は、テーブルトラバース型を適用することもできる。

【0022】

研削盤１は、主として、ベッド１１、主軸台１２、心押台１３、トラバースベース１４、砥石台１５、砥石車１６、定寸装置１７、砥石車修正装置１８、クーラント装置１９、および、制御装置２０を備える。

【0023】

ベッド１１は、設置面上に固定されている。主軸台１２は、ベッド１１の上面において、Ｘ軸方向の手前側（図１の下側）且つＺ軸方向の一端側（図１の左側）に設けられている。主軸台１２は、工作物ＷをＺ軸回りに回転可能に支持する。工作物Ｗは、主軸台１２に設けられたモータ１２ａの駆動により回転される。心押台１３は、ベッド１１の上面において、主軸台１２に対してＺ軸方向に対向する位置、すなわち、Ｘ軸方向の手前側（図１の下側）且つＺ軸方向の他端側（図１の右側）に設けられている。つまり、主軸台１２および心押台１３が、工作物Ｗを回転可能に両端支持する。

【0024】

トラバースベース１４は、ベッド１１の上面において、Ｚ軸方向に移動可能に設けられている。トラバースベース１４は、ベッド１１に設けられたモータ１４ａの駆動により移動する。砥石台１５は、トラバースベース１４の上面において、Ｘ軸方向に移動可能に設けられている。砥石台１５は、トラバースベース１４に設けられたモータ１５ａの駆動により移動する。砥石車１６は、砥石台１５に回転可能に支持されている。砥石車１６は、砥石台１５に設けられたモータ１６ａの駆動により回転する。砥石車１６は、複数の砥粒をボンド材により固定されて構成されている。

【0025】

定寸装置１７は、工作物Ｗの寸法（径）を測定する。砥石車修正装置１８は、砥石車１６の形状を修正する。砥石車修正装置１８は、砥石車１６のツルーイングとドレッシングの何れか一方を行う装置である。さらに、砥石車修正装置１８は、砥石車１６の寸法（径）を測定する機能も有する。

【0026】

ここで、ツルーイングは、形直し作業であり、研削によって砥石車１６が摩耗した場合に工作物Ｗの形状に合わせて砥石車１６を成形する作業、片摩耗によって砥石車１６の振れを取り除く作業等である。ドレッシングは、目直し（目立て）作業であり、砥粒の突き出し量を調整したり、砥粒の切れ刃を創成したりする作業である。ドレッシングは、目つぶれ、目詰まり、目こぼれ等を修正する作業であって、通常ツルーイング後に行われる。また、ツルーイングとドレッシングは、特段区別することなく実施される場合もある。

【0027】

クーラント装置１９は、砥石車１６による工作物Ｗの研削点にクーラントを供給する。クーラント装置１９は、回収したクーラントを、所定温度に冷却して、再度研削点に供給する。

【0028】

制御装置２０は、工作物Ｗの形状、加工条件、砥石車１６の形状、クーラントの供給タイミング情報等の動作指令データに基づいて生成されたＮＣプログラムに基づいて、各駆動装置を制御する。すなわち、制御装置２０は、動作指令データを入力し、動作指令データに基づいてＮＣプログラムを生成し、ＮＣプログラムに基づいて各モータ１２ａ，１４ａ，１５ａ，１６ａおよびクーラント装置１９等を制御することにより工作物Ｗの研削を行う。特に、制御装置２０は、定寸装置１７により測定される工作物Ｗの径に基づいて、工作物Ｗが仕上げ形状となるまで研削を行う。また、制御装置２０は、砥石車１６を修正するタイミングにおいて、各モータ１４ａ，１５ａ，１６ａ、および、砥石車修正装置１８等を制御することにより、砥石車１６の修正（ツルーイングおよびドレッシング）を行う。

【0029】

また、図１には一部を図示しないが、研削盤１は、後述する各種センサ２１，２２，２３（図３等に示す）を備えている。例えば、研削盤１は、各モータ等の実動作データ、研削盤１を構成する構造部材の状態を示すデータを検出するセンサ、定寸装置１７、砥石径センサ、温度センサ等を備える。なお、各種センサ等の詳細は、後述する。

【0030】

（２．機械学習装置１００の概要）
機械学習装置１００の概要について、図２を参照して説明する。機械学習装置１００は、以下の、（ａ）－（ｆ）を行う。
（ａ）工作物Ｗの研削品質を推定するための第一学習モデルを生成すること。
（ｂ）第一学習モデルを用いて工作物Ｗの研削品質を推定すること。
（ｃ）砥石車１６の表面状態を推定するための第二学習モデルを生成すること。
（ｄ）第二学習モデルを用いて砥石車１６の表面状態を推定すること。
（ｅ）研削品質が良好となるように、且つ、砥石車１６の修正または交換の頻度を少なくするように、研削盤１の動作指令データを調整するための第三学習モデルを生成すること。
（ｆ）第三学習モデルを用いて、研削品質が良好となるように、且つ、砥石車１６の修正または交換の頻度を少なくするように、研削盤１の動作指令データを更新すること。

【0031】

機械学習装置１００は、研削盤１とは別の装置として構成することもできるし、研削盤１の制御装置２０等に組み込まれた装置として構成することもできる。本実施形態においては、機械学習装置１００は、研削盤１とネットワーク線により接続されており、各種データの送受信を行う。

【0032】

（２－１．第一学習フェーズ１０１の概要）
上記（ａ）（ｃ）に対応する第一学習フェーズ１０１について説明する。機械学習装置１００は、図２に示すように、第一学習モデルおよび第二学習モデルを生成する第一学習フェーズ１０１において機能する要素１０１ａ，１０１ｂ，１０１ｃ，１０１ｄ，１０１ｅを備える。機械学習装置１００は、第一学習フェーズ１０１において機能する要素として、第一学習用入力データを取得する要素１０１ａ、第一教師データを取得する要素１０１ｂ、第一学習モデルの生成を行う要素１０１ｃ、第二教師データを取得する要素１０１ｄ、および、第二学習モデルの生成を行う要素１０１ｅを備える。

【0033】

要素１０１ａにおいて取得される第一学習用入力データは、機械学習に用いられる入力データであって、研削盤１の制御装置２０への動作指令データ、工作物Ｗ毎の所定期間分の複数種のサンプリングデータ、および、複数種のサンプリングデータから演算される研削特性を表す値である。サンプリングデータは、例えば、実動作データ、第一実測データ（構造部材の状態を表すデータ）、第二実測データ（研削部位に関するデータ）等である。

【0034】

要素１０１ｂにおいて取得される第一教師データは、教師有り学習における機械学習に用いられる教師データである。第一教師データは、工作物Ｗの研削品質データであって、例えば、工作物Ｗの加工変質層データ、工作物Ｗの表面性状データ、工作物Ｗのびびり模様データ等である。

【0035】

要素１０１ｃにおいて生成される第一学習モデルは、第一学習用入力データおよび第一教師データに基づいて、機械学習のうち教師有り学習を行うことによって工作物Ｗの研削品質を推定するためのモデル（関数）である。ただし、第一学習モデルは、研削品質の分類分けを行うことを目的として、教師無し学習を適用することにより生成することもできる。ただし、教師有り学習を適用する場合には、高精度に研削品質を取得することができる。

【0036】

要素１０１ｄにおいて取得される第二教師データは、教師有り学習における機械学習に用いられる教師データである。第二教師データは、砥石車１６の表面状態を表すデータ（砥石車１６の表面状態データ）である。砥石車１６の表面状態データは、例えば、目つぶれ、目詰まり、目こぼれ等が生じている状態に関するデータ、目立てすぎの状態に関するデータ等である。

【0037】

砥石車１６の表面は、工作物Ｗの研削品質に影響を及ぼす。すなわち、砥石車１６の表面状態とは、工作物Ｗの研削品質に影響を及ぼす程度である。砥石車１６の表面状態とは、例えば、目つぶれ、目詰まり、目こぼれ等が生じている状態、目立てすぎの状態等である。そして、砥石車１６の表面状態が良好でない場合には、工作物Ｗの研削品質が低下するおそれがある。従って、砥石車１６の表面状態を把握することが求められる。

【0038】

砥石車１６の表面状態が、目つぶれ、目詰まり、目こぼれ等が生じている場合には、ドレッシングを行ったり、ツルーイングにより成形した後にドレッシングを行ったりすることが必要となる。また、砥石車１６の表面状態が、目立てすぎの状態であれば、ツルーイングを行うことが必要となる。通常、ツルーイング後には、ドレッシングが行われる。そして、ツルーイング回数が所定回数に到達した場合には、または、ツルーイングにより所定量成形した場合には、砥石車１６の交換を行う必要がある。

【0039】

そして、砥石車１６の寿命を向上するためには、ツルーイングおよびドレッシングを行う回数を少なくすることが求められる。さらに、ツルーイング、ドレッシングおよび砥石車１６の交換を行うと、これらに要する時間によって、研削サイクル時間が長くなることになる。当然に、研削サイクル時間を短くすることが求められる。この観点においても、砥石車１６の表面状態を把握することが求められる。そこで、要素１０１ｄは、砥石車１６の表面状態データを第二教師データとして取得することとしている。なお、砥石車１６の表面状態データとは、工作物の研削品質に影響を及ぼす程度を示すデータである。

【0040】

要素１０１ｅにおいて生成される第二学習モデルは、第一学習用入力データおよび第二教師データに基づいて、機械学習のうち教師有り学習を行うことによって砥石車１６の表面状態を推定するためのモデル（関数）である。ただし、第二学習モデルは、砥石車１６の表面状態の分類分けを行うことを目的として、教師無し学習を適用することにより生成することもできる。ただし、教師有り学習を適用する場合には、高精度に、砥石車１６の表面状態を取得することができる。

【0041】

（２－２．第二学習フェーズ１０２の概要）
上記（ｅ）に対応する第二学習フェーズ１０２について説明する。機械学習装置１００は、図２に示すように、第三学習モデルを生成する第二学習フェーズ１０２において機能する要素１０２ａ，１０２ｂ，１０２ｃ，１０２ｄを備える。機械学習装置１００は、第二学習フェーズ１０２において機能する要素として、第二学習用入力データを取得する要素１０２ａ、第一評価結果データを取得する要素１０２ｂ、第二評価結果データを取得する要素１０２ｃ、および、第三学習モデルの生成を行う要素１０２ｄを備える。

【0042】

要素１０２ａにおいて取得される第二学習用入力データは、機械学習に用いられる入力データであって、例えば、動作指令データ等である。要素１０２ｂにおいて取得される第一評価結果データは、強化学習における機械学習に用いられる報酬を導き出すための評価結果データである。第一評価結果データは、工作物Ｗの研削品質データであって、例えば、工作物Ｗの加工変質層データ、工作物Ｗの表面性状データ、工作物Ｗのびびり模様データ等である。

【0043】

要素１０２ｃにおいて取得する第二評価結果データは、強化学習における機械学習に用いられる報酬を導き出すための評価結果データである。第二評価結果データは、砥石車１６の表面状態データである。要素１０２ｄにおいて生成される第三学習モデルは、第二学習用入力データ、第一評価結果データおよび第二評価結果データに基づいて、機械学習のうち強化学習を行うことによって研削盤１の動作指令データを調整するためのモデル（関数）である。

【0044】

（２－３．推定フェーズ１０３の概要）
上記（ｂ）（ｄ）に対応する推定フェーズ１０３について説明する。機械学習装置１００は、図２に示すように、推定フェーズ１０３において機能する要素として、推定用入力データを取得する要素１０３ａ、研削品質の推定および工作物Ｗの良否の判別を行う要素１０３ｂを備える。さらに、機械学習装置１００は、推定フェーズ１０３において機能する要素として、砥石車１６の表面状態の推定、並びに、砥石車１６のツルーイングの実行、砥石車１６のドレッシングの実行、および、砥石車１６の交換の実行を判別する要素１０３ｃを備える。

【0045】

要素１０３ａにおいて取得される推定用入力データは、第一学習用入力データと同種のデータであって、学習に用いた工作物Ｗとは異なる工作物Ｗ（新しい工作物Ｗ）に関して取得されるデータである。つまり、推定用入力データは、複数種のサンプリングデータと研削特性を表す値を含む。要素１０３ｂは、推定用入力データと第一学習モデルとを用いて研削品質を推定すると共に、推定された研削品質に基づいて工作物Ｗの良否を判別する。要素１０３ｂにて用いる第一学習モデルは、第一学習フェーズ１０１において機械学習によって生成される第一学習モデルである。

【0046】

要素１０３ｃは、推定用入力データと第二学習モデルとを用いて砥石車１６の表面状態を推定すると共に、推定された砥石車１６の表面状態に基づいて、砥石車１６のツルーイングの実行、砥石車１６のドレッシングの実行、および、砥石車１６の交換の実行を判別する。要素１０３ｃにて用いる第二学習モデルは、第一学習フェーズ１０１において機械学習によって生成される第二学習モデルである。

【0047】

（２－４．更新フェーズ１０４の概要）
上記（ｆ）に対応する更新フェーズ１０４について説明する。機械学習装置１００は、動作指令データを更新する更新フェーズ１０４において機能する要素として、更新用入力データを取得する要素１０４ａ、並びに、動作指令データの更新を行う要素１０４ｂを備える。要素１０４ａにおいて取得される更新用入力データは、第二学習用入力データと同種のデータであって、学習に用いた工作物Ｗとは異なる工作物Ｗ（新しい工作物Ｗ）に関して取得されるデータである。

【0048】

要素１０４ｂは、更新用入力データ、第三学習モデル、推定された研削品質、および、推定された砥石車１６の表面状態を用いて、動作指令データを更新する。要素１０４ｂにて用いる第三学習モデルは、第二学習フェーズ１０２において機械学習によって生成される第三学習モデルである。また、推定された研削品質は、推定フェーズ１０３において推定された研削品質である。推定された砥石車１６の表面状態は、推定フェーズ１０３において推定された砥石車１６の表面状態である。

【0049】

（３．第一学習フェーズ１０１の詳細構成）
機械学習装置１００の第一学習フェーズ１０１の詳細構成について、図３を参照して説明する。第一学習フェーズ１０１の構成は、研削加工に関する学習モデル生成装置を構成する。第一学習フェーズ１０１の構成は、第一入力データ取得部１３０と、研削特性演算部１４０、教師データ取得部１５０と、第一学習モデル生成部１６０と、第一学習モデル記憶部１７０と、第二学習モデル生成部１８０と、第二学習モデル記憶部１９０とを備えて構成される。

【0050】

第一学習フェーズ１０１において用いる第一学習用入力データ、第一教師データおよび第二教師データは、表１に示すとおりである。

【0051】

【表1】

【0052】

第一入力データ取得部１３０は、動作指令データ取得部１１０と、サンプリングデータ取得部１２０とを備える。動作指令データ取得部１１０は、制御装置２０への動作指令データを、機械学習の第一学習用入力データとして取得する。動作指令データは、表１に示すように、工程毎の指令切込速度、工程切替時の移動体１４，１５の指令位置、砥石車１６の指令回転速度、工作物Ｗの指令回転速度、クーラントの供給情報等である。ここで、工作物Ｗの研削は、例えば、粗研、精研、微研、スパークアウト等の複数の研削工程によって行われる。

【0053】

サンプリングデータ取得部１２０は、複数の工作物Ｗに関する所定期間分の複数種のサンプリングデータを、機械学習の第一学習用入力データとして取得する。サンプリングデータとは、工作物Ｗ毎に、所定のサンプリング周期におけるデータ群を構成する。サンプリングデータ取得部１２０は、制御装置２０により制御される駆動装置１２ａ等の実動作データをセンサ２１から取得する実動作データ取得部１２１、第一実測データをセンサ２２から取得する第一実測データ取得部１２２、第二実測データをセンサ２３から取得する第二実測データ取得部１２３を備える。

【0054】

実動作データは、表１に示すように、モータ１２ａ等の駆動電流、モータ１２ａ等の実位置等である。実動作データ取得部１２１は、工作物Ｗ毎に所定期間分の実動作データを取得する。所定期間分とは、例えば、研削初期から研削終期まで、粗研の初期から粗研の終期まで等である。なお、研削が非定常状態の時には、不安定であるため、定常状態のみを対象としてデータを取得することも可能である。

【0055】

第一実測データは、砥石車１６により工作物Ｗの研削を行っている際の実測データであって、構造部材１５等の振動、構造部材１５等の変形量等である。第二実測データは、砥石車１６により工作物Ｗの研削を行う際の実測データであって、工作物Ｗの寸法（径）、研削点温度等である。

【0056】

第一実測データ取得部１２２は、第一実測データを、工作物Ｗ毎に所定期間分取得する。また、第二実測データ取得部１２３も、第二実測データを、工作物Ｗ毎に所定期間分取得する。第一実測データおよび第二実測データは、上述した実動作データと同一の所定期間の分だけ取得される。所定期間は、上述したように、例えば、研削初期から研削終期まで、粗研の初期から粗研の終期まで等である。

【0057】

研削特性演算部１４０は、第一入力データ取得部１３０により取得された動作指令データおよびサンプリングデータに基づいて、研削特性を表す値を演算する。特に、研削特性演算部１４０は、複数種のサンプリングデータに基づいて、研削特性を表す値を演算する。研削特性を表す値は、表１に示すように、動作指令データおよびサンプリングデータと同様に、第一学習用入力データとなる。

【0058】

例えば、研削特性演算部１４０は、所定期間分における複数種のサンプリングデータの関係を近似関係式で表すことにより、研削特性を表す値を演算する。近似関係式は、例えば、２種類のパラメータにより表されており、一次式、二次式または三次式等、比較的低次の関係式である。もちろん、近似関係式は、３種類以上のパラメータにより表されるようにしてもよい。

【0059】

研削特性を表す値は、近似関係式における微分値、極値、所定の軸成分がゼロである値等である。例えば、近似関係式が２種類のサンプリングデータにより一次式で表される場合には、研削特性を表す値は、当該一次の近似関係式の傾き（微分値）等である。つまり、サンプリングデータは、所定時間分のデータ群であるのに対して、研削特性を表す値は、一つの数値である。研削特性を表す値は、データ群（多数のデータの集合体）であるサンプリングデータとは異なり、サンプリングデータに基づいて整理されたデータとなる。

【0060】

研削特性を表す値の具体例として、砥石車１６の切れ味、研削点に供給されるクーラントの動圧、工作物Ｗの静剛性等である。研削特性を表す値として、上記３種類の何れか一つを適用してもよいし、３種類全てを適用してもよい。さらに、研削特性を表す値として、上記３種類以外を含むようにすることもできる。

【0061】

砥石車１６の切れ味およびクーラントの動圧は、砥石車１６の状態を表す指標である。砥石車１６の切れ味は、研削抵抗と単位時間当たり（工作物Ｗの１回転当たり）の切込量とをパラメータとする２次元座標系において、当該２種類のサンプリングデータ（データ群）の関係から得られる値である。砥石車１６の切れ味は、当該切込量に代えて、単位時間当たり（工作物Ｗの１回転当たり）の工作物Ｗの除去体積をパラメータとしてもよい。

【0062】

クーラントの動圧も、砥石車１６の切れ味と同様のパラメータを用いることができる。すなわち、クーラントの動作は、研削抵抗と単位時間当たり（工作物Ｗの１回転当たり）の切込量とをパラメータとする２次元座標系において、当該２種類のサンプリングデータ（データ群）の関係から得られる値である。クーラントの動圧は、当該切込量に代えて、単位時間当たり（工作物Ｗの１回転当たり）の工作物Ｗの除去体積をパラメータとしてもよい。

【0063】

工作物Ｗの静剛性は、研削抵抗と工作物Ｗの撓み量とをパラメータとする２次元座標系において、当該２種類のサンプリングデータ（データ群）の関係から得られる値である。工作物Ｗの撓み量は、砥石車１６の送り位置や工作物Ｗの径から得ることも可能である。ここで、工作物Ｗが例えばクランクシャフト等の複雑形状である場合において、クランクピンの研削加工におけるクランクシャフトの静剛性を得ることができる。

【0064】

教師データ取得部１５０は、研削品質データを取得する研削品質データ取得部１５１と、砥石車１６の表面状態データを取得する砥石車表面状態データ取得部１５２とを備える。

【0065】

研削品質データ取得部１５１は、外部装置２によって取得された複数の工作物Ｗに関する研削品質データを、教師有り学習の第一教師データとして取得する。つまり、研削品質データ取得部１５１は、例えば、加工変質層データ（研削焼け、研削による軟化層等に関するデータ）、表面性状データ（表面粗さ等のデータ）、びびり模様データ等を、第一教師データとして取得する。

【0066】

砥石車表面状態データ取得部１５２は、工作物Ｗ毎に研削後における砥石車１６の表面状態データを、機械学習の第二教師データとして取得する。砥石車表面状態データ取得部１５２は、外部装置２によって取得された工作物Ｗの研削品質データに対応する砥石車１６の表面状態データを取得する。

【0067】

砥石車１６の表面状態データは、工作物Ｗの加工変質層の状態に対応する第一表面状態データ、工作物Ｗの表面性状に対応する第二表面状態データ、および、工作物Ｗのびびり模様状態に対応する第三表面状態データを含む。ただし、第一表面状態データは、加工変質層データそのものとしてもよいし、加工変質層データに基づいて演算したデータとしてもよい。また、第二表面状態データは、工作物Ｗの表面性状データそのものとしてもよいし、表面性状データに基づいて演算したデータとしてもよい。第三表面状態データは、びびり模様データそのものとしてもよいし、びびり模様データに基づいて演算したデータとしてもよい。

【0068】

第一学習モデル生成部１６０は、教師有り学習を行って、第一学習モデルを生成する。詳細には、第一学習モデル生成部１６０は、第一入力データ取得部１３０が取得した動作指令データおよびサンプリングデータ、並びに、研削特性演算部１４０により演算された研削特性を表す値を、第一学習用入力データとして取得する。また、第一学習モデル生成部１６０は、研削品質データ取得部１５１が取得した複数の工作物Ｗに関する研削品質データを、第一教師データとして取得する。そして、第一学習モデル生成部１６０は、第一学習用入力データおよび第一教師データを用いた機械学習により、工作物Ｗの研削品質を推定するための第一学習モデルを生成する。

【0069】

つまり、第一学習モデル生成部１６０は、動作指令データ、実動作データ、第一実測データ、第二実測データおよび研削特性を表す値を第一学習用入力データとし、且つ、研削品質データを第一教師データとする機械学習により、第一学習モデルを生成する。第一学習モデルは、第一学習用入力データと第一教師データとの関係を示すモデルである。

【0070】

ここで、サンプリングデータとしての、実動作データ、第一実測データおよび第二実測データは、工作物Ｗ毎の所定期間分のデータ群である。従って、１つの工作物Ｗに関するサンプリングデータだけでも、多量のデータとなる。さらに、複数の工作物Ｗに関するサンプリングデータとなれば、極めて多量のデータとなる。しかし、第一学習モデルは、機械学習を用いることによって、複数の工作物Ｗに関する多数のサンプリングデータを用いるとしても、容易に生成することができる。従って、後述するが、工作物Ｗの研削品質に影響を及ぼす多数のサンプリングデータを考慮して第一学習モデルを生成することで、結果として、工作物Ｗの研削品質を取得することができる。

【0071】

ただし、所定期間分のサンプリングデータは、データ群（多数のデータの集合体）であるため、種々の影響を受けている可能性がある。そこで、第一学習用入力データは、所定期間分のサンプリングデータのみならず、所定期間分のサンプリングデータから演算された研削特性を表す値を含んでいる。研削特性を表す値は、サンプリングデータに基づいて整理されたデータである。また、研削特性を表す値は、直接的な計測が困難である。

【0072】

つまり、第一学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。このように、整理された研削特性を表す値を用いることにより、第一学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、研削品質を推定する際において、推定される研削品質は、研削特性を十分に考慮した結果となり、より高精度な結果となる。さらに、直接的な計測が困難な研削特性を、サンプリングデータからの演算により把握している。計測だけでは得ることが難しい研削特性を学習データとして活用することで、より高精度な研削品質が得られる。

【0073】

ここで、第一学習モデルは、工作物Ｗの研削品質として、例えば、工作物Ｗの加工変質層の状態、工作物Ｗの表面性状、および、工作物Ｗのびびり模様状態を推定するためのモデルである。ただし、第一学習モデルは、これら全ての研削品質を推定する場合に限られず、これらの一部のみの研削品質を推定するようにしてもよい。そして、第一学習モデル生成部１６０によって生成された第一学習モデルは、第一学習モデル記憶部１７０に記憶される。

【0074】

また、取得する所定期間が、研削初期から研削終期までである場合には、第一学習モデルは、全ての研削工程を考慮したモデルとなる。一方、取得する所定期間が、例えば粗研の初期から粗研の終期までである場合には、第一学習モデルは、粗研工程のみを考慮した学習モデルとなる。研削品質に影響を及ぼす工程を特定したい場合には、工程毎に第一学習モデルを取得するようにしてもよい。

【0075】

第二学習モデル生成部１８０は、教師有り学習を行って、第二学習モデルを生成する。詳細には、第二学習モデル生成部１８０は、第一入力データ取得部１３０が取得した動作指令データおよびサンプリングデータ、並びに、研削特性演算部１４０により演算された研削特性を表す値を、第一学習用入力データとして取得する。また、第二学習モデル生成部１８０は、砥石車表面状態データ取得部１５２が取得した工作物Ｗ毎の砥石車１６の表面状態データを、第二教師データとして取得する。第二学習モデル生成部１８０は、第一学習用入力データおよび第二教師データを用いた機械学習により、砥石車１６の表面状態を推定するための第二学習モデルを生成する。

【0076】

つまり、第二学習モデル生成部１８０は、動作指令データ、実動作データ、第一実測データ、第二実測データおよび研削特性を表す値を第一学習用入力データとし、且つ、砥石車表面状態データを第二教師データとする機械学習により、第二学習モデルを生成する。第二学習モデルは、第一学習用入力データと第二教師データとの関係を示すモデルである。多数のサンプリングデータが存在するとしても、機械学習を適用することにより第二学習モデルの生成が可能となる。また、整理された研削特性を表す値を用いることにより、第二学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、砥石車１６の表面状態を推定する際において、推定される表面状態は、研削特性を十分に考慮した結果となり、より高精度な結果となる。

【0077】

第二学習モデルは、砥石車１６の表面状態として、工作物の研削品質に影響を及ぼす程度を推定するためのモデルである。この第二学習モデルは、砥石車１６の表面状態として、砥石車１６の目つぶれ、目詰まり、目こぼれ等が生じている状態、砥石車１６の目立てすぎの状態等を推定するためのモデルである。

【0078】

例えば、第二学習モデルは、砥石車１６の表面状態として、工作物Ｗの加工変質層の状態に対応する第一表面状態、工作物Ｗの表面性状に対応する第二表面状態、および、工作物Ｗのびびり模様状態に対応する第三表面状態を推定するためのモデルである。ただし、第二学習モデルは、これら全ての表面状態を推定する場合に限られず、これらの一部のみの表面状態を推定するようにしてもよい。そして、第二学習モデル生成部１８０によって生成された第二学習モデルは、第二学習モデル記憶部１９０に記憶される。

【0079】

（４．第二学習フェーズ１０２の詳細構成）
機械学習装置１００の第二学習フェーズ１０２の詳細構成について、図３を参照して説明する。第二学習フェーズ１０２の構成は、動作指令データ取得部１１０と、研削品質データ取得部１５１と、砥石車表面状態データ取得部１５２と、研削サイクル時間演算部２１０と、砥石車形状情報取得部２２０と、報酬決定部２３０と、第三学習モデル生成部２４０と、第三学習モデル記憶部２５０とを備えて構成される。

【0080】

第二学習フェーズ１０２において用いる第二学習用入力データ、第一評価結果データおよび第二評価結果データは、表２に示すとおりである。

【0081】

【表2】

【0082】

動作指令データ取得部１１０は、複数の工作物Ｗに関する動作指令データを、機械学習の第二学習用入力データとして取得する。また、研削品質データ取得部１５１は、当該複数の工作物Ｗに関する研削品質データを、機械学習の第一評価結果データとして取得する。砥石車表面状態データ取得部１５２は、工作物Ｗ毎の研削後における砥石車１６の表面状態データを、機械学習の第二評価結果データとして取得する。ここで、表２に示すように、第二学習用入力データは、多数のデータとしているが、表２に示す全てのデータを用いる必要はなく、一部のデータのみを用いるようにしてもよい。

【0083】

研削サイクル時間演算部２１０は、１個の工作物Ｗ当たりの研削サイクル時間を演算する。研削サイクル時間には、複数の工作物Ｗの研削に要する時間、前記研削において砥石車１６の交換に要する時間、前記研削において砥石車１６のドレッシングに要する時間、および、前記研削において砥石車１６のツルーイングに要する時間の合計を、工作物Ｗの数で除算した値である。つまり、砥石車１６の交換回数が少ないほど、砥石車１６のドレッシングの回数が少ないほど、さらには、砥石車１６のツルーイングの回数が少ないほど、研削サイクル時間が短くなる。

【0084】

砥石車形状情報取得部２２０は、砥石車１６の形状情報を取得する。砥石車形状情報取得部２２０は、砥石車修正装置１８により測定された砥石車１６の寸法（径）を取得する。つまり、砥石車形状情報取得部２２０は、砥石車修正装置１８によって、砥石車１６のツルーイングまたはドレッシングが行われるときに取得される。さらに、砥石車形状情報取得部２２０は、砥石車１６の形状情報として、砥石車１６の寸法変化、および、砥石車１６の形崩れを取得することができる。

【0085】

報酬決定部２３０は、第二学習用入力データである動作指令データ、第一評価結果データである研削品質データ、および、第二評価結果データである砥石車１６の表面状態データを取得して、研削品質データおよび表面状態データに応じて、動作指令データに対する報酬を決定する。ここで、報酬は、強化学習において、動作指令データの組み合わせに対する報酬である。

【0086】

そして、報酬決定部２３０において、当該動作指令データに対応する研削品質データが望ましい結果を導き出した時に、当該動作指令データに対して多くの報酬が付与され、望ましくない結果を導き出した時に、当該動作指令データに対して少ない報酬（マイナスの報酬を含む）が付与される。

【0087】

例えば、報酬決定部２３０は、工作物Ｗの加工変質層データにおいて、加工変質層が無い場合に報酬を多くし、加工変質層が有る場合に報酬を少なくする。また、報酬決定部２３０は、工作物Ｗの表面性状データが所定閾値以下の場合に報酬を多くし、表面性状データが所定閾値より大きい場合に報酬を少なくする。さらに、報酬決定部２３０は、工作物Ｗのびびり模様データにおいて、びびり模様が無しの場合に報酬を多くし、びびり模様が有りの場合に報酬を少なくする。なお、報酬決定部２３０は、加工変質層データ、表面性状データ、および、びびり模様データの全てに基づいて報酬を決定してもよいし、これらの何れかのみに基づいて報酬を決定してもよい。

【0088】

さらに、報酬決定部２３０において、当該動作指令データに対応する表面状態データが望ましい結果を導き出した時に、当該動作指令データに対して多くの報酬が付与され、望ましくない結果を導き出した時に、当該動作指令データに対して少ない報酬が付与される。

【0089】

例えば、報酬決定部２３０は、第一表面状態データに対応する加工変質層が無い場合に報酬を多くし、加工変質層が有る場合に報酬を少なくする。また、報酬決定部２３０は、第二表面状態データに対応する工作物Ｗの表面性状データが所定閾値以下の場合に報酬を多くし、表面性状が所定閾値より大きい場合に報酬を少なくする。また、報酬決定部２３０は、第三表面状態データに対応するびびり模様が無しの場合に報酬を多くし、びびり模様が有りの場合に報酬を少なくする。

【0090】

さらに、報酬決定部２３０は、研削サイクル時間演算部２１０によって演算された研削サイクル時間を取得し、研削サイクル時間に応じて、動作指令データに対する報酬を決定する。詳細には、報酬決定部２３０は、研削サイクル時間が短くなるほど報酬を多くする。つまり、報酬決定部２３０は、砥石車１６の交換に要する時間、砥石車１６のドレッシングに要する時間、および、砥石車１６のツルーイングに要する時間の少なくとも一つが短くなるほど、報酬を多くする。

【0091】

さらに、報酬決定部２３０は、砥石車形状情報取得部２２０が取得した砥石車１６の形状情報に基づいて、報酬を決定する。詳細には、報酬決定部２３０は、砥石車１６の寸法変化が小さくなるほど、砥石車１６の形崩れが小さくなるほど、報酬を多くする。

【0092】

第三学習モデル生成部２４０は、機械学習により、報酬を多くするように動作指令データを調整するための第三学習モデルを生成する。第三学習モデル生成部２４０において、強化学習として、例えば、Ｑ学習、Sarsa、モンテカルロ法等が適用される。

【0093】

ここで、調整前の動作指令データが、第一の工作物Ｗに関するデータであり、調整後の動作指令データが、第二の工作物Ｗに関するデータであるとする。第一の工作物Ｗに関する動作指令データと当該第一の工作物Ｗの研削品質データとの関係を、第一データ関係とする。第二の工作物Ｗの動作指令データと当該第二の工作物Ｗの研削品質データとの関係を、第二データ関係とする。

【0094】

そして、第三学習モデルは、調整前である第一データ関係と調整後である第二データ関係との相互関係を表すモデルである。第三学習モデル生成部２４０は、調整後である第二の工作物Ｗの研削品質データが調整前である第一の工作物Ｗの研削品質データより良好となるように、すなわち報酬が多くなるように、調整前である第一の工作物Ｗの動作指令データから調整後である第二の工作物Ｗの動作指令データへの調整方法を学習する。

【0095】

ただし、調整後の動作指令データは、調整前の動作指令データに対して、予め設定された制約の範囲内で調整可能とされている。例えば、調整可能なパラメータの一つである指令切込速度においては、調整後の指令切込速度は、調整前の指令切込速度に対して所定割合（例えば±３％）内に制限されている。所定割合は、任意に設定可能である。その他の調整可能なパラメータについても同様である。また、調整可能なパラメータを設定することも可能である。そして、生成された第三学習モデルは、第三学習モデル記憶部２５０に記憶される。

【0096】

また、第三学習モデルにおいて、砥石車１６の表面状態データについても、研削品質データと同様に用いられる。すなわち、第三学習モデル生成部２４０は、調整後である第二の工作物Ｗの研削を行った場合の砥石車１６の表面状態データが、調整前である第一の工作物Ｗの研削を行った場合の砥石車１６の表面状態データより良好となるように、すなわち報酬が多くなるように、調整前である第一の工作物Ｗの動作指令データから調整後である第二の工作物Ｗの動作指令データへの調整方法を学習する。

【0097】

なお、第三学習モデル生成部２４０は、後述する更新フェーズ１０４においても第三学習モデルを学習することも可能である。この場合、第一評価結果データである研削品質データは、推定フェーズ１０３により得られた研削品質データを用いる。また、第二評価結果データである砥石車１６の表面状態データは、推定フェーズ１０３により得られた表面状態データを用いる。

【0098】

（５．推定フェーズ１０３の詳細構成）
機械学習装置１００の推定フェーズ１０３の詳細構成について、図４を参照して説明する。推定フェーズ１０３の構成が、研削加工に関する推定装置に相当する。推定フェーズ１０３の構成は、第一入力データ取得部１３０と、第一学習モデル記憶部１７０と、第二学習モデル記憶部１９０と、推定部３１０と、判別部３２０とを備えて構成される。

【0099】

推定部３１０は、研削品質推定部３１１および砥石車表面状態推定部３１２を備える。研削品質推定部３１１は、新たな工作物Ｗの研削を行っている際の所定期間分の第一入力データ、および、研削特性演算部１４０により演算される研削特性を表す値を、推定用入力データとして取得する。つまり、推定用入力データは、動作指令データ、サンプリングデータ、および、研削特性を表す値を含む。そして、研削品質推定部３１１は、推定用入力データを入力し、第一学習モデル記憶部１７０に記憶されている第一学習モデルを用いることで、新たな工作物Ｗの研削品質を推定する。

【0100】

ここで、第一学習モデルは、上述したように、第一学習用入力データと、第一教師データとの関係を示すモデルである。そして、第一学習モデルは、第一教師データである研削品質データとして、工作物Ｗの加工変質層の状態、工作物Ｗの表面性状、および、工作物Ｗのびびり模様状態に関するモデルである。

【0101】

そこで、研削品質推定部３１１は、研削品質として、工作物Ｗの加工変質層の状態、工作物Ｗの表面性状、および、工作物Ｗのびびり模様状態を推定する。ただし、研削品質推定部３１１は、当該全ての研削品質を推定するのではなく、一部の研削品質のみを推定するようにしてもよい。例えば、研削品質推定部３１１は、加工変質層の状態のみを推定するようにしてもよい。この場合、第一学習モデルが、加工変質層の状態のみを推定するようなモデルとして生成されていることになる。

【0102】

第一学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。整理された研削特性を表す値を用いることにより、第一学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、推定される研削品質は、研削特性を十分に考慮した結果となり、より高精度な結果となる。

【0103】

砥石車表面状態推定部３１２は、新たな工作物Ｗの研削を行っている際の所定期間分の第一入力データ、および、研削特性演算部１４０により演算される研削特性を表す値を、推定用入力データとして取得する。つまり、推定用入力データは、動作指令データ、サンプリングデータ、および、研削特性を表す値を含む。そして、砥石車表面状態推定部３１２は、推定用入力データを入力し、第二学習モデル記憶部１９０に記憶されている第二学習モデルを用いることで、新たな工作物Ｗの研削を行った場合の砥石車１６の表面状態を推定する。ここで、第二学習モデルは、上述したように、第一学習用入力データと、第二教師データとの関係を示すモデルである。

【0104】

そこで、砥石車表面状態推定部３１２は、砥石車１６の表面状態として、工作物Ｗの研削品質に影響を及ぼす程度を推定する。例えば、砥石車表面状態推定部３１２は、砥石車１６の表面状態として、工作物Ｗの加工変質層の状態に対応する第一表面状態、工作物Ｗの表面性状に対応する第二表面状態、および、工作物Ｗのびびり模様状態に対応する第三表面状態を推定する。ただし、砥石車表面状態推定部３１２は、当該全ての砥石車１６の表面状態を推定するのではなく、一部の表面状態のみを推定するようにしてもよい。例えば、砥石車表面状態推定部３１２は、第一表面状態のみを推定するようにしてもよい。この場合、第二学習モデルが、第一表面状態のみを推定するようなモデルとして生成されていることになる。

【0105】

第二学習モデルは、サンプリングデータそのものと、整理された研削特性を表す値とを用いて生成されている。このように、整理された研削特性を表す値を用いることにより、第二学習モデルは、研削特性との関係を際立たせたモデルとなる。その結果、推定される砥石車１６の表面状態は、研削特性を十分に考慮した結果となり、より高精度な結果となる。

【0106】

判別部３２０は、研削品質推定部３１１により推定された工作物Ｗの研削品質に基づいて工作物Ｗの良否を判別する。例えば、判別部３２０は、推定された加工変質層の状態に基づいて、工作物Ｗに加工変質層が存在している（所定条件を満たしていない）と判別された場合には、当該工作物Ｗは不良品と判別する。また、判別部３２０は、推定された表面性状が所定条件を満たしていないと判別された場合には、当該工作物Ｗは不良品と判別する。また、判別部３２０は、推定されたびびり模様状態に基づいて、びびり模様が存在している（所定条件を満たしていない）と判別された場合には、当該工作物Ｗは不良品と判別する。

【0107】

一方、判別部３２０は、加工変質層の状態、表面性状、および、びびり模様状態に関して各条件を満たす場合に、当該工作物Ｗは良品と判別する。このように、機械学習を適用して生成された第一学習モデルを用いることにより、複数の条件について、容易に判別することができる。

【0108】

さらに、判別部３２０は、砥石車表面状態推定部３１２により推定された砥石車１６の表面状態に基づいて、砥石車１６のツルーイングの実行、砥石車１６のドレッシングの実行、および、砥石車１６の交換の実行の少なくとも一つを判別する。例えば、判別部３２０は、推定された加工変質層の状態に対応する第一表面状態に基づいて、工作物Ｗに加工変質層が存在している（所定条件を満たしていない）と判別された場合には、砥石車１６のドレッシングを実行するべきと判別する。また、判別部３２０は、推定された表面性状に対応する第二表面状態が所定条件を満たしていないと判別された場合には、砥石車１６のツルーイングを実行するべきと判別する。また、判別部３２０は、推定されたびびり模様状態に対応する第三表面状態に基づいて、びびり模様が存在している（所定条件を満たしていない）と判別された場合には、砥石車１６のドレッシングを実行するべきと判別する。

【0109】

一方、判別部３２０は、第一表面状態、第二表面状態および第三表面状態に関して各条件を満たす場合に、砥石車１６は良好な状態であると判別する。この場合、砥石車１６に対してドレッシングおよびツルーイングは不要であると判別されることになる。このように、機械学習を適用して生成された第二学習モデルを用いることにより、複数の条件について、容易に判別することができる。

【0110】

（６．更新フェーズ１０４の詳細構成）
機械学習装置１００の更新フェーズ１０４の詳細構成について、図４を参照して説明する。更新フェーズ１０４の構成が、研削加工に関する動作指令データ更新装置に相当する。更新フェーズ１０４の構成は、動作指令データ取得部１１０と、研削品質推定部３１１と、砥石車表面状態推定部３１２と、研削サイクル時間演算部２１０と、砥石車形状情報取得部２２０と、報酬決定部２３０と、第三学習モデル記憶部２５０と、動作指令データ調整部３３０とを備えて構成される。

【0111】

動作指令データ取得部１１０は、新たな工作物Ｗの研削における各データを取得し、第二学習フェーズ１０２において説明した内容と実質的に同一である。また、研削サイクル時間演算部２１０、および、砥石車形状情報取得部２２０も、第二学習フェーズ１０２において説明した内容と実質的に同一である。また、研削品質推定部３１１、および、砥石車表面状態推定部３１２は、推定フェーズ１０３にて説明した内容と同一である。すなわち、研削品質推定部３１１、および、砥石車表面状態推定部３１２は、新たな工作物Ｗの研削における工作物Ｗの研削品質および砥石車１６の表面状態を推定する。

【0112】

報酬決定部２３０は、新たな工作物Ｗの研削において取得した動作指令データ、研削品質、および、砥石車１６の表面状態を用いて、報酬を決定する。すなわち、報酬決定部２３０は、新たな工作物Ｗの研削に関して、研削品質および砥石車１６の表面状態に応じて、動作指令データに対する報酬を決定する。さらに、報酬決定部２３０は、研削サイクル時間および砥石車１６の形状情報に応じて、動作指令データに対する報酬を決定する。第三学習モデル記憶部２５０は、第二学習フェーズ１０２において説明したように、第三学習モデル生成部２４０によって生成された第三学習モデルを記憶する。

【0113】

動作指令データ調整部３３０は、新たな工作物Ｗの研削に関する動作指令データ、推定された新たな工作物Ｗの研削品質、新たな工作物Ｗの研削を行った場合の推定された砥石車１６の表面状態、報酬、および、第三学習モデルを用いて、動作指令データの調整方法を決定し、決定した調整方法に基づいて動作指令データの調整を行う。ここで、第三学習モデルは、報酬が多くなるように、調整前の動作指令データから調整後の動作指令データへの調整方法を学習することによって生成されたモデルである。

【0114】

詳細には、動作指令データ調整部３３０は、現在の動作指令データを調整前の動作指令データとして取得し、そのときの報酬を取得する。この場合に、動作指令データ調整部３３０は、現在の動作指令データと、現在の動作指令データに対する報酬と、第三学習モデルとを用いて、調整すべき動作指令データを決定する。つまり、調整すべき動作指令データは、現在の動作指令データにおける報酬よりも多くの報酬となるような動作指令データとなる。

【0115】

動作指令データ調整部３３０の処理において、調整すべき動作指令データとして、報酬が同等となる複数の候補が出力される場合がある。この場合には、例えば、動作指令データ調整部３３０は、調整するパラメータの優先順位を設定することにより、複数の候補に対して順位付けを行うことができる。例えば、調整するパラメータの優先順位とは、第一位を指令切込速度とし、第二位を工作物Ｗの指令回転速度とする等である。

【0116】

そして、動作指令データ調整部３３０は、第一位の候補を、調整すべき動作指令データと決定し、現在の動作指令データを当該調整すべき動作指令データに更新する。そうすると、研削盤１は、更新された動作指令データに基づいて工作物Ｗの研削を行う。そして、機械学習装置１００の更新フェーズ１０４において、当該工作物Ｗの研削における各データに基づいて、再び、次の研削における動作指令データを調整する。なお、動作指令データの調整の頻度を設定することもできる。例えば、設定数の工作物Ｗを研削した後に、動作指令データを調整するようにしてもよい。

【0117】

つまり、機械学習装置１００の機械学習により生成された第三学習モデルを用いて動作指令データが更新される。そのため、研削状態が変化したとしても、動作指令データが現在の研削状態に応じて更新されていく。このように動作指令データが更新されることによって、工作物Ｗの研削品質を良好とすることができる。

【0118】

さらに、動作指令データが更新されることによって、砥石車１６の表面状態に応じた研削を行うことができる。すなわち、動作指令データが更新されることによって、砥石車１６の表面状態が良好となる。砥石車１６の表面状態を良好とすることにより、工作物Ｗの研削品質を向上させることにつながる。さらに、動作指令データが更新されることによって、砥石車１６の交換に要する時間、砥石車１６のドレッシングに要する時間、および、砥石車１６のツルーイングに要する時間が少なくなる。結果として、研削サイクル時間が短くなる。さらに、動作指令データが更新されることによって、砥石車１６の寸法変化が小さくなり、砥石車１６の形崩れが小さくなる。

【0119】

特に、更新フェーズ１０４においては、推定フェーズ１０３にて推定された工作物Ｗの研削品質および砥石車１６の表面状態を用いて処理される。つまり、研削特性を十分に考慮した結果としての研削品質または砥石車の表面状態を用いて、動作指令データの調整を行うための第三学習モデルを生成し、動作指令データの更新を行うことができる。従って、工作物Ｗの研削品質および砥石車の表面状態に応じて、動作指令を適切に更新することができる。

【0120】

（７．その他）
上記の機械学習装置１００は、第一学習モデルの生成、第二学習モデルの生成、工作物Ｗの研削品質の推定、工作物Ｗの良否の判別、砥石車１６の表面状態の推定、砥石車１６のツルーイングの実行の判別、砥石車１６のドレッシングの実行の判別、砥石車１６の交換の実行の判別、動作指令データの更新の全てを行う場合について説明した。この他に、機械学習装置１００は、上記処理の何れかの要素のみを行う装置として適用することもできる。その場合、機械学習装置１００は、当該要素に対応する構成のみを備える。

【符号の説明】

【0121】

１：研削盤、２：外部装置、１２：主軸台（構造部材）、１２ａ，１４ａ，１５ａ，１６ａ：モータ（駆動装置）、１３：心押台（構造部材）、１４：トラバースベース（構造部材、移動体）、１５：砥石台（構造部材、移動体）、１６：砥石車、１７：定寸装置（駆動装置）、１８：砥石車修正装置（駆動装置）、１９：クーラント装置、２０：制御装置、２１，２２，２３：センサ、１００：機械学習装置、１０１：第一学習フェーズ（学習モデル生成装置）、１０２：第二学習フェーズ（学習モデル生成装置）、１０３：推定フェーズ（推定装置）、１０４：更新フェーズ（更新装置）、１１０：動作指令データ取得部、１２０：サンプリングデータ取得部、１２１：実動作データ取得部、１２２：第一実測データ取得部、１２３：第二実測データ取得部、１３０：第一入力データ取得部、１４０：研削特性演算部、１５０：教師データ取得部、１５１：研削品質データ取得部、１５２：砥石車表面状態データ取得部、１６０：第一学習モデル生成部、１７０：第一学習モデル記憶部、１８０：第二学習モデル生成部、１９０：第二学習モデル記憶部、２１０：研削サイクル時間演算部、２２０：砥石車形状情報取得部、２３０：報酬決定部、２４０：第三学習モデル生成部、２５０：第三学習モデル記憶部、３１０：推定部、３１１：研削品質推定部、３１２：砥石車表面状態推定部、３２０：判別部、３３０：動作指令データ調整部、Ｗ：工作物

【図1】

【図2】

【図3】

【図4】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版