IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ジェイテクトの特許一覧

特許7388528研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置
<>
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図1
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図2
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図3
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図4
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図5
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図6
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図7
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図8
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図9
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図10
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図11
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図12
  • 特許-研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置
(51)【国際特許分類】
   B24B 49/10 20060101AFI20231121BHJP
   B24B 49/04 20060101ALI20231121BHJP
   B24B 5/04 20060101ALI20231121BHJP
   G05B 23/02 20060101ALI20231121BHJP
【FI】
B24B49/10
B24B49/04 A
B24B5/04
G05B23/02 T
【請求項の数】 26
(21)【出願番号】P 2022206756
(22)【出願日】2022-12-23
(62)【分割の表示】P 2019022199の分割
【原出願日】2019-02-11
(65)【公開番号】P2023024706
(43)【公開日】2023-02-16
【審査請求日】2023-01-19
(31)【優先権主張番号】P 2018139210
(32)【優先日】2018-07-25
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000001247
【氏名又は名称】株式会社ジェイテクト
(74)【代理人】
【識別番号】110000648
【氏名又は名称】弁理士法人あいち国際特許事務所
(72)【発明者】
【氏名】増田 祐生
(72)【発明者】
【氏名】河原 徹
(72)【発明者】
【氏名】村上 慎二
【審査官】城野 祐希
(56)【参考文献】
【文献】特開平11-129145(JP,A)
【文献】特開2015-199152(JP,A)
【文献】特開平07-195183(JP,A)
【文献】特開平08-032281(JP,A)
【文献】特開2017-045300(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B24B 49/10
B24B 49/04
B24B 5/04
G05B 23/02
(57)【特許請求の範囲】
【請求項1】
粗研、精研、微研、スパークアウトの順番の研削工程で砥石車による工作物の研削が行われる研削盤にて前記砥石車により前記工作物の研削を行っている際の実測データであって、前記研削盤の構造部材の状態を表す第一実測データ、および、研削部位に関する第二実測データの少なくとも一つである前記実測データを、前記工作物毎にかつ前記研削工程毎に取得する実測データ取得部と、
複数の前記工作物に関する前記実測データを第一学習用入力データとする機械学習により、前記工作物の研削品質を推定するための第一学習モデルを前記研削工程毎に生成する第一学習モデル生成部と、
を備える、研削品質推定モデル生成装置。
【請求項2】
前記実測データ取得部は、前記研削盤の前記構造部材の振動および前記研削盤の前記構造部材の変形量の少なくとも一つである前記第一実測データ、および、前記研削によって変化する前記工作物の寸法および研削点温度の少なくとも一つである前記第二実測データを、前記実測データとして取得し、
前記第一学習モデル生成部は、複数の前記工作物に関する前記第一実測データおよび前記第二実測データを前記第一学習用入力データとする機械学習により、前記第一学習モデルを生成する、請求項1に記載の研削品質推定モデル生成装置。
【請求項3】
前記研削品質推定モデル生成装置は、さらに、前記工作物の研削品質データを前記工作物毎に取得する研削品質データ取得部を備え、
前記第一学習モデル生成部は、前記研削品質データを教師データとする前記機械学習により、前記第一学習モデルを生成する、請求項1または2に記載の研削品質推定モデル生成装置。
【請求項4】
前記工作物の前記研削品質データは、前記工作物の加工変質層データ、前記工作物の表面性状データ、および、前記工作物のびびり模様データの少なくとも一つである、請求項3に記載の研削品質推定モデル生成装置。
【請求項5】
前記研削品質推定モデル生成装置は、さらに、前記研削盤の制御装置への動作指令データ、および、前記制御装置により制御される駆動装置の実動作データの少なくとも一つである動作関連データを、前記工作物毎にかつ前記研削工程毎に取得する動作関連データ取得部を備え、
前記第一学習モデル生成部は、複数の前記工作物に関する前記実測データおよび前記動作関連データを前記第一学習用入力データとする前記機械学習により、前記第一学習モデルを生成する、請求項1-4の何れか一項に記載の研削品質推定モデル生成装置。
【請求項6】
請求項1-5の何れか一項に記載の研削品質推定モデル生成装置と、
推定フェーズにおいて、新たな工作物の研削を行っている際の前記研削工程毎の前記実測データである推定用入力データと前記第一学習モデルとを用いて、前記新たな工作物の前記研削品質を推定する研削品質推定部と、
を備える、研削品質推定装置。
【請求項7】
前記第一学習モデル生成部は、前記工作物の前記研削品質として、前記工作物の加工変質層の状態、前記工作物の表面性状、および、前記工作物のびびり模様状態の少なくとも一つを推定するための前記第一学習モデルを生成し、
前記研削品質推定部は、前記新たな工作物の前記研削品質として、前記工作物の加工変質層の状態、前記工作物の表面性状、および、前記工作物のびびり模様状態の少なくとも一つを推定する、請求項6に記載の研削品質推定装置。
【請求項8】
前記研削品質推定装置は、さらに、前記研削品質推定部により推定された前記工作物の前記研削品質に基づいて前記工作物の良否を判別する判別部を備える、請求項6または7に記載の研削品質推定装置。
【請求項9】
請求項8に記載の研削品質推定装置と、
前記研削盤の制御装置により制御される駆動装置の実動作データであって予め取得した良品に関する前記実動作データ、または、予め取得した良品に関する前記実測データに基づいて作成された良品加工データを記憶する良品加工データ記憶部と、
前記良品加工データと、前記判別部により不良品と推定された前記工作物に関する前記実動作データまたは実測データである不良品加工データとを比較して、不良品質の発生要因を特定するための加工データ相違情報を抽出する相違情報抽出部と、
を備える、不良品質発生要因推定装置。
【請求項10】
前記不良品質発生要因推定装置は、さらに、
前記加工データ相違情報と前記不良品質の発生要因との関係を示す発生要因関係情報を記憶する関係情報記憶部と、
前記加工データ相違情報と前記発生要因関係情報との関係に基づいて、前記不良品質の発生要因を推定する不良要因推定部と、
を備える、請求項9に記載の不良品質発生要因推定装置。
【請求項11】
前記関係情報記憶部は、前記加工データ相違情報と複数種の前記不良品質の発生要因との関係を示す複数種の前記発生要因関係情報を記憶する、請求項10に記載の不良品質発生要因推定装置。
【請求項12】
前記発生要因関係情報は、前記加工データ相違情報と前記不良品質の発生要因とを学習データとする前記機械学習により生成された学習モデルである、請求項10または11に記載の不良品質発生要因推定装置。
【請求項13】
前記不良品質の発生要因は、前記研削盤による前記工作物の加工条件、前記砥石車の切れ味、および、前記研削盤の構成部品の振動の少なくとも一つである、請求項9-12の何れか一項に記載の不良品質発生要因推定装置。
【請求項14】
前記相違情報抽出部は、前記良品加工データと、前記不良品加工データとの差を、前記加工データ相違情報として抽出する、請求項9-13の何れか一項に記載の不良品質発生要因推定装置。
【請求項15】
前記良品加工データは、予め取得した複数個の良品に関する前記実測データまたは前記実動作データに基づいて作成される、請求項9-14の何れか一項に記載の不良品質発生要因推定装置。
【請求項16】
前記良品加工データ記憶部は、複数種の前記良品加工データを記憶し、
前記相違情報抽出部は、前記複数種の前記良品加工データと、前記不良品加工データとをそれぞれ比較し、複数種の前記加工データ相違情報を抽出する、請求項9-15の何れか一項に記載の不良品質発生要因推定装置。
【請求項17】
請求項6-8の何れか一項に記載の研削品質推定装置と、
前記研削盤にて前記砥石車により工作物の研削を行う際において、前記研削盤の制御装置への動作指令データを前記工作物毎に取得する動作指令データ取得部と、
前記工作物の研削品質データを前記工作物毎に取得する研削品質データ取得部と、
前記工作物毎に、前記研削品質データに応じて前記動作指令データに対する報酬を決定する報酬決定部と、
複数の前記工作物に関する前記動作指令データおよび前記報酬を用いた機械学習により、前記報酬を多くするように前記動作指令データを調整するための第二学習モデルを生成する第二学習モデル生成部と、
更新フェーズにおいて、新たな工作物の研削に関する前記動作指令データ、前記新たな工作物ついて前記研削品質推定部により推定された前記研削品質データ、前記報酬、および、前記第二学習モデルを用いて、前記動作指令データの調整を行う動作指令データ調整部と、
を備える、研削盤の動作指令データ更新装置
【請求項18】
前記工作物の前記研削品質データは、前記工作物の加工変質層データ、前記工作物の表面性状データ、および、前記工作物のびびり模様データの少なくとも一つである、請求項17に記載の研削盤の動作指令データ更新装置
【請求項19】
前記報酬決定部は、前記工作物の前記加工変質層データにおいて、加工変質層が無い場合に前記報酬を多くし、前記加工変質層が有る場合に前記報酬を少なくする、請求項18記載の研削盤の動作指令データ更新装置
【請求項20】
前記報酬決定部は、前記工作物の前記表面性状データが所定閾値以下の場合に前記報酬を多くし、前記所定閾値より大きい場合に前記報酬を少なくする、請求項18に記載の研削盤の動作指令データ更新装置
【請求項21】
前記報酬決定部は、前記工作物の前記びびり模様データにおいて、びびり模様が無しの場合に前記報酬を多くし、びびり模様が有りの場合に前記報酬を少なくする、請求項18に記載の研削盤の動作指令データ更新装置
【請求項22】
前記研削盤の動作指令データ調整モデル生成装置は、さらに、前記砥石車の表面状態データを前記工作物毎に取得する表面状態データ取得部を備え、
前記報酬決定部は、前記工作物毎に、前記研削品質データおよび前記表面状態データに応じて前記動作指令データに対する報酬を決定する、請求項17-21の何れか一項に記載の研削盤の動作指令データ更新装置
【請求項23】
前記砥石車の前記表面状態データは、前記工作物の研削品質に影響を及ぼすデータである、請求項22に記載の研削盤の動作指令データ更新装置
【請求項24】
前記砥石車の前記表面状態データは、前記工作物の加工変質層の状態に対応する第一表面状態データ、前記工作物の表面性状に対応する第二表面状態データ、および、前記工作物のびびり模様状態に対応する第三表面状態データの少なくとも一つである、請求項23に記載の研削盤の動作指令データ更新装置
【請求項25】
前記工作物の前記研削品質データは、請求項6-8の何れか一項に記載の研削品質推定装置により推定された前記研削品質である、請求項17-24の何れか一項に記載の研削盤の動作指令データ更新装置
【請求項26】
前記研削盤の動作指令データ更新装置は、さらに、
請求項10-12の何れか一項に記載の不良品質発生要因推定装置を備え、
前記動作指令データ調整部は、さらに、前記発生要因関係情報を用いて、前記動作指令データの調整を行う、請求項17-25の何れか一項に記載の研削盤の動作指令データ更新装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、研削品質推定モデル生成装置、研削品質推定装置、不良品質発生要因推定装置、および、研削盤の動作指令データ更新装置に関するものである。
【背景技術】
【0002】
研削盤にて砥石車による工作物の研削において、工作物の研削品質が所定条件を満たすようにすることが求められる。例えば、工作物に加工変質層が生じないようにすること、工作物の表面性状(例えば表面粗さ)が所定値以内であること、工作物にびびり模様が生じないようにすること等が求められる。
【0003】
作業者が、研削後の工作物の検査を行うことで、研削品質が所定条件を満たすか否かを確認し、所定条件を満たす場合に良品とすることが行われている。また、特許文献1には、研削を行っている際において測定した研削負荷に基づいて、工作物に加工変質層が生じているか否かを判定することが記載されている。
【0004】
ところで、近年コンピュータの処理速度の向上に伴い、人工知能が急速に発展しており、例えば、特許文献2には、機械学習により、レーザ加工条件データを生成することが記載されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2013-129028号公報
【文献】特開2017-164801号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1に記載されているように、研削負荷を用いるだけでは、加工変質層の有無を高精度に判定することができない。加工変質層が生じる要因には、種々の要因が存在するためである。そこで、種々の要因を考慮して、加工変質層の有無等の工作物の研削品質を取得することが求められる。さらに、工作物の研削品質が良好となるような研削条件を得ることが求められる。
【0007】
本発明は、工作物の研削品質を取得することができる研削品質推定モデル生成装置、および、研削品質推定装置を提供することを目的とする。また、本発明は、不良品と判別された工作物に不良品質が発生した要因を推定できる不良品質発生要因推定装置を提供することを目的とする。また、本発明は、工作物の研削品質を用いて、研削品質を向上させることができる研削盤の動作指令データを取得するために、研削盤の動作指令データ更新装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
(1.研削品質推定モデル生成装置)
本発明の一態様は、粗研、精研、微研、スパークアウトの順番の研削工程で砥石車による工作物の研削が行われる研削盤にて前記砥石車により前記工作物の研削を行っている際の実測データであって、前記研削盤の構造部材の状態を表す第一実測データ、および、研削部位に関する第二実測データの少なくとも一つである前記実測データを、前記工作物毎にかつ前記研削工程毎に取得する実測データ取得部と、
複数の前記工作物に関する前記実測データを第一学習用入力データとする機械学習により、前記工作物の研削品質を推定するための第一学習モデルを前記研削工程毎に生成する第一学習モデル生成部と、
を備える、研削品質推定モデル生成装置にある
【0009】
第一学習モデルは、実測データを第一学習用入力データとする機械学習により生成されている。そして、実測データは、研削盤の構造部材の状態を表す第一実測データ、および、研削部位に関する第二実測データの少なくとも一つである。そして、実測データは、工作物毎にかつ研削工程毎に取得したデータである。例えば、実測データは、工作物毎における研削初期から研削終期までのデータや、粗研の初期から粗研の終期までのデータ等である。従って、1つの工作物の実測データだけでも、多量のデータとなる。さらに、複数の工作物に関する実測データとなれば、極めて多量のデータとなる。しかし、第一学習モデルは、機械学習を用いることによって、複数の工作物に関する多量の実測データを用いるとしても、容易に生成することができる。
【0010】
従って、工作物の研削品質に影響を及ぼす多量の実測データを考慮して第一学習モデルを生成することで、結果として、工作物の研削品質を取得することができる。なお、研削盤の構造部材の状態を表す第一実測データは、例えば、構造部材の振動、構造部材の変形量等である。研削部位に関する第二実測データは、例えば、研削によって変化する工作物の寸法、研削点温度等である。
【0011】
(2.研削品質推定装置)
本発明の他の態様は、上述した研削品質推定モデル生成装置と、
推定フェーズにおいて、新たな工作物の研削を行っている際の前記研削工程毎の前記実測データである推定用入力データと前記第一学習モデルとを用いて、前記新たな工作物の前記研削品質を推定する研削品質推定部と、
を備える、研削品質推定装置にある
機械学習により生成された第一学習モデルを用いることで、新たな工作物に関する多量の実測データである推定用入力データに基づいて、当該新たな工作物の研削品質を推定することができる。
【0012】
(3.不良品質発生要因推定装置)
本発明の他の態様は、上述した研削品質推定装置と、
前記研削盤の制御装置により制御される駆動装置の実動作データであって予め取得した良品に関する前記実動作データ、または、予め取得した良品に関する前記実測データに基づいて作成された良品加工データを記憶する良品加工データ記憶部と、
前記良品加工データと、前記判別部により不良品と推定された前記工作物に関する前記実動作データまたは実測データである不良品加工データとを比較して、不良品質の発生要因を特定するための加工データ相違情報を抽出する相違情報抽出部と、
を備える、不良品質発生要因推定装置にある
【0013】
当該不良品質発生要因推定装置は、相違情報抽出部により抽出された加工データ相違情報を用いて、判別部により不良品と推定された工作物に関して、不良品質が発生した要因を推定することができる。
【0014】
(4.研削盤の動作指令データ更新装置
本発明の他の態様は、上述した研削品質推定装置と、
前記研削盤にて前記砥石車により工作物の研削を行う際において、前記研削盤の制御装置への動作指令データを前記工作物毎に取得する動作指令データ取得部と、
前記工作物の研削品質データを前記工作物毎に取得する研削品質データ取得部と、
前記工作物毎に、前記研削品質データに応じて前記動作指令データに対する報酬を決定する報酬決定部と、
複数の前記工作物に関する前記動作指令データおよび前記報酬を用いた機械学習により、前記報酬を多くするように前記動作指令データを調整するための第二学習モデルを生成する第二学習モデル生成部と、
更新フェーズにおいて、新たな工作物の研削に関する前記動作指令データ、前記新たな工作物ついて前記研削品質推定部により推定された前記研削品質データ、前記報酬、および、前記第二学習モデルを用いて、前記動作指令データの調整を行う動作指令データ調整部と、
を備える、研削盤の動作指令データ更新装置にある
【0015】
当該更新装置は、機械学習により、研削盤の動作指令データを調整するための第二学習モデルを生成する。そして、機械学習においては、複数の工作物に関する動作指令データおよび報酬を用いている。従って、多量のデータを用いたとしても、機械学習を適用することにより、第二学習モデルを容易に生成することができる。さらに、機械学習においては、工作物の研削品質データを用いて決定された報酬を多くするように、研削盤の動作指令データが調整されている。従って、研削品質が良好となるような動作指令データを生成することができるようになる。
【0016】
さらに、機械学習により生成された第二学習モデルを用いて動作指令データが更新される。そのため、研削状態が変化したとしても、動作指令データが現在の研削状態に応じて更新されていく。このように動作指令データが更新されることによって、工作物の研削品質を良好とすることができる。
【図面の簡単な説明】
【0017】
図1】研削盤を示す平面図である。
図2】第一実施形態の機械学習装置の概要構成を示す機能ブロック図である。
図3】第一実施形態の機械学習装置の学習フェーズの詳細構成を示す機能ブロック図である。
図4】第一実施形態の機械学習装置の推定フェーズの詳細構成を示す機能ブロック図である。
図5】第二実施形態の機械学習装置の概要構成を示す機能ブロック図である。
図6】第二実施形態の機械学習装置の学習フェーズの詳細構成を示す機能ブロック図である。
図7】第二実施形態の機械学習装置の推定フェーズの詳細構成を示す機能ブロック図である。
図8】第三実施形態の機械学習装置の概要構成を示す機能ブロック図である。
図9】第三実施形態の機械学習装置の学習フェーズの詳細構成を示す機能ブロック図である。
図10】第三実施形態の機械学習装置の推定フェーズの詳細構成を示す機能ブロック図である。
図11】第四実施形態の機械学習装置の概要構成を示す機能ブロック図である。
図12】第四実施形態の機械学習装置の学習フェーズの詳細構成を示す機能ブロック図である。
図13】第四実施形態の機械学習装置の推定フェーズの詳細構成を示す機能ブロック図である。
【発明を実施するための形態】
【0018】
(1.第一実施形態)
(1-1.研削盤の構成)
研削盤1の構成について、図1を参照して説明する。研削盤1は、工作物Wを研削するための機械である。研削盤1は、円筒研削盤、カム研削盤等、種々の構成の研削盤を適用できる。本実施形態においては、研削盤1は、砥石台トラバース型の円筒研削盤を例にあげる。ただし、研削盤1は、テーブルトラバース型を適用することもできる。
【0019】
研削盤1は、主として、ベッド11、主軸台12、心押台13、トラバースベース14、砥石台15、砥石車16、定寸装置17、砥石車修正装置18、クーラント装置19、及び、制御装置20を備える。
【0020】
ベッド11は、設置面上に固定されている。主軸台12は、ベッド11の上面において、X軸方向の手前側(図1の下側)且つZ軸方向の一端側(図1の左側)に設けられている。主軸台12は、工作物WをZ軸回りに回転可能に支持する。工作物Wは、主軸台12に設けられたモータ12aの駆動により回転される。心押台13は、ベッド11の上面において、主軸台12に対してZ軸方向に対向する位置、すなわち、X軸方向の手前側(図1の下側)且つZ軸方向の他端側(図1の右側)に設けられている。つまり、主軸台12および心押台13が、工作物Wを回転可能に両端支持する。
【0021】
トラバースベース14は、ベッド11の上面において、Z軸方向に移動可能に設けられている。トラバースベース14は、ベッド11に設けられたモータ14aの駆動により移動する。砥石台15は、トラバースベース14の上面において、X軸方向に移動可能に設けられている。砥石台15は、トラバースベース14に設けられたモータ15aの駆動により移動する。砥石車16は、砥石台15に回転可能に支持されている。砥石車16は、砥石台15に設けられたモータ16aの駆動により回転する。砥石車16は、複数の砥粒をボンド材により固定されて構成されている。
【0022】
定寸装置17は、工作物Wの寸法(径)を測定する。砥石車修正装置18は、砥石車16の形状を修正する。砥石車修正装置18は、砥石車16のツルーイングを行う装置である。砥石車修正装置18は、ツルーイングに加えて、または、ツルーイングに代えて、砥石車16のドレッシングを行う装置としてもよい。さらに、砥石車修正装置18は、砥石車16の寸法(径)を測定する機能も有する。
【0023】
ここで、ツルーイングは、形直し作業であり、研削によって砥石車16が摩耗した場合に工作物Wの形状に合わせて砥石車16を成形する作業、片摩耗によって砥石車16の振れを取り除く作業等である。ドレッシングは、目直し(目立て)作業であり、砥粒の突き出し量を調整したり、砥粒の切れ刃を創成したりする作業である。ドレッシングは、目つぶれ、目詰まり、目こぼれ等を修正する作業であって、通常ツルーイング後に行われる。
【0024】
クーラント装置19は、砥石車16による工作物Wの研削点にクーラントを供給する。クーラント装置19は、回収したクーラントを、所定温度に冷却して、再度研削点に供給する。
【0025】
制御装置20は、工作物Wの形状、加工条件、砥石車16の形状、クーラントの供給タイミング情報等の動作指令データに基づいて生成されたNCプログラムに基づいて、各駆動装置を制御する。すなわち、制御装置20は、動作指令データを入力し、動作指令データに基づいてNCプログラムを生成し、NCプログラムに基づいて各モータ12a,14a,15a,16aおよびクーラント装置19等を制御することにより工作物Wの研削を行う。特に、制御装置20は、定寸装置17により測定される工作物Wの径に基づいて、工作物Wが仕上げ形状となるまで研削を行う。また、制御装置20は、砥石車16を修正するタイミングにおいて、各モータ14a,15a,16a、および、砥石車修正装置18等を制御することにより、砥石車16の修正(ツルーイングおよびドレッシング)を行う。
【0026】
また、図1には一部を図示しないが、研削盤1は、後述する各種センサ21,22,23(図3等に示す)を備えている。例えば、研削盤1は、各モータ等の実動作データ、研削盤1を構成する構造部材の状態を示すデータ、定寸装置17、砥石径センサ、温度センサ等を備える。なお、各種センサ等の詳細は、後述する。
【0027】
(1-2.機械学習装置100の概要)
次に、第一実施形態の機械学習装置100の概要について、図2を参照して説明する。機械学習装置100は、(a)工作物Wの研削品質を推定するための第一学習モデルを生成すると共に、(b)第一学習モデルを用いて工作物Wの研削品質を推定する。機械学習装置100は、研削盤1とは別の装置として構成することもできるし、研削盤1の制御装置20等に組み込まれた装置として構成することもできる。本実施形態においては、機械学習装置100は、研削盤1とネットワーク線により接続されており、各種データの送受信を行う。
【0028】
機械学習装置100は、第一学習モデルを生成する第一学習フェーズ101において機能する要素101a,101b,101c、および、研削品質を推定する推定フェーズ102(一般に「推論フェーズ」とも称する)において機能する要素102a,102bを備える。機械学習装置100は、第一学習フェーズ101において機能する要素として、第一学習用入力データを取得する要素101a、第一教師データを取得する要素101b、および、第一学習モデルの生成を行う要素101cを備える。
【0029】
要素101aにおいて取得される第一学習用入力データは、機械学習に用いられる入力データであって、例えば、動作指令データ、実動作データ、第一実測データ(構造部材の状態を表すデータ)、第二実測データ(研削部位に関するデータ)等である。
【0030】
要素101bにおいて取得される第一教師データは、教師有り学習における機械学習に用いられる教師データである。第一教師データは、工作物Wの研削品質データであって、例えば、工作物Wの加工変質層データ、工作物Wの表面性状データ、工作物Wのびびり模様データ等である。
【0031】
要素101cにおいて生成される第一学習モデルは、第一学習用入力データおよび第一教師データに基づいて、機械学習のうち教師有り学習を行うことによって工作物Wの研削品質を推定するためのモデル(関数)である。ただし、第一学習モデルは、研削品質の分類分けを行うことを目的として、教師無し学習を適用することにより生成することもできる。ただし、教師有り学習を適用する場合には、高精度に研削品質を取得することができる。
【0032】
機械学習装置100は、推定フェーズ102において機能する要素として、推定用入力データを取得する要素102a、並びに、研削品質の推定および工作物Wの良否の判別を行う要素102bを備える。要素102aにおいて取得される推定用入力データは、第一学習用入力データと同種のデータであって、学習に用いた工作物Wとは異なる工作物W(新しい工作物W)に関して取得されるデータである。要素102bは、推定用入力データと第一学習モデルとを用いて研削品質を推定すると共に、推定された研削品質に基づいて工作物Wの良否を判別する。要素102bにて用いる第一学習モデルは、第一学習フェーズ101において機械学習によって生成される第一学習モデルである。
【0033】
(1-3.機械学習装置100に関連する研削盤1の構成)
機械学習装置100に関連する研削盤1の構成について、図3を参照して説明する。図3に示すように、研削盤1は、制御装置20を備える。制御装置20は、いわゆるCNC(Computerized Numerical Control)装置である。上述したように、制御装置20は、動作指令データに基づいてNCプログラムを生成し、当該NCプログラムに基づいて、各駆動装置12a,14a,15a,16a,17,18(図3では「12a等」と記載する)を制御する。
【0034】
各駆動装置12a,14a,15a,16a,17,18が駆動することによって、構造部材12,13,14,15(図3では「15等」を記載する。)が動作する。構造部材12,13,14,15の動作によって、工作物Wが砥石車16による研削が行われる。図3では、工作物Wにおいて砥石車16によって研削される部位が研削部位として示される。
【0035】
研削盤1は、さらに、駆動装置12a等の実動作データを検出するセンサ21、構造部材15等の状態(構造部材の状態を表すデータ)を検出するセンサ22、研削によって変化する研削部位Wに関するデータ(研削部位データ)を検出するセンサ23を備える。センサ21は、例えば、モータ12aの駆動電流を検出する電流センサ、モータ12aの現在位置(回転角度)を検出する位置センサ等である。センサ21は、他の駆動装置14a,15a,16a,17,18についても同様の情報を検出する。センサ22は、構造部材15等の振動を検出する振動センサ、構造部材15等の変形量を検出する歪センサ等である。振動センサは、振動に対応する加速度を検出するセンサ、振動に対応する音波を検出するセンサ等を適用できる。センサ23は、研削によって変化する工作物Wの寸法(径)を検出する定寸装置、研削時における研削点温度を検出する温度センサである。
【0036】
(1-4.機械学習装置100に関連する外部装置2の構成)
機械学習装置100に関連する外部装置2の構成について、図3を参照して説明する。外部装置2は、研削盤1にて砥石車16によって研削された工作物Wの研削品質データを工作物W毎に検出する。研削品質データには、例えば、加工変質層データ(研削焼け等のデータ)、表面性状データ(表面粗さ等のデータ)、びびり模様データ等が含まれる。
【0037】
すなわち、外部装置2は、加工変質層データ(研削焼け、研削による軟化層等に関するデータ)を取得する加工変質層検出器、表面性状データ(表面粗さ等に関するデータ)を取得する表面性状測定器、びびり模様データを取得するびびり検出器等である。なお、外部装置2は、当該データを直接取得する装置としてもよい。また、外部装置2は、相関を有する別データを取得して、当該別データを用いて演算することにより目的のデータを取得する装置、すなわち目的のデータを間接的に取得する装置としてもよい。
【0038】
加工変質層データは、加工変質層の有無に関するデータとしてもよいし、加工変質層の程度に関するスコアとしてもよい。表面性状データは、例えば表面粗さの値そのものとしてもよいし、表面粗さの程度に関するスコアとしてもよい。また、びびり模様データは、びびり模様の有無に関するデータとしてもよいし、びびり模様の程度に関するスコアとしてもよい。各スコアは、例えば、複数段階の評点などで表される。
【0039】
(1-5.機械学習装置100の第一学習フェーズ101の詳細構成)
機械学習装置100の第一学習フェーズ101の詳細構成について図3を参照して説明する。ここで、第一学習フェーズ101の構成が、研削品質推定モデル生成装置に相当する。
【0040】
第一学習フェーズ101の構成は、第一入力データを取得する第一入力データ取得部130と、研削品質データを取得する研削品質データ取得部140と、第一学習モデル生成部150と、第一学習モデル記憶部160とを備えて構成される。
【0041】
第一入力データ取得部130は、複数の工作物Wに関する第一入力データを、機械学習の第一学習用入力データとして取得する。また、研削品質データ取得部140は、当該複数の工作物Wに関する研削品質データを、機械学習の第一教師データとして取得する。ここで、第一学習用入力データおよび第一教師データは、表1に示すとおりである。表1に示すように、第一学習用入力データは、多数のデータとしているが、表1に示す全てのデータを用いる必要はなく、一部のデータのみを用いるようにしてもよい。
【0042】
【表1】
【0043】
第一入力データ取得部130は、動作関連データ取得部110と、実測データ取得部120とを備える。動作関連データ取得部110は、制御装置20への動作指令データを取得する動作指令データ取得部111、制御装置20により制御される駆動装置12a等の実動作データをセンサ21から取得する実動作データ取得部112を備える。
【0044】
動作関連データのうちの動作指令データは、表1に示すように、工程毎の指令切込速度、工程切替時の移動体14,15の指令位置、砥石車16の指令回転速度、工作物Wの指令回転速度、クーラントの供給情報等である。ここで、工作物Wの研削は、例えば、粗研、精研、微研、スパークアウト等の複数の研削工程によって行われる。動作関連データのうちの実動作データは、表1に示すように、モータ12a等の駆動電流、モータ12a等の実位置等である。実動作データ取得部112は、工作物W毎に所定期間分の実動作データを取得する。所定期間分とは、例えば、研削初期から研削終期まで、粗研の初期から粗研の終期まで等である。なお、研削が非定常状態の時には、不安定であるため、定常状態のみを対象としてデータを取得することも可能である。
【0045】
実測データ取得部120は、第一実測データをセンサ22から取得する第一実測データ取得部121、第二実測データをセンサ23から取得する第二実測データ取得部122を備える。第一実測データは、砥石車16により工作物Wの研削を行っている際の実測データであって、構造部材15等の振動、構造部材15等の変形量等である。第二実測データは、砥石車16により工作物Wの研削を行う際の実測データであって、工作物Wの寸法(径)、研削点温度等である。
【0046】
第一実測データ取得部121は、第一実測データを、工作物W毎に所定期間分取得する。また、第二実測データ取得部122も、第二実測データを、工作物W毎に所定期間分取得する。第一実測データおよび第二実測データは、上述した実動作データと同一の所定期間の分だけ取得される。所定期間は、上述したように、例えば、研削初期から研削終期まで、粗研の初期から粗研の終期まで等である。
【0047】
研削品質データ取得部140は、外部装置2によって取得された複数の工作物Wに関する研削品質データを、教師有り学習の第一教師データとして取得する。つまり、研削品質データ取得部140は、例えば、加工変質層データ(研削焼け、研削による軟化層等に関するデータ)、表面性状データ(表面粗さ等のデータ)、びびり模様データ等を、第一教師データとして取得する。
【0048】
第一学習モデル生成部150は、教師有り学習を行って、第一学習モデルを生成する。詳細には、第一学習モデル生成部150は、第一入力データ取得部130が取得した複数の工作物Wに関する第一入力データを第一学習用入力データとし、且つ、研削品質データ取得部140が取得した複数の工作物Wに関する研削品質データを第一教師データとする機械学習により、工作物Wの研削品質を推定するための第一学習モデルを生成する。
【0049】
つまり、第一学習モデル生成部150は、動作指令データ、実動作データ、第一実測データ、第二実測データを第一学習用入力データとし、且つ、研削品質データを第一教師データとする機械学習により、第一学習モデルを生成する。第一学習モデルは、第一学習用入力データと第一教師データとの関係を示すモデルである。
【0050】
ここで、第一学習用入力データのうち、少なくとも、実動作データ、第一実測データおよび第二実測データは、工作物W毎の所定期間分のデータである。従って、1つの工作物Wに関する第一学習用入力データだけでも、多量のデータとなる。さらに、複数の工作物Wに関する第一学習用入力データとなれば、極めて多量のデータとなる。しかし、第一学習モデルは、機械学習を用いることによって、複数の工作物Wに関する多量の第一学習用入力データを用いるとしても、容易に生成することができる。従って、後述するが、工作物Wの研削品質に影響を及ぼす多量の第一学習用入力データを考慮して第一学習モデルを生成することで、結果として、工作物Wの研削品質を取得することができる。
【0051】
第一学習モデルは、工作物Wの研削品質として、工作物Wの加工変質層の状態、工作物Wの表面性状、および、工作物Wのびびり模様状態を推定するためのモデルである。ただし、第一学習モデルは、これら全ての研削品質を推定する場合に限られず、これらの一部のみの研削品質を推定するようにしてもよい。そして、第一学習モデル生成部150によって生成された第一学習モデルは、第一学習モデル記憶部160に記憶される。
【0052】
また、取得する所定期間が、研削初期から研削終期までである場合には、第一学習モデルは、全ての研削工程を考慮したモデルとなる。一方、取得する所定期間が、例えば粗研の初期から粗研の終期までである場合には、第一学習モデルは、粗研工程のみを考慮した学習モデルとなる。研削品質に影響を及ぼす工程を特定したい場合には、工程毎に第一学習モデルを取得するようにしてもよい。
【0053】
(1-6.機械学習装置100の推定フェーズ102の詳細構成)
機械学習装置100の推定フェーズ102の詳細構成について図4を参照して説明する。ここで、第一学習フェーズ101の構成および推定フェーズ102の構成が、研削品質推定装置に相当する。第一学習フェーズ101の構成は、上述したとおりである。
【0054】
推定フェーズ102の構成は、第一入力データを取得する第一入力データ取得部130と、第一学習モデル記憶部160と、研削品質推定部170と、判別部180とを備えて構成される。第一入力データ取得部130は、新たな工作物Wの研削における第一入力データを所定期間分取得しており、第一学習フェーズ101において説明した内容と実質的に同一である。ここでの所定期間とは、第一学習フェーズ101における所定期間と同一とする。第一学習モデル記憶部160は、第一学習フェーズ101において説明したように、第一学習モデル生成部150によって生成された第一学習モデルを記憶する。
【0055】
研削品質推定部170は、新たな工作物Wの研削を行っている際の所定期間分の第一入力データを推定用入力データとし、第一学習モデル記憶部160に記憶されている第一学習モデルを用いることで、新たな工作物Wの研削品質を推定する。ここで、第一学習モデルは、上述したように、第一学習用入力データと、第一教師データとの関係を示すモデルである。そして、第一学習モデルは、第一教師データである研削品質データとして、工作物Wの加工変質層の状態、工作物Wの表面性状、および、工作物Wのびびり模様状態に関するモデルである。
【0056】
そこで、研削品質推定部170は、研削品質として、工作物Wの加工変質層の状態、工作物Wの表面性状、および、工作物Wのびびり模様状態を推定する。ただし、研削品質推定部170は、当該全ての研削品質を推定するのではなく、一部の研削品質のみを推定するようにしてもよい。例えば、研削品質推定部170は、加工変質層の状態のみを推定するようにしてもよい。この場合、第一学習モデルが、加工変質層の状態のみを推定するようなモデルとして生成されていることになる。
【0057】
研削品質推定部170は、上記のように、複数の対象を推定している。機械学習を適用して生成された第一学習モデルを用いることにより、研削品質推定部170は、複数の対象を容易に推定することができる。このように、機械学習装置100は、複雑化された対象を一度に推定することができる。
【0058】
判別部180は、研削品質推定部170により推定された工作物Wの研削品質に基づいて工作物Wの良否を判別する。例えば、判別部180は、推定された加工変質層の状態に基づいて、工作物Wに加工変質層が存在している(所定条件を満たしていない)と判別された場合には、当該工作物Wは不良品と判別する。また、判別部180は、推定された表面性状が所定条件を満たしていないと判別された場合には、当該工作物Wは不良品と判別する。また、判別部180は、推定されたびびり模様状態に基づいて、びびり模様が存在している(所定条件を満たしていない)と判別された場合には、当該工作物Wは不良品と判別する。
【0059】
一方、判別部180は、加工変質層の状態、表面性状、および、びびり模様状態に関して各条件を満たす場合に、当該工作物Wは良品と判別する。このように、機械学習を適用して生成された第一学習モデルを用いることにより、複数の条件について、容易に判別することができる。
【0060】
(2.第二実施形態)
(2-1.機械学習装置200の概要)
第二実施形態の機械学習装置200の概要について、図5を参照して説明する。機械学習装置200は、第一実施形態の機械学習装置100と同様に、(a)工作物Wの研削品質を推定するための第一学習モデルを生成すると共に、(b)第一学習モデルを用いて工作物Wの研削品質を推定する。さらに、機械学習装置200は、(c)研削品質が良好となるように、研削盤1の動作指令データを調整するための第二学習モデルを生成すると共に、(d)第二学習モデルを用いて研削品質が良好となるように、研削盤1の動作指令データを更新する。
【0061】
機械学習装置200は、第一学習モデルを生成する第一学習フェーズ101において機能する要素101a,101b,101c、および、研削品質を推定する推定フェーズ102において機能する要素102a,102bを備える。第一学習フェーズ101および推定フェーズ102は、第一実施形態の対応するフェーズと同一構成を有する。
【0062】
また、機械学習装置200は、第二学習モデルを生成する第二学習フェーズ203において機能する要素として、第二学習用入力データを取得する要素203a、第一評価結果データを取得する要素203b、および、第二学習モデルの生成を行う要素203cを備える。
【0063】
要素203aにおいて取得される第二学習用入力データは、機械学習に用いられる入力データであって、例えば、動作指令データ等である。動作指令データは、第一実施形態における表1に示すように、工程毎の指令切込速度、工程切替時の移動体14,15の指令位置、砥石車16の指令回転速度、工作物Wの指令回転速度、クーラントの供給情報等である。動作指令データは、制御装置20にて実行されるNCプログラムを生成するためのデータである。
【0064】
要素203bにおいて取得される第一評価結果データは、強化学習における機械学習に用いられる報酬を導き出すための評価結果データである。第一評価結果データは、工作物Wの研削品質データであって、例えば、工作物Wの加工変質層データ、工作物Wの表面性状データ、工作物Wのびびり模様データ等である。要素203cにおいて生成される第二学習モデルは、第二学習用入力データおよび第一評価結果データに基づいて、機械学習のうち強化学習を行うことによって研削盤1の動作指令データを調整するためのモデル(関数)である。
【0065】
機械学習装置200は、動作指令データを更新する更新フェーズ204において機能する要素として、更新用入力データを取得する要素204a、並びに、動作指令データの更新を行う要素204bを備える。要素204aにおいて取得される更新用入力データは、第二学習用入力データと同種のデータであって、学習に用いた工作物Wとは異なる工作物W(新しい工作物W)に関して取得されるデータである。要素204bは、更新用入力データ、第二学習モデル、および、推定された研削品質を用いて、動作指令データを更新する。要素204bにて用いる第二学習モデルは、第二学習フェーズ203において機械学習によって生成される第二学習モデルである。また、推定された研削品質は、推定フェーズ102において推定された研削品質である。
【0066】
(2-2.機械学習装置200の第一学習フェーズ101の詳細構成)
機械学習装置200の第一学習フェーズ101の詳細構成は、第一実施形態と同一構成である。
【0067】
(2-3.機械学習装置200の第二学習フェーズ203の詳細構成)
機械学習装置200の第二学習フェーズ203の詳細構成について図6を参照して説明する。ここで、第二学習フェーズ203の構成が、研削盤の動作指令データ調整モデル生成装置に相当する。
【0068】
第二学習フェーズ203の構成は、動作指令データ取得部111と、研削品質データ取得部140と、報酬決定部210と、第二学習モデル生成部220と、第二学習モデル記憶部230とを備えて構成される。
【0069】
動作指令データ取得部111は、研削盤1にて砥石車16により工作物Wの研削を行う際において、研削盤1の制御装置20への動作指令データを取得する。動作指令データ取得部111は、複数の工作物Wに関する動作指令データを、機械学習の第二学習用入力データとして取得する。また、研削品質データ取得部140は、複数の工作物Wに関する研削品質データを、機械学習の第一評価結果データとして取得する。ここで、第二学習用入力データおよび第一評価結果データは、表2に示すとおりである。ここで、表2に示すように、第二学習用入力データは、多数のデータとしているが、表2に示す全てのデータを用いる必要はなく、一部のデータのみを用いるようにしてもよい。
【0070】
【表2】
【0071】
報酬決定部は210、第二学習用入力データである動作指令データおよび第一評価結果データである研削品質データを取得して、研削品質データに応じて、動作指令データに対する報酬を決定する。ここで、報酬は、強化学習において、動作指令データの組み合わせに対する報酬である。そして、当該動作指令データに対応する研削品質データが望ましい結果を導き出した時に、当該動作指令データに対して多くの報酬が付与され、望ましくない結果を導き出した時に、当該動作指令データに対して少ない報酬(マイナスの報酬を含む)が付与される。
【0072】
例えば、報酬決定部210は、工作物Wの加工変質層データにおいて、加工変質層が無い場合に報酬を多くし、加工変質層が有る場合に報酬を少なくする。また、報酬決定部210は、工作物Wの表面性状データが所定閾値以下の場合に報酬を多くし、表面性状データが所定閾値より大きい場合に報酬を少なくする。さらに、報酬決定部210は、工作物Wのびびり模様データにおいて、びびり模様が無しの場合に報酬を多くし、びびり模様が有りの場合に報酬を少なくする。なお、報酬決定部210は、加工変質層データ、表面性状データ、および、びびり模様データの全てに基づいて報酬を決定してもよいし、これらの何れかのみに基づいて報酬を決定してもよい。
【0073】
第二学習モデル生成部220は、機械学習により、報酬を多くするように動作指令データを調整するための第二学習モデルを生成する。第二学習モデル生成部220において、強化学習として、例えば、Q学習、Sarsa、モンテカルロ法等が適用される。
【0074】
ここで、調整前の動作指令データが、第一の工作物Wに関するデータであり、調整後の動作指令データが、第二の工作物Wに関するデータであるとする。第一の工作物Wに関する動作指令データと当該第一の工作物Wの研削品質データとの関係を、第一データ関係とする。第二の工作物Wの動作指令データと当該第二の工作物Wの研削品質データとの関係を、第二データ関係とする。
【0075】
そして、第二学習モデルは、調整前である第一データ関係と調整後である第二データ関係との相互関係を表すモデルである。第二学習モデル生成部220は、調整後である第二の工作物Wの研削品質データが調整前である第一の工作物Wの研削品質データより良好となるように、すなわち報酬が多くなるように、調整前である第一の工作物Wの動作指令データから調整後である第二の工作物Wの動作指令データへの調整方法を学習する。
【0076】
ただし、調整後の動作指令データは、調整前の動作指令データに対して、予め設定された制約の範囲内で調整可能とされている。例えば、調整可能なパラメータの一つである指令切込速度においては、調整後の指令切込速度は、調整前の指令切込速度に対して所定割合(例えば±3%)内に制限されている。所定割合は、任意に設定可能である。その他の調整可能なパラメータについても同様である。また、調整可能なパラメータを設定することも可能である。そして、生成された第二学習モデルは、第二学習モデル記憶部230に記憶される。
【0077】
なお、第二学習モデル生成部220は、後述する更新フェーズ204においても第二学習モデルを学習することも可能である。この場合、第一評価結果データである研削品質データは、推定フェーズ102(第一実施形態にて説明)により得られた研削品質データを用いる。
【0078】
(2-4.機械学習装置200の推定フェーズ102の詳細構成)
機械学習装置200の推定フェーズ102は、第一実施形態の推定フェーズ102と同一である。
【0079】
(2-5.機械学習装置200の更新フェーズ204の詳細構成)
機械学習装置200の更新フェーズ204の詳細構成について図7を参照して説明する。ここで、第二学習フェーズ203の構成および更新フェーズ204の構成が、研削盤の動作指令データ更新装置に相当する。第二学習フェーズ203の構成は、上述したとおりである。
【0080】
更新フェーズ204の構成は、動作指令データ取得部111と、研削品質データ取得部140と、報酬決定部210と、第二学習モデル記憶部230と、動作指令データ調整部240とを備えて構成される。
【0081】
動作指令データ取得部111および研削品質データ取得部140は、新たな工作物Wの研削における各データを取得し、第二学習フェーズ203において説明した内容と実質的に同一である。報酬決定部210は、新たな工作物Wの研削において取得した動作指令データおよび研削品質データを用いて、報酬を決定する。すなわち、報酬決定部210は、新たな工作物Wの研削に関して、研削品質データに応じて、動作指令データに対する報酬を決定する。第二学習モデル記憶部230は、第二学習フェーズ203において説明したように、第二学習モデル生成部220によって生成された第二学習モデルを記憶する。
【0082】
動作指令データ調整部240は、新たな工作物Wの研削に関する動作指令データ、新たな工作物Wの研削品質データ、報酬、および、第二学習モデルを用いて、動作指令データの調整方法を決定し、決定した調整方法に基づいて動作指令データの調整を行う。ここで、第二学習モデルは、報酬が多くなるように、調整前の動作指令データから調整後の動作指令データへの調整方法を学習することによって生成されたモデルである。
【0083】
詳細には、動作指令データ調整部240は、現在の動作指令データを調整前の動作指令データとして取得し、そのときの報酬を取得する。この場合に、動作指令データ調整部240は、現在の動作指令データと、現在の動作指令データに対する報酬と、第二学習モデルとを用いて、調整すべき動作指令データを決定する。つまり、調整すべき動作指令データは、現在の動作指令データにおける報酬よりも多くの報酬となるような動作指令データとなる。
【0084】
動作指令データ調整部240の処理において、調整すべき動作指令データとして、報酬が同等となる複数の候補が出力される場合がある。この場合には、例えば、動作指令データ調整部240は、調整するパラメータの優先順位を設定することにより、複数の候補に対して順位付けを行うことができる。例えば、調整するパラメータの優先順位とは、第一位を指令切込速度とし、第二位を工作物Wの指令回転速度とする等である。
【0085】
そして、動作指令データ調整部240は、第一位の候補を、調整すべき動作指令データと決定し、現在の動作指令データを当該調整すべき動作指令データに更新する。そうすると、研削盤1は、更新された動作指令データに基づいて工作物Wの研削を行う。そして、機械学習装置200の更新フェーズ204において、当該工作物Wの研削における各データに基づいて、再び、次の研削における動作指令データを調整する。なお、動作指令データの調整の頻度を設定することもできる。例えば、設定数の工作物Wを研削した後に、動作指令データを調整するようにしてもよい。
【0086】
つまり、機械学習装置200の機械学習により生成された第二学習モデルを用いて動作指令データが更新される。そのため、研削状態が変化したとしても、動作指令データが現在の研削状態に応じて更新されていく。このように動作指令データが更新されることによって、工作物Wの研削品質を良好とすることができる。
【0087】
(3.第三実施形態)
(3-1.機械学習装置300の概要)
第三実施形態の機械学習装置300の概要について、図8を参照して説明する。機械学習装置300は、(a)工作物Wの研削品質を推定するための第一学習モデルを生成すると共に、(b)第一学習モデルを用いて工作物Wの研削品質を推定する。さらに、機械学習装置300は、(e)砥石車16の表面状態を推定するための第三学習モデルを生成すると共に、(f)第三学習モデルを用いて砥石車16の表面状態を推定する。さらに、機械学習装置300は、(g)研削品質が良好となるように、且つ、砥石車16の修正または交換の頻度を少なくするように、研削盤1の動作指令データを調整するための第二学習モデルを生成すると共に、(h)第二学習モデルを用いて、研削品質が良好となるように、且つ、砥石車16の修正または交換の頻度を少なくするように、研削盤1の動作指令データを更新する。
【0088】
機械学習装置300は、第一学習モデルおよび第三学習モデルを生成する第一学習フェーズ305において機能する要素101a,101b,101c,305d,305eを備える。機械学習装置300は、第一学習フェーズ305において機能する要素として、第一学習用入力データを取得する要素101a、第一教師データを取得する要素101b、第一学習モデルの生成を行う要素101c、第二教師データを取得する要素305d、および、第三学習モデルの生成を行う要素305eを備える。ここで、要素101a,101b,101cは、第一実施形態の対応する要素と同一構成を有する。
【0089】
要素305dにおいて取得される第二教師データは、教師有り学習における機械学習に用いられる教師データである。第二教師データは、砥石車16の表面状態を表すデータ(砥石車16の表面状態データ)である。砥石車16の表面状態データは、例えば、目つぶれ、目詰まり、目こぼれ等が生じている状態に関するデータ、目立てすぎの状態に関するデータ等である。
【0090】
砥石車16の表面は、工作物Wの研削品質に影響を及ぼす。すなわち、砥石車16の表面状態とは、工作物Wの研削品質に影響を及ぼす程度である。砥石車16の表面状態とは、例えば、目つぶれ、目詰まり、目こぼれ等が生じている状態、目立てすぎの状態等である。そして、砥石車16の表面状態が良好でない場合には、工作物Wの研削品質が低下するおそれがある。従って、砥石車16の表面状態を把握することが求められる。
【0091】
砥石車16の表面状態が、目つぶれ、目詰まり、目こぼれ等が生じている場合には、ドレッシングを行ったり、ツルーイングにより成形した後にドレッシングを行ったりすることが必要となる。また、砥石車16の表面状態が、目立てすぎの状態であれば、ツルーイングを行うことが必要となる。通常、ツルーイング後には、ドレッシングが行われる。そして、ツルーイング回数が所定回数に到達した場合には、または、ツルーイングにより所定量成形した場合には、砥石車16の交換を行う必要がある。
【0092】
そして、砥石車16の寿命を向上するためには、ツルーイングおよびドレッシングを行う回数を少なくすることが求められる。さらに、ツルーイング、ドレッシングおよび砥石車16の交換を行うと、これらに要する時間によって、研削サイクル時間が長くなることになる。当然に、研削サイクル時間を短くすることが求められる。この観点においても、砥石車16の表面状態を把握することが求められる。そこで、要素305dは、砥石車16の表面状態データを第二教師データとして取得することとしている。なお、砥石車16の表面状態データとは、工作物の研削品質に影響を及ぼす程度を示すデータである。
【0093】
要素305eにおいて生成される第三学習モデルは、第一学習用入力データおよび第二教師データに基づいて、機械学習のうち教師有り学習を行うことによって砥石車16の表面状態を推定するためのモデル(関数)である。ただし、第三学習モデルは、砥石車16の表面状態の分類分けを行うことを目的として、教師無し学習を適用することにより生成することもできる。ただし、教師有り学習を適用する場合には、高精度に、砥石車16の表面状態を取得することができる。
【0094】
機械学習装置300は、第二学習モデルを生成する第二学習フェーズ306において機能する要素203a,203b,306d,306eを備える。機械学習装置300は、第二学習フェーズ306において機能する要素として、第二学習用入力データを取得する要素203a、第一評価結果データを取得する要素203b、第二評価結果データを取得する要素306d、および、第二学習モデルの生成を行う要素306eを備える。ここで、要素203a,203bは、第二実施形態の対応する要素と同一構成を有する。
【0095】
要素306dにおいて取得する第二評価結果データは、強化学習における機械学習に用いられる報酬を導き出すための評価結果データである。第二評価結果データは、砥石車16の表面状態データである。要素306eにおいて生成される第二学習モデルは、第二学習用入力データ、第一評価結果データおよび第二評価結果データに基づいて、機械学習のうち強化学習を行うことによって研削盤1の動作指令データを調整するためのモデル(関数)である。
【0096】
機械学習装置300は、研削品質および砥石車16の表面状態を推定する推定フェーズ307において機能する要素として、推定用入力データを取得する要素102a、並びに、研削品質の推定および工作物Wの良否の判別を行う要素102bを備える。ここで、要素102a,102bは、第一実施形態の対応する要素と同一構成を有する。
【0097】
さらに、機械学習装置300は、推定フェーズ307において機能する要素として、砥石車16の表面状態の推定、並びに、砥石車16のツルーイングの実行、砥石車16のドレッシングの実行、および、砥石車16の交換の実行を判別する要素307cを備える。要素307cは、推定用入力データと第三学習モデルとを用いて砥石車16の表面状態を推定すると共に、推定された砥石車16の表面状態に基づいて、砥石車16のツルーイングの実行、砥石車16のドレッシングの実行、および、砥石車16の交換の実行を判別する。要素307cにて用いる第三学習モデルは、第一学習フェーズ305において機械学習によって生成される第三学習モデルである。
【0098】
機械学習装置300は、動作指令データを更新する更新フェーズ308において機能する要素として、更新用入力データを取得する要素204a、並びに、動作指令データの更新を行う要素308cを備える。ここで、要素204aは、第二実施形態の対応する要素と同一構成を有する。要素308cは、更新用入力データ、第二学習モデル、推定された研削品質、および、推定された砥石車16の表面状態を用いて、動作指令データを更新する。要素308cにて用いる第二学習モデルは、第二学習フェーズ306において機械学習によって生成される第二学習モデルである。また、推定された研削品質は、推定フェーズ307において推定された研削品質である。推定された砥石車16の表面状態は、推定フェーズ307において推定された砥石車16の表面状態である。
【0099】
(3-2.機械学習装置300の第一学習フェーズ305の詳細構成)
機械学習装置300の第一学習フェーズ305の詳細構成について図9を参照して説明する。第一学習フェーズ305の構成は、研削品質推定モデル生成装置、および、砥石車表面状態推定モデル生成装置を構成する。第一学習フェーズ305の構成は、第一入力データ取得部130と、品質データ取得部310と、第一学習モデル生成部150と、第三学習モデル生成部320と、第一学習モデル記憶部160と、第三学習モデル記憶部330とを備えて構成される。
【0100】
第一入力データ取得部130は、複数の工作物Wに関する第一入力データを、機械学習の第一学習用入力データとして取得する。品質データ取得部310は、研削品質データを取得する研削品質データ取得部140と、砥石車16の表面状態データを取得する砥石車表面状態データ取得部311とを備える。研削品質データ取得部140は、複数の工作物Wに関する研削品質データを、機械学習の第一教師データとして取得する。また、砥石車表面状態データ取得部311は、工作物W毎に研削後における砥石車16の表面状態を、機械学習の第二教師データとして取得する。ここで、第一学習用入力データ、第一教師データおよび第二教師データは、表3に示すとおりである。
【0101】
【表3】
【0102】
第一入力データ取得部130および研削品質データ取得部140は、第一実施形態の対応する構成と同一構成を有する。砥石車表面状態データ取得部311は、外部装置2によって取得された工作物Wの研削品質データに対応する砥石車16の表面状態データを、教師有り学習の第二教師データとして取得する。
【0103】
砥石車16の表面状態データは、工作物Wの加工変質層の状態に対応する第一表面状態データ、工作物Wの表面性状に対応する第二表面状態データ、および、工作物Wのびびり模様状態に対応する第三表面状態データを含む。ただし、第一表面状態データは、加工変質層データそのものとしてもよいし、加工変質層データに基づいて演算したデータとしてもよい。また、第二表面状態データは、工作物Wの表面性状データそのものとしてもよいし、表面性状データに基づいて演算したデータとしてもよい。第三表面状態データは、びびり模様データそのものとしてもよいし、びびり模様データに基づいて演算したデータとしてもよい。
【0104】
第一学習モデル生成部150は、第一学習モデルを学習し、第一実施形態の対応する構成と同一構成を有する。第一学習モデル記憶部160は、第一学習モデル生成部150によって生成された第一学習モデルを記憶する。
【0105】
第三学習モデル生成部320は、教師有り学習を行って、第三学習モデルを生成する。詳細には、第三学習モデル生成部320は、第一入力データ取得部130が取得した第一入力データを第一学習用入力データとし、且つ、砥石車表面状態データ取得部311が取得した工作物W毎の砥石車16の表面状態データを第二教師データとする機械学習により、砥石車16の表面状態を推定するための第三学習モデルを生成する。
【0106】
つまり、第三学習モデル生成部320は、動作指令データ、実動作データ、第一実測データ、第二実測データを第一学習用入力データとし、且つ、砥石車表面状態データを第二教師データとする機械学習により、第三学習モデルを生成する。第三学習モデルは、第一学習用入力データと第二教師データとの関係を示すモデルである。第一学習用入力データの種類が多数存在するとしても、機械学習を適用することにより第三学習モデルの生成が可能となる。
【0107】
第三学習モデルは、砥石車16の表面状態として、工作物の研削品質に影響を及ぼす程度を推定するためのモデルである。例えば、第一学習モデルは、砥石車16の表面状態として、砥石車16の目つぶれ、目詰まり、目こぼれ等が生じている状態、砥石車16の目立てすぎの状態等を推定するためのモデルである。
【0108】
例えば、第一学習モデルは、砥石車16の表面状態として、工作物Wの加工変質層の状態に対応する第一表面状態、工作物Wの表面性状に対応する第二表面状態、および、工作物Wのびびり模様状態に対応する第三表面状態を推定するためのモデルである。ただし、第三学習モデルは、これら全ての表面状態を推定する場合に限られず、これらの一部のみの表面状態を推定するようにしてもよい。そして、第三学習モデル生成部320によって生成された第三学習モデルは、第三学習モデル記憶部330に記憶される。
【0109】
(3-3.機械学習装置300の第二学習フェーズ306の詳細構成)
機械学習装置300の第二学習フェーズ306の詳細構成について図9を参照して説明する。第二学習フェーズ306の構成は、研削盤の動作指令データ調整モデル生成装置を構成する。
【0110】
第二学習フェーズ306の構成は、動作指令データ取得部111と、研削品質データ取得部140と、砥石車表面状態データ取得部311と、研削サイクル時間演算部340と、砥石車形状情報取得部350と、報酬決定部210と、第二学習モデル生成部220と、第二学習モデル記憶部230とを備えて構成される。
【0111】
動作指令データ取得部111は、複数の工作物Wに関する動作指令データを、機械学習の第二学習用入力データとして取得する。また、研削品質データ取得部140は、当該複数の工作物Wに関する研削品質データを、機械学習の第一評価結果データとして取得する。砥石車表面状態データ取得部311は、工作物W毎の研削後における砥石車16の表面状態データを、機械学習の第二評価結果データとして取得する。ここで、第二学習用入力データ、第一評価結果データおよび第二評価結果データは、表4に示すとおりである。ここで、表4に示すように、第二学習用入力データは、多数のデータとしているが、表4に示す全てのデータを用いる必要はなく、一部のデータのみを用いるようにしてもよい。
【0112】
【表4】
【0113】
研削サイクル時間演算部340は、1個の工作物W当たりの研削サイクル時間を演算する。研削サイクル時間には、複数の工作物Wの研削に要する時間、前記研削において砥石車16の交換に要する時間、前記研削において砥石車16のドレッシングに要する時間、および、前記研削において砥石車16のツルーイングに要する時間の合計を、工作物Wの数で除算した値である。つまり、砥石車16の交換回数が少ないほど、砥石車16のドレッシングの回数が少ないほど、さらには、砥石車16のツルーイングの回数が少ないほど、研削サイクル時間が短くなる。
【0114】
砥石車形状情報取得部350は、砥石車16の形状情報を取得する。砥石車形状情報取得部350は、砥石車修正装置18により測定された砥石車16の寸法(径)を取得する。つまり、砥石車形状情報取得部350は、砥石車修正装置18によって、砥石車16のツルーイングまたはドレッシングが行われるときに取得される。さらに、砥石車形状情報取得部350は、砥石車16の形状情報として、砥石車16の寸法変化、および、砥石車16の形崩れを取得することができる。
【0115】
報酬決定部は210、第二学習用入力データである動作指令データ、第一評価結果データである研削品質データ、および、第二評価結果データである砥石車16の表面状態データを取得して、研削品質データおよび表面状態データに応じて、動作指令データに対する報酬を決定する。ここで、報酬は、強化学習において、動作指令データの組み合わせに対する報酬である。
【0116】
第二実施形態と同様に、当該動作指令データに対応する研削品質データが望ましい結果を導き出した時に、当該動作指令データに対して多くの報酬が付与され、望ましくない結果を導き出した時に、当該動作指令データに対して少ない報酬(マイナスの報酬を含む)が付与される。
【0117】
さらに、当該動作指令データに対応する表面状態データが望ましい結果を導き出した時に、当該動作指令データに対して多くの報酬が付与され、望ましくない結果を導き出した時に、当該動作指令データに対して少ない報酬が付与される。
【0118】
例えば、報酬決定部210は、第一表面状態データに対応する加工変質層が無い場合に報酬を多くし、加工変質層が有る場合に報酬を少なくする。また、報酬決定部210は、第二表面状態データに対応する工作物Wの表面性状データが所定閾値以下の場合に報酬を多くし、表面性状が所定閾値より大きい場合に報酬を少なくする。また、報酬決定部210は、第三表面状態データに対応するびびり模様が無しの場合に報酬を多くし、びびり模様が有りの場合に報酬を少なくする。
【0119】
さらに、報酬決定部210は、研削サイクル時間演算部340によって演算された研削サイクル時間を取得し、研削サイクル時間に応じて、動作指令データに対する報酬を決定する。詳細には、報酬決定部210は、研削サイクル時間が短くなるほど報酬を多くする。つまり、報酬決定部210は、砥石車16の交換に要する時間、砥石車16のドレッシングに要する時間、および、砥石車16のツルーイングに要する時間の少なくとも一つが短くなるほど、報酬を多くする。
【0120】
さらに、報酬決定部210は、砥石車形状情報取得部350が取得した砥石車16の形状情報に基づいて、報酬を決定する。詳細には、報酬決定部210は、砥石車16の寸法変化が小さくなるほど、砥石車16の形崩れが小さくなるほど、報酬を多くする。
【0121】
第二学習モデル生成部220は、機械学習により、報酬を多くするように動作指令データを調整するための第二学習モデルを生成する。生成された第二学習モデルは、第二学習モデル記憶部230に記憶される。
【0122】
(3-4.機械学習装置300の推定フェーズ307の詳細構成)
機械学習装置300の推定フェーズ307の詳細構成について、図10を参照して説明する。推定フェーズ307の構成は、第一入力データ取得部130と、第一学習モデル記憶部160と、第三学習モデル記憶部330と、研削品質推定部170と、砥石車表面状態推定部360と、判別部370とを備えて構成される。
【0123】
砥石車表面状態推定部360は、新たな工作物Wの研削を行っている際の所定期間分の第一入力データを推定用入力データとし、第三学習モデル記憶部330に記憶されている第三学習モデルを用いることで、新たな工作物Wの研削を行った場合の砥石車16の表面状態を推定する。ここで、第三学習モデルは、上述したように、第一学習用入力データと、第二教師データとの関係を示すモデルである。
【0124】
そこで、砥石車表面状態推定部360は、砥石車16の表面状態として、工作物Wの研削品質に影響を及ぼす程度を推定する。例えば、砥石車表面状態推定部360は、砥石車16の表面状態として、工作物Wの加工変質層の状態に対応する第一表面状態、工作物Wの表面性状に対応する第二表面状態、および、工作物Wのびびり模様状態に対応する第三表面状態を推定する。ただし、砥石車表面状態推定部360は、当該全ての砥石車16の表面状態を推定するのではなく、一部の表面状態のみを推定するようにしてもよい。例えば、砥石車表面状態推定部360は、第一表面状態のみを推定するようにしてもよい。この場合、第一学習モデルが、第一表面状態のみを推定するようなモデルとして生成されていることになる。
【0125】
砥石車表面状態推定部360は、上記のように、表面状態として複数の対象を推定している。機械学習を適用して生成された第三学習モデルを用いることにより、砥石車表面状態推定部360は、複数の対象を容易に推定することができる。このように、機械学習装置300は、複雑化された対象を一度に推定することができる。
【0126】
判別部370は、研削品質推定部170により推定された工作物Wの研削品質に基づいて工作物Wの良否を判別する。さらに、判別部370は、砥石車表面状態推定部360により推定された砥石車16の表面状態に基づいて、砥石車16のツルーイングの実行、砥石車16のドレッシングの実行、および、砥石車16の交換の実行の少なくとも一つを判別する。
【0127】
(3-5.機械学習装置300の更新フェーズ308の詳細構成)
機械学習装置300の更新フェーズ308の詳細構成について図10を参照して説明する。更新フェーズ308の構成は、動作指令データ取得部111と、研削品質データ取得部140と、砥石車表面状態データ取得部311と、研削サイクル時間演算部340と、砥石車形状情報取得部350と、報酬決定部210と、第二学習モデル記憶部230と、動作指令データ調整部240とを備えて構成される。
【0128】
動作指令データ取得部111、研削品質データ取得部140、および、砥石車表面状態データ取得部311は、新たな工作物Wの研削における各データを取得し、第二学習フェーズ306において説明した内容と実質的に同一である。また、研削サイクル時間演算部340、および、砥石車形状情報取得部350も、第二学習フェーズ306において説明した内容と実質的に同一である。
【0129】
報酬決定部210は、新たな工作物Wの研削において取得した動作指令データ、研削品質データ、および、砥石車16の表面状態データを用いて、報酬を決定する。すなわち、報酬決定部210は、新たな工作物Wの研削に関して、研削品質データおよび砥石車16の表面状態データに応じて、動作指令データに対する報酬を決定する。さらに、報酬決定部210は、研削サイクル時間および砥石車16の形状情報に応じて、動作指令データに対する報酬を決定する。第二学習モデル記憶部230は、第二学習フェーズ306において説明したように、第二学習モデル生成部220によって生成された第二学習モデルを記憶する。
【0130】
動作指令データ調整部240は、新たな工作物Wの研削に関する動作指令データ、新たな工作物Wの研削品質データ、新たな工作物Wの研削を行った場合の砥石車16の表面状態データ、報酬、および、第二学習モデルを用いて、動作指令データの調整方法を決定し、決定した調整方法に基づいて動作指令データの調整を行う。ここで、第二学習モデルは、報酬が多くなるように、調整前の動作指令データから調整後の動作指令データへの調整方法を学習することによって生成されたモデルである。動作指令データ調整部240は、実質的に、第二実施形態で説明した動作指令データ調整部240と同一である。
【0131】
そして、機械学習装置200の機械学習により生成された第二学習モデルを用いて動作指令データが更新される。そのため、研削状態が変化したとしても、動作指令データが現在の研削状態に応じて更新されていく。このように動作指令データが更新されることによって、工作物Wの研削品質を良好とすることができる。
【0132】
さらに、動作指令データが更新されることによって、砥石車の表面状態に応じた研削を行うことができる。すなわち、動作指令データが更新されることによって、砥石車16の表面状態が良好となる。砥石車16の表面状態を良好とすることにより、工作物Wの研削品質を向上させることにつながる。さらに、動作指令データが更新されることによって、砥石車16の交換に要する時間、砥石車16のドレッシングに要する時間、および、砥石車16のツルーイングに要する時間が少なくなる。結果として、研削サイクル時間が短くなる。さらに、動作指令データが更新されることによって、砥石車16の寸法変化が小さくなり、砥石車16の形崩れが小さくなる。
【0133】
(4.第四実施形態)
(4-1.機械学習装置400の概要)
第四実施形態の機械学習装置400の概要について、図11を参照して説明する。機械学習装置400は、(a)不良品であると判別された工作物Wの不良品質発生要因を推定するための関係情報学習モデルを生成すると共に、(b)関係情報学習モデルを用いて、不良品であると判別された工作物Wの不良品質発生要因を推定する。なお、機械学習装置400の構成は、不良品質発生要因推定装置を構成する。
【0134】
機械学習装置400は、関係情報学習モデルを生成する関係情報学習フェーズ401において機能する要素として、関係情報学習用入力データを取得する要素401a、関係情報教師データを取得する要素401b、および、関係情報学習モデルの生成を行う要素401cを備える。
【0135】
要素401aにおいて取得される関係情報学習用入力データは、機械学習に用いられる入力データであって、例えば、実動作データ、第一実測データ、第二実測データ等である。要素401bにおいて取得される関係情報教師データは、教師有り学習における機械学習に用いられる教師データである。関係情報教師データは、工作物Wの不良品質発生要因に関する情報であって、例えば、研削盤1による工作物Wの加工条件(送り速度等)に関する情報、砥石車16の切れ味に関する情報等である。要素401cにおいて生成される関係情報学習モデルは、関係情報学習用入力データおよび関係情報教師データに基づき、機械学習のうち教師有り学習を行うことによって工作物Wの研削品質を推定するためのモデル(関数)である。
【0136】
機械学習装置400は、不良品質発生要因を推定する推定フェーズ402において機能する要素として、推定用入力データを取得する要素402a、並びに、不良品質の発生要因の推定を行う要素402bを備える。要素402aにおいて取得される推定用入力データは、関係情報学習用入力データと同種のデータであって、学習に用いた工作物Wとは異なる工作物W(新しい工作物W)に関して取得されるデータである。要素402bは、推定用入力データと関係情報学習モデルとを用いて不良品質の発生要因を推定する。要素402bにて用いる関係情報学習モデルは、関係情報学習フェーズ401において機械学習によって生成される関係情報学習モデルである。
【0137】
(4-2.機械学習装置400の関係情報学習フェーズ401の詳細構成)
機械学習装置400の関係情報学習フェーズ401の詳細構成について図12を参照して説明する。関係情報学習フェーズ401の構成は、不良品加工データ記憶部410と、良品加工データ記憶部420と、相違情報抽出部430と、不良品質発生要因データ記憶部440と、関係情報学習モデル生成部450と、関係情報学習モデル記憶部460とを備えて構成される。
【0138】
不良品加工データ記憶部410は、不良品である複数の工作物Wに関する複数種の加工データ(不良品加工データ)を、機械学習の関係情報学習用入力データとして予め取得し、記憶する。また、不良品加工データには、不良品である工作物Wが有する不良品質に関する情報が含まれる。なお、不良品質とは、研削品質推定部170が推定可能な研削品質、及び、砥石車表面状態推定部360が推定可能な砥石車16の表面状態等である。
【0139】
良品加工データ記憶部420は、良品である複数の工作物Wに関する複数種の加工データ(良品加工データ)を、機械学習の関係情報教師データとして予め取得し、記憶する。なお、良品加工データの種別は、不良品加工データの種別に対応する。また、不良品加工データ及び良品加工データの種別としては、実動作データ取得部112がセンサ21から取得する実動作データ、実測データ取得部120がセンサ22,23から取得する第一実測データ及び第二実測データに相当するデータ等が例示される。
【0140】
なお、本実施形態において、良品加工データ記憶部420には、複数種の良品加工データが記憶されているが、良品加工データ記憶部420には、少なくとも1種の良品加工データが記憶されていればよい。
【0141】
相違情報抽出部430は、不良品加工データと良品加工データとを取得し、不良品加工データと良品加工データとを比較する。そして、相違情報抽出部430は、両者の間で相違する加工データを、加工データ相違情報として抽出する。不良品質発生要因データ記憶部440は、工作物Wの不良品質の発生要因に関する情報(不良品質発生要因データ)を予め取得し、記憶する。なお、不良品質発生要因データ記憶部440に記憶される不良品質発生要因データとしては、研削盤1による工作物Wの加工条件(送り速度)、砥石車16の切れ味、加工点温度、研削盤1の構成部品の振動等が例示される。
【0142】
関係情報学習モデル生成部450は、教師有り学習を行い、関係情報学習モデルを生成する。詳細には、関係情報学習モデル生成部450は、相違情報抽出部430が抽出した加工データ相違情報を関係情報学習用入力データとし、且つ、不良品質発生要因データ記憶部440に記憶された不良品質発生要因データを関係情報教師データとする機械学習により、工作物Wに不良品質が発生した要因(不良要因)を推定するための関係情報学習モデルを生成する。
【0143】
関係情報学習モデル記憶部460は、関係情報学習モデル生成部450が生成した関係情報学習モデルを記憶する。また、関係情報学習モデル記憶部460には、関係学習モデルが、不良品であると判別された工作物Wが有する複数種の不良品質(研削品質推定部170が推定した研削品質、又は、砥石車表面状態推定部360が推定した砥石車16の表面状態等)と関連付けて記憶される。なお、関係情報学習モデル記憶部460において、関係学習モデルと不良品質との関連付けは、省略することも可能である。
【0144】
このように、関係情報学習モデル生成部450は、加工データ相違情報と不良品質の発生要因との関係を示す発生要因関係情報に関する学習モデル(関係情報学習モデル)を生成する。関係情報学習モデルは、不良品であると判別された工作物Wにおいて、不良品質が発生した要因を推定するためのモデルである。機械学習装置400は、関係情報学習モデルを用いることにより、加工データ相違情報と不良品質の発生要因との関係をより明確にすることができる。
【0145】
なお、本実施形態において、関係情報学習モデル記憶部460は、加工データ相違情報と複数種の不良品質発生要因との関係を示す複数種の関係情報学習モデルを記憶しているが、複数種の関係情報学習モデルの一部のみを記憶してもよい。
【0146】
(4-3.機械学習装置400の推定フェーズ402の詳細構成)
機械学習装置400の推定フェーズ402の詳細構成について、図13を参照して説明する。推定フェーズ402の構成は、不良品加工データ記憶部410と、良品加工データ記憶部420と、相違情報抽出部430と、関係情報学習モデル記憶部460と、不良要因推定部470とを備えて構成される。
【0147】
不良品加工データ記憶部410は、新たなに研削した工作物Wに対し、判別部180,370が不良品であると判別した場合に、実動作データ取得部112、第一実測データ取得部121、第二実測データ取得部122から、実動作データ、第一実測データ、第二実測データを取得し、記憶する。
【0148】
相違情報抽出部430は、不良品加工データ記憶部410が新たに取得し、記憶した不良品加工データと、良品加工データ記憶部420に記憶された良品加工データとを比較することにより、不良品加工データと良品加工データとの差を、新たな加工データ相違情報を抽出する。
【0149】
次に、不良要因推定部470は、新たに抽出した加工データ相違情報を推定用入力データとし、関係情報学習モデル記憶部460に記憶されている関係情報学習モデルを用いることで、新たに研削した工作物Wにおいて、不良品質が発生した要因を推定する。これにより、機械学習装置400は、判別部180,370により不良品と判別された工作物Wに関して、当該工作物Wに不良品質が発生した要因を推定することができる。また、不良要因推定部470は、相違情報抽出部430により抽出された加工データ相違情報に基づき、不良品質の発生要因の推定を行う。よって、不良要因推定部470は、不良品質発生要因の推定を容易に行うことができる。
【0150】
本実施形態において、良品加工データ記憶部420には、複数種の良品加工データが記憶され、相違情報抽出部430は、複数種の良品加工データと、不良品加工データとをそれぞれ比較し、複数種の加工データ相違情報を抽出する。よって、不良要因推定部470は、複数種の不良品質発生要因の中から一の不良品質発生要因を選択できるので、不良要因推定部470による推定の精度を高めることができる。
【0151】
また、良品加工データ記憶部420に記憶される良品加工データは、予め取得した複数個の良品に関する実動作データまたは実測データに基づいて作成されるので、良品加工データの質を高めることができる。これにより、相違情報抽出部430は、加工データ相違情報を的確に抽出することができる。
【0152】
なお、本実施形態において、機械学習装置400は、発生要因関係情報に関する学習モデルを用いて不良品質の発生要因を推定しているが、発生要因関係情報は、必ずしも機械学習により生成された学習モデルである必要はない。即ち、機械学習装置400は、不良品である少なくとも一の工作物Wから得られた不良品加工データと、良品である少なくとも一の工作物Wから得られた良品加工データとの比較により得られた一の加工データ相違情報と、当該不良品である一の工作物Wが有する特定の不良品質に関する情報とが関連づけられた情報を、発生要因関係情報として有していてもよい。この場合においても、不良要因推定部470は、新たに不良品と判別された工作物Wから得られる不良品加工データおよび良品加工データに基づく加工データ相違情報と、発生要因関係情報とに基づき、特定の不良品質を有するか否かの推定を行うことができる。
【0153】
また、第二実施形態及び第三実施形態における更新フェーズ204,308において、動作指令データ調整部240は、不良要因推定部470による推定結果に基づき、動作指令データの調整を行ってもよい。この場合、機械学習装置200,300は、工作物の研削品質を良好とすることができる。
【符号の説明】
【0154】
1:研削盤、2:外部装置、11:ベッド、12:主軸台(構造部材)、12a,14a,15a,16a:モータ(駆動装置)、13:心押台(構造部材)、14:トラバースベース(構造部材、移動体)、15:砥石台(構造部材、移動体)、16:砥石車、17:定寸装置(駆動装置)、18:砥石車修正装置(駆動装置)、19:クーラント装置、20:制御装置、21,22,23:センサ、100:機械学習装置、101:第一学習フェーズ、102:推定フェーズ、110:動作関連データ取得部、111:動作指令データ取得部、112:実動作データ取得部、120:実測データ取得部、121:第一実測データ取得部、122:第二実測データ取得部、130:第一入力データ取得部、140:研削品質データ取得部、150:第一学習モデル生成部、160:第一学習モデル記憶部、170:研削品質推定部、180:判別部、200:機械学習装置、203:第二学習フェーズ、204:更新フェーズ、210:報酬決定部、220:第二学習モデル生成部、230:第二学習モデル記憶部、240:動作指令データ調整部、300:機械学習装置、305:第一学習フェーズ、306:第二学習フェーズ、307:推定フェーズ、308:更新フェーズ、310:品質データ取得部、311:砥石車表面状態データ取得部、320:第三学習モデル生成部、330:第三学習モデル記憶部、340:研削サイクル時間演算部、350:砥石車形状情報取得部、360:砥石車表面状態推定部、370:判別部、400:機械学習装置(不良品質発生要因推定装置)、420:良品加工データ記憶部、430:相違情報抽出部、460:関係情報学習モデル記憶部(関係情報記憶部)、470:不良要因推定部、W:工作物(研削部位)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13