IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユニパルス株式会社の特許一覧

特開2024-77778機械学習装置、機械学習システム及びシステム
<>
  • 特開-機械学習装置、機械学習システム及びシステム 図1
  • 特開-機械学習装置、機械学習システム及びシステム 図2
  • 特開-機械学習装置、機械学習システム及びシステム 図3
  • 特開-機械学習装置、機械学習システム及びシステム 図4
  • 特開-機械学習装置、機械学習システム及びシステム 図5
  • 特開-機械学習装置、機械学習システム及びシステム 図6
  • 特開-機械学習装置、機械学習システム及びシステム 図7
  • 特開-機械学習装置、機械学習システム及びシステム 図8
  • 特開-機械学習装置、機械学習システム及びシステム 図9
  • 特開-機械学習装置、機械学習システム及びシステム 図10
  • 特開-機械学習装置、機械学習システム及びシステム 図11
  • 特開-機械学習装置、機械学習システム及びシステム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024077778
(43)【公開日】2024-06-10
(54)【発明の名称】機械学習装置、機械学習システム及びシステム
(51)【国際特許分類】
   G01M 13/02 20190101AFI20240603BHJP
   H02K 11/24 20160101ALI20240603BHJP
   H02K 7/116 20060101ALI20240603BHJP
【FI】
G01M13/02
H02K11/24
H02K7/116
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022189921
(22)【出願日】2022-11-29
(71)【出願人】
【識別番号】591156799
【氏名又は名称】ユニパルス株式会社
(72)【発明者】
【氏名】岩崎 信夫
【テーマコード(参考)】
2G024
5H607
5H611
【Fターム(参考)】
2G024AB02
2G024BA27
2G024CA12
2G024DA09
2G024FA04
2G024FA06
2G024FA15
5H607BB01
5H607EE31
5H611AA01
5H611BB01
5H611QQ01
5H611QQ03
5H611QQ08
(57)【要約】
【課題】変速機及び変速モータ装置の良否の判定のための機械学習装置、これを含む機械学習システムを提供することを課題としている。
【解決手段】モータ102の回転を変速する変速機104もしくは変速機104を有する変速モータ装置1の良否を判定するための計測条件を学習する機械学習装置301であって、計測に関する物理量Pと計測条件Cとで構成される状態変数を観測する状態観測部302と、計測した変速機104の良否判定結果を示す判定データを取得する判定データ取得部308と、状態変数と判定データとを用いて、計測条件を学習する学習部304と、を有し、学習部304は、学習した結果を記憶する学習結果記憶部307を含む機械学習装置。
【選択図】図1
【特許請求の範囲】
【請求項1】
モータの回転を変速する変速機もしくは前記変速機を有する変速モータ装置の良否を判定するための計測条件を学習する機械学習装置であって、
計測に関する物理量と前記計測条件とで構成される状態変数を観測する状態観測部と、
前記変速機の良否判定結果を示す判定データを取得する判定データ取得部と、
前記状態変数と前記判定データとを用いて、前記計測条件を学習する学習部と、を含み、
前記学習部は、学習した結果を記憶する学習結果記憶部を有する機械学習装置。
【請求項2】
前記計測条件は、
前記変速機の出力軸に設けられた出力軸トルク検出部から出力された出力軸トルク値の一部を除去及び加工して出力する信号処理と、
前記変速機の前記出力軸の回転方向と、
の少なくとも1つを含み
前記物理量は、
前記モータに接続された位置検出部から出力された前記出力軸の回転の位置値の波形データと、
前記出力軸トルク値の波形データと、
前記変速機の筐体に配された温度検出部によって検出された前記変速機の温度値の波形データと、を含む請求項1に記載の機械学習装置。
【請求項3】
前記物理量は、
前記変速機の出力軸に設けられた出力軸トルク検出部から出力された出力軸トルク値の波形データを高速フーリエ変換解析して生成するスペクトルデータを含む請求項1に記載の機械学習装置。
【請求項4】
前記物理量は、
前記変速モータ装置に配置された加速度検出部によって検出された加速度値の波形データと、
前記変速モータ装置に配置された角速度検出部によって検出された角速度値の波形データと、を含む請求項1に記載の機械学習装置。
【請求項5】
前記計測条件は、
前記変速機の出力軸に設けられた出力軸トルク検出部から出力された出力軸トルク値に同期して、前記変速機の入力軸に設けられた入力軸トルク検出部から出力された入力軸トルク値の一部を除去及び加工して出力する信号処理と、
前記入力軸トルク値及び前記出力軸トルク値から前記変速機の良否判定値を確定するために用いる判定処理の項目と、
を含む請求項1に記載の機械学習装置。
【請求項6】
前記学習部は、誤差計算部と、モデル更新部と、を有し、
前記誤差計算部は、前記状態変数と前記判定データとから前記計測条件を導く相関性モデルと、予め用意された教師データから識別される相関性特徴と、の誤差を計算し、
前記モデル更新部は、前記誤差を小さくするように前記相関性モデルを更新し、
前記学習結果記憶部は、前記モデル更新部が更新した結果を記憶する請求項1から5のいずれか一項に記載の機械学習装置。
【請求項7】
前記学習部は、
前記状態変数に基づいて前記計測条件を決定した結果に対する報酬を演算する報酬演算部と、
前記報酬に基づいて、行動価値関数を更新する行動価値関数更新部と、を含み、
前記行動価値関数更新部によって前記行動価値関数の更新を繰り返して、前記報酬が最も多く得られる前記計測条件を学習し、
前記報酬演算部は、報酬条件を設定する報酬条件設定部を含んでおり、前記報酬演算部は、前記報酬条件設定部により設定された前記報酬条件に基づいて前記報酬を演算し、
前記学習結果記憶部は、前記行動価値関数更新部が更新した結果を記憶する請求項1から5のいずれか一項に記載の機械学習装置。
【請求項8】
前記変速モータ装置と、
前記変速モータ装置に係る前記物理量を検出して演算する演算部を含んだ制御部と、
請求項1に記載の機械学習装置と、を備える機械学習システム。
【請求項9】
請求項8に記載の機械学習システムを複数備え、
前記各機械学習システムを互いに通信にて接続するネットワークと、
前記各機械学習システムに接続されて、前記状態観測部により観測された前記物理量及び前記学習結果記憶部により記憶された学習結果のうちの少なくとも一つを記憶する上位コンピュータと、を含むシステム。
【請求項10】
請求項8に記載の機械学習システムを複数備え、
前記各機械学習システムを互いに通信にて接続するネットワークを有し、
前記ネットワークは、前記状態観測部により観測された前記物理量及び前記学習結果記憶部により記憶された学習結果のうちの少なくとも一つを前記各機械学習システムの間で送受信するシステム。
【請求項11】
モータの回転を変速する変速機を有する複数の変速モータ装置と、
前記各変速モータ装置をそれぞれ制御する複数の制御部と、
前記各制御部に接続した請求項1に記載の少なくとも一つ以上の機械学習装置と、 を含むシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、変速機及び変速機を有する変速モータ装置の良否を判定する機械学習装置、この機械学習装置を含むシステムに関するものである。
【背景技術】
【0002】
モータの出力軸に連結されて、変速機によってモータの回転を減速させるとともにトルクを増大させる変速モータ装置がシリアルリンクロボットなどに、広く使用されている。そして減速により増大したトルクを検出するトルク検出部を組み込んだ変速モータ装置が公知である(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2016-77121号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
この変速機や変速モータ装置の経年劣化を見極めて、構成部品の交換及び装置のメンテナンスの時期を知らせることが望まれている。
【0005】
本発明は、変速機及び変速モータ装置の良否の判定のための機械学習装置、これを含む機械学習システムを提供することを課題としている。
【課題を解決するための手段】
【0006】
本発明の機械学習装置は、モータの回転を変速する変速機もしくは変速機を有する変速モータ装置の良否を判定するための計測条件を学習する機械学習装置であって、
計測に関する物理量と計測条件とで構成される状態変数を観測する状態観測部と、
変速機の良否判定結果を示す判定データを取得する判定データ取得部と、
状態変数と判定データとを用いて、計測条件を学習する学習部と、を含み、
学習部は、学習した結果を記憶する学習結果記憶部を有する。
【0007】
また、計測条件は、
変速機の出力軸に設けられた出力軸トルク検出部から出力された出力軸トルク値の一部を除去及び加工して出力する信号処理と、
変速機の出力軸の回転方向と、
の少なくとも1つを含み
物理量は、
モータに接続された位置検出部から出力された出力軸の回転の位置値の波形データと、
出力軸トルク値の波形データと、
変速機の筐体に配された温度検出部によって検出された変速機の温度値の波形データと、を含んでいる。
【0008】
また、物理量は、
変速機の出力軸に設けられた出力軸トルク検出部から出力された出力軸トルク値の波形データを高速フーリエ変換解析して生成するスペクトルデータを含んでいる。
【0009】
また、物理量は、
変速モータ装置に配置された加速度検出部によって検出された加速度値の波形データと、
変速モータ装置に配置された角速度検出部によって検出された角速度値の波形データと、を含んでいる。
【0010】
また、計測条件は、
変速機の出力軸に設けられた出力軸トルク検出部から出力された出力軸トルク値に同期して、変速機の入力軸に設けられた入力軸トルク検出部から出力された入力軸トルク値の一部を除去及び加工して出力する信号処理と、
入力軸トルク値及び出力軸トルク値から変速機の良否判定値を確定するために用いる判定処理の項目と、
を含んでいる。
【図面の簡単な説明】
【0011】
図1】本発明の第1の実施形態に係る変速モータ装置の機械学習システムの構成図である。
図2】本発明の第1の実施形態に係る変速モータ部から出力される物理量の波形の例である。
図3】本発明の第1の実施形態に係る変速モータ部から出力されるトルク値のFFT解析による振幅スペクトルの例である。
図4】本発明の第2の実施形態に係る変速モータ装置の機械学習システムの構成図である。
図5】本発明の第2の実施形態に係る変速モータ装置から出力される物理量の波形の例である。
図6】本発明の第2の実施形態に係る変速モータ装置から出力されるトルク値のFFT解析による振幅スペクトルの例である。
図7】本発明の変速モータ装置の教師あり学習における機械学習システムの詳細構成図である。
図8】本発明の変速モータ装置の強化学習における機械学習システムの詳細構成図である。
図9】本発明の変速モータ装置の強化学習における機械学習装置が行うフローチャートである。
図10】本発明の複数の機械学習システムを含むシステムの構成図である。
図11】本発明の複数の機械学習システムを含むシステムの変形例の構成図である。
図12】本発明の機械学習装置を含むシステムの変形例の構成図である。
【発明を実施するための形態】
【0012】
以下、本発明に係る機械学習システムの実施形態について図面を参照して説明する。図1は、本発明の第1の実施形態の機械学習システム401の構成を示した図である。
【0013】
機械学習システム401は、変速モータ装置1と、機械学習装置301とで構成されている。変速モータ装置1は、変速モータ部101と制御部201とで構成されている。変速モータ部101は、モータ102と、位置検出部103と、変速機104と、トルク検出部106と、電気電子回路基板とを含んで構成される。制御部201は、変速モータ部101へ電源を供給して駆動する電気回路基板と、変速モータ部101に設けられた各検出手段からの電気信号を処理する電子回路とを含むコンピュータのハードウエアである回路基板と、演算等を行うソフトウエアで構成される。機械学習装置301は、制御部201と電気信号の送受信を行って計測に関する学習を行うコンピュータのハードウエア及びソフトウエアで構成される。なお変速モータ部101と、制御部201との配置は別体型で設けても良いし、一体組み込み型としても良い。
【0014】
変速モータ部101は、電気によるモータ102を動力源としている。モータ102の負荷側には変速機104が連結されて、モータ102の回転を変速機104によって変速させている。モータ102は、本実施形態では例えば交流サーボモータであるがこれに限るものではない。モータ102の反負荷側には位置検出部103が設けられている。位置検出部103は、例えば光学式のアブソリュートエンコーダであって、モータ102の回転の位置値θの信号をデジタル値で出力する。位置検出部103のいち検出方法はこれに限らず、磁力によるものなどの変形であっても良い。
【0015】
変速機104は例えば減速機であって、この場合モータ102の回転を減速するとともに負荷を駆動するのに必要なトルクに増幅させている。本発明の実施形態の変速機104は波動歯車減速機である。波動歯車減速機は、モータ102の回転軸に連結されて外周が楕円状のウエーブジェネレータ104aと、ウエーブジェネレータ104aの回転により円周方向へ撓まされる位置が変化するようにした弾性変形可能な外歯のフレクスプライン104cと、フレクスプライン104cの外周側にあってフレクスプライン104cの外歯と嵌合する内歯を備えたサーキュラスプライン104bと、を含んでいる。そして動力は、モータ102から、ウエーブジェネレータ104aを経由してフレクスプライン104cを回転出力として繋げた出力軸105に取り出されて伝達する。そして変速機104のこれらの歯車は潤滑油で浸漬した筐体内に配置されている。
【0016】
変速機104は、波動歯車減速機に代えて差動減速機であっても良い。差動減速機はケーシングに嵌り回転するローラで構成する内歯車と、入力軸の偏心部に軸受を介して支持されるトロコイドギアからなる差動減速機構である。また、変速機104は、ボール減速機であっても良い。ボール減速機は、歯車の代わりに転動体であるスチールボールを介在させ、常時転がり接触によって動力を伝達する。
【0017】
トルク検出部106は出力軸105に配置されている。出力軸105の軸方向の中間部には、直径が他の部分よりも小さく形成した起歪部がある。この起歪部には出力軸105のねじりトルクを測定するために例えば歪みゲージ106aが貼着されている。この起歪部は、出力軸105の軸方向には強度を有していて変形しないが、直径が他の部分よりも小さく形成されているため、ねじれ方向には変形する。したがって歪みゲージ106aは、起歪部に生じるねじれ(剪断歪み)によって歪み、歪みゲージ106aはせん断歪み量に応じた抵抗変化を生じる。ねじりトルクを検出は歪みゲージによるものに限らず、静電容量式若しくは磁歪式などであっても良い。
【0018】
歪みゲージ106aは出力軸105に加わるねじりトルクに応じて起歪部に生ずる歪みを電気信号に変換するホイートストンブリッジ回路に組み込まれ、トルク検出部106の一部を構成している。そしてトルク検出部106は出力軸トルク値τgをデジタル値で出力する。このトルク検出回路が回転基板106bに実装されている。
【0019】
回転基板106bは環状の円板であって、支柱等の固定支持部材を介して出力軸105に固定されて、出力軸105と一緒に回転する。回転基板106bは、歪みゲージ106aの抵抗変化を検出するホイートストンブリッジ回路を含む抵抗変化検出回路と、抵抗変化検出回路の出力をデジタル信号に変換するアナログ・デジタル変換器と、このデジタル信号を処理するCPUと、整流回路及び安定化回路等を備えている。そしてトルク検出回路から送出されたねじりトルク測定値の信号は、発光素子106cによって光信号に変換されて無線通信にて固定基板106eに実装された受光素子106dへ送られる。
【0020】
2つの固定基板106eは基板間コネクタで機械的かつ電気的に接続されていて、ケーシングに固定されている。固定基板106eは、発光素子106cが発した光信号を電気信号に変換するフォトダイオードなどの受光素子106dと、電気信号に変換したデジタル変調信号からねじりトルクの測定値の信号をデジタル復調によって取り出すデジタル復調回路とを備えている。そして固定基板106eは、配線ケーブルにより、変速モータ部101を制御する制御部201と繋がっている。なお固定基板106eから回転基板106bへの電力の供給は、非接触型の変圧器によって行われる。
【0021】
温度検出部107は、例えばサーミスタなどであって変速機104付近の外周面に取り付けられていて、変速機104の温度値Tをデジタル値で出力する。
【0022】
角速度・加速度検出部108は、変速モータ部101に加わる角速度値ω及び加速度値αを検出してこれをデジタル値で出力する。本実施形態は、角速度3軸,ω(x,y,z方向)と、加速度3軸,α(x,y,z方向)と、を一体化させた多軸センサである。もちろんこの軸数は、変速モータ部101の使用形態によって1~3軸の中で適宜選択されるものである。角速度は、コリオリ力を利用して物体の回転や向きの変化を角速度として検出して電気信号で出力する。加速度は、例えば検出電極間に生じる静電容量差を測定することで慣性力を検出して電気信号で出力する。角速度・加速度検出部108は、固定基板106e上に実装されていても良いし、変速モータ部101の筐体内部に固定されていても良い。もちろん角速度・加速度検出部108は、角速度、加速度をそれぞれ別の素子で検出しても良いし、また変速モータ部101が使用される環境によって各軸数も適宜設定することができる。
【0023】
制御部201は、変速モータ部101と電気的に繋がって変速モータ部101へ駆動信号を送信し、変速モータ部101の各検出部からの検出信号を受信する。制御部201は、出力トルク信号処理部202と、FFT部204と、演算部205と、判定部206と、判定結果表示部207、記憶部208と、制御実行部209、設定部210と、モータ駆動部211と、を含んでいる。
【0024】
出力トルク信号処理部202は、変速モータ部101のトルク検出部106から出力されたデジタル信号を処理して所定の期間分だけ記憶してこれをFFT部204へ出力する。
【0025】
FFT部204は、出力トルク信号処理部202から出力トルク信号波形データを得て、これを離散的フーリエ変換して振幅スペクトルを生成して、これを振幅スペクトル波形データとして出力する。
【0026】
設定部210は、モータのトルクや回転速度の目標設定も行う。さらに設定部210は、制御部201に対しての入力手段の役割も有している。すなわち設定部210は、キーボードやタッチパネル等の入力手段を有している。
【0027】
演算部205は、CPU(Central Processing Unit)と、入出力部と、信号処理部203を備えている。演算部205は、トルク検出部106から出力された出力軸トルク値τgの信号データと、位置検出部103から出力された位置値θの信号データと、角速度・加速度検出部108から出力された加速度値αの信号データ及び角速度値ωの信号データと、温度検出部107から出力された温度値Tの信号データと、FFT部(高速フーリエ変換部)204から出力された振幅スペクトルの波形データと、を受信して、信号処理部203にて同じ時系列にそれぞれ波形を生成し、これらを基に演算して変速モータ部101の良否判定用の信号データを生成して判定部206へ出力する。信号処理部203はフィルタを含んでいて、バンドパスフィルタ、ローパスフィルタ、平均化処理のフィルタなどが用いられる。なお各検出部からの信号は本実施形態ではデジタル出力であるが、これに限らずアナログ信号であってもよく、この場合には信号処理部203がアナログ・デジタル変換の機能を有する。また信号処理部203が出力トルク信号処理部202を、演算部205がFFT部204をそれぞれ包括する構成であっても良い。
【0028】
演算部205はさらに、後述する状態変数(物理量Pと計測条件C)を機械学習装置301の状態観測部302へ出力する。
【0029】
記憶部208は、書き換え消去が可能なROM(Read Only Memory)及びRAM(Random Access Memory)を有する。記憶部208は、例えば出力軸トルク値τgの波形と、位置値θの波形と、加速度値αの波形と、角速度値ωの波形と、温度検出部107から出力された温度値Tの波形と、FFT部204から出力された振幅スペクトル波形と、モータ指令の電流値iの波形と、を記憶する。また記憶部208には、変速モータ部101の良否判定の出力トルクの上下限の範囲、FFT部204の振幅スペクトルに表れる代表的な周波数、変速モータ部101が正常時の出力軸トルク値τgの波形、変速モータ部101が異常時の出力軸トルク値τgの波形、等が記憶されていても良い。
【0030】
モータ駆動部211は、設定部210からの設定情報にしたがって、記憶部208内に記憶されている現在駆動中のモータ速度、電流値iを参照してそれぞれ所定の速度や設定された目標トルクでモータ102を駆動する。
【0031】
判定部206は、例えば演算部205から記憶部208に記憶されている出力トルクの判定用上下限値と、出力トルク信号処理部202から得た出力トルク値と、を比較して許容範囲内にあるかを判定する。判定部206は、出力トルク値が範囲内であれば正常として判定出力し、範囲外であれば不良と判定し、この良否判定結果の情報を判定結果表示部207へ送信する。判定部206はさらに、この良否判定結果と、出力トルク値と、判定用上下限値とを判定データとして機械学習装置301の判定データ取得部308へ出力する。また判定部206は、FFT部204から出力された振幅スペクトルデータ波形から演算部205にて抽出された振幅スペクトルにおいて、変速モータ部101の正常時に現れていない所定以上の値を示す周波数が存在しない場合に正常と判定出力し、変速モータ部101の正常時に現れていない所定以上の値を示す周波数が存在する場合に不良と判定し、この良否判定結果の情報を判定結果表示部207へ送信しても良い。
【0032】
判定結果表示部207は判定部206からの情報を受信して、良否判定結果、出力トルク値及び判定用上下限値、振幅スペクトルグラフなどを表示する。
【0033】
機械学習装置301は、状態観測部302と、判定データ取得部308と、学習部304と、意思決定部303とを含んでいる。状態観測部302は、例えばコンピュータのCPUの一つの機能として、あるいはコンピュータのCPUを機能させるためのソフトウエアとして構成できる。状態観測部302が観測する状態変数には、例えば物理量Pと計測条件Cを含んでいる。状態観測部302は、物理量Pと計測条件Cを、制御部201の演算部205から受信する。
【0034】
物理量Pは、例えば、回転の位置値の波形データ、出力軸トルク値の波形データ、変速機の温度値の波形データ、出力軸トルク値の振幅スペクトルデータ、変速機の加速度値の波形データ、変速機の角速度値の波形データなどである。
【0035】
計測条件Cは、例えば、モータ指令速度、モータ指令トルク、出力軸トルク信号に適用するフィルタ種類、変速機104の出力軸105の回転方向、角速度・加速度検出部108からの角速度信号及び加速度信号に適用するフィルタ種類、FFT部204の振幅スペクトルを生成処理する際のフィルタ種類などを含めることができる。なお計測条件Cは、計測に関する物理量Pに含まれる場合もある。
【0036】
なお、これらの状態変数は上記の項目に限定されるものではなく、他の有用な変数を状態変数として用いることが可能である。
【0037】
判定データ取得部308は、例えばコンピュータのCPUの一つの機能として、あるいはコンピュータのCPUを機能させるためのソフトウエアとして構成できる。判定データ取得部308が取得する判定データは、変速モータ部101に対して計測が行われた後に、制御部201の判定部206から取得できる。判定データは、ある状態変数の下で計測を実行した時の結果を表す指標であって、計測が行われた環境の現在の状態を間接的に表す。
【0038】
学習部304は、例えばコンピュータのCPUの一つの機能として、あるいはコンピュータのCPUを機能させるためのソフトウエアとして構成できる。学習部304は、機械学習のアルゴリズムにしたがい、変速モータ部101の計測条件を学習する。学習部304は、変速モータ部101に対して、前述の状態変数と判定データとを含むデータ集合に基づく学習を反復実行する。
【0039】
意思決定部303は、例えばコンピュータのCPUの一つの機能として、あるいはコンピュータのCPUを機能させるためのソフトウエアとして構成できる。意思決定部303は、例えば学習部304が学習した計測条件を、使用者等に対して判定結果表示部207等を共用して表示する。また意思決定部303は、学習部304が学習した計測条件に基づいて、変速モータ部101の制御部201の制御実行部209への指令値を生成して出力する。意思決定部303が計測条件を決定し、これに基づいて制御部201の制御実行部209へ指令値を出力した場合、これに応じて計測条件が変化する。
【0040】
図2は本発明の第1の実施形態に係る変速モータ装置1の物理量の一部例等をタイミングチャートで表したものである。横軸は共通で時刻tを示していて、取得された各波形を同時刻に揃えて表したものである。
【0041】
図2(a)はモータ駆動部211から出力される電流値iを示していて、正側がモータの正転、負側がモータの逆転である。電流は実際の電流値を計測しても良いし、指令としてのロジックであっても良い。したがってこの電流値iの符号によってモータ102の回転方向が特定でき、したがって変速機104の出力軸105の回転方向も特定できる。
【0042】
図2(b)は信号処理部203から出力される位置信号波形データの例である。本実施形態の変速機104は減速比が30:1であることから、出力軸105を1回転させるのにモータ102は30回転することが必要である。したがって図2(b)は、若干のオーバラップを有して回転の位置値θが0度から10800度を少し超えた値の間を繰り返した様子を示している。
【0043】
図2(c)は出力トルク信号波形データの例である。モータ102が正転している時には出力トルク信号は正で、モータ102が逆転している時には出力トルク信号は負でそれぞれ表している。
【0044】
図2(d)は温度検出部107から出力される温度の波形データの例である。変速モータ部101を運転することで次第に温度が上昇する。
【0045】
図2(e)は角速度信号処理部213から出力されるx方向の角速度信号波形データの例である。図2(f)は加速度信号処理部212から出力されるx方向の加速度信号波形データの例である。図2(e)及び図2(f)ではx方向のみの角速度と加速度の波形データのみを示しているが、角速度・加速度検出部108からyz方向においても同様に角速度信号波形データ、加速度信号データを得ることができる。
【0046】
演算部205の信号処理部203で行う変速モータ部101の良否判定用の判定信号処理は、例えば単純平均処理、除去平均処理などがある。
【0047】
単純平均処理は、出力トルク信号波形において規定した計測開始から終了までの計測期間内の全計測データを加算して、これをデータ数で割り算して平均値を求めて変速モータ部101の良否判定用のトルク値として確定する処理である。
【0048】
除去平均処理は、出力トルク信号波形において規定した計測開始から終了までの計測期間内の全データのうち最大値と最小値を抽出し、その最大値と最小値の差を所定の分割数にて割ってグループ分けし、最大のグループ及び最小のグループのデータを除去して、残りのグループのデータを単純平均して平均値を求めて変速モータ部101の良否判定用のトルク値として確定する処理である。
【0049】
判定部206は演算部205からこの良否判定用のトルク値を受信して、記憶部208に記憶されている良否判定のトルク値の上限値τ、下限値τと比較する。判定部206は、良否判定用のトルク値が上限値τから下限値τの範囲内であれば良品として判定出力し、範囲外であれば不良と判定し、この良否判定結果の情報を判定結果表示部207へ送信する。
【0050】
図3は本発明の第1の実施形態に係る出力トルク信号処理部202から出力されたトルク値波形を高速フーリエ変換してこれを解析した振幅スペクトルの例である。横軸は周波数、縦軸はスペクトル強度である。図3は、変速モータ部101が正常な時の振幅スペクトルであって、基準値avを超える特徴的な周波数は周波数fa,fb,fc,fdの4つである。したがって、記憶部208にはこの4つの周波数fa,fb,fc,fdが記憶されている。
【0051】
判定部206は演算部205から現在の振幅スペクトルデータを受信して、記憶部208に記憶されている良否判定の4つの周波数fa,fb,fc,fdと比較する。判定部206は、現在の振幅スペクトルデータにおいて基準値avを超える強度の周波数が4つの周波数fa,fb,fc,fdと合致すれば良品として判定出力し、新たな周波数があれば不良と判定し、この良否判定結果の情報を判定結果表示部207へ送信する。
【0052】
図4は、本発明の第2の実施形態の機械学習システム401の構成を示した図である。機械学習システム401は、変速モータ装置1と、機械学習装置301とで構成されている。変速モータ装置1は、変速モータ部101と制御部201とで構成されている。変速モータ部101は、モータ102と、位置検出部103と、変速機104と、トルク検出部106と、トルク検出部109と、を含んで構成される。制御部201は、変速モータ部101へ電源を供給して駆動する電気回路基板と、変速モータ部101に設けられた各検出手段からの電気信号を処理する電子回路とを含むコンピュータのハードウエアすなわち回路基板と、演算等を行うソフトウエアで構成される。機械学習装置301は、制御部201と電気信号の送受信を行って計測に関する学習を行うコンピュータのハードウエア及びソフトウエアで構成される。
【0053】
変速モータ部101は、第2の実施形態では主として変速機104の単体評価を行う所謂テストベンチなどに適するように構成されている。モータ102、変速機104、トルク検出部106の接続形態は第1の実施形態と同じであるが、それぞれ独立した装置で構成され、さらにモータ102の出力軸(変速機104の入力軸)にトルク検出部109が挿入されている。そして、モータ102とトルク検出部109、トルク検出部109と変速機104、変速機104とトルク検出部106はそれぞれ軸継手若しくはフランジ構造で接続されている。トルク検出部106は、モータ102の出力トルク、すなわち変速機104の入力軸トルク値τmを検出してデジタル値で出力する。
【0054】
第2の実施形態における制御部201、機械学習装置301の構成は第1の実施形態と基本的に同じである。第2の実施形態の制御部201が第1の実施形態の制御部201と相違点について説明する。第1の相違点は、変速機104の入力軸トルク値τmが出力軸トルク値τgに同期して、入力軸トルク値τmの一部を除去及び加工して出力する信号処理部203を有していることである。信号処理部203はフィルタを含んでいて、バンドパスフィルタ、ローパスフィルタ、平均化処理のフィルタなどである。第2の実施形態では、変速機104の入力軸トルク値τmによってモータ102のコギングトルクなどを検出することができるため、変速機104の出力軸トルク値τgと同時刻で比較することで、変速機104の状態をより精確に把握することが可能となる。例えば変速機104が波動歯車減速機である場合、フレクスプラインが湾曲するためトルクリップルが生じるので、減速前のトルクがそのまま変速機104の出力軸105に現れることはない。また変速機104がボール減速機である場合、ボールの動きによってトルクが脈動する現象が生じ、波動歯車減速機同様に減速前のトルクがそのまま変速機104の出力軸105に現れることはない。なおトルク検出部106側に駆動装置を取り付けて駆動することで、バックドライビリティも評価することができる。
【0055】
第2の相違点は、入力軸トルク信号及び出力軸トルク信号から変速機の良否判定値を確定するために用いる判定処理の項目を有していることである。この判定処理の種類として、例えば変速機104の変速比であって、変速機104の出力軸が1回転する時のモータ102の回転数の比である。これによって変速機104の出力段の部材の回転全域に渡った性能特性を明らかにすることができる。
【0056】
図5は本発明の第2の実施形態に係る変速モータ装置1の物理量の一部例等をタイミングチャートで表したものである。横軸は共通で時刻tを示していて、取得された各波形を同時刻に揃えて表したものである。図6では時刻の途中を省略して、初期の部分t1と時間が経過した部分t2とを表している。
【0057】
図5(c)において、初期の部分t1では大きなトルクの変動ピークは見受けられないが、経過した部分t2では、モータの回転の位置値θで0度から3600度の間に変動が見受けられる。図5(g)は、変速機104の入力軸トルク値τmの波形である。したがって出力軸トルク値τgの波形に乗る成分と入力軸トルク値τmのとの関係から、波形に適用する適切なフィルタを機械学習によって明らかにできる。
【0058】
図6は本発明の第2の実施形態に係る出力トルク信号処理部202から出力されたトルク値波形のFFT解析による振幅スペクトルの例である。横軸は周波数、縦軸はスペクトル強度である。図6(a)は、変速モータ部101が正常な時の振幅スペクトルであって、基準値aを超える特徴的な周波数は周波数fe,fg,fh,fiの4つである。したがって、記憶部208にはこの4つの周波数fe,fg,fh,fiが記憶されている。一方図6(b)は、変速モータ部101に何かしらの異常が発生していると思われる時の振幅スペクトルであって、基準値avを超える特徴的な周波数は周波数fe,fg,fh,fいの4つに加えて、周波数fj,fkが現れている。
【0059】
図7は本発明の実施形態に係る機械学習システム401の詳細構成図である。機械学習システム401は、変速モータ装置1と機械学習装置301とで構成されている。ここで示されている機械学習システム401は、機械学習が教師あり学習を行う場合である。教師あり学習は、入力とそれに対応する出力との既知のデータセット、いわゆる教師データが予め大量に与えられる。機械学習装置301は、この教師データから入力と出力との相関性を暗示する特徴を識別して、新たな入力に対する出力を推定するための相関性モデル、例えばここでは計測条件を学習する。
【0060】
制御部201の演算部205は、状態変数を構成する物理量Pと計測条件Cとを演算して出力する。一方、機械学習装置301の状態観測部302は、演算部205から出力された物理量Pと計測条件Cとを受信する。
【0061】
図7に示す機械学習装置301は、状態観測部302と、学習部304aと、意思決定部303と、判定データ取得部308とを有する。状態観測部302は、制御部201の演算部205から出力された物理量Pと計測条件Cとを受信する。状態観測部302は学習部304aへこの物理量Pと計測条件Cとを送信する。一方、判定データ取得部308は制御部201の判定部206から出力された判定データを受信する。判定データ取得部308は学習部304aへこの判定データを送信する。
【0062】
学習部304aは、誤差計算部305と、モデル更新部306と、学習結果記憶部307を備える。誤差計算部305は、状態変数及び判定データから計測を行う際の最適な計測条件を導く相関性モデルと、予め用意された教師データから識別される相関性特徴と、の誤差を計算する。モデル更新部306は、この誤差を縮小するように相関性モデルを更新する。そして学習部304aは、モデル更新部306が相関性モデルの更新を繰り返すことによって計測における最適な計測条件を学習して、学習結果記憶部307にてこれを記憶する。意思決定部303は、学習部304aが学習した計測条件に基づいて、変速モータ装置1の制御部201の制御実行部209への指令値を生成して出力する。
【0063】
なお学習結果記憶部307に、他の機械学習装置によって得られた学習結果や、他の機械学習システムが記憶している学習結果を入力して記憶させても良い。さらに学習結果記憶部307が記憶している学習結果を、他の機械学習装置や他の機械学習システムに対して出力することも可能である。
【0064】
相関性モデルの初期値は、例えば、状態変数及び判定データとの相関性を単純化して表現したものであり、教師あり学習の開始前に学習部304aに与えられる。教師データは、例えば、過去の計測において管理者等が決定した計測条件を記録することで蓄積された経験値(変速機の種類や変速比と、適切な計測条件との既知のデータセット)によって構成される。誤差計算部305は、学習部304aに与えられた大量の教師データから変速機104の種類や変速比と、適切な計測条件との相関性を暗示する相関性特徴を識別し、この相関性特徴と、現在の状態における状態変数及び判定データに対応する相関性モデルとの誤差を求める。モデル更新部306は、例えば予め定めた更新ルールにしたがい、誤差が小さくなる方向へ相関性モデルを更新する。
【0065】
相関性モデルの初期値が与えられた後、誤差計算部305は、更新後の相関性モデルにしたがって計測を試行することで変化した状態変数及び判定データを用いて、変化した状態変数及び判定データに対応する相関性モデルに対して誤差を求める。そしてこの誤差に基づきモデル更新部306は、再び相関性モデルを更新する。これを繰り返して、未知であった変速モータ部101の現在状態とそれに対する適切な計測条件との相関性が徐々に明らかになる。相関性モデルの更新により、変速機104の種類や変速比と、適切な計測条件との関係が最適解に徐々に近づく。
【0066】
教師あり学習を進める際に、例えばニューラルネットワークを用いても良い。ニューラルネットワークは、例えばニューロンのモデルと同様の構造の演算装置や記憶装置等によって構成できる。機械学習装置301においては、状態変数と判定データとを入力として、学習部304aがニューラルネットワークにしたがう多層構造の演算を行い、計測を行う際の最適な計測条件を出力することができる。ニューラルネットワークの動作モードには、学習モードと価値予測モードとがあり、例えば学習モードで学習データセットを用いて重みを学習し、学習した重みを用いて価値予測モードで行動の価値判断を行うことができる。
【0067】
上記の機械学習装置301の構成は、コンピュータのCPUが実行する機械学習方法、あるいはソフトウエアとして記述できる。この機械学習方法は、計測を行う際の最適な計測条件を学習する方法である。この機械学習方法は、状態変数観測ステップと、判定データ取得ステップと、学習ステップを有している。状態変数観測ステップは、計測を行う際の計測条件を示す条件データを状態変数として観測する。判定データ取得ステップは、この状態変数のもとで計測を行った際の計測の判定が良好であった時の計測条件を示す判定データを取得する。学習ステップは、この状態変数と判定データとを用いて、計測を行う際の計測条件と適切な計測条件とを関連付けて学習する。
【0068】
なお図7における機械学習システム401は、学習部304aが教師あり学習を行う場合について説明したが、半教師あり学習、教師なし学習などの各種の機械学習を行うことも可能である。
【0069】
図8は本発明の機械学習システム401の変形例の詳細構成図である。機械学習システム401は、変速モータ装置1と機械学習装置301とで構成されている。図8に示す機械学習システム401は機械学習を強化学習にて行う場合である。強化学習は、学習対象が存在する環境の現在状態(入力)を観測するとともに、現在状態で所定の行動(出力)を実行し、その行動に対し予め定めた報酬を与えるというサイクルを反復して、報酬の総計が最大化されるような計測条件を最適なものとして学習する手法である。
【0070】
図8に示す機械学習装置301において、学習部304bは、報酬演算部309と、行動価値関数更新部311と、学習結果記憶部307とを備える。報酬演算部309は、状態変数に基づいて計測することにより得られる判定結果に関連する報酬を求める。行動価値関数更新部311はこの報酬を用いて、計測時に使用される計測条件の価値を表す行動価値関数Qを更新する。そして学習部304bは、行動価値関数更新部311が行動価値関数Qの更新を繰り返すことによって変速モータ装置1の計測条件を学習する。
【0071】
学習部304bが実行するいわゆるQ学習として知られる強化学習について説明する。この強化学習のアルゴリズムは、行動主体の状態sと、その状態sで行動主体が選択し得る行動aとを独立変数として、状態sで行動aを選択した場合の行動の価値を表す行動価値関数Q(s,a)を学習する方法である。状態sで行動価値関数Q(s,a)が最も高くなる行動aを選択することが最適解となる。学習部304bは、状態sと行動aとの相関性が未知の状態でQ学習を開始し、任意の状態sで種々の行動aを選択する試行錯誤を繰り返すことで、行動価値関数Q(s,a)を反復して更新し、最適解に近づける。ここで、状態sで行動aを選択した結果として環境(状態s)が変化した時に、その変化に応じた報酬r(行動aの重み付け)が得られるように構成し、より高い報酬rが得られる行動aを選択するように学習を誘導することで、行動価値関数Q(s,a)を比較的短時間で最適解に近づけることができる。
【0072】
行動価値関数Q(s,a)の更新式は、一般に下記の数1式のように表すことができる。数1式において、s及びaはそれぞれ時刻tにおける状態及び行動であり、行動aにより状態はst+1に変化する。rt+1は、状態がsからst+1に変化したことで得られる報酬である。maxの項は、時刻t+1で最大の価値になる行動を行った時の価値を意味する。αは学習係数であり、0<α≦1、 0<γ≦1で任意設定され、行動価値関数Q(s,a)の更新をどれだけ急速に行うかを設定するものである。一方、γは割引率であり、0<γ≦1で任意設定され、将来の価値をどれだけ割り引いて考えるかを設定するものである。
【数1】
【0073】
学習部304bがQ学習を実行する場合、状態観測部302が観測した状態変数、及び判定データ取得部308が取得した判定データは、更新式の状態sに該当する。現在状態の計測条件をどのように変更するかという行動は、更新式の行動aに該当する。報酬演算部309が求める報酬は、更新式の報酬rに該当する。よって行動価値関数更新部311は、現在状態の計測条件の価値を表す行動価値関数Q(s,a)を、報酬を用いたQ学習により繰り返し更新する。
【0074】
報酬演算部309が求める報酬は、例えば物理量が予め設定された範囲内で安定している場合に正(プラス)の報酬とし、物理量が予め設定された範囲外となっている場合に負(マイナス)の報酬とすることができる。正負の報酬の絶対値は、互いに同一であっても良いし異なっていても良い。この報酬に係る項目の詳細については図9のフローチャート図を用いて後述する。
【0075】
報酬条件設定部310は、正負の報酬の値を設定する役割を持っている。報酬条件設定部310は、学習が進むにつれて正負の報酬の値を変化させても良い。
【0076】
行動価値関数更新部311は、状態変数sと判定データdと報酬rとを、行動価値関数Q(s,a)で表される行動価値と関連付けて整理した例えば行動価値テーブルを有している。この場合に、行動価値関数更新部311が行動価値関数Q(s,a)を更新するという行為は、行動価値関数更新部311が行動価値テーブルを更新するという行為を指すことに等価と言える。Q学習の開始時には環境の現在状態とそれに対する行動との相関性は未知であるから、行動価値テーブルにおいては、種々の状態変数sと判定データdと報酬rとが、無作為に定めた行動価値の値と関連付けた形態で用意されている。なお報酬演算部309は、判定データdに基づきこれに対応する報酬rを直ちに算出でき、算出した値の報酬rが行動価値テーブルに書き込まれる。
【0077】
変速モータ部101の合否判定結果に応じた報酬rを用いてQ学習を進めると、より高い報酬rが得られる行動を選択する方向へ学習が誘導される。そして選択した行動を現在状態で実行した結果として変化する環境の状態(状態変数及び判定データ)に応じて、現在状態で行う行動の行動価値の値が書き替えられて行動価値テーブルが更新される。この更新を繰り返すことにより、行動価値テーブルにおける行動価値の値は、適正な行動ほど大きな値となるように更新される。この更新を繰り返すことで、未知であった環境の現在状態とそれに対する行動との相関性が徐々に明らかになる。つまり行動価値テーブルの更新により、計測条件が最適なものに徐々に近づくことになる。
【0078】
学習結果記憶部307は、学習部304bが学習した学習結果を記憶する。この学習結果とは例えば行動価値の値を含む行動価値テーブルを指す。
【0079】
図9は本発明の強化学習用の機械学習システムが実行するフローチャート図である。図9により、機械学習装置301が行うQ学習のフローを説明する。
【0080】
ステップS01にて、状態観測部302は変速モータ装置1の状態変数に係るデータを、判定データ取得部308は変速モータ装置1の判定部206の判定に係るデータを取得する。
【0081】
ステップS02にて、学習部304bは、状態観測部302が取得した状態変数に係るデータと、判定データ取得部308が取得した判定に係るデータと、に基づいて現在の状態Sを特定する。
【0082】
ステップS03にて、学習部304bは、過去の学習結果とステップS02にて特定した現在の状態に基づいて行動aを選択し、意思決定部303は学習部304bにて選択された行動に基づいて行動aを実行する。
【0083】
ステップS04にて、状態観測部302は変速モータ装置1の状態変数に係るデータを、判定データ取得部308は変速モータ装置1の判定部206の判定に係るデータをそれぞれ新たに取得する。この時、変速モータ装置1の状態は、ステップS03を実行していることから時刻が推移しているとともに実行された行動により変化している。
【0084】
ステップS05にて、報酬演算部309は、ステップS04で取得した状態変数に係る物理量の連続した複数のデータを基に、この複数のデータの変動が小さいすなわち物理量が安定しているかどうかを判断する。ステップS05にて報酬演算部309が、物理量が安定していると判断した場合(Yes)はステップS06へ進み、物理量が安定していないと判断した場合(No)はステップS07へ進む。物理量が安定しているかどうかの許容範囲は予め個別に設定されているものである。
【0085】
ステップS06にて、報酬演算部309は、正の値の報酬を演算してステップS08へ進む。一方ステップS07にて、報酬演算部309は、負の値の報酬を演算してステップS08へ進む。
【0086】
ステップS08にて、報酬演算部309は、ステップS04で取得した状態変数に係るデータを基に、出力軸のトルクが設定した範囲内にあるかどうかを判断する。出力軸のトルクが設定した範囲内にあると判断した場合(Yes)はステップS09にて正の値の報酬を演算した後ステップS11へ進み、そうでないと判断した場合(No)はステップS10にて負の値の報酬を演算した後ステップS11へ進む。
【0087】
ステップS11にて、報酬演算部309は、ステップS04で取得した状態変数に係るデータを基に、回転位置に依存した出力軸のトルク変化があるかどうかを判断する。回転位置に依存した出力軸のトルク変化がないと判断した場合(Yes)はステップS12にて正の値の報酬を演算した後ステップS14へ進み、そうでないと判断した場合(No)はステップS13にて負の値の報酬を演算した後ステップS14へ進む。
【0088】
ステップS14にて、報酬演算部309は、ステップS04で取得した状態変数に係るデータを基に、回転方向による出力軸のトルクの差の有無を判断する。回転方向による出力軸のトルクの差がないと判断した場合(Yes)はステップS15にて正の値の報酬を演算した後ステップS17へ進み、そうでないと判断した場合(No)はステップS16にて負の値の報酬を演算した後ステップS17へ進む。
【0089】
ステップS17にて、報酬演算部309は、ステップS04で取得した状態変数に係るデータを基に、FFT解析による出力軸のトルク振幅スペクトルに規定以上の新たなピーク周波数があるかどうかを判断する。新たなピーク周波数がないと判断した場合(Yes)はステップS18にて正の値の報酬を演算した後ステップS20へ進み、そうでないと判断した場合(No)はステップS19にて負の値の報酬を演算した後ステップS20へ進む。
【0090】
ステップS20にて、報酬演算部309は、ステップS04で取得した状態変数に係るデータを基に、変速機の温度が規定範囲内であるかどうかを判断する。変速機の温度が規定範囲内であると判断した場合(Yes)はステップS21にて正の値の報酬を演算した後ステップS23へ進み、そうでないと判断した場合(No)はステップS22にて負の値の報酬を演算した後ステップS23へ進む。
【0091】
ステップS23にて、報酬演算部309は、ステップS04で取得した判定に係るデータを基に、設定トルクを変化させた時の出力軸のトルクの応答時間が所定の値内であるかどうかを判断する。出力軸のトルクの応答時間が所定の値内であると判断した場合(Yes)はステップS24にて正の値の報酬を演算した後ステップS26へ進み、そうでないと判断した場合(No)はステップS25にて負の値の報酬を演算した後ステップS26へ進む。
【0092】
ステップS26にて、行動価値関数更新部311は、ステップS06~S24で、報酬演算部309が求めた負の報酬又は正の報酬を行動価値関数Qの更新式に適用し、更新後の行動価値関数Qとして行動価値関数のテーブルを更新して、ステップS02へ戻る。学習部304bは、ステップS02~ステップS26の区間を繰り返すことで行動価値関数のテーブルを反復して更新し、計測条件の学習を行う。なお各判断ステップにおける判断項目はこれに限らず、変速機の種類、変速比などによって定めることができる。
【0093】
なお機械学習においては、計測条件の少なくとも1つを所定の範囲内で意図的に変動させて学習部304に学習させることも可能である。計測条件を意図的に変動させることで、外乱に対するロバスト性を高めた学習を実施することができる。
【0094】
図10は本発明の複数の機械学習システムを含むシステムの構成図である。システム501は、複数の機械学習システム401a~401dと、上位コンピュータ402と、これらを互いに通信にて接続するネットワーク403で構成される。各機械学習システム401a~401dにはそれぞれ、変速モータ装置1a~1dと、機械学習装置301a~301dとで構成されている。各変速モータ装置1a~1dは、変速モータ部101a~101dと、制御部201a~201dで構成されている。
【0095】
このシステム501の構成では、各機械学習装置301a~301dで学習した学習結果が上位コンピュータ402にアップロードされる。そして上位コンピュータ402にアップロードされた学習データは、各機械学習装置301a~301dが共有することができる。この構成では、各機械学習システム401a~401dに機械学習を行う機械学習装置301a~301dが設けられているので、高速に学習処理を行い、その結果を全ての機械学習システム401a~401dで用いることができる。
【0096】
図11は本発明の複数の機械学習システムを含むシステムの変形例の構成図である。システム502は、複数の機械学習システム401a、401bと、複数の変速モータ装置1c、1dと、これらを互いに通信にて接続するネットワーク403で構成される。機械学習システム401a、401bにはそれぞれ、機械学習装置301a、301bが組み込まれているが、複数の変速モータ装置1c、1dは直接的に機械学習装置を有していない。この場合、機械学習システム401a、401bで学習した結果はネットワーク403にて共有できることから、機械学習装置を有していない複数の変速モータ装置1c、1dもこの学習結果を利用することができる。もちろん機械学習装置301aと機械学習装置301bでそれぞれ学習した学習結果は互いに共有することができる。この構成では、機械学習装置を有していない複数の変速モータ装置も、他の学習結果を用いて計測ができることからコストセーブや既存の設備に用いることができる。
【0097】
図12は本発明の機械学習装置を含むシステムの変形例の構成図である。システム503は、複数の変速モータ装置1a~1dと、これらを互いに通信にて接続する機械学習装置301とで構成される。すなわち複数の変速モータ装置1a~1dに対して少なくとも1以上の機械学習装置301が学習機能を受け持ち、それぞれの変速モータ装置1a~1dで得られた状態変数及び判定データを用いて、変速モータ装置1a~1d共通の計測条件を学習する。複数の変速モータ装置1a~1dと、機械学習装置301の接続は直接配線されたものであっても良いし、ネットワークとして行われるものであっても良い。複数の変速モータ装置1a~1dと、機械学習装置301の接続がネットワークである時は、機械学習装置301はクラウドサーバ上に構成することも可能である。この構成では、機械学習装置301は機械学習結果を一元的に管理できるという利点がある。
【0098】
本発明の機械学習装置、機械学習システムによれば、変速機104の温度データと出力軸105の出力軸トルクデータを状態変数の物理量としている場合、変速機104の温度と出力トルクとから変速機104の劣化や故障を推定できる。すなわち変速機104の温度が正常時よりも上昇している場合、変速機104内部のオイルシールの損傷などによるオイルの漏れによるオイル不足、またオイルにおける金属粉の濃度の上昇による冷却不良、歯車式の変速機による歯車の噛み合い不良による摩擦の増大、歯車の摩耗などによるバックラッシの増大で起こる振動による発熱などによって、出力軸トルクの値が既定値を外れる現象となって現れるためである。
【0099】
また、本発明の機械学習装置、機械学習システムによれば、変速機104の回転方向を状態変数の計測条件とし、出力軸105の出力軸トルクデータを状態変数の物理量としている場合、変速機104の回転方向と出力トルクとの相関から変速機104の劣化や故障の推定を得ることができる。すなわち変速機104の回転方向によってトルク変動は、歯車やボールの摩耗などによるバックラッシの増大などによって生じるためである。
【0100】
また、本発明の機械学習装置、機械学習システムによれば、変速モータ部101に加わる角速度、加速度、出力軸105の出力軸トルクデータを状態変数の物理量としている場合、変速モータ部101に生じる角速度、加速度と出力トルクとの相関を得ることで変速モータ部101の故障の推定を得ることができる。すなわち変速モータ部101の移動方向と移動距離、振動の揺れ幅、強度、衝撃の強度によって出力軸のトルクデータの振幅スペクトルに表れる特有の周波数のピークを学習することで、正常時と故障時の差が明らかになって、変速モータ部101の動きの履歴と故障との相関を得ることが可能となる。例えば変速モータ部101がシリアルリンクロボットに配置されている場合、ロボットの動きにおいて、ある変速モータ部にはラジアル荷重が、他の変速モータ部にはスラスト荷重が、それぞれ高い頻度で加わるケースがある。そうすると変速モータ部の移動方向と移動距離、振動の揺れ幅、強度、衝撃の強度などと、各変速モータ部の劣化や故障との相関が上記の機械学習によって明らかになって行く。
【0101】
一方、本発明のシステムによれば、機械学習装置の学習機能を行いながら、変速モータ装置の計測を実施し続けることで、変速モータ装置毎に異なる個体差や経時変化を学習することができ、適切な計測条件によって計測を行うことができる。特にシリアルリンクロボットにこの変速モータ装置が搭載されている場合、図12に示すような多数の変速モータ装置と1つの機械学習装置は有用である。
【0102】
以上、本発明を好ましい実施形態に基づいて説明したが、本発明は上述した実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々の変更が可能である。
【産業上の利用可能性】
【0103】
本発明の活用例として、変速モータ装置及びこれを複数配置したシリアルリンクロボットなどへの適用が可能である。
【符号の説明】
【0104】
1 : 変速モータ装置
1a~1d :変速モータ装置
101 :変速モータ部
102 :モータ
103 :位置検出部
104 :変速機
104a :ウエーブジェネレータ
104b :サーキュラスプライン
104c :フレクスプライン
105 :出力軸
106 :トルク検出部
106a :歪みゲージ
106b :回転基板
106c :発光素子
106d :受光素子
106e :固定基板
107 :温度検出部
108 :角速度・加速度検出部
109 :トルク検出部
201 :制御部
201a~201d :制御部
202 :出力トルク信号処理部
203 :信号処理部
204 :FFT部(高速フーリエ変換部)
205 :演算部
206 :判定部
207 :判定結果表示部
208 :記憶部
209 :制御実行部
210 :設定部
211 :モータ駆動部
P :物理量
C :計測条件
301 :機械学習装置
301a~301d :機械学習装置
302 :状態観測部
303 :意思決定部
304 :学習部
304a、304b :学習部
305 :誤差計算部
306 :モデル更新部
307 :学習結果記憶部
308 :判定データ取得部
309 :報酬演算部
310 :報酬条件設定部
311 :行動価値関数更新部
401 :機械学習システム
401a~401d :機械学習システム
402 :上位コンピュータ
403 :ネットワーク
501 :システム
502 :システム
503 :システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12