(58)【調査した分野】(Int.Cl.,DB名)
前記稼働状態は、前記電動機に流れる電流を指令する電流指令、前記電動機に印加される電圧を指令する電圧指令、前記電動機に流れる電流もしくは電圧の周波数を指令する周波数指令、前記電動機が出力するトルク、前記電動機の回転数、前記電動機の稼働時間、前記電動機近傍の温度、前記電動機近傍の湿度、および前記電動機に発生する振動、のうちの少なくとも1つを含む請求項1に記載の機械学習装置。
前記報酬計算部は、前記実際寿命に対する前記予測寿命と前記実際寿命との差の割合が、規定範囲内であるとき報酬を増やし、前記規定範囲外であるとき報酬を減らす請求項3に記載の機械学習装置。
前記学習部は、複数の電動機に対して取得される前記訓練データセットに従って、前記条件を学習するように構成される請求項1〜4のいずれか一項に記載の機械学習装置。
前記意思決定部により計算された前記予測寿命に基づいて、前記電動機に流れる電流を指令する電流指令、前記電動機に印加される電圧を指令する電圧指令、および前記電動機に流れる電流もしくは電圧の周波数を指令する周波数指令、のうちの少なくとも1つを変更する変更指令を、前記電動機を制御する制御装置へ出力する変更指令出力部をさらに備える請求項6〜8のいずれか一項に記載の寿命予測装置。
前記学習部は、前記現在の状態変数によって構成される追加の訓練データセットに従って、前記条件を再学習して更新するように構成される請求項6〜9のいずれか一項に記載の寿命予測装置。
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、電動機の使用環境によってその寿命は異なるものとなる。したがって、実験による電動機の寿命予測では正確さを欠くことがある。また、正確さを求めて個々の使用環境に応じて実験を再現するにも時間や手間がかかり、煩雑である。また、個人の経験則に頼るもの非効率であり、個人差も大きい。
【0008】
従って本発明の目的は、上記問題に鑑み、使用環境に応じた電動機の寿命の予測を正確かつ容易に行うことができる機械学習装置および方法ならびに該機械学習装置を備えた寿命予測装置および電動機システムを提供することにある。
【課題を解決するための手段】
【0009】
上記目的を実現するために、本発明においては、電動機の予測寿命に関連付けられる条件を学習する機械学習装置は、電動機の稼働状態を検出するセンサの出力データと、電動機の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する状態観測部と、電動機の実際寿命に関するデータを取得する実際寿命データ取得部と、状態変数と実際寿命との組合せに基づいて作成される訓練データセットに従って、電動機の予測寿命に関連付けられる条件を学習する学習部と、を備える。
【0010】
ここで、上記稼働状態は、電動機に流れる電流を指令する電流指令、電動機に印加される電圧を指令する電圧指令、電動機に流れる電流もしくは電圧の周波数を指令する周波数指令、電動機が出力するトルク、電動機の回転数、電動機の稼働時間、電動機近傍の温度、電動機近傍の湿度、および電動機に発生する振動、のうちの少なくとも1つを含んでもよい。
【0011】
また、学習部は、予測寿命および実際寿命に基づいて報酬を計算する報酬計算部と、状態変数および報酬に基づいて、電動機の予測寿命を計算するための関数を更新する関数更新部と、を備えてもよい。
【0012】
また、報酬計算部は、実際寿命に対する予測寿命と実際寿命との差の割合が、規定範囲内であるとき報酬を増やし、規定範囲外であるとき報酬を減らすようにしてもよい。
【0013】
また、学習部は、複数の電動機に対して取得される訓練データセットに従って、条件を学習するように構成されてもよい。
【0014】
また、本発明においては、上述の機械学習装置を備えた、電動機の寿命予測装置は、学習部が訓練データセットに従って学習した結果に基づいて、現在の状態変数の入力に応答して、電動機の予測寿命を計算する意思決定部をさらに備えてもよい。
【0015】
また、寿命予測装置は、意思決定部により計算された予測寿命をオペレータに通知する通知部をさらに備えてもよい。
【0016】
また、寿命予測装置は、意思決定部により計算された予測寿命に基づき、電動機の交換を促す情報をオペレータに通知する通知部をさらに備えてもよい。
【0017】
また、寿命予測装置は、意思決定部により計算された予測寿命に基づいて、電動機に流れる電流を指令する電流指令、電動機に印加される電圧を指令する電圧指令、および電動機に流れる電流もしくは電圧の周波数を指令する周波数指令、のうちの少なくとも1つを変更する変更指令を、電動機を制御する制御装置へ出力する変更指令出力部をさらに備えてもよい。
【0018】
また、学習部は、現在の状態変数によって構成される追加の訓練データセットに従って、上記条件を再学習して更新するように構成されてもよい。
【0019】
また、本発明においては、電動機システムは、上述の寿命予測装置と、電動機と、電動機を制御する制御装置と、電動機の稼働状態を検出するセンサと、を備える。
【0020】
また、本発明においては、電動機の予測寿命に関連付けられる条件を学習する機械学習方法は、電動機の稼働状態を検出するセンサの出力データと、電動機の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する状態観測ステップと、電動機の実際寿命に関するデータを取得する実際寿命データ取得ステップと、状態変数と実際寿命との組合せに基づいて作成される訓練データセットに従って、電動機の予測寿命に関連付けられる条件を学習する学習ステップと、を備える。
【発明の効果】
【0021】
本発明によれば、使用環境に応じた電動機の寿命の予測を正確かつ容易に行うことができる機械学習装置および方法ならびに該機械学習装置を備えた寿命予測装置および電動機システムを実現することができる。
【0022】
本発明による機械学習装置およびその方法によれば、電動機を実際に動作させながら予測寿命を学習するので、実際の使用状況に応じた正確な予測寿命が学習される。また、本発明による機械学習装置を備えた寿命予測装置および電動機システムによれば、実際の使用状況に応じた正確な予測寿命を計算することができる。これにより、設計者や作業者は、電動機の正確な予測寿命を知ることができるので、電動機が稼働不能になる前に電動機またはその構成部品を交換したり、あるいは補修や修繕などの保守を行うことができる。電動機の構成部品を交換したり保守を行うことにより、電動機の寿命を延ばすことができる。また、予測寿命の計算に際して得られた電動機の寿命に大きな影響を与える稼働状態を知ることができるので、設計者や作業者は、電動機の寿命に影響を及ぼす稼働状態を変更する対応を取ることができる。また、電動機の寿命に影響を及ぼす稼働状態を変更するよう電動機の制御装置に直接指令することもできる。
【発明を実施するための形態】
【0024】
図1は、本発明の実施例による機械学習装置の原理ブロック図である。以降、異なる図面において同じ参照符号が付されたものは同じ機能を有する構成要素であることを意味するものとする。
【0025】
本発明の実施例による機械学習装置1は、電動機の予測寿命に関連付けられる条件を学習するものとして構成される。
【0026】
機械学習装置1は、状態観測部11、実際寿命データ取得部12、および学習部13を備える。ここで、機械学習装置1は、ネットワークを介して電動機に接続されるデジタルコンピュータとして構成されもよい。またあるいは、機械学習装置1は、クラウドサーバ上に設けられてもよく、この場合ネットワークを介して電動機に接続される。またあるいは、機械学習装置1は、電動機を制御する制御装置に内蔵されてもよく、この場合は、当該制御装置のプロセッサを利用して機械学習を実行する。
【0027】
状態観測部11は、電動機の稼働状態(稼働条件)を検出するセンサの出力データと、電動機の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。
【0028】
センサによって検出される電動機の稼働状態は、電動機に流れる電流を指令する電流指令、電動機に印加される電圧を指令する電圧指令、電動機に流れる電流もしくは電圧の周波数を指令する周波数指令、電動機が出力するトルク、電動機の回転数、電動機の稼働時間、電動機近傍の温度、電動機近傍の湿度、および電動機に発生する振動、のうちの少なくとも1つを含む。またさらに、これら以外の電動機に係るパラメータが電動機の稼働状態に含まれてもよい。
【0029】
状態観測部11によって状態変数として観測される上記稼働状態のうち、電動機に流れる電流を指令する電流指令、電動機に印加される電圧を指令する電圧指令、および電動機に流れる電流もしくは電圧の周波数を指令する周波数指令は、電動機を制御する制御装置が、当該電動機(より正確には当該電動機に駆動電力を供給する電力変換器)に入力するものであり、一般に、電動機の制御装置に格納された制御ソフトウェアの内部データとして利用されるものである。以下、これら稼働状態を単に「電動機の入力条件」と称することがある。
【0030】
また、状態観測部11によって状態変数として観測される上記稼働状態のうち、電動機が出力するトルク、電動機の回転数、および電動機の稼働時間は、電動機の動作の結果出力される情報であり、通常、各種センサによって検出される。例えば、電動機が出力するトルクはトルクセンサによって検出され、電動機の回転数は回転センサによって検出され、電動機の稼働時間は稼働時間計測器(計時センサ)によって検出される。以下、これら稼働状態を単に「電動機の出力条件」と称することがある。なお、上述した電動機の入力条件について、電動機の制御装置による電流指令、電圧指令、および周波数指令の結果生じる、電動機に流れる電流、電動機に印加される電圧、および電動機に流れる電流もしくは電圧の周波数を、電流センサ、電圧センサ、および周波数センサによって検出し、これらを「電動機の出力条件」としての稼働状態にを含めてもよい。
【0031】
また、状態観測部11によって状態変数として観測される上記稼働状態のうち、電動機近傍の温度、電動機近傍の湿度、および電動機に発生する振動は、電動機が設置された環境の状態を示す情報であり、これらも電動機の動作や寿命に外部的に影響力を及ぼすものである。例えば、電動機近傍の温度は温度センサ(温度計)によって計測され、電動機近傍の湿度は湿度センサ(湿度計)によって計測され、電動機に発生する振動は振動センサ(振動計)によって計測される。以下、これら稼働状態を単に「電動機の外部条件」と称することがある。
【0032】
また、状態観測部11によって観測される電動機の故障の有無に関するデータは、例えば電動機に設置された故障検出装置によって生成されてもよい。この場合、故障検出装置は、トルクセンサによって検出される外乱トルクや振動センサによって検出される振動の振幅が予め定められる閾値を超えたときに、電動機の故障発生を示すデータを出力する。またあるいは、状態観測部11によって観測される電動機の故障の有無に関するデータは、電動機の制御装置に格納された制御ソフトウェアの内部データに基づいて生成されてもよい。またあるいは、電動機の故障を発見しあるいは知得した設計者や利用者が自ら操作によって、状態観測部11へ電動機の故障発生を示すデータを入力するようにしてもよい。
【0033】
このように、状態観測部11は、電動機の稼働状態(電動機の入力条件、出力条件および外部条件)を検出するセンサの出力データと、電動機の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。機械学習装置1がネットワークを介して電動機に接続される場合やクラウドサーバ上に設けられる場合は、状態観測部11は、ネットワークを介して状態変数を観測する。またあるいは、機械学習装置1が電動機を制御する制御装置に内蔵される場合は、当該制御装置に格納された制御ソフトウェアの内部データや当該制御装置に接続された各種センサから出力されるセンサデータに基づいて状態変数を観測する。
【0034】
実際寿命データ取得部12は、電動機の実際寿命に関するデータを取得する。電動機の実際寿命は、例えば、電動機を使用を開始してから実際に寿命が到来するまで(もしくは故障するまで)の時間を計測することで得られ、例えば設計者や利用者が自ら操作によって計測した実際寿命に関するデータを実際寿命データ取得部12へ入力する。または、電動機を制御や駆動を行う装置中にタイマーを設置し、電動機の稼働時間を積算しこれを実際寿命データ取得部12へ入力する。
【0035】
学習部13は、状態観測部11によって観測された状態変数と実際寿命データ取得部12によって取得された実際寿命との組合せに基づいて作成される訓練データセットに従って、電動機の予測寿命を学習する。なお、訓練データセットを複数の電動機に関して取得してもよくこの場合、学習部13は、複数の電動機に対して取得される訓練データセットに従って、電動機の予測寿命を学習する。
【0036】
図2は、本発明の実施例による機械学習方法の動作フローを示すフローチャートである。電動機の予測寿命に関連付けられる条件を学習する機械学習方法は、状態観測ステップS101と、実際寿命データ取得ステップS102と、学習ステップS103とを備える。
【0037】
状態観測ステップS101は、状態観測部11により実行されるものであり、すなわち、電動機の稼働状態を検出するセンサの出力データと、電動機の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。
【0038】
実際寿命データ取得ステップS102は、実際寿命データ取得部12により実行されるものであり、すなわち、電動機の実際寿命に関するデータを取得する。
【0039】
なお、上述のステップS101の処理とステップS102の処理は任意に入れ替えて実行してもよい。
【0040】
学習ステップS103は、学習部
13によって実行されるものであり、状態観測部11によって観測された状態変数と実際寿命データ取得部12によって取得された実際寿命との組合せに基づいて作成される訓練データセットに従って、電動機の予測寿命を学習する。
【0041】
学習部13が用いる学習アルゴリズムはどのようなものを用いてもよい。一例として、強化学習(Reinforcement Learning)を適用した場合について説明する。強化学習は、ある環境内におけるエージェント(行動主体)が、現在の状態を観測し、取るべき行動を決定する、というものである。エージェントは行動を選択することで環境から報酬を得て、一連の行動を通じて報酬が最も多く得られるような方策を学習する。強化学習の代表的な手法として、Q学習(Q−learning)やTD学習(TD−learning)が知られている。例えば、Q学習の場合、行動価値関数Q(s,a)の一般的な更新式(行動価値テーブル)は式1で表される。
【0043】
式1において、s
tは時刻tにおける環境を表し、a
tは時刻tにおける行動を表す。行動a
tにより、環境はs
t+1に変わる。r
t+1はその環境の変化によってもらえる報酬(reward)を表し、γは割引率を表し、αは学習係数を表す。Q学習を適用した場合、行動a
tは、予測された寿命によっては電動機またはその構成部品を交換したり保守したりすることをもたらす当該予測寿命が該当する。
【0044】
図3は、本発明の実施例による、強化学習を用いた機械学習装置の原理ブロック図である。学習部13は、報酬計算部21と関数更新部22とを備える。報酬計算部21は、後述する意思決定部によって決定された予測寿命および実際寿命データ取得部12によって取得された実際寿命に基づいて報酬を計算する。関数更新部22は、状態観測部11によって観測された状態変数および報酬計算部21によって計算された報酬に基づいて、電動機の予測寿命を計算するための関数を更新する。例えばQ学習の場合、式1で表される行動価値関数Q(s,a)を、行動a
tである予測寿命を変更するための関数として用いる。なお、これら以外の構成要素については
図1に示す構成要素と同様であるので、同一の構成要素には同一符号を付して当該構成要素についての詳細な説明は省略する。
【0045】
図4は、本発明の実施例による、強化学習を用いた機械学習方法の動作フローを示すフローチャートである。
【0046】
まず、状態観測ステップS101において、状態観測部11は、電動機の稼働状態を検出するセンサの出力データと、電動機の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。
【0047】
次いで、実際寿命データ取得ステップS102において、実際寿命データ取得部12は、電動機の実際寿命に関するデータを取得する。
【0048】
なお、上述のステップS101の処理とステップS102の処理は任意に入れ替えて実行してもよい。
【0049】
次いで、報酬計算ステップS103−1において、報酬計算部21は、意思決定部によって決定された予測寿命および実際寿命データ取得部12によって取得された実際寿命に基づいて報酬を計算する。
【0050】
次いで、関数更新ステップS103−2において、関数更新部22は、状態観測部11によって観測された状態変数および報酬計算部21によって計算された報酬に基づいて、電動機の予測寿命を計算するための関数を更新する。
【0051】
続いて、上述の機械学習装置を備える電動機の寿命予測装置について説明する。ここでは一例として、学習部の学習アルゴリズムとして強化学習を用いた場合について説明する。
【0052】
図5は、本発明の実施例による機械学習装置を備える寿命予測装置およびこの寿命予測装置を備える電動機システムを示す原理ブロック図である。ここでは、電動機31を制御装置32で制御する場合について説明する。
【0053】
電動機31の寿命予測装置100は、機械学習装置1と、意思決定部14と、第1の通知部15−1と
、第2の通知部15−2と、変更指令出力部16とを備える。なお、第1の通知部15−
1および第2の通知部15−2については、後述するように1つの通知部として実現してもよい。なお、ここでは図示しないが、意思決定部14により決定された予測寿命に関するデータを出力するデータ出力部を別途設けてもよい。
【0054】
また、電動機システム1000は、寿命予測装置100と、電動機31と、制御装置32と、センサ33とを備える。
【0055】
電動機31の種類は、本発明を限定するものではなく、交流電動機であっても直流電動機であってもよい。
【0056】
制御装置32は、その内部に格納された制御ソフトウェアに基づいて、センサ33によって検出された各種データを用いて、電動機31を制御する。電動機31を制御するための駆動指令として、電動機31に流れる電流を指令する電流指令、電動機31に印加される電圧を指令する電圧指令、および電動機31に流れる電流もしくは電圧の周波数を指令する周波数指令などがある。制御装置32による電動機31の制御方法は、本発明を特に限定するものではなく、公知の制御方法でよい。
【0057】
センサ33は、電動機31の稼働状態を検出する。例えば、電動機31が出力するトルクを検出するトルクセンサ、電動機31の回転数を検出する回転センサ、電動機31の稼働時間を検出する稼働時間計測器(計時センサ)、電動機31に流れる電流を検出する電流センサ、電動機
31に印加される電圧を検出する電圧センサ、電動機
31に流れる電流もしくは電圧の周波数を検出する周波数センサ、電動機31に供給される駆動電力を検出する電力センサ、電動機31の近傍の温度を計測する温度センサ(温度計)、電動機31の近傍の湿度を計測する湿度センサ(湿度計)、電動機31に発生する振動を計測する振動センサなどがある。すなわち、センサ33は、上述した電動機31の稼働状態のうち、出力条件および外部条件と呼ばれるものを検出する。
【0058】
機械学習装置1は、状態観測部11、実際寿命データ取得部12、および学習部13を備える。
【0059】
状態観測部11は、上述したように、電動機31の稼働状態を検出するセンサの出力データと、電動機31の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。状態観測部11は、状態変数として観測される稼働状態のうち、出力条件および外部条件と呼ばれるものについては例えばセンサ33から取得し、入力条件と呼ばれるものについては例えば制御装置32から取得する。また、状態観測部11は、電動機31の故障の有無に関するデータについて、上述したように、電動機31に設置された故障検出装置(図示せず)から取得してもよく、あるいは制御装置32から取得してもよく、あるいは、電動機31の故障を発見しあるいは知得した設計者や利用者による入力操作を介して取得してもよい。
【0060】
実際寿命データ取得部12は、電動機31の実際寿命に関するデータを取得する。
【0061】
学習部13は、報酬計算部21と関数更新部22とを備え、状態観測部11によって観測された状態変数と実際寿命データ取得部12によって取得された実際寿命との組合せに基づいて作成される訓練データセットに従って、電動機31の予測寿命を学習する。
【0062】
学習部13内の報酬計算部21は、意思決定部14によって決定された予測寿命および実際寿命データ取得部12によって取得された実際寿命に基づいて報酬を計算する。具体的には、報酬計算部21は、実際寿命Mに対する予測寿命Nと実際寿命Mとの差の割合である「|N−M|/M」が、規定範囲α以内であるとき報酬を増やし、規定範囲外であるとき報酬を減らす。ここで、「|N−M|」は予測寿命Nと実際寿命Mとの差の絶対値を表す。このようにして報酬を計算するのは、実際寿命Mに対する予測寿命Nと実際寿命Mとの差の割合である「|N−M|/M」が小さいほど、機械学習装置1による学習により予測寿命が正確に計算できていることを意味するからである。規定範囲αは、報酬判断因子であり、例えば機械学習装置1による学習の結果得られた予測寿命の正確さなどに基づいて任意に設定してもよい。
【0063】
学習部1
3内の関数更新部22は、状態観測部11によって観測された状態変数および報酬計算部21によって計算された報酬に基づいて、電動機31の予測寿命を計算するための関数を更新する。例えばQ学習の場合、式1で表される行動価値関数Q(s,a)を、行動a
tである予測寿命を変更するための関数として用いる。
【0064】
意思決定部14は、学習部
13が訓練データセットに従って学習した結果に基づいて、現在の状態変数の入力に応答して、電動機31の予測寿命を計算する。本実施例では、一例として学習アルゴリズムとして強化学習を用いているので、学習部13内の報酬計算部21によって算出された報酬に基づいて学習部1
3内の関数更新部22は予測寿命を計算するための関数を更新し、意思決定部1
4は、更新された関数に基づき、報酬が最も多く得られる予測寿命を選択し、これを出力する。意思決定部14によって決定された予測寿命は、報酬計算部21、第1の通知部15−1、第2の通知部15−2、および変更指令出力部16へ出力される。報酬計算部21は、意思決定部14によって決定された予測寿命および実際寿命データ取得部12によって取得された実際寿命に基づいて、上述のように報酬を計算する。
【0065】
第1の通知部15−1は、意思決定部14により計算された予測寿命をオペレータに通知し、第2の通知部15−2は、意思決定部14により計算された予測寿命に基づき、電動機の交換を促す情報をオペレータに通知する。なお、第1の通知部15−
1および第2の通知部15−2については、1つの通知部として実現してもよい。これにより、設計者や作業者は、電動機31の予測寿命を知ることができるので、電動機31が稼働不能になる前に電動機31またはその構成部品を交換したり、あるいは補修や修繕などの保守を行うことができる。電動機31の構成部品を交換したり保守を行うことにより、電動機31の寿命を延ばすことができる。またあるいは、第1の通知部15−
1および/または第2の通知部15−2の通知内容として、予測寿命の計算に際して得られた電動機31の寿命に大きな影響を与える稼働状態(入力条件、出力条件および外部条件)を併せて通知するようにしてもよい。例えば、作業者は電動機31を使って物を加工する場合、出力条件Aとして「トルクT
A、回転数S
A、稼働時間t
A」、出力条件Bとして「トルクT
B、回転数S
B、稼働時間t
B」としたとき、意思決定部14はこれら出力条件AおよびBについて予測寿命を計算し、予測寿命が大きい方を作業者に提示することが考えられる。これにより、設計者や作業者は、電動機31の寿命に影響を及ぼす稼働状態を変更する対応を取ることができる。例えば、設計者や作業者は、温度や湿度が電動機31の寿命に影響を及ぼすことを知った場合は、電動機31の寿命を延ばす適切な温度や湿度になるよう電動機31の周辺環境を整えるといった対応を取ることができる。
【0066】
第1の通知部15−
1および第2の通知部15−2として、例えば、パソコン、携帯端末、タッチパネルなどのディスプレイや制御装置32に付属のディスプレイなどがあり、例えば予測寿命を文字や絵柄で表示することができる。また例えば、第1の通知部15−
1および第2の通知部15−2を、スピーカ、ブザー、チャイムなどのような音を発する音響機器にて実現してもよい。またあるいは、第1の通知部15−
1および第2の通知部15−2について、プリンタを用いて紙面等にプリントアウトして表示させる形態をとってもよい。またあるいは、これらを適宜組み合わせて実現してもよい。
【0067】
変更指令出力部16は、意思決定部1
4により計算された予測寿命に基づいて、電動機
31に流れる電流を指令する電流指令、電動機
31に印加される電圧を指令する電圧指令、および電動機
31に流れる電流もしくは電圧の周波数を指令する周波数指令、のうちの少なくとも1つを変更する変更指令を、電動機31を制御する制御装置32へ出力する。上述のように、電動機
31に流れる電流を指令する電流指令、電動機
31に印加される電圧を指令する電圧指令、および電動機
31に流れる電流もしくは電圧の周波数を指令する周波数指令は、電動機31の入力条件と呼ばれるものである。予測寿命の計算に際して、変更指令出力部16は、電動機
31の寿命に大きな影響を与える電圧指令、電流指令または周波数指令を把握することができるので、これに基づき制御装置32へ変更指令を出力する。
【0068】
図6は、本発明の実施例による、強化学習を用いた機械学習装置を備える寿命予測装置の動作フローを示すフローチャートである。
【0069】
一般に、強化学習では行動の初期値はランダムに選択される。本発明の実施例では、ステップS201において、行動である予測寿命をランダムに選択する。
【0070】
ステップS202では、制御装置32は、その内部に格納された制御ソフトウェアに基づいて、センサ33によって検出された各種データを用いて、電動機31を制御する。制御装置32の制御により、電動機31は駆動される。この間、センサ33は、上述した電動機31の稼働状態のうち、出力条件および外部条件と呼ばれるものを検出する。
【0071】
ステップS203において、状態観測部11は、電動機31の稼働状態を検出するセンサの出力データと、電動機31の故障の有無に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。
【0072】
次いで、実際寿命データ取得ステップS204において、実際寿命データ取得部12は、電動機の実際寿命に関するデータを取得する。
【0073】
なお、上述のステップS203の処理とステップS204の処理は任意に入れ替えて実行してもよい。
【0074】
次いで、ステップS205において、状態観測部11は、実際寿命Mに対する予測寿命Nと実際寿命Mとの差の割合である「|N−M|/M」が、規定範囲α以内であるか否かを判別する。実際寿命Mに対する予測寿命Nと実際寿命Mとの差の割合である「|N−M|/M」が規定範囲α以内であると判定された場合は、ステップS206において報酬計算部21は報酬を増やす。一方、実際寿命Mに対する予測寿命Nと実際寿命Mとの差の割合である「|N−M|/M」が規定範囲α以内にないと判定された場合は、ステップS207において報酬計算部21は報酬を減らす。
【0075】
ステップS208では、関数更新部22は、状態観測部11によって観測された状態変数および報酬計算部21によって計算された報酬に基づいて、電動機31の予測寿命を計算するための関数を更新する。
【0076】
続くステップS209では、意思決定部14は、ステップS208において更新された関数に基づいて、報酬が最も多く得られる電動機31の予測寿命を選択し、これを出力する。意思決定部14によって決定された予測寿命は、報酬計算部21、第1の通知部15−1、第2の通知部15−2、および変更指令出力部16へ出力される。その後、ステップS202へ戻り、これ以降、ステップS202〜S209の処理が繰り返し実行される。これにより、機械学習装置1は、予測寿命を学習していく。なお、訓練データセットを、複数の電動機31から取得してもよく、この場合、学習部1
3は、複数の電動機31に対して取得される訓練データセットに従って、ステップS201〜S209の処理を繰り返し実行し、予測寿命を学習していく。複数の電動機31に対して訓練データセットが取得されると機械学習装置1の学習精度は向上する。
【0077】
なお、上述した状態観測部11、実際寿命データ取得部12、学習部13、および意思決定部14は、例えばソフトウェアプログラム形式で構築されてもよく、あるいは各種電子回路とソフトウェアプログラムとの組み合わせで構築されてもよい。例えばこれらをソフトウェアプログラム形式で構築する場合は、電動機31の制御装置32内にある演算処理装置をこのソフトウェアプログラムに従って動作させたり、クラウドサーバ上においてこのソフトウェアプログラムを動作させることで、上述の各部の機能を実現することができる。またあるいは、状態観測部11、実際寿命データ取得部12および学習部13を備える機械学習装置1を、各部の機能を実現するソフトウェアプログラムを書き込んだ半導体集積回路として実現してもよい。またあるいは、状態観測部11、実際寿命データ取得部12および学習部13を備える機械学習装置1のみならず意思決定部1
4も含めた形で、各部の機能を実現するソフトウェアプログラムを書き込んだ半導体集積回路を実現してもよい。
【0078】
また、機械学習処理1は、制御装置32が電動機31の駆動制御のために本来的に備えるセンサにより検出されるデータを用いて実行されるので、新たなハードウェア装置を別途設ける必要がないことから、既存の電動機の制御装置にも後付けで適用することも可能である。この場合、機械学習装置1や意思決定部14の各部の機能を実現するソフトウェアプログラムを書き込んだ半導体集積回路を当該既存の電動機制御装置に組み込んだり、機械学習装置1や意思決定部14の各部の機能を実現するソフトウェアプログラムそのものを当該既存の電動機制御装置内の演算処理装置に追加的にインストールすればよい。また、ある電動機31に関して予測寿命を学習した機械学習装置1を、これとは別の電動機制御装置に取り付け、当該別の電動機駆動装置に関して予測寿命を再学習して更新するようにしてもよい。