(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6093076
(24)【登録日】2017年2月17日
(45)【発行日】2017年3月8日
(54)【発明の名称】冷却装置の稼働条件を学習する機械学習装置、機械学習装置を備えた電動機制御装置及び電動機制御システム並びに機械学習方法
(51)【国際特許分類】
G06N 99/00 20100101AFI20170227BHJP
H02K 9/00 20060101ALI20170227BHJP
H02K 11/25 20160101ALI20170227BHJP
G05B 13/02 20060101ALI20170227BHJP
【FI】
G06N99/00 153
G06N99/00ZIT
G06N99/00 150
H02K9/00 Z
H02K11/25
G05B13/02 L
【請求項の数】17
【全頁数】13
(21)【出願番号】特願2016-129081(P2016-129081)
(22)【出願日】2016年6月29日
(65)【公開番号】特開2017-33546(P2017-33546A)
(43)【公開日】2017年2月9日
【審査請求日】2016年7月15日
(31)【優先権主張番号】特願2015-152415(P2015-152415)
(32)【優先日】2015年7月31日
(33)【優先権主張国】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】390008235
【氏名又は名称】ファナック株式会社
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100092624
【弁理士】
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100151459
【弁理士】
【氏名又は名称】中村 健一
(72)【発明者】
【氏名】松本 康之
(72)【発明者】
【氏名】三嶋 大和
【審査官】
多賀 実
(56)【参考文献】
【文献】
特開2000−350413(JP,A)
【文献】
特開2014−236622(JP,A)
【文献】
特開2007−100967(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00−99/00
H02K 9/00−9/28
H02K11/25
G05B13/00−13/04
(57)【特許請求の範囲】
【請求項1】
電動機又は電動機制御装置を冷却するための冷却装置の稼働条件を学習する機械学習装置であって、
前記電動機及び前記電動機制御装置のそれぞれの特定箇所の温度データのうちの少なくとも1つを含む状態変数を前記冷却装置の動作中に観測する状態観測部と、
前記電動機、前記電動機制御装置、及び前記冷却装置のそれぞれの損失並びに前記電動機、前記電動機制御装置それぞれの特定箇所の温度の許容値に対する余裕を判定する判定データを取得する判定データ取得部と、
前記状態変数及び前記判定データの組合せによって構成される訓練データセットに従って、前記冷却装置の稼働条件を学習する学習部と、
を備えることを特徴とする機械学習装置。
【請求項2】
前記温度データは、前記電動機及び前記電動機制御装置のそれぞれに設けられた温度検出素子が検出する、前記電動機の巻線温度及び前記電動機制御装置のパワー素子温度のうちの少なくとも1つを含む、請求項1に記載の機械学習装置。
【請求項3】
前記温度データから前記電動機及び前記電動機制御装置の損失を推定する損失推定部と、
前記冷却装置の稼働条件から前記冷却装置の損失を計算する損失計算部と、
をさらに備える、請求項1または2に記載の機械学習装置。
【請求項4】
前記冷却装置の損失は、前記冷却装置の回転速度及び稼動時間の組、又は前記冷却装置の冷媒温度及び冷媒流量の組のうち少なくとも一つを利用して計算される、請求項1乃至3のいずれか一項に記載の機械学習装置。
【請求項5】
前記学習部は、複数の冷却装置に対して取得される訓練データセットに従って、前記稼働条件を学習するように構成される、請求項1乃至4のいずれか一項に記載の機械学習装置。
【請求項6】
前記学習部は、
前記判定データに基づいて報酬を計算する報酬計算部と、
前記報酬に基づいて、現在の状態変数から前記電動機、前記電動機制御装置のうち少なくとも一つ及び前記冷却装置の損失の合計を低減する、適切な前記冷却装置の回転速度及び稼動時間の組、又は前記冷却装置の冷媒温度及び冷媒流量の組のうち少なくとも一つを推測するための関数を更新する関数更新部と、
を備える、請求項1乃至5のいずれか一項に記載の機械学習装置。
【請求項7】
前記学習部は、前記電動機及び前記電動機制御装置のうち少なくとも一つの状態変数並びに前記報酬に基づいて、前記冷却装置の回転速度及び稼動時間の組、又は前記冷却装置の冷媒温度及び冷媒流量の組のうち少なくとも一つに対応する行動価値テーブルを更新する、請求項6に記載の機械学習装置。
【請求項8】
前記学習部は、前記電動機又は前記電動機制御装置と同一構成の他の電動機又は電動機制御装置の状態変数と前記報酬に基づいて、当該他の電動機又は電動機制御装置を冷却するための冷却装置の回転速度及び稼動時間の組、又は前記冷却装置の冷媒温度及び冷媒流量の組のうち少なくとも一つに対応する行動価値テーブルを更新する、請求項6に記載の機械学習装置。
【請求項9】
前記報酬計算部は、前記電動機の銅損及び鉄損、前記電動機制御装置のパワー素子の損失の少なくとも一つ及び前記冷却装置の損失の合計、又は、前記電動機及び前記電動機制御装置の特定箇所の温度の許容値に対する余裕に基づいて報酬を計算する、請求項7または8に記載の機械学習装置。
【請求項10】
請求項1乃至9のいずれか一項に記載の機械学習装置を備えた電動機制御装置であって、
前記学習部が前記訓練データセットに従って学習した結果に基づいて、前記冷却装置の回転速度及び稼動時間の組、又は前記冷却装置の冷媒温度及び冷媒流量の組のうち少なくとも一つの指令値を決定する意思決定部をさらに備える、電動機制御装置。
【請求項11】
前記学習部は、現在の状態変数及び前記判定データの組合せによって構成される追加の訓練データセットに従って、前記稼働条件を再学習して更新するように構成される、請求項10に記載の電動機制御装置。
【請求項12】
前記機械学習装置がネットワークを介して前記電動機制御装置に接続されており、
前記状態観測部は、前記ネットワークを介して、現在の状態変数を取得するように構成される、請求項10又は11に記載の電動機制御装置。
【請求項13】
前記機械学習装置は、クラウドサーバに存在する、請求項12に記載の電動機制御装置。
【請求項14】
前記機械学習装置は、前記電動機を制御する前記電動機制御装置に内蔵されている、請求項10または11に記載の電動機制御装置。
【請求項15】
請求項10乃至14のいずれか一項に記載の電動機制御装置と、
前記電動機又は前記電動機制御装置を冷却するための冷却装置と、
前記温度データを出力する温度検出素子と、
を備える電動機制御システム。
【請求項16】
前記冷却装置は、冷却装置の流量並びに冷媒温度を制御する冷却装置制御部をさらに備え、
前記状態観測部は、前記冷却装置の冷媒の流量並びに冷媒の温度を観測する、請求項15に記載の電動機制御システム。
【請求項17】
電動機又は電動機制御装置を冷却するための冷却装置の稼働条件を学習する機械学習方法であって、
前記電動機及び前記電動機制御装置のそれぞれの特定箇所の温度データのうちの少なくとも1つを含む状態変数を前記冷却装置の動作中に観測し、
前記電動機、前記電動機制御装置、及び前記冷却装置のそれぞれの損失及びそれぞれの特定箇所の温度の許容値に対する余裕を判定する判定データを取得し、
前記状態変数及び前記判定データの組合せによって構成される訓練データセットに従って、前記冷却装置の稼働条件を学習する、
ことを含むことを特徴とする機械学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習装置、電動機制御装置、電動機制御システム、及び機械学習方法に関し、特に、冷却装置の稼働条件を学習する機械学習装置、機械学習装置を備えた電動機制御装置及び電動機制御システム並びに機械学習方法に関する。
【背景技術】
【0002】
電動機(モータ)は、駆動に伴って、ステータコアの鉄損や巻線の銅損による発熱により、電動機の温度が上昇し、電動機の損失が増加したり、電動機が損傷する恐れがある。そこで、生じる熱を吸収冷却するために、電動機を冷却する方法が提案されている(例えば、特許文献1)。
【0003】
また、電動機を駆動する制御装置は、電動機の駆動に伴って、制御装置内部のパワー素子が発熱して温度が上昇し、パワー素子が損傷する恐れがある。そこで、制御装置の寿命を維持する為に、制御装置を冷却する方法が提案されている。
【0004】
特許文献1に記載されたモータ冷却装置は、モータの回転軸内に軸方向に沿って設けられた冷却用冷媒供給路と、ステータコアに巻着されている巻線によって形成されている巻線耳部に対向し、冷却用冷媒を冷却用冷媒供給路より巻線耳部に噴出させるように設けられた冷却用冷媒噴出孔と、冷却用冷媒供給路に冷却用冷媒を供給するポンプと、このポンプの吐出する冷却用冷媒量をモータの駆動状態に応じて可変とするポンプ制御手段と、を設けている。特許文献1に記載されたモータ冷却装置によれば、効率よくステータコアを冷却することができ、これにより、モータ全体を効率的に冷却することが可能となるというものである。
【0005】
しかしながら、従来のモータ制御装置は、電動機の温度に合わせて冷却装置の稼働率を変化させるだけであったため、電動機及び電動機制御装置の温度を規定された温度以下になるように制御しつつ、電動機、電動機制御装置及び冷却装置の損失を低減させることが難しいという問題があった。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平5−236704号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、機械学習によって、電動機及び電動機制御装置の温度を規定された温度以下になるように制御しつつ、電動機、電動機制御装置、及び冷却装置の損失を減らすことが可能な機械学習装置、機械学習装置を備えた電動機制御装置及び電動機制御システム並びに機械学習方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一実施例に係る機械学習装置は、電動機又は電動機制御装置を冷却するための冷却装置の稼働条件を学習する機械学習装置であって、電動機及び電動機制御装置のそれぞれの特定箇所の温度データのうちの少なくとも1つを含む状態変数を冷却装置の動作中に観測する状態観測部と、電動機、電動機制御装置、及び冷却装置のそれぞれの損失の合計並びに電動機及び電動機制御装置のそれぞれの特定箇所の温度の許容値に対する余裕を判定する判定データを取得する判定データ取得部と、状態変数及び判定データの組合せによって構成される訓練データセットに従って、冷却装置の稼働条件を学習する学習部と、を備えることを特徴とする。
【0009】
本発明の一実施例に係る電動機制御装置は、上記機械学習装置を備えた電動機制御装置であって、学習部が訓練データセットに従って学習した結果に基づいて、冷却装置の回転速度及び稼動時間の組、又は冷却装置の冷媒温度及び冷媒流量の組のうち少なくとも一つの指令値を決定する意思決定部をさらに備えることを特徴とする。
【0010】
本発明の一実施例に係る電動機制御システムは、上記電動機制御装置と、温度データを出力する温度検出素子と、を備えることを特徴とする。
【0011】
本発明の一実施例に係る機械学習方法は、電動機又は電動機制御装置を冷却するための冷却装置の稼働条件を学習する機械学習方法であって、電動機、及び電動機制御装置のそれぞれの特定箇所の温度データを含む状態変数を冷却装置の動作中に観測し、電動機、電動機制御装置、及び冷却装置のそれぞれの損失の合計並びにそれぞれの特定箇所の温度の許容値に対する余裕を判定する判定データを取得し、状態変数及び判定データの組合せによって構成される訓練データセットに従って、冷却装置の稼働条件を学習する、ことを含むことを特徴とする。
【発明の効果】
【0012】
本発明によれば、機械学習によって、電動機、電動機制御装置及び冷却装置の損失の合計を減らすことが可能な機械学習装置、機械学習装置を備えた電動機制御装置及び電動機制御システム並びに機械学習方法を提供することができる。
【図面の簡単な説明】
【0013】
【
図1】本発明の実施例に係る機械学習装置の構成図である。
【
図2】本発明の実施例に係る電動機制御システムの構成図である。
【
図3】本発明の実施例の第1の変形例に係る電動機制御システムの構成図である。
【
図4】本発明の実施例の第2の変形例に係る電動機制御システムの構成図である。
【
図5】本発明の実施例の第3の変形例に係る電動機制御システムの構成図である。
【
図6】本発明の実施例に係る電動機制装置の構成図である。
【
図7】本発明の実施例に係る機械学習装置の動作手順を説明するためのフローチャートである。
【
図8】本発明の実施例に係る電動機制御システムの動作手順を説明するためのフローチャートである。
【発明を実施するための形態】
【0014】
以下、図面を参照して、本発明に係る機械学習装置、電動機制御装置、電動機制御システム及び機械学習方法について説明する。
【0015】
図1は、本発明の実施例に係る機械学習装置の構成図である。
図2は、本発明の実施例に係る電動機制御システムの構成図である。
図6は、本発明の実施例に係る電動機制装置の構成図である。
【0016】
本発明の実施例に係る機械学習装置1は、電動機5又は電動機制御装置6を冷却するための冷却装置7の稼働条件を学習する機械学習装置であって、状態観測部2と、判定データ取得部3と、学習部4と、を備える。
図2において、機械学習装置は電動機制御装置6に含まれている。
【0017】
状態観測部2は、電動機5(
図2参照)、電動機制御装置6のそれぞれの特定箇所の温度データを含む状態変数を冷却装置7の動作中に観測する。
【0018】
判定データ取得部3は、電動機5、電動機制御装置6、及び冷却装置7のそれぞれの損失及び、電動機5、電動機制御装置6のそれぞれの特定箇所の温度の許容値に対する余裕を判定する判定データを取得する。
【0019】
学習部4は、状態変数及び判定データの組合せによって構成される訓練データセットに従って、冷却装置7の稼働条件を学習する。
【0020】
温度データは、電動機5及び電動機制御装置6のそれぞれに設けられた温度検出素子(8,9)が検出する、電動機5の巻線温度、及び電動機制御装置6のパワー素子温度とする。
【0021】
機械学習装置1は、温度データから電動機5及び電動機制御装置6の損失を推定する損失推定部11と、冷却装置7の稼働条件から冷却装置7の損失を計算する損失計算部12と、をさらに備えることが好ましい。損失推定部11及び損失計算部12は判定データ取得部3に含まれていてもよい。
【0022】
冷却装置7の損失は、冷却装置7の回転速度及び稼動時間を利用して計算される。また、液体による冷却を行う場合は、冷却流量、及び温度検出素子(10、10´)が検出する、冷媒温度を利用しても良い。なお、温度検出素子10は電動機5から冷却装置7へ流れる方向への冷媒の温度を、温度検出素子10´は冷却装置7から電動機5へ流れる方向への冷媒の温度をそれぞれ検出する。
【0023】
図2に示した電動機制御システム100の構成図には冷却装置を1台のみ備えた例を示したが、このような例には限られず、冷却装置を複数台備えていてもよい(
図3,
図4,
図5)。
【0024】
図3は、本発明の実施例の第1の変形例に係る電動機制御システム100´の構成図である。
図3に示すように、2台の冷却装置、即ち、第1冷却装置71及び第2冷却装置72が設けられ、それぞれが電動機5及び電動機制御装置6を冷却するようにしてもよい。
【0025】
図4は、本発明の実施例の第2の変形例に係る電動機制御システム100″の構成図である。
図4に示すように、2台の冷却装置、即ち、第1冷却装置71´及び第2冷却装置72´が設けられ、第1冷却層装置71´が電動機5を冷却し、第2冷却装置72´が電動機制御装置6を冷却するようにしてもよい。
【0026】
図5は、本発明の実施例の第3の変形例に係る電動機制御システム100'''の構成図である。
図5に示すように、4台の冷却装置、即ち、第1冷却装置71″、第2冷却装置72″、第3冷却装置73″、及び第4冷却装置74″が設けられ、第1冷却装置71″及び第2冷却装置72″が電動機5を冷却し、第3冷却装置73″及び第4冷却装置74″が電動機制御装置6を冷却するようにしてもよい。なお、冷却装置の台数は、
図3〜5に示した例には限定されず、3台または5台以上の冷却装置を設けるようにしてもよい。
【0027】
学習部4は、複数の冷却装置に対して取得される訓練データセットに従って、稼働条件を学習するように構成されてもよい。
【0028】
電動機制御装置6は、判定データに基づいて報酬を計算する報酬計算部14を備える、学習部4は、報酬に基づいて、現在の状態変数から適切な冷却装置7の稼働条件(回転速度、稼働時間等)を決定するための関数を更新する関数更新部15を備える。
【0029】
報酬計算部14は、判定データ、即ち電動機5、電動機制御装置6、及び冷却装置7のそれぞれの損失の合計及び電動機5及び電動機制御装置6、それぞれの特定箇所の温度の許容値に対する余裕を判定した結果を基に報酬を計算する。
【0030】
具体的には、報酬計算部14は、冷却装置7、電動機5及び電動機制御装置6のそれぞれの損失、並びに冷却装置7、電動機5及び電動機制御装置6のそれぞれの特定箇所の温度が許容値に対して余裕があるか否かに基づいて報酬を決定することができる。例えば、冷却装置7、電動機5及び電動機制御装置6のそれぞれの損失の合計値が前回(1試行前)の値より減少し、かつ、冷却装置7、電動機5及び電動機制御装置6のそれぞれの特定箇所の温度が許容値未満である場合は、余裕に応じて報酬を増加させ、冷却装置7、電動機5及び電動機制御装置6のそれぞれの損失の合計値が前回(1試行前)の値より増加したか、あるいは冷却装置7、電動機5及び電動機制御装置6のそれぞれの特定箇所の温度が許容値以上である場合は、報酬を減少させるようにしてもよい。なお、本実施例では冷却装置7の損失の他に電動機5及び電動機制御装置6の損失の合計から報酬を計算することを例としているが、電動機5及び電動機制御装置6のうち損失が少ない一方は報酬の計算に使用しないこととしてもよい。
【0031】
関数更新部15は、いわゆるQ学習を用いて強化学習を行うことが好ましい。Q学習は、ある環境sの下で、行動aを選択する価値(行動の価値)Q(s,a)を学習する方法である。ある状態sのとき、Q(s,a)の最も高い行動aを最適な行動として選択するものである。関数更新部15は、下記の式(1)を用いて関数(行動価値関数Q(s
t,a
t))を更新する。
【0033】
ここで、Q(s
t,a
t)は行動価値関数、s
tは時刻tにおける状態(環境)、a
tは時刻tにおける行動、αは学習係数、r
t+1は報酬、γは割引率である。行動価値関数は、報酬の期待値を意味する。maxが付いた項は、環境s
t+1の下で、最もQ値が高い行動aを選んだ場合のQ値にγを掛けたものである。
【0034】
学習係数及び割引率は、0<α,γ≦1で設定することが知られているが、ここでは簡便のため学習係数及び割引率を1とすると、下記の式(2)のように表せる。
【0036】
この更新式は、環境sにおける行動aの価値Q(s
t,a
t)よりも、行動aによる次の環境状態における最良の行動の価値Q(s
t+1,max a
t+1)の方が大きければQ(s
t,a
t)を大きくし、逆に小さければQ(s
t,a
t)を小さくすることを示す。即ち、ある状態におけるある行動の価値を、それによる次の状態における最良の行動の価値に近づけるものである。この更新式に用いる状態は訓練データセットにより取得可能な状態変数が対応する。また報酬は報酬計算部14から取得出来る。行動とは、冷却装置7の稼働条件、即ち冷却装置7の回転速度等を変更することである。行動価値Q(s
t,a
t)は、例えば環境s、行動a毎にテーブルとして格納しておくことが考えられる(以下、行動価値テーブルと呼ぶ)。
【0037】
図6に示すように、電動機制御装置6における状態には、行動で間接的に変化する状態と、行動で直接的に変化する状態とがある。行動で間接的に変化する状態には、電動機制御装置6の特定箇所の温度(巻線温度やパワー素子の温度等)、冷却装置7、電動機5、及びパワー素子の損失が含まれる。行動で直接的に変化する状態には、冷却装置7の回転速度、冷却装置7の稼動時間が含まれる。なお、液体による冷却を行う場合は、行動で間接的に変化する状態には、更に冷却装置7の(電動機5から冷却装置7へ流れる方向への)冷媒の温度が含まれる。また、行動で直接的に変化する状態には更に冷却装置7の冷媒流量、及び冷却装置7の(冷却装置7から電動機5へ流れる方向への)冷媒の温度が含まれる。
【0038】
学習部4は更新式及び報酬に基づいて、行動価値テーブルの中から現在の状態変数及び取り得る行動に対応する行動価値を更新する。
【0039】
学習部4は、電動機5や電動機制御装置6と同一構成の他の電動機、電動機制御装置(図示せず)の状態変数及び報酬に基づいて行動価値テーブルを更新するようにしてもよい。
【0040】
次に、本発明の実施例に係る電動機制御装置6について説明する。なお、本実施例は液体による冷却を行う場合について記載している。本発明の実施例に係る電動機制御装置6は、上記の機械学習装置1を備えた電動機制御装置6であって、学習部4が訓練データセットに従って学習した結果に基づいて、冷却装置7の回転速度等の稼働条件を変更する指示を出す意思決定部16をさらに備えることを特徴とする。
【0041】
学習部4は、現在の状態変数及び判定データの組合せによって構成される追加の訓練データセットに従って、冷却装置7の稼働条件を再学習して更新するように構成される。
【0042】
機械学習装置1がネットワークを介して電動機制御装置6に接続されており、状態観測部2は、ネットワークを介して、現在の状態変数を取得するように構成されるようにしてもよい。
【0043】
機械学習装置1は、クラウドサーバに存在することが好ましい。
【0044】
機械学習装置1は、電動機5を制御する電動機制御装置6に内蔵されていてもよい。
【0045】
電動機制御システム100は、上記の電動機制御装置6と、電動機5及び電動機制御装置6を冷却するための冷却装置7と、温度データを出力する温度検出素子(8,9,10,10´)と、を備える。電動機制御装置6は交流電源20から交流電力を受電して、電動機5を駆動する。
【0046】
冷却装置7は、冷却装置7の冷媒流量並びに冷媒温度を制御する冷却装置制御部13をさらに備え、状態観測部2は、冷却装置7の冷媒の流量並びに冷媒の温度を観測する。冷却装置7は、さらに、冷却装置7の回転速度を検出する回転速度計21、冷却装置の冷媒の流量を検出する流量計22を備えている。
【0047】
次に、本発明の実施例に係る機械学習方法について説明する。本発明の実施例に係る機械学習方法は、電動機5又は電動機制御装置6を冷却するための冷却装置7の稼働条件を学習する機械学習方法であって、電動機5及び電動機制御装置6のそれぞれの特定箇所の温度データのうちの少なくとも1つを含む状態変数を冷却装置7の動作中に観測し、電動機5、電動機制御装置6、及び冷却装置7のそれぞれの損失並びに電動機5及び電動機制御装置6それぞれの特定箇所の温度の許容値に対する余裕を判定する判定データを取得し、状態変数及び判定データの組合せによって構成される訓練データセットに従って、冷却装置7の稼働条件を学習する、ことを含むことを特徴とする。
【0048】
図7に本発明の実施例に係る機械学習装置の動作手順を説明するためのフローチャートを示す。まず、ステップS101において、電動機5及び電動機制御装置6のそれぞれの特定箇所の温度データのうちの少なくとも1つを含む状態変数を冷却装置7の動作中に観測する。
【0049】
次に、ステップS102において、電動機5、電動機制御装置6、及び冷却装置7のそれぞれの損失、並びに、電動機5及び電動機制御装置6のそれぞれの特定箇所の温度の許容値に対する余裕を判定する判定データを取得する。
【0050】
次に、ステップS103において、状態変数及び判定データの組合せによって構成される訓練データセットに従って、冷却装置7の稼働条件を学習する。
【0051】
次に、本発明の実施例に係る電動機制御システムを用いた機械学習方法について説明する。
図8に本発明の実施例に係る電動機制御システムの動作手順を説明するためのフローチャートを示す。まず、ステップS201において、学習をスタートする。
【0052】
次に、ステップS202において、冷却装置7の稼動条件(回転速度、稼働時間等)を設定する。
【0053】
次に、ステップS203において、一定時間、電動機5を駆動する。
【0054】
次に、ステップS204において、電動機5の温度(巻線温度等)を測定し、損失推定部11が損失を推定する。さらに、電動機制御装置6のパワー素子の温度を測定し、損失推定部11が損失を推定する。さらに、冷却装置7の状況(回転速度、稼動時間等)を測定し、損失計算部12が損失を計算する。ここで、損失推定部11は、各温度における損失データを予め、持っているものとする。
【0055】
次に、ステップS205において、各損失(電動機5、冷却装置7、パワー素子)の合計及び各部の温度に基づいて報酬計算を行う。
【0056】
前回より損失の合計が増加したか、あるいは各部の温度が許容値以上となった場合は、ステップS206において、変更した行動の価値を減点する。その後、ステップS208において、行動価値テーブルを更新する。
【0057】
一方、前回より損失の合計が減少し、かつ各部の温度が許容値未満であった場合は、ステップS207において、変更した行動の価値を加点する。その後、ステップS208において、行動価値テーブルを更新する。
【0058】
ただし、初回のみ価値を加減せずに、ステップS208において、行動価値テーブルを更新する。
【0059】
次に、ステップS209において、行動価値テーブルから、行動価値の点数の大きい項目を優先して、冷却装置7の稼動条件を変更する項目を決定する。
【0060】
ステップS209において決定された冷却装置7の稼働条件に基づいて、ステップS202に戻って冷却装置7を稼働させて行動価値が最良となるようにする。
【0061】
以上説明したように、本発明の実施例に係る機械学習装置、機械学習装置を備えた電動機制御装置及び電動機制御システム並びに機械学習方法によれば、機械学習によって、電動機、電動機制御装置の温度を規定された温度以下になるように制御しつつ、電動機、電動機制御装置及び冷却装置の損失を減らすことができる。
【符号の説明】
【0062】
1 機械学習装置
2 状態観測部
3 判定データ取得部
4 学習部
5 電動機
6 電動機制御装置
7 冷却装置
71,71´,71″ 第1冷却装置
72,72´,72″ 第2冷却装置
73´,73″ 第3冷却装置
74´,74″ 第4冷却装置
8,9,10,10´ 温度検出素子
11 損失推定部
12 損失計算部
13 冷却装置制御部
14 報酬計算部
15 関数更新部
16 意思決定部
21 回転速度計
22 流量計