特許第5964488号(P5964488)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ファナック株式会社の特許一覧

特許5964488保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法
<>
  • 特許5964488-保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法 図000003
  • 特許5964488-保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法 図000004
  • 特許5964488-保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法 図000005
  • 特許5964488-保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法 図000006
  • 特許5964488-保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法 図000007
  • 特許5964488-保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法 図000008
  • 特許5964488-保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】5964488
(24)【登録日】2016年7月8日
(45)【発行日】2016年8月3日
(54)【発明の名称】保護動作制御部を有するモータ制御装置、ならびに機械学習装置およびその方法
(51)【国際特許分類】
   H02P 29/024 20160101AFI20160721BHJP
   H02P 27/06 20060101ALI20160721BHJP
【FI】
   H02P29/024
   H02P27/06
【請求項の数】8
【全頁数】15
(21)【出願番号】特願2015-152006(P2015-152006)
(22)【出願日】2015年7月31日
【審査請求日】2016年2月8日
【早期審査対象出願】
(73)【特許権者】
【識別番号】390008235
【氏名又は名称】ファナック株式会社
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100092624
【弁理士】
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100114018
【弁理士】
【氏名又は名称】南山 知広
(74)【代理人】
【識別番号】100165191
【弁理士】
【氏名又は名称】河合 章
(74)【代理人】
【識別番号】100151459
【弁理士】
【氏名又は名称】中村 健一
(72)【発明者】
【氏名】山本 健太
【審査官】 池田 貴俊
(56)【参考文献】
【文献】 特開2011−050119(JP,A)
【文献】 特開2013−126346(JP,A)
【文献】 中国特許出願公開第103326635(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
H02P 29/024
H02P 27/06
(57)【特許請求の範囲】
【請求項1】
交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータへ供給するモータ制御装置の、前記交流電源側が停電であるか否かの判断基準となる電源電圧の値である停電検出レベルおよび前記交流電源側の電源電圧が前記停電検出レベル未満である状態の継続時間である停電検出時間を学習する機械学習装置であって、
前記交流電源側の電源電圧の値に関するデータと、前記DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、を含む状態変数を観測する状態観測部と、
前記状態変数に基づいて前記停電検出レベルおよび前記停電検出時間を変更するための関数の更新を繰り返すことによって、前記停電検出レベルおよび前記停電検出時間を学習する学習部と、
を備えることを特徴とする機械学習装置。
【請求項2】
前記学習部は、
前記状態変数に基づいて、前記停電検出レベルおよび前記停電検出時間を変更した結果に対する報酬を計算する報酬計算部と、
前記報酬に基づいて、前記関数を更新する関数更新部と、
を備え
前記関数更新部による前記関数の更新を繰り返すことによって、前記報酬が最も多く得られる前記停電検出レベルおよび前記停電検出時間を学習する請求項1に記載の機械学習装置。
【請求項3】
前記報酬計算部は、前記状態観測部により観測された前記DCリンクコンデンサに蓄積されたエネルギー量が、所定値未満であるときは報酬を増やし、前記所定値以上であるときは報酬を減らす請求項2に記載の機械学習装置。
【請求項4】
前記報酬計算部は、前記状態観測部によりモータ制御装置に対する保護動作が失敗したことを観測したときは報酬を減らす請求項2に記載の機械学習装置。
【請求項5】
前記学習部は、複数のモータ制御装置に対して取得される前記状態変数基づいて前記停電検出レベルおよび前記停電検出時間を学習するように構成される請求項1〜4のいずれか一項に記載の機械学習装置。
【請求項6】
請求項1〜5のいずれか一項に記載の機械学習装置を備えたモータ制御装置であって、
前記学習部が学習した結果に基づいて、現在の前記状態変数の入力に応答して、前記停電検出レベルおよび前記停電検出時間を決定する意思決定部と、
前記交流電源側から供給された交流電力を直流電力に変換して前記DCリンクへ出力する整流器と、
前記DCリンクに接続され、前記DCリンクにおける直流電力を交流電力に変換してモータへ供給する逆変換器と、
前記交流電源側の電源電圧が前記停電検出レベル未満である状態が前記停電検出時間継続した場合、前記交流電源側で停電が発生したと判定する停電検出部と、
前記停電検出部が前記交流電源側の停電を検出した場合、モータが所定の保護動作を行うための電力を出力するよう前記逆変換器に対して保護動作指令を出力する保護動作制御部と、
をさらに備えることを特徴とするモータ制御装置。
【請求項7】
前記学習部は、前記状態変数に基づいて前記停電検出レベルおよび前記停電検出時間を再学習して更新するように構成される請求項6に記載のモータ制御装置。
【請求項8】
交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータへ供給するモータ制御装置の、前記交流電源側が停電であるか否かの判断基準となる電源電圧の値である停電検出レベルおよび前記交流電源側の電源電圧が前記停電検出レベル未満である状態の継続時間である停電検出時間を学習する機械学習方法であって、
前記交流電源側の電源電圧の値に関するデータと、前記DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、を含む状態変数を観測する状態観測ステップと、
前記状態変数に基づいて前記停電検出レベルおよび前記停電検出時間を変更するための関数の更新を繰り返すことによって、前記停電検出レベルおよび前記停電検出時間を学習する学習ステップと、
を備えることを特徴とする機械学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、交流入力側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータへ供給するモータ制御装置、ならびにこのモータ制御装置に用いられる機械学習装置およびその方法に関し、特に、三相交流入力側の停電時にモータが所定の保護動作を行うよう指令する保護動作制御部を有するモータ制御装置、ならびにこのモータ制御装置に用いられる機械学習装置およびその方法に関する。
【背景技術】
【0002】
工作機械、鍛圧機械、射出成形機、産業機械、あるいは各種ロボット内のモータを駆動するモータ制御装置においては、三相交流入力側から供給された交流電力を整流器にて直流電力に一旦変換したのちさらに逆変換器にて交流電力に変換し、この交流電力を駆動軸ごとに設けられたモータの駆動電力として用いている。
【0003】
このようなモータ制御装置では、整流器の三相交流入力側において停電が発生し三相交流入力電圧が低下すると、モータの正常な運転を継続することができなくなる。このため、モータ、当該モータを駆動するモータ制御装置、当該モータ制御装置が駆動するモータに接続されたツール、当該ツールが加工する加工対象、当該モータ制御装置を有する製造ラインなどが、破損したり変形するなどといった何らかの障害が生じる可能性がある。したがって、整流器の三相交流入力側に停電検出部を設けて整流器の三相交流入力側の停電発生の有無を監視し、整流器の三相交流入力側に停電が発生したと停電検出部が判定した場合には、モータ制御装置は上記障害を回避するかもしくは最小限に抑えるための保護動作をする必要がある。
【0004】
停電検出方法として、例えば、整流器の交流電源側の三相交流入力電圧をそれと等価な二相座標上の電圧ベクトルに座標変換し、そのベクトルの振幅を計算することによって、電源電圧の振幅値を算出し、その振幅値が所定の基準電圧値を下回る状態が所定の基準時間継続したことをもって停電を検出する方法がある(例えば、特許文献1参照。)。
【0005】
図7は、停電時に保護動作を行う一般的なモータ制御装置を示すブロック図である。なお、図7では、図面を簡明なものとするために、1台のモータ104を駆動する場合について示している。モータ制御装置100は、商用三相交流電源(以下、単に「交流電源」と称する。)103からの交流電力を直流電力に変換する整流器101と、整流器101の直流側であるDCリンク(直流リンク)に接続され、整流器101から出力された直流電力をモータ104の駆動電力として供給される所望の周波数の交流電力に変換しまたはモータ104から回生される交流電力を直流電力に変換する逆変換器102と、DCリンクに設けられ、直流電力を蓄積する蓄電機能および整流器101の直流出力の脈動分を抑える平滑機能を有するDCリンクコンデンサ105とを備える。モータ制御装置100は、その制御系として、通常動作制御部111と、停電検出部112と、保護動作制御部113とを備える。通常動作制御部111は、逆変換器102からモータ104へ供給される交流電流と、DCリンクコンデンサ105の両端に印加される直流電圧(以下、単に「DCリンク電圧」と称する。)と、交流電源103から整流器101へ供給される交流電流とに基づいて、逆変換器102に対して、モータ104を駆動するための所望の電圧および所望の周波数を有する交流電力を出力するよう、あるいはモータ104で発生した交流の回生電力を直流電力に変換するよう、制御する。また、停電検出部112は、整流器101の交流電源側の電源電圧に基づいて停電発生の有無を検出し、保護動作制御部113は、停電検出部112によって停電発生が検出されると、モータ制御装置100が保護動作を行うよう逆変換器102に対して保護動作指令を通知する。保護動作指令を受けて逆変換器102は、DCリンクコンデンサ105に蓄積された直流電力を、モータ104に接続されたツール、当該ツールが加工する加工対象、モータ制御装置100を有する製造ラインなどを保護するための各種保護動作に必要な交流電力に変換して出力する。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2006−14546号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
停電発生時に行われる保護動作は、モータ、モータ制御装置、ツール、加工対象、当該モータ制御装置を有する製造ラインなどを保護できるメリットはあるものの、一旦保護動作が実行されると、製造ラインが停止することで経済的損失が発生する問題がある。したがって、停電が発生したときには、DCリンクコンデンサの蓄積エネルギーにてモータ制御装置およびその周辺機器(例えば制御電源部やクーラント機器など)がある程度の間は通常動作を継続できるようにし、保護動作の実行を必要最小限に抑えることが好ましい。
【0008】
従って本発明の目的は、上記問題に鑑み、交流電源側の停電発生時において、通常動作を最大限継続し、保護動作の実行を最小限に抑えることができるモータ制御装置、ならびにこのモータ制御装置に用いられる機械学習装置およびその方法を提供することにある。
【課題を解決するための手段】
【0009】
上記目的を実現するために、本発明においては、交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータへ供給するモータ制御装置の、交流電源側の停電に関連付けられる条件を学習する機械学習装置は、交流電源側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する状態観測部と、状態変数によって構成される訓練データセットに従って、交流電源側の停電に関連付けられる条件を学習する学習部と、を備える。
【0010】
ここで、学習部は、状態変数に基づいて報酬を計算する報酬計算部と、報酬に基づいて、交流電源側が停電であるか否かの判断基準となる電源電圧の値である停電検出レベルおよび交流電源側の電源電圧が停電検出レベル未満である状態の継続時間である停電検出時間を変更するための関数を更新する関数更新部と、を備えてもよい。
【0011】
また、報酬計算部は、状態観測部により観測されたDCリンクコンデンサに蓄積されたエネルギー量が、所定値未満であるときは報酬を増やし、上記所定値以上であるときは報酬を減らすようにしてもよい。
【0012】
また、報酬計算部は、状態観測部によりモータ制御装置に対する保護動作が失敗したことを観測したときは報酬を減らすようにしてもよい。
【0013】
学習部は、複数のモータ制御装置に対して取得される訓練データセットに従って、条件を学習するように構成されてもよい。
【0014】
また、上述の機械学習装置を備えたモータ制御装置は、学習部が訓練データセットに従って学習した結果に基づいて、現在の状態変数の入力に応答して、停電検出レベルおよび停電検出時間を決定する意思決定部と、交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力する整流器と、DCリンクに接続され、DCリンクにおける直流電力を交流電力に変換してモータへ供給する逆変換器と、交流電源側の電源電圧が停電検出レベル未満である状態が停電検出時間継続した場合、交流電源側で停電が発生したと判定する停電検出部と、停電検出部が交流電源側の停電を検出した場合、モータが所定の保護動作を行うための電力を出力するよう逆変換器に対して保護動作指令を出力する保護動作制御部と、をさらに備える。
【0015】
ここで、学習部は、現在の状態変数によって構成される追加の訓練データセットに従って、条件を再学習して更新するように構成されてもよい。
【0016】
また、交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータへ供給するモータ制御装置の、交流電源側の停電に関連付けられる条件を学習する機械学習方法は、交流電源側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、のうちの少なくとも1つから構成される状態変数を観測する状態観測ステップと、状態変数によって構成される訓練データセットに従って、交流電源側の停電に関連付けられる条件を学習する学習ステップと、を備える。
【発明の効果】
【0017】
本発明によれば、交流電源側の停電発生時において、通常動作を最大限継続し、保護動作の実行を最小限に抑えることができるモータ制御装置、ならびにこのモータ制御装置に用いられる機械学習装置およびその方法を実現することができる。
【0018】
本発明によれば、動作しているモータ制御装置に対し、交流電源側の停電発生時において通常動作を最大限継続し保護動作の実行を最小限に抑えることができる停電検出レベルおよび停電検出時間を機械学習装置が自ら調整するので、モータ制御装置の設計段階や運転段階における人間による調整が不要となる。
【図面の簡単な説明】
【0019】
図1】本発明の実施例による機械学習装置の原理ブロック図である。
図2】本発明の実施例による機械学習方法の動作原理を示すフローチャートである。
図3】本発明の実施例による、強化学習を用いた機械学習装置の原理ブロック図である。
図4】本発明の実施例による、強化学習を用いた機械学習方法の原理を示すフローチャートである。
図5】本発明の実施例による機械学習装置を備えるモータ制御装置を示す原理ブロック図である。
図6】本発明の実施例による、強化学習を用いた機械学習装置の動作フローを示すフローチャートである。
図7】停電時に保護動作を行う一般的なモータ制御装置を示すブロック図である。
【発明を実施するための形態】
【0020】
図1は、本発明の実施例による機械学習装置の原理ブロック図である。以降、異なる図面において同じ参照符号が付されたものは同じ機能を有する構成要素であることを意味するものとする。
【0021】
本発明の実施例による機械学習装置1は、交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータへ供給するモータ制御装置における、交流電源側の停電に関連付けられる条件を学習するものとして構成される。すなわち、機械学習装置1は、モータ制御装置の交流電源側の停電発生時において、通常動作を最大限継続し、保護動作の実行を最小限に抑えることができる、交流電源側の停電に関連付けられる条件としての停電検出レベルおよび停電検出時間を学習する。ここで、停電検出レベルとは、モータ制御装置の交流電源側が停電であるか否かの判断基準となる電源電圧の値であり、停電検出時間とは、モータ制御装置の交流電源側の電源電圧が停電検出レベル未満である状態の継続時間である。交流電源側の電源電圧が停電検出レベル未満である状態が停電検出時間継続した場合に、「交流電源側で停電が発生した」と判定される。
【0022】
機械学習装置1は、状態観測部11と学習部12とを備える。
【0023】
状態観測部11は、訓練データセットとして、交流電源側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。
【0024】
学習部12は、状態変数によって構成される訓練データセットに従って、交流電源側の停電に関連付けられる条件としての停電検出レベルおよび停電検出時間を学習する。なお、訓練データセットを、複数のモータ制御装置から取得してもよく、この場合、学習部12は、複数のモータ制御装置に対して取得される訓練データセットに従って、交流電源側の停電に関連付けられる条件を学習する。
【0025】
図2は、本発明の実施例による機械学習方法の動作原理を示すフローチャートである。交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータへ供給するモータ制御装置の、交流電源側の停電に関連付けられる条件を学習する機械学習方法は、状態観測ステップS101と、機械学習ステップS102とを備える。
【0026】
状態観測ステップS101は、状態観測部11により実行されるものであり、すなわち、交流電源側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。
【0027】
機械学習ステップS102は、学習部12により実行されるものであり、状態変数によって構成される訓練データセットに従って、交流電源側の停電に関連付けられる条件を学習する。
【0028】
学習部12が用いる学習アルゴリズムはどのようなものを用いてもよい。一例として、強化学習(Reinforcement Learning)を適用した場合について説明する。強化学習は、ある環境内におけるエージェント(行動主体)が、現在の状態を観測し、取るべき行動を決定する、というものである。エージェントは行動を選択することで環境から報酬を得て、一連の行動を通じて報酬が最も多く得られるような方策を学習する。強化学習の代表的な手法として、Q学習(Q−learning)やTD学習(TD−learning)が知られている。例えば、Q学習の場合、行動価値関数Q(s,a)の一般的な更新式(行動価値テーブル)は式1で表される。
【0029】
【数1】
【0030】
式1において、stは時刻tにおける環境を表し、atは時刻tにおける行動を表す。行動atにより、環境はst+1に変わる。rt+1はその環境の変化によってもらえる報酬(reward)を表し、γは割引率を表し、αは学習係数を表す。Q学習を適用した場合、停電検出レベルおよび停電検出時間が行動atとなる。
【0031】
図3は、本発明の実施例による、強化学習を用いた機械学習装置の原理ブロック図である。学習部12は、報酬計算部21と関数更新部22とを備える。報酬計算部21は、状態変数に基づいて報酬を計算する。関数更新部22は、報酬に基づいて、交流電源側が停電であるか否かの判断基準となる電源電圧の値である停電検出レベルおよび交流電源側の電源電圧が停電検出レベル未満である状態の継続時間である停電検出時間を変更するための関数を更新する。例えばQ学習の場合、式1で表される行動価値関数Q(s,a)を、行動atである停電検出レベルおよび停電検出時間を変更するための関数として用いる。なお、これら以外の回路構成要素については図1に示す回路構成要素と同様であるので、同一の回路構成要素には同一符号を付して当該回路構成要素についての詳細な説明は省略する。
【0032】
図4は、本発明の実施例による、強化学習を用いた機械学習方法の原理を示すフローチャートである。
【0033】
まず、状態観測ステップS101において、状態観測部11は、交流電源側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。
【0034】
次いで、報酬計算ステップS102−1において、報酬計算部21は、ステップS101において観測された状態変数に基づいて報酬を計算する。
【0035】
次いで、関数更新ステップS102−2において、関数更新部22は、報酬に基づいて、交流電源側が停電であるか否かの判断基準となる電源電圧の値である停電検出レベルおよび交流電源側の電源電圧が停電検出レベル未満である状態の継続時間である停電検出時間を変更するための関数を更新する。
【0036】
続いて、上述の機械学習装置を備えるモータ制御装置について説明する。ここでは一例として、学習部の学習アルゴリズムとして強化学習を用いた場合について説明する。
【0037】
図5は、本発明の実施例による機械学習装置を備えるモータ制御装置を示す原理ブロック図である。なお、ここでは1個のモータ104を駆動制御するモータ制御装置1000について説明するが、モータ制御装置1000により駆動制御するモータ104の個数は、本発明を特に限定するものではなく、複数個であってもよい。また、モータ制御装置1000によって駆動されるモータ104の種類についても本発明を特に限定するものではなく、例えば誘導モータであっても同期モータであってもよい。また、相数も本発明を特に限定するものではなく、三相の他に、例えば単相やその他の多相であってもよい。
【0038】
モータ制御装置1000は、その主回路構成として、整流器101と、逆変換器102と、DCリンクコンデンサ105とを備える。モータ制御装置1000の三相交流入力側には交流電源103が接続され、モータ制御装置1000の交流モータ側には三相のモータ104が接続される。なお、説明を簡明にするために、図5では、モータ104を駆動するための制御系を通常動作制御部41としてまとめて表記している。また、DCリンク電圧を0[V]から入力電圧波高値まで昇圧する際に用いる初期充電手段については図示を省略している。
【0039】
整流器101は、交流電源103側から供給された交流電力を直流電力に変換してDCリンクへ出力する。本発明では、用いられる整流器101の実施形態は特に限定されず、例えばダイオード整流器、あるいはPWM制御方式の整流回路などがある。
【0040】
DCリンクコンデンサ105は、整流器101の直流側と逆変換器102の直流側とを接続するDCリンクに設けられる。DCリンクコンデンサ105は、DCリンクにおける直流電力を蓄積する機能と整流器101の直流出力の脈動分を抑える平滑機能とを有する。
【0041】
逆変換器102は、DCリンクに接続され、DCリンクにおける直流電力を交流電力に変換してモータ104へ供給するものであるが、一般的には交直双方向に変換可能である電力変換器である。すなわち、逆変換器102は、DCリンクの直流電力とモータ104の駆動電力もしくは回生電力である交流電力との間で双方向に電力変換することができるものであり、通常動作制御部41から受信したモータ駆動指令に従い、直流電力を交流電力に変換する力行動作(逆変換動作)および交流電力を直流電力に変換する回生動作(順変換動作)のいずれかを行う。具体的には、逆変換器102は、DCリンク側から供給される直流電力を、通常動作制御部41から受信したモータ駆動指令に基づき内部のスイッチング素子をスイッチング動作させ、モータ104を駆動するための所望の電圧および所望の周波数の三相交流電力に変換する。これにより、モータ104は、供給された電圧可変および周波数可変の三相交流電力に基づいて動作することになる。また、モータ104の減速時には回生電力が発生するが、この場合は通常動作制御部41から受信したモータ駆動指令に基づき、モータ104で発生した交流の回生電力を直流電力へ変換してDCリンクへ戻す。なお、モータ制御装置1000で複数のモータ104を駆動制御する場合には、各モータ104に個別に駆動電力を供給してモータ104を駆動制御するために、逆変換器102は、モータ104の個数と同数個、並列接続される。逆変換器102は、例えばPWMインバータなどのような、スイッチング素子およびこれに逆並列に接続されたダイオードのブリッジ回路からなる。スイッチング素子の例としては、IGBT、サイリスタ、GTO(Gate Turn−OFF thyristor:ゲートターンオフサイリスタ)、トランジスタなどがあるが、スイッチング素子の種類自体は本発明を限定するものではなく、その他の半導体素子であってもよい。
【0042】
モータ制御装置1000は、その制御系として、図3および図4を参照して説明した強化学習を用いた機械学習装置1と、意思決定部13と、保護動作制御部14と、直流電圧測定部31と、交流電圧測定部32と、エネルギー量計算部33と、通常動作制御部41と、モータ制御部51とを備える。
【0043】
直流電圧測定部31は、DCリンクに設けられたDCリンクコンデンサ105の両端の電圧(DCリンク電圧)を測定する。
【0044】
交流電圧測定部32は、交流電源103側の電源電圧を測定する。
【0045】
エネルギー量計算部33は、DCリンクコンデンサ105に蓄積されたエネルギー量を計算する。
【0046】
停電検出部34は、交流電源103側の電源電圧が停電検出レベル未満である状態が停電検出時間継続した場合、交流電源側で停電が発生したと判定する。停電検出部34による停電検出処理に用いられる停電検出レベルおよび停電検出時間は、後述するように意思決定部13が決定したものである。
【0047】
保護動作制御部14は、停電検出部34が交流電源103側の停電を検出した場合、モータ10が所定の保護動作を行うための電力を出力するよう逆変換器102に対して保護動作指令を出力する。逆変換器102がPWM制御方式のインバータである場合、保護動作指令は、逆変換器102内のスイッチング素子のスイッチング動作をPWM制御するためのPWM制御信号として生成される。なお、本実施例では、保護動作制御部14は、保護動作指令を逆変換器102に対して直接出力するようにしたが、この代替例として、保護動作指令を通常動作制御部41に対して出力するようにしてもよく、この場合は、通常動作制御部41は、保護動作制御部14からの保護動作指令を受けて、モータ10が所定の保護動作を行うための電力を出力するよう逆変換器102に対して駆動指令を出力するようにする。いずれの場合であっても、逆変換器102は、保護動作指令を受信すると、DCリンクコンデンサ105に蓄積された直流電力を、モータ104に接続されたツール、当該ツールが加工する加工対象、モータ制御装置1000を有する製造ラインなどを保護するための各種保護動作に必要な交流電力に変換して出力する。
【0048】
通常動作制御部41は、DCリンク側の直流電力と交流モータ104側の交流電力とを相互に変換する逆変換器102の電力変換動作を制御する。すなわち、通常動作制御部41は、モータ104の動作プログラム、逆変換器102の交流モータ側の交流電流もしくは交流電圧および/またはモータ104の回転速度などを用いて、モータ104の速度、トルク、もしくは回転子の位置を制御するための駆動指令として、交流電力を直流電力に変換する回生動作(順変換動作)および直流電力を交流電力に変換する力行動作(逆変換動作)のいずれかを逆変換器102に対して指令する。逆変換器102がPWM制御方式のインバータである場合、上記各指令は、逆変換器102内のスイッチング素子のスイッチング動作をPWM制御するためのPWM制御信号として生成される。
【0049】
機械学習装置1は、状態観測部11と学習部12とを備える。
【0050】
状態観測部11は、交流電源103側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサ105に蓄積されたエネルギー量に関するデータと、保護動作制御部14によるモータ制御装置1000に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。観測された状態変数は訓練データセットとして学習部12における学習に用いられる。交流電源103側の電源電圧は交流電圧測定部32によって測定され、DCリンクコンデンサ105に蓄積されたエネルギー量はエネルギー量計算部33により計算される。
【0051】
学習部12内の報酬計算部21は、状態観測部11により観測された状態変数に基づいて、報酬を計算する。
【0052】
DCリンクコンデンサ105に蓄積されたエネルギー量を状態変数とした場合、報酬計算部21は、状態観測部11により観測されたDCリンクコンデンサ105に蓄積されたエネルギー量が、所定値未満であるときは報酬を増やし、所定値以上であるときは報酬を減らす。このように、DCリンクコンデンサ105に蓄積されたエネルギー量が、所定値未満であるときは報酬を増やし、所定値以上であるときは報酬を減らすのは、交流電源103側に停電が発生し保護動作制御部14による保護動作が完了したときに、DCリンクコンデンサ105に蓄積されたエネルギー量が所定値以上の残っていたということは、保護動作を実行せずにモータ制御装置1000を通常動作させる電力がまだ余っており、停電検出レベルおよび停電検出時間の設定が厳しすぎたということであるからである。
【0053】
また、モータ制御装置1000に対する保護動作が成功したか否かに関するデータを状態変数とした場合、報酬計算部21は、状態観測部11によりモータ制御装置1000に対する保護動作が失敗したことを観測したときは報酬を減らす。このように、モータ制御装置1000に対する保護動作が失敗したことを観測したときは報酬を減らすのは、保護動作の失敗により、モータ104、モータ104を駆動するモータ制御装置1000、モータ制御装置1000が駆動するモータ104に接続されたツール、当該ツールが加工する加工対象、当該モータ制御装置を有する製造ラインなどが、破損したり変形するなどといった何らかの障害が生じるからである。
【0054】
学習部12内の関数更新部22は、報酬計算部21によって算出された報酬に基づいて、停電検出レベルおよび停電検出時間を変更するための関数を更新する。例えばQ学習の場合、式1で表される行動価値関数Q(s,a)を停電検出レベルおよび停電検出時間を変更するための関数として用いる。
【0055】
意思決定部13は、学習部12が訓練データセットに従って学習した結果に基づいて、現在の状態変数の入力に応答して、停電検出レベルおよび停電検出時間を決定する。本実施例では、一例として学習アルゴリズムとして強化学習を用いているので、学習部12内の報酬計算部21によって算出された報酬に基づいて学習部12内の関数更新部22は停電検出レベルおよび停電検出時間を変更するための関数を更新し、意思決定部13は、更新された関数に基づき、報酬が最も多く得られる停電検出レベルおよび停電検出時間を選択する。意思決定部13が決定した停電検出レベルおよび停電検出時間に基づいて、停電検出部34は交流電源103側の停電の発生の有無を判別する。
【0056】
モータ制御部51は、保護動作制御部14および通常動作制御部41を統括制御する。
【0057】
図6は、本発明の実施例による、強化学習を用いた機械学習装置の動作フローを示すフローチャートである。
【0058】
一般に、強化学習では行動の初期値はランダムに選択される。本発明の実施例では、ステップS201において、行動である停電検出レベルおよび停電検出時間の初期値をランダムに選択する。
【0059】
ステップS202では、通常動作制御部41は、逆変換器102に対し、モータ104の動作プログラム、逆変換器102の交流モータ側の交流電流もしくは交流電圧および/またはモータ104の回転速度などを用いて、モータ104の速度、トルク、もしくは回転子の位置を制御するための駆動指令として、交流電力を直流電力に変換する回生動作(順変換動作)および直流電力を交流電力に変換する力行動作(逆変換動作)のいずれかを指令する。これによりモータ104は加速動作、定速動作もしく減速動作をすることになる。この間、直流電圧測定部31はDCリンクに設けられたDCリンクコンデンサ105の両端の電圧(DCリンク電圧)を測定し、交流電圧測定部32は交流電源103側の電源電圧を測定し、エネルギー量計算部33はDCリンクコンデンサ105に蓄積されたエネルギー量を計算する。
【0060】
ステップS203において、状態観測部11は、訓練データセットとして、交流電源103側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサ105に蓄積されたエネルギー量に関するデータと、保護動作制御部14によるモータ制御装置1000に対する保護動作が成功したか否かに関するデータと、モータ出力に関するデータと、のうちの少なくとも1つから構成される状態変数を観測する。なお、本実施例では、一例としてこれら3つのデータを状態変数としたが、これら3つのデータのうち少なくとも1つを状態変数とすればよい。
【0061】
次いでステップS204において、停電検出部34は、停電検出レベルおよび停電検出時間ならびに交流電圧測定部32は交流電源103側の電源電圧に基づいて交流電源103側の停電の発生の有無を判別する。停電検出部34は、交流電源103側の電源電圧が停電検出レベル未満である状態が停電検出時間継続した場合、交流電源側で停電が発生したと判定してステップS205へ進む。
【0062】
ステップS205では、保護動作制御部14は、停電検出部34が交流電源103側の停電を検出した場合、モータ10が所定の保護動作を行うための電力を出力するよう逆変換器102に対して保護動作指令を出力する。これにより、逆変換器102は、DCリンクコンデンサ105に蓄積された直流電力を、モータ104に接続されたツール、当該ツールが加工する加工対象、モータ制御装置1000を有する製造ラインなどを保護するための各種保護動作に必要な交流電力に変換して出力する。
【0063】
ステップS206では、状態観測部11は、保護動作が成功したか否かに関するデータに基づき、モータ制御装置1000に対する保護動作が失敗したか否かを判別する。状態観測部11によりモータ制御装置1000に対する保護動作が失敗したことを観測したときは、ステップS208において報酬計算部21は報酬を減らす。一方、状態観測部11がモータ制御装置1000に対する保護動作が成功したことを観測したときはステップS207へ進む。
【0064】
ステップS207では、状態観測部11は、DCリンクコンデンサ105に蓄積されたエネルギー量に関するデータに基づき、状態観測部11により観測されたDCリンクコンデンサ105に蓄積されたエネルギー量が所定値以上であるか否かを判別する。状態観測部11がDCリンクコンデンサ105に蓄積されたエネルギー量が所定値以上であると判定したときは、ステップS208において報酬計算部21は報酬を減らす。一方、状態観測部11がDCリンクコンデンサ105に蓄積されたエネルギー量が所定値未満であると判定したときは、ステップS209において報酬計算部21は報酬を増やす。
【0065】
ステップS210では、関数更新部22は、報酬計算部21によって算出された報酬に基づいて、停電検出レベルおよび停電検出時間を変更するための関数を更新する。
【0066】
続くステップS211では、意思決定部13は、ステップS210において更新された関数に基づき、報酬が最も多く得られる停電検出レベルおよび停電検出時間を選択する。その後、ステップS202へ戻り、これ以降、ステップS202〜S211の処理が繰り返し実行される。これにより、機械学習装置1は、通常動作を最大限継続し保護動作の実行を最小限に抑えることができる交流電源側の停電に関連付けられる条件としての停電検出レベルおよび停電検出時間を学習していく。なお、訓練データセットを、複数の整流器101から取得してもよく、この場合、学習部12は、複数の整流器101に対して取得される訓練データセットに従って、ステップS201〜S211の処理を繰り返し実行し、停電検出レベルおよび停電検出時間を学習していく。複数の整流器101に対して訓練データセットが取得されると機械学習装置1の学習精度は向上する。
【0067】
なお、上述した状態観測部11、学習部12、および意思決定部13は、例えばソフトウェアプログラム形式で構築されてもよく、あるいは各種電子回路とソフトウェアプログラムとの組み合わせで構築されてもよい。例えばこれらをソフトウェアプログラム形式で構築する場合は、モータ制御装置1000内にある演算処理装置をこのソフトウェアプログラムに従って動作させることで上述の各部の機能が実現される。またあるいは、状態観測部11および学習部12を備える機械学習装置1を、各部の機能を実現するソフトウェアプログラムを書き込んだ半導体集積回路として実現してもよい。またあるいは、状態観測部11および学習部12を備える機械学習装置1のみならず意思決定部13も含めた形で、各部の機能を実現するソフトウェアプログラムを書き込んだ半導体集積回路を実現してもよい。
【0068】
また、本発明による機械学習処理は、モータ制御装置1000がモータの駆動制御のために本来的に備える直流電圧測定部31および交流電圧測定部32により測定された各種データを用いて実行されるので、従来技術のように新たなハードウェア装置を設ける必要がないことから、既存のモータ制御装置にも後付けで適用することも可能である。この場合、機械学習装置1や意思決定部13の各部の機能を実現するソフトウェアプログラムを書き込んだ半導体集積回路を当該既存のモータ制御装置に組み込んだり、機械学習装置1や意思決定部13の各部の機能を実現するソフトウェアプログラムそのものを当該既存のモータ制御装置内の演算処理装置に追加的にインストールすればよい。また、あるモータ制御装置に関して停電検出レベルおよび停電検出時間を学習した機械学習装置1を、これとは別のモータ制御装置に取り付け、当該別のモータ駆動装置に関して停電検出レベルおよび停電検出時間を再学習して更新するようにしてもよい。
【符号の説明】
【0069】
1 機械学習装置
11 状態観測部
12 学習部
13 意思決定部
14 保護動作制御部
21 報酬計算部
22 関数更新部
31 直流電圧測定部
32 交流電圧測定部
33 エネルギー量計算部
34 停電検出部
41 モータ制御装置
51 モータ制御部
101 整流器
102 逆変換器
103 交流電源
104 モータ
105 DCリンクコンデンサ
1000 モータ制御装置
【要約】
【課題】交流電源側の停電発生時において、通常動作を最大限継続し、保護動作の実行を最小限に抑えることができるモータ制御装置、ならびに機械学習装置およびその方法を実現する。
【解決手段】交流電源側から供給された交流電力を直流電力に変換してDCリンクへ出力したのちさらにモータの駆動のための交流電力に変換してモータ104へ供給するモータ制御装置の、交流電源側の停電に関連付けられる条件を学習する機械学習装置1は、交流電源側の電源電圧の値に関するデータと、DCリンクに設けられたDCリンクコンデンサに蓄積されたエネルギー量に関するデータと、モータ制御装置に対する保護動作が成功したか否かに関するデータと、のうちの少なくとも1つから構成される状態変数を観測する状態観測部11と、状態変数によって構成される訓練データセットに従って、交流電源側の停電に関連付けられる条件を学習する学習部12とを備える。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7