特許第6987304号(P6987304)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許6987304電力変換装置、機械学習器、および学習済みモデルの生成方法
<>
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000002
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000003
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000004
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000005
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000006
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000007
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000008
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000009
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000010
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000011
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000012
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000013
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000014
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000015
  • 特許6987304-電力変換装置、機械学習器、および学習済みモデルの生成方法 図000016
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6987304
(24)【登録日】2021年12月2日
(45)【発行日】2021年12月22日
(54)【発明の名称】電力変換装置、機械学習器、および学習済みモデルの生成方法
(51)【国際特許分類】
   H02M 7/48 20070101AFI20211213BHJP
   H02P 27/06 20060101ALI20211213BHJP
   G06N 20/00 20190101ALI20211213BHJP
【FI】
   H02M7/48 E
   H02P27/06
   G06N20/00 130
【請求項の数】15
【全頁数】26
(21)【出願番号】特願2021-515920(P2021-515920)
(86)(22)【出願日】2020年3月31日
(86)【国際出願番号】JP2020014808
(87)【国際公開番号】WO2020217879
(87)【国際公開日】20201029
【審査請求日】2021年3月2日
(31)【優先権主張番号】特願2019-81821(P2019-81821)
(32)【優先日】2019年4月23日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110002941
【氏名又は名称】特許業務法人ぱるも特許事務所
(72)【発明者】
【氏名】樋渡 天次郎
(72)【発明者】
【氏名】佐野 壮太
(72)【発明者】
【氏名】楠部 真作
【審査官】 栗栖 正和
(56)【参考文献】
【文献】 特開平03−124266(JP,A)
【文献】 特開平08−172796(JP,A)
【文献】 特開平08−149884(JP,A)
【文献】 特開2017−083237(JP,A)
【文献】 国際公開第2013/110532(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H02M 7/48
H02P 27/06
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
複数のスイッチング素子を備え、直流電力を交流電力に変換して回転機械装置に供給する電力変換部と、前記回転機械装置に流れる電流を検出する電流検出部と、設定された制御周期ごとに、機械学習器から与えられるパターン生成関数に基づいて、前記複数のスイッチング素子における1周期分のスイッチング状態を決定し、前記1周期分のスイッチング状態の組み合わせから成るスイッチングパターンを生成して、前記電力変換部を出力制御するパターン決定部とを備え、
前記機械学習器は、教師データに含まれる、電流指令値および前記電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方に基づいて機械学習を実行して前記電力変換部のスイッチングパターンを決定する前記パターン生成関数を生成するものであり、
前記パターン決定部は、前記機械学習器から与えられる前記パターン生成関数と、前記電流指令値および前記電流検出値若しくは前記電圧指令値のいずれか一方とを共に入力して演算処理を実行して前記電力変換部のスイッチングパターンを決定するものである、電力変換装置。
【請求項2】
前記パターン決定部は、前記機械学習器から、前記電力変換部のスイッチング損失をパルス幅変調方式の場合よりも小さくするための前記パターン生成関数を取得する、請求項1に記載の電力変換装置。
【請求項3】
前記パターン決定部は、前記機械学習器から、前記回転機械装置の駆動音、前記回転機械装置の機械振動、前記回転機械装置に流れる電流に含まれる電流高調波、前記電流指令値への前記電流検出値の追従時間の内の少なくともいずれか1つをパルス幅変調方式の場合よりも小さくするための前記パターン生成関数を取得する、請求項1または請求項2に記載の電力変換装置。
【請求項4】
前記パターン決定部は、前記電力変換部のスイッチングパターンを決定する場合に、前記回転機械装置の磁束応答値、速度応答値、位置応答値、前記回転機械装置の磁束指令値、速度指令値、位置指令値、前記電力変換部の前回の制御周期内のスイッチング状態、および前記回転機械装置の回転機械パラメータの少なくともいずれか1つを状態量として取得する、請求項1から請求項3のいずれか1項に記載の電力変換装置。
【請求項5】
前記機械学習器をさらに備える請求項1から請求項4のいずれか1項に記載の電力変換装置。
【請求項6】
直流電力を交流電力に変換して回転機械装置に供給する電力変換部を構成する複数のスイッチング素子の設定された制御周期の1周期分のスイッチング状態の組み合わせから成るスイッチングパターンを決めるパターン生成関数を、教師データに基づいて機械学習を実行して出力するものであって、
前記教師データに含まれる電流指令値および前記回転機械装置に流れる電流を検出する電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方を入力データとして取得する入力データ取得部と、
前記教師データに含まれる前記電力変換部のスイッチングパターンをラベルとして取得するラベル取得部と、
前記入力データ取得部で得られた前記電流指令値および前記電流検出値、若しくは前記電圧指令値のいずれか一方と、前記ラベル取得部で得られたスイッチングパターンに基づいて前記電力変換部の前記スイッチング素子のスイッチングパターンを決める学習済みモデルを生成する学習部と、を備える機械学習器。
【請求項7】
前記入力データ取得部は、前記教師データに含まれる前記入力データとして、前回周期の前記電力変換部のスイッチング状態を取得するとともに、
前記ラベル取得部は、前記教師データに含まれる前記ラベルとして、前記前回周期の前記電力変換部のスイッチング状態に対応する今回周期の前記電力変換部のスイッチングパターンを取得する、請求項6に記載の機械学習器。
【請求項8】
前記入力データ取得部は、前記教師データに含まれる前記入力データとして、前記回転機械装置の磁束応答値、速度応答値、位置応答値、前記回転機械装置の磁束指令値、速度指令値、位置指令値、および前記回転機械装置の回転機械パラメータの少なくともいずれか1つを取得する、請求項6または請求項7に記載の機械学習器。
【請求項9】
前記ラベル取得部は、前記教師データに含まれる前記ラベルとして、前記電力変換部のスイッチング損失をパルス幅変調方式の場合よりも小さくするための前記スイッチングパターンを取得する、請求項6または請求項7に記載の機械学習器。
【請求項10】
前記ラベル取得部は、前記教師データに含まれる前記ラベルとして、前記回転機械装置に流れる電流に含まれる電流高調波、および前記電流指令値への前記電流検出値の追従時間のうち少なくともいずれか1つをパルス幅変調方式の場合よりも小さくするスイッチングパターンを取得する、請求項6、請求項7または請求項9のいずれか1項に記載の機械学習器。
【請求項11】
前記学習部は、前記電流指令値、前記電流検出値、または前記スイッチング状態に基づいて報酬を計算する報酬計算部と、前記報酬計算部から入力された前記報酬に基づいて前記パターン生成関数を更新する関数更新部を備える、請求項6から請求項10のいずれか1項に記載の機械学習器。
【請求項12】
前記報酬計算部は、前記電力変換部におけるスイッチングパターンにおいて、前記電力変換部のスイッチング回数を現状よりも少なくしたら報酬を増やし、前記電流指令値に対する前記電流検出値の差が規定値を超えたら現状よりも報酬を減らす、請求項11に記載の機械学習器。
【請求項13】
前記報酬計算部は、前記電力変換部におけるスイッチングパターンにおいて、前記回転機械装置の機械振動を現状よりも小さくしたら報酬を増やす、請求項12に記載の機械学習器。
【請求項14】
前記報酬計算部は、前記電力変換部におけるスイッチングパターンにおいて、前記回転機械装置の駆動音を現状よりも小さくしたら報酬を増やす、請求項12または請求項13に記載の機械学習器。
【請求項15】
請求項6から請求項14のいずれか1項に記載の機械学習器を用いて機械学習を実施することにより、前記電力変換部を構成する前記スイッチング素子のスイッチングパターンを決定するための学習済みモデルを生成する、学習済みモデルの生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、電力変換装置、機械学習器、および学習済みモデルの生成方法に関するものである。
【背景技術】
【0002】
従来、多相交流の回転機械装置の駆動制御において、回転機械装置の駆動状態に基づいて、電力変換部のスイッチング状態を直接決定する瞬時電流制御があり、瞬時電流制御の1つとしてモデル予測制御が知られている。
【0003】
例えば、下記の特許文献1記載の従来技術においては、モデル予測制御に基づいた直接トルク制御が検討されている。この制御方式は、回転機械装置のトルクと固定子磁束の数ステップ先を予測しながら定められた許容幅内で制御する方式であり、数ステップの予測区間で各相スイッチの切り替え回数が最小となるスイッチングパターンを探索する。このため、モデル予測制御による過渡状態の高速なトルク応答時間を維持しながら、定常状態のスイッチング損失を低減することが期待される。
【0004】
また、下記の特許文献2記載の従来技術においては、機械学習器を備えたフィードバック制御系が検討されている。フィードバック制御によって計算した電力変換部のスイッチング状態とスイッチング状態を維持する時間に対して、機械学習器はスイッチング状態を維持する時間を調整する。これにより、過渡状態で発生する振動の抑制効果が期待されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2011−152038号公報
【特許文献2】特開2012−213258号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1に記載されているようなモデル予測制御に基づいた直接トルク制御は、過渡状態の高速なトルク応答時間を維持しながら、定常状態のスイッチング損失を低減することが期待される。しかしながら、スイッチング損失低減の効果をさらに高めようとした場合には、より長い区間を予測しなければならず、予測する区間を徒に拡張すると、演算量が指数関数的に増大するため、実機実装を考えた場合には、予測する区間を拡張してスイッチング損失を低減するには自ずと限界がある。
【0007】
また、特許文献2に記載されているような機械学習器を備えたフィードバック制御系は、過渡状態で発生する振動が抑制されるものの、機械学習器は電力変換部のスイッチング状態を維持する時間のみを調整し、電力変換部のスイッチング状態を調整または決定しないため、電力変換部の変調方式に関わるスイッチング損失、電流高調波、および駆動音を考慮することが困難である。
【0008】
本願は、前記のような課題を解決するための技術を開示するものであり、電力変換部の変調方式に関わる性能を考慮しつつ、ユーザの要望と制御対象となる回転機械装置の状態に合わせてスイッチングパターンを決定することができる電力変換装置、機械学習器、および学習済みモデルの生成方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
本願に開示される電力変換装置は、複数のスイッチング素子を備え、直流電力を交流電力に変換して回転機械装置に供給する電力変換部と、前記回転機械装置に流れる電流を検出する電流検出部と、設定された制御周期ごとに、機械学習器から与えられるパターン生成関数に基づいて、前記複数のスイッチング素子における1周期分のスイッチング状態を決定し、前記1周期分のスイッチング状態の組み合わせから成るスイッチングパターンを生成して、前記電力変換部を出力制御するパターン決定部とを備え、
前記機械学習器は、教師データに含まれる、電流指令値および前記電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方に基づいて機械学習を実行して前記電力変換部のスイッチングパターンを決定する前記パターン生成関数を生成するものであり、
前記パターン決定部は、前記機械学習器から与えられる前記パターン生成関数と、前記電流指令値および前記電流検出値若しくは前記電圧指令値のいずれか一方とを共に入力して演算処理を実行して前記電力変換部のスイッチングパターンを決定するものである。
【0010】
また、本願に開示される機械学習器は、直流電力を交流電力に変換して回転機械装置に供給する電力変換部を構成する複数のスイッチング素子の設定された制御周期の1周期分のスイッチング状態の組み合わせから成るスイッチングパターンを決めるパターン生成関数を、教師データに基づいて機械学習を実行して出力するものであって、
前記教師データに含まれる電流指令値および前記回転機械装置に流れる電流を検出する電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方を入力データとして取得する入力データ取得部と、
前記教師データに含まれる前記電力変換部のスイッチングパターンをラベルとして取得するラベル取得部と、
前記入力データ取得部で得られた前記電流指令値および前記電流検出値、若しくは前記電圧指令値のいずれか一方と、前記ラベル取得部で得られたスイッチングパターンに基づいて前記電力変換部の前記スイッチング素子のスイッチングパターンを決める学習済みモデルを生成する学習部と、を備える。
【0011】
さらに、本願に開示される学習済みモデルの生成方法は、前記機械学習器を用いて機械学習を実施することにより、前記電力変換部を構成する前記スイッチング素子のスイッチングパターンを決定するための学習済みモデルを生成する。
【発明の効果】
【0012】
本願に開示される電力変換装置、機械学習器、学習済みモデルの生成方法によれば、電力変換部の変調方式に関わる性能を考慮しつつ、ユーザの要望と制御対象となる回転機械装置の状態に合わせてスイッチングパターンを決定することができる。
【図面の簡単な説明】
【0013】
図1】本願の実施の形態1による電力変換装置の構成を示すブロック図である。
図2】本願の実施の形態1による電力変換装置を実現するハードウェア構成図である。
図3】本願の実施の形態1による電力変換装置の動作例を示すフローチャートである。
図4】本願の実施の形態1による機械学習器の構成を示すブロック図である。
図5】本願の実施の形態1による機械学習器を実現するハードウェア構成図である。
図6】本願の実施の形態2による電力変換装置の構成を示すブロック図である。
図7】本願の実施の形態2による電力変換装置の動作例を示すフローチャートである。
図8】本願の実施の形態3による電力変換装置の構成を示すブロック図である。
図9】本願の実施の形態3による電力変換装置の動作例を示すフローチャートである。
図10】本願の実施の形態4による電力変換装置の構成を示すブロック図である。
図11】本願の実施の形態4による機械学習器を実現するハードウェア構成図である。
図12】本願の実施の形態5による電力変換装置の構成を示すブロック図である。
図13】本願の実施の形態6による電力変換装置の構成を示すブロック図である。
図14】本願の実施の形態1による電力変換部のスイッチング状態の一例を示す図である。
図15】本願の実施の形態1によるスイッチングパターンを説明する図である。
【発明を実施するための形態】
【0014】
実施の形態1.
この実施の形態1に関わる電力変換装置と機械学習器の構成および動作について、電力変換装置の構成を示すブロック図である図1、電力変換装置を実現するハードウェア構成図である図2、電力変換装置と機械学習器の動作をフローチャートで示した図3、機械学習器の構成を示すブロック図である図4、機械学習器を実現するハードウェア構成図である図5に基づいて説明する。
【0015】
この実施の形態1のシステム全体は、図1に示すように、電力変換装置1、直流電源2、および回転機械装置3から構成される。
【0016】
電力変換装置1は、直流電源2と回転機械装置3との間に接続され、直流電源2からの直流電力を交流電力に変換して回転機械装置3に出力して回転機械装置3を駆動する。回転機械装置3は、電力変換装置1から出力された交流電力を動力に変換する。なお、ここで使用される回転機械装置3は、例えば誘導電動機、同期電動機等の各種の電動機を用いることができる。
【0017】
電力変換装置1は、機械学習器10、uvw/dq変換器11、主回路である電力変換部12、電流検出部13、およびパターン決定部14を備える。
【0018】
電流検出部13は、電力変換部12が回転機械装置3に出力している三相分の電流値iu(k)、iv(k)、iw(k)を検出する。uvw/dq変換器11は、検出した電流値iu(k)、iv(k)、iw(k)をdq座標上の電流値であるid(k)、iq(k)に変換する。
【0019】
パターン決定部14は、制御周期ごとに、uvw/dq変換器11の出力である電流値id(k)、iq(k)、電流指令値idref(k)、iqref(k)、前回周期のスイッチング状態SWu(k−1)、SWv(k−1)、SWw(k−1)、および後で詳述する機械学習器10が出力したパターン生成関数に基づいて、電力変換部12のスイッチングパターンSWP(k)を決定する。なお、実施の形態1の図面(図1図3図4)において、また、実施の形態1以外の図面においても、パターン生成関数を、表記の簡易化のため、PGFと表している。
【0020】
また、スイッチングパターンSWP(k)は、制御周期の1周期分のスイッチング状態の組み合わせから成るものであり、詳細は後述する。また、(k−1)、(k)の表記は、制御周期ごとの離散時間信号を表しており、(k−1)は前回値、(k)は現在値、(k+1)は次回値である。これは図1および図1以降の図においても同様である。
【0021】
また、検出した電流値iu(k)、iv(k)、iw(k)をまとめて記載する場合は、適宜、電流検出値iuvw(k)と表記する。dq座標上の電流値であるid(k)、iq(k)をまとめて記載する場合は、適宜、dq座標電流値idq(k)と記載する。電流指令値idref(k)、iqref(k)をまとめて記載する場合は、適宜、電流指令値idqref(k)と表記する。前回周期(k−1)のスイッチング状態SWu(k−1)、SWv(k−1)、SWw(k−1)をまとめて記載する場合は、適宜、前回周期のスイッチング状態SW(k−1)と表記する。これらの表記は、図1および、図1以降の図においても同様である。
【0022】
電力変換装置1は、例えば、図2で示すハードウェア構成により実現される。
電力変換装置1は、電力変換部12、電流検出部13、電力変換部12を制御するプロセッサ20、およびプロセッサ20が備える記憶装置21で構成されている。
【0023】
電力変換部12は、直流電源2の直流電力を三相交流電力に変換する三相インバータ回路により構成され、負荷である電動機などの回転機械装置3を駆動するものである。電力変換部12は、それぞれダイオードDが逆並列接続された複数のスイッチング素子Q1〜Q6を備える。本例では、U相の上アームおよび下アームはスイッチング素子Q1およびQ2を備え、V相の上アームおよび下アームはスイッチング素子Q3およびQ4を備え、W相の上アームおよび下アームはスイッチング素子Q5およびQ6を備える。そして、各相の上アームと下アームとの接続点からバスバーによって回転機械装置3の各相の入力端子に接続されている。
【0024】
記憶装置21は、RAM(Random Access Memory)等の揮発性記憶装置と、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の不揮発性の補助記憶装置(いずれも図示省略)を備えている。なお、不揮発性の補助記憶装置としては、HDDの代わりにフラッシュメモリ等を使用してもよい。
【0025】
プロセッサ20は、記憶装置21から入力された制御プログラムを実行する。
記憶装置21は補助記憶装置と揮発性記憶装置とを備えるため、プロセッサ20には補助記憶装置から揮発性記憶装置を介して制御プログラムが入力される。
プロセッサ20は、演算結果等のデータを記憶装置21の揮発性記憶装置に出力してもよいし、揮発性記憶装置を介して補助記憶装置にこれらのデータを保存してもよい。
【0026】
上述したように、パターン決定部14は、制御周期毎に1周期分のスイッチング状態の組み合わせから成るスイッチングパターンSWP(k)を出力して電力変換部12を制御する。
図14は、電力変換部12のスイッチング状態の一例を示す図である。スイッチング状態は、各スイッチング素子Q1〜Q6のオン(:1)とオフ(:0)の信号の組み合わせである。上アームおよび下アームのスイッチング素子Q1〜Q6の内、一方がオンで他方がオフとなる8通りのスイッチング状態(SW1〜SW8)と、電力変換装置1の動作停止時に全スイッチング素子Q1〜Q6をオフするスイッチング状態(SW0)の9通りのスイッチング状態がある。図14のスイッチング状態SW1(SWu1、SWv1、SWw1)では、スイッチング素子Q1、Q4、Q6がオン、スイッチング素子Q2、Q3、Q5がオフである。
【0027】
図15は、スイッチングパターンSWP(k)を説明する図である。スイッチングパターンSWP(k)は1周期分のスイッチング状態の組み合わせであり、1周期Tを複数区間に分割し、区間毎に割り当てるスイッチング状態が決定される。この場合、スイッチングパターンSWP(k)は、スイッチング状態SW3、SW4、SW2、SW2、SW6、SW7の順番で切り替わるように設定された、組み合わせである。
なお、1周期を予め決められた幅の区間に分割してスイッチング状態をそれぞれ割り当てるものでも、また、スイッチング状態を異なるスイッチング状態に切り替えるタイミング情報をスイッチング状態の情報に付加させても良い。
【0028】
図15に示すように、電力変換部12は、現時点t(k)において、スイッチング状態SW1で動作しており、1つ前のスイッチング状態は、SW7である。現時点t(k)のスイッチング状態SW1も前周期(k−1)から継続するものであり、スイッチング状態SW1、SW7は、前周期(k−1)内のスイッチング状態SW(k−1)である。
【0029】
パターン決定部14は、現時点t(k)のスイッチング状態SW1を含む、少なくとも1つの前周期(k−1)内のスイッチング状態SW(k−1)、例えばSW1、SW7と、電流値idq(k)と、電流指令値idqref(k)とに基づいて、パターン生成関数PGFにより、現周期(k)の1周期分のスイッチングパターンSWP(k)(:SW3、SW4、SW2、SW2、SW6、SW7)を生成する。スイッチングパターンSWP(k)は1周期分のスイッチング状態の指令として電力変換部12に与えられ、各スイッチング素子Q1〜Q6はオンオフ制御される。
そして、パターン決定部14は、時点t(k+1)において、次周期(k+1)のためのスイッチングパターンSWP(k+1)を生成する。
【0030】
この場合、パターン決定部14が、前周期(k−1)内の実際のスイッチング状態SW(k−1)を電力変換部12から受信して取得するものを図示したが、パターン決定部14が前周期に生成したスイッチングパターンSWP(k−1)内から、前周期(k−1)内のスイッチング状態SW(k−1)を取得しても良い。
【0031】
なお、通常、制御周期の1周期Tは1つのスイッチング状態の継続期間より格段と長いため、スイッチングパターンSWPは、複数のスイッチング状態の組み合わせから成る。但し、制御周期がスイッチング状態の継続期間と同等に短縮可能な場合は、1つのスイッチング状態を1周期分としても良い。
【0032】
また、前周期内のスイッチング状態SW(k−1)は、現時点のスイッチング状態のみでも適用可能であるが、複数個あるのが望ましい。また、制御周期が短い場合は、前周期内のスイッチング状態として直前周期(k−1)に限らず、例えば2個前の周期(k−2)のスイッチング状態を併せて採用しても良い。
【0033】
次に、電力変換装置1の各部の機能、動作について、図1に基づいて説明する。
電力変換部12は、直流電源2から供給された直流電力をパターン決定部14で決定されたスイッチングパターンSWP(k)に基づいて交流電力に変換し、回転機械装置3に出力する。スイッチングパターンSWP(k)の決定方法については、後で説明する。
【0034】
電流検出部13は、電力変換部12と回転機械装置3の間の三相交流電流を検出し、これを電流検出値iuvw(k)としてuvw/dq変換器11に出力する。
ここで電流検出部13には、CT(Current Transformer)検出器、シャント抵抗等、いずれの電流検出部を用いてもよい。三相の電流の内、二相分の電流を検出し、残りの一相の電流を算出したものを用いてもよい。また、一つの電流検出部で三相交流電流値を復元する1シャント電流検出方式を用いてもよい。
【0035】
uvw/dq変換器11は、電流検出部13で検出した電流値iuvw(k)を二軸のdq座標上の電流値idq(k)に変換し、パターン決定部14に出力する。このとき、uvw/dq変換器11に必要な回転機械装置3の磁極位置の位相情報は電力変換装置1内で生成した位相を用いることができる。回転機械装置3にエンコーダ等の位相および速度の検出器を設置している場合は、検出した位相を用いてもよい。
【0036】
この実施の形態1では、電流指令値がdq座標上の電流指令値であるidqref(k)の例を示しているため、電流検出値iuvw(k)をdq座標上の電流値idq(k)に変換している。電流指令値が三相交流電流の指令値iuref(k)、ivref(k)、iwref(k)であれば、uvw/dq変換器11で電流検出値iuvw(k)の座標変換は行わずにそのままパターン決定部14に出力すればよい。
【0037】
また、電流指令値が二相交流電流iαref(k)、iβref(k)であれば、uvw/dq変換器11に代えて、uvw/αβ変換器を用いて電流検出値iuvw(k)をαβ座標上の電流値iα(k)、iβ(k)に変換してパターン決定部14に出力すればよい。
【0038】
次に、この実施の形態1の電力変換装置1における動作例について、図3の処理手順を示すフローチャートを参照して説明する。なお、以下で説明する処理手順は、本願の学習方法と電動機制御方法の一例である。そのため、各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。
【0039】
まず、ステップS1では、機械学習Aを実行するか電動機制御Bを実行するかを判定する。機械学習Aを実行する場合(ステップS1:Yes)は、機械学習Aを行い、学習済みモデルを作成する。機械学習Aを実行しない場合(ステップS1:No)は、機械学習Aを行った学習済みモデルを用いて電動機制御Bを実行する。この場合、機械学習Aを行う場合の処理と、電動機制御Bを行う場合の処理とでそれぞれ処理内容が異なるため、まずは機械学習Aを行う場合の処理手順について説明する。
【0040】
機械学習Aは、図4の機械学習器10の構成により実行される。
図4に示すように、機械学習器10は、入力データ取得部10a、ラベル取得部10b、学習部10c、およびパターン生成関数記憶部10dを含んで構成される。
【0041】
機械学習器10は、機械学習Aを実施するに当たり、予め用意した教師データに基づいた教師データ付き学習を行う。なお、教師データ付き学習については後で説明する。
ここで教師データとして取得する制御方式は、三相の電圧指令値を正規化して三角波キャリア比較変調方式によりスイッチングパターンSWP(k)を決定する、いわゆるパルス幅変調(PWM:Pulse Width Modulation)方式に比べて、電力変換部12のスイッチング損失を小さくする制御方式であり、例えば、モデル予測制御(Model Predictive Control)、選択的高調波消去(Selective Harmonic Elimination)、低次高調波消去(Low−order Harmonic Elimination)、最適パルスパターン(Optimized Pulse Patterns)などの制御方式である。
【0042】
ステップS2では、機械学習器10の入力データ取得部10aは、予め用意した教師データの中から電流指令値idqref(k)、dq座標電流値idq(k)、前回周期のスイッチング状態SW(k−1)を入力データとして取得し、学習部10cに出力する。なお、入力データとして利用される前回周期のスイッチング状態SW(k−1)は、例えば事前にモデル予測制御を実施した場合に得られるデータであって、図2の電力変換部12のスイッチング素子Q1〜Q6をオン/オフ制御するためのデータである。
【0043】
ステップS3では、機械学習器10のラベル取得部10bは、予め用意した教師データの中からスイッチングパターンSWP(k)をラベルとして取得し、学習部10cに出力する。
【0044】
ステップS4では、機械学習器10の学習部10cは、入力データ取得部10aから入力された入力データと、ラベル取得部10bから入力されたラベルとからなる1組のデータ(以下、教師データ組と称する)として取得し、教師データ付き学習を実行する。
【0045】
学習部10cは、上述のように入力された教師データ組に基づいて教師データ付き学習を行うことにより、学習済みモデルを構築する。
【0046】
この実施の形態1における電動機制御Bを対象とした機械学習Aは、パーセプトロンを組み合わせて構成したニューラルネットワークによる教師データ付き学習である。具体的には、電動機状態を示す入力データと電動機状態に応じたラベルとからなる教師データ組をニューラルネットワークに与え、ニューラルネットワークの出力がラベルと同じとなるように、各パーセプトロンについての重みづけを変更しながら学習を繰り返す。
【0047】
学習の過程では、バックプロパゲーション(Back−propagation、誤差逆伝搬法とも呼ばれる)という処理を行うことを繰り返すことにより各パーセプトロンの出力の誤差を小さくするように重みづけ値を調整する。
【0048】
このようにして、教師データ組の特徴を学習し、入力から結果を推定するための学習済みモデルを帰納的に獲得する。すなわち、教師データ付き学習は、上述したように、重みづけ値を調整しながら、ラベルと出力データとの誤差がなくなるようにするものである。
【0049】
このように、学習部10cにより実施される教師データ付き学習は、その学習結果として、パルス幅変調(PWM)方式よりもスイッチング損失を小さくなるように電力変換部12のスイッチング素子Q1〜Q6を制御するスイッチングパターンSWP(k)を決定するための学習済みモデルが得られる。そして、学習部10cが構築した学習済みモデルは、次段のパターン生成関数記憶部10dに出力される。
【0050】
なお、学習部10cが学習に用いるニューラルネットワークは三層であってもよいが、これ以上にさらに層を増やすようにしてもよい。いわゆるディープラーニング(深層学習とも呼ばれる。)により学習を行うようにしてもよい。
【0051】
ステップS5では、機械学習器10のパターン生成関数記憶部10dは、学習部10cで教師データ付き学習により得られる学習済みモデルをパターン生成関数PGFとして保存する。なお、パターン生成関数PGFは、ステップS2からS5の処理を定期的に実行することで更新してもよい。
【0052】
パターン生成関数記憶部10dに保存したパターン生成関数PGFは、後述の電動機制御Bを実行する際にパターン決定部14に出力される。そして、パターン決定部14では、パターン生成関数PGF、dq座標電流値idq(k)、電流指令値idqref(k)、前回周期のスイッチング状態SW(k−1)に基づいて電力変換部12のスイッチングパターンSWP(k)が決定される。
【0053】
上述した処理を実現するための機械学習器10は、例えば図5に示すハードウェア構成により実現される。すなわち、この機械学習器10は、プロセッサ30、およびプロセッサ30が備える記憶装置31で構成されている。
【0054】
記憶装置31は、RAM(Random Access Memory)等の揮発性記憶装置311と、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の不揮発性の補助記憶装置312を備えている。なお、不揮発性の補助記憶装置312としては、HDDの代わりにフラッシュメモリ等を使用してもよい。
【0055】
プロセッサ30は、記憶装置31から入力された各種の学習プログラムを実行する。
記憶装置31は、揮発性記憶装置311と補助記憶装置312を備えるため、プロセッサ30には補助記憶装置312から揮発性記憶装置311を介して各種の学習プログラムが入力される。
【0056】
プロセッサ30は、学習プログラムの学習結果等のデータを記憶装置31の揮発性記憶装置311に出力してもよいし、揮発性記憶装置311を介して補助記憶装置312にこれらのデータを保存してもよい。
【0057】
学習プログラムは、教師データ付き学習の処理を機械学習器10のプロセッサ30に実行させ、機械学習Aの結果として学習結果データを生成させるための命令を含むプログラムである。教師データは、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくするための電力変換部12のスイッチングパターンSWP(k)を獲得するように機械学習器10によって機械学習Aを実施するためのデータである。
【0058】
機械学習器10は、PC(Personal Computer)、サーバ装置等により実現できる。ただし、機械学習器10については機械学習Aに伴う演算量が多いため、例えば、PCにGPU(Graphics Processing Units)を搭載し、GPGPU(General−Purpose computing on Graphics Processing Units)と呼ばれる技術により、GPUを機械学習Aに伴う演算処理に利用して、高速に処理できるようにしてもよい。
【0059】
なお、機械学習器10の具体的なハードウェア構成に関して、各種の実施の形態に応じて、適宜、構成要素の省略、置換および追加が可能である。例えば、機械学習器10は、複数のプロセッサを含んでもよい。また、プロセッサ30は、CPU(Central Processing Unit)、FPGA(Field−Programmable Gate Array)等で構成されてもよい。
【0060】
次に、上述のように機械学習Aが行われた後に、学習済みモデルを用いて行われる電動機制御Bの処理内容について、図3に示すフローチャートに戻って説明する。
【0061】
まず、ステップS1では、機械学習Aを実行するか電動機制御Bを実行するかを判定する。機械学習Aを実施する際の処理については上述にて説明しているため、ここでは電動機制御Bを行う場合(ステップS1:No)の処理内容について説明する。
【0062】
ステップS6では、パターン決定部14は、機械学習器10のパターン生成関数記憶部10dに記憶されている学習済みモデルであるパターン生成関数PGFを取得する。
【0063】
次に、ステップS7では、パターン決定部14は、電流指令値idqref(k)、dq座標電流値idq(k)、電力変換部12の前回周期のスイッチング状態SW(k−1)を入力データとして取得する。
【0064】
ステップS8では、パターン決定部14は、入力データ(電流指令値idqref(k)、dq座標電流値idq(k)、電力変換部12の前回周期のスイッチング状態SW(k−1))、および機械学習器10から得られるパターン生成関数PGFに基づいて、スイッチングパターンSWP(k)を生成する。そして、生成したスイッチングパターンSWP(k)は、電力変換部12に出力される。
【0065】
ステップS9では、電力変換部12は、パターン決定部14から出力されたスイッチングパターンSWP(k)に基づいて、回転機械装置3に交流電力を供給し、回転機械装置3は、電流指令値idqref(k)に対し、dq座標上のdq座標電流値idq(k)を追従させつつ、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくするように駆動される。
【0066】
以上のように、この実施の形態1の電力変換装置1は、回転機械装置3に流れる電流を検出する電流検出部13と、スイッチングパターンを決定するためのパターン生成関数を出力する機械学習器10と、電流指令値idqref(k)、dq座標電流値idq(k)、電力変換部12の前回周期のスイッチング状態SW(k−1)、および機械学習器10からのパターン生成関数に基づいてスイッチングパターンを決定するパターン決定部14と、スイッチングパターンに応じてスイッチング素子Q1〜Q6を制御して回転機械装置3に交流電力を出力する電力変換部12とを備え、機械学習器10は、電力変換部12のスイッチング損失がパルス幅変調(PWM)方式よりも小さくなるように教師データ付き学習を行ってパターン生成関数を出力し、これに応じてパターン決定部14が電力変換部12のスイッチングパターンを決定する。
【0067】
このため、実施の形態1の電力変換装置1は、電流指令値idqref(k)に対し、dq座標電流値idq(k)を追従させつつ、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくするように回転機械装置3を駆動することができる。
【0068】
なお、前記の実施の形態1の説明では、機械学習器10における教師データ付き学習による学習済みモデルの作成は、予め用意した教師データを使用しているが、これに限らず、電動機制御Bを行いながら、教師データを測定して教師データ付き学習を行うようにしてもよい。また、機械学習器10を電力変換装置1に含まずに、パターン生成関数のみを電力変換装置1のパターン決定部14が機械学習器10から取得する構成としてもよい。
【0069】
実施の形態2.
この実施の形態2の電力変換装置は、機械学習器において作成する学習済みモデルの性能として、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくすることに加えて、回転機械装置の駆動音、回転機械装置の機械振動、回転機械装置の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか1つをパルス幅変調(PWM)方式に対して小さくするものを獲得できるようにしたものである。
【0070】
以下、この実施の形態2に関わる電力変換装置と機械学習器の構成および動作について、電力変換装置の構成を示すブロック図である図6、電力変換装置と機械学習器の動作をフローチャートで示した図7に基づいて説明する。なお、実施の形態2の電力変換装置において、実施の形態1と同一あるいは相当部分には、同一の符号を付す。
【0071】
この実施の形態2の電力変換装置の基本的な機能および構成は、上述した実施の形態1(図1)と共通するため、以下では、重複する説明を省略し、実施の形態1と実施の形態2について相違する点について、詳細に説明する。
【0072】
この実施の形態2のシステム全体は、図6に示すように、電力変換装置1、直流電源2、および回転機械装置3から構成される。
【0073】
電力変換装置1は、機械学習器10A、主回路である電力変換部12、電流検出部13、パターン決定部14A、速度検出部15、位置検出部16、および状態観測部17を備える。
【0074】
先の実施の形態1では、パターン決定部14には、電流指令値idqref(k)、dq座標電流値idq(k)、前回周期のスイッチング状態SW(k−1)、パターン生成関数が入力されていた。
【0075】
これに対して、この実施の形態2では、パターン決定部14Aには、予め設定された制御目標、電流指令値idqref(k)、前回周期のスイッチング状態SW(k−1)、パターン生成関数、および後で詳述する状態観測部17が出力する状態量がそれぞれ入力されている。
【0076】
ここに、前記の制御目標とは、例えば、電力変換部12のスイッチング損失の低減、回転機械装置3の駆動音の低減、回転機械装置3の機械振動の低減、回転機械装置3の電流高調波の低減、および電流指令値への電流検出値追従時間の低減などを図るための目標値である。なお、この制御目標は、例えば、数字と関連付けされたテーブルとして、制御目標No.1ではスイッチング損失を低減、制御目標No.2では、スイッチング損失と機械振動を低減、のように予め設定してもよい。
【0077】
また、この実施の形態2において、パターン決定部14Aは、機械学習器10Aに対して学習済みモデルの種類選択指令を出力する。この学習済みモデルの種類選択指令は、前記の制御目標に適合した学習済みモデルの性能を選択して機械学習器10Aからパターン生成関数を読み出す指令であり、後の電動機制御Bの処理の際に説明する。なお、本実施の形態の図面(図6図7)において、また、その他の実施の形態の図面においても、学習済みモデルの種類選択指令を、表記の簡易化のため、TSCと表している。
【0078】
次に、実施の形態1との差異である実施の形態2の速度検出部15、位置検出部16、状態観測部17の機能について説明する。
【0079】
速度検出部15は、回転機械装置3の機械的な速度情報ωrm(k)を検出して、状態観測部17に出力する。なお、回転機械装置3の速度情報としては、電気的な速度情報ωre(k)を検出してもよい。
【0080】
位置検出部16は、回転機械装置3の機械的な位相情報θrm(k)を検出して、状態観測部17に出力する。なお、回転機械装置3の位相情報としては、電気的な位相情報θre(k)を検出してもよい。
【0081】
状態観測部17は、電流検出部13、速度検出部15、および位置検出部16によりそれぞれ検出した回転機械装置3の電流、速度、位相に基づいて、回転機械装置3の駆動状態を観測してその状態量を出力する。
【0082】
すなわち、状態観測部17は、電流指令値idqref(k)、電流検出部13から取得した電流検出値iuvw(k)、速度検出部15から取得した速度検出値ωrm(k)、および位置検出部16から取得した位置検出値θrm(k)に基づいて、回転機械装置3の状態量を観測する。ここで、状態観測部17が観測する状態量としては、例えば、dq座標電流値idq(k)、回転機械装置3の回転機械パラメータ、回転機械装置3の磁束、出力トルク、回転機械装置3に流れる電流の高調波、および回転機械装置3への電流指令値idqref(k)に対するdq座標電流値idq(k)の立ち上がり時間の少なくとも何れか1つを含む。
【0083】
なお、回転機械装置3の回転機械パラメータとしては、例えば、回転機械装置3の抵抗、インダクタンス、慣性モーメントなどの値である。回転機械装置3の各パラメータは、状態観測部17において計算してもよいし、状態観測部17に入力するようにしてもよい。
【0084】
次に、この実施の形態2の特徴である機械学習器10Aとパターン決定部14Aの処理手順について、図7に示すフローチャートを参照して説明する。なお、以下で説明する処理手順は、本願の学習方法と電動機制御方法の一例である。そのため、各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。
【0085】
この実施の形態2においても、先の実施の形態1と同様に、機械学習Aにおいては予め用意した教師データに基づいた教師データ付き学習を行うが、教師データの作成方法が異なる。
【0086】
すなわち、実施の形態1において、機械学習器10は、教師データとしてパルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失が小さくするように電動機制御Bを実施するためのデータを取得していた。これに対して、この実施の形態2では、機械学習器10Aは、制御目標に応じて、スイッチング損失を小さくするだけでなく、これに加えて、回転機械装置3の駆動音、回転機械装置3の機械振動、回転機械装置3の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか1つを小さくするように電動機制御Bを実施した時のデータを取得する。
【0087】
したがって、先の実施の形態1では、スイッチング損失を小さくするための学習済みモデルを求めて一つのパターン生成関数のみを作成していたが、この実施の形態2では、制御目標に応じて、性能の異なる複数のパターン生成関数を作成して保存する。そのための教師データ付き学習により作成するパターン生成関数の保存方法と、電動機制御Bを実施するための学習済みモデルの取得方法について、次に説明する。
【0088】
ステップS2からS4では、実施の形態1と同様の手順により、教師データ付き学習によって学習済みモデルを作成する。
【0089】
ステップS10において、教師データ付き学習により作成した学習済みモデルをパターン生成関数として保存する。その後、ステップS1に戻り、予め用意した教師データを変更して、再度ステップS2からS4の教師データ付き学習を行い、スイッチング損失を小さくすることに加えて、回転機械装置3の駆動音の低減、回転機械装置3の機械振動の低減、回転機械装置3の電流高調波の低減、および電流指令値への電流検出値の追従時間の低減のうち少なくとも何れか1つ別の性能を有した学習済みモデルを作成し、これを別のパターン生成関数として保存する。
【0090】
教師データ付き学習は、予め用意した教師データ毎に、個別に複数の学習済みモデルを作成し、学習済みモデルに対応するパターン生成関数をすべて保存してもよい。あるいは、予め用意した全ての教師データの内から、必要な教師データのみを選択し、選択した教師データに基づいて複数の学習済みモデルを作成し、学習済みモデルに対応するパターン生成関数のみを保存するようにしてもよい。
【0091】
上述の教師データ付き学習を行うことにより、予め用意した教師データ毎のパターン生成関数を獲得して保存できる。その場合、制御目標に応じて、パターン生成関数として、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくすることに加えて、回転機械装置3の駆動音、回転機械装置3の機械振動、回転機械装置3の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか1つを小さくする性能を実現するように電力変換部12のスイッチングパターンSWP(k)を決定する関数を獲得することができる。
【0092】
次に、上述のように機械学習Aが行われた後に、学習済みモデルを用いて行われる電動機制御Bについて、図7の処理手順を示すフローチャートを参照して説明する。なお、以下で説明する処理手順は、本願の電動機制御方法の一例である。そのため、以下で説明する各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。
【0093】
まず、ステップS1では、機械学習Aを実行するか電動機制御Bを実行するかを判定する。機械学習Aを行う場合の処理については、実施の形態2における実施の形態1との差異を既に説明したので、ここでは電動機制御Bの処理を実施する場合(ステップS1:No)の実施の形態1との差異について説明する。
【0094】
ステップS11では、パターン決定部14Aは、制御目標を取得する。制御目標とは、前述したように、例えば、電力変換部12のスイッチング損失の低減、回転機械装置3の駆動音の低減、回転機械装置3の機械振動の低減、回転機械装置3の電流高調波の低減、電流指令値への電流検出値追従時間の低減などである。
【0095】
ステップS12では、パターン決定部14Aは、取得した制御目標に応じて、学習済みモデルの種類選択指令TSCを生成し、これを機械学習器10Aに出力する。この場合の学習済みモデルの種類選択指令TSCは、パターン生成関数記憶部10dにおいて、数字と関連付けされたテーブルとして保存された学習済みモデルを選択する指令である。例えば、学習済みモデルNo.1ではスイッチング損失を低減する学習済みモデル、学習済みモデルNo.2ではスイッチング損失と機械振動を低減する学習済みモデル、……といったように、制御目標に適合した学習済みモデルを読み出すための信号である。
【0096】
そして、機械学習器10Aは、ステップS10で保存した学習済みモデルの内から学習済みモデルの種類選択指令TSCに適合したパターン生成関数を出力するので、パターン決定部14Aは、このパターン生成関数を取得する。
【0097】
引き続いて、ステップS7では、パターン決定部14Aが、教師データ付き学習において使用した電流指令値idqref(k)、状態観測部17からの状態量、電力変換部12からの前回周期のスイッチング状態SW(k−1)を入力データとして取得する。この場合に入力データとして取得する値は、複数の学習済みモデルを獲得するために行った教師データ付き学習毎に使用した入力データを全て入力するようにしてもよいし、あるいは特定の学習済みモデルを獲得するために行った教師データ付き学習に使用した入力データのみを入力するようにしてもよい。
その後、ステップS8〜S9において、実施の形態1と同様の手順で回転機械装置3が駆動される。
【0098】
上述の電動機制御を行うことにより、実施の形態2の電力変換装置1は、制御目標に適合した学習済みモデルであるパターン生成関数を機械学習器10Aから読み出して、電力変換部12のスイッチングパターンSWP(k)が決定される。そのため、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくするだけでなく、これに加えて、回転機械装置3の駆動音、回転機械装置3の機械振動、回転機械装置3の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか1つを小さくするように回転機械装置3を駆動することが可能となる。
【0099】
なお、この実施の形態2では、パルス幅変調(PWM)方式よりもスイッチング損失を小さくすることをベースとした上で、複数の学習済みモデルの作成および使用方法について述べたが、これに限らず、他の変調方式に関わる性能をベースとして学習済みモデルを作成してもよい。
【0100】
実施の形態3.
この実施の形態3の電力変換装置は、パターン決定部に使用する教師データ付き学習を行ったパターン生成関数に対して、強化学習を行うものである。
【0101】
以下、実施の形態3に関わる電力変換装置と機械学習器の構成および動作について、電力変換装置の構成を示すブロック図である図8、電力変換装置と機械学習器の動作をフローチャートで示した図9に基づいて説明する。なお、この実施の形態3の電力変換装置において、実施の形態1および2と同一あるいは相当部分には、同一の符号を付す。
【0102】
この実施の形態3の電力変換装置の基本的な機能および構成は、上述した実施の形態1(図1)と共通するため、以下では重複する説明を省略し、ここでは実施の形態1と実施の形態3について相違する点について、以下、詳細に説明する。
【0103】
この実施の形態3のシステム全体は、図8に示すように、電力変換装置1、直流電源2、および回転機械装置3から構成される。
【0104】
電力変換装置1は、機械学習器10Bと、主回路である電力変換部12、電流検出部13、状態観測部17B、およびパターン決定部14Bを備えている。
【0105】
この実施の形態3では、教師データ付き学習を行った学習済みモデルであるパターン生成関数に基づいて電動機制御を実行しながら、パターン生成関数の強化学習を行うように構成されている。そのため、機械学習器10Bでは、報酬計算部10gおよび関数更新部10hが設けられている。
【0106】
ここで、まず、強化学習の概念について説明する。強化学習とは、与えられた環境において、価値を最大化するようにエージェントを学習させることである。すなわち、実施の形態3において、実施の形態1で作成した学習済みモデルよりも電力変換部12のスイッチング損失を小さくする(価値を最大化する)ように、回転機械装置3の状態(与えられた環境)に合わせて、電力変換部12のスイッチングパターンSWP(k)を適切に選択する学習済みモデル(エージェント)を生成するということである。
【0107】
図9は、図8における上述の教師データ付き学習を行った学習済みパターン生成関数の強化学習を行う処理手順の一例を説明するためのフローチャートである。なお、以下で説明する処理手順は、本願の強化学習の一例である。そのため、これらの手順の各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。
【0108】
まず、ステップS14では、パターン決定部14Bは、回転機械装置3の初期状態として、電流指令値idqref(k)、dq座標電流値idq(k)、前回周期のスイッチング状態SW(k−1)、教師データ付き学習により学習を行って獲得したパターン生成関数を取得する。なお、この初期状態として取得するこれらの値は、すべて0の状態からスタートしてもよいし、あるいは制御途中の値を用いてスタートしてもよい。
【0109】
ステップS15では、パターン決定部14Bは、ステップS14で取得した回転機械装置3の初期状態および機械学習器10Bで得られる今回のパターン生成関数に基づいて、スイッチングパターンSWP(k)を決定する。
【0110】
次に、ステップS16では、電力変換部12は、パターン決定部14Bの出力したスイッチングパターンSWP(k)に基づいて、回転機械装置3を駆動する。そして、機械学習器10Bは、電流指令値idqref(k)、状態観測部17Bから与えられるdq座標電流値idq(k)、および前回のスイッチングパターンSWP(k−1)と今回のスイッチングパターンSWP(k)との間における電力変換部12のスイッチング素子Q1〜Q6のオン/オフの回数の偏差を示すスイッチング遷移回数SWcountを取得する。
【0111】
ステップS17では、報酬計算部10gは、電流指令値idqref(k)とdq座標電流値idq(k)との電流偏差を計算し、電流偏差が規定値以内かどうかを判定する。電流偏差が規定値以内であると判定した場合には(ステップS17:Yes)、ステップS18に進んで、予め設定した報酬(変化量Δ1)を増やし、電流偏差が規定値を超えると判定した場合(ステップS17:No)には、ステップS19に進んで予め設定した報酬(変化量Δ1)を減らす。
【0112】
ステップS20では、報酬計算部10gは、状態観測部17Bから得られるスイッチング遷移回数SWcountが規定値以内かどうかを判定する。スイッチング遷移回数SWcountが規定値以内である場合には(ステップS20:Yes)、ステップS21に進んで予め設定した報酬(変化量Δ2)を増やし、スイッチング遷移回数SWcountが規定値を超えると判定した場合(ステップS20:No)には、ステップS22に進んで予め設定した報酬(変化量Δ2)を減らす。
【0113】
ステップS23では、関数更新部10hは、報酬計算部10gで得られた報酬(変化量Δ1、Δ2)に基づいて、パターン生成関数を構成するニューラルネットワークの各重みづけ係数とバイアスとを電流偏差を規定値の範囲内に維持しながら、スイッチング損失を小さくするように調整するために価値関数を更新する。そして、更新した価値関数に基づいて、パターン生成関数が更新される。
【0114】
ここに、前記のパターン生成関数の更新とは、パターン生成関数を構成するニューラルネットワークの各重みづけ係数とバイアスを調整することである。
その後は、ステップS15に戻り、更新したパターン生成関数に基づいてスイッチングパターンSWP(k)を決定し、同様の処理を繰り返す。
【0115】
上述の強化学習を行うことにより、実施の形態3の電力変換装置1は、実施の形態1において作成されるパルス幅変調(PWM)方式に関するパターン生成関数よりもさらにスイッチング損失を小さくするように、パターン生成関数が更新される。そのため、実施の形態1の教師データ付き学習で学習を行ったパターン生成関数よりも電力変換部12のスイッチング損失を小さくして、回転機械装置3を駆動することができる。
【0116】
なお、この実施の形態3では、実施の形態1の教師データ付き学習で学習を行った学習済みモデルの強化学習の方法について説明したが、実施の形態2の学習済みモデルを強化学習するようにしてもよい。
【0117】
すなわち、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくすることに加えて、回転機械装置3の駆動音、回転機械装置3の機械振動、回転機械装置3の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか1つを小さくすることができるパターン生成関数を強化学習し、さらに前記性能を向上させたパターン生成関数を作成するようにしてもよい。
また、強化学習を行ったパターン生成関数を学習済みモデルとして、実施の形態1または実施の形態2の機械学習器10、10Aにおいて使用してもよい。
【0118】
以上のように、この実施の形態3の電力変換装置1は、先の実施の形態1または実施の形態2において、教師データ付き学習を行った学習済みモデルを強化学習することにより、スイッチング損失に加えて、変調方式に関わる回転機械装置3の駆動音、回転機械装置3の機械振動、回転機械装置3の電流高調波、電流指令値への電流検出値の追従時間のうち少なくとも何れか1つをさらに小さくするように回転機械装置3を駆動することができる。
【0119】
実施の形態4.
この実施の形態4の電力変換装置は、実施の形態1の電力変換装置1に備えられている電力変換部12のスイッチング状態を電圧指令値に基づいて計算する構成となっている。電力変換部12のスイッチング状態を電圧指令値に基づいて算出することで、電流指令値idqref(k)に対するdq座標電流値idq(k)の時定数を設計通りにでき、さらに電動機の速度指令から電圧指令値を計算する、電流指令値を介さない制御方式にも適用できるようになる。
【0120】
以下、実施の形態4の電力変換装置と機械学習器の構成について、電力変換装置の構成を示すブロック図である図10、機械学習器の構成を示すブロック図である図11に基づいて説明する。
なお、電力変換装置を実現するハードウェア構成図は図2、電力変換装置と機械学習器の動作フローチャートは図3、機械学習器を実現するハードウェア構成図は図5であり、実施の形態1と共通する。そのため、以下では、実施の形態1と重複する説明を省略し、実施の形態1と相違する点について、詳細に説明する。また、実施の形態4の電力変換装置において、実施の形態1と同一あるいは相当部分には、同一の符号を付す。
【0121】
この実施の形態4のシステム全体は、図10に示すように、電力変換装置1、直流電源2、および回転機械装置3から構成される。
【0122】
電力変換装置1は、機械学習器610、uvw/dq変換器11、主回路である電力変換部12、電流検出部13、パターン決定部614、PI(Proportional Integral)電流制御器618を備える。実施の形態1と比較すると電力変換装置1はPI電流制御器618をさらに備えた構成となっている。
【0123】
図10では、電圧指令値vdqref(k)を計算するために、電流指令値idqref(k)とdq座標電流値idq(k)からPI電流制御器618により計算している。しかし、PI電流制御器618ではなく、P(Proportional)電流制御器、I(Integral)電流制御器、PID(Proportional Integral Differential)電流制御器、I−P(Integral−Proportional)電流制御器を用いてもよく、V/f制御のような制御方式にて速度指令値から電圧指令値を計算するようにしてもよい。また、図10では、電圧指令値としてdq座標の電圧指令値vdqref(k)を使用しているが、αβ座標の電圧指令値、uvw座標の電圧指令値を使用してもよい。
【0124】
次に、この実施の形態4で使用される機械学習器610の構成について説明する。
図11に示すように、機械学習器610は、入力データ取得部610a、ラベル取得部10b、学習部10c、およびパターン生成関数記憶部10dを含んで構成される。この実施の形態4では実施の形態1と比較して、入力データ取得部610aにて取り扱うデータが変更されるため、変更される内容を主として説明する。
【0125】
機械学習器610は、予め用意した教師データに基づいて教師データ付き学習を行う。教師データ付き学習の方法は実施の形態1と同様のため、ここでは説明を省略する。
【0126】
機械学習器610の教師データに含まれる入力データは、電圧指令値vdqref(k)と、電力変換部12の前回周期のスイッチング状態SW(k−1)である。
【0127】
図11のように、予め用意した教師データに基づいて学習部10cにて教師データ付き学習を実施することで、電圧指令値vdqref(k)と前回周期のスイッチング状態SW(k−1)からスイッチングパターンSWP(k)を決定する学習済みモデルが作成できる。
【0128】
この実施の形態4における機械学習と電動機制御の動作は、図3のフローチャートと同様であり、実施の形態1との相違点は、ステップS2において電圧指令値vdqref(k)と前回周期のスイッチング状態SW(k−1)を入力データとして取得すること、および、ステップS7において電圧指令値vdqref(k)と前回周期のスイッチング状態SW(k−1)を入力データとして取得することである。
【0129】
この実施の形態4は、電圧指令値vdqref(k)と前回周期のスイッチング状態SW(k−1)、および学習済みモデルであるパターン生成関数に基づいて、スイッチングパターンSWP(k)を計算するため、電流指令値idqref(k)に対する電動機のdq座標電流値idq(k)の時定数をPI電流制御器618が設計できるようになる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式においても適用可能な構成である。
【0130】
以上のように、この実施の形態4の電力変換装置1は、回転機械装置3に流れる電流を検出する電流検出部13と、スイッチングパターンを決定するためのパターン生成関数を出力する機械学習器610と、電流指令値idqref(k)およびdq座標電流値idq(k)から電圧指令値vdqref(k)を計算するPI電流制御器618と、電圧指令値vdqref(k)、電力変換部12の前回周期のスイッチング状態SW(k−1)、および機械学習器610からのパターン生成関数に基づいてスイッチングパターンを決定するパターン決定部614と、スイッチングパターンに応じてスイッチング素子Q1〜Q6を制御して回転機械装置3に交流電力を出力する電力変換部12とを備え、機械学習器610は、電力変換部12のスイッチング損失がパルス幅変調(PWM)方式よりも小さくなるように教師データ付き学習を行ってパターン生成関数を出力し、これに応じてパターン決定部614が電力変換部12のスイッチング状態を決定する。
【0131】
このため、実施の形態4の電力変換装置1は、実施の形態1と同様の効果を奏するとともに、実施の形態1と比較して、電流指令値idqref(k)に対する回転機械装置3のdq座標電流値idq(k)の時定数をPI電流制御器618が設計できるようになる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式においても適用可能な構成である。
【0132】
なお、前記の実施の形態4の説明では、機械学習器610における教師データ付き学習による学習済みモデルの作成は、予め用意した教師データを使用しているが、これに限らず、電動機制御Bを行いながら、教師データを測定して教師データ付き学習を行うようにしてもよいし、機械学習器610を電力変換装置1に含まずに、パターン生成関数のみを電力変換装置1のパターン決定部614が機械学習器610から取得する構成としてもよい。
【0133】
実施の形態5.
この実施の形態5の電力変換装置は、実施の形態2の電力変換装置1に備えられている電力変換部12のスイッチングパターンを電圧指令値に基づいて計算する構成となっている。電力変換部12のスイッチングパターンを電圧指令値に基づいて算出することで、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式にも適用できる。そして、このような制御方式においても電力変換部12のスイッチング損失の低減、回転機械装置3の駆動音の低減、回転機械装置3の機械振動の低減、回転機械装置3の電流高調波の低減、電流指令値への電流検出値追従時間の低減効果が得られる。
【0134】
以下、この実施の形態5に関わる電力変換装置の構成について、電力変換装置の構成を示すブロックである図12に基づいて説明する。機械学習器の構成は図11、電力変換装置と機械学習器の動作フローチャートは図7であり、実施の形態2または実施の形態4と共通する。そのため、以下では、重複する説明を省略し、実施の形態2または実施の形態4と相違する点について、詳細に説明する。なお、実施の形態5の電力変換装置において、実施の形態2または実施の形態4と同一あるいは相当部分には、同一の符号を付す。
【0135】
この実施の形態5のシステム全体は、図12に示すように、電力変換装置1、直流電源2、および回転機械装置3から構成される。
【0136】
この実施の形態5の電力変換装置1は、機械学習器710、主回路である電力変換部12、電流検出部13、パターン決定部714、速度検出部15、位置検出部16、状態観測部17、およびV/f制御器719を備える。実施の形態2と比較するとV/f制御器719をさらに備えた構成となっている。
【0137】
図12では、Vf電圧指令値vfref(k)を、電動機の速度指令値wref(k)からV/f制御器719により計算している。しかし、V/f制御器719ではなく、電流指令値idqref(k)とdq座標電流値idq(k)からPI電流制御器618、P電流制御器、I電流制御器、PID電流制御器、I−P電流制御器により電圧指令値vdqref(k)を計算するようにしてもよく、また、電圧指令値をαβ座標の電圧指令値、uvw座標の電圧指令値に変更してもよい。
【0138】
この実施の形態5で使用される機械学習器710は、実施の形態4の図11の構成と同様であるが、教師データに含まれる入力データとラベルデータについて、実施の形態2と同様に制御目標に応じて予め用意した教師データ毎に、学習部が個別に複数の学習済みモデルを作成する。
【0139】
この実施の形態5における機械学習と電動機制御は、電力変換装置と機械学習器の動作フローチャートの図7と同様である。実施の形態2との相違点は、ステップS2において少なくともVf電圧指令値vfref(k)と前回周期のスイッチング状態SW(k−1)を入力データとして取得し、ステップS7においては、ステップS12にて取得した学習済みモデルに対応して少なくともVf電圧指令値vfref(k)と前回周期のスイッチング状態SW(k−1)を入力データとして取得することである。
【0140】
この実施の形態5は、Vf電圧指令値vfref(k)と制御目標に適合したパターン生成関数を機械学習器710から読み出して、電力変換部12のスイッチングパターンSWP(k)を決定する。そのため、V/f制御器719のような電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式においても、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくするだけでなく、これに加えて、回転機械装置3の駆動音、回転機械装置3の機械振動、回転機械装置3の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか1つを小さくするように回転機械装置3を駆動する効果が得られる。
【0141】
なお、前記の実施の形態5の説明では、V/f制御器719により計算したVf電圧指令値Vfref(k)に基づいてスイッチングパターンSWP(k)を計算するように説明したが、電流指令値idqref(k)とdq座標電流値idq(k)からPI電流制御器618により電圧指令値vdqref(k)を計算して、電圧指令値vdqref(k)からスイッチングパターンSWP(k)を計算するようにしてもよい。
【0142】
実施の形態6.
この実施の形態6の電力変換装置は、実施の形態3の電力変換装置1に備えられている電力変換部12のスイッチングパターンを電圧指令値に基づいて計算する構成となっている。電力変換部12のスイッチングパターンを電圧指令値に基づいて算出することで、電流指令値idqref(k)に対するdq座標電流値idq(k)の時定数を設計通りにしたまま、パターン決定部に使用する教師データ付き学習を行ったパターン生成関数に対して、強化学習を行うことができる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式にも適用できる。
【0143】
以下、この実施の形態6に関わる電力変換装置の構成について、電力変換装置の構成を示すブロックである図13に基づいて説明する。電力変換装置と機械学習器の動作フローチャートは図9に示しており、実施の形態3と共通する。そのため、以下では、重複する説明を省略し、実施の形態3と相違する点について、詳細に説明する。なお、実施の形態6の電力変換装置において、実施の形態3と同一あるいは相当部分には、同一の符号を付す。
【0144】
この実施の形態6のシステム全体は、図13に示すように、電力変換装置1、直流電源2、および回転機械装置3から構成される。
【0145】
電力変換装置1は、機械学習器810と、主回路である電力変換部12、電流検出部13、状態観測部17、PI電流制御器618、およびパターン決定部814を備えている。実施の形態3と比較するとPI電流制御器618をさらに備えた構成となっている。
【0146】
図13では、電圧指令値vdqref(k)を計算するために、電流指令値idqref(k)とdq座標電流値idq(k)からPI電流制御器618により計算している。しかし、PI電流制御器618ではなく、P電流制御器、I電流制御器、PID電流制御器、I−P電流制御器を用いてもよく、V/f制御のような制御方式にて速度指令値から電圧指令値を計算するようにしてもよい。本実施の形態では、dq座標の電圧指令値としているが、αβ座標の電圧指令値、uvw座標の電圧指令値に変更してもよい。
【0147】
この実施の形態6における強化学習と電動機制御は、電力変換装置と機械学習器の動作フローチャートの図9とほぼ同様であるが、実施の形態3との相違点は、ステップS15においてパターン決定部814は、ステップS14で取得した回転機械装置3の初期状態の電流指令値idqref(k)とdq座標電流値idq(k)をPI電流制御器618により計算した電圧指令値vdqref(k)と、機械学習器810で得られる今回のパターン生成関数に基づいて、スイッチングパターンSWP(k)を決定することである。
【0148】
この実施の形態6により、実施の形態4において作成されるパルス幅変調(PWM)方式に関するパターン生成関数よりもさらにスイッチング損失を小さくするように、学習済みモデルであるパターン生成関数が更新されるため、実施の形態4の教師データ付き学習で得られた学習済みモデルよりも電力変換部12のスイッチング損失を小さくして、回転機械装置3を駆動することができる。
【0149】
なお、この実施の形態6では、実施の形態4の教師データ付き学習で得られた学習済みモデルの強化学習の方法について説明したが、実施の形態5の学習済みモデルを強化学習するようにしてもよい。
【0150】
すなわち、パルス幅変調(PWM)方式よりも電力変換部12のスイッチング損失を小さくすることに加えて、回転機械装置3の駆動音、回転機械装置3の機械振動、回転機械装置3の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか1つを小さくすることができるパターン生成関数を強化学習し、さらに前記性能を向上させたパターン生成関数を作成するようにしてもよい。
また、強化学習を行ったパターン生成関数を学習済みモデルとして、実施の形態4の機械学習器610または実施の形態5の機械学習器710に使用してもよい。
【0151】
以上のように、この実施の形態6の電力変換装置1は、先の実施の形態4または実施の形態5において、教師データ付き学習を行った学習済みモデルを強化学習することにより、スイッチング損失に加えて、変調方式に関わる回転機械装置6の駆動音、回転機械装置6の機械振動、回転機械装置6の電流高調波、電流指令値への電流検出値の追従時間のうち少なくとも何れか1つをさらに小さくするように回転機械装置3を駆動することができる。さらに、実施の形態3と比較すると、電力変換部12のスイッチングパターンを電圧指令値に基づいて算出することで、電流指令値idqref(k)に対するdq座標電流値idq(k)の時定数を設計通りにしたまま、パターン決定部814に使用する教師データ付き学習を行ったパターン生成関数に対して、強化学習を行うことができる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式にも適用できる。
【0152】
本願は、様々な例示的な実施の形態及び実施例が記載されているが、1つ、または複数の実施の形態に記載された様々な特徴、態様、及び機能は特定の実施の形態の適用に限られるのではなく、単独で、または様々な組み合わせで実施の形態に適用可能である。
従って、例示されていない無数の変形例が、本願に開示される技術の範囲内において想定される。例えば、少なくとも1つの構成要素を変形する場合、追加する場合または省略する場合、さらには、少なくとも1つの構成要素を抽出し、他の実施の形態の構成要素と組み合わせる場合が含まれるものとする。
【符号の説明】
【0153】
1 電力変換装置、2 直流電源、3 回転機械装置、10,10A,10B,610,710,810 機械学習器、10a,610a 入力データ取得部、10b ラベル取得部、10c 学習部、10d パターン生成関数記憶部、10g 報酬計算部、10h 関数更新部、11 uvw/dq変換器、12 電力変換部、12a スイッチング素子、13 電流検出部、14,14A,14B,614,714,814 パターン決定部、20,30 プロセッサ、21,31 記憶装置、15 速度検出部、16 位置検出部、17,17B 状態観測部、311 揮発性記憶装置、312 補助記憶装置、618 PI電流制御器、719 V/f制御器。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15