特許6987304 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許6987304電力変換装置、機械学習器、および学習済みモデルの生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6987304

(24)【登録日】2021年12月2日

(45)【発行日】2021年12月22日

(54)【発明の名称】電力変換装置、機械学習器、および学習済みモデルの生成方法

(51)【国際特許分類】

H02M 7/48 20070101AFI20211213BHJP

H02P 27/06 20060101ALI20211213BHJP

G06N 20/00 20190101ALI20211213BHJP

【ＦＩ】

H02M7/48 E

H02P27/06

G06N20/00 130

【請求項の数】15

【全頁数】26

(21)【出願番号】特願2021-515920(P2021-515920)

(86)(22)【出願日】2020年3月31日

(86)【国際出願番号】JP2020014808

(87)【国際公開番号】WO2020217879

(87)【国際公開日】20201029

【審査請求日】2021年3月2日

(31)【優先権主張番号】特願2019-81821(P2019-81821)

(32)【優先日】2019年4月23日

(33)【優先権主張国】JP

(73)【特許権者】

【識別番号】000006013

【氏名又は名称】三菱電機株式会社

(74)【代理人】

【識別番号】110002941

【氏名又は名称】特許業務法人ぱるも特許事務所

(72)【発明者】

【氏名】樋渡天次郎

(72)【発明者】

【氏名】佐野壮太

(72)【発明者】

【氏名】楠部真作

【審査官】栗栖正和

(56)【参考文献】

【文献】特開平０３−１２４２６６（ＪＰ，Ａ）

【文献】特開平０８−１７２７９６（ＪＰ，Ａ）

【文献】特開平０８−１４９８８４（ＪＰ，Ａ）

【文献】特開２０１７−０８３２３７（ＪＰ，Ａ）

【文献】国際公開第２０１３／１１０５３２（ＷＯ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｈ０２Ｍ７／４８

Ｈ０２Ｐ２７／０６

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

複数のスイッチング素子を備え、直流電力を交流電力に変換して回転機械装置に供給する電力変換部と、前記回転機械装置に流れる電流を検出する電流検出部と、設定された制御周期ごとに、機械学習器から与えられるパターン生成関数に基づいて、前記複数のスイッチング素子における１周期分のスイッチング状態を決定し、前記１周期分のスイッチング状態の組み合わせから成るスイッチングパターンを生成して、前記電力変換部を出力制御するパターン決定部とを備え、
前記機械学習器は、教師データに含まれる、電流指令値および前記電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方に基づいて機械学習を実行して前記電力変換部のスイッチングパターンを決定する前記パターン生成関数を生成するものであり、
前記パターン決定部は、前記機械学習器から与えられる前記パターン生成関数と、前記電流指令値および前記電流検出値若しくは前記電圧指令値のいずれか一方とを共に入力して演算処理を実行して前記電力変換部のスイッチングパターンを決定するものである、電力変換装置。

【請求項2】

前記パターン決定部は、前記機械学習器から、前記電力変換部のスイッチング損失をパルス幅変調方式の場合よりも小さくするための前記パターン生成関数を取得する、請求項１に記載の電力変換装置。

【請求項3】

前記パターン決定部は、前記機械学習器から、前記回転機械装置の駆動音、前記回転機械装置の機械振動、前記回転機械装置に流れる電流に含まれる電流高調波、前記電流指令値への前記電流検出値の追従時間の内の少なくともいずれか１つをパルス幅変調方式の場合よりも小さくするための前記パターン生成関数を取得する、請求項１または請求項２に記載の電力変換装置。

【請求項4】

前記パターン決定部は、前記電力変換部のスイッチングパターンを決定する場合に、前記回転機械装置の磁束応答値、速度応答値、位置応答値、前記回転機械装置の磁束指令値、速度指令値、位置指令値、前記電力変換部の前回の制御周期内のスイッチング状態、および前記回転機械装置の回転機械パラメータの少なくともいずれか１つを状態量として取得する、請求項１から請求項３のいずれか１項に記載の電力変換装置。

【請求項5】

前記機械学習器をさらに備える請求項１から請求項４のいずれか１項に記載の電力変換装置。

【請求項6】

直流電力を交流電力に変換して回転機械装置に供給する電力変換部を構成する複数のスイッチング素子の設定された制御周期の１周期分のスイッチング状態の組み合わせから成るスイッチングパターンを決めるパターン生成関数を、教師データに基づいて機械学習を実行して出力するものであって、
前記教師データに含まれる電流指令値および前記回転機械装置に流れる電流を検出する電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方を入力データとして取得する入力データ取得部と、
前記教師データに含まれる前記電力変換部のスイッチングパターンをラベルとして取得するラベル取得部と、
前記入力データ取得部で得られた前記電流指令値および前記電流検出値、若しくは前記電圧指令値のいずれか一方と、前記ラベル取得部で得られたスイッチングパターンに基づいて前記電力変換部の前記スイッチング素子のスイッチングパターンを決める学習済みモデルを生成する学習部と、を備える機械学習器。

【請求項7】

前記入力データ取得部は、前記教師データに含まれる前記入力データとして、前回周期の前記電力変換部のスイッチング状態を取得するとともに、
前記ラベル取得部は、前記教師データに含まれる前記ラベルとして、前記前回周期の前記電力変換部のスイッチング状態に対応する今回周期の前記電力変換部のスイッチングパターンを取得する、請求項６に記載の機械学習器。

【請求項8】

前記入力データ取得部は、前記教師データに含まれる前記入力データとして、前記回転機械装置の磁束応答値、速度応答値、位置応答値、前記回転機械装置の磁束指令値、速度指令値、位置指令値、および前記回転機械装置の回転機械パラメータの少なくともいずれか１つを取得する、請求項６または請求項７に記載の機械学習器。

【請求項9】

前記ラベル取得部は、前記教師データに含まれる前記ラベルとして、前記電力変換部のスイッチング損失をパルス幅変調方式の場合よりも小さくするための前記スイッチングパターンを取得する、請求項６または請求項７に記載の機械学習器。

【請求項10】

前記ラベル取得部は、前記教師データに含まれる前記ラベルとして、前記回転機械装置に流れる電流に含まれる電流高調波、および前記電流指令値への前記電流検出値の追従時間のうち少なくともいずれか１つをパルス幅変調方式の場合よりも小さくするスイッチングパターンを取得する、請求項６、請求項７または請求項９のいずれか１項に記載の機械学習器。

【請求項11】

前記学習部は、前記電流指令値、前記電流検出値、または前記スイッチング状態に基づいて報酬を計算する報酬計算部と、前記報酬計算部から入力された前記報酬に基づいて前記パターン生成関数を更新する関数更新部を備える、請求項６から請求項１０のいずれか１項に記載の機械学習器。

【請求項12】

前記報酬計算部は、前記電力変換部におけるスイッチングパターンにおいて、前記電力変換部のスイッチング回数を現状よりも少なくしたら報酬を増やし、前記電流指令値に対する前記電流検出値の差が規定値を超えたら現状よりも報酬を減らす、請求項１１に記載の機械学習器。

【請求項13】

前記報酬計算部は、前記電力変換部におけるスイッチングパターンにおいて、前記回転機械装置の機械振動を現状よりも小さくしたら報酬を増やす、請求項１２に記載の機械学習器。

【請求項14】

前記報酬計算部は、前記電力変換部におけるスイッチングパターンにおいて、前記回転機械装置の駆動音を現状よりも小さくしたら報酬を増やす、請求項１２または請求項１３に記載の機械学習器。

【請求項15】

請求項６から請求項１４のいずれか１項に記載の機械学習器を用いて機械学習を実施することにより、前記電力変換部を構成する前記スイッチング素子のスイッチングパターンを決定するための学習済みモデルを生成する、学習済みモデルの生成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本願は、電力変換装置、機械学習器、および学習済みモデルの生成方法に関するものである。

【背景技術】

【0002】

従来、多相交流の回転機械装置の駆動制御において、回転機械装置の駆動状態に基づいて、電力変換部のスイッチング状態を直接決定する瞬時電流制御があり、瞬時電流制御の１つとしてモデル予測制御が知られている。

【0003】

例えば、下記の特許文献１記載の従来技術においては、モデル予測制御に基づいた直接トルク制御が検討されている。この制御方式は、回転機械装置のトルクと固定子磁束の数ステップ先を予測しながら定められた許容幅内で制御する方式であり、数ステップの予測区間で各相スイッチの切り替え回数が最小となるスイッチングパターンを探索する。このため、モデル予測制御による過渡状態の高速なトルク応答時間を維持しながら、定常状態のスイッチング損失を低減することが期待される。

【0004】

また、下記の特許文献２記載の従来技術においては、機械学習器を備えたフィードバック制御系が検討されている。フィードバック制御によって計算した電力変換部のスイッチング状態とスイッチング状態を維持する時間に対して、機械学習器はスイッチング状態を維持する時間を調整する。これにより、過渡状態で発生する振動の抑制効果が期待されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２０１１−１５２０３８号公報

【特許文献2】特開２０１２−２１３２５８号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

特許文献１に記載されているようなモデル予測制御に基づいた直接トルク制御は、過渡状態の高速なトルク応答時間を維持しながら、定常状態のスイッチング損失を低減することが期待される。しかしながら、スイッチング損失低減の効果をさらに高めようとした場合には、より長い区間を予測しなければならず、予測する区間を徒に拡張すると、演算量が指数関数的に増大するため、実機実装を考えた場合には、予測する区間を拡張してスイッチング損失を低減するには自ずと限界がある。

【0007】

また、特許文献２に記載されているような機械学習器を備えたフィードバック制御系は、過渡状態で発生する振動が抑制されるものの、機械学習器は電力変換部のスイッチング状態を維持する時間のみを調整し、電力変換部のスイッチング状態を調整または決定しないため、電力変換部の変調方式に関わるスイッチング損失、電流高調波、および駆動音を考慮することが困難である。

【0008】

本願は、前記のような課題を解決するための技術を開示するものであり、電力変換部の変調方式に関わる性能を考慮しつつ、ユーザの要望と制御対象となる回転機械装置の状態に合わせてスイッチングパターンを決定することができる電力変換装置、機械学習器、および学習済みモデルの生成方法を提供することを目的とする。

【課題を解決するための手段】

【0009】

本願に開示される電力変換装置は、複数のスイッチング素子を備え、直流電力を交流電力に変換して回転機械装置に供給する電力変換部と、前記回転機械装置に流れる電流を検出する電流検出部と、設定された制御周期ごとに、機械学習器から与えられるパターン生成関数に基づいて、前記複数のスイッチング素子における１周期分のスイッチング状態を決定し、前記１周期分のスイッチング状態の組み合わせから成るスイッチングパターンを生成して、前記電力変換部を出力制御するパターン決定部とを備え、
前記機械学習器は、教師データに含まれる、電流指令値および前記電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方に基づいて機械学習を実行して前記電力変換部のスイッチングパターンを決定する前記パターン生成関数を生成するものであり、
前記パターン決定部は、前記機械学習器から与えられる前記パターン生成関数と、前記電流指令値および前記電流検出値若しくは前記電圧指令値のいずれか一方とを共に入力して演算処理を実行して前記電力変換部のスイッチングパターンを決定するものである。

【0010】

また、本願に開示される機械学習器は、直流電力を交流電力に変換して回転機械装置に供給する電力変換部を構成する複数のスイッチング素子の設定された制御周期の１周期分のスイッチング状態の組み合わせから成るスイッチングパターンを決めるパターン生成関数を、教師データに基づいて機械学習を実行して出力するものであって、
前記教師データに含まれる電流指令値および前記回転機械装置に流れる電流を検出する電流検出部で検出された電流検出値、若しくは電圧指令値のいずれか一方を入力データとして取得する入力データ取得部と、
前記教師データに含まれる前記電力変換部のスイッチングパターンをラベルとして取得するラベル取得部と、
前記入力データ取得部で得られた前記電流指令値および前記電流検出値、若しくは前記電圧指令値のいずれか一方と、前記ラベル取得部で得られたスイッチングパターンに基づいて前記電力変換部の前記スイッチング素子のスイッチングパターンを決める学習済みモデルを生成する学習部と、を備える。

【0011】

さらに、本願に開示される学習済みモデルの生成方法は、前記機械学習器を用いて機械学習を実施することにより、前記電力変換部を構成する前記スイッチング素子のスイッチングパターンを決定するための学習済みモデルを生成する。

【発明の効果】

【0012】

本願に開示される電力変換装置、機械学習器、学習済みモデルの生成方法によれば、電力変換部の変調方式に関わる性能を考慮しつつ、ユーザの要望と制御対象となる回転機械装置の状態に合わせてスイッチングパターンを決定することができる。

【図面の簡単な説明】

【0013】

【図1】本願の実施の形態１による電力変換装置の構成を示すブロック図である。

【図2】本願の実施の形態１による電力変換装置を実現するハードウェア構成図である。

【図3】本願の実施の形態１による電力変換装置の動作例を示すフローチャートである。

【図4】本願の実施の形態１による機械学習器の構成を示すブロック図である。

【図5】本願の実施の形態１による機械学習器を実現するハードウェア構成図である。

【図6】本願の実施の形態２による電力変換装置の構成を示すブロック図である。

【図7】本願の実施の形態２による電力変換装置の動作例を示すフローチャートである。

【図8】本願の実施の形態３による電力変換装置の構成を示すブロック図である。

【図9】本願の実施の形態３による電力変換装置の動作例を示すフローチャートである。

【図10】本願の実施の形態４による電力変換装置の構成を示すブロック図である。

【図11】本願の実施の形態４による機械学習器を実現するハードウェア構成図である。

【図12】本願の実施の形態５による電力変換装置の構成を示すブロック図である。

【図13】本願の実施の形態６による電力変換装置の構成を示すブロック図である。

【図14】本願の実施の形態１による電力変換部のスイッチング状態の一例を示す図である。

【図15】本願の実施の形態１によるスイッチングパターンを説明する図である。

【発明を実施するための形態】

【0014】

実施の形態１．
この実施の形態１に関わる電力変換装置と機械学習器の構成および動作について、電力変換装置の構成を示すブロック図である図１、電力変換装置を実現するハードウェア構成図である図２、電力変換装置と機械学習器の動作をフローチャートで示した図３、機械学習器の構成を示すブロック図である図４、機械学習器を実現するハードウェア構成図である図５に基づいて説明する。

【0015】

この実施の形態１のシステム全体は、図１に示すように、電力変換装置１、直流電源２、および回転機械装置３から構成される。

【0016】

電力変換装置１は、直流電源２と回転機械装置３との間に接続され、直流電源２からの直流電力を交流電力に変換して回転機械装置３に出力して回転機械装置３を駆動する。回転機械装置３は、電力変換装置１から出力された交流電力を動力に変換する。なお、ここで使用される回転機械装置３は、例えば誘導電動機、同期電動機等の各種の電動機を用いることができる。

【0017】

電力変換装置１は、機械学習器１０、ｕｖｗ／ｄｑ変換器１１、主回路である電力変換部１２、電流検出部１３、およびパターン決定部１４を備える。

【0018】

電流検出部１３は、電力変換部１２が回転機械装置３に出力している三相分の電流値ｉｕ（ｋ）、ｉｖ（ｋ）、ｉｗ（ｋ）を検出する。ｕｖｗ／ｄｑ変換器１１は、検出した電流値ｉｕ（ｋ）、ｉｖ（ｋ）、ｉｗ（ｋ）をｄｑ座標上の電流値であるｉｄ（ｋ）、ｉｑ（ｋ）に変換する。

【0019】

パターン決定部１４は、制御周期ごとに、ｕｖｗ／ｄｑ変換器１１の出力である電流値ｉｄ（ｋ）、ｉｑ（ｋ）、電流指令値ｉｄｒｅｆ（ｋ）、ｉｑｒｅｆ（ｋ）、前回周期のスイッチング状態ＳＷｕ（ｋ−１）、ＳＷｖ（ｋ−１）、ＳＷｗ（ｋ−１）、および後で詳述する機械学習器１０が出力したパターン生成関数に基づいて、電力変換部１２のスイッチングパターンＳＷＰ（ｋ）を決定する。なお、実施の形態１の図面（図１、図３、図４）において、また、実施の形態１以外の図面においても、パターン生成関数を、表記の簡易化のため、ＰＧＦと表している。

【0020】

また、スイッチングパターンＳＷＰ（ｋ）は、制御周期の１周期分のスイッチング状態の組み合わせから成るものであり、詳細は後述する。また、（ｋ−１）、（ｋ）の表記は、制御周期ごとの離散時間信号を表しており、（ｋ−１）は前回値、（ｋ）は現在値、（ｋ＋１）は次回値である。これは図１および図１以降の図においても同様である。

【0021】

また、検出した電流値ｉｕ（ｋ）、ｉｖ（ｋ）、ｉｗ（ｋ）をまとめて記載する場合は、適宜、電流検出値ｉｕｖｗ（ｋ）と表記する。ｄｑ座標上の電流値であるｉｄ（ｋ）、ｉｑ（ｋ）をまとめて記載する場合は、適宜、ｄｑ座標電流値ｉｄｑ（ｋ）と記載する。電流指令値ｉｄｒｅｆ（ｋ）、ｉｑｒｅｆ（ｋ）をまとめて記載する場合は、適宜、電流指令値ｉｄｑｒｅｆ（ｋ）と表記する。前回周期（ｋ−１）のスイッチング状態ＳＷｕ（ｋ−１）、ＳＷｖ（ｋ−１）、ＳＷｗ（ｋ−１）をまとめて記載する場合は、適宜、前回周期のスイッチング状態ＳＷ（ｋ−１）と表記する。これらの表記は、図１および、図１以降の図においても同様である。

【0022】

電力変換装置１は、例えば、図２で示すハードウェア構成により実現される。
電力変換装置１は、電力変換部１２、電流検出部１３、電力変換部１２を制御するプロセッサ２０、およびプロセッサ２０が備える記憶装置２１で構成されている。

【0023】

電力変換部１２は、直流電源２の直流電力を三相交流電力に変換する三相インバータ回路により構成され、負荷である電動機などの回転機械装置３を駆動するものである。電力変換部１２は、それぞれダイオードＤが逆並列接続された複数のスイッチング素子Ｑ１〜Ｑ６を備える。本例では、Ｕ相の上アームおよび下アームはスイッチング素子Ｑ１およびＱ２を備え、Ｖ相の上アームおよび下アームはスイッチング素子Ｑ３およびＱ４を備え、Ｗ相の上アームおよび下アームはスイッチング素子Ｑ５およびＱ６を備える。そして、各相の上アームと下アームとの接続点からバスバーによって回転機械装置３の各相の入力端子に接続されている。

【0024】

記憶装置２１は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等の揮発性記憶装置と、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の不揮発性の補助記憶装置（いずれも図示省略）を備えている。なお、不揮発性の補助記憶装置としては、ＨＤＤの代わりにフラッシュメモリ等を使用してもよい。

【0025】

プロセッサ２０は、記憶装置２１から入力された制御プログラムを実行する。
記憶装置２１は補助記憶装置と揮発性記憶装置とを備えるため、プロセッサ２０には補助記憶装置から揮発性記憶装置を介して制御プログラムが入力される。
プロセッサ２０は、演算結果等のデータを記憶装置２１の揮発性記憶装置に出力してもよいし、揮発性記憶装置を介して補助記憶装置にこれらのデータを保存してもよい。

【0026】

上述したように、パターン決定部１４は、制御周期毎に１周期分のスイッチング状態の組み合わせから成るスイッチングパターンＳＷＰ（ｋ）を出力して電力変換部１２を制御する。
図１４は、電力変換部１２のスイッチング状態の一例を示す図である。スイッチング状態は、各スイッチング素子Ｑ１〜Ｑ６のオン（：１）とオフ（：０）の信号の組み合わせである。上アームおよび下アームのスイッチング素子Ｑ１〜Ｑ６の内、一方がオンで他方がオフとなる８通りのスイッチング状態（ＳＷ１〜ＳＷ８）と、電力変換装置１の動作停止時に全スイッチング素子Ｑ１〜Ｑ６をオフするスイッチング状態（ＳＷ０）の９通りのスイッチング状態がある。図１４のスイッチング状態ＳＷ１（ＳＷｕ１、ＳＷｖ１、ＳＷｗ１）では、スイッチング素子Ｑ１、Ｑ４、Ｑ６がオン、スイッチング素子Ｑ２、Ｑ３、Ｑ５がオフである。

【0027】

図１５は、スイッチングパターンＳＷＰ（ｋ）を説明する図である。スイッチングパターンＳＷＰ（ｋ）は１周期分のスイッチング状態の組み合わせであり、１周期Ｔを複数区間に分割し、区間毎に割り当てるスイッチング状態が決定される。この場合、スイッチングパターンＳＷＰ（ｋ）は、スイッチング状態ＳＷ３、ＳＷ４、ＳＷ２、ＳＷ２、ＳＷ６、ＳＷ７の順番で切り替わるように設定された、組み合わせである。
なお、１周期を予め決められた幅の区間に分割してスイッチング状態をそれぞれ割り当てるものでも、また、スイッチング状態を異なるスイッチング状態に切り替えるタイミング情報をスイッチング状態の情報に付加させても良い。

【0028】

図１５に示すように、電力変換部１２は、現時点ｔ（ｋ）において、スイッチング状態ＳＷ１で動作しており、１つ前のスイッチング状態は、ＳＷ７である。現時点ｔ（ｋ）のスイッチング状態ＳＷ１も前周期（ｋ−１）から継続するものであり、スイッチング状態ＳＷ１、ＳＷ７は、前周期（ｋ−１）内のスイッチング状態ＳＷ（ｋ−１）である。

【0029】

パターン決定部１４は、現時点ｔ（ｋ）のスイッチング状態ＳＷ１を含む、少なくとも１つの前周期（ｋ−１）内のスイッチング状態ＳＷ（ｋ−１）、例えばＳＷ１、ＳＷ７と、電流値ｉｄｑ（ｋ）と、電流指令値ｉｄｑｒｅｆ（ｋ）とに基づいて、パターン生成関数ＰＧＦにより、現周期（ｋ）の１周期分のスイッチングパターンＳＷＰ（ｋ）（：ＳＷ３、ＳＷ４、ＳＷ２、ＳＷ２、ＳＷ６、ＳＷ７）を生成する。スイッチングパターンＳＷＰ（ｋ）は１周期分のスイッチング状態の指令として電力変換部１２に与えられ、各スイッチング素子Ｑ１〜Ｑ６はオンオフ制御される。
そして、パターン決定部１４は、時点ｔ（ｋ＋１）において、次周期（ｋ＋１）のためのスイッチングパターンＳＷＰ（ｋ＋１）を生成する。

【0030】

この場合、パターン決定部１４が、前周期（ｋ−１）内の実際のスイッチング状態ＳＷ（ｋ−１）を電力変換部１２から受信して取得するものを図示したが、パターン決定部１４が前周期に生成したスイッチングパターンＳＷＰ（ｋ−１）内から、前周期（ｋ−１）内のスイッチング状態ＳＷ（ｋ−１）を取得しても良い。

【0031】

なお、通常、制御周期の１周期Ｔは１つのスイッチング状態の継続期間より格段と長いため、スイッチングパターンＳＷＰは、複数のスイッチング状態の組み合わせから成る。但し、制御周期がスイッチング状態の継続期間と同等に短縮可能な場合は、１つのスイッチング状態を１周期分としても良い。

【0032】

また、前周期内のスイッチング状態ＳＷ（ｋ−１）は、現時点のスイッチング状態のみでも適用可能であるが、複数個あるのが望ましい。また、制御周期が短い場合は、前周期内のスイッチング状態として直前周期（ｋ−１）に限らず、例えば２個前の周期（ｋ−２）のスイッチング状態を併せて採用しても良い。

【0033】

次に、電力変換装置１の各部の機能、動作について、図１に基づいて説明する。
電力変換部１２は、直流電源２から供給された直流電力をパターン決定部１４で決定されたスイッチングパターンＳＷＰ（ｋ）に基づいて交流電力に変換し、回転機械装置３に出力する。スイッチングパターンＳＷＰ（ｋ）の決定方法については、後で説明する。

【0034】

電流検出部１３は、電力変換部１２と回転機械装置３の間の三相交流電流を検出し、これを電流検出値ｉｕｖｗ（ｋ）としてｕｖｗ／ｄｑ変換器１１に出力する。
ここで電流検出部１３には、ＣＴ（ＣｕｒｒｅｎｔＴｒａｎｓｆｏｒｍｅｒ）検出器、シャント抵抗等、いずれの電流検出部を用いてもよい。三相の電流の内、二相分の電流を検出し、残りの一相の電流を算出したものを用いてもよい。また、一つの電流検出部で三相交流電流値を復元する１シャント電流検出方式を用いてもよい。

【0035】

ｕｖｗ／ｄｑ変換器１１は、電流検出部１３で検出した電流値ｉｕｖｗ（ｋ）を二軸のｄｑ座標上の電流値ｉｄｑ（ｋ）に変換し、パターン決定部１４に出力する。このとき、ｕｖｗ／ｄｑ変換器１１に必要な回転機械装置３の磁極位置の位相情報は電力変換装置１内で生成した位相を用いることができる。回転機械装置３にエンコーダ等の位相および速度の検出器を設置している場合は、検出した位相を用いてもよい。

【0036】

この実施の形態１では、電流指令値がｄｑ座標上の電流指令値であるｉｄｑｒｅｆ（ｋ）の例を示しているため、電流検出値ｉｕｖｗ（ｋ）をｄｑ座標上の電流値ｉｄｑ（ｋ）に変換している。電流指令値が三相交流電流の指令値ｉｕｒｅｆ（ｋ）、ｉｖｒｅｆ（ｋ）、ｉｗｒｅｆ（ｋ）であれば、ｕｖｗ／ｄｑ変換器１１で電流検出値ｉｕｖｗ（ｋ）の座標変換は行わずにそのままパターン決定部１４に出力すればよい。

【0037】

また、電流指令値が二相交流電流ｉαｒｅｆ（ｋ）、ｉβｒｅｆ（ｋ）であれば、ｕｖｗ／ｄｑ変換器１１に代えて、ｕｖｗ／αβ変換器を用いて電流検出値ｉｕｖｗ（ｋ）をαβ座標上の電流値ｉα（ｋ）、ｉβ（ｋ）に変換してパターン決定部１４に出力すればよい。

【0038】

次に、この実施の形態１の電力変換装置１における動作例について、図３の処理手順を示すフローチャートを参照して説明する。なお、以下で説明する処理手順は、本願の学習方法と電動機制御方法の一例である。そのため、各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。

【0039】

まず、ステップＳ１では、機械学習Ａを実行するか電動機制御Ｂを実行するかを判定する。機械学習Ａを実行する場合（ステップＳ１：Ｙｅｓ）は、機械学習Ａを行い、学習済みモデルを作成する。機械学習Ａを実行しない場合（ステップＳ１：Ｎｏ）は、機械学習Ａを行った学習済みモデルを用いて電動機制御Ｂを実行する。この場合、機械学習Ａを行う場合の処理と、電動機制御Ｂを行う場合の処理とでそれぞれ処理内容が異なるため、まずは機械学習Ａを行う場合の処理手順について説明する。

【0040】

機械学習Ａは、図４の機械学習器１０の構成により実行される。
図４に示すように、機械学習器１０は、入力データ取得部１０ａ、ラベル取得部１０ｂ、学習部１０ｃ、およびパターン生成関数記憶部１０ｄを含んで構成される。

【0041】

機械学習器１０は、機械学習Ａを実施するに当たり、予め用意した教師データに基づいた教師データ付き学習を行う。なお、教師データ付き学習については後で説明する。
ここで教師データとして取得する制御方式は、三相の電圧指令値を正規化して三角波キャリア比較変調方式によりスイッチングパターンＳＷＰ（ｋ）を決定する、いわゆるパルス幅変調（ＰＷＭ：ＰｕｌｓｅＷｉｄｔｈＭｏｄｕｌａｔｉｏｎ）方式に比べて、電力変換部１２のスイッチング損失を小さくする制御方式であり、例えば、モデル予測制御（ＭｏｄｅｌＰｒｅｄｉｃｔｉｖｅＣｏｎｔｒｏｌ）、選択的高調波消去（ＳｅｌｅｃｔｉｖｅＨａｒｍｏｎｉｃＥｌｉｍｉｎａｔｉｏｎ）、低次高調波消去（Ｌｏｗ−ｏｒｄｅｒＨａｒｍｏｎｉｃＥｌｉｍｉｎａｔｉｏｎ）、最適パルスパターン（ＯｐｔｉｍｉｚｅｄＰｕｌｓｅＰａｔｔｅｒｎｓ）などの制御方式である。

【0042】

ステップＳ２では、機械学習器１０の入力データ取得部１０ａは、予め用意した教師データの中から電流指令値ｉｄｑｒｅｆ（ｋ）、ｄｑ座標電流値ｉｄｑ（ｋ）、前回周期のスイッチング状態ＳＷ（ｋ−１）を入力データとして取得し、学習部１０ｃに出力する。なお、入力データとして利用される前回周期のスイッチング状態ＳＷ（ｋ−１）は、例えば事前にモデル予測制御を実施した場合に得られるデータであって、図２の電力変換部１２のスイッチング素子Ｑ１〜Ｑ６をオン／オフ制御するためのデータである。

【0043】

ステップＳ３では、機械学習器１０のラベル取得部１０ｂは、予め用意した教師データの中からスイッチングパターンＳＷＰ（ｋ）をラベルとして取得し、学習部１０ｃに出力する。

【0044】

ステップＳ４では、機械学習器１０の学習部１０ｃは、入力データ取得部１０ａから入力された入力データと、ラベル取得部１０ｂから入力されたラベルとからなる１組のデータ（以下、教師データ組と称する）として取得し、教師データ付き学習を実行する。

【0045】

学習部１０ｃは、上述のように入力された教師データ組に基づいて教師データ付き学習を行うことにより、学習済みモデルを構築する。

【0046】

この実施の形態１における電動機制御Ｂを対象とした機械学習Ａは、パーセプトロンを組み合わせて構成したニューラルネットワークによる教師データ付き学習である。具体的には、電動機状態を示す入力データと電動機状態に応じたラベルとからなる教師データ組をニューラルネットワークに与え、ニューラルネットワークの出力がラベルと同じとなるように、各パーセプトロンについての重みづけを変更しながら学習を繰り返す。

【0047】

学習の過程では、バックプロパゲーション（Ｂａｃｋ−ｐｒｏｐａｇａｔｉｏｎ、誤差逆伝搬法とも呼ばれる）という処理を行うことを繰り返すことにより各パーセプトロンの出力の誤差を小さくするように重みづけ値を調整する。

【0048】

このようにして、教師データ組の特徴を学習し、入力から結果を推定するための学習済みモデルを帰納的に獲得する。すなわち、教師データ付き学習は、上述したように、重みづけ値を調整しながら、ラベルと出力データとの誤差がなくなるようにするものである。

【0049】

このように、学習部１０ｃにより実施される教師データ付き学習は、その学習結果として、パルス幅変調（ＰＷＭ）方式よりもスイッチング損失を小さくなるように電力変換部１２のスイッチング素子Ｑ１〜Ｑ６を制御するスイッチングパターンＳＷＰ（ｋ）を決定するための学習済みモデルが得られる。そして、学習部１０ｃが構築した学習済みモデルは、次段のパターン生成関数記憶部１０ｄに出力される。

【0050】

なお、学習部１０ｃが学習に用いるニューラルネットワークは三層であってもよいが、これ以上にさらに層を増やすようにしてもよい。いわゆるディープラーニング（深層学習とも呼ばれる。）により学習を行うようにしてもよい。

【0051】

ステップＳ５では、機械学習器１０のパターン生成関数記憶部１０ｄは、学習部１０ｃで教師データ付き学習により得られる学習済みモデルをパターン生成関数ＰＧＦとして保存する。なお、パターン生成関数ＰＧＦは、ステップＳ２からＳ５の処理を定期的に実行することで更新してもよい。

【0052】

パターン生成関数記憶部１０ｄに保存したパターン生成関数ＰＧＦは、後述の電動機制御Ｂを実行する際にパターン決定部１４に出力される。そして、パターン決定部１４では、パターン生成関数ＰＧＦ、ｄｑ座標電流値ｉｄｑ（ｋ）、電流指令値ｉｄｑｒｅｆ（ｋ）、前回周期のスイッチング状態ＳＷ（ｋ−１）に基づいて電力変換部１２のスイッチングパターンＳＷＰ（ｋ）が決定される。

【0053】

上述した処理を実現するための機械学習器１０は、例えば図５に示すハードウェア構成により実現される。すなわち、この機械学習器１０は、プロセッサ３０、およびプロセッサ３０が備える記憶装置３１で構成されている。

【0054】

記憶装置３１は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等の揮発性記憶装置３１１と、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の不揮発性の補助記憶装置３１２を備えている。なお、不揮発性の補助記憶装置３１２としては、ＨＤＤの代わりにフラッシュメモリ等を使用してもよい。

【0055】

プロセッサ３０は、記憶装置３１から入力された各種の学習プログラムを実行する。
記憶装置３１は、揮発性記憶装置３１１と補助記憶装置３１２を備えるため、プロセッサ３０には補助記憶装置３１２から揮発性記憶装置３１１を介して各種の学習プログラムが入力される。

【0056】

プロセッサ３０は、学習プログラムの学習結果等のデータを記憶装置３１の揮発性記憶装置３１１に出力してもよいし、揮発性記憶装置３１１を介して補助記憶装置３１２にこれらのデータを保存してもよい。

【0057】

学習プログラムは、教師データ付き学習の処理を機械学習器１０のプロセッサ３０に実行させ、機械学習Ａの結果として学習結果データを生成させるための命令を含むプログラムである。教師データは、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくするための電力変換部１２のスイッチングパターンＳＷＰ（ｋ）を獲得するように機械学習器１０によって機械学習Ａを実施するためのデータである。

【0058】

機械学習器１０は、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、サーバ装置等により実現できる。ただし、機械学習器１０については機械学習Ａに伴う演算量が多いため、例えば、ＰＣにＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔｓ）を搭載し、ＧＰＧＰＵ（Ｇｅｎｅｒａｌ−ＰｕｒｐｏｓｅｃｏｍｐｕｔｉｎｇｏｎＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔｓ）と呼ばれる技術により、ＧＰＵを機械学習Ａに伴う演算処理に利用して、高速に処理できるようにしてもよい。

【0059】

なお、機械学習器１０の具体的なハードウェア構成に関して、各種の実施の形態に応じて、適宜、構成要素の省略、置換および追加が可能である。例えば、機械学習器１０は、複数のプロセッサを含んでもよい。また、プロセッサ３０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等で構成されてもよい。

【0060】

次に、上述のように機械学習Ａが行われた後に、学習済みモデルを用いて行われる電動機制御Ｂの処理内容について、図３に示すフローチャートに戻って説明する。

【0061】

まず、ステップＳ１では、機械学習Ａを実行するか電動機制御Ｂを実行するかを判定する。機械学習Ａを実施する際の処理については上述にて説明しているため、ここでは電動機制御Ｂを行う場合（ステップＳ１：Ｎｏ）の処理内容について説明する。

【0062】

ステップＳ６では、パターン決定部１４は、機械学習器１０のパターン生成関数記憶部１０ｄに記憶されている学習済みモデルであるパターン生成関数ＰＧＦを取得する。

【0063】

次に、ステップＳ７では、パターン決定部１４は、電流指令値ｉｄｑｒｅｆ（ｋ）、ｄｑ座標電流値ｉｄｑ（ｋ）、電力変換部１２の前回周期のスイッチング状態ＳＷ（ｋ−１）を入力データとして取得する。

【0064】

ステップＳ８では、パターン決定部１４は、入力データ（電流指令値ｉｄｑｒｅｆ（ｋ）、ｄｑ座標電流値ｉｄｑ（ｋ）、電力変換部１２の前回周期のスイッチング状態ＳＷ（ｋ−１））、および機械学習器１０から得られるパターン生成関数ＰＧＦに基づいて、スイッチングパターンＳＷＰ（ｋ）を生成する。そして、生成したスイッチングパターンＳＷＰ（ｋ）は、電力変換部１２に出力される。

【0065】

ステップＳ９では、電力変換部１２は、パターン決定部１４から出力されたスイッチングパターンＳＷＰ（ｋ）に基づいて、回転機械装置３に交流電力を供給し、回転機械装置３は、電流指令値ｉｄｑｒｅｆ（ｋ）に対し、ｄｑ座標上のｄｑ座標電流値ｉｄｑ（ｋ）を追従させつつ、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくするように駆動される。

【0066】

以上のように、この実施の形態１の電力変換装置１は、回転機械装置３に流れる電流を検出する電流検出部１３と、スイッチングパターンを決定するためのパターン生成関数を出力する機械学習器１０と、電流指令値ｉｄｑｒｅｆ（ｋ）、ｄｑ座標電流値ｉｄｑ（ｋ）、電力変換部１２の前回周期のスイッチング状態ＳＷ（ｋ−１）、および機械学習器１０からのパターン生成関数に基づいてスイッチングパターンを決定するパターン決定部１４と、スイッチングパターンに応じてスイッチング素子Ｑ１〜Ｑ６を制御して回転機械装置３に交流電力を出力する電力変換部１２とを備え、機械学習器１０は、電力変換部１２のスイッチング損失がパルス幅変調（ＰＷＭ）方式よりも小さくなるように教師データ付き学習を行ってパターン生成関数を出力し、これに応じてパターン決定部１４が電力変換部１２のスイッチングパターンを決定する。

【0067】

このため、実施の形態１の電力変換装置１は、電流指令値ｉｄｑｒｅｆ（ｋ）に対し、ｄｑ座標電流値ｉｄｑ（ｋ）を追従させつつ、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくするように回転機械装置３を駆動することができる。

【0068】

なお、前記の実施の形態１の説明では、機械学習器１０における教師データ付き学習による学習済みモデルの作成は、予め用意した教師データを使用しているが、これに限らず、電動機制御Ｂを行いながら、教師データを測定して教師データ付き学習を行うようにしてもよい。また、機械学習器１０を電力変換装置１に含まずに、パターン生成関数のみを電力変換装置１のパターン決定部１４が機械学習器１０から取得する構成としてもよい。

【0069】

実施の形態２．
この実施の形態２の電力変換装置は、機械学習器において作成する学習済みモデルの性能として、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくすることに加えて、回転機械装置の駆動音、回転機械装置の機械振動、回転機械装置の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか１つをパルス幅変調（ＰＷＭ）方式に対して小さくするものを獲得できるようにしたものである。

【0070】

以下、この実施の形態２に関わる電力変換装置と機械学習器の構成および動作について、電力変換装置の構成を示すブロック図である図６、電力変換装置と機械学習器の動作をフローチャートで示した図７に基づいて説明する。なお、実施の形態２の電力変換装置において、実施の形態１と同一あるいは相当部分には、同一の符号を付す。

【0071】

この実施の形態２の電力変換装置の基本的な機能および構成は、上述した実施の形態１（図１）と共通するため、以下では、重複する説明を省略し、実施の形態１と実施の形態２について相違する点について、詳細に説明する。

【0072】

この実施の形態２のシステム全体は、図６に示すように、電力変換装置１、直流電源２、および回転機械装置３から構成される。

【0073】

電力変換装置１は、機械学習器１０Ａ、主回路である電力変換部１２、電流検出部１３、パターン決定部１４Ａ、速度検出部１５、位置検出部１６、および状態観測部１７を備える。

【0074】

先の実施の形態１では、パターン決定部１４には、電流指令値ｉｄｑｒｅｆ（ｋ）、ｄｑ座標電流値ｉｄｑ（ｋ）、前回周期のスイッチング状態ＳＷ（ｋ−１）、パターン生成関数が入力されていた。

【0075】

これに対して、この実施の形態２では、パターン決定部１４Ａには、予め設定された制御目標、電流指令値ｉｄｑｒｅｆ（ｋ）、前回周期のスイッチング状態ＳＷ（ｋ−１）、パターン生成関数、および後で詳述する状態観測部１７が出力する状態量がそれぞれ入力されている。

【0076】

ここに、前記の制御目標とは、例えば、電力変換部１２のスイッチング損失の低減、回転機械装置３の駆動音の低減、回転機械装置３の機械振動の低減、回転機械装置３の電流高調波の低減、および電流指令値への電流検出値追従時間の低減などを図るための目標値である。なお、この制御目標は、例えば、数字と関連付けされたテーブルとして、制御目標Ｎｏ．１ではスイッチング損失を低減、制御目標Ｎｏ．２では、スイッチング損失と機械振動を低減、のように予め設定してもよい。

【0077】

また、この実施の形態２において、パターン決定部１４Ａは、機械学習器１０Ａに対して学習済みモデルの種類選択指令を出力する。この学習済みモデルの種類選択指令は、前記の制御目標に適合した学習済みモデルの性能を選択して機械学習器１０Ａからパターン生成関数を読み出す指令であり、後の電動機制御Ｂの処理の際に説明する。なお、本実施の形態の図面（図６、図７）において、また、その他の実施の形態の図面においても、学習済みモデルの種類選択指令を、表記の簡易化のため、ＴＳＣと表している。

【0078】

次に、実施の形態１との差異である実施の形態２の速度検出部１５、位置検出部１６、状態観測部１７の機能について説明する。

【0079】

速度検出部１５は、回転機械装置３の機械的な速度情報ωｒｍ（ｋ）を検出して、状態観測部１７に出力する。なお、回転機械装置３の速度情報としては、電気的な速度情報ωｒｅ（ｋ）を検出してもよい。

【0080】

位置検出部１６は、回転機械装置３の機械的な位相情報θｒｍ（ｋ）を検出して、状態観測部１７に出力する。なお、回転機械装置３の位相情報としては、電気的な位相情報θｒｅ（ｋ）を検出してもよい。

【0081】

状態観測部１７は、電流検出部１３、速度検出部１５、および位置検出部１６によりそれぞれ検出した回転機械装置３の電流、速度、位相に基づいて、回転機械装置３の駆動状態を観測してその状態量を出力する。

【0082】

すなわち、状態観測部１７は、電流指令値ｉｄｑｒｅｆ（ｋ）、電流検出部１３から取得した電流検出値ｉｕｖｗ（ｋ）、速度検出部１５から取得した速度検出値ωｒｍ（ｋ）、および位置検出部１６から取得した位置検出値θｒｍ（ｋ）に基づいて、回転機械装置３の状態量を観測する。ここで、状態観測部１７が観測する状態量としては、例えば、ｄｑ座標電流値ｉｄｑ（ｋ）、回転機械装置３の回転機械パラメータ、回転機械装置３の磁束、出力トルク、回転機械装置３に流れる電流の高調波、および回転機械装置３への電流指令値ｉｄｑｒｅｆ（ｋ）に対するｄｑ座標電流値ｉｄｑ（ｋ）の立ち上がり時間の少なくとも何れか１つを含む。

【0083】

なお、回転機械装置３の回転機械パラメータとしては、例えば、回転機械装置３の抵抗、インダクタンス、慣性モーメントなどの値である。回転機械装置３の各パラメータは、状態観測部１７において計算してもよいし、状態観測部１７に入力するようにしてもよい。

【0084】

次に、この実施の形態２の特徴である機械学習器１０Ａとパターン決定部１４Ａの処理手順について、図７に示すフローチャートを参照して説明する。なお、以下で説明する処理手順は、本願の学習方法と電動機制御方法の一例である。そのため、各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。

【0085】

この実施の形態２においても、先の実施の形態１と同様に、機械学習Ａにおいては予め用意した教師データに基づいた教師データ付き学習を行うが、教師データの作成方法が異なる。

【0086】

すなわち、実施の形態１において、機械学習器１０は、教師データとしてパルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失が小さくするように電動機制御Ｂを実施するためのデータを取得していた。これに対して、この実施の形態２では、機械学習器１０Ａは、制御目標に応じて、スイッチング損失を小さくするだけでなく、これに加えて、回転機械装置３の駆動音、回転機械装置３の機械振動、回転機械装置３の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか１つを小さくするように電動機制御Ｂを実施した時のデータを取得する。

【0087】

したがって、先の実施の形態１では、スイッチング損失を小さくするための学習済みモデルを求めて一つのパターン生成関数のみを作成していたが、この実施の形態２では、制御目標に応じて、性能の異なる複数のパターン生成関数を作成して保存する。そのための教師データ付き学習により作成するパターン生成関数の保存方法と、電動機制御Ｂを実施するための学習済みモデルの取得方法について、次に説明する。

【0088】

ステップＳ２からＳ４では、実施の形態１と同様の手順により、教師データ付き学習によって学習済みモデルを作成する。

【0089】

ステップＳ１０において、教師データ付き学習により作成した学習済みモデルをパターン生成関数として保存する。その後、ステップＳ１に戻り、予め用意した教師データを変更して、再度ステップＳ２からＳ４の教師データ付き学習を行い、スイッチング損失を小さくすることに加えて、回転機械装置３の駆動音の低減、回転機械装置３の機械振動の低減、回転機械装置３の電流高調波の低減、および電流指令値への電流検出値の追従時間の低減のうち少なくとも何れか１つ別の性能を有した学習済みモデルを作成し、これを別のパターン生成関数として保存する。

【0090】

教師データ付き学習は、予め用意した教師データ毎に、個別に複数の学習済みモデルを作成し、学習済みモデルに対応するパターン生成関数をすべて保存してもよい。あるいは、予め用意した全ての教師データの内から、必要な教師データのみを選択し、選択した教師データに基づいて複数の学習済みモデルを作成し、学習済みモデルに対応するパターン生成関数のみを保存するようにしてもよい。

【0091】

上述の教師データ付き学習を行うことにより、予め用意した教師データ毎のパターン生成関数を獲得して保存できる。その場合、制御目標に応じて、パターン生成関数として、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくすることに加えて、回転機械装置３の駆動音、回転機械装置３の機械振動、回転機械装置３の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか１つを小さくする性能を実現するように電力変換部１２のスイッチングパターンＳＷＰ（ｋ）を決定する関数を獲得することができる。

【0092】

次に、上述のように機械学習Ａが行われた後に、学習済みモデルを用いて行われる電動機制御Ｂについて、図７の処理手順を示すフローチャートを参照して説明する。なお、以下で説明する処理手順は、本願の電動機制御方法の一例である。そのため、以下で説明する各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。

【0093】

まず、ステップＳ１では、機械学習Ａを実行するか電動機制御Ｂを実行するかを判定する。機械学習Ａを行う場合の処理については、実施の形態２における実施の形態１との差異を既に説明したので、ここでは電動機制御Ｂの処理を実施する場合（ステップＳ１：Ｎｏ）の実施の形態１との差異について説明する。

【0094】

ステップＳ１１では、パターン決定部１４Ａは、制御目標を取得する。制御目標とは、前述したように、例えば、電力変換部１２のスイッチング損失の低減、回転機械装置３の駆動音の低減、回転機械装置３の機械振動の低減、回転機械装置３の電流高調波の低減、電流指令値への電流検出値追従時間の低減などである。

【0095】

ステップＳ１２では、パターン決定部１４Ａは、取得した制御目標に応じて、学習済みモデルの種類選択指令ＴＳＣを生成し、これを機械学習器１０Ａに出力する。この場合の学習済みモデルの種類選択指令ＴＳＣは、パターン生成関数記憶部１０ｄにおいて、数字と関連付けされたテーブルとして保存された学習済みモデルを選択する指令である。例えば、学習済みモデルＮｏ．１ではスイッチング損失を低減する学習済みモデル、学習済みモデルＮｏ．２ではスイッチング損失と機械振動を低減する学習済みモデル、……といったように、制御目標に適合した学習済みモデルを読み出すための信号である。

【0096】

そして、機械学習器１０Ａは、ステップＳ１０で保存した学習済みモデルの内から学習済みモデルの種類選択指令ＴＳＣに適合したパターン生成関数を出力するので、パターン決定部１４Ａは、このパターン生成関数を取得する。

【0097】

引き続いて、ステップＳ７では、パターン決定部１４Ａが、教師データ付き学習において使用した電流指令値ｉｄｑｒｅｆ（ｋ）、状態観測部１７からの状態量、電力変換部１２からの前回周期のスイッチング状態ＳＷ（ｋ−１）を入力データとして取得する。この場合に入力データとして取得する値は、複数の学習済みモデルを獲得するために行った教師データ付き学習毎に使用した入力データを全て入力するようにしてもよいし、あるいは特定の学習済みモデルを獲得するために行った教師データ付き学習に使用した入力データのみを入力するようにしてもよい。
その後、ステップＳ８〜Ｓ９において、実施の形態１と同様の手順で回転機械装置３が駆動される。

【0098】

上述の電動機制御を行うことにより、実施の形態２の電力変換装置１は、制御目標に適合した学習済みモデルであるパターン生成関数を機械学習器１０Ａから読み出して、電力変換部１２のスイッチングパターンＳＷＰ（ｋ）が決定される。そのため、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくするだけでなく、これに加えて、回転機械装置３の駆動音、回転機械装置３の機械振動、回転機械装置３の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか１つを小さくするように回転機械装置３を駆動することが可能となる。

【0099】

なお、この実施の形態２では、パルス幅変調（ＰＷＭ）方式よりもスイッチング損失を小さくすることをベースとした上で、複数の学習済みモデルの作成および使用方法について述べたが、これに限らず、他の変調方式に関わる性能をベースとして学習済みモデルを作成してもよい。

【0100】

実施の形態３．
この実施の形態３の電力変換装置は、パターン決定部に使用する教師データ付き学習を行ったパターン生成関数に対して、強化学習を行うものである。

【0101】

以下、実施の形態３に関わる電力変換装置と機械学習器の構成および動作について、電力変換装置の構成を示すブロック図である図８、電力変換装置と機械学習器の動作をフローチャートで示した図９に基づいて説明する。なお、この実施の形態３の電力変換装置において、実施の形態１および２と同一あるいは相当部分には、同一の符号を付す。

【0102】

この実施の形態３の電力変換装置の基本的な機能および構成は、上述した実施の形態１（図１）と共通するため、以下では重複する説明を省略し、ここでは実施の形態１と実施の形態３について相違する点について、以下、詳細に説明する。

【0103】

この実施の形態３のシステム全体は、図８に示すように、電力変換装置１、直流電源２、および回転機械装置３から構成される。

【0104】

電力変換装置１は、機械学習器１０Ｂと、主回路である電力変換部１２、電流検出部１３、状態観測部１７Ｂ、およびパターン決定部１４Ｂを備えている。

【0105】

この実施の形態３では、教師データ付き学習を行った学習済みモデルであるパターン生成関数に基づいて電動機制御を実行しながら、パターン生成関数の強化学習を行うように構成されている。そのため、機械学習器１０Ｂでは、報酬計算部１０ｇおよび関数更新部１０ｈが設けられている。

【0106】

ここで、まず、強化学習の概念について説明する。強化学習とは、与えられた環境において、価値を最大化するようにエージェントを学習させることである。すなわち、実施の形態３において、実施の形態１で作成した学習済みモデルよりも電力変換部１２のスイッチング損失を小さくする（価値を最大化する）ように、回転機械装置３の状態（与えられた環境）に合わせて、電力変換部１２のスイッチングパターンＳＷＰ（ｋ）を適切に選択する学習済みモデル（エージェント）を生成するということである。

【0107】

図９は、図８における上述の教師データ付き学習を行った学習済みパターン生成関数の強化学習を行う処理手順の一例を説明するためのフローチャートである。なお、以下で説明する処理手順は、本願の強化学習の一例である。そのため、これらの手順の各処理は可能な限り変更されてもよく、また、実施の形態に応じて、適宜、処理の省略、置換、および追加が可能である。

【0108】

まず、ステップＳ１４では、パターン決定部１４Ｂは、回転機械装置３の初期状態として、電流指令値ｉｄｑｒｅｆ（ｋ）、ｄｑ座標電流値ｉｄｑ（ｋ）、前回周期のスイッチング状態ＳＷ（ｋ−１）、教師データ付き学習により学習を行って獲得したパターン生成関数を取得する。なお、この初期状態として取得するこれらの値は、すべて０の状態からスタートしてもよいし、あるいは制御途中の値を用いてスタートしてもよい。

【0109】

ステップＳ１５では、パターン決定部１４Ｂは、ステップＳ１４で取得した回転機械装置３の初期状態および機械学習器１０Ｂで得られる今回のパターン生成関数に基づいて、スイッチングパターンＳＷＰ（ｋ）を決定する。

【0110】

次に、ステップＳ１６では、電力変換部１２は、パターン決定部１４Ｂの出力したスイッチングパターンＳＷＰ（ｋ）に基づいて、回転機械装置３を駆動する。そして、機械学習器１０Ｂは、電流指令値ｉｄｑｒｅｆ（ｋ）、状態観測部１７Ｂから与えられるｄｑ座標電流値ｉｄｑ（ｋ）、および前回のスイッチングパターンＳＷＰ（ｋ−１）と今回のスイッチングパターンＳＷＰ（ｋ）との間における電力変換部１２のスイッチング素子Ｑ１〜Ｑ６のオン／オフの回数の偏差を示すスイッチング遷移回数ＳＷｃｏｕｎｔを取得する。

【0111】

ステップＳ１７では、報酬計算部１０ｇは、電流指令値ｉｄｑｒｅｆ（ｋ）とｄｑ座標電流値ｉｄｑ（ｋ）との電流偏差を計算し、電流偏差が規定値以内かどうかを判定する。電流偏差が規定値以内であると判定した場合には（ステップＳ１７：Ｙｅｓ）、ステップＳ１８に進んで、予め設定した報酬（変化量Δ１）を増やし、電流偏差が規定値を超えると判定した場合（ステップＳ１７：Ｎｏ）には、ステップＳ１９に進んで予め設定した報酬（変化量Δ１）を減らす。

【0112】

ステップＳ２０では、報酬計算部１０ｇは、状態観測部１７Ｂから得られるスイッチング遷移回数ＳＷｃｏｕｎｔが規定値以内かどうかを判定する。スイッチング遷移回数ＳＷｃｏｕｎｔが規定値以内である場合には（ステップＳ２０：Ｙｅｓ）、ステップＳ２１に進んで予め設定した報酬（変化量Δ２）を増やし、スイッチング遷移回数ＳＷｃｏｕｎｔが規定値を超えると判定した場合（ステップＳ２０：Ｎｏ）には、ステップＳ２２に進んで予め設定した報酬（変化量Δ２）を減らす。

【0113】

ステップＳ２３では、関数更新部１０ｈは、報酬計算部１０ｇで得られた報酬（変化量Δ１、Δ２）に基づいて、パターン生成関数を構成するニューラルネットワークの各重みづけ係数とバイアスとを電流偏差を規定値の範囲内に維持しながら、スイッチング損失を小さくするように調整するために価値関数を更新する。そして、更新した価値関数に基づいて、パターン生成関数が更新される。

【0114】

ここに、前記のパターン生成関数の更新とは、パターン生成関数を構成するニューラルネットワークの各重みづけ係数とバイアスを調整することである。
その後は、ステップＳ１５に戻り、更新したパターン生成関数に基づいてスイッチングパターンＳＷＰ（ｋ）を決定し、同様の処理を繰り返す。

【0115】

上述の強化学習を行うことにより、実施の形態３の電力変換装置１は、実施の形態１において作成されるパルス幅変調（ＰＷＭ）方式に関するパターン生成関数よりもさらにスイッチング損失を小さくするように、パターン生成関数が更新される。そのため、実施の形態１の教師データ付き学習で学習を行ったパターン生成関数よりも電力変換部１２のスイッチング損失を小さくして、回転機械装置３を駆動することができる。

【0116】

なお、この実施の形態３では、実施の形態１の教師データ付き学習で学習を行った学習済みモデルの強化学習の方法について説明したが、実施の形態２の学習済みモデルを強化学習するようにしてもよい。

【0117】

すなわち、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくすることに加えて、回転機械装置３の駆動音、回転機械装置３の機械振動、回転機械装置３の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか１つを小さくすることができるパターン生成関数を強化学習し、さらに前記性能を向上させたパターン生成関数を作成するようにしてもよい。
また、強化学習を行ったパターン生成関数を学習済みモデルとして、実施の形態１または実施の形態２の機械学習器１０、１０Ａにおいて使用してもよい。

【0118】

以上のように、この実施の形態３の電力変換装置１は、先の実施の形態１または実施の形態２において、教師データ付き学習を行った学習済みモデルを強化学習することにより、スイッチング損失に加えて、変調方式に関わる回転機械装置３の駆動音、回転機械装置３の機械振動、回転機械装置３の電流高調波、電流指令値への電流検出値の追従時間のうち少なくとも何れか１つをさらに小さくするように回転機械装置３を駆動することができる。

【0119】

実施の形態４．
この実施の形態４の電力変換装置は、実施の形態１の電力変換装置１に備えられている電力変換部１２のスイッチング状態を電圧指令値に基づいて計算する構成となっている。電力変換部１２のスイッチング状態を電圧指令値に基づいて算出することで、電流指令値ｉｄｑｒｅｆ（ｋ）に対するｄｑ座標電流値ｉｄｑ（ｋ）の時定数を設計通りにでき、さらに電動機の速度指令から電圧指令値を計算する、電流指令値を介さない制御方式にも適用できるようになる。

【0120】

以下、実施の形態４の電力変換装置と機械学習器の構成について、電力変換装置の構成を示すブロック図である図１０、機械学習器の構成を示すブロック図である図１１に基づいて説明する。
なお、電力変換装置を実現するハードウェア構成図は図２、電力変換装置と機械学習器の動作フローチャートは図３、機械学習器を実現するハードウェア構成図は図５であり、実施の形態１と共通する。そのため、以下では、実施の形態１と重複する説明を省略し、実施の形態１と相違する点について、詳細に説明する。また、実施の形態４の電力変換装置において、実施の形態１と同一あるいは相当部分には、同一の符号を付す。

【0121】

この実施の形態４のシステム全体は、図１０に示すように、電力変換装置１、直流電源２、および回転機械装置３から構成される。

【0122】

電力変換装置１は、機械学習器６１０、ｕｖｗ／ｄｑ変換器１１、主回路である電力変換部１２、電流検出部１３、パターン決定部６１４、ＰＩ（ＰｒｏｐｏｒｔｉｏｎａｌＩｎｔｅｇｒａｌ）電流制御器６１８を備える。実施の形態１と比較すると電力変換装置１はＰＩ電流制御器６１８をさらに備えた構成となっている。

【0123】

図１０では、電圧指令値ｖｄｑｒｅｆ（ｋ）を計算するために、電流指令値ｉｄｑｒｅｆ（ｋ）とｄｑ座標電流値ｉｄｑ（ｋ）からＰＩ電流制御器６１８により計算している。しかし、ＰＩ電流制御器６１８ではなく、Ｐ（Ｐｒｏｐｏｒｔｉｏｎａｌ）電流制御器、Ｉ（Ｉｎｔｅｇｒａｌ）電流制御器、ＰＩＤ（ＰｒｏｐｏｒｔｉｏｎａｌＩｎｔｅｇｒａｌＤｉｆｆｅｒｅｎｔｉａｌ）電流制御器、Ｉ−Ｐ（Ｉｎｔｅｇｒａｌ−Ｐｒｏｐｏｒｔｉｏｎａｌ）電流制御器を用いてもよく、Ｖ／ｆ制御のような制御方式にて速度指令値から電圧指令値を計算するようにしてもよい。また、図１０では、電圧指令値としてｄｑ座標の電圧指令値ｖｄｑｒｅｆ（ｋ）を使用しているが、αβ座標の電圧指令値、ｕｖｗ座標の電圧指令値を使用してもよい。

【0124】

次に、この実施の形態４で使用される機械学習器６１０の構成について説明する。
図１１に示すように、機械学習器６１０は、入力データ取得部６１０ａ、ラベル取得部１０ｂ、学習部１０ｃ、およびパターン生成関数記憶部１０ｄを含んで構成される。この実施の形態４では実施の形態１と比較して、入力データ取得部６１０ａにて取り扱うデータが変更されるため、変更される内容を主として説明する。

【0125】

機械学習器６１０は、予め用意した教師データに基づいて教師データ付き学習を行う。教師データ付き学習の方法は実施の形態１と同様のため、ここでは説明を省略する。

【0126】

機械学習器６１０の教師データに含まれる入力データは、電圧指令値ｖｄｑｒｅｆ（ｋ）と、電力変換部１２の前回周期のスイッチング状態ＳＷ（ｋ−１）である。

【0127】

図１１のように、予め用意した教師データに基づいて学習部１０ｃにて教師データ付き学習を実施することで、電圧指令値ｖｄｑｒｅｆ（ｋ）と前回周期のスイッチング状態ＳＷ（ｋ−１）からスイッチングパターンＳＷＰ（ｋ）を決定する学習済みモデルが作成できる。

【0128】

この実施の形態４における機械学習と電動機制御の動作は、図３のフローチャートと同様であり、実施の形態１との相違点は、ステップＳ２において電圧指令値ｖｄｑｒｅｆ（ｋ）と前回周期のスイッチング状態ＳＷ（ｋ−１）を入力データとして取得すること、および、ステップＳ７において電圧指令値ｖｄｑｒｅｆ（ｋ）と前回周期のスイッチング状態ＳＷ（ｋ−１）を入力データとして取得することである。

【0129】

この実施の形態４は、電圧指令値ｖｄｑｒｅｆ（ｋ）と前回周期のスイッチング状態ＳＷ（ｋ−１）、および学習済みモデルであるパターン生成関数に基づいて、スイッチングパターンＳＷＰ（ｋ）を計算するため、電流指令値ｉｄｑｒｅｆ（ｋ）に対する電動機のｄｑ座標電流値ｉｄｑ（ｋ）の時定数をＰＩ電流制御器６１８が設計できるようになる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式においても適用可能な構成である。

【0130】

以上のように、この実施の形態４の電力変換装置１は、回転機械装置３に流れる電流を検出する電流検出部１３と、スイッチングパターンを決定するためのパターン生成関数を出力する機械学習器６１０と、電流指令値ｉｄｑｒｅｆ（ｋ）およびｄｑ座標電流値ｉｄｑ（ｋ）から電圧指令値ｖｄｑｒｅｆ（ｋ）を計算するＰＩ電流制御器６１８と、電圧指令値ｖｄｑｒｅｆ（ｋ）、電力変換部１２の前回周期のスイッチング状態ＳＷ（ｋ−１）、および機械学習器６１０からのパターン生成関数に基づいてスイッチングパターンを決定するパターン決定部６１４と、スイッチングパターンに応じてスイッチング素子Ｑ１〜Ｑ６を制御して回転機械装置３に交流電力を出力する電力変換部１２とを備え、機械学習器６１０は、電力変換部１２のスイッチング損失がパルス幅変調（ＰＷＭ）方式よりも小さくなるように教師データ付き学習を行ってパターン生成関数を出力し、これに応じてパターン決定部６１４が電力変換部１２のスイッチング状態を決定する。

【0131】

このため、実施の形態４の電力変換装置１は、実施の形態１と同様の効果を奏するとともに、実施の形態１と比較して、電流指令値ｉｄｑｒｅｆ（ｋ）に対する回転機械装置３のｄｑ座標電流値ｉｄｑ（ｋ）の時定数をＰＩ電流制御器６１８が設計できるようになる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式においても適用可能な構成である。

【0132】

なお、前記の実施の形態４の説明では、機械学習器６１０における教師データ付き学習による学習済みモデルの作成は、予め用意した教師データを使用しているが、これに限らず、電動機制御Ｂを行いながら、教師データを測定して教師データ付き学習を行うようにしてもよいし、機械学習器６１０を電力変換装置１に含まずに、パターン生成関数のみを電力変換装置１のパターン決定部６１４が機械学習器６１０から取得する構成としてもよい。

【0133】

実施の形態５．
この実施の形態５の電力変換装置は、実施の形態２の電力変換装置１に備えられている電力変換部１２のスイッチングパターンを電圧指令値に基づいて計算する構成となっている。電力変換部１２のスイッチングパターンを電圧指令値に基づいて算出することで、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式にも適用できる。そして、このような制御方式においても電力変換部１２のスイッチング損失の低減、回転機械装置３の駆動音の低減、回転機械装置３の機械振動の低減、回転機械装置３の電流高調波の低減、電流指令値への電流検出値追従時間の低減効果が得られる。

【0134】

以下、この実施の形態５に関わる電力変換装置の構成について、電力変換装置の構成を示すブロックである図１２に基づいて説明する。機械学習器の構成は図１１、電力変換装置と機械学習器の動作フローチャートは図７であり、実施の形態２または実施の形態４と共通する。そのため、以下では、重複する説明を省略し、実施の形態２または実施の形態４と相違する点について、詳細に説明する。なお、実施の形態５の電力変換装置において、実施の形態２または実施の形態４と同一あるいは相当部分には、同一の符号を付す。

【0135】

この実施の形態５のシステム全体は、図１２に示すように、電力変換装置１、直流電源２、および回転機械装置３から構成される。

【0136】

この実施の形態５の電力変換装置１は、機械学習器７１０、主回路である電力変換部１２、電流検出部１３、パターン決定部７１４、速度検出部１５、位置検出部１６、状態観測部１７、およびＶ／ｆ制御器７１９を備える。実施の形態２と比較するとＶ／ｆ制御器７１９をさらに備えた構成となっている。

【0137】

図１２では、Ｖｆ電圧指令値ｖｆｒｅｆ（ｋ）を、電動機の速度指令値ｗｒｅｆ（ｋ）からＶ／ｆ制御器７１９により計算している。しかし、Ｖ／ｆ制御器７１９ではなく、電流指令値ｉｄｑｒｅｆ（ｋ）とｄｑ座標電流値ｉｄｑ（ｋ）からＰＩ電流制御器６１８、Ｐ電流制御器、Ｉ電流制御器、ＰＩＤ電流制御器、Ｉ−Ｐ電流制御器により電圧指令値ｖｄｑｒｅｆ（ｋ）を計算するようにしてもよく、また、電圧指令値をαβ座標の電圧指令値、ｕｖｗ座標の電圧指令値に変更してもよい。

【0138】

この実施の形態５で使用される機械学習器７１０は、実施の形態４の図１１の構成と同様であるが、教師データに含まれる入力データとラベルデータについて、実施の形態２と同様に制御目標に応じて予め用意した教師データ毎に、学習部が個別に複数の学習済みモデルを作成する。

【0139】

この実施の形態５における機械学習と電動機制御は、電力変換装置と機械学習器の動作フローチャートの図７と同様である。実施の形態２との相違点は、ステップＳ２において少なくともＶｆ電圧指令値ｖｆｒｅｆ（ｋ）と前回周期のスイッチング状態ＳＷ（ｋ−１）を入力データとして取得し、ステップＳ７においては、ステップＳ１２にて取得した学習済みモデルに対応して少なくともＶｆ電圧指令値ｖｆｒｅｆ（ｋ）と前回周期のスイッチング状態ＳＷ（ｋ−１）を入力データとして取得することである。

【0140】

この実施の形態５は、Ｖｆ電圧指令値ｖｆｒｅｆ（ｋ）と制御目標に適合したパターン生成関数を機械学習器７１０から読み出して、電力変換部１２のスイッチングパターンＳＷＰ（ｋ）を決定する。そのため、Ｖ／ｆ制御器７１９のような電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式においても、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくするだけでなく、これに加えて、回転機械装置３の駆動音、回転機械装置３の機械振動、回転機械装置３の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか１つを小さくするように回転機械装置３を駆動する効果が得られる。

【0141】

なお、前記の実施の形態５の説明では、Ｖ／ｆ制御器７１９により計算したＶｆ電圧指令値Ｖｆｒｅｆ（ｋ）に基づいてスイッチングパターンＳＷＰ（ｋ）を計算するように説明したが、電流指令値ｉｄｑｒｅｆ（ｋ）とｄｑ座標電流値ｉｄｑ（ｋ）からＰＩ電流制御器６１８により電圧指令値ｖｄｑｒｅｆ（ｋ）を計算して、電圧指令値ｖｄｑｒｅｆ（ｋ）からスイッチングパターンＳＷＰ（ｋ）を計算するようにしてもよい。

【0142】

実施の形態６．
この実施の形態６の電力変換装置は、実施の形態３の電力変換装置１に備えられている電力変換部１２のスイッチングパターンを電圧指令値に基づいて計算する構成となっている。電力変換部１２のスイッチングパターンを電圧指令値に基づいて算出することで、電流指令値ｉｄｑｒｅｆ（ｋ）に対するｄｑ座標電流値ｉｄｑ（ｋ）の時定数を設計通りにしたまま、パターン決定部に使用する教師データ付き学習を行ったパターン生成関数に対して、強化学習を行うことができる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式にも適用できる。

【0143】

以下、この実施の形態６に関わる電力変換装置の構成について、電力変換装置の構成を示すブロックである図１３に基づいて説明する。電力変換装置と機械学習器の動作フローチャートは図９に示しており、実施の形態３と共通する。そのため、以下では、重複する説明を省略し、実施の形態３と相違する点について、詳細に説明する。なお、実施の形態６の電力変換装置において、実施の形態３と同一あるいは相当部分には、同一の符号を付す。

【0144】

この実施の形態６のシステム全体は、図１３に示すように、電力変換装置１、直流電源２、および回転機械装置３から構成される。

【0145】

電力変換装置１は、機械学習器８１０と、主回路である電力変換部１２、電流検出部１３、状態観測部１７、ＰＩ電流制御器６１８、およびパターン決定部８１４を備えている。実施の形態３と比較するとＰＩ電流制御器６１８をさらに備えた構成となっている。

【0146】

図１３では、電圧指令値ｖｄｑｒｅｆ（ｋ）を計算するために、電流指令値ｉｄｑｒｅｆ（ｋ）とｄｑ座標電流値ｉｄｑ（ｋ）からＰＩ電流制御器６１８により計算している。しかし、ＰＩ電流制御器６１８ではなく、Ｐ電流制御器、Ｉ電流制御器、ＰＩＤ電流制御器、Ｉ−Ｐ電流制御器を用いてもよく、Ｖ／ｆ制御のような制御方式にて速度指令値から電圧指令値を計算するようにしてもよい。本実施の形態では、ｄｑ座標の電圧指令値としているが、αβ座標の電圧指令値、ｕｖｗ座標の電圧指令値に変更してもよい。

【0147】

この実施の形態６における強化学習と電動機制御は、電力変換装置と機械学習器の動作フローチャートの図９とほぼ同様であるが、実施の形態３との相違点は、ステップＳ１５においてパターン決定部８１４は、ステップＳ１４で取得した回転機械装置３の初期状態の電流指令値ｉｄｑｒｅｆ（ｋ）とｄｑ座標電流値ｉｄｑ（ｋ）をＰＩ電流制御器６１８により計算した電圧指令値ｖｄｑｒｅｆ（ｋ）と、機械学習器８１０で得られる今回のパターン生成関数に基づいて、スイッチングパターンＳＷＰ（ｋ）を決定することである。

【0148】

この実施の形態６により、実施の形態４において作成されるパルス幅変調（ＰＷＭ）方式に関するパターン生成関数よりもさらにスイッチング損失を小さくするように、学習済みモデルであるパターン生成関数が更新されるため、実施の形態４の教師データ付き学習で得られた学習済みモデルよりも電力変換部１２のスイッチング損失を小さくして、回転機械装置３を駆動することができる。

【0149】

なお、この実施の形態６では、実施の形態４の教師データ付き学習で得られた学習済みモデルの強化学習の方法について説明したが、実施の形態５の学習済みモデルを強化学習するようにしてもよい。

【0150】

すなわち、パルス幅変調（ＰＷＭ）方式よりも電力変換部１２のスイッチング損失を小さくすることに加えて、回転機械装置３の駆動音、回転機械装置３の機械振動、回転機械装置３の電流高調波、および電流指令値への電流検出値の追従時間のうち少なくとも何れか１つを小さくすることができるパターン生成関数を強化学習し、さらに前記性能を向上させたパターン生成関数を作成するようにしてもよい。
また、強化学習を行ったパターン生成関数を学習済みモデルとして、実施の形態４の機械学習器６１０または実施の形態５の機械学習器７１０に使用してもよい。

【0151】

以上のように、この実施の形態６の電力変換装置１は、先の実施の形態４または実施の形態５において、教師データ付き学習を行った学習済みモデルを強化学習することにより、スイッチング損失に加えて、変調方式に関わる回転機械装置６の駆動音、回転機械装置６の機械振動、回転機械装置６の電流高調波、電流指令値への電流検出値の追従時間のうち少なくとも何れか１つをさらに小さくするように回転機械装置３を駆動することができる。さらに、実施の形態３と比較すると、電力変換部１２のスイッチングパターンを電圧指令値に基づいて算出することで、電流指令値ｉｄｑｒｅｆ（ｋ）に対するｄｑ座標電流値ｉｄｑ（ｋ）の時定数を設計通りにしたまま、パターン決定部８１４に使用する教師データ付き学習を行ったパターン生成関数に対して、強化学習を行うことができる。さらに、電動機の速度指令から電圧指令値を計算する電流指令値を介さない制御方式にも適用できる。

【0152】

本願は、様々な例示的な実施の形態及び実施例が記載されているが、１つ、または複数の実施の形態に記載された様々な特徴、態様、及び機能は特定の実施の形態の適用に限られるのではなく、単独で、または様々な組み合わせで実施の形態に適用可能である。
従って、例示されていない無数の変形例が、本願に開示される技術の範囲内において想定される。例えば、少なくとも１つの構成要素を変形する場合、追加する場合または省略する場合、さらには、少なくとも１つの構成要素を抽出し、他の実施の形態の構成要素と組み合わせる場合が含まれるものとする。

【符号の説明】

【0153】

１電力変換装置、２直流電源、３回転機械装置、１０，１０Ａ，１０Ｂ，６１０，７１０，８１０機械学習器、１０ａ，６１０ａ入力データ取得部、１０ｂラベル取得部、１０ｃ学習部、１０ｄパターン生成関数記憶部、１０ｇ報酬計算部、１０ｈ関数更新部、１１ｕｖｗ／ｄｑ変換器、１２電力変換部、１２ａスイッチング素子、１３電流検出部、１４，１４Ａ，１４Ｂ，６１４，７１４，８１４パターン決定部、２０，３０プロセッサ、２１，３１記憶装置、１５速度検出部、１６位置検出部、１７，１７Ｂ状態観測部、３１１揮発性記憶装置、３１２補助記憶装置、６１８ＰＩ電流制御器、７１９Ｖ／ｆ制御器。

【図1】