特開2024-124173 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ オムロン株式会社の特許一覧

特開2024-124173制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024124173

(43)【公開日】2024-09-12

(54)【発明の名称】制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法

(51)【国際特許分類】

G05B 13/02 20060101AFI20240905BHJP

G05B 23/02 20060101ALI20240905BHJP

G05B 19/05 20060101ALI20240905BHJP

【ＦＩ】

G05B13/02 C

G05B23/02 X

G05B19/05 S

【審査請求】未請求

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2023032163

(22)【出願日】2023-03-02

(71)【出願人】

【識別番号】000002945

【氏名又は名称】オムロン株式会社

(74)【代理人】

【識別番号】110001195

【氏名又は名称】弁理士法人深見特許事務所

(72)【発明者】

【氏名】藤井高史

(72)【発明者】

【氏名】浪江正樹

【テーマコード（参考）】

3C223

5H004

5H220

【Ｆターム（参考）】

3C223AA11

3C223BA03

3C223CC02

3C223DD03

3C223FF05

3C223FF26

3C223FF43

3C223GG03

3C223HH30

5H004GA07

5H004GB16

5H004KB33

5H004KD62

5H220AA05

5H220AA06

5H220BB17

5H220CC05

5H220JJ16

(57)【要約】

【課題】制御対象に対するフィードフォワード制御の精度を向上させる。
【解決手段】装置１００は、複数の第１組合せのうち、誤差ｅｑと第１基準値との比較に基づいて、計測値ｄｏと操作量ｒとを含む複数の第２組合せをそれぞれ特定し、複数の第２組合せにそれぞれ含まれる複数の操作量ｒにおいて、第１要素ｄｓｋに対応するための複数の第１成分ｒｆと、第２要素ｄｓｕに対応するための複数の第２成分ｒｂとをそれぞれ特定し、複数のタイミングにおける第２組合せにそれぞれ含まれる複数の計測値ｄｏに複数の第１成分ｒｆを正解としてそれぞれ対応させた教師データＤｔを出力する。
【選択図】図１

【特許請求の範囲】

【請求項1】

外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための装置であって、
前記フィードバック操作量は、目標値と前記制御対象の制御量との誤差に基づいて、前記制御量が前記目標値に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量および前記フィードフォワード補償値の和が、操作量として前記制御対象に前記制御装置から出力され、
前記外乱は、第１要素と、第２要素とを含み、
前記予測モデルは、前記第１要素の計測値から前記フィードフォワード補償値を予測し、
前記装置は、学習データ生成部を備え、
前記学習データ生成部は、
複数のタイミングにおいて取得された、前記目標値と、前記目標値に対応する前記操作量と、前記計測値と、前記計測値および前記操作量の両方に対応する前記制御量とを含む複数の第１組合せのうち、前記誤差と第１基準値との比較に基づいて、前記計測値と前記操作量とを含む複数の第２組合せをそれぞれ特定し、
前記複数の第２組合せにそれぞれ含まれる複数の操作量において、前記第１要素に対応するための複数の第１成分と、前記第２要素に対応するための複数の第２成分とをそれぞれ特定し、
前記複数のタイミングにおける第２組合せにそれぞれ含まれる複数の計測値に前記複数の第１成分を正解としてそれぞれ対応させた教師データを出力する、装置。

【請求項2】

前記教師データを用いて前記予測モデルに対して前記機械学習を行う学習部をさらに備え、
前記学習部は、
前記予測モデルによって表現される、前記複数の計測値と前記複数の第１成分との関係を、前記フィードフォワード補償値を目的変数とするとともに、前記計測値を説明変数とする関数として近似し、
前記複数の第１組合せのうち前記計測値の絶対値が第２基準値より大きい第３組合せの数に対する、前記複数の第２組合せのうち前記計測値の絶対値が前記第２基準値より大きい第４組合せの数の割合が第３基準値より大きい場合、前記機械学習を終了する、請求項１に記載の装置。

【請求項3】

前記学習部は、前記機械学習が終了し、かつ、前記割合が前記第３基準値より小さい場合、前記機械学習を再開する、請求項２に記載の装置。

【請求項4】

前記第２要素は、計測されない、請求項１～３のいずれか１項に記載の装置。

【請求項5】

外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための教師データの生成プログラムであって、
前記フィードバック操作量は、目標値と前記制御対象の制御量との誤差に基づいて、前記制御量が前記目標値に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量および前記フィードフォワード補償値の和が、操作量として前記制御対象に前記制御装置から出力され、
前記外乱は、第１要素と、第２要素とを含み、
前記予測モデルは、前記第１要素の計測値から前記フィードフォワード補償値を予測し、
前記教師データの生成プログラムは、プロセッサに実行されることによって、
複数のタイミングにおいて取得された、前記目標値と、前記目標値に対応する前記操作量と、前記計測値と、前記計測値および前記操作量の両方に対応する前記制御量とを含む複数の第１組合せのうち、前記誤差と第１基準値との比較に基づいて、前記計測値と前記操作量とを含む複数の第２組合せをそれぞれ特定し、
前記複数の第２組合せにそれぞれ含まれる複数の操作量において、前記第１要素に対応するための複数の第１成分と、前記第２要素に対応するための複数の第２成分とをそれぞれ特定し、
前記複数のタイミングにおける第２組合せにそれぞれ含まれる複数の計測値に前記複数の第１成分を正解としてそれぞれ対応させた教師データを出力する、教師データの生成プログラム。

【請求項6】

外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための教師データの生成方法であって、
前記フィードバック操作量は、目標値と前記制御対象の制御量との誤差に基づいて、前記制御量が前記目標値に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量および前記フィードフォワード補償値の和が、操作量として前記制御対象に前記制御装置から出力され、
前記外乱は、第１要素と、第２要素とを含み、
前記予測モデルは、前記第１要素の計測値から前記フィードフォワード補償値を予測し、
前記教師データの生成方法は、
複数のタイミングにおいて取得された、前記目標値と、前記目標値に対応する前記操作量と、前記計測値と、前記計測値および前記操作量の両方に対応する前記制御量とを含む複数の第１組合せのうち、前記誤差と第１基準値との比較に基づいて、前記計測値と前記操作量とを含む複数の第２組合せをそれぞれ特定することと、
前記複数の第２組合せにそれぞれ含まれる複数の操作量において、前記第１要素に対応するための複数の第１成分と、前記第２要素に対応するための複数の第２成分とをそれぞれ特定することと、
前記複数のタイミングにおける第２組合せにそれぞれ含まれる複数の計測値に前記複数の第１成分を正解としてそれぞれ対応させた教師データを出力することとを含む、教師データの生成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法に関する。

【背景技術】

【0002】

従来、制御対象に対してフィードフォワード制御を行なう構成が知られている。たとえば、特開平４－３２６１０１号公報（特許文献１）には、被制御系に影響を及ぼす外乱を検出しその外乱検出値によってニューラルネットワーク型フィードフォワード補償器の自己学習を制御する外乱発生検知器を備えるニューラルネットワーク制御装置が開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開平４－３２６１０１号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１に開示されている構成においては、被制御系に影響を及ぼす外乱の検出値がニューラルネットワーク型フィードフォワード補償器の自己学習に使用される。この点、被制御系に影響を及ぼす外乱には、複数の要素が含まれる場合がある。これらをすべて検出することができない場合、外乱の検出値が用いられる自己学習によっては、検出されていない要素を含む外乱とフィードフォワード補償信号との正確な関係性を抽出することができない。その結果、ニューラルネットワーク型フィードフォワード補償器によるフィードフォワード補償信号の予測の精度が低下し得る。

【0005】

本開示は上記のような課題を解決するためになされたものであり、その目的は、制御対象に対するフィードフォワード制御の精度を向上させることである。

【課題を解決するための手段】

【0006】

本開示の一局面に係る装置は、外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための装置である。フィードバック操作量は、目標値と制御対象の制御量との誤差に基づいて、制御量が目標値に近づくように制御対象の制御装置のフィードバック制御によって決定される。フィードバック操作量およびフィードフォワード補償値の和が、操作量として制御対象に制御装置から出力される。外乱は、第１要素と、第２要素とを含む。予測モデルは、第１要素の計測値からフィードフォワード補償値を予測する。装置は、学習データ生成部を備える。学習データ生成部は、複数のタイミングにおいて取得された、目標値と、目標値に対応する操作量と、計測値と、計測値および操作量の両方に対応する制御量とを含む複数の第１組合せのうち、誤差と第１基準値との比較に基づいて、計測値と操作量とを含む複数の第２組合せをそれぞれ特定し、複数の第２組合せにそれぞれ含まれる複数の操作量において、第１要素に対応するための複数の第１成分と、第２要素に対応するための複数の第２成分とをそれぞれ特定し、複数のタイミングにおける第２組合せにそれぞれ含まれる複数の計測値に複数の第１成分を正解としてそれぞれ対応させた教師データを出力する。

【0007】

この開示によれば、フィードフォワード制御の結果に含まれる操作量のうち、計測値に対応させるべき正解として、操作量そのものではなく、操作量のうちフィードフォワード制御が必要な計測要素に対応するための第１成分がフィードフォワード補償値として特定される。その結果、教師データにおいて計測値に対して適切な正解が関連付けられる。そのため、この開示によれば、教師データを用いて予測モデルに対して機械学習を行うことにより、制御対象に対するフィードフォワード制御の精度を向上させることができる。

【0008】

上記の開示において、装置は、教師データを用いて予測モデルに対して機械学習を行う学習部をさらに備える。学習部は、予測モデルによって表現される、複数の計測値と複数の第１成分との関係を、フィードフォワード補償値を目的変数とするとともに、計測値を説明変数とする関数として近似し、複数の第１組合せのうち計測値の絶対値が第２基準値より大きい第３組合せの数に対する、複数の第２組合せのうち計測値の絶対値が第２基準値より大きい第４組合せの数の割合が第３基準値より大きい場合、機械学習を終了する。

【0009】

この開示によれば、フィードフォワード制御の結果から教師データが選択されるため、フィードフォワード制御と並行して外乱および制御対象の特性に予測モデルをリアルタイムに適合させることができる。また、この開示によれば、予測モデルの精度が十分に高くなるまで機械学習が継続されるため、制御対象に対するフィードフォワード制御の精度を十分に向上させることができる。

【0010】

上記の開示において、学習部は、機械学習が終了し、かつ、上記割合が第３基準値より小さい場合、機械学習を再開してもよい。

【0011】

この開示によれば、制御対象の特性の変化に応じて予測モデルが当該特性に再適合されるため、制御対象の特性の変化によるフィードフォワード制御の精度の低下を抑制することができる。

【0012】

上記の開示において、第２要素は、計測されなくてもよい。

【0013】

この開示によれば、第２要素の計測に必要なセンサ等のコストを削減することができる。

【0014】

本開示の他の局面に係る教師データの生成プログラムは、外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のためのプログラムである。フィードバック操作量は、目標値と制御対象の制御量との誤差に基づいて、制御量が目標値に近づくように制御対象の制御装置のフィードバック制御によって決定される。フィードバック操作量およびフィードフォワード補償値の和が、操作量として制御対象に制御装置から出力される。外乱は、第１要素と、第２要素とを含む。予測モデルは、第１要素の計測値からフィードフォワード補償値を予測する。教師データの生成プログラムは、プロセッサに実行されることによって、複数のタイミングにおいて取得された、目標値と、目標値に対応する操作量と、計測値と、計測値および操作量の両方に対応する制御量とを含む複数の第１組合せのうち、誤差と第１基準値との比較に基づいて、計測値と操作量とを含む複数の第２組合せをそれぞれ特定し、複数の第２組合せにそれぞれ含まれる複数の操作量において、第１要素に対応するための複数の第１成分と、第２要素に対応するための複数の第２成分とをそれぞれ特定し、複数のタイミングにおける第２組合せにそれぞれ含まれる複数の計測値に複数の第１成分を正解としてそれぞれ対応させた教師データを出力する。

【0015】

【0016】

本開示の他の局面に係る教師データの生成方法は、外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための方法である。フィードバック操作量は、目標値と制御対象の制御量との誤差に基づいて、制御量が目標値に近づくように制御対象の制御装置のフィードバック制御によって決定される。フィードバック操作量およびフィードフォワード補償値の和が、操作量として制御対象に制御装置から出力される。外乱は、第１要素と、第２要素とを含む。予測モデルは、第１要素の計測値からフィードフォワード補償値を予測する。教師データの生成方法は、複数のタイミングにおいて取得された、目標値と、目標値に対応する操作量と、計測値と、計測値および操作量の両方に対応する制御量とを含む複数の第１組合せのうち、誤差と第１基準値との比較に基づいて、計測値と操作量とを含む複数の第２組合せをそれぞれ特定することと、複数の第２組合せにそれぞれ含まれる複数の操作量において、第１要素に対応するための複数の第１成分と、第２要素に対応するための複数の第２成分とをそれぞれ特定することと、複数のタイミングにおける第２組合せにそれぞれ含まれる複数の計測値に複数の第１成分を正解としてそれぞれ対応させた教師データを出力することとを含む。

【0017】

【発明の効果】

【0018】

本開示に係る装置、教師データの生成プログラム、および教師データの生成方法によれば、制御対象に対するフィードフォワード制御の精度を向上させることができる。

【図面の簡単な説明】

【0019】

【図1】実施の形態１に係る制御装置の機能構成を示すブロック図である。

【図2】４つの組合せをそれぞれ含む４つのデータセットの包含関係を示すベン図である。

【図3】予測モデルが未学習である場合の試行期間における外乱、計測値、操作量、および制御量の各々のタイムチャートを示す図である。

【図4】図３に示される試行期間において取得された計測値、操作量、および制御量のうち、誤差の絶対値が基準値よりも小さい場合の計測値、操作量、および制御量を示す図である。

【図5】操作量を計測成分と非計測成分とに分ける処理を説明するための図である。

【図6】サンプル番号（測定時刻）が互いに同じである図４の計測値と図５（ｄ）のフィードフォワード補償値とによって特定される点がプロットされた図である。

【図7】２つの試行期間において取得された２つのデータセットに基づいて予測関数を導出する処理を説明するための図である。

【図8】教師データを取得するための試行回数を増加させることによって、制御量が改善する様子を示す図である。

【図9】図１のフィードバック制御系、フィードフォワード制御系、学習データ生成部、および学習部の各々によって行われる処理の流れを示すフローチャートを示す図である。

【図10】図９の学習データ生成処理の具体的な処理の流れを示すフローチャートである。

【図11】図９の機械学習処理の具体的な処理の流れを示すフローチャートである。

【図12】図２の学習部によって行われる追加学習処理の流れを示す図である。

【図13】実施の形態１の変形例１に係る制御装置の機能構成を示すブロック図である。

【図14】実施の形態２に係る制御システムの機能構成を示すブロック図である。

【図15】実施の形態３に係る制御システムのネットワーク構成例を示す模式図である。

【図16】図１５の制御装置のハードウェア構成例を示すブロック図である。

【発明を実施するための形態】

【0020】

以下、実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は原則として繰り返さない。

【0021】

［実施の形態１］
＜適用例＞
図１は、実施の形態１に係る制御装置１００の機能構成を示すブロック図である。図１に示されるように、制御装置１００（学習装置）は、フィードバック制御部１１０と、フィードフォワード補償部１２０と、学習データ生成部１３０と、記憶部１４０と、減算器１５０と、加算器１６０と、学習部１７０とを備える。

【0022】

制御装置１００は、外乱ｄｓを受ける制御対象２００の出力値である制御量ｑが目標値ｑｒに近づくように制御対象２００へのフィードバック操作量ｒｂとフィードフォワード補償値ｒｆとの和を操作量ｒとして制御対象２００に出力する。記憶部１４０には、予測モデルＭｐおよび教師データＤｔが保存されている。制御装置１００と制御対象２００とは、ネットワーク（たとえば、インターネット、あるいはクラウドシステム）を介して接続され、互いに遠隔に配置されていてもよい。予測モデルＭｐを構築する機械学習アルゴリズムとしては、ディープバイナリーツリー、あるいはサポートベクターマシンを挙げることができる。

【0023】

外乱ｄｓとは、制御装置１００と制御対象２００とを含む制御系の状態を乱す量である。外乱ｄｓは、複数の外乱要素を含み、たとえば、制御対象に偶発的あるいは突発的に入力される光量、電圧、電流、および温度を含む。外乱ｄｓに含まれる複数の外乱要素のうち、センサ等の計測装置によって計測される外乱要素を計測要素ｄｓｋ（第１要素）とし、計測されない外乱要素を非計測要素ｄｓｕ（第２要素）とする。また、計測要素ｄｓｋの計測値をｄｏとする。

【0024】

外乱ｄｓに含まれる複数の外乱要素は、制御対象２００の対象装置の特性要因図等の予め得られている知見に基づいて、制御対象２００の品質特性値（制御量ｑ）に影響を与えることが想定される複数の因子として決定され得る。当該複数の因子のうち、フィードバック制御に関する基準時間間隔（たとえば、フィードバック制御のサインプリングタイムあるいは時定数）において、比較的大きい変動を制御量ｑに生じさせる因子が計測要素ｄｓｋとされ、比較的小さい変動を制御量ｑに生じさせる因子または未知の因子が非計測要素ｄｓｕとされる。すなわち、基準時間間隔における計測要素に基づく制御量ｑの変動は、基準時間間隔における非計測要素に基づく制御量ｑの変動よりも大きい。たとえば、フィードバック制御での追従が困難である急峻あるいは不連続な変動を制御量ｑに生じさせる因子（たとえば、材料の湾曲あるいは耐力等の材料の特性）が計測要素ｄｓｋとされる。計測要素ｄｓｋに対しては、急峻な変動に予め備えることが可能なフィードフォワード制御を行う必要性が比較的高い。一方、フィードバック制御での追従が可能な緩やかあるいは連続的な変動を制御量ｑに生じさせる因子（たとえば、制御対象の周囲の温度、あるいは加工熱による制御対象の熱膨張）が非計測要素ｄｓｕとされる。非計測要素ｄｓｕに対しては、フィードバック制御での追従が可能であるため、フィードフォワード制御を行なう必要性は比較的低い。なお、当該因子の計測に必要なセンサ等のコストを削減するために、非計測要素とされてもよい。

【0025】

以下では、フィードバック制御部１１０と減算器１５０とを含む構成をフィードバック制御系とも呼び、フィードフォワード補償部１２０と加算器１６０とを含む構成をフィードフォワード制御系とも呼ぶ。

【0026】

減算器１５０は、目標値ｑｒと制御量ｑとの誤差ｅｑ（＝ｑｒ－ｑ）をフィードバック制御部１１０に出力する。フィードバック制御部１１０は、誤差ｅｑに基づいてフィードバック操作量ｒｂを決定して加算器１６０に出力する。フィードフォワード補償部１２０は、予測モデルＭｐを用いて計測値ｄｏからフィードフォワード補償値ｒｆを予測して加算器１６０に出力する。加算器１６０は、フィードバック操作量ｒｂとフィードフォワード補償値ｒｆとの和を操作量ｒとして制御対象２００および学習データ生成部１３０に出力する。

【0027】

学習データ生成部１３０は、予測モデルＭｐに対する機械学習において用いられる教師データＤｔを生成する。学習データ生成部１３０は、複数のタイミングにおいて、目標値ｑｒと、目標値ｑｒに対応する操作量ｒと、計測値ｄｏと、計測値ｄｏおよび操作量ｒの両方に対応する制御量ｑとを含む複数の組合せＣｍ１（第１組合せ）をそれぞれ取得する。学習データ生成部１３０は、複数の組合せＣｍ１のうち、誤差ｅｑの絶対値が基準値α（第１基準値）よりも小さい場合（制御対象２００に対して高精度の制御が行われた場合）の計測値ｄｏと操作量ｒとを含む複数の組合せＣｍ２（第２組合せ）をそれぞれ特定する。基準値αは、たとえば、実機実験、シミュレーション、製品の規格値、ある製造工程の管理値に基づいて適宜決定することができる。

【0028】

学習データ生成部１３０は、複数の組合せＣｍ２にそれぞれ含まれる複数の操作量ｒにおいて、計測要素ｄｓｋに対応するための複数の計測成分（第１成分）と、非計測要素ｄｓｕに対応するための複数の非計測成分（第２成分）とを特定する。計測成分および非計測成分は、フィードフォワード補償値ｒｆおよびフィードバック操作量ｒｂにそれぞれ対応する。学習データ生成部１３０は、複数の計測値ｄｏに、複数の計測成分（正解）をそれぞれ対応させた教師データＤｔを記憶部１４０に出力する。教師データＤｔは、学習データのセット（データセット）を取得するための試行期間毎に区別されて記憶部１４０に保存される。なお、学習データ生成部１３０は、教師データＤｔを学習部１７０に直接出力してもよい。

【0029】

学習部１７０は、計測値ｄｏと、フィードフォワード補償値ｒｆ（計測成分）との関係を、フィードフォワード補償値ｒｆを目的変数とするとともに、計測値ｄｏを説明変数とする関数（回帰曲線あるいは回帰曲面）として近似する。予測モデルＭｐは、当該関数を含む。学習部１７０は、複数の組合せＣｍ１のうち計測値ｄｏの絶対値が基準値β（第２基準値）より大きい組合せＣｍ３（第３組合せ）の数に対する、複数の組合せＣｍ２のうち計測値ｄｏの絶対値が基準値βより大きい組合せＣｍ４（第４組合せ）の数の割合Ｃｒが基準値δ（第３基準値）より大きい場合、外乱ｄｓの計測成分が比較的大きくても制御対象２００に対して高精度の制御が行われるタイミング数が所望のレベルまで増加したとして、予測モデルＭｐに対する機械学習を終了する。なお、基準値βは、制御系が定常状態である場合の計測値ｄｏの絶対値の最大値として決定されてもよい。基準値βは、たとえば、実機実験、シミュレーション、製品の規格値、あるいは製造工程の管理値に基づいて適宜決定することができる。

【0030】

学習部１７０は、予測モデルＭｐに対する機械学習（初回の学習または追加学習）が終了し、かつ、割合Ｃｒが基準値δ以下である場合、制御対象２００の特性が変化したとして、予測モデルＭｐに対する機械学習（追加学習）を再開する。基準値δは、たとえば、実機実験、シミュレーション、製品の規格値、ある製造工程の管理値に基づいて適宜決定することができる。制御対象２００の特性には、たとえば、計測値ｄｏおよび操作量ｒと、制御量ｑとの対応関係が含まれる。

【0031】

図２は、４つの組合せＣｍ１～Ｃｍ４をそれぞれ含む４つのデータセットＳｃｍ１，Ｓｃｍ２，Ｓｃｍ３，Ｓｃｍ４の包含関係を示すベン図である。データセットＳｃｍ１は、目標値ｑｒと、操作量ｒと、計測値ｄｏと、制御量ｑとを含む組合せＣｍ１の全てを含むデータセットである。データセットＳｃｍ２は、データセットＳｃｍ１のうち、誤差ｅｑの絶対値が基準値αよりも小さい場合の計測値ｄｏと操作量ｒとを含む組合せＣｍ２の全てを含むデータセットである。データセットＳｃｍ３は、データセットＳｃｍ１のうち、計測値ｄｏの絶対値が基準値βより大きい場合の組合せＣｍ３の全てを含むデータセットである。データセットＳｃｍ４は、データセットＳｃｍ２のうち、計測値ｄｏの絶対値が基準値βより大きい組合せＣｍ４の全てを含むデータセットである。図５に示されるように、データセットＳｃｍ１は、データセットＳｃｍ２，Ｓｃｍ３を包含する。データセットＳｃｍ４は、データセットＳｃｍ２とＳｃｍ３との共通部分（積集合）である。

【0032】

制御装置１００においては、フィードフォワード制御の結果に含まれる操作量ｒのうち、計測値ｄｏに対応させるべき正解として、操作量ｒそのものではなく、操作量ｒのうちフィードフォワード制御が必要な計測要素ｄｓｋに対応するための計測成分がフィードフォワード補償値ｒｆとして特定される。制御装置１００によれば、教師データＤｔにおいて計測値ｄｏに対して適切な正解が関連付けられるため、教師データＤｔを用いて予測モデルＭｐに対して機械学習を行うことにより、制御対象２００に対するフィードフォワード制御の精度を向上させることができる。また、制御装置１００によれば、フィードフォワード制御と並行して計測値ｄｏおよび制御対象２００の特性に予測モデルＭｐをリアルタイムに適合させることができる。また、予測モデルＭｐの精度が十分に高くなるまで機械学習が継続されるため、制御対象２００に対するフィードフォワード制御の精度を十分に向上させることができる。さらに、制御対象２００の特性の変化に応じて予測モデルＭｐが当該特性に再適合されるため、制御対象２００の特性の変化によるフィードフォワード制御の精度の低下を抑制することができる。

【0033】

図３は、予測モデルＭｐが未学習である場合の試行期間における外乱ｄｓ、計測値ｄｏ、操作量ｒ、および制御量ｑの各々のタイムチャートを示す図である。図３には、６４００秒間に取得された８０００個のデータがプロットされている。図３に示されるように、計測要素ｄｓｋ，計測値ｄｏは、時刻ｔ１，ｔ２，ｔ３，ｔ４（ｔ１＜ｔ２＜ｔ３＜ｔ４）の各々において他の時間帯よりも急峻な変化をするとともに、それ以外の時間帯においてはほぼ平坦な階段状のグラフを形成する。非計測要素ｄｓｕは、一様に連続的な変化をして直線上のグラフを形成する。操作量ｒは、時刻ｔ１，ｔ２，ｔ３，ｔ４の各々において計測要素ｄｓｋと同様に急峻に変化するとともに、それ以外の時間帯においては非計測要素ｄｓｕと同様に連続的に変化する。制御量ｑには、時刻ｔ１，ｔ２，ｔ３，ｔ４の各々において、スパイク状のノイズが発生する。

【0034】

図４は、図３に示される試行期間において取得された計測値ｄｏ、操作量ｒ、および制御量ｑのうち、誤差ｅｑの絶対値が基準値αよりも小さい場合の計測値ｄｏ、操作量ｒ、および制御量ｑを示す図である。図５は、操作量ｒを計測成分と非計測成分とに分ける処理を説明するための図である。図５の（ａ）の操作量ｒは図４の操作量ｒに対応し、図５の（ｄ）の操作量ｒは図３の操作量ｒに対応する。図４，図５の横軸のサンプル番号は、データが取得された時刻順に付される番号である。後に説明する図８においても同様である。

【0035】

図５を参照しながら、（ｂ）の差分は、（ａ）のｎ＋１番目の操作量ｒ_ｎ＋１からｎ番目の操作量ｒ_ｎを引いた値（ｒ_ｎ＋１－ｒ_ｎ）である。（ｂ）において時刻ｔ１～ｔ４において、外れ値ｏｔ１，ｏｔ２，ｏｔ３，ｏｔ４がそれぞれ検出されている。外れ値ｏｔ１～ｏｔ４の各々は、閾値以上の絶対値（｜ｒ_ｎ＋１－ｒ_ｎ｜）を有する差分である。

【0036】

（ｃ）には、（ａ）に示される複数のデータの各々にオフセット処理を行うことによって抽出された非計測成分がプロットされている。当該オフセット処理においては、当該複数のデータの各々から測定された時刻に応じた外れ値の合計が引かれる。具体的には、時刻０（測定開始）から時刻ｔ１までの操作量ｒから引かれる外れ値はｏｔ０である。時刻ｔ１～ｔ２までの操作量ｒから引かれる外れ値はｏｔ０，ｏｔ１の合計である。時刻ｔ２～ｔ３までの操作量ｒから引かれる外れ値はｏｔ０～ｏｔ２の合計である。時刻ｔ３～ｔ４までの操作量ｒから引かれる外れ値はｏｔ０～ｏｔ３の合計である。時刻ｔ４以降の操作量ｒから引かれる外れ値はｏｔ０～ｏｔ４の合計である。（ｃ）にプロットされている非計測成分に基づいてサンプル番号（あるいは時間）と操作量ｒの非計測成分との対応関係が非計測成分の関数として近似される。操作量ｒの非計測成分は、非計測要素ｄｓｕに対応するためにフィードバック制御によって決定された操作量である。そのため、このように関数として近似された操作量ｒの非計測成分は、（ｄ）においてフィードバック操作量ｒｂとして示されている。操作量ｒは、フィードバック操作量ｒｂとフィードフォワード補償値ｒｆとの和である。したがって、（ｄ）において、フィードフォワード補償値ｒｆは、操作量ｒからフィードバック操作量ｒｂを引くことによって導かれる。

【0037】

図６は、サンプル番号（測定時刻）が互いに同じである図４の計測値ｄｏと図５（ｄ）のフィードフォワード補償値ｒｆとによって特定される点がプロットされた図である。図６に示されるように、プロットされた複数の点（教師データ）に基づく回帰分析によって、計測値ｄｏとフィードフォワード補償値ｒｆとの対応関係が、計測値ｄｏ，フィードフォワード補償値ｒｆをそれぞれ説明変数および目的変数として有する予測関数Ｆｎ１として近似される。なお、計測値ｄｏとフィードフォワード補償値ｒｆとの対応関係を関数として近似することには、ガウス過程回帰などの機械学習アルゴリズムを利用することができる。

【0038】

図７は、２つの試行期間Ｔｐ１，Ｔｐ２において取得された２つのデータセットに基づいて予測関数Ｆｎ１２を導出する処理を説明するための図である。図７に示されるように、試行期間Ｔｐ１，Ｔｐ２の各々において導出された点（教師データ）のフィードフォワード補償値ｒｆからオフセット値が引かれた点が新たな教師データとされて、予測関数Ｆｎ１２が導出される。また、当該オフセット値は、試行期間Ｔｐ１，Ｔｐ２にそれぞれ対応する予測関数Ｆｎ１，Ｆｎ２の重複範囲Ｒｇに含まれる計測値ｄｏ１２を利用して決定されてもよい。具体的には、予測関数Ｆｎ１，Ｆｎ２において計測値ｄｏ１２にそれぞれ対応するフィードフォワード補償値ｒｆ１，ｒｆ２の平均値ｒｆａとフィードフォワード補償値ｒｆ１またはｒｆ２との差の絶対値（フィードフォワード補償値ｒｆ１，ｒｆ２の差の半分）を当該オフセット値とすることができる。また、当該オフセット値は、２つの試行期間Ｔｐ１，Ｔｐ２に含まれるすべての点に対するオフセット値の合計が最小となるように決定されてもよい。

【0039】

図８は、教師データを取得するための試行回数を増加させることによって、制御量ｑが改善する様子を示す図である。図８に示されるように、第１回の試行期間においては、時刻ｔ１１，ｔ１２，ｔ１３，ｔ１４においてスパイク状のノイズが発生する。しかし、第１回の試行期間において生成された教師データを用いる機械学習が予測モデルＭｐに対して行われるため、第２回の試行期間の時刻ｔ２１，ｔ２２，ｔ２３，ｔ２４の各々において発生するスパイク状のノイズの大きさ、および第３回の試行期間の時刻ｔ３１，ｔ３２，ｔ３３，ｔ３４の各々において発生するスパイク状のノイズの大きさは、第１回の試行期間の時刻ｔ１１，ｔ１２，ｔ１３，ｔ１４において発生するスパイク状のノイズの大きさよりも小さい。

【0040】

図９は、図１のフィードバック制御系、フィードフォワード制御系、学習データ生成部１３０、および学習部１７０の各々によって行われる処理の流れを示すフローチャートを示す図である。フィードバック制御系およびフィードフォワード制御系の各々のフローチャートに対応するルーチンは、たとえば、サンプリングタイム毎に実行される。学習データ生成部１３０および学習部１７０の各々のフローチャートに対応するルーチンは、たとえば、フィードフォワード制御系の各々のフローチャートに対応するルーチンの初回実行に応じて実行される。以下ではステップを単にＳと記載する。

【0041】

図９に示されるように、減算器１５０は、Ｓ１１１において、目標値ｑｒと制御量ｑとの誤差ｅｑを算出してフィードバック制御部１１０に出力する。フィードバック制御部１１０は、Ｓ３１２において、誤差ｅｑに基づいてフィードバック操作量ｒｂを決定して加算器１６０に出力して、処理を終了する。

【0042】

フィードフォワード補償部１２０は、Ｓ１２１において、計測値ｄｏからフィードフォワード補償値ｒｆを決定して加算器１６０に出力する。加算器１６０は、Ｓ１２２において、フィードバック操作量ｒｂとフィードフォワード補償値ｒｆとの和を操作量ｒとして制御対象２００および学習データ生成部１３０に出力して、処理を終了する。

【0043】

学習データ生成部１３０は、Ｓ１３０において教師データＤｔを生成して処理を終了する。学習部１７０は、Ｓ１７０において予測モデルＭｐに対して教師データＤｔを用いた機械学習を行って、処理を終了する。

【0044】

図１０は、図９の学習データ生成処理Ｓ１３０の具体的な処理の流れを示すフローチャートである。図１０に示されるように、学習データ生成部１３０は、Ｓ１３１において、複数のタイミングにおいて複数の組合せＣｍ１をそれぞれ取得して処理をＳ１３２に進める。学習データ生成部１３０は、Ｓ１３２において、複数の組合せＣｍ１のうち、誤差ｅｑの絶対値が基準値αよりも小さい場合の計測値ｄｏと操作量ｒとを含む複数の組合せＣｍ２をそれぞれ特定して処理をＳ１３３に進める。学習データ生成部１３０は、Ｓ１３３において、複数の組合せＣｍ２にそれぞれ含まれる複数の操作量ｒにおいて、計測要素ｄｓｋに対応するための複数の計測成分と、非計測要素ｄｓｕに対応するための複数の非計測成分とをそれぞれ特定して処理をＳ１３４に進める。学習データ生成部１３０は、Ｓ１３４において、複数のタイミングにおける組合せＣｍ２にそれぞれ含まれる複数の計測値ｄｏに複数の計測成分（フィードフォワード補償値ｒｆ）を正解としてそれぞれ対応させた教師データＤｔを出力して処理を終了する。

【0045】

図１１は、図９の機械学習処理Ｓ１７０の具体的な処理の流れを示すフローチャートである。図１１に示されるように、学習部１７０は、Ｓ１７１において、新たに追加された教師データＤｔを取得して処理をＳ１７２に進める。学習部１７０は、Ｓ１７２において、予測モデルＭｐによって表現される計測値ｄｏと、操作量ｒの計測成分としてのフィードフォワード補償値ｒｆとの関係を、フィードフォワード補償値ｒｆを目的変数とするとともに、計測値ｄｏを説明変数とする関数（回帰曲線）として近似して処理をＳ１７３に進める。学習部１７０は、Ｓ１７３において、複数の組合せＣｍ１のうち計測値ｄｏの絶対値が基準値βより大きい組合せＣｍ３の数Ｍ１に対する、複数の組合せＣｍ２のうち計測値ｄｏの絶対値が基準値βより大きい組合せＣｍ４の数Ｍ２の割合Ｃｒ（＝Ｍ２／Ｍ１）を算出して、処理をＳ１７４に進める。学習部１７０は、Ｓ１７４において、割合Ｃｒが基準値δより大きいか否かを判定する。割合Ｃｒが基準値δ以下である場合（Ｓ１７４においてＮＯ）、学習部１７０は、制御対象２００へのフィードフォワード制御の精度が不十分であるとして、処理をＳ１７１に戻す。割合Ｃｒが基準値δより大きい場合（Ｓ１７４においてＹＥＳ）、制御対象２００へのフィードフォワード制御の精度が十分に高まったとして、学習部１７０は、機械学習を終了する。

【0046】

図１２は、図２の学習部１７０によって行われる追加学習処理の流れを示す図である。図１２に示される処理は、たとえば、初回の機械学習が開始した後、サンプリングタイム毎に実行される。図１２に示されるように、学習部１７０は、Ｓ１７１Ａにおいて、機械学習が終了し、かつ、割合Ｃｒが基準値δ以下であるか否かを判定する。機械学習が終了していないか、または割合Ｃｒが基準値δより大きい場合（Ｓ１７１ＡにおいてＮＯ）、制御対象２００の特性が変化しておらず既存の学習済みの予測モデルＭｐが制御対象２００に適合しているとして、学習部１７０は、処理を終了する。機械学習が終了し、かつ割合Ｃｒが基準値δより以下である場合（Ｓ１７１ＡにおいてＹＥＳ）、学習部１７０は、前回の機械学習が終了した後、制御対象２００の特性が変化したとして、予測モデルＭｐを制御対象２００の特性に再度適合させるために、図９と同様のＳ１７０において予測モデルＭｐに対する機械学習を再開する。制御装置１００によれば、制御対象２００の特性の変化に応じて予測モデルＭｐに対する追加学習が行われるため、制御対象２００の特性の変化によるフィードフォワード制御の精度の低下を抑制することができる。

【0047】

［実施の形態１の変形例１］
実施の形態１においては、フィードバック制御系およびフィードフォワード制御系の両方が含まれる構成について説明した。実施の形態１の変形例１においては、フィードバック制御系が含まれない構成について説明する。

【0048】

図１３は、実施の形態１の変形例１に係る制御装置１００Ａの機能構成を示すブロック図である。制御装置１００Ａの構成は、図１の制御装置１００から減算器１５０およびフィードバック制御部１１０が除かれた構成である。これ以外は同様であるため、同様の構成についての説明を繰り返さない。なお、加算器１６０は、制御装置１００Ａに含まれていなくてもよい。

【0049】

図１３に示されるように、制御装置１００Ａは、計測値ｄｏを受ける制御対象２００の制御量ｑが目標値ｑｒに近づくように制御対象２００へのフィードバック操作量ｒｂのフィードフォワード補償値ｒｆを決定する。制御装置１００Ａによれば、既存のフィードバック制御系を残存させながら、当該フィードバック制御系に制御装置を追加することにより、既存のフィードバック制御系をフィードフォワード制御系および学習機能を含む制御系に容易に拡張することができる。

【0050】

以上、実施の形態１および変形例１に係る装置および教師データの生成方法によれば、制御対象に対するフィードフォワード制御の精度を向上させることができる。

【0051】

［実施の形態２］
実施の形態１においてはフィードバック制御系と、フィードフォワード制御系と、予測モデルに対して機械学習を行う構成とが１つの制御装置に含まれている場合について説明した。実施の形態２においては、フィードバック制御系と、フィードフォワード制御系と、予測モデルに対して機械学習を行う構成とが互いに別個の装置に分かれている構成について説明する。

【0052】

図１４は、実施の形態２に係る制御システム２の機能構成を示すブロック図である。図１４において図１と同様の参照符号が付されている構成は、実施の形態１において説明された当該参照符号によって特定される構成と同様の機能を有するため、当該同様の構成についての説明を繰り返さない。

【0053】

図１４に示されるように、制御システム２は、フィードバック制御装置１１と、フィードフォワード補償装置１２と、学習データ生成装置１３と、記憶装置１４と、学習装置１７とを備える。学習データ生成装置１３、記憶装置１４、および学習装置１７は、図１の学習データ生成部１３０、記憶部１４０、および学習部１７０にそれぞれ対応する。フィードバック制御装置１１は、フィードバック制御部１１０と、減算器１５０とを含む。フィードフォワード補償装置１２は、フィードフォワード補償部１２０と、加算器１６０とを含む。フィードバック制御装置１１、フィードフォワード補償装置１２、学習データ生成装置１３、記憶装置１４、学習装置１７、および制御対象２００は、ネットワークを介して互いに接続され、互いに遠隔に配置されていてもよい。なお、加算器１６０は、フィードフォワード補償装置１２ではなく、フィードバック制御装置１１に含まれていてもよい。

【0054】

制御システム２によれば、既存のフィードバック制御装置を残存させながら、当該フィードバック制御装置にフィードフォワード補償装置、学習データ生成装置、および学習装置を追加することにより、既存の制御システムを容易に拡張することができる。

【0055】

以上、実施の形態２に係る装置および教師データの生成方法によれば、制御対象に対するフィードフォワード制御の精度を向上させることができる。

【0056】

［実施の形態３］
実施の形態３においては、実施の形態１に係る制御装置の一例として、当該制御装置がＰＬＣ（Programmable Logic Controller）を含む構成について説明する。

【0057】

＜制御システムのネットワーク構成例＞
図１５は、実施の形態３に係る制御システム３のネットワーク構成例を示す模式図である。図１５に示されるように、制御システム３は、複数のデバイスが互いに通信可能に構成されたデバイス群を含む。典型的には、デバイスは、制御プログラムを実行する処理主体である制御装置３００と、制御装置３００に接続される周辺装置とを含み得る。制御装置３００は、図１に示される制御装置１００と同様の機能構成を有する。

【0058】

制御装置３００は、各種の設備または装置などの制御対象を制御する産業用コントローラに相当する。制御装置３００は、制御演算を実行する一種のコンピュータであり、典型的には、ＰＬＣ（Programmable Logic Controller）を含む。制御装置３００は、フィールドネットワーク２０を介してフィールドデバイス２００Ｃに接続されている。制御装置３００は、フィールドネットワーク２０を介して、少なくとも１つのフィールドデバイス２００Ｃとの間でデータを遣り取りする。

【0059】

制御装置３００において実行される制御演算は、フィールドデバイス２００Ｃにおいて収集または生成されたデータを収集する処理、フィールドデバイス２００Ｃに対する指令値（操作量）などのデータを生成する処理、および生成した出力データを対象のフィールドデバイス２００Ｃへ送信する処理などを含む。フィールドデバイス２００Ｃにおいて収集または生成されたデータには、フィールドデバイス２００Ｃに入力された外乱に関するデータ、および指令値に従ってフィールドデバイス２００Ｃが実際に動作した結果としての制御量が含まれる。フィールドデバイス２００Ｃに対する指令値は、制御装置３００によって実行される制御プログラムに基づいて算出された制御目標値（目標値）と実際の制御量との誤差に基づいて暫定的に算出された操作量に、予測モデルによって外乱から予測されたフィードフォワード補償値が加算されることによって決定される。

【0060】

フィールドネットワーク２０は、定周期通信を行うバスまたはネットワークを採用することが好ましい。このような定周期通信を行うバスまたはネットワークとしては、ＥｔｈｅｒＣＡＴ（登録商標）、ＥｔｈｅｒＮｅｔ／ＩＰ（登録商標）、ＤｅｖｉｃｅＮｅｔ（登録商標）、またはＣｏｍｐｏＮｅｔ（登録商標）などが知られている。データの到達時間が保証される点において、ＥｔｈｅｒＣＡＴ（登録商標）が好ましい。

【0061】

フィールドネットワーク２０には、任意のフィールドデバイス２００Ｃを接続することができる。フィールドデバイス２００Ｃは、フィールド側にあるロボットまたはコンベアなどに対して何らかの物理的な作用を与えるアクチュエータ、および、フィールドとの間で情報を遣り取りする入出力装置などを含む。

【0062】

制御システム３においてフィールドデバイス２００Ｃは、複数のサーボドライバ２２０＿１，２２０＿２と、複数のサーボドライバ２２０＿１，２２０＿２にそれぞれ接続された複数のサーボモータ２２２＿１，２２２＿２とを含む。フィールドデバイス２００Ｃは、「制御対象」の一例である。

【0063】

サーボドライバ２２０＿１，２２０＿２は、制御装置３００からの指令値（たとえば、位置指令値または速度指令値など）に従って、サーボモータ２２２＿１および２２２＿２のうちの対応するサーボモータを駆動する。このようにして、制御装置３００は、フィールドデバイス２００Ｃを制御することができる。

【0064】

制御装置３００は、上位ネットワーク３２を介して、他の装置にも接続されている。上位ネットワーク３２は、ゲートウェイ７００を介して、外部ネットワークであるインターネット９００に接続されている。上位ネットワーク３２には、一般的なネットワークプロトコルであるイーサネット（登録商標）、あるいはＥｔｈｅｒＮｅｔ／ＩＰ（登録商標）が採用されてもよい。より具体的には、上位ネットワーク３２には、少なくとも１つのサーバ装置６００および少なくとも１つの表示装置５００が接続されてもよい。

【0065】

サーバ装置６００としては、データベースシステム、または製造実行システム（ＭＥＳ：Manufacturing Execution System）などが想定される。製造実行システムは、制御対象の製造装置または設備からの情報を取得して、生産全体を監視および管理するものであり、オーダ情報、品質情報、あるいは出荷情報などを扱うこともできる。これらに限らず、情報系サービスを提供する装置を上位ネットワーク３２に接続するようにしてもよい。情報系サービスとしては、制御対象の製造装置または設備からの情報を取得して、マクロ的またはミクロ的な分析などを行う処理が想定される。たとえば、情報系サービスとしては、制御対象の製造装置または設備からの情報に含まれる何らかの特徴的な傾向を抽出するデータマイニング、あるいは制御対象の設備または機械からの情報に基づく機械学習を行うための機械学習ツールなどが想定される。

【0066】

表示装置５００は、ユーザからの操作を受けて、制御装置３００に対してユーザ操作に応じたコマンドなどを出力するとともに、制御装置３００での演算結果などをグラフィカルに表示する。

【0067】

制御装置３００には、サポート装置４００が接続可能になっている。サポート装置４００は、上位ネットワーク３２またはインターネット９００を介して制御装置３００に接続されてもよい。サポート装置４００は、制御装置３００が制御対象を制御するために必要な準備を支援する装置である。具体的には、サポート装置４００は、制御装置３００で実行されるプログラムの開発環境（プログラム作成編集ツール、パーサ、およびコンパイラなど）、制御装置３００および制御装置３００に接続される各種デバイスの構成情報（コンフィギュレーション）を設定するための設定環境、生成したプログラムを制御装置３００へ出力する機能、および制御装置３００上で実行されるプログラムなどをオンラインで修正および変更を行う機能などを提供する。

【0068】

制御システム３においては、制御装置３００、サポート装置４００、および表示装置５００がそれぞれ別体として構成されているが、これらの機能の全部または一部を単一の装置に集約するような構成が採用されてもよい。

【0069】

制御装置３００は、一の生産現場のみで使用される場合に限らず、他の生産現場においても使用される。また、一の生産現場内においても複数の異なるラインで使用される場合もある。

【0070】

＜制御装置のハードウェア構成例＞
図１６は、図１５の制御装置３００のハードウェア構成例を示すブロック図である。図１４に示されるように、制御装置３００は、プロセッサ３０２と、メインメモリ３０４と、ストレージ３６０と、メモリカードインターフェイス３１２と、上位ネットワークコントローラ３０６と、フィールドネットワークコントローラ３０８と、ローカルバスコントローラ３１６と、ＵＳＢ（Universal Serial Bus）インターフェイスを提供するＵＳＢコントローラ３７０とを含む。これらのコンポーネントは、プロセッサバス３１８を介して接続されている。

【0071】

図１６に示されるように、プロセッサ３０２は、制御演算を実行する演算処理部に相当し、ＣＰＵ（Central Processing Unit）および／またはＧＰＵ（Graphics Processing Unit）などで構成される。具体的には、プロセッサ３０２は、ストレージ３６０に保存されたプログラムを読み出して、メインメモリ３０４に展開して実行することで、制御対象に対する制御演算を実現する。

【0072】

メインメモリ３０４は、ＤＲＡＭ（Dynamic Random Access Memory）および／またはＳＲＡＭ（Static Random Access Memory）などの揮発性記憶装置などで構成される。ストレージ３６０は、たとえば、ＳＳＤ（Solid State Drive）および／またはＨＤＤ（Hard Disk Drive）などの不揮発性記憶装置などで構成される。

【0073】

ストレージ３６０には、制御プログラムＰｃと、教師データＤｔと、予測モデルＭｐとが保存されている。ストレージ３６０は、図１の記憶部１４０に対応する。制御プログラムＰｃは、制御装置３００を統合的に制御して、制御装置３００の各機能を実現するためのプログラムを含む。すなわち、制御プログラムＰｃを実行するプロセッサ３０２が、図１のフィードバック制御系（フィードバック制御部１１０および減算器１５０）、フィードフォワード制御系（フィードフォワード補償部１２０および加算器１６０）、ならびに学習データ生成部１３０および学習部１７０に対応する。

【0074】

メモリカードインターフェイス３１２は、着脱可能な記憶媒体の一例であるメモリカード３１４を受け付ける。メモリカードインターフェイス３１２は、メモリカード３１４に対して任意のデータの読み書きが可能になっている。

【0075】

上位ネットワークコントローラ３０６は、上位ネットワーク３２（たとえばローカルエリアネットワーク）を介して、上位ネットワーク３２に接続された任意の情報処理装置との間でデータを遣り取りする。

【0076】

フィールドネットワークコントローラ３０８は、フィールドネットワーク２０を介して、サーボモータ２２２＿１，２２２＿２等の任意のデバイスとの間でデータを遣り取りする。

【0077】

ローカルバスコントローラ３１６は、ローカルバス１２２を介して、制御装置３００を構成する任意の機能ユニット３８０との間でデータを遣り取りする。機能ユニット３８０は、たとえば、アナログ信号の入力および／または出力を担当するアナログＩ／Ｏユニット、デジタル信号の入力および／または出力を担当するデジタルＩ／Ｏユニット、ならびにエンコーダなどからのパルスを受け付けるカウンタユニットなどからなる。

【0078】

ＵＳＢコントローラ３７０は、ＵＳＢ接続を介して、任意の情報処理装置との間でデータを遣り取りする。ＵＳＢコントローラ３７０には、たとえばサポート装置４００が接続される。

【0079】

以上、実施の形態３に係る装置、教師データの生成プログラム、および教師データの生成方法によれば、制御対象に対するフィードフォワード制御の精度を向上させることができる。

【0080】

＜付記＞
上記したような本実施の形態は、以下のような技術思想を含む。

【0081】

［構成１］
外乱（ｄｓ）を受ける制御対象（２００）へのフィードバック操作量（ｒｂ）のフィードフォワード補償値（ｒｆ）を予測する予測モデル（Ｍｐ）に対する機械学習のための装置（１００）であって、
前記フィードバック操作量（ｒｂ）は、目標値（ｑｒ）と前記制御対象（２００）の制御量（ｑ）との誤差（ｅｑ）に基づいて、前記制御量（ｑ）が前記目標値（ｑｒ）に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量（ｒｂ）および前記フィードフォワード補償値（ｒｆ）の和が、操作量（ｒ）として前記制御対象（２００）に前記制御装置から出力され、
前記外乱（ｄｓ）は、第１要素（ｄｓｋ）と、第２要素（ｄｓｕ）とを含み、
前記予測モデル（Ｍｐ）は、前記第１要素（ｄｓｋ）の計測値（ｄｏ）から前記フィードフォワード補償値（ｒｆ）を予測し、
前記装置（１００）は、学習データ生成部（１３０）を備え、
前記学習データ生成部（１３０）は、
複数のタイミングにおいて取得された、前記目標値（ｑｒ）と、前記目標値（ｑｒ）に対応する前記操作量（ｒ）と、前記計測値（ｄｏ）と、前記計測値（ｄｏ）および前記操作量（ｒ）の両方に対応する前記制御量（ｑ）とを含む複数の第１組合せ（Ｃｍ１）のうち、前記誤差（ｅｑ）と第１基準値（α）との比較に基づいて、前記計測値（ｄｏ）と前記操作量（ｒ）とを含む複数の第２組合せ（Ｃｍ２）をそれぞれ特定し、
前記複数の第２組合せ（Ｃｍ２）にそれぞれ含まれる複数の操作量（ｒ）において、前記第１要素（ｄｓｋ）に対応するための複数の第１成分（ｒｆ）と、前記第２要素（ｄｓｕ）に対応するための複数の第２成分（ｒｂ）とをそれぞれ特定し、
前記複数のタイミングにおける第２組合せ（Ｃｍ２）にそれぞれ含まれる複数の計測値（ｄｏ）に前記複数の第１成分（ｒｆ）を正解としてそれぞれ対応させた教師データ（Ｄｔ）を出力する、装置（１００）。

【0082】

［構成２］
前記教師データ（Ｄｔ）を用いて前記予測モデル（Ｍｐ）に対して前記機械学習を行う学習部をさらに備え、
前記学習部（１７０）は、
前記予測モデル（Ｍｐ）によって表現される、前記複数の計測値（ｄｏ）と前記複数の第１成分（ｒｆ）との関係を、前記フィードフォワード補償値（ｒｆ）を目的変数とするとともに、前記計測値（ｄｏ）を説明変数とする関数として近似し、
前記複数の第１組合せ（Ｃｍ１）のうち前記計測値（ｄｏ）の絶対値が第２基準値より大きい第３組合せの数に対する、前記複数の第２組合せ（Ｃｍ２）のうち前記計測値（ｄｏ）の絶対値が前記第２基準値より大きい第４組合せの数の割合が第３基準値より大きい場合、前記機械学習を終了する、構成１に記載の装置（１００）。

【0083】

［構成３］
前記学習部（１７０）は、前記機械学習が終了し、かつ、前記割合が前記第３基準値より小さい場合、前記機械学習を再開する、構成２に記載の装置（１００）。

【0084】

［構成４］
前記第２要素（ｄｓｕ）は、計測されない、構成１～３のいずれか１つに記載の装置（１００）。

【0085】

［構成５］
外乱（ｄｓ）を受ける制御対象（２００）へのフィードバック操作量（ｒｂ）のフィードフォワード補償値（ｒｆ）を予測する予測モデル（Ｍｐ）に対する機械学習のための教師データの生成プログラムであって、
前記フィードバック操作量（ｒｂ）は、目標値（ｑｒ）と前記制御対象（２００）の制御量（ｑ）との誤差（ｅｑ）に基づいて、前記制御量（ｑ）が前記目標値（ｑｒ）に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量（ｒｂ）および前記フィードフォワード補償値（ｒｆ）の和が、操作量（ｒ）として前記制御対象（２００）に前記制御装置から出力され、
前記外乱（ｄｓ）は、第１要素（ｄｓｋ）と、第２要素（ｄｓｕ）とを含み、
前記予測モデル（Ｍｐ）は、前記第１要素（ｄｓｋ）の計測値（ｄｏ）から前記フィードフォワード補償値（ｒｆ）を予測し、
前記教師データの生成プログラムは、プロセッサに実行されることによって、
複数のタイミングにおいて取得された、前記目標値（ｑｒ）と、前記目標値（ｑｒ）に対応する前記操作量（ｒ）と、前記計測値（ｄｏ）と、前記計測値（ｄｏ）および前記操作量（ｒ）の両方に対応する前記制御量（ｑ）とを含む複数の第１組合せ（Ｃｍ１）のうち、前記誤差（ｅｑ）と第１基準値（α）との比較に基づいて、前記計測値（ｄｏ）と前記操作量（ｒ）とを含む複数の第２組合せ（Ｃｍ２）をそれぞれ特定し、
前記複数の第２組合せ（Ｃｍ２）にそれぞれ含まれる複数の操作量（ｒ）において、前記第１要素（ｄｓｋ）に対応するための複数の第１成分（ｒｆ）と、前記第２要素（ｄｓｕ）に対応するための複数の第２成分（ｒｂ）とをそれぞれ特定し、
前記複数のタイミングにおける第２組合せ（Ｃｍ２）にそれぞれ含まれる複数の計測値（ｄｏ）に前記複数の第１成分（ｒｆ）を正解としてそれぞれ対応させた教師データ（Ｄｔ）を出力する、教師データの生成プログラム。

【0086】

［構成６］
外乱（ｄｓ）を受ける制御対象（２００）へのフィードバック操作量（ｒｂ）のフィードフォワード補償値（ｒｆ）を予測する予測モデル（Ｍｐ）に対する機械学習のための教師データの生成方法であって、
前記フィードバック操作量（ｒｂ）は、目標値（ｑｒ）と前記制御対象（２００）の制御量（ｑ）との誤差（ｅｑ）に基づいて、前記制御量（ｑ）が前記目標値（ｑｒ）に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量（ｒｂ）および前記フィードフォワード補償値（ｒｆ）の和が、操作量（ｒ）として前記制御対象（２００）に前記制御装置から出力され、
前記外乱（ｄｓ）は、第１要素（ｄｓｋ）と、第２要素（ｄｓｕ）とを含み、
前記予測モデル（Ｍｐ）は、前記第１要素（ｄｓｋ）の計測値（ｄｏ）から前記フィードフォワード補償値（ｒｆ）を予測し、
前記教師データの生成方法は、
複数のタイミングにおいて取得された、前記目標値（ｑｒ）と、前記目標値（ｑｒ）に対応する前記操作量（ｒ）と、前記計測値（ｄｏ）と、前記計測値（ｄｏ）および前記操作量（ｒ）の両方に対応する前記制御量（ｑ）とを含む複数の第１組合せ（Ｃｍ１）のうち、前記誤差（ｅｑ）と第１基準値（α）との比較に基づいて、前記計測値（ｄｏ）と前記操作量（ｒ）とを含む複数の第２組合せ（Ｃｍ２）をそれぞれ特定することと、
前記複数の第２組合せ（Ｃｍ２）にそれぞれ含まれる複数の操作量（ｒ）において、前記第１要素（ｄｓｋ）に対応するための複数の第１成分（ｒｆ）と、前記第２要素（ｄｓｕ）に対応するための複数の第２成分（ｒｂ）とをそれぞれ特定することと、
前記複数のタイミングにおける第２組合せ（Ｃｍ２）にそれぞれ含まれる複数の計測値（ｄｏ）に前記複数の第１成分（ｒｆ）を正解としてそれぞれ対応させた教師データ（Ｄｔ）を出力することとを含む、教師データの生成方法。

【0087】

［構成７］
前記教師データ（Ｄｔ）を用いて前記予測モデル（Ｍｐ）に対して前記機械学習を行って学習済みモデルを生成する方法をさらに含み、
前記学習済みモデルを生成する方法は、
前記予測モデル（Ｍｐ）によって表現される、前記複数の計測値（ｄｏ）と前記複数の第１成分（ｒｆ）との関係を、前記フィードフォワード補償値（ｒｆ）を目的変数とするとともに、前記計測値（ｄｏ）を説明変数とする関数として近似するステップと、
前記複数の第１組合せ（Ｃｍ１）のうち前記計測値（ｄｏ）の絶対値が第２基準値より大きい第３組合せの数に対する、前記複数の第２組合せ（Ｃｍ２）のうち前記計測値（ｄｏ）の絶対値が前記第２基準値より大きい第４組合せの数の割合が第３基準値より大きい場合、前記機械学習を終了するステップとを含む、構成６に記載の教師データの生成方法。

【0088】

［構成８］
前記学習済みモデルを生成する方法は、前記機械学習が終了し、かつ、前記割合が前記第３基準値より小さい場合、前記機械学習を再開するステップをさらに含む、構成７に記載の教師データの生成方法。

【0089】

今回開示された各実施の形態は、矛盾しない範囲で適宜組み合わされて実施されることも予定されている。今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0090】

２，３制御システム、１１フィードバック制御装置、１２フィードフォワード補償装置、１３学習データ生成装置、１４記憶装置、１７学習装置、２０フィールドネットワーク、３２上位ネットワーク、１００，１００Ａ，３００制御装置、１１０フィードバック制御部、１２０フィードフォワード補償部、１２２ローカルバス、１３０学習データ生成部、１４０記憶部、１５０減算器、１６０加算器、１７０学習部、２００制御対象、２００Ｃフィールドデバイス、２２２サーボモータ、３０２プロセッサ、３０４メインメモリ、３０６上位ネットワークコントローラ、３０８フィールドネットワークコントローラ、３１２メモリカードインターフェイス、３１４メモリカード、３１６ローカルバスコントローラ、３１８プロセッサバス、３６０ストレージ、３７０コントローラ、３８０機能ユニット、４００サポート装置、５００表示装置、６００サーバ装置、７００ゲートウェイ、９００インターネット、Ｃｍ１～Ｃｍ４組合せ、Ｃｒ割合、Ｄｔ教師データ、Ｆｎ１，Ｆｎ２，Ｆｎ１２予測関数、Ｍｐ予測モデル、Ｐｃ制御プログラム、Ｒｇ重複範囲、Ｓｃｍ１～Ｓｃｍ４データセット、Ｔｐ１，Ｔｐ２試行期間、ｄｓｋ計測要素、ｄｏ，ｄｏ１２計測値、ｄｓ外乱、ｄｓｕ非計測要素、ｅｑ誤差、ｏｔ１～ｏｔ４外れ値、ｑ制御量、ｑｒ目標値、ｒ操作量、ｒｂフィードバック操作量、ｒｆ，ｒｆ１，ｒｆ２フィードフォワード補償値。

【図1】