(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024023119
(43)【公開日】2024-02-21
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
G05B 13/02 20060101AFI20240214BHJP
G05B 13/04 20060101ALI20240214BHJP
G05B 23/02 20060101ALI20240214BHJP
【FI】
G05B13/02 A
G05B13/04
G05B23/02 P
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023003909
(22)【出願日】2023-01-13
(31)【優先権主張番号】P 2022126508
(32)【優先日】2022-08-08
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000102692
【氏名又は名称】NTN株式会社
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】成田 武史
(72)【発明者】
【氏名】丸井 直樹
【テーマコード(参考)】
3C223
5H004
【Fターム(参考)】
3C223AA11
3C223BA03
3C223CC02
3C223DD03
3C223EB02
3C223EB07
3C223FF02
3C223FF12
3C223FF22
3C223FF26
3C223GG01
5H004GA01
5H004GA30
5H004GB15
5H004HA16
5H004KC33
5H004KC39
5H004KD62
(57)【要約】
【課題】手作業での調整を行なうことなく適正パラメータを推定する。
【解決手段】パラメータ調整装置(5)は、産業機械の座標データを取得する座標データ取得部(10)と、動作パラメータを生成するパラメータ生成部(20)と、動作パラメータを記憶するパラメータ記憶部(30)と、産業機械の状態データを取得する状態データ取得部(40)と、状態データに基づいて指標データを計算する指標データ計算部(50)と、動作パラメータと指標データとを紐付けたサンプルデータを記憶するサンプル記憶部(60)と、サンプルデータを用いて適正と推定される動作パラメータを探索するパラメータ探索部(70)と、適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて座標データから適正パラメータを推定するための学習モデルを生成するモデル学習部(80)とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
制御器によって制御される駆動装置の情報処理装置であって、
前記駆動装置の動作座標を示す座標データを外部から取得する座標データ取得部と、
前記制御器による前記駆動装置の制御に用いられる動作パラメータを生成するパラメータ生成部と、
前記動作パラメータを記憶し、前記動作パラメータを含む動作指令を前記制御器に出力するパラメータ記憶部と、
前記動作パラメータによる動作中の前記駆動装置の状態を示す状態データを取得する状態データ取得部と、
前記動作パラメータの適否を判定するための指標となる指標データを前記状態データに基づいて計算する指標データ計算部と、
前記動作パラメータと前記指標データとを紐付けたサンプルデータを記憶するサンプル記憶部と、
前記指標データに基づいて適正と推定される動作パラメータを前記サンプルデータを用いて探索するパラメータ探索部と、
前記パラメータ探索部によって適正と推定される動作パラメータと前記座標データとを紐付けた学習用データを用いて、前記座標データの動作を行なうのに適した動作パラメータである適正パラメータを前記座標データから推定するための学習モデルを生成するモデル学習部とを備える、情報処理装置。
【請求項2】
前記モデル学習部が生成した前記学習モデルを記憶するモデル記憶部と、
前記座標データ取得部が取得した前記座標データを、前記モデル記憶部が記憶している前記学習モデルに入力することで、前記適正パラメータを出力するパラメータ出力部とをさらに備える、請求項1に記載の情報処理装置。
【請求項3】
前記パラメータ探索部は、前記パラメータ探索部によって適正と推定される動作パラメータで前記駆動装置を制御するように前記制御器に指令し、
前記状態データ取得部は、前記パラメータ探索部によって適正と推定される動作パラメータで前記駆動装置を動作させた場合の前記駆動装置の状態を示す探索状態データを取得し、
前記指標データ計算部は、前記探索状態データに基づいて前記指標データを計算し、
前記サンプル記憶部は、前記探索状態データに基づいて適正と判定される動作パラメータと前記座標データとを紐付けたデータを前記学習用データとして記憶し、
前記モデル学習部は、前記サンプル記憶部に記憶された前記学習用データを用いて前記学習モデルを生成する、請求項1または2に記載の情報処理装置。
【請求項4】
前記状態データ取得部は、前記パラメータ探索部によって適正と推定される動作パラメータで前記駆動装置を動作させた場合の前記駆動装置の状態を示す探索状態データを取得し、
前記指標データ計算部は、前記探索状態データに基づいて2種類以上の指標を計算して、計算された前記2種類以上の指標の組合せを前記指標データとし、
前記パラメータ探索部は、前記指標データを構成するそれぞれの指標に基づいて、多目的最適化手法を用いて適正と判定される動作パラメータを推定する、請求項1または2に記載の情報処理装置。
【請求項5】
前記パラメータ生成部は、前記パラメータ探索部のパラメータ探索方法に応じて設定された第1所定数の動作パラメータを生成する、請求項1または2に記載の情報処理装置。
【請求項6】
前記モデル学習部は、前記モデル学習部のモデル学習方法に応じて設定された第2所定数の学習用データが前記サンプル記憶部に記憶された場合に、前記第2所定数の前記学習用データを用いて前記学習モデルを生成する、請求項1または2に記載の情報処理装置。
【請求項7】
前記パラメータ探索部は、
前記サンプル記憶部が記憶している前記サンプルデータを用いて、前記動作パラメータから前記指標データを推定するための探索用モデルを生成する探索用モデル構築部と、
前記探索用モデルを記憶する探索用モデル記憶部と、
前記探索用モデルを用いて推定される前記指標データに基づいて適正と推定される動作パラメータを探索するパラメータ推定部とを備える、請求項1または2に記載の情報処理装置。
【請求項8】
前記状態データ取得部は、駆動装置からトルクデータを取得し、
前記指標データ計算部は、前記トルクデータから計算したトルクの振動振幅値とトルク波形の減衰率の線形結合を駆動装置の位置決め後の残留振動を示す指標とする、請求項1または2に記載の情報処理装置。
【請求項9】
前記モデル学習部は、前記サンプル記憶部が記憶している学習用データを複数のグループに分割する分類モデルと、前記複数のグループに対応してそれぞれ設けられる複数の回帰モデルとを生成する、請求項1または2に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、生産設備の位置決めに用いられる産業機械などの駆動装置の動作の制御に用いられる動作パラメータを、自動で調整する情報処理装置に関する。
【背景技術】
【0002】
特許文献1は、産業機械に対する動作指令に応じて、適切な制御パラメータを適用するパラメータ調整装置を開示する。特許文献1に記載のパラメータ調整装置は、産業機械の動作における速度、加速度、ジャークの少なくとも1つの指令を含む状態データ、および産業機械を制御する制御器から取得した該動作の最適パラメータに基づいて、状態データから最適な制御パラメータを推定するためのモデルを機械学習によって生成し、動作指令に応じて適した動作パラメータをモデルから取得し、適用する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
多軸ロボット等の産業機械の動作を制御する上で、産業機械の動作時の振動、および軌道のズレを修正するためには、ゲインパラメータを始めとした制御パラメータの調整を行なうことが求められる。一方、制御パラメータを適切に調整するには、制御およびセンサに関する知識が必要となる上に、産業機械には個体差があるため、それらに対応できるだけの経験も必要となることから、制御パラメータの調整は未だに手作業での試行錯誤によって行なわれているのが現状である。
【0005】
特許文献1は、工作機械、ロボット等の産業機械の速度、加速度、ジャーク等の指令に応じて、より適した制御パラメータを設定するパラメータ調整装置を提案している。しかし、たとえば、予め設定した座標間の位置決め等の動作において、動作時間の短縮を目的に、産業機械に可能な限り早く動作することを望む場合、速度、加速度、ジャークについても、適切な値に調整する手間が必要となる。
【0006】
特に、制御対象である位置決め装置の剛性や振動特性が、位置決め装置の現在の位置や姿勢によって大きく変わる場合、位置決め可能な全領域に対して固定された1組の制御パラメータを用いると、条件の悪い姿勢を考慮しなくてはならないため、全体として動作時間の短縮が困難である。
【0007】
本開示は、上記の課題を解決するためになされたものであって、その目的は、従来のような手作業での試行錯誤による調整を行なうことなく、駆動装置の動作を行なうのに適した動作パラメータ(制御パラメータ)を推定することである。
【課題を解決するための手段】
【0008】
本開示による情報処理装置は、制御器によって制御される駆動装置の情報処理装置であって、駆動装置の動作座標を示す座標データを外部から取得する座標データ取得部と、制御器による駆動装置の制御に用いられる動作パラメータを生成するパラメータ生成部と、動作パラメータを記憶するパラメータ記憶部と、動作パラメータによる動作中の駆動装置の状態を示す状態データを取得する状態データ取得部と、動作パラメータの適否を判定するための指標となる指標データを状態データに基づいて計算する指標データ計算部と、動作パラメータと指標データとを紐付けたサンプルデータを記憶するサンプル記憶部と、指標データに基づいて適正と推定される動作パラメータをサンプルデータを用いて探索するパラメータ探索部と、パラメータ探索部によって適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データの動作を行なうのに適した動作パラメータである適正パラメータを座標データから推定するための学習モデルを生成するモデル学習部とを備える。
【発明の効果】
【0009】
本開示によれば、座標データ取得部に座標データを入力することによって、動作パラメータが生成され、その動作パラメータによる状態データから指標データが計算され、指標データに基づいて適正と推定される動作パラメータが探索される。そして、適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データから適正パラメータを推定するための学習モデルが生成される。すなわち、情報処理装置に座標データを入力するだけで、座標データから適正パラメータを推定するための学習モデルを生成することができる。そのため、従来のような手作業での試行錯誤によるパラメータ調整を行なうことなく、この学習モデルに座標データを入力するだけで、座標データの動作を行なうのに適した動作パラメータを推定することができる。
【図面の簡単な説明】
【0010】
【
図1】パラメータ調整装置(情報処理装置)を備える制御システムの全体構成の一例を模式的に示す図である。
【
図4】モデル学習部の学習の一例を模式的に示す図(その1)である。
【
図5】学習モデルを生成する処理手順の一例を示すフローチャートである。
【
図6】サンプルデータを生成する処理の詳細な流れの一例を示すフローチャートである。
【
図7】学習用データを生成する処理の詳細な流れの一例を示すフローチャートである。
【
図8】適正パラメータの出力の一例を示す図(その1)である。
【
図9】適正パラメータを出力する処理手順の一例を示す。
【
図10】パラメータ調整装置の構成の一例を模式的に示す図(その1)である。
【
図11】パラメータ調整装置の構成の一例を模式的に示す図(その2)である。
【
図12】モデル学習部の学習の一例を模式的に示す図(その2)である。
【
図13】適正パラメータの出力の一例を示す図(その2)である。
【
図15】角度調整装置の構成の一例を示す図である。
【
図16】パラレルリンク機構の構成の一例を示す斜視図である。
【
図17】一組のリンク機構を直線で表現した図である。
【発明を実施するための形態】
【0011】
以下、本開示の実施の形態について図面を参照しつつ説明する。なお、以下の図面において同一または相当する部分には同一の参照番号を付し、その説明は繰り返さない。
【0012】
図1は、本実施の形態によるパラメータ調整装置5(情報処理装置)を備える制御システム1の全体構成の一例を模式的に示す図である。
【0013】
この制御システム1は、産業機械2と、制御器3と、センサ4と、パラメータ調整装置5とを備える。産業機械2は、制御器3の制御対象となる駆動装置(モータあるいは空圧シリンダなどアクチュエータ)を含んで構成される。産業機械2は、たとえば、生産設備等に用いられる、多軸ロボット、工作機械などである。
【0014】
制御器3は、予め設定された動作パラメータに従って産業機械2の動作(位置決め動作など)の制御を行なう。動作パラメータとは、産業機械2の動作時の速度、加速度等の速度に関連するパラメータ、および産業機械2の制御に用いられる制御パラメータである。制御パラメータは、たとえば、PID制御におけるゲインパラメータ、状態フィードバックの係数、ロバスト制御のパラメータである。
【0015】
制御器3は、産業機械2の状態データを取得することができる。状態データとは、産業機械2の動作中における状態を示すデータであって、たとえば、制御器3に予め組み込まれたプログラムによって生成される信号、制御対象となるモータを流れる電流値、追従誤差等のフィードバック信号などである。パラメータ調整装置5は、産業機械2の状態データを制御器3から取得することができる。
【0016】
制御器3には、複数の座標データが設定されている。座標データとは、産業機械2を動作させる上で設定される始点座標と終点座標とを一組にしたデータである。たとえば、制御器3の制御対象が産業機械2のモータである場合、座標データは、モータの出力軸の始点角度と終点角度とを一組にしたデータとすることができる。
【0017】
センサ4は、産業機械2の状態データを検出する。センサ4は、たとえば、加速度ピックアップである。パラメータ調整装置5は、産業機械2の状態データを、制御器3からだけでなく、必要に応じてセンサ4からも取得することができる。なお、センサ4は省略されてもよい。
【0018】
パラメータ調整装置5は、産業機械2の座標データを入力として産業機械2の適正パラメータを出力する情報処理装置である。適正パラメータは、産業機械2がある座標データの動作を行なうのに適した動作パラメータである。本実施の形態においては、後述する指標データ計算部50によって計算される指標データに基づいて、動作パラメータの適否が判定される。すなわち、指標データは、動作パラメータが適正であるか否かを評価するための指標となるデータである。たとえば、産業機械2が位置決め動作を行なう場合には、指標データは、位置決め動作の継続時間、位置決め動作終了後の振動の最大振幅、振動時間、位置偏差の累計値、あるいは、それらの組み合わせ等とすることができる。たとえば、指標データが位置決め動作の継続時間である場合、動作パラメータのうち、位置決め動作の継続時間が予め設定された閾値内に収まる動作パラメータが適正であると判定される。
【0019】
パラメータ調整装置5は、座標データ取得部10と、パラメータ生成部20と、パラメータ記憶部30と、状態データ取得部40と、指標データ計算部50と、サンプル記憶部60と、パラメータ探索部70と、モデル学習部80と、モデル記憶部90と、パラメータ出力部100とを備える。
【0020】
座標データ取得部10は、サンプル記憶部60から座標取得指令を受信すると、サンプル記憶部60に記憶されていない座標データを制御器3から取得する。たとえば、座標データ取得部10は、サンプル記憶部60に記憶されている座標データと、制御器3に記憶されている座標データとを照合し、制御器3に記憶されている座標データのなかに、サンプル記憶部60に記憶されていない座標データが存在する場合、サンプル記憶部60に記憶されていない座標データを制御器3から取得する。
【0021】
座標データ取得部10は、制御器3から座標データを取得すると、その座標データを学習フェーズで使用するのか、それとも活用フェーズで使用するのかを判定する。学習フェーズとは、座標データから適正パラメータを推定するための学習モデルを生成するフェーズである。活用フェーズとは、学習フェーズで生成された学習モデルに座標データを入力することによって、適正パラメータを出力するフェーズである。たとえば、座標データ取得部10は、サンプル記憶部60から受信する座標取得指令に座標データの使用目的を示す情報が含まれている場合には、座標取得指令に含まれる使用目的に応じて、制御器3から取得した座標データを学習フェーズで使用するのか、それとも活用フェーズで使用するのかを判定する。
[学習フェーズ]
制御器3から取得された座標データを「学習フェーズ」で使用する場合、パラメータ調整装置5は、座標データを入力とし適正パラメータを出力とする学習モデルを、2段階で生成する。1段階目では、後述のパラメータ探索部70が、制御器3に設定されている複数の座標データ(動作)の各々について、適正パラメータを探索する。2段階目では、後述するモデル学習部80が、座標データとその座標データにおける適正パラメータとの複数の組合せ(学習用データ)から、座標データを入力とし適正パラメータを出力とする学習モデルを機械学習を用いて生成する。以下、学習モデルの生成について詳細に説明する。
【0022】
座標データ取得部10は、制御器3から取得された座標データを「学習フェーズ」で使用すると判定した場合、その座標データとともにパラメータ生成指令をパラメータ生成部20に出力する。
【0023】
パラメータ生成部20は、座標データ取得部10から座標データおよびパラメータ生成指令を受信する毎に、受信した座標データに対して第1所定数の動作パラメータを生成し、生成した第1所定数の動作パラメータをその座標データとともにパラメータ記憶部30に記憶する。
【0024】
たとえば、パラメータ生成部20は、学習モデルの生成前に予め設定しておいた動作パラメータの探索範囲から、一様分布のような確率分布を用いてサンプリングされた動作パラメータを生成する。なお、動作パラメータの探索範囲は、たとえば、学習モデルの生成前に予め設定しておいた動作パラメータの下限値と上限値との間の範囲とすることができる。
【0025】
各座標データに対して生成される動作パラメータの数(すなわち上述の「第1所定数」)は、後述するパラメータ探索部70のパラメータ探索方法に応じて設定される。具体的には、第1所定数は、後述するパラメータ探索部70が各座標データに対する適正候補パラメータを探索するのに必要な数以上の値に設定される。第1所定数は、たとえば、外部から適切な値が設定されてもよい。パラメータ探索部70による適正候補パラメータの探索方法としてベイズ最適化が用いられる場合には、ベイズ最適化が1点のデータからでも適正値を探索できることに鑑み、各座標データに対して生成される動作パラメータの数(第1所定数)を「1」に設定するができる。そのため、適正パラメータの探索方法としてベイズ最適化以外の回帰モデルが用いられる場合と比較して、動作パラメータの生成数を少なく抑えることができる。
【0026】
各座標データに対して生成される動作パラメータの数(第1所定数)が2以上である場合、パラメータ生成部20は、生成された2以上の動作パラメータの各々に対して順番ラベルを付与する。順番ラベルは、制御器3が産業機械2を動作させる順番を示すものである。
【0027】
図2は、第1所定数がn(nは2以上の整数)である場合、すなわち、ある座標データに対してn個の動作パラメータが生成され、n個の動作パラメータにそれぞれn個の順番ラベルが付与される場合の、パラメータ生成の一例を示す図である。n個の順番ラベルは、たとえば、1からnまでの連続した整数値で表される。パラメータ生成部20は、n個(第1所定数)の順番ラベル付きの動作パラメータを、座標データともにパラメータ記憶部30に記憶する。なお、第1所定数の値は、固定値であってもよいし、座標データに応じて変更される変動値であってもよい。
【0028】
図1に戻って、パラメータ記憶部30は、ある座標データに対して
図2に示すような順番ラベルが付与された第1所定数の動作パラメータが記憶されると、それらのデータを含む動作指令を制御器3に出力する。
【0029】
制御器3は、パラメータ記憶部30からの動作指令を受信すると、動作指令に含まれる座標データの動作を、動作指令に含まれる第1所定数の動作パラメータを用いて、順番ラベルが示す順番で順次実行するように産業機械2を制御する。これにより、動作指令に含まれる1つの座標データの動作が、動作パラメータを変えながら第1所定数と同じ回数だけ実行されることになる。
【0030】
また、パラメータ記憶部30は、制御器3に動作指令を出力する際に、その動作指令を指標データ計算部50にも出力する。この際、パラメータ記憶部30は、動作指令の出力元がパラメータ記憶部30であることを示すラベルを動作指令に付与する。
【0031】
状態データ取得部40は、制御器3による産業機械2の動作中に、制御器3あるいはセンサ4から産業機械2の状態データを取得し、取得された状態データとともに計算指令を指標データ計算部50に出力する。
【0032】
指標データ計算部50は、状態データ取得部40から状態データおよび計算指令を受信すると、取得した状態データを用いて指標データを計算するとともに、状態データ取得部40が状態データを取得した時の動作パラメータをパラメータ記憶部30もしくは後述するパラメータ探索部70から取得する。
【0033】
指標データは、上述のように、動作パラメータが適正であるか否かを評価するための指標となるデータであって、たとえば、産業機械2の位置決め動作の継続時間である。たとえば、産業機械2の動作中に制御器3が状態データの1つとして連続的に信号を発信する場合、その信号が連続的に発信され続けた時間を、指標データ(位置決め動作の継続時間)とすることができる。
【0034】
また、指標データは2種類以上でもよい。例えば、上記の継続時間は産業機械2の動作時間に関する指標だが、これに加えて位置決め時の残留振動を考慮した指標も併せて計算し、動作時間と残留振動の2つのデータを組み合わせたものを1つの指標データとしてもよい。組み合わせ方については、例えば、2つ以上の指標の値を線形結合してもよいし、それぞれの指標の値を保持する形でもよい。
【0035】
また、残留振動を表現する指標としては、例えば産業機械2の先端に設置した加速度ピックアップから取得したデータを加工したものが考えられる。もしくは、産業機械2を制御する駆動装置からトルクデータを取得し、トルクデータの振動振幅とトルク波形の減衰率を線形結合した値を残留振動を表現する指標としてもよい。
【0036】
また、指標データ計算部50は、取得した動作パラメータが、パラメータ記憶部30から取得された動作パラメータであるのか、それとも、パラメータ探索部70から取得された動作パラメータ(後述の適正候補パラメータ)であるのかを判定する。たとえば、取得した動作パラメータに出力元を示すラベルが付与されている場合には、指標データ計算部50は、そのラベルを参照することによって、取得した動作パラメータがパラメータ記憶部30から取得された動作パラメータであるのか、それとも、パラメータ探索部70から取得された動作パラメータであるのかを判定する。
【0037】
取得した動作パラメータがパラメータ記憶部30から取得された動作パラメータである場合、指標データ計算部50は、取得した動作パラメータと指標データとを紐付けたサンプルデータを生成し、そのサンプルデータにパラメータ記憶部30から取得した動作パラメータであることを示すラベルと各サンプルデータの動作(座標データ)とを付与して、サンプル記憶部60に記憶する。
【0038】
なお、指標データ計算部50が取得した動作パラメータがパラメータ探索部70で探索された動作パラメータ(後述の適正候補パラメータ)である場合の処理については、後に詳述する。
【0039】
上述した一連のサンプルデータの生成処理は、パラメータ生成部20が座標データ取得部10から受信する複数の座標データの各々に対して行なわれる。したがって、各座標データに対して、複数(第1所定数)のサンプルデータがサンプル記憶部60に記憶される。
【0040】
サンプル記憶部60は、記憶されているサンプルデータをパラメータ探索部70に送信する。この際、サンプル記憶部60は、各座標データについて、記憶している全て(第1所定数以上)のサンプルデータをパラメータ探索部70に送信する。
【0041】
パラメータ探索部70は、サンプル記憶部60からサンプルデータを受信すると、受信したサンプルデータに基づいて、複数の座標データの各々について、適正パラメータを推定(探索)する機能を有する。具体的には、パラメータ探索部70は、探索用モデル構築部71と、探索用モデル記憶部72と、パラメータ推定部73とを含む。
【0042】
探索用モデル構築部71は、サンプル記憶部60からサンプルデータを取得した場合、サンプル記憶部60から取得したサンプルデータを用いて探索用モデルを生成する。探索用モデルは、動作パラメータを入力として指標データを出力するブラックボックス関数を推論する回帰モデルである。なお、探索用モデルは、複数の座標データに対して、それぞれ生成される。
【0043】
そして、探索用モデル構築部71は、生成した探索用モデルを、サンプルデータに付与されていた座標データとともに、探索用モデルとして探索用モデル記憶部72に出力する。これにより、探索用モデル記憶部72には、複数の座標データにそれぞれ対応する複数の探索用モデルが記憶される。
【0044】
探索用モデル記憶部72は、探索用モデル構築部71が生成した探索用モデルを記憶すると、パラメータ推定部73にパラメータ推定指令を出力する。
【0045】
パラメータ推定部73は、探索用モデル記憶部72からパラメータ推定指令を受信すると、探索用モデル記憶部72に記憶されている探索用モデルに基づいて、適正と推定される動作パラメータ(適正パラメータの候補となる動作パラメータ、以下「適正候補パラメータ」ともいう)を推定する。そして、パラメータ推定部73は、適正候補パラメータの推定に用いた座標データの動作を産業機械2に実行させる動作指令を制御器3に出力するとともに、推定した適正候補パラメータを指標データ計算部50に出力する。
【0046】
パラメータ探索部70による適正候補パラメータの推定は、たとえば、ベイズ最適化を用いて実施することができる。この場合、まず、探索用モデル構築部71においてガウス過程回帰モデルが生成され、生成されたガウス過程回帰モデルが探索用モデルとして探索用モデル記憶部72に記憶される。その後、パラメータ推定部73において、探索用モデルを用いてベイズ最適化を実施することによって、適正候補パラメータが推定(探索)される。ベイズ最適化による探索方法そのものは、論文等で既に公知であるため、ここでは詳細の説明を省略する。
【0047】
また、指標データが2種類以上の指標の値をセットで保持している場合、適正候補パラメータの推定に多目的最適化アルゴリズムを用いてもよい。多目的最適化については論文等で公知のため、ここでは詳細な説明は省略する。例えば適正候補パラメータの推定にベイズ最適化を用いるならば、獲得関数にEHVI(Expected Hypervolume Improvement)を用いることで、2つ以上の指標に基づくパレート解を、適正候補パラメータとして推定することができる。
【0048】
なお、適正候補パラメータの推定方法はベイズ最適化に限られない。たとえば、回帰モデルにニューラルネットワークを採用し、最適化方法に勾配法を用いた方法でもよい。もしくは、動作パラメータを入力とし指標データを出力とする関数をスプライン曲線で描画し、ピーク値の一つに対応するパラメータを適正パラメータとして推定する方法でもよい。
【0049】
指標データ計算部50は、パラメータ探索部70から動作パラメータ(適正候補パラメータ)を受信すると、状態データ取得部40から取得した状態データを用いて指標データを計算するとともに、計算した指標データを用いて、パラメータ探索部70から取得した動作パラメータが適正パラメータであるか否かを判定する。たとえば、指標データ計算部50は、計算した指標データと予め設定されている比較用の指標データとを比較し、計算した指標データが比較用の指標データに対して有意に改善されているとみなせる場合に、パラメータ探索部70から受信した動作パラメータ(適正候補パラメータ)を適正パラメータであると判定する。
【0050】
指標データが1種類の指標のみの場合、たとえば、指標データ計算部50は、計算した指標データyと比較用の指標データysとの差異dを下記の式(1)を用いて定量化する。
【0051】
d=1-y/ys ・・・(1)
そして、式(1)で算出された差異dが予め設定された閾値内に収まる場合には、指標データ計算部50は、受信した動作パラメータ(適正候補パラメータ)を適正パラメータであると判定する。一方、式(1)で算出された差異dが予め設定された閾値内に収まらない場合には、指標データ計算部50は、受信した動作パラメータ(適正候補パラメータ)を適正パラメータでないと判定する。
【0052】
指標データが2種類以上の指標の値をセットで保持している場合、例えば、指標データを構成する指標それぞれについて上記の式(1)の計算を行うことで指標毎に差異dを計算し、指標毎に計算した差異dを足し合わせた値が予め設定した閾値内に収まれば適正パラメータと判定する。
【0053】
受信した動作パラメータ(適正候補パラメータ)が適正パラメータである場合、指標データ計算部50は、その動作パラメータと指標データとを紐付けたサンプルデータに、そのサンプルデータ中の動作パラメータがパラメータ探索部70から取得されたことを示すラベルと、そのサンプルデータの動作(座標データ)と、そのサンプルデータ中の動作パラメータが適正パラメータであることを示すラベルとを付与して、サンプル記憶部60に記憶する。
【0054】
一方、受信した動作パラメータ(適正候補パラメータ)が適正パラメータでない場合、指標データ計算部50は、動作パラメータと指標データとを紐付けたサンプルデータに、そのサンプルデータ中の動作パラメータがパラメータ探索部70から取得されたことを示すラベルと、そのサンプルデータの動作(座標データ)と、そのサンプルデータ中の動作パラメータが適正パラメータでないことを示すラベルとを付与して、サンプル記憶部60に記憶する。
【0055】
なお、サンプルデータに付与される各ラベルは、たとえば「0」または「1」の2値の整数によって構成することができる。なお、サンプルデータに付与する複数のラベルを1つのラベルに統合してもよい。たとえば、サンプルデータ中の動作パラメータがパラメータ記憶部30から取得された動作パラメータである場合には「0」、サンプルデータ中の動作パラメータがパラメータ探索部70で探索された動作パラメータであり、かつ適正パラメータでない場合には「1」、サンプルデータ中の動作パラメータがパラメータ探索部70で探索された動作パラメータであり、かつ適正パラメータである場合には「2」とする、3値の整数を付与してもよい。こうすることで、サンプルデータに付与するラベルの数を削減することができる。
【0056】
図3は、サンプル記憶部60が記憶しているサンプルデータの一例を示す図である。
図3には、複数の動作1,2,…(複数の座標データ1,2,…)の各々について、複数のサンプルデータが生成される例が示されている。
【0057】
動作1(座標データ1)のサンプルデータには、パラメータ生成部20で生成されたn個の動作パラメータに基づいてn回の動作1を行なうことでそれぞれ得られたn個のサンプルデータと、パラメータ探索部70で推定されたm個の動作パラメータに基づいてm回の動作1を行なうことでそれぞれ得られたm個のサンプルデータとの、合計(n+m)個のサンプルデータが含まれている。
【0058】
さらに、パラメータ生成部20で生成された動作パラメータを含むn個のサンプルデータには、パラメータ生成部20で生成されたことを示すラベルと、座標データ1を示すラベルとが付与されている。一方、パラメータ探索部70で推定された動作パラメータを含むm個のサンプルデータには、パラメータ探索部70で推定されたことを示すラベルと、座標データ1を示すラベルとに加えて、適正パラメータであるか否かを示すラベルが付与されている。
【0059】
座標データ2に対応する動作2のサンプルデータも、動作1のサンプルデータと同様である。具体的には、動作2のサンプルデータには、パラメータ生成部20で生成されたp個の動作パラメータを含むp個のサンプルデータと、パラメータ探索部70で推定されたq個の動作パラメータを含むq個のサンプルデータとの、合計(p+q)個のサンプルデータが含まれている。
【0060】
また、パラメータ生成部20で生成された動作パラメータを含むp個のサンプルデータには、パラメータ生成部20で生成されたことを示すラベルと、座標データ2を示すラベルとが付与されている。パラメータ探索部70で推定された動作パラメータを含むq個のサンプルデータには、パラメータ探索部70で推定されたことを示すラベルと、座標データ2を示すラベルとに加えて、適正パラメータであるか否かを示すラベルが付与されている。
【0061】
図3に示す例では、動作1(座標データ1)に対しては、(n+m)番目のサンプルデータに含まれる動作パラメータが適正パラメータであると判定されている。また、動作2(座標データ2)に対しては、(p+q)番目のサンプルデータに含まれる動作パラメータが適正パラメータであると判定されている。このような座標データとその座標データに対する適正パラメータとの組合せが、学習用データとして、後述するモデル学習部80による学習モデルの生成に用いられる。
【0062】
なお、
図3に示す例では、(座標データ1、動作パラメータn+m)、(座標データ2、動作パラメータp+q)の2組が学習用データとして示されているが、実際には、サンプル記憶部60には、後述するモデル学習部80のモデル学習方法に応じて設定された第2所定数の学習用データが記憶される。サンプル記憶部60に記憶されている学習用データの数である「第2所定数」は、後述するモデル学習部80による学習モデルの生成に必要な数以上の値に設定される。
【0063】
図1に戻って、サンプル記憶部60に第2所定数の学習用データが記憶されると、サンプル記憶部60は、モデル学習指令をモデル学習部80に送信する。
【0064】
モデル学習部80は、サンプル記憶部60からモデル学習指令を受信すると、サンプル記憶部60に記憶されている第2所定数の学習用データを用いて、座標データを入力として適正パラメータを出力とする学習モデルを生成する。モデル学習部80は、たとえば、ニューラルネットワークを用いた深層学習によって学習モデルを生成する。モデル学習部80は、生成した学習モデルをモデル記憶部90に記憶する。
【0065】
図4は、モデル学習部80の学習の一例を模式的に示す図である。
図4に示される学習モデルは、機械学習(たとえば、ニューラルネットワークを用いた深層学習)によって得られた回帰モデルである。
図4に示されるように、モデル学習部80は、r個(第2所定数)の学習用データ(座標データと適正パラメータとの組合せ)を用いて機械学習を行なうことによって、座標データを入力として適正パラメータを出力とする学習モデルを生成する。
【0066】
図5は、パラメータ調整装置5が学習フェーズにおいて学習モデルを生成する処理手順の一例を示すフローチャートである。このフローチャートは、座標データ取得部10が制御器3から取得した座標データを「学習フェーズ」で使用すると判定した場合に開始される。
【0067】
まず、座標データ取得部10が、制御器3から取得した座標データとともにパラメータ生成指令をパラメータ生成部20に出力する(ステップS10)。
【0068】
次いで、パラメータ生成部20が、座標データ取得部10から受信した座標データに対して、第1所定数の動作パラメータを生成し、生成した第1所定数の動作パラメータをその座標データとともにパラメータ記憶部30に記憶する(ステップS20)。
【0069】
次いで、パラメータ記憶部30が、サンプルデータを生成する処理を行なう(ステップS30)。
【0070】
図6は、サンプルデータを生成する処理(
図5のステップS30)の詳細な流れの一例を示すフローチャートである。
【0071】
パラメータ記憶部30は、記憶されている第1所定数の動作パラメータのうちから、今回の処理対象となる動作パラメータを上述の順番ラベルを参照して特定し、特定された動作パラメータと座標データとを含む動作指令を生成する(ステップS31)。
【0072】
次いで、パラメータ記憶部30は、生成された動作指令を制御器3に出力する(ステップS32)。これにより、制御器3は、動作指令に応じて産業機械2を動作させる。
【0073】
次いで、状態データ取得部40が、制御器3による産業機械2の動作中に、制御器3あるいはセンサ4から産業機械2の状態データを取得する(ステップS33)。
【0074】
次いで、状態データ取得部40が、取得された状態データとともに計算指令を指標データ計算部50に出力する(ステップS34)。これにより、指標データ計算部50において指標データが計算される。
【0075】
次いで、指標データ計算部50が、動作パラメータと指標データとを紐付けたサンプルデータに、動作パラメータがパラメータ生成部20で生成された動作パラメータであることを示すラベルを付与して、サンプル記憶部60に記憶する(ステップS35)。
【0076】
図5に戻って、指標データ計算部50は、サンプル記憶部60に記憶されたサンプルデータの数が第1所定数に達したか否かを判定する(ステップS40)。サンプルデータの数が第1所定数に達していない場合(ステップS40においてNO)、指標データ計算部50は、処理対象となる動作パラメータを順番ラベルに従って順次変えながら、サンプルデータが第1所定数に達するまでステップS30の処理を繰り返し実行する。
【0077】
サンプルデータが第1所定数に達した場合(ステップS40においてYES)、学習用データを生成する処理が行なわれる(ステップS50)。
【0078】
図7は、学習用データを生成する処理(
図5のステップS50)の詳細な流れの一例を示すフローチャートである。
【0079】
まず、パラメータ探索部70が、記憶している全て(第1所定数以上)のサンプルデータを用いて、動作パラメータを入力として指標データを出力する探索用モデルを生成し、生成した探索用モデルを探索用モデル記憶部72に記憶する(ステップS51)。
【0080】
次いで、パラメータ探索部70が、探索用モデル記憶部72に記憶されている探索用モデルを用いて、座標データ取得部10から受信した座標データに対する適正候補パラメータを推定する(ステップS52)。
【0081】
次いで、パラメータ探索部70が、推定された適正候補パラメータと座標データとを含む動作指令を生成し、生成した動作指令を制御器3に出力する(ステップS53)。これにより、制御器3は、動作指令に応じて産業機械2を動作させる。
【0082】
次いで、状態データ取得部40が、制御器3による産業機械2の動作中に、制御器3あるいはセンサ4から産業機械2の状態データを取得する(ステップS54)。
【0083】
次いで、状態データ取得部40が、取得された状態データとともに計算指令を指標データ計算部50に出力する(ステップS55)。これにより、指標データ計算部50において指標データが計算される。
【0084】
次いで、指標データ計算部50は、計算した指標データを用いて、今回の適正候補パラメータが適正パラメータであるか否かを判定する(ステップS56)。
【0085】
今回の適正候補パラメータが適正パラメータでないと判定された場合(ステップS56においてNO)、指標データ計算部50は、今回の適正候補パラメータと指標データとを紐付けたサンプルデータに、パラメータ探索部70から取得した適正候補パラメータであることを示すラベルと、適正パラメータではないことを示すラベルとを付与して、サンプル記憶部60に記憶する(ステップS57)。その後、処理はステップS51に戻され、適正パラメータと判定される適正候補パラメータが推定されるまで、ステップS51~S56の処理が繰り返される。
【0086】
そして、適正パラメータであると判定される適正候補パラメータが推定された場合(ステップS56においてYES)、指標データ計算部50は、その適正候補パラメータと指標データとを紐付けたサンプルデータに、パラメータ探索部70で生成された動作パラメータであることを示すラベルと、適正パラメータであることを示すラベルとを付与して、サンプル記憶部60に学習用データとして記憶する(ステップS58)。
【0087】
図5に戻って、指標データ計算部50は、サンプル記憶部60に記憶された学習用データの数が第2所定数(モデル学習部80による学習モデルの生成に必要な数以上の値)に達したか否かを判定する(ステップS60)。サンプル記憶部60に記憶された学習用データの数が第2所定数に達していない場合(ステップS60においてNO)、座標データ取得部10が、サンプル記憶部60に記憶されている座標データとは異なる新たな座標データを制御器3から取得する(ステップS70)。その後、処理はステップS20に戻され、サンプル記憶部60に記憶された学習用データの数が第2所定数に達するまで、ステップS20~S60の処理が繰り返される。
【0088】
サンプル記憶部60に記憶された学習用データの数が第2所定数に達した場合(ステップS60においてYES)、モデル学習部80が、サンプル記憶部60に記憶された第2所定数の学習用データを用いて、座標データを入力とし動作パラメータを出力とする学習モデルを生成し(ステップS80)、生成した学習モデルをモデル記憶部90に記憶する(ステップS90)。
[活用フェーズ]
次に、活用フェーズの処理について説明する。座標データ取得部10は、制御器3から取得された座標データを「活用フェーズ」で使用すると判定した場合、パラメータ出力部100に対してパラメータ出力指令を出力する。
【0089】
図8は、パラメータ出力部100による適正パラメータの出力の一例を示す図である。パラメータ出力部100は、座標データ取得部10からパラメータ出力指令を受信すると、座標データ取得部10から取得した座標データをモデル記憶部90に記憶されている学習モデルに入力することによって、その座標データに対する適正パラメータを出力する。
【0090】
図9は、パラメータ調整装置5が活用フェーズにおいて適正パラメータを出力する処理手順の一例を示す。このフローチャートは、座標データ取得部10が、制御器3から取得した座標データを「活用フェーズ」で使用すると判定した場合に開始される。
【0091】
まず、座標データ取得部10が、制御器3から取得した座標データをパラメータ出力部100に出力する(ステップS100)。
【0092】
次いで、パラメータ出力部100が、座標データ取得部10が取得した座標データを、モデル記憶部90に記憶されている学習モデルに入力することで、入力した座標データに対応する適正パラメータを取得する(ステップS110)。
【0093】
以上に説明したパラメータ調整装置5は、以下のような特徴を有する。
(1) 本実施の形態によるパラメータ調整装置5は、産業機械2の動作座標を示す座標データを取得する座標データ取得部10と、制御器3による産業機械2の制御に用いられる動作パラメータを生成するパラメータ生成部20と、動作パラメータを記憶し、動作パラメータを含む動作指令を制御器3に出力するパラメータ記憶部30と、動作パラメータによる動作中の産業機械2の状態データを取得する状態データ取得部40と、動作パラメータの適否を判定するための指標となる指標データを状態データに基づいて計算する指標データ計算部50と、動作パラメータと指標データとを紐付けたサンプルデータを記憶するサンプル記憶部60と、指標データに基づいて適正と推定される動作パラメータをサンプルデータを用いて探索するパラメータ探索部70と、パラメータ探索部70によって適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データから適正パラメータを推定するための学習モデルを生成するモデル学習部80とを備える。
【0094】
上記構成においては、座標データ取得部10に座標データを入力することによって、動作パラメータが生成され、その動作パラメータによる状態データから指標データが計算され、指標データに基づいて適正と推定される動作パラメータが探索される。そして、適正と推定される動作パラメータと座標データとを紐付けた学習用データを用いて、座標データから適正パラメータを推定するための学習モデルが生成される。すなわち、パラメータ調整装置5に座標データを入力するだけで、座標データから適正パラメータを推定するための学習モデルを生成することができる。そのため、従来のような手作業での試行錯誤によるパラメータ調整を行なうことなく、この学習モデルに座標データを入力するだけで適正パラメータを推定することができる。
【0095】
(2) さらに、本実施の形態によるパラメータ調整装置5は、モデル学習部80が生成した学習モデルを記憶するモデル記憶部90と、座標データ取得部10が取得した座標データを、モデル記憶部90が記憶している学習モデルに入力することで、適正パラメータを出力するパラメータ出力部100とをさらに備える。
【0096】
そのため、パラメータ調整装置5に座標データに入力するだけで、適正パラメータを出力することができる。
【0097】
(3) さらに、パラメータ探索部70は、パラメータ探索部70によって適正と推定される動作パラメータで産業機械2を制御するように制御器3に指令する。状態データ取得部40は、パラメータ探索部70によって適正と推定される動作パラメータで産業機械2を動作させた場合の産業機械2の状態を示す状態データ(探索状態データ)を取得する。指標データ計算部50は、探索状態データに基づいて指標データを計算する。サンプル記憶部60は、探索状態データに基づいて適正と判定される動作パラメータと座標データとを紐付けたデータを学習用データとして記憶する。モデル学習部80は、サンプル記憶部60に記憶された学習用データを用いて学習モデルを生成する。
【0098】
上記構成においては、パラメータ探索部70によって適正と推定される動作パラメータをそのまま学習用データとして用いるのではなく、パラメータ探索部70によって適正と推定される動作パラメータで産業機械2の実際に動作させた場合の状態データ(探索状態データ)に基づいて指標データを計算し、その指標データに基づいて適正と判定される動作パラメータを学習データとして用いる。そのため、パラメータ探索部70によって適正と推定される動作パラメータをそのまま学習用データとして用いる場合に比べて、学習モデルをより適切に生成することができる。
【0099】
(4)さらに、指標データ計算部50は探索状態データに基づいて2種類以上の指標を計算して、計算された2種類以上の指標の組合せを前記指標データとし、パラメータ探索部70は、指標データを構成するそれぞれの指標に基づいて、多目的最適化手法を用いて適正と判定される動作パラメータを推定する。
【0100】
こうすることで、複数の指標を線形結合して一つにした値を指標データとした場合よりも、さらに適正なパラメータを推定できる。
【0101】
(5) さらに、パラメータ生成部20は、パラメータ探索部70のパラメータ探索方法に応じて設定された第1所定数の動作パラメータを生成する。
【0102】
これにより、パラメータ探索部70による探索を目的とした産業機械2の動作回数が無駄に多くなることを抑制することができる。そのため、パラメータ調整装置5が探索用モデルを生成するのに要する時間を短くすることができる。
【0103】
(6) さらに、モデル学習部80は、モデル学習部80のモデル学習方法に応じて設定された第2所定数の学習用データがサンプル記憶部60に記憶された場合に、第2所定数の学習用データを用いて学習モデルを生成する。
【0104】
これにより、モデル学習部80による学習モデルの生成を目的とした産業機械2の動作回数が無駄に多くなることを抑制することができる。そのため、パラメータ調整装置5が学習モデルを生成するのに要する時間を短くすることができる。
【0105】
(7) さらに、パラメータ探索部70は、サンプル記憶部60が記憶しているサンプルデータを用いて、動作パラメータから指標データを推定するための探索用モデルを生成する探索用モデル構築部71と、探索用モデルを記憶する探索用モデル記憶部72と、探索用モデルを用いて推定される指標データに基づいて適正と推定される動作パラメータを探索するパラメータ推定部73とを備える。
【0106】
これにより、動作パラメータと指標データとの関係が探索用モデルから把握できるようになる。そのため、適正パラメータをより効率的に探索することができる。
【0107】
(8)さらに、状態データ取得部40は、産業機械2を動作する駆動装置からトルクデータを取得し、指標データ計算部50は、トルクデータから計算したトルクの振動振幅値とトルク波形の減衰率の線形結合を産業機械2の位置決め後の残留振動の指標とする。
【0108】
こうすることで、産業機械に取り付けるエンドエフェクタの制約によって加速度ピックアップを取り付けられない場合でも、残留振動の指標を計算することができる。
【0109】
また、トルクデータを用いることで、位置決め装置を構成する減速機の減速比が大きくても残留振動のデータを取得することができる。
【0110】
また、トルクの振動振幅値だけでなく、トルク波形の減衰率を考慮することで、より適切に残留振動の度合いを示す指標を計算することができる。
【0111】
なお、本実施の形態によるパラメータ調整装置5は上記(1)~(8)の構成を備えるが、本開示によるパラメータ調整装置は、少なくとも上記(1)の構成を備えるものであればよく、必ずしも上記(2)~(8)の構成を全て備えるものに限定されない。たとえば、本開示によるパラメータ調整装置は、上記(1)の構成と、上記(2)~(8)の少なくとも1つの構成との組合せであればよい。
[変形例1]
上述の実施の形態によるパラメータ調整装置5は、学習フェーズで学習モデルを生成する構成と、活用フェーズで適正パラメータを出力する構成との双方を備える。
【0112】
これに対し、学習フェーズで学習モデルを生成する構成と、活用フェーズで適正パラメータを出力する構成とを、別々の装置に分割して備えるようにしてもよい。
【0113】
図10は、本変形例1によるパラメータ調整装置5Aの構成の一例を模式的に示す図である。本変形例1によるパラメータ調整装置5Aは、上述の実施の形態によるパラメータ調整装置5から、学習フェーズでは用いられずに活用フェーズで用いられる「パラメータ出力部100」を取り除いたものである。
【0114】
図11は、本変形例1によるパラメータ調整装置5Bの構成の一例を模式的に示す図である。本変形例1によるパラメータ調整装置5Bは、上述の実施の形態によるパラメータ調整装置5に対して、活用フェーズで用いられる座標データ取得部10、モデル記憶部90およびパラメータ出力部100を残し、その他の部分を取り除いたものである。
【0115】
このように、学習フェーズで学習モデルを生成する構成と、活用フェーズで適正パラメータを出力する構成とを、別々の装置に分割して備えるようにしてもよい。こうすることで、特に活用フェーズで適正パラメータを出力するための構成を有するハードウェア(
図11に示すパラメータ調整装置5B)に要求される性能を下げることができ、コストを低減することができる。
[変形例2]
上述の実施の形態においてはモデル学習部80が生成する学習モデルが単一の回帰モデルである例について説明した(
図4参照)が、モデル学習部80が生成する学習モデルは単一の回帰モデルであることには限定されない。
【0116】
図12は、本変形例2によるモデル学習部80Aの学習の一例を模式的に示す図である。
図12に示されるように、本変形例2によるモデル学習部80Aは、学習モデルとして、分類モデルと、複数の回帰モデルとを生成する。分類モデルは、たとえば、教師なし機械学習の分類方法であるクラスタリングを行なうためのモデルである。複数の回帰モデルは、それぞれ、たとえば重回帰モデルのような一般的な機械学習の回帰モデルである。
【0117】
図12に示されるように、モデル学習部80Aは、学習用データ中のr個の座標データを用いて、r個の学習用データを複数のグループに分類するための分類モデルを学習する。分類モデルが座標データをグループ分けする基準は、たとえば、始点座標と終点座標の距離である。この場合、分類モデルは、たとえば、距離が長いグループと短いグループとの2つのグループに座標データを分類するように生成される。
【0118】
生成された分類モデルは、少なくとの1つ以上の学習用データから構成される複数のグループを出力する。そのため、複数のグループの各々に対して、座標データを入力として適正パラメータを出力する回帰モデルが生成される。
【0119】
このような学習方法では、学習用データを複数のグループに分類するため、個々の回帰モデルの学習量を削減することができ、学習モデルの生成に要する時間を短縮することができる。たとえば、回帰モデルにガウス過程回帰モデルを採用している場合、カーネル関数のハイパーパラメータの学習、及び、未知の座標データに対する適正パラメータの推定時に必要な共分散行列の逆行列の計算量のオーダーは、分類モデルによる分割数が多いほど削減されるため、各回帰モデルの学習に要する時間を短くすることができる。
【0120】
なお、モデルの入力として学習させる座標データは、必要に応じて特徴ベクトルに変換してもよい。たとえば、産業機械2がX軸、Y軸、Z軸の直交座標系からなる3軸の自由度を有するロボットであり、座標データとして始点座標(Xs,Ys,Zs)、終点座標(Xg,Yg,Zg)を設定できる場合、座標データを各軸の座標間の差異(ΔX,ΔY,ΔZ)に変換してもよい。
【0121】
図13は、本変形例2によるパラメータ出力部100Aによる適正パラメータの出力の一例を示す図である。パラメータ出力部100Aは、
図12にて例示した学習モデルを用いて適正パラメータを出力する。具体的には、
図13に示すように、パラメータ出力部100Aは、座標データを分類モデルに入力することで、座標データが属するグループを特定し、特定されたグループに対応する回帰モデルに座標データを入力することで、その座標に対する適正パラメータを出力する。
【0122】
以上のように、モデル学習部80が生成する学習モデルは、単一の回帰モデルであることには限定されず、たとえば分類モデルと複数の回帰モデルとであってもよい。
【0123】
(産業機械2の構成例)
以下に、上述のパラメータ調整装置5(情報処理装置)が好適に適用される産業機械2の構成例について説明する。
【0124】
図14は、産業機械2の構成の一例を示す図である。
図14を参照して、産業機械2は、ワーク220を載置場所から取り上げるピックアップ装置である。産業機械2は、ワーク設置台214上または容器213の内部等に任意の姿勢で置かれたワーク220をピックアップすることが可能である。産業機械2は、ワーク220を撮影する撮影方向を変えることが可能な撮像装置209と、ワーク220へのアプローチ方向を変えることが可能なピックアップ部210とを備える。撮像装置209とピックアップ部210とは、制御器3によって制御される。
【0125】
撮像装置209は、少なくとも1つ以上のワーク220を撮影する。ピックアップ部210は、ワーク220にアプローチ方向から近づき、ワーク220をピックアップする。ピックアップ対象のワーク220は、ワーク設置台214上のワーク容器213内に乱雑に積みあげられる場合が多い。
【0126】
産業機械2は、位置決め機構247と角度調整装置208とをさらに備える。位置決め機構247は、回転機構207と直動ユニット204によって構成される。角度調整装置208には、撮像装置209とピックアップ部210が取り付けられる。位置決め機構247は、ワーク220に対する角度調整装置208の相対位置を調整することが可能に構成される。回転機構207の空間上の位置は、直交3軸の直動ユニット204によって変更可能である。
【0127】
直動ユニット204は、互いに直交するX軸、Y軸、Z軸にそれぞれ対応する第1電動アクチュエータ204X,第2電動アクチュエータ204Y,第3電動アクチュエータ204Zを含む。回転機構207は、第3電動アクチュエータ204Zの出力部206に取り付けられている。
【0128】
角度調整装置208は、回転機構207に取り付けられている。角度調整装置208は、回転機構207によって回転が可能である。また、角度調整装置208の先端側のリンクハブには、撮像装置209とピックアップ部210とが取り付けられている。角度調整装置208は、撮像装置209の光軸方向およびピックアップ部210のアプローチ方向を任意に調整可能に構成される。
【0129】
図15は、角度調整装置208の構成の一例を示す図である。
図15に示した角度調整装置208は、パラレルリンク機構230とアクチュエータ231とを含む。
図16は、パラレルリンク機構230の構成の一例を示す斜視図である。なお、
図15には、
図16に示された3組のリンク機構234のうち代表として1組が抽出して示されている。
【0130】
図15、
図16に示すように、産業機械2は、さらに、第1リンクハブ232と、撮像装置209とピックアップ部210とが取り付けられた第2リンクハブ233とを備える。位置決め機構247は、第1リンクハブ232の位置を変更可能に構成される。角度調整装置208は、第1リンクハブ232と第2リンクハブ233とを連結する。
【0131】
角度調整装置208は、撮像装置209およびピックアップ部210を姿勢変更可能に支持するパラレルリンク機構230と、このパラレルリンク機構230を作動させる姿勢制御用のアクチュエータ231とで構成される。アクチュエータ231は、
図15の角度αを変更することができる。
【0132】
図15、
図16を参照して、パラレルリンク機構230は、基端側の第1リンクハブ232に対し先端側の第2リンクハブ233を3組のリンク機構234によって姿勢変更可能に連結したものである。先端側の第2リンクハブ233には、
図14に示された撮像装置209およびピックアップ部210が取り付けられている。なお、ここでは3組のリンク機構234を有するパラレルリンク機構230について示したが、リンク機構234の数は、4組以上であっても良い。
【0133】
各リンク機構234は、基端側の端部リンク部材235、先端側の端部リンク部材236、および中央リンク部材237で構成される。リンク機構234は、4つの回転対偶からなる4節連鎖のリンク機構である。基端側および先端側の端部リンク部材235,236はL字状の形状を有する。
【0134】
基端側の端部リンク部材235の一端は、基端側の第1リンクハブ232に回転自在に連結されている。先端側の端部リンク部材236の一端は、先端側の第2リンクハブ233に回転自在に連結されている。中央リンク部材237は、両端に端部リンク部材235,236の各他端がそれぞれ回転自在に連結されている。
【0135】
パラレルリンク機構230は、2つの球面リンク機構を組み合わせた構造を有する。端部リンク部材235,236と中央リンク部材237との各回転対偶の中心軸は、ある交差角γ(
図15)を持っていてもよいし、平行であってもよい。
【0136】
図17は、一組のリンク機構234を直線で表現した図である。3組のリンク機構234は、幾何学的に同一形状のモデルで示すことができる。
【0137】
基端側の第1リンクハブ232と先端側の第2リンクハブ233と3組のリンク機構234とは、2自由度機構を構成する。この2自由度機構では、基端側の第1リンクハブ232に対し先端側の第2リンクハブ233が直交する2軸の周りに回転自在な2自由度を有する。これらの直交する2軸は、
図17に示す旋回角φの回転軸(中心軸QA)と折れ角θの回転軸(点Oを通り、中心軸QAおよび中心軸QBに直交する軸)である。旋回角φは、第1リンクハブ232の中心軸QAに垂直な平面において、中心軸QAの交点を通る基準直線と第2リンクハブ233の中心軸QBを投映した直線とが成す角度である。折れ角θは、第1リンクハブ232の中心軸QAと第2リンクハブ233の中心軸QBとが成す角度である。この2自由度機構は、コンパクトでありながら、基端側の第1リンクハブ232に対する先端側の第2リンクハブ233の可動範囲を広くとれる。
【0138】
折れ角θの調整はリンク機構234の動作のみで可能であり、多関節ロボットのようには複数の関節の動作を伴わない。このため、パラレルリンク機構230は、多関節ロボットと比べて素早い動作が可能である。したがって、
図16のパラレルリンク機構230を機械学習に必要な画像データの収集に用いれば、多関節ロボットと比較して、大量の画像データを短時間で収集することができる。
【0139】
図15に示す角度調整装置208の姿勢制御用のアクチュエータ231は、減速機構を備えたロータリアクチュエータである。アクチュエータ231は、第1リンクハブ232の基端部材240の面に、回転軸242と同軸上に設置されている。アクチュエータ231と減速機構は一体に設けられ、減速機構が基端部材240に固定されている。3組のリンク機構234に
図16の角α1~α3を変更するための3つの姿勢制御用のアクチュエータ231を設けても良いが必ずしもアクチュエータ231を3つ設けなくても良い。3組のリンク機構234のうち少なくとも2組に姿勢制御用のアクチュエータ231を設ければ、基端側の第1リンクハブ232に対する先端側の第2リンクハブ233の姿勢を確定することができる。
【0140】
上述のパラメータ調整装置5(情報処理装置)は、
図14~
図17に示す産業機械2のような多軸ロボットの位置決め制御に好適に適用される。
【0141】
今回開示された実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本開示の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0142】
1 制御システム、2 産業機械、3 制御器、4 センサ、5,5A,5B パラメータ調整装置、10 座標データ取得部、20 パラメータ生成部、30 パラメータ記憶部、40 状態データ取得部、50 指標データ計算部、60 サンプル記憶部、70 パラメータ探索部、71 探索用モデル構築部、72 探索用モデル記憶部、73 パラメータ推定部、80,80A モデル学習部、90 モデル記憶部、100,100A パラメータ出力部、204 直動ユニット、204X 第1電動アクチュエータ、204Y 第2電動アクチュエータ、204Z 第3電動アクチュエータ、206 出力部、207 回転機構、208 角度調整装置、209 撮像装置、210 ピックアップ部、213 容器、214 ワーク設置台、220 ワーク、230 パラレルリンク機構、231 アクチュエータ、232 第1リンクハブ、233 第2リンクハブ、234 リンク機構、235,236 端部リンク部材、237 中央リンク部材、240 基端部材、242 回転軸、247 位置決め機。