(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-01-06
(45)【発行日】2025-01-15
(54)【発明の名称】制御方法および制御装置
(51)【国際特許分類】
G05B 13/02 20060101AFI20250107BHJP
B25J 13/00 20060101ALI20250107BHJP
【FI】
G05B13/02 A
G05B13/02 Z
B25J13/00 Z
【外国語出願】
(21)【出願番号】P 2021093777
(22)【出願日】2021-06-03
【審査請求日】2024-03-11
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成27年度、国立研究開発法人新エネルギー・産業技術総合開発機構「次世代人工知能・ロボット中核技術開発/(革新的ロボット要素技術分野)自律型ヒューマノイドロボット/非整備環境対応型高信頼ヒューマノイドロボットシステムの開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】301021533
【氏名又は名称】国立研究開発法人産業技術総合研究所
(74)【代理人】
【識別番号】100161207
【氏名又は名称】西澤 和純
(74)【代理人】
【識別番号】100147267
【氏名又は名称】大槻 真紀子
(74)【代理人】
【識別番号】100140774
【氏名又は名称】大浪 一徳
(72)【発明者】
【氏名】ベナレグ メヘディ
(72)【発明者】
【氏名】シスネロスリモン ラファエル
【審査官】田中 友章
(56)【参考文献】
【文献】特開2020-032481(JP,A)
【文献】特開2002-023807(JP,A)
【文献】特開平4-195503(JP,A)
【文献】米国特許出願公開第2020/0183341(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/02
B25J 13/00
(57)【特許請求の範囲】
【請求項1】
制御方法であって、
制御対象であるターゲットのプロセス変数を測定するステップと、
基準値と前記プロセス変数との差として定義されている誤差値e(t)を計算するステップと、
微分利得K
sと時間に関する前記誤差値の微分s(t)との積、比例利得K
eと前記誤差値e(t)との積、および積分利得K
Eと時間に関する前記誤差値の積分E(t)との積の総和を使用して操作変数uを計算するステップと、
前記操作変数uに基づき前記ターゲットを制御するステップと、を含み、
式(1)として定義されている状態ベクトルx(t)は、式(2)
【数1】
を満たし、
tは時間を表し、α
0およびα
1は正の数を表す、制御方法。
【請求項2】
前記微分利得K
sは式(3)を満たし、前記比例利得K
eは式(4)を満たし、積分利得K
Eの積は式(5)を満たし、
K
s=λM+K
a+C 式(3)
K
e=μM+λK
a+L+λC 式(4)
K
E=μK
a+γλL+μC 式(5)
λ、μ、およびγは正のスカラー、γは1未満であり、K
aおよびLは正定値行列であり、Mは質量行列である、請求項1に記載の制御方法。
【請求項3】
前記ターゲットはn個の関節を有し、前記n個の関節の各々は位置を1つ有し、
前記操作変数uは、式(6)
【数2】
として定義され、
ここで、qは関節位置であり、
【数3】
は関節速度であり、
【数4】
は関節加速度であり、Cはコリオリ行列であり、Gはターゲットの重力ベクトルであり、J
iは関節点iのヤコビアン行列であり、F
iは前記関節点iにおける一般化力であり、iは0からnの間の値である、請求項1または2に記載の制御方法。
【請求項4】
制御装置であって、
制御対象であるターゲットのプロセス変数を感知するように構成されているセンサーユニットと、
入力されるべき基準値を記憶するように構成されているメモリユニットと、
微分利得K
sと時間に関する誤差値e(t)の微分s(t)との積、比例利得K
eと前記誤差値e(t)との積、および積分利得K
Eと時間に関する前記誤差値の積分E(t)との積の総和を使用して操作変数uを計算するように構成されている計算ユニットと、
前記操作変数uに基づき前記ターゲットを制御するように構成されている制御ユニットとを備え、
式(1)として定義されている状態ベクトルx(t)は、式(2)
【数5】
を満たし、
e(t)は前記基準値と前記プロセス変数との間の差として定義され、tは時間を表し、α
0およびα
1は正の数を表す、制御装置。
【請求項5】
前記微分利得K
sは式(3)を満たし、前記比例利得K
eは式(4)を満たし、K
Eは式(5)を満たし、
K
s=λM+K
a+C 式(3)
K
e=μM+λK
a+L+λC 式(4)
K
E=μK
a+γλL+μC 式(5)
λ、μ、およびγは正のスカラー、γは1未満であり、K
aおよびLは正定値行列であり、Mは質量行列である、請求項4に記載の制御装置。
【請求項6】
前記ターゲットはn個の関節を有し、前記n個の関節の各々は位置を1つ有し、
前記操作変数uは、式(6)
【数6】
として定義され、
ここで、qは関節位置であり、
【数7】
は関節速度であり、
【数8】
は関節加速度であり、Cはコリオリ行列であり、Gはターゲットの重力ベクトルであり、J
iは関節点iのヤコビアン行列であり、F
iは前記関節点iにおける一般化力であり、iは0からnの間の値である、請求項4または5に記載の制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御方法および制御装置に関する。
【背景技術】
【0002】
非特許文献1では、マニピュレータの未知の動力学パラメータやペイロードをオンラインで推定している、PDフィードバック部と完全ダイナミクスフィードフォワード補償部(full dynamics feedforward compensation part)とからなる適応型ロボット制御アルゴリズムを開示している。このアルゴリズムは、マニピュレータダイナミクスの構造を効果的に利用しているので計算が簡単である。
【0003】
非特許文献2では、線形コントローラの伝達関数の正実性を必要とする系全体の大域的漸近安定性を開示している。
【0004】
非特許文献3では、制約条件付きの多目的加重タスクとして定式化された二次計画法(QP)を用いて、トラッキング誤差を効率的に最小化するトルク制御型ヒューマノイドロボットに対する制御フレームワークを開示している。
【先行技術文献】
【非特許文献】
【0005】
【文献】J.-J.E. Slotineら、「On the adaptive control of robot manipulators.」The International Journal of Robotics Research、6(3)、1987年。
【文献】I.D. Landauら、「Applications of the Passive Systems Approach to the Stability Analysis of Adaptive Controllers for Robot Manipulators.」International Journal of Adaptive Control and Signal Processing、3、1989年。
【文献】R. Cisneros Limon、M. Benallegue、A. Benallegue、M. Morisawa、H. Audren、P. Gergondet、A. Escande、A. Kheddar、F. Kanehiro、「Robust Humanoid Control Using a QP Solver with Integral Gains.」IROS 2018年:7472~7479頁。
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来のトルクまたは電流制御は、たとえば、質量分布および荷重負荷が間違っている場合に、モデル化誤差の影響を受けやすい。したがって、一般的に高利得の位置制御が使用され、そのため、特に予期しない接触が発生したときに、動的運動におけるトラッキング誤差ならびに周囲の人間および環境にとって危険な状態が生じる。
【0007】
したがって、本発明は、上記問題点に鑑みてなされたものであり、本発明の目的は、エネルギー効率およびロバスト性をさらに改善することが可能な制御方法および制御装置を提供することにある。
【課題を解決するための手段】
【0008】
本発明は、上記の知見に基づきなされたものであり、その要旨は次のとおりである。
【0009】
[1]制御方法であって、
制御対象であるターゲットのプロセス変数を測定するステップと、
基準値とプロセス変数との差として定義されている誤差値e(t)を計算するステップと、
微分利得Ksと時間に関する誤差値の微分s(t)との積、比例利得Keと誤差値e(t)との積、および積分利得KEと時間に関する誤差値の積分E(t)との積の総和を使用して操作変数uを計算するステップと、
操作変数uに基づきターゲットを制御するステップとを含み、
式(1)として定義されている状態ベクトルx(t)は、式(2)
【0010】
【0011】
を満たし、
tは時間を表し、α0およびα1は正の数を表す、方法。
[2][1]に記載の制御方法であって、微分利得Ksは式(3)を満たし、比例利得Keは式(4)を満たし、積分利得KEの積は式(5)を満たし、
Ks=λM+Ka+C 式(3)
Ke=μM+λKa+L+λC 式(4)
KE=μKa+γλL+μC 式(5)
ここで、λ、μ、およびγは正のスカラー、γは1未満であり、KaおよびLは正定値行列であり、Mは質量行列である、制御方法。
[3][1]または[2]に記載の制御方法であって、ターゲットはn個の関節を有し、n個の関節の各々は位置を1つ有し、
操作変数uは、式(6)
【0012】
【0013】
として定義され、
ここで、qは関節位置であり、
【0014】
【0015】
は関節速度であり、
【0016】
【0017】
は関節加速度であり、Cはコリオリ行列であり、Gはターゲットの重力ベクトルであり、Jiは関節点iのヤコビアン行列であり、Fiは関節点iにおける一般化力であり、iは0からnの間の値である、制御方法。
[4]制御装置であって、
制御対象であるターゲットのプロセス変数を感知するように構成されているセンサーユニットと、
入力されるべき基準値を記憶するように構成されているメモリユニットと、
微分利得Ksと時間に関する誤差値e(t)の微分s(t)との積、比例利得Keと誤差値e(t)との積、および積分利得KEと時間に関する誤差値の積分E(t)との積の総和を使用して操作変数uを計算するように構成されている計算ユニットと、
操作変数uに基づきターゲットを制御するように構成されている制御ユニットと、を備え、
式(1)として定義されている状態ベクトルx(t)は、式(2)
【0018】
【0019】
を満たし、
ここで、e(t)は基準値とプロセス変数との間の差として定義され、tは時間を表し、α0およびα1は正の数を表す、制御装置。
[5][4]に記載の制御装置であって、微分利得Ksは式(3)を満たし、比例利得Keは式(4)を満たし、KEは式(5)を満たし、
Ks=λM+Ka+C 式(3)
Ke=μM+λKa+L+λC 式(4)
KE=μKa+γλL+μC 式(5)
ここで、λ、μ、およびγは正のスカラー、γは1未満であり、KaおよびLは正定値行列であり、Mは質量行列である、制御装置。
[6][4]または[5]に記載の制御装置であって、ターゲットはn個の関節を有し、n個の関節の各々は位置を1つ有し、
操作変数uは、式(6)
【0020】
【0021】
として定義され、
ここで、qは関節位置であり、
【0022】
【0023】
は関節速度であり、
【0024】
【0025】
は関節加速度であり、Cはコリオリ行列であり、Gはターゲットの重力ベクトルであり、Jiは関節点iのヤコビアン行列であり、Fiは関節点iにおける一般化力であり、iは0からnの間の値である、制御装置。
【発明の効果】
【0026】
上で説明されているように、本発明によれば、エネルギー効率およびロバスト性をさらに改善することができる制御方法および制御装置を提供することが可能である。
【図面の簡単な説明】
【0027】
【
図1】本発明の実施形態による制御方法の流れの一例を示すフローチャートである。
【
図2】一実施形態による制御装置が搭載される制御装置のコンポーネントを示す図である。
【
図3】本発明の一例による制御対象の関節を備えるロボットを示す図である。
【
図4】本発明の例による運動学的フィードバックおよび受動性に基づくPIDの下での完全なモデルに対するラジアン/秒単位の関節速度(vq)およびミリ秒単位の時間に関するラジアン単位の位置(q)の二乗平均平方根(RMS)誤差を示す図である。
【
図5】本発明の比較例による運動学的フィードバックおよび受動性に基づくPIDの下でのバイアスモデルに対するラジアン/秒単位の関節速度(vq)および時間(ms)に関するラジアン単位の位置(q)のRMS誤差を示す図である。
【発明を実施するための形態】
【0028】
これ以降、本開示の一実施形態は、添付図面を参照しつつ詳しく説明される。それに加えて、本明細書および図面において、実質的に同一の機能および構成を有する同一の構成要素には同一の参照数字を付し、重複する説明は省略する。
【0029】
図1は、本発明の実施形態による制御方法の流れの一例を示すフローチャートである。
図1に示されているように、本発明の実施形態による制御方法は、特徴として、
(a)制御対象であるターゲットのプロセス変数を測定するステップと、
(b)基準値とプロセス変数との差として定義されている誤差値e(t)を計算するステップと、
(c)微分利得K
sと時間に関する誤差値の微分s(t)との積、比例利得K
eと誤差値e(t)との積、および積分利得K
Eと時間に関する誤差値の積分E(t)との積の総和を使用して操作変数uを計算するステップと、
(d)操作変数uに基づきターゲットを制御するステップと、を含み、
式(1)として定義されている状態ベクトルx(t)は、式(2)
【0030】
【0031】
を満たし、
tは時間を表し、α0およびα1は正の数を表す。
【0032】
(制御対象であるターゲットのプロセス変数を測定するステップ)
本発明の実施形態において、制御対象であるターゲットのプロセス変数が測定される。プロセス変数およびターゲットは限定されない。ターゲットは、n個の関節を有することができる。n個の関節の各々は、位置を1つ有することができる。ターゲットは、ロボットであってもよい。ターゲットのプロセス変数を測定するためのセンサーが、測定装置とし使用され得る。本発明の実施形態において、センサーは、関節位置センサーである。それに加えて、センサーは、トルクセンサー、圧力センサー、慣性センサー、または同様のセンサーをさらに含むことができる。
【0033】
(基準値とプロセス変数との差として定義されている誤差値e(t)を計算するステップ)
本発明の実施形態において、誤差値e(t)は、基準値およびプロセス変数を使用することによって計算される。基準値は、プリセット値である。誤差値e(t)は、基準値とプロセス変数との間の差として定義される。
【0034】
(フィードバック操作変数uを算出するステップ)
本発明の実施形態では、フィードバック操作変数ufは、微分利得Ksと時間に関する誤差値の微分s(t)との積、比例利得Keと誤差値e(t)との積、および積分利得KEと時間に関する誤差値の積分E(t)との積の総和を使用して計算される。フィードバック操作変数ufは、式
【0035】
【0036】
によって表すことができる。
【0037】
微分利得Ksは、好ましくは式(3)を満たす。比例利得Keは、好ましくは式(4)を満たし、積分利得KEの積は式(5)を満たす。
Ks=λM+Ka+C 式(3)
Ke=μM+λKa+L+λC 式(4)
KE=μKa+γλL+μC 式(5)
ここで、λ、μ、およびγは正のスカラーであり、γは1未満であり、KaおよびLは正定値行列であり、Mは関節の質量行列である。
【0038】
ターゲットが、n個の関節を有するときに、n個の関節の各々は位置を1つ有し、操作変数uは、好ましくは式(6)
【0039】
【0040】
として定義される。
ここで、qは関節位置であり、
【0041】
【0042】
は関節速度であり、
【0043】
【0044】
は関節加速度であり、Cはコリオリ行列であり、Gはターゲットの重力ベクトルであり、Jiは関節点iのヤコビアン行列であり、Fiは関節点iにおける一般化力であり、iは0からnの間の値である。
【0045】
(操作変数uに基づきターゲットを制御するステップ)
本発明の実施形態において、ターゲットは、操作変数uに基づき制御される。
【0046】
本発明の実施形態によれば、操作変数uは、積分利得KEと時間に関する誤差値の積分E(t)との積を含む。したがって、低周波におけるモデリング誤差の補正を可能にし、予測されない接触があった場合により安全なコンプライアント挙動を有することが可能である。
【0047】
さらに、本発明の実施形態によれば、式(1)として定義されている状態ベクトルx(t)は、式(2)
【0048】
【0049】
を満たし、
tは時間を表し、α0およびα1は正の数を表す。したがって、状態ベクトルx(t)は、一次指数関数的収束となる。このような理由から、収束証明は、速い収束の保証を与える。
【0050】
ロボットがn個の関節を有するときに、各々実数で表される1つの位置を有する。これらの関節位置のベクトルは、qと表記される。これらの関節の各々は、トルク発生器により作動される。これらのトルクのベクトルはτで表される。留意すべき重要な要因の1つは、τおよびqが同じサイズを有するベクトルであることである。ロボットは、接点iにおいてFiで各々表される外力も受ける。時間微分演算子d/dtは、ドット
【0051】
【0052】
で表され、2次のd2/dt2は、2つのドット
【0053】
【0054】
で表される。q、
【0055】
【0056】
、
【0057】
【0058】
、τ、およびFiをリンクする運動方程式は、ラグランジュ力学と呼ばれ、
【0059】
【0060】
であり、
記号は、以下のように定義され得る。
q=q(t):現在の関節位置
qr=qr(t):基準関節位置
【0061】
【0062】
:現在の関節速度
【0063】
【0064】
:基準関節速度
【0065】
【0066】
:現在の関節加速度
【0067】
【0068】
:基準関節加速度
M=M(q):質量行列/慣性行列
e=q-qr:関節位置誤差
【0069】
【0070】
:dM/dt=C+Ctとなるようなコリオリ行列
【0071】
【0072】
:関節速度誤差
G=G(q):ロボットの重力ベクトル
【0073】
【0074】
:関節位置誤差の積分
Ji= Ji(q):接点iのヤコビアン行列
λ、μ、γ:正のスカラー(γ<1)
Fi=Fi(t):接点iにおける一般化力
Ka、L:正定値行列
【0075】
ロボットが時間に依存する所定の基準軌道qrをたどることが望まれる場合、上記の基準軌道は2回微分可能であるべきなので、微分
【0076】
【0077】
および
【0078】
【0079】
も定義される。問題はトルクτをどのように発生させるかである。上述の基準軌道によれば、tが無限大になるときにqがqrに収束することを保証することは困難である。tが無限大になるときに
【0080】
【0081】
が
【0082】
【0083】
に収束し、tが無限大になるときに
【0084】
【0085】
が
【0086】
【0087】
に収束するという望ましい特性を得ることは困難である。
【0088】
一方、本発明の実施形態による制御方法は、上述の問題を解決することができる。
【0089】
本発明の実施形態による制御方法は、受動性に基づくPID(比例積分微分)制御法を含む。ここで、受動性に基づくとは、入力ソースと外部ソースとで導入されたエネルギーを超えるエネルギーを発生しない系の特性である。
【0090】
系のエネルギーは式
【0091】
【0092】
で表され、
Pは、ポテンシャル重力エネルギーである。エネルギーの時間微分は、機械力であり、式
【0093】
【0094】
によって与えられ、
次いで、
【0095】
【0096】
である場合に、次の式が得られる。
【0097】
【0098】
第2の項に
【0099】
【0100】
が加えられ、次の式が得られる。
【0101】
【0102】
行列
【0103】
【0104】
は、歪対称である。これは、任意のベクトル
【0105】
【0106】
について、
【0107】
【0108】
が得られることを意味する。
【0109】
【0110】
この系において、受動性による
【0111】
【0112】
であるという事実から恩恵を受け得る。したがって、この利得行列Ks、Ke、およびKEは、次のように表すことができる。
Ks=λM+Ka+C 式(3)
Ke=μM+λKa+L+λC 式(4)
KE=μKa+γλL+μC 式(5)
これは、式
【0113】
【0114】
を与える。
ここで、これらの利得は、qおよび
【0115】
【0116】
に依存し、したがって時間で異なる。
【0117】
本発明の実施形態による制御方法は、リアプノフ安定性を有する。リアプノフ安定性は、力学系を記述する微分方程式または差分方程式の解に対する様々なタイプの安定性もしくは収束性のうちの1つである。平衡点xe付近から出発した解が、いつまでも平衡点xe付近に留まるときに、その平衡点xeはリアプノフ安定である。より正確には、平衡点xeがリアプノフ安定であり、平衡点xe付近から出発したすべての解が平衡点xeに収束するとき、平衡点xeは漸近安定である。
【0118】
状態空間内の任意の場所から始まる解がすべて平衡点xeに収束するときに、平衡点xeは大域的漸近安定である(条件1)。
状態空間Rnの任意の場所で時刻t=0から始まる解が特性
【0119】
【0120】
を有するような2つの正数α0およびα1が存在するときに、状態xは平衡点xeに大域的指数関数的に収束する(条件2)。
【0121】
【0122】
の定数正定値行列Hが存在し、
【0123】
【0124】
の2つの他の正定値行列H0(t)>HおよびH1(t)>Hが存在し、状態空間Rn内の任意の場所から始まる解が特性
【0125】
【0126】
を有するときに(条件3)、以下のようになる。
【0127】
状態xは平衡点xeに大域的指数関数的に収束する。条件3は、条件1より少し強い条件であり、一次大域的指数関数的収束と呼ばれる。本発明の実施形態による制御方法は、好ましくは、一次大域的指数関数的収束を満たす。
【0128】
状態ベクトルxが
【0129】
【0130】
として定義されるときに、
式
【0131】
【0132】
は式
【0133】
【0134】
の中で置き換えられ、閉ループダイナミクス
【0135】
【0136】
が得られ、
これは、
【0137】
【0138】
を与える。
これは、自律的状態ダイナミクス
【0139】
【0140】
を与え、
I3×3は3×3単位行列であり、03×3は3×3零行列である。
【0141】
ここで、これは時間変化行列を有する自律的な線形ダイナミクスである。これは、xe=(0 0 0)が系の平衡点であることを意味する。ここで、この平衡点の大域的漸近安定性が得られると、tが無限大になるときにqがqrに収束することを保証することが可能であることは重要である。また、tが無限大になるときに
【0142】
【0143】
が
【0144】
【0145】
に収束し、tが無限大になるときに
【0146】
【0147】
が
【0148】
【0149】
に収束するという望ましい特性を得ることが可能である。
【0150】
Ks、Ke、およびKEの値がそれぞれ式(3)、(4)、および(5)からの値で置き換えられたときに、
【0151】
【0152】
における定数正定値行列H、および
【0153】
【0154】
における他の2つの正定値行列H0(t)>H、H1(t)>Hが存在して、
【0155】
【0156】
であり、これが条件3を満たすときに、これは条件2も満たされることを意味し、これは系が大域的指数関数的安定であることを意味する。
【0157】
本発明の実施形態による制御方法は、速度誤差、位置誤差、および位置誤差の積分において誤差がゼロに収束する1次指数的収束の理論的証明を達成することができる。位置誤差は、通常、単に誤差と呼ばれるものである。位置誤差がゼロに収束するときに、これは完全系の場合に、トラッキングが良好であり、ダイナミクスが安定していることを意味する。速度誤差がゼロに収束するときに、動体トラッキングが良く、遅延がないことを意味する。位置誤差の積分がゼロに収束するときに、モデルと現実との間に小さなミスマッチがある場合、定常誤差はないことを意味する。
【0158】
位置誤差の積分の存在は、系が静的誤差を有しないことを許し、定常誤差はゼロ周波数外乱の結果である。同様に、低周波数外乱があるときに、この積分項はまたそれを補償することになる。これは、積分が低周波成分を増幅するからである。この項により、われわれは定常誤差なしで低い利得を保つことができ、コンプライアンスをさらに許し、ロボットと人間との間の相互作用の場合に通常はより安全なものとなる。
【0159】
次に、本発明の一実施形態による制御装置が、添付図面を参照しつつ詳しく説明される。
【0160】
図2は、本実施形態による制御装置が搭載される制御装置のコンポーネントを示す図である。
図2に示されているように、本実施形態による制御装置100は、センサーユニット200と、メモリユニット300と、計算ユニット400と、制御ユニット500とを備える。
【0161】
(センサーユニット)
本発明の実施形態によるセンサーユニット200は、制御対象であるターゲットのプロセス変数を感知する。たとえば、センサーユニット200は、関節位置センサーによって実現され得る。それに加えて、センサーユニット200は、トルクセンサー、圧力センサー、慣性センサー、または同様のセンサーをさらに含むことができる。
【0162】
(メモリユニット)
本発明の実施形態によるメモリユニット300は、入力されるべき基準値を記憶する。たとえば、メモリユニット300は、リードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)、ハードディスクドライブ(HDD)、フラッシュメモリ、または同様のものによって実現され得る。
【0163】
(計算ユニット)
本発明の実施形態による計算ユニット400は、微分利得Ksと時間に関する誤差値e(t)の微分s(t)との積、比例利得Keと誤差値e(t)との積、および積分利得KEと時間に関する誤差値の積分E(t)との積の総和を使用して操作変数uを計算する。たとえば、計算ユニット400は、算術論理演算ユニット(ALU)とすることができる。
【0164】
本発明の実施形態による計算ユニット400は、微分利得Ksが式(3)を満たし、比例利得Keが式(4)を満たし、積分利得KEの積が式(5)を満たすように、操作変数uを計算する。
Ks=λM+Ka+C 式(3)
Ke=μM+λKa+L+λC 式(4)
KE=μKa+γλL+μC 式(5)
ここで、λ、μ、およびγは正のスカラー、γは1未満であり、KaおよびLは正定値行列であり、Mは質量行列である。
【0165】
ターゲットが、n個の関節を有するときに、n個の関節の各々は位置を1つ有し、操作変数uは、好ましくは式(6)
【0166】
【0167】
として定義される。
ここで、qは関節位置であり、
【0168】
【0169】
は関節速度であり、
【0170】
【0171】
は関節加速度であり、Cはコリオリ行列であり、Gはターゲットの重力ベクトルであり、Jiは関節点iのヤコビアン行列であり、Fiは関節点iにおける一般化力であり、iは0からnの間の値である、制御方法が提供される。
【0172】
(制御ユニット)
本発明の実施形態による制御ユニット500は、操作変数uに基づきターゲットを制御する。たとえば、制御ユニット500は、プログラム(ソフトウェア)を実行する中央演算処理装置(CPU)またはグラフィックスプロセッシングユニット(GPU)などのプロセッサによって実現され得る。それに加えて、これらの構成要素のいくつかまたはすべては、大規模集積回路(LSI)、特定用途向け集積回路(ASIC)、またはフィールドプログラマブルゲートアレイ(FPGA)などのハードウェア(回路ユニット、回路を含む)によって実現されるか、またはソフトウェアとハードウェアとの連携によって実現されもよい。
【0173】
上で説明されている実施形態は、以下のように表すことができる。
プログラムを記憶する記憶装置と、プロセッサとを備える、制御装置であって、プロセッサはプログラムを実行し、制御対象であるターゲットのプロセス変数を測定することと、基準値とプロセス変数との差として定義されている誤差値e(t)を計算することと、微分利得Ksと時間に関する誤差値の微分s(t)との積、比例利得Keと誤差値e(t)との積、および積分利得KEと時間に関する誤差値の積分E(t)との積の総和を使用して操作変数uを計算することと、操作変数uに基づきターゲットを制御することとを実行するように構成され、式(1)として定義されている状態ベクトルx(t)は、式(2)
【0174】
【0175】
を満たし、tは時間を表し、α0およびα1は正の数を表す、制御装置。
【実施例】
【0176】
次に、本発明の例について説明する。実施例における条件は、本発明の実施可能性および効果を確認するために採用されている条件の一例であるが、本発明は、条件のこの例に限定されるものではない。本発明は、本発明の要旨から逸脱することなく、本発明の目的が達成される限り、種々の条件を採用することができる。
【0177】
図3は、本発明の一例による制御対象の関節を備えるロボットを示す図である。例では、関節トルクは
【0178】
【0179】
に設定される。
【0180】
したがって、次の特性を有するトルクが得られた。外乱がなく、現在の軌道から所望の軌道が始まるときに、
【0181】
【0182】
、
【0183】
【0184】
、q=qrが得られた。したがって、完全な状態では、実施例による制御方法は、系の性能を低下させない。外乱があるときに、または所望の軌道が現在の軌道と異なる状態から始まるときに、1次指数関数的ダイナミクスにおいて、s、e、Eのゼロへの収束が得られる。したがって、系は摂動に対してロバストである。この収束は、系の自然な受動性を利用しているので、モデル化誤差に対してかなりロバストである。この定式化は、適応制御に適している。
【0185】
図4は、本発明の例による運動学的フィードバックおよび受動性に基づくPIDの下での完全なモデルに対するラジアン/秒単位の関節速度(vq)およびミリ秒単位の時間に関するラジアン単位の位置(q)のRMS誤差を示す図である。
図5は、本発明の比較例による運動学的フィードバックおよび受動性に基づくPIDの下でのバイアスモデルに対するラジアン/秒単位の関節速度(vq)および時間(ms)に関するラジアン単位の位置(q)のRMS誤差を示す図である。
図4および
図5は、サンプリングされた時間に関する関節速度の誤差||s||および関節位置の誤差||e||についての二乗平均平方根(RMS)誤差を示す。軸は、x軸:サンプル時間[ms]、y軸:左側では関節速度[rad/s]、右側では関節角度[rad]である。古典的なPID(kf)の信号はピンク色で、受動性に基づくPIDの信号は緑色である。
マニピュレータアームSawyer(Rethink Robotics社製)のシミュレーションモデルは、所望の軌道を追跡する。2つの異なるアルゴリズムがテストされ、第1のアルゴリズムは、運動学的フィードバック(kf)と呼ばれる従来のPID制御であり、第2のアルゴリズムは、受動性に基づく積分(ip)として表される受動性に基づくPIDである。
図5は、サンプリングされた時間に関する所望の関節軌道を追跡する際のRMS誤差を示している。
図4に示されているように、完全な状態では、誤差は同様に両方ともゼロになる。
【0186】
しかしながら、
図5に示されているように、たとえば、トルクにバイアスを加えることによってモデル化誤差が加えられたときに、従来のコントローラの関節誤差は増大し、受動性に基づくものは誤差をゼロに非常に近い値に維持した。
【0187】
図5の右に示されているように、
図5の右は、PD制御に関する最新技術(Slotine 1987)(Landau 1989)から知られているが、PID制御には使用されたことがない。
図6は、コントローラのブロック図である。基準加速度発生器は、所望の位置、速度、および加速度を発生するユニットである。トルク/電流制御は、逆ダイナミクスを利用して運動の加速度を発生するために使用される。受動性に基づくPIDは、系のロバスト性を向上させる補正項を追加することによって通常の逆ダイナミクスを改善する。実施例において示されているように、系が完全なときには、誤差がないので、追加項はゼロとなり、逆ダイナミクスに影響を及ぼさない。これらの項は、系がモデルのように完全な挙動を示さないときのみ、補正されるように見える。大域的指数関数的収束は、制御が安定しており、良好な性能を持つことを保証する。
【0188】
本発明の好ましい実施形態が上で説明され、例示されているが、これらは本発明の例示であって、限定するものとして考えられるべきではないことは理解されたい。本発明の精神または範囲から逸脱することなく、追加、省略、置換、および他の修正が行われ得る。したがって、本発明は、前述の説明によって制限されるものと考えられるべきではなく、付属の請求項の範囲によってのみ制限される。本発明の実施形態による制御装置は、油圧式または電動式のいずれかのアクチュエータを備えたロボットとすることができる。
【産業上の利用可能性】
【0189】
本発明によれば、エネルギー効率およびロバスト性をさらに改善することができる制御方法および制御装置を提供することが可能である。したがって、本発明は、産業上の高い応用性を有する。
【符号の説明】
【0190】
100 制御装置
200 センサーユニット
300 メモリユニット
400 計算ユニット
500 制御ユニット