特許7613738 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人産業技術総合研究所の特許一覧

特許7613738制御方法および制御装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-01-06

(45)【発行日】2025-01-15

(54)【発明の名称】制御方法および制御装置

(51)【国際特許分類】

G05B 13/02 20060101AFI20250107BHJP

B25J 13/00 20060101ALI20250107BHJP

【ＦＩ】

G05B13/02 A

G05B13/02 Z

B25J13/00 Z

【請求項の数】 6

【外国語出願】

(21)【出願番号】P 2021093777

(22)【出願日】2021-06-03

(65)【公開番号】P2022185879

(43)【公開日】2022-12-15

【審査請求日】2024-03-11

【国等の委託研究の成果に係る記載事項】（出願人による申告）平成２７年度、国立研究開発法人新エネルギー・産業技術総合開発機構「次世代人工知能・ロボット中核技術開発／（革新的ロボット要素技術分野）自律型ヒューマノイドロボット／非整備環境対応型高信頼ヒューマノイドロボットシステムの開発」委託研究、産業技術力強化法第１７条の適用を受ける特許出願

(73)【特許権者】

【識別番号】301021533

【氏名又は名称】国立研究開発法人産業技術総合研究所

(74)【代理人】

【識別番号】100161207

【弁理士】

【氏名又は名称】西澤和純

(74)【代理人】

【識別番号】100147267

【弁理士】

【氏名又は名称】大槻真紀子

(74)【代理人】

【識別番号】100140774

【弁理士】

【氏名又は名称】大浪一徳

(72)【発明者】

【氏名】ベナレグメヘディ

(72)【発明者】

【氏名】シスネロスリモンラファエル

【審査官】田中友章

(56)【参考文献】

【文献】特開２０２０－０３２４８１（ＪＰ，Ａ）

【文献】特開２００２－０２３８０７（ＪＰ，Ａ）

【文献】特開平４－１９５５０３（ＪＰ，Ａ）

【文献】米国特許出願公開第２０２０／０１８３３４１（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０５Ｂ１３／０２

Ｂ２５Ｊ１３／００

(57)【特許請求の範囲】

【請求項1】

制御方法であって、
制御対象であるターゲットのプロセス変数を測定するステップと、
基準値と前記プロセス変数との差として定義されている誤差値ｅ（ｔ）を計算するステップと、
微分利得Ｋ_ｓと時間に関する前記誤差値の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと前記誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する前記誤差値の積分Ｅ（ｔ）との積の総和を使用して操作変数ｕを計算するステップと、
前記操作変数ｕに基づき前記ターゲットを制御するステップと、を含み、
式（１）として定義されている状態ベクトルｘ（ｔ）は、式（２）

【数1】

を満たし、
ｔは時間を表し、α_０およびα_１は正の数を表す、制御方法。

【請求項2】

前記微分利得Ｋ_ｓは式（３）を満たし、前記比例利得Ｋ_ｅは式（４）を満たし、積分利得Ｋ_Ｅの積は式（５）を満たし、
Ｋ_ｓ＝λＭ＋Ｋ_ａ＋Ｃ式（３）
Ｋ_ｅ＝μＭ＋λＫ_ａ＋Ｌ＋λＣ式（４）
Ｋ_Ｅ＝μＫ_ａ＋γλＬ＋μＣ式（５）
λ、μ、およびγは正のスカラー、γは１未満であり、Ｋ_ａおよびＬは正定値行列であり、Ｍは質量行列である、請求項１に記載の制御方法。

【請求項3】

前記ターゲットはｎ個の関節を有し、前記ｎ個の関節の各々は位置を１つ有し、
前記操作変数ｕは、式（６）

【数2】

として定義され、
ここで、ｑは関節位置であり、

【数3】

は関節速度であり、

【数4】

は関節加速度であり、Ｃはコリオリ行列であり、Ｇはターゲットの重力ベクトルであり、Ｊ_ｉは関節点ｉのヤコビアン行列であり、Ｆ_ｉは前記関節点ｉにおける一般化力であり、ｉは０からｎの間の値である、請求項１または２に記載の制御方法。

【請求項4】

制御装置であって、
制御対象であるターゲットのプロセス変数を感知するように構成されているセンサーユニットと、
入力されるべき基準値を記憶するように構成されているメモリユニットと、
微分利得Ｋ_ｓと時間に関する誤差値ｅ（ｔ）の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと前記誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する前記誤差値の積分Ｅ（ｔ）との積の総和を使用して操作変数ｕを計算するように構成されている計算ユニットと、
前記操作変数ｕに基づき前記ターゲットを制御するように構成されている制御ユニットとを備え、
式（１）として定義されている状態ベクトルｘ（ｔ）は、式（２）

【数5】

を満たし、
ｅ（ｔ）は前記基準値と前記プロセス変数との間の差として定義され、ｔは時間を表し、α_０およびα_１は正の数を表す、制御装置。

【請求項5】

前記微分利得Ｋ_ｓは式（３）を満たし、前記比例利得Ｋ_ｅは式（４）を満たし、Ｋ_Ｅは式（５）を満たし、
Ｋ_ｓ＝λＭ＋Ｋ_ａ＋Ｃ式（３）
Ｋ_ｅ＝μＭ＋λＫ_ａ＋Ｌ＋λＣ式（４）
Ｋ_Ｅ＝μＫ_ａ＋γλＬ＋μＣ式（５）
λ、μ、およびγは正のスカラー、γは１未満であり、Ｋ_ａおよびＬは正定値行列であり、Ｍは質量行列である、請求項４に記載の制御装置。

【請求項6】

前記ターゲットはｎ個の関節を有し、前記ｎ個の関節の各々は位置を１つ有し、
前記操作変数ｕは、式（６）

【数6】

として定義され、
ここで、ｑは関節位置であり、

【数7】

は関節速度であり、

【数8】

は関節加速度であり、Ｃはコリオリ行列であり、Ｇはターゲットの重力ベクトルであり、Ｊ_ｉは関節点ｉのヤコビアン行列であり、Ｆ_ｉは前記関節点ｉにおける一般化力であり、ｉは０からｎの間の値である、請求項４または５に記載の制御装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、制御方法および制御装置に関する。

【背景技術】

【0002】

非特許文献１では、マニピュレータの未知の動力学パラメータやペイロードをオンラインで推定している、ＰＤフィードバック部と完全ダイナミクスフィードフォワード補償部（ｆｕｌｌｄｙｎａｍｉｃｓｆｅｅｄｆｏｒｗａｒｄｃｏｍｐｅｎｓａｔｉｏｎｐａｒｔ）とからなる適応型ロボット制御アルゴリズムを開示している。このアルゴリズムは、マニピュレータダイナミクスの構造を効果的に利用しているので計算が簡単である。

【0003】

非特許文献２では、線形コントローラの伝達関数の正実性を必要とする系全体の大域的漸近安定性を開示している。

【0004】

非特許文献３では、制約条件付きの多目的加重タスクとして定式化された二次計画法（ＱＰ）を用いて、トラッキング誤差を効率的に最小化するトルク制御型ヒューマノイドロボットに対する制御フレームワークを開示している。

【先行技術文献】

【非特許文献】

【0005】

【文献】Ｊ．－Ｊ．Ｅ．Ｓｌｏｔｉｎｅら、「Ｏｎｔｈｅａｄａｐｔｉｖｅｃｏｎｔｒｏｌｏｆｒｏｂｏｔｍａｎｉｐｕｌａｔｏｒｓ．」ＴｈｅＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＲｏｂｏｔｉｃｓＲｅｓｅａｒｃｈ、６（３）、１９８７年。

【文献】Ｉ．Ｄ．Ｌａｎｄａｕら、「ＡｐｐｌｉｃａｔｉｏｎｓｏｆｔｈｅＰａｓｓｉｖｅＳｙｓｔｅｍｓＡｐｐｒｏａｃｈｔｏｔｈｅＳｔａｂｉｌｉｔｙＡｎａｌｙｓｉｓｏｆＡｄａｐｔｉｖｅＣｏｎｔｒｏｌｌｅｒｓｆｏｒＲｏｂｏｔＭａｎｉｐｕｌａｔｏｒｓ．」ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＡｄａｐｔｉｖｅＣｏｎｔｒｏｌａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ、３、１９８９年。

【文献】Ｒ．ＣｉｓｎｅｒｏｓＬｉｍｏｎ、Ｍ．Ｂｅｎａｌｌｅｇｕｅ、Ａ．Ｂｅｎａｌｌｅｇｕｅ、Ｍ．Ｍｏｒｉｓａｗａ、Ｈ．Ａｕｄｒｅｎ、Ｐ．Ｇｅｒｇｏｎｄｅｔ、Ａ．Ｅｓｃａｎｄｅ、Ａ．Ｋｈｅｄｄａｒ、Ｆ．Ｋａｎｅｈｉｒｏ、「ＲｏｂｕｓｔＨｕｍａｎｏｉｄＣｏｎｔｒｏｌＵｓｉｎｇａＱＰＳｏｌｖｅｒｗｉｔｈＩｎｔｅｇｒａｌＧａｉｎｓ．」ＩＲＯＳ２０１８年：７４７２～７４７９頁。

【発明の概要】

【発明が解決しようとする課題】

【0006】

従来のトルクまたは電流制御は、たとえば、質量分布および荷重負荷が間違っている場合に、モデル化誤差の影響を受けやすい。したがって、一般的に高利得の位置制御が使用され、そのため、特に予期しない接触が発生したときに、動的運動におけるトラッキング誤差ならびに周囲の人間および環境にとって危険な状態が生じる。

【0007】

したがって、本発明は、上記問題点に鑑みてなされたものであり、本発明の目的は、エネルギー効率およびロバスト性をさらに改善することが可能な制御方法および制御装置を提供することにある。

【課題を解決するための手段】

【0008】

本発明は、上記の知見に基づきなされたものであり、その要旨は次のとおりである。

【0009】

［１］制御方法であって、
制御対象であるターゲットのプロセス変数を測定するステップと、
基準値とプロセス変数との差として定義されている誤差値ｅ（ｔ）を計算するステップと、
微分利得Ｋ_ｓと時間に関する誤差値の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する誤差値の積分Ｅ（ｔ）との積の総和を使用して操作変数ｕを計算するステップと、
操作変数ｕに基づきターゲットを制御するステップとを含み、
式（１）として定義されている状態ベクトルｘ（ｔ）は、式（２）

【0010】

【数1】

【0011】

を満たし、
ｔは時間を表し、α_０およびα_１は正の数を表す、方法。
［２］［１］に記載の制御方法であって、微分利得Ｋ_ｓは式（３）を満たし、比例利得Ｋ_ｅは式（４）を満たし、積分利得Ｋ_Ｅの積は式（５）を満たし、
Ｋ_ｓ＝λＭ＋Ｋ_ａ＋Ｃ式（３）
Ｋ_ｅ＝μＭ＋λＫ_ａ＋Ｌ＋λＣ式（４）
Ｋ_Ｅ＝μＫ_ａ＋γλＬ＋μＣ式（５）
ここで、λ、μ、およびγは正のスカラー、γは１未満であり、Ｋ_ａおよびＬは正定値行列であり、Ｍは質量行列である、制御方法。
［３］［１］または［２］に記載の制御方法であって、ターゲットはｎ個の関節を有し、ｎ個の関節の各々は位置を１つ有し、
操作変数ｕは、式（６）

【0012】

【数2】

【0013】

として定義され、
ここで、ｑは関節位置であり、

【0014】

【数3】

【0015】

は関節速度であり、

【0016】

【数4】

【0017】

は関節加速度であり、Ｃはコリオリ行列であり、Ｇはターゲットの重力ベクトルであり、Ｊ_ｉは関節点ｉのヤコビアン行列であり、Ｆ_ｉは関節点ｉにおける一般化力であり、ｉは０からｎの間の値である、制御方法。
［４］制御装置であって、
制御対象であるターゲットのプロセス変数を感知するように構成されているセンサーユニットと、
入力されるべき基準値を記憶するように構成されているメモリユニットと、
微分利得Ｋ_ｓと時間に関する誤差値ｅ（ｔ）の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する誤差値の積分Ｅ（ｔ）との積の総和を使用して操作変数ｕを計算するように構成されている計算ユニットと、
操作変数ｕに基づきターゲットを制御するように構成されている制御ユニットと、を備え、
式（１）として定義されている状態ベクトルｘ（ｔ）は、式（２）

【0018】

【数5】

【0019】

を満たし、
ここで、ｅ（ｔ）は基準値とプロセス変数との間の差として定義され、ｔは時間を表し、α_０およびα_１は正の数を表す、制御装置。
［５］［４］に記載の制御装置であって、微分利得Ｋ_ｓは式（３）を満たし、比例利得Ｋ_ｅは式（４）を満たし、Ｋ_Ｅは式（５）を満たし、
Ｋ_ｓ＝λＭ＋Ｋ_ａ＋Ｃ式（３）
Ｋ_ｅ＝μＭ＋λＫ_ａ＋Ｌ＋λＣ式（４）
Ｋ_Ｅ＝μＫ_ａ＋γλＬ＋μＣ式（５）
ここで、λ、μ、およびγは正のスカラー、γは１未満であり、Ｋ_ａおよびＬは正定値行列であり、Ｍは質量行列である、制御装置。
［６］［４］または［５］に記載の制御装置であって、ターゲットはｎ個の関節を有し、ｎ個の関節の各々は位置を１つ有し、
操作変数ｕは、式（６）

【0020】

【数6】

【0021】

として定義され、
ここで、ｑは関節位置であり、

【0022】

【数7】

【0023】

は関節速度であり、

【0024】

【数8】

【0025】

は関節加速度であり、Ｃはコリオリ行列であり、Ｇはターゲットの重力ベクトルであり、Ｊ_ｉは関節点ｉのヤコビアン行列であり、Ｆ_ｉは関節点ｉにおける一般化力であり、ｉは０からｎの間の値である、制御装置。

【発明の効果】

【0026】

上で説明されているように、本発明によれば、エネルギー効率およびロバスト性をさらに改善することができる制御方法および制御装置を提供することが可能である。

【図面の簡単な説明】

【0027】

【図1】本発明の実施形態による制御方法の流れの一例を示すフローチャートである。

【図2】一実施形態による制御装置が搭載される制御装置のコンポーネントを示す図である。

【図3】本発明の一例による制御対象の関節を備えるロボットを示す図である。

【図4】本発明の例による運動学的フィードバックおよび受動性に基づくＰＩＤの下での完全なモデルに対するラジアン／秒単位の関節速度（ｖｑ）およびミリ秒単位の時間に関するラジアン単位の位置（ｑ）の二乗平均平方根（ＲＭＳ）誤差を示す図である。

【図5】本発明の比較例による運動学的フィードバックおよび受動性に基づくＰＩＤの下でのバイアスモデルに対するラジアン／秒単位の関節速度（ｖｑ）および時間（ｍｓ）に関するラジアン単位の位置（ｑ）のＲＭＳ誤差を示す図である。

【図6】コントローラのブロック図である。

【発明を実施するための形態】

【0028】

これ以降、本開示の一実施形態は、添付図面を参照しつつ詳しく説明される。それに加えて、本明細書および図面において、実質的に同一の機能および構成を有する同一の構成要素には同一の参照数字を付し、重複する説明は省略する。

【0029】

図１は、本発明の実施形態による制御方法の流れの一例を示すフローチャートである。図１に示されているように、本発明の実施形態による制御方法は、特徴として、
（ａ）制御対象であるターゲットのプロセス変数を測定するステップと、
（ｂ）基準値とプロセス変数との差として定義されている誤差値ｅ（ｔ）を計算するステップと、
（ｃ）微分利得Ｋ_ｓと時間に関する誤差値の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する誤差値の積分Ｅ（ｔ）との積の総和を使用して操作変数ｕを計算するステップと、
（ｄ）操作変数ｕに基づきターゲットを制御するステップと、を含み、
式（１）として定義されている状態ベクトルｘ（ｔ）は、式（２）

【0030】

【数9】

【0031】

を満たし、
ｔは時間を表し、α_０およびα_１は正の数を表す。

【0032】

（制御対象であるターゲットのプロセス変数を測定するステップ）
本発明の実施形態において、制御対象であるターゲットのプロセス変数が測定される。プロセス変数およびターゲットは限定されない。ターゲットは、ｎ個の関節を有することができる。ｎ個の関節の各々は、位置を１つ有することができる。ターゲットは、ロボットであってもよい。ターゲットのプロセス変数を測定するためのセンサーが、測定装置とし使用され得る。本発明の実施形態において、センサーは、関節位置センサーである。それに加えて、センサーは、トルクセンサー、圧力センサー、慣性センサー、または同様のセンサーをさらに含むことができる。

【0033】

（基準値とプロセス変数との差として定義されている誤差値ｅ（ｔ）を計算するステップ）
本発明の実施形態において、誤差値ｅ（ｔ）は、基準値およびプロセス変数を使用することによって計算される。基準値は、プリセット値である。誤差値ｅ（ｔ）は、基準値とプロセス変数との間の差として定義される。

【0034】

（フィードバック操作変数ｕを算出するステップ）
本発明の実施形態では、フィードバック操作変数ｕ_ｆは、微分利得Ｋ_ｓと時間に関する誤差値の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する誤差値の積分Ｅ（ｔ）との積の総和を使用して計算される。フィードバック操作変数ｕ_ｆは、式

【0035】

【数10】

【0036】

によって表すことができる。

【0037】

微分利得Ｋ_ｓは、好ましくは式（３）を満たす。比例利得Ｋ_ｅは、好ましくは式（４）を満たし、積分利得Ｋ_Ｅの積は式（５）を満たす。
Ｋ_ｓ＝λＭ＋Ｋ_ａ＋Ｃ式（３）
Ｋ_ｅ＝μＭ＋λＫ_ａ＋Ｌ＋λＣ式（４）
Ｋ_Ｅ＝μＫ_ａ＋γλＬ＋μＣ式（５）
ここで、λ、μ、およびγは正のスカラーであり、γは１未満であり、Ｋ_ａおよびＬは正定値行列であり、Ｍは関節の質量行列である。

【0038】

ターゲットが、ｎ個の関節を有するときに、ｎ個の関節の各々は位置を１つ有し、操作変数ｕは、好ましくは式（６）

【0039】

【数11】

【0040】

として定義される。
ここで、ｑは関節位置であり、

【0041】

【数12】

【0042】

は関節速度であり、

【0043】

【数13】

【0044】

は関節加速度であり、Ｃはコリオリ行列であり、Ｇはターゲットの重力ベクトルであり、Ｊ_ｉは関節点ｉのヤコビアン行列であり、Ｆ_ｉは関節点ｉにおける一般化力であり、ｉは０からｎの間の値である。

【0045】

（操作変数ｕに基づきターゲットを制御するステップ）
本発明の実施形態において、ターゲットは、操作変数ｕに基づき制御される。

【0046】

本発明の実施形態によれば、操作変数ｕは、積分利得Ｋ_Ｅと時間に関する誤差値の積分Ｅ（ｔ）との積を含む。したがって、低周波におけるモデリング誤差の補正を可能にし、予測されない接触があった場合により安全なコンプライアント挙動を有することが可能である。

【0047】

さらに、本発明の実施形態によれば、式（１）として定義されている状態ベクトルｘ（ｔ）は、式（２）

【0048】

【数14】

【0049】

を満たし、
ｔは時間を表し、α_０およびα_１は正の数を表す。したがって、状態ベクトルｘ（ｔ）は、一次指数関数的収束となる。このような理由から、収束証明は、速い収束の保証を与える。

【0050】

ロボットがｎ個の関節を有するときに、各々実数で表される１つの位置を有する。これらの関節位置のベクトルは、ｑと表記される。これらの関節の各々は、トルク発生器により作動される。これらのトルクのベクトルはτで表される。留意すべき重要な要因の１つは、τおよびｑが同じサイズを有するベクトルであることである。ロボットは、接点ｉにおいてＦ_ｉで各々表される外力も受ける。時間微分演算子ｄ／ｄｔは、ドット

【0051】

【数15】

【0052】

で表され、２次のｄ^２／ｄｔ^２は、２つのドット

【0053】

【数16】

【0054】

で表される。ｑ、

【0055】

【数17】

【0056】

、

【0057】

【数18】

【0058】

、τ、およびＦ_ｉをリンクする運動方程式は、ラグランジュ力学と呼ばれ、

【0059】

【数19】

【0060】

であり、
記号は、以下のように定義され得る。
ｑ＝ｑ（ｔ）：現在の関節位置
ｑ^ｒ＝ｑ^ｒ（ｔ）：基準関節位置

【0061】

【数20】

【0062】

：現在の関節速度

【0063】

【数21】

【0064】

：基準関節速度

【0065】

【数22】

【0066】

：現在の関節加速度

【0067】

【数23】

【0068】

：基準関節加速度
Ｍ＝Ｍ（ｑ）：質量行列／慣性行列
ｅ＝ｑ－ｑ^ｒ：関節位置誤差

【0069】

【数24】

【0070】

：ｄＭ／ｄｔ＝Ｃ＋Ｃ^ｔとなるようなコリオリ行列

【0071】

【数25】

【0072】

：関節速度誤差
Ｇ＝Ｇ（ｑ）：ロボットの重力ベクトル

【0073】

【数26】

【0074】

：関節位置誤差の積分
Ｊ_ｉ＝Ｊ_ｉ（ｑ）：接点ｉのヤコビアン行列
λ、μ、γ：正のスカラー（γ＜１）
Ｆ_ｉ＝Ｆ_ｉ（ｔ）：接点ｉにおける一般化力
Ｋ_ａ、Ｌ：正定値行列

【0075】

ロボットが時間に依存する所定の基準軌道ｑ^ｒをたどることが望まれる場合、上記の基準軌道は２回微分可能であるべきなので、微分

【0076】

【数27】

【0077】

および

【0078】

【数28】

【0079】

も定義される。問題はトルクτをどのように発生させるかである。上述の基準軌道によれば、ｔが無限大になるときにｑがｑ^ｒに収束することを保証することは困難である。ｔが無限大になるときに

【0080】

【数29】

【0081】

が

【0082】

【数30】

【0083】

に収束し、ｔが無限大になるときに

【0084】

【数31】

【0085】

が

【0086】

【数32】

【0087】

に収束するという望ましい特性を得ることは困難である。

【0088】

一方、本発明の実施形態による制御方法は、上述の問題を解決することができる。

【0089】

本発明の実施形態による制御方法は、受動性に基づくＰＩＤ（比例積分微分）制御法を含む。ここで、受動性に基づくとは、入力ソースと外部ソースとで導入されたエネルギーを超えるエネルギーを発生しない系の特性である。

【0090】

系のエネルギーは式

【0091】

【数33】

【0092】

で表され、
Ｐは、ポテンシャル重力エネルギーである。エネルギーの時間微分は、機械力であり、式

【0093】

【数34】

【0094】

によって与えられ、
次いで、

【0095】

【数35】

【0096】

である場合に、次の式が得られる。

【0097】

【数36】

【0098】

第２の項に

【0099】

【数37】

【0100】

が加えられ、次の式が得られる。

【0101】

【数38】

【0102】

行列

【0103】

【数39】

【0104】

は、歪対称である。これは、任意のベクトル

【0105】

【数40】

【0106】

について、

【0107】

【数41】

【0108】

が得られることを意味する。

【0109】

【数42】

【0110】

この系において、受動性による

【0111】

【数43】

【0112】

であるという事実から恩恵を受け得る。したがって、この利得行列Ｋ_ｓ、Ｋ_ｅ、およびＫ_Ｅは、次のように表すことができる。
Ｋ_ｓ＝λＭ＋Ｋ_ａ＋Ｃ式（３）
Ｋ_ｅ＝μＭ＋λＫ_ａ＋Ｌ＋λＣ式（４）
Ｋ_Ｅ＝μＫ_ａ＋γλＬ＋μＣ式（５）
これは、式

【0113】

【数44】

【0114】

を与える。
ここで、これらの利得は、ｑおよび

【0115】

【数45】

【0116】

に依存し、したがって時間で異なる。

【0117】

本発明の実施形態による制御方法は、リアプノフ安定性を有する。リアプノフ安定性は、力学系を記述する微分方程式または差分方程式の解に対する様々なタイプの安定性もしくは収束性のうちの１つである。平衡点ｘ_ｅ付近から出発した解が、いつまでも平衡点ｘ_ｅ付近に留まるときに、その平衡点ｘ_ｅはリアプノフ安定である。より正確には、平衡点ｘ_ｅがリアプノフ安定であり、平衡点ｘ_ｅ付近から出発したすべての解が平衡点ｘ_ｅに収束するとき、平衡点ｘ_ｅは漸近安定である。

【0118】

状態空間内の任意の場所から始まる解がすべて平衡点ｘ_ｅに収束するときに、平衡点ｘ_ｅは大域的漸近安定である（条件１）。
状態空間Ｒ^ｎの任意の場所で時刻ｔ＝０から始まる解が特性

【0119】

【数46】

【0120】

を有するような２つの正数α_０およびα_１が存在するときに、状態ｘは平衡点ｘ_ｅに大域的指数関数的に収束する（条件２）。

【0121】

【数47】

【0122】

の定数正定値行列Ｈが存在し、

【0123】

【数48】

【0124】

の２つの他の正定値行列Ｈ_０（ｔ）＞ＨおよびＨ_１（ｔ）＞Ｈが存在し、状態空間Ｒ^ｎ内の任意の場所から始まる解が特性

【0125】

【数49】

【0126】

を有するときに（条件３）、以下のようになる。

【0127】

状態ｘは平衡点ｘ_ｅに大域的指数関数的に収束する。条件３は、条件１より少し強い条件であり、一次大域的指数関数的収束と呼ばれる。本発明の実施形態による制御方法は、好ましくは、一次大域的指数関数的収束を満たす。

【0128】

状態ベクトルｘが

【0129】

【数50】

【0130】

として定義されるときに、
式

【0131】

【数51】

【0132】

は式

【0133】

【数52】

【0134】

の中で置き換えられ、閉ループダイナミクス

【0135】

【数53】

【0136】

が得られ、
これは、

【0137】

【数54】

【0138】

を与える。
これは、自律的状態ダイナミクス

【0139】

【数55】

【0140】

を与え、
Ｉ_３×３は３×３単位行列であり、０_３×３は３×３零行列である。

【0141】

ここで、これは時間変化行列を有する自律的な線形ダイナミクスである。これは、ｘ_ｅ＝（０００）が系の平衡点であることを意味する。ここで、この平衡点の大域的漸近安定性が得られると、ｔが無限大になるときにｑがｑ^ｒに収束することを保証することが可能であることは重要である。また、ｔが無限大になるときに

【0142】

【数56】

【0143】

が

【0144】

【数57】

【0145】

に収束し、ｔが無限大になるときに

【0146】

【数58】

【0147】

が

【0148】

【数59】

【0149】

に収束するという望ましい特性を得ることが可能である。

【0150】

Ｋ_ｓ、Ｋ_ｅ、およびＫ_Ｅの値がそれぞれ式（３）、（４）、および（５）からの値で置き換えられたときに、

【0151】

【数60】

【0152】

における定数正定値行列Ｈ、および

【0153】

【数61】

【0154】

における他の２つの正定値行列Ｈ_０（ｔ）＞Ｈ、Ｈ_１（ｔ）＞Ｈが存在して、

【0155】

【数62】

【0156】

であり、これが条件３を満たすときに、これは条件２も満たされることを意味し、これは系が大域的指数関数的安定であることを意味する。

【0157】

本発明の実施形態による制御方法は、速度誤差、位置誤差、および位置誤差の積分において誤差がゼロに収束する１次指数的収束の理論的証明を達成することができる。位置誤差は、通常、単に誤差と呼ばれるものである。位置誤差がゼロに収束するときに、これは完全系の場合に、トラッキングが良好であり、ダイナミクスが安定していることを意味する。速度誤差がゼロに収束するときに、動体トラッキングが良く、遅延がないことを意味する。位置誤差の積分がゼロに収束するときに、モデルと現実との間に小さなミスマッチがある場合、定常誤差はないことを意味する。

【0158】

位置誤差の積分の存在は、系が静的誤差を有しないことを許し、定常誤差はゼロ周波数外乱の結果である。同様に、低周波数外乱があるときに、この積分項はまたそれを補償することになる。これは、積分が低周波成分を増幅するからである。この項により、われわれは定常誤差なしで低い利得を保つことができ、コンプライアンスをさらに許し、ロボットと人間との間の相互作用の場合に通常はより安全なものとなる。

【0159】

次に、本発明の一実施形態による制御装置が、添付図面を参照しつつ詳しく説明される。

【0160】

図２は、本実施形態による制御装置が搭載される制御装置のコンポーネントを示す図である。図２に示されているように、本実施形態による制御装置１００は、センサーユニット２００と、メモリユニット３００と、計算ユニット４００と、制御ユニット５００とを備える。

【0161】

（センサーユニット）
本発明の実施形態によるセンサーユニット２００は、制御対象であるターゲットのプロセス変数を感知する。たとえば、センサーユニット２００は、関節位置センサーによって実現され得る。それに加えて、センサーユニット２００は、トルクセンサー、圧力センサー、慣性センサー、または同様のセンサーをさらに含むことができる。

【0162】

（メモリユニット）
本発明の実施形態によるメモリユニット３００は、入力されるべき基準値を記憶する。たとえば、メモリユニット３００は、リードオンリーメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、ハードディスクドライブ（ＨＤＤ）、フラッシュメモリ、または同様のものによって実現され得る。

【0163】

（計算ユニット）
本発明の実施形態による計算ユニット４００は、微分利得Ｋ_ｓと時間に関する誤差値ｅ（ｔ）の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する誤差値の積分Ｅ（ｔ）との積の総和を使用して操作変数ｕを計算する。たとえば、計算ユニット４００は、算術論理演算ユニット（ＡＬＵ）とすることができる。

【0164】

本発明の実施形態による計算ユニット４００は、微分利得Ｋ_ｓが式（３）を満たし、比例利得Ｋ_ｅが式（４）を満たし、積分利得Ｋ_Ｅの積が式（５）を満たすように、操作変数ｕを計算する。
Ｋ_ｓ＝λＭ＋Ｋ_ａ＋Ｃ式（３）
Ｋ_ｅ＝μＭ＋λＫ_ａ＋Ｌ＋λＣ式（４）
Ｋ_Ｅ＝μＫ_ａ＋γλＬ＋μＣ式（５）
ここで、λ、μ、およびγは正のスカラー、γは１未満であり、Ｋ_ａおよびＬは正定値行列であり、Ｍは質量行列である。

【0165】

ターゲットが、ｎ個の関節を有するときに、ｎ個の関節の各々は位置を１つ有し、操作変数ｕは、好ましくは式（６）

【0166】

【数63】

【0167】

として定義される。
ここで、ｑは関節位置であり、

【0168】

【数64】

【0169】

は関節速度であり、

【0170】

【数65】

【0171】

は関節加速度であり、Ｃはコリオリ行列であり、Ｇはターゲットの重力ベクトルであり、Ｊ_ｉは関節点ｉのヤコビアン行列であり、Ｆ_ｉは関節点ｉにおける一般化力であり、ｉは０からｎの間の値である、制御方法が提供される。

【0172】

（制御ユニット）
本発明の実施形態による制御ユニット５００は、操作変数ｕに基づきターゲットを制御する。たとえば、制御ユニット５００は、プログラム（ソフトウェア）を実行する中央演算処理装置（ＣＰＵ）またはグラフィックスプロセッシングユニット（ＧＰＵ）などのプロセッサによって実現され得る。それに加えて、これらの構成要素のいくつかまたはすべては、大規模集積回路（ＬＳＩ）、特定用途向け集積回路（ＡＳＩＣ）、またはフィールドプログラマブルゲートアレイ（ＦＰＧＡ）などのハードウェア（回路ユニット、回路を含む）によって実現されるか、またはソフトウェアとハードウェアとの連携によって実現されもよい。

【0173】

上で説明されている実施形態は、以下のように表すことができる。
プログラムを記憶する記憶装置と、プロセッサとを備える、制御装置であって、プロセッサはプログラムを実行し、制御対象であるターゲットのプロセス変数を測定することと、基準値とプロセス変数との差として定義されている誤差値ｅ（ｔ）を計算することと、微分利得Ｋ_ｓと時間に関する誤差値の微分ｓ（ｔ）との積、比例利得Ｋ_ｅと誤差値ｅ（ｔ）との積、および積分利得Ｋ_Ｅと時間に関する誤差値の積分Ｅ（ｔ）との積の総和を使用して操作変数ｕを計算することと、操作変数ｕに基づきターゲットを制御することとを実行するように構成され、式（１）として定義されている状態ベクトルｘ（ｔ）は、式（２）

【0174】

【数66】

【0175】

を満たし、ｔは時間を表し、α_０およびα_１は正の数を表す、制御装置。

【実施例】

【0176】

次に、本発明の例について説明する。実施例における条件は、本発明の実施可能性および効果を確認するために採用されている条件の一例であるが、本発明は、条件のこの例に限定されるものではない。本発明は、本発明の要旨から逸脱することなく、本発明の目的が達成される限り、種々の条件を採用することができる。

【0177】

図３は、本発明の一例による制御対象の関節を備えるロボットを示す図である。例では、関節トルクは

【0178】

【数67】

【0179】

に設定される。

【0180】

したがって、次の特性を有するトルクが得られた。外乱がなく、現在の軌道から所望の軌道が始まるときに、

【0181】

【数68】

【0182】

、

【0183】

【数69】

【0184】

、ｑ＝ｑ^ｒが得られた。したがって、完全な状態では、実施例による制御方法は、系の性能を低下させない。外乱があるときに、または所望の軌道が現在の軌道と異なる状態から始まるときに、１次指数関数的ダイナミクスにおいて、ｓ、ｅ、Ｅのゼロへの収束が得られる。したがって、系は摂動に対してロバストである。この収束は、系の自然な受動性を利用しているので、モデル化誤差に対してかなりロバストである。この定式化は、適応制御に適している。

【0185】

図４は、本発明の例による運動学的フィードバックおよび受動性に基づくＰＩＤの下での完全なモデルに対するラジアン／秒単位の関節速度（ｖｑ）およびミリ秒単位の時間に関するラジアン単位の位置（ｑ）のＲＭＳ誤差を示す図である。図５は、本発明の比較例による運動学的フィードバックおよび受動性に基づくＰＩＤの下でのバイアスモデルに対するラジアン／秒単位の関節速度（ｖｑ）および時間（ｍｓ）に関するラジアン単位の位置（ｑ）のＲＭＳ誤差を示す図である。図４および図５は、サンプリングされた時間に関する関節速度の誤差｜｜ｓ｜｜および関節位置の誤差｜｜ｅ｜｜についての二乗平均平方根（ＲＭＳ）誤差を示す。軸は、ｘ軸：サンプル時間［ｍｓ］、ｙ軸：左側では関節速度［ｒａｄ／ｓ］、右側では関節角度［ｒａｄ］である。古典的なＰＩＤ（ｋｆ）の信号はピンク色で、受動性に基づくＰＩＤの信号は緑色である。
マニピュレータアームＳａｗｙｅｒ（ＲｅｔｈｉｎｋＲｏｂｏｔｉｃｓ社製）のシミュレーションモデルは、所望の軌道を追跡する。２つの異なるアルゴリズムがテストされ、第１のアルゴリズムは、運動学的フィードバック（ｋｆ）と呼ばれる従来のＰＩＤ制御であり、第２のアルゴリズムは、受動性に基づく積分（ｉｐ）として表される受動性に基づくＰＩＤである。図５は、サンプリングされた時間に関する所望の関節軌道を追跡する際のＲＭＳ誤差を示している。図４に示されているように、完全な状態では、誤差は同様に両方ともゼロになる。

【0186】

しかしながら、図５に示されているように、たとえば、トルクにバイアスを加えることによってモデル化誤差が加えられたときに、従来のコントローラの関節誤差は増大し、受動性に基づくものは誤差をゼロに非常に近い値に維持した。

【0187】

図５の右に示されているように、図５の右は、ＰＤ制御に関する最新技術（Ｓｌｏｔｉｎｅ１９８７）（Ｌａｎｄａｕ１９８９）から知られているが、ＰＩＤ制御には使用されたことがない。図６は、コントローラのブロック図である。基準加速度発生器は、所望の位置、速度、および加速度を発生するユニットである。トルク／電流制御は、逆ダイナミクスを利用して運動の加速度を発生するために使用される。受動性に基づくＰＩＤは、系のロバスト性を向上させる補正項を追加することによって通常の逆ダイナミクスを改善する。実施例において示されているように、系が完全なときには、誤差がないので、追加項はゼロとなり、逆ダイナミクスに影響を及ぼさない。これらの項は、系がモデルのように完全な挙動を示さないときのみ、補正されるように見える。大域的指数関数的収束は、制御が安定しており、良好な性能を持つことを保証する。

【0188】

本発明の好ましい実施形態が上で説明され、例示されているが、これらは本発明の例示であって、限定するものとして考えられるべきではないことは理解されたい。本発明の精神または範囲から逸脱することなく、追加、省略、置換、および他の修正が行われ得る。したがって、本発明は、前述の説明によって制限されるものと考えられるべきではなく、付属の請求項の範囲によってのみ制限される。本発明の実施形態による制御装置は、油圧式または電動式のいずれかのアクチュエータを備えたロボットとすることができる。

【産業上の利用可能性】

【0189】

本発明によれば、エネルギー効率およびロバスト性をさらに改善することができる制御方法および制御装置を提供することが可能である。したがって、本発明は、産業上の高い応用性を有する。

【符号の説明】

【0190】

１００制御装置
２００センサーユニット
３００メモリユニット
４００計算ユニット
５００制御ユニット

【図1】