特開2022-188370 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社国際電気通信基礎技術研究所の特許一覧

特開2022-188370ロボット制御装置、ロボット制御方法、および、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022188370

(43)【公開日】2022-12-21

(54)【発明の名称】ロボット制御装置、ロボット制御方法、および、プログラム

(51)【国際特許分類】

B25J 5/00 20060101AFI20221214BHJP

【ＦＩ】

B25J5/00 F

【審査請求】未請求

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2021096353

(22)【出願日】2021-06-09

【国等の委託研究の成果に係る記載事項】（出願人による申告）２０２０－２０２１年度国立研究開発法人新エネルギー・産業技術総合開発機構「人と共に進化する次世代人工知能に関する技術開発事業／人と共に進化するＡＩシステムのフレームワーク開発／サイボーグＡＩに関する研究開発」、および、令和２年度総務省戦略的情報通信研究開発推進事業（ＳＣＯＰＥ）「ロボットの運動と知能の融合に向けた、ビッグデータを用いたヒトの運動能力の抽出と運動生成への利用」、産業技術力強化法第１７条の適用を受ける特許出願

(71)【出願人】

【識別番号】393031586

【氏名又は名称】株式会社国際電気通信基礎技術研究所

(74)【代理人】

【識別番号】100143498

【弁理士】

【氏名又は名称】中西健

(74)【代理人】

【識別番号】100136319

【弁理士】

【氏名又は名称】北原宏修

(74)【代理人】

【識別番号】100148275

【弁理士】

【氏名又は名称】山内聡

(74)【代理人】

【識別番号】100142745

【弁理士】

【氏名又は名称】伊藤世子

(72)【発明者】

【氏名】石原弘二

(72)【発明者】

【氏名】森本淳

【テーマコード（参考）】

3C707

【Ｆターム（参考）】

3C707CS08

3C707KS21

3C707KS23

3C707KT01

3C707KT04

3C707LV19

3C707LW07

3C707WA03

3C707WA13

3C707WK07

(57)【要約】

【課題】運動指令を計算する時間が長い時間となることを許容し、ロボットが転倒することなく、ロボットに多様な運動をさせることができるロボット制御装置を実現する。
【解決手段】ロボット制御装置１００では、階層的な制御、つまり、モデル予測制御部２によるモデル予測処理、および、ＰＤ制御部３によるＰＤ制御を行うことができる。これにより、このロボット制御装置では、運動指令を計算する時間が長い時間となることを許容し、ロボットが転倒することなく、ロボットに多様な運動をさせることができる。
【選択図】図１

【特許請求の範囲】

【請求項1】

ロボットに所定の運動を実行させるために前記ロボットを制御するためのロボット制御装置であって、
前記ロボットに所定の運動をさせるための目標データを生成する目標生成部と、
前記目標データに基づいて、前記ロボットに前記所定の運動をさせるための力学制約に従うモデルを用いてモデル予測処理を行うことで、前記ロボットを制御するための制御入力であるＭＰＣ用制御入力を取得するモデル予測制御部と、
前記目標データと前記ロボットの状態とに基づいて、前記ロボットの平衡状態を維持させるための制御入力であるＰＤ制御用制御入力を取得するＰＤ制御部と、
前記ＭＰＣ用制御入力、および、前記ＰＤ制御用制御入力を合成した制御入力を前記ロボットの駆動装置に出力する、あるいは、前記ＭＰＣ用制御入力、および、前記ＰＤ制御用制御入力のいずれか一方を前記ロボットの駆動装置に出力する合成部と、
を備えるロボット制御装置。

【請求項2】

前記モデル予測制御部は、第１時間間隔で、前記ＭＰＣ用制御入力を取得し、
前記ＰＤ制御部は、前記第１時間間隔よりも短い時間間隔である第２時間間隔で、前記ＰＤ制御用制御入力を取得する、
請求項１に記載のロボット制御装置。

【請求項3】

前記目標生成部は、前記ＰＤ制御部に出力する目標データを、前記ロボットの平衡状態を維持させるために必要なデータに関するデータのみのデータであるＰＤ制御用目標データとして、前記ＰＤ制御部に出力する、
請求項１または２に記載のロボット制御装置。

【請求項4】

前記モデル予測制御部は、前記ロボットの目標軌道をＮ時間ステップ（Ｎ：自然数）分予測するモデル予測処理を実行するものであり、前記目標データと、前記ロボットの現在の状態とに基づいて、前記Ｎ時間ステップの期間における前記ロボットの状態を表す状態ベクトルのシーケンス、ローカルフィードバックゲインのシーケンス、および、ＭＰＣ用制御入力のシーケンスを最適化する処理を行うことで、前記Ｎ時間ステップの期間における最適な状態ベクトルシーケンス、最適なローカルフィードバックゲインシーケンス、および、最適なＭＰＣ用制御入力のシーケンスを取得し、
前記ＰＤ制御部は、
前記ロボットの現在の状態を表す状態ベクトルと、前記モデル予測制御部により取得された前記最適な状態ベクトルシーケンスおよび最適なローカルフィードバックゲインシーケンスとを用いて、モデル予測についてのＰＤ制御用制御入力を取得する第１ＰＤ制御部と、
前記ロボットの現在の状態を表す状態ベクトルと、前記ＰＤ制御用目標データとを用いて、前記ロボットの平衡状態を維持させるためのＰＤ制御用制御入力を取得する第２ＰＤ制御部と、
前記第１ＰＤ制御部で取得されたモデル予測についてのＰＤ制御用制御入力と、前記第２ＰＤ制御部で取得された前記ロボットの平衡状態を維持させるためのＰＤ制御用制御入力とを加算する加算部と、
を備える、
請求項３に記載のロボット制御装置。

【請求項5】

ロボットに所定の運動を実行させるために前記ロボットを制御するためのロボット制御方法であって、
前記ロボットに所定の運動をさせるための目標データを生成する目標生成ステップと、
前記目標データに基づいて、前記ロボットに前記所定の運動をさせるための力学制約に従うモデルを用いてモデル予測処理を行うことで、前記ロボットを制御するための制御入力であるＭＰＣ用制御入力を取得するモデル予測制御ステップと、
前記目標データと前記ロボットの状態とに基づいて、前記ロボットの平衡状態を維持させるための制御入力であるＰＤ制御用制御入力を取得するＰＤ制御ステップと、
前記ＭＰＣ用制御入力、および、前記ＰＤ制御用制御入力を合成した制御入力を前記ロボットの駆動装置に出力する、あるいは、前記ＭＰＣ用制御入力、および、前記ＰＤ制御用制御入力のいずれか一方を前記ロボットの駆動装置に出力する合成ステップと、
を備えるロボット制御方法。

【請求項6】

請求項５に記載のロボット制御方法をコンピュータに実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、人型ロボット等のロボットの動作を制御するための技術に関する。

【背景技術】

【0002】

近年、姿勢を維持しつつ歩行等を行うロボット（例えば、人型ロボット（ヒューマノイドロボット）等）が開発されている。このようなロボットに多様な動作をさせるためには、ロボットの姿勢を適切に制御する技術が必要となる。このようなロボットの姿勢を適切に制御する技術として、例えば、先行技術文献１には、ロボットを倒立振子とみなし、ロボットの姿勢を維持させる技術の開示がある。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特表２０１２－４０６４４号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

一般に、ロボットに所定の運動をさせようとする場合（ロボットの運動生成を行う場合）、ロボットに搭載されているアクチュエータに指令を与えることで、ロボットに所定の動作（運動）をさせることが可能となる。つまり、ロボットに所定の運動をさせようとする場合（ロボットの運動生成を行う場合）、（１）アクチュエータへの指令の計算し、（２）計算した指令をロボットに入力し、（３）ロボットが動くというシーケンスが繰り返されることで、ロボットに所定の運動をさせることができる。

【0005】

人型ロボットの場合、多くのアクチュエータを有しているので、人型ロボットの全てのアクチュエータに対して、運動指令（ロボットに運動させるための指令）を計算すると、その計算時間に長い時間が必要となる。これに対処するために、運動指令を計算する時間を短縮する手法が開発されてきている。特許文献１の技術は、このような手法（運動指令を計算する時間を短縮する手法）を用いる技術であり、ロボットを倒立振子とみなし、運動指令を計算する処理を単純化し、運動指令を計算する時間を短縮している。

【0006】

しかしながら、このような手法では、歩行や走行などの限られた運動をロボットにさせることはできるが、より複雑な運動を、ロボットが転倒することなく、ロボットにさせることは困難である。

【0007】

そこで、本発明は、上記課題に鑑み、運動指令を計算する時間が長い時間となることを許容し、ロボットが転倒することなく、ロボットに多様な運動をさせることができるロボット制御装置、ロボット制御方法、および、プログラムを実現することを目的とする。

【課題を解決するための手段】

【0008】

上記課題を解決するために、第１の発明は、ロボットに所定の運動を実行させるためにロボットを制御するためのロボット制御装置であって、目標生成部と、モデル予測制御部と、ＰＤ制御部と、合成部と、を備える。

【0009】

目標生成部は、ロボットに所定の運動をさせるための目標データを生成する。

【0010】

モデル予測制御部は、目標データに基づいて、ロボットに所定の運動をさせるための力学制約に従うモデルを用いてモデル予測処理を行うことで、ロボットを制御するための制御入力であるＭＰＣ用制御入力を取得する。

【0011】

ＰＤ制御部は、目標データとロボットの状態とに基づいて、ロボットの平衡状態を維持させるための制御入力であるＰＤ制御用制御入力を取得する。

【0012】

合成部は、ＭＰＣ用制御入力、および、ＰＤ制御用制御入力を合成した制御入力をロボットの駆動装置に出力する、あるいは、ＭＰＣ用制御入力、および、ＰＤ制御用制御入力のいずれか一方をロボットの駆動装置に出力する。

【0013】

このロボット制御装置では、階層的な制御、つまり、（１）モデル予測制御部によるモデル予測処理（上位層の制御）（モデル予測処理により運動指令を計算する処理）、および、（２）ＰＤ制御部によるＰＤ制御（下位層の制御）（ロボットの姿勢を維持する制御（平衡状態を維持させる制御））を行うことができる。これにより、このロボット制御装置では、運動指令を計算する時間が長い時間となることを許容し、ロボットが転倒することなく、ロボットに多様な運動をさせることができる。

【0014】

第２の発明は、第１の発明であって、モデル予測制御部は、第１時間間隔で、ＭＰＣ用制御入力を取得（または更新）し、ＰＤ制御部は、第１時間間隔よりも短い時間間隔である第２時間間隔で、ＰＤ制御用制御入力を取得（または更新）する。

【0015】

これにより、このロボット制御装置では、モデル予測制御部での処理時間を、ＰＤ制御部での処理時間よりも長くすることができる。

【0016】

第３の発明は、第１または第２の発明であって、目標生成部は、ＰＤ制御部に出力する目標データを、ロボットの平衡状態を維持させるために必要なデータに関するデータのみのデータであるＰＤ制御用目標データとして、ＰＤ制御部に出力する。

【0017】

このロボット制御装置では、ＰＤ制御部に、ロボットの平衡状態を維持させるために必要なデータに関するデータ（例えば、ロボットの関節の角度のデータ）のみのデータを出力するので、ＰＤ制御部での処理が効率良く実行できる。

【0018】

第４の発明は、第３の発明であって、モデル予測制御部は、ロボットの目標軌道をＮ時間ステップ（Ｎ：自然数）分予測するモデル予測処理を実行するものであり、目標データと、ロボットの現在の状態とに基づいて、Ｎ時間ステップの期間におけるロボットの状態を表す状態ベクトルのシーケンス、ローカルフィードバックゲインのシーケンス、および、ＭＰＣ用制御入力のシーケンスを最適化する処理を行うことで、Ｎ時間ステップの期間における最適な状態ベクトルシーケンス、最適なローカルフィードバックゲインシーケンス、および、最適なＭＰＣ用制御入力のシーケンスを取得する。

【0019】

そして、ＰＤ制御部は、第１ＰＤ制御部と、第２ＰＤ制御部と、加算部と、を備える。

【0020】

第１ＰＤ制御部は、ロボットの現在の状態を表す状態ベクトルと、モデル予測制御部により取得された最適な状態ベクトルシーケンスおよび最適なローカルフィードバックゲインシーケンスとを用いて、モデル予測についてのＰＤ制御用制御入力を取得する。

【0021】

第２ＰＤ制御部は、ロボットの現在の状態を表す状態ベクトルと、ＰＤ制御用目標データとを用いて、ロボットの平衡状態を維持させるためのＰＤ制御用制御入力を取得する。

【0022】

加算部は、第１ＰＤ制御部で取得されたモデル予測についてのＰＤ制御用制御入力と、第２ＰＤ制御部で取得されたロボットの平衡状態を維持させるためのＰＤ制御用制御入力とを加算する。

【0023】

これにより、このロボット制御装置では、第１ＰＤ制御部により、モデル予測についてのＰＤ制御用制御入力を取得するとともに、第２ＰＤ制御部により、ロボットの平衡状態を維持させるためのＰＤ制御用制御入力を取得することができる。

【0024】

第５の発明は、ロボットに所定の運動を実行させるためにロボットを制御するためのロボット制御方法であって、目標生成ステップと、モデル予測制御ステップと、ＰＤ制御ステップと、合成ステップと、を備える。

【0025】

目標生成ステップは、ロボットに所定の運動をさせるための目標データを生成する。

【0026】

モデル予測制御ステップは、目標データに基づいて、ロボットに所定の運動をさせるための力学制約に従うモデルを用いてモデル予測処理を行うことで、ロボットを制御するための制御入力であるＭＰＣ用制御入力を取得する。

【0027】

ＰＤ制御ステップは、目標データとロボットの状態とに基づいて、ロボットの平衡状態を維持させるための制御入力であるＰＤ制御用制御入力を取得する。

【0028】

合成ステップは、ＭＰＣ用制御入力、および、ＰＤ制御用制御入力を合成した制御入力をロボットの駆動装置に出力する、あるいは、ＭＰＣ用制御入力、および、ＰＤ制御用制御入力のいずれか一方をロボットの駆動装置に出力する。

【0029】

これにより、第１の発明と同様の効果を奏するロボット制御方法を実現することができる。

【0030】

第６の発明は、第５の発明であるロボット制御方法をコンピュータに実行させるためのプログラムである。

【0031】

これにより、第１の発明と同様の効果を奏するロボット制御方法をコンピュータに実行させるためのプログラムを実現することができる。

【発明の効果】

【0032】

本発明によれば、運動指令を計算する時間が長い時間となることを許容し、ロボットが転倒することなく、ロボットに多様な運動をさせることができるロボット制御装置、ロボット制御方法、および、プログラムを実現することができる。

【図面の簡単な説明】

【0033】

【図1】第１実施形態に係るロボット制御装置１００の概略構成図。

【図2】ロボット制御装置１００で実行される処理のシーケンス図（タイミングチャート）。

【図3】所定の運動を実行させた場合のロボットの状態を示す図。

【図4】所定の運動を実行させた場合のロボットの状態を示す図。

【図5】ＣＰＵバス構成を示す図。

【発明を実施するための形態】

【0034】

［第１実施形態］
第１実施形態について、図面を参照しながら、以下、説明する。

【0035】

＜１．１：ロボット制御装置の構成＞
図１は、第１実施形態に係るロボット制御装置１００の概略構成図である。

【0036】

ロボット制御装置１００は、ロボットＲｂｔを制御するための装置であって、ロボットＲｂｔに搭載されているセンサＲｂｔ＿ｓｎｓｒからデータを取得するとともに、ロボットＲｂｔに搭載されているアクチュエータＲｂｔ＿ａｃｔｒを駆動することで、ロボットＲｂｔに所定の動作を行わせるように制御するための装置である。なお、ロボット制御装置１００は、ロボットＲｂｔに搭載されている。

【0037】

ロボット制御装置１００は、図１に示すように、目標生成部１と、モデル予測制御部２と、ＰＤ制御部３（ＰＤ：ＰｒｏｐｏｒｔｉｏｎａｌＤｉｆｆｅｒｅｎｔｉａｌ）と、合成部４と、を備える。

【0038】

目標生成部１は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。目標生成部１は、状態ベクトルｘに基づいて、（１）モデル予測制御部２に対する目標データＱ^ｅと、（２）ＰＤ制御部３に対する目標データＱ^ｅ _２とを算出する。そして、目標生成部１は、算出した目標データＱ^ｅをモデル予測制御部２に出力するとともに、算出した目標データＱ^ｅ _２をＰＤ制御部３に出力する。

【0039】

モデル予測制御部２は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。また、モデル予測制御部２は、目標生成部１から出力される目標データＱ^ｅを入力する。モデル予測制御部２は、状態ベクトルｘと、目標データＱ^ｅとに基づいて、モデル予測処理を行い、運動指令データＵ^＊（最適制御入力シーケンスＵ^＊）を取得し、取得した運動指令データＵ^＊（これを「ＭＰＣ用運動指令データＵ^＊」という）、または、運動指令データＵ^＊に含まれる現時間ステップの制御入力ｕ_ＭＰＣを合成部４に出力する。また、モデル予測制御部２は、モデル予測処理により、最適状態シーケンスデータＸ^＊と、ローカル最適フィードバックゲインデータ列Ｇ^＊とを取得し、取得した最適状態シーケンスデータＸ^＊およびローカル最適フィードバックゲインデータ列Ｇ^＊をＰＤ制御部３に出力する。

【0040】

ＰＤ制御部３は、図１に示すように、第１ＰＤ制御部３１と、第２ＰＤ制御部３２と、加算部３３とを備える。

【0041】

第１ＰＤ制御部３１は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。また、第１ＰＤ制御部３１は、モデル予測制御部２から出力される最適状態シーケンスデータＸ^＊およびローカル最適フィードバックゲインデータ列Ｇ^＊を入力する。第１ＰＤ制御部３１は、状態ベクトルｘ、最適状態シーケンスデータＸ^＊、および、ローカル最適フィードバックゲインデータ列Ｇ^＊に基づいて、モデル予測制御（ＭＰＣ：ＭｏｄｅｌＰｒｅｄｉｃｔｉｖｅＣｏｎｔｒｏｌ）のためのＰＤ制御用運動指令データｕ_{ＰＤ－ＭＰＣ}（これを「ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}」という）を取得し、取得したＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}を加算部３３に出力する。

【0042】

第２ＰＤ制御部３２は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。また、第２ＰＤ制御部３２は、目標生成部１から出力される目標データＱ^ｅ _２を入力する。第２ＰＤ制御部３２は、状態ベクトルｘと、目標データＱ^ｅ _２とに基づいて、ロボットＲｂｔの姿勢を維持するためのＰＤ制御用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}（これを「ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}」という）を取得し、取得したＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}を加算部３３に出力する。

【0043】

加算部３３は、第１ＰＤ制御部３１から出力されるＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}と、第２ＰＤ制御部３２から出力されるＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}とを入力する。加算部３３は、ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}と、ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}とに対して加算処理を行うことで、ロボットＲｂｔに対するＰＤ制御のための運動指令データｕ_ＰＤｓ（＝ｕ_{ＰＤ－ＭＰＣ}＋ｕ_{ＰＤ－ｅｑｕｉｖ}）（これを「ＰＤ制御用運動指令データｕ_ＰＤｓ」という）を取得する。そして、加算部３３は、取得したＰＤ制御用運動指令データｕ_ＰＤｓを合成部４に出力する。

【0044】

合成部４は、モデル予測制御部２から出力されるＭＰＣ用運動指令データＵ^＊または運動指令データＵ^＊に含まれる現時間ステップの制御入力ｕ_ＭＰＣと、ＰＤ制御部３の加算部３３から出力されるＰＤ制御用運動指令データｕ_ＰＤｓとを入力する。合成部４は、ＭＰＣ用運動指令データＵ^＊または運動指令データＵ^＊に含まれる現時間ステップの制御入力ｕ_ＭＰＣと、ＰＤ制御用運動指令データｕ_ＰＤｓとを合成する処理（例えば、加算処理）を実行し、トルクについてのベクトルτ（例えば、τ＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ、ｕ_ＭＰＣは、Ｕ^＊に含まれるデータ。）（これを「トルクベクトルτ」という）を取得する。なお、ロボットＲｂｔに搭載されているアクチュエータであって、制御対象のアクチュエータの数がｎ個（ｎ：自然数）である場合、ロボット制御装置１００から第ｉ番目（ｉ：自然数、ｉ≦ｎ）のアクチュエータに対して出力するトルクをτ_ｉとすると、トルクベクトルτは、
τ^Ｔ＝［τ_１，τ_２，・・・，τ_ｎ］
τ^Ｔ：ベクトルτの転置ベクトル（ｎ行１列の行列τの転置行列）
である。

【0045】

合成部４は、取得したトルクベクトルτをロボットＲｂｔのアクチュエータＲｂｔ＿ａｃｔｒに出力する。

【0046】

ロボットＲｂｔは、姿勢を維持しながら、多様な動作（多様な運動）を行うことができるロボット（例えば、人型ロボット（ヒューマノイド・ロボット））であり、ロボット制御装置１００により制御される対象である。

【0047】

ロボットＲｂｔは、所定の物理量を取得できる多様なセンサ（例えば、角度センサ、慣性計測装置（ＩＭＵ：ＩｎｅｒｔｉａｌＭｅａｓｕｒｅｍｅｎｔＵｎｉｔ）、カメラ等）と、多様な動作（多様な運動）を行うためのアクチュエータ（例えば、ロボットＲｂｔの関節を回転させたり、移動させたりするための動力を発生させるための駆動装置）とを備える。

【0048】

ロボットに搭載されている多様なセンサ（例えば、角度センサ、慣性計測装置（ＩＭＵ：ＩｎｅｒｔｉａｌＭｅａｓｕｒｅｍｅｎｔＵｎｉｔ）、カメラ等）により、ロボットの状態を特定するためのデータが取得され、取得されたデータは、状態ベクトルｘとして、ロボット制御装置１００に出力される。状態ベクトルｘとしては、例えば、（１）ロボットＲｂｔの所定の部位の位置を示すデータ、（２）ロボットＲｂｔの姿勢（３次元空間における姿勢）を特定するためのデータ、（３）ロボットＲｂｔの関節の角度、および、（４）それらの時間微分データ等が含まれる。そして、上記（１）～（４）のデータは、ロボットに搭載されているセンサやセンサ信号の処理により取得される。

【0049】

ロボットＲｂｔに搭載されているアクチュエータは、ロボット制御装置１００から出力されるトルクベクトルτを入力し、当該トルクベクトルτにより特定されるトルクが出力されるように駆動される。例えば、ロボットＲｂｔに搭載されているアクチュエータであって、ロボット制御装置１００の制御対象であるアクチュエータがｎ個である場合、ｉ番目のアクチュエータには、トルクベクトルτ（τ^Ｔ＝［τ_１，τ_２，・・・，τ_ｎ］）のｉ番目の要素τ_ｉで特定されるトルクが、ロボット制御装置１００から出力され、当該ｉ番目のアクチュエータは、トルクτ_ｉで駆動される。

【0050】

このように、ロボットＲｂｔに搭載されているアクチュエータが、ロボット制御装置１００から出力されるトルクベクトルτにより駆動されることで、ロボットＲｂｔは、所定の動作（運動）を行う。

【0051】

＜１．２：ロボット制御装置の動作＞
以上のように構成されたロボット制御装置１００の動作について、以下、説明する。

【0052】

図２は、ロボット制御装置１００で実行される処理のシーケンス図（タイミングチャート）である。

【0053】

以下では、図２のシーケンス図（タイミングチャート）を参照しながら、ロボット制御装置１００の動作について、説明する。

【0054】

≪初期化処理（時刻ｔ_０～ｔ_１）≫
まず、初期化処理（図２の時刻ｔ_０～ｔ_１の処理）について説明する。

【0055】

初期化処理において、目標生成部１は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘ（初期状態の状態ベクトルｘ）として入力する。目標生成部１は、状態ベクトルｘに基づいて、（１）モデル予測制御部２に対する目標データＱ^ｅと、（２）ＰＤ制御部３に対する目標データＱ^ｅ _２とを算出する。目標生成部１での具体的な処理について、以下、説明する。

【0056】

まず、状態ベクトルｘ（ｎｘ個（ｎｘ：自然数）の実数を要素とするベクトル（１×ｎｘの行列））を以下のように規定する。

【数1】

ｑ_１：ロボットＲｂｔの所定の部位の位置のデータ、３次元姿勢についてのデータ等を要素とするベクトル
ｖ_１：ロボットＲｂｔの所定の部位の速度のデータ、３次元角速度についてのデータ等を要素とするベクトル
ｑ_２：ロボットＲｂｔの関節の角度のデータを要素とするベクトル
ｖ_２：ロボットＲｂｔの関節の角速度のデータを要素とするベクトル
なお、「^Ｔ」は、転置を表している（以下同様）。

【0057】

また、ロボットＲｂｔへの制御入力ｕは、ｎｕ個（ｎｕ：自然数）の実数を要素とするベクトル（１×ｎｕの行列）であるものとする。すなわち、下記の数式を満たすものとする。

【数2】

なお、制御入力ｕの要素は、ロボットＲｂｔの各アクチュエータに出力するトルクであるものとする。

【0058】

また、ロボット制御装置１００では、Ｎ時間ステップ分の運動軌道を予測するものとし、時間ステップｋにおける（１）状態ベクトルシーケンスＸ_ｋ、および、（２）制御入力シーケンスＵ_ｋを以下のように規定する。

【数3】

Ｎ：２以上の自然数
ｘ_ｋ：時間ステップｋにおける状態ベクトル（状態ベクトルｘ）
ｕ_ｋ：時間ステップｋにおける制御入力（制御入力ｕ）
また、ロボットＲｂｔの目標軌道を設定するために、時間ステップｋの平衡軌道Ｑ^ｅ _ｋを以下のように規定する。

【数4】

ｋ：時間ステップ
ｑ^ｅ：平衡状態変数ベクトル（（１）フローティング機構（ｆｌｏａｔｉｎｇｂａｓｅ）の位置、姿勢（例えば、ロボットＲｂｔの位置、姿勢）を特定するデータと、（２）ジョイント（例えば、ロボットＲｂｔの関節）の角度のデータとを含む変数）
そして、時間ステップｋの平衡状態変数ベクトルｑ^ｅ _ｋのｉ番目の要素ｑ^ｅ，ｉ _ｋを以下のように規定する。

【数5】

ｑ^ｃ：ロボットＲｂｔの名目上の姿勢（nominal posture）を特定する変数
φ^ｃ：三角関数の位相を表す変数
そして、変数ｑ^ｃ、変数φ^ｃは、下記のダイナミクスに従うものとする。
＜ダイナミクス＞

【数6】

Δｔ_ｕ：制御期間（制御入力ｕが入力される時間間隔）
（ｔ＝ｋ，・・・，ｋ＋Ｎ－１）
なお、変数ｑ^ｃ _ｔのi番目の要素の初期値ｈａｔ＿ｑ^ｃ，ｉ _ｔ、および、変数φ^ｃのｉ番目の要素の初期値ｈａｔ＿φ^ｃ，ｉ _ｔは、目標生成部１により、ロボットＲｂｔの状態（ロボットＲｂｔのセンサＲｂｔ＿ｎｓｒから入力される状態ベクトルｘにより特定されるロボットＲｂｔの状態）に応じて、設定した目標軌道（ロボットＲｂｔの目標軌道）に合うように補正された値に設定される。

【0059】

目標生成部１は、目標軌道（ロボットＲｂｔの目標軌道）が実現されるように、パラメータ｛Ａ_ｉ，Ｂ_ｉ，γ_ｉ，ｖ_ｉ，ω_ｉ｝を設定することで、時間ステップｋの平衡状態変数ベクトルｑ^ｅ _ｋを設定する。そして、目標生成部１は、時間ステップｋ＋１～ｋ＋Ｎ－１についても同様に平衡状態変数ベクトルを設定し、時間ステップｋにおいて、Ｎ時間ステップ分の平衡軌道Ｑ^ｅ _ｋ（＝｛ｑ^ｅ _ｋ，ｑ^ｅ _ｋ＋１，・・・，ｑ^ｅ _{ｋ＋Ｎ－１}｝）を取得する。

【0060】

目標生成部１は、上記のようにして設定したＮ時間ステップ分の平衡軌道Ｑ^ｅ _ｋ（＝｛ｑ^ｅ _ｋ，ｑ^ｅ _ｋ＋１，・・・，ｑ^ｅ _{ｋ＋Ｎ－１}｝）を目標データＱ^ｅとして、モデル予測制御部２に出力する。

【0061】

また、目標生成部１は、Ｎ時間ステップ分の平衡軌道Ｑ^ｅ _ｋ（＝｛ｑ^ｅ _ｋ，ｑ^ｅ _ｋ＋１，・・・，ｑ^ｅ _{ｋ＋Ｎ－１}｝）において、角度に関するデータ（ロボットＲｂｔの平衡状態を維持させるために必要な関節等の角度のデータ）だけを抽出したものをＰＤ制御部３に対する目標データＱ^ｅ _２として取得する。つまり、ベクトルｑ^ｅ _ｋ，ｑ^ｅ _ｋ＋１，・・・，ｑ^ｅ _{ｋ＋Ｎ－１}において、角度に関するデータ（ロボットＲｂｔの平衡状態を維持させるために必要な関節等の角度のデータ）だけを抽出したデータ（ベクトル）（これをｑ^’ｅ _ｋと表記する）を取得し、取得したデータ（ベクトル）を含むデータをＰＤ制御部３に対する目標データＱ^ｅ _２（＝｛ｑ^’ｅ _ｋ，ｑ^’ｅ _ｋ＋１，・・・，ｑ^’ｅ _{ｋ＋Ｎ－１}｝）として取得する。

【0062】

そして、目標生成部１は、取得した目標データＱ^ｅ _２をＰＤ制御部３の第２ＰＤ制御部３２に出力する。

【0063】

【0064】

まず、コスト関数ｌｏｓｓを以下のように規定する。

【数7】

（ｔ＝ｋ，ｋ＋1，・・・，ｋ＋Ｎ－１）
Ｗ_ｑ：位置データの重み行列（位置データについての重み係数を要素（対角要素）とする行列）
Ｗ_ｖ：速度データの重み行列（速度データについての重み係数を要素（対角要素）とする行列）
Ｗ_ｕ：制御入力データの重み行列（制御入力データについての重み係数を要素（対角要素）とする行列）
ｑ_ｔ：時間ステップｔの平衡状態変数ベクトル（状態ベクトルｘから取得したデータ）
ｑ^ｅ _ｔ：時間ステップｔの平衡状態変数ベクトルの目標（目標値のベクトル）
モデル予測制御部２は、上記コスト関数を算出し、さらに、下記数式に相当する処理を行い、積算コストＪ（Ｘ_ｋ，Ｕ_ｋ）（予測期間（Ｎ時間ステップ分の期間）におけるコスト関数ｌｏｓｓの積算値）を取得する。

【数8】

そして、モデル予測制御部２は、下記数式に相当する処理を実行することで、モデル予測処理を行う。つまり、モデル予測制御部２は、下記の状態遷移関数による制約を満たしつつ、積算コストＪ（Ｘ_ｋ，Ｕ_ｋ）を最小とする制御入力シーケンスＵ_ｋを取得（算出）する。

【数9】

（ｔ＝ｋ，・・・，ｋ＋Ｎ－２）
Δｔ_ｄ：離散化のための時間ステップサイズ（１時間ステップの期間）
ｆ（）：モデルを表現するための関数（状態遷移関数）
なお、ｘ_ｔ＋１＝ｆ（ｘ_ｔ，ｕ_ｔ，Δｔ_ｄ）は、以下の力学制約を受けるものとする。
＜力学制約（運動方程式）＞

【数10】

Ｍ_＊＊：慣性行列の要素
Ｃ_＊：外部からの力（例えば、重力、遠心力、コリオリの力、粘性摩擦力等）
Ｊ_＊：ヤコビアン行列
ｆ_ｃ：接触力（contact force）
τ：ジョイントトルク（ロボットＲｂｔの各関節等に与えられるトルク）
なお、変数（ベクトル）の上にドットを付した変数（ベクトル）は、ドットを付された変数（ベクトル）の時間微分を表している（以下同様）。

【0065】

上記数式は、運動方程式を微分方程式により表現しているが、微分項を取り除くために、例えば、オイラー積分（例えば、下記先行技術文献Ａに開示の手法によるオイラー積分手法を用いた処理）を行い、微分項を取り除いた方程式により、力学制約を表現するようにしてもよい。
（先行技術文献Ａ）：
Y. Tassa, T. Erez, and E. Todorov, “ Synthesis and stabilization of complex behaviors through online trajectory optimization,” in 2012 IEEE/RSJ International Conference on Intelligent Robots and Systems. IEEE, 2012, pp. 4906-4913.
モデル予測制御部２は、上記により表現されるモデル（力学モデル）を用いて、Ｎ時間ステップ分の予測（現時点から（Ｎ－１）時間ステップ先の未来までの予測）を行いながら、設定した軌道目標を満たす解を求めることで最適化処理（モデル最適化処理）を行う。

【0066】

例えば、モデル予測制御部２は、ｉＬＱＲ（線形二次レギュレータ法、ｉＬＱＲ：iterative Linear-quadratic regulator）により、最適化処理（モデル最適化処理）を行う。ｉＬＱＲでは、モデルが局所的に線形であると仮定するＬＱＲ（Linear-quadratic regulator）を非線形モデルに拡張する。具体的には、ｉＬＱＲでは、動的モデル（状態遷移関数で規定されるモデル）を1次近似し（テイラー展開の１次微分項までの近似を行い）、コスト関数を２次近似する（テイラー展開の２次微分項までの近似を行う）。つまり、ｉＬＱＲでは、動的モデルｆ、コスト関数ｃを以下のように表す。

【数11】

「＾」：予測値（推定値）
ｆ（ｘ_ｔ，ｕ_ｔ）＝ｆ（ｘ_ｔ，ｕ_ｔ，Δｔ_ｄ）（Δｔ_ｄを省略して表してる。）

【数12】

「＾」：予測値（推定値）
ｃ（ｘ_ｔ，ｕ_ｔ）：コスト関数（ｃ（ｘ_ｔ，ｕ_ｔ）＝ｌｏｓｓ（ｘ_ｔ，ｕ_ｔ））
また、上記数式を以下のように整理する。

【数13】

【数14】

そして、モデル予測制御部２は、ｉＬＱＲにより、ＬＱＲと同様に、コスト関数を最適化することにより、初期状態（時間ステップｋの状態）からターゲット状態（時間ステップｋ＋Ｎ－１の状態）までの最適な軌道を算出する。モデル予測制御部２は、ｉＬＱＲにより最適な軌道を取得したときの各時間ステップでの状態ベクトルｘ^＊（最適状態ベクトルｘ^＊）、および、ローカル最適フィードバックゲインＬ^＊を取得し、それらのシーケンスである、（１）最適状態シーケンスデータＸ^＊ _ｋ（＝｛ｘ^＊ _ｋ，ｘ^＊ _ｋ＋１，・・・，ｘ^＊ _{ｋ＋Ｎ－１}｝）、および、（２）ローカル最適フィードバックゲインデータ列Ｇ^＊ _ｋ（＝｛Ｌ^＊ _ｋ，Ｌ^＊ _ｋ＋１，・・・，Ｌ^＊ _{ｋ＋Ｎ－１}｝）を取得する。そして、モデル予測制御部２は、取得した最適状態シーケンスデータＸ^＊ _ｋ（＝｛ｘ^＊ _ｋ，ｘ^＊ _ｋ＋１，・・・，ｘ^＊ _{ｋ＋Ｎ－１}｝）およびローカル最適フィードバックゲインデータ列Ｇ^＊をＰＤ制御部３の第１ＰＤ制御部３１に出力する。

【0067】

また、モデル予測制御部２は、ｉＬＱＲにより最適な軌道を取得したときの各時間ステップでの制御入力ｕ^＊（最適制御入力ｕ^＊）を取得し、それらのシーケンスである最適制御入力シーケンスＵ^＊ _ｋ（＝｛ｕ^＊ _ｋ，ｕ^＊ _ｋ＋１，・・・，ｕ^＊ _{ｋ＋Ｎ－１}｝）を取得し、保持する。そして、モデル予測制御部２は、ＰＤ制御部３により制御入力ｕ_ＰＤｓ（ＰＤ制御用制御入力ｕ_ＰＤｓ）が取得された段階（合成部４でＰＤ制御用制御入力ｕ_ＰＤｓと最適制御入力シーケンスＵ^＊ _ｋ（または制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ））とを合成できる状態になった段階）で、上記により取得し、保持している最適制御入力シーケンスＵ^＊ _ｋ（または制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ））を合成部４に出力する。図２に示した場合、モデル予測制御部２は、時刻ｔ_１ｅ、時刻ｔ_１１ｅ、時刻ｔ_１２ｅ、・・・、時刻ｔ_ｍｅ（初期化処理が終了し、運動生成処理が実行開始された時刻以降（図２の場合、時刻ｔ_１以降の時刻）において、上記により取得し、保持している最適制御入力シーケンスＵ^＊ _ｋ（または制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ））を合成部４に出力する。図２において、「モデル予測制御（処理１）」で取得された最適制御入力シーケンスＵ^＊ _ｋ（または制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ））を「出力１」として示している。

【0068】

なお、モデル予測制御部２は、取得した最適制御入力シーケンスＵ^＊ _ｋのうち現時間ステップ（時間ステップｋ）の制御入力であるｕ^＊ _ｋを制御入力ｕ_ＭＰＣとして合成部４に出力するようにしてもよい。以下では、説明便宜のために、モデル予測制御部２が制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）を合成部４に出力するものとして、説明する。

【0069】

なお、モデル予測制御部２で実行されるｉＬＱＲの処理は、下記の先行技術文献Ｂの手法を用いて実行されるものであってもよい。
（先行技術文献Ｂ）：
E. Todorov, C. Hu, A. Simpkins, and J. Movellan, "A generalized iterative lqg method for locally-optimal feedback control of constrained nonlinear stochastic systems," 2005, pp. 300-306.
合成部４は、モデル予測制御部２から出力されるＭＰＣ用運動指令データＵ^＊の制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）を入力する。初期化処理時において、ＰＤ制御部３からの出力はないので、合成部４は、制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）をトルクベクトルτ（＝ｕ_ＭＰＣ）として、ロボットＲｂｔのアクチュエータＲｂｔ＿ａｃｔｒに出力する（図２の時刻ｔ_０１のＭＰＣ出力に相当）。

【0070】

これにより、ロボットＲｂｔは、トルクベクトルτ（＝ｕ_ＭＰＣ）による制御がなされ、初期状態となる。なお、初期化処理時において、合成部４からの出力を省略するようにしてもよい（次の時間ステップから合成部４からトルクベクトルを出力し、ロボットＲｂｔを制御するようにしてもよい）。

【0071】

以上のように、ロボット制御装置１００において、初期化処理が実行される。

【0072】

≪運動生成処理（時刻ｔ_１～ｔ_２）≫
次に、運動生成処理（図２の時刻ｔ_１～ｔ_２の処理）について説明する。

【0073】

≪時刻ｔ_１からの処理≫
まず、時刻ｔ_１からの処理について説明する。

【0074】

第１ＰＤ制御部３１は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。また、第１ＰＤ制御部３１は、モデル予測制御部２から出力される最適状態シーケンスデータＸ^＊およびローカル最適フィードバックゲインデータ列Ｇ^＊を入力する。第１ＰＤ制御部３１は、状態ベクトルｘ、最適状態シーケンスデータＸ^＊、および、ローカル最適フィードバックゲインデータ列Ｇ^＊に基づいて、モデル予測制御（ＭＰＣ：ＭｏｄｅｌＰｒｅｄｉｃｔｉｖｅＣｏｎｔｒｏｌ）のためのＰＤ制御用運動指令データｕ_{ＰＤ－ＭＰＣ}（ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}）を取得する（図２の時刻ｔ_１から処理）。

【0075】

具体的には、第１ＰＤ制御部３１は、下記数式に相当する処理を実行することで、ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}（ＰＤ－ＭＰＣ用制御入力ｕ_{ＰＤ－ＭＰＣ}）を取得する。

【数15】

なお、Ｌ^＊＝Ｌ^＊ _ｋ（初期化処理時に、モデル予測制御部２により取得された時間ステップｋのゲインＬ^＊ _ｋ）であり、ｘ^＊＝ｘ^＊ _ｋ（初期化処理時に、モデル予測制御部２により取得された時間ステップｋの最適状態ベクトルｘ^＊ _ｋ）である。

【0076】

また、上記数式から分かるように、第１ＰＤ制御部３１で実行される処理は、ＰＤ制御、すなわち、比例制御（ゲインを乗算する制御）、微分制御（状態ベクトルに含まれる変数の時間微分のデータについて処理）のみであるため、高速に処理することができる。

【0077】

そして、第１ＰＤ制御部３１は、上記処理により取得したＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}（ＰＤ－ＭＰＣ用制御入力ｕ_{ＰＤ－ＭＰＣ}）を加算部３３に出力する。

【0078】

第２ＰＤ制御部３２は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。また、第２ＰＤ制御部３２は、目標生成部１から出力される目標データＱ^ｅ _２（初期化処理時に、目標生成部１により設定された目標データＱ^ｅ _２）を入力する。第２ＰＤ制御部３２は、状態ベクトルｘと、目標データＱ^ｅ _２とに基づいて、ロボットＲｂｔの姿勢を維持するためのＰＤ制御用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}（ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}）を取得する（図２の時刻ｔ_１から処理）。

【0079】

具体的には、第２ＰＤ制御部３２は、下記数式に相当する処理を実行することで、ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}（ＰＤ－ｅｑｕｉｖ用制御入力ｕ_{ＰＤ－ＭＰＣ}）を取得する。

【数16】

Ｋ：関節剛性行列（Joint stiffness matrix）（ロボットＲｂｔの関節の剛性の行列）
Ｄ：関節粘性行列（Joint viscosity matrix）（ロボットＲｂｔの関節の粘性の行列）
ｑ_２：ロボットＲｂｔの関節の角度のデータを要素とするベクトル（状態ベクトルｘから取得されるデータ）
ｖ_２：ベクトルｑ_２の各要素の時間微分を要素とするベクトル（状態ベクトルｘから取得されるデータ）
ｑ^’ｅ：ベクトルｑ_２の目標データ（目標データＱ^ｅ _２から取得されるデータ）
なお、上記数式から分かるように、第２ＰＤ制御部３２で実行される処理は、ＰＤ制御、すなわち、比例制御（ゲインを乗算する制御）、微分制御（状態ベクトルに含まれる変数の時間微分のデータ（速度ベクトルｖ_２）について処理）のみであるため、高速に処理することができる。

【0080】

そして、第２ＰＤ制御部３２は、上記処理により取得したＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}（ＰＤ－ｅｑｕｉｖ用制御入力ｕ_{ＰＤ－ＭＰＣ}）を加算部３３に出力する。

【0081】

加算部３３は、第１ＰＤ制御部３１から出力されるＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}と、第２ＰＤ制御部３２から出力されるＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}とを入力する。加算部３３は、ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}と、ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}とに対して加算処理を行うことで、ロボットＲｂｔに対するＰＤ制御のための運動指令データｕ_ＰＤｓ（＝ｕ_{ＰＤ－ＭＰＣ}＋ｕ_{ＰＤ－ｅｑｕｉｖ}）（ＰＤ制御用運動指令データｕ_ＰＤｓ）を取得する。そして、加算部３３は、取得したＰＤ制御用運動指令データｕ_ＰＤｓ（ＰＤ制御用制御入力ｕ_ＰＤｓ）を合成部４に出力する。

【0082】

合成部４は、ＭＰＣ用制御入力ｕ_ＭＰＣと、ＰＤ制御用運動指令データｕ_ＰＤｓ（ＰＤ制御用制御入力ｕ_ＰＤｓ）とを合成する処理（例えば、加算処理）を実行する。つまり、合成部４は、モデル予測制御部２が初期化処理において取得した制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）（図２において、「モデル予測制御（処理１）」で取得された制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）（図２の「出力１」で示したデータ））を、ＭＰＣ用制御入力ｕ_ＭＰＣとして、ＭＰＣ用制御入力ｕ_ＭＰＣと、ＰＤ制御用制御入力ｕ_ＰＤｓとを合成する処理を行う。すなわち、合成部４は、
τ＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ
に相当する処理により、トルクベクトルτを取得する。

【0083】

そして、合成部４は、取得したトルクベクトルτをロボットＲｂｔのアクチュエータＲｂｔ＿ａｃｔｒに出力する（図２の時刻ｔ_１ｅのＰＤ出力に相当）。

【0084】

これにより、ロボットＲｂｔは、トルクベクトルτ（＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ）による制御がなされる。つまり、ロボット制御装置１００において、トルクベクトルτ（＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ）によるロボットＲｂｔの制御を行うことで、ロボットＲｂｔの姿勢を適切に維持しつつ、ロボットＲｂｔに対して、目標軌道の運動（設定した目標を実現する運動）をさせることができる。

【0085】

また、時刻ｔ_１から、初期化処理時と同様に、目標生成部１において、目標生成処理が実行される。さらに、初期化処理時と同様に、モデル予測制御部２において、モデル予測処理が実行される。そして、モデル予測制御部２は、時刻ｔ_１からの処理において取得した、
（１）最適状態シーケンスデータＸ^＊ _ｋ（＝｛ｘ^＊ _ｋ，ｘ^＊ _ｋ＋１，・・・，ｘ^＊ _{ｋ＋Ｎ－１}｝）、
（２）ローカル最適フィードバックゲインデータ列Ｇ^＊ _ｋ（＝｛Ｌ^＊ _ｋ，Ｌ^＊ _ｋ＋１，・・・，Ｌ^＊ _{ｋ＋Ｎ－１}｝）
を、図２に示すように、時刻ｔ_２以降に（モデル予測処理が完了した後の時刻に）、ＰＤ制御部３の第１ＰＤ制御部３１に出力する。

【0086】

≪時刻ｔ_１１ｓからの処理≫
次に、時刻ｔ_１１ｓからの処理について説明する。

【0087】

時刻ｔ_１１ｓからの処理では、以下の処理が実行される。

【0088】

第１ＰＤ制御部３１は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。

【0089】

また、第１ＰＤ制御部３１は、状態ベクトルｘ、時刻ｔ１からの処理で取得した、最適状態シーケンスデータＸ^＊、および、ローカル最適フィードバックゲインデータ列Ｇ^＊に基づいて、モデル予測制御のためのＰＤ制御用運動指令データｕ_{ＰＤ－ＭＰＣ}（ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}）を取得する（図２の時刻ｔ_１１ｓから処理）。

【0090】

具体的には、第１ＰＤ制御部３１は、時刻ｔ_１１ｓからの処理と同様の処理を行うことで、ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}（ＰＤ－ＭＰＣ用制御入力ｕ_{ＰＤ－ＭＰＣ}）を取得する。

【0091】

【0092】

第２ＰＤ制御部３２は、ロボットＲｂｔに搭載されているセンサ（例えば、角度センサ、慣性計測装置、カメラ等）により取得したデータを状態ベクトルｘとして入力する。

【0093】

第２ＰＤ制御部３２は、状態ベクトルｘと、時刻ｔ１からの処理で取得した目標データＱ^ｅ _２とに基づいて、ロボットＲｂｔの姿勢を維持するためのＰＤ制御用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}（ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}）を取得する（図２の時刻ｔ_１１ｓから処理）。

【0094】

具体的には、第２ＰＤ制御部３２は、時刻ｔ_１１ｓからの処理と同様の処理を行うことで、ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}（ＰＤ－ｅｑｕｉｖ用制御入力ｕ_{ＰＤ－ＭＰＣ}）を取得する。

【0095】

加算部３３は、第１ＰＤ制御部３１から出力されるＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}と、第２ＰＤ制御部３２から出力されるＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}とを入力する。加算部３３は、ＰＤ－ＭＰＣ用運動指令データｕ_{ＰＤ－ＭＰＣ}と、ＰＤ－ｅｑｕｉｖ用運動指令データｕ_{ＰＤ－ｅｑｕｉｖ}とに対して加算処理を行うことで、ロボットＲｂｔに対するＰＤ制御のための運動指令データｕ_ＰＤｓ（＝ｕ_{ＰＤ－ＭＰＣ}＋ｕ_{ＰＤ－ｅｑｕｉｖ}）（ＰＤ制御用運動指令データｕ_ＰＤｓ）を取得する。そして、加算部３３は、取得したＰＤ制御用運動指令データｕ_ＰＤｓ（ＰＤ制御用制御入力ｕ_ＰＤｓ）を合成部４に出力する。

【0096】

【0097】

そして、合成部４は、取得したトルクベクトルτをロボットＲｂｔのアクチュエータＲｂｔ＿ａｃｔｒに出力する（図２の時刻ｔ_１１ｅのＰＤ出力に相当）。

【0098】

【0099】

≪時刻ｔ_１２ｓからの処理≫
時刻ｔ_１２ｓからの処理として、時刻ｔ_１１ｓからの処理と同様の処理が、モデル予測制御部２によるモデル予測処理（時刻ｔ_１の目標生成処理の後に実行されるモデル予測処理）が完了し、モデル予測制御部２により制御入力ｕ_ＭＰＣが取得するまで、繰り返し実行される。

【0100】

このようにすることで、ロボット制御装置１００において、第１ＰＤ制御部３１および第２ＰＤ制御部３２により取得された制御入力ｕ_ＰＤｓ（ロボットＲｂｔの姿勢を維持させるために必要な制御入力）を短い期間（制御入力ｕ_ＰＤｓの更新期間（更新間隔）Δｔ_ｌｏｗ（例えば、Δｔ_ｌｏｗ＝２ｍｓ））で連続して出力することができる（短い更新間隔Δｔ_ｌｏｗで更新されるＰＤ制御用制御入力ｕ_ＰＤｓと、初期化時に、モデル予測制御部２により取得された制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）とを合成した出力（トルクベクトルτ（＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ）を連続して出力することができる）。つまり、ロボット制御装置１００では、時間がかかるモデル予測処理を実行している間においても、ロボットＲｂｔの姿勢を維持させる（ロボットＲｂｔの平衡状態を維持させる）ための制御入力をＰＤ制御により取得でき、当該制御入力を短い時間間隔で連続して出力させることができる（短い更新間隔Δｔ_ｌｏｗで更新されるＰＤ制御用制御入力ｕ_ＰＤｓと、初期化時に、モデル予測制御部２により取得された制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）とを合成した出力（トルクベクトルτ（＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ）を連続して出力することができる）。

【0101】

したがって、ロボット制御装置１００では、長い時間（ＭＰＣ用制御入力ｕ_ＭＰＣの更新期間（更新間隔）Δｔ_ｕ（例えば、Δｔ_ｕ＝１００ｍｓ））がかかるモデル予測処理を実行している間においても、ロボットＲｂｔの姿勢を適切に維持させることが可能となる。

【0102】

そして、図２の場合、時刻ｔ_１１において、モデル予測制御部２によるモデル予測処理が完了しており、モデル予測制御部２は、当該モデル予測処理（図２の場合、時刻ｔ_１０～時刻ｔ_１１で実行されたモデル予測処理）で取得したＭＰＣ用制御入力ｕ_ＭＰＣにより、初期化処理時に取得したＭＰＣ用制御入力ｕ_ＭＰＣを更新し、更新したＭＰＣ用制御入力ｕ_ＭＰＣを保持する。そして、モデル予測制御部２は、初期化処理時のときと同様に、ＰＤ制御部３により制御入力ｕ_ＰＤｓ（ＰＤ制御用制御入力ｕ_ＰＤｓ）が取得された段階（合成部４でＰＤ制御用制御入力ｕ_ＰＤｓと最適制御入力シーケンスＵ^＊ _ｋに含まれる制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）とを合成できる状態になった段階）で、上記モデル予測処理（図２の場合、時刻ｔ_１０～時刻ｔ_１１で実行されたモデル予測処理）で取得し、保持している制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）を合成部４に出力する。図２に示した場合、モデル予測制御部２は、時刻ｔ_２ｅ、時刻ｔ_２１ｅ、時刻ｔ_２２ｅ、・・・（モデル予測処理（処理２）が終了した以降の時刻）において、上記モデル予測処理（図２の場合、時刻ｔ_１０～時刻ｔ_１１で実行されたモデル予測処理）により取得し、保持している制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）を合成部４に出力する。図２において、「モデル予測制御（処理２）」で取得された最適制御入力シーケンスＵ^＊ _ｋに含まれる制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）を「出力２」として示している。

【0103】

≪運動生成処理（時刻ｔ_２～ｔ_３）≫
運動生成処理（図２の時刻ｔ_２～ｔ_３の処理）について説明する。

【0104】

時刻ｔ_２～ｔ_３において、上記で説明した時刻ｔ_１～ｔ_２と同様の処理が実行される。なお、合成部４では、以下の処理が実行される。

【0105】

合成部４は、モデル予測制御部２がモデル予測処理（図２の「モデル予測制御（処理２）」で示した期間に実行されるモデル予測処理（時刻ｔ_１０～ｔ_１１））において取得した制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）（図２において、「モデル予測制御（処理２）」で取得された制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）（図２の「出力２」で示したデータ））を、ＭＰＣ用制御入力ｕ_ＭＰＣとして、ＭＰＣ用制御入力ｕ_ＭＰＣと、ＰＤ制御用制御入力ｕ_ＰＤｓとを合成する処理を行う。すなわち、合成部４は、
τ＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ
に相当する処理により、トルクベクトルτを取得する。

【0106】

そして、合成部４は、取得したトルクベクトルτをロボットＲｂｔのアクチュエータＲｂｔ＿ａｃｔｒに出力する（図２の時刻ｔ_２ｅのＭＰＣ出力（出力２）、ＰＤ出力に相当）。

【0107】

【0108】

≪運動生成処理（時刻ｔ_３以降）≫
さらに、時刻ｔ_３以降においても、上記で説明した時刻ｔ_１～ｔ_２と同様の処理が実行される。

【0109】

これにより、時刻ｔ_１～ｔ_２と同様の処理と同様に、ロボット制御装置１００では、トルクベクトルτ（＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ）によるロボットＲｂｔの制御を行うことできる。そして、このようなロボット制御装置１００において、このような処理を行うことで、ロボットＲｂｔの姿勢を適切に維持しつつ、ロボットＲｂｔに対して、目標軌道の運動（設定した目標を実現する運動）をさせることができる。

【0110】

≪まとめ≫
以上のように、ロボット制御装置１００では、階層的な制御、つまり、（１）モデル予測制御部２によるモデル予測処理（上位層の制御）（モデル予測処理により運動指令を計算する処理）、および、（２）ＰＤ制御部３によるＰＤ制御（下位層の制御）（ロボットＲｂｔの姿勢を維持する制御（平衡状態を維持させる制御））を行うことで、運動指令を計算する時間が長い時間となることを許容し、ロボットＲｂｔが転倒することなく、ロボットＲｂｔに多様な運動をさせることができる。

【0111】

ロボット制御装置１００では、長い時間（例えば、ＭＰＣ用制御入力ｕ_ＭＰＣの更新間隔がΔｔ_ｕ（例えば、Δｔ_ｕ＝１００ｍｓ））がかかるモデル予測処理（ロボットに多様な運動させるための運動指令を計算するための複雑な処理）を実行している期間においても、ＰＤ制御部３によるＰＤ制御を行うための制御入力ｕ_ＰＤｓを短い時間（例えば、ＰＤ制御用制御入力ｕ_ＰＤｓの更新間隔がΔｔ_ｌｏｗ（例えば、Δｔ_ｌｏｗ＝２ｍｓ））でロボットＲｂｔに対して出力することができる（短い更新間隔Δｔ_ｌｏｗで更新されるＰＤ制御用制御入力ｕ_ＰＤｓと、既に終了しているモデル予測処理で、モデル予測制御部２により取得された制御入力ｕ_ＭＰＣ（＝ｕ^＊ _ｋ）とを合成した出力（トルクベクトルτ（＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ）を連続して出力することができる）。したがって、ロボット制御装置１００では、モデル予測処理（ロボットに多様な運動させるための運動指令を計算するための複雑な処理）が実行されている期間においても、ロボットＲｂｔの平衡状態を維持させるための制御入力ｕ_ＰＤｓが短い時間間隔で更新され、更新された制御入力ｕ_ＰＤｓを反映したトルクベクトルτ（＝ｕ_ＭＰＣ＋ｕ_ＰＤｓ）により、ロボットＲｂｔの平衡状態を維持することができる（ロボットＲｂｔの姿勢を適切に維持することができる）。これにより、ロボット制御装置１００では、運動指令を計算する時間が長い時間となることを許容しつつ、ロボットＲｂｔを転倒させることなく、ロボットＲｂｔに多様な運動をさせることができる。

【0112】

ここで、本発明の適用結果（シミュレーション結果）について示す。

【0113】

自由度が「１８」（１８－ＤｏＦ（ＤｅｇｒｅｅｏｆＦｒｅｅｄｏｍ））の簡易ヒューマノイドモデルであって、１つの胴体と、各脚に６個のリンクがある簡易ヒューマノイドモデルに対して、本発明を適用した結果について示す。そして、制御期間（制御入力ｕが入力される時間間隔）Δｔ_ｕ、ホライズン数Ｎ（予測する時間ステップ数Ｎ）、離散化のための時間ステップサイズ（１時間ステップの期間）Δｔ_ｄ、および、下位層（ＰＤ制御）の制御入力（制御入力ｕ_ＰＤｓ）更新期間（更新間隔）Δｔ_ｌｏｗを、下記のように設定した。
Δｔ_ｕ＝１００ｍｓ
Ｎ＝５０
Δｔ_ｄ＝２０ｍｓ
Δｔ_ｌｏｗ＝２ｍｓ
そして、以下の（１）～（４）の場合について、本発明を適用した。
（１）ロボットにさせる運動：つま先立ち（ロボットの脚の状態：裸足）
（２）ロボットにさせる運動：歩行（ロボットの脚の状態：裸足）
（３）ロボットにさせる運動：片足立ち（ロボットの脚の状態：ローラースケートを履いた状態）
（４）ロボットにさせる運動：スケート（ロボットの脚の状態：ローラースケートを履いた状態）
図３は、上記（１）～（３）の場合のロボットの状態を示す図である。なお、図３において横軸は、時間軸である。

【0114】

図４は、上記（４）の場合のロボットの状態を示す図である。なお、図４において横軸は、時間軸である。

【0115】

図３、図４に示すように、上記（１）～（４）の場合において、いずれも、ロボットは姿勢を適切に維持し（各時間ステップにおいて、平衡状態を維持し）、転倒することなく、各運動を行うことができた。特に、図４に示すように、ロボットの脚にローラースケートを履かせた状態において、斜面を滑り降りるという極めて複雑な運動を行った場合においても、本発明を適用したロボットは、姿勢を適切に維持し（各時間ステップにおいて、平衡状態を維持し）、転倒することなく、当該運動を行うことができた。

【0116】

これらの結果から分かるように、本発明により、従来技術では極めて難しいとされていた運動を、ロボットを転倒させることなく（ロボットの姿勢を適切に維持しつつ）、実行されることが可能となる。すなわち、本発明の有用性は、極めて高いことが分かる。

【0117】

［他の実施形態］
上記実施形態では、ロボット制御装置１００が制御する対象がヒューマノイドロボットであることを想定しているが、これに限定されることはなく、ロボット制御装置１００が制御する対象は、２足歩行ロボット以外の多足ロボットであってもよいし、また、ヒューマノイドロボット以外のロボットであってもよい。

【0118】

また、上記実施形態で説明したロボット制御装置１００において、各ブロックは、ＬＳＩなどの半導体装置により個別に１チップ化されても良いし、一部又は全部を含むように１チップ化されても良い。

【0119】

なお、ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

【0120】

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路又は汎用プロセサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。

【0121】

また、上記各実施形態の各機能ブロックの処理の一部または全部は、プログラムにより実現されるものであってもよい。そして、上記各実施形態の各機能ブロックの処理の一部または全部は、コンピュータにおいて、中央演算装置（ＣＰＵ）により行われる。また、それぞれの処理を行うためのプログラムは、ハードディスク、ＲＯＭなどの記憶装置に格納されており、ＲＯＭにおいて、あるいはＲＡＭに読み出されて実行される。

【0122】

また、上記実施形態の各処理をハードウェアにより実現してもよいし、ソフトウェア（ＯＳ（オペレーティングシステム）、ミドルウェア、あるいは、所定のライブラリとともに実現される場合を含む。）により実現してもよい。さらに、ソフトウェアおよびハードウェアの混在処理により実現しても良い。

【0123】

例えば、上記実施形態の各機能部を、ソフトウェアにより実現する場合、図５に示したハードウェア構成（例えば、ＣＰＵ（ＧＰＵを含む）、ＲＯＭ、ＲＡＭ、入力部、出力部等をバスＢｕｓにより接続したハードウェア構成）を用いて、各機能部をソフトウェア処理により実現するようにしてもよい。

【0124】

また、本明細書内の記載、特許請求の範囲の記載において、「最適化」（あるいは「最適」）とは、最も良い状態にすることをいい、システム（モデル）を「最適化」するパラメータとは、当該システムの目的関数の値が最適値となるときのパラメータのことをいう。「最適値」は、システムの目的関数の値が大きくなるほど、システムが良い状態となる場合は、最大値であり、システムの目的関数の値が小さくなるほど、システムが良い状態となる場合は、最小値である。また、「最適値」は、極値であってもよい。また、「最適値」は、所定の誤差（測定誤差、量子化誤差等）を許容するものであってもよく、所定の範囲（十分収束したとみなすことができる範囲）に含まれる値であってもよい。

【0125】

また、上記実施形態における処理方法の実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えることができるものである。

【0126】

前述した方法をコンピュータに実行させるコンピュータプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体は、本発明の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、ＣＤ－ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ、大容量ＤＶＤ、次世代ＤＶＤ、半導体メモリを挙げることができる。

【0127】

上記コンピュータプログラムは、上記記録媒体に記録されたものに限られず、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して伝送されるものであってもよい。

【0128】

なお、本発明の具体的な構成は、前述の実施形態に限られるものではなく、発明の要旨を逸脱しない範囲で種々の変更および修正が可能である。

【符号の説明】

【0129】

１００ロボット制御装置
１目標生成部
２モデル予測制御部
３ＰＤ制御部
３１第１ＰＤ制御部
３２第２ＰＤ制御部
３３加算部
４合成部
Ｒｂｔロボット

【図1】