(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-11
(45)【発行日】2024-03-19
(54)【発明の名称】制御装置、ロボットシステム、およびロボットの制御方法
(51)【国際特許分類】
B25J 17/02 20060101AFI20240312BHJP
【FI】
B25J17/02 H
(21)【出願番号】P 2020094782
(22)【出願日】2020-05-29
【審査請求日】2023-03-07
(73)【特許権者】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】井尻 善久
(72)【発明者】
【氏名】田中 一敏
(72)【発明者】
【氏名】▲濱▼屋 政志
(72)【発明者】
【氏名】フェリクス フォン ドリガルスキ
(72)【発明者】
【氏名】柴田 義也
(72)【発明者】
【氏名】中島 千智
【審査官】仁木 学
(56)【参考文献】
【文献】特開2017-052052(JP,A)
【文献】特開平06-083427(JP,A)
【文献】特開2016-168663(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B25J 1/00 - 21/02
(57)【特許請求の範囲】
【請求項1】
柔軟部および前記柔軟部を固定するロック機構を有するロボットの制御装置であって、
前記柔軟部のロックおよびアンロックを制御するロック制御部と、
前記柔軟部が
アンロック状態である場合には、機械学習ベースの制御ポリシを用いて前記ロボットの動作を制御
し、前記柔軟部がロック状態である場合には、古典制御または状態空間モデルに基づく制御の制御ポリシを用いて前記ロボットの動作を制御する動作制御部と、
を備える、制御装置。
【請求項2】
前記ロボットに行わせる作業指令を受け付ける作業指令入力部をさらに備え、
入力される作業指令に応じて、前記ロック制御部は前記柔軟部のロックおよびアンロックを制御し、前記動作制御部は利用する制御ポリシを切り替える、
請求項
1に記載の制御装置。
【請求項3】
前記ロボットと対象物との間の距離を表すセンサ情報を取得するセンサ情報取得部をさらに備え、
前記ロボットと前記対象物との間の距離に応じて、前記ロック制御部は前記柔軟部のロックおよびアンロックを制御し、前記動作制御部は利用する制御ポリシを切り替える、
請求項
1に記載の制御装置。
【請求項4】
前記ロボットと対象物との接触に関するセンサ情報を取得するセンサ情報取得部をさらに備え、
前記ロボットが前記対象物と接触しているか否かに応じて、前記ロック制御部は前記柔軟部のロックおよびアンロックを制御し、前記動作制御部は利用する制御ポリシを切り替える、
請求項
1に記載の制御装置。
【請求項5】
前記ロボットのセンサ情報を取得するセンサ情報取得部をさらに備え、
前記動作制御部は、前記動作制御部が利用する制御ポリシに応じて、前記センサ情報取
得部が取得したセンサ情報のうち利用するセンサ情報を決定する、
請求項
1に記載の制御装置。
【請求項6】
取得される前記センサ情報は、前記柔軟部の状態を表すセンサ情報を含み、
前記動作制御部は、前記柔軟部がアンロック状態であれば前記柔軟部の状態を表すセンサ情報を利用するセンサ情報として決定する、
請求項
5に記載の制御装置。
【請求項7】
前記ロボットのセンサ情報を取得するセンサ情報取得部をさらに備え、
前記センサ情報取得部は、前記動作制御部が利用する制御ポリシに応じて前記ロボットから取得するセンサ情報を決定する、
請求項1から
4のいずれか1項に記載の制御装置。
【請求項8】
前記ロボットは、対象物を把持するためのグリッパと、前記グリッパを移動させるためのアームとを備え、
前記柔軟部は、前記グリッパの途中、前記グリッパと前記アームとの間、および前記アームの途中のうちの少なくともいずれかの位置に設けられる、
請求項1から
7のいずれか1項に記載の制御装置。
【請求項9】
対象物を把持するためのグリッパと、前記グリッパを移動させるためのアームとを備え、前記グリッパの途中、前記グリッパと前記アームとの間、および前記アームの途中のうちの少なくともいずれかの位置に柔軟部を有するロボットと、
請求項1から
8のいずれか1項に記載の制御装置と、
を備える、ロボットシステム。
【請求項10】
制御装置によって行われる、柔軟部および前記柔軟部を固定するロック機構を有するロボットの制御方法であって、
前記柔軟部のロックおよびアンロックを制御するロック制御ステップと、
前記柔軟部が
アンロック状態である場合には、機械学習ベースの制御ポリシを前記ロボットの動作の制御に用いる制御ポリシ
として選択
し、前記柔軟部がロック状態である場合には、古典制御または状態空間モデルに基づく制御の制御ポリシを前記ロボットの動作の制御に用いる制御ポリシとして選択するポリシ選択ステップと、
前記選択されたポリシを用いて、前記ロボットの動作を制御する動作制御ステップと、
を備える、制御方法。
【請求項11】
請求項
10に記載の方法の各ステップをコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、柔軟部を備えるロボットの制御に関する。
【背景技術】
【0002】
剛性の高い機構のみで構成されたロボットを用いて対象に対する接触を伴う動作をする際には、細心の注意を払う必要があり、対象や動作環境を決定してモデリングした上で、更に動作速度を落として制御する必要があった。また、剛性の高い機構のみで精密な作業をしようとすると、高い精度の状態計測が必要となるが、実際には計測に誤差が伴う。したがって、剛性の高い機構のみで構成されたロボットを用いると、動作速度が遅く、また、現場で必要とされる高い作業成功率を実現できないという問題がある。
【0003】
一方、変形を許容する柔軟な機構を有するロボットは、対象に対する接触を伴う動作を、速い動作速度、かつ、高い作業性効率で実現できる。しかしながら、柔軟機構は移動時の振動発生等により作業が安定せず、むしろ剛性の高い機構の方が安定する作業も存在する。
【0004】
剛性の高い機構と柔軟な機構のメリットを両立させるために、特許文献1~3には、ロック機構付の柔軟要素を備えるロボットが提案されている。これらのロボットでは、柔軟部(コンプライアンスユニット)を原点位置または任意位置に固定可能なロック機構が用いられる。
【0005】
しかしながら、特許文献1~3ではいずれも、柔軟部をロックしているときとロックしていないときにどのような制御を行うかの検討はされていない。
【先行技術文献】
【特許文献】
【0006】
【文献】特開平05-192892号公報
【文献】特開2005-177918号公報
【文献】特開平08-118281号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は上記実情に鑑みなされたものであって、柔軟部のロックおよびアンロックを切り替え可能なロボットを効果的に制御可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために本発明は、以下の構成を採用する。
【0009】
本発明の第一態様は、柔軟部および前記柔軟部を固定するロック機構を有するロボットの制御装置であって、
前記柔軟部のロックおよびアンロックを制御するロック制御部と、
前記柔軟部がロック状態であるかアンロック状態であるかに応じて異なる種類の制御ポリシを用いて前記ロボットの動作を制御する動作制御部と、
を備える。
【0010】
柔軟部は、物理的に柔軟な要素、すなわち、変位に対して復元力が働く受動要素を含む概念である。物理的に柔軟な要素は、典型的には、バネやゴムのような弾性体、ダンパ、
空気圧または液圧のシリンダが含まれる。柔軟部は、力制御を用いてあるいは力制御のみによって柔軟性を得る機構であってもよい。
【0011】
制御ポリシは、ロボットがある状態xにあるときに次にとるべき行動uを決定する要素(写像)である。制御ポリシは、典型的には、確率密度関数π(u|x)または関数u=π(x)という形式で表される。
【0012】
制御ポリシの種類には、例えば、機械学習ベースの制御ポリシ、現代制御理論に基づく状態空間モデルを用いた制御ポリシ、古典制御の制御ポリシが含まれる。機械学習ベースの制御ポリシは、機械学習アルゴリズムを用いてデータドリブンに導出される制御ポリシであり、例えば、強化学習により導出された制御ポリシ、深層学習により導出された制御ポリシ、モデルベースの強化学習により導出された制御ポリシが含まれる。状態空間モデルに基づく制御ポリシは、制御対象に関する既知の情報であるシステムモデル(状態空間モデル)に基づいて導出される制御ポリシであり、最適制御やモデル予測制御に基づく制御ポリシが含まれる。古典制御の制御ポリシは、PID制御等の古典制御に基づく制御ポリシである。状態空間モデルに基づく制御ポリシおよび古典制御の制御ポリシは、解析的な制御ポリシと捉えることもできる。
【0013】
本態様において、動作制御部は、柔軟部がアンロック状態(非固定状態)である場合には機械学習ベースの制御ポリシを用いてロボットの動作を制御するように構成されてよい。柔軟部が固定されていない状態では、ロボットの先端位置が不確定になるため、状態空間モデル等でモデリングして制御することは困難であり、機械学習ベースの制御ポリシを用いることが好適である。
【0014】
本態様において、動作制御部は、柔軟部がロック状態(固定状態)である場合には古典制御または状態空間モデルに基づく制御の制御ポリシを用いてロボットを制御するように構成されてよい。柔軟部が固定されている状態では、ロボットの先端位置は正確に求めることができるため、解析的な制御ポリシを用いて精度の高い制御が可能である。
【0015】
本態様にかかる制御装置は、入力される作業指令に応じて、柔軟部のロックおよびアンロックの制御と、動作制御部が用いる制御ポリシの切り替えとを行ってもよい。作業指令という1つの入力に基づいてロック・アンロックと制御ポリシの切り替えとが行われるので処理が簡便である。また、作業指令に応じて、例えば、異なるモデルパラメータを有する複数の機械学習ベースの制御ポリシのいずれかを用いるようにすることもできる。
【0016】
また、本態様にかかる制御装置は、ロボットと対象物の距離に応じて、または、ロボットが対象物と接触しているか否かに応じて、柔軟部のロックおよびアンロックの制御と、動作制御部が用いる制御ポリシの切り替えとを行ってもよい。ロボットが対象物と接近あるいは接触した時には、安全性の観点から柔軟部のロックを解除することが望ましく、そしてそれに応じて制御ポリシを切り替えることができる。
【0017】
また、本態様にかかる制御装置は、柔軟部がロック状態であるかアンロック状態であるかに応じて、利用する制御ポリシだけでなく、利用するセンサ情報を決定してもよい。利用するセンサ情報を決定するというのは、例えば、ロボットから取得するセンサ情報の種類を決定あるいは変更することと、ロボットから取得するセンサ情報は変更しないが制御ポリシに入力するセンサ情報の種類を決定あるいは変更することとを含む。例えば、柔軟部がアンロック状態であれば、柔軟部の状態を表すセンサ情報を利用するように決定することが考えられる。
【0018】
本態様における柔軟部は、対象物を把持するためのグリッパと、前記グリッパを移動さ
せるためのアームとを備えるロボットの、グリッパの途中、グリッパとアームとの間、およびアームの途中のうちの少なくともいずれかの位置に設けられてもよい。
【0019】
本発明の第二の態様は、
対象物を把持するためのグリッパと、前記グリッパを移動させるためのアームとを備え、前記グリッパの途中、前記グリッパと前記アームとの間、および前記アームの途中のうちの少なくともいずれかの位置に柔軟部を有するロボットと、
第一の態様にかかる制御装置と、
を備える、ロボットシステムである。
【0020】
本発明の第三の態様は、
制御装置によって行われる、柔軟部および前記柔軟部を固定するロック機構を有するロボットの制御方法であって、
前記柔軟部のロックおよびアンロックを制御するロック制御ステップと、
前記柔軟部がロック状態であるかアンロック状態であるかに応じて前記ロボットの動作の制御に用いる制御ポリシを選択するポリシ選択ステップと、
前記選択されたポリシを用いて、前記ロボットの動作を制御する動作制御ステップと、
を備える、制御方法である。
【0021】
本発明は、上述の制御方法を実現するためのプログラムやそのプログラムを非一時的に記録した記録媒体として捉えることもできる。なお、上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
【発明の効果】
【0022】
本発明によれば、柔軟部のロックおよびアンロックを切り替え可能なロボットを効果的に制御できる。
【図面の簡単な説明】
【0023】
【
図1】
図1は、本発明を適用したロボットシステムの概要を説明する図である。
【
図3】
図3は、ロボットシステムの制御装置のハードウェア構成を示すブロック図である。
【
図4】
図4は、作業指令と、柔軟部のロック状態および制御ポリシとの対応関係を表すテーブルの例を説明する図である。
【
図5】
図5は、制御装置の制御フローを示す図である。
【発明を実施するための形態】
【0024】
<適用例>
図1を参照して、本発明に係るロボットシステム1の適用例を説明する。ロボットシステム1は、柔軟部を備えるロボット10と、ロボット10を制御する制御装置により構成される。ロボット10の柔軟部13はロック状態とアンロック状態をとることができ、制御装置20は、ロボット10の柔軟部13がロック状態であるかアンロック状態であるかに応じて異なる種類の制御ポリシを用いてロボット10の動作を制御する。
【0025】
具体的には、制御装置20は、柔軟部13がアンロック状態である場合には、機械学習ベースの制御ポリシを用いてロボット10の動作を制御する。柔軟部13がアンロック状態の時には、ロボット10のグリッパ12の先端位置が確定しないので、機械学習ベースの制御ポリシを用いることで作業を適切に実行できる。一方、制御装置20は、柔軟部13がロック状態である場合には、古典制御または状態空間モデルに基づく制御の制御ポリシを用いてロボット10を制御する。柔軟部13がロック状態の時には、ロボット10の
グリッパ12の先端位置を正確に求めることができるので、解析的な制御ポリシを用いて精度の高い制御が可能である。
【0026】
このように、制御装置20は、柔軟部13の状態に応じて適切な制御ポリシを用いることで、柔軟部13がロック状態である場合とアンロック状態である場合の両方で効果的な制御を実現できる。
【0027】
<第1実施形態>
図1は、本発明の第1実施形態に係るロボットシステム1を示すロボットシステム1は、ロボット10と制御装置20を有する。
【0028】
(ロボット)
図2A,
図2Bは、ロボット10の概略構成を示す図である。本実施形態におけるロボット10は、6軸垂直多関節ロボットであり、アーム11の先端に柔軟部13を介してグリッパ(ハンド)12が設けられる。ロボット10は、例えば、グリッパ12によって部品(例えばペグ)を把持して穴に嵌め込む嵌め込み作業を行う。
【0029】
図2Aに示すように、ロボット10は、関節J1~J6を備えた6自由度のアーム11を有する。各関節J1~J6は、図示しないモータによりリンク同士を矢印C1~C6の方向に回転可能に接続する。ここでは、垂直多関節ロボットを例に挙げたが、水平多関節ロボット(スカラーロボット)であってもよい。また、6軸ロボットを例に挙げたが、5軸や7軸などその他の自由度の多関節ロボットであってもよく、パラレルリンクロボットであってもよい。
【0030】
グリッパ12は、1組の挟持部12aを有し、挟持部12aを制御して部品を挟持する。グリッパ12は、柔軟部13を介してアーム11の先端11aと接続され、アーム11の移動に伴って移動する。本実施形態では、柔軟部13は各バネの基部が正三角形の各頂点になる位置関係に配置された3つのバネ13a~13cにより構成されるが、バネの数はいくつであってもよい。また、柔軟部13は、位置の変動に対して復元力を生じて、柔軟性が得られる機構であればその他の機構であってもよい。例えば、柔軟部13は、バネやゴムのような弾性体、ダンパ、空気圧または液圧シリンダなどであってもよい。柔軟部13は、力制御を用いてあるいは力制御のみによって柔軟性を得る機構であってもよい。柔軟部13により、アーム先端11aとグリッパ12は、水平方向および垂直方向に、5mm以上、好ましくは1cm以上、更に好ましくは2cm以上、相対移動可能に構成される。
【0031】
ロボット10は、グリッパ12がアーム11に対して柔軟(相対移動可能)な状態と固定された状態とを切り替えられるためのロック機構を備える。グリッパ12とアーム11の位置関係が固定された状態は柔軟部13が固定あるいはロックされた状態ともいえる。また、グリッパ12とアーム11が柔軟な状態は柔軟部が固定されていないあるいはアンロックされた状態ともいえる。
【0032】
本実施形態では、アーム11は、アーム11の先端から柔軟部13の方向に向かって移動可能な移動部材11b、11cを有しており、移動部材11b、11cによって柔軟部13を押圧する。柔軟部13が押圧されると、グリッパ12の係止部12bとアーム11の係止部11dとの係止により、グリッパ12とアーム11の位置関係が固定される。
【0033】
なお、上記のロック機構は一具体例に過ぎず、グリッパ12をアーム11に対して固定可能であればどのようなロック機構を採用してもよい。例えば、グリッパ12とアーム11の間に負圧をかけたり、グリッパ12をアーム11の方向に引き寄せたりして、グリッ
パ12とアーム11の位置関係を固定してもよい。あるいは、柔軟部13の弾性係数を増加させることによって、グリッパ12とアーム11の位置関係を固定してもよい。
【0034】
また、ここではアーム11の先端11aとグリッパ12の間に柔軟部13を設ける構成を例示したが、グリッパ12の途中(例えば、指関節の場所または指の柱状部分の途中)、アームの途中(例えば、関節J1~J6のいずれかの場所またはアームの柱状部分の途中)に設けられてもよい。また、柔軟部13は、これらのうちの複数の箇所に設けられてもよい。
【0035】
ロボット10における柔軟部のロックおよびアンロックと、各関節の動作は、制御装置20からの指令に基づいて行われる。また、ロボット10は、その状態を取得する各種のセンサを有しており、取得したセンサ情報を制御装置20に対して送信する。
【0036】
(制御装置)
次に、制御装置20について説明する。
【0037】
図3は、本実施形態に係る制御装置のハードウェア構成を示すブロック図である。
図3に示すように、制御装置20は、一般的なコンピュータ(情報処理装置)と同様の構成であり、CPU(Central Processing Unit)31、ROM(Read Only Memory)32、RAM(Random Access Memory)33、ストレージ34、キーボード35、マウス36、モニタ37、及び通信インタフェース38を有する。各構成は、バス39を介して相互に通信可能に接続されている。
【0038】
本実施形態では、ROM32又はストレージ34には、ロボット10の制御を行うためのプログラムおよびデータが格納されている。CPU31は、中央演算処理ユニットであり、各種プログラムを実行したり、各構成を制御したりする。すなわち、CPU31は、ROM32又はストレージ34からプログラムを読み出し、RAM33を作業領域としてプログラムを実行する。CPU31は、ROM32又はストレージ34に記録されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。ROM32は、各種プログラム及び各種データを格納する。RAM33は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ34は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリにより構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。キーボード35及びマウス36は入力装置の一例であり、各種の入力を行うために使用される。モニタ37は、例えば、液晶ディスプレイであり、ユーザインタフェースを表示する。モニタ37は、タッチパネル方式を採用して、入力部として機能してもよい。通信インタフェース38は、他の機器と通信するためのインタフェースであり、例えば、イーサネット(登録商標)、FDDI又はWi-Fi(登録商標)等の規格が用いられる。
【0039】
次に、制御装置20の機能構成について説明する。
【0040】
図1に、制御装置20の機能構成の例が示されている。
図1に示すように、制御装置20は、その機能構成として、作業指令入力部21、動作モード切替部22、ロック制御部25、動作制御部26、センサ情報取得部27を有する。動作モード切替部22は、ロック状態切替部23と制御ポリシ切替部24を含む。各機能部は、CPU31がROM32またはストレージ34に記憶された学習プログラムを読み出して、RAM33に展開して実行することにより実現される。なお、一部または全部の機能は専用のハードウェア装置によって実現されても構わない。
【0041】
作業指令入力部21は、外部装置あるいはユーザーからロボット10に行わせる作業を表す作業指令を取得する。作業指令の抽象度あるいは粒度はどのように定義されてもよい。ペグの嵌め込み作業を例にとると、作業指令は、例えば、「グリッパ12によって対象物を把持する」「グリッパ12を穴付近まで移動させる」「穴を探索してペグを穴に接触させる」「ペグを穴に対して平行にする」「ペグを穴に挿入する」「ペグを指定位置に固定する」である。作業指令は、より低い抽象度で定義されても、高い抽象度で定義されてもよい。
【0042】
動作モード切替部22は、柔軟部13のロックおよびアンロックの制御と、ロボット10の動作の制御に用いる制御ポリシを切り替える。本実施形態では、動作モード切替部22は、作業指令入力部21に入力される作業指令に応じて、これら2つの制御を行う。そのために、動作モード切替部22は、作業指令と、柔軟部13のロックまたはアンロックおよび利用する制御ポリシの種類とを対応づけた設定テーブル40(
図4)をあらかじめ記憶しておき、入力される作業指令と当該設定テーブル40に基づいて、柔軟部13のロック・アンロックおよび利用する制御ポリシの種類の決定を行う。
【0043】
図4は、動作モード切替部22が記憶する設定テーブル40の例を示す図である。この例では、グリッパを移動させる作業指令(Move)およびグリッパまたはペグを固定する作業指令(Fix)では状態空間モデルに基づく制御ポリシを用い、穴を探索する作業指令(Explore)、ペグを穴に対して平行にする作業指令(Align)、ペグを穴に挿入する作業指令(Insert)では機械学習ベースの制御ポリシを用いることが定義されている。設定テーブル40には、どの種類の作業ポリシを利用するかではなく、どの作業ポリシを利用するかが定義されてもよい。例えば、Explore作業に対しては、Explore作業用に機械学習した制御ポリシを用いると定義されていてもよい。その他の作業についても同様である。
【0044】
ロック状態切替部23は、作業指令入力部21に入力される作業指令と設定テーブル40に基づいて、柔軟部13をロック状態とするかアンロック状態とするかを決定し、ロック制御部25に出力する。制御ポリシ切替部24は、作業指令入力部21に入力される作業指令と設定テーブル40とに基づいて、動作制御部26が利用すべき制御ポリシの種類または制御ポリシを決定して、動作制御部26に出力する。
【0045】
ロック制御部25は、ロック状態切替部23からの入力に応じて、柔軟部13のロックのオンまたはオフを指示する指令をロボット10に出力する。
【0046】
動作制御部26は、ロボット10に対して動作を指示する動作指令を生成して、ロボット10に出力する。動作制御部26は、センサ情報取得部27から取得されるロボット10のセンサ情報(状態観測データ;状態変数)と、制御ポリシ切替部24から指示された制御ポリシとを用いて、動作指令を生成する。
【0047】
なお、動作制御部26は、センサ情報取得部27から取得されるすべてのセンサ情報を用いて動作指令を生成する必要はなく、利用する制御ポリシに応じてどのセンサ情報を利用するかを決定してもよい。例えば、機械学習ベースの制御ポリシを用いる場合には柔軟部13の状態を表すセンサ情報を利用し、状態空間モデルに基づく制御ポリシを用いる場合には柔軟部13の状態を表すセンサ情報を利用しないことが考えられる。
【0048】
センサ情報取得部27は、ロボット10からロボット10の状態を表すセンサ情報を取得する。ロボット10の状態を表すセンサ情報の例は、各関節のエンコーダ、視覚センサ(カメラ)、力関連センサ(力覚センサ、トルクセンサ、触覚センサ)、変位センサによって取得される情報である。
【0049】
(処理)
図5は本実施形態にかかる制御装置20が行うロボット10の制御方法の処理の流れを示すフローチャートである。
【0050】
ステップS51において、作業指令入力部21は外部装置またはユーザーからロボット10に行わせる作業を指示する作業指令を取得する。ステップS52において、動作モード切替部22は、作業指令と設定テーブル40とに基づいて、柔軟部のロックの有効・無効および利用する制御ポリシを選択する。
【0051】
ステップS53では、ステップS52においてロックを有効にするように選択されたか否かを判定する。ロックを有効にすると選択した場合にはステップS54に進み、ロックを無効にすると選択した場合にはステップS56に進む。ステップS54では、ロック制御部25は、ロボット10に対して柔軟部13のロックの無効化(アンロック)する指示を出力し、ステップS55では、動作制御部26はアンロック時用の制御ポリシ、すなわち機械学習ベースの制御ポリシを読み込む。ステップ56では、ロック制御部25は、ロボット10に対して柔軟部のロックを有効化(ロック)する指示を出力し、ステップS57では、動作制御部26はロック時用の制御ポリシ、すなわち、古典制御または状態空間モデルに基づく制御の制御ポリシを読み込む。
【0052】
ステップS57では、動作制御部26は、ステップS54またはステップS56で選択された制御ポリシと、センサ情報取得部27から得られるセンサ情報に基づいて動作指令を生成し、当該動作指令をロボット10に送信することによりロボット10の制御を実行する。
【0053】
ステップS58では、作業が完了したか否かを判定し、作業が完了していなければステップS51に戻り、作業が完了していれば処理を終了する。
【0054】
(本実施形態の有利な効果)
ロボットが行う作業に応じて、ロボットに柔軟性を持たせることが好ましい場合と柔軟性を持たせないことが好ましい場合がある。そして、ロボットに柔軟性を持たせる場合にはハンド位置の不確定性から機械学習ベースの制御ポリシを用いて制御を行うことが好ましく、一方、ロボットに柔軟性を持たせない場合にはハンド位置が確定することから解析的な制御ポリシを用いて制御することが好ましい。本実施形態によれば、ロボットに行わせる作業に応じてロボットの柔軟部のロック・アンロックを制御し、かつ、動作制御に用いる制御ポリシを切り替えるので、ロボットに対して様々な作業を効果的に行わせることができる。また、作業指令に応じて、柔軟部のロック・アンロックおよび利用する制御ポリシが決定されるので、ユーザーは柔軟部のロック状態や用いる制御ポリシを明示的に指定しなくてもロボットの制御プログラムを作成することができる。
【0055】
<変形例>
上記実施形態は、本発明の構成例を例示的に説明するものに過ぎない。本発明は上記の具体的な形態には限定されることはなく、その技術的思想の範囲内で種々の変形が可能である。
【0056】
上記の実施形態では、作業指令に応じて柔軟部13のロック・アンロックの制御と利用する制御ポリシの切替が行われるが、柔軟部13のロック状態であるかアンロック状態に応じて異なる種類の制御ポリシが利用されれば、具体的にどのように制御されてもよい。
【0057】
例えば、ロボット10のグリッパ12と対象物の間の距離に応じて柔軟部13のロック
状態の制御と利用する制御ポリシの切替を行ってもよい。より詳細には、制御装置20は、グリッパ12と対象物の間の距離が閾値より小さければ、柔軟部13をアンロック状態に制御し、かつ、動作制御部26が利用する制御ポリシを機械学習ベースの制御ポリシに切り替える。一方、グリッパ12と対象物の間の距離が閾値より大きければ、制御装置20は、柔軟部13をロック状態に制御し、かつ、動作制御部26が利用する制御ポリシを古典制御または状態空間モデルに基づく制御の制御ポリシに切り替える。
【0058】
他の例では、ロボット10のグリッパ12が対象物と接触しているか否かに応じて柔軟部13のロック状態の制御と利用する制御ポリシの切替を行ってもよい。より詳細には、グリッパ12と対象物が接触している場合は、制御装置20は、柔軟部13をアンロック状態に制御し、かつ、動作制御部26が利用する制御ポリシを機械学習ベースの制御ポリシに切り替える。一方、グリッパ12と対象物が接触していない場合は、制御装置20は、柔軟部13をロック状態に制御し、かつ、動作制御部26が利用する制御ポリシを古典制御または状態空間モデルに基づく制御の制御ポリシに切り替える。
【0059】
グリッパ12と対象物の間の距離またはグリッパ12と対象物との接触検知は、ロボット10に備えられたセンサまたはロボット10を観測するセンサから得られるセンサ情報に基づいて判断すればよい。
【0060】
また、制御装置20は、利用する制御ポリシに応じて、動作制御部26が動作指令を生成するために用いるセンサ情報を決定してもよい。例えば、センサ情報取得部27がロボット10から取得するセンサ情報の種類を変更してもよいし、センサ情報取得部27がロボット10から取得するセンサ情報は変わらないが、センサ情報取得部27が動作制御部26に供給するセンサ情報を変更したり動作制御部26が利用するセンサ情報を変更したりしてもよい。例えば、柔軟部13がアンロック状態であるとき、すなわち機械学習ベースの制御ポリシを利用するときは、ロボット10のアーム11とグリッパ12の相対的な位置関係を示すセンサ情報やグリッパ12における力触覚センサ情報を動作指令生成のために用い、柔軟部13がロック状態であるときはこれらのセンサ情報を用いないことが考えられる。
【0061】
<付記>
1.柔軟部(13)および前記柔軟部を固定するロック機構を有するロボットの制御装置(20)であって、
前記柔軟部(13)のロックおよびアンロックを制御するロック制御部(25)と、
前記柔軟部(13)がロック状態であるかアンロック状態であるかに応じて異なる種類の制御ポリシを用いて前記ロボットの動作を制御する動作制御部(26)と、
を備える、制御装置(20)。
【0062】
2.制御装置(20)によって行われる、柔軟部(13)および前記柔軟部を固定するロック機構を有するロボット(10)の制御方法であって、
前記柔軟部のロックおよびアンロックを制御するロック制御ステップ(S54,S56)と、
前記柔軟部がロック状態であるかアンロック状態であるかに応じて前記ロボットの動作の制御に用いる制御ポリシを選択するポリシ選択ステップ(S55,S57)と、
前記選択されたポリシを用いて、前記ロボットの動作を制御する動作制御ステップと、
を備える、制御方法。
【符号の説明】
【0063】
1:ロボットシステム
10:ロボット 11:アーム 12:グリッパ 13:柔軟部
20:制御装置