特許第6811688号(P6811688)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧
特許6811688複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置
<>
  • 特許6811688-複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置 図000002
  • 特許6811688-複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置 図000003
  • 特許6811688-複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置 図000004
  • 特許6811688-複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置 図000005
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6811688
(24)【登録日】2020年12月17日
(45)【発行日】2021年1月13日
(54)【発明の名称】複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置
(51)【国際特許分類】
   B25J 13/00 20060101AFI20201228BHJP
   B25J 9/08 20060101ALI20201228BHJP
   G05B 13/02 20060101ALI20201228BHJP
【FI】
   B25J13/00 Z
   B25J9/08
   G05B13/02 L
【請求項の数】6
【全頁数】9
(21)【出願番号】特願2017-128137(P2017-128137)
(22)【出願日】2017年6月30日
(65)【公開番号】特開2019-10701(P2019-10701A)
(43)【公開日】2019年1月24日
【審査請求日】2020年1月21日
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール特許業務法人
(72)【発明者】
【氏名】伊藤 洋
(72)【発明者】
【氏名】山本 健次郎
(72)【発明者】
【氏名】日永田 佑介
【審査官】 谷川 啓亮
(56)【参考文献】
【文献】 国際公開第00/041853(WO,A1)
【文献】 特開2001−038663(JP,A)
【文献】 特開2007−319989(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B25J 1/00 − 21/02
G05B 13/00 − 13/04
(57)【特許請求の範囲】
【請求項1】
可動部を有する複数の動作ユニットと、統合モジュールから構成される複数動作ユニット統合装置であって、
前記統合モジュールは、複数の前記動作ユニットの動作により実現する一連の動作毎に動作タイミング器を備え、外部から入力される前記一連の動作についての動作指示の条件に適合する1つの前記動作タイミング器を選択し、選択された前記動作タイミング器は当該一連の動作に関与する複数の前記動作ユニットの夫々に対して、動作ユニットごとに分解された個別の動作指示として動作タイミング信号を与え、
前記動作ユニットは、前記統合モジュールの前記動作タイミング器からの前記動作タイミング信号に応じて、前記可動部に与える制御信号を発生するとともに、前記動作タイミング器から与えられた動作タイミング信号が表す個別の動作指示についての動作を学習する複数の動作学習器と、前記制御信号に従って前記動作ユニットの可動部を駆動する複数の駆動手段と、該駆動手段によって駆動される前記可動部の状態量を検出するセンサを備え、前記動作タイミング器から与えられた動作タイミング信号が表す個別の動作指示に応じて複数の前記動作学習器の中から1つの前記動作学習器を選択し、選択された前記動作学習器は複数の前記駆動手段に対するブレークダウンされた個別の動作指示情報を前記制御信号とし、前記センサからの状態量を帰還信号として前記駆動手段を駆動することを特徴とする複数動作ユニット統合装置。
【請求項2】
請求項1に記載の複数動作ユニット統合装置であって、
前記統合モジュールの前記動作タイミング信号は、前記動作ユニットの動作内容と動作開始あるいは停止のタイミングを定めたものであることを特徴とする複数動作ユニット統合装置。
【請求項3】
請求項1または請求項2に記載の複数動作ユニット統合装置であって、
前記動作ユニットは、前記動作ユニットを駆動したときの前記動作タイミング信号と前記状態量を学習データとして記憶する記憶部を備えており、前記記憶部に記憶された前記学習データを基に、前記動作学習器のパラメータを調整することを特徴とする複数動作ユニット統合装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の複数動作ユニット統合装置であって、
前記統合モジュールは、所定の動作を達成するように、前記動作タイミング器のパラメータを調整することを特徴とする複数動作ユニット統合装置。
【請求項5】
請求項1から請求項4のいずれか1項に記載の複数動作ユニット統合装置を制御部分として構成された自律学習型ロボット装置。
【請求項6】
可動部を有する複数の動作ユニットと、統合モジュールから構成される複数動作ユニット統合装置の制御方法であって、
前記統合モジュールは、複数の前記動作ユニットの動作により実現する一連の動作毎に動作タイミング器を備え、外部から入力される前記一連の動作についての動作指示の条件に適合する1つの前記動作タイミング器を選択し、前記動作タイミング器は当該一連の動作に関与する複数の前記動作ユニットの夫々に対して、動作ユニットごとに分解された個別の動作指示として動作タイミング信号を与え、
指定された前記動作ユニットは、前記統合モジュールの前記動作タイミング器からの前記動作タイミング信号に応じて、前記可動部に与える制御信号を発生するとともに、前記動作タイミング器から与えられた動作タイミング信号が表す個別の動作指示についての動作を学習する複数の動作学習器を備え、前記動作タイミング器から与えられた動作タイミング信号が表す個別の動作指示に応じて複数の動作学習器の中から前記動作学習器を選択し、選択された前記動作学習器は複数の駆動手段に対するブレークダウンされた個別の動作指示情報を前記制御信号として前記駆動手段を駆動することを特徴とする複数動作ユニット統合装置の制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置に係り、特にアクチュエータとセンサと学習器からなる動作ユニット、及び複数の動作ユニットを統合する統合モジュールにより構成された複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置に関する。
【背景技術】
【0002】
従来のロボット装置の構築に際しては、膨大なプログラミングや高い専門知識が必要であり、ロボット装置導入の阻害要因になっている。そこで、ロボット装置に取り付けられた各種センサ情報に基づいて、ロボット装置自身で動作を決定する自律学習型ロボット装置が提案されている。
【0003】
この自律学習型ロボット装置は、ロボット装置自らの動作経験を記憶・学習することで多様な環境変化に対し柔軟な動作生成が可能ではないかと期待されている。なおロボット装置の動作経験とは、例えば、オペレータ又はユーザがロボット装置に動作を直接教え記憶させる方法や、人や他のロボット装置の動作を見て真似る方法などが挙げられる。
【0004】
一般的に、自律学習型ロボット装置には、学習器と呼ばれる学習装置が備えられており、動作経験時のセンサ情報の記憶と、動作を生成するためのパラメータ調整が行われている。この記憶された動作を学習データ、パラメータの調整を学習と呼び、学習データを用いて学習器の学習を行う。学習器は、あらかじめ入出力の関係を定義し、学習器への入力値に対し期待した出力値が出力されるように学習を繰り返し行う。
【0005】
例えば、ある動作経験時のロボット装置の関節角情報を時系列情報として記憶する。得られた学習データを用いて、学習器に、時刻(t)の関節角情報を入力し、時刻(t+1)の関節角情報を予測するように時系列学習させたとする。そして、学習が完了した学習器にロボット装置の関節角情報を逐次入力することで、自律学習型ロボット装置は、自身の状態に応じて自動的に動作を生成することが可能になる。
【0006】
ロボット装置の学習に関し、非特許文献1は、複数のセンサ情報を統合して学習させることで、センサ情報に基づいて複数の動作パターンの生成が可能であり、環境の変化に応じて自動的に動作を生成する能力を獲得している。
【0007】
また特許文献1は、複数の動作ユニットから構成されるロボット装置において、動作ユニットの動作履歴を記憶手段に記憶することにより、動作ユニットを交換した場合でも、動作を決定することができ、従来と比較して使い勝手を向上し得るロボット装置を実現している。所定の基準に基づいて各動作ユニットの動作結果を評価し、動作の最適化を行うことで、外部から与えられる命令に適した動作を決定する能力を獲得している。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】国際公開番号WO00/41853
【非特許文献】
【0009】
【非特許文献1】タイトル:深層学習を用いた多自由度ロボットによる柔軟物の折り畳み動作生成著者:鈴木彼方,高橋城志,ゴードンチェン,尾形哲也学会名:情報処理学会 第78回全国大会発表日:2015年3月10日場所:慶應義塾大学
【発明の概要】
【発明が解決しようとする課題】
【0010】
非特許文献1によれば、自律学習型ロボット装置は、多様な環境変化に対し柔軟な動作生成を実現することができる。しかしながら、学習が完了した自律学習型ロボット装置の構造を変更する場合、学習器への入出力数や入出力情報の種類が変化することから、再度学習データを記憶し、学習器を学習させなければならず、手間と時間がかかるという問題がある。そのため、獲得した学習器を異構造、異自由度のロボットへ適用することは困難であり、使い勝手が悪いという問題がある。
【0011】
特許文献1は、目的動作に対し、各動作ユニットの動作結果を所定の基準に基づいて更新するため、各動作ユニットの動作を最適化することは可能である。しかし、ロボット装置全体の動作の最適化が困難である。
【0012】
本発明は、以上の点を考慮してなされたもので、規模拡張性を備え、装置全体の最適動作を生成することができる装置全体の最適動作を生成することができる複数動作ユニット統合装置、およびその制御方法、並びに自律学習型ロボット装置を提供することを目的とする。
【課題を解決するための手段】
【0013】
以上のことから本発明は、「可動部を有する複数の動作ユニットと、統合モジュールから構成される複数動作ユニット統合装置であって、統合モジュールは、外部から入力される動作指示に基づいて複数の動作ユニットに対して、動作タイミング信号を与える動作タイミング器を備え、動作ユニットは、統合モジュールの動作タイミング器からの動作タイミング信号に応じて、可動部に与える制御信号を発生する複数の動作学習器と、制御信号に従って動作ユニットの可動部を駆動する駆動手段と、駆動手段によって駆動される可動部の状態量を検出するセンサを備えていることを特徴とする複数動作ユニット統合装置、さらには複数動作ユニット統合装置を制御部分として構成された自律学習型ロボット装置」としたものである。
【0014】
また本発明は、「可動部を有する複数の動作ユニットと、統合モジュールから構成される複数動作ユニット統合装置の制御方法であって、統合モジュールは、外部から入力される一連の動作指示を個別の動作指示に分解し、分解された動作指示を請け負う個別の動作ユニットを指定して、動作タイミング信号を与え、指定された動作ユニットは、統合モジュールからの動作タイミング信号に応じて、可動部を駆動することを特徴とする複数動作ユニット統合装置の制御方法」としたものである。
【発明の効果】
【0015】
本発明により、動作ユニットの交換が可能であり、自律学習型ロボット装置の規模拡張性と、自律学習型ロボット装置全体の最適動作の生成が可能になる。
【図面の簡単な説明】
【0016】
図1】自律学習型ロボット装置の典型的な構成例を示す図。
図2】自律学習型ロボット装置を構成する各動作ユニットの動作ユニット群を示す図。
図3】各動作ユニットの動作タイミングを管理する統合モジュールを備えた複数動作ユニット統合装置の構成例を示す図。
図4】自律学習型ロボット装置を構成する各動作ユニット群の変形例を示す図。
【発明を実施するための形態】
【0017】
本発明の実施例について図面を参照して説明する。
【実施例1】
【0018】
図1に、自律学習型ロボット装置の典型的な構成例を示している。典型的な自律学習型ロボット装置1は、複数の動作ユニットにより構成されており、図1の例では上肢動作ユニット2と下肢動作ユニット3が連結されて自律学習型ロボット装置1が構成されている。またこの例では上肢動作ユニット2として選択された動作ユニット2Aは、頭部と胴体と腕などから構成され、下肢動作ユニット3として選択された3Aは膝や足などから構成され、動作ユニット2Aと動作ユニット3Aを連結することにより、人型の自律学習型ロボット装置1を構成したものである。各動作ユニット2,3には、自律的に動作を生成するためのセンサや動作学習器を備えている。なお、動作ユニットを配置する部位の単位としては、頭部と胴体と腕などの単位ごとに設定することが可能であるが、ここでは上下肢の2つについて動作ユニットを配置した例を示している。
【0019】
図2は、自律学習型ロボット装置を構成する各動作ユニットの動作ユニット群を示す図である。上下肢の動作ユニット2,3は、自律学習型ロボット装置1の上下肢として果たすべき機能に応じて、幾つかの機能のものが適用可能である。例えば図2に示すように、上肢動作ユニット2として、複数種類の動作ユニット2A、2B,2Cからなる上肢動作ユニット群2の中から1つの上肢動作ユニット2Aを選択し、下肢動作ユニット3として、複数種類の動作ユニット3A、3Bからなる下肢動作ユニット群3の中から1つの下肢動作ユニット3Aを選択して所定状態に連結することにより、自律学習型ロボット装置を構成することができる。このように、上下肢の2つの動作ユニットの組み合わせにより、多様な動作、多様な機能の自律学習型ロボット装置を実現することが可能である。
【0020】
そして自律学習型ロボット装置1においては、上肢動作ユニット2Aを交換する必要が生じた場合、上肢動作ユニット群2から例えば上肢動作ユニット2Bを選択し、現在連結されている上肢動作ユニット2Aと交換することにより、動作ユニットの変更が可能である。かくして、自律学習型ロボット装置の規模拡張性を実現することが可能である。
【0021】
次に、自律学習型ロボット装置の動作方法について説明する。図2に示す上肢動作ユニット群2内の各動作ユニットは、上肢動作ユニットとして果たすべき動作機能である物体把持動作や、ドア開け動作などの複数の動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を上肢動作ユニット内の複数の動作学習器に備えている。また下肢動作ユニット群3内の各動作ユニットは、下肢動作ユニットとして果たすべき動作機能である目的地への移動や、障害物回避などの複数の動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を下肢動作ユニット内の複数の動作学習器に備えている。
【0022】
動作指示を与えられた各動作ユニットは、複数の動作学習器の中から動作指示に対応した動作学習器を選択し、センサ情報に基づいて自律的に動作することが可能である。例えば上肢動作ユニット2Aに対する動作指示が「ドア開け動作」である時、上肢動作ユニット2Aは複数の動作学習器の中から、「ドア開け動作」についての動作学習器を選択し、センサ情報に基づいて自律的に動作することができる。また同様にして、例えば下肢動作ユニット3Aに対する動作指示が「ドア通過動作」である時、下肢動作ユニット3Aは複数の動作学習器の中から、「ドア通過動作」についての動作学習器を選択し、センサ情報に基づいて自律的に動作することができる。
【0023】
しかしながら自律学習型ロボット装置1は、単純に上肢動作ユニット2Aと下肢動作ユニット3Aを連結しても、上肢動作「ドア開け」と下肢動作「ドア通過」を組み合わせた、「ドア開け通過動作」を生成することができない。
【0024】
このことから本発明では、各動作ユニットが連携動作できるように、各動作ユニットの動作タイミングを管理する統合モジュールを備えることで、各動作ユニット間の連携動作を実現している。
【0025】
図3は、各動作ユニットの動作タイミングを管理する統合モジュールを備えた複数動作ユニット統合装置の構成例を示している。図3は、外部からの情報を基に動作する自律学習型ロボット装置を実現するための複数動作ユニット統合装置である。
【0026】
図3の複数動作ユニット統合装置は、複数の動作ユニットUN(UN1・・UNN)と統合モジュールMにより構成されている。複数の動作ユニットUNのうちUN1が例えば上肢動作ユニット2に対応し、UNNが例えば下肢動作ユニット3に対応している。また統合モジュールMは、自律学習型ロボット装置の適宜の場所に配置されている。統合モジュールMは、外部からの動作指示の情報OPに応じて各動作ユニットUN(UN1・・UNN)に動作タイミング信号T(T1・・TN)を送り、各動作ユニットUN(UN1・・UNN)からのセンサ情報S(S1・・SN)を受信、監視する。
【0027】
統合モジュールMは、ロボット装置の構成(例えば上下肢動作ユニット2,3の組み合わせ)と動作指示(例えば上下肢動作ユニット2,3の動作内容)ごとに複数の動作タイミング器MT(MT1・・MTm)を備え、動作指示に基づいて適切な動作タイミング器を選択する。動作タイミング器MTは、各動作ユニットUN(UN1・・UNN)のセンサ情報S(S1・・SN)に基づいて動作タイミング信号T(T1・・TN)を生成し、各動作ユニットUN(UN1・・UNN)に送出する。動作タイミング信号T(T1・・TN)とは、各動作ユニットUN(UN1・・UNN)の動作開始、動作終了のほかに、各動作ユニットの動作速度や動作停止、再開などを指示することが可能である。
【0028】
統合モジュールMの典型的な動作事例は、ロボット装置の構成が上下肢動作ユニット2A,3Aの組み合わせであり、外部からの動作指示の情報OPが「ドア開け通過動作」であるとき、この条件に適合する1つの動作タイミング器MTを選択し、動作ユニットUN1に対して上肢動作「ドア開け」の動作タイミング信号T1を送出し、動作ユニットUNNに対して下肢動作「ドア通過」の動作タイミング信号TNを送出するものである。また各動作のタイミングを定めるに当たり、動作ユニットUN1、UNNのセンサ情報S1、SNを参照し、センサ情報SNから例えば下肢動作ユニット3Aの立ち位置が、開放するドアとの関係で開放に支障のない位置であることを確認し、センサ情報S1から例えば上肢動作ユニット2Aが、ドアの開放に至るまでの一連の動作を支障なく行える位置関係にあることを確認して、各タイミングの送出とする。
【0029】
この統合モジュールMの機能は、与えられた一連の動作指示「ドア開け通過動作」を、動作ユニットごとの個別の動作指示「ドア開け」、「ドア通過」に分解して与えたものであり、分解された動作指示を請け負う個別の動作ユニットを指定したものということができる。
【0030】
他方動作ユニットUNについてみるとこれは、センサ10の他に複数の動作学習器12、記憶部13、複数の可動部11により構成されている。
【0031】
このうち複数の動作学習器12は、例えば上肢動作ユニットUN1(2)であれば、上肢動作ユニットとして果たすべき動作機能である物体把持動作や、ドア開け動作などの動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を動作学習器内に備えている。また下肢動作ユニットUN2(3)であれば、下肢動作ユニットとして果たすべき動作機能である目的地への移動や、障害物回避などの動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を動作学習器内に備えている。可動部11は、例えば上肢であれば、頭部と胴体と腕などの間の上肢の主要な節である部分、さらには手を構成するための節ごとに適宜設けられている。
【0032】
動作ユニットUN(例えば上肢動作ユニットUN1)においては、統合モジュールMからの動作指示内容(例えばドア開け動作)についての動作タイミング信号Tに基づいて、複数の動作学習器12の中からドア開け動作に特化された動作学習器12を選択し、カメラ、ポテンショメータ、力覚センサ、触覚センサ等からなるセンサ10を介して得られたセンサ情報を用いて可動部11を動作させる。なお、ドア開け動作に特化された動作学習器12は、この動作を複数の可動部11の連係動作により実現するために、複数の各可動部11に対するブレークダウンされた個別の動作指示情報として与えている。また図3には図示していないが、動作学習器12は制御信号を発生して駆動手段に与え、駆動手段により可動部11を操作している。また可動部11を操作する際に、適宜センサ10からのセンサ情報Sを帰還信号として用いて位置制御などに利用している。
【0033】
動作ユニットUNは単体で動作することが可能であるが、統合モジュールMからの動作タイミング信号Tと動作指示に基づいて動作することも可能である。
【0034】
これにより、例えば、ドア開け動作を学習した上肢動作ユニットUN1と、ドア通過動作を学習した下肢動作ユニットUNNから構成される自律学習型ロボット装置において、動作タイミング器MTが生成する動作タイミング信号Tに基づいて、各動作ユニットUN(UN1・・UNN)を動作させることで、下肢動作ユニットUNNがドアへ接近し、上肢動作ユニットUN1がドア開け動作を生成し、下肢動作ユニットUNNがドアを押し開けるといった、一連のドア開け通過動作を生成することが可能である。このように自律学習型ロボット装置1は、外部から与えられる動作指示OPとセンサ情報Sに基づいて、各動作ユニットを適切に動作することが可能である。
【0035】
次に、統合モジュールMの動作タイミング器MTにおける動作学習機能の獲得方法について説明する。動作タイミング器MTは、各動作ユニットUNのセンサ情報Sを基に、ロボット装置自身の試行錯誤により最適な動作タイミングを獲得する教師なし学習法や、人が自律学習型ロボット装置に動作タイミングを数パターン教示した際のセンサ情報Sを基に、ロボット装置が動作タイミングを学習により自己組織化する教師あり学習法などを用いることで、動作タイミングの学習を行う。
【0036】
いずれの手法も、所定の評価基準、例えば動作効率やエネルギー効率などに関して評価を行い、評価が高くなるように学習を行う。所定の基準に基づいて学習された動作タイミング器MTに、各動作ユニットUNのセンサ情報Sを入力することで、最適動作タイミングの生成を行う。
【0037】
以上の構成において、自律学習型ロボット装置1は、統合モジュールMにて、動作指示を実行し達成するために適した動作ユニットの動作タイミングを、動作タイミング器MTで学習し、生成することにより、自律学習型ロボット装置全体の最適動作の生成が可能になる。
【0038】
上記の実施例では、動作ユニットとして、上肢動作ユニット2と下肢動作ユニット3を用いたが、動作ユニットの単位を変更した例を図4に示す。図4は、自律学習型ロボット装置を構成する各動作ユニット群の変形例を示す図である。図4においては、ロボットアーム動作ユニット10Aと、複数種類のハンド動作ユニット群11の中から、1つのハンド動作ユニット11Aを選択し、連結することにより自律学習型ロボットを構成したものである。
【0039】
また上記の実施例では、複数の動作ユニットUNと統合モジュールMを用いて1台の自律学習型ロボット装置を構成していたが、1台の自律学習型ロボット装置を1つの動作ユニットとすることで、複数の自律学習型ロボット装置と統合モジュールによるロボットシステムを構成しても良い。
【0040】
以上説明した本発明によれば、複数の動作ユニットと、動作ユニットの動作生成タイミングを学習・生成する統合モジュールにより構成された複数動作ユニット統合装置による自律学習型ロボット装置とすることで、ロボット装置の構成を変化させても動作を生成することが可能である。
図1
図2
図3
図4