【実施例1】
【0018】
図1に、自律学習型ロボット装置の典型的な構成例を示している。典型的な自律学習型ロボット装置1は、複数の動作ユニットにより構成されており、
図1の例では上肢動作ユニット2と下肢動作ユニット3が連結されて自律学習型ロボット装置1が構成されている。またこの例では上肢動作ユニット2として選択された動作ユニット2Aは、頭部と胴体と腕などから構成され、下肢動作ユニット3として選択された3Aは膝や足などから構成され、動作ユニット2Aと動作ユニット3Aを連結することにより、人型の自律学習型ロボット装置1を構成したものである。各動作ユニット2,3には、自律的に動作を生成するためのセンサや動作学習器を備えている。なお、動作ユニットを配置する部位の単位としては、頭部と胴体と腕などの単位ごとに設定することが可能であるが、ここでは上下肢の2つについて動作ユニットを配置した例を示している。
【0019】
図2は、自律学習型ロボット装置を構成する各動作ユニットの動作ユニット群を示す図である。上下肢の動作ユニット2,3は、自律学習型ロボット装置1の上下肢として果たすべき機能に応じて、幾つかの機能のものが適用可能である。例えば
図2に示すように、上肢動作ユニット2として、複数種類の動作ユニット2A、2B,2Cからなる上肢動作ユニット群2の中から1つの上肢動作ユニット2Aを選択し、下肢動作ユニット3として、複数種類の動作ユニット3A、3Bからなる下肢動作ユニット群3の中から1つの下肢動作ユニット3Aを選択して所定状態に連結することにより、自律学習型ロボット装置を構成することができる。このように、上下肢の2つの動作ユニットの組み合わせにより、多様な動作、多様な機能の自律学習型ロボット装置を実現することが可能である。
【0020】
そして自律学習型ロボット装置1においては、上肢動作ユニット2Aを交換する必要が生じた場合、上肢動作ユニット群2から例えば上肢動作ユニット2Bを選択し、現在連結されている上肢動作ユニット2Aと交換することにより、動作ユニットの変更が可能である。かくして、自律学習型ロボット装置の規模拡張性を実現することが可能である。
【0021】
次に、自律学習型ロボット装置の動作方法について説明する。
図2に示す上肢動作ユニット群2内の各動作ユニットは、上肢動作ユニットとして果たすべき動作機能である物体把持動作や、ドア開け動作などの複数の動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を上肢動作ユニット内の複数の動作学習器に備えている。また下肢動作ユニット群3内の各動作ユニットは、下肢動作ユニットとして果たすべき動作機能である目的地への移動や、障害物回避などの複数の動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を下肢動作ユニット内の複数の動作学習器に備えている。
【0022】
動作指示を与えられた各動作ユニットは、複数の動作学習器の中から動作指示に対応した動作学習器を選択し、センサ情報に基づいて自律的に動作することが可能である。例えば上肢動作ユニット2Aに対する動作指示が「ドア開け動作」である時、上肢動作ユニット2Aは複数の動作学習器の中から、「ドア開け動作」についての動作学習器を選択し、センサ情報に基づいて自律的に動作することができる。また同様にして、例えば下肢動作ユニット3Aに対する動作指示が「ドア通過動作」である時、下肢動作ユニット3Aは複数の動作学習器の中から、「ドア通過動作」についての動作学習器を選択し、センサ情報に基づいて自律的に動作することができる。
【0023】
しかしながら自律学習型ロボット装置1は、単純に上肢動作ユニット2Aと下肢動作ユニット3Aを連結しても、上肢動作「ドア開け」と下肢動作「ドア通過」を組み合わせた、「ドア開け通過動作」を生成することができない。
【0024】
このことから本発明では、各動作ユニットが連携動作できるように、各動作ユニットの動作タイミングを管理する統合モジュールを備えることで、各動作ユニット間の連携動作を実現している。
【0025】
図3は、各動作ユニットの動作タイミングを管理する統合モジュールを備えた複数動作ユニット統合装置の構成例を示している。
図3は、外部からの情報を基に動作する自律学習型ロボット装置を実現するための複数動作ユニット統合装置である。
【0026】
図3の複数動作ユニット統合装置は、複数の動作ユニットUN(UN1・・UNN)と統合モジュールMにより構成されている。複数の動作ユニットUNのうちUN1が例えば上肢動作ユニット2に対応し、UNNが例えば下肢動作ユニット3に対応している。また統合モジュールMは、自律学習型ロボット装置の適宜の場所に配置されている。統合モジュールMは、外部からの動作指示の情報OPに応じて各動作ユニットUN(UN1・・UNN)に動作タイミング信号T(T1・・TN)を送り、各動作ユニットUN(UN1・・UNN)からのセンサ情報S(S1・・SN)を受信、監視する。
【0027】
統合モジュールMは、ロボット装置の構成(例えば上下肢動作ユニット2,3の組み合わせ)と動作指示(例えば上下肢動作ユニット2,3の動作内容)ごとに複数の動作タイミング器MT(MT1・・MTm)を備え、動作指示に基づいて適切な動作タイミング器を選択する。動作タイミング器MTは、各動作ユニットUN(UN1・・UNN)のセンサ情報S(S1・・SN)に基づいて動作タイミング信号T(T1・・TN)を生成し、各動作ユニットUN(UN1・・UNN)に送出する。動作タイミング信号T(T1・・TN)とは、各動作ユニットUN(UN1・・UNN)の動作開始、動作終了のほかに、各動作ユニットの動作速度や動作停止、再開などを指示することが可能である。
【0028】
統合モジュールMの典型的な動作事例は、ロボット装置の構成が上下肢動作ユニット2A,3Aの組み合わせであり、外部からの動作指示の情報OPが「ドア開け通過動作」であるとき、この条件に適合する1つの動作タイミング器MTを選択し、動作ユニットUN1に対して上肢動作「ドア開け」の動作タイミング信号T1を送出し、動作ユニットUNNに対して下肢動作「ドア通過」の動作タイミング信号TNを送出するものである。また各動作のタイミングを定めるに当たり、動作ユニットUN1、UNNのセンサ情報S1、SNを参照し、センサ情報SNから例えば下肢動作ユニット3Aの立ち位置が、開放するドアとの関係で開放に支障のない位置であることを確認し、センサ情報S1から例えば上肢動作ユニット2Aが、ドアの開放に至るまでの一連の動作を支障なく行える位置関係にあることを確認して、各タイミングの送出とする。
【0029】
この統合モジュールMの機能は、与えられた一連の動作指示「ドア開け通過動作」を、動作ユニットごとの個別の動作指示「ドア開け」、「ドア通過」に分解して与えたものであり、分解された動作指示を請け負う個別の動作ユニットを指定したものということができる。
【0030】
他方動作ユニットUNについてみるとこれは、センサ10の他に複数の動作学習器12、記憶部13、複数の可動部11により構成されている。
【0031】
このうち複数の動作学習器12は、例えば上肢動作ユニットUN1(2)であれば、上肢動作ユニットとして果たすべき動作機能である物体把持動作や、ドア開け動作などの動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を動作学習器内に備えている。また下肢動作ユニットUN2(3)であれば、下肢動作ユニットとして果たすべき動作機能である目的地への移動や、障害物回避などの動作ごとに、これらの動作を円滑に実行させるためのプログラム及び学習機能を動作学習器内に備えている。可動部11は、例えば上肢であれば、頭部と胴体と腕などの間の上肢の主要な節である部分、さらには手を構成するための節ごとに適宜設けられている。
【0032】
動作ユニットUN(例えば上肢動作ユニットUN1)においては、統合モジュールMからの動作指示内容(例えばドア開け動作)についての動作タイミング信号Tに基づいて、複数の動作学習器12の中からドア開け動作に特化された動作学習器12を選択し、カメラ、ポテンショメータ、力覚センサ、触覚センサ等からなるセンサ10を介して得られたセンサ情報を用いて可動部11を動作させる。なお、ドア開け動作に特化された動作学習器12は、この動作を複数の可動部11の連係動作により実現するために、複数の各可動部11に対するブレークダウンされた個別の動作指示情報として与えている。また
図3には図示していないが、動作学習器12は制御信号を発生して駆動手段に与え、駆動手段により可動部11を操作している。また可動部11を操作する際に、適宜センサ10からのセンサ情報Sを帰還信号として用いて位置制御などに利用している。
【0033】
動作ユニットUNは単体で動作することが可能であるが、統合モジュールMからの動作タイミング信号Tと動作指示に基づいて動作することも可能である。
【0034】
これにより、例えば、ドア開け動作を学習した上肢動作ユニットUN1と、ドア通過動作を学習した下肢動作ユニットUNNから構成される自律学習型ロボット装置において、動作タイミング器MTが生成する動作タイミング信号Tに基づいて、各動作ユニットUN(UN1・・UNN)を動作させることで、下肢動作ユニットUNNがドアへ接近し、上肢動作ユニットUN1がドア開け動作を生成し、下肢動作ユニットUNNがドアを押し開けるといった、一連のドア開け通過動作を生成することが可能である。このように自律学習型ロボット装置1は、外部から与えられる動作指示OPとセンサ情報Sに基づいて、各動作ユニットを適切に動作することが可能である。
【0035】
次に、統合モジュールMの動作タイミング器MTにおける動作学習機能の獲得方法について説明する。動作タイミング器MTは、各動作ユニットUNのセンサ情報Sを基に、ロボット装置自身の試行錯誤により最適な動作タイミングを獲得する教師なし学習法や、人が自律学習型ロボット装置に動作タイミングを数パターン教示した際のセンサ情報Sを基に、ロボット装置が動作タイミングを学習により自己組織化する教師あり学習法などを用いることで、動作タイミングの学習を行う。
【0036】
いずれの手法も、所定の評価基準、例えば動作効率やエネルギー効率などに関して評価を行い、評価が高くなるように学習を行う。所定の基準に基づいて学習された動作タイミング器MTに、各動作ユニットUNのセンサ情報Sを入力することで、最適動作タイミングの生成を行う。
【0037】
以上の構成において、自律学習型ロボット装置1は、統合モジュールMにて、動作指示を実行し達成するために適した動作ユニットの動作タイミングを、動作タイミング器MTで学習し、生成することにより、自律学習型ロボット装置全体の最適動作の生成が可能になる。
【0038】
上記の実施例では、動作ユニットとして、上肢動作ユニット2と下肢動作ユニット3を用いたが、動作ユニットの単位を変更した例を
図4に示す。
図4は、自律学習型ロボット装置を構成する各動作ユニット群の変形例を示す図である。
図4においては、ロボットアーム動作ユニット10Aと、複数種類のハンド動作ユニット群11の中から、1つのハンド動作ユニット11Aを選択し、連結することにより自律学習型ロボットを構成したものである。
【0039】
また上記の実施例では、複数の動作ユニットUNと統合モジュールMを用いて1台の自律学習型ロボット装置を構成していたが、1台の自律学習型ロボット装置を1つの動作ユニットとすることで、複数の自律学習型ロボット装置と統合モジュールによるロボットシステムを構成しても良い。
【0040】
以上説明した本発明によれば、複数の動作ユニットと、動作ユニットの動作生成タイミングを学習・生成する統合モジュールにより構成された複数動作ユニット統合装置による自律学習型ロボット装置とすることで、ロボット装置の構成を変化させても動作を生成することが可能である。