特開2022-78002 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト　ボツシユ　ゲゼルシヤフト　ミツト　ベシユレンクテル　ハフツングの特許一覧

特開2022-78002ロボットデバイスを制御するための方法及びロボット制御装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022078002

(43)【公開日】2022-05-24

(54)【発明の名称】ロボットデバイスを制御するための方法及びロボット制御装置

(51)【国際特許分類】

B25J 9/16 20060101AFI20220517BHJP

【ＦＩ】

B25J9/16

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2021183865

(22)【出願日】2021-11-11

(31)【優先権主張番号】10 2020 214 231.9

(32)【優先日】2020-11-12

(33)【優先権主張国・地域又は機関】DE

(71)【出願人】

【識別番号】390023711

【氏名又は名称】ローベルトボツシユゲゼルシヤフトミツトベシユレンクテルハフツング

【氏名又は名称原語表記】ＲＯＢＥＲＴＢＯＳＣＨＧＭＢＨ

【住所又は居所原語表記】Ｓｔｕｔｔｇａｒｔ，Ｇｅｒｍａｎｙ

(74)【代理人】

【識別番号】100114890

【弁理士】

【氏名又は名称】アインゼル・フェリックス＝ラインハルト

(74)【代理人】

【識別番号】100098501

【弁理士】

【氏名又は名称】森田拓

(74)【代理人】

【識別番号】100116403

【弁理士】

【氏名又は名称】前川純一

(74)【代理人】

【識別番号】100134315

【弁理士】

【氏名又は名称】永島秀郎

(74)【代理人】

【識別番号】100162880

【弁理士】

【氏名又は名称】上島類

(72)【発明者】

【氏名】アンドラスガボールクプツィック

(72)【発明者】

【氏名】レオネールロツォ

(72)【発明者】

【氏名】メングオ

(72)【発明者】

【氏名】パトリックケスパー

(72)【発明者】

【氏名】フィリップクリスティアンシリンガー

【テーマコード（参考）】

3C707

【Ｆターム（参考）】

3C707BS10

3C707LS20

3C707LV19

3C707LW03

3C707LW08

3C707LW12

(57)【要約】

【課題】種々の実施形態により、ロボットデバイスを制御するための方法が記載される。
【解決手段】運動スキル及び動作プリミティブから実施すべきシーケンスを有する、ロボットによって実施されるべきタスクのためのフローチャートについて、複合的ロボット軌道モデルが運動スキルのロボット軌道モデルから生成され、ロボットが制御され、その際、フローチャートによる運動スキルの後で、１つ以上の動作プリミティブが次の運動スキルの前に実行される場合、複合的ロボット軌道モデルによるロボットの制御は、運動スキルの実施後に中断され、１つ以上の動作プリミティブが実行された後で、複合的ロボット軌道モデルによるロボットの制御が継続される。
【選択図】図６

【特許請求の範囲】

【請求項1】

ロボットデバイスを制御するための方法であって、
複数の運動スキルの各々を実施するためのデモンストレーションを提供するステップと、
前記デモンストレーションから各運動スキルのためのロボット軌道モデルを訓練するステップと、
ロボットによって実施されるべきタスクのためのフローチャートを受信するステップであって、前記フローチャートは、前記運動スキル及び動作プリミティブから実施すべきシーケンスを有する、ステップと、
前記動作プリミティブの省略により前記フローチャートから短縮されたフローチャートを特定するステップと、
２つの運動スキルが前記短縮されたフローチャートに従って順次連続して実施されるべき場合に、前記運動スキルのロボット軌道モデルをカスケードすることにより、前記短縮されたフローチャートのための前記運動スキルの前記ロボット軌道モデルから複合的ロボット軌道モデルを生成するステップと、
前記複合的ロボット軌道モデルによって前記ロボットを制御するステップと、
を含み、
前記フローチャートによる運動スキルの後で、１つ以上の動作プリミティブが次の運動スキルの前に実行される場合に、前記複合的ロボット軌道モデルによる前記ロボットの制御は、前記運動スキルの実施後に中断され、１つ以上の動作プリミティブが実行された後で、前記複合的ロボット軌道モデルによる前記ロボットの制御が継続される、方法。

【請求項2】

前記フローチャートにより１つ以上の動作プリミティブが運動スキルの後で実行される場合、前記複合的ロボット軌道モデルにおける、前記運動スキルの前記ロボット軌道モデルの最終状態である状態が識別され、前記ロボットの前記制御において前記複合的ロボット軌道モデルの前記状態に到達したときに、前記複合的ロボット軌道モデルによる前記ロボットの前記制御が中断され、１つ以上の動作プリミティブが実行された後で、前記複合的ロボット軌道モデルによる前記ロボットの前記制御が継続される、請求項１に記載の方法。

【請求項3】

前記ロボット軌道モデルの各運動スキルについて、１つ以上の初期状態と１つ以上の最終状態とを有する隠れ準マルコフモデルであり、
前記方法は、
前記運動スキルの前記ロボット軌道モデルの各初期状態について、前記運動スキルを実行する前のロボットコンフィギュレーションの確率分布を含む、前記デモンストレーションからの前記各運動スキルについての前提条件モデルと、
前記運動スキルの前記ロボット軌道モデルの各最終状態について、前記運動スキルを実行した後のロボットコンフィギュレーションの確率分布を含む、前記各運動スキルについての最終条件モデルと、
を訓練するステップをさらに含み、
前記複合的ロボット軌道モデルは、
－前記２つの運動スキルが短縮されたフローチャートに従って順次連続して実施されるべき場合には、
ｏ前記２つの運動スキルの軌道モデルの前記状態を、前記複合的ロボット軌道モデルに取り込むステップと、
ｏ前記２つの運動スキルの第１の運動スキルの軌道モデルの各最終状態と、前記２つの運動スキルの第２の運動スキルの軌道モデルの各初期状態との間の遷移確率を、前記第１の運動スキルの第１の状態に対する前記第１の運動スキルの最終条件モデルの確率分布と、前記第２の運動スキルの初期状態に対する前記第２の運動スキルの初期モデルの確率分布との間の類似性の関数として計算するステップとによる、
前記運動スキルの前記ロボット軌道モデルをカスケードするステップによって生成され、
－前記２つの運動スキルが前記フローチャートに従って互いに交互に実施されるべき場合には、
ｏ前記２つの運動スキルの軌道モデルの状態を前記複合的ロボット軌道モデルに取り込むステップと、
ｏ前記第１の運動スキルの状態と前記第２の運動スキルの状態との間の遷移確率をゼロに設定するステップとによる、
前記運動スキルの前記ロボット軌道モデルを組み合わせるステップによって生成される、請求項１又は２に記載の方法。

【請求項4】

前記各運動スキルは、前記ロボットによる１つ以上の物体の操作を含み、前記各運動スキルの前記隠れ準マルコフモデルは、前記運動スキルが適用されるロボット及び物体コンフィギュレーションに対応するタスクパラメータを有するタスクパラメータ化された隠れ準マルコフモデルである、請求項１に記載の方法。

【請求項5】

前記方法は、前記各運動スキルのための効果モデルを訓練するステップをさらに含み、前記効果モデルは、前記運動スキルの前記ロボット軌道モデルの各最終状態について、前記ロボット及び／又は物体コンフィギュレーションが前記運動スキルの実行後に、前記運動スキルが適用される初期のロボット及び／又は物体コンフィギュレーションに対してどのように変化したかの確率分布を含み、前記２つの運動スキルがタスク内において順次連続して実施されるべき場合には、前記運動スキルの前記ロボット軌道モデルをカスケードするステップは、前記第２の運動スキルのタスクパラメータ化された隠れ準マルコフモデルを変換するステップを含み、それにより、それらのタスクパラメータは、前記第１の運動スキルの前記効果モデルによって与えられたロボット及び／又は物体コンフィギュレーションに対応するタスクパラメータである、請求項４に記載の方法。

【請求項6】

前記複合的ロボット軌道モデルを生成するステップは、前記ロボット軌道モデル、カスケードされたロボット軌道モデル及び組み合わせられたロボット軌道モデルを繰り返しカスケードするステップと、前記ロボット軌道モデル、前記カスケードされたロボット軌道モデル及び前記組み合わせられたロボット軌道モデルをタスクに従って組み合わせるステップとを含み、それにより、前記複合的ロボット軌道モデルは、全タスクのための軌道モデルである、請求項１乃至５のいずれか一項に記載の方法。

【請求項7】

請求項１乃至６のいずれか一項に記載の方法を実施するように構成されているロボット制御装置。

【請求項8】

命令がプロセッサによって実行されるときに、前記プロセッサに請求項１乃至６のいずれか一項に記載の方法を実施させるための命令を含むコンピュータプログラム。

【請求項9】

命令がプロセッサによって実行されるときに、前記プロセッサに請求項１乃至６のいずれか一項に記載の方法を実施させるための命令が記憶されているコンピュータ可読記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、ロボットデバイスを制御するための方法及びロボット制御装置に関する。

【背景技術】

【0002】

ロボットによってタスクを実施するために、ユーザは、典型的には、種々の動作の実行を含み得るフローチャートを与える。これらの動作の多くは、ロボットによって提供される、制御状況に適合化させる必要のない「オープングリッパ」などのような動作プリミティブであるものとしてよい。ただし、動作は、ロボットがそれぞれの制御状況に適合化し得ることが望ましいタイプの運動スキルであるものとしてもよい。そのため、例えば、「物体をピックアップする」動作は、物体の初期位置と初期配向とに依存する。

【0003】

そのようなスキルのためにロボット軌道モデルを訓練することができる。例えば、L. Schwenkel、M. Guo及びM. Buergerらによる文献「Optimizing sequences of probabilistic manipulation skills learned from demonstration (Conference on Robot Learning, 2019)」（以下、参考文献［１］とも称する）には、各運動スキルが、種々のシナリオの下において独立して訓練され、何らかの特定のタスクに縛られていない方法が記載されている。

【先行技術文献】

【非特許文献】

【0004】

【非特許文献1】「Optimizing sequences of probabilistic manipulation skills learned from demonstration (Conference on Robot Learning, 2019)」 L. Schwenkel、M. Guo及びM. Buerger著

【発明の概要】

【発明が解決しようとする課題】

【0005】

ロボット（又は一般的にロボットデバイス）を制御するためのアプローチにおいては、ロボット軌道モデルが学習された動作プリミティブ及び運動スキルの両方を含むフローチャートの効率的な実装を可能にすることが望ましい。

【課題を解決するための手段】

【0006】

種々の実施形態によれば、ロボットデバイスを制御するための方法が提供され、この方法は、複数の運動スキルの各々を実施するためのデモンストレーションを提供するステップと、デモンストレーションから各運動スキルのためのロボット軌道モデルを訓練するステップと、ロボットデバイスによって実施されるべきタスクのためのフローチャートを受信するステップであって、フローチャートは、運動スキル及び動作プリミティブから実施すべきシーケンスを有する、ステップと、動作プリミティブの省略によりフローチャートから短縮されたフローチャートを特定するステップと、２つの運動スキルが短縮されたフローチャートに従って順次連続して実施されるべき場合に、運動スキルのロボット軌道モデルをカスケードすることにより、短縮されたフローチャートのための運動スキルのロボット軌道モデルから複合的ロボット軌道モデルを生成するステップと、複合的ロボット軌道モデルによってロボットを制御するステップとを含み、フローチャートによる運動スキルの後で、１つ以上の動作プリミティブが次の運動スキルの前に実行される場合、複合的ロボット軌道モデルによるロボットの制御は、運動スキルの実施後に中断され、１つ以上の動作プリミティブが実行された後で、複合的ロボット軌道モデルによるロボットの制御が継続される。

【0007】

さらなる実施形態によれば、上述の方法を実施するように構成されたロボット制御装置が提供される。

【0008】

上述したようなロボットデバイスを制御するための方法及びロボット制御装置は、デモンストレーションから学習した運動スキルも動作プリミティブも実行すべきタスクに対してロボットデバイスを効率的に制御することを可能にする。特に、それらの学習したロボット軌道モデルから複合的ロボット軌道モデルが形成される運動スキルが、動作プリミティブによって中断された場合においても、ロボットデバイスを複合的ロボット軌道モデルによって制御することが可能である。

【0009】

以下においては、種々の実施例が与えられる。

【0010】

実施例１は、上述したようなロボットデバイスを制御するための方法である。

【0011】

実施例２は、実施例１による方法であり、フローチャートに従って１つ以上の動作プリミティブが運動スキルに従って実行される場合、複合的ロボット軌道モデルにおける、運動スキルのロボット軌道モデルの最終状態である状態が識別され、ロボットの制御において複合的ロボット軌道モデルの状態に到達したときに、複合的ロボット軌道モデルによるロボットの制御が中断され、１つ以上の動作プリミティブが実行された後で、複合的ロボット軌道モデルによるロボットの制御が継続される。

【0012】

種々の運動スキルのロボット軌道モデルの最終状態に基づき動作プリミティブを挿入することにより、動作プリミティブが制御経過の適正な時点において実行されることが保証される。同様に、ロボットの位置を変更しない動作プリミティブの特性により、後続の運動スキルが複合的ロボット軌道モデルによって実行可能になることが保証される。

【0013】

実施例３は、実施例１又は２による方法であり、ロボット軌道モデルの各運動スキルについて、１つ以上の初期状態と１つ以上の最終状態とを有する隠れ準マルコフモデルであり、この方法は、
運動スキルのロボット軌道モデルの各初期状態について、運動スキルを実行する前のロボットコンフィギュレーションの確率分布を含む、デモンストレーションからの各運動スキルについての前提条件モデルと、
運動スキルのロボット軌道モデルの各最終状態について、運動スキルを実行した後のロボットコンフィギュレーションの確率分布を含む、各運動スキルについての最終条件モデルと、
を訓練するステップをさらに含み、複合的ロボット軌道モデルは、
－２つの運動スキルが短縮されたフローチャートに従って順次連続して実施されるべき場合には、
ｏ２つの運動スキルの軌道モデルの状態を、複合的ロボット軌道モデルに取り込むステップと、
ｏ２つの運動スキルの第１の運動スキルの軌道モデルの各最終状態と、２つの運動スキルの第２の運動スキルの軌道モデルの各初期状態との間の遷移確率を、第１の運動スキルの第１の状態に対する第１の運動スキルの最終条件モデルの確率分布と、第２の運動スキルの初期状態に対する第２の運動スキルの初期モデルの確率分布との間の類似性の関数として計算するステップとによる、
運動スキルのロボット軌道モデルをカスケードするステップによって生成され、
－２つの運動スキルがフローチャートに従って互いに交互に実施されるべき場合には、
ｏ２つの運動スキルの軌道モデルの状態を複合的ロボット軌道モデルに取り込むステップと、
ｏ第１の運動スキルの状態と第２の運動スキルの状態との間の遷移確率をゼロに設定するステップとによる、
運動スキルのロボット軌道モデルを組み合わせるステップによって生成される。

【0014】

これにより、運動スキルのロボット軌道モデルの適正な自動複合化が可能になる。

【0015】

実施例４は、実施例１による方法であり、各運動スキルは、ロボットによる１つ以上の物体の操作を含み、各運動スキルの隠れ準マルコフモデルは、運動スキルが適用されるロボット及び物体コンフィギュレーションに対応するタスクパラメータを有するタスクパラメータ化された隠れ準マルコフモデルである。

【0016】

それにより、種々の実施形態は、１つ以上の物体を取り扱うためのロボットデバイスの効率的な訓練及び効率的な制御を可能にする。

【0017】

実施例５は、実施例４による方法であり、この方法は、各運動スキルのための効果モデルを訓練するステップをさらに含み、この効果モデルは、運動スキルのロボット軌道モデルの各最終状態について、ロボット及び／又は物体コンフィギュレーションが運動スキルの実行後に、運動スキルが適用される初期のロボット及び／又は物体コンフィギュレーションに対してどのように変化したかの確率分布を含み、２つの運動スキルがタスク内において順次連続して実施されるべき場合には、運動スキルのロボット軌道モデルをカスケードするステップは、第２の運動スキルのタスクパラメータ化された隠れ準マルコフモデルを変換するステップを含み、それにより、それらのタスクパラメータは、第１の運動スキルの効果モデルによって与えられたロボット及び／又は物体コンフィギュレーションに対応するタスクパラメータである。

【0018】

それにより、制御軌道が、運動スキルのシーケンスを介して適正に計算されることが保証される。

【0019】

実施例６は、実施例１から５までのいずれか１つによる方法であり、複合的ロボット軌道モデルを生成するステップは、ロボット軌道モデル、カスケードされたロボット軌道モデル及び組み合わせられたロボット軌道モデルを繰り返しカスケードするステップと、ロボット軌道モデル、カスケードされたロボット軌道モデル及び組み合わせられたロボット軌道モデルをタスクに従って組み合わせるステップとを含み、それにより、複合的ロボット軌道モデルは、全タスクのための軌道モデルである。

【0020】

従って、複雑なタスクのための複合的モデルを繰り返し決定することができ、複雑なタスクに対する堅牢性を保証し、分岐条件の複雑な階層を定義する必要性から操作者を解放する。

【0021】

実施例７は、実施例１から６までのいずれか１つによる方法を実施するように構成されたロボット制御装置である。

【0022】

実施例８は、命令がプロセッサによって実行されるときに、プロセッサに実施例１から６までのいずれか１つによる方法を実施させるための命令を含むコンピュータプログラムである。

【0023】

実施例９は、命令がプロセッサによって実行されるときに、プロセッサに実施例１から６までのいずれか１つによる方法を実施させるための命令を記憶しているコンピュータ可読記憶媒体である。

【0024】

図面において、同一の参照符号は、一般に、種々の図面全体を通して同一の部品を表している。これらの図面は、必ずしも縮尺通りではないが、その代わりにここでは、本発明の原理を一般的に表すことに重点が置かれている。以下の明細書においては、種々の態様を以下の図面を参照して説明する。

【図面の簡単な説明】

【0025】

【図1】ロボットを示した図である。

【図2】運動スキルのシーケンスを伴う操作タスクを示すフローチャートである。

【図3】一実施形態によるロボットデバイスを制御するための方法を示すフローチャートである。

【図4】連続して実行されるべき運動スキルのロボット軌道モデルを、複合的ロボット軌道モデルにカスケードするためのカスケード操作を示した図である。

【図5】分岐において（即ち、代替的に）実行されるべき運動スキルのロボット軌道モデルを、複合的ロボット軌道モデルに組み合わせるための組合せ操作を示した図である。

【図6】一実施形態によるロボットデバイスを制御するための方法を示すフローチャートである。

【発明を実施するための形態】

【0026】

以下の詳細な説明は、説明のために、本開示の特定の詳細及び本発明を実施することができる態様を示す添付の図面を参照している。また、本発明の保護範囲から逸脱することなく、他の態様を使用したり、構造的、論理的及び電気的な変更を実施したりすることができる。本開示のいくつかの態様は、新たな態様を構成するために本開示の１つ以上の他の態様と組み合わせることができるので、本開示の種々の態様は、必ずしも相互に排他的なものではない。

【0027】

以下においては、種々の例をより詳細に説明する。

【0028】

図１は、ロボット１００を示している。

【0029】

ロボット１００は、ロボットアーム１０１、例えば、ワーク（又は１つ以上の他の物体）を操作したり、取り付けたりするための産業用ロボットアームを含む。このロボットアーム１０１は、マニピュレータ１０２，１０３，１０４と、これらのマニピュレータ１０２，１０３，１０４が支持されている基台（又は支持台）１０５とを含む。「マニピュレータ」という用語は、それらの操作が例えばタスクを実行するために周辺環境との物理的な相互作用を可能にするロボットアーム１０１の可動要素に関連する。制御のために、ロボット１００は、周辺環境との相互作用を制御プログラムに従って実施するように構成された（ロボット）制御装置１０６を含む。マニピュレータ１０２，１０３，１０４の最後の要素１０４（支持台１０５から最も遠い）は、エンドエフェクタ１０４とも称され、例えば、溶接トーチ、把持具、塗装具などの１つ以上のツールを含み得る。

【0030】

（支持台１０５に近い）他のマニピュレータ１０２，１０３は、位置決め装置を構成し得るものであり、それにより、エンドエフェクタ１０４と合わせて、ロボットアーム１０１は、その端部にエンドエフェクタ１０４を備えている。ロボットアーム１０１は、（場合によってはその手先に工具を持った）人間の腕と同様の機能を満たすことができる機械的なアームである。

【0031】

ロボットアーム１０１は、マニピュレータ１０２，１０３，１０４を相互に接続し、さらに支持台１０５に接続する関節要素１０７，１０８，１０９を含み得る。関節要素１０７，１０８，１０９は、１つ以上の関節を含み得るものであり、それらの各々は、関連するマニピュレータの相互に対する回転可能な運動（即ち、回転運動）及び／又は並進運動（即ち、シフト）を提供することができる。マニピュレータ１０２，１０３，１０４の運動は、制御装置１０６によって制御されるアクチュエータを用いて開始することができる。

【0032】

「アクチュエータ」という用語は、駆動されることに応じて機構やプロセスに作用を与えるように設計されたコンポーネントとして理解することができる。アクチュエータは、制御装置１０６によって出力された命令（いわゆる起動）を機械的な運動に置き換えることができる。例えば、電気機械式変換器などのアクチュエータは、その起動に応じて電気エネルギーを機械エネルギーに変換するように構成されるものとしてもよい。

【0033】

「制御装置」という用語は、エンティティを実装する何らかのタイプの論理回路として理解することができ、これは、例えば、記憶媒体に記憶されたソフトウェアを実行し得る回路及び／又はプロセッサ、ファームウェア、又は、それらの組合せを含み得るものであり、例えば、本例においては、アクチュエータに命令を出力することができる。制御装置は、例えば、ロボット装置の動作を制御するためにプログラムコード（例えば、ソフトウェア）によって構成されるものとしてもよい。

【0034】

本例においては、制御装置１０６は、１つ以上のプロセッサ１１０と、コード及びデータを格納したメモリ１１１とを含み、これらのコード及びデータに基づいて、プロセッサ１１０はロボットアーム１０１を制御する。種々の実施形態によれば、制御装置１０６は、メモリ１１１に格納された統計モデル１１２に基づいて、ロボットアーム１０１を制御する。ロボット１００は、例えば、物体１１３を操作するものである。

【0035】

各時点において、ロボットアーム１０１と、操作すべき物体１１３（又はその他の物体）とからなるシステム全体は、位置、向き、エンドエフェクタ状態（グリッパの開閉）などに関して特定の状態にある。システム、ロボット又は物体のこの状態は、制御時に現れる統計モデルの状態との混同を回避するために、以下においては「（システム／ロボット／オブジェクト）コンフィギュレーション」と称する。

【0036】

ロボット１００は、タスクを実行することを学習したり、人間のパートナーと協働することを学習したりするために、デモンストレーションから学習する方法（ＬｆＤ）を利用することができる。人間のデモンストレーションは、ロボットのためのタスクの基準プランを表す確率論モデル１１２（統計モデルとも称される）によって符号化することができる。引き続き、制御装置１０６は、所望のロボットの運動を、場合によっては、人間のパートナーと周辺環境の両方のコンフィギュレーションの関数として生成するために、ロボット軌道モデルとも称される統計モデル１１２を使用することができる。

【0037】

ＬｆＤの基本的考察は、例えばＧＭＭのような予め定められた運動スキルモデルを、複数のデモンストレーションに適合化させることにある。Ｍ個のデモンストレーションが存在すると仮定するならば、それらの各々は、Ｎ＝Σ_ｍＴ_ｍの総観測量

【数1】

のデータセットに対してＴ_ｍのデータ点を含む。ただし、

【数2】

である。また、同様のデモンストレーションがＰ個の種々の座標系（タスクパラメータによって与えられる対象物体の局所的座標系や参照フレームなど）の観点から記録されることも想定される。そのようなデータを得るための通常の方法は、静的なグローバル参照フレームから参照フレームｐへのデモンストレーションを、以下の式、

【数3】

によって変換することにある。ここで、

【数4】

は、グローバル座標系（即ち、グローバル参照フレーム）に関する（局所的）参照フレームｐの並進及び回転である。従って、ＴＰ－ＧＭＭは、モデルパラメータ

【数5】

によって記述される、ここで、Ｋは、混合モデル内のガウス成分の数であり、π_ｋは、各成分の事前確率であり、

【数6】

は、参照フレームｐ内のｋ番目のガウス成分のパラメータである。

【0038】

標準的なＧＭＭとは異なり、上記の混合モデルは、各参照フレームに対して独立して学習することはできない。実際、混合係数π_ｋは、すべての参照フレームによって分けられ、参照フレームｐのｋ番目の成分は、グローバル参照フレームの対応するｋ番目の成分にマッピングされなければならない。期待値最大化（ＥＭ）は、そのようなモデルを学習するために確立された手法である。

【0039】

それが学習されるとただちに、ＴＰ－ＧＭＭは、実行中に学習した運動スキルのための軌道を再現するために使用することができる。詳細には、観測された参照フレーム

【数7】

を考慮して、学習したＴＰ－ＧＭＭは、以下のように、異なる参照フレーム上においてアフィン変換されたガウス成分を乗算することにより、パラメータ

【数8】

を有する単一のＧＭＭに変換される。即ち、

【数9】

ここで、各参照フレームｐにおける更新されたガウスベルのパラメータは、次のように計算される。即ち、

【数10】

タスクのパラメータは、時間に関して変化する可能性があるが、表記上、時間指標は省略している。

【0040】

隠れ準マルコフモデル（ＨＳＭＭ）は、標準的な隠れマルコフモデル（ＨＭＭ）を、基礎となる確率過程の時間情報の埋め込みによって拡張したものである。即ち、ＨＭＭにおいては、基礎となる隠れプロセスがマルコフと想定される、即ち、次の状態への遷移確率は現在の状態にのみ依存すると想定されるが、ＨＳＭＭにおいては、状態プロセスが準マルコフであると想定される。このことは、次の状態への遷移が現在の状態だけでなく、その状態になってからの経過時間にも依存することを意味する。これらは、デモンストレーションの時空間的特徴を学習するために、ロボット運動スキル符号化のためのＴＰ－ＧＭＭとの組合せに適用することができる。タスクパラメータ化されたＨＳＭＭモデル（ＴＰ－ＨＳＭＭモデル）は次のように定義される。即ち、

【数11】

ここで、ａ_ｈｋは、状態ｈからｋへの遷移確率であり、

【数12】

は、状態ｋの持続時間についてのガウス分布、即ち、特定の数の順次連続したステップの間、状態ｋに留まる確率を記述し、

【数13】

は、先に述べたＴＰ－ＧＭＭと同様に、状態ｋに対応する観測確率を表している。ここでは、状態数が、「連結された」ＴＰ－ＧＭＭにおけるガウス成分の数を表していることに留意されたい。

【0041】

観測されたデータ点

【数14】

の特定の（部分的な）シーケンスを考慮して、Θの関連する状態シーケンスは、ｓ_ｔ＝ｓ_１ｓ_２…ｓ_ｔによって与えられると仮定する必要がある。データ点ξ_ｔが状態ｋに属する確率（即ち、ｓ_ｔ＝ｋ）は、順方向変数

【数15】

によって与えられる。即ち、

【数16】

ここで、

【数17】

は放出確率であり、

【数18】

は、タスクパラメータを考慮して式（１）から導出される。さらに、Ｔ_ｍまでの将来のステップを予測するために、再現中は同一の順方向変数を使用することもできる。

【0042】

しかしながら、この場合、将来の観測値は利用することができないため、遷移及び持続時間情報のみが使用される。即ち、式（２）においてすべてのｋ及びｌ＞ｔに対して

【数19】

と設定する。最後に、最尤状態シーケンス

【数20】

が、

【数21】

の選択によって決定される。

【0043】

ここで、ロボット状態の所望の最終観測が、ξ_Ｔとして与えられると仮定するならば、この場合、Ｔは、運動スキルの計画対象期間（例えば、デモンストレーションの平均的な長さ）である。その上さらに、ロボットの初期状態は、ξ_１として観測される。学習したモデルΘａを考慮した運動スキルの実行（運動スキル再現）に対しては、ξ_１及びξ_Ｔのみを考慮した最尤状態シーケンス

【数22】

のみが構築される。

【0044】

順方向変数を使用した再現は、この場合、直接行うことはできない。なぜなら、式（２）の順方向変数は、境界の最尤状態のシーケンスを計算するのに対して、ここで望まれるのは、ξ_１及びξ_Ｔを考慮した共通の最尤状態シーケンスだからである。従って、式（２）を使用する場合、返されるシーケンス

【数23】

が、デモンストレーションの時空間パターンと最終観測値の両方に対応するという保証はない。物体をピックアップする例に関しては、所望の最終コンフィギュレーションが、物体の上面にエンドエフェクタが存在することであっても、「側方からのピックアップ」に対応する最尤シーケンスを返すことができる。

【0045】

この問題を克服するために、一実施形態によれば、ビタビアルゴリズムの修正が使用される。古典的なビタビアルゴリズムは、ＨＭＭにおいて、観測された事象の所与の流れにつながる最尤状態シーケンス（ビタビパスとも称される）を見出すために使用することができる。一実施形態によれば、主に２つの観点、即ち、（ａ）ＨＭＭではなくＨＳＭＭにおいて動作することと、さらに重要なこととして（ｂ）最初と最後を除くほとんどの観測値が欠落していることとによって、それとは異なる方法が使用される。特に、観測がない場合、ビタビアルゴリズムは以下のようになる。即ち、

【数24】

ここで、

【数25】

は、状態ｊの持続確率であり、δ_ｔ（ｊ）は、システムが時点ｔで状態ｊにあり、ｔ＋１で状態ｊにない確率であり、さらに、

【数26】

ここで、

【数27】

は、ξ_ｔを考慮した式（１）のΘ_ａにおけるグローバルガウス成分ｊである。詳細には、各時点ｔ及び各状態ｊについて、式δ_ｔ（ｊ）を最大化する２つの引数が記録され、最尤状態シーケンス

【数28】

を見出すために、単純なトレースバック手順が使用される。換言すれば、上記のアルゴリズムは、ξ_１を起点として、最終的な観測値ξ_Ｔが生じる運動スキルａについての最尤シーケンス

【数29】

を導出する。

【0046】

ロボットのタスク空間が、エンドエフェクタの時間的に変化する姿勢（位置及び向き）によって表される場合、古典的なユークリッドに基づく手法は、そのようなデータの処理には適していない。それゆえ、種々の実施形態によれば、ロボットタスク空間は、リーマン多様体Ｍを備えている。多様体Ｍにおける各点ｘには、接線空間Ｔ_ｘＭが存在する。これにより、多様体の制約との幾何学的一貫性を保ちながらユークリッド演算を局所的に実行することができる。

【0047】

指数写像及び対数写像は、Ｔ_ｘＭとＭとの間の点をマッピングするために使用することができる。指数写像Ｅｘｐ_ｘ：Ｔ_ｘＭ→Ｍは、点ｘの接線空間内の点を、測地線距離を維持したまま多様体上の点にマッピングする。その逆の演算は、対数写像Ｌｏｇ_ｘ：Ｍ→Ｔ_ｘＭと称する。他の有用な演算には、平行移動

【数30】

があり、これは、要素を接線空間の間において歪みを生じさせることなく移動させるものである。上述した演算の正確な形態は、多様体に割り当てられるリーマンメトリックに依存する。種々の実施形態によれば、リーマン多様体は、観測された運動のパターンを符号化し、タスクプラン（例えば、順次連続する運動スキル）に対応する制御動作を最適なリーマン制御装置を使用して呼び出すリーマン正規分布を使用してＭに関する統計量を適正に計算するために使用される。

【0048】

以下の説明においては、例として複数の自由度を有するロボットアーム１０１を観測する。このロボットアーム１０１のエンドエフェクタ１０４は、以下の状態

【数31】

（これはカルテシアン位置、オリエンテーションクオータニオン、グリッパコンフィギュレーションを記述する）を有し、静的で既知の作業空間内において動作する。アーム１０１の到達範囲内には、Ｏ＝｛ｏ_１，ｏ_２，…ｏ_Ｊ｝により表される対象物体も存在し、これらの各々は、以下のコンフィギュレーション

【数32】

を有している。簡単化のために、システム全体のコンフィギュレーションを、

【数33】

により表す。

【0049】

そのようなシナリオにおいては、人間のユーザは、特定の運動スキルに従って１つ以上の物体を操作するために、アームに対して複数の運動的デモンストレーションを実施する。デモンストレーションされた運動スキルセットは、Ａ＝｛ａ_１，ａ_２，…ａ_Ｈ｝により表される。その上さらに、運動スキルａ∈Ａについて、関係する物体のセットはＯ_ａによって与えられ、利用可能なデモンストレーションのセットはＤ_ａにより表す。すべてのデモンストレーションは、上記で述べた物体固定構造に従っていることに留意すべきであり、即ち、それらは通常Ｏ_ａの物体に割り当てられた複数の参照フレームに対して（即ち、複数の参照フレームの観点から）記録され、これは、多くの場合、作業空間内の物体の姿勢を表す。「ジャーナルをシリンダに挿入する」という運動スキルには、例えば、物体「ジャーナル」と「シリンダ」とが含まれ、関連するデモンストレーションにおいては、ロボット参照フレーム、「ジャーナル」参照フレームも、「シリンダ」参照フレームも記録される。

【0050】

以下において観測する（操作）タスクは、デモンストレーションされた運動スキルＡから選択された運動スキルのシーケンスａ^＊からなる。挿入タスクには、例えば、「キャップのピックアップ、キャップの向きの変更、キャップの新たなピックアップ及びキャップの挿入」などが含まれる。タスクの最後においては、ロボット及び物体を含めたシステムの所望の最終コンフィギュレーションとしての目標コンフィギュレーションＧに到達する。

【0051】

工場で操作タスクを整理する手法では、ダイアグラムやフローチャートを介するのが一般的である。それらは通常、ＧＵＩ（グラフィカルユーザインタフェース）の中においてドラッグ＆ドロップを介して定義される。

【0052】

図２は、運動スキルを用いた操作タスクを順次連続して示したフローチャート（又はタスクダイアグラム）２００である。

【0053】

操作タスクは、一連の運動スキル２０１乃至２０９からなり、この場合、各スキルは、上述したようなデモンストレーションから学習した運動スキルａ∈Ａ、即ち、ＨＳＭＭで学習した運動スキルであり、又は、予め定められた動作プリミティブ（例えば、グリッパ命令）である。例えば、操作タスクは、キャップを差し込むためのタスクであり、以下のもの、即ち、
－キャップを位置特定する（動作プリミティブ）２０１
－グリッパをピックアップ位置に運ぶ（運動スキル）２０２
－グリッパを閉じる（動作プリミティブ）２０３
－グリッパ（ひいてはキャップ）の向きを変更する（運動スキル）２０４
－グリッパを開く（動作プリミティブ）２０５
－グリッパを再びピックアップ位置に運ぶ（運動スキル）２０６
－グリッパを閉じる（動作プリミティブ）２０７
－キャップを挿入する（運動スキル）２０８
－グリッパを開く（動作プリミティブ）２０９
を含む。

【0054】

グリッパを閉じる動作２０３，２０７、グリッパを開く動作２０５，２０９、及び、キャップを位置特定する動作２０１は、例えば６Ｄポーズ推定（キャップを位置特定する２０１）を含む予め定められた動作プリミティブであり、それに対して、他の動作は、上述したモデルのようにデモンストレーションから学習する学習型運動スキルである。

【0055】

フローチャートは、分岐を有する可能性もある。例えば、「物体を上からピックアップするための位置にグリッパを運ぶ」、「物体を左からピックアップするための位置にグリッパを運ぶ」又は「物体を右からピックアップするための位置にグリッパを運ぶ」といった運動スキルは、物体の初期コンフィギュレーションに依存して実行することができる。この意味においては、フローチャートは、種々の分岐から生じる（従って、どの分岐条件がそれぞれの制御状況を満たしているかに基づいて）、実施すべき運動スキル及び動作プリミティブの複数のシーケンスを示すことができる。

【0056】

このことは、ロボットが、運動スキルのセット（事前プログラミングされた動作プリミティブやデモンストレーションを通じて学習した運動スキル）を事前にインストールすることができることを意味し、特定の操作タスクについては、操作者がマニュアル（手動）により、当該タスクの実施を説明するダイアグラム（例えば、図２のフローチャートなど）を構築する。その場合、これらのモジュールは、学習した運動スキルのセットや動作プリミティブである。

【0057】

図３は、一実施形態によるロボットデバイスを制御するための方法を表すフローチャートを示している。

【0058】

３０１においては、運動スキルのデモンストレーションが実施される。

【0059】

これらの運動スキルには、少なくとも、フローチャート３０３によって与えられたタスクの実行のために必要とされる運動スキルが含まれる。フローチャート３０３は、図２を参照して上述したように、運動スキルに加えて動作プリミティブも有している。

【0060】

前述したように、デモンストレーションされた運動スキルａ∈Ａについては、利用可能なデモンストレーションのセットが、Ｐ個の参照フレームに記録されている以下の式

【数34】

によって与えられる。そのような参照フレームは、Ｏ_ａの物体に直接結びついている点に留意されたい。

【0061】

３０２においては、ロボット軌道モデル（「ロボット挙動モデル」とも称される）が、各運動スキルについて学習される。

【0062】

上述したように、例えば、適正に選択されたコンポーネントの数Ｋを考慮して、運動スキルａに関する軌道の時空間的特徴を抽象化するＴＰ－ＨＳＭＭモデルΘ_ａは、ＥＭ（期待値最大化）タイプによるアルゴリズムを使用して学習することができる。

【0063】

３０４においては、複合的ロボット軌道モデルが、３０２で学習したロボット軌道モデルから生成される。

【0064】

この目的のために、３０４においては、（動作プリミティブを除く）運動スキルが、フローチャートから取り出されている。図２の例においては、このことは、複合的ロボット軌道モデルが、以下の運動スキルのシーケンス、即ち、
－グリッパをピックアップ位置に運ぶ２０２
－グリッパの向きを変更する２０４
－グリッパを再びピックアップ位置に運ぶ２０６
－キャップを挿入する（運動スキル）２０８
について生成されることを意味する。

【0065】

種々の運動スキルの軌道モデルから複合的ロボット軌道モデルを生成することができるようにするために、各運動スキルについての学習には、軌道モデルの学習の他に、さらに前提条件モデル、最終条件モデル及び効果モデルの学習も含まれる。これらのモデルを使用して、複合的ロボット軌道モデル３０５は、フローチャート３０３によって確定されたタスクの運動部分（即ち、動作プリミティブを除く運動スキルのシーケンス）について構築される。明確に言えば、前提条件モデルは、運動スキルを実行する前のシステムがいかにあるべきかをカプセル化したものであり、それに対して、効果モデル及び最終条件モデルは、運動スキルを実行した後のシステムがいかに変更されるべきかをカプセル化したものである。これらのモデルは、複合的ロボット軌道モデルを計算するための重要な部分である。なぜなら、それらは、運動スキル間の互換性を測定し、システムコンフィギュレーション（即ち、ロボット及び関与する物体のコンフィギュレーション）の進化に追従するからである。なお、「運動スキルモデル」という用語は、それぞれの運動スキルについてのロボット軌道モデル、前提条件モデル、最終条件モデル及び効果モデルを含むという解釈が可能である点に留意されたい。

【0066】

図２を参照して説明したように、タスクは、運動スキルを分岐して（即ち、交互に）実行すること、及び、順次連続して実行することを含み得る。

【0067】

従って、複合的モデルの生成は、運動スキルを順次連続して組み合わせる組合せ演算と、運動スキルを並列に組み合わせる演算とを再帰的に適用することを含む。

【0068】

図４は、順次連続して実行されるべき運動スキル４０１，４０２，４０３のロボット軌道モデルを、複合的ロボット軌道モデル４０４にカスケードするためのカスケード演算を示している。

【0069】

図５は、分岐して（即ち、交互に）実行されるべき運動スキル５０１，５０２，５０３，５０４のロボット軌道モデルを、複合的ロボット軌道モデル５０５に組み合わせるための組合せ演算を示している。

【0070】

図４に示されるように、運動スキルのシーケンスをカスケードするための組合せ演算は、順次連続して実行されるべき２つの運動スキルをカスケードするための演算の１つ以上の適用を含む。同様に、図５に示されるように、運動スキルのシーケンスを組み合わせるための組合せ演算は、分岐して実行されるべき２つの運動スキルを組み合わせるための演算の１つ以上の適用を含む。

【0071】

順次連続して実行されるべき２つの運動スキルの組合せについては、２つの運動スキルの軌道モデルが、以下のように複合的軌道モデルにカスケードされる。

【0072】

順次連続した２つの運動スキルの２つのＴＰ－ＨＳＭＭ

【数35】

及び

【数36】

を考慮して、それらを

【数37】

にカスケードするための演算はアルゴリズム１に要約されている。

【0073】

【数38】

【0074】

アルゴリズム１の３行目の計算及び４行目の更新は、以下において与えられる式（４）又は式（５）に従って実施することができる点に留意されたい。

【0075】

重要な認識は、同一のモデル

【数39】

は、当該モデル

【数40】

がカスケードされるモデル

【数41】

の最終成分（即ち、ＨＳＭＭの状態）に依存して異なって更新されることに見出すことができる。この根拠は、各最終成分が、ａ_１の実行後に

【数42】

のタスクパラメータの種々の変換を符号化することにあり、このことも、

【数43】

の成分を更新する種々の方法につながる。従って、複合的モデル

【数44】

は、Ｋ_１＋Ｋ_１，ｆ・Ｋ_２のサイズを有し、ここで、Ｋ_１及びＫ_２は、

【数45】

又は

【数46】

の成分の数であり、それに対して、Ｋ_１，ｆは、

【数47】

の最終成分の数である。特に、アルゴリズム２は、２つの主要な演算からなる。即ち、
（ａ）

【数48】

の各最終成分から

【数49】

の各初期成分への遷移確率を計算すること、
（ｂ）

【数50】

がカスケードされた

【数51】

の各最終成分について、

【数52】

の全成分を変更することからなる。

【0076】

一実施形態によれば、文献［１］に記載されているように前提条件モデルと効果モデルとが使用される。特に、

【数53】

により表される学習した前提条件モデルは、初期ロボットコンフィギュレーション（例えば、ロボットの初期位置及び／又は姿勢）に対するＴＰ－ＧＭＭ、即ち、

【数54】

を含み、ここで、Ｐ_１，ａは、初期システムコンフィギュレーション（即ち、ロボット及び／又は物体の初期コンフィギュレーション（例えば、位置及び／又は姿勢）から導出されるタスクパラメータの選択されたセットである。その他に、本明細書においては、

【数55】

により表され、

【数56】

と同様の方法により学習されるが、最終的なコンフィギュレーションについての最終条件モデル、即ち、

【数57】

が導入され、ここで、Ｐ_Ｔ，ａは、最終システムコンフィギュレーションから導出された参照フレームの選択されたセットである。簡単に言うと、

【数58】

は、運動スキルａを実行する前の初期コンフィギュレーションをモデル化し、それに対して、

【数59】

は、その後の最終コンフィギュレーションをモデル化する。
さらに、

【数60】

により表される学習した効果モデルは、予測された最終システムコンフィギュレーションに対するＴＰ－ＧＭＭ、即ち、

【数61】

を含み、ここで、Ｐ_１，ａは、

【数62】

で定義されている。これらの３つのモデルは、

【数63】

のタスクパラメータが（ａの実行後の）最終システムコンフィギュレーションから計算されるのに対して、

【数64】

及び

【数65】

のタスクパラメータは、（ａの実行前の）初期システムコンフィギュレーションから抽出される点において異なっている。ここでは、

【数66】

と記述される。

【0077】

次いで、

【数67】

の最終成分ｋ_ｆから

【数68】

の初期成分ｋ_ｉへの遷移確率は以下のとおりである。即ち、

【数69】

ここで、ＫＬ（・｜｜・）は、ＫＬダイバージェンス（Kullback-Leibler divergence）であり、

【数70】

は、参照フレームｐの成分ｋ_ｆに対応付けられたＧＭＭであり、

【数71】

は、参照フレームｐの成分ｋ_ｉに対応付けられたＧＭＭであり、

【数72】

は、これらの２つのモデルによって分けられ、常にグローバルな参照フレームを追加することにより、強制的に空でない状態にすることができる共通の参照フレームのセットである。このプロセスは、

【数73】

の最終成分及び

【数74】

の初期成分のすべての対について繰り返される。なお、

【数75】

の何らかの最終成分の初期確率は、正規化されるべきである点に留意されたい。

【0078】

【数76】

の最終成分ｋ_ｆを考慮して、

【数77】

の各成分ｋは、以下のようにアフィン変換されるべきである。

【数78】

ここで、演算

【数79】

は、式（１）と同様の演算として定義され、

【数80】

は、

【数81】

の平均値から算出されるタスクパラメータであり、ここで、ｏは、

【数82】

の古い参照フレームｐに対応付けられた物体であり、

【数83】

は、

【数84】

の新しい参照フレームである。参照フレームの変更は、

【数85】

のすべての成分を、

【数86】

の初期システムコンフィギュレーションを考慮して直接計算するために重要である点に留意されたい。

【数87】

の各成分についても、

【数88】

に基づく参照フレームの変更により同様のプロセスが適用される。

【0079】

最後に、アルゴリズム１により示されるように、

【数89】

の他のモデルパラメータ、例えば、持続確率、初期分布、最終分布などは、

【数90】

及び

【数91】

をわずかに変更するだけで簡単に確定される。

【数92】

の持続確率は、例えば、ｋ_ｆ個の複数のコピーに複製され、初期分布

【数93】

はゼロに設定される。なぜなら、

【数94】

の初期状態は、第１のモデルの状態

【数95】

に対応しているからである。

【数96】

の最終成分は、除去される。なぜなら、

【数97】

の最終状態が、ここでは、その複数の事例で更新された

【数98】

の最終成分だからである。

【0080】

並列に実行されるべき２つの運動スキルの組合せにおいては、２つの運動スキルの軌道モデルが、以下のように複合的軌道モデルに組み合わせられる。

【0081】

２つの運動スキルの２つのＴＰ－ＨＳＭＭ

【数99】

及び

【数100】

は、並列に観測されるべきであり、それらを

【数101】

に組み合わせるための演算はアルゴリズム２に要約されている。

【0082】

【数102】

【0083】

アルゴリズム２は、２つの部分からなり、一方は、複合的ＴＰ－ＨＳＭＭモデル

【数103】

を計算する部分であり、他方は、複合的ＴＰＧＭＭモデル

【数104】

を計算する部分である。第１の最も重要なステップは、Θ_２の成分インデックスをΘ_１の成分の総数によって更新することである。これにより、同一のインデックスを有する種々の運動スキルの複数の成分が回避される。その後は、関連するＴＰＧＭＭモデル、持続モデル、前提条件モデル及び効果モデルのすべてを相応に更新する必要がある。最後に、複合的遷移マトリックス｛ａ_ｋｈ｝が計算される場合、Θ_１の｛ａ_ｋｈ｝_１及びΘ_２の｛ａ_ｋｈ｝_２は、対角的に｛ａ_ｋｈ｝に付加され、それに対して、残余の項目はゼロで埋められる。これは、Θ_１からΘ_２への遷移が並列にまとめられる（即ち、順次連続してではない）ため、Θ_１からΘ_２への追加の遷移が付加されないことを意味する。

【0084】

要約すれば、３０４における複合的モデルの生成は、２つの運動スキルの以下の動作を繰り返し適用することを含む。即ち、
１）演算１（運動スキルを順次連続してカスケードする）：
（図４に示されているように）「運動スキル＃１」と「運動スキル＃２」とが順次連続して接続している場合、アルゴリズム１に従って複合的運動スキルモデルを計算する。
２）演算２（運動スキルを分岐して組み合わせる）：
（図５に示されているように）「運動スキル＃１」と「運動スキル＃２」とが並列に接続されている場合、アルゴリズム２に従って複合的運動スキルモデルを計算する。

【0085】

特に、これらの２つの演算は以下のように繰り返し実施される。即ち、
Ａ）複合的運動スキルを各ブランチについて導出するために、タスクダイアグラム３０３内の各分岐又はサブ分岐について、演算１を再帰的に適用する。
Ｂ）複合的運動スキルをすべての分岐について導出するために、並列なすべての分岐について、演算２を再帰的に適用する。Ａによれば、各分岐は、１つの複合的運動スキルのみを有すべきであることに留意すべきである。
Ｃ）すべての運動スキルのシーケンスにＡを再帰的に適用し、すべての運動スキル分岐にＢを再帰的に適用する。

【0086】

複合的ロボット軌道モデル３０５が生成された場合、フローチャート３０３によって定義されたタスクについて、所与の状況３０６（例えば、システムの初期コンフィギュレーションなど）で実行することができる。

【0087】

この目的のために、ロボット制御装置は、所与の状況３０６における初期システムコンフィギュレーションを考慮し、例えば、式（３）を複合的ロボット軌道モデル３０５に適用することにより、複合的ロボット軌道モデル３０５内部で最尤状態シーケンス３０７（即ち、ＧＭＭ成分）、即ち、（ロボット及び物体を含めた）システムを最大確率で目標コンフィギュレーションにもたらす状態シーケンスを決定する。

【0088】

また、状態シーケンス３０７の決定は、所与の状況３０６下において実行する必要のある運動スキルのシーケンスも供給する。このことは、フローチャート３０３内に複数の分岐が存在し、そのために制御装置が種々の分岐を選択する必要がある場合に重要である。

【0089】

状態シーケンス３０７から、制御装置は、追従すべきロボット運動軌道３０８を求める。制御装置は、例えば、最適な軌道を求めるために、線形二次追従（ＬＱＴ）を使用することができる。

【0090】

制御装置１０６が、ロボットアーム１０１をロボット運動軌道３０８に従って制御する場合、制御装置１０６は、矢印３０９により示すように、制御経過においてフローチャート３０３に従って実行される動作プリミティブを組み込む。

【0091】

この目的のために、動作プリミティブが運動スキルに従って実行される場合には、運動スキルが最終状態である状態、即ち、運動スキルのロボット軌道モデルの最終状態が、状態シーケンス３０７において識別される。この状態に達すると、状態シーケンス３０７による制御は中断され、動作プリミティブ（又は複数の動作プリミティブが運動スキルの後に実行される場合には複数の動作プリミティブ）が実行された後で、状態シーケンスによる制御が再開される。

【0092】

種々の実施形態に従って要約すれば、図６に示されるような方法が提供される。

【0093】

図６は、一実施形態によるロボットデバイスを制御するための方法を表すフローチャート６００を示している。

【0094】

６０１においては、複数の運動スキルの各々を実施するためのデモンストレーションが提供される。

【0095】

６０２においては、デモンストレーションからの各運動スキルについて、ロボット軌道モデルを訓練する。

【0096】

６０３においては、ロボットデバイスによって実施されるべきタスクのためのフローチャートが受信され、フローチャートは、運動スキル及び動作プリミティブから実施すべきシーケンスを有する。

【0097】

６０４においては、動作プリミティブの省略によりフローチャートから短縮されたフローチャートが生成される。

【0098】

６０５においては、２つの運動スキルが短縮されたフローチャートに従って順次連続して実施されるべき場合に、運動スキルのロボット軌道モデルをカスケードすることにより、短縮されたフローチャートのための運動スキルのロボット軌道モデルから複合的ロボット軌道モデルが生成される。

【0099】

６０６においては、ロボットデバイスが複合的ロボット軌道モデルによって制御され、フローチャートによる運動スキルの後で、１つ以上の動作プリミティブが次の運動スキルの前に実行される場合に、複合的ロボット軌道モデルによるロボットの制御は、運動スキルの実施後に中断され、１つ以上の動作プリミティブが実行された後で、複合的ロボット軌道モデルによる前記ロボットの制御が継続される。

【0100】

種々の実施形態によれば、換言すれば、ロボット装置によって実施される操作タスクのためのフローチャートから運動スキルが抽出され、それに対して複合的運動モデルが生成される。次いで、ロボットデバイスは、複合的運動モデルに基づいて制御され、制御の適正な箇所において動作が実行される。

【0101】

動作プリミティブは、基本的動作として理解することができる。即ち、ロボットデバイスが、例えば、デモンストレーションから学び取る必要性なしで掌握し得る動作の基礎を意味するものと理解することができる。特に、それは、各制御状況に適合化させる必要のない動作であるものとしてもよい。例えば、エンドエフェクタの起動（例えば、グリッパの開放、グリッパの閉鎖など）、ロボットの作業領域内の物体の認識、又は、ロボット制御のパラメータの変更（例えば、コンプライアンス）などである。その上さらに、動作プリミティブは、エンドエフェクタの位置及び向きを変更しなくてもよいという特性を有し、そのため、計算されたロボット軌道は、その後も引き続き有効であり、継続することができる。

【0102】

種々の実施形態によれば、ロボットデバイスのためのモデルは、複数の運動スキルについて訓練され、これらの運動スキルの複数の実行が分岐又は順次連続して含まれるタスクが実行されるべき場合には、モデルが複合的モデルにカスケードされ及び／又は組み合わせられる。次いで、この複合的モデルは、あたかも単一の運動スキルのためのモデルのように、例えば、タスクに対する最適な状態シーケンス（及びタスクが実行されるべきロボットデバイス及び物体の初期コンフィギュレーション）を決定し、それに応じてロボット装置を制御することによって、ロボットの制御のために使用することができる。

【0103】

図６の方法は、１つ以上のデータ処理ユニットを有する１つ以上のコンピュータによって実施され得る。「データ処理ユニット」という用語は、データや信号の処理を可能にする何らかのタイプのエンティティを意味するものと理解することができる。これらのデータや信号は、例えば、データ処理ユニットによって実施される少なくとも１つの（即ち、１つ以上の）特定の機能に従って処理可能である。データ処理ユニットは、アナログ回路、デジタル回路、複合信号回路、論理回路、マイクロプロセッサ、マイクロコントローラ、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、デジタル信号プロセッサ（ＤＳＰ）、プログラマブルゲートアレイ（ＦＰＧＡ）の集積回路、又は、それらの組合せを含むものとしてもよいし、又は、それらから構成されるものとしてもよい。また、以下においてより詳細に説明する各機能を実現するための何らかの他の手法も、データ処理ユニットや論理回路ユニットとして理解することができる。もちろん、本明細書において詳細に説明されている１つ以上のプロセスステップは、データ処理ユニットによって実施される１つ以上の特定の機能を通じて、データ処理ユニットによって実行（例えば、実装）することができる。

【0104】

「ロボットデバイス」という用語は、例えば、コンピュータ制御された機械、車両、家電製品、電動ツール、製造機械、パーソナルアシスタント、又は、入退室管理システムなど（それらの動作が制御される機械部品を有する）何らかの物理的システムを指すものと理解することができる。

【0105】

種々の実施形態は、システム（ロボットデバイスや１つ以上の物体）のデモンストレーションや状態、コンフィギュレーション、及び、シナリオに関するセンサデータを取得するために、種々のセンサ、例えば、ビデオ、レーダ、ＬｉＤＡＲ、超音波、モーション、サーマルイメージングセンサなどからのセンサ信号を受信して使用することができる。これらのセンサデータは、処理することが可能である。これには、例えば、（センサデータが取得された周辺環境における）物体の存在を検出するために、センサデータの分類や、センサデータにおけるセマンティックセグメンテーションの実施などが含まれ得る。これらの実施形態は、種々のシナリオ下において種々の操作タスクを達成するために、機械学習システムを訓練し、ロボットデバイス、例えば自律型ロボットマニピュレータを制御することに使用することができる。特に、これらの実施形態は、例えば組立ラインなどでの操作タスクの実行の制御及び監視に対して適用可能である。これらの実施形態は、例えば、従来の制御プロセス用ＧＵＩとシームレスに要約することができる。

【0106】

本明細書においては、特定の実施形態を示して説明してきたが、当業者が、図示され説明されてきたこれらの特定の実施形態を、本発明の保護範囲から逸脱することなく、種々の代替的及び／又は同等の実施形態に入れ替えることが可能であることは、明らかである。本明細書において論じられる特定の実施形態の何らかの適合化又は変化形態は、本出願によって包含されるべきであり、それゆえ、本発明は、本出願の特許請求の範囲及び等価物によってのみ限定されることが意図される。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【外国語明細書】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版