特許7609169 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7609169制御装置、制御方法及び、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-12-23

(45)【発行日】2025-01-07

(54)【発明の名称】制御装置、制御方法及び、プログラム

(51)【国際特許分類】

G05D 1/43 20240101AFI20241224BHJP

【ＦＩ】

G05D1/43

【請求項の数】 10

(21)【出願番号】P 2022555227

(86)(22)【出願日】2020-10-09

(86)【国際出願番号】 JP2020038296

(87)【国際公開番号】W WO2022074823

(87)【国際公開日】2022-04-14

【審査請求日】2023-04-05

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100107331

【弁理士】

【氏名又は名称】中村聡延

(74)【代理人】

【識別番号】100104765

【弁理士】

【氏名又は名称】江上達夫

(74)【代理人】

【識別番号】100131015

【弁理士】

【氏名又は名称】三輪浩誉

(72)【発明者】

【氏名】大山博之

(72)【発明者】

【氏名】高野凜

【審査官】稲垣浩司

(56)【参考文献】

【文献】特開平８－１６２４０（ＪＰ，Ａ）

【文献】特開２００５－３２１９６（ＪＰ，Ａ）

【文献】国際公開第２０２０／１６１８８０（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０５Ｄ１／００－１／８７

Ｂ２５Ｊ１／００－２１／０２

(57)【特許請求の範囲】

【請求項1】

ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定する抽象状態設定手段と、
前記作業空間内の情報の確度を表すマップである環境マップを生成する環境マップ生成手段と、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成する抽象モデル生成手段と、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成する制御入力生成手段と、
前記制御入力による前記ロボットの動作中において、前記抽象状態の変化に基づき、前記抽象モデルの再生成の要否を判定する抽象状態比較手段と、
を備える制御装置。

【請求項2】

前記抽象状態比較手段は、前記制御入力による前記ロボットの動作中において、前記物体の個数又は位置の少なくとも一方の変化に基づき、前記抽象モデルの再生成の要否を判定する、請求項１に記載の制御装置。

【請求項3】

前記ロボットには、計測装置が備えられており、
前記ロボットの動作に応じて前記計測装置の計測範囲が変化し、
前記抽象状態設定手段は、前記ロボットの動作中において、前記計測装置が生成する計測信号に基づき、前記抽象状態の変化を特定する、請求項１または２に記載の制御装置。

【請求項4】

前記抽象状態比較手段は、前記計測信号に基づき設定された現在の前記抽象状態と、前記制御入力に基づき予測される現在の前記抽象状態との差に基づき、前記抽象モデルの再生成の要否を判定する、請求項３に記載の制御装置。

【請求項5】

前記制御入力生成手段は、前記抽象モデルと、前記環境マップが表す確度を評価する環境評価値とに基づき、前記制御入力を生成する、請求項１～４のいずれか一項に記載の制御装置。

【請求項6】

前記制御入力生成手段は、前記制御入力及び前記環境評価値を含む評価関数と、前記ロボットに作業させるタスクである目的タスクの実行において満たすべき制約条件とを設定し、前記評価関数と前記制約条件とに基づく最適化により前記制御入力を生成する、請求項５に記載の制御装置。

【請求項7】

最終目標を表す時相論理の論理式である目標論理式を生成する目標論理式生成手段と、
前記論理式から、前記ロボットに作業させるタスクである目的タスクを実行するためのタイムステップ毎の状態を表す論理式であるタイムステップ論理式を生成するタイムステップ論理式生成手段と、をさらに有し、
前記制御入力生成手段は、前記抽象モデルと前記タイムステップ論理式とに基づき、前記制御入力を生成する、請求項１～６のいずれか一項に記載の制御装置。

【請求項8】

コンピュータが、
ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定し、
前記作業空間内の情報の確度を表すマップである環境マップを生成し、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成し、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成し、
前記制御入力による前記ロボットの動作中において、前記抽象状態の変化に基づき、前記抽象モデルの再生成の要否を判定する
制御方法。

【請求項9】

ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定し、
前記作業空間内の情報の確度を表すマップである環境マップを生成し、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成し、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成し、
前記制御入力による前記ロボットの動作中において、前記抽象状態の変化に基づき、前記抽象モデルの再生成の要否を判定する処理をコンピュータに実行させるプログラム。

【請求項10】

ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定する抽象状態設定手段と、
前記作業空間内の情報の確度を表すマップである環境マップを生成する環境マップ生成手段と、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成する抽象モデル生成手段と、
前記抽象モデルと、前記環境マップが表す確度を評価する環境評価値とに基づき、前記ロボットに対する制御入力を生成する制御入力生成手段と、
を備える制御装置。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、ロボットの動作を制御する制御装置、制御方法及び記憶媒体の技術分野に関する。

【背景技術】

【0002】

ロボットに作業させるタスクが与えられた場合に、当該タスクを実行するために必要なロボットの制御を行う制御手法が提案されている。例えば、特許文献１には、行動と環境の状態の変化を学習し、これを基に、所定の行動に対する環境の状態の変化を予測し、この予測結果に基づいて現在の状態から目標状態に達するまでの自律エージェントの行動シーケンスを計画するコントローラが開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２００７－０１８４９０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

与えられたタスクをロボットに実行させるための動作計画を行う場合に、タスクを完了するために認識する必要がある物体等が初期状態において計測できないことがある。この場合においても、動作計画を適切に行いロボットの動作を開始する必要がある。

【0005】

本開示の目的の１つは、上述した課題を鑑み、ロボットを好適に制御することが可能な制御装置、制御方法及び記憶媒体を提供することである。

【課題を解決するための手段】

【0006】

制御装置の一の態様は、
ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定する抽象状態設定手段と、
前記作業空間内の情報の確度を表すマップである環境マップを生成する環境マップ生成手段と、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成する抽象モデル生成手段と、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成する制御入力生成手段と、
前記制御入力による前記ロボットの動作中において、前記抽象状態の変化に基づき、前記抽象モデルの再生成の要否を判定する抽象状態比較手段と、
を備える制御装置である。

【0007】

制御方法の一の態様は、
コンピュータが、
ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定し、
前記作業空間内の情報の確度を表すマップである環境マップを生成し、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成し、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成し、
前記制御入力による前記ロボットの動作中において、前記抽象状態の変化に基づき、前記抽象モデルの再生成の要否を判定する
制御方法である。

【0008】

プログラムの一の態様は、
ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定し、
前記作業空間内の情報の確度を表すマップである環境マップを生成し、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成し、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成し、
前記制御入力による前記ロボットの動作中において、前記抽象状態の変化に基づき、前記抽象モデルの再生成の要否を判定する処理をコンピュータに実行させる。

【発明の効果】

【0009】

ロボットを動作させるための制御入力を好適に生成することができる。

【図面の簡単な説明】

【0010】

【図1】第１実施形態におけるロボット制御システムの構成を示す。

【図2】ロボットコントローラのハードウェア構成を示す。

【図3】アプリケーション情報のデータ構造の一例を示す。

【図4】ロボットコントローラの機能ブロックの一例である。

【図5】ピックアンドプレイスを目的タスクとした場合の作業空間の俯瞰図を示す。

【図6】ロボットが移動体である場合のロボットの作業空間の俯瞰図を示す。

【図7】初期状態における未計測空間と、計測済空間との関係を概略的に表した作業空間の俯瞰図である。

【図8】ロボットが移動した後の未計測空間と、計測済空間との関係を概略的に表した作業空間の俯瞰図である。

【図9】第１実施形態においてロボットコントローラが実行するロボット制御処理の概要を示すフローチャートの一例である。

【図10】第２実施形態における制御装置の概略構成図を示す。

【図11】第２実施形態において制御装置が実行するフローチャートの一例である。

【発明を実施するための形態】

【0011】

以下、図面を参照しながら、制御装置、制御方法及び記憶媒体の実施形態について説明する。

【0012】

＜第１実施形態＞
（１）システム構成
図１は、第１実施形態に係るロボット制御システム１００の構成を示す。ロボット制御システム１００は、主に、ロボットコントローラ１と、指示装置２と、記憶装置４と、ロボット５と、計測装置７と、を備える。

【0013】

ロボットコントローラ１は、ロボット５に実行させるタスク（「目的タスク」とも呼ぶ。）が指定された場合に、ロボット５が受付可能な単純なタスクのタイムステップ（時間刻み）毎のシーケンスに目的タスクを変換し、生成したシーケンスに基づきロボット５を制御する。

【0014】

また、ロボットコントローラ１は、指示装置２、記憶装置４、ロボット５、及び計測装置７と、通信網を介し、又は、無線若しくは有線による直接通信により、データ通信を行う。例えば、ロボットコントローラ１は、指示装置２から、目的タスクの指定、アプリケーション情報の生成又は更新等に関する入力信号を受信する。また、ロボットコントローラ１は、指示装置２に対し、所定の出力制御信号を送信することで、指示装置２に所定の表示又は音出力を実行させる。さらに、ロボットコントローラ１は、ロボット５の制御に関する制御信号「Ｓ１」をロボット５に送信する。また、ロボットコントローラ１は、計測装置７から計測信号「Ｓ２」を受信する。

【0015】

指示装置２は、作業者によるロボット５に対する指示を受け付ける装置である。指示装置２は、ロボットコントローラ１から供給される出力制御信号に基づき所定の表示又は音出力を行ったり、作業者の入力に基づき生成した入力信号をロボットコントローラ１へ供給したりする。指示装置２は、入力部と表示部とを備えるタブレット端末であってもよく、据置型のパーソナルコンピュータであってもよい。

【0016】

記憶装置４は、アプリケーション情報記憶部４１を有する。アプリケーション情報記憶部４１は、ロボット５が実行すべきシーケンスである動作シーケンスを目的タスクから生成するために必要なアプリケーション情報を記憶する。アプリケーション情報の詳細は、図３を参照しながら後述する。記憶装置４は、ロボットコントローラ１に接続又は内蔵されたハードディスクなどの外部記憶装置であってもよく、フラッシュメモリなどの記憶媒体であってもよい。また、記憶装置４は、ロボットコントローラ１と通信網を介してデータ通信を行うサーバ装置であってもよい。この場合、記憶装置４は、複数のサーバ装置から構成されてもよい。

【0017】

ロボット５は、ロボットコントローラ１から供給される制御信号Ｓ１に基づき目的タスクに関する作業を行う。ロボット５は、例えば、組み立て工場、食品工場などの各種工場、又は、物流の現場などで動作を行うロボットである。ロボット５は、垂直多関節型ロボット、水平多関節型ロボット、又はその他の任意の種類のロボットであってもよい。ロボット５は、ロボット５の状態を示す状態信号をロボットコントローラ１に供給してもよい。この状態信号は、ロボット５全体又は関節などの特定部位の状態（位置、角度等）を検出するセンサ（内界センサ）の出力信号であってもよく、制御信号Ｓ１が表すロボット５の動作計画のシーケンスの進捗状態を示す信号であってもよい。

【0018】

計測装置７は、目的タスクが実行される作業空間内の状態を検出するカメラ、測域センサ、ソナーまたはこれらの組み合わせとなる１又は複数のセンサ（外界センサ）である。計測装置７は、ロボット５に備えられたセンサを含んでもよく、作業空間内に設けられたセンサを含んでもよい。図１では、計測装置７は、ロボット５に設けられたカメラなどの外界センサを含んでおり、ロボット５の動作に応じて計測範囲が変化する。他の例では、計測装置７は、ロボット５の作業空間内で移動する自走式又は飛行式のセンサ（ドローンを含む）を含んでもよい。また、計測装置７は、作業空間内の音又は物体の触覚を検出するセンサを含んでもよい。このように、計測装置７は、作業空間内の状態を検出する種々のセンサであって、任意の場所に設けられたセンサを含んでもよい。

【0019】

なお、図１に示すロボット制御システム１００の構成は一例であり、当該構成に種々の変更が行われてもよい。例えば、ロボット５は、複数台存在してもよく、ロボットアームなどの夫々が独立して動作する制御対象物を複数有してもよい。これらの場合であっても、ロボットコントローラ１は、目的タスクに基づき、ロボット５毎又は制御対象物毎の動作を規定するシーケンスを表す制御信号Ｓ１を、対象のロボット５に送信する。また、ロボット５は、作業空間内で動作する他のロボット、作業者又は工作機械と協働作業を行うものであってもよい。また、計測装置７は、ロボット５の一部であってもよい。また、指示装置２は、ロボットコントローラ１と同一の装置として構成されてもよい。また、ロボットコントローラ１は、複数の装置から構成されてもよい。この場合、ロボットコントローラ１を構成する複数の装置は、予め割り当てられた処理を実行するために必要な情報の授受を、これらの複数の装置間において行う。また、ロボットコントローラ１とロボット５とは、一体に構成されてもよい。

【0020】

（２）ハードウェア構成
図２（Ａ）は、ロボットコントローラ１のハードウェア構成を示す。ロボットコントローラ１は、ハードウェアとして、プロセッサ１１と、メモリ１２と、インターフェース１３とを含む。プロセッサ１１、メモリ１２及びインターフェース１３は、データバス１０を介して接続されている。

【0021】

プロセッサ１１は、メモリ１２に記憶されているプログラムを実行することにより、ロボットコントローラ１の全体の制御を行うコントローラ（演算装置）として機能する。プロセッサ１１は、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＴＰＵ（ＴｅｎｓｏｒＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などのプロセッサである。プロセッサ１１は、複数のプロセッサから構成されてもよい。プロセッサ１１は、コンピュータの一例である。

【0022】

メモリ１２は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、フラッシュメモリなどの各種の揮発性メモリ及び不揮発性メモリにより構成される。また、メモリ１２には、ロボットコントローラ１が実行する処理を実行するためのプログラムが記憶される。なお、メモリ１２が記憶する情報の一部は、ロボットコントローラ１と通信可能な１又は複数の外部記憶装置（例えば記憶装置４）により記憶されてもよく、ロボットコントローラ１に対して着脱自在な記憶媒体により記憶されてもよい。

【0023】

インターフェース１３は、ロボットコントローラ１と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。

【0024】

なお、ロボットコントローラ１のハードウェア構成は、図２（Ａ）に示す構成に限定されない。例えば、ロボットコントローラ１は、表示装置、入力装置又は音出力装置の少なくともいずれかと接続又は内蔵してもよい。また、ロボットコントローラ１は、指示装置２又は記憶装置４の少なくとも一方を含んで構成されてもよい。

【0025】

図２（Ｂ）は、指示装置２のハードウェア構成を示す。指示装置２は、ハードウェアとして、プロセッサ２１と、メモリ２２と、インターフェース２３と、入力部２４ａと、表示部２４ｂと、音出力部２４ｃと、を含む。プロセッサ２１、メモリ２２及びインターフェース２３は、データバス２０を介して接続されている。また、インターフェース２３には、入力部２４ａと表示部２４ｂと音出力部２４ｃとが接続されている。

【0026】

プロセッサ２１は、メモリ２２に記憶されているプログラムを実行することにより、所定の処理を実行する。プロセッサ２１は、ＣＰＵ、ＧＰＵなどのプロセッサである。プロセッサ２１は、インターフェース２３を介して入力部２４ａが生成した信号を受信することで、入力信号を生成し、インターフェース２３を介してロボットコントローラ１に当該入力信号を送信する。また、プロセッサ２１は、インターフェース２３を介してロボットコントローラ１から受信した出力制御信号に基づき、表示部２４ｂ又は音出力部２４ｃの少なくとも一方を、インターフェース２３を介して制御する。

【0027】

メモリ２２は、ＲＡＭ、ＲＯＭ、フラッシュメモリなどの各種の揮発性メモリ及び不揮発性メモリにより構成される。また、メモリ２２には、指示装置２が実行する処理を実行するためのプログラムが記憶される。

【0028】

インターフェース２３は、指示装置２と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。また、インターフェース２３は、入力部２４ａ、表示部２４ｂ及び音出力部２４ｃのインターフェース動作を行う。入力部２４ａは、ユーザの入力を受け付けるインターフェースであり、例えば、タッチパネル、ボタン、キーボード、音声入力装置などが該当する。表示部２４ｂは、例えば、ディスプレイ、プロジェクタ等であり、プロセッサ２１の制御に基づき表示を行う。また、音出力部２４ｃは、例えば、スピーカであり、プロセッサ２１の制御に基づき音出力を行う。

【0029】

なお、指示装置２のハードウェア構成は、図２（Ｂ）に示す構成に限定されない。例えば、入力部２４ａ、表示部２４ｂ又は音出力部２４ｃの少なくともいずれかは、指示装置２と電気的に接続する別体の装置として構成されてもよい。また、指示装置２は、カメラなどの種々の装置と接続してもよく、これらを内蔵してもよい。

【0030】

（３）アプリケーション情報
次に、アプリケーション情報記憶部４１が記憶するアプリケーション情報のデータ構造について説明する。

【0031】

図３は、アプリケーション情報のデータ構造の一例を示す。図３に示すように、アプリケーション情報は、抽象状態指定情報Ｉ１と、制約条件情報Ｉ２と、動作限界情報Ｉ３と、サブタスク情報Ｉ４と、ダイナミクスモデル情報Ｉ５と、物体モデル情報Ｉ６と、マップ更新モデル情報Ｉ７と、マップ・物体事前情報Ｉ８とを含む。

【0032】

抽象状態指定情報Ｉ１は、動作シーケンスの生成にあたり定義する必要がある抽象状態を指定する情報である。この抽象状態は、作業空間内における物体の抽象的な状態であって、後述する目標論理式において使用する命題として定められる。例えば、抽象状態指定情報Ｉ１は、目的タスクの種類毎に、定義する必要がある抽象状態を指定する。

【0033】

制約条件情報Ｉ２は、目的タスクを実行する際の制約条件を示す情報である。制約条件情報Ｉ２は、例えば、目的タスクがピックアンドプレイスの場合、障害物にロボット５（ロボットアーム）が接触してはいけないという制約条件、ロボット５（ロボットアーム）同士が接触してはいけないという制約条件などを示す。なお、制約条件情報Ｉ２は、目的タスクの種類毎に夫々適した制約条件を記録した情報であってもよい。

【0034】

動作限界情報Ｉ３は、ロボットコントローラ１により制御が行われるロボット５の動作限界に関する情報を示す。動作限界情報Ｉ３は、例えば、ロボット５の速度、加速度、又は角速度の上限を規定する情報である。なお、動作限界情報Ｉ３は、ロボット５の可動部位又は関節ごとに動作限界を規定する情報であってもよい。

【0035】

サブタスク情報Ｉ４は、動作シーケンスの構成要素となるサブタスクの情報を示す。「サブタスク」は、ロボット５が受付可能な単位により目的タスクを分解したタスクであって、細分化されたロボット５の動作を指す。例えば、目的タスクがピックアンドプレイスの場合には、サブタスク情報Ｉ４は、ロボット５のロボットアームの移動であるリーチングと、ロボットアームによる把持であるグラスピングとをサブタスクとして規定する。サブタスク情報Ｉ４は、目的タスクの種類毎に使用可能なサブタスクの情報を示すものであってもよい。

【0036】

ダイナミクスモデル情報Ｉ５は、作業空間におけるダイナミクスを抽象化したダイナミクスモデルに関する情報である。例えば、ダイナミクスモデルは、現実のダイナミクスをハイブリッドシステムにより抽象化したモデルであってもよい。この場合、ダイナミクスモデル情報Ｉ５は、上述のハイブリッドシステムにおけるダイナミクスの切り替わりの条件を示す情報を含む。切り替わりの条件は、例えば、ロボット５により作業対象となる物（「対象物」とも呼ぶ。）をロボット５が掴んで所定位置に移動させるピックアンドプレイスの場合、対象物はロボット５により把持されなければ移動できないという条件などが該当する。ダイナミクスモデル情報Ｉ５は、目的タスクの種類毎に適したダイナミクスモデルに関する情報を有している。

【0037】

物体モデル情報Ｉ６は、計測装置７が生成した計測信号Ｓ２から認識すべき作業空間内の各物体の物体モデルに関する情報である。上述の各物体は、例えば、ロボット５、障害物、ロボット５が扱う工具その他の対象物、ロボット５以外の作業体などが該当する。物体モデル情報Ｉ６は、例えば、上述した各物体の種類、位置、姿勢、現在実行中の動作などをロボットコントローラ１が認識するために必要な情報と、各物体の３次元形状を認識するためのＣＡＤ（ＣｏｍｐｕｔｅｒＡｉｄｅｄＤｅｓｉｇｎ）データなどの３次元形状情報とを含んでいる。前者の情報は、ニューラルネットワークなどの機械学習における学習モデルを学習することで得られた推論器のパラメータを含む。この推論器は、例えば、画像が入力された場合に、当該画像において被写体となる物体の種類、位置、姿勢等を出力するように予め学習される。また、対象物などの主要な物体に画像認識用のＡＲマーカが付されている場合には、ＡＲマーカにより物体を認識するために必要な情報が物体モデル情報Ｉ６として記憶されてもよい。

【0038】

マップ更新モデル情報Ｉ７は、ロボット５の作業空間（環境）において収集された情報の確度を表したマップ（「環境マップｂ」とも呼ぶ。）を更新するモデル（「マップ更新モデルｂ^＋」とも呼ぶ。）に関する情報である。

【0039】

環境マップｂは、ロボットコントローラ１により生成される。環境マップｂは、例えば、対象空間（２次元又は３次元空間）を格子状に分割した場合のグリッドごとに情報の確度を離散的に表す情報であってもよく、対象空間における情報の確度を連続的に表す情報であってもよい。また、環境マップｂは、物理的な２次元空間又は３次元空間の軸に時間等の概念を表す軸を加えた空間において表される確度の情報であってもよい。また、環境マップｂは、確度の時間的な減衰が生じるものであってもよい。例えば、計測装置７が迷路等を探索する移動式ロボットである場合などでは、計測した場所でも時間の経過とともに状況は変化する可能性があり、計測後からの時間経過と共に情報の確度が低くなる。以上を勘案し、ロボットコントローラ１は、環境マップｂが表す確度を、計測後からの時間経過に応じて減衰させるように環境マップｂを更新してもよい。

【0040】

マップ更新モデルｂ^＋は、環境マップｂの時間変化を予測するモデルであり、例えば、予測されるロボット５への入力と、設定された抽象状態と、現在の環境マップｂとを引数とする関数により表される。マップ更新モデルｂ^＋は、例えば、ロボット５に設置された計測装置７の設置位置、設置向き（角度）、計測装置７の視野角、計測可能距離などを勘案して予め生成される。環境マップｂ及びマップ更新モデルｂ^＋については、後述の図７及び図８を参照して具体的に説明する。

【0041】

マップ・物体事前情報Ｉ８は、環境マップｂ及び抽象状態を設定すべき物体に関する事前情報を表す。マップ・物体事前情報Ｉ８は、ロボットコントローラ１がロボット５の動作計画を行う時点よりも前に生成された情報であって、例えば、任意の物体の初期状態を表す情報を含んでもよく、環境マップｂの初期状態を表す情報を含んでもよい。マップ更新モデル情報Ｉ７及びマップ・物体事前情報Ｉ８は、指示装置２を用いたユーザによる外部入力に基づき生成された情報であってもよい。

【0042】

なお、アプリケーション情報記憶部４１は、上述した情報の他、ロボットコントローラ１が制御信号Ｓ１を生成するために必要な種々の情報を記憶してもよい。例えば、アプリケーション情報記憶部４１は、ロボット５の作業空間を特定する情報を記憶してもよい。

【0043】

（４）処理概要
次に、ロボットコントローラ１の処理概要について説明する。概略的には、ロボットコントローラ１は、環境マップｂと、マップ更新モデルｂ^＋とを用い、環境の不確実性を考慮したロボット５の動作計画を行う。そして、ロボットコントローラ１は、制御信号Ｓ１に基づくロボット５の動作中において、計測信号Ｓ２に基づき環境マップｂを更新し、かつ、抽象状態の変化に応じて抽象モデルの再設定及び制御信号Ｓ１の再生成を行う。これにより、ロボットコントローラ１は、不確実性のある環境においても、目的タスクを完了するように好適にロボット５の制御を行う。

【0044】

図４は、ロボットコントローラ１の処理の概要を示す機能ブロックの一例である。ロボットコントローラ１のプロセッサ１１は、機能的には、抽象状態設定部３１と、目標論理式生成部３２と、タイムステップ論理式生成部３３と、環境マップ更新部３４と、抽象モデル生成部３５と、制御入力生成部３６と、ロボット制御部３７と、抽象状態比較部３８とを有する。なお、図４では、各ブロック間で授受が行われるデータの一例が示されているが、これに限定されない。後述する他の機能ブロックの図においても同様である。

【0045】

抽象状態設定部３１は、計測装置７から供給される計測信号Ｓ２と、抽象状態指定情報Ｉ１と、物体モデル情報Ｉ６と、に基づき、作業空間内の抽象状態を設定する。この場合、抽象状態設定部３１は、計測信号Ｓ２を受信した場合に、物体モデル情報Ｉ６等を参照し、目的タスクを実行する際に考慮する必要がある作業空間内の各物体の種類等の属性と位置及び姿勢などの状態とを認識する。状態の認識結果は、例えば、状態ベクトルとして表される。そして、抽象状態設定部３１は、各物体に対する認識結果に基づいて、目的タスクを実行する際に考慮する必要がある各抽象状態に対し、論理式で表すための命題を定義する。抽象状態設定部３１は、設定した抽象状態を示す情報（「抽象状態設定情報ＩＳ」とも呼ぶ。）を、目標論理式生成部３２に供給する。

【0046】

また、抽象状態設定部３１は、ロボット５が制御信号Ｓ１に基づき動作している期間（「ロボット動作期間Ｔｗ」とも呼ぶ。）において、所定時間間隔毎（例えば所定タイムステップ毎）に、最新の計測信号Ｓ２に基づいて作業空間内の物体の最新の抽象状態を認識する。そして、抽象状態設定部３１は、最新の計測信号Ｓ２に基づいて認識した抽象状態（「計測抽象状態Ｓｔｍ」とも呼ぶ。）を表す情報を、抽象状態比較部３８に供給する。

【0047】

目標論理式生成部３２は、抽象状態設定情報ＩＳに基づき、指定された目的タスクを、最終的な達成状態を表す時相論理の論理式（「目標論理式Ｌｔａｇ」とも呼ぶ。）に変換する。この場合、目標論理式生成部３２は、アプリケーション情報記憶部４１から制約条件情報Ｉ２を参照することで、目的タスクの実行において満たすべき制約条件を、目標論理式Ｌｔａｇに付加する。そして、目標論理式生成部３２は、生成した目標論理式Ｌｔａｇを、タイムステップ論理式生成部３３に供給する。

【0048】

タイムステップ論理式生成部３３は、目標論理式生成部３２から供給された目標論理式Ｌｔａｇを、各タイムステップでの状態を表した論理式（「タイムステップ論理式Ｌｔｓ」とも呼ぶ。）に変換する。そして、タイムステップ論理式生成部３３は、生成したタイムステップ論理式Ｌｔｓを、制御入力生成部３６に供給する。

【0049】

環境マップ更新部３４は、ロボット５が作動する前の動作計画時において、マップ・物体事前情報Ｉ８と、計測信号Ｓ２とに基づき、初期状態となる環境マップｂを生成する。また、環境マップ更新部３４は、ロボット動作期間Ｔｗにおいて、所定の時間間隔により（例えば所定タイムステップ毎に）、計測信号Ｓ２に基づき環境マップｂの更新を行う。環境マップ更新部３４は、生成又は更新した環境マップｂを、抽象モデル生成部３５及び制御入力生成部３６へ供給する。なお、マップ・物体事前情報Ｉ８は存在しなくともよい。この場合、環境マップ更新部３４は、計測信号Ｓ２に基づき、作業空間の初期状態での情報の確度を表す環境マップｂを生成する。また、環境マップ更新部３４は、環境マップｂが表す確度を、計測後からの時間経過に応じて減衰させるように環境マップｂを更新してもよい。言い換えると、環境マップ更新部３４は、計測装置７による計測が行われた空間の当該計測後からの時間経過に基づき当該空間における確度を減衰させるように環境マップｂを更新してもよい。

【0050】

抽象モデル生成部３５は、ダイナミクスモデル情報Ｉ５と、マップ更新モデル情報Ｉ７と、抽象状態設定情報ＩＳとに基づき、作業空間における現実のダイナミクスを抽象化したダイナミクスモデルと、マップ更新モデルｂ^＋とを含む抽象モデル「Σ」を生成する。抽象モデルΣの生成方法については後述する。抽象モデル生成部３５は、生成した抽象モデルΣを、制御入力生成部３６へ供給する。

【0051】

制御入力生成部３６は、タイムステップ論理式生成部３３から供給されるタイムステップ論理式Ｌｔｓと、抽象モデル生成部３５から供給される抽象モデルΣとを満たし、評価関数を最適化するタイムステップ毎のロボット５への制御入力を決定する。そして、制御入力生成部３６は、ロボット５へのタイムステップ毎の制御入力に関する情報（「制御入力情報Ｉｃｎ」とも呼ぶ。）を、ロボット制御部３７及び抽象状態比較部３８へ供給する。

【0052】

ロボット制御部３７は、制御入力生成部３６から供給される制御入力情報Ｉｃｎと、アプリケーション情報記憶部４１が記憶するサブタスク情報Ｉ４とに基づき、ロボット５が解釈可能なサブタスクのシーケンスを表す制御信号Ｓ１を生成する。そして、ロボット制御部３７は、インターフェース１３を介して制御信号Ｓ１をロボット５へ供給する。なお、ロボット制御部３７に相当する機能を、ロボットコントローラ１に代えてロボット５が有してもよい。この場合、ロボット５は、ロボットコントローラ１から供給される制御入力情報Ｉｃｎに基づき、計画されたタイムステップ毎の動作を実行する。

【0053】

抽象状態比較部３８は、ロボット動作期間Ｔｗ中に、抽象状態の変化に基づき、抽象モデルΣの再生成の要否を判定する。この場合、抽象状態比較部３８は、抽象状態設定部３１から供給される計測抽象状態Ｓｔｍ（即ち、計測された現在の抽象状態）と、制御入力情報Ｉｃｎに基づき予測される現在の抽象状態（「予測抽象状態Ｓｔｐ」とも呼ぶ。）とを比較する。そして、抽象状態比較部３８は、計測抽象状態Ｓｔｍと予測抽象状態Ｓｔｐとに実質的な差異があると判定した場合、抽象モデルΣを再生成する必要があると判定し、計測抽象状態Ｓｔｍを、抽象モデル生成部３５へ供給する。

【0054】

ここで、抽象状態設定部３１、目標論理式生成部３２、タイムステップ論理式生成部３３、環境マップ更新部３４、抽象モデル生成部３５、制御入力生成部３６、ロボット制御部３７及び抽象状態比較部３８の各構成要素は、例えば、プロセッサ１１がプログラムを実行することによって実現できる。また、必要なプログラムを任意の不揮発性記憶媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。なお、これらの各構成要素の少なくとも一部は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組合せ等により実現してもよい。また、これらの各構成要素の少なくとも一部は、例えばＦＰＧＡ（Field-Programmable Gate Array）又はマイクロコントローラ等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。また、各構成要素の少なくとも一部は、ＡＳＳＰ（Application Specific Standard Produce）、ＡＳＩＣ（Application Specific Integrated Circuit）又は量子コンピュータ制御チップにより構成されてもよい。このように、各構成要素は、種々のハードウェアにより実現されてもよい。以上のことは、後述する他の実施の形態においても同様である。さらに、これらの各構成要素は，例えば，クラウドコンピューティング技術などを用いて、複数のコンピュータの協働によって実現されてもよい。

【0055】

（５）各処理部の詳細
次に、図４において説明した各処理部が実行する処理の詳細について順に説明する。

【0056】

（５－１）抽象状態設定部
まず、抽象状態設定部３１は、物体モデル情報Ｉ６を参照し、作業空間の環境を認識する技術（画像処理技術、画像認識技術、音声認識技術、ＲＦＩＤ（ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩｄｅｎｔｉｆｉｅｒ）を用いる技術等）により計測信号Ｓ２を解析することで、作業空間に存在する物体の状態及び属性（種類等）を認識する。上述の画像認識技術には、深層学習に基づくセマンティックセグメンテーション、モデルマッチング、又はＡＲマーカ等を用いた認識などが含まれる。上記の認識結果には、作業空間内の物体の種類、位置、及び姿勢などの情報が含まれている。また、作業空間内の物体は、例えば、ロボット５、ロボット５が取り扱う工具又は部品などの対象物、障害物及び他作業体（ロボット５以外に作業を行う人又はその他の物体）などである。

【0057】

次に、抽象状態設定部３１は、計測信号Ｓ２等による物体の認識結果と、アプリケーション情報記憶部４１から取得した抽象状態指定情報Ｉ１とに基づき、作業空間内の抽象状態を設定する。この場合、まず、抽象状態設定部３１は、抽象状態指定情報Ｉ１を参照し、作業空間内において設定すべき抽象状態を認識する。なお、作業空間内において設定すべき抽象状態は、目的タスクの種類によって異なる。よって、目的タスクの種類毎に設定すべき抽象状態が抽象状態指定情報Ｉ１に規定されている場合には、抽象状態設定部３１は、指定された目的タスクに対応する抽象状態指定情報Ｉ１を参照し、設定すべき抽象状態を認識する。

【0058】

図５は、ピックアンドプレイスを目的タスクとした場合の作業空間の俯瞰図を示す。図５に示す作業空間には、２つのロボットアーム５２ａ、５２ｂと、４つの対象物６１（６１ａ～６１ｄ）と、障害物６２と、対象物６１の目的地である領域Ｇとが存在している。

【0059】

この場合、まず、抽象状態設定部３１は、作業空間内の各物体の状態を認識する。具体的には、抽象状態設定部３１は、対象物６１の状態、障害物６２の状態（ここでは存在範囲等）、ロボット５の状態、領域Ｇの状態（ここでは存在範囲等）などを夫々認識する。

【0060】

ここでは、抽象状態設定部３１は、対象物６１ａ～６１ｄの各々の中心の位置ベクトル「ｘ_１」～「ｘ_４」を、対象物６１ａ～６１ｄの位置として認識する。また、抽象状態設定部３１は、対象物を把持するロボットハンド５３ａの位置ベクトル「ｘ_ｒ１」と、ロボットハンド５３ｂの位置ベクトル「ｘ_ｒ２」とを、ロボットアーム５２ａとロボットアーム５２ｂの位置として認識する。なお、これらの位置ベクトルｘ_１～ｘ_４，ｘ_ｒ１，ｘ_ｒ２は、対応する物体の姿勢（角度）に関する要素、速度に関する要素などの、状態に関する種々の要素を含んだ状態ベクトルとして定義されてもよい。

【0061】

同様に、抽象状態設定部３１は、障害物６２の存在範囲、領域Ｇの存在範囲等を認識する。なお、抽象状態設定部３１は、例えば、障害物６２を直方体とみなし、領域Ｇを矩形とみなす場合には、障害物６２及び領域Ｇの各頂点の位置ベクトルを認識する。

【0062】

また、抽象状態設定部３１は、抽象状態指定情報Ｉ１を参照することで、目的タスクにおいて定義すべき抽象状態を決定する。この場合、抽象状態設定部３１は、作業空間内に存在する物体に関する認識結果（例えば物体の種類毎の個数）と、抽象状態指定情報Ｉ１とに基づき、抽象状態を示す命題を定める。

【0063】

図５の例では、抽象状態設定部３１は、計測信号Ｓ２等に基づき認識した対象物６１ａ～６１ｄに対し、夫々識別ラベル「１」～「４」を付す。また、抽象状態設定部３１は、対象物「ｉ」（ｉ＝１～４）が最終的に載置されるべき目標地点である領域Ｇ内に存在するという命題「ｇ_ｉ」を定義する。また、抽象状態設定部３１は、障害物６２に対して識別ラベル「Ｏ」を付し、対象物ｉが障害物Ｏに干渉しているという命題「ｏ_ｉ」を定義する。さらに、抽象状態設定部３１は、ロボットアーム５２同士が干渉するという命題「ｈ」を定義する。

【0064】

このように、抽象状態設定部３１は、定義すべき抽象状態を認識し、当該抽象状態を表す命題（上述の例ではｇ_ｉ、ｏ_ｉ、ｈ等）を、対象物６１の数、ロボットアーム５２の数、障害物６２の数、ロボット５の数等に応じてそれぞれ定義する。そして、抽象状態設定部３１は、設定した抽象状態（抽象状態を表す命題及び状態ベクトルを含む）を表す情報を、抽象状態設定情報ＩＳとして目標論理式生成部３２に供給する。

【0065】

図６は、ロボット５が移動体である場合のロボット５の作業空間（動作範囲）の俯瞰図を示す。図６に示す作業空間には、２体のロボット５Ａ、５Ｂと、障害物７２と、ロボット５Ａ、５Ｂの目的地である領域Ｇとが存在している。

【0066】

この場合、まず、抽象状態設定部３１は、作業空間内の各物体の状態を認識する。具体的には、抽象状態設定部３１は、ロボット５Ａ、５Ｂの位置、姿勢及び移動速度、障害物７２及び領域Ｇの存在範囲等を認識する。そして、抽象状態設定部３１は、ロボット５Ａの位置、姿勢（及び移動速度）を表す状態ベクトル「ｘ１」と、ロボット５Ｂの位置、姿勢（及び移動速度）を表す状態ベクトル「ｘ２」とを夫々設定する。また、抽象状態設定部３１は、ロボット５Ａ、５Ｂをロボット「ｉ」（ｉ＝１～２）により表し、ロボットｉが最終的に載置されるべき目標地点である領域Ｇ内に存在するという命題「ｇ_ｉ」を定義する。また、抽象状態設定部３１は、障害物７２に対して識別ラベル「Ｏ」を付し、ロボットｉが障害物Ｏに干渉しているという命題「ｏ_ｉ」を定義する。さらに、抽象状態設定部３１は、ロボットｉ同士が干渉するという命題「ｈ」を定義する。

【0067】

このように、抽象状態設定部３１は、ロボット５が移動体である場合においても、定義すべき抽象状態を認識し、かつ、当該抽象状態を表す命題（上述の例ではｇ_ｉ、ｏ_ｉ、ｈ等）を好適に設定することができる。そして、抽象状態設定部３１は、抽象状態を表す命題を示す情報を、抽象状態設定情報ＩＳとして目標論理式生成部３２に供給する。

【0068】

なお、設定されるタスクは、ロボット５が移動を行い、かつ、ピックアンドプレイスを行うもの（即ち図５及び図６の例の組み合わせに相当するもの）であってもよい。この場合においても、抽象状態設定部３１は、図５及び図６の例の両方を包括する抽象状態及び抽象状態を表す命題を表す抽象状態設定情報ＩＳを生成する。

【0069】

ここで、抽象状態を設定すべき物体（領域Ｇなどの領域を含む）のうち、計測装置７により計測できなかったこと等に起因して抽象状態を設定できない物体（「未設定物体」とも呼ぶ。）が存在する場合について説明する。抽象状態を設定すべき物体は、例えば、抽象状態指定情報Ｉ１において抽象状態を設定すべき物体として指定されている物体である。未設定物体は、ロボット５が作業する対象となる対象物であってもよく、対象物又はロボット５のゴール地点（図５又は図６における領域Ｇ）であってもよい。

【0070】

この場合、抽象状態設定部３１は、未設定物体の位置等を表す状態ベクトルを未定のまま当該未設定物体に関する命題を定義する。例えば、図６の例において、領域Ｇが障害物７２によって計測装置７の死角に存在することにより計測信号Ｓ２により計測できなかった場合には、抽象状態設定部３１は、領域Ｇの抽象状態を未設定（即ち、状態を表す状態ベクトルの値を未決定）としたまま領域Ｇに関する命題（例えばｇ_ｉ等）を設定する。

【0071】

なお、未設定物体は、障害物によって形成された死角に存在する物体の他、計測装置７の計測可能距離よりも遠くに存在する物体であってもよく、筐体などによって収容されている物体などであってもよい。例えば、箱から対象物を取り出す動作を必要とする目的タスクが設定された場合、箱の蓋を開けるまでは対象物は計測装置７により計測できない。この場合、箱の蓋をロボット５が開けて計測信号Ｓ２に基づきロボットコントローラ１が対象物を認識するまでは、対象物は未設定物体として扱われる。

【0072】

なお、マップ・物体事前情報Ｉ８において物体の位置等が事前に指定されている場合、抽象状態設定部３１は、マップ・物体事前情報Ｉ８に基づき、計測装置７により計測できない物体の抽象状態（状態ベクトル）を設定するとよい。

【0073】

このように、初期状態（即ち動作計画の段階）において目的タスクの遂行に必要な物体を計測できない場合であっても、抽象状態設定部３１は、ロボット５の動作計画の策定に必要な命題を好適に定めることができる。

【0074】

（５－２）目標論理式生成部
以後では、まず、環境マップｂを考慮しない場合の目標論理式Ｌｔａｇについて説明する。

【0075】

例えば、図５に示すピックアンドプレイスの例において、「最終的に全ての対象物が領域Ｇに存在する」という目的タスクが与えられたとする。この場合、目標論理式生成部３２は、線形論理式（ＬＴＬ：ＬｉｎｅａｒＴｅｍｐｏｒａｌＬｏｇｉｃ）の「eventually」に相当する演算子「◇」と、「always」に相当する演算子「□」、抽象状態設定部３１により定義された命題「ｇ_ｉ」と用いて、目的タスクのゴール状態を表す以下の論理式を生成する。
∧_ｉ◇□ｇ_ｉ

【0076】

なお、目標論理式生成部３２は、演算子「◇」、「□」以外の任意の時相論理の演算子（論理積「∧」、論理和「∨」、否定「￢」、論理包含「⇒」、next「○」、until「Ｕ」等）を用いて論理式を表現してもよい。また、線形時相論理に限らず、ＭＴＬ（ＭｅｔｒｉｃＴｅｍｐｏｒａｌＬｏｇｉｃ）やＳＴＬ（ＳｉｇｎａｌＴｅｍｐｏｒａｌＬｏｇｉｃ）などの任意の時相論理を用いて目的タスクに対応する論理式を表現してもよい。

【0077】

次に、目標論理式生成部３２は、制約条件情報Ｉ２が示す制約条件を、目的タスクを表す論理式に付加することで、目標論理式Ｌｔａｇを生成する。

【0078】

例えば、図５に示すピックアンドプレイスに対応する制約条件として、「ロボットアーム５２同士が常に干渉しない」、「対象物ｉは障害物Ｏに常に干渉しない」の２つが制約条件情報Ｉ２に含まれていた場合、目標論理式生成部３２は、これらの制約条件を論理式に変換する。具体的には、目標論理式生成部３２は、抽象状態設定部３１により定義された命題「ｏ_ｉ」及び命題「ｈ」を用いて、上述の２つの制約条件を、夫々以下の論理式に変換する。
□￢ｈ
∧_ｉ□￢ｏ_ｉ

【0079】

よって、この場合、目標論理式生成部３２は、「最終的に全ての対象物が領域Ｇに存在する」という目的タスクに対応する論理式「∧_ｉ◇□ｇ_ｉ」に、これらの制約条件の論理式を付加することで、以下の目標論理式Ｌｔａｇを生成する。
（∧_ｉ◇□ｇ_ｉ）∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）

【0080】

なお、実際には、ピックアンドプレイスに対応する制約条件は、上述した２つに限られず、「ロボットアーム５２が障害物Ｏに干渉しない」、「複数のロボットアーム５２が同じ対象物を掴まない」、「対象物同士が接触しない」などの制約条件が存在する。このような制約条件についても同様に、制約条件情報Ｉ２に記憶され、目標論理式Ｌｔａｇに反映される。

【0081】

次に、ロボット５が移動体である図６に示す例について説明する。この場合、目標論理式生成部３２は、目的タスクを表す論理式として、「最終的に全てのロボットが領域Ｇに存在する」を表す以下の論理命題を設定する。
∧_ｉ◇□ｇ_ｉ

【0082】

また、目標論理式生成部３２は、制約条件として、「ロボット同士が干渉しない」、「ロボットｉは障害物Ｏに常に干渉しない」の２つが制約条件情報Ｉ２に含まれていた場合、これらの制約条件を論理式に変換する。具体的には、目標論理式生成部３２は、抽象状態設定部３１により定義された命題「ｏ_ｉ」及び命題「ｈ」を用いて、上述の２つの制約条件を、夫々以下の論理式に変換する。
□￢ｈ
∧_ｉ□￢ｏ_ｉ

【0083】

よって、この場合、目標論理式生成部３２は、「最終的に全てのロボットが領域Ｇに存在する」という目的タスクに対応する論理式「∧_ｉ◇□ｇ_ｉ」に、これらの制約条件の論理式を付加することで、以下の目標論理式Ｌｔａｇを生成する。
（∧_ｉ◇□ｇ_ｉ）∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）

【0084】

このように、目標論理式生成部３２は、ロボット５が移動体である場合においても、抽象状態設定部３１の処理結果に基づき、目標論理式Ｌｔａｇを好適に生成することができる。

【0085】

次に、環境マップｂを考慮した目標論理式Ｌｔａｇについて、「最終的に全てのロボットが領域Ｇに存在する」という目的タスクが設定された場合を例として引き続き説明する。

【0086】

この場合、例えば、環境マップｂに基づく命題を「ρ」とすると、目標論理式生成部３２は、以下のような目標論理式Ｌｔａｇを設定する。
（∧_ｉ◇□ｇ_ｉ∨ρ）∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）
ここで、命題ρは、環境マップｂが表す確度を評価する値（「環境評価値ｙ」とも呼ぶ。）がある閾値以上となった場合に真となる命題である。この閾値は、例えば予め決定された適合値であり、メモリ１２又は記憶装置４に記憶されている。

【0087】

また、環境評価値ｙは、例えば、環境マップｂを引数とする関数「ｇ」を用いて、以下のように表される。
ｙ＝ｇ（ｂ）
ここで、関数ｇは、例えば、環境マップｂが表すグリッド毎の確度を「ｐ_ｉ」（ｉ＝１～ｎ、「ｎ」はグリッド数）とすると、全てのグリッドに対する確度ｐ_ｉの和（即ちｇ（ｂ）＝Σｐ_ｉ）、又は、当該和と正の相関を有する関数である。なお、「ｐ_ｉ」は、連続的に確度が規定された環境マップｂをグリッド毎の離散値に変換した値であってもよい。

【0088】

上記の目標論理式Ｌｔａｇは、「∧_ｉ◇□ｇ_ｉ」を満たすか、「ρ」を満たす（即ち環境評価値ｙが閾値以上となる）場合に真となる。なお、ロボットコントローラ１は、目的タスクに関連する物体の抽象状態が設定されていない（即ち未設定物体が存在する）場合、目的タスクに対応する論理式「∧_ｉ◇□ｇ_ｉ」を偽とみなす。例えば、図６の例において、初期状態において領域Ｇが計測装置７により計測できず、かつ、マップ・物体事前情報Ｉ８にも領域Ｇの情報が記憶されていない場合、領域Ｇに関する状態ベクトルは未設定となる。よって、この場合、ロボットコントローラ１は、目的タスクに対応する論理式「∧_ｉ◇□ｇ_ｉ」を、偽とみなす。

【0089】

そして、「∧_ｉ◇□ｇ_ｉ」が偽とみなされた場合、「ρ」が真となる（即ち環境評価値ｙが閾値以上となる）ように、制御入力生成部３６においてロボット５の動作に関する最適化が行われる。よって、この場合、環境マップｂにおいて確度が低い領域を計測するようにロボット５の動作計画が行われ、結果として未設定物体の計測が優先して行われる。例えば、図６の例において、障害物７２によって形成された計測装置７の死角に領域Ｇが存在する場合、環境マップｂにおいて確度が低い計測装置７の死角部分の領域を計測するようなロボットｉの動作計画が策定されることになる。

【0090】

（５－３）タイムステップ論理式生成部
タイムステップ論理式生成部３３は、目的タスクを完了するタイムステップ数（「目標タイムステップ数」とも呼ぶ。）を定め、目標タイムステップ数で目標論理式Ｌｔａｇを満たすような各タイムステップでの状態を表す命題の組み合わせを定める。この組み合わせは、通常複数存在するため、タイムステップ論理式生成部３３は、これらの組み合わせを論理和により結合した論理式を、タイムステップ論理式Ｌｔｓとして生成する。上述の組み合わせは、ロボット５に命令する動作のシーケンスを表す論理式の候補となり、以後では「候補φ」とも呼ぶ。

【0091】

ここで、図５に示すピックアンドプレイスの説明におけるタイムステップ論理式生成部３３の処理の具体例について説明する。

【0092】

ここでは、説明の簡略化のため、「最終的に対象物（ｉ＝２）が領域Ｇに存在する」という目的タスクが設定されたものとし、この目的タスクに対応する以下の目標論理式Ｌｔａｇが目標論理式生成部３２からタイムステップ論理式生成部３３へ供給されたものとする。なお、ここでは、未設定物体が存在しないものとし、命題ρに関する記載を説明便宜上省略する。
（◇□ｇ_２）∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）
この場合、タイムステップ論理式生成部３３は、命題「ｇ_ｉ」をタイムステップの概念を含むように拡張した命題「ｇ_ｉ，ｋ」を用いる。命題「ｇ_ｉ，ｋ」は、「タイムステップｋで対象物ｉが領域Ｇに存在する」という命題である。

【0093】

ここで、目標タイムステップ数を「３」とした場合、目標論理式Ｌｔａｇは、以下のように書き換えられる。
（◇□ｇ_２,３）∧（∧_{ｋ＝１,２,３}□￢ｈ_ｋ）∧（∧_{ｉ,ｋ＝１,２,３}□￢ｏ_ｉ,ｋ）
また、◇□ｇ_２,３は、以下の式（１）に示すように書き換えることが可能である。

【0094】

【数1】

【0095】

このとき、上述した目標論理式Ｌｔａｇは、以下の式（２）～式（５）に示される４つの候補「φ_１」～「φ_４」の論理和（φ_１∨φ_２∨φ_３∨φ_４）により表される。

【0096】

【数2】

【0097】

よって、タイムステップ論理式生成部３３は、４つの候補φ_１～φ_４の論理和をタイムステップ論理式Ｌｔｓとして定める。この場合、タイムステップ論理式Ｌｔｓは、４つの候補φ_１～φ_４の少なくともいずれかが真となる場合に真となる。なお、各候補φ_１～φ_４の制約条件に相当する部分「（∧_{ｋ＝１,２,３}□￢ｈ_ｋ）∧（∧_{ｉ,ｋ＝１,２,３}□￢ｏ_ｉ,ｋ）」については、候補φ_１～φ_４に組み込む代わりに、制御入力生成部３６による最適化処理において候補φ_１～φ_４と論理積により結合させてもよい。

【0098】

次に、図６に示すロボット５が移動体である例の場合について説明する。ここでは、説明の簡略化のため、「最終的にロボット（ｉ＝２）が領域Ｇに存在する」という目的タスクが設定されたものとし、この目的タスクに対応する以下の目標論理式Ｌｔａｇが目標論理式生成部３２からタイムステップ論理式生成部３３へ供給されたものとする。この場合、以下の目標論理式Ｌｔａｇが目標論理式生成部３２からタイムステップ論理式生成部３３へ供給される。なお、ここでは、未設定物体が存在しないものとし、命題ρに関する記載を説明便宜上省略する。
（◇□ｇ_２）∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）

【0099】

この場合、タイムステップ論理式生成部３３は、命題「ｇ_ｉ」をタイムステップの概念を含むように拡張した命題「ｇ_ｉ，ｋ」を用いる。ここで、命題「ｇ_ｉ，ｋ」は、「タイムステップｋでロボットｉが領域Ｇに存在する」という命題である。ここで、目標タイムステップ数を「３」とした場合、目標論理式Ｌｔａｇは、以下のように書き換えられる。
（◇□ｇ_２,３）∧（∧_{ｋ＝１,２,３}□￢ｈ_ｋ）∧（∧_{ｉ,ｋ＝１,２,３}□￢ｏ_ｉ,ｋ）

【0100】

また、◇□ｇ_２,３は、ピックアンドプレイスの例と同様、式（１）に書き換えることが可能である。そして、目標論理式Ｌｔａｇは、ピックアンドプレイスの例と同様、式（２）～式（５）に示される４つの候補「φ_１」～「φ_４」の論理和（φ_１∨φ_２∨φ_３∨φ_４）により表される。よって、タイムステップ論理式生成部３３は、４つの候補φ_１～φ_４の論理和をタイムステップ論理式Ｌｔｓとして定める。この場合、タイムステップ論理式Ｌｔｓは、４つの候補φ_１～φ_４の少なくともいずれかが真となる場合に真となる。

【0101】

なお、未設定物体が存在する場合には、タイムステップ論理式生成部３３は、命題ρを満たす１又は複数の候補φを決定し、候補φの組み合わせを論理和により結合した論理式を、タイムステップ論理式Ｌｔｓとして生成する。

【0102】

次に、目標タイムステップ数の設定方法について補足説明する。

【0103】

タイムステップ論理式生成部３３は、例えば、指示装置２から供給される入力信号により指定された作業の見込み時間に基づき、目標タイムステップ数を決定する。この場合、タイムステップ論理式生成部３３は、メモリ１２又は記憶装置４に記憶された、１タイムステップ当たりの時間幅の情報に基づき、上述の見込み時間から目標タイムステップ数を算出する。他の例では、タイムステップ論理式生成部３３は、目的タスクの種類毎に適した目標タイムステップ数を対応付けた情報を予めメモリ１２又は記憶装置４に記憶しておき、当該情報を参照することで、実行すべき目的タスクの種類に応じた目標タイムステップ数を決定する。

【0104】

好適には、タイムステップ論理式生成部３３は、目標タイムステップ数を所定の初期値に設定する。そして、タイムステップ論理式生成部３３は、制御入力生成部３６が制御入力を決定できるタイムステップ論理式Ｌｔｓが生成されるまで、目標タイムステップ数を徐々に増加させる。この場合、タイムステップ論理式生成部３３は、設定した目標タイムステップ数により制御入力生成部３６が最適化処理を行った結果、最適解を導くことができなかった場合、目標タイムステップ数を所定数（１以上の整数）だけ加算する。

【0105】

このとき、タイムステップ論理式生成部３３は、目標タイムステップ数の初期値を、ユーザが見込む目的タスクの作業時間に相当するタイムステップ数よりも小さい値に設定するとよい。これにより、タイムステップ論理式生成部３３は、不必要に大きな目標タイムステップ数を設定することを好適に抑制する。

【0106】

（５－４）環境マップ更新部
まず、ロボット動作期間Ｔｗ前の動作計画時点では、環境マップ更新部３４は、制御信号Ｓ１の生成に用いる環境マップｂを生成する。この場合、環境マップ更新部３４は、例えば、対象の空間又は領域において確率的なマップを生成することが可能なＯｃｃｕｐａｎｃｙＧｒｉｄＭａｐｓなどの技術を用い、計測信号Ｓ２に基づき環境マップｂを生成する。この場合、計測装置７により計測された空間（「計測済空間」とも呼ぶ。）の確度は、計測装置７により計測されていない空間（「未計測空間」とも呼ぶ。）の確度よりも高い値に設定される。また、環境マップ更新部３４は、マップ・物体事前情報Ｉ８に環境マップｂの初期状態を指定する情報が含まれている場合には、マップ・物体事前情報Ｉ８と計測信号Ｓ２との両方に基づき、環境マップｂを生成する。

【0107】

図７は、初期状態における未計測空間５０と、計測済空間５１との関係を概略的に表したロボット５の作業空間の俯瞰図である。図７の例では、一例として、計測装置７は、移動型のロボット５に対して固定され、ロボット５の前方を正面方向とする半円を計測範囲とする。

【0108】

この場合、環境マップ更新部３４は、計測信号Ｓ２に基づき計測済空間５１を認識し、かつ、計測済空間５１以外の作業空間を未計測空間５０として認識する。なお、環境マップ更新部３４は、ロボット５の位置及び姿勢、計測装置７のロボット５に対する設置位置及び設置角度、及び計測装置７の視野角及び計測可能距離等に基づき計測済空間５１を特定してもよい。

【0109】

そして、環境マップ更新部３４は、計測済空間５１に対応する環境マップｂの空間（２次元空間、即ち、領域を含む、以下同じ）の確度を、未計測空間５０に対応する環境マップｂの空間の確度よりも高い値に設定する。なお、簡易的な例では、環境マップ更新部３４は、計測済空間５１に対応する環境マップｂの空間の確度を最大値「１」とし、未計測空間５０に対応する環境マップｂの空間の確度を最小値「０」としてもよい。なお、この例の他、環境マップ更新部３４は、上述したＯｃｃｕｐａｎｃｙＧｒｉｄＭａｐｓなどの技術に基づき、環境マップｂの空間の確度を０から１までの任意の実数値に設定してもよい。また、環境マップｂは、離散値のマップとして２次元又は３次元のグリッド毎に確度の情報を有してもよい。

【0110】

また、環境マップ更新部３４は、ロボット５が動作するロボット動作期間Ｔｗでは、計測装置７が出力する最新の計測信号Ｓ２に基づき、所定時間間隔ごとに環境マップｂを更新する。

【0111】

図８は、ロボット５が移動軌跡５４に従い移動した後の未計測空間５０と、計測済空間５１との関係を概略的に表したロボット５の作業空間の俯瞰図である。図８の例では、ロボット５は、図７に示す初期位置から所定距離だけ直進している。この場合、環境マップ更新部３４は、制御信号Ｓ１に基づき、計測済空間５１を認識する。図８では、初期状態での計測済空間５１を既存計測空間５１０とし、ロボット５の移動により新たに計測された計測済空間５１を新規計測空間５２０として表示している。この場合、環境マップ更新部３４は、計測済空間５１に対応する環境マップｂの確度が、未計測空間５０に対応する環境マップｂの確度よりも高い値になるように環境マップｂを更新する。

【0112】

ここで、マップ更新モデルｂ^＋について補足説明する。マップ更新モデルｂ^＋は、動作計画時点での環境マップｂ、状態ベクトル及び予測されるロボット５への入力ベクトルから環境マップｂの時間変化を予測するモデルとなる。例えば、マップ更新モデルｂ^＋は、図７に示す初期状態に対応する状態ベクトル及び環境マップｂと、移動軌跡５４に沿ってロボット５を移動させる入力ベクトルとが入力された場合、図８に示す新規計測空間５２０に相当する領域の確度を高くした環境マップｂを出力する。マップ更新モデルｂ^＋については、「（５－５）抽象モデル生成部」のセクションにてさらに説明する。

【0113】

（５－５）抽象モデル生成部
抽象モデル生成部３５は、ダイナミクスモデル情報Ｉ５と、抽象状態設定情報ＩＳと、環境マップｂと、マップ更新モデルｂ^＋とに基づき、抽象モデルΣを生成する。ここで、抽象モデルΣは、ダイナミクスモデルとマップ更新モデルｂ^＋とを表したモデルとなる。以後では、まず、抽象モデルΣのダイナミクスモデルについて説明する。

【0114】

例えば、目的タスクがピックアンドプレイスの場合のダイナミクスモデルについて説明する。この場合、対象物の位置や数、対象物を置く領域の位置、ロボット５の台数（又はロボットアーム５２の数）等を特定しない汎用的な形式の抽象モデルがダイナミクスモデル情報Ｉ５に記録されている。そして、抽象モデル生成部３５は、ダイナミクスモデル情報Ｉ５に記録された、ロボット５のダイナミクスを含む汎用的な形式のモデルに対し、抽象状態設定部３１による物体の認識結果を反映することで、ダイナミクスモデルを生成する。これにより、抽象モデルΣは、作業空間内の物体の状態と、ロボット５のダイナミクスとが抽象的に表されたモデルとなる。作業空間内の物体の状態は、ピックアンドプレイスの場合には、対象物の位置及び数、対象物を置く領域の位置、ロボット５の台数等を示す。

【0115】

ここで、ピックアンドプレイスを伴う目的タスクの作業時においては、作業空間内のダイナミクスが頻繁に切り替わる。例えば、図５に示されるピックアンドプレイスの例では、ロボットアーム５２が対象物ｉを掴んでいる場合には、当該対象物ｉを動かすことができるが、ロボットアーム５２が対象物ｉを掴んでない場合には、当該対象物ｉを動かすことができない。

【0116】

以上を勘案し、本実施形態においては、ピックアンドプレイスの場合、対象物ｉを掴むという動作を論理変数「δ_ｉ」により抽象表現する。この場合、例えば、抽象モデル生成部３５は、図５のピックアンドプレイスの例における作業空間に対して設定すべき抽象モデルΣのダイナミクスモデルを、以下の式（６）により定めることができる。

【0117】

【数3】

【0118】

ここで、「ｕ_ｊ」は、ロボットハンドｊ（「ｊ＝１」はロボットハンド５３ａ、「ｊ＝２」はロボットハンド５３ｂ）を制御するための制御入力を示し、「Ｉ」は単位行列を示し、「０」は零行例を示す。なお、制御入力は、ここでは、一例として速度を想定しているが、加速度であってもよい。また、「δ_ｊ,ｉ」は、ロボットハンドｊが対象物ｉを掴んでいる場合に「１」であり、その他の場合に「０」である論理変数である。また、「ｘ_ｒ１」、「ｘ_ｒ２」は、ロボットハンドｊ（ｊ＝１、２）の位置ベクトル、「ｘ_１」～「ｘ_４」は、対象物ｉ（ｉ＝１～４）の位置ベクトルを示す。また、「ｈ（ｘ）」は、対象物を掴める程度に対象物の近傍にロボットハンドが存在する場合に「ｈ（ｘ）≧０」となる変数であり、論理変数δとの間で以下の関係を満たす。
δ＝１ ⇔ ｈ（ｘ）≧０
この式では、対象物を掴める程度に対象物の近傍にロボットハンドが存在する場合には、ロボットハンドが対象物を掴んでいるとみなし、論理変数δを１に設定している。

【0119】

ここで、式（６）は、タイムステップｋでの物体の状態とタイムステップｋ＋１での物体の状態との関係を示した差分方程式である。そして、上記の式（６）では、把持の状態が離散値である論理変数により表わされ、物体の移動は連続値により表わされているため、式（６）はハイブリッドシステムを示している。

【0120】

また、式（６）では、ロボット５全体の詳細なダイナミクスではなく、対象物を実際に把持するロボット５の手先であるロボットハンドのダイナミクスのみを考慮している。これにより、制御入力生成部３６による最適化処理の計算量を好適に削減することができる。

【0121】

また、ダイナミクスモデル情報Ｉ５には、ダイナミクスが切り替わる動作（ピックアンドプレイスの場合には対象物ｉを掴むという動作）に対応する論理変数、及び、計測信号Ｓ２等に基づく物体の認識結果から式（６）の差分方程式を導出するための情報が記録されている。よって、抽象モデル生成部３５は、対象物の位置や数、対象物を置く領域（図５では領域Ｇ）、ロボット５の台数等が変動する場合であっても、ダイナミクスモデル情報Ｉ５と物体の認識結果とに基づき、対象の作業空間の環境に即した抽象モデルΣのダイナミクスモデルを決定することができる。

【0122】

なお、他作業体が存在する場合、他作業体の抽象化されたダイナミクスに関する情報がダイナミクスモデル情報Ｉ５に含まれてもよい。この場合、抽象モデルΣのダイナミクスモデルは、作業空間内の物体の状態と、ロボット５のダイナミクスと、他作業体のダイナミクスとが抽象的に表されたモデルとなる。また、抽象モデル生成部３５は、式（６）に示されるモデルに代えて、混合論理動的（ＭＬＤ：ＭｉｘｅｄＬｏｇｉｃａｌＤｙｎａｍｉｃａｌ）システムまたはペトリネットやオートマトンなどを組み合わせたハイブリッドシステムのモデルを生成してもよい。

【0123】

次に、図６に示すロボット５が移動体である場合の抽象モデルΣのダイナミクスモデルについて説明する。この場合、抽象モデル生成部３５は、例えば、図６に示される作業空間に対して設定すべき抽象モデルΣのダイナミクスモデルを、ロボット（ｉ＝１）に対する状態ベクトルｘ１及びロボット（ｉ＝２）に対する状態ベクトルｘ２を用いて、以下の式（７）により定める。

【0124】

【数4】

【0125】

ここで、「ｕ_１」は、ロボット（ｉ＝１）に対する入力ベクトルを表し、「ｕ_２」は、ロボット（ｉ＝２）に対する入力ベクトルを表す。また、「Ａ_１」、「Ａ_２」、「Ｂ_１」、「Ｂ_２」は行列であり、ダイナミクスモデル情報Ｉ５に基づき定められる。

【0126】

他の例では、抽象モデル生成部３５は、ロボットｉの動作モードが複数存在する場合には、図６に示される作業空間に対して設定すべき抽象モデルΣのダイナミクスモデルを、ロボットｉの動作モードに応じてダイナミクスが切り替わるハイブリッドシステムにより表してもよい。この場合、抽象モデル生成部３５は、ロボットｉの動作モードを「ｍｉ」とすると、図６に示される作業空間に対して設定すべき抽象モデルΣのダイナミクスモデルを、以下の式（８）により定める。

【0127】

【数5】

【0128】

このように、抽象モデル生成部３５は、ロボット５が移動体である場合においても、抽象モデルΣのダイナミクスモデルを好適に定めることができる。なお、抽象モデル生成部３５は、式（７）又は式（８）に示されるモデルに代えて、ＭＬＤシステムまたはペトリネットやオートマトンなどを組み合わせたハイブリッドシステムのモデルを生成してもよい。

【0129】

なお、式（６）～式（８）等に示される抽象モデルΣにおける対象物やロボット５の状態を表すベクトルｘ_ｉ及び入力ｕ_ｉは、離散値であってもよい。ベクトルｘ_ｉ及び入力ｕ_ｉを離散的に表した場合であっても、抽象モデル生成部３５は、現実のダイナミクスを好適に抽象化した抽象モデルΣを設定することができる。また、ロボット５が移動を行い、かつ、ピックアンドプレイスを行う目的タスクが設定されていた場合には、抽象モデル生成部３５は、例えば、式（８）に示されるような動作モードの切り替えを想定したダイナミクスモデルを設定する。

【0130】

次に、抽象モデルΣに含めるマップ更新モデルｂ^＋について説明する。

【0131】

マップ更新モデルｂ^＋は、ある時点での環境マップｂと、状態ベクトルｘと、ロボット５への入力ベクトルｕとに基づき、次の時点での環境マップｂを予測する関数となる。よって、環境マップｂは、状態ベクトルｘ、ロボット５への入力ベクトルｕ、マップ更新モデルｂ^＋に相当する関数「ｆ」、タイムステップｋ、及び、誤差ベクトル「ｎｖ」を用いた以下の差分方程式により表される。
ｂ_ｋ＋１＝ｆ（ｂ_ｋ，ｘ_ｋ，ｕ_ｋ）＋ｎｖ_ｋ

【0132】

関数ｆ及び誤差ベクトルｎｖに関する情報は、例えば、マップ更新モデル情報Ｉ７に記憶されている。また、状態ベクトルｘ、入力ベクトルｕ及び環境マップｂは、以下のように表される。ここでは、ロボット５の数を「Ｍ」とし、環境マップｂをグリッド数「ｎ」の離散マップと仮定している。
ｘ＝［ｘ_１ ^Ｔ，ｘ_２ ^Ｔ…，ｘ_Ｍ ^Ｔ］^Ｔ
ｕ＝［ｕ_１ ^Ｔ，ｕ_２ ^Ｔ…，ｕ_Ｍ ^Ｔ］^Ｔ
ｂ＝［ｐ_１，ｐ_２…，ｐ_ｎ］^Ｔ
各要素ｘ_１，ｘ_２…，ｘ_Ｍ、ｕ_１，ｕ_２…，ｕ_Ｍはロボット毎の状態又は入力を表すベクトルであり、ｐ_ｉ∈［０，１］（ｉ＝１～ｎ）は各グリッドの確度を表す。また、ｘとｕは、例えば式（７）に示すダイナミクスモデルの場合、以下のように表される。
ｘ_ｋ＋１＝Ａｘ_ｋ＋Ｂｕ_ｋ

【0133】

なお、環境マップｂに関する上述の差分方程式では、誤差ベクトルｎｖを用いて確率的に環境マップｂに定めているが、これに代えて、誤差ベクトルｎｖを用いずに環境マップｂを確定的に定めてもよい。

【0134】

（５－６）制御入力生成部
制御入力生成部３６は、タイムステップ論理式生成部３３から供給されるタイムステップ論理式Ｌｔｓと、抽象モデル生成部３５から供給される抽象モデルΣとに基づき、最適となるタイムステップ毎のロボット５に対する制御入力を決定する。この場合、制御入力生成部３６は、目的タスクに対する評価関数を定義し、抽象モデルΣ及びタイムステップ論理式Ｌｔｓを制約条件として評価関数を最小化する最適化問題を解く。評価関数は、例えば、目的タスクの種類毎に予め定められ、メモリ１２又は記憶装置４に記憶されている。

【0135】

例えば、制御入力生成部３６は、制御入力「ｕ_ｋ」と環境評価値ｙとに基づき、評価関数を設定する。この場合、制御入力生成部３６は、制御入力ｕ_ｋが小さい（即ちロボット５が費やすエネルギーが小さい）ほど小さくなり、かつ、未設定物体が存在する場合には環境評価値ｙが大きい（即ち作業空間全体での情報の確度が高い）ほど小さくような評価関数の最小化を行う。具体的には、制御入力生成部３６は、抽象モデルΣと、タイムステップ論理式Ｌｔｓ（即ち候補φ_ｉの論理和）に基づく論理式とを制約条件とする以下の式（９）に示す制約付き混合整数最適化問題を解く。

【0136】

【数6】

「α」は０以上の定数を表し、「Ｔ」は、最適化の対象となるタイムステップ数であり、目標タイムステップ数であってもよく、目標タイムステップ数よりも小さい所定数であってもよい。

【0137】

ここで、評価関数の項「－αｙ_ｋ」及び論理式の「ρ_Ｔ∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）」は、未設定物体が存在する場合を考慮して設けられている。これらを設けることで、「ｈ」及び「ｏ_ｉ」により規定される一般的な制約条件を満たしつつ、環境マップｂの確度を上げるように制御入力ｕ_ｋを決定することが可能となる。

【0138】

好適には、未設定物体が存在する場合、制御入力生成部３６は、タイムステップ論理式Ｌｔｓに相当する候補φ_ｉの論理和「∨_ｉφ_ｉ」については、自動的に偽であると判定するとよい。一方、未設定物体が存在しない場合、制御入力生成部３６は、好適には、評価関数の項「－αｙ_ｋ」及び論理式の「ρ_Ｔ∧（□￢ｈ）∧（∧_ｉ□￢ｏ_ｉ）」を削除して制御入力ｕ_ｋの最適化を行うとよい。

【0139】

このように、制御入力生成部３６は、環境マップｂ及びマップ更新モデルｂ^＋に基づく環境評価値ｙ及び命題ρを含む最適化問題を解くことで最適な制御入力ｕ_ｋを決定する。これにより、制御入力生成部３６は、未設定物体が存在する場合には作業空間内の情報の確度を上げて設定物体を計測できるように制御入力ｕ_ｋを決定し、未設定物体が存在しない場合には目的タスクを達成するように制御入力ｕ_ｋを決定することができる。

【0140】

また、好適には、制御入力生成部３６は、論理変数を連続値に近似する（連続緩和問題とする）とよい。これにより、制御入力生成部３６は、計算量を好適に低減することができる。なお、線形論理式（ＬＴＬ）に代えてＳＴＬを採用した場合には、非線形最適化問題として記述することが可能である。また、環境マップｂ及びマップ更新モデルｂ^＋は、上述した方法の他、任意の強化学習の方法に基づき最適化問題に組み込まれてもよい。

【0141】

また、制御入力生成部３６は、目標タイムステップ数が長い場合（例えば所定の閾値より大きい場合）、最適化に用いるタイムステップ数を、目標タイムステップ数より小さい値（例えば上述の閾値）に設定してもよい。この場合、制御入力生成部３６は、例えば、所定のタイムステップ数が経過する毎に、上述の最適化問題を解くことで、逐次的に制御入力ｕ_ｋを決定する。この場合、制御入力生成部３６は、目的タスクの達成状態に対する中間状態に相当する所定のイベント毎に、上述の最適化問題を解き、制御入力ｕ_ｋを決定してもよい。この場合、制御入力生成部３６は、次のイベント発生までのタイムステップ数を、最適化に用いるタイムステップ数に設定する。上述のイベントは、例えば、作業空間におけるダイナミクスが切り替わる事象である。例えば、ピックアンドプレイスを目的タスクとした場合には、ロボット５が対象物を掴む、ロボット５が運ぶべき複数の対象物のうちの１つの対象物を目的地点へ運び終える、などがイベントとして定められる。イベントは、例えば、目的タスクの種類毎に予め定められており、目的タスクの種類毎にイベントを特定する情報が記憶装置４に記憶されている。

【0142】

（５－７）ロボット制御部
ロボット制御部３７は、制御入力生成部３６から供給される制御入力情報Ｉｃｎと、アプリケーション情報記憶部４１が記憶するサブタスク情報Ｉ４とに基づき、サブタスクのシーケンスを生成する。この場合、ロボット制御部３７は、サブタスク情報Ｉ４を参照することで、ロボット５が受け付け可能なサブタスクを認識し、制御入力情報Ｉｃｎが示すタイムステップ毎の制御入力をサブタスクに変換する。

【0143】

例えば、サブタスク情報Ｉ４には、ピックアンドプレイスを目的タスクとする場合にロボット５が受け付け可能なサブタスクとして、ロボットハンドの移動（リーチング）とロボットハンドの把持（グラスピング）の２つのサブタスクを示す関数が定義されている。この場合、リーチングを表す関数「Ｍｏｖｅ」は、例えば、当該関数実行前のロボット５の初期状態、当該関数実行後のロボット５の最終状態、及び当該関数の実行に要する所要時間をそれぞれ引数とする関数である。また、グラスピングを表す関数「Ｇｒａｓｐ」は、例えば、当該関数実行前のロボット５の状態、及び当該関数実行前の把持対象の対象物の状態、論理変数δをそれぞれ引数とする関数である。ここで、関数「Ｇｒａｓｐ」は、論理変数δが「１」のときに掴む動作を行うこと表し、論理変数δが「０」のときに放す動作を行うこと表す。この場合、ロボット制御部３７は、関数「Ｍｏｖｅ」を、制御入力情報Ｉｃｎが示すタイムステップ毎の制御入力により定まるロボットハンドの軌道に基づき決定し、関数「Ｇｒａｓｐ」を、制御入力情報Ｉｃｎが示すタイムステップ毎の論理変数δの遷移に基づき決定する。

【0144】

そして、ロボット制御部３７は、関数「Ｍｏｖｅ」と関数「Ｇｒａｓｐ」とにより構成されるシーケンスを生成し、当該シーケンスを表す制御信号Ｓ１をロボット５に供給する。例えば、目的タスクが「最終的に対象物（ｉ＝２）が領域Ｇに存在する」の場合、ロボット制御部３７は、対象物（ｉ＝２）に最も近いロボットハンドに対し、関数「Ｍｏｖｅ」、関数「Ｇｒａｓｐ」、関数「Ｍｏｖｅ」、関数「Ｇｒａｓｐ」のシーケンスを生成する。この場合、対象物（ｉ＝２）に最も近いロボットハンドは、１回目の関数「Ｍｏｖｅ」により対象物（ｉ＝２）の位置まで移動し、１回目の関数「Ｇｒａｓｐ」により対象物（ｉ＝２）を把持し、２回目の関数「Ｍｏｖｅ」により領域Ｇまで移動し、２回目の関数「Ｇｒａｓｐ」により対象物（ｉ＝２）を領域Ｇに載置する。

【0145】

（５－８）抽象状態比較部
抽象状態比較部３８は、ロボット動作期間Ｔｗにおいて、抽象状態設定部３１から供給される計測抽象状態Ｓｔｍと、制御入力情報Ｉｃｎに基づく予測抽象状態Ｓｔｐとを比較し、抽象モデルΣの再生成の要否判定を行う。ここで、予測抽象状態Ｓｔｐの取得方法について補足説明する。抽象状態比較部３８は、例えば、制御入力生成部３６が実行した最適化処理の処理結果を表す制御入力情報Ｉｃｎに基づき、タイムステップ毎に予測される各物体の状態の軌跡を認識する。そして、抽象状態比較部３８は、現時点に対応するタイムステップでの予測される状態を、予測抽象状態Ｓｔｐとして決定する。

【0146】

ここで、抽象状態比較部３８は、計測抽象状態Ｓｔｍと予測抽象状態Ｓｔｐとに実質的な差異があると判定した場合、抽象モデルΣを再生成する必要があると判定する。「計測抽象状態Ｓｔｍと予測抽象状態Ｓｔｐとに実質的な差異がある」場合とは、例えば、抽象状態を規定する物体の個数が異なる場合、同一物体の位置が所定距離以上異なる場合、又は、その他所定の条件を満たす場合を指す。この場合、抽象状態比較部３８は、計測装置７により未設定物体を検出した場合、又は、マップ・物体事前情報Ｉ８に基づき設定した物体の抽象状態と当該物体の計測結果とに差異があることを検出した場合等に、抽象モデルΣの再生成が必要であると好適に判定する。なお、抽象状態比較部３８は、上記の場合の他、予測外の障害物が発生した場合、予測外の動きを行う物体が存在する場合などにおいても、抽象モデルの再生成が必要であると判定する。

【0147】

そして、抽象状態比較部３８は、抽象モデルΣを再生成する必要があると判定した場合、計測抽象状態Ｓｔｍを抽象モデル生成部３５に供給する。なお、計測抽象状態Ｓｔｍは、作業空間内の各物体（検出された未設定物体を含む）の位置・姿勢等の抽象的な状態を表す最新の情報となる。そして、抽象モデル生成部３５は、計測抽象状態Ｓｔｍと、環境マップ更新部３４が生成する最新の環境マップｂとに基づき、現在の抽象状態を反映した抽象モデルΣを生成する。そして、制御入力生成部３６は、生成された抽象モデルΣを制約条件として式（９）に示される最適化問題を構築し、構築した最適化問題を解く。これにより、制御入力生成部３６は、最新の抽象状態を勘案した最適なロボット５の動作計画を表す制御入力を好適に生成することができる。これにより、ロボット５の動作が再計画され、最新の計測結果に基づきロボット５の動作のシーケンスが好適に決定される。

【0148】

（６）処理フロー
図９は、第１実施形態においてロボットコントローラ１が実行するロボット制御処理の概要を示すフローチャートの一例である。

【0149】

まず、ロボットコントローラ１の抽象状態設定部３１は、作業空間に存在する物体の抽象状態を設定する（ステップＳ１１）。ここで、抽象状態設定部３１は、例えば、所定の目的タスクの実行を指示する外部入力を指示装置２等から受信した場合に、ステップＳ１１を実行する。ステップＳ１１では、抽象状態設定部３１は、例えば、抽象状態指定情報Ｉ１、物体モデル情報Ｉ６、マップ・物体事前情報Ｉ８及び計測信号Ｓ２に基づき、目的タスクに関連する物体に関する命題及び位置・姿勢等の状態ベクトルを設定する。なお、抽象状態設定部３１は、計測信号Ｓ２と抽象状態指定情報Ｉ１に基づき、未設定物体が存在すると判定した場合には、未設定物体に対する位置等の状態ベクトルを未定のまま当該未設定物体に関する命題を設定する。

【0150】

次に、目標論理式生成部３２は、ステップＳ１１の処理結果を表す抽象状態設定情報ＩＳに基づき、目標論理式Ｌｔａｇを決定する（ステップＳ１２）。この場合、目標論理式生成部３２は、制約条件情報Ｉ２を参照することで、目的タスクの実行における制約条件を、目標論理式Ｌｔａｇに付加する。

【0151】

そして、タイムステップ論理式生成部３３は、目標論理式Ｌｔａｇを、各タイムステップでの状態を表すタイムステップ論理式Ｌｔｓに変換する（ステップＳ１３）。この場合、タイムステップ論理式生成部３３は、目標タイムステップ数を定め、目標タイムステップ数で目標論理式Ｌｔａｇを満たすような各タイムステップでの状態を表す候補φの論理和を、タイムステップ論理式Ｌｔｓとして生成する。この場合、好適には、タイムステップ論理式生成部３３は、動作限界情報Ｉ３を参照することで、各候補φの実行可能性を判定し、実行不可能と判定される候補φを、タイムステップ論理式Ｌｔｓから除外するとよい。

【0152】

次に、環境マップ更新部３４は、環境マップｂを生成する（ステップＳ１４）。この場合、環境マップ更新部３４は、例えば、計測信号Ｓ２と、マップ・物体事前情報Ｉ８とに基づき、環境マップｂを生成する。そして、抽象モデル生成部３５は、抽象モデルΣを生成する（ステップＳ１５）。この場合、抽象モデル生成部３５は、環境マップｂ、抽象状態設定情報ＩＳ、ダイナミクスモデル情報Ｉ５、マップ更新モデル情報Ｉ７等に基づき、ダイナミクスモデルとマップ更新モデルｂ^＋とを表した抽象モデルΣを生成する。

【0153】

そして、制御入力生成部３６は、ステップＳ１１～ステップＳ１５の処理結果に基づき最適化問題を構築し、構築した最適化問題を解くことで制御入力を決定する（ステップＳ１６）。この場合、例えば、制御入力生成部３６は、式（９）に示されるような最適化問題を構築し、制御入力及び環境評価値ｙに基づき設定された評価関数を最小化するような制御入力を決定する。

【0154】

そして、ロボット制御部３７は、ステップＳ１６で決定された制御入力に基づき、ロボット５の制御を行う（ステップＳ１７）。この場合、例えば、ロボット制御部３７は、ステップＳ１６で決定された制御入力を、サブタスク情報Ｉ４を参照してロボット５が解釈可能なサブタスクのシーケンスに変換し、当該シーケンスを表す制御信号Ｓ１をロボット５に供給する。

【0155】

そして、ロボットコントローラ１は、目的タスクが完了したか否か判定する（ステップＳ１８）。ロボットコントローラ１は、例えば、ロボット５から正常完了を表す信号を受信した場合、又は、作業空間内の物体が目的タスクを達成したゴール状態になったことを計測信号Ｓ２に基づき検知した場合、目的タスクが完了したと判定する。そして、ロボットコントローラ１は、目的タスクが完了したと判定した場合（ステップＳ１８；Ｙｅｓ）、フローチャートの処理を終了する。一方、目的タスクが完了していない場合（ステップＳ１８；Ｎｏ）、環境マップ更新部３４は、最新の計測信号Ｓ２に基づき環境マップｂを更新する（ステップＳ１９）。

【0156】

そして、抽象状態比較部３８は、抽象状態の変化を監視する（ステップＳ２０）。具体的には、抽象状態比較部３８は、制御入力生成部３６が実行する最適化処理の処理結果を表す制御入力情報Ｉｃｎに基づき、比較時点での予測される抽象状態を表す予測抽象状態Ｓｔｐを認識する。そして、抽象状態比較部３８は、最新の計測信号Ｓ２に基づき抽象状態設定部３１が設定した抽象状態を表す計測抽象状態Ｓｔｍと予測抽象状態Ｓｔｐとを比較する。

【0157】

そして、抽象状態比較部３８は、抽象状態の実質的な変化があったか否か判定する（ステップＳ２１）。そして、抽象状態比較部３８は、抽象状態の実質的な変化があったと判定した場合（ステップＳ２１；Ｙｅｓ）、ステップＳ１５へ処理を進める。その後、抽象モデルΣの生成及び制御入力の生成等が行われ、最新の抽象状態に基づいたロボット５の動作計画の再決定が行われる。一方、抽象状態比較部３８は、抽象状態の実質的な変化がないと判定した場合（ステップＳ２１；Ｎｏ）、引き続きステップＳ１８へ処理を戻す。この場合、当初の動作計画に基づき引き続きロボット５の制御が継続される。

【0158】

（７）変形例
図４に示すプロセッサ１１の機能ブロック構成は一例であり、種々の変更がなされてもよい。

【0159】

例えば、ロボット５に命令する動作のシーケンスの候補φの情報が記憶装置４に予め記憶され、プロセッサ１１は、当該情報に基づき、制御入力生成部３６の最適化処理を実行する。これにより、プロセッサ１１は、最適な候補φの選定とロボット５の制御入力の決定を行う。この場合、プロセッサ１１は、制御信号Ｓ１の生成において、目標論理式生成部３２及びタイムステップ論理式生成部３３に相当する機能を有しなくともよい。このように、図４に示すプロセッサ１１の一部の機能ブロックの実行結果に関する情報が予めアプリケーション情報記憶部４１に記憶されていてもよい。

【0160】

他の例では、アプリケーション情報には、目的タスクに対応する制御入力又はサブタスクシーケンスを設計するためのフローチャートなどの設計情報が予め含まれており、ロボットコントローラ１は、当該設計情報を参照することで、制御入力又はサブタスクシーケンスを生成してもよい。この場合、ロボットコントローラ１は、例えば、未設定物体の有無又は／及び環境評価値ｙに対する閾値処理などに基づき分岐された処理フローを実行する。なお、予め設計されたタスクシーケンスに基づきタスクを実行する具体例については、例えば特開２０１７－３９１７０号に開示されている。

【0161】

＜第２実施形態＞
図１０は、第２実施形態における制御装置１Ｘの概略構成図を示す。制御装置１Ｘは、主に、抽象状態設定手段３１Ｘと、環境マップ生成手段３４Ｘと、抽象モデル生成手段３５Ｘと、制御入力生成手段３６Ｘとを有する。なお、制御装置１Ｘは、複数の装置から構成されてもよい。制御装置１Ｘは、例えば、第１実施形態におけるロボットコントローラ１とすることができる。

【0162】

抽象状態設定手段３１Ｘは、ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定する。抽象状態設定手段３１Ｘは、作業空間内を計測するセンサの計測結果に基づき抽象状態を設定してもよく、予め生成された事前情報に基づき抽象状態を設定してもよい。例えば、第１実施形態における抽象状態設定部３１とすることができる。

【0163】

環境マップ生成手段３４Ｘは、作業空間内の情報の確度を表すマップである環境マップを生成する。環境マップ生成手段３４Ｘは、作業空間内を計測するセンサの計測結果に基づき環境マップを生成してもよく、予め生成された事前情報に基づき環境マップを設定してもよい。環境マップ生成手段３４Ｘは、例えば、第１実施形態における環境マップ更新部３４とすることができる。

【0164】

抽象モデル生成手段３５Ｘは、抽象状態のダイナミクスと環境マップの時間変化とを表す抽象モデルを生成する。抽象モデル生成手段３５Ｘは、例えば、第１実施形態における抽象モデル生成部３５とすることができる。

【0165】

制御入力生成手段３６Ｘは、抽象モデルに基づき、ロボットに対する制御入力を生成する。制御入力生成手段３６Ｘは、例えば、第１実施形態における制御入力生成部３６とすることができる。

【0166】

図１１は、第２実施形態において制御装置１Ｘが実行するフローチャートの一例である。まず、抽象状態設定手段３１Ｘは、ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定する（ステップＳ３１）。環境マップ生成手段３４Ｘは、作業空間内の環境マップを生成する（ステップＳ３２）。なお、ステップＳ３１とステップＳ３２とは順不同であり、同時に実行されてもよく、逆の順番により実行されてもよい。抽象モデル生成手段３５Ｘは、抽象状態のダイナミクスと環境マップの時間変化とを表す抽象モデルを生成する（ステップＳ３３）。制御入力生成手段３６Ｘは、抽象モデルに基づき、ロボットに対する制御入力を生成する（ステップＳ３４）。

【0167】

第２実施形態によれば、制御装置１Ｘは、作業空間における情報の不確実性を考慮してロボットを好適に動作させるための制御入力を好適に生成することができる。

【0168】

なお、上述した各実施形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（Non-Transitory Computer Readable Medium）を用いて格納され、コンピュータであるプロセッサ等に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記憶媒体（Tangible Storage Medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記憶媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記憶媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（Transitory Computer Readable Medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

【0169】

その他、上記の各実施形態の一部又は全部は、以下の付記のようにも記載され得るが以下には限られない。

【0170】

［付記１］
ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定する抽象状態設定手段と、
前記作業空間内の情報の確度を表すマップである環境マップを生成する環境マップ生成手段と、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成する抽象モデル生成手段と、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成する制御入力生成手段と、
を備える制御装置。
［付記２］
前記制御入力による前記ロボットの動作中において、前記抽象状態の変化に基づき、前記抽象モデルの再生成の要否を判定する抽象状態比較手段をさらに有する、付記１に記載の制御装置。
［付記３］
前記抽象状態比較手段は、前記制御入力による前記ロボットの動作中において、前記物体の個数又は位置の少なくとも一方の変化に基づき、前記抽象モデルの再生成の要否を判定する、付記２に記載の制御装置。
［付記４］
前記ロボットには、計測装置が備えられており、
前記ロボットの動作に応じて前記計測装置の計測範囲が変化し、
前記抽象状態設定手段は、前記ロボットの動作中において、前記計測装置が生成する計測信号に基づき、前記抽象状態の変化を特定する、付記２または３に記載の制御装置。
［付記５］
前記抽象状態比較手段は、前記計測信号に基づき設定された現在の前記抽象状態と、前記制御入力に基づき予測される現在の前記抽象状態との差に基づき、前記抽象モデルの再生成の要否を判定する、付記４に記載の制御装置。
［付記６］
前記制御入力生成手段は、前記抽象モデルと、前記環境マップが表す確度を評価する環境評価値とに基づき、前記制御入力を生成する、付記１～５のいずれか一項に記載の制御装置。
［付記７］
前記制御入力生成手段は、前記制御入力及び前記環境評価値を含む評価関数と、前記ロボットに作業させるタスクである目的タスクの実行において満たすべき制約条件とを設定し、前記評価関数と前記制約条件とに基づく最適化により前記制御入力を生成する、付記６に記載の制御装置。
［付記８］
最終目標を表す時相論理の論理式である目標論理式を生成する目標論理式生成手段と、
前記論理式から、前記ロボットに作業させるタスクである目的タスクを実行するためのタイムステップ毎の状態を表す論理式であるタイムステップ論理式を生成するタイムステップ論理式生成手段と、
をさらに有し、
前記制御入力生成手段は、前記抽象モデルと前記タイムステップ論理式とに基づき、前記制御入力を生成する、付記１～７のいずれか一項に記載の制御装置。
［付記９］
前記目標論理式生成手段は、前記目的タスクに対応する論理式と、前記環境マップが表す確度を評価する環境評価値に基づく命題との論理和を含む前記目標論理式を生成する、付記８に記載の制御装置。
［付記１０］
前記制御入力を、前記ロボットが実行可能なサブタスクのシーケンスに変換したサブタスクシーケンスを前記ロボットに供給するロボット制御手段をさらに有する、付記１～９のいずれか一項に記載の制御装置。
［付記１１］
前記環境マップ生成手段は、計測が行われた空間の当該計測後からの時間経過に基づき当該空間における前記確度を減衰させるように前記環境マップを更新する、付記１～１０のいずれか一項に記載の制御装置。
［付記１２］
コンピュータが、
ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定し、
前記作業空間内の情報の確度を表すマップである環境マップを生成し、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成し、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成する、
制御方法。
［付記１３］
ロボットが作業を行う作業空間における物体の抽象的な状態である抽象状態を設定し、
前記作業空間内の情報の確度を表すマップである環境マップを生成し、
前記抽象状態のダイナミクスと前記環境マップの時間変化とを表す抽象モデルを生成し、
前記抽象モデルに基づき、前記ロボットに対する制御入力を生成する処理をコンピュータに実行させるプログラムが格納された記憶媒体。

【0171】

以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。

【符号の説明】

【0172】

１ロボットコントローラ
１Ｘ制御装置
２指示装置
４記憶装置
５ロボット
７計測装置
４１アプリケーション情報記憶部
１００ロボット制御システム

【図1】