(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024162293
(43)【公開日】2024-11-21
(54)【発明の名称】ロボット、ロボットの行動決定システム及びそのプログラム
(51)【国際特許分類】
G05D 1/43 20240101AFI20241114BHJP
B25J 13/00 20060101ALI20241114BHJP
【FI】
G05D1/02 H
B25J13/00 Z
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023077663
(22)【出願日】2023-05-10
(71)【出願人】
【識別番号】899000068
【氏名又は名称】学校法人早稲田大学
(74)【代理人】
【識別番号】100114524
【弁理士】
【氏名又は名称】榎本 英俊
(72)【発明者】
【氏名】亀▲崎▼ 允啓
(72)【発明者】
【氏名】濱田 太郎
(72)【発明者】
【氏名】山口 皓大
(72)【発明者】
【氏名】三宅 太文
(72)【発明者】
【氏名】菅野 重樹
【テーマコード(参考)】
3C707
5H301
【Fターム(参考)】
3C707KS02
3C707KS03
3C707KS11
3C707KS39
3C707LS15
3C707LV14
3C707WL05
3C707WL07
5H301AA01
5H301BB14
5H301CC03
5H301CC06
5H301CC10
5H301GG08
5H301GG09
5H301LL01
5H301LL02
5H301LL06
5H301LL11
(57)【要約】
【課題】人間と協働して一連の作業を行う際に、人間の行動状況に適応した動作を可能にする。
【解決手段】ロボット10は、複数のタスクからなる一連の作業を協働者と協調しながら実行するようにロボット10を動作制御する制御装置13を備える。制御装置13は、協働者の位置情報及び速度情報の経時的変化に基づき、協働者のタスクに対する行動を推定する協働者行動推定部24と、当該推定された協働者の行動に応じたロボット10の動作計画を設定する動作計画設定部25とを備えている。動作計画設定部25では、通常行動、依頼行動、支援行動からなる行動選択肢について動作計画をそれぞれ作成し、ロボット及び協働者が実行するタスクの負荷に対応する協働作業コストを求めて行動選択肢の各行動を比較し、適切となる行動の動作計画を選択する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
所定のタスクを実行可能に動作する動作部と、周囲の環境情報を検出する検出装置と、当該検出装置の検出結果に基づき前記動作部を動作制御する制御装置とを備え、複数の前記タスクからなる一連の作業を協働者と協調しながら実行するロボットにおいて、
前記検出装置では、協働者を含むロボット周囲の物体の位置情報及び速度情報が検出され、
前記制御装置は、協働者の前記位置情報及び前記速度情報の経時的変化に基づき、協働者の前記タスクに対する行動を推定する協働者行動推定部と、当該協働者行動推定部で推定された協働者の行動に応じたロボットの移動軌道を含む動作計画を設定する動作計画設定部と、前記動作計画に従ってロボットが動作するように前記動作部を制御する動作指令部とを備え、
前記動作計画設定部では、ロボット及び協働者が事前設定により互いに与えられた前記タスクを実行する通常行動と、ロボットが自身の前記タスクの少なくとも1部を前記協働者に代替してもらう依頼行動と、ロボットが協働者の前記タスクの少なくとも1部を代替する支援行動とからなる行動選択肢について、前記動作計画をそれぞれ作成し、ロボット及び協働者が実行する前記タスクの負荷に対応する協働作業コストを求め、当該協働作業コストに基づいて前記行動選択肢の各行動を比較し、適切となる行動の前記動作計画を選択することを特徴とするロボット。
【請求項2】
所定のタスクを実行可能に動作する動作部と、周囲の環境情報を検出する検出装置と、当該検出装置の検出結果に基づき前記動作部を動作制御する制御装置とを備え、複数の前記タスクからなる一連の作業を協働者と協調しながら実行するロボットにおいて、
前記検出装置では、協働者を含むロボット周囲の物体の位置情報及び速度情報が検出され、
前記制御装置は、協働者の前記位置情報及び前記速度情報の経時的変化に基づき、協働者の前記タスクに対する行動を推定する協働者行動推定部と、当該協働者行動推定部で推定された協働者の行動に応じたロボットの移動軌道を含む動作計画を設定する動作計画設定部と、前記動作計画に従ってロボットが動作するように前記動作部を制御する動作指令部とを備え、
前記動作計画設定部は、協働者及びロボットのそれぞれについて、現在実行中の直近タスクの負荷とそれ以外の残存タスクの負荷の合計に対応した協働作業コストを算出するコスト算出部と、前記協働作業コストに基づき、予め設定された行動選択肢の中から適切な行動を選択する行動選択部とを備え、
前記行動選択肢として、ロボット及び協働者が事前設定により互いに与えられた前記タスクを実行する通常行動と、ロボットが自身の前記タスクの少なくとも1部を前記協働者に代替してもらう依頼行動と、ロボットが協働者の前記タスクの少なくとも1部を代替する支援行動とが設定され、
前記コスト算出部では、前記行動選択肢の各行動についてそれぞれ前記協働作業コストが算出されることを特徴とするロボット。
【請求項3】
前記行動選択部では、協働者及びロボットの前記協働作業コストを総合した総合コストに基づいて、前記依頼行動若しくは前記支援行動を前記通常行動と比較し、前記依頼行動若しくは前記支援行動が前記通常行動よりも小さいことを条件として、前記依頼行動若しくは前記支援行動が選択されることを特徴とする請求項2記載のロボット。
【請求項4】
前記行動選択部では、前記依頼行動や前記支援行動の際に、協働者の主張に対してロボットが同調するリアクティブの状態と判断された場合、前記協働作業コストに対して所定の係数が掛け合わされ、その際の行動を起こし易くするように設定されることを特徴とする請求項2記載のロボット。
【請求項5】
前記行動選択部では、ロボットが前記依頼行動や前記支援行動を選択してロボットから協働者に主張するプロアクティブの状態とした場合、直近の行動が終了するまで、別の行動の前記協働作業コストに対して所定の係数が掛け合わされ、当該別の行動を起こし難くするように設定されることを特徴とする請求項2記載のロボット。
【請求項6】
前記行動選択部では、ロボットが前記依頼行動や前記支援行動を開始した後に、何らかの理由によって協働者が反応できなかった場合に、これら行動を断念して別の行動に変更するよう、前記協働作業コストに対して所定の係数が掛け合わされることを特徴とする請求項2記載のロボット。
【請求項7】
前記協働者行動推定部は、協働者における前記各タスクの達成度を推定する達成度推定部と、協働者が前記各タスクを実行する際の移動軌道を推定し、当該移動軌道に基づき、前記各タスクへの移動容易性に対応するエネルギーを算出する協働者動作計画部と、前記達成度及び前記エネルギーの尤度を算出する尤度算出部と、前記尤度から、前記各タスクを協働者が実行する確率であるタスク実行確率をベイズ推定により周期的に更新するベイズ更新部とを備えたことを特徴とする請求項2記載のロボット。
【請求項8】
所定の複数のタスクからなる一連の作業を協働者と協調しながら実行するロボットの行動を決定するシステムであって、
協働者の位置情報及び速度情報の経時的変化に基づき、協働者の前記タスクに対する行動を推定する協働者行動推定部と、当該協働者行動推定部で推定された協働者の行動に応じたロボットの移動軌道を含む動作計画を設定する動作計画設定部とを備え、
前記動作計画設定部では、ロボット及び協働者が事前設定により互いに与えられた前記タスクを実行する通常行動と、ロボットが自身の前記タスクの少なくとも1部を前記協働者に代替してもらう依頼行動と、ロボットが協働者の前記タスクの少なくとも1部を代替する支援行動とからなる行動選択肢について、前記動作計画をそれぞれ作成し、ロボット及び協働者が実行する前記タスクの負荷に対応する協働作業コストを求め、当該協働作業コストに基づいて前記行動選択肢の各行動を比較し、適切となる行動の前記動作計画を選択することを特徴とするロボットの行動決定システム。
【請求項9】
所定の複数のタスクからなる一連の作業を協働者と協調しながら実行するロボットの行動を決定するシステムのプログラムであって、
協働者の位置情報及び速度情報の経時的変化に基づき、協働者の前記タスクに対する行動を推定する協働者行動推定部と、当該協働者行動推定部で推定された協働者の行動に応じたロボットの移動軌道を含む動作計画を設定する動作計画設定部としてコンピュータを機能させ、
前記動作計画設定部では、ロボット及び協働者が事前設定により互いに与えられた前記タスクを実行する通常行動と、ロボットが自身の前記タスクの少なくとも1部を前記協働者に代替してもらう依頼行動と、ロボットが協働者の前記タスクの少なくとも1部を代替する支援行動とからなる行動選択肢について、前記動作計画をそれぞれ作成し、ロボット及び協働者が実行する前記タスクの負荷に対応する協働作業コストを求め、当該協働作業コストに基づいて前記行動選択肢の各行動を比較し、適切となる行動の前記動作計画を選択することを特徴とするロボットの行動決定システムのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人間と協働して一連の作業を行う際に、人間の行動状況に適応した動作を可能とするロボット、ロボットの行動決定システム及びそのプログラムに関する。
【背景技術】
【0002】
近時、人間が存在する複雑な環境下で自律的に移動可能となる様々な自律移動ロボットが出現しており、人間と協調しながら所定のタスクを実行する自律移動ロボットの需要が高まっている。このような自律移動ロボットにおいては、周囲の人間や障害物の状況をセンシングし、これら人間や障害物との干渉を回避しながらタスクを行う必要がある。また、人間との共存環境下で自律移動するロボットにおいては、人間の動きを考慮した人間との協調的な動作が要求される。そこで、本発明者らは、自身の研究成果として、ロボットが移動する環境に存在する人間の動きを踏まえた最適な移動経路や目的地を探索しながら行動計画を行うロボットを種々提案している(特許文献1、特許文献2等参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-46773号公報
【特許文献2】特開2023-32381号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、複数の人間(作業者)が共働して一連の作業を行う現場では、通常、各作業者が自身に与えられたタスクを実行する。しかし、時には、「やってもらう」、「やってあげる」という協働譲り合い行動を取ることで、通常より作業効率を向上できる場合がある。このような協働譲り合い行動は、相手の効率低下の代わりに、自身の効率向上を試みる依頼行動と、自身の効率低下の代わりに、相手の効率向上を試みる支援行動がある。また、主張的に相手との譲り合いを促すプロアクティブと、相手のプロアクティブな行動に同調するリアクティブの関係性が考えられる。そこで、人間が共存する複雑な環境下で自由に行動できるロボットが、人間と協働作業を行う際においても、ロボットと協働者の効率をより効果的に向上させるためには、人間同士の作業遂行と同様、互いの状況や相手の行動意図に応じて依頼行動や支援行動を選択し、プロアクティブとリアクティブの関係性も逐次的に判断することが必要となる。
【0005】
本発明は、このような課題に着目して案出されたものであり、その目的は、ロボットと協働作業を行う際の協働者の行動を推定し、通常の行動の他に、相手方への依頼や支援を含めた行動を計画し、それらの中から状況に応じて適切な行動を選択するロボット、ロボットの行動決定システム及びそのプログラムを提供することにある。
【課題を解決するための手段】
【0006】
前記目的を達成するため、本発明は、主として、所定のタスクを実行可能に動作する動作部と、周囲の環境情報を検出する検出装置と、当該検出装置の検出結果に基づき前記動作部を動作制御する制御装置とを備え、複数の前記タスクからなる一連の作業を協働者と協調しながら実行するロボットにおいて、前記検出装置では、協働者を含むロボット周囲の物体の位置情報及び速度情報が検出され、前記制御装置は、協働者の前記位置情報及び前記速度情報の経時的変化に基づき、協働者の前記タスクに対する行動を推定する協働者行動推定部と、当該協働者行動推定部で推定された協働者の行動に応じたロボットの移動軌道を含む動作計画を設定する動作計画設定部と、前記動作計画に従ってロボットが動作するように前記動作部を制御する動作指令部とを備え、前記動作計画設定部では、ロボット及び協働者が事前設定により互いに与えられた前記タスクを実行する通常行動と、ロボットが自身の前記タスクの少なくとも1部を前記協働者に代替してもらう依頼行動と、ロボットが協働者の前記タスクの少なくとも1部を代替する支援行動とからなる行動選択肢について、前記動作計画をそれぞれ作成し、ロボット及び協働者が実行する前記タスクの負荷に対応する協働作業コストを求め、当該協働作業コストに基づいて前記行動選択肢の各行動を比較し、適切となる行動の前記動作計画を選択する、という構成を採っている。
【発明の効果】
【0007】
本発明によれば、予め設定されたタスクを実行する協働者の行動を随時推定することができ、当該推定に応じ、通常行動の他に、依頼行動や支援行動の協働譲り合い行動を含め、それら行動の中から、協働者や作業の状況に応じて適切となるロボットの行動が適宜選択され、ロボットと協働者とのスムーズな協調作業が可能になる。
【図面の簡単な説明】
【0008】
【
図1】本実施形態に係るロボットの動作制御に関連する構成のみを概略的に表したブロック図である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について図面を参照しながら説明する。
【0010】
図1には、本実施形態に係るロボットの動作制御に関連する構成のみを概略的に表したブロック図が示されている。本実施形態のロボット10は、周囲の人間(以下、「協働者」と称する)と協調しながら、予め設定された一連の作業を実行可能に動作する自律移動ロボットである。当該一連の作業には、所定目標に対して移動して所定作業を実行する行動であるタスクが様々存在する。例えば、複数の場所に散在する室内ゴミ等の対象物を他の一箇所の目的地点となるゴミ箱等に集める一連の作業について、ロボット10と協働者が分担して行う場合には、ロボット10と協働者それぞれが相互に異なる場所となる目標位置の対象物に向かって移動するタスクと、それぞれが各対象物を把持するタスクと、それぞれが目的となる地点である他の目標位置に運搬するタスクとがある。
【0011】
前記ロボット10には、予め設定されたタスクの実行を含む各種動作を可能に構成された機構や機器からなる動作部11と、ロボット10の周囲の環境情報を検出する検出装置12と、検出装置12の検出結果に基づき動作部11の動作を制御する制御装置13とが設けられている。
【0012】
前記動作部11は、モータ等の駆動装置を動力源としてロボット10を移動させるための台車等を含む移動機構15と、所定の音声を発するスピーカー16と、所定空間内で動作可能なアーム17とを含む。これら移動機構15、スピーカー16及びアーム17は、全て公知の部材、機構、装置類等からなり、各構成についての詳細な図示説明を省略する。
【0013】
前記検出装置12は、ロボット10の周囲に存在する協働者や壁その他の障害物等を含む物体に関する各種情報の検出処理を実行するためのコンピュータ及び各種機器類等からなる。この検出装置12は、物体の位置情報を検出する位置検出部19と、位置検出部19での検出結果に基づき、物体の速度情報を検出する速度検出部20と、協働者からの音声による発話情報を検出するマイク等の音声検出部21とを備えており、所定の時間毎にこれら各情報を取得可能となっている。
【0014】
前記位置検出部19は、特に限定されるものではないが、公知のレーザレンジファインダ等の測域センサの他に、カメラ情報を利用する深度センサを含む公知のセンサ類により構成される。これらセンサ類により、検出時刻における物体の位置座標が取得されるとともに、時系列データに基づき同一の物体か否かが判定される。その中で同一の協働者等の移動物体については、取得した時系列の位置情報の変化から、速度検出部20で速度情報が求められることになる。
【0015】
前記速度検出部20では、本発明者らが既に提案した手法(特開2020-91235号公報)等により、ロボット10周囲の協働者等の位置情報を取得した時刻毎に、当該位置情報から協働者等の速度情報が算出される。当該速度情報を導出するアルゴリズムについては、本発明の本質要素ではないため、詳細な説明を省略する。
【0016】
なお、前記検出装置12としては、前述した各種情報を検出できる限りにおいて、前述の態様の他に、様々なセンサ類、装置類、或いはシステム類等を適用することができる。
【0017】
以上のように、ロボット10周囲の所定範囲内に存在する物体に関する情報が、所定時間毎に検出装置12で逐次検出され、その検出タイミングで制御装置13に伝送されて記憶されるとともに、当該検出タイミング毎に制御装置13にて以下の各処理が行われる。
【0018】
この制御装置13は、ロボット10に一体的に或いは別体として設けられており、CPU等の演算処理装置及びメモリやハードディスク等の記憶装置等からなるコンピュータによって構成されている。当該コンピュータには、以下の各部として機能させるためのプログラムがインストールされている。
【0019】
前記制御装置13は、各種データが記憶される記憶部23と、協働者の位置情報及び速度情報の経時的変化に基づき、協働者のタスクに対する行動を推定する協働者行動推定部24と、協働者行動推定部24で推定された協働者の行動に応じたロボット10の移動軌道を含む動作計画を設定する動作計画設定部25と、動作計画設定部25で設定された動作計画に従ってロボット10が動作するように動作部11を制御する動作指令部26とを備えている。
【0020】
前記記憶部23には、検出装置12で逐次検出された各種情報が蓄積される他、予め設定されるタスク情報、各種演算時における関係式や固定パラメータ、及び以下の処理結果のデータ等が記憶される。
【0021】
ここで、タスク情報として、ロボット10と協働者が予め設定された一連の作業を行う際に、ロボット10には、m個のタスクTR{T1
R,T2
R,・・・・,Tm
R}が与えられ、協働者には、n個のタスクTH{T1
H,T2
H,・・・・,Tn
H}が与えられるとされる。また、各タスクについて、目標位置及び動作内容(掴む、置く等)に加え、ロボット10が作業に所要する平均的な時間を表すロボット目安作業時間tavg
R(TR)、協働者が作業に所要する平均的な時間を表す協働者目安作業時間tavg
H(TH)が予め設定される。更に、タスクの前後関係(置く動作を実行するためには掴む動作を実行している必要がある等)を表す前工程タスクや次工程タスクの条件が事前に設定される。
【0022】
前記協働者行動推定部24は、協働者における各タスクの達成度を推定する達成度推定部28と、協働者が各タスクを実行する際の移動軌道を予測し、当該軌道軌道に基づき、各タスクへの移動容易性に対応するエネルギーを算出する協働者動作計画部29と、達成度推定部28及び協働者動作計画部29での処理結果から、前記達成度及び前記エネルギーの尤度を算出する尤度算出部30と、尤度算出部30で算出した尤度から、協働者が各タスクを次に実行する確率であるタスク実行確率をベイズ推定により周期的に更新するベイズ更新部31とを備えている。
【0023】
前記達成度推定部28では、次の演算処理が行われる。
【0024】
協働者のタスク実行確率を求める上で、協働者が各タスクを既にどの程度達成しているかを表すタスク達成度は重要な情報となる。このタスク達成度A(T)は、初期値を0とし、完全に達成された状態で1となる連続値と定義し、タスク達成度が大きいほど、そのタスクの実行確率が小さくなるように設定される。
【0025】
この達成度推定部28では、検出装置12で取得され記憶部23に蓄積された協働者の経時的な位置情報及び速度情報からなる時系列データから、協働者のn個のタスクTH{T1
H,T2
H,・・・・,Tn
H}におけるタスク達成度A(TH){A(T1
H),A(T2
H),・・・・,A(Tn
H)}が次のようにして推定される。
【0026】
先ず、周期的に取得された協働者の位置x
H、速度v
Hから、協働者がタスクT
H{T
1
H,T
2
H,・・・・,T
n
H}を実行可能な距離範囲内d
max(T)で静止した秒数t
elap(T)が算出される。協働者の位置x
Hと当該タスクT
H{T
1
H,T
2
H,・・・・,T
n
H}の目標位置の距離差分をΔdとし、予め設定され、人間が静止しているとみなす最低速度をv
min
Hとすると、静止秒数t
elap(T)は、次式で算出される。
【数1】
なお、上式のA(T
prev(T))は、当該タスクの前タスクのタスク達成度を表しており、前タスクが存在しない場合は1とされる。そして、算出したt
elap(T)を確率変数とした正規分布の累積確率として、以下の式からタスク達成度A(T)が求められる。
【数2】
なお、σ
Aは、タスク達成度を算出する際の固定パラメータであり、予め記憶部23に記憶される。
【0027】
前記協働者動作計画部29では、次の演算処理が行われる。
【0028】
協働者のタスク実行確率を推定する上で、協働者が当該タスクの目標位置へ向かっている傾向があるか、また、到達の容易さも重要な情報である。これらの情報を得るためには、協働者が当該タスクへ向かう際の移動軌道を予測する必要がある。このとき、協働者が迂回や回避しようとしている、通行できる道が無い等の状況を考慮し、次の手法により、各タスクへ向かう際の移動軌道が算出される。ここでは、本発明者らが、特開2023-32381号公報にて既に提案した手法(Adaptive Goal Finder(以下、「AGF」と称する))を、ロボット視点でなく協働者視点において、協働者のタスクTH{T1
H,T2
H,・・・・,Tn
H}に対して実行し、各タスクTH{T1
H,T2
H,・・・・,Tn
H}に向かう際の移動軌道が算出される。このAGFは、作業内容や当該環境における人とロボットとの相互作用の逐次的な予測に基づく移動目標位置探索手法であり、具体的なアルゴリズムについては、本発明の本質部分でないため、詳細な説明を省略する。
【0029】
次に、AGFで導出した協働者の各タスクTH{T1
H,T2
H,・・・・,Tn
H}に対する移動軌道から、各タスクTH{T1
H,T2
H,・・・・,Tn
H}について、協働者が当該タスクTH{T1
H,T2
H,・・・・,Tn
H}の目的位置へ向かっている傾向(速度方向差分)と、到達の容易さ(軌道コスト)に基づくエネルギーE(T)(E(TH){E(T1
H),E(T2
H),・・・・,E(Tn
H)})が算出される。
【0030】
前記速度方向差分θ
diff(T)は、次式のように、協働者の速度ベクトルv
Hと算出した各タスクT
H{T
1
H,T
2
H,・・・・,T
n
H}の移動軌道の進行方向ベクトルv
T
H(T)の角度差分によって算出される。ここで、協働者が停止している場合は、θ
diff(T)=1とされる。
【数3】
【0031】
前記軌道コストcpath(T)は、特開2023-32381号公報に記載され、前記AGFでの処理時に求めた移動軌道のコストがそのまま使用される。
【0032】
以上の速度方向差分θ
diff(T)及び軌道コストc
path(T)から、各タスクT
H{T
1
H,T
2
H,・・・・,T
n
H}について、尤度算出部30で用いるパラメータとなるエネルギーE(T)が次式により算出される。
【数4】
上式において、k
θdiff、k
cpathは、エネルギーを算出する際の固定パラメータであり、予め記憶部23に記憶される。
【0033】
前記尤度算出部30では、次式により、達成度推定部28で算出したタスク達成度A(T
H)、協働者動作計画部29で算出したエネルギーE(T
H)の各タスクの尤度P(A,E|T
H){P(A(T
1
H),E(T
1
H)|T
1
H),P(A(T
2
H),E(T
2
H)|T
2
H),・・・,P(A(T
n
H),E(T
n
H)|T
n
H)}が求められる。当該尤度の算出においては、確率変数をA(T
H)、E(T
H)とした1以下の単一切断正規分布を考える。
【数5】
上式において、σ
Lは尤度を算出する際の固定パラメータであり、予め記憶部23に記憶される。
【0034】
前記ベイズ更新部31では、尤度算出部30で算出された尤度(A,E|T
H)を用いて、ベイズ推定によるタスク実行確率P(T
H)の更新を行う。このとき、協働者が全てのタスクT
H{T
1
H,T
2
H,・・・・,T
n
H}を達成しており、どのタスクT
H{T
1
H,T
2
H,・・・・,T
n
H}も実行していない確率P(φ)を考慮する。P(φ)は次の式によって算出する。
【数6】
【0035】
P(T
H|A,E){P(T
1
H|A(T
1
H),E(T
1
H)),P(T
2
H|A(T
2
H),E(T
2
H)),・・・,P(T
n
H|A(T
n
H),E(T
n
H))}で表される事後確率は、次式によって算出される。
【数7】
上式において、kは、各タスクの重みパラメータを表しており、例えば、前処理タイミングでのタスク達成度A(T
prev(T
H))を使い、k=2A(T
prev(T
H))とされる。
なお、推定の結果、タスク実行確率P(T)が非常に小さい値(≒0)を取った場合に、確率が更新できなくなってしまう場合がある。そこで、本発明では、タスク実行確率P(T)の下限値P
minを設け、タスク実行確率P(T)がP
minを下回るタスクがあった場合には、タスク実行確率P(T)をP
minに繰り上げ、繰り上げた分を他のタスクから均等に繰り下げている。
【0036】
前記動作計画設定部25では、計画した行動を定量的に評価、選択するために、予め設定されるロボット10の各行動選択肢に対して協働者とロボット10の協働作業に関する負荷に対応する協働作業コストをそれぞれ算出し、当該協働作業コストに基づいてロボット10の行動が選択される。
【0037】
ここで、行動選択肢としては、ロボット10及び協働者が事前設定により互いに与えられたタスクを実行する行動状態である通常行動と、ロボット10が自身のタスクの少なくとも1部を協働者に代替してもらう行動状態である依頼行動と、ロボット10が協働者のタスクの少なくとも1部を代替する行動状態である支援行動が設定される。
【0038】
この動作計画設定部25は、各行動選択肢における協働者及びロボット10のそれぞれについて協働作業コストを算出するコスト算出部33と、コスト算出部33で求めた協働作業コストに基づき、行動選択肢の中から適切な行動を選択する行動選択部34とを備えている。
【0039】
前記コスト算出部33では、現在実行中のタスク(以下、「直近タスク」と称する)のコストと、それ以外のタスク(以下、「残存タスク」と称する)のコストを別々に算出して合計することで、前記協働作業コストが求められる。
【0040】
ここで、作業者の直近タスクT
0のコストC(T
0)、残存タスクT
iのコストC(T
i)は、以下の式から算出される。
【数8】
上式において、t
path(T
0)は、直近タスクT
0を行う際の移動時間であり、t
ave(T
0)は、予め記憶された当該直近タスクT
0における目安の作業時間である。また、v
defは、作業者の定常速度であり、l
iは、当該残存タスクT
iの移動距離である。協働者の場合は、残存タスクの順番が不明であるため、各残存タスクT
iの目標位置x
iから重心位置gを算出し,重心位置と当該残存タスクT
iの目標位置x
iの距離をl
iとする。なお、k
lは、記憶部23に記憶される固定パラメータである。
【0041】
一方、ロボット10の直近タスクT0のコストC(T0)は、ロボット10の各行動選択肢について、前述した行動計画手法であるAGFにより生成されたロボット10の移動軌道と、予め設定されたロボット10の移動速度から、直近タスクT0を行う際の移動時間と予め記憶された当該直近タスクT0における目安の作業時間との合計値とされる。また、ロボット10の残存タスクTiのコストC(Ti)は、残存タスクTiの順番が明確であるため、当該残存タスクTiとその前のタスクの距離をliとし、当該距離liを予め設定されたロボット10の移動速度で除算することで求めた移動時間と予め記憶された当該残存タスクTiにおける目安の作業時間との合計値とされる。
【0042】
そして、ロボット10、協働者の協働作業コストC
R、C
Hは、以下の式から算出される。
【数9】
上式において、k
R、k
Hは、記憶部23に記憶される各作業者の固有パラメータである。この値を調整することで各作業者のコスト比重が変化するが、本実施形態では、ロボット10と協働者の作業効率が均等になるように、k
R=k
H=1とされる。
【0043】
なお、通常行動の場合、協働者の直近タスクT0は、タスクTH{T1
H,T2
H,・・・・,Tn
H}のうち、協働者行動推定部24で求めたタスク実行確率P(TH)が最も高いタスクを実行する場合とされる。
【0044】
また、依頼行動の場合、ロボット10の直近タスクT0は、協働者へ近づき自身の当該タスクを受け渡すことになり、協働者の直近タスクT0は当該タスクを受け取ることになる。
【0045】
更に、支援行動の場合、ロボット10の直近タスクT0は、協働者へ近づき、協働者の当該タスクを受け取ることになり、協働者の直近タスクT0は当該タスクを受け渡すことになる。
【0046】
また、コスト算出部33では、各行動選択肢におけるロボット10の動作が前記AGFによって計画される。ここで、依頼動作、支援動作を計画する際には、ロボット10と協働者の間でグローバル・パスプランニングを実行し、軌道上で両者からの道のりが等しい点が仮想の目標位置として設定される。但し、ロボット10と協働者が十分に接近した後は、協働者の位置を目標位置とされ、AGFにおけるグリッドの粒度、作業可能な最大距離を変更することで動作計画される。
【0047】
そして、以下の説明において、両者が互いに与えられたタスクを実行する通常行動の場合では、ロボット10の協働作業コストCRをCNrml
R、協働者の協働作業コストCHをCNrml
Hとする。また、ロボット10が協働者にタスクを依頼する依頼行動の場合では、ロボット10の協働作業コストCRをCRqst
R、協働者の協働作業コストCHをCRqst
Hとする。更に、ロボット10が協働者のタスクを支援する支援行動の場合では、ロボット10の協働作業コストCRをCAsst
R、協働者の協働作業コストCHをCAsst
Hとする。何れも、前述の数式により算出されるが、ロボット10が依頼行動や支援行動を行う際は、直近タスクをタスクの受け渡し動作としてロボット10の直近タスクのコストを計算し、協働者の直近タスクのコストは、ロボット10の直近タスクのコストと同値とされる。
【0048】
前記行動選択部34では、通常行動、依頼行動、支援行動毎に、ロボット10及び協働者の各協働作業コストを総合した総合コストに基づき、後述する条件式を用いてこれら各行動が比較され、その結果によりロボット10の行動が決定される。このとき、通常行動、依頼行動、支援行動それぞれについて、総合コストは、協働作業コストCR、CHの合計値に、予め設定された係数KNrml、KRqst、KAsstを乗じたものとなる。これら係数KNrml、KRqst、KAsstはデフォルト値を1としており、以下(1)~(3)の状況によって変更される。
【0049】
(1)リアクティブ定数
ロボット10の依頼行動、支援行動では、ロボットから協働者に主張するプロアクティブと、協働者の主張に対してロボット10が同調するリアクティブの状態が定義される。これらは、単純にロボット10、協働者のどちらが先に依頼行動、支援行動という協働譲り合いの提案を行ったかによって決定される。従って、協働者がロボットに対して先に協働譲り合いを提案した場合、ロボット10は、リアクティブに行動を決定することとなる。この判断としては、相手に対して「お願いします」、「私がやります」という発話を行った際に、当該発話を行った一方が他方に依頼行動や支援行動を提案したと判断される。
ロボット10がリアクティブに行動を決定する場合は、協働者が協働譲り合いを提案した事実をコスト要素として考慮する必要がある。そこで、音声検出部21により、協働者が「私がやります」若しくは同義の発話情報が検出され、ロボット10がリアクティブの状態と判断された場合には、依頼行動に係る係数K
Rqstに、リアクティブ係数K
Rが掛け合わされる。一方、協働者が「お願いします」若しくは同義の発話情報が検出され、ロボット10がリアクティブの状態と判断された場合には、支援行動に係る係数K
Asstに、リアクティブ係数K
Rが掛け合わされる。これらリアクティブ係数K
Rは、記憶部23に記憶された固定パラメータであり、1未満に設定することで当該行動が起こり易くなる。
(2)行動変化定数
ロボット10が依頼行動、支援行動を選択し、プロアクティブにスピーカー16から協働者に対して発話することで意思を示した場合に、その直後に別の行動を選択すると協働者の混乱を招く可能性がある。そのため、一度協働譲り合い行動を選択した後は、直近の行動が終了するまで、別の行動の係数に行動変化定数K
Cが掛け合わされる。この行動変化定数K
Cは、記憶部23に記憶された固定パラメータであり、1より大きい値に設定することで当該行動が起こりにくくなる。
(3)予測誤差変数
ロボット10が協働譲り合いを開始した後に、何らかの理由によって協働者が反応できなかった場合、ロボット10は、当該協働譲り合いを断念して行動を変更する必要がある。そこで、協働譲り合いを開始した時刻に算出された当該行動に対して、予測通りに行動が進んでいるかが判断され、予測誤差に応じた予測誤差変数K
Eが当該行動の係数に掛け合わされる。予測誤差変数K
Eは、以下の式によって算出される。
【数10】
なお、上式において、C
R(T
0)は、現在時刻における当該行動のロボット10の直近タスクT
0の協働作業コスト、C
R(T
0)´は、当該行動開始時におけるロボット10の直近タスクT
0の協働作業コスト、Δtは当該行動開始時からの経過時間、C
errはコストの予測誤差である。また、k
Eは、予測誤差変数を算出する際の固定パラメータであり、予め記憶部23に記憶される。
【0050】
そして、以下の条件式によりロボット10の行動が決定される。
【数11】
【0051】
上式において、依頼行動については、ロボット10及び協働者の両者の協働作業コストの合計に前記係数を乗じた総合コストが通常行動より小さくなり、且つ、ロボット10の協働作業コストが協働者の協働作業コストより大きい場合に選択される。支援行動については、前記総合コストのコストが通常行動より小さくなり、且つ、ロボット10の協働作業コストが協働者の協働作業コストより小さい場合に選択される。ここで、リアクティブに行動する場合には、ロボット10、協働者の間の協働作業コストの大小を比較せずに、前記合計コストについての通常行動との対比のみで行動が選択される。そして、これらの条件の何れも満たさない場合は、通常行動が選択される。以上において、協働譲り合い行動と通常行動の間では、ロボット10及び協働者の両者の協働作業コストの合計コストが比較されることになり、ロボット10及び協働者の作業の総量が小さくなる行動が選択される。
【0052】
なお、全体の作業時間が小さくなる行動を選択できるように、前述の条件式に代えて他の条件式を採用してロボット10の行動を決定することもできる。
【0053】
前記動作指令部26では、動作計画設定部25で選択されたロボット10の行動に沿う移動軌道での移動を含めたタスクの実行動作を行うように、動作部11に対して動作指令が行われる。
【0054】
ここで、依頼行動、支援行動が選択された場合には、その意図がスピーカー16からの音声を通じて協働者に伝わるように、ロボット10からの発話動作が行われる。また、ロボット10の主張に対して協働者が断る意思を表す発話情報を音声検出部21で検知した場合、ロボット10は、再度の動作計画により、通常行動に切り替え可能となる。逆に、協働者が主張した際に、ロボット10が通常行動を選択した場合には、協働者の主張を断る行動となるため、その意図がスピーカー16からの音声を通じて協働者に伝わるよう発話動作が行われる。
【0055】
なお、ロボット10の依頼行動及び支援行動によって、タスクの受け渡しが発生した場合には、記憶部23に記憶されたロボット10、協働者のタスクTR、THの更新が行われる。依頼行動の場合には、依頼するタスクをロボット10のタスクTRから削除され、協働者のタスクTHに追加される。このとき、協働者は、当該タスクをその場で実行開始するため、当該タスクの実行確率が1若しくは1よりもやや小さい値に設定される。支援行動の場合には、支援する協働者のタスクTHが削除され、ロボット10のタスクTRに追加される。このとき、協働者の他のタスクの実行確率について、現在の合計値と相対的な割合が変化しないよう再計算される。
【0056】
以上の構成の制御装置13は、所定の複数のタスクからなる一連の作業を協働者と協調しながら実行するロボット10の行動を決定する行動決定システムとして機能する。
【0057】
なお、本発明が対象とする前記一連の作業としては、特に限定されるものではなく、以下の作業やタスクも例示できる。前記実施形態では、プロアクティブやリアクティブな行動として、ロボット10と協働者との間で対象物の受け渡しも想定される。その際、作業効率を考慮して対象物の目的地点となるゴミ箱等を移動させるような前記受け渡し以外の行動選択肢を考慮することもできる。また、前記受け渡し以外の行動選択肢として、ロボット10や協働者と目的地点との間に位置するサブゴールを設定することも可能である。その他、ロボット10と協働者が協働しながら料理するような作業等、種々の作業にも本発明を適用可能である。
【0058】
また、前記実施形態では、前記協働作業コストを所要時間に基づき算出しているが、本発明はこれに限らず、距離や作業量に基づいて前記協働作業コストを算出することもできる。この場合、前述のコスト式における時間のパラメータを距離や作業量のパラメータに変更することで協働作業コストが求められる。ここで、作業量のパラメータとしては、例えば、運搬荷物の重量を移動量に乗じて得られる数値が挙げられる。
【0059】
その他、本発明における装置各部の構成は図示構成例に限定されるものではなく、実質的に同様の作用を奏する限りにおいて、種々の変更が可能である。
【符号の説明】
【0060】
10 ロボット
11 動作部
12 検出装置
13 制御装置
24 協働者行動推定部
25 動作計画設定部
26 動作指令部
28 達成度推定部
29 協働者動作計画部
30 尤度算出部
31 ベイズ更新部
33 コスト算出部
34 行動選択部