IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイシン精機株式会社の特許一覧 ▶ 学校法人慶應義塾の特許一覧

特許7232210移動体制御装置、移動体制御プログラム及び移動体
<>
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図1
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図2
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図3
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図4
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図5
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図6
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図7
  • 特許-移動体制御装置、移動体制御プログラム及び移動体 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-21
(45)【発行日】2023-03-02
(54)【発明の名称】移動体制御装置、移動体制御プログラム及び移動体
(51)【国際特許分類】
   G05D 1/02 20200101AFI20230222BHJP
【FI】
G05D1/02 H
【請求項の数】 7
(21)【出願番号】P 2020064336
(22)【出願日】2020-03-31
(65)【公開番号】P2021163216
(43)【公開日】2021-10-11
【審査請求日】2022-06-07
(73)【特許権者】
【識別番号】000000011
【氏名又は名称】株式会社アイシン
(73)【特許権者】
【識別番号】899000079
【氏名又は名称】慶應義塾
(74)【代理人】
【識別番号】100214260
【弁理士】
【氏名又は名称】相羽 昌孝
(74)【代理人】
【識別番号】100139114
【弁理士】
【氏名又は名称】田中 貞嗣
(74)【代理人】
【識別番号】100139103
【弁理士】
【氏名又は名称】小山 卓志
(74)【代理人】
【識別番号】100119220
【氏名又は名称】片寄 武彦
(72)【発明者】
【氏名】久野 和宏
(72)【発明者】
【氏名】渡邊 豊
(72)【発明者】
【氏名】▲高▼橋 正樹
(72)【発明者】
【氏名】萬 礼応
(72)【発明者】
【氏名】関口 舜一
【審査官】堀内 亮吾
(56)【参考文献】
【文献】特表2019-514103(JP,A)
【文献】特開2008-191800(JP,A)
【文献】特開2007-286741(JP,A)
【文献】特開2019-179460(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05D 1/02
(57)【特許請求の範囲】
【請求項1】
移動体が対象者の進行方向前方に随行して移動するように、前記移動体の移動手段を制御する移動体制御装置であって、
前記対象者の位置及び進行方向を含む対象者情報を取得する対象者情報取得手段と、
前記対象者情報を時系列で処理することにより前記対象者が現時点までに歩行した軌跡を観測軌跡として取得する観測軌跡取得手段と、
歩行者が異なる複数の目的地点に向かって歩行するときの軌跡に沿って前記軌跡から逸脱する確率分布を表す不確かさが付与された複数の基本軌跡から、前記観測軌跡に合致する前記基本軌跡を特定基本軌跡として取得する基本軌跡取得手段と、
前記特定基本軌跡のうち、前記対象者が前記観測軌跡に続くように前記現時点以降に歩行する軌跡を対象者予測軌跡として取得する対象者予測軌跡取得手段と、
前記対象者予測軌跡に沿って付与された前記不確かさに基づいて、前記対象者が前記対象者予測軌跡に従って歩行すると予測する際の予測信頼度を前記対象者予測軌跡に沿って算出する予測信頼度算出手段と、
前記対象者が前記対象者予測軌跡に従って歩行するものとした場合に、前記対象者の進行方向前方に設定された前記移動体の目標位置により形成される軌跡を目標軌跡として取得する目標軌跡取得手段と、
前記対象者予測軌跡、前記予測信頼度、前記目標軌跡、及び、前記移動手段に対して時系列順に出力される制御指令系列に従って前記移動体が移動するときの制御軌跡を入力とする評価関数を用いて前記制御指令系列を生成する制御指令系列生成手段と、
前記制御指令系列に基づいて、前記移動手段を制御する移動制御手段とを備える、
ことを特徴とする移動体制御装置。
【請求項2】
前記評価関数は、
前記制御指令系列に対する制御ペナルティ項と、前記対象者予測軌跡と前記制御軌跡との間の距離に基づく対象者ペナルティ項と、前記目標軌跡と前記制御軌跡との間の距離に基づく目標ペナルティ項とを加算するとともに、前記対象者ペナルティ項及び前記目標ペナルティ項に対して前記予測信頼度を係数として乗算することにより、前記評価値を算出するものであり、
前記制御指令系列生成手段は、
前記評価値を最小化するように、前記制御指令系列を生成する、
ことを特徴とする請求項1に記載の移動体制御装置。
【請求項3】
前記基本軌跡取得手段は、
前記複数の基本軌跡が前記観測軌跡に合致する合致度をそれぞれ算出し、前記合致度に基づいて、前記複数の基本軌跡を合成することにより、前記特定基本軌跡を取得する、
ことを特徴とする請求項1又は2に記載の移動体制御装置。
【請求項4】
前記基本軌跡は、
当該基本軌跡の旋回角度が高いほど前記不確かさが大きく設定されるとともに、当該基本軌跡における時間軸が進むほど前記不確かさが大きく設定される、
ことを特徴とする請求項1乃至請求項3のいずれか一項に記載の移動体制御装置。
【請求項5】
目標軌跡取得手段は、
前記移動体の位置及び進行方向を含む移動体情報と、前記対象者情報とに基づいて、前記対象者の進行方向の左前方及び右前方のいずれかを前記目標位置として選択し、その選択した前記目標位置により形成される軌跡を前記目標軌跡を取得する、
ことを特徴とする請求項1乃至請求項4のいずれか一項に記載の移動体制御装置。
【請求項6】
コンピュータを、請求項1乃至請求項5のいずれか一項に記載された移動体制御装置として機能させる、
ことを特徴とする移動体制御プログラム。
【請求項7】
請求項1乃至請求項5のいずれか一項に記載された移動体制御装置を備える、
ことを特徴とする移動体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、移動体制御装置、移動体制御プログラム及び移動体に関する。
【背景技術】
【0002】
従来、歩行者の進行方向前方を随行して移動するように、ロボットを制御するための様々な制御方法が知られている。例えば、特許文献1には、対象者に対して斜め前方かつ相対的な所定位置を維持して追従動作を行う移動ロボットにおいて、カメラ等によって検出された対象者の向きに応じて、移動ロボットの目標位置を決定することが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2008-234404号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示された移動ロボットでは、上述したように、カメラ等によって検出された対象者の向きに応じて、移動ロボットの目標位置を決定するものである。しかし、カメラ等によって検出された対象者の向きには誤差が含まれるだけでなく、対象者の旋回時や方向転換時等には、対象者の進行方向を正確に検出することができず、移動ロボットの目標位置を適切に決定することが困難であった。
【0005】
本発明は、このような事情に鑑みてなされたものであって、移動体が対象者の歩行状態に合わせて対象者に随行するように、移動体を適切に移動させることができる移動体制御装置、移動体制御プログラム及び移動体を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、上記課題を解決するものであって、本発明の一実施形態に係る移動体制御装置は、
移動体が対象者の進行方向前方に随行して移動するように、前記移動体の移動手段を制御する移動体制御装置であって、
前記対象者の位置及び進行方向を含む対象者情報を取得する対象者情報取得手段と、
前記対象者情報を時系列で処理することにより前記対象者が現時点までに歩行した軌跡を観測軌跡として取得する観測軌跡取得手段と、
歩行者が異なる複数の目的地点に向かって歩行するときの軌跡に沿って前記軌跡から逸脱する確率分布を表す不確かさが付与された複数の基本軌跡から、前記観測軌跡に合致する前記基本軌跡を特定基本軌跡として取得する基本軌跡取得手段と、
前記特定基本軌跡のうち、前記対象者が前記観測軌跡に続くように前記現時点以降に歩行する軌跡を対象者予測軌跡として取得する対象者予測軌跡取得手段と、
前記対象者予測軌跡に沿って付与された前記不確かさに基づいて、前記対象者が前記対象者予測軌跡に従って歩行すると予測する際の予測信頼度を前記対象者予測軌跡に沿って算出する予測信頼度算出手段と、
前記対象者が前記対象者予測軌跡に従って歩行するものとした場合に、前記対象者の進行方向前方に設定された前記移動体の目標位置により形成される軌跡を目標軌跡として取得する目標軌跡取得手段と、
前記対象者予測軌跡、前記予測信頼度、前記目標軌跡、及び、前記移動手段に対して時系列順に出力される制御指令系列に従って前記移動体が移動するときの制御軌跡を入力とする評価関数を用いて、前記制御指令系列を生成する制御指令系列生成手段と、
前記制御指令系列に基づいて、前記移動手段を制御する移動制御手段とを備える、ことを特徴とする。
【0007】
また、本発明の一実施形態に係る移動体制御プログラムは、
コンピュータを、上記移動体制御装置として機能させる、ことを特徴とする。
【0008】
また、本発明の一実施形態に係る移動体は、
上記移動体制御装置を備える、ことを特徴とする。
【発明の効果】
【0009】
本発明の一実施形態に係る移動体制御装置、移動体制御プログラム及び移動体によれば、観測軌跡取得手段が、対象者が現時点までに歩行した軌跡を観測軌跡として取得し、基本軌跡取得手段が、不確かさが付与された複数の基本軌跡から、観測軌跡に合致する基本軌跡を特定基本軌跡として取得し、対象者予測軌跡取得手段が、特定基本軌跡のうち、対象者が観測軌跡に続くように現時点以降に歩行する軌跡を対象者予測軌跡として取得し、予測信頼度算出手段が、対象者予測軌跡に沿って付与された不確かさに基づいて、対象者が対象者予測軌跡に従って歩行すると予測する際の予測信頼度を対象者予測軌跡に沿って算出し、目標軌跡取得手段が、対象者が対象者予測軌跡に従って歩行するものとした場合に、対象者の進行方向前方に設定された移動体の目標位置により形成される軌跡を目標軌跡として取得し、制御指令系列生成手段が、対象者予測軌跡、予測信頼度、目標軌跡、及び、移動手段に対して時系列順に出力される制御指令系列に従って移動体が移動するときの制御軌跡を入力とする評価関数を用いて制御指令系列を生成し、移動制御手段が、制御指令系列に基づいて、移動体の移動手段を制御する。
【0010】
そのため、制御指令系列生成手段が制御指令系列を生成する際に用いる評価関数では、対象者が対象者予測軌跡に従って歩行すると予測したときの予測信頼度が考慮されているので、予測信頼度の高低に応じて、移動体の随行制御が実行される。したがって、移動体が対象者の歩行状態に合わせて対象者に随行するように、移動体を適切に移動させることができる。
【図面の簡単な説明】
【0011】
図1】本発明の実施形態に係る移動体1(ロボットR)の一例を示し、(a)は正面図、(b)は平面図である。
図2】本発明の実施形態に係る移動体1(ロボットR)の一例を示すブロック図である。
図3】基本軌跡群情報602に含まれる複数の基本軌跡101~109の一例を示す図である。
図4】本発明の実施形態に係る移動体制御装置6の一例を示す機能ブロック図である。
図5】基本軌跡103、104から合成された特定基本軌跡100の一例を示す図である。
図6】対象者予測軌跡12、予測信頼度γ、目標軌跡13、制御軌跡14、及び、制御指令系列Uの関係を示す模式図である。
図7】シミュレーションの概要を示し、(a)はシミュレーション条件、(b)は評価指標(c)は適正範囲を示す図である。
図8】シミュレーションの解析結果を示し、(a)は評価指標の比較結果、(b)は制御軌跡の比較結果を示す図である。
【発明を実施するための形態】
【0012】
以下、本発明の一実施形態について添付図面を参照しつつ説明する。
【0013】
図1は、本発明の実施形態に係る移動体1(ロボットR)の一例を示し、(a)は正面図、(b)は平面図である。図2は、本発明の実施形態に係る移動体1(ロボットR)の一例を示すブロック図である。
【0014】
移動体1は、例えば、自走式のロボットRとして構成されており、対象者Hの歩行状態(速度や進行方向)に合わせて対象者Hの進行方向前方に設定された目標位置Gを逐次更新しながら移動することで、対象者Hに随行して移動する装置である。なお、移動体1は、例えば、産業用、商業用、家庭用、医療用、災害用、研究用等の任意の用途で使用されるものでよい。また、移動体1が使用される環境は、室内でもよいし、屋外でもよい。
【0015】
本実施形態では、移動体1は、図1に示すように、自走式のロボットRであるものして説明する。ロボットRは、例えば、円柱状の本体2と、自装置(ロボットR)の現在位置(自位置)及び姿勢(進行方向)を検出する自位置検出ユニット3と、ロボットRの周囲に存在する対象者Hを検出する対象者検出ユニット4と、ロボットRを前後左右に移動させる移動ユニット5と、本体2に内蔵されて、ロボットRの各部を制御する移動体制御処理(移動体制御方法)を行う移動体制御装置6と、ロボットRの各部に電力を供給する電源7とを備える。
【0016】
自位置検出ユニット3は、例えば、GPSセンサや推測航法による位置推測センサ(車輪50の回転角速度センサ等)で構成されており、ロボットRの自位置及び進行方向を所定の検出周期で検出し、その検出結果を移動体制御装置6に送る。なお、自位置検出ユニット3は、環境内の各位置に設置された位置発信機(不図示)から位置情報を受信することにより、ロボットRの自位置を検出するものでもよいし、上述の複数の手段を組み合わせたものでもよい。
【0017】
対象者検出ユニット4は、例えば、レーザレンジセンサやミリ波センサ等の測距センサで構成され、対象者Hの肩付近及び足首付近の高さにそれぞれ取り付けられている。対象者検出ユニット4は、所定の検出周期でレーザ光やミリ波を全方位(360度)に対して照射し、検出範囲40に存在する対象者Hからの反射光や反射波が戻るまでの時間を計測することで、ロボットRに対する対象者Hの相対位置(距離や方位)を検出するとともに、肩の形状や足元の動き等を観察することで、対象者Hの進行方向を検出する。そして、対象者検出ユニット4は、その対象者Hの検出結果を所定の検出周期で移動体制御装置6に送る。なお、対象者検出ユニット4は、カメラ、超音波センサ、赤外線センサ等で構成されていてもよいし、上述の複数の手段を組み合わせたものでもよい。また、対象者検出ユニット4は、他の移動体1、他の歩行者、障害物を検出する機能を兼ねてもよい。
【0018】
移動ユニット5は、複数の車輪50と、電源7から電力が供給され、複数の車輪50を回転駆動させる複数の電動モータ51とを備える。移動ユニット5は、移動体制御装置6から送られた制御指令に基づいて、電動モータ51の回転数やトルクを制御することにより、ロボットRが前進又は後進するときの並進運動Uを変更するとともに、ロボットRが旋回するときの角速度Uωを変更する。なお、移動ユニット5は、ロボットRを旋回させる機能として、例えば、左右の車輪50の回転数の差を設けてもよいし、前側の車輪50の向きを変更する操舵機構を備えていてもよい。
【0019】
移動体制御装置6は、自位置検出ユニット3から送られた自位置の検出結果や、対象者検出ユニット4から送られた対象者Hの検出結果に基づいて、ロボットRと対象者Hとの間の距離を維持しつつロボットRを対象者Hの進行方向前方に随行して移動させるように、移動ユニット5に制御指令を送ることでロボットRを制御する。
【0020】
本実施形態では、移動体制御装置6は、移動ユニット5が独立二輪駆動型であって、下記の(1)式に示す状態方程式により定義される運動学モデルを用いて、移動ユニット5を制御するものとして説明する。したがって、移動体制御装置6は、所定の制御周期Δt毎に、移動ユニット5に対して制御指令U={並進運動U,角速度Uω}を出力することで、移動体の位置(x、y)及び進行方向θを制御する。
【0021】
【数1】
【0022】
移動体制御装置6は、その具体的な構成として、図2に示すように、HDD、SDD、ROM、RAM等により構成され、各種の情報を記憶する記憶部60と、CPU等のプロセッサにより構成され、各種の演算を行う制御部61と、外部装置(例えば、インフラ設備、集中管理装置、他の移動体、対象者Hが所持する携帯端末等を含む。)との通信インターフェースである通信部62とを備える。
【0023】
記憶部60は、ロボットRの位置及び進行方向を含む移動体情報600と、対象者Hの位置及び進行方向を含む対象者情報601と、複数の基本軌跡に関する情報を含む基本軌跡群情報602と、評価値J(詳細は後述する。)を算出するのに必要な各種の係数、条件、算出式等を含む設定情報603と、移動体制御プログラム604とを記憶する。
【0024】
移動体情報600に含まれるロボットRの位置及び進行方向は、所定の検出周期で自位置検出ユニット3により検出された検出結果(ロボットRの位置及び進行方向)を、過去の時点から現時点までの所定の期間分を時系列順に蓄積したものであり、自位置検出ユニット3から新たな検出結果が送られると、現時点の情報が逐次更新される。
【0025】
対象者情報601に含まれる対象者Hの位置及び進行方向は、所定の検出周期で対象者検出ユニット4により検出された検出結果(対象者Hの位置及び進行方向)を、過去の時点から現時点までの所定の期間分を時系列順に蓄積したものであり、対象者検出ユニット4から新たな検出結果が送られると、現時点の情報が逐次更新される。
【0026】
図3は、基本軌跡群情報602に含まれる複数の基本軌跡101~109の一例を示す図である。
【0027】
基本軌跡群情報602は、歩行者が異なる複数の目的地点(図3の例ではスタート位置に対して9つの目的地点1~9)に向かって歩行するときの複数の基本軌跡101~109を事前の実験で学習したものである。
【0028】
例えば、複数の歩行者の各々が、出発地点から各目的地点1~9に向かってそれぞれ歩行するときの軌跡を各種のセンサで複数回計測し、それらを統計的に処理することで、目的地点1~9に対する基本軌跡101~109の形状(図3で示す実線部分)を生成したものである。例えば、基本軌跡101~109は、各時点の歩行者の位置及び進行方向を、時系列順に並べた点列のデータとして生成される。そして、原点Oの位置を、例えば、現時点の位置とすることで、原点Oよりも左側の軌跡は、過去の時点から現時点までの軌跡であり、原点Oよりも右側の軌跡は、現時点から将来の時点までの軌跡であるものとして取り扱われる。
【0029】
また、対象者Hが同じ目的地点に歩行したときの軌跡を比較した場合、複数の対象者Hの間で差異(ばらつき)があり、また、同じ歩行者であっても1回目の歩行時と2回目の歩行時では軌跡に差異(ばらつき)がある。そのため、基本軌跡101~109(図3で示す実線部分)から逸脱する確率分布を、例えば、ガウス分布等を用いて不確かさ(エントロピー)として表すことにより、基本軌跡101~109には、各基本軌跡101~109の形状(図3で示す実線部分)に沿って不確かさ(図3で示す楕円部分)が付与されている。
【0030】
図3に示す基本軌跡101~109では、各時点における不確かさは、標準偏差の2倍(2σ)の範囲に相当する楕円として表されている。基本軌跡101~109において、基本軌跡の旋回角度が高いほど不確かさが大きく設定されるものであり、例えば、Uターンに相当する基本軌跡101、109、急な旋回時に相当する基本軌跡102、108における不確かさ(楕円)が大きく設定される。また、基本軌跡101~109において、基本軌跡における時間軸が進むほど不確かさが大きく設定されるものであり、例えば、原点Oよりも右側に進むほど、不確かさ(楕円)が大きく設定される。なお、図3に示す基本軌跡101~109は、位置(x座標及びy座標)に関するものであるが、基本軌跡群情報602は、進行方向θに関する基本軌跡101~109(不図示)をさらに備え、x座標及びy座標と同様に取り扱われる。
【0031】
制御部61は、図2に示すように、移動体制御プログラム604を実行することにより、対象者情報取得手段610、観測軌跡取得手段611、基本軌跡取得手段612、対象者予測軌跡取得手段613、予測信頼度算出手段614、目標軌跡取得手段615、制御指令系列生成手段616、及び、移動制御手段617として機能する。
【0032】
図4は、本発明の実施形態に係る移動体制御装置6の一例を示す機能ブロック図である。
【0033】
対象者情報取得手段610は、対象者Hの位置及び進行方向を含む対象者情報601を記憶部60から読み出すことにより、対象者情報601を取得する。なお、対象者情報取得手段610は、対象者検出ユニット4から対象者情報601を直接取得してもよい。
【0034】
観測軌跡取得手段611は、対象者情報601を時系列で処理することにより、対象者Hが現時点までに移動した軌跡を観測軌跡11として取得する。観測軌跡11は、所定の検出周期で対象者検出ユニット4により測定された各時点の対象者Hの位置及び進行方向を、時系列順に並べた点列のデータである。
【0035】
基本軌跡取得手段612は、基本軌跡群情報602に含まれる複数の基本軌跡101~109から、観測軌跡11に合致する基本軌跡を特定基本軌跡100として取得する。具体的には、基本軌跡取得手段612は、複数の基本軌跡101~109が観測軌跡11に合致する合致度をそれぞれ算出し、各観測軌跡11に対する合致度に基づいて複数の基本軌跡を合成することにより、特定基本軌跡100を取得する。
【0036】
図5は、基本軌跡103、104から合成された特定基本軌跡100の一例を示す図である。なお、図5では、位置(x座標及びy座標)に関する基本軌跡103、104だけでなく、進行方向θに関する基本軌跡103、104についても図示している。
【0037】
合致度は、例えば、0から1までの値域で算出され、対象者Hが現時点までに歩行した観測軌跡11の形状と、各基本軌跡101~109における原点Oまでの形状(過去の時点から現時点までの形状)とが類似するほど、高く算出される指標値である。図5の例では、基本軌跡取得手段612が、例えば、基本軌跡103の合致度が「0.3」と算出し、基本軌跡104の合致度が「0.7」と算出した場合であり、この場合には、基本軌跡103と基本軌跡104とを「3:7」の比率で按分して合成することにより、特定基本軌跡100を取得する。これにより、観測軌跡11が、基本軌跡群情報602に含まれていないような未知の軌跡であったとしても、既知の基本軌101~109から観測規則11に合致する特定基本軌跡100を取得することができる。
【0038】
対象者予測軌跡取得手段613は、特定基本軌跡100のうち、対象者Hが観測軌跡11に続くように現時点以降に歩行する軌跡を対象者予測軌跡12として取得する。
【0039】
予測信頼度算出手段614は、対象者予測軌跡12に沿って付与された不確かさ(エントロピー)に基づいて、対象者Hが対象者予測軌跡12に従って歩行すると予測する際の予測信頼度γを対象者予測軌跡12に沿って算出する。
【0040】
予測信頼度算出手段614は、対象者予測軌跡12に沿って各点に付与された不確かさ(楕円の大きさ)に対して、下記の(2)式に示すように、シグモイド関数を適用することにより、0から1までの値域で予測信頼度γを算出する。予測信頼度γは、不確かさが小さいほど、大きく算出される指標値である。
【0041】
【数2】
【0042】
目標軌跡取得手段615は、対象者Hが対象者予測軌跡12に従って歩行するものとした場合に、対象者Hの進行方向前方に設定されたロボットRの目標位置Gにより形成される軌跡を目標軌跡13として取得する。
【0043】
例えば、ロボットRの目標位置Gとして、対象者の進行方向の左前方及び右前方のいずれかを選択可能に設定される場合には、目標軌跡取得手段615は、ロボットRの位置及び進行方向を含む移動体情報600と、対象者情報601とに基づいて、対象者Hの進行方向の左前方及び右前方のいずれかを目標位置Gとして選択し、その選択した目標位置Gにより形成される軌跡を目標軌跡13として取得する。目標位置Gは、例えば、対象者Hの進行方向に対して左45度又は右45度であって、対象者Hから0.85[m]の位置に設定される。なお、図4の例では、目標軌跡13は、目標位置Gが対象者Hの進行方向右前方に設定されている場合に、当該目標位置Gにより形成される軌跡である、
【0044】
制御指令系列生成手段616は、対象者予測軌跡12、予測信頼度γ、目標軌跡13、及び、移動ユニット5に対して時系列順に出力される制御指令系列Uに従ってロボットRが移動するときの制御軌跡14を入力とする評価関数を用いて、制御指令系列Uを生成する。なお、制御指令系列Uと、制御軌跡14とは、上記の(1)式に示す運動方程式により規定される。
【0045】
評価関数は、下記の(3)式で定義されており、制御指令系列生成手段616は、評価関数により算出される評価値Jを最小化するように、制御指令系列Uを生成する。
【0046】
【数3】
【0047】
図6は、対象者予測軌跡12、予測信頼度γ、目標軌跡13、制御軌跡14、及び、制御指令系列Uの関係を示す模式図である。
【0048】
評価関数は、上記の(3)式のように、制御指令系列Uに対する制御ペナルティ項と、対象者予測軌跡12と制御軌跡14との間の距離に基づく対象者ペナルティ項と、目標軌跡13と制御軌跡14との間の距離に基づく目標ペナルティ項とを加算するとともに、対象者ペナルティ項及び目標ペナルティ項に対して予測信頼度γを係数として乗算することにより、評価値Jtを算出する。
【0049】
制御ペナルティ項は、制御指令系列Uにおける制御指令の時間的変化量に対するペナルティである。例えば、制御ペナルティ項は、制御指令系列Uに含まれる制御指令が、急な加減速や急な旋回を示すような場合に、その値(ペナルティ)が大きくなり、反対に、並進速度や角速度の時間的変化量が小さい移動を示すような場合に、その値(ペナルティ)が小さくなる。
【0050】
対象者ペナルティ項は、対象者予測軌跡12と制御軌跡14との間の距離に対するペナルティである。例えば、対象者ペナルティ項は、対象者Hに接触する程度に接近したり、対象者Hから大きく離れたりするような場合に、その値(ペナルティ)が大きくなり、反対に、対象者Hとの間の距離が所定の範囲に維持されているような場合に、その値(ペナルティ)が小さくなる。
【0051】
目標ペナルティ項は、目標軌跡13と制御軌跡14との間の距離に対するペナルティである。例えば、目標ペナルティ項は、目標位置Gから離れるほどその値(ペナルティ)が大きくなり、反対に、目標位置Gに近づくほど、その値(ペナルティ)が小さくなる。
【0052】
移動制御手段617は、制御指令系列Uに基づいて、移動ユニット5を制御する。すなわち、移動制御手段617は、制御指令系列Uに含まれる最先時刻の制御指令U0,t を移動ユニット5に出力することにより、移動ユニット5を制御する。
【0053】
以上のように、本実施形態に係る移動体制御装置6、移動体制御プログラム6604及び移動体1によれば、観測軌跡取得手段611が、対象者Hが現時点までに歩行した軌跡を観測軌跡11として取得し、基本軌跡取得手段612が、不確かさが付与された複数の基本軌跡101~109から、観測軌跡11に合致する基本軌跡を特定基本軌跡100として取得し、対象者予測軌跡取得手段613が、特定基本軌跡100のうち、対象者Hが観測軌跡11に続くように現時点以降に歩行する軌跡を対象者予測軌跡12として取得し、予測信頼度算出手段614が、対象者予測軌跡12に沿って付与された不確かさに基づいて、対象者Hが対象者予測軌跡12に従って歩行すると予測する際の予測信頼度γを対象者予測軌跡12に沿って算出し、目標軌跡取得手段615が、対象者Hが対象者予測軌跡12に従って歩行するものとした場合に、対象者Hの進行方向前方に設定された移動体の目標位置Gにより形成される軌跡を目標軌跡13として取得し、制御指令系列生成手段616が、対象者予測軌跡12、予測信頼度γ、目標軌跡13、及び、移動ユニット5に対して時系列順に出力される制御指令系列Uに従って移動体1が移動するときの制御軌跡14を入力とする評価関数を用いて前記制御指令系列Uを生成し、移動制御手段617が、制御指令系列Uに基づいて、移動体1の移動ユニット5を制御する。
【0054】
そのため、制御指令系列生成手段616が制御指令系列Uを生成する際に用いる評価関数では、対象者Hが対象者予測軌跡12に従って歩行すると予測したときの予測信頼度γが考慮されているので、予測信頼度γの高低に応じて、移動体1の随行制御が実行される。したがって、移動体制御6は、複雑な制御パターンや制御ルールを事前に用意しなくても、所定の制御周期Δt毎に、図4の機能ブロック図に示す移動体制御処理(移動体制御方法)を実行することにより、対象者Hの様々な歩行状態に合わせて移動体1が対象者Hに随行するように、移動体1を適切に移動させることができる。
【0055】
その際、評価関数は、制御指令系列Uに対する制御ペナルティ項と、対象者予測軌跡12と制御軌跡14との間の距離に基づく対象者ペナルティ項と、目標軌跡13と制御軌跡14との間の距離に基づく目標ペナルティ項とを加算するとともに、対象者ペナルティ項及び目標ペナルティ項に対して予測信頼度γを係数として乗算することにより、評価値Jを算出する。
【0056】
そのため、評価値Jを算出する際に、予測信頼度γが高い場合と、予測信頼度γが低い場合では、予測信頼度γが係数として乗算される対象者ペナルティ項及び目標ペナルティ項によるペナルティの重みが変動する。例えば、予測信頼度γが低い場合には、対象者ペナルティ項及び目標ペナルティ項が、制御ペナルティ項よりも相対的に小さく評価されるので、対象者Hとの距離が離れたり、目標位置Gとの距離が離れたりすることによるペナルティが、制御指令の時間的変化量が大きくなることによるペナルティよりも相対的に小さく評価されることになる。これにより、予測信頼度γが低い場合には、移動体1が対象者H及び目標位置Gから離れることが許容されるとともに、併進速度や角速度を大きく変化させることなく惰行するような移動状態となるため、移動体1は、対象者Hの次の動作を伺うように様子見状態で移動することになる。
【0057】
また、対象者予測軌跡12として、例えば、直進時の基本軌跡104~106が取得されたような場合には、遠い将来の時点まで予測信頼度γが高い状態にあるので、対象者ペナルティ項及び目標ペナルティ項の重みが継続的に大きく評価される。これにより、移動体1は、対象者Hとの距離や目標位置Gとの距離が小さくなるように移動することになる。一方、対象者予測軌跡12として、例えば、急な旋回時の基本軌跡101、102、108、109が取得されたような場合には、将来の時点に進むにつれて予測信頼度γが低下していく状態にあるので、対象者ペナルティ項及び目標ペナルティ項の重みは、将来の時点になるほど小さく評価される。これにより、移動体1は、時間が進むにつれて対象者Hへの随行制御の度合いを弱め、徐々に対象者Hの次の動作を伺うように様子見状態に移行することになる。
【0058】
(シミュレーションによる解析結果)
次に、移動体制御装置6により制御されたロボットRが移動する状況を、シミュレーションにより解析した結果について説明する。
【0059】
図7は、シミュレーションの概要を示し、(a)はシミュレーション条件、(b)は評価指標(c)は適正範囲を示す図である。図7(a)におけるステップ数は、制御周期Δtの1周期を1ステップとしてカウントしたものである。評価指標は、図7(b)に示すように、平均目標追従誤差TE、ロボットRの走行距離の総和D、及び、適正範囲外時間Tcomfortの3つを用いて評価した。なお、適正範囲は、図7(c)に示すように、対象者Hを中心とし、その中心からの距離が0.45mから1.2mまでの範囲であり、ロボットRが当該適正範囲の外側に存在する時間を適正範囲外時間Tcomfortとして評価した。
【0060】
シミュレーションでは、(1)対象者Hの予測を行わない(対象者予測軌跡12を取得しない)状態で、対象者検出ユニット4の検出結果のみを用いてロボットRを制御した場合、(2)対象者Hの予測を行うが、予測の不確かさを考慮しない(予測信頼度γを取得しない)状態で、ロボットRを制御した場合、(3)本発明(図4に示す機能ブロック図)によりロボットRを制御した場合の3つについて、上記の評価指標の値と、制御軌跡14とをそれぞれ比較した。対象者Hの歩行パターンとしては、直進した後、Uターンするような歩行パターンを対象とした。
【0061】
図8は、シミュレーションの解析結果を示し、(a)は評価指標の比較結果、(b)は制御軌跡の比較結果を示す図である。
【0062】
図8(a)に示す評価指標について比較すると、(3)本発明によるシミュレーション結果の評価指標では、(1)対象者Hの予測を行わない場合の評価指標に比べて、平均目標追従誤差TEが小さいことが分かった。これは、対象者Hの軌跡を予測することにより制御の遅れが低減されたことによる効果であると考えられる。
【0063】
また、(3)本発明によるシミュレーション結果の評価指標では、(2)不確かさを考慮しない場合の評価指標に比べて、ロボットRの走行距離の総和Dが小さくなっており、無断な動きが少ないことが分かった。
【0064】
図8(b)に示す制御軌跡14について比較すると、(3)本発明によるシミュレーション結果の制御軌跡14では、(1)対象者Hの予測を行わない場合の制御軌跡14に比べて、急な加減速や急な旋回が少なく、また、遅れも少ないことが分かった。これは、上述したように、対象者Hの軌跡を予測することにより対象者Hの次の動作を伺うように移動した結果、制御の遅れが低減されて、対象者Hの動きに合わせた随行制御が実行されたものと考えられる。
【0065】
また、(3)本発明によるシミュレーション結果の制御軌跡14では、(2)不確かさを考慮しない場合の制御軌跡14に比べて、対象者HがUターンする際、対象者Hの歩行を妨害することなく移動できることが分かった。これは、Uターン時に、ロボットRの目標位置Gが、対象者Hの進行方向に対して右前方から左前方に適切に切り替えられたことによる効果であると考えられる。
【0066】
(他の実施形態)
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の技術的思想を逸脱しない範囲で適宜変更可能である。
【0067】
例えば、移動体1の移動ユニット5は、複数の車輪50として、例えば、オムニホイールを備えるものでもよいし、複数の車輪50に代えて、二足歩行を行う歩行機構を備えるものでもよい。
【0068】
また、上記実施形態では、移動体1が移動体制御装置6を備えるものとして説明したが、移動体制御装置6が、移動体1と各種の情報を通信可能に構成されることで、移動体1とは別体の装置に備えられたものでもよい。
【0069】
また、上記実施形態では、移動体制御プログラム604は、記憶部60に記憶されたものとして説明したが、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。また、移動体制御プログラム604は、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供されてもよい。
【符号の説明】
【0070】
1…移動体(ロボットR)、2…本体、3…自位置検出ユニット、4…対象者検出ユニット
5…移動ユニット(移動手段)、6…移動体制御装置、7…電源
11…観測軌跡、12…対象者予測軌跡、13…目標軌跡、14…制御軌跡、
100…特定基本軌跡、101~109…基本軌跡
40…検出範囲、50…車輪、51…電動モータ
60…記憶部、61…制御部、62…通信部
600…移動体情報、601…対象者情報、602…基本軌跡群情報、
603…設定情報、604…移動体制御プログラム、
610…対象者情報取得手段、611…観測軌跡取得手段、
612…基本軌跡取得手段、613…対象者予測軌跡取得手段、
614…予測信頼度算出手段、615…目標軌跡取得手段、
616…制御指令系列生成手段、617…移動制御手段、
H…対象者
図1
図2
図3
図4
図5
図6
図7
図8