特許7232210 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ アイシン精機株式会社の特許一覧 ▶ 学校法人慶應義塾の特許一覧

特許7232210移動体制御装置、移動体制御プログラム及び移動体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-02-21

(45)【発行日】2023-03-02

(54)【発明の名称】移動体制御装置、移動体制御プログラム及び移動体

(51)【国際特許分類】

G05D 1/02 20200101AFI20230222BHJP

【ＦＩ】

G05D1/02 H

【請求項の数】 7

(21)【出願番号】P 2020064336

(22)【出願日】2020-03-31

(65)【公開番号】P2021163216

(43)【公開日】2021-10-11

【審査請求日】2022-06-07

(73)【特許権者】

【識別番号】000000011

【氏名又は名称】株式会社アイシン

(73)【特許権者】

【識別番号】899000079

【氏名又は名称】慶應義塾

(74)【代理人】

【識別番号】100214260

【弁理士】

【氏名又は名称】相羽昌孝

(74)【代理人】

【識別番号】100139114

【弁理士】

【氏名又は名称】田中貞嗣

(74)【代理人】

【識別番号】100139103

【弁理士】

【氏名又は名称】小山卓志

(74)【代理人】

【識別番号】100119220

【氏名又は名称】片寄武彦

(72)【発明者】

【氏名】久野和宏

(72)【発明者】

【氏名】渡邊豊

(72)【発明者】

【氏名】▲高▼橋正樹

(72)【発明者】

【氏名】萬礼応

(72)【発明者】

【氏名】関口舜一

【審査官】堀内亮吾

(56)【参考文献】

【文献】特表２０１９－５１４１０３（ＪＰ，Ａ）

【文献】特開２００８－１９１８００（ＪＰ，Ａ）

【文献】特開２００７－２８６７４１（ＪＰ，Ａ）

【文献】特開２０１９－１７９４６０（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０５Ｄ１／０２

(57)【特許請求の範囲】

【請求項1】

移動体が対象者の進行方向前方に随行して移動するように、前記移動体の移動手段を制御する移動体制御装置であって、
前記対象者の位置及び進行方向を含む対象者情報を取得する対象者情報取得手段と、
前記対象者情報を時系列で処理することにより前記対象者が現時点までに歩行した軌跡を観測軌跡として取得する観測軌跡取得手段と、
歩行者が異なる複数の目的地点に向かって歩行するときの軌跡に沿って前記軌跡から逸脱する確率分布を表す不確かさが付与された複数の基本軌跡から、前記観測軌跡に合致する前記基本軌跡を特定基本軌跡として取得する基本軌跡取得手段と、
前記特定基本軌跡のうち、前記対象者が前記観測軌跡に続くように前記現時点以降に歩行する軌跡を対象者予測軌跡として取得する対象者予測軌跡取得手段と、
前記対象者予測軌跡に沿って付与された前記不確かさに基づいて、前記対象者が前記対象者予測軌跡に従って歩行すると予測する際の予測信頼度を前記対象者予測軌跡に沿って算出する予測信頼度算出手段と、
前記対象者が前記対象者予測軌跡に従って歩行するものとした場合に、前記対象者の進行方向前方に設定された前記移動体の目標位置により形成される軌跡を目標軌跡として取得する目標軌跡取得手段と、
前記対象者予測軌跡、前記予測信頼度、前記目標軌跡、及び、前記移動手段に対して時系列順に出力される制御指令系列に従って前記移動体が移動するときの制御軌跡を入力とする評価関数を用いて前記制御指令系列を生成する制御指令系列生成手段と、
前記制御指令系列に基づいて、前記移動手段を制御する移動制御手段とを備える、
ことを特徴とする移動体制御装置。

【請求項2】

前記評価関数は、
前記制御指令系列に対する制御ペナルティ項と、前記対象者予測軌跡と前記制御軌跡との間の距離に基づく対象者ペナルティ項と、前記目標軌跡と前記制御軌跡との間の距離に基づく目標ペナルティ項とを加算するとともに、前記対象者ペナルティ項及び前記目標ペナルティ項に対して前記予測信頼度を係数として乗算することにより、前記評価値を算出するものであり、
前記制御指令系列生成手段は、
前記評価値を最小化するように、前記制御指令系列を生成する、
ことを特徴とする請求項１に記載の移動体制御装置。

【請求項3】

前記基本軌跡取得手段は、
前記複数の基本軌跡が前記観測軌跡に合致する合致度をそれぞれ算出し、前記合致度に基づいて、前記複数の基本軌跡を合成することにより、前記特定基本軌跡を取得する、
ことを特徴とする請求項１又は２に記載の移動体制御装置。

【請求項4】

前記基本軌跡は、
当該基本軌跡の旋回角度が高いほど前記不確かさが大きく設定されるとともに、当該基本軌跡における時間軸が進むほど前記不確かさが大きく設定される、
ことを特徴とする請求項１乃至請求項３のいずれか一項に記載の移動体制御装置。

【請求項5】

目標軌跡取得手段は、
前記移動体の位置及び進行方向を含む移動体情報と、前記対象者情報とに基づいて、前記対象者の進行方向の左前方及び右前方のいずれかを前記目標位置として選択し、その選択した前記目標位置により形成される軌跡を前記目標軌跡を取得する、
ことを特徴とする請求項１乃至請求項４のいずれか一項に記載の移動体制御装置。

【請求項6】

コンピュータを、請求項１乃至請求項５のいずれか一項に記載された移動体制御装置として機能させる、
ことを特徴とする移動体制御プログラム。

【請求項7】

請求項１乃至請求項５のいずれか一項に記載された移動体制御装置を備える、
ことを特徴とする移動体。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、移動体制御装置、移動体制御プログラム及び移動体に関する。

【背景技術】

【0002】

従来、歩行者の進行方向前方を随行して移動するように、ロボットを制御するための様々な制御方法が知られている。例えば、特許文献１には、対象者に対して斜め前方かつ相対的な所定位置を維持して追従動作を行う移動ロボットにおいて、カメラ等によって検出された対象者の向きに応じて、移動ロボットの目標位置を決定することが開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２００８－２３４４０４号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１に開示された移動ロボットでは、上述したように、カメラ等によって検出された対象者の向きに応じて、移動ロボットの目標位置を決定するものである。しかし、カメラ等によって検出された対象者の向きには誤差が含まれるだけでなく、対象者の旋回時や方向転換時等には、対象者の進行方向を正確に検出することができず、移動ロボットの目標位置を適切に決定することが困難であった。

【0005】

本発明は、このような事情に鑑みてなされたものであって、移動体が対象者の歩行状態に合わせて対象者に随行するように、移動体を適切に移動させることができる移動体制御装置、移動体制御プログラム及び移動体を提供することを目的とする。

【課題を解決するための手段】

【0006】

本発明は、上記課題を解決するものであって、本発明の一実施形態に係る移動体制御装置は、
移動体が対象者の進行方向前方に随行して移動するように、前記移動体の移動手段を制御する移動体制御装置であって、
前記対象者の位置及び進行方向を含む対象者情報を取得する対象者情報取得手段と、
前記対象者情報を時系列で処理することにより前記対象者が現時点までに歩行した軌跡を観測軌跡として取得する観測軌跡取得手段と、
歩行者が異なる複数の目的地点に向かって歩行するときの軌跡に沿って前記軌跡から逸脱する確率分布を表す不確かさが付与された複数の基本軌跡から、前記観測軌跡に合致する前記基本軌跡を特定基本軌跡として取得する基本軌跡取得手段と、
前記特定基本軌跡のうち、前記対象者が前記観測軌跡に続くように前記現時点以降に歩行する軌跡を対象者予測軌跡として取得する対象者予測軌跡取得手段と、
前記対象者予測軌跡に沿って付与された前記不確かさに基づいて、前記対象者が前記対象者予測軌跡に従って歩行すると予測する際の予測信頼度を前記対象者予測軌跡に沿って算出する予測信頼度算出手段と、
前記対象者が前記対象者予測軌跡に従って歩行するものとした場合に、前記対象者の進行方向前方に設定された前記移動体の目標位置により形成される軌跡を目標軌跡として取得する目標軌跡取得手段と、
前記対象者予測軌跡、前記予測信頼度、前記目標軌跡、及び、前記移動手段に対して時系列順に出力される制御指令系列に従って前記移動体が移動するときの制御軌跡を入力とする評価関数を用いて、前記制御指令系列を生成する制御指令系列生成手段と、
前記制御指令系列に基づいて、前記移動手段を制御する移動制御手段とを備える、ことを特徴とする。

【0007】

また、本発明の一実施形態に係る移動体制御プログラムは、
コンピュータを、上記移動体制御装置として機能させる、ことを特徴とする。

【0008】

また、本発明の一実施形態に係る移動体は、
上記移動体制御装置を備える、ことを特徴とする。

【発明の効果】

【0009】

本発明の一実施形態に係る移動体制御装置、移動体制御プログラム及び移動体によれば、観測軌跡取得手段が、対象者が現時点までに歩行した軌跡を観測軌跡として取得し、基本軌跡取得手段が、不確かさが付与された複数の基本軌跡から、観測軌跡に合致する基本軌跡を特定基本軌跡として取得し、対象者予測軌跡取得手段が、特定基本軌跡のうち、対象者が観測軌跡に続くように現時点以降に歩行する軌跡を対象者予測軌跡として取得し、予測信頼度算出手段が、対象者予測軌跡に沿って付与された不確かさに基づいて、対象者が対象者予測軌跡に従って歩行すると予測する際の予測信頼度を対象者予測軌跡に沿って算出し、目標軌跡取得手段が、対象者が対象者予測軌跡に従って歩行するものとした場合に、対象者の進行方向前方に設定された移動体の目標位置により形成される軌跡を目標軌跡として取得し、制御指令系列生成手段が、対象者予測軌跡、予測信頼度、目標軌跡、及び、移動手段に対して時系列順に出力される制御指令系列に従って移動体が移動するときの制御軌跡を入力とする評価関数を用いて制御指令系列を生成し、移動制御手段が、制御指令系列に基づいて、移動体の移動手段を制御する。

【0010】

そのため、制御指令系列生成手段が制御指令系列を生成する際に用いる評価関数では、対象者が対象者予測軌跡に従って歩行すると予測したときの予測信頼度が考慮されているので、予測信頼度の高低に応じて、移動体の随行制御が実行される。したがって、移動体が対象者の歩行状態に合わせて対象者に随行するように、移動体を適切に移動させることができる。

【図面の簡単な説明】

【0011】

【図1】本発明の実施形態に係る移動体１（ロボットＲ）の一例を示し、（ａ）は正面図、（ｂ）は平面図である。

【図2】本発明の実施形態に係る移動体１（ロボットＲ）の一例を示すブロック図である。

【図3】基本軌跡群情報６０２に含まれる複数の基本軌跡１０１～１０９の一例を示す図である。

【図4】本発明の実施形態に係る移動体制御装置６の一例を示す機能ブロック図である。

【図5】基本軌跡１０３、１０４から合成された特定基本軌跡１００の一例を示す図である。

【図6】対象者予測軌跡１２、予測信頼度γ、目標軌跡１３、制御軌跡１４、及び、制御指令系列Ｕの関係を示す模式図である。

【図7】シミュレーションの概要を示し、（ａ）はシミュレーション条件、（ｂ）は評価指標（ｃ）は適正範囲を示す図である。

【図8】シミュレーションの解析結果を示し、（ａ）は評価指標の比較結果、（ｂ）は制御軌跡の比較結果を示す図である。

【発明を実施するための形態】

【0012】

以下、本発明の一実施形態について添付図面を参照しつつ説明する。

【0013】

図１は、本発明の実施形態に係る移動体１（ロボットＲ）の一例を示し、（ａ）は正面図、（ｂ）は平面図である。図２は、本発明の実施形態に係る移動体１（ロボットＲ）の一例を示すブロック図である。

【0014】

移動体１は、例えば、自走式のロボットＲとして構成されており、対象者Ｈの歩行状態（速度や進行方向）に合わせて対象者Ｈの進行方向前方に設定された目標位置Ｇを逐次更新しながら移動することで、対象者Ｈに随行して移動する装置である。なお、移動体１は、例えば、産業用、商業用、家庭用、医療用、災害用、研究用等の任意の用途で使用されるものでよい。また、移動体１が使用される環境は、室内でもよいし、屋外でもよい。

【0015】

本実施形態では、移動体１は、図１に示すように、自走式のロボットＲであるものして説明する。ロボットＲは、例えば、円柱状の本体２と、自装置（ロボットＲ）の現在位置（自位置）及び姿勢（進行方向）を検出する自位置検出ユニット３と、ロボットＲの周囲に存在する対象者Ｈを検出する対象者検出ユニット４と、ロボットＲを前後左右に移動させる移動ユニット５と、本体２に内蔵されて、ロボットＲの各部を制御する移動体制御処理（移動体制御方法）を行う移動体制御装置６と、ロボットＲの各部に電力を供給する電源７とを備える。

【0016】

自位置検出ユニット３は、例えば、ＧＰＳセンサや推測航法による位置推測センサ（車輪５０の回転角速度センサ等）で構成されており、ロボットＲの自位置及び進行方向を所定の検出周期で検出し、その検出結果を移動体制御装置６に送る。なお、自位置検出ユニット３は、環境内の各位置に設置された位置発信機（不図示）から位置情報を受信することにより、ロボットＲの自位置を検出するものでもよいし、上述の複数の手段を組み合わせたものでもよい。

【0017】

対象者検出ユニット４は、例えば、レーザレンジセンサやミリ波センサ等の測距センサで構成され、対象者Ｈの肩付近及び足首付近の高さにそれぞれ取り付けられている。対象者検出ユニット４は、所定の検出周期でレーザ光やミリ波を全方位（３６０度）に対して照射し、検出範囲４０に存在する対象者Ｈからの反射光や反射波が戻るまでの時間を計測することで、ロボットＲに対する対象者Ｈの相対位置（距離や方位）を検出するとともに、肩の形状や足元の動き等を観察することで、対象者Ｈの進行方向を検出する。そして、対象者検出ユニット４は、その対象者Ｈの検出結果を所定の検出周期で移動体制御装置６に送る。なお、対象者検出ユニット４は、カメラ、超音波センサ、赤外線センサ等で構成されていてもよいし、上述の複数の手段を組み合わせたものでもよい。また、対象者検出ユニット４は、他の移動体１、他の歩行者、障害物を検出する機能を兼ねてもよい。

【0018】

移動ユニット５は、複数の車輪５０と、電源７から電力が供給され、複数の車輪５０を回転駆動させる複数の電動モータ５１とを備える。移動ユニット５は、移動体制御装置６から送られた制御指令に基づいて、電動モータ５１の回転数やトルクを制御することにより、ロボットＲが前進又は後進するときの並進運動Ｕ^ｖを変更するとともに、ロボットＲが旋回するときの角速度Ｕ^ωを変更する。なお、移動ユニット５は、ロボットＲを旋回させる機能として、例えば、左右の車輪５０の回転数の差を設けてもよいし、前側の車輪５０の向きを変更する操舵機構を備えていてもよい。

【0019】

移動体制御装置６は、自位置検出ユニット３から送られた自位置の検出結果や、対象者検出ユニット４から送られた対象者Ｈの検出結果に基づいて、ロボットＲと対象者Ｈとの間の距離を維持しつつロボットＲを対象者Ｈの進行方向前方に随行して移動させるように、移動ユニット５に制御指令を送ることでロボットＲを制御する。

【0020】

本実施形態では、移動体制御装置６は、移動ユニット５が独立二輪駆動型であって、下記の（１）式に示す状態方程式により定義される運動学モデルを用いて、移動ユニット５を制御するものとして説明する。したがって、移動体制御装置６は、所定の制御周期Δｔ毎に、移動ユニット５に対して制御指令Ｕ＝｛並進運動Ｕ^ｖ，角速度Ｕ^ω｝を出力することで、移動体の位置（ｘ、ｙ）及び進行方向θを制御する。

【0021】

【数1】

【0022】

移動体制御装置６は、その具体的な構成として、図２に示すように、ＨＤＤ、ＳＤＤ、ＲＯＭ、ＲＡＭ等により構成され、各種の情報を記憶する記憶部６０と、ＣＰＵ等のプロセッサにより構成され、各種の演算を行う制御部６１と、外部装置（例えば、インフラ設備、集中管理装置、他の移動体、対象者Ｈが所持する携帯端末等を含む。）との通信インターフェースである通信部６２とを備える。

【0023】

記憶部６０は、ロボットＲの位置及び進行方向を含む移動体情報６００と、対象者Ｈの位置及び進行方向を含む対象者情報６０１と、複数の基本軌跡に関する情報を含む基本軌跡群情報６０２と、評価値Ｊ（詳細は後述する。）を算出するのに必要な各種の係数、条件、算出式等を含む設定情報６０３と、移動体制御プログラム６０４とを記憶する。

【0024】

移動体情報６００に含まれるロボットＲの位置及び進行方向は、所定の検出周期で自位置検出ユニット３により検出された検出結果（ロボットＲの位置及び進行方向）を、過去の時点から現時点までの所定の期間分を時系列順に蓄積したものであり、自位置検出ユニット３から新たな検出結果が送られると、現時点の情報が逐次更新される。

【0025】

対象者情報６０１に含まれる対象者Ｈの位置及び進行方向は、所定の検出周期で対象者検出ユニット４により検出された検出結果（対象者Ｈの位置及び進行方向）を、過去の時点から現時点までの所定の期間分を時系列順に蓄積したものであり、対象者検出ユニット４から新たな検出結果が送られると、現時点の情報が逐次更新される。

【0026】

図３は、基本軌跡群情報６０２に含まれる複数の基本軌跡１０１～１０９の一例を示す図である。

【0027】

基本軌跡群情報６０２は、歩行者が異なる複数の目的地点（図３の例ではスタート位置に対して９つの目的地点１～９）に向かって歩行するときの複数の基本軌跡１０１～１０９を事前の実験で学習したものである。

【0028】

例えば、複数の歩行者の各々が、出発地点から各目的地点１～９に向かってそれぞれ歩行するときの軌跡を各種のセンサで複数回計測し、それらを統計的に処理することで、目的地点１～９に対する基本軌跡１０１～１０９の形状（図３で示す実線部分）を生成したものである。例えば、基本軌跡１０１～１０９は、各時点の歩行者の位置及び進行方向を、時系列順に並べた点列のデータとして生成される。そして、原点Ｏの位置を、例えば、現時点の位置とすることで、原点Ｏよりも左側の軌跡は、過去の時点から現時点までの軌跡であり、原点Ｏよりも右側の軌跡は、現時点から将来の時点までの軌跡であるものとして取り扱われる。

【0029】

また、対象者Ｈが同じ目的地点に歩行したときの軌跡を比較した場合、複数の対象者Ｈの間で差異（ばらつき）があり、また、同じ歩行者であっても１回目の歩行時と２回目の歩行時では軌跡に差異（ばらつき）がある。そのため、基本軌跡１０１～１０９（図３で示す実線部分）から逸脱する確率分布を、例えば、ガウス分布等を用いて不確かさ（エントロピー）として表すことにより、基本軌跡１０１～１０９には、各基本軌跡１０１～１０９の形状（図３で示す実線部分）に沿って不確かさ（図３で示す楕円部分）が付与されている。

【0030】

図３に示す基本軌跡１０１～１０９では、各時点における不確かさは、標準偏差の２倍（２σ）の範囲に相当する楕円として表されている。基本軌跡１０１～１０９において、基本軌跡の旋回角度が高いほど不確かさが大きく設定されるものであり、例えば、Ｕターンに相当する基本軌跡１０１、１０９、急な旋回時に相当する基本軌跡１０２、１０８における不確かさ（楕円）が大きく設定される。また、基本軌跡１０１～１０９において、基本軌跡における時間軸が進むほど不確かさが大きく設定されるものであり、例えば、原点Ｏよりも右側に進むほど、不確かさ（楕円）が大きく設定される。なお、図３に示す基本軌跡１０１～１０９は、位置（ｘ座標及びｙ座標）に関するものであるが、基本軌跡群情報６０２は、進行方向θに関する基本軌跡１０１～１０９（不図示）をさらに備え、ｘ座標及びｙ座標と同様に取り扱われる。

【0031】

制御部６１は、図２に示すように、移動体制御プログラム６０４を実行することにより、対象者情報取得手段６１０、観測軌跡取得手段６１１、基本軌跡取得手段６１２、対象者予測軌跡取得手段６１３、予測信頼度算出手段６１４、目標軌跡取得手段６１５、制御指令系列生成手段６１６、及び、移動制御手段６１７として機能する。

【0032】

図４は、本発明の実施形態に係る移動体制御装置６の一例を示す機能ブロック図である。

【0033】

対象者情報取得手段６１０は、対象者Ｈの位置及び進行方向を含む対象者情報６０１を記憶部６０から読み出すことにより、対象者情報６０１を取得する。なお、対象者情報取得手段６１０は、対象者検出ユニット４から対象者情報６０１を直接取得してもよい。

【0034】

観測軌跡取得手段６１１は、対象者情報６０１を時系列で処理することにより、対象者Ｈが現時点までに移動した軌跡を観測軌跡１１として取得する。観測軌跡１１は、所定の検出周期で対象者検出ユニット４により測定された各時点の対象者Ｈの位置及び進行方向を、時系列順に並べた点列のデータである。

【0035】

基本軌跡取得手段６１２は、基本軌跡群情報６０２に含まれる複数の基本軌跡１０１～１０９から、観測軌跡１１に合致する基本軌跡を特定基本軌跡１００として取得する。具体的には、基本軌跡取得手段６１２は、複数の基本軌跡１０１～１０９が観測軌跡１１に合致する合致度をそれぞれ算出し、各観測軌跡１１に対する合致度に基づいて複数の基本軌跡を合成することにより、特定基本軌跡１００を取得する。

【0036】

図５は、基本軌跡１０３、１０４から合成された特定基本軌跡１００の一例を示す図である。なお、図５では、位置（ｘ座標及びｙ座標）に関する基本軌跡１０３、１０４だけでなく、進行方向θに関する基本軌跡１０３、１０４についても図示している。

【0037】

合致度は、例えば、０から１までの値域で算出され、対象者Ｈが現時点までに歩行した観測軌跡１１の形状と、各基本軌跡１０１～１０９における原点Ｏまでの形状（過去の時点から現時点までの形状）とが類似するほど、高く算出される指標値である。図５の例では、基本軌跡取得手段６１２が、例えば、基本軌跡１０３の合致度が「０．３」と算出し、基本軌跡１０４の合致度が「０．７」と算出した場合であり、この場合には、基本軌跡１０３と基本軌跡１０４とを「３：７」の比率で按分して合成することにより、特定基本軌跡１００を取得する。これにより、観測軌跡１１が、基本軌跡群情報６０２に含まれていないような未知の軌跡であったとしても、既知の基本軌１０１～１０９から観測規則１１に合致する特定基本軌跡１００を取得することができる。

【0038】

対象者予測軌跡取得手段６１３は、特定基本軌跡１００のうち、対象者Ｈが観測軌跡１１に続くように現時点以降に歩行する軌跡を対象者予測軌跡１２として取得する。

【0039】

予測信頼度算出手段６１４は、対象者予測軌跡１２に沿って付与された不確かさ（エントロピー）に基づいて、対象者Ｈが対象者予測軌跡１２に従って歩行すると予測する際の予測信頼度γを対象者予測軌跡１２に沿って算出する。

【0040】

予測信頼度算出手段６１４は、対象者予測軌跡１２に沿って各点に付与された不確かさ（楕円の大きさ）に対して、下記の（２）式に示すように、シグモイド関数を適用することにより、０から１までの値域で予測信頼度γを算出する。予測信頼度γは、不確かさが小さいほど、大きく算出される指標値である。

【0041】

【数2】

【0042】

目標軌跡取得手段６１５は、対象者Ｈが対象者予測軌跡１２に従って歩行するものとした場合に、対象者Ｈの進行方向前方に設定されたロボットＲの目標位置Ｇにより形成される軌跡を目標軌跡１３として取得する。

【0043】

例えば、ロボットＲの目標位置Ｇとして、対象者の進行方向の左前方及び右前方のいずれかを選択可能に設定される場合には、目標軌跡取得手段６１５は、ロボットＲの位置及び進行方向を含む移動体情報６００と、対象者情報６０１とに基づいて、対象者Ｈの進行方向の左前方及び右前方のいずれかを目標位置Ｇとして選択し、その選択した目標位置Ｇにより形成される軌跡を目標軌跡１３として取得する。目標位置Ｇは、例えば、対象者Ｈの進行方向に対して左４５度又は右４５度であって、対象者Ｈから０．８５［ｍ］の位置に設定される。なお、図４の例では、目標軌跡１３は、目標位置Ｇが対象者Ｈの進行方向右前方に設定されている場合に、当該目標位置Ｇにより形成される軌跡である、

【0044】

制御指令系列生成手段６１６は、対象者予測軌跡１２、予測信頼度γ、目標軌跡１３、及び、移動ユニット５に対して時系列順に出力される制御指令系列Ｕに従ってロボットＲが移動するときの制御軌跡１４を入力とする評価関数を用いて、制御指令系列Ｕを生成する。なお、制御指令系列Ｕと、制御軌跡１４とは、上記の（１）式に示す運動方程式により規定される。

【0045】

評価関数は、下記の（３）式で定義されており、制御指令系列生成手段６１６は、評価関数により算出される評価値Ｊ_ｔを最小化するように、制御指令系列Ｕを生成する。

【0046】

【数3】

【0047】

図６は、対象者予測軌跡１２、予測信頼度γ、目標軌跡１３、制御軌跡１４、及び、制御指令系列Ｕの関係を示す模式図である。

【0048】

評価関数は、上記の（３）式のように、制御指令系列Ｕに対する制御ペナルティ項と、対象者予測軌跡１２と制御軌跡１４との間の距離に基づく対象者ペナルティ項と、目標軌跡１３と制御軌跡１４との間の距離に基づく目標ペナルティ項とを加算するとともに、対象者ペナルティ項及び目標ペナルティ項に対して予測信頼度γを係数として乗算することにより、評価値Ｊｔを算出する。

【0049】

制御ペナルティ項は、制御指令系列Ｕにおける制御指令の時間的変化量に対するペナルティである。例えば、制御ペナルティ項は、制御指令系列Ｕに含まれる制御指令が、急な加減速や急な旋回を示すような場合に、その値（ペナルティ）が大きくなり、反対に、並進速度や角速度の時間的変化量が小さい移動を示すような場合に、その値（ペナルティ）が小さくなる。

【0050】

対象者ペナルティ項は、対象者予測軌跡１２と制御軌跡１４との間の距離に対するペナルティである。例えば、対象者ペナルティ項は、対象者Ｈに接触する程度に接近したり、対象者Ｈから大きく離れたりするような場合に、その値（ペナルティ）が大きくなり、反対に、対象者Ｈとの間の距離が所定の範囲に維持されているような場合に、その値（ペナルティ）が小さくなる。

【0051】

目標ペナルティ項は、目標軌跡１３と制御軌跡１４との間の距離に対するペナルティである。例えば、目標ペナルティ項は、目標位置Ｇから離れるほどその値（ペナルティ）が大きくなり、反対に、目標位置Ｇに近づくほど、その値（ペナルティ）が小さくなる。

【0052】

移動制御手段６１７は、制御指令系列Ｕに基づいて、移動ユニット５を制御する。すなわち、移動制御手段６１７は、制御指令系列Ｕに含まれる最先時刻の制御指令Ｕ_０，ｔ ^ｒを移動ユニット５に出力することにより、移動ユニット５を制御する。

【0053】

以上のように、本実施形態に係る移動体制御装置６、移動体制御プログラム６６０４及び移動体１によれば、観測軌跡取得手段６１１が、対象者Ｈが現時点までに歩行した軌跡を観測軌跡１１として取得し、基本軌跡取得手段６１２が、不確かさが付与された複数の基本軌跡１０１～１０９から、観測軌跡１１に合致する基本軌跡を特定基本軌跡１００として取得し、対象者予測軌跡取得手段６１３が、特定基本軌跡１００のうち、対象者Ｈが観測軌跡１１に続くように現時点以降に歩行する軌跡を対象者予測軌跡１２として取得し、予測信頼度算出手段６１４が、対象者予測軌跡１２に沿って付与された不確かさに基づいて、対象者Ｈが対象者予測軌跡１２に従って歩行すると予測する際の予測信頼度γを対象者予測軌跡１２に沿って算出し、目標軌跡取得手段６１５が、対象者Ｈが対象者予測軌跡１２に従って歩行するものとした場合に、対象者Ｈの進行方向前方に設定された移動体の目標位置Ｇにより形成される軌跡を目標軌跡１３として取得し、制御指令系列生成手段６１６が、対象者予測軌跡１２、予測信頼度γ、目標軌跡１３、及び、移動ユニット５に対して時系列順に出力される制御指令系列Ｕに従って移動体１が移動するときの制御軌跡１４を入力とする評価関数を用いて前記制御指令系列Ｕを生成し、移動制御手段６１７が、制御指令系列Ｕに基づいて、移動体１の移動ユニット５を制御する。

【0054】

そのため、制御指令系列生成手段６１６が制御指令系列Ｕを生成する際に用いる評価関数では、対象者Ｈが対象者予測軌跡１２に従って歩行すると予測したときの予測信頼度γが考慮されているので、予測信頼度γの高低に応じて、移動体１の随行制御が実行される。したがって、移動体制御６は、複雑な制御パターンや制御ルールを事前に用意しなくても、所定の制御周期Δｔ毎に、図４の機能ブロック図に示す移動体制御処理（移動体制御方法）を実行することにより、対象者Ｈの様々な歩行状態に合わせて移動体１が対象者Ｈに随行するように、移動体１を適切に移動させることができる。

【0055】

その際、評価関数は、制御指令系列Ｕに対する制御ペナルティ項と、対象者予測軌跡１２と制御軌跡１４との間の距離に基づく対象者ペナルティ項と、目標軌跡１３と制御軌跡１４との間の距離に基づく目標ペナルティ項とを加算するとともに、対象者ペナルティ項及び目標ペナルティ項に対して予測信頼度γを係数として乗算することにより、評価値Ｊ_ｓを算出する。

【0056】

そのため、評価値Ｊ_ｓを算出する際に、予測信頼度γが高い場合と、予測信頼度γが低い場合では、予測信頼度γが係数として乗算される対象者ペナルティ項及び目標ペナルティ項によるペナルティの重みが変動する。例えば、予測信頼度γが低い場合には、対象者ペナルティ項及び目標ペナルティ項が、制御ペナルティ項よりも相対的に小さく評価されるので、対象者Ｈとの距離が離れたり、目標位置Ｇとの距離が離れたりすることによるペナルティが、制御指令の時間的変化量が大きくなることによるペナルティよりも相対的に小さく評価されることになる。これにより、予測信頼度γが低い場合には、移動体１が対象者Ｈ及び目標位置Ｇから離れることが許容されるとともに、併進速度や角速度を大きく変化させることなく惰行するような移動状態となるため、移動体１は、対象者Ｈの次の動作を伺うように様子見状態で移動することになる。

【0057】

また、対象者予測軌跡１２として、例えば、直進時の基本軌跡１０４～１０６が取得されたような場合には、遠い将来の時点まで予測信頼度γが高い状態にあるので、対象者ペナルティ項及び目標ペナルティ項の重みが継続的に大きく評価される。これにより、移動体１は、対象者Ｈとの距離や目標位置Ｇとの距離が小さくなるように移動することになる。一方、対象者予測軌跡１２として、例えば、急な旋回時の基本軌跡１０１、１０２、１０８、１０９が取得されたような場合には、将来の時点に進むにつれて予測信頼度γが低下していく状態にあるので、対象者ペナルティ項及び目標ペナルティ項の重みは、将来の時点になるほど小さく評価される。これにより、移動体１は、時間が進むにつれて対象者Ｈへの随行制御の度合いを弱め、徐々に対象者Ｈの次の動作を伺うように様子見状態に移行することになる。

【0058】

（シミュレーションによる解析結果）
次に、移動体制御装置６により制御されたロボットＲが移動する状況を、シミュレーションにより解析した結果について説明する。

【0059】

図７は、シミュレーションの概要を示し、（ａ）はシミュレーション条件、（ｂ）は評価指標（ｃ）は適正範囲を示す図である。図７（ａ）におけるステップ数は、制御周期Δｔの1周期を1ステップとしてカウントしたものである。評価指標は、図７（ｂ）に示すように、平均目標追従誤差ＴＥ_Ｐ、ロボットＲの走行距離の総和Ｄ_ｎ、及び、適正範囲外時間Ｔ_{ｃｏｍｆｏｒｔ}の３つを用いて評価した。なお、適正範囲は、図７（ｃ）に示すように、対象者Ｈを中心とし、その中心からの距離が０．４５ｍから１．２ｍまでの範囲であり、ロボットＲが当該適正範囲の外側に存在する時間を適正範囲外時間Ｔ_{ｃｏｍｆｏｒｔ}として評価した。

【0060】

シミュレーションでは、（１）対象者Ｈの予測を行わない（対象者予測軌跡１２を取得しない）状態で、対象者検出ユニット４の検出結果のみを用いてロボットＲを制御した場合、（２）対象者Ｈの予測を行うが、予測の不確かさを考慮しない（予測信頼度γを取得しない）状態で、ロボットＲを制御した場合、（３）本発明（図４に示す機能ブロック図）によりロボットＲを制御した場合の３つについて、上記の評価指標の値と、制御軌跡１４とをそれぞれ比較した。対象者Ｈの歩行パターンとしては、直進した後、Ｕターンするような歩行パターンを対象とした。

【0061】

図８は、シミュレーションの解析結果を示し、（ａ）は評価指標の比較結果、（ｂ）は制御軌跡の比較結果を示す図である。

【0062】

図８（ａ）に示す評価指標について比較すると、（３）本発明によるシミュレーション結果の評価指標では、（１）対象者Ｈの予測を行わない場合の評価指標に比べて、平均目標追従誤差ＴＥ_Ｐが小さいことが分かった。これは、対象者Ｈの軌跡を予測することにより制御の遅れが低減されたことによる効果であると考えられる。

【0063】

また、（３）本発明によるシミュレーション結果の評価指標では、（２）不確かさを考慮しない場合の評価指標に比べて、ロボットＲの走行距離の総和Ｄ_ｎが小さくなっており、無断な動きが少ないことが分かった。

【0064】

図８（ｂ）に示す制御軌跡１４について比較すると、（３）本発明によるシミュレーション結果の制御軌跡１４では、（１）対象者Ｈの予測を行わない場合の制御軌跡１４に比べて、急な加減速や急な旋回が少なく、また、遅れも少ないことが分かった。これは、上述したように、対象者Ｈの軌跡を予測することにより対象者Ｈの次の動作を伺うように移動した結果、制御の遅れが低減されて、対象者Ｈの動きに合わせた随行制御が実行されたものと考えられる。

【0065】

また、（３）本発明によるシミュレーション結果の制御軌跡１４では、（２）不確かさを考慮しない場合の制御軌跡１４に比べて、対象者ＨがＵターンする際、対象者Ｈの歩行を妨害することなく移動できることが分かった。これは、Ｕターン時に、ロボットＲの目標位置Ｇが、対象者Ｈの進行方向に対して右前方から左前方に適切に切り替えられたことによる効果であると考えられる。

【0066】

（他の実施形態）
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の技術的思想を逸脱しない範囲で適宜変更可能である。

【0067】

例えば、移動体１の移動ユニット５は、複数の車輪５０として、例えば、オムニホイールを備えるものでもよいし、複数の車輪５０に代えて、二足歩行を行う歩行機構を備えるものでもよい。

【0068】

また、上記実施形態では、移動体１が移動体制御装置６を備えるものとして説明したが、移動体制御装置６が、移動体１と各種の情報を通信可能に構成されることで、移動体１とは別体の装置に備えられたものでもよい。

【0069】

また、上記実施形態では、移動体制御プログラム６０４は、記憶部６０に記憶されたものとして説明したが、インストール可能な形式又は実行可能な形式のファイルでＣＤ－ＲＯＭ、ＤＶＤ等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。また、移動体制御プログラム６０４は、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供されてもよい。

【符号の説明】

【0070】

１…移動体（ロボットＲ）、２…本体、３…自位置検出ユニット、４…対象者検出ユニット
５…移動ユニット（移動手段）、６…移動体制御装置、７…電源
１１…観測軌跡、１２…対象者予測軌跡、１３…目標軌跡、１４…制御軌跡、
１００…特定基本軌跡、１０１～１０９…基本軌跡
４０…検出範囲、５０…車輪、５１…電動モータ
６０…記憶部、６１…制御部、６２…通信部
６００…移動体情報、６０１…対象者情報、６０２…基本軌跡群情報、
６０３…設定情報、６０４…移動体制御プログラム、
６１０…対象者情報取得手段、６１１…観測軌跡取得手段、
６１２…基本軌跡取得手段、６１３…対象者予測軌跡取得手段、
６１４…予測信頼度算出手段、６１５…目標軌跡取得手段、
６１６…制御指令系列生成手段、６１７…移動制御手段、
Ｈ…対象者

【図1】