特許7601105 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7601105移動体制御装置、移動体制御方法、移動体制御システム及び移動体制御プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-12-09

(45)【発行日】2024-12-17

(54)【発明の名称】移動体制御装置、移動体制御方法、移動体制御システム及び移動体制御プログラム

(51)【国際特許分類】

G05D 1/43 20240101AFI20241210BHJP

【ＦＩ】

G05D1/43

【請求項の数】 10

(21)【出願番号】P 2022553318

(86)(22)【出願日】2020-09-30

(86)【国際出願番号】 JP2020037196

(87)【国際公開番号】W WO2022070324

(87)【国際公開日】2022-04-07

【審査請求日】2023-03-10

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100103894

【弁理士】

【氏名又は名称】家入健

(72)【発明者】

【氏名】安田真也

【審査官】松本泰典

(56)【参考文献】

【文献】特開平８－１６２４０（ＪＰ，Ａ）

【文献】国際公開第２０１２／０８６０２９（ＷＯ，Ａ１）

【文献】国際公開第２０１３／００２０６７（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０５Ｄ１／４３

(57)【特許請求の範囲】

【請求項1】

第１の制御入力値に基づき移動体を制御するロボット制御部と、
次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出部と、を有し、
前記制御入力算出部は、
前記第１の制御入力値のあとに前記ロボット制御部に与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって複数の経路コストを算出し、前記複数の経路コストのうち最も経路コストが小さくなる前記第２の制御入力値を算出する移動体制御装置。

【請求項2】

前記制御入力算出部は、
前記予想制御入力値を生成して、前記予想制御入力値に対応する前記複数の経路コストを算出する経路コスト算出部と、
前記複数の経路コストのうち最も経路コストが小さくなる前記第２の制御入力値を算出する制御入力決定部と、
を有する請求項１に記載の移動体制御装置。

【請求項3】

前記経路コスト算出部は、
現制御サイクルの前記第１の制御入力値に基づき前記予想制御入力値を生成する制御入力列生成部と、
前記予想制御入力値に対して疑似乱数パターンを適用した確率変動シミュレーションを異なる疑似乱数パターンを用いて複数回行い、複数の前記確率変動シミュレーションのそれぞれにおいて前記移動体の走行状態を判断する指標となる予測コストを算出する確率変動シミュレーション処理部と、
複数の前記確率変動シミュレーションにおいて生成された複数の前記予測コストを用いて前記経路コストを算出するコスト推定部と、有し、
前記確率変動シミュレーション処理部は、
それぞれが複数の前記確率変動シミュレーションのいずれか１つを実行する複数のシミュレーション実行部と、
前記複数のシミュレーション実行部のうち対応する前記シミュレーション実行部で算出されたシミュレーション結果について前記予測コストを算出する複数のコスト計算部と、
を有する請求項２に記載の移動体制御装置。

【請求項4】

前記制御入力算出部は、
前記移動体の位置情報を取得する位置情報取得部を有し、
前記複数のシミュレーション実行部は、前記位置情報に基づき特定される前記移動体の位置に基づき前記予測コストを算出する請求項３に記載の移動体制御装置。

【請求項5】

前記予想制御入力値は、時間的に異なる複数のタイミングの制御入力値の予測値を含む制御入力列であり、それぞれが異なる時間的変化を示す複数の前記制御入力列を含む請求項３に記載の移動体制御装置。

【請求項6】

前記コスト推定部は、リスクに敏感な振る舞いをさせるリスクセンシティブ評価関数に基づき前記経路コストを算出する前記確率変動シミュレーション処理部のそれぞれから得られた複数の前記予測コストを適用して前記制御入力列毎に前記経路コストを算出するリスクセンシティブコスト推定部を有する請求項５に記載の移動体制御装置。

【請求項7】

前記コスト推定部は、
リスクに敏感な振る舞いをさせるリスクセンシティブ評価関数をテイラー展開して得られる期待値項に前記確率変動シミュレーション処理部のそれぞれから得られた複数の前記予測コストを適用して前記制御入力列毎に期待値を算出する期待値推定部と、
前記リスクセンシティブ評価関数をテイラー展開して得られる分散項に前記確率変動シミュレーション処理部のそれぞれから得られた複数の前記予測コストを適用して前記制御入力列毎に分散値を算出する分散項推定部と、を有し、
前記期待値と前記分散値との加算結果を前記経路コストとして算出する請求項５に記載の移動体制御装置。

【請求項8】

第１の制御入力値に基づき移動体を制御するロボット制御ステップと、
次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出ステップと、を有し、
前記制御入力算出ステップにおいて、
前記第１の制御入力値のあとに前記ロボット制御ステップに与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって複数の経路コストを算出し、前記複数の経路コストのうち最も経路コストが小さくなる前記第２の制御入力値を算出する移動体制御方法。

【請求項9】

【請求項10】

現制御サイクルで移動体に与える第１の制御入力値のあとに前記移動体の制御に用いられると予想される第１の制御入力値の予測値である少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって複数の経路コストを算出し、前記複数の経路コストのうち最も経路コストが小さくなる第２の制御入力値を算出する制御入力算出処理と、
前記第２の制御入力値により設定される前記第１の制御入力値に基づき移動体を制御するロボット制御処理と、
を演算部の演算処理を用いて実行する移動体制御プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は移動体制御装置、移動体制御方法、移動体制御システム及び移動体制御プログラムが記録したコンピュータ読み取り可能な非一時的な記憶媒体に関し、特に、移動体の移動状態を指示する制御入力値を周期的に更新する移動体制御装置、移動体制御方法、移動体制御システム及び移動体制御プログラムが記録したコンピュータ読み取り可能な非一時的な記憶媒体に関する。

【背景技術】

【0002】

近年、障害物の状態が時々刻々に変化する場所において運用されるロボット等の移動体が提案されている。このような移動体では、予め最適な制御入力を決定することが出来ない問題がある。そこで、非特許文献１、２では、移動体が運用される場所の状態に応じて適用可能な制御技術が開示されている。

【0003】

非特許文献１では、周期的に繰り返される制御サイクル毎にシミュレーションを多数回実行し、各シミュレーションにおいて制御入力列を様々に変化させることでどういった入力すると最終的にコストが小さくなるかを探索する。そして、非特許文献１では、最終的にコストが最小となる制御入力列を構成する制御入力値の重み付き平均値を次制御サイクルの制御入力値とする。

【0004】

非特許文献２では、コスト関数として、コスト関数に数学的な処理を施してリスクに敏感な振る舞いをさせる（リスクセンシティブな）評価関数を用い、評価関数を最小化するためにどういった制御入力を与えればよいかを解析的に求める技術が開示されている。

【先行技術文献】

【非特許文献】

【0005】

【文献】仲谷真太朗, 伊達央「モンテカルロモデル予測制御法を用いた倒立振子振り上げ安定化における予測と分岐に関する考察」自動制御連合講演会講演論文集 Vol.61，pp. 423-427 (2018)

【文献】J. R. Medina and S. Hirche, “Considering Uncertainty in Optimal Robot Control Through High-Order Cost Statistics,” IEEE Transactions on Robotics, Vol. 34, No. 4, pp. 1068-1081 (2018).

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、非特許文献１に記載の技術では、実際と論理的な指示値との間に差が生じた場合（例えば、実際の移動体の速度と、制御入力値により指示した速度との間に差が生じた場合）に制御精度が維持できない問題がある。また、非特許文献２に記載の技術では搬送ロボットのような現実的な問題に適用するには数式が複雑になりすぎて解くことができないという問題がある。

【課題を解決するための手段】

【0007】

本発明にかかる移動体制御装置の一態様は、第１の制御入力値に基づき移動体を制御するロボット制御部と、次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出部と、を有し、前記制御入力算出部は、前記第１の制御入力値のあとに前記ロボット制御部に与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる前記第２の制御入力値を算出する。

【0008】

本発明にかかる移動体制御方法の一態様は、第１の制御入力値に基づき移動体を制御するロボット制御ステップと、次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出ステップと、を有し、前記制御入力算出ステップにおいて、前記第１の制御入力値のあとに前記ロボット制御ステップに与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる前記第２の制御入力値を算出する。

【0009】

本発明にかかる移動体制御システムの一態様は、第１の制御入力値に基づき移動体を制御するロボット制御部と、次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出部と、を有し、前記制御入力算出部は、前記第１の制御入力値のあとに前記ロボット制御部に与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる前記第２の制御入力値を算出する。

【0010】

本発明にかかる移動体制御プログラムが記録したコンピュータ読み取り可能な非一時的な記憶媒体の一態様は、現制御サイクルで移動体に与える第１の制御入力値のあとに前記移動体の制御に用いられると予想される第１の制御入力値の予測値である少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる第２の制御入力値を算出する制御入力算出処理と、前記第２の制御入力値により設定される前記第１の制御入力値に基づき移動体を制御するロボット制御処理と、を演算部の演算処理を用いて実行する。

【発明の効果】

【0011】

本発明にかかる移動体制御装置、移動体制御方法、移動体制御システム及び移動体制御プログラムが記録したコンピュータ読み取り可能な非一時的な記憶媒体によれば、実際と論理的な指示値との間に差によらず制御精度を高めることができる。

【図面の簡単な説明】

【0012】

【図1】実施の形態１にかかる制御入力装置の概略図である。

【図2】実施の形態１にかかる制御入力装置の動作を説明するフローチャートである。

【図3】実施の形態１にかかる制御入力装置を用いた移動体の移動経路のシミュレーション結果である。

【図4】実施の形態１にかかる制御入力装置を用いた移動体の速度変化のシミュレーション結果である。

【図5】実施の形態２にかかる制御入力算出部のブロック図である。

【図6】実施の形態２にかかる経路コスト算出部のブロック図である。

【図7】実施の形態２にかかる確率変動シミュレーション処理部のブロック図である。

【図8】実施の形態２にかかる制御入力算出部の動作を説明するフローチャートである。

【図9】実施の形態２にかかる制御入力算出部で用いられる制御入力列の一例を示す図である。

【図10】実施の形態２にかかる制御入力算出部で用いられる制御入力列の一例を示す図である。

【図11】実施の形態３にかかる経路コスト算出部のブロック図である。

【図12】その他の実施の形態にかかる移動体制御システムのブロック図である。

【図13】その他の実施の形態にかかる移動体制御システムで用いられるハードウェア資源のブロック図である。

【発明を実施するための形態】

【0013】

説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。また、様々な処理を行う機能ブロックとして図面に記載される各要素は、ハードウェア的には、ＣＰＵ（Central Processing Unit）、メモリ、その他の回路で構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。なお、各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。

【0014】

また、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

【0015】

実施の形態１
以下で説明する移動体制御装置は、ロボット等の移動体の速度、進行方向等を制御するが、以下の説明では、制御対象のパラメータを速度とした説明を行う。なお、制御対象のパラメータを変えることで移動体制御装置は、ロボットの進行方向、或いは、アームの移動等の他の制御を行うこともできる。

【0016】

図１に実施の形態１にかかる移動体制御装置１のブロック図を示す。図１に示すように、実施の形態１にかかる移動体制御装置１は、制御入力算出部１０、ロボット制御部１１を有する。なお、移動体制御装置１は、所定の周期で繰り返し行われる制御サイクル毎に以下で説明する処理を行うが、本開示の内容は繰り返し行われる制御サイクル毎に行われる形態に限られるものではない。

【0017】

ロボット制御部１１は、第１の制御入力値に基づき移動体を制御する。より具体的には、ロボット制御部１１は、周期的に繰り返される制御サイクル毎に与えられる第１の制御入力値（例えば、速度指示値）に加えて移動体の進行方向を指示する方向指示値を移動体に与えることで移動体を制御する。

【0018】

制御入力算出部１０は、次制御サイクルの第１の制御入力値となる第２の制御入力値を算出する。より具体的には、制御入力算出部１０は、第１の制御入力値のあとに前記ロボット制御部に与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、経路コストが小さくなる第２の制御入力値を算出する。本開示において、入力値が構成する列（制御入力列）には、その列を構成する要素として、入力値が少なくとも１つ存在する場合を含む。

【0019】

ここで、実施の形態１にかかる移動体制御装置１の動作を説明する。そこで、図２に実施の形態１にかかる制御入力装置の動作を説明するフローチャートを示す。実施の形態１にかかる移動体制御装置１では、周期的に制御サイクルを繰り返すことで移動体を制御するロボット制御部に与える第１の制御入力値を更新する。そして、実施の形態１にかかる移動体制御装置１では、動作開始時は、移動体に与える第１の制御入力値として予め設定した初期値を有する第１の制御入力値を移動体に与える。また、実施の形態１にかかる移動体制御装置１では、２回目以降の制御サイクルでは、制御入力算出部１０が算出した第１の制御入力値をロボット制御部１１に与える。つまり、移動体制御装置１では、まず、ロボット制御部１１は、第１の制御入力値に従って移動体を制御する（ステップＳ１）。

【0020】

続いて、実施の形態１にかかる移動体制御装置１では、制御入力算出部１０において次制御サイクルの第１の制御入力値となる第２の制御入力値を算出する。具体的には、制御入力算出部１０では、第１の制御入力値のあとに前記ロボット制御部に与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、経路コストが小さくなる第２の制御入力値を算出する。

【0021】

図２では、この制御入力算出部１０の動作における確率的ノイズを加味したシミュレーションの一例を含む動作を示した。図２に示す例では、制御入力算出部１０は、第１の制御入力値のあとにロボット制御部１１に与えられる予想制御入力値の列である制御入力列に対して疑似乱数パターンを適用したシミュレーションを用いて経路コストを算出する（ステップＳ２）。また、制御入力算出部１０では、ステップＳ２で算出された経路コストから経路コストが小さくなる第２の制御入力値を算出する（ステップＳ３）。そして、制御入力算出部１０では、ステップＳ３で算出された第２の制御入力値を次制御サイクルと第１の制御入力値とする（ステップＳ４）。

【0022】

続いて、実施の形態１にかかる移動体制御装置１を用いて速度を制御した移動体の移動軌跡及び速度軌跡の検証結果を説明する。なお、以下の説明では、距離１０ｍの空間において、４．５ｍ～５．５ｍの間に幅０．０４ｍ、距離１ｍの隙間を有する壁を設置し、移動体を壁に設けた隙間をとおって１０ｍ先の位置に移動させるものである。また、以下で説明するシミュレーションは、ロボットの大きさは無視し、移動体の重心が隙間を通れるかどうかだけを考慮したものである。さらに、以下で説明するシミュレーションは、移動体の移動する速度が大きくなるほど走行誤差が大きくなることを想定している。なお、以下で説明するシミュレーションでは、５回の試行を繰り返した。

【0023】

図３に実施の形態１にかかる制御入力装置を用いた移動体の移動経路のシミュレーション結果を示す。図３に示すように、実施の形態１にかかる移動体制御装置１を用いることで、５回の試行のいずれにおいても移動体を壁に設けた隙間を通って１０ｍの距離を進んでいることがわかる。また、図３に示すように、移動体は、壁に設けた隙間を通過するとき以外は、大きく経路がぶれていることがわかる。

【0024】

また、図４に実施の形態１にかかる制御入力装置を用いた移動体の速度変化のシミュレーション結果を示す。図４に示すように、実施の形態１にかかる移動体制御装置１を用いることで、移動体は、高い走行経路精度が必要な壁の隙間の通過動作の前に大きく速度を落としていることがわかる。これは、移動体が壁にぶつかる状態は経路コストが大きくなる状態であり、この経路コストを小さくするように制御入力算出部１０が第１の制御入力値を更新することで図４に示すような速度の抑制がなされる。

【0025】

上記説明より、実施の形態１にかかる移動体制御装置１では、第１の制御入力値の時間的に先の期間の予測値の列である制御入力列に対して疑似乱数パターンを適用したシミュレーション結果に基づき経路コストを算出する。これにより、実施の形態１にかかる移動体制御装置１では、実際の移動体が制御入力値通りに動かず、確率的な誤差が加わった移動しか出来ない状況であっても、高速性と安全性を両立する制御が可能である。

【0026】

実施の形態２
実施の形態２では、制御入力算出部１０の詳細な構成の一例について説明する。そこで、図５に実施の形態２にかかる制御入力算出部のブロック図を示す。図５に示すように、制御入力算出部１０は、位置情報取得部２１、経路コスト算出部２２、制御入力決定部２３を有する。

【0027】

なお、実施の形態２では、制御入力算出部１０が扱う予測制御入力値として、時間的に異なる複数のタイミングの制御入力値の予測値を含む制御入力列を扱う。また、実施の形態２では、予測制御入力値が、それぞれが異なる時間的変化を示す複数の制御入力列を含む例について説明する。これはより好適な例であり、制御入力算出部１０は、少なくとも１つの予測制御入力値があれば動作は可能である。

【0028】

位置情報取得部２１は、運用されている移動体の位置を示す位置情報を取得する。位置情報取得部２１は、例えば、カメラ、無線信号を用いたセンサ等の機器を用いて移動体の具体的な位置を特定する情報を取得する。

【0029】

制御入力決定部２３は、経路コストを小さくする第２の制御入力値を算出する。なお、制御入力算出部１０では、経路コスト算出部２２が予想制御入力値を生成して、予想制御入力値に対応する経路コストを算出する。より具体的には、経路コスト算出部２２が複数の経路コスト（例えば、Ｎ個であって、Ｎは後述する制御入力列の数を表す）を算出する。そして、制御入力決定部２３は、例えば、複数の経路コストが小さな制御入力列を下からＫ個（Ｋは整数）選択し、選択した制御入力列について路コストが小さな値から大きな重み付けをした平均値を算出し、平均化された制御入力列の先頭の制御入力値を算出する。制御入力決定部２３は、算出した制御入力値を第２の制御入力値として決定する。また、制御入力決定部２３は、決定した第２の制御入力値を次制御サイクルの第１の制御入力値としてロボット制御部１１に出力する。

【0030】

続いて、経路コスト算出部２２の詳細について説明する。図６に実施の形態２にかかる経路コスト算出部２２のブロック図を示す。図６に示すように、経路コスト算出部２２は、制御入力列生成部３１、確率変動シミュレーション処理部３２１～３２Ｎ（Ｎは確率変動シミュレーション処理部の個数を示す整数）、コスト推定部３３を有する。

【0031】

制御入力列生成部３１は、現制御サイクルの第１の制御入力値に基づき予想制御入力値を生成する。より具体的には、制御入力列生成部３１は、現制御サイクルの第１の制御入力値が属する制御入力列において、第１の制御入力列として採用された制御入力値の次のタイミングに設定された制御入力値を先頭とする制御入力列（以下ベース制御入力列と称す）を生成する。また、制御入力列生成部３１は、ベース制御入力列に対してばらつきを加味して速度変化がベース制御入力列とは異なる少なくとも１つの制御入力列を生成する。つまり、制御入力列生成部３１は、複数の制御入力列（例えば、Ｎ個の制御入力列）を含む予測制御入力値を生成する。

【0032】

確率変動シミュレーション処理部３２１～３２Ｎは、それぞれが予想制御入力値（例えば、複数の制御入力列の１つ）に対して疑似乱数パターンを適用した確率変動シミュレーションを異なる疑似乱数パターンを用いて複数回（例えば、Ｍ回）行う。そして、確率変動シミュレーション処理部３２１～３２Ｎは、それぞれ、移動体の走行状態を判断する指標となる予測コストを算出する。つまり、確率変動シミュレーション処理部３２１～３２Ｎは、それぞれＭ個の予測コストを算出する。ここで、確率変動シミュレーション処理部３２１～３２Ｎを考えると、制御入力算出部１０では、Ｎ×Ｍ個の予測コストが算出される。ここで、本開示において、予測コストは、例えば、移動体の走行状態の良否判断の指標となるものである。より具体的には、予測コストは、移動体が目標経路から外れて走行したときや、所定の速度を下回って走行したときのコストとも捉えることができる。

【0033】

コスト推定部３３は、実施の形態２では、リスクセンシティブコスト推定部３４を有する。このリスクセンシティブコスト推定部３４では、（１）式を用いて経路コストＪを算出する。なお、（１）式は、リスクセンシティブ評価関数とも称す。

【数1】

（１）式において、βは予め移動体制御装置１において決定されているパラメータである。Ｅは、期待値である。Ｓは確率変動シミュレーション処理部で生成されるコストである。リスクセンシティブコスト推定部３４では、複数の制御入力列について制御入力列毎に経路コストＪを算出する。

【0034】

続いて、確率変動シミュレーション処理部３２１～３２Ｎについて詳細に説明する。確率変動シミュレーション処理部３２１～３２Ｎは、処理対象とする制御入力列が異なるのみであり、構成としては同一であるため、ここでは確率変動シミュレーション処理部３２１を説明する。

【0035】

図７に実施の形態２にかかる確率変動シミュレーション処理部のブロック図を示す。図７に示すように、確率変動シミュレーション処理部３２１は、制御入力選択部４１、シミュレーション実行部４２１～４２Ｍ（Ｍは、シミュレーション実行部の個数或いは適用する疑似乱数パターンの数を表す整数）、コスト算出部４３１～４３Ｍを有する。

【0036】

制御入力選択部４１は、制御入力列生成部３１が生成した複数の制御入力列の１つを選択する。なお、制御入力算出部１０では、制御入力選択部４１が選択する制御入力列は予め決定されており、確率変動シミュレーション処理部３２１～３２Ｎがそれぞれ複数の制御入力列のいずれか１つに対応する。

【0037】

シミュレーション実行部４２１～４２Ｍは、それぞれが、制御入力選択部４１が選択した制御入力列について、複数の疑似乱数パターン（例えば、Ｍ個の疑似乱数パターン）に含まれる疑似乱数パターンの１つを適用して移動体に与える制御入力値（例えば、移動体の速度）の変化軌跡をシミュレーションする。このシミュレーションは、例えば、確率微分方程式の数値解法を用いる。また、シミュレーション実行部４２１～４２Ｍでは、移動体の経路シミュレーションを行う上で位置情報取得部２１が出力する位置情報を用いる。位置情報を利用せずにシミュレーション上で認識される論理的な位置情報を用いることもできるが、位置情報取得部２１を用いて取得した実際の位置情報を用いた方がシミュレーション精度を向上させることができる。

【0038】

コスト算出部４３１～４３Ｍは、複数のシミュレーション実行部のうち対応するシミュレーション実行部で算出されたシミュレーション結果について予測コストを算出する。コスト算出部４３１～４３Ｍが生成したＭ個の予測コストは、リスクセンシティブコスト推定部３４に与えられる。そして、リスクセンシティブコスト推定部３４は、Ｍ個の予測コスト（（１）式のコストＳ）を用いて経路コストＪを算出する。

【0039】

続いて、制御入力算出部１０の動作について説明する。そこで、図８に実施の形態２にかかる制御入力算出部１０の動作を説明するフローチャートを示す。図８に示すように、制御入力算出部１０は、制御入力値の算出を開始すると、まず、制御入力列生成部３１を用いて現制御サイクルの第１の制御入力値が属した制御入力列からＮ個の制御入力列を算出する（ステップＳ１１）。なお、動作開始時のステップＳ１１では、それ以前に決定された制御入力列がないため、最大加速度と最大速度を満たすようなＮ個の制御入力列をランダムに決定する。

【0040】

そして、制御入力算出部１０は、確率変動シミュレーション処理部３２１～３２Ｎのそれぞれを用いてＮ個の制御入力列のそれぞれにＭ個の疑似乱数パターンを適用したＮ個×Ｍ個のシミュレーションを行う（ステップＳ１２）。続いて、制御入力算出部１０は、確率変動シミュレーション処理部３２１～３２Ｎのそれぞれから出力されるＭ個の予測コストＳを用いてＮ個の制御入力列の経路コストＪを算出する（ステップＳ１３）。つまり、ステップＳ１３ではＮ個の経路コストＪが算出される。その後、制御入力算出部１０は、制御入力決定部２３を用いて、経路コストＪが小さなものからＫ個の制御入力列を選択し、Ｋ個の制御入力列の重み付き平均値である平均制御入力列を生成し、平均制御入力列の先頭の制御入力値を第２の制御入力値として特定する（ステップＳ１４）。そして、制御入力算出部１０は、ステップＳ１４で特定した第２の制御入力値を次の制御サイクルの第１の制御入力値として出力する（ステップＳ１５）。

【0041】

上記処理について、別の観点から説明する。そこで、図９及び図１０に実施の形態２にかかる制御入力算出部１０で用いられる制御入力列の一例を示す図を示す。図９は、制御入力列から第２の制御入力値を決定する場合を説明するものであり、図１０は、次の制御サイクルで用いる制御入力列の生成する場合を説明するものである。図９に示す例では、制御入力列の数Ｎを５、シミュレーションに適用する疑似乱数パターンの数Ｍを３、第２の制御入力値の決定に用いる制御入力列の数Ｋを３としたものである。

【0042】

図９に示す例では、現制御サイクルＴ１の第１の制御入力値が属する制御入力列（例えば、経路コストＪが後の計算で４となる制御入力列）をベース制御入力列とし、このベース制御入力列に４つの制御入力列が与えられている。この制御入力列は、現制御サイクルＴ１以降の制御サイクルＴｐ１～Ｔｐ６の予測期間の移動体に与える制御入力値の変化（或いは移動体の速度変化）を予想した予想制御入力値を時系列に並べたものである。

【0043】

制御入力算出部１０では、Ｎ本の制御入力列のそれぞれに対してＭ個の疑似乱数パターンを与えたシミュレーションを行い、Ｎ個の経路コストＪを算出する。図９に示す例では、経路コストＪは、１、３、４、６、７である。なお、図９では経路コストJを整数としたが、小数点以下の数値を含むものであっても構わない。そして、制御入力算出部１０は、経路コストＪが小さな順から３つの制御入力列の重み付き平均値から生成される平均制御入力列の先頭の制御入力値を第２の制御入力値として決定する。

【0044】

また、図１０を参照し、タイミングＴ２の次の制御サイクルの第１の制御入力値の算出に用いる制御入力列について説明する。図１０に示すように、制御入力列生成部３１では、図９で示した平均制御入力列の先頭の制御入力値を削除し、末尾からさらに１制御サイクル後の予測制御入力値を追加した新たなベース制御入力列を生成する。図１０に示す例では、ベース制御入力列の末尾の予測制御入力値は末尾から１つ前の予測制御入力値と同じ値を用いた。そして、制御入力列生成部３１は、図１０の上手に示したベース制御入力列に対して異なる速度変化を示す４つの制御入力列を生成する。

【0045】

上記説明より、実施の形態１にかかる制御入力算出部１０では、複雑な数式処理を用いることなく、リスクセンシティブ評価関数を最小化する制御入力値を算出することができる。これにより、実施の形態１にかかる制御入力算出部１０を用いた移動体制御装置１では、実際の移動体が制御入力値通りに動かず、確率的な誤差が加わった移動しか出来ない状況であっても、高速性と安全性を両立する制御が可能である。

【0046】

実施の形態３
実施の形態３では、経路コスト算出部２２の別の形態となる経路コスト算出部２２ａについて説明する。なお、実施の形態３の説明では、実施の形態２で説明した構成要素と同じ構成要素については、実施の形態２と同じ符号を付して説明を省略する。

【0047】

図１１に実施の形態３にかかる経路コスト算出部２２ａのブロック図を示す。図１１に示すように、経路コスト算出部２２ａは、経路コスト算出部２２のコスト推定部３３をコスト推定部３３ａに置き換えたものである。コスト推定部３３ａは、期待値推定部３５、分散項推定部３６を有する。

【0048】

実施の形態２では、リスクセンシティブコスト推定部３４において（１）式で示した評価関数を経路コストJの計算に用いた。しかし、（１）式により経路コストJを算出した場合、確率的変動がある程度以上大きい場合には発散してしまい、制御入力値が安定しないことがある。そこで、実施の形態３では、経路コストＪの計算に（１）式をテイラー展開して３次項以降の項を無視することで予測コストＳのばらつきの影響を経路コストに反映させつつ、発散の可能性を低減する。（１）式の１次項及び２次項は、（２）式によって算出される。

【数2】

ここで、（２）式において、第１項が期待値項であり、第２項が分散項である。

【0049】

期待値推定部３５は、リスクセンシティブ評価関数をテイラー展開して得られる期待値項に確率変動シミュレーション処理部３２１～３２Ｎのそれぞれから得られた複数の予測コストを適用して制御入力列毎に期待値を算出する。つまり、期待値推定部３５は、（２）式の第１項の値を算出する。

【0050】

分散項推定部３６は、リスクセンシティブ評価関数をテイラー展開して得られる分散項に確率変動シミュレーション処理部のそれぞれから得られた複数の予測コストを適用して制御入力列毎に分散値を算出する。つまり、分散項推定部３６は、（２）式の第２項の値を算出する。

【0051】

そして、コスト推定部３３ａは、期待値推定部３５で算出された期待値と分散項推定部３６で算出された分散値との加算結果を経路コストとして算出する。

【0052】

上記説明より、実施の形態３にかかるコスト推定部３３ａを用いることで経路コストＪの算出における発散を効果的に抑制することができる。

【0053】

その他の実施の形態
その他の実施の形態では、移動体制御装置１を含む移動体制御システムの全体の構成及び移動体制御装置１を実現するハードウェア資源について説明する。まず、図１２にその他の実施の形態にかかる移動体制御システムのブロック図を示す。なお、図１２に示した移動体制御システムは、システムの模式的なブロック図である。

【0054】

図１２に示す移動体制御システムは、遠隔制御装置１０１、ネットワーク１０２、撮像装置１０３、移動体１０４を有する。遠隔制御装置１０１は、移動体制御部２０１、通信部２０２を有する。移動体制御部２０１は、上記で説明した移動体制御装置１が備えられる。また、通信部２０２は、移動体制御部２０１が移動体１０４及び撮像装置１０３と通信するためのインタフェースである。

【0055】

ネットワーク１０２は、遠隔制御装置１０１、撮像装置１０３、移動体１０４の間で相互に通信を行うための構成である。撮像装置１０３は、例えば、カメラであり遠隔制御装置１０１内の位置情報取得部２１により利用されるものである。

【0056】

移動体１０４は、制御対象となるものである。移動体１０４は、通信部３０１、駆動制御部３０２、駆動部３０３を有する。通信部３０１は、移動体１０４が遠隔制御装置１０１と通信するためのインタフェースである。駆動制御部３０２は、遠隔制御装置１０１から与えられる第１の制御入力値に基づき駆動部３０３に動作指示を与える。駆動部３０３は、駆動輪を駆動するモータ等の構成である。

【0057】

続いて、遠隔制御装置１０１を構成するハードウェア資源を図１３を参照して説明する。図１３に示すのはハードウェア資源の一例であり、入力インタフェース等の他の構成が含まれていても良い。つまり、図１３に示すハードウェア資源４００は、図１３に示した構成を限定する趣旨ではない。

【0058】

ハードウェア資源４００は、情報処理装置、コンピュータにより構成することができる。図１３に示す例では、ハードウェア資源４００は、内部バス４０４により相互に接続される、演算部４０１、メモリ４０２、ネットワークインタフェース４０３等を備える。

【0059】

ハードウェア資源４００は、図示しないハードウェア（例えば、入出力インタフェース）を含んでもよい。あるいは、装置に含まれる演算部４０１等のユニットの数も図１３の例示に限定する趣旨ではなく、例えば、複数の演算部４０１が装置に含まれていてもよい。演算部４０１には、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processor Unit）等を用いることができる。

【0060】

メモリ４０２には、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）等を用いることができる。

【0061】

ネットワークインタフェース４０３には、例えば、ＬＡＮ（Local Area Network）カード、ネットワークアダプタ、ネットワークインタフェースカード等を用いることができる。

【0062】

なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、図１で示した制御入力算出部１０及びロボット制御部１１は、１つの装置として設けられていてもよく、複数の装置により１つのシステムを構成してもよい。また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

【0063】

（付記１）
第１の制御入力値に基づき移動体を制御するロボット制御部と、
次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出部と、を有し、
前記制御入力算出部は、
前記第１の制御入力値のあとに前記ロボット制御部に与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる前記第２の制御入力値を算出する移動体制御装置。

【0064】

（付記２）
前記制御入力算出部は、
前記予想制御入力値を生成して、前記予想制御入力値に対応する前記経路コストを算出する経路コスト算出部と、
前記経路コストを小さくする前記第２の制御入力値を算出する制御入力決定部と、
を有する付記１に記載の移動体制御装置。

【0065】

（付記３）
前記経路コスト算出部は、
現制御サイクルの前記第１の制御入力値に基づき前記予想制御入力値を生成する制御入力列生成部と、
前記予想制御入力値に対して疑似乱数パターンを適用した確率変動シミュレーションを異なる疑似乱数パターンを用いて複数回行い、複数の前記確率変動シミュレーションのそれぞれにおいて前記移動体の走行状態を判断する指標となる予測コストを算出する確率変動シミュレーション処理部と、
複数の前記確率変動シミュレーションにおいて生成された複数の前記予測コストを用いて前記経路コストを算出するコスト推定部と、
を有する付記２に記載の移動体制御装置。

【0066】

（付記４）
前記確率変動シミュレーション処理部は、
それぞれが複数の前記確率変動シミュレーションのいずれか１つを実行する複数のシミュレーション実行部と、
前記複数のシミュレーション実行部のうち対応する前記シミュレーション実行部で算出されたシミュレーション結果について前記予測コストを算出する複数のコスト計算部と、
を有する付記３に記載の移動体制御装置。

【0067】

（付記５）
前記制御入力算出部は、
前記移動体の位置情報を取得する位置情報取得部を有し、
前記複数のシミュレーション実行部は、前記位置情報に基づき特定される前記移動体の位置に基づき前記予測コストを算出する付記４に記載の移動体制御装置。

【0068】

（付記６）
前記予想制御入力値は、時間的に異なる複数のタイミングの制御入力値の予測値を含む制御入力列である付記１乃至５のいずれか１項に記載の移動体制御装置。

【0069】

（付記７）
前記予測制御入力値は、それぞれが異なる時間的変化を示す複数の前記制御入力列を含む付記６に記載の移動体制御装置。

【0070】

（付記８）
前記コスト推定部は、リスクに敏感な振る舞いをさせるリスクセンシティブ評価関数に基づき前記経路コストを算出する前記確率変動シミュレーション処理部のそれぞれから得られた複数の前記予測コストを適用して前記制御入力列毎に前記経路コストを算出するリスクセンシティブコスト推定部を有する付記３に記載の移動体制御装置。

【0071】

（付記９）
前記コスト推定部は、
リスクに敏感な振る舞いをさせるリスクセンシティブ評価関数をテイラー展開して得られる期待値項に前記確率変動シミュレーション処理部のそれぞれから得られた複数の前記予測コストを適用して前記制御入力列毎に期待値を算出する期待値推定部と、
前記リスクセンシティブ評価関数をテイラー展開して得られる分散項に前記確率変動シミュレーション処理部のそれぞれから得られた複数の前記予測コストを適用して前記制御入力列毎に分散値を算出する分散項推定部と、を有し、
前記期待値と前記分散値との加算結果を前記経路コストとして算出する付記３に記載の移動体制御装置。

【0072】

（付記１０）
第１の制御入力値に基づき移動体を制御するロボット制御ステップと、
次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出ステップと、を有し、
前記制御入力算出ステップにおいて、
前記第１の制御入力値のあとに前記ロボット制御ステップに与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる前記第２の制御入力値を算出する移動体制御方法。

【0073】

（付記１１）
第１の制御入力値に基づき移動体を制御するロボット制御部と、
次制御サイクルの前記第１の制御入力値となる第２の制御入力値を算出する制御入力算出部と、を有し、
前記制御入力算出部は、
前記第１の制御入力値のあとに前記ロボット制御部に与えられると予想される少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる前記第２の制御入力値を算出する移動体制御システム。

【0074】

（付記１２）
現制御サイクルで移動体に与える第１の制御入力値のあとに前記移動体の制御に用いられると予想される第１の制御入力値の予測値である少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる第２の制御入力値を算出する制御入力算出処理と、
前記第２の制御入力値により設定される前記第１の制御入力値に基づき移動体を制御するロボット制御処理と、
を演算部の演算処理を用いて実行する移動体制御プログラムを記録したコンピュータ読み取り可能な非一時的な記憶媒体。

【0075】

（付記１３）
現制御サイクルで移動体に与える第１の制御入力値のあとに前記移動体の制御に用いられると予想される第１の制御入力値の予測値である少なくとも１つの予想制御入力値に対して、確率的ノイズを加味したシミュレーションによって経路コストを算出し、前記経路コストが小さくなる第２の制御入力値を算出する制御入力算出処理と、
前記第２の制御入力値により設定される前記第１の制御入力値に基づき移動体を制御するロボット制御処理と、
を演算部の演算処理を用いて実行する移動体制御プログラム。

【符号の説明】

【0076】

１移動体制御装置
１０制御入力算出部
１１ロボット制御部
２１位置情報取得部
２２経路コスト算出部
２３制御入力決定部
３１制御入力列生成部
３２１確率変動シミュレーション処理部
３３コスト推定部
３４リスクセンシティブコスト推定部
３５期待値推定部
３６分散項推定部
４１制御入力選択部
４２１シミュレーション実行部
４３１コスト算出部
１０１遠隔制御装置
１０２ネットワーク
１０３撮像装置
１０４移動体
２０１移動体制御部
２０２通信部
３０１通信部
３０２駆動制御部
３０３駆動部
４００ハードウェア資源
４０１演算部
４０２メモリ
４０３ネットワークインタフェース
４０４内部バス

【図1】