IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧 ▶ 国立大学法人京都大学の特許一覧

特開2023-120649経路計画装置、その適用設備、並びに経路計画方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023120649
(43)【公開日】2023-08-30
(54)【発明の名称】経路計画装置、その適用設備、並びに経路計画方法
(51)【国際特許分類】
   G05D 1/02 20200101AFI20230823BHJP
   G08G 1/00 20060101ALI20230823BHJP
   G08G 1/005 20060101ALI20230823BHJP
   G08G 1/09 20060101ALI20230823BHJP
   G08G 1/14 20060101ALI20230823BHJP
   G01C 21/26 20060101ALI20230823BHJP
【FI】
G05D1/02 P
G08G1/00 X
G08G1/005
G08G1/09 V
G08G1/14 A
G01C21/26 P
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022023612
(22)【出願日】2022-02-18
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(71)【出願人】
【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール弁理士法人
(72)【発明者】
【氏名】石原 新士
(72)【発明者】
【氏名】成川 理優
(72)【発明者】
【氏名】金井 政樹
(72)【発明者】
【氏名】永崎 佑里
(72)【発明者】
【氏名】大塚 敏之
【テーマコード(参考)】
2F129
5H181
5H301
【Fターム(参考)】
2F129AA02
2F129AA03
2F129BB02
2F129BB07
2F129FF20
2F129FF32
5H181AA01
5H181AA21
5H181AA27
5H181BB04
5H181CC03
5H181CC04
5H181CC12
5H181KK10
5H301AA10
5H301BB07
5H301BB14
5H301CC03
5H301CC06
5H301DD01
5H301DD06
5H301DD07
5H301DD15
5H301GG08
5H301KK03
5H301KK04
5H301KK08
5H301KK10
(57)【要約】      (修正有)
【課題】複数のエージェントに対して、価値を最大化する経路計画を、事前に精緻な地図情報を作ることなく、かつ、デッドロックを生じずに生成するシステムを提供する。
【解決手段】複数のエージェントの移動先を決定する業務管理部と、地図情報管理部と、エージェント情報管理部と、地図情報管理部とエージェント情報管理部の情報に基づいて、各エージェントを業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、評価を行う評価部と、各エージェントについて、を備え、経路計画計算部は、各時刻において、主目的達成評価部、主目的達成補助部、およびエージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、さらに、経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数のエージェントの移動先を決定する業務管理部と、
前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
前記エージェントの個体情報を管理するエージェント情報管理部と、
前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
前記経路計画計算部は、各時刻において、前記主目的達成評価部、前記主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
さらに、前記経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
【請求項2】
請求項1に記載の経路計画装置であって、
前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行うことを特徴とする経路計画装置。
【請求項3】
請求項1に記載の経路計画装置であって、
前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行い、かつ、または、各エージェントが地図情報管理部で設定された所定の位置に近づくほど低い評価を行うことを特徴とする経路計画装置。
【請求項4】
請求項1に記載の経路計画装置であって、
前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行い、かつ、または、各エージェントが地図情報管理部で設定された所定の位置に近づくほど低い評価を行い、さらに、各エージェントの位置とそれぞれの目標値との偏差が所定時間の間に減少しない場合に低い評価を行うことを特徴とする経路計画装置。
【請求項5】
複数、かつ、形状の異なるエージェントの移動先を決定する業務管理部と、
前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
前記エージェントの個体情報を管理するエージェント情報管理部と、
前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントの形態に応じて設定された所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
前記経路計画計算部は、各時刻において、前記主目的達成評価部、主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
さらに、前記経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
【請求項6】
人を含む異種、かつ、複数のエージェントの移動先を決定する業務管理部と、
前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
前記エージェントの個体情報を管理するエージェント情報管理部と、
前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントの形態に応じて設定された所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
前記経路計画計算部は、各時刻において、前記主目的達成評価部、主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
さらに、前記経路計画計算部で算出した経路計画を、自律体には制御指令値として、人には推奨経路として伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
【請求項7】
複数のエージェントの移動先と、前記エージェントが存在するエリアの地図情報と、前記エージェントの個体情報に基づいて、各エージェントを移動先に移動させるための経路計画を生成し、
前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う第1の評価と、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う第2の評価と、前記各エージェントについて、エージェント間の距離が、各エージェントに応じて設定される所定の値に近づくほど低い評価を行う第3の評価を求め、
各時刻において、前記第1の評価、前記第2の評価、および前記第3の評価による総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、全エージェントに伝達することを計算機により実現することを特徴とする経路計画方法。
【請求項8】
請求項1に記載の経路計画装置が適用され、ビーコン及び、あるいは監視カメラにより前記エージェントの情報が入手されて、行動計画が前記エージェントに伝達される物流現場。
【請求項9】
請求項1に記載の経路計画装置が適用され、監視カメラにより前記エージェントの情報が入手されて、行動計画がデジタルサイネージに伝達される駐車場。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多種、複数のエージェントが存在するエリアにおける経路計画装置、その適用設備、並びに経路計画方法に関する。
【背景技術】
【0002】
物流倉庫の物品搬送や工場の工程間搬送の人手不足を解消するために、移動ロボット(AGV:utomated uided ehicle、AMR:utonomous obile obotなど)の導入が進んでいる。
【0003】
このような移動ロボットを導入するには、倉庫や工場内にロボットが移動可能な通路を設定(ノードとエッジからなるグラフなどの作成)が必要になる。この設定が細かいほど、ロボットが選択可能な通路の自由度は高くなるため、より効率的な搬送が可能になるが、その反面、設定作業に多くの工数が必要になる。さらに、前記の通路の設定作業は、倉庫や工場のレイアウトが変更するたびに必要になるため、詳細な通路を設定する作業は、倉庫や工場を管理する事業者に大きな負担(エンジニアリングコスト)を求めることになる。
【0004】
このような課題に対して、特許文献1には、詳細な通路を設計することなく、複数のロボット(特許文献中ではビークル)が移動する経路を算出する方法が提示されている。
【0005】
より具体的には、各ロボットが障害物(建物内の柱や壁、自身以外のロボットなど)に接触せず、各ロボットの現在位置と各ロボットの目標位置をできるだけ小さくするようにモデル予測制御の考えに従って、各ロボットに対する制御入力(速度、角速度)を算出する。そして算出された制御入力を積分することで移動経路(位置、姿勢)を算出する。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2021-77090号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1によれば、事前に倉庫や工場内に詳細な通路情報を設計せずに、ロボットが目標値にたどり着く経路を算出することができる。
【0008】
然しながら、特許文献1はモデル予測制御の考え方に従っているため、モデル予測制御自体が抱える課題をそのまま受け継いでしまう。モデル予測制御は特定の評価関数を最小化するように制御入力を算出する手法であるが、評価関数の最小化(もしくは最大化)には、例えば勾配法など数値最適化手法を利用するため、算出される最適解が大域的最適(グローバル最適)にならず、局所最適(ローカル最適)になる可能性が高い。
【0009】
このように、特許文献1の手法によれば、局所最適の状態に陥り、ロボットが動作できなくなる状態(スタック、デッドロック)が非常に多く存在する恐れがある。
【0010】
本発明は以上の課題を解決するためになされたものであり、事前に詳細な通路情報を設定することなく、かつ、デッドロックを生じない経路計画装置、その適用設備、並びに経路計画方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
以上のことから本発明においては、「複数のエージェントの移動先を決定する業務管理部と、エージェントが存在するエリアの地図情報を管理する地図情報管理部と、エージェントの個体情報を管理するエージェント情報管理部と、地図情報管理部とエージェント情報管理部の情報に基づいて、各エージェントを業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、各エージェントについて、エージェント間の距離が、エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、経路計画計算部は、各時刻において、主目的達成評価部、主目的達成補助部、およびエージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、さらに、経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。」とする。
【0012】
また本発明においては、「複数のエージェントの移動先と、エージェントが存在するエリアの地図情報と、エージェントの個体情報に基づいて、各エージェントを移動先に移動させるための経路計画を生成し、各エージェントについて、位置が目標位置に近づくほど高い評価を行う第1の評価と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う第2の評価と、各エージェントについて、エージェント間の距離が、各エージェントに応じて設定される所定の値に近づくほど低い評価を行う第3の評価を求め、各時刻において、第1の評価、第2の評価、および第3の評価による総合結果が、以前の評価値よりも向上するように経路計画を生成し、全エージェントに伝達することを計算機により実現することを特徴とする経路計画方法。」とする。
【0013】
また本発明においては、「経路計画装置が適用され、ビーコン及び、あるいは監視カメラによりエージェントの情報が入手されて、行動計画が前記エージェントに伝達される物流現場。」とする。
【0014】
また本発明においては、「経路計画装置が適用され、監視カメラによりエージェントの情報が入手されて、行動計画がデジタルサイネージに伝達される駐車場。」とする。
【発明の効果】
【0015】
本発明によれば、事前に精緻な地図情報を用意せずに、各エージェントが安全性や動作制約を考慮したうえで、デッドロックを生じない移動経路を生成できる。
【0016】
よって本発明の実施例によれば、エージェントの経路計画のエンジニアリングコストを大幅に抑制できる。また、個々のエージェントに対して移動計画をそれぞれ実行するのではなく、全エージェントの移動経路を同時に生成するため、全体最適化を実現できる。
【図面の簡単な説明】
【0017】
図1】本発明の実施例1に係る経路計画システムの全体構成例を示す機能ブロック図。
図2】本発明の実施例1に係る経路計画装置1の機能例を示すブロック図。
図3a】エージェントの座標を示す図。
図3b】エージェントの座標を示す図。
図4】エージェント間距離に関する評価関数の一例を示す図。
図5a】従来における評価関数の特性例を示す図。
図5b】エリア平面の位置例を示す図。
図5c】評価関数が大域最適以外の局所最適を持つ特性の場合を示す図。
図5d】円周上が局所最適解になる事例を示す図。
図6a】2台のロボットが相手ロボットの後側の目標地点qに移動する状況を示す図。
図6b】互いの偏差が一定になる円弧上に固定される動作を示す図。
図7a】(12)式の評価関数の特性例を示す図。
図7b】γiの与え方の一例を示す図。
図8】(13)式の評価関数の特性例を示す図。
図9a】2次元平面におけるエージェント位置、走行軌道と目標地点rを示す図。
図9b】2次元平面におけるエージェント位置と目標地点の偏差の時間変化を示す図。
図10】本発明の実施例2に係る制御システムの全体的な処理手順を示す図。
図11】処理機能FC6に示した主目的達成補助評価部42の詳細なフローを示す図。
図12】経路計画装置1の更新タイミングの一例を示す図。
図13a】スタック状態を初期状態として示した図。
図13b】速度低下時の状態を示す図。
図13c】総合評価の形状を示す図。
図13d】局所最適からの移動を示す図。
図13e】大域最適解の探索を示す図。
図14a図6bのときの主目的達成評価部43の評価を示す図。
図14b】局所解を持たない形状の評価関数を示す図。
図14c】スタック回避の状況を示す図。
図15a】スタックが発生する偏差eb1にエージェントが接近した状態を示す図。
図15b】ペナルティが増加したときの総合評価値の形状を示す図。
図15c】スタック回避の状況を示す図。
図16】作業員と自動化機械が混在する倉庫の例を示す図。
図17a】予測ステップk=5までに生成されるエージェントの経路の例を示す図。
図17b】自動化機械が衝突防止方向に経路変更されたことを示す図。
図17c】自動化機械が衝突防止のために停止することを示す図。
図18a】2台の自動化機械が互いの後方に目標位置を与えられた状況示す図。
図18b】2台の自動化機械が停止してしまう状況を示す図。
図18c】交差する通路を活用して接触を回避する経路が生成された状況示す図。
図19】非自動化車両と自動化車両が混在する駐車場を示す図。
図20a】駐車場に従来技術を適用したときに発生し得る経路計画の例を示す図。
図20b】本発明を適用した場合に生成される経路計画の例を示す図。
【発明を実施するための形態】
【0018】
以下、本発明の実施例について、図面を参照して説明する。
【0019】
なお以下においては、実施例1で経路計画システムの全体構成例を、実施例2で経路計画の処理フローを、実施例3でスタック状態から脱出できる仕組みを、実施例4で物流現場への適用事例を、実施例5で駐車場への適用事例を説明する。
【実施例0020】
図1は、本発明の実施例1に係る経路計画システムの全体構成例を示す機能ブロック図である。図1において、経路計画システム10は、経路計画装置1が、監視装置2及びエージェント3からの位置情報S1、S2を得て、エージェント3に行動計画情報S3を与えるものである。ここでは、説明を簡略化するために、エージェント3(ロボット、車両、人など移動するすべての対象を含む)が1台(1人)しかいない場合を示すが、エージェントの数が増えたとしても基本的な構成は変わらない。
【0021】
このうちエージェント3は、通信部31、自己位置取得部32、他者位置取得部33、経路追従部34を備える。なお、すべてのエージェントは、これらの機能を備えている。ただしエージェント3が人である場合には、人の位置が何らかの手段(例えば監視装置2)により把握され、人に対して行動計画を伝達できることが満たされていればよい。
【0022】
つまり、エージェント3が移動ロボットであり、かつ、移動ロボットがLiDAR(Light etection nd anging)などの環境情報を取得するセンサを備えており、さらに、これらのセンサ情報を利用したSLAM(imultaneous ocalization nd apping)によって自己位置を算出する場合、点群情報として他のエージェント3の位置情報を取得することもできる。このような場合は、自己位置取得部32と他者位置取得部33を同時に実行することができる。
【0023】
一方、エージェント3が作業員の場合、エージェント自身は特定の機能を備えることはできない。ただし、作業員がWifiやBluetoohなどの無線通信機能を有するタブレットを保有していれば、通信部31、自己位置取得部32の機能を代替できる。また、作業員がタブレットに示された移動指示に従えば、経路追従部34の機能が代替されていると言える。ただし、タブレットには他のエージェント3の位置情報を取得する機能がないため、作業員は他者位置取得部33を有さないエージェント3として扱われる。
【0024】
エージェント3が移動ロボットの場合、経路計画装置1内の行動計画伝達部15から配信された行動計画(経路計画)についての指令値S3を通信部31で受信し、受信した経路計画に従うように経路追従部34で各アクチュエータ(モータなど)を制御する。また、LiDAR-SLAMによって取得した位置情報(自己位置や他者位置)S2を通信部31から経路計画装置1内のエージェント情報管理部13へと送信する。なお、LiDAR-SLAMを利用する場合、管理エリアの地図情報も取得できるため、倉庫のレイアウト変更など地図情報に変更があった場合、この情報を地図情報管理部12へ送信してもよい。
【0025】
なお、エリア内のエージェント3の位置情報S1は、エリア内に備えられた監視装置2内のエージェント位置取得部22(監視カメラやビーコンなど)で取得し、監視装置2に備えられた通信部21を介して、経路計画装置1内のエージェント情報管理部13に渡してもよい。
【0026】
図2は、本発明の実施例1に係る経路計画装置1の機能例を示すブロック図である。図2において、経路計画装置1は、管理対象エリア(例えば、倉庫や駐車場)内のすべてのエージェント3(ロボット、車両、人など移動するすべての対象を含む)の位置やIDなどを管理するエージェント情報管理部13から得られるエージェント情報S6、管理対象エリアにおけるエージェントの業務内容(移動先)を管理する業務管理部11から得られる業務情報S4、管理対象エリアの地図情報を管理する地図情報管理部12から得られる地図情報S5を入力情報として、各エージェント3に対する移動経路を経路計画部14で算出する。経路計画部14で算出した経路計画S3は行動計画伝達部15により、管理対象エリアにいるエージェント3に送信される。
【0027】
なおエージェント情報管理部13、業務管理部11、地図情報管理部12から得られる情報S6、S4、S5によれば、各エージェント3が、現時点で管理対象エリア内のどの位置に存在していて、どこの場所に行って、何をするのかが過去及び将来における行動として、時系列的に把握されていることになる。
【0028】
経路計画部14は、主目的達成評価部43、エージェント間距離評価部41、主目的達成補助部42、経路計画計算部44から構成されて、経路計画計算部44の出力を行動計画情報S3とする。
【0029】
なお図2における経路計画部14の構成に関して、主目的達成評価部43、エージェント間距離評価部41、経路計画計算部44は、従来から備えられている機能であるが、本発明ではこれに対して主目的達成補助部42の機能を追加したものということができる。基本的には、従来構成である主目的達成評価部43とエージェント間距離評価部41と経路計画計算部44の機能により経路計画が可能であるが、この経路計画によりロボットが動作できなくなる状態(固着状態:スタック、デッドロック)に陥った場合に、主目的達成補助部42の機能により固着状態から脱出するものである。
【0030】
まず、従来部分の機能について説明する。主目的達成評価部43は、管理対象エリアにおけるエージェントの業務内容(移動先)を管理する業務管理部11から得られる業務情報S4と、管理対象エリアの地図情報を管理する地図情報管理部12から得られる地図情報S5を入力情報としている。これらの情報により、主目的達成評価部43では、各エージェント3が達成すべき業務、つまり、特定位置(目標地点)への移動を達成するために利用される評価値の算出を行う。
【0031】
主目的達成評価部43の処理の考え方について図3aと図3bを用いて説明する。これらの図は、X-Y座標で示される管理対象エリア内におけるエージェント3の現在位置を表している。
【0032】
i番目のエージェント3が移動ロボットであるときに、図3aのように自身の位置(x,y)及び姿勢θから構成される位置ベクトルをpで定義すると、目標位置r=(rx,ry,rθ)への移動は自身の位置ベクトルpと目標位置rの偏差eを、例えば(1)式を用いて0に近づけることが経路計画の目標になる。
【0033】
【数1】
【0034】
なお、図3aの移動ロボットの運動方程式は(2)式で与えることができる。ここで、viはエージェントiの移動速度、ωiはエージェントiの角速度であり、制御入力は(v,ω)の2入力で与えることができる。
【0035】
【数2】
【0036】
一方、図3bのように、エージェント3がオムニホイールで駆動されるロボットや作業員(人間)の場合、X、Y方向に自在に移動できるため、運動方程式は(3)式に従うことになる。この場合、制御入力が(vx,vy,ω)の3入力になる。
【0037】
【数3】
【0038】
なおエージェント3を早く動かす方が移動効率は良いが、一方でエネルギ消費量も増加してしまう。各時刻のエネルギ消費は、エージェントの速度や角速度の関数として(4)式で与えることができる。
【0039】
【数4】
【0040】
よって、エネルギ消費量を抑制しながら、エージェント3が目標値に到達するには、(5)式のように、自身の位置pと目標地点rの偏差eとエネルギ消費量Eから構成される評価値を利用することが望ましい。
【0041】
【数5】
【0042】
ここで、kは時刻を意味し、k0は評価開始時刻、kNは評価終了時刻である。αは偏差に関する重みであり、βは消費エネルギに関する重みである。αとβのバランスを調整することでエージェント3の行動を調整できる。例えば、αに比べてβを大きくすると消費エネルギを抑制する、省エネモードの動作を実現できる。一方、βを0にすると、消費エネルギを考慮しないで最も早く移動する経路を計算することになる。
【0043】
(5)式をN台の全エージェント3について、考慮した(6)式を評価することが主目的達成評価部43の機能となる。
【0044】
【数6】
【0045】
次に、同じく従来部分の機能である図2のエージェント間距離評価部41について説明する。エージェント間距離評価部41は、管理対象エリア内のすべてのエージェント3の位置やIDなどを管理するエージェント情報管理部13から得られるエージェント情報S6と、管理対象エリアの地図情報を管理する地図情報管理部12から得られる地図情報S5を入力情報としている。これらの情報により、エージェント間距離評価部41は、各エージェントが接触すること防止するために、エージェント情報管理部13から受け取った各エージェント間の距離が所定以上になるように主目的達成評価部43の評価値を補正する機能を有する。
【0046】
位置ベクトルPiのエージェントiと位置ベクトルPjのエージェントjの距離dijは(7)式で算出することができる。この距離dijがエージェントごとに与えられる余裕距離da以上になる、つまり、(8)式を満足するように経路計画を実行する。
【0047】
【数7】
【0048】
【数8】
【0049】
(8)式を実現するには、後述の経路計画計算部44の最適化計算における拘束条件として組み込んでもよい。また、(9)式のような評価関数を導入してもよい。(9)式のεはゼロ割を回避するための微小係数である。
【0050】
【数9】
【0051】
なお、(9)式は(9a)式と(9b)式を含んでいる。(9a)式は特定の時刻のみの評価であり、(9b)式はモデル予測制御の考えに従って評価時刻の予測期間k=k0からkNまでの全ての評価を示す。
【0052】
説明の簡略化のため、特定の一時刻の評価である(9a)式に注目する。図4は、(9a)式の評価関数を示す図であり、横軸にエージェント間の距離dij、縦軸に評価関数の大きさを示している。ここでは、(9a)式の評価関数は図4のような形状になるため、エージェント間の距離dijが余裕距離daに近づくほど、大きな値をとる。つまり、エージェント間の距離が近づくほどに大きな罰則(ペナルティ)を与えることによって、各エージェント3の接触を防止することができる。
【0053】
次にエージェント間距離評価部41の特徴点について説明する。ここで、余裕距離daはエージェント情報管理部13が保有しているエージェント情報S6に従って変更することが望ましい。
【0054】
【表1】
【0055】
表1は接触安全性に注目して設計された余裕距離daの一例である。エージェント種別(作業員、低速機械、高速機械)ごとの接触を想定している。作業員は移動速度も遅く、作業員同士であれば接触しても事故になる可能性が低いため、エージェントの余裕距離daは30cmになる。一方、高速機械(フォークリフトなど)が人と接触すると重大な事故になりえるため、余裕距離daは100cmとする。ほかの組み合わせも同様の指針で設計される。
【0056】
【表2】
【0057】
表2は表1に加えて、感染症予防の観点を追加した余裕距離daの設計例である。ここでもエージェント種別(作業員、低速機械、高速機械)ごとの接触を想定している。人と機械であれば、飛沫感染の可能性は少ないため、余裕距離daは表1と同様である。一方で、人同士がすれ違うと飛沫感染の可能性が高まるため、余裕距離daを大きくとることでソーシャルディスタンスを確保することが望ましい。表1、表2ともに余裕距離daはエージェントの特性のみで決まるのではなく、エリアの通路幅などにも依存することになる。
【0058】
なお、地図情報管理部13から受け取った地図情報S5における障害物(壁や柱など)を仮想的なエージェントとして扱い、各エージェントと障害物の距離diを(9)式と同様の形式で評価すれば障害物との接触回避も実現できる。もしくは、障害物情報をコストマップCに保存しておき、コストマップにおける各エージェントの位置piを評価するように(10)式を利用してもよい。
【0059】
【数10】
【0060】
以上が、従来の経路計画装置における制御であり、主目的達成評価部43とエージェント間距離評価部41と経路計画計算部44の機能により経路計画が可能であるが、この経路計画によりロボットが動作できなくなる状態(固着状態:スタック、デッドロック)に陥った場合に、固着状態から脱出することができないものであった。固着状態から脱出できないことについて、図5a,図5b,図5c,図5d,図6a,図6bを用いて説明する。
【0061】
たとえば、特許文献1では、m台目のロボットの現在位置をpm、目標位置をqmとして、その偏差をem=pm-qmで与え、(11)式のような評価関数を設計している。
【0062】
【数11】
【0063】
ここで、ロボットが1台しか存在せず(m=1の場合)、かつ、障害物が存在しない場合、評価関数は図5aのような形状(横軸:偏差、縦軸:評価関数)になるため、評価関数を最小化するように制御入力を算出すれば、偏差eが0になる(ロボットが目標値に到達する)状態を達成できる。
【0064】
ただし、図5bのエリア平面に示すように、ロボットの現在位置p1と目標地点q1の間に障害物が存在する場合には、前述のような動作を実現することができなくなる。図5bの場合、(11)式を小さくするには、Y軸を正方向に移動する動作が選択されることになる。しかし、Y軸正方向に移動すると障害物があり、それ以上、目標地点q1に接近することができなくなってしまう。
【0065】
このような状態から抜け出すには、Y軸負方向に移動する必要があるが、自身の位置p1と目標地点q1との偏差e1が増加するため、評価関数の値が増加してしまう。よって、制御入力は特許文献1の手法では算出できない。このような状況は図5cに示すように、評価関数が大域最適以外の局所最適を持つ場合に発生する。
【0066】
同じような状況は障害物(通路)の反対側に目標地点q1がある場合には必ず発生する。例えば、図5dのような状況でロボットがX軸正方向に移動していると、目標地点q1との偏差e1が特定の距離になる円周上が局所最適解になる。この地点よりもX軸正方向に移動するにはY軸負方向への移動を伴う円弧運動をとらない限り評価関数が増加する。円弧運動を行ってB地点にたどり着いても障害物があるため、ロボットはそれ以上進むことができなくなってしまう。
【0067】
前述のとおり、特許文献1の手法では、ロボットが1台しかいない環境でもロボットが目標地点に到達できない可能性がある。ロボットが複数台になると、さらにロボットが目標地点に到達することが困難になる。
【0068】
例えば、図6aのように2台のロボットがそれぞれ相手ロボットの後ろ側にある目標地点qに移動する状況を考える。仮に、丸いロボット(m=1)がY軸負方向に移動して、四角いロボット(m=2)が通過するのを待つ、もしくは迂回する動作(図中、迂回ルートを生成)を実現できれば、2台のロボットはそれぞれ目標地点qに到達できる。
【0069】
しかし、そのような動作は丸いロボットの偏差e1を増加させない限り生成されない。偏差emを減少するようにして実現される動作は図6bに示すように互いのロボットが前進し、衝突回避のために設定された距離d離れた状態で、互いの偏差emが一定になる円弧上に固定される動作である。
【0070】
このように、従来においては(6)式でβ=0とした評価関数((11)式)を最小化するように制御入力(vi,ωi)を算出し、その結果を利用すると経路を算出しようとすると、局所最適に陥り、エージェントが移動できなくなってしまう状況がある。
【0071】
ここで、局所最適に陥り、エージェントが移動できなくなってしまう状況について、さらに検討すると、いくつかのパターンに整理することができる。このことから本発明では、各パターンに対応した対応策を提案する。
【0072】
本発明の主目的達成補助部42は、このような状況を解消し、各エージェントが目標地点rに到達することを補助するために導入される。まず、各エージェントがデッドロックになってしまうという状況は、エージェントの移動速度が0(ゼロ)になる、と言い換えることができる。本発明が想定する第1のパターンがこれである。
【0073】
主目的達成補助部42では、この第1のパターンの状況を回避するために、(12)式の評価関数を導入する。なお(12)式は(12a)式と(12b)式を含んでいる。(12a)式は特定の時刻のみの評価であり、(12b)式はモデル予測制御の考えに従って評価時刻の予測期間k=k0からkNまでの全ての評価を示す。以降の説明は、(12a)式を使用して行うものとする。
【0074】
【数12】
【0075】
(12a)式は図7aのような形状(横軸:v ,縦軸:評価関数の大きさ)になるため、各エージェントの移動速度viが0(ゼロ)に近づくほど、大きな罰則を与えることになる。このような関数を評価関数に加えることによって、エージェントが停止状態を解消するような動作が生成される。
【0076】
より具体的には、自己位置pと目標地点rとの偏差eが増えても、移動速度viが0(ゼロ)になるよりは合計の評価関数が低くなる。結果、図5b、図6a,図6bのような状況で、エージェントは迂回するような挙動を実現することができる。同様に、図5dのような状況も解消することができる。
【0077】
なお、速度viが0(ゼロ)になるときにペナルティを与えると、エージェントが目標地点rに到達しても停止することができなくなってしまう。これを回避するために図7b(横軸:e,縦軸: γi)に示すように、エージェント位置qと目標地点rの偏差eiが所定値eth以下になったらγi=0とするように変更する。γi=0であれば、速度viが0(ゼロ)になってもペナルティは与えられないので、エージェントは目標地点に到達することができる。
【0078】
なお、図7bはγiの与え方の一例であり、偏差eiが0のときに、γi=0を満足していれば、どのような方法で設計してもよい。
【0079】
さらに、各エージェントがデッドロックになってしまうという状況は、エージェントが特定の位置paにとどまっている状態、と言い換えることができる。本発明が想定する第2のパターンがこれである。
【0080】
主目的達成補助部42では、この第2のパターンの状況を回避するために、(13)式の評価関数を導入する。なお(13)式は(13a)式と(13b)式を含んでいる。(13a)式は特定の時刻のみの評価であり、(13b)式はモデル予測制御の考えに従って評価時刻の予測期間k=k0からkNまでの全ての評価を示す。以降の説明は、(13a)式を使用して行うものとする。
【0081】
(13a)式は図8のような形状(横軸:(Pa-Pi),縦軸:評価関数の大きさ)になるため、各エージェントの位置piがpaに近づくほど、大きな罰則を与えることになる。このような関数を評価関数に加えることによって、エージェントが停止状態を解消するような動作が生成される。
【0082】
【数13】
【0083】
なお特定の位置paは、事前にデッドロックを生じることが予測できる地図形状であれば、地図情報管理部12に記録しておくことが望ましい。
【0084】
また、エージェント情報管理部13で取得した各エージェントの位置piが一定時間変化しない場合、そのエージェントの位置piを前述の特定位置paとして設定してもよい。このような方法を採用すると、pa=piが設定されたタイミングで大きなペナルティが課されるため、i番目のエージェントがすぐに動き出すことが期待される。エージェントが移動し始めたら、設定したpaを解除することが望ましい。
【0085】
また、各エージェントが停止状態になっていないが、目標地点に到達できない状況も考えられる。例えば、図9aに示すように、エージェント3が目標地点と一定距離以上離れたまま円周上動作を一定速度で走行する状況がこのような状況に相当する。本発明が想定する第3のパターンがこれである。
【0086】
図9aは、2次元平面におけるi番目のエージェントの位置Pi、および走行軌道と目標地点rを示しており、図9bはi番目のエージェントの位置Piと目標地点の偏差の時間変化を示している。このとき、、エージェント3は、目標地点riと一定距離以上離れたまま,円周上(偏差の最小値min ei、偏差の最大値max ei)で、動作を一定速度で走行している。
【0087】
図9aの状況では、エージェントが一定速度で動作しているため、(12)式でペナルティを与えることは難しい。また、エージェントが特定位置に留まっているわけではないので、(13)式でペナルティを与えることも難しい。
【0088】
各エージェントが停止状態、もしくは、図9aのような状況は、所定時間内に確認された偏差eiの最小値min eiが更新されない状況と言い換えることができる。このような状況を解消するために、(14)式に示すように、各エージェントの偏差eiの積分値を評価するペナルティを導入する。図7のように円軌道で走行していると、時間が経過するほど偏差の積分値が大きくなるため、円軌道を逸脱する動作が選択されやすくなる。
【0089】
【数14】
【0090】
(14)式は、偏差eiを評価するという点では、(6)式において、β=0とした評価関数に類似するが、(6)式は「kN-k0」分の時間の偏差の累積値しか評価しないことに違いがある。たとえば、図9bの時刻taから時刻tbが「kN-k0」に相当すると(6)式の評価値は減少しているため、適切な動作が生成されていると判断される。一方、(14)式は偏差eiが0でない限り増加するため、より長期的に評価が実現できる。
【0091】
なお、(14)式を利用すると過去の偏差eiがすべて影響するため、最小値min eiが更新されるたびに積分をリセットすることと、重みηiをゼロにする操作を加えることが望ましい。
【0092】
以上のように、主目的達成補助部42は、上記に示したパターンに対応する複数の対策手法を備えることで、脱出機能を実現することができる。主目的達成補助部42は以上のいずれの方法の少なくとも1つ備えていれば良い。当然、前述の3つの手法すべてを備えていても良い。
【0093】
図2に戻り、経路計画計算部44は、主目的達成評価部43、エージェント間距離評価部41、主目的達成補助部42の、それぞれで設定した評価関数を統合し、その評価関数の値を最小化するように制御入力uを算出する。
【0094】
具体的には、各要素で設定した評価関数JIを、重み係数αIを利用して統合した評価関数((15)式)を最小化するように制御入力uを算出する。なお、主目的達成補助部42のうち、特定の手法を無効化する場合は、対応する重み係数αI(I=4、5、6)を0(ゼロ)にすればよい。
【0095】
【数15】
【0096】
制御入力uの算出方法自体は、よく知られたモデル予測制御の考えに従っており、特段の工夫はないため、説明は省略する。
【0097】
各時刻で最適な制御入力uが求まれば、対応する運動方程式((2)式、(3)式)を利用して位置(x、y)と方位(θ)の時系列データを容易に生成できる。この時系列データが各エージェントに対する経路計画になる。この経路計画自体は特許文献1と同様であり、広く知られた手法であるため、具体的な説明は省略する。
【0098】
また経路計画計算部44は、パターンを判別して特定の対策手法を実行するものとしてもよく、或は複数の対策手法を順次実行していずれかにより解消するのを待つことにしてもよい。
【0099】
算出された経路計画は行動計画伝達部15を介して、各エージェントに配信される。
【実施例0100】
実施例1では、経路計画システムの全体構成例を説明した。実施例2では、経路計画システムにおける処理フローについて説明する。
【0101】
本発明の実施例2に係る制御システムの全体的な処理手順を図10のフローチャートを用いて説明する。
【0102】
まず、処理機能FC1からFC3で経路計画装置1の計算に必要な情報を取得する。処理機能FC1では、エリア内のエージェントの位置情報S6を取得する。この機能は、エージェント情報管理部13に相当する。処理機能FC2では、エリア内の各エージェントに与える業務内容S4(移動すべき目標地点ri)を取得する。この機能は、業務管理部11に相当する。処理機能FC3では、エリア内の地図情報S5を取得する。この機能は、地図情報管理部12に相当する。なお地図情報S5は業務内容やエージェントの位置情報に比べて、更新頻度が遅いため、必ず毎ステップで更新する必要はない。なお、処理機能FC1から処理機能FC3の処理順番はどのような順番でも良く、処理機能FC4以降に遷移する前にすべての情報がそろっていることが重要である。
【0103】
処理機能FC4では、処理機能FC1と処理機能FC2で取得した各エージェントの位置S6、業務内容S4に従って、各エージェントが目標地点に移動するための評価を行う。この機能は、主目的達成評価部43に相当する。
【0104】
処理機能FC5では、処理機能FC1と処理機能FC3で取得した各エージェントの位置S6、および、地図情報S5を利用して、各エージェントが障害物や他のエージェントにも接触しないように行動するための評価を行う。この機能は、エージェント間距離評価部41に該当する。
【0105】
処理機能FC6では、処理機能FC1から処理機能FC3で取得した各情報S4,S5,S6を利用して、各エージェントが目標地点に移動する過程で停止してしまう状況を解消するための評価を行う。この機能は主目的達成補助部42に該当する。
【0106】
処理機能FC4から処理機能FC6も処理順番はどのような順番でも良く、処理機能FC7以降に遷移する前にすべての情報がそろっていることが重要である。上述のとおり、モデル予測制御の考えを利用する場合、処理機能FC4から処理機能FC6は初期時刻k0から予測ステップ分(kN-k0)先までの値を評価することになる。
【0107】
処理機能FC7では、処理機能FC4から処理機能FC6で算出した評価関数を最小化するように各エージェントの制御入力を算出し、その入力を積分することで移動経路を算出する。この機能は、行動計画計算部44に相当する。
【0108】
処理機能FC7で経路計画が生成されたら、処理機能FC8に遷移する。
【0109】
処理機能FC8では、処理機能FC7で生成された経路計画を各エージェントに配信する。この機能は行動計画伝達部15に相当する。
【0110】
処理機能FC6に示した主目的達成補助評価部42の実施例に関して、より詳細なフローチャートを、図11を用いて説明する。
【0111】
図11の主目的達成補助評価部42の最初の処理機能FC61では、主目的達成補助評価部42におけるパターン1に対する第1の実現手段である目標地点以外の箇所での減速にペナルティを与える機能を有効にするかを判断する。本機能が有効である場合(YES)は処理機能FC62に遷移し、無効である場合(NO)は処理機能FC63に遷移する。
【0112】
第1の実現手段を有効にするか否かは、ユーザ(エリア管理者)の設定で切り替えても良い。さらに、ユーザが第1の実現手段を有効にすると判断した状態でも、エージェント3が目標地点の近くにいるのであれば、本機能は無効になる。
【0113】
処理機能FC62に遷移したとき、ここでは(12)式に従って、目的地点以外での停止(減速)に対するペナルティ値を算出する。
【0114】
処理機能FC63に遷移したとき、ここでは主目的達成補助評価部42におけるパターン2に対する第2の実現手段である目標地点以外の特定位置paに留まることにペナルティを与える機能を有効にするかを判断する。本機能が有効である場合(YES)は処理機能FC64に遷移し、無効である場合(NO)は処理機能FC67に遷移する。
【0115】
第2の実現手段を有効にするか否かは、ユーザの設定で切り替えても良い。さらに、ユーザが第2の実現手段を有効にすると判断した状態でも、エージェントが停止していないのあれば、本機能を無効にしても良い。
【0116】
処理機能FC64では、i番目のエージェントが停止している位置piをペナルティ計算のための特定位置paとして与える。なお、地図形状からエージェントが停止することが事前に予測できる場合は、その位置をpaとして事前に設定する処理で代替しても良い。
【0117】
処理機能FC65に遷移すると、(13)式に従って、目的地点以外の特定位置paでの停止に対するペナルティ値を算出する。
【0118】
処理機能FC66では、主目的達成補助評価部42におけるパターン3に対する第3の実現手段であるエージェント位置と目標地点の偏差の積分を利用してペナルティを与える機能を有効にするかを判断する。本機能が有効である場合(YES)は処理機能FC67に遷移し、無効である場合(NO)は処理機能FC60に遷移する。
【0119】
第3の実現手段を有効にするか否かは、ユーザの設定で切り替えても良いが、第1、2の実現手段をユーザが無効にした場合は、自動的に有効にすることが望ましい。なお、後述の具体的な実施形態に示す通り、エージェントが作業員の場合、デッドロック(立ち往生)するような状況は作業員自身で解消できるため、そのような場合に限り、第1から第3の実現手段をすべて無効にしても良い。
【0120】
処理機能FC67に遷移すると、特定時間のエージェント位置と目標地点の偏差の変化量を分析する。処理機能FC68では、処理機能FC67で取得した偏差の最小値が変化していれば(YES)、処理機能FC69bに遷移する。一方、処理機能FC67で取得した偏差の最小値が変化していない場合(NO)は処理機能FC69aに遷移する。
【0121】
FC69aでは、(14)式に従って、偏差eiの積分値を利用したペナルティを算出する。処理機能FC69bでは、偏差eiの積分値をリセットする操作を行う。処理機能FC69aに遷移した時のみに、積分値を計算する処理を実施している場合は、処理機能FC69bの処理は行わなくても良い。
【0122】
処理機能FC60では、処理機能FC62、FC65、FC69aで計算したそれぞれのペナルティを加算することでペナルティを統合する。処理機能FC62、FC65、FC69aのうち計算が実施されなかった値は0(ゼロ)で代替する。
【0123】
次に、経路計画装置1の更新タイミングの一例を、図12を用いて説明する。本例は、エージェント数がN=3の時(3A,3B,3C)を考えているが、エージェント数が増えた場合であっても同様の処理を行うことができる。
【0124】
まず、経路計画装置1が動き出す時刻t0では、すべてのエージェントが停止していることを想定する。経路計画装置1は、各エージェント3の位置情報などを入力として受け付けると、経路計画の計算を行い、各エージェント3に対する経路計画を順次配信する。
【0125】
最初の経路が時刻t1に配信されると、各エージェントが目標地点に移動を開始する。エージェント3ごとに目標地点rまでの移動距離も移動速度も異なるため、移動時間は一致していないことが多い。
【0126】
このうちエージェント3Aについてみると、時刻t2で目標地点に到達し、到達を検知した経路計画装置1はエージェント1に対して、新しい目標地点を付与して再度経路計画を行う。再度の経路計画は、入力、計算、出力の順序で実行され、時刻t3においてエージェント3Aに対する再経路計画が送信可能となる。
【0127】
この経路計画の計算時点(t2-t3間)では、エージェント3B、エージェント3Cは既に経路を与えられているため、エージェント3Aのみの経路計画としても良い。ただし、全エージェントの経路計画を行う方が、全体最適化になるため、エリア全体としてはより良い行動計画が実現できる。
【0128】
経路計画の計算が完了すると、時刻t3で各エージェントに新しい経路計画が与えられる。以降、各エージェントが目標地点に到達するごとに同様の処理が実行される。
【0129】
ただし、例えば、倉庫内で荷崩れが起きて特定の通路が通行不可になったなど、経路計画の再実施が必要になった場合には、どのエージェントも目標地点に到達していない時刻t4に割り込み処理を行っても良い。
【実施例0130】
実施例3では、上記した実施例の手法によりスタック状態から脱出できる仕組みについて時系列をもって説明する。
【0131】
まず、エージェント3が1台でスタックが発生する図5bのケースを想定する。なお、説明を簡単にするため、エージェント間距離評価部41、主目標達成補助部42がなく、主目的達成評価部43のみであるとする。このときは評価関数の形状が、図5cのようになる。このため、経路計画計算部44は総合評価を向上する(評価関数の値を小さくする)ために、偏差eを小さくするようにエージェントをy軸正方向に移動させる。
【0132】
図13aは、図5bと図5cを併記して、スタック状態を初期状態として示した図である。この特性では、大域最適に移行すべきところ、局所最適に陥っている。この時、図13aに示すように、評価関数の値はf1からf2へと減少する(総合評価は向上する)。その後、エージェントと目標位置の間には壁があるため、それ以上エージェントは移動できなくなる。この状態からエージェントが引き返す動作(y軸負方向への移動)をとると偏差eが増加するため、評価関数の値はf2よりも増加、つまり、総合評価が低下することになる。経路計画計算部44は総合評価を向上する経路を算出する機能であるため、このような総合評価が低下する行動は算出できない。よって、エージェントは停止し続けることになる。
【0133】
つぎに、主目標達成補助部42を追加した場合の動作を説明する。ここでは、エージェントは移動速度に注目した主目標達成補助部42((12)式、図7a)が採用された場合について説明する。主目標達成補助部42を追加した場合、図13aのようにエージェントが壁に近づこうとして減速を開始すると、図7aに示した関数によって急速にペナルティ(罰則)が増加する。つまり、速度が低下するにつれて図13bに示すように、主目標達成補助部42の出力が増加する。結果として、主目標達成評価部43と主目標達成補助部42の和である総合評価が図13cに示すような形状になる。つまり、エージェントが偏差eを小さくするための移動、および、壁への接近による減速に伴って、総合評価値がf1からf3へと増加(評価が低下)する結果になる。
【0134】
主目的達成評価部43のみの場合、偏差eがea1のときの図13aのように局所最適解に陥っていたのに対して、主目標達成補助部42を追加すると、偏差がea1のときは図13cに示す通り、局所最適解でなくなる。これによって、図13dに示すように、経路計画計算部44は偏差eを小さくしながら、総合評価値を改善する解を探索することができるようになる。エージェントの速度が一定以上になると、主目標達成補助部42によるペナルティの影響はなくなるが、図13dのように偏差eがea2を下回る状況になれば、局所解に陥ることなく、図13eに示すように、経路計画計算部44は偏差eが0になる大域最適解を探索することができる。
【0135】
次に、エージェント3が2台でスタックが発生する図6bのケースを想定する。図6bに示す状況の各エージェントの主目的達成評価部43の評価を図14aに示す。図6bの状態では、位置p1のエージェント3が迂回して目的地点へ移動する状況なので、図14aのように局所解を有する形状の評価関数になる。
【0136】
一方、位置p2のエージェント3は直進のみで目標地点へ移動する状況なので図14bのように、エージェント単独では局所解を持たない形状の評価関数になる。ただし、経路計画計算部44は個別のエージェントの挙動を最適化するものではなく、全エージェントの行動を最適化するものであるため、総合評価値は図14aと図14bを足し合した図14cのような形状の評価関数の最適化を実施することになる。図14cの評価関数は、合計の偏差eがeb1に局所解が存在する。この局所解に陥った状況が図6bに示すお互いのエージェントが所定距離d離れた状況から移動できない状況に相当する。
【0137】
これに対し、図15aに示すように、スタックが発生する偏差eb1に各エージェントが接近すると、各エージェントの速度が低下するため、主目標達成補助部42により、ペナルティが増加する。ペナルティが増加することにより、経路計画計算部44で利用する総合評価値の形状は図15bのように変化し、偏差eb1の値は局所解でなくなる。よって、図15cに示すように、もともとの局所解(eb1)で全エージェントがスタックしてしまう状況を回避することができる。
【実施例0138】
実施例4では、本発明を工場、物流現場に適用することについて説明する。図16は、エージェント3である作業員3Bと自動化機械(フォークリフト)3Aが混在する倉庫100を簡易的に表記した図である。図はわかりやすさを優先して作業員3Bも自動化機械3Aも1台しか表記していないが、作業員、自動化機械ともに複数台いる環境でもよいし、自動化させていない通常の機械が混在していても良い。
【0139】
作業員3Bは図示しないスマートデバイスを装着、もしくは、保持している。スマートデバイスは、タブレット端末でも良いし、ゴーグルのように装着可能なモノであっても良い。スマートデバイスは、タブレット端末のモニタもしくはゴーグル内に目標地点への経路を表示することで作業員3Bに移動先を通知、誘導することができる。
【0140】
スマートデバイスは倉庫エリア100内に配置されたビーコン103と無線通信を行うことで、スマートデバイスを装着、もしくは保有している作業員3Bの位置を計測することができる。また、スマートデバイスは通信機能を有しており、管制サーバ104と通信することができる。また倉庫エリア100内に配置された監視カメラ101により、エリア内の様子が把握されている。
【0141】
管制サーバ104が本発明の経路計画装置1に相当する。なお、経路計画装置1の機能が同一のサーバで実施されなくても良い。例えば、処理負荷の高い経路計画計画部44のみを特定のサーバで実行する形態にしても良い。また、管制サーバ104は必ずしも倉庫100内に設置されている必要はない。
【0142】
自動化機械3Aには図示しないLiDARが搭載されている。LiDARで収集した点群データを処理することで自動化機械は倉庫地図の作成と自己位置推定を同時に実行する
SLAMの機能が実装されている。さらに、自動化機械3Aには図示しないコントローラが搭載されており、自動運転に関する各種演算が実行される。
【0143】
自動化機械3Aのコントローラは通信機能を備えており、SLAMで取得した自己位置、および、地図情報を管制サーバ104に送信するとともに、管制サーバ104から経路計画を受信する。コントローラは移動計画に従うように自動化機械3Aのアクチュエータ(ステアリングモータ、走行モータなど)を制御する。作業員3Bや自動化機械3Aが本発明におけるエージェント3に相当する。
【0144】
また、倉庫内に配置された監視カメラ101が本発明における図1の監視装置2に相当する。
【0145】
以下、図1の業務管理部11において作業員3Bに棚102Bの位置r1に物品を回収するように、また、自動化機械3Aに棚102Aの位置r2の物品を回収するように作業が設定された状況を想定する。
【0146】
経路計画装置1は、作業員3Bをエージェント1、自動化機械3Aをエージェント2として、それぞれが従うべき経路を算出する。
【0147】
まず、管制サーバ104は、作業員3Bが備えたスマートデバイスと自動化機械3Aのコントローラからそれぞれの現在位置p1、p2を受信する。この機能は本発明のエージェント情報管理部13に相当する。また、業務管理部11が定めた作業員3B、自動化機械3Aの目標地点をr1、r2とする。
【0148】
経路計画部14は作業員3Bを現在位置p1から目標地点r1に、自動化機械3Aを現在位置p2から目標地点r2に導くように経路計画を行う。まず、両エージェントの位置が十分に離れているときは主目的達成評価部43の評価値が支配的であるため、それぞれが最短ルートになるように経路が徐々に生成される。
【0149】
予測ステップk=5までに生成される各エージェントの経路の例を図17aに示す。図17aの経路の時点(k-5)から自動化機械3AがY軸負方向に移動する経路を引くと、時刻k=6で自動化機械3Aと作業員3Bが接触する可能性がある。
【0150】
このような状況になると、エージェント間距離評価部41によるペナルティが支配的になる。よって、図17bに示すように、自動化機械3Aは最短経路(Y軸負方向への移動)ではなく、衝突を防止するX軸負方向に移動する経路を生成するようになる。以降は接触の可能性がなくなるため、それぞれが最短ルートをたどるように経路を順次生成する。
【0151】
なお、主目的達成評価部43において(6)式のエネルギ消費量に関する重みβが大きく設定されている場合は、図17bのように自動化機械3Aを迂回させるルートを生成せず、図17cのように、時刻k=4でたどり着いた位置p2(4)で自動化機械3Aを待機させる動作も実現し得る。図17cでは、予測ステップk=4からk=7の間は、位置P2(4)に停止して移動しないことを表している。
【0152】
本発明を利用すれば、詳細な地図(ノード、エッジ情報)を事前に準備せずとも、評価関数の設計次第でさまざまな経路計画が自動的に実現されるため、エンジニアリングコストを大幅に抑制することができる。
【0153】
なお、図17cの動作は主目的達成補助部42の第1の実現手段によるペナルティ((12)式)の影響によっては実現することができない。ゆえに、エネルギ消費量を抑えることを重視する場合は、主目的達成補助部42の第1の実現手段を無効にして、第2、第3の実現手段によって、デッドロックの発生を防止することが望ましい。
【0154】
次に、従来技術(特許文献1)ではデッドロックが生じ得るような状況として2台の自動化機械3D(エージェント1)、3C(エージェント2)が互いの初期位置p1、p2の後方に目標位置r1、r2が与えられた図18aの状況を考える。
【0155】
従来技術では、前述の図6bと同様の図18bに示したようにそれぞれの自動化機械3C,3Dがある程度前進した位置(衝突しない距離)で停止してしまう。これは主目的達成評価部43とエージェント間距離評価部41しか有効でない状況で発生する固有の問題である。
【0156】
本発明を利用した場合も、最初は図18bのような状況になり、車両が接触しないように減速を始める。その後、主目的達成評価部43における偏差eを最小化しようとする評価指標(rをqと読み替えた(11)式)に比べて、主目的達成補助部42の第1の実現手段によるペナルティが増加すると、偏差eを増加させてでも移動する経路が生成される。つまり、図18cのように、交差する通路を活用して接触を回避する経路が生成される。
【0157】
以上のように、本発明を利用すれば、従来技術でデッドロックを生じる可能性がある状況でも、デッドロックを生じない経路を自動的に生成できる。ゆえに、デッドロック発生時のサービス員による遠隔操作も不要になるため、運用コストの抑制も期待できる。
【0158】
なお、作業員3Bは、自動化機械3Aと異なり、自身の意思で自由に動き回ることができるため、スマートデバイスに与えた経路指示に従わないことも予想される。
【0159】
作業員3Bが経路指示に従ない場合は、経路計画装置1は、その作業員3Bを制御可能なエージェントとして扱わず、接触してはいけない障害物として扱うことになる。
【0160】
経路指示に従わないことが確認され次第、経路計画装置1は割り込み処理(図12の時刻t4)によって、その作業員3Bを除外したエージェントの経路計画を実施する。
【0161】
なお、作業員3Bが再び経路指示に従う意思をスマートデバイスから送信した場合は、同様に、経路計画装置1は割り込み処理によって、その作業員3Bを含めた全エージェントの経路計画を実施する。
【実施例0162】
実施例5では、本発明を駐車場における経路計画に適用した場合を説明する。
【0163】
図19は非自動化車両3Eと自動化車両3Fが混在する駐車場200を簡易的に表記した図である。図はわかりやすさを優先して非自動化車両3Eも自動化車両3Fも1台しか表記していないが、非自動化車両、自動化車両ともに複数台いる環境でもよいし、非自動化車両が存在しない状況でも良い。
【0164】
非自動化車両3Eはカーナビゲーションシステムを備えているため、GNSS(lobal avigation atellite ystem)を利用した自己位置取得機能や、通信機能を備えていることがあるが、これらの情報が本発明の経路計画システムと連携できるとは限らない。このため、駐車場環境における、非自動化車両3Eはエージェント3が備えるべき機能を自身で有していない状況になる。ただし、後述の構成により、非自動化車両3Eが備えるべき機能を代替することは可能である。
【0165】
自動化車両3FはGNSSやLiDARを利用した自己位置取得が可能である。また、自動化車両3Fには図示しないコントローラが搭載されており、自動運転に関する各種演算が実行される。さらに、コントローラには通信機能が備わっており、駐車場の運用を管理する管制サーバ104と通信を行い、管制サーバ104が伝達した経路計画に従って駐車場内を走行することが可能である。
【0166】
駐車場200には、監視カメラ101が各所に備えられており、駐車場内の車両の位置、および、空きスペースを監視している。監視カメラ101は本発明の監視装置2に相当する。よって、監視カメラ101が非自動化車両3Eの自己位置取得部22の代替機能となる。
【0167】
駐車場200には、デジタルサイネージ105が各所に備えられており、空きエリアへのルート案内を表示することができる。管制サーバ104が配信した経路計画をデジタルサイネージ105に表示することで、非自動化車両3Eを誘導することができる。なお前述の物流倉庫の例と同様に、管制サーバ104は必ずしも駐車場200内に設置されている必要はない。
【0168】
駐車場200では、各エージェントに割り付ける業務は空きスペースへの移動になる。よって、業務管理部11は監視カメラ101で取得した空きスペースのうち、各エージェントの現在地から最も近い空きスペース、もしくは、施設入り口に最も近い空きスペースのいずれかを目的地点ri(i=1、…、N)として割り当てる機能を備える。
【0169】
経路計画装置1は各エージェントの現在位置p1、p2に対して、業務管理部11が算出した目的地点r1、r2へと移動させるための経路計画を算出する。
【0170】
図20aは駐車場に従来技術(特許文献1)を適用したときに発生し得る経路計画の例を示している。図5b、図5dに示した状況と同様に、各エージェントは障害物(壁や駐車している他車両)を挟んだ目標地点riへの最短距離位置(p1(6)とp2(2))でデッドロックしてしまう。
【0171】
図20bは同じ状況で本発明を適用した場合に生成される経路計画の例を示している。図20aでデッドロックが発生する状況になると主目的達成補助部42が算出するペナルティの値が大きくなるため、最短距離位置(p1(6)とp2(2))から離れる制御入力を算出する このため、最短距離位置(p1(6)とp2(2))を一度離れた後に、徐々に目標地点r1、r2へと接近する経路を生成することが可能になる。
【0172】
物流倉庫の例と同様に、非自動化車両3Eは、自動化車両3Fと異なり、ドライバーの意思で自由に動き回ることができるため、デジタルサイネージ105に与えた経路指示に従わないことも予想される。
【0173】
非自動化車両3Eが経路指示に従ない場合は、経路計画装置1は、その非自動化車両3Eを制御可能なエージェントとして扱わず、接触してはいけない障害物として扱うことになる。経路指示に従わないことが確認され次第、経路計画装置1は割り込み処理(図12の時刻t4)によって、その非自動化車両3Eを除外したエージェントの経路計画を実施する。
【0174】
以上、物流倉庫と駐車場を例に本発明の実施形態を詳細に述べたが、本発明の適用先がこれらの場合に限定されないことは言うまでもない。たとえば、港湾における搬送車両の移動経路生成、テーマパーク内を移動するロボットの経路生成などにも活用できる。
【符号の説明】
【0175】
1:経路計画装置
2:監視装置
3:エージェント
10:経路計画システム
11:業務管理部
12:地図情報管理部
13:エージェント情報管理部
14:経路計画部
15:行動計画伝達部
21:通信部
22:エージェント位置取得部
31:通信部
32:自己位置取得部
33:他者位置取得部
34:経路追従部
41:エージェント間距離評価部
42:主目的達成補助部
43:主目的達成評価部
44:経路計画計算部
図1
図2
図3a
図3b
図4
図5a
図5b
図5c
図5d
図6a
図6b
図7a
図7b
図8
図9a
図9b
図10
図11
図12
図13a
図13b
図13c
図13d
図13e
図14a
図14b
図14c
図15a
図15b
図15c
図16
図17a
図17b
図17c
図18a
図18b
図18c
図19
図20a
図20b