(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-28
(45)【発行日】2024-12-06
(54)【発明の名称】自律体システム及びその制御方法
(51)【国際特許分類】
G05D 1/43 20240101AFI20241129BHJP
B25J 9/16 20060101ALN20241129BHJP
B25J 13/08 20060101ALN20241129BHJP
【FI】
G05D1/43
B25J9/16
B25J13/08 A
(21)【出願番号】P 2018223859
(22)【出願日】2018-11-29
【審査請求日】2021-03-19
【審判番号】
【審判請求日】2023-04-07
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001678
【氏名又は名称】藤央弁理士法人
(72)【発明者】
【氏名】守屋 俊夫
(72)【発明者】
【氏名】渡邊 高志
(72)【発明者】
【氏名】木村 宣隆
【合議体】
【審判長】本庄 亮太郎
【審判官】刈間 宏信
【審判官】田々井 正吾
(56)【参考文献】
【文献】特開2018-67111(JP,A)
【文献】特開2019-110742(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05D 1/43 B25J 9/16 B25J 13/08
(57)【特許請求の範囲】
【請求項1】
複数の自律体を有する自律体システムであって、
前記複数の自律体の各々は、センサ部と、前記センサ部によるセンシング結果に基づいて状況を把握する状況把握部と、把握された状況に基づいて動作を決定する動作決定部と、決定した動作を実行する動作実行部と、を有する、人以外の自律体であり、
前記自律体システムが有する前記複数の自律体は、一つ以上の第1の自律体と、二つ以上の第2の自律体とを含み、
前記第1の自律体の前記状況把握部が把握する状況は、前記第1の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第2の自律体の状況を含み、
前記第2の自律体の前記状況把握部が把握する状況は、前記第2の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第1の自律体の動作実行部によって実行された動作の結果を含み、
前記第2の自律体の前記動作決定部は、前記第1の自律体の動作実行部によって実行された動作の結果に
従う動作を決定
する場合と、前記第1の自律体の動作実行部によって実行された動作の結果に反する動作を決定する場合とがあり、
前記第1の自律体の前記動作決定部は、前記第1の自律体の前記状況把握部が把握した状況に基づいて算出される評価パラメータが高い評価を示す値となるように前記第1の自律体の動作を決定することを特徴とする自律体システム。
【請求項2】
請求項1に記載の自律体システムであって、
前記第1の自律体の前記動作決定部は、前記第1の自律体の前記状況把握部が把握した状況に基づいて動作を決定する関数を保持し、前記評価パラメータが高い評価を示す値となるように前記関数のパラメータを変更することを特徴とする自律体システム。
【請求項3】
複数の自律体を有する自律体システムであって、
前記複数の自律体の各々は、センサ部と、前記センサ部によるセンシング結果に基づいて状況を把握する状況把握部と、把握された状況に基づいて動作を決定する動作決定部と、決定した動作を実行する動作実行部と、を有する、人以外の自律体であり、
前記自律体システムが有する前記複数の自律体は、一つ以上の第1の自律体と、二つ以上の第2の自律体とを含み、
前記第1の自律体の前記状況把握部が把握する状況は、前記第1の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第2の自律体の状況を含み、
前記第2の自律体の前記状況把握部が把握する状況は、前記第2の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第1の自律体の動作実行部によって実行された動作の結果を含み、
前記第2の自律体の前記動作決定部は、前記第2の自律体の前記状況把握部が把握した状況に基づいて算出される評価パラメータが高い評価を示す値となるように前記第2の自律体の動作を決定する
ことによって、前記第1の自律体の動作実行部によって実行された動作の結果に従う動作を決定する場合と、前記第1の自律体の動作実行部によって実行された動作の結果に反する動作を決定する場合とがあることを特徴とする自律体システム。
【請求項4】
請求項3に記載の自律体システムであって、
前記第2の自律体の前記状況把握部が把握した状況は、前記第1の自律体の動作実行部によって実行された動作の結果と、それ以外の状況と、を含み、
前記第2の自律体の前記動作決定部は、前記第1の自律体の動作実行部によって実行された動作の結果と、それ以外の状況と、に基づいて動作を決定する関数を保持し、前記評価パラメータが高い評価を示す値となるように前記関数のパラメータを変更することを特徴とする自律体システム。
【請求項5】
請求項4に記載の自律体システムであって、
前記関数のパラメータは、前記第1の自律体の動作実行部によって実行された動作の結果と、それ以外の状況と、のそれぞれに付される重みを含むことを特徴とする自律体システム。
【請求項6】
複数の自律体を有する自律体システムの制御方法であって、
前記複数の自律体の各々は、センサ部を含む人以外の自律体であり、
前記制御方法は、前記複数の自律体の各々が、前記センサ部によるセンシング結果に基づいて状況を把握する状況把握手順と、把握された状況に基づいて動作を決定する動作決定手順と、決定した動作を実行する動作実行手順と、を含み、
前記自律体システムが有する前記複数の自律体は、一つ以上の第1の自律体と、二つ以上の第2の自律体とを含み、
前記第1の自律体が前記状況把握手順において把握する状況は、前記第1の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第2の自律体の状況を含み、
前記第2の自律体が前記状況把握手順において把握する状況は、前記第2の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第1の自律体の動作実行手順で実行された動作の結果を含み、
前記第2の自律体は、前記動作決定手順において、前記第1の自律体の動作実行手順で実行された動作の結果に
従う動作を決定
する場合と、前記第1の自律体の動作実行手順で実行された動作の結果に反する動作を決定する場合とがあり、
前記第1の自律体は、前記動作決定手順において、前記第1の自律体の前記状況把握手順で把握された状況に基づいて算出される評価パラメータが高い評価を示す値となるように前記第1の自律体の動作を決定することを特徴とする制御方法。
【請求項7】
請求項6に記載の制御方法であって、
前記第1の自律体は、前記第1の自律体の前記状況把握手順で把握された状況に基づいて動作を決定する関数を保持し、前記動作決定手順において、前記評価パラメータが高い評価を示す値となるように前記関数のパラメータを変更することを特徴とする制御方法。
【請求項8】
複数の自律体を有する自律体システムの制御方法であって、
前記複数の自律体の各々は、センサ部を含む人以外の自律体であり、
前記制御方法は、前記複数の自律体の各々が、前記センサ部によるセンシング結果に基づいて状況を把握する状況把握手順と、把握された状況に基づいて動作を決定する動作決定手順と、決定した動作を実行する動作実行手順と、を含み、
前記自律体システムが有する前記複数の自律体は、一つ以上の第1の自律体と、二つ以上の第2の自律体とを含み、
前記第1の自律体が前記状況把握手順において把握する状況は、前記第1の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第2の自律体の状況を含み、
前記第2の自律体が前記状況把握手順において把握する状況は、前記第2の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第1の自律体の動作実行手順で実行された動作の結果を含み、
前記第2の自律体は、前記動作決定手順において、前記第2の自律体の前記状況把握手順で把握された状況に基づいて算出される評価パラメータが高い評価を示す値となるように前記第2の自律体の動作を決定する
ことによって、前記第1の自律体の動作実行手順で実行された動作の結果に従う動作を決定する場合と、前記第1の自律体の動作実行手順で実行された動作の結果に反する動作を決定する場合とがあることを特徴とする制御方法。
【請求項9】
請求項8に記載の制御方法であって、
前記第2の自律体が前記状況把握手順において把握した状況は、前記第1の自律体の前記動作実行手順において実行された動作の結果と、それ以外の状況と、を含み、
前記第2の自律体は、
前記第1の自律体の動作実行手順で実行された動作の結果と、それ以外の状況と、に基づいて動作を決定する関数を保持し、前記動作決定手順において、前記評価パラメータが高い評価を示す値となるように前記関数のパラメータを変更することを特徴とする制御方法。
【請求項10】
請求項9に記載の制御方法であって、
前記関数のパラメータは、前記第1の自律体の動作実行手順で実行された動作の結果と、それ以外の状況と、のそれぞれに付される重みを含むことを特徴とする制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の自律体を含む自律体システムに関する。
【背景技術】
【0002】
複数のロボットを含むシステムを制御する技術として、例えば特開2006-000954号公報(特許文献1)又は特開2015-208811号公報(特許文献2)に開示された技術がある。
【0003】
特許文献1には、複数台のロボットが協調的に動作し、全体としてある特定の目的を実現するマルチロボット・システムに関して、「マルチロボット・システムは、舞台上で活動する複数のロボットと、舞台上のロボットの動作を監視するモニタ・システムと、マルチロボットの運用を行なう統括コントローラで構成される。統括コントローラは、ロボットの状態と、モニタされた位置及び方向に基づいて、ロボットに対する動作指示や、ロボットに対する位置及び方向の補正指示、異常発生(若しくは予測)時におけるロボットへの動作指示を、無線LAN経由でリアルタイムに行なう。」と記載されている。
【0004】
特許文献2には、複数台のロボットを有するロボットシステムの動作プログラムの最適化に関して、「シミュレーション装置は、駆動軸の指令速度と指令加速度と動作待ち指令とを含む動作プログラムをシミュレーションにより実行するシミュレーション部と、動作プログラムの行番号と行番号における指令速度および指令加速度とを関連付けて時系列に記憶する記憶部と、シミュレーション部により実行されたシミュレーション結果に基づき、記憶部に記憶された行番号毎に、動作プログラムの実行時間を算出する実行時間算出部と、実行時間算出部により算出された実行時間に基づき、動作待ち指令に応じた動作待ち時間を算出する待ち時間算出部とを備える。」と記載されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2006-000954号公報
【文献】特開2015-208811号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記の特許文献1に記載されたロボットシステムでは、各ロボットがコントローラからの指示を受けるために、コントローラとの通信に適合したインターフェースを持つ必要がある。また、コントローラが各ロボットを制御するために、必要に応じて情報の統合、無矛盾性の保証及び同期の保証等が必要となる。また、ロボットの仕様の変更又は新たな仕様を持ったロボットの追加等があった場合には、それに合わせてコントローラ側の情報の変更又はインターフェースの変更等が必要になる場合がある。
【0007】
また、上記の特許文献2に記載されたシミュレーション装置では、ロボットシステムの動作プログラムのシミュレーションを行うために、事前に各ロボットの仕様を把握しておく必要があり、仕様が変更されたり、異なる仕様のロボットが追加されたりした場合にはそれに合わせてシミュレーション装置の情報を更新する必要がある。
【課題を解決するための手段】
【0008】
上記課題の少なくとも一つを解決するために、本願において開示される発明の代表的な一例は、複数の自律体を有する自律体システムであって、前記複数の自律体の各々は、センサ部と、前記センサ部によるセンシング結果に基づいて状況を把握する状況把握部と、把握された状況に基づいて動作を決定する動作決定部と、決定した動作を実行する動作実行部と、を有する、人以外の自律体であり、前記自律体システムが有する前記複数の自律体は、一つ以上の第1の自律体と、二つ以上の第2の自律体とを含み、前記第1の自律体の前記状況把握部が把握する状況は、前記第1の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第2の自律体の状況を含み、前記第2の自律体の前記状況把握部が把握する状況は、前記第2の自律体の前記センサ部によるセンシング結果に基づいて把握される、前記第1の自律体の動作実行部によって実行された動作の結果を含み、前記第2の自律体の前記動作決定部は、前記第1の自律体の動作実行部によって実行された動作の結果に従う動作を決定する場合と、前記第1の自律体の動作実行部によって実行された動作の結果に反する動作を決定する場合とがあり、前記第1の自律体の前記動作決定部は、前記第1の自律体の前記状況把握部が把握した状況に基づいて算出される評価パラメータが高い評価を示す値となるように前記第1の自律体の動作を決定することを特徴とする。
【発明の効果】
【0009】
本発明の一態様によれば、下位の各自律体(第2の自律体)が上位の自律体(第1の自律体)に対するインターフェースを明示的に持つ必要がない。このため、自律体の機種及び製造者等にかかわらず、下位の自律体と上位の自律体の接続が容易になる。また、予め各自律体に関する情報を統合したり、それらの無矛盾性及び同期等を保証したりする必要がなくなるため、動作のロバスト性が増す。さらに、下位の自律体の仕様が変化したり、新たな仕様を持った下位の自律体が追加されたりした場合にも、特別な作業を行うことなく上位の自律体が適応できるため、自律体システムの継続的な更新が可能になる。
【0010】
前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施例1の自律体システムの全体構成を示す説明図である。
【
図2】本発明の実施例1の自律体システムにおける管制システムの構成を示すブロック図である。
【
図3】本発明の実施例1の自律体システムにおけるウィング車の構成を示すブロック図である。
【
図4】本発明の実施例1の自律体システムにおけるフォークリフトの構成を示すブロック図である。
【
図5】本発明の実施例1の自律体システムにおける管制システムが実行する処理を示すフローチャートである。
【
図6】本発明の実施例1の自律体システムにおけるウィング車が実行する処理を示すフローチャートである。
【
図7】本発明の実施例1の自律体システムにおけるフォークリフトが実行する処理を示すフローチャートである。
【
図8】本発明の実施例2の自律体システムの全体構成を示す説明図である。
【
図9】本発明の実施例3の自律体システムの全体構成を示す説明図である。
【
図10】本発明の実施例4の自律体システムの全体構成を示す説明図である。
【
図11】本発明の実施例5の自律体システムの全体構成を示す説明図である。
【発明を実施するための形態】
【実施例1】
【0012】
図1は、本発明の実施例1の自律体システム100の全体構成を示す説明図である。
【0013】
実施例1の自律体システム100は、物流倉庫における自律フォークリフトによるウィング車からにパレット自動卸しシステムである。この自律体システム100は、自律体として、一つ以上のウィング車102と、一つ以上のフォークリフト103と、管制システム101と、を含む。
【0014】
ここで、自律体とは、自ら状況を把握し、判断し、動作を行う物体の総称である。例えば、センサ情報等に基づいて自律運転をするウィング車102及びフォークリフト103、並びに、センサ情報等に基づいて自律的な判断を行ってその結果を出力する管制システム101が自律体である。実施例1では主にこのような自律体について説明する。ただし、人間が運転するウィング車102及びフォークリフト103であっても、人間が自ら状況を把握し、判断した結果に従って動作する自律体として扱うことができる。さらに、例えば倉庫内に物品の運搬、仕分け等の作業をする人間がいる場合、その人間自身も、自ら視覚及び聴覚等によるセンシングの結果に基づいて状況を把握し、その人間の知能を用いて判断することで自律的に行動する自律体として扱うことができる。
【0015】
倉庫は、入荷エリア110、在庫エリア111及び出荷エリア112を含む。入荷エリア110にウィング車102が到着すると、フォークリフト103は、物品が積載されたパレット104を下ろして在庫エリア111に運ぶ。在庫エリア111に搬送された物品は、パレット104に積載されたままで保管されてもよいし、パレット104から下ろされ、棚に保管されてもよい。物品を保管する棚は、在庫エリア111に固定されていてもよいし、自動搬送車(図示省略)等によって移動可能なものであってもよい。
【0016】
フォークリフト103は、出荷オーダに応じて必要なパレット104を在庫エリア111から出荷エリア112に搬出し、出荷エリア112に到着したウィング車102に積み込む。パレット104の積み込みが終了したウィング車102は、出荷エリア112から離れて、次の配送先に物品を搬送する。
【0017】
なお、
図1では説明を簡単にするために省略されているが、実際の倉庫は、一般に、ウィング車102から下ろされたパレット104(又はこれからウィング車102に積み込まれるパレット)を仮置きするエリア、パレット104に積まれた物品の荷ほどきを行うエリア、出荷オーダに応じて物品のピッキング、仕分け、検品等を行うエリア、出荷する物品をパレットに積載するエリア等を含む。
【0018】
管制システム101は、倉庫内の各ウィング車102及び各フォークリフト103の状況を把握して、それらを管制するための情報を出力する、上位の(又は第1の種類の)自律体である。これは、自律体システム全体に関する情報を取得して全体を最適化するための処理を行うものであり、これを全体知と呼んでもよい。これに対して、各ウィング車102及び各フォークリフト103は、管制システム101から出力された情報を必要に応じて利用しながら、自律的に自らの動作を決定する下位の(又は第2の種類の)自律体である。これは、それぞれ自らの周囲の情報を取得して自律的に動作するものであり、これを自律個と呼んでもよい。
【0019】
図1の例では、倉庫内に、管制システム101と通信可能な一つ以上のカメラ105及び管制システム101と通信可能な一つ以上の信号機106が設けられる。各カメラ105は、倉庫内を撮影して、撮影した画像のデータを管制システム101に送信する。各信号機106は、例えば入荷エリア110又は出荷エリアに設けられ、管制システム101から送信された情報に従って何らかの信号を出力する。さらに、管制システム101は、各フォークリフト103と通信をしてもよい。
【0020】
管制システム101は、カメラ105、信号機106及びフォークリフト103等と通信可能である限り、倉庫内又は倉庫外(遠隔地を含む)のいずれに設けられてもよい。
【0021】
図2は、本発明の実施例1の自律体システム100における管制システム101の構成を示すブロック図である。
【0022】
管制システム101は、プロセッサ201、通信インターフェース(I/F)202及び記憶装置203を有する計算機である。
【0023】
プロセッサ201は、記憶装置203に格納されたプログラムに従って種々の処理を実行する。通信インターフェース202は、ネットワーク210に接続され、ネットワーク210を介して、カメラ105、信号機106及びフォークリフト103等と(ウィング車102が管制システム101との通信機能を有する場合には、ウィング車102とも)通信する。
【0024】
記憶装置203は、例えば、DRAM(Dynamic Random Access Memory)等の主記憶装置と、ハードディスクドライブ又はフラッシュメモリ等の補助記憶装置との組合せであってもよい。記憶装置203は、状況把握部204、動作決定部205、動作実行部206及びタスク情報208を保持する。
【0025】
状況把握部204、動作決定部205及び動作実行部206は、プロセッサ201によって実行されるプログラムである。以下の説明において上記の各部が実行する処理は、実際には、プロセッサ201が、記憶装置203に保持されたプログラムに従って、必要に応じて通信インターフェース202、カメラ105及び信号機106等を制御することによって実行する。
【0026】
例えば、カメラ105による撮影機能と、プロセッサ201が状況把握部204のプログラムに従ってカメラ105が撮影した画像から状況を把握する機能と、の全体を状況把握部204の機能として扱ってもよい。言い換えると、カメラ105を状況把握部204の一部と考えてもよい。同様に、信号機106を動作実行部206の一部と考えてもよい。上記の各部の処理については後述する。
【0027】
タスク情報208は、管制システム101が実行すべきタスクに関する情報である。例えば、実施例1の管制システム101が倉庫内のウィング車102及びフォークリフト103を管制する場合には、タスク情報208は、その倉庫から出荷されるべき物品の種類、数量及び出荷先等を含んだ出荷オーダを含んでもよい。
【0028】
カメラ105は、倉庫内を撮影する光学カメラである。倉庫の状況を把握するために必要であれば倉庫外を撮影するカメラ105が設置されてもよい。カメラ105は、倉庫内を撮影して、その画像データをネットワーク210を介して管制システム101に送信する。状況把握部204は、画僧データに基づいて、倉庫の状況(例えば倉庫内の各エリアにおけるパレット104の配置、各ウィング車102及び各フォークリフト103の位置及び状態等)を把握する。
【0029】
なお、カメラ105は、管制システム101が倉庫の状況を把握するための情報を取得するセンサの一例である。センサとして、カメラ105の代わりに(又はカメラ105に加えて)レーダー又はLIDAR(Laser Imaging Detection and Ranging)を用いてもよい。また、管制システム101が各ウィング車102及び各フォークリフト103の位置を把握するために例えばビーコンを使用してもよい。その場合はビーコン信号の受信機が倉庫内の各所に設置されてネットワーク210に接続される。倉庫に複数のカメラ105が設置されてもよいし、複数の種類のセンサが設置されてもよい。
【0030】
信号機106は、例えば交通信号と同様に、進行を許可する青色、停止を指示する黄色又は赤色の色信号を出力してもよい。信号機106は、例えば入荷エリア110及び出荷エリア112に設置され、ウィング車102に対して進行の許可又は停止等の情報を提示するために使用される。信号機106は、ネットワーク210を介して管制システム101から送信された信号に従って、いずれかの色信号を出力してもよい。あるいは、信号機106は、色信号の代わりに図形、記号又は文字等を含む信号によって進行、停止等の情報を表示してもよい。さらに、信号機106は、ウィング車102のウィングの開閉を指示する情報を表示してもよい。あるいは、信号機106の代わりに(又はそれに加えて)、上記のような情報を含む音声信号を出力する装置が使用されてもよい。
【0031】
ネットワーク210は、管制システム101とウィング車102、フォークリフト103、カメラ105及び信号機106との通信を可能にするものである限り、いかなる種類のものであってもよい。例えば、ネットワーク210は、管制システム101が遠隔地にある場合には広域ネットワークを含んでもよいし、移動するフォークリフト103等と通信するために無線ネットワークを含んでもよい。
【0032】
図3は、本発明の実施例1の自律体システム100におけるウィング車102の構成を示すブロック図である。
【0033】
ウィング車102は、物品が積載されたパレット104を搬送する車両である。ここではフォークリフト103によるパレットの積み下ろしが容易なウィング車(すなわち荷台部分の側板と天井が跳ね上がるタイプのトラック車両)を例示したが、それ以外のタイプの車両が使用されてもよい。
【0034】
ウィング車102は、プロセッサ301、通信インターフェース302、センサ部303、駆動部304及び記憶装置305を有する。
【0035】
プロセッサ301は、記憶装置305に格納されたプログラムに従って種々の処理を実行する。通信インターフェース302は、ネットワーク210に接続され、管制システム101と通信する。ただし、ウィング車102は管制システム101との通信機能を持たなくてもよく、その場合はウィング車102は通信インターフェース302を持たなくてもよい。
【0036】
センサ部303は、ウィング車102の周囲の状況を把握するための情報を取得する。センサ部303は、例えば光学カメラ、レーダー又はLIDAR等を含んでもよいし、マイクロフォンのような音声センサを含んでもよい。ウィング車102は複数のセンサ部303を有してもよいし、複数の種類のセンサ部303を有してもよい。
【0037】
駆動部304は、ウィング車102の走行及びウィングの開閉等の機能を有する。駆動部304は、例えば、内燃機関又は電動機のような原動機、原動機が発生した動力を車輪又はウィングに伝達する伝達装置、ウィング車102を所望の方向に走行させるための操舵装置等を含む。
【0038】
記憶装置305は、例えば、DRAM等の主記憶装置と、ハードディスクドライブ又はフラッシュメモリ等の補助記憶装置との組合せであってもよい。記憶装置305は、状況把握部306、動作決定部307、動作実行部308及びタスク情報310を保持する。
【0039】
状況把握部306、動作決定部307及び動作実行部308は、プロセッサ301によって実行されるプログラムである。以下の説明において上記の各部が実行する処理は、実際には、プロセッサ301が、記憶装置305に保持されたプログラムに従って、必要に応じて通信インターフェース302、センサ部303及び駆動部304等を制御することによって実行する。
【0040】
例えば、センサ部303によるセンシング機能と、センサ部303がセンシングした情報に基づいて、プロセッサ301が状況把握部306のプログラムに従って状況を把握する機能と、の全体を状況把握部306の機能として扱ってもよい。言い換えると、センサ部303を状況把握部306の一部と考えてもよい。通信インターフェース302が受信した情報が状況把握に利用される場合には、通信インターフェース302も状況把握部306の一部と考えてもよい。同様に、駆動部304を動作実行部308の一部と考えてもよい。
【0041】
なお、本実施例のウィング車102は、運転者なしで自動運転を行う自動運転機能、又は、運転者の運転を支援する運転支援機能を有する。上記の状況把握部306、動作決定部307及び動作実行部308の少なくとも一部は、自動運転機能又は運転支援機能の少なくとも一部として実装されてもよい。
【0042】
また、
図3では省略されているが、記憶装置305は、自動運転機能又は運転支援機能によって参照される地図データ等をさらに保持してもよい。
【0043】
タスク情報310は、ウィング車102が実行すべきタスクに関する情報である。例えば、タスク情報310は、ウィング車102が次に向かうべき倉庫又は出荷先の情報等を含んでもよい。
【0044】
図4は、本発明の実施例1の自律体システム100におけるフォークリフト103の構成を示すブロック図である。
【0045】
フォークリフト103は、ウィング車102からのパレット104の荷卸し、入荷エリア110、在庫エリア111及び出荷エリア112の間のパレット104の搬送、及び、ウィング車102へのパレット104の積み込み等を行う車両である。
【0046】
フォークリフト103は、プロセッサ401、通信インターフェース402、センサ部403、駆動部404及び記憶装置405を有する。
【0047】
プロセッサ401は、記憶装置405に格納されたプログラムに従って種々の処理を実行する。通信インターフェース402は、ネットワーク210に接続され、管制システム101と通信する。
【0048】
センサ部403は、フォークリフト103の周囲の状況を把握するための情報を取得する。センサ部403は、例えば光学カメラ、レーダー又はLIDAR等を含んでもよいし、マイクロフォンのような音声センサを含んでもよい。フォークリフト103は複数のセンサ部403を有してもよいし、複数の種類のセンサ部403を有してもよい。具体的には、センサ部403は、フォークリフト103の走行のために周囲の物体を検知するためのセンサ、及び、フォークの爪とパレット104との位置関係を計測するためのセンサ等を含んでもよい。
【0049】
駆動部404は、フォークリフト103の走行及びフォークによるパレット104の上げ下ろしの機能を有する。駆動部404は、例えば、内燃機関又は電動機のような原動機、原動機が発生した動力を車輪又はフォークに伝達する伝達装置、フォークリフト103を所望の方向に走行させるための操舵装置等を含む。
【0050】
記憶装置405は、例えば、DRAM等の主記憶装置と、ハードディスクドライブ又はフラッシュメモリ等の補助記憶装置との組合せであってもよい。記憶装置405は、状況把握部406、動作決定部407、動作実行部408及びタスク情報410を保持する。
【0051】
状況把握部406、動作決定部407及び動作実行部408は、プロセッサ401によって実行されるプログラムである。以下の説明において上記の各部が実行する処理は、実際には、プロセッサ401が、記憶装置405に保持されたプログラムに従って、必要に応じて通信インターフェース402、センサ部403及び駆動部404等を制御することによって実行する。
【0052】
例えば、センサ部403によるセンシング機能と、センサ部403がセンシングした情報に基づいて、プロセッサ401が状況把握部406のプログラムに従って状況を把握する機能と、の全体を状況把握部406の機能として扱ってもよい。言い換えると、センサ部403を状況把握部406の一部と考えてもよい。通信インターフェース402が受信した情報が状況把握に利用される場合には、通信インターフェース402も状況把握部406の一部と考えてもよい。同様に、駆動部404を動作実行部408の一部と考えてもよい。上記の各部の処理については後述する。
【0053】
なお、本実施例のフォークリフト103は、運転者なしで自動運転を行う自動運転機能、又は、運転者の運転を支援する運転支援機能を有する。上記の状況把握部406、動作決定部407及び動作実行部408の少なくとも一部は、自動運転機能又は運転支援機能の少なくとも一部として実装されてもよい。
【0054】
また、
図4では省略されているが、記憶装置405は、自動運転機能又は運転支援機能によって参照される倉庫内の地図データ等をさらに保持してもよい。
【0055】
タスク情報410は、フォークリフト103が実行すべきタスクに関する情報である。例えば、タスク情報410は、フォークリフト103が搬送すべきパレット104及びその搬送先を示す情報等を含んでもよい。
【0056】
図5は、本発明の実施例1の自律体システム100における管制システム101が実行する処理を示すフローチャートである。
【0057】
最初に、管制システム101の状況把握部204は、倉庫の状況を把握する(ステップ501)。例えば、状況把握部204は、各カメラ105から送信された画像データの画像認識等を行って、倉庫内の各エリアにおけるパレット104の配置、各ウィング車102の位置及び状態(例えば走行中であるか否か、駐車している場合はどこに駐車しているか、ウィングを開いているか否か等)、各フォークリフト103の位置及び状態(例えば走行中であるか否か、パレット104を積載しているか否か等)を把握してもよい。
【0058】
次に、管制システム101の動作決定部205は、管制システム101の動作を決定する(ステップ502)。具体的には、動作決定部205は、状況把握部204によって把握された状況が入力されると、それに基づいて、管制システム101の動作を決定する。ここで管制システム101の動作とは、例えば、各信号機106への信号の送信及び各フォークリフト103への指示の送信等である。例えば、動作決定部205は、状況把握部204が把握した状況に基づいて、ウィング車102の入荷エリア又は出荷エリアへの到着、及びウィングの開閉等を把握又は予測し、それに基づいてフォークリフト103がパレット104を取りに行く(又は積み込みに行く)タイミングを決定してもよい。あるいは、ウィング車102からの荷卸し又はウィング車102への物品の積み込みが終了し、フォークリフト103が荷台から離れた状況を把握して、ウィング車102がウィングを閉じて発車するタイミングを決定してもよい。
【0059】
具体的には、例えば、動作決定部205は、状況把握部204によって把握された状況を入力として、実行されるべき動作を出力とする関数を保持し、その関数を用いてステップ502を実行してもよい。この関数は、いかなるものであってもよいが、例えばニューラルネットワークによって実装されてもよい。
【0060】
次に、管制システム101の動作実行部206は、決定した動作を実行する(ステップ503)。例えば、ステップ502において各信号機106が表示すべき信号(例えばウィング車102の進行又は停止、ウィングの開閉等を示す信号)が決定された場合、動作実行部206は、通信インターフェース202及びネットワーク210を介して、決定された信号を表示させる指示を各信号機106に送信する。また、ステップ502において各フォークリフト103に送信すべき情報(例えば各フォークリフト103の行き先、搬送すべきパレットの識別情報等)が決定された場合、動作実行部206は、通信インターフェース202及びネットワーク210を介して、決定された情報を各フォークリフト103に送信する。
【0061】
その後、処理はステップ501に戻り、上記のステップ501から503の処理が繰り返し実行される。
【0062】
なお、動作決定部205は、いずれかのタイミングで(例えば、学習に使用できる十分な量のデータが蓄積されたと判定された時点で)、動作の決定を最適化するための学習処理を行ってもよい。例えば、動作決定部205は、管制システム101に設定されたKPI(Key Performance Indicator)を保持し、その値が向上する(すなわち高い評価を示す値となる)ように関数のパラメータを変更してもよい。
【0063】
ここで、動作決定部205が実行する学習処理の一例を説明する。管制システム101に設定されたKPI(すなわち管制システム101のパフォーマンスを評価するパラメータ)は、例えば、倉庫全体のスループット又は売上高等である。動作決定部205は、例えば、ステップ502において決定した動作が実行された後のKPIに基づいて、KPIを向上させる(例えばスループット又は売上高等が向上する)ように、ステップ502で用いられる関数のパラメータを変更してもよい。このようにして学習された関数を用いることによって、ステップ502では、KPIが向上するような動作が決定される。
【0064】
図6は、本発明の実施例1の自律体システム100におけるウィング車102が実行する処理を示すフローチャートである。
【0065】
最初に、ウィング車102の状況把握部306は、当該ウィング車102の周囲の状況を把握する(ステップ601)。例えば、状況把握部306は、センサ部303によって取得された情報に基づいて、当該ウィング車102の周囲の物体の識別、当該ウィング車102が荷卸し又は積み込みを行う入荷エリア110又は出荷エリア112の状況、及び、当該ウィング車102から視認できる信号機106の表示内容の識別等を行ってもよい。
【0066】
次に、ウィング車102の動作決定部307は、ウィング車102の動作を決定する(ステップ602)。具体的には、動作決定部307は、状況把握部306によって把握された状況が入力されると、それに基づいて、ウィング車102の動作を決定する。ここでウィング車102の動作とは、例えば、入荷エリア110又は出荷エリア112への駐車及びそれらのエリアからの離脱、のための走行、停止及び操舵、並びに、ウィングの開閉等である。
【0067】
具体的には、例えば、動作決定部307は、状況把握部306によって把握された状況を入力として、実行されるべき動作を出力とする関数を保持し、その関数を用いてステップ602を実行してもよい。この関数は、いかなるものであってもよいが、例えばニューラルネットワークによって実装されてもよい。
【0068】
次に、ウィング車102の動作実行部308は、決定した動作を実行する(ステップ603)。例えば、ステップ602においてウィング車102の走行、停止、操舵又はウィングの開閉が決定された場合、動作実行部308は、決定された動作を実行する指示を駆動部304に送信する。
【0069】
その後、処理はステップ601に戻り、上記のステップ601から603の処理が繰り返し実行される。
【0070】
なお、動作決定部307は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。例えば、動作決定部307は、ウィング車102に設定されたKPIを保持し、その値が向上する(すなわち高い評価を示す値となる)ように関数のパラメータを変更してもよい。
【0071】
ここで、動作決定部307が実行する学習処理の一例を説明する。ウィング車102に設定されたKPI(すなわちウィング車102のパフォーマンスを評価するパラメータ)は、例えば、ウィング車102の倉庫における滞在時間が短いほど評価が高くなるように設定される。動作決定部307は、例えば、ステップ602において決定した動作が実行された後に算出されたKPIに基づいて、KPIを向上させる(例えば滞在時間が短くなる)ように、ステップ602で用いられる関数のパラメータを変更してもよい。
【0072】
より詳細には、例えば、動作決定部307は、センサ部303が取得した情報に基づいて状況把握部306が把握した周囲の状況を関数に入力して、その出力に基づいて動作を決定する。このとき、把握された周囲の状況には、ウィング車102の周囲の物体の認識結果等の他に、当該ウィング車102に向けて出力された信号機106の信号の表示内容の認識結果が含まれる。信号機106の表示内容は、管制システム101の動作結果であり、管制システム101が管制システム101のKPIを向上させるために当該ウィング車102が行うべきであると判断した動作を指示するものである。
【0073】
しかし、このような管制システム101からの指示をそのまま実行することで当該ウィング車102のKPIが向上するとは限らない。これは、例えば使用しているセンサの種類及び設置位置等の違いのために、管制システム101が取得できる倉庫の状況と、ウィング車102が取得できる周囲の状況とが必ずしも一致しないこと、及び、管制システム101がウィング車102のKPIを把握していないことに起因する。ウィング車102に設定されたKPIは一般には管制システム101に設定されたものとは異なる。また、複数のウィング車102のそれぞれに異なるKPIが設定されている場合もある。
【0074】
このため、動作決定部307は、例えば、周囲の状況のうち管制システム101の動作結果を認識した結果と、それ以外の状況と、のそれぞれに与える重みを、ウィング車102に設定されたKPIが向上するように変更することによって、ステップ602で用いられるパラメータを変更してもよい。このようにして学習された関数を用いることによって、ステップ602では、KPIが向上するような動作が決定される。
【0075】
図7は、本発明の実施例1の自律体システム100におけるフォークリフト103が実行する処理を示すフローチャートである。
【0076】
最初に、フォークリフト103の状況把握部406は、当該フォークリフト103の周囲の状況を把握する(ステップ701)。例えば、状況把握部406は、センサ部403によって取得された情報、及び、通信インターフェース402が管制システム101から受信した情報に基づいて、当該フォークリフト103の周囲の物体の識別、ウィング車の荷台の状況、荷台のパレットの状況、入荷エリア及び出荷エリアの状況、並びに、管制システム101の動作結果の識別等を行ってもよい。
【0077】
次に、フォークリフト103の動作決定部407は、フォークリフト103の動作を決定する(ステップ702)。具体的には、動作決定部407は、状況把握部406によって把握された状況が入力されると、それに基づいて、フォークリフト103の動作を決定する。ここでフォークリフト103の動作とは、例えば、パレットの位置までの移動、パレットへのフォークのツメの差し込み及び持ち上げ、パレットの搬送先までの移動、並びに、搬送先にパレットを置く動作等である。
【0078】
具体的には、例えば、動作決定部407は、状況把握部406によって把握された状況を入力として、実行されるべき動作を出力とする関数を保持し、その関数を用いてステップ702を実行してもよい。この関数は、いかなるものであってもよいが、例えばニューラルネットワークによって実装されてもよい。
【0079】
次に、フォークリフト103の動作実行部408は、決定した動作を実行する(ステップ703)。例えば、ステップ702においてフォークリフト103の走行、停止、操舵又はフォークの上げ下げが決定された場合、動作実行部408は、決定された動作を実行する指示を駆動部404に送信する。
【0080】
その後、処理はステップ701に戻り、上記のステップ701から703の処理が繰り返し実行される。
【0081】
なお、動作決定部407は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。例えば、動作決定部407は、フォークリフト103に設定されたKPIを保持し、その値が向上する(すなわち高い評価を示す値となる)ように関数のパラメータを変更してもよい。
【0082】
ここで、動作決定部407が実行する学習処理の一例を説明する。フォークリフト103に設定されたKPI(すなわちフォークリフト103のパフォーマンスを評価するパラメータ)は、例えば、フォークリフト103が効率的に作業をするほど、又は、確実に作業をするほど、評価が高くなるように設定される。作業の効率は、例えば単位時間当たりの作業量(搬送した物品の量又は移動距離等)によって計測されてもよい。また、作業の確実性は、例えば単位時間当たりの緊急停止回数等によって計測されてもよい。
【0083】
動作決定部407は、例えば、ステップ702において決定した動作が実行された後に算出されたKPIに基づいて、KPIを向上させる(例えば作業の効率が向上する)ように、ステップ702で用いられる関数のパラメータを変更してもよい。
【0084】
より詳細には、例えば、動作決定部407は、センサ部403が取得した情報及び通信インターフェース402を介して受信した情報に基づいて状況把握部406が把握した周囲の状況を関数に入力して、その出力に基づいて動作を決定する。このとき、把握された周囲の状況には、フォークリフト103の周囲の物体の認識結果等の他に、当該フォークリフト103に向けて管制システム101から送信された情報が含まれる。管制システムから送信された情報は、管制システム101の動作結果であり、例えば、管制システム101が管制システム101のKPIを向上させるために当該フォークリフト103が行うべきであると判断した動作を指示するものである。
【0085】
しかし、このような管制システム101からの指示をそのまま実行することで当該フォークリフト103のKPIが向上するとは限らない。これは、例えば使用しているセンサの種類及び設置位置等の違いのために、管制システム101が取得できる倉庫の状況と、フォークリフト103が取得できる周囲の状況とが必ずしも一致しないこと、及び、管制システム101がフォークリフト103のKPIを把握していないことに起因する。フォークリフト103に設定されたKPIは一般には管制システム101に設定されたものとは異なる。また、複数のフォークリフト103のそれぞれに異なるKPIが設定されている場合もある。
【0086】
このため、動作決定部307は、例えば、周囲の状況のうち管制システム101の動作結果を認識した結果と、それ以外の状況と、のそれぞれに与える重みを、フォークリフト103に設定されたKPIが向上するように変更することによって、ステップ702で用いられるパラメータを変更してもよい。このようにして学習された関数を用いることによって、ステップ702では、KPIが向上するような動作が決定される。
【0087】
管制システム101、ウィング車102及びフォークリフト103がそれぞれに
図5から
図7に示したような方法で関数を学習することによって、各々が互いのKPIを把握していなくても、それぞれのKPIが向上するようにそれぞれの動作を決定することができる。
【0088】
例えば、管制システム101は、カメラ105が撮影した画像から把握した倉庫の状況に基づいて、KPI(例えば倉庫のスループット)が向上するように、各ウィング車102及び各フォークリフト103に情報を提供する。例えば、管制システム101は、入荷エリア110にウィング車102が到着したことを把握すると、荷卸しのために入荷エリア110に行くことを指示する情報を各フォークリフト103に送信してもよい。
【0089】
この情報を受信したフォークリフト103は、この情報と、自らのセンサ部403を介して把握した周囲の状況と、タスク情報410と、に基づいて、自らに設定されたKPI(例えば作業効率)が向上するように、自らの動作を決定する。その結果、フォークリフト103は、受信した情報に含まれる指示に従って入荷エリア110に移動してもよいし、従わずに他の動作を行ってもよい。
【0090】
例えば、フォークリフト103は、既に他のパレット104を搬送中である場合、指示に従わずに当該パレット104の搬送を継続してもよい。また、フォークリフト103の現在地が入荷エリア110から遠い場合には、自らに設定されたKPIを向上させるために指示に従うことが適切でないと判断して、指示に従わずに別の動作を行ってもよい。
【0091】
あるいは、例えば倉庫内で複数の機種のフォークリフト103が使用されており、機種によって搬送できるパレット104の条件(例えば重量等)が異なる場合がある。このような場合に、フォークリフト103が到着したウィング車102に積まれている物品に関する情報を取得できたとすると、フォークリフト103は、自らが搬送できないパレットを積んだウィング車102が到着した場合には、管制システム101からの指示を受けたとしてもそのウィング車102からの荷卸しを行わないという決定をすることができる。
【0092】
あるいは、例えば管制システム101が倉庫内の画像から特定のエリアにおけるフォークリフト103の混雑を検出した場合に、その混雑を解消してKPIを向上させるために、混雑に関与しているフォークリフト103に対して当該エリアから離れるように移動の指示を送信してもよい。この指示を受けたフォークリフト103は、指示に従って移動してもよいし、指示に従うことによってフォークリフト103のKPIが悪化すると判断して指示に従わないという決定をしてもよい。
【0093】
このように、管制システム101からフォークリフト103への指示は、必ず従わせるためのものではなく、フォークリフト103の動作の決定に緩やかに働きかけるものである。
【0094】
ウィング車102も同様に、信号機106を介して受け取った管制システム101からの指示に沿った動作を行うことを決定してもよいし、自らに設定されたKPIを向上させるためにその指示に反する動作を行うことを決定してもよい。
【0095】
このように、管制システム101が自らの動作を決定してそれを実行(すなわちそれぞれの下位の自律体に対する指示の内容を決定してそれを送信)すると、ある自律体はその指示に沿った動作を行い、別のある自律体はその指示に反する動作を行う場合がある。その結果、倉庫内の状態が変化する。管制システム101は、変化した倉庫内の状況を把握して、KPIの値を算出する。管制システム101は、先に把握した状況と、それに基づいて決定した動作と、その動作を実行した後の状況に基づいて算出されたKPIの値と、に基づいて、KPIの値が向上するように、把握した状況から動作を決定するための関数のパラメータを学習してもよい。
【0096】
例えば、当初の管制システム101は、入荷エリア110にウィング車102が到着したときに、全てのフォークリフト103に入荷エリア110への移動を指示してもよい。しかし、学習の結果、管制システム101は、パレット104を搬送中でないフォークリフト103、入荷エリア110の近くにいるフォークリフト103、又は、到着したウィング車102に積まれているパレットの条件に合致するフォークリフト103に移動の指示を送信しやすくなることが考えられる。
【0097】
このように、管制システム101は、事前に下位の各自律体の特性等(KPIを含む)を把握していなくても、各自律体に緩やかに働きかけて、その結果を学習することによって、下位の各自律体が自らに設定されたKPIに照らして受け入れやすい指示を出すことができるようになる。これによって、管制システム101の(すなわち自律体システム100全体の)KPIの向上に寄与し、かつ、各自律体のKPIの向上にも寄与するように、各自律体の動作を決定することができる。
【0098】
なお、このような学習を行うために、管制システム101は、ある程度の割合で、あえて自らに設定されたKPIの値を悪化させるような指示、又は、各自律体が受け入れ難いことが予想される指示を送信してもよい。
【0099】
一方、下位の自律体について言えば、例えばフォークリフト103は、センサ部403から取得された周囲の状況と、通信インターフェース402が受信した管制システム101からの指示と、に従って、自らのKPIを向上させるように、指示に沿った動作を行う場合もあり、指示に反する動作を行う場合もある。フォークリフト103は、決定した動作を行った後で、その動作が反映された状況に基づいて、自らに設定されたKPIの値を算出する。フォークリフト103は、先に把握した状況と、それに基づいて決定した動作と、その動作を実行した後の状況に基づいて算出されたKPIの値と、に基づいて、KPIの値が向上するように、把握した状況から動作を決定するための関数のパラメータを学習してもよい。
【0100】
ここで、関数のパラメータは、センサ部403を介して把握した状況と、管制システム101からの指示と、のそれぞれに付される重みを含んでもよい。また、このような学習を行うために、フォークリフト103は、あえて自らに設定されたKPIの値を悪化させるような動作を決定してもよい。
【0101】
ウィング車102については、上記のフォークリフト103と同様である。
【0102】
上記のように上位及び下位の自律体がそれぞれに学習を行うことによって、各自律体が他の自律体の特性等を把握していなくても(いわば、上位の自律体から見た下位の自律体がブラックボックスであっても)、各自律体のKPIが向上し、かつ、全体としてのKPIも向上するように、各自律体の行動を決定することが可能になる。これによって、全体の情報を統合したり、全体の無矛盾性及び同期を保証したりする必要がなくなり、ロバストな動作が実現される。また、未知の下位の自律体が追加されたり、既にある下位の自律体の特性が変化したりしても、上位の自律体がそれに適応できるため、自律体システムの継続的な進化が可能になる。
【0103】
また、上記の信号機106のような情報伝達手段を利用すれば、下位の自律体は上位の自律体に対するインターフェースを明示的に持つ必要がなくなる。これによって、例えば当初は想定されていなかった品種の(例えば他の自律体とは製造者が異なる)自律体も容易に接続することが可能になる。
【0104】
上記の例では、ウィング車102への指示は信号機106を介して伝達され、フォークリフト103への指示は通信インターフェース402を介して伝達される。この例では、ウィング車102は通信インターフェース302を持たなくてもよい。これによって、事前に詳細な通信手順などを決めておくことなく、管制システム101からフォークリフト103への情報伝達が可能になる。
【0105】
しかし、このような情報伝達方法は一例である。例えばウィング車102への情報伝達が通信インターフェース302を介して行われてもよい。あるいは、倉庫内の各所に信号機106と同様の信号機が設けられ、それを介してフォークリフト103への情報伝達が行われてもよい。
【0106】
また、上記の例では、ウィング車102及びフォークリフト103のいずれも、自動運転機能又は運転支援機能を有しているが、それらの少なくとも一部は自動運転機能及び運転支援機能のいずれも有しなくてもよい。例えば、いずれかのウィング車102は、プロセッサ301、通信インターフェース302、センサ部303及び記憶装置305を有しなくてもよい。その場合、当該ウィング車102の運転者(すなわち人間)が、駆動部304を操作してウィング車102の走行及びウィングの開閉を制御する。また、通信インターフェース302及びセンサ部303は運転者の感覚器(例えば目及び耳等)によって代替される。また、状況把握部306、動作決定部307及び動作実行部308の機能は運転者の知能によって代替される。
【0107】
この場合でも、運転者は、信号機106を参照することで管制システム101からの指示を受け取ることができる。また、この場合、ウィング車102に設定されたKPIは、例えば運転者が早く業務を終わらせたい、又は、確実に業務を遂行したい、といったものであってもよい。
【0108】
フォークリフト103も、同様に、人間が運転するものであってもよい。その場合、信号機を介して管制システム101からの指示が伝達されてもよいし、通信インターフェース402を介して受信した指示が、フォークリフト103の表示部(図示省略)に表示され、運転者がそれを見て指示を受け取ってもよい。
【0109】
また、実施例1の自律体システムは下位の自律体として複数のウィング車102及び複数のフォークリフト103を含むが、実際には、いずれか一方のみを含んでもよいし、さらに別の自律体を含んでもよい。例えば、倉庫内に物品をピッキングするロボットが設置される場合に、そのロボットが第2の種類の自律体として追加されてもよい。あるいは、在庫エリア111で物品を保管する棚をピッキングエリア等に搬送するための自動搬送車が使用される場合には、そのような自動搬送車が第2の種類の自律体として追加されてもよい。その場合、第2の種類の自律体もウィング車102及びフォークリフト103と同様に何らかのKPIが設定され、上記と同様の処理を実行する。
【0110】
また、複数のウィング車102は、例えば製造者が異なる複数の種類の車両を含んでもよいし、それぞれに異なるKPIが設定されていてもよい。複数のフォークリフト103についても同様である。
【0111】
以上の実施例1によれば、管制システム101がカメラ105等を介して把握した倉庫の状況に従って、管制システム101のKPIを向上させるために有効と判断される情報を下位の自律体(例えばウィング車102及びフォークリフト103)に提供する。これによって、例えば、フォークリフト103がウィング車102の荷台にアクセスするタイミングを当該ウィング車102及びその周囲の実際の状況にあわせて正確に知ることができる。このため、フォークリフト103の待ち時間等が減少し、荷卸し及び積み込みの作業時間が短縮される。また、ウィング車102が荷卸し及び物品の積み込みの実際の状況に合わせて、発車するタイミングを正確に知ることができる。このため、ウィング車102の停車時間が短縮される。
【0112】
管制システム101のような上位の自律体がなく、下位の自律体が情報を直接交換する自律体システムでは、以下の理由によって、上記のような効果を得ることは困難である。すなわち、上位の自律体がないシステムでは、各ウィング車102及び各フォークリフト103がそれぞれ自車のセンサによって取得した情報に基づいて、それぞれに設定されたKPIを向上させるための動作を決定する。しかし、それぞれのセンサからは限られた範囲内の情報しか得られないため、取得した情報と実際の倉庫の状況との間に乖離が発生し、その結果としてKPIが向上しない場合がある。
【0113】
一方、本実施例によれば、管制システム101が倉庫全体の(すなわち自律体システム全体の)状況を把握してそれに基づいて全体のKPIを向上させるために望ましい各自律体の動作を通知することができるため、全体のKPIを向上させることができる。
【0114】
また、ウィング車102とフォークリフト103との間で直接情報をやり取りするために互いの通信手段を予め決めておく必要がある。しかし、実際には、例えばフォークリフト103が倉庫の所有者によって管理されるのに対してウィング車102は運送会社によって管理されるなど、管理者が異なる場合があり、通信手段を予め決めておくことが現実的には困難である。しかし、本実施例によれば、例えば信号機106等の情報伝達手段を用いることによって、予め通信手段を決めておかなくても必要な情報を提供することが可能になる。
【実施例2】
【0115】
次に、本発明の実施例2を説明する。以下に説明する相違点を除き、実施例2の自律体システムの各部は、
図1~
図7に示された実施例1の同一の符号を付された各部と同一の機能を有するため、それらの説明は省略する。
【0116】
図8は、本発明の実施例2の自律体システム800の全体構成を示す説明図である。
【0117】
実施例2の自律体システム800は、棚804に格納された物品805を取り出して仕分け用の箱806に詰めるピッキング作業を行うロボットシステムである。この自律体システム800は、自律体として、アーム・リフタ統合管理システム801、アームロボット802及びリフタ803を含む。
【0118】
アームロボット802は、例えば垂直多関節ロボットであり、棚804に格納された物品805の取り出し、その物品805を箱806へ詰め込む。このために、アームロボット802は、周囲の状況として棚804に積まれた物品805の状況を把握する。この状況の把握のために、アームロボット802に設置されたセンサ(例えばカメラ等)が使用される。アームロボット802の動作の決定はアームロボット802の知能(例えば後述するアームロボット802の動作決定部307)によって行われる。
【0119】
アームロボット802の構成は、以下の相違点を除いて、
図3に示した実施例1のウィング車102又は
図4に示した実施例1のフォークリフト103の構成と同様である。ここでは、
図3を参照してアームロボット802の構成を説明する。
【0120】
アームロボット802の通信インターフェース302は、ネットワーク210を介してアーム・リフタ統合管理システム801と通信する。アームロボット802のセンサ部303は、例えばアームロボット802に取り付けられたカメラである。このカメラが棚804の方向を撮影した画像に基づいて、アームロボット802の状況把握部306が棚804に積まれた物品805の状況を把握する。さらに、アームロボット802の状況把握部306は、アーム・リフタ統合管理システム801から伝達されたメッセージ(例えば、後述する、リフタ803が所望の高さまで持ち上がったことを示す情報)を把握する。
【0121】
また、アームロボット802の駆動部304は、アームロボット802のアーム807の関節808及びアーム807の先端のハンド部809を駆動するモータ(図示省略)等を含む。
【0122】
タスク情報310は、例えば、アームロボット802が取りだすべき物品を識別する情報等を含む。動作決定部307は、例えば、通信インターフェース302を介して取得した、アーム・リフタ統合管理システム801からの情報と、センサ部303によるセンシングの結果から把握される状態と、タスク情報310と、に基づいて、所望の物品805を取りだすための各関節808及びハンド部809の動作を決定する。そして、動作実行部308が、駆動部304を介して、決定された動作を実行する。
【0123】
また、動作決定部307は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。これらの処理の流れは、
図6に示したウィング車102の処理の流れと同様である。なお、アームロボット802に設定されるKPIは、例えば、作業の効率である。
【0124】
リフタ803は、アームロボット802を所定の範囲内の任意の高さに移動させる機能を有する。このために、リフタ803は、周囲の状況として棚804の状況を把握する。この状況の把握のために、リフタ803に設置されたセンサ(例えばカメラ等)が使用される。リフタ803の動作の決定はリフタ803の知能(例えば後述するリフタ803の動作決定部407)によって行われる。
【0125】
リフタ803の構成は、以下の相違点を除いて、
図3に示した実施例1のウィング車102又は
図4に示した実施例1のフォークリフト103の構成と同様である。ここでは、
図4を参照してリフタ803の構成を説明する。
【0126】
リフタ803の通信インターフェース402は、ネットワーク210を介してアーム・リフタ統合管理システム801と通信する。リフタ803のセンサ部403は、例えばリフタ803に取り付けられたカメラである。このカメラが棚804の方向を撮影した画像に基づいて、状況把握部406が棚804の状況を把握する。さらに、リフタ803の状況把握部406は、アーム・リフタ統合管理システム801から伝達されたメッセージ(例えば、後述する、アームロボット802を持ち上げるべき高さを示す情報)を把握する。また、リフタ803の駆動部404は、リフタ803を上下方向に駆動するモータ(図示省略)等を含む。
【0127】
タスク情報410は、例えば、アームロボット802が取り出すべき物品が格納された棚の位置を示す情報等を含んでもよい。動作決定部407は、例えば、通信インターフェース402を介して取得した、アーム・リフタ統合管理システム801からの情報と、センサ部403によるセンシングの結果から把握される状態と、タスク情報410と、に基づいて、アームロボット802が所望の物品805を取りだすために適切なリフタ803の高さを決定する。そして、動作実行部408が、駆動部304を介して、決定された動作(例えば決定された高さまでのアームロボット802の持ち上げ)を実行する。
【0128】
また、動作決定部407は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。これらの処理の流れは、
図7に示したフォークリフト103の処理の流れと同様である。なお、リフタ803に設定されるKPIは、例えば、上下方向の移動回数の少なさ(すなわち、上下方向の移動回数が少ないほど評価が高くなる)である。
【0129】
アーム・リフタ統合管理システム801は、アームロボット802及びリフタ803と通信してそれらを管理する計算機である。アーム・リフタ統合管理システム801の構成は、以下の相違点を除いて、
図2に示した実施例1の管制システム101の構成と同様である。ここで、
図2を参照してアーム・リフタ統合管理システム801の構成を説明する。
【0130】
アーム・リフタ統合管理システム801の通信インターフェース202は、ネットワーク210を介してアームロボット802及びリフタ803と通信する。さらに、ネットワーク210には一つ以上のカメラ105が接続される。ただし、カメラ105はネットワーク210を介さずにアーム・リフタ統合管理システム801に接続されてもよい。各カメラ105は、自律体システム800の全体を撮影してもよいし、自律体システム800の所定の部分を撮影してもよいし、自律体システム800の周囲(例えば棚804及び物品805)を撮影してもよい。このカメラ105は、自律体システム800の状況を把握するためのセンサの一例であり、他の種類のセンサが使用されてもよい。
【0131】
状況把握部204は、カメラ105が撮影した画像に基づいて、自律体システム800の状況を把握する。ここで把握される状況は、例えば、棚804の状況、棚804に格納された物品805の状況、アームロボット802の状況及びリフタ803の状況である。
【0132】
タスク情報208は、例えば、アームロボット802が取り出すべき物品を識別する情報及びその物品が格納された棚の位置を示す情報等を含んでもよい。動作決定部205は、カメラ105によって撮影された画像から把握される状況と、タスク情報208と、に基づいて、棚804のどの位置に目的の物品805があるかを把握する。そして、動作決定部205は、アームロボット802が目的の物品805を取りだすために適切なリフタ803の高さ(すなわちアームロボット802を持ち上げるべき高さ)を決定する。動作実行部206は、通信インターフェース202を介して決定された高さをリフタ803に伝達する。続いて、動作実行部206は、リフタ803がアームロボット802を決定された高さまで持ち上げたことをアームロボット802に伝達する。
【0133】
アームロボット802は、目的の物品805を掴む動作を行う。その結果、目的の物品805をつかめなかった場合は、状況把握部204がカメラ105からの情報に従ってそのことを把握する。動作決定部205は、把握された情報に基づいて、リフタ803の高さが適切でなかったと判断して、より適切なリフタ803の高さを決定し、動作実行部206がその高さをリフタ803に伝達する。
【0134】
また、動作決定部205は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。これらの処理の流れは、
図5に示した管制システム101の処理の流れと同様である。なお、アーム・リフタ統合管理システム801に設定されるKPIは、例えば、自律体システム800全体としての作業の効率である。
【0135】
なお、本実施例の自律体システム800は、より大きな自律体システム一部であってもよい。例えば、実施例2の自律体システム800は、実施例1の自律体システム100の倉庫に、棚からの物品のピッキングを行うロボットとして組み込まれてもよい。その場合、実施例2のアーム・リフタ統合管理システム801は、アームロボット802及びリフタ803に対しては上位の自律体として動作し、管制システム101に対しては下位の自律体として動作する。
【0136】
また、上記の例ではアームロボット802を一つの下位の自律体として扱ったが、実際にはアームロボット802が上位の自律体と下位の自律体とからなる自律体システムであってもよい。例えば、下位の自律体は、それぞれの関節808の状況を把握するセンサ部、それから得られた情報に基づいて動作を決定する動作決定部、及び、決定した動作に従って関節を駆動する駆動部等を有してもよい。一方、上位の自律体は、アームロボット802全体及びその周囲の状況を把握するセンサ部、それから得られた情報に基づいて動作を決定する動作決定部、及び、決定した動作を各関節808に伝達する動作実行部等を有してもよい。
【0137】
このように、本発明が適用される自律体システムは、3以上の階層を有してもよい。その場合でも、上記の実施例1及び実施例2に説明したように、それぞれの自律体が、それぞれに設定されたKPIが向上するように学習した結果に基づいて、それぞれが取得した情報からそれぞれの動作を決定することによって、個々の自律体のKPIを向上させながら、自律体システム全体としてのKPIも向上するような動作を行うことができる。また、そのような自律体システムを、上位と下位の自律体のインターフェースの詳細な取り決めを必要とせず、事前の情報の統合等を必要とせず、下位の自律体の構成が変化しても上位の自律体が適応できる、柔軟なシステムとして構築することができる。
【0138】
以上の実施例2によれば、アーム・リフタ統合管理システム801がカメラ105等を介して把握した倉庫の状況に従って、アーム・リフタ統合管理システム801のKPIを向上させるために有効と判断される情報を下位の自律体(例えばアームロボット802及びリフタ803)に提供する。これによって、例えば、リフタ803は、どの高さまでアームロボット802を持ちあげればよいか、リフタ803自身では判断できないものを知ることができる。また、アームロボット802は、おおよそどの位置に目的の物品805が置かれているかを予め知ることができる。このため、リフタ803によって持ち上げられたときに目的の物品805を見つけやすい。言い換えると、目的の物品805を見つけるまでの時間を短縮することができ、また、確実に見つけることができる。
【0139】
アーム・リフタ統合管理システム801のような上位の自律体がなく、下位の自律体が情報を直接交換する自律体システムでは、以下の理由によって、上記のような効果を得ることは困難である。すなわち、上位の自律体がないシステムでは、リフタ803は、まだアームロボット802を持ち上げていない状態では、センサ部403を介して棚804の上の段の状態を知ることができない。同様に、まだ持ち上げられていないアームロボット802は、センサ部303を介して棚の中の物品を把握することができない。
【0140】
一方、本実施例によれば、アーム・リフタ統合管理システム801が自律体システム800全体及びその周囲の状況を把握してそれに基づいて全体のKPIを向上させるために望ましい各自律体の動作を通知することができるため、全体のKPIを向上させることができる。
【実施例3】
【0141】
次に、本発明の実施例3を説明する。以下に説明する相違点を除き、実施例3の自律体システムの各部は、
図1~
図7に示された実施例1の同一の符号を付された各部と同一の機能を有するため、それらの説明は省略する。
【0142】
図9は、本発明の実施例3の自律体システム900の全体構成を示す説明図である。
【0143】
実施例3の自律体システム900は、自律体として、自動運転車902、人が運転する自動車903及びそれらが利用する駐車場904を管制する駐車場内管制システム901を含む駐車場システムである。
【0144】
駐車場内管制システム901は、広い駐車場904内で、車両(例えば一つ以上の自動運転車902及び一つ以上の人が運転する自動車903を含む)がどこをどれだけの速度で走行しているか、駐車場内の路上(すなわち、駐車領域906以外の、車両が移動するための領域)をどのように占有しているか、といったことを監視する。さらに、駐車場内管制システム901は、駐車領域906のどの区画が空いているかを監視する。そして、駐車場内管制システム901は、上記の監視結果を把握して、自動運転車902及び人が運転する自動車903に対して緩やかな制御を行う。
【0145】
駐車場904には、例えば、一つ以上の案内表示板908が設けられる。これは、駐車場内管制システム901からの情報を自動運転車902及び人が運転する自動車903に伝達する手段の一例である。
【0146】
自動運転車902の構成は、以下の相違点を除いて、
図3に示した実施例1のウィング車102の構成と同様である。ここで、
図3を参照して自動運転車902の構成を説明する。
【0147】
自動運転車902の通信インターフェース302は、ネットワーク210を介して駐車場内管制システム901と通信する。自動運転車902のセンサ部303は、例えば自動運転車902に取り付けられ、自動運転車902の周囲を撮影するカメラ又は距離センサ等である。ここではカメラの例を説明する。自動運転車902の状況把握部306は、カメラが撮影した画像に基づいて、駐車場904内の自車の周囲の状況を把握する。
【0148】
さらに、自動運転車902の状況把握部306は、駐車場内管制システム901から伝達された情報(例えば、駐車場904内の状況、移動先の区画及びそこまでの経路の情報等)を把握する。状況把握部306は、この情報を、センサ部303のカメラ等によって取得された情報(例えば案内表示板908の表示内容の認識結果)から把握してもよいし、通信インターフェース302を介して取得した情報から把握してもよい。
【0149】
また、自動運転車902の駆動部304は、例えば、内燃機関又は電動機のような原動機、原動機が発生した動力を車輪に伝達する伝達装置、自動運転車902を所望の方向に走行させるための操舵装置等を含む。
【0150】
タスク情報310は、例えば、駐車可能な区画を探してそこに自車を移動させる、といった情報を含む。動作決定部307は、例えば、通信インターフェース302又はセンサ部303を介して取得した、駐車場内管制システム901からの情報と、センサ部303によるセンシングの結果から把握される状態と、タスク情報310と、に基づいて、進行、停止及び操舵量等の動作を決定する。そして、動作実行部308が、駆動部304を介して、決定された動作を実行する。
【0151】
また、動作決定部307は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。これらの処理の流れは、
図6に示したウィング車102の処理の流れと同様である。なお、自動運転車902に設定されるKPIは、例えば、燃料(又は電力)の消費量を最小にしたい、又は、自車を駐車する区画及びそこまでの経路を指示してほしい、といったものである。
【0152】
なお、自動運転車902は、人による操作を必要とせずに走行できる完全な自動運転機能を有してもよいし、人の運転の一部を支援する運転支援機能を有してもよい。また、実施例1のウィング車102の場合と同様、上記の状況把握部306、動作決定部307及び動作実行部308の機能の少なくとも一部は、自動運転機能又は運転支援機能の少なくとも一部として実装されてもよい。
【0153】
人が運転する自動車903の構成は、以下の相違点を除いて、自動運転車902の構成と同様である。すなわち、人が運転する自動車903は、プロセッサ301、通信インターフェース302、センサ部303及び記憶装置305を有しなくてもよい。自動運転車902における状況把握部306、動作決定部307及び動作実行部308に相当する機能は、人が運転する自動車903においては、運転者の知能によって置き換えられる。タスク情報310は運転者によって記憶される。また、センサ部303は、運転者の感覚器(例えば目及び耳等)によって置き換えられる。
【0154】
なお、人が運転する自動車903に設定されるKPIは、自動運転車902に設定されるものと同様のものであってもよいが、それとは逆に、例えば、自車を駐車する区画及びそこまでの経路を指示してほしくない、といったものであってもよいし、人の出口に近いところに駐車したい、又は日陰に駐車したい、といったものであってもよい。
【0155】
駐車場内管制システム901は、駐車場904内を監視して、自動運転車902及び人が運転する自動車903に対して緩やかな制御を行う計算機である。駐車場内管制システム901の構成は、以下の相違点を除いて、
図2に示した実施例1の管制システム101の構成と同様である。ここで、
図2を参照して駐車場内管制システム901の構成を説明する。
【0156】
ネットワーク210にはそれぞれが駐車場904の少なくとも一部の領域を撮影する一つ以上のカメラ105が接続される。各カメラ105は、それぞれ適切な場所に据え付けられた固定カメラであってもよいが、カメラ付きドローンのように移動するカメラであってもよい。このカメラ105は、自律体システム900の状況を把握するためのセンサの一例であり、他の種類のセンサが使用されてもよい。
【0157】
さらに、ネットワーク210には案内表示板908が接続される。これは、駐車場内管制システム901が各車両を制御するための情報伝達手段の一例である。このような情報伝達手段の他の例としては、駐車場904内の各所に設けられた、実施例1と同様の信号機等が挙げられる。
【0158】
状況把握部204は、カメラ105が撮影した画像に基づいて、自律体システム900の状況を把握する。ここで把握される状況は、例えば、各車両がどこをどれだけの速度で走行しているか、駐車場内の路上をどのように占有しているか、といった状況である。
【0159】
タスク情報208は、例えば、駐車場904に入ってきた車両を、駐車場904内の空き区画に誘導する、及び、いずれかの区画から出た車両を駐車場904の出口に誘導する、といったものであってもよい。動作決定部205は、カメラ105によって撮影された画像から把握される駐車場904の状況(例えば駐車場904内の各車両の状況)と、タスク情報208と、に基づいて、駐車場904内に渋滞が発生しないように、及び、各車両が早く、現在位置の近くに駐車できるように、各車両の制御を決定し、動作実行部206がその制御を実行する。制御は、例えば、案内表示板908への情報の表示によって行われる。車両がネットワーク210に接続された通信インターフェース302を介して情報を受信可能である場合には、動作実行部206は、通信インターフェース202及びネットワーク210を介して制御情報を伝達してもよい。
【0160】
なお、
図9には一つの案内表示板908のみを示しているが、実際には駐車場904に複数の案内表示板908が設置されてもよい。その場合、それぞれの案内表示板908は、全て同じ内容(例えば駐車場904内の全ての空き区画)を表示してもよいが、それぞれ異なる内容を表示してもよい。例えば、各案内表示板908は、その付近を走行している車両を誘導したい空き区画のみを表示してもよい。また、各案内表示板908は、例えば車両の進行方向等、空き区画以外の情報を表示してもよい。それぞれの案内表示板908がどのような状況においてどのような表示をするかは、後述する学習の結果に基づいて決定される。
【0161】
動作決定部205は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。具体的には、動作決定部205は、どういう情報を車両に提供すると、どういう車両の流れが発生するかを過去の実績等から学習してもよい。また、動作決定部205は、適切な制御が行われる情報の提供方法(例えば案内表示板908への表示方法)をシミュレーションで探索してもよい。このとき、駐車場内管制システム901に設定されたKPIは、例えば、駐車場904の利用効率、又は、駐車場904を利用する人の満足度等であってもよい。そして、動作実行部206は、最適な情報を最適な方法で車両に提供する。これらの処理の流れは、
図5に示した管制システム101の処理の流れと同様である。
【0162】
以上の実施例3によれば、自動運転車902の、例えば燃料消費を最少にしたいというKPIが向上するように、駐車位置及びそこまでの移動経路が最適化される。また、人が運転する自動車903の、例えば早く駐車したい、人の出口に近い場所に駐車したい、又は日陰に駐車したいといったそれぞれのKPIが向上するように、駐車位置及びそこまでの移動経路が最適化される。このような効果は、駐車場内管制システム901を有しない自律体システムにおいて、各自動運転車902及び人が運転する各自動車903が相互に直接情報を交換しても、得ることは困難である。
【実施例4】
【0163】
次に、本発明の実施例4を説明する。以下に説明する相違点を除き、実施例4の自律体システムの各部は、
図1~
図7に示された実施例1の同一の符号を付された各部と同一の機能を有するため、それらの説明は省略する。
【0164】
図10は、本発明の実施例4の自律体システム1000の全体構成を示す説明図である。
【0165】
実施例4の自律体システム1000は、自律体として、ショベルカー1002、ダンプカー1003、人1004及びそれらを管制する施工現場管制システム1001を含む建機システムである。
【0166】
施工現場管制システム1001は、施工現場における自律体(例えばショベルカー1002、ダンプカー1003及び人1004)の干渉及び干渉可能性を監視し、各自律体に対して適切な制御(情報の提示)を行う。また、施工現場管制システム1001は、施工現場の自律体以外に関する状況(例えば掘削された穴の状況又は施工に使用される資材の状況等)を監視し、各自律体に対して適切な制御(情報の提示)を行う。
【0167】
なお、
図10には説明を簡単にするために自律体システム1000に含まれる自律体として一つのショベルカー1002、一つのダンプカー1003及び一人の人1004を示しているが、これらは一例であり、自律体システム1000は、複数のショベルカー1002、複数のダンプカー1003及び複数の人1004を含んでもよいし、それらの少なくともいずれかを含まなくてもよいし、例えば一つ以上のブルドーザ等、他の建機を含んでもよい。
【0168】
また、一つ以上のショベルカー1002及び一つ以上のダンプカー1003の少なくともいずれかは、人の操作によらずに(又は人の操作を支援して)自律的に動作する建機(以下、自律建機と記載する)であってもよく、他のいずれかは人が運転する一般的な建機(以下、一般建機とも記載する)であってもよい。
【0169】
自律建機の構成は、例えば
図3に示したウィング車102又は
図4に示したフォークリフト103の構成と同様であってもよい。ここでは
図3を参照する。自律建機の状況把握部306は、例えばカメラ等の、当該自律建機のセンサ部303を介して、周囲の状況として施工現場の当該自律建機の周囲の状況を把握する。
【0170】
このようにして把握された周囲の状況には、施工現場管制システム1001から提供された情報が含まれる。この情報は、例えば、当該自律建機の付近に他の自律体がある否か、及び、他の自律体が接近中であるか否か、といった情報を含んでもよい。動作決定部307は、把握された状況及びタスク情報310(例えばこれから行うべき掘削又は運搬等の動作に関する情報)に基づいて、例えば掘削又は運搬といった動作を決定し、動作実行部308が駆動部304を介して決定した動作を実行する。
【0171】
一般建機の構成は、例えば
図3に示したウィング車102又は
図4に示したフォークリフト103の構成と同様であってもよい。ここでは
図3を参照する。ただし、一般建機は、プロセッサ301、通信インターフェース302、センサ部303及び記憶装置305を有しなくてもよい。一般建機の運転者の感覚器(例えば目及び耳等)が自律建機のセンサ部303に相当する。一般建機の運転者の知能が自律建機の状況把握部306、動作決定部307及び動作実行部308に相当する。また、タスク情報310に相当する情報(例えばこれから行うべき掘削又は運搬等の動作に関する情報)が運転者によって記憶されていてもよい。
【0172】
一般建機の運転者は、自らの感覚器を介して、周囲の状況として施工現場の当該一般建機の周囲の状況を把握する。このようにして把握された周囲の状況には、施工現場管制システム1001から提供された情報(例えば、上記と同様の他の自律体の接近に関する情報)が含まれる。
【0173】
運転者は、把握された状況及びタスク情報310に相当する情報に基づいて、例えば掘削又は運搬といった動作を決定し、駆動部304を介して決定した動作を実行する。
【0174】
自律建機及び一般建機に設定されるKPIは、例えば、効率的に作業をしたい、又は、確実に作業をしたい、と言ったものであってもよい。建機ごとに異なるKPIが設定されていてもよい。
【0175】
人1004は、目及び耳等の感覚器を使って周囲の状況を把握し、動作(例えば現在行っている作業を続ける、周囲の物体(例えば接近してきた他の自律体)を回避する、又は周囲を再確認するなど)を決定し、決定した動作を行う。人1004が把握する周囲の状況には、施工現場管制システム1001から提供された情報(例えば、上記と同様のに関する情報)が含まれる。
【0176】
人1004のKPIは、その人1004が施工現場における施工作業を行う作業者である場合には、例えば効率的に作業をしたい、確実に作業をしたい、又は疲れたくない、といったものであってもよい。また、その人1004が作業者以外の人(例えば施工現場の観察をする人又は作業者への物品(例えば弁当)の配達をする人)である場合には、例えばそれぞれの目的を効率的に、かつ確実に達成したい、といったものであってもよい。
【0177】
施工現場管制システム1001の構成は、
図2に示した実施例1の管制システム101の構成と同様である。施工現場管制システム1001の状況把握部204は、例えば一つ以上のカメラ105を介して、周囲の状況として施工現場の全体の状況(例えば、ショベルカー1002、ダンプカー1003及び人1004といった各自律体の状況、並びに、施工現場内の穴及び資材の状況等)を把握する。ここで、各カメラ105は、それぞれ適切な場所に据え付けられた固定カメラであってもよいが、カメラ付きドローンのように移動するカメラであってもよい。このカメラ105は、自律体システム1000の状況を把握するためのセンサの一例であり、他の種類のセンサが使用されてもよい。
【0178】
施工現場管制システム1001のタスク情報208は、例えば施工現場において実行されるべき作業(例えば掘削及び運搬等)に関する情報であってもよい。施工現場管制システム1001の動作決定部205は、カメラ105によって撮影された画像から把握された施工現場の状況と、タスク情報208と、に基づいて、各自律体の連携作業が効率的かつ確実に行われるように、それぞれの制御内容を決定する。ここで、各自律体の連携作業とは、例えば、ショベルカー1002が掘削した土をダンプカー1003に入れ、人1004が掘削によって生じた穴を成型する、などである。
【0179】
そして、動作実行部206が、決定された制御を行う。制御は、各自律体への情報提示によって行われる。例えば、実施例1と同様の信号機106が施工現場内に設けられてもよいし、音声によって必要な情報が各自律体に提供されてもよい。
【0180】
動作決定部205は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。具体的には、動作決定部205は、どういう情報を各自律体に提供すると、それぞれがどういう動作を行い、全体としてどのような挙動になるかを、実績等から学習してもよい。また、動作決定部205は、適切な制御が行われる情報の提供方法をシミュレーションで探索してもよい。このとき、施工現場管制システム1001に設定されたKPIは、例えば、施工現場の作業効率であってもよい。そして、動作実行部206は、最適な情報を最適な方法で各自律体に提供する。これらの処理の流れは、
図5に示した管制システム101の処理の流れと同様である。
【0181】
以上の実施例4によれば、自律建機の動作が、他の自律体及び現場の状況に合わせて、効率の観点で最適になる。同様に、一般建機の動作が、他の自律体及び現場の状況に合わせて、効率の観点で最適になる。作業者や作業者以外の人の動作が、他の自律体及び現場の状況に合わせて、効率及び疲労度の観点で最適になる。
【0182】
このような効果は、施工現場管制システム1001を有しない自律体システムにおいて、各自律体が相互に直接情報を交換しても、得ることは困難である。これは、例えば以下の理由による。すなわち、それぞれの自律体が把握した状況と実際の状況との間に乖離が発生する可能性がある。また、互いの通信手段を予め決めておく必要があるが、一般的にはそれぞれの自律体の提供者、運営者が異なるため、それが現実的には困難である。
【実施例5】
【0183】
次に、本発明の実施例5を説明する。以下に説明する相違点を除き、実施例5の自律体システムの各部は、
図1~
図7に示された実施例1の同一の符号を付された各部と同一の機能を有するため、それらの説明は省略する。
【0184】
図11は、本発明の実施例5の自律体システム1100の全体構成を示す説明図である。
【0185】
実施例5の自律体システム1100は、二つのワーク(加工対象の部品)を組合せてそれらをネジで締めるネジ締めロボットシステムである。この自律体システム1100は、自律体として、ネジ締め監視システム1101、第1のハンドロボット1102及び第2のハンドロボット1103を含む。
【0186】
第1のハンドロボット1102は、第1のワーク1104を作業台1107の上に置き、続いて第2のワーク1105を第1のワーク1104の上に載せてそのまま静止させる。
【0187】
第2のハンドロボット1103は、第1のワーク1104及び第2のワーク1105のネジ穴1108にネジ1106を差し込み、第2のハンドロボット1103のアームの先端に取り付けられたネジ締め器具1109がネジ1106を締める。
【0188】
ネジ締め監視システム1101は、第2のワーク1105を載せた位置のずれ、及び、ネジ締めの失敗等を監視し、第1のハンドロボット1102及び第2のハンドロボット1103に対して適切な制御(情報の提示)を行う。
【0189】
第1のハンドロボット1102及び第2のハンドロボット1103の構成は、例えば
図3に示したウィング車102又は
図4に示したフォークリフト103の構成と同様であってもよい。また、以下の説明において省略されている部分に関しては、実施例2のアームロボット802に関する説明が適用されてもよい。ここでは第1のハンドロボット1102の構成に関して
図3を、第2のハンドロボット1103の構成に関して
図4を参照する。
【0190】
第1のハンドロボット1102の状況把握部306は、例えば第1のハンドロボット1102に取り付けられたカメラ等の、第1のハンドロボット1102のセンサ部303を介して、周囲の状況として第1のワーク1104の状態、第2のワーク1105の状態及び作業台1107の状態を把握する。
【0191】
また、状況把握部306が把握する状況には、ネジ締め監視システム1101から提供された情報が含まれる。この情報は、例えば、各ワークの固定位置のずれ、及び、ネジ締め作業の完了又は失敗の情報等を含む。動作決定部307は、把握された状況及びタスク情報310(例えばこれから行うべきネジ締め作業に関する情報)に基づいて、例えば各ワークの保管場所からの取り出し及び作業台1107上の所定の位置への固定といった動作を決定し、動作実行部308が駆動部304を介して決定した動作を実行する。
【0192】
なお、第1のハンドロボット1102に設定されるKPIは、例えば、効率的に作業をしたい、といったものである。
【0193】
第2のハンドロボット1103の状況把握部406は、例えば第2のハンドロボット1103に取り付けられたカメラ等の、第2のハンドロボット1103のセンサ部403を介して、周囲の状況としてネジ穴1108、ネジ1106及びネジ締め器具1109の状況を把握する。
【0194】
また、状況把握部406が把握する状況には、ネジ締め監視システム1101から提供された情報が含まれる。この情報は、例えば、各ワークがネジ締め作業が開始できる状態になっているかどうか、及び、ネジ締め作業の完了又は失敗の情報等を含む。動作決定部407は、把握された状況及びタスク情報410(例えばこれから行うべきネジ締め作業に関する情報)に基づいて、例えばネジ穴1108へのネジ1106の差し込み及びネジ締め器具1109によるネジ締めといった動作を決定し、動作実行部408が駆動部404を介して決定した動作を実行する。
【0195】
なお、第2のハンドロボット1103に設定されるKPIは、例えば、効率的に作業をしたい、及び、ネジ締めを成功させたい、といったものである。
【0196】
ネジ締め監視システム1101の構成は、
図2に示した実施例1の管制システム101の構成と同様である。ネジ締め監視システム1101の状況把握部204は、例えば一つ以上のカメラ105を介して、周囲の状況として、例えば、第1のワーク1104及び第2のワーク1105の状態(例えば互いのネジ穴が重なっているか)、並びに、第1のハンドロボット1102及び第2のハンドロボット1103の状況を把握する。ここで、カメラ105は、例えば、各ワーク及びハンドロボットを撮影できる適切な場所に設置された一つ以上のカメラである。このカメラ105は、自律体システム1100の状況を把握するためのセンサの一例であり、他の種類のセンサが使用されてもよい。
【0197】
ネジ締め監視システム1101のタスク情報208は、例えばこれから実行されるべきネジ締め作業に関する情報である。ネジ締め監視システム1101の動作決定部205は、カメラ105によって撮影された画像から把握された状況と、タスク情報208と、に基づいて、第1のハンドロボット1102及び第2のハンドロボット1103の制御内容を決定する。
【0198】
例えば、動作決定部205は、二つのワークの状況(例えば互いのネジ穴が重なった状態で置かれているか等)を把握し、状況によって第2のワーク1105の位置の補正指示を第1のハンドロボット1102に通知することを決定してもよい。また、動作決定部205は、例えば二つのワークのネジ穴が重なったことによってネジ締め作業が実行できる状態になった場合にはそのことを第2のハンドロボット1103に通知することを決定してもよい。さらに、動作決定部205は、ネジ締めが成功又は失敗したことを把握し、失敗したときはやり直しを第2のハンドロボット1103に通知することを決定してもよい。
【0199】
そして、動作実行部206が、決定された制御を行う。制御は、各自律体への情報提示(例えばネットワーク210を介した情報の送信)によって行われる。
【0200】
動作決定部205は、いずれかのタイミングで、動作の決定を最適化するための学習処理を行ってもよい。具体的には、動作決定部205は、どういう情報を各ハンドロボットに提供すると、ネジ締め作業の結果(成功又は失敗)がどうなるか、また、作業に要する時間の長さがどうなるか、といったことを、実績等から学習してもよい。このとき、ネジ締め監視システム1101に設定されたKPIは、例えば、効率的に作業をしたい、及び、ネジ締めを成功させたい、といったものであってもよい。これらの処理の流れは、
図5に示した管制システム101の処理の流れと同様である。
【0201】
以上の実施例5によれば、第1のハンドロボット1102の動作が、ネジ締めの成功の観点で適切になる。また、第2のハンドロボット1103の動作が効率的(例えば待ち時間が少ない、及び、失敗の可能性が少ない)になる。
【0202】
このような効果は、ネジ締め監視システム1101を有しない自律体システムにおいて、各ハンドロボットが相互に直接情報を交換しても、得ることは困難である。これは、例えば以下の理由による。すなわち、それぞれのハンドロボットが把握した状況と実際の状況との間に乖離が発生する可能性がある。また、それぞれのハンドロボットが状況を観測できない可能性がある。
【0203】
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明のより良い理解のために詳細に説明したのであり、必ずしも説明の全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることが可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0204】
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によってハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによってソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
【0205】
また、制御線及び情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線及び情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
【符号の説明】
【0206】
100、800、900、1000、1100 自律体システム
101 管制システム
102 ウィング車
103 フォークリフト
104 パレット
105 カメラ
106 信号機
801 リフタ統合管理システム
802 アームロボット
803 リフタ
901 駐車場内管制システム
902 自動運転車
903 自動車
904 駐車場
906 駐車領域
908 案内表示板
1001 施工現場管制システム
1002 ショベルカー
1003 ダンプカー
1004 人
1101 ネジ締め監視システム
1102 第1のハンドロボット
1103 第2のハンドロボット
1104 第1のワーク
1105 第2のワーク
1106 ネジ