【文献】
Where to Park? Minimizing the Expected Time to Find Parking Space,Proc IEEE Int Conf Rob Autom ,米国,2015年 5月,p.2147-2152
【文献】
DESCRIPTIVE MODELS OF PARKING TO COMPLEMENT TRANSPORT PLANNING STUDIES,TRANSPORTATION RESEARCH. PART A:GENERAL,米国,1980年 6月,14巻号,p.159-171
(58)【調査した分野】(Int.Cl.,DB名)
前記状態において前記被案内車両の位置が取り得る値は、最寄りの駐車スペースによってその位置を示す値、被案内車両が駐車済みであることを示す値、および、他車両が駐車済みの駐車スペースに駐車することを決定したことを示す値である請求項1または2に記載の駐車スペース案内システム。
前記遷移関数は、前記被案内車両の位置及び最寄りの駐車スペースの駐車状況が一つ前の状態における最寄り駐車スペース以外の他の駐車スペースの駐車状況に依存しない請求項1〜5のいずれかに記載の駐車スペース案内システム。
前記遷移関数は、前記被案内車両の位置から所定の閾値以上離れた複数の駐車スペースの駐車状況を一つの駐車スペースの駐車状況に丸めた関数である請求項1〜6のいずれかに記載の駐車スペース案内システム。
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記した従来技術のように、「なるべく奥に駐車する」あるいは「車両の移動距離が短い」等の基準で駐車スペースを選ぶと、他車両が駐車スペースに駐車したり、あるいは逆に他車両が駐車スペースから出ていくなどした場合に、変化する状況に対して十分に対応できない。
【0007】
そこで、本発明は、駐車スペースの駐車状況に応じて最適な駐車位置を決定できる駐車スペース案内システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の駐車スペース案内システムは、駐車場の駐車スペースに車両を案内するシステムであって、案内の対象となる被案内車両の位置および全駐車スペースの駐車状況と、最寄りの駐車スペースに駐車すべきか否かのアクションとの関係を規定したポリシーを保存したポリシー保存部と、被案内車両の現在位置を検出する現在位置検出部と、全駐車スペースの駐車状況を取得する駐車場センサと、前記ポリシー保存部からポリシーを読み出し、読み出したポリシーに基づいて、前記現在位置検出部にて検出した前記被案内車両の現在位置と前記駐車場センサにて取得した全駐車スペースの駐車状況に対応するアクションを決定するアクション決定部と、前記アクション決定部にて決定されたアクションを示すデータを出力する出力部とを備え、前記ポリシーは、被案内車両の位置と全駐車スペースの駐車状況の状態を定義し、ある状態で所定のアクションをとったときの遷移先の状態を条件付き確率によって規定する遷移関数を定義し、ある状態で所定のアクションをとったときの報酬を条件付き確率によって規定する報酬関数を定義し、累積報酬を最大化する各状態におけるアクションを、マルコフ決定過程(Markov Decision Process:MDP)によって計算して求められる。
【0009】
このようにMDPによって求めたポリシーをポリシー保存部に保存しておき、被案内車両を駐車スペースに案内する際に、ポリシー保存部からポリシーを読み出し、そのときの被案内車両の位置や駐車状況の状態に対応するアクションを決定し、状態に応じて適切なアクションを出すことができる。また、ポリシーを決定する際に、報酬関数を適切に設定することにより、優先的に誘導する駐車スペースを設定することができる。
【0010】
本発明の別の態様の駐車スペース案内システムは、駐車場の駐車スペースに車両を案内するシステムであって、案内の対象となる被案内車両の位置および被案内車両の周囲の駐車スペースの駐車状況に基づいて、最寄りの駐車スペースに駐車すべきか否かのアクションを求めるために用いる価値関数を保存した価値関数保存部と、被案内車両の現在位置を検出する現在位置検出部と、被案内車両の周囲の駐車スペースの駐車状況を取得するセンサと、前記価値関数保存部から価値関数を読み出し、読み出した価値関数に基づいて、前記現在位置検出部にて検出した前記被案内車両の現在位置と前記センサにて取得した前記被案内車両の周囲の駐車スペースの駐車状況に対応するアクションを決定するアクション決定部と、前記アクション決定部にて決定されたアクションを示すデータを出力する出力部とを備え、前記価値関数は、被案内車両の位置と全駐車スペースの駐車状況の状態を定義し、ある状態で所定のアクションをとったときの遷移先の状態を条件付き確率によって規定する遷移関数を定義し、ある状態で所定のアクションをとったときの報酬を条件付き確率によって規定する報酬関数を定義し、ある状態で所定のアクションをとったときに観測される状態を条件付き確率によって規定する観測関数を定義し、部分観測マルコフ決定過程(Pertially Observable Markov Decision Process:POMDP)によって計算して求められ、前記アクション決定部は、前記現在位置検出部により取得した被案内車両の現在位置および前記センサにより取得した前記被案内車両の周囲の駐車スペースの駐車状況のデータを前記観測関数に適用して現在の状態の確率分布を求め、前記現在の状態の確率分布を前記報酬関数に適用して累積報酬を最大化するアクションを決定する。
【0011】
このようにPOMDPによって求めた価値関数を価値関数保存部に保存しておき、被案内車両を駐車スペースに案内する際には、価値関数保存部から価値関数を読み出し、観測された状態から、被案内車両が取るべきアクションを決定することにより、観測された状態に応じて適切なアクションを出すことができる。この構成によれば、全駐車スペースの駐車状況を検出する必要はなく、例えば、被案内車両から観測可能な駐車スペースの駐車状況のデータがあれば、アクションを決定できるので、駐車スペース案内システムで用いるセンサの数を減らすことができる。
【0012】
本発明の駐車スペース案内システムでは、前記状態において前記被案内車両の位置が取り得る値は、最寄りの駐車スペースによってその位置を示す値、被案内車両が駐車済みであることを示す値、および、他車両が駐車済みの駐車スペースに駐車することを決定したことを示す値であってもよい。
【0013】
このように状態を定義することにより、被案内車両が取るべきアクションを適切に求めることができる。他車両が駐車済みの駐車スペースに駐車することを決定したことを示す値をとり得ることとしているのは、このような状態への遷移にマイナスの報酬を設定するためである。これにより、駐車済みの駐車スペースに被案内車両が進入して、衝突事故を起こす危険を回避できる。
【0014】
本発明の駐車スペース案内システムにおいて、前記アクションは、最寄りの駐車スペースへの駐車、および、最寄りの駐車スペースの通過であってもよいし、最寄りの駐車スペースへの駐車、直進、左折、および右折であってもよい。
【0015】
このようにアクションを定義することにより、駐車場の構造に応じて、アクションを適切に決定することができる。
【0016】
本発明の駐車スペース案内システムにおいて、前記遷移関数は、前記被案内車両の位置及び最寄りの駐車スペースの駐車状況が一つ前の状態における最寄り駐車スペース以外の他の駐車スペースの駐車状況に依存しないこととしてもよい。
【0017】
このように条件付き確率によって規定された遷移関数の条件を減らすことにより、計算量を減らし、計算処理を高速化できる。また、被案内車両の位置は一つ前の状態における被案内車両の位置およびその最寄り駐車スペースの駐車状況に対する依存度が大きく、駐車スペースの駐車状況は一つ前の状態における同じ駐車スペースの駐車状況に対する依存度が大きいので、条件から他の駐車スペースの駐車状況を省いても、被案内車両がとるべきアクションを適切に決定することができる。
【0018】
本発明の駐車スペース案内システムにおいて、前記遷移関数は、前記被案内車両の位置から所定の閾値以上離れた複数の駐車スペースの駐車状況を一つの駐車スペースの駐車状況に丸めた関数であってもよい。
【0019】
このように被案内車両から遠く離れた駐車スペースの駐車状況を丸めることにより、計算量を減らし、計算処理を高速化できる。また、被案内車両から遠く離れた駐車スペースの駐車状況は、被案内車両がとるべきアクションに与える影響が小さいので、本発明のように複数の駐車スペースの駐車状況を一つの駐車スペースの駐車状況に近似しても、アクションを適切に決定することができる。
【0020】
本発明の駐車スペース案内方法は、駐車スペース案内システムによって駐車場の駐車スペースに車両を案内する方法であって、案内の対象となる被案内車両の位置と全駐車スペースの駐車状況の状態を定義し、ある状態で所定のアクションをとったときの遷移先の状態を条件付き確率によって規定する遷移関数を定義し、ある状態で所定のアクションをとったときの報酬を条件付き確率によって規定する報酬関数を定義し、累積報酬を最大化する各状態におけるアクションを、マルコフ決定過程(Markov Decision Process:MDP)によって計算し、被案内車両の位置および全駐車スペースの駐車状況と、最寄りの駐車スペースに駐車すべきか否かのアクションとの関係を規定したポリシーを求め、ポリシー保存部に保存するステップと、現在位置検出部にて、被案内車両の現在位置を検出するステップと、駐車場センサにて、全駐車スペースの駐車状況を取得するステップと、前記ポリシー保存部からポリシーを読み出し、読み出したポリシーに基づいて、前記被案内車両の現在位置と全駐車スペースの駐車状況に対応するアクションを決定するステップと、決定されたアクションを示すデータを出力するステップとを備える。
【0021】
この構成により、本発明の駐車スペース案内システムと同様に、被案内車両の位置や駐車状況の状態に応じて適切なアクションを出すことができる。
【0022】
本発明の別の態様の駐車スペース案内方法は、駐車スペース案内システムによって駐車場の駐車スペースに車両を案内する方法であって、案内の対象となる被案内車両の位置と全駐車スペースの駐車状況の状態を定義し、ある状態で所定のアクションをとったときの遷移先の状態を条件付き確率によって規定する遷移関数を定義し、ある状態で所定のアクションをとったときの報酬を条件付き確率によって規定する報酬関数を定義し、ある状態で所定のアクションをとったときに観測される状況を条件付き確率によって規定する観測関数を定義し、部分観測マルコフ決定過程(Pertially Observable Markov Decision Process:POMDP)によって計算し、被案内車両の位置および被案内車両の周囲の駐車スペースの駐車状況に基づいて、最寄りの駐車スペースに駐車すべきか否かのアクションを求めるために用いる価値関数を求め、価値関数保存部に保存するステップと、現在位置検出部にて、被案内車両の現在位置を検出するステップと、センサにて、被案内車両の周囲の駐車スペースの駐車状況を取得するステップと、前記価値関数保存部から価値関数を読み出し、前記価値関数に基づいて、前記被案内車両の現在位置と前記被案内車両の周囲の駐車スペースの駐車状況に対応するアクションを決定するステップと、決定されたアクションを示すデータを出力するステップとを備え、前記アクションを決定するステップは、前記現在位置検出部により取得した被案内車両の現在位置および前記センサにより取得した前記被案内車両の周囲の駐車スペースの駐車状況のデータを前記観測関数に適用して現在の状態の確率分布を求め、前記現在の状態の確率分布を前記報酬関数に適用して累積報酬を最大化するアクションアクションを決定する。
【0023】
この構成により、本発明の駐車スペース案内システムと同様に、全駐車スペースの駐車状況を検出しなくても、観測された状態に応じて適切なアクションを出すことができる。
【0024】
本発明のプログラムは、駐車スペース案内システムによって駐車場の駐車スペースに車両を案内するためのプログラムであって、コンピュータに、上記方法の発明の各ステップを実行させる。
【発明の効果】
【0025】
本発明によれば、被案内車両の位置や駐車スペースの駐車状況の状態に応じてアクションを出し、被案内車両を駐車スペースに適切に案内できるという効果を有する。
【発明を実施するための形態】
【0027】
以下、本発明の実施の形態の駐車スペース案内システムについて、図面を参照して説明する。
(第1の実施の形態)
図1は、第1の実施の形態の駐車スペース案内システム1が適用される駐車場30の例を示す図である。駐車場30は、例えば、デパートやショッピングモールなどの駐車場であり、
図1において「出入口」とは、駐車場への人の出入口を示し、例えば、デパートやショッピングモールなどの入口に通じている。
【0028】
図1に示す駐車場30は、12個の駐車スペースSL
1〜SL
12を有している。駐車場30には、駐車スペースSL
1〜SL
12に車両が駐車されているか否かを検出する駐車場センサ31が設けられている。
図1では、4つの駐車場センサ31を示しているが、駐車場センサ31の数は、全ての駐車スペースSL
1〜SL
12における駐車状況を検出するのに十分な数であればよい。
図1において、被案内車両Vは、駐車スペース案内システム1によって駐車スペースへ案内される車両を示す。
【0029】
図2は、駐車スペース案内システム1の構成を示す図である。駐車スペース案内システム1は、駐車場サーバ10と車載装置20とを有している。
【0030】
駐車場サーバ10には、前述した駐車場センサ31が接続されており、駐車場センサ31から駐車スペースの駐車状況を示すデータを取得する。また、駐車場サーバ10は、通信部11を有しており、駐車スペースの駐車状況を示すデータを駐車場30に進入した被案内車両Vに搭載された車載車両に送信する機能を有する。
【0031】
駐車場サーバ10は、駐車場情報保存部12を有している。駐車場情報保存部12は、駐車場30が備える駐車スペースの数や、駐車スペースの並び方などの駐車場30の構造、駐車場30の出入口の位置などのデータを有している。各駐車スペースには、その駐車スペースを特定する識別子であるSL
1〜SL
12が設定されている。また、各駐車スペースの前の通路にも識別子X
1〜X
12が設定されている。駐車場情報保存部12が記憶する駐車場30の構造には、各駐車スペースSL
1〜SL
12がどのように並んでいて、通路X
1〜X
12がどのようにつながっているかのデータが含まれる。
【0032】
さらに、駐車場情報保存部12には、各駐車スペースSL
1〜SL
12が駐車済みか否かに関する事前確率のデータと、各駐車スペースSL
1〜SL
12の条件付き確率のデータが記憶されている。駐車スペースSL
iが空いている事前確率のデータをP
ie=p(sl
i=empty)と表し、駐車済みである事前確率のデータをP
if=p(sl
i=full)と表す。また、駐車スペースSL
iの状態sl
i´は、全駐車スペースSL
1〜SL
12の一つ前の状態sl
1〜sl
12に依存するものとして、条件付き確率によってp(sl
i´|sl
1,sl
2,...,sl
12)と表す。事前確率のデータ及び条件付き確率は、駐車スペース案内システム1の運用者が設定してもよいし、この駐車場30における実績から学習によって求めてもよい。また、駐車場30における実績から学習する場合、一定期間における履歴に基づいて計算を行ってもよいし、MDPモデルを生成する際に、逐次計算し直すこととしてもよい。
【0033】
駐車場サーバ10は、MDPモデル生成部13と、MDPモデル学習部14と、ポリシー保存部15とを有している。
【0034】
ここで、MDPについて説明する。MDPは、状態の集合S、アクションの集合A、状態sでアクションaをとったとき状態s´へ遷移する条件付き確率P(s´|s,a)、状態sでアクションaをとって状態s´へ遷移したときの報酬の期待値R
a(s´|s)を定義し、累積報酬を最大化するように各状態でのアクションを計算することで、各状態におけるアクションを示すポリシーを決定するものである。状態s
t+1と報酬r
t+1は、一つ前の状態s
tとアクションa
tのみ依存し、それ以前の状態やアクションに依存しないマルコフ性を有している。
【0035】
MDPモデル生成部13は、状態の定義、アクションの定義、遷移関数の定義、報酬関数の定義を行い、MDPモデルを生成する。各駐車スペースSL
iの状態は、SL
i=[empty,full]とする。被案内車両Vの位置Xは、X=[pk,cr,x
1, ... ,x
n]と定義する。ここで、「pk」は駐車済み状態、「cr」はすでに駐車されている駐車スペースに対して駐車を決定した状態を示す。したがって、考慮すべき状態Sは、S=X×SL
1×...×SL
nと定義される。
【0036】
アクションAは、A=[go,pk]の2つを定義する。「go」は現在位置の最寄りの駐車スペースを通り過ぎる、「pk」は最寄りの駐車スペースに駐車するというアクションを示す。
【0037】
遷移関数は、ある状態s={x,sl
1,sl
2,... ,sl
12}において、アクションaを取ったときに、状態s´に遷移する条件付き確率によって定義される。具体的には、次式(1)によって定義される。
【数1】
【0038】
報酬関数は、ある状態であるアクションをとったときの報酬を設定することにより定義する。ある状態sでアクション「go」をとったときの報酬をR
igoと定義する。また、ある状態でアクション「pk」をとったときの報酬を、最寄りの駐車スペースxsl
iが空いている(empty)場合と、駐車済み(full)の場合とに場合分けして定義する。空いている場合にはR
ipkとし、駐車済みの場合にはR
negとする。
【数2】
【0039】
駐車済みの場合の報酬R
negは、このような状態が生じないように、マイナスに設定される。報酬R
igoと報酬R
ipkは、駐車スペース案内システム1の運用者が、駐車場30の運用方針に応じて適切な値を設定する。報酬R
igoは、被案内車両Vが移動する時間によって定義し、報酬R
ipkは駐車スペースから駐車場30の出入口まで歩く時間によって定義してもよい。
【0040】
この報酬関数を適切に設定することにより、駐車スペース案内システム1の運用者がどのような方針で被案内車両Vを駐車スペースに案内するかを設定することができる。例えば、出入口に近い駐車スペースに優先的に駐車させたい場合には、駐車場30の出入口に近い当該駐車スペースに駐車した際の報酬を高く設定すればよい。
【0041】
MDPモデル学習部14は、MDPモデル生成部13にて生成したMDPモデルを解き、ポリシーを生成する。ポリシーは、全駐車スペースの駐車状況と被案内車両Vの位置の組合せについて、被案内車両Vが「go」(現在位置の最寄りの駐車スペースを通り過ぎる)か、「pk」(最寄りの駐車スペースに駐車する)かのいずれを行うかを示すデータである。MDPモデル学習部14が、生成されたMDPモデルを学習する方法については、公知技術を用いることができる。MDPモデル学習部14は、学習によって得られたポリシーをポリシー保存部15に保存する。
【0042】
なお、以上に説明した駐車場サーバ10は、CPU、RAM、ROM、ハードディスクなどを備えたコンピュータによって構成され、プログラムをCPUによって実行させることにより実現される。このようなプログラムも本発明の範囲に含まれる。
【0043】
次に、車載装置20について説明する。車載装置20は、被案内車両Vに搭載され、駐車場サーバ10から送信されるポリシーにしたがって、駐車場30内の駐車スペースに駐車するか先に進むかのアクションを決定する装置である。
【0044】
車載装置20は、駐車場内における現在位置を検出する現在位置検出部21と、駐車場サーバ10と通信する通信部22と、駐車場サーバ10から送信されるポリシーを保存するポリシー保存部15と、ポリシーにしたがってアクションを決定するアクション決定部24と、決定したアクションをドライバに対して表示する表示部25とを有している。
【0045】
現在位置検出部21は、被案内車両Vが駐車場30内のどこにいるか、すなわち、位置X
1〜X
12を検出する機能を有する。現在位置検出部21は、例えば、カメラによって、車両の周辺にある駐車スペースを撮影し、画像に映った駐車スペースを特定することにより、駐車場30の構造の情報から車両の現在位置を求める。また、GPSの精度が高い場合には、GPSによって求めた緯度・経度情報と駐車場30の構造の情報を重ね合わせて、現在位置を求めてもよい。
【0046】
アクション決定部24は、ポリシー保存部23からポリシーを読み出し、ポリシーにしたがってアクションを決定する。すなわち、アクション決定部24は、駐車場サーバ10から送信された全駐車スペースの駐車状況のデータと、現在位置検出部21にて検出した被案内車両Vの位置とに対応するアクションをポリシーから読み出し、アクションを決定する。表示部25は、アクション決定部24にて決定されたアクションを表示する。
【0047】
なお、以上に説明した車載装置20は、CPU、RAM、ROM、ハードディスクなどを備えたコンピュータによって構成され、プログラムをCPUによって実行させることにより実現される。このようなプログラムも本発明の範囲に含まれる。
【0048】
次に、第1の実施の形態の駐車スペース案内システム1の動作について説明する。
図3は、駐車場サーバ10がMDP学習によってポリシーを生成して保存する処理を示すフローチャート、
図4は駐車スペース案内システム1にて被案内車両Vを案内する処理を示すフローチャートである。
【0049】
図3に示すように、駐車場サーバ10は、駐車場情報記憶部から駐車場情報を読み込み(S10)、読み込んだ駐車場情報に基づいてMDPモデルを生成する(S11)。続いて、駐車場サーバ10は、MDPモデルを解いてポリシーを求め(S12)、求めたポリシーをポリシー保存部15に保存する(S13)。
【0050】
次に、被案内車両Vの案内について説明する。
図4に示すように、駐車場サーバ10は、駐車場30内に進入してきた被案内車両Vに搭載された車載装置20に対してポリシーを送信し(S20)、車載装置20は駐車場サーバ10からポリシーを受信すると、受信したポリシーをポリシー保存部23に保存する(S21)。なお、車載装置20が、この駐車場のポリシーをすでに有している場合には、駐車場サーバ10から車載装置20にポリシーを送信するステップを省略することができる。車載装置20は、ポリシー保存部15からポリシーを読み出す(S22)。
【0051】
次に、駐車場サーバ10は、車載装置20に全駐車スペースの駐車状況データを送信し(S23)、車載装置20は駐車場サーバ10から全駐車スペースの駐車状況データを受信する(S24)。続いて、車載装置20は、現在位置検出部21にて、被案内車両Vが駐車場30内のどの位置Xにいるかを検出する(S25)。
【0052】
車載装置20は、全駐車スペースの駐車状況と被案内車両Vの現在位置とに対応するアクションをポリシーから読み出し、アクションを決定し(S26)、決定したアクションをドライバに対して表示する(S27)。その後、被案内車両Vが駐車したか否かを判定する(S28)。被案内車両Vが駐車した場合には(S28でYES)、駐車スペース案内システム1の動作を終了する。被案内車両Vが駐車していない場合には(S28でNO)、駐車場サーバ10から車載装置20に駐車スペースの駐車状況データを送信するステップ(S23、S24)に戻り、アクションの決定および表示を行う動作を行う。
【0053】
以上、第1の実施の形態の駐車スペース案内システム1の構成および動作について説明した。第1の実施の形態では、駐車場サーバ10がオフラインでMDPモデルの学習を行ってポリシーを求めておき、被案内車両Vを案内する際にはポリシーにしたがってアクションを決定するので、駐車スペースの状態に基づいて最適なアクションを選択することができ、駐車場30内の状況の変化に対して柔軟な行動が可能となる。
【0054】
上記した第1の実施の形態では、アクションが「go」(現在位置の最寄りの駐車スペースを通り過ぎる)と、「pk」(最寄りの駐車スペースに駐車する)の2つの場合を例として説明したが、駐車場30の構造がより複雑な場合には、それに合ったアクションの定義を行う。
【0055】
図5は、実施の形態の駐車スペース案内システム1が適用される別の駐車場30の例を示す図である。
図5に示す駐車場30では、駐車スペースSL
3を通過したところで、「直進」および「左折」を行うことができる。
図6は、
図5に示す駐車場30に適用する駐車スペース案内システム1の状態遷移のモデルを示す図である。
【0056】
図5に示す駐車場30の場合には、アクションとして「go」(直進)、「left」(左折)、「right」(右折)、「pk」(駐車)を定義する。なお、右折についても定義しているのは、右折した場合にはマイナスの報酬を与え、
図5に示す車両の流れを実現するためである。
【0057】
(第2の実施の形態)
次に、第2の実施の形態の駐車スペース案内システムについて説明する。第2の実施の形態の駐車スペース案内システムは、車載装置20がポリシーにしたがってアクションを決定する点は同じであるが、遷移関数を近似することでポリシーを求める計算処理を軽減する。
【0058】
図7は、第2の実施の形態の駐車スペース案内システムが適用される駐車場30の例を示す図である。ここでは、デパート等の入口に向かって駐車スペースが直線的に並ぶ単純な駐車場を例としているが、第2の実施の形態の駐車スペース案内システムも、第1の実施の形態と同様に、複雑な構造の駐車場に適用することができる。
【0059】
第2の実施の形態の駐車スペース案内システムでは、被案内車両Vの位置は最寄りの駐車スペース以外の駐車スペースの駐車状況には依存しないと仮定する。具体的には、被案内車両Vの位置は、一つ前の状態における被案内車両Vの位置およびその最寄り駐車スペースの駐車状況にのみ依存すると仮定し、また駐車スペースの駐車状況は一つ前の状態における同じ駐車スペースの駐車状況にのみ依存すると仮定する。
【0060】
第1の実施の形態では、遷移関数は式(1)のように表されたが、状況sl
i´は、状況sl
i以外には依存しないので、これらの状況sl
i以外を条件から除くことができる。また、車両位置X´は、最寄りの駐車スペースの状況以外には依存しないので、やはり条件から除くことができる。ここで、最寄りの駐車スペースを定義する値としてxsl
iを導入すると、遷移関数は以下のように近似できる。
【数3】
【0061】
上記の近似を行うだけでも計算処理負担を軽減することができるが、本実施の形態では、さらに、上記の遷移関数を階層化し、現在位置から所定の閾値以上離れている駐車スペースの駐車状況を一つの状況に丸める。次式では、最寄りの駐車スペースxsl
1から、m−1番目の駐車スペースxsl
mー1までは、各駐車スペースの駐車状況に基づく条件付き確率を求め、m番目〜n番目の駐車スペースまでは、各駐車スペースの駐車状況を計算するのではなく、駐車スペースの駐車状況をhslとして丸めている。
【数4】
【0062】
図8は、以上に説明した遷移関数の近似を模式的に示す図である。
図8の左に示すモデルは、第1の実施の形態の遷移関数に相当するモデルである。このモデルでは、位置X´及び各駐車スペースsl
1´〜sl
n´の状態は、その前の状態である位置X,全駐車スペースsl
1〜sl
nに依存している。本実施の形態では、相対位置xsl
iの概念を導入し、各要素を分離することで、中央のモデルに示すように依存関係を減らしている。さらに、被案内車両Vの位置Xから離れた位置にある駐車スペースについては、右のモデルに示すように、hslという要素にまとめることにより、さらに依存関係を減らしている。
【0063】
以上のように遷移関数を近似することにより、各駐車スペースの条件付き確率は、各駐車スペースの駐車状況のみで決定されることになる。この場合、事前パラメータとして必要な条件付き確率は、各駐車スペースの駐車状況のみから決定されるため、以下のように表現できる。各駐車スペースの条件付き確率をp
iff=p(sl
i´=full|sl
i=full)、p
iee=p(sl
i´=empty|sl
i=empty)、p
ief=p(sl
i´=empty|sl
i´=full)、p
ife=p(sl
i´=full|sl
i=empty)とする。
【0064】
上記計算結果から、p
f、p
ff、p
ee、R
pk、R
goに
図9(a)〜
図9(e)に示すようなパラメータを与える。
図9(a)に示すように、駐車スペースが駐車済みであることを示す事前確率p
fは、出入口に近い方が高い確率値となっている。
図9(b)及び
図9(c)に示すように、駐車スペースが駐車済みである状態であるときに次に駐車済みの状態に遷移する条件付き確率p
ffおよび駐車スペースがあいている状態であるときに次にあいている状態に遷移する条件付き確率p
eeは、いずれの駐車スペースについても同じである。
図9(d)及び
図9(e)に示すように、駐車スペースに駐車したときに得られる報酬R
pkは入口に近い方が高く、駐車スペースを通り過ぎたときに得られる報酬R
goは入口から遠い方が高くなっている。第2の実施の形態の駐車スペース案内システムが、被案内車両Vを案内する動作については、第1の実施の形態と同じである。
【0065】
第2の実施の形態の駐車スペース案内システムは、ポリシーを求めるための計算を簡略化できるため、より大きな駐車場での意思決定が可能となる。
【0066】
(第3の実施の形態)
次に、本発明の第3の実施の形態の駐車スペース案内システム3について説明する。第3の実施の形態の駐車スペース案内システム3は、駐車場の全駐車スペースの駐車状況のデータを用いるのではなく、被案内車両Vから観測可能な周辺の駐車スペースの駐車状況に基づいて、アクションを決定する。
【0067】
図10は、第3の実施の形態の駐車スペース案内システム3が適用される駐車場30の例を示す図である。
図1で説明した駐車場30と同じであるが、駐車場30には駐車場センサ31が設けられていない。本実施の形態では、被案内車両Vは周囲の状況を取得するセンサを備えている。
図10に示す例では、駐車スペースSL
1、SL
2がセンシング範囲に含まれている。
【0068】
図11は、第3の実施の形態の駐車スペース案内システム3の構成を示す図である。駐車スペース案内システム3は、駐車場サーバ10と車載装置20を有している。駐車場サーバ10は、駐車場情報保存部12と、POMDPモデル生成部16と、POMDPモデル解法部17と、価値関数保存部18と、通信部11とを有している。
【0069】
ここで、POMDPについて説明する。上述したとおり、MDPは行動の不確定性を考慮したモデルであったが、POMDPはこれに加えて観測の不確定性を考慮したモデルである。POMDPでは、状態sを部分的にしか知ることができないことから、観測と信念という概念を追加している。状態sであるアクションaをとったときに観測される観測値oが得られたとき、観測値oから状態sの確率分布を求めることができる。これを信念と呼ぶ。そして、POMDPでは、各信念でのアクションを決定する。MDPでは状態sが確定していたのに対し、POMDPでは状態sが確率分布として与えられる点が異なるが、累積報酬を最大化するという点は、MDPと同じである。
【0070】
MDPモデル生成部16は、第1の実施の形態と同様に、状態、アクション、遷移関数、および、報酬関数を定義する。MDPモデル生成部16は、被案内車両Vの最寄り駐車スペースの観測情報をOSL
1とし、そこから被案内車両Vの前方に所定範囲内における駐車スペースの観測情報をOSL
2,...,OSL
Lとする。なお、Lの値は、被案内車両Vが有するセンサのセンシング範囲に基づいて定めることとしてもよい。MDPモデル生成部16は、駐車スペースの駐車状況とその状況とアクションとを条件として観測される状況を条件付き確率によって次のように定義する。
【数5】
【0071】
POMDPモデル解法部17は、MDPモデル生成部16にて生成したモデルを解いて価値関数を求め、求めた価値関数を価値関数保存部18に保存する。POMDPモデルを解く方法は、公知技術を用いることができる。
【0072】
次に、車載装置20について説明する。車載装置20は、通信部22と、センサ28と、現在位置検出部21と、価値関数保存部27と、アクション決定部24と、表示部25とを有している。通信部22は、駐車場サーバ10と通信を行う機能を有する。センサ28は、被案内車両Vの周辺の駐車スペースの駐車状況を検出するためのセンサである。センサ28は、例えば、カメラにて撮影した映像を解析することにより、周辺の駐車スペースに車両が駐車しているか否かを判断することとしてもよい。現在位置検出部21は、被案内車両Vが駐車場30内のどこにいるかを検出する機能を有する。現在位置検出部21の構成は、第1の実施の形態で説明した車載装置20が有する現在位置検出部21と同じである。
【0073】
アクション決定部24は、センサ28から、被案内車両Vの周辺の駐車スペースの駐車状況データを取得すると共に、現在位置検出部21にて被案内車両Vの現在位置を取得する。アクション決定部24は、センサ28及び現在位置検出部21にて取得したデータと価値関数保存部18から読み出した価値関数を用いて、被案内車両Vが取るべきアクションを決定する機能を有する。
【0074】
アクション決定部24は、信念更新部26を有している。信念更新部26は、センサ28にて観測された周辺の駐車スペースの駐車状況データに基づいて、被案内車両Vがおかれた現在の状況を確率分布で求める機能を有する。信念の更新は、次の式で与えられる。
【数6】
【0075】
このように信念更新部26により、被案内車両Vのセンサ28によって観測された部分的な情報に基づいて現在の状態を求めることができるので、アクション決定部24は、駐車場30内の全駐車スペースの駐車状況が分からなくても、信念更新部26にて更新された状態に基づいて、被案内車両Vが取るべきアクションを決定することができる。
【0076】
図12は、駐車場サーバ10がPOMDPモデルによって価値関数を生成して保存する処理を示すフローチャート、
図13は駐車スペース案内システム3が被案内車両Vを案内する処理を示すフローチャートである。
【0077】
図12に示すように、駐車場サーバ10は、駐車場情報記憶部12から駐車場情報を読み込み(S30)、読み込んだ駐車場情報に基づいてPOMDPモデルを生成する(S31)。続いて、駐車場サーバ10は、POMDPモデルを解いて価値関数を求め(S32)、求めた価値関数を価値関数保存部18に保存する(S33)。
【0078】
次に、被案内車両Vの案内について説明する。
図13に示すように、駐車場サーバ10は、駐車場30内に進入してきた被案内車両Vに搭載された車載装置20に対して価値関数を送信し(S40)、車載装置20は駐車場サーバ10から価値関数を受信すると、受信した価値関数を価値関数保存部18に保存する(S41)。なお、車載装置20が、この駐車場30の価値関数をすでに有している場合には、駐車場サーバ10から車載装置20に価値関数を送信するステップを省略することができる。車載装置20は、価値関数保存部18から価値関数を読み出す(S42)。
【0079】
次に、車載装置20は、現在位置検出部21にて、被案内車両Vが駐車場30内のどの位置にいるかを検出し(S43)、続いて、センサ28にて被案内車両Vの周辺の駐車スペースの駐車状況を検出する(S44)。
【0080】
車載装置20は、アクション決定部24の信念更新部26にて、観測された駐車スペースの駐車状況に基づいて現在の状態の確率分布を求める(S45)。続いて、アクション決定部24は、更新された信念、すなわち、現在の状態の確率分布に基づいてアクションを決定し(S46)、決定したアクションをドライバに対して表示する(S47)。その後、被案内車両Vが駐車したか否かを判定する(S48)。被案内車両Vが駐車した場合には(S48でYES)、駐車スペース案内システム3の動作を終了する。被案内車両Vが駐車していない場合には(S48でNO)、車載装置20による被案内車両Vの現在位置検出のステップ(S43)に戻り、アクションの決定および表示を行う動作を行う。
【0081】
以上、第3の実施の形態の駐車スペース案内システム3の構成および動作について説明した。第3の実施の形態の駐車スペース案内システム3は、被案内車両Vから観測可能な周辺の駐車スペースの駐車状況に基づいて、被案内車両Vのアクションを決定することができる。したがって、駐車場30に駐車場センサ31を設ける必要がなく、かつ、駐車場サーバ10との間でリアルタイムに駐車スペースの駐車状況を取得する必要がなくなるという効果がある。
【0082】
なお、第3の実施の形態の駐車スペース案内システム3においても、第2の実施の形態と同様に、観測関数の近似を行うことができる。近似した観測関数の式を示すと以下のとおりである。
【数7】
【0083】
以上、本発明の実施の形態の駐車スペース案内システム3について実施の形態を挙げて詳細に説明したが、本発明は上記した実施の形態に限定されるものではない。
【0084】
上記した実施の形態では、車載装置は、決定したアクションを表示部に表示する例について説明したが、被案内車両Vが自動運転車両の場合には、決定したアクションのデータを車両の制御部に送信することにより、被案内車両Vに決定したアクションにしたがった自動運転を行わせることとしてもよい。
【0085】
上記した実施の形態において、MDPやPOMDPの解法については、公知技術を用いることを前提に説明したが、M. Spaan and N. Vlassis,「Perseus: Randomized point-based valueiteration for POMDPs.」J. Artif. Intell. Res.(JAIR), vol. 24, pp. 195-220, 2005.あるいはR. St-Aubin, J. Hoey, and C. Boutilier,「APRICODD: Approximatepolicy construction using decision diagrams,」NIPS, 2000.などの近似解法を用いてもよい。