【解決手段】車両情報取得部222により、車両の各々について、車両の位置情報を含む車両情報を取得し、軌道候補取得部224により、車両の各々について軌道候補を複数取得し、最適制御値探索部230により、取得された車両の各々の軌道候補の組み合わせのうち、算出されるコストに従って、最適な軌道候補の組み合わせを探索し、探索された最適な起動候補の組み合わせのうちの注目車両の軌道候補を、注目車両の最適な車両状態の時系列パターンとし、制御装置30により、車両の各々について探索された車両の最適な車両状態の時系列パターンに従って、車両の各々を制御する。
前記最適制御値探索手段は、前記注目車両について、前記車両情報取得手段によって取得された前記注目車両の位置情報及び前記注目車両とは異なる他車両の位置情報とに基づいて、前記注目車両に対する前記他車両の相対位置が一定の範囲に含まれる前記他車両を特定し、前記軌道候補取得手段により取得された前記注目車両及び前記特定された他車両の各々の軌道候補の組み合わせのうち、最適な軌道候補の組み合わせを探索する請求項1又は2記載の車両制御装置。
前記軌道候補取得手段は、前記車両の各々について、複数種類の車両状態を表すノードの各々を、所定時刻後までの各時刻について有し、各ノードを時系列に連結して、前記車両の車両状態の時系列パターンの各々を表した車両状態ネットワークに含まれる、前記車両の車両状態の時系列パターンの各々を、前記車両の軌道候補として複数取得し、
前記最適制御値探索手段は、前記注目車両について、前記軌道候補取得手段により取得された前記車両の各々の軌道候補の組み合わせのうち、前記組み合わせの前記車両の各々の軌道候補の前記時系列パターンに含まれる車両状態に対応する各ノードに対する、前記注目車両の前記ノードが表す車両状態と、他車両の各々の前記軌道候補の時系列パターンに含まれる前記車両状態とに基づいて得られる、前記ノードに対応する時刻における前記車両の速度、加速度、及び前記車両に対する他車両の相対位置に基づいて算出されるコストに従って、最適な軌道候補の組み合わせを探索し、前記探索された最適な軌道候補の組み合わせのうちの前記注目車両の軌道候補を、前記注目車両の最適な車両状態の時系列パターンとする請求項1〜3の何れか1項記載の車両制御装置。
前記最適制御値探索手段は、前記車両に対する他車両の相対距離に基づく距離が、所定距離以下である場合には、前記コストを無限大として算出する請求項1〜6の何れか1項記載の車両制御装置。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、非特許文献1の方法においては、車両自身が一台でどのように行動すべきか考えて走行するアルゴリズムであるため、基本的に自車両の利益が最大となるように行動することとなるという問題がある。例えば、自動運転で燃費性能を良くしたい場合は、いかに燃費がよくなるかを自車両のみで考えて次の行動を決定する。この事は、都市全体で見ると自動運転の性能の悪化を引き起こす原因となる。
【0006】
自車両のみで考えて次の行動を決定するというロジックは、周囲に車両が存在せず単独で走行している場合には、特に問題はないが、例えば、近くに同じシステムを搭載する自動運転車両がもう一台いる場合を想定すると、お互いにいかに燃費がよくなるかということだけを考えるため、
図18に示すように、最悪の場合は、相手に悪影響となる行動を起こすという問題がある。特に、車線変更や合流、交差点通過など、車両の動線が交差するような場合に顕著となる。例えば、前方に停止車両が止まっている状況を考えた場合、自分の利益が最大となるように行動すると、多少強引でも車線変更をして通り抜けようとする。この場合、後ろに車両がいる場合には、急減速を余儀なくされ、結果として後続車両の利益(燃費や安全性)が低下するという問題がある。
【0007】
また、非特許文献2の方法においては、「ある広い空間を効率よく探索する」という問題に対しては有効であるが、交通社会における「自動運転の性能(燃費、安全性、乗り心地)をよくする」という問題には適用することができないという問題がある。
【0008】
非特許文献2のおける「ある広い空間を効率よく探索する」という問題設定であれば、他の機体に近づかない方が探索の効率がよくなる。つまり、基本的にお互いの機体が近づかないようにすればよいため、非常に大雑把な固定分布を利用するだけでも、問題を解くための同時制御が簡単に実現することができる。一方、交通社会においては、車両と車両の距離が非常に近く、通常は同じ方向(道路進行方向)に向かって進行するため、車両同士が複雑に絡み合う環境となっている。そのような状況においては、大雑把な固定分布で問題を近似しようとすると、近似による誤りの影響が多くなり、結果として同時制御が実現できなくなるという問題がある。また、安全性のような衝突判定のみであれば、非特許文献2の方法と同様に、固定分布で表現可能であるが、燃費を同時制御にて最適にしたい場合は、非特許文献2の方法と同様となる固定分布では表現できず、非特許文献2の方法のように独立問題へ分割することが出来ないという問題がある。
【0009】
本発明では、上記問題点を解決するために成されたものであり、現実的な計算時間において、複数台数の車両の制御を最適化することができる車両制御装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記目的を達成するために、本発明に係る車両制御装置は、車両の各々について、前記車両の位置情報を含む車両情報を取得する車両情報取得手段と、前記車両の各々について、所定時刻後までの各時刻について、前記車両の車両状態の時系列パターンを、前記車両の軌道候補として複数取得する軌道候補取得手段と、前記車両の各々を、注目車両とし、前記軌道候補取得手段により取得された前記車両の各々の軌道候補の組み合わせのうち、前記組み合わせの前記車両の各々の軌道候補の前記時系列パターンに含まれる各車両状態に対する、前記注目車両の前記車両状態と、他車両の各々の前記軌道候補の時系列パターンに含まれる前記車両状態とに基づいて得られる、前記車両状態に対応する時刻における前記車両の速度、加速度、及び前記車両に対する他車両の相対位置に基づいて算出されるコストに従って、最適な軌道候補の組み合わせを探索し、前記探索された最適な軌道候補の組み合わせのうちの前記注目車両の軌道候補を、前記注目車両の最適な車両状態の時系列パターンとする最適制御値探索手段と、前記最適制御値探索手段により、前記車両の各々について探索された前記車両の最適な車両状態の時系列パターンに従って、前記車両の各々を制御する制御手段と、を含んで構成されている。
【0011】
本発明によれば、車両情報取得手段により、車両の各々の位置情報を含む車両情報を取得し、軌道候補取得手段により、車両の各々の複数の軌道候補を取得し、最適制御値探索手段により、車両の各々を、注目車両とし、取得した車両の各々の軌道候補の組み合わせのうち、組み合わせの車両の各々の軌道候補の時系列パターンに含まれる各車両状態に対する、注目車両の車両状態と、他車両の各々の軌道候補の時系列パターンに含まれる車両状態とに基づいて得られる、車両状態に対応する時刻における車両の速度、加速度、及び車両に対する他車両の相対位置に基づいて算出されるコストに従って、最適な軌道候補の組み合わせを探索し、探索された最適な軌道候補の組み合わせのうちの注目車両の軌道候補を、注目車両の最適な車両状態の時系列パターンとし、制御手段により、車両の各々について探索された車両の最適な車両状態の時系列パターンに従って、車両の各々を制御する。
【0012】
このように、車両の各々の位置情報を含む車両情報を取得し、車両の各々の複数の軌道候補を取得し、車両の各々を、注目車両とし、取得した車両の各々の軌道候補の組み合わせのうち、組み合わせの車両の各々の軌道候補の時系列パターンに含まれる各車両状態に対する、最適な軌道候補の組み合わせを探索し、探索された最適な軌道候補の組み合わせのうちの注目車両の軌道候補を、注目車両の最適な車両状態の時系列パターンとし、車両の各々について探索された車両の最適な車両状態の時系列パターンに従って、車両の各々を制御することによって、現実的な計算時間において、複数台数の車両の制御を最適化することができる。
【0013】
また、本発明の車両制御装置において、前記車両状態を、予め定められた複数種類の車両状態の何れかとし、前記軌道候補取得手段は、前記車両の各々について、前記複数種類の車両状態の各々に対し、前記車両状態を初期車両状態とする前記車両の車両状態の時系列パターンを、前記車両の軌道候補として複数取得してもよい。
【0014】
また、本発明の車両制御装置において、前記最適制御値探索手段は、前記注目車両について、前記車両情報取得手段によって取得された前記注目車両の位置情報及び前記注目車両とは異なる他車両の位置情報とに基づいて、前記注目車両に対する前記他車両の相対位置が一定の範囲に含まれる前記他車両を特定し、前記軌道候補取得手段により取得された前記注目車両及び前記特定された他車両の各々の軌道候補の組み合わせのうち、最適な軌道候補の組み合わせを探索してもよい。
【0015】
また、本発明の車両制御装置において、前記軌道候補取得手段は、前記車両の各々について、複数種類の車両状態を表すノードの各々を、所定時刻後までの各時刻について有し、各ノードを時系列に連結して、前記車両の車両状態の時系列パターンの各々を表した車両状態ネットワークに含まれる、前記車両の車両状態の時系列パターンの各々を、前記車両の軌道候補として複数取得し、前記最適制御値探索手段は、前記注目車両について、前記軌道候補取得手段により取得された前記車両の各々の軌道候補の組み合わせのうち、前記組み合わせの前記車両の各々の軌道候補の前記時系列パターンに含まれる車両状態に対応する各ノードに対する、前記注目車両の前記ノードが表す車両状態と、他車両の各々の前記軌道候補の時系列パターンに含まれる前記車両状態とに基づいて得られる、前記ノードに対応する時刻における前記車両の速度、加速度、及び前記車両に対する他車両の相対位置に基づいて算出されるコストに従って、最適な軌道候補の組み合わせを探索し、前記探索された最適な軌道候補の組み合わせのうちの前記注目車両の軌道候補を、前記注目車両の最適な車両状態の時系列パターンとしてもよい。
【0016】
また、本発明の車両制御装置において、前記車両状態を、予め定められた複数種類の車両状態の何れかとし、前記複数種類の車両状態は、加速状態、減速状態、及び車線変更状態を含み、前記軌道候補取得手段は、前記車両の各々について、前記軌道候補の時系列パターンにおいて前記車線変更状態を一度しか含まない制約条件、前記軌道候補の時系列パターンにおいて前記加速状態の後に前記加速状態及び前記減速状態に遷移しないという制約条件、及び前記軌道候補の時系列パターンにおいて前記減速状態の後に前記加速状態及び前記減速状態に遷移しないという制約条件のうちの少なくとも1つの制約条件を満たすように、前記車両の軌道候補を複数取得してもよい。
【0017】
また、本発明の車両制御装置において、前記車両状態を、予め定められた複数種類の車両状態の何れかとし、前記軌道候補取得手段は、前記車両の各々について、前記複数種類の車両状態の各々に対し、前記車両状態を初期車両状態とする一定数の前記車両の車両状態の時系列パターンの各々を、前記車両の軌道候補として複数取得してもよい。
【0018】
また、本発明の車両制御装置において、前記最適制御値探索手段は、前記車両に対する他車両の相対距離に基づく距離が、所定距離以下である場合には、前記コストを無限大として算出してもよい。
【0019】
また、本発明の車両制御装置において、前記最適制御値探索手段は、前記コストを予測期間の燃費の項と無限期間の燃費の項とを含む式を用いて算出してもよい。
【0020】
また、本発明の車両制御装置において、前記車両状態を、予め定められた複数種類の車両状態の何れかとし、前記複数種類の車両状態は、加速状態、減速状態、等速状態、車線変更等速状態、車線変更加速状態、及び車線変更減速状態を含んでもよい。
【0021】
また、本発明のプログラムは、コンピュータを、上記の車両制御装置を構成する各手段として機能させるためのプログラムである。
【発明の効果】
【0022】
以上説明したように、本発明の車両制御装置、及びプログラムによれば、車両の各々の位置情報を含む車両情報を取得し、車両の各々の複数の軌道候補を取得し、車両の各々を、注目車両とし、取得した車両の各々の軌道候補の組み合わせのうち、組み合わせの車両の各々の軌道候補の時系列パターンに含まれる各車両状態に対する、最適な軌道候補の組み合わせを探索し、探索された最適な軌道候補の組み合わせのうちの注目車両の軌道候補を、注目車両の最適な車両状態の時系列パターンとし、車両の各々について探索された車両の最適な車両状態の時系列パターンに従って、車両の各々を制御することによって、現実的な計算時間において、複数台数の車両の制御を最適化することができる。
【発明を実施するための形態】
【0024】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0025】
<本発明の実施の形態に係る車両制御装置の原理>
まず、本発明の実施の形態に係る車両制御装置の原理について説明する。
【0026】
本発明の実施の形態に係る車両制御装置においては、車両の各々について、車両の各々の軌道候補を組み合わせて、その組み合わせの中から一つだけ当該車両の最適な制御値を探索するという問題を解く事になる。しかしながら、当該問題を解く手順を実際に考えると、
図1のようになり、車両の数と軌道候補の数だけ組み合わせが発生する。具体的には、5秒先までの未来を考慮して、6通りの行動可能性をもつ車両を7台同時に制御すると、その組み合わせによる計算量は下記(1)式で表される。
【0028】
上記(1)式に示すように、膨大の数の組み合わせ数の中からたった一つの最適解を見つけなければならないという、実行不可能な問題を解く事になる。これは、ある一台の未来の可能性(軌道候補)を算出する手続きが指数関数的に増加することに加え、それをさらに複数の台数分組み合わせることで、二重の指数関数的増加が発生することになる。そのため、単純な手続きでは、同時制御を現実的な時間内に動作させることは不可能である。
【0029】
また、上記(1)式の計算量削減を考えた場合、べき乗の底を減らす、ということが考えられる。上記(1)式であれば、9330という数値の部分が、べき乗の底にあたる。上記(1)式の底は、数秒先(本実施の形態においては5秒先)までの未来を考慮したときにおけるある1台の車両の軌道候補数である。上記(1)式の底を減らす、ということは、1台毎の未来までの軌道候補数を減らすということを意味する。
【0030】
さらに単純に1台毎の未来までの軌道候補数を減らすということを考えた場合、上記(1)式のべき乗の底に表されるような未来の全ての軌道候補の中から、性能(燃費、安全性、乗り心地)の良い軌道を上位一定数選択する、という方法がある。そのため、車両の各々において、性能の良い軌道候補のみを抽出し、その候補を利用して車両の各々を同時制御することが考えられる。
【0031】
しかし、車両の各々について、性能の良い軌道候補を上位3つ抜き出すことを考えた場合、性能の良い軌道候補は、
図2に示すように、非常に似通った軌道をしている。
【0032】
図2に示すように、車両の各々から抽出された軌道候補が非常に似通った軌道をしている場合、当該軌道候補を他の車両の軌道候補と組み合わせて、軌道候補の中から最も協調して性能のよいものを選択するが、車両の軌道候補の各々が非常に似通った軌道であるため、どの軌道候補を選択しても車両の行動がほとんど変化しないという現象が発生する。
【0033】
また、車両の各々を同時制御する効果は、対象となる車両が最適と思われる行動をやめ、周囲の車両の各々の性能も良くなるように行動を変化させる点にあるが、対象となる車両にとって性能の良い軌道に似ている候補のみでは、組み合わせても行動は変化せず、結果として車両の各々を同時制御する効果が得られない。
【0034】
そのため、本実施の形態に係る車両制御装置においては、
図3に示すように、車両状態の種類毎に、当該種類の車両状態を初期車両状態とした場合の、性能の良い未来の軌道候補を一定数抽出することで、組み合わせによる行動の変化と、計算量削減とを同時に実現する。初期車両状態が異なれば、その後の行動も大きく変化するため、組み合わせによる行動変化を表現することができる。
【0035】
また、本実施の形態に係る車両制御装置においては、固定分布や問題の独立化を考慮せず、組み合わせ問題を以下の二段階の部分問題で近似することにより、車両の各々の同時制御を実現する。
【0036】
(一)車両の各々について、車両状態の種類毎に、当該種類の車両状態を初期車両状態とした場合の性能が良いと思われる軌道候補を取得する。
(二)対象となる車両の軌道候補の各々と、対象となる車両の位置と一定の範囲内に位置する他の車両の軌道候補の各々とを組み合わせ、対象となる車両の軌道候補の各々の中から最適制御値を探索する。
【0037】
本実施の形態に係る車両制御装置は、上記(一)及び(二)の要件を満たすように、組み合わせ数の削減を行うことにより、現実的な時間内での複数車両の同時制御を動作させる。
【0038】
<車両状態の離散化>
次に、本発明の実施の形態に係る車両制御装置に用いる車両状態の離散化について説明する。
【0039】
本実施の形態においては、まず、車両の各々について、車両の状態を離散化する。例えば、
図4に示すように、(A)加速状態、(B)減速状態、(C)等速状態、(LA)車線変更加速状態、(LB)車線変更減速状態、及び(LC)車線変更等速状態の6種類の車両状態に分割し、分割した状態の各々を車両状態ノードとする。なお、加速、及び減速は、予め定められた一定の加速又は減速が行われるとする。また、車両状態ノードがノードの一例である。また、6種類が複数種類の一例である。なお、車線変更加速状態、車線変更減速状態、及び車線変更等速状態が車線変更状態の一例である。
【0040】
次に、分割した6種類の車両状態ノードを、任意の時間までの各時刻について設け、時系列に連結する。本実施の形態においては、予測時間間隔を1秒と設定する。この場合、1秒後までの車両状態の時系列パターンを考慮する場合は、(A)、(B)、(C)、(LA)、(LB)、(LC)の全部で6通りの車両状態の時系列パターンが存在することとなる。2秒後までの車両状態の時系列パターンを考慮する場合は、(A)‐(A)、(A)‐(D)、(A)‐(C)、(A)‐(LA)、(A)‐(LB)、(A)‐(LC)、(D)‐(A)、…、(LC)‐(LD)、(LC)‐(LC)の全部で36通りの車両状態の時系列パターンが存在することとなる。そのため、任意の時間n秒後までの車両状態の時系列パターンを考慮して、車両の各々について、6
n通りの車両状態の時系列パターンで表される車両状態ネットワークを構成する。
図5に車両状態ネットワークの例を示す。
【0041】
また、6
n通りのn秒後までの軌道候補を全て計算するには、
【0043】
の計算量が必要となる。この6
n通りの軌道候補を組み合わせて、N台の車両の各々を同時制御する場合には、
【0046】
<軌道候補の削減>
次に、本実施の形態に係る車両制御装置における車両の各々についての軌道候補の削減について説明する。本実施の形態に係る車両制御装置においては、車両の各々における軌道候補を削減する。上述したように、通常であれば、車両の各々が有するn秒後までの未来の軌道候補は、6
n通り存在するが、本実施の形態においては、車両の各々が有するn秒後までの未来の軌道候補を、6通りまで削減する。
【0047】
具体的には、
図6に示すように、1秒後の車両状態(初期車両状態)を(A)加速状態、(D)減速状態、(C)等速状態、(LA)車線変更加速状態、(LD)車線変更減速状態、及び(LC)車線変更等速状態という6つの状態に固定した軌道候補の中で、目的の自動運転性能(燃費、安全性、乗り心地等)が最適となる候補を1つずつ選択し、車両各々の軌道候補を6つに限定する。例えば、最初の1秒加速した時に5秒後までの燃費最適な軌道候補を1つ選択し、最初の1秒減速した時に5秒後までの燃費最適な軌道候補を1つ選択するというように、同様に6つの初期車両状態のそれぞれで軌道候補を1つずつ選択する。このように、車両の各々の軌道候補を6通りにすることで、N台の車両の各々を同時制御する場合に必要な計算量を6
Nまで削減する。また、本実施の形態においては、車両状態の種類毎に、当該種類の車両状態を初期車両状態とした最適な軌道候補を探索する際に、
図7に示すように、以下の3つの制約条件を利用して探索数の削減を行う。
【0048】
(i)軌道候補の時系列パターンにおいて車線変更状態を一度しか含まない制約
(ii)軌道候補の時系列パターンにおいて加速状態の後に加速状態及び減速状態に遷移しないという制約
(iii)軌道候補の時系列パターンにおいて減速状態の後に加速状態及び減速状態に遷移しないという制約
【0049】
この制約によって、車両の各々について、軌道候補を取得するための計算量を
【0053】
へと削減する。なお、本実施の形態においては、車両の各々について、
【0055】
通りの軌道候補の中から、ダイクストラ法を利用して、評価関数が最も高い軌道候補を、車両状態の種類毎に、当該種類の車両状態を初期車両状態として、1つずつ探索する。
【0056】
<同時制御組み合わせ台数の削減>
次に、本実施の形態に係る車両制御装置における、複数台数の車両の同時制御における、同時制御組み合わせ台数の削減について説明する。
【0057】
上述のように、本実施の形態においては、車両の各々についての軌道候補は6つとなるため、N台の車両の同時制御の計算量は、6
Nとなる。しかし、計算量が車両数に対して指数的に増加するため、道路上の車両数によっては計算不可能な問題となる。そこで、本実施の形態においては、同時に制御する車両の組み合わせ台数を削減する。
【0058】
通常であれば、同時制御する台数をN台として場合、6
N通りとなる組み合わせ計算量を、N×6
C(C<<<N)まで削減する。ここで、Cは一定範囲に存在する車両数である。具体的には、
図8に示すように下記(a)〜(e)の処理において実現する。
【0059】
(a)道路上に存在する車両から対象となる特定の一台(以後、注目車両とする。)を任意に選択する。
(b)注目車両を基準として、一定範囲内に存在する車両の各々を抽出する。
(c)上記(a)及び(b)において選択又は抽出された車両からなる車両群について、当該車両群に含まれる車両の各々の軌道候補の組み合わせのうち、当該車両群全体で最も性能(燃費、安全性、乗り心地など)がよくなる組み合わせを決定し、決定された組み合わせに含まれる注目車両の軌道候補を、注目車両の軌道として一つ決定する。
(d)上記(c)において決定された軌道を利用して、注目車両の制御情報を決定する。
(e)上記(a)〜(d)の処理を、道路上の対象となる全ての車両について繰り返す。
【0060】
一定範囲内に存在する車両数には限界があるため、範囲設定を適切に設定することで、同時制御組み合わせ数の削減を実現することができる。
【0061】
<本発明の第1の実施の形態に係る車両の構成>
次に、本発明の第1の実施の形態に係る車両について説明する。
図9に示すように、本発明の第1の実施の形態に係る車両101は、認識センサ10と、位置測位センサ12と、演算部20と、アクセル50と、ブレーキ60と、ステアリング70と、通信部80とを備えている。なお、車両102〜車両10Nまでは、車両101と同様の構成のため説明を省略する。
【0062】
認識センサ10は、車両101の周囲車両の情報を画像又は点群として逐次取得する。認識センサ10としては、例えば、カメラやLRF(Laser Range Finder)を用いる。
【0063】
位置測位センサ12は、車両101の絶対位置情報を逐次取得する。位置測位センサ12としては、例えば、GPSを用いる。
【0064】
通信部80は、車両制御装置200から送信された車両101の制御情報を受信する。
【0065】
演算部20は、入力部22と、周囲車両検出装置24と、絶対位置変換装置26と、制御装置30と、を備えている。
【0066】
入力部22は、認識センサ10から逐次入力される車両101の周囲車両の情報と、位置測位センサ12から逐次入力される車両101の絶対位置情報と、通信部80から入力される車両101の制御情報とを受け付ける。
【0067】
周囲車両検出装置24は、入力部22において逐次受け付けた車両101の周囲の車両情報に基づいて、車両101の周囲に存在する車両の各々を検出し、検出された車両の各々の車両101との相対位置、相対速度、及び相対向きの各々を検出する。
【0068】
絶対位置変換装置26は、位置測位センサ12において逐次取得した車両101の絶対位置情報と、周囲車両検出装置24において検出した周囲車両の各々の車両101との相対位置、相対速度、及び相対向きとに基づいて、車両101及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向を取得し、通信部80を介して車両制御装置200に送信する。
【0069】
制御装置30は、車両制御装置200から送信された車両101の制御情報に基づいて、アクセル50、ブレーキ60、及びステアリング70を制御する。
【0070】
<本発明の第1の実施の形態に係る車両制御装置の構成>
次に、本発明の第1の実施の形態に係る車両制御装置について説明する。
図10に示すように、本発明の第1の実施の形態に係る車両制御装置200は、通信部202と、演算部220とを備えている。
【0071】
通信部202は、車両101〜車両10N(N=1〜N)から送信される車両の各々についての、当該車両及び当該車両の周囲車両の各々の絶対位置、絶対速度、及び絶対方向を受信する。
【0072】
演算部220は、車両情報取得部222と、軌道候補取得部224と、ネットワーク図記憶部226と最適制御値探索部230と、出力部240とを含んで構成されている。
【0073】
車両情報取得部222は、通信部202により受信した、車両101〜車両10Nから送信される車両の各々についての、当該車両及び当該車両の周囲車両の各々の絶対位置、絶対速度、及び絶対方向を受け付ける。
【0074】
ネットワーク図記憶部226は、予め構築された、予測時間間隔をt秒としたn秒後までの6
n通りの車両の車両状態を表す車両状態ネットワークと、各調整パラメータ(m、α)と、車両各々の最大減速度とを記憶している。なお、n秒後が所定時刻後の一例である。
【0075】
軌道候補取得部224は、車両情報取得部222において取得した、車両101〜車両10Nの各々についての、当該車両の各々の絶対位置、絶対速度、及び絶対方向に基づいて、ネットワーク図記憶部226に記憶されている車両状態ネットワークを用いて、車両101〜車両10Nの各々について、車両状態の種類毎に、当該種類の車両状態を初期車両状態とした軌道候補を各々取得する。第1の実施の形態においては、6つの車両状態が存在するため、1台につき6つの軌道候補を取得する。
図11に軌道候補の例を示す。
【0076】
具体的には、まず、車両状態ネットワークを、対象となる車両の車両状態の種類毎に、当該種類の車両状態を初期車両状態として固定したネットワーク毎に分離する。そして、分離されたネットワークの各々について、Dijkstra法及び上記(i)〜(iii)の3つの制約条件に従って、各車両状態ノードを探索しながら、当該車両状態ノードのコストを算出し、コストの総和が最小となる車両状態の時系列パターンを探索する。第1の実施の形態においては、車両状態の種類毎に、下記(2)式に示す評価式に従って、当該種類の車両状態を初期車両状態とし、かつ、燃費が最大となる車両状態の時系列パターンを探索する。
【0078】
ただし、vは当該車両状態ノードに対応する時刻における対象となる車両の速度であり、aは、当該車両状態ノードに対応する時刻における対象となる車両の加速度であり、x
nearは、当該車両状態ノードに対応する時刻における進行方向での対象となる車両に最も近い他車両までの距離であり、y
nearは、当該車両状態ノードに対応する時刻における進行方向に垂直な方向での対象となる車両に最も近い他車両までの距離であり、tは予測時間間隔(秒)であり、Wは燃料消費量に関する関数であり、
【0080】
は対象となる車両の最大減速度であり、mは停車時の車間距離を調整するパラメータであり、αは評価関数の振る舞いを調整するパラメータであり、d
nearは、
【0082】
である。なお、第1の実施の形態においては、t=1とする。また、上記(2)式の第1項を予測期間の燃費項、第2項を無限期間の燃費項とする。また、
【0084】
が所定距離の一例である。また、d
nearが相対距離の一例である。
【0085】
ここで、車両状態ノードのコストを算出する際に用いられる上記(2)式の各情報は、ネットワーク図記憶部226に記憶されている各調整パラメータ(m、α)及び対象となる車両の最大減速度と、車両情報取得部222において取得した対象となる車両の絶対速度、絶対速度から求まる加速度、及び絶対位置、又は当該車両状態ノードより一つ前の車両状態ノードにおける対象となる車両の位置、速度、及び加速度と、車両情報取得部222において取得した対象となる車両以外の車両の各々の絶対位置、絶対速度、絶対方向と、当該車両状態ノードの車両状態と、により求められる。なお、他車両の各々については、取得された絶対速度で、等速に、取得された絶対方向に毎秒移動するものとして仮定する。また、第1の実施の形態においては、全ての車両を制御対象とする場合について説明するが、これに限定されるものではない。例えば、制御対象とならない車両を含んだ形式で当該車両制御装置を構成することができる。その場合、制御対象とならない車両については、制御対象の車両の各々において取得された制御対象の車両の周囲の車両の絶対位置、絶対速度、絶対方向の情報に基づいて、当該絶対位置から当該絶対速度で、当該絶対方向に等速運動しているものとして仮定して処理を実行する。
【0086】
具体的には、対象となる車両の速度vは、一時刻前における車両状態ノードにおける対象となる車両の速度に基づいて求められ、一時刻前における車両状態ノードが加速状態である場合には、所定の速度だけ加算した速度となり、一時刻前における車両状態ノードが減速状態である場合には、所定の速度だけ減算した速度となる。対象となる車両の加速度aは、当該車両状態ノードが加速状態である場合には、正の所定加速度となり、当該車両状態ノードが減速状態である場合には、負の所定加速度となる。また、進行方向、及び進行方向に垂直な方向での、対象となる車両に最も近い他車両までの距離の各々は以下のように求められる。まず、車両情報取得部222により取得された対象となる車両の絶対位置と、及び絶対速度、及び時系列の取得された絶対速度から算出される加速度に基づいて、又は一時刻前における車両状態ノードに対して求められた対象となる車両の絶対位置と、一時刻前における車両状態ノードに対して算出された対象となる車両の速度と、一時刻前における車両状態ノードに対して算出された対象となる車両の加速度とに基づいて、当該車両状態ノードの時刻における対象となる車両の絶対位置が算出される。一時刻前における車両状態ノードが、車線変更を伴う場合には、車線変更後の対象となる車両の絶対位置が算出される。また、車両情報取得部222により取得された対象車両以外の車両の絶対位置、又は一時刻前における車両状態ノードに対して求められた対象車両以外の車両の絶対位置と、対象車両以外の車両の絶対速度及び絶対方向とに基づいて、当該車両状態ノードの時刻における対象車両以外の車両の位置が算出される。上記のように、当該車両状態ノードの時刻における対象となる車両の位置及び対象となる車両以外の車両の位置が算出され、算出された結果に基づいて、進行方向での及び進行方向に垂直な方向での対象となる対象となる車両に最も近い対象となる車両以外の車両までの距離の各々が求められる。
【0087】
最適制御値探索部230は、軌道候補取得部224において取得した車両101〜車両10Nの各々の軌道候補の各々に基づいて、上記(a)〜(e)の処理に従って、車両101〜車両10Nの各々の制御情報を決定する。
【0088】
最適制御値探索部230は、周囲車両判定部232と、燃費評価値演算部234とを含んで構成されている。
【0089】
周囲車両判定部232は、車両情報取得部222において取得した車両の各々の位置情報から、注目車両の位置を基準として、一定範囲内に含まれる車両の各々を抽出し、注目車両と抽出された車両の各々とを合わせて処理対象となる車両群とする。
【0090】
燃費評価値演算部234は、軌道候補取得部224において取得した処理対象となる車両群に含まれる車両の各々の軌道候補の各々を組み合わせ、軌道候補の組み合わせの各々について、上記(2)式に従って、当該組み合わせに含まれる軌道候補の各々についてコストの総和を算出し、当該組み合わせのコストを、当該軌道候補の各々のコストの総和の平均値として算出し、コストが最小となる組み合わせに含まれる注目車両の軌道候補を、注目車両の軌道として決定する。
【0091】
また、燃費評価値演算部234は、決定した注目車両の軌道のうち、初期車両状態を、注目車両の制御情報として決定し、出力部240に出力する。
【0092】
最適制御値探索部230は、車両101〜車両10Nの各々を注目車両として、上記のように、周囲車両判定部232及び燃費評価値演算部234の処理を繰り返す。
【0093】
出力部240は、最適制御値探索部230から入力される車両101〜10Nの各々の制御情報を、通信部202を介して車両101〜車両10Nの各々に出力する。なお、出力部240及び通信部202が制御手段の一例である。
【0094】
<第1の実施の形態に係る車両制御装置の作用>
次に、本発明の実施の形態に係る車両制御装置200の作用について説明する。まず、通信部202により、車両101〜車両10Nの各々から当該車両及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向が逐次受信されているときに、車両制御装置200のROMに記憶されたプログラムを、CPUが実行することにより、
図12に示す車両制御処理ルーチンが実行される。
【0095】
まず、ステップS100では、車両情報取得部222により、通信部202により逐次受信した車両101〜車両10Nの各々の当該車両及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向を受け付ける。
【0096】
ステップS101では、ネットワーク図記憶部226に記憶されている車両状態ネットワークと、各調整パラメータ(m、α)と、各車両の最大減速度とを読み込む。
【0097】
次に、ステップS102では、ステップS100において取得した車両の各々の当該車両及び当該車両の周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、ステップS101において取得した車両状態ネットワーク、各調整パラメータ、及び対象となる車両の最大減速度とに基づいて、対象となる車両について、車両状態の種類毎に、当該種類の車両状態を初期車両状態とした軌道候補の各々を取得する。
【0098】
次に、ステップS104では、対象となる全ての車両についてステップS100〜ステップS102までの処理を終了したか否かを判定する。対象となる全ての車両についてステップS100〜ステップS102までの処理を終了している場合には、ステップS106へ移行し、対象となる全ての車両についてステップS100〜ステップS102までの処理を終了していない場合には、対象となる車両を変更し、ステップS100〜ステップS104の処理を繰り返す。
【0099】
次に、ステップS106では、ステップS100において取得した車両各々の当該車両及び当該車両の周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、ステップS101において取得した各調整パラメータ、及び対象となる車両の最大減速度と、ステップS102において取得した車両各々の軌道候補の各々と、に基づいて、注目車両の制御情報を決定する。
【0100】
次に、ステップS108では、対象となる全ての車両についてステップS106の処理を終了したか否かを判定する。対象となる全ての車両についてステップS106の処理を終了している場合には、ステップS110へ移行し、対象となる全ての車両についてステップS106の処理を終了していない場合には、注目車両を変更し、ステップS106〜ステップS108の処理を繰り返す。
【0101】
ステップS110では、ステップS106において取得した車両101〜車両10Nの各々の制御情報に従って、車両の制御情報を、通信部202を介して車両101〜車両10Nの各々へ送信し、ステップS100へ移行し、ステップS100〜ステップS110の処理を繰り返す。なお、繰り返し処理は、予測時間間隔毎に行われる。
【0102】
上記ステップS102について、
図13に示す軌道候補取得処理ルーチンにおいて詳細に説明する。
【0103】
図13に示すステップS200では、ステップS101において取得した車両状態ネットワークを用いて、対象となる車両の、対象となる車両状態の種類を初期車両状態として固定した車両状態ネットワークを分離する。
【0104】
次に、ステップS202では、ステップS100において取得した車両の各々の当該車両及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、ステップS101において取得した各種パラメータ、及び対象となる車両の最大減速度と、ステップS200において取得した対象となる車両状態の種類を初期車両状態として固定した車両状態ネットワークとに基づいて、上記(2)式に従って、対象となる車両状態の種類を初期車両状態とした場合における軌道候補を取得する。
【0105】
次に、ステップS204では、対象となる車両の車両状態の種類の全てについてステップS200〜ステップS202の処理を終了したか否かを判定する。全ての車両状態の種類についてステップS200〜ステップS202の処理を終了している場合には、軌道候補取得処理ルーチンを終了し、全ての車両状態の種類についてステップS200〜ステップS202の処理を終了していない場合には、対象となる車両状態の種類を変更し、ステップS200〜ステップS204の処理を繰り返す。
【0106】
上記ステップS106について、
図14に示す最適制御値探索処理ルーチンにおいて詳細に説明する。
【0107】
図14に示すステップS300では、ステップS100において取得した車両101〜車両10Nの各々の当該車両及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向に基づいて、注目車両の近傍の車両の各々を抽出し、注目車両と抽出された車両の各々とを合わせて車両群とする。
【0108】
次に、ステップS302では、ステップS100において取得した車両101〜車両10Nの各々の当該車両及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、ステップS101において取得した各種パラメータと、ステップS102において取得したステップS300において取得した車両群に含まれる車両の各々の軌道候補の各々とに基づいて、最適な軌道候補の組み合わせを探索し、最適な軌道候補の組み合わせに含まれる注目車両の軌道候補に基づいて、注目車両の制御情報を決定し、最適制御値探索処理ルーチンを終了する。
【0109】
以上説明したように、本発明の第1の実施の形態に係る車両制御装置200によれば、車両の各々の位置情報を含む車両情報を取得し、車両の各々の複数の軌道候補を取得し、車両の各々を、注目車両とし、取得した車両の各々の軌道候補の組み合わせのうち、組み合わせの車両の各々の軌道候補の時系列パターンに含まれる各車両状態に対する、最適な軌道候補の組み合わせを探索し、探索された最適な軌道候補の組み合わせのうちの注目車両の軌道候補を、注目車両の最適な車両状態の時系列パターンとし、車両の各々について探索された車両の最適な車両状態の時系列パターンに従って、車両の各々を制御することによって、現実的な計算時間において、複数台数の車両の制御を最適化することができる。
【0110】
また、車両制御装置が搭載された複数台の車両全ての軌道を最適化することにより、単体での制御よりも燃費、安全性、及び乗り心地などの面でより良い制御を行う場合において、車両全ての軌道最適化を、現実的な計算時間で処理することを可能とする。
【0111】
また、車両を同時に制御することによって、制御下にある全ての車両の未来が既知となるため、未来を見据えた最適な制御が実現できる。
【0112】
また、車両ごとに軌道候補を取得し、その軌道候補のみを組み合わせることで、計算量を大きく削減することができる。また、軌道候補を離散化することや、事前知識での制約や、組み合わせ範囲を設置することで、更なる計算量削減を実現している。
【0113】
また、初期行動毎に性能の良い未来の軌道候補を一定数抽出することで、同時制御と計算量削減の2つを実現することができる。
【0114】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0115】
例えば、第1の実施の形態においては、最適制御値探索部230では、選択した車両を基準として一定範囲内に存在する車両を抽出する場合について説明したが、これに限定されるものではなく、選択した車両を基準として、基準車両に距離が近い順に一定数の車両を抽出してもよい。
【0116】
また、第1の実施の形態においては、車両の各々について、車両状態の種類毎に、当該車両状態を初期車両状態として、1つずつ軌道候補を取得する場合について説明したが、これに限定されるものではない。例えば、車両の各々について、車両状態の種類毎に、当該車両状態を初期車両状態として、一定数の軌道候補を取得してもよい。
【0117】
また、第1の実施の形態においては、離散状態を加速状態、減速状態、等速状態、車線変更加速状態、車線変更減速状態、及び車線変更等速状態の6種類の車両状態とする場合について説明したが、これに限定されるものではない。例えば、当該6種類の車両状態を含んだ6種類以上の離散状態としてもよい。また、加速状態として、複数の加速状態を用いてもよいし、減速状態として、複数の減速状態を用いてもよい。例えば、加速状態として、10m/s
2加速する第1加速状態と、20m/s
2加速する第2加速状態とを用いてもよい。
【0118】
また、第1の実施の形態においては、上記(i)〜(iii)の3つの制約条件の全てを用いる場合について説明したが、これに限定されるものではない。例えば、上記(i)〜(iii)の3つの制約条件のうち、少なくとも1つの制約条件を用いてもよい。
【0119】
次に、第2の実施の形態に係る車両制御装置について説明する。
【0120】
第2の実施の形態においては、車両の各々において、当該車両において軌道軌跡を求める点が第1の実施の形態と異なる。なお、第1の実施の形態に係る車両制御装置及び車両と同様の構成及び作用については、同一の符号を付して説明を省略する。
【0121】
<第2の実施の形態に係る車両の構成>
次に、本発明の第2の実施の形態に係る車両について説明する。
図15に示すように、本発明の第2の実施の形態に係る車両301は、認識センサ10と、位置測位センサ12と、演算部320と、アクセル50と、ブレーキ60と、ステアリング70と、通信部380とを備えている。なお、車両302〜車両30Nまでは、車両301と同様の構成のため説明を省略する。
【0122】
演算部320は、入力部22と、周囲車両検出装置24と、絶対位置変換装置26と、制御装置30と、ネットワーク図記憶部322と、軌道候補取得部324と、を備えている。
【0123】
ネットワーク図記憶部322は、予め構築された、予測時間間隔をt秒としたn秒後までの6
n通りの車両の車両状態を表す車両状態ネットワークと、各調整パラメータ(m、α)と、車両301の最大減速度とを記憶している。
【0124】
軌道候補取得部324は、絶対位置変換装置26において取得した、車両301及び車両301の周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、ネットワーク図記憶部322に記憶されている車両状態ネットワークと、各調整パラメータ(m、α)と、車両301の最大減速度とに基づいて、上記(2)式に従って、車両状態の種類毎に、当該種類の車両状態を初期車両状態とした軌道候補を各々取得し、通信部380を介して車両制御装置400に送信する。
【0125】
制御装置330は、車両制御装置400から受信した制御情報に基づいて、アクセル50、ブレーキ60、及びステアリング70を制御する。
【0126】
<本発明の第2の実施の形態に係る車両制御装置の構成>
次に、本発明の第2の実施の形態に係る車両制御装置について説明する。
図16に示すように、本発明の第2の実施の形態に係る車両制御装置400は、通信部402と、演算部420とを備えている。
【0127】
通信部402は、車両301〜車両30N(N=1〜N)から送信される車両の各々についての、当該車両及び当該車両の周囲車両の各々の絶対位置、絶対速度、及び絶対方向を受信する。
【0128】
演算部420は、車両情報取得部422と、パラメータ記憶部424と、最適制御値探索部430と、出力部240とを含んで構成されている。
【0129】
車両情報取得部422は、通信部402により受信した、車両301〜車両30Nから送信される車両の各々についての、当該車両及び当該車両の周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、車両301〜車両30N各々の軌道候補の各々と、を受け付ける。
【0130】
ネットワーク図記憶部226は、各調整パラメータ(m、α)と、車両各々の最大減速度とを記憶している。
【0131】
最適制御値探索部430は、車両情報取得部422において取得した車両301〜車両30Nの各々の軌道候補の各々に基づいて、上記(a)〜(e)の処理に従って、車両301〜車両30Nの各々の制御情報を決定する。
【0132】
最適制御値探索部430は、周囲車両判定部232と、燃費評価値演算部434とを含んで構成されている。
【0133】
燃費評価値演算部434は、車両情報取得部422において取得した処理対象となる車両群に含まれる車両の各々の軌道候補の各々を組み合わせ、軌道候補の組み合わせの各々について、上記(2)式に従って、当該組み合わせに含まれる軌道候補の各々についてコストの総和を算出し、当該組み合わせのコストを、当該軌道候補の各々のコストの総和の平均値として算出し、コストが最小となる組み合わせに含まれる注目車両の軌道候補を、注目車両の軌道として決定する。
【0134】
また、燃費評価値演算部434は、決定した注目車両の軌道のうち、初期車両状態を、注目車両の制御情報として決定し、出力部240に出力する。
【0135】
最適制御値探索部430は、車両301〜車両30Nの各々を注目車両として、上記のように、周囲車両判定部232及び燃費評価値演算部234の処理を繰り返す。
【0136】
出力部240は、最適制御値探索部430から入力される車両301〜30Nの各々の制御情報を、通信部402を介して車両301〜車両30Nの各々に送信する。
【0137】
<第2の実施の形態に係る車両制御装置の作用>
次に、本発明の実施の形態に係る車両制御装置400の作用について説明する。まず、通信部202により、車両301〜車両30Nの各々から当該車両及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、車両301〜車両30Nの各々の軌道候補の各々と、が逐次受信されているときに、車両制御装置400のROMに記憶されたプログラムを、CPUが実行することにより、
図17に示す車両制御処理ルーチンが実行される。
【0138】
まず、ステップS400では、車両情報取得部222により、通信部202により逐次受信した車両301〜車両30Nの各々の当該車両及び周囲車両の各々の絶対位置、絶対速度、及び絶対方向と、車両301〜車両30Nの各々の軌道候補の各々とを受け付ける。
【0139】
次に、ステップS402では、パラメータ記憶部424に記憶されている各調整パラメータ(m、α)と、各車両の最大減速度とを読み込む。
【0140】
まず、ステップS404において、ステップS400において取得した車両各々の当該車両及び当該車両の周囲車両の各々の絶対位置、絶対速度、絶対方向、及び軌道候補の各々と、ステップS402において取得した各調整パラメータ、及び対象となる車両の最大減速度と、に基づいて、注目車両の制御情報を決定する。なお、ステップS400の詳細の処理については、
図12のステップS106と同様であるものとする。
【0141】
以上説明したように、本発明の第2の実施の形態に係る車両制御装置400によれば、車両の各々の位置情報を含む車両情報を取得し、車両の各々の複数の軌道候補を取得し、車両の各々を、注目車両とし、取得した車両の各々の軌道候補の組み合わせのうち、組み合わせの車両の各々の軌道候補の時系列パターンに含まれる各車両状態に対する、最適な軌道候補の組み合わせを探索し、探索された最適な軌道候補の組み合わせのうちの注目車両の軌道候補を、注目車両の最適な車両状態の時系列パターンとし、車両の各々について探索された車両の最適な車両状態の時系列パターンに従って、車両の各々を制御することによって、現実的な計算時間において、複数台数の車両の制御を最適化することができる。
【0142】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0143】
本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。