(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-26
(45)【発行日】2024-02-05
(54)【発明の名称】運転制御装置、運転制御方法及びプログラム
(51)【国際特許分類】
G08G 1/16 20060101AFI20240129BHJP
B60W 40/04 20060101ALI20240129BHJP
【FI】
G08G1/16 C
B60W40/04
(21)【出願番号】P 2020126572
(22)【出願日】2020-07-27
【審査請求日】2022-08-25
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】皆本 岳
(72)【発明者】
【氏名】金子 敏充
(72)【発明者】
【氏名】関根 真弘
【審査官】佐々木 佳祐
(56)【参考文献】
【文献】特開2019-155974(JP,A)
【文献】特開2019-192228(JP,A)
【文献】国際公開第2019/198481(WO,A1)
【文献】国際公開第2015/190212(WO,A1)
【文献】特開2019-184583(JP,A)
【文献】国際公開第2019/220206(WO,A1)
【文献】特開2019-124538(JP,A)
【文献】特開2020-051902(JP,A)
【文献】国際公開第2018/134941(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G08G 1/00-99/00
B60W 10/00-10/30
B60W 30/00-60/00
(57)【特許請求の範囲】
【請求項1】
自車両の位置情報と速度情報とを含む自車両情報、前記自車両の周辺に存在する他車両の位置情報と速度情報とを含む他車両情報、出発地点から目的地点に至るまでに走行すべき道路を示す道路情報と前記道路内で走行すべき車線を示す情報とを含む経路情報、及び、前記道路内の車線情報と前記道路の法定速度情報と前記道路の車線変更可否情報と前記道路の工事範囲を示す工事情報とを含む地図情報を取得する取得部と、
前記自車両情報と前記他車両情報と前記経路情報と前記地図情報とに基づいて、前記車線情報に含まれる各車線の車線推奨度、前記各車線の走行可否、及び、前記各車線の目標速度のうち少なくとも1つを含む車線属性情報を算出する算出部と、
前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報とを入力とし、走行車線及び速
度を出力する機械学習モデルを用
い、前記機械学習モデルにより出力された走行車線及び速度によって、前記自車両の走行車線及び速
度を決定する決定部と、
を備え、
前記機械学習モデルは、前記各車線の目標速度との差分、及び、前記目的地点までの距離に基づく報酬が用いられた強化学習によって学習される、
運転制御装置。
【請求項2】
前記算出部は、前記工事情報から、前記工事範囲を特定し、前記工事範囲を含む車線の走行可否を走行不可にする、
請求項1に記載の運転制御装置。
【請求項3】
前記算出部は、前記自車両の位置情報と前記他車両の位置情報と前記車線情報とから、前記自車両が走行する車線の周辺の車線で走行する前記他車両と前記自車両との相対距離を算出し、前記自車両の速度情報と前記他車両の速度情報とから前記自車両と前記他車両との相対速度を算出し、前記相対距離が第1閾値より小さく、かつ、前記相対速度が第2閾値より大きい場合に、前記周辺の車線の走行可否を走行不可にする、
請求項1又は2に記載の運転制御装置。
【請求項4】
前記算出部は、前記道路情報から前記各車線と前記走行すべき車線との距離dを特定し、前記距離dが小さいほど前記各車線の車線推奨度を高く算出する、
請求項1乃至3のいずれか1項に記載の運転制御装置。
【請求項5】
前記算出部は、前記道路情報から前記車線の分岐点を特定し、前記走行すべき車線が前記分岐点で別の車線に変更される場合、前記分岐点までの距離lが小さいほど、前記分岐点で分岐する車線の車線推奨度が高くなるように算出する、
請求項1乃至4のいずれか1項に記載の運転制御装置。
【請求項6】
前記算出部は、前記自車両の位置情報と前記自車両の速度情報と前記他車両の位置情報と前記他車両の速度情報と前記法定速度情報とから、前記各車線の目標速度を算出する、
請求項1乃至5のいずれか1項に記載の運転制御装置。
【請求項7】
前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報とから、前記自車両の周辺の走行可否、車線推奨度及び目標速度の少なくとも1つを画素値により表す1以上の画像を生成する生成部を更に備え、
前記決定部は、前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報との入力を前記1以上の画像によって受け付ける、
請求項1乃至6のいずれか1項に記載の運転制御装置。
【請求項8】
運転制御装置が、自車両の位置情報と速度情報とを含む自車両情報、前記自車両の周辺に存在する他車両の位置情報と速度情報とを含む他車両情報、出発地点から目的地点に至るまでに走行すべき道路を示す道路情報と前記道路内で走行すべき車線を示す情報とを含む経路情報、及び、前記道路内の車線情報と前記道路の法定速度情報と前記道路の車線変更可否情報と前記道路の工事範囲を示す工事情報とを含む地図情報を取得するステップと、
前記運転制御装置が、前記自車両情報と前記他車両情報と前記経路情報と前記地図情報とに基づいて、前記車線情報に含まれる各車線の車線推奨度、前記各車線の走行可否、及び、前記各車線の目標速度のうち少なくとも1つを含む車線属性情報を算出するステップと、
前記運転制御装置が、前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報とを入力とし、走行車線及び速
度を出力する機械学習モデルを用
い、前記機械学習モデルにより出力された走行車線及び速度によって、前記自車両の走行車線及び速
度を決定するステップと、
を含み、
前記機械学習モデルは、前記各車線の目標速度との差分、及び、前記目的地点までの距離に基づく報酬が用いられた強化学習によって学習される、
運転制御方法。
【請求項9】
前記算出するステップは、前記工事情報から、前記工事範囲を特定し、前記工事範囲に含まれる車線の走行可否を走行不可にするステップを含む、
請求項8に記載の運転制御方法。
【請求項10】
前記算出するステップは、前記自車両の位置情報と前記他車両の位置情報と前記車線情報とから、前記自車両が走行する車線の周辺の車線で走行する前記他車両と前記自車両との相対距離を算出し、前記自車両の速度情報と前記他車両の速度情報とから前記自車両と前記他車両との相対速度を算出し、前記相対距離が第1閾値より小さく、かつ、前記相対速度が第2閾値より大きい場合に、前記周辺の車線の走行可否を走行不可にするステップを含む、
請求項8又は9に記載の運転制御方法。
【請求項11】
前記算出するステップは、前記道路情報から前記各車線と前記走行すべき車線との距離dを特定し、前記距離dが小さいほど前記各車線の車線推奨度を高く算出する、
請求項8乃至10のいずれか1項に記載の運転制御方法。
【請求項12】
前記算出するステップは、前記道路情報から前記車線の分岐点を特定し、前記走行すべき車線が前記分岐点で別の車線に変更される場合、前記分岐点までの距離lが小さいほど、前記分岐点で分岐する車線の車線推奨度が高くなるように算出する、
請求項8乃至11のいずれか1項に記載の運転制御方法。
【請求項13】
前記算出するステップは、前記自車両の位置情報と前記自車両の速度情報と前記他車両の位置情報と前記他車両の速度情報と前記法定速度情報とから、前記各車線の目標速度を算出する、
請求項8乃至12のいずれか1項に記載の運転制御方法。
【請求項14】
前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報とから、前記自車両の周辺の走行可否、車線推奨度及び目標速度の少なくとも1つを画素値により表す1以上の画像を生成するステップを更に含み、
前記決定するステップは、前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報との入力を前記1以上の画像によって受け付けるステップを含む、
請求項8乃至13のいずれか1項に記載の運転制御方法。
【請求項15】
コンピュータを、
自車両の位置情報と速度情報とを含む自車両情報、前記自車両の周辺に存在する他車両の位置情報と速度情報とを含む他車両情報、出発地点から目的地点に至るまでに走行すべき道路を示す道路情報と前記道路内で走行すべき車線を示す情報とを含む経路情報、及び、前記道路内の車線情報と前記道路の法定速度情報と前記道路の車線変更可否情報と前記道路の工事範囲を示す工事情報とを含む地図情報を取得する取得部と、
前記自車両情報と前記他車両情報と前記経路情報と前記地図情報とに基づいて、前記車線情報に含まれる各車線の車線推奨度、前記各車線の走行可否、及び、前記各車線の目標速度のうち少なくとも1つを含む車線属性情報を算出する算出部と、
前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報とを入力とし、走行車線及び速
度を出力する機械学習モデルを用
い、前記機械学習モデルにより出力された走行車線及び速度によって、前記自車両の走行車線及び速
度を決定する決定部、
として機能させ、
前記機械学習モデルは、前記各車線の目標速度との差分、及び、前記目的地点までの距離に基づく報酬が用いられた強化学習によって学習される、
プログラム。
【請求項16】
前記算出部は、前記工事情報から、前記工事範囲を特定し、前記工事範囲に含まれる車線の走行可否を走行不可にする、
請求項15に記載のプログラム。
【請求項17】
前記算出部は、前記自車両の位置情報と前記他車両の位置情報と前記車線情報とから、前記自車両が走行する車線の周辺の車線で走行する前記他車両と前記自車両との相対距離を算出し、前記自車両の速度情報と前記他車両の速度情報とから前記自車両と前記他車両との相対速度を算出し、前記相対距離が第1閾値より小さく、かつ、前記相対速度が第2閾値より大きい場合に、前記周辺の車線の走行可否を走行不可にする、
請求項15又は16に記載のプログラム。
【請求項18】
前記算出部は、前記道路情報から前記各車線と前記走行すべき車線との距離dを特定し、前記距離dが小さいほど前記各車線の車線推奨度を高く算出する、
請求項15乃至17のいずれか1項に記載のプログラム。
【請求項19】
前記算出部は、前記道路情報から前記車線の分岐点を特定し、前記走行すべき車線が前記分岐点で別の車線に変更される場合、前記分岐点までの距離lが小さいほど、前記分岐点で分岐する車線の車線推奨度が高くなるように算出する、
請求項15乃至18のいずれか1項に記載のプログラム。
【請求項20】
前記算出部は、前記自車両の位置情報と前記自車両の速度情報と前記他車両の位置情報と前記他車両の速度情報と前記法定速度情報とから、前記各車線の目標速度を算出する、
請求項15乃至19のいずれか1項に記載のプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は運転制御装置、運転制御方法及びプログラムに関する。
【背景技術】
【0002】
自動運転において、走行車線及び速度を決定する技術として、機械学習を用いた方法と、ルールベースの方法とがある。機械学習を用いた方法では、相当な学習時間を要するのに加え、安全性が担保されない。一方、ルールベースの方法では、安全であるが、走行効率が悪い。
【先行技術文献】
【非特許文献】
【0003】
【文献】”High-level Decision Making for Safe and Reasonable Autonomous Lane Changing using Reinforcement Learning”, B.Mirchevska(BMW), ITSC2018.
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の技術では、安全性と走行効率とを両立して、自動運転における走行車線及び速度を決定することが難しかった。
【課題を解決するための手段】
【0005】
実施形態の運転制御装置は、取得部と算出部と決定部とを備える。取得部は、自車両の位置情報と速度情報とを含む自車両情報、前記自車両の周辺に存在する他車両の位置情報と速度情報とを含む他車両情報、出発地点から目的地点に至るまでに走行すべき道路を示す道路情報と前記道路内で走行すべき車線を示す情報とを含む経路情報、及び、前記道路内の車線情報と前記道路の法定速度情報と前記道路の車線変更可否情報と前記道路の工事範囲を示す工事情報とを含む地図情報を取得する。算出部は、前記自車両情報と前記他車両情報と前記経路情報と前記地図情報とに基づいて、前記車線情報に含まれる各車線の車線推奨度、前記各車線の走行可否、及び、前記各車線の目標速度のうち少なくとも1つを含む車線属性情報を算出する。決定部は、前記自車両情報と前記他車両情報と前記経路情報と前記地図情報と前記車線属性情報とを入力とし、走行車線及び速度を出力する機械学習モデルを用い、前記機械学習モデルにより出力された走行車線及び速度によって、前記自車両の走行車線及び速度を決定する。前記機械学習モデルは、前記各車線の目標速度との差分、及び、前記目的地点までの距離に基づく報酬が用いられた強化学習によって学習される。
【図面の簡単な説明】
【0006】
【
図2】第1実施形態の移動体の機能構成の例を示す図。
【
図4】第1実施形態の車線推奨度の算出例を説明するための図。
【
図5】第1実施形態の走行可否の算出例を説明するための図。
【
図6】第1実施形態の目標速度の算出例を説明するための図。
【
図7】第1実施形態の運転制御方法の例を示すフローチャート。
【
図8】第2実施形態の移動体の機能構成の例を示す図。
【
図9A】第2実施形態の生成部により生成される画像を説明するための図。
【
図10A】第2実施形態の生成部により生成される画像を説明するための図。
【
図11A】第2実施形態の生成部により生成される画像を説明するための図。
【
図12】第1及び第2実施形態の運転制御装置のハードウェア構成の例を示す図。
【発明を実施するための形態】
【0007】
以下に添付図面を参照して、運転制御装置、運転制御方法及びプログラムの実施形態を詳細に説明する。
【0008】
(第1実施形態)
第1実施形態の推定装置は、例えば移動体に搭載される。
【0009】
[移動体の例]
図1は第1実施形態の移動体10の例を示す図である。
【0010】
移動体10は、運転制御装置20、出力部10A、センサ10B、センサ10C、動力制御部10G及び動力部10Hを備える。
【0011】
移動体10は任意でよい。移動体10は、例えば車両、台車及び移動ロボット等である。車両は、例えば自動二輪車、自動四輪車及び自転車等である。また、移動体10は、例えば人による運転操作を介して走行する移動体でもよいし、人による運転操作を介さずに自動的に走行(自律走行)可能な移動体でもよい。
【0012】
運転制御装置20は、ECU(Electronic Control Unit)として構成される。運転制御装置20は、移動体10が走行する走行車線及び速度の少なくとも一方を決定する。例えば、運転制御装置20は、移動体10が走行する走行車線が1つしかない状況等では、速度のみを決定してもよい。
【0013】
なお、運転制御装置20は、移動体10に搭載された形態に限定されない。運転制御装置20は、静止物に搭載されていてもよい。静止物は、例えば地面に固定された物等の移動不可能な物である。地面に固定された静止物は、例えばガードレール、ポール、駐車車両及び道路標識等である。また例えば、静止物は、地面に対して静止した状態の物である。また、運転制御装置20は、クラウドシステム上で処理を実行するクラウドサーバに搭載されていてもよい。
【0014】
動力部10Hは、移動体10に搭載された駆動デバイスである。動力部10Hは、例えば、エンジン、モータ及び車輪等である。
【0015】
動力制御部10Gは、処理部20Aの決定部23から走行車線及び速度の少なくとも一方を示す情報を受け付け、動力部10Hの駆動制御をする。
【0016】
出力部10Aは情報を出力する。第1実施形態では、出力部10Aは、運転制御装置20により決定された走行車線及び速度の少なくとも一方を示す情報を出力する。
【0017】
出力部10Aは、例えば、走行車線及び速度の少なくとも一方を示す情報を送信する通信機能、走行車線及び速度の少なくとも一方を示す情報を表示する表示機能、及び、走行車線及び速度の少なくとも一方を示す情報を示す音を出力する音出力機能等を備える。出力部10Aは、例えば通信部10D、ディスプレイ10E及びスピーカ10Fの少なくとも1つを備える。なお、第1実施形態では、出力部10Aは、通信部10D、ディスプレイ10E及びスピーカ10Fを備えた構成を例にして説明する。
【0018】
通信部10Dは、走行車線及び速度の少なくとも一方を示す情報を他の装置へ送信する。例えば、通信部10Dは、通信回線を介して走行車線及び速度の少なくとも一方を示す情報を他の装置へ送信する。ディスプレイ10Eは、走行車線及び速度の少なくとも一方を示す情報を表示する。ディスプレイ10Eは、例えばLCD(Liquid Crystal Display)、投影装置及びライト等である。スピーカ10Fは、走行車線及び速度の少なくとも一方を示す情報を示す音を出力する。
【0019】
センサ10Bは移動体10の周辺の情報を取得するセンサである。例えば単眼カメラ、ステレオカメラ、魚眼カメラ及び赤外線カメラ、ミリ波レーダ、LIDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)等である。ここでは、センサ10Bの一例としてカメラを用いて説明する。カメラ(10B)の数は任意でよい。また、撮像される画像はRGBの3チャネルで構成されたカラー画像であってもよく、グレースケールで表現された1チャネルのモノクロ画像であってもよい。カメラ(10B)は、移動体10周辺の時系列の画像を撮像する。カメラ(10B)は、例えば移動体10の周辺を時系列に撮像することにより、時系列の画像を撮像する。移動体10の周辺は、例えば当該移動体10から予め定められた範囲内の領域である。この範囲は、例えばカメラ(10B)の撮像可能な範囲である。
【0020】
第1実施形態では、カメラ(10B)が、移動体10の前方を撮影方向として含むように設置されている場合を例にして説明する。すなわち、第1実施形態では、カメラ(10B)は、移動体10の前方を時系列に撮像する。
【0021】
センサ10Cは、移動体10の状態を測定するセンサである。測定情報は、例えば移動体10の速度、並びに、移動体10のハンドルの舵角を含む。センサ10Cは、例えば慣性計測装置(IMU:Inertial Measurement Unit)、速度センサ及び舵角センサ等である。IMUは、移動体10の三軸加速度及び三軸角速度を含む測定情報を測定する。速度センサは、タイヤの回転量から速度を測定する。舵角センサは、移動体10のハンドルの舵角を測定する。
【0022】
次に、第1実施形態の移動体10の機能構成の例について詳細に説明する。
【0023】
[機能構成の例]
図2は第1実施形態の移動体10の機能構成の例を示す図である。第1実施形態の説明では、移動体10が車両である場合を例にして説明する。
【0024】
移動体10は、運転制御装置20、出力部10A、センサ10B、センサ10C、動力制御部10G及び動力部10Hを備える。運転制御装置20は、処理部20A及び記憶部20Bを備える。出力部10Aは、通信部10D、ディスプレイ10E及びスピーカ10Fを備える。
【0025】
処理部20A、記憶部20B、出力部10A、センサ10B、センサ10C及び動力制御部10Gは、バス10Iを介して接続されている。動力部10Hは、動力制御部10Gに接続されている。
【0026】
なお、出力部10A(通信部10D、ディスプレイ10E及びスピーカ10F)、センサ10B、センサ10C、動力制御部10G及び記憶部20Bは、ネットワークを介して接続されていてもよい。接続に使用されるネットワークの通信方式は、有線方式であっても無線方式であってもよい。また、接続に使用されるネットワークは、有線方式と無線方式とを組み合わせることにより実現されていてもよい。
【0027】
記憶部20Bは情報を記憶する。記憶部20Bは、例えば半導体メモリ素子、ハードディスク及び光ディスク等である。半導体メモリ素子は、例えばRAM(Random Access Memory)及びフラッシュメモリ等である。なお、記憶部20Bは、運転制御装置20の外部に設けられた記憶装置であってもよい。また、記憶部20Bは、記憶媒体であってもよい。具体的には、記憶媒体は、プログラムや各種情報を、LAN(Local Area Network)やインターネットなどを介してダウンロードして記憶または一時記憶したものであってもよい。また、記憶部20Bを、複数の記憶媒体から構成してもよい。
【0028】
処理部20Aは、取得部21、算出部22及び決定部23を備える。取得部21、算出部22及び決定部23は、例えば1又は複数のプロセッサにより実現される。
【0029】
処理部20Aは、例えばCPU(Central Processing Unit)等のプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現されてもよい。また例えば、処理部20Aは、専用のIC(Integrated Circuit)等のプロセッサ、すなわちハードウェアにより実現されてもよい。また例えば、処理部20Aは、ソフトウェア及びハードウェアを併用することにより実現されてもよい。
【0030】
なお、実施形態において用いられる「プロセッサ」の文言は、例えば、CPU、GPU(Graphical Processing Unit)、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、及び、プログラマブル論理デバイスを含む。プログラマブル論理デバイスは、例えば単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及び、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA)等を含む。
【0031】
プロセッサは、記憶部20Bに保存されたプログラムを読み出し実行することで、処理部20Aを実現する。なお、記憶部20Bにプログラムを保存する代わりに、プロセッサの回路内にプログラムを直接組み込むよう構成してもよい。この場合、プロセッサは回路内に組み込まれたプログラムを読み出し実行することで、処理部20Aを実現する。
【0032】
次に、処理部20Aの各機能について説明する。
【0033】
取得部21は自車両情報、他車両情報、経路情報及び地図情報等の情報を運転制御装置20の外部から取得する。
【0034】
自車両情報は、少なくとも自車両の位置情報と速度情報とを含む。例えば、自車両の位置情報は例えば、GNSS(Global Navigation Satellite System)によって車両の現在座標を特定し、さらにセンサによって車両の方位を特定することにより取得される。また、自車両の速度情報は、例えば、車両に搭載したセンサ10C等から取得される。
【0035】
他車両情報は、自車両周辺に存在する他車両の位置情報と速度情報とを含む。他車両情報は、例えばセンサ10Bから得られた自車両との相対的な位置関係及び相対速度を基に計算される。また例えば、他車両情報は、車車間通信により周辺に存在する他車両から自車両に送信される情報を基に計算される。
【0036】
地図情報は、道路の座標、交差点の位置、道路における合流点、分岐点、道路標識情報、路面標識情報、道路ネットワーク及び道路工事情報などを含む。
【0037】
図3は第1実施形態の経路情報の例を示す図である。経路情報は、車両が走行する予定である走行予定経路上の情報を含む。走行予定経路は、例えば車両が搭載しているカーナビゲーションシステムから取得される。
図3の例では、経路情報は、車線320上の出発地点101から、車線323上の目的地点102まで走行する道路の車線、当該車線の数、及び、走行すべき車線104を含む。道路の車線を示すデータは、例えば位置座標情報と、その位置で走行すべき方位の情報とを含むウェイポイント103の配列として表現される。
図3の例では、各車線320~323が、ウェイポイント103の点列(ウェイポイント列)で示されている。
【0038】
経路情報は、道路区分毎に示される。
図3の例では、道路区分310及び311が、車線322が車線322及び323に分岐する分岐点で区切られている。目的地点102は道路区分311の車線323上にあるため、道路区分311の走行すべき車線104は車線323である。また、道路区分310においては車線323が存在しないため、車線323に最も近い車線322が走行すべき車線104である。後述の決定部23が、経路情報に含まれる車線の中から走行車線を決定する。
【0039】
図2に戻り、算出部22は、取得部21により取得された情報を基にルールベースで各車線の車線推奨度、走行可否及び目標速度のうち少なくとも1つを算出し、各車線の属性値として出力する。
【0040】
車線推奨度は、走行予定経路の目的地点102に到達するために自車両が走行することがどの程度望ましいかを表す情報である。例えば、車線推奨度は、現在位置から走行すべき車線までの距離の逆数として算出される。また例えば、車線推奨度に、自車両の現在位置から分岐点までの距離に応じた重みをつけてもよい。
【0041】
図4は第1実施形態の車線推奨度rの算出例を説明するための図である。例えば、算出部22は、道路区分410において走行すべき車線104が車線422である場合に、自車両(移動体10)が車線420上の地点Aに存在し、走行すべき車線422の中央までの距離がdである時、車線420の車線推奨度rを距離dの逆数1/dで算出する。すなわち、算出部22は、道路情報から各車線と走行すべき車線との距離dを特定し、距離dが小さいほど各車線の車線推奨度rを高く算出する。
【0042】
また、道路区分411では車線423を走行していなければ、車線423の先にある目的地に到達できない。そのため、分岐点に到達する時点で車線422上を走行する必要がある。この場合、算出部22は、自車両の現在位置から分岐点までの距離lに応じて、車線422の車線推奨度rを算出する。
図4の地点Aでは分岐点まで十分に離れており、算出部22は、地点A付近では分岐点までの距離lに関わらず、車線422までの距離dに応じて車線推奨度rを算出する。算出部22は、分岐点までの距離lがより短くなった地点B付近では、車線422の車線推奨度rを分岐点までの距離lが短くなるにつれて大きく算出する。すなわち、算出部22は、道路情報から車線の分岐点を特定し、走行すべき車線が分岐点で別の車線に変更される場合、分岐点までの距離lが小さいほど、分岐点で分岐する車線(
図4では車線422)の車線推奨度rが高くなるように算出する。
【0043】
また、車線推奨度rを算出する場合に、追越しにおいて右側から追い越すべきか、左側から追い越すべきかといった交通マナーを考慮してもよい。例えば、算出部22は、追越しが行われる場合には、自車両が走行している車線の左側の車線の車線推奨度r1よりも、右側の車線の車線推奨度r2を大きく算出する。
【0044】
算出部22が、経路情報を基にした車線推奨度rを示す車線属性情報を算出し、当該車線属性情報を決定部23に入力することで、決定部23が走行車線及び速度の少なくとも一方を決定する際に、走行すべき車線を考慮して走行車線(速度)を決定することができる。
【0045】
図5は第1実施形態の走行可否の算出例を説明するための図である。算出部22は、自車両情報、他車両情報及び地図情報から各車線の走行可否を算出する。例えば、算出部22は、
図5の地点Aにおいては、地図情報から車線520において道路の工事範囲105が存在するという情報を特定し、工事範囲105を含む車線520を走行不可とする。走行可否を示す属性値は、例えば走行可能であれば1、走行不可であれば0により表される。
【0046】
また、算出部22は、
図5のB地点においては、自車両情報と他車両情報と地図情報とを用いて、自車両周辺の車線520上に他車両106が存在することを特定し、自車両(移動体10)と他車両106の相対距離、相対速度が閾値を満たさない場合に、走行不可と判定する。具体的には、例えば算出部22は、自車両の位置情報と他車両106の位置情報と車線情報とから、自車両が走行する車線の周辺の車線で走行する他車両106と自車両との相対距離を算出する。算出部22は、自車両の速度情報と他車両の速度情報とから自車両と他車両106との相対速度を算出する。そして、算出部22は、相対距離が第1閾値より小さく、かつ、相対速度が第2閾値より大きい場合に、周辺の車線(
図5では車線520)の走行可否を走行不可にする。
【0047】
算出部22が、自車両情報、他車両情報及び地図情報から走行可否を示す車線属性情報を算出し、当該車線属性情報を決定部23に入力することで、決定部23が自車両の走行車線及び速度の少なくとも一方を決定する際に、衝突を避け安全性を考慮して走行車線(速度)を決定することができる。
【0048】
図6は第1実施形態の目標速度の算出例を説明するための図である。目標速度は、自車両が走行する車線で目標にする速度である。算出部22は、自車両の位置情報と自車両の速度情報と他車両の位置情報と他車両の速度情報と法定速度情報とから、各車線の目標速度を算出する。
【0049】
例えば、
図6では、自車両(移動体10)が、速度40km/hで車線621を走行し、自車両の前方を他車両106bが速度40km/hで走行している。車線620では、他車両106aが速度20km/hで走行している。車線622上は他車両が存在しない。この場合、例えば、算出部22は、車線620での目標速度を、前方の他車両106aに追従するように、時速20km/hと算出する。同様に、算出部22は、車線621での目標速度を、前方の他車両106bに追従するように、時速40km/hと算出する。また、算出部22は、車線622は他車両が存在しないため、地図情報から、この道路の法定速度を特定し、車線622での目標速度を法定速度(例えば60km/h)で算出する。
【0050】
算出部22が、自車両情報と他車両情報と地図情報とから目標速度を示す車線属性情報を算出し、当該目標速度を決定部23に入力することで、決定部23が自車両の走行車線及び速度の少なくとも一方を決定する際に、走行効率を考慮して走行車線(速度)を決定することができる。
【0051】
図2に戻り、決定部23は、取得部21により取得された情報(自車両情報、他車両情報、経路情報及び地図情報)と、算出部22により出力された車線属性情報とを入力とし、走行車線及び速度の少なくとも一方を出力する機械学習モデルを用いて、走行車線及び速度の少なくとも一方を決定する。
【0052】
決定部23は、この機械学習モデルを例えば強化学習により学習する。学習における報酬は、例えば、算出部22により算出された目標速度との差分を用いる。機械学習モデルは、例えば取得部21により取得された自車両情報及び他車両情報等、並びに、算出部22によって算出された走行可否等を基に、走行車線が存在しない範囲、他車両との衝突する危険性がある車線、及び、道路工事が存在し走行できない車線等を選択せずに、走行速度が目標速度に近づくように走行車線及び速度の少なくとも一方を決定する。その結果、安全を担保しつつ、効率のよい走行を実現できる。
【0053】
また、強化学習において、目標速度との差分と目的地までの距離とを報酬とし、算出部22によって算出された経路情報を考慮した車線推奨度及び目標速度を機械学習モデルに入力することで、経路情報を考慮して走行車線及び速度の少なくとも一方を決定できる。その結果、効率の良い走行を保ちつつ、目的地へ到達することができる。具体的には、例えば、走行すべき車線において自車両前方に自車両より速度が遅い他車両106が存在する時、走行すべき車線を一旦、離れ、速度が遅い車両106を追越した後、走行すべき車線に再び戻るように走行車線及び速度を決定することができる。
【0054】
また、強化学習における報酬は、衝突回数、走行するべき車線との距離、及び、現在車線からの車線変更回数等を用いてもよい。
【0055】
[運転制御方法の例]
図7は第1実施形態の運転制御方法の例を示すフローチャートである。はじめに、取得部21が、自車両(移動体10)の位置情報と速度情報とを含む自車両情報、自車両の周辺に存在する他車両106の位置情報と速度情報とを含む他車両情報、出発地点101から目的地点102に至るまでに走行すべき道路を示す道路情報と道路内で走行すべき車線を示す情報とを含む経路情報、及び、道路内の車線情報と道路の法定速度情報と道路の車線変更可否情報と道路の工事範囲105を示す工事情報とを含む地図情報を取得する(ステップS1)。
【0056】
次に、算出部22が、自車両情報と他車両情報と経路情報と地図情報とに基づいて、車線情報に含まれる各車線の車線推奨度r、各車線の走行可否、及び、各車線の目標速度のうち少なくとも1つを含む車線属性情報を算出する(ステップS2)。
【0057】
次に、決定部23が、自車両情報と他車両情報と経路情報と地図情報と車線属性情報とを入力とし、走行車線及び速度の少なくとも一方を出力する機械学習モデルを用いることによって、安全が担保された範囲から自車両の走行車線及び速度の少なくとも一方を決定する(ステップS3)。
【0058】
[第1実施形態の効果]
以上、説明した第1実施形態の運転制御装置20によれば、安全性と走行効率とを両立して、自動運転における走行車線及び速度を決定することができる。具体的には、算出部22により算出された各車線の車線属性情報を機械学習モデルに入力することで、ルールベースでの最低限の安全を担保することができる。そして、決定部23が、機械学習モデルで自車両の走行車線及び速度の少なくとも一方を決定することで、学習ベースで走行効率の良い運転行動を決定できる。
【0059】
(第2実施形態)
次に第2実施形態について説明する。第2実施形態の説明では、第1実施形態と同様の説明については省略し、第1実施形態と異なる箇所について説明する。
【0060】
第1実施形態では、取得部21により出力された情報(自車両情報、他車両情報、経路情報及び地図情報)と、算出部22により出力された車線属性情報をそのまま決定部23に入力していた。第2実施形態では、学習の効率化のために、取得部21及び算出部22により出力された情報から画像を生成し、当該画像を機械学習モデルに入力する場合について説明する。
【0061】
[機能構成の例]
図8は第2実施形態の移動体10の機能構成の例を示す図である。移動体10は、運転制御装置20-2、出力部10A、センサ10B、センサ10C、動力制御部10G及び動力部10Hを備える。運転制御装置20-2は、処理部20A及び記憶部20Bを備える。
【0062】
処理部20Aは、取得部21、算出部22、決定部23及び生成部24を備える。第2実施形態では、生成部24が更に追加されている。
【0063】
生成部24は、自車両情報と他車両情報と経路情報と地図情報と車線属性情報とから、自車両(移動体10)の周辺の走行可否、車線推奨度及び目標速度の少なくとも1つを画素値により表す1以上の画像を生成する。生成部24は、算出部22が出力する車線属性情報のうち少なくとも一つを用いて少なくとも一枚の画像を生成する。なお、生成部24は、複数の属性値を用いて、複数の画像を生成し、当該複数の画像を決定部23に入力してもよい。
【0064】
図9Aは第2実施形態の生成部24により生成される画像を説明するための図である。
図9Bは、
図9Aの地点A付近の情報を示す画像の例を示す図である。
図9Cは、
図9Bの地点B付近の情報を示す画像の例を示す図である。
図9B及びCの例では、画像上側が自車両(移動体10)の進行方向を示す。縦方向に三分割された領域120~122は、それぞれ左から車線920、921、922を表す領域である。画像中央の矩形110は自車両を表し、車線921上を走行していることを表す。
【0065】
図9B及びCの画像では、車線920~922の走行可否が、各車線の領域120~122を塗りつぶす色の濃淡(画素値)で表現されている。例えば、
図9Bの例では、自車両近傍に障害物が存在しないため、算出部22が、全車線が走行可であることを示す車線属性情報を出力する。そのため、生成部24は、全ての車線が走行可であることを表す
図9Bの画像を生成する。一方、
図9Cの例では、車線920上の自車両近傍に障害物(他車両106)が存在するため、算出部22が車線920は走行不可であることを示す車線属性情報を出力する。そのため、生成部24が、車線920を表す領域120は走行不可であり、車線921及び922を表す領域121及び122は走行可であることを表す
図9Cの画像を生成する。
【0066】
図10Aは第2実施形態の生成部24により生成される画像を説明するための図である。
図10Bは、
図10Aの地点A付近の情報を示す画像の例を示す図である。
図10Cは、
図10Bの地点B付近の情報を示す画像の例を示す図である。
【0067】
図10B及びCの画像では、車線920~922の車線推奨度が、各車線の領域120~122を塗りつぶす色の濃淡(画素値)で表現されている。例えば、
図10B及びCの例では、車線推奨度が高い車線を示す領域ほど濃い色で表されている。
図10Bの例では、車線1022を表す領域122が最も車線推奨度が高いため最も濃い色となる。また
図10Cの例では、自車両周辺の車線922において分岐点に近いほど車線推奨度が高くなるため、車線922を表す領域122については自車進行方向に向かって色がより濃くなっている。
【0068】
図11Aは第2実施形態の生成部24により生成される画像を説明するための図である。
図11Bは、
図11Aの自車両付近の情報を示す画像の例を示す図である。
図11Bの画像では、車線920~922の目標速度が、各車線の領域120~122を塗りつぶす色の濃淡(画素値)で表現されている。例えば、
図11Bの例では、目標速度が高い車線を示す領域ほど濃い色で表されている。
図11Bの例では、車線1122を表す領域122が最も目標速度が高い(60km/h)ため最も濃い色となる。
【0069】
以上説明したように、第2実施形態の運転制御装置20-2では、生成部24が、自車両情報と他車両情報と経路情報と地図情報と車線属性情報とから、自車両(移動体10)の周辺の走行可否、車線推奨度及び目標速度の少なくとも1つを画素値により表す1以上の画像を生成する。そして、決定部23が、自車両情報と他車両情報と経路情報と地図情報と車線属性情報との入力を、1以上の画像によって受け付ける。
【0070】
これにより第2実施形態の運転制御装置20-2によれば、機械学習モデルの入力を画像データ形式にすることで、当該機械学習モデルの学習をより効率化できる。
【0071】
最後に、第1及び第2実施形態の運転制御装置20(20-2)のハードウェア構成の例について説明する。
【0072】
[ハードウェア構成の例]
図12は第1及び第2実施形態の運転制御装置20(20-2)のハードウェア構成の例を示す図である。運転制御装置20は、制御装置201、主記憶装置202、補助記憶装置203、表示装置204、入力装置205及び通信装置206を備える。制御装置201、主記憶装置202、補助記憶装置203、表示装置204、入力装置205及び通信装置206は、バス210を介して接続されている。
【0073】
なお、運転制御装置20は、表示装置204、入力装置205及び通信装置206は備えていなくてもよい。例えば、運転制御装置20が他の装置と接続される場合、当該他の装置の表示機能、入力機能及び通信機能を利用してもよい。
【0074】
制御装置201は補助記憶装置203から主記憶装置202に読み出されたプログラムを実行する。制御装置201は、例えばCPU等の1以上のプロセッサである。主記憶装置202はROM(Read Only Memory)、及び、RAM等のメモリである。補助記憶装置203はメモリカード、及び、HDD(Hard Disk Drive)等である。
【0075】
表示装置204は情報を表示する。表示装置204は、例えば液晶ディスプレイである。入力装置205は、情報の入力を受け付ける。入力装置205は、例えばハードウェアキー等である。なお表示装置204及び入力装置205は、表示機能と入力機能とを兼ねる液晶タッチパネル等でもよい。通信装置206は他の装置と通信する。
【0076】
運転制御装置20で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、メモリカード、CD-R、及び、DVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記憶媒体に記憶されてコンピュータ・プログラム・プロダクトとして提供される。
【0077】
また運転制御装置20で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また運転制御装置20が実行するプログラムを、ダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。
【0078】
また運転制御装置20で実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
【0079】
運転制御装置20で実行されるプログラムは、運転制御装置20の機能のうち、プログラムにより実現可能な機能を含むモジュール構成となっている。
【0080】
プログラムにより実現される機能は、制御装置201が補助記憶装置203等の記憶媒体からプログラムを読み出して実行することにより、主記憶装置202にロードされる。すなわちプログラムにより実現される機能は、主記憶装置202上に生成される。
【0081】
なお運転制御装置20の機能の一部を、IC等のハードウェアにより実現してもよい。ICは、例えば専用の処理を実行するプロセッサである。
【0082】
また複数のプロセッサを用いて各機能を実現する場合、各プロセッサは、各機能のうち1つを実現してもよいし、各機能のうち2つ以上を実現してもよい。
【0083】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0084】
10 移動体
10A 出力部
10B センサ
10C センサ
10D 通信部
10E ディスプレイ
10F スピーカ
10G 動力制御部
10H 動力部
10I バス
20 運転制御装置
21 取得部
22 算出部
23 決定部
24 生成部
201 制御装置
202 主記憶装置
203 補助記憶装置
204 表示装置
205 入力装置
206 通信装置
210 バス