(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024170516
(43)【公開日】2024-12-10
(54)【発明の名称】制御装置
(51)【国際特許分類】
G08G 1/00 20060101AFI20241203BHJP
G08G 1/09 20060101ALI20241203BHJP
G08G 1/16 20060101ALI20241203BHJP
B60W 50/06 20060101ALI20241203BHJP
B60W 60/00 20200101ALI20241203BHJP
B60W 30/08 20120101ALI20241203BHJP
G16Y 10/40 20200101ALI20241203BHJP
G16Y 20/20 20200101ALI20241203BHJP
G16Y 40/20 20200101ALI20241203BHJP
【FI】
G08G1/00 A
G08G1/09 V
G08G1/16 A
B60W50/06
B60W60/00
B60W30/08
G16Y10/40
G16Y20/20
G16Y40/20
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2024151885
(22)【出願日】2024-09-04
(62)【分割の表示】P 2023092491の分割
【原出願日】2018-07-11
(31)【優先権主張番号】P 2017138957
(32)【優先日】2017-07-18
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】100110928
【弁理士】
【氏名又は名称】速水 進治
(74)【代理人】
【識別番号】100127236
【弁理士】
【氏名又は名称】天城 聡
(72)【発明者】
【氏名】下平 真武
(72)【発明者】
【氏名】矢野 健一郎
(72)【発明者】
【氏名】大杉 淳
(57)【要約】
【課題】安定した自動運転制御を可能とする技術を提供する。
【解決手段】制御装置(100)は、イベント検出部(110)および制御ルール変更部(120)を備える。イベント検出部(110)は、機械学習に基づく第1の制御ルールを用いて車両が自動運転している間に、車両の自動運転時の制御ルールを変更するトリガーとなるイベントが検出されたか否かを判定する。制御ルール変更部(120)は、イベント検出部(110)によりトリガーとなるイベントが検出された場合、車両の自動運転時の制御ルールを、トリガーとなるイベントに応じた第2の制御ルールに変更する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
機械学習に基づく第1の制御ルールを用いて車両が自動運転している間に、前記車両の自動運転時の制御ルールを変更するトリガーとなるイベントが検出されたか否かを判定するイベント検出部と、
前記イベント検出部により前記トリガーとなるイベントが検出された場合、前記車両の自動運転時の制御ルールを、前記トリガーとなるイベントに応じた第2の制御ルールに変更する制御ルール変更部と、
を備える制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御装置、制御方法、およびプログラムに関する。
【背景技術】
【0002】
近年、自動運転制御に関する研究および開発が進められている。例えば、下記特許文献1では、既知の教師あり機械学習手法を利用して生成された論理式を格納する知識ベースに基づいて危険予測などを行い、車両の自動運転制御に活用する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
機械学習によって構築されるモデル(機械学習モデル)は、インプットされる学習データに応じて変化し、機械学習モデル毎に固有の特性を持つ可能性がある。このような機械学習モデルは、そのモデルを構築する際に与えられた学習データに基づく最適な制御が実行可能になるという点で基本的には好ましいと言える。一方で、そのモデルを構築する際に与えられた学習データから大きく外れる入力データ(イベント)に対しては、適切な対処が常に実行されるとは限らない。この点から、安定した制御が求められるような場面などにおいては、機械学習モデルに基づく制御が好ましくない可能性がある。
【0005】
本発明が解決しようとする課題としては、安定した自動運転制御を可能とする技術を提供することが一例として挙げられる。
【課題を解決するための手段】
【0006】
請求項1に記載の発明は、
機械学習に基づく第1の制御ルールを用いて車両が自動運転している間に、前記車両の自動運転時の制御ルールを変更するトリガーとなるイベントが検出されたか否かを判定するイベント検出部と、
前記イベント検出部により前記トリガーとなるイベントが検出された場合、前記車両の自動運転時の制御ルールを、前記トリガーとなるイベントに応じた第2の制御ルールに変更する制御ルール変更部と、
を備える制御装置である。
【0007】
本開示には、
コンピュータによって実行される制御方法であって、
機械学習に基づく第1の制御ルールを用いて車両が自動運転している間に、前記車両の自動運転時の制御ルールを変更するトリガーとなるイベントが検出されたか否かを判定する工程と、
前記イベント検出部により前記トリガーとなるイベントが検出された場合、前記車両の自動運転時の制御ルールを、前記トリガーとなるイベントに応じた第2の制御ルールに変更する工程と、
を含む制御方法が含まれる。
【0008】
本開示には、
コンピュータを、
機械学習に基づく第1の制御ルールを用いて車両が自動運転している間に、前記車両の自動運転時の制御ルールを変更するトリガーとなるイベントが検出されたか否かを判定するイベント検出手段、および、
前記イベント検出部により前記トリガーとなるイベントが検出された場合、前記車両の自動運転時の制御ルールを、前記トリガーとなるイベントに応じた第2の制御ルールに変更する制御ルール変更手段、
として機能させるためのプログラムが含まれる。
【図面の簡単な説明】
【0009】
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
【0010】
【
図1】本発明に係る制御装置の概要を説明するための図である。
【
図2】第1実施形態における制御装置の機能構成を概念的に示すブロック図である。
【
図3】第1実施形態の制御装置のハードウエア構成を例示する図である。
【
図4】第1実施形態の制御装置によって実行される処理の流れを例示するフローチャートである。
【
図5】所定のイベントと第2の制御ルールとを対応付ける情報を例示する図である。
【
図6】第2実施形態における制御装置の機能構成を概念的に示すブロック図である。
【
図7】第2実施形態の制御装置のハードウエア構成を例示する図である。
【
図8】第2実施形態の制御装置により実行される処理の流れを例示するシーケンス図である。
【発明を実施するための形態】
【0011】
[概要説明]
図1は、本発明に係る制御装置100の概要を説明するための図である。
図1の例では、制御装置100は車両Vに搭載される装置(例えば、ECU(Electronic Control Unit)など)である。制御装置100は、機械学習によって変化(最適化)していく第1の制御ルールと、機械学習によらない固定のルールである第2の制御ルールとを変更することができる。制御装置100は、詳細には後述するように、機械学習に基づく第1の制御ルールを用いて車両の自動運転が行われているときに、自動運転の制御ルールを変更するトリガーとなる所定のイベントを検出した場合、当該イベントに応じた固定のルールである、第2の制御ルールに変更する。なお、自動運転の制御ルールを変更するトリガーとなる所定のイベントに関する情報は、車両Vに搭載されるセンサデバイス300からの出力、或いは、外部装置500から得ることができる。外部装置500は、例えば、図示しない他の車両に搭載される制御装置100と同様の装置や、道路沿いに設けられる路車間通信用の装置などである。
【0012】
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、ブロック図における各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。
【0013】
[第1実施形態]
図2は、第1実施形態における制御装置100の機能構成を概念的に示すブロック図である。
図2に示されるように、本実施形態の制御装置100は、イベント検出部110および制御ルール変更部120を有する。
【0014】
イベント検出部110は、機械学習に基づく第1の制御ルールを用いて車両が自動運転している間に、所定のイベントが検出されたか否かを判定する。所定のイベントとは、車両の自動運転時の制御ルールを変更するトリガーとなるイベントである。所定のイベントは、機械学習に基づく第1の制御ルールを用いた自動運転の制御を中断するタイミングを示すイベントと表現することもできる。なお、所定のイベントの具体例については後述する。イベント検出部110は、自車両に搭載された各種センサデバイス300からの出力を解析した結果に基づいて所定のイベントを検出することができる。また、イベント検出部110は、外部装置(周囲の他車両に搭載される制御装置、或いは、道路沿いに設けられた路車間通信用の装置)と通信することによって、その外部装置を経由して所定のイベントを検出してもよい。また、イベント検出部110は、車両Vの自動運転時に使用される自動運転用地図データに含まれる動的情報に基づいて所定のイベントを検出してもよい。ここで、自動運転用地図データとは、例えば「ダイナミックマップ」などと呼ばれる地図データであり、従来の地図情報(静的情報)と、リアルタイムに変わる情報(動的情報)と、を含むデータである。動的情報は、ITS(Intelligent Transport Systems)先読み情報(周辺車両、歩行者情報、信号情報など)といった比較的短いスパン(例えば、秒単位)で変動し得る情報と、事故情報、渋滞情報、狭域気象情報など、やや短いスパン(例えば、分単位)で変動し得る情報(これを、"准動的情報"とも呼ぶ)を含む。また、静的情報は、路面情報、車線情報、3次元構造物など、比較的長いスパン(例えば、月単位)で変動し得る情報と、交通規制情報、道路工事情報、広域気象情報といったやや長めのスパン(例えば、時間単位)で変動し得る情報(これを"准静的情報"とも呼ぶ)を含む。本発明において、准静的情報は動的情報のカテゴリに分類されてもよい。なお、自動運転用地図データに含まれる静的情報および動的情報は、ここで挙げた例に限定されない。自動運転用地図データには、車両の自動運転制御に活用可能な様々な情報が含まれ得る。
【0015】
制御ルール変更部120は、機械学習に基づく第1の制御ルールを用いて車両が自動運転している間に、イベント検出部110によってイベントが検出された場合、当該車両の自動運転の制御ルールを、検出されたイベントに応じた固定のルールである、第2の制御ルールに変更する。
【0016】
各車両が自動運転時に用いる第1の制御ルールは、上述のとおり機械学習に基づくルールである。そのため、第1の制御ルールを用いたときの車両の動作には、与えられた学習データの学習結果に応じた固有の特徴が現れ得る。そして、第1の制御ルールを用いて自動運転時の制御を行った場合、この第1の制御ルールの固有の特徴によって、予測し得ない不安定な動作が行われる可能性がある。この点に関し、本実施形態では、機械学習に基づく第1の制御ルールで自動運転が行われているときに所定のイベントが検出された場合、自動運転の制御ルールが当該検出されたイベントに応じた固定のルールである、第2の制御ルールに変更される。これにより、所定のイベントが検出された場合には自動運転時の車両の動作が固定のルールに従って制御されるため、予測し得ない不安定な動作を抑制できる。
【0017】
その他にも、制御装置100を有する複数の車両が集まっている場所では、各々の車両が機械学習結果に基づく第1の制御ルールではなく固定のルールである第2の制御ルールを用いて自動運転を行うことで、各々の車両の動きの統制をとることができ、結果として、交通環境を改善させる効果が期待できる。例えば、片道3車線の道路において1つの車線に障害物があり、その障害物を避けるために当該車線を走行中の各車両が車線を変更する必要がある場合を考える。この場合に、各車両固有の特性を持つ第1の制御ルールを各車両が動いたとすると、残りの2車線のうち1つの車線に車両が集中するなどして渋滞が発生或いは悪化する、といった問題が生じ得る。このような場合に、本実施形態の制御装置100が、各車両の自動運転の制御ルールを検出されたイベントに応じた固定のルール(この場合は、例えば、「障害物の回避行動として、前方車両が移動した車線と異なる車線に移動する」といったルールなど)に切り替えて各車両の統制をとることによって、残りの2車線それぞれに車両を分散させて渋滞量を最小化させる、といったことが可能となる。
【0018】
以下、本実施形態の制御装置100について、更に詳細を説明する。
【0019】
〔ハードウエア構成〕
制御装置100の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、制御装置100の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、更に説明する。
【0020】
図3は、第1実施形態の制御装置100のハードウエア構成を例示する図である。計算機200は、制御装置100を実現する計算機である。例えば計算機200は、自動運転時の車両の動作を制御可能なECU(Electronic Control Unit)である。計算機200は、制御装置100を実現するために専用に設計された計算機であってもよいし、汎用の計算機であってもよい。
【0021】
計算機200は、バス202、プロセッサ204、メモリ206、ストレージデバイス208、入出力インタフェース210、及びネットワークインタフェース212を有する。バス202は、プロセッサ204、メモリ206、ストレージデバイス208、入出力インタフェース210、及びネットワークインタフェース212が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ204などを互いに接続する方法は、バス接続に限定されない。プロセッサ204は、マイクロプロセッサなどを用いて実現される演算処理装置である。メモリ206は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス208は、ROM(Read Only Memory)やフラッシュメモリなどを用いて実現される補助記憶装置である。
【0022】
入出力インタフェース210は、計算機200を周辺機器と接続するためのインタフェースである。計算機200には、入出力インタフェース210を介し、車両の制御に用いる各種のアナログ信号やデジタル信号が入力又は出力される。ここで、入出力インタフェース210には、アナログの入力信号をデジタル信号に変換するA/Dコンバータや、デジタルの出力信号をアナログ信号に変換するD/Aコンバータなどが適宜含まれる。
【0023】
例えば
図3において、入出力インタフェース210には、車両の制御に用いるセンサデバイス300や駆動回路400が接続されている。センサデバイス300は、LIDAR(Light Detection and Ranging)、ミリ波レーダー、ソナー、カメラなどである。図示していないが、複数のセンサデバイス300が、入出力インタフェース210を介して計算機200と接続され得る。駆動回路400は、車両のギア、エンジン、及びステアリングなどの各種機構を駆動させるための回路である。制御装置100は、駆動回路400の動作を制御することで、自動運転時の車両の動作を制御することができる。
【0024】
ネットワークインタフェース212は、計算機200を通信網に接続するためのインタフェースである。この通信網は、例えばCAN(Controller Area Network)、LAN(Local Area Network)、WAN(Wide Area Network)などである。ネットワークインタフェース212が通信網に接続する方法は、無線接続であってもよいし、有線接続であってもよい。計算機200は、無線LAN等により他車両の制御装置502や路車間通信用装置504と通信し、これらの装置から、制御装置100の処理で用いられるイベントに関する情報を取得することができる。
【0025】
ストレージデバイス208は、制御装置100の各機能構成部を実現するためのプログラムモジュールを記憶している。プロセッサ204は、このプログラムモジュールをメモリ206に読み出して実行することで、制御装置100の機能を実現する。また、ストレージデバイス208は、車両Vの自動運転時に使用される自動運転用地図データを記憶してもよい。
【0026】
〔処理の流れ〕
図4を用いて、本実施形態の制御装置100によって実行される処理の流れを概略的に説明する。
図4は、第1実施形態の制御装置100によって実行される処理の流れを例示するフローチャートである。
【0027】
まず、車両の走行モードが自動運転モードに切り替わると(S102:YES)、イベント検出部110が起動され、所定のイベントの監視処理が開始される(S104)。その後、イベント検出部110が、所定のイベントを検出した場合(S104:YES)、イベント検出部110は、所定のイベントが検出されたことを制御ルール変更部120に通知する(S106)。
【0028】
制御ルール変更部120は、S106の処理で通知されたイベントに対応する第2の制御ルールを特定する(S108)。制御ルール変更部120は、例えば、
図5に示すようなテーブルを用いて、イベント検出部110が検出したイベントに対応する第2の制御ルールを特定することができる。
図5に例示されるテーブルは、イベントの識別情報と、そのイベントの検出に応じて適用すべき第2の制御ルールの識別情報とを対応付けて記憶している。例えば、制御ルール変更部120は、S106の処理において検出されたイベントの識別子をイベント検出部110から取得し、そのイベントの識別子を基に
図5のテーブルを参照することによって、第2の制御ルールを特定することができる。そして、制御ルール変更部120は、S108の処理で読み出した第2の制御ルールを適用する指示を、自動運転を制御するECUなどに転送する(S110)。これにより、第2の制御ルールに基づいて、自動運転時の車両の動作が制御される。なお、ここでの説明はあくまで例示であり、制御ルール変更部120の動作は、
図5に例示されるテーブルを用いるものに制限されない。例えば、
図5では、イベント毎に異なる第2の制御ルールが対応付けられている例が示されているが、これに限らず、複数のイベントに対して同一の第2のルールが対応付けられていてもよい。
【0029】
以下、具体例をいくつか挙げて、より詳細な動作を説明する。
【0030】
<第1の具体例>
本具体例では、イベント検出部110が、「センサデバイス300に異常が生じていること」を所定のイベントとして検出するケースについて説明する。ここで、センサデバイス300の異常とは、光学系(レンズ等)の汚損、内部故障、センシング環境下の外乱(太陽光、雨、霧、雪、対向車のライト等)又は、エラーを意味する信号や予期しない信号の検出などによる、センサデバイス300からの出力信号の異常やセンサデバイス300と制御装置100間での通信不良を意味する。
【0031】
また、イベント検出部110が、「自動運転用地図データに含まれる動的情報」に基づいて所定のイベントを検出するケースについて説明する。自動運転用地図データは、上述したように、例えば静的な情報(路面情報、車線情報、3次元構造物などの地図情報)だけでなく動的な情報(事故情報、渋滞情報、気象情報、歩行者情報、信号情報等)を組み込んだデジタル地図である。具体的に、自動運転用地図データに含まれる動的情報とは、上記動的な情報を意味する。この動的な情報は、例えば、事故情報等を管理するサーバから車両Vに配信される。事故情報等を受信した車両Vは、自動運転用地図データにおける動的な情報を示す領域に上記事故情報等を記憶する。そして、イベント検出部110は、車両Vの自動運転時に使用される自動運転用地図データに含まれる動的な情報を参照することにより、イベントを検出することができる。
【0032】
イベント検出部110は、入出力インタフェース210を介してセンサデバイス300に接続される信号線を監視し、センサデバイス300から出力される信号の強度の測定や信号の内容の解析を行う。そして、イベント検出部110は、測定した信号の強度が所定の基準値よりも低いか否か、又は解析した信号がエラーを意味する信号や予期しない信号であるか否かを判定する。この場合、比較対象となる所定の基準値は、例えば、メモリ206やストレージデバイス208に予め記憶されている。測定した信号の強度が所定の基準値以下であること、又は解析した信号がエラーを意味する信号や予期しない信号であることが検出された場合、イベント検出部110は、「センサデバイス300に異常が生じている」旨を制御ルール変更部120に通知する。制御ルール変更部120は、イベント検出部110からの通知を基に、「センサデバイス300に異常が生じている」ときに適用すべき第2の制御ルールを特定する。この場合の第2の制御ルールは、特に限定されないが、例えば「所定の手順(例えば、ハザードランプを付けてブレーキを制御して徐々に減速するなど)で車両を停止させる」といったルールなどである。
【0033】
センサデバイス300の異常によってその出力信号の強度が下がった場合、自動運転の制御処理部が車両の周囲の状況を誤って認識する確率が上がり、自動運転時の動作が不安定となり易い。センサデバイス300の異常が検知された場合に、固定の制御動作が定義されている第2の制御ルールに従って自動運転制御を行うことによって、自動運転時の動作が不安定となることを防止することができる。なお、センサデバイス300の異常が検知された場合において、制御装置100は、第2の制御ルールに変更する代わりに、自動運転による制御を諦めて、運転手に制御権限を委譲するように構成されていてもよい。
【0034】
<第2の具体例>
本具体例では、イベント検出部110が、「片側に複数の車線を有する道路を車両が走行しているときに、当該複数の車線の少なくともいずれか1つの車線において事故が起こっていること」を所定のイベントとして検出するケースについて説明する。
【0035】
イベント検出部110は、例えば、他車両の制御装置502または道路沿いに設けられた路車間通信用装置504を経由して、事故車両の位置を示す情報(例えば、地図情報上の位置座標、事故が発生している車線の情報など)を取得することによって、所定のイベントを検出することができる。他車両の制御装置502は、例えば、当該他車両に搭載される各種センサを用いて事故車両の存在を検知した場合に、事故車両の存在を知らせる情報を、その事故車両の位置情報(例えば、地図情報上での位置座標、事故が発生している車線の情報など)と共に生成し、これらの情報を車車間通信によって伝達することができる。この場合、イベント検出部110は、他車両の制御装置502と車車間通信を行うことによって、他車両の制御装置502経由で所定のイベントを検出することができる。また、路車間通信用装置504は、事故車両の存在を知らせる情報およびその事故車両の位置情報を他車両の制御装置502から収集し、当該路車間通信用装置504の管轄エリア内に収集した情報をブロードキャストすることができる。この場合、イベント検出部110は、路車間通信用装置504からブロードキャストされた情報を受信することによって、路車間通信用装置504経由で所定のイベントを検出することができる。また、自車両に搭載されているセンサデバイス300がイメージセンサを有するカメラ等である場合、当該カメラにより生成される画像データを解析することにより、事故車両の有無(所定のイベント)を検出することもできる。同様に、自車両に搭載されているセンサデバイス300がLIDARである場合、当該LIDARのレーザー光走査により得られる点群データから生成される画像に基づいて、事故車両の有無(所定のイベント)を検出することもできる。例えば、イベント検出部110は、事故車両の画像を学習データとして用いて構築されたCNN(Convolutional Neural Network)などを利用して、画像データ内の事故車両の有無を判別することができる。
【0036】
イベント検出部110が上記所定イベントを検出した場合、一例として、制御ルール変更部120は、自動運転時に用いる制御ルールを、機械学習によって第1の制御ルールが構築される前のデフォルトルールに変更する。ここで、デフォルトルールは、機械学習が行われていない初期状態の制御ルールであり、言いかえれば、固有の特性を持たない制御ルールと言える。このようなデフォルトルールを用いて自動運転を制御することによって、機械学習により生じる固有の特性に起因する、予測し得ない不安定な動作を抑制できる。
【0037】
他の例として、複数の車両間で動作の統制を取る目的であれば、イベント検出部110が上記所定イベントを検出した場合、制御ルール変更部120は、自動運転時に用いる制御ルールを、複数の制御装置(制御装置100、他車両の制御装置502、その他の図示しない車両に搭載される制御装置)間で共通に用いられるルール(以下、"共通ルール"とも表記)に変更してもよい。共通ルールは、例えば、全世界、国単位、地域単位、車種単位、車両メーカー単位といった範囲で共通のルールとして用意され得る。これらの共通ルールは、例えば
図5に示すような形式で、メモリ206やストレージデバイス208に予め記憶されている。また、共通ルールは、例えばストレージデバイス208または車両Vの外部のサーバ装置等に記憶されている自動運転用地図データに保存されていてもよい。複数の制御装置間で共通のルールを利用することによって、各車両の自動運転時の動作のばらつきが減少し、各車両の動作の統制を取ることができる。なお、共通ルールの具体例としては、特に限定されないが、「前方の車両が移動した車線と異なる車線に移動する」などである。
【0038】
<第3の具体例>
本具体例では、イベント検出部110が、「車両が走行している車線上に障害物(落下物、路面の陥没や冠水など)が存在すること」を所定のイベントとして検出するケースについて説明する。
【0039】
イベント検出部110は、例えば、他車両の制御装置502または道路沿いに設けられた路車間通信用装置504を経由して、障害物の位置を示す情報(例えば、地図情報上の位置座標、障害物が存在している車線の情報など)を取得することによって、所定のイベントを検出することができる。他車両の制御装置502は、例えば、当該他車両に搭載される各種センサを用いて障害物を検知した場合に、障害物の存在を知らせる情報を、その障害物の位置情報(例えば、地図情報上での位置座標、障害物が存在している車線の情報など)と共に生成し、これらの情報を車車間通信によって伝達することができる。この場合、イベント検出部110は、他車両の制御装置502と車車間通信を行うことによって、他車両の制御装置502経由で所定のイベントを検出することができる。また、路車間通信用装置504は、障害物の存在を知らせる情報およびその障害物の位置情報を他車両の制御装置502から収集し、当該路車間通信用装置504の管轄エリア内に収集した情報をブロードキャストすることができる。この場合、イベント検出部110は、路車間通信用装置504からブロードキャストされた情報を受信することによって、路車間通信用装置504経由で所定のイベントを検出することができる。また、自車両に搭載されているセンサデバイス300を用いて、障害物の有無(所定のイベント)を検出することもできる。例えば、イベント検出部110は、イメージセンサを用いて生成された画像やLIDARによる走査結果(距離画像)に基づいて、路面の形状や路面上の障害物を認識することができる。
【0040】
この場合、制御ルール変更部120は、第2の具体例と同様に、自動運転時に用いる制御ルールを、機械学習によって第1の制御ルールが構築される前のデフォルトルールや複数の制御装置間で共通に用いられるルールに変更することができる。
【0041】
<第4の具体例>
本具体例では、イベント検出部110が、「他車両の制御装置502または路車間通信用装置504から、車両が取るべき動作を示す情報を第2の制御ルールとして受信したこと」を所定のイベントとして検出するケースについて説明する。
【0042】
一例として、まず、路面上の障害物や事故車両の有無を他車両の制御装置502が検出する。他車両の制御装置502は、例えば、当該他車両に備えられているセンサデバイスからの出力に基づいて、路面上の障害物や事故車両を検出することができる。他車両の制御装置502は、路面上の障害物の情報や事故車両に関する情報を路車間通信用装置504から取得することもできる。路面上の障害物や事故車両を検出した場合、他車両の制御装置502は、その障害物や事故車両を避けるように他車両を制御すると共に、後続の車両が取るべき動作を示す情報を生成する。そして、他車両の制御装置502は、生成した情報に例えば専用の識別子を付与した上で、通信装置を介して後続の車両に向けて送信する。その他の例として、路車間通信用装置504が路面上の障害物や事故車両の有無を他車両に備えられているセンサデバイスからの出力に基づいて検出してもよい。路車間通信用装置504は、例えば、路面上の障害物や事故車両に関する情報(センサの情報)を周囲の車両から収集し、当該収集した情報を用いて、対象エリアに存在する各車両の取るべき動作を決定する。路車間通信用装置504は、決定した動作を示す情報に例えば専用の識別子を付与した上で、対象エリア内にブロードキャストする。具体的な指示の例として、3車線の道路で中央の車線上に障害物を検知した場合、他車両の制御装置502又は路車間通信用装置504は、ナンバープレートの末尾の数字が奇数の車両は左の車線に移動し、該数字が偶数の車両は右の車線に移動する旨の指示を送信することができる。イベント検出部110は、自車両が取るべき動作を示す情報を他車両の制御装置502や路車間通信用装置504から受信した場合に、当該情報を第2の制御ルールとして用いて自車両の自動運転時の動作を制御する。なお、イベント検出部110は、他車両から受け取った情報に付与された識別子によって、当該情報が"自車両が取るべき動作を示す情報"であると判断することができる。本具体例では、自動運転時の動作が他車両の制御装置502や路車間通信用装置504から送信された指示に基づいて制御される。これにより、機械学習による固有の特性に起因する不安定な動作が防止される。
【0043】
[第2実施形態]
第1実施形態において、複数の制御装置(制御装置100、他車両の制御装置502、その他の図示しない車両に搭載される制御装置)間で共通のルールを用いる例を示した。本実施形態の制御装置100は、この共通ルールを更新する構成を更に備える。
【0044】
〔機能構成〕
図6は、第2実施形態における制御装置100の機能構成を概念的に示すブロック図である。
図6に示されるように、本実施形態の制御装置100は、更新情報取得部130と共通ルール更新部140とを更に備える。また、
図7に示されるように、本実施形態において、共通ルールを更新するための情報を生成するサーバ装置506が、制御装置100と通信可能に接続されている。
【0045】
更新情報取得部130は、共通ルールの更新情報をサーバ装置506から取得する。一例として、サーバ装置506は、共通ルールに基づく自動運転制御の結果(例えば、渋滞度合の変化)を報酬として学習を行い、共通ルールを更新する。具体的には、サーバ装置506は、各車両や道路周辺に設けられたセンサデバイス等から、各車両が共通ルールに従ってどのように動作したかを示す情報と、渋滞度合の変化を示す情報とを取得し、現状の共通ルールを評価する。そして、サーバ装置506は、評価結果に基づいて共通ルールを更新する。例えば、共通ルールで定義されている「動作A」が行われた結果、「渋滞度合が許容値以上悪化した」という報酬が得られたと仮定する。この場合には、「動作A」に対して一定の又は悪化度合いに応じたペナルティを与えて、動作Aが選択される優先度を下げるように共通ルールを更新する情報が生成される。ここで挙げた例以外にも、管理担当者が共通ルールの更新情報をサーバ装置506に手入力して各車両の制御装置に配信する構成を採用することもできる。サーバ装置506は、このように生成された共通ルールの更新情報を各車両に配信する。なお、サーバ装置506は、共通ルールの更新情報を用いて更新した新たな共通ルールを、各車両の制御装置に向けて配信するように構成されていてもよい。また、サーバ装置506から配信された共通ルールの更新情報は、路車間通信用装置504を経由して、各車両の制御装置100に配信されてもよい。
【0046】
共通ルール更新部140は、更新情報取得部130により取得された共通ルールの更新情報を用いて、メモリ206やストレージデバイス208に記憶されている共通ルールを更新する。
【0047】
〔ハードウエア構成〕
図7は、第2実施形態の制御装置100のハードウエア構成を例示する図である。本実施形態では、ストレージデバイス208は更新情報取得部130および共通ルール更新部140の機能を実現するためのプログラムモジュールを記憶している。プロセッサ204は、これらのプログラムモジュールをメモリ206に読み出して実行することで、更新情報取得部130および共通ルール更新部140の機能をそれぞれ実現する。また、本実施形態では、ネットワークインタフェース212を介してサーバ装置506が接続されている。
【0048】
〔動作例〕
図8を用いて、第2実施形態の制御装置100により実行される処理の流れを説明する。
図8は、第2実施形態の制御装置100により実行される処理の流れを例示するシーケンス図である。
【0049】
サーバ装置506は、各車両に搭載される複数の制御装置から、共通ルールに基づく自動運転制御のログ情報(例えば、自動運転時に選択した共通ルール上の動作と時刻を示す情報など)を収集する(S202)。また、サーバ装置506は、道路沿いに設けられた路車間通信用装置504から、渋滞度合の変化を示す情報を時刻情報と共に取得する(S204)。そして、サーバ装置506は、各車両が現状の共通ルールに従って選択した動作とそれに伴う結果(報酬)に基づいて、共通ルールの更新情報を生成する(S206)。なお、サーバ装置506は、時刻情報に基づいてS202およびS204の処理で収集された情報の対応関係を特定することができる。そして、サーバ装置506は、S206の処理で生成した共通ルールの更新情報を、各車両の制御装置に配信する(S208)。サーバ装置506は、共通ルールの更新情報を路車間通信用装置504に一旦送信し、路車間通信用装置504経由で各車両に配信してもよい。
【0050】
各車両において、更新情報取得部130によりS208で配信された共通ルールの更新情報が受信される。共通ルール更新部140は、更新情報取得部130により取得された共通ルールの更新情報に基づいて、メモリ206やストレージデバイス208に記憶されている現状の共通ルールを更新する(S210)。
【0051】
以上、本実施形態によれば、サーバ装置506から配信される共通ルールの更新情報によって、各車両に記憶される共通ルールを最適化することが可能となる。
【0052】
以上、図面を参照して実施形態及び実施例について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【0053】
この出願は、2017年7月18日に出願された日本出願特願2017-138957号を基礎とする優先権を主張し、その開示の全てをここに取り込む。