(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024179785
(43)【公開日】2024-12-26
(54)【発明の名称】制御装置
(51)【国際特許分類】
B60W 50/08 20200101AFI20241219BHJP
【FI】
B60W50/08
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023098920
(22)【出願日】2023-06-16
(71)【出願人】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】高橋 祐希
(72)【発明者】
【氏名】金子 拓央
【テーマコード(参考)】
3D241
【Fターム(参考)】
3D241BA00
3D241CE08
3D241DD06Z
3D241DD12Z
3D241DD13Z
(57)【要約】
【課題】ユーザの振舞に適合した移動体の制御を遂行する精度の向上を図る。
【解決手段】本開示の一側面に係る制御装置は、複数の訓練済み制御モデルのうちの1つ以上の訓練済み制御モデルの演算を実行することで、1つ以上のパスを生成し、対象ユーザの振舞を監視し、対象ユーザの振舞を監視した結果に応じて、生成された1つ以上のパスから1つのパスを選択し、かつ選択されたパスに従って、移動体の移動を制御する。各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した移動体の移動を制御するためのパスを生成する能力を獲得している。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の訓練済み制御モデルを記憶する記憶部、及び
制御部、
を備える制御装置であって、
前記制御部は、
前記複数の訓練済み制御モデルのうちの1つ以上の訓練済み制御モデルの演算を実行することで、1つ以上のパスを生成すること、
対象ユーザの振舞を監視すること、
前記対象ユーザの振舞を監視した結果に応じて、生成された前記1つ以上のパスから1つのパスを選択すること、及び
選択されたパスに従って、移動体の移動を制御すること、
を実行するように構成され、並びに
前記各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した前記移動体の移動を制御するためのパスを生成する能力を獲得している、
制御装置。
【請求項2】
前記1つ以上の訓練済み制御モデルは、前記ユーザによる指示のない状況におけるパスを生成する能力を獲得している第1訓練済み制御モデルを含み、
前記1つのパスを選択することは、前記対象ユーザからの指示がない場合に、前記第1訓練済み制御モデルにより生成されたパスを選択することを含む、
請求項1に記載の制御装置。
【請求項3】
前記1つ以上の訓練済み制御モデルは、前記ユーザによる対応する指示のある状況におけるパスを生成する能力をそれぞれ獲得している1つ以上の第2訓練済み制御モデルを含み、
前記1つのパスを選択することは、前記対象ユーザによる指示に応じて、前記1つ以上の第2訓練済み制御モデルのうちのいずれかにより生成されたパスを選択することを含む、
請求項1に記載の制御装置。
【請求項4】
前記移動体は、車両であり、
前記1つ以上の第2訓練済み制御モデルは、訓練済み車線変更モデルを含み、
前記1つのパスを選択することは、前記対象ユーザによる車線変更の指示に応じて、前記訓練済み車線変更モデルにより生成されたパスを選択することを含む、
請求項3に記載の制御装置。
【請求項5】
前記制御部は、生成された1つ以上のパスそれぞれの安全度を評価することを更に実行するように構成され、
前記1つのパスを選択することは、前記安全度が低いと評価されるパスを除外した上で、生成された前記1つ以上のパスから1つのパスを選択することにより構成される、
請求項1から4のいずれか1項に記載の制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、自動運転車両の制御技術に関する。
【背景技術】
【0002】
特許文献1には、訓練済みのニューラルネットワークを使用して、ルート、GPSデータ及びセンサデータから車両のコマンドを決定するように構成された自律的車両制御のためのシステムが提案されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示の目的の一つは、ユーザの振舞に適合した移動体の制御を遂行する精度の向上を図るための技術を提供することである。
【課題を解決するための手段】
【0005】
本開示の第1態様に係る制御装置は、複数の訓練済み制御モデルを記憶する記憶部、及び制御部を備える。前記制御部は、前記複数の訓練済み制御モデルのうちの1つ以上の訓練済み制御モデルの演算を実行することで、1つ以上のパスを生成すること、対象ユーザの振舞を監視すること、前記対象ユーザの振舞を監視した結果に応じて、生成された前記1つ以上のパスから1つのパスを選択すること、及び選択されたパスに従って、移動体の移動を制御すること、を実行するように構成される。前記各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した前記移動体の移動を制御するためのパスを生成する能力を獲得している。各訓練済み制御モデルは、ニューラルネットワークにより構成されてよく、機械学習の手法には深層学習が用いられてよい。
【発明の効果】
【0006】
本開示によれば、ユーザの振舞に適合した移動体の制御を遂行する精度の向上を図ることができる。
【図面の簡単な説明】
【0007】
【
図1】
図1は、本開示が適用される場面の一例を模式的に示す。
【
図2】
図2は、本開示の制御モデル構成の一例を模式的に示す。
【
図3】
図3は、本開示の第2制御モデル構成の一例を模式的に示す。
【
図4】
図4は、本開示の制御装置のハードウェア構成の一例を模式的に示す。
【
図5】
図5は、本開示の制御装置による制御に関する処理手順の一例を示す。
【発明を実施するための形態】
【0008】
特許文献1等の従来の方法によれば、訓練済みの機械学習モデルを使用することで、自動運転システムを構築することができる。しかしながら、本件発明者は、従来の方法には、次のような問題点があることを見出した。例えば、車線変更、路肩退避等の特定の態様の走行をユーザの振舞に応じて実行することを想定する。ユーザの振舞は、例えば、ウィンカー操作、ドライバに異常がある等である。このようなユーザの振舞を含めた上で、各態様の走行のための訓練データを収集するのは、パターンが膨大であり困難である。また、発生頻度も大きく相違し得る。このように発生頻度の大きく異なるシーンが混在する条
件下で、ユーザの振舞を入力として受け入れ、各振舞に適合するパスを生成するための訓練済みの機械学習モデルを生成することを想定する。この場合、得られる訓練済みモデルにおいて、ユーザの振舞に適合する車両の制御を高精度に遂行することが困難である可能性がある。例えば、極めて発生頻度の低いユーザの振舞の学習が不十分になり、これにより、訓練済みモデルによる車両制御の精度の低下を招く恐れがある。なお、この問題点は、車両の種類を問わず生じ得る。また、このような問題点が生じるのは、車両を制御する場面に限られない。移動を制御する点では、車両以外の移動体でも同様である。そのため、車両以外のあらゆる移動体を制御する場面でも、同様の問題点が生じ得る。
【0009】
これに対して、本開示の第1態様に係る制御装置は、複数の訓練済み制御モデルを記憶する記憶部、及び制御部を備える。制御部は、複数の訓練済み制御モデルのうちの1つ以上の訓練済み制御モデルの演算を実行することで、1つ以上のパスを生成すること、対象ユーザの振舞を監視すること、対象ユーザの振舞を監視した結果に応じて、生成された1つ以上のパスから1つのパスを選択すること、及び選択されたパスに従って、移動体の移動を制御すること、を実行するように構成される。各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した移動体の移動を制御するためのパスを生成する能力を獲得している。
【0010】
本開示の第1態様では、各訓練済み制御モデルは、ユーザの振舞に関連した移動態様に応じて用意される。すなわち、各訓練済み制御モデルは、他の態様による移動を担当しないため、各訓練済み制御モデルの機械学習では、他の移動態様のデータの混在を抑えることができる。理想的には、対応する移動態様に特化して学習データが収集され、得られた学習データで訓練済みモデルが生成されてよい。本開示の第1態様では、訓練済み制御モデルを移動態様に応じて用意し、対象ユーザの振舞に対応する訓練済み制御モデルにより生成されたパスを移動体の制御に使用するようにする。これにより、ユーザの振舞に適合した移動体の制御を遂行する精度の向上を期待することができる。
【0011】
なお、上記態様に係る制御装置の別の形態として、本開示の一側面は、以上の各構成要素の全部又はその一部を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記憶した、コンピュータ等の機械が読み取り可能な記憶媒体であってもよい。ここで、機械が読み取り可能な記憶媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。
【0012】
[1 適用例]
図1は、本開示を適用した場面の一例を模式的に示す。本実施形態に係る制御装置1は、対象の移動体Mの自動的な移動を制御するように構成された1台以上のコンピュータである。本実施形態では、制御装置1は、移動体Mに搭載され、複数の訓練済み制御モデル30を保持する。各訓練済み制御モデル30は、機械学習により、ユーザの対応する振舞に関連した移動体の移動を制御するためのパスを生成する能力を獲得している。
【0013】
制御装置1は、複数の訓練済み制御モデル30のうちの1つ以上の訓練済み制御モデル35の演算を実行することで、1つ以上のパス50を生成する。制御装置1は、対象ユーザOUの振舞40を監視し、対象ユーザOUの振舞40を監視した結果に応じて、生成された1つ以上のパス50から1つのパス55を選択する。そして、制御装置1は、選択されたパス55に従って、移動体Mの移動を制御する。
【0014】
本実施形態では、ユーザの振舞に関連した移動態様に応じて訓練済み制御モデル30を用意し、対象ユーザOUの振舞40に対応する訓練済み制御モデル35により生成されたパス55を移動体Mの制御に使用する。各訓練済み制御モデル30は、対応する移動態様に特化して生成することができる。そのため、本実施形態によれば、ユーザの振舞に適合
した移動体の制御を遂行する精度の向上を期待することができる。
【0015】
なお、本実施形態では、対象ユーザOUの振舞40は、各訓練済み制御モデル30の入力として使用されなくてよい。すなわち、対象ユーザOUの振舞40は、各訓練済み制御モデル30のパスを生成する説明変数として用いられなくてよい。これにより、制御モデル30の構造をシンプルにすることができ、その結果、各訓練済み制御モデル30によるパスの生成精度の向上を期待することができる。
【0016】
また、ユーザの振舞に対応する訓練済み制御モデルを選択した後に訓練済み制御モデルの演算を実行する形態が他の形態として考えられる。しかしながら、この形態では、ユーザの振舞に対応する訓練済み制御モデルを選択した後に、訓練済み制御モデルの演算処理を実行する分だけ、ユーザの振舞を移動体の制御に反映するまでの時間が長くなってしまう。これに対して、本実施形態に係る制御装置1は、使用の有無に関係なく、使用する蓋然性のある訓練済み制御モデル35の演算をすべて実行し、対象ユーザOUの振舞40に応じて、演算結果(1つ以上のパス50)から使用するパス55を選択してよい。これにより、ユーザの振舞を移動体の制御に反映するまでの時間を短くすることができる。
【0017】
(移動体)
機械制御により自動的に移動可能であれば、移動体Mの種類は、実施の形態に応じて適宜選択されてよい。移動体Mは、例えば、車両、飛行体、船舶、ロボット装置等の移動可能な装置であってよい。飛行体は、ドローン等の無人機及び有人機の少なくともいずれかであってよい。一例では、
図1のとおり、移動体Mは、車両であってよい。この場合、ユーザの振舞に適合した自動運転を遂行する精度の向上を期待することができる。なお、車両の種類(車輪数、動力源、大きさ等)は任意に選択されてよい。典型例として、移動体Mは、レベル2以上の自動運転の能力を有した自動車であってよい。
【0018】
(動作を制御すること)
一例では、対象の移動体Mの動作を制御することは、対象の移動体Mを直接的に制御することにより構成されてよい。他の一例では、移動体Mは、例えば、コントローラ等の専用の制御装置を備えてよい。この場合、制御装置1による対象の移動体Mの動作を制御することは、当該専用の制御装置に導出結果を与えることで、対象の移動体Mを間接的に制御することにより構成されてよい。制御装置1は任意の場所に配備されてよい。一例では、
図1に示されるように、制御装置1は、移動体Mに搭載されてよい。他の一例では、制御装置1は、移動体Mから離れて配置され、移動体Mを遠隔的に制御してもよい。制御装置1は、移動体Mの自動制御モードから手動制御モードに及び手動制御モードから自動制御モードに、任意の操作により任意のタイミングで切替可能に構成されてよい。なお、移動体Mが車両の場合、典型的には、対象ユーザOUは、ドライバ又はドライバ以外の同乗者であってよい。対象ユーザOUは、移動体Mに応じて適宜決定されてよい。
【0019】
(1つ以上の訓練済み制御モデル)
本実施形態では、必ずしも、用意される複数の訓練済み制御モデル30全ての演算を常に実行し、パスを生成しなければならない訳ではない。使用する蓋然性のある訓練済み制御モデル35が、用意される複数の訓練済み制御モデル30の中から任意の方法で選択されてよい。一例では、位置、ルート、通路の種別(車両の場合、例えば、高速道路、一般道等)等の移動シーンに応じて、パスの生成に使用する1つ以上の訓練済み制御モデル35が選択されてよい。具体例として、移動体Mが車両であり、制御装置1が、訓練済み制御モデル30として、左車線変更のパスを生成する第1制御モデル、右車線変更のパスを生成する第2制御モデル、及び車線維持のパスを生成する第3制御モデルを備えている場面を想定する。この場面において、最も左側の車線を走行しているシーンでは、制御装置1は、第2制御モデル及び第3制御モデルそれぞれを使用してパスを生成するのに対して
、第1制御モデルのパスは選択する余地がないため、第1制御モデルによるパスの生成は省略されてよい。一方で、左右両方向に車線変更可能なシーンでは、制御装置1は、第1制御モデル~第3制御モデルそれぞれを使用してパスを生成してよい。
【0020】
(パス)
パス(制御モデルの出力)は、移動体Mの動作を制御可能であれば、その形式は、特に限られなくてよく、実施の形態に応じて適宜決定されてよい。一例では、パス(50、55)は、1つ以上の制御指令により構成されてよい。制御指令は、移動体Mの制御量を示すように構成されてよい。他の一例では、パス(50、55)は、移動体Mの未来の移動経路を示すように構成され、1つ以上の制御指令を導出するために使用されてよい。この場合、1つ以上の制御指令が、パス55から任意の方法で決定されてよい。制御モデル(30、35)は、パスプランナと称されてもよい。
【0021】
なお、制御指令は、移動体Mの動作に関する。制御指令の構成は、実施の形態に応じて適宜選択されてよい。一例では、制御指令は、加速、減速、操舵又はこれらの組み合わせにより構成されてよい。加速及び減速は、ギアチェンジを含んでよい。制御指令は、例えば、アクセル制御量、ブレーキ制御量、ハンドル操舵角等の移動体Mの制御量(制御指示値、制御出力量)を示すように構成されてよい。また、制御指令は、移動体Mの操作に関する指令を更に含んでよい。一例として、移動体Mが車両である場合、制御指令は、ウィンカー、ハザード、クラクション、通信処理(例えば、センタにデータを送信する、緊急コールを発信する等)等の車両操作を含んでよい。
【0022】
(訓練済み制御モデル)
制御モデル30は、機械学習により調整可能な1つ以上の演算パラメータを有する機械学習モデルにより構成される。1つ以上の演算パラメータは、目的とする推論(本件では、パスの導出)の演算に使用される。機械学習は、学習データを使用して、演算パラメータの値を調整(最適化)することである。機械学習モデルの構成及び種類はそれぞれ、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。機械学習モデルは、例えば、ニューラルネットワーク、サポートベクタマシン、回帰モデル、決定木モデル等により構成されてよい。機械学習の方法は、採用する機械学習モデルに応じて、適宜選択されてよい(例えば、誤差逆伝播法等)。一例として、複数の制御モデル30のうちの少なくともいずれかは、少なくとも部分的にニューラルネットワークにより構成されてよい。ニューラルネットワークの構造は、実施の形態に応じて適宜決定されてよく、例えば、入力層から出力層までの層の数、各層の種類、各層に含まれるノード(ニューロン)の数、各層のノード同士の結合関係等により特定されてよい。一例では、ニューラルネットワークは、再帰構造を有してよい。また、ニューラルネットワークは、例えば、全結合層、畳み込み層、プーリング層、逆畳み込み層、アンプーリング層、正規化層、ドロップアウト層、LSTM(Long short-term memory)等の任意の層を含んでよい。ニューラルネットワークは、Attention機構等の任意の機構を有してよい。ニューラルネットワークは、GNN
(Graph neural network)、diffusionモデル、生成モデル(例えば、Generative Adversarial Network、Transformer等)等の任意のモデルを含んでよい。ニューラルネットワークを制御モデルに使用する場合、制御モデルに含まれる各ノード間の結合の重み及び各ノードの閾値が、演算パラメータの一例である。なお、機械学習モデルを採用する場合、制御モデルは、end-to-endモデルの構造で構成されてよい。
【0023】
各制御モデル30は、移動体Mの環境に応じてパスを導出するように構成される。環境は、移動体M自身及び周囲の少なくとも一方で観測される事象である。一例では、少なくとも一部の環境は、移動体Mの内部又は外部に配置された1つ以上のセンサSにより観測されてよい。センサSは、移動体Mの移動する任意の環境を観測可能であれば、その種類は、特に限られなくてよく、実施の形態に応じて適宜選択されてよい。一例では、1つ以
上のセンサSは、カメラ(画像センサ)、レーダ、LiDAR(Light Detection And Ranging)、ソナー(超音波センサ)、赤外線センサ、GNSS(Global Navigation Satellite System)/GPS(Global Positioning Satellite)モジュール等を含んでよい。
【0024】
移動体Mの環境からパスを導出可能であれば、制御モデル30の入出力の形態は、特に限られなくてよく、実施の形態に応じて適宜選択されてよい。一例では、複数の制御モデル30のうちの少なくともいずれかは、1時点以上のセンサSの観測データ120からパスを導出するように構成されてよい。他の一例では、複数の制御モデル30のうちの少なくともいずれかは、周辺環境の認識結果からパスを導出するように構成されてよい。この場合、制御装置1は、センサSの観測データ120から周辺環境の認識結果を推論する解析モデルを更に備えてよい。或いは、訓練済み制御モデル30は、当該解析モデルを含んでよい。解析モデルは、任意に構成されてよい。一例では、解析モデルは、機械学習モデルにより構成されてよい。また、複数の制御モデル30のうちの少なくともいずれかの入力には、その他の情報が任意で追加されてよい。複数の制御モデル30のうちの少なくともいずれかは、例えば、設定速度、制限速度、位置、地図情報、ナビ情報等の任意の情報の入力を更に受け付けるように構成されてよい。また、一例では、制御モデル30は、パスを直接的に出力するように構成されてよい。他の一例では、制御モデル30は、パスを間接的に出力するように構成され、制御モデル30の出力に対して任意の情報処理(解釈処理)を実行することでパスが得られてもよい。
【0025】
なお、典型的には、複数の訓練済み制御モデル30は、それぞれ別個(独立)に構成されてよい。ただし、複数の訓練済み制御モデル30の構成は、このような例に限られなくてよい。本実施形態の一例では、複数の訓練済み制御モデル30のうちの2つ以上の制御モデルは、一体的に構成されてもよい。例えば、1つのモデルが、入力側に配置された上記解析モデル、及び解析モデルの出力からパスをそれぞれ導出するn個の出力部分を備えてよい(nは、2以上の自然数)。この1つのモデルは、n個の訓練済み制御モデル30と見なされてよい。すなわち、本実施形態では、モデルの構造が一体的であっても、当該モデルが、それぞれパスを出力するように構成されるn個の出力部を備える場合、当該モデルを保持していることは、n個の訓練済み制御モデル30を保持していることと見なされてよい。また、与えた条件に応じた出力をするように構成される条件付きモデルについても同様に取り扱われてよい。すなわち、複数の訓練済み制御モデル30は、入力された条件(クラス/カテゴリ)に応じたパスを出力するように構成された条件付きモデルを含んでよい。この場合、条件付きモデルに与える条件を変えて、条件付きモデルの演算を繰り返すことで、それぞれ与えた条件に応じた複数のパスを導出することができる。そのため、1つの条件付きモデルがn個の条件に対応するように構成されている場合、この1つの条件付きモデルを保持していることは、n個の訓練済み制御モデル30を保持していることと見なされてよい。
【0026】
(振舞の監視)
振舞40を監視することは、特定の入力がないこと及び特定の入力があることの少なくとも一方を監視することにより構成されてよい。特定の入力があることを監視することは、入力の種類(指示)を識別することを含んでよい。
【0027】
また、対象ユーザOUの振舞40は任意の方法で監視されてよい。一例では、制御装置1は、画像、音声、操作子等の入力の有無を介して対象ユーザOUの振舞40を監視してよい。画像を介して振舞40を監視する場合、振舞40は、ジェスチャ、対象ユーザOUの状態(例えば、対象ユーザOUが異常状態に陥っている等)等を含んでよい。操作子は、移動体Mの操作に関するあらゆる種類のデバイスを含んでよい。一例では、移動体Mが車両の場合、操作子は、例えば、ウィンカー、ハザード、クラクション等の車両に設けられた操作具を含んでよい。
【0028】
本実施形態の一例では、振舞40を監視するため、モニタリング装置MDが用いられてよい。モニタリング装置MDは、例えば、カメラ(画像センサ)、マイクロフォン、操作子、操作子の操作量を計測するセンサ等を含んでよい。対象ユーザOUの振舞40は、モニタリング装置MDによりリアルタイムに得られる観測データ125から任意の方法で識別されてよい。対象ユーザOUの振舞40は、例えば、画像解析、音声解析、操作子の操作内容の解析等の公知の解析手法により、観測データ125から識別されてよい。
【0029】
(振舞-制御モデルの対応関係)
用意する訓練済み制御モデル30とユーザの振舞との対応関係は、実施の形態に応じて適宜決定されてよい。すなわち、ユーザのどのような振舞に対応して訓練済み制御モデル30を用意するかは、実施の形態に応じて適宜決定されてよい。また、振舞に対応した用意された制御モデル30に対して、どのような移動態様のパスを生成する能力を獲得させるかも、実施の形態に応じて適宜決定されてよい。
【0030】
図2は、本実施形態に係る制御モデル構成の一例を模式的に示す。
図2の例では、複数の訓練済み制御モデル30は、ユーザによる指示のない状況におけるパスを生成する能力を獲得している第1訓練済み制御モデル31を含んでいる。これに応じて、1つ以上の訓練済み制御モデル35は、第1訓練済み制御モデル31を含んでよい。1つのパス55を選択することは、対象ユーザOUからの指示がない場合に、第1訓練済み制御モデル31により生成されたパスを選択することを含んでよい。これにより、対象ユーザOUの振舞40として、任意の指示がない場面において、移動体Mの自動制御を実施することができる。なお、一例では、指示がないことは、移動体Mに対して、画像、音声、操作子等の入力による特定の指示がないことにより構成されてよい。
【0031】
また、
図2の例では、複数の訓練済み制御モデル30は、ユーザによる対応する指示のある状況におけるパスを生成する能力をそれぞれ獲得している1つ以上の第2訓練済み制御モデル32を更に含んでいる。これに応じて、1つ以上の訓練済み制御モデル35は、1つ以上の第2訓練済み制御モデル32を含んでよい。1つのパス55を選択することは、対象ユーザOUによる指示に応じて、1つ以上の第2訓練済み制御モデル32のうちのいずれかにより生成されたパスを選択することを含んでよい。これにより、対象ユーザOUの振舞40として、任意の指示がある場合において、当該指示に応じた移動体Mの自動制御を実施することができる。なお、一例では、指示があることは、移動体Mに対して、画像、音声、操作子等の入力による特定の指示があることにより構成されてよい。指示内容及び第2訓練済み制御モデル32の能力は、実施の形態に応じて適宜決定されてよい。
【0032】
図3は、本実施形態に係る第2訓練済み制御モデル32の構成の一例を模式的に示す。
図3に示されるとおり、移動体Mは車両であってよく、1つ以上の第2訓練済み制御モデル32は、車線変更の指示のある状況における移動体M(車両)の移動を制御するためのパスを生成する能力を獲得している訓練済み車線変更モデル33を含んでよい。これに応じて、1つのパス55を選択することは、対象ユーザOUによる車線変更の指示に応じて、訓練済み車線変更モデル33により生成されたパスを選択することを含んでよい。
【0033】
車線変更の指示方法(振舞40)は、実施の形態に応じて適宜決定されてよい。一例では、車線変更の指示は、ジェスチャ(画像)入力、音声入力、特定の操作子に対する操作(例えば、右又は左ウィンカー操作)等の任意の入力により行われてよい。また、訓練済み車線変更モデル33は、右車線への変更及び左車線への変更の少なくとも一方を実行するためのパスを生成するように構成されてよい。右車線変更及び左車線変更の両方を実行可能に構成する場合、右車線変更及び左車線変更に対してそれぞれ別個の車線変更モデルが用意されてよい。或いは、左右両方の車線変更に対応可能な1つの車線変更モデルが用
意されてもよい。
【0034】
なお、第2訓練済み制御モデル32の種類は、訓練済み車線変更モデル33の例に限られなくてよく、実施の形態に応じて適宜決定されてよい。その他の一例として、移動体Mが車両である場合に、第2訓練済み制御モデル32は、車線維持モデル、緊急停車モデル等を含んでよい。車線維持モデルは、車両の走行する車線を維持するためのパスを生成するように構成されてよい。車線維持モデルは、第1訓練済み制御モデル31又は訓練済み車線変更モデル33に含まれてもよい。緊急停車モデルは、例えば、ドライバの意識がなくなった等のユーザの異常状態に応じて、車両を路肩に退避させるためのパスを生成するように構成されてよい。また、ユーザの振舞及び制御モデル30の対応関係は、上記の例に限られなくてよい。他の一例では、上記第1訓練済み制御モデル31及び第2訓練済み制御モデル32の少なくともいずれかは省略されてよい。
【0035】
(パスの選別)
図3のシーンSC1では、車両の走行する車線の両側に別の車線が存在するため、車線維持及び左右両方の車線変更が実行可能である。一方で、シーンSC2では、車両は、最も左側の車線を走行しているため、車線維持及び右車線変更は実行可能であるが、左車線変更は実行不能である。そのため、シーンSC2では、左車線変更のパスは除外されることが好ましい。このような移動体Mの移動シーンに応じて、安全に実行不能な移動が生じ得ることは、移動体Mが車両である場合に限られない。移動体Mが車両以外である場合も同様に、移動体Mの移動シーンに応じて、安全に実行不能な移動は生じ得る。
【0036】
これに対応するため、一例では、制御装置1は、上記のとおり、複数の訓練済み制御モデル30から1つ以上の訓練済み制御モデル35を選択する際に、移動シーンに応じて、実行不能なパスを生成する訓練済み制御モデル30を除外してよい。すなわち、制御装置1は、移動シーンに応じて、実行不能なパスを生成する訓練済み制御モデル30を訓練済み制御モデル35として選択しないことで、実行不能なパスを排除してよい。
【0037】
他の一例では、当該方法に加えて又は当該方法に代えて、制御装置1は、生成された1つ以上のパス50それぞれの安全度を評価してよい。1つのパス55を選択することは、安全度が低いと評価されるパスを除外した上で、生成された1つ以上のパス50から1つのパス55を選択することにより構成されてよい。安全度が低いか否かは、任意の方法で判定されてよい。典型的には、算出された安全度と閾値との比較に応じて、安全度が低いか否かが判定されてよい。閾値は、実施の形態に応じて適宜決定されてよい。これにより、実行不能なパスを排除することができる。
【0038】
なお、安全度を評価する方法は、実施の形態に応じて適宜選択されてよい。一例では、機械学習の際に、訓練データに安全度の真値が付与されている(すなわち、安全度の教師信号が与えられる)ことで、訓練済み制御モデル(30、35)は、パスと共に安全度を導出可能に構成されてよい。この場合、安全度を評価することは、訓練済み制御モデル35の演算を実行することで、導出されるパス50の安全度を算出することにより構成される。他の一例では、シミュレーションに基づいて、生成されたパス50の安全度を評価してよい。例えば、制御装置1又は外部コンピュータ(例えば、サーバ装置)により、生成されたパス50による移動をリアルタイムにシミュレートすることで、生成されたパス50の安全度を評価してよい。また、例えば、シミュレーションの結果を収集することで、生成されたパス(訓練データ)及び評価された安全度(教師信号/ラベル)の組み合わせでそれぞれ構成される複数のデータセットを獲得してよい。訓練データは、対応するパスを生成した際の移動体Mの環境又は環境の認識結果を更に含んでもよい。獲得された複数のデータセットを使用した機械学習により、生成されたパスから安全度を算出する能力を獲得した訓練済み機械学習モデルを生成してよい。制御装置1は、生成された1つ以上の
パス50それぞれをこの訓練済み機械学習モデルに与えることで、1つ以上のパス50それぞれの安全度を算出してよい。
【0039】
更に他の一例では、パス50の生成の際に訓練済み制御モデル35に与えられた入力データ(例えば、センサSの観測データ120、環境の認識結果等)が、機械学習の範疇か否かに応じて、安全度が評価されてよい。例えば、機械学習により、訓練済み制御モデル(30、35)と共に又は訓練済み制御モデル(30、35)とは別に、自己符号化器が生成されてよい。入力データが機械学習の範疇であれば、自己符号化器の再構成誤差は小さく、そうでなければ、自己符号化器の再構成誤差は大きくなる。すなわち、再構成誤差が大きいほど、安全度は低いと評価することができる。そこで、制御装置1は、1つ以上の訓練済み制御モデル35の演算と共に、自己符号化器の演算を実行し、入力データと出力データとの差分を演算することで、再構成誤差を算出してよい。制御装置1は、算出された再構成誤差に応じて、生成されたパス50の安全度を評価してよい。単純には、再構成誤差がそのまま安全度として使用されてよい。
【0040】
(1つのパスを選択すること)
1つ以上のパス50から1つのパス55を選択することは、生成された複数のパスから1つのパスを選択すること、及び生成された1つのパスをそのまま使用することを含んでよい。すなわち、本実施形態に係る制御装置1は、複数のパスを生成し、生成された複数のパスから1つのパスを選択する第1モードを備えていれば、少なくとも一時的に、1つの訓練済み制御モデル35のみから1つのパス50を生成し、生成された1つのパス50をそのままパス55として移動体Mの制御に使用する第2モードを備えていてもよい。第2モードは省略されてもよい。
【0041】
[2 構成例]
図4は、本実施形態に係る制御装置1のハードウェア構成の一例を模式的に示す。本実施形態に係る制御装置1は、制御部11、記憶部12、外部インタフェース13、入力装置14、出力装置15、及びドライブ16が電気的に接続されたコンピュータである。
【0042】
制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory
)、ROM(Read Only Memory)等を含み、プログラム及び各種データに基づいて任意の情報処理を実行するように構成される。制御部11(CPU)は、プロセッサ・リソースの一例である。記憶部12は、例えば、ハードディスクドライブ、ソリッドステートドライブ等の任意の記憶装置により構成されてよい。記憶部12(及びRAM、ROM)は、本開示の記憶部の一例である。また、記憶部12(及びRAM、ROM)は、メモリ・リソースの一例である。本実施形態では、記憶部12は、制御プログラム81、学習結果データ300等の各種情報を記憶する。
【0043】
制御プログラム81は、移動体Mの制御に関する情報処理(後述の
図5)を制御装置1に実行させるためのプログラムである。制御プログラム81は、当該情報処理の一連の命令を含む。学習結果データ300は、訓練済み制御モデル30に関する情報を示すように構成される。一例では、学習結果データ300は、訓練済み制御モデル30毎に与えられてよい。他の一例では、1件の学習結果データ300が、2つ以上の訓練済み制御モデル30を示すように構成されてよい。また、訓練済み制御モデル30を再生可能であれば、学習結果データ300のデータ構成は、実施の形態に応じて適宜決定されてよい。一例では、学習結果データ300は、機械学習により調整された制御モデル30の演算パラメータの値を示す情報を含んでよい。学習結果データ300は、機械学習モデルの構成(例えば、ニューラルネットワークの構造等)を示す情報を更に含んでもよい。
【0044】
外部インタフェース13は、例えば、USB(Universal Serial Bus)ポート、専用ポ
ート、無線通信ポート等であってよく、有線又は無線で外部装置と接続するように構成される。本実施形態では、制御装置1は、外部インタフェース13を介して、センサS及びモニタリング装置MDに接続されてよい。入力装置14は、例えば、マウス、キーボード、操作子等の入力を行うための装置である。出力装置15は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。入力装置14及び出力装置15は、例えば、タッチパネルディスプレイ等により一体的に構成されてもよい。
【0045】
ドライブ16は、記憶媒体91に記憶されたプログラム等の各種情報を読み込むための装置である。上記制御プログラム81及び学習結果データ300の少なくともいずれかは、記憶部12に代えて又は記憶部12と共に、記憶媒体91に格納されていてもよい。記憶媒体91は、コンピュータ等の機械が各種情報(記憶されたプログラム等)を読み取り可能なように、電気的、磁気的、光学的、機械的又は化学的作用により当該情報を蓄積するように構成される。制御装置1は、上記制御プログラム81及び学習結果データ300の少なくともいずれかを記憶媒体91から取得してよい。なお、記憶媒体91は、CD、DVD等のディスク型の記憶媒体であってもよいし、或いは半導体メモリ(例えば、フラッシュメモリ)等のディスク型以外の記憶媒体であってもよい。ドライブ16の種類は、記憶媒体91の種類に応じて適宜選択されてよい。
【0046】
なお、制御装置1の具体的なハードウェア構成に関して、実施の形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部11は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、FPGA(field-programmable gate array)、DSP(digital signal processor)、ECU
(Electronic Control Unit)、GPU(Graphics Processing Unit)等により構成され
てよい。外部インタフェース13、入力装置14、出力装置15及びドライブ16の少なくともいずれかは省略されてもよい。制御装置1は、提供されるサービス専用に設計されたコンピュータの他、汎用のコンピュータ、端末装置等であってよい。移動体Mが車両である場合、制御装置1は、車載装置であってよい。
【0047】
[3 動作例]
図5は、本実施形態に係る制御装置1による移動体Mの制御に関する処理手順の一例を示す。制御装置1の制御部11は、制御プログラム81に含まれる命令をCPUにより実行する。これにより、制御装置1は、以下の情報処理を実行可能なコンピュータとして動作する。以下の処理手順は、コンピュータにより実行される制御方法の一例である。ただし、以下の処理手順は、一例に過ぎず、各ステップは可能な限り変更されてよい。また、以下の処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
【0048】
ステップS101では、制御部11は、センサSの観測データ120を取得する。制御部11は、直接的又は間接的にセンサSから観測データ120を取得してよい。
【0049】
ステップS102では、制御部11は、複数の訓練済み制御モデル30のうちの1つ以上の訓練済み制御モデル35の演算を実行することで、1つ以上のパス50を生成する。一例では、制御部11は、取得された観測データ120の少なくとも一部を訓練済み制御モデル35に与え、訓練済み制御モデル35の演算処理を実行することで、パス50を導出してよい。訓練済み制御モデル35に与える前に、観測データ120には任意の前処理が適用されてよい。他の一例では、制御部11は、任意の方法で観測データ120から移動体Mの環境を認識し、当該環境の認識結果を訓練済み制御モデル35に与え、訓練済み制御モデル35の演算処理を実行することで、パス50を導出してよい。
【0050】
本実施形態の一例では、1つ以上の訓練済み制御モデル35は、ユーザによる特定の指
示のない状況における移動体Mの移動を制御するためのパスを生成する能力を獲得している第1訓練済み制御モデル31を含んでよい。また、1つ以上の訓練済み制御モデル35は、ユーザによる対応する特定の指示のある状況における移動体Mの移動を制御するためのパスを生成する能力をそれぞれ獲得している1つ以上の第2訓練済み制御モデル32を含んでよい。移動体Mが車両である場合、1つ以上の第2訓練済み制御モデル32は、訓練済み車線変更モデル33を含んでよい。
【0051】
なお、ステップS102を実行する前、制御部11は、任意のタイミングで、移動体Mの移動シーンに応じて、複数の訓練済み制御モデル30から使用する蓋然性のある1つ以上の訓練済み制御モデル35を選択してよい。ステップS102では、制御部11は、選択された訓練済み制御モデル35を使用して、パス50を導出してよい。
【0052】
ステップS103では、制御部11は、対象ユーザOUの振舞40を監視する。対象ユーザOUの振舞40は任意の方法で監視されてよい。一例では、制御部11は、直接的又は間接的にモニタリング装置MDから観測データ125を得ることで、対象ユーザOUの振舞40を監視してよい。この場合、制御部11は、任意の方法により、観測データ125から対象ユーザOUの振舞40を識別してよい。
【0053】
ステップS104では、制御部11は、生成された1つ以上のパス50それぞれの安全度を評価する。本実施形態の一例では、制御部11は、上記いずれかの方法により、パス50の安全度を評価してよい。
【0054】
ステップS105では、制御部11は、対象ユーザOUの振舞40を監視した結果に応じて、生成された1つ以上のパス50から1つのパス55を選択する。本実施形態の一例では、1つのパス55を選択することは、対象ユーザOUからの特定の指示がない場合に、第1訓練済み制御モデル31により生成されたパスを選択することを含んでよい。対象ユーザOUの振舞40に対応する訓練済み制御モデル35が存在しない場合も、特定の指示がない場合と同様に、制御部11は、第1訓練済み制御モデル31により生成されたパスを選択してよい。また、本実施形態の一例では、1つのパス55を選択することは、対象ユーザOUによる指示(振舞40)を監視し、当該監視の結果に応じて、1つ以上の第2訓練済み制御モデル32のうちのいずれかにより生成されたパスを選択することを含んでよい。移動体Mが車両である場合、1つのパス55を選択することは、対象ユーザOUによる車線変更の指示に応じて、訓練済み車線変更モデル33により生成されたパスを選択することを含んでよい。
【0055】
また、本実施形態の一例では、ステップS104及びステップS105の間において、制御部11は、安全度を評価した結果に応じて、生成された1つ以上のパス50のうち、安全度が低いと評価されるパスを除外してよい。これに応じて、1つのパス55を選択することは、安全度が低いと評価されるパスを除外した上で、生成された1つ以上のパス50から1つのパス55を選択することにより構成されてよい。安全度が低いと評価されることは、安全度が基準を満たさないことであってよい。一例では、安全度が低いか否かは、閾値比較により判定されてよい。この場合、安全度の基準は、閾値により定義される。
【0056】
なお、一例では、安全度の評価結果により、対象ユーザOUの振舞40に対応する訓練済み制御モデルのパスが除外された場合、制御部11は、例えば、音声、画像等の任意の方法で、対応するパスが除外されたことを対象ユーザOUにフィードバックしてよい。また、対象ユーザOUの振舞40に対応するパスが除外された場合、制御部11は、最も安全度の高いパスを選択してよい。対象ユーザOUによる特定の指示に対応する第2訓練済み制御モデル32のパスが除外された場合、制御部11は、第1訓練済み制御モデル31により生成されたパスを選択してもよい。安全度を評価した結果、全てのパス50が除外
された場合、制御部11は、自動制御モードから手動制御モードに切り替え、任意のユーザ(典型的には、対象ユーザOU)に移動体Mの手動操作を促す通知を出力してよい。
【0057】
ステップS106では、制御部11は、選択されたパス55に従って、移動体Mの移動を制御する。対象の移動体Mの制御が完了すると、制御部11は、本動作例に係る制御装置1の処理手順を終了する。
【0058】
制御部11は、ステップS101~ステップS106の一連の情報処理を任意のタイミングで繰り返し実行してよい。一例では、制御部11は、所定期間の間(例えば、移動体Mの動力源が起動され、自動制御モードが選択されている間)、ステップS101~ステップS106の一連の情報処理を繰り返し実行してよい。これにより、制御装置1は、移動体Mの自動制御を継続的に実行してよい。
【0059】
なお、各ステップの処理順序は、
図5の例に限られなくてよく、実施の形態に応じて適宜変更されてよい。例えば、ステップS103の処理は、ステップS105の処理を実行する前の任意のタイミングに実行されてよい。ステップS104の処理は、ステップS102の処理を実行した後、ステップS105の処理を実行する前の任意のタイミングに実行されてよい。ステップS104の処理は、省略されてもよい。
【0060】
[特徴]
本実施形態では、複数の訓練済み制御モデル30が、ユーザの振舞に関連したそれぞれの移動態様に応じて用意される。そして、ステップS102~ステップS106(ステップS104を除く)の処理により、対象ユーザOUの振舞40に対応する訓練済み制御モデル35により生成されたパス55が、移動体Mの制御に使用される。これにより、ユーザの振舞に適合した移動体Mの制御を遂行する精度の向上を期待することができる。
【0061】
[4 変形例]
以上、本開示の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。本開示において説明した処理及び手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。
【符号の説明】
【0062】
1…制御装置、
11…制御部、12…記憶部、
30・35…訓練済み制御モデル、50・55…パス、
M…移動体、OU…対象ユーザ、
S…センサ、MD…モニタリング装置