特開2024-179785 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ トヨタ自動車株式会社の特許一覧

特開2024-179785制御装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024179785

(43)【公開日】2024-12-26

(54)【発明の名称】制御装置

(51)【国際特許分類】

B60W 50/08 20200101AFI20241219BHJP

【ＦＩ】

B60W50/08

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2023098920

(22)【出願日】2023-06-16

(71)【出願人】

【識別番号】000003207

【氏名又は名称】トヨタ自動車株式会社

(74)【代理人】

【識別番号】110002860

【氏名又は名称】弁理士法人秀和特許事務所

(72)【発明者】

【氏名】高橋祐希

(72)【発明者】

【氏名】金子拓央

【テーマコード（参考）】

3D241

【Ｆターム（参考）】

3D241BA00

3D241CE08

3D241DD06Z

3D241DD12Z

3D241DD13Z

(57)【要約】

【課題】ユーザの振舞に適合した移動体の制御を遂行する精度の向上を図る。
【解決手段】本開示の一側面に係る制御装置は、複数の訓練済み制御モデルのうちの１つ以上の訓練済み制御モデルの演算を実行することで、１つ以上のパスを生成し、対象ユーザの振舞を監視し、対象ユーザの振舞を監視した結果に応じて、生成された１つ以上のパスから１つのパスを選択し、かつ選択されたパスに従って、移動体の移動を制御する。各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した移動体の移動を制御するためのパスを生成する能力を獲得している。
【選択図】図１

【特許請求の範囲】

【請求項1】

複数の訓練済み制御モデルを記憶する記憶部、及び
制御部、
を備える制御装置であって、
前記制御部は、
前記複数の訓練済み制御モデルのうちの１つ以上の訓練済み制御モデルの演算を実行することで、１つ以上のパスを生成すること、
対象ユーザの振舞を監視すること、
前記対象ユーザの振舞を監視した結果に応じて、生成された前記１つ以上のパスから１つのパスを選択すること、及び
選択されたパスに従って、移動体の移動を制御すること、
を実行するように構成され、並びに
前記各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した前記移動体の移動を制御するためのパスを生成する能力を獲得している、
制御装置。

【請求項2】

前記１つ以上の訓練済み制御モデルは、前記ユーザによる指示のない状況におけるパスを生成する能力を獲得している第１訓練済み制御モデルを含み、
前記１つのパスを選択することは、前記対象ユーザからの指示がない場合に、前記第１訓練済み制御モデルにより生成されたパスを選択することを含む、
請求項１に記載の制御装置。

【請求項3】

前記１つ以上の訓練済み制御モデルは、前記ユーザによる対応する指示のある状況におけるパスを生成する能力をそれぞれ獲得している１つ以上の第２訓練済み制御モデルを含み、
前記１つのパスを選択することは、前記対象ユーザによる指示に応じて、前記１つ以上の第２訓練済み制御モデルのうちのいずれかにより生成されたパスを選択することを含む、
請求項１に記載の制御装置。

【請求項4】

前記移動体は、車両であり、
前記１つ以上の第２訓練済み制御モデルは、訓練済み車線変更モデルを含み、
前記１つのパスを選択することは、前記対象ユーザによる車線変更の指示に応じて、前記訓練済み車線変更モデルにより生成されたパスを選択することを含む、
請求項３に記載の制御装置。

【請求項5】

前記制御部は、生成された１つ以上のパスそれぞれの安全度を評価することを更に実行するように構成され、
前記１つのパスを選択することは、前記安全度が低いと評価されるパスを除外した上で、生成された前記１つ以上のパスから１つのパスを選択することにより構成される、
請求項１から４のいずれか１項に記載の制御装置。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、自動運転車両の制御技術に関する。

【背景技術】

【0002】

特許文献１には、訓練済みのニューラルネットワークを使用して、ルート、ＧＰＳデータ及びセンサデータから車両のコマンドを決定するように構成された自律的車両制御のためのシステムが提案されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特表２０１９－５３３８１０号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

本開示の目的の一つは、ユーザの振舞に適合した移動体の制御を遂行する精度の向上を図るための技術を提供することである。

【課題を解決するための手段】

【0005】

本開示の第１態様に係る制御装置は、複数の訓練済み制御モデルを記憶する記憶部、及び制御部を備える。前記制御部は、前記複数の訓練済み制御モデルのうちの１つ以上の訓練済み制御モデルの演算を実行することで、１つ以上のパスを生成すること、対象ユーザの振舞を監視すること、前記対象ユーザの振舞を監視した結果に応じて、生成された前記１つ以上のパスから１つのパスを選択すること、及び選択されたパスに従って、移動体の移動を制御すること、を実行するように構成される。前記各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した前記移動体の移動を制御するためのパスを生成する能力を獲得している。各訓練済み制御モデルは、ニューラルネットワークにより構成されてよく、機械学習の手法には深層学習が用いられてよい。

【発明の効果】

【0006】

本開示によれば、ユーザの振舞に適合した移動体の制御を遂行する精度の向上を図ることができる。

【図面の簡単な説明】

【0007】

【図1】図１は、本開示が適用される場面の一例を模式的に示す。

【図2】図２は、本開示の制御モデル構成の一例を模式的に示す。

【図3】図３は、本開示の第２制御モデル構成の一例を模式的に示す。

【図4】図４は、本開示の制御装置のハードウェア構成の一例を模式的に示す。

【図5】図５は、本開示の制御装置による制御に関する処理手順の一例を示す。

【発明を実施するための形態】

【0008】

特許文献１等の従来の方法によれば、訓練済みの機械学習モデルを使用することで、自動運転システムを構築することができる。しかしながら、本件発明者は、従来の方法には、次のような問題点があることを見出した。例えば、車線変更、路肩退避等の特定の態様の走行をユーザの振舞に応じて実行することを想定する。ユーザの振舞は、例えば、ウィンカー操作、ドライバに異常がある等である。このようなユーザの振舞を含めた上で、各態様の走行のための訓練データを収集するのは、パターンが膨大であり困難である。また、発生頻度も大きく相違し得る。このように発生頻度の大きく異なるシーンが混在する条
件下で、ユーザの振舞を入力として受け入れ、各振舞に適合するパスを生成するための訓練済みの機械学習モデルを生成することを想定する。この場合、得られる訓練済みモデルにおいて、ユーザの振舞に適合する車両の制御を高精度に遂行することが困難である可能性がある。例えば、極めて発生頻度の低いユーザの振舞の学習が不十分になり、これにより、訓練済みモデルによる車両制御の精度の低下を招く恐れがある。なお、この問題点は、車両の種類を問わず生じ得る。また、このような問題点が生じるのは、車両を制御する場面に限られない。移動を制御する点では、車両以外の移動体でも同様である。そのため、車両以外のあらゆる移動体を制御する場面でも、同様の問題点が生じ得る。

【0009】

これに対して、本開示の第１態様に係る制御装置は、複数の訓練済み制御モデルを記憶する記憶部、及び制御部を備える。制御部は、複数の訓練済み制御モデルのうちの１つ以上の訓練済み制御モデルの演算を実行することで、１つ以上のパスを生成すること、対象ユーザの振舞を監視すること、対象ユーザの振舞を監視した結果に応じて、生成された１つ以上のパスから１つのパスを選択すること、及び選択されたパスに従って、移動体の移動を制御すること、を実行するように構成される。各訓練済み制御モデルは、機械学習により、ユーザの対応する振舞に関連した移動体の移動を制御するためのパスを生成する能力を獲得している。

【0010】

本開示の第１態様では、各訓練済み制御モデルは、ユーザの振舞に関連した移動態様に応じて用意される。すなわち、各訓練済み制御モデルは、他の態様による移動を担当しないため、各訓練済み制御モデルの機械学習では、他の移動態様のデータの混在を抑えることができる。理想的には、対応する移動態様に特化して学習データが収集され、得られた学習データで訓練済みモデルが生成されてよい。本開示の第１態様では、訓練済み制御モデルを移動態様に応じて用意し、対象ユーザの振舞に対応する訓練済み制御モデルにより生成されたパスを移動体の制御に使用するようにする。これにより、ユーザの振舞に適合した移動体の制御を遂行する精度の向上を期待することができる。

【0011】

なお、上記態様に係る制御装置の別の形態として、本開示の一側面は、以上の各構成要素の全部又はその一部を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記憶した、コンピュータ等の機械が読み取り可能な記憶媒体であってもよい。ここで、機械が読み取り可能な記憶媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。

【0012】

［１適用例］
図１は、本開示を適用した場面の一例を模式的に示す。本実施形態に係る制御装置１は、対象の移動体Ｍの自動的な移動を制御するように構成された１台以上のコンピュータである。本実施形態では、制御装置１は、移動体Ｍに搭載され、複数の訓練済み制御モデル３０を保持する。各訓練済み制御モデル３０は、機械学習により、ユーザの対応する振舞に関連した移動体の移動を制御するためのパスを生成する能力を獲得している。

【0013】

制御装置１は、複数の訓練済み制御モデル３０のうちの１つ以上の訓練済み制御モデル３５の演算を実行することで、１つ以上のパス５０を生成する。制御装置１は、対象ユーザＯＵの振舞４０を監視し、対象ユーザＯＵの振舞４０を監視した結果に応じて、生成された１つ以上のパス５０から１つのパス５５を選択する。そして、制御装置１は、選択されたパス５５に従って、移動体Ｍの移動を制御する。

【0014】

本実施形態では、ユーザの振舞に関連した移動態様に応じて訓練済み制御モデル３０を用意し、対象ユーザＯＵの振舞４０に対応する訓練済み制御モデル３５により生成されたパス５５を移動体Ｍの制御に使用する。各訓練済み制御モデル３０は、対応する移動態様に特化して生成することができる。そのため、本実施形態によれば、ユーザの振舞に適合
した移動体の制御を遂行する精度の向上を期待することができる。

【0015】

なお、本実施形態では、対象ユーザＯＵの振舞４０は、各訓練済み制御モデル３０の入力として使用されなくてよい。すなわち、対象ユーザＯＵの振舞４０は、各訓練済み制御モデル３０のパスを生成する説明変数として用いられなくてよい。これにより、制御モデル３０の構造をシンプルにすることができ、その結果、各訓練済み制御モデル３０によるパスの生成精度の向上を期待することができる。

【0016】

また、ユーザの振舞に対応する訓練済み制御モデルを選択した後に訓練済み制御モデルの演算を実行する形態が他の形態として考えられる。しかしながら、この形態では、ユーザの振舞に対応する訓練済み制御モデルを選択した後に、訓練済み制御モデルの演算処理を実行する分だけ、ユーザの振舞を移動体の制御に反映するまでの時間が長くなってしまう。これに対して、本実施形態に係る制御装置１は、使用の有無に関係なく、使用する蓋然性のある訓練済み制御モデル３５の演算をすべて実行し、対象ユーザＯＵの振舞４０に応じて、演算結果（１つ以上のパス５０）から使用するパス５５を選択してよい。これにより、ユーザの振舞を移動体の制御に反映するまでの時間を短くすることができる。

【0017】

（移動体）
機械制御により自動的に移動可能であれば、移動体Ｍの種類は、実施の形態に応じて適宜選択されてよい。移動体Ｍは、例えば、車両、飛行体、船舶、ロボット装置等の移動可能な装置であってよい。飛行体は、ドローン等の無人機及び有人機の少なくともいずれかであってよい。一例では、図１のとおり、移動体Ｍは、車両であってよい。この場合、ユーザの振舞に適合した自動運転を遂行する精度の向上を期待することができる。なお、車両の種類（車輪数、動力源、大きさ等）は任意に選択されてよい。典型例として、移動体Ｍは、レベル２以上の自動運転の能力を有した自動車であってよい。

【0018】

（動作を制御すること）
一例では、対象の移動体Ｍの動作を制御することは、対象の移動体Ｍを直接的に制御することにより構成されてよい。他の一例では、移動体Ｍは、例えば、コントローラ等の専用の制御装置を備えてよい。この場合、制御装置１による対象の移動体Ｍの動作を制御することは、当該専用の制御装置に導出結果を与えることで、対象の移動体Ｍを間接的に制御することにより構成されてよい。制御装置１は任意の場所に配備されてよい。一例では、図１に示されるように、制御装置１は、移動体Ｍに搭載されてよい。他の一例では、制御装置１は、移動体Ｍから離れて配置され、移動体Ｍを遠隔的に制御してもよい。制御装置１は、移動体Ｍの自動制御モードから手動制御モードに及び手動制御モードから自動制御モードに、任意の操作により任意のタイミングで切替可能に構成されてよい。なお、移動体Ｍが車両の場合、典型的には、対象ユーザＯＵは、ドライバ又はドライバ以外の同乗者であってよい。対象ユーザＯＵは、移動体Ｍに応じて適宜決定されてよい。

【0019】

（１つ以上の訓練済み制御モデル）
本実施形態では、必ずしも、用意される複数の訓練済み制御モデル３０全ての演算を常に実行し、パスを生成しなければならない訳ではない。使用する蓋然性のある訓練済み制御モデル３５が、用意される複数の訓練済み制御モデル３０の中から任意の方法で選択されてよい。一例では、位置、ルート、通路の種別（車両の場合、例えば、高速道路、一般道等）等の移動シーンに応じて、パスの生成に使用する１つ以上の訓練済み制御モデル３５が選択されてよい。具体例として、移動体Ｍが車両であり、制御装置１が、訓練済み制御モデル３０として、左車線変更のパスを生成する第１制御モデル、右車線変更のパスを生成する第２制御モデル、及び車線維持のパスを生成する第３制御モデルを備えている場面を想定する。この場面において、最も左側の車線を走行しているシーンでは、制御装置１は、第２制御モデル及び第３制御モデルそれぞれを使用してパスを生成するのに対して
、第１制御モデルのパスは選択する余地がないため、第１制御モデルによるパスの生成は省略されてよい。一方で、左右両方向に車線変更可能なシーンでは、制御装置１は、第１制御モデル～第３制御モデルそれぞれを使用してパスを生成してよい。

【0020】

（パス）
パス（制御モデルの出力）は、移動体Ｍの動作を制御可能であれば、その形式は、特に限られなくてよく、実施の形態に応じて適宜決定されてよい。一例では、パス（５０、５５）は、１つ以上の制御指令により構成されてよい。制御指令は、移動体Ｍの制御量を示すように構成されてよい。他の一例では、パス（５０、５５）は、移動体Ｍの未来の移動経路を示すように構成され、１つ以上の制御指令を導出するために使用されてよい。この場合、１つ以上の制御指令が、パス５５から任意の方法で決定されてよい。制御モデル（３０、３５）は、パスプランナと称されてもよい。

【0021】

なお、制御指令は、移動体Ｍの動作に関する。制御指令の構成は、実施の形態に応じて適宜選択されてよい。一例では、制御指令は、加速、減速、操舵又はこれらの組み合わせにより構成されてよい。加速及び減速は、ギアチェンジを含んでよい。制御指令は、例えば、アクセル制御量、ブレーキ制御量、ハンドル操舵角等の移動体Ｍの制御量（制御指示値、制御出力量）を示すように構成されてよい。また、制御指令は、移動体Ｍの操作に関する指令を更に含んでよい。一例として、移動体Ｍが車両である場合、制御指令は、ウィンカー、ハザード、クラクション、通信処理（例えば、センタにデータを送信する、緊急コールを発信する等）等の車両操作を含んでよい。

【0022】

（訓練済み制御モデル）
制御モデル３０は、機械学習により調整可能な１つ以上の演算パラメータを有する機械学習モデルにより構成される。１つ以上の演算パラメータは、目的とする推論（本件では、パスの導出）の演算に使用される。機械学習は、学習データを使用して、演算パラメータの値を調整（最適化）することである。機械学習モデルの構成及び種類はそれぞれ、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。機械学習モデルは、例えば、ニューラルネットワーク、サポートベクタマシン、回帰モデル、決定木モデル等により構成されてよい。機械学習の方法は、採用する機械学習モデルに応じて、適宜選択されてよい（例えば、誤差逆伝播法等）。一例として、複数の制御モデル３０のうちの少なくともいずれかは、少なくとも部分的にニューラルネットワークにより構成されてよい。ニューラルネットワークの構造は、実施の形態に応じて適宜決定されてよく、例えば、入力層から出力層までの層の数、各層の種類、各層に含まれるノード（ニューロン）の数、各層のノード同士の結合関係等により特定されてよい。一例では、ニューラルネットワークは、再帰構造を有してよい。また、ニューラルネットワークは、例えば、全結合層、畳み込み層、プーリング層、逆畳み込み層、アンプーリング層、正規化層、ドロップアウト層、LSTM（Long short-term memory）等の任意の層を含んでよい。ニューラルネットワークは、Attention機構等の任意の機構を有してよい。ニューラルネットワークは、ＧＮＮ
（Graph neural network）、diffusionモデル、生成モデル（例えば、Generative Adversarial Network、Transformer等）等の任意のモデルを含んでよい。ニューラルネットワークを制御モデルに使用する場合、制御モデルに含まれる各ノード間の結合の重み及び各ノードの閾値が、演算パラメータの一例である。なお、機械学習モデルを採用する場合、制御モデルは、end-to-endモデルの構造で構成されてよい。

【0023】

各制御モデル３０は、移動体Ｍの環境に応じてパスを導出するように構成される。環境は、移動体Ｍ自身及び周囲の少なくとも一方で観測される事象である。一例では、少なくとも一部の環境は、移動体Ｍの内部又は外部に配置された１つ以上のセンサＳにより観測されてよい。センサＳは、移動体Ｍの移動する任意の環境を観測可能であれば、その種類は、特に限られなくてよく、実施の形態に応じて適宜選択されてよい。一例では、１つ以
上のセンサＳは、カメラ（画像センサ）、レーダ、LiDAR（Light Detection And Ranging）、ソナー（超音波センサ）、赤外線センサ、ＧＮＳＳ（Global Navigation Satellite System）／ＧＰＳ（Global Positioning Satellite）モジュール等を含んでよい。

【0024】

移動体Ｍの環境からパスを導出可能であれば、制御モデル３０の入出力の形態は、特に限られなくてよく、実施の形態に応じて適宜選択されてよい。一例では、複数の制御モデル３０のうちの少なくともいずれかは、１時点以上のセンサＳの観測データ１２０からパスを導出するように構成されてよい。他の一例では、複数の制御モデル３０のうちの少なくともいずれかは、周辺環境の認識結果からパスを導出するように構成されてよい。この場合、制御装置１は、センサＳの観測データ１２０から周辺環境の認識結果を推論する解析モデルを更に備えてよい。或いは、訓練済み制御モデル３０は、当該解析モデルを含んでよい。解析モデルは、任意に構成されてよい。一例では、解析モデルは、機械学習モデルにより構成されてよい。また、複数の制御モデル３０のうちの少なくともいずれかの入力には、その他の情報が任意で追加されてよい。複数の制御モデル３０のうちの少なくともいずれかは、例えば、設定速度、制限速度、位置、地図情報、ナビ情報等の任意の情報の入力を更に受け付けるように構成されてよい。また、一例では、制御モデル３０は、パスを直接的に出力するように構成されてよい。他の一例では、制御モデル３０は、パスを間接的に出力するように構成され、制御モデル３０の出力に対して任意の情報処理（解釈処理）を実行することでパスが得られてもよい。

【0025】

なお、典型的には、複数の訓練済み制御モデル３０は、それぞれ別個（独立）に構成されてよい。ただし、複数の訓練済み制御モデル３０の構成は、このような例に限られなくてよい。本実施形態の一例では、複数の訓練済み制御モデル３０のうちの２つ以上の制御モデルは、一体的に構成されてもよい。例えば、１つのモデルが、入力側に配置された上記解析モデル、及び解析モデルの出力からパスをそれぞれ導出するｎ個の出力部分を備えてよい（ｎは、２以上の自然数）。この１つのモデルは、ｎ個の訓練済み制御モデル３０と見なされてよい。すなわち、本実施形態では、モデルの構造が一体的であっても、当該モデルが、それぞれパスを出力するように構成されるｎ個の出力部を備える場合、当該モデルを保持していることは、ｎ個の訓練済み制御モデル３０を保持していることと見なされてよい。また、与えた条件に応じた出力をするように構成される条件付きモデルについても同様に取り扱われてよい。すなわち、複数の訓練済み制御モデル３０は、入力された条件（クラス／カテゴリ）に応じたパスを出力するように構成された条件付きモデルを含んでよい。この場合、条件付きモデルに与える条件を変えて、条件付きモデルの演算を繰り返すことで、それぞれ与えた条件に応じた複数のパスを導出することができる。そのため、１つの条件付きモデルがｎ個の条件に対応するように構成されている場合、この１つの条件付きモデルを保持していることは、ｎ個の訓練済み制御モデル３０を保持していることと見なされてよい。

【0026】

（振舞の監視）
振舞４０を監視することは、特定の入力がないこと及び特定の入力があることの少なくとも一方を監視することにより構成されてよい。特定の入力があることを監視することは、入力の種類（指示）を識別することを含んでよい。

【0027】

また、対象ユーザＯＵの振舞４０は任意の方法で監視されてよい。一例では、制御装置１は、画像、音声、操作子等の入力の有無を介して対象ユーザＯＵの振舞４０を監視してよい。画像を介して振舞４０を監視する場合、振舞４０は、ジェスチャ、対象ユーザＯＵの状態（例えば、対象ユーザＯＵが異常状態に陥っている等）等を含んでよい。操作子は、移動体Ｍの操作に関するあらゆる種類のデバイスを含んでよい。一例では、移動体Ｍが車両の場合、操作子は、例えば、ウィンカー、ハザード、クラクション等の車両に設けられた操作具を含んでよい。

【0028】

本実施形態の一例では、振舞４０を監視するため、モニタリング装置ＭＤが用いられてよい。モニタリング装置ＭＤは、例えば、カメラ（画像センサ）、マイクロフォン、操作子、操作子の操作量を計測するセンサ等を含んでよい。対象ユーザＯＵの振舞４０は、モニタリング装置ＭＤによりリアルタイムに得られる観測データ１２５から任意の方法で識別されてよい。対象ユーザＯＵの振舞４０は、例えば、画像解析、音声解析、操作子の操作内容の解析等の公知の解析手法により、観測データ１２５から識別されてよい。

【0029】

（振舞－制御モデルの対応関係）
用意する訓練済み制御モデル３０とユーザの振舞との対応関係は、実施の形態に応じて適宜決定されてよい。すなわち、ユーザのどのような振舞に対応して訓練済み制御モデル３０を用意するかは、実施の形態に応じて適宜決定されてよい。また、振舞に対応した用意された制御モデル３０に対して、どのような移動態様のパスを生成する能力を獲得させるかも、実施の形態に応じて適宜決定されてよい。

【0030】

図２は、本実施形態に係る制御モデル構成の一例を模式的に示す。図２の例では、複数の訓練済み制御モデル３０は、ユーザによる指示のない状況におけるパスを生成する能力を獲得している第１訓練済み制御モデル３１を含んでいる。これに応じて、１つ以上の訓練済み制御モデル３５は、第１訓練済み制御モデル３１を含んでよい。１つのパス５５を選択することは、対象ユーザＯＵからの指示がない場合に、第１訓練済み制御モデル３１により生成されたパスを選択することを含んでよい。これにより、対象ユーザＯＵの振舞４０として、任意の指示がない場面において、移動体Ｍの自動制御を実施することができる。なお、一例では、指示がないことは、移動体Ｍに対して、画像、音声、操作子等の入力による特定の指示がないことにより構成されてよい。

【0031】

また、図２の例では、複数の訓練済み制御モデル３０は、ユーザによる対応する指示のある状況におけるパスを生成する能力をそれぞれ獲得している１つ以上の第２訓練済み制御モデル３２を更に含んでいる。これに応じて、１つ以上の訓練済み制御モデル３５は、１つ以上の第２訓練済み制御モデル３２を含んでよい。１つのパス５５を選択することは、対象ユーザＯＵによる指示に応じて、１つ以上の第２訓練済み制御モデル３２のうちのいずれかにより生成されたパスを選択することを含んでよい。これにより、対象ユーザＯＵの振舞４０として、任意の指示がある場合において、当該指示に応じた移動体Ｍの自動制御を実施することができる。なお、一例では、指示があることは、移動体Ｍに対して、画像、音声、操作子等の入力による特定の指示があることにより構成されてよい。指示内容及び第２訓練済み制御モデル３２の能力は、実施の形態に応じて適宜決定されてよい。

【0032】

図３は、本実施形態に係る第２訓練済み制御モデル３２の構成の一例を模式的に示す。図３に示されるとおり、移動体Ｍは車両であってよく、１つ以上の第２訓練済み制御モデル３２は、車線変更の指示のある状況における移動体Ｍ（車両）の移動を制御するためのパスを生成する能力を獲得している訓練済み車線変更モデル３３を含んでよい。これに応じて、１つのパス５５を選択することは、対象ユーザＯＵによる車線変更の指示に応じて、訓練済み車線変更モデル３３により生成されたパスを選択することを含んでよい。

【0033】

車線変更の指示方法（振舞４０）は、実施の形態に応じて適宜決定されてよい。一例では、車線変更の指示は、ジェスチャ（画像）入力、音声入力、特定の操作子に対する操作（例えば、右又は左ウィンカー操作）等の任意の入力により行われてよい。また、訓練済み車線変更モデル３３は、右車線への変更及び左車線への変更の少なくとも一方を実行するためのパスを生成するように構成されてよい。右車線変更及び左車線変更の両方を実行可能に構成する場合、右車線変更及び左車線変更に対してそれぞれ別個の車線変更モデルが用意されてよい。或いは、左右両方の車線変更に対応可能な１つの車線変更モデルが用
意されてもよい。

【0034】

なお、第２訓練済み制御モデル３２の種類は、訓練済み車線変更モデル３３の例に限られなくてよく、実施の形態に応じて適宜決定されてよい。その他の一例として、移動体Ｍが車両である場合に、第２訓練済み制御モデル３２は、車線維持モデル、緊急停車モデル等を含んでよい。車線維持モデルは、車両の走行する車線を維持するためのパスを生成するように構成されてよい。車線維持モデルは、第１訓練済み制御モデル３１又は訓練済み車線変更モデル３３に含まれてもよい。緊急停車モデルは、例えば、ドライバの意識がなくなった等のユーザの異常状態に応じて、車両を路肩に退避させるためのパスを生成するように構成されてよい。また、ユーザの振舞及び制御モデル３０の対応関係は、上記の例に限られなくてよい。他の一例では、上記第１訓練済み制御モデル３１及び第２訓練済み制御モデル３２の少なくともいずれかは省略されてよい。

【0035】

（パスの選別）
図３のシーンＳＣ１では、車両の走行する車線の両側に別の車線が存在するため、車線維持及び左右両方の車線変更が実行可能である。一方で、シーンＳＣ２では、車両は、最も左側の車線を走行しているため、車線維持及び右車線変更は実行可能であるが、左車線変更は実行不能である。そのため、シーンＳＣ２では、左車線変更のパスは除外されることが好ましい。このような移動体Ｍの移動シーンに応じて、安全に実行不能な移動が生じ得ることは、移動体Ｍが車両である場合に限られない。移動体Ｍが車両以外である場合も同様に、移動体Ｍの移動シーンに応じて、安全に実行不能な移動は生じ得る。

【0036】

これに対応するため、一例では、制御装置１は、上記のとおり、複数の訓練済み制御モデル３０から１つ以上の訓練済み制御モデル３５を選択する際に、移動シーンに応じて、実行不能なパスを生成する訓練済み制御モデル３０を除外してよい。すなわち、制御装置１は、移動シーンに応じて、実行不能なパスを生成する訓練済み制御モデル３０を訓練済み制御モデル３５として選択しないことで、実行不能なパスを排除してよい。

【0037】

他の一例では、当該方法に加えて又は当該方法に代えて、制御装置１は、生成された１つ以上のパス５０それぞれの安全度を評価してよい。１つのパス５５を選択することは、安全度が低いと評価されるパスを除外した上で、生成された１つ以上のパス５０から１つのパス５５を選択することにより構成されてよい。安全度が低いか否かは、任意の方法で判定されてよい。典型的には、算出された安全度と閾値との比較に応じて、安全度が低いか否かが判定されてよい。閾値は、実施の形態に応じて適宜決定されてよい。これにより、実行不能なパスを排除することができる。

【0038】

なお、安全度を評価する方法は、実施の形態に応じて適宜選択されてよい。一例では、機械学習の際に、訓練データに安全度の真値が付与されている（すなわち、安全度の教師信号が与えられる）ことで、訓練済み制御モデル（３０、３５）は、パスと共に安全度を導出可能に構成されてよい。この場合、安全度を評価することは、訓練済み制御モデル３５の演算を実行することで、導出されるパス５０の安全度を算出することにより構成される。他の一例では、シミュレーションに基づいて、生成されたパス５０の安全度を評価してよい。例えば、制御装置１又は外部コンピュータ（例えば、サーバ装置）により、生成されたパス５０による移動をリアルタイムにシミュレートすることで、生成されたパス５０の安全度を評価してよい。また、例えば、シミュレーションの結果を収集することで、生成されたパス（訓練データ）及び評価された安全度（教師信号／ラベル）の組み合わせでそれぞれ構成される複数のデータセットを獲得してよい。訓練データは、対応するパスを生成した際の移動体Ｍの環境又は環境の認識結果を更に含んでもよい。獲得された複数のデータセットを使用した機械学習により、生成されたパスから安全度を算出する能力を獲得した訓練済み機械学習モデルを生成してよい。制御装置１は、生成された１つ以上の
パス５０それぞれをこの訓練済み機械学習モデルに与えることで、１つ以上のパス５０それぞれの安全度を算出してよい。

【0039】

更に他の一例では、パス５０の生成の際に訓練済み制御モデル３５に与えられた入力データ（例えば、センサＳの観測データ１２０、環境の認識結果等）が、機械学習の範疇か否かに応じて、安全度が評価されてよい。例えば、機械学習により、訓練済み制御モデル（３０、３５）と共に又は訓練済み制御モデル（３０、３５）とは別に、自己符号化器が生成されてよい。入力データが機械学習の範疇であれば、自己符号化器の再構成誤差は小さく、そうでなければ、自己符号化器の再構成誤差は大きくなる。すなわち、再構成誤差が大きいほど、安全度は低いと評価することができる。そこで、制御装置１は、１つ以上の訓練済み制御モデル３５の演算と共に、自己符号化器の演算を実行し、入力データと出力データとの差分を演算することで、再構成誤差を算出してよい。制御装置１は、算出された再構成誤差に応じて、生成されたパス５０の安全度を評価してよい。単純には、再構成誤差がそのまま安全度として使用されてよい。

【0040】

（１つのパスを選択すること）
１つ以上のパス５０から１つのパス５５を選択することは、生成された複数のパスから１つのパスを選択すること、及び生成された１つのパスをそのまま使用することを含んでよい。すなわち、本実施形態に係る制御装置１は、複数のパスを生成し、生成された複数のパスから１つのパスを選択する第１モードを備えていれば、少なくとも一時的に、１つの訓練済み制御モデル３５のみから１つのパス５０を生成し、生成された１つのパス５０をそのままパス５５として移動体Ｍの制御に使用する第２モードを備えていてもよい。第２モードは省略されてもよい。

【0041】

［２構成例］
図４は、本実施形態に係る制御装置１のハードウェア構成の一例を模式的に示す。本実施形態に係る制御装置１は、制御部１１、記憶部１２、外部インタフェース１３、入力装置１４、出力装置１５、及びドライブ１６が電気的に接続されたコンピュータである。

【0042】

制御部１１は、ＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory
）、ＲＯＭ（Read Only Memory）等を含み、プログラム及び各種データに基づいて任意の情報処理を実行するように構成される。制御部１１（ＣＰＵ）は、プロセッサ・リソースの一例である。記憶部１２は、例えば、ハードディスクドライブ、ソリッドステートドライブ等の任意の記憶装置により構成されてよい。記憶部１２（及びＲＡＭ、ＲＯＭ）は、本開示の記憶部の一例である。また、記憶部１２（及びＲＡＭ、ＲＯＭ）は、メモリ・リソースの一例である。本実施形態では、記憶部１２は、制御プログラム８１、学習結果データ３００等の各種情報を記憶する。

【0043】

制御プログラム８１は、移動体Ｍの制御に関する情報処理（後述の図５）を制御装置１に実行させるためのプログラムである。制御プログラム８１は、当該情報処理の一連の命令を含む。学習結果データ３００は、訓練済み制御モデル３０に関する情報を示すように構成される。一例では、学習結果データ３００は、訓練済み制御モデル３０毎に与えられてよい。他の一例では、１件の学習結果データ３００が、２つ以上の訓練済み制御モデル３０を示すように構成されてよい。また、訓練済み制御モデル３０を再生可能であれば、学習結果データ３００のデータ構成は、実施の形態に応じて適宜決定されてよい。一例では、学習結果データ３００は、機械学習により調整された制御モデル３０の演算パラメータの値を示す情報を含んでよい。学習結果データ３００は、機械学習モデルの構成（例えば、ニューラルネットワークの構造等）を示す情報を更に含んでもよい。

【0044】

外部インタフェース１３は、例えば、ＵＳＢ（Universal Serial Bus）ポート、専用ポ
ート、無線通信ポート等であってよく、有線又は無線で外部装置と接続するように構成される。本実施形態では、制御装置１は、外部インタフェース１３を介して、センサＳ及びモニタリング装置ＭＤに接続されてよい。入力装置１４は、例えば、マウス、キーボード、操作子等の入力を行うための装置である。出力装置１５は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。入力装置１４及び出力装置１５は、例えば、タッチパネルディスプレイ等により一体的に構成されてもよい。

【0045】

ドライブ１６は、記憶媒体９１に記憶されたプログラム等の各種情報を読み込むための装置である。上記制御プログラム８１及び学習結果データ３００の少なくともいずれかは、記憶部１２に代えて又は記憶部１２と共に、記憶媒体９１に格納されていてもよい。記憶媒体９１は、コンピュータ等の機械が各種情報（記憶されたプログラム等）を読み取り可能なように、電気的、磁気的、光学的、機械的又は化学的作用により当該情報を蓄積するように構成される。制御装置１は、上記制御プログラム８１及び学習結果データ３００の少なくともいずれかを記憶媒体９１から取得してよい。なお、記憶媒体９１は、ＣＤ、ＤＶＤ等のディスク型の記憶媒体であってもよいし、或いは半導体メモリ（例えば、フラッシュメモリ）等のディスク型以外の記憶媒体であってもよい。ドライブ１６の種類は、記憶媒体９１の種類に応じて適宜選択されてよい。

【0046】

なお、制御装置１の具体的なハードウェア構成に関して、実施の形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部１１は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ（field-programmable gate array）、ＤＳＰ（digital signal processor）、ＥＣＵ
（Electronic Control Unit）、ＧＰＵ（Graphics Processing Unit）等により構成され
てよい。外部インタフェース１３、入力装置１４、出力装置１５及びドライブ１６の少なくともいずれかは省略されてもよい。制御装置１は、提供されるサービス専用に設計されたコンピュータの他、汎用のコンピュータ、端末装置等であってよい。移動体Ｍが車両である場合、制御装置１は、車載装置であってよい。

【0047】

［３動作例］
図５は、本実施形態に係る制御装置１による移動体Ｍの制御に関する処理手順の一例を示す。制御装置１の制御部１１は、制御プログラム８１に含まれる命令をＣＰＵにより実行する。これにより、制御装置１は、以下の情報処理を実行可能なコンピュータとして動作する。以下の処理手順は、コンピュータにより実行される制御方法の一例である。ただし、以下の処理手順は、一例に過ぎず、各ステップは可能な限り変更されてよい。また、以下の処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

【0048】

ステップＳ１０１では、制御部１１は、センサＳの観測データ１２０を取得する。制御部１１は、直接的又は間接的にセンサＳから観測データ１２０を取得してよい。

【0049】

ステップＳ１０２では、制御部１１は、複数の訓練済み制御モデル３０のうちの１つ以上の訓練済み制御モデル３５の演算を実行することで、１つ以上のパス５０を生成する。一例では、制御部１１は、取得された観測データ１２０の少なくとも一部を訓練済み制御モデル３５に与え、訓練済み制御モデル３５の演算処理を実行することで、パス５０を導出してよい。訓練済み制御モデル３５に与える前に、観測データ１２０には任意の前処理が適用されてよい。他の一例では、制御部１１は、任意の方法で観測データ１２０から移動体Ｍの環境を認識し、当該環境の認識結果を訓練済み制御モデル３５に与え、訓練済み制御モデル３５の演算処理を実行することで、パス５０を導出してよい。

【0050】

本実施形態の一例では、１つ以上の訓練済み制御モデル３５は、ユーザによる特定の指
示のない状況における移動体Ｍの移動を制御するためのパスを生成する能力を獲得している第１訓練済み制御モデル３１を含んでよい。また、１つ以上の訓練済み制御モデル３５は、ユーザによる対応する特定の指示のある状況における移動体Ｍの移動を制御するためのパスを生成する能力をそれぞれ獲得している１つ以上の第２訓練済み制御モデル３２を含んでよい。移動体Ｍが車両である場合、１つ以上の第２訓練済み制御モデル３２は、訓練済み車線変更モデル３３を含んでよい。

【0051】

なお、ステップＳ１０２を実行する前、制御部１１は、任意のタイミングで、移動体Ｍの移動シーンに応じて、複数の訓練済み制御モデル３０から使用する蓋然性のある１つ以上の訓練済み制御モデル３５を選択してよい。ステップＳ１０２では、制御部１１は、選択された訓練済み制御モデル３５を使用して、パス５０を導出してよい。

【0052】

ステップＳ１０３では、制御部１１は、対象ユーザＯＵの振舞４０を監視する。対象ユーザＯＵの振舞４０は任意の方法で監視されてよい。一例では、制御部１１は、直接的又は間接的にモニタリング装置ＭＤから観測データ１２５を得ることで、対象ユーザＯＵの振舞４０を監視してよい。この場合、制御部１１は、任意の方法により、観測データ１２５から対象ユーザＯＵの振舞４０を識別してよい。

【0053】

ステップＳ１０４では、制御部１１は、生成された１つ以上のパス５０それぞれの安全度を評価する。本実施形態の一例では、制御部１１は、上記いずれかの方法により、パス５０の安全度を評価してよい。

【0054】

ステップＳ１０５では、制御部１１は、対象ユーザＯＵの振舞４０を監視した結果に応じて、生成された１つ以上のパス５０から１つのパス５５を選択する。本実施形態の一例では、１つのパス５５を選択することは、対象ユーザＯＵからの特定の指示がない場合に、第１訓練済み制御モデル３１により生成されたパスを選択することを含んでよい。対象ユーザＯＵの振舞４０に対応する訓練済み制御モデル３５が存在しない場合も、特定の指示がない場合と同様に、制御部１１は、第１訓練済み制御モデル３１により生成されたパスを選択してよい。また、本実施形態の一例では、１つのパス５５を選択することは、対象ユーザＯＵによる指示（振舞４０）を監視し、当該監視の結果に応じて、１つ以上の第２訓練済み制御モデル３２のうちのいずれかにより生成されたパスを選択することを含んでよい。移動体Ｍが車両である場合、１つのパス５５を選択することは、対象ユーザＯＵによる車線変更の指示に応じて、訓練済み車線変更モデル３３により生成されたパスを選択することを含んでよい。

【0055】

また、本実施形態の一例では、ステップＳ１０４及びステップＳ１０５の間において、制御部１１は、安全度を評価した結果に応じて、生成された１つ以上のパス５０のうち、安全度が低いと評価されるパスを除外してよい。これに応じて、１つのパス５５を選択することは、安全度が低いと評価されるパスを除外した上で、生成された１つ以上のパス５０から１つのパス５５を選択することにより構成されてよい。安全度が低いと評価されることは、安全度が基準を満たさないことであってよい。一例では、安全度が低いか否かは、閾値比較により判定されてよい。この場合、安全度の基準は、閾値により定義される。

【0056】

なお、一例では、安全度の評価結果により、対象ユーザＯＵの振舞４０に対応する訓練済み制御モデルのパスが除外された場合、制御部１１は、例えば、音声、画像等の任意の方法で、対応するパスが除外されたことを対象ユーザＯＵにフィードバックしてよい。また、対象ユーザＯＵの振舞４０に対応するパスが除外された場合、制御部１１は、最も安全度の高いパスを選択してよい。対象ユーザＯＵによる特定の指示に対応する第２訓練済み制御モデル３２のパスが除外された場合、制御部１１は、第１訓練済み制御モデル３１により生成されたパスを選択してもよい。安全度を評価した結果、全てのパス５０が除外
された場合、制御部１１は、自動制御モードから手動制御モードに切り替え、任意のユーザ（典型的には、対象ユーザＯＵ）に移動体Ｍの手動操作を促す通知を出力してよい。

【0057】

ステップＳ１０６では、制御部１１は、選択されたパス５５に従って、移動体Ｍの移動を制御する。対象の移動体Ｍの制御が完了すると、制御部１１は、本動作例に係る制御装置１の処理手順を終了する。

【0058】

制御部１１は、ステップＳ１０１～ステップＳ１０６の一連の情報処理を任意のタイミングで繰り返し実行してよい。一例では、制御部１１は、所定期間の間（例えば、移動体Ｍの動力源が起動され、自動制御モードが選択されている間）、ステップＳ１０１～ステップＳ１０６の一連の情報処理を繰り返し実行してよい。これにより、制御装置１は、移動体Ｍの自動制御を継続的に実行してよい。

【0059】

なお、各ステップの処理順序は、図５の例に限られなくてよく、実施の形態に応じて適宜変更されてよい。例えば、ステップＳ１０３の処理は、ステップＳ１０５の処理を実行する前の任意のタイミングに実行されてよい。ステップＳ１０４の処理は、ステップＳ１０２の処理を実行した後、ステップＳ１０５の処理を実行する前の任意のタイミングに実行されてよい。ステップＳ１０４の処理は、省略されてもよい。

【0060】

［特徴］
本実施形態では、複数の訓練済み制御モデル３０が、ユーザの振舞に関連したそれぞれの移動態様に応じて用意される。そして、ステップＳ１０２～ステップＳ１０６（ステップＳ１０４を除く）の処理により、対象ユーザＯＵの振舞４０に対応する訓練済み制御モデル３５により生成されたパス５５が、移動体Ｍの制御に使用される。これにより、ユーザの振舞に適合した移動体Ｍの制御を遂行する精度の向上を期待することができる。

【0061】

［４変形例］
以上、本開示の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。本開示において説明した処理及び手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。

【符号の説明】

【0062】

１…制御装置、
１１…制御部、１２…記憶部、
３０・３５…訓練済み制御モデル、５０・５５…パス、
Ｍ…移動体、ＯＵ…対象ユーザ、
Ｓ…センサ、ＭＤ…モニタリング装置

【図1】

【図2】

【図3】

【図4】

【図5】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版