IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ニッサン ノース アメリカ,インクの特許一覧 ▶ ユニバーシティ オブ マサチューセッツの特許一覧

特表2024-511928車線レベルルートプランナにおける学習
<>
  • 特表-車線レベルルートプランナにおける学習 図1
  • 特表-車線レベルルートプランナにおける学習 図2
  • 特表-車線レベルルートプランナにおける学習 図3
  • 特表-車線レベルルートプランナにおける学習 図4
  • 特表-車線レベルルートプランナにおける学習 図5
  • 特表-車線レベルルートプランナにおける学習 図6
  • 特表-車線レベルルートプランナにおける学習 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-18
(54)【発明の名称】車線レベルルートプランナにおける学習
(51)【国際特許分類】
   G01C 21/34 20060101AFI20240311BHJP
   B60W 60/00 20200101ALI20240311BHJP
   B60W 30/10 20060101ALI20240311BHJP
【FI】
G01C21/34
B60W60/00
B60W30/10
【審査請求】有
【予備審査請求】有
(21)【出願番号】P 2023551683
(86)(22)【出願日】2022-01-31
(85)【翻訳文提出日】2023-10-11
(86)【国際出願番号】 US2022014564
(87)【国際公開番号】W WO2022182477
(87)【国際公開日】2022-09-01
(31)【優先権主張番号】17/186,987
(32)【優先日】2021-02-26
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】511257078
【氏名又は名称】ニッサン ノース アメリカ,インク
(71)【出願人】
【識別番号】507088266
【氏名又は名称】ユニバーシティ オブ マサチューセッツ
【住所又は居所原語表記】One Beacon Street,31st Floor,Boston,Massachusetts 02108
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100111235
【弁理士】
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100170575
【弁理士】
【氏名又は名称】森 太士
(72)【発明者】
【氏名】ジルベルシュタイン、 シュロモ
(72)【発明者】
【氏名】レイ、 カイル ホリンズ
(72)【発明者】
【氏名】ウィトウィッキ、 ステファン
【テーマコード(参考)】
2F129
3D241
【Fターム(参考)】
2F129AA03
2F129BB03
2F129BB18
2F129DD02
2F129DD20
2F129DD29
2F129DD70
2F129EE02
2F129EE52
2F129EE57
2F129EE62
2F129FF02
2F129FF32
2F129GG17
2F129GG18
2F129HH25
3D241BA11
3D241CE03
3D241CE04
3D241CE09
3D241DA05Z
3D241DA39Z
3D241DA52Z
3D241DB02Z
3D241DB05Z
3D241DB12Z
3D241DC31Z
3D241DC33Z
3D241DC38Z
3D241DC42Z
3D241DC51Z
3D241DC60Z
(57)【要約】
車線レベルルートプラニングは、道路の車線レベル情報を取得することであって、道路は、第1の車線及び第2の車線を含み、車線レベル情報は、第1の車線に関連する第1の車線情報及び第2の車線に関連する第2の車線情報を含むことと、車線レベル情報を状態遷移関数に関する確率に変換することと、目的地を受信することと、前記状態遷移関数を使用するモデルの解としてポリシーを取得することとを含む。
【特許請求の範囲】
【請求項1】
車線レベルルートプランニングのための方法において、
道路の車線レベル情報を取得することであって、前記道路は、第1の車線及び第2の車線を含み、前記車線レベル情報は、前記第1の車線に関連する第1の車線情報、及び前記第2の車線に関連する第2の車線情報を含むことと、
前記車線レベル情報を状態遷移関数に関する確率に変換することと、
目的地を受信することと、
前記状態遷移関数を使用するモデルの解としてポリシーを取得することと
を含む、方法。
【請求項2】
前記車線レベル情報は、ホスト車両において取得される、請求項1に記載の方法。
【請求項3】
前記車線レベル情報は、複数の車両から取得される、請求項1に記載の方法。
【請求項4】
前記車線レベル情報は、環境情報、車両情報、又は人的情報のうち少なくとも2つを含む、請求項1に記載の方法。
【請求項5】
前記環境情報は、車線セグメントの交通パターン、歩行者パターン、又は通行困難情報のうち少なくとも2つを含む、請求項4に記載の方法。
【請求項6】
前記車両情報は、ユーザの選好ルート及び前記ユーザによる制御の移行要求を含む、請求項4に記載の方法。
【請求項7】
前記道路の前記車線レベル情報を取得することは、
前記道路上での停止を伴う前記道路の自動通行の第1の時間を記録すること、
前記道路上での停止を伴わない前記道路の自動通行の第2の時間を記録すること、
前記道路上での停止を伴う前記道路の手動通行の第3の時間を記録すること、及び
前記道路上での停止を伴わない前記道路の手動通行の第4の時間を記録すること
を含む、請求項1に記載の方法。
【請求項8】
前記道路の前記車線レベル情報を取得することは、
手動通行中に後続車線セグメントを記録すること
を含む、請求項1に記載の方法。
【請求項9】
前記道路の前記車線レベル情報を取得することは、
自動走行制御の人間によるオーバライドを記録すること
を含む、請求項1に記載の方法。
【請求項10】
車線レベルルートプランニングのための装置において、
道路の車線レベル情報を取得することであって、前記道路は、第1の車線及び第2の車線を含み、前記車線レベル情報は、前記第1の車線に関連する第1の車線情報、及び前記第2の車線に関連する第2の車線情報を含むことと、
前記車線レベル情報を状態遷移関数に変換することであって、前記状態遷移関数は目的地へのルートを取得するために使用されることと
を行うように構成されるプロセッサを備える、装置。
【請求項11】
前記車線レベル情報は、ホスト車両から取得される、請求項10に記載の装置。
【請求項12】
前記車線レベル情報は、複数の車両から取得される、請求項10に記載の装置。
【請求項13】
前記車線レベル情報は、環境情報、車両情報、又は人的情報のうち少なくとも2つを含む、請求項10に記載の装置。
【請求項14】
前記環境情報は、車線セグメントの交通パターン、歩行者パターン、又は通行困難情報のうち少なくとも2つを含む、請求項13に記載の装置。
【請求項15】
前記車両情報は、ユーザの選好ルート、前記ユーザによる制御の移行要求を含む、請求項13に記載の装置。
【請求項16】
前記道路の前記車線レベル情報を取得することは、
前記道路上での停止を伴う前記道路の自動通行の第1の時間を記録すること、
前記道路上での停止を伴わない前記道路の自動通行の第2の時間を記録すること、
前記道路上での停止を伴う前記道路の手動通行の第3の時間を記録すること、及び
前記道路上での停止を伴わない前記道路の手動通行の第4の時間を記録すること、
を含む、請求項10に記載の装置。
【請求項17】
前記道路の前記車線レベル情報を取得することは、
手動通行中に後続車線セグメントを記録すること、及び
自動走行制御の人間によるオーバライドを記録すること
を含む、請求項10に記載の装置。
【請求項18】
前記目的地へのルートを取得することは、
前記状態遷移関数を使用するモデルの解としてポリシーを取得すること
を含む、請求項10に記載の装置。
【請求項19】
実行可能命令を含む非一時的なコンピュータ可読媒体において、前記実行可能命令は、プロセッサによって実行されると、
道路を通行する複数の車両からそれぞれ車線レベル情報を受信することと、
前記車線レベル情報からナビゲーションマップを取得することであって、前記ナビゲーションマップは、状態遷移グラフ及び報酬関数を含み、車線レベル情報は、環境情報、車両情報、又は人的情報のうち少なくとも2つを含むことと、
前記ナビゲーションマップを1つの車両に送信することであって、前記車両は前記ナビゲーションマップを使用してレーンレベルルートを取得することと
を含む動作の実行を促進する、非一時的なコンピュータ可読記憶媒体。
【請求項20】
前記動作は、
目的地及び現在位置を受信することと、
前記ナビゲーションマップを使用して、前記現在位置から前記目的地への車線レベルルートを取得することと
をさらに含む、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般にルートプランニングに関するものであり、より詳細には、自律走行車の車線レベルルートプランニングに関する。
【背景技術】
【0002】
ルートプランニングアプリケーション及びシステム(集合的に、ルートプランナ)は、車載車両システム又はハンドヘルドデバイスであり得る。ユーザ(例えば、運転者)は、目的地を提供し、ルーティングアプリケーションはユーザの現在位置から目的地へのルートを計算する。
【0003】
ルートはマップ上にオーバレイされる場合があり、ユーザが目的地に到着するために従うことができる道路及び曲がり角を含む(例えば、示す)場合がある。つまり、ルートは、目的地への進路変更ごとの示を含み得る。通常、ルートは道路及び曲がり角を含んでおり、運転者が特定の道路のどの車線を走行するか、及び出口又は交差点での曲がり角等、いつ車線を切り替えるかを決定するのはユーザ(例えば、運転者)次第である。
【0004】
従来のルートプランナは、所定の距離(例えば、2マイル)以内に曲がり角(例えば、出口)が近づいていることをユーザに警告又は通知する場合があり、現在の車線からどのように操縦して曲がるかを決定するのはユーザ次第である。このようなルートプランナは、ホスト車両がどの車線にいるかを知らず、単に所定の距離内でユーザに通知するだけで、ユーザは現在の車線から曲がり角の場所に移動するための安全でない操縦を余儀なくされる可能性がある。
【0005】
このようなルートプランニングアプリケーションは、道路レベルで確定的に計画する場合があり、車線レベル情報/プランニングを考慮しない。ルートプランニングは、ルート時間を最小化しようとする古典的プランニング問題としてモデル化される場合がある。
【0006】
少なくともこれらの理由から、このようなルートプランニングアプリケーションにおけるプランニングマップは、運転者がまったく関与しないか、せいぜい関与が最小限であり得る自律走行に必要なものを超えた抽象レベルにあるり得るため、車線レベルではなく道路レベルルートプランニングは、自律走行には適切ではない(例えば、十分ではない)場合がある。
【発明の概要】
【0007】
第1の態様は車線レベルルートプランニングのための方法である。この方法は、道路の車線レベル情報を取得することであって、前記道路は、第1の車線及び第2の車線を含み、前記車線レベル情報は、第1の車線に関連する第1の車線情報及び前記第2の車線に関連する第2の車線情報を含むことと、前記車線レベル情報を状態遷移関数に関する確率に変換することと、目的地を受信することと、前記状態遷移関数を使用するモデルの解としてポリシーを取得することとを含む。
【0008】
第2の態様は、車線レベルルートプランニングのための装置である。この装置は、道路の車線レベル情報を取得することであって、前記道路は、第1の車線及び第2の車線を含み、前記車線レベル情報は、第1の車線に関連する第1の車線情報及び前記第2の車線に関連する第2の車線情報を含むことと、前記車線レベル情報を、目的地へのルートを取得するために使用される状態遷移関数に変換することとを行うように構成されるプロセッサを含む。
【0009】
第3の態様は、プロセッサによって実行されると、動作の実行を容易にする実行可能命令を含む非一時的なコンピュータ可読記憶媒体である。この動作は、道路を通行する複数の車両から各車線レベル情報を受信することと、前記車線レベル情報からナビゲーションマップを取得することであって、前記ナビゲーションマップは、状態遷移グラフ及び報酬関数を含み、車線レベル情報は、環境情報、車両情報、又は人的情報のうち少なくとも2つを含むことと、前記車両に前記ナビゲーションマップを送信することであって、前記車両は前記ナビゲーションマップを使用して車線レベルルートを取得することとを含む。
【0010】
以下では、本明細書に開示された方法、装置、プロシージャ及びアルゴリズムのこうした及び他の態様、特徴、要素、実装及び実施形態の変形がさらに詳細に記載される。
【0011】
本明細書に開示された方法及び装置の様々な態様は、以下の記載及び図面において提供される例示を参照することでより明らかになるであろう。ここで同じ参照番号は同じ要素を指している。
【図面の簡単な説明】
【0012】
図1】本明細書に開示の態様、特徴及び要素が実装され得る車両の例を示す図である。
【0013】
図2】本明細書に開示の態様、特徴及び要素が実装され得る車両交通及び通信システムの一部の例示の図である。
【0014】
図3】本開示の実施形態によるルートプランニングのための技術の一例を示すフローチャート図である。
【0015】
図4】本開示の実装によるマップの一例を示す図である。
【0016】
図5】本開示の実装による目的の選好順位付けグラフの一例を示す図である。
【0017】
図6】本開示の実装によるナビゲーションマップの学習及び使用の概要を示す図である。
【0018】
図7】本開示の実施形態によるルートプランニングのためのナビゲーションマップを学習する技術の一例を示すフローチャート図である。
【発明を実施するための形態】
【0019】
前述のように、ルートプランナは、通常、車線情報なしでルートを提供する。このようなルートは、全地球測位システム(GPS)座標の連結グラフに基づいて計画される場合があり、あまりにも抽象的であるため、自律走行には使用できない。自律走行は、車線変更及び決定を行い、ルートに従うことができない障害が何らかの理由で発生した場合の偶発事象に備えて計画するために、車線固有の情報を必要とする。従来のルートプランナのマップでは、トポロジー、接続性、及び車線情報は通常利用できない。本明細書で使用される場合、自律走行は、文脈がそうでないことを示す場合を除き、人間の運転者又はテレオペレータ等による手動制御と比較すると、ホスト車両を自動的に実行するための車両走行制御を実行することを含む。
【0020】
さらに、そのようなルートプランナは、典型的には、1つの目的、すなわち、時間のみについて解決し得る。つまり、目的地に到達するまでにかかる時間を最小限に抑えることで、古典的なルートプランニングを実行する。一部のルートプランナでは、ユーザが道路タイプの選好(例えば、地方道路の代わりに高速道路、有料道路の代わりに無料道路)を指定できる場合がある。しかしながら、自律走行では、異なる(例えば、より多くの)基準、制約、及び/又は目的を使用してルートプランニングを行う必要がある。
【0021】
単純な例を使用して説明すると、従来のルートプランナの場合、運転者が予期した曲がり角で曲がらず、出口を出ない場合、ルートプランナは、通常、代替ルートを識別するために、完了までに少なくとも数秒かかる「再ルーティング」動作を実行する。自律走行の場合、混雑のために自律走行車(AV)が出口を出られなかったと仮定すると、ルーティングアプリケーションが代替ルートを識別する(すなわち、再ルーティングする)までAVがその場で停止し、再ルーティング動作を実行している間に偶発事象ルートを通行したりすることは受け入れられない。
【0022】
むしろ、本開示に従ったルートプランナは、全ての偶発事象に対して事前に計画することができる。偶発事象は、後述するようにポリシーに組み込まれ得る。一例では、偶発事象は、以前の確率を考慮して計画され得る。確率は、車線セグメント通行の履歴データに基づき得る。確率は、車線変更に成功する確率、交通に基づいて車線変更に失敗する確率、交通履歴の確率、又はその他の確率を含み得る。車線レベルルートプランナは、異なる道路又は道路セグメントでの自律走行の能力レベルに基づいてルートを計画することもできる。能力については、以下にさらに説明する。ルートプランナは、自律走行、運転者、及び/又はテレオペレータ間の制御の移行を決定(例えば、計画)することもできる。車線レベルルートプランナは、確率を組み込んだナビゲーションマップを使用する。
【0023】
繰り返しになるが、本開示によるルートプランナは、AVが車線変更を行うために制御されるルートに沿った場所を含む目的地への車線レベルルートを決定する。つまり、ルートプランナによって、車線変更、及び、場合によってはルートに沿った障害が計画され得る。追加的に、ルートプランナは、成功及び失敗を想定し、コスト(例えば、目的地への時間)を最小限に抑える確定的な計画を取得するだけではなく、目標(例えば、目的地)までの全ての可能なルートの偶発事象プランを有し得る。
【0024】
自律走行車の現実世界での展開には、複数の目的を同時に両立させる必要があり得る。いくつかの目的は、目的地への時間、所望のユーザの快適性(例えば、でこぼこした道路対平坦な道路)、所望のユーザの道路速度、道路ナビゲーション能力(例えば、車両が道路又は車線を通行する能力を有するかどうか)、ジオフェンスエリア間の移行ポイント、及び/又は他の目的を含んでもよい。電気又はハイブリッド電気自動車の場合、追加の目的は、バッテリ効率及び/又は再充電のための停止ポイントに関連し得る。本開示による車線レベルルートプランニングは、このような多目的プランニングを実行することができる。
【0025】
本開示の態様では、車線レベル情報を含むナビゲーションマップが学習され得る。その後、ナビゲーションマップを使用して車線レベルルートが生成され得る。
【0026】
従来の自律走行車ルートプランナは、複数の状態特徴又は目的に関して学習しない場合がある。対照的に、本開示の実装に従った車線レベルルートプランニングにおいて、ナビゲーションマップは、道路の車線の複数の車線セグメントに関して、及び学習を介して、本明細書にさらに記載されるように、少なくともいくつかの環境情報、車両情報、人的情報、より少ない、より多い若しくは他の情報、又はそれらの組み合わせを組み込むことができる。
【0027】
本明細書に記載のリスク認識多目的車線レベルルートプランニングは、自律した接続された車両の多目的空間における考慮として、各車線の確率性及び特定の明確な目的報酬値に合わせて調整されたカスタマイズされた学習が必要であり、それらが本明細書に記載されている。
【0028】
多目的での学習は、少なくとも、単一目的プランナよりも自動運転をより適応させることができる車線レベルルートプランナによってより多くの懸念を考慮することができるため、単一目的学習よりも有利であり得る。複数の目的が可能な場合、車線レベルルートプランナは、良好な(例えば、所望の、快適な)ルート、交通パターン、ユーザ選好、能力等について学習することができる(又はユーザによって教えられ得る)。例えば、ユーザは、正確に対応する目的で選好を直接エンコードすることができる。
【0029】
車線レベルルートプランニングの詳細は、本明細書では、それが実装可能な環境を最初に参照して説明する。
【0030】
図1は、本明細書に開示の態様、特徴及び要素が実装され得る車両の例を示す図である。図示の実施形態では、車両100は様々な車両システムを含む。車両システムは、シャーシ110、パワートレイン120、コントローラ130、及び車輪140を含む。車両システムの追加の又は異なる組み合わせが使用されてもよい。簡潔のため、車両100は4つの車輪140を含むように示されているが、プロペラ又はトレッド等の1つ以上の任意の他の推進装置が使用されてもよい。図1において、パワートレイン120、コントローラ130及び車輪140等の要素を相互接続する線は、データ又は制御信号等の情報、電力又はトルク等の力、又は情報及び電力の両方が各要素間で伝達され得ることを示している。例えば、コントローラ130は、パワートレイン120から電力を受信して、パワートレイン120、車輪140、又はその両方と通信して、車両100を制御してもよく、これは、車両100を加速、減速、操縦又は他のやり方で制御することを含み得る。
【0031】
図1の例で示されるパワートレイン120は、電源121、トランスミッション122、ステアリング装置123、及びアクチュエータ124を含む。サスペンション、駆動シャフト、車軸、又は排気システム等のパワートレインの任意の他の要素又は要素の組み合わせが含まれてもよい。別々に示されているが、車輪140は、パワートレイン120に含まれてもよい。
【0032】
電源121は、エンジン、バッテリ、又はこれらの組み合わせを含む。電源121は、電気エネルギー、熱エネルギー又は運動エネルギー等のエネルギーを提供するように動作する任意のデバイス又はデバイスの組み合わせであってもよい。一例では、電源121は、内燃エンジン、電気モータ又は内燃エンジン及び電気モータの組み合わせ等のエンジンを含み、車輪140の1つ以上に原動力としての運動エネルギーを提供するように動作する。代替的に又は追加的に、電源121は、ニッケルカドミウム(NiCd)、ニッケル亜鉛(NiZn)、ニッケル水素(NiMH)、リチウムイオン(Li-ion)等の1つ以上の乾電池、太陽電池、燃料電池、又はエネルギーを提供することが可能な任意の他のデバイス等のポテンシャルエネルギー装置を含んでもよい。
【0033】
トランスミッション122は、電源121から運動エネルギー等のエネルギーを受信し、原動力を提供するために車輪140にエネルギーを送る。トランスミッション122は、コントローラ130、アクチュエータ124又はその両方によって制御されてもよい。ステアリング装置123は、コントローラ130、アクチュエータ124又は両方によって制御され、車両を操縦するために車輪140を制御してもよい。アクチュエータ124は、コントローラ130から信号を受信してもよく、車両100を動作させるために電源121、トランスミッション122、ステアリング装置123又はこれらの任意の組み合わせを作動又は制御してもよい。
【0034】
例示の実施形態では、コントローラ130は、位置決め装置131、電子通信装置132、プロセッサ133、メモリ134、ユーザインターフェース135、センサ136、及び電子通信インターフェース137を含む。これらの要素のうち少数が、コントローラ130の一部として存在し得る。単一の装置として示されているが、コントローラ130の任意の1つ以上の要素が任意の数の分離した物理装置に組み込まれてもよい。例えば、ユーザインターフェース135及びプロセッサ133は、第1の物理装置に組み込まれてもよく、メモリ134は、第2の物理装置に組み込まれてもよい。図1には示されていないが、コントローラ130は、バッテリ等の電源1210を含んでもよい。個別の要素として示されているが、位置決め装置131、電子通信装置132、プロセッサ133、メモリ134、ユーザインターフェース135、センサ136、電子通信インターフェース137、又はこれらの任意の組み合わせは、1つ以上の電子装置、回路又はチップに組み込まれてもよい。
【0035】
プロセッサ133は、光プロセッサ、量子プロセッサ、分子プロセッサ又はこれらの組み合わせを含む現存する又は今後開発される信号又は他の情報を操作又は処理することが可能な任意のデバイス又はデバイスの組み合わせを含んでもよい。例えば、プロセッサ133は、1つ以上の専用プロセッサ、1つ以上のデジタル信号プロセッサ、1つ以上のマイクロプロセッサ、1つ以上のコントローラ、1つ以上のマイクロコントローラ、1つ以上の集積回路、1つ以上の特定用途向け集積回路、1つ以上のフィールドプログラマブルゲートアレイ、1つ以上のプログラマブルロジックアレイ、1つ以上のプログラマブルロジックコントローラ、1つ以上の状態機械、又はこれらの任意の組み合わせを含んでもよい。プロセッサ133は、位置決め装置131、メモリ134、電子通信インターフェース137、電子通信装置132、ユーザインターフェース135、センサ1360、及びパワートレイン136の1つ以上と動作可能に結合されてもよい。例えば、プロセッサは、通信バス138を介してメモリ134と動作可能に結合されてもよい。
【0036】
メモリ134は、プロセッサ133によって使用される又はそれと接続される、機械可読命令又はそれに関連付けられる任意の情報を、例えば、保持、記憶、伝達又は搬送することが可能な任意の有形の非一時的なコンピュータ使用可能又はコンピュータ可読媒体を含む。メモリ134は、例えば、1つ以上の半導体ドライブ、1つ以上のメモリカード、1つ以上のリムーバブル媒体、1つ以上の読み取り専用メモリ、1つ以上のランダムアクセスメモリ、ハードディスク、フロッピーディスク、光学ディスクを含む1つ以上のディスク、磁気若しくは光学カード、又は電子情報を記憶するのに適した任意のタイプの非一時的な媒体、又はこれらの任意の組み合わせであってもよい。例えば、メモリは、1つ以上の読み取り専用メモリ(ROM)、1つ以上のランダムアクセスメモリ(RAM)、1つ以上のレジスタ、低電力DDR(LPDDR)メモリ、1つ以上のキャッシュメモリ、1つ以上の半導体メモリデバイス、1つ以上の磁気媒体、1つ以上の光学媒体、1つ以上の磁気光学媒体、又はこれらの任意の組み合わせであってもよい。
【0037】
通信インターフェース137は、図示のような無線アンテナ、有線通信ポート、光学通信ポート、又は有線若しくは無線電子通信媒体150とインターフェース接続することが可能な任意の他の有線若しくは無線装置であってもよい。図1は単一の通信リンクを介して通信を行う通信インターフェース137が示されているが、通信インターフェースは、複数の通信リンクを介して通信を行うように構成されてもよい。図1は単一の通信インターフェース137を示しているが、車両は、任意の数の通信インターフェースを含んでもよい。
【0038】
通信装置132は、通信インターフェース137等を介して、有線又は無線電子通信媒体150を介して信号を送信又は受信するように構成される。図1に明示されていないが、通信装置132は、無線周波数(RF)、紫外線(UV)、可視光、光ファイバ、有線回線、又はこれらの組み合わせ等の任意の有線又は無線通信媒体を介して送信、受信又は両方を行うように構成されてもよい。図1は、単一の通信装置132及び単一の通信インターフェース137を示しているが、任意の数の通信装置及び任意の数の通信インターフェースが使用されてもよい。いくつかの実施形態では、通信装置132は、狭域通信(DSRC)装置、車載装置(OBU)、又はこれらの組み合わせを含む。
【0039】
位置決め装置131は、車両100の経度、緯度、高度、進行方向又は速さ等の地理情報を決定してもよい。一例では、GPSは、広域補強システム(Wide Area Augmentation System;WAAS)対応米国海洋電子機器協会(National MarineElectronics Association;NMEA)装置、無線三角測量装置、又はこれらの組み合わせ等の全地球測位システム(GPS)装置を含む。位置決め装置131は、例えば、車両100の現在の向き、2次元又は3次元での車両100の現在地、車両100の現在の角度方向、又はこれらの組み合わせを表す情報を取得するために使用され得る。
【0040】
ユーザインターフェース135は、仮想又は物理キーパッド、接触パッド、ディスプレイ、接触ディスプレイ、ヘッドアップディスプレイ、仮想ディスプレイ、拡張現実ディスプレイ、触覚ディスプレイ、視線追跡装置等の特徴追跡デバイス、スピーカ、マイクロホン、ビデオカメラ、センサ、プリンタ、又はこれらの任意の組み合わせ等、人物とインターフェース接続することが可能な任意の装置を含む。ユーザインターフェース135は、図示のようにプロセッサ133と、又はコントローラ130の任意の他の要素と動作可能に結合されてもよい。単一の装置として示されているが、ユーザインターフェース135は、1つ以上の物理装置を含んでもよい。例えば、ユーザインターフェース135は、人物との音声通信を行うためのオーディオインターフェース、及び人物との視覚及びタッチに基づく通信を行うためのタッチディスプレイの両方を含んでもよい。ユーザインターフェース135は、複数の物理的に分離した装置、単一の物理装置の中の複数の定義部分、又はこれらの組み合わせ等の複数のディスプレイを含んでもよい。
【0041】
センサ136は、車両を制御するために使用され得る情報を提供するように動作可能である。センサ136は、センサのアレイであってもよい。センサ136は、車両動作情報を含む車両100の現在の動作特徴に関する情報を提供してもよい。センサ136は、例えば、速度センサ、加速度センサ、ステアリング角センサ、トラクション関連センサ、ブレーキ関連センサ、ハンドル位置センサ、視線追跡センサ、着座位置センサ、又は任意のセンサ若しくはセンサの組み合わせを含んでもよく、これらは車両100の現在の動的状況の何らかの態様に関する情報を報告するように動作可能である。
【0042】
センサ136は、動作環境情報等の車両100を取り囲む物理環境に関する情報を取得するように動作可能な1つ以上のセンサを含んでもよい。例えば、1つ以上のセンサが、車線等の道路の形状、及び固定障害物、車両及び歩行者等の障害物を検出してもよい。センサ136は、既知の又は後に開発される、1つ以上のビデオカメラ、レーザ感知システム、赤外線感知システム、音響感知システム、又は任意の他の適切なタイプの車載環境感知デバイス、又はデバイスの組み合わせであるか、又はこれらを含み得る。いくつかの実施形態では、センサ136及び位置決め装置131が結合される。
【0043】
別に示されてはいないが、車両100は、軌道コントローラを含んでもよい。例えば、コントローラ130が、軌道コントローラを含んでもよい。軌道コントローラは、車両100の現在の状態及び車両100に対して計画されたルートを記述する情報を取得し、この情報に基づいて、車両100に対する軌道を決定及び最適化するように動作可能であってもよい。いくつかの実施形態では、軌道コントローラは、車両100が軌道コントローラによって決定される軌道に従うように、車両100を制御するように動作可能な信号を出力してもよい。例えば、軌道コントローラの出力は、パワートレイン120、車輪140又はその両方に供給され得る最適化された軌道であり得る。いくつかの実施形態において、最適化された軌道は、一組のステアリング角等の制御入力であってもよく、各ステアリング角は1つの時点又は位置に対応する。いくつかの実施形態において、最適化された軌道は、1つ以上の経路、線、曲線、又はこれらの組み合わせであり得る。
【0044】
1つ以上の車輪140は、ステアリング装置123の制御下でステアリング角に枢動される操縦車輪、トランスミッション122の制御下で車両100を推進するためのトルクを与えられる推進車輪、又は車両100を操縦及び推進し得る操縦及び推進車輪であってもよい。
【0045】
図1には示されていないが、車両は、エンクロージャ、ブルートゥース(登録商標)モジュール、周波数変調(FM)ラジオ装置、近距離無線通信(NFC)モジュール、液晶表示(LCD)ディスプレイ装置、有機発光ダイオード(OLED)ディスプレイ装置、スピーカ、又はこれらの任意の組み合わせ等の図1に示されていない追加の装置又は要素を含んでもよい。
【0046】
車両100は、交通網の一部を移動するように、直接的な人間の介入なしで、自律的に制御される自律走行車であってもよい。図1に別に示されていないが、自律走行車は、自律走行車のルーティング、ナビゲーション及び制御を行う自律走行車制御装置を含んでもよい。自律走行車制御装置は、車両の別の装置と一体化されてもよい。例えば、コントローラ130は、自律走行車制御装置を含んでもよい。
【0047】
存在する場合、自律走行車制御装置は、現在の車両動作パラメータに従って車両交通網の一部を移動するように車両100を制御し又は動作させてもよい。自律走行車制御装置は、車両の駐車等の定義された動作又は操縦を行うように車両100を制御し又は動作させてもよい。自律走行車制御装置は、車両情報、環境情報、車両交通ネットワークを表す車両交通ネットワーク情報、又はこれらの組み合わせに基づいて車両100の現在地等の出発地から目的地への移動ルートを生成してもよく、ルートに従って車両交通ネットワークを移動するように車両100を制御し又は動作させてもよい。例えば、自律走行車制御装置は、軌道コントローラに移動ルートを出力して、生成されたルートを使用して出発点から目的地に移動するように車両100を動作させてもよい。
【0048】
図2は、本明細書に開示の態様、特徴及び要素が実装され得る車両交通及び通信システムの一部の例示の図である。車両交通及び通信システム200は、図1に示される車両100等の1つ以上の車両210/211を含んでもよく、これは車両交通ネットワーク220の1つ以上の部分を介して移動してもよく、1つ以上の電子通信ネットワーク230を介して通信を行う。図2には明示されていないが、車両はオフロードエリアを通行してもよい。
【0049】
電子通信ネットワーク230は、例えば、車両210/211と1つ以上の通信デバイス240との間の音声通信、データ通信、映像通信、メッセージング通信、又はこれらの組み合わせ等の通信を提供する多重アクセスシステムであってもよい。例えば、車両210/211は、ネットワーク230を介して通信デバイス240から車両交通ネットワーク220を表す情報等の情報を受信してもよい。
【0050】
いくつかの実施形態では、車両210/211は、有線通信リンク(図示せず)、無線通信リンク231/232/237、又は任意の数の有線若しくは無線通信リンクの組み合わせを介して通信してもよい。図示のように、車両211/211は、陸上無線通信リンク231を介して、非陸上無線通信リンク232を介して、又はこれらの組み合わせを介して通信する。陸上無線通信リンク231は、イーサネット(登録商標)リンク、シリアルリンク、ブルートゥース(登録商標)リンク、赤外線(IR)リンク、紫外線(UV)リンク、又は電子通信を提供可能な任意のリンクを含んでもよい。
【0051】
車両210/211は、別の車両210/211と通信してもよい。例えば、ホスト又は対象の車両210が、直接通信リンク237を介して又はネットワーク230を介して、遠隔又はターゲット車両(RV)211から基本安全メッセージ(basic safety message;BSM)等の1つ以上の自律走行車間メッセージを受信してもよい。リモート車両211は、300メートル等の定義されたブロードキャスト範囲内のホスト車両にメッセージをブロードキャストしてもよい。いくつかの実施形態では、ホスト車両210は、信号リピータ(図示せず)又は別のリモート車両(図示せず)等のサードパーティを介してメッセージを受信してもよい。車両210/211は、例えば、100ミリ秒等の定義された間隔に基づいて周期的に1つ以上の自動車両間メッセージを送信してもよい。
【0052】
自動車両間メッセージは、車両識別情報、経度、緯度若しくは高度情報等の地理空間状態情報、地理空間位置精度情報、車両加速度情報、ヨーレート情報、速度情報、車両方位情報、制動システム状態情報、スロットル情報、ハンドル角度情報若しくは車両ルーティング情報等の運動状態情報、又は送信車両状態に関連する車両サイズ情報、ヘッドライト状態情報、方向指示器情報、ワイパー状態情報、トランスミッション情報若しくは任意の他の情報若しくは情報の組み合わせ等の車両動作状態情報を含んでもよい。例えば、トランスミッション状態情報は、送信車両のトランスミッションがニュートラル状態、駐車状態、前進状態又は後退状態に有るかどうかを示してもよい。
【0053】
車両210は、アクセスポイント233を介して通信ネットワーク230と通信してもよい。コンピュータ装置を含み得るアクセスポイント233は、無線又は有線通信リンク231/234を介して、車両210と、通信ネットワーク230と、1つ以上の通信デバイス240と、又はこれらの組み合わせと通信するように構成される。例えば、アクセスポイント233は、基地局、BTS(base transceiver station)、Node-B、eNode-B(enhanced Node-B)、HNode-B(Home Node-B)、無線ルータ、有線ルータ、ハブ、リレー、スイッチ、又は任意の類似の有線若しくは無線デバイスであってもよい。ここでは単一の装置として示されているが、アクセスポイントは、任意の数の相互接続要素を含んでもよい。
【0054】
車両210は、衛星235又は他の非陸上通信デバイスを介して通信ネットワーク230と通信してもよい。コンピュータデバイスを含み得る衛星235は、1つ以上の通信リンク232/236を介して、車両210と、通信ネットワーク230と、1つ以上の通信デバイス240と、又はこれらの組み合わせと通信するように構成される。ここでは単一の装置として示されているが、衛星は、任意の数の相互接続要素を含んでもよい。
【0055】
電子通信ネットワーク230は、音声、データ、又は任意の他のタイプの電子通信を提供するように構成される任意のタイプのネットワークである。例えば、電子通信ネットワーク230は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、仮想プライベートネットワーク(VPN)、モバイル若しくはセルラ電話ネットワーク、インターネット、又は任意の他の電子通信システムを含んでもよい。電子通信ネットワーク230は、トランスミッションコントロールプロトコル(TCP)、ユーザデータグラムプロトコル(UDP)、インターネットプロトコル(IP)、リアルタイムトランスポートプロトコル(RTP)、ハイパーテキストトランスポートプロトコル(HTTP)、又はこれらの組み合わせ等の通信プロトコルを使用する。ここでは単一の装置として示されているが、電子通信ネットワークは、任意の数の相互接続要素を含んでもよい。
【0056】
車両210は、車両交通網220の一部又は状態を識別してもよい。例えば、車両は、速度センサ、車輪速度センサ、カメラ、ジャイロスコープ、光学センサ、レーザセンサ、レーダセンサ、音響センサ、又は車両交通ネットワーク220の一部若しくは状態を決定若しくは識別することが可能な任意の他のセンサ若しくは装置又はこれらの組み合わせであってもよく又はそれを含み得る図1に示されたセンサ136等の少なくとも1つの車載センサ209を含む。
【0057】
車両210は、交通ネットワーク220を表す情報、1つ以上の車載センサ209、又はこれらの組み合わせ等のネットワーク230を介して伝達される情報を使用して、車両交通ネットワーク220の一部又は複数の部分を通行してもよい。
【0058】
簡潔のため、図2には1つの1つの車両交通ネットワーク220、1つの電子通信ネットワーク230及び1つの通信デバイス240が示されているが、任意の数のネットワーク又は通信デバイスが使用されてもよい。車両交通及び通信システム200は、図2に示されていないデバイス、装置又は要素を含んでもよい。車両210は単一の装置として示されているが、車両は、任意の数の相互接続要素を含んでもよい。
【0059】
ネットワーク230を介して通信デバイス240と通信する車両210が示されているが、車両210は、任意の数の直接又は間接通信リンクを介して通信デバイス240と通信してもよい。例えば、車両210は、ブルートゥース(登録商標)通信リンク等の直接通信リンクを介して通信デバイス240と通信してもよい。
【0060】
図3は、本開示の実施形態によるルートプランニングのための技術の一例を示すフローチャート図である。技術300は、図1に示された車両100、図2に示された車両210/211のうちの1つ、半自律走行車、運転支援機能を含み得る任意の他の車両、又は運転者等によって手動で制御される車両であり得るホスト車両において部分的又は完全に実装され得る。技術300は、図1のメモリ134等のメモリに記憶される命令(例えば、動作)として実装され得る。命令は、図1のプロセッサ133等のプロセッサによって実行され得る。技術300は、専用のハードウェア又はファームウェアを使用して実装され得る。複数のプロセッサ、メモリ、又はその両方が使用されてもよい。
【0061】
技術300は、車線レベルルートプランナによって部分的又は完全に実装され得る。車線レベルプランナは、図1等に関して説明されたCPU(中央処理装置)、メモリ、及び入出力装置を含むプロセッサを使用して実装され得る。プロセッサを車線レベルルートプランナとして機能させるコンピュータプログラムは、プロセッサにインストールされ且つ実行され得る。これにより、プロセッサを車線レベルルートプランナとして機能させることが可能になる。なお、ここではソフトウェアによって車線レベルルートプランナが実装される例を説明するが、当然のことながら、ここで説明する各情報処理を実行するために用意された専用のハードウェアによっても車線レベルルートプランナは実装され得る。
【0062】
ステップ302において、技術300は目的地を受信する。一例では、ユーザ(例えば、運転者)は、ルーティングアプリケーションのユーザインターフェースを介して目的地を提供することができる。一例では、ユーザは、ユーザのポータブルデバイス上で実行され得るルーティングアプリケーションに目的地を提供することができる。別の例では、車両は、サービス(例えば、ロボタクシーサービス)を実行しており、目的地は、配車プロセスを介して技術300に提供されてもよく、これにより、車両は、顧客又は荷物のピックアップ場所又は顧客又は荷物のドロップオフ場所であり得る目的地に移動する。技術300に目的地を提供する他のやり方も可能である。目的地は、住所、ランドマーク、会場、又は他の目的地タイプであってもよい。技術300は、受信した目的地をGPS座標の集合に変換することができる。
【0063】
ステップ304において、技術300は、マップ(すなわち、ナビゲーションマップ又は車線レベルナビゲーションマップ)を使用して目的地への車線レベルルートを取得する。車線レベルルートは、道路の第1の車線の第1のセグメントから道路の第2の車線の第2のセグメントへの遷移(すなわち、遷移のためのアクション)を含む。一例では、目的地は、車線レベルルートを計算する図2の通信デバイス240等のサーバ(例えば、クラウド型のサーバ)に(無線で)送信されて提供されてもよい。図4に関して、マップ及び車線レベルルートの一例を説明する。
【0064】
図4は、本開示の実装によるマップの一例を示す図である。マップ400は、目的地が道路セグメント401にあることを示す。マップ400は、3つの車線、車線404A~404Cを含む道路402を含む。マップ400の車線は、車線セグメントに分割される。車線セグメントは、マップ400の番号付きセグメントによって示される。例えば、車線404Aは、車線セグメント406A~406Cを含む。車両403は、現在、車線セグメント406Aにあり、車線セグメント401の目的地に向かっている。車線セグメント406Aは、車両403の出発点(図示せず)と目的地との間の中間車線セグメントであってもよい。
【0065】
一例では、全ての道路セグメントは、同じ長さ(例えば、100メートル、200メートル、又はその他のセグメント長)を有し得る。一例では、車線セグメントの長さの少なくとも一部は、車線セグメントの道路に沿った速度に依存し得る。例えば、高速では、車線セグメントは、500メートル等のより長い長さを有してもよい。一例では、一部の車線セグメントの長さは調整され得る。つまり、例えば、第1の車線レベルルートを生成する場合、第1の車線レベルルートは、第1の長さを有する車線セグメントの一部により生成されてもよく、第2の車線レベルルートを生成する場合、第2の車線レベルルートは、第2の長さを有する車線セグメントの一部により生成されてもよい。車線セグメントの長さは、道路における速度、時刻(例えば、ラッシュアワー対週末)、社会地理的領域(例えば、スクールゾーン、住宅街)、天候(例えば、晴れ対雪)、道路タイプ(例えば、高速道路対市街地道路)、より多い、より少ない、その他の基準、又はそれらの組み合わせに基づいて変更され得る。例えば、視覚的に示されているように、車線セグメント406Eは、車線セグメント406Cよりも短い。しかし、車線セグメント406Dは、車線セグメント406Cよりも長い。
【0066】
マップ400において、車線セグメントは、識別番号(ID)を有し得る。例えば、車線セグメント406A~406Eは、それぞれID1、2、3、7、13を有する。車線セグメントの少なくとも一部は、メタデータに関連付けられ得る。一例では、メタデータには、1つ以上の分類(例えば、指定)が含まれ得る。例えば、マップ400は、(異なる陰影を使用して)IDが1、2、及び3の車線セグメントが高速セグメントであることを示し、IDが4、5、6、7、及び11の車線セグメントが標準速度(例えば、速度制限)セグメントであることを示し、IDが8、9、及び10の車線セグメントが快適(例えば、低速)セグメントであることを示し、IDが12、13、及び15の車線セグメントが市街地車線セグメントであることを示し、IDが14、16、及び17の車線セグメントが手動運転の車線セグメントであることを示している。これらの分類は、必ずしも相互に排他的ではない。例えば、市街地車線セグメントは手動運転車線セグメントであり得る。
【0067】
快適性車線セグメントとは、車線セグメントの道路上の制限速度の-10マイル/時間(又はその他の閾値速度)以内の速度で交通が移動し得る車線セグメントであってもよい。手動運転車線セグメントとは、自律的に通行できない、又は十分な信頼度で自律的に通行できない車線セグメントである。このような車線セグメントは、運転者又はテレオペレータ等の手動運転制御の下で通行する必要がある。そのため、車線レベルルートプランナは、車線セグメントの一定時間前に、ユーザが車両の手動運転制御を引き継ぐ必要があることをユーザ(例えば、運転者)に通知するアクションを含んでもよい。
【0068】
一例では、車線レベルルートを取得することは、起点位置から目的地まで車線セグメントを通行するためのポリシーを取得することを含んでもよい。ポリシーには、車線遷移が含まれる。より正確には、後述するように、ポリシーは、車両が現在の車線セグメント内にあることを考慮したアクションを提供する。一例では、ポリシーは確定的なポリシーであり得る。別の例では、ポリシーは確率モデルに基づき得る。
【0069】
ルートプランニングでは、目的地への時間を最小化することがルートプランナの通常の目的であるが、本開示に従った車線レベルルートプランナは、以下にさらに説明するように、いくつかの目的のために最適化することによって車線レベルルートを取得することができる。
【0070】
車線レベルルートは、1つのタイプのマルコフ決定過程(MDP)モデルを使用して取得され得る。車線レベルルートプランニングは、トポロジカル部分観測マルコフ決定過程(TPOMDP)又はその完全に観測可能なサブクラスのトポロジカルマルコフ決定過程(TMDP)としてモデル化され得る。TPOMDP及びTMDPは、安全性、円滑性、及び/又は他の人の選好を最大化する等の追加的な目的尺度を、移動時間又は移動距離の最小化等、典型的な部分観測マルコフ決定過程モデル(POMDP)又はマルコフ決定過程(MDP)の目的に組み込むことを可能にする。TPOMDPモデルを解くことは、TMDPモデルを解くことに似ている場合があるが、TPOMDPが信念状態(すなわち、確率)に基づいており、それぞれの状態の確率を表し、それぞれの状態の観測値の生成に対応する観測確率に従うという点が異なる。他のモデルタイプも可能である。例えば、モデルはスカラー化された多目的マルコフ決定過程(MOMDP)、スカラー化された部分観測多目的マルコフ決定過程(MOPOMDP)、制約付きマルコフ決定過程(CMDP)、又は制約付き部分観測マルコフ決定過程(CPOMDP)のいずれかであり得る。
【0071】
一般性を失わずに説明するために、ユーザは低速車線の選好を示してもよい。そのため、ルートプランナはどのように目的地に到達するかの計算に「快適性」の目的を組み込むことができる。別の例では、ユーザは、追加的に又は代替的に、エネルギー消費を最小限に抑える車線の選好を示し得る。例えば、一部の車線セグメントにおける交通がノロノロ運転であり、より多くのエネルギー消費を必要とする傾向がある場合、ルートプランナは他の道路セグメントを優先してもよい。別の例として、上り坂下り坂の多い道路はエネルギー消費が多くなる傾向があるため、ルートプランナによってそのような道路よりも円滑な道路が優先される。別の例として、充電ステーションが少ない別の道路よりも、充電ステーションが多い道路が優先されてもよい。
【0072】
一般性を失わずに、モデル(例えば、TMDP又はTPOMDP)を確率的最短経路(SSP)構造用語(例えば、報酬の代わりにコスト、及び到着時に自己ループするターゲット状態としての目標)で記述され得る。
【0073】
連結グラフ(V、E、R)は、タプル〈S,A,T,C,E,δ,s,sg〉で表されるモデルに変換され得る。各頂点v∈Vは、ルーティング決定が行われ得る点のGPS座標であり得る。そのため、頂点は、交差点、(例えば、ID9の車線セグメントからID11の車線セグメントへの)車線変更位置、マージポイント等のGPS座標であり得る。説明するために、マップ400では、頂点vは、車線セグメントの特定の点の座標であり得る。例えば、特定の点は、車線セグメントの中点であり得る。連結グラフの各エッジe∈Eは、長さ又は通行時間R(e)の頂点の有向グラフを記述し得る。例えば、マップ400の下にある連結グラフでは、ID9の車線セグメントに対応する頂点は、ID10及び11の車線セグメントに接続される。
【0074】
次に、形式モデルTMDPの概要を示す。前述のように、このモデルは形式的にタプル〈S,A,T,C,E,δ,s,sg〉として記述され得る。Sは、状態又は頂点v∈Vの有限集合であり得る。Aは、後続車線セグメント(言い換えれば、後続の頂点)を選択するための各頂点におけるアクション空間である。一般性を損なわずに説明するために、アクション空間Aには、「左に移動する」、「右に移動する」、「真っすぐ移動する」、又は「斜めに移動する」というアクションを含み得る。しかしながら、より多い、より少ない、他のアクション、又はそれらの組み合わせも可能である。例えば、アクション空間Aは、手動制御を引き継ぐようにユーザに通知するアクション、手動制御に切り替えるアクション、制御が自動制御に切り替わることをユーザに通知するアクション、自動制御に切り替えるアクション等を含み得る。
【0075】
sは初期状態であり、これはルートプランナが車線レベルルートを計算するときの車両の現在位置であり得る。sgは目標状態であり、これは目的地であり得る。目標状態sgに達すると、どのアクションが実行されても目標状態が維持され、目標状態sgで実行される全てのアクションは0のコストを有する。
【0076】
T(つまり、T:S×A×S→[0,1])は、状態s∈Sでアクションa∈Aを実行した後に後続の状態s’∈Sが発生する確率を表す状態遷移関数であり得る。したがって、Tは、各アクションの確率的な成功/失敗を記述する状態遷移関数である。状態遷移関数T(s,a,s')=Pr(s'|s,a)は、アクションaが状態sで実行されたことを考慮した後続(車線セグメント又は頂点)の確率s'である。一例では、状態遷移関数は、頂点(例えば、車線セグメント)の隣接する頂点(例えば、車線セグメント)の少なくともいくつか(例えば、それぞれ)の各確率を含んでもよい。説明のため、ID1(すなわち、車線セグメント406A)の車線セグメントに関して、状態遷移関数Tは、ID1の車線セグメントからID4の車線セグメントへの遷移、ID1の車線セグメントからID2の車線セグメントへの遷移、及び/又はID1の車線セグメントからID5の車線セグメントへの遷移のいくつかについて各遷移確率を含んでもよい。いくつかの例では、状態遷移関数は、より離れた近隣へ(例えば、ID1の車線セグメントからID3の車線セグメントへ)の遷移確率を含んでもよい。
【0077】
そのため、マップを使用して目的地への車線レベルルートを取得することは、AVがマップの第1の車線セグメント上にある場合に、第1の車線セグメントに隣接する第2の車線セグメントに移動するようにAVを制御するアクションを提供するポリシーを取得することを含んでもよい。
【0078】
確率は、速度制限、エッジeの車線長、AVの仕様、時刻及び場所、交通渋滞情報、より多くの基準、より少ない基準、他の基準、又はそれらの組み合わせを含む基準に基づいて導出され得る。一例では、これらの確率(及び/又は遷移確率を取得するために使用される基準)は、以下でさらに説明するように学習され得る。
【0079】
【数1】
は、状態s∈Sでアクションa∈Aを実行するために期待される即時コストを表すマルチコスト関数を表し得る。そのため、車線レベルルートは1つ以上の目的を使用して計算され得る。コストCは、1つ以上の期待される目的に対する最適化のコストベクトルとしてモデル化され得る。1つ以上の期待される目的は、時間目的CT(すなわち、目的地への移動時間を最小化する時間に関する第1の目的)、快適性目的CC(すなわち、快適性車線セグメントの選好を示す快適性に関する第2の目的)、自律目的CA(すなわち、車両が手動で制御されるのとは対照的に自律的に制御され得る車線セグメントの選好を示す自律性に関する第3の目的)、市街地目的CU(すなわち、例えば、地方車線セグメントとは対照的な市街地車線セグメントの選好に関する第4の目的)、より少ない目的、より多い目的、他の目的、又はそれらの組み合わせを含んでもよい。一例では、コスト目的は発電に関連し得る。したがって、一例では、コストベクトルCは、
【数2】
によって与えられてもよく、ここで、各Ci (s,a)が状態sにあり、アクションaを実行するためのコスト目的iを示す。一例では、1つ以上の目的は、時間に関連する第1の目的、快適性に関連する第2の目的、自律性に関連する第3の目的、又は市街地車線セグメントに関連する第4の目的のうちの少なくとも2つを含んでもよい。
【0080】
目的は、有向非巡回グラフ(DAG)Eに続く選好順位付けで配置され得る。図5を用いて選好順位付けグラフの例を説明する。各目的は非負のスラックδ : e → R+を有してもよく、これはユーザが他の目的の価値を向上させるために、ある目的の価値にどれだけ「費やす」意思があるかを記述する。このように、1つ以上の目的は、スラック変数を含む選好順位付けで関連付けられる。
【0081】
モデルの解は、ポリシーπ:S→Aであってもよい。ポリシーπの下では、アクションa(すなわち、π(s))が状態sに対して選択される。つまり、ポリシーπは、状態sでアクションπ(s)∈Aを実行する必要があることを示し得る。ポリシーπは、ポリシーπに従って状態sから目的地(すなわち、目標状態sg)に到達するために期待される累積コストVπ(s)を表し得る価値関数Vπ:S→Cを含んでもよい。つまり、価値関数は、開始状態から目標状態に達するまでの各中間状態siの期待されるコスト(すなわち、価値)を提供し得る。
【0082】
最適なポリシーπ*は、期待される累積コストを最小化する。形式的には、初期状態sに対して、期待値は式(1)で与えられ得る。
【数3】
【0083】
式(1)において、St及びAtは、時間ステップtにおける状態及びアクションのランダム変数をそれぞれ表す。一般に、モデルを解くには、適切なポリシーが存在する必要がある。適切なポリシーπは、(1)確率1で目標に到達するポリシーが存在し、(2)確率1で目標に到達しない全ての状態は無限のコストをもたらす、という特性を有する。
【0084】
図3のステップ306において、技術300は、車線レベルルートを通行するようにAVを制御する。図4に戻り、図4の矢印は、決定されたポリシーπの下でのアクションを示す。矢印408Aは、「状態がID1の車線セグメントと等しい場合に、右のアクションを実行し、その結果、車両はID4の車線セグメントと等しい状態で終了する」というアクションを示す。この場合の「アクションを実行する」とは、アクセルペダルの動作量、ブレーキペダルの動作量、ハンドルのステアリング角等の変更により、「車両が制御される」ことを意味する。
【0085】
決定されたポリシーπには、偶発事象に備えたルートが組み込まれている(例えば、含まれる)。したがって、得られた車線レベルルートには偶発事象に備えたルートが含まれる。説明のため、車両がID9の車線セグメント内にある場合、ポリシーは車両がID11の車線セグメントに移動するように制御されることを示す。しかしながら、車両がID11の車線セグメントを取ることができず、ID10の車線セグメントに入ってしまった場合、ポリシーは車両をID6の車線セグメントに移動させ、且つID7の車線セグメントに移動させる「左のアクションを実行する」を示す。したがって、車線レベルルートを通行するようにAVを制御することは、第1のセグメントから第2のセグメントに遷移できないことに応答して、偶発事象ルートに従ってAVを制御することを含んでもよい。
【0086】
図5は、本開示の実装に従った目的の選好順位付けグラフの例500を示す。上述したように、モデルの目的はトポロジカルに順序付けすることであってもよい。トポロジカルに順序付けされた制約は、先行目的に対して最初の信念又は全ての信念のスラックを満たさせ得る。車線レベルルートプランナは、トポロジカルに順序付けされた制約グラフで順序付けされたポリシーを計算するために、目的について推論することができる。3つの異なる選好順位が記述されているが、本開示はそれに限定されず、他の構成(すなわち、選好順位)も可能である。
【0087】
例500に示される目的は、速度の最適化(すなわち、目的512,538及び556等のHとラベルされたバブル)、快適性の最適化(すなわち、目的514,534及び554等のCとラベルされたバブル)、市街地運転の最適化(すなわち、目的516,532及び552等のUとラベルされたバブル)、及び手動運転の最適化(すなわち、目的518,536及び558等のMとラベルされたバブル)に関連する。例示された目的は例であり、他の目的も可能である。さらに、例示された選好順位付けグラフは非限定的な例であり、同じ又は異なる目的及びトポロジーを含む他の選好順位付けグラフも可能である。これらの目的のそれぞれは、人間にとって有意であり得るそれぞれの意味ラベルに関連付けられる。本明細書でさらに説明するように、ユーザは、意味ラベルを使用して、車線レベルルートプランナのためのルート選好を示すことができる。
【0088】
例510は、連鎖選好順位付けグラフの例である。例510の選好順位付けグラフを使用する場合(すなわち、目的が連鎖的に関連している場合)、第1の高速目的が最大化され(すなわち、目的512)、次に、快適性目的(すなわち、目的514)は、それが高速目的のスラック513(例えば、3のスラック)内であれば最大化され、次に、市街地目的(すなわち、目的516)は、快適性目的のスラック515(例えば、1のスラック)内であれば最大化され、これはそれが最初の目的のスラック513内であることを保証するためにすでに制約されており、最後に、手動走行目的(すなわち、目的518)は、すでに制約されている市街地目的のスラック517(例えば、7のスラック)以内であれば最大化される。
【0089】
例510は、車線レベルルートプランナが高速道路(すなわち、目的512)を好むが、ルートプランナがより快適な別の代替ルート(すなわち、目的514)を選択するために、3分の余分な時間(すなわち、スラック513)を許容すると解釈されてもよく(例えば、理解され得る)、この代替ルートも快適性目的を最大化する。そのため、ユーザは、「可能な限り最速の道路を与えてもらうが、より快適な車線を運転するために、最速よりも3分長いルートを許可する」を本質的に示す入力を提供(例えば、コマンドを発行)してもよい。また、例510の他の目的についても同様である。スラック変数の測定単位は、それが制約する目的の測定単位と同じであることに注意すべきである。
【0090】
以下でさらに説明するように、ユーザは、ルートプランナがグラフィカルユーザインタフェース(例えば、ドラッグアンドドロップインターフェース、リスト等)を介して、又はユーザが選好を提供するための他のやり方を介して、選好順位付けグラフに変換し得る口頭コマンドを使用して、目的の選好を指定することができる。
【0091】
例530は、扇形の選好順位付けグラフの一例である。例530の選好順位付けグラフが使用される場合(つまり、目的がこのような扇形のような関係を持っている場合)、最適ポリシーは、市街地目的(すなわち、目的532)、快適性目的(すなわち、目的534)、及び手動運転目的(すなわち、目的536)に対して同時に計算される。次に、3つの最初の目的のスラック533,535及び537(すなわち、それぞれスラック値5、9、及び2)を条件として、高速目的(すなわち、目的538)を最大化する最終ポリシーが決定される。これは、最初の3つの目的のポリシー集合の交点を取得し、最後の目的のためにその空間を検索することと等価である。
【0092】
例550は、例510及び530を混合した有向グラフの一例である。
【0093】
各目的(例えば、例500のバブル)に対して、車線レベルルートプランナは、その目的を満たすルートの集合を取得する。例えば、目的552に関して、車線レベルルートプランナは、最適ルート(例えば、できるだけ多くの市街地車線で目的地に到達するための最小ルート)を識別する。目標に到達するために、1分間のスラック(すなわち、スラック553)が許容される。そのため、ルートプランナは、目標到達の周囲で可能性のエンベロープを提供すると考えることができる。つまり、ルートプランナは、最適な時間の1分以内にある全てのルート、及びそれらが市街地道路上にあるかどうかを識別することができる。したがって、スラック553内で目的552を満たすルートの最初の集合が返される。
【0094】
ルートの第2の集合は、目的554(すなわち、快適とマークされた車線を走行すること)を満たし、最も快適なルートの6分(すなわち、スラック555)以内である。同様に、9分(すなわち、スラック557)以内に手動運転目的を満たす第3のルートの集合も得られ、以下同様である。取得されたルートの全ての集合は目的556に渡され、このシンク目的から取得されたルートは、取得されたルートの全ての集合に入っている必要がる。状況によっては、全ての制約及びスラックを満たすルートは不可能な場合がある。
【0095】
例500のバブルへの入力矢印は、その目的が与えられたルートの集合(又は、選好順位付けグラフの構成に応じて、複数の集合)内にあるようにその目的を制約すると考えることができることに留意されたい。したがって、親矢印がない(つまり、入力矢印がない)場合、任意のスラック(存在する場合)内で目的を満たす任意のルートがルートプランナによって選択され得る。一方、選択された(複数の)ルートは、親の目的によって提供されたルート内に入っている必要がある。そのため、下流の目的は、提供された(例えば、入力の)ルートの(複数の)集合のプルーニングと考えることができる。
【0096】
一例では、選好順位付けグラフの代わりに、スカラー化関数を使用して、全ての報酬(例えば、コスト)を単一の値にマッピング(例えば、結合等)することができる。スカラー化関数を使用して、モデル/問題を最短経路最適化問題(SSP)MDP又はPOMDPに変換することができる。スカラー化関数を使用して、次の即時アクションの長期的な有用性を示す単一の値が取得されてもよく、これは単一の値を取得するために期待されるコストを結合する。形式的には、スカラー化関数f:C→Rは、単一の値に関してf(V(s))=Vf (s)であり、コスト関数に関してf(C(s))=Cf (s)であるようなものであってもよい。一例では、スカラー化関数は、目的の加重和又は目的の非線形関数であってもよい。所望の最適化に応じて、異なる重みが使用されてもよい。一例では、車線レベルルートプランニングは、確率を除去することによって、古典的プランニング(CP)問題としてモデル化され得る。
【0097】
使用するモデルに関係なく、車線レベルルートプランニングは階層的であってもよい。理解できるように、可能な車線の数が多いほど、仮にあった場合に、ポリシーの計算に時間がかかる可能性がある。車線レベルルートプランナが推論する車線セグメントの数を制限するために、車線レベルルートプランニングは階層的なやり方で実行され得る。例えば、フロリダ州マイアミの出発地及びアラスカ州フェアバンクスの目的地の場合、車線レベルルートプランナは、米国の道路をクラスタにグループ化し、クラスタ間の車線レベルルートを計画してから、ルートの各クラスタ内でルートレベルプランニングを実行してもよい。
【0098】
一例では、前述のように、車線レベルルートプランニングは、トポロジカル部分観測MDP(TPOMDP)としてモデル化され、例えば、(1)各州の交通レベル、(2)運転者及び/又は車両のうちの少なくとも1つの能力、及び/又は(3)様々な目的コストに対する信念を可能にしてもよい。
【0099】
より形式的には、TPOMDPはタプル〈S,A,Ω,T,O,R,E,δ〉として記述され得る。
【0100】
Sは有限の状態集合である。Aは有限のアクション集合である。Ωは有限の観測集合である。Tは状態遷移関数であり、T(s,a,s')=Pr(s'|s,a)は、アクションaが状態sで実行されたことを考慮した後続状態s'の確率である。Oは観測関数であり、O(a,s',ω)=Pr(w|a,s')は、アクションaが実行された結果、後続状態s'になったことを考慮した観測確率ωである。
【0101】
Rは報酬関数のベクトルであり、これは前述のコストベクトルCと等価であり得る。前述のように、Eはk個の報酬(例えば、コスト)に対するエッジの集合であり、一般性を失うことなく、報酬頂点kである1つのリーフ(すなわち、シンク)の報酬頂点を有する有向非巡回グラフを形成する。δは、エッジe=〈i,j〉∈Eを非負のスラック制約δ(e)≧0又は同等にδ(i,j)≧0にマッピングする関数である。
【0102】
TPOMDPは、世界の信念b∈B⊆Δ|S|に対して動作し、ここで、Δ|S|は状態Sに対する確率分布であり、且つ標準|S|-simplexとしてである。信念bは、状態に対する確率分布である。信念は、全ての時間ステップ、及び全ての前方、後方、後続、先行等の車線セグメントに存在する。信念bの場合、アクションaを実行して観察ωを行った後で、状態s’に対する次の信念bbaωは、
【数4】
であり、ここで、∝は比例を意味する。
【0103】
前述のように、TMDPはΩ=S及びO(a,s,s')=1であるTPOMDPのサブクラスであり、到達可能な信念b∈Bは全てのs∈Sに対してb(s)=1である。
【0104】
無限区間TPOMDPの目的は、割引係数γ∈[0,1)の初期信念bから期待される割引報酬を最大化しようとすることである。ポリシーπの場合、期待される割引報酬は、
【数5】
によって与えられてもよく、btは、遷移関数T及び観測関数Oに続いて生成された時間tの信念に対する確率変数を表し、これはアクションaが実行された結果として後続状態s’となったことを考慮した特定の観測の確率である。
【0105】
【数6】
は、信念bにおける期待される報酬であり、以下によって与えられ得る。
【数7】
【0106】
式(3)において、R(b,a)=Σsb(s)R(s,a)及びbbπ(b)ω'は式(2)の信念の更新に従う。
【0107】
ここで述べたように、車線レベルルートプランナは、ナビゲーションマップを使用してポリシーを取得する。一例では、ナビゲーションマップは学習され得る。ここで使用される場合、学習されるとは、ナビゲーションマップが進化され得ることを含む。ナビゲーションマップは、事前に設定された車線情報を含んでもよく、車線レベル情報が1つ以上の車両から取得されると、事前に設定された車線情報は、取得された車線レベル情報を反映する(例えば、組み込む)ように進化させることができる。ナビゲーションマップは、最初に車線レベル情報を含まなくてもよく、車線レベル情報は、1つ以上の車両から受信した車線レベル情報に基づいて構築(例えば、投入)され得る。
【0108】
車線レベル情報は、継続的に受信されてもよく、新たに受信した車線レベル情報を使用してナビゲーションマップが定期的に更新されてもよい。ナビゲーションマップは、(例えば、特定の車両に配備される)特定の車両のナビゲーションマップであってもよく、ナビゲーションマップは、車両自身からの車線レベル情報に基づいて更新され得る。
【0109】
追加的に又は代替的に、ナビゲーションマップは、多くの車両から(サーバ等において)受信した車線レベル情報に基づいて学習され得る。車線レベル情報はサーバと共にあってもよく、これはクラウド型のサーバであり得る。そのため、複数の車両は、その後、(実際に道路を走行する前に)時間に関する正確な初期推定、(新しいエリアの)人気のあるルートに関する選好、及び(同じコード/ハードウェアを共有する車両の)車両軍が通行するルートを計画しているべき場所に関する能力情報を受信し得る。
【0110】
車線レベル情報は、多くの車両から取得されてもよい。特定の顧客が所有する車両は、車線レベル情報を生成し得る。(タクシーサービス、デリバリーサービス、その他のサービス等を提供する)展開された車両群は、車線レベル情報を生成し得る。車両からの車線レベル情報は、車両のセンサから受信したデータを使用して生成され得る。一例では、生センサデータがサーバに送信され、サーバは、生センサデータを使用して車線レベル情報を生成し得る。
【0111】
このように、ナビゲーションマップは、異なる車線及び異なる道路の異なる車線セグメントについて学習された過去の走行パターン及び特性を含み得る。過去の走行パターンは、特定の車両、特定の車両の特定の運転者、又は複数の車両の集約された学習された履歴走行パターンのいずれかであり得る。
【0112】
1人以上の運転者の走行パターンが学習され、車線レベルルートプランニングに使用され得る。ナビゲーションマップは、道路状態に関する情報を含んでもよい。したがって、学習されたナビゲーションマップは、運転者の運転挙動の履歴及び/又は車線(より具体的には車線セグメント)の特性を活用/組み込むことができるものであり、車線レベルルートプランニングを可能にする。
【0113】
(例えば、クラウド型のサーバに接続されている)複数の接続された車両からの車線レベル情報は、共有ナビゲーションマップに結合されてもよい。接続された各車両は、1つ以上の通信デバイス240等のサーバに車線レベル情報を送信してもよく、これは、取得した車線レベル情報の全てを集約してナビゲーションマップを取得することができる。多車両多目的学習(すなわち、複数の接続車両からの車線レベル情報)は、単一の車両の学習を大幅に高速化することができ、車両が道路自体を走行する前にルートの値(例えば、車線レベル情報)を学習することを可能にする。
【0114】
経時的に、サーバは、特定の車両が走行した道路だけでなく、多くの運転者がエリア内で走行した多くの車線セグメントに関する情報を受信し得る。また、車線レベル情報は、車両プラットフォーム(例えば、日産リーフ、日産セントラ、日産ローグ等)の識別情報を含んでもよい。いくつかの例では、車線レベル情報は、車線レベル情報が生成された特定の運転者の情報(例えば、選好等)も含み得る。受信した車線レベル情報トレースを使用して、サーバは、その情報を車両(すなわち、車両仕様)、運転スタイル、道路(例えば、車線及び車線セグメント状態を含む)、及び/又はその他の基準に依存するものに分離して、それぞれが特定の車両、特定の車両プラットフォーム、特定の運転者、特定の運転スタイル等に固有の一意のナビゲーションマップを作成することができる。
【0115】
上述したように、道路の車線の車線セグメントに関して、及び学習を介して、少なくともいくつかの環境情報、車両情報、人的情報、より少ない、より多い、その他の情報、又はそれらの組み合わせが学習され得る。学習された情報は、確率に変換され得る。確率は、本明細書に記載されるように、状態遷移関数に組み込まれてもよく、又は状態遷移関数によって使用され得る。確率は、計算されるルート(例えば、ポリシー)に関して目的を設定する際にも使用され得る。
【0116】
環境情報は、交通パターン、歩行者パターン、車両(例えば、他のAV)による車線セグメントの通行困難情報、気象情報、負担情報、より多い、より少ない、その他の環境情報の1つ以上、又はこれらの組み合わせを含み得る。車両情報は、車線セグメントごとの平均速度情報、エネルギー使用(例えば、電気自動車のバッテリ使用、ハイブリッド自動車のガソリン及びバッテリ使用、又は内燃機関自動車のガソリン使用)、より多い、より少ない、その他の車両情報のうちの1つ以上、又はこれらの組み合わせを含み得る。
【0117】
人的情報は、好ましいルート、好ましい車線、制御移行の要求(自動運転から手動運転へ、又は手動運転から自動運転へ等)、運転者のオーバライドによる能力モデルの更新、より多い、より少ない、その他の人的情報、又はそれらの組み合わせのうちの1つ以上を含んでもよい。制御移行の要求は、制御の移行が要求された車線セグメントを含んでもよい。制御移行の要求は、計画された後続車線セグメント、及びどの後続車線セグメントを人間の運転者が取ったかを含んでもよい。
【0118】
車両がルートを通行しているときに(ナビゲーションマップの現在の状態に基づいているか、又は車線レベルプランナを介してルートを設定していないかにかかわらず)、車両のセンサを使用して、車線レベル情報に変換される情報を収集することができる。つまり、車両はシャドウモードにあり、センサを介して環境を監視していると考えられ得る。
【0119】
センサからのデータは、例えば、限定されないが、道路(したがって、車線及び車線セグメント)が市街地か高速道路か、車線セグメントが通行困難であるかどうか、交通が密集しているかどうか、密度のレベル等を識別するために使用されてもよい。通行の困難さは、運転者のオーバライド量に基づいて識別されてもよい。つまり、自動運転の決定が人間によってオーバライド又は修正された回数、又は人間が自動制御によって提案されたのとは異なるやり方で車両を制御するように自動制御に指示した回数である。
【0120】
負荷情報は、選択された車線変更の決定を与えられたユーザ(例えば、車両の乗員)が受け得るストレスのレベルを示し得る。説明するために、特定のルートは、混雑した又は高速の交通エリアで、比較的短い時間又は短い距離内で、車両が3つの車線セグメントを左に移動することを必要とする場合がある。このような状況は、ユーザにストレスを与え得る。このような負荷情報は、混雑エリアよりも前のはるかに早い車線セグメント遷移点を選択し、又はストレスのかかる状況を完全に回避するルートを選択するために使用されてもよい。
【0121】
車線レベル情報を使用して、カウントが確率に変換され得るように、カウントを実行し得る。例えば、一般性を失うことなく、交通密度のカウントは、道路の1つの車線セグメントを通行して次の車線セグメントに移動するのにかかる時間等、1つの車線セグメントから別の車線セグメントに移動する確率に変換されてもよく、車線セグメント上の交通量が少なかった場合と交通が密集していた場合の履歴の回数のカウントを使用して、交通密度の確率を決定してもよく、車線セグメント上の速度が速い回数のカウントを使用して、車線セグメントを高速であると分類してもよく、車線セグメント上の速度が制限速度の-10マイル以内であった回数のカウントを使用して、車線セグメントが快適性車線セグメントである確率を決定してもよく、以下同様である。
【0122】
ナビゲーションマップは確率から構築され得る。つまり、ナビゲーションマップに確率を組み込み得る。ナビゲーションマップは、図4に関して説明したような遷移グラフである。ポリシーを取得する際には、車線レベル情報(例えば、確率)に基づいて、次のアクション(例えば、次の車線セグメントに真っすぐ移動する、左隣の車線セグメントに移動する等)が決定され得る。一般性を失わずに説明するために、次のアクションは、例えば、現在の車線セグメントが渋滞しているかどうかに基づいて隣接する車線セグメントが渋滞している確率を含む、本明細書に記載されている隣接する車線セグメントの確率に基づいて確率的に(又は確定的に)決定され得る。
【0123】
ナビゲーションマップの車線レベル情報の少なくとも一部は、車線レベルルートプランナの目的を設定するために使用され得る。説明のため、限定されないが、前述のように、環境は通行困難を含んでもよく、(例えば、ユーザによって設定された)目的が自動運転を最大化する場合、ルートプランナは通行困難のある車線(又は車線セグメント)を回避するであろう。つまり、ルートプランナポリシーは、通行困難のある車線セグメントを回避するように計算される。
【0124】
目的地への時間(これには、制限速度、道路の長さ、停止信号、交通密度、車線セグメントが高速車線であるかどうか等が含まれるか又は組み込まれ得る)、選好(これには、快適性、高速道路とは対照的な市街地道路、エネルギー消費等の少なくともいくつかのユーザ選好が含まれ得る)、及び能力(これには、車線セグメントが有能に自動的に通行できるか、又は有能に手動で通行できるかが含まれ得る)についての目的を検討する。
【0125】
説明のため、限定されないが、時間、優先度、及び能力目的の少なくとも一部を使用してルートを計画することができるように、車両がルートを走行するときはいつでも、特定の車線セグメントを自動的に通行するための時間は完全停止の有無にかかわらず記録され得る。同様に、特定の車線セグメントを手動で通行する時間(つまり、人間が運転しているとき)も記録され得る。したがって、4つの平均持続時間が記録され得る。平均時間を使用して、自己ループ(停止)のTMDP状態遷移を定義し得る。平均時間を使用して、例えば、自動運転(例えば、制御)対手動運転の状態に基づいて、通行時間の報酬/コストを定義し得る。
【0126】
追加的に、人間が車線セグメントを運転するときはいつでも、後続の車線セグメントが記録され得る。後続の車線セグメントを使用して、選好に関する報酬/コストを[0、1]の範囲で定義してもよく、これは、人間が道路又は車線セグメントを運転した時間の比率であり得る。
【0127】
さらに、人間が自動制御をオーバライドするか、又は自動制御の下で車両が立ち往生する(すなわち、1分又はその他の時間の閾値等の第1の閾値を超えて前進しない)ときはいつでも、第1の値として-1が記録されてもよく、そうでなければ(例えば、自動制御がオーバライドされず、車両が立ち往生しない場合)、第2の値として0が記録され得る。記録された第1の値及び第2の値の平均は、能力の尺度として使用され得る。その逆は、人間の運転者の能力を学習するために使用され得る。例えば、手動制御の下では、車両が第2の時間の閾値(例えば、1分又はその他の時間閾値)を超えて移動しない場合、第3の値として-1が記録され得る。例えば、運転者車線レベルルートプランナによって識別された禁止された次のアクションに従わない場合、第4の値として-1が記録され得る。例えば、運転者がシームレスに隣接する車線セグメントに進む場合、第5の値として0が記録され得る。第3、第4、及び第5の値の平均は、車両が現在の車線セグメントにあるときに次のアクションを実行する人間の能力の尺度として記録され得る。
【0128】
すでに述べたように、意味ラベルを使用して、車線レベルルートプランナによって計算されるルートの目的を定義し得る。意味ラベルの例は、「快適性」(及び/又は関連する意味概念)、「市街地」(及び/又は「高速道路」等の関連する意味概念)、「高速」(及び/また関連する意味概念)、「手動運転」(及び/又は「自動運転」等の関連する意味概念)等、図5に関して説明されたものを含む。より少ない、より多い、他の意味ラベル、又はそれらの組み合わせも可能である。説明するために、ユーザが快適な道路の選好を示す場合、車線レベルルートプランナは、「快適」とラベル付けされた車線セグメントを考慮してポリシーを計算する。
【0129】
ここで、目的から意味ラベルへのマッピングは、1対1のマッピングである必要はないことに留意されたい。そのため、意味ラベルはいくつかの目的を組み合わせてもよく、又は1つの目的を使用して1つ以上の意味ラベルが定義されてもよい。
【0130】
開示された実装の一態様において、多目的深層強化学習(MODRL)が使用され得る。強化学習又は深層強化学習において、深層ニューラルネットワーク(DNN)を使用してポリシーを学習することができる。DNNは、代替的に又は追加的に、価値関数を学習するために使用され得る。そのため、強化学習技術がプランニング技術の代わりに使用され得る。強化学習では、目的はフィードバックからDNNを介して学習され得る。フィードバックは、車線セグメントを通行する時間、能力に対する人間のオーバライド、又はその他のフィードバックの1つ以上を含み得る。強化学習では、確率を学習する代わりに、確率及びコストを組み合わせて、目標(すなわち、目的地)に到達するための期待値にする。
【0131】
ある態様では、本明細書に記載のように、TMDPはナビゲーションマップを使用してポリシーを取得し得る。別の態様では、TPOMDPを使用してポリシーを取得し得る。TPOMDPを使用すると、例えば、限定されないが、道路、車線、又は車線セグメント上の交通のレベル;新しい道路、車線、又は車線セグメントの能力の量;又は、本明細書に記載のその他の車線レベル情報に対する信念が有効になる。
【0132】
図6は、本開示の実装によるナビゲーションマップの学習及び使用の概要600を示す。車線レベルルートプランナは、車線レベル情報を取得する学習モジュールを含んでもよい。車線レベルルートプランナは車両で実行されてもよく、車線レベル情報は車両のナビゲーションマップに組み込まれ得る。車線レベル情報はサーバに送信されてもよく、サーバは複数の車両から車線レベル情報を受信してもよい。サーバは受信した車線レベル情報をナビゲーションマップに組み込み得る。その後、ナビゲーションマップは車線レベルルートプランナを使用してポリシー(例えば、ルート)を取得し得る。
【0133】
概要600は、起点608から目的地610まで(図示しない同一又は複数の車両によって)3つの異なるルート602,604及び606が取られたことを示す。走行中、車線セグメント612等の車線セグメントについて車線レベル情報が収集される。履歴614は学習された車線遷移を示し、履歴614における車線セグメントの陰影は車線セグメントの学習された特性を示す。履歴614は、本明細書に記載されるように学習された他の車線セグメント情報を含む。
【0134】
ルートの少なくともいくつか(例えば、全て)に沿った車線セグメントの少なくともいくつか(例えば、全て)の履歴は、本明細書に記載されるように、ナビゲーションマップに結合(例えば、カウント)され得る。本明細書に記載されるように、複数の目的及び他の意味ラベルが、ボックス618によって示されるように、各車線セグメント履歴に記録され得る。
【0135】
学習に基づいて、遷移グラフ620によって示される状態遷移グラフ構造(すなわち、上述の状態遷移関数T)が生成され得る。状態遷移グラフは、本明細書に記載されるように、SSP MDP又はPOMDPモデルによって使用され得る。次に、車線レベル多目的車線レベルルートプランナのナビゲーションマップが出力される(例えば、生成される)。ナビゲーションマップの車線レベル情報は、車線セグメントの車両の全通行の平均を含む。例えば、車線レベル情報は、速度、停止、認識された交通の密度、バッテリ使用、車線変更成功率等の1つ以上の平均を含む。
【0136】
学習に基づいて、SSP MDP又はPOMDPモデルで使用されるコスト(報酬)関数も生成され得る。異なる目的の平均が、上記のように時間、制御の移行点、バッテリ使用、速度等を観察して報酬として記録され得る。報酬関数から、目的間においてスラックが可能かどうかを知ることができる。例えば、ルートの期待値が最適値より10分長い場合、少なくとも10のスラックが可能である。このような報酬関数及びスラックは、図5に関して説明され、選好順位付け622で示されるように、選好順位付けを設定するために使用され得る。
【0137】
図7は、本開示の実施形態によるルートプランニングのためのナビゲーションマップを学習する技術の一例を示すフローチャート図である。ナビゲーションマップは、車線レベルルートプランナによって使用される。技術300は、図1に示された車両100等のホスト車両、図2に示された車両210/211のうちの1つ、半自律走行車、運転支援機能を含み得る他の車両、又は運転者等によって手動で制御される車両であり得る装置において部分的又は完全に実装され得る。装置は、図2の通信デバイス240であり得るサーバであり得る。
【0138】
技術700は、メモリに記憶される指示(例えば、命令)として実装され得る。メモリは、図1のメモリ134であり得る。メモリは、サーバのメモリであり得る。命令は、図1のプロセッサ133等のプロセッサによって実行され得る。技術700は、専用のハードウェア又はファームウェアを使用して実装され得る。複数のプロセッサ、メモリ、又はその両方が使用されてもよい。
【0139】
ステップ702において、技術700は、道路の車線レベル情報を取得する。車線レベル情報は、道路の異なる車線の異なるセグメントの情報を含む。例えば、道路は第1の車線及び第2の車線を含み得る。車線レベル情報は、第1の車線に関連する第1の車線情報、及び第2の車線に関連する第2の車線情報を含む。
【0140】
車線レベル情報は、ホスト車両で取得されてもよく、車線レベル情報を使用して、ホスト車両の(例えば、ホスト車両の中で使用される、ホスト車両が使用する、ホスト車両で利用可能な)ナビゲーションマップを進化させることができる。車線レベル情報は、複数の車両から車線レベル情報を取得するサーバで取得(例えば、受信)され得る。サーバは、それぞれの車線レベルルートプランナによって使用される進化したナビゲーションマップを車両に送信し得る。サーバは、進化したナビゲーションマップを使用してルート(例えば、ポリシー)を計算し得る。
【0141】
上述したように、車線レベル情報は、環境情報、車両情報、又は人的情報の少なくとも1つを含んでもよい。環境情報は、車線セグメントの交通パターン、歩行者パターン、又は通行困難情報の少なくとも1つを含んでもよい。車両情報は、ユーザの選好ルート及びユーザによる制御の移行要求を含んでもよい。
【0142】
一例では、道路の車線レベル情報を取得することは、道路上での停止を伴う道路の自動通行の第1の時間を記録すること、道路上での停止を伴わない道路の自動通行の第2の時間を記録すること、道路上での停止を伴う道路の手動通行の第3の時間を記録すること、及び道路上での停止を伴わない道路の手動通行の第4の時間を記録することを含んでもよい。一例では、道路の車線レベル情報を取得することは、手動通行中に後続車線セグメントを記録することを含んでもよい。一例では、道路の車線レベル情報を取得することは、自動走行制御の人間によるオーバライドを記録すること含んでもよい。道路の自動通行とは、車両が道路を通行するように自動的に制御されることを意味する。道路の手動通行とは、車両が道路を通行するように(人等によって)手動で制御されることを意味する。
【0143】
ステップ704において、技術700は、車線レベル情報を、目的地へのルートを取得するために使用され得る状態遷移関数に変換する。上述したように、状態遷移関数は、TMDP又はTPOMDPモデルのものであってもよい。目的地へのルートは、上述したように、ポリシーであってもよく、又はそれにカプセル化されてもよい。一例では、ポリシー、つまりルートは確率的である。
【0144】
ステップ706において、技術700は目的地を受信する。例えば、サーバ(より具体的には、サーバで実行される車線レベルルートプランナ)は、現在位置及び目的地を(例えば、ユーザ装置、車両のマッピングアプリケーション等から)受信して、ルートを取得し得る。例えば、装置で実行される車線レベルルートプランナは、ユーザ(運転者又は乗員等)から目的地を受信してもよく、車線レベルルートプランナはルートを取得し得る。例えば、車線レベルルートプランナは、装置の現在位置等に基づいて、ルートの起点位置を推測し得る。
【0145】
ステップ708において、技術700は、状態遷移関数を使用するモデルの解としてポリシーを取得する。
【0146】
本明細書で使用される場合、「命令」という用語は、本明細書に開示の任意の方法を実行するための指示若しくは表現、又はその任意の部分若しくは複数の部分を含んでもよく、ハードウェア、ソフトウェア又はこれらの任意の組み合わせで実現されてもよい。例えば、命令は、本明細書に記載の各方法、アルゴリズム、態様又はこれらの組み合わせのいずれかを行うためにプロセッサによって実行され得るメモリに記憶されたコンピュータプログラム等の情報として実装されてもよい。命令又はその一部は、本明細書に記載の任意の方法、アルゴリズム、態様又はその組み合わせを行うための専用ハードウェアを含み得る専用プロセッサ又は回路として実装されてもよい。いくつかの実装では、命令の部分は、直接的に又はローカルエリアネットワーク、ワイドエリアネットワーク、インターネット又はこれらの組み合わせ等のネットワークを介して通信し得る複数の装置又は単一の装置上の複数のプロセッサに分散されてもよい。
【0147】
本明細書で使用される場合、「例示」、「実施形態」、「実装」、「態様」、「特徴」又は「要素」という用語は、用例、例示又は実例としての役割を果たすことを示している。明示されない限り、任意の例示、実施形態、実装、態様、特徴又は要素が、互いの例示、実施形態、実装、態様、特徴又は要素から独立しており、任意の他の例示、実施形態、実装、態様、特徴又は要素と組み合わせて使用されてもよい。
【0148】
本明細書で使用される場合、「決定」及び「識別」又はこれらの任意の変形の用語は、図示の及び本明細書に記載の1つ以上の装置を使用するいかなるやり方で選択、確認、計算、検索、受信、決定、確立、取得、又は他のやり方で識別又は決定することを含んでいる。
【0149】
本明細書で使用される場合、「又は」という用語は、特に明記されていない限り、又は文脈から明らかな場合を除き、排他的な「又は」ではなく包含的な「又は」を意味することが意図されている。さらに、本願及び添付の請求項の中で使用される“a”及び“an”という冠詞は、一般に、単数形を指していることが文脈から明確であるか又は他に特段の定めがない限り、「1つ以上の」を意味すると解釈されるべきである。
【0150】
さらに、説明の簡潔のため、本明細書の図面及び説明は一連のステップ又は段階又はシーケンスを含み得るが、本明細書に開示の方法の要素は、様々な順番で又は同時に起こってもよい。さらに、本明細書に開示の方法の要素は、本明細書に明示的に提示及び開示されていない他の要素と共に起こってもよい。さらに、本明細書に記載の方法の全ての要素が、本開示による方法を実装することを要求されるとは限らない。態様、特徴及び要素は特定の組み合わせで本明細書に記載されているが、各態様、特徴又は要素は、他の態様、特徴及び要素と共に又はそれらなしで独立して又は様々な組み合わせで使用されてもよい。
【0151】
上記の態様、例示及び実装は、本開示の理解を容易にするために記載されており、限定するものではない。対照的に、本開示は、添付の特許請求の範囲内に含まれる様々な修正及び等価な構成を包含しており、特許請求の範囲は、法的に認められている全てのこのような修正及び均等構造を包含するように最も広く解釈されるべきである。
図1
図2
図3
図4
図5
図6
図7
【国際調査報告】