IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ウーブン・プラネット・ホールディングス株式会社の特許一覧

特開2024-106299自動運転車両に関するニューラルネットワークについてのフェデレーテッドラーニングの訓練のための方法及びシステム
<>
  • 特開-自動運転車両に関するニューラルネットワークについてのフェデレーテッドラーニングの訓練のための方法及びシステム 図1
  • 特開-自動運転車両に関するニューラルネットワークについてのフェデレーテッドラーニングの訓練のための方法及びシステム 図2
  • 特開-自動運転車両に関するニューラルネットワークについてのフェデレーテッドラーニングの訓練のための方法及びシステム 図3
  • 特開-自動運転車両に関するニューラルネットワークについてのフェデレーテッドラーニングの訓練のための方法及びシステム 図4
  • 特開-自動運転車両に関するニューラルネットワークについてのフェデレーテッドラーニングの訓練のための方法及びシステム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024106299
(43)【公開日】2024-08-07
(54)【発明の名称】自動運転車両に関するニューラルネットワークについてのフェデレーテッドラーニングの訓練のための方法及びシステム
(51)【国際特許分類】
   G06N 3/098 20230101AFI20240731BHJP
   G06N 3/09 20230101ALI20240731BHJP
   G08G 1/16 20060101ALI20240731BHJP
   G08G 1/00 20060101ALI20240731BHJP
【FI】
G06N3/098
G06N3/09
G08G1/16 A
G08G1/00 D
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023116729
(22)【出願日】2023-07-18
(31)【優先権主張番号】18/159,767
(32)【優先日】2023-01-26
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】521042770
【氏名又は名称】ウーブン・バイ・トヨタ株式会社
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【弁理士】
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100147555
【弁理士】
【氏名又は名称】伊藤 公一
(74)【代理人】
【識別番号】100123593
【弁理士】
【氏名又は名称】関根 宣夫
(74)【代理人】
【識別番号】100133835
【弁理士】
【氏名又は名称】河野 努
(74)【代理人】
【識別番号】100180194
【弁理士】
【氏名又は名称】利根 勇基
(72)【発明者】
【氏名】川名 雄樹
(72)【発明者】
【氏名】谷内出 悠介
(72)【発明者】
【氏名】田川 貴章
(72)【発明者】
【氏名】山口 晃一郎
(72)【発明者】
【氏名】橋本 大輔
(72)【発明者】
【氏名】青野 博之
(72)【発明者】
【氏名】高橋 亮
【テーマコード(参考)】
5H181
【Fターム(参考)】
5H181AA01
5H181BB05
5H181BB13
5H181BB20
5H181CC03
5H181CC04
5H181CC14
5H181FF04
5H181FF10
5H181FF13
5H181FF25
5H181FF27
5H181FF33
5H181LL01
5H181LL07
5H181LL08
5H181LL09
5H181MC19
5H181MC27
(57)【要約】      (修正有)
【課題】安全及びユーザプライバシーを維持しつつ、フェデレーテッドラーニングの訓練をニューラルネットワークに提供するシステム及び方法を提供する。
【解決手段】方法は、第1のモデルを受信し、第1の車両上のセンサによって取得されたセンサデータを収集し、第1のデータ項目が基準を満たすと判定したときに、収集したセンサデータの中から1のデータ項目を特定し、特定した第1のデータ項目を第1のモデルへの入力として用いて第1のモデルを動作させることによって、特定した第1のデータ項目に含まれる物体を検出し、第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立して、第2の車両上のコンピュータから物体を含むものとして示された第2のデータ項目を受信し、訓練データセットを生成して、訓練データセット上で第1のモデルに対する訓練を行い、訓練された第1のモデルを表す第1のデータを送信する。
【選択図】図5
【特許請求の範囲】
【請求項1】
プログラムされた一つ又は複数のプロセッサによって実行される方法であって、
一つ又は複数のサーバコンピュータから通信ネットワークを介して第1のモデルを受信することと、
第1の車両上のセンサによって取得されたセンサデータを収集することと、
第1のデータ項目が基準を満たすと判定されたときに、前記収集されたセンサデータの中から該第1のデータ項目を特定することと、
前記特定された第1のデータ項目を前記第1のモデルへの入力として用いて前記第1のモデルを動作させることによって、該特定された第1のデータ項目に含まれる物体を検出することと、
前記第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立することと、
前記第2の車両上の前記コンピュータから前記物体を含むものとして示された第2のデータ項目を受信することと、
前記第1のデータ項目と、前記第2のデータ項目と、前記物体のラベルとを含む訓練データセットを教師信号として生成することと、
前記訓練データセット上で前記第1のモデルに対する訓練を行うことと、
前記訓練された第1のモデルを表す第1のデータを前記通信ネットワークを介して前記一つ又は複数のサーバコンピュータに送信することと
を含む、方法。
【請求項2】
他のエッジモデルから集約されたモデル情報を用いて訓練されたモデルを表す更新データを前記一つ又は複数のサーバコンピュータから通信ネットワークを介して受信することと、
前記更新データに基づいて前記第1のモデルを更新することと
を更に含む、請求項1に記載の方法。
【請求項3】
前記第1のモデルに対する訓練を行うことが、前記受信された第1のモデルのコピーを訓練することを含む、請求項1又は2に記載の方法。
【請求項4】
前記訓練前の前記第1のモデルと前記訓練後の前記第1のモデルとの間の勾配を前記第1のデータとして得ることを更に含む、請求項1又は2に記載の方法。
【請求項5】
前記受信された第1のモデルと、前記訓練によって更新された前記第1のモデルのコピーとの間の勾配を前記第1のデータとして得ることを更に含む、請求項3に記載の方法。
【請求項6】
前記第2のデータ項目を受信することは、前記第2のデータ項目と、該第2のデータ項目内の前記物体の検出に対する前記第2の車両における第2のモデルの推定結果とを受信することを含む、請求項1又は2に記載の方法。
【請求項7】
前記訓練データセットを生成することは、前記第1のモデルの推定結果と、前記第2のデータ項目内の前記物体を検出する、前記第2の車両における第2のモデルの推定結果とを組み合わせることによって前記物体のラベルを得ることを含む、請求項1又は2に記載の方法。
【請求項8】
命令を記憶するメモリと、
プロセッサと
を備える、コンピュータデバイスであって、
前記プロセッサは、
一つ又は複数のサーバコンピュータから通信ネットワークを介して第1のモデルを受信し、
第1の車両上のセンサによって取得されたセンサデータを収集し、
第1のデータ項目が基準を満たすと判定されたときに、前記収集されたセンサデータの中から該第1のデータ項目を特定し、
前記特定された第1のデータ項目を前記第1のモデルへの入力として用いて前記第1のモデルを動作させることによって、該特定された第1のデータ項目に含まれる物体を検出し、
前記第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立し、
前記第2の車両上の前記コンピュータから前記物体を含むものとして示された第2のデータ項目を受信し、
前記第1のデータ項目と、前記第2のデータ項目と、前記物体のラベルとを含む訓練データセットを教師信号として生成し、
前記訓練データセット上で前記第1のモデルに対する訓練を行い、
前記訓練された第1のモデルを表す第1のデータを前記通信ネットワークを介して前記一つ又は複数のサーバコンピュータに送信するための前記命令を実行するように構成される、コンピュータデバイス。
【請求項9】
前記プロセッサは、さらに、
他のエッジモデルから集約されたモデル情報を用いて訓練されたモデルを表す更新データを前記一つ又は複数のサーバコンピュータから通信ネットワークを介して受信し、
前記更新データに基づいて前記第1のモデルを更新するための前記命令を実行するように構成される、請求項8に記載のコンピュータデバイス。
【請求項10】
前記第1のモデルに対する訓練を行うための前記命令は、前記受信された第1のモデルのコピーを訓練するための命令を含む、請求項8又は9に記載のコンピュータデバイス。
【請求項11】
前記プロセッサは、さらに、前記訓練前の前記第1のモデルと前記訓練後の前記第1のモデルとの間の勾配を前記第1のデータとして得るための前記命令を実行するように構成される、請求項8又は9に記載のコンピュータデバイス。
【請求項12】
前記プロセッサは、さらに、前記受信された第1のモデルと、前記訓練によって更新された前記第1のモデルのコピーとの間の勾配を前記第1のデータとして得るための前記命令を実行するように構成される、請求項10に記載のコンピュータデバイス。
【請求項13】
前記第2のデータ項目を受信するための前記命令は、、前記第2のデータ項目と、該第2のデータ項目内の前記物体の検出に対する前記第2の車両における第2のモデルの推定結果とを受信するための命令を含む、請求項8又は9に記載のコンピュータデバイス。
【請求項14】
前記訓練データセットを生成するための前記命令は、前記第1のモデルの推定結果と、前記第2のデータ項目内の前記物体を検出する、前記第2の車両における第2のモデルの推定結果とを組み合わせることによって前記物体のラベルを得るための命令を含む、請求項8又は9に記載のコンピュータデバイス。
【請求項15】
命令を記憶する非一時的なコンピュータ可読媒体であって、
前記命令は、
一つ又は複数のサーバコンピュータから通信ネットワークを介して第1のモデルを受信することと、
第1の車両上のセンサによって取得されたセンサデータを収集することと、
第1のデータ項目が基準を満たすと判定されたときに、前記収集されたセンサデータの中から該第1のデータ項目を特定することと、
前記特定された第1のデータ項目を前記第1のモデルへの入力として用いて前記第1のモデルを動作させることによって、該特定された第1のデータ項目に含まれる物体を検出することと、
前記第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立することと、
前記第2の車両上の前記コンピュータから前記物体を含むものとして示された第2のデータ項目を受信することと、
前記第1のデータ項目と、前記第2のデータ項目と、前記物体のラベルとを含む訓練データセットを教師信号として生成することと、
前記訓練データセット上で前記第1のモデルに対する訓練を行うことと、
前記訓練された第1のモデルを表す第1のデータを前記通信ネットワークを介して前記一つ又は複数のサーバコンピュータに送信することと
を、装置の一つ又は複数のプロセッサによって実行されるときに該一つ又は複数のプロセッサに実行させる一つ又は複数の命令を含む、非一時的なコンピュータ可読媒体。
【請求項16】
前記命令は、さらに、
他のエッジモデルから集約されたモデル情報を用いて訓練されたモデルを表す更新データを前記一つ又は複数のサーバコンピュータから通信ネットワークを介して受信することと、
前記更新データに基づいて前記第1のモデルを更新することと
を、装置の一つ又は複数のプロセッサによって実行されるときに該一つ又は複数のプロセッサに実行させる一つ又は複数の命令を含む、請求項15に記載の非一時的なコンピュータ可読媒体。
【請求項17】
前記第1のモデルに対する訓練を行うことを前記一つ又は複数のプロセッサに実行させることは、前記受信された第1のモデルのコピーを訓練することを前記一つ又は複数のプロセッサに実行させることを含む、請求項15又は16に記載の非一時的なコンピュータ可読媒体。
【請求項18】
前記命令は、さらに、前記訓練前の前記第1のモデルと前記訓練後の前記第1のモデルとの間の勾配を前記第1のデータとして得ることを、装置の一つ又は複数のプロセッサによって実行されるときに該一つ又は複数のプロセッサに実行させる一つ又は複数の命令を含む、請求項15又は16に記載の非一時的なコンピュータ可読媒体。
【請求項19】
前記第2のデータ項目を受信することを前記一つ又は複数のプロセッサに実行させることは、前記第2のデータ項目と、該第2のデータ項目内の前記物体の検出に対する前記第2の車両における第2のモデルの推定結果とを受信することを前記一つ又は複数のプロセッサに実行させることを含む、請求項18に記載の非一時的なコンピュータ可読媒体。
【請求項20】
前記訓練データセットを生成することを前記一つ又は複数のプロセッサに実行させることは、前記第1のモデルの推定結果と、前記第2のデータ項目内の前記物体を検出する、前記第2の車両における第2のモデルの推定結果とを組み合わせることによって前記物体のラベルを得ることを前記一つ又は複数のプロセッサに実行させることを含む、請求項15又は16に記載の非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、概して、自動運転車両のアプリケーションにおけるニューラルネットワークの訓練を提供するためのシステム及び方法に関する。具体的には、本開示は、安全及びユーザプライバシーを維持しつつ、フェデレーテッドラーニングの訓練をニューラルネットワークに提供することに関する。
【背景技術】
【0002】
ニューラルネットワークは、多数の分散エッジデバイス(例えば病院又は携帯電話に実装されたプロセッサ又はコンピュータデバイス)に展開されたアプリケーションに統合される場合がある。斯かるニューラルネットワークを訓練する一つの方法が、ユーザのプライバシーを確保しつつ大量のデータを使用して機械学習(ML)モデルを訓練するフェデレーテッドラーニング(FL)である。
【0003】
この目的のために、FL技術はローカル訓練フェーズ及びグローバル集約フェーズから成る。ローカル訓練フェーズでは、各エッジデバイスは、アプリケーションによって検知され且つ使用されるデータを用いて各エッジデバイスのニューラルネットワークのコピーを訓練する。エッジデバイス上で訓練を行うことによって、ローカルデータが外部に(例えばリモートコーディネータ又はサーバに)曝され又は送信されることがなく、このことによってエッジデバイスユーザのデータのプライバシーが確保される。代わりに、エッジデバイス上で訓練されたニューラルネットワークに対するローカルな更新のみがコーディネータに送信され、コーディネータは更新を集約して新たなグローバルモデルを生成する。その後、グローバルモデルをアプリケーションにおける使用のために他のエッジデバイスに提供することができる。
【0004】
自動運転車両におけるコンピュータビジョン(CL)又は他の機械学習(ML)アプリケーション(例えば自動運転制御)のようなセーフティクリティカルなアプリケーションに統合された機械学習(ML)モデルが推定の精度及び実世界環境での使用の安全性を確保するために大量のデータで訓練されることが極めて重要である。FLがこれらモデルに適用されうるが、車両コンテキストにおける訓練のための信頼できる教師信号(例えば人間のアノテーション)が存在しない。その結果、車両におけるローカルデータ上で訓練されたときに、推定の精度が減少する場合がある。
【発明の概要】
【0005】
一つ又は複数の例示的な実施形態によって、運転情報を非ドライバユーザに提供するためのシステム及び方法が提供される。
【0006】
本開示の態様によれば、プログラムされた一つ又は複数のプロセッサによって実行される方法は、一つ又は複数のサーバコンピュータから通信ネットワークを介して第1のモデルを受信することと、第1の車両上のセンサによって取得されたセンサデータを収集することと、第1のデータ項目が基準を満たすと判定されたときに、収集されたセンサデータの中から第1のデータ項目を特定することと、特定された第1のデータ項目を第1のモデルへの入力として用いて第1のモデルを動作させることによって、特定された第1のデータ項目に含まれる物体を検出することと、第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立することと、第2の車両上のコンピュータから物体を含むものとして示された第2のデータ項目を受信することと、第1のデータ項目と、第2のデータ項目と、物体のラベルとを含む訓練データセットを教師信号として生成することと、訓練データセット上で第1のモデルに対する訓練を行うことと、訓練された第1のモデルを表す第1のデータを通信ネットワークを介して一つ又は複数のサーバコンピュータに送信することとを含む。
【0007】
本開示の態様によれば、コンピュータデバイスは、命令を記憶するメモリと、プロセッサとを含み、プロセッサは、一つ又は複数のサーバコンピュータから通信ネットワークを介して第1のモデルを受信し、第1の車両上のセンサによって取得されたセンサデータを収集し、第1のデータ項目が基準を満たすと判定されたときに、収集されたセンサデータの中から第1のデータ項目を特定し、特定された第1のデータ項目を第1のモデルへの入力として用いて第1のモデルを動作させることによって、特定された第1のデータ項目に含まれる物体を検出し、第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立し、第2の車両上のコンピュータから物体を含むものとして示された第2のデータ項目を受信し、第1のデータ項目と、第2のデータ項目と、物体のラベルとを含む訓練データセットを教師信号として生成し、訓練データセット上で第1のモデルに対する訓練を行い、訓練された第1のモデルを表す第1のデータを通信ネットワークを介して一つ又は複数のサーバコンピュータに送信するための命令を実行するように構成される。
【0008】
本開示の態様によれば、非一時的なコンピュータ可読媒体は命令を記憶し、命令は、一つ又は複数のサーバコンピュータから通信ネットワークを介して第1のモデルを受信することと、第1の車両上のセンサによって取得されたセンサデータを収集することと、第1のデータ項目が基準を満たすと判定されたときに、収集されたセンサデータの中から第1のデータ項目を特定することと、特定された第1のデータ項目を第1のモデルへの入力として用いて第1のモデルを動作させることによって、特定された第1のデータ項目に含まれる物体を検出することと、第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立することと、第2の車両上のコンピュータから物体を含むものとして示された第2のデータ項目を受信することと、第1のデータ項目と、第2のデータ項目と、物体のラベルとを含む訓練データセットを教師信号として生成することと、訓練データセット上で第1のモデルに対する訓練を行うことと、訓練された第1のモデルを表す第1のデータを通信ネットワークを介して一つ又は複数のサーバコンピュータに送信することとを、装置の一つ又は複数のプロセッサによって実行されるときに一つ又は複数のプロセッサに実行させる一つ又は複数の命令を含む。
【0009】
追加の態様が、以下の記載において部分的に説明され、以下の記載から明らかになり、又は本開示の提示された実施形態の実践から学ぶことができる。
【図面の簡単な説明】
【0010】
図1図1は、実施形態に係るシステムの図である。
図2図2は、実施形態に係る図1の自動運転車両のコンポーネントの図である。
図3図3は、実施形態に従って、複数の自動運転車両のためのニューラルネットワークを訓練することに関連するデータ処理の図である。
図4図4は、実施形態に従って、単一の自動運転車両のためのニューラルネットワークを訓練することに関連するデータ処理の図である。
図5図5は、実施形態に従って、自動運転車両のためのニューラルネットワークを訓練する方法についてのフローチャートである。
【発明を実施するための形態】
【0011】
上記及び他の態様、特徴並びに本開示の実施形態の態様は、添付図面と併せて解釈される以下の説明からより明らかになるだろう。
【0012】
例示的な実施形態の以下の詳細な説明は添付図面を参照する。種々の図面における同一の参照番号は同一又は同様の要素を特定する。
【0013】
図1は、実施形態に係るシステム100の図である。システム100は複数の車両110a-n及び一つ又は複数のサーバコンピュータ120a-nを含む。一つ又は複数のサーバコンピュータ120a-nは、例えば通信ネットワーク130を介して、互いと接続し、車両110a-nの各々と接続する。
【0014】
開示された実施形態は、一つ又は複数のサーバコンピュータ120から受信することを含む。本開示において使用されるようなサーバコンピュータ120は、汎用コンピュータ、パーソナルコンピュータ、ワークステーション、メインフレームコンピュータ、ノートブック、全地球測位装置、ラップトップコンピュータ、スマートフォン、携帯情報端末、ネットワークサーバ、及びユーザとやり取りしてプログラミングコードを開発する可能性のあるその他の電子デバイスを含む。
【0015】
いくつかの実施形態では、サーバコンピュータ120は、、プロセッサ、ディスプレイ装置、メモリ装置、及び電子通信を促進するこれらコンポーネントを含む他のコンポーネントを含む。他のコンポーネントは入出力装置のようなユーザインタフェース装置を含む。サーバコンピュータ120は、中央処理装置(CPU)又はプロセッサ、バス、メモリ装置、ストレージユニット、データプロセッサ、入力装置、出力装置、ネットワークインタフェース装置、及び当業者に明らかな他のタイプのコンポーネントの組合せのようなコンピュータハードウェアコンポーネントを含む。サーバコンピュータ120は、さらに、ソフトウェアモジュール、一連の命令、ルーチン、データ構造、表示インタフェース、及び本開示の操作を実行する他のタイプの構造を含むアプリケーションプログラムを含むことができる。
【0016】
開示された実施形態は、通信ネットワーク130を介して受信することを含む。本開示において使用されるような通信ネットワークは、ネットワークノード上にあり又はネットワークノードによって提供されるリソースを共有する一組のコンピュータ(例えば一つ又は複数のサーバコンピュータ120)を含む。この一組のコンピュータはデジタル相互接続を介した共通の通信プロトコルを使用して互いに通信する。これら相互接続は、様々なネットワークトポロジに配置される物理的な有線の、光学的な、ワイヤレスの無線周波数方式に基づく電気通信技術から構成される。例えば、これら相互接続は、データベース、サーバ、RF(無線周波数)信号、セルラー技術、イーサネット、電話、「TCP/IP」(トランスミッションコントロールプロトコル/インターネットプロトコル)、及びその他の電子通信フォーマットを通して行われる。例えば、ネットワーク130は、セルラーネットワーク(例えば、第五世代(5G)ネットワーク、ロングタームエボリューション(LTE)ネットワーク、第三世代(3G)ネットワーク、符号分割多元接続(CDMA)ネットワーク等)、公衆陸上移動体通信網(PLMN)、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、電話網(例えば、公衆交換電話網(PSTN)、プライベートネットワーク、アドホックネットワーク、イントラネット、インターネット、光ファイバベースのネットワーク、若しくはこれらの均等物、及び/又はこれらの組合せ若しくは他のタイプのネットワークを含む。
【0017】
図1に示されるサーバ120及びネットワーク130の数及び配置は例として提供されている。実際には、追加のサーバ120及び/又はネットワーク130、より少ないサーバ120及び/又はネットワーク130、種々のサーバ120及び/又はネットワーク130、又は図1に示されるものとは異なる配置のサーバ120及び/又はネットワーク130が存在する。さらに、図1に示される二つ以上のサーバ120が単一のサーバ120内に実装されてもよく、又は図1に示される単一のサーバ120が複数の分散サーバ130として実装されてもよい。加えて又は代替的に、一組のサーバ120(例えば一つ又は複数のサーバ120)が、別の組のサーバ120によって実行されるものとして記載された一つ又は複数の機能を実行してもよい。
【0018】
いくつかの実施形態では、通信ネットワーク130はニューラルネットワークとして構築される。ニューラルネットワークは、生物学的脳におけるニューロンを大まかにモデル化した、人工ニューロンと呼ばれる接続されたユニット又はノードの集合体に基づくものである。生物学的脳におけるシナプスのような各接続は信号を他のニューロンに送信することができる。人工ニューロンは、信号を受信して処理し、その後、それに接続された他のニューロンに信号を送る。接続におけるこれら信号は実際の数であり、各ニューロンの出力はその入力の合計の非線形関数によって計算される。これら接続は(自動運転車両110のような)エッジであってもよい。ニューロン及びエッジは、学習が進行するにつれて調整される重みを有する。重みは接続における信号の強さを増大又は減少させる。ニューロンは、集約信号がその閾値を超える場合にのみ信号が送信されるような閾値を有する。ニューロンは層に集約される。異なる層がこれらの入力に対して異なる変換を実行する。信号は、最初の層(例えば入力層)から潜在的な中間層を介して最後の層(例えば出力層)まで移動し、複数回移動してもよい。
【0019】
以下に更に詳細に説明されるように、フェデレーテッドラーニング(FL)は、近傍の装置(例えば自動運転車両110)から得られたデータを使用して、信頼性の高い教師信号(supervision signal)をローカルで導出することによって、セーフティクリティカルな自動車のアプリケーションのニューラルネットワークを訓練するのに使用される。FLを適用することによって、ニューラルネットワークを訓練するのに大量のデータを使用することができ、このことによって推定の精度が高められる。さらに、FLを適用することによってユーザ(すなわち車両110のオペレータ)についてのデータプライバシーを確保することができる。加えて、別のエッジデバイス(例えば別の自動運転車両110)からの検出結果を利用して信頼性の高い教師信号を得ることによって、ニューラルネットワークによる推定又は予測の精度を高めることができる。
【0020】
車両110のより詳細な図が図2に見られる。車両110の各々は、一つ又は複数のセンサ112と、一つ又は複数の送受信機114と、車両コンピュータ116とを含む。
【0021】
本開示において使用されるような一つ又は複数の送受信機114は、例えば、有線接続、無線接続、又は有線接続と無線接続との組合せを介して、車両110が他の車両110及び/又は一つ又は複数のサーバコンピュータ120と通信するのを可能とする一つ又は複数のコンポーネント(例えば送受信機及び/又は別個の受信機及び送信機)を含む。一つ又は複数の送受信機114は、車両110が別の車両110/サーバコンピュータ120から情報を受信し且つ/又は別の車両110/サーバコンピュータ120に情報を提供することを可能とする。例えば、一つ又は複数の送受信機114は、イーサネットインタフェース、光インタフェース、同軸インタフェース、赤外線インタフェース、無線周波数(RF)インタフェース、ユニバーサルシリアルバス(USB)インタフェース、Wi-Fiインタフェース、セルラーネットワークインタフェース、又は電気/電磁情報を送信又は受信することができるその他のインタフェースを含む。
【0022】
図2に見られるように、本開示において使用されるような車両コンピュータ116は、バス(図示せず)、メモリ117、プロセッサ118、入力コンポーネント(図示せず)及び出力コンポーネント(図示せず)を含む。
【0023】
バスは、車両コンピュータ116のコンポーネント間の通信を可能とするコンポーネントを含む。
【0024】
プロセッサ118は、ハードウェア、ファームウェア又はハードウェアとソフトウェアとの組合せにおいて実装される。プロセッサ118は、中央処理装置(CPU)、グラフィック処理装置(GPU)、アクセラレーテッドプロセッシングユニット(APU)、マイクロプロセッサ、マイクロコントローラ、デジタルシグナルプロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、又は別のタイプの処理コンポーネントである。プロセッサ118は、機能を実行するようにプログラムされることが可能な一つ又は複数のプロセッサを含む。
【0025】
メモリ117は、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、及び/又はプロセッサ118によって使用される情報及び/又は命令を記憶する別のタイプの動的又は静的ストレージ装置(例えばフラッシュメモリ、磁気メモリ及び/又は光メモリ)を含む。メモリ117は、車両コンピュータ116の操作及び使用に関する情報及び/又はソフトウェアも記憶する。例えば、メモリ117は、対応するドライブと共に、ハードディスク(例えば磁気ディスク、光ディスク、光磁気ディスク、及び/又はソリッドステートディスク)、コンパクトディスク(CD)、デジタルバーサタイルディスク(DVD)、フロッピーディスク、カートリッジ、磁気テープ、及び/又は別のタイプの非一時的なコンピュータ可読媒体を含む。
【0026】
入力コンポーネントは、例えばユーザ入力(例えば、タッチスクリーンディスプレイ、キーボード、キーパッド、マウス、ボタン、スイッチ及び/又はマイクロフォン)を介して車両コンピュータ116が情報を受信することを可能とするコンポーネントを含む。入力コンポーネントは、情報を検知するためのセンサ(例えば、全地球測位システム(GPS)コンポーネント、加速度計、ジャイロスコープ及び/又はアクチュエータ)を含む。
【0027】
出力コンポーネントは、車両コンピュータ116から出力情報を提供するコンポーネント(例えば、ディスプレイ、スピーカ、及び/又は一つ又は複数の発光ダイオード(LED))を含む。
【0028】
車両コンピュータ116は、本明細書に記載された一つ又は複数の処理を実行する。車両コンピュータ116は、メモリ117のような非一時的なコンピュータ可読媒体によって記憶されたソフトウェア命令をプロセッサ118が実行することに基づいて、操作を実行する。コンピュータ可読媒体は本明細書において非一時的なメモリ装置として定義される。メモリ装置は、単一の物理ストレージ装置内のメモリ空間、又は複数の物理ストレージ装置に亘って広がるメモリ空間を含む。
【0029】
ソフトウェア命令は一つ又は複数の送受信機114を介して別のコンピュータ可読媒体又は別の装置からメモリ117に読み込まれてもよい。実行されると、メモリ117に記憶されたソフトウェア命令は、本明細書に記載された一つ又は複数の処理をプロセッサ118に実行させる。
【0030】
加えて又は代替的に、本明細書に記載された一つ又は複数の処理を実行するために、ソフトウェア命令の代わりに又はソフトウェア命令と組み合わせてハードワイヤード回路が使用されてもよい。このため、本明細書に記載される実施形態がハードウェア回路及びソフトウェアの特定の組合せに限定されることはない。
【0031】
開示された実施形態は、第1のモデル210aを受信することを含む。本開示において使用されるような第1のモデル210は機械学習モデルを含む。機械学習モデルは、(車両110aのような)自動運転車両上で動作するアプリケーションに統合されるように構成される。自動運転車両110上で動作するアプリケーションは、コンピュータビジョン、自動運転制御、及び自動運転車両110の操作に関連する他の機械学習アプリケーションのようなセーフティクリティカルなアプリケーションである。自動運転制御は、加速、制動、操舵、変速、及び車両110の環境を通して車両110の動作に影響する可能性のあるその他のシステムの自律制御を含むことができる。
【0032】
いくつかの実施形態では、第1のモデル210aは、車両110が遭遇する物体140の検出に関連付けられる。物体は、別の車両、歩行者、野生動物、道路障害物、又は車両110と相互作用する可能性のあるその他の態様の環境である。例えば、図1において、物体140が道路上の自転車として描かれている。
【0033】
いくつかの実施形態では、第1のモデル210aは感覚的解釈と関連付けられる。例えば、感覚的解釈の一つのタイプは画像セグメンテーションを含む。画像セグメンテーションはデジタル画像を複数の画像セグメント(例えば画像領域又は画像物体(一組のピクセル))に分割する。画像セグメンテーションは画像の表示をより有意義なもの及び/又はより分析しやすいものに単純化し且つ/又は変更する。画像セグメンテーションは画像における物体及び境界(例えば線及び曲線)を突き止めるのに使用される。画像セグメンテーションは、同一のラベルを有するピクセルが或る特性を共有するように、画像内の様々なピクセルにラベルを割り当てることを含む。
【0034】
図1及び図2に見られるように、車両110aは、一つ又は複数の送受信機114を介して第1のモデル210aを受信し、受信した第1のモデル210aを例えば車両110aの車両コンピュータ116のメモリ117に記憶する。同様に、他の車両110b-nが、それぞれ、これらのそれぞれの送受信機114において第1のモデル210aの受信と同様にモデル(例えば、第2のモデル210b、第3のモデル210c、n番目のモデル210n)を受信し、受信したそれぞれのモデル210b-nを例えば他の車両110b-nの車両コンピュータ116のメモリ117に記憶する。
【0035】
開示された実施形態は、車両110aにおいて一つ又は複数のセンサ112によって取得されたセンサデータ220aを収集することを含む。本開示において使用されるようなセンサ112は、カメラ、カムコーダ、マイクロフォン、ライダ、又はセンサデータ220aを収集するように構成されたその他の装置を含む。本開示において使用されるようなセンサデータ220aは、写真、映像記録、音声記録、ライダデータ、又は車両110aの周囲環境のその他の測定記録を含む。同様に、他の車両110b-nがそれぞれこれらのそれぞれのセンサ112を介してセンサデータ220b-nを収集する。
【0036】
図1及び図2に見られるように、車両110aは、一つ又は複数のセンサ112を介してセンサデータ220aを受信し、受信したセンサデータ220aを例えば車両コンピュータ116のメモリ117に記憶する。同様に、他の車両110b-nがそれぞれこれらの収集されたセンサデータ220b-nをこれらの車両コンピュータ116のこれらのそれぞれのメモリ117を介して記憶する。
【0037】
開示された実施形態は第1の車両110aを含む。本開示において使用されるような第1の車両110aは、車、バン、トラック、バス、オートバイ、モペット、ドローン、ロボット、又は完全な又は部分的な自律移動が可能なその他の移動装置を含む。
【0038】
図1に見られるように、システム100は複数の車両110a-nを含む。車両110a-nの各々は他の車両110a-nのいくつかと実質的に同様であり又は他の車両110a-nのいくつかと異なっている。いくつかの実施形態では、全ての車両110a-nが、同様の検知及び動的能力/構成を有する同一モデルの自動運転車である。他の実施形態では、全ての車両110a-nが、様々な異なる検知及び動的能力/構成を有する異なるモデルの自動運転車両である。他の実施形態では、車両110a-nのいくつかが同様の構成であり、他の車両が異なる構成である。
【0039】
開示された実施形態は、収集されたセンサデータ220aの中から第1のデータ項目222aを特定することを含む。本開示において使用されるような第1のデータ項目222aは、車両110aによって受信されたセンサデータ220aのサブセットを含み、このサブセットは、推定の精度及び実世界環境における使用の安全性を改善するように第1のモデル210aを訓練するのに有用である。同様の方法で、例えば図3に見られるように、他の車両110b-nは、第1のデータ項目222aの特定と同様に、他のデータ項目(例えば、第2のデータ項目222b、第3のデータ項目222c、n番目のデータ項目222n)を特定することを含む。
【0040】
開示された実施形態は、第1のデータ項目222aが基準を満たすと判定されるときを特定することを含む。本開示において使用されるような基準は、(i)データが検知されるときの車両情報(例えば、速度、操舵及び制動)(例えば、所定速度以上である速度、又は速度が所定速度以上であるときの制動、所定度若しくは所定量以上である操舵、速度が所定速度以上であるときに所定量以上である操舵、又は第1のモデル210を訓練するのに有用な車両動作に関連するその他の条件)と、(ii)データが検知されるときの(例えば、慣性計測装置(IMU)、全地球測位システム(GPS)、又は車両110aの相対的又は絶対的な位置/向きを判別するのに使用されるその他のセンサによって判別されるような)車両の位置、データが検知されるときの時間、データが送信されるときのドライバモニタ情報、(iii)画像認識結果(例えば、シーン分類、検出された物体の数の分散、道路構造、又は車両110aの周囲の環境のその他の意味のある特性)、(iv)画像特徴の一意性/クラスタリング、(v)不確実性指標(uncertainty metrics)、(vi)及び/又は第1のモデル210を訓練するのに有用であることを示すその他の認識可能な特性を含む。同様の方法で、他の車両110b-nは、これらのそれぞれのデータ項目222b-nが基準を満たすと判定されるときを特定する。
【0041】
開示された実施形態は、特定された第1のデータ項目222aに含まれる物体140を検出することを含む。本開示において使用されるような物体140を検出することは、環境内の物体140の実世界の存在を示す第1のデータ項目222aの位置を特定することを含む。環境内の物体140の実世界の存在に関する情報は、物体140の位置、向き、サイズ、速度、軌跡又はその他の物理的/挙動的特徴を含む物体の特性を含む。同様の方法で、他の車両110b-nは、環境内の物体140の実世界の存在を示すこれらのそれぞれのデータ項目222b-nの部分を特定することによって物体140を検出する。
【0042】
図1に見られるように、物体140を検出することは、第1のデータ項目222aの部分が、特定の速度で、特定の方向に、道路の特定の部分を移動している自転車を示していると判別することを含む。
【0043】
開示された実施形態は、特定された第1のデータ項目222aを第1のモデル210aへの入力として用いて第1のモデル210aを動作させることを含む。いくつかの実施形態では、(i)第1のモデル210aがサーバコンピュータ120から受信されて車両110aの車両コンピュータ116のメモリ117に記憶され、且つ(ii)第1のデータ項目222がメモリ117に記憶されて車両110aのプロセッサ118によって特定された後に、プロセッサ118は第1のデータ項目222aを第1のモデル210aに入力して第1の推定224aとして物体140を検出する。第1のモデルを動作させることは、物体140の検出をもたらし、一つ又は複数の特定の信頼レベルを有する第1の推定224aを生成する。これら信頼レベルは、物体140の存在、特性及び挙動の第1モデル210aの認知が実世界環境における物体140の現実と一致する程度を示す。例えば、プロセッサ118は、第1のデータ項目222aを第1のモデル210aを通して動作させた後、第1の推定224aとして、90%の信頼で、時速20マイルで北に向かっている自転車が検出されたことと、80%の信頼で、検出された自転車がこの軌跡上を進み続けることとを判別する。同様な方法で、例えば図3に見られるように、他の車両110b-nは、これらそれぞれの特定された第1のデータ項目222b-nを入力として用いてこれらそれぞれの受信されたモデル210b-nを動作させて推定(例えば、第2の推定224b、第3の推定224c、n番目の推定224n)を生成する。これら他の推定224b-nの信頼区間は、個々に、第1の推定224aと同様であり、第1の推定224a未満であり、又は第1の推定224aよりも大きい。
【0044】
開示された実施形態は、第2の車両110b上のコンピュータ116との通信を確立することを含む。本開示において使用されるような通信を確立することは、有線又は無線態様での電気/電磁気情報の交換に関与することを含む。この電気/電磁気情報の交換は、例えば、通信ネットワーク130を介して、通信ネットワーク130とは別個のネットワークを介して、個別のスタンドアロン相互接続として、又は電子データの転送に適したその他の態様で行われる。
【0045】
状況に応じて、いくつかの実施形態は、追加の車両110との通信を確立することを含んでもよい。例えば、図1に見られるように、第1の車両110aは車両110b及び110cの各々と通信する(矢印の符号222b及び222cを参照)。
【0046】
開示された実施形態は、第1の車両110aから所定距離150以下に位置する第2の車両110bを含む。本開示において使用されるような所定距離150は、(i)ニューラルネットワークを効率的に訓練するのに十分なデータを得るために有効な長さであり、且つ(ii)ユーザ(例えば車両110aのオペレータ)についてのデータプライバシーを確保するように十分に制限された、第1の車両110aに近接した地理的範囲を含む。所定距離の長さは、静的であってもよく、又は関連する状況(例えば環境における車両110の密度)に応じて変化してもよい。いくつかの実施形態では、所定距離は数フィートのみである。いくつかの実施形態では、所定距離は数マイルである。
【0047】
状況に応じて、いくつかの実施形態は、所定距離150内の複数の車両を含む。例えば、図1に見られるように、第1の車両110aは所定距離150内の他の二つの車両110b及び110cと近接しており、更に別の車両110nは第1の車両110aの所定距離150内にいない。加えて、図1に見られるように、車両110b及び110cが第1の車両110aの所定距離150内にあるので、第1の車両110aのコンピュータ116と車両110b及び110cのコンピュータ116の各々との間で通信が(例えば車両110a-cの各々についての送受信機114を介して)確立された(矢印222b及び222c参照)。さらに、図1に見られるように、車両110nが第1の車両110aの所定距離150内にいないので、車両110aのコンピュータ116と車両110nのコンピュータ116との間で通信が確立されなかった。
【0048】
開示された実施形態は、第2の車両110b上のコンピュータ116から物体140を含むものとして示された第2のデータ項目222bを受信することを含む。上述したように、第2のデータ項目222bは、第1の車両110aに関連する第1のデータ項目222aと同様に、推定の精度及び実世界環境における使用の安全性を改善するように第2のモデル210bを訓練するのに有用な、第2の車両110bからのセンサデータ220bのサブセットを含む。
【0049】
いくつかの実施形態では、第2のデータ項目222bを受信することは、第2のデータ項目222bと、第2のデータ項目222b内の物体140の検出に対する第2の車両110bにおける第2のモデル210bの推定結果224bとを受信することを含む。
【0050】
いくつかの実施形態は、追加のデータ項目222を受信することを含む。例えば、図1に見られるように、車両110b及び110cの両方が第1の車両110aの所定距離150内にあるので、第1の車両110aは第2のデータ項目222b及び第3のデータ項目222cの両方を受信する。さらに、図1に見られるように、車両110nが第1の車両110aの所定距離150内にいないので、第1の車両110aはn番目のデータ項目を受信しない。同様の方法で、他の車両110b-nも、これら他の車両110b-nのそれぞれの所定距離150内の車両110のいくつかからそれぞれのデータ項目222を受信する。
【0051】
いくつかの実施形態では、追加のデータ項目222を受信することは、追加のデータ項目222と、追加のデータ項目222内の物体140の検出に対する追加の車両110における追加のモデル210の推定結果224とを受信することを含む。
【0052】
開示された実施形態は、(例えば図4に見られるような)第1のデータ項目222aと、第2のデータ項目222bと、物体140のラベル226とを含む訓練データセット228aを生成することを含む。本開示において使用されるような訓練データセット228aを生成することは、機械学習モデルを訓練するために有用な態様の関連情報を集約することを含む。訓練データセット228aは他のデータ項目222を含む。例えば、図1に表示された状況では、車両110b及び110cのみが車両110aの所定距離150内にあるので、訓練データセット228aは、n番目のデータ項目222nを含まないが、第1のデータ項目222a、第2のデータ項目222b及び第3のデータ項目222cを含む。本開示において使用されるような物体140のラベル226は、機械学習モデルがそれから学習できるようなコンテキストを提供する、物体140の意味ある又は有益な特性である。例えば、自転車に対応するラベルは、二輪、ペダル又はハンドルバーを含む。同様に、例えば図3に見られるように、他の車両110b-nは、ラベル226と、それぞれの車両110b-nに対応する生成され又は受信されたデータ項目222とを含むこれら自体の訓練データセット(例えば、訓練データセット224b、訓練データセット224c、訓練データセット224n)を生成する。
【0053】
開示された実施形態は、訓練データセット228aを教師信号として生成することを含む。本開示において使用されるような教師信号は、入力及び所望の出力値を有する訓練例を含む。入力は(例えば図4に見られるような)第1のデータ項目222a及び第2のデータ項目222bを含む。入力は他のデータ項目222を含む。例えば、図1に表示された状況では、車両110b及び110cのみが車両110aの所定距離150内にあるので、入力は、n番目のデータ項目222nを含まないが、第1のデータ項目222a、第2のデータ項目222b及び第3のデータ項目222cを含む。所望の出力値は物体140のラベル226を含む。同様に、車両110b-nに関連する訓練データセット228b-nも教師信号として生成される。
【0054】
いくつかの実施形態では、(例えば図1及び図4に見られるような)訓練データセット228を生成することは、第1のモデル210aの推定結果(例えば第1の推定224a)と、第2のデータ項目222b内の物体140を検出する、第2の車両110bにおける第2のモデル210bの推定結果(例えば第2の推定224b)とを組み合わせることによって物体140のラベル226を得ることを含む。推定結果224a、224b(すなわち第1のモデル210a及び第2のモデル210bからの推定結果224)のこの融合は物体140についての豊富なラベル情報をもたらす。ラベル226を得ることは追加の推定224の融合を含む。例えば、図1に表示された状況では、車両110b及び110cのみが車両110aの所定距離150内にあるので、第4の推定224dではなく、第1の推定224a、第2の推定224b及び第3の推定224cを組み合わせることによってラベル226が得られる。これに関して、異なるエッジモデル210の推定結果224の間に不一致が生じている場合、車両110は、教師信号のために、最も高い信頼スコアを有する推定結果を判別し、又は教師信号のために、複数の推定結果のうち最も多く見られる推定結果を判別する。
【0055】
開示された実施形態は、訓練データセット228a上で第1のモデル210aに対して訓練を行うことを含む。本開示において使用されるような訓練は、FLに関連するローカル訓練フェーズ(local training phase)を含む。図4に見られるように、訓練データセット228aを用いて第1のモデル210aを訓練することは、訓練された第1のモデル230aの生成をもたらす。訓練された第1のモデル230aは、訓練されていない第1のモデル210aよりも高い信頼レベルの推定を生成することができる。例えば、プロセッサ118は、第1のデータ項目222aを訓練された第1のモデル230aを通して動作させた後、訓練された第1の推定として、95%の信頼(元の第1のモデル210aを使用した90%からの上昇)で、時速20マイルで北に向かっている自転車が検出されたことを判別し、85%の信頼(元の第1のモデル210aを使用した80%からの上昇)で、検出された自転車がこの軌跡上を進み続けることを判別する。同様に、他の車両110b-nは、これらのそれぞれ生成された訓練データセット228b-n上でこれらのそれぞれのエッジモデル210b-nを訓練して、訓練されたエッジモデル230b-nを生成する。
【0056】
いくつかの実施形態では、第1のモデル210aに対して訓練を行うことは、受信された第1のモデル210aのコピーを訓練することを含む。第1のモデル210aのコピーに訓練を行うことによって、訓練後に元の第1のモデル210aが保存される。従って、高い信頼レベルを有する推定を生成可能なモデル210a、230aを今後も使用できるように、元の第1のモデル210aの性能と、訓練された第1のモデル230aの性能とを比較することができる。同様に、他の車両110b-nはこれらのそれぞれのエッジモデル210b-nのコピー上でこれらを訓練する。
【0057】
開示された実施形態は、訓練された第1のモデル230aを表す第1のデータ240aを通信ネットワーク130を介して一つ又は複数のサーバコンピュータ120に送信することを含む。訓練のために訓練データセット228aを一つ又は複数のサーバ120に送信することとは対照的に、(ローカルで訓練を行うことによって取得された)訓練された第1のモデル230aを表す第1のデータ240aを送信することによってユーザのデータのプライバシーを保護することができる。同様に、図3に見られるように、他の車両110b-nは、その後に一つ又は複数のサーバ120に送信されるこれら自体のデータ(例えば第2のデータ240b、第3のデータ240b、n番目のデータ240n)を生成する。
【0058】
開示された実施形態は、訓練前の第1のモデル210aと訓練後の第1のモデル230aとの間の勾配232aを第1のデータ240aとして得ることを含む。本開示において使用されるような勾配232aは、第1のモデル210aと、訓練された第1のモデル230aとの間の差を表す更新パラメータ(例えば重み)を含む。更新/訓練されたモデル230aの全体ではなく勾配232aのみを送信することによって、送信のオーバーヘッドを低減することができ、このことによって通信ネットワーク130のパフォーマンスを改善することができる。同様に、他の車両110b-nは、その後に一つ又は複数のサーバ120に送信される、これらそれぞれのエッジモデル210b-nと、訓練されたエッジモデル230b-nとの間の勾配232b-nをこれらそれぞれのデータ240b-nとして得る。
【0059】
開示された実施形態は、他のエッジモデルから集約されたモデル情報を用いて訓練されたモデルを表す更新データ250aを一つ又は複数のサーバコンピュータ120から通信ネットワーク130を介して受信することを含む。本開示において使用されるような更新データ250aは、FLに関連するグローバル集約フェーズ(global aggregation phase)の結果を含む。例えば、一つ又は複数のサーバコンピュータ120は、第1のモデル210aに対して複数のエッジ車両110a-nの各々から受信されたデータ240a-n(例えば訓練されたモデル230a-n又は勾配232a-n)を集約し、それに従って第1のモデル210aを更新する。更新データ250aは、更新された第1のモデル自体、又は更新された第1のモデルと元の第1のモデル210aとの間の勾配を表す。同様に、他の車両110b-nはそれぞれ更新データ250b-nを受信する。更新データ250b-nは、それぞれのモデル210b-nに対するデータ240a-nの集約に基づくそれぞれのモデル210b-nに対する更新を表す。更新データ250b-nはそれぞれ更新データ250aと実質的に同一であり又は更新データ250aとは異なる。いくつかの実施形態では、更新データ250aは一つ又は複数のサーバコンピュータ120からエッジ車両110a-nの各々に送信される。
【0060】
開示された実施形態は、更新データ250aに基づいて第1のモデル210aを更新することを含む。更新データ250aを用いて第1のモデル210a(並びに可能性としては両方のコピーがメモリ117に記憶されている場合に、訓練された第1のモデル230a)を更新した後、更新された第1のモデルは、元の第1のモデル210a及び訓練された第1のモデル230aの両方に対してより高い信頼レベルの推定を生成することができる。例えば、プロセッサ118は、更新された第1のモデルを通して第1のデータ項目222aを動作させた後、更新された第1の推定として、98%の信頼(訓練された第1のモデル230aを使用した95%及び元の第1のモデル210aを使用した90%からの上昇)で、時速20マイルで北に向かっている自転車が検出されたことを判別し、90%の信頼(訓練された第1のモデル230aを使用した85%及び元の第1のモデル210aを使用した80%からの上昇)で、検出された自転車がこの軌跡上を進み続けることを判別する。同様に、他の車両110b-nはそれぞれ更新データ250b-nを用いてこれらのそれぞれのエッジモデル210b-nを更新する。代替的に、他の車両110b-nは更新データ250aを用いてこれらのそれぞれのエッジモデル210b-nを更新してもよい。
【0061】
図5は、実施形態に従って自動運転車両のためのニューラルネットワークを訓練するFLを提供する方法についてのフローチャートである。図5を参照すると、操作302において、システムは一つ又は複数のサーバコンピュータから通信ネットワークを介して第1のモデルを受信する。操作304では、システムは、第1の車両上のセンサによって取得されたセンサデータを収集する。操作306では、システムは、第1のデータ項目が基準を満たすと判定されたときに、収集されたセンサデータの中から第1のデータ項目を特定する。操作308では、システムは、、特定された第1のデータ項目を第1のモデルへの入力として用いて第1のモデルを動作させることによって、特定された第1のデータ項目に含まれる物体を検出する。操作310では、システムは、第1の車両から所定距離以下に位置する第2の車両上のコンピュータとの通信を確立する。操作312では、システムは、第2の車両上のコンピュータから物体を含むものとして示された第2のデータ項目を受信する。操作314では、システムは、第1のデータ項目と、第2のデータ項目と、物体のラベルとを含む訓練データセットを教師信号として生成する。操作316では、システムは訓練データセット上で第1のモデルに対する訓練を行う。操作318では、システムは、訓練された第1のモデルを表す第1のデータを通信ネットワークを介して一つ又は複数のサーバコンピュータに送信する。
【0062】
上述した方法の一つ又は複数の操作が省略され又は他の操作と組み合わされてもよく、且つ一つ又は複数の追加の操作が加えられてもよいことが理解される。
【0063】
上述した方法を利用して、従来の自動運転車両の訓練技術に対するいくつかの利点が実現される。訓練データをコーディネータに送信することとは対称的に、ローカルで訓練を行うことによって、ユーザのデータのプライバシーが確保される。一つ又は複数の近傍の車両からの推定結果を利用し、ローカルのエッジデバイスにおける推定結果を融合して教師信号を得ることによって、教師信号が容易に又は実際的に達成できない車両コンテキストにおいて訓練を行うことができ、推定の精度を改善することができる。更新/訓練されたモデルではなく勾配のみを送信することによって、送信のオーバーヘッドが低減され、このことによって通信ネットワークのパフォーマンスを改善することができる。複数のエッジデバイスからMLモデルに対する更新を集約することによって、大量のデータを用いてMLモデルを効率的に訓練することができ、このことによってパフォーマンス(推定の精度)を改善することができる。
【0064】
前述の開示は、例示及び説明を提供するが、網羅的であること、又は開示された正確な形態に実施を限定することを意図するものではない。修正及び変形が上記の開示に照らして可能であり又は実施の実践から得られてもよい。
【0065】
本明細書において使用されるとき、用語「コンポーネント」は、ハードウェア、ファームウェア、又はハードウェアとソフトウェアとの組合せとして広く構成されることを意図している。
【0066】
本明細書に記載されたシステム及び/又は方法が、ハードウェア、ファームウェア、又はハードウェアとソフトウェアとの組合せの種々の形態で実装されうることが明らかであろう。これらシステム及び/又は方法を実装するために使用される実際の専用の制御ハードウェア又はソフトウェアコードは実装を限定するものではない。このため、システム及び/又は方法の操作及び挙動が特定のソフトウェアコードを参照することなく本明細書に記載され、ソフトウェア及びハードウェアが本明細書の記載に基づいてシステム及び/又は方法を実装するように設計されうることが理解される。
【0067】
特徴の特定の組合せが特許請求の範囲に列挙され且つ/又は明細書に開示されているが、これら組合せは可能な実装の開示を限定することは意図していない。実際、これら特徴の多くを、特許請求の範囲に具体的に列挙されてなく且つ/又は明細書に開示されていない方法で組み合わせることができる。以下に挙げられた各従属請求項が一つの請求項のみに直接従属しているが、可能な実装の開示は、請求項のセット内の他の全ての請求項と組み合わされた各従属請求項を含む。
【0068】
本明細書において使用される要素、行為又は命令は、明示的に記載されない限り、重要又は必須であると解釈されるべきではない。また、本明細書において使用されるとき、冠詞「a」及び「an」は、一つ又は複数の項目を含むことを意図しており、「一つ又は複数の」と交換可能に使用されうる。さらに、本明細書において使用されるとき、用語「組」は、一つ又は複数の項目(例えば、関連する項目、関連しない項目、関連する項目と関連しない項目との組合せ等)を含むことを意図しており、「一つ又は複数の」と交換可能に使用されうる。一つのみの項目が意図されている場合、用語「一つ」又は類似の言葉が使用される。また、本明細書において使用されるとき、用語「有する」又は同様の用語は、オープンエンドの用語であることを意図している。さらに、語句「基づく」は、反対のことが明記されない限り、「少なくとも部分的に基づく」を意味することを意図している。
【0069】
要素のリストに先行するときの「少なくとも一つの」のような表現は、要素のリスト全体を修飾し、リストの個々の要素を修飾することはない。例えば、表現「a、b及びcの少なくとも一つ」は、aのみ、bのみ、cのみ、a及びbの両方、a及びcの両方、b及びcの両方、a、b及びcの全て、又は前述の例の任意のバリエーションを含むものと理解されるべきである。
【0070】
「第1の」、「第2の」等のような用語が様々な要素を記載するのに使用されるが、斯かる要素は上記の用語に限定されてはならない。上記の用語は、一つの要素を別の要素と区別するためのみに使用されうる。
図1
図2
図3
図4
図5
【外国語明細書】