(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023021910
(43)【公開日】2023-02-14
(54)【発明の名称】自律マシン・アプリケーションにおける距離画像マッピングのための信念伝搬
(51)【国際特許分類】
G06T 7/579 20170101AFI20230207BHJP
【FI】
G06T7/579
【審査請求】未請求
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022087386
(22)【出願日】2022-05-30
(31)【優先権主張番号】17/392,050
(32)【優先日】2021-08-02
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ZIGBEE
2.TENSORFLOW
(71)【出願人】
【識別番号】501450960
【氏名又は名称】エヌビディア コーポレーション
(74)【代理人】
【識別番号】110000855
【氏名又は名称】弁理士法人浅村特許事務所
(72)【発明者】
【氏名】デイヴィッド ヴェール
(72)【発明者】
【氏名】イブラヒム イーデン
(72)【発明者】
【氏名】ヨアキム ペーゼリ
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096AA09
5L096BA04
5L096BA05
5L096DA01
5L096FA66
(57)【要約】
【課題】自律マシン・アプリケーションにおける距離画像マッピングのための信念伝搬のためのシステム及び方法を提供する。
【解決手段】様々な実例において、3D LiDARデータを「2.5D」オプティカル・フロー空間(たとえば、x、y、及び深度フロー)に簡略化することによって3D空間においてシーン・フローを生成するシステム及び方法について説明する。たとえば、LiDARデータのフレーム間の深度フロー情報の2.5D表現を生成するためにLiDAR距離画像が使用され得、深度フロー情報を生成するために2つ又はそれ以上の距離画像が比較され得、2.5D表現における画素値を更新するために、たとえば、信念伝搬アルゴリズムを使用してメッセージがパスされ得る。得られた画像を使用して、2.5D動きベクトルを生成可能であり、2.5D動きベクトルを3D空間に変換して、自律マシン周辺の環境の3Dシーン・フロー表現を生成可能である。
【選択図】
図1A
【特許請求の範囲】
【請求項1】
少なくとも2つの連続する距離画像の対応する画素間の深度値の1つ又は複数の変化を表す深度フロー画像を生成することと、
前記深度フロー画像の1つ又は複数の隣接する画素に関連付けられた1つ又は複数の値を更新するために、信念伝搬アルゴリズムを使用して、前記深度フロー画像の前記1つ又は複数の隣接する画素に対応するデータをパスすることと、
前記1つ又は複数の更新された値に少なくとも部分的に基づいて、前記少なくとも2つの連続する距離画像間の前記深度フロー画像の前記1つ又は複数の隣接する画素の動きに対応する画像空間における1つ又は複数の動きベクトルを計算することと、
前記1つ又は複数の動きベクトルを世界空間における対応する1つ又は複数の動きベクトルに変換することによってシーン・フロー表現を生成することと
を行うための1つ又は複数の回路
を備えるプロセッサ。
【請求項2】
前記プロセッサが、
自律又は半自律マシンの制御システム、
自律又は半自律マシンの認知システム、
シミュレーション動作を実行するためのシステム、
深層学習動作を実行するためのシステム、
エッジ・デバイスを使用して実装されるシステム、
ロボットを使用して実装されるシステム、
1つ又は複数の仮想マシン(VM:Virtual Machine)を組み込むシステム、
データ・センタにおいて少なくとも部分的に実装されるシステム、又は
クラウド計算資源を使用して少なくとも部分的に実装されるシステム、のうちの少なくとも1つに含まれる、請求項1に記載のプロセッサ。
【請求項3】
前記シーン・フロー表現に少なくとも部分的に基づいて1つ又は複数の物体の1つ又は複数の位置を決定することと、
前記1つ又は複数の物体の前記1つ又は複数の位置に少なくとも部分的に基づいて1つ又は複数の動作を実行することと
を行うための処理回路をさらに備える、請求項1に記載のプロセッサ。
【請求項4】
前記シーン・フローに少なくとも部分的に基づいて1つ又は複数の動作を実行するための処理回路をさらに備える、請求項1に記載のプロセッサ。
【請求項5】
前記少なくとも2つの連続する距離画像が、対応するLiDAR(Light Detection and Ranging)点群を使用して生成される、請求項1に記載のプロセッサ。
【請求項6】
別の1つ又は複数の隣接する画素のペアが同じ物体に対応しないと決定されたとき、前記別の1つ又は複数の隣接する画素の前記ペアに対応するデータがパスされることが防止される、請求項1に記載のプロセッサ。
【請求項7】
第1の時間において1つ又は複数のLiDARセンサを使用して生成された第1のLiDAR距離画像と、前記第1の時間の後の第2の時間において前記1つ又は複数のLiDARセンサを使用して生成された第2のLiDAR距離画像とに少なくとも部分的に基づいて深度フロー画像を生成するステップであって、前記深度フロー画像が、1つ又は複数の深度フロー値でラベル付けされた1つ又は複数の画素を含む、生成するステップと、
更新された深度フロー画像を生成するために、前記深度フロー画像の前記1つ又は複数の画素のうちの少なくとも1つの画素に対応するデータをパスするステップであって、前記パスされたデータが、前記1つ又は複数の画素のそれぞれの深度フロー値と、前記1つ又は複数の画素のそれぞれのコストとを少なくとも部分的に示す、パスするステップと、
前記更新された深度フロー画像に少なくとも部分的に基づいて、前記第1のLiDAR距離画像と前記第2のLiDAR距離画像との間の相対画素位置を表す1つ又は複数の動きベクトルを計算するステップと
を含む方法。
【請求項8】
前記第1のLiDAR距離画像及び前記第2のLiDAR距離画像が、1つ又は複数のLiDAR点群を表すデータを使用して生成される、請求項7に記載の方法。
【請求項9】
前記第1のLiDAR距離画像が、計算されたエゴモーションに少なくとも部分的に基づいて前記第2のLiDAR距離画像と同じ座標系に変換される、請求項7に記載の方法。
【請求項10】
前記第1のLiDAR距離画像及び前記第2のLiDAR距離画像がそれぞれ、反射率情報、強度情報、深度情報、飛行時間(ToF:Time Of Flight)情報、戻り情報、又は分類情報のうちの少なくとも1つを表す、請求項7に記載の方法。
【請求項11】
前記1つ又は複数の動きベクトルが2次元(2D:two-dimensional)空間において計算され、前記方法は、1つ又は複数の3D(three-dimensional)動きベクトルを生成するために前記1つ又は複数の動きベクトルを3D空間に変換するステップをさらに含む、請求項7に記載の方法。
【請求項12】
前記1つ又は複数の3D動きベクトルが、前記第1のLiDAR距離画像と前記第2のLiDAR距離画像との間のシーン・フロー表現を表す、請求項11に記載の方法。
【請求項13】
前記1つ又は複数の画素のうちの前記少なくとも1つの画素に対応する前記データが、信念伝搬アルゴリズムを使用してパスされる、請求項7に記載の方法。
【請求項14】
前記深度フロー画像が、第2の画素に隣接する第1の画素を含み、前記方法は、
前記第2のLiDARデータからの深度データに少なくとも部分的に基づいて、前記第1の画素が、前記第2の画素に対応する第1の物体とは別個の第2の物体に対応することを決定するステップと、
前記決定することに少なくとも部分的に基づいて、前記第1の画素に対応するデータを前記パスすることを防止するステップと
をさらに含む、請求項13に記載の方法。
【請求項15】
1つ又は複数の処理ユニットと、
命令を記憶する1つ又は複数のメモリ・ユニットと
を備えるシステムであって、前記命令が、前記1つ又は複数の処理ユニットによって実行されたときに、前記1つ又は複数の処理ユニットに、
少なくとも2つの連続する距離画像の対応する画素間の1つ又は複数の深度値の1つ又は複数の変化を表す深度フロー画像を生成することと、
前記深度フロー画像の画素に関連付けられた1つ又は複数の値を更新するために、信念伝搬アルゴリズムを使用して、前記深度フロー画像の前記1つ又は複数の隣接する画素に対応するデータをパスすることと、
前記1つ又は複数の更新された値に少なくとも部分的に基づいて、前記少なくとも2つの連続する距離画像間の前記深度フロー画像の前記1つ又は複数の隣接する画素の動きに対応する1つ又は複数の画像空間動きベクトルを計算することと、
シーン・フロー表現を生成するために前記画像空間動きベクトルを世界空間動きベクトルに変換することと
を含む動作を実行させるシステム。
【請求項16】
前記システムが、
自律又は半自律マシンの制御システム、
自律又は半自律マシンの認知システム、
シミュレーション動作を実行するためのシステム、
深層学習動作を実行するためのシステム、
エッジ・デバイスを使用して実装されるシステム、
ロボットを使用して実装されるシステム、
1つ又は複数の仮想マシン(VM)を組み込むシステム、
データ・センタにおいて少なくとも部分的に実装されるシステム、又は
クラウド計算資源を使用して少なくとも部分的に実装されるシステム、のうちの少なくとも1つに含まれる、請求項15に記載のシステム。
【請求項17】
前記動作が、
前記シーン・フローに少なくとも部分的に基づいて1つ又は複数の物体の1つ又は複数の位置を決定することと、
前記1つ又は複数の物体の前記1つ又は複数の位置に少なくとも部分的に基づいて1つ又は複数の動作を実行することと
をさらに含む、請求項15に記載のシステム。
【請求項18】
前記動作が、前記シーン・フロー表現に少なくとも部分的に基づいて1つ又は複数の動作を実行することをさらに含む、請求項15に記載のシステム。
【請求項19】
前記少なくとも2つの連続する距離画像が、対応するLiDAR点群を使用して生成される、請求項15に記載のシステム。
【請求項20】
1つ又は複数の他の隣接する画素のペアが同じ物体に対応しないことが決定されたとき、少なくとも1つのメッセージが、前記1つ又は複数の他の隣接する画素の前記ペア間でパスされることが防止される、請求項15に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
安全で効果的に動作するために、自律及び半自律型車両は、適切な行動が適時に取られ得るように、異なる距離において動く障害物又は物体を識別する必要がある。
【背景技術】
【0002】
たとえば、適切な行動は、識別された障害物を回避するか又はそこから離れるために、方向転換すること、車線を変更すること、ブレーキをかけること、及び/又は加速することを含み得る。さらに、障害物及びそれらの動きを早く正確に決定することにより、適切な行動を決定し、実行するための時間が見込まれる。したがって、物体検出及び追跡は、車両がハイウェイ速度で走行しているとき、又は交差交通が存在するときでも、リアルタイム又はほぼリアルタイムで行われなければならない。
【0003】
3次元(3D:three-dimensional)空間における静止物体及び/又は動く物体の表現はシーン・フローと呼ばれることがある。既存のシーン・フロー・システムは、一般に、静止しているように、及び/又は限られた視野を有するように設計される。3D空間においてシーン・フローを実行することの複雑さ及び計算要件により、既存のシーン・フロー・システムはまた、リアルタイムで動作することが不可能であり得るか、又は限られた解像度及び/若しくは精度においてのみリアルタイムで動作することが可能であり得る。したがって、既存の自律型車両は、カメラベースのニューラル・ネットワーク、LiDAR(Light Detection and Ranging)点群(point cloud)、及び/又はRADARデータに依拠するなど、これらの制限により障害物検出の他の方法及びデータ・ソースに依拠している。しかしながら、カメラベースのニューラル・ネットワークは、短い距離においては正確であるが、任意の所与の物体又は障害物を表す画素の量が限られているので、より遠い距離においてはそれほど正確ではない。さらに、LiDARセンサ及びRADARセンサは、一般に、消失したデータ・ポイントを含み、ノイズが多いことがある。これらの既存の方法は、一般に、時間にわたって複数のフレームを分析することによってのみ獲得され得る重要なコンテキストを欠くことがある、データの単数フレームを分析することに依拠する。
【発明の概要】
【課題を解決するための手段】
【0004】
本開示の実施例は、自律マシン・アプリケーションにおける距離画像マッピングのための信念伝搬(belief propagation)に関する。少なくとも部分的に、単一フレーム検出の代わりに経時的な動きに焦点を当てることによって、リアルタイムでLiDARベースのシーン・フローを与えるシステム及び方法が開示される。上記で説明したシステムなど、従来のシステムとは対照的に、現在のシステム及び方法は、3D LiDARデータを拡張2次元(「2.5D」)深度フロー空間(たとえば、LiDAR距離画像間の深度値の変化を示す、x、y、及び深度フロー)に簡略化することと、たとえば、信念伝搬アルゴリズムによって、画素間で(たとえば、画素に対応する行列、格子、表など、画素表現のノード間で)メッセージをパスすることと、(たとえば、2.5D画像空間位置と3D世界空間位置との間の既知の関連付けに基づいて)2.5D情報を3D空間に逆変換することによって画素についての3D動きベクトルを計算することとによって、3D空間においてシーン・フローを生成する。結果として、LiDARデータからのノイズの多い又は消失した情報は、シーンのより密な表現を生成するために、たとえば、2D又は2.5D空間において、メッセージ・パッシングを使用して推定され得、より密な表現は、その場合、環境中で動的物体を検出、識別、及び/又は追跡する際に使用するために3D空間に逆変換され得る。現在のシステムは、自律マシン(たとえば、車両、ロボットなど)など、モバイル・プラットフォーム上で使用されるように構成され得、たとえば、スピニングLiDARセンサ、又は既存のシステムよりも広い視野(たとえば、最大360度)を与える他の深度センサを含み得る。さらに、計算の実質的な部分が、3D空間において行われる代わりに投影画像(たとえば、LiDAR距離画像)に対して行われることにより、現在のシステムはまた、動く障害物を識別するためにリアルタイムで動作することが可能である。
【0005】
以下で、添付の図面を参照しながら、自律マシン・アプリケーションにおける距離画像マッピングのための信念伝搬のための本システム及び方法について詳しく説明する。
【図面の簡単な説明】
【0006】
【
図1A】本開示のいくつかの実施例による、シーン・フロー推定システムを示すデータ流れ図である。
【
図1B】本開示のいくつかの実施例による、シーン・フロー生成のためのプロセスを示す時間流れ図である。
【
図2】本開示のいくつかの実施例による、画像変位と深度フローとを示す、例示的な画素体積上のラベルを示す図である。
【
図3】本開示のいくつかの実施例による、深度フローに関するメッセージ・パッシングについての例示的なコスト関数を示す図である。
【
図4】本開示のいくつかの実施例による、画素ノードと近隣画素ノードとの間のメッセージ・パッシングを示す図である。
【
図5】本開示のいくつかの実施例による、2つの連続するLiDAR距離画像と合成深度フロー画像とを示す図である。
【
図6A】本開示のいくつかの実施例による、深度フロー画像から生成された合成シーン・フローを示す図である。
【
図6B】本開示のいくつかの実施例による、深度フロー画像から生成された合成シーン・フローを示す図である。
【
図7】本開示のいくつかの実施例による、信念伝搬を使用したシーン・フロー生成のための方法を示す流れ図である。
【
図8A】本開示のいくつかの実施例による、例示的自律型車両のイラストレーションである。
【
図8B】本開示のいくつかの実施例による、
図8Aの例示的自律型車両のカメラ位置及び視野の実例である。
【
図8C】本開示のいくつかの実施例による、
図8Aの例示的自律型車両の例示的システム・アーキテクチャのブロック図である。
【
図8D】本開示のいくつかの実施例による、クラウドベースのサーバと
図8Aの例示的自律型車両との間の通信のシステム図である。
【
図9】本開示のいくつかの実施例の実装において使用するのに適した例示的コンピューティングデバイスのブロック図である。
【
図10】本開示のいくつかの実施例の実装において使用するのに適した例示的データ・センタのブロック図である。
【発明を実施するための形態】
【0007】
自律マシン・アプリケーションにおける距離画像マッピングのための信念伝搬に関するシステム及び方法が開示される。本開示は、例示的自律型車両800(或いは、本明細書で「車両800」又は「エゴ車両(ego-vehicle)800」と称され、その実例は
図8A~8Dに関して説明される)に関して説明されることがあるが、これは限定的なものではない。たとえば、本明細書に記載のシステム及び方法は、非自律型車両、半自律型車両(たとえば、1つ又は複数の適応型運転者支援システム(ADAS:adaptive driver assistance system)における)、有人及び無人ロボット又はロボティクス・プラットフォーム、倉庫車両、オフロード車両、1つ又は複数のトレーラに連結された車両、飛行船舶、ボート、シャトル、緊急対応車両、オートバイ、電気若しくは原動機付自転車、航空機、建設車両、潜水艦、ドローン、及び/又は、他の車両若しくは自律マシン・タイプによって使用されてもよいが、これに限定されない。加えて、本開示は、自律運転のためのシーン・フローを生成することに関して説明されることがあるが、これは限定的なものではなく、本明細書に記載のシステム及び方法は、拡張現実、仮想現実、複合現実、ロボット工学、セキュリティ及び監視、自律若しくは半自律マシン・アプリケーション、及び/又は、シーン・フローが使用され得る任意の他の技術空間において使用され得る。
【0008】
本開示の実施例は、LiDAR距離(又は他の投影)画像から生成された距離画像の作成及び分析によって、自律型車両上で使用されるLiDARセンサなど、深度センサを使用したシーン・フロー決定に関する。たとえば、LiDARセンサは、それらの視野又は感覚野(sensory field)を表す3D LiDARデータを生成し得、たとえば、LiDARデータは、標準球面投影又は他の投影タイプを表し得る。LiDARセンサは、各セットがLiDARセンサの単一の掃引又は回転を示す、LiDARデータの多数のセットが生成されるように、LiDARデータを連続的に生成し得る。LiDARデータのセットは、たとえば、1つの回転を完了するために必要とされる時間間隔に対応する、時間間隔によって分離され得、本開示の実施例は、本明細書で説明するように、LiDARデータの第1の(たとえば、現在の)セットを使用し、そのセットをLiDARデータの第2の前の(たとえば、直前の)セットと比較して、データから様々な情報を決定し得る。いくつかの実施例では、LiDARデータの2つの連続するセットが分析され得るが、これは限定的なものではなく、LiDARデータの分析されたセットは、連続するフレーム以外のデータの異なる構成に対応し得る。
【0009】
(たとえば、3D点群を表す)複雑な3D LiDARデータは、2D LiDAR距離画像(又は他の投影画像タイプ)に簡略化され得、また、より高速な分析を可能にする(代替的に本明細書で「深度フロー画像」と呼ぶ)2.5D深度フロー画像を生成するために、(深度フローなど)追加の情報を用いて符号化され得る。いくつかの実施例では、深度フロー画像はまた、特に、フレーム間でより大きい動きが生じている場合、オプティカル・フロー情報をより迅速に識別するのを助けるために、ピラミッド手法又はマルチスケール手法を使用して解像度が低減され得る。深度フロー画像は画素のセットを含み得、各画素は、2次元(2D:two-dimensional)座標と、(フレームにわたる深度又は距離の変化を示す)深度フロー値とのセットをもつ。いくつかの実施例では、深度フローは、センサに向かう動き、センサから離れる動き、及び/又は向かう若しくは離れる動きがないこと(たとえば、静止)を示すラベルのセット(たとえば、信念伝搬など、ラベルベースのアルゴリズムが採用される場合)として簡略化され得る。たとえば、これらの深度フロー値は、それぞれ-1(向かう)、+1(離れる)、及び0(静止)として表され得る。いくつかの実施例では、深度フローは、より粒度が細かくてもよく、センサに向かう速い動き、センサに向かう遅い動き、センサに向かう動きなし、センサから離れる遅い動き、及び/又はセンサから離れる速い動きを表し得る。この簡略化された深度フロー情報により、本明細書で説明する分析が可能になり得る。
【0010】
2つの、たとえば連続する、距離画像を比較するとき、エゴモーションを補償するように、1つの距離画像(たとえば、以前の画像)が後続の又は現在の距離画像の座標系に変換されるか又は整流され得る(又はその逆も同様である)。エゴモーションを補償することによって、以後の分析は、エゴ車両の動きが除外されているので、エゴ車両に対する物体の動きを考慮することのみを必要とし、それにより、同じ座標系における2つの距離画像の整合が可能になり得る。
【0011】
いくつかの実施例では、その中の各画素に関連する3D動きベクトルを決定するように、2つ又はそれ以上の距離画像が比較される。3D動きベクトルは、メッセージ・パッシング信念伝搬アルゴリズムを介して2つ又はそれ以上の深度画像の分析によって生成される。たとえば、画素データが信念伝搬アルゴリズムによって近隣画素(たとえば、行列、表、格子などにおいて表される画素ノード)に伝搬され得、近隣画素(たとえば、画素表現の近隣ノード)において受信されたデータは、画素についての更新された値を決定するために分析され、使用される。次いで、結果を精緻化するために追加の反復が実行される。
【0012】
一般に、信念伝搬は、グラフィカル・モデルから情報を推論するためのメッセージ・パッシング・アルゴリズムである。信念伝搬は、場合によっては厳密であり得るが、信念伝搬は、しばしば、近似のために使用される。信念伝搬アルゴリズムでは、2つの制約が定義される必要があり得る。第1の制約はデータ項を決定することであり、第2の制約は平滑度(smoothness)項を決定することである。データ項は、画素によって表される物体の動きが決定され得るように、2つの距離画像にわたって同様の又は同じ画素を識別するために使用され得る。平滑度項は、識別された物体が一緒に移動するように、又は物体若しくは表面間の境界がそのように処理されるように、隣接する画素にわたって値を調整するために使用され得る。メッセージは、同じ深度フロー画像の画素(たとえば、画素に対応する画素ノード)間で送られ、データ項と平滑度項の両方に関する情報を搬送し得る。詳細には、メッセージは、(画像間の正しい画素を識別するための中への及び外への一般的な方向を識別するのを助けるための)深度フロー情報、2D画素フロー情報(フレーム間の画素の動き)、及び/又は(画素がそれらの近隣にどのくらい影響を及ぼすべきであるかを識別するのを助けるための)コストを含み得る。
【0013】
データ項は、2つ又はそれ以上の距離画像中のどの画素が同じ物体(又は同じ物体の一部)に対応するかを識別し得る。物理的物体及び/又は深度センサは画像間で移動しているので、データ項は実施例では有用であり得る。深度フロー、反射率、色値、強度、飛行時間(ToF:Time Of Flight)、テクスチャ、戻り挙動、及び/又は(LiDARデータによって表される情報、又はLiDAR距離画像中に表される情報など)他の情報などの変数がデータ項において分析され得る。
【0014】
メッセージは、異種物体に対応する画素(たとえば、画素ノード)間でパスされないことがある。たとえば、物理的環境中の同じ物理的物体に対応しないことが計算された隣接する画素は、(2つの画素間の深度又は反射率の検出された差がある閾値を超えるのでなど)互いの間でメッセージをパスしない。これは、これらの画素は、それらが異なる物理的物体に対応するので、それらの近隣画素に影響を及ぼすべきでないからである。したがって、これらの近隣画素間の視差(disparity)は信念伝搬アルゴリズムによって過度に影響されないことがある。
【0015】
平滑度項は、深度フローについてのどの値が、同じ物理的物体に対応する画素についてほぼ正しいかを識別し得る。一般に、空間中で移動している物理的物体は単一のユニットとして移動する。したがって、いくつかの画素の不完全で不正確なデータは、この情報を考慮するために近隣画素によって調整され、影響され得る。たとえば、各画素と関連付けられたデータがどのくらい信頼できるかに基づいて、各画素にコストが割り当てられる。不完全なデータをもつ(たとえば、LiDARセンサへの戻りがない)画素の場合、不完全なデータが、信念伝搬アルゴリズムによってそれらの近隣画素によって影響される可能性が高くなるように、低いコストが割り当てられ得る。これにより、元のLiDAR走査からデータが消失しているにもかかわらず、密な動き場を作成することが可能になり得る。
【0016】
同じ深度フロー画像の画素間のこれらのメッセージのパッシング及び分析によって、各画素における様々なデータの精度が、精緻化された2D(又は2.5D)動きベクトルに対して改善され得る。他の画素についての消失した又は不完全なデータも推定され、精緻化され得る。
【0017】
2D(又は2.5D)ベクトルは、その場合、2D画像空間と3D世界空間位置との間の既知の対応を使用して3D空間に逆変換され得る。したがって、LiDAR点群中の点についての3D動きベクトルが決定され得、3D動きベクトルは、LiDARデータのフレームにわたる、点、したがって物体又は障害物の差異(又は動き)を表す。このようにして、メッセージ・パッシング信念伝搬アルゴリズムにより、この複雑な分析を3D空間に戻る前に簡略化し、完了することが可能になり、それにより、3D座標系における分析を回避することによってシステムの計算要件及び実行時間が低減される。最終的に、シーン・フローは、深度センサの周りの様々な物理的物体の動きを示し、物体を考慮するために自律又は半自律マシンによって様々な適切な行動が取られ得るように、マシンの周りの動的物体を検出し、追跡するために使用され得る。
【0018】
図1Aを参照すると、
図1Aは、本開示のいくつかの実施例による、例示的シーン・フロー生成システム100である。本明細書に記載のこの及び他の構成は単に実例として記載されていることを理解されたい。他の構成及び要素(たとえば、マシン、インターフェース、機能、順番、機能のグループ化など)が、図示されたものに加えて又はそれらの代わりに使用され得、いくつかの要素は、完全に省略され得る。さらに、本明細書に記載の要素の多数は、個別の若しくは分散された構成要素として又は他の構成要素と併せて、並びに任意の適切な組合せ及び場所において実装され得る機能エンティティである。エンティティによって実行されるものとして本明細書に記載された様々な機能は、ハードウェア、ファームウェア、及び/又はソフトウェアによって実施され得る。たとえば、様々な機能が、メモリに記憶された命令を実行するプロセッサによって実施され得る。いくつかの実施例では、システム100は、
図8A~
図8Dに関して本明細書で説明する車両800、
図9の例示的な計算デバイス900、及び/又は
図10の例示的データ・センタ1000のそれと同様の構成要素、特徴、及び/又は機能性を含み得る。
【0019】
図1Aに示されているように、シーン・フロー・システム100は、(LiDARセンサ、RADARセンサ、超音波センサなど)1つ又は複数の深度知覚センサ102を含み得る。深度知覚センサ102は、一般に、送信機と受信機とを含み得、広い視野(たとえば、180度から360度まで)など、任意の好適な視野又は感覚野を含み得、実施例では、深度知覚センサ102に対してより広い領域の視界を獲得するように移動(たとえば、回転)し得る。その、たとえば、LiDAR、信号は、深度知覚センサ102の近傍にある物体から反射し得る。物体は、深度知覚センサ102に対して移動していることがあり、深度知覚センサ102は、(自律型車両がそれの上で走行している道路など)下にある表面に対して移動していることがある。受信機はこれらの様々な反射された信号の指示を(直接又は間接的に)受信し得、指示は後の分析のためにデータとして記憶及び/又は送信され得る。
【0020】
深度知覚センサ102は、深度知覚センサ102の動作を制御し、結果を解釈するために使用され得るセンサ・コントローラ104を有し得る。たとえば、センサ・コントローラ104又は他のプロセッサは、センサ・データ106を受信し、センサ・データ106に関係する計算を処理するか、分析するか、さもなければ実行し得る。いくつかの実施例では、深度知覚センサ102及び/又はセンサ・コントローラ104は、
図8A~
図8Cに関して説明するLiDARセンサ864と同様であり得るか、又は別のタイプの深度知覚センサ102であり得る。
【0021】
センサ・コントローラ104は、センサ・データ106を、車両800及び/又は
図9の例示的な計算デバイス900内で実行する計算システムなど、計算システム108に出力し得る。センサ・データ106は、限定はしないが、3D LiDAR点群など、様々な形態のいずれかであり得る。センサ・データ106は、それに関係する様々な機能を実行するために分析され得、(
図8A~
図8Cに示され、本明細書で説明する様々なセンサなど)他のセンサ・データ106とともに使用され得る。LiDARセンサが使用される実施例では、センサ・データ106はLiDARデータと呼ばれることがある。しかしながら、本開示の他の実施例では、センサ・データ106は(たとえば、RADAR、超音波などからの)別のタイプの深度データであり得る。
【0022】
システム100は、センサ・データ106を異なるフォーマット、(たとえば、3Dから2D又は2.5Dなどへの)基準フレーム、及び/又は(たとえば、点群から投影又は距離画像への)タイプに変換し得る座標変換器110を含み得る。非限定的実例として、座標変換器110は、3D点群を表すLiDARデータを2D距離画像又は他の投影画像タイプに変換し得、深度フロー生成器は、深度フロー画像生成器112を使用して「2.5D」深度フロー画像を生成するために、フレーム間の深度情報を分析し得る。いくつかの実施例では、座標変換器110は、(車両800の既知の又は追跡された動き(たとえば、エゴモーション)に基づいて)1つ又は複数の距離画像を同じ座標系に変換し得、2.5D空間におけるオプティカル・フロー、メッセージ・パッシングなどについての分析の後に、座標変換器110は、得られた2.5D深度フロー画像を3Dシーン・フロー表現に変換し得る。
【0023】
システム100は、センサ・データ106の1つ又は複数のセットを使用して深度フロー画像を作成し得る深度フロー生成器116をさらに含み得る。
図5に示されているように、1つ又は複数のLiDARセンサを使用してLiDARデータから距離画像が生成され得る。時間T1においてキャプチャされたLiDARデータ502の第1のセットと、時間T2においてキャプチャされたLiDARデータ504の第2のセットとが
図5に示されている。たとえば、LiDARデータのセットは、深度知覚センサ102から延びる球面投影又は他の投影タイプを表し得る。LiDARセンサは、LiDARデータの多数のセットが生成されるように、LiDARデータを連続的に生成し得る。各そのようなセットは、LiDARセンサの単一の掃引、回転、又は他のキャプチャを示し得、LiDARデータのセットは時間間隔によって分離され得る。いくつかの実施例では、本明細書で説明するように、オプティカル・フロー画像又は深度フロー画像を生成するために、深度フロー画像生成器112は、LiDARデータ504の第2の(たとえば、現在の又は直近の)セットを使用し、それをLiDARデータ502の以前のセットと比較して、データから様々な情報を決定し得る。いくつかの実施例では、LiDARデータの2つの連続するセットが分析され得るが、これは限定的なものではなく、LiDARデータの分析されたセットは、連続するフレーム以外の異なる構成に対応し得る。
【0024】
いくつかの実施例では、オプティカル・フロー画像又は深度フロー画像は3D情報の簡略化された「2.5D」レンダリングであり得、画素(たとえば、各画素)は、座標(たとえば、たとえばそれぞれ方位及び高度を示す(x、y)座標)と、深度及び/又は深度フローなど、1つ又は複数の関連付けられた変数とを有する。3D表現を2D又は2.5D表現に縮小することによって、計算時間及び実行時間が短縮され得る。
【0025】
いくつかの実施例では、深度フロー画像生成器112は、時間T1において1つ又は複数のLiDARセンサを使用して生成された第1のLiDARデータに少なくとも部分的に基づいて、第1の距離画像を生成し得る。第1の距離画像は、画像の画素が、たとえば、フレームにわたる深度値の変化を示す、深度フロー値を含むように生成され得る。同様に、深度フロー画像生成器112は、T1の後の時間T2において1つ又は複数のLiDARセンサを使用して生成された第2のLiDARデータに少なくとも部分的に基づいて、第2の距離画像を生成し得る。第1の距離画像及び第2の距離画像は、その場合、本明細書で説明するなど、記憶、分析、及び/又は互いに(並びに第3の深度フロー画像、第4の深度フロー画像などと)比較され得る。
【0026】
本開示の実施例では、距離画像は、1つ又は複数のLiDAR点群を表すデータを使用して生成されたLiDAR距離画像を使用して生成され得る。LiDAR点群は、本明細書で説明するように、LiDARセンサ(及び/又はLiDARコントローラ)によって出力された生データに対応し得る。LiDARデータは、限定はしないが、反射率情報、テクスチャ情報、飛行時間(ToF)情報、色情報、及び/又は強度情報など、送信された信号と受信された信号とに関連付けられた様々な変数の任意の組合せを表し得る。
【0027】
(たとえば、3D点群を表す)複雑な3D LiDARデータは、2D LiDAR距離画像(又は他の投影画像タイプ)に簡略化され得、また、高速な分析を可能にする2.5D深度フロー画像を生成するために、(深度フローなど)追加の情報を用いて符号化され得る。いくつかの実施例では、深度フロー画像はまた、特に、(ハイウェイ速度で動作している自律型車両上の深度知覚センサ102について生じているであろうなど)フレーム間でより大きい動きが生じている場合、オプティカル・フロー情報をより迅速に識別するのを助けるために、ピラミッド手法又はマルチスケール手法を使用して、解像度が低減され得る。深度フロー画像は画素のセットを含み得、各画素は2D座標と深度フローとのセットをもつ。深度フローは、実施例では、画素上のラベルとして記憶され得る。
【0028】
簡略化された深度フロー表現は、より複雑な3D LiDAR点群データの代わりにシーン・フローのための処理において使用され得る。計算を簡略化することにより、本明細書で説明する分析をリアルタイムで実行することが可能になり得、結果は、正確な3Dシーン・フロー情報がより少ない計算時間及び処理時間で生成されるように、3D空間に逆投影され得る。
【0029】
システム100は、
図2に示されているなど、1つ又は複数の特性をもつ画素を識別するか、又は割り当て得る信念プロパゲータ(belief propagator)114を含み得る。たとえば、信念プロパゲータ114は、
図3に示されているように、深度フロー画像の画素(たとえば、行列、グラフ、表など、画素の表現の画素ノード)間でメッセージをパスして、その中で情報を精緻化し、分析し得る。いくつかの実施例では、
図4に示されているように、コストが画素に割り当てられ得る。
【0030】
したがって、本開示の実施例は、信念伝搬アルゴリズムを使用して、深度フロー画像の隣接する画素(たとえば、画素ノード)間でメッセージをパスし得る。一般に、信念伝搬は、グラフィカル・モデルから情報を推論するためのメッセージ・パッシング・アルゴリズムを含み得る。信念伝搬は、場合によっては厳密であり得るが、信念伝搬は、しばしば、近似のために使用される。たとえば、LiDARデータの正確な情報は深度フロー画像に簡略化され、メッセージ・パッシングは近隣する画素の値を近似し、近似された値は、生成されたLiDARデータの座標空間に戻される。簡略化、メッセージ・パッシング、及び戻りは、障害物の検出、識別、及び/又は追跡における明確性(definiteness)を十分に高めることを可能にしながら、フル3Dにおける完全な分析を行うよりも迅速に実行され得る。
【0031】
信念伝搬アルゴリズムが隣接する画素(たとえば、画素表現の画素ノード)間でメッセージをパスするのを助けるために、隣接する画素に関連があり得る情報を含む画素にラベルが関連付けられ得る。本明細書で使用する「画素」は、深度フロー画像の任意の細分を指し得、深度フロー画像の表現(たとえば、行列、表、グラフなど)における画素又はそれの細分を表すノードに対応し得ることを諒解されたい。個々の画素の解像度は、より高速な処理を可能にするために低減され得る。同様に、画素のグループが一緒にグループ化され得、たとえば、メッセージが、実施例では、画素から画素にではなく隣接する画素のグループ間でパスされ得る。
【0032】
図2を参照すると、
図2は、画素に関連付けられ得る例示的なラベルを示す。たとえば、信念伝搬ラベルは2.5D矩形ブロックに対応し得る。図示されているラベルは画像変位及び深度フローを表し得、ラベル体積は、(たとえば、深度知覚センサ102に向かう及びそこから離れる)Z方向における動きに対応し得る。
【0033】
いくつかの実施例では、深度フローは、センサに向かう動きと、センサから離れる動きと、向かう又は離れる動きがないこと(たとえば、静止)とを示すラベルのセットに簡略化され得る。たとえば、これらの深度フロー値(
図2のZ)は、それぞれ-1、+1、及び0として表され得る。いくつかの非限定的な実施例では、これらの簡略化されたデータ・フロー・ラベルは、平衡した3値論理(ternary logic)を使用する3値ラベルとして知られていることがある。いくつかの実施例では、深度フローは、センサに向かう速い動きと、センサに向かう遅い動きと、センサに対して動きがないことと、センサから離れる遅い動きと、センサから離れる速い動きとを示す、ラベルの簡略化されたセットであり得る。たとえば、深度フロー値は、それぞれ-2、-1、0、+1、及び+2として表され得る(図示されていない)。しかしながら、これらのラベルは例示的な目的のためのものにすぎず、他の実施例では、フレーム間の深度フロー又は深度の変化を表すために異なるラベル・タイプが使用され得る。
【0034】
図3を参照すると、
図3は、画素に関連付けられ得る別のラベル・タイプを示す。たとえば、
図3は、深度フロー・データ項についてのコスト関数の計算を示す例示的なグラフを示す。
図3のグラフのx軸は、その画素について検出された深度の差に対応し、
図3のグラフのy軸は、関連するコストに対応する。第1の実例として、深度差が0.0であり、深度フロー値が0である場合、0のコストが割り当てられ、対応する物理的物体が移動しておらず、2つの隣接する画素が同じ距離にある場合、コストは極めて低くなることが示される。第2の実例として、深度差が(
図3上の最初の目盛り(tick mark)において)0.125である場合、最低コストの深度フロー・ラベルはZ=1に関連付けられ、2番目に低いコストはZ=0に関連付けられ、最高コストはZ=-1に関連付けられる。コストは、その画素についての適切な深度フロー値と、その画素についての対応する深度フローとにおけるy値として選択される。グラフ上に示されているy値、並びに対応するプロットの傾きは例示的な目的のためのものにすぎず、実際のコスト値及び深度ラベル関数は、任意の数の要因に基づいて変動し得ることを諒解されたい。
【0035】
ラベルが割り当てられると、画素は、
図4に示されているように、信念伝搬アルゴリズムを介してそれら自体の間でメッセージをパスし得、たとえば、画素に対応するノードは、隣接する又は近隣する画素に対応する隣接するノードにメッセージをパスし得る。たとえば、信念プロパゲータ114は、画素のそれぞれの深度フロー値と画素のそれぞれのコストとを少なくとも部分的に示す画素の第2のセットの画素間で1つ又は複数のメッセージをパスし得る。いくつかの実施例では、1つ又は複数のメッセージは、信念伝搬アルゴリズムを使用してパスされる。一般に、本明細書で説明するラベルを少なくとも部分的に示すメッセージが、隣接する画素に送られ得る。受信されたメッセージは、その場合、分析され得、詳細には、関連するコストをもつ画像変位及び深度フローは、その画素についての対応する値と比較され得る。次いで、ラベルの値をさらに精緻化するために、精緻化された値とともに新しいメッセージが送られ、分析され得る。ある閾値を過ぎた後に、メッセージ及び分析の反復は終了し得る。いくつかの実例では、閾値は、一定数の反復、一定の時間間隔の経過、一定の閾値信頼レベルを達成すること、プロセッサ及び/又はメモリ容量に関連付けられた閾値、及び/又は別の閾値であり得る。
【0036】
信念伝搬アルゴリズムの使用は様々な制約を満たし得る。たとえば、信念伝搬アルゴリズムは、どの隣接画素が同じ物理的物体(たとえば、データ項)に対応するかを識別し得、信念伝搬アルゴリズムは、同じ物理的物体に対応する隣接画素が最初に同様の合成値(たとえば、平滑度項)を有するように、隣接する値を「平滑化」し得る。したがって、信念伝搬アルゴリズムは、データ項によって、どの隣接する画素が同じ物理的物体に対応するかを決定し得、平滑度項によって、その物理的物体に関連付けられた画素についての近似値を決定し得る。同じオプティカル・フロー画像又は深度フロー画像にわたるメッセージ・パッシング及び分析の複数の反復によって、物理的物体の決定と、それらの動きの近似値とが決定され得る。多数の連続する深度フロー画像にわたる複数の反復によって、(前に遮蔽されたか、又は深度知覚センサ102の範囲に入る物理的物体など)新しい物理的物体が識別され得、前に識別された物理的物体の(方向又は速度の変化などの)変化が決定され、追跡され得る。
【0037】
いくつかの実施例では、メッセージは、同じ深度フロー画像の画素(たとえば、画素に対応するノード)間で送られ、データ項と平滑度項とに関する情報を搬送し得る。いくつかの実施例では、データ項は、反復の第1のセット中に決定され得、平滑度項は、同じ深度フロー画像の後続の反復中に決定され得る。他の実施例では、データ項と平滑度項とは同時に決定され得る。詳細には、メッセージは、(画像間の正しい画素を識別するための中への及び外への一般的な方向を識別するのを助けるための)深度フロー情報、及び/又は(画素がそれらの近隣にどのくらい影響を及ぼすべきであるかを識別するのを助けるための)コストを含み得る。
【0038】
メッセージ・パッシングの実例が
図4に示されている。例示的な対象画素「X」が
図4の中心に示されている。対象画素は水平方向及び垂直方向における近隣画素に隣接している。いくつかの実施例では、対象画素はまた、水平方向又は他の指定(図示されていない)における近隣画素に隣接し得る。
図4では、垂直方向における近隣画素はv+(対象画素の垂直方向上方)及びv-(対象画素の垂直方向下方)としてラベル付けされている。水平方向における近隣画素はh+(対象画素の水平方向右側)及びh-(対象画素の水平方向左側)としてラベル付けされている。深度フロー画像中の任意の画素が、対応する近隣画素とともに対象画素として指定され得ることを諒解されたい。たとえば、
図4の画素h+は、画素「x」として水平近隣画素、並びにさらに右側の別の画素(
図4に示されていない)を有するであろう対象画素として指定され得る。さらに、画素と呼ぶが、メッセージ・パッシングは、グラフ、行列、表、若しくは画像の他の表現における画素のノード又は他の表現間にあり得る。
【0039】
それぞれの画素間でメッセージがパスされ得る。たとえば、対象画素は、それの近隣画素にメッセージを送り得、メッセージは、それぞれ、少なくとも1つのラベル、又はそれの部分を含み得る。メッセージは、実施例では、それぞれの画素に関連付けられた1つ又は複数のラベルに関する情報の簡単なパケットに対応し得る。本明細書で説明するように、情報を近隣画素と共有することによって、データの様々な態様が決定され得る。
【0040】
発信メッセージは、
図4の場合のように、小文字のラムダと、発信メッセージの発信元である画素の下付き文字とでラベル付けされ得、メッセージの受信側は丸括弧中に追加されている(この慣習は、純粋に、例示的な目的のためのものである)。たとえば、対象画素xからそれの垂直方向上方近隣への発信メッセージはλ
x(v+)として指定され得る。対象画素は、したがって、λ
x(v+)、λ
x(v-)、λ
x(h+)、及びλ
x(h-)という4つの発信メッセージを作成し、送り得る。本明細書で説明するように、本開示の実施例では、(対角方向に隣接する画素へのメッセージなど)他のメッセージも送られ得る。発信メッセージは、対象画素に関連付けられた1つ又は複数の現在のラベルについての情報を与え得る。いくつかの実例では、対象画素に関連付けられた1つ又は複数のラベルはすべて同等であるので、対象画素(たとえば、対象画素に対応するノード)から各隣接画素(たとえば、隣接画素に対応するノード)への発信メッセージは同様又は同等であり得る。他の実施例では、少なくとも1つの発信メッセージのコンテンツは、近隣画素の1つ又は複数の特性に基づいて選択され得る。
【0041】
着信メッセージは、
図4では、小文字のパイと、着信メッセージの着信先である画素の下付き文字とでラベル付けされ、メッセージの送信側は丸括弧中に追加されている(この慣習は、純粋に、例示的な目的のためのものである)。たとえば、対象画素xへのそれの水平方向右側近隣からの着信メッセージはπ
x(h+)として指定され得る。対象画素は、したがって、π
x(h+)、π
x(h-)、π
x(v+)、及びπ
x(v-)という4つの着信メッセージを受信する。本明細書で説明するように、本開示の実施例では、(対角方向に隣接する画素からのメッセージなど)他のメッセージも受信され得る。着信メッセージは、近隣画素に関連付けられた1つ又は複数の現在のラベルについての情報を与える。いくつかの実施例では、近隣画素に関連付けられた1つ又は複数のラベルは独立しているので、発信メッセージのうちの1つ又は複数のコンテンツは別個である。
【0042】
また、関与する画素の視点に基づいて、単一のメッセージが異なって指定され得ることを諒解されたい。たとえば、発信メッセージλx(v+)はまた、画素v+の視点からの着信メッセージである。同様に、着信メッセージπx(h+)はまた、画素h+の視点からの発信メッセージである。着信メッセージπx(h+)はまた、画素h+によってそれの近隣画素に送られる他のメッセージと同様又は同等であり得る。
【0043】
本明細書で説明するように、データ項は、どの隣接画素が同じ物理的物体に対応するかを識別し、平滑度項は、同じ物理的物体に対応する隣接画素が最初に同様の合成値を有するように、隣接する値を調整する。実施例では、信念プロパゲータ114は、1つ又は複数のメッセージに基づいて、第2の距離画像中の画素の第2のセットのうちの1つ又は複数に対応する、第1の距離画像中の画素の第1のセットのうちの1つ又は複数を示す1つ又は複数のデータ項を計算し得る。物理的物体及び/又は深度センサは画像間で移動しているので、データ項は使用され得る。深度フロー、反射率、色値、強度、飛行時間(ToF)、テクスチャ、戻り挙動、及び/又は(LiDARデータによって表される情報、又はLiDAR距離画像中に表される情報など)他の情報などの変数がデータ項において分析され得る。実例では、これらの変数のうちの1つ又は複数について、物理的物体が比較的一定であり得る。たとえば、物理的物体は単一のユニットとして移動するので、物理的物体は同様の深度フローで移動し得る。別の実例として、反射率は物理的物体に基づいて変動し得る(たとえば、塗装された車両は歩行者よりも高い反射率値を有し得る)。
【0044】
実施例では、信念プロパゲータ114は、1つ又は複数のメッセージに少なくとも部分的に基づいて、深度フロー画像中の画素のセットについての修正された深度フロー値を示す1つ又は複数の平滑度項を計算する。平滑度項は、深度フローについてのどの値が、同じ物理的物体に対応する画素についてほぼ正しいかを識別し得る。一般に、空間中で移動している物理的物体は単一のユニットとして移動する。したがって、いくつかの画素の不完全で不正確なデータは、この情報を考慮するために近隣画素によって調整され、影響され得る。たとえば、各画素中のデータがどのくらい信頼できるかに基づいて、各画素にコストが割り当てられる。不完全なデータをもつ(たとえば、LiDARセンサへの戻りがない)画素の場合、不完全なデータが、信念伝搬アルゴリズムによってそれらの近隣画素によって影響される可能性が高くなるように、低いコストが割り当てられ得る。これにより、元のLiDAR走査からデータが消失しているにもかかわらず、密な動き場を作成することが可能になる。
【0045】
いくつかの実施例では、信念プロパゲータ114は、異種物理的物体に対応する境界にわたるメッセージのパッシングを防止し得る。任意の2つの隣接する画素が同じ物体に対応するかどうかは、2つのそれぞれの画素に関連付けられた相対深度及び/又は深度フローを比較することによって計算され得る。物理的環境中の同じ物理的物体に対応しないことが計算された隣接する画素は、(2つの画素間の深度又は反射率の検出された差がある閾値を超えるのでなど)互いの間でメッセージをパスしないことがある(たとえば、行列、表、グラフなど、画像の表現中の画素に対応するノード間でメッセージがパスされないことがある)。これは、これらの画素は、それらが異なる物理的物体に対応するので、それらの近隣画素に影響を及ぼすべきでないからである。したがって、これらの近隣画素間の視差は信念伝搬アルゴリズムによって影響されないことがある。
【0046】
いくつかの実施例では、信念プロパゲータ114は、第2のLiDARデータからの深度データに少なくとも部分的に基づいて、対象画素が、近隣画素に対応する近隣物体とは別個である対象物体に対応することを決定し得る。この決定に基づいて、対象画素と近隣画素との間のメッセージのパッシングが停止されるか、又は防止され得る。たとえば、メッセージのパッシングを防止することは、関与する画素が同じ物理的物体に対応するかどうかを(メッセージを送る前に)決定することによって実行され得る。他の実施例では、メッセージのパッシングを防止することは、決定がプロセスの後続の反復中に再び実行される必要がないように、同じ物体に対応する画素の周りに仮想バリアを配置することによって行われ得る。さらに他の実施例では、メッセージのパッシングを防止することは、物理的物体を示す少なくとも1つの画素に(物体参照番号又は他のインジケータなど)ラベルを追加することによって実行され得る。この実施例では、対象画素がそれに対応する同じ物体にラベルが対応しない場合、メッセージはパスされるが、受信されたメッセージは無視され得る。
【0047】
システム100は、シーン・フローを生成するために、たとえば、座標変換器110を使用して、2.5Dオプティカル・フロー情報又は深度フロー情報を(たとえば、メッセージ・パッシングの後に)3D空間に逆変換し得るシーン・フロー生成器116を含み得る。たとえば、同じ深度フロー画像の画素(たとえば、深度フロー画像の表現中の画素に対応するノード)間のこれらのメッセージのパッシング及び分析によって、各画素における様々なデータの精度が、精緻化された2D動きベクトルに対して改善される。精緻化された2D動きベクトルは、対象画素に対応する物理的物体についてのオプティカル・フロー変化及び/又は深度フロー変化を示し得る。他の画素についての消失した又は不完全なデータも、精緻化された2D動きベクトルに少なくとも部分的に基づいて推定され、精緻化され得る。
【0048】
シーン・フロー生成器116は、1つ又は複数のデータ項と1つ又は複数の平滑度項とに少なくとも部分的に基づいて、画素の第2のセットに対応する1つ又は複数の動きベクトルを計算し得、1つ又は複数の動きベクトルは、第1の距離画像と第2の距離画像との間の相対画素位置を表し得る。相対画素位置は、環境中の深度知覚センサ102の近傍における物理的物体の動きを示し得る。
【0049】
本開示の実施例では、シーン・フロー生成器116は、2D又は2.5D空間において1つ又は複数の動きベクトルを計算又は算出し、次いで、1つ又は複数の3D動きベクトルを生成するために1つ又は複数の動きベクトルを3D空間に変換し得る。実施例では、プロセッサは、2Dベクトルにおける情報と、その2Dベクトルについての対応するLiDARデータとに少なくとも部分的に基づいて、決定された2D動きベクトルを3D空間に変換する。深度情報を含むので2.5D動きベクトルと呼ばれることもある、2Dベクトルは、2D画像空間と3D世界空間位置との間の既知の対応を使用して(たとえば、内因性及び/又は外因性センサ・パラメータを使用して)3D空間に逆変換され得る。したがって、LiDAR点群中の点についての3D動きベクトルが計算され得、3D動きベクトルは、たとえば、LiDARデータのフレームにわたる物理的物体の変位を示す、点群の3D点の変位についての様々な情報を表す。このようにして、メッセージ・パッシング信念伝搬アルゴリズムにより、この複雑な分析を簡略化し、完了し、その後、3D空間に戻し、次いで、3Dシーン・フロー情報を生成するために3D空間に変換することが可能になる。
【0050】
したがって、シーン・フロー生成器116は、第1の距離画像と第2の距離画像との間のシーン・フローを表す1つ又は複数の3D動きベクトルに少なくとも部分的に基づいて、シーン・フローを生成し得る。シーン・フローは、車両800の環境内、たとえば、深度知覚センサ102の視野又は感覚野内の様々な物理的物体を検出、識別、及び/又は追跡するために使用され得る。
【0051】
図6A~
図6Bを参照すると、対応する距離画像604とともに、例示的なシーン・フロー602が提示されている。たとえば、
図6Aは、第1の方位からの例示的なシーン・フロー602を示し、
図6Bは、第2の方位からの(たとえば、及びズーム・インされた)
図6Aからの例示的なシーン・フロー602を示す。例示的なシーン・フロー602は、検出された物体606と、検出された物体の対応する動きの表示とを示す。たとえば、シーン・フロー602は、過疎であり、(
図6A又は
図6Bには示されていないが)深度知覚センサ102の位置、並びにそこから延びる半径に対応する、中央領域608を含む。中央領域608の縁部には、このエリアについての情報が利用可能であるが、障害物が検出されないことを示し得る、一連の同心円610がある。障害物606が検出された場合、同心円610中に障害物があり得、(深度知覚センサ102の視点から)障害物606の後ろに(空白の空間によって示された)遮蔽された領域612があり得る。障害物及び/又は知覚センサが互いに対して移動し、それにより遮蔽を除去するので、プロセスの追加の反復中に、遮蔽された物体が見えるようになり得る。
【0052】
図1Aを参照すると、システム100は、深度知覚センサ102を取り巻く物理的環境中の障害物を決定するためにシーン・フロー中の情報を分析し得る、車両コントローラ118を含み得る。車両コントローラ118は、その場合、ブレーキを作動させること、又は車両を方向転換させることなど、決定された障害物に基づいて1つ又は複数の車両動作を命令し得る。たとえば、車両コントローラ118は、知覚層、世界モデル管理層、計画層、制御層、作動層、障害物回避層、及び/又は1つ又は複数の他の層を含み得る、自律運転ソフトウェア・スタックを実行し得る。
【0053】
次に
図1Bを参照すると、
図1Bは、時間間隔にわたるシステム100の例示的な実施例を示す時間流れ図を示す。たとえば、
図1Bに示されているように、システム100の動作中に時間T1において、LiDARデータ150が収集される。LiDARデータ150は3D LiDAR点群152に集約され、3D LiDAR点群は、距離画像を生成するために投影される。例示的な距離画像が
図5に示されている。(時間T1の後の)時間T2において、LiDARデータ150は再び収集され、第2の3D LiDAR点群152に集約され、LiDAR点群は、距離画像を生成するために投影され、1つ又は複数の距離画像は、第2の2.5D深度フロー画像154を生成するために使用される。この2.5D深度フロー画像154中で、様々な画素(たとえば、画素に対応するノード)は、メッセージ・パッシング・アルゴリズム156を介して画素間でメッセージをパスし得る。メッセージが第1の反復中にパスされたとき、深度フローの値(場合によっては他のラベル及び値)は、精緻化された値158を生成するために精緻化され、距離画像と比較され得る。一定数の反復の後に、2.5D深度フロー画像160及び3Dシーン・フロー162が生成され得る。経時的に3Dシーン・フローをさらに精緻化するために、時間T3(図示されていない)において収集されたLiDARデータがさらに処理され、時間T2からのデータと比較される。
【0054】
ここで
図7を参照すると、本明細書に記載される、方法700の各ブロックは、ハードウェア、ファームウェア、及び/又はソフトウェアの任意の組合せを使用して実行され得る計算プロセスを含む。たとえば、様々な機能が、メモリに記憶された命令を実行するプロセッサによって実施され得る。方法700はまた、コンピュータ記憶媒体に記憶されたコンピュータ使用可能命令として実施され得る。方法700は、いくつか例を挙げると、独立型アプリケーション、サービス若しくはホスト型サービス(独立型の若しくは別のホスト型サービスと組み合わせた)、又は別の製品へのプラグインによって、提供され得る。さらに、実例として、
図1Aのシーン・フロー生成システム100に関して、方法700について説明する。しかしながら、この方法は、本明細書に記載のものを含むがこれらに限定されない、任意の1つのシステム、又は任意の組合せのシステムによって、追加で又は別法として実行され得る。
【0055】
図7は、本開示のいくつかの実施例による、シーン・フローを生成するための方法700を示す流れ図である。方法700は、ブロックB702において、少なくとも第1の距離画像と第2の距離画像とを生成することを含む。たとえば、第1の時間において生成されたLiDARデータの第1のセットに対応する第1の距離画像と、第1の時間の後の第2の時間におけるLiDARデータの第2のセットに対応する第2の距離画像とが生成され得る。距離画像は、深度、強度、ToFなど、様々な情報を符号化し得る。
【0056】
方法700は、ブロックB704において、第1の距離画像と第2の距離画像とを使用して深度フロー画像を生成することを含む。たとえば、経時的な、距離画像中の特定の(たとえば、一致した)画素又は点についての深度の変化を示す、深度フロー値を決定するために、少なくとも、第1の距離画像と第2の距離画像とに対応する深度値が比較され得る。2つの距離画像を比較するために、距離画像の一方が他方の距離画像の座標空間に変換され得、変換は、距離画像を生成するために使用される第1のLiDARデータと第2のLiDARデータとのキャプチャの間の車両800の追跡されたエゴモーションを使用して実行され得る。
【0057】
方法700は、ブロックB706において、深度フロー画像の画素間でメッセージをパスすることを含む。たとえば、深度フロー画像中の値を更新するために、及び/又は消失した若しくは不完全なデータについての消失した情報を埋めるために、画像の表現(たとえば、行列、グラフ、表など)の画素に対応するノード間で信念伝搬アルゴリズムを介してメッセージがパスされ得る。
【0058】
方法700は、ブロックB708において、どの画素がどの物理的物体に対応するかを示すデータ項を計算することを含み、これは第1の深度フロー画像との比較を含み得る。
【0059】
方法700は、ブロックB710において、近隣画素から受信された情報に基づいてラベルの値を調整する平滑度項を計算することを含む。
【0060】
方法700は、ブロックB712において、データ項と平滑度項とに少なくとも部分的に基づいて動きベクトルを計算及び/又は精緻化することを含む。いくつかの実施例では、方法700は、ブロックB706~B712のループの複数の反復を含み得、それの中で、平滑度項は値を調整し、データ項は物体を識別する。
【0061】
ある閾値を過ぎた後に、方法700は、ブロックB714において、動きベクトルに基づいてシーン・フローを生成することを含み得る。たとえば、シーン・フローは、2.5D動きベクトルを3D空間に変換することによって決定された3D動きベクトルから生成され得る。
【0062】
方法700は、ブロックB716において、シーン・フローに少なくとも部分的に基づいて障害物を識別することを含む。たとえば、障害物は、直接又は間接的に自律型車両800に影響を及ぼし得る物理的物体を含み得る。したがって、障害物は、他の車両又は歩行者など、動いていることがあるか、又は建築物及び木など、静止していることがある。障害物は、車両に対する位置と、(加速、回転、又は他の動き指示を含み得る)3D動きベクトルと、(いくつの画素が障害物に対応するかに基づく)相対サイズとを有し得る。いくつかの実施例では、障害物についての情報に少なくとも部分的に基づいて、システム100は、障害物が車両に影響を及ぼす可能性を決定し得、システムは、障害物を回避するように実行されるべき1つ又は複数の是正措置を決定し得る。たとえば、車両コントローラ118は、車両が、障害物を回避するためにブレーキをかけるか、方向転換するか、又は加速するべきであることを決定し得る。障害物が回避され得ない場合、システム100は、損傷を最小限に抑えるか、又は他の安全機能を作動させるなど、1つ又は複数の是正措置が取られるべきであることを決定し得る。
【0063】
方法700は、ブロック718において、識別された1つ又は複数の是正措置を取ることによって、識別された障害物を回避するように車両を制御することを含む。車両を制御することは、
図8A~
図8Dに関して説明する車両システムなど、多数の車両システムのいずれかにコマンドを送ることを含み得る。
【0064】
(例示的自律型車両)
図8Aは、本開示のいくつかの実施例による、例示的自律型車両800の図である。自律型車両800(或いは、本明細書で「車両800」と称される)は、旅客車両、たとえば、乗用車、トラック、バス、ファースト・レスポンダ車両、シャトル、電気又は原動機付自転車、オートバイ、消防車、警察車両、救急車、ボート、建設車両、潜水艦、ドローン、トレーラに連結された車両、及び/又は別のタイプの車両(たとえば、無人の及び/又は1人若しくは複数の乗客を乗せた)を含み得るが、これらに限定されない。自律型車両は、一般に、米国運輸省道路交通安全局(NHTSA:National Highway Traffic Safety Administration)、米国運輸省の部署、及び自動車技術者協会(SAE:Society of Automotive Engineers)「Taxonomy and Definitions for Terms Related to Driving Automation Systems for On-Road Motor Vehicle」(2018年6月15日に公開された規格番号J3016-201806、2016年9月30日に公開された規格番号J3016-201609、及びこの規格の前の及び未来のバージョン)によって定義される、自動化レベルに関して記述される。移動車800は、自律運転レベルのレベル3~レベル5のうちの1つ又は複数による機能の能力を有し得る。たとえば、車両800は、実施例に応じて、条件的自動化(レベル3)、高い自動化(レベル4)、及び/又は完全な自動化(レベル5)の能力を有し得る。
【0065】
移動車800は、移動車のシャシ、車体、車輪(たとえば、2、4、6、8、18など)、タイヤ、車軸、及び他の構成要素などの構成要素を含み得る。移動車800は、内部燃焼エンジン、ハイブリッド動力装置、完全な電気式エンジン、及び/又は別の推進システム・タイプなど、推進システム850を含み得る。推進システム850は、移動車800の推進力を有効にするために、トランスミッションを含み得る、移動車800のドライブ・トレインに接続され得る。推進システム850は、スロットル/加速装置852からの信号の受信に応答して制御され得る。
【0066】
ハンドルを含み得る、ステアリング・システム854は、推進システム850が動作しているときに(たとえば、移動車が移動中のときに)移動車800のかじを取る(たとえば、所望の進路又はルートに沿って)ために使用され得る。ステアリング・システム854は、ステアリング・アクチュエータ856から信号を受信することができる。ハンドルは、完全自動化(レベル5)機能のオプションでもよい。
【0067】
ブレーキ・センサ・システム846は、ブレーキ・アクチュエータ848及び/又はブレーキ・センサからの信号の受信に応答して移動車ブレーキを動作させるために使用され得る。
【0068】
1つ又は複数のシステム・オン・チップ(SoC:system on chip)804(
図8C)及び/又はGPUを含み得る、コントローラ836は、移動車800の1つ若しくは複数の構成要素及び/又はシステムに信号(たとえば、コマンドの表現)を提供することができる。たとえば、コントローラは、1つ又は複数のブレーキ・アクチュエータ848を介して移動車ブレーキを動作させて、1つ又は複数のステアリング・アクチュエータ856を介してステアリング・システム854を動作させて、1つ又は複数のスロットル/加速装置852を介して推進システム850を動作させるために、信号を送ることができる。コントローラ836は、センサ信号を処理する、並びに律的運転を可能にするために及び/又は運転者の移動車800の運転を支援するために動作コマンド(たとえば、コマンドを表す信号)を出力する、1つ又は複数の搭載された(たとえば、統合された)計算デバイス(たとえば、スーパーコンピュータ)を含み得る。コントローラ836は、自律運転機能のための第1のコントローラ836、機能的安全性機能のための第2のコントローラ836、人工知能機能(たとえば、コンピュータ・ビジョン)のための第3のコントローラ836、インフォテインメント機能のための第4のコントローラ836、緊急状態における冗長性のための第5のコントローラ836、及び/又は他のコントローラを含み得る。いくつかの実例では、単一のコントローラ836が、前述の機能のうちの2個以上を処理することができ、2個以上のコントローラ836が、単一の機能、及び/又はその任意の組合せを処理することができる。
【0069】
コントローラ836は、1つ又は複数のセンサから受信したセンサ・データ(たとえば、センサ入力)に応答して移動車800の1つ若しくは複数の構成要素及び/又はシステムを制御するための信号を提供することができる。センサ・データは、たとえば、そして制限なしに、全地球的航法衛星システム・センサ858(たとえば、グローバル・ポジショニング・システム・センサ)、RADARセンサ860、超音波センサ862、LIDARセンサ864、慣性計測装置(IMU:inertial measurement unit)センサ866(たとえば、加速度計、ジャイロスコープ、磁気コンパス、磁力計など)、マイクロフォン896、ステレオ・カメラ868、ワイドビュー・カメラ870(たとえば、魚眼カメラ)、赤外線カメラ872、サラウンド・カメラ874(たとえば、360度カメラ)、長距離及び/又は中距離カメラ898、スピード・センサ844(たとえば、移動車800のスピードを測定するための)、振動センサ842、ステアリング・センサ840、ブレーキ・センサ(たとえば、ブレーキ・センサ・システム846の一部としての)、及び/又は他のセンサ・タイプから受信され得る。
【0070】
コントローラ836のうちの1つ又は複数のコントローラは、移動車800の計器群832から入力(たとえば、入力データによって表される)を受信し、出力(たとえば、出力データ、表示データなどによって表される)をヒューマン・マシン・インターフェース(HMI:human-machine interface)ディスプレイ834、可聴式アナンシエータ、ラウドスピーカ、及び/又は移動車800の他の構成要素を介して提供することができる。出力は、移動車ベロシティ、スピード、時間、マップ・データ(たとえば、
図8CのHDマップ822)、位置データ(たとえば、マップ上などの、移動車の800の位置)、方向、他の移動車の位置(たとえば、占有グリッド)、コントローラ836によって把握されるものとしての物体及び物体の状況に関する情報などの、情報を含み得る。たとえば、HMIディスプレイ834は、1つ又は複数の物体(たとえば、道路標識、警告標識、交通信号の変化など)の存在、及び/又は移動車が行った、行っている、又は行うであろう運転操作(たとえば、今、車線変更をしていること、3.22km(2マイル)内の出口34Bを出ることなど)に関する情報を表示することができる。
【0071】
移動車800はさらに、1つ若しくは複数のワイヤレス・アンテナ826及び/又はモデムを使用して1つ若しくは複数のネットワークを介して通信することができるネットワーク・インターフェース824を含む。たとえば、ネットワーク・インターフェース824は、LTE、WCDMA(登録商標)、UMTS、GSM、CDMA2000などを介する通信の能力を有し得る。ワイヤレス・アンテナ826はまた、ブルートゥース(登録商標)、ブルートゥース(登録商標)LE、Z-Wave、ZigBeeなどのローカル・エリア・ネットワーク、及び/又はLoRaWAN、SigFoxなどのロー・パワー・ワイドエリア・ネットワーク(LPWAN:low power wide-area network)を使用し、環境内の物体(たとえば、移動車、モバイル・デバイスなど)の間の通信を可能にすることができる。
【0072】
図8Bは、本開示のいくつかの実施例による、
図8Aの例示的自律型車両800のカメラ位置及び視野の実例である。カメラ及びそれぞれの視野は、1つの例示的実施例であり、制限することは意図されていない。たとえば、追加の及び/又は代替カメラが含まれ得る、及び/又はカメラは移動車800の異なる位置に置かれ得る。
【0073】
カメラのカメラ・タイプは、移動車800の構成要素及び/又はシステムと使用するようになされ得るデジタル・カメラを含み得るが、これに限定されない。カメラは、自動車安全整合性レベル(ASIL:automotive safety integrity level)Bにおいて及び/又は別のASILにおいて動作することができる。カメラ・タイプは、実施例に応じて、60フレーム/秒(fps)、120fps、240fpsなど、任意の画像キャプチャ・レートの能力を有し得る。カメラは、ロール・シャッタ、グローバル・シャッタ、別のタイプのシャッタ、又はその組合せを使用する能力を有し得る。いくつかの実例では、カラー・フィルタ・アレイは、RCCC(red clear clear clear)カラー・フィルタ・アレイ、RCCB(red clear clear blue)カラー・フィルタ・アレイ、RBGC(red blue green clear)カラー・フィルタ・アレイ、Foveon X3カラー・フィルタ・アレイ、Bayerセンサ(RGGB)カラー・フィルタ・アレイ、モノクロ・センサ・カラー・フィルタ・アレイ、及び/又は別のタイプのカラー・フィルタ・アレイを含み得る。一部の実施例では、RCCC、RCCB、及び/又はRBGCカラー・フィルタ・アレイを有するカメラなどのクリア画素カメラは、光感度を上げるための取り組みにおいて使用され得る。
【0074】
いくつかの実例では、カメラのうちの1つ又は複数が、高度運転者支援システム(ADAS:advanced driver assistance system)機能(たとえば、冗長又はフェイルセーフ設計の一部として)を実行するために使用され得る。たとえば、多機能モノ・カメラは、車線逸脱警報、交通標識アシスト及びインテリジェント・ヘッドランプ制御を含む機能を提供するために設置され得る。カメラのうちの1つ又は複数(たとえば、すべてのカメラ)が、画像データ(たとえば、ビデオ)を同時に記録及び提供することができる。
【0075】
カメラのうちの1つ又は複数は、カメラの画像データ・キャプチャ能力を妨げることがある自動車内からの迷光及び反射(たとえば、フロントガラスのミラーにおいて反射されたダッシュボードからの反射)を取り除くために、カスタム設計された(3D印刷された)部品などの取付部品において取り付けられ得る。サイドミラー取付部品を参照すると、サイドミラー部品は、カメラ取付板がサイドミラーの形状に合うように、カスタム3D印刷され得る。いくつかの実例では、カメラは、サイドミラー内に統合され得る。サイドビュー・カメラについては、カメラはまた、キャビンの各角にある4個の支柱内に統合され得る。
【0076】
移動車800の前の環境の部分を含む視野を有するカメラ(たとえば、前向きのカメラ)は、前向きの進路及び障害物の識別を助け、1つ若しくは複数のコントローラ836及び/又は制御SoCの助けにより、占有グリッドの生成及び/又は好ましい移動車進路の決定に不可欠な情報の提供の提供を助けるための、サラウンド・ビューのために使用され得る。前向きのカメラは、緊急ブレーキ、歩行者検出、及び衝突回避を含む、LIDARと同じADAS機能の多くを実行するために使用され得る。前向きのカメラはまた、車線逸脱警報(LDW:Lane Departure Warning)、自律的クルーズ制御(ACC:Autonomous Cruise Control)、及び/又は交通標識認識などの他の機能を含むADAS機能及びシステムのために使用され得る。
【0077】
様々なカメラが、たとえば、CMOS(complementary metal oxide semiconductor)カラー画像化装置を含む単眼カメラ・プラットフォームを含む、前向きの構成において使用され得る。別の実例は、周辺(たとえば、歩行者、交差する交通又は自転車)からのビューに入る物体を把握するために使用され得るワイドビュー・カメラ870でもよい。
図8Bにはワイドビュー・カメラは1つだけ示されているが、移動車800には任意の数のワイドビュー・カメラ870が存在し得る。加えて、長距離カメラ898(たとえば、ロングビュー・ステレオ・カメラ・ペア)が、特に、ニューラル・ネットワークがまだトレーニングされていない物体について、深度ベースの物体検出のために使用され得る。長距離カメラ898はまた、物体検出及び分類、並びに基本物体追跡のために使用され得る。
【0078】
1つ又は複数のステレオ・カメラ868もまた、前向きの構成に含まれ得る。ステレオ・カメラ868は、単一のチップ上に統合されたCAN又はイーサネット(登録商標)・インターフェースを有するプログラマブル論理(FPGA)及びマルチコア・マイクロプロセッサを提供し得る、拡張可能な処理ユニットを備えた統合された制御ユニットを含み得る。そのようなユニットは、画像内のすべてのポイントの距離推定値を含む、移動車の環境の3Dマップを生成するために使用され得る。代替ステレオ・カメラ868は、2個のカメラ・レンズ(左と右に1つずつ)と、移動車から対象物体までの距離を測定する及び生成された情報(たとえば、メタデータ)を使用して自律的緊急ブレーキ及び車線逸脱警報機能をアクティブにすることができる画像処理チップとを含み得る、コンパクト・ステレオ・ビジョン・センサを含み得る。他のタイプのステレオ・カメラ868が、本明細書に記載のものに加えて、又はそれらの代わりに、使用されてもよい。
【0079】
移動車800の側面に対する環境の部分を含む視野を有するカメラ(たとえば、サイドビュー・カメラ)が、占有グリッドを作成及び更新するために並びに側面衝撃衝突警報を生成するために使用される情報を提供する、サラウンド・ビューのために使用され得る。たとえば、サラウンド・カメラ874(たとえば、
図8Bに示されるような4個のサラウンド・カメラ874)は、移動車800上に位置付けられ得る。サラウンド・カメラ874は、ワイドビュー・カメラ870、魚眼カメラ、360度カメラ、及び/又は同類のものを含み得る。たとえば、4個の魚眼カメラが、移動車の前、後ろ、及び側面に配置され得る。代替配置において、移動車は、3個のサラウンド・カメラ874(たとえば、左、右、及び後部)を使用してもよく、第4のサラウンド・ビュー・カメラとして1つ又は複数の他のカメラ(たとえば、前向きのカメラ)を活用してもよい。
【0080】
移動車800の後ろに対する環境の部分を含む視野を有するカメラ(たとえば、後方確認カメラ)が、駐車支援、サラウンド・ビュー、後部衝突警報、並びに占有グリッドの作成及び更新のために使用され得る。本明細書に記載のように、前向きのカメラ(たとえば、長距離及び/又は中距離カメラ898、ステレオ・カメラ868)、赤外線カメラ872など)としても適したカメラを含むがこれらに限定されない、多種多様なカメラが使用され得る。
【0081】
図8Cは、本開示のいくつかの実施例による、
図8Aの例示的自律型車両800の例示的システム・アーキテクチャのブロック図である。本明細書に記載されているこの及び他の配置は単に実例として説明されていることを理解されたい。他の配置及び要素(たとえば、マシン、インターフェース、機能、順番、機能のグループ分けなど)が、示されたものに加えて又はこれらに代わって使用されてもよく、いくつかの要素はともに除外されてもよい。さらに、本明細書に記載の要素の多くは、個別の又は分散された構成要素として又は他の構成要素と併せて、並びに任意の適切な組合せ及び場所において、実装され得る機能エンティティである。エンティティによって実行されるものとして本明細書に記載された様々な機能は、ハードウェア、ファームウェア、及び/又はソフトウェアによって実施され得る。たとえば、様々な機能が、メモリに記憶された命令を実行するプロセッサによって実施され得る。
【0082】
図8Cの移動車800の構成要素、特徴、及びシステムのそれぞれは、バス802を介して接続されるものとして図示されている。バス802は、コントローラ・エリア・ネットワーク(CAN)データ・インターフェース(或いは、「CANバス」と称される)を含み得る。CANは、ブレーキ、加速度、ブレーキ、ステアリング、フロントガラス・ワイパなどの作動など、移動車800の様々な特徴及び機能の制御を助けるために使用される移動車800内のネットワークでもよい。CANバスは、それぞれが独自の一意の識別子(たとえば、CAN ID)を有する、数ダース又は数百ものノードを有するように構成され得る。CANバスは、ハンドル角度、対地速度、1分間のエンジン回転(RPM:revolutions per minute)、ボタン位置、及び/又は他の移動車状況指標を見つけるために読み取られ得る。CANバスは、ASIL B準拠でもよい。
【0083】
バス802は、CANバスであるものとして本明細書に記載されているが、これは制限することを意図されていない。たとえば、CANバスに加えて、又はこのその代替として、FlexRay及び/又はイーサネット(登録商標)が使用されてもよい。加えて、単一の線が、バス802を表すために使用されているが、これは制限することを意図されていない。たとえば、1つ若しくは複数のCANバス、1つ若しくは複数のFlexRayバス、1つ若しくは複数のイーサネット(登録商標)・バス、及び/又は異なるプロトコルを使用する1つ若しくは複数の他のタイプのバスを含み得る、任意の数のバス802が存在し得る。いくつかの実例では、2個以上のバス802が、異なる機能を実行するために使用され得る、及び/又は冗長性のために使用され得る。たとえば、第1のバス802は衝突回避機能のために使用されてもよく、第2のバス802は作動制御のために使用されてもよい。任意の実例において、各バス802は、移動車800の構成要素のいずれかと通信し得、2個以上のバス802が同じ構成要素と通信し得る。いくつかの実例では、移動車内の各SoC804、各コントローラ836、及び/又は各コンピュータは、同じ入力データ(たとえば、移動車800のセンサからの入力)へのアクセスを有し得、CANバスなどの共通バスに接続され得る。
【0084】
移動車800は、
図8Aに関して本明細書で説明されるものなど、1つ又は複数のコントローラ836を含み得る。コントローラ836は、様々な機能のために使用され得る。コントローラ836は、移動車800の様々な他の構成要素及びシステムのいずれかに連結されてもよく、移動車800、移動車800の人工知能、移動車800のためのインフォテインメント、及び/又は同類のものの制御のために使用され得る。
【0085】
移動車800は、システム・オン・チップ(SoC)804を含み得る。SoC804は、CPU806、GPU808、プロセッサ810、キャッシュ812、加速装置814、データ・ストア816、及び/又は図示されていない他の構成要素及び特徴を含み得る。SoC804は、様々なプラットフォーム及びシステム内の移動車800を制御するために使用され得る。たとえば、SoC804は、1つ又は複数のサーバ(たとえば、
図8Dのサーバ878)からネットワーク・インターフェース824を介してマップのリフレッシュ及び/又は更新を取得することができるHDマップ822を有するシステム(たとえば、移動車800のシステム)において結合され得る。
【0086】
CPU806は、CPUクラスタ又はCPU複合体(或いは、「CCPLEX」とも称される)を含み得る。CPU806は、複数のコア及び/又はL2キャッシュを含み得る。たとえば、一部の実施例では、CPU806は、コヒーレント・マルチプロセッサ構成内の8個のコアを含み得る。一部の実施例では、CPU806は、4個のデュアルコア・クラスタを含むことができ、各クラスタが専用のL2キャッシュ(たとえば、2MBL2キャッシュ)を有する。CPU806(たとえば、CCPLEX)は、CPU806のクラスタの任意の組合せが任意の所与の時間にアクティブになることを可能にする同時クラスタ動作をサポートするように構成され得る。
【0087】
CPU806は、以下の特徴のうちの1つ又は複数を含む電力管理能力を実装することができる:個別ハードウェア・ブロックが、動的電力を節約するためにアイドル状態のときに自動的にクロック・ゲーティングされ得る、各コア・クロックは、WFI/WFE命令の実行により命令をコアがアクティブに実行していないときにゲーティングされ得る、各コアは、独立してパワー・ゲーティングされ得る、各コア・クラスタは、すべてのコアがクロック・ゲーティングされる若しくはパワー・ゲーティングされるときに、独立してクロック・ゲーティングされ得る、及び/又は、各コア・クラスタは、すべてのコアがパワー・ゲーティングされるときに、独立してパワー・ゲーティングされ得る。CPU806は、電力状態を管理するための強化されたアルゴリズムをさらに実装することができ、そこでは、許容される電力状態及び予想されるウェイクアップ時間が指定され、ハードウェア/マイクロ・コードが、コア、クラスタ、及びCCPLEXに入力するための最良の電力状態を決定する。処理コアは、作業がマイクロ・コードにオフロードされたソフトウェアにおける簡略化された電力状態入力シーケンスをサポートすることができる。
【0088】
GPU808は、統合されたGPU(或いは本明細書において「iGPU」と称される)を含み得る。GPU808は、プログラマブルになり得、並行のワークロードに効率的になり得る。一部の実例では、GPU808は、強化されたテンソル命令セットを使用することができる。GPU808は、1つ又は複数のストリーミング・マイクロプロセッサを含み得、そこで、各ストリーミング・マイクロプロセッサは、L1キャッシュ(たとえば、少なくとも96KB記憶容量を有するL1キャッシュ)を含み得、ストリーミング・マイクロプロセッサのうちの2個以上が、キャッシュ(たとえば、512KB記憶容量を有するL2キャッシュ)を共用し得る。一部の実施例では、GPU808は、少なくとも8個のストリーミング・マイクロプロセッサを含み得る。GPU808は、計算アプリケーション・プログラミング・インターフェース(API)を使用することができる。加えて、GPU808は、1つ若しくは複数の並行のコンピューティング・プラットフォーム及び/又はプログラミング・モデル(たとえば、NVIDIAのCUDA)を使用することができる。
【0089】
GPU808は、自動車の及び組み込まれた使用事例における最高のパフォーマンスのために電力最適化され得る。たとえば、GPU808は、FinFET(Fin field-effect transistor)上に製造され得る。しかしながら、これは制限することを意図されておらず、GPU808は、他の半導体製造プロセスを使用し、製造され得る。各ストリーミング・マイクロプロセッサは、複数のブロックに区切られたいくつかの混合精度処理コアを組み込むことができる。限定ではなく、たとえば、64 PF32コア及び32 PF64コアは、4個の処理ブロックに区切られてもよい。そのような実例では、各処理ブロックは、16 FP32コア、8 FP64コア、16 INT32コア、深層学習行列演算のための2個の混合精度NVIDIAテンソル・コア、L0命令キャッシュ、ワープ・スケジューラ、発送ユニット、及び/又は64KBレジスタ・ファイルを割り当てられ得る。加えて、ストリーミング・マイクロプロセッサは、計算及びアドレス指定演算の混合を有するワークロードの効率的な実行を提供するための独立した並行の整数及び浮動小数点データ進路を含み得る。ストリーミング・マイクロプロセッサは、並行スレッドの間のより高い細粒度の同期及び連携を可能にするために、独立したスレッド・スケジューリング能力を含み得る。ストリーミング・マイクロプロセッサは、プログラミングを単純化しつつ性能を向上させるために、結合されたL1データ・キャッシュ及び共用メモリ・ユニットを含み得る。
【0090】
GPU808は、一部の実例では、900GB/秒のピーク・メモリ帯域幅に関して、提供するための高帯域幅メモリ(HBM:high bandwidth memory)及び/又は16GBHBM2メモリ・サブシステムを含み得る。いくつかの実例では、HBMメモリに加えて、又はこれの代わりに、グラフィックス・ダブル・データ・レート・タイプ5同期ランダム・アクセス・メモリ(GDDR5:graphics double data rate type five synchronous random-access memory)などの同期グラフィックス・ランダム・アクセス・メモリ(SGRAM:synchronous graphics random-access memory)が使用され得る。
【0091】
GPU808は、メモリ・ページに最も頻繁にアクセスするプロセッサへのそれらのメモリ・ページのより正確な移動を可能にするためにアクセス・カウンタを含む統一されたメモリ技術を含むことができ、それにより、プロセッサ間で共用される記憶範囲の効率を向上させる。いくつかの実例では、アドレス変換サービス(ATS:address translation service)サポートが、GPU808がCPU806ページ・テーブルに直接アクセスすることを可能にするために使用され得る。そのような実例では、GPU808メモリ管理ユニット(MMU:memory management unit)がミスを経験するとき、アドレス変換要求が、CPU806に送信され得る。応答して、CPU806は、アドレスの仮想対現実マッピングのためのそのページ・テーブルを調べることができ、GPU808に変換を送り返す。そのようなものとして、統一されたメモリ技術は、CPU806とGPU808との両方のメモリの単一統一仮想アドレス空間を可能にすることができ、それによりGPU808へのアプリケーションのGPU808プログラミング及び移植を単純化する。
【0092】
加えて、GPU808は、他のプロセッサのメモリへのGPU808のアクセスの頻度を記録することができるアクセス・カウンタを含み得る。アクセス・カウンタは、メモリ・ページが最も頻繁にそのページにアクセスしているプロセッサの物理メモリに移動されることを確実にするのを助けることができる。
【0093】
SoC804は、本明細書に記載のものを含む任意の数のキャッシュ812を含み得る。たとえば、キャッシュ812は、CPU806とGPU808との両方に利用可能な(たとえば、CPU806とGPU808との両方に接続された)L3キャッシュを含み得る。キャッシュ812は、キャッシュ・コヒーレンス・プロトコル(たとえば、MEI、MESI、MSIなど)を使用することなどによって、線の状態を記録することができるライトバック・キャッシュを含み得る。L3キャッシュは、より小さいキャッシュ・サイズが使用されてもよいが、実施例に応じて、4MB以上を含み得る。
【0094】
SoC804は、車両800の様々なタスク又は動作のいずれか(たとえば、処理DNN)に関して処理を実行する際に活用され得る論理演算ユニット(ALU:arithmetic logic unit)を含み得る。加えて、SoC804は、システム内で数学演算を実行するための浮動小数点演算ユニット(FPU:floating point unit)(又は他のマス・コプロセッサ又は数値演算コプロセッサ・タイプ)を含み得る。たとえば、SoC104は、CPU806及び/又はGPU808内の実行ユニットとして統合された1つ又は複数のFPUを含み得る。
【0095】
SoC804は、1つ又は複数の加速装置814(たとえば、ハードウェア・加速装置、ソフトウェア・加速装置、又はその組合せ)を含み得る。たとえば、SoC804は、最適化されたハードウェア加速装置及び/又は大きなオンチップ・メモリを含み得る、ハードウェア加速クラスタを含み得る。大きなオンチップメモリ(たとえば、4MBのSRAM)は、ハードウェア加速クラスタがニューラル・ネットワーク及び他の演算を加速することを可能にし得る。ハードウェア加速クラスタは、GPU808を補完するために及びGPU808のタスクの一部をオフロードするために(たとえば、他のタスクを実行するためのGPU808のより多くのサイクルを解放するために)使用され得る。一実例として、加速装置814は、加速に適するように十分に安定している対象ワークロード(たとえば、知覚、畳み込みニューラル・ネットワーク(CNN:convolutional neural network)など)のために使用され得る。本明細書では、「CNN」という用語は、領域ベースの又は領域的畳み込みニューラル・ネットワーク(RCNN:regional convolutional neural network)及び高速RCNN(たとえば、物体検出のために使用されるものとしての)を含む、すべてのタイプのCNNを含み得る。
【0096】
加速装置814(たとえば、ハードウェア加速クラスタ)は、深層学習加速装置(DLA:deep learning accelerator)を含み得る。DLAは、深層学習アプリケーション及び推論のために1秒あたり追加の10兆の動作を提供するように構成することができる1つ又は複数のテンソル処理ユニット(TPU:Tensor processing unit)を含み得る。TPUは、画像処理機能(たとえば、CNN、RCNNなどの)を実行するように構成及び最適化された加速装置でもよい。DLAはさらに、特定のセットのニューラル・ネットワーク・タイプ及び浮動小数点演算、並びに推論のために最適化され得る。DLAの設計は、汎用GPUよりも1ミリメートルあたりより多くのパフォーマンスを提供することができ、CPUのパフォーマンスを大きく超える。TPUは、たとえば、特徴と重みとの両方についてINT8、INT16、及びFP16データ・タイプをサポートする、単一インスタンス畳み込み機能、並びにポストプロセッサ機能を含む、いくつかの機能を実行することができる。
【0097】
DLAは、以下を含むがこれらに限定されない、様々な機能のいずれかのために処理済み又は未処理のデータでニューラル・ネットワーク、特にCNN、を迅速に及び効率的に実行することができる:カメラ・センサからのデータを使用する物体識別及び検出のためのCNN、カメラ・センサからのデータを使用する距離推定のためのCNN、マイクロフォンからのデータを使用する緊急車両検出及び識別及び検出のためのCNN、カメラ・センサからのデータを使用する顔認識及び移動車所有者識別のためのCNN、及び/又は、セキュリティ及び/又は安全性関連イベントのためのCNN。
【0098】
DLAは、GPU808の任意の機能を実行することができ、そして、推論加速装置を使用することによって、たとえば、設計者は、任意の機能のためにDLA又はGPU808のいずれかを対象にすることができる。たとえば、設計者は、DLA上のCNN及び浮動小数点演算の処理に重点的に取り組み、他の機能をGPU808及び/又は他の加速装置814に任せることができる。
【0099】
加速装置814(たとえば、ハードウェア加速クラスタ)は、或いはコンピュータ・ビジョン加速装置と本明細書で称され得るプログラマブル・ビジョン加速装置(PVA:programmable vision accelerator)を含み得る。PVAは、高度運転者支援システム(ADAS:advanced driver assistance system)、自律運転、及び/又は拡張現実(AR:augmented reality)及び/又は仮想現実(VR:virtual reality)アプリケーションのためのコンピュータ・ビジョン・アルゴリズムを加速するように設計及び構成され得る。PVAは、パフォーマンスと柔軟性との間のバランスをもたらすことができる。たとえば、各PVAは、たとえば、任意の数の縮小命令セット・コンピュータ(RISC:reduced instruction set computer)コア、直接メモリ・アクセス(DMA:direct memory access)、及び/又は任意の数のベクトル・プロセッサを含み得るが、これらに限定されない。
【0100】
RISCコアは、画像センサ(たとえば、本明細書に記載のカメラのうちのいずれかのカメラの画像センサ)、画像信号プロセッサ、及び/又は同類のものと相互作用することができる。それぞれのRISCコアは、任意の量のメモリを含み得る。RISCコアは、実施例に応じて、いくつかのプロトコルのいずれかを使用することができる。いくつかの実例では、RISCコアは、リアルタイム・オペレーティング・システム(RTOS:real-time operating system)を実行することができる。RISCコアは、1つ若しくは複数の集積回路デバイス、特定用途向け集積回路(ASIC)、及び/又はメモリ・デバイスを使用して、実装され得る。たとえば、RISCコアは、命令キャッシュ及び/又はしっかりと結合されたRAMを含み得る。
【0101】
DMAは、CPU806から独立したシステム・メモリにPVAの構成要素がアクセスすることを可能にし得る。DMAは、多次元アドレス指定及び/又は循環アドレス指定をサポートすることを含むがこれに限定されないPVAに最適化をもたらすために使用される任意の数の特徴をサポートすることができる。いくつかの実例では、DMAは、ブロック幅、ブロック高さ、ブロック深度、水平ブロック・ステッピング、垂直ブロック・ステッピング、及び/又は深度ステッピングを含み得る、6次元まで又はそれ以上のアドレス指定をサポートすることができる。
【0102】
ベクトル・プロセッサは、コンピュータ・ビジョン・アルゴリズムのプログラミングを効率的に柔軟に実行する及び信号処理能力を提供するように設計され得るプログラマブル・プロセッサでもよい。いくつかの実例では、PVAは、PVAコア及び2個のベクトル処理サブシステム・パーティションを含み得る。PVAコアは、プロセッサ・サブシステム、DMAエンジン(たとえば、2個のDMAエンジン)、及び/又は他の周辺装置を含み得る。ベクトル処理サブシステムは、PVAの1次的処理エンジンとして動作することができ、ベクトル処理ユニット(VPU:vector processing unit)、命令キャッシュ、及び/又はベクトル・メモリ(たとえば、VMEM)を含み得る。VPUコアは、たとえば、単一の命令、複数のデータ(SIMD)、超長命令語(VLIW:very long instruction word)デジタル信号プロセッサなど、デジタル信号プロセッサを含み得る。SIMD及びVLIWの組合せは、スループット及びスピードを高めることができる。
【0103】
それぞれのベクトル・プロセッサは、命令キャッシュを含み得、専用のメモリに連結され得る。結果として、一部の実例では、それぞれのベクトル・プロセッサは、他のベクトル・プロセッサから独立して実行するように構成され得る。他の実例において、特定のPVAに含まれるベクトル・プロセッサは、データ並列処理を用いるように構成され得る。たとえば、一部の実施例では、単一のPVAに含まれる複数のベクトル・プロセッサは、同じコンピュータ・ビジョン・アルゴリズムを、しかし画像の異なる領域上で、実行することができる。他の実例において、特定のPVAに含まれるベクトル・プロセッサは、異なるコンピュータ・ビジョン・アルゴリズムを、同じ画像上で、同時に実行することができ、或いは順次画像又は画像の部分で異なるアルゴリズムを実行することさえできる。特に、任意の数のPVAは、ハードウェア加速クラスタに含まれ得、任意の数のベクトル・プロセッサは、それぞれのPVAに含まれ得る。加えて、PVAは、全体的システム安全性を高めるために、追加のエラー訂正コード(ECC:error correcting code)メモリを含み得る。
【0104】
加速装置814(たとえば、ハードウェア加速クラスタ)は、加速装置814のための高帯域幅、低レイテンシSRAMを提供するための、コンピュータ・ビジョン・ネットワーク・オンチップ及びSRAMを含み得る。いくつかの実例では、オンチップ・メモリは、たとえば、そして制限ではなく、PVAとDLAとの両方によってアクセス可能でもよい、8個のフィールド構成可能なメモリ・ブロックから成る、少なくとも4MBのSRAMを含み得る。各ペアのメモリ・ブロックは、高度周辺バス(APB:advanced peripheral bus)インターフェース、構成回路、コントローラ、及びマルチプレクサを含み得る。任意のタイプのメモリが、使用され得る。PVA及びDLAは、メモリへの高速アクセスを有するPVA及びDLAを提供するバックボーンを介してメモリにアクセスすることができる。バックボーンは、(たとえば、APBを使用して)PVA及びDLAをメモリに相互接続するコンピュータ・ビジョン・ネットワーク・オンチップを含み得る。
【0105】
コンピュータ・ビジョン・ネットワーク・オンチップは、PVAとDLAとの両方が作動可能及び有効信号を提供することを、任意の制御信号/アドレス/データの送信の前に、決定するインターフェースを含み得る。そのようなインターフェースは、制御信号/アドレス/データを送信するための別個のフェーズ及び別個のチャネル、並びに連続的データ転送のためのバーストタイプの通信を提供することができる。このタイプのインターフェースは、ISO26262又はIEC61508規格に従うことができるが、他の規格及びプロトコルが使用されてもよい。
【0106】
いくつかの実例では、SoC804は、2018年8月10日に出願された米国特許出願第16/101,232号に記載されるような、リアルタイム・レイトレーシング・ハードウェア加速装置を含み得る。リアルタイム・レイトレーシング・ハードウェア加速装置は、RADAR信号解釈のための、音響伝播合成及び/又は分析のための、SONARシステムのシミュレーションのための、一般波伝播シミュレーションのための、ローカリゼーション及び/又は他の機能を目的とするLIDARデータに対する比較のための、及び/又は他の使用のための、リアルタイム視覚化シミュレーションを生成するために、(たとえば、世界モデル内の)物体の位置及び規模を迅速に効率的に決定するために使用され得る。一部の実施例では、1つ又は複数の木の走査ユニット(TTU:tree traversal unit)が、1つ又は複数のレイトレーシング関連動作を実行するために使用され得る。
【0107】
加速装置814(たとえば、ハードウェア加速装置クラスタ)は、自律運転のための多様な用途を有する。PVAは、ADAS及び自律型車両における極めて重要な処理段階に使用され得るプログラマブル・ビジョン加速装置でもよい。PVAの能力は、低電力及び低レイテンシにおいて、予測可能な処理を必要とするアルゴリズムの領域にふさわしい。言い換えれば、PVAは、低レイテンシ及び低電力とともに予測可能な実行時間を必要とする、小さなデータ集合上でも、半高密度の又は高密度の通常の計算で上手く機能する。それ故に、PVAは、物体検出及び整数計算での動作において効率的であるので、自律型車両のためのプラットフォームとの関連で、PVAは、クラシック・コンピュータ・ビジョン・アルゴリズムを実行するように設計される。
【0108】
たとえば、本技術の1つの実施例によれば、PVAは、コンピュータ・ステレオ・ビジョンを実行するために使用される。半グローバルなマッチングベースのアルゴリズムが、一部の実例では使用され得るが、これは制限することを意図されていない。レベル3~5の自律運転のための多数のアプリケーションは、動き推定/ステレオ・マッチング・オンザフライ(たとえば、SFM(structure from motion)、歩行者認識、レーン検出など)を必要とする。PVAは、2個の単眼カメラからの入力でコンピュータ・ステレオ・ビジョン機能を実行することができる。
【0109】
いくつかの実例では、PVAは、高密度のオプティカル・フローを実行するために使用され得る。処理されたRADARを提供するために未加工のRADARデータを処理する(たとえば、4D高速フーリエ変換を使用して)ことによる。他の実例において、PVAは、たとえば、飛行データの未加工の時間を処理して飛行データの処理済み時間を提供することにより、飛行深度処理の時間に使用される。
【0110】
DLAは、たとえば、各物体検出の信頼性の測定値を出力するニューラル・ネットワークを含む、制御及び運転安全性を強化するために任意のタイプのネットワークを実行するために使用され得る。そのような信頼性値は、確率として、又は他の検出と比較した各検出の相対的「重み」を提供するものとして、解釈され得る。この信頼性値は、どの検出が誤判定検出ではなくて真陽性検出と考えられるべきであるかに関するさらなる決定をシステムが行うことを可能にする。たとえば、システムは、信頼性の閾値を設定し、真陽性検出としての閾値を超える検出のみを考慮することができる。自動非常ブレーキ(AEB:automatic emergency braking)システムにおいて、誤判定検出は、移動車に非常ブレーキを自動で実行させることになり、これは明らかに望ましくない。したがって、最も確信のある検出のみが、AEBのトリガとして考えられるべきである。DLAは、信頼性値を退行するニューラル・ネットワークを実行し得る。ニューラル・ネットワークは、境界ボックス次元、(たとえば、別のサブシステムから)取得されたグラウンド・プレーン推定、ニューラル・ネットワーク及び/又は他のセンサ(たとえば、LIDARセンサ864又はRADARセンサ860)から取得された物体の移動車800方位、距離、3D位置推定と相関する慣性計測装置(IMU:inertial measurement unit)センサ866出力、その他など、少なくともいくつかのサブセットのパラメータをその入力として受け取ることができる。
【0111】
SoC804は、データ・ストア816(たとえば、メモリ)を含み得る。データ・ストア816は、SoC804のオンチップ・メモリでもよく、GPU及び/又はDLAで実行されることになるニューラル・ネットワークを記憶することができる。いくつかの実例では、データ・ストア816は、冗長性及び安全性のためにニューラル・ネットワークの複数のインスタンスを記憶するのに十分な大きさの容量を有し得る。データ・ストア812は、L2又はL3キャッシュ812を備え得る。データ・ストア816の参照は、本明細書に記載のような、PVA、DLA、及び/又は他の加速装置814に関連するメモリの参照を含み得る。
【0112】
SoC804は、1つ又は複数のプロセッサ810(たとえば、組み込まれたプロセッサ)を含み得る。プロセッサ810は、ブート電力及び管理能力及び関連するセキュリティ施行を処理するための専用のプロセッサ及びサブシステムでもよいブート及び電力管理プロセッサを含み得る。ブート及び電力管理プロセッサは、SoC804ブート・シーケンスの一部でもよく、実行時間電力管理サービスを提供することができる。ブート電力及び管理プロセッサは、クロック及び電圧プログラミング、システム低電力状態移行の支援、SoC804熱及び温度センサの管理、及び/又はSoC804電力状態の管理を提供することができる。各温度センサは、その出力頻度が温度に比例するリング発振器として実装されてもよく、SoC804は、リング発振器を使用してCPU806、GPU808、及び/又は加速装置814の温度を検出することができる。温度が、閾値を超えたと判定された場合、ブート及び電力管理プロセッサは、温度障害ルーティンに入り、SoC804をより低い電力状態に置く及び/又は移動車800をショーファーの安全停止モードにする(たとえば、移動車800を安全停止させる)ことができる。
【0113】
プロセッサ810は、オーディオ処理エンジンの機能を果たし得る1セットの組み込まれたプロセッサをさらに含み得る。オーディオ処理エンジンは、複数のインターフェースを介するマルチチャネル・オーディオの完全なハードウェア・サポートとオーディオI/Oインターフェースの広く柔軟な範囲とを可能にするオーディオ・サブシステムでもよい。いくつかの実例では、オーディオ処理エンジンは、専用のRAMを有するデジタル信号プロセッサを有する専用のプロセッサ・コアである。
【0114】
プロセッサ810は、低電力センサ管理及びウェイク使用事例をサポートするための必要なハードウェア特徴を提供することができる常時オンのプロセッサ・エンジンをさらに含み得る。常時オンのプロセッサ・エンジンは、プロセッサ・コア、しっかりと結合されたRAM、支援周辺装置(たとえば、タイマ及び割り込みコントローラ)、様々なI/Oコントローラ周辺装置、及びルーティング論理を含み得る。
【0115】
プロセッサ810は、自動車のアプリケーションの安全性管理を処理するために専用のプロセッサ・サブシステムを含む安全性クラスタ・エンジンをさらに含み得る。安全性クラスタ・エンジンは、2個以上のプロセッサ・コア、しっかりと結合されたRAM、サポート周辺装置(たとえば、タイマ、割り込みコントローラなど)、及び/又はルーティング論理を含み得る。安全性モードにおいて、2個以上のコアは、ロックステップ・モードにおいて動作し、それらの動作の間の何らかの差を検出するための比較論理を有する単一のコアとして機能することができる。
【0116】
プロセッサ810は、リアルタイム・カメラ管理を処理するための専用のプロセッサ・サブシステムを含み得るリアルタイム・カメラ・エンジンをさらに含み得る。
【0117】
プロセッサ810は、カメラ処理パイプラインの一部であるハードウェア・エンジンである画像信号プロセッサを含み得る高ダイナミック・レンジ信号プロセッサをさらに含み得る。
【0118】
プロセッサ810は、プレイヤ・ウインドウのための最終的画像を生み出すためにビデオ再生アプリケーションによって必要とされるビデオ処理後機能を実装する処理ブロック(たとえば、マイクロプロセッサに実装された)でもよいビデオ画像合成器を含み得る。ビデオ画像合成器は、ワイドビュー・カメラ870で、サラウンド・カメラ874で、及び/又はキャビン内監視カメラ・センサでレンズ歪み補正を実行することができる。キャビン内監視カメラ・センサは好ましくは、キャビン内イベントを識別し、適切に応答するように構成された、高度SoCの別のインスタンス上で実行するニューラル・ネットワークによって監視される。キャビン内システムは、セルラ・サービスをアクティブにする及び電話をかける、電子メールを書き取らせる、移動車の目的地を変更する、移動車のインフォテインメント・システム及び設定をアクティブにする又は変更する、或いは音声起動型ウェブ・サーフィンを提供するために、読唇術を実行することができる。ある特定の機能は、自律モードで動作しているときにのみ運転者に利用可能であり、そうでない場合には無効にされる。
【0119】
ビデオ画像合成器は、空間的ノイズ低減及び時間的ノイズ低減の両方のための強化された時間的ノイズ低減を含み得る。たとえば、動きがビデオ内で生じた場合、ノイズ低減は、隣接するフレームによって提供される情報の重みを減らし、空間的情報に適切に重みを加える。画像又は画像の一部が動きを含まない場合、ビデオ画像合成器によって実行される時間的ノイズ低減は、前の画像からの情報を使用して現在の画像におけるノイズを減らすことができる。
【0120】
ビデオ画像合成器はまた、入力ステレオ・レンズ・フレーム上でステレオ・レクティフィケーションを実行するように構成され得る。ビデオ画像合成器はさらに、オペレーティング・システム・デスクトップが使用中であるときにユーザ・インターフェース合成のために使用することができ、GPU808は、新しい表面を連続してレンダリングために必要とされない。GPU808の電源が入れられ、3Dレンダリングをアクティブに行っているときでも、ビデオ画像合成器は、GPU808をオフロードしてパフォーマンス及び反応性を向上させるために使用され得る。
【0121】
SoC804は、カメラからビデオ及び入力を受信するためのモバイル・インダストリ・プロセッサ・インターフェース(MIPI:mobile industry processor interface)カメラ・シリアル・インターフェース、高速インターフェース、及び/又は、カメラ及び関連画素入力機能のために使用され得るビデオ入力ブロックをさらに含み得る。SoC804は、ソフトウェアによって制御され得る、及び特定の役割にコミットされていないI/O信号を受信するために使用され得る、入力/出力コントローラをさらに含み得る。
【0122】
SoC804は、周辺装置、オーディオ・コーデック、電力管理、及び/又は他のデバイスとの通信を可能にするために、広範囲の周辺インターフェースをさらに含み得る。SoC804は、(たとえば、ギガビット・マルチメディア・シリアル・リンク及びイーサネット(登録商標)を介して接続された)カメラからのデータ、センサ(たとえば、イーサネット(登録商標)を介して接続され得るLIDARセンサ864、RADARセンサ860など)、バス802からのデータ(たとえば、移動車800のスピード、ハンドル位置など)、(たとえば、イーサネット(登録商標)又はCANバスを介して接続された)GNSSセンサ858からのデータを処理するために使用され得る。SoC804は、独自のDMAエンジンを含み得る及びルーティン・データ管理タスクからCPU806を解放するために使用され得る専用の高性能大容量記憶コントローラをさらに含み得る。
【0123】
SoC804は、自動化レベル3~5に広がる柔軟なアーキテクチャを有する終端間プラットフォームでもよく、それによって、多様性及び冗長性のためにコンピュータ・ビジョン及びADAS技法を活用し、効率的に使用し、深層学習ツールとともに、柔軟な、信頼できる運転ソフトウェア・スタックのためのプラットフォームを提供する、総合的機能的安全性アーキテクチャを提供する。SoC804は、従来のシステムよりも高速で、信頼でき、さらにエネルギ効率がよく、空間効率がよくなり得る。たとえば、加速装置814が、CPU806と結合されるとき、GPU808、及びデータ・ストア816は、レベル3~5の自律型車両のための高速で効率的なプラットフォームを提供することができる。
【0124】
したがって、本技術は、従来のシステムによって達成することができない能力及び機能性をもたらす。たとえば、コンピュータ・ビジョン・アルゴリズムは、多種多様な視覚的データにわたり多種多様な処理アルゴリズムを実行するために、Cプログラミング言語などの高レベルのプログラミング言語を使用して構成され得る、CPUで実行され得る。しかしながら、CPUは、しばしば、たとえば、実行時間及び電力消費に関連するものなど、多数のコンピュータ・ビジョン・アプリケーションの性能要件を満たすことができない。具体的には、多数のCPUは、移動車内ADASアプリケーションの要件及び実際のレベル3~5の自律型車両の要件である、リアルタイムでの複合物体検出アルゴリズムを実行することができない。
【0125】
従来のシステムとは対照的に、CPU複合体、GPU複合体、及びハードウェア加速クラスタを提供することによって、本明細書に記載の技術は、複数のニューラル・ネットワークが同時に及び/又は連続して実行されることと、レベル3~5の自律運転機能を可能にするために結果が結合されることとを可能にする。たとえば、DLA又はdGPU(たとえば、GPU820)で実行するCNNは、ニューラル・ネットワークが具体的にトレーニングされていない標識を含む、交通標識をスーパーコンピュータが読み取る及び理解することを可能にする、テキスト及び単語認識を含み得る。DLAは、標識の意味論的理解を識別、解釈、及び提供することと、CPU複合体で実行する進路計画立案モジュールに意味論的理解を渡すこととを行うことができる、ニューラル・ネットワークをさらに含み得る。
【0126】
別の実例として、複数のニューラル・ネットワークは、レベル3、4、又は5の運転に必要とされるように、同時に実行され得る。たとえば、電光とともに、「注意:点滅光は、凍った状態を示す」から成る警告標識は、いくつかのニューラル・ネットワークによって独立して又は集合的に解釈され得る。標識自体は、第1の配備されたニューラル・ネットワーク(たとえば、トレーニングされてあるニューラル・ネットワーク)によって交通標識として識別され得、テキスト「点滅光は、凍った状態を示す」は、点滅光が検出されるときには凍った状態が存在することを移動車の進路計画立案ソフトウェア(好ましくはCPU複合体上で実行する)に知らせる、第2の配備されたニューラル・ネットワークによって解釈され得る。点滅光は、点滅光の存在(又は無いこと)を移動車の進路計画立案ソフトウェアに知らせ、複数のフレームを介して第3の配備されたニューラル・ネットワークを動作させることによって識別され得る。すべての3個のニューラル・ネットワークは、DLA内及び/又はGPU808上などで、同時に実行することができる。
【0127】
いくつかの実例では、顔認識及び移動車所有者識別のためのCNNは、カメラ・センサからのデータを使用して移動車800の正規の運転者及び/又は所有者の存在を識別することができる。常時オンのセンサ処理エンジンは、所有者が運転席側のドアに近づくときに移動車を解錠する及び明かりをつけるために、並びに、セキュリティ・モードにおいて、所有者が移動車を離れるときに移動車の動作を停止させるために、使用され得る。このようにして、SoC804は、盗難及び/又は車の乗っ取りに対するセキュリティをもたらす。
【0128】
別の実例では、緊急車両検出及び識別のためのCNNは、マイクロフォン896からのデータを使用して緊急車両サイレンを検出及び識別することができる。一般分類子を使用してサイレンを検出する及び特徴を手動で抽出する従来のシステムとは対照的に、SoC804は、環境の及び都市の音の分類、並びに視覚的データの分類のためにCNNを使用する。好ましい一実施例では、DLA上で実行するCNNは、(たとえば、ドップラー効果を使用することによって)緊急車両の相対的終速度を識別するようにトレーニングされる。CNNはまた、GNSSセンサ858によって識別されるように、移動車が稼働しているローカル・エリアに特有の緊急車両を識別するようにトレーニングされ得る。それ故に、たとえば、欧州で稼働しているとき、CNNは、欧州のサイレンを検出しようとすることになり、そして、米国にあるとき、CNNは、北米のサイレンのみを識別しようとすることになる。緊急車両が検出された後は、制御プログラムが、緊急車両が通過するまで、超音波センサ862の支援を受けて、移動車を減速する、道の端に停止させる、移動車を駐車する、及び/又は移動車をアイドリングさせる、緊急車両安全性ルーティンを実行するために使用され得る。
【0129】
移動車は、高速相互接続(たとえば、PCIe)を介してSoC804に連結され得るCPU818(たとえば、個別のCPU、又はdCPU)を含み得る。CPU818は、たとえば、X86プロセッサを含み得る。CPU818は、たとえば、ADASセンサとSoC804との間の潜在的に不整合の結果を調停すること、及び/又はコントローラ836及び/又はインフォテインメントSoC830の状況及び調子を監視することを含む、様々な機能のいずれかを実行するために使用され得る。
【0130】
移動車800は、高速相互接続(たとえば、NVIDIAのNVLINK)を介してSoC804に連結され得るGPU820(たとえば、個別のGPU、又はdGPU)を含み得る。GPU820は、冗長及び/又は異なるニューラル・ネットワークを実行することなどによって、付加的人工知能機能をもたらすことができ、移動車800のセンサからの入力(たとえば、センサ・データ)に基づいてニューラル・ネットワークをトレーニング及び/又は更新するために使用され得る。
【0131】
移動車800は、1つ又は複数のワイヤレス・アンテナ826(たとえば、セルラ・アンテナ、ブルートゥース(登録商標)・アンテナなど、異なる通信プロトコルのための1つ又は複数のワイヤレス・アンテナ)を含み得るネットワーク・インターフェース824をさらに含み得る。ネットワーク・インターフェース824は、インターネットを介するクラウドとの(たとえば、サーバ878及び/又は他のネットワーク・デバイスとの)、他の移動車との、及び/又は計算デバイス(たとえば、乗客のクライアント・デバイス)とのワイヤレス接続を使用可能にするために使用され得る。他の移動車と通信するために、直接リンクが2個の移動車の間に確立され得る、及び/又は、間接リンクが(たとえば、ネットワークを通じて及びインターネットを介して)確立され得る。直接リンクは、移動車対移動車通信リンクを使用し、提供され得る。移動車対移動車通信リンクは、移動車800に近接する移動車(たとえば、移動車800の前の、横の、及び/又は後ろの移動車)に関する移動車800情報を提供することができる。この機能は、移動車800の共同適応クルーズ制御機能の一部でもよい。
【0132】
ネットワーク・インターフェース824は、変調及び復調機能を提供する及びコントローラ836がワイヤレス・ネットワークを介して通信することを可能にする、SoCを含み得る。ネットワーク・インターフェース824は、ベースバンドから無線周波数へのアップコンバージョン、及び無線周波数からベースバンドへのダウンコンバージョンのための無線周波数フロントエンドを含み得る。周波数コンバージョンは、よく知られているプロセスを通して実行することができ、及び/又はスーパーヘテロダイン・プロセスを用いて実行することができる。いくつかの実例では、無線周波数フロントエンド機能は、別個のチップによって提供され得る。ネットワーク・インターフェースは、LTE、WCDMA(登録商標)、UMTS、GSM、CDMA2000、ブルートゥース(登録商標)、ブルートゥース(登録商標)LE、Wi-Fi、Z-Wave、ZigBee、LoRaWAN、及び/又は他のワイヤレス・プロトコルを介して通信するためのワイヤレス機能を含み得る。
【0133】
移動車800は、チップ外の(たとえば、SoC804外の)ストレージを含み得るデータ・ストア828をさらに含み得る。データ・ストア828は、RAM、SRAM、DRAM、VRAM、フラッシュ、ハードディスク、及び/又は、少なくとも1ビットのデータを記憶することができる他の構成要素及び/又はデバイスを含む、1つ又は複数の記憶素子を含み得る。
【0134】
車両800は、GNSSセンサ858をさらに含み得る。GNSSセンサ858(たとえば、GPS、支援されたGPSセンサ、ディファレンシャルGPS(DGPS)センサなど)は、マッピング、知覚、占有グリッド生成、及び/又は進路計画策定機能を支援する。たとえば、シリアル(RS-232)ブリッジへのイーサネット(登録商標)を有するUSBコネクタを使用するGPSを含むが、これに限定されない、任意の数のGNSSセンサ858が、使用され得る。
【0135】
移動車800は、RADARセンサ860をさらに含み得る。RADARセンサ860は、暗闇及び/又は厳しい気象条件においても、長距離移動車検出のために移動車800によって使用され得る。RADAR機能安全性レベルは、ASIL Bでもよい。一部の実例では、RADARセンサ860は、未加工のデータにアクセスするためのイーサネット(登録商標)へのアクセスを用いて、制御のために及び物体追跡データにアクセスするために(たとえば、RADARセンサ860によって生成されたデータを送信するために)CAN及び/又はバス802を使用することができる。多種多様なRADARセンサ・タイプが、使用され得る。たとえば、そして制限なしに、RADARセンサ860は、前部、後部、及び側部RADAR使用に適し得る。一部の実例では、パルス・ドップラーRADARセンサが使用される。
【0136】
RADARセンサ860は、狭い視野を有する長距離、広い視野を有する短距離、短距離側部カバレッジなど、異なる構成を含み得る。いくつかの実例では、長距離RADARは、適応クルーズ制御機能のために使用され得る。長距離RADARシステムは、250mの範囲内など、2個以上の独立したスキャンによって実現される広い視野を提供することができる。RADARセンサ860は、静的物体と動く物体との区別を助けることができ、緊急ブレーキ・アシスト及び前方衝突警報のためのADASシステムによって使用され得る。長距離RADARセンサは、複数の(たとえば、6つ以上の)固定RADARアンテナと高速CAN及びFlexRayインターフェースとを有するモノスタティック・マルチモーダルRADARを含み得る。6つのアンテナを有する一実例では、中央の4個のアンテナは、隣接レーン内の交通からの干渉を最小限にして高速で移動車800の周囲を記録するように設計された、集束ビーム・パターンを作成し得る。他の2個のアンテナは、視野を広げることができ、移動車800のレーンに入る又はこれを去る移動車を迅速に検出することを可能にする。
【0137】
一実例として、中距離RADARシステムは、860m(前)又は80m(後)までの範囲、及び42度(前)又は850度(後)までの視野を含み得る。短距離RADARシステムは、後部バンパの両端に設置されるように設計されたRADARセンサを含み得るが、これに限定されない。後部バンパの両端に設置されるとき、そのようなRADARセンサ・システムは、移動車の後ろ及び隣の死角を常に監視する2個のビームを作成することができる。
【0138】
短距離RADARシステムは、死角検出及び/又はレーン変更アシストのためにADASシステムにおいて使用され得る。
【0139】
移動車800は、超音波センサ862をさらに含み得る。移動車800の前部、後部、及び/又は側部に位置付けられ得る、超音波センサ862は、駐車アシストのために及び/又は占有グリッドの作成及び更新のために使用され得る。多種多様な超音波センサ862が使用され得、異なる超音波センサ862が、異なる範囲の検出(たとえば、2.5m、4m)のために使用され得る。超音波センサ862は、ASIL Bの機能的安全性レベルにおいて動作することができる。
【0140】
移動車800はLIDARセンサ864を含み得る。LIDARセンサ864は、物体及び歩行者検出、緊急ブレーキ、衝突回避、及び/又は他の機能のために使用され得る。LIDARセンサ864は、機能的安全性レベルASIL Bでもよい。いくつかの実例では、移動車800は、(たとえば、ギガビット・イーサネット(登録商標)・スイッチにデータを提供するために)イーサネット(登録商標)を使用することができる複数の(たとえば、2個、4個、6個などの)LIDARセンサ864を含み得る。
【0141】
いくつかの実例では、LIDARセンサ864は、物体及び360度視野のそれらの距離のリストを提供する能力を有し得る。市販のLIDARセンサ864は、たとえば、2cm~3cmの精度を有し、800Mbpsイーサネット(登録商標)接続のサポートを有して、約800mの広告された範囲を有し得る。いくつかの実例では、1つ又は複数の非突出したLIDARセンサ864が、使用され得る。そのような実例では、LIDARセンサ864は、移動車800の前部、後部、側部、及び/又は角に組み込まれ得る小さいデバイスとして実装され得る。そのような実例では、LIDARセンサ864は、低反射物体についても200mの範囲を有し、120度水平及び35度垂直視野まで提供することができる。前部に取り付けられたLIDARセンサ864は、45度と135度との間の水平視野向けに構成され得る。
【0142】
いくつかの実例では、3DフラッシュLIDARなどのLIDAR技術もまた使用され得る。3DフラッシュLIDARは、約200mまで移動車の周囲を照らすために、送信元としてレーザーのフラッシュを使用する。フラッシュLIDARユニットは、移動車から物体までの範囲に順番に対応する、レーザー・パルス走行時間及び各画素上の反射光を記録する、レセプタを含む。フラッシュLIDARは、周囲の高精度の及び歪みのない画像があらゆるレーザー・フラッシュで生成されることを可能にし得る。いくつかの実例では、4個のフラッシュLIDARセンサが、移動車800の各側面に1つずつ、配備され得る。利用可能な3DフラッシュLIDARシステムは、送風機以外に動く部分を有さないソリッドステート3Dステアリング・アレイLIDARカメラ(たとえば、非スキャン型LIDARデバイス)を含む。フラッシュLIDARデバイスは、1フレームにつき5ナノ秒クラスI(目に安全な)レーザー・パルスを使用することができ、3D範囲点群及び共記載された強度データの形で反射レーザー光をキャプチャし得る。フラッシュLIDARを使用することによって、また、フラッシュLIDARは、動く部分を有さないソリッドステート・デバイスであるので、LIDARセンサ864は、モーション・ブラー、振動、及び/又は衝撃の影響を受けにくくなり得る。
【0143】
移動車は、IMUセンサ866をさらに含み得る。一部の実例では、IMUセンサ866は、移動車800の後部車軸の中央に位置付けられ得る。IMUセンサ866は、たとえば、加速度計、磁力計、ジャイロスコープ、磁気コンパス、及び/又は他のセンサ・タイプを含み得るが、これらに限定されない。いくつかの実例では、6軸アプリケーションなどにおいて、IMUセンサ866は、加速度計及びジャイロスコープを含み得るが、9軸アプリケーションにおいて、IMUセンサ866は、加速度計、ジャイロスコープ、及び磁力計を含み得る。
【0144】
一部の実施例では、IMUセンサ866は、マイクロ電気機械システム(MEMS:micro-electro-mechanical system)慣性センサ、高感度GPSレシーバ、及び高度カルマン・フィルタリング・アルゴリズムを結合して位置、ベロシティ、及び姿勢の推定値を提供するミニチュア、高性能GPS支援型慣性航行システム(GPS/INS:GPS-Aided Inertial Navigation System)として実装され得る。そのようなものとして、一部の実例では、IMUセンサ866は、GPSからIMUセンサ866までのベロシティの変化を直接観測すること及び関連付けることによって、磁気センサからの入力を必要とせずに進行方向を移動車800が推定することを可能にし得る。いくつかの実例では、IMUセンサ866及びGNSSセンサ858は、単一の統合されたユニットにおいて結合され得る。
【0145】
移動車は、移動車800内及び/又は周囲に置かれたマイクロフォン896を含み得る。マイクロフォン896は、中でも、緊急車両検出及び識別のために使用され得る。
【0146】
移動車は、ステレオ・カメラ868、ワイドビュー・カメラ870、赤外線カメラ872、サラウンド・カメラ874、長距離及び/又は中距離カメラ898、及び/又は他のカメラ・タイプを含む、任意の数のカメラ・タイプをさらに含み得る。カメラは、移動車800の全外面の周りの画像データをキャプチャするために使用され得る。使用されるカメラのタイプは、移動車800の実施例及び要件に応じて決まり、任意の組合せのカメラ・タイプが、移動車800の周りの必要なカバレッジを実現するために使用され得る。加えて、カメラの数は、実施例に応じて異なり得る。たとえば、移動車は、6個のカメラ、7個のカメラ、10個のカメラ、12個のカメラ、及び/又は別の数のカメラを含み得る。カメラは、一実例として、ギガビット・マルチメディア・シリアル・リンク(GMSL:Gigabit Multimedia Serial Link)及び/又はギガビット・イーサネット(登録商標)をサポートし得るが、これに限定されない。それぞれのカメラは、
図8A及び
図8Bに関連して本明細書においてさらに詳しく説明される。
【0147】
移動車800は、振動センサ842をさらに含み得る。振動センサ842は、車軸など、移動車の構成要素の振動を測定することができる。たとえば、振動の変化は、道路の表面の変化を示し得る。別の実例では、2個以上の振動センサ842が使用されるとき、振動の差は、道路表面の摩擦又は滑りを判定するために使用され得る(たとえば、振動の差が電力駆動車軸と自由回転車軸との間であるとき)。
【0148】
移動車800は、ADASシステム838を含み得る。一部の実例では、ADASシステム838は、SoCを含み得る。ADASシステム838は、自律/適応/自動クルーズ制御(ACC:autonomous/adaptive/automatic cruise control)、共同適応クルーズ制御(CACC:cooperative adaptive cruise control)、前方衝突警報(FCW:forward crash warning)、自動緊急ブレーキ(AEB:automatic emergency braking)、車線逸脱警報(LDW:lane departure warning)、レーン・キープ・アシスト(LKA:lane keep assist)、死角警報(BSW:blind spot warning)、後部交差交通警報(RCTW:rear cross-traffic warning)、衝突警報システム(CWS:collision warning system)、レーン・センタリング(LC:lane centering)、及び/又は他の特徴及び機能を含み得る。
【0149】
ACCシステムは、RADARセンサ860、LIDARセンサ864、及び/又はカメラを使用し得る。ACCシステムは、縦ACC及び/又は横ACCを含み得る。縦ACCは、移動車800の直ぐ前の移動車までの距離を監視及び制御し、前方の移動車からの安全距離を維持するために移動車速度を自動的に調整する。横ACCは、距離の保持を実行し、必要なときにレーンを変更するように移動車800にアドバイスする。横ACCは、LCA及びCWSなどの他のADASアプリケーションに関連する。
【0150】
CACCは、ワイヤレス・リンクを介して他の移動車からネットワーク・インターフェース824及び/又はワイヤレス・アンテナ826を介して、或いは間接的にネットワーク接続を介して(たとえば、インターネットを介して)、受信することができる、他の移動車からの情報を使用する。直接リンクは、移動車対移動車(V2V:vehicle-to-vehicle)通信リンクによって提供され得、一方、間接リンクは、インフラストラクチャ対移動車(I2V:infrastructure-to-vehicle)通信リンクでもよい。一般に、V2V通信概念は、直前の移動車(たとえば、移動車800と同じレーン内にある、移動車800の直ぐ前の移動車)に関する情報を提供し、一方、I2V通信概念は、さらに前の交通に関する情報を提供する。CACCシステムは、I2V情報ソースとV2V情報ソースとのいずれか又は両方を含み得る。移動車800の前方の移動車の情報を所与として、CACCは、より高信頼になり得、CACCは、交通の流れをよりスムーズにし、道路の渋滞を減らす可能性を有する。
【0151】
運転者が修正行動を取ることができるように、FCWシステムは、危険を運転者に警告するように設計される。FCWシステムは、ディスプレイ、スピーカ、及び/又は振動部品など、運転者フィードバックに電気的に連結された、専用のプロセッサ、DSP、FPGA、及び/又はASICに連結された、前向きのカメラ及び/又はRADARセンサ860を使用する。FCWシステムは、音響、視覚的警報、振動及び/又はクイック・ブレーキ・パルスなどの形で、警報を提供することができる。
【0152】
AEBシステムは、別の移動車又は他の物体との差し迫った前方衝突を検出し、運転者が指定された時間又は距離パラメータ内に修正行動を取らない場合に、ブレーキを自動的に適用することができる。AEBシステムは、専用のプロセッサ、DSP、FPGA、及び/又はASICに連結された、前向きのカメラ及び/又はRADARセンサ860を使用することができる。AEBシステムが危険を検出するとき、AEBシステムは通常は、先ず、衝突を回避するための修正行動を取るように運転者に警告し、運転者が修正行動を取らない場合、AEBシステムは、予測される衝突の影響を防ぐ、又は少なくとも軽減するための努力の一環としてブレーキを自動的に適用することができる。AEBシステムは、ダイナミック・ブレーキ・サポート及び/又は衝突切迫ブレーキなどの技法を含み得る。
【0153】
LDWシステムは、ハンドル又はシートの振動など、視覚的、可聴式、及び/又は触覚的警報を提供して、移動車800が車線区分線を越えたときに運転者に警告する。LDWシステムは、運転者が、方向指示器を起動することによって、意図的な車線逸脱を指示するときには、起動しない。LDWシステムは、ディスプレイ、スピーカ、及び/又は振動部品など、運転者フィードバックに電気的に連結された、専用のプロセッサ、DSP、FPGA、及び/又はASICに連結された、前側を向いたカメラを使用することができる。
【0154】
LKAシステムは、LDWシステムの変更形態である。LKAシステムは、移動車800が車線をはみ出し始めた場合に移動車800を修正するためにステアリング入力又はブレーキを提供する。
【0155】
BSWシステムは、自動車の死角において移動車の運転者に検出及び警告する。BSWシステムは、合流又はレーンの変更が安全ではないことを指示するために視覚的、可聴式、及び/又は触覚的警告を提供することができる。システムは、運転者が方向指示器を使用するときに、付加的警告を提供することができる。BSWシステムは、運転者フィードバック、たとえば、ディスプレイ、スピーカ、及び/又は振動部品、に電気的に結合された、専用プロセッサ、DSP、FPGA、及び/又はASICに結合された、後ろ側を向いたカメラ及び/又はRADARセンサ860を使用することができる。
【0156】
RCTWシステムは、車両800がバックしているときにリアカメラの範囲外で物体が検出されたときに視覚的、可聴式、及び/又は触覚的通知を提供することができる。いくつかのRCTWシステムは、衝突を回避するために車両ブレーキが適用されることを確実にするために、AEBを含む。RCTWシステムは、運転者フィードバック、たとえば、ディスプレイ、スピーカ、及び/又は振動部品、に電気的に結合された、専用プロセッサ、DSP、FPGA、及び/又はASICに結合された、1つ又は複数の後ろを向いたRADARセンサ860を使用することができる。
【0157】
従来のADASシステムは、運転者に警告し、安全状態が本当に存在するかどうかを運転者が判定し、それに応じて行動することを可能にするので、従来のADASシステムは、通常は壊滅的ではないが、運転者を悩ませている及び気を散らせていることがある誤判定結果を生み出す傾向にあることがあった。しかしながら、自律型車両800では、結果が矛盾する場合には、移動車800自体が、1次的コンピュータ又は2次的コンピュータ(たとえば、第1のコントローラ836又は第2のコントローラ836)からの結果を聞き入れるかどうかを決定しなければならない。たとえば、一部の実施例では、ADASシステム838は、知覚情報をバックアップ・コンピュータ合理性モジュールに提供するためのバックアップ及び/又は2次的コンピュータでもよい。バックアップ・コンピュータ合理性モニタは、ハードウェア構成要素で冗長な多様なソフトウェアを実行して、知覚及び動的運転タスクにおいて障害を検出することができる。ADASシステム838からの出力は、監督MCUに提供され得る。1次的コンピュータ及び2次的コンピュータからの出力が矛盾する場合、監督MCUは、安全な動作を確実にするためにその矛盾をどのように調整するかを決定する必要がある。
【0158】
いくつかの実例では、1次的コンピュータは、選択された結果における1次的コンピュータの信頼性を指示する、信頼性スコアを監督MCUに提供するように構成され得る。信頼性スコアが閾値を超えた場合、監督MCUは、2次的コンピュータが矛盾する又は不整合の結果を与えるかどうかにかかわらず、1次的コンピュータの指示に従い得る。信頼性スコアが閾値を満たさない場合、及び1次的及び2次的コンピュータが異なる結果を示す(たとえば、矛盾する)場合、監督MCUは、コンピュータの間で調停して適切な結果を決定することができる。
【0159】
監督MCUは、2次的コンピュータが誤ったアラームを提供する状態を、1次的コンピュータ及び2次的コンピュータからの出力に基づいて判定するようにトレーニング及び構成されたニューラル・ネットワークを実行するように構成され得る。したがって、監督MCU内のニューラル・ネットワークは、2次的コンピュータの出力が信頼され得るとき、及びそれが信頼され得ないときを学習することができる。たとえば、2次的コンピュータがRADARベースのFCWシステムであるとき、監督MCU内のニューラル・ネットワークは、アラームをトリガする下水溝の鉄格子又はマンホールの蓋など、実際には危険ではない金属製の物をいつFCWが識別しているかを学習することができる。同様に、2次的コンピュータがカメラベースのLDWシステムであるとき、監督MCU内のニューラル・ネットワークは、自転車に乗った人又は歩行者が存在し、車線逸脱が、実際には、最も安全な操作であるときに、LDWを無視することを学習することができる。監督MCU上で実行中のニューラル・ネットワークを含む実施例では、監督MCUは、関連メモリを有するニューラル・ネットワークを実行するのに適したDLA又はGPUのうちの少なくとも1つを含み得る。好ましい実施例において、監督MCUは、SoC804の構成要素を備え得る、及び/又はSoC804の構成要素として含まれ得る。
【0160】
他の実例において、ADASシステム838は、コンピュータ・ビジョンの従来のルールを使用するADAS機能を実行する2次的コンピュータを含み得る。そのようなものとして、2次的コンピュータは、古典的コンピュータ・ビジョン・ルール(if-then)を使用することができ、監督MCU内のニューラル・ネットワークの存在は、信頼性、安全性及び性能を向上させることができる。たとえば、多様な実装形態及び意図的な非同一性は、特にソフトウェア(又はソフトウェア-ハードウェア・インターフェース)機能によって引き起こされる障害に対して、システム全体をよりフォールトトレラントにする。たとえば、1次的コンピュータで実行中のソフトウェア内にソフトウェア・バグ又はエラーが存在し、2次的コンピュータで実行中の同一でないソフトウェア・コードが同じ総合的結果を提供する場合、監督MCUは、総合的結果は正しく、1次的コンピュータ上のソフトウェア又はハードウェア内のバグは重大なエラーを引き起こしていないというより大きな確信を有し得る。
【0161】
いくつかの実例では、ADASシステム838の出力は、1次的コンピュータの知覚ブロック及び/又は1次的コンピュータの動的運転タスク・ブロックに供給され得る。たとえば、ADASシステム838が、直ぐ前の物体が原因で、前方衝突警報を示した場合、知覚ブロックは、物体を識別するときに、この情報を使用することができる。他の実例において、2次的コンピュータは、本明細書に記載のように、トレーニングされ、それ故に誤判定のリスクを減らす、独自のニューラル・ネットワークを有し得る。
【0162】
移動車800は、インフォテインメントSoC830(たとえば、移動車内のインフォテインメント・システム(IVI:in-vehicle infotainment system))をさらに含み得る。SoCとして図示及び記述されているが、インフォテインメント・システムは、SoCでなくてもよく、2個以上の個別の構成要素を含み得る。インフォテインメントSoC830は、オーディオ(たとえば、音楽、携帯情報端末、ナビゲーション命令、ニュース、無線など)、ビデオ(たとえば、TV、映画、ストリーミングなど)、電話(たとえば、ハンズフリー通話)、ネットワーク接続(たとえば、LTE、Wi-Fiなど)、及び/又は情報サービス(たとえば、ナビゲーション・システム、後方駐車支援、無線データシステム、燃料レベル、総移動距離、ブレーキ燃料レベル、オイル・レベル、ドアを開ける/閉じる、エア・フィルタ情報などの移動車関連情報)を移動車800に提供するために使用され得るハードウェア及びソフトウェアの組合せを含み得る。たとえば、インフォテインメントSoC830は、無線、ディスク・プレイヤ、ナビゲーション・システム、ビデオ・プレイヤ、USB及びブルートゥース(登録商標)接続、カーピュータ、車内エンターテインメント、Wi-Fi、ハンドル・オーディオ制御装置、ハンズ・フリー音声制御、ヘッドアップ・ディスプレイ(HUD:heads-up display)、HMIディスプレイ834、テレマティックス・デバイス、制御パネル(たとえば、様々な構成要素、特徴、及び/又はシステムを制御する及び/又はこれと相互に作用するための)、及び/又は他の構成要素でもよい。インフォテインメントSoC830は、ADASシステム838からの情報、計画された移動車操作などの自律運転情報、軌道、周囲環境情報(たとえば、交差点情報、移動車情報、道路情報など)、及び/又は他の情報など、移動車のユーザへの情報(たとえば、視覚的及び/又は可聴式の)を提供するためにさらに使用され得る。
【0163】
インフォテインメントSoC830は、GPU機能性を含み得る。インフォテインメントSoC830は、バス802(たとえば、CANバス、イーサネット(登録商標)など)を介して、移動車800の他のデバイス、システム、及び/又は構成要素と通信することができる。いくつかの実例では、インフォテインメント・システムのGPUが、1次的コントローラ836(たとえば、移動車800の1次的及び/又はバックアップ・コンピュータ)が故障した場合に、いくつかのセルフドライブ機能を実行することができるように、インフォテインメントSoC830は、監督MCUに連結され得る。そのような実例では、インフォテインメントSoC830は、本明細書に記載のように、移動車800をショーファーの安全停止モードにすることができる。
【0164】
移動車800は、計器群832(たとえば、デジタル・ダッシュ、電子計器群、デジタル計器パネルなど)をさらに含み得る。計器群832は、コントローラ及び/又はスーパーコンピュータ(たとえば、個別のコントローラ又はスーパーコンピュータ)を含み得る。計器群832は、スピードメーター、燃料レベル、油圧、タコメーター、オドメーター、方向指示器、ギアシフト位置インジケータ、シート・ベルト警告灯、パーキングブレーキ警告灯、エンジン故障灯、エアバッグ(SRS)システム情報、照明制御装置、安全システム制御装置、ナビゲーション情報など、1セットの器具類を含み得る。いくつかの実例では、情報は、インフォテインメントSoC830及び計器群832の間で表示及び/又は共有され得る。言い換えれば、計器群832は、インフォテインメントSoC830の一部として含まれてもよく、逆もまた同様である。
【0165】
図8Dは、本開示のいくつかの実施例による、
図8Aのクラウドベースのサーバと例示的自律型車両800との間の通信のシステム図である。システム876は、サーバ878、ネットワーク890、及び、移動車800を含む移動車を含み得る。サーバ878は、複数のGPU884(A)~884(H)(本明細書でGPU884と総称される)、PCIeスイッチ882(A)~882(H)(本明細書でPCIeスイッチ882と総称される)、及び/又はCPU880(A)~880(B)(本明細書でCPU880と総称される)を含み得る。GPU884、CPU880、及びPCIeスイッチは、たとえば、NVIDIAによって開発されたNVLinkインターフェース888及び/又はPCIe接続886などの、これらに限定されない、高速相互接続で相互に接続され得る。いくつかの実例では、GPU884は、NVLink及び/又はNVSwitch SoCを介して接続され、GPU884及びPCIeスイッチ882は、PCIe相互接続を介して接続される。8個のGPU884、2個のCPU880、及び2個のPCIeスイッチが図示されているが、これは制限を意図されていない。実施例に応じて、それぞれのサーバ878は、任意の数のGPU884、CPU880、及び/又はPCIeスイッチを含み得る。たとえば、サーバ878は、それぞれ、8個、16個、32個、及び/又はそれ以上のGPU884を含み得る。
【0166】
サーバ878は、最近開始された道路工事など、予想外の又は変更された道路状態を示す画像を表す画像データを、ネットワーク890を介して、移動車から、受信することができる。サーバ878は、ニューラル・ネットワーク892、更新されたニューラル・ネットワーク892、及び/又は、交通及び道路状態に関する情報を含むマップ情報894をネットワーク890を介して移動車に送信することができる。マップ情報894の更新は、建設現場、くぼみ、迂回路、洪水、及び/又は他の障害物に関する情報など、HDマップ822の更新を含み得る。いくつかの実例では、ニューラル・ネットワーク892、更新されたニューラル・ネットワーク892、及び/又はマップ情報894は、環境において任意の数の移動車から受信されたデータにおいて表された新しいトレーニング及び/又は経験から、及び/又は(たとえば、サーバ878及び/又は他のサーバを使用する)データ・センタにおいて実行されたトレーニングに基づいて生じた可能性がある。
【0167】
サーバ878は、トレーニング・データに基づいてマシン学習モデル(たとえば、ニューラル・ネットワーク)をトレーニングするために使用され得る。トレーニング・データは、移動車によって生成され得る、及び/又は(たとえば、ゲーム・エンジンを使用して)シミュレーションにおいて生成され得る。いくつかの実例では、トレーニング・データは、タグ付けされる(たとえば、ニューラル・ネットワークが、監督された学習の恩恵を受ける場合)及び/又は他の事前処理を受けるが、他の実例において、トレーニング・データは、タグ付け及び/又は事前処理されない(たとえば、ニューラル・ネットワークが、監督された学習を必要としない場合)。トレーニングは、たとえば以下のクラスを含むがこれらに限定されない、任意の1つ又は複数のクラスのマシン学習技法に従って、実行され得る:監視されたトレーニング、半監視されたトレーニング、監視されていないトレーニング、自己学習、強化学習、連合型学習、転移学習、特徴学習(主要構成要素及びクラスタ分析を含む)、マルチ線形部分空間学習、多様体学習、表現学習(予備辞書学習を含む)、ルールに基づくマシン学習、異常検出、及びそれらの変更形態若しくは組合せ。マシン学習モデルがトレーシングされた後は、マシン学習モデルは、移動車によって使用され得(たとえば、ネットワーク890を介して移動車に送信される)、及び/又は、マシン学習モデルは、移動車を遠隔監視するために、サーバ878によって使用され得る。
【0168】
いくつかの実例では、サーバ878は、移動車からデータを受信し、リアルタイムのインテリジェント推論のために最新のリアルタイムのニューラル・ネットワークにデータを適用することができる。サーバ878は、NVIDIAによって開発されたDGX及びDGXステーション・マシンなど、GPU884によって電力供給される深層学習スーパーコンピュータ及び/又は専用のAIコンピュータを含み得る。しかしながら、一部の実例では、サーバ878は、CPU電源式データ・センタのみを使用する深層学習インフラストラクチャを含み得る。
【0169】
サーバ878の深層学習インフラストラクチャは、高速のリアルタイム推論の能力を有することでき、その能力を使用して移動車800内のプロセッサ、ソフトウェア、及び/又は関連ハードウェアの調子を評価及び検証することができる。たとえば、深層学習インフラストラクチャは、移動車800がそのシーケンスの画像内に位置したシーケンスの画像及び/又は物体など、移動車800からの定期的更新を受信することができる(たとえば、コンピュータ・ビジョン及び/又は他のマシン学習物体分類技法を介して)。深層学習インフラストラクチャは、物体を識別し、移動車800によって識別された物体とそれらを比較するために、独自のニューラル・ネットワークを実行することができ、結果が一致せず、インフラストラクチャが、移動車800内のAIは正常に機能していないという結論を下した場合、サーバ878は、制御を推測し、乗客に通知し、安全な駐車操作を完了するように移動車800のフェイルセーフ・コンピュータに命じる移動車800への信号を送信することができる。
【0170】
推論のために、サーバ878は、GPU884及び1つ又は複数のプログラマブル推論加速装置(たとえば、NVIDIAのTensorRT)を含み得る。GPU電源式サーバ及び推論加速の組合せは、リアルタイムの反応性を可能にすることができる。パフォーマンスがさほど必要とされない場合など、他の実例では、CPU、FPGA、及び他のプロセッサによって電力供給されるサーバが、推論のために使用され得る。
【0171】
(例示的計算デバイス)
図9は、本開示のいくつかの実施例の実装に使用するのに適した計算デバイス900の一実例のブロック図である。計算デバイス900は、以下のデバイスを間接的に又は直接的につなぐ相互接続システム902を含み得る:メモリ904、1つ又は複数の中央処理装置(CPU)906、1つ又は複数のグラフィック処理ユニット(GPU)909、通信インターフェース910、入力/出力(I/O)ポート912、入力/出力構成要素914、電力供給装置916、1つ又は複数の提示構成要素918(たとえば、ディスプレイ)、及び1つ又は複数の論理ユニット920。少なくとも1つの実施例において、計算デバイス900は、1つ又は複数の仮想マシン(VM:Virtual Machine)を含み得る、及び/又は、その構成要素のいずれかは、仮想構成要素(たとえば、仮想ハードウェア構成要素)を含み得る。非限定的実例として、GPU908のうちの1つ又は複数は、1つ又は複数のvGPUを含み得、CPU906のうちの1つ又は複数は、1つ又は複数のvCPUを含み得、及び/又は、論理ユニット920のうちの1つ又は複数は、1つ又は複数の仮想論理ユニットを含み得る。そのようなものとして、計算デバイス900は、個別の構成要素(たとえば、計算デバイス900専用の全GPU)、仮想構成要素(たとえば、計算デバイス900専用のGPUの一部分)、又はその組合せを含み得る。
【0172】
図9の様々なブロックは、線で相互接続システム902を介して接続しているように示されているが、これは制限することを意図されておらず、単に分かりやすくするためである。たとえば、一部の実施例では、表示デバイスなどの提示構成要素918は、I/O構成要素914と考えられ得る(たとえば、ディスプレイがタッチ・スクリーンである場合)。別の実例として、CPU906及び/又はGPU908はメモリを含み得る(たとえば、メモリ904は、GPU908、CPU906、及び/又は他の構成要素のメモリに加えた記憶デバイスを表し得る)。言い換えれば、
図9の計算デバイスは、単に例示である。「ワークステーション」、「サーバ」、「ラップトップ」、「デスクトップ」、「タブレット」、「クライアント・デバイス」、「モバイル・デバイス」、「ハンドヘルド・デバイス」、「ゲーム機」、「電子制御ユニット(ECU:electronic control unit)」、「仮想現実システム」、及び/又は他のデバイス若しくはシステム・タイプなどのカテゴリはすべて、
図9の計算デバイスの範囲内にあることが意図されているので、これらは区別されない。
【0173】
相互接続システム902は、1つ又は複数のリンク又はバス、たとえば、アドレス・バス、データ・バス、制御バス、又はその組合せ、を表し得る。相互接続システム902は、1つ又は複数のバス又はリンク・タイプ、たとえば、業界標準アーキテクチャ(ISA:industry standard architecture)バス、拡張業界標準アーキテクチャ(EISA:extended industry standard architecture)バス、VESA(video electronics standards association)バス、周辺構成要素相互接続(PCI:peripheral component interconnect)バス、周辺構成要素相互接続エクスプレス(PCIe:peripheral component interconnect express)バス、及び/又は別のタイプのバス若しくはリンク、を含み得る。一部の実施例では、構成要素の間に直接接続が存在する。一実例として、CPU906は、メモリ904に直接接続され得る。さらに、CPU906は、GPU908に直接接続され得る。構成要素の間に直接、又はポイント対ポイント接続が存在する場合、相互接続システム902は、接続を実施するためのPCIeリンクを含み得る。これらの実例では、PCIバスは、計算デバイス900に含まれる必要はない。
【0174】
メモリ904は、様々なコンピュータ可読媒体のいずれかを含み得る。コンピュータ可読媒体は、計算デバイス900によってアクセスすることができる任意の利用可能な媒体でもよい。コンピュータ可読媒体は、揮発性及び不揮発性媒体の両方、及び取り外し可能な及び取り外し不可能な媒体を含み得る。例として、しかし限定ではなく、コンピュータ可読媒体は、コンピュータ記憶媒体及び通信媒体を備え得る。
【0175】
コンピュータ記憶媒体は、コンピュータ可読命令、データ構造体、プログラム・モジュール、及び/又は他のデータ・タイプなどの情報の記憶のための任意の方法又は技術において実装された揮発性及び不揮発性媒体及び/又は取り外し可能な及び取り外し不可能な媒体の両方を含み得る。たとえば、メモリ904は、オペレーティング・システムなど、(たとえば、プログラム及び/又はプログラム要素を表す)コンピュータ可読命令を記憶することができる。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ又は他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD:digital versatile disk)又は他の光ディスク・ストレージ、磁気カセット、磁気テープ、磁気ディスク・ストレージ又は他の磁気記憶デバイス、或いは、所望の情報を記憶するために使用し得る及び計算デバイス900によってアクセスし得る任意の他の媒体を含み得るが、これらに限定されない。本明細書では、コンピュータ記憶媒体は、信号自体を含まない。
【0176】
コンピュータ記憶媒体は、搬送波などの変調データ信号又は他の移送機構においてコンピュータ可読命令、データ構造体、プログラム・モジュール、及び/又は他のデータ・タイプを実施することができ、任意の情報配信媒体を含む。「変調データ信号」という用語は、その特性セットのうちの1つ又は複数を有する或いは信号内の情報をエンコードするような方式で変化した信号を指し得る。例として、しかし限定せず、コンピュータ記憶媒体は、ワイヤード・ネットワーク又は直接ワイヤード接続などのワイヤード媒体と、音響、RF、赤外線及び他のワイヤレス媒体などのワイヤレス媒体とを含み得る。前述のいずれかの組合せもまた、コンピュータ可読媒体の範囲に含まれるべきである。
【0177】
CPU906は、コンピュータ可読命令のうちの少なくともいくつかを実行して計算デバイス900の1つ又は複数の構成要素を制御して本明細書に記載の方法及び/又はプロセスのうちの1つ又は複数を実行するように構成され得る。CPU906は、多数のソフトウェア・スレッドを同時に処理する能力を有する1つ又は複数の(たとえば、1個、2個、4個、8個、28個、72個などの)コアをそれぞれ含み得る。CPU906は、任意のタイプのプロセッサを含み得、実装された計算デバイス900のタイプに応じて、異なるタイプのプロセッサを含み得る(たとえば、モバイル・デバイスのためのより少数のコアを有するプロセッサ、及びサーバのためのより多数のコアを有するプロセッサ)。たとえば、計算デバイス900のタイプに応じて、プロセッサは、縮小命令セット計算(RISC:Reduced Instruction Set Computing)を使用して実装されたAdvanced RISC Machines(ARM)プロセッサ、又は複合命令セット計算(CISC:Complex Instruction Set Computing)を使用して実装されたx86プロセッサでもよい。計算デバイス900は、計算コプロセッサなど、1つ又は複数のマイクロプロセッサ又は補助コプロセッサ内の1つ又は複数のCPU906を含み得る。
【0178】
CPU906に加えて又はその代わりに、GPU908は、コンピュータ可読命令のうちの少なくともいくつかを実行して計算デバイス900の1つ又は複数の構成要素を制御して本明細書に記載の方法及び/又はプロセスのうちの1つ又は複数を実行するように構成され得る。GPU908のうちの1つ若しくは複数は、統合されたGPU(たとえば、CPU906のうちの1つ又は複数とでもよく、及び/又はGPU908のうちの1つ若しくは複数は、離散GPUでもよい。実施例では、GPU908のうちの1つ又は複数は、CPU906のうちの1つ又は複数のコプロセッサでもよい。GPU908は、グラフィックス(たとえば、3Dグラフィックス)をレンダリングする又は汎用計算を実行するために、計算デバイス900によって使用され得る。たとえば、GPU908は、GPUによる汎用計算(GPGPU:General-Purpose computing on GPU)のために使用され得る。GPU908は、同時に数百又は数千のソフトウェア・スレッドを処理する能力を有する数百又は数千のコアを含み得る。GPU908は、レンダリング・コマンド(たとえば、ホスト・インターフェースを介して受信されたCPU906からのレンダリング・コマンド)に応答して、出力画像のための画素データを生成することができる。GPU908は、画素データ又は任意の他の適切なデータ、たとえばGPGPUデータ、を記憶するためのグラフィックス・メモリ、たとえば表示メモリ、を含み得る。表示メモリは、メモリ904の一部として含まれ得る。GPU908は、並行して動作する(たとえば、リンクを介して)2個以上のGPUを含み得る。リンクは、GPUに直接接続することができ(たとえば、NVLINKを使用して)、又はスイッチを介して(たとえば、NVSwitchを使用して)GPUを接続することができる。ともに結合されるとき、各GPU908は、出力の異なる部分の又は異なる出力の画素データ又はGPGPUデータ(たとえば、第1の画像の第1のGPU及び第2の画像の第2のGPU)を生成することができる。各GPUは、独自のメモリを含むことができ、又は他のGPUとメモリを共有することができる。
【0179】
CPU906及び/又はGPU908に加えて又はその代わりに、論理ユニット920は、コンピュータ可読命令のうちの少なくともいくつかを実行して計算デバイス900のうちの1つ又は複数を制御して本明細書に記載の方法及び/又はプロセスのうちの1つ又は複数を実行するように構成され得る。実施例では、CPU906、GPU908、及び/又は論理ユニット920は、方法、プロセス及び/又はその部分の任意の組合せを離散的に又は合同で実行することができる。論理ユニット920のうちの1つ若しくは複数は、CPU906及び/若しくはGPU908のうちの1つ若しくは複数の一部でもよく及び/又はそこで統合されてもよく、及び/又は、論理ユニット920のうちの1つ若しくは複数は、CPU906及び/若しくはGPU908に対する離散構成要素であっても若しくは他の方法でそれらの外部にあってもよい。実施例では、論理ユニット920のうちの1つ又は複数は、CPU906のうちの1つ若しくは複数及び/又はGPU908のうちの1つ若しくは複数のコプロセッサでもよい。
【0180】
論理ユニット920の実例は、1つ又は複数の処理コア及び/又はその構成要素、たとえば、テンソル・コア(TC:Tensor Core)、テンソル処理ユニット(TPU:Tensor Processing Unit)、画素ビジュアル・コア(PVC:Pixel Visual Core)、ビジョン処理ユニット(VPU:Vision Processing Unit)、グラフィックス処理クラスタ(GPC:Graphics Processing Cluster)、テクスチャ処理クラスタ(TPC:Texture Processing Cluster)、ストリーミング・マルチプロセッサ(SM:Streaming Multiprocessor)、木の走査ユニット(TTU:Tree Traversal Unit)、人工知能加速装置(AIA:Artificial Intelligence Accelerator)、深層学習加速装置(DLA:Deep Learning Accelerator)、論理演算ユニット(ALU)、特定用途向け集積回路(ASIC)、浮動小数点演算ユニット(FPU)、入力/出力(I/O)エレメント、周辺構成要素相互接続(PCI)又は周辺構成要素相互接続エクスプレス(PCIe)エレメント、及び/又は同類のもの、を含む。
【0181】
通信インターフェース910は、ワイヤード及び/又はワイヤレス通信を含む、電子通信ネットワークを介して計算デバイス900が他の計算デバイスと通信することを可能にする、1つ又は複数のレシーバ、トランスミッタ、及び/又はトランシーバを含み得る。通信インターフェース910は、ワイヤレス・ネットワーク(たとえば、Wi-Fi、Z-Wave、ブルートゥース(登録商標)、ブルートゥース(登録商標)LE、ZigBeeなど)、ワイヤード・ネットワーク(たとえば、イーサネット(登録商標)又はInfiniBandを介して通信すること)、低電力ワイド・エリア・ネットワーク(たとえば、LoRaWAN、SigFoxなど)、及び/又はインターネットなどの、いくつかの異なるネットワークのうちのいずれかを介する通信を可能にするための構成要素及び機能を含み得る。
【0182】
I/Oポート912は、そのうちのいくつかは計算デバイス900に内蔵(たとえば、統合)され得る、I/O構成要素914、提示構成要素918、及び/又は他の構成要素を含む、他のデバイスに計算デバイス900が論理的に連結されることを可能にすることができる。例示的なI/O構成要素914は、マイクロフォン、マウス、キーボード、ジョイスティック、ゲーム・パッド、ゲーム・コントローラ、サテライト・ディッシュ、スキャナ、プリンタ、ワイヤレス・デバイスなどを含む。I/O構成要素914は、エア・ジェスチャ、音声、又は、ユーザによって生成される他の生理的入力を処理する自然ユーザ・インターフェース(NUI:natural user interface)を提供することができる。場合によっては、入力は、さらなる処理のための適切なネットワーク要素に送信され得る。NUIは、音声認識、スタイラス認識、顔認識、生体認識、画面上での及び画面の隣でのジェスチャ認識、エア・ジェスチャ、頭部及び視標追跡、並びに計算デバイス900のディスプレイに関連するタッチ認識(さらに詳しく後述するような)の任意の組合せを実装し得る。計算デバイス900は、ジェスチャ検出及び認識のための、ステレオスコープ・カメラ・システム、赤外線カメラ・システム、RGBカメラ・システム、タッチ画面技術、及びこれらの組合せなど、深度カメラを含み得る。追加で、計算デバイス900は、動きの検出を可能にする加速度計又はジャイロスコープを含み得る(たとえば、慣性測定ユニット(IMU:inertia measurement unit)の一部として)。いくつかの実例では、加速度計又はジャイロスコープの出力は、没入型拡張現実又は仮想現実をレンダリングするために、計算デバイス900によって使用され得る。
【0183】
電力供給装置916は、ハードワイヤード電力供給装置、バッテリ電力供給装置、又はその組合せを含み得る。電力供給装置916は、計算デバイス900の構成要素が動作することを可能にするために計算デバイス900に電力を提供することができる。
【0184】
提示構成要素918は、ディスプレイ(たとえば、モニタ、タッチ画面、テレビジョン画面、ヘッドアップ表示装置(HUD)、他のディスプレイタイプ、又はその組合せ)、スピーカ、及び/又は他の提示構成要素を含み得る。提示構成要素918は、他の構成要素(たとえば、GPU908、CPU906など)からデータを受信し、データを(たとえば、画像、ビデオ、音響などとして)出力することができる。
【0185】
(例示的データ・センタ)
図10は、本開示の少なくとも1つの実施例において使用され得る例示的データ・センタ1000を示す。データ・センタ1000は、データ・センタ・インフラストラクチャ層1010、フレームワーク層1020、ソフトウェア層1030、及び/又はアプリケーション層1040を含み得る。
【0186】
図10に示すように、データ・センタ・インフラストラクチャ層1010は、資源オーケストレータ1012、グループ化された計算資源1014、及びノード計算資源(「ノードC.R.」)1016(1)~1016(N)を含み得、そこで、「N」は、任意の整数の、自然数を表す。少なくとも1つの実施例において、ノードC.R.1016(1)~1016(N)は、任意の数の中央処理装置(「CPU」)又は他のプロセッサ(加速装置、フィールド・プログラマブル・ゲート・アレイ(FPGA)、グラフィックス・プロセッサ若しくはグラフィックス・プロセッシング・ユニット(GPU)などを含む)、メモリ・デバイス(たとえば、動的リード・オンリ・メモリ)、記憶デバイス(たとえば、ソリッドステート若しくはディスク・ドライブ)、ネットワーク入力/出力(「NW I/O」)デバイス、ネットワーク・スイッチ、仮想マシン(「VM」)、電力モジュール、及び/又は冷却モジュールなどを含み得るが、これらに限定されない。いくつかの実施例において、ノードC.R.1016(1)~1016(N)のうちの1つ又は複数のノードC.R.は、前述の計算資源のうちの1つ又は複数を有するサーバに対応し得る。加えて、いくつかの実施例において、ノードC.R.1016(1)~10161(N)は、1つ若しくは複数の仮想構成要素、たとえば、vGPU、vCPU、及び/若しくは同類のもの、を含み得る、並びに/又は、ノードC.R.1016(1)~1016(N)のうちの1つ若しくは複数は、仮想マシン(VM)に対応し得る。
【0187】
少なくとも1つの実施例において、グループ化された計算資源1014は、1つ又は複数のラック(図示せず)内に収容された別個のグループのノードC.R.1016、或いは様々な地理的場所(やはり図示せず)にあるデータ・センタに収容された多数のラックを含み得る。グループ化された計算資源1014内の別個のグループのノードC.R.1016は、1つ又は複数のワークロードをサポートするように構成する又は割り当てることができる、グループ化された計算、ネットワーク、メモリ又はストレージ資源を含み得る。少なくとも1つの実施例において、CPU、GPU、及び/又は他のプロセッサを含むいくつかのノードC.R.1016は、1つ又は複数のワークロードをサポートするための計算資源を提供するために、1つ又は複数のラック内にグループ化され得る。1つ又は複数のラックはまた、任意の組合せで、任意の数の電力モジュール、冷却モジュール、及び/又はネットワーク・スイッチを含み得る。
【0188】
資源オーケストレータ1012は、1つ若しくは複数のノードC.R.1016(1)~1016(N)及び/又はグループ化された計算資源1014を構成又は他の方法で制御することができる。少なくとも1つの実施例において、資源オーケストレータ1012は、データ・センタ1000のソフトウェア設計インフラストラクチャ(「SDI」)管理エンティティを含み得る。資源オーケストレータ1012は、ハードウェア、ソフトウェア、又はその何らかの組合せを含み得る。
【0189】
少なくとも1つの実施例において、
図10に示すように、フレームワーク層1020は、ジョブ・スケジューラ1032、構成マネージャ1034、資源マネージャ1036、及び/又は分散型ファイル・システム1038を含み得る。フレームワーク層1020は、ソフトウェア層1030のソフトウェア1032及び/又はアプリケーション層1040の1つ若しくは複数のアプリケーション1042をサポートするためにフレームワークを含み得る。ソフトウェア1032又はアプリケーション1042は、ウェブベースのサービス・ソフトウェア又はアプリケーション、たとえば、アマゾン・ウェブ・サービス、グーグル・クラウド及びMicrosoft Azureによって提供されるもの、をそれぞれ含み得る。フレームワーク層1020は、大規模データ処理(たとえば、「ビッグ・データ」)のための分散型ファイル・システム1038を使用し得るApache Spark(商標)(以下「Spark」)などのフリー及びオープン・ソース・ソフトウェア・ウェブ・アプリケーション・フレームワークのタイプでもよいが、これに限定されない。少なくとも1つの実施例において、ジョブ・スケジューラ1032は、データ・センタ1000の様々な層によってサポートされるワークロードのスケジューリングを容易にするために、Sparkドライバを含み得る。構成マネージャ1034は、異なる層、たとえば、ソフトウェア層1030と、大規模データ処理をサポートするためのSpark及び分散型ファイル・システム1038を含むフレームワーク層1020、を構成する能力を有し得る。資源マネージャ1036は、分散型ファイル・システム1038及びジョブ・スケジューラ1032のサポートのためにマップされた又は割り当てられたクラスタ化された又はグループ化された計算資源を管理する能力を有し得る。少なくとも1つの実施例において、クラスタ化された又はグループ化された計算資源は、データ・センタ・インフラストラクチャ層1010にグループ化された計算資源1014を含み得る。資源マネージャ1036は、資源オーケストレータ1012と調整して、これらのマップされた又は割り当てられた計算資源を管理することができる。
【0190】
少なくとも1つの実施例において、ソフトウェア層1030に含まれるソフトウェア1032は、ノードC.R.1016(1)~1016(N)の少なくとも部分、グループ化された計算資源1014、及び/又はフレームワーク層1020の分散型ファイル・システム1038によって使用されるソフトウェアを含み得る。1つ又は複数のタイプのソフトウェアは、インターネット・ウェブ・ページ検索ソフトウェア、電子メール・ウイルス・スキャン・ソフトウェア、データベース・ソフトウェア、及びストリーミング・ビデオ・コンテンツ・ソフトウェアを含み得るが、これらに限定されない。
【0191】
少なくとも1つの実施例において、アプリケーション層1040に含まれるアプリケーション1042は、ノードC.R.1016(1)~1016(N)の少なくとも部分、グループ化された計算資源1014、及び/又はフレームワーク層1020の分散型ファイル・システム1038によって使用される1つ又は複数のタイプのアプリケーションを含み得る。1つ又は複数のタイプのアプリケーションは、任意の数のゲノミクス・アプリケーション、認知計算、並びに、トレーニング若しくは推論ソフトウェア、マシン学習フレームワーク・ソフトウェア(たとえば、PyTorch、TensorFlow、Caffeなど)、及び/又は1つ若しくは複数の実施例と併せて使用される他のマシン学習アプリケーションを含む、マシン学習アプリケーションを含み得るが、これらに限定されない。
【0192】
少なくとも1つの実施例において、構成マネージャ1034、資源マネージャ1036、及び資源オーケストレータ1012のうちのいずれかは、任意の技術的に可能な方式で取得される任意の量及びタイプのデータに基づいて任意の数及びタイプの自己書換え型アクションを実装することができる。自己書換え型アクションは、よくない可能性のある構成決定を行うこと並びにデータ・センタの十分に活用されていない及び/又は実行の不十分な部分を恐らく回避することからデータ・センタ1000のデータ・センタ・オペレータを解放し得る。
【0193】
データ・センタ1000は、1つ又は複数のマシン学習モデルをトレーニングする或いは本明細書に記載の1つ又は複数の実施例による1つ又は複数のマシン学習モデルを使用して情報を予測する又は推論するために、ツール、サービス、ソフトウェア或いは他の資源を含み得る。たとえば、マシン学習モデルは、データ・センタ1000に関して前述されたソフトウェア及び/又は計算資源を使用するニューラル・ネットワーク・アーキテクチャによる重量パラメータの計算によって、トレーニングされ得る。少なくとも1つの実施例において、1つ又は複数のニューラル・ネットワークに対応するトレーニングされた又は配備されたマシン学習モデルは、たとえば、本明細書に記載のものに限定されない、1つ又は複数のトレーニング技法を介して計算された重量パラメータを使用することによって、データ・センタ1000に関して前述された資源を使用して情報を推論又は予測するために使用され得る。
【0194】
少なくとも1つの実施例において、データ・センタ1000は、前述の資源を使用するトレーニング及び/又は推論の実行のために、CPU、特定用途向け集積回路(ASIC)、GPU、FPGA、及び/又は他のハードウェア(若しくはそれに対応する仮想計算資源)を使用することができる。さらに、前述の1つ又は複数のソフトウェア及び/又はハードウェア資源は、情報の推論をユーザがトレーニング又は実行することを可能にするためのサービス、たとえば、画像認識、音声認識、又は他の人工知能サービス、として構成され得る。
【0195】
(例示的ネットワーク環境)
本開示の実施例の実装において使用するのに適したネットワーク環境は、1つ若しくは複数のクライアント・デバイス、サーバ、ネットワーク接続型ストレージ(NAS:network attached storage)、他のバックエンド・デバイス、及び/又は他のデバイス・タイプを含み得る。クライアント・デバイス、サーバ、及び/又は他のデバイス・タイプ(たとえば、各デバイス)は、
図9の計算デバイス900の1つ又は複数のインスタンスで実装され得、たとえば、各デバイスは、計算デバイス900の類似の構成要素、特徴、及び/又は機能性を含み得る。加えて、バックエンド・デバイス(たとえば、サーバ、NASなど)が、実装される場合、バックエンド・デバイスは、データ・センタ1000の一部として含まれ得、その実例は、
図10に関して本明細書でさらに詳述される。
【0196】
ネットワーク環境の構成要素は、ワイヤード、ワイヤレス、又はその両方でもよい、ネットワークを介して互いに通信し得る。ネットワークは、複数のネットワーク、又はネットワークのネットワークを含み得る。実例として、ネットワークは、1つ若しくは複数のワイド・エリア・ネットワーク(WAN)、1つ若しくは複数のローカル・エリア・ネットワーク(LAN)、1つ若しくは複数のパブリック・ネットワーク、たとえば、インターネット及び/若しくは公衆交換電話網(PSTN)、並びに/又は1つ若しくは複数のプライベート・ネットワークを含み得る。ネットワークが、ワイヤレス電気通信ネットワークを含む場合、構成要素、たとえば、基地局、通信塔、或いはアクセス・ポイント(並びに他の構成要素)、は、ワイヤレス接続を提供し得る。
【0197】
互換性のあるネットワーク環境は、1つ又は複数のピア・ツー・ピア・ネットワーク環境(その場合、サーバはネットワーク環境に含まれないことがある)と、1つ又は複数のクライアント・サーバ・ネットワーク環境(その場合、1つ又は複数のサーバがネットワーク環境に含まれ得る)とを含み得る。ピア・ツー・ピア・ネットワーク環境では、サーバに関して本明細書に記載した機能性は、任意の数のクライアント・デバイスで実装され得る。
【0198】
少なくとも1つの実施例において、ネットワーク環境は、1つ又は複数のクラウドベースのネットワーク環境、分散型計算環境、その組合せなどを含み得る。クラウドベースのネットワーク環境は、フレームワーク層、ジョブ・スケジューラ、資源マネージャ、並びに、1つ若しくは複数のコア・ネットワーク・サーバ及び/又はエッジ・サーバを含み得る、サーバのうちの1つ又は複数で実装された分散型ファイル・システムを含み得る。フレームワーク層は、ソフトウェア層のソフトウェア及び/又はアプリケーション層の1つ若しくは複数のアプリケーションをサポートするために、フレームワークを含み得る。ソフトウェア又はアプリケーションは、それぞれ、ウェブベースのサービス・ソフトウェア又はアプリケーションを含み得る。実施例において、クライアント・デバイスのうちの1つ又は複数は、ウェブベースのサービス・ソフトウェア又はアプリケーションを使用し得る(たとえば、1つ又は複数のアプリケーション・プログラミング・インターフェース(API)を介してサービス・ソフトウェア及び/又はアプリケーションにアクセスすることによって)。フレームワーク層は、たとえば大規模データ処理(たとえば、「ビッグ・データ」)のための分散型ファイル・システムを使用し得る、フリー及びオープン・ソース・ソフトウェア・ウェブ・アプリケーション・フレームワークのタイプでもよいが、これに限定されない。
【0199】
クラウドベースのネットワーク環境は、本明細書に記載の計算及び/又はデータ・ストレージ機能(又は1つ若しくは複数のその部分)の任意の組合せを実施するクラウド計算及び/又はクラウド・ストレージを提供し得る。これらの様々な機能のいずれも、セントラル又はコア・サーバ(たとえば、州、領域、国、世界にわたって分散され得る1つ又は複数のデータ・センタなどの)から複数の場所に分散され得る。ユーザ(たとえば、クライアント・デバイス)への接続が、エッジ・サーバに比較的近い場合、コア・サーバは、機能性の少なくとも一部分をエッジ・サーバに任じ得る。クラウドベースのネットワーク環境は、プライベート(たとえば、単一の組織に制限される)でもよく、パブリック(たとえば、多数の組織に利用可能)、及び/又はその組合せ(たとえば、ハイブリッド・クラウド環境)でもよい。
【0200】
クライアント・デバイスは、
図9に関して本明細書に記載の例示的計算デバイス900の構成要素、特徴、及び機能性のうちの少なくともいくつかを含み得る。実例として、及び制限ではなく、クライアント・デバイスは、パーソナル・コンピュータ(PC)、ラップトップ・コンピュータ、モバイル・デバイス、スマートフォン、タブレット・コンピュータ、スマート・ウォッチ、ウェアラブル・コンピュータ、パーソナル・デジタル・アシスタント(PDA)、MP3プレイヤ、仮想現実ヘッドセット、全地球測位システム(GPS)又はデバイス、ビデオ・プレイヤ、ビデオカメラ、監視デバイス又はシステム、車両、ボート、飛行船、仮想マシン、ドローン、ロボット、ハンドヘルド通信デバイス、病院デバイス、ゲーミング・デバイス又はシステム、娯楽システム、車両コンピュータ・システム、組み込み型システム・コントローラ、リモート制御、器具、民生用電子デバイス、ワークステーション、エッジ・デバイス、これらの描写されたデバイスの任意の組合せ、或いは任意の他の適切なデバイスとして実施され得る。
【0201】
本開示は、コンピュータ又は、携帯情報端末若しくは他のハンドヘルド・デバイスなどの、他のマシンによって実行されている、プログラム・モジュールなどのコンピュータ実行可能命令を含む、コンピュータ・コード又はマシン使用可能命令との一般的関連において説明されることがある。一般に、ルーティン、プログラム、オブジェクト、構成要素、データ構造体などを含むプログラム・モジュールは、特定のタスクを実行する又は特定の抽象データ・タイプを実装するコードを指す。本開示は、ハンドヘルド・デバイス、家電製品、汎用コンピュータ、より特殊な計算デバイスなどを含む、様々な構成で実施され得る。本開示はまた、通信ネットワークを介してリンクされた遠隔処理デバイスによってタスクが実行される分散型コンピューティング環境において実施され得る。
【0202】
本明細書では、2個以上の要素に関する「及び/又は」の記述は、1つの要素のみ、又は要素の組合せを意味すると解釈されるべきである。たとえば、「要素A、要素B、及び/又は要素C」は、要素Aのみ、要素Bのみ、要素Cのみ、要素A及び要素B、要素A及び要素C、要素B及び要素C、或いは、要素A、B、及びCを含み得る。加えて、「要素A又は要素Bのうちの少なくとも1つ」は、要素Aの少なくとも1つ、要素Bの少なくとも1つ、或いは、要素Aの少なくとも1つ及び要素Bの少なくとも1つを含み得る。さらに、「要素A及び要素Bのうちの少なくとも1つ」は、要素Aのうちの少なくとも1つ、要素Bのうちの少なくとも1つ、或いは、要素Aのうちの少なくとも1つ及び要素Bのうちの少なくとも1つを含み得る。
【0203】
本開示の主題は、法定の要件を満たすために特異性を有して記述されている。しかしながら、その記述自体が本開示の範囲を制限することは意図されていない。そうではなくて、本発明者は、請求されている主題が、他の現在の又は未来の技術と併せて、異なるステップ又は本文書に記載されたものと類似のステップの組合せを含むように、他の形で実施され得ることを意図している。さらに、「ステップ」及び/又は「ブロック」という用語は、使用される方法の異なる要素を含意するように本明細書で使用され得るが、これらの用語は、個別のステップの順番が明示的に記載されていない限り及びそのように記載されているときを除いて本明細書で開示される様々なステップの間に何らかの特定の順番を暗示するものとして解釈されるべきではない。
【外国語明細書】