(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-28
(45)【発行日】2024-06-05
(54)【発明の名称】ルート計画計算デバイスを改良するためのデバイス及び方法
(51)【国際特許分類】
G01C 21/20 20060101AFI20240529BHJP
G01C 21/34 20060101ALI20240529BHJP
【FI】
G01C21/20
G01C21/34
(21)【出願番号】P 2022180882
(22)【出願日】2022-11-11
(62)【分割の表示】P 2019512974の分割
【原出願日】2017-09-15
【審査請求日】2022-12-12
(32)【優先日】2016-09-16
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】505035585
【氏名又は名称】ポラリス インダストリーズ インコーポレーテッド
(74)【代理人】
【識別番号】100073184
【氏名又は名称】柳田 征史
(74)【代理人】
【識別番号】100175042
【氏名又は名称】高橋 秀明
(72)【発明者】
【氏名】エリック エス フリード
【審査官】宮本 礼子
(56)【参考文献】
【文献】特開2010-257115(JP,A)
【文献】特開2013-019683(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01C 21/00-25/00
(57)【特許請求の範囲】
【請求項1】
ルート計画デバイスのルート生成器用のデータ処理方法であって、前記方法は:
ドッグレッグ除去を使用して、マップ内にあるルート内のギザギザの経路を排除してルート開始点とルート終点の間の前記ルートを生成するステップ、前記ドッグレッグ除去を使用するステップが:
地形移動コストデータに基づいて、均一なコストを有する前記マップ内の、第1の点および第2の点を有する領域を決定するステップ;かつ
前記第1の点及び前記第2の点の間のまっすぐな経路を決定することによって、前記領域内の前記第1の点および前記第2の点の間のギザギザな経路を排除するステップを含み、
前記ルートが重ねられたトラバーサルマップを生成するステップ;および
該トラバーサルマップを前記ルート生成器に表示するステップを含む、ルート生成器用のデータ処理方法。
【請求項2】
均一なコストを有する前記マップ内の前記領域の決定は、前記地形移動コストデータから、同じコスト値を有する、前記マップから少なくとも3つの隣接するセルを決定するステップを含む、請求項1記載の方法。
【請求項3】
ドッグレッグ除去を使用した前記ルートの生成は、さらに前記生成されたルート内で、セルの16点の隣接を使用して点を滑らかにするステップを含む、請求項1または2いずれか1項記載の方法。
【請求項4】
セルの前記16点の隣接の使用が、セルへの直接隣接および前記セルの8点のチェス・ナイト型の隣接に対応する前記セルの8点の隣接を使用するステップを含む、請求項3記載の方法。
【請求項5】
グラフィック処理ユニット(GPU)を有する計算システムであって、前記グラフィック処理ユニットは、
マップ内に位置するルートの開始点とルートの終点との間のルートを、ドッグレッグ除去を使用して前記ルート内のジグザグの経路を除去して生成し、前記グラフィック処理ユニットは、前記ドッグレッグ除去を使用して、
地形移動コストデータに基づき、均一なコストを有する前記マップ内の第1の点および第2の点を含む領域を決定し;かつ
前記第1の点および前記第2の点の間の直線経路を決定することにより、前記領域内の前記第1の点および第2の点の間のジグザクの経路を除去する;
ことにより前記ルートを生成し、
前記ルートが重ねられたトラバーサルマップを生成し;
該トラバーサルマップ
をルート計画デバイスに表示するように構成され
ることを特徴とする計算システム。
【請求項6】
前記グラフィック処理ユニットが、前記地形移動コストデータから、同じコスト値を有する前記マップから少なくとも3つの隣接するセルを決定することによって、均一なコストを有する前記マップ内の前記領域を決定する、請求項5記載の計算システム。
【請求項7】
前記グラフィック処理ユニットが、前記生成されたルート内の点を滑らかにするためにさらにセルの16点隣接を使用して前記ルートを生成する、請求項5または6記載の計算システム。
【請求項8】
前記グラフィック処理ユニ
ットが、セルへの直接隣接に対応する前記セルの8点の隣接および前記セルの8点のチェス・ナイト型の隣接を使用して、セルの前記16点の隣接を使用する、請求項7記載の計算システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は一般に、ルート計画デバイス及び上記デバイスを操作する方法に関する。より具体的には、本開示は、ルート計画デバイスの速度及び効率を向上させる、上記ルート計画デバイスの計算動作の改善に関する。
【背景技術】
【0002】
全地球測位システム(GPS)を採用したもの等のルート計画デバイスは、ある場所から別の場所へのルートを計画するために使用できる。A*(「Aスター(A star)」)は、ノードと呼ばれる複数の点間の効率的に走行可能な経路をプロットするために、経路探索及びグラフトラバーサルに幅広く使用されているコンピュータアルゴリズムである。A*は情報探索アルゴリズム又は最良優先探索であり、つまり、ソリューション(目標)への全ての可能な経路の中から、発生するコストが最小である(移動距離が最小である、時間が最短である等)ものを探索することによって、問題を解決し、またこれらの経路の中から、ソリューションに最も迅速にたどり着くと思われるものを最初に検討する。これは重み付けグラフで定式化される:グラフの特定のノードから開始して、該ノードから始まる複数の経路のツリーを構成し、その経路のうちの1つが所定の目標ノードにおいて終端するまで、一度に1ステップずつ上記経路を拡張する。
【0003】
ルート計画が道路に限定されている場合、限定された移動の選択肢(限定されたノードのセット)により、A*は、経路が長い経路であっても、ユーザが許容可能な期間内に経路を計算できる。しかしながら、A*によるルート計画は、時間がかかるものとなり得、特にオフロードでの移動に関しては、リアルタイムルート設定には遅すぎる場合がある。移動のための可能な領域(ノード)が道路に限定されていない場合(徒歩、又はレクリエーション用車両等によるオフロード移動等)、増加したノードがA*に殺到して、出力される経路への到達までに必要な時間を大幅に増加させる場合がある。
【0004】
また更に、ルート設定デバイスのプロセッサによるA*の命令の解釈により、ルート設定デバイス内で特定の動作が引き起こされる。A*の動作は、あるノードに関して行われる計算が他のノードに影響を及ぼす可能性を有することを禁じている。従ってノードは連続的に、一度に1つの方式で処理されるのが普通であり、複数の同時処理ソース/コアによる計算を検討する能力を有しない。これに関連して、A*の命令は、GPUで採用されているような超並列スレッド化を可能とするようには構成されていない。
【発明の概要】
【発明が解決しようとする課題】
【0005】
従って必要とされているのは、ルート設定デバイスの動作を改善するための、オフロード移動の多ノード環境で迅速かつ効率的に動作できる、デバイス及び方法である。
【課題を解決するための手段】
【0006】
本開示は、ルート生成器を操作する第1の実施形態の方法を含み、上記方法は、第1のグループ内の複数のブロックに関して、ルートトラバーサル値を同時に計算するステップであって、各上記ブロックは複数のセルを含み、上記トラバーサル値は、地形移動コストデータと、ルート終点への進行を示すデータとを、セル毎に検討した値である、ステップを含み、上記複数のブロックは、上記第1のグループ内の上記ブロックが、上記第1のグループ内の他のグループと、いずれのエッジを共有できないように選択される。
【0007】
本開示はまた、ルート生成器を操作する第2の実施形態の方法を含み、上記方法は:コストマップのセルの第1のブロックに関するデータを、グラフィック処理ユニットのキャッシュメモリにロードするステップであって、上記第1のブロック内の1つの上記セルに関するデータのロードは、上記第1のブロック内の全ての上記セルに関するデータのロードを必要とする、ステップ;及びセルの第2のセットをロードするステップであって、上記第2のセット内の各上記セルは、上記第1のブロック内にはなく、上記第1のブロック内のあるセルとエッジを共有するか、又は対角線方向に隣接する、ステップを含み、上記第1のブロック内の上記セルの数と、上記第2のセット内の上記セルの数との比は、1:8未満であり、上記セルの第1のブロックと上記セルの第2のセットとの組み合わせは、上記第1のブロックの全ての上記セルに関するトラバーサル値を生成するために必要な全てのマップデータを提供し、上記トラバーサル値は、コストデータと、ルート終点への進行を示すデータとを検討した値である。
【0008】
更に別の実施形態では、本開示は、ルート生成器を操作する方法を含み、上記方法は:ルートの決定の一部として第1のセルが処理されることになることを決定するステップ;上記第1のセルが、少なくとも2つのセルを内包する第1のブロック内にあることを決定するステップ;上記第1のブロック内の全ての上記セルを分析するために必要なデータを、第1の不揮発性メモリから、プロセッサによってアクセス可能な揮発性メモリにロードするステップであって、上記第1のブロック内の全ての上記セルを分析するために必要な上記データは、上記第1のブロック内のある1つの上記セルとエッジ及びコーナーのうちの少なくとも1つを共有する全てのセルを含む、ステップ;及び上記第1のブロック内の全ての上記セルを分析するために必要な上記データを全て上記揮発性メモリにロードした後、上記第1のブロック内の全ての上記セルを分析するステップを含む。
【0009】
これより、本発明の実施形態を図面に関連して説明する。
【図面の簡単な説明】
【0010】
【
図2】
図1のシステムが検討する例示的な土地被覆マップ
【
図3】
図2の土地被覆マップを用いて生成された、例示的なコストマップ
【
図4】
図2及び3のマップに適用されるパリティブロックの例示的なセット
【
図6】
図5の動作のルートフラッディングの動作を示すフローチャート
【
図8】例示的な論理トラバーサルブロック構成及びそれに対する影響の領域
【
図9A】
図7のブロックスウィーパーの動作を示すフローチャート
【
図10】
図7の終点セルシーダーの動作を示すフローチャート
【
図11】
図9A~Bのブロックのスウィープに関する更なる詳細を示すフローチャート
【
図12】
図7の隣接するノードの追加の後に採用されるブロックリデューサーの動作を示すフローチャート
【
図13】
図6のブロックプライオリタイザーの動作を示すフローチャート
【
図14】
図5のルートのベクトル化の動作を示すフローチャート
【
図15】ルートが重ねられたトラバーサルマップの視覚的描写を示す例示的な図
【発明を実施するための形態】
【0011】
複数の図にわたり、対応する参照符号は対応する部品を示す。本明細書に記載される適例は、本発明の実施形態を例示し、このような適例は、本発明の範囲をいかなる様式でも限定するものと解釈されないものとする。
【0012】
本明細書に開示される実施形態は、包括的であること、又は以下の「発明を実施するための形態」において開示される正確な形態に本開示を限定することを意図したものではない。寧ろこれらの実施形態は、当業者がこれらの教示を利用できるように、選択され、説明されている。
【0013】
本明細書中で使用される場合、用語「論理(logic)」又は「制御論理(control logic)」は、1つ以上のプログラマブルプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、ハードワイヤードロジック、又はこれらの組み合わせにおいて実行される、ソフトウェア及び/又はファームウェアを含んでよい。従って実施形態によると、様々な論理を、いずれの適切な様式で実装してよく、またこれは本明細書で開示される実施形態に従ったものであり続ける。
【0014】
図1は、ルート計画計算システム10を示す。システム10は、1つ以上のプロセッサ12、14、キャッシュメモリ16a、b、RAM18、及びハードドライブ20を含む。プロセッサ12は中央演算処理装置(CPU)12であり、プロセッサ14はグラフィック処理ユニット14である。各プロセッサ12、14はその上にキャッシュメモリ16a、bを有する。RAM18は、プロセッサ12及びプロセッサ14に共有されているものとして図示されている。しかしながら、各プロセッサ12、14が別個のRAM18を有する実施形態が想定される。ビデオRAM22は、GPU14による使用のためだけに及び/又はGPU14による使用のために優先的に設けられたRAMである。ハードドライブ20は従来のマスストレージデバイスである。
【0015】
コンピュータ分野では容易に理解されるように、メモリは速いほど高価になるのが一般的である。従って計算システムは、長期格納のための大型で比較的遅い不揮発性メモリを有するように設計されてきた。より小型で速いメモリの1つ以上の層も、プロセッサが現在使用している又は使用する可能性があるデータの保持のために設けられる。従ってRAM18及びビデオRAM22は、ハードドライブ20のメモリよりアクセス時間が短い。RAM18及びビデオRAM22のサイズ(データ容量)は、ハードドライブ20より小さい。同様に、キャッシュ16a、bはRAM18及びビデオRAM22よりアクセス時間が短い。キャッシュ16a、bのサイズ(データ容量)は、RAM18及びビデオRAM22より小さい。このようなサイズは必須ではないことを理解されたい。しかしながら、プライスポイントとのトレードオフで計算速度を提供することに関心が持たれているため、上述のような相対的なサイズ設定が一般的となっている。
【0016】
従ってプロセッサ(12又は14)がデータに対して動作するために、上記データを主にハードドライブ20に格納する。プロセッサ12、14がデータを要求すると、メモリ16、18、20、22は、典型的なキャッシングの形態で動作し、最も近く速いメモリ(キャッシュ16a、b)をまずチェックする。所望のデータがメモリ(16、18、20、22)のあるレベルに存在しない場合、次のレベルをチェックする。所望のデータが見つかると、該データがキャッシュ16a、b内に存在するようになり、プロセッサ12、14によって直接アクセス可能となるまで、各レベルを通して該データを引き上げる。
【0017】
キャッシュ16a、bのサイズが小さいことにより、その中に保持されるデータは多くの場合、プロセッサ12、14が現在実行中の動作のために即座に必要とするデータに限定される。メモリ間のデータの移動は、このような移動に時間がかかり、かつメモリの切り替えにビットを必要とするという点で、処理及び電力消費のオーバーヘッドを招く。
【0018】
GPU14は、巨大なバッチのデータを取得し、同一の動作を何度も極めて迅速に実行するために最適化されたプロセッサである。CPUマイクロプロセッサは、リクエストを処理する場所全体をスキップする傾向がある。CPU12は数個のコアで構成され、一度に数個のソフトウェアスレッドを処理できる。対照的に、GPU14は、同時に数千個のスレッドを処理できる数百個のコアで構成される。
【0019】
図2は、マップデータベース70に格納された土地被覆マップ200の一部分を示す。ある例では、タイルデータが、USGSデータベースから取得され、及び/又はESRI, Inc.(カリフォルニア州レッドランズ)のMapInfo等の標準的な地理情報システム(GIS)を介して取得される。土地被覆マップ200は複数のタイルに分割される(
図15を参照)。各タイルは複数のブロック210(例えば64個のブロック)を内包する。
図2は1つのこのようなブロック210を示す。各ブロック210は例えば、セル220の8×8のグリッドを含み、ブロックあたり合計64個のセルを含む。各セル220は、単一の土地タイプを内包する。従ってルート設定を目的として、セル220内の土地タイプを同種と見なす。マップデータベース70は更に、標高マップ(図示せず)を含む。
【0020】
土地被覆マップ200及び標高マップをプロセッサ12、14で処理して、コストマップ300(
図3)を生成する。この処理の更に具体的な詳細は以下で提供される。ここで提供されている例では、コストマップ300は、現在の輸送モード(歩行、車輪での搬送等)に関して、マップの各セルのトラバーサルにどの程度のコストが掛かるか、又はトラバーサルがどの程度遅いかを表す、コスト決定器96によって生成される。コスト値5=速い、15=遅い、及び∞=通行不可能を、土地被覆マップから決定されたセルの特徴に基づいて割り当てる。コストマップ300は例えば、キャッシュ16b、ビデオRAM22、及びRAM18のうちの1つ以上に保持される。ルート設定ルーチンによって考察される各輸送モードに対して異なるコストマップが生成されることを理解されたい。更に、コスト決定器96はGPU14内に位置するものとして図示されているが、より一般的には、コスト決定器96及びルート生成器80がCPU12内でインスタンス化される実施形態が想定される。
【0021】
オフロードルートを生成する際、ルートは可能性として、1個のセルから隣接する8個のセル(側面が隣接する4個のセル、及びコーナーが隣接する4個のセル)へと進むことができる。いずれのセルAから隣接するセルBに移動する場合、セルAとセルBとの間の平均コストにセルA及びセルBの中心間の距離を掛けたものに等しいコストが累積される。
【0022】
従ってルートの計算時、検討されるセルに関するいずれのコストを、プロセッサ12、14によってアクセス可能となるように、キャッシュ16a、bにロードする。よって特定の実施形態では、1回に1個のセルを検討する場合、関心対象のセル及びその周囲の8個のセルをキャッシュ16a、b内に移動させる。他のセルの検討によってこれらのセルのうちのいくつかが既にキャッシュ16a、b内にある可能性があるが、このような状態の発生は確実ではないか又は期待できない。従って各セルは潜在的には、9個のセルを記述するデータをメモリ(16、18、20)間で移動させることを要求する。換言すれば、あるセルの検討は、別の8個のセルの移動のオーバーヘッドを招く。同様に、あるセルの処理は、周囲の8個のセルのデータを検討する。
【0023】
本実施形態では、セルはブロック210のレベルにおいて処理される。
図2は、64個のセルを内包するように8×8となったブロックを示す。ブロック210の他の実施形態は、4×4、16×16、又は32×32のセルの大きさである。しかしながら、他のサイズのブロックも想定されることを理解されたい。簡単にするために、4×4のブロック410について議論する(
図4)。一般に、1辺の長さが2のべき乗個のセルとなるブロックを考察する。
【0024】
ブロック410は、どのようなチェッカーの色又はパリティであるかによって分類される。
図4に示すように、灰色のブロックはチェッカー値0を有し、白色のブロックはパリティ値1を有する。パリティ値は:
パリティ=(ブロックX+ブロックY)mod2
によって計算され、mod2は、奇数値に対して操作を行う場合は1の値を返し、偶数値に対して操作を行う場合には0の値を返す、よく知られた操作である。
【0025】
これにより、同様のパリティのブロックが対角線方向にしか互いに隣接しない「チェッカーボード(checkerboard)」タイプのパターンが生成される。同様のパリティを有するブロックは、同一のパリティを有する他のブロックとエッジを共有しない。実際にはデータに色分けがあるわけではなく、ブロック410に割り当てられるパリティ値が存在するだけであることを理解されたい。ここでは理解を容易にするために、色分けが議論及び図示されている。このパリティの割り当ての有用性については、以下で更に議論する。
【0026】
各ノード/ブロックはキー値を含む。キー値は、ノードの優先順位(又は関連するルート設定情報を提供する上で考えられる重要性)を示す。キー値が低いノードは高い重要性を有するものとして示され、より早期に処理されるようスケジュール設定されることになる。
【0027】
所与のルート設定作業に関して、システム10はコストマップ300を用いてトラバーサルマップを生成する。ルート生成器80は例えば、コードを実行するプロセッサ14である。しかしながら、ルート生成器80が別個の論理である実施形態も想定される。ルート生成器80はトラバーサルマップ1500を生成し、これは、そのコストマップとの1:1セル対応を有する(コストマップ300はトラバーサルマップ1500に対応しない)。ルート生成器80の動作を
図5に示す。探索初期化により、コストマップと同一サイズの初期トラバーサルマップを生成し、ルート探索の開始に備える(要素510)。ルートフラッディングは、ルート開始点から探索領域をフラッディングし、上記トラバーサルマップを、ルート始点からルート終点まで到達するための累積コストを表す有限値で更新する(要素520)。本明細書中で使用される場合、用語「フラッディング(flooding)」及び「フラッディングする(flood)」は、ルートを生成してルートマップを配置するプロセスを指す。
図15の模式図では、ルート探索、生成及び/又は配置が、ルート始点から、まるでそこに水源が存在し、そこから水が流れ出て探索領域を溢れさせるかのように、外側に拡大されていくことを理解されたい。遡行初期化により、決定されたルートをルートフラッダー(flooder)が遡行する準備を行う(要素530)。遡行をルートフラッダーによって実施し、探索領域をルート終点から始点に戻るようにたどり、トラバーサル値の符号を正から負に反転させる(要素540)。ルートのベクトル化は、負のトラバーサル値の流れをたどり、最終的なルートを表す座標のリストを構築する(要素550)。全体として、トラバーサル値は、地形移動コストデータと、ルート終点への進行を示すデータとを、セル毎に検討して、検討された各セルに関するトラバーサル値に到達することを理解されたい。
【0028】
探索イニシャライザー85による探索初期化(510)は、システム10を初期化することにより、ルートフラッディングの動作及びルート探索の実施を提供する。フラッドモードは、後でルートのスウィープに使用されるトラバーサルモードに設定される(フラッドモードはトラバーサル又は遡行に設定できる)。トラバーサルマップは、コストマップと1:1のセル比を有するマップを生成することによって初期化される。上記トラバーサルマップは、全てのセルに無限の値(走行不可能)が与えられるように設定される。現在のノードのリストを、上記リストが開始位置を含むノードを含むように生成する。あるブロックにわたって探索を実施する場合、ブロックのある辺から別の辺へと処理を行う(スウィープ)によって、セルを検討する。スウィープは4方向(上、下、左、右)に実施できる。初期化により、4つのスウィープ方向全てが可能となるようにも設定される。このスウィーププロセスについては、以下で更に議論する。
【0029】
ルートフラッダー90によるルートフラッディング(要素520)は、「第1の草案(first draft)」ルートを生成するプロセスである。ルートフラッディングは、現在のノードのリスト内に未処理のノードが存在する限り(要素610)、及び最大反復回数を超えない限り(要素620)、行われる。許容される反復の回数は、ルート始点と終点との間の距離に基づいて変化する。ルートフラッディングの第1の部分は、現在の探索に最も関連しそうな領域がどれかを理解することである。これは、ブロックプライオリタイザーを用いて達成される。上記ブロックプライオリタイザーは、現在のノードのリスト中のノードを、現在処理されるべきノードと、後で処理されるべきノードとに分ける(要素630)。現在処理されるべきノードは、現在のノードのリスト内にとどまる。後で処理されるべきノードは、将来のノードのリストに移動される。
【0030】
本実施形態では、ノードはブロックである。本実施形態は、セルのエッジではなくセルに関して、コスト及びトラバーサル値を追跡する。従って、以前のルート設定操作が各セルに関して8個(側部及びコーナーが隣接するトラバーサル点それぞれに関して1個)のトラバーサル値を生成していたが、本実施形態は各セルに関して、8個ではなく単一の値で動作する。
【0031】
現在のノードのリスト内の各ノードに関して、ブロックを処理する(要素640)。この実行により、与えられたブロックに関してトラバーサルマップが更新され、影響を受けたいずれの近隣のブロックに関するノードが、隣接するノードのリストに追加される。GPU14では、現在のノードのリスト中のブロックを、それぞれの(以下で議論されるパリティチェックを既に受けた)ストリーミングマルチプロセッサ上で並列に実行できる。
【0032】
現在のノードのリスト中の全てのノードを処理した後(現在のノードのリスト内にノードがそれ以上存在しない(要素610))、将来のノードのリスト及び隣接するノードのリストが空ではない(要素660)限り、将来のノードのリスト及び隣接するノードのリストからのノードを現在のノードのリストに移動させて処理する(要素650)。
【0033】
ノード/ブロックの処理(要素640)に関して、
図7を参照して更なる詳細を示す。まず、現在のブロックに関するトラバーサルマップをロードする(要素710)。上述のように、初期化時に、上記トラバーサルマップには、全てのセルに関する無限値が配置される。あるブロックをロードする際、この要素810の全てのセルを、1セル幅のパディングリング820と共にロードする(
図8)。パディングリング820は、実際に(側方及び対角線方向に)隣接するブロックの一部であるセルから構成される。トラバーサルセルの変化はその近隣のセルのうちのいずれかに影響を及ぼし得るため、トラバーサルブロックのエッジに沿ったセルにおけるいずれの変化は、特定の隣接するトラバーサルブロックのセルに影響を及ぼし得る。ある隣接するブロックに影響を及ぼす、トラバーサルブロックのエッジのセルのセットは、この隣接するブロックの影響領域の一部であると表現される。従って、要素810内のセルに影響を及ぼす可能性のあるセルの包括的なリストが処理の一部として存在するように、パディングリング820がロードされる。セルを一度に1個処理する場合、パディングリングのロードにより、1個のセルに対して8個のパディングのセルが提示される(即ちパディングのオーバーヘッドと処理されるセルとの比が8:1である)。この(少なくとも)64セルのブロックの例は、ブロックの64個のセルに対して、36個(以下)のパディングのセルを提示する。これは、0.5625:1という、パディングのオーバーヘッドと処理されるセルとの比を提示する。従ってブロックの処理は、およそ14倍のオーバーヘッドの低減を提供する。よって本実施形態は、8:1未満であるパディングとセルとの比を考察する。実際には、16個のセルを有するブロックでは、パディングは20個以下のセルを有する。一般に、パディングに必要なセルの個数は、ブロックの幅(セルの個数で表される)の4倍に(コーナーの)4を加えたものである。
【0034】
次に、現在処理されているブロックに対応するコストマップもロードする(要素720)。コストマップもまた同様に、1セル幅のパディングリングと共にロードされる。次にブロックのハッシュ値をゼロに設定する(ブロックのハッシュについては以下で更に詳細に議論する)(要素730)。
【0035】
システム10は、優先順位指定済みリスト中のノードを用いて、探索作業項目をスケジューリングする。作業項目はエッジを用いずにトラバーサルセルのブロックとして表され、これにより、作業項目の数及びスケジューリングのオーバーヘッドが低減される。換言すれば、システム10は本質的にラスターベースであり、各ブロックを単一のノードとして表現する。ルートマッピングシステムの他の実施形態は、グラフのベクトルベースの表現、即ち全ての頂点及びエッジの明示的なセットに依存し、これらの実施形態は接続された各縁部に対して1個ずつの8個のノードを用いて各セルを表現するが、各ブロックを単一のノードとして提供することにより、約8倍の(各セルエッジを考慮する必要がないため、1ブロック中のセルの個数倍、例えば8×32×32=8192倍の)メモリ要件の低減が提供される。このメモリ要件の低減により、計算スループットは大幅に改善され、サポートできるルート探索のサイズが増大する。
【0036】
上述のように、各ブロックは8個の隣接するブロックを有する。現在のブロックの外縁部のセルに関するトラバーサル値の変化は、隣接するブロック内のセルに関する値に影響を及ぼす可能性がある。ハッシュ値は、これらの外側のセルに関するトラバーサル値が変化する時を追跡し、ハッシュ値をこのブロックに関して調整する。従ってハッシュ値は、現在のブロックに対する操作によってどの隣接するブロックが変化する可能性があるかを追跡する。よってハッシュ値の変化により、適切な隣接するブロックが識別され、「隣接するノード(Adjacent Node)」のリストに入れられる。
【0037】
よって、ブロックの処理はまず、ブロックのハッシュをゼロに設定する(要素730)。次に、処理されるブロックに関するトラバーサルマップの初期状態に基づいて、前処理ハッシュが設定される(要素740)。ハッシュは、ブロック内のデータにハッシュ関数を適用して、各セル内のデータを表す値を出力することによって設定される。次に終点をシードする(要素745)。終点のシードは、ルートの根源の場所の値を、イプシロンのトラバーサル値(1.4×10-45)を有するように設定することを含む。(以下で議論する遡行モードの場合、終点のシードは、ルート終点に関連付けられた値の(正から負への)反転を含む)。(以下で議論する)スウィープ操作を実施する際、トラバーサルマップに対するいずれの修正が必要に応じて行われる(要素750)。ブロックが処理されると、ハッシュ操作をトラバーサルマップに再び適用して、トラバーサルマップのハッシュを生成する(後処理、要素760)。この後処理ハッシュを、いずれの正の値が負になり、いずれの負の値が正に変わるように、反転させる。続いてこの後処理ハッシュを前処理ハッシュに加える。この操作は、前処理ハッシュと後処理ハッシュとを比較する役割を果たす(要素770)。所与のセルに対して変化がない場合、前処理ハッシュと反転された後処理ハッシュとは、上記加算中に互いを相殺する。従って、前処理ハッシュと後処理ハッシュとの合計がゼロでない、影響領域内のいずれのセルは、変化したものとして識別される。このような変化したセルによって影響される可能性のある隣接するブロックは、影響される各ブロックに関して新たなノードを生成することによって更に処理されることになる隣接ブロックとして識別される(要素780)。このような影響されるブロックを、隣接するノードのリストに加える(要素790)。
【0038】
ある好適なハッシュ関数は、IEEE‐754仕様の32ビット浮動小数点から32ビット整数へのビット単位コピーであり、これはC/C++及び他の同様のプログラミング言語での演算である:
int HashFunction(float traversal) {
int hash = *(int *)(&traversal);
return hash;
}
図10は、終点シード操作(要素745)の更なる詳細を示す。終点のシードはまず、採用するフラッドモード(トラバーサル又は遡行)を決定する(要素1010)。遡行モードに関しては後述する。フラッドモードがトラバーサルである場合、システム10は、ルートの始点が現在のトラバーサルブロック内にあるかどうかを決定する(要素1020)。ルートの始点が現在のトラバーサルブロック内にある場合、この始点セルにイプシロン(ε)の値を与える(要素1030)。これは、ゼロよりも明確に大きい、最小の数である。コストは全くかからず、いかなる距離も移動しない(始点に到達する)。しかしながら上記システムは、遡行フラッドモードでは正の数を負の数から区別するため、εの使用によって両方の目的が達成される。
【0039】
フラッドモードが遡行である場合、システム10は、ルートの終点が現在のトラバーサルブロック内にあるかどうかを決定する(要素1040)。ルートの終点が現在のトラバーサルブロック内にある場合、この終点セルに、反転させた値を与える(トラバーサル値5は-5に変更される)(要素1050)。
【0040】
図9A~Bは、スウィープ操作(
図7の要素750)の更なる詳細を示す。ブロックのスウィープは、最高4回のスウィープ(上/北「N」、下/南「S」、左/西「W」、及び右/東「E」)を含む可能性がある。最初にブロックを受け取ると、4回のスウィープ全てを実施するようにスケジューリングする。従って該ブロックは、スウィープレジスタ内に、4回全てのスウィープ(N、S、E、W)が保留中であることを表す、該ブロックに関連付けられた指標を有する。過去の処理と、その後の1つ以上の隣接するブロックの処理とが、このブロックが変化した可能性があることを示すことを理由として、このブロックが処理のために入力された場合、スウィープレジスタによって、全てのスウィープより少ないスウィープをスケジューリングしてよい。
【0041】
このスウィーププロセスはまず、現在検討されているブロックに関していずれのスウィープが保留中であるかどうかを決定する(要素910)。少なくとも1つのスウィープが保留中である場合、システム10はスウィープの実行を開始する。「スウィープの実行(executing sweep)」に関する更なる詳細は、
図11を参照して後に提供する。システム10はまず、「N」のスウィープが保留中であることを確認するためにチェックを行う(要素915)。保留中でない場合、システム10は、「S」のスウィープが保留中であるかどうかの確認に進む(要素940)。
【0042】
Nのスウィープが保留中である場合、Nのスウィープを実行する(要素920)。結論として、スウィープレジスタを、Nのスウィープが完了したことを反映するように更新する(要素925)。次にシステム10は、Nのスウィープがいずれのトラバーサル値を変化させたかどうかを決定する(要素930)。いずれのトラバーサル値も変化していなかった場合、システム10は、「S」のスウィープが保留中であるかどうかの確認に進む(要素940)。Nのスウィープが少なくとも1つのトラバーサル値を変化させていた場合、スウィープレジスタを、E及びWのスウィープを保留中としてマークするように更新する(要素935)。E及びWのスウィープは既に保留中として留意されている場合があることを理解されたい。続いてシステム10は、「S」のスウィープが保留中であるかどうかの確認に進む(要素940)。
【0043】
Sのスウィープが保留中でない場合、システム10は、「E」のスウィープが保留中であるかどうかの確認に進む(要素965)。Sのスウィープが保留中である場合、Sのスウィープを実行する(要素945)。結論として、スウィープレジスタを、Sのスウィープが完了したことを反映するように更新する(要素950)。次にシステム10は、Sのスウィープがいずれのトラバーサル値を変化させたかどうかを決定する(要素955)。いずれのトラバーサル値も変化していなかった場合、システム10は、「E」のスウィープが保留中であるかどうかの確認に進む(要素965)。Sのスウィープが少なくとも1つのトラバーサル値を変化させていた場合、スウィープレジスタを、E及びWのスウィープを保留中としてマークするように更新する(要素960)。ここでも、E及びWのスウィープは、開始値、Nのスウィープからの変化等によって、既に保留中として留意されている場合があることを理解されたい。続いてシステム10は、「E」のスウィープが保留中であるかどうかの確認に進む(要素965)。
【0044】
Eのスウィープが保留中でない場合、システム10は、「W」のスウィープが保留中であるかどうかの確認に進む(要素990)。Eのスウィープが保留中である場合、Eのスウィープを実行する(要素970)。結論として、スウィープレジスタを、Eのスウィープが完了したことを反映するように更新する(要素975)。次にシステム10は、Eのスウィープがいずれのトラバーサル値を変化させたかどうかを決定する(要素980)。いずれのトラバーサル値も変化していなかった場合、システム10は、「W」のスウィープが保留中であるかどうかの確認に進む(要素990)。Eのスウィープが少なくとも1つのトラバーサル値を変化させていた場合、スウィープレジスタを、N及びSのスウィープを保留中としてマークするように更新する(要素985)。続いてシステム10は、「W」のスウィープが保留中であるかどうかの確認に進む(要素990)。
【0045】
Wのスウィープが保留中でない場合、システム10は、いずれのスウィープが保留中であるかどうかの確認に戻る(要素910)。Wのスウィープが保留中である場合、Wのスウィープを実行する(要素992)。結論として、スウィープレジスタを、Wのスウィープが完了したことを反映するように更新する(要素994)。次にシステム10は、Wのスウィープがいずれのトラバーサル値を変化させたかどうかを決定する(要素996)。いずれのトラバーサル値も変化していなかった場合、システム10は、いずれのスウィープが保留中であるかどうかの確認に進む(要素910)。Wのスウィープが少なくとも1つのトラバーサル値を変化させていた場合、スウィープレジスタを、N及びSのスウィープを保留中としてマークするように更新する(要素998)。続いてシステム10は、いずれのスウィープが保留中であるかどうかの確認に進む(要素910)。
【0046】
最終的に、スウィープは、トラバーサル値に変化を発生させなくなり、これによりトラバーサル値は定常状態に到達する。これが起こると、変化がないことにより、全てのスウィープを完了させることができ、他のスウィープを要求することはなくなる。保留中のスウィープが存在しない状態で、システム10はトラバーサル値の保存に進む(要素915)。保存を行うと、システム10は動作を継続し、後処理ハッシュを実行する(要素760)。
【0047】
上述のように、多くの場合、スウィープはトラバーサル値を変化させ、具体的にはトラバーサル値を、所与のブロックのエッジに沿って変化させ、このトラバーサル値の変化が、隣接するブロック内のセルに関する計算に影響を及ぼす可能性がある。このような影響されたブロックを、隣接するノードのリストに加える(要素790)。隣接するノードのリストにブロックを加えるステップは、加えられるノードに関するプロパティを確立するステップを含む。これらのプロパティとしては、キー値(これは上記ノードの優先順位を決定する)、上記ノードの場所(潜在的には座標のセット)、及び初期スウィープ(該ブロックの処理時に実施されるスウィープ操作)が挙げられる。
【0048】
キー値は、例えば以下の式によって決定される:
キー=min(影響領域内のトラバーサルセル)+最小コスト*到達距離。
【0049】
「影響領域内のトラバーサルセル(traversal cells in region of influence)」は、現在のブロック内の、検討対象の隣接するセルの境界をなすセルであり、従って、隣接するブロックがロードされていた場合、この「影響領域内のトラバーサルセル」も、上記ブロックに関するパディングリングの一部としてロードされていることになる。8×8セルのブロックにおいて、側方に隣接するブロックに関して、システム10は8個の、影響領域内のトラバーサルセルを予想する。対角線方向に隣接するブロックに関しては、システム10は1個の、影響領域内のトラバーサルセルを予想する。よって上記式の「min( )」の部分は、関連するグループから最小のトラバーサル値を有するセルを見出し、その値を使用する。
【0050】
「最小コスト(Minimum Cost)」は、可能な最小コストのセルの値である。一例として、可能な最小コスト値は「5」である。到達距離は、影響領域内のあるセルから、隣接するブロック内の最も近いセルへ移動するための距離(セルの長さを単位とする)である。北、南、西又は東の直近に隣接するブロック(側方に隣接)に関しては、到達距離は1である。4つの対角線方向に隣接するブロック(対角線方向に隣接)に関しては、到達距離は√2である。
【0051】
上述のように、「スウィープ操作(sweeping)」は、トラバーサルセル値を更新するものである。このスウィープ操作は、4方向(N、S、E、W)で行われる(要素920、940、970、992)。
図11は、スウィープ操作が何を伴うかについての更なる詳細を提供する。ブロックのスウィープ操作は、ブロックを上記4方向のうちの1つにおいてスウィープすることに焦点を当てており、各スウィープは等しく、各セルに関する8個の近隣のセルのうちの3つを評価する。
【0052】
まず、いずれのトラバーサルブロックセルがブロックのスウィープによって修正されたかどうかを示すブール値であるSweeper Changed TraversalがFalseに設定される(要素1110)。この時点において、システム10は、ランク値を後方から前方へと反復するための外側のforループを確立する(要素1120)。ここでランクは、W若しくはEのスウィープに関するブロック内のセルの列、又はN若しくはSのスウィープに関するブロック内のセルの行である。プロセッサXXがCPUである場合、全てのセル(行)を通して反復する内側のループが存在する(要素1130)。プロセッサXXがGPUである場合、ある行の全てのセルが、それぞれの別個のストリーミングプロセッサ上で同時に実行される。処理時、各セルに関して、「後方(back)」「後方左(back left)」及び「後方右(back right)」セルが識別される(要素1140)。方向「後方」、「後方左」及び「後方右」は、スウィープの方向を基準とする。また、トラバーサルセルの現在の値を「現在のセル(current cell)」に設定することによって、変化したトラバーサル値を後で決定できる。
【0053】
後方セルからのトラバーサル値は、以下のように決定される(要素1150):
後方からのトラバーサル=トラバーサル(後方セル)+1/2*(コスト現在のセル)+コスト(後方セル))
後方左セルからのトラバーサル値は、以下のように決定される:
後方左からのトラバーサル=トラバーサル(後方左セル)+√2/2*(コスト(現在のセル)+コスト(後方左セル))
後方右セルからのトラバーサル値は、以下のように決定される:
後方右からのトラバーサル=トラバーサル(後方右セル)+√2/2*(コスト(現在のセル)+コスト(後方右セル))
続いて、「後方」、「後方左」及び「後方右」セルから現在のセルに到達するためのコストを計算して、最小コストの可能性を見出すことにより、現在のトラバーサル値を決定する。これを実施するために、上記システムは、現在のフラッドモード(要素1160)に応じて、トラバーサルセルオプティマイザー(要素1170)又はトラバーサルセルリトレーサー(要素1180)を動作させて、古い値及び3つの後方トラバーサル値に基づいて適切な新しいトラバーサルセル値を計算する。現在のトラバーサルセルが修正されている場合、いずれのモジュールは、Sweeper Changed TraversalをTrueに設定する。
【0054】
所与のランクの値は、1つ前のランクからの値のみに左右されることを理解されたい。従ってあるランク内の複数のセルをGPUで同時に処理できる。というのは、同時処理されるセルは互いに独立しているためである。
【0055】
フラッドモードがトラバーサルである場合、トラバーサルセルオプティマイザーをブロックのスウィープに使用して、トラバーサルセルがどのように値を変更し、最良のルートの探索を伝播するかを定義する。これは以下のように動作する:
まず、システム10は新しいトラバーサル値を評価する:
トラバーサル(現在のセル)=min({古いトラバーサル,後方からのトラバーサル,後方右からのトラバーサル,後方左からのトラバーサル})。
【0056】
abs(トラバーサル(現在のセル)-古いトラバーサル)>トレランスである場合、Sweeper Changed Traversalの値をTrueに設定する。これによりシステム10は、このトラバーサルブロックの既知の最良の経路が更に改善されていること、及び異なる複数の方向の更なるスウィープが要求されていることを把握する。
【0057】
フラッドモードが遡行である場合、以下で更に議論するように、ブロックスウィーパーによってトラバーサルセルリトレーサーが使用される。
【0058】
隣接するノード中の各ノードに関して、システム10は、ノードに関するヒューリスティック関数を計算し、これをノードのキーに加える(要素642)。公知のA*アルゴリズムと同様に、キーは、それまでに累積された合計コストと、目標までのヒューリスティックコスト又は推定コストとを足したものを表す。隣接するノード中のノードのキーは合計コスト又はトラバーサルのみを表す。
【0059】
ヒューリスティック関数は、ルートの最後のセルから、ブロック内の最も近いセルまでの距離に、最小コストマップを掛けたものとして計算される。これを計算するために、システム10は、水平距離dx=maxf0({終点X-(ノードX*B+(B-1)),(ノードX*B)-終点X,0})を計算し、ここで中括弧内の第1の項は、ルートの終点がブロックの東側の場合のdxを決定し、第2の項は西側の場合であり、第3の項は終点がブロックの西側及び東側境界内にある場合である。次にシステム10は、計算垂直距離dy=maxf0({終点Y-(ノードY*B+(B-1)),(ノードY*B)-終点Y,0})を計算する。続いてシステム10は、距離d=√(dx^2+dy^2)を計算する。そしてヒューリスティック関数は、d*最小コストとして計算される。
【0060】
ルートフラッダーが現在のノード中の全てのブロックを実行した後、現在のノードをクリアできる(要素645)。残りの作業は、将来のノードのリスト及び隣接するノードのリストに見出される。次のブロックプランナーは、隣接するノード中のノードに優先順位を付け、現在のノードのリストを、隣接するノードのリストと将来のノードのリストとを連結したもので置換し、ブロックリデューサーを呼び出すことによっていずれの重複したノードをマージする(要素650)。
【0061】
隣接するノードの加算(要素790)及び次のブロックのプランニングにより、更なるノードが現在のノードのリストに、他のノードがリスト内に既にあることを検討することなく加えられるため、重複したノードが存在する場合がある。ブロックリデューサーは、同一ブロックを表す複数のノードインスタンスがどこに存在するかを発見し、これらを1つにまとめる。複数のノードをまとめる際、ブロックリデューサーは、まとめられたインスタンスが元のインスタンスの情報を十分にキャプチャしていることを提供する。例えばノードAが北及び東の初期スウィープを有し、ノードBが南及び東の初期スウィープを有していた場合、まとめられたノードは、北、南及び東の初期スウィープを有する。同様に、ノードAが100のキーを有し(優先順位が高い)、ノードBが800のキーを有する(優先順位が低い)場合、まとめられたキーは100となる。
【0062】
より具体的には、ブロックリデューサーは
図12に示すように動作する。ブロックリデューサーは、現在のノードのリストに何個のノードが存在するかを確認するためにチェックを行う。現在のノードのリスト中に2個未満のノードが存在する場合(要素1210)、要素1260までスキップする。3個以上のノードが存在する場合、ブロックリデューサーはノードのSortBy値を、ノードX XOR(ノードY<<13)に等しくなるように設定し続け、ここでXORは論理排他的OR演算であり、「<<」は論理ビットシフトレフト演算であり、これらの演算はいずれも、いずれのソフトウェアプラットフォームで容易に利用可能である。XOR及び<<演算は、ほとんど全てのプロセッサで利用可能な周知の演算である。SortByプロパティはハッシュコードとして機能し、同一のブロックを表すいずれのノードが同一のSortBy値を有することができる。これを現在のノード中の各ノードに対して行う(要素1215)。
【0063】
次に、現在のノードのリスト中のノードを、そのSortByプロパティによってソートする(要素1220)。例えばCPU上でのQuicksort又はGPU上でのBitonic Sortといったプログラムを、このプロセスのために実例として使用する。ソートの方向は問題にならない。問題は、同一のブロックに関するノードが、ソート済みのリスト内で互いに隣接することである。
【0064】
次にブロックリデューサーは、2つのノードポインタを初期化する。ノードAは、現在のノード中の第1のノードで始まり、ノードBは第2のノードで始まる(要素1225)。
【0065】
次にシステムは、ノードBが現在のノードの最後にあるかどうかをチェックする(要素1230)。ブロックリデューサーが現在のノードの最後にある場合、要素1260に進む。ブロックリデューサーが現在のノードの最後にない場合、ブロックリデューサーは、ノードAの値がノードBの値に等しいかどうかを確認する(要素1235)。これらが等しくない場合、ノードAをノードBの値に設定し(要素1240)、ノードBを、現在のノード中の次の値に向くように1だけ増分させる(次のノードAは以前のノードBとなる)(要素1242)。ノードA及びノードBが同一の値を有することが分かる場合、重複するノードが発見されている。ノードマージャをこれらのノードに対して動作させて、これらのノードのプロパティをマージし、各ノードから情報(キー値、スウィープ)をまとめられたノードへと抽出し、これをノードAとして保存する(要素1245、1250)。ノードBに関するキー値は無限に設定され、これによって削除のためにマークされる(要素1255)。次にノードBを、現在のノードのリスト中の次のノードに向くように前進させ、ブロックリデューサーは要素1230に戻る。
【0066】
現在のノードのリストを処理した後、ブロックリデューサーは、無限のキー値を有する現在のノードのリスト中のノードの除去に進む(要素1260)。
【0067】
図13は、要素630(
図6)のブロックプライオリタイザーの実行に関する更なる詳細を提供する。ブロックプライオリタイザーは、現在のノード中のノードに優先順位を付け、後で処理されるいずれのノードを将来のノードに移動させることによって、保留中のトラバーサルブロックのうちのいずれを、ブロックエグゼキューターにおいて次に処理するべきかを決定する。現在のノード中の残りのノードを選択して、これらをいずれの順序で、又は並列でも、ブロックエグゼキューターによって処理できる。選択されるノードは、最小のキーを有する(即ち優先順位が最も高い)ノード及び同様の小さなキーを有する他のいずれのノード(要素1310)、並びに同一のブロックパリティ(
図4を参照)を有するノード(要素1320)を含む。キーがどの程度類似しているかは、キーカットオフ値によって決定され、これは所望の性能のために実験によって微調整できる(要素1330)。図示されている例では、カットオフは、最小コスト値に「B」の25倍を掛けたものに等しい(Bはあるブロックのあるランク(又はファイル)内のセルの数である。数25は、好適な個数のブロックを、ブロックの再処理を過剰に必要とすることなく処理できるようにするために、経験的に選択されたものである)。同一のパリティの全てのノードを選択することにより、これらがエッジ上で互いに接触しない(コーナーにおいてのみ接触する)ことを保証して、これらの相互依存性を最小化し、並列実行をサポートする。MinParity値はPartity(MinNode)に設定され、これにより、最小コストのノードが、次の処理ウェーブで使用するパリティを定義する(要素1320)。カットオフキーの設定後、将来のノードのリスト及び隣接するノードのリストをクリアする(要素1340)。次に、現在のノードのリスト中のどのノードが、カットオフキーより大きなノードキーを有するか、又はMinParityとは異なるパリティを有するかを決定する(要素1350)。このようなノードを現在のノードのリストから除去し、将来のノードのリストに付加する(要素1360)。
【0068】
遡行初期化(要素530)は、遡行イニシャライザー92によって実施される。遡行初期化は、システム10を第2の実行のために再構成するか、又はルートフラッダーを、ルート遡行を実施するように再構成する。遡行イニシャライザーは、フラッドモードを「遡行(Retrace)」に設定する。遡行イニシャライザーはまた、現在のノードのリストを、ルート終点を含むブロックを有する単一のノードを内包するように設定し、また上記ノードに関するスウィープ方向を設定する。
【0069】
次にシステム10は、生成されたルートの遡行に進む。フラッドモードが遡行である場合、トラバーサルセルリトレーサーをブロックスウィーパー(ブロックスウィープコードを実行するプロセッサ)が用いて、最終的なルート内にあるいずれのトラバーサルセルをマークする(要素540)。ルート始点から全ての方向にトラバーサルマップを拡張するトラバーサルセルオプティマイザーとは異なり、トラバーサルセルリトレーサーは、ルート終点から始点に戻るまでのトラバーサルセルの細い道筋のみを更新する。トラバーサルセルリトレーサーは、ルートの一部であるトラバーサルセルをマークし、その符号を反転させて負にする。これは以下のように動作する。
If:
1.古いトラバーサル>0、かつ
2.以下のうちの1つがTrue:
a.abs(古いトラバーサル+後方セルからのトラバーサル)<トレランス、
b.abs(古いトラバーサル+後方左セルからのトラバーサル)<トレランス、又は
c.abs(古いトラバーサル+後方右セルからのトラバーサル<トレランス、
Then:
1.トラバーサル(現在のセル)=-(古いトラバーサル)、即ち現在のセルを最終的なルートの一部としてマークする。
【0070】
2.Sweeper Changed TraversalをTrueに設定する。即ちルートエグゼキューターに、異なる複数の方向の更なるスウィープが必要であることを通知する。
【0071】
上述の条件を更に説明すると:条件1は、現在のトラバーサルセルが最終的なルートの一部としてまたマークされていないことを保証することにより、二重に戻ること又はループに囚われることを防止する。条件2aは、トレランスが実際にはゼロであるため、古いトラバーサルと後方セルからのトラバーサルとが等しくかつ反対であるかどうかをチェックする。条件1及び2aがいずれも真である場合、後方セルからのトラバーサルが負であると推論でき、従って後方セルは最終的なルートの一部として既にマークされたものである。また、遡行プロセスの開始前に古いトラバーサルと後方セルからのトラバーサルとが等しく、従って現在のセルは後方セルへの最速の経路の一部であると結論付けることもできる。よって、トラバーサル(現在のセル)をマークするべきである。条件2b~cは、これらが後方及び後方左の近隣のセルに適用される以外は、条件2aと同一である。
【0072】
次に、ルートベクトライザー94によってルートをベクトル化する(要素550)。ルートベクトライザー94は例えば、コードを実行するプロセッサである。ルートベクトライザー94の動作に関する更なる詳細を
図14に提供する。ルートベクトライザー94は、ルート生成のブロック及びセルから最終的なルートを定義する頂点のリストを生成する。ルートベクトライザー94は、ルートの終点のトラバーサルセルで開始され、始点セルに向かって逆方向に動作する。各点において、ルートベクトライザー94は、どの隣接するセルが最大の負のトラバーサル値を有するかを見出し、その点をルート点のリストに加え、その点へと進む。ルートの始点に到達すると、ルート点のリストを逆転させて、マップセル座標に最終的なルートを生成する。
【0073】
ルートベクトライザー94はまず、ルート点をクリアする(要素1410)。続いてルート終点を始点に設定する(要素1420)。ルート終点(ベクトル化の始点)をルート点リストに付加する(要素1430)。次にルートベクトライザー94は、これがルート始点に到達するかどうかを確認するためにチェックを行う(要素1440)。ルート始点に到達しない場合、ルートベクトライザー94は、現在検討中のセル(最初はルートの終点)に隣接する全てのセルをチェックして、最大値の負の値(-イプシロンが最大値を有する負の値となる)を有するセルを見つける(要素1450)。発見された点を、ルート内の次の点として設定し(要素1460)、ルートに付加する(要素1470)。この要素1450、1460及び1470のプロセスを、ルートベクトライザー94がルートの始点に到達するまで繰り返す。ルートベクトライザー94がルートの始点に到達すると、ルートは、ルート終点からルート始点まで連なる頂点のリストで構成される。よって、次にこれらのルート点を逆転させることによって、ルートを定義する頂点のリストを生成する(要素1480)。
【0074】
長さ50マイル(80.4672km)等の長いルートに関しては、探索する必要がある領域は極めて大きい。このような大きな領域を表すために十分に、コストマップ及びトラバーサルマップを大きくするには、相当量のメモリを割り当てる必要があり得る。BlockSwathは:1)マップ上のセルのいずれのブロックに対する迅速なランダムアクセスを提供し;2)メモリの無駄を削減するためにまばらなマッピングを提供することによって、大きなマップを表現するための、簡単で効果的なデータ構造である。
class BlockSwath
{
int BlockSize;
int ChunkSize;
int WidthChunks;
int HeightChunks;
float [ ][ ][ ] Data; // float ***Data in C/C++
}
BlockSizeはセル内の各ブロックの幅及び高さを記述する。BlockSizeは2のべき乗になるはずである。ChunkSizeは、セル内の各チャンクの幅及び高さを記述する。ChunkSizeは2のべき乗になり、かつBlockSizeより大きくなるはずである。WidthChunksは、スウォース(swath)内のチャンクの列の数を記述する。HeightChunksは、スウォース内のチャンクの行の数を記述する。Dataは、実際のセルのデータを内包する不揃いなアレイを記述し、これらはData[chunk][block][cell]としてアドレス指定でき、ここでchunkは、セルを内包するチャンクのインデックスを表し:
chunk = [x/ChunkSize] + [y/ChunkSize] * WidthChunks
blockは、チャンク内のブロックのインデックスを表し:
block = [x/BlockSize] + [y/BlockSize] * ChunkSize)Mod ChunkSize2
cellは、ブロック内のセルのインデックスを表し:
cell = (x + y * BlockSize)Mod BlockSize2
x及びyは、ブロック全体のスウォースの北西方向のコーナーからの、セルのx及びy座標である。
【0075】
データをこのようにして表現することにより、到達されていないトラバーサルブロックを割り当てる必要がなくなり、ブロックあたり(例えば)4KBのメモリが節約される。同様に、到達されていないチャンクを割り当てる必要がなくなり、(ChunkSizeを256バイトと仮定すると)チャンクあたり256バイトが節約され、これは、極めて巨大な探索領域に対処する場合には、最終的に大きな節約となる。
【0076】
トラバーサルマップ1500は、生成されたトラバーサル値、及びシステム10によって生成されたルート1510の、視覚的な図である。マップ1500は、始点「d」及び終点「e」を含み、これらの間にルート1510がある。共通の細線(細線1520、1530、1540、1550等)上に位置決めされた場所は、始点「d」から同様の移動時間距離を有する場所を表す。
【0077】
双方向探索を採用する実施形態も想定される。双方向探索は、2つのルート探索の生成を伴い、これらは1つずつ、ルートの各端部において開始され、これらが中央で出会った時に停止する。これは、探索される総面積が低減されるため、より効率的であり、またルートの端部が到達不可能な島に存在すような通行不可能なルートの検出に役立つ。
【0078】
更に、多重分解能ルート設定を採用する実施形態も想定される。多重分解能ルート設定は、粗いコストマップを用いて粗レベルルートを生成するステップと、これを用いて、精細レベルでのルート生成を、前のルートの周りの細長い領域に沿って限定するステップとを含む。より明確には、一実施形態において、64個のセルのブロックを、単一のコスト値を有する単一のエンティティとして扱う。上述のルート設定を、このような粗いブロックに関する値のみを用いて実施して、上記ブロックを、最終的なルートを内包する可能性が高まるように狭める。
【0079】
更に、評価を、8個の隣接するセルへの移動よりも拡張して、16点の隣接を検討する実施形態も想定される。これらの更なる隣接を
図16に示す。上記更なる隣接は、「チェス・ナイト(chess‐knight)」型の隣接を含む。8点の隣接に対して、16点の隣接は、ますます滑らかなルート及び精密なコスト計算を提供できる可能性を有し、また角度付き方向の移動の選択肢が増加する。
【0080】
ドッグレッグ(dogleg)除去を行う実施形態も想定される。ドッグレッグ除去は、コストが均一な(又は略均一な)領域にわたるルートの生成を試みる際に一般的なアーティファクトである、ギザギザの、即ち「ドッグレッグ」型の経路(例えば、NNE方向にまっすぐ約180メートル進むのではなく、N方向に100メートル進んだ後、NE方向に100メートル進む経路)の排除を支援する。
【0081】
先読みマップロードを採用する実施形態も想定される。先読みマップロード(Look‐Ahead Map Loading)は、ルートの探索が、ロードされていないマップのタイルにどの程度近いかを確認して、どのマップのタイルを次にロードするかの優先順位を指定することによって、ルートの生成がマップのロードを待機しないことを保証する。
【0082】
本発明を、例示的な設計を有するものとして説明したが、本発明は本開示の精神及び範囲内で更に修正してよい。従って本出願は、本発明の一般原理を用いた本発明のいずれの変形、使用又は改造を包含することを意図している。更に本出願は、本発明が属する技術分野の公知の又は慣例的な実施の範囲内にあるような、本開示からの発展形態を包含することを意図している。
【0083】
以下、本発明の好ましい実施形態を項分け記載する。
【0084】
実施形態1
ルート生成器を操作する方法であって、前記方法は:
第1のグループ内の複数のブロックに関して、ルートトラバーサル値を同時に計算するステップであって、各前記ブロックは複数のセルを含み、前記トラバーサル値は、地形移動コストデータと、ルート終点への進行を示すデータとを、セル毎に検討した値である、ステップ
を含み、
前記複数のブロックは、前記第1のグループ内の前記ブロックが、前記第1のグループ内の他のグループと、いずれのエッジを共有できないように選択される、方法。
【0085】
実施形態2
前記複数のブロックに関する前記ルートトラバーサル値は、グラフィック処理ユニットによって同時に計算される、実施形態1に記載の方法。
【0086】
実施形態3
前記ブロックはマップの一部であり、
各前記ブロックは、2つの極性の値のうちの一方が割り当てられる、実施形態1又は2に記載の方法。
【0087】
実施形態4
第1の前記極性を有する各前記ブロックは、第2の前記極性のみを有する他の前記ブロックに対して側方に隣接する、実施形態3に記載の方法。
【0088】
実施形態5
前記第1の極性を有する各前記ブロックは、前記第1の極性のみを有する他の前記ブロックに対して対角線方向に隣接する、実施形態3又は4に記載の方法。
【0089】
実施形態6
前記第1のグループ内の前記ブロックは、共通の前記極性を共有する、実施形態3~5のいずれか1項に記載の方法。
【0090】
実施形態7
いずれの前記ブロック内のいずれの前記セルに関する前記トラバーサル値を計算する際、前記ブロック内の全ての前記セルに関する前記トラバーサル値を計算する必要がある、実施形態1~6のいずれか1項に記載の方法。
【0091】
実施形態8
ルート生成器を操作する方法であって、前記方法は:
コストマップのセルの第1のブロックに関するデータを、グラフィック処理ユニットのキャッシュメモリにロードするステップであって、前記第1のブロック内の1つの前記セルに関するデータのロードは、前記第1のブロック内の全ての前記セルに関するデータのロードを必要とする、ステップ;及び
前記セルの第2のセットをロードするステップであって、前記第2のセット内の各前記セルは、前記第1のブロック内にはなく、前記第1のブロック内のあるセルとエッジを共有するか、又は対角線方向に隣接する、ステップ
を含み、
前記第1のブロック内の前記セルの数と、前記第2のセット内の前記セルの数との比は、1:8未満であり、
前記セルの第1のブロックと前記セルの第2のセットとの組み合わせは、前記第1のブロックの全ての前記セルに関するトラバーサル値を生成するために必要な全てのマップデータを提供し、
前記トラバーサル値は、コストデータと、ルート終点への進行を示すデータとを検討した値である、方法。
【0092】
実施形態9
前記第1のブロックに関する前記コストデータを処理することによって、前記第1のブロックに関する前記トラバーサル値を生成するステップを更に含む、実施形態8に記載の方法。
【0093】
実施形態10
前記第1のブロックは少なくとも1024個のセルを含み、前記第2のセットは272個以下のセルを含む、実施形態8又は9に記載の方法。
【0094】
実施形態11
いずれの前記ブロック内のいずれの前記セルに関する前記トラバーサル値を計算する際、前記ブロック内の全ての前記セルに関する前記トラバーサル値を計算する必要がある、実施形態8~10のいずれか1項に記載の方法。
【0095】
実施形態12
前記セルの前記第1のブロックに関する前記トラバーサル値を生成するステップを更に含み、
前記セルの前記第1のブロックに関する前記トラバーサル値を生成するために使用されるコスト値のみが、前記セルの第1のセット及び前記第2のセットのコスト値である、実施形態8~11のいずれか1項に記載の方法。
【0096】
実施形態13
生成された前記トラバーサル値に応答して、開始位置から目的位置までのルートを生成するステップを更に含む、実施形態8~12のいずれか1項に記載の方法。
【0097】
実施形態14
各前記セルは、各前記セルに関連付けられた単一の前記コスト値及び単一の前記トラバーサル値のみを有する、実施形態8~13のいずれか1項に記載の方法。
【0098】
実施形態15
ルート生成器を操作する方法であって、前記方法は:
ルートの決定の一部として第1のセルが処理されることになることを決定するステップ;
前記第1のセルが、少なくとも2つのセルを内包する第1のブロック内にあることを決定するステップ;
前記第1のブロック内の全ての前記セルを分析するために必要なデータを、第1の不揮発性メモリから、プロセッサによってアクセス可能な揮発性メモリにロードするステップであって、前記第1のブロック内の全ての前記セルを分析するために必要な前記データは、前記第1のブロック内のある1つの前記セルとエッジ及びコーナーのうちの少なくとも1つを共有する全てのセルを含む、ステップ;及び
前記第1のブロック内の全ての前記セルを分析するために必要な前記データを全て前記揮発性メモリにロードした後、前記第1のブロック内の全ての前記セルを分析するステップ
を含む、方法。
【0099】
実施形態16
ロードされる各前記セルは、各前記セルに割り当てられた単一のコスト値及び単一のトラバーサル値のみを有する、実施形態15に記載の方法。
【0100】
実施形態17
前記第1のセルが処理されることになることを決定する前記ステップは、前記第1のセルを内包しない第2のブロックを処理するステップを含み、
前記処理は、前記第1のブロックが前記第2のブロックに隣接することを示す、実施形態15又は16に記載の方法。
【0101】
実施形態18
前記プロセッサはグラフィック処理ユニットであり、
複数の前記ブロックが同時に処理される、実施形態15~17のいずれか1項に記載の方法。
【0102】
実施形態19
各前記ブロックは、2のべき乗の個数の前記セルを含む、実施形態15~18のいずれか1項に記載の方法。
【0103】
実施形態20
前記揮発性メモリは、前記プロセッサ上のキャッシュメモリである、実施形態15~19のいずれか1項に記載の方法。
【符号の説明】
【0104】
10 ルート計画計算システム
12 プロセッサ、中央演算処理装置
14 プロセッサ、グラフィック処理ユニット、GPU
16 メモリ
16a、16b キャッシュメモリ、キャッシュ
18 RAM、メモリ
20 ハードドライブ、メモリ
22 ビデオRAM、メモリ
70 マップデータベース
80 ルート生成器
85 探索イニシャライザー
90 ルートフラッダー
92 遡行イニシャライザー
94 ルートベクトライザー
96 コスト決定器
200 土地被覆マップ
210、410 ブロック
220 セル
300 コストマップ
810 要素
820 パディングリング
1500 トラバーサルマップ
1510 ルート
1520、1530、1540、1550 細線