(58)【調査した分野】(Int.Cl.,DB名)
前記予測対象軌跡の長さがnであり、サブ軌跡の抽出間隔がstep=1であり、抽出したサブ軌跡の長さがkであり、抽出したサブ軌跡の数がn-kである、ことを特徴とする請求項1に記載の軌跡予測方法。
【発明の概要】
【発明が解決しようとする課題】
【0003】
以上に鑑み、本発明の1つ以上の実施例は、予測軌跡位置と実際軌跡位置との誤差を低減できる軌跡予測方法及びシステムを提供する。
【課題を解決するための手段】
【0004】
本明細書の1つ以上の実施例は軌跡予測方法を提供し、この軌跡予測方法は、
予測対象軌跡のうち所定長さのサブ軌跡をグリッド化してエンコーディングし、長期短期記憶LSTMネットワークに入力するステップと、
前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとするステップと、
中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドを前記候補セットから選択するステップと、
選択された確率値の最も高いグリッドの中心座標を前記サブ軌跡の軌跡予測結果とするステップと、を含み、
前記LSTMネットワークは、履歴軌跡データに基づいて事前トレーニングして得られるものである。
【0005】
好ましくは、前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとする前記ステップの後、中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドが前記候補セットに存在しない場合、前記サブ軌跡のフラグ点を含むグリッドの中心座標を前記サブ軌跡の軌跡予測結果とするステップをさらに含む。
【0006】
前記予測対象軌跡の長さがn、サブ軌跡の抽出間隔がstep=1、抽出したサブ軌跡の長さがk、抽出したサブ軌跡の数がn-kである。
【0007】
好ましくは、前記軌跡のn-k個のサブ軌跡を前記LSTMネットワークで予測して、n-k個の予測軌跡座標を得た後、
得られたn-k個の予測軌跡座標からなるシーケンスをカルマンフィルタリングするステップと、
フィルタリングして得られた最適推定シーケンスを前記軌跡の最終予測結果とするステップと、をさらに含む。
【0008】
好ましくは、前記予測対象軌跡のうち所定長さのサブ軌跡をグリッド化してエンコーディングするステップは、
トレーニングセット内の任意の2つの軌跡セグメントに対して、この2つの軌跡セグメントの時間、空間状態に基づいて、この2つの軌跡セグメントの間の時空間状態距離を算出するステップと、
算出した軌跡セグメントの間の時空間状態距離に基づいて、軌跡セグメントをクラスタリングするステップと、を含む。
【0009】
本明細書の1つ以上の実施例は、軌跡予測システムをさらに提供し、この軌跡予測システムは、グリッドエンコーディングモジュールと、履歴軌跡データに基づいて事前トレーニングして得られるLSTMネットワークと、予測モジュールと、を備え、
前記グリッドエンコーディングモジュールは、予測対象軌跡のうち所定長さのサブ軌跡をグリッド化してエンコーディングした後に出力し、前記LSTMネットワークに入力し、
前記予測モジュールは、前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとし、中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドを前記候補セットから選択し、選択された確率値の最も高いグリッドの中心座標を前記サブ軌跡の軌跡予測結果とする。
【0010】
本明細書の1つ以上の実施例は、電子機器をさらに提供し、この電子機器は、メモリ、プロセッサ、及び、メモリに記憶されプロセッサにおいて実行可能なコンピュータプログラムを備え、前記プロセッサは、前記プログラムを実行すると、前記軌跡予測方法を実現する。
【発明の効果】
【0011】
本明細書の技術案では、予測対象軌跡のうち所定長さのサブ軌跡をグリッド化してエンコーディングし、長期短期記憶LSTMネットワークに入力し、前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとし、中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドを前記候補セット選択し、選択された確率値の最も高いグリッドの中心座標を前記サブ軌跡の軌跡予測結果とする。従来のブルートフォースLSTM軌跡予測アルゴリズムに比べて、本明細書の実施例による軌跡予測アルゴリズムは、LSTMが出力する唯一な結果を用いるのではなく、LSTMが出力するtop_N個の候補セットから適切な予測結果を選択することにより、予測による軌跡位置が実際軌跡位置により近くなり、即ち、予測軌跡位置と実際軌跡位置との誤差を低減できる。
【0012】
さらに、本明細書の1つ以上の実施例による技術案では、前記軌跡のn-k個のサブ軌跡を前記LSTMネットワークで予測して、n-k個の予測軌跡座標を得た後、得たn-k個の予測軌跡座標からなるシーケンスをカルマンフィルタリングし、フィルタリングして得られた最適推定シーケンスを前記軌跡の最終予測結果とすることもでき、それによって、予測軌跡位置と実際軌跡位置との誤差をさらに低減できる。
【発明を実施するための形態】
【0014】
本明細書の目的、技術案及び利点をさらに明瞭にするために、以下、具体的な実施例を取り挙げて図面を参照しながら、本明細書の1つ以上の実施例をさらに詳細に説明する。
【0015】
なお、特に断らない限り、本明細書の実施例に使用される技術用語又は科学用語は当業者が理解する一般的な意味を有するべきである。本開示に使用される「第1」、「第2」及び類似する用語は順序、数量又は重要性を示すものではなく、単に異なる構成要素を区別するために用いられる。「備える」又は「含む」等のような用語は、該用語の前にある主語となる素子又は物品が該用語の後に列挙される目的語となる素子又は物品及びその同等のものをカバーするが、他の素子又は物品を除外するものではないという意味を有する。「接続」又は「連結」等のような用語は物理的又は機械的接続に限定されないが、直接及び間接を問わず電気的接続を含んでもよい。「上」、「下」、「左」、「右」などは、相対位置関係だけを示し、説明対象の絶対位置が変わると、対応する相対位置関係もその分変わる。
【0016】
人工知能技術の普及及び幅広い応用に伴い、現在、長期短期記憶ネットワーク(
Long
Short−
Term
Memory;LSTM)に基づいて、履歴軌跡データを通じて、軌跡を予測するモデルをトレーニングすることが可能である。
【0017】
長期短期記憶ネットワーク(LSTM)は、時間再帰型ニューラルネットワークであり、一般的なRNN(再帰型ニューラルネットワーク)の長期依存の問題を解決するために特別に設計されているものである。LSTMは時系列で広く使用されており、時空間軌跡データ予測にもいくつかの用途がある。LSTMセルの内部構造を
図1に示す。
【0018】
各シーケンスインデックス位置でのLSTMのゲートには、一般には、忘却ゲート(forget gate)、入力ゲート及び出力ゲートの3つのタイプがある。忘却ゲートは、その名のとおり、忘れられるかどうかを制御し、LSTMでは、前のレイヤーの隠しセルの状態が忘れられるかどうかを一定の確率で制御する。つまり、ベクトル
は現在の入力x
tと前時点の出力h
t-1に基づいて計算され、f
tの各次元の値は(0,1)の範囲内にあり、次に前時点のC
t-1にf
tベクトルをビット単位で乗算すると、f
tの値が0に近い次元では、情報は忘れられ、f
tの値が1に近い次元では、情報は保持される。
【0019】
入力ゲート(input gate)は、現在のシーケンス位置の入力を処理する。式1、2に示すように、入力ゲートには合計2つのステップがある。σレイヤーは更新する必要のある情報を決定し、tanhレイヤーは、値を(−1,1)にマップするベクトル、つまり、更新の代替コンテンツを生成し、2つの部分を組み合わせて入力ゲートが形成される。
【0020】
出力ゲートの前に、式3に示すようにセルの状態を更新する必要があり、前の忘却ゲートと入力ゲートの結果はいずれもセルの状態に作用する
【0021】
出力ゲート(output gate)は何を出力するかを決定し、この出力はLSTMセルの状態に基づいているが、フィルタリングされた結果である。式4及び式5に示すとおりである。
【0022】
従来のブルートフォースLSTM軌跡予測アルゴリズムは、K個の軌跡点のサブ軌跡seqを順次選択し、それをグリッド化してエンコーディングし、
図1に示されるLSTMセルネットワーク構造に入力し、K+1番目のグリッドのインデックスを予測するものである。
【0023】
従来のブルートフォースLSTMアルゴリズムは、入力された軌跡シーケンスを予測するものであり、アルゴリズムフローは
図2に示されている。このアルゴリズムは、データ前処理モジュール、モデルトレーニングモジュール、及び予測モジュールの3つのモジュールに分かれている。データ処理モジュールには、軌跡データをグリッド化してエンコーディングして、LSTMの許容可能な軌跡データベクトルにすることを含み、モデルトレーニングモジュールは、最適なLSTM予測モデルを見つけ、予測モジュールは、トレーニングされたLSTMモデルに基づいて次のグリッドのインデックスを予測する。
【0024】
ニューラルネットワークに基づくLSTMは、履歴知識の学習に対して、優れた機能を備えているが、新しい知識に対しては適応性が不十分であることがある。ハリケーンの軌跡データは比較的小さなデータのサンプルであり、そしてハリケーンの軌跡には、ハリケーンが発生した区域で、過去ハリケーンが発生しなかったり発生回数が非常に少なかったりする場合があるという重要な特徴があり、このため、ニューラルネットワークは、学習程度が不十分であることにより、予測する軌跡位置が実際軌跡位置とは大きな誤差を生じさせることがある。
【0025】
本明細書の1つ以上の実施例の技術案は、従来のブルートフォースLSTM軌跡予測アルゴリズムを改良しており、改良LSTM(ILSTM)軌跡予測アルゴリズムは、ブルートフォースLSTM軌跡予測アルゴリズムの予測モジュールの部分を改良したものであり、改良LSTM(ILSTM)アルゴリズムは、軌跡データ前処理の部分とモデルトレーニングの部分がブルートフォースLSTM軌跡予測アルゴリズムと一致している。
【0027】
改良LSTM軌跡予測は、距離しきい値に対する制限条件により、予測結果の偏差が大きすぎるか又は予測結果がサブ軌跡のフラグ点と重なるという、ブルートフォースLSTM予測における特別な状況を回避し、予測結果を特定の合理的な範囲に制限することで、予測軌跡位置と実際軌跡位置との誤差を低減できる。
【0028】
さらに、本明細書の1つ以上の実施例の技術案では、カルマンフィルタリング(Kalman Filtering)によって、改良LSTM(ILSTM)軌跡予測アルゴリズムにより予測された軌跡座標を最適に推定し、それにより、予測軌跡位置と実際軌跡位置との誤差をさらに低減できる。
【0029】
以下、図面を参照しながら本明細書の1つ以上の実施例の技術案を詳細に説明する。
【0030】
本明細書の1つ以上の実施例による軌跡予測方法のフローは、具体的には、
図3に示され、下記ステップを含む。
ステップS301:軌跡データを前処理する。
具体的には、移動対象は地理空間内を移動し、その位置が経時的に連続的に変化し、m個の離散的な位置点と関連する補助情報から構成される順序付けされたシーケンスは、軌跡として定義され、つまり、式6に示すように、軌跡(trajectory)は、多次元空間内の順序付けられた点集合である。
【0031】
式中、P
mは軌跡Trjのm番目の軌跡点の空間位置情報、たとえば、緯度と経度の情報P
m=(lon
m,lat
m)を示し、ここで、lon
m、lat
mはそれぞれ軌跡Trjのm番目の軌跡点の経度、緯度を示し、I
mは、軌跡Trjのm番目の軌跡点の状態情報を示し、ハリケーンデータを例とすれば、最大持続風速やハリケーンの中心最小圧力などの状態情報を示す。
【0032】
サブ軌跡は、特定の軌跡範囲内の順序付けられた軌跡点集合を指し、式7に示す。
式中、kはサブ軌跡の長さを示す。
【0033】
データ前処理は、生データを使用する前に必要なステップであり、データ前処理モジュールは、生データに対して前処理を実行するものである。データの前処理操作には、データのインポート、データのフィルタリング、データ欠損値の充填などの操作が含まれる。
【0034】
生軌跡データには、必然的にデータ欠損やデータエラーなどが存在し、データ欠損やエラーによって引き起こされる問題は、アルゴリズムの最終結果の精度に直接影響する。したがって、当該データがアルゴリズムモジュールのトレーニングに実際に使用される前に、データを前処理する必要がある。このステップのデータ前処理操作には、軌跡データに対するデータのインポート、データのフィルタリング、及びデータ欠損値の充填などの操作が含まれる。データ前処理モジュールは、管理員がアップロードしたトレーニング用の生データと異常検出用の生データをデータベースにインポートして記憶し、一連のデータベース操作を通じてデータのクリーニングと欠損値の充填を実行する。
【0035】
データベースをコアとするシステムモードに基づいて、データの前処理段階でExcelテーブルにおけるデータがデータベースにインポートされ、インポートされたデータがデータベースから読み取られてフィルタリングされ、充填が行われた後、再度データベースに記憶される。
【0036】
たとえば、ハリケーンの軌跡の場合、軌跡データには、ハリケーンの緯度と経度、最大持続風速、中心最小気圧、サンプリング時間などの情報が含まれ得る。このステップでは、ハリケーンの軌跡データのうち緯度と経度、最大持続風速やシステムの状態(Status of system)などのデータを前処理することができ、データにデータ欠損が存在する場合、データ欠損値は隣接データの近似値で充填される。サンプリング点で重複するデータもクリーニングされ、また、一部の異常値は変更される。
【0037】
ステップS302:軌跡データをグリッド化してエンコーディングする。
【0038】
具体的には、移動対象が位置する地理的空間は、固定グリッド(正方形、三角形、六角形など)によってさまざまな空間領域に分割され、軌跡の単一の座標点が空間領域にマッピングされ、元の軌跡Trjがグリッド化されたグリッド軌跡のシーケンスを式8に示す。
【0040】
生軌跡データは、時空間データとして、テキストや画像とは構造が大きく異なり、このため、従来のディープ学習モデルを直接使用することができない。したがって、このステップでは、軌跡データがニューラルネットワークにより受信可能なデータ形式にグリッド化され、つまり、軌跡シーケンスの表現フォーマットがグリッド軌跡に変換される。
【0041】
また、軌跡データにはカテゴリーデータと数値型データが含まれているため、このステップでは、グリッド化した軌跡に基づいて、グリッド軌跡をエンコーディングすることもでき、さまざまなタイプの軌跡データをエンコーディングして一体に組み合わせるエンコーディングのプロセスは、次の3つのステップに分けることができる。
【0042】
1.グリッド軌跡内のカテゴリーデータにOne−hot(ワンホット)エンコーディングを行う。たとえば、グリッド軌跡内のグリッドインデックスS
mをOne−hotエンコーディングできる。One−hotエンコーディングは、フラグをベクトルに変換するために使用される最も一般的で基本的なエンコーディングである。まず、カテゴリー値を整数値にマッピングする。次に、整数値のインデックスを除いて、各整数値をバイナリベクトルとして表し、残りはゼロ値であり、インデックス位置は1としてメークされる。
図4bには、グリッド軌跡のOne−hotエンコーディングの模式図が示されている。
【0043】
2.数値型データ範囲が[0 1]の間にあるように、グリッド軌跡内の数値型データを標準化する。指標間の次元の影響を排除するには、データ標準化を行うことで、データ指標間を比較可能にすることが必要である。生データがデータ標準化によって処理された後、各指標は同じ桁になり、包括的な比較評価に適している。I
mにおける数値型データzには、以下の式9を用いて標準化され、z’は得られる。
【0044】
3.カテゴリーデータと数値型データを接続して、完全な軌跡ベクトルV_Trjを形成する。
【0045】
ステップS303:履歴軌跡データに基づいて事前トレーニングして得られるLSTMネットワークによって軌跡予測を行う。
【0046】
具体的には、予測対象軌跡のうち、グリッド化してコーディングしたサブ軌跡が事前トレーニングして得たLSTMネットワークに順次入力され、各サブ軌跡の次の軌跡グリッドの位置がLSTMネットワークの出力によって予測される。たとえば、長さnの軌跡Trjである場合、stepをサブ軌跡の抽出間隔、kをサブ軌跡の長さ抽出として、各サブ軌跡シーケンスが抽出され、グリッド化してエンコーディングした各サブ軌跡シーケンスseqについて、次の軌跡座標が予測され、step=1であれば、n-k個のサブ軌跡のシーケンスが予測され、このため、n-k個の予測軌跡座標が生成され、これらの予測座標から構成されるシーケンスは、予測軌跡シーケンス
と呼ばれる。
【0047】
ここで、予測対象軌跡のうち所定長さのサブ軌跡に対して、履歴軌跡データに基づいて事前トレーニングして得られるLSTMネットワークによって、このサブ軌跡の次の軌跡グリッドの位置を予測する方法のフローは、具体的には、
図5に示される方法のフローのとおりであり、下記サブステップを含む。
【0048】
サブステップS501:予測対象軌跡のうち、グリッド化してエンコーディングした1つのサブ軌跡を、履歴軌跡データに基づいて事前トレーニングして得られるLSTMネットワークに入力する。
【0049】
サブステップS502:前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとする。
【0050】
サブステップS503:中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドを前記候補セットにおいて検索し、検索した場合、下記サブステップS404を実行し、検索していない場合、下記サブステップS405を実行する。
【0051】
サブステップS504:選択された確率値の最も高いグリッドの中心座標を前記サブ軌跡の軌跡予測結果とし、即ち、予測されたこのサブ軌跡の次の軌跡グリッドの位置とする。
【0052】
サブステップS505:前記サブ軌跡のフラグ点を含むグリッドの中心座標を前記サブ軌跡の軌跡予測結果とし、即ち、予測されたこのサブ軌跡の次の軌跡グリッドの位置とする。
【0055】
軌跡フラグ点Trj_flagの定義:
各々の軌跡から抽出される一番目のサブ軌跡シーケンスにおけるサブ軌跡フラグ点seq_flagは軌跡全体の軌跡フラグ点Trj_flagとされる。
【0056】
ステップS304:予測結果をカルマンフィルタリングする。
【0057】
具体的には、ノイズを除去して実データを復元するデータ処理技術であるカルマンフィルタリング(Kalman Filtering)は、通信、ナビゲーション、誘導や制御など、多くの分野で効果的に利用されている。カルマンフィルタリング(Kalman Filtering)は、システムの入出力観測データにより、システムの状態を最適に推定する。観測データにはシステム内のノイズや干渉の影響が含まれているため、最適推定はフィルタリングプロセスと見なすこともできる。
【0058】
したがって、より好ましくは、このステップでは、カルマンフィルタリングが、得られたn-k個の予測軌跡座標から構成されるシーケンスZに対して実行され、フィルタリングによって得られた最適推定シーケンスが、前記Trj軌跡の最終予測結果として使用され、本明細書では、カルマンフィルタリングを用いた軌跡予測方法は、略してILSTM−KF軌跡予測アルゴリズムと呼ばれる。
【0059】
移動対象X(m)の運動のシステムの状態ベクトルの定義は式10に示される。
【0061】
カルマンフィルタリングには、離散制御プロセスシステムの導入が必要である。移動物体の運動のシステム状態方程式と観測方程式は、それぞれ式11と式12に示される。
【0062】
式中、X(m)はシステム状態ベクトルを表し、式10に示すように、m時点での運動対象の状態ベクトルを表し、Aは、前時点から現在時点までの運動状態の遷移モードを表すための状態遷移行列を表し、W(m)は、モデルのシステム状態ノイズを表し、その統計的特性がホワイトノイズ又はガウスノイズに似ており、Z(m)は、予測軌跡シーケンスZ内のm番目の予測値を表す観測ベクトルを表し、Hは観測行列であり、V(m)は観測ノイズであるある。
【0063】
分析の便宜上、一般にシステムノイズW(m)と観測ノイズV(m)は互いに独立したガウスホワイトノイズであると仮定しており、それらの共分散はそれぞれQとRであり、それらの統計的特性はそれぞれ式13と式14に示される。
【0064】
カルマンフィルタリングアルゴリズムの中核は、再帰アルゴリズムを使用して最適状態推定の推定モデルを実現し、前時点の推定値と現在時点の観測値を使用して現在の状態変数の推定を更新することである。システムの状態方程式を使用して、次の時点のシステムの状態を推定する。システムの現在の状態がmであるとすると、システムの状態方程式に従って、式15に示すように、システムの前回の状態に基づいて現在の状態を推定できる。
【0065】
式中、X(m|m-1)は、前回の状態推定の結果であり、X(m-1|m-1)は前回の状態の最適推定の結果である。
【0066】
X(m|m-1)に対応する共分散の更新式を式16に示す。
【0067】
式16中、ρ(m|m-1)は、X(m|m-1)に対応する共分散であり、ρ(m-1|m-1)は、X(m-1|m-1)に対応する共分散であり、A
TはAの転置行列である。
【0068】
改良LSTM軌跡予測アルゴリズムによって予測された軌跡座標Z(m)を組み合わせる、つまり、測定値Z(m)と推定値X(m|m-1)を組み合わせると、式17に示すように、現在の状態mの最適推定値X(m|m)を取得できる。
【0071】
以上のように、予測軌跡シーケンスZのカルマンフィルタリングプロセス全体が完了する。カルマンフィルタリングの役割は、改良LSTM軌跡予測アルゴリズムによって予測された軌跡座標を最適に推定することである。
【0072】
上記のLSTMネットワークは、履歴軌跡データに基づいて事前トレーニングして得られるものであり、たとえば、1851年から2015年までのハリケーンデータセットをトレーニングセットとしてLSTMネットワークをトレーニングし、このデータには、1780本のハリケーン軌跡と49139個のサンプリング点があり、サンプリング時間間隔は6時間である。使用するトレーニング方法は、従来のブルートフォースLSTMアルゴリズムでLSTMネットワークをトレーニングする方法と同様であってもよいため、ここでは詳しく説明しない。
【0073】
上記軌跡予測方法によれば、本明細書の1つ以上の実施例は、軌跡予測システムをさらに提供し、この構造は、
図6に示されるように、グリッドエンコーディングモジュール601、履歴軌跡データに基づいて事前トレーニングして得られるLSTMネットワーク602、及び予測モジュール603を備える。
【0074】
そのうち、グリッドエンコーディングモジュール601は、予測対象軌跡のうち所定長さのサブ軌跡をグリッド化してエンコーディングし、前記LSTMネットワーク602に入出力し、つまり、グリッドエンコーディングモジュール601は、軌跡データをグリッド化して、グリッド化したグリッド軌跡に基づいて、グリッド軌跡をエンコーディングする。
【0075】
予測モジュール603は、前記LSTMネットワーク602が出力した最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとし、中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドを前記候補セットから選択し、選択された確率値の最も高いグリッドの中心座標を前記サブ軌跡の軌跡予測結果とする。
【0076】
さらに、予測モジュール603は、また、前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとする前記ステップの後、中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドが前記候補セットに存在しない場合、前記サブ軌跡のフラグ点を含むグリッドの中心座標を前記サブ軌跡の軌跡予測結果とする。
【0077】
前記予測対象軌跡の長さがnであり、サブ軌跡の抽出間隔がstep=1であり、抽出したサブ軌跡の長さがkであり、抽出したサブ軌跡の数がn-kであり、また、前記予測モジュール603は、さらに、前記軌跡のn-k個のサブ軌跡を前記LSTMネットワークで予測して、n-k個の予測軌跡座標を得た後、得たn-k個の予測軌跡座標からなるシーケンスをカルマンフィルタリングし、フィルタリングして得られた最適推定シーケンスを前記軌跡の最終予測結果とする。
【0078】
さらに、本明細書の1つ以上の実施例による軌跡予測システムは、データ前処理モジュール604をさらに備えてもよい。
【0079】
データ前処理モジュール604は、軌跡データに対して、データのインポート、データのフィルタリング、データ欠損値の充填の操作を行って、グリッドエンコーディングモジュール601に入力する。
【0080】
さらに、本明細書の1つ以上の実施例による軌跡予測システムは、トレーニングモジュール605をさらに備えてもよい。
【0081】
トレーニングモジュール605は、履歴軌跡データに基づいて前記LSTMネットワークをトレーニングする。
【0082】
上記軌跡予測システムの各モジュールの機能の実現方法は、具体的には、
図3に示されるフローにおける各ステップに記載の詳細な方法を参照できるため、ここでは詳しく説明しない。
【0083】
以下の実験データでは、2016年のハリケーンを検証セットとして使用する。従来のブルートフォースLSTM軌跡予測アルゴリズム、本明細書の実施例で提案されるILSTM軌跡予測アルゴリズム及びILSTM−KF軌跡予測アルゴリズムの3つの方法を使用する場合の予測誤差が比較される。
【0084】
実際の軌跡シーケンスT={Trj
1,Trj
2,L,Trj
N}と予測軌跡シーケンスT’={Trj’
1,Trj’
2,L,Trj’
N}を想定した場合、予測軌跡点と実際軌跡点の幾何空間誤差を用い、式20に示す二乗平均平方根誤差RSMEを予測誤差とし、単位は度である。
【0085】
式中、nは予測軌跡の数を示し、mは各予測軌跡に含まれる予測軌跡の点のデータを示す。
【0086】
実験パラメータ値の設定を表1に示し、LSTMネットワークトレーニングのラウンドに伴うRSME値の変化を
図7及び8に示す。
図7は、Qが[1,0,0,0; 0,1,0,0; 0,0,1,0; 0,0,0,1]であることを示し、
図8は、Qが[2,0,0,0; 0,2,0,0; 0,0,2,0; 0,0,0,2]であることを示し、Qはシステムの共分散行列である。
【0088】
図7及び
図8では、横軸はニューラルネットワークのトレーニングラウンドを表し、縦軸はRSEMの値を表す。
図7(a)及び
図8(a)に示されるLSTMネットワークの構造は、128*128*256であり、
図7(b)及び
図8(b)に示されるLSTMネットワークの構造は、128*256*512であり、
図7(c)及び
図8(c)に示されるLSTMネットワークの構造は256*256であり、
図7(d)及び
図8(d)に示されるLSTMネットワークの構造は256*256*256である。
図7及び
図8からわかるように、最初は、従来のブルートフォースLSTM軌跡予測アルゴリズムのRSME値が大きく、このとき、LSTMネットワークの学習程度は低く、予測軌跡誤差が大きく、一方、本明細書の実施例で提案されるILSTM軌跡予測アルゴリズムとILSTM−KF軌跡アルゴリズムのRSEM値は、従来のブルートフォースLSTM軌跡予測アルゴリズムのRSMEよりも大幅に低くなっている。LSTMネットワークトレーニングのラウンド数が増えるに伴い、従来のブルートフォースLSTMアルゴリズムのRSEM値は徐々に減少し、徐々に安定しているが、従来のブルートフォースLSTMアルゴリズムの予測誤差は、ILSTM及びILSTM−KFの予測誤差よりも大幅に高いことが分かった。
【0089】
上記した3つの方法のRSEM値をより良好に表示するために、128*256*512のLSTMネットワーク構造のラウンド71からラウンド80までの3つの方法のRSME値を以下に示し、つまり、
図7(b)及び
図8(b)には、ラウンド71〜80のRSME値を、以下の表2に示す。表2から分かるように、ILSTM−KFの各ラウンドのRSMEの値はILSTMの値よりわずかに小さく、これは、ILSTM−KFの予測効果が3つの方法の中で最も優れていることを示している。
【0090】
図7(b)では、従来のブルートフォースLSTM軌跡アルゴリズムは、ラウンド71〜80の10ラウンドの平均予測誤差が2.1065度であり、改良LSTM軌跡予測アルゴリズム(ILSTM)は、ラウンド71〜80の10ラウンドの平均予測誤差が1.4690であり、ILSTM−KF軌跡予測アルゴリズムは、ラウンド71〜80の10ラウンドの平均RSEMの値が1.4605である。
【0091】
図8(b)では、従来のブルートフォースLSTM軌跡予測アルゴリズムは、ラウンド71〜80の10ラウンドの平均RSEM値が2.3865度であり、改良LSTM軌跡予測アルゴリズム(ILSTM)は、ラウンド71〜80の10ラウンドの平均RSEM値が1.5141であり、ILSTM−KF軌跡予測アルゴリズムは、ラウンド71〜80の10ラウンドの平均RSEM値が1.5017であり、このことから、ILSTM−KFの予測誤差が最小であることがわかった。従来のブルートフォースLSTM軌跡予測アルゴリズムの予測誤差は約2度であり、効果が最も低い。ILSTM−KFの予測誤差は、ILSTMの予測誤差よりもわずかに小さくなっている。これは、ILSTM−KFによって予測された軌跡座標がILSTMによって予測された軌跡座標よりも高精度であることを示しており、ILSTM−KFが最良の予測効果を持っていると考えられる。
【0093】
上記実施例のシステムは、前述の実施例における対応する方法を実施するためであり、対応する方法の実施例の有益な効果を有し、ここでは詳しく説明しない。
【0094】
図10は、本実施例による電子機器のより具体的なハードウェア構造の模式図を示し、この機器は、プロセッサ1010、メモリ1020、入力/出力インターフェース1030、通信インターフェース1040、及びバス1050を含み得る。そのうち、プロセッサ1010、メモリ1020、入力/出力インターフェース1030、及び通信インターフェース1040は、バス1050を介して機器内で互いに通信可能に接続されている。
【0095】
プロセッサ1010は、関連するプログラムを実行し、本明細書の実施例による軌跡予測方法を実施するために、汎用CPU(Central Processing Unit、中央処理装置)、マイクロプロセッサ、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、又は1つ以上の集積回路などの形態によって実現される。
【0096】
メモリ1020は、ROM(Read Only Memory、読み取り専用メモリ)、RAM(Random Access Memory、ランダムアクセスメモリ)、静的記憶装置、及び動的記憶装置の形で実装することができる。メモリ1020は、オペレーティングシステムや他のアプリケーションプログラムを記憶することができ、本明細書の実施例による技術案がソフトウェア又はファームウェアによって実装されるとき、関連するプログラムコードはメモリ1020に記憶され、プロセッサ1010によって呼び出されて実行される。
【0097】
入力/出力インターフェース1030は、入力/出力モジュールを接続して情報の入出力を行うために使用される。入力/出力モジュールは、コンポーネントとして機器内に配置されてもよく(図示せず)、機器に外部接続して対応する機能を提供してもよい。入力機器は、キーボード、マウス、タッチスクリーン、マイクロフォン、様々なセンサーなどを含み、出力機器は、ディスプレイ、スピーカー、バイブレーター、インジケータライトなどを含み得る。
【0098】
通信インターフェース1040は、機器と他の機器との間の通信を実現するために通信モジュール(図示せず)を接続するために使用される。通信モジュールは、有線方式(USB、ネットワークケーブルなど)により通信してもよく、無線方式(モバイルネットワーク、WIFI、ブルートゥース(登録商標)など)により通信してもよい。
【0099】
バス1050は、機器の様々なコンポーネント(たとえば、プロセッサ1010、メモリ1020、入力/出力インターフェース1030、及び通信インターフェース1040)間で情報を転送するための経路を含む。
【0100】
なお、上記機器は、プロセッサ1010、メモリ1020、入力/出力インターフェース1030、通信インターフェース1040、及びバス1050のみを示しているが、特定の実施プロセスでは、この機器は、通常の動作を達成するのに必要なほかのコンポーネントも含んでもよい。さらに、当業者が理解できるように、上記機器には、図に示されるすべてのコンポーネントを含むのではなく、本明細書の実施例の実施態様を実施するのに必要なコンポーネントのみを含んでもよい。
【0101】
本明細書の1つ以上の実施例は、非一時的コンピュータ読み取り可能な記憶媒体をさらに提供し、上記非一時的コンピュータ読み取り可能な記憶媒体は、コンピュータ命令を記憶することができ、記憶されたコンピュータ命令は、コンピュータに上記実施例の前記軌跡予測方法を実行させるために使用される。
【0102】
本明細書の1つ以上の実施例による技術案では、予測対象軌跡のうち所定長さのサブ軌跡をグリッド化してエンコーディングし、長期短期記憶LSTMネットワークに入力し、前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとし、中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドを前記候補セットから選択し、選択された確率値の最も高いグリッドの中心座標を前記サブ軌跡の軌跡予測結果とする。従来のブルートフォースLSTM軌跡予測アルゴリズムに比べて、本明細書の実施例による軌跡予測アルゴリズムは、LSTMが出力する唯一の結果を用いるのではなく、LSTMが出力するtop_N個の候補セットから適切な予測結果を選択することにより、予測による軌跡位置が実際軌跡位置により近くなり、即ち、予測軌跡位置と実際軌跡位置との誤差を低減できる。
【0103】
さらに、本明細書の1つ以上の実施例による技術案では、前記軌跡のn-k個のサブ軌跡を前記LSTMネットワークで予測して、n-k個の予測軌跡座標を得た後、得られたn-k個の予測軌跡座標からなるシーケンスをカルマンフィルタリングし、フィルタリングして得られた最適推定シーケンスを前記軌跡の最終予測結果とすることもでき、それによって、予測軌跡位置と実際軌跡位置との誤差をさらに低減できる。
【0104】
本実施例のコンピュータ読み取り可能な媒体は、永続的及び非永続的、リムーバブル及び非リムーバブル媒体を含み、任意の方法又は技術によって情報を記憶することができる。情報は、コンピュータ読み取り可能な命令、データ構造、プログラムのモジュール、又は他のデータであり得る。コンピュータ記憶媒体の例には、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他のタイプのランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的に消去可能なプログラム可能な読み取り専用メモリ(EEPROM)、フラッシュメモリ又はその他のメモリ技術、コンパクト・ディスク・リード・オンリー・メモリ(CD−ROM)、デジタル多用途ディスク(DVD)又はその他の光学記憶機器、カセット式磁気テープ、磁気テープ・磁気ディスク記憶機器やその他の磁気記憶機器、又はその他の非伝送媒体が含まれるが、これらに限定されず、コンピューティング機器がアクセスできる情報の保存に用いられる。
【0105】
当業者が理解できるように、上記実施例のいずれの説明も例示的なものに過ぎず、本開示の範囲(特許請求の範囲を含む)がこれらの例に限定されることを意図するものではない。本明細書の実施例の構想に基づいて、上記の各実施例又は各実施例の技術的特徴を組み合わせることもでき、ステップは任意の順序で実施することができ、上記のように異なる態様における多くの変化があり、簡略化のため、それらは詳細に記載されない。
【0106】
さらに、説明及び検討を簡略化するとともに、本明細書の実施例を理解しにくくしないために、提供される図面は、集積回路(IC)チップ及びその他のコンポーネントの公知の電源に接続される/アース接続されることを示しても示されなくてもよい。さらに、本明細書の実施例を理解することが困難になることを避けるために、装置はブロック図の形で示されてもよく、また、これはこれらのブロック図による装置の実施形態に関する詳細が、本明細書の実施例を実施するプラットフォーム(すなわち、これらの詳細は完全に当業者が理解できるものである)に大きく依存するという事実を考慮に入れる。特定の詳細(たとえば、回路)が記載されて本明細書の例示的な実施例を説明する場合、これら特定の詳細がない又はこれら特定の詳細に変化がある場合にも本明細書の実施例を実施できることは当業者には明らかである。したがって、これらの説明は、制限的ではなく例示的であると見なされるべきである。
【0107】
本明細書による技術案は、具体的な実施例を参照しながら説明されたが、前記の説明に基づいてこれらの実施例に対して多くの置換、修正、及び変形を行えることは当業者には明らかである。たとえば、他のメモリアーキテクチャ(たとえば、ダイナミックRAM(DRAM))は、検討された実施例を使用することができる。
【0108】
本明細書の実施例は、添付の特許請求の範囲の広い範囲に含まれるそのようなすべての置換、修正、及び変形を含むことを意図している。したがって、本明細書の実施例の精神及び原則の範囲内でなされたあらゆる省略、修正、同等の置換、改良などは、本明細書の特許範囲に含まれるべきである。
【解決手段】一実施例による軌跡予測方法は、予測対象軌跡のうち所定長さのサブ軌跡をグリッド化してエンコーディングし、長期短期記憶LSTMネットワークに入力するステップと、前記LSTMネットワークから出力された最初のtop_N個の確率値に対応するグリッドを予測結果の候補セットとするステップと、中心座標から前記サブ軌跡のフラグ点の座標までのユークリッド距離が上限しきい値と下限しきい値の間にあるグリッドを前記候補セットから選択するステップと、選択された確率値の最も高いグリッドの中心座標を前記サブ軌跡の軌跡予測結果とするステップと、を含む。前記LSTMネットワークは、履歴軌跡データに基づいて事前トレーニングして得られる。