(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022078967
(43)【公開日】2022-05-25
(54)【発明の名称】室内測位および追跡のための深層スマートフォンセンサ融合
(51)【国際特許分類】
G01C 21/28 20060101AFI20220518BHJP
G01S 5/02 20100101ALI20220518BHJP
【FI】
G01C21/28
G01S5/02 Z
【審査請求】有
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2021183842
(22)【出願日】2021-11-11
(31)【優先権主張番号】20306380.5
(32)【優先日】2020-11-13
(33)【優先権主張国・地域又は機関】EP
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.アンドロイド
(71)【出願人】
【識別番号】505205812
【氏名又は名称】ネイバー コーポレーション
【氏名又は名称原語表記】NAVER Corporation
(71)【出願人】
【識別番号】319012978
【氏名又は名称】ネイバーラボス コーポレーション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ボリス チドロフスキ
(72)【発明者】
【氏名】レオニッド アンツフェルド
(72)【発明者】
【氏名】エミリオ サンサノ
【テーマコード(参考)】
2F129
5J062
【Fターム(参考)】
2F129AA02
2F129BB05
2F129BB07
2F129BB26
5J062CC18
(57)【要約】 (修正有)
【課題】センサデータから室内環境内の携帯用電子デバイスの位置を予測する方法を提供する。
【解決手段】方法は少なくとも一つの絶対位置予測を生成する段階、それぞれの絶対位置予測を生成する段階は携帯用電子デバイスの無線信号データおよび/または磁場データに基づく、および変位予測を生成する段階を含み、変位予測を生成する段階はニューラルネットワークによって、携帯用電子デバイスの慣性センサデータに基づいて変位予測を生成する段階を含む。絶対位置予測を生成する段階は第1速度で繰り返され得、変位予測を生成する段階は第2速度で繰り返され得る。方法は少なくとも一つの変位予測および少なくとも一つの絶対位置予測で以前に予測された位置をアップデートすることによって予測された位置を決定する段階をさらに含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
センサデータから室内環境内の携帯用電子デバイスの位置を予測するコンピュータの具現方法において、
携帯用電子デバイスの少なくとも一つの絶対位置予測を生成する段階-それぞれの前記絶対位置予測を生成する段階は前記携帯用電子デバイスの無線信号データおよび/または磁場データに基づき、前記少なくとも一つの絶対位置予測を生成する段階は第1速度で繰り返される-;
前記携帯用電子デバイスの変位予測を生成する段階-前記変位予測を生成する段階はニューラルネットワークによって、前記携帯用電子デバイスの慣性センサデータに基づいて前記変位予測を生成する段階を含み、前記変位予測を生成する段階は前記第1速度と異なる第2速度で繰り返される-;および
少なくとも一つの前記変位予測および前記少なくとも一つの絶対位置予測で以前に予測された位置をアップデートすることによって予測された位置を決定する段階を含む、コンピュータの具現方法。
【請求項2】
前記慣性センサデータから前記変位予測を生成する段階は前記慣性センサデータをグラフィック表現に変換する段階を含み、前記ニューラルネットワークは畳み込みニューラルネットワーク、双方向循環ニューラルネットワークおよびアテンションレイヤを含むニューラルネットワークのうち少なくとも一つを含む、請求項1に記載のコンピュータの具現方法。
【請求項3】
前記ニューラルネットワークは変位回帰のためのフィード-フォワードネットワークおよび活動を予測するためのフィード-フォワードネットワークを含み、予測された前記活動は前記変位予測を生成するために前記変位回帰を補正するために利用される、請求項1に記載のコンピュータの具現方法。
【請求項4】
前記少なくとも一つの絶対位置予測を生成する段階は前記無線信号データから前記絶対位置予測を生成するために学習された変分オートエンコーダを利用する段階を含む、請求項1~3のいずれか一項に記載のコンピュータの具現方法。
【請求項5】
携帯用電子デバイスのセンサデータから位置を予測するための機械学習システムを学習させるコンピュータの具現方法において、
ユーザーの活動を識別することを学習するようにセンサ学習データのサブセットでモーション分類器を学習させる段階-前記学習データは軌跡に沿って前記携帯用電子デバイスを携帯するユーザーによってキャプチャーされた慣性センサデータを含む-;
前記センサ学習データからランドマークの検出のためのランドマーク分類器を学習させる段階と、
前記センサ学習データにアノテートするための疑似ラベルを生成する段階-前記疑似ラベルを生成する段階は前記モーション分類器によって識別されたユーザーの活動および前記ランドマーク分類器によって識別されたランドマーク位置を利用する段階を含み、前記疑似ラベルを生成する段階は前記モーション分類器によって識別された前記ユーザーの活動が前記ユーザーが移動中であることを示す場合、2個のランドマーク位置の間で位置を補間する段階を含む-;および
前記アノテートされた学習データでニューラルネットワークを学習させる段階を含む、コンピュータの具現方法。
【請求項6】
前記ランドマーク分類器を学習させる段階は前記慣性センサデータから配向ベクトルを推定し、前記配向ベクトルの変化をランドマーク位置を示すものとして利用する段階を含む、請求項5に記載のコンピュータの具現方法。
【請求項7】
磁場データから携帯用電子デバイスの絶対位置を予測するコンピュータの具現方法であって、前記方法は、
携帯用電子デバイスのセンサの磁場データに基づいてグラフィック表現を生成する段階-前記磁場データは磁場値の時系列を含む-;および
ニューラルネットワークを使って前記グラフィック表現に少なくとも部分的に基づいて前記携帯用電子デバイスの絶対位置を決定する段階を含み、
前記ニューラルネットワークは一つ以上の畳み込み層を含み、前記ニューラルネットワークは前記一つ以上の畳み込み層に対する多重チャネル入力を含む、コンピュータの具現方法。
【請求項8】
前記磁場データに基づいて前記グラフィック表現を生成する段階は
前記磁場値の時系列の磁場値のサブセットを選択する段階、および
前記磁場値のサブセットまたは前記磁場値のサブセットの投影を一つ以上の2次元イメージに変換する段階を含む、請求項7に記載のコンピュータの具現方法。
【請求項9】
前記グラフィック表現は反復プロット、グラミアン角度合算フィールド、グラミアン角度差フィールド、およびマルコフ遷移フィールドのうち少なくとも一つを含む、請求項7または8に記載のコンピュータの具現方法。
【請求項10】
前記ニューラルネットワークは一つ以上の循環レイヤを含み、前記一つ以上の循環レイヤは前記一つ以上の畳み込み層にした従い/従うか
第1方法により生成された第1グラフィック表現および前記第1方法と異なる第2方法により生成された第2グラフィック表現は前記一つ以上の畳み込み層に対して前記多重チャネル入力で同時に入力され、前記第1グラフィック表現と前記第2グラフィック表現は磁場値の同一のセットから獲得される、請求項7~9のいずれか一項に記載のコンピュータの具現方法。
【請求項11】
前記ニューラルネットワークは測位システムから獲得された一つ以上の開始位置で初期化され/されるか
前記ニューラルネットワークは建物内の地球磁場の特性に基づいて学習されて前記建物内の前記センサの位置を決定する、請求項7~10のいずれか一項に記載のコンピュータの具現方法。
【請求項12】
前記携帯用電子デバイスの絶対位置を決定する段階は前記ニューラルネットワークで、視覚的表現のうち第1タイムスタンプに関連した視覚的表現のセットおよび
(i)一つ以上の以前に決定された位置、
(ii)以前に決定された特徴ベクトル、および
(iii)前記第1タイムスタンプと異なる各自のタイムスタンプに関連した視覚的表現の一つ以上のセットのうち少なくとも一つを入力する段階を含み/含むか
前記方法は、前記センサによって、前記磁場データを生成する段階をさらに含む、請求項7~11のいずれか一項に記載のコンピュータの具現方法。
【請求項13】
前記少なくとも一つの絶対位置予測を生成する段階は請求項7~12のいずれか一項に記載されたコンピュータの具現方法によって前記磁場データから前記携帯用電子デバイスの前記絶対位置を予測する段階を含む、請求項1~4のいずれか一項に記載のコンピュータの具現方法。
【請求項14】
一つ以上のプロセッサを含む装置であって、前記一つ以上のプロセッサは請求項1~13のいずれか一項に記載された方法を遂行するように構成される、装置。
【請求項15】
一つ以上のプロセッサにより実行される時、請求項1~13のいずれか一項に記載された方法を遂行するコンピュータ実行可能命令語が保存される一つ以上の、コンピュータ読み取り可能保存媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は携帯用電子デバイスの室内測位および追跡に関する。
【背景技術】
【0002】
スマートフォン、タブレットコンピュータのような携帯用電子デバイスで位置基盤サービスが広く使われている。このようなサービスには携帯用電子デバイスに対する信頼性ある測位および追跡技術が必要である。GPSおよびガリレオ(Galileo)のような衛星測位システムは室外で信頼性ある測位を提供するが、完全に閉鎖されたり部分的に閉鎖され得る室内環境で匹敵するほどの測位正確度を達成することは依然として難しいことである。室内位置基盤サービスは、関連した社会的および商業的な利点を提供して正しい室内測位のための解決策を提供しなければならない技術的要求が増加する。
【0003】
従来技術のスマートフォン基盤室内測位のための方法は、多様な条件において強みと弱点を示す。このような技術は一般的なスマートフォンに含まれた互いに異なるセンサを利用する。Wi-Fiセンサおよびブルートゥース(登録商標)センサのようなネットワークセンサは、室内環境内に分散した多様なアクセスポイントから携帯用電子デバイスの位置を推定するためのRSSフィンガープリントとして利用され得る、室内の位置で受信された信号強度を推定するために利用され得る。
【0004】
Wi-Fiフィンガープリント認識はスマートフォン基盤室内測位のために最も広く使われる技術である(非特許文献1乃至5)。測位は測定されたWi-Fiフィンガープリントを以前に収集された基準フィンガープリントとマッチングすることによって遂行される。最近接するようにマッチングされる基準フィンガープリントに関連した位置が位置推定値として返還される。位置推定は基準データがない領域で外挿できるガウスプロセスを使って改善され得る簡単な最近傍マッチング(nearest-neighbor matching)(非特許文献2)に基づくことができ、これは非特許文献6に記述された通りである。正確な測位を算出するためにWi-Fiフィンガープリントは稠密に記録されなければならず、正確な位置でアノテート(annotate)されなければならない。アノテートされた無線(radio)の希少性の問題は非特許文献7によって、半教師あり学習接近法に基づいてする効率的なフィンガープリント学習方法を利用することによって解決された。他の接近法は非特許文献8で、ラプラシアンエンベデッド回帰最小自乗(Laplacian embedded regression least square)接近法で算出されたラベリングされていないデータに対する疑似ラベル(pseudo-label)を利用して位置推定(localization)のための半教師あり方法を利用することによって提案された。アノテートされた無線データの欠如に対するさらに他の解決策は、非特許文献9で、Wi-Fi基盤位置予測のための変分オートエンコーダ学習を提案することによって記述される。
【0005】
Wi-Fiおよびブルートゥースデータを使う室内測位用接近法はインフラ依存的である。したがって、優秀な性能を達成するためにこのようなシステムは、カバレッジが広い多数のアクセスポイントが必要である。さらに、RSS変動が激しいとたびたび不正確な位置推定結果が示され、2~3mの位置推定エラーが発生する。
【0006】
位置推定システムの他の範疇はインフラ独立的(infrastructure-free)である(非特許文献10)。この範疇には慣性測定装置(IMU)および磁力計に基づく測位システムが含まれる。このようなセンサは位置推定に一般的に使われる他のセンサに比べて費用上の利点を有する。歩行者推測航法(Pedestrian Dead Reckoning、PDR)システムはモバイル電話の加速度計とジャイロスコープを活用してユーザーの経路を追跡する。PDRシステムは相対位置のみ提供することができ、開始位置を必要とする。鉄要素(壁、柱、窓)を含む要素はたびたび磁場基盤接近法に活用され得る固有な磁気異常(magnetic anomaly)を生成する。
【0007】
PDR接近法は加速度計、ジャイロスコープおよび磁力計のデータストリームからの歩数の検出、歩幅(step length)の推定およびユーザーの進行方向の推定を結合することに依存する。PDRは短距離で正確な測位を達成できるものの、長距離ではドリフト(drift)が発生し得る。PDR接近法は歩数の検出、歩幅の推定および進行方向の決定に依存する。最新の技術によると、PDR接近法は多くのパラメータの調整を経ることになるが、その理由は歩幅が背丈、年齢などのようなユーザーの特性によって変わるか同じユーザーであってもユーザーの活動によって異なり得るためである。ピーク検出、フラットゾーン(flat zone)検出およびゼロクロッシング(zero crossing)検出のような最新技術の歩数検出アルゴリズムも多くのパラメータチューニングに依存する(非特許文献11)。
【0008】
AMID方法(非特許文献12)は深層ニューラルネットワークを使って磁気シーケンスパターンを認識する室内測位システムを提案する。特徴が磁気シーケンスから抽出され、深層ニューラルネットワークは周辺の磁気ランドマークによって生成されたパターンに基づいてシーケンスを分類するのに使われる。しかし、類似する磁気シグネチャが非常に異なる位置にある場合、この方法は失敗する。同一の強磁性物体によって同一の磁気異常が異なる位置に存在し得るため、センサの位置が正確に検出され得ない。
【0009】
したがって、Wi-Fi基盤測位方法とPDRはいずれも深刻な限界がある。測位の正確度を向上させるために、次のように、特定のセンサパターンに基づいたランドマークの識別が提案された[非特許文献13および非特許文献14。同様に、非特許文献15はWi-Fi測位、PDRおよびランドマーク検出の融合を提案する。
【0010】
したがって、無線信号データおよび/または磁場データから携帯用電子デバイスの絶対位置を正確に予測する改善された方法に対する必要性がある。
【先行技術文献】
【特許文献】
【0011】
【特許文献1】韓国登録特許公報第10-1424747号
【非特許文献】
【0012】
【非特許文献1】Davidson and Piche:「A survey of selected indoor positioning methods for Smartphones」、IEEE Communications Surveys Tutorials、19(2):1347-1370
【非特許文献2】Gressmann et al.:Towards ubiquitous indoor location based services and indoor navigation.In 7th Workshop on Positioning Navigation and Communication、WPNC、pages 107ー112.IEEE、2010
【非特許文献3】Khalajmehrabadi et al.:「Modern Wlan fingerprinting indoor positioning methods and deployment challenges」、IEEE Communications Surveys Tutorials、19(3):1974-2002、2017
【非特許文献4】Ma et al.:「Wifi sensing with channel state information:A survey」、ACM Comput.Surv.、52(3):46:1-46:36、June 2019
【非特許文献5】Wang et al.:「Pedestrian Stride-Length Estimation Based on LSTM and Denoising Autoencoders」、Sensors、19(4)、2019
【非特許文献6】Ferris et al.:「Wifi-slam using gaussian process latent variable models」、in:Proc.20th Intern.Joint Conference on Artificial Intelligence(IJCAI)、pages 2480-2485、2007
【非特許文献7】Yuanet et al.、「Efficient Wifi fingerprint training using semi-supervised learning」、in:Ubiquitous Positioning Indoor Navigation and Location Based Service、pages 148-155、2014
【非特許文献8】Yoo and Johansson、「Semi-supervised learning for mobile robot localization using wireless signal strengths」、in:Intern.Conf.Indoor Positioning and Indoor Navigation(IPIN)、pages 1-8、2017
【非特許文献9】Chidlovskii and Antsfeld、「Semi-supervised variational autoencoder for Wifi indoor localization」、in:Intern.Conf.Indoor Positioning and Indoor Navigation(IPIN)、pages 1-8.IEEE、2019
【非特許文献10】Gu et al.:「Indoor localization improved by spatial context? a survey」、ACM Comput.Surv.、52(3):64:1-64:35、July 2019]
【非特許文献11】Shin et al.:「Adaptive step length estimation algorithm using low-cost mems inertial sensors」、in:IEEE Sensors Applications Symposium、pages 1-5、2007
【非特許文献12】Lee et al.:「Accurate magnetic indoor localization using deep learning」、Sensors、2018
【非特許文献13】Sousa Lima et al.:「Human activity recognition using inertial sensors in a smartphone:An overview」、Sensors、19(14):3213、2019
【非特許文献14】Wang et al.:「Indoor localization using smartphone magnetic and light sensors:a deep LSTM approach」、MONET、25(2):819-832、2020
【非特許文献15】Deng et al.:「Continuous indoor positioning fusing wifi、smartphone sensors and landmarks」、Sensors 16(09)、2016
【発明の概要】
【発明が解決しようとする課題】
【0013】
最新技術の問題を解決するために、室内測位のためのスマートフォン慣性センサ、磁場データおよびWi-Fi測定を融合するための新しいセンサ融合フレームワークが開示され、これは磁場データから携帯用電子デバイスの絶対位置を予測する新しい接近法を含む。
【0014】
一実施例において、センサデータから室内環境内の携帯用電子デバイスの位置を予測するコンピュータの具現方法が提供される。コンピュータの具現方法は、携帯用電子デバイスの少なくとも一つの絶対位置予測を生成する段階を含み、それぞれの絶対位置予測を生成する段階は無線信号データおよび/または磁場データに基づき、少なくとも一つの絶対位置予測を生成する段階は第1速度で繰り返される。方法は携帯用電子デバイスの変位予測を生成する段階を含み、変位予測を生成する段階は、ニューラルネットワークによって、携帯用電子デバイスの慣性センサデータから変位予測を生成する段階を含み、変位予測を生成する段階は第1速度と異なる第2速度で繰り返される。方法は、少なくとも一つの変位予測および少なくとも一つの絶対位置予測で以前に予測された位置をアップデートすることによって予測された位置を決定する段階をさらに含むことができる。
【0015】
他の実施例によると、携帯用電子デバイスのセンサデータから位置を予測するための機械学習システムを学習させるコンピュータの具現方法が開示される。方法は、ユーザーの活動を識別することを学習するようにセンサ学習データのサブセットでモーション分類器を学習させる段階-学習データは軌跡に沿って携帯用電子デバイスを携帯するユーザーによってキャプチャーされた慣性センサデータを含む-、センサ学習データからランドマークの検出のためのランドマーク分類器を学習させる段階、およびセンサ学習データにアノテートするための疑似ラベルを生成する段階を含むことができる。疑似ラベルを生成する段階はモーション分類器によって識別されたユーザーの活動およびランドマーク分類器によって識別されたランドマーク位置を利用する段階を含み、疑似ラベルを生成する段階は、モーション分類器によって識別されたユーザーの活動がユーザーが移動中であることを示す場合、2個のランドマーク位置の間で位置を補間する段階を含む。方法はアノテートされた学習データでニューラルネットワークを学習させる段階をさらに含むことができる。
【0016】
一実施例において、磁場データから携帯用電子デバイスの絶対位置を予測するコンピュータの具現方法は、携帯用電子デバイスのセンサの磁場データに基づいてグラフィック表現を生成する段階、およびニューラルネットワークを使ってグラフィック表現に少なくとも部分的に基づいて携帯用電子デバイスの絶対位置を決定する段階を含む。磁場データは磁場値の時系列を含む。ニューラルネットワークは一つ以上の畳み込み層および一つ以上の畳み込み層に対する多重チャネル入力を含む。
【0017】
一つ以上の畳み込み層および一つ以上の畳み込み層に対する多重チャネル入力を含むニューラルネットワークを利用して、グラフィック表現に少なくとも部分的に基づいて携帯用電子デバイスの絶対位置を決定することによって、正確な方式で携帯用電子デバイスの絶対位置を決定する改善された方法が提供される。
【0018】
追加の実施例において、コンピュータ実行可能命令語が保存されたコンピュータ読み取り可能保存媒体が提供される。一つ以上のプロセッサによって実行される時、コンピュータ実行可能命令語は前述した携帯用電子デバイスの絶対位置を予測する方法を遂行する。
【0019】
追加の実施例において、プロセッシング回路部を含む装置が提供される。プロセッシング回路部は前述した携帯用電子デバイスの絶対位置を予測する方法を遂行するように構成される。
【0020】
次の詳細な説明および添付図面は本発明の特性および利点に対するより詳細な理解を提供する。
【図面の簡単な説明】
【0021】
添付された図面は、実施例の原理を説明する目的で本明細書に統合されてその一部を形成する。図面はそれらがどのように作られて使われ得るかに対する、例示され記述された実施例にのみ実施例を制限するものと解釈されてはならない。追加の特徴および利点は、添付図面に例示された通り、以下の実施例の説明およびさらに具体的な部分で明白となるであろう。
【
図1】少なくとも一つの実施例に係る、室内位置推定のための方法のプロセスフローチャートを図示する。
【
図2】実施例に係る、室内位置推定のためのシステムを図示する。
【
図3】実施例に係る、PDRのためのニューラルネットワークのブロック図を図示する。
【
図4】他の実施例に係る、PDRのためのニューラルネットワークに対するブロック図を図示する。
【
図5】実施例に係る、センサデータをグラフィック表現に変換することを図示する。
【
図6】実施例に係る、PDRのためのニューラルネットワークを学習させるための方法のプロセスフローチャートを図示する。
【
図7a】実施例に係る、PDRのためのニューラルネットワークを学習させるために利用される例示的な学習経路に対するセンサデータを図示する。
【
図7b】実施例に係る、PDRのためのニューラルネットワークを学習させるために利用される例示的な学習経路に対するセンサデータを図示する。
【
図8】少なくとも一つの実施例に係る、室内位置推定のための方法のプロセスフローチャートを図示する。
【
図9】モバイル電話に関連した例示的な基準フレームおよび回転角度を図示する。
【
図10a】実施例に係る例示的なニューラルネットワークアーキテクチャーを図示する。
【
図10b】実施例に係る例示的なニューラルネットワークアーキテクチャーを図示する。
【
図11】従来の位置予測を有する一実施例により生成された位置予測を図示する。
【
図12】少なくとも一つの実施例に係る、室内位置推定のための方法のプロセスフローチャートを図示する。
【
図13】一実施例に係る、ランドマークを選択するための方法のプロセスフローチャートを図示する。
【
図14】開示された方法が遂行され得る例示的なアーキテクチャーを図示する。
【発明を実施するための形態】
【0022】
<発明の概要>
【0023】
実施例において、第2速度は第1速度より速い。方法は複数の繰り返された変位予測および少なくとも一つの絶対位置予測で以前に予測された位置をアップデートすることによって予測された位置のシーケンスを決定する段階をさらに含むことができる。
【0024】
一態様によると、慣性センサデータから変位予測を生成する段階は慣性センサデータをグラフィック表現に変換する段階を含む。ニューラルネットワークは畳み込みニューラルネットワーク(CNN)、双方向循環ニューラルネットワーク(RNN)およびアテンションレイヤを含むニューラルネットワークのうち少なくとも一つを含むことができる。
【0025】
他の態様によると、ニューラルネットワークは変位回帰のためのフィード-フォワード(feed-forward)ネットワークおよび活動を予測するためのフィード-フォワードネットワークを含み、予測された活動は変位予測を生成するために変位回帰を補正するために利用される。
【0026】
一実施例によると、少なくとも一つの絶対位置予測を生成する段階は、無線信号データから絶対位置予測を生成するために学習された変分オートエンコーダ(variational autoencoder、VAE)を利用する段階を含む。
【0027】
一態様によると、ランドマーク分類器を学習させる段階は、慣性センサデータから配向ベクトルを推定し、配向ベクトルの変化をランドマーク位置を示すものとして利用する段階を含む。
【0028】
一態様において、磁場データに基づいてグラフィック表現を生成する段階は、磁場値の時系列の磁場値のサブセットを選択する段階、および磁場値のサブセットまたは磁場値のサブセットの投影を一つ以上の2次元イメージに変換する段階を含む。グラフィック表現は反復プロット(Recurrence plot、RP)、グラミアン角度合算フィールド(Gramian Angular Summation Field、GASF)および/またはグラミアン角度差フィールド(Gramian Angular Difference Field、GADF)のようなグラミアン角度フィールド、およびマルコフ遷移フィールド(Markov Transition Fields、MTF)のうち少なくとも一つを含むことができる。
【0029】
一態様において、ニューラルネットワークは一つ以上のゲーテッド循環ユニット(gated recurrent unit)のような一つ以上の循環レイヤを含むことができる。一つ以上の循環レイヤは一つ以上の畳み込み層に従うことができる。ニューラルネットワークは建物内の地球磁場の特性に基づいて学習されて建物内のセンサの位置を決定することができる。第1方法により生成され得る第1グラフィック表現および第1方法と異なる第2方法により生成された第2グラフィック表現は、一つ以上の畳み込み層に対する多重チャネル入力で同時に入力され、第1グラフィック表現と第2グラフィック表現は磁場値の同一のセットから獲得される。第1方法および第2方法は反復プロット(RP)、グラミアン角度合算フィールド(GASF)および/またはグラミアン角度差フィールド(GADF)のようなグラミアン角度フィールド、またはマルコフ遷移フィールド(MTF)を生成する方法であり得る。
【0030】
各態様によると、方法は室内測位システムのような測位システムから獲得された一つ以上の開始位置でニューラルネットワークを初期化する段階をさらに含む。テストのためにニューラルネットワークはノイズがあるグラウンドトゥルース(ground truth)ポイントまたは位置で初期化され得る。
【0031】
各態様によると、方法は、センサによって、磁場データを生成する段階をさらに含むことができる。携帯用電子デバイスの絶対位置を決定する段階は、視覚的表現のうち第1タイムスタンプに関連した視覚的表現のセットおよび次のうち少なくとも一つを入力する段階を含むことができる:(i)一つ以上の以前に決定された位置、(ii)以前に決定された特徴ベクトル、および(iii)第1タイムスタンプと異なる各自のタイムスタンプに関連した視覚的表現の一つ以上のセット。
【0032】
<発明の詳細な説明>
【0033】
本明細書では室内位置推定のためのシステムおよび方法に対して記述する。説明を目的として、記述された実施例の完全な理解を提供するために多くの例および特定の詳細事項が提示される。請求項によって定義されたような実施例はこれらの例の特徴のうち一部又は全部を、単独でまたは以下に記述された他の特徴らと組み合わせて含むことができ、本明細書に記述された特徴および概念の修正および同等物をさらに含むことができる。例示された実施例は、要素および構造が参照番号で表示される図面を参照して記述されるであろう。また、実施例が方法である場合、方法の段階および要素は並列または順次的実行で組み合わせられ得る。これらが矛盾しない限り、以下で記述されるすべての実施例は互いに組み合わせられ得る。
【0034】
本開示の態様はスマートフォン慣性センサおよびWi-Fi測定を融合する新しいセンサ融合フレームワークで室内測位および追跡問題を解決する。歩行者推測航法に対する深層学習接近法が提案される。本開示は生センサデータからユーザーモーション状態およびランドマークを検出し、このような分類を利用して疑似ラベルを生成することによってPDRのための神経モデルを学習させるための大容量のアノテートされたデータセットを生成するための方法をさらに含む。
【0035】
本開示に記述されたシステムおよび方法はIPIN 2019 Indoor Localization Competition:Track 3-Smartphone-based(http://indoorloc.uji.es/ipin2019track3/で利用可能)のオフライン設定に対して評価されたし、これは従来の現代スマートフォンを所持して人が歩いた経路をスマートフォンセンサの読み取り値に基づいて再現する作業を伴う。
【0036】
本発明の追加の態様は、移動電話センサのようなセンサによって提供される磁場データを使って室内位置推定の問題を解決する。室内環境で磁気異常は異なる強磁性物体によって生成され得る。一態様において、室内磁気異常による地球磁場の変化は、多変数(multi-variate)時系列でキャプチャーおよび変換され得る。視覚的パターンで時間的パターンを変換するのに多様な技術が使われ得る。例えば、反復プロット、グラミアン角度フィールドおよびマルコフ遷移フィールド(Markov Transition Field)を使って磁場時系列をイメージシーケンスで示すことができる。一態様において、畳み込みおよび循環レイヤを結合することによってランドマーク基盤分類がセンサ位置または関連したユーザー位置に対する深層回帰で補完され得る。一態様において、ニューラルネットワークの予測はノイズがある開始推定でブートストラップ(bootstrapped)され得る。
【0037】
本発明の実施例を磁場基盤位置推定方法を評価するためのMagPieデータセットに対してテストした([David Hanley、Alexander B.Faustino、Scott D.Zelman、David A.Degenhardt、and Timothy Bretl.Magpie:「A dataset for indoor positioning with magnetic anomalies」、Eigth International Conference of Indoor Positioning and Indoor Navigation(IPIN)、2017])。
【0038】
図1は、室内位置推定のための方法100のフローチャートを図示する。方法100は、携帯用電子デバイスの内蔵センサによって提供されるセンサデータから室内環境内のスマートフォンのような携帯用電子デバイスの位置を予測するために利用され得る。
【0039】
方法100は、無線信号データおよび/または磁場データから、または専用センサによって感知された類似する物理的環境データから携帯用電子デバイスの絶対位置に対する予測を生成する段階110を含む。携帯用電子デバイスには一般的に無線信号をキャプチャーするように構成されたWi-Fiセンサが装着されている。Wi-FiセンサはWi-Fiアクセスポイントのような隣り合う無線アクセスポイントからRSSデータを生成するように構成される。一般的にWi-Fiデータの収集のための時間間隔は、4秒に一度のように比較的長い。
【0040】
無線信号データから絶対位置に対する予測を生成する段階は、第1速度で繰り返され得、磁場データから絶対位置に対する予測を生成する段階は、第1速度より大きくてもよい第2速度で繰り返され得る。
【0041】
一実施例において、Wi-Fiデータから絶対位置予測を生成する段階は、低費用で収集されたアノテートされていないWi-FiデータをアノテートされたWi-Fiデータの制限されたセットと結合する半教師あり学習パラダイムに基づき得る。一実施例において、欧州特許出願第19306204.9号に記述された通り、VAEに基づいた方法が利用される。VAEエンコーダ-デコーダアーキテクチャーは獲得したRSSデータを潜在変数にマッピングするエンコーダを含み、使用可能なラベリングされたデータの回帰子役割をする。VAEデコーダはラベリングされたデータとラベリングされていないデータに対する正規化器として機能する。予測された位置を生成するための潜在変数を利用するために分類ニューラルネットワークが利用され得る。
【0042】
追加的にまたは代案として、絶対位置予測を生成する段階は、
図8~
図10、
図12および
図13を参照して以下でさらに詳細に説明されるように磁場データを利用することに基づき得る。
【0043】
方法100は、学習されたニューラルネットワークに入力された慣性センサデータを利用して変位予測を生成する段階120をさらに含む。慣性センサデータは一般的に装置のIMUセンサで高い速度で提供され、学習されたニューラルネットワークが高い速度でローカル変位予測(Δx、Δy)を生成するようにする。高い速度は無線信号データから絶対位置予測を繰り返す第1速度および磁場データから絶対位置を予測する第2速度より大きいこともある。
【0044】
実施例で、段階120は慣性センサデータをグラフィック表現に変換する段階を含むことができ、グラフィック表現は学習されたニューラルネットワークに入力されて水平変位予測(Δx、Δy)を生成する。気圧計センサデータが垂直変位予測(Δz)を生成するために利用され得る。
【0045】
以下でさらに詳細に記述される実施例によると、変位予測のためのニューラルネットワークはCNNまたはRNNを含むことができる。他の実施例によると、センサデータのグラフィック表現は反復マトリクス(recurrence matrix)を構築することに基づき得る。
【0046】
方法100は、以前に予測された位置を変位予測および/または絶対位置予測でアップデートすることによって位置を予測する段階130をさらに含む。絶対位置予測は一般的に相対的に低い速度で利用可能である反面変位予測は一般的に高い速度で生成されるため、予測された位置を変位予測のみでアップデートすることは高い速度で遂行され得る反面、予測された位置を絶対位置予測でアップデートすることは低い速度で遂行され得る。予測された位置のシーケンスは複数の変位予測を少なくとも一つの絶対位置予測と融合することによって決定され得る。変位予測に加え、少なくとも一つの絶対位置予測を利用すれば正確度を向上させることができるが、その理由は絶対位置予測が複数の変位予測を合算して発生する予測の体系的ドリフトを補正することができるためである。
【0047】
実施例で、予測された位置を生成するように絶対位置予測と変位予測を融合するためにカルマン(Kalman)フィルタに基づき得る。カルマンフィルタ基盤接近法を利用するのはリソースが制限されたスマートフォンに特に適合であるが、その理由は計算的に軽いためである。実施例で、カルマンフィルタは高い速度で生成されたPDR予測と相対的に低い速度で生成された絶対位置予測を結合するためのセンサ融合フレームワークとして利用され得る。実施例で、カルマンフィルタは[Chen、「Fusion of Wifi、smartphone sensors and landmarks using the Kalman filter for indoor localization」、Sensors、151:715-732、2015]に記述された通りに利用され得る。
【0048】
方法100は、選択的に段階130で予測された位置にマップがない(map-free)投影を適用する段階140を含む。段階140は、例えば、以下でさらに詳細に説明されるように、予測された位置を知られている室内位置の凸包(convex hull)に投影することによって室内位置外部に置かれた、段階130で予測された位置を室内位置内の位置に補正することができる。
【0049】
図2は方法100を遂行するように構成されたシステム200を図示する。システム200はセンサ222、242、262により提供されるセンサデータに依存する。センサ222はRSSデータを提供するWi-Fiセンサのような無線信号データのためのセンサであり得。センサ242は携帯用電子デバイスの現在位置で磁場データを測定するように構成された、携帯用電子デバイスに含まれた磁力計であり得る。センサ262はスマートフォンのような携帯用電子デバイスに一般的に提供される加速度計およびジャイロスコープのような各種IMUセンサを含むことができる。
【0050】
磁力計242により提供される磁場データはブロック244により事前-プロセッシングされ得る。事前-プロセッシングされた磁力計データは例えば、反復プロット(recurrent plot)を生成することによって磁場データのグラフィック表現を生成するように構成された変換ブロック246に提供され得る。グラフィック表現はニューラルネットワーク248に提供され得る。以下でさらに詳細に説明されるように、ニューラルネットワーク248はRNNが後続する多重チャネルCNNを含むことができる。ニューラルネットワーク248は
図10aおよび
図10bを参照して以下で説明されるように、絶対位置予測を生成するように構成され得る。携帯用電子デバイスの磁力計は普通適当な速度で磁場データを生成するように構成されるため、磁力計242、事前-プロセッシングブロック244、変換ブロック246およびニューラルネットワーク248のパイプラインは適当な速度で絶対位置予測を提供することができる。
【0051】
IMUセンサ262は慣性センサデータを高速で提供することができる。事前-プロセッシングブロック264後に、データストリームは変換ブロック266によりグラフィック表現に変換され得る。以下でさらに詳しく説明されるように、変換ブロックはIMUデータストリームに亘って実行されるスライディングウインドウのデータからグラフィック表現を構成することに対応し得る。IMUデータストリームのグラフィック表現はユーザー位置の変化予測に対応する変位予測をイメージフレーム入力から推論するように学習されたニューラルネットワーク268に提供され得る。以下でさらに詳細に説明されるように、ニューラルネットワーク268はCNNまたはRNNを含むことができる。実施例で、変換ブロック266は生モードでセンサデータを変換することができ、例えばデータ値をピクセルの色相値に変換してすべてのセンサの寸法に対してピクセルを連結(concatenate)することにより、センサのデータ値からグラフィック表現を単純に形成することができる。代案として、変換ブロック266はグラフィック表現を構築するために反復マトリクスを形成することを利用することができる。
【0052】
システム200はWi-Fi RSSデータのような無線信号データから絶対位置予測を生成するためのコンポーネントをさらに含む。ネットワークセンサ222は比較的低い速度で無線信号データを収集するように構成され得る。無線信号データは、Wi-Fiフィンガープリンティング測位方法によって絶対位置予測を生成するためにニューラルネットワーク224、228のパイプラインに入力され得る。実施例で、ニューラルネットワーク224はVAEを具現し、ニューラルネットワーク228は欧州特許出願第19306204.9号に開示された通り、VAE224の潜在変数から絶対位置予測を決定するように構成された分類ニューラルネットワークを具現することができる。VAEを利用すればラベリングされたデータの必要性が大きく減るが、その理由は、少量(10~15%)のラベリングされたデータとアノテートされていない膨大なWi-Fi観察データセットを結合して位置推定コンポーネントに対する正確な予測変数を構築するようにするためである。
【0053】
センサ融合モジュール280はIMUセンサ262、変換ブロック266およびニューラルネットワーク268のパイプラインによる相対的に高い速度で生成された変位予測を、磁力計242、変換ブロック244、およびニューラルネットワーク248のパイプラインによって生成された絶対位置予測、および/またはネットワークセンサ222、ニューラルネットワーク224、228のパイプラインによって生成された絶対位置予測と融合するように構成され得る。パイプライン262、264、266、268の高い速度の予測に比べて、パイプライン242、244、248およびパイプライン222、224、228は相対的に低い速度で予測を生成するため、センサ融合モジュール280は位置をしばしばアップデートするために変位予測を利用し、比較的希に一つ以上の絶対位置予測を利用する。一つ以上の絶対位置予測を利用する位置のアップデートは、希ではあるが変位予測のエラーの累積によるドリフトを補正することができる。
【0054】
センサ融合モジュール280により生成された予測はターゲット空間の外部、例えば建物の外部に置かれ得る。この問題を克服するための直接的な解決策は、室内環境の位置地図に接近して位置地図により予測が室内環境の内部にあるかどうかに基づいてセンサ融合モジュール280の予測を補正することである。その代わりに、システムをより一般的かつ地図独立的にするために、本開示はセンサ融合モジュール280により生成された予測のマップがない投影を適用することを提案する。投影モジュール290は利用可能なアノテートされた学習セットで隣の上位マッチング数Nrが考慮される加重値隣予測を計算するように構成される。引き続き、識別された最近接隣の位置の加重値の和で絶対位置予測が算出される。加重値の和は予測と対応する隣間の距離の逆数で計算された加重値を利用し、したがってNr個の隣で定義された凸包(convex hull)を定義する。
【0055】
図2はまた、点線を利用して、ニューラルネットワーク268を学習させるのに使われるデータの流れおよびモジュールを図示する。学習データは一般的に、単に少数のグラウンドトゥルース(ground truth)アノテーション278のみを含む。学習の間、事前-プロセッシングされたデータがランドマーク検出器272、活動分類器274、および速度および歩幅(stride)推定器276に提供される。事前-学習段階で、ランドマーク検出器272は事前-プロセッシングされたセンサデータからランドマークを予測するために学習され得る。ランドマークは一般的にユーザーが廊下の一つのコーナーに到達して廊下を歩き続くために方向を変える時のような方向の変更を意味し得。ランドマーク検出器272は配向変更を検出するために配向ベクトルを利用することができる。ランドマーク検出器272はランドマークの存在を分類するために配向データを他のセンサデータおよび/またはランドマークグラウンドトゥルースと相関させることができる。配向ベクトルは加速度計、ジャイロスコープおよび磁力計データで推定され得る。実施例で、ランドマーク検出器272はランダムフォレスト(random forest)モデルで具現される。
【0056】
活動分類器274は、学習データを生成するのに使われる携帯用電子デバイスを携帯するユーザーが歩いていたかまたはじっと立っていたかどうかを推論するために、IMUセンサデータを分類するように学習され得る。
【0057】
また、学習の間、速度および歩幅推定器276はセンサデータからユーザーの速度および歩幅を推定するように学習され得る。ランドマーク検出器272、活動分類器274、および速度および歩幅推定器276の出力は、以下でさらに詳細に説明されるように疑似ラベルを生成するために利用される。疑似ラベルを生成すればアノテーション278の不足を克服できるため、IMUセンサ262により収集された利用可能な学習センサデータに、生成された疑似ラベルでアノテートされてニューラルネットワーク268学習のための完全にアノテートされた学習データを生成する。
【0058】
図3は、CNNに基づいたPDRのためのニューラルネットワーク268の具現を図示する。ニューラルネットワーク268はセンサデータから獲得されたグラフィック表現302を受信することができる。グラフィック表現302は畳み込み層304、306、引き続き最大プーリング層308、畳み込み層310および最大プーリング層312によりプロセッシングされ得る。最大プーリング層312の出力はフィードフォワード層318x、318y、314に提供され得る。フィードフォワード層314の出力は活動分類316を生成するために利用され得る。フィードフォワード層318x、318yの出力は、以前に決定された位置に対する携帯用電子デバイスの変位に対する変位予測(Δx、Δy)に対応する予測324x、324yを生成するために、フィードフォワード層320x、320y、引き続きフィードフォワード層322x、322yの各自のパイプラインによってプロセッシングされ得る。
【0059】
したがって、
図3のニューラルネットワーク268の具現は、3個の畳み込み層および2個の最大プーリング層、引き続き完全に連結されたレイヤを伴う。最大プーリング層はCNNによって生成された予測の全般的な正確度を改善するのに役に立つ。また、畳み込み層304、306、310で畳み込みカーネルは入力イメージの大きさの関数で多様である。プーリング層308、312はイメージの行と列の数を減らすことによって畳み込み層の出力の特徴を抽出することができる。実施例で、最大プーリング層308、312は本発明の2×2サブセクションの最大値を保存するために歩幅2を有する2×2フィルタを含む。CNNの最後の段階でソフトマックス活性化関数を有する完全連結レイヤ322x、322yはCNNの出力を計算する。
【0060】
CNNをPDRのためのニューラルネットワーク268として利用すると、センサの間の相関関係を識別することができる。特にCNNは多重モード時系列センサデータに内在されたローカル従属性特性を活用することができる。また、CNNを利用すると、移動の並進不変特性(translational invariant nature)を活用することができる。
【0061】
図4は、PDRのためのニューラルネットワーク268の代案的な実施例を図示する。センサデータのグラフィック表現302はbi-LSTMレイヤ404~410のパイプラインによってプロセッシングされ得る。最後の出力レイヤ412は
図3を参照して前述した通り、同じ方式で、予測された変位324x、324yを生成するように構成されたフィードフォワード層314x、318xおよび318yに出力を提供するように構成され得る。
【0062】
図4に係るニューラルネットワーク268の実施例は、値のシーケンスをプロセッシングし入力ストリームで長距離相互依存性をキャプチャーするのに特化したRNNを利用する。RNNは一つの時間段階から次の段階に情報を伝達できるため、これらは入力ストリーム内の以前の値に対する情報をキャプチャーするように構成される。特にRNNはIMUセンサデータの時系列データ内の時間パターンをキャプチャーするのに適合する。
図4に係るRNN基盤実施例は、双方向方式で時系列データを供給する方式を利用して、bi-LSTMが二つすべての時間方向のパターンを認識するように学習されるようにする。LSTMネットワークはより伝統的なRNNの傾き(gradient)消失(vanishing)および暴走(exploding)問題を克服し、長距離従属性を効率的に学習させるために提案された。
【0063】
図5は、センサデータでグラフィック表現を生成することを図示する。
図5は加速度計、ジャイロスコープおよび磁力計データ値のグラフを表示する。それぞれの加速度計、ジャイロスコープおよび磁力計はX、Y、Z軸に沿って各自の値に対するデータ値を提供する。ラインプロット52で図示されたデータ値はグラフィック表現54に変換される。図示された実施例で、データ値はグラフィック表現54のピクセルの色相彩度を決定するために利用されて、それぞれのセンサデータ次元に対するピクセルの行を生成する。実施例によると、正のデータ値はrgb色相次元のような第1色相次元のピクセルの色相彩度を決定することができ、負のデータ値は異なるrgb色相次元のような第2色相次元のピクセルの色相彩度を決定することができる。すべてのセンサデータを連結する(concatenating)ことによって、次元Δt×dのグラフィック表現が算出され、ここでΔtは考慮されるスライディング時間ウインドウの大きさである。Δtの幅はニューラルネットワーク268に対する入力のためのそれぞれのデータポイントの幅を決定する。一実施例において、グラフィック表現54を生成する前に、センサデータは任意のユーザーの変位を特性化するのに十分な周波数である50Hzの周波数でダウンサンプリングされる。実施例で、ウインドウ幅は1秒に対応して、グラフィック表現54のそれぞれのデータポイントは50個の列(Δt=50)を有する。
【0064】
図5は3個のセンサである加速度計、ジャイロスコープおよび磁力計に該当する総12個の特徴を有する実施例、およびそれぞれのセンサに対して、それぞれの軸に対する一つの行および結合されたX、Y、Z値から計算された大きさに対する一つの行を図示する。上記で詳細に説明された通り、神経モデル268は変位(Δx、Δy)を予測するための一つの回帰分岐およびユーザーの活動を予測するための分類分岐を有する。
図5に図示された実施例はニューラルネットワーク268に、グラフィック表現54で直接翻訳されたセンサデータ値(例えば、変換ブロック266からの加速度計およびジャイロスコープデータ値、および変換ブロック246からの磁力計データ値)が供給される生データモードに対応する。代案として、グラフィック表現は反復マトリクスに基づいて形成され得る。
【0065】
図6は、PDRのためのニューラルネットワークを学習させるための方法600を図示する。方法600は、センサ読み取り値を記録する携帯用電子デバイスを携帯するユーザーによってキャプチャーされた学習データを利用することができる。学習データは記録されたセンサ読み取り値と制限された数のランドマークに対するアノテーションを含む。方法600は、高速で生成された生センサデータに疑似ラベルでアノテートすることができる。疑似ラベルの生成はユーザーの活動分類およびランドマーク検出の簡単な作業に対する事前-学習に基づく。
【0066】
方法600は、ユーザーが歩いているのとユーザーがじっと立っているのを区別するために、活動分類器を学習させる段階610を含む。また、方法600はランドマーク分類器を学習させる段階620を含む。したがって、データが提供されたランドマークは学習データをキャプチャーする間のユーザー軌跡の方向変化を示すと仮定する。方法600に係る学習は、特に二つの連続的なランドマーク間でユーザーの軌跡に対する配向の変化がないと仮定するため、ランドマークに対応するポイントの間のユーザーの軌跡は直線である。
【0067】
活動分類のための活動分類器を学習させ、ランドマーク分類のためのランドマーク分類器を学習させることは比較的容易な作業であるため、活動分類器とランドマーク分類器は高い正確度を達成するように学習され得、これは生成された疑似ラベルの高い正確度を保障する。
【0068】
方法600は、ランドマークの間のユーザーモーションに対するこのような仮定に基づいて疑似ラベルを生成する段階630を含む。しかし、軌跡に沿うユーザーの速度は軌跡中に遭遇するドアや他人のような障害物によって変わり得る。疑似ラベルを生成する段階は、加速度計のデータから多数の歩数を獲得することによってランドマークの間の軌跡に沿った速度を決定する段階を利用する。速度は連続ランドマークの間の距離とそれらの対応するタイムスタンプにより調整される。ユーザーの軌跡が任意の二つの連続ランドマークの間の直線に沿うという仮定は、たびたび長い廊下がある建物が含まれた殆どの室内環境で検証される。したがって、この仮定により発生するエラーは多重ドア通路と廊下の幅の間のユーザー選択のような状況に制限される。
【0069】
方法600は、変位予測を生成するためにPDRのためのニューラルネットワークを学習させる段階640をさらに含む。PDRのためのニューラルネットワークを学習させる段階640は、生成された疑似ラベルで学習セットを強化(enrich)する段階を含み、PDRのためのニューラルネットワークを学習させるための強化された学習セットを利用する。PDRのためのニューラルネットワークを学習させる段階は、回帰のための学習および活動予測のための学習を含む。回帰のための学習は変位(Δx、Δy)を予測することを目標とする。PDRのためのニューラルネットワークを学習させる段階は、一般的な交差エントロピー損失(Lossce)で学習させる段階を含むことができる一方、回帰のためのPDRのためのニューラルネットワークを学習させる段階は、2Dポイントのセットに対するL2損失を次の式により最小化する段階を含むことができる
【0070】
【0071】
ここでΔxn、Δynはアノテーションデータから算出され、
【0072】
【数2】
は変位予測である。PDRのための神経モデルを学習させるために、学習率10
-3であるAdamオプティマイザー(optimizer)が利用される。総学習および検証損失が次の式により計算される
【0073】
【0074】
ここでαは回帰と活動予測間の折衝点である。
【0075】
図7aおよび
図7bは、方法600に係る学習のための例示的な軌跡に対する学習データを図示する。
図7aの左側パネルはIPINカンファレンスチャレンジの室内測位および室内ナビゲーションに含まれたユーザー経路の一例を図示する。
図7aの右側パネルは加速度計、ジャイロスコープ、磁力計および気圧計センサの関連センサデータだけでなく、速度および歩幅推定値を図示する。例示的な経路はポイント0でスマートフォンをつけて校正(calibration)が終了するようにすることで始めて10ポイントに渡っている。引き続き、ユーザーはポイント1、2、3、4を通ってポイント5に移動する。ポイント5からユーザーは振り向いてポイント6を生成し、ポイント7、8、9を経て開始位置に再び復帰する。ポイント1~ポイント5およびポイント7~ポイント10は方向変更を含むためランドマークである。ランドマーク検出器は前述した通り、配向変更を利用することに基づいてポイント1~ポイント5およびポイント7~ポイント10をランドマークとして識別するように学習される。
【0076】
図7bの左側パネルは配向変更がユーザー軌跡の検出されたランドマーク位置(1~5および7~10)とどのように関係するかを図示する。
図7bの右側の下段のパネルはパラメータデータが軌跡が固定された底内にあることを示し、二つのランドマークの間のそれぞれの軌跡セグメントに対する予想歩幅を追加で表示することを図示する。
【0077】
本開示で記述されたシステムおよび方法をIPIN競争のオフライン設定に対して評価したし、これはスマートフォンセンサの読み取り値に基づいて従来の現代スマートフォンを所持している人によって選択された経路を再現する作業を含む。センサデータは「センサデータを持ってくる(Get Sensors Data)」アンドロイドアプリケーションを使ってログファイルに記録および保存された。競争データはまた、与えられたタイムスタンプのユーザー位置からなるランドマークのセットを含む。競争データに提供される学習セットはそれぞれ5分の長さの15個の異なるユーザー軌跡に対応する50個のログファイルからなり、これは双方向に多数回横断された。有効性検査セットには10分の長さの10個の異なる軌跡に関連した10個のログファイルが含まれた。学習ログファイルですべての重要な方向転換(turn)にランドマークとしてアノテートされたが、検証セットは、必ずしも直線に沿わなければならないものではなく、方向転換、Uターン、停止およびその他挑戦的な動きを含むことができる二つの連続ランドマークの間の軌跡を含む。IPIN競争の評価ログファイルには、任意のランドマークの情報なしに20分の間のセンサデータの記録のみ含まれる。チャレンジは評価ログファイルのセンサデータに基づいてユーザーの経路を再現して、0.5秒ごとにユーザー位置推定値を提供することである。
【0078】
記述されたシステムおよび方法の長所を、異なるコンポーネントを除去して対応する位置推定エラーを測定することによって評価した。
【0079】
【表1】
表1:IPIN’19チャレンジの最上の結果および疑似ラベル(PLs)、RPs、Wi-Fiおよびマップがない投影(PRJ)を除去することによる開示されたシステムに対するMAE、50%、75%および90%エラー。
【0080】
表1で上段はチャレンジの上位3個の結果を報告し、引き続きCNNおよびRNNを深層PDRモデルであってニューラルネットワークとして使う時の開示されたシステムの結果を提示する。表1はWi-Fi基盤絶対位置予測およびマップがない投影を利用して疑似ラベルを評価する時の結果を報告する。表1で推論できるように、75%エラーで1.80メートルの最上の性能は、センサデータのグラフィック表現を生成するために疑似ラベルおよび反復プロットを利用するのと共に、CNNを深層PDRモデルとして使うシステムに対して獲得される。これに比べ、IPIN’19チャレンジの優勝者は2.27メートルの75%エラーと報告された。Wi-Fi測位およびマップがない投影コンポーネントを除去すれば、このようなコンポーネントすべてがCNNおよびRNNモデルのいずれに対しても正確度を改善するのに重要な役割をするということが分かる。
【0081】
図11は、前述したシステム200のコンポーネントにより生成された位置予測と最新PDR方法の予測を図示する。
【0082】
センサによって提供される磁場データを使って室内位置推定の問題を解決する、パイプライン242、244、246、248により生成された絶対位置予測に関連した本発明の追加の態様が以下に記述されるであろう。
【0083】
室内磁気シグネチャは壁、柱、ドアおよびエレベータのような多様な強磁性物体によって誘導された地球磁場の撹乱である。このような異常は観測ポイントまでの距離が減少するにつれて目立つ。多数の室内強磁性物体とこれらが誘発する撹乱は固有なパターンでシグネチャを形成し、これはこれらシグネチャをそのパターンに基づいて分類できるようにする。磁場データはモバイルフォンのようなモバイルコンピューティングデバイスに含まれ得る磁力計のようなセンサによって獲得され得る。したがって、モバイル電話アプリケーションは室内環境でセンサ基盤の測位およびナビゲーションに使われ得る。
【0084】
ユーザーが室内環境をナビゲーティングする時に収集される磁気データは多変数時系列で形成され得る順次的な特性を有し得る。実施例で、多変数時系列は一つ以上のイメージのような一つ以上の視覚的/グラフィック表現に変換される。これらイメージは異なる磁気パターンを示すことができる。グラフィック表現は位置ベクトルエンベッディングを抽出する畳み込み層に対する多重チャネル入力を形成することができる。一例で、グラフィック表現は完全に連結された(fully connected、FC)レイヤに供給され得る。FCレイヤは分類モードで最近接ランドマークを予測するように訓練されたり、回帰モード(regression mode)でユーザーの位置座標を直接推定するように訓練され得る。
【0085】
回帰基盤およびランドマーク基盤のこの二つの接近法は磁気センサデータを使うその概念によって補完される。したがって、これらは多重作業方式で組み合わせられ得る。ウイングロス(wing loss)技術はそれぞれのコンポーネントの予測に対する信頼度を推定し、より正確な位置推定予測器を生成することによってこの二つのコンポーネントを組み合わせるのに使うことができる。しかし、綿密な分析によると、二つの方法はいずれも実際に非常に類似する状況で失敗したものと示された。それらの失敗はシステムが非常に異なる場所で直面する類似する磁気シグネチャによってもたらされる。説明すると、同一の磁気異常が同一の強磁性物体、例えば廊下の異なるコーナーに配置された同一のアーマチュアの柱(armature pillars)によって発生するものである。
【0086】
一実施例によると、深層学習接近法は畳み込みおよび循環レイヤおよびこれらの学習を含む深層ニューラルネットワークの最も最近の発展から利益を得るために使われる。実施例で、位置推定コンテクストは、システムまたはモデルが類似する磁気パターンを明確にすることを助けるために、多重チャネル深層回帰で完全に連結されたレイヤを代替する循環レイヤでキャプチャーされる。畳み込み層が位置エンベッディングを抽出する一方、循環レイヤは類似するパターンを明確にするために内部状態で位置推定コンテクストをエンコーディングする。モデルは一つ以上の畳み込み層を有する畳み込みニューラルネットワーク(CNN)および一つ以上の循環レイヤを有する循環ニューラルネットワーク(RNN)を含むニューラルネットワークであり得る。
【0087】
順次データに対するモデルはブートストラップ(bootstrapping)問題に露出され得る。一部のモデルは第1予測を生成するために磁気センサデータを蓄積しなければならないこともある。実際にこのような蓄積に5~10秒が必要とされ得る。循環モデルは試み(trial)の開始ポイントを知らなければならないというさらに他の制約があり得る。一実施例において、ランドマーク基盤分類またはCNN基盤回帰モデルのような一つ以上の他のモデル、またはWi-Fi信号のような他のセンサからの近似位置がこのような問題を解決するのに使われる。一つ以上の他のモデルからの近似位置はノイズがある予測であり得る。したがって、一実施例において、モデルは開始ポイント推定エラー下でテストされる。
【0088】
MagPieデータセットに対する集中評価は、本発明の実施例が強力かつ正確な位置推定システムに寄与するということを示した。実際に3個のMagPie建物に対する位置推定エラーが0.30~1.05mに減少して、0.95~4.49mのエラーを有するAMID方法を大幅に改善することができる。パイプラインのモデル学習および評価はオフラインで遂行され得る。ネットワークはすでに観察されたデータでフィード-フォワードするのでテスト段階はオンラインで遂行され得る。
【0089】
実施例はローカル磁気センサ、例えば、モバイルフォンからの磁力計に関連したローカル基準フレームをグローバル基準フレームに変換する方法を含む。磁場データは多変数時系列を形成することができる。方法は多変数時系列を多チャンネル2Dシーケンスに変換する段階を含むことができる。これを通じて時系列のパターン検出をイメージのパターンマイニング、そして畳み込みおよび循環ニューラルネットワークの最近の発展からの利点で代替することができる。MagPieデータセットに対する実施例に係る方法の評価は低い位置推定エラーおよび最新方法の大幅の改善を示す。実施例はインフラに対する任意の投資を要求せず、磁場基盤測位システムをWi-Fi、ブルートゥースおよびPDR方法に対して競争力があって匹敵できるようにする。
【0090】
図8は、一実施例に係る室内位置推定のための例示的な方法800のプロセスフローチャートである。方法800は室内測位のための独立型(stand-alone)解決策として適用され得る。代案として、方法800の方法段階は前述した方法100の段階110の一部として遂行され得る。
【0091】
選択的段階810で、方法は磁力計、ジャイロスコープ、および/またはモバイルコンピューティング装置の加速度計のような一つ以上のセンサを校正する段階を含むことができる。例えば、ジャイロスコープは磁力計のようなセンサの基準フレームをグローバル基準フレームに変換するのに使われ得る。
【0092】
段階820で、磁場データは一つ以上の校正されたセンサのうちのセンサ、例えば、磁力計によって生成され得る。磁場データは磁場値の時系列を含むことができる。例えば、センサはセンサが建物内で移動したりまたは地球の磁場を干渉する物体の近所で移動される時に磁場の変化を検出することができる。センサは地球の磁場と強磁性物体に基づく磁気シグネチャを検出することができる。これらシグネチャは地球の磁場を撹乱するので異常として知られている。このような構造の影響は観察ポイントまでの距離が減少するにつれて目立つようになる。その結果、このようなシグネチャはそのパターンでの固有性を表示し、これはそれらのパターンに基づいてシグネチャを分類できるようにする。
【0093】
段階830で、センサの磁場データに基づいて視覚的表現が生成される。段階830は磁場値の時系列の磁場値のサブセットを選択する段階、および磁場値のサブセットまたは磁場値のサブセットの投影を一つ以上の2次元イメージに変換する段階を含むことができる。グラフィック表現は反復プロット(RP)、グラミアン角度合算フィールド(GASF)、および/またはグラミアン角度差フィールド(GADF)のようなグラミアン角度フィールド、およびマルコフ遷移フィールド(MTF)のうち少なくとも一つを含むことができる。例えば、グラフィック表現は単一タイムスタンプの間、ニューラルネットワークに同時に入力され得る反復プロット(RP)、グラミアン角度合算フィールド(GASF)、および/またはグラミアン角度差フィールド(GADF)のようなグラミアン角度フィールド、およびマルコフ遷移フィールド(MTF)のうち少なくとも二つ、三つ、又はすべてを含むことができる。
【0094】
第1方法により生成された第1グラフィック表現および第1方法と異なる第2方法により生成された第2グラフィック表現は、一つ以上の畳み込み層に対する多重チャネル入力で同時に入力され、第1グラフィック表現と第2グラフィック表現は磁場値の同一のセットから獲得される。第1方法および第2方法は反復プロット(RP)、グラミアン角度合算フィールド(GASF)、および/またはグラミアン角度差フィールド(GADF)のようなグラミアン角度フィールド、またはマルコフ遷移フィールド(MTF)に対する方法であり得る。
【0095】
段階840で、センサの位置はニューラルネットワークを使う視覚的表現に基づいて決定される。ニューラルネットワークは畳み込みニューラルネットワークと畳み込みニューラルネットワークの畳み込み層に対する多重チャネル入力を含む。ニューラルネットワークは一つ以上のゲーテッド循環ユニットを含む循環ニューラルネットワークを含むことができる。一つ以上の循環レイヤは一つ以上の畳み込み層に従い得る。初期に、方法は循環ニューラルネットワークを室内測位システムのような測位システムから獲得された一つ以上の開始位置で初期化する段階をさらに含むことができる。テストのために、循環ニューラルネットワークは学習/テスト/検証データから獲得されたノイズがあるグラウンドトゥルースポイントまたは位置で初期化され得る。
【0096】
段階840は、ニューラルネットワークに、視覚的表現のうち第1タイムスタンプに関連した視覚的表現のセットおよび次のうち少なくとも一つを入力する段階を含むことができる:(i)一つ以上の、以前に決定された位置、(ii)以前に決定された特徴ベクトル、および(iii)前記第1タイムスタンプと異なる各自のタイムスタンプに関連した視覚的表現の一つ以上のセット。
【0097】
一つ以上の畳み込み層および一つ以上の畳み込み層に対する多重チャネル入力を含むニューラルネットワークを利用して、グラフィック表現に少なくとも部分的に基づいて携帯用電子デバイスの絶対位置を決定することによって、正確な方式で携帯用電子デバイスの絶対位置を決定する改善された方法が提供される。
【0098】
段階850で、センサの軌跡がセンサの決定された位置およびセンサの予め決定された位置に基づいて決定される。
【0099】
MagPIE(磁気測位室内推定(Magnetic Positioning Indoor Estimation))データセットは磁気異常を利用した室内測位アルゴリズムの評価のためのデータセットである。データセットにはセンチメートル正確度を有するグラウンドトゥルース位置測定と共に、IMU(慣性測定単位)および磁力計測定が含まれる。データはUIUCキャンパスのCSL(Coordinated Sciences Laboratory)、Talbot研究所およびLoomis研究所の3つの建物で収集された。データセットは(まるで文字メッセージを送るような)ハンドヘルド電話機を所持して歩く人(WLK)のデータポイントおよびUGV(無人地上車両)のデータポイントを含む。二つの異なるテストシナリオが利用可能である:一つは建物の磁場に任意の変更が賦課されず、(異常値なし)、二番目のセットには建物の磁場を変更する物体が場面に追加される(異常値がある)。
【0100】
一実施例によると、磁場データから携帯用電子デバイスの絶対位置を予測する方法は、任意の時間でモバイル電話センサデータを分析することによってユーザーおよび/またはモバイル電話の位置を決定する段階を含むモバイル電話基盤位置推定方法を含むことができる。建物の底は圧力センサデータからたびたび正確に検出されるので、3D位置推定問題はユーザーの位置が二つの値(posxおよびposy)で記述されるさらに簡単な2D位置推定問題に縮小され得る。
【0101】
モバイル電話で加速度計、ジャイロスコープおよび磁力計はローカル基準フレームでそれらのデータを提供する。加速度計およびジャイロスコープセンサが磁気センサ値をローカルからグローバル基準フレームに変換するのに使われ得る(
図9参照)。以下では磁場データが空間で電話機の配向に依存しないと仮定することができる。空間で電話機の配向はグローバル基準フレームを参照するため、タイムスタンプ(t)で三個の値
【0102】
【数4】
で構成された多変数時系列を形成する。学習およびテストデータセットは試み(trial)のセットからなり得る。任意の学習試みは磁場データおよびグラウンドトゥルース位置を含むことができる:
【0103】
【数5】
ここでtは測定タイムスタンプである。テスト試みの場合、グラウンドトゥルース位置が利用可能でないこともあるので、
【0104】
【数6】
データセットは建物を通過する単一歩行者試みのセットが含まれる。試みは異なる日に建物の異なる部分で収集され得る。
【0105】
モバイル電話センサは一般的に同期化されない;これらは異なるタイムスタンプと異なる頻度でデータをキャプチャーする。任意の追加プロセッシングの場合、センサ読み取り値は同じタイムスタンプで同期化および整列され得る。
【0106】
内蔵された磁力計は安価のセンサであり、磁場に関するそれらの測定値はたびたびセンサの製造問題およびプラットホームおよび環境によって誘導される磁気偏差を含んだエラーによって汚染される。したがって、高い正確度を達成するために測定前に磁力計が校正され得る。
【0107】
磁気偏差は磁力計の周辺に存在する強磁性要素によって発生し得る。磁気偏差は永久磁気および誘導磁気で構成され得る。最初のものは硬鉄効果といい、二番目のものは軟鉄効果という。硬鉄効果は永久磁石と磁気ヒステリシス、すなわち磁化された鉄材料の残留によって発生し、バイアスベクトル(bm)と同一である。軟鉄効果は強磁性要素と外部場の相互作用により発生し、これは磁場を誘導する。これは感知されたフィールドの強度だけでなく方向も変更させる。軟鉄効果は3×3行列Λでモデリングされ得る。
【0108】
理想的な三軸磁力計は電話機に関連した直交軸に沿って磁場の強度を測定する。任意の磁気干渉がない場合、磁力計の読み取り値は地球の磁場を測定する。センサがあらゆる可能な配向で回転する時に磁力計の測定が遂行される場合、測定値は3D球上に置かれなければならない。球の半径は磁場の強度である。磁力計は生磁気データからbmおよびΛを推定することによって校正され得る。一応bmおよびΛが発見されると、校正されたデータは
【0109】
【0110】
空間で電話機の配向は4元数(quaternion)または回転角度(ヨー、ピッチ、ロール)で記述され得る(
図9参照)。4元数は三個の回転角度に変換され得る。これら回転角度は電話機から直接獲得されたりジャイロスコープの読み取り値から再構成され得る。移動する間、人は多様な位置(自身の前の上に、耳の近く、ポケットの中など)で電話機を捉え得る。短い時間でも電話機の位置はかなり変更され得る。電話機のセンサがローカル基準フレームでの測定値を提供することにより、これらをグローバル基準フレームに変換するために回転角度が使われ得る。
【0111】
実施例で、磁場基盤位置推定は例えば、
図2のシステム200のブロック246で磁場データのグラフィック表現を形成するために深層ニューラルネットワーク(DNN)を使って具現される。DNN学習プロセスは傾き逆伝播を通じての目的関数最適化およびネットワーク加重値アップデートを含むことができる。ニューラルネットワークのようなモデルは回帰モデルまたは分類モデルを含むことができる。回帰モデルを学習させる時、平均-自乗-誤差(Mean-Square-Error、MSE)、平均絶対誤差(MAE)およびフーバー損失(Huber loss)が目的最小化関数として使われ得る。分類モデルは交差エントロピー損失として学習され得る。
【0112】
単一試みの磁場値は多変数時系列を示す。それぞれの観察は3個の値
【0113】
【数8】
からなり得る。軸(x、yおよびz)は直交する必要がない。磁場の一部の配向は他のものよりさらに重要であり得る。例えば、
【0114】
【0115】
【数10】
のような異なる組み合わせおよび投影が磁場値に基づいて計算され得る。磁場値の最適投影の選択はモデルハイパーパラメータのうち一つであり得る。
【0116】
初期に、センサデータは(例えば、
図2の244でセンサ242に対して)事前-プロセッシングされ得る。事前-プロセッシング後に磁場値の投影が獲得されると、これらはDNNに入力され得る。例えば、1次元時系列(
【0117】
【数11】
に対する特徴生成段階はスライディングウインドウ接近法を適用する段階を含むことができる。例えば、ウインドウのサイズおよび重複に基づいて時系列から複数のサブセットが選択され得る。例えば、ウインドウのサイズは5~10秒であり得、ウインドウの重複は20~1パーセントの間、例えば10、5、または2パーセントであり得る。データポイントまたは磁場値のすべてのサブセットに対して、磁場パターンをグラフィック表現に変換するために1D時系列から2Dイメージへの非線形変換が適用され得る。例えば、反復プロット(RP)に変換された順次的値を分析するために畳み込みニューラルネットワークが使われ得る。RPが時系列で一つの特定類型の反復を扱うため、PRは時系列をグラフィック表現、例えば2D視覚的パターンにエンコーディングする他の方法を利用して拡張され得る。例えば、他の方法はグラミアン角度合算/差フィールド(GASF/GADF)およびマルコフ遷移フィールド(MTF)であり得る。
【0118】
この4つの非線形1Dから2Dへの変換は以下でさらに詳しく記述される。
【0119】
反復プロット(RP)は、以前に異なる時系列およびアプリケーションに対して提案されたことがある。磁場データの場合、RPは次のようにユークリッドメトリックに対して計算され得る:
【0120】
【0121】
【0122】
方法はミンコフスキー(Minkowski)またはマンハッタン(Manhattan)メトリックのような任意のペアワイズ(pairwise)距離メトリックに拡張され得る。
【0123】
グラミアン角度フィールド(GAF)で時系列は、デカルト座標(Cartesian coordinates)の代わりに極座標(polar coordinate)システムで表現され得る。時系列値はすべての値が極座標で表現されるために、間隔([-1、1])に属するようにリスケーリング(rescale)され得る。
【0124】
【0125】
引き続き、極座標エンコーディングされた時系列ベクトルは行列に変換される。時系列ベクトルの長さがnである場合、変換された行列は形態(n×n)である。GAFは次のように、GAFの二つの変形:グラミアン角度合算フィールド(GASF)およびグラミアン角度差フィールド(GADF)のうち一つを含むことができる
【0126】
【0127】
MTF(マルコフ遷移フィールド)の主な発想は時系列をマルコフプロセスの結果として見なすことである。この方法は、離散化後に分位数ビン(bin)のマルコフ行列を構築し、準-グラミアン行列で動的転換確率をエンコーディングする。
【0128】
時系列(V)の場合、Q分位数ビンが識別され得、それぞれのviは対応するビン
【0129】
【数16】
に割り当てられ得る。Q×Q加重値隣接行列(W)は次の通り、時間軸に沿って一次マルコフチェーン方式で分位数ビンのうちの遷移を計数することによって構成され得る:
【0130】
【0131】
前記提示された4つの変換は、ウインドウのサイズ7秒、ウインドウのステップサイズ1秒、イメージのサイズ100および「キャンベラ(Canberra)」距離メトリックを使ってMagPieデータセットから一回の試み(CSL学習試みN 11)を使って視角化され得る。
図12は、試みのためのグローバル座標系の磁場時系列1210を図示する。
【0132】
図12は、前記提示されたRP、GASF、GADFおよびMTF方法を使って2Dパターン1220で時系列を変換した結果を図示する(上位3個の行、3次元x、y、zに対する10個の反復プロットのシーケンス;上から二番目の3個の行、3次元x、y、zに対する10個の連続的なグラミアン角度合算フィールドプロット;上から三番目の3個の行、3次元x、y、zに対する10個の連続的なグラミアン角度差フィールドプロット;最後の3個の行、3次元x、y、zに対する10個の連続的なマルコフ遷移フィールドプロット)。すべてのイメージは磁場時系列1210から7秒~24秒の間のセグメントで生成される。イメージは本来の磁気値
【0133】
【0134】
次の説明部分で、磁場データに基づいて携帯用電子デバイスの絶対位置を予測するための実施例に係る3個の異なるニューラルネットワークが議論される。前述したシステム200の実施例で、ニューラルネットワーク248はこれらニューラルネットワークにより構成され得る。
【0135】
第1ニューラルネットワークはランドマーク基盤分類モデルと称されるであろう。このモデルの場合、磁気地図が構成され、これは磁気ランドマークを検出することを含む。モデルは正しい位置をランドマークのうち一つとして分類するように学習される。より詳細には、磁気データを補間して磁気グリッド地図が構成される。引き続き、平滑化プロセスはセンサ読み取りオフセットによるエラーを補正することができる。ランドマークの検出は
図13に図示された通り、ローカル最小値/最大値(ピーク)の検出、(異常値を除去するための)磁気ランドマーク候補微細調整および磁気ランドマーク選択を含むことができる。
【0136】
磁気ランドマークはそれらの周辺よりさらに大きいか小さい磁気強度を有する強磁性物体であり得る。したがって、磁気ランドマーク候補は磁気地図でローカル最小値/最大値を探すことによって識別され得る。
【0137】
すべてのポイントが測位のための磁気ランドマークとして使われ得るものではない。これらポイントの間には室内地磁気環境と磁気ランドマーク特性によって異常値が存在する。一部の領域では磁気強度がほとんど変わらない。また、一部の磁気ランドマークの磁気強度は時間が経過するにつれて変動する。変動は電気モータのような電磁要素によって発生し得る。このような変動はローカル最小値/最大値のクラスターを生成することができる。磁気ランドマーク候補微細調整は問題の解決に役に立つ。ユークリッド距離基盤レイヤツリーが使われて、これらポイントを一つの磁気ランドマーク候補にグループ化することができる。
【0138】
殆どのランドマーク候補は平均磁気強度よりはるかに高いか低い値を有する。しかし、一部の候補の磁気強度は平均強度と類似しているため磁気シーケンスパターンが生成されない。臨界値が定義または設定されて、これら候補を自動で識別しフィルタリングすることができる。臨界値は手動で設定され得る。
【0139】
磁気ランドマークが選択または決定されると、位置推定作業は最近接ランドマークを識別することに縮小され得る。分類器が使われて最近接ランドマークを決定することができる。
【0140】
モデル入力はN-チャネルテンソルであり得る。例えば、NはRP、GASF、GADFおよびMTFそれぞれに対して3個のチャネルずつ12個であり得る。分類アーキテクチャーは位置エンベッディングを抽出する二つの畳み込み層および分類のための二つの完全に連結されたレイヤを含むことができる。例えば、CSL建物に対して30個の磁気ランドマークが決定され得る。したがって、出力レイヤは30個のニューロンを有することができる(
図10a)。損失関数は交差エントロピー損失であり得る。
【0141】
CNN+FC回帰モデルと称される第2ニューラルネットワークの場合、ランドマーク基盤分類が直接絶対位置回帰で代替される。CNN+FC回帰モデルはランドマーク分類アーキテクチャーを複製するが、出力レイヤは単にx-位置およびy-位置(posxandposy)に対して2個のニューロンのみ有することができる。代案として、出力レイヤはx-位置、y-位置およびz-位置に対して3個のニューロンを有することができる。目的最小化関数に対して、MSE、MAEまたはフーバー損失が使われ得る。CNN+FC回帰はシステムを磁場地図品質および選択されたランドマークに独立的にさせる。しかし、ランドマーク基盤およびCNN基盤回帰モデルは異なる位置での類似する磁気パターンに直面する時に失敗する。
【0142】
一実施例において、異なる位置での類似する磁気パターンを明確にするためにナビゲーションコンテクストが考慮される。三番目のニューラルネットワークはCNN+RNN回帰モデルと称する。このモデルでFCレイヤは循環レイヤで代替される。循環ニューラルネットワーク(RNN)は順次的かつ規則的なタイムスタンプ基盤データを作業するのに使われ得る。学習プロトコルはRNNに対して変更され得、データはポイント別(point-by-point)方式ではなく試み別(trial-by-trial)方式でプロセッシングされ得る。それぞれのトラックに対して位置推定値
【0143】
【数19】
が順次生成され、以前の推定値は次の位置
【0144】
【0145】
CNN+RNN回帰モデルは多重チャネルCNN+RNN深層回帰モデルを含むことができる。CNN+RNN回帰モデルは位置エンベッディングを抽出するために畳み込み層を維持するが、FCレイヤは循環レイヤで代替する。
図10bは、一実施例に係るCNN+RNN回帰モデルのアーキテクチャーを図示する。CNN+RNN回帰モデルは一つ以上の畳み込み層を有する畳み込みニューラルネットワークおよびGRUセルの2-レイヤ単方向RNNのような少なくとも一つの循環レイヤを有する循環ニューラルネットワークを含む。
【0146】
RNNは多様な長さの入力シーケンスを収容することができる。モデルは第1タイムスタンプに関連した磁場データの第1グラフィック表現に基づいて位置を予測することによって開始され得る。後続的に、モデルは第2タイムスタンプに関連した磁場データの第1グラフィック表現および第2グラフィック表現に基づいて次の位置を予測することができる。次の位置は各自の以前のタイムスタンプまたは以前に決定された位置に関連した少なくとも一部のグラフィック表現に基づいて予測され得る。代案として、他の室内測位システムが以前の位置を決定するために使われ得、これらは引き続き、センサまたはユーザーの次の位置を予測するのに使われ得る。RNNレイヤに対して以前に決定された位置または以前に生成されたグラフィック表現の最大数は予め定義されるかユーザーによって設定され得る。その結果、モデルは、次の予測のために、以前に決定された位置または以前に生成されたグラフィック表現のすべてまたは10~20個の最大数の以前に決定された位置または以前に生成されたグラフィック表現のシーケンスを使うことができる。
【0147】
代案的なセンサおよび位置推定システムが、例えばWi-Fiまたはブルートゥース信号から第1位置(position)または位置(location)を決定するために使われ得る。Wi-Fi基盤位置推定の平均距離誤差は2~3メートルであるので、この誤差は開始ポイント位置に任意のノイズを追加することによって学習およびテスト段階のすべてにおいてシミュレーションされ得る。
【0148】
すべてのモデルをMagPieデータセットに対して評価した。三つの建物、すなわちCSL、LoomisおよびTalbotは異なるレイアウトと異なる位置推定の複雑性を有する。学習およびテストデータセットに追加して、検証データセットが(ニューラルネットワークが過剰適合(overfit)され始まる時に学習を中止するための)早期中止のために使われる。CNN+FC回帰モデルはCSL建物に対して良い結果を示す。すべての建物、3個のモデルと1、3、9、12個のチャネルすべてに対する最上の結果が表1に提示されている。CNN+FCランドマーク基盤分類モデルは分類のためにランドマークを使用し、これは建物が磁気異常で大きく異なることを確認した。CSLでのみ良い結果が獲得された。CNN+RNN深層回帰は軌跡コンテクストを考慮し、これはパターンの曖昧性の問題を解決するのに役に立ち、位置推定エラーをかなり減らすことができる。建物に対するCNN+RNNモデル結果による予測が
図12において参照符号1230で図示される。
【0149】
表2は三つの建物に対する三つの方法の性能を要約したものである。また、この票はチャネルの数が1個(RPの場合x)、3個(RPの場合x、y、z)、9個(RP、GASFおよびGADFの場合x、y、z)または12個(すべての方法の場合z、y、z)である時の位置推定エラーを報告する。結果は複数のチャネルを使うのが、最終的に低いエラーに大きく寄与するということを明確に示す。
【0150】
【表2】
表2:1、3、9および12個のチャネルに対する深層回帰およびランドマーク分類方法の位置推定エラー[m]
【0151】
すべてのモデルに対して、開始ポイントの推定は学習およびテスト試みすべてに対してノイズがあり得る。ノイズは平均0mおよび分散3mの正規分布でシミュレーションされ得る。モデルはハイパーパラメータによって学習され得る。ハイパーパラメータはRNNレイヤの数、ペアワイズ距離メトリック、開始ポイントの数、開始ポイントノイズおよび教師強制確率を含むことができる。
【0152】
本出願の実施例は磁場データに基づいて絶対位置を予測するための多数の改善事項を提供し、磁場時系列を2D表現に変換してCNN基盤モデルを使うことを可能にすること、ランドマークなしにユーザーの位置の深層回帰として位置推定をプロセッシングすること、およびアルゴリズムがブートストラップできるようにすることを含む。
【0153】
実施例は磁気パターンの曖昧性により発生する問題を、試みコンテクストを示すセンサまたはユーザーの全体軌跡を考慮することによって、そしてRNNレイヤが後続するCNNレイヤを含むニューラルネットワークを使って解決する。磁場パターンの曖昧性は非常に類似しているが、建物の非常に異なる位置にある磁気パターンを区別する難しい作業に直面したCNN+FNモデルを誤作動するようにする。その代わりに、循環モデルはセンサおよび/またはユーザーの軌跡のコンテクストを内部RNN状態として考慮する。これは循環モデルの以前の状態によって与えられるナビゲーションコンテンツを考慮してパターン位置を明確にするのに役に立つ。パイプラインの開発および評価はオフラインで遂行され得る。提案されたすべての方法が正確なモデルを学習させるのに時間(およびメモリ)を必要とするが、これらはすでに観察されたデータでネットワークをフィード-フォワードするため、テスト段階でオンラインで実行され得る。
【0154】
RNNを使う時、一つ問題は軌跡の第1ポイントに対する遅延であり得る。この問題を克服するために、さらに小さいウインドウサイズを有するモデルや次のポイントに対する軌跡でさらに少ない数のポイントを決定するモデルが使われ得、メインモデルが予測に必要なデータを収集した後、小さいモデルはスイッチオフされ得る。
【0155】
RNNの他の問題としては、テスト時間に軌跡の開始ポイントを知らなければならず、開始N秒の間データを蓄積しなければならないという要求事項がある。このブートストラップ問題に対する解決策として、RNNは他のセンサデータからの第1ポイントの推定(例えば、圧力センサからの底推定およびWi-Fi信号からの位置推定)を使うことができる。
【0156】
一部の特定の実施例が前記で詳述されたが、実施例の意図された範囲を逸脱することなく、前記教示に照らして、そして添付された特許請求の範囲の内容内で実施例の多様な修正、変更および改善がなされ得ることが当業者に明白であろう。また、当業者になじまれていると考えられる分野は、本明細書に記述された実施例を不要に曖昧にさせないために本明細書に記述していない。したがって、実施例は特定の例示的な実施例によって限定されるものではなく、添付された特許請求の範囲の範囲によってのみ限定されることが理解されるべきである。
【0157】
前記の実施例が方法段階の脈絡で説明されたが、それらはまた、対応する装置またはシステムの対応するコンポーネント、モジュールまたは特徴の説明を示す。
【0158】
方法段階の一部又は全部はプロセッサ、マイクロプロセッサ、電子回路またはプロセッシング回路部によって(またはそれを使って)実行されるという点でコンピュータによって具現され得る。
【0159】
前述した実施例はハードウェアまたはソフトウェアで具現され得る。具現はコンピュータ読み取り可能保存媒体、例えば、フロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROMおよびEPROM、EEPROMおよびフラッシュメモリのような非一過性の保存媒体を使って遂行され得る。そのようなコンピュータ読み取り可能媒体は汎用または特殊目的のコンピュータシステムによってアクセスされ得る任意の利用可能な媒体であり得る。
【0160】
一般的に、実施例はプログラムコードまたはコンピュータ実行可能命令語を有するコンピュータプログラム製品として具現され得、プログラムコードまたはコンピュータ実行可能命令語はコンピュータプログラム製品がコンピュータで実行される時に方法のうち一つを遂行するように作動可能である。プログラムコードまたはコンピュータ実行可能命令語はコンピュータ読み取り可能保存媒体に保存され得る。
【0161】
一実施例において、保存媒体(またはデータキャリアまたはコンピュータ読み取り可能媒体)は、プロセッサによって遂行される時、本明細書に記述された方法のうち一つを遂行するためのコンピュータプログラムまたはコンピュータ実行可能命令語を保存する。追加の実施例で、装置は一つ以上のプロセッサおよび前記で言及された保存媒体を含む。
【0162】
追加の実施例で、装置は例えばメモリと通信するプロセッサのようなプロセッシング回路部のような手段を含み、この手段は本明細書に記述された方法のうち一つを遂行するように構成されたり適応される。
【0163】
追加の実施例は、本明細書に記述された方法のうち一つを遂行するためのコンピュータプログラムまたは命令語が設置されたコンピュータを含む。
【0164】
前述した方法および実施例は、データ交換のためのインターネットのようなネットワーク1404(無線および/または有線であり得る)を通じて通信するサーバー1400および一つ以上のクライアントデバイス1402を含む
図14に例示されたようなアーキテクチャー内で具現され得る。サーバー1400およびクライアントデバイス1402はデータプロセッサ1412およびハードディスクのようなメモリ1413を含む。クライアントデバイス1402は自律車両1402b、ロボット1402c、コンピュータ1402d、または携帯電話1402eを含む、サーバー1400と通信する任意のデバイスであり得る。
【0165】
より正確には、一実施例において、
図1、
図6または
図8の実施例に係る方法はサーバー1400で遂行され得る。他の実施例で、
図1、
図6または
図8の実施例に係る方法はクライアントデバイス1402で部分的にまたは完全に遂行され得る。さらに他の実施例で、方法は分散方式で異なるサーバーまたは複数のサーバーで遂行され得る。