IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ケンブリッジ モバイル テレマティクス,インク.の特許一覧

特許7295036トリップの種類を識別するためのテレマティクスデータの使用
<>
  • 特許-トリップの種類を識別するためのテレマティクスデータの使用 図1
  • 特許-トリップの種類を識別するためのテレマティクスデータの使用 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-06-12
(45)【発行日】2023-06-20
(54)【発明の名称】トリップの種類を識別するためのテレマティクスデータの使用
(51)【国際特許分類】
   G01C 21/26 20060101AFI20230613BHJP
   H04M 11/00 20060101ALI20230613BHJP
【FI】
G01C21/26 P
H04M11/00 301
【請求項の数】 12
(21)【出願番号】P 2019563504
(86)(22)【出願日】2018-05-03
(65)【公表番号】
(43)【公表日】2020-07-09
(86)【国際出願番号】 US2018030869
(87)【国際公開番号】W WO2018213013
(87)【国際公開日】2018-11-22
【審査請求日】2021-04-30
(31)【優先権主張番号】15/596,384
(32)【優先日】2017-05-16
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】15/874,017
(32)【優先日】2018-01-18
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】517411036
【氏名又は名称】ケンブリッジ モバイル テレマティクス,インク.
【氏名又は名称原語表記】CAMBRIDGE MOBILE TELEMATICS, INC.
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(74)【代理人】
【識別番号】100142907
【弁理士】
【氏名又は名称】本田 淳
(72)【発明者】
【氏名】パク、ジュン-グン
【審査官】田中 将一
(56)【参考文献】
【文献】特開2016-222136(JP,A)
【文献】国際公開第2013/179359(WO,A1)
【文献】特開2016-223995(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G08G 1/00 - 99/00
G01C 21/00 - 21/36
G01C 23/00 - 25/00
H04M 3/00
H04M 3/16 - 3/20
H04M 3/38 - 3/58
H04M 7/00 - 7/16
H04M 11/00 - 11/10
(57)【特許請求の範囲】
【請求項1】
特定のトリップにおける1つ以上のセグメントの輸送モードを識別するとともに、前記輸送モードが車による輸送を含む前記特定のトリップにおける前記1つ以上のセグメントの各々について、乗客または運転者として人の役割を識別する際における計算装置の動作を改善する、コンピュータにより実行する方法であって、前記方法は、
以前のトリップについての前記人の行動を示す履歴情報を格納するステップであって、前記履歴情報は、前記以前のトリップ中において車両の1つ以上のセンサによって捕捉された運動情報と、前記以前のトリップ中の1つ以上のモバイル機器についての使用情報とを含む、ステップと、
前記履歴情報から前記以前のトリップについての特徴を導出するステップであって、前記特徴は、前記以前のトリップ中の運動に関する1つ以上の特徴と、前記以前のトリップ中のモバイル機器の使用に関する1つ以上の特徴とを含む、ステップと、
前記特定のトリップについての前記人の前記行動を示す情報を受信するステップであって、該情報は、前記特定のトリップ中において1つ以上のセンサによって捕捉された運動情報と、前記特定のトリップ中の前記人のモバイル機器についての使用情報とを含む、ステップと、
前記以前のトリップについて導出された前記特徴を入力することにより訓練した第1分類器に、前記特定のトリップについての前記人の前記行動を示す前記情報を入力することに基づいて、輸送モードが車による輸送を含む前記特定のトリップにおける1つ以上のセグメントを識別するステップと、
前記輸送モードが車による輸送を含む前記特定のトリップにおける前記1つ以上のセグメントの各々について、導出された前記以前のトリップについての前記特徴を入力することにより訓練した第2分類器に、前記特定のトリップについての前記人の前記行動を示す前記情報を入力することに基づいて、前記特定のトリップ中の前記車の乗客または運転者として前記人の役割を識別するステップとを含む、方法。
【請求項2】
前記以前のトリップ中または前記特定のトリップ中に捕捉される前記運動情報は速度情報または加速度情報を含む、請求項1に記載の方法。
【請求項3】
前記以前のトリップについての前記特徴は、しきい値より大きな加速度、しきい値より大きな減速度、またはしきい値より大きな速度のうちの1つ以上を含む、請求項1に記載の方法。
【請求項4】
前記履歴情報は、前記トリップ中にモバイル機器から受信された非運動情報を含む、請求項1に記載の方法。
【請求項5】
前記履歴情報は、前記以前のトリップについての役割の情報を含み、前記役割の情報の少なくとも一部は、前記人からの入力なしで決定される、請求項1に記載の方法。
【請求項6】
前記以前のトリップについての前記特徴は、前記以前のトリップについての、運転者であるのと比較して、どれくらい頻繁に乗客として前記人が移動するかに係る特徴を含む、請求項1に記載の方法。
【請求項7】
前記特定のトリップについての前記情報における1つ以上の変化を識別するステップと、
前記1つ以上の変化に基づいて、前記特定のトリップを前記1つ以上のセグメントへとセグメント化するステップと、をさらに含む、請求項1に記載の方法。
【請求項8】
前記1つ以上の変化に基づいて前記特定のトリップをセグメント化することにより得られた前記1つ以上のセグメントのうちの少なくとも1つのセグメントの長さが、時間のしきい値よりも長いと判定するステップと、
前記1つ以上のセグメントのうちの前記少なくとも1つのセグメントを、前記時間のしきい値以下の長さを有する複数のセグメントへと分割するステップと、を含む請求項に記載の方法。
【請求項9】
前記人の前記モバイル機器についての前記使用情報は、どのくらい頻繁に前記人が前記モバイル機器を使用するかを示す情報を含み、
前記人の前記役割を識別するステップは、前記特定のトリップ中において、どのくらい頻繁に前記人が前記モバイル機器を使用するかを示す前記情報に基づいて、前記人の前記役割が乗客または運転者であるか識別するステップを含む、請求項1に記載の方法。
【請求項10】
請求項1からのいずれか一項に記載の方法を実行するように構成された1つまたは複数のプロセッサを含むシステム。
【請求項11】
プログラムがコンピュータによって実行されるときに、前記コンピュータに請求項1からのいずれか一項に記載の方法を実行させる命令を含むコンピュータプログラム製品。
【請求項12】
命令を含むコンピュータ可読記憶媒体であって、前記命令は、コンピュータによって実行されると、前記コンピュータに請求項1からのいずれか一項に記載の方法を実行させる、コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
この記載は、トリップの種類を識別するためにテレマティクスデータ(telematics data)を用いることに関する。
【背景技術】
【0002】
いくつかの状況において、テレマティクスアプリケーションは、乗物内のセンサからデータを収集し、格納し、処理することを含んでいる。具体的には、モバイルテレマティクス(時に「スマートフォンテレマティクス」として知られている)は、モバイルセンシング技術を用いて、スマートフォンのようなモバイル機器の内蔵センサまたは外部センサからデータを収集し、格納し、処理する。
【0003】
モバイルテレマティクスアプリケーションは、いつセンサデータを収集すべきかを決定するために様々なスキームを用い得る。操作の共通モードは、センサと関連付けられたモバイル機器が移動していると思われるか、または(車両アプリケーションについて)運転に関連付けられていると思われるか、または以前の既知の位置から場所(ロケーション)が有意に変化したときは常に、センサデータ(例えば、特に加速度、ジャイロスコープ、磁力計、位置、速度、または気圧計の1つ以上を含む)を収集することである。アプリケーションは、モバイル機器が相当量の時間にわたって停止するまで、それらのセンサからデータを収集する。
【0004】
センサデータの各収集項目にはタイムスタンプを付与することができ、そのようなタイムスタンプ付きセンサデータ項目のシーケンスは時に記録と呼ばれる。一般的なアプローチは、センサデータ項目を一定期間にわたって連続して収集することである。この場合、規則に従って収集されたデータのシーケンス(例えば実質的な休止期間によって分離されたシーケンス)をセグメント化して、複数の記録を形成し得る。
【0005】
「記録」という用語は、例えば、移動(travel)または輸送(transportation)に関連付けられたエピソード、イベントまたは他の出来事にともに関係するか、それらを捕捉するか、含むか、または反映するデータ項目の、任意の収集された、集められた、体系化された、格納された、または蓄積された組(セット)、シーケンス(一続きのもの)、または系列(一連のもの)を含むように広く用いられる。具体的には、記録は1つ以上のトリップに関連付けられるか、または1つ以上のトリップを表わしてもよく、また1つ以上の記録を単一のトリップに関連付けることができる。
【0006】
「トリップ」という用語は、出発地から到着地までの移動の任意の事例を含むように広く用いられる。いくつかの場合において、トリップは、単一の輸送モード(transportation mode)(例えば車)および輸送されている人の単一の役割(例えば運転者)のいずれか、または双方を含むそのような場合である。例えば、トリップは、記録が捕捉されるモバイル機器のユーザが車の運転者である車で家から食料雑貨店まで移動する場合であり得る。
【0007】
「輸送モード」という用語は、例えば、2~3例を挙げると、車、トラック、歩行者(ウォーキングまたはランニング)、自転車、自動二輪車、オフロード車両(off-road vehicles)、バス、列車、ボートまたは飛行機のような、あらゆる移動の形態、輸送機関または方法を含むように広く用いられる。
【0008】
輸送されている人に関する「役割」という用語は、例えば、特に乗客、運転者、乗員、利用者、または乗り手のような、任意のクラス、カテゴリまたは種類の活動を含むように広く用いられる。
【0009】
よって、トリップは輸送モードおよび役割のいずれか、または双方を含むことができるか、またはトリップに関連付けられた他の分類またはカテゴリ、例えば、通勤通学 対 娯楽、ラッシュアワー 対 オフアワー、能動的な乗客 対 受動的な乗客、を含むことができるという意味の種類のものであると考えられ得る。
【0010】
一部の場合には、モバイル機器上で動作するモバイルアプリケーションは記録を行い、記録がいつ開始および終了する予定であるかを決定する。記録は、様々な理由に対して、ユーザ入力を伴うことなく、モバイルアプリケーションによって自動的に開始および停止され得、またユーザがモバイル機器上のアプリケーションを訪れることなく、バックグラウンドで行われ得る。例えば、記録は、特定の速度よりも速い移動または予め知られている位置からの有意な場所の変化などの特定の活動が生じている場合のみに行われてもよい。記録はまた、ユーザ(例えば、その移動に関わる人)に適当なユーザインターフェース選択肢を提供することによって、手動で開始および停止されてもよい。時に、運転者もしくは乗客であるか、または他の場合にはトリップに関与する「関係者」について言及する。ユーザは、時に特定のスマートフォンまたは他のモバイル機器を使用するか、またはそれらに関連付けられた人と称され、また時にトリップの関係者と称される。かなりの頻度で、ユーザは、トリップの関係者とも、トリップの間に関係者において使用されたか、または関係者によって携帯された特定のモバイル機器に関連付けられた人とも称される。
【0011】
記録中に捕捉されるトリップの種類の識別は様々な目的に対して非常に有用であり得る。本願では、テレマティクスデータ(例えば、モバイル機器上で捕捉されたセンサデータの記録および他の情報)を用いて、そのような種類、例えば輸送のモード、輸送されている人の役割、または他の種類を識別する(例えば分類する)技術について記載する。トリップの種類の識別は、自動的であってもよいし、または(人の入力によって支援される)半自動的であってもよい。
【0012】
「識別する」という用語は、例えば、分析する、分類する、分割する、ラベル付けする、予測する、区別する、判断する、検出する、確立する、または選択することを含むように広く用いられる。しばしば「分類する」および「予測する」という語は「識別する」と区別なく用いられる。
【0013】
輸送モードの識別は多くの異なるアプリケーションにおいて有用であり得る。例えば、車両保険および安全運転プログラムにおけるアプリケーションの開発者およびユーザは、輸送モードが「車」であり、輸送される人の役割が「運転者」であり、かつ場合によりトリップの種類の他の態様が満たされるトリップについてのみ、運転の質または運転行動の他の態様を評価すること興味を有し得る。典型的には、保険または安全運転解析の対象となるであろうトリップから、歩行者(ウォーキングまたはランニング)、自転車、自動二輪車、バス、列車、ボート、飛行機、オフロード走行(off-road travel)などを含む他の輸送のモードを除外することが重要である。例えば、特定の人によって運転されている車のような輸送モードの自動的または半自動的識別は、現実世界の状況において有用であり得る。例えば、モバイルアプリケーションが、ユーザが記録の開始および終了のいずれか(または双方)を特定することを可能にする場合、輸送モードの正しい独立した識別は、ユーザの不作為または作為の過誤を克服することができる。より一般的には、トリップの種類を識別するための任意の技術は、自動的か半自動的かにかかわらず、時として誤りを生じるであろう。記録中に捕捉されたデータが、識別された輸送のモード内にあるモバイル機器に由来していなかったり、またはいずれの輸送のモードにも全く関連付けられなかったりすることがある。従って不適切な記録および不正確な識別を検出し、後続の処理および分析から対応するトリップを修正または除去する能力は、テレマティクスデータおよびそれらのデータで行われる解釈(例えば輸送モードまたは他のトリップの種類の識別)の完全性を保証する本技術の有用な特徴である。
【発明の概要】
【発明が解決しようとする課題】
【0014】
従来技術において、輸送モードの高速で粗雑な推定(fast,coarse-grained estimate)を提供する方法が知られている。多くのスマートフォンは、ソフトウェアまたは専用の運動検出ハードウェアを用いて、トリップモードの即時の分類を提供する方法を有する。典型的には、ほんの数種の別個のトリップモードしか分類されず、またトリップモード検出精度は、応答の待ち時間を低減するために、実質的に犠牲にされている。
【0015】
トリップに関係している人の役割、例えば、運転者または乗客としての人の役割を識別することはまた、テレマティクスアプリケーションの有用なタスクであり得る。そのような識別は、それ自体で、また輸送モードまたはトリップの種類の他の態様を識別する情報と組み合わせて、有用であり得る。例えば、車内の乗客のモバイル機器から収集されたデータのいくつかの項目は、モバイル機器に関連付けられた人の運転行動に直接関係しないことがある。運転安全解析に用いられる運転行動情報の例において、乗客の役割でモバイル機器(例えばスマートフォン)に気を取られることは、運転者の役割でスマートフォンに気を取られる場合よりも安全上の懸念は少ない。従って、アプリケーションによっては、装置のユーザが乗客の役割を有していた間にモバイル機器から捕捉されたデータを後続の使用および解析から除外することは有益であり得る。
【課題を解決するための手段】
【0016】
概して、一態様において、人の所与のトリップの種類を識別する際における計算装置の動作が改善される。その人および他者のいずれか、または双方の以前のトリップについて履歴情報が格納される。履歴情報はトリップの記録された運動データ以外のものに基づく。履歴情報から以前のトリップについて特徴が導出される。所与のトリップの種類を示す特徴は計算装置によって識別される。所与のトリップの種類は履歴情報から導出された特徴に基づいて識別される。
【0017】
実施形態は以下の特徴のうちの1つまたは2つ以上の組合せを含み得る。格納された履歴情報は、以前のトリップの履歴パターンを示す。履歴パターンは、以前のトリップの時間、以前のトリップの場所、または以前のトリップの軌跡のうちの1つ以上と関連付けられている。特徴は、以前のトリップのうちの1つ以上において乗客であった人、以前のトリップのうちの1つ以上の局所性(locality)、所与のトリップに対する以前のトリップのうちの1つ以上の文脈的近接性(contextual proximity)、所与のトリップに対する以前のトリップのうちの1つ以上のトリップ類似性、以前のトリップの暦に関する変動(calendrical variations)、または電話の使用パターンのうちの1つ以上を含む。特徴は、以前のトリップの日付、曜日または時間のうちの1つ以上を含む。特徴は、その人および他者のいずれか、または双方によって提供された以前のトリップのラベルを含む。特徴は、以前のトリップの種類の識別を含む。所与のトリップの種類は、そのトリップにおける人の役割を含む。人の役割は、運転者の役割または乗客の役割を含む。所与のトリップの種類は輸送モードを含む。輸送モードは車を含む。輸送モードは車以外のものを含む。以前のトリップについての履歴情報はユーザのモバイル機器から受信される。所与のトリップの種類の特定は、所与のトリップに関連付けられたデータに基づいて、所与のトリップの特徴を計算することを含む。所与のトリップに関連付けられたデータはセンサデータを含む。特徴は、所与のトリップの種類に関連付けられた一定速度の期間を含む。特徴は乗物の特性を示すアイドル振動を含む。特徴は傾斜を含む。特徴は、所与のトリップ中におけるモバイル機器の使用を含む。特徴は、所与のトリップ中における軌跡の直線性を含む。
【0018】
概して、一態様において、人の所与のトリップの種類を識別する際における計算装置の動作が改善される。以前のトリップについて人の行動を示す履歴情報が格納される。行動について特徴が導出される。人は、人の行動について導出された特徴および所与のトリップについて人の行動を示す情報に基づいて、所与のトリップに関連付けられていると識別される。
【0019】
実施形態は以下の特徴のうちの1つまたは2つ以上の組合せを含み得る。履歴情報は、以前のトリップの運動情報を含む。運動情報は速度情報または加速度情報を含む。特徴は、しきい値より大きな加速度、しきい値より大きな減速度、またはしきい値より大きな速度のうちの1つ以上を含む。履歴情報は、トリップ中にモバイル機器から受信された非運動情報を含む。特徴は、モバイル機器の使用を含む。人はトリップ中における運転者であると識別される。
【0020】
概して、一態様において、人の所与のトリップの種類を識別する際における計算装置の動作が改善される。予想される公共交通トリップについて情報が格納される。予想される公共交通トリップについて特徴が導出される。所与のトリップは、導出された特徴に基づいて公共交通トリップとして識別される。
【0021】
実施形態は以下の特徴のうちの1つまたは2つ以上の組合せを含み得る。予想される公共交通トリップについての情報は、スケジュール情報およびルート情報のいずれか、または双方を含む。予想される公共交通トリップについての特徴は、トリップの時間、またはトリップの開始場所またはトリップの終了場所のうちの1つ以上を含む。所与のトリップを公共交通トリップとして識別する請求項に記載の方法は、所与のトリップおよび予想される公共交通トリップの以下の特徴、すなわち、開始時間、終了時間、開始場所または終了場所のうちの1つ以上をマッチさせることを含む。
【0022】
概して、一態様において、人の所与のトリップの種類を識別する際における計算装置の動作が改善される。所与のトリップの種類は、識別された輸送モードおよび識別された人の役割のトリップとして自動的に識別される。所与のトリップについて輸送モードおよび人の役割のいずれか、または双方を識別する情報は、人から受信される。人の将来のトリップの種類は人から受信した情報に基づいて識別されるか、または受信した情報は人から第三者に対して所与のトリップの種類の正しい識別として提供されるか、またはそれらの双方である。
【0023】
概して、一態様において、人の所与のトリップの種類を識別する際における計算装置の動作が改善される。トリップを含む期間にわたる記録の運動データが格納される。その期間の運動データはセグメント化される。セグメント化することは、一時的セグメントを生成する変化点セグメンテーション(change-point segmentation)と、最終セグメントを生成する一時的セグメントの長さセグメンテーション(length segmentation)とを含む。
【0024】
実施形態は以下の特徴のうちの1つまたは2つ以上の組合せを含み得る。連続する最終セグメントは時間的に平滑である。時間的平滑化は、最終セグメントのうちの2つ以上を再度組み合わせることを含む。
【0025】
概して、一態様において、人の所与のトリップの種類を識別する際における計算装置の動作が改善される。所与のトリップ中における輸送モードの動作特徴を表すデータが捕捉される。所与のトリップの動作特徴は捕捉されたデータに基づいて計算される。動作特徴は輸送モードの識別に使用するために計算装置に提供される。
【0026】
実施形態は以下の特徴のうちの1つまたは2つ以上の組合せを含み得る。捕捉されたデータはセンサデータを含む。動作特徴は、所与のトリップの種類に関連付けられた一定速度の期間を含む。動作特徴は乗物の特性を示すアイドル振動を含む。動作特徴は傾斜を含む。動作特徴は、所与のトリップ中における軌跡の直線性を含む。
【0027】
これらおよび他の態様、特徴、および実施形態は、機能を実施するための方法、装置、システム、構成要素、プログラム製品、営業方法、手段またはステップとして、および他の方法で、表され得る。
【0028】
これらおよび他の態様、特徴、および実施形態は、特許請求の範囲を含む以下の記載から明らかになるであろう。
【図面の簡単な説明】
【0029】
図1】テレマティクスシステムのブロック図。
図2】セグメンテーションのフローチャート。
【発明を実施するための形態】
【0030】
本願に記載する技術は、記録に基づいて、輸送モードまたはトリップに関係する人の役割、または他のトリップの種類を識別するために適用することができる。
本技術は、単一のトリップまたは複数のトリップを表す記録から、1つ以上の輸送モード、関係者の役割、または他のトリップの種類のシーケンスを識別することができる。識別され得る輸送のモードとしては、例えば、車、飛行機、バス、列車、自転車、ボート、自動二輪車、オフロード、および徒歩が挙げられる。オフロードモードでは、トリップは、大抵の場合、全地形対応車両(ATV)またはスキーを用いた未舗装道路上のものである。徒歩モードはランニングおよびウォーキングを含む。トリップの記録は、実際のトリップが行われていなかったときに誤って生じたり、または不適切になったりすることがある。そのような記録を「ファントム」と称する。いくつかの実施形態において、ファントムトリップは可能な輸送モードのうちの特定の1つとして識別される。また、本技術は、車でのトリップの運転者および乗客のような輸送されている人々の役割を識別することができる。役割は本技術によって識別され得るか、または他の手段、例えば他の分類技術、ユーザによる指示、車に導入されたハードウェアデバイス(米国特許出願公開第2015/0312655号参照。この特許文献はこの参照により本願に援用される)またはそれらの組合せによって識別されてもよい。
【0031】
いくつかの実施形態において、本技術は、1つ以上のモバイル機器によって捕捉された記録を用いて、1つ以上のトリップの1つ以上の輸送モードを識別する。いくつかの場合において、本技術は、輸送モード、関係者の役割または他のトリップの種類、および非トリップファントム記録を識別するために有用な特徴を抽出するために、記録に含まれる様々なモバイルセンサデータを用いることができる。
【0032】
図1に示すように、いくつかの実施形態において、技術10は、中心に位置し得るコンピュータ11上において段階的に動作し、1つ以上のモバイル機器12から収集された1つ以上の記録23によって表される1つ以上のトリップについて輸送モード24および関係者の役割31を識別する。
【0033】
段階のうちの1つにおいて、記録の各々は、ハイブリッドセグメンテーション16を用いて、セグメント14に分割される。1つ以上のセグメントは所与のトリップと関連付けられ得る。次に、各セグメントは、それらのセグメント内のデータから抽出された特徴20を用いて、輸送モードセグメント分類器18によって、輸送モードに従って分類される。輸送モードセグメント分類器は、オーバーフィッティングに対して堅牢になるように訓練され、また予測オーバーライド(prediction overrides)は誤った予測を修正するために用いられ得る。輸送モードセグメント分類器の出力、すなわち、輸送モード予測ラベル24(各ラベルは輸送モードを識別する)および確率26(所与のラベルが正しい確率をそれぞれ表す)のシーケンス22は、隠れマルコフモデル(HMM)に基づいた時間的平滑化モデル28を用いて平滑化される。個々のセグメント分類結果は、ノイズが多く誤っている可能性があるため、輸送モードの連続性およびモード間の切替え行動を捕捉する時間的モデルを用いて、輸送モードラベルの系列を平滑化する。本技術は、アプリケーション要件に応じて、利用可能な輸送モード予測ラベルの組から1つ以上の代表的なトリップラベル29(各ラベルはトリップの輸送モードを識別する)を判断する。別のアプリケーション80は、(例えばユーザにフィードバックを伝達するために)捕捉されたトリップについてそのような代表的なラベルを要求し得る。役割分類器30は、輸送モード予測ラベルが例えば「車」であるそれらのセグメントに適用されて、モバイル機器に関連付けられた関係者が例えば「運転者」の役割31を有するセグメントである記録内の車セグメントを識別する。この例は輸送モードおよび役割の識別について言及したが、いくつかのアプリケーションでは、トリップに関連付けられた他の種類ものを識別することができる。
【0034】
図1に示すプロセスのいくつかの実施形態において、輸送モードセグメント分類器および役割分類器は、典型的にはトリップの関係者によって携帯されるモバイル機器13によって収集されたデータから輸送モードのシーケンスを判断する。スマートフォンのような大半の現代のモバイル機器は、関係者の動き、および関係者によって使用されている輸送モードに関する物理的特性、並びに環境の他の態様を測定する様々なセンサ32を装備している。モバイル機器のセンサによるこれらの物理的特性の測定値から生じたデータ34(これらは記録23の一部とみなされ得る)は、場所、時間、軌跡またはユーザのような、トリップについての(モバイル機器、およびいくつかの場合には他のデータ源38からの)より高レベルの状況記述36と組み合わせることができ、輸送モードセグメント分類器および役割分類器によって用いられる特徴20の豊富な組を生じる。いくつかの場合において、状況記述のうちのいくつかまたはすべては記録23の一部とみなされ得る。
【0035】
本技術によって用いられるセンサ32およびデータ源38は、以下の加速度計(3軸線)、ジャイロスコープ(3軸線)、磁力計(3軸線)、気圧計、GPS受信機、セルタワー、またはWi-Fiロケーション(セルタワーおよびWi-Fiネットワークからの情報から導出された場所推定値(location estimates)は、時に「ネットワークロケーション」と称される)、ビーコンおよびIoT(モノのインターネット)デバイスなどの外部装置のアイデンティティおよび接続情報、外部装置からのセンサデータ、トリップの時空間記述(spatio-temporal description)、ユーザ情報、トリップ履歴、オンデバイス活動認識、並びにマップおよびマップマッチしたデータ(map-matched data)のうちのいずれか1つ、または任意の2つ以上の組合せを含み得るが、これらに限定されるものではない。
【0036】
センサおよび他のデータ源によって生成された生データから、コンピュータまたは他の技術は、後で説明するように分類器への入力として用いられる特徴20の組を計算する。上記に列記した入力源のいずれも必須ではない。入力の特定の供給源が見当たらない場合には、本技術は対応する特徴を計算せず、代わりにそれらを「欠落」としてマークし、それらは分類器によって、例えばそのままで特徴値として、適切に処理され得る。
【0037】
図1の技術段階の1つ以上は、センサデータの収集中に(例えば、記録またはトリップが完了する以前でも、データの最新の適用後に収集されたデータを用いて数分ごとに実行することによって)ライブで(リアルタイムで)適用されてもよい。または、図1の技術段階の1つ以上は、全記録が行われた後に適用されてもよい。各記録(記録のシーケンスは単一のより大きな記録と考えられ得る)は、記録を記述するメタデータ(例えば、図1中の状況記述36の一部、または状況記述36に加えて)を含むことができる。メタデータの例としては、トリップの時空間記述(例えば、都市、時刻、曜日)、ハードウェア情報(例えば、モバイル機器のオペレーティングシステムの種類)、およびユーザデータ(例えば、好ましい輸送モード)が挙げられる。加えて、本技術は、車両軌跡の道路網へのマップマッチングのような記録から導出された他の種類の情報を利用してもよい(米国特許第8,457,880号参照。この特許文献は参照により本願に援用される)。図1に関して検討したように、いくつかの実施形態において、本技術の出力は、記録の各セグメントの特定の輸送モードに属するという識別、並びに報告された分類における随意の信頼度、およびモバイル機器に関連付けられた関係者の役割である。
【0038】
上述したように、輸送モード分類器18の出力は、分類信頼度26を伴った輸送モードの系列である。いくつかの実施形態において、シーケンス内の各セグメントについて、分類器はそれに対して、以下の輸送モードラベル、すなわち、車、飛行機、列車、バス、ボート、自転車、自動二輪車、徒歩(ウォーキングまたはランニング)、オフロード、非トリップ記録(「ファントム」)のうちの1つを信頼度値と共に割り当てる。
【0039】
一部の場合には、「車」という輸送モードを有すると識別されたセグメントは、役割分類器によって、以下の役割、すなわち、運転者、乗客のうちの1つに、信頼度値41とともに、さらに分類される。
【0040】
輸送モードラベルおよび役割の識別のいずれか、または双方のシーケンスは、個人ユーザおよび企業およびそれらのアプリケーションを含む、多種多様な消費アプリケーションおよびユーザに対する供給物として提供され得る。
【0041】
本技術に関連する多くの利点が存在する。自動的または半自動的に輸送モードラベルを提供することにより、記録を捕捉するモバイル機器上で動作するアプリ(app)は、トリップおよびトリップセグメントの輸送モードの手動によるラベル付けを常に要求するものよりも、運転者にとってそれほど面倒なものではなくなり得る。モデル検証は、精度(accuracy)(適合率(precision)および再現率(recall)の双方)の評価を特定の予測の分類信頼度と共に提供する。この情報の消費者は、各予測にどれだけの信頼度を配置するかを決定することができる。例えば、保険会社は、保険統計の目的のために情報に適切に重み付けすることができる。一部は(車と列車のように)相互排除であり、その他は(車とオフロードのように)重複可能である複数の輸送モードを提供することは、最終的な分類出力に対するきめの細かい制御を可能にする。新たな輸送モードを追加し、モデルを(再)訓練するプロセスの自動化によって、本技術は、輸送モードの大きな組を分類し、比較的容易に新たなものを動的に追加することができる。本技術により、テレマティクスサービスプロバイダーは、その製品およびビジネスにおいて高品質な輸送モードおよび役割分類を提供することが可能となる。
【0042】
これより本技術の各段階についてより深く説明する。
セグメンテーション
図2に示すように、いくつかの実施形態において、入力記録102のセグメンテーション100を実施するために、2つのスキーム、すなわち、固定長セグメンテーション122と変化点セグメンテーション124とが組み合わせられる。固定長セグメンテーションは、データを同一の固定時間長を有するセグメントに分割する。変化点セグメンテーションは、データの1つ以上の特性126の変化に基づいて、新たなセグメントを開始する。本技術は、双方の利点から恩恵を受けるために、それらのスキームを組み合わせている。
【0043】
固定長セグメンテーションの利点としては、各セグメントが異なる輸送モード間の本物の移行にまたがるほど長くないことを実施および保証することがより容易であることが挙げられる。不都合としては、各セグメントの継続時間は先験的(a priori)に判断され、判断されたセグメント長は異なる要求に適応するほど十分な融通性を有さない場合があることが挙げられる。例えば、セグメントが、各セグメントについて計算された周波数スペクトル(これらは周波数領域に基づいた分析特徴に用いられる)が充分な分解能を有することを保証するために十分に長い場合に有用である。他方では、セグメントが長いほど複数のモードを不正確に含むことがあるため、セグメントは任意の輸送モードの典型的な最小継続時間よりも過度に長くてはならない。
【0044】
変化点セグメンテーションスキームは、時系列入力データを調査し、1つ以上の監視された統計量125に関して有意である変化が生じた場合に、それをセグメント化する。いくつかの場合において、統計量はオンラインまたはスライディングウィンドウ方式で計算される。系列の間の各時点において、最新値は、誤検出を少なくし、できるだけ迅速に統計量の変化を検出するために、累積和のような技術を用いて、より古い値と比較される。例えば、(時系列データに基づいて)監視される統計量は、下記の(例えば一次微分(first-order derivatives)または二次微分(second-order derivatives)によって測られるような)センサ読み取り値の急な変化、センサ読み取り値中の経時的なドリフト(drift over time)、(分散、範囲または四分位範囲によって測られるような)「揮発性」の変化、GPSおよびネットワークロケーションの有意な場所変化、オンデバイス分類結果の変化、またはマップマッチした出力における道路の種類の変化のうちの1つ以上を含むことができる。変化点セグメンテーションの利点としては、所与の輸送モードに属すると見なされるデータを不必要にセグメント化せず、従って、セグメント分類器による使用のために所与のセグメントについてより多くのデータを示すことが挙げられる。しかしながら、変化点セグメンテーションは、モード境界を見落として、複数の輸送モードを含む可能性がある長いセグメントを生じる危険性を有する。
【0045】
本技術は、固定長セグメンテーション122および変化点セグメンテーション124の双方の利点を組み合わせたハイブリッドセグメンテーションスキーム171を用いている。入力時系列データ134は、最初に、変化点セグメンテーションスキーム124によって、その系列内における大きな変化点においてセグメント化される。結果として生じたセグメント173の長さが所定のしきい値138よりも長い場合には、次に、そのセグメントは、固定長セグメンテーション122を用いて、より小さなセグメント175にさらに分割される。これを行うことにより、単一の輸送モードの区間(interval)をいくつかのより小さなセグメントに不必要に分割する必要なく、潜在的に見落とされた境界を後で認識することができ、これはセグメント分類器に対して利用可能なデータ量を低減するであろう。
【0046】
輸送モード分類特徴
図1に示すように、トリップモード分類中に、記録のデータの各セグメントは、輸送モードのうちの1つに分類される。前述したセンサおよび他のデータ源から、様々な特徴156が各セグメントに対して計算され、それらは輸送モード分類器によって入力として用いられる。それらの特徴は、下記のうちの1つ、または2つ以上の組み合わせを含み得る。
【0047】
記述統計量(Descriptive statistics):各センサタイプについて、記述統計量の組が所与のセグメントに属するデータに対して計算される。記述統計量は、平均、標準偏差、変動係数(平均に対する標準偏差の比)、順序統計量(最小値、5パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、95パーセンタイル、および最大値)、範囲(最大値と最小値との差)、ロバスト範囲(95パーセンタイル値と5パーセンタイル値との差)、四分位範囲(75パーセンタイルと25パーセンタイル値との差)、歪度(3次モーメント)、および尖度(4次モーメント)を含む。3軸加速度計または3軸ジャイロスコープのような多軸センサについては、統計量は瞬時ベクトル測定値の大きさから計算される。
【0048】
運動の静粛性:運動の静粛性は、慣性センサ(加速度計およびジャイロスコープ)から捕捉されたデータ値が平坦なままである時間の割合(a fraction of time)を計算することにより捕捉される。セグメント内の各データサンプルについて、それに中心を合わせたローリングウィンドウで標準偏差が計算される。標準偏差値が特定のしきい値未満である場合、そのとき対応するウィンドウは平坦であるとみなされる。所与のセグメントについて、すべてのウィンドウで割られた平坦なウィンドウの割合が計算され、セグメント内の運動の静粛性を表す特徴として用いられる。この特徴は、その一部が誤った場所変化アラートのような非慣性センサによる誤警報により生じ得るファントム記録を検出するのに特に有効である。
【0049】
速度プロファイル:GPS速度データが利用可能な場合、セグメントの速度プロファイルは、トリップの輸送モードに一意的であり得る速度動特性(speed dynamics)を捕捉するために生成される。速度プロファイルは、GPS速度の様々な記述統計量、ゼロおよび非ゼロ速度区間の継続時間およびその割合、停止の頻度および継続時間、速度導出加速度(速度の微分値として計算される)の分布、または加加速度(jerk)(加速度の微分値、または速度の二次微分値として計算される)の分布、またはそれらの組合せを含むことができる。ほとんどの速度統計量は、2つの方法で、すなわち全速度測定(all speed measurements)または非ゼロ速度のみの測定(only non-zero speed measurements)のいずれかを用いて計算される。この2つの方法のアプローチは、未定義量の時間にわたって外部要因による運動が存在しない場合(例えば交通渋滞で動けない車両)の状況を考慮する。バスは、多くの場合、他の輸送モードと比較して、その継続時間および間隔がかなり一定である頻繁な停止を行う。加速度および加加速度の分布は、構造、サイズおよび重量が異なる種々雑多な種類のモータービークル(motorized vehicles)を区別するために、加速度およびジャイロスコープに基づく特徴に加えて、補足的な根拠を与える。
【0050】
極端な速度または高度:GPS読み取り値によって与えられた極端に高い速度測定値は、そのトリップが考慮され得る輸送モードの中で飛行機または高速列車のいずれかによって行われたことを示す。同様に、GPS読み取り値からの高度測定値の高い値は飛行機のトリップを示す。いくつかの速度しきい値(例えば40m/s、60m/s、および80m/s)および高度しきい値(例えば500m、1000m、および2000m)は、速度または進行方向(heading)における様々な程度の極値をそれぞれ捕捉するために用いられ得る。
【0051】
一定速度検出:いくつかの輸送モードは、自動速度制御システム(例えばクルーズコントロールなど)によって正確に制御されて、一定速度で移動することができる。したがって、(特定の最小速度以上で)一定速度の期間の検出は、分類器がクルーズコントロール装置を装備したいくつかの輸送モードをクルーズコントロールが一般的でないか、または全く利用可能でない他のものから区別することを支援する。誤検出を低減するために、いくつかの実施形態では、速度測定の期間が一定速度区間として適格になるように、最小速度および継続時間の要件を課すことができる。
【0052】
周波数領域の解析:周波数領域特徴は、異なる周波数における運動および振動を特徴付けるために抽出され得る。乗物について、例えば、構造的および機械的な相違(デザイン、形状、体積、重量、または材料)、およびエンジン形式(燃焼式、電気式、または人力式)または動力供給部(power delivery)(例えばモータービークル用パワートレイン)のような動力供給機構の相違は、各種の乗物に特有の周波数持性を与える。加速度計およびジャイロスコープデータの双方に対する高速フーリエ変換(FFT)はスペクトル密度を推定するために用いることができ、スペクトル密度から様々な周波数領域特徴が抽出される。それらの特徴としては、ピーク周波数、ピーク周波数付近のエネルギー(「ピークパワー」)、バックグラウンドパワーに対するピークパワーの比、スペクトルエネルギー全体に対するピークパワーの割合、異なる周波数帯におけるパワー値、およびスペクトルエントロピーが挙げられる。これらの周波数領域特徴は、ウォーキング、ランニングまたは自転車のような周期的な運動を他の輸送モードから区別するのに特に有効である。
【0053】
アイドル振動:アイドル状態の乗物の振動特性は、移動および道路の粗さのなどの移動に関連する外部要因によって誘発される振動成分を除く、乗物のエンジンによって引き起こされるその機械的および構造的共振によって定義されるその特性を示す。アイドル振動を捕捉するプロセスは、最初に速度、加速度およびジャイロスコープ測定値から休止期間を検出し、任意の運動誘発低周波数成分、並びに高周波ノイズ成分を抑制するためにバンドパスフィルタによって信号をフィルタリングした後に、加速度計およびジャイロスコープデータからそれらの期間内における数種の統計量、例えば標準偏差およびスペクトルエネルギーなど、を計算することにより開始する。
【0054】
傾斜検出:二輪を備えた車両(例えば自転車、自動二輪車)は、旋回したり、または立ち止まったりするために、四輪車よりも傾かなければならない。有用な特徴は、特に乗物が旋回したり、または停止したりしている時に乗物が(従って推測上、その上にある装置も)横方向に傾き、旋回または停止が終了すると、その元の向きに戻るかどうかである。傾斜を検出するために、加速度測定値の系列に対してローパスフィルタを適用し、次に、重力推定値が有意に変化し、次いで所定の間隔内で元の値に戻るときのモーメントを見いだすことにより、瞬間重力方向が追跡される。同時に、旋回および停止は、ジャイロスコープ測定値およびGPS速度測定値からそれぞれ検出される。検出された旋回および停止にマッチする検出された傾斜モーメントは、乗物の傾きによる傾斜と見なされる。マッチした傾斜の数、および傾斜のあらゆる場合に対するマッチの割合は、特徴として分類器に用いられる。
【0055】
日時:月、曜日および時間のような暦情報は、記録の開始タイムスタンプから特徴として抽出することができる。これらの日時特徴は、トリップが生じた時に、一般的に、またはモバイル機器に関連付けられた人によって好まれる輸送モードに関する情報を先験的に与える。例えば、自転車は、冬季の間には夏季よりもあまり好まれないことがあり、午前3時に開始するトリップは、公共交通モード(例えば列車)よりも自家輸送モード(例えば車)のうちの1つである可能性が高いことがある。この情報は、人々の様々な層において、例えば、すべてのユーザ、特定の場所にいるか、もしくは特定の特性を有するユーザ、または個々のユーザから抽出され得る。
【0056】
場所および場所のクラス:記録の国名(例えば米国)および地域名(例えばボストン)は、分類器に輸送モードの地域的な選好性を提供する特徴として用いられる。この情報は、(軌跡のマップマッチングの副産物として)地図データから、またはポイントロケーションを人間が読める意味をもつ地名にマップする逆ジオコーディングサービスの利用により、入手することができる。トリップの場所から最寄りの都心までの距離を計算することにより、そのトリップが、都市で生じたのか、郊外で生じたのか、または田園地帯で生じたのかを示す場所の種類が導出される。
【0057】
装置の使用:ユーザが乗物(例えば車、自動二輪車または自転車)の運転者である場合には、ユーザが乗客(例えばバス、列車または飛行機)である他の輸送モードにおいてよりも、ユーザは特定の輸送モードにおいてユーザのモバイル機器をそれほど頻繁に使用しないか、または全く使用しないことが予想される。したがって、記録に対応する装置の使用を知ることにより、これらの2つの異なる輸送モードの群を区別するための根拠を提供することができる。装置使用情報を入手するのに良い方法の一つは、画面点灯(screen on)および画面消灯(screen off)イベントを監視することによるものである。装置の使用は様々な技術によって捕捉され得る。装置使用イベントから、一般的な使用パターンに対して基礎的な統計量、例えば継続時間の合計、画面使用イベントの数、および個々のイベント1つ当たりの平均継続時間などを計算することができる。モバイル機器が他の輸送モード(例えば車)よりも特定の輸送モード(例えば自動二輪車)の運転者によって用いられる可能性は低いと考えられるので、乗物が高速で移動している場合の装置の使用を捕捉するために、速度が特定のしきい値を超える場合に限り、同じ特徴の組が計算され得る。別の特徴は、乗物が移動している場合に乗客がモバイル機器を用いるのを差し控えることは期待されないが、運転者は一般に差し控えるものと考えられるので、その装置の使用が、乗物が停止したときの記録中の瞬間に対応するかどうかということである。
【0058】
輸送ステーションへの近接性:記録に関連付けられた場所から空港、列車の駅およびバス停留所を含む近くの輸送ステーションまでの距離が特徴として測定され得る。記録の最初および最後のGPSロケーションの各々について、各種類の最も近いステーション(例えば空港、バス停、または列車駅)を見つける。そのとき、最も近い距離は、その種類の輸送ステーションに対する近接性を表す特徴として得られる。例えば、最初のGPSロケーションが考慮される場合、それから最も近い空港まで距離は、最も近い空港へのトリップ開始の近接性を表す特徴として得られる。これは、最初のGPS座標または最終のGPS座標と異なる種類の輸送ステーションとのすべての組合せについて繰り返される。最後に、これらの近接距離の中で最も小さいものは、どの種類の輸送ステーションが異なる輸送モードの選択肢の中で最も近いかを示す別の特徴を形成するために用いられ得る。
【0059】
オンデバイス活動認識出力:現代のスマートフォン(および他のモバイル機器)並びにモバイルオペレーティングシステムは、ユーザ活動を収集したり、またはユーザの身体活動の変化に応答したりするのにコンテクスチュアルアプリケーションを支援するためにオンデバイス活動認識機能を提供する。それらは、大抵の場合、例えば、ユーザが、歩行中であるか、または乗物に乗っているか(必ずしも輸送モードを識別しない)、または静止しているかにかかわらず、ユーザの現在の身体活動がどうであるかについての粗雑な情報(coarse-grained information)を提供する。これらのオンデバイス活動予測は、しばしば粗雑であり、高度に正確ではないが、利用可能である場合には、裏付けとなる根拠として輸送モード分類に用いられ得る。未加工の活動認識出力はそのままで用いられるか、または別個の活動ラベルの分布を生成するために要約され得る。
【0060】
マップマッチ情報:テレマティクスアプリケーションは、多くの場合、「マップマッチング」のタスク、すなわち、モバイル機器によって提供される場所およびセンサ測定値を考慮して、ルート網上における乗物の軌跡を判断するプロセスを含む。マップマッチング情報が利用可能である場合、分類器は下記の2つのカテゴリの情報を収集することができる。1.ルートのカテゴリ(例えば道路、鉄道線路またはフェリールート)および特定のルートカテゴリ内におけるルートのクラス(例えば、道路というカテゴリについて高速道路 対 一般道路)を含む、マッチしたルートセグメントの種類。各セグメントについて、最も有力なカテゴリおよびクラス、並びにそれらの相対的割合(relative fractions)が特徴として用いられる。2.マップマッチした出力が、入力ロケーション測定値(すなわちGPSまたはネットワークロケーション)からどれくらい逸脱するか。高い偏差は、分類器が、ルート網上で移動する必要のない特定の輸送モード(例えば自転車、徒歩、ボート、オフロード)を他のもの(例えば道路網上の車)よりも選好するようにする。
【0061】
ロケーション測定値の分散および密度:ロケーション測定値の空間的分散および時間的密度は所与のセグメントについて計算され得る。空間的分散は、ロケーションサンプルによって報告された座標が経時的にどのように変化するかを特徴付ける。各GPSまたはネットワークロケーションについて、ロケーションサンプルの境界ボックスを計算することができ、境界ボックスの対角線の長さはその種類の空間的分散の尺度と見なされる。ネットワークロケーションサンプルについて、最初はすべてのサンプルから、次に高精度サンプルからのみ、分散を測定することによりプロセスを繰り返す。2つのメトリック間の差異は、低精度ロケーションサンプルが高精度サンプルと比較してどれほどノイズが多いかを捕捉し、ノイズの多いロケーションアラートによって引き起こされるファントム記録を特徴付けるのに有効である。時間的密度は、単位時間中における測定されたロケーションサンプルの数(すなわち継続時間で割られたセグメント中のサンプル数)として計算される。サンプルの密度が低いことは、ユーザが屋内(例えばファントム)または地下(例えば地下道列車)にいた可能性があることを意味する。高精度ネットワークロケーションサンプルの密度が低いことは、ユーザがWi-Fi(802.11)などの高位置精度ネットワークロケーションが利用可能でない田園地帯にいた可能性があることを意味し、これは特定の輸送モードである可能性がより高いことを意味する。
【0062】
軌跡の直線性:いくつかの実施形態では、異なるレベルの直線性を用いて、経路(path)がどれくらい直線的であるかを定義することができる。1つのレベルは、モバイル機器の進行方向が場所の軌跡(location trajectory)においてどれくらい頻繁に所定のしきい値を上回って変化するかを計数することにより捕捉される巨視的直線性を含む。巨視的直線性は、進行方向を頻繁に変更することができない輸送モード(例えば列車、飛行機)を、進行方向をより頻繁に変更することができ、かつより短い旋回半径を用いることができるモード(例えば車)から区別するために用いられる。別のレベルは、経路が瞬間的な移動の方向に直交する方向においてどれほどノイズを有するか(すなわち、経路がどれほど「波状(wiggly)」であるか)を測定することにより捕捉される微視的直線性である。いくつかの場合において、レイマー-ダグラス-ポイカー(Ramer-Douglas-Peucker)アルゴリズムを適用して経路を単純化し、単純化した経路の累積距離を元の経路のそれと比較することができる。より高い差は、その経路がより大きな側方ノイズ成分を含むことを示し、その経路は速度が遅く、かつあまり直線的でない輸送モード(例えば徒歩)によってとられた可能性があることを意味する。
【0063】
公共輸送情報:公共輸送機関は、トランジットアプリケーション開発者を助けるために、多くの場合、ジェネラル トランジット フィード スペシフィケーション(General Transit Feed Specification)のような共通データフォーマットで、輸送スケジュールおよびルートを公開している。データは、特にルート、停止地および時刻表を含むことができ、それらはセグメントのデータとの近似マッチが存在するかどうか、および最も近いマッチは何か、を識別するために用いられ得る。1つ以上の近似マッチが見つかった場合、関連する輸送モードは次に特徴として分類器に直接用いられ得る。マッチングを実施するために、本技術は、トリップの軌跡を、(速度および加速度計とジャイロスコープの測定値から)停止地および対応するタイムスタンプを抽出することによって分類され、それらをタイムスタンプ付き停止イベントの系列として表すようにコードする。その系列は、(それに埋め込まれた停止時間および停止地によって)公共輸送データ中のルートに対してマッチさせられる。停止時間および停止地の些細な差異および省略を許容するために、動的時間伸縮法を用いることができる。所定のマッチしきい値内の最もマッチしたもの(top matches)が特徴として選択される。
【0064】
履歴ユーザラベルおよび予測:分類器は、特定のユーザのトリップパターンおよび好ましい輸送モードについて学習するためにいくつかのチャネルを有し得る。例えば、モバイル機器上のユーザ対応モバイルアプリケーションは、ユーザがアプリで好ましい輸送モードを設定したり、現在のトリップまたは昔のトリップの輸送モードを入力したり修正したりすることを可能にし得る。そのようなデータが利用可能な場合、本技術は、各種類のユーザラベルの時間および場所に関して、手動ラベルの分布およびトリップパターンの要約を作成することができる。この履歴要約情報は次に現在のトリップの個人化されたマッチングのために用いられ、可能な各ユーザラベルに対して1つずつマッチングスコアを生成し、それらのマッチングスコアは分類に用いられる。
【0065】
輸送モード分類アルゴリズム
上述したように取得または計算した特徴を考慮して、輸送モードセグメント分類器は、最も可能性が高い所与のセグメントの輸送モードおよび0~1にわたる信頼度尺度を予測する。分類器は、基本学習器として決定木を用いた勾配ブースティング(「勾配ブースティング決定木」)を用いる。分類モデルは、選択された損失関数(「訓練誤差」)が最小化されるか、または当てはめられた木の数が所定のラウンド数に達するまで、多数の決定木を訓練データに対して一つずつ段階的に当てはめることによって構築される。
【0066】
分類器を訓練するプロセスは以下の通りである。ラベル付き記録(トリップ)の精選された組が訓練データとして用いられるために準備される。訓練データ中のトリップラベルは、大部分はモバイルテレマティクスアプリケーションのエンドユーザによって提供されるユーザラベルに由来する。トリップラベルの他の供給源としては、エンドユーザ以外の者、アルゴリズムによる以前の分類の結果、または既知のラベルを有する以前のデータを挙げることができる。本技術は、センサデータ、オンデバイス活動予測、マップマッチ結果およびユーザ履歴データを含む訓練データを前処理する。前処理ステップは、データクレンジング、外れ値除去、タイムスタンプ補正、および入力訓練データを処理可能な形式(form ready for processing)にするための他のステップを含む。各トリップの前処理された訓練データは、前述したようにセグメント化される。結果として生じた各セグメントは、セグメント分類器のための訓練セット内の個別データポイントになる。前述したように各セグメントについて特徴が抽出される。データポイント(セグメント)のすべてから計算された特徴は特徴マトリクスを構成し、分類器訓練アルゴリズムはその特徴マトリクスを入力として取り込む。訓練アルゴリズムは、予想される性能をチェックし、必要により訓練パラメータを変更することによって、特徴マトリクスを用いて分類器を訓練し、交差検証を用いて分類器を評価する。良好な分類モデルが見つかると、最終分類器は利用可能なすべての訓練データを用いて見つけた最良モデルを使用して訓練される。最終モデルは、そのモデルを後でロードして、新しいトリップの記録に対する輸送モードの予測に用いることができるように、永続性記憶装置内に保存される。
【0067】
訓練プロセス中に、単純に実施された場合には、モデルが所与の訓練データに対してオーバーフィットすることがあり、結果として新しいトリップの記録に対して実際には期待されるように作用しない分類器を生じる。オーバーフィッティングに対抗するために、いくつかの戦略を用いることができる。それらの戦略としては、個々の決定木の深さの制限、アンサンブルにおける木の最大数の制限、後続の基本学習器の学習率の制御、決定木がさらに分離するために必要とされるサンプルの最小数を課すこと、および決定木フィッテングプロセス中における訓練例および特徴のランダムサブサンプリングのうちの1つまたは2以上の組合せが挙げられる。
【0068】
訓練の最後に、最終分類モデルは永久記憶装置に格納され、プロダクションサーバに展開される。トリップの記録がトリップモード分類のためにモバイル機器から示されると、プロダクションサーバは格納された最終分類モデルをロードして、そのトリップに適用し、セグメントごとの(segment-by-segment)トリップモード識別を生成する。いくつかの実施形態では、最終分類モデルをモバイル機器に転送することができ、モバイル機器は最終分類モデルをロードし、それをトリップの輸送モードを識別するために適用する。いくつかの実施形態では、モデルを記録のデータに適用する計算作業を、サーバとモバイル機器との間で分割することができる。
【0069】
いくつかの場合には、記録データの特定の特徴により、輸送モードを明白に予測または拒絶することができるトリップの記録が存在する。この場合、識別オーバーライドを適用して最終的に識別された輸送モードを修正することができる。例えば、極端な速度および極端な高度の双方が検出される場合、輸送モードの中で唯一の賢明な選択肢は飛行機である。別の例は、加速度計測定値が任意の注目に値する運動を表さない場合のファントム記録である。特定の輸送モード識別は、識別された輸送モードの特定の要件が満たされない場合には安全に拒絶され得る。例えば、約10メートル/秒を超える少なからぬ数の速度観測値が生じた場合、その期間中の輸送モードは徒歩ではあり得ない。そのようなモード識別は誤っており、拒絶されるであろう。識別が拒絶されると、分類器による次の最良の識別がとられ、関連する信頼度は再正規化される(renormalized)。
【0070】
分類器は、特徴と輸送モードとの間の最適な関連性を学習することができるはずである。実際、分類器は、例えばデータの不足、特徴の不足、またはノイズの多い入力ラベルにより、いくつかの関連性を学習しなかったり、または代わりに誤った関連性を学習したりすることがある。輸送モード識別のオーバーライドは、分類器によるこの不完全な学習に対して誤った分類を修正するように設計されている。
【0071】
時間的平滑化
上述したセグメント分類器は、トリップの記録内の各セグメントについて輸送モードを識別し、対応する確率測度を生成する。個々の識別は、例えば、セグメントデータ内の情報の不足により、または不完全なセグメント輸送モード分類により、またはそれらの組合せにより、正確ではないことがある。セグメントに対して1つずつ得られたそのような識別は、連続するセグメントにわたる時間的規則性およびダイナミクスから恩恵を受けない。例えば、人々は異なる輸送モードをあれこれと頻繁に切り替えない可能性があり、また特定のモード移行が概して他のものよりも頻繁に生じることがある。例えば、中間に徒歩を有することなく飛行機から車に切り替わる可能は低く、また飛行機から自転車へ移行する確率は車へ移行する確率よりもはるかに低い。
【0072】
時間的平滑化アルゴリズムは、上記の直観を用いて、モード識別結果を向上させるために用いられ得る。時間的平滑化は、入力としてセグメント輸送モード識別のシーケンスを与えられると、出力としてセグメント輸送モード識別の「平滑化された」シーケンスを生じる隠れマルコフモデル(HMM)としてモデル化され得る。
【0073】
このHMMにおいて、状態空間は可能な輸送モードを含む。観測空間は、セグメント輸送モード識別ラベルおよびその関連信頼度(確率)に基づいている。確率値は量子化によって離散値に変換され、輸送モード予測ラベルを用いて拡張されて(augmented)、HMMの入力として用いられる新しい観測記号を生成する。例えば、確率0.95はバケット番号1に分類されると仮定すると、確率0.95を有する「ボート」のセグメント分類結果は「ボート-1」に翻訳される。このHMM表示を考えると、学習したHMMは、ビタビ(Viterbi)アルゴリズムのようなHMM予測アルゴリズムを用いて、入力分類シーケンスから平滑化された予測のシーケンスを予測することができる。また、HMMは、ボーム-ウェルチ(Baum-Welch)アルゴリズムのような期待値最大化アルゴリズムを用いて、ラベル付きデータまたはラベルなしデータから訓練され得る。
【0074】
役割識別
いくつかの実施形態において、「車」の輸送モードであると識別された平滑化セグメントについて、役割分類器は、関係者の役割を、例えば運転者または乗客として、識別する。役割分類器は、前述したように、輸送モード分類器と同じデータ源の組を用いるが、車における識別子ユーザ役割に対して設計された異なる特徴の組を計算する。
【0075】
役割ラベル
トリップの所与の記録について所与のユーザの役割を予測する場合、役割分類器は、ユーザからの予測時に利用可能な履歴ユーザラベルを利用して、ユーザに特異的な役割行動(すなわちユーザ役割に特異的な特徴成分)を学習し、同様に、ユーザの同じ時空間グループ内の他のユーザおよび記録からのラベル(例えば同じ国、または同じ季節の間、またはそれらの双方におけるユーザおよびトリップ)を利用して、一般的な役割行動(すなわち一般集団役割特徴成分)を学習する。以下で概説される多くの特徴は、一般的およびユーザに特異的であるこれらの2つの異なる情報源を適当な方法で組み合わせる。例えば、ユーザが少数の役割ラベルしか事前に提供しなかったため、限られた量のユーザに特異的な情報のみが利用可能である場合には、役割分類器は、以下で特徴のうちのいくつかを計算する場合に、一般集団成分により重きを置くであろう。
【0076】
ユーザはユーザの役割に基づいてトリップにラベルを付けることができるか、またはいかなる役割ラベルもトリップに与えることができないかのいずれかであると考えられ得る。したがって、履歴ユーザラベルに基づいた特徴を計算する場合、ユーザによる(または一般集団成分を計算するための一般集団による)以前のトリップは、(役割が乗客および運転者に限定された実施形態において)3つのトリップ群、すなわち運転者ラベル付きトリップ、乗客ラベル付きトリップ、およびラベルなしトリップにグループ分けされる。トリップの捕捉関連性を下回る特徴が、特定のトリップ特性に関して3つの群の各々に対して予測される。ラベルなしトリップは、必ずしも主として運転者トリップまたは主として乗客トリップのいずれかであるとは想定されておらず、役割分類器訓練プロセスは、存在する場合には、データから任意の関連性を学習することを許容されている。
【0077】
役割予測特徴
ここでは車トリップについて2つの役割、すなわち運転者および乗客のみが存在する実施形態において役割分類器によって用いられる特徴について説明する。
【0078】
乗客優先(Passenger prior):乗客優先特徴は、そのユーザが、運転者であるのと比較して、どれくらい頻繁に乗客として移動するかを捕捉し、乗客分類に対してユーザに特異的なバイアス(「優先」)を提供する。この特徴は、履歴ユーザ役割ラベルから運転者とラベル付けされたトリップの割合として計算される。初期の間、ユーザはあまり移動しておらず、乗客優先特徴の信頼できる推定に必要とされる十分な数の車トリップをラベル付けしていないことがある。このデータの不足に対処するために、役割分類器は、トリップの数または経過した日数に基づく適当な重みを用いて、ユーザに特異的な推定を一般集団乗客優先特徴と組み合わせる。その重みは、ユーザが一定数のトリップを完了したら、または一定の日数後に、ユーザに特異的な乗客優先特徴が一般集団の乗客優先を越え始めるような方法で選択される。
【0079】
局所性:局所性特徴は、ユーザが典型的には運転者としてまたは乗客として移動する地域に対する近接性を表す。例えば、ある人の自宅の場所付近の車トリップは、運転者トリップである可能性が高くなり得るが、別の国におけるトリップは乗客トリップである確率がより高いであろう。現在のトリップを事前定義された場所とマッチさせる代わりに、局所性特徴は、3つのトリップ群(運転者、乗客、およびラベルなし)の各々に対して代表的な場所の組を見つけ、場所の近接性に関して現在のトリップを各群にマッチさせることにより、この情報(knowledge)をコードする。従って、この特徴は、場所の種類と、運転者または乗客である確率との間におけるいかなる文脈的関連性(contextual association)も想定しない。
【0080】
文脈的近接性:ユーザは、トリップの出発地および到着地の種類に応じて、好ましい役割を有していることがある。換言すると、特定の種類の出発地および到着地の場所はユーザの役割に対して関連性を有し得る。自宅、仕事および空港のような数種類のキーロケーションが各ユーザに対して判断される。そのようなキーロケーションは、ユーザによって(ユーザの仕事場および自宅の場所を設定することにより)提供されてもよいし、外部データベースから与えられてもよいし(例えば空港の場所)、またはユーザのトリップパターンから自動的に抽出されてもよい。識別されたキーロケーションの種類ごとに、運転者および乗客としての役割の頻度が追跡される。現在のトリップの分類について、役割分類器は、現在のトリップがユーザの識別されたキーロケーションのうちのいずれかとマッチするかどうかを最初に判断する。マッチが存在する場合には、乗客の役割に対する運転者の役割の相対頻度は、ユーザに特異的な場所に基づいた文脈的バイアス(contextual bias)を可能にする。
【0081】
トリップ類似性:この特徴は、現在のトリップがトリップ群のうちの1つの中のトリップに対して空間的または時空間的類似性を有するかどうかを検査する。各トリップ群について、群内のすべてのトリップが現在のトリップに対して、出発地および到着地、移動経路、および時刻によって比較され、ここで所定のしきい値内でマッチが成功した場合には、現在のトリップとその群内のトリップとは類似していると見なされる。各トリップ群の類似性は群内の同様のトリップの割合として計算され、その群に対するトリップ類似性を表す特徴として役割分類器に提供される。
【0082】
暦に関する変動:例えば、運転者および乗客としての役割のユーザパターンは、日変動、週変動、または季節変動を示すことがある。役割分類器は、役割ラベル(運転者または乗客)、並びに時刻、曜日、月および季節のような時間的なグループ分けごとに、トリップの数を計数することによって、これらの暦に関する変動を捕捉する。乗客優先特徴と同様に、これらの統計量は、ユーザに特異的なデータの不足の可能性を考慮するため、およびオーバーフィッティングを防止するために、一般集団から得られた同一の統計量と組み合わせられる。
【0083】
運転行動サイン:車の運動(急な発進、ブレーキおよび旋回)、高速進行および電話の使用に関して捕捉され採点される運転行動は、ユーザごとに変化し、各運転者を表すシグネチャとして用いられ得る。そのような運転行動プロファイルまたはスコアが利用可能な場合、ユーザの運転者役割でのトリップであることが分かっているトリップに対するそれらの運転行動プロファイルまたはスコアは格納され、後に現在のトリップの運転行動の運転行動シグネチャに対する類似性を決定するために比較される。
【0084】
電話の使用パターン:通常、運転者は、運転中に電話を使用するとは予想されない。運転者が電話を使用する場合、運転者は、常にではないが、通常、低速であるか、または車が交通渋滞で動けなくて停止しているか、または信号待ちしているときに、運転者の電話を使用する。したがって、電話の使用と車の停止地とは、ユーザが乗客役割を有するトリップについてよりも、ユーザが運転者役割を有するトリップについて、より頻繁に、同じ場所に位置する(co-located)。電話の使用は、画面ロック解除イベントもしくはフォアグラウンドアプリ情報などの電話中(on-phone)イベントまたはそれらの双方を電話の運動と組み合わせることにより検出され得、車の停止はGPS速度観測値、または加速度計もしくはジャイロセンサ信号、またはそれらの組合せを調査することにより検出され得る。これらの異なる2つの種類のイベントが一緒または時間的に近接して発生した場合、電話の使用と車の停止とが特定の瞬間に同じ場所に位置すると判断される。これらの結合された同一場所(co-location)イベントから、同一場所の合計長さ、頻度および典型的な長さのような様々な統計量が役割分類器のための特徴として抽出される。
【0085】
乗物の旋回半径:旅客車両について、運転者および乗客は乗物の両側に着座していることがある。例えば、右側交通システムでは、運転者は、ほとんどの種類の乗物においてもっぱら車の左側に着座するが、一方、乗客は乗物の右側に着座する可能性がある。すなわち、運転者の位置は車の中心線から数十センチメートル以上左側に位置し、乗客の位置は中心線から右側に位置していることがある。車が旋回しているときに、車の中心線からのこの分離は、運転者位置および乗客位置の遠心加速度において差異を生じる。モバイル機器の加速度計によって捕捉された瞬間遠心加速度は、モバイル機器によって測定されたGPS速度およびヨーレートから計算された、乗物の中心線において経験される遠心加速度と比較され得る。
【0086】
役割分類アルゴリズム
役割分類器は、輸送モード分類と同様に、ベース分類アルゴリズムとして勾配ブースティング決定木を用いる。役割分類に用いられるプロセスは、上述したような輸送モード分類に用いられるプロセスに類似しており、訓練データセットを準備するプロセス、訓練データの前処理、特徴の抽出、モデルの訓練、および交差検証による評価を含む。最終モデルがデータに対してオーバーフィットするのを防止するために同様の戦略も用いられる。輸送モード分類器に関するのと同様に、最終役割分類モデルは、(いくつかの実施形態では)サーバ上または(いくつかの実施形態では)電話内に格納され、展開され、予測に用いられる。
【0087】
トリップのラベル付け
多くの場合、トリップが2つ以上のセグメントにかかる場合には、単一のラベル(輸送モードと役割を含む)を、セグメントレベルではなくトリップレベルで、割り当てることが有用である。単一の代表的なトリップラベルを生成するためには、アプリケーション要件に応じて、以下のスキームまたはその他が用いられ得る。
【0088】
いくつかの実施形態において、記録の開始境界および終了境界を保存する必要がない場合、すなわち、トリップ境界が変更され得るか、または新しいトリップが生成され得る場合、複数のトリップは、セグメントラベルが変化する時点で記録をセグメント化することにより定義され得る。このスキームは、単一のトリップとしてみなすために、同一のラベルを有するセグメントのシーケンスに対して、最小継続時間または最小平均確率などの要件を課し得る。
【0089】
いくつかの実施形態において、記録の開始境界および終了境界は厳格であり、保存されなければならないことがある。この状況は、境界が供給源(例えばモバイルアプリケーション)によって判断されて変更することができない場合に生じ得る。そのような場合には、所定の境界内におけるデータについて最も代表的なラベルが用いられ得る。用いられ得る方法の中には、アプリケーションに応じて、大多数投票および最長範囲ラベル(longest-stretch label)がある。大多数投票スキームは、そのモードであると分類されたセグメントの継続時間の和が最大である輸送モードラベルを用いる。最長範囲ラベル法は、同一のラベルを有するであろうセグメントの最長範囲に関連付けられたラベルを選択する。双方の方法において、一時的である(すなわち非常に短期間を有する)か、または偽の(spurious)(すなわち低い確率を有する)セグメントは無視される。
【0090】
最終輸送モードラベルおよび役割ラベルはアプリケーション内でエンドユーザに提供されることが可能であり、エンドユーザは次に必要に応じてそれらのラベルを修正することができる。その修正は、次の繰り返しにおいて分類アルゴリズムを改善するために用いられ得る。また、様々なユーザ依存特徴に用いられるユーザに特異的な履歴情報は、ユーザによって行われたいかなるラベル変更も直ちに反映するであろう。予測ラベルは、後の使用および解析のために企業顧客に提供することもできる。
【0091】
上述したように、輸送モードおよび役割分類ステップの一部またはすべては、サーバの代わりに、またはサーバと併用して、電話上で行われてもよい。
他の実施形態も以下の特許請求の範囲内にある。
図1
図2