(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-09
(45)【発行日】2022-11-17
(54)【発明の名称】滞留点抽出装置、滞留点抽出方法、およびプログラム
(51)【国際特許分類】
G06Q 10/00 20120101AFI20221110BHJP
G06Q 10/08 20120101ALI20221110BHJP
【FI】
G06Q10/00
G06Q10/08
(21)【出願番号】P 2019234292
(22)【出願日】2019-12-25
【審査請求日】2021-05-13
【新規性喪失の例外の表示】特許法第30条第2項適用 発行日 平成31年1月23日 平成30年度 東京大学大学院工学系研究科 修士論文「軒先行動のモデル化に基づく配送計画策定に関する研究」
(73)【特許権者】
【識別番号】599163458
【氏名又は名称】アスクル株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】小野 俊克
(72)【発明者】
【氏名】田中 謙司
(72)【発明者】
【氏名】小澤 一穂
【審査官】池田 聡史
(56)【参考文献】
【文献】特開2015-158799(JP,A)
【文献】特開2017-091435(JP,A)
【文献】特開2013-210969(JP,A)
【文献】特開2011-154484(JP,A)
【文献】西田京介ほか2名,“確率的訪問POI分析:時空間行動軌跡からのユーザモデリング”,マルチメディア,分散,協調とモバイル(DICOMO2013)シンポジウム論文集,日本,一般社団法人情報処理学会,2013年07月03日,第2013巻, 第2号,pp.334~345
【文献】小林直ほか3名,“携帯電話通信履歴に特化した移動状態及び滞在位置推定手法の提案”,Webとデータベースに関するフォーラム(WebDB Forum 2014)論文集,日本,一般社団法人情報処理学会,2014年11月12日,第2014巻, 第4号
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
位置情報と時刻情報を含む複数の測位点に対して、位置情報と時刻情報に基づくクラスタリング処理を施して、第1のクラスタを生成するクラスタリングステップと、
前記第1のクラスタのうちの時間的に隣接するクラスタの間の距離が第1距離閾値より小さければ結合して、第2のクラスタを生成する第1結合ステップと、
前記第2のクラスタに対してクラスタ位置に基づくクラスタリング処理を施し、同一のクラスタに含まれる時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが所定の条件を満たす場合には、前記2つの第2のクラスタを結合して第3のクラスタを生成する第2結合ステップと、
前記第3のクラスタに基づいて、前記複数の測位点における滞留点を表す滞留点情報を出力する出力ステップと、
を含
み、
前記所定の条件は、前記2つの第2のクラスタから前記他の第2のクラスタへ移動すると仮定した場合の移動速度が速度閾値以上であるという条件である、
滞留点抽出方法。
【請求項2】
位置情報と時刻情報を含む複数の測位点に対して、位置情報と時刻情報に基づくクラスタリング処理を施して、第1のクラスタを生成するクラスタリングステップと、
前記第1のクラスタのうちの時間的に隣接するクラスタの間の距離が第1距離閾値より小さければ結合して、第2のクラスタを生成する第1結合ステップと、
前記第2のクラスタに対してクラスタ位置に基づくクラスタリング処理を施し、同一のクラスタに含まれる時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが所定の条件を満たす場合には、前記2つの第2のクラスタを結合して第3のクラスタを生成する第2結合ステップと、
前記第3のクラスタに基づいて、前記複数の測位点における滞留点を表す滞留点情報を出力する出力ステップと、
を含み、
前記所定の条件は、
前記2つの第2のクラスタのうちの時間的に先の第2のクラスタと前記他の第2のクラスタの間の距離が、前記先の第2のクラスタに含まれる最も時間的に遅い測位点の時刻情報と前記他の第2のクラスタに含まれる時間的に最も早い測位点の時刻情報との差と、所
定の速度とに基づく距離より大きいという第1条件と、
前記2つの第2のクラスタのうちの時間的に後の第2のクラスタと前記他の第2のクラスタの間の距離が、前記後の第2のクラスタに含まれる最も時間的に早い測位点の時刻情報と前記他の第2のクラスタに含まれる時間的に最も遅い測位点の時刻情報との差と、前記所定の速度とに基づく距離より大きいという第2条件と、
のうちのいずれか一方または両方を満たすという条件である、
滞留点抽出方法。
【請求項3】
前記第2結合ステップにおいて、時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが前記所定の条件を満たす場合には、前記他の第2のクラスタを除去する、
請求項1
または2に記載の滞留点抽出方法。
【請求項4】
前記クラスタリングステップは、
前記測位点の位置情報および距離情報を、距離カーネル幅および時間カーネル幅に応じて正規化するステップと、
正規化後の測位点に対して、前記距離カーネル幅を用いたMean-Shiftクラスタリング処理を施すステップと、
を含む、
請求項1から
3のいずれか1項に記載の滞留点抽出方法。
【請求項5】
前記第1結合ステップにおける前記第1距離閾値は、前記距離カーネル幅よりも小さい、
請求項
4に記載の滞留点抽出方法。
【請求項6】
前記出力ステップでは、前記第3のクラスタのうち、その中に含まれる時間的に最も早い測位点と時間的に最も遅い測位点の時間情報の差が、所定の時間閾値以上である場合に、前記第3のクラスタの重心位置と、前記最も早い測位点の時間情報と、最も遅い測位点の時間情報と、を含む滞留点情報を出力する、
請求項1から
5のいずれか1項に記載の滞留点抽出方法。
【請求項7】
請求項1から
6のいずれか1項に記載の方法の各ステップをコンピュータに実行させるためのプログラム。
【請求項8】
プロセッサと、
請求項
7に記載したプログラムを記憶した記憶装置と、
を備える、滞留点抽出装置。
【請求項9】
位置情報と時刻情報を含む複数の測位点に対して、位置情報と時刻情報に基づくクラスタリング処理を施して、第1のクラスタを生成するクラスタリング手段と、
前記第1のクラスタのうちの時間的に隣接するクラスタの間の距離が第1距離閾値以内であれば結合して、第2のクラスタを生成する第1結合手段と、
前記第2のクラスタに対してクラスタ位置に基づくクラスタリング処理を施し、同一のクラスタに含まれる時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが所定
の条件を満たす場合には、前記2つの第2のクラスタを結合して第3のクラスタを生成する第2結合手段と、
前記第3のクラスタに基づいて、前記複数の測位点における滞留点を出力する出力手段と、
を含
み、
前記所定の条件は、前記2つの第2のクラスタから前記他の第2のクラスタへ移動する
と仮定した場合の移動速度が速度閾値以上であるという条件である、
滞留点抽出装置。
【請求項10】
位置情報と時刻情報を含む複数の測位点に対して、位置情報と時刻情報に基づくクラスタリング処理を施して、第1のクラスタを生成するクラスタリング手段と、
前記第1のクラスタのうちの時間的に隣接するクラスタの間の距離が第1距離閾値以内であれば結合して、第2のクラスタを生成する第1結合手段と、
前記第2のクラスタに対してクラスタ位置に基づくクラスタリング処理を施し、同一のクラスタに含まれる時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが所定の条件を満たす場合には、前記2つの第2のクラスタを結合して第3のクラスタを生成する第2結合手段と、
前記第3のクラスタに基づいて、前記複数の測位点における滞留点を出力する出力手段と、
を含み、
前記所定の条件は、
前記2つの第2のクラスタのうちの時間的に先の第2のクラスタと前記他の第2のクラスタの間の距離が、前記先の第2のクラスタに含まれる最も時間的に遅い測位点の時刻情報と前記他の第2のクラスタに含まれる時間的に最も早い測位点の時刻情報との差と、所定の速度とに基づく距離より大きいという第1条件と、
前記2つの第2のクラスタのうちの時間的に後の第2のクラスタと前記他の第2のクラスタの間の距離が、前記後の第2のクラスタに含まれる最も時間的に早い測位点の時刻情報と前記他の第2のクラスタに含まれる時間的に最も遅い測位点の時刻情報との差と、前記所定の速度とに基づく距離より大きいという第2条件と、
のうちのいずれか一方または両方を満たすという条件である、
滞留点抽出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、滞留点抽出装置、滞留点抽出方法、およびプログラムに関する。
【背景技術】
【0002】
近年のEC(Electronic Commerce)市場の著しい成長に伴い、宅配便の取扱個数が急
速に増加し、また、消費者が宅配サービスに求めるサービス基準も高まっている。特に、物流の末端部分、すなわち顧客の軒先に貨物を届ける部分に当たるラストワンマイル配送において、ドライバーの人手不足を発端とした様々な課題が存在しており、ラストワンマイル配送の効率化が強く求められている。例えば、現状では配送経路の決定はドライバーに委ねられているが、適切な配送経路を自動的に決定できれば、経験の浅いドライバーも効率的な配送が可能となる。
【0003】
配送経路決定の一要素として、配送先に応じた駐車位置の決定がある。駐車位置を適切に決定するためには、経験のあるドライバーの行動を分析することが望まれる。効率化のために、ドライバー行動の分析、特に駐車位置の分析を、車両に搭載されたGPS装置(位置情報取得装置)の測位点データに基づいて行うことが想定される。
【0004】
GPS測位点の軌跡から滞留点抽出を含むイベント検出の手法は広く研究されている。例えば、DBScan、Mean-Shift、k-meanによるクラスタリングを用いる手法があるが、これらの手法は時系列を考慮しておらず、時間間隔が広いデータも同一のクラスタとしてみなしてしまう欠点がある。DBScanにおけるデータ間の接続条件に時系列的に連続するという条件を加える手法も提案されているが、ノイズの影響により一つの滞留点が複数のクラスタに分断されてしまうという欠点がある。
【0005】
これに対して、非特許文献1は、ノイズに対してロバストな手法として時空間Mean-Shiftと呼ばれる手法を提案している。この手法は、距離だけでなく時間に対してもカーネル幅を考慮したMean-Shiftである。しかしながら、この手法もノイズによる分断を十分に解消することができない。
【先行技術文献】
【非特許文献】
【0006】
【文献】西田京介, et al. 「確率的訪問 POI 分析: 時空間行動軌跡からのユーザモデリング.」 マルチメディア, 分散協調とモバイルシンポジウム 2013 論文集 2013 (2013): 334-345.
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、ノイズによる影響を極力排除して、時系列の測位点データから滞留点を精度良く抽出することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第一の態様は、
位置情報と時刻情報を含む複数の測位点に対して、位置情報と時刻情報に基づくクラスタリング処理を施して、第1のクラスタを生成するクラスタリングステップと、
前記第1のクラスタのうちの時間的に隣接するクラスタの間の距離が第1距離閾値より小さければ結合して、第2のクラスタを生成する第1結合ステップと、
前記第2のクラスタに対してクラスタ位置に基づくクラスタリング処理を施し、同一の
クラスタに含まれる時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが所定の条件を満たす場合には、前記2つの第2のクラスタを結合して第3のクラスタを生成する第2結合ステップと、
前記第3のクラスタに基づいて、前記複数の測位点における滞留点を表す滞留点情報を出力する出力ステップと、
を含む、滞留点抽出方法である。
【0009】
上記の所定の条件は、前記2つの第2のクラスタから前記他の第2のクラスタへ移動すると仮定した場合の移動速度が速度閾値以上であるという条件でありうる。
【0010】
上記の所定の条件は、
前記2つの第2のクラスタのうちの時間的に先の第2のクラスタと前記他の第2のクラスタの重心間距離が、前記先の第2のクラスタに含まれる最も時間的に遅い測位点の時刻情報と前記他の第2のクラスタに含まれる時間的に最も早い測位点の時刻情報との差と、所定の速度とに基づく距離より大きいという第1条件と、
前記2つの第2のクラスタのうちの時間的に後の第2のクラスタと前記他の第2のクラスタの重心間距離が、前記後の第2のクラスタに含まれる最も時間的に早い測位点の時刻情報と前記他の第2のクラスタに含まれる時間的に最も遅い測位点の時刻情報との差と、前記所定の速度とに基づく距離より大きいという第2条件と、
のうちのいずれか一方または両方を満たすという条件でありうる。
【0011】
本態様に係る滞留点抽出処理は、前記第2結合ステップにおいて、時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが前記所定の条件を満たす場合には、前記他の第2のクラスタを除去してもよい。
【0012】
本態様における前記クラスタリングステップは、
前記測位点の位置情報および距離情報を、距離カーネル幅および時間カーネル幅に応じて正規化するステップと、
正規化後の測位点に対して、前記距離カーネル幅を用いたMean-Shiftクラスタリング処理を施すステップと、
を含んでもよい、
【0013】
本態様において、前記第1結合ステップにおける前記第1距離閾値は、前記距離カーネル幅よりも小さいことが好ましい。
【0014】
本態様における前記出力ステップでは、前記第3のクラスタのうち、その中に含まれる時間的に最も早い測位点と時間的に最も遅い測位点の時間情報の差が、所定の時間閾値以上である場合に、前記第3のクラスタの重心位置と、前記最も早い測位点の時間情報と、最も遅い測位点の時間情報と、を含む滞留点情報を出力してもよい。
【0015】
本発明の第二の態様は、
位置情報と時刻情報を含む複数の測位点に対して、位置情報と時刻情報に基づくクラスタリング処理を施して、第1のクラスタを生成するクラスタリング手段と、
前記第1のクラスタのうちの時間的に隣接するクラスタの間の距離が第1距離閾値以内であれば結合して、第2のクラスタを生成する第1結合手段と、
前記第2のクラスタに対してクラスタ位置に基づくクラスタリング処理を施し、同一のクラスタに含まれる時間的に隣接する2つの第2のクラスタの間に存在する全ての他の第2のクラスタが所定の結合条件を満たす場合には、前記2つの第2のクラスタを結合して第3のクラスタを生成する第2結合手段と、
前記第3のクラスタに基づいて、前記複数の測位点における滞留点を出力する出力手段
と、
を含む、滞留点抽出装置である。
【0016】
本発明の他の態様は、上述の方法の各ステップをコンピュータに実行させるためのプログラムである。本発明の更に他の対応は、プロセッサと、上記プログラムを記憶した記憶装置と、を備える滞留点抽出装置である。
【発明の効果】
【0017】
本発明によれば、ノイズによる影響を極力排除して、時系列の測位点データから滞留点を精度良く抽出することができる。
【図面の簡単な説明】
【0018】
【
図1】
図1は、本実施形態に係る滞留点抽出システムの概略構成図である。
【
図2】
図2Aは入力データである測位点データの例を示し、
図2Bは出力データである滞留点データの例を示す図である。
【
図3】
図3A~
図3Cは測位点データに含まれる(A)欠損、(B)ランダムノイズ、(C)連続ノイズを説明する図である。
【
図4】
図4は、滞留点抽出処理の全体の流れを示すフローチャートである。
【
図5】
図5は、滞留点抽出処理において測位点がそのようにまとめられるかを説明する模式図である。
【
図6】
図6は、滞留点抽出処理における時空間Mean-Shiftの流れを示すフローチャートである。
【
図7】
図7は、滞留点抽出処理における超隣接結合処理の流れを示すフローチャートである。
【
図8】
図9は、滞留点抽出処理におけるノイズ分断結合処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0019】
以下では、時系列のGPS測位点データから滞留点を精度良く抽出する手法について説明する。本手法は、測位点を時空間Mean-Shiftによりクラスタリングし、得られるクラスタを、超隣接結合とノイズ分断結合と称する2段階の結合処理により結合することを特徴とする。超隣接結合によってランダムノイズおよびデータ欠損の影響を排除し、ノイズ分断結合によって連続ノイズ(異常値ノイズ)の影響を排除する。この2段階の結合によって、ノイズに対してロバストな精度のよい滞留点抽出が実現できる。
【0020】
[用語説明]
詳細な説明に入る前に、本明細書における用語の説明を行う。
【0021】
「測位点」は、測位により得られる位置情報と、測位を行ったタイミングを示す時刻情報を含む。位置情報は、水平位置(2次元位置)を特定できればよく、高さの情報は含まれなくてもよい。典型的には、位置情報は緯度と経度を含む。すなわち、測位点p
iは、位置x
i(緯度lat
i, 経度lon
i)と時刻t
iを含む。
【数1】
【0022】
「滞留点」は、時系列の測位点データにおいて所定時間以上静止していたと推定される位置である。滞留点は測位点の集合に対応する。測位点の集合をP
j(j=1,2,・・・,N)とするとき、それに対する滞留点S
jは、以下に示す、測位点の集合P
jと、開始時刻t_bgn
jと、
終了時刻t_end
jと、中心位置(lat_s
j, lon_s
j)の各値を持つ。なお、滞留点と測位点集合(測位点のクラスタ)は同一視でき、本明細書中では滞留点S
jを測位点集合S
j(測位点のクラスタS
j)と称することもある。
【数2】
【0023】
「緯度、経度、時刻の正規化」は、緯度、経度、時刻を、距離カーネル幅Φdis1と時間カーネル幅Φtimeを基準として互いに比較可能な量に変換することである。正規化された緯度lat_disiおよび経度lon_disiは、緯度latiおよび経度loniを、基準点(例えば、測位点集合における重心位置)からの緯度方向および経度方向に沿った距離に変換することにより得られる。この際、地表面を平面に近似してよい。また、正規化された時刻t_disiは、時刻tiをΦdis1/Φtime倍することにより得られる。この例では、正規化された緯度、経度、時刻は互いに比較可能なデータに変換されているので、「緯度、経度、時刻の正規化」は「緯度、経度、時刻の対称なデータへの変換」と称することもできる。また、ここでは距離を基準とした変換(正規化)を行っているので、この正規化は、「緯度、経度、時刻の対称な距離への変換」と称することもできる。
【0024】
[システム構成]
図1は、実施形態に係るシステムの概略構成図である。
図1に示すように、本実施形態に係るシステムは、滞留点抽出装置1、データサーバ2、および車両3を含む。
【0025】
車両3は、GPS装置を搭載しており、定期的(例えば10秒おき)に測位結果(測位点データ)を取得する。車両3は、適当なタイミングで取得された測位点データをデータサーバ2に送信する。ここでは、1台の車両3しか示していないが複数台の車両3から測位点データを取得してもよい。
【0026】
データサーバ2は、車両3から送信される測位点データを記憶する。なお、複数の車両3が利用される場合には、データサーバ2は、測位点データがどの車両3が取得したデータであるかを判別可能に記憶する。なお、本実施形態では、データサーバ2と滞留点抽出装置1を別個の装置として説明しているが、一つの装置が両者の機能を実現してもよい。
【0027】
滞留点抽出装置1は、プロセッサ11、通信装置12、入力装置13、出力装置14、および記憶装置15を有するコンピュータ(情報処理装置)である。プロセッサ11は、単一のプロセッサでもよくマルチプロセッサ、1つのプロセッサが複数のコアを有していてもよい。プロセッサは、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)、数値演算プロセッサ、ベクトル
プロセッサであってよい。記憶装置15は、RAMのような揮発性の主記憶装置と、SSD(Solid State Disk)またはHDD(Hard Disk Drive)のような不揮発性の補助記憶
装置を含む。
【0028】
記憶装置15には、データ取得モジュール16、クラスタリングモジュール17、超隣接結合モジュール18、ノイズ分断結合モジュール19、出力モジュール20のプログラムが格納されている。プロセッサ11が記憶装置15に格納されたプログラムを実行する
ことにより、各モジュールの機能が実現される。各モジュールの機能の詳細について以下で説明する。
【0029】
[入出力データ]
本実施形態における滞留点抽出装置1は、車両3のGPS測位点データを入力データとして扱い、車両3が停車していたと思われる時間と場所を示す滞留点データを出力する。入力データである測位点データは、時刻、緯度、および経度の情報を有する。
図2Aに測位点データの例を示す。滞留点データは、滞留していた時間帯として開始時刻と終了時刻、および滞留していた場所として緯度と経度の情報を有する。
図2Bは、出力される滞留点データの例を示す。なお、入出力データに、ここで示した以外の情報が含まれても構わない。
【0030】
GPS測位データは欠損やノイズを含み、特に高層ビル街のような地域では長時間の欠損や大きなノイズが生じる場合があるので、このような影響を排除した精度良い滞留点抽出が望まれる。
【0031】
図3Aは、欠損の例を示す。欠損は測位不能なときに生じる。
図3Aは、本来10秒間隔で取得されるべき測位点が170秒にわたって取得できなかった欠損の例を示す。
【0032】
また、測位点データにはノイズが含まれ、その原因としてマルチパス効果や周辺環境による電波干渉が挙げられる。ノイズの例として、実際の位置の周辺で細かくバラつくランダムノイズと、実際の位置とは異なる位置が一定の期間連続して検出される連続ノイズが挙げられる。連続ノイズは異常値ノイズとも呼ばれる。
【0033】
図3Bはランダムノイズの例を示し、実際には車両3が停車中であるにもかかわらず、測位点は停車位置の周辺で細かくバラついていて移動しているように見える。
図3Cは連続ノイズの例を示し、車両3の実際の停車位置とは異なる位置に停車しているように見える。なお、ランダムノイズと連続ノイズの両方が同時に発生することもある。
【0034】
[処理]
図4は、本実施形態に係る滞留点抽出装置1が行う滞留点抽出処理の全体の流れを示すフローチャートである。
図5は、滞留点抽出処理の各ステップにおいて測位点がどのようにまとめられるかを説明する模式図である。
図6~
図8は、滞留点抽出処理におけるサブステップを示すフローチャートである。
【0035】
図4に示すように、滞留点抽出処理のステップS10からS50の処理は、日付および車両(あるいはドライバー)の組についてループ処理L1としてそれぞれ行われる。なお、1日単位よりも短いあるいは長い期間を対象として処理を行ってもよい。
【0036】
(データ取得処理)
ステップS10において、データ取得モジュール16のプログラムを実行するプロセッサ11が、データサーバ2から、処理対象の日付および車両の測位点データを取得する。なお、以下では説明の簡略化のために、プロセッサがあるモジュールのプログラムを実行して処理を行うことを、当該モジュールが処理を行うと説明する。例えば、ステップS10では、データ取得モジュール16が、処理対象の日付および車両の測位点データを取得する。
【0037】
図5に示すグラフ510は、ステップS10において取得される測位点データを模式的に示す。横軸が時間であり、縦軸が空間(位置)であり、図中の各点が測位点を表す。本例において、時間帯511において車両は停車しており、移動の後に、時間帯512にお
いて移動後の別の位置に停車している。ここで、ランダムノイズ513が発生しており、実際には停車しているにもかかわらず車両が移動しているように見える。また、連続ノイズ514が発生しており、実際とは異なる位置に停車しているように見える。また、欠損515が発生しており、この期間の測位点が不明である。
【0038】
(時空間Mean-Shift処理)
ステップS20において、クラスタリングモジュール17が、入力された測位点データに対して時空間Mean-Shiftによるクラスタリング処理を施す。時空間Mean-Shiftは、位置情報と距離情報の両方に基づくMean-Shiftである。時空間Mean-Shift処理S20の詳細は、
図6に示される。
【0039】
ステップS21において、クラスタリングモジュール17は、各測位点piの緯度、経度、時刻の情報を対称な3次元データに変換する正規化処理を施す。この正規化処理は、上述したように、測位点piの緯度、経度、時刻を、距離カーネル幅Φdis1と時間カーネル幅Φtimeを基準として互いに比較可能な量に変換する処理である。具体的には、正規化された緯度lat_disiおよび経度lat_loniは、任意の基準点を原点として、当該基準点からの南北方向(緯度方向)および東西方向(経度方向)の距離として求められる。正規化された距離t_disiは、時刻tiに距離カーネル幅Φdis1と時間カーネル幅Φtimeの比(Φdis1/Φtime)をかけることにより求められる。このように緯度、経度、時刻のデータは互いに比較可能な距離相当の値に正規化(変換)され、以降のMean-Shiftにおいて正規化された緯度、経度、時刻を用いる。これにより、位置(緯度、経度)と時刻を同様に扱うことができるようになる。
【0040】
ステップS22~S25の処理は、既知のMean-Shiftクラスタリング処理と同様であるため簡単に説明する。ステップS22において、クラスタリングモジュール17は、各測位点piをクラスタciの重心として初期化する。ループ処理L2では、全ての測位点piに対してステップS23~S24の処理が実行される。ステップS23において、クラスタリングモジュール17は、現在の重心から半径Φdis1に含まれる点の重心を、新しい重心に設定する。ステップS24において、クラスタリングモジュール17は、重心が変化したかを判定して、重心が変化した場合にはステップS23に戻り、変化していない場合には次の測位点を処理対象とする。全ての測位点についてループL2の処理が完了したら、ステップS25において、クラスタリングモジュール17は、重心が同じ測位点群を1つのクラスタ(測位点集合)Sjにまとめる。
【0041】
本実施形態では、ステップS21において測位点を正規化した対称な3次元データに変換することで、位置および時間に基づくMean-Shiftクラスタリングが行える。
【0042】
図5のグラフ520は、時空間Mean-Shiftクラスタリングにより得られるクラスタS
1からS
22を示す。時空間Mean-Shiftクラスタリング処理S20後の各
クラスタが、本発明における第1のクラスタの例である。
【0043】
時空間Mean-Shiftクラスタリングにおいて、距離カーネル幅Φdis1は、激しいランダムノイズに対応できるように比較的大きな値に設定する。また、時間カーネル幅Φtimeは、誤ったクラスタリングを減らすために比較的小さな値に設定する。適切な値は測定環境に応じて異なるが、距離カーネル幅Φdis1は、例えば、20m以上130m以下としてもよく、あるいは30m以上90m以下としてもよい。時間カーネル幅Φtimeは、20秒以上130秒以下としてもよく、あるいは30秒以上90秒以下としてもよい。本実施形態では、距離カーネル幅Φdis1を40mとし、時間カーネル幅Φtimeを50秒とする。
【0044】
なお、時間情報と位置情報を考慮したMean-Shiftクラスタリングであれば、上記のように測位点データの正規化を行わずに、非特許文献1のように時間と空間に対して個別にカーネルを設定してMean-Shiftを実施しても構わない。
【0045】
(超隣接結合処理)
ステップS30において、超隣接結合モジュール18が、時空間Mean-Shiftクラスタリングによって得られたクラスタを結合する。この結合は、時間カーネル幅を超えて時間的に隣接するクラスタを結合していく処理なので、超隣接結合と称する。超隣接結合処理S30の詳細は、
図7に示される。なお、「2つのクラスタ(滞留点)が時間的に隣接する」とは、当該2つのクラスタ(滞留点)の滞留期間の間の時刻を有するクラスタ(滞留点)が存在しないことを意味する。
【0046】
ループ処理L3では、j=2, 3, ... , Njについて以下のステップS31およびS32が行われる。ステップS31において、超隣接結合モジュール18は、クラスタSj-1とSjが、クラスタ間の距離dist(Sj-1, Sj)が結合距離カーネル幅Φdis2よりも小さいという結合条件を満たすか否か判定する。ここで、結合距離カーネル幅Φdis2は、本発明における第1距離閾値に相当する。また、クラスタ間の距離distは、本実施形態ではクラスタ中心(重心)の間の距離として定義するが、最短距離、最長距離、平均距離で定義してもよい。結合条件を満たす場合、超隣接結合モジュール18は、クラスタ(滞留点)SjにSj-1を結合する。
【0047】
図5のグラフ530は、超隣接結合後のクラスタを示す。この例では、クラスタS
1がS
2に結合され、S
2がS
3に結合され、と繰り返して、最終的にクラスタS
1からS
5が1つのクラスタS
5に結合される。同様に、S
11からS
13が結合され、S
14からS
17が結合され、S
18からS
22が結合される。その他のクラスタは、隣接するクラスタとの結合が行われず、含まれる測位点に変更がない。超隣接結合後の各クラスタが、本発明における第2のクラスタの例である。
【0048】
このように時間的に隣接するクラスタの距離が近い場合に結合することにより、ランダムノイズがあっても結合が行え、また、欠損による分断も結合できる。
【0049】
超隣接結合処理における結合距離カーネル幅Φdis2は、例えば、20m以上60m以下としてもよく、あるいは30m以上50m以下としてもよい。なお、超隣接結合は、時間的に隣接するクラスタの距離が極めて近い場合に結合することが有効であると考えられ、したがって、結合距離カーネル幅Φdis2は、時空間Mean-Shiftにおける距離カーネル幅Φdis1よりも小さくすることが好ましい。本実施形態では、結合距離カーネル幅Φdis2は35mとする。
【0050】
(ノイズ分断結合)
ステップS40において、ノイズ分断結合モジュール19が、超隣接結合処理によって得られたクラスタを結合する。この結合は、連続ノイズによって分断されている可能性があるクラスタを結合することを目的とする処理なので、ノイズ分断結合と称する。ノイズ分断結合が本手法の特徴的な部分の一つである。ノイズ分断結合処理S40の詳細は、
図8に示される。
【0051】
ステップS41において、ノイズ分断結合モジュール19は、超隣接結合処理後のクラスタに対してMean-Shiftによるクラスタリング処理を施す。ここでは、クラスタの時間情報は用いずに、位置情報のみに着目してクラスタリングを行う。ただし、時間情報も考慮したクラスタリングを行ってもよい。
【0052】
Mean-Shiftクラスタリングにおける距離カーネル幅は適宜決定すればよいが、距離カーネル幅Φdis1よりも小さくすることが好ましく、例えば、結合距離カーネル幅Φdis2と同じ値を採用する。
【0053】
Mean-Shiftクラスタリングは、
図6のステップS22~S25の処理と同様なので繰り返しの説明は省略する。Mean-Shiftクラスタリングの結果として得られるクラスタを、クラスタC
kと表す。クラスタC
kは、N
k個のクラスタS
jを含む。
【数3】
【0054】
このMean-Shiftクラスタリングにより、
図5に示す例では、グラフ530中のクラスタS
5,S
13,S
22が1つのクラスタC
1として得られる。グラフ530中のその他のクラスタSは、それぞれが1つのクラスタC
kとなることもあるし、いくつかのクラスタSが1つのクラスタCとなることもある。この例では、クラスタC
1に関して、C
1_1=S
5, C
1_2=S
13, C
1_3=S
22, N
1=3である。なお、k_jはk
jと同じ意味である。
【0055】
ループL4の処理は、Mean-Shiftクラスタリングにより得られるクラスタCkのそれぞれについて行われる。ループL5の処理は、対象とするクラスタCkに含まれるクラスタSk_j(j=1,2,...,Nk)について行われる。
【0056】
ステップS42において、ノイズ分断結合モジュール19は、クラスタC
kに含まれる時間的に隣接するクラスタS
k_j-1とS
k_jが結合条件を満たすか否かを判定する。この結合条件は以下のように表せる。
【数4】
【0057】
この結合条件は、Mean-Shiftクラスタリングにより得られる1つのクラスタCkに含まれる時間的に隣接する2つのクラスタSk_j-1とSk_jの間に含まれる全てのクラスタSi (kj-1 < i < kj)について、条件(1)かつ(2)を満たすという条件である。条件(1)かつ(2)は、クラスタSk_j-1とSk_jからクラスタSiに移動したと仮定した場合に、その移動の際の移動速度が速度閾値Vnsより大きいという条件を満たすという条件と等
しい。
【0058】
別の表現をすると、条件(1)は、クラスタSk_j-1とSiの間の距離dist(Sk_j-1, Si)が、クラスタSk_j-1の終了時刻とクラスタSiの開始時刻との差と、速度閾値Vnsを乗算した
値よりも大きいという条件である。条件(2)は、クラスタSk_jとSiの間の距離dist(Sk_j, Si)が、クラスタSiの終了時刻とクラスタSk_jの開始時刻との差と、速度閾値Vnsを乗
算した値よりも大きいという条件である。なお、上述のようにクラスタ間の距離distは重心間距離、最短距離、最長距離、平均距離のいずれであってもよい。
【0059】
ステップS42の判定処理は、別の表現をすると、クラスタSk_j-1とSk_jの間に含まれる全てのクラスタSiがクラスタSk_j-1とSk_jから現実的な移動速度では到達できないような位置で計測された場合に、クラスタSk_j-1とSk_jの間のクラスタを全て連続的なノイズと判定する処理である。
【0060】
なお、ここでは時間的に隣接する2つのクラスタSk_j-1とSk_jの間に含まれる全てのクラスタSiについて、条件(1)かつ(2)を満たすことを条件としているが、条件(1)と条件(2)のいずれか一方のみを満たすことを条件としてもよい。
【0061】
上記の結合条件を満たす場合には、ノイズ分断結合モジュール19は、ステップS43において、クラスタ(滞留点)Sk_jにSk_j-1を結合し、ステップS44において、クラスタSi (kj-1 < i < kj)を除去する。
【0062】
図5のグラフ530,540を参照してより具体的に説明する。ステップS41のMean-Shiftクラスタリングにより、クラスタS
5,S
13,S
22を含むクラスタC
1が得られるとする。ここで実際には、S
5とS
13およびS
22は異なる滞留点であるが、位置が近しいために同じクラスタに属するものと判断されたことを想定する。このようなクラスタリングの結果、ループ処理L4における、クラスタC
1に対する処理は次のように行われる。
【0063】
ループ処理L5の1回目の処理では、S5とS13の間の存在するクラスタSi (i = 6, 7, 8, 9, 10)の全てについて上記の条件(1)かつ(2)が成立するか判定される。ここでは、例えばS5からS6への移動が閾値速度Vns以下で移動できるので、結合条件を満たさずS5
とS13は結合されない。
【0064】
ループ処理L5の2回目の処理では、S13とS22の間に存在するクラスタSi (i = 17)の
全てについて上記の条件(1)かつ(2)が成立するか判定される。ここでは、S13からS17への移動とS17からS22への移動のいずれもが、閾値速度Vnsより大きい速度での移動と
なるので、結合条件を満たす。したがって、S22にS13が結合されるとともに、S17が除去
される。
【0065】
最終的に、
図5のグラフ540に示すように、クラスタ(滞留点)S
5, S
6, S
7, S
8, S
9, S
10, S
22が得られる。このように、ノイズ分断結合後の各クラスタが本発明における第3のクラスタの例である。
【0066】
(滞留点出力処理)
ステップS50において、出力モジュール20は、ノイズ分断結合の結果として得られるクラスタから滞留点としてみなすクラスタを決定して、滞留点の情報を記憶装置15、データサーバ2またはその他の外部装置に出力する。ここで、滞留点とみなす条件は、クラスタ内に含まれる時間的に最も早い測位点と時間的に最も遅い測位点の時間情報の差(t_endj- t_bgnj)が、所定の時間閾値以上であるという条件である。出力モジュール20は、ノイズ分断結合の結果として得られるクラスタ(第3のクラスタ)が上記条件を満たす場合には、当該クラスタの重心位置(lat_sj, lon_sj)、最も早い測位点の時刻(開始時刻)t_bgnj、および最も遅い測位点の時刻(終了時刻)t_endjを含む滞留点情報を出力する。
【0067】
図5のグラフ540の例では、クラスタS
6からS
10は滞留時間が閾値よりも短いので滞
留点とはみなされず、クラスタS
5およびS
22 が滞留点として出力されることになる。
【0068】
[有利な効果]
本実施形態によれば、時空間Mean-Shiftによる細かな滞留点(クラスタ)を、超隣接結合とノイズ分断結合の2段階の結合処理によって結合している。超隣接結合ではデータ欠損およびランダムノイズによる影響を排除し、ノイズ分断結合では連続ノイズ(異常値ノイズ)による影響を排除している。特にノイズ分断結合により、誤結合のリスクを増加させることなく、連続ノイズに対する耐性が強めることが可能である。明確な連続ノイズであれば、その長さにかかわらず、連続ノイズの影響を取り除いて滞留点を正しく抽出可能である。
【0069】
[変形例]
上記の説明では、測位点は車両に搭載されたGPS装置によって取得されているが、測位点はどのように取得されてもよい。例えば、GPS装置以外の衛星測位システム(たとえば、ガリレオ、GLONASS、北斗、みちびき、DORIS等)による測位情報を用いてもよいし、基地局測位による測位情報を用いてもよい。また、測位装置は車両に搭載される必要は無く、車両以外の移動体に搭載されてもよいし、人間によって携帯されてもよい。
【0070】
測位点データの最初のクラスタリング処理(S20)において、時空間Mean-Shiftを用いているが、位置情報と時間情報を考慮したクラスタリング処理であればその他の任意のクラスタリング処理を採用して構わない。また、ノイズ分断結合S40内のクラスタリング処理S41も、Mean-Shift以外のクラスタリング処理を採用しても構わない。
【0071】
[コンピュータが読み取り可能な記録媒体]
コンピュータその他の機械、装置(以下、コンピュータ等)に上記の機能を実現させるプログラムをコンピュータ等が読み取り可能な非一時的記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
【0072】
ここで、コンピュータ等が読み取り可能な非一時的記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばSSD,フレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、ブルーレイディスク、DAT、8mmテープ、フラッシュメモリ等のメモリカード等がある。また、コンピュータ等に固定された記録媒体としてハードディスク、SSDやROM等がある。
【符号の説明】
【0073】
1:滞留点抽出装置 11:プロセッサ 12:通信装置
13:入力装置 13:出力装置 15:記憶装置
16:データ取得モジュール 17:クラスタリングモジュール
18:超隣接結合モジュール 19:ノイズ分断結合モジュール
20:出力モジュール