【文献】
岡田 和也 他,ユーザの移動軌跡における滞留点推定と応用の提案,情報処理学会研究報告,日本,社団法人情報処理学会,2008年 9月18日,Vol.2008,No.91(2008-DPS-136(16)),pp.89-94.
【文献】
吉井 英樹 他,区間速度を用いた位置情報履歴データの分析手法に関する検討,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2009年 5月14日,Vol.109,No.39(LOIS2009-7),pp.109-112.
【文献】
加美 伸治 他,GPSデータからの重要位置の高速検出アルゴリズム,電子情報通信学会2010年通信ソサイエティ大会講演論文集,日本,社団法人電子情報通信学会,2010年 8月31日,Vol.2,No.B-20-3,p.406.
(58)【調査した分野】(Int.Cl.,DB名)
利用者の測位位置及び測位時刻を含む情報である位置情報ログの集合から、前記利用者が滞留する位置である滞留点に相当する位置情報ログが除外された位置情報ログの集合の入力を受け付ける手段と、
前記入力された集合の位置情報ログに対して、前記測位位置を表す数値情報および時刻により規定される多次元空間上における前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出手段とを備えた
ことを特徴とする行動パタン解析装置。
前記滞留点クラスタ抽出手段は、利用者の測位位置及び測位時刻を含む情報である位置情報ログに対して、前記測位位置を表す数値情報および時刻により規定される多次元空間上における前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを行ない、前記重み付けされた位置情報ログをクラスタリングすることにより、前記滞留点を抽出する
請求項1記載の行動パタン解析装置。
利用者の測位位置及び測位時刻を含む情報である位置情報ログを、当該測位位置を表す数値情報および時刻により規定される多次元空間上にプロットする位置情報プロット手段を更に備える
請求項1または請求項3に記載の行動パタン解析装置。
前記位置情報プロット手段は、利用者の測位位置として緯度、経度および高度を示す値を含む位置情報ログを、緯度、経度、高度および時刻により規定される4次元空間上にプロットし、
前記滞留点クラスタ抽出手段は、前記4次元空間において緯度、経度および高度により規定される空間である緯度経度高度空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、
前記移動経路クラスタ抽出手段は、前記4次元空間において緯度、経度および高度により規定される空間である緯度経度高度空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記抽出された集合の位置情報ログに対して行なう
請求項4記載の行動パタン解析装置。
利用者の測位位置及び測位時刻を含む情報である位置情報ログに含まれる当該測位時刻順にソートされた隣接する2つの位置情報ログ間の差分値として、当該位置情報ログに含まれる前記測位時刻の時間差、および、前記測位位置間の距離を算出する移動ベクトル関数値算出手段と、
前記測位時刻の時間差及び測位位置間の距離に基づいて、前記位置情報ログの属性が、利用者が頻繁に滞留する位置である滞留点を示す滞留属性か、利用者の移動経路上の位置である非滞留点を示す非滞留属性かを判定する属性判定手段と、
前記位置情報ログを、前記測位位置を表す数値情報および時刻により規定される多次元空間上にプロットする位置情報プロット手段と、
前記多次元空間において前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、前記滞留点を抽出する滞留点クラスタ抽出手段と、
前記位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出手段とを備えた
ことを特徴とする行動パタン解析装置。
2つの位置情報ログに基づいて、当該各位置情報ログが示す測位位置からの進行方向と、2つ位置情報ログが示す測位位置間を結ぶ方向とがなす角度の値が小さいほど値が小さくなる係数である進行方向距離係数を、前記位置情報ログごとに算出する進行方向距離係数算出手段を備え、
移動経路クラスタ抽出手段は、位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、かつ、前記移動方向距離係数算出手段が算出した進行方向距離係数を前記ユークリッド距離に乗じることによる重み付けを行い、当該重み付けされた位置情報ログのうち非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する
請求項7記載の行動パタン解析装置。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態を図面を参照して説明する。以下の説明では、携帯端末に搭載されるGPSなどによるセンサ情報を利用して、位置情報および位置情報の取得時刻を記録するようなライフログサービスを想定する。
【0018】
実施形態1.
図1は、本発明による行動パタン解析装置の第1の実施形態の構成例を示すブロック図である。本実施形態における行動パタン解析装置は、位置情報ログ入力部10と、行動パタン解析基準入力部11と、行動パタン解析部20と、行動パタン記憶部30とを備えている。
【0019】
位置情報ログ入力部10は、GPS機能を搭載した携帯電話機などが取得した利用者の位置情報ログが入力されると、その位置情報ログを行動パタン解析部20に入力する。位置情報ログとは、緯度、経度、高度などの位置を取得した端末の位置を表す数値情報と、その数値情報(位置情報)を取得した日時を示す日時情報とを含む情報である。言い換えると、位置情報ログは、端末利用者の測位位置及び測位日時を含む情報である。また、位置情報ログは、位置情報を取得した端末の識別子や、その端末利用者の識別子(以下、利用者識別子と記す。)を含んでいてもよい。
図2は、位置情報ログの例を示す説明図である。
図2に例示する例では、位置情報ログが、利用者識別子、日時、緯度および経度を含んでいることを示す。
【0020】
行動パタン解析基準入力部11は、後述する行動パタン解析部20が位置情報ログをもとに行動パタンの解析を行う際の基準とする情報(以下、単に基準と記すこともある。)を行動パタン解析部20に入力する。具体的には、行動パタン解析基準入力部11は、「木曜日」、「全ての曜日」のような解析の対象とする曜日の基準(以下、曜日基準と記す。)や、「午前3時」のような解析の対象とする時刻の基準(以下、時刻基準と記す。)を行動パタン解析部20に入力する。すなわち、ここでの基準とは、解析の対象とする位置情報ログの日時情報を指定する情報である。
【0021】
行動パタン解析部20は、端末利用者が頻繁に滞留する位置(以下、滞留点と記す。)、及び、端末利用者が頻繁に行き来する経路(以下、移動経路と記す。)を、位置情報ログを解析することにより抽出する。以下、抽出されたこれらの情報をあわせて、行動パタンデータと記すこともある。
【0022】
行動パタン解析部20は、クラスタリング空間プロット部21と、滞留点クラスタ抽出部22と、滞留点位置情報ログ除去部23と、移動経路クラスタ抽出部24とを含む。
【0023】
クラスタリング空間プロット部21は、解析の対象とする位置情報ログをクラスタリング空間にプロットする。ここで、クラスタリング空間とは、緯度、経度、高度などの位置を表す数値に加え、時刻を表す時刻軸を追加した超空間を意味する。言い換えると、クラスタリング空間とは、位置情報および日時情報により規定される多次元の空間であり、少なくとも、緯度、経度および時刻により規定される3次元空間である。また、位置情報ログをクラスタリング空間にプロットするとは、位置情報ログをクラスタリング空間の座標で示すことを意味する。さらに、クラスタリング空間にプロットされた位置情報ログのことを、クラスタリング空間にプロットされたデータまたはクラスタリング空間データと記すこともある。
【0024】
図3は、クラスタリング空間の例を示す説明図である。
図3に例示するクラスタリング空間は、緯度軸、経度軸および時刻軸で規定される3次元空間であり、それぞれ、x軸、y軸およびz軸に対応する。なお、
図3の詳細については後述する。
【0025】
クラスタリング空間プロット部21は、行動パタン解析基準入力部11から入力された曜日基準及び時刻基準の値を保持する。そして、クラスタリング空間プロット部21は、保持している曜日基準や時刻基準の値、及び、位置情報ログ入力部10から入力された利用者の位置情報ログをもとに、クラスタリング空間に位置情報ログをプロットする。クラスタリング空間プロット部21は、例えば、行動パタンの解析を行う際の基準から所定の期間内に取得された位置情報ログを解析の対象とする。その後、クラスタリング空間プロット部21は、クラスタリング空間にプロットされたデータを滞留点クラスタ抽出部22に入力する。
【0026】
図4は、クラスタリング空間にプロットされた位置情報ログの例を示す説明図である。なお、説明を簡略化する為、
図4では、日付ごとに緯度−経度平面を分けたクラスタリング空間で位置情報ログをプロットし、その位置情報ログを積算した場合の例を示す。
【0027】
例えば、位置情報ログに9月1日水曜日から9月14日火曜日までの位置情報ログが存在し、曜日基準が「木曜日」、時刻基準が「午前3時」と設定されているとする。この場合、クラスタリング空間プロット部21は、9月2日木曜日午前3時から9月3日午前3時までの位置情報ログ、および、9月9日木曜日午前3時から9月10日午前3時までの位置情報ログを抽出する。そして、クラスタリング空間プロット部21は、抽出した位置情報ログの日付を除去し、午前3時から翌日午前3時までの時系列上に並ぶ時刻軸を緯度−経度平面に追加したクラスタリング空間に、その位置情報ログをプロットする(
図4(a)および(b)参照。)。そして、クラスタリング空間プロット部21は、これらの2日分の位置情報ログを積算したクラスタリング空間を生成する(
図4(c)参照。)。
【0028】
上記説明では、クラスタリング空間プロット部21が緯度および経度により規定される2次元の平面で日付ごとに位置情報ログをプロット後、それらの位置情報ログを積算する場合について説明した。他にも、クラスタリング空間プロット部21は、緯度、経度および時刻により規定される3次元のクラスタリング空間に直接位置情報ログをプロットしてもよい。また、位置情報ログの位置情報に緯度、経度および高度が含まれている場合、クラスタリング空間プロット部21は、緯度、経度、高度および時刻により規定される4次元のクラスタリング空間に位置情報ログをプロットしてもよい。
【0029】
滞留点クラスタ抽出部22は、クラスタリング空間データのクラスタリングを行い、端末利用者が頻繁に滞留している位置(すなわち、滞留点)を抽出する。具体的には、滞留点クラスタ抽出部22は、緯度、経度および時刻の3変数からなる空間上のユークリッド距離が近い位置情報ログの集合を、EM(Expectation Maximization)アルゴリズムや階層型クラスタリングなど、汎用のクラスタリング手法を用いて生成することにより、滞留点を抽出する。以下、抽出された滞留点のことを滞留点パタンデータと記すこともある。
【0030】
ただし、滞留点クラスタ抽出部22がクラスタリングを行う空間は、緯度、経度および時刻の3変数により規定される空間に限定されない。クラスタリングを行う空間は、4変数以上により規定される空間であってもよい。例えば、位置情報ログに高度を示す情報が含まれている場合、滞留点クラスタ抽出部22は、緯度、経度、高度および時刻の4変数により規定される空間上の位置情報ログについてクラスタリングを行ってもよい。なお、以下の説明では、緯度、経度および時刻の3変数により規定される空間上に位置情報ログがプロットされている場合について具体的に説明する。
【0031】
ここで位置情報ログが示す座標における緯度をX
i、経度をY
i、時刻をZ
iとすると、ある2点間のユークリッド距離の2乗の値は、(X
1−X
2)
2+(Y
1−Y
2)
2+(Z
1−Z
2)
2で定義される。しかし、緯度Xおよび経度Yに対し、時刻Zは単位系が異なる。そのため、空間上の時刻に対して場所(緯度−経度)に強く関連する距離関数の定義が必要となる。そこで、(Z
1−Z
2)
2の値に対し、予め定めた重み値k
1を乗じた距離関数を定義する。すなわち、この関数は、(X
1−X
2)
2+(Y
1−Y
2)
2+k
1(Z
1−Z
2)
2と定義される。
【0032】
重み値k
1は、緯度−経度平面上に存在する点同士の距離と、緯度−経度平面上に存在する点と時刻軸方向に存在する点との間の距離とで、その距離に差をつける重み値であると言える。k
1の値を小さくすると、位置情報ログ同士を比較した場合、距離の差よりも時間の差が、より小さくなる。そのため、k
1の値を小さくすることにより、緯度−経度平面に対する時刻軸のユークリッド距離が近いと判定されやすくなるため、位置情報ログにおいて、場所(すなわち、緯度および経度から定まる位置)の近いログ同士が同一の集合になりやすいクラスタを生成することができる。
【0033】
この重み値k
1には、サービスの利用者が意図した滞留点の大きさになるように予めチューニングされた結果が指定される。例えば、時刻Zが時(hour)単位である場合、日本国内において半径1km程度の滞留点を抽出したい場合には、重み値k
1を1/1200程度に設定することが望ましい。
【0034】
このように、滞留点クラスタ抽出部22は、クラスタリング空間プロット部21からクラスタリング空間にプロットされたデータを受け取ると、予め設定されている重み値をクラスタリング空間にプロットされたデータにおける緯度及び経度に対してそれぞれ乗じる。重み値は、緯度−経度平面に対し、時刻軸のユークリッド距離が近いと判定されやすくなる値であれば、どのような値でもよい。
【0035】
なお、位置情報ログに高度を示す情報が含まれている場合、位置情報ログが示す座標における緯度をX
i、経度をY
i、時刻をZ
i、高度をW
iとすると、距離関数を、(X
1−X
2)
2+(Y
1−Y
2)
2+(W
1−W
2)
2+k
1(Z
1−Z
2)
2と定義すればよい。
【0036】
次に、滞留点クラスタ抽出部22は、重み値を乗じたクラスタリング空間データを用いて滞留点の抽出を行うため、このクラスタリング空間データを対象にクラスタリングの演算を行う。クラスタリングの演算は、一般に知られているどのクラスタリング手法を用いて行ってもよい。ここでは、セントロイド法を用いてクラスタリングの演算を行う場合を例に説明する。
【0037】
まず、滞留点クラスタ抽出部22は、クラスタリング空間にプロットされた全データをそれぞれ初期クラスタとし、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。この際、滞留点クラスタ抽出部22は、元のクラスタに含まれる値から重心の値を求めることにより、求めた値を統合されたクラスタの新たなデータ値とする。なお、滞留点クラスタ抽出部22は、統合されたクラスタを形成するクラスタリング空間データの個数も保持する。
【0038】
滞留点クラスタ抽出部22は、ユークリッド距離が予め設定された閾値(以下、第一ユークリッド距離閾値と記す。)を超えない範囲で以上の演算を繰り返し行う。第一ユークリッド距離閾値には、重み値と同程度の値(ここでは、1/1200程度)を設定することが望ましい。
【0039】
滞留点クラスタ抽出部22は、ここまでの演算で求めたクラスタリング空間データ数が、予め設定された閾値(以下、第一クラスタ個数閾値と記す。)を超えたクラスタを滞留点と判断する。この第一クラスタ個数閾値には、試験等により適切な値が設定される。言い換えると、この第一クラスタ個数閾値を超える数の位置情報が測位された位置は、利用者が頻繁に滞留する位置ということができる。
【0040】
例えば、
図4(c)に例示するクラスタリング空間データの場合、滞留点クラスタ抽出部22は、クラスタ301a,301bを滞留点と判断する。そして、滞留点クラスタ抽出部22は、そのクラスタ中のデータで最も早い時刻と最も遅い時刻、及び、そのクラスタ中のデータにおける位置情報(緯度及び経度)の重心の値を、滞留点を識別する識別子(以下、滞留点識別子と記す。)とともに、滞留点パタン保存部31に記憶させる。
【0041】
滞留点位置情報ログ除去部23は、クラスタリング空間プロット部21から渡されたデータのうち、滞留点クラスタ抽出部22が滞留点と判断しなかった位置情報ログを抽出する。以下、この位置情報ログの集合のことを、非滞留点と記す。
【0042】
移動経路クラスタ抽出部24は、クラスタリング空間データのクラスタリングを行い、端末利用者が頻繁に移動を行っている時間帯及び移動経路を抽出する。以下、抽出された移動経路を、移動経路パタンデータと記すこともある。
【0043】
具体的には、移動経路クラスタ抽出部24は、緯度、経度および時刻の3変数からなる空間上のユークリッド距離が近い位置情報ログの集合を、汎用のクラスタリング手法を用いて生成することにより、移動経路を抽出する。なお、滞留点クラスタ抽出部22での説明と同様、移動経路クラスタ抽出部24がクラスタリングを行う空間は、緯度、経度および時刻の3変数により規定される空間に限定されず、4変数以上により規定される空間であってもよい。
【0044】
滞留点クラスタ抽出部22での説明と同様に、緯度、経度および時刻の3変数に対する距離関数は、(X
1−X
2)
2+(Y
1−Y
2)
2+k
2(Z
1−Z
2)
2と定義され、緯度、経度、高度および時刻の4変数に対する距離関数は、(X
1−X
2)
2+(Y
1−Y
2)
2+(W
1−W
2)
2+k
2(Z
1−Z
2)
2と定義される。ここで、k
2の値を大きくすることにより、緯度−経度平面に対する時刻軸のユークリッド距離が遠いと判定されやすくなるため、位置情報ログにおいて、場所(すなわち、緯度および経度から定まる位置)よりも、時刻の近いログ同士が同一の集合になりやすいクラスタを生成することができる。
【0045】
ここでの重み値k
2も、サービスの利用者が意図した滞留点の大きさになるように予めチューニングされた結果が指定される。なお、滞留点をクラスタリングする際の重み値k
1と、移動経路を算出する際の重み値k
2との間には、k
1<k
2の関係が成り立つ。この重み値k
2にも、サービスの利用者が意図した滞留点の大きさになるように予めチューニングされた結果が指定される。例えば、時刻Zが時(hour)単位である場合、重み値には、k
2=1と設定すればよい。
【0046】
具体的には、移動経路クラスタ抽出部24は、まず、滞留点位置情報ログ除去部23からクラスタリング空間にプロットされたデータのうち滞留点と判断されなかったクラスタリング空間データを受け取る。そして、移動経路クラスタ抽出部24は、予め設定されている重み値を、クラスタリング空間にプロットされたデータの緯度及び経度に対してそれぞれ乗じる。重み値は、緯度−経度平面に対し、時刻軸のユークリッド距離が遠いと判定されやすくなる値であれば、どのような値でもよい。
【0047】
次に、移動経路クラスタ抽出部24は、重み値を乗じたクラスタリング空間データを用いて移動経路を示す場所の抽出を行うため、このクラスタリング空間データを対象にクラスタリングの演算を行う。クラスタリングの演算は、一般に知られているどのクラスタリング手法を用いて行ってもよい。ここでは、セントロイド法を用いてクラスタリングの演算を行う場合を例に説明する。
【0048】
まず、移動経路クラスタ抽出部24は、滞留点位置情報ログ除去部23から受け取ったクラスタリング空間データをそれぞれ初期クラスタとし、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。この際、移動経路クラスタ抽出部24は、元のクラスタに含まれる値から重心の値を求めることにより、求めた値を統合されたクラスタの新たなデータ値とする。なお、移動経路クラスタ抽出部24は、統合されたクラスタを形成するクラスタリング空間データの個数も保持する。
【0049】
移動経路クラスタ抽出部24は、ユークリッド距離が予め設定された閾値(以下、第二ユークリッド距離閾値と記す。)を超えない範囲で以上の演算を繰り返し行う。なお、第二ユークリッド距離閾値には、重み値と同程度の値を設定すればよい。
【0050】
移動経路クラスタ抽出部24は、ここまでの演算で求めたクラスタリング空間データ数が、予め設定された閾値(以下、第二クラスタ個数閾値と記す。)を超えたクラスタを移動経路と判断する。この第二クラスタ個数閾値にも、試験等により適切な値が設定される。例えば、
図4(c)に例示するクラスタリング空間データの場合、移動経路クラスタ抽出部24は、クラスタ302を移動経路と判断する。
【0051】
そして、移動経路クラスタ抽出部24は、そのクラスタ中のデータで最も早い時刻と最も遅い時刻を抽出する。さらに、移動経路クラスタ抽出部24は、そのクラスタに含まれるクラスタリング空間データ(すなわち、クラスタの重心の値)と滞留点パタン保存部31が記憶する全滞留点の位置情報(すなわち、滞留点における緯度及び経度の重心の値)との2点間のユークリッド距離が1番短い滞留点と2番目に短い滞留点を移動経路の始終点と決定する。そして、移動経路クラスタ抽出部24は、抽出した時刻および始終点と決定した滞留点とを、移動経路を識別する識別子(以下、移動経路識別子と記す。)とともに、移動経路パタン保存部32に記憶させる。以下、ユークリッド距離が1番短い滞留点および2番目に短い滞留点をそれぞれ識別する情報を、第1近接滞留点識別子および第2近接滞留点識別子と記す。
【0052】
なお、
図3に例示するクラスタリング空間では、クラスタ101a,101b,101cが滞留点と判断されたクラスタを示し、クラスタ102a,102bが移動経路と判断されたクラスタを示す。
【0053】
行動パタン解析部20(より具体的には、クラスタリング空間プロット部21と、滞留点クラスタ抽出部22と、滞留点位置情報ログ除去部23と、移動経路クラスタ抽出部24)は、プログラム(行動パタン解析プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、行動パタン解析装置の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、行動パタン解析部20(より具体的には、クラスタリング空間プロット部21、滞留点クラスタ抽出部22、滞留点位置情報ログ除去部23、および、移動経路クラスタ抽出部24)として動作してもよい。また、クラスタリング空間プロット部21と、滞留点クラスタ抽出部22と、滞留点位置情報ログ除去部23と、移動経路クラスタ抽出部24とは、それぞれが専用のハードウェアで実現されていてもよい。
【0054】
行動パタン記憶部30は、行動パタン解析部20が解析した行動パタンデータをデータベースとして記憶する。行動パタン記憶部30は、滞留点パタン保存部31と、移動経路パタン保存部32とを含む。
【0055】
滞留点パタン保存部31は、滞留点クラスタ抽出部22が抽出した滞留点パタンデータをデータベースとして記憶する。
図5は、滞留点パタンデータの例を示す説明図である。
図5に例示するように、滞留点パタン保存部31は、利用者識別子、滞留点識別子、滞留開始時刻、滞留終了時刻、緯度および経度を滞留点パタンデータとして記憶する。なお、位置情報ログに高度を示す情報が含まれている場合、滞留点パタン保存部31は、高度が追加された滞留点パタンデータを記憶する。
【0056】
移動経路パタン保存部32は、移動経路クラスタ抽出部24が抽出した移動経路パタンデータをデータベースとして記憶する。
図6は、移動経路パタンデータの例を示す説明図である。
図6に例示するように、移動経路パタン保存部32は、利用者識別子、移動経路識別子、移動開始時刻、移動終了時刻、第1近接滞留点識別子および第2近接滞留点識別子を移動経路パタンデータとして記憶する。
【0057】
行動パタン記憶部30(より具体的には、滞留点パタン保存部31と移動経路パタン保存部32)は、例えば、磁気ディスク等により実現される。
【0058】
次に、本実施形態の行動パタン解析装置の動作を説明する。
図7および
図8は、行動パタン解析装置の動作例を示すフローチャートである。また、
図9は、基準曜日及び基準時刻を設定する動作の例を示すフローチャートである。
【0059】
まず、位置情報ログ入力部10は、位置情報ログが入力されると、その位置情報ログをクラスタリング空間プロット部21に入力する(
図7におけるステップA1)。次に、クラスタリング空間プロット部21は、位置情報ログを受け取ると、既に設定されている基準曜日及び基準時刻をもとに、位置情報ログをクラスタリング空間にプロットし、クラスタリング空間にプロットしたデータを滞留点クラスタ抽出部22に入力する(ステップA2)。なお、基準曜日及び基準時刻の設定方法については後述する。
【0060】
次に、滞留点クラスタ抽出部22は、クラスタリング空間にプロットされたデータをクラスタリング空間プロット部21から受け取ると、予め設定されている重み値を、クラスタリング空間にプロットされたデータの緯度及び経度に対してそれぞれ乗じる(ステップA3)。なお、滞留点クラスタ抽出部22は、予め設定されている重み値を、時刻に対して乗じてもよい。
【0061】
次に、滞留点クラスタ抽出部22は、クラスタリング空間にプロットされ、重み値を乗じた全データを初期クラスタとする(ステップA4)。そして、滞留点クラスタ抽出部22は、全クラスタの中から選び出した2点間のユークリッド距離が設定した第一ユークリッド距離閾値を超えているか否を判定する(ステップA5)。2点間のユークリッド距離が第一ユークリッド距離閾値を超えていない場合(ステップA5におけるNo)にはステップA6へ進み、超えている場合(ステップA5におけるYes)にはステップA7へ進む。
【0062】
2点間のユークリッド距離が第一ユークリッド距離閾値を超えていない場合、滞留点クラスタ抽出部22は、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。この際、滞留点クラスタ抽出部22は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、滞留点クラスタ抽出部22は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、滞留点クラスタ抽出部22は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく(ステップA6)。ステップA6の処理後、ステップA5以降の処理を行う。
【0063】
一方、2点間のユークリッド距離が第一ユークリッド距離閾値を超えている場合、滞留点クラスタ抽出部22は、設定された第一クラスタ個数閾値を越えた個数のクラスタリング空間データを含むクラスタを滞留点と判断する。次に、滞留点クラスタ抽出部22は、そのクラスタ中のデータのうち最も早い時刻を滞留開始時刻、最も遅い時刻を滞留終了時刻とする。そして、滞留点クラスタ抽出部22は、滞留開始時刻、滞留終了時刻、および、そのクラスタ中のデータにおける位置情報(緯度及び経度)の重心の値を、滞留点パタン保存部31に記憶させる(ステップA7)。
【0064】
次に、滞留点クラスタ抽出部22は、ステップA2で受け取ったクラスタリング空間にプロットされたデータ、及び、ステップA7で決定された滞留点パタンデータを滞留点位置情報ログ除去部23に入力する(ステップA8)。
【0065】
滞留点位置情報ログ除去部23は、滞留点クラスタ抽出部22からクラスタリング空間にプロットされたデータ及び滞留点パタンデータを受け取ると、そのクラスタリング空間にプロットされたデータから、滞留点パタンデータに含まれる滞留点と判断されたデータを差し引く。そして、滞留点位置情報ログ除去部23は、クラスタリング空間にプロットされたデータのうち、差し引かれた残りのデータを移動経路クラスタ抽出部24に入力する(
図8におけるステップA9)。
【0066】
次に、移動経路クラスタ抽出部24は、クラスタリング空間にプロットされたデータであって、滞留点と判断された位置情報ログが除去されたデータを滞留点位置情報ログ除去部23から受け取ると、予め設定されている重み値を、受け取ったデータの緯度および経度に対してそれぞれ乗じる(ステップA10)。なお、移動経路クラスタ抽出部24は、予め設定されている重み値を、時刻に対して乗じてもよい。
【0067】
次に、移動経路クラスタ抽出部24は、クラスタリング空間にプロットされ、ステップA10において重み値を乗じた全データを初期クラスタとする(ステップA11)。そして、移動経路クラスタ抽出部24は、全クラスタの中から選び出した2点間のユークリッド距離が設定した第二ユークリッド距離閾値を超えているか否を判定する(ステップA12)。2点間のユークリッド距離が第二ユークリッド距離閾値を超えていない場合(ステップA12におけるNo)にはステップA13へ進み、超えている場合(ステップA12におけるYes)にはステップA14へ進む。
【0068】
2点間のユークリッド距離が第二ユークリッド距離閾値を超えていない場合、移動経路クラスタ抽出部24は、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。この際、移動経路クラスタ抽出部24は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、移動経路クラスタ抽出部24は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、移動経路クラスタ抽出部24は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく(ステップA13)。ステップA13の処理後、ステップA12以降の処理を行う。
【0069】
一方、2点間のユークリッド距離が第二ユークリッド距離閾値を超えている場合、移動経路クラスタ抽出部24は、設定された第二クラスタ個数閾値を超えた個数のクラスタリング空間データを含むクラスタを移動経路と判断する。次に、移動経路クラスタ抽出部24は、そのクラスタ中のデータのうち最も早い時刻を移動開始時刻、最も遅い時刻を移動終了時刻とする。さらに、移動経路クラスタ抽出部24は、そのクラスタの位置情報(緯度及び経度)と、ステップA9で受け取った滞留点パタンデータに含まれる滞留点の位置情報(緯度及び経度)とを比較する。そして、移動経路クラスタ抽出部24は、そのクラスタの位置とのユークリッド距離が1番短い滞留点と2番目に短い滞留点を、それぞれ第1近接滞留点識別子、第2近接滞留点識別子と決定する。そして、移動経路クラスタ抽出部24は、移動開始時刻、移動終了時刻、第1近接滞留点識別子および第2近接滞留点識別子を、移動経路パタン保存部32に記憶させる(ステップA14)。
【0070】
次に、基準曜日及び基準時刻を設定する動作を説明する。まず、行動パタン解析基準入力部11は、例えば、利用者によって基準曜日及び基準時刻の値が入力されると、入力された基準曜日及び基準時刻の値をクラスタリング空間プロット部21に入力する(
図9におけるステップB1)。次に、クラスタリング空間データプロット部21は、行動パタン解析基準入力部11から基準曜日及び基準時刻の値を受け取ると、クラスタリング空間データプロット部21内部に基準曜日の値および基準時刻の値を保持する(ステップB2)。
【0071】
以上のように、本実施形態によれば、クラスタリング空間プロット部21が、少なくとも緯度、経度および時刻により規定される3次元空間上に位置情報ログをプロットする。そして、滞留点クラスタ抽出部22が、緯度−経度平面に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを位置情報ログに対して行い、その位置情報ログをクラスタリングすることにより滞留点を抽出する。また、滞留点位置情報ログ除去部23が、空間上にプロットされた位置情報ログから滞留点として抽出された位置情報ログを除いた非滞留点を抽出する。そして、移動経路クラスタ抽出部24が、緯度−経度平面に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを非滞留点の位置情報ログに対して行い、その位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する。このような構成により、位置情報の測位間隔が長く、また、位置情報の測位が不定期である場合にも、利用者の行動パタンを精度良く解析できる。
【0072】
例えば、
図3(a)および
図3(b)に例示するように、1日分の位置情報ログでは、1レコードが指し示す場所が利用者にとってどのような場所であるか判断することは困難である。しかし、
図3(a)および
図3(b)に例示する位置情報ログを、
図3(c)に例示する1つのクラスタリング空間上にプロットすることで、レコードが多く滞留する地点、及び、その滞留点間の移動経路上にレコードが連なることを確認できる。そのため、測位していない時刻の大まかな位置情報を補間することが可能になる。
【0073】
実施形態2.
次に、本発明による行動パタン解析装置の第2の実施形態を説明する。本実施形態では、位置情報ログが大量に存在する場合に、滞留点クラスタと移動経路クラスタの判別精度を上げる手法を説明する。
図10は、本発明による行動パタン解析装置の第2の実施形態の構成例を示すブロック図である。本実施形態における行動パタン解析装置は、位置情報ログ入力部10と、行動パタン解析基準入力部11と、行動パタン解析部50と、行動パタン記憶部30と、移動ベクトル演算解析部40とを備えている。
【0074】
行動パタン解析基準入力部11および行動パタン記憶部30の内容は、第1の実施形態と同様のため、説明を省略する。
【0075】
位置情報ログ入力部10は、[緯度,経度,時刻]を1レコードとする位置情報ログを受け取ると、その位置情報ログを移動ベクトル関数値演算部41に入力する。なお、時刻は、測位日時ということができ、緯度および経度は、測位場所ということができる。
【0076】
移動ベクトル演算解析部40は、移動ベクトル関数値演算部41と、滞留・移動経路属性判定部42とを含む。移動ベクトル関数値演算部41は、入力された位置情報ログのレコードを、位置情報ログに含まれる時刻の時系列順にソートする。そして、移動ベクトル関数値演算部41は、時系列順にソートされたレコードの前後の差分値をベクトル関数値として演算する。なお、以下の説明では、ベクトル関数値のことを移動ベクトル関数値と記すこともある。また、レコードの前後とは、位置情報ログのレコードをソートした時に、隣り合う2つのレコードを意味する。また、差分値には、位置情報ログに含まれる測位日時の時間差、および、測位場所間の距離が含まれる。さらに、差分値には、測位場所間での進行方向を表す進行方向角度が含まれていてもよい。
【0077】
ベクトル関数値は、(t
1,t
2,r,θ)と定義することができる。t
1は、レコードが記録された時刻を示す。t
2は、そのレコードが記録された時刻から次のレコードが記録された時刻まで差分(測位日時の時間差)を示す。rは、そのレコードが記録された位置から次のレコードが記録された位置までの距離(測位場所間の距離)を示す。θは、そのレコードが記録された位置から次のレコードが記録された位置への進行方向を表す進行方向角度を示す。
【0078】
ここで、位置情報ログが示す座標における緯度をX
i、経度をY
iとし、比較する2点の座標を、それぞれ(X
1,Y
1)、(X
2,Y
2)とする。このとき、移動ベクトル関数値演算部41は、次のレコードが記録された位置までの距離を、r=((X
2−X
1)
2+(Y
2−Y
1)
2)
1/2で算出する。また、移動ベクトル関数値演算部41は、進行方向角度を、θ=arg((Y
2−Y
1)/(X
2−X
1))で算出する。そして、移動ベクトル関数値演算部41は、これらの演算により得られた全レコードのベクトル関数値を滞留・移動経路属性判定部42に入力する。
【0079】
図11は、移動ベクトル関数値の例を示す説明図である。
図11に示す例では、時系列順に8:30、9:00、9:15、9:30、10:30および11:30に記録された位置情報ログが存在することを示す。このとき、移動ベクトル関数値演算部41は、11:30に記録された位置情報ログのベクトル関数値を(9,0.25,10,315°)と算出する。ここで、時刻および時刻の差分の単位は「時」である。また、移動ベクトル関数値演算部41は、r及びθの値を、上述する式に基づいて算出すればよい。なお、11:30に記録された位置情報ログは、次に記録されたレコードが存在しないため、11:30に記録された位置情報ログについてのベクトル関数値は算出されていない。
【0080】
滞留・移動経路属性判定部42は、移動ベクトル関数値演算部41から全レコードのベクトル関数値を受け取ると、その各レコードが滞留を表すレコードか、移動経路を表すレコードか、または、滞留と移動経路のどちらを表すレコードか判定が不能であるレコードかを判別する。なお、滞留を表すレコードとは、滞留点に含まれるレコードのことを意味し、移動経路を表すレコードとは、非滞留点に含まれるレコードを意味する。以下、滞留を表すレコードの属性を滞留属性と示す。また、移動経路を表すレコードの属性を移動属性と示す。
【0081】
具体的には、滞留・移動経路属性判定部42は、移動ベクトル関数値演算部41から受け取ったベクトル関数値を示す各レコードの属性を、予め設定された滞留点許容距離Rおよび有効レコード閾時間Tを用いて判定する。
【0082】
滞留・移動経路属性判定部42は、レコードの移動ベクトル関数値に含まれるt
2(すなわち、次のレコードが記録された時刻まで差分)の値が有効レコード閾時間Tよりも大きい場合、そのレコードの属性を判定不能とする。一方、レコードの移動ベクトル関数値に含まれるt
2値が有効レコード閾時間Tよりも小さい場合、滞留・移動経路属性判定部42は、さらに、移動ベクトル関数値に含まれるrの値と滞留点許容距離Rの値とを比較する。
【0083】
移動ベクトル関数値に含まれるrの値が滞留点許容距離Rの値よりも小さい場合、滞留・移動経路属性判定部42は、対象のレコードを滞留属性を持つレコードと判定する。一方、rの値が滞留点許容距離Rの値よりも大きい場合、滞留・移動経路属性判定部42は、対象のレコードを移動経路属性を持つレコードと判定する。そして、滞留・移動経路属性判定部42は、滞留属性か移動属性かを判定したレコードをクラスタリング空間プロット部21に入力する。
【0084】
行動パタン解析部50は、クラスタリング空間プロット部21と、滞留点クラスタ抽出部22と、移動経路クラスタ抽出部24とを含む。すなわち、本実施形態における行動パタン解析部50は、滞留点位置情報ログ除去部23を含んでいない点において第1の実施形態における行動パタン解析部20と異なる。
【0085】
クラスタリング空間プロット部21は、第1の実施形態と同様、解析の対象とする位置情報ログをクラスタリング空間にプロットする。具体的には、まず、クラスタリング空間プロット部21は、予め設定された時刻(すなわち、時刻基準)を日付の切れ目とし、設定された曜日(すなわち、曜日基準)の位置情報ログを抽出する。なお、時刻基準および曜日基準に基づいて位置情報ログを抽出する方法は、第1の実施形態で示す方法と同様である。
【0086】
なお、クラスタリング空間プロット部21には、位置情報ログ入力部10から直接位置情報ログが入力されてもよい。また、滞留・移動経路属性判定部42が、移動ベクトル演算解析部40に入力された位置情報ログをクラスタリング空間プロット部21に入力するようにしてもよい。
【0087】
そして、本実施形態では、クラスタリング空間プロット部21は、緯度、経度および時刻を含む位置情報ログに、滞留・移動経路属性判定部42から受信した進行方向角度を加えたレコードをクラスタリング空間にプロットする。なお、この進行方向角度は、位置情報ログに含まれる時刻に対応する値である。すなわち、クラスタリング空間プロット部21は、[緯度,経度,時刻,進行方向角度]を含むレコードを4次元のクラスタリング空間にプロットする。なお、クラスタリング空間プロット部21がクラスタリング空間に上記レコードをプロットする方法は、第1の実施形態と同様である。そして、クラスタリング空間プロット部21は、プロットしたデータを滞留点クラスタ抽出部22に入力する。
【0088】
滞留点クラスタ抽出部22は、第1の実施形態と同様、クラスタリング空間データのクラスタリングを行い、滞留点を抽出する。ただし、本実施形態では、滞留点クラスタ抽出部22は、クラスタリング空間プロット部21からクラスタリング空間にプロットされたデータを受け取ると、滞留・移動経路属性判定部42で滞留属性と判定されたレコードのみを対象としてクラスタリングを行う。
【0089】
滞留点クラスタ抽出部22は、クラスタリング空間にプロットされたデータの緯度及び経度を示す値に対して、予め設定された重み値をそれぞれ乗じる。ここで、クラスタリング空間にプロットされ、予め設定された重み値が乗じられた全データのうち、滞留属性と判定されたデータを初期クラスタとする。
【0090】
次に、滞留点クラスタ抽出部22は、上記クラスタの中から選び出した2点間のユークリッド距離が、予め設定されたユークリッド距離閾値を超えていないか否かを判断する。ユークリッド距離がユークリッド距離閾値を超えていない場合、滞留点クラスタ抽出部22は、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。
【0091】
この際、滞留点クラスタ抽出部22は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、滞留点クラスタ抽出部22は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、滞留点クラスタ抽出部22は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく。
【0092】
一方、2点間のユークリッド距離がユークリッド距離閾値を超えていた場合、滞留点クラスタ抽出部22は、設定されたクラスタ個数閾値を越えた個数のクラスタリング空間データを含むクラスタを滞留点と判断する。そして、滞留点クラスタ抽出部22は、そのクラスタ中のデータのうち最も早い時刻を滞留開始時刻、最も遅い時刻を滞留終了時刻とする。そして、滞留点クラスタ抽出部22は、滞留開始時刻、滞留終了時刻、および、そのクラスタ中のデータにおける緯度及び経度の重心の値を、滞留点パタン保存部31に記憶させる。
【0093】
滞留点クラスタ抽出部22は、クラスタリング空間プロット部21から受け取ったデータを移動経路クラスタ抽出部24に入力する。
【0094】
すなわち、本実施形態における滞留点クラスタ抽出部22がクラスタリングを行う方法は、第1の実施形態と同様である。ただし、本実施形態では、滞留点クラスタ抽出部22が滞留属性と判定されたレコードのみを対象としてクラスタリングを行う点において、第1の実施形態と異なる。
【0095】
移動経路クラスタ抽出部24は、第1の実施形態と同様、クラスタリング空間データのクラスタリングを行い、端末利用者が頻繁に移動を行っている時間帯及び移動経路を抽出する。ただし、移動属性と判定されたデータを初期クラスタとして処理を行う点において第1の実施形態と異なる。
【0096】
また、第1の実施形態では、滞留点位置情報ログ除去部23が、クラスタリング空間にプロットされたデータから、滞留点パタンデータに含まれる滞留点と判断されたデータを差し引いた。そして、滞留点位置情報ログ除去部23が、クラスタリング空間にプロットされたデータのうち、差し引かれた残りのデータを移動経路クラスタ抽出部24に入力した。一方、本実施形態では、滞留・移動経路属性判定部42によって滞留か移動経路かの属性が判定されたレコードがクラスタリング空間プロット部21に入力される。そのため、滞留点位置情報ログ除去部23によって滞留点と判断されたデータがクラスタリング空間にプロットされたデータから差し引かれなくても、移動経路クラスタ抽出部24は、移動属性と判定されたデータを識別することが可能になる。
【0097】
すなわち、第1の実施形態における滞留点位置情報ログ除去部23も、本実施形態における移動ベクトル演算部40(より詳しくは、移動ベクトル関数値演算部41と、滞留・移動経路属性判定部42)も、非滞留点を抽出する機能を有する。さらに、本実施形態における移動ベクトル演算部40では、データの絞り込みが行われるため、第1の実施形態における効果に加え、位置情報ログが大量になった場合でも、滞留点クラスタと移動経路クラスタの判別精度を上げることができる。
【0098】
まず、移動経路クラスタ抽出部24は、滞留点クラスタ抽出部22からデータを受け取ると、予め設定されている重み値を、受け取ったデータの緯度および経度に対してそれぞれ乗じる。
【0099】
本実施形態では、移動経路の進行方向について考慮する。そこで、距離関数は、緯度、経度、時刻および進行方向角度の4変数を用いて以下の式1のように定義される。なお、以下に定義される距離関数において、緯度及び経度を基準として、時刻と進行方向角度に対して、k
2,k
3がそれぞれ定められる。
【0100】
(X
1−X
2)
2+(Y
1−Y
2)
2+k
2(Z
1−Z
2)
2+k
3(|θ
1−θ
2|)
2
但し|θ
1−θ
2|<180°
(X
1−X
2)
2+(Y
1−Y
2)
2+k
2(Z
1−Z
2)
2+k
3(|θ
1−θ
2|−180)
2
但し|θ
1−θ
2|>180° ・・・(式1)
【0101】
ここで、定義された重み値k
2、k
3が乗じられた全データのうち、移動属性と判定されたデータを初期クラスタとする。移動経路クラスタ抽出部24は、上記クラスタの中から選び出した2点間のユークリッド距離が設定したユークリッド距離閾値を超えていないか否かを判定する。ユークリッド距離が閾値を超えていない場合、移動経路クラスタ抽出部24は、上記クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。
【0102】
この際、移動経路クラスタ抽出部24は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、移動経路クラスタ抽出部24は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、移動経路クラスタ抽出部24は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく。
【0103】
一方、2点間のユークリッド距離がユークリッド距離閾値を超えている場合、移動経路クラスタ抽出部24は、設定されたクラスタ個数閾値を超えた個数のクラスタリング空間データを含むクラスタを移動経路と判断する。そして、移動経路クラスタ抽出部24は、そのクラスタ中のデータのうち最も早い時刻を移動開始時刻、最も遅い時刻を移動終了時刻とする。
【0104】
さらに、移動経路クラスタ抽出部24は、そのクラスタの位置情報(緯度及び経度)と、滞留点クラスタ抽出部22から受け取った滞留点パタンデータに含まれる滞留点の位置情報(緯度及び経度)とを比較する。そして、移動経路クラスタ抽出部24は、そのクラスタの位置とのユークリッド距離が1番短い滞留点と2番目に短い滞留点を、それぞれ第1近接滞留点識別子、第2近接滞留点識別子と決定する。そして、移動経路クラスタ抽出部24は、移動開始時刻、移動終了時刻、第1近接滞留点識別子および第2近接滞留点識別子を、移動経路パタン保存部32に記憶させる。
【0105】
すなわち、本実施形態では、移動経路クラスタ抽出部24が進行方向角度の差分を考慮してクラスタリングを行う点において、第1の実施形態における移動経路クラスタ抽出部24と異なる。それ以外については、第1の実施形態と同様である。なお、移動経路の進行方向について考慮しない場合、移動経路クラスタ抽出部24は、第1の実施形態と同様に、利用者の測位位置及び測位日時をもとにクラスタリングを行えばよい。
【0106】
以上のように、本実施形態によれば、移動ベクトル関数値演算部41が位置情報ログに含まれる測位日時順にソートされた隣接する2つの位置情報ログ間の差分値(移動ベクトル関数値)として、その位置情報ログに含まれる測位日時の時間差、測位場所間の距離、および、測位場所間での進行方向を表す進行方向角度を算出する。また、滞留・移動経路属性判定部42が、測位日時の時間差及び測位場所間の距離に基づいて、位置情報ログの属性が滞留属性を有するか否かを判定する。そして、滞留点クラスタ抽出部22が、滞留属性を有すると判定された位置情報ログをクラスタリングすることにより滞留点を抽出する。
【0107】
また、本実施形態によれば、滞留・移動経路属性判定部42が、測位日時の時間差及び測位場所間の距離に基づいて、位置情報ログの属性が移動属性を有するか否かを判定する。また、クラスタリング空間プロット部21が、利用者の測位位置及び測位日時を含む位置情報ログに進行方向角度を加えたレコードを、少なくとも緯度、経度、時刻および進行方向角度により規定される4次元空間上にプロットする。そして、移動経路クラスタ抽出部24が、移動経路属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する。
【0108】
以上のような構成により、第1の実施形態における効果に加え、位置情報ログが大量になった場合でも、滞留点クラスタと移動経路クラスタの判別精度を上げることができる。
【0109】
すなわち、本実施形態では、滞留と移動経路のどちらを表すレコードか判定が不能であるレコード(すなわち、滞留属性でも移動属性でもないレコード)は、クラスタリングの対象から除外される。このようにして、クラスタリングの対象とするレコードを削減することで、クラスタリングの精度を上げることができる。
【0110】
実施形態3.
次に、本発明による行動パタン解析装置の第3の実施形態を説明する。本実施形態では、各移動経路クラスタの分類精度を上げる方法を説明する。
図12は、位置情報ログの集合例を示す説明図である。
図12では、点線の矢印が位置情報ログに含まれる進行方向を示している。また、
図12に示す例では、破線で囲まれた位置情報ログ群401に含まれる位置情報ログ401aと、位置情報ログ401bは、進行方向が同じであるが別の経路を利用していることを示す。また、
図12に示す例では、破線で囲まれた位置情報ログ群402に含まれる位置情報ログ402aと、位置情報ログ402bは、同一移動経路上で大きく進行方向が変化していることを示す。本実施形態では、位置情報ログ群401に含まれる別経路を別の移動経路クラスタとして分類し、位置情報ログ群401に含まれる同一移動経路を同一の移動経路クラスタとして分類する精度を向上させる処理について説明する。
【0111】
図13は、本発明による行動パタン解析装置の第3の実施形態の構成例を示すブロック図である。本実施形態における行動パタン解析装置は、位置情報ログ入力部10と、行動パタン解析基準入力部11と、行動パタン解析部60と、行動パタン記憶部30と、移動ベクトル演算解析部40とを備えている。
【0112】
位置情報ログ入力部10、行動パタン解析基準入力部11、行動パタン記憶部30、および、移動ベクトル関数値演算部41と滞留・移動経路属性判定部42とを含む移動ベクトル演算解析部40の内容は、第2の実施形態と同様のため、説明を省略する。
【0113】
行動パタン解析部60は、クラスタリング空間プロット部21と、滞留点クラスタ抽出部22と、移動経路クラスタ抽出部24と、進行方向距離係数演算部25とを含む。すなわち、本実施形態における行動パタン解析部60は、進行方向距離係数演算部25を含む点において第2の実施形態における行動パタン解析部50と異なる。
【0114】
クラスタリング空間プロット部21は、第2の実施形態と同様、解析の対象とする位置情報ログをクラスタリング空間にプロットする。具体的には、まず、クラスタリング空間プロット部21は、予め設定された時刻(すなわち、時刻基準)を日付の切れ目とし、設定された曜日(すなわち、曜日基準)の位置情報ログを抽出する。なお、時刻基準および曜日基準に基づいて位置情報ログを抽出する方法は、第2の実施形態で示す方法と同様である。
【0115】
なお、クラスタリング空間プロット部21には、位置情報ログ入力部10から直接位置情報ログが入力されてもよい。また、滞留・移動経路属性判定部42が、移動ベクトル演算解析部40に入力された位置情報ログをクラスタリング空間プロット部21に入力するようにしてもよい。
【0116】
本実施形態では、クラスタリング空間プロット部21は、緯度、経度および時刻を含む位置情報ログをクラスタリング空間にプロットする。クラスタリング空間プロット部21がクラスタリング空間に上記レコードをプロットする方法は、第1の実施形態と同様である。そして、クラスタリング空間プロット部21は、プロットしたデータを滞留点クラスタ抽出部22に入力する。
【0117】
滞留点クラスタ抽出部22は、第2の実施形態と同様、クラスタリング空間データのクラスタリングを行い、滞留点を抽出する。本実施形態では、滞留点クラスタ抽出部22は、クラスタリング空間プロット部21からクラスタリング空間にプロットされたデータを受け取ると、滞留・移動経路属性判定部42で滞留属性と判定されたレコードのみを対象としてクラスタリングを行う。
【0118】
滞留点クラスタ抽出部22は、クラスタリング空間にプロットされたデータの緯度及び経度を示す値に対して、予め設定された重み値をそれぞれ乗じる。ここで、クラスタリング空間にプロットされ、予め設定された重み値が乗じられた全データのうち、滞留属性と判定されたデータを初期クラスタとする。
【0119】
次に、滞留点クラスタ抽出部22は、上記クラスタの中から選び出した2点間のユークリッド距離が、予め設定されたユークリッド距離閾値を超えていないか否かを判断する。ユークリッド距離がユークリッド距離閾値を超えていない場合、滞留点クラスタ抽出部22は、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。
【0120】
この際、滞留点クラスタ抽出部22は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、滞留点クラスタ抽出部22は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、滞留点クラスタ抽出部22は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく。
【0121】
一方、2点間のユークリッド距離がユークリッド距離閾値を超えていた場合、滞留点クラスタ抽出部22は、設定されたクラスタ個数閾値を越えた個数のクラスタリング空間データを含むクラスタを滞留点と判断する。そして、滞留点クラスタ抽出部22は、そのクラスタ中のデータのうち最も早い時刻を滞留開始時刻、最も遅い時刻を滞留終了時刻とする。そして、滞留点クラスタ抽出部22は、滞留開始時刻、滞留終了時刻、および、そのクラスタ中のデータにおける緯度及び経度の重心の値を、滞留点パタン保存部31に記憶させる。
【0122】
滞留点クラスタ抽出部22は、クラスタリング空間プロット部21から受け取ったデータを移動経路クラスタ抽出部24に入力する。
【0123】
すなわち、本実施形態における滞留点クラスタ抽出部22がクラスタリングを行う方法は、第2の実施形態と同様である。ただし、第2の実施形態では、クラスタリング空間プロット部21が[緯度,経度,時刻,進行方向角度]を含むレコードを4次元のクラスタリング空間にプロットしているのに対し、本実施形態ではクラスタリング空間プロット部21が[緯度,経度,時刻]を含むレコードを3次元のクラスタリング空間にプロットしてクラスタリングを行う点において、第2の実施形態と異なる。
【0124】
移動経路クラスタ抽出部24は、クラスタリング空間データのクラスタリングを行い、端末利用者が頻繁に移動を行っている時間帯及び移動経路を抽出する。ただし、本実施形態では、移動経路クラスタ抽出部24が、位置情報ログが示す進行方向と、位置情報ログ間の方位角との関係も考慮してクラスタリングを行う点において第2の実施形態と異なる。
【0125】
図14は、位置情報ログが示す進行方向と位置情報ログの方位角との関係の例を示す説明図である。
図14に示す例では、矢印501a,501bが、位置情報ログを示す各点P1,P2のそれぞれの進行方向を示している。
【0126】
本実施形態では、後述する進行方向距離係数演算部25が、P1の進行方向角度θ
1と、P1を原点とするP2への方位角θ
12とから進行方向距離係数w
12を算出し、移動経路クラスタ抽出部24がw
12を前述のユークリッド距離の値に乗じる。同様に、進行方向距離係数演算部25が、P2の進行方向角度θ
2と、P1を原点とするP2への方位角θ
21とから進行方向距離係数w
21を算出し、移動経路クラスタ抽出部24がw
21を前述のユークリッド距離の値に乗じる。
【0127】
ここで、進行方向距離係数とは、位置情報ログが示す測位位置からの進行方向と、2つの測位位置間を結ぶ方向とがなす角度の値が小さいほど値が小さくなる係数であり、後述する方法により算出される。そして、移動経路クラスタ抽出部24は、算出した値を用いて、移動属性と判定されたデータを初期クラスタとした処理を行う。なお、方位角の算出方法についても後述する。
【0128】
進行方向距離係数演算部25は、2つの位置情報ログに基づいて、各位置情報ログが示す測位位置からの進行方向と、2つ位置情報ログが示す測位位置間を結ぶ方向とがなす角度の値が小さいほど値が小さくなる係数(すなわち、進行方向距離係数)を、位置情報ログごとに算出する。具体的には、進行方向距離係数演算部25は、2点の位置情報ログに対して、1点を原点としたもう1点へのベクトル(具体的には、2つの測位位置間の方向を示すベクトル)と、移動ベクトル関数値演算部41で算出された移動方向ベクトル(具体的には、測位位置からの進行方向を示すベクトル)とのなす角の演算を行い、進行方向距離係数の値を決定する。なお、進行方向距離係数演算部25は、移動経路クラスタ抽出部24から位置情報ログを受け取って、進行方向距離係数を算出する。
【0129】
なお、2点の位置情報ログの移動方向ベクトルは、通常各々異なるものである。そこで、進行方向距離係数演算部25は、なす角の演算を、それぞれの位置情報ログを原点として行う。
【0130】
ここで、
図14に例示する位置情報ログが示す座標における緯度をX
i、経度をY
iとし、比較する2点P1,P2の座標を、それぞれ(X
1,Y
1)、(X
2,Y
2)とする。また、P1の移動方向ベクトル501aの方位角をθ
1、P2の移動方向ベクトル501bの方位角をθ
2とする。このとき、P1を原点としたP2の方位角は、以下の式2のように定義される。
【0131】
θ
12=arg((Y
2−Y
1)/(X
2−X
1)) ・・・(式2)
【0132】
また、P1を原点としたP2へのベクトルと、移動ベクトル関数値演算部41で算出されたP1の移動方向ベクトル501aとのなす角θ
1to2は、以下の式3で定義される。
【0133】
θ
1to2=min{|θ
1−θ
12|,360−|θ
1−θ
12|} ・・・(式3)
【0134】
このとき、進行方向距離係数演算部25は、式2および式3により算出したθ
1to2を用いて、進行方向距離係数w
12を求める。進行方向距離係数演算部25は、例えば、以下の式4を用いて、進行方向距離係数w
12を算出してもよい。
【0135】
w
12=1−COS θ
1to2 ・・・(式4)
【0136】
なお、進行方向係数w
12を算出する際に用いる式は、上記の式4に限定されない。位置情報ログが示す測位位置からの進行方向と、2つの測位位置間の方向とがなす角度の値が小さいほど値が小さくなり、かつ、両者のなす角度が取り得る区間において連続関数であり、さらに、進行方向距離係数の値が、両者のなす角度に関わらず常に正の値をとる、という条件を満たす式であれば、他の式であってもよい。
【0137】
このように、進行方向距離係数は、2つの位置情報ログに対し、移動ベクトル関数値演算部41が算出した移動ベクトル関数値に含まれる進行方向と、2つの位置情報ログの方位角とのなす角の値から定まる係数であると言える。
【0138】
同様に、P2を原点としたP1の方位角は、以下の式5のように定義される。
【0139】
θ
21=arg((Y
1−Y
2)/(X
1−X
2)) ・・・(式5)
【0140】
また、P2を原点としたP1へのベクトルと、移動ベクトル関数値演算部41で算出されたP2の移動方向ベクトル501bとのなす角θ
2to1についても、式3と同様、以下の式6で定義される。
【0141】
θ
2to1=min{|θ
2−θ
21|,360−|θ
2−θ
21|} ・・・(式6)
【0142】
このとき、進行方向距離係数演算部25は、式5および式6により算出したθ
2to1を用いて、進行方向距離係数w
21を求める。進行方向距離係数演算部25は、例えば、以下の式7を用いて、進行方向距離係数w
21を算出してもよい。
【0143】
w
21=1−COS θ
2to1 ・・・(式7)
【0144】
進行方向距離係数演算部25は、算出した進行方向距離係数w
12およびw
21を、移動経路クラスタ抽出部24に通知する。
【0145】
移動経路クラスタ抽出部24は、滞留点クラスタ抽出部22からデータを受け取ると、進行方向距離係数演算部25に対して少なくとも[緯度,経度,進行方向角度]を含む位置情報ログを渡し、進行方向距離係数演算部25から進行方向距離係数を受け取る。
【0146】
本実施形態では、位置情報ログの2点(P1,P2)間の距離を示す値を算出する場合、P1を基準として距離を算出した場合と、P2を基準として距離を算出した場合とで、移動経路の進行方向を考慮したときに、両者の距離を示す値が異なるように演算を行う。
【0147】
そこで、本実施形態では、緯度、経度、時刻および進行方向距離係数の4変数を用いて以下の式8のように距離関数を定義する。なお、以下の式8で定義される距離関数では、緯度及び経度を基準として、時刻に対して、k
2がそれぞれ定められる。
【0148】
w
12{(X
1−X
2)
2+(Y
1−Y
2)
2+k
2(Z
1−Z
2)
2} ・・・(式8)
【0149】
ここで、定義された重み値k
2が乗じられた全データのうち、移動属性と判定されたデータを初期クラスタとする。すなわち、緯度および経度を基準として、時刻方向のユークリッド距離が遠いと判定されやすくなる重み値k
2を予め設定しておく。移動経路クラスタ抽出部24は、各位置情報ログに含まれる緯度及び経度に対してそれぞれ重み値k
2を乗じることにより、位置情報ログ間のユークリッド距離を算出する。さらに、移動経路クラスタ抽出部24は、算出したユークリッド距離に対して、進行方向距離係数を乗じることで、重み付けを行う。
【0150】
そして、移動経路クラスタ抽出部24は、上記クラスタの中から選び出した2点間のユークリッド距離が設定したユークリッド距離閾値を超えていないか否かを判定する。ユークリッド距離が閾値を超えていない場合、移動経路クラスタ抽出部24は、上記クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。
【0151】
この際、移動経路クラスタ抽出部24は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、移動経路クラスタ抽出部24は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、移動経路クラスタ抽出部24は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく。
【0152】
一方、2点間のユークリッド距離がユークリッド距離閾値を超えている場合、移動経路クラスタ抽出部24は、設定されたクラスタ個数閾値を超えた個数のクラスタリング空間データを含むクラスタを移動経路と判断する。そして、移動経路クラスタ抽出部24は、そのクラスタ中のデータのうち最も早い時刻を移動開始時刻、最も遅い時刻を移動終了時刻とする。
【0153】
さらに、移動経路クラスタ抽出部24は、そのクラスタの位置情報(緯度及び経度)と、滞留点クラスタ抽出部22から受け取った滞留点パタンデータに含まれる滞留点の位置情報(緯度及び経度)とを比較する。そして、移動経路クラスタ抽出部24は、そのクラスタの位置とのユークリッド距離が1番短い滞留点と2番目に短い滞留点を、それぞれ第1近接滞留点識別子、第2近接滞留点識別子と決定する。そして、移動経路クラスタ抽出部24は、移動開始時刻、移動終了時刻、第1近接滞留点識別子および第2近接滞留点識別子を、移動経路パタン保存部32に記憶させる。
【0154】
すなわち、本実施形態の移動経路クラスタ抽出部24は、[緯度,経度,時刻]を含むレコードを対象にユークリッド距離の演算を行い、これらのクラスタリングを行う点で、第2の実施形態における移動経路クラスタ抽出部24と異なる。また、本実施形態の移動経路クラスタ抽出部24は、2点の位置情報ログ間のユークリッド距離を各々の位置情報ログを始点として算出し、さらに、この値に進行方向距離係数を乗算することで2点間の距離を定義する。そして、各点ごとに定義された2つの値を考慮したクラスタリングを行う点で、第2の実施形態における移動経路クラスタ抽出部24と異なる。それ以外の処理については、第2の実施形態と同様である。
【0155】
例えば、
図12に例示する位置情報ログ群401に含まれる位置情報ログ401aと位置情報ログ401bに着目すると、各移動方向ベクトルは、お互いの位置情報ログの方向を向いていない。そのため、位置情報ログ401aと位置情報ログ401bのいずれを基準として進行方向距離係数の値を利用しても、進行方向距離係数を乗算したユークリッド距離(上記式2参照)が遠くなる。そのため、2点の位置情報ログはクラスタリングされにくくなる。
【0156】
一方、
図12に例示する位置情報ログ群402に含まれる位置情報ログ402aと位置情報ログ402bに着目すると、位置情報ログ402aの移動方向ベクトルは、位置情報ログ402bの方向を向いている。一方、位置情報ログ402bの移動方向ベクトルは、位置情報ログ402aの方向とは離れた方向を向いている。そのため、位置情報ログ402bを基準として算出される進行方向距離係数の値は大きくなるが、位置情報ログ402aを基準として算出される進行方向距離係数の値は小さくなる。このとき、移動経路クラスタ抽出部24は、進行方向距離係数を乗算したユークリッド距離が小さい値の順番にクラスタリングを行うので、結果として2点の位置情報ログはクラスタリングされやすくなる。
【0157】
以上のように、本実施形態によれば、進行方向距離係数演算部25が、2つの位置情報ログに基づいて、進行方向距離係数を位置情報ログごとに算出する。また、移動経路クラスタ抽出部24が、緯度および経度を基準として、時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを位置情報ログに対して行い、かつ、そのユークリッド距離に進行方向距離係数を乗じることによる重み付けを行う。そして、移動経路クラスタ抽出部24が、重み付けされた位置情報ログのうち非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する。そのため、第1の実施形態の効果に加え、移動経路クラスタを分類する精度を向上させることができる。
【実施例】
【0158】
以下、具体的な実施例により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。
【0159】
まず、位置情報ログ入力部10は、[緯度,経度,時刻]を1レコードとする位置情報ログを受け取ると、その位置情報ログをクラスタリング空間プロット部21に入力する。クラスタリング空間プロット部21は、予め設定された時刻を日付の切れ目とし、設定された曜日の位置情報ログを抽出する。そして、クラスタリング空間プロット部21は、[緯度,経度,時刻]を含むレコードを3次元のクラスタリング空間にプロットし、プロットしたデータを滞留点クラスタ抽出部22に入力する。
【0160】
次に、滞留点クラスタ抽出部22は、クラスタリング空間にプロットされたデータを受け取ると、クラスタリング空間にプロットされたデータの緯度及び経度を示す値に対して、予め設定された重み値をそれぞれ乗じる。ここで、クラスタリング空間にプロットされ、設定された重み値が掛けられた全データを初期クラスタとする。
【0161】
次に、滞留点クラスタ抽出部22は、全クラスタの中から選び出した2点間のユークリッド距離が、予め設定されたユークリッド距離閾値を超えていないか否かを判断する。ユークリッド距離が閾値を超えていない場合、滞留点クラスタ抽出部22は、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。
【0162】
この際、滞留点クラスタ抽出部22は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、滞留点クラスタ抽出部22は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、滞留点クラスタ抽出部22は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく。
【0163】
一方、ユークリッド距離が閾値を超えていた場合、滞留点クラスタ抽出部22は、設定されたクラスタ個数閾値を越えた個数のクラスタリング空間データを含むクラスタを滞留点と判断する。そして、滞留点クラスタ抽出部22は、そのクラスタ中のデータのうち最も早い時刻を滞留開始時刻、最も遅い時刻を滞留終了時刻とする。そして、滞留点クラスタ抽出部22は、滞留開始時刻、滞留終了時刻、および、そのクラスタ中のデータにおける緯度及び経度の重心の値を、滞留点パタン保存部31に記憶させる。
【0164】
滞留点クラスタ抽出部22は、クラスタリング空間プロット部21から受け取ったデータ(すなわち、クラスタリング空間にプロットされたデータ)と、滞留点と判断したデータ(滞留点パタンデータ)を滞留点位置情報ログ除去部23に入力する。
【0165】
滞留点位置情報ログ除去部23は、クラスタリング空間にプロットされたデータから、滞留点パタンデータに含まれる滞留点と判断されたデータを差し引く。そして、滞留点位置情報ログ除去部23は、クラスタリング空間にプロットされたデータのうち、差し引かれた残りのデータを移動経路クラスタ抽出部24に入力する
【0166】
次に、移動経路クラスタ抽出部24は、滞留点位置情報ログ除去部23からデータを受け取ると、予め設定されている重み値を、受け取ったデータの緯度および経度に対してそれぞれ乗じる。ここで、重み値が掛けられた全データを初期クラスタとする。
【0167】
移動経路クラスタ抽出部24は、全クラスタの中から選び出した2点間のユークリッド距離が設定したユークリッド距離閾値を超えていないか否かを判定する。ユークリッド距離が閾値を超えていない場合、移動経路クラスタ抽出部24は、全クラスタの中から選び出した2点間のユークリッド距離が最も短いクラスタ同士を一つのクラスタへ統合する。この際、移動経路クラスタ抽出部24は、クラスタを構成するそれぞれの位置情報ログの時刻、緯度および経度を含むようにクラスタを統合する。さらに、移動経路クラスタ抽出部24は、それぞれの位置情報ログとは別に、そのクラスタに含まれる位置情報ログから緯度および経度の重心の値を算出し、その値を新たなクラスタデータの値とする。また、移動経路クラスタ抽出部24は、統合したクラスタに含まれるクラスタリング空間データの個数も保持しておく。
【0168】
一方、ユークリッド距離が閾値を超えている場合、移動経路クラスタ抽出部24は、設定されたクラスタ個数閾値を超えた個数のクラスタリング空間データを含むクラスタを移動経路と判断する。そして、移動経路クラスタ抽出部24は、そのクラスタ中のデータのうち最も早い時刻を移動開始時刻、最も遅い時刻を移動終了時刻とする。
【0169】
さらに、移動経路クラスタ抽出部24は、そのクラスタの位置情報(緯度及び経度)と、滞留点位置情報ログ除去部23から受け取った滞留点パタンデータに含まれる滞留点の位置情報(緯度及び経度)とを比較する。そして、移動経路クラスタ抽出部24は、そのクラスタの位置とのユークリッド距離が1番短い滞留点と2番目に短い滞留点を移動経路を、それぞれ第1近接滞留点識別子、第2近接滞留点識別子と決定する。そして、移動経路クラスタ抽出部24は、移動開始時刻、移動終了時刻、第1近接滞留点識別子および第2近接滞留点識別子を、移動経路パタン保存部32に記憶させる。
【0170】
次に、本発明の最小構成の例を説明する。
図15は、本発明による行動パタン解析装置の最小構成の例を示すブロック図である。本発明による行動パタン解析装置は、利用者の測位位置(例えば、緯度、経度、高度)及び測位日時(例えば、時刻)を含む情報である位置情報ログを、その測位位置を表す数値情報(例えば、緯度、経度、高度)および時刻により規定される多次元空間(例えば、緯度、経度および時刻により規定される3次元空間)上にプロットする位置情報プロット手段81(例えば、クラスタリング空間プロット部21)と、多次元空間において測位位置を表す数値情報により規定される空間である位置情報空間(例えば、緯度−経度平面)に対する時刻方向(例えば、時刻軸方向)のユークリッド距離が近いと判定されやすくなる重み付け(例えば、時刻に重み値kを乗じる処理)を位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者が頻繁に滞留する位置である滞留点を抽出する滞留点クラスタ抽出手段82(例えば、滞留点クラスタ抽出部22)と、位置情報プロット手段81がプロットした位置情報ログから滞留点として抽出された位置情報ログを除いた位置情報ログの集合を非滞留点として抽出する非滞留点位置情報ログ抽出手段83(例えば、滞留点位置情報ログ除去部23)と、位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付け(例えば、時刻に重み値kを乗じる処理)を非滞留点の位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出手段84(例えば、移動経路クラスタ抽出部24)とを備えている。
【0171】
そのような構成により、位置情報の測位間隔が長く、また、位置情報の測位が不定期である場合にも、利用者の行動パタンを精度良く解析できる。
【0172】
また、
図16は、本発明による行動パタン解析装置の他の最小構成の例を示すブロック図である。本発明による他の行動パタン解析装置は、利用者の測位位置(例えば、緯度、経度、高度)及び測位日時(例えば、時刻)を含む情報である位置情報ログに含まれるその測位日時順にソートされた隣接する2つの位置情報ログ間の差分値として、その位置情報ログに含まれる測位日時の時間差、および、測位位置間の距離を算出する移動ベクトル関数値算出手段91(例えば、移動ベクトル関数値演算部41)と、測位日時の時間差及び測位位置間の距離に基づいて、位置情報ログの属性が、利用者が頻繁に滞留する位置である滞留点を示す滞留属性か、利用者の移動経路上の位置である非滞留点を示す非滞留属性(例えば、移動属性)かを判定する属性判定手段92(例えば、滞留・移動経路属性判定部42)と、位置情報ログを、測位位置を表す数値情報(例えば、緯度、経度、高度)および時刻により規定される多次元空間(例えば、緯度、経度および時刻により規定される3次元空間)上にプロットする位置情報プロット手段93(例えば、クラスタリング空間プロット部21)と、多次元空間において測位位置を表す数値情報により規定される空間である位置情報空間(例えば、緯度−経度平面)に対する時刻方向(例えば、時刻軸方向)のユークリッド距離が近いと判定されやすくなる重み付けを位置情報ログに対して行い、重み付けされた位置情報ログのうち滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、滞留点を抽出する滞留点クラスタ抽出手段94(例えば、滞留点クラスタ抽出部22)と、位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを位置情報ログに対して行い、重み付けされた位置情報ログのうち非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出手段95(例えば、移動経路クラスタ抽出部24)とを備えている。
【0173】
このような構成であっても、位置情報の測位間隔が長く、また、位置情報の測位が不定期である場合に、利用者の行動パタンを精度良く解析できる。
【0174】
また、移動ベクトル関数値算出手段91は、2つの位置情報ログ間の差分値として、測位位置間での進行方向を表す進行方向角度(例えば、θ)の差分値を算出してもよい。そして、位置情報プロット手段93は、利用者の測位位置及び測位日時を含む位置情報ログに進行方向角度を加えたレコード(例えば、[緯度,経度,時刻,進行方向角度]を含むレコード)を、測位位置を表す数値情報、時刻および進行方向角度により規定される多次元空間(例えば、緯度、経度、高度および時刻により規定される4次元空間)上にプロットしてもよい。さらに、移動経路クラスタ抽出手段95は、移動経路属性を有すると判定された位置情報ログに進行方向角度を加えたレコードをクラスタリングすることにより、利用者の移動経路を抽出してもよい。
【0175】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0176】
(付記1)利用者の測位位置及び測位日時を含む情報である位置情報ログを、当該測位位置を表す数値情報および時刻により規定される多次元空間上にプロットする位置情報プロット手段と、前記多次元空間において前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者が頻繁に滞留する位置である滞留点を抽出する滞留点クラスタ抽出手段と、位置情報プロット手段がプロットした位置情報ログから前記滞留点として抽出された位置情報ログを除いた位置情報ログの集合を非滞留点として抽出する非滞留点位置情報ログ抽出手段と、前記位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記非滞留点の位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出手段とを備えたことを特徴とする行動パタン解析装置。
【0177】
(付記2)位置情報プロット手段は、利用者の測位位置として緯度および経度を示す値を含む位置情報ログを、緯度、経度および時刻により規定される3次元空間上にプロットし、滞留点クラスタ抽出手段は、前記3次元空間において緯度および経度により規定される平面である緯度経度平面に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行う付記1記載の行動パタン解析装置。
【0178】
(付記3)位置情報プロット手段は、利用者の測位位置として緯度、経度および高度を示す値を含む位置情報ログを、緯度、経度、高度および時刻により規定される4次元空間上にプロットし、滞留点クラスタ抽出手段は、前記4次元空間において緯度、経度および高度により規定される空間である緯度経度高度空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行う付記1記載の行動パタン解析装置。
【0179】
(付記4)移動経路クラスタ抽出手段は、緯度経度高度空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを非滞留点の位置情報ログに対して行う付記3記載の行動パタン解析装置。
【0180】
(付記5)移動経路クラスタ抽出手段は、クラスタリングされた位置情報ログとのユークリッド距離が1番短い滞留点と、2番目に短い滞留点を、移動経路の始点または終点と決定する付記1から付記4のうちのいずれか1つに記載の行動パタン解析装置。
【0181】
(付記6)移動経路クラスタ抽出手段は、クラスタリングされた位置情報ログにおける位置情報の重心の値と、滞留点における位置情報の重心の値との距離とを比較し、前記距離が1番短い滞留点と、2番目に短い滞留点を、移動経路の始点または終点と決定する付記1から付記5のうちのいずれか1つに記載の行動パタン解析装置。
【0182】
(付記7)利用者の測位位置及び測位日時を含む情報である位置情報ログに含まれる当該測位日時順にソートされた隣接する2つの位置情報ログ間の差分値として、当該位置情報ログに含まれる前記測位日時の時間差、および、前記測位位置間の距離を算出する移動ベクトル関数値算出手段と、前記測位日時の時間差及び測位位置間の距離に基づいて、前記位置情報ログの属性が、利用者が頻繁に滞留する位置である滞留点を示す滞留属性か、利用者の移動経路上の位置である非滞留点を示す非滞留属性かを判定する属性判定手段と、前記位置情報ログを、前記測位位置を表す数値情報および時刻により規定される多次元空間上にプロットする位置情報プロット手段と、前記多次元空間において前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、前記滞留点を抽出する滞留点クラスタ抽出手段と、前記位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出手段とを備えたことを特徴とする行動パタン解析装置。
【0183】
(付記8)移動ベクトル関数値算出手段は、2つの位置情報ログ間の差分値として、測位位置間での進行方向を表す進行方向角度の差分値を算出し、位置情報プロット手段は、利用者の測位位置及び測位日時を含む位置情報ログに進行方向角度を加えたレコードを、測位位置を表す数値情報、時刻および前記進行方向角度により規定される多次元空間上にプロットし、移動経路クラスタ抽出手段は、前記移動経路属性を有すると判定された位置情報ログに進行方向角度を加えたレコードをクラスタリングすることにより、利用者の移動経路を抽出する付記7記載の行動パタン解析装置。
【0184】
(付記9)2つの位置情報ログに基づいて、当該各位置情報ログが示す測位位置からの進行方向と、2つ位置情報ログが示す測位位置間を結ぶ方向とがなす角度の値が小さいほど値が小さくなる係数である進行方向距離係数を、前記位置情報ログごとに算出する進行方向距離係数算出手段を備え、移動経路クラスタ抽出手段は、位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、かつ、前記移動方向距離係数算出手段が算出した進行方向距離係数を前記ユークリッド距離に乗じることによる重み付けを行い、当該重み付けされた位置情報ログのうち非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する付記7記載の行動パタン解析装置。
【0185】
(付記10)利用者の測位位置及び測位日時を含む情報である位置情報ログを、当該測位位置を表す数値情報および時刻により規定される多次元空間上にプロットし、前記多次元空間において前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者が頻繁に滞留する位置である滞留点を抽出し、前記多次元空間上にプロットされた位置情報ログから前記滞留点として抽出された位置情報ログを除いた位置情報ログの集合を非滞留点として抽出し、前記位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記非滞留点の位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出することを特徴とする行動パタン解析方法。
【0186】
(付記11)利用者の測位位置として緯度および経度を示す値を含む位置情報ログを、緯度、経度および時刻により規定される3次元空間上にプロットし、前記3次元空間において緯度および経度により規定される平面である緯度経度平面に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行う付記10記載の行動パタン解析方法。
【0187】
(付記12)利用者の測位位置として緯度、経度および高度を示す値を含む位置情報ログを、緯度、経度、高度および時刻により規定される4次元空間上にプロットし、前記4次元空間において緯度、経度および高度により規定される空間である緯度経度高度空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行う付記10記載の行動パタン解析方法。
【0188】
(付記13)緯度経度高度空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを非滞留点の位置情報ログに対して行う付記12記載の行動パタン解析方法。
【0189】
(付記14)利用者の測位位置及び測位日時を含む情報である位置情報ログに含まれる当該測位日時順にソートされた隣接する2つの位置情報ログ間の差分値として、当該位置情報ログに含まれる前記測位日時の時間差、および、前記測位位置間の距離を算出し、前記測位日時の時間差及び測位位置間の距離に基づいて、前記位置情報ログの属性が、利用者が頻繁に滞留する位置である滞留点を示す滞留属性か、利用者の移動経路上の位置である非滞留点を示す非滞留属性かを判定し、前記位置情報ログを、前記測位位置を表す数値情報および時刻により規定される多次元空間上にプロットし、前記多次元空間において前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、前記滞留点を抽出し、前記位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出することを特徴とする行動パタン解析方法。
【0190】
(付記15)2つの位置情報ログ間の差分値として、測位位置間での進行方向を表す進行方向角度の差分値を算出し、利用者の測位位置及び測位日時を含む位置情報ログに進行方向角度を加えたレコードを、測位位置を表す数値情報、時刻および前記進行方向角度により規定される多次元空間上にプロットし、前記移動経路属性を有すると判定された位置情報ログに進行方向角度を加えたレコードをクラスタリングすることにより、利用者の移動経路を抽出する付記14記載の行動パタン解析方法。
【0191】
(付記16)2つの位置情報ログに基づいて、当該各位置情報ログが示す測位位置からの進行方向と、2つ位置情報ログが示す測位位置間を結ぶ方向とがなす角度の値が小さいほど値が小さくなる係数である進行方向距離係数を、前記位置情報ログごとに算出し、位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、かつ、算出された前記進行方向距離係数を前記ユークリッド距離に乗じることによる重み付けを行い、当該重み付けされた位置情報ログのうち非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する付記14記載の行動パタン解析方法。
【0192】
(付記17)コンピュータに、利用者の測位位置及び測位日時を含む情報である位置情報ログを、当該測位位置を表す数値情報および時刻により規定される多次元空間上にプロットする位置情報プロット処理、前記多次元空間において前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者が頻繁に滞留する位置である滞留点を抽出する滞留点クラスタ抽出処理、位置情報プロット処理でプロットされた位置情報ログから前記滞留点として抽出された位置情報ログを除いた位置情報ログの集合を非滞留点として抽出する非滞留点位置情報ログ抽出処理、および、前記位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記非滞留点の位置情報ログに対して行い、重み付けされた位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出処理を実行させるための行動パタン解析プログラム。
【0193】
(付記18)コンピュータに、位置情報プロット処理で、利用者の測位位置として緯度および経度を示す値を含む位置情報ログを、緯度、経度および時刻により規定される3次元空間上にプロットさせ、滞留点クラスタ抽出処理で、前記3次元空間において緯度および経度により規定される平面である緯度経度平面に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行わせる付記17記載の行動パタン解析プログラム。
【0194】
(付記19)コンピュータに、位置情報プロット処理で、利用者の測位位置として緯度、経度および高度を示す値を含む位置情報ログを、緯度、経度、高度および時刻により規定される4次元空間上にプロットさせ、滞留点クラスタ抽出処理で、前記4次元空間において緯度、経度および高度により規定される空間である緯度経度高度空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行わせる付記17記載の行動パタン解析プログラム。
【0195】
(付記20)コンピュータに、移動経路クラスタ抽出処理で、緯度経度高度空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを非滞留点の位置情報ログに対して行わせる付記19記載の行動パタン解析プログラム。
【0196】
(付記21)コンピュータに、利用者の測位位置及び測位日時を含む情報である位置情報ログに含まれる当該測位日時順にソートされた隣接する2つの位置情報ログ間の差分値として、当該位置情報ログに含まれる前記測位日時の時間差、および、前記測位位置間の距離を算出する移動ベクトル関数値算出処理、前記測位日時の時間差及び測位位置間の距離に基づいて、前記位置情報ログの属性が、利用者が頻繁に滞留する位置である滞留点を示す滞留属性か、利用者の移動経路上の位置である非滞留点を示す非滞留属性かを判定する属性判定処理、前記位置情報ログを、前記測位位置を表す数値情報および時刻により規定される多次元空間上にプロットする位置情報プロット処理、前記多次元空間において前記測位位置を表す数値情報により規定される空間である位置情報空間に対する時刻方向のユークリッド距離が近いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、前記滞留点を抽出する滞留点クラスタ抽出処理、および、前記位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、重み付けされた位置情報ログのうち前記非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出する移動経路クラスタ抽出処理を実行させるための行動パタン解析プログラム。
【0197】
(付記22)コンピュータに、移動ベクトル関数値算出処理で、2つの位置情報ログ間の差分値として、測位位置間での進行方向を表す進行方向角度の差分値を算出させ、位置情報プロット処理で、利用者の測位位置及び測位日時を含む位置情報ログに進行方向角度を加えたレコードを、測位位置を表す数値情報、時刻および前記進行方向角度により規定される多次元空間上にプロットさせ、移動経路クラスタ抽出処理で、前記移動経路属性を有すると判定された位置情報ログに進行方向角度を加えたレコードをクラスタリングすることにより、利用者の移動経路を抽出させる付記21記載の行動パタン解析プログラム。
【0198】
(付記23)コンピュータに、2つの位置情報ログに基づいて、当該各位置情報ログが示す測位位置からの進行方向と、2つ位置情報ログが示す測位位置間を結ぶ方向とがなす角度の値が小さいほど値が小さくなる係数である進行方向距離係数を、前記位置情報ログごとに算出する進行方向距離係数算出処理を実行させ、移動経路クラスタ抽出処理で、位置情報空間に対する時刻方向のユークリッド距離が遠いと判定されやすくなる重み付けを前記位置情報ログに対して行い、かつ、前記移動方向距離係数算出処理で算出された進行方向距離係数を前記ユークリッド距離に乗じることによる重み付けを行い、当該重み付けされた位置情報ログのうち非滞留属性を有すると判定された位置情報ログをクラスタリングすることにより、利用者の移動経路を抽出させる付記21記載の行動パタン解析プログラム。
【0199】
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【0200】
この出願は、2011年1月14日に出願された日本特許出願2011−006260、2011年5月16日に出願された日本特許出願2011−109400、および、2011年9月21日に出願された日本特許出願2011−206345を基礎とする優先権を主張し、その開示の全てをここに取り込む。