(58)【調査した分野】(Int.Cl.,DB名)
ユーザの位置情報、および当該位置情報の取得時刻を対応付けた位置ログを複数含む移動ログをユーザ毎に有する複数の位置情報サービスにおいて、同一人物のユーザを特定するユーザ特定装置であって、
二つの位置情報サービスの移動ログを参照して、第1の位置情報サービスと第2の位置情報サービスとの間において、前記取得時刻が近接する位置ログを少なくとも1つ有するユーザの組合せを同一人物候補ペアとして選択する同一人物候補選択手段と、
前記同一人物候補ペア毎に、前記取得時刻が近接する位置ログの位置情報および取得時刻それぞれの差分を位置ログ差分として算出する差分算出手段と、
前記同一人物候補ペア毎に、各位置ログ差分について拡散方程式を用いて、同時に同位置に前記同一人物候補ペアが存在できる確率を示す存在確率を算出する存在確率算出手段と、
前記同一人物候補ペア毎に、各位置ログ差分について前記存在確率算出手段で算出された存在確率に予め設定されたしきい値以下が1つもない同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定するユーザ特定手段と、
を備えることを特徴とするユーザ特定装置。
前記存在確率算出手段が、前記同一人物候補ペアについて算出された位置ログ差分と、前記同一人物候補ペアの一のユーザの移動速度の分散を拡散係数とする拡散方程式とから、前記存在確率を算出することを特徴とする請求項1に記載のユーザ特定装置。
前記ユーザ特定手段が、同一ユーザを含む複数の同一人物候補ペアを抽出した場合に、抽出した複数の同一人物候補ペア毎に、各位置ログ差分について前記存在確率算出手段で算出された存在確率の平均が最も高い同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定することを特徴とする請求項1から請求項4のいずれかに記載のユーザ特定装置。
前記移動ログがPOI情報を含み、前記ユーザ特定手段が、同一ユーザを含む複数の同一人物候補ペアを抽出した場合に、同一人物候補ペアのユーザ間におけるPOI同士の類似度と当該ユーザ間の位置ログの類似度とから算出されたユーザ間類似度がもっとも高い同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定することを特徴とする請求項1から請求項4のいずれかに記載のユーザ特定装置。
予め用意されている各移動方法の速度、経路情報、および停止または減速する節点情報と前記移動ログとに基づいて、移動方法を推定し、推定した移動方法に応じて移動速度を推定する移動速度推定手段を備え、
前記差分算出手段が、前記同一人物候補ペアにおける前記取得時刻が近接する位置ログと、当該同一人物候補ペアの一ユーザについて前記移動速度推定手段で算出された当該位置ログにおける移動速度とに基づいて、他ユーザの取得時刻における前記一ユーザの予測位置情報を算出し、算出された予測位置情報と前記他ユーザの位置情報との差分を位置情報差分として算出し、
前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置情報差分について拡散方程式を用いて、前記存在確率を算出することを特徴とする請求項1から請求項6のいずれかに記載のユーザ特定装置。
前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置情報差分について、前記移動速度推定手段で推定された前記他ユーザの移動速度の分散を拡散係数とする拡散方程式を用いて、前記存在確率を算出することを特徴とする請求項7に記載のユーザ特定装置。
前記差分算出手段が、前記同一人物候補ペアにおける前記取得時刻が近接する位置ログと、当該同一人物候補ペアの一ユーザについて前記移動速度推定手段で推定された移動速度とに基づいて、他ユーザの取得時刻における前記一ユーザの予測位置情報を算出し、算出された予測位置情報と前記他ユーザの位置情報との差分を位置情報差分として算出するとともに、前記同一人物候補ペアにおける前記取得時刻が近接する位置ログにおいて、前記一ユーザの前記移動速度推定手段で推定された移動速度と前記他ユーザの前記移動速度推定手段で推定された移動速度との差分を速度差分として算出し、
前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置情報差分について拡散方程式を用いて算出した位置に基づく存在確率と、各速度差分について拡散方程式を用いて算出した速度に基づく存在確率とから、前記存在確率を算出することを特徴とする請求項7または請求項8のいずれかに記載のユーザ特定装置。
同一人物候補選択手段、差分算出手段、存在確率算出手段、およびユーザ特定手段を備え、ユーザの位置情報、および当該位置情報の取得時刻を対応付けた位置ログを複数含む移動ログをユーザ毎に有する複数の位置情報サービスにおいて、同一人物のユーザを特定するユーザ特定装置におけるユーザ特定方法であって、
前記同一人物候補選択手段が、二つの位置情報サービスの移動ログを参照して、第1の位置情報サービスと第2の位置情報サービスとの間において、前記取得時刻が近接する位置ログを少なくとも1つ有するユーザの組合せを同一人物候補ペアとして選択する第1のステップと、
前記差分算出手段が、前記同一人物候補ペア毎に、前記取得時刻が近接する位置ログの位置情報および取得時刻それぞれの差分を位置ログ差分として算出する第2のステップと、
前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置ログ差分について拡散方程式を用いて、同時に同位置に前記同一人物候補ペアが存在できる確率を示す存在確率を算出する第3のステップと、
前記ユーザ特定手段が、前記同一人物候補ペア毎に、各位置ログ差分について前記代3のステップで算出された存在確率に予め設定されたしきい値以下が1つもない同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定する第4のステップと、
を含むことを特徴とするユーザ特定方法。
同一人物候補選択手段、差分算出手段、存在確率算出手段、およびユーザ特定手段を備え、ユーザの位置情報、および当該位置情報の取得時刻を対応付けた位置ログを複数含む移動ログをユーザ毎に有する複数の位置情報サービスにおいて、同一人物のユーザを特定するユーザ特定装置におけるユーザ特定方法をコンピュータに実行させるためのプログラムであって、
前記同一人物候補選択手段が、二つの位置情報サービスの移動ログを参照して、第1の位置情報サービスと第2の位置情報サービスとの間において、前記取得時刻が近接する位置ログを少なくとも1つ有するユーザの組合せを同一人物候補ペアとして選択する第1のステップと、
前記差分算出手段が、前記同一人物候補ペア毎に、前記取得時刻が近接する位置ログの位置情報および取得時刻それぞれの差分を位置ログ差分として算出する第2のステップと、
前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置ログ差分について拡散方程式を用いて、同時に同位置に前記同一人物候補ペアが存在できる確率を示す存在確率を算出する第3のステップと、
前記ユーザ特定手段が、前記同一人物候補ペア毎に、各位置ログ差分について前記代3のステップで算出された存在確率に予め設定されたしきい値以下が1つもない同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定する第4のステップと、
をコンピュータに実行させることを特徴とするプログラム。
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に記載の技術では、複数の位置情報サービスから得られた位置情報が完全に一致する瞬間がなければユーザを特定することができないという問題点があった。また、一般に位置情報サービスでログに残っている位置情報は不連続であるため、同一人物であっても、位置情報が完全に一致する瞬間があるとは限らないという問題点もあった。一方、特許文献2に記載の技術は、似たような位置を好むユーザを見つけるための技術であるため、全く異なる人物を同一人物とみなしてしまうことがあるという問題点があった。
【0007】
そこで、本発明は、上記課題に鑑み、複数の位置情報サービスにおけるユーザの位置情報を含む移動ログから、異なる位置情報サービスにおいて、同一人物のユーザを特定するユーザ特定装置、ユーザ特定方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0009】
(1) 本発明は、ユーザの位置情報、および当該位置情報の取得時刻を対応付けた位置ログを複数含む移動ログをユーザ毎に有する複数の位置情報サービスにおいて、同一人物のユーザを特定するユーザ特定装置であって、二つの位置情報サービスの移動ログを参照して、第1の位置情報サービスと第2の位置情報サービスとの間において、前記取得時刻が近接する位置ログを少なくとも1つ有するユーザの組合せを同一人物候補ペアとして選択する同一人物候補選択手段(例えば、
図1の同一人物候補選択部120に相当)と、前記同一人物候補ペア毎に、前記取得時刻が近接する位置ログの位置情報および取得時刻それぞれの差分を位置ログ差分として算出する差分算出手段(例えば、
図1の差分算出部130に相当)と、前記同一人物候補ペア毎に、各位置ログ差分について拡散方程式を用いて、同時に同位置に前記同一人物候補ペアが存在できる確率を示す存在確率を算出する存在確率算出手段(例えば、
図1の存在確率算出部140に相当)と、前記同一人物候補ペア毎に、各位置ログ差分について前記存在確率算出手段で算出された存在確率に予め設定されたしきい値以下が1つもない同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定するユーザ特定手段(例えば、
図1のユーザ特定部150に相当)と、を備えることを特徴とするユーザ特定装置を提案している。
【0010】
(2) 本発明は、(1)のユーザ特定装置において、前記存在確率算出手段が、前記同一人物候補ペアについて算出された位置ログ差分と、前記同一人物候補ペアの一のユーザの移動速度の分散を拡散係数とする拡散方程式とから、前記存在確率を算出することを特徴とするユーザ特定装置を提案している。
【0011】
(3) 本発明は、(2)のユーザ特定装置において、前記拡散係数が、前記同一人物候補ペアの一ユーザの移動ログに基づいて算出した移動速度の分散であることを特徴とするユーザ特定装置を提案している。
【0012】
(4) 本発明は、(3)のユーザ特定装置において、前記拡散係数が、予め設定された時間帯または地域毎に算出されることを特徴とするユーザ特定装置を提案している。
【0013】
(5) 本発明は、(1)から(4)のユーザ特定装置において、同一ユーザを含む複数の同一人物候補ペアを抽出した場合に、抽出した複数の同一人物候補ペア毎に、各位置ログ差分について前記存在確率算出手段で算出された存在確率の平均が最も高い同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定することを特徴とするユーザ特定装置を提案している。
【0014】
(6) 本発明は、(1)から(4)のユーザ特定装置において、前記移動ログがPOI情報を含み、前記ユーザ特定手段が、同一ユーザを含む複数の同一人物候補ペアを抽出した場合に、同一人物候補ペアのユーザ間におけるPOI同士の類似度と当該ユーザ間の位置ログの類似度とから算出されたユーザ間類似度がもっとも高い同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定することを特徴とするユーザ特定装置を提案している。
【0015】
(7) 本発明は、(1)から(6)のユーザ特定装置において、予め用意されている各移動方法の速度、経路情報、および停止または減速する節点情報と前記移動ログとに基づいて、移動方法を推定し、推定した移動方法に応じて移動速度を算出する移動速度推定手段を(例えば、
図3の移動速度推定部160に相当)備え、前記差分算出手段が、前記同一人物候補ペアにおける前記取得時刻が近接する位置ログと、当該同一人物候補ペアの一ユーザについて前記移動速度推定手段で推定された移動速度とに基づいて、他ユーザの取得時刻における前記一ユーザの予測位置情報を算出し、算出された予測位置情報と前記他ユーザの位置情報との差分を位置情報差分として算出し、前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置情報差分について拡散方程式を用いて、前記存在確率を算出することを特徴とするユーザ特定装置を提案している。
【0016】
(8) 本発明は、(7)のユーザ特定装置において、前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置情報差分について、前記移動速度推定手段で推定された前記他ユーザの移動速度の分散を拡散係数とする拡散方程式を用いて、前記存在確率を算出することを特徴とするユーザ特定装置を提案している。
【0017】
(9) 本発明は、(7)または(8)のユーザ特定装置において、前記差分算出手段が、前記同一人物候補ペアにおける前記取得時刻が近接する位置ログと、当該同一人物候補ペアの一ユーザについて前記移動速度推定手段で推定された移動速度とに基づいて、他ユーザの取得時刻における前記一ユーザの予測位置情報を算出し、算出された予測位置情報と前記他ユーザの位置情報との差分を位置情報差分として算出するとともに、前記同一人物候補ペアにおける前記取得時刻が近接する位置ログにおいて、前記一ユーザの前記移動速度推定手段で推定された移動速度と前記他ユーザの前記移動速度推定手段で推定された移動速度との差分を速度差分として算出し、前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置情報差分について拡散方程式を用いて算出した位置に基づく存在確率と、各速度差分について拡散方程式を用いて算出した速度に基づく存在確率とから、前記存在確率を算出することを特徴とするユーザ特定装置を提案している。
【0018】
(10) 本発明は、同一人物候補選択手段、差分算出手段、存在確率算出手段、およびユーザ特定手段を備え、ユーザの位置情報、および当該位置情報の取得時刻を対応付けた位置ログを複数含む移動ログをユーザ毎に有する複数の位置情報サービスにおいて、同一人物のユーザを特定するユーザ特定装置におけるユーザ特定方法であって、前記同一人物候補選択手段が、二つの位置情報サービスの移動ログを参照して、第1の位置情報サービスと第2の位置情報サービスとの間において、前記取得時刻が近接する位置ログを少なくとも1つ有するユーザの組合せを同一人物候補ペアとして選択する第1のステップ(例えば、
図2のステップS1,S2に相当)と、前記差分算出手段が、前記同一人物候補ペア毎に、前記取得時刻が近接する位置ログの位置情報および取得時刻それぞれの差分を位置ログ差分として算出する第2のステップ(例えば、
図2のステップS3に相当)と、前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置ログ差分について拡散方程式を用いて、同時に同位置に前記同一人物候補ペアが存在できる確率を示す存在確率を算出する第3のステップ(例えば、
図2のステップS4に相当)と、前記ユーザ特定手段が、前記同一人物候補ペア毎に、各位置ログ差分について前記代3のステップで算出された存在確率に予め設定されたしきい値以下が1つもない同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定する第4のステップ(例えば、
図2のステップS5〜S7に相当)と、を含むことを特徴とするユーザ特定方法を提案している。
【0019】
(11) 本発明は、同一人物候補選択手段、差分算出手段、存在確率算出手段、およびユーザ特定手段を備え、ユーザの位置情報、および当該位置情報の取得時刻を対応付けた位置ログを複数含む移動ログをユーザ毎に有する複数の位置情報サービスにおいて、同一人物のユーザを特定するユーザ特定装置におけるユーザ特定方法をコンピュータに実行させるためのプログラムであって、前記同一人物候補選択手段が、二つの位置情報サービスの移動ログを参照して、第1の位置情報サービスと第2の位置情報サービスとの間において、前記取得時刻が近接する位置ログを少なくとも1つ有するユーザの組合せを同一人物候補ペアとして選択する第1のステップ(例えば、
図2のステップS1,S2に相当)と、前記差分算出手段が、前記同一人物候補ペア毎に、前記取得時刻が近接する位置ログの位置情報および取得時刻それぞれの差分を位置ログ差分として算出する第2のステップ(例えば、
図2のステップS3に相当)と、前記存在確率算出手段が、前記同一人物候補ペア毎に、各位置ログ差分について拡散方程式を用いて、同時に同位置に前記同一人物候補ペアが存在できる確率を示す存在確率を算出する第3のステップ(例えば、
図2のステップS4に相当)と、前記ユーザ特定手段が、前記同一人物候補ペア毎に、各位置ログ差分について前記代3のステップで算出された存在確率に予め設定されたしきい値以下が1つもない同一人物候補ペアを抽出し、抽出した同一人物候補ペアを同一人物として特定する第4のステップ(例えば、
図2のステップS5〜S7に相当)と、をコンピュータに実行させることを特徴とするプログラムを提案している。
【発明の効果】
【0020】
本発明によれば、複数の位置情報サービスにおけるユーザの位置情報を含む移動ログから、異なる位置情報サービスにおいて、同一人物のユーザを特定することができる。
【発明を実施するための形態】
【0022】
以下、図面を用いて、本発明の実施形態について詳細に説明する。なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0023】
<第1の実施形態>
図1は、本発明の第1の実施形態に係るユーザ特定装置100の機能構成を示す図である。ユーザ特定装置100は、複数の位置情報サービスにおけるユーザの移動ログから、異なる位置情報サービスにおいて同一人物のユーザを特定する装置であって、
図1に示すように、位置情報サービス選択部110、同一人物候補選択部120、差分算出部130、存在確率算出部140、およびユーザ特定部150を備える。
【0024】
本実施形態において、ユーザ特定装置100は、複数の位置情報サービスのサーバと接続されている。ここで、複数の位置情報サービスのサーバは、ユーザの位置情報、および位置情報を取得した取得時刻を対応付けた位置ログをユーザの端末から取得し、取得した位置ログをユーザ毎にまとめて移動ログとして蓄積している。
【0025】
なお、ユーザ特定装置100は、処理を実行する際に複数の位置情報サービスのサーバから移動ログを取得してもよいし、定期的に複数の位置情報サービスのサーバから移動ログを取得し装置内に記憶しておいてもよい。また、ユーザ特定装置100は、位置情報サービスのサーバ内に備えられてもよい。
【0026】
位置情報サービス選択部110は、複数の位置情報サービスの中から2つの位置情報サービスの組合せを選択し、選択した位置情報サービスの移動ログを取得する。位置情報サービス選択部110は、選択した2つの位置情報サービスについて、各機能部を経て同一人物のユーザが特定されると、続いて、異なる組合せの位置情報サービスを選択し、複数の位置情報サービス全ての組合せについて順次選択する。
【0027】
なお、管理者等が、位置情報サービス選択部110で選択する位置情報サービスの1つまたは複数を指定することもできる。本実施形態において、位置情報サービス選択部110で選択された2つの位置情報サービスを、サービス1およびサービス2とし、それぞれの移動ログをS1,S2とする。
【0028】
同一人物候補選択部120は、位置情報サービス選択部110から受信した移動ログS1,S2を参照して、サービス1およびサービス2の間において、移動ログに含まれる位置ログのうち取得時刻が近接する位置ログを有するユーザの組合せを、同一人物の可能性がある同一人物候補ペアとして選択する。また、同一人物候補選択部120は、選択した同一人物候補ペアについて、両者の移動ログS1,S2から取得時刻が近接する位置ログの組合せ(以下、近接ログペアという)を抽出する。
【0029】
同一人物候補選択部120の処理について、具体例を用いて説明する。サービス1を利用するユーザをa
i(i=1,2,・・・,n)、位置ログの位置情報をx、取得時刻をtとすると、サービス1を利用する各ユーザの移動ログS1は、(1)式のように表すことができる。なお、位置ログは時系列に並べられているのが望ましい。
【0031】
サービス2についても、サービス1と同様に、サービス2を利用するユーザをb
j(j=1,2,・・・,m)、位置ログの位置情報をx、取得時刻をtとすると、サービス2を利用する各ユーザの移動ログS2は、(2)式のように表すことができる。サービス2についても、位置ログは時系列に並べられているのが望ましい。
【0033】
同一人物候補選択部120は、サービス1のユーザa
iの移動ログS1に含まれる位置ログの取得時刻t(a
i,n)に近接する取得時刻を有する位置ログを少なくとも1つ有するサービス2の移動ログS2のユーザを、サービス2の全ユーザの中から特定し(ここでは、ユーザb
jとする)、ユーザa
iとユーザb
jとの組合せを同一人物候補ペアとして選択する。ここで、近接する取得時刻とは、サービス1のユーザa
iの取得時刻t(a
i,n)との時間差分が、予め設定された閾値以下の取得時刻をいう。
【0034】
なお、ユーザa
iと同一人物候補ペアとなるサービス2のユーザb
jは1人とは限らなく、また、ユーザa
iと同一人物候補ペアとなるサービス2のユーザb
jがいるとも限らない。
【0035】
また、同一人物候補選択部120は、同一人物候補ペアであるユーザa
iとユーザb
jの移動ログS1
ai,S2
bjから、取得時刻が近接する位置ログの組合せである近接ログペアを抽出する。例えば、ユーザa
iの取得時刻t(a
i,n)と、ユーザb
jの取得時刻t(b
j,m)とが近接する場合には、{x(a
i,n),t(a
i,n)}と、{x(b
j,m),t(b
j,m)}とを近接ログペアとして抽出する。なお、近接ログペアは複数であってもよい。
【0036】
同一人物候補選択部120は、サービス1を利用しているすべてのユーザについて上述した処理を行って、サービス1とサービス2との間における同一人物候補ペアを選択し、それぞれの近接ログペアを抽出する。
【0037】
以下、説明に、同一人物候補選択部120で選択された同一人物候補ペアとして(ユーザa
i,ユーザb
j)を、近接ログペアとして[{x(a
i,n),t(a
i,n)},{x(b
j,m),t(b
j,m)}]を用いる。
【0038】
差分算出部130は、同一人物候補選択部120で選択された同一人物候補ペア毎に、抽出された近接ログペアから、位置情報の差分Δx、および取得時刻の差分Δtを位置ログ差分として算出する。差分算出部130は、一の同一人物候補ペアについて、近接ログペアが複数ある場合にはそれぞれについて位置ログ差分を算出する。具体的には、同一人物候補ペアが(ユーザa
i,ユーザb
j)の位置ログ差分のΔxおよびΔtは、(3)式のように表わされる。
【0040】
存在確率算出部140は、同一人物候補選択部120で選択された同一人物候補ペア毎に、各近接ログペアについて差分算出部130で算出された位置ログ差分について、拡散方程式を用いて、同時に同位置に同一人物候補ペアが存在できる確率を示す存在確率を算出する。存在確率は、言い換えると、同一人物候補ペアのユーザが位置ログ差分の時間Δtの間にΔx移動することができる確率であり、同一人物候補ペアが別人であるほど小さい値となる。存在確率は、ユーザがランダムウォークで移動する場合には拡散方程式に従うので、位置ログ差分と拡散方程式とから算出することができる。存在確率の算出に用いる拡散方程式は、(4)式で表される。(新・工科系の物理学 4 工学基礎「熱力学・統計力学」,堂寺知成, 数理工学社 (2009)参照)。
【0042】
(4)式のxに位置ログ差分のΔx、tに位置ログ差分のΔtを代入して、存在確率p(Δx,Δt)について、一次元で解いた結果は(5)式となり、ガウス分布の式に等しい。
【0044】
(4)式および(5)式の拡散係数Dは、人間がどれだけ活発に移動するかを示す定数であって、任意に設定してもよいし、ユーザの移動速度に基づいて算出してもよい。なお、ユーザがどれだけ活発に移動するかは、ユーザ毎に異なる可能性が高いので、拡散係数Dはユーザ毎に異なる。
【0045】
拡散係数Dを、ユーザの移動速度に基づいて算出する場合について、説明する。ユーザの移動が(5)式のガウス分布に従う場合、単位時間あたりの移動距離vの分散は(6)式に従う。そして、単位時間あたりの移動距離vの分散がσ
2であることから、移動ログから算出した各位置での単位時間あたりの移動距離vの分散から、拡散係数Dを求めることができる。
【0047】
例えば、同一人物候補ペア(ユーザa
i,ユーザb
j)についての存在確率を求める場合に用いる拡散方程式の拡散係数Dは、(7)式に示す、移動ログS1の各位置における単位時間あたりの移動距離v(l)(移動速度)の分散から求めることができる。(7)式に示すように、v(l)は、ユーザa
iの移動ログS1における近傍のログを用いて算出される。なお、v(l)は、ユーザb
jの移動ログS2における近傍のログを用いて算出されてもよい。
【0049】
また、人間がどれだけ活発に移動するかは、時間帯や場所に応じて変化する可能性が高いことから、拡散係数Dは地域毎や時間帯毎に算出してもよい。具体的には、vを地域毎や時間帯毎に算出して、単位時間あたりの移動距離vの分散を求めることで、拡散係数Dを地域毎や時間帯毎に算出する。
【0050】
ユーザ特定部150は、同一人物候補選択部120で選択された同一人物候補ペア毎に、各近接ログペアについて存在確率算出部140で算出された存在確率の中に、予め設定されたしきい値以下のものがあるか否かを判断する。ユーザ特定部150は、しきい値以下の存在確率がある同一人物候補ペアは同一人物ではないとして抽出しない。1人の人間は同時に複数の位置に存在できないからである。一方、ユーザ特定部150は、しきい値以下の存在確率がある同一人物候補ペアを抽出する。
【0051】
ユーザ特定部150は、抽出した同一人物候補ペアの中に、同一ユーザを含む他の同一人物候補ペアがない同一人物候補ペアのサービスS1のユーザa
iとサービスS2のユーザb
jとを同一人物と特定する。一方、ユーザ特定部150は、取得した同一人物候補ペアの中に、同一ユーザを含む他の同一人物候補ペアがある場合には、同一ユーザを含む同一人物候補ペアの中から一の同一人物候補ペアを抽出し、抽出した同一人物候補ペアのサービスS1のユーザa
iとサービスS2のユーザb
jとを同一人物と特定する。なお、抽出された同一人物候補ペア全てを同一人物として特定して提示し、提示された者が最終的な判断するようにしてもよい。
【0052】
取得した同一人物候補ペアの中に同一ユーザを含む他の同一人物候補ペアがある場合において、同一ユーザを含む同一人物候補ペアの中から一の同一人物候補ペアを取得する方法には、存在確率を用いる方法と同一人物候補ペアのユーザa
iとユーザb
j間の類似度を用いる方法とがある。
【0053】
存在確率を用いる方法では、ユーザ特定部150は、同一ユーザを含む同一人物候補ペア毎に、各近接ログペアについて存在確率算出部140で算出された存在確率の平均が最も高い同一人物候補ペアを取得し、取得した同一人物候補ペアを同一人物として特定する。
【0054】
同一人物候補ペアのユーザa
iとユーザb
j間の類似度を用いる方法では、特許文献2に記載の技術を用いて、同一人物候補ペアのユーザa
iとユーザb
j間におけるPOI(Point of Interest)同士の類似度とユーザa
iの移動ログS1とユーザb
jの移動ログS2の類似度とから算出されたユーザ間類似度とが最も高い同一人物候補ペアを取得し、取得した同一人物候補ペアを同一人物として特定する。なお、この方法を用いるには、移動ログに、POI情報が含まれている必要がある。
【0055】
図2は、本実施形態に係るユーザ特定装置100におけるユーザ特定処理フローを示す図である。位置情報サービス選択部110が、複数の位置情報サービスの中から2つの位置情報サービス(サービス1およびサービス2)の組合せを選択し、選択した位置情報サービスの移動ログ(S1およびS2)を取得すると本処理は開始する。
【0056】
まず、ステップS1において、同一人物候補選択部120は、位置情報サービス選択部110で取得した移動ログS1,S2を参照して、サービス1およびサービス2の間において、移動ログに含まれる位置ログの取得時刻が近接する位置ログを有するユーザの組合せを、同一人物の可能性がある同一人物候補ペアとして選択する。
【0057】
次に、ステップS2において、同一人物候補選択部120は、ステップS2で選択した同一人物候補ペアであるユーザa
iとユーザb
jとそれぞれの移動ログS1
ai,S2
bjから、取得時刻が近接する位置ログの組合せである近接ログペアを抽出する。
【0058】
次に、ステップS3において、差分算出部130は、ステップS1で選択された同一人物候補ペア毎に、ステップS2で抽出された近接ログペアから、位置情報の差分Δx、および取得時刻の差分Δtを位置ログ差分として算出する。
【0059】
次に、ステップS4において、存在確率算出部140は、ステップS2で選択された同一人物候補ペア毎に、ステップS3で算出された各近接ログペアの位置ログ差分について拡散方程式を用いて、存在確率を算出する。
【0060】
次に、ステップS5において、ユーザ特定部150は、一の同一人物候補ペアについて、各近接ログペアの位置ログ差分について存在確率算出部140で算出された存在確率の中に、予め設定されたしきい値以下のものがあるか否かを判断する。しきい値以下の存在確率がない場合(NO)には、ステップS6に処理を進め、一方、しきい値以下の存在確率がある場合(YES)には、ステップS7に処理を進める。
【0061】
次に、ステップS6において、ユーザ特定部150は、同一人物候補ペアのサービスS1のユーザa
iとサービスS2のユーザb
jとを同一人物と特定する。
【0062】
次に、ステップS7において、ユーザ特定部150は、ステップS2で選択された同一人物候補ペア全てについてステップS5およびS6の処理を行ったか否か判断する。同一人物候補ペア全てについてステップS5およびS6の処理を行った場合(YES)には処理を終了し、一方、同一人物候補ペア全てについてステップS5およびS6の処理を行っていない場合(NO)には、ステップS5に処理を戻す。
【0063】
以上、説明したように、本実施形態によれば、1人のユーザが同時に複数の位置に存在することは無いという仮定に基づいて、複数の位置情報サービスにおけるユーザの移動ログを用いて、異なる位置情報サービス間において別人である確率が高いユーザを排除することで、同一人物のユーザを特定することができる。その結果、異なる位置情報サービス間のデータをユーザ毎に統合して分析対象データを増やすことにより、ユーザの嗜好や行動傾向等を的確に把握して提供するサービスに反映すること等が可能になる。
【0064】
<第2の実施形態>
図3を用いて、本発明の第2の実施形態について説明する。本実施形態においては、位置情報サービスを利用するユーザの移動速度を推定し、推定した移動速度を用いて異なる位置情報サービスにおいて同一人物のユーザを特定する場合について説明する。なお、第1の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
【0065】
図3は、本発明の第2の実施形態に係るユーザ特定装置101の機能構成を示す図である。ユーザ特定装置101は、複数の位置情報サービスにおけるユーザの移動ログから、異なる位置情報サービスにおいて同一人物のユーザを特定する装置であって、
図3に示すように、位置情報サービス選択部110、同一人物候補選択部120、差分算出部131、存在確率算出部141、ユーザ特定部150、および移動速度推定部160を備える。
【0066】
移動速度推定部160は、特開2013−148486号公報に記載の技術を用いて、予め用意されている各移動手段の速度、経路情報、および停止または減速する節点情報と、ユーザの移動ログとに基づいて、鉄道、バス、徒歩といった移動方法を移動ログにおける各位置ついて推定する。そして、移動速度推定部160は、推定した移動方法の特徴(例えば、移動方法がバスの場合には、停留所で停止する)によって、移動ログから算出した移動速度を補正することで、移動ログにおける各位置の移動速度をより正確に推定する。以下、移動方法により補正した移動速度を推定移動速度という。
【0067】
差分算出部131は、まず、同一人物候補ペアの一ユーザ(ユーザb
jとする)について、近接ログペアに含まれるユーザb
jの位置ログにおける推定移動速度を移動速度推定部160から取得する。ここで、同一人物候補ペアの一ユーザ(ユーザb
j)は、移動速度推定部160で移動速度を推定可能なユーザであって、少なくとも同一人物候補ペアの一方について推定可能なことが必要である。
【0068】
次に、差分算出部131は、移動速度推定部160から取得したユーザb
jの推定移動速度と近接ログペアに含まれる他ユーザ(ユーザa
iとする)の位置ログとに基づいて、他ユーザa
iの取得時刻におけるユーザb
jの予測位置情報を算出する。そして、差分算出部131は、算出したユーザb
jの予測位置情報と他ユーザa
iの位置ログ(近接ログペアに含まれる)の位置情報との差分を位置情報差分Δxとして算出する。差分算出部131は、近接ログペア毎に、上述したように予測位置情報を用いて位置情報差分Δxを算出する。
【0069】
同一人物候補ペア(ユーザa
i,ユーザb
j)の近接ログペアが、[{x(a
i,n),t(a
i,n)},{x(b
j,m),t(b
j,m)}]の場合には、まず、差分算出部131は、ユーザb
jについて、x(b
j,m)における推定移動速度v(b
j,m)を移動速度推定部160から取得する。そして、差分算出部131は、(8)式に示すように、x(b
j,m)、近接ログペア内の取得時刻の差分Δt、取得した移動速度v(b
j,m)から、ユーザa
iの取得時刻におけるユーザb
jの予測位置情報を算出し、x(a
i,n)から引くことで位置情報差分Δxを算出する。
【0071】
存在確率算出部141は、同一人物候補選択部120で選択された同一人物候補ペア毎に、各近接ログペアについて差分算出部130で算出された位置情報差分Δxについて拡散方程式を用いて、存在確率を算出する。本実施形態において、存在確率p(Δx)は、(9)式で表わされる。
【0073】
拡散係数Dは、実施形態1と同様に任意に設定してもよいし、ユーザの移動速度に基づいて算出してもよい。拡散係数Dをユーザの移動速度に基づいて算出する場合に、実施形態1では移動ログから算出した移動速度を利用したが、本実施形態では移動速度推定部160で算出した推定移動速度を利用してもよい。なお、差分算出部131で予測位置情報を算出しなかったユーザa
iについて移動速度推定部160で推定移動速度を算出できる場合には、ユーザa
iの推定移動速度を利用するのが望ましい。その場合には、移動速度推定部160でユーザa
iの移動ログS1における各位置の推定移動速度を算出し、算出した推定移動速度の分散から拡散係数Dを求める。それにより、より精度よく存在確率p(Δx)を得ることができる。
【0074】
以上、説明したように、本実施形態によれば、ユーザの移動速度を推定することで、2つの位置情報サービスにおいて、同時刻のユーザの位置が推定できることにより、別人である確率が高いユーザを排除ために用いる存在確率の精度が向上でき、より高い精度で同一人物のユーザを特定することができる。
【0075】
<第3の実施形態>
図4を用いて、本発明の第3の実施形態について説明する。本実施形態においては、位置情報サービスを利用するユーザの移動速度を推定し、推定した移動速度を用いて異なる位置情報サービスにおいて同一人物のユーザを特定する場合について説明する。なお、第1および2の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
【0076】
図4は、本発明の第3の実施形態に係るユーザ特定装置102の機能構成を示す図である。ユーザ特定装置102は、複数の位置情報サービスにおけるユーザの移動ログから、異なる位置情報サービスにおいて同一人物のユーザを特定する装置であって、
図4に示すように、位置情報サービス選択部110、同一人物候補選択部120、差分算出部132、存在確率算出部142、ユーザ特定部150、移動速度推定部160を備える。
【0077】
差分算出部132は、実施形態2で説明した差分算出部131と同様に、位置情報差分を算出するとともに、同一人物候補選択部120で選択された同一人物候補ペア毎に、近接ログペアに含まれる位置ログにおける位置について移動速度推定部160で算出された移動速度の差分を速度差分として算出する。なお、差分算出部132は、位置情報差分の代わりに、実施形態1で説明した位置ログ差分を算出するとともに、速度差分を算出してもよい。
【0078】
具体的には、同一人物候補ペア(ユーザa
i,ユーザb
j)の近接ログペアが、[{x(a
i,n),t(a
i,n)},{x(b
j,m),t(b
j,m)}]の場合には、ユーザa
iの位置ログ{x(a
i,n),t(a
i,n)}における推定移動速度V
aiと、ユーザb
jの位置ログ{x(b
j,m),t(b
j,m)}における推定移動速度V
bjとを、差分算出部132は、移動速度推定部160に算出させる。そして、差分算出部132は、(10)式に示すように、算出された推定移動速度V
aiと推定移動速度V
bjとの差分を速度差分Δvとして算出する
【0080】
存在確率算出部142は、実施形態2で説明した存在確率算出部141と同様に、同一人物候補ペア毎に、各近接ログペアの位置情報差分について存在確率p(Δx)を算出するとともに、差分算出部132で算出された速度差分について存在確率p(Δv)も算出する。存在確率p(Δv)は、同一人物候補ペアが同一人物であれば両者の同時刻では、位置だけでなく、速度も等しいからである。速度変化もガウス分布に従うとすると、速度差分に基づく存在確率は(11)式で算出することができる。
【0082】
そして、存在確率算出部142は、同じ近接ログペアから、位置情報差分について算出された存在確率p(Δx)と、速度差分について算出された存在確率p(Δv)との線形和を存在確率pとして算出する。このように、存在確率pを、位置ログ差分だけでなく速度差分についても考慮して算出することにより、存在確率pの精度を向上させることができる。なお、差分算出部132で位置情報差分に代わって位置ログ差分を算出した場合には、存在確率算出部142は、位置ログ差分について算出された存在確率p(Δx,Δt)と、速度差分について算出された存在確率p(Δv)との線形和を存在確率pとして算出する。
【0083】
以上、説明したように、本実施形態によれば、2つの位置情報サービスにおけるユーザの移動速度を推定することで、2つの位置情報サービスにおいて、近接時刻におけるユーザの位置の差および速度の差から、別人である確率が高いユーザを排除ために用いる存在確率を算出することにより、存在確率の精度が向上し、よりも高い精度で同一人物のユーザを特定することができる。
【0084】
なお、ユーザ特定装置の処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたユーザ特定装置に読み込ませ、実行することによって本発明のユーザ特定装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
【0085】
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0086】
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。更に、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0087】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。