特許6618981 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ノキア　ソリューションズ　アンド　ネットワークス　オサケユキチュアの特許一覧

特許6618981ユーザ移動プロファイリング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6618981

(24)【登録日】2019年11月22日

(45)【発行日】2019年12月11日

(54)【発明の名称】ユーザ移動プロファイリング

(51)【国際特許分類】

G06F 16/906 20190101AFI20191202BHJP

G06F 16/909 20190101ALI20191202BHJP

H04W 4/029 20180101ALI20191202BHJP

【ＦＩ】

G06F16/906

G06F16/909

H04W4/029

【請求項の数】12

【外国語出願】

【全頁数】28

(21)【出願番号】特願2017-236734(P2017-236734)

(22)【出願日】2017年12月11日

(65)【公開番号】特開2018-106704(P2018-106704A)

(43)【公開日】2018年7月5日

【審査請求日】2017年12月26日

(31)【優先権主張番号】20166016

(32)【優先日】2016年12月22日

(33)【優先権主張国】FI

(73)【特許権者】

【識別番号】513311642

【氏名又は名称】ノキアソリューションズアンドネットワークスオサケユキチュア

(74)【代理人】

【識別番号】100094569

【弁理士】

【氏名又は名称】田中伸一郎

(74)【代理人】

【識別番号】100088694

【弁理士】

【氏名又は名称】弟子丸健

(74)【代理人】

【識別番号】100103610

【弁理士】

【氏名又は名称】▲吉▼田和彦

(74)【代理人】

【識別番号】100067013

【弁理士】

【氏名又は名称】大塚文昭

(74)【代理人】

【識別番号】100086771

【弁理士】

【氏名又は名称】西島孝喜

(74)【代理人】

【識別番号】100109070

【弁理士】

【氏名又は名称】須田洋之

(74)【代理人】

【識別番号】100109335

【弁理士】

【氏名又は名称】上杉浩

(74)【代理人】

【識別番号】100120525

【弁理士】

【氏名又は名称】近藤直樹

(74)【代理人】

【識別番号】100158469

【弁理士】

【氏名又は名称】大浦博司

(72)【発明者】

【氏名】クリスティアンジョルトヴァルガ

(72)【発明者】

【氏名】フェレンツコバチ

(72)【発明者】

【氏名】ゾルタンラザル

【審査官】原秀人

(56)【参考文献】

【文献】特開２０１４−００６８４２（ＪＰ，Ａ）

【文献】特開２０１６−１５２５２７（ＪＰ，Ａ）

【文献】特表２０１３−５０９６２８（ＪＰ，Ａ）

【文献】特開２０１０−１９７６７７（ＪＰ，Ａ）

【文献】米国特許第０８８３０９０９（ＵＳ，Ｂ１）

【文献】米国特許第０８４１２２３４（ＵＳ，Ｂ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１６／００

Ｈ０４Ｗ４／０２９

(57)【特許請求の範囲】

【請求項1】

【数1】

および

【数2】

の１つによって計算され、Ｃ_1,iおよびＣ_2,iはそれぞれ前記ユーザ１および前記ユーザ２の前記時間間隔ｉの前記バケット内の前記位置データの集合を表し、

【数3】

は共通集合演算子を表し、

【数4】

は和集合演算子を表し、

【数5】

はそれぞれの集合の濃度を表す、装置。

【請求項2】

少なくとも１つのプロセッサ、コンピュータプログラムコードを含んだ少なくとも１つのメモリを備えた装置であって、前記少なくとも１つのプロセッサは、前記少なくとも１つのメモリおよび前記コンピュータプログラムコードを用いて、前記装置に少なくとも、複数のユーザのそれぞれの位置データを、前記ユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、前記位置データのそれぞれは所定の期間のある時点での前記それぞれのユーザの位置を示し、前記バケットのそれぞれは前記期間のそれぞれの時間間隔を含み、前記時間間隔は重複せず前記期間を包含し、前記時間間隔は前記ユーザのすべてに対して同じであり、前記時間間隔のそれぞれに対して前記ユーザのそれぞれのためのバケットが存在するステップと、
前記ユーザの各ペアに対しておよび前記時間間隔のそれぞれに対して、前記それぞれのバケット内の前記位置データに基づいて、前記それぞれのペアの前記ユーザの間のそれぞれの部分距離を計算するステップと、
前記ユーザの前記ペアのそれぞれに対して、前記それぞれのペアの前記ユーザの間の距離を取得するために、前記期間にわたる前記部分距離を総計するステップと、
前記ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有する前記ユーザをクラスタ化するステップと
を少なくとも行わせるように構成され、
前記少なくとも１つのプロセッサは、前記少なくとも１つのメモリおよび前記コンピュータプログラムコードを用いて、前記装置に、
前記それぞれのクラスタ内の前記ユーザの数が、所定の数より大きいかどうかをチェックするステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい第１のセルを決定するステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい場合、前記第１のセル内のセルブロードキャストによって、前記ユーザに情報をもたらすステップと、前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きくない場合、専用メッセージによって前記ユーザに前記情報をもたらすステップと
をさらに行わせるように構成される、装置。

【請求項3】

少なくとも１つのプロセッサ、コンピュータプログラムコードを含んだ少なくとも１つのメモリを備えた装置であって、前記少なくとも１つのプロセッサは、前記少なくとも１つのメモリおよび前記コンピュータプログラムコードを用いて、前記装置に少なくとも、複数のユーザのそれぞれの位置データを、前記ユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、前記位置データのそれぞれは所定の期間のある時点での前記それぞれのユーザの位置を示し、前記バケットのそれぞれは前記期間のそれぞれの時間間隔を含み、前記時間間隔は重複せず前記期間を包含し、前記時間間隔は前記ユーザのすべてに対して同じであり、前記時間間隔のそれぞれに対して前記ユーザのそれぞれのためのバケットが存在するステップと、
前記ユーザの各ペアに対しておよび前記時間間隔のそれぞれに対して、前記それぞれのバケット内の前記位置データに基づいて、前記それぞれのペアの前記ユーザの間のそれぞれの部分距離を計算するステップと、
前記ユーザの前記ペアのそれぞれに対して、前記それぞれのペアの前記ユーザの間の距離を取得するために、前記期間にわたる前記部分距離を総計するステップと、
前記ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有する前記ユーザをクラスタ化するステップと
を少なくとも行わせるように構成され、
前記少なくとも１つのプロセッサは、前記少なくとも１つのメモリおよび前記コンピュータプログラムコードを用いて、前記装置に、
前記それぞれのクラスタ内の前記ユーザの数が所定の数より大きいかどうかをチェックするステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい第２のセルを決定するステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい場合、前記第２のセルの容量を増加させるステップと
をさらに行わせるように構成される、装置。

【請求項4】

前記位置データは通信ネットワークから取得されたハンドオーバデータであり、および／または前記位置データは測位システムから取得されたデータである請求項１から３までのいずれか１項に記載の装置。

【請求項5】

前記クラスタ化するステップは、凝集型階層的クラスタリングによって行われる、請求項１から４までのいずれか１項に記載の装置。

【請求項6】

方法であって、
複数のユーザのそれぞれの位置データを、前記ユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、前記位置データのそれぞれは、所定の期間のある時点での前記それぞれのユーザの位置を示し、前記バケットのそれぞれは、前記期間のそれぞれの時間間隔を含み、前記時間間隔は重複せず前記期間を包含し、前記時間間隔は前記ユーザのすべてに対して同じであり、前記時間間隔のそれぞれに対して前記ユーザのそれぞれのためのバケットが存在するステップと、
前記ユーザの各ペアに対して、および前記時間間隔のそれぞれに対して、前記それぞれのバケット内の前記位置データに基づいて、前記それぞれのペアの前記ユーザの間のそれぞれの部分距離を計算するステップと、
前記ユーザの前記ペアのそれぞれに対して、前記それぞれのペアの前記ユーザの間の距離を取得するために、前記期間にわたる前記部分距離を総計するステップと、
前記ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有する前記ユーザをクラスタ化するステップと
を含み、
前記時間間隔ｉにおける前記ユーザのユーザ１とユーザ２の間の部分距離ｄ（Ｃ_1,i，Ｃ_2,i）は以下の式、

【数6】

および

【数7】

【数8】

は共通集合演算子を表し、

【数9】

は和集合演算子を表し、

【数10】

はそれぞれの集合の濃度を表す、方法。

【請求項7】

方法であって、
複数のユーザのそれぞれの位置データを、前記ユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、前記位置データのそれぞれは、所定の期間のある時点での前記それぞれのユーザの位置を示し、前記バケットのそれぞれは、前記期間のそれぞれの時間間隔を含み、前記時間間隔は重複せず前記期間を包含し、前記時間間隔は前記ユーザのすべてに対して同じであり、前記時間間隔のそれぞれに対して前記ユーザのそれぞれのためのバケットが存在するステップと、
前記ユーザの各ペアに対して、および前記時間間隔のそれぞれに対して、前記それぞれのバケット内の前記位置データに基づいて、前記それぞれのペアの前記ユーザの間のそれぞれの部分距離を計算するステップと、
前記ユーザの前記ペアのそれぞれに対して、前記それぞれのペアの前記ユーザの間の距離を取得するために、前記期間にわたる前記部分距離を総計するステップと、
前記ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有する前記ユーザをクラスタ化するステップと
を含み、
前記それぞれのクラスタ内の前記ユーザの数が所定の数より大きいかどうかをチェックするステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい第１のセルを決定するステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい場合、前記第１のセル内のセルブロードキャストによって、前記ユーザに情報をもたらすステップと、前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きくない場合、専用メッセージによって前記ユーザに前記情報をもたらすステップと
をさらに含む、方法。

【請求項8】

方法であって、
複数のユーザのそれぞれの位置データを、前記ユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、前記位置データのそれぞれは、所定の期間のある時点での前記それぞれのユーザの位置を示し、前記バケットのそれぞれは、前記期間のそれぞれの時間間隔を含み、前記時間間隔は重複せず前記期間を包含し、前記時間間隔は前記ユーザのすべてに対して同じであり、前記時間間隔のそれぞれに対して前記ユーザのそれぞれのためのバケットが存在するステップと、
前記ユーザの各ペアに対して、および前記時間間隔のそれぞれに対して、前記それぞれのバケット内の前記位置データに基づいて、前記それぞれのペアの前記ユーザの間のそれぞれの部分距離を計算するステップと、
前記ユーザの前記ペアのそれぞれに対して、前記それぞれのペアの前記ユーザの間の距離を取得するために、前記期間にわたる前記部分距離を総計するステップと、
前記ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有する前記ユーザをクラスタ化するステップと
を含み、
前記それぞれのクラスタ内の前記ユーザの数が、所定の数より大きいかどうかをチェックするステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい第２のセルを決定するステップと、
前記それぞれのクラスタ内の前記ユーザの数が、前記所定の数より大きい場合、前記第２のセルの容量を増加させるステップと、
をさらに含む、方法。

【請求項9】

前記位置データは通信ネットワークから取得されたハンドオーバデータであり、かつ／または前記位置データは測位システムから取得されたデータである請求項６から８までのいずれか１項に記載の方法。

【請求項10】

前記クラスタ化するステップは、凝集型階層的クラスタリングによって行われる、請求項６から９までのいずれか１項に記載の方法。

【請求項11】

装置上で実行されたとき、請求項６から１０までのいずれか１項に記載の方法を装置に行わせるように構成された、命令のセットを備えるコンピュータプログラム。

【請求項12】

コンピュータ可読媒体に記録された、またはコンピュータに直接ロード可能な、請求項１１に記載のコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ユーザ移動プロファイリングに関連する装置、方法、およびコンピュータプログラム製品に関する。より詳細には本発明は、セル位置データに基づくユーザ移動プロファイリングに関連する装置、方法、およびコンピュータプログラム製品に関する。

【0002】

略語
３ＧＰＰ第３世代パートナーシッププロジェクト
Ａ−ＧＰＳアシスト型ＧＰＳ
ＤＢデータベース
Ｇｂ／ｓギガビット／秒
ＧＰＳ全地球測位システム
ＧＳＭ(登録商標) 移動体通信用グローバルシステム
ＧＵＩグラフィカルユーザインターフェース
ＭＮＯモバイルネットワークオペレータ
ＰｏＣ概念実証（ＰｒｏｏｆｏｆＣｏｎｃｅｐｔ）
ＰＯＩ興味のある地点（ＰｏｉｎｔｏｆＩｎｔｅｒｅｓｔ）
ＳＭＳショートメッセージサービス

【背景技術】

【0003】

モバイル行動のみから、微細な細分性でユーザおよび彼等の移動の位置を確認することは自明なことではない。ほとんどの測位システムは、デバイスの位置を能動的に監視するために、Ａ−ＧＰＳサポートを有するＧＰＳ（または同様な衛星システム）を用いる。しかしモバイルオペレータにとっては、あらゆるユーザを能動的に監視することは、いくつかの理由により現実的には選択肢とならない。
・ほとんどすべての場合においてＧＰＳデータは、オペレータはアクセスできないユーザのモバイルデバイスにおいてのみ使用可能である。
・ユーザのモバイルデバイスにアプリケーションを強制的にプッシュダウンすることは、販売が難しいプライバシー契約となり得る。
・ユーザが同意したとしても、すべてのモバイルタイプのためにアプリケーションを開発し、維持することはコストがかかる。
・常時の能動的な測位がバッテリーを消費し、ユーザエクスペリエンスの悪化に繋がることは言うまでもない。
この分野におけるいくつかの従来技術は以下の通りである。
ＩｄｅｎｔｉｆｉｃａｔｉｏｎｖｉａＬｏｃａｔｉｏｎ−ＰｒｏｆｉｌｉｎｇｉｎＧＳＭ(登録商標) Ｎｅｔｗｏｒｋｓ（２００８）
ＹｏｎｉＤｅＭｕｌｄｅｒ，ＧｅｏｒｇｅＤａｎｅｚｉｓ，ＬｅｊｌａＢａｔｉｎａ，ＢａｒｔＰｒｅｎｅｅｌ

【0004】

この論文において著者は、簡単な１次マルコフ連鎖および階層的クラスタリングを用いて、ＧＳＭ(登録商標)位置データからユーザの動きをプロファイリングした。後の期間において、これらのプロファイルからのユーザ識別に対しては、８０％の精度があること、および１ヶ月に収集された情報は非常に豊富でありその後長い間、ユーザを識別するために用いることができること、を彼等は主張している。
オンラインＰＤＦバージョンは、ｈｔｔｐ：／／ｗｗｗ０．ｃｓ．ｕｃｌ．ａｃ．ｕｋ／ｓｔａｆｆ／Ｇ．Ｄａｎｅｚｉｓ／ｐａｐｅｒｓ／ＧＳＭ(登録商標)Ｌｏｃａｔｉｏｎ−ｐｒｏｆｉｌｅ．ｐｄｆにおいて入手可能である。
ＭｏｂｉｌｉｔｙＰｒｏｆｉｌｅｒ：ＡＦｒａｍｅｗｏｒｋｆｏｒＤｉｓｃｏｖｅｒｉｎｇＭｏｂｉｌｅＵｓｅｒＰｒｏｆｉｌｅｓ（２００８）
ＡｌｉＭｕｒａｔ，ＤｅｍｉｒｂａｓＭｕｒａｔ，ＥａｇｌｅＮａｔｈａｎ

【0005】

この論文は、セルタワー振動（すなわちピンポン）などの問題も取り扱う、完結したモビリティプロファイラフレームワークを導入している。彼等は、セルモビリティパスを構築し、反復して振動するセルペアを識別することによってピンポンを低減し、それらをセルクラスタに変換する。その後彼等は、主要パターンをフィルタ除去し、評価するために、順次的な先験的アルゴリズムを用いた。これらのパターンは、そのユーザのモビリティプロファイルを組み立てることになる。
オンラインＰＤＦバージョン：ｈｔｔｐ：／／ｗｗｗ．ｃｓｅ．ｂｕｆｆａｌｏ．ｅｄｕ／ｔｅｃｈ−ｒｅｐｏｒｔｓ／２００８−１７．ｐｄｆ

【先行技術文献】

【非特許文献】

【0006】

【非特許文献1】ＩｄｅｎｔｉｆｉｃａｔｉｏｎｖｉａＬｏｃａｔｉｏｎ−ＰｒｏｆｉｌｉｎｇｉｎＧＳＭ(登録商標) Ｎｅｔｗｏｒｋｓ（２００８），ＹｏｎｉＤｅＭｕｌｄｅｒ，ＧｅｏｒｇｅＤａｎｅｚｉｓ，ＬｅｊｌａＢａｔｉｎａ，ＢａｒｔＰｒｅｎｅｅｌ

【非特許文献2】ｈｔｔｐ：／／ｗｗｗ０．ｃｓ．ｕｃｌ．ａｃ．ｕｋ／ｓｔａｆｆ／Ｇ．Ｄａｎｅｚｉｓ／ｐａｐｅｒｓ／ＧＳＭ(登録商標)Ｌｏｃａｔｉｏｎ−ｐｒｏｆｉｌｅ．ｐｄｆ

【非特許文献3】ＭｏｂｉｌｉｔｙＰｒｏｆｉｌｅｒ：ＡＦｒａｍｅｗｏｒｋｆｏｒＤｉｓｃｏｖｅｒｉｎｇＭｏｂｉｌｅＵｓｅｒＰｒｏｆｉｌｅｓ（２００８），ＡｌｉＭｕｒａｔ，ＤｅｍｉｒｂａｓＭｕｒａｔ，ＥａｇｌｅＮａｔｈａｎ

【非特許文献4】ｈｔｔｐ：／／ｗｗｗ．ｃｓｅ．ｂｕｆｆａｌｏ．ｅｄｕ／ｔｅｃｈ−ｒｅｐｏｒｔｓ／２００８−１７．ｐｄｆ

【非特許文献5】ｈｔｔｐｓ：／／ｅｎ．ｗｉｋｉｐｅｄｉａ．ｏｒｇ／ｗｉｋｉ／Ｈｉｅｒａｒｃｈｉｃａｌ＿ｃｌｕｓｔｅｒｉｎｇ

【非特許文献6】ｈｔｔｐ：／／ｄｏｃｓ．ｓｃｉｐｙ．ｏｒｇ／ｄｏｃ／ｓｃｉｐｙ／ｒｅｆｅｒｅｎｃｅ／ｃｌｕｓｔｅｒ．ｈｉｅｒａｒｃｈｙ．ｈｔｍｌ

【非特許文献7】ｈｔｔｐｓ：／／ｅｎ．ｗｉｋｉｐｅｄｉａ．ｏｒｇ／ｗｉｋｉ／Ｋ−ｍｅａｎｓ＿ｃｌｕｓｔｅｒｉｎｇ

【非特許文献8】ｈｔｔｐ：／／ｄｏｃｓ．ｓｃｉｐｙ．ｏｒｇ／ｄｏｃ／ｓｃｉｐｙ／ｒｅｆｅｒｅｎｃｅ／ｇｅｎｅｒａｔｅｄ／ｓｃｉｐｙ．ｃｌｕｓｔｅｒ．ｖｑ．ｋｍｅａｎｓ．ｈｔｍｌ

【発明の概要】

【発明が解決しようとする課題】

【0007】

本発明の目的は、従来技術を改善することである。

【課題を解決するための手段】

【0008】

本発明の第１の態様によれば、装置がもたらされ、装置は少なくとも１つのプロセッサ、コンピュータプログラムコードを含んだ少なくとも１つのメモリを備え、少なくとも１つのプロセッサは、少なくとも１つのメモリおよびコンピュータプログラムコードを用いて、装置に少なくとも、複数のユーザのそれぞれの位置データを、ユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、位置データのそれぞれは所定の期間のある時点でのそれぞれのユーザの位置を示し、バケットのそれぞれは期間のそれぞれの時間間隔を含み、時間間隔は重複せず期間を包含し、時間間隔はユーザのすべてに対して同じであり、時間間隔のそれぞれに対してユーザのそれぞれのためのバケットが存在する、ステップと、ユーザの各ペアに対しておよび時間間隔のそれぞれに対して、それぞれのバケット内の位置データに基づいて、それぞれのペアのユーザの間のそれぞれの部分距離を計算するステップと、ユーザのペアのそれぞれに対して、それぞれのペアのユーザの間の距離を取得するために、期間にわたる部分距離を総計するステップと、ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有するユーザをクラスタ化するステップとを少なくとも行わせるように構成される。

【0009】

位置データは通信ネットワークから取得されたハンドオーバデータとすることができ、かつ／または位置データは測位システムから取得されたデータとすることができる。

【0010】

時間間隔ｉにおけるユーザのユーザ１とユーザ２の間の部分距離ｄ（Ｃ_1,i，Ｃ_2,i）は以下の式、

【数1】

および

【数2】

の１つによって計算されることができ、Ｃ_1,iおよびＣ_2,iはそれぞれユーザ１およびユーザ２の時間間隔ｉのバケット内の位置データの集合を表し、

【数3】

は共通集合演算子（ｉｎｔｅｒｓｅｃｔｉｏｎｏｐｅｒａｔｏｒ）を表し、

【数4】

は和集合演算子（ｕｎｉｏｎｏｐｅｒａｔｏｒ）を表し、

【数5】

はそれぞれの集合の濃度（ｃａｒｄｉｎａｌｉｔｙ）を表す。

【0011】

クラスタ化するステップは、凝集型階層的クラスタリングによって行われ得る。

【0012】

少なくとも１つのプロセッサは、少なくとも１つのメモリおよびコンピュータプログラムコードを用いて、装置に、それぞれのクラスタ内のユーザの数が所定の数より大きいかどうかをチェックするステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい第１のセルを決定するステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい場合、第１のセル内のセルブロードキャストによって、ユーザに情報をもたらすステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きくない場合、専用メッセージによってユーザに情報をもたらすステップとをさらに行わせるように構成され得る。

【0013】

少なくとも１つのプロセッサは、少なくとも１つのメモリおよびコンピュータプログラムコードを用いて、装置に、それぞれのクラスタ内のユーザの数が所定の数より大きいかどうかをチェックするステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい第２のセルを決定するステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい場合、第２のセルの容量を増加させるステップとをさらに行わせるように構成され得る。

【0014】

本発明の第２の態様によれば、装置がもたらされ、装置は少なくとも１つのプロセッサ、コンピュータプログラムコードを含んだ少なくとも１つのメモリを備え、少なくとも１つのプロセッサは、少なくとも１つのメモリおよびコンピュータプログラムコードを用いて、装置に少なくとも、複数のユーザのセルデータをユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、セルデータのそれぞれは、所定の期間のある時点でのユーザの位置が確認されたセルを示し、バケットのそれぞれは期間のそれぞれの時間間隔を含み、時間間隔は重複せず期間を包含し、時間間隔はユーザのすべてに対して同じであり、時間間隔のそれぞれに対してユーザのそれぞれのためのバケットが存在する、ステップと、それぞれのバケット内のセルデータに基づいて、時間間隔のそれぞれに対して、ユーザのそれぞれの平均位置を計算するステップと、ユーザのそれぞれに対しておよび時間間隔のそれぞれに対して、それぞれの時間間隔に後続する時間間隔における平均位置とそれぞれの時間間隔の平均位置の差と、時間間隔の持続時間の比として、それぞれのユーザの速度を決定するステップと、ユーザのそれぞれのクラスタを取得するために、期間の時間間隔にわたって、ユーザのもう一人のそれぞれの速度に近いそれぞれの速度を有する、ユーザをクラスタ化するステップとを少なくとも行わせるように構成される。

【0015】

平均位置の少なくとも１つは、それぞれの時間間隔の間にユーザの位置が確認された、セルのジオロケーションの重心として計算され得る。

【0016】

クラスタ化するステップは、ｋ平均法（ｋ−ｍｅａｎｓ）教師なし（ｕｎｓｕｐｅｒｖｉｓｅｄ）クラスタリングによって行われ得る。

【0017】

本発明の第３の態様によれば、装置がもたらされ、装置は少なくとも１つのプロセッサ、コンピュータプログラムコードを含んだ少なくとも１つのメモリを備え、少なくとも１つのプロセッサは、少なくとも１つのメモリおよびコンピュータプログラムコードを用いて、装置に少なくとも、１つまたは複数のセルのそれぞれに対して、所定の期間中にそれぞれのセル内でユーザの位置が確認された、それぞれの持続時間を決定するステップと、期間中にユーザの位置が確認されたセルのジオロケーションの加重平均から、ユーザの平均位置を計算するステップであって、位置のそれぞれの重みは、それぞれのセル内でユーザの位置が確認された持続時間に基づく、ステップとを少なくとも行わせるように構成される。

【0018】

持続時間の少なくとも１つは、ユーザがそれぞれのセルから第２のハンドオーバを行った第２の時点と、ユーザがそれぞれのセルから第１のハンドオーバを行った第１の時点の間の時間間隔として決定され得る。

【0019】

重みの少なくとも１つは、さらにそれぞれのセルのサイズに基づくことができる。

【0020】

少なくとも１つのプロセッサは、少なくとも１つのメモリおよびコンピュータプログラムコードを用いて、装置に、第１の広告掲示板が平均位置に近いことをチェックするステップと、第１の広告掲示板が平均位置に近い場合、ユーザの関心に従って、第１の広告掲示板に示されるコンテンツを適応させるステップとをさらに行わせるように構成され得る。

【0021】

少なくとも１つのプロセッサは、少なくとも１つのメモリおよびコンピュータプログラムコードを用いて、装置に、第２の広告掲示板が平均位置に近いことをチェックするステップと、第２の広告掲示板が平均位置に近くない場合、第２の広告掲示板を平均位置の近くに配置するステップとをさらに行わせるように構成され得る。

【0022】

本発明の第４の態様によれば、方法がもたらされ、方法は、複数のユーザのそれぞれの位置データを、ユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、位置データのそれぞれは所定の期間のある時点でのそれぞれのユーザの位置を示し、バケットのそれぞれは期間のそれぞれの時間間隔を含み、時間間隔は重複せず期間を包含し、時間間隔はユーザのすべてに対して同じであり、時間間隔のそれぞれに対してユーザのそれぞれのためのバケットが存在する、ステップと、ユーザの各ペアに対しておよび時間間隔のそれぞれに対して、それぞれのバケット内の位置データに基づいて、それぞれのペアのユーザの間のそれぞれの部分距離を計算するステップと、ユーザのペアのそれぞれに対して、それぞれのペアのユーザの間の距離を取得するために、期間にわたる部分距離を総計するステップと、ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有するユーザをクラスタ化するステップとを含む。

【0023】

【0024】

時間間隔ｉにおけるユーザのユーザ１とユーザ２の間の部分距離ｄ（Ｃ_1,i，Ｃ_2,i）は以下の式、

【数6】

および

【数7】

の１つによって計算されることができ、Ｃ_1,iおよびＣ_2,iはそれぞれユーザ１およびユーザ２の時間間隔ｉのバケット内の位置データの集合を表し、

【数8】

は共通集合演算子を表し、

【数9】

は和集合演算子を表し、

【数10】

はそれぞれの集合の濃度を表す。

【0025】

クラスタ化するステップは、凝集型階層的クラスタリングによって行われ得る。

【0026】

方法は、それぞれのクラスタ内のユーザの数が所定の数より大きいかどうかをチェックするステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい第１のセルを決定するステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい場合、第１のセル内のセルブロードキャストによって、ユーザに情報をもたらすステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きくない場合、専用メッセージによってユーザに情報をもたらすステップとをさらに含むことができる。

【0027】

方法は、それぞれのクラスタ内のユーザの数が所定の数より大きいかどうかをチェックするステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい第２のセルを決定するステップと、それぞれのクラスタ内のユーザの数が、所定の数より大きい場合、第２のセルの容量を増加させるステップとをさらに含むことができる。

【0028】

本発明の第５の態様によれば、方法がもたらされ、方法は、複数のユーザのセルデータをユーザのそれぞれのためのそれぞれのバケットに分配するステップであって、セルデータのそれぞれは、所定の期間のある時点でユーザの位置が確認されたセルを示し、バケットのそれぞれは期間のそれぞれの時間間隔を含み、時間間隔は重複せず期間を包含し、時間間隔はユーザのすべてに対して同じであり、時間間隔のそれぞれに対してユーザのそれぞれのためのバケットが存在する、ステップと、それぞれのバケット内のセルデータに基づいて、時間間隔のそれぞれに対して、ユーザのそれぞれの平均位置を計算するステップと、ユーザのそれぞれに対しておよび時間間隔のそれぞれに対して、それぞれの時間間隔に後続する時間間隔における平均位置とそれぞれの時間間隔の平均位置の差と、時間間隔の持続時間の比として、それぞれのユーザの速度を決定するステップと、ユーザのそれぞれのクラスタを取得するために、期間の時間間隔にわたって、ユーザのもう一人のそれぞれの速度に近いそれぞれの速度を有する、ユーザをクラスタ化するステップとを含む。

【0029】

平均位置の少なくとも１つは、それぞれの時間間隔の間にユーザの位置が確認された、セルのジオロケーションの重心として計算され得る。

【0030】

クラスタ化するステップは、ｋ平均法教師なしクラスタリングによって行われ得る。

【0031】

本発明の第６の態様によれば、方法がもたらされ、方法は、１つまたは複数のセルのそれぞれに対して、所定の期間中にそれぞれのセル内でユーザの位置が確認された、それぞれの持続時間を決定するステップと、期間中にユーザの位置が確認されたセルのジオロケーションの加重平均から、ユーザの平均位置を計算するステップであって、位置のそれぞれの重みは、それぞれのセル内でユーザの位置が確認された持続時間に基づく、ステップとを含む。

【0032】

【0033】

重みの少なくとも１つは、さらにそれぞれのセルのサイズに基づくことができる。

【0034】

方法は、第１の広告掲示板が平均位置に近いことをチェックするステップと、第１の広告掲示板が平均位置に近い場合、ユーザの関心に従って、第１の広告掲示板に示されるコンテンツを適応させるステップとをさらに含むことができる。

【0035】

方法は、第２の広告掲示板が平均位置に近いことをチェックするステップと、第２の広告掲示板が平均位置に近くない場合、第２の広告掲示板を平均位置の近くに配置するステップとをさらに含むことができる。

【0036】

第４から第６の態様による方法のそれぞれは、ユーザ移動プロファイリングの方法とすることができる。

【0037】

本発明の第７の態様によれば、装置上で実行されたとき、第４から第６の態様のいずれかによる方法を装置に行わせるように構成された、命令のセットを備えるコンピュータプログラム製品がもたらされる。コンピュータプログラム製品は、コンピュータ可読媒体として具体化され得る、またはコンピュータに直接ロード可能とすることができる。

【0038】

本発明のいくつかの例示の実施形態によれば、以下の技術的効果の少なくとも１つがもたらされ得る。
・どのユーザが通常一緒に通勤するかを決定すること
・多くのユーザが通勤する時刻を決定すること
・ユーザの自宅位置（ｈｏｍｅｌｏｃａｔｉｏｎ）および／または勤務場所（ｗｏｒｋｌｏｃａｔｉｏｎ）などの、静止エリアを決定すること

【0039】

さらなる詳細、特徴、目的、および利点は、添付の図面と併せ読まれる、本発明の例示の実施形態の以下の詳細な説明から明らかとなる。

【図面の簡単な説明】

【0040】

【図1】本発明のいくつかの実施形態による、「一緒の通勤」シナリオにおける距離計算を示す図である。

【図2】ユーザのグループは線種によって区別された、一緒に通勤するユーザの軌跡を示す図である。

【図3】線種によって区別された通勤パターンを示す図である。

【図4】本発明のいくつかの実施形態による、近似する自宅位置の例示の可視化を示す図である。

【図5】本発明のいくつかの実施形態による、概念実証のアーキテクチャを示す図である。

【図6】本発明のいくつかの実施形態による、単一サーバアーキテクチャのアーキテクチャを示す図である。

【図7】本発明のいくつかの実施形態による、概念実証のスケーラブルアーキテクチャを示す図である。

【図8】本発明の例示の実施形態による装置を示す図である。

【図9】本発明の例示の実施形態による方法を示す図である。

【図10】本発明の例示の実施形態による装置を示す図である。

【図11】本発明の例示の実施形態による方法を示す図である。

【図12】本発明の例示の実施形態による装置を示す図である。

【図13】本発明の例示の実施形態による方法を示す図である。

【図14】本発明の例示の実施形態による装置を示す図である。

【発明を実施するための形態】

【0041】

本明細書の以下では、本発明のいくつかの例示の実施形態が添付の図面を参照して詳細に述べられ、例示の実施形態の特徴は、特に明記されない限り、互いに自由に組み合わされ得る。しかし、いくつかの実施形態の記述は例示のためのみに示されるものであり、開示される詳細に本発明を限定する意図は全くないことが明確に理解されるべきである。

【0042】

さらに、装置は対応する方法を行うように構成されるが、いくつかの場合では装置のみ、または方法のみが述べられることが理解されるべきである。

【0043】

機械学習および統計分析方法によって本発明のいくつかの実施形態は、セルハンドオーバデータから、毎日のユーザルーチンのプロファイリングを行う。この追加された情報は、オペレータに対して、および特にオンライン広告エコシステムにおいて、広告会社または広告仲介業者などのサードパーティに対しての両方に、有益な情報をもたらすことができる。この知識のいくつかの他の可能性のある使用は、都市計画、または伝染病の場合の緊急対応予測を含むことができる。

【0044】

本発明のいくつかの実施形態は、モバイルオペレータ側からのセルハンドオーバデータを用いるので、クライアント側アプリケーションの必要はない。実施形態のいくつかは、以下の問題の少なくとも１つに対する答えを与え得る。
１．どのユーザが一緒に通勤するか？
２．ユーザの毎日の移動パターン（通勤／昼食／帰宅時間間隔）は何か？
３．ユーザの静止エリア（例えば、自宅および／または勤務エリア（複数可）および／またはＰＯＩｓ）は何か？

【0045】

以下では、これらの問題のそれぞれに対して、それらが本発明のいくつかの実施形態によってどのように答えられるかについて述べられる。本発明の単一の実施形態は、これらの問題の１つ、２つ、または３つに答えるように構成され得ることに留意されたい。

【0046】

作業の間に、以下のパイプラインが用いられた。
１．関連があり得る問題を定式化し、モバイルネットワークユーザについての我々の知識を拡張する。例えば：誰が一緒に通勤するか？
２．より良好な品質を得るために、取得することになるデータをクリーンにする。例えば：ハンドオーバデータからのピンポン効果など、ノイズとなる項目をフィルタ除去する。
３．問題に関してユーザを比較することができる、距離／類似性測度（複数可）を定義する。例えば：一定の期間における、共通のセルと異なるセルの比率。
４．問題記述および距離関数に適したクラスタリングアルゴリズムを選択する、例えば：階層的クラスタリング
５．結果を検証し、パラメータまたは距離測度を精緻化する、例えば：結果可視化。

【0047】

本発明の具体的な焦点は、このパイプラインの最初の３つの項目に当てられる。

【0048】

一緒の通勤
この関数の出力は、時間および場所に関して、共通の毎日の移動パターンを有する人々のグループである。これは各グループが、同様な時間に同様の位置で、日々一緒に移動するユーザを得ることになることを意味する。このようなグループの例は、通勤電車の乗客とすることができる。

【0049】

これらのグループを作成するために、最初に各ユーザの毎日のセル／位置データが収集される。各ユーザは、（セル、タイムスタンプ）タプルのリストを有すると仮定する。これは、ＭＮＯのトラフィックを精査することによって容易にアクセスされ得る。

【表1】

【0050】

最初に我々は、タイムスタンプを時刻データに変換し（本質的に日付部分を捨てる）、１日全体を固定の数のウィンドウ（スロット／バケット）に切り離す。例えば我々は１０分の長さのウィンドウを用い、１４４個のバケットを生成する（１日は１４４０分あるので）。この後、我々はユーザのデータを、彼等のセルをそれらのタイムスタンプに従って各バケットに入れるように編成する。この部分は、我々のデータを低減するだけでなく、ピンポンとしても知られるセルタワー振動の大部分を相殺するので有用である。

【0051】

我々の実装形態において、我々は１０分のウィンドウを用いており、他の長さも適切となり得るが、長過ぎるウィンドウは粗い結果を生成することになり、短すぎるウィンドウはノイズの影響をより受けやすいことを、我々は考慮しなければならないことに留意されたい。

【0052】

また本実施形態において、毎日の移動パターンは、時刻が十分な情報となるように考えられる。しかし他の移動期間（例えば毎週、毎月、または毎年）が識別される場合、時間情報は、例えば日の情報を備えるべきである。これと対照的に、毎時間の移動期間が識別される場合、時間の情報は省かれ得る。

【0053】

変換の後、我々は以下の表２を得る。

【表2】

【0054】

次に我々は、各時間ウィンドウの２人のユーザの間の［０．．１］の値を計算する距離関数を定義することができる。Ｃ_1,i、Ｃ_2,i集合を有する２人のユーザＵ₁、Ｕ₂を有すると仮定し、ただしセル集合を含むｉ＝１，２，．．．，１４４（スロットの数）である。我々は式１を用いて、特定の時間スロットｉにおける２人のユーザの間の（部分）距離を計算する。あるいは、代わりにいくつかの場合においてより優れた結果を生じるので、式２も用いられ得る。
式１（交差比率による距離）

【数11】

式２（落合係数による距離）

【数12】

ここでＣ_1,iおよびＣ_2,iは、それぞれユーザ１およびユーザ２の、時間間隔ｉのバケット内の位置データの集合を表し、

【数13】

は共通集合演算子を表し、

【数14】

は和集合演算子を表し、

【数15】

はそれぞれの集合の濃度を表す。
注記：式のいずれかにおいて分母がゼロになる特別な場合は、我々はｄ＝１を用いる。

【0055】

一緒に移動するユーザの識別において、これら以外のメトリクスは好結果が得られなかった。

【0056】

最後に我々は、２人のユーザの間の距離ｄ（Ｕ₁，Ｕ₂）を取得するために、正規化ユークリッド距離を用いて、これらの部分距離ｄ（Ｃ_1,i，Ｃ_2,i）を総計することができる。

【数16】

【0057】

図１は、距離計算（式１による）の観念を示す。

【0058】

破線（ｄａｓｈｅｄｌｉｎｅｓ）および点線（ｄｏｔｔｅｄｌｉｎｅｓ）は、２人のユーザの移動を表し、基地局はそれらがユーザの時間ウィンドウの両方にある場合は丸印で囲まれ、２人のユーザの時間ウィンドウの一方のみにある場合は囲まれない。文字「Ａ」および「Ｂ」によって、基地局のそれぞれに対して、それぞれの時間ウィンドウにおいてそれら基地局がどちらのユーザのためにあるかが示される。我々は図上で、ユーザが共通の経路（すなわち電車または地下鉄）を共有するのに従ってどのように共通セルの数が増加するか、かつどのように部分距離が計算されるかが分かる。

【0059】

従って我々は、表３に示されるように距離行列を取得するために、各ユーザペアの間の距離を計算する。

【表3】

【0060】

これは、三角形不等定理が適用できないので有効なユークリッド空間ではなく、従って我々はここでｋ平均法または同様のアルゴリズムを用いることができないことに留意されたい。代わりに我々は、互いに低い距離を有するユーザを結合するために、凝集型階層的クラスタリング方法を用いる（階層的クラスタリング：ｈｔｔｐｓ：／／ｅｎ．ｗｉｋｉｐｅｄｉａ．ｏｒｇ／ｗｉｋｉ／Ｈｉｅｒａｒｃｈｉｃａｌ＿ｃｌｕｓｔｅｒｉｎｇを参照）。

【0061】

第１の段階では、すべてのユーザはそれら自体のクラスタを有し、各ステップにおいてアルゴリズムは、２つの最も近いクラスタをマージし、もとの２つのクラスタのユーザの和集合により新しいクラスタを作成する。このステップは、所与の距離閾値に達するまで反復される。適切な閾値レベルの特定は、階層的クラスタリングにおいて深く調べられる。実装のために我々は、「単一」凝集型ルーチンモードにおいて、このクラスタリング方法（ｈｔｔｐ：／／ｄｏｃｓ．ｓｃｉｐｙ．ｏｒｇ／ｄｏｃ／ｓｃｉｐｙ／ｒｅｆｅｒｅｎｃｅ／ｃｌｕｓｔｅｒ．ｈｉｅｒａｒｃｈｙ．ｈｔｍｌ）のＰｙｔｈｏｎ実装形態：ｓｃｉｐｙ．ｃｌｕｓｔｅｒ．ｈｉｅｒａｒｃｈｙを用いた。

【0062】

このクラスタ化の出力は、実際のデータに基づく図２の市内地図で見ることができるグループである。ここでユーザのグループは、異なる線種によって区別される。グループごとの最小および最大ユーザ数は、適用エリアに依存する。

【0063】

本発明のいくつかの実施形態による例示のアプリケーションとして、システムは特定のユーザに対して、彼が通勤者グループに属するかどうかを分析する。属さない場合は、専用メッセージ（例えばＳＭＳ、または専用アプリ内の）によって、ユーザに何らかの広告が送られることになる。しかしユーザが十分なサイズ（メンバの数）の通勤者グループに属する場合、広告は、通勤者が一緒に通勤するセル内のこれらの通勤者に、セルブロードキャストによって送られ得る。従ってネットワーク負荷が低減される。

【0064】

本発明のいくつかの実施形態による、いくつかの他の例示の応用例は以下の通りである。
− ユーザに、彼／彼女の毎日の移動ルーチンに基づいて、広告または割引クーポンをもたらす。
− ネットワーク挙動を変更する
・その時間に彼等は彼等の電話機を用いる可能性が高いので、通勤者のために帯域を最適化する
・ユーザの既知の軌道（共通の通勤経路）に対して、ネットワークを最適化する
− 病気の発生予測（可能性の高い汚染の経路）：一緒に通勤するおよび一緒にいる人々は、潜在的に互いに影響を及ぼすものとしてラベル付けされ得る。この情報は人々を引き離し、彼等を救うために用いられ得る。従って病気の広がりが、防止または減速され得る。

【0065】

毎日の移動パターン
本発明のいくつかの実施形態によれば、この関数は時刻にわたるユーザ移動の強度を分析する。「一緒の通勤」関数と異なり、ここでは移動位置ではなく、時間的な移動距離（速度）のみが重要となる。これは、同じ時刻に通勤している、または昼食に出かける、または帰宅する人々を捉えるために有用となる。幸いにもこれはまた、人々が移動時に彼等の電話機によってインターネット上でニュースを読むまたはネットサーフィンする可能性が高い。

【0066】

図３は通勤パターンを示す：１日の各時間に対して（１０分のステップのｘ軸において）、予め定義された最小値より大きな速度で移動するユーザの数が示される。

【0067】

いくつかの不明瞭なパターンは別として、我々はすでにどのようにいくらかの人々が異なる移動パターンにおいて、午前５、６、７、８、９または１０時に職場に行くかを見ることができる。おそらく同じ朝の通勤グループ内のユーザの場合であっても人によって異なるので、ここでは帰宅に対するパターンは見ることができない。それでも、昼食および帰宅パターンも、時間フィルタリングを用いて対処され得る。

【0068】

基礎をなすアルゴリズムは、本明細書で上記で論じられた「一緒の通勤」関数と同様である。我々は、各ユーザに対して１０分の長さのスロットに構成された、時刻に変換されたハンドオーバを用いる。

【表4】

【0069】

次いで我々は、以下のやり方を用いてセルを、各ウィンドウにおけるジオロケーションに変換する：我々は各セルのジオロケーション（例えば基地局の位置、またはセルのカバレージエリアの中心）を地図上の点として取得し、これらの点を用いて重心を計算する。結局我々は、重心を得ることになる。この方法は、セルの急速な変化が環境の状況によりノイズを生成し得る（すなわち移動するバスは現在のセル局を阻止し、バスがそこから離れるまで、モバイル機器は別のものに切り換える）、ピンポンハンドオーバ現象を低減するために有用である。

【表5】

【0070】

この情報から我々は、隣接したウィンドウ（バケット）の各ペアの間の時間にわたる重心の間の距離から、移動速度を内挿することができる。各重心が緯度（ｌａｔ）および経度（ｌｏｎ）座標からなると仮定すると、我々は以下の式を用いて、２つの時間ウィンドウの間を用いて、ｍ／ｓでの近似する速度ｖ_i,i+1を計算することができる。

【数17】

【0071】

ここで各バケットは１０分＝６００秒のデータを備えるので、分母の６００が選ばれる。もちろんバケットは異なる持続時間を有することができ、分母はそれに従って調整されることになる。

【0072】

次に我々は以下の表を取得し、我々はｋ平均法教師なしクラスタリングのための入力として用いることができる（これらの値は１４４次元ユークリッド空間に対して有効であるので）。

【表6】

【0073】

ｋ平均法は、教師なし学習におけるよく知られた基本的クラスタリング方法である。ｋ平均法クラスタリングに関するさらなる情報は、ｈｔｔｐｓ：／／ｅｎ．ｗｉｋｉｐｅｄｉａ．ｏｒｇ／ｗｉｋｉ／Ｋ−ｍｅａｎｓ＿ｃｌｕｓｔｅｒｉｎｇに見出すことができる。ＰｏＣにおいて我々は、ｓｃｉｐｙ．ｃｌｕｓｔｅｒ．ｖｑ．ｋｍｅａｎｓ（ｈｔｔｐ：／／ｄｏｃｓ．ｓｃｉｐｙ．ｏｒｇ／ｄｏｃ／ｓｃｉｐｙ／ｒｅｆｅｒｅｎｃｅ／ｇｅｎｅｒａｔｅｄ／ｓｃｉｐｙ．ｃｌｕｓｔｅｒ．ｖｑ．ｋｍｅａｎｓ．ｈｔｍｌ）クラスを用いて計算を行った。我々は１０個のクラスタを作成し、そのうちの３個は図３に示される。クラスタ化の出力は、各ユーザを最も近い一致パターンに類別するために用いられ得る。

【0074】

静止エリア（例えば自宅／勤務エリアおよびＰＯＩｓ）
本発明のいくつかの実施形態によれば、この関数は、特定のユーザのＰＯＩおよび／または自宅／勤務エリアなどの、静止エリアを検出する。入力データは、やはりセルハンドオーバから抽出される。自宅／勤務エリアの例のために我々は、規則的な毎日のパターンを有する人々が通常自宅または職場（または学生に対しては学校／大学）にいるようになる、２つの固定の間隔、午後９時〜午前５時および午前１０時〜午後４時をそれぞれ定義する。このような人々に対してこれは平日のほとんどに当てはまることになり、従って我々はこの仮定を用いて彼等の自宅／勤務場所を予測することができる（これはその地域の習慣に基づいて異なる国に対して、または時間におけるユーザの予期される行動に応じて異なるＰＯＩｓに対して、調整され得る）。

【0075】

最初に我々は、これらの時間間隔内のすべてのハンドオーバターゲットセルを取得し、重みを割り当てる。例えば重みは、次のハンドオーバまでに経過する時間とすることができる（事実上、その特定のセル内でモバイルが過ごした時間）。我々はこれらのハンドオーバセルのジオロケーションに対する加重平均を計算すれば、我々は各時間間隔に対する最も関連のある位置を取得し、従って我々は自宅／勤務場所近似を得ることになる。

【0076】

詳細には本発明のいくつかの実施形態において、ｈをハンドオーバ、ｗ（ｈ）をハンドオーバの重み、ｔｓ（ｈ）をハンドオーバのタイムスタンプ属性とする。我々は重みｗ（ｈ）を、
ｗ（ｈ_current）＝ｔｓ（ｈ_next）−ｔｓ（ｈ_current）
となるように計算し、ただしｎｅｘｔは所与のユーザのために並ぶ、次の既知のハンドオーバである。ｇｅｏ（ｈ）をハンドオーバにおけるターゲットセルの２次元ジオロケーション、およびＨ_homeを想定された自宅時間間隔（午後９時〜午前５時）に従った、ユーザのハンドオーバのフィルタリングされた集合とする。次に我々は自宅位置を以下により計算する。

【数18】

【0077】

同様に勤務場所またはＰＯＩが計算され得る。

【0078】

重みは、特定のセル内にユーザがいる持続時間に基づくだけでなく、他のパラメータも関わることができる。例えば小さなエリアを有するセルは、大きなエリアを有するセルより高い重みをもつことができる。これは例えばセルのエリアに反比例する追加の重み係数として表され得る。従って、ユーザは小さなセル内に短時間だけいる場合があるが、この時間の間、ユーザの位置は高い精度で決定されることが反映され得る。

【0079】

セルのジオロケーションは、「毎日の移動パターン」のシナリオに対して述べられたものと同じやり方で決定され得る。

【0080】

図４は、近似する自宅位置の例示の可視化を示す。基地局に示される時間は、ユーザがそれぞれのセルにいつハンドオーバを行ったかを示す。星印は、これらのセルの重み付きジオロケーションから計算された位置を示す。図から分かるように、計算された位置は、実際の位置（大きな家によって示され、他の位置は小さな家として示される）に非常に近い。

【0081】

従って毎日の移動パターンの結果は、勤務時間が不規則な人々に適合するように、個々に静止期間を検出するために用いられる。我々はこれらの静止期間内の加重平均を用いて、ユーザがより長い時間留まる位置を検出することができ、通常これは職場または自宅位置である。

【0082】

応用例として、一定の場所に一定の時間留まる（すなわちＰＯＩ、自宅位置、勤務場所など）、行き交う人々のプロファイルに従って、実世界のデジタル広告掲示板に動的コンテンツを載せることができる。ユーザの関心が知られている場合、これらの関心にコンテンツ（例えば広告、公共輸送機関時刻表、ニュース、または交通渋滞の情報）を適応させることができる。さらには、ユーザの静止エリアの知識に基づいて、広告掲示板を配置することができる。

【0083】

対応する応用例は、通勤者の経路に沿ってデジタル広告掲示板を配置または制御するために、本明細書において上記で述べられた「一緒の通勤」シナリオの位置情報を用いることができる。

【0084】

概念実証
上述のアルゴリズムは事実上任意の言語で実施され得るが、追加設定なしで用いられ得るもの（Ｐｙｔｈｏｎなど）より、すでに機械学習関連ライブラリを有する言語に対して、より実現可能である。我々の概念実証は、主にＰｙｔｈｏｎ、ワイヤシャーク、およびＰｏｓｔｇｒｅＳＱＬを用いて行われた。アーキテクチャは、図５に見ることができる。

【0085】

我々のテストデータは、ゲートウェイハンドオーバおよびユーザプレーン関連データを含んだ、Ｓ５／Ｓ１１／Ｓ１Ｕインターフェースからの生のパケット捕捉ファイルからなる。制御プレーンデータからユーザおよび彼等のハンドオーバが抽出され、相互に関係付けられ、データベースに書き込まれた。セルジオロケーションのリストもデータベース内にアップロードされ、そこからユーザ位置を推定することができた。また、本発明のいくつかの実施形態に対して本明細書において上記で述べられたアルゴリズムを含む、分析の結果を可視化するように実装されたＧＵＩがある。このＰｏＣは機能の実証のために良好であり、Ｐｙｔｈｏｎを用いることは迅速な開発を達成するために大きな助けとなった。

【0086】

実際の製品に対しては、ビッグデータ対応の言語およびフレームワークを用いることが推奨される。単一サーバ展開アーキテクチャは、図６に見ることができる。

【0087】

この解決策は、Ｓ５／Ｓ１１／Ｓ１Ｕインターフェースからの４０Ｇｂ／ｓパケットデータの処理を達成することを目標とする。相関エンジンは、制御プレーンおよびユーザプレーンの整合を行い、ユーザハンドオーバは、Ｓｐａｒｋストリーミングを用いて書かれた分類およびモデルビルダに転送される。Ｓｐａｒｋストリーミングは、ＡｐａｃｈｅＳｐａｒｋ上で稼働するポピュラーなバッチストリーム処理エンジンである。我々の現在の推定によれば、４０Ｇｂ／ｓ電話会社ネットワークデータの取り扱いは、単一サーバインスタンスを用いて達成され得る。

【0088】

しかしＳｐａｒｋのおかげで、この解決策は容易にスケーラブルとなり得る。４０Ｇｂ／ｓを超えるＰｏＣに対する将来の計画は、図７に見ることができる。

【0089】

図８は、本発明の例示の実施形態による装置を示す。装置はコンピュータ、またはその要素とすることができる。図９は、本発明の例示の実施形態による方法を示す。図８による装置は、図９の方法を行うことができるが、この方法に限定されない。図９の方法は、図８の装置によって行われ得るが、この装置によって行われることに限定されない。

【0090】

装置は、分配手段１０、計算手段２０、総計手段３０、およびクラスタリング手段４０を備える。分配手段１０、計算手段２０、総計手段３０、およびクラスタリング手段４０は、それぞれ分配回路、計算回路、総計回路、およびクラスタリング回路とすることができる。

【0091】

分配手段１０は、複数のユーザのそれぞれの位置データを、ユーザのそれぞれのためのそれぞれのバケットに分配する（Ｓ１０）。位置データのそれぞれは、ある時点でのそれぞれのユーザの位置を示す。時間は、日などの所定の期間中である。バケットのそれぞれは、期間のそれぞれの時間間隔（例えば１０分）を含む。時間間隔は重複せず期間を包含する。時間間隔はユーザのすべてに対して同じであり、時間間隔のそれぞれに対してユーザのそれぞれのためのバケットが存在する。

【0092】

計算手段２０は、ユーザの各ペアに対しておよび時間間隔のそれぞれに対して、それぞれのバケット内の位置データに基づいて、それぞれのペアのユーザの間のそれぞれの部分距離を計算する（Ｓ２０）。

【0093】

総計手段３０は、ユーザのペアのそれぞれに対して、期間（例えば日）にわたる部分距離を総計する（Ｓ３０）。このようにして、それぞれのペアのユーザの間の距離が取得される。

【0094】

クラスタリング手段４０は、ユーザのそれぞれのクラスタを取得するために、互いに最も近い距離を有するユーザをクラスタ化する（Ｓ４０）。

【0095】

図１０は、本発明の例示の実施形態による装置を示す。装置はコンピュータ、またはその要素とすることができる。図１１は、本発明の例示の実施形態による方法を示す。図１０による装置は、図１１の方法を行うことができるが、この方法に限定されない。図１１の方法は、図１０の装置によって行われ得るが、この装置によって行われることに限定されない。

【0096】

装置は、分配手段１１０、計算手段１２０、決定手段１３０、およびクラスタリング手段１４０を備える。分配手段１１０、計算手段１２０、決定手段１３０、およびクラスタリング手段１４０は、それぞれ分配回路、計算回路、決定回路、およびクラスタリング回路とすることができる。

【0097】

分配手段１１０は、複数のユーザのセルデータを、ユーザのそれぞれのためのそれぞれのバケットに分配する（Ｓ１１０）。セルデータのそれぞれは、例えば日などの所定の期間のある時点で、ユーザの位置が確認されたセルを示す。バケットのそれぞれは、期間のそれぞれの時間間隔（例えば１０分）を含む。時間間隔は重複せず期間を包含する。時間間隔はユーザのすべてに対して同じであり、時間間隔のそれぞれに対してユーザのそれぞれのためのバケットが存在する。

【0098】

計算手段１２０は、それぞれのバケット内のセルデータに基づいて、時間間隔のそれぞれに対して、ユーザのそれぞれの平均位置を計算する（Ｓ１２０）。

【0099】

決定手段１３０は、ユーザのそれぞれに対しておよび時間間隔のそれぞれに対して、それぞれのユーザの速度を決定する（Ｓ１３０）。速度は、それぞれの時間間隔に後続する時間間隔における平均位置とそれぞれの時間間隔の平均位置の差と、時間間隔の持続時間の比として計算される。

【0100】

クラスタリング手段１４０は、ユーザのそれぞれのクラスタを取得するために、期間の時間間隔にわたって、ユーザのもう一人のそれぞれの速度に近いそれぞれの速度を有する、ユーザをクラスタ化する（Ｓ１４０）。

【0101】

図１２は、本発明の例示の実施形態による装置を示す。装置はコンピュータ、またはその要素とすることができる。図１３は、本発明の例示の実施形態による方法を示す。図１２による装置は、図１３の方法を行うことができるが、この方法に限定されない。図１３の方法は、図１２の装置によって行われ得るが、この装置によって行われることに限定されない。

【0102】

装置は、決定手段２１０および計算手段２２０を備える。決定手段２１０および計算手段２２０は、それぞれ決定回路および計算回路とすることができる。

【0103】

決定手段２１０は、１つまたは複数のセルのそれぞれに対して、所定の期間中にそれぞれのセル内でユーザの位置が確認された、それぞれの持続時間を決定する（Ｓ２１０）。

【0104】

計算手段２２０は、期間中にユーザの位置が確認されたセルのジオロケーションの加重平均から、ユーザの平均位置を計算する（Ｓ２２０）。位置のそれぞれの重みは、それぞれのセル内でユーザの位置が確認された持続時間に基づく。

【0105】

図１４は、本発明の実施形態による装置を示す。装置は、少なくとも１つのプロセッサ６１０、コンピュータプログラムコードを含んだ少なくとも１つのメモリ６２０を備え、少なくとも１つのプロセッサ６１０は、少なくとも１つのメモリ６２０およびコンピュータプログラムコードを用いて、装置に、図９、１１、および１３ならびに関連する記述による方法の少なくとも１つを少なくとも行わせるように構成される。

【0106】

Ｍｕｌｄｅｒらと比較して、本発明の実施形態は異なる手法および距離関数を使用し、述べられる基本的なクラスタリングアルゴリズム（階層的クラスタリング）は本発明の「一緒の通勤」機能と同様である。またＭｕｌｄｅｒらの論文は、同様の通勤習慣に対するユーザクラスタリング方法を含まない。

【0107】

Ｍｕｒａｔらによって開示された概念は、本発明の実施形態と非常に異なる。Ｍｕｒａｔらによって導入されたセルクラスタリングの欠点は、多くのセルを組み合わせるときに、位置における精度が過度に失われることである。またＭｕｒａｔらの論文は、同様の通勤習慣に対するユーザクラスタリング方法のための方法を導入していない。

【0108】

本発明の実施形態は、３ＧＰＰネットワーク（ＬＴＥ、ＬＴＥ−Ａなど）においてのみでなく、ネットワークにおいてユーザのハンドオーバデータが使用可能な他のネットワークにおいて（例えばＧＳＭ(登録商標)ネットワークにおいて）も使用され得る。

【0109】

１つの情報は、１つのエンティティから別のエンティティに、１つまたは複数のメッセージにおいて送信され得る。これらのメッセージのそれぞれは、他の（異なる）情報を含むことができる。

【0110】

ネットワーク要素、プロトコル、および方法の名前は、現在の標準に基づく。他のバージョンまたは他の技術において、これらのネットワーク要素および／またはプロトコルおよび／または方法の名前は、それらが対応する機能をもたらす限り、異なり得る。

【0111】

端末装置は、それぞれのネットワークに接続し得る任意のデバイスとすることができる。例えば端末装置は、ＵＥ、携帯電話、ラップトップ、スマートフォン、マシンタイプ通信デバイスなどとすることができる。

【0112】

特に明記されない、またはその他文脈から明らかにされない場合、２つのエンティティが異なるという記述は、それらが異なる機能を行うことを意味する。これは必ずしもそれらが異なるハードウェアに基づくことを意味しない。すなわち本明細書で述べられるエンティティのそれぞれは異なるハードウェアに基づくことができ、あるいはエンティティのいくつかまたはすべては同じハードウェアに基づくことができる。これは必ずしもそれらが異なるソフトウェアに基づくことを意味しない。すなわち本明細書で述べられるエンティティのそれぞれは異なるソフトウェアに基づくことができ、あるいはエンティティのいくつかまたはすべては同じソフトウェアに基づくことができる。本発明の実施形態は全体にまたは部分的にクラウドにおいて使用されることができ、それぞれのタスクのためのリソース（例えばプロセッサ、ソフトウェア、メモリ、ネットワーク）は、他のアプリケーションと共有され得る。

【0113】

上記の記述により、従って本発明の例示の実施形態は、例えばコンピュータ、またはその構成要素、同じものを具体化した装置、同じものを制御するかつ／または動作させる方法、および同じものを制御するかつ／または動作させるコンピュータプログラム（複数可）、ならびにこのようなコンピュータプログラム（複数可）を運ぶまたはコンピュータプログラム製品（複数可）を形成する媒体をもたらすことが明らかとなるべきである。

【0114】

上述のブロック、装置、システム、技法、手段、エンティティ、ユニット、デバイス、または方法のいずれの実装形態も、非限定的な例として、ハードウェア、ソフトウェア、ファームウェア、専用回路またはロジック、汎用ハードウェアまたはコントローラまたは他のコンピューティングデバイス、仮想マシン、またはそれらの何らかの組み合わせとしての実装形態を含む。

【0115】

実施形態の記述は例としてのみ示され、添付の「特許請求の範囲」によって定義される本発明の範囲から逸脱せずに、様々な変更がなされ得ることが留意されるべきである。

【符号の説明】

【0116】

１ユーザ
２ユーザ
１０分配手段
２０計算手段
３０総計手段
４０クラスタリング手段
１１０分配手段
１２０計算手段
１３０決定手段
１４０クラスタリング手段
２１０決定手段
２２０計算手段
６１０プロセッサ
６２０メモリ
ｉ時間間隔
ｄ部分距離

【図1】