(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-05-14
(45)【発行日】2024-05-22
(54)【発明の名称】プログラム、方法、情報処理装置、およびシステム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240515BHJP
G06F 16/29 20190101ALI20240515BHJP
G06F 16/9035 20190101ALI20240515BHJP
G06F 16/909 20190101ALI20240515BHJP
【FI】
G06Q50/10
G06F16/29
G06F16/9035
G06F16/909
(21)【出願番号】P 2023132819
(22)【出願日】2023-08-17
【審査請求日】2023-08-17
【早期審査対象出願】
(73)【特許権者】
【識別番号】718000381
【氏名又は名称】株式会社ピース企画
(74)【代理人】
【識別番号】110002815
【氏名又は名称】IPTech弁理士法人
(72)【発明者】
【氏名】森田 晋平
【審査官】毛利 太郎
(56)【参考文献】
【文献】特開2011-221804(JP,A)
【文献】中国特許出願公開第113505314(CN,A)
【文献】特開2022-027291(JP,A)
【文献】特開2020-035252(JP,A)
【文献】特開2009-230723(JP,A)
【文献】国際公開第2009/075043(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
G06F 16/29
G06F 16/9035
G06F 16/909
(57)【特許請求の範囲】
【請求項1】
プロセッサを備えるコンピュータに、
複数のユーザの位置情報を取得するステップと、
所定のエリアにおけるスポットの情報を取得するステップと、
前記ユーザの位置情報に基づき、前記スポットごとのユーザの利用度合いを算出するステップと、
前記利用度合いを考慮して、前記エリアにおける前記スポットの重要度を算出するステップと、を実行させ
、
前記ユーザの利用度合いを算出するステップでは、
前記利用度合いとして、前記スポットの訪問回数および当該スポットでの滞在時間の少なくとも一方を算出し、
前記訪問回数は、前記スポットを訪問したユーザの延べ人数としての回数、および前記スポットを訪問したユーザの実人数としての回数の少なくとも一方である、プログラム。
【請求項2】
プロセッサを備えるコンピュータに、
複数のユーザの位置情報を取得するステップと、
所定のエリアにおけるスポットの情報を取得するステップと、
前記ユーザの位置情報に基づき、前記スポットごとのユーザの利用度合いを算出するステップと、
前記利用度合いを考慮して、前記エリアにおける前記スポットの重要度を算出するステップと、を実行させ、
前記スポットの重要度を算出するステップでは、
所定の期間を母集団として、前記スポットの重要度を算出する、プログラム。
【請求項3】
プロセッサを備えるコンピュータに、
複数のユーザの位置情報を取得するステップと、
所定のエリアにおけるスポットの情報を取得するステップと、
前記ユーザの位置情報に基づき、前記スポットごとのユーザの利用度合いを算出するステップと、
前記利用度合いを考慮して、前記エリアにおける前記スポットの重要度を算出するステップと、を実行させ、
前記ユーザが訪問したスポットの時系列を考慮した重要度を算出し、当該重要度に基づくクラスタリングを行うステップを実行させる、プログラム。
【請求項4】
プロセッサを備えるコンピュータに、
複数のユーザの位置情報を取得するステップと、
所定のエリアにおけるスポットの情報を取得するステップと、
前記ユーザの位置情報に基づき、前記スポットごとのユーザの利用度合いを算出するステップと、
前記利用度合いを考慮して、前記エリアにおける前記スポットの重要度を算出するステップと、を実行させ、
前記エリアの時系列に沿った重要度の評価を行うステップを実行させる、プログラム。
【請求項5】
前記エリアの時系列に沿った重要度の評価に基づき、前記エリアのクラスタリングを行うステップを実行させる、請求項
4に記載のプログラム。
【請求項6】
前記スポットの重要度に基づいて、前記エリアのクラスタリングを行うステップ、を実行させる、請求項1
から請求項4のいずれかに記載のプログラム。
【請求項7】
前記エリアにおける前記スポットの重要度と、前記クラスタリングにおいて生成されたクラスタにおけるスポットの重要度の代表値とを比較
し、前記エリアのクラスタ内における相対的な評価を行うステップを実行させる、請求項
6に記載のプログラム。
【請求項8】
予め生成されたユーザのクラスタと、前記エリアのクラスタリングによって生成されたエリアのクラスタとのマッチングを行うステップと、
前記クラスタに属するユーザに対して、マッチングされたクラスタに属するエリアをレコメンドするステップを実行させる、請求項
6に記載のプログラム。
【請求項9】
前記ユーザの利用度合いを算出するステップでは、
予め生成されたユーザのクラスタごとに、当該クラスタに属するユーザの利用度合いを算出する、請求項1
から請求項4のいずれかに記載のプログラム。
【請求項10】
前記クラスタに属するユーザの利用度合いを考慮して、前記エリアにおける前記スポットの当該クラスタに属するユーザにとっての重要度を算出するステップと、
当該重要度に基づいて、前記エリアの当該重要度に基づくエリアのクラスタリングを行うステップと、を実行させる、請求項
9に記載のプログラム。
【請求項11】
前記エリアのクラスタリングを行うステップでは、
前記エリアにおける前記スポットの重要度の共通性に基づいて、当該エリアのクラスタリングを行う、請求項
6に記載のプログラム。
【請求項12】
前記エリアのクラスタリングを行うステップの結果に基づいて、
当該エリアを利用したユーザのクラスタリングを行う、請求項
6に記載のプログラム。
【請求項13】
前記エリアのクラスタリングを行うステップの結果に基づいて、
予め生成されたユーザのクラスタと、前記エリアのクラスタリングによって生成されたエリアのクラスタとのマッチングを行
い、マッチングされたユーザのクラスタに属するエリアのレコメンドを実行する、請求項
6に記載のプログラム。
【請求項14】
プロセッサと、メモリとを備えるコンピュータに実行される方法であって、前記プロセッサが、請求項1から請求項
4のいずれかに係る発明において実行される全てのステップを実行する、方法。
【請求項15】
制御部と、記憶部とを備える情報処理装置であって、前記制御部が、請求項1から請求項
4のいずれかに係る発明において実行される全てのステップを実行する、情報処理装置。
【請求項16】
請求項1から請求項
4のいずれかに係る発明において実行される全てのステップを実行する手段を備える、システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、ユーザの位置情報及びユーザが訪れたスポットの情報に基づいて、ユーザが行動するエリアについてのデータを取得するプログラム、方法、情報処理装置およびシステムに関する。
【背景技術】
【0002】
近年のスマートフォンの普及に伴い、ユーザの位置情報を簡単に取得することが可能となっている。複数のユーザの位置情報を取得することができれば、人の流れを可視化することが可能となり、どのような人々がどのような場所に集うのか、また、人がどこからどこへ流れていくのかを分析することが可能となる。さらに、人が訪問した場所の共通性などに基づいて、分析することにより、地域振興・文化保護・ビジネスなどに役立てることが可能である。
【0003】
例えば、特許文献1では、ユーザに提示された案内情報に至る経路が選択された場合に、当該案内情報をユーザの嗜好情報として登録し、ユーザによって選択される頻度に応じた重要度を付するシステムが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1に開示された情報提供装置では、ユーザの嗜好についての分析を行う一方で、エリアの特色についての分析を行うことができなかった。
【0006】
本開示は、エリアの特色と当該エリアの利用実態を考慮した分析を可能とする技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示では、プロセッサを備えるコンピュータに、複数のユーザの位置情報を取得するステップと、所定のエリアにおけるスポットの情報を取得するステップと、前記ユーザの位置情報に基づき、前記スポットごとのユーザの利用度合いを算出するステップと、前記利用度合いを考慮して、前記エリアにおける前記スポットの重要度を算出するステップと、を実行させるプログラムが提供される。
【発明の効果】
【0008】
本開示によれば、エリアの利用実態を考慮して、当該エリアの特色を分析することが可能となる。
【図面の簡単な説明】
【0009】
【
図1】本開示の実施形態に係るサーバ10の機能構成の一例を示す図である。
【
図2】ユーザ情報DB1021のデータ構成の一例を示す図である。
【
図3】スポット情報DB1022のデータ構成の一例を示す図である。
【
図4】スポット情報取得部1032および重要度算出部1034の処理の一例を説明する図である。
【
図5】サーバ10の処理の流れを説明する図である。
【
図6】クラスタ生成部1035の処理を説明する図である。
【
図7】本開示のサーバ10のハードウェア構成を示す図である。
【
図8】ネットワークを介したシステム1の全体構成を示す図である。
【
図9】変形例における重要度算出部1034の処理を説明する図である。
【
図10】変形例におけるクラスタ生成部1035の処理を説明する図である。
【
図11】他の実施形態における時系列におけるスポットの利用実態を考慮する例を示す図である。
【
図12】他の実施形態におけるスポットの利用度合いの算出パターンの例を示す図である。
【
図13】他の実施形態におけるエリアのスケジューリングの例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、本開示の実施形態を説明する。なお、以下に説明する実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態で説明される構成の全てが、本開示の必須構成要件であるとは限らない。また、実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。
【0011】
近年の情報処理技術の発達により、ユーザの位置情報を簡単に取得することが可能となっており、人が訪問した場所の共通性などを分析することにより、地域振興・文化保護・ビジネスなどに役立てることが可能となっている。また、人口減少社会において地域の個性や特色を活かした地域づくりが提唱されている。このため、地域の多様性を分析する手法の開発が求められていた。現状は、一律の手法で評価する方法がなく、一律の手法で地域の多様性を分析するには全国のスポット情報と全国の位置情報が必要である。また、「住宅街」「歓楽街」「飲食街」といった既存の尺度のみでは、地域の特色を精緻に把握することが困難であった。具体的には、現状では、「人口の多寡」および「施設種別の多寡」での分析であるため、「住宅街」「歓楽街」「飲食街」といった既存のおおまかな分類でしか評価ができない。また、利用度合いについての基準がないから、「住宅街」「歓楽街」「飲食街」としてどの程度利用されているのかも評価できない。さらに、観光客というグループにとっては観光地となり得る地域でも、在住者にとって観光地ではないように、グループにとって地域の意味合いは変わってくる。このように、現状では、
・訪問場所の分類が大まかすぎる
・訪問場所の利用実態を考慮できていない
・全国内での相対的な評価がわからない
・ユーザの属するグループによらない一律の基準になってしまっている
といった改善の余地があった。このような点を留意して、出願人は以下に示す技術的思想に想到した。
【0012】
<1.第1実施形態>
(1.サーバ10の機能構成)
以下、サーバ10の構成を詳細に説明する。
図1に示すように、本実施形態に係るサーバ10は、通信部101、記憶部102、制御部103を備える。通信部101は、サーバ10が他の装置と通信するための処理を行う。通信部101は、制御部103で生成された信号に送信処理を施し、外部へ送信する。通信部101は、外部から受信した信号に受信処理を施し、制御部103へ出力する。
【0013】
記憶部102は、例えばフラッシュメモリ等により構成され、サーバ10が使用するデータ、及びプログラムを記憶する。記憶部102は、一例として、ユーザ情報データベース(Database/以下、DBと記載)1021と、スポット情報DB1022を備える。
【0014】
図2にユーザ情報DB1021の具体例を示す。ユーザ情報DB1021は、後述するユーザ情報取得部1031によって位置情報を取得されたユーザのユーザid、取得時間、ユーザの位置情報(緯度及び経度)を記憶する。なお、位置情報には高さに関する情報(一例として、標高または階数)を含めてもよい。ユーザ情報DB1021が記憶する情報はこれらに限られるものではなく、ユーザの年齢(年代)、性別、居住地域など他の情報を記憶してもよい。
【0015】
図3にスポット情報DB1022の具体例を示す。スポット情報DB1022は、スポットに関する情報(以下、スポット情報ともいう)を記憶する。スポットとは、ユーザが訪問して利用する対象となる場所のことである。一例として、スポットには、店舗、ショッピングモール等の複合商業施設、市役所や公園といった公共施設、およびそれらの一部の領域(例えば公園における特定の場所等)が含まれ得るが、これらの例に限定されない。
【0016】
スポット情報DB1022は、具体的には、スポットを識別するための識別id、スポットの位置情報(緯度、経度、および必要に応じて高さに関する情報)、スポット名(ショップ名など)、種類(飲食店、テーマパーク、駅などそのスポットの用途に基づく区分)等を記憶する。また、スポット情報DB1022には、そのスポットの営業日および営業時間、平均予算などその他の情報を記憶しておいてもよいし、そのスポットの公式ホームページ、紹介ページなどのリンクを保存しておき、スポットの各種情報を取得できるようにしておいてもよい。
【0017】
制御部103は、プロセッサ11が記憶部102に記憶されるプログラムを読み込み、プログラムに含まれる命令を実行することにより実現される。制御部103は、サーバ10の動作を制御する。具体的には、例えば、制御部103は、ユーザ情報取得部1031と、スポット情報取得部1032と、利用度合算出部1033と、重要度算出部1034と、クラスタ生成部1035としての機能を発揮する。以下、各機能について説明する。
【0018】
ユーザ情報取得部1031は、通信部101を介して、ユーザの位置情報及び時間情報(以下、総括してユーザ情報ともいう)を取得する。ユーザの位置情報は、例えば、緯度、経度などの情報である。また、時間情報は、位置情報を取得した時点の時間情報である。一例として、ユーザ情報取得部1031は、ユーザより、一定の時間的間隔をもって、定期的に位置情報及び時間情報を取得する。そして、ユーザ情報取得部1031は、位置情報を取得したユーザのユーザid、取得時間、ユーザの位置情報をユーザ情報DB1021に記憶する。このように、サーバ10は、様々な観点からクラスタリングなどを用いた分析ができるよう、取得したユーザの位置情報を一度記憶部102に記憶しておくことが好ましい。
【0019】
ユーザの位置情報の取得には、ユーザが所持するスマートフォン、スマートウォッチなどに搭載されたGPS(Global Positioning System)などの情報を用いてもよい。また、磁気リーダ、ICリーダなどの端末を設置し、ユーザがこれらの端末に自らの端末等を読み取らせたことをもって位置情報を取得してもよい。さらに、携帯電話など通信装置の基地局から得られる位置情報、WiFi(Wireless Fidelity、登録商標)、Bluetooth(登録商標)、beacon等から得られる位置情報を取得してもよい。
【0020】
また、ユーザ情報取得部1031は、SNS(Social Networking Service)等のWebサービスに発信された情報に基づいて位置情報を取得してもよい。
【0021】
一例として、ユーザ情報取得部1031は、ユーザより、一定の時間的間隔をもって、定期的に位置情報及び時間情報を取得することが望ましい。ユーザの位置情報を取得する間隔は、短ければ短いほど詳細な分析が可能となる点において、望ましい。
【0022】
一方で、位置情報を取得する時間的間隔が長ければ、システム及びネットワークへの負担を軽減することが可能となる。したがって、ユーザ情報取得部1031は、分析の対象とシステムの負荷を考慮しつつ、ユーザの位置情報を取得する時間的間隔を設定することが好ましい。なお、位置情報及び時間情報の取得は、一定の時間的間隔でなくてもよく、取得後に一定間隔に成型する仕様としてもよい。
【0023】
スポット情報取得部1032は、分析の対象となるエリア(以下、分析エリアともいう)内にあるスポットの情報を取得する。ここで、エリアとは、ユーザによって設定される所定の領域のことである。一例として、エリアは市町村などの行政区分であってもよく、ユーザによって設定される所定の距離(例えば10キロメートル)四方の領域であってもよく、または、ユーザによって設定された地点から所定の距離(例えば10キロメートル)を半径とした円形の領域であってもよい。スポット情報取得部1032は、ユーザによって指定されたエリアに含まれるスポットについてのスポット情報を、スポット情報DB1022から取得する。または、スポット情報取得部1032は、分析エリアに含まれるスポットについてのスポット情報を、他の情報提供サービスから情報連携を受けてもよいし、複数のホームページのスクレイピングを行うことにより、取得してもよい。
【0024】
利用度合算出部1033は、所定の期間に分析エリア内のスポットを利用したユーザ(以下、利用ユーザともいう)による利用の度合いを算出する。所定の期間(以下、分析期間ともいう)は、任意の期間を設定することができ、例えば1カ月間としてもよい。なお、利用度合算出部1033は、地図を予め所定の間隔(一例として125m間隔)で方眼状にメッシュとして区切り、当該メッシュ単位でスポットに訪問したか否かを判定してもよい。この場合、あるメッシュを訪問した場合に、当該メッシュ内に含まれる1つまたは複数のスポットを全て訪問したと判定してもよい。また、所定のスポットが例えば大きな公園のように広い面積を有する場合には、1つのスポット内に複数のメッシュが存在するケースもあり得る。この場合、1つのスポット内の複数のメッシュを訪問した場合であっても、当該スポットを1回訪問したと判定してもよい。
【0025】
利用度合算出部1033は、ユーザがスポットを訪問した場合に当該スポットを利用したと判定してもよいし、ユーザがスポットを訪問して所定の時間以上滞在した場合に、当該スポットを利用したと判定してもよい。利用度合算出部1033は、ユーザ情報DB1021およびスポット情報DB1022を参照し、所定の期間に分析エリア内のスポットを利用したユーザによる利用の度合いを算出する。ここで、利用の度合いとは、一例として、ユーザによる訪問回数であってもよいし、利用時間(すなわち滞在時間)であってもよいし、ユニークユーザによる利用の回数(利用頻度)であってもよい。また、利用の度合いを示す他の値を算出してもよい。また、訪問回数を算出する場合には、スポットを訪問したユーザの述べ人数としての回数、またはスポットを訪問したユーザの実人数としての回数のいずれを採用してもよい。
【0026】
重要度算出部1034は、分析エリアにおけるスポットの重要度(一例としてTF-IDF値)を算出する。本実施形態では、重要度算出部1034は、ユーザによるスポットの利用度合いを考慮して、分析エリアにおけるスポットの種類の利用重要度Irを算出する。なお、重要度の算出にあたっては、任意の母集団が採用され得る。以下に示す例では、日本全国を母集団としているが、この例に限定されることはない。
【0027】
一例として、分析エリアにおけるスポットの種類の重要度Inは以下の式で算出される。
In(重要度)=Fn(頻度)×Rn(レアリティ)
Fn=(An/Bn)
Rn=log(Cn/Dn)
An:分析エリアにおける当該種類のスポット数
Bn:日本全国(母集団の一例)に存在する当該種類のスポット数
Cn:日本全国に存在する全エリア数
Dn:当該種類のスポットが存在するエリア数
【0028】
例えば、
図4Aに示す分析エリアRでは、種類「カフェ」のスポット数が15、種類「温泉」のスポット数が5、種類「餃子」のスポット数が10であるとする。また、日本全国における種類「カフェ」のスポット数が70000、種類「温泉」のスポット数が20000、種類「餃子」のスポット数が50000であるとする。また、日本全国に存在する全エリア数が178397であるとする。また、日本全国において、種類「カフェ」のスポットが存在するエリア数が20000、種類「温泉」のスポットが存在するエリア数が15000、種類「餃子」のスポットが存在するエリア数が10000であるとする。この場合、スポットの種類「カフェ」の重要度Inは以下のように算出される。
An:分析エリアにおける種類「カフェ」のスポット数=15
Bn:全国に存在する種類「カフェ」のスポット数=70000
Cn:日本全国に存在する全エリア数=178397
Dn:種類「カフェ」のスポットが存在するエリア数=20000
In[カフェ]=Fn(頻度)×Rn(レアリティ)=(An/Bn)×log(Cn/Dn)=(15/70000)×log(178397/20000)=0.00020
【0029】
以上のようにして、一般に、分析エリアRにおけるスポットの種類の重要度Inを、種類「カフェ」、種類「温泉」、種類「餃子」について算出すると、
図4Bに示す値となる。しかし、このようにして算出された重要度では、各種類に属するスポット数の多寡についての情報しか得られないという課題があった。
【0030】
これに対して、本実施形態における重要度算出部1034は、ユーザによるスポットの利用度合いを考慮するため、以下の式で利用重要度Irを算出する。
Ir(利用重要度)=Fr(頻度)×Rr(レアリティ)
Fr=(Ar/Br)
Rr=log(Cr/Dr)
Ar:分析エリアにおける当該種類のスポットの利用度合い
Br:日本全国に存在する当該種類のスポットの利用度合い
Cr:日本全国に存在する全エリア数
Dr:当該種類のスポットが存在するエリア数
【0031】
例えば、
図4Aに示す分析エリアRでは、種類「カフェ」の利用度合い(一例として訪問回数)が70000、種類「温泉」の利用度合いが15000、種類「餃子」の利用度合いが10000であるとする。また、全国における種類「カフェ」の利用度合いが7000000、種類「温泉」の利用度合いが2500000、種類「餃子」の利用度合いが1000000であるとする。この場合、スポットの種類「カフェ」の利用重要度Irは以下のように算出される。
Ar:分析エリアにおける種類「カフェ」のスポットの利用度合い=70000
Br:日本全国に存在する種類「カフェ」のスポットの利用度合い=7000000
Cr:日本全国に存在する全エリア数=178397
Dr:種類「カフェ」のスポットが存在するエリア数=20000
Ir[カフェ]=Fr(頻度)×Rr(レアリティ)=(Ar/Br)×log(Cr/Dr)=(70000/7000000)×log(178397/20000)=0.0095
【0032】
以上のようにして、分析エリアRにおける利用重要度Irを種類「カフェ」、種類「温泉」、種類「餃子」について算出すると、
図4Cに示す値となる。
図4Bと
図4Cとを対比すると、店舗数だけに基づいて算出された重要度Inと比べて、利用頻度を考慮した利用重要度Irにおいては、種類「カフェ」の重要度の値が種類「カフェ」よりも高くなっている。このようにして、本実施形態では、重要度算出部1034は、ユーザの利用頻度を考慮して重要度を算出するため、ユーザの利用実績に即した分析が可能となる。
【0033】
クラスタ生成部1035は、重要度算出部1034が算出したスポットの利用重要度Irに基づいて、複数の分析エリアのクラスタリング(グルーピング)を行う。クラスタ生成部1035は、複数の分析エリアについて、スポットの利用重要度Irに基づいて、分析エリアの分類であるクラスタを生成する。
【0034】
クラスタ生成部1035は、例えば、利用重要度Irの共通性に基づき、階層型クラスタリング、非階層型クラスタリング、または既知のアルゴリズムなどを用いてクラスタ生成を行う。このとき、クラスタ生成部1035は、クラスタ生成の目標をM1個とし、クラスタリングを行った後に、共通するエリア数の多いものからM1個のクラスタを生成してもよい。
【0035】
また、クラスタ生成部1035は、クラスタリングを行う際に、スポットの訪問回数、訪問時刻、滞在時間およびスポットの種類の共通性の少なくとも1つを加味してクラスタを生成してもよい。加えて、クラスタ生成部1035は、総滞在時間、平均滞在時間、テレビ・雑誌・インターネット・SNSなどメディアで紹介・引用された回数、移動体などを加味してクラスタを生成してもよい。
【0036】
さらに、クラスタ生成部1035は、クラスタリングを行う際に、スポットの共通性、スポットの訪問回数、訪問時刻、滞在時間、スポットの種類の共通性、総滞在時間、平均滞在時間、テレビ・雑誌・インターネット・SNSなどメディアで紹介・引用された回数、移動体、購買データ、スポットが取り扱う商品や役務の料金、商品や役務の種別・種類などの要素に対して、それらによる重みづけを加味してクラスタを生成してもよい。
【0037】
また、クラスタ生成部1035は、スポットに対して、意味のある場所、すなわちレアリティの高い場所に対して高い値を付与してもよい。レアリティは、一部のユーザが共通した行動をとる場合に高い値を付与する。例えば、訪問回数の少ない場所に対して、レアリティを高く付与してもよい。駅やコンビニなどは、多くの人が訪問するため、レアリティを低く付与する。一方で、特定の趣味をもった人に人気の書店や、ライブハウスなど、訪問回数の少ない場所はレアリティを高く付与する。
【0038】
また、例えば、スポットの滞在時間や一人あたりの訪問回数が大きい場所にレアリティを高く付与してもよい。これは、あるスポットの滞在時間は通常15分以内であるが、一部のユーザのみ60分以上滞在する場合にレアリティを高く付与してもよい。すなわち、通常、ある駅を利用するユーザは駅から電車に乗るために利用するが、一部のユーザは電車を撮影するために訪問時間が長い場合、60分以上滞在するユーザを通常のスポットAとは別の疑似的なスポットA2としてクラスタを生成してもよい。さらに、特定日時のスポットあるいはスポットの種類にレアリティを高く付与してもよい。例えば、ある施設や催事場で行われる催しごとに通常のスポットBとは別の疑似的なスポットB2(または通常のスポットの種類Cとは別の疑似的なスポットの種類C2)としてクラスタを生成し、スポットB2(またはスポットの種類C2)にスポットB(またはスポットの種類C)よりも高いレアリティを付与してもよい。
【0039】
さらに、例えば、あるスポットに対して、関連するスポットが少ないスポットに対してレアリティを高く付与してもよい。
【0040】
クラスタ生成部1035は、クラスタ生成を行う際に、レアリティが一定の閾値を超えるスポットのみを選択した上で、ユーザが訪問するスポットの共通性に基づき、クラスタ生成を行ってもよい。
【0041】
クラスタ生成部1035は、クラスタを生成する際に、レアリティの高いスポットを多く含むクラスタのスコアを高く設定し、スコアの高いクラスタを優先的に生成し、または、クラスタ生成後にスコアの高いクラスタから並べ替えてクラスタを抽出してもよい。
【0042】
クラスタ生成部1035がクラスタを生成するに際して、共通するスポットに基づいてクラスタを生成するのではなく、いくつかのスポットをまとめたゾーンを形成し、ゾーンに基づいてクラスタを生成してもよい。このとき、クラスタ生成部1035は、スポットと同様に、ゾーンの位置情報、ゾーンに属するスポットの種類、属性、ユーザの訪問回数などの情報を用いて、クラスタリングを行ってもよい。
【0043】
クラスタ生成部1035は、クラスタを生成するに際して、分類を行うスポット、ゾーンの範囲を限定し、その限定された範囲内でのスポット、ゾーンに基づいてクラスタを生成してもよい。また、クラスタ生成部1035は、一定の時間的範囲をもって、指定された時間内におけるクラスタを生成してもよい。このとき、曜日、時間帯などの範囲をもってクラスタを生成してもよい。
【0044】
さらに、クラスタ生成部1035は、クラスタを生成するに際して、スポット、ゾーンの訪問回数、訪問時刻、滞在時間などを考慮した上で、クラスタを生成してもよい。このように、スポットの共通性など、一定の要素をもとにクラスタリングを行うことで、クラスタ又はスポット毎の特性を把握することが可能となる。
【0045】
(2.処理の流れ)
図5は、本開示の第1実施形態におけるクラスタ生成プログラムの処理の流れを示す。
【0046】
(2.1.ユーザ情報の取得)
ステップS110において、ユーザ情報取得部1031は、ユーザの位置情報と時間を継続的に取得する。そして、ユーザ情報取得部1031は、取得した情報を、ユーザ情報DB1021に順次記憶する。
【0047】
(2.2.スポット情報の取得)
ステップS120において、スポット情報取得部1032は、スポット情報DB1022を参照して、ユーザによって指定された分析エリアに含まれるスポットについてのスポット情報を取得する。
【0048】
(2.3.利用度合いの算出)
ステップS130において、利用度合算出部1033は、所定の期間に分析エリア内のスポットを利用したユーザによる利用の度合いを算出する。一例として、利用度合算出部1033は、所定の期間に分析エリア内のスポットを訪問したユーザの数を、当該スポットを利用した利用ユーザ数であるとして算出する。
【0049】
(2.4.重要度の算出)
ステップS140において、重要度算出部1034は、利用度合算出部1033が算出したスポットの利用度合いを考慮して、分析エリアにおけるスポットの種類の利用重要度Irを算出する。一例として、重要度算出部1034は、ユーザによる訪問回数に基づいて、スポットの種類の利用重要度を以下の式で算出する。
Ir(利用重要度)=Fr(頻度)×Rr(レアリティ)
Fr=(Ar/Br)
Rr=log(Cr/Dr)
Ar:分析エリアにおける当該種類のスポットの訪問回数
Br:日本全国に存在する当該種類のスポットの訪問回数
Cr:日本全国に存在する全エリア数
Dr:当該種類のスポットが存在するエリア数
【0050】
(2.5.エリアのクラスタリング)
ステップS150において、クラスタ生成部1035は、重要度算出部1034が算出したスポットの利用重要度Irに基づいて、分析エリアのクラスタリングを行う。クラスタ生成部1035は、例えば、次に示すように、階層型クラスタリングを用いて分析エリアのクラスタリングを行う。
【0051】
階層型クラスタリングでは、例えば、エリアごとの利用重要度Irの共通性を距離又は類似度に見立てて、エリアのクラスタリングを行う。具体的には、例えば、A,B,Cの3つのエリアがあり、そのエリアの重要度が高いスポットの種類がそれぞれA=(温泉,土産屋,射的場,カフェ,居酒屋)、B=(温泉,土産屋,射的場,餃子,カフェ)、C=(映画館,餃子,美術館,居酒屋,カフェ)であった場合、重要度の共通性が高い(類似度が高い)AとBがまずはクラスタリングが行われ、そののちに、A+B,Cという形でクラスタリングが行われてもよい。階層型クラスタリングの候補としては、A+B+C、A+B、C、A、Bというパターンが生成されてもよい。
【0052】
図6は、分析エリアごとに算出された利用重要度の特徴を例示する図である。
図6Aと
図6Bを比較すると、いずれの分析エリアにおいても「温泉」、「土産屋」、「射的場」の利用重要度が高いため、いずれの分析エリアも温泉街であると推察することができる。このように、本開示におけるサーバ10による処理を行うことにより、エリアの特色と当該エリアの利用実態を考慮した分析を行うことが可能となる。
【0053】
(3.ハードウェア構成)
図7は、サーバ10のハードウェア構成を示す図である。サーバ10は、汎用のコンピュータである。サーバ10は、例えば、据え置き型のPC(Personal Computer)、ラップトップPC等により実現される。また、サーバ10は、スマートフォン、又はタブレット端末などの携行性を備えたコンピュータであってもよい。
【0054】
図7に示すように、サーバ10は、プロセッサ11、メモリ12、ストレージ13、通信IF14、入出力IF15を備える。
【0055】
プロセッサ11は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路などにより構成される。メモリ12は、プログラム、および、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えばDRAM(Dynamic Random Access Memory)等の揮発性のメモリにより実現される。ストレージ13は、データを保存するための記憶装置であり、例えばフラッシュメモリ、HDD(Hard Disc Drive)により実現される。通信IF14は、サーバ10が外部の装置と通信するため、信号を送受信するためのインタフェースである。入出力IF15は、ユーザからの入力を受け付けるための入力装置、および、ユーザに対し情報を提示するための出力装置とのインタフェースとして機能する。
【0056】
図8は、サーバ10とユーザ端末20とを接続させたシステム1の例を示す。本開示に係るシステム1は、
図8に示すように、サーバ10と、ユーザ端末20とをネットワークを介して接続させて動作させてもよい。このとき、サーバ10とユーザ端末20との間で、機能を分散させてもよい。また、複数のサーバを用いて機能を分散させてもよい。
【0057】
また、本開示に係る情報処理装置は、上記装置によらず、例えば、コンピュータがプログラムを実行することで、その機能を実現してもよい。情報処理装置の機能を実現するためのプログラムは、USB(Universal Serial Bus)メモリ、CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)、HDD(Hard Disc Drive)等のコンピュータ読み取り可能な記録媒体に記憶されてもよいし、ネットワークを介してコンピュータにダウンロードされてもよい。
【0058】
(4.小括)
以上のようにして、本実施形態では、サーバ10は、複数のユーザの位置情報を取得するステップ(S110)と、所定のエリアにおけるスポットの情報を取得するステップ(S120)と、ユーザの位置情報に基づき、スポットごとのユーザの利用度合いを算出するステップ(S130)と、利用度合いを考慮して、エリアにおけるスポットの重要度(一例として、スポットの種類の重要性)を算出するステップ(S140)と、スポットの重要度に基づいて、エリアのクラスタリングを行うステップ(S150)と、を実行する。
【0059】
このような構成とすることにより、エリアの特色と当該エリアの利用実態を考慮した分析を行うことができる。すなわち、本実施形態における技術的思想を適用することにより、例えば、
・若者にとっての流行っている街
・母親にとっての社交場
・流行感度の高い人に向いているエリア
などを把握することができ、地域を有機的(他の要素とのつながりを考慮して)、立体的(他の地域および時系列を考慮して)に捉えることができ、ヒトコトモノの効果的な資源配分を行うことが可能となる。
【0060】
なお、制御部103は、重要度算出部1034によって算出された分析エリアにおけるスポットの重要度と、クラスタ生成部1035によって生成されたエリアのクラスタにおけるスポットの重要度の代表値とを比較してもよい。代表値とは、統計データとして算出される値であって、平均値、中央値、最頻値、最小値、および最大値が含まれ得る。例えば、制御部103は、分析エリアAがクラスタリングされたエリアクラスタXのスポットの重要度の代表値と、分析エリアAにおけるスポットの重要度との比較を行うことにより、分析エリアAのエリアクラスタX内における相対的な評価を行うことが可能となる。
【0061】
(5.変形例)
図9、
図10を参照して、本実施形態の変形例について説明する。変形例では、サーバ10は、予め生成されたユーザのクラスタごとに分析エリアのクラスタリングを行う点で上記実施形態と相違する。以下、相違点を中心に説明する。
【0062】
変形例では、複数のユーザが予め複数のクラスタに分類されており、各クラスタに属するユーザごとにスポットの利用重要度が算出される。重要度算出部1034は、各クラスタに属するユーザによるスポットの利用度合いを考慮するため、以下の式で利用重要度Ir′を算出する。なお、変形例においては、ユーザの利用度合いとして、スポットでの滞在時間に基づいて利用重要度が算出される。
Ir′(クラスタごとの利用重要度)=Fr′(クラスタごとの頻度)×Rr′(クラスタごとのレアリティ)
Fr′=(Ar′/Br′)
Rr′=log(Cr′/Dr′)
Ar′:所定の期間における当該種類のスポットでのクラスタ内のユーザ一人当たりの滞在時間
Br′:所定の期間における日本全国に存在する当該種類のスポットでのユーザ一人当たりの滞在時間
Cr′:日本全国に存在する全エリア数
Dr′:当該種類のスポットが存在するエリア数
【0063】
例えば、
図9に示す例では、クラスタAに属するユーザによる種類「カフェ」での滞在時間が30分、種類「温泉」での滞在時間が200分、種類「餃子」での滞在時間が10分であるとする。また、全国における種類「カフェ」での滞在時間が15分、種類「温泉」での滞在時間が60分、種類「餃子」での滞在時間が45分であるとする。また、日本全国に存在する全エリア数が178397であるとする。また、日本全国において、種類「カフェ」のスポットが存在するエリア数が20000、種類「温泉」のスポットが存在するエリア数が15000、種類「餃子」のスポットが存在するエリア数が10000であるとする。
【0064】
この場合、クラスタAに属するユーザによるスポットの種類「カフェ」の利用重要度Irは以下のように算出される。
Ar′:所定の期間における当該種類のスポットでのクラスタ内のユーザ一人当たりの滞在時間=30分
Br′:所定の期間における日本全国に存在する当該種類のスポットでのユーザ一人当たりの滞在時間の平均値=15分
Cr′:日本全国に存在する全エリア数=178397
Dr′:種類「カフェ」のスポットが存在するエリア数=20000
Ir′[A/カフェ]=Fr′(頻度)×Rr′(レアリティ)=(Ar′/Br′)×log(Cr′/Dr′)
=(30/15)×log(178397/20000)=1.90
【0065】
また、クラスタBに属するユーザによる種類「カフェ」での滞在時間が10分、種類「温泉」での滞在時間が30分、種類「餃子」での滞在時間が120分であるとする。この場合、クラスタBに属するユーザによるスポットの種類「カフェ」の利用重要度Irは以下のように算出される。
Ar′:所定の期間における当該種類のスポットでのクラスタ内のユーザ一人当たりの滞在時間=10分
Br′:所定の期間における日本全国に存在する当該種類のスポットでのユーザ一人当たりの滞在時間の平均値=15分
Cr′:日本全国に存在する全エリア数=178397Dr′:種類「カフェ」のスポットが存在するエリア数=20000
Ir′[A/カフェ]=Fr′(頻度)×Rr′(レアリティ)=(Ar′/Br′)×log(Cr′/Dr′)
=(10/15)×log(178397/20000)=0.63
【0066】
このように変形例では、重要度算出部1034は、ユーザが属するクラスタごとにスポットの利用度合いを算出する。クラスタ生成部1035は、重要度算出部1034が算出した利用重要度に基づいて、複数の分析エリアのクラスタリングを行う。
【0067】
図10は、ユーザが属するクラスタごとに、分析エリアごとに算出された利用重要度の特徴を例示する図である。このように変形例においては、クラスタに属するユーザごとに利用度合いを算出するため、特定のクラスタに属するユーザにとってのエリアの特色を考慮した分析を行うことが可能となる。
【0068】
なお、変形例においては、ユーザのクラスタは適宜設定可能である。例えば、ユーザの年代別のクラスタを用いてもよいし、性別によるクラスタを用いてもよい。このようにすることで、特定の年代/性別のクラスタに属するユーザにとって特定のエリアがどのような重要度を持つかを、ユーザの利用度合いを考慮して把握することができる。
【0069】
また、ユーザの利用度合いの算出および重要度の算出においては、時間帯を区切って算出してもよい。このようにすることで、特定の時間帯において、特定のエリアがどのような重要度を持つかを、ユーザの利用度合いを考慮して把握することができる。また、重要度の算出において、所定の母集団における利用度合い(上記例では滞在時間)の平均値(代表値の一例)を用いて頻度を算出してもよい。このように平均値を用いることで、標準偏差を頻度として求めて、重要度を算出することが可能となる。なお、利用度合いの平均値は一例であって、他の代表値(すなわち、中央値、最頻値、最小値および最大値の少なくとも1つ)を用いて頻度を求めて、重要度を算出してもよい。
【0070】
また、重要度算出部1034は、クラスタに属するユーザの利用度合いを考慮して、分析エリアにおけるスポットの当該ユーザにとっての重要度を算出し、クラスタ生成部1035は、当該重要度に基づいて、エリアのクラスタリングを実行してもよい。このような構成とすることにより、クラスタに属するユーザにとっての重要度に基づいて、エリアを分析することが可能となる。
【0071】
<2.他の実施形態>
以上、本願の技術的範囲を適用する実施形態について説明したが、上記内容に限定されることはない。
【0072】
例えば、上記実施形態では、ユーザが分析エリア内の特定のスポットを利用したか否かの利用実績を用いて処理を行っているが、時系列におけるスポットの利用実績を考慮してもよい。
【0073】
具体的には、一例として、
図11Aに示すように、利用度合算出部1033は、所定の間隔に定められたメッシュ単位で、ユーザがスポットに訪問したか否かを判定する。ここで、区画A~区画Yがそれぞれスポットに対応している。利用度合算出部1033は、特定のスポットを訪問したユーザが、訪問したタイミングを基準とした所定の期間(例えば12時間ごとの前後期間)に、どのスポットを訪問したかを検出する。
【0074】
図11Bに示す図では、所定の期間内に区画Aに初めて訪れた(以下、チェックインしたという)ユーザ13人のうち、チェックインのタイミングを基準として単位時間T(本実施形態では一例として30分)経過後に、3人が区画Bに、2人が区画Cに、1人が区画Dに移動したことが示されている。また、当該ユーザ13人のうち、2T経過後には、3人が区画Bに、2人が区画Cに、2人が区画Dに、1人が区画Eに、1人が区画Fに移動したことが示されている。
【0075】
一方、当該ユーザ13人のうち、チェックインのタイミングを基準として単位時間T前には、7人が区画Bに、3人が区画Cに、2人が区画Dに、1人が区画Eにいたことが示されている。また、当該ユーザ13人のうち、チェックインのタイミングを基準として2T前には、5人が区画Bに、2人が区画Cに、3人が区画Dに、2人が区画Eに、1人が区画Fにいたことが示されている。
【0076】
このように、利用度合算出部1033は、ユーザがスポットにチェックインしたタイミングを基準として、前後12時間(すなわちチェックインを基準とした相対時刻としての24時間の期間)における当該ユーザによる他のスポットの利用実績を算出してもよい。このようにチェックインのタイミングを基準とした所定の単位時間ごとの前後期間における位置情報を取得することにより、ユーザの時系列に沿った行動を把握することができ、ユーザが訪問したスポットの時系列を考慮したクラスタリングを行うことも可能となる。または、利用度合算出部1033は、所定の絶対時刻としての24時間における当該ユーザによる他のスポットの利用実績を算出してもよい。
【0077】
また、上記実施形態では、重要度算出部1034は、分析エリアにおけるスポットの利用重要度を算出するにあたって、母集団として日本全国を採用しているが、この例に限定されることはない。例えば、一部の地域(例えば関東地域)を母集団として採用してもよいし、または、所定の期間を母集団として採用して、分析エリアにおけるスポットの重要度を算出してもよい。
【0078】
具体的には、重要度算出部1034は、例えば以下に示す式で利用重要度Irを算出してもよい。このような仕様としても、本開示の技術的思想を適用することが可能である。
Ir(利用重要度)=Fr(頻度)×Rr(レアリティ)
Fr=(Ar/Br)
Rr=(Cr/Dr)
Ar:所定の調査期間(例えば1カ月)における分析エリアにおける当該種類のスポットの利用度合い
Br:所定の母集団としての期間(例えば1年)における分析エリアにおける当該種類のスポットの利用度合い
Cr:所定の母集団としての期間における全スポットの利用度合い
Dr:所定の調査期間における分析エリアにおける当該種類のスポットの利用度合い
【0079】
たとえば、クラスタ生成部1035は、上述したエリアのクラスタリングを行った後に、クラスタリングされたエリアを訪問したユーザのクラスタリングを行ってもよい。ユーザのクラスタリングにあたっては、上述のエリアのクラスタリングと同様の手法を用いることができる。例えば、クラスタ生成部1035は、ユーザが訪問したエリアの共通性(またはユーザが訪問したエリアの属するクラスタの共通性)に基づいて、階層型クラスタリング、非階層型クラスタリング、または既知のアルゴリズムなどを用いてクラスタ生成を行う仕様としてもよい。
【0080】
また、クラスタ生成部1035は、予め生成されたユーザのクラスタと、上述したエリアのクラスタリングによって生成されたエリアのクラスタとのマッチングを行い、特定のクラスタに属するユーザに対して、マッチングされたクラスタに属するエリアをレコメンド(推奨)してもよい。
【0081】
また、上記実施形態では、利用度合算出部1033は、地図を予め所定の間隔(一例として125m間隔)で方眼状にメッシュとして区切り、当該メッシュ単位でスポットに訪問したか否かを判定している。ここで、メッシュの間隔は、250m、500m、1km等適宜設定可能である。また、メッシュ内のスポットの利用度合いを算出にあたり、メッシュへの訪問回数をメッシュ内の異なるスポットそれぞれに適用して利用度合いを算出してもよい。あるいは、メッシュをさらに分割した区画ごとの訪問回数を、当該区画内のスポットに適用して利用度合いを算出してもよい。
【0082】
例えば、
図12Aに示すように、ユーザのメッシュMへの訪問回数が300回だった場合に、メッシュM内の全てのスポットへの訪問回数を300回として利用度合いを算出してもよい。または、
図12Bに示すように、メッシュMをさらに4つの区画に分割して、当該分割された区画ごとの訪問回数を、当該区画内のスポットの訪問回数として利用度合いを算出してもよい。
【0083】
また、上記実施形態で算出したスポットの重要度(またはスポットの種類の重要度)に基づいて、スポットが属するエリアの時系列に沿った重要度の評価(以下、エリアのスケジューリングともいう)を行ってもよい。
図13は、特定のエリアにおけるユーザのクラスタA~Dにとっての重要度の相対値を時系列に沿って比較した図である。このように、エリアのスケジューリングを行うことで、ユーザが属するクラスタに合った観光地などのエリアのレコメンドを行うことが可能となる。また、エリアのスケジューリングを行うことで、特定のクラスタに属するユーザの旅行日程などに応じて、お勧めの観光エリアなどをレコメンドすることが可能となる。また、特定のユーザの利用実態に応じて、特定のエリアにおいて不足している施設のジャンルを把握することができる。例えば、映画を見た後にカフェに行きたいといったニーズを把握した上で、カフェの数を増やすといった出店計画に利用することが可能となる。また、エリアの時系列に沿った重要度の評価に基づき、エリアのクラスタリングを行ってもよい。
【0084】
また、利用度合算出部1033は、ユーザの位置情報に基づき、スポットごとの時系列を考慮したユーザの利用度合いを算出し、クラスタ生成部1035は、スポットの時系列を考慮した利用度合いに基づくクラスタリングを実行してもよい。このような構成とすることにより、スポットの重要度を算出することなく、スポットごとの時系列を考慮したユーザの利用度合いに基づいて、エリアの特色を分析することが可能となる。
【0085】
また、通信回線を介した所定情報の共有は、主にインターネットなどのWANを介して行われるが、情報処理装置間では、WANを介さずにBluetooth(登録商標)等の近距離の無線通信、及び赤外線通信等のみを介して行われてもよい。
【0086】
また、上記実施形態では、各機能をサーバ10が備える態様の一例について説明したが、この形態に限定されることはなく、一部または全部の機能について上記実施形態と異なる態様で複数のサーバまたは端末装置などが実施する仕様としてもよい。
【0087】
さらに、本発明は、上述したサーバ10が備える機能を情報処理装置に実行させるプログラムとして実現してもよいし、当該プログラムを格納する、コンピュータ読み取り可能な非一時的な記録媒体として実現してもよい。
【0088】
以上、本発明に係る種々の実施形態を説明したが、これらは例として提示したものであり、発明の範囲を限定することは意図していない。当該新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。当該実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0089】
1:システム、10:サーバ、11:プロセッサ、12:メモリ、13:ストレージ、20:ユーザ端末、101:通信部、102:記憶部、103:制御部、1031:ユーザ情報取得部、1032:スポット情報取得部、1033:利用度合算出部、1034:重要度算出部、1035:クラスタ生成部。
【要約】
【課題】エリアの特色と当該エリアの利用実態を考慮した分析を行う。
【解決手段】プロセッサを備えるコンピュータに、複数のユーザの位置情報を取得するステップと、所定のエリアにおけるスポットの情報を取得するステップと、前記ユーザの位置情報に基づき、前記スポットごとのユーザの利用度合いを算出するステップと、前記利用度合いを考慮して、前記エリアにおける前記スポットの重要度を算出するステップと、を実行させるプログラムが提供される。
【選択図】
図5