特許第6484767号(P6484767)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社Geolocation Technologyの特許一覧

特許6484767IPアドレスに基づくユーザ属性推定システム
<>
  • 特許6484767-IPアドレスに基づくユーザ属性推定システム 図000002
  • 特許6484767-IPアドレスに基づくユーザ属性推定システム 図000003
  • 特許6484767-IPアドレスに基づくユーザ属性推定システム 図000004
  • 特許6484767-IPアドレスに基づくユーザ属性推定システム 図000005
  • 特許6484767-IPアドレスに基づくユーザ属性推定システム 図000006
  • 特許6484767-IPアドレスに基づくユーザ属性推定システム 図000007
  • 特許6484767-IPアドレスに基づくユーザ属性推定システム 図000008
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6484767
(24)【登録日】2019年2月22日
(45)【発行日】2019年3月13日
(54)【発明の名称】IPアドレスに基づくユーザ属性推定システム
(51)【国際特許分類】
   G06Q 10/04 20120101AFI20190304BHJP
   G06Q 30/02 20120101ALI20190304BHJP
【FI】
   G06Q10/04
   G06Q30/02 398
【請求項の数】9
【全頁数】19
(21)【出願番号】特願2018-542794(P2018-542794)
(86)(22)【出願日】2018年4月27日
(86)【国際出願番号】JP2018017225
【審査請求日】2018年8月13日
【早期審査対象出願】
(73)【特許権者】
【識別番号】503295518
【氏名又は名称】株式会社Geolocation Technology
(74)【代理人】
【識別番号】100105784
【弁理士】
【氏名又は名称】橘 和之
(72)【発明者】
【氏名】山本 敬介
【審査官】 上田 威
(56)【参考文献】
【文献】 特開2007−249578(JP,A)
【文献】 特開2017−146943(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 − 99/00
(57)【特許請求の範囲】
【請求項1】
IPアドレスと、そのIPアドレスに基づき特定可能な属性情報とを関連付けて成るIPアドレス属性情報を、当該IPアドレス属性情報を日時情報と共に履歴情報として蓄積した第1のデータベースから取得するIPアドレス属性情報取得部と、
ユーザ端末からウェブサイトにアクセスしたときに取得されるユーザ識別子と、上記ウェブサイトへのアクセスを通じて取得されるIPアドレスおよび閲覧関連情報とを関連付けて成るユーザ識別子属性情報を、当該ユーザ識別子属性情報を日時情報と共に履歴情報として蓄積した第2のデータベースから取得するユーザ識別子属性情報取得部と、
上記IPアドレス属性情報取得部により取得された上記IPアドレス属性情報の履歴情報と、上記ユーザ識別子属性情報取得部により取得された上記ユーザ識別子属性情報の履歴情報とを、上記IPアドレスおよび上記日時情報をキーとして第3のデータベースに統合するデータベース統合部と、
上記データベース統合部により統合された上記第3のデータベースに格納された情報に基づいて、上記ユーザの属性を推定するユーザ属性推定部とを備えたことを特徴とするIPアドレスに基づくユーザ属性推定システム。
【請求項2】
上記IPアドレス属性情報取得部は、上記IPアドレスに基づき特定可能な属性情報として、上記IPアドレスが使われているユーザ端末の地域を表す地域情報を上記第1のデータベースから取得し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記地域情報と、上記第2のデータベースから取得された上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所在地域を推定することを特徴とする請求項1に記載のIPアドレスに基づくユーザ属性推定システム。
【請求項3】
上記IPアドレス属性情報取得部は、上記IPアドレスに基づき特定可能な属性情報として、上記IPアドレスが使われているユーザ端末の保有組織を表す組織情報を上記第1のデータベースから取得し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記組織情報と、上記第2のデータベースから取得された上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所属組織を推定することを特徴とする請求項1に記載のIPアドレスに基づくユーザ属性推定システム。
【請求項4】
上記ユーザ識別子属性情報取得部は、上記ウェブサイトへのアクセスを通じて取得されるユーザの閲覧関連情報として、上記アクセスしたウェブサイトのロケーション情報を取得し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記組織情報と、上記第2のデータベースから取得された上記ウェブサイトのロケーション情報に基づき特定される上記ウェブサイトの内容情報および上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所属組織および職種を推定することを特徴とする請求項3に記載のIPアドレスに基づくユーザ属性推定システム。
【請求項5】
上記ユーザ識別子属性情報取得部は、上記ウェブサイトへのアクセスを通じて取得されるユーザの閲覧関連情報として、上記アクセスしたウェブサイトのロケーション情報を取得し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記組織情報と、上記第2のデータベースから取得された上記ウェブサイトのロケーション情報に基づき特定される職種および上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所属組織および所属部署を推定することを特徴とする請求項3に記載のIPアドレスに基づくユーザ属性推定システム。
【請求項6】
上記IPアドレス属性情報取得部は、上記IPアドレスに基づき特定可能な属性情報として、上記IPアドレスが使われているユーザ端末の通信ネットワークへの接続位置を表す接続位置情報を上記第1のデータベースから取得し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記接続位置情報と、上記第2のデータベースから取得された上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの行動状況を推定することを特徴とする請求項1に記載のIPアドレスに基づくユーザ属性推定システム。
【請求項7】
上記IPアドレス属性情報取得部は、上記IPアドレスに基づき特定可能な属性情報として、上記IPアドレスが使われているユーザ端末の地域を表す地域情報を上記第1のデータベースから更に取得し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記地域情報と、上記第2のデータベースから取得された上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所在地域を更に推定し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記地域情報と、上記所在地域の推定の確からしさを表す信頼度情報と、上記第2のデータベースから取得された上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの行動状況を推定することを特徴とする請求項6に記載のIPアドレスに基づくユーザ属性推定システム。
【請求項8】
上記ユーザ識別子属性情報取得部は、上記ウェブサイトへのアクセスを通じて取得される閲覧関連情報として、上記ウェブサイトへのアクセス時に上記IPアドレスが使われているユーザ端末が備える位置検出装置により検出されたアクセス位置情報を上記第2のデータベースから取得し、
上記ユーザ属性推定部は、上記データベース統合部により統合された上記第3のデータベースに格納された情報のうち、上記第1のデータベースから取得された上記地域情報と、上記第2のデータベースから取得された上記ユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所在地域を推定するとともに、上記第2のデータベースから取得された上記アクセス位置情報および上記ユーザ識別子に基づいて、当該ユーザ識別子に対応するユーザの所在地域を推定することを特徴とする請求項2に記載のIPアドレスに基づくユーザ属性推定システム。
【請求項9】
上記ユーザ属性推定部は、上記第1のデータベースから取得された上記地域情報を用いて推定した上記ユーザの所在地域について、推定の確からしさを表す信頼度を算出し、
上記ユーザ属性推定部により算出された上記信頼度が所定の条件を満たす場合に、上記第2のデータベースから取得された上記アクセス位置情報を用いて推定した上記ユーザの所在地域によって、上記第1のデータベースに格納されている上記地域情報を更新する情報更新部を更に備えたことを特徴とする請求項8に記載のIPアドレスに基づくユーザ属性推定システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、IPアドレスに基づくユーザ属性推定システムに関し、特に、IPアドレスを用いてユーザの属性を推定するシステムに用いて好適なものである。
【背景技術】
【0002】
従来、ネットワーク上でのユーザのアクセス履歴や行動履歴に関する情報をもとに、当該ユーザの居住地や勤務地などの生活地域、年齢・性別などの個人属性、興味の対象などを推定し、その推定した内容に合わせて広告等の情報を配信するようにしたターゲティングシステムが広く活用されている。例えば、IPアドレスに基づいて、ユーザが存在する位置や地域を推定するシステムが知られている(例えば、特許文献1〜3参照)。
【0003】
特許文献1,2に記載の情報送信システムでは、利用者のIPアドレスを取得する利用者アドレス取得手段と、あらかじめ複数のIPアドレスを地域別に分類した地域別アドレス分類データベースと、地域別分類に応じて送信するファイルを複数のファイルの中から指定するファイル分類データベースとを備え、利用者アドレス取得手段により得られた利用者のIPアドレスから、その地域の分類を地域別アドレス分類データベースを参照して判断するとともに、その分類に対応するファイルをファイル分類データベースにより指定して、利用者のコンピュータに送信する。
【0004】
特許文献3に記載のIPアドレス取得分類システムでは、インターネット・サービス・プロバイダのアクセスポイントのIPアドレスを取得して、IPアドレスに対応するドメインネームを取得する。そして、ドメインネームを構成する文字列からネットワーク名を抽出してプロバイダ名を判定するとともに、ドメインネームを構成する文字列からホストネームを抽出する。さらに、ホストネームを地域別に分類した地域別ホストネーム分類テーブルを参照して、取得されたホストネームから地域別分類を判定し、判定された地域をIPアドレスと関連付けて格納することにより、IPアドレスの地域別分類データベースを構築する。そして、当該地域別分類データベースを利用したアクセス統計、情報送信、データ再配置を行う。
【0005】
また、IPアドレスに基づいて、ユーザの位置や地域以外の情報を推定するシステムも知られている(例えば、特許文献4,5参照)。特許文献4に記載のユーザ情報取得装置において、WWWサーバは、アクセス中のユーザ端末のIPアドレスを発信者番号取得部に送信する。発信者番号取得部は、受信したIPアドレスを網終端装置に問い合せ、対応するユーザIDを取得する。さらに、発信者番号取得部は、取得したユーザIDをRASに問い合せて、対応する発信者番号を取得する。ユーザ情報取得部は、取得した発信者番号に基づいてユーザ情報データベースを検索し、発信者番号に対応するユーザ情報を取得する。
【0006】
特許文献5に記載の集団ターゲティングシステムでは、ブラウザクッキーを用いて単位時間当たりの接続回数を算出して、単位時間当たりの接続回数が設定回数以上であるIPアドレスを集団IPアドレスとして抽出し、あるいは、4セクションから構成されたIPアドレス体系で4番目のセクションのデジットを除いた残りのアドレスが同一のIPアドレス帯域を集団IPアドレスとして抽出する。そして、当該抽出した集団IPアドレスを用いて、IPアドレス帯域と、集団の規模、位置、業者名または業種とがマッピングされて格納されたデータベースを参照することにより、集団IPアドレスを用いる集団の特性(集団の規模、集団の位置、集団の業者名、集団の業種など)を判断する。
【0007】
上記特許文献1〜5に記載のシステムは何れも、IPアドレスと、それに対応して取得したい情報とを関連付けたデータベースをあらかじめ構築しておき、ユーザ端末からネットワークへのアクセス時に取得されるIPアドレスをもとにデータベースを参照することにより、IPアドレスに対応した情報(ユーザの位置や地域、ユーザ情報、集団の規模や位置、業者名業種など)を取得する構成となっている。
【0008】
そのため、ユーザ端末からネットワークへのアクセス時に、あるIPアドレスが取得されたとしても、そのIPアドレスに対応付けて分類データベースに格納されていない情報については、当然のことながら取得することができない。例えば、IPアドレスと地域とを関連付けて格納した分類データベースを用いている場合は、ネットワークへのアクセス時に取得されたIPアドレスに対応して、地域以外の情報を取得することはできない。
【0009】
【特許文献1】特開2001−188732号公報
【特許文献2】特開2001−312661号公報
【特許文献3】特開2002−198997号公報
【特許文献4】特開2002−232592号公報
【特許文献5】特開2013−73628号公報
【発明の開示】
【0010】
本発明は、上述のような問題を解決するために成されたものであり、ネットワークへのアクセス時に取得されるIPアドレスに対応して取得可能なユーザ属性情報をより多くすることができるようにすることを目的とする。
【0011】
上記した課題を解決するために、本発明では、IPアドレスとそのIPアドレスに基づき特定可能な属性情報とを関連付けて成るIPアドレス属性情報を、当該IPアドレス属性情報を履歴情報として蓄積した第1のデータベースから取得する。一方、ユーザ端末からウェブサイトにアクセスしたときに取得されるユーザ識別子と、ウェブサイトへのアクセスを通じて取得されるIPアドレスおよび閲覧関連情報とを関連付けて成るユーザ識別子属性情報を、当該ユーザ識別子属性情報を履歴情報として蓄積した第2のデータベースから取得する。そして、第1のデータベースから取得されたIPアドレス属性情報の履歴情報と、第2のデータベースから取得されたユーザ識別子属性情報の履歴情報とを、IPアドレスおよび履歴の日時情報をキーとして第3のデータベースに統合した上で、当該第3のデータベースに格納された情報に基づいて、ユーザの属性を推定するようにしている。
【0012】
上記のように構成した本発明によれば、第1のデータベースだけだとIPアドレスからそのIPアドレスに特有の属性情報が得られるだけであるのに対し、ユーザ識別子とウェブサイトの閲覧関連情報とがIPアドレスと共に第2のデータベースから取得され、IPアドレスおよび履歴の日時情報をキーとして、各データベースから取得された情報が第3のデータベースに統合されるので、IPアドレスに特有の属性情報とユーザによるウェブサイトの閲覧関連情報とがIPアドレスおよびユーザ識別子に関連付けて記憶された状態となる。そして、この統合された情報に基づいて、ユーザ識別子で特定されるユーザの属性が推定されるので、第1のデータベースの情報だけ、または第2のデータベースの情報だけでは推定できないユーザの属性を推定することが可能となる。これにより、ネットワークへのアクセス時に取得されるIPアドレスに対応して取得可能なユーザ属性情報をより多くすることができる。
【図面の簡単な説明】
【0013】
図1】本実施形態によるIPアドレスに基づくユーザ属性推定システムの全体構成を、ユーザ属性推定装置の機能ブロックと共に示す図である。
図2】第1のデータベースに記憶される履歴情報のレコードの一例を示す図である。
図3】第2のデータベースに記憶される履歴情報のレコードの一例を示す図である。
図4】第3のデータベースに記憶される統合情報の一例を示す図である。
図5】本実施形態の属性推定部により推定されたユーザ属性の一例を示す図である。
図6】本実施形態の属性推定部により推定されたユーザの行動状況の一例を示す図である。
図7】他の実施形態に係るユーザ属性推定装置の機能構成例を示す図である。
【発明を実施するための最良の形態】
【0014】
以下、本発明の一実施形態を図面に基づいて説明する。図1は、本実施形態によるIPアドレスに基づくユーザ属性推定システムの全体構成を、ユーザ属性推定装置の機能ブロックと共に示す図である。
【0015】
図1に示すように、本実施形態のユーザ属性推定システムは、IPアドレスログ収集サーバ100、アクセスログ収集サーバ200およびユーザ属性推定装置300を備えて構成される。ユーザ属性推定装置300とIPアドレスログ収集サーバ100との間、およびユーザ属性推定装置300とアクセスログ収集サーバ200との間は、インターネットや携帯電話網などの通信ネットワークを介して接続され、相互にデータ通信を行うことができるようになされている。
【0016】
IPアドレスログ収集サーバ100は、図示しないユーザ端末から通信ネットワークを介して通信が行われるときに使用されるIPアドレスを取得し、そのIPアドレスに対して種々の解析を行うことにより、IPアドレスに特有の属性情報を生成し、第1のデータベース101に格納する。
【0017】
通信ネットワーク上では、各地にいる多くのユーザが、それぞれのユーザ端末から所望のタイミングで所望のウェブサイトにアクセスしてコンテンツを閲覧したり、他のユーザ端末またはサーバなどとの間でコミュニケーションやデータ取得などの各種通信を行ったりしている。IPアドレスログ収集サーバ100は、これらの通信に使用されるIPアドレスを都度取得し、種々の解析を行うことにより、IPアドレスに特有の属性情報を生成して第1のデータベース101に逐次格納する。
【0018】
これにより、第1のデータベース101には、IPアドレスと、そのIPアドレスに基づき特定可能な属性情報とを関連付けて成るIPアドレス属性情報が、IPアドレスを取得した日時情報と共に履歴情報として第1のデータベース101に格納される。この履歴情報の詳細については後述する。
【0019】
なお、IPアドレスログ収集サーバ100によるIPアドレスの取得およびIPアドレスの解析による属性情報の生成は、公知の技術を適用して行うことが可能である。例えば、特許文献1〜3に開示されている方法に従って、IPアドレスの取得およびIPアドレスに基づき特定可能な属性情報の解析を行うことが可能である。詳細は割愛するが、その内容を以下に簡単に説明する。
【0020】
IPアドレスは、所定ビット数から成る数値データであり、どのネットワークかを表すネットワークアドレス部と、どのコンピュータかを表すホストアドレス部とにより構成され、世界中に存在するサーバのネットワーク上における住所を示している。このIPアドレスは、ドメイン名、例えば「〜.プロバイダ名.ne.jp」、「〜.会社名.co.jp」などのような、ある種の意味を含む文字列に1対1の対応で相互に変換可能である。すなわち、IPアドレスは、オリジナル・ドメインを有する特定のサーバと常に1対1に対応している。
【0021】
さらに、オリジナル・ドメインを有する特定のサーバは、全世界のドメインを管理する機関であるNIC(Network Information Center)や、日本のドメインを管轄するJPNICなどで得られる情報から、いずれの国のどの地域のどこに住所を有するかが明らかにされている。IPアドレスログ収集サーバ100は、このNICやJPNICなどで得られる情報をもとに複数のIPアドレスを地域別に分類した地域別アドレス分類データベース(図示せず)をあらかじめ備えている。この地域別アドレス分類データベースは、国、地方、県、市町村などの階層により区分して地域情報を格納することが可能である。
【0022】
一方、大多数の個人ユーザが利用するインターネット・サービス・プロバイダ(ISP)は、多数のユーザが全国各地から利用するため、多数の地域に設けられたアクセスポイントごとに、多数のIPアドレスを管理している。そのため、ISPをダイヤルアップIP接続により利用している大多数の個人ユーザが使用するIPアドレスは、アクセスするごとに異なる。しかしながら、ISPが所有する各アクセスポイントは、いずれの国のどの地域のどこに存在するかは特定可能である。
【0023】
そのため、IPアドレスログ収集サーバ100は、ISPが所有するアクセスポイントごとのIPアドレスを地域別に分類した地域別ISPアドレス分類データベース(図示せず)をあらかじめ備えている。上述したように、IPアドレスとドメインネームとが1対1に対応することから、この地域別ISPアドレス分類データベースは、各IPアドレスが、携帯電話により利用されるものであるか否かの情報を含むことも可能である。
【0024】
例えば、データの送信元であるユーザ端末のIPアドレスは、ユーザ端末から送信されるデータに付加されるIPヘッダに記述され、IPアドレスログ収集サーバ100にて中継される。IPアドレスログ収集サーバ100は、ユーザ端末から送信されたIPアドレスを取得し、このIPアドレスからオリジナル・ドメインのサーバを特定した上で、IPアドレスをキーとして上述の地域別アドレス分類データベースを参照することにより、IPアドレスに基づき特定可能な属性情報として、IPアドレスが使われているユーザ端末の地域を表す地域情報を取得することが可能である。
【0025】
また、IPアドレスログ収集サーバ100は、ユーザ端末から送信されたIPアドレスを取得し、このIPアドレスに基づいて、通信がISPのいずれのアクセスポイントを経由したものであるかを判別した上で、IPアドレスをキーとして上述の地域別ISPアドレス分類データベースを参照することにより、IPアドレスに対応する属性情報として地域情報を取得することが可能である。また、アクセスポイントのほぼ正確な設置位置が地域別ISPアドレス分類データベースに登録されている場合は、IPアドレスに対応する属性情報として、IPアドレスが使われているユーザ端末の通信ネットワークへの接続位置を表す接続位置情報を取得することも可能である。
【0026】
また、特許文献3に記載されているように、IPアドレスログ収集サーバ100は、ユーザ端末から取得されたIPアドレスに対応するドメインネームを取得し、ドメインネームを構成する文字列からネットワーク名を抽出してプロバイダ名を判定するとともに、ドメインネームを構成する文字列からホストネームを抽出する。そして、プロバイダごとにホストネームを地域別に分類した地域別ホストネーム分類データベースを参照して、上記抽出したホストネームから地域情報を取得するようにすることも可能である。
【0027】
また、IPアドレスに対応するドメインネームは、ホストネーム、組織または企業名、組織属性、国名の階層構造をなしている。例えば、ドメインネームが「www.xxx.co.jp」であれば、wwwがホストネーム、xxxが企業名、coが組織属性、jpが国名と判別することができる。プロバイダのアクセスポイントのドメインネームの場合にも、同様に判別が可能である。したがって、IPアドレスログ収集サーバ100は、ユーザ端末から取得されたIPアドレスから変換したドメインネームをもとに、IPアドレスに基づき特定可能な属性情報として、IPアドレスが使われているユーザ端末の保有組織を表す組織情報(企業名など)を取得することも可能である。
【0028】
IPアドレスログ収集サーバ100は、以上のようにして取得した地域情報、接続位置情報および組織情報を、それぞれIPアドレスの属性情報として、IPアドレスおよびその取得日時情報と関連付けて第1のデータベース101格納する。IPアドレスログ収集サーバ100は、IPアドレスを取得するたびに同様の処理を繰り返すことにより、IPアドレス、日時情報、地域情報、接続位置情報および組織情報を1レコードに含む履歴情報を第1のデータベース101に逐次格納する。
【0029】
なお、地域別アドレス分類データベースや地域別ISPアドレス分類データベースなどにあらかじめ登録されていない初めてのIPアドレスをIPアドレスログ収集サーバ100がユーザ端末から取得した場合には、当該IPアドレスに対応する地域情報や接続位置情報、組織情報を取得することができない。また、地域別アドレス分類データベースや地域別ISPアドレス分類データベースなどにIPアドレスの登録はあっても、地域情報や接続位置情報、組織情報のうち何れかの登録がない場合には、その登録がない情報を取得することもできない。この場合、そのIPアドレスに対応する第1のデータベース101のレコードにおいて、地域情報や接続位置情報、組織情報は記録されない。
【0030】
図2は、第1のデータベース101に記憶される履歴情報のレコードの一例を示す図である。図2に示すように、第1のデータベース101には、個々のアクセスごとに、IPアドレスログ収集サーバ100により取得されるIPアドレスおよびその取得日時情報に関連付けて、国コードと都道府県(国コードおよび都道府県により地域情報が構成される)、接続位置情報、組織情報が履歴情報として記憶される。都道府県、接続位置情報、組織情報のうち、取得できなかった情報については、“不明”の値またはNull値が記録される。このように、第1のデータベース101には、IPアドレスと、そのIPアドレスに基づき特定可能な属性情報とを関連付けて成るIPアドレス属性情報が、日時情報と共に履歴情報として蓄積された状態となる。
【0031】
アクセスログ収集サーバ200は、図示しないユーザ端末から通信ネットワークを介してウェブサイトへのアクセスが行われるときに、使用されるユーザ識別子、IPアドレス、およびウェブサイトの閲覧関連情報を取得し、第2のデータベース201に格納する。
【0032】
上述のように、通信ネットワーク上では、各地にいる多くのユーザが、それぞれのユーザ端末から所望のタイミングで所望のウェブサイトにアクセスしてコンテンツを閲覧している。また、特定のウェブサイトへアクセスする際に、ユーザ識別子およびパスワードの入力が必要な場合もある。アクセスログ収集サーバ200は、このアクセスが行われる都度、そのアクセスに使用されているユーザ識別子、IPアドレスおよび閲覧関連情報を取得して第2のデータベース201に逐次格納する。
【0033】
これにより、第2のデータベース201には、ユーザ識別子、IPアドレスおよびウェブサイトの閲覧関連情報が、これらの情報を取得した日時情報と共に履歴情報として第2のデータベース201に格納される。この履歴情報の詳細については後述する。
【0034】
なお、アクセスログ収集サーバ200によるユーザ識別子、IPアドレスおよび閲覧関連情報の取得は、公知の技術を適用して行うことが可能である。詳細は割愛するが、その内容を以下に簡単に説明する。
【0035】
例えば、アクセスの履歴情報を取得する対象のウェブサイトに、JavaScript(登録商標)による分析用タグを事前に埋め込んでおく。この分析用タグは、ウェブサイトへのアクセスログを収集することが可能になされた公知の簡易プログラムである。この分析用タグが埋め込まれたウェブサイトに対してアクセスが行われると、プログラムが実行され、各種の閲覧関連情報が取得されて、アクセスログ収集サーバ200に送信される。
【0036】
ウェブサイトへのアクセスを通じて分析用タグにより取得される閲覧関連情報は、例えば、ユーザによりアクセスされた(閲覧された)ウェブサイトのロケーション情報(URL:Uniform Resource Locator)である。また、分析用タグは、ウェブサイト内に配されている広告が閲覧(クリック)された場合に、当該広告を特定するための広告特定情報を取得することも可能である。広告特定情報は、例えば、表示する広告に対して事前に割り振られた広告IDとすることが可能である。
【0037】
さらに、分析用タグは、ウェブサイトへのアクセスを通じて取得されるユーザの閲覧関連情報として、ウェブサイトへのアクセスに使用されているユーザ端末のデバイス情報(例えば、MACアドレス、シリアル番号など)を取得することが可能である。また、ユーザ端末がGPS等の位置検出装置を内蔵している場合には、ウェブサイトへのアクセスが行われているユーザ端末の位置を表すアクセス位置情報を取得することも可能である。
【0038】
アクセスログ収集サーバ200は、以上のようにして各ウェブサイトの分析用タグを用いて取得した各種の閲覧関連情報を、ユーザ識別子、IPアドレスおよびその取得日時情報と関連付けて第2のデータベース201格納する。アクセスログ収集サーバ200は、各ウェブサイトの分析用タグから上記の情報を取得するたびに同様の処理を繰り返すことにより、ユーザ識別子、IPアドレス、日時情報および各種の閲覧関連情報を1レコードに含む履歴情報を第2のデータベース201に逐次格納する。
【0039】
なお、ユーザがウェブサイト内に配されている広告をクリックしていない場合は、そのユーザ識別子に対応する第2のデータベース201のレコードにおいて、広告特定情報は記録されない。また、ユーザがアクセスに使用しているユーザ端末がGPS等の位置検出装置を搭載していない場合は、そのユーザ識別子に対応する第2のデータベース201のレコードにおいて、アクセス位置情報は記録されない。
【0040】
図3は、第2のデータベース201に記憶される履歴情報のレコードの一例を示す図である。図3に示すように、第2のデータベース201には、個々のアクセスごとに、アクセスログ収集サーバ200により取得されるユーザ識別子およびその取得日時情報に関連付けて、IPアドレスと、閲覧しているウェブサイトのURL、広告特定情報、アクセス位置情報などを含む閲覧関連情報とが履歴情報として記憶される。このように、第2のデータベース201には、ユーザ端末からウェブサイトにアクセスしたときに取得されるユーザ識別子と、ウェブサイトへのアクセスを通じて取得されるIPアドレスおよび閲覧関連情報とを関連付けて成るユーザ識別子属性情報が、日時情報と共に履歴情報として蓄積された状態となる。
【0041】
次に、ユーザ属性推定装置300の機能構成について説明する。図1に示すように、ユーザ属性推定装置300は、その機能構成として、IPアドレス属性情報取得部11、ユーザ識別子属性情報取得部12、データベース統合部13およびユーザ属性推定部14を備えている。また、ユーザ属性推定装置300は、記憶媒体として第3のデータベース301を備えている。
【0042】
上記各機能ブロック11〜14は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック11〜14は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。
【0043】
IPアドレス属性情報取得部11は、IPアドレスとそれに対応する属性情報とから成るIPアドレス属性情報を、履歴の日時情報と共に第1のデータベース101から取得する。
【0044】
ここで、IPアドレス属性情報取得部11は、第1のデータベース101から複数レコード分のIPアドレス属性情報を取得する。この場合の複数レコードは、第1のデータベース101の全レコードであってもよいし、一部レコードであってもよい。一部レコードのIPアドレス属性情報を取得する場合のルールは、任意に設定することが可能である。例えば、直近の所定期間あるいは所定数のレコードのIPアドレス属性情報を取得することが考えられる。
【0045】
ユーザ識別子属性情報取得部12は、ユーザ識別子とそれに対応するIPアドレスおよび閲覧関連情報とから成るユーザ識別子属性情報を、履歴の日時情報と共に第2のデータベース201から取得する。
【0046】
ここで、ユーザ識別子属性情報取得部12は、第2のデータベース201から複数レコード分のユーザ識別子属性情報を取得する。この場合の複数レコードは、第2のデータベース201の全レコードであってもよいし、一部レコードであってもよい。一部レコードのIPアドレス属性情報を取得する場合のルールは、任意に設定することが可能である。例えば、直近の所定期間あるいは所定数のレコードのユーザ識別子属性情報を取得することが考えられる。
【0047】
データベース統合部13は、IPアドレス属性情報取得部11により取得されたIPアドレス属性情報の履歴情報と、ユーザ識別子属性情報取得部12により取得されたユーザ識別子属性情報の履歴情報とを、IPアドレスおよび履歴の日時情報をキーとして第3のデータベース301に統合する。
【0048】
すなわち、データベース統合部13は、図2のように第1のデータベース101に記憶されたIPアドレス属性情報の中の何れかのレコードの情報と、図3のように第2のデータベース201に記憶されたユーザ識別子属性情報の中の何れかのレコードの情報とを、第3のデータベース301の1つのレコードに統合する。ここで、統合する各データベース101,102の2つのレコードは、IPアドレスおよび日時情報の両方が共通するレコードである。
【0049】
一方、IPアドレスおよび日時情報の少なくとも一方が異なるレコードどうしは統合しない。この場合、第3のデータベース301の1つのレコードには、第1のデータベース101から取得される1つのレコードのIPアドレス属性情報のみ、または、第2のデータベース201から取得される1つのレコードのユーザ識別子属性情報のみが記録されることになる。
【0050】
図4は、第3のデータベース301に記憶される統合情報の一例を示す図である。図4には、8個のレコードの統合情報が示されている。ここでは、8個全てのレコードにおいて、第1のデータベース101から取得されたIPアドレス属性情報と、第2のデータベース201から取得されたユーザ識別子属性情報とが統合されて記録された状態を示している。
【0051】
図4に示すように、第3のデータベース301の各レコードには、ユーザ識別子、日時情報、IPアドレス、IPアドレス属性情報(国コード、都道府県、信頼度、接続位置情報、組織情報)および閲覧関連情報(閲覧ウェブサイトのURL、広告特定情報、アクセス位置情報)が記録される。このうち、日時情報およびIPアドレスは、第1のデータベース101および第2のデータベース201の双方から取得される共通の情報である。IPアドレス属性情報は、第1のデータベース101から取得される情報である。ユーザ識別子および閲覧関連情報は、第2のデータベース201から取得される情報である。
【0052】
ここで、信頼度とは、IPアドレスログ収集サーバ100が地域別アドレス分類データベースや地域別ISPアドレス分類データベースなどを参照してIPアドレスから推定した地域情報がどの程度確かなものであるか(IPアドレスが使われているユーザ端末が存在する地域の推定の確からしさ)を示した指標値であり、データベース統合部13が所定のロジックに基づいて算出する。
【0053】
例えば、データベース統合部13は、同じIPアドレスから推定可能な地域の広さに応じて値が変動するロジックに従って、信頼度を算出する。ここで、推定可能な地域の広さに応じて信頼度が変動するロジックは、IPアドレスから比較的狭い地域まで特定して推定可能なほど信頼度が大きくなり、比較的広い地域までしか推定の範囲を限定できないほど信頼度が小さくなるようなロジックとする。
【0054】
一例として、単一の都道府県の広さまで特定して推定可能な場合は信頼度が最も大きくなり、次に信頼度が大きくなるのは八地方区分の広さまで推定可能な場合、その次は東日本/西日本の2区分の広さまでしか推定できない場合で、2区分のどちらかも特定できない場合(日本の中のどこかくらいしか分からない場合)は信頼度が最も小さくなるようなロジックに従って、信頼度を算出する。
【0055】
なお、単一の都道府県まで特定して推定可能な場合以外は、推定した範囲内に含まれる複数の都道府県のうちあらかじめ定めた主要な都道府県を特定するようにし、推定した範囲の広さに応じた信頼度を算出するようにする。例えば、図4に示した第3のデータベース301の例では、都道府県として“静岡”、“北海道”、“大阪”、“東京”が推定されており、それらの信頼度がそれぞれ“95”,“90”,“30”,“60”となっている。このうち、信頼度が“95”の“静岡”は、単一の都道府県まで特定して推定可能であった場合を示している。信頼度が“60”の“東京”は、関東地方のどこかというところまで推定された場合で、関東地方の中で最も主要な“東京”を特定して信頼度を“60”と算出した場合を示している。
【0056】
ユーザ属性推定部14は、データベース統合部13により統合された第3のデータベース301に格納された情報に基づいて、ユーザの属性を推定する。第3のデータベース301のどの情報を使うかによって、ユーザの様々な属性を推定することが可能である。
【0057】
例えば、ユーザ属性推定部14は、データベース統合部13により統合された第3のデータベース301に格納された情報のうち、第1のデータベース101から取得された地域情報(都道府県)と、第2のデータベース201から取得されたユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所在地域(生活の中心となっている拠点地域)を推定する。
【0058】
例えば、図4に示した第3のデータベース301には、ユーザ識別子“U01”に関するレコードが5つ含まれている。そして、これら5つのレコードに格納されているIPアドレスがそれぞれ“#1”、“#1”、“#3”、“#5”、“#1”であり、地域情報(都道府県)が“静岡”、“静岡”、“東京”、“不明”、“静岡”となっている。また、これらの地域の推定信頼度がそれぞれ“95”、“95”、“60”、“0”、“95”となっている。
【0059】
これは、ユーザ識別子“U01”のユーザは、時おり異なる地域からアクセスを行っているものの、多くは“静岡”からIPアドレス“#1”を使ってアクセスしていることを示していると言える。よって、この場合にユーザ属性推定部14は、ユーザ識別子“U01”に対応するユーザの所在地域が“静岡”であると推定する。
【0060】
また、ユーザ属性推定部14は、データベース統合部13により統合された第3のデータベース301に格納された情報のうち、第1のデータベース101から取得された組織情報と、第2のデータベース201から取得されたユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所属組織(企業名)を推定する。
【0061】
例えば、図4に示した第3のデータベース301には、ユーザ識別子“U01”に関するレコードが5つ含まれている。そして、これら5つのレコードに格納されているIPアドレスがそれぞれ“#1”、“#1”、“#3”、“#5”、“#1”であり、組織情報が“組織#1”、“組織#1”、“不明”、“不明”、“組織#1”となっている。よって、この場合にユーザ属性推定部14は、ユーザ識別子“U01”に対応するユーザの所属組織が“組織#1”であると推定する。
【0062】
また、ユーザ属性推定部14は、データベース統合部301により統合された第3のデータベース301に格納された情報のうち、第1のデータベース101から取得された組織情報と、第2のデータベース201から取得された閲覧ウェブサイトのURLおよびユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所属組織および職種を推定することも可能である。
【0063】
例えば、ユーザ属性推定部14は、まず、上述した方法でユーザの所属組織を推定する。また、ユーザ属性推定部14は、閲覧ウェブサイトのURLに基づいて、そのURLで特定されるウェブサイトにおいて表示されているコンテンツの内容(ウェブサイトの内容情報)を特定し、当該コンテンツの内容と上記推定したユーザの所属組織とに基づいて、ユーザの職種を推定する。
【0064】
このような推定を可能とするために、ユーザ属性推定部14は、例えば、URLとそのウェブサイトに表示されているコンテンツの内容情報(例えば、あらかじめ定めたカテゴリなど)とを対応付けて記憶した第1のテーブル情報、組織に関する組織情報(例えば、企業名および存在する部署名)を組織ごとに記憶した第2のテーブル情報、および、コンテンツのカテゴリと部署とを2軸として職種を特定可能なマトリクステーブルを備える。
【0065】
すなわち、ユーザ属性推定部14は、第3のデータベース301に含まれているURLを用いて第1のテーブル情報を参照することにより、そのURLに対応する表示コンテンツのカテゴリを特定する。また、ユーザ属性推定部14は、第3のデータベース301に含まれている組織情報(企業名)を用いて第2のテーブル情報を参照することにより、その企業名に対応する組織に存在する部署名を特定する。そして、ユーザ属性推定部14は、以上のようにして特定したコンテンツのカテゴリと部署名とを用いてマトリクステーブルを参照することにより、ユーザの職種を特定する。
【0066】
ここで、第2のテーブル情報から特定される部署名が複数ある場合は、その複数の部署名を用いてマトリクステーブルから特定される職種も複数となる可能性がある。このような場合、特定する職種は複数であってよい。あるいは、第2のテーブル情報から特定される部署名が複数ある場合でも1つの職種を特定できるように、例えば、表示コンテンツのカテゴリと部署との複数の組み合わせについて優先度を設定しておき、優先度が最も高い組み合わせから1つの職種を特定するようにしてもよい。
【0067】
なお、ここに説明した職種の推定方法は一例に過ぎず、これ以外の方法によって、閲覧ウェブサイトのURLと組織情報とからユーザの職種を推定するようにしてもよい。例えば、閲覧ウェブサイトのURL、コンテンツのカテゴリ、組織情報(企業名、部署名など)を説明変数とし、職種を目的変数とする機械学習を行うことによって、ユーザの職種を推定するようにすることも可能である。
【0068】
また、ここでは、閲覧ウェブサイトのURLと組織情報とからユーザの職種を推定する例を示したが、広告特定情報を更に用いてもよい。すなわち、URLで特定されるウェブサイトにおいて表示されているコンテンツのカテゴリを特定するとともに、広告特定情報で特定される広告コンテンツのカテゴリを特定し、それぞれのコンテンツの内容と上記推定したユーザの所属組織とに基づいて、ユーザの職種を推定するようにしてもよい。
【0069】
また、ユーザ属性推定部14は、第3のデータベース301に格納された情報のうち、第1のデータベース101から取得された組織情報と、第2のデータベース201から取得された閲覧ウェブサイトのURLおよびユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所属組織および所属部署を推定することも可能である。
【0070】
例えば、ユーザ属性推定部14は、まず、第3のデータベース301に含まれているURLに対応する表示コンテンツ内容をもとに、閲覧者がその表示コンテンツに興味を持ちそうな職種を推定する。次に、ユーザ属性推定部14は、上述した方法でユーザの所属組織を推定し、当該推定した所属組織と、上述のように推定して職種とに基づいて、所属組織に存在する部署のうちどの部署に所属しているかを推定する。
【0071】
このような推定を可能とするために、ユーザ属性推定部14は、例えば、URLと、そのウェブサイトに表示されているコンテンツの内容から想定される職種(その表示コンテンツと関連のある職種)とを対応付けて記憶した第1のテーブル情報、および、組織に関する組織情報(例えば、企業名、存在する部署名、各部署に関連する職種)を組織ごとに記憶した第2のテーブル情報を備える。
【0072】
そして、ユーザ属性推定部14は、第3のデータベース301に含まれているURLを用いて第1のテーブル情報を参照することにより、そのURLに対応する職種を、閲覧者がその表示コンテンツに興味を持ちそうな職種として特定する。また、ユーザ属性推定部14は、第3のデータベース301に含まれている組織情報(企業名)と、上記のように特定した職種とを用いて第2のテーブル情報を参照することにより、その企業名に対応する組織に存在する部署の中から上記職種に対応する部署名を特定する。
【0073】
図5は、以上のようにしてユーザ属性推定部14により推定されたユーザ属性の一例を示す図である。ここでは、図4に示した第3のデータベース301に記録されているユーザ識別子“U01”、“U02”および“U03”の3人のユーザについてユーザ属性を推定した結果の例を示している。
【0074】
ここに示されている信頼度は、ユーザ属性推定部14が推定した所在地域の確からしさを示すものであり、図2に示す第1のデータベース101に記憶されている信頼度の値を用いてユーザ属性推定部14が計算したものである。例えば、ユーザ識別子が“U01”のユーザの所在地域として“静岡”が推定され、その信頼度として“50”の値が計算されている。この信頼度の値は、ユーザ識別子が“U01”のユーザに関して第1のデータベース101に記憶されている5つの信頼度“95”、“95”、“60”、“0”、“95”を用いて所定の演算をした結果として得られるものである。
【0075】
また、ユーザ属性推定部14は、データベース統合部13により統合された第3のデータベース301に格納された情報のうち、第1のデータベース101から取得された接続位置情報と、第2のデータベース201から取得されたユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの行動状況を推定することも可能である。ここでいう行動状況とは、仕事中、通勤中、出張中、休憩中などの行動態様のうち何れに該当するかということである。
【0076】
例えば、ユーザ属性推定部14は、地図データベースを備え、アクセスポイントの接続位置情報が地図上のどの場所に当たるのかを特定する。そして、特定した場所がオフィスビルであれば仕事中、特定した場所が道路や線路などであれば通勤中または出張中、特定した場所が喫茶店や公園など休憩が可能な場所であれば休憩中と推定する。なお、上述のように推定したユーザの所在地域を更に考慮することにより、特定した場所がユーザの所在地域内であれば通勤中、そうでなければ出張中などと判別するようにしてもよい。
【0077】
また、ユーザ属性推定部14は、第3のデータベース301に記憶されているユーザ識別子および接続位置情報に加え、地域推定の信頼度情報に基づいて、ユーザの行動状況を推定するようにすることも可能である。例えば、上述したように、IPアドレスログ収集サーバ100が有する地域別ISPアドレス分類データベースにおいて、各IPアドレスが携帯電話により利用されるものであるか否かの情報が含まれている場合は、この情報を用いて、信頼度を計算するようにすることが可能である。すなわち、固定回線ではなくモバイル回線を使っている場合には信頼度が低くなるようなロジックを使って計算することが可能である。よって、ユーザ属性推定部14は、信頼度情報が所定値より小さい値を示している場合に、ユーザが通勤中または出張中と推定することが可能である。
【0078】
図6は、以上のようにしてユーザ属性推定部14により推定されたユーザの行動状況の一例を示す図である。ここでは、図4に示した第3のデータベース301に記録されているユーザ識別子“U01”、“U02”および“U03”の3人のユーザについて行動状況を推定した結果の例を示している。ここでは、ユーザ識別子に対応してIPアドレスも示している。これは、どのIPアドレスが使われているときに、ユーザがどのような行動をしている傾向があるのかを推定した結果であると言える。
【0079】
以上詳しく説明したように、本実施形態のユーザ属性推定装置300では、IPアドレスとそのIPアドレスに基づき特定可能な属性情報とを関連付けて成るIPアドレス属性情報を、履歴の日時情報と共に第1のデータベース101から取得する。一方、ユーザ端末からウェブサイトにアクセスしたときに取得されるユーザ識別子と、ウェブサイトへのアクセスを通じて取得されるIPアドレスおよび閲覧関連情報とを関連付けて成るユーザ識別子属性情報を、履歴の日時情報と共に第2のデータベース201から取得する。そして、第1のデータベース101から取得されたIPアドレス属性情報の履歴情報と、第2のデータベース201から取得されたユーザ識別子属性情報の履歴情報とを、IPアドレスおよび履歴の日時情報をキーとして第3のデータベース301に統合した上で、当該第3のデータベース301に格納された情報に基づいて、ユーザの属性を推定するようにしている。
【0080】
このように構成した本実施形態によれば、第1のデータベース101だけだとIPアドレスからそのIPアドレスに特有の属性情報が得られるだけであるのに対し、ユーザ識別子とウェブサイトの閲覧関連情報とがIPアドレスと共に第2のデータベース201から取得され、IPアドレスおよび履歴の日時情報をキーとして、各データベース101,201から取得された情報が第3のデータベース301に統合されるので、IPアドレスに特有の属性情報とユーザによるウェブサイトの閲覧関連情報とがIPアドレスおよびユーザ識別子に関連付けて記憶された状態となる。そして、この統合された情報に基づいて、ユーザ識別子で特定されるユーザの属性が推定されるので、第1のデータベース101の情報だけ、または第2のデータベース201の情報だけでは推定できないユーザの属性を推定することが可能となる。これにより、ネットワークへのアクセス時に取得されたIPアドレスに対応して取得可能なユーザ属性情報をより多くすることができる。
【0081】
図7は、他の実施形態に係るユーザ属性推定装置300’の機能構成例を示す図である。なお、この図7において、図1に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
【0082】
図7に示す構成のユーザ属性推定装置300’は、その機能構成として、情報更新部15を更に備えるとともに、ユーザ属性推定部14に代えてユーザ属性推定部14’を備えている。ユーザ属性推定部14’は、上述したユーザ属性推定部14の推定機能に加え、以下の推定機能を備えている。
【0083】
すなわち、ユーザ属性推定部14’は、データベース統合部13により統合された第3のデータベース301に格納された情報のうち、第1のデータベース101から取得された地域情報と、第2のデータベース201から取得されたユーザ識別子とに基づいて、当該ユーザ識別子に対応するユーザの所在地域を推定する。これは、ユーザ属性推定部14の機能と同じである。
【0084】
これに加え、ユーザ属性推定部14’は、第2のデータベース201から取得されたアクセス位置情報およびユーザ識別子に基づいて、当該ユーザ識別子に対応するユーザの所在地域を推定する。ここで、ユーザ属性推定部14’は、地図データベースを備え、アクセス位置情報が地図上のどの地域に当たるのかを特定することにより、ユーザの所在地域を推定する。
【0085】
情報更新部15は、ユーザ属性推定部14’により算出された地域推定の信頼度(図5に示した信頼度)の値が所定の条件を満たす場合に、第2のデータベース201から取得されたアクセス位置情報を用いて推定したユーザの所在地域によって、IPアドレスログ収集サーバ100の第1のデータベース101に格納されている地域情報を更新する。更新するのは、所定の条件を満たすと判定された信頼度が格納されているレコードのユーザ識別子に関連付けられているIPアドレスに対応する地域情報である。所定の条件は、例えば、信頼度の値が所定値よりも小さいという条件とすることが可能である。
【0086】
例えば、図5に示す例において、ユーザ識別子“U03”のユーザに関してユーザ属性推定部14’により算出された地域推定の信頼度の値が“10”となっており、これが所定値よりも小さいとする。この場合、情報更新部15は、所定値よりも小さい信頼度“10”が格納されているレコードのユーザ識別子“U03”に関連付けられているIPアドレスを、図4に示す第3のデータベース301を参照することによって特定する。この場合に特定されるのは、“IPアドレス#2”である。そして、情報更新部15は、第1のデータベース101において“IPアドレス#2”に関連付けて記憶されている地域情報“大阪”を、第2のデータベース201から取得されたアクセス位置情報を用いて推定したユーザの所在地域によって更新する。
【0087】
上述した通り、第2のデータベース201から取得されたアクセス位置情報は、ウェブサイトへのアクセスに使用されているユーザ端末が備えるGPS等により検出される位置情報であり、ユーザの位置をほぼ正確に示したものと言える。よって、第1のデータベース101から取得された地域情報に基づいて推定されたユーザの所在地域の信頼度が所定値より小さい場合に、正確なアクセス位置情報に基づいて推定された所在地域によって、IPアドレスログ収集サーバ100の第1のデータベース101に格納されている地域情報を更新することにより、第1のデータベース101に格納されている情報の精度を向上させることができる。
【0088】
また、第1のデータベース101から取得された地域情報に基づいて推定されたユーザの所在地域の信頼度がゼロまたはそれに近い値を示す場合は、第1のデータベース101において、IPアドレスに対応する地域が不明で、地域情報が記録されていない可能性がある。これに対して、情報更新部15の処理を実行することにより、IPアドレスログ収集サーバ100の第1のデータベース101において地域情報が格納されていないレコードに対して地域情報を記録することができ、第1のデータベース101の完成度を向上させることができる。
【0089】
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0090】
例えば、ユーザ端末からウェブサイトへのアクセスが行われるときに、ユーザ識別子に加えてユーザのプロファイル情報(誕生日、性別など)が取得される場合は、そのプロファイル情報を更に用いてユーザ属性を推定するようにしてもよい。
【0091】
また、ユーザ端末からウェブサイトへのアクセスを通じて取得されるユーザの閲覧関連情報として、データプロバイダからの情報(組織名、統計情報など)が取得される場合は、そのプロバイダからの情報を更に用いてユーザ属性を推定するようにしてもよい。
【符号の説明】
【0092】
11 IPアドレス属性情報取得部
12 ユーザ識別子属性情報取得部
13 データベース統合部
14,14’ ユーザ属性推定部
15 情報更新部
100 IPアドレスログ収集サーバ
101 第1のデータベース
200 アクセスログ収集サーバ
201 第2のデータベース
300 ユーザ属性推定装置
301 第3のデータベース
【要約】
IPアドレスとそのIPアドレスに基づき特定可能な属性情報とを関連付けて成るIPアドレス属性情報を、履歴の日時情報と共に第1のデータベース101から取得する。一方、ユーザ端末からウェブサイトにアクセスしたときに取得されるユーザ識別子と、ウェブサイトへのアクセスを通じて取得されるIPアドレスおよび閲覧関連情報とを関連付けて成るユーザ識別子属性情報を、履歴の日時情報と共に第2のデータベース201から取得する。そして、第1のデータベース101から取得されたIPアドレス属性情報の履歴情報と、第2のデータベース201から取得されたユーザ識別子属性情報の履歴情報とを、IPアドレスおよび履歴の日時情報をキーとして第3のデータベース301に統合した上で、当該第3のデータベース301に格納された情報に基づいて、ユーザの属性を推定するようにしている。
図1
図2
図3
図4
図5
図6
図7