(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-19
(45)【発行日】2024-12-27
(54)【発明の名称】情報処理システム、情報処理方法、及び情報処理装置
(51)【国際特許分類】
G06Q 30/0201 20230101AFI20241220BHJP
H04N 21/254 20110101ALI20241220BHJP
【FI】
G06Q30/0201
H04N21/254
(21)【出願番号】P 2023049686
(22)【出願日】2023-03-27
【審査請求日】2024-08-27
【早期審査対象出願】
(73)【特許権者】
【識別番号】591101434
【氏名又は名称】株式会社ビデオリサーチ
(74)【代理人】
【識別番号】100152984
【氏名又は名称】伊東 秀明
(74)【代理人】
【識別番号】100149401
【氏名又は名称】上西 浩史
(72)【発明者】
【氏名】阿部 良一
【審査官】山崎 雄司
(56)【参考文献】
【文献】国際公開第2017/183703(WO,A1)
【文献】特開2019-092067(JP,A)
【文献】特表2013-543710(JP,A)
【文献】特開2020-064620(JP,A)
【文献】特開2022-078725(JP,A)
【文献】特開2013-207519(JP,A)
【文献】特開2005-189154(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
H04N 21/254
(57)【特許請求の範囲】
【請求項1】
Web利用者によるWebコンテンツの利用履歴と、前記Webコンテンツの利用時に用いられる端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する第1取得部と、
放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、前記受信エリアを推定するエリア推定部と、
前記受信機器に割り当てられた第2識別情報と前記第1識別情報との対応関係に基づいて、前記被取得情報に基づく前記受信エリアの推定結果を、前記第1ログ情報に対して関連付ける関連付け部と、を備え
、
前記対応関係において、前記第1識別情報と、該第1識別情報が割り当てられた前記端末を使用する前記Web利用者と同一人である前記放送利用者の前記受信機器に割り当てられた前記第2識別情報と、が対応付けられている、情報処理システム。
【請求項2】
前記放送利用者による前記放送コンテンツの利用履歴と、前記第2識別情報と、を含む第2ログ情報を取得する第2取得部を備え、
前記第2ログ情報に対して前記被取得情報が関連付けられている、請求項1に記載の情報処理システム。
【請求項3】
前記第2識別情報と前記第1識別情報との前記対応関係を示すデータが記憶装置に記憶されており、
前記関連付け部は、前記第2ログ情報に関連付けられた前記被取得情報に基づく前記受信エリアの推定結果を、前記第2ログ情報に含まれる前記第2識別情報と対応する前記第1識別情報を含む前記第1ログ情報に対して関連付ける、請求項2に記載の情報処理システム。
【請求項4】
前記第1ログ情報には、前記Web利用者の識別情報を含み、
前記関連付け部は、前記第1ログ情報中、前記Web利用者の識別情報に対して、前記被取得情報に基づく前記受信エリアの推定結果を関連付ける、請求項1乃至
3のいずれか一項に記載の情報処理システム。
【請求項5】
前記被取得情報が、前記放送利用者が利用した前記放送コンテンツの提供者の識別情報を含む場合に、前記エリア推定部は、前記提供者の識別情報と前記提供者の所在地との対応関係、及び、前記被取得情報に含まれる前記提供者の識別情報に基づいて、前記受信エリアを推定する、請求項1乃至
3のいずれか一項に記載の情報処理システム。
【請求項6】
複数の前記放送コンテンツを利用した前記放送利用者について、前記放送コンテンツ毎に前記被取得情報が得られた場合に、前記エリア推定部は、
前記被取得情報に基づく前記受信エリアの候補を前記放送コンテンツ毎に特定し、
前記放送コンテンツ毎に特定された前記候補のうち、同じエリアである前記候補の数が最も多い最多候補を、前記受信エリアとして推定する、請求項
5に記載の情報処理システム。
【請求項7】
複数の前記放送コンテンツを利用した前記放送利用者について、前記放送コンテンツ毎に前記被取得情報が得られ、且つ、それぞれの前記被取得情報が、前記受信機器により前記放送コンテンツを受信した際の受信強度を示す情報を含む場合に、前記エリア推定部は、
前記被取得情報に基づく前記受信エリアの候補を前記放送コンテンツ毎に特定し、
前記放送コンテンツ毎に特定された前記候補のうち、前記受信強度が最も高い候補を、前記受信エリアとして推定する、請求項
5に記載の情報処理システム。
【請求項8】
前記被取得情報が、前記放送利用者が利用した前記放送コンテンツの内容に関する内容情報を含む場合に、前記エリア推定部は、前記内容情報から前記受信エリアに関連する文字情報を抽出し、抽出された前記文字情報に基づいて、前記受信エリアを推定する、請求項1乃至
3のいずれか一項に記載の情報処理システム。
【請求項9】
前記エリア推定部は、前記受信機器がインターネット回線を通じて前記放送コンテンツを受信した際の前記受信エリアを推定する、請求項1乃至
3のいずれか一項に記載の情報処理システム。
【請求項10】
前記第1識別情報は、前記端末に割り当てられたIPアドレス、前記端末の端末識別子又は広告識別子であり、
前記第2識別情報は、前記受信機器に割り当てられたIPアドレス、前記受信機器の機器識別子又は広告識別子である、請求項1乃至
3のいずれか一項に記載の情報処理システム。
【請求項11】
コンピュータが、Web利用者によるWebコンテンツの利用履歴と、前記Webコンテンツの利用時に用いられる前記Web利用者の端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する工程と、
コンピュータが、放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、前記受信エリアを推定する工程と、
コンピュータが、前記受信機器に割り当てられた第2識別情報と前記第1識別情報との対応関係に基づいて、前記被取得情報に基づく前記受信エリアの推定結果を、前記第1ログ情報に対して関連付ける工程と、を備え
、
前記対応関係において、前記第1識別情報と、該第1識別情報が割り当てられた前記端末を使用する前記Web利用者と同一人である前記放送利用者の前記受信機器に割り当てられた前記第2識別情報と、が対応付けられている、情報処理方法。
【請求項12】
Web利用者によるWebコンテンツの利用履歴と、前記Webコンテンツの利用時に用いられる前記Web利用者の端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する第1取得部と、
放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、前記受信エリアを推定するエリア推定部と、
前記受信機器に割り当てられた第2識別情報と前記第1識別情報との対応関係に基づいて、前記被取得情報に基づく前記受信エリアの推定結果を、前記第1ログ情報に対して関連付ける関連付け部と、を備え
、
前記対応関係において、前記第1識別情報と、該第1識別情報が割り当てられた前記端末を使用する前記Web利用者と同一人である前記放送利用者の前記受信機器に割り当てられた前記第2識別情報と、が対応付けられている、情報処理装置。
【請求項13】
Web利用者によるWebコンテンツの利用履歴と、前記Webコンテンツの利用時に用いられる端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する第1取得部と、
放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、前記受信エリアを推定するエリア推定部と、
前記第1識別情報と同じ情報が第2識別情報として割り当てられた前記受信機器により得られる前記被取得情報に基づく前記受信エリアの推定結果を、前記第1ログ情報に対して関連付ける関連付け部と、を備える情報処理システム。
【請求項14】
コンピュータが、Web利用者によるWebコンテンツの利用履歴と、前記Webコンテンツの利用時に用いられる前記Web利用者の端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する工程と、
コンピュータが、放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、前記受信エリアを推定する工程と、
コンピュータが、前記第1識別情報と同じ情報が第2識別情報として割り当てられた前記受信機器により得られる前記被取得情報に基づく前記受信エリアの推定結果を、前記第1ログ情報に対して関連付ける工程と、を備える情報処理方法。
【請求項15】
Web利用者によるWebコンテンツの利用履歴と、前記Webコンテンツの利用時に用いられる前記Web利用者の端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する第1取得部と、
放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、前記受信エリアを推定するエリア推定部と、
前記第1識別情報と同じ情報が第2識別情報として割り当てられた前記受信機器により得られる前記被取得情報に基づく前記受信エリアの推定結果を、前記第1ログ情報に対して関連付ける関連付け部と、を備える情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、Web利用者によるWebコンテンツの利用履歴等を含むログ情報を処理対象とする情報処理システム、情報処理方法、及び情報処理装置に関する。
【背景技術】
【0002】
Web利用者によるWebコンテンツの利用履歴を含むログ情報は、Web利用者の行動や興味等を把握するために利用される場合がある(例えば、特許文献1参照)。特許文献1に記載の装置は、ユーザがダウンロードしたファイル(コンテンツ)に関するダウンロード履歴情報の入力を受け付け、ダウンロード履歴情報に含まれるファイル形式に応じてユーザの興味を推定し、推定したユーザの興味をデータベースに登録するものである。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、Web利用者が居る地域(以下、所在地)に関する情報は、種々の目的に利用可能であり、例えば、Webコンテンツの利用履歴に関するログ情報に基づいてWeb利用者の所在地を推定できることが望ましい。
一方、Web利用者の所在地は、ログ情報中に含まれるIPアドレス等の情報から推定することが可能である。ただし、Web利用者の所在エリアについては、より高い精度にて推定できることが望ましく、上記の推定手法に比べて精度が向上した方法にてWeb利用者の所在地を推定できるシステム、装置、及び方法の開発が求められている。
【0005】
本発明は、上記の事情に鑑みてなされたものであり、以下に示す目的を達成することを課題し、具体的には、従来技術の問題点を解決し、Web利用者の所在地を精度よく推定するための情報処理システム、方法、及び装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記の目的を達成するために、本発明の情報処理システムは、Web利用者によるWebコンテンツの利用履歴と、Webコンテンツの利用時に用いられる端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する第1取得部と、放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、受信エリアを推定するエリア推定部と、受信機器に割り当てられた第2識別情報と第1識別情報との対応関係に基づいて、被取得情報に基づく受信エリアの推定結果を、第1ログ情報に対して関連付ける関連付け部と、を備えることを特徴とする。
【0007】
本発明の情報処理システムによれば、Webコンテンツの利用履歴に関する第1ログ情報と、放送コンテンツを受信した受信機器に割り当てられた識別情報(第2識別情報)とを活用して、Web利用者の所在地をより正確に推定することができる。
【0008】
また、上記の情報処理システムは、放送利用者による放送コンテンツの利用履歴と、第2識別情報と、を含む第2ログ情報を取得する第2取得部を備えてもよい。この場合、第2ログ情報に対して被取得情報が関連付けられてもよい。
上記の構成によれば、放送コンテンツの利用履歴に関する第2ログ情報と関連付けて被取得情報を取得し、その被取得情報と第1ログ情報とを活用して、Web利用者の所在地をより正確に推定することができる。
【0009】
また、第2識別情報と第1識別情報との対応関係を示すデータが記憶装置に記憶されてもよい。この場合、関連付け部は、第2ログ情報に関連付けられた被取得情報に基づく受信エリアの推定結果を、第2ログ情報に含まれる第2識別情報と対応する第1識別情報を含む第1ログ情報に対して関連付けるとよい。
上記の構成によれば、第2識別情報と第1識別情報とが異なる場合であっても、記憶装置に記憶されたデータから、第2識別情報と第1識別情報との対応関係を適切に特定することができる。そして、その対応関係に基づき、受信エリアの推定結果を関連付ける第1ログ情報を適切に決めることができる。
【0010】
また、上記の対応関係において、第1識別情報と、当該第1識別情報が割り当てられた端末を使用するWeb利用者と同一人である放送利用者の受信機器に割り当てられた第2識別情報と、が対応付けられていてもよい。
上記の構成によれば、第2識別情報と第1識別情報との対応関係を適切に規定することができる。これにより、その対応関係に基づいて、受信エリアの推定結果を関連付ける第1ログ情報をより適切に決めることができる。
【0011】
また、第1ログ情報には、Web利用者の識別情報を含んでもよい。この場合、関連付け部は、第1ログ情報中、Web利用者の識別情報に対して、被取得情報に基づく受信エリアの推定結果を関連付けるとよい。
上記の構成によれば、Web利用者の識別情報に対して受信エリアの推定結果が関連付けられることで、Web利用者の所在地をより一層正確に推定することができる。
【0012】
また、被取得情報が、放送利用者が利用した放送コンテンツの提供者の識別情報を含んでもよい。この場合に、エリア推定部は、提供者の識別情報と提供者の所在地との対応関係、及び、被取得情報に含まれる提供者の識別情報に基づいて、受信エリアを推定するとよい。
上記の構成によれば、放送利用者が利用した放送コンテンツの提供者の識別情報から、放送コンテンツを受信機器により受信した際の受信エリアを精度よく推定することができる。また、この推定結果を用いることで、Web利用者の所在地をより一層正確に推定することができる。
【0013】
また、複数の放送コンテンツを利用した放送利用者について、放送コンテンツ毎に被取得情報が得られてもよい。この場合に、エリア推定部は、被取得情報に基づく受信エリアの候補を放送コンテンツ毎に特定し、放送コンテンツ毎に特定された候補のうち、同じエリアである候補の数が最も多い最多候補を、受信エリアとして推定するとよい。
上記の構成によれば、複数の放送コンテンツのそれぞれについて得られる被取得情報に基づいて、放送コンテンツを受信機器により受信した際の受信エリアを精度よく推定することができる。また、この推定結果を用いることで、Web利用者の所在地をより一層正確に推定することができる。
【0014】
また、複数の放送コンテンツを利用した放送利用者について、放送コンテンツ毎に被取得情報が得られ、且つ、それぞれの被取得情報が、受信機器により放送コンテンツを受信した際の受信強度を示す情報を含んでもよい。この場合に、エリア推定部は、被取得情報に基づく受信エリアの候補を放送コンテンツ毎に特定し、放送コンテンツ毎に特定された候補のうち、受信強度が最も高い候補を、受信エリアとして推定するとよい。
上記の構成によれば、放送コンテンツを受信した際の受信強度から、放送コンテンツを受信機器により受信した際の受信エリアを精度よく推定することができる。また、この推定結果を用いることで、Web利用者の所在地をより一層正確に推定することができる。
【0015】
また、被取得情報が、放送利用者が利用した放送コンテンツの内容に関する内容情報を含んでもよい。この場合に、エリア推定部は、内容情報から受信エリアに関連する文字情報を抽出し、抽出された文字情報に基づいて、受信エリアを推定するとよい。
上記の構成によれば、放送コンテンツの内容情報から抽出された文字情報に基づいて、放送コンテンツを受信機器により受信した際の受信エリアを精度よく推定することができる。また、この推定結果を用いることで、Web利用者の所在地をより一層正確に推定することができる。
【0016】
また、エリア推定部は、受信機器がインターネット回線を通じて放送コンテンツを受信した際の受信エリアを推定してもよい。
上記の構成によれば、インターネット回線を通じて放送コンテンツを受信した際の受信エリアを推定し、その推定結果を用いて、Web利用者の所在地を推定することができる。
【0017】
また、第1識別情報は、端末に割り当てられたIPアドレス、端末の端末識別子又は広告識別子でもよい。また、第2識別情報は、受信機器に割り当てられたIPアドレス、受信機器の機器識別子又は広告識別子でもよい。
上記の構成によれば、第1識別情報として設定された情報と、第2識別情報として設定された情報との対応関係を用いて、受信エリアの推定結果を、第1ログ情報に対して適切に関連付けることができる。これにより、Web利用者の所在地を正確に推定することができる。
【0018】
また、前述した課題を解決するため、本発明の情報処理方法は、コンピュータが、Web利用者によるWebコンテンツの利用履歴と、Webコンテンツの利用時に用いられるWeb利用者の端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する工程と、コンピュータが、放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、受信エリアを推定する工程と、コンピュータが、受信機器に割り当てられた第2識別情報と第1識別情報との対応関係に基づいて、被取得情報に基づく受信エリアの推定結果を、第1ログ情報に対して関連付ける工程と、を備えることを特徴とする。
本発明の情報処理方法によれば、Web利用者の所在地をより正確に推定することができる。
【0019】
また、本発明によれば、Web利用者によるWebコンテンツの利用履歴と、Webコンテンツの利用時に用いられるWeb利用者の端末に割り当てられた第1識別情報と、を含む第1ログ情報を取得する第1取得部と、放送利用者の受信機器により放送コンテンツを受信した際の受信エリアに応じて得られる被取得情報に基づいて、受信エリアを推定するエリア推定部と、受信機器に割り当てられた第2識別情報と第1識別情報との対応関係に基づいて、被取得情報に基づく受信エリアの推定結果を、第1ログ情報に対して関連付ける関連付け部と、を備える情報処理装置も実現可能である。
本発明の情報処理装置であれば、Web利用者の所在地をより正確に推定することができる。
【発明の効果】
【0020】
本発明によれば、Webコンテンツの利用履歴に関する第1ログ情報に含まれる第1識別情報と、放送コンテンツを受信した受信機器に割り当てられた第2識別情報との対応関係に基づいて、Web利用者の所在地をより精緻に推定することができる。
【図面の簡単な説明】
【0021】
【
図3】Webログに地域情報を関連付ける手順を示す図である。
【
図4】第1識別情報と第2識別情報との対応関係を示す図である。
【
図5】本発明の一つの実施形態に係る情報処理システムの構成例を示す図である。
【
図6】本発明の一つの実施形態に係る情報処理システムの機能についての説明図である。
【
図7】放送局の識別情報と放送局の所在地との対応関係を示す図である。
【
図8】ある放送利用者が所定期間内に視聴した複数の番組のそれぞれについての視聴ログの例を示す図である。
【
図9】本発明の一つの実施形態に係る情報処理フローを示す図である。
【発明を実施するための形態】
【0022】
本発明の一実施形態(本実施形態)について、添付の図面を参照しながら、以下に詳細に説明する。ただし、以下に説明する実施形態は、本発明の理解を容易にするために挙げた一例にすぎず、本発明を限定するものではない。すなわち、本発明は、その趣旨を逸脱しない限りにおいて、以下に説明する実施形態から変更又は改良され得る。また、本発明には、その等価物が含まれる。
【0023】
また、本実施形態についての説明に際して、本明細書中の幾つかの文言(用語)について、本明細書での定義、意味、及び解釈を以下に説明する。
【0024】
[装置]
本明細書において、「装置」は、単独で特定の機能を発揮する一つの装置を含み、また、分散して存在しているものの特定の機能を発揮するために協働する複数の装置の組み合わせも含むものである。
【0025】
[人(ヒト)・者]
本明細書において、「人(ヒト)」及び「者」は、主として個人のことであるが、世帯等のグループ、企業等の法人、法人以外の団体等も「人(ヒト)」及び「者」の範疇に含まれることとする。
【0026】
[コンテンツ]
コンテンツは、放送やインターネット通信により提供又は配信される動画、静止画像、音声、ゲーム、広告、及びテキスト等の情報であり、利用者(ユーザ)によって利用される。また、コンテンツには、Webコンテンツ及び放送コンテンツが含まれる。
【0027】
[Webコンテンツ]
Webコンテンツは、インターネットを通じて配信されるデータを受信してWebブラウザ又は専用のアプリ(アプリケーションプログラム)により利用可能なコンテンツである。Webコンテンツには、例えば、Webサイト、Web配信用の動画コンテンツや音楽コンテンツ、検索サイト、電子商取引サイト、SNS(Social Networking Service)、Web上でプレイ可能なゲーム、アプリを通じて利用可能なWeb上のサービス、及び、投稿動画等のようなWeb利用者がサーバにアップロードしたコンテンツ等が含まれる。
【0028】
[放送コンテンツ]
放送コンテンツは、放送を通じて提供されるコンテンツであり、具体的には、テレビ番組やラジオ番組等のように放送局(放送コンテンツの提供者に相当)が番組表に応じて放送する番組及び広告である。放送には、地上波放送、ケーブル放送(有線放送)、BS放送及び衛星放送等が含まれる。また、放送コンテンツの中には、インターネットテレビ及びIPサイマルラジオ等のように、インターネット回線を通じて受信可能な放送コンテンツがあり、本明細書では、そのような放送コンテンツをWebコンテンツとは区別するものとする。また、放送コンテンツは、番組単位で区切られるものに限定されず、時間単位、分単位又は秒単位等、所定の時間単位で区切られるものでもよい。
なお、以下の説明では、放送コンテンツがテレビ番組(テレビCMを含む)である場合を例に挙げて説明することとする。
【0029】
[情報の関連付け]
本明細書において、「情報の関連付け」とは、情報同士を紐付けて(対応付けて)記憶すること、すなわち、互いに関連付けられた情報のうちの一方から他方の情報を特定できるように各情報を保持することを意味する。また、本明細書では、対象とする情報に対して、関連付けられる情報を付加したり追加したりすることも「情報の関連付け」に含まれることとする。
【0030】
<<本実施形態の概要>>
本実施形態は、Webログの取得、解析、及び活用に関する情報処理分野の技術である。Webログは、本発明の第1ログ情報に相当し、Webコンテンツの利用者(以下、Web利用者)がWebコンテンツを利用した際に、そのWebコンテンツの配信サーバにより生成される。そして、本実施形態では、Webログに対して、Web利用者の所在地に関する地域情報を関連付けることができる。これにより、本実施形態では、Webログに関連付けられた地域情報を利用して、Web利用者の所在地を推定することができる。ここで、所在地とは、一定の範囲を有する地域、例えば、行政区画に基づいて決められる単位区画に相当するエリアであり、具体的には、都道府県でもよく、市区町村等のようにより細かい区画の地域でもよい。
【0031】
Webログに対して地域情報を関連付けるためには、テレビ番組の視聴履歴に関する視聴ログが必要となる。視聴ログは、本発明の第2ログ情報に相当し、テレビ番組の視聴者(以下、放送利用者)がテレビ番組を利用した際、つまりテレビ番組を視聴した際に、放送利用者が所持する受信機器により生成される。受信機器は、放送利用者がテレビ番組を視聴する際にテレビ番組(厳密には、テレビ番組の放送電波又はデータ)を受信する機器であり、具体的には、テレビ受像機である。
【0032】
本実施形態では、視聴ログと関連付けられる被取得情報から、放送利用者がテレビ番組を受信した際の受信エリアを推定し、その推定結果を、地域情報として、視聴ログとマッチングするWebログに対して関連付ける。
なお、被取得情報、及び、視聴ログとWebログとのマッチングについては後述する。
【0033】
<<Webログに対する地域情報の関連付けの手順について>>
Webログに対して地域情報を関連付ける手順について説明する。
関連付けの手順について説明するにあたり、先ず、Webログ、及び、視聴ログのそれぞれについて、
図1及び2を参照しながら説明する。
【0034】
(Webログ)
Webログは、
図1に示すように、Web利用者の識別情報であるユーザIDと、Webコンテンツの利用履歴(以下、利用履歴)と、第1識別情報とを含む。利用履歴は、Web利用者のユーザIDと関連付けられている(紐付けられている)。利用履歴には、例えば、アクセス(閲覧)したWebサイトのURL(Uniform Resource Locator)、電子商取引サイトでの購入行動のようなWeb利用者の行動に関するログ、Webコンテンツ利用時に起動したアプリのログ、及び、Webコンテンツへのアクセス回数を測定したログ等が含まれてもよい。また、利用履歴には、Webコンテンツの利用日時等が含まれてもよい。
なお、利用履歴は、Web利用者に対して実施されるアンケート調査の調査結果から特定されてもよい。
【0035】
第1識別情報は、Webコンテンツの利用時に用いられる端末に割り当てられた識別情報(アクセス識別子)であり、具体的には、上記の端末に割り当てられたIPアドレス、あるいは、上記の端末の端末識別子又は広告識別子である。端末は、Webコンテンツを利用するためのブラウザ又はアプリがインストールされた情報通信端末であり、例えば、パソコン、スマートフォン、タブレット型端末、ゲーム用機器、及び、その他のインターネット回線に接続されて通信可能な機器である。
また、第1識別情報は、Webログに含まれる利用履歴、より詳しくは、アプリのログ、ブラウザのバージョン情報、及び、WebサイトのURL等の情報を参照して特定してもよい。
【0036】
なお、Webログには、必ずしもWeb利用者のユーザIDが含まれてなくてもよい。例えば、Web利用者の住宅の共有スペースに据え付けられた共有機器によりWebコンテンツを利用する場合のWebログには、ユーザIDが含まれていなくてもよい。
【0037】
(視聴ログ)
視聴ログは、
図2に示すように、放送利用者の識別情報であるユーザIDと、放送利用者によるテレビ番組の視聴履歴(以下、視聴履歴)と、第2識別情報とを含む。また、視聴ログには、放送利用者のユーザIDとして、放送利用者が属する世帯のIDが用いられてもよい。また、テレビ番組の視聴履歴は、リアルタイム視聴の履歴でもよいし、いわゆるタイムシフト視聴に対応した履歴でもよい。
【0038】
視聴履歴は、放送利用者による放送コンテンツの利用履歴であり、放送利用者のユーザIDと関連付けられている(紐付けられている)。視聴履歴には、放送利用者が視聴したテレビ番組(以下、視聴番組)を放送した放送局のID、放送利用者が視聴番組を視聴した日時、視聴番組のID又は番組名、及び視聴番組の概要等が含まれてもよい。視聴番組の番組名及び概要は、視聴番組の内容に関する内容情報に相当する。
なお、視聴履歴は、放送利用者に対して実施されるアンケート調査の調査結果から特定されてもよい。
【0039】
放送局のIDは、各放送局に固有の識別情報であればよく、放送局の略称、あるいは、放送規格に従って規定されたサービスIDでもよい。視聴番組のID又は名前、及び視聴番組の概要等の情報は、放送局により生成され、視聴番組の放送電波に載せて伝播され、受信機器により受信される。
【0040】
また、視聴履歴の一部の情報、具体的には、視聴番組の放送局のID、視聴番組のID又は名前、及び視聴番組の概要は、被取得情報に該当する。被取得情報は、放送利用者の受信機器により視聴番組を受信した際の受信エリアに応じて得られる情報であり、受信エリアは、放送利用者が視聴番組を視聴した際の所在地に相当する。被取得情報は、視聴ログに関連付けられており、具体的には、
図2に示すように視聴ログに含まれている。
【0041】
第2識別情報は、放送利用者がテレビ番組を視聴する際に使用する受信機器に割り当てられたIPアドレス、あるいは、上記の受信機器の機器識別子又は広告識別子である。なお、第2識別情報には、受信機器の識別情報とともに、あるいは受信機器の識別情報の代わりに、テレビ番組の視聴の有無及び視聴チャンネルを測定する目的で受信機器に内蔵された測定機器の識別情報(ID)が含まれてもよい。
【0042】
さらに、視聴ログには、被取得情報として、受信機器が視聴番組を受信した際の受信強度(厳密には、放送電波の受信強度)を示す情報が関連付けられてもよい。受信強度は、受信機器が視聴番組を受信した際に受信機器によって特定され、特定された受信強度の情報(以下、受信強度情報)を視聴ログに関連付けておくことができる。
【0043】
さらにまた、視聴ログには、被取得情報として、放送利用者が視聴したテレビ番組(視聴番組)と同じ期間中に視聴可能な他のテレビ番組の放送局のIDが関連付けられてもよい。放送利用者が視聴したテレビ番組(視聴番組)と同じ期間中に視聴可能な他のテレビ番組は、放送利用者の受信機器が視聴番組を受信したエリアにて当該視聴番組と同じ期間中に受信可能なテレビ番組である。
【0044】
(Webログに対して地域情報を関連付ける手順)
次に、Webログに対して地域情報を関連付ける手順について、
図3及び4を参照しながら説明する。
Webログに対して地域情報を関連付けるには、先ず、複数の放送利用者のそれぞれについて視聴番組毎に生成された視聴ログを取得する。各放送利用者がテレビ番組を受信機器60であるテレビ受像機にて視聴すると、受信機器60が視聴ログを生成する。生成された視聴ログは、所定の送信先(具体的には、視聴ログサーバ20)に送信される。
【0045】
次に、
図3に示すように、取得した各視聴ログに対して、各視聴ログに係る視聴番組の受信エリアの推定情報を関連付ける。受信エリアの推定情報は、視聴ログに係る視聴番組の視聴に用いられた受信機器により当該視聴番組を受信した際の受信エリアを、その視聴ログに関連付けられた被取得情報に基づいて推定した結果を示す。受信エリアの推定手順については後述する。
【0046】
推定情報が関連付けられた視聴ログ(以下、関連付け後の視聴ログ)は、放送利用者毎に得られる。そして、
図3に示すように、地域情報が関連付けられるWebログについて、放送利用者の人数に相当する数の関連付け後の視聴ログの中から、マッチングするものを特定する。
【0047】
具体的に説明すると、視聴ログに含まれる第2識別情報とWebログに含まれる第1識別情報との対応関係に基づいて、Webログとマッチング(対応)する視聴ログを特定する。第2識別情報と第1識別情報との対応関係は、第2識別情報と対応する第1識別情報を特定する場合、あるいは第1識別情報と対応する第2識別情報を特定する場合に利用される。
【0048】
より詳しく説明すると、本実施形態の対応関係において、第1識別情報と、下記の条件Aを満たす第2識別情報とが対応付けられている。
条件A:第1識別情報と対応する第2識別情報が割り当てられた受信機器は、当該第1識別情報が割り当てられた端末を使用するWeb利用者と同一人である放送利用者の受信機器である。
ここで、Web利用者と同一人であるとは、Web利用者の端末と同じ場所(例えば、Web利用者の住居)で利用される受信機器にてテレビ番組を視聴する者であることを意味する。
【0049】
本実施形態では、視聴ログに含まれる第2識別情報と、Webログに含まれる第1識別情報とが互いに異なっており、例えば、第1識別情報がIPアドレスであり、第2識別情報が広告識別子及び機器識別子である。そのため、本実施形態では、IPアドレスと広告識別子及び機器識別子との対応関係が、
図4に示すテーブルデータとして予め規定されている。このテーブルデータを参照することで、地域情報が関連付けられるWebログの第1識別情報と対応する第2識別情報を特定することができる。
【0050】
そして、
図3に示すように、特定された第2識別情報を含む関連付け後の視聴ログ(
図3中、破線にて囲まれた視聴ログ)を抽出し、その視聴ログに関連付けられた推定情報を、地域情報としてWebログに対して関連付ける。
また、本実施形態では、Webログに含まれるWeb利用者のユーザIDに対して、推定情報(すなわち、被取得情報に基づく受信エリアの推定結果)が関連付けられる。つまり、本実施形態では、地域情報としての推定情報が、属人的な情報としてWebログに対して関連付けられる。
【0051】
以上のように、本実施形態では、放送利用者の受信機器により視聴番組を受信した際の受信エリアの推定結果を、その放送利用者と同一人であるWeb利用者の所在地として採用することができる。
【0052】
<<本実施形態に係る情報処理システムの構成>>
本実施形態に係る情報処理システム(以下、情報処理システム100)について、
図5を参照しながら説明することとする。
情報処理システム100は、Webログに対して地域情報を関連付けるために構築され、
図5に示すように、Webログサーバ10、視聴ログサーバ20、集計サーバ30、コンテンツ配信サーバ40、Web利用者の端末50、及び放送利用者の受信機器60によって構成されている。これらの機器は、通信用ネットワークNを介して互いに通信可能な状態で接続されている。
【0053】
Webログサーバ10は、コンテンツ配信サーバ40と通信してWebログを取得する。コンテンツ配信サーバ40は、Web利用者が端末50にてコンテンツ配信の要求操作を行った場合に、その要求操作に応じてWebコンテンツをWeb利用者に対して配信するとともに、コンテンツ配信に付随してWebログを生成して送信する。Webログサーバ10は、コンテンツ配信サーバ40から送信されるWebログを受け取り、受け取ったWebログを集計サーバ30に向けて送信する。
【0054】
視聴ログサーバ20は、受信機器60から送信される視聴ログを受け取る。また、視聴ログサーバ20は、受け取った視聴ログに含まれる被取得情報に基づいて、その視聴ログに係る視聴番組を受信機器60により受信した際の受信エリアを推定する。さらに、視聴ログサーバ20は、受信エリアの推定結果を示す推定情報を、視聴ログに対して関連付ける。そして、視聴ログサーバ20は、関連付け後の視聴ログを集計サーバ30に向けて送信する。
【0055】
集計サーバ30は、Webログ及び視聴ログ(詳しくは、関連付け後の視聴ログ)を取得し、取得した情報を集計及び解析する処理を実行する。集計サーバ30により実行される処理には、Webログに対して地域情報を関連付ける処理、及び、各Webコンテンツの利用回数(アクセス回数)を解析する処理が含まれる。集計サーバ30による集計結果及び解析結果は、Webログに関連付けられた地域情報を用いて様々な目的に活用され、例えば、Web利用者の行動パターンや興味関心を推定して、これらに適した広告や動画コンテンツをWeb利用者に配信又は推奨する目的で活用される。
【0056】
Webログサーバ10、視聴ログサーバ20、集計サーバ30、及びコンテンツ配信サーバ40の各々は、コンピュータの一例に相当し、具体的には汎用的なサーバコンピュータである。すなわち、各サーバは、
図5に示すように、CPU等からなるプロセッサ10a、20a、30a、40aと、ROM及びRAM等からなるメモリ10b、20b、30b、40bと、を有する。また、各サーバは、通信用インタフェース10c、20c、30c、40cを通じて互いに通信可能であり、記憶装置としてのストレージ10d、20d、30d、40dに各種の情報を保存及び蓄積する。
【0057】
また、各サーバには、各サーバが担う機能を発揮させるためのプログラム(以下、情報処理プログラム)がインストールされている。各サーバにおいてプロセッサ10a、20a、30a、40aが情報処理プログラムを実行することにより、各サーバは、Webログに対して地域情報を関連付けるための処理のうち、対応する処理を実行する。
【0058】
情報処理システム100の構成について、Webログに対して地域情報を関連付ける機能の面から改めて説明すると、情報処理システム100は、
図6に示すように、第1取得部101、第2取得部102、エリア推定部103、関連付け部104を有する。上記の各機能部は、当該機能部と対応するサーバコンピュータが有するハードウェア機器と、そのコンピュータにインストールされた情報処理プログラムとが協働することで実現される。
以下、それぞれの機能部について説明する。
【0059】
(第1取得部)
第1取得部101は、Webログサーバ10によって構成され、Webログをコンテンツ配信サーバ40から取得し、取得したWebログを集計サーバ30に向けて送信する。
なお、Webログの取得タイミングについては、特に限定されず、コンテンツ配信サーバ40がWebログを生成する度に、そのWebログがWebログサーバ10に送信され、第1取得部101により受信されてもよい。あるいは、一定期間(例えば、1日又は数日)毎に、その期間内に生成されたWebログを一括して取得できるようにしてもよい。
【0060】
(第2取得部)
第2取得部102は、視聴ログサーバ20によって構成され、視聴ログを各放送利用者の受信機器60から取得する。
なお、視聴ログの取得タイミングについては、特に限定されず、受信機器60が視聴ログを生成する度に、その視聴ログが視聴ログサーバ20に送信され、第2取得部102により受信されてもよい。あるいは、一定期間(例えば、1日又は数日)毎に、その期間内に生成された視聴ログを一括して取得できるようにしてもよい。
【0061】
(エリア推定部)
エリア推定部103は、視聴ログサーバ20によって構成され、放送利用者の受信機器60により視聴番組を受信した際の受信エリアを、その視聴番組についての視聴ログに関連付けられた被取得情報に基づいて推定する。また、エリア推定部103は、受信エリアの推定結果を示す情報、すなわち推定情報を当該視聴ログに関連付け、関連付け後の視聴ログを集計サーバ30に向けて送信する。
【0062】
本実施形態において、被取得情報に基づいて受信エリアを推定する方式には、下記の第1方式乃至第4方式が含まれる。エリア推定部103は、これら4つの方式のうち、被取得情報に含まれる情報に応じて選定される方式に従って受信エリアを推定する。下記の各方式によれば、被取得情報に含まれる情報に基づいて、受信エリアを適切に推定することができる。
【0063】
[第1方式]
第1方式は、被取得情報が、放送利用者が視聴したテレビ番組(視聴番組)の放送局の識別情報を含む場合に用いられる。第1方式では、放送局の識別情報と放送局の所在地との対応関係、及び、被取得情報に含まれる放送局の識別情報に基づいて、受信エリアを推定する。
【0064】
より詳しく説明すると、視聴ログサーバ20のストレージ20dには、
図7に示すテーブルデータが記憶されており、このテーブルデータは、放送局の識別情報である放送局ID及び放送局名称と、放送局の所在地の住所との対応関係を規定しており、このテーブルデータを参照することで、被取得情報に含まれる放送局の識別情報から、その放送局の所在地を特定し、特定された所在地を受信エリアとして推定する。
つまり、第1方式では、視聴番組の放送局の所在地を、その視聴番組についての受信エリアとして推定する。
【0065】
[第2方式]
第2方式は、第1方式を応用したものであり、複数のテレビ番組を視聴した放送利用者について、視聴ログが番組毎に得られ、且つ、各視聴ログに対して、視聴番組の放送局のIDを含む被取得情報が関連付けられている場合に用いられる。第2方式では、放送利用者が視聴した複数のテレビ番組のそれぞれについて、第1方式と同様の手順により、被取得情報に含まれる放送局のIDに基づいて、受信エリアの候補を番組毎に特定する。
【0066】
そして、番組毎に特定された受信エリアの候補のうち、同じエリアである候補の数が最も多い最多候補を、受信エリアとして推定する。例えば、ある放送利用者について、
図8に示す複数の視聴ログが得られたケースを例に挙げて説明すると、視聴番組の放送局の所在地(都道府県)の中で、A県が最も多くなっており、A県が、最多候補に該当し、受信エリアとしてA県が推定される。
【0067】
以上のように、第2方式では、所定期間内に放送利用者が視聴した複数のテレビ番組について、各視聴番組を放送した放送局の所在地を特定し、その中で最も多い放送局の所在地を受信エリアとして推定する。
なお、第2方式を採用する場合には、所定期間内に放送利用者が視聴した複数のテレビ番組のそれぞれについて視聴ログを解析することになるが、この場合の所定期間は、特に限定されないが、例えば、1時間又は数時間、あるいは1日又は数日に設定することができる。
【0068】
[第3方式]
第3方式は、第1方式を応用したものであり、複数のテレビ番組を利用した放送利用者について、視聴ログが番組毎に得られ、且つ、各視聴ログに対して、受信強度情報を含む被取得情報が関連付けられている場合に用いられる。第3方式では、放送利用者が視聴した複数のテレビ番組のそれぞれについて、第1方式と同様の手順により、被取得情報に含まれる放送局のIDに基づいて、受信エリアの候補を番組毎に特定する。
【0069】
そして、番組毎に特定された受信エリアの候補のうち、視聴番組(厳密には、視聴番組の放送電波)の受信強度が最も高い候補を、受信エリアとして推定する。例えば、ある放送利用者について、
図8に示す複数の視聴ログが得られたケースを例に挙げて説明すると、番組id「idbbb」のテレビ番組の受信強度が最も高いため、当該番組の放送局の所在地であるA県が受信エリアとして推定される。
【0070】
以上のように、第3方式では、所定期間内に放送利用者が視聴した複数のテレビ番組について、各視聴番組を放送した放送局の所在地を特定し、その中で、受信機器60での受信強度が最も高いテレビ番組の放送局の所在地を受信エリアとして推定する。
なお、第3方式を採用する場合には、所定期間内に放送利用者が視聴した複数のテレビ番組のそれぞれについて視聴ログを解析することになるが、この場合の所定期間は、特に限定されないが、例えば、1時間又は数時間、あるいは1日又は数日に設定することができる。
【0071】
[第4方式]
第4方式は、被取得情報が、放送利用者が視聴したテレビ番組(視聴番組)の内容に関する内容情報、具体的には、視聴番組の番組名や概要等を含む場合に用いられる。第4方式では、被取得情報に含まれる内容情報に対して、自然言語処理を適用して、内容情報から受信エリアに関連する文字情報を抽出し、具体的には地域に関するワード、及び地域を特定できるワードを抽出する。そして、抽出された文字情報に基づいて、受信エリアを推定する。
なお、内容情報から受信エリアに関連する文字情報を抽出する方法、及び、文字情報から受信エリアを推定する方法については、特に限定されないが、機械学習や人工知能(Artificial Intelligence:AI)を活用した方法を利用してもよい。
【0072】
(関連付け部)
関連付け部104は、集計サーバ30によって構成されており、Webログサーバ10から送信されるWebログと、視聴ログサーバ20から送信される視聴ログ(詳しくは、関連付け後の視聴ログ)とを取得する。そして、関連付け部104は、エリア推定部103による受信エリアの推定結果を、地域情報としてWebログに関連付ける。
【0073】
具体的に説明すると、関連付け部104は、
図4に示すテーブルデータを参照し、このデータに規定される第2識別情報と第1識別情報との対応関係に基づき、対象とするWebログの第1識別情報と対応する第2識別情報を特定する。その後、関連付け部104は、特定された第2識別情報を含む視聴ログに関連付けられた推定情報、すなわち、被取得情報に基づく受信エリアの推定結果を、対象とするWebログ(換言すると、当該視聴ログに含まれる第2識別情報と対応する第1識別情報を含むWebログ)に対して関連付ける。
【0074】
また、本実施形態では、前述したように、対象とするWebログ中、Web利用者のユーザIDに対して、視聴ログに関連付けられた推定情報、すなわち、被取得情報に基づく受信エリアの推定結果が関連付けられる。
また、地域情報(つまり、受信エリアの推定結果)が関連付けられたWebログは、集計サーバ30のストレージ30dに記憶され、ストレージ30dから適宜読み出して利用することができる。
【0075】
なお、関連付け部104により参照され、第2識別情報と第1識別情報との対応関係を規定した
図4のテーブルデータは、例えば、集計サーバ30のストレージ30dに記憶されてもよい。ただし、これに限定されず、上記のテーブルデータは、集計サーバ以外のサーバのストレージ10d、20d、40dに記憶されてもよいし、それ以外の外部の記憶装置、例えば、NAS(Network Attached Storage)等に記憶されてもよい。
【0076】
<<本実施形態に係る情報処理方法について>>
次に、本実施形態の情報処理システム100により、Webログに対して地域情報を関連付ける一連の処理の流れ(以下、情報処理フロー)について説明する。情報処理フローでは、本発明の情報処理方法が採用されている。すなわち、以下の説明には、本発明の情報処理方法についての説明が含まれており、また、情報処理フロー中の各ステップは、本発明の情報処理方法の構成要素に相当する。
なお、以下に説明する情報処理フローは、あくまでも一例であり、本発明の趣旨を逸脱しない範囲において不要なステップを削除したり、新たなステップを追加したり、ステップの実施順序を入れ替えてもよい。
【0077】
情報処理フローは、
図9に示す流れに従って進行する。具体的に説明すると、情報処理フローでは、先ず、Webログサーバ10が、Webログを取得する工程を実施する(S001)。すなわち、あるWeb利用者がWebコンテンツを利用した場合に、その利用履歴を含むWebログがコンテンツ配信サーバ40から送信され、Webログサーバ10により受信(取得)される。また、Webログサーバ10は、取得したWebログを集計サーバ30に向けて送信する(S002)。
【0078】
他方、視聴ログサーバ20が、各放送利用者の受信機器60から視聴ログを取得する工程を実施する(S003)。取得された視聴ログには、被取得情報が既に関連付けられてもよく、あるいは、視聴ログの取得後に、視聴ログサーバ20により視聴ログに対して被取得情報が関連付けられてもよい。
【0079】
また、視聴ログサーバ20は、各視聴ログについて、各視聴ログに関連付けれられた被取得情報に基づき、各視聴ログに係る視聴番組を放送利用者の受信機器60により受信した際の受信エリアを推定する工程を実施する(S004)。この工程において、視聴ログサーバ20は、前述の第1方式乃至第4方式のうち、いずれかの方式に従って受信エリアを推定する。その後、視聴ログサーバ20は、受信エリアの推定結果を示す推定情報を視聴ログに関連付け、関連付け後の視聴ログを集計サーバ30に向けて送信する(S005)。
【0080】
Webログサーバ10から送られてくるWebログと、視聴ログサーバ20から送られてくる関連付け後の視聴ログとは、集計サーバ30により受信されて取得される(S006)。
【0081】
次に、集計サーバ30は、取得した関連付け後の視聴ログに含まれる第2識別情報と、Webログに含まれる第1識別情報との対応関係に基づき、対象とするWebログに対して地域情報を関連付ける工程を実施する(S007)。この工程において、集計サーバ30は、ストレージ20dに記憶された
図4のテーブルデータを参照し、テーブルデータに規定された対応関係から、対象とするWebログに含まれる第1識別情報と対応する第2識別情報を特定する。
【0082】
そして、集計サーバ30は、特定された第2識別情報を含む視聴ログに関連付けられた推定情報、すなわち、ステップS004における受信エリアの推定結果を、対象とするWebログに対して関連付ける。より具体的には、対象とするWebログに含まれるWeb利用者のユーザIDに対して、受信エリアの推定結果を関連付ける。
【0083】
以上までの一連のステップが終了した時点で、情報処理フローが終了する。そして、情報処理フローは、繰り返し実施され、例えば、新たなWebログが取得される度に(すなわち、ステップS001が実施される度に)実施される。
【0084】
以上のように、本実施形態では、Webログの第1識別情報をキーとして、対応する第2識別情報を含む視聴ログ、及び、その視聴ログに関連付けられた被取得情報に基づく受信エリアの推定結果(推定情報)を特定する。そして、特定された視聴ログ及び推定情報に基づいて、上記のWebログに対して地域情報を関連付けることができる。具体的には、推定情報が示す受信エリアの推定結果を、地域情報として上記のWebログに対して関連付ける。これにより、関連付けられた地域情報(すなわち、受信エリアの推定結果)から、そのWebログに係るコンテンツ利用者の所在地を、より正確に推定することができる。
【0085】
より詳しく説明すると、一般に、Webログ等に含まれる情報、例えばIPアドレス等からコンテンツ利用者の現在位置を推定することができるが、コンテンツ利用者の所在地の推定については、より高い精度が求められている。
これに対して、本実施形態では、コンテンツ利用者の所在地を、視聴ログに関連付けられた推定情報から精度よく推定することができる。また、その推定結果と比較することにより、IPアドレス等に基づいて推定されたコンテンツ利用者の現在位置(所在地)について、その妥当性を評価することができ、より精緻な推定が実現される。
【0086】
<<その他の実施形態>>
以上までに本発明の情報処理装置及び情報処理方法について、一例を挙げて説明してきたが、上述の実施形態は、あくまでも一例に過ぎず、他の実施形態も考えられ得る。
【0087】
上述の実施形態では、エリア推定部103が、前述した第1方式乃至第4方式のいずれかによって、放送利用者の受信機器60により視聴番組を受信した際の受信エリアを推定することとした。ただし、受信エリアを推定する方式については、上記4つの方式に限定されず、それ以外の方式が用いられてもよい。
例えば、受信機器60が最初に世帯に設置される際にテレビアンテナと接続され、初期スキャンと呼ばれる処理を手動又は自動にて行うと、放送電波を受信できる放送局一覧が取得される。この放送局一覧は、視聴ログに関連付けられた被取得情報として、視聴可能な放送局のIDが含まれているとする。このとき、N個(Nは3以上の自然数)の放送局のそれぞれについて、放送局のIDから各放送局の所在地を特定する。そして、放送局のID毎に特定された放送局の所在地のうち、同じ所在地(都道府県)にある放送局が最も多くなる地域を、受信エリアとして推定してもよい。
【0088】
また、上記の実施形態では、コンテンツ配信サーバ40からWebログを取得し、各放送利用者の受信機器60から視聴ログを取得することとした。ただし、Webログ及び視聴ログの取得元については、特に限定されるものではない。例えば、Webログは、Web利用者の端末50から取得してもよいし、視聴ログは、テレビ番組の放送局から取得してもよい。
【0089】
上記の実施形態では、放送利用者が放送コンテンツ(具体的には、テレビ番組)の電波を受信機器にて受信して当該放送コンテンツを利用することとしたが、これに限定されるものではない。例えば、インターネットテレビやIPサイマルラジオ、又はOTT(Over-the-Top Media)サービスのように、放送利用者がインターネット回線を通じて放送コンテンツを利用してもよい。つまり、放送利用者の受信機器が情報通信端末であり、放送利用者は、情報通信端末によって放送コンテンツのデータをインターネット経由で受信することで、当該放送コンテンツを利用してもよい。この場合、エリア推定部103は、受信機器としての情報通信端末がインターネット回線を通じて放送コンテンツを受信した際の受信エリアを推定するとよい。
【0090】
上記の実施形態では、Webログに含まれる第1識別情報と、視聴ログに含まれる第2識別情報とが、互いに異なっており、両識別情報の対応関係を特定する際に、その対応関係を規定したテーブルデータ(
図4参照)が用いられることとした。ただし、これに限定されるものではなく、第1識別情報と第2識別情報とが同じ種類の情報であり、両識別情報がいずれもIPアドレスであってもよい。この場合には、
図4に示すテーブルデータのような、両識別情報の対応関係を規定したデータが不要となる。
【0091】
上記の実施形態では、各放送利用者が視聴した番組について視聴ログを取得し、番組単位の視聴ログに関連付けれられた被取得情報に基づき、その視聴ログに係る視聴番組を放送利用者の受信機器により受信した際の受信エリアを推定することとしたが、これに限定されるものではない。例えば、視聴ログには視聴日時が含まれており、その視聴日時に相当する日付及び時間帯について、視聴ログに関連付けられた被取得情報に基づいて、受信エリアの候補を特定してもよい。そして、視聴時間毎に受信エリアの候補を特定し、視聴時間の長さに基づいて選定される候補を、放送利用者の受信機器により視聴番組を受信した際の受信エリアとして推定してもよい。
【0092】
また、上述の実施形態では、Webログに対して地域情報を関連付けるための一連の機能が、情報処理システム100を構成する複数の装置、具体的には複数のサーバによって実現されることとした。ただし、これに限定されず、上記の一連の機能、具体的には、第1取得部101、第2取得部102、エリア推定部103、及び関連付け部104のすべてが一つの装置、例えば一台のサーバコンピュータによって構成されてもよい。つまり、上述の情報処理システム100により発揮される機能が一つの装置によって実現されてもよい。そのような装置は、本発明の情報処理装置として機能することになる。
【符号の説明】
【0093】
10 Webログサーバ
20 視聴ログサーバ
30 集計サーバ
40 コンテンツ配信サーバ
10a、20a、30a、40a プロセッサ
10b、20b、30b、40b メモリ
10c、20c、30c、40c 通信用インタフェース
10d、20d、30d、40d ストレージ
50 端末
60 受信機器
100 情報処理システム
101 第1取得部
102 第2取得部
103 エリア推定部
104 関連付け部
N 通信用ネットワーク