【解決手段】一実施形態に係る情報処理システムは、少なくとも一つのプロセッサを備える。少なくとも一つのプロセッサは、(A)機器のIPアドレス、機器ID、および利用履歴を含む機器ログを記憶する機器ログデータベースから該機器ログを取得し、(B)ユーザの携帯端末のIPアドレス、端末特定情報、および利用履歴を含む端末ログを記憶する端末ログデータベースから該端末ログを取得し、(C)IPアドレスおよび利用履歴が一致する機器ログおよび端末ログを互いに関連付けることで、ユーザおよび機器が互いに関連付けられた機器利用データを生成し、(D)機器利用データを出力する。
【発明を実施するための形態】
【0011】
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
【0012】
[システムの概要]
実施形態に係る情報処理システム1は、ユーザによる機器利用の状況を把握するために用いられるコンピュータシステムである。より具体的には、情報処理システム1は個人単位での機器の利用状況を把握するために用いられる。個々のユーザ、すなわち個人が誰であるかは限定されず、例えば、家族の中の一人でもよいし、会社などの組織の中の一人でもよい。本開示における「機器」とは、通信機能を備え、他のコンピュータとの間でデータ通信を実行することができる機械または装置のことをいう。機器の種類は限定されず、例えば電気製品、ロボット、または産業用機械でもよい。電気製品の例としてテレビ、スピーカ、エアーコンディショナ、冷蔵庫、給湯器、電磁調理器、およびパーソナルコンピュータが挙げられるが、当然ながらこれらに限定されない。「ユーザによる機器利用の状況」とは、ユーザが機器を実際に使っていた状況、またはその利用が推定される状況のことをいう。例えば、機器がテレビであれば、「ユーザによる機器利用の状況」とは、ユーザが放送コンテンツを視聴した状況、またはその視聴が推定される状況のことをいう。
【0013】
一例では、情報処理システム1は、機器とユーザの携帯端末とを照合し、その機器および携帯端末を関連付けることで、ユーザがその機器を利用したと推定する。ここで、携帯端末とは、ユーザが持ち歩くことができ、且つ通信機能を備えるコンピュータである。携帯端末の例は限定されず、例えば、携帯端末は高機能携帯電話機(スマートフォン)、携帯電話機、タブレット端末、またはウェアラブル端末でもよい。
【0014】
図1は、情報処理システム1による機器と携帯端末との照合の一例を示す図である。この例は、ユーザ51およびユーザ52を含む家族50の自宅60に設置されているテレビ70の利用状況を示す。ユーザ51は携帯端末81を所持し、ユーザ52は携帯端末82を所持するものとする。ユーザ51は自宅60にいて放送コンテンツを視聴しているのに対して、ユーザ52は外出している。この場合、情報処理システム1は、ユーザ51がテレビ70を利用したと推定し、ユーザ52がテレビ70を利用したとは推定しない。より具体的には、情報処理システム1はテレビ70と携帯端末81を照合して双方を関連付けることで、ユーザ51がテレビ70を利用したと推定する。この一方で、情報処理システム1はテレビ70と携帯端末82とを関連付けないので、ユーザ52がテレビ70を利用したとは推定しない。このように、情報処理システム1は機器単位ではなく個人単位で機器の利用状況を判定することができる。
【0015】
[システムの構成]
以下では、機器の一例として受像装置を示しながら、情報処理システム1の構成を説明する。受像装置とは、テレビ番組、CMなどの放送コンテンツを受信および表示する装置である。放送コンテンツの配信方法は限定されず、例えば、放送コンテンツは電波で配信されてもよいし、有線または無線の電気通信回線(典型的にはインターネット回線)で配信されてもよい。受像装置の種類も限定されず、例えば、テレビ、スマートテレビ、またはテレビ機能を有するパーソナルコンピュータでもよい。
【0016】
図2は、情報処理システム1の機能構成の一例を示す図である。本実施形態では、情報処理システム1は、ユーザによる受像装置の利用状況を推定するコンピュータであるサーバ10を備える。サーバ10は、その処理に用いられるデータを記憶するデータベース群20と通信ネットワークを介して接続し、必要に応じてデータベース群20からデータを取得する。通信ネットワークの構成は何ら限定されるものでなく、例えば、通信ネットワークはインターネット、イントラネットなどの任意の通信網を用いて構築されてよい。
【0017】
サーバ10は機能要素として第1マッチング部11、第2マッチング部12、および推定部13を備える。第1マッチング部11は、機器ログと端末ログとを関連付けることで、受像装置と端末との対応関係を得る機能要素である。第2マッチング部12は、第1マッチング部11による処理結果とユーザ情報とを関連付けることで、ユーザと受像装置との対応関係を得る機能要素である。推定部13は、第2マッチング部12による処理結果とユーザ位置情報とを少なくとも用いて、ユーザによる受像装置の利用状況を推定する機能要素である。機器ログ、端末ログ、ユーザ情報、およびユーザ位置情報などの各種データの詳細は後述する。
【0018】
図3は、サーバ10として機能するコンピュータ100の一般的なハードウェア構成を示す図である。例えば、コンピュータ100はプロセッサ101、主記憶部102、補助記憶部103、通信制御部104、入力装置105、および出力装置106を備える。プロセッサ101はオペレーティングシステムおよびアプリケーションプログラムを実行する。主記憶部102は例えばROMおよびRAMで構成される。補助記憶部103は例えばハードディスクまたはフラッシュメモリで構成され、一般に主記憶部102よりも大量のデータを記憶する。補助記憶部103は、少なくとも1台のコンピュータを情報処理システム1(サーバ10)として機能させるためのプログラム110を記憶する。通信制御部104は例えばネットワークカードまたは無線通信モジュールで構成される。入力装置105は例えばキーボード、マウス、タッチパネルなどで構成される。出力装置106は例えばモニタおよびスピーカで構成される。
【0019】
サーバ10の各機能要素は、プロセッサ101または主記憶部102の上にプログラム110を読み込ませてそのプログラムを実行させることで実現される。プログラム110はサーバ10の各機能要素を実現するためのコードを含む。個々の機能要素が別々のコンピュータ100に実装される場合には、それぞれのコンピュータ100に記憶されるプログラム110は相異なってもよい。いずれにしても、プロセッサ101はプログラム110に従って、通信制御部104、入力装置105、または出力装置106を動作させ、主記憶部102または補助記憶部103におけるデータの読み出しおよび書き込みを行う。この処理によりサーバ10の各機能要素が実現される。処理に必要なデータまたはデータベースは主記憶部102または補助記憶部103内に格納されてもよい。
【0020】
プログラム110は情報処理プログラムに相当する。プログラム110は、例えば、CD−ROM、DVD−ROM、半導体メモリなどの有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、プログラム110は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
【0021】
データベース群20は1以上のデータベースの集合である。データベースとは、プロセッサまたは外部のコンピュータからの任意のデータ操作(例えば、抽出、追加、削除、上書きなど)に対応できるようにデータ集合を記憶する機能要素または装置である。データベースの実装方法は限定されず、例えばリレーショナル・データベースでもよい。それぞれのデータベースの管理主体および設置場所は限定されない。例えば、少なくとも一つのデータベースは、サーバ10とは異なるコンピュータシステムにより管理されてもよい。また、少なくとも一つのデータベースはサーバ10の一部であってもよい。個々のデータベースの管理主体は互いに異なってもよいし同じでもよい。
【0022】
本実施形態では、データベース群20は機器ログデータベース21、端末ログデータベース22、ユーザデータベース23、視聴ログデータベース24、およびユーザ位置データベース25を備える。
【0023】
機器ログデータベース21は、受像装置が利用されたことを示すデータである機器ログを記憶するデータベースである。一例では、機器ログの各レコードは、個々の受像装置を一意に特定する識別子である機器IDと、受像装置が利用された日付と、受像装置のIPアドレスとを含む。受像装置が利用された日付は機器の利用履歴の一例であり、例えば、受像装置が何らかの放送コンテンツを受信および表示した日付を示す。機器の利用履歴とは機器が利用されたことを示す記録のことをいう。一例では、受像装置のIPアドレスは、受像装置に対応するグローバルIPアドレスであり得る。例えば、受像装置が接続するルーターに割り当てられたグローバルIPアドレスが受像装置のIPアドレスとして機器ログに記録されてもよい。機器ログは受像装置の動作(例えば、電源ON、チャンネル変更、電源OFF)を示すログに基づいて生成される。機器ログは任意の装置により機器ログデータベース21に格納されてよい。
【0024】
端末ログデータベース22は、携帯端末が利用されたことを示すデータである端末ログを記憶するデータベースである。一例では、端末ログの各レコードは、個々の携帯端末を一意に特定するために利用可能な端末特定情報と、携帯端末が利用された日付と、携帯端末のIPアドレスとを含む。携帯端末を特定することができる限り、端末特定情報として用いられる情報は限定されない。例えば、端末特定情報は、HTTPクッキー(HTTP cookie)の識別子であるクッキーID(cookie ID)でもよいし、広告識別子(Advertising Identifier)でもよく、これら2種類の情報は、ウェブブラウザを備える携帯端末から得ることができる。あるいは、端末特定情報はユーザエージェントおよびユーザIDの組合せでもよい。ユーザエージェントとは、ウェブブラウザの種類およびバージョンと、オペレーティングシステムの種類およびバージョンとの組合せを含む識別子である。ユーザIDはユーザを一意に特定するための識別子である。携帯端末が利用された日付は携帯端末の利用履歴の一例であり、例えば、携帯端末が何らかのウェブページを受信および表示した日付を示す。携帯端末の利用履歴とは携帯端末が利用されたことを示す記録のことをいう。一例では、携帯端末のIPアドレスとは、携帯端末に対応するグローバルIPアドレスのことをいう。例えば、携帯端末が接続するルーターに割り当てられたグローバルIPアドレスが携帯端末のIPアドレスとして端末ログに記録されてもよい。端末ログは携帯端末上でのウェブブラウザの動作(例えば、起動、ウェブページの遷移、終了)を示すログに基づいて生成される。端末ログは任意の装置により端末ログデータベース22に格納される。以下では、端末特定情報としてクッキーIDを例示する。
【0025】
ユーザデータベース23は、ユーザに関する情報であるユーザ情報を記憶するデータベースである。一例では、ユーザ情報の各レコードは、個々のユーザを一意に特定する識別子であるユーザIDと、ユーザの携帯端末から得られる端末特定情報と、ユーザの属性とを含む。上述したように端末特定情報の例としてクッキーIDおよび広告識別子が挙げられる。ユーザ属性はユーザの特徴または性質を示す情報であり、例えば性別、年齢を含んでもよい。ユーザ属性は個人を特定できない情報のみから構成されてもよい。ユーザ情報はユーザの個人情報と、そのユーザの携帯端末の情報とを用いて生成される。例えば、ユーザは受像装置の利用の調査に同意した人でもよい。ユーザ情報は任意の装置によりユーザデータベース23に格納される。
【0026】
視聴ログデータベース24は、受像装置により放送コンテンツが視聴されたことを示す視聴ログを記憶するデータベースである。視聴ログはユーザによる機器の利用を示す利用ログの一例であり、視聴ログデータベース24は利用ログを記憶する利用ログデータベースの一例である。一例では、視聴ログの各レコードは、機器IDと、視聴された日時と、視聴情報とを含む。視聴情報は放送コンテンツへの接触を示す情報である。例えば、視聴情報はチャンネル、番組情報、CM情報のうちの少なくとも一つを含んでもよいし、受像装置の電源のON/OFFを示す情報を含んでもよい。視聴ログは受像装置の動作(例えば、電源ON、チャンネル変更、電源OFF)を示すログに基づいて生成される。視聴ログは任意の装置により生成されて視聴ログデータベース24に格納される。
【0027】
ユーザ位置データベース25は、ユーザの位置の履歴を示すユーザ位置情報を記憶するデータベースである。一例では、ユーザ位置情報の各レコードは、ユーザIDと、ユーザの位置と、その位置が測定された日時とを含み、この例ではユーザの位置の履歴はその位置および日時の組合せで表される。ユーザの位置は携帯端末から定期的に得られる位置データに基づいて設定される。例えば、携帯端末はGPS(全地球測位システム)で得られる座標、または基地局から得られるセルIDを位置データとして提供することができる。ユーザの位置は、その位置データに基づいて設定される。一例では、ユーザの位置は、受像装置が設置されている場所であるか否かの二値で示されてもよく、例えば、受像装置が設置されている自宅内にユーザがいるか否かを示してもよい。ユーザ位置情報は、ユーザの携帯端末から提供される位置データとユーザ情報とを用いて生成される。ユーザの位置は位置データの履歴から推定され、例えば、所与の時間帯毎の位置データの変化の度合いに基づいて推定されてもよいし、会員情報で示される住所と位置データとを照合することで推定されてもよい。ユーザ位置情報は任意の装置により生成されてユーザ位置データベース25に格納される。
【0028】
本開示では、上述した各データのデータ構造(データ項目)を以下のように表す。
・機器ログ:(機器ID,日付,IPアドレス)
・端末ログ:(クッキーID,日付,IPアドレス)
・ユーザ情報:(ユーザID,クッキーID,ユーザ属性)
・視聴ログ:(機器ID,日時,視聴情報)
・ユーザ位置情報:(ユーザID,ユーザの位置,日時)
【0029】
各データベースの構成は上記のものに限定されるものではなく、任意の手法で個々のデータが正規化または冗長化されてもよい。例えば、機器ログのレコードと視聴ログのレコードとを1レコードに統合することも可能である。
【0030】
[システムの動作]
図4〜
図6を参照しながら、情報処理システム1の動作を説明するとともに本実施形態に係る情報処理方法について説明する。
図4は情報処理システム1の動作の一例を示すフローチャートである。
図5は個人視聴の推定方法の例を示す図である。
図6は、
図4に対応する一連のデータ処理の流れを示す図である。
【0031】
ステップS11では、第1マッチング部11が、IPアドレスおよび日付の双方が一致する機器ログおよび端末ログを互いに関連付けることで第1中間データを生成する。一例では、機器ログと端末ログとの間でIPアドレスが一致するとは、受像装置に対応するグローバルIPアドレスと、携帯端末に対応するグローバルIPアドレスとが一致することをいう。第1マッチング部11は機器ログデータベース21から機器ログを取得すると共に、端末ログデータベース22から端末ログを取得する。続いて、第1マッチング部11は機器ログのレコード群と端末ログのレコード群とを比較して、双方のレコード群の間で、IPアドレスおよび日付の双方が一致する組合せを特定する。そして、第1マッチング部11は、IPアドレスおよび日付の双方が一致する機器ログおよび端末ログを互いに関連付けることで第1中間データを生成する。機器ログのデータ構造は(機器ID,日付,IPアドレス)であり、端末ログのデータ構造は(クッキーID,日付,IPアドレス)である。したがって、第1マッチング部11は(機器ID,日付,IPアドレス,クッキーID)というデータ構造を含む第1中間データを生成する。
【0032】
ステップS12では、第2マッチング部12が、クッキーID(端末特定情報)が一致する第1中間データおよびユーザ情報を互いに関連付けることで第2中間データを生成する。第2マッチング部12はユーザデータベース23からユーザ情報を取得する。続いて、第2マッチング部12は第1中間データのレコード群とユーザ情報のレコード群とを比較して、双方のレコード群の間で、クッキーIDが一致する組合せを特定する。そして、第2マッチング部12は、クッキーIDが一致する第1中間データおよびユーザ情報を互いに関連付けることで第2中間データを生成する。第1中間データのデータ構造は(機器ID,日付,IPアドレス,クッキーID)であり、ユーザ情報のデータ構造は(ユーザID,クッキーID,ユーザ属性)である。したがって、第2マッチング部12は(機器ID,日付,IPアドレス,クッキーID,ユーザID,ユーザ属性)というデータ構造を含む第2中間データを生成する。
【0033】
ステップS13では、第2マッチング部12が、不特定多数の人により利用される可能性があるIPアドレス(例えばグローバルIPアドレス)を含むレコードを第2中間データから削除する。この処理は、所与の条件を満たすIPアドレスを含むレコードの削除の一例である。例えば、第2マッチング部12は、移動体通信事業者、電気通信事業者などにより提供される無料Wi−Fiで用いられるIPアドレス(例えばグローバルIPアドレス)を含むレコードを削除する。その絞り込みを実行するために、第2マッチング部12は、除外の対象であるIPアドレス(例えばグローバルIPアドレス)を示す除外IPリストを用いる。この除外IPリストは、例えば、移動体通信事業者、電気通信事業者などにより公開されているIPアドレス情報を参照して用意することができる。除外IPリストは、サーバ10内のメモリに予め記憶されてもよいし、サーバ10がアクセス可能な任意の外部メモリまたは外部データベースに予め記憶されてもよい。いずれにしても、第2マッチング部12は除外IPリストと、第2中間データのIPアドレスとを比較して、除外の対象であるIPアドレスを含むレコードを第2中間データから削除する。
【0034】
ステップS14では、第2マッチング部12が、特定の時間幅(期間)において閾値以上の個数のクッキーIDと関連付けられるIPアドレス(例えばグローバルIPアドレス)を含むレコードを第2中間データから削除する。この処理も、所与の条件を満たすIPアドレスを含むレコードの削除の一例である。集合住宅などのように複数の世帯または組織がIPアドレス(例えばグローバルIPアドレス)を共有する場合があり、第2マッチング部12このような共有のIPアドレスを除外するために第2中間データをさらに絞り込む。第2マッチング部12は各IPアドレス(例えば各グローバルIPアドレス)について、特定の時間幅において該IPアドレスと関連付けられているクッキーIDの個数を集計する。そして、第2マッチング部12は閾値以上の個数のクッキーIDと関連付けられているIPアドレスを特定する。そして、第2マッチング部12は、特定されたIPアドレスを含むレコードを第2中間データから削除する。この処理で用いられる時間幅の長さおよび閾値の値は限定されず、任意に定められてよい。
【0035】
ステップS15では、第2マッチング部12が、処理された第2中間データに基づいて、ユーザと受像装置とが関連付けられた機器利用データを生成する。「処理された第2中間データ」とは、ステップS13,S14の削除処理が実行された後に残った第2中間データのことをいう。第2マッチング部12は第2中間データから、機器ID、日付、およびユーザIDの組合せを抽出し、この組合せに基づいて、特定の時間幅(期間)における機器IDおよびユーザIDのペアの出現回数(出現した日数)を集計する。そして、第2マッチング部12はその出現回数が閾値未満のペアを削除する。この処理で用いられる時間幅の長さおよび閾値の値も限定されず、任意に定められてよい。出現回数が低いペアを削除するのは、出現回数が多いペア(機器ID,ユーザID)は安定して出現するということができ、したがって信頼性が高いと期待できるからである。第2マッチング部12は、抽出されたペアのそれぞれに、対応するユーザ属性を追加することで、機器ID、ユーザID、およびユーザ属性が互いに関連付けられた機器利用データを生成する。したがって、機器利用データは(機器ID,ユーザID,ユーザ属性)というデータ構造を含む。
【0036】
ステップS16では、推定部13が機器利用データおよび視聴ログを関連付けることで個人視聴データを生成する。第2マッチング部12から推定部13への機器利用データの受け渡しは、機器利用データの出力の一例である。推定部13は視聴ログデータベース24から視聴ログを取得し、機器IDが一致する機器利用データおよび視聴ログを互いに関連付けることで、個人視聴データを生成する。機器利用データのデータ構造は(機器ID,ユーザID,ユーザ属性)であり、視聴ログのデータ構造は(機器ID,日時,視聴情報)である。したがって、推定部13は(機器ID,ユーザID,ユーザ属性,日時,視聴情報)というデータ構造を含む個人視聴データを生成する。個人視聴データはユーザが視聴した放送コンテンツを示すデータであり、ユーザ毎の機器の利用を示す個人利用データの一例である。
【0037】
ステップS17では、推定部13がその個人視聴データとユーザ位置情報とに基づいて個人視聴を推定する。推定部13はユーザ位置データベース25からユーザ位置情報を取得し、そのユーザ位置情報と生成された個人視聴データとを比較することで、個人視聴を推定する。一例では、推定部13は、ユーザが受像装置の設置場所(例えば自宅)に滞在した時間帯である滞在時間帯をユーザ位置情報に基づいて推定する。そして、推定部13は、その滞在時間帯内に含まれる日時の個人視聴データが存在する場合には、その個人視聴データで示される放送コンテンツを該時間帯に視聴していた(すなわち、受像装置を利用していた)と推定する。この処理は、滞在時間帯に対応する機器利用データ(これは個人視聴データの基になるデータである。)が存在する場合に、滞在時間帯の少なくとも一部において前記ユーザが機器を利用したと推定することの一例である。本開示では、機器(例えば受像装置)を利用していた時間帯を「利用時間帯」という。推定部13は個人視聴データで示される1以上のユーザのそれぞれについて個人視聴を推定することができる。例えば、推定部13は滞在時間帯と利用時間帯との対応関係(たとえば、双方の時間帯の重なり)に基づいて個人視聴を推定することができる。
【0038】
携帯端末が提供する位置データの時間間隔が長い場合には(例えばその間隔が1時間である場合には)、個々のユーザのユーザ位置情報の時間間隔も長くなる。この場合には、推定部13は個人の視聴(すなわち、個人の受像装置の利用)を精密に推定するために以下の処理を実行してもよい。ユーザ位置情報がユーザの在宅状況を示すことと、位置情報の時間間隔がn時間であることとを前提として、
図5を参照しながらその処理の一例を以下に説明する。ここで、nの値は何ら限定されず、例えば、位置情報の時間間隔は1時間でもよいし30分(0.5時間)でもよい。
図5において、利用時間帯は視聴時間帯に相当し、滞在時間帯は在宅時間帯に相当する。
【0039】
例1は、個人視聴データで示される視聴終了時刻(利用時間帯の終点)が、ユーザ位置情報から得られる在宅終了時刻(滞在時間帯の終点)の経過後n時間以内である場合を示す。この場合には、推定部13はその滞在時間帯を視聴終了時刻まで延長することで該滞在時間帯の終点を補正し、補正された滞在時間帯の範囲の終点までユーザが放送コンテンツを視聴したと推定してもよい。推定部13は最大n時間の範囲で滞在時間帯の終点を補正する可能性がある。この処理は、ユーザ位置情報の時間間隔の間にユーザが自宅から別の場所に移動した可能性を考慮したものである。
【0040】
例2は、個人視聴データで示される視聴開始時刻(利用時間帯の始点)が、ユーザ位置情報から得られる滞在時間帯の範囲外であり、かつ、視聴開始時刻と在宅開始時刻(滞在時間帯の始点)との差がn時間以内である場合を示す。この場合には、推定部13は滞在時間帯の始点が視聴開始時刻と一致するように該滞在時間帯の始点を補正し、補正後の始点からユーザが放送コンテンツを視聴したと推定してもよい。この処理は、ユーザ位置情報の時間間隔の間にユーザが別の場所から自宅に戻った可能性を考慮したものである。
【0041】
例3は、個人視聴データで示される視聴終了時刻が、ユーザ位置情報から得られる在宅終了時刻からn時間を経過した後である場合を示す。この場合には、推定部13は在宅終了時刻(滞在時間帯の終点)を中間点とするm時間の範囲においてその在宅終了時刻を補正してもよい。mの値は任意に定めてよい。具体的には、推定部13は、その在宅終了時刻の次に位置情報が取得される時刻(これを「次の時刻」という)における過去の所与の期間(例えば1ヶ月)の条件付き確率を用いて、{在宅終了時刻+m/2×(条件付き確率−0.5)}を補正後の在宅終了時刻として得る。条件付き確率は、在宅終了時刻にユーザが在宅しているという条件下で、該ユーザが次の時刻にも在宅している確率を示す。推定部13は、補正後の滞在時間帯と重複する利用時間帯においてユーザが放送コンテンツを視聴したと推定する。この処理は、ユーザ位置情報の時間間隔の間にユーザが自宅から別の場所に移動した可能性を考慮したものである。例3では、過去の在宅状況を考慮してユーザの移動を考慮する。
【0042】
例4は、個人視聴データで示される視聴開始時刻が、ユーザ位置情報から得られる滞在時間帯の範囲外であり、かつ、視聴開始時刻が在宅開始時刻(滞在時間帯の始点)よりもn時間以上前である場合を示す。この場合には、推定部13は在宅開始時刻を中間点とするm時間の範囲においてその在宅開始時刻を補正してもよい。具体的には、推定部13は、その在宅開始時刻の一つ前に位置情報が取得される時刻(これを「前の時刻」という)における過去の所与の期間(例えば1ヶ月)の条件付き確率を用いて、{在宅開始時刻−m/2×(条件付き確率−0.5)}を補正後の在宅開始時刻として得る。条件付き確率は、在宅開始時刻にユーザが在宅しているという条件下で、該ユーザが前の時刻にも在宅している確率を示す。推定部13は、補正後の滞在時間帯と重複する利用時間帯においてユーザが放送コンテンツを視聴したと推定する。この処理は、ユーザ位置情報の時間間隔の間にユーザが別の場所から自宅に戻った可能性を考慮したものである。例4でも、過去の在宅状況を考慮してユーザの移動を考慮する。
【0043】
図4に戻って、ステップS18では、推定部13が推定結果を出力する。推定結果の出力方法は限定されない。例えば、推定部13は推定結果を、所与のデータベースに格納してもよいし、他のコンピュータに送信してもよいし、モニタ上に表示してもよい。いずれにしても、その推定結果を参照することで各ユーザの視聴の実態を把握することができる。これは、個人単位での機器の利用状況を把握できることの一例である。
【0044】
図6は、上述したステップS11〜S18の一連の処理をデータ処理の観点から示す。まず、第1マッチング部11が機器ログおよび端末ログに基づいて第1中間データを生成する(ステップS11)。続いて、第2マッチング部12がその第1中間データとユーザ情報とに基づいて第2中間データを生成し(ステップS12)、その第2中間データに基づいて機器利用データを生成する(ステップS15)。続いて、推定部13がその機器利用データと視聴ログとに基づいて個人視聴データを生成し(ステップS16)、その個人視聴データとユーザ位置情報とに基づいて個人視聴の推定結果を生成する(ステップS17)。
【0045】
[効果]
以上説明したように、本開示の一側面に係る情報処理システムは、少なくとも一つのプロセッサを備え、少なくとも一つのプロセッサが、機器のIPアドレス、機器ID、および利用履歴を含む機器ログを記憶する機器ログデータベースから該機器ログを取得し、ユーザの携帯端末のIPアドレス、端末特定情報、および利用履歴を含む端末ログを記憶する端末ログデータベースから該端末ログを取得し、IPアドレスおよび利用履歴が一致する機器ログおよび端末ログを互いに関連付けることで、ユーザおよび機器が互いに関連付けられた機器利用データを生成し、機器利用データを出力する。
【0046】
本開示の一側面に係る情報処理方法は、少なくとも一つのプロセッサを備える情報処理システムにより実行される情報処理方法であって、機器のIPアドレス、機器ID、および利用履歴を含む機器ログを記憶する機器ログデータベースから該機器ログを取得するステップと、ユーザの携帯端末のIPアドレス、端末特定情報、および利用履歴を含む端末ログを記憶する端末ログデータベースから該端末ログを取得するステップと、IPアドレスおよび利用履歴が一致する機器ログおよび端末ログを互いに関連付けることで、ユーザおよび機器が互いに関連付けられた機器利用データを生成するステップと、機器利用データを出力するステップとを含む。
【0047】
本開示の一側面に係る情報処理プログラムは、機器のIPアドレス、機器ID、および利用履歴を含む機器ログを記憶する機器ログデータベースから該機器ログを取得するステップと、ユーザの携帯端末のIPアドレス、端末特定情報、および利用履歴を含む端末ログを記憶する端末ログデータベースから該端末ログを取得するステップと、IPアドレスおよび利用履歴が一致する機器ログおよび端末ログを互いに関連付けることで、ユーザおよび機器が互いに関連付けられた機器利用データを生成するステップと、機器利用データを出力するステップとをコンピュータに実行させる。
【0048】
このような側面においては、IPアドレスおよび利用履歴が互いに一致する機器とユーザの携帯端末とが関連付けられて機器利用データが生成される。この機器利用データを用いることでユーザ(すなわち個人)と機器の利用との対応が得られるので、個人単位での機器の利用状況の把握に貢献することができる。
【0049】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、ユーザIDおよび端末特定情報を含むユーザ情報を記憶するユーザデータベースから該ユーザ情報を取得し、IPアドレスおよび利用履歴が一致する機器ログおよび端末ログを互いに関連付けることで第1中間データを生成し、端末特定情報が一致する第1中間データおよびユーザ情報を互いに関連付けることで機器利用データを生成してもよい。ユーザ情報を用いることで、ユーザと機器の利用との対応をより正確に特定することができる。
【0050】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、端末特定情報が一致する第1中間データおよびユーザ情報を互いに関連付けることで第2中間データを生成し、第2中間データから、所与の条件を満たすIPアドレスを含むレコードを削除し、削除が実行された後に残った第2中間データに基づいて機器利用データを生成してもよい。この処理により、個人単位での機器の利用状況を推定する際に不要であると考えられるレコードを削除することができ、その結果、機器利用データの量を抑えることができる。また、推定の制度の向上および演算時間の短縮も期待できる。
【0051】
他の側面に係る情報処理システムでは、所与の条件を満たすIPアドレスが、無料Wi−Fiで用いられるIPアドレスを含んでもよい。無料Wi−Fiで用いられるIPアドレスは不特定多数の人により利用される可能性があるので、機器の利用状況の推定には不要であると考えられる。そのIPアドレスを含むレコードを削除することで、機器利用データの量を抑えることができる。また、推定の制度の向上および演算時間の短縮も期待できる。
【0052】
他の側面に係る情報処理システムでは、所与の条件を満たすIPアドレスが、特定の時間幅において閾値以上の個数の端末特定情報と関連付けられるIPアドレスを含んでもよい。集合住宅などのように複数の世帯または組織がIPアドレスを共有する場合があり、そのIPアドレスは機器の利用状況の推定には不要であると考えられる。そのIPアドレスを含むレコードを削除することで、機器利用データの量を抑えることができる。また、推定の制度の向上および演算時間の短縮も期待できる。
【0053】
他の側面に係る情報処理システムでは、機器が受像装置であってもよい。この場合には個人単位での受像装置の利用状況の把握に貢献することができる。
【0054】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、ユーザIDおよびユーザの位置の履歴を含むユーザ位置情報を記憶するユーザ位置データベースから取得し、ユーザIDが一致する機器利用データおよびユーザ位置情報を互いに関連付け、ユーザによる機器の利用を推定してもよい。この構成により、個人単位での機器の利用状況を把握することができる。
【0055】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、ユーザが機器の設置場所に滞在した時間帯である滞在時間帯をユーザ位置情報に基づいて推定し、滞在時間帯に対応する機器利用データが存在する場合に、滞在時間帯の少なくとも一部においてユーザが機器を利用したと推定してもよい。この構成により、個人単位での機器の利用状況をより正確に把握することができる。
【0056】
他の側面に係る情報処理システムでは、機器利用データが、機器が利用された時間帯を利用時間帯として示し、少なくとも一つのプロセッサが、滞在時間帯と利用時間帯との対応関係に基づいて、ユーザによる機器の利用を推定してもよい。この構成により、個人単位での機器の利用状況をより正確に把握することができる。
【0057】
他の側面に係る情報処理システムでは、少なくとも一つのプロセッサが、ユーザの位置が取得される時間間隔に基づいて、滞在時間帯の始点または終点の少なくとも一方を補正し、補正された滞在時間帯と利用時間帯との対応関係に基づいて、ユーザによる機器の利用を推定してもよい。滞在時間帯を補正した上で双方の時間帯の対応関係を考慮することで、個人単位での機器の利用状況をより正確に把握することができる。
【0058】
他の側面に係る情報処理システムでは、機器が受像装置であり、機器の利用が、受像装置を用いての放送コンテンツの視聴であってもよい。この場合には、放送コンテンツの視聴状況を個人単位で推定することができる。
【0059】
他の側面に係る情報処理システムでは、端末特定情報が、HTTPクッキーの識別子と、広告識別子と、ユーザエージェントおよびユーザIDの組合せとのうちの一つであってもよい。この場合には、携帯端末そのものの識別子を用いることなくユーザの携帯端末を特定することができる。
【0060】
[変形例]
以上、本開示の実施形態に基づいて詳細に説明した。しかし、本開示は上記実施形態に限定されるものではない。本開示は、その要旨を逸脱しない範囲で様々な変形が可能である。
【0061】
上記実施形態では情報処理システム1が機器利用データの生成および出力だけでなく個人単位での機器の利用を推定するが、情報処理システムはその推定処理を実行しなくてもよい。例えば、情報処理システムが機器利用データを他のコンピュータシステムに送信するか所与のデータベースに格納し、他のコンピュータシステムがその機器利用データを用いて個人単位での機器の利用を推定してもよい。
【0062】
情報処理システム内で二つの数値の大小関係を比較する際には、「以上」および「よりも大きい」という二つの基準のどちらを用いてもよく、「以下」および「未満」という二つの基準のうちのどちらを用いてもよい。このような基準の選択は、二つの数値の大小関係を比較する処理についての技術的意義を変更するものではない。
【0063】
少なくとも一つのプロセッサにより実行される情報処理方法の処理手順は上記実施形態での例に限定されない。例えば、上述したステップ(処理)の一部が省略されてもよいし、別の順序で各ステップが実行されてもよい。また、上述したステップのうちの任意の2以上のステップが組み合わされてもよいし、ステップの一部が修正又は削除されてもよい。あるいは、上記の各ステップに加えて他のステップが実行されてもよい。例えば、情報処理システムは、所与の条件を満たすIPアドレスを含むレコードを第2中間データから削除する処理(ステップS13,S14)の少なくとも一部を実行しなくてもよい。別の例として、各データベースのレコードの構成によっては、情報処理システムは、第1中間データおよび第2中間データを生成することなく、機器ログおよび端末ログから機器利用データを生成してもよい。