(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5774617
(24)【登録日】2015年7月10日
(45)【発行日】2015年9月9日
(54)【発明の名称】情報処理装置、サーバ装置、情報処理システム、制御方法、及びプログラム
(51)【国際特許分類】
G06F 21/62 20130101AFI20150820BHJP
G06Q 50/10 20120101ALI20150820BHJP
【FI】
G06F21/62 354
G06Q50/10 180
【請求項の数】12
【全頁数】18
(21)【出願番号】特願2013-23080(P2013-23080)
(22)【出願日】2013年2月8日
(65)【公開番号】特開2014-153533(P2014-153533A)
(43)【公開日】2014年8月25日
【審査請求日】2014年8月4日
(73)【特許権者】
【識別番号】311012169
【氏名又は名称】NECパーソナルコンピュータ株式会社
(74)【代理人】
【識別番号】100084250
【弁理士】
【氏名又は名称】丸山 隆夫
(72)【発明者】
【氏名】白川 貴久
【審査官】
中里 裕正
(56)【参考文献】
【文献】
特開2012−078923(JP,A)
【文献】
特表2011−524560(JP,A)
【文献】
米国特許第06687691(US,B1)
【文献】
米国特許第06931403(US,B1)
【文献】
Polat, H. and Du, W.,Privacy-Preserving Collaborative Filtering Using Randomized Pertubation Techniques,Proceedings of the 3rd IEEE International Conference on Data Mining,2003年,p.625-628
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/62
G06Q 50/10
(57)【特許請求の範囲】
【請求項1】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、
前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する手段と、
前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する手段と、
0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数のそれぞれから前記バイアス値を除去し、前記第1のサーバ装置の補正計数を生成する手段と、
前記補正計数を前記第2のサーバ装置に対して送信する手段と、
を含むことを特徴とする情報処理装置。
【請求項2】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、
前記第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、
前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、
前記アクセス総数に基づいて、バイアス値を算出する手段と、
前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、
前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、
0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、
前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、
前記補正計数を前記第2のサーバ装置に対して送信する手段と、
を含むことを特徴とする情報処理装置。
【請求項3】
前記情報処理装置は複数存在し、前記第2のサーバ装置は、前記複数の情報処理装置より送信された前記補正計数を前記複数の第1のサーバ装置毎に集計する手段を含むことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、
前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する手段と、
前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する手段と、
0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数を前記第2のサーバ装置に対して送信する手段と、
を含むことを特徴とする情報処理装置。
【請求項5】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、
前記第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、
前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、
前記アクセス総数に基づいて、バイアス値を算出する手段と、
前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、
前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、
0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、
前記計数を前記第2のサーバ装置に対して送信する手段と、を含むことを特徴とする情報処理装置。
【請求項6】
前記情報処理装置は複数存在し、前記第2のサーバ装置は、前記複数の情報処理装置より送信された前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、前記補正計数を前記複数の第1のサーバ装置毎に集計する手段と、を含むことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、前記アクセス総数に基づいて、バイアス値を算出する手段と、前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、前記補正計数を前記第2のサーバ装置に対して送信する手段と、を含む複数の情報処理装置、及び前記第1のサーバ装置と、ネットワークを介して接続されたサーバ装置であって、前記複数の情報処理装置より送信された前記補正計数を、前記複数の第1のサーバ装置毎に集計する手段を含むことを特徴とするサーバ装置。
【請求項8】
第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、前記アクセス総数に基づいて、バイアス値を算出する手段と、前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、前記計数を前記第2のサーバ装置に対して送信する手段と、を含む複数の情報処理装置、及び前記第1のサーバ装置と、ネットワークを介して接続されたサーバ装置であって、前記複数の情報処理装置より送信された前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、前記補正計数を前記複数の第1のサーバ装置毎に集計する手段と、を含むことを特徴とするサーバ装置。
【請求項9】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置の制御方法であって、
前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する工程と、
前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する工程と、
0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数のそれぞれから前記バイアス値を除去し、前記第1のサーバ装置の補正計数を生成する工程と、
前記補正計数を前記第2のサーバ装置に対して送信する工程と、
を含むことを特徴とする制御方法。
【請求項10】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置の制御方法であって、
前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する工程と、
前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する工程と、
0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数を前記第2のサーバ装置に対して送信する工程と、
を含むことを特徴とする制御方法。
【請求項11】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置に実行させるコンピュータにより読み取り可能なプログラムであって、
前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する処理と、
前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する処理と、
0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数のそれぞれから前記バイアス値を除去し、前記第1のサーバ装置の補正計数を生成する処理と、
前記補正計数を前記第2のサーバ装置に対して送信する処理と、
を含むことを特徴とするプログラム。
【請求項12】
第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置に実行させるコンピュータにより読み取り可能なプログラムであって、
前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する処理と、
前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する処理と、
0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数を前記第2のサーバ装置に対して送信する処理と、
を含むことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、サーバ装置、情報処理システム、制御方法、及びプログラムに関する。
【背景技術】
【0002】
ユーザが、インターネットを用いて特定のWebサイト(以下、サービサー装置ともいう。)へアクセスしたときに、当該ユーザに対して特定の識別番号を割り当てて閲覧情報(以下、ページビュー情報ともいう。)を記録するサービサー装置から、そのログ情報を収集して同一の識別番号毎に一連のアクセス状況を示すデータを集計するサーバ装置が存在する。
【0003】
このサーバ装置は、インターネットを介して接続されるサービサー装置にアクセスした際のページビュー情報を格納し、その情報からサービサー装置に対するアクセス情報を作成し、アクセス情報のうち必要なログ情報のみを抽出してデータベースに格納する、そして、そのデータベース上のログ情報を所定の条件で解析し、サービサー装置に対するユーザ毎の一連のページビュー情報を短時間で集計し、視聴率、アンケート結果、個人情報等を統計情報として明らかにすることが可能である。
【0004】
また、いわゆるポータルサイトや電子商取引サイトが、集客のために、パーソナルコンピュータ(以下、PCともいう。)にインストールされるアプリケーションソフトウェアプログラム中にリンクを配置し、当該アプリケーションソフトウェアプログラムのベンダーは、ユーザが当該リンクにアクセスしページビューを行った見返りとして、アフィリエイト収入を得るというビジネスモデルも、近年知られている。
【0005】
そして、ユーザが、当該リンクにアクセスし、ページビューを行う回数、頻度をサイト側で取得することにより、サイト側では、当該ユーザが、如何なる分野のサービスに対して興味、関心を抱いているかを知ることができる利点があると共に、ベンダー側では、当該ユーザのページビューの回数、頻度に応じてアフィリエイト収入を得ることができるという利点がある。このように、ユーザによるサービスに対するアクセス回数は、ベンダーがアフィリエイトを得る上で重要なデータとなる。
【0006】
例えば、ベンダー側で広告等を掲載する場合、特定のジャンルの情報に対する興味を有するユーザ数がどの程度いるか、そのようなジャンルの情報に対するページビュー数がどの程度か、又は平均クリックレートがどの程度か、という点は、広告主から見た掲載判断基準となる。
【0007】
このような状況の下、近年、プライバシ情報流出事件の発生を背景として、ユーザの動向に関する統計情報を収集するサービサー装置では、プライバシ情報流出リスクに伴うプライバシ情報管理負荷を軽減しつつ、プライバシ情報に関係する統計情報の収集を実現したいとの要求が増大している。一方で、直接サービサー装置に対してプライバシ情報を送付することに心理的抵抗を持つユーザも増えている。そのため、ネットワークを介してユーザから送信されるプライバシ情報を保護する技術が開発されてきている。
【0008】
例えば、プライバシ情報の一部を匿名項目として暗号化した上でサーバへ送信する技術がある。すなわち、ユーザのプライバシ情報の集計処理においては、サーバ装置上でプライバシ情報を削除した上で暗号化を行い、解読し集計を行うことにより、ユーザの匿名性を保証する技術である。また、各サービサー装置から発行された計測専用のURL(Uniform Resource Locator)を設定し、当該計測専用のURLにてサービサー装置側で計測を行う技術もある。
【0009】
さらに、サーバ装置からページビュー情報を転送する転送サーバを別途用意し、当該転送サーバ上でページビュー情報をカウントしたり、PC等のクライアント側のプログラム制御によって、必要な情報のみをサーバ装置に送付したりする技術も知られている。
【0010】
特許文献1には、アンケートデータを集計する処理において、プライバシ情報をサーバ側で知ることのない処理をすることを目的として、ユーザがプライバシ情報をサーバによって解読可能な形で登録せずに、ログ情報を収集するサーバ側において、プライバシ情報の内容を知る必要のない集計処理を可能とし、さらに、同一個人に関する複数のプライバシ情報が同時に必要な処理においてもその内容を知ることなく処理できる集計方法が開示されている。具体的には、サービサー装置側でユーザ側から回答されたデータから乱数を加算してサーバに送信して回答内容を攪乱する一方、サーバ側で同じ乱数を減算して攪乱を消去する旨の技術が開示されている。
【先行技術文献】
【特許文献】
【0011】
【特許文献1】特開2006−018053号公報
【発明の概要】
【発明が解決しようとする課題】
【0012】
上記したサービスへのアクセス情報を収集するために、ベンダーが個々のユーザのサービス毎の利用情報を取得し、解析するということも可能ではある。しかしながら、この場合はユーザのプライバシ情報を入手することになるため、厳重な管理を必要とする。したがって、サーバ側の管理コスト等の負荷が増大する恐れがある。
【0013】
特許文献1に開示された方法では、ユーザとベンダー(サーバ)との間の通信路の機密性は高まるが、ベンダー側で結局ユーザのプライバシ情報を入手することになるため、やはり厳重な管理が必要となり、サーバ側の負荷が増大するという課題は依然として残存する。
【0014】
ここで注意すべき点は、個々のユーザのプライバシ情報を必要としているのではなく、実際に必要な情報は、どのサービスのページビュー情報が高いかといった統計的な情報である。しかしながら、従来の手法では、サービサー側と交渉し、統計情報収集のための専用URLを獲得する等、多くの競業相手の協力を必要とする。このような状況の下、既に特定のサーバと契約済みであるサービサー側から見ると、当該特定のサーバと異なるサーバに対して情報を提供するメリットが少なく、統計情報収集のための専用URLを提供する可能性が低いという問題がある。
【0015】
さらに、当該サーバに対して、全てのクライアントからの通信が集中することとなる。そうなると、アプリケーションプログラムのレスポンスの遅延に直結するためサーバ側の負荷が増大し、これを解決するには、大きなサーバを準備するといった投資が必要となる。また、ユーザの各種サービスに対するアクセス情報(ページビュー情報等)を集めることになるため、プライバシ情報の漏洩に対する懸念、及びプライバシ情報保護のための投資が必要になるという課題もある。
【0016】
そこで本発明は、上記従来の問題点に鑑みてなされたもので、個々のユーザのプライバシを侵害することなく、ユーザ総体(全体)として特定情報のカテゴリに対するページビュー情報等のアクセス情報を推定することが可能な情報処理装置、サーバ装置、情報処理システム、制御方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0018】
上記課題を解決するため、請求項
1に記載の本発明における情報処理装置は、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する手段と、前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する手段と、0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数のそれぞれから前記バイアス値を除去し、前記第1のサーバ装置の補正計数を生成する手段と、前記補正計数を前記第2のサーバ装置に対して送信する手段と、を含むことを特徴とする。
【0019】
また、上記課題を解決するため、請求項
2に記載の本発明における情報処理装置は、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、前記第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、前記アクセス総数に基づいて、バイアス値を算出する手段と、前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、前記補正計数を前記第2のサーバ装置に対して送信する手段と、を含むことを特徴とする。
【0020】
さらに、本発明における情報処理装置は、請求項
2に記載の本発明における情報処理装置において、前記情報処理装置は複数存在し、前記第2のサーバ装置は、前記複数の情報処理装置より送信された前記補正計数を前記複数の第1のサーバ装置毎に集計する手段を含むことを特徴とする。
【0021】
また、上記課題を解決するため、請求項
4に記載の本発明における情報処理装置は、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する手段と、前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する手段と、0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数を前記第2のサーバ装置に対して送信する手段と、を含むことを特徴とする。
【0022】
そして、上記課題を解決するため、請求項
5に記載の本発明における情報処理装置は、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、前記第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、前記アクセス総数に基づいて、バイアス値を算出する手段と、前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、前記計数を前記第2のサーバ装置に対して送信する手段と、を含むことを特徴とする。
【0023】
また、本発明における情報処理装置は、請求項
5に記載の情報処理装置において、前記情報処理装置は複数存在し、前記第2のサーバ装置は、前記複数の情報処理装置より送信された前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、前記補正計数を前記複数の第1のサーバ装置毎に集計する手段と、を含むことを特徴とする。
【0024】
さらに、上記課題を解決するため、請求項
7に記載の本発明におけるサーバ装置は、第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、前記アクセス総数に基づいて、バイアス値を算出する手段と、前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、前記補正計数を前記第2のサーバ装置に対して送信する手段と、を含む複数の情報処理装置、及び前記第1のサーバ装置と、ネットワークを介して接続されたサーバ装置であって、前記複数の情報処理装置より送信された前記補正計数を、前記複数の第1のサーバ装置毎に集計する手段を含むことを特徴とする。
【0025】
また、上記課題を解決するため、請求項
8に記載の本発明におけるサーバ装置は、第1のサーバ装置に対するアクセス要求に応答して、複数の前記第1のサーバ装置から提供される情報にアクセスした所定時間内のアクセス数を、前記第1のサーバ装置毎にそれぞれカウントする手段と、前記アクセス数に基づいて、前記複数の第1のサーバ装置に対するアクセス総数を算出する手段と、前記アクセス総数に基づいて、バイアス値を算出する手段と、前記複数の第1のサーバ装置毎のアクセス数に対して前記バイアス値をそれぞれ加算し、補正アクセス数を算出する手段と、前記補正アクセス数に基づいて、前記複数の第1のサーバ装置に対する補正アクセス総数を算出する手段と、0以上前記複数の第1のサーバ装置の総数未満の間で、前記アクセス総数に基づいて決まる個数の乱数を、前記補正アクセス数の累積範囲に対応する前記複数の第1のサーバ装置の何れかに計数として割り当てる手段と、前記計数を前記第2のサーバ装置に対して送信する手段と、を含む複数の情報処理装置、
及び前記第1のサーバ装置と、ネットワークを介して接続されたサーバ装置であって、前記複数の情報処理装置より送信された前記計数のそれぞれから、前記バイアス値を除去し、前記複数の第1のサーバ装置毎の補正計数を生成する手段と、前記補正計数を前記複数の第1のサーバ装置毎に集計する手段と、を含むことを特徴とする。
【0028】
そして、上記課題を解決するために、請求項
9に記載の本発明における制御方法は、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置の制御方法であって、前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する工程と、前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する工程と、0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数のそれぞれから前記バイアス値を除去し、前記第1のサーバ装置の補正計数を生成する工程と、前記補正計数を前記第2のサーバ装置に対して送信する工程と、を含むことを特徴とする。
【0029】
また、上記課題を解決するために、請求項1
0に記載の本発明における制御方法は、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置の制御方法であって、前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する工程と、前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する工程と、0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数を前記第2のサーバ装置に対して送信する工程と、を含むことを特徴とする。
【0031】
さらに、上記課題を解決するために、請求項1
1に記載の本発明におけるプログラムは、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置に実行させるコンピュータにより読み取り可能なプログラムであって、前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する処理と、前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する処理と、0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数のそれぞれから前記バイアス値を除去し、前記第1のサーバ装置の補正計数を生成する処理と、前記補正計数を前記第2のサーバ装置に対して送信する処理と、を含むことを特徴とする。
【0032】
また、上記課題を解決するために、請求項1
2に記載の本発明におけるプログラムは、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置に実行させるコンピュータにより読み取り可能なプログラムであって、前記第1のサーバ装置に対する所定時間内のアクセス総数を算出する処理と、前記第1のサーバ装置に対するアクセス数に、前記アクセス総数に基づいて算出されたバイアス値を加算し、補正アクセス数を算出する処理と、0以上前記第1のサーバ装置の総数未満の個数の乱数を、前記補正アクセス数の累積範囲に対応する前記第1のサーバ装置の何れかに計数として割り当て、前記計数を前記第2のサーバ装置に対して送信する処理と、を含むことを特徴とする。
【発明の効果】
【0033】
本発明によれば、個々のユーザのプライバシを侵害することなく、ユーザ総体(全体)として特定情報のカテゴリに対するページビュー情報等のアクセス情報を推定することが可能な情報処理装置、サーバ装置、情報処理システム、制御方法、及びプログラムが得られる。
【図面の簡単な説明】
【0034】
【
図1】本発明の実施形態における情報処理システムの全体構成を示す構成図である。
【
図2】本発明の実施形態における情報処理装置の全体構成について説明する概略ブロック図である。
【
図3】本発明の実施形態におけるサービサー装置、及びサーバ装置の全体構成について説明する概略ブロック図である。
【
図4】本発明の実施形態における情報処理装置の機能ブロック図である。
【
図5】本発明の実施形態におけるサーバ装置の機能ブロック図である。
【
図6】本発明の他の実施形態における情報処理装置の機能ブロック図である。
【
図7】本発明の他の実施形態におけるサーバ装置の機能ブロック図である。
【
図8】本発明の実施形態における情報処理装置の動作について説明する図(その1)である。
【
図9】本発明の実施形態における情報処理装置の動作について説明する図(その2)について説明する図である。
【
図10】本発明の実施形態における情報処理装置の動作について説明する図(その3)について説明する図である。
【
図11】本発明の実施形態における情報処理システムを用いた場合の具体例について説明する図である。
【発明を実施するための形態】
【0035】
次に、本発明を実施するための形態について図面を参照して詳細に説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化乃至省略する。本発明の内容を簡潔に説明すると、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、第1のサーバ装置に対する所定時間内のアクセス数に対し、所定の演算を施すことにより生成された補正計数を、第2のサーバ装置に対して送信することにより、個々のユーザのプライバシを侵害することなく、ユーザ総体(全体)として特定情報のカテゴリに対するページビュー情報等のアクセス情報を推定することができるのである。
【0036】
まず、
図1を用いて本発明の実施形態における情報処理システムの全体構成について説明する。
図1は、本発明の実施形態における情報処理システムの全体構成を示す構成図である。
図1を参照すると、本発明の実施形態における情報処理システム100は、例えば、パーソナルコンピュータ(PC)を代表とする情報処理装置101は、インターネット等の広く公衆によって接続可能なネットワーク104を介してWebサーバ102(以下、サービサー装置という。)に接続されている。また、PC101は、放送局105から送信される放送波を受信することができるようになっていても良い。なお、情報処理装置101には、PC以外にスマートフォン等の携帯情報端末も含まれることは勿論である。
【0037】
また、サーバ装置103は、サービサー装置102及びPC101と、インターネット等のネットワーク104を介して接続されている。そして、PC101から発せられた任意のWebページに接続したい旨のアクセス要求に対して、複数の分野(カテゴリ)に分類された様々なWebページを有する複数のサービサー装置102の中から、URLで特定されたサービサー装置102から提供されるWebページの閲覧が可能となる。そして、PC101から当該URLに対してアクセスされた旨の閲覧情報(以下、ページビュー情報ともいう。)が、サービサー装置102からサーバ装置103に対してネットワーク104を介して通知される。なお、
図1中には、インターネット等のネットワーク104に対して情報処理装置101が1台のみ接続されているが、情報処理装置101は1台に限定されず、複数台接続されていることはいうまでも無い。
【0038】
次に、本発明の実施形態における情報処理装置の全体構成について説明する。
図2は、本発明の実施形態における情報処理装置の全体構成について説明する概略ブロック図である。PC101は、TVチューナ部201と、ネットワーク接続部205と、CPU(Central Processing Unit)206と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、HDD(Hard Disk Drive)204と、表示部207と、入力部208と、電源部209とから構成される。
【0039】
TVチューナ部201は、放送局105から送信される地上デジタル、BS(Broadcasting Satellite)、及びCS(Communications Satellite)放送をアンテナから受信し復調するものである。ネットワーク接続部205は、インターネットに代表されるネットワーク104に接続され、ネットワーク104とのインタフェースを図るものである。CPU206は、PC101全体の動作を制御するものであり、ROM202に格納された制御プログラムをロードし、PC101の動作によって得られた様々なデータをRAM203に展開するものである。HDD204は、PC101のアプリケーションソフトウェアプログラムを格納したり、TVチューナ部201によって受信されたテレビ番組(以下、コンテンツともいう。)を録画したりするものである。
【0040】
表示部207は、LCD(Liquid Crystal Display)等で構成される表示画面であり、PC101によって実行されたアプリケーションソフトウェアプログラムの結果やTVチューナ部201によって受信されたテレビ番組を表示するものである。入力部208は、キーボード、マウス、タッチパネル等、ユーザがPC101に対して指示を与えるものである。そして、電源部209は、PC101に対してAC(Alternative Current:交流)、又はDC(Direct Current:直流)電源を与えるものである。
【0041】
次に、本発明の実施形態におけるサービサー装置、及びサーバ装置の全体構成について説明する。
図3は、本発明の実施形態におけるサービサー装置、及びサーバ装置の全体構成について説明する概略ブロック図である。サービサー装置102、及びサーバ装置103は、ネットワーク接続部303と、CPU304と、ROM301と、データベース部302と、表示部305と、操作部306と、電源部307とから構成される。
【0042】
ネットワーク接続部303は、インターネットに代表されるネットワーク104に接続され、ネットワーク104とのインタフェースを図るものである。CPU304は、サービサー装置102、又はサーバ装置103全体の動作を制御するものであり、ROM301に格納された制御プログラムをロードし、CPU304の動作によって得られた様々なデータをデータベース部302に展開するものである。表示部305は、LCD等で構成される表示画面であり、サービサー装置102、又はサーバ装置103によってデータベース部302に格納されたデータの格納状況等を表示するものである。操作部306は、キーボード、マウス、タッチパネル等、サービサー装置102、又はサーバ装置103の保守者が、サービサー装置102、又はサーバ装置103に対して指示を与えるものである。そして、電源部307は、サービサー装置102、又はサーバ装置103に対してAC又はDC電源を与えるものである。
【0043】
次に、本発明の実施形態における情報処理装置、及びサーバの動作について
図4、及び
図5を用いて説明する。
図4は、本発明の実施形態における情報処理装置の機能ブロック図であり、
図5は、本発明の実施形態におけるサーバ装置の機能ブロック図である。
【0044】
図4において、サービサー装置102、及びサーバ装置103と、ネットワーク104を介して接続されたPC101は、複数のサービサー装置102の中から、URLで特定された所定のWebページを有するサービサー装置102に対するアクセス要求を送信する。このアクセス要求に応答して、複数の分野(カテゴリ)にそれぞれ分類された情報(Webページ)を有する複数のサービサー装置102の中から、当該特定されたURLに対応するサービサー装置102が選択される。
【0045】
そして、PC101から複数の分野(カテゴリ)にそれぞれ分類された情報(Webページ)を有する複数のサービサー装置102に対してアクセスされた回数が、所定時間内、例えば、100回から1000回あった場合、当該100回から1000回閲覧された複数のWebページのうち、様々な分野(カテゴリ)に分類されるWebページに対するアクセス数401が、それぞれの分野(カテゴリ)毎に何回あったかという情報(ページビュー情報)が、アクセス数カウント部402によってカウントされる。そして、各分野(カテゴリ)毎のアクセス数の総数が、アクセス総数算出部403によって算出される。
【0046】
次に、アクセス総数算出部403によって算出された各分野(カテゴリ)毎のアクセス数の総数に基づいて、バイアス値算出部404によってバイアス値が算出される。このバイアス値としては、後述するように、例えば、アクセス総数の10%として四捨五入された値を、各分野(カテゴリ)の総数で均等割りして求められた値を用いることができる。そして、バイアス値加算部405によって、各分野(カテゴリ)毎のアクセス数に対して、当該求められたバイアス値を加算する処理が行われる。
【0047】
バイアス値加算部405によって加算された各分野(カテゴリ)毎のアクセス数(以下、補正アクセス数という。)の総数が、補正アクセス総数算出部406によって算出される。そして、0以上であり、補正アクセス総数未満、すなわち、サービサー装置102の総数未満の間で、各分野(カテゴリ)の補正アクセス総数に基づいて決まる任意の数字が、乱数生成部407によって生成される。併せて、補正アクセス数累積値算出部412によって、上記算出された補正アクセス数の累積値408が、各分野(カテゴリ)毎に算出される。
【0048】
そして、乱数生成部407によって生成された任意の数字が、補正アクセス数累積値408の範囲に対応する各分野(カテゴリ)を指し示し、各分野(カテゴリ)毎の計数として割り当ててカウントされる。この割り当てられた各分野(カテゴリ)毎の計数のそれぞれから、上記したバイアス値が、バイアス値除去部409によって除去され、補正計数生成部410によって各分野(カテゴリ)毎の補正計数が求められる。そして、この補正計数が、補正計数送信部411によってサーバ装置103に送信される。
【0049】
図5に示すように、サーバ装置103では、PC101から送信された補正計数が補正計数受信部501によって受信され、この補正計数が、補正計数集計部502によって各分野(カテゴリ)毎に集計される。
【0050】
次に、本発明の他の実施形態における情報処理装置及びサーバの動作について
図6、及び
図7を用いて説明する。
図6は、本発明の他の実施形態における情報処理装置の機能ブロック図であり、
図7は、本発明の他の実施形態におけるサーバ装置の機能ブロック図である。
【0051】
図4、及び
図5で説明した動作と異なる点は、補正計数が、PC101ではなく、サーバ装置103で求められる点である。すなわち、
図6に示すように、乱数生成部607によって生成された任意の数字が、補正アクセス数累積値
608の範囲に対応する各分野(カテゴリ)を指し示し、各分野(カテゴリ)毎の計数として割り当ててカウントされる。この割り当てられた各分野(カテゴリ)毎の計数が計数生成部609によって生成された後、計数送信部610によってサーバ装置103に送信される。
【0052】
そして、
図7に示すように、サーバ装置103では、PC101から送信された計数が計数受信部701によって受信され、割り当てらた各分野(カテゴリ)毎の計数から、それぞれ上記したバイアス値が、バイアス値除去部702によって除去され、補正計数生成部703によって各分野(カテゴリ)毎の補正計数が求められる。そして、この補正計数が、補正計数集計部704によって各分野(カテゴリ)毎に集計される。
【0053】
また、上記実施形態における補正計数をサーバ装置103に対して送信するタイミング、又は上記他の実施形態における計数をサーバ装置103に対して送信するタイミングを所定の間隔で間引くことによって、サーバ装置103の負荷を軽減することができる。すなわち、PC101からサーバ装置103に対して補正係数、又は計数を如何なる頻度で送信するかによってサーバ装置103の負荷が軽減される。
【0054】
例えば、PC101からサーバ装置103に対して、補正計数、又は計数を送信する頻度を、等間隔で10回に1度だけとすることによって、サーバ装置103に対してアクセスする頻度が、従来よりも10分の1に減少する。そして、サーバ装置103側で、受信された補正計数、又は計数を10倍すれば、ほぼ元の数値を再現することができる。これは、本発明が、元来誤差を許容しているシステムだからこそできることである。
【0055】
次に、本発明の実施形態における情報処理装置の動作ついて、具体的な数値を用いて説明する。
図8から
図10は、本発明の実施形態における情報処理装置の動作について説明する図である。
【0056】
インターネットにおけるページビュー情報を対象とする度数情報(アクセス数情報)について、所定時間だけバッファリングを実行し、得られた度数情報(アクセス数情報)を、PC101からサーバ装置103に対して送信することにより、サーバ装置103側で度数情報(アクセス数情報)を観測することができる情報処理システムを考える。その際、各カテゴリ(分野)毎に度数情報(アクセス数情報)を、生データのまま送信するのではなく、度数(アクセス数)に応じた確率データを用いて送信用度数である計数を生成し、その送信用度数を送信することとする。
【0057】
このとき、アクセス数がゼロであるカテゴリ(分野)も送信用度数の対象に含まれるよう、全てのカテゴリ(分野)を対象に、総度数(総アクセス数)に応じたバイアス値を加算することによって確率データを求める。これによって、度数(アクセス数)がゼロであるカテゴリ(分類)であっても、低い確率ではあるが、計数値として表れることとなる。このような処理を行うことによって、計数値の有無だけでは、当該カテゴリ(分類)に対するアクセスの有無を特定することができないこととなる。
【0058】
また、サンプル数を大量に増やしてこの計数値を集計すると、多少の誤差は含まれるが、大数の法則によってある程度有効な度数情報(アクセス数情報)としてサーバ装置103は受け取ることができる。例えば、所定の単位時間における5つのカテゴリ(分野)に対する度数(アクセス数)が
図8に示すように、カテゴリ1が度数0、カテゴリ2が度数5、カテゴリ3が度数2、カテゴリ4が度数3、カテゴリ5が度数1で、すべてのカテゴリの総度数(総アクセス数)が11であるとする。
【0059】
ここで、バイアス値αを、総度数(総アクセス数)11の10%である1.1を四捨五入して1(総バイアス数)とし、各カテゴリ(分野)に均等に割り振ると、1/5=0.2となる。そして、このバイアス値α=0.2を、各カテゴリ(分野)の度数(アクセス数)に加算すると、
図9に示すように、5つのカテゴリ(分野)に対する補正度数(補正アクセス数)は、カテゴリ1が補正度数0.2、カテゴリ2が補正度数5.2、カテゴリ3が補正度数2.2、カテゴリ4が補正度数3.2、カテゴリ5が補正度数1.2となる。併せて、各カテゴリ(分野)毎の累積補正度数も算出しておく。
【0060】
カテゴリ5までの累積補正度数が12であるから、0以上12未満、すなわち、0以上でサービサー装置102の総数である12未満の一様な乱数を、カテゴリ5までの総度数分である12個、乱数生成部407、607(
図4、
図6)によって生成し、12個のカテゴリ毎(分野毎)の計数を発生させる。なお、計数の総個数が12個であるのは、上記求めた総バイアス数が1なので、度数総数として加算したためである。
【0061】
生成された乱数が、累積補正度数の範囲に対応するカテゴリ(分野)において、どのカテゴリ(分野)に属するかを当てはめる。すなわち、乱数が0以上0.2未満であればカテゴリ1、0.2以上5.4未満であればカテゴリ2、5.4以上7.6未満であればカテゴリ3、7.6以上10.8未満であればカテゴリ4、10.8以上12.0未満であればカテゴリ5と判断する。例えば、生成された乱数値が、それぞれ、9.25、11.01、6.63、11.13、9.68、10.39、1.47、11.56、8.35、0.12、7.50、4.32であったとすると、これらの乱数は、それぞれカテゴリ4、5、3、5、4、4、2、5、4、1、3、2に対応するので、
図10に示したような計数となる。そして、各カテゴリ毎(各分野毎)に、計数からバイアス値α=0.2を除去することによって補正計数を求め、これをサーバ装置103へ送信する。なお、補正計数の算出は、サーバ装置103側で実行しても良い。
【0062】
補正計数、又は計数を受信したサーバ装置103では、カテゴリ(分野)1に対するアクセス数がゼロである情報、すなわち、分野1に対するページビュー情報が存在しないという情報や、最も度数が高い、すなわち、アクセス情報(ページビュー情報)が最も高いカテゴリ(分野)が2であるという情報の真偽が不明となる。また、サーバ装置103では、カテゴリ(分野)4に対するアクセス数(ページビュー数)も僅かな確率ではあるが、ゼロであるという可能性もある。
【0063】
この補正計数をカテゴリ毎(分野毎)に集計することにより、
図10に示すように誤差情報が消失され、大数の法則によって、サンプル数を大量に増やすことにより、最終的な度数の集計値に略等しい値を得ることができる。また、バイアス値αの値を制御することで、誤差とプライバシ保護との度合いのバランスを制御することができる。
【0064】
最後に、本発明の実施形態における情報処理システムを用いた場合の具体例について、
図11を用いて説明する。
図11は、本発明の実施形態における情報処理システムを用いた場合の具体例について説明する図である。
【0065】
図11は、あるユーザが所定時間内に1000回Webページにアクセスしたときの、閲覧情報(ページビュー情報)をカテゴリ(分野)毎に分類し、上述した補正計数を求め、それぞれのカテゴリ(分野)毎の補正計数の割合をルーレット状に示したものである。そして、このルーレットを矢印方向に回転させ、刺さった矢に対応するカテゴリ(分野)のページビュー情報を、PC101がサーバ装置103に対して送信するものとする。
【0066】
そうすると、当該ユーザのページビュー情報として、ルーレット上の領域面積が大きい順に「旅」に関するページビュー情報、「グルメ」に関するページビュー情報、「家」に関するページビュー情報、及び「車」に関するページビュー情報が、高い確率でサーバ装置103に対して送信され易い傾向にある。その一方で、「コンピュータ」に関するページビュー情報、「スポーツ」に関するページビュー情報も、低い確率ではあるが、サーバ装置103に対して送信される可能性がある。さらに、その他数%に対応する幾つかのカテゴリ(分野)に属するページビュー情報も、実際はユーザによって閲覧された履歴がゼロであるかもしれないが、上記説明した補正計数を用いることによって、ルーレット上は0%ではなく、僅かではあるが領域面積を有することになる。したがって、サーバ装置103には、その他数%に対応する幾つかのカテゴリ(分野)に属するページビュー情報も僅かながらに存在したという情報が送信される。
【0067】
この状態では、サーバ装置103では、送信されたページビュー情報を集計することにより、当該ユーザが如何なるカテゴリ(分野)に対してどれくらいの興味を持っているかという情報を正確に得ることができなくなるが、サンプル数を増加していけば、ある程度の確からしさを得ることができる。これにより、個々のユーザのプライバシ情報を保護しつつ、ユーザ総体(全体)として特定情報のカテゴリに対するページビュー情報をある程度推定することができることになるのである。
【0068】
なお、
図4及び
図6に示した本発明の実施形態における情報処理装置(PC)101を構成する各機能ブロックの各動作は、コンピュータ上のプログラムに実行させることもできる。すなわち、情報処理装置101のCPU206が、ROM202、RAM203等から構成される記憶部に格納されたプログラムをロードし、プログラムの各処理ステップが順次実行されることによって行われる。
【0069】
以上説明してきたように、本発明によれば、第1のサーバ装置、及び第2のサーバ装置と、ネットワークを介して接続された情報処理装置であって、第1のサーバ装置に対する所定時間内のアクセス数に対し、所定の演算を施すことにより生成された補正計数を、第2のサーバ装置に対して送信することにより、個々のユーザのプライバシを侵害することなく、ユーザ総体(全体)として特定情報のカテゴリに対するページビュー情報等のアクセス情報を推定することができるのである。
【0070】
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範囲な趣旨及び範囲から逸脱することなく、これら具体例に様々な修正及び変更が可能である。
【符号の説明】
【0071】
100 情報処理システム
101 情報処理装置(PC)
102 サービサー装置
103 サーバ装置
104 ネットワーク
105 放送局
201 TVチューナ部
202、301 ROM
203 RAM
204 HDD
205、303 ネットワーク接続部
206、304 CPU
207、305 表示部
208 入力部
209、307 電源部
302 データベース部
306 操作部
401、601 アクセス数
402、602 アクセス数カウント部
403、603 アクセス総数算出部
404、604 バイアス値算出部
405、605 バイアス値加算部
406、606 補正アクセス総数算出部
407、607 乱数生成部
408、608 補正アクセス数の累積値
409、702 バイアス値除去部
410、703 補正計数生成部
411 補正計数送信部
412、611 補正アクセス数累積値算出部
501 補正計数受信部
502、704 補正計数集計部
609 計数生成部
610 計数送信部
701 計数受信部