(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-22
(45)【発行日】2023-10-02
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20230925BHJP
G06F 16/906 20190101ALI20230925BHJP
【FI】
G06Q50/10
G06F16/906
(21)【出願番号】P 2021150449
(22)【出願日】2021-09-15
【審査請求日】2022-09-16
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】寺中 元希
(72)【発明者】
【氏名】坪内 孝太
(72)【発明者】
【氏名】山口 修司
【審査官】星野 裕
(56)【参考文献】
【文献】特開2012-22570(JP,A)
【文献】特開2019-20930(JP,A)
【文献】特開2014-6757(JP,A)
【文献】特開2017-68765(JP,A)
【文献】米国特許出願公開第2008/0281809(US,A1)
【文献】米国特許出願公開第2008/0281808(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/906
(57)【特許請求の範囲】
【請求項1】
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成部と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成部と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類部と、
前記分類部による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価部と
を備えることを特徴とする情報処理装置。
【請求項2】
前記評価部は、
前記第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、前記第2リスト情報の信頼性を評価する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記分類部は、
前記センサ情報を用いて特定される前記各ユーザの行動パターンの類似性に基づいて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1又は2に記載の情報処理装置。
【請求項4】
前記分類部は、
複数の前記行動パターンを用いて、前記行動パターンごとに前記各ユーザを複数のクラスタに分類し、
前記評価部は、
複数の前記行動パターンごとに、前記第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、前記第2リスト情報の信頼性を評価する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記分類部は、
前記所定の行動と関連性を有するセンサ情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1~4のいずれか1つに記載の情報処理装置。
【請求項6】
前記分類部は、
前記センサ情報から推定される前記各ユーザに関する情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1~5のいずれか1つに記載の情報処理装置。
【請求項7】
コンピュータが実行する情報処理方法であって、
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成工程と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成工程と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類工程と、
前記分類工程による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価工程と
を含むことを特徴とする情報処理方法。
【請求項8】
コンピュータに、
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成手順と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成手順と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類手順と、
前記分類手順による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価手順と
を実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、インターネット上におけるユーザ行動の予測をする手法が知られている。例えば、特許文献1には、ユーザの行動を従来よりも高い精度で予測することを目的として、インターネット上のユーザの検索クエリの傾向を学習し、学習した検索クエリの傾向とその後のユーザの行動との関連性スコアを算出してモデルを生成し、このモデルを用いて他のユーザの行動を予測する技術が提案されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した技術では、生成した情報を信頼してもよいかどうかの確証を得ることが難しい。たとえば、結果論として有効な成果を上げるモデルが含まれている可能性があり、仮にABテストを行ったとしても、テストの内容に応じて適切ではないモデルが採用されてしまう場合もある。
【0005】
本願は、上記に鑑みてなされたものであって、生成した情報の信頼性を確かめることができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、第1生成部と、第2生成部と、分類部と、評価部とを備える。第1生成部は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部は、シードユーザを含む各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第2リスト情報を生成する。分類部は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部は、分類部による分類結果を用いて、第2リスト情報の信頼性を評価する。
【発明の効果】
【0007】
実施形態の態様の1つによれば、生成した情報の信頼性を確かめることができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る情報処理システムの一例を説明する図である。
【
図2】
図2は、実施形態に係るユーザ分類方法および第2リスト情報評価方法の一例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置の構成例を示す図である。
【
図4】
図4は、実施形態に係る第1リスト情報の概要を示す図である。
【
図5】
図5は、実施形態に係る第2リスト情報の概要を示す図である。
【
図6】
図6は、実施形態に係るセンサ情報の概要を示す図である。
【
図7】
図7は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。
【
図8】
図8は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下に説明する実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下に説明する実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
また、以下の説明において、端末装置10をシードユーザU-1またはユーザU-2と表記して説明する場合がある。すなわち、シードユーザU-1またはユーザU-2を端末装置10と読み替えることができる。また、シードユーザU-1やユーザU-2を「ユーザU」と総称する場合がある。
【0011】
[1.情報処理システム]
図1は、実施形態に係る情報処理システムの一例を説明する図である。
図1に示すように、実施形態に係る情報処理システムSYSは、端末装置10、及び情報処理装置100を有する。なお、情報処理システムSYSは、
図1に示す例に限られず、複数の端末装置10や複数の情報処理装置100を有していてもよい。
【0012】
端末装置10、及び情報処理装置100は、それぞれ有線又は無線によりネットワークN(たとえば、
図3参照)に接続される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網、固定電話網等)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNは、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。端末装置10、及び情報処理装置100は、ネットワークNを通じて、相互に通信できる。
【0013】
図1に示す端末装置10は、検索クエリを用いた各種サービスを利用するユーザUが使用する情報処理装置である。たとえば、端末装置10は、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、PDA(Personal Digital Assistant)などにより実現される。
【0014】
また、端末装置10は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)などの無線通信網や、Bluetooth(登録商標)、無線LAN(Local Area Network)などの近距離無線通信を介してネットワークNに接続できる。
【0015】
また、端末装置10は、各種サービスを利用するための情報を、ウェブブラウザやアプリケーションにより表示できる。なお、端末装置10は、情報の表示処理を実現する制御情報を情報処理装置100などから受け取った場合には、制御情報に従って表示処理を実現する。
【0016】
また、ユーザUは、各種サービスの利用を通じて、情報処理装置100に対し、センサ情報を提供する。センサ情報は、端末装置10に搭載される各種センサにより取得される情報である。たとえば、位置センサにより取得される位置情報や、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される角速度情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などを含み得る。
【0017】
図1に示す情報処理装置100は、検索クエリを用いた各種サービスなどを提供する情報処理装置である。情報処理装置100が提供する各種サービスには、各種アプリケーションに対応するAPI(Application Programming Interface)サービスや、各種オンラインサービスが含まれていてもよい。オンラインサービスとしては、インターネット接続や、検索サービスや、SNS(Social Networking Service)や、電子商取引サービスや、電子決済サービスや、オンラインゲームや、オンラインバンキングサービスや、オンライントレーディングサービスや、宿泊予約サービスや、チケット予約サービスや、動画配信サービスや、音楽配信サービスや、ニュース配信サービスや、地図情報サービスや、ルート検索サービスや、経路案内サービスや、路線情報サービスや、運行情報サービスや、天気情報サービスなどのサービスが該当し得る。
【0018】
また、情報処理装置100は、各種サービスの提供を通じて収集したセンサ情報を用いて、実施形態に係る情報処理を実行する情報処理装置である。情報処理装置100は、典型的にはサーバ装置であるが、メインフレームやワークステーションなどにより実現されてもよい。
【0019】
情報処理装置100がサーバ装置で実現される場合、単独のサーバにより実現されてもよいし、複数のサーバ装置及び複数のストレージ装置が協働して動作するクラウドシステムなどにより実現されてもよい。なお、情報処理装置100は、ユーザUが使用する端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)などのスクリプト言語やCSS(Cascading Style Sheets)などのスタイルシート言語により記述される。なお、情報処理装置100から配信されるアプリケーションそのものを制御情報とみなしてもよい。
【0020】
[2.情報処理]
以下、情報処理システムSYSにおける情報処理の一例を説明する。なお、以下の説明において、実施形態に係る情報処理の対象は、各種サービスを利用するユーザUである。また、以下の説明において、シードユーザU-1の一群を「ユーザ群UG-1」と総称し、シードユーザを含む全てのユーザU-2の一群を「ユーザ群UG-2」と総称する。シードユーザU-1は、「〇〇を買った」、「〇〇に行った」、「〇〇している」といった所定の行動を行ったユーザや、特定の属性(興味嗜好など)を有するユーザなど、特定のユーザコンテキストを有するユーザに該当する。
【0021】
なお、以下に説明する情報処理は、情報処理の対象がユーザUである場合に限られず、商品や、街や、サービスなど、情報を収集可能な対象であれば、どのような対象に対しても適用できる。
【0022】
まず、
図1に示す例において、情報処理装置100は、所定の行動をとった複数のシードユーザU-1からなるユーザ群UG-1を特定する。そして、情報処理装置100は、ユーザ群UG-1に含まれる各シードユーザU-1が入力した検索クエリの共通性に基づいて、各シードユーザU-1が入力した検索クエリと所定の行動との関係性を数値化した第1リスト情報を生成し、記憶する。
【0023】
たとえば、情報処理装置100は、「〇〇を買った」「〇〇に興味がある」という条件(タイトル)を満たすユーザをシードユーザU-1として収集し、シードユーザU-1が入力した検索クエリの共通性に基づいたスコアを付与した第1リスト情報を作成する。具体的には、「眼鏡をかけている」というシードユーザU-1を収集し、検索クエリ:「眼鏡」に「70点」、検索クエリ:「眼鏡ふき」に「50点」、検索クエリ:「リンゴ」にスコア「-50点」といったようなスコアを付与し、検索クエリとスコアとの組である第1リスト情報を作成する。
【0024】
上述したシードユーザU-1の一群であるユーザ群UG-1の特定は、任意の方法を用いて行うことができる。たとえば、情報処理装置100は、購買履歴や利用履歴、位置履歴などの各種の情報に基づいて、想定される行動を行ったユーザをシードユーザU-1であると推定し、ユーザ群UG-1を特定してもよい。具体的には、ある所定の店舗の名称を検索クエリとして入力し、その後、その所定の店舗を実際に訪問した訪問者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、別の例として、イベントの名称を検索クエリとして入力し、その後、そのイベントに実際に参加した参加者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、更に別の例として、ある商品の名称を検索クエリとして入力し、その後、その名称の商品を実際に購入した購入者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、情報処理装置100は、実際に所定の店舗(たとえば、配信済みの広告と対応する店舗)を利用した利用者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、情報処理装置100は、所定の広告やウェブページ、映画や音楽などのコンテンツを視聴した視聴者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。
【0025】
また、情報処理装置100は、第1リストにおける検索クエリのスコアは、以下のような機械学習により生成される行動モデルから求めることができる。たとえば、情報処理装置100は、シードユーザU-1が入力した検索クエリを正例とし、ランダムに選択したシードユーザU-1以外の他のユーザが入力した検索クエリを負例としたときに、正例を入力した際により高い値を出力し、負例を入力した際により低い値を出力するように学習モデルの学習を行う。このとき、学習には任意の手法が採用可能である。たとえば、モデルとしてニューラルネットワークが採用される場合は、バックプロパゲーションなどにより実現可能である。
【0026】
また、情報処理装置100は、シードユーザU1が共通して入力している検索クエリについては、より高い値の数値が出力されるようにモデルを学習してもよい。たとえば、正例となる検索クエリを入力したシードユーザU-1の数が多ければ多い程、より高い値を出力するようにモデルを学習してもよい。また、負例となる検索クエリを入力した他のユーザの数が多い程、より小さい値(負の値)を出力するようにモデルを学習してもよい。そして、情報処理装置100は、各検索クエリと、このような学習モデルに検索クエリを入力した際に出力したスコアとの組のリストを「第1リスト情報」として生成する。すなわち、情報処理装置100は、所定の行動を行ったシードユーザU-1が入力した各検索クエリと、検索クエリの各々に対応する上述のスコア(検索クエリと所定の行動との間の関係性を示すスコア)との組を「第1リスト情報」として生成する。なお、この第1リスト情報は、情報処理装置100により、所定の行動ごとに生成された行動モデルを用いて、それぞれの行動に対応した第1リスト情報が生成される。
【0027】
続いて、情報処理装置100は、ユーザ群UG-2が入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザU-2との関係性を数値化し、数値化した関係性を示す値に基づいて、各ユーザU-2を順位付けした第2リスト情報を生成し、記憶する。
【0028】
たとえば、情報処理装置100は、シードユーザU-1を含むユーザ群UG-2から各ユーザU-2を選定し、選定した各ユーザU-2が入力した検索クエリと対応付けられたスコアを第1リスト情報から特定する。なお、情報処理装置100は、ユーザ群UG-2に含まれる各ユーザU-2を無作為に選定してもよいし、所定の条件に基づいて選定してもよい。そして、情報処理装置100は、特定したスコアの合計から、シードユーザU-1を収集する際の条件として設定した所定の行動と、各ユーザU-2との間の関係性を示す第2リスト情報を導出する。たとえば、第2リスト情報において、所定の行動と関係性が高いユーザU-2はスコアが高く、所定の行動と関係性が低いユーザU-2はスコアが低くなる。
【0029】
以下、情報処理装置100による第2リスト情報の生成について具体的に説明する。シードユーザU-1を含む各ユーザU-2が入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第1リスト情報から取得し、取得したスコアの合計値を算出する。このようにすれば、各ユーザU-2が入力した複数の検索クエリと所定の行動との関係性を数値として表すことができるため、単一の検索クエリの数値化と比較してより信頼性の高い数値化を実現できる。
【0030】
次に、情報処理装置100は、各ユーザU-2についてスコアの合計値を計算した後、スコアの高い順に各ユーザU-2を順位付けするとともに、順位順に各ユーザU-2が入力した検索クエリを対応付けた第2リスト情報を生成する。この第2リスト情報は、どのような検索クエリを入力したユーザU-2が、所定の行動との関連性が強いかを示すリストとして機能する。この第2リスト情報は、検索クエリと所定の行動との関連性の分析や、ユーザU-2の分析などに用いられる。なお、この第2リストは、シードユーザU-1を選定する際に設定される行動(たとえば、「〇〇を買った」、「〇〇に行った」、「〇〇している」など)といった所定の行動ごとに作成される。
【0031】
上述した第2リスト情報を用いることにより、ユーザU-2が興味を有する可能性が高い情報の提供を実現できると考えられる。たとえば、ある店舗を訪問したという行動と対応する第2リスト情報には、その行動と関連性が高いユーザU-2のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第2リスト情報を用いることにより、ランキングの順位が高いユーザU-2に対し、その店舗に関する広告を提供することで、広告効果を向上させることができると考えられる。また、ある商品を購入したという行動と対応する第2リスト情報には、その行動と関連性が高いユーザU-2のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第2リスト情報を用いることにより、ランキングの順位が高いユーザU-2に対し、その商品またはその商品と関連する商品に関する広告を提供することで、広告効果を向上させることができると考えられる。
【0032】
一方、上述した第2リスト情報について、ユーザU-2の行動を正確に反映したリストであるかどうかの確証を得ることは難しい。すなわち、スコアに基づいてユーザU-2を順位付けした際に、果たしてどの順位までのユーザU-2が所定の行動との関係性を有するのかという点について、実際には定かではない。たとえば、スコアが高いほど、所定の行動を取る可能性が高いという推測が働くが、スコアがどの程度高ければ所定の行動と関連性が高いのかを見極めることは難しい。また、スコアの高さと、所定の行動との関係性の高さとの相関関係の検証も十分とは言い切れない。
【0033】
そこで、実施形態に係る情報処理装置100は、以下に説明する情報処理により、第2リスト情報の信頼性を確かめるための情報処理方法を提案する。
【0034】
まず、情報処理装置100は、信頼性の評価を行う第2リスト情報を選定するための所定の行動を設定する(ステップS1)。次に、情報処理装置100は、ユーザ群UG-2から収集されるセンサ情報の共通性に基づいて、第2リスト情報内の各ユーザU-2を分類する(ステップS2)。以下、
図2を用いて、ユーザ分類方法および第2リスト情報評価方法の一例について説明する。
図2は、実施形態に係るユーザ分類方法および第2リスト情報評価方法の一例を示す図である。なお、
図2に示す第2リスト情報内に順位付けされたユーザの数は一例であり、
図2に示す例よりも多くのユーザが含まれていてもよい。
【0035】
まず、情報処理装置100は、第2リスト情報LT(
図2参照)内において、スコア順位が1位であるユーザU-2(以下、「参照ユーザ」と称する。)に対応するセンサ情報#EX-1を取得する。次に、情報処理装置100は、取得したセンサ情報#EX-1を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンXを特定する。
【0036】
続いて、情報処理装置100は、第2リストLTに列挙された参照ユーザ以外の他のユーザU-2(以下、「比較ユーザ」と称する。)について、センサ情報#EX-1に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報を用いて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。
【0037】
以下、情報処理装置100による行動パターンの特定方法について一例を説明する。たとえば、情報処理装置100は、センサ情報EX-1として、位置履歴とSNSなどのメッセージ送信履歴を取得する。また、情報処理装置100は、位置履歴の中から、所定時間以上滞在していた位置を特定する。また、情報処理装置100は、特定した位置の記録日時に対応する送信メッセージがあるかメッセージ送信履歴内を検索する。そして、情報処理装置100は、所定時間以上滞在していた位置と、メッセージの内容とを突き合わせて、たとえば、送信メッセージが「ハンバーガー美味しい」という内容であれば、所定時間滞在していた位置に対応するエリアのハンバーガーショップに位置したと推定する。このようにして、情報処理装置100は、位置履歴とメッセージ送信履歴とに基づいて特定した行動を1つずつ繋ぎ合わせていくことにより、参照ユーザの時系列の行動パターンを特定できる。なお、情報処理装置100は、比較ユーザについても同様に行動パターンを特定できる。
【0038】
そして、情報処理装置100は、参照ユーザの行動パターンXと、比較ユーザの行動パターンとをそれぞれ比較し、行動パターンの類似性(比較ユーザの行動パターンが行動パターンXに類似するかどうか)に基づいて、クラスタリングを行う。たとえば、
図2に示すように、情報処理装置100は、行動パターンが行動パターンXに類似する比較ユーザをクラスタX-1に振り分け、行動パターンが行動パターンXに類似しない比較ユーザをクラスタX-2に振り分ける。
【0039】
そして、情報処理装置100は、所定の行動に紐づく各ユーザU-2の分類結果に基づいて、第2リスト情報LTの信頼性を評価する。たとえば、情報処理装置100は、第2リスト情報LTにおける所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報LTの信頼性を評価する。なお、第2リスト情報LTにおける所定の順位層は、情報処理装置100のオペレータが任意に設定できる。
【0040】
具体的には、情報処理装置100は、第2リスト情報LTにおいて、スコア順位が1位~10位までの順位層に位置する各ユーザU-2が、クラスタX-1に振り分けられる割合である振分率を算出する。次に、たとえば、情報処理装置100は、算出した振分率が、予め規定される信頼性判定閾値以上であると判定した場合、第2リスト情報LTにおいて、スコア順位が1位~10位までの順位層に位置する各ユーザU-2と、所定の行動との関連性について信頼性ありとする判定結果を導出する。
【0041】
図2に示す例では、信頼性判定閾値が含有率90%に設定されており、スコア順位が1位~10位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が90%である場合が示されている。このため、情報処理装置100は、第2リスト情報LTの1位~10位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性ありとする判定結果を導出することになる。
【0042】
一方、
図2に示す例では、スコア順位が11位~20位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が60%である場合が示されている。このため、情報処理装置100は、第2リスト情報LTの11位~20位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性なしとする判定結果を導出することになる。
【0043】
また、情報処理装置100は、複数の行動パターンを用いて、行動パターンごとに各ユーザU-2を複数のクラスタに分類してもよい。そして、情報処理装置100は、複数の行動パターンごとに、第2リスト情報LTにおいて所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報LTの信頼性を評価してもよい。
【0044】
たとえば、
図2に示すように、情報処理装置100は、参照ユーザから取得したセンサ情報#EX-2を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンXとは別の行動パターンYをさらに特定する。
【0045】
続いて、情報処理装置100は、比較ユーザについて、センサ情報#EX-2に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報に基づいて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。
【0046】
続いて、情報処理装置100は、行動パターンXの場合と同様に、参照ユーザの行動パターンYと、比較ユーザの行動パターンとをそれぞれ照合し、行動パターンの類似性に基づいて、クラスタリングを行う。たとえば、
図2に示すように、情報処理装置100は、行動パターンが行動パターンYに類似する比較ユーザをクラスタY-1に振り分け、行動パターンが行動パターンYに類似しない比較ユーザをクラスタY-2に振り分ける。
【0047】
そして、情報処理装置100は、行動パターンXおよび行動パターンYのそれぞれについて、第2リスト情報LTにおいて所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報LTの信頼性を評価する。
【0048】
図2に示す例では、スコア順位が1位~10位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が90%であり、また、クラスタY-1に振り分けられる割合が90%である場合が示されている。この場合、情報処理装置100は、行動パターンXおよび行動パターンYの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしているので、第2リスト情報LTの1位~10位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性ありとする判定結果を導出する。
【0049】
一方、
図2に示す例では、スコア順位が11位~20位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が60%であり、また、クラスタY-1に振り分けられる割合が80%である場合が示されている。この場合、情報処理装置100は、行動パターンXおよび行動パターンYの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしていないので、第2リスト情報LTの11位~20位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性なしとする判定結果を導出する。
【0050】
なお、情報処理装置100は、参照ユーザの行動パターンと、比較ユーザの行動パターンの類似性に基づいて、第2リスト情報の各ユーザU-2を分類する場合に限られない。たとえば、情報処理装置100は、各順位層に位置する各ユーザU-2の行動パターンを、各ユーザU-2に対応するセンサ情報に基づいて個別に特定する。そして、情報処理装置100は、特定した各行動パターンを総当たりで比較し、各行動パターンが相互に類似している各ユーザU-2を同一のクラスタに分類してもよい。この場合、情報処理装置100は、各クラスタに含まれる順位がまとまるように、分類時のパラメータを自動的に設定してもよい。たとえば、情報処理装置100は、各クラスタに分類される順位の数(すなわち、ユーザの数)が所定の下限閾値を下回る場合には、行動パターン間の類似性を判定するための閾値をより低い値に再調整する。また、情報処理装置100は、各クラスタに分類される順位の数(すなわち、ユーザの数)が所定の上限閾値を上回る場合には、行動パターン間の類似性を判定するための閾値をより高い値に再調整する。
【0051】
また、情報処理装置100は、センサ情報を用いて特定される行動パターンの類似性に基づいて、各ユーザU-2を複数のクラスタに分類する場合に限られず、センサ情報そのものの共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。たとえば、情報処理装置100は、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される傾きの情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などの共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。
【0052】
また、情報処理装置100は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。たとえば、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に撮影された画像情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。また、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に記録された音情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。また、情報処理装置100は、行動パターンを特定する際、所定の行動と関連性を有するセンサ情報を用いてもよい。つまり、情報処理装置100は、所定の行動と関連性を有するセンサ情報を用いて特定した行動パターンの類似性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。
【0053】
また、情報処理装置100は、センサ情報から推定される各ユーザU-2に関する情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。センサ情報から推定される情報の一例について説明すると、たとえば、情報処理装置100は、加速度情報や角速度情報から推定される動作状態の情報や、音情報から抽出した環境音から推定される環境(場所)の情報や、気圧情報から推定される天候や高度の情報などが想定される。情報処理装置100は、これらの情報の共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。
【0054】
なお、情報処理装置100は、第2リスト情報の信頼性の評価結果を示す情報をオペレータに対して視認可能に提供してもよい。このとき、情報処理装置100は、第2リスト情報に含まれる各ユーザU-2の分類に用いたセンサ情報や、センサ情報に基づく行動パターンの情報を合わせて提供できる。
【0055】
[3.情報処理装置の構成]
図3を用いて、実施形態に係る情報処理装置100の構成について説明する。
図3は、実施形態に係る情報処理装置の構成例を示す図である。
【0056】
図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを備える。なお、
図3は、情報処理装置100の構成例を示すものであり、
図3に示す形態には限られず、
図3に示す以外の他の機能部を備える形態であってもよい。
【0057】
(通信部110)
通信部110は、例えば、ネットワークNと有線または無線で接続され、ネットワークNを介して、端末装置10などの他の装置との間で情報の送受信を行う。通信部110は、例えば、NIC(Network Interface Card)やアンテナなどによって実現される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網や固定電話網など)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
【0058】
通信部110は、端末装置10から、撮影画像などの情報を受信する。また、通信部110は、提案情報を端末装置10に送信する。
【0059】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリなどの半導体メモリ素子、または、ハードディスクや光ディスクなどの記憶装置によって実現される。記憶部120は、制御部130の各部により実行される情報処理を実現するためのプログラム及びデータを記憶する。
【0060】
図3に示すように、記憶部120は、第1リスト情報記憶部121と、第2リスト情報記憶部122と、ユーザ情報記憶部123とを有する。
【0061】
(第1リスト情報記憶部121)
第1リスト情報記憶部121には、第1リスト情報が任意の形式で記憶されている。第1リスト情報は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した情報である。
図4は、実施形態に係る第1リスト情報の概要を示す図である。
【0062】
図4に示すように、第1リスト情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。第1リスト情報は、「検索クエリ」の項目と、「スコア」の項目とを有する。第1リスト情報が有するこれらの項目は、相互に対応付けられている。
【0063】
「検索クエリ」の項目には、所定の行動を行ったシードユーザにより入力された検索クエリの情報が記憶される。また、「スコア」の項目には、検索クエリと所定の行動との間の関係性を示すスコアの情報が記憶される。
【0064】
(第2リスト情報記憶部122)
第2リスト情報記憶部122には、第2リスト情報が任意の形式で記憶されている。第2リスト情報は、シードユーザ以外の各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした情報である。
図5は、実施形態に係る第2リスト情報の概要を示す図である。
【0065】
図5に示すように、第2リスト情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。また、
図5に示すように、第2リスト情報は、「順位」の項目と、「ユーザID」の項目と、「検索クエリ」の項目とを有する。第2リスト情報が有するこれらの項目は相互に対応付けられている。
【0066】
「順位」の項目には、シードユーザ以外のユーザが入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第1リスト情報から取得し、取得したスコアの合計値により順位付けを行った順位の情報が記憶される。
【0067】
「ユーザID」には、各種サービスの提供に際して、各種サービスを利用するユーザを識別するために、情報処理装置100によりユーザごとに個別に付与される識別情報が記憶される。なお、
図5に示す例に限られず、「ユーザID」の項目には、順位が同じ複数のユーザIDが記憶され得る。
【0068】
「検索クエリ」の項目には、「ユーザID」の項目に記憶されている識別情報に紐づく各ユーザが入力した検索クエリの情報が記憶される。
【0069】
(ユーザ情報記憶部123)
ユーザ情報記憶部123には、各ユーザから提供されるセンサ情報などのユーザ情報が任意の形式で記憶されている。
図6は、実施形態に係るユーザ情報の概要を示す図である。
【0070】
図6に示すように、ユーザ情報は、「ユーザID」の項目や、「センサ情報」の項目などを有する。
【0071】
「ユーザID」の項目には、センサ情報の提供元であるユーザに付与されている識別情報が記憶される。「ユーザID」の項目に記憶される識別情報は、
図5に例示する第2リスト情報において「ユーザID」の項目に記憶される識別情報に対応する。
【0072】
「センサ情報」の項目には、各ユーザから提供されるセンサ情報が記憶される。なお、「センサ情報」の項目に記憶されるセンサ情報は、各ユーザから提供された生データであってもよいし、正規化などの処理を施して処理しやすいように加工した情報であってもよい。
【0073】
なお、ユーザ情報記憶部123は、「ユーザID」の項目などに対応付けて、センサ情報から推定される情報を記憶してもよい。
【0074】
(制御部130)
図3に示す制御部130は、情報処理装置100を制御するコントローラ(controller)である。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、GPU(Graphics Processing Unit)などによって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(例えば、情報処理プログラム)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現されてもよい。
【0075】
図3に示すように、制御部130は、第1生成部131と、第2生成部132と、分類部133と、評価部134とを有する。制御部130は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各部の接続関係は、
図3に示した接続関係に限られず、他の接続関係であってもよい。
【0076】
(第1生成部131)
第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。
【0077】
(第2生成部132)
第2生成部132は、シードユーザ以外の各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値(スコア)に基づいて各ユーザを順位付けした第2リスト情報を生成する。
【0078】
(分類部133)
分類部133は、各ユーザのセンサ情報の共通性に基づいて、所定の行動に紐づく各ユーザを複数のクラスタに分類する。たとえば、分類部133は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、センサ情報から推定される各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類できる。
【0079】
(評価部134)
評価部134は、分類部133による分類結果を用いて、第2リスト情報の信頼性を評価する。たとえば、評価部134は、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報の信頼性を評価できる。
【0080】
また、評価部134は、分類部133により、複数の行動パターンを用いて行動パターンごとに各ユーザが複数のクラスタに分類された場合、複数の行動パターンごとに、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報の信頼性を評価できる。
【0081】
[4.処理手順]
以下、
図7を用いて、実施形態に係る情報処理装置100による処理手順について説明する。
図7は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。
図7に示す処理手順は、情報処理装置100の制御部130により実行される。
図7に示す処理手順は、情報処理装置100の稼働中、繰り返し実行される。
【0082】
図7に示すように、分類部133は、オペレータの操作に応じて、所定の行動を設定する(ステップS101)。
【0083】
続いて、分類部133は、ステップS101で設定した所定の行動に関する第2リスト情報を第2リスト情報記憶部122から取得するとともに、ステップS101で設定した所定の行動に関するセンサ情報をユーザ情報記憶部123から取得する(ステップS102)。
【0084】
続いて、分類部133は、ステップS102で取得したセンサ情報の共通性に基づいて、ステップS102で取得した第2リスト情報内の各ユーザを複数のクラスタに分類する(ステップS103)。
【0085】
そして、評価部134は、分類部133による分類結果に基づいて、第2リスト情報の信頼性を評価して(ステップS104)、
図7に示す処理手順を終了する。
【0086】
[5.変形例]
上述した情報処理装置100は、上述した実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。
【0087】
(5-1.第1リスト情報および第2リスト情報について)
上述した実施形態において、情報処理装置100は、複数の所定の行動それぞれについて第1リスト情報および第2リスト情報を生成する例を説明したが、この例には特に限定される必要はない。たとえば、情報処理装置100は、ターゲットとするユーザの行動以外のコンテキスト(たとえば、デモグラフィック属性や興味嗜好など)に基づいて、第1リスト情報および第2リスト情報を作成してもよい。
【0088】
(5-2.クラスタの構成ユーザについて)
上述の実施形態において、情報処理装置100は、分類部133により分類されたクラスタの情報、たとえば、クラスタの構成ユーザの情報を記録してもよい。そして、所定のタイミングで、情報処理装置100は、第1リスト情報および第2リスト情報を更新し、更新した第2リスト情報に基づいて各ユーザのクラスタを作成して、作成したクラスタの構成ユーザと、記録済みのクラスタの構成ユーザとの間に大幅な変化がないかどうかを確かめてもよい。また、情報処理装置100は、クラスタの構成ユーザにシードユーザが含まれているかどうかを確かめてもよい。
【0089】
[6.ハードウェア構成]
実施形態に係る情報処理装置100は、たとえば、
図8に示すような構成のコンピュータ1000によって実現される。
図8は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【0090】
コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0091】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
【0092】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェイスであり、例えば、USB等により実現される。
【0093】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0094】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0095】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0096】
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)を実行することにより、制御部130と同様の機能を実現する。すなわち、演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)との協働により、実施形態に係る情報処理装置100による処理を実現する。
【0097】
[7.その他]
上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0098】
上述の実施形態において、情報処理装置100による情報処理方法(たとえば、
図7参照)を実現するために、情報処理装置100が有する制御部130の各部(第1生成部131、第2生成部132、分類部133、及び評価部134)に対応する処理機能は、情報処理装置100に予めインストールされている情報処理プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の提供プログラムとして柔軟に記述することにより実現されてもよい。
【0099】
また、情報処理装置100は、各ユーザの情報として、各ユーザが入力した検索クエリの履歴だけでなく、各ユーザの購買履歴、電子商店街で閲覧した取引対象の履歴、購入した取引対象の履歴である購買履歴、閲覧したニュース等のコンテンツの履歴である閲覧履歴、SNS(Social Networking Service)に投稿したテキストや画像等の履歴である投稿履歴、位置履歴などを収集してもよい。また、情報処理装置100は、たとえば、各ユーザが保有するスマートフォンを用いて店舗に設置されたQRコード(登録商標)を読み取り、読み取り結果を用いて実現する決済サービスの利用履歴や、各ユーザが保有するスマートフォンにQRコードを表示させ、かかるQRコードを店舗端末が読み込むことで行われる決済サービスの利用履歴(たとえば、購入日時や購入商品、購入額など)を収集してもよい。また、情報処理装置100は、各ユーザが保有するクレジットカードの利用履歴や銀行口座の利用履歴などを収集してもよい。
【0100】
また、情報処理装置100は、収集した情報に基づいて推定された情報を各ユーザの情報としてもよい。たとえば、情報処理装置100は、購買履歴から、毎月の食料品の平均的な購入総額が10万円以上である場合、たとえば、世帯月収若しくは個人月収が30万円以上であるといった収入や、3人家族であるといった家族構成、もしくは同居人構成などを推定し、各ユーザの情報としてもよい。また、情報処理装置100は、たとえば、位置履歴や購入履歴から、各ユーザが所有する物品や、各ユーザの居住地や職場などを推定し、推定した情報を各ユーザの情報としてもよい。
【0101】
また、情報処理装置100は、たとえば、各種サービスを提供するサーバ装置から、サービスの利用履歴を各ユーザの情報として取得してもよい。また、情報処理装置100は、このようなサービスを提供するサーバ装置もしくは単独のサーバ装置が、サービスの利用履歴から推定した各種情報を各ユーザの情報として収集してもよい。また、情報処理装置100は、各ユーザが登録、又は各ユーザについて推定された各種のジオグラフィック属性や趣味嗜好といったサイコグラフィック属性を示す情報を各ユーザの情報として収集してもよい。
【0102】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部130の分類部133と評価部134とは機能的に統合されていてもよい。
【0103】
また、上述の実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0104】
[8.効果]
上述の実施形態に係る情報処理装置100は、第1生成部131と、第2生成部132と、分類部133と、評価部134とを備える。第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部132は、シードユーザを含む各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第2リスト情報を生成する。分類部133は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部134は、分類部133による分類結果を用いて、第2リスト情報の信頼性を評価する。
【0105】
このようなことから、実施形態に係る情報処理装置100は、たとえば、第2リスト情報に含まれる各ユーザを検索クエリとは無関係のセンサ情報に基づいてクラスタリングすることにより、第2リスト情報に含まれる各ユーザが一定の関連性を有するかを客観的に確かめることができ、第2リスト情報の信頼性を間接的に評価できる。
【0106】
また、実施形態に係る情報処理装置100において、評価部134は、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置100は、たとえば、第2リスト情報において、どの順位までのユーザが所定の行動との関係性を有するのかについて確かめることができる。
【0107】
また、実施形態に係る情報処理装置100において、分類部133は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類する。これにより、実施形態に係る情報処理装置100は、各ユーザの具体的な行動内容が類似する各ユーザを同一のクラスタに分類できる。
【0108】
また、実施形態に係る情報処理装置100において、分類部133は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類し、評価部134は、複数の行動パターンごとに、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置100は、信頼性の評価精度を高めることができる。
【0109】
また、実施形態に係る情報処理装置100において、分類部133は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類する。
【0110】
また、実施形態に係る情報処理装置100において、分類部133は、センサ情報から推定される前記各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類する。
【0111】
これらにより、実施形態に係る情報処理装置100は、様々な基準で各ユーザを分類できる。
【0112】
以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0113】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。
【符号の説明】
【0114】
10 端末装置
100 情報処理装置
110 通信部
120 記憶部
121 第1リスト情報記憶部
122 第2リスト情報記憶部
123 ユーザ情報記憶部
130 制御部
131 第1生成部
132 第2生成部
133 分類部
134 評価部