特許7354195 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ヤフー株式会社の特許一覧

特許7354195情報処理装置、情報処理方法、及び情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-09-22

(45)【発行日】2023-10-02

(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム

(51)【国際特許分類】

G06Q 50/10 20120101AFI20230925BHJP

G06F 16/906 20190101ALI20230925BHJP

【ＦＩ】

G06Q50/10

G06F16/906

【請求項の数】 8

(21)【出願番号】P 2021150449

(22)【出願日】2021-09-15

(65)【公開番号】P2023042995

(43)【公開日】2023-03-28

【審査請求日】2022-09-16

(73)【特許権者】

【識別番号】319013263

【氏名又は名称】ヤフー株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】寺中元希

(72)【発明者】

【氏名】坪内孝太

(72)【発明者】

【氏名】山口修司

【審査官】星野裕

(56)【参考文献】

【文献】特開２０１２－２２５７０（ＪＰ，Ａ）

【文献】特開２０１９－２０９３０（ＪＰ，Ａ）

【文献】特開２０１４－６７５７（ＪＰ，Ａ）

【文献】特開２０１７－６８７６５（ＪＰ，Ａ）

【文献】米国特許出願公開第２００８／０２８１８０９（ＵＳ，Ａ１）

【文献】米国特許出願公開第２００８／０２８１８０８（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

Ｇ０６Ｆ１６／９０６

(57)【特許請求の範囲】

【請求項1】

所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第１リスト情報を生成する第１生成部と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第１リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第２リスト情報を生成する第２生成部と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類部と、
前記分類部による分類結果を用いて、前記第２リスト情報の信頼性を評価する評価部と
を備えることを特徴とする情報処理装置。

【請求項2】

前記評価部は、
前記第２リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、前記第２リスト情報の信頼性を評価する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記分類部は、
前記センサ情報を用いて特定される前記各ユーザの行動パターンの類似性に基づいて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項１又は２に記載の情報処理装置。

【請求項4】

前記分類部は、
複数の前記行動パターンを用いて、前記行動パターンごとに前記各ユーザを複数のクラスタに分類し、
前記評価部は、
複数の前記行動パターンごとに、前記第２リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、前記第２リスト情報の信頼性を評価する
ことを特徴とする請求項３に記載の情報処理装置。

【請求項5】

前記分類部は、
前記所定の行動と関連性を有するセンサ情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項１～４のいずれか１つに記載の情報処理装置。

【請求項6】

前記分類部は、
前記センサ情報から推定される前記各ユーザに関する情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項１～５のいずれか１つに記載の情報処理装置。

【請求項7】

コンピュータが実行する情報処理方法であって、
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第１リスト情報を生成する第１生成工程と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第１リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第２リスト情報を生成する第２生成工程と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類工程と、
前記分類工程による分類結果を用いて、前記第２リスト情報の信頼性を評価する評価工程と
を含むことを特徴とする情報処理方法。

【請求項8】

コンピュータに、
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第１リスト情報を生成する第１生成手順と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第１リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第２リスト情報を生成する第２生成手順と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類手順と、
前記分類手順による分類結果を用いて、前記第２リスト情報の信頼性を評価する評価手順と
を実行させることを特徴とする情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。

【背景技術】

【0002】

従来、インターネット上におけるユーザ行動の予測をする手法が知られている。例えば、特許文献１には、ユーザの行動を従来よりも高い精度で予測することを目的として、インターネット上のユーザの検索クエリの傾向を学習し、学習した検索クエリの傾向とその後のユーザの行動との関連性スコアを算出してモデルを生成し、このモデルを用いて他のユーザの行動を予測する技術が提案されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１６－１７７３７７号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、上述した技術では、生成した情報を信頼してもよいかどうかの確証を得ることが難しい。たとえば、結果論として有効な成果を上げるモデルが含まれている可能性があり、仮にＡＢテストを行ったとしても、テストの内容に応じて適切ではないモデルが採用されてしまう場合もある。

【0005】

本願は、上記に鑑みてなされたものであって、生成した情報の信頼性を確かめることができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本願に係る情報処理装置は、第１生成部と、第２生成部と、分類部と、評価部とを備える。第１生成部は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第１リスト情報を生成する。第２生成部は、シードユーザを含む各ユーザが入力した検索クエリと、第１リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第２リスト情報を生成する。分類部は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部は、分類部による分類結果を用いて、第２リスト情報の信頼性を評価する。

【発明の効果】

【0007】

実施形態の態様の１つによれば、生成した情報の信頼性を確かめることができる。

【図面の簡単な説明】

【0008】

【図1】図１は、実施形態に係る情報処理システムの一例を説明する図である。

【図2】図２は、実施形態に係るユーザ分類方法および第２リスト情報評価方法の一例を示す図である。

【図3】図３は、実施形態に係る情報処理装置の構成例を示す図である。

【図4】図４は、実施形態に係る第１リスト情報の概要を示す図である。

【図5】図５は、実施形態に係る第２リスト情報の概要を示す図である。

【図6】図６は、実施形態に係るセンサ情報の概要を示す図である。

【図7】図７は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。

【図8】図８は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

【発明を実施するための形態】

【0009】

以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、以下に説明する実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下に説明する実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

【0010】

また、以下の説明において、端末装置１０をシードユーザＵ－１またはユーザＵ－２と表記して説明する場合がある。すなわち、シードユーザＵ－１またはユーザＵ－２を端末装置１０と読み替えることができる。また、シードユーザＵ－１やユーザＵ－２を「ユーザＵ」と総称する場合がある。

【0011】

［１．情報処理システム］
図１は、実施形態に係る情報処理システムの一例を説明する図である。図１に示すように、実施形態に係る情報処理システムＳＹＳは、端末装置１０、及び情報処理装置１００を有する。なお、情報処理システムＳＹＳは、図１に示す例に限られず、複数の端末装置１０や複数の情報処理装置１００を有していてもよい。

【0012】

端末装置１０、及び情報処理装置１００は、それぞれ有線又は無線によりネットワークＮ（たとえば、図３参照）に接続される。ネットワークＮは、ＬＡＮ（Local Area Network）や、ＷＡＮ（Wide Area Network）や、電話網（携帯電話網、固定電話網等）や、地域ＩＰ（Internet Protocol）網や、インターネットなどの通信ネットワークである。ネットワークＮは、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。端末装置１０、及び情報処理装置１００は、ネットワークＮを通じて、相互に通信できる。

【0013】

図１に示す端末装置１０は、検索クエリを用いた各種サービスを利用するユーザＵが使用する情報処理装置である。たとえば、端末装置１０は、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、ＰＤＡ（Personal Digital Assistant）などにより実現される。

【0014】

また、端末装置１０は、ＬＴＥ（Long Term Evolution）、４Ｇ（4th Generation）、５Ｇ（5th Generation：第５世代移動通信システム）などの無線通信網や、Ｂｌｕｅｔｏｏｔｈ（登録商標）、無線ＬＡＮ（Local Area Network）などの近距離無線通信を介してネットワークＮに接続できる。

【0015】

また、端末装置１０は、各種サービスを利用するための情報を、ウェブブラウザやアプリケーションにより表示できる。なお、端末装置１０は、情報の表示処理を実現する制御情報を情報処理装置１００などから受け取った場合には、制御情報に従って表示処理を実現する。

【0016】

また、ユーザＵは、各種サービスの利用を通じて、情報処理装置１００に対し、センサ情報を提供する。センサ情報は、端末装置１０に搭載される各種センサにより取得される情報である。たとえば、位置センサにより取得される位置情報や、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される角速度情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などを含み得る。

【0017】

図１に示す情報処理装置１００は、検索クエリを用いた各種サービスなどを提供する情報処理装置である。情報処理装置１００が提供する各種サービスには、各種アプリケーションに対応するＡＰＩ（Application Programming Interface）サービスや、各種オンラインサービスが含まれていてもよい。オンラインサービスとしては、インターネット接続や、検索サービスや、ＳＮＳ（Social Networking Service）や、電子商取引サービスや、電子決済サービスや、オンラインゲームや、オンラインバンキングサービスや、オンライントレーディングサービスや、宿泊予約サービスや、チケット予約サービスや、動画配信サービスや、音楽配信サービスや、ニュース配信サービスや、地図情報サービスや、ルート検索サービスや、経路案内サービスや、路線情報サービスや、運行情報サービスや、天気情報サービスなどのサービスが該当し得る。

【0018】

また、情報処理装置１００は、各種サービスの提供を通じて収集したセンサ情報を用いて、実施形態に係る情報処理を実行する情報処理装置である。情報処理装置１００は、典型的にはサーバ装置であるが、メインフレームやワークステーションなどにより実現されてもよい。

【0019】

情報処理装置１００がサーバ装置で実現される場合、単独のサーバにより実現されてもよいし、複数のサーバ装置及び複数のストレージ装置が協働して動作するクラウドシステムなどにより実現されてもよい。なお、情報処理装置１００は、ユーザＵが使用する端末装置１０に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、ＪａｖａＳｃｒｉｐｔ（登録商標）などのスクリプト言語やＣＳＳ（Cascading Style Sheets）などのスタイルシート言語により記述される。なお、情報処理装置１００から配信されるアプリケーションそのものを制御情報とみなしてもよい。

【0020】

［２．情報処理］
以下、情報処理システムＳＹＳにおける情報処理の一例を説明する。なお、以下の説明において、実施形態に係る情報処理の対象は、各種サービスを利用するユーザＵである。また、以下の説明において、シードユーザＵ－１の一群を「ユーザ群ＵＧ－１」と総称し、シードユーザを含む全てのユーザＵ－２の一群を「ユーザ群ＵＧ－２」と総称する。シードユーザＵ－１は、「〇〇を買った」、「〇〇に行った」、「〇〇している」といった所定の行動を行ったユーザや、特定の属性（興味嗜好など）を有するユーザなど、特定のユーザコンテキストを有するユーザに該当する。

【0021】

なお、以下に説明する情報処理は、情報処理の対象がユーザＵである場合に限られず、商品や、街や、サービスなど、情報を収集可能な対象であれば、どのような対象に対しても適用できる。

【0022】

まず、図１に示す例において、情報処理装置１００は、所定の行動をとった複数のシードユーザＵ－１からなるユーザ群ＵＧ－１を特定する。そして、情報処理装置１００は、ユーザ群ＵＧ－１に含まれる各シードユーザＵ－１が入力した検索クエリの共通性に基づいて、各シードユーザＵ－１が入力した検索クエリと所定の行動との関係性を数値化した第１リスト情報を生成し、記憶する。

【0023】

たとえば、情報処理装置１００は、「〇〇を買った」「〇〇に興味がある」という条件（タイトル）を満たすユーザをシードユーザＵ－１として収集し、シードユーザＵ－１が入力した検索クエリの共通性に基づいたスコアを付与した第１リスト情報を作成する。具体的には、「眼鏡をかけている」というシードユーザＵ－１を収集し、検索クエリ：「眼鏡」に「７０点」、検索クエリ：「眼鏡ふき」に「５０点」、検索クエリ：「リンゴ」にスコア「－５０点」といったようなスコアを付与し、検索クエリとスコアとの組である第１リスト情報を作成する。

【0024】

上述したシードユーザＵ－１の一群であるユーザ群ＵＧ－１の特定は、任意の方法を用いて行うことができる。たとえば、情報処理装置１００は、購買履歴や利用履歴、位置履歴などの各種の情報に基づいて、想定される行動を行ったユーザをシードユーザＵ－１であると推定し、ユーザ群ＵＧ－１を特定してもよい。具体的には、ある所定の店舗の名称を検索クエリとして入力し、その後、その所定の店舗を実際に訪問した訪問者（シードユーザＵ－１）を推定することによりユーザ群ＵＧ－１を特定してもよい。また、別の例として、イベントの名称を検索クエリとして入力し、その後、そのイベントに実際に参加した参加者（シードユーザＵ－１）を推定することによりユーザ群ＵＧ－１を特定してもよい。また、更に別の例として、ある商品の名称を検索クエリとして入力し、その後、その名称の商品を実際に購入した購入者（シードユーザＵ－１）を推定することによりユーザ群ＵＧ－１を特定してもよい。また、情報処理装置１００は、実際に所定の店舗（たとえば、配信済みの広告と対応する店舗）を利用した利用者（シードユーザＵ－１）を推定することによりユーザ群ＵＧ－１を特定してもよい。また、情報処理装置１００は、所定の広告やウェブページ、映画や音楽などのコンテンツを視聴した視聴者（シードユーザＵ－１）を推定することによりユーザ群ＵＧ－１を特定してもよい。

【0025】

また、情報処理装置１００は、第１リストにおける検索クエリのスコアは、以下のような機械学習により生成される行動モデルから求めることができる。たとえば、情報処理装置１００は、シードユーザＵ－１が入力した検索クエリを正例とし、ランダムに選択したシードユーザＵ－１以外の他のユーザが入力した検索クエリを負例としたときに、正例を入力した際により高い値を出力し、負例を入力した際により低い値を出力するように学習モデルの学習を行う。このとき、学習には任意の手法が採用可能である。たとえば、モデルとしてニューラルネットワークが採用される場合は、バックプロパゲーションなどにより実現可能である。

【0026】

また、情報処理装置１００は、シードユーザＵ１が共通して入力している検索クエリについては、より高い値の数値が出力されるようにモデルを学習してもよい。たとえば、正例となる検索クエリを入力したシードユーザＵ－１の数が多ければ多い程、より高い値を出力するようにモデルを学習してもよい。また、負例となる検索クエリを入力した他のユーザの数が多い程、より小さい値（負の値）を出力するようにモデルを学習してもよい。そして、情報処理装置１００は、各検索クエリと、このような学習モデルに検索クエリを入力した際に出力したスコアとの組のリストを「第１リスト情報」として生成する。すなわち、情報処理装置１００は、所定の行動を行ったシードユーザＵ－１が入力した各検索クエリと、検索クエリの各々に対応する上述のスコア（検索クエリと所定の行動との間の関係性を示すスコア）との組を「第１リスト情報」として生成する。なお、この第１リスト情報は、情報処理装置１００により、所定の行動ごとに生成された行動モデルを用いて、それぞれの行動に対応した第１リスト情報が生成される。

【0027】

続いて、情報処理装置１００は、ユーザ群ＵＧ－２が入力した検索クエリと、第１リスト情報とに基づいて、所定の行動と各ユーザＵ－２との関係性を数値化し、数値化した関係性を示す値に基づいて、各ユーザＵ－２を順位付けした第２リスト情報を生成し、記憶する。

【0028】

たとえば、情報処理装置１００は、シードユーザＵ－１を含むユーザ群ＵＧ－２から各ユーザＵ－２を選定し、選定した各ユーザＵ－２が入力した検索クエリと対応付けられたスコアを第１リスト情報から特定する。なお、情報処理装置１００は、ユーザ群ＵＧ－２に含まれる各ユーザＵ－２を無作為に選定してもよいし、所定の条件に基づいて選定してもよい。そして、情報処理装置１００は、特定したスコアの合計から、シードユーザＵ－１を収集する際の条件として設定した所定の行動と、各ユーザＵ－２との間の関係性を示す第２リスト情報を導出する。たとえば、第２リスト情報において、所定の行動と関係性が高いユーザＵ－２はスコアが高く、所定の行動と関係性が低いユーザＵ－２はスコアが低くなる。

【0029】

以下、情報処理装置１００による第２リスト情報の生成について具体的に説明する。シードユーザＵ－１を含む各ユーザＵ－２が入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第１リスト情報から取得し、取得したスコアの合計値を算出する。このようにすれば、各ユーザＵ－２が入力した複数の検索クエリと所定の行動との関係性を数値として表すことができるため、単一の検索クエリの数値化と比較してより信頼性の高い数値化を実現できる。

【0030】

次に、情報処理装置１００は、各ユーザＵ－２についてスコアの合計値を計算した後、スコアの高い順に各ユーザＵ－２を順位付けするとともに、順位順に各ユーザＵ－２が入力した検索クエリを対応付けた第２リスト情報を生成する。この第２リスト情報は、どのような検索クエリを入力したユーザＵ－２が、所定の行動との関連性が強いかを示すリストとして機能する。この第２リスト情報は、検索クエリと所定の行動との関連性の分析や、ユーザＵ－２の分析などに用いられる。なお、この第２リストは、シードユーザＵ－１を選定する際に設定される行動（たとえば、「〇〇を買った」、「〇〇に行った」、「〇〇している」など）といった所定の行動ごとに作成される。

【0031】

上述した第２リスト情報を用いることにより、ユーザＵ－２が興味を有する可能性が高い情報の提供を実現できると考えられる。たとえば、ある店舗を訪問したという行動と対応する第２リスト情報には、その行動と関連性が高いユーザＵ－２のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第２リスト情報を用いることにより、ランキングの順位が高いユーザＵ－２に対し、その店舗に関する広告を提供することで、広告効果を向上させることができると考えられる。また、ある商品を購入したという行動と対応する第２リスト情報には、その行動と関連性が高いユーザＵ－２のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第２リスト情報を用いることにより、ランキングの順位が高いユーザＵ－２に対し、その商品またはその商品と関連する商品に関する広告を提供することで、広告効果を向上させることができると考えられる。

【0032】

一方、上述した第２リスト情報について、ユーザＵ－２の行動を正確に反映したリストであるかどうかの確証を得ることは難しい。すなわち、スコアに基づいてユーザＵ－２を順位付けした際に、果たしてどの順位までのユーザＵ－２が所定の行動との関係性を有するのかという点について、実際には定かではない。たとえば、スコアが高いほど、所定の行動を取る可能性が高いという推測が働くが、スコアがどの程度高ければ所定の行動と関連性が高いのかを見極めることは難しい。また、スコアの高さと、所定の行動との関係性の高さとの相関関係の検証も十分とは言い切れない。

【0033】

そこで、実施形態に係る情報処理装置１００は、以下に説明する情報処理により、第２リスト情報の信頼性を確かめるための情報処理方法を提案する。

【0034】

まず、情報処理装置１００は、信頼性の評価を行う第２リスト情報を選定するための所定の行動を設定する（ステップＳ１）。次に、情報処理装置１００は、ユーザ群ＵＧ－２から収集されるセンサ情報の共通性に基づいて、第２リスト情報内の各ユーザＵ－２を分類する（ステップＳ２）。以下、図２を用いて、ユーザ分類方法および第２リスト情報評価方法の一例について説明する。図２は、実施形態に係るユーザ分類方法および第２リスト情報評価方法の一例を示す図である。なお、図２に示す第２リスト情報内に順位付けされたユーザの数は一例であり、図２に示す例よりも多くのユーザが含まれていてもよい。

【0035】

まず、情報処理装置１００は、第２リスト情報ＬＴ（図２参照）内において、スコア順位が１位であるユーザＵ－２（以下、「参照ユーザ」と称する。）に対応するセンサ情報＃ＥＸ－１を取得する。次に、情報処理装置１００は、取得したセンサ情報＃ＥＸ－１を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンＸを特定する。

【0036】

続いて、情報処理装置１００は、第２リストＬＴに列挙された参照ユーザ以外の他のユーザＵ－２（以下、「比較ユーザ」と称する。）について、センサ情報＃ＥＸ－１に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報を用いて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。

【0037】

以下、情報処理装置１００による行動パターンの特定方法について一例を説明する。たとえば、情報処理装置１００は、センサ情報ＥＸ－１として、位置履歴とＳＮＳなどのメッセージ送信履歴を取得する。また、情報処理装置１００は、位置履歴の中から、所定時間以上滞在していた位置を特定する。また、情報処理装置１００は、特定した位置の記録日時に対応する送信メッセージがあるかメッセージ送信履歴内を検索する。そして、情報処理装置１００は、所定時間以上滞在していた位置と、メッセージの内容とを突き合わせて、たとえば、送信メッセージが「ハンバーガー美味しい」という内容であれば、所定時間滞在していた位置に対応するエリアのハンバーガーショップに位置したと推定する。このようにして、情報処理装置１００は、位置履歴とメッセージ送信履歴とに基づいて特定した行動を１つずつ繋ぎ合わせていくことにより、参照ユーザの時系列の行動パターンを特定できる。なお、情報処理装置１００は、比較ユーザについても同様に行動パターンを特定できる。

【0038】

そして、情報処理装置１００は、参照ユーザの行動パターンＸと、比較ユーザの行動パターンとをそれぞれ比較し、行動パターンの類似性（比較ユーザの行動パターンが行動パターンＸに類似するかどうか）に基づいて、クラスタリングを行う。たとえば、図２に示すように、情報処理装置１００は、行動パターンが行動パターンＸに類似する比較ユーザをクラスタＸ－１に振り分け、行動パターンが行動パターンＸに類似しない比較ユーザをクラスタＸ－２に振り分ける。

【0039】

そして、情報処理装置１００は、所定の行動に紐づく各ユーザＵ－２の分類結果に基づいて、第２リスト情報ＬＴの信頼性を評価する。たとえば、情報処理装置１００は、第２リスト情報ＬＴにおける所定の順位層に位置する各ユーザＵ－２が同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第２リスト情報ＬＴの信頼性を評価する。なお、第２リスト情報ＬＴにおける所定の順位層は、情報処理装置１００のオペレータが任意に設定できる。

【0040】

具体的には、情報処理装置１００は、第２リスト情報ＬＴにおいて、スコア順位が１位～１０位までの順位層に位置する各ユーザＵ－２が、クラスタＸ－１に振り分けられる割合である振分率を算出する。次に、たとえば、情報処理装置１００は、算出した振分率が、予め規定される信頼性判定閾値以上であると判定した場合、第２リスト情報ＬＴにおいて、スコア順位が１位～１０位までの順位層に位置する各ユーザＵ－２と、所定の行動との関連性について信頼性ありとする判定結果を導出する。

【0041】

図２に示す例では、信頼性判定閾値が含有率９０％に設定されており、スコア順位が１位～１０位までの順位層に位置する各ユーザＵ－２がクラスタＸ－１に振り分けられる割合（振分率）が９０％である場合が示されている。このため、情報処理装置１００は、第２リスト情報ＬＴの１位～１０位までの順位層に位置する各ユーザＵ－２と所定の行動との関連性について、信頼性ありとする判定結果を導出することになる。

【0042】

一方、図２に示す例では、スコア順位が１１位～２０位までの順位層に位置する各ユーザＵ－２がクラスタＸ－１に振り分けられる割合（振分率）が６０％である場合が示されている。このため、情報処理装置１００は、第２リスト情報ＬＴの１１位～２０位までの順位層に位置する各ユーザＵ－２と所定の行動との関連性について、信頼性なしとする判定結果を導出することになる。

【0043】

また、情報処理装置１００は、複数の行動パターンを用いて、行動パターンごとに各ユーザＵ－２を複数のクラスタに分類してもよい。そして、情報処理装置１００は、複数の行動パターンごとに、第２リスト情報ＬＴにおいて所定の順位層に位置する各ユーザＵ－２が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第２リスト情報ＬＴの信頼性を評価してもよい。

【0044】

たとえば、図２に示すように、情報処理装置１００は、参照ユーザから取得したセンサ情報＃ＥＸ－２を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンＸとは別の行動パターンＹをさらに特定する。

【0045】

続いて、情報処理装置１００は、比較ユーザについて、センサ情報＃ＥＸ－２に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報に基づいて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。

【0046】

続いて、情報処理装置１００は、行動パターンＸの場合と同様に、参照ユーザの行動パターンＹと、比較ユーザの行動パターンとをそれぞれ照合し、行動パターンの類似性に基づいて、クラスタリングを行う。たとえば、図２に示すように、情報処理装置１００は、行動パターンが行動パターンＹに類似する比較ユーザをクラスタＹ－１に振り分け、行動パターンが行動パターンＹに類似しない比較ユーザをクラスタＹ－２に振り分ける。

【0047】

そして、情報処理装置１００は、行動パターンＸおよび行動パターンＹのそれぞれについて、第２リスト情報ＬＴにおいて所定の順位層に位置する各ユーザＵ－２が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第２リスト情報ＬＴの信頼性を評価する。

【0048】

図２に示す例では、スコア順位が１位～１０位までの順位層に位置する各ユーザＵ－２がクラスタＸ－１に振り分けられる割合（振分率）が９０％であり、また、クラスタＹ－１に振り分けられる割合が９０％である場合が示されている。この場合、情報処理装置１００は、行動パターンＸおよび行動パターンＹの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしているので、第２リスト情報ＬＴの１位～１０位までの順位層に位置する各ユーザＵ－２と所定の行動との関連性について、信頼性ありとする判定結果を導出する。

【0049】

一方、図２に示す例では、スコア順位が１１位～２０位までの順位層に位置する各ユーザＵ－２がクラスタＸ－１に振り分けられる割合（振分率）が６０％であり、また、クラスタＹ－１に振り分けられる割合が８０％である場合が示されている。この場合、情報処理装置１００は、行動パターンＸおよび行動パターンＹの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしていないので、第２リスト情報ＬＴの１１位～２０位までの順位層に位置する各ユーザＵ－２と所定の行動との関連性について、信頼性なしとする判定結果を導出する。

【0050】

なお、情報処理装置１００は、参照ユーザの行動パターンと、比較ユーザの行動パターンの類似性に基づいて、第２リスト情報の各ユーザＵ－２を分類する場合に限られない。たとえば、情報処理装置１００は、各順位層に位置する各ユーザＵ－２の行動パターンを、各ユーザＵ－２に対応するセンサ情報に基づいて個別に特定する。そして、情報処理装置１００は、特定した各行動パターンを総当たりで比較し、各行動パターンが相互に類似している各ユーザＵ－２を同一のクラスタに分類してもよい。この場合、情報処理装置１００は、各クラスタに含まれる順位がまとまるように、分類時のパラメータを自動的に設定してもよい。たとえば、情報処理装置１００は、各クラスタに分類される順位の数（すなわち、ユーザの数）が所定の下限閾値を下回る場合には、行動パターン間の類似性を判定するための閾値をより低い値に再調整する。また、情報処理装置１００は、各クラスタに分類される順位の数（すなわち、ユーザの数）が所定の上限閾値を上回る場合には、行動パターン間の類似性を判定するための閾値をより高い値に再調整する。

【0051】

また、情報処理装置１００は、センサ情報を用いて特定される行動パターンの類似性に基づいて、各ユーザＵ－２を複数のクラスタに分類する場合に限られず、センサ情報そのものの共通性に基づいて、各ユーザＵ－２を複数のクラスタに分類してもよい。たとえば、情報処理装置１００は、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される傾きの情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などの共通性に基づいて、各ユーザＵ－２を複数のクラスタに分類してもよい。

【0052】

また、情報処理装置１００は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザＵ－２を複数のクラスタに分類してもよい。たとえば、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に撮影された画像情報を用いて、各ユーザＵ－２を複数のクラスタに分類してもよい。また、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に記録された音情報を用いて、各ユーザＵ－２を複数のクラスタに分類してもよい。また、情報処理装置１００は、行動パターンを特定する際、所定の行動と関連性を有するセンサ情報を用いてもよい。つまり、情報処理装置１００は、所定の行動と関連性を有するセンサ情報を用いて特定した行動パターンの類似性に基づいて、各ユーザＵ－２を複数のクラスタに分類してもよい。

【0053】

また、情報処理装置１００は、センサ情報から推定される各ユーザＵ－２に関する情報を用いて、各ユーザＵ－２を複数のクラスタに分類してもよい。センサ情報から推定される情報の一例について説明すると、たとえば、情報処理装置１００は、加速度情報や角速度情報から推定される動作状態の情報や、音情報から抽出した環境音から推定される環境（場所）の情報や、気圧情報から推定される天候や高度の情報などが想定される。情報処理装置１００は、これらの情報の共通性に基づいて、各ユーザＵ－２を複数のクラスタに分類してもよい。

【0054】

なお、情報処理装置１００は、第２リスト情報の信頼性の評価結果を示す情報をオペレータに対して視認可能に提供してもよい。このとき、情報処理装置１００は、第２リスト情報に含まれる各ユーザＵ－２の分類に用いたセンサ情報や、センサ情報に基づく行動パターンの情報を合わせて提供できる。

【0055】

［３．情報処理装置の構成］
図３を用いて、実施形態に係る情報処理装置１００の構成について説明する。図３は、実施形態に係る情報処理装置の構成例を示す図である。

【0056】

図３に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを備える。なお、図３は、情報処理装置１００の構成例を示すものであり、図３に示す形態には限られず、図３に示す以外の他の機能部を備える形態であってもよい。

【0057】

（通信部１１０）
通信部１１０は、例えば、ネットワークＮと有線または無線で接続され、ネットワークＮを介して、端末装置１０などの他の装置との間で情報の送受信を行う。通信部１１０は、例えば、ＮＩＣ（Network Interface Card）やアンテナなどによって実現される。ネットワークＮは、ＬＡＮ（Local Area Network）や、ＷＡＮ（Wide Area Network）や、電話網（携帯電話網や固定電話網など）や、地域ＩＰ（Internet Protocol）網や、インターネットなどの通信ネットワークである。ネットワークＮには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。

【0058】

通信部１１０は、端末装置１０から、撮影画像などの情報を受信する。また、通信部１１０は、提案情報を端末装置１０に送信する。

【0059】

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリなどの半導体メモリ素子、または、ハードディスクや光ディスクなどの記憶装置によって実現される。記憶部１２０は、制御部１３０の各部により実行される情報処理を実現するためのプログラム及びデータを記憶する。

【0060】

図３に示すように、記憶部１２０は、第１リスト情報記憶部１２１と、第２リスト情報記憶部１２２と、ユーザ情報記憶部１２３とを有する。

【0061】

（第１リスト情報記憶部１２１）
第１リスト情報記憶部１２１には、第１リスト情報が任意の形式で記憶されている。第１リスト情報は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した情報である。図４は、実施形態に係る第１リスト情報の概要を示す図である。

【0062】

図４に示すように、第１リスト情報は、第１リスト情報の作成時に予め設定される所定の行動ごとに設けられる。第１リスト情報は、「検索クエリ」の項目と、「スコア」の項目とを有する。第１リスト情報が有するこれらの項目は、相互に対応付けられている。

【0063】

「検索クエリ」の項目には、所定の行動を行ったシードユーザにより入力された検索クエリの情報が記憶される。また、「スコア」の項目には、検索クエリと所定の行動との間の関係性を示すスコアの情報が記憶される。

【0064】

（第２リスト情報記憶部１２２）
第２リスト情報記憶部１２２には、第２リスト情報が任意の形式で記憶されている。第２リスト情報は、シードユーザ以外の各ユーザが入力した検索クエリと、第１リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした情報である。図５は、実施形態に係る第２リスト情報の概要を示す図である。

【0065】

図５に示すように、第２リスト情報は、第１リスト情報の作成時に予め設定される所定の行動ごとに設けられる。また、図５に示すように、第２リスト情報は、「順位」の項目と、「ユーザＩＤ」の項目と、「検索クエリ」の項目とを有する。第２リスト情報が有するこれらの項目は相互に対応付けられている。

【0066】

「順位」の項目には、シードユーザ以外のユーザが入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第１リスト情報から取得し、取得したスコアの合計値により順位付けを行った順位の情報が記憶される。

【0067】

「ユーザＩＤ」には、各種サービスの提供に際して、各種サービスを利用するユーザを識別するために、情報処理装置１００によりユーザごとに個別に付与される識別情報が記憶される。なお、図５に示す例に限られず、「ユーザＩＤ」の項目には、順位が同じ複数のユーザＩＤが記憶され得る。

【0068】

「検索クエリ」の項目には、「ユーザＩＤ」の項目に記憶されている識別情報に紐づく各ユーザが入力した検索クエリの情報が記憶される。

【0069】

（ユーザ情報記憶部１２３）
ユーザ情報記憶部１２３には、各ユーザから提供されるセンサ情報などのユーザ情報が任意の形式で記憶されている。図６は、実施形態に係るユーザ情報の概要を示す図である。

【0070】

図６に示すように、ユーザ情報は、「ユーザＩＤ」の項目や、「センサ情報」の項目などを有する。

【0071】

「ユーザＩＤ」の項目には、センサ情報の提供元であるユーザに付与されている識別情報が記憶される。「ユーザＩＤ」の項目に記憶される識別情報は、図５に例示する第２リスト情報において「ユーザＩＤ」の項目に記憶される識別情報に対応する。

【0072】

「センサ情報」の項目には、各ユーザから提供されるセンサ情報が記憶される。なお、「センサ情報」の項目に記憶されるセンサ情報は、各ユーザから提供された生データであってもよいし、正規化などの処理を施して処理しやすいように加工した情報であってもよい。

【0073】

なお、ユーザ情報記憶部１２３は、「ユーザＩＤ」の項目などに対応付けて、センサ情報から推定される情報を記憶してもよい。

【0074】

（制御部１３０）
図３に示す制御部１３０は、情報処理装置１００を制御するコントローラ（controller）である。制御部１３０は、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）などによって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（例えば、情報処理プログラム）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの集積回路により実現されてもよい。

【0075】

図３に示すように、制御部１３０は、第１生成部１３１と、第２生成部１３２と、分類部１３３と、評価部１３４とを有する。制御部１３０は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各部の接続関係は、図３に示した接続関係に限られず、他の接続関係であってもよい。

【0076】

（第１生成部１３１）
第１生成部１３１は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第１リスト情報を生成する。

【0077】

（第２生成部１３２）
第２生成部１３２は、シードユーザ以外の各ユーザが入力した検索クエリと、第１リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値（スコア）に基づいて各ユーザを順位付けした第２リスト情報を生成する。

【0078】

（分類部１３３）
分類部１３３は、各ユーザのセンサ情報の共通性に基づいて、所定の行動に紐づく各ユーザを複数のクラスタに分類する。たとえば、分類部１３３は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部１３３は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類できる。また、たとえば、分類部１３３は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部１３３は、センサ情報から推定される各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類できる。

【0079】

（評価部１３４）
評価部１３４は、分類部１３３による分類結果を用いて、第２リスト情報の信頼性を評価する。たとえば、評価部１３４は、第２リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第２リスト情報の信頼性を評価できる。

【0080】

また、評価部１３４は、分類部１３３により、複数の行動パターンを用いて行動パターンごとに各ユーザが複数のクラスタに分類された場合、複数の行動パターンごとに、第２リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第２リスト情報の信頼性を評価できる。

【0081】

［４．処理手順］
以下、図７を用いて、実施形態に係る情報処理装置１００による処理手順について説明する。図７は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。図７に示す処理手順は、情報処理装置１００の制御部１３０により実行される。図７に示す処理手順は、情報処理装置１００の稼働中、繰り返し実行される。

【0082】

図７に示すように、分類部１３３は、オペレータの操作に応じて、所定の行動を設定する（ステップＳ１０１）。

【0083】

続いて、分類部１３３は、ステップＳ１０１で設定した所定の行動に関する第２リスト情報を第２リスト情報記憶部１２２から取得するとともに、ステップＳ１０１で設定した所定の行動に関するセンサ情報をユーザ情報記憶部１２３から取得する（ステップＳ１０２）。

【0084】

続いて、分類部１３３は、ステップＳ１０２で取得したセンサ情報の共通性に基づいて、ステップＳ１０２で取得した第２リスト情報内の各ユーザを複数のクラスタに分類する（ステップＳ１０３）。

【0085】

そして、評価部１３４は、分類部１３３による分類結果に基づいて、第２リスト情報の信頼性を評価して（ステップＳ１０４）、図７に示す処理手順を終了する。

【0086】

［５．変形例］
上述した情報処理装置１００は、上述した実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。

【0087】

（５－１．第１リスト情報および第２リスト情報について）
上述した実施形態において、情報処理装置１００は、複数の所定の行動それぞれについて第１リスト情報および第２リスト情報を生成する例を説明したが、この例には特に限定される必要はない。たとえば、情報処理装置１００は、ターゲットとするユーザの行動以外のコンテキスト（たとえば、デモグラフィック属性や興味嗜好など）に基づいて、第１リスト情報および第２リスト情報を作成してもよい。

【0088】

（５－２．クラスタの構成ユーザについて）
上述の実施形態において、情報処理装置１００は、分類部１３３により分類されたクラスタの情報、たとえば、クラスタの構成ユーザの情報を記録してもよい。そして、所定のタイミングで、情報処理装置１００は、第１リスト情報および第２リスト情報を更新し、更新した第２リスト情報に基づいて各ユーザのクラスタを作成して、作成したクラスタの構成ユーザと、記録済みのクラスタの構成ユーザとの間に大幅な変化がないかどうかを確かめてもよい。また、情報処理装置１００は、クラスタの構成ユーザにシードユーザが含まれているかどうかを確かめてもよい。

【0089】

［６．ハードウェア構成］
実施形態に係る情報処理装置１００は、たとえば、図８に示すような構成のコンピュータ１０００によって実現される。図８は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

【0090】

コンピュータ１０００は、出力装置１０１０、入力装置１０２０と接続され、演算装置１０３０、一次記憶装置１０４０、二次記憶装置１０５０、出力ＩＦ（Interface）１０６０、入力ＩＦ１０７０、ネットワークＩＦ１０８０がバス１０９０により接続された形態を有する。

【0091】

演算装置１０３０は、一次記憶装置１０４０や二次記憶装置１０５０に格納されたプログラムや入力装置１０２０から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置１０４０は、ＲＡＭ等、演算装置１０３０が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置１０５０は、演算装置１０３０が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ＲＯＭ(Read Only Memory)、ＨＤＤ、フラッシュメモリ等により実現される。

【0092】

出力ＩＦ１０６０は、モニタやプリンタといった各種の情報を出力する出力装置１０１０に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、ＵＳＢ（Universal Serial Bus）やＤＶＩ（Digital Visual Interface）、ＨＤＭＩ（登録商標）（High Definition Multimedia Interface）といった規格のコネクタにより実現される。また、入力ＩＦ１０７０は、マウス、キーボード、およびスキャナ等といった各種の入力装置１０２０から情報を受信するためのインターフェイスであり、例えば、ＵＳＢ等により実現される。

【0093】

なお、入力装置１０２０は、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置１０２０は、ＵＳＢメモリ等の外付け記憶媒体であってもよい。

【0094】

ネットワークＩＦ１０８０は、ネットワークＮを介して他の機器からデータを受信して演算装置１０３０へ送り、また、ネットワークＮを介して演算装置１０３０が生成したデータを他の機器へ送信する。

【0095】

演算装置１０３０は、出力ＩＦ１０６０や入力ＩＦ１０７０を介して、出力装置１０１０や入力装置１０２０の制御を行う。例えば、演算装置１０３０は、入力装置１０２０や二次記憶装置１０５０からプログラムを一次記憶装置１０４０上にロードし、ロードしたプログラムを実行する。

【0096】

例えば、コンピュータ１０００が情報処理装置１００として機能する場合、コンピュータ１０００の演算装置１０３０は、一次記憶装置１０４０上にロードされたプログラム（たとえば、情報処理プログラム）を実行することにより、制御部１３０と同様の機能を実現する。すなわち、演算装置１０３０は、一次記憶装置１０４０上にロードされたプログラム（たとえば、情報処理プログラム）との協働により、実施形態に係る情報処理装置１００による処理を実現する。

【0097】

［７．その他］
上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

【0098】

上述の実施形態において、情報処理装置１００による情報処理方法（たとえば、図７参照）を実現するために、情報処理装置１００が有する制御部１３０の各部（第１生成部１３１、第２生成部１３２、分類部１３３、及び評価部１３４）に対応する処理機能は、情報処理装置１００に予めインストールされている情報処理プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の提供プログラムとして柔軟に記述することにより実現されてもよい。

【0099】

また、情報処理装置１００は、各ユーザの情報として、各ユーザが入力した検索クエリの履歴だけでなく、各ユーザの購買履歴、電子商店街で閲覧した取引対象の履歴、購入した取引対象の履歴である購買履歴、閲覧したニュース等のコンテンツの履歴である閲覧履歴、ＳＮＳ（Social Networking Service）に投稿したテキストや画像等の履歴である投稿履歴、位置履歴などを収集してもよい。また、情報処理装置１００は、たとえば、各ユーザが保有するスマートフォンを用いて店舗に設置されたＱＲコード（登録商標）を読み取り、読み取り結果を用いて実現する決済サービスの利用履歴や、各ユーザが保有するスマートフォンにＱＲコードを表示させ、かかるＱＲコードを店舗端末が読み込むことで行われる決済サービスの利用履歴（たとえば、購入日時や購入商品、購入額など）を収集してもよい。また、情報処理装置１００は、各ユーザが保有するクレジットカードの利用履歴や銀行口座の利用履歴などを収集してもよい。

【0100】

また、情報処理装置１００は、収集した情報に基づいて推定された情報を各ユーザの情報としてもよい。たとえば、情報処理装置１００は、購買履歴から、毎月の食料品の平均的な購入総額が１０万円以上である場合、たとえば、世帯月収若しくは個人月収が３０万円以上であるといった収入や、３人家族であるといった家族構成、もしくは同居人構成などを推定し、各ユーザの情報としてもよい。また、情報処理装置１００は、たとえば、位置履歴や購入履歴から、各ユーザが所有する物品や、各ユーザの居住地や職場などを推定し、推定した情報を各ユーザの情報としてもよい。

【0101】

また、情報処理装置１００は、たとえば、各種サービスを提供するサーバ装置から、サービスの利用履歴を各ユーザの情報として取得してもよい。また、情報処理装置１００は、このようなサービスを提供するサーバ装置もしくは単独のサーバ装置が、サービスの利用履歴から推定した各種情報を各ユーザの情報として収集してもよい。また、情報処理装置１００は、各ユーザが登録、又は各ユーザについて推定された各種のジオグラフィック属性や趣味嗜好といったサイコグラフィック属性を示す情報を各ユーザの情報として収集してもよい。

【0102】

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部１３０の分類部１３３と評価部１３４とは機能的に統合されていてもよい。

【0103】

また、上述の実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【0104】

［８．効果］
上述の実施形態に係る情報処理装置１００は、第１生成部１３１と、第２生成部１３２と、分類部１３３と、評価部１３４とを備える。第１生成部１３１は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第１リスト情報を生成する。第２生成部１３２は、シードユーザを含む各ユーザが入力した検索クエリと、第１リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第２リスト情報を生成する。分類部１３３は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部１３４は、分類部１３３による分類結果を用いて、第２リスト情報の信頼性を評価する。

【0105】

このようなことから、実施形態に係る情報処理装置１００は、たとえば、第２リスト情報に含まれる各ユーザを検索クエリとは無関係のセンサ情報に基づいてクラスタリングすることにより、第２リスト情報に含まれる各ユーザが一定の関連性を有するかを客観的に確かめることができ、第２リスト情報の信頼性を間接的に評価できる。

【0106】

また、実施形態に係る情報処理装置１００において、評価部１３４は、第２リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第２リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置１００は、たとえば、第２リスト情報において、どの順位までのユーザが所定の行動との関係性を有するのかについて確かめることができる。

【0107】

また、実施形態に係る情報処理装置１００において、分類部１３３は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類する。これにより、実施形態に係る情報処理装置１００は、各ユーザの具体的な行動内容が類似する各ユーザを同一のクラスタに分類できる。

【0108】

また、実施形態に係る情報処理装置１００において、分類部１３３は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類し、評価部１３４は、複数の行動パターンごとに、第２リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第２リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置１００は、信頼性の評価精度を高めることができる。

【0109】

また、実施形態に係る情報処理装置１００において、分類部１３３は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類する。

【0110】

また、実施形態に係る情報処理装置１００において、分類部１３３は、センサ情報から推定される前記各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類する。

【0111】

これらにより、実施形態に係る情報処理装置１００は、様々な基準で各ユーザを分類できる。

【0112】

以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

【0113】

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。

【符号の説明】

【0114】