(58)【調査した分野】(Int.Cl.,DB名)
第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、前記第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する算出部と、
前記算出部によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する生成部と、
を備えたことを特徴とする生成装置。
第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、前記第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する算出手順と、
前記算出手順によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。
【発明を実施するための形態】
【0010】
以下に本願に係る生成装置、生成方法、及び生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願にかかる生成装置、生成方法、及び生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
[1.生成処理]
まず、
図1を用いて、実施形態に係る生成処理の一例について説明する。
図1は、実施形態に係る生成処理の一例を示す図である。
図1に示す例では、生成装置100が、検索クエリ「高級ブランドA」、並びに、他の各検索クエリ「高級ブランドB」、「高級ブランドC」及び「大衆向けブランドD」間の関連度を算出する場合を示す。ここで、実施形態において、高級ブランドA〜Cは、大衆向けブランドDと比べ、単価が高い商品を扱うブランドを示す。
【0012】
また、
図1に示す例では、生成装置100が、グループU1に属するユーザが入力した検索クエリ群に基づいて算出した関連度と、グループU2に属するユーザが入力した検索クエリ群に基づいて算出した関連度とに基づいて、グループU2に属するユーザの特徴を示す指標を生成する場合を示す。ここで、実施形態において、グループU1は、後述する検索装置20が提供する所定の検索サービスのユーザ全体を示し、グループU2は、グループU1に比べ高級ブランドAを嗜好する傾向が強いユーザを示す。例えば、生成装置100は、検索クエリ「高級ブランドA」の入力回数が所定の閾値以上であるユーザをグループU2に属するユーザであると判定してもよい。
【0013】
[生成システムの構成]
図1の説明に先立って、
図2を用いて生成システム1の構成について説明する。
図2は、実施形態に係る生成システム1の構成例を示す図である。
図2に示すように、実施形態に係る生成システム1は、端末装置10と、検索装置20と、生成装置100とを含む。端末装置10、検索装置20及び生成装置100は、ネットワークNを介して有線または無線により相互に通信可能に接続される。ネットワークNは、例えば、インターネットなどのWAN(Wide Area Network)である。なお、
図2に示した生成システム1には、複数台の端末装置10、複数台の検索装置20及び複数台の生成装置100が含まれていてもよい。
【0014】
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。端末装置10は、ウェブブラウザやアプリケーションにより、検索装置20によって提供されるコンテンツを表示する。
【0015】
検索装置20は、端末装置10からの要求に応じて所定の検索サービス(例えば、ウェブページ)を提供する情報処理装置である。例えば、検索装置20は、ユーザが利用する端末装置10から検索クエリを取得し、その検索クエリに応じた検索結果を端末装置10に提供する。また、検索装置20は、端末装置10に配信したページにおいて、各ユーザが入力した検索クエリを収集し、検索装置20の記憶部に格納する。なお、検索装置20は、生成装置100と一体であってもよい。また、検索装置20は、端末装置10から検索クエリを受け付けるサービスを提供すればよく、例えば、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関する各ウェブページを配信してもよい。
【0016】
検索装置20によって配信されるウェブページの情報には、例えば、マークアップ言語により記述されたファイル等が含まれる。マークアップ言語は、例えば、HTML(Hyper Text Markup Language)やXML(Extensible Markup Language)である。なお、以下においては、マークアップ言語により記述されたファイルがHTMLファイルであるものとして説明するが、マークアップ言語により記述されたファイルは、XMLファイルやその他のファイルであってもよい。
【0017】
生成装置100は、異なる検索クエリを入力したユーザの数を取得し、取得したユーザの数に基づいて所定の処理を行う情報処理装置である。なお、異なる検索クエリ(検索クエリXと検索クエリYとする)を入力したユーザとは、所定の期間で検索クエリXと検索クエリYとを入力したユーザを示す。例えば、ある時点で検索クエリXを入力し、その時点から所定の期間(例えば、1時間、24時間、1週間、など)内に検索クエリYを入力したユーザは、異なる検索クエリ(検索クエリXと検索クエリY)を入力したユーザに該当する。なお、1度に検索クエリXと検索クエリYの双方を入力したユーザも異なる検索クエリ(検索クエリXと検索クエリY)を入力したユーザとしてもよい。
【0018】
以下、
図1に戻り、生成処理の一例を説明する。なお、生成装置100は、検索装置20の記憶部から、検索装置20が提供する所定の検索サービスにおいて、異なる検索クエリを入力したユーザの数を取得したものとする。具体的には、生成装置100は、検索クエリ「高級ブランドA」と「高級ブランドB」との双方を入力したユーザの数、検索クエリ「高級ブランドA」と「高級ブランドC」との双方を入力したユーザの数、並びに、検索クエリ「高級ブランドA」と「大衆向けブランドD」との双方を入力したユーザの数を取得する。
【0019】
まず、生成装置100は、検索クエリ間の関連度を算出する(ステップS11)。具体的には、生成装置100は、異なる検索クエリを入力したユーザの数に基づいて、検索クエリ間の関連度を算出する。より具体的には、生成装置100は、異なる検索クエリを入力したユーザの数が多いほど、異なる検索クエリ間の関連度を高く算出する。
【0020】
図1に示す例において、生成装置100は、グループU1に属するユーザにおける、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を算出する。例えば、生成装置100は、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との双方を入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度を算出する。同様に、生成装置100は、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との双方を入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との関連度を算出し、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との双方を入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との関連度を算出する。
図1の例では、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との双方を入力したユーザの数が、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との双方を入力したユーザの数よりも多く、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との双方を入力したユーザの数が、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との双方を入力したユーザの数よりも多い例を示している。そして、
図1の例において、生成装置100は、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度「4.0」を算出し、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との関連度「2.5」を算出し、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との関連度「2.0」を算出する。また、同様に、生成装置100は、グループU2に属するユーザのうち、異なる検索クエリを入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を算出する。
【0021】
続いて、生成装置100は、ステップS11で算出した関連度に基づいて、グループU2に属するユーザの特徴を示す指標を生成する(ステップS12)。具体的には、生成装置100は、グループU1において算出された関連度よりもグループU2において算出された関連度の方が高い場合には、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有することを示す指標を生成する。一方、生成装置100は、グループU1において算出された関連度よりもグループU2において算出された関連度の方が低い場合には、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有しないことを示す指標を生成する。
【0022】
以下、生成装置100が生成する指標の一例を説明する。生成装置100は、グループU2における検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度から、対応するグループU1の関連度を差し引いた数値を指標値として算出する。
図1の例では、生成装置100は、グループU2における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度「6.0」から、グループU1における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度「4.0」を差し引くことで、指標値「2.0」を算出する。これは、グループU1に属するユーザよりも、高級ブランドAを嗜好する傾向が強いグループU2に属するユーザは、高級ブランドBを入力する傾向が高いことを示す。すなわち、グループU2に属するユーザは、グループU1に属するユーザよりも高級ブランドBを嗜好する傾向が強いといえる。同様にして、生成装置100は、グループU1とグループU2における各関連度の差分である指標値を算出する。そして、生成装置100は、
図1に示す例のように、縦軸方向に検索クエリ「高級ブランドA」との関連度の算出対象となった各検索クエリ、横軸方向に指標値を示す値を設定したグラフG1を生成する。ここで、生成装置100は、中心軸「0」を点線で示し、中心軸から右の領域を正の領域、中心軸から左の領域を負の領域とし、算出した指標値に応じてグラフG1に丸印でマッピングする。例えば、グループU2における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度から、グループU1における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度を差し引いた指標値が正の値であるため、生成装置100は、グラフG1の縦軸「高級ブランドB」の正の領域に丸印でマッピングする。同様にして、生成装置100は、算出した指標値に応じてグラフG1の縦軸に設定された検索クエリごとにマッピングを行う。
【0023】
このようにして、生成装置100は、グループU2のグループU1に対する特徴を示す指標を生成できる。
【0024】
以上のように、実施形態に係る生成装置100は、検索クエリを入力したユーザの数に基づいて、所定の属性等で特定されるグループの特徴を生成する。例えば、
図1の例では、高級ブランドAを嗜好するユーザ、すなわち、高級嗜好のあるユーザは、大衆向けブランドD、すなわち低価格の商品に対して関心を示さないと考えられる。また、高級ブランドAを嗜好するユーザは、高級ブランドB及び高級ブランドCともに関心が高いが、高級ブランドの中でも特に高級ブランドBに対して関心が高いと考えられる。すなわち、実施形態に係る生成装置100は、利用者の特徴を精度良く把握することを可能にする。
【0025】
[2.生成装置の構成]
次に、
図3を用いて、実施形態に係る生成装置100の構成について説明する。
図3は、実施形態に係る生成装置100の構成例を示す図である。
図3に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、生成装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0026】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、生成装置100、端末装置10、検索装置20等との間で情報の送受信を行う。
【0027】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、
図3に示すように、関連度情報記憶部121と、指標情報記憶部122とを有する。
【0028】
(関連度情報記憶部121について)
関連度情報記憶部121に格納される関連度情報は、後述する算出部132が算出する検索クエリ間の関連度に関する各種情報をユーザグループ(
図1の例における「グループU1」及び「グループU2」に相当)毎に含んだ情報である。
【0029】
ここで、
図4を用いて、関連度情報記憶部121に格納される関連度情報の一例について説明する。
図4は、実施形態に係る関連度情報記憶部121の一例を示す図である。
図4に示すように、関連度情報記憶部121には、「ユーザグループID」、「検索クエリ」、「関連度」といった項目に属する情報が含まれる。
【0030】
「ユーザグループID」は、ユーザが属するグループを識別する情報を示す。例えば、
図4の例では、「ユーザグループID」に、グループU1を識別する「U1」、グループU2を識別する「U2」といった情報が含まれる。「検索クエリ」は、ユーザが入力した異なる検索クエリを示す。例えば、
図4の例では、「検索クエリ」に、検索クエリ「高級ブランドA」と、他の各検索クエリとの双方に関する情報が含まれる。「関連度」は、「検索クエリ」の項目に格納される検索クエリ間の関連度に関する情報を示す。例えば、
図4の例では、「関連度」に、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度が格納される。
【0031】
(指標情報記憶部122について)
指標情報記憶部122に格納される指標情報は、後述する生成部133が生成する情報であって、特定のユーザグループ(
図1の例における「グループU2」に相当)に属するユーザの特徴を示す指標に関する各種情報を含んだ情報である。
【0032】
ここで、
図5を用いて、指標情報記憶部122に格納される指標情報の一例について説明する。
図5は、実施形態に係る指標情報記憶部122の一例を示す図である。
図5に示すように、指標情報記憶部122には、「ユーザグループID」、「検索クエリ」、「指標値」といった項目に属する情報が含まれる。「ユーザグループID」は、指標の生成対象となったユーザグループを識別する情報を示す。例えば、
図5の例では、「ユーザグループID」に、グループU2を識別する「U2」といった情報が含まれる。
【0033】
「検索クエリ」は、ユーザが入力した異なる検索クエリを示す。例えば、
図5の例では、「検索クエリ」に、検索クエリ「高級ブランドA」と、他の各検索クエリとの双方に関する情報が含まれる。「指標値」は、関連度情報記憶部121に格納される「関連度」に基づいて算出される値を示す。具体的には、かかる「関連度」に対応する検索クエリに関連する特徴を、「ユーザグループID」から特定されるユーザグループが有するか否かを示す値である。例えば、
図5の例では、グループU2における検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度から、対応するグループU1の関連度を差し引いた数値を指標値とする。ここで、指標値が正の値である場合、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有することを示す。例えば、グループU1に属するユーザよりも、グループU2に属するユーザは、かかる関連度に対応する検索クエリを入力する傾向が高いという特徴を有することを示す。また、指標値が負の値である場合、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有しないことを示す。例えば、グループU1に属するユーザよりも、グループU2に属するユーザは、かかる関連度に対応する検索クエリを入力する傾向が低いという特徴を有することを示す。また、指標値が0である場合、グループU1に属するユーザと、グループU2に属するユーザとは、かかる関連度に対応する検索クエリを入力する傾向が同一であることを示す。
【0034】
(制御部130について)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(決定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部130は、
図3に示すように、取得部131と、算出部132と、生成部133とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
【0035】
(取得部131について)
取得部131は、異なる検索クエリを入力したユーザの数を取得する。例えば、
図1の例において、取得部131は、検索装置20が提供する所定の検索サービスにおいて異なる検索クエリを入力したユーザの数を検索装置20の記憶部から取得する。なお、以下の説明では、異なる検索クエリのうち、一方を「第1検索クエリ」(
図1の例における検索クエリ「高級ブランドA」に相当)と記載し、もう一方の検索クエリであって第1検索クエリに対する関連度の算出対象となる検索クエリを「第2検索クエリ」(
図1の例における検索クエリ「高級ブランドB」、「高級ブランドC」又は「大衆向けブランドD」のいずれかに相当)と記載する場合がある。
【0036】
また、取得部131は、第1検索クエリ又は第2検索クエリのいずれかを入力するユーザの数を取得し、第1検索クエリ及び第2検索クエリを両方とも入力するユーザの数を取得してもよい。
【0037】
(算出部132について)
算出部132は、第1グループ(
図1の例における「グループU1」に相当)に属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、第1グループと異なる第2グループ(
図1の例における「グループU2」に相当)に属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する。具体的には、算出部132は、第1関連度として、第1グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出し、第2関連度として、第2グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出する。より具体的には、算出部132は、第1関連度として、第1グループに属するユーザのうち、第1検索クエリと、第1検索クエリとは異なる第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出し、第2関連度として、第2グループに属するユーザのうち、第1検索クエリと、第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出する。例えば、
図1の例において、算出部132は、第1検索クエリ「高級ブランドA」と、他の各第2検索クエリとの関連度を算出する。具体的には、
図1の例において、算出部132は、グループU1に属するユーザのうち、第1検索クエリ「高級ブランドA」と第2検索クエリ「高級ブランドB」との双方を入力したユーザの数に基づいて、第1検索クエリ「高級ブランドA」に対する第2検索クエリ「高級ブランドB」の関連度(第1関連度)を算出する。また、同様に、算出部132は、グループU2に属するユーザのうち、異なる検索クエリを入力したユーザの数に基づいて、第1検索クエリ「高級ブランドA」と、第2検索クエリである他の各検索クエリとの関連度(第2関連度)を算出する。
【0038】
なお、算出部132は、第1検索クエリ又は第2検索クエリのいずれかを入力した第1グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第1グループに属するユーザの数とに基づいて第1関連度を算出し、第1検索クエリ又は第2検索クエリのいずれかを入力した第2グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第2グループに属するユーザの数とに基づいて第2関連度を算出してもよい。例えば、算出部132は、下記式(1)に基づいて、第1検索クエリ(式(1)では、「検索クエリA」)と第2検索クエリ(式(1)では、「検索クエリB」)の第1関連度及び第2関連度を算出する。
【0040】
上記式(1)において、例えば、第1関連度を算出する場合、「Score(A,B)」は、検索クエリAと検索クエリBの第1関連度の数値を示す。「Auser」は、第1グループに属するユーザのうち、検索クエリAを入力したユーザの数を示す。「Buser」は、第1グループに属するユーザのうち、検索クエリBを入力したユーザの数を示す。「ALLuser」は、第1グループに属するユーザの数を示す。そして、「Auser∧Buser」は、第1グループに属するユーザのうち、検索クエリA及び検索クエリBの両方を入力したユーザの数を示す。
【0041】
算出部132は、上記式(1)を用いて、第1グループに属するユーザ群から入力された検索クエリの第1関連度を算出する。例えば、算出部132は、第1グループに属するユーザのうち、第1検索クエリである検索クエリAを入力したユーザが検索する検索クエリBを集計する。そして、算出部132は、第1検索クエリに対する全ての第2検索クエリに対して、上記式(1)を用いて第1関連度を算出する。
【0042】
また、上記式(1)において、例えば、第2関連度を算出する場合、「Score(A,B)」は、検索クエリAと検索クエリBの第2関連度の数値を示す。「Auser」は、第2グループに属するユーザのうち、検索クエリAを入力したユーザの数を示す。「Buser」は、第2グループに属するユーザのうち、検索クエリBを入力したユーザの数を示す。「ALLuser」は、第2グループに属するユーザの数を示す。そして、「Auser∧Buser」は、第2グループに属するユーザのうち、検索クエリA及び検索クエリBの両方を入力したユーザの数を示す。
【0043】
算出部132は、上記式(1)を用いて、第2グループに属するユーザ群から入力された検索クエリの第2関連度を算出する。例えば、算出部132は、第2グループに属するユーザのうち、第1検索クエリである検索クエリAを入力したユーザが検索する検索クエリBを集計する。そして、算出部132は、第1検索クエリに対する全ての第2検索クエリに対して、上記式(1)を用いて第2関連度を算出する。
【0044】
また、算出部132は、第2関連度として、第1グループに含まれる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の関連度を算出してもよい。具体的には、算出部132は、第1グループのうち、所定の検索クエリの入力履歴、所定のサービスの利用履歴、または、所定の属性の少なくともいずれか一つに基づいて特定される第2グループにおける第2関連度を算出する。例えば、
図1の例に示すように、算出部132は、検索装置20が提供する所定の検索サービスのユーザ全体を示す第1グループのうち、第1検索クエリ「高級ブランドA」の入力回数が所定の閾値以上であることによって特定されるユーザを第2グループに属するユーザとし、第2グループにおける第2関連度を算出してもよい。また、算出部132は、
図1の例における検索装置20が提供する特定の検索サービス、又は、検索装置20以外の外部の情報処理装置が提供する種々のサービスの利用履歴によって特定されるユーザを第2グループに属するユーザとし、第2グループにおける第2関連度を算出してもよい。例えば、算出部132は、検索装置20、又は、検索装置20以外の外部の情報処理装置が提供するポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどのサービスにおける利用履歴に基づいて第2グループに属するユーザを特定してもよい。また、算出部132は、「性別」、「年代」などといった所定の属性で特定されるユーザを第2グループに属するユーザとし、第2グループにおける第2関連度を算出してもよい。
【0045】
(生成部133について)
生成部133は、算出部132によって算出された第1関連度と第2関連度とに基づいて、第2グループに属するユーザの特徴を示す指標を生成する。具体的には、生成部133は、第1関連度と第2関連度との高低関係に基づいて第2グループに属するユーザの特徴を示す指標を生成する。例えば、
図1の例において、生成部133は、グループU2における第1検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度から、対応するグループU1の関連度を差し引いた数値を、グループU2に属するユーザの特徴を示す指標値として算出する。
【0046】
また、生成部133は、第1関連度よりも第2関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有することを示す指標を生成し、第2関連度よりも前記第1関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有しないことを示す指標を生成する。例えば、
図1の例において、算出部132が算出したグループU2における第1検索クエリ「高級ブランドA」と第2検索クエリ「高級ブランドB」との関連度は「6.0」であり、グループU1における第1検索クエリ「高級ブランドA」と第2検索クエリ「高級ブランドB」との関連度は「4.0」である。すなわち、第1関連度よりも第2関連度が高いため、生成部133は、グループU2に属するユーザがグループU1に属するユーザよりも第2検索クエリ「高級ブランドB」に関連する特徴を有する指標を生成する。具体的には、生成部133は、グループU1に属するユーザよりも、高級ブランドAを嗜好する傾向が強いグループU2に属するユーザが、高級ブランドBを入力する傾向が高いという特徴を有することを示す指標(
図1における「グラフG1」に相当)を生成する。また、
図1の例において、算出部132が算出したグループU1における第1検索クエリ「高級ブランドA」と第2検索クエリ「大衆向けブランドD」との関連度は「2.0」であり、グループU2における第1検索クエリ「高級ブランドA」と第2検索クエリ「大衆向けブランドD」との関連度は「0.5」である。すなわち、第2関連度よりも第1関連度が高いため、生成部133は、グループU2に属するユーザがグループU1に属するユーザよりも第2検索クエリ「大衆向けブランドD」に関連する特徴を有しない指標を生成する。具体的には、生成部133は、グループU1に属するユーザよりも、高級ブランドAを嗜好する傾向が強いグループU2に属するユーザが、大衆向けブランドDを入力する傾向が低いという特徴を有することを示す指標を生成する。
【0047】
また、生成部133は、第2グループに属するユーザの特徴を示す指標として、第2検索クエリが属するカテゴリへの嗜好性を有するか否かを示す指標を生成する。ここで、
図6及び7を用いて、第1検索クエリが属するカテゴリと、第2検索クエリが属するカテゴリとに基づいて算出されたグループU1、グループU2の各グループに属するユーザにおける各関連度に基づいて生成部133が生成する指標の一例を説明する。
図6は、関連度及び指標値の一例を示す図である。
【0048】
なお、本説明において、算出部132は、第1検索クエリが属するカテゴリを「コスメ系クエリ群」とし、各第2検索クエリが属する各カテゴリとの関連度を算出したものとする。ここで、本説明において、グループU1は、
図1に示す検索装置20が提供する所定の検索サービスのユーザ全体を示し、グループU2は、グループU1に比べ、カテゴリ「コスメ系クエリ群」に関する事項を嗜好する傾向が強いユーザを示す。例えば、算出部132は、カテゴリ「コスメ系クエリ群」に属する検索クエリの入力回数が所定の閾値以上であるユーザをグループU2に属するユーザとしてもよい。なお、カテゴリ「コスメ系クエリ群」には、例えば、「化粧水」、「香水」、「口紅」などといった検索クエリが含まれる。また、例えば、第2検索クエリが属するカテゴリの一例「動画系クエリ群」には、「ミュージックビデオ」、「ショートムービー」、「予告動画」などといった検索クエリが含まれる。
【0049】
また、
図6に示す例において、算出部132は、グループU1に属するユーザにおける、カテゴリ「コスメ系クエリ群」に属する一の検索クエリと、第2検索クエリが属するカテゴリの各検索クエリとの関連度を算出したものとする。例えば、算出部132は、検索クエリ「化粧水」と検索クエリ「ミュージックビデオ」との双方を入力したユーザの数に基づいて、検索クエリ「化粧水」と検索クエリ「ミュージックビデオ」との関連度を算出する。同様に、算出部132は、検索クエリ「化粧水」と検索クエリ「ショートムービー」との双方を入力したユーザの数に基づいて、検索クエリ「化粧水」と検索クエリ「ショートムービー」との関連度を算出し、検索クエリ「化粧水」と検索クエリ「予告動画」との双方を入力したユーザの数に基づいて、検索クエリ「化粧水」と検索クエリ「予告動画」との関連度を算出する。同様に、算出部132は、カテゴリ「コスメ系クエリ群」に属する他の一の検索クエリと、第2検索クエリが属するカテゴリの各検索クエリとの関連度を算出する。そして、算出部132は、算出した関連度の平均値を算出し、算出した平均値をグループU1に属するユーザにおける、カテゴリ「コスメ系クエリ群」と「動画系クエリ群」との関連度とする。
図6に示す例において、算出部132は、カテゴリ「コスメ系クエリ群」と「動画系クエリ群」との関連度を「4.0」と算出したものとする。また、同様に、算出部132は、「コスメ系クエリ群」と、第2検索クエリが属する各カテゴリとの関連度を算出したものとする。
【0050】
また、同様に、算出部132は、グループU2に属するユーザにおける、「コスメ系クエリ群」と、第2検索クエリが属する各カテゴリとの関連度を算出したものとする。
【0051】
生成部133は、算出部132が算出した第1検索クエリが属するカテゴリと、第2検索クエリが属する各カテゴリとの関連度に基づいて、グループU2に属するユーザの指標値を算出する。
図6の例では、生成部133は、グループU2におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度「5.5」から、グループU1におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度「4.0」を差し引くことで、指標値「+1.5」を算出する。これは、グループU1に属するユーザよりも、カテゴリ「コスメ系クエリ群」に関する事項を嗜好する傾向が強いグループU2に属するユーザは、カテゴリ「動画系クエリ群」に属する検索クエリを入力する傾向が高いことを示す。すなわち、グループU2に属するユーザは、グループU1に属するユーザよりもカテゴリ「動画系クエリ群」に関する事項を嗜好する傾向が強いといえる。同様にして、生成部133は、グループU1とグループU2における各関連度の差分である指標値を算出する。
【0052】
そして、生成部133は、
図7に示すように、縦軸方向にカテゴリ「コスメ系クエリ群」との関連度の算出対象となった各カテゴリに関する事項、横軸方向に指標値を示す値を設定したグラフG11を生成する。
図7は、指標の一例を示す図である。ここで、生成部133は、中心軸「0」を点線で示し、中心軸から右の領域を正の領域、中心軸から左の領域を負の領域とし、算出した指標値に応じてグラフG11に丸印でマッピングする。例えば、グループU2におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度から、グループU1におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度を差し引いた指標値が正の値であるため、生成部133は、グラフG11の縦軸「動画好き」の正の領域に丸印でマッピングする。同様にして、生成部133は、算出した指標値に応じてグラフG11の縦軸に設定されたカテゴリに関する事項ごとにマッピングを行う。
【0053】
なお、生成部133は、算出部132が算出した第1検索クエリと、第2検索クエリが属するカテゴリとの関連度に基づいて指標を生成してもよい。
【0054】
[3.決定処理のフロー]
ここで、
図8を用いて、実施形態に係る生成処理の手順について説明する。
図8は、実施形態に係る生成処理手順の一例を示すフローチャートである。
【0055】
図8に示すように、生成装置100は、検索装置20から、異なる検索クエリを入力したユーザの数を取得する(ステップS101)。続いて、生成装置100は、第1関連度を算出する(ステップS102)。例えば、
図1に示す例において、生成装置100は、グループU1に属するユーザにおける、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を第1関連度として算出する。続いて、生成装置100は、第2関連度を算出する(ステップS103)。
図1に示す例において、グループU2に属するユーザにおける、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を第2関連度として算出する。
【0056】
続いて、生成装置100は、第1関連度及び第2関連度に基づいて指標値を算出する(ステップS104)。続いて、生成装置100は、算出した指標値に基づいて指標を生成し(ステップS105)、処理を終了する。例えば、
図1に示す例において、生成装置100は、算出した指標値が正の値である場合、指標を示すグラフの正の領域にマッピングする。具体的には、生成装置100は、グラフG1の中心軸「0」から右の領域に丸印でマッピングする。また、生成装置100は、第1関連度及び第2関連度に基づいて算出した指標値が負の値である場合、指標を示すグラフの負の領域にマッピングする。具体的には、生成装置100は、グラフG1の中心軸「0」から左の領域に丸印でマッピングする。また、生成装置100は、算出した指標値が0である場合、グラフG1の中心軸「0」に丸印でマッピングする。
【0057】
[4.効果]
上述してきたように、実施形態に係る生成装置100は、算出部132と、生成部133とを有する。算出部132は、第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する。生成部133は、算出部132によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する。
【0058】
これにより、実施形態に係る生成装置100は、利用者が入力した検索クエリ群、すなわち、定量的なデータに基づいて利用者の特徴を示す指標を生成できるため、利用者の特徴を精度良く把握することを可能にする。
【0059】
また、算出部132は、第1関連度として、第1グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出し、第2関連度として、第2グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出する。
【0060】
これにより、実施形態に係る生成装置100は、各検索クエリ間の関連度に基づいて利用者の特徴を示す指標を生成できるため、第2グループに属する利用者の特徴を精度良く把握することを可能にする。
【0061】
また、生成部133は、第1関連度と第2関連度との高低関係に基づいて第2グループに属するユーザの特徴を示す指標を生成する。
【0062】
これにより、実施形態に係る生成装置100は、第1関連度と第2関連度との相対的な関係に基づいて第2グループの第2関連度に属する利用者の特徴を示す指標を生成できるため、第2グループの利用者の特徴をより精度良く把握することを可能にする。
【0063】
また、算出部132は、第1グループに属するユーザのうち、第1検索クエリと、第1検索クエリとは異なる第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出し、第2関連度として、第2グループに属するユーザのうち、第1検索クエリと、第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出し、生成部133は、第1関連度よりも第2関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有することを示す指標を生成し、第2関連度よりも第1関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有しないことを示す指標を生成する。
【0064】
これにより、実施形態に係る生成装置100は、第1関連度を基準として指標を生成することにより、第2グループに属する利用者の特徴をより精度良く把握することを可能にする。
【0065】
また、生成部133は、第2グループに属するユーザの特徴を示す指標として、第2検索クエリが属するカテゴリへの嗜好性を有するか否かを示す指標を生成する。
【0066】
これにより、実施形態に係る生成装置100は、検索クエリが属するカテゴリへの嗜好性を示す指標を生成するため、第2グループに属する利用者の特徴をカテゴリ単位で精度良く把握することを可能にする。
【0067】
また、算出部132は、第1検索クエリ又は第2検索クエリのいずれかを入力した第1グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第1グループに属するユーザの数とに基づいて第1関連度を算出し、第1検索クエリ又は第2検索クエリのいずれかを入力した第2グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第2グループに属するユーザの数とに基づいて第2関連度を算出する。
【0068】
これにより、実施形態に係る生成装置100は、各検索クエリ間の関連度をより精度よく算出し、算出した関連度に基づいて利用者の特徴を示す指標を生成できるため、第2グループに属する利用者の特徴を精度良く把握することを可能にする。
【0069】
また、算出部132は、第2関連度として、第1グループに含まれる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の関連度を算出する。
【0070】
これにより、実施形態に係る生成装置100は、例えば利用者全体を対象とする第1グループに含まれる第2グループに属する利用者の特徴を示す指標を生成するため、利用者全体のうち所定の属性等を有する利用者の特徴を精度良く把握することを可能にする。
【0071】
また、算出部132は、所定の検索クエリの入力履歴、所定のサービスの利用履歴、または、所定の属性の少なくともいずれか一つに基づいて特定される第2グループにおける第2関連度を算出する。
【0072】
これにより、実施形態に係る生成装置100は、行動情報又は属性情報等により特定される第2グループに属する利用者の特徴を示す指標を生成するため、所定の情報によって特定される第2グループに属する利用者の特徴を精度良く把握することを可能にする。
【0073】
[5.ハードウェア構成]
また、上述してきた各実施形態に係る生成装置は、例えば
図9に示すような構成のコンピュータ1000によって実現される。以下、生成装置100を例に挙げて説明する。
図9は、生成装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0074】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0075】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
【0076】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0077】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0078】
例えば、コンピュータ1000が生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
【0079】
[6.その他]
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0080】
また、上述した生成装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0081】
また、特許請求の範囲に記載した「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。