IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2024-60955情報処理装置、情報処理方法及び情報処理プログラム
<>
  • 特開-情報処理装置、情報処理方法及び情報処理プログラム 図1
  • 特開-情報処理装置、情報処理方法及び情報処理プログラム 図2
  • 特開-情報処理装置、情報処理方法及び情報処理プログラム 図3
  • 特開-情報処理装置、情報処理方法及び情報処理プログラム 図4
  • 特開-情報処理装置、情報処理方法及び情報処理プログラム 図5
  • 特開-情報処理装置、情報処理方法及び情報処理プログラム 図6
  • 特開-情報処理装置、情報処理方法及び情報処理プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024060955
(43)【公開日】2024-05-07
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
   G06F 16/9032 20190101AFI20240425BHJP
【FI】
G06F16/9032
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022168559
(22)【出願日】2022-10-20
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】小川 知紘
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA10
5B175FB04
5B175HA02
5B175JA02
(57)【要約】
【課題】所定の事象との関連性を有さない検索クエリを特定する。
【解決手段】本願に係る情報処理装置は、所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する取得部と、検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する生成部と、基準分布情報と、対象分布情報とを比較する比較部と、比較部による比較結果に基づいて、所定の条件を満たす検索クエリを特定する特定部とを有することを特徴とする。
【選択図】図3
【特許請求の範囲】
【請求項1】
所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する取得部と、
前記検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する生成部と、
前記基準分布情報と、前記対象分布情報とを比較する比較部と、
前記比較部による比較結果に基づいて、所定の条件を満たす検索クエリを特定する特定部と
を有することを特徴とする情報処理装置。
【請求項2】
前記比較部は、
前記基準分布情報のピークの位置と、前記対象分布情報のピークの位置とを比較し、
前記特定部は、
前記基準分布情報のピークの位置と、前記対象分布情報のピークの位置とが一致しない場合に、前記所定の条件を満たす検索クエリを特定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記比較部は、
利用者の属性ごとに、前記基準分布情報が示す分布と、前記対象分布情報が示す分布とを比較し、
前記特定部は、
前記基準分布情報が示す分布と、前記対象分布情報が示す分布との差分が所定の閾値以上である場合に、前記所定の条件を満たす検索クエリを特定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記特定部は、
検索クエリごとに、入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、前記対象分布情報とピークの位置が一致する分布情報に対応する検索クエリを特定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記特定部は、
前記分布情報のうち、前記対象分布情報とピークの位置が一致する複数の分布情報のそれぞれに対応する複数の検索クエリを分類したクラスタを特定する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記特定部は、
検索クエリのクラスタごとに、クラスタに属する検索クエリを入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、前記対象分布情報とピークの位置が一致する分布情報に対応するクラスタに属する検索クエリを特定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記特定部は、
検索クエリのうち、前記対象分布情報のピークの位置に対応する属性を有する利用者が入力した検索クエリを特定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記特定部は、
利用者が入力した検索クエリに応じた利用者のクラスタごとに、クラスタに属する利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、前記対象分布情報とピークの位置が一致する分布情報に対応するクラスタに対応する検索クエリを特定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
コンピュータが実行する情報処理方法であって、
所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する取得工程と、
前記検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する生成工程と、
前記基準分布情報と、前記対象分布情報とを比較する比較工程と、
前記比較工程による比較結果に基づいて、所定の条件を満たす検索クエリを特定する特定工程と
を含むことを特徴とする情報処理方法。
【請求項10】
所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する取得手順と、
前記検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する生成手順と、
前記基準分布情報と、前記対象分布情報とを比較する比較手順と、
前記比較手順による比較結果に基づいて、所定の条件を満たす検索クエリを特定する特定手順と
をコンピュータに実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、インターネットを介して様々な情報を利用者に提供する技術が知られている。このような技術の一例として、広告を閲覧した利用者が入力した検索キーワードのうち、入力頻度が高い検索キーワードを、検索連動型広告のキーワードとする技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2014-6757号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した従来技術では、所定の事象との関連性を有さない検索クエリを特定できるとは限らない。
【0005】
例えば、上述した従来技術では、ログデータから対象広告の広告主の広告を閲覧したユーザを特定し、当該ユーザが入力した検索キーワードを抽出しているに過ぎず、所定の事象との関連性を有さない検索クエリを特定できるとは限らない。
【0006】
本願は、上記に鑑みてなされたものであって、所定の事象との関連性を有さない検索クエリを特定することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る情報処理装置は、所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する取得部と、前記検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する生成部と、前記基準分布情報と、前記対象分布情報とを比較する比較部と、前記比較部による比較結果に基づいて、所定の条件を満たす検索クエリを特定する特定部とを有することを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、所定の事象との関連性を有さない検索クエリを特定できるという効果を奏する。
【図面の簡単な説明】
【0009】
図1図1は、実施形態に係る情報処理の一例を示す図である。
図2図2は、分布情報の一例を示す図である。
図3図3は、実施形態に係る情報処理装置10の構成例を示す図である。
図4図4は、実施形態に係る利用者情報データベース31の一例を示す図である。
図5図5は、実施形態に係る企業情報データベース32の一例を示す図である。
図6図6は、実施形態に係る情報処理の手順の一例を示すフローチャートである。
図7図7は、情報処理装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の実施形態において、同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
〔1.実施形態〕
図1を用いて、本実施形態の情報処理装置等により実現される生成処理を説明する。図1は、実施形態に係る情報処理の一例を示す図である。なお、図1では、本願に係る情報処理装置の一例である情報処理装置10によって、実施形態に係る情報処理などが実現されるものとする。
【0012】
図1に示すように、実施形態に係る情報処理システム1は、情報処理装置10と、管理者端末100とを含む。情報処理装置10及び管理者端末100は、ネットワークN(例えば、図2参照)を介して有線または無線により相互に通信可能に接続される。ネットワークNは、例えば、インターネットなどのWAN(Wide Area Network)である。なお、図1に示した情報処理システム1には、複数台の情報処理装置10及び複数台の管理者端末100が含まれていてもよい。
【0013】
図1に示す情報処理装置10は、実施形態に係る情報処理を行う情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報処理装置10は、利用者が所定の検索サービスにおいて入力した検索クエリの履歴を示す情報を取得し、利用者の属性情報(例えば、性別や、年齢など)と関連付けて自装置の記憶部で管理する。そして、情報処理装置10は、自装置の記憶部で管理する情報に基づいて、企業等から分析対象として指定された利用者群(例えば、所定の検索クエリを入力した利用者)の属性ごとの分布を示す分布情報を生成し、管理者端末100に提供する。
【0014】
図1に示す管理者端末100は、企業等の管理者によって利用される情報処理装置である。管理者端末100は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。なお、図1に示す例において、管理者端末100は、管理者によって利用されるノート型PCである場合を示す。
【0015】
以下、図1を用いて、情報処理装置10が行う情報処理の一例について説明する。なお、以下の説明では、管理者端末100が、企業#1の管理者である管理者M1により利用される例を示す。また、以下の説明では、管理者端末100を管理者M1と同一視する場合がある。すなわち、以下では、管理者M1を管理者端末100と読み替えることもできる。
【0016】
また、以下の説明において、企業#1が、分析対象の利用者を「検索クエリ#1を入力した利用者」と指定し、当該利用者の属性ごとの分布を示す分布情報の提供の要求を、情報処理装置10に対して行ったものとする。ここで、検索クエリ#1とは、例えば、企業#1の製品#1に関心を有する利用者が入力すると推定される検索クエリを示し、企業#1の製品#1の名称等を示す検索クエリが含まれる。
【0017】
まず、情報処理装置10は、検索クエリ#1と関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を管理者端末100から取得する(ステップS1)。例えば、情報処理装置10は、企業#1の製品を購入した利用者や、企業#1に関するコンテンツ(広告等)を閲覧した利用者(言い換えると、企業#1に対する関心を有する利用者)の性別及び年代ごとの分布G1を示す基準分布情報を取得する。具体的な例を挙げると、情報処理装置10は、検索クエリ#1と関連する行動を行った利用者のうち、属性「男性、年齢が25-29」である利用者の割合や、属性「男性、年齢が30-34」である利用者の割合、属性「男性、年齢が35-39」である利用者の割合、・・・を示す分布G1を示す基準分布情報を取得する。
【0018】
なお、情報処理装置10は、検索クエリ#1と関連する行動を行った利用者の属性を示す情報を取得し、取得した情報に基づいて基準分布情報を生成してもよい。また、情報処理装置10は、利用者が所定の検索サービスにおいて入力した検索クエリの履歴と、利用者の属性とに基づいて、基準分布情報を生成してもよい。
【0019】
続いて、情報処理装置10は、検索クエリ#1を入力した利用者の属性ごとの分布を示す対象分布情報を生成する(ステップS2)。例えば、情報処理装置10は、検索クエリ#1を入力した利用者群#1の性別及び年代ごとの分布G2を示す対象分布情報を生成する。
【0020】
続いて、情報処理装置10は、基準分布情報と、対象分布情報とを比較する(ステップS3)。例えば、情報処理装置10は、基準分布情報と、対象分布情報とを比較し、分布G1及びG2のピークの位置が一致するか否かを判定する。
【0021】
ここで、図1の例において、分布G1において、属性「男性、年齢が50-54」の利用者の割合がピークを形成しているのに対し、分布G2では、属性「男性、年齢が30-34」及び「男性、年齢が45-49」の利用者の割合がピークを形成している。したがって、情報処理装置10は、分布G1及びG2のピークの位置が一致しないと判定する。言い換えると、情報処理装置10は、企業#1に対する関心を有していない利用者が利用者群#1に含まれていることにより、分布G1とは異なるピークを分布G2が形成していると判定する。
【0022】
続いて、情報処理装置10は、利用者群#1に含まれる利用者のうち、企業#1に対する関心を有していない利用者が入力すると推定される検索クエリ(以下、「推定検索クエリ」と記載する場合がある)を特定する(ステップS4)。例えば、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリごとに、入力した利用者の属性ごとの分布を示す分布情報を生成する。そして、情報処理装置10は、生成した分布情報のうち、分布G2とピークの位置が一致する分布情報に対応する検索クエリを、推定検索クエリとして特定する。
【0023】
ここで、図2を用いて、情報処理装置10が生成する分布情報について説明する。図2は、分布情報の一例を示す図である。
【0024】
例えば、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリのうち、検索クエリ#2を入力した利用者の属性ごとの分布G2-1を示す分布情報を生成する。ここで、分布G2-1では、属性「男性、年齢が40-44」の利用者の割合がピークを形成しており、分布G2のピークと一致しないため、情報処理装置10は、検索クエリ#2を推定検索クエリとして特定しない。
【0025】
また、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリのうち、検索クエリ#3を入力した利用者の属性ごとの分布G2-2を示す分布情報を生成する。ここで、分布G2-2では、属性「男性、年齢が40-44」及び「男性、年齢が50-54」の利用者の割合がピークを形成しており、分布G2のピークと一致しないため、情報処理装置10は、検索クエリ#3を推定検索クエリとして特定しない。
【0026】
また、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリのうち、検索クエリ#4を入力した利用者の属性ごとの分布G2-3を示す分布情報を生成する。ここで、分布G2-3では、属性「男性、年齢が30-34」の利用者の割合がピークを形成しており、分布G2のピークと一致するため、情報処理装置10は、検索クエリ#4を推定検索クエリとして特定する。
【0027】
なお、情報処理装置10は、分布G2における利用者の割合との差分が、所定の閾値(例えば、1%、3%)以内である分布情報に対応する検索クエリを、推定検索クエリとして特定してもよい。例えば、情報処理装置10は、分布G2における属性「男性、年齢が30-34」の割合が「11.6%」であり、分布G2-1における属性「男性、年齢が30-34」の割合が「10.7%」である場合、差分が所定の閾値内であるため、検索クエリ#2を推定検索クエリとして特定する。
【0028】
また、推定検索クエリの特定は、上述したものに限られず、任意の態様で行われてよい。例えば、情報処理装置10は、分布情報のうち、分布G2とピークの位置が一致する複数の分布情報のそれぞれに対応する複数の検索クエリ(推定検索クエリ)を分類したクラスタ(例えば、利用者の属性)を特定してもよい。
【0029】
また、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリのクラスタごとに、クラスタに属する検索クエリを入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、分布G2とピークの位置が一致する分布情報に対応するクラスタに属する検索クエリを、推定検索クエリとして特定してもよい。
【0030】
また、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリのうち、分布G2のピークの位置に対応する属性「男性、年齢が30-34」及び「男性、年齢が45-49」を有する利用者が入力した検索クエリを、推定検索クエリとして特定してもよい。例えば、情報処理装置10は、属性「男性、年齢が30-34」を有す利用者のうち、所定の割合以上の利用者が入力した検索クエリを、推定検索クエリとして特定する。
【0031】
また、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリに応じて、利用者群#1をクラスタに分類し、クラスタごとに、クラスタに属する利用者の属性ごとの分布を示す分布情報を生成してもよい。そして、情報処理装置10は、生成した分布情報のうち、分布G2とピークの位置が一致する分布情報に対応するクラスタを特定し、特定したクラスタに対応する検索クエリを、推定検索クエリとして特定してもよい。
【0032】
図1に戻り、説明を続ける。続いて、情報処理装置10は、推定検索クエリに基づいた分布を示す分布情報を生成する(ステップS5)。例えば、情報処理装置10は、利用者群#1に含まれる利用者のうち、推定検索クエリを入力した利用者を除外した分布G3を示す分布情報を生成する。具体的な例を挙げると、情報処理装置10は、利用者群#1からノイズとなる利用者(例えば、企業#1に関心を持っておらず、たまたま検索クエリ#1を入力しただけの利用者)を除外することにより、分布G1とピークの位置が一致するようになった分布G3を生成することが可能となる。
【0033】
なお、ステップS4において、複数の推定検索クエリを分類したクラスタを特定した場合、情報処理装置10は、利用者群#1に含まれる利用者のうち、当該クラスタに対応する検索クエリを入力した利用者を除外した分布G3を示す分布情報を生成してもよい。
【0034】
続いて、情報処理装置10は、特定した検索クエリ(推定検索クエリ)に関する情報を管理者端末100に提供する(ステップS6)。例えば、情報処理装置10は、推定検索クエリを示す情報と、分布G3を示す分布情報とを提供する。
【0035】
以上のように、実施形態に係る情報処理装置10は、企業#1に対する関心を有する利用者の分布と、検索クエリ#1を入力した利用者群の分布とに差異がある場合、言い換えると、分析対象の利用者群にノイズが含まれている場合には、検索クエリ#1を入力した利用者群が入力した検索クエリの中から、企業#1に対する関心を有していない利用者が入力すると推定される検索クエリ(すなわち、所定の事象との関連性を有さない検索クエリ)を特定することができる。
【0036】
〔2.その他の処理例〕
なお、上述した処理は一例に過ぎず、情報処理装置10は、様々な情報を用いて様々な処理を行ってもよい。この点について、以下例示を列挙する。
【0037】
〔2-1.基準分布情報と対象分布情報との比較について〕
図1の例において、情報処理装置10は、情報処理装置10は、基準分布情報と、対象分布情報とを比較し、分布G1及びG2において、利用者の割合の差分が所定の閾値以上である属性が存在するか否かを判定してもよい。そして、分布G1及びG2において、利用者の割合の差分が所定の閾値以上である属性が存在する場合、情報処理装置10は、利用者群#1に含まれる利用者が入力した検索クエリの中から、推定検索クエリを特定する。例えば、情報処理装置10は、属性「男性、年齢が50-54」の利用者の割合が、分布G1及びG2において所定の閾値以上異なる場合、情報処理装置10は、利用者群#1に含まれる利用者のうち、属性「男性、年齢が50-54」である利用者が入力した検索クエリを、推定検索クエリとして特定する。具体的な例を挙げると、情報処理装置10は、利用者群#1に含まれる利用者のうち、属性「男性、年齢が50-54」である利用者の所定の割合以上が入力した検索クエリを、推定検索クエリとして特定する。
【0038】
〔3.情報処理装置の構成〕
次に、図3を用いて、情報処理装置10の構成について説明する。図3は、実施形態に係る情報処理装置10の構成例を示す図である。図3に示すように、情報処理装置10は、通信部20と、記憶部30と、制御部40とを有する。
【0039】
(通信部20について)
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、管理者端末100等との間で情報の送受信を行う。
【0040】
(記憶部30について)
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示すように、記憶部30は、利用者情報データベース31と、企業情報データベース32とを有する。
【0041】
(利用者情報データベース31について)
利用者情報データベース31は、利用者に関する各種の情報を記憶する。ここで、図4を用いて、利用者情報データベース31が記憶する情報の一例を説明する。図4は、実施形態に係る利用者情報データベース31の一例を示す図である。図4の例において、利用者情報データベース31は、「利用者ID」、「属性情報」、「検索履歴」、「閲覧履歴」といった項目を有する。
【0042】
「利用者ID」は、利用者を識別するための識別情報を示す。「属性情報」は、利用者の属性(例えば、デモグラフィック属性や、サイコグラフィック属性)を示す。「検索履歴」は、所定の検索サービスにおける利用者の検索履歴を示す。「閲覧履歴」は、所定のサービスにおける利用者のコンテンツの閲覧履歴を示す。
【0043】
すなわち、図4では、利用者ID「UID#1」により識別される利用者の属性情報が「属性情報#1」、検索履歴が「検索履歴#1」、閲覧履歴が「閲覧履歴#1」である例を示す。
【0044】
(企業情報データベース32について)
企業情報データベース32は、管理者が管理する企業等に関する各種の情報を記憶する。ここで、図5を用いて、企業情報データベース32が記憶する情報の一例を説明する。図5は、実施形態に係る企業情報データベース32の一例を示す図である。図5の例において、企業情報データベース32は、「企業ID」、「基準分布情報」、「対象分布情報」、「特定検索クエリ」といった項目を有する。
【0045】
「企業ID」は、企業を識別するための識別情報を示す。「基準分布情報」は、所定の検索クエリと関連する行動を行った利用者の属性ごとの分布に関する情報を示す。「対象分布情報」は、所定の検索クエリを入力した利用者の属性ごとの分布に関する情報を示す。「特定検索クエリ」は、後述する特定部44により特定された検索クエリを示す
【0046】
すなわち、図5では、企業ID「CID#1」により識別される企業の基準分布情報が「基準分布情報#1」、対象分布情報が「対象分布情報#1」、特定された検索クエリが「特定検索クエリ#1」である例を示す。
【0047】
(制御部40について)
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部40は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部40は、図3に示すように、取得部41と、生成部42と、比較部43と、特定部44と、提供部45とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
【0048】
(取得部41について)
取得部41は、所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する。例えば、図1の例において、取得部41は、検索クエリ#1と関連する行動を行った利用者の属性ごとの分布G1を示す基準分布情報を管理者端末100から取得し、企業情報データベース32に格納する。
【0049】
(生成部42について)
生成部42は、検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する。例えば、図1の例において、生成部42は、検索クエリ#1を入力した利用者群#1の性別及び年代ごとの分布G2を示す対象分布情報を生成し、企業情報データベース32に格納する。
【0050】
(比較部43について)
比較部43は、基準分布情報と、対象分布情報とを比較する。例えば、図1の例において、比較部43は、企業情報データベース32を参照し、基準分布情報と、対象分布情報とを比較する。
【0051】
また、比較部43は、基準分布情報のピークの位置と、対象分布情報のピークの位置とを比較してもよい。例えば、図1の例において、比較部43は、基準分布情報と、対象分布情報とを比較し、分布G1及びG2のピークの位置が一致するか否かを判定する。
【0052】
また、比較部43は、利用者の属性ごとに、基準分布情報が示す分布と、対象分布情報が示す分布とを比較してもよい。例えば、図1の例において、比較部43は、基準分布情報と、対象分布情報とを比較し、分布G1及びG2において、利用者の割合の差分が所定の閾値以上である属性が存在するか否かを判定する。
【0053】
(特定部44について)
特定部44は、比較部43による比較結果に基づいて、所定の条件を満たす検索クエリを特定する。例えば、図1の例において、特定部44は、利用者群#1に含まれる利用者のうち、企業#1に対する関心を有していない利用者が入力すると推定される推定検索クエリを特定する。
【0054】
また、特定部44は、基準分布情報のピークの位置と、対象分布情報のピークの位置とが一致しない場合に、所定の条件を満たす検索クエリを特定してもよい。例えば、図1の例において、特定部44は、分布G1及びG2のピークの位置が一致しない場合に、推定検索クエリを特定する。
【0055】
また、特定部44は、基準分布情報が示す分布と、対象分布情報が示す分布との差分が所定の閾値以上である場合に、所定の条件を満たす検索クエリを特定してもよい。例えば、図1の例において、特定部44は、分布G1及びG2において、利用者の割合の差分が所定の閾値以上である属性が存在する場合に、推定検索クエリを特定する。
【0056】
また、特定部44は、検索クエリごとに、入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、対象分布情報とピークの位置が一致する分布情報に対応する検索クエリを特定してもよい。例えば、図1の例において、特定部44は、利用者群#1に含まれる利用者が入力した検索クエリごとに、入力した利用者の属性ごとの分布を示す分布情報を生成する。そして、特定部44は、生成した分布情報のうち、分布G2とピークの位置が一致する分布情報に対応する検索クエリを、推定検索クエリとして特定する。
【0057】
また、特定部44は、分布情報のうち、対象分布情報とピークの位置が一致する複数の分布情報のそれぞれに対応する複数の検索クエリを分類したクラスタを特定してもよい。例えば、図1の例において、特定部44は、分布情報のうち、分布G2とピークの位置が一致する複数の分布情報のそれぞれに対応する複数の検索クエリ(推定検索クエリ)を分類したクラスタを特定する。
【0058】
また、特定部44は、検索クエリのクラスタごとに、クラスタに属する検索クエリを入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、対象分布情報とピークの位置が一致する分布情報に対応するクラスタに属する検索クエリを特定してもよい。例えば、図1の例において、特定部44は、利用者群#1に含まれる利用者が入力した検索クエリのクラスタごとに、クラスタに属する検索クエリを入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、分布G2とピークの位置が一致する分布情報に対応するクラスタに属する検索クエリを、推定検索クエリとして特定する。
【0059】
また、特定部44は、検索クエリのうち、対象分布情報のピークの位置に対応する属性を有する利用者が入力した検索クエリを特定してもよい。例えば、図1の例において、特定部44は、利用者群#1に含まれる利用者が入力した検索クエリのうち、分布G2のピークの位置に対応する属性「男性、年齢が30-34」及び「男性、年齢が45-49」を有する利用者が入力した検索クエリを、推定検索クエリとして特定する。
【0060】
また、特定部44は、利用者が入力した検索クエリに応じた利用者のクラスタごとに、クラスタに属する利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、対象分布情報とピークの位置が一致する分布情報に対応するクラスタに対応する検索クエリを特定してもよい。例えば、図1の例において、特定部44は、利用者群#1に含まれる利用者が入力した検索クエリに応じて、利用者群#1をクラスタに分類し、クラスタごとに、クラスタに属する利用者の属性ごとの分布を示す分布情報を生成する。そして、特定部44は、生成した分布情報のうち、分布G2とピークの位置が一致する分布情報に対応するクラスタを特定し、特定したクラスタに対応する検索クエリを、推定検索クエリとして特定する。
【0061】
(提供部45について)
提供部45は、特定部44により特定された検索クエリに関する情報を提供する。例えば、図1の例において、提供部45は、推定検索クエリを示す情報と、分布G3を示す分布情報とを提供する。
【0062】
〔4.情報処理のフロー〕
図6を用いて、実施形態に係る情報処理装置10の情報処理の手順について説明する。図6は、実施形態に係る情報処理の手順の一例を示すフローチャートである。
【0063】
図6に示すように、情報処理装置10は、所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する(ステップS101)。続いて、情報処理装置10は、所定の検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する(ステップS102)。続いて、情報処理装置10は、基準分布情報と、対象分布情報とを比較する(ステップS103)。基準分布情報と、対象分布情報とを比較した結果、基準分布情報のピークの位置と、対象分布情報のピークの位置とが一致しない場合(ステップS104;No)、情報処理装置10は、所定の条件を満たす検索クエリを特定し(ステップS105)、処理を終了する。
【0064】
一方、基準分布情報のピークの位置と、対象分布情報のピークの位置とが一致する場合(ステップS104;Yes)、情報処理装置10は、処理を終了する。
【0065】
〔5.変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。
【0066】
〔5-1.処理態様について〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0067】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0068】
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0069】
〔6.効果〕
上述してきたように、実施形態に係る情報処理装置10は、取得部41と、生成部42と、比較部43と、特定部44と、提供部45とを有する。取得部41は、所定の検索クエリと関連する行動を行った利用者の属性ごとの分布を示す基準分布情報を取得する。生成部42は、検索クエリを入力した利用者の属性ごとの分布を示す対象分布情報を生成する。比較部43は、基準分布情報と、対象分布情報とを比較する。特定部44は、比較部43による比較結果に基づいて、所定の条件を満たす検索クエリを特定する。また、比較部43は、基準分布情報のピークの位置と、対象分布情報のピークの位置とを比較する。そして、特定部44は、基準分布情報のピークの位置と、対象分布情報のピークの位置とが一致しない場合に、所定の条件を満たす検索クエリを特定する。また、比較部43は、利用者の属性ごとに、基準分布情報が示す分布と、対象分布情報が示す分布とを比較する。そして、また、特定部44は、基準分布情報が示す分布と、対象分布情報が示す分布との差分が所定の閾値以上である場合に、所定の条件を満たす検索クエリを特定する。提供部45は、特定部44により特定された検索クエリに関する情報を提供する。
【0070】
これにより、実施形態に係る情報処理装置10は、分析対象の利用者群にノイズが含まれている場合には、利用者群が入力した検索クエリの中から、所定の検索クエリに関する行動と関連性の低い検索クエリを特定することができるため、所定の事象との関連性を有さない検索クエリを特定することができる。
【0071】
また、実施形態に係る情報処理装置10において、例えば、特定部44は、検索クエリごとに、入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、対象分布情報とピークの位置が一致する分布情報に対応する検索クエリを特定する。また、特定部44は、分布情報のうち、対象分布情報とピークの位置が一致する複数の分布情報のそれぞれに対応する複数の検索クエリを分類したクラスタを特定する。また、特定部44は、検索クエリのクラスタごとに、クラスタに属する検索クエリを入力した利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、対象分布情報とピークの位置が一致する分布情報に対応するクラスタに属する検索クエリを特定する。また、特定部44は、検索クエリのうち、対象分布情報のピークの位置に対応する属性を有する利用者が入力した検索クエリを特定する。また、特定部44は、利用者が入力した検索クエリに応じた利用者のクラスタごとに、クラスタに属する利用者の属性ごとの分布を示す分布情報を生成し、当該分布情報のうち、対象分布情報とピークの位置が一致する分布情報に対応するクラスタに対応する検索クエリを特定する。
【0072】
これにより、実施形態に係る情報処理装置10は、各種の態様で所定の事象との関連性を有さない検索クエリを特定することができるため、特定する検索クエリの精度を向上させることができる。
【0073】
〔7.ハードウェア構成〕
また、上述してきた各実施形態に係る情報処理装置10は、例えば、図7に示すような構成のコンピュータ1000によって実現される。以下、情報処理装置10を例に挙げて説明する。図7は、情報処理装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0074】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0075】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
【0076】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0077】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0078】
例えば、コンピュータ1000が情報処理装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部40の機能を実現する。また、HDD1400には、情報処理装置10の記憶装置内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
【0079】
〔8.その他〕
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0080】
また、上述した情報処理装置10は、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0081】
また、特許請求の範囲に記載した「部」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0082】
10 情報処理装置
20 通信部
30 記憶部
31 利用者情報データベース
32 企業情報データベース
40 制御部
41 取得部
42 生成部
43 比較部
44 特定部
45 提供部
100 管理者端末
図1
図2
図3
図4
図5
図6
図7