(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-05-16
(45)【発行日】2022-05-24
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G06Q 30/02 20120101AFI20220517BHJP
【FI】
G06Q30/02 312
(21)【出願番号】P 2021070979
(22)【出願日】2021-04-20
【審査請求日】2022-01-20
【早期審査対象出願】
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】上森 規央
(72)【発明者】
【氏名】田村 健
(72)【発明者】
【氏名】森 琢郎
(72)【発明者】
【氏名】岡本 あゆみ
(72)【発明者】
【氏名】石川 葉子
(72)【発明者】
【氏名】尾崎 弘宗
【審査官】大野 朋也
(56)【参考文献】
【文献】特開2015-185153(JP,A)
【文献】特開2014-215915(JP,A)
【文献】特開2011-059832(JP,A)
【文献】特開2020-046895(JP,A)
【文献】特開2020-091816(JP,A)
【文献】米国特許出願公開第2015/0293989(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
所定の条件に合致するユーザが検索した検索ワードの中から、前記所定の条件との関連性の強さを評価した第1の指標値が第1の閾値未満であり、かつ前記所定の条件との関連性を示す第2の指標値が第2の閾値以上である検索ワードを特定する特定部と、
前記特定部により特定された前記検索ワードに紐づく情報を統計的に処理した統計情報を提供する提供部と
を備えることを特徴とする情報処理装置。
【請求項2】
前記特定部は、
前記第1の指標値として、前記所定の条件に合致する第1ユーザ群における前記検索ワードの出現確率と、前記第1ユーザ群を含む第2ユーザ群における前記検索ワードの出現確率とに基づくリフト値を算出する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記特定部は、
前記第2の指標値として、前記検索ワードの検索数を用いる
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記特定部は、
前記所定の条件に合致するユーザの数が第3の閾値未満である場合、前記ユーザの数が前記第3の閾値以上となるように、前記所定の条件を拡張する
ことを特徴とする請求項1~3のいずれか1つに記載の情報処理装置。
【請求項5】
前記特定部は、
前記所定の条件の内容に応じて、前記第3の閾値を動的に変更する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記提供部は、
前記検索ワード間の類似度に基づく前記検索ワードの分類結果を反映した前記統計情報を提供する
ことを特徴とする請求項1~5のいずれか1つに記載の情報処理装置。
【請求項7】
前記提供部は、
匿名化した前記統計情報を提供する
ことを特徴とする請求項1~6のいずれか1つに記載の情報処理装置。
【請求項8】
コンピュータが実行する情報処理方法であって、
所定の条件に合致するユーザが検索した検索ワードの中から、前記所定の条件との関連性の強さを示す第1の指標値が第1の閾値未満であり、かつ前記所定の条件との関連性を示す第2の指標値が第2の閾値以上である検索ワードを特定する特定工程と、
前記特定工程により特定された前記検索ワードに紐づく情報を統計的に処理した統計情報を提供する提供工程と
を含むことを特徴とする情報処理方法。
【請求項9】
コンピュータに、
所定の条件に合致するユーザが検索した検索ワードの中から、前記所定の条件との関連性の強さを示す第1の指標値が第1の閾値未満であり、かつ前記所定の条件との関連性を示す第2の指標値が第2の閾値以上である検索ワードを特定する特定手順と、
前記特定手順により特定された前記検索ワードに紐づく情報を統計的に処理した統計情報を提供する提供手順と
を実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、ビジネスシーン等に活用することを目的として、インターネットを介してやり取りされる膨大なデータを様々な側面から分析するための様々な技術が提案されている。たとえば、購買履歴データ等を用いて時期のトレンドを考慮して顧客を分析する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、ターゲットとなるユーザの潜在的な需要を調査する上で有益な情報を提供できない。たとえば、トレンドを考慮した顧客分析では、トレンドの背面に隠れた顧客の潜在的な需要を洗い出すことは難しい。このため、従来の技術は、たとえば、利用者が顧客の潜在的な需要の分析を必要としている場合、利用者が必要とする情報を提供できない。
【0005】
本願は、上記に鑑みてなされたものであって、ターゲットとなるユーザの潜在的な需要を調査する上で有益な情報を提供できる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、特定部と、提供部とを備える。特定部は、所定の条件に合致するユーザが検索した検索ワードの中から、所定の条件との関連性の強さを評価した第1の指標値が第1の閾値未満であり、かつ所定の条件との関連性を示す第2の指標値が第2の閾値以上である検索ワードを特定する。提供部は、特定部により特定された検索ワードに紐づく情報を統計的に処理した統計情報を提供する。
【発明の効果】
【0007】
実施形態の態様の1つによれば、ターゲットとなるユーザの潜在的な需要を調査する上で有益な情報を提供できる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る情報処理の一例を示す図である。
【
図2】
図2は、実施形態に係る統計情報の概要を示す図である。
【
図3】
図3は、実施形態に係る統計情報の概要を示す図である。
【
図4】
図4は、実施形態に係る統計情報の概要を示す図である。
【
図5】
図5は、実施形態に係る統計情報の概要を示す図である。
【
図6】
図6は、実施形態に係る統計情報の概要を示す図である。
【
図7】
図7は、実施形態に係る情報処理装置の構成例を示す図である。
【
図8】
図8は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。
【
図9】
図9は、変形例に係る統計情報の提供例を示す図である。
【
図10】
図10は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下に説明する実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下に説明する実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
[1.情報処理の概要]
以下、図面を参照しつつ、実施形態に係る情報処理の一例を説明する。
図1は、実施形態に係る情報処理の一例を示す図である。なお、
図1では、端末装置10の利用者の一例としてユーザU01を例示するが、実施形態に係る情報処理装置100は、任意の数の端末装置および任意の数の利用者について、以下に説明する情報処理を並列して実行できる。また、実施形態に係る情報処理システム1は、
図1に示す例よりも多くのサービス提供装置20や、他の装置を含む形態であってもよい。
【0011】
図1に示すように、実施形態に係る情報処理システム1は、端末装置10と、サービス提供装置20と、情報処理装置100とを備える。端末装置10、サービス提供装置20、及び情報処理装置100は、それぞれ有線又は無線によりネットワークN(たとえば、
図7参照)に接続される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網、固定電話網等)や、地域IP(Internet Protocol)網や、インターネット等の通信ネットワークである。ネットワークNは、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。端末装置10、サービス提供装置20、及び情報処理装置100は、ネットワークNを通じて相互に通信できる。
【0012】
図1に示す端末装置10は、ユーザU01が利用する情報処理装置である。また、端末装置10は、スマートフォンやタブレット端末などのスマートデバイス、又はデスクトップPC(Personal Computer)やノートPCなどの任意のパーソナルコンピュータなどにより実現される。
【0013】
また、端末装置10は、情報処理装置100などから提供される情報を、ウェブブラウザやアプリケーションにより表示できる。なお、端末装置10は、情報の表示処理を実現する制御情報を情報処理装置100などから受け取った場合には、制御情報に従って表示処理を実現する。
【0014】
また、端末装置10は、情報処理装置100から統計情報の提供を受けるためのターゲット情報の指定をユーザU01から受け付ける。ターゲット情報は、ターゲットとするユーザ群(ユーザセグメント)を特定するための所定の条件であり、たとえば、デモグラフィック属性や、サイコグラフィック属性や、位置情報などが含まれる。
【0015】
また、端末装置10は、情報処理装置100から受信した統計情報を出力する。ユーザU01は、端末装置10が出力した統計情報を参照できる。
【0016】
サービス提供装置20は、ポータルサイトなどのオンラインコンテンツを介してインターネット上の各種サービスを提供する情報処理装置である。サービス提供装置20が提供するサービスは、検索エンジンサイトや、ニュースサイトや、技術解説サイトや、ショッピングサイトや、ファイナンスサイト(株価サイト)や、路線検索サイトや、地図提供サイトや、旅行サイトや、飲食店紹介サイトや、ウェブブログなどに関するウェブページなどを介して提供される各種サービスが含まれる。また、サービス提供装置20は、端末装置10にインストールされた各種アプリ(例えば、ポータルアプリ、ニュースアプリ、オークションアプリ、天気予報アプリ、ショッピングアプリ、ファイナンス(株価)アプリ、路線検索アプリ、地図提供アプリ、旅行アプリ、飲食店紹介アプリ、ブログ閲覧アプリ等)に表示する情報を提供できる。また、サービス提供装置20は、端末装置10にインストールされた各種アプリ(例えば、ポータルアプリ、ニュースアプリ、オークションアプリ、天気予報アプリ、ショッピングアプリ、ファイナンス(株価)アプリ、路線検索アプリ、地図提供アプリ、旅行アプリ、飲食店紹介アプリ、ブログ閲覧アプリ等)に表示する情報を提供できる。
【0017】
また、サービス提供装置20は、端末装置10に提供する各種サービスに対するユーザの操作や閲覧等に基づくユーザ属性(例えば、年齢、性別、地域等のデモフラフィック属性や、各種サービスのオンラインコンテンツの利用履歴等に基づいて推定されるサイコグラフィック属性など)や、各種サービス等におけるユーザの行動履歴を収集し、ユーザIDと対応付けて格納する。また、サービス提供装置20は、この各種サービスを介して、端末装置10から、検索ワードを受信できる。また、サービス提供装置20は、受信された検索ワードを、検索履歴(検索ログ)として蓄積できる。
【0018】
また、サービス提供装置20は、端末装置10にインストールされた各種サービスに関するアプリケーションに表示する情報を、端末装置10に配信する装置であってもよい。また、サービス提供装置20は、アプリケーションのデータそのものを配信するサーバであってもよい。なお、サービス提供装置20は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)等のスクリプト言語やCSS(Cascading Style Sheets)等のスタイルシート言語により記述される。なお、サービス提供装置20から配信されるアプリケーションそのものを制御情報とみなしてもよい。サービス提供装置20は、たとえば、サーバ装置やクラウドシステムなどにより実現される。
【0019】
図1に示す情報処理装置100は、端末装置10の利用者であるユーザU01に対して、ターゲット情報に合致する統計情報をユーザU01に提供するための情報処理を行う情報処理装置である。例えば、情報処理装置100は、サーバ装置やクラウドシステムなどにより実現される。以下に説明するように、情報処理装置100は、ユーザU01に対して統計情報を提供するための情報処理を実行する。
【0020】
まず、情報処理装置100は、端末装置10から受信したターゲット情報(「所定の条件」の一例)に合致するユーザを特定し、実施形態に係る情報処理を行うためのデータをサンプリングする(ステップS11)。具体的には、情報処理装置100は、ターゲット情報(たとえば、「占い好き」)に合致するユーザ数(人数)を問合せるための問合せ要求をサービス提供装置20に送信する。サービス提供装置20は、情報処理装置100からの問合せ要求に応じて、各種サービスに関するサービス利用者の情報が格納されているデータベースから、ターゲット情報に合致するユーザ群(ユーザセグメント)をセグメンテーションし、ターゲット情報に合致するユーザ群に含まれるユーザ数を計数する。サービス提供装置20は、計数したユーザ数を情報処理装置100に通知する。
【0021】
ここで、情報処理装置100は、サービス提供装置20から通知されたユーザ数が予め定められる閾値Z(第3の閾値の一例)に満たない場合、ユーザ数が閾値Z(所定人数)以上となるように、ターゲット情報を拡張する。たとえば、情報処理装置100は、ターゲット情報に合致するユーザに類似する類似ユーザを探し出し、探し出した類似ユーザを特定するための条件を用いてターゲット情報を拡張する。そして、情報処理装置100は、拡張したターゲット情報に合致するユーザ数を問合せるための問合せ要求をサービス提供装置20に改めて送信する。そして、情報処理装置100は、ターゲット情報に合致するユーザ数が閾値Z以上となった場合、ターゲット情報に合致するユーザに紐づくデータをサービス提供装置20から取得する。なお、情報処理装置100は、ターゲット情報の内容に応じて、前述の閾値Zを動的に変更できる。たとえば、情報処理装置100は、予め規定される複数の閾値の中から、ターゲット情報として指定された条件の数に対応する閾値を動的に選択して用いることができる。より具体的には、ターゲット情報として指定された条件の数が多くなるほど、必要な数だけデータサンプルを確保できるように、閾値の条件を緩和することが考えられる。
【0022】
サンプリングが終了すると、情報処理装置100は、サービス提供装置20から取得したデータの中から、ターゲット情報に合致するユーザ群の各ユーザが検索した検索ワードを抽出し、抽出した検索ワードについてスコアリングを行う(ステップS12)。具体的には、情報処理装置100は、検索ワードごとに、ターゲット情報との関連性の強さを評価した特徴度(「第1の指標値」の一例)を算出する。たとえば、情報処理装置100は、特徴度として、ターゲット情報に合致する第1ユーザ群における検索ワードの出現確率と、第1ユーザ群を含む第2ユーザ群における検索ワードの出現確率とに基づくリフト値を算出する。また、情報処理装置100は、検索ワードごとの検索数を集計する。検索数は、ターゲット情報との関連性を示す第2の指標値として機能する情報の一例である。
【0023】
スコアリングが終了すると、情報処理装置100は、ターゲット情報に合致するユーザ群の各ユーザが検索した検索ワードのうち、潜在層(潜在的なユーザ層)に対応する検索ワードを特定する(ステップS13)。具体的には、情報処理装置100は、ターゲット情報に合致する各ユーザが検索した検索ワードの中から、特徴度が閾値X(「第1の閾値」の一例)未満であり、かつ検索数が閾値Y(「第2の閾値」の一例)以上である各検索ワードを特定する。つまり、情報処理装置100は、ターゲット情報(たとえば、「占い好き」)との関連性の強さがそれほど強くはないが、ターゲット情報との間に一定の関連性を有する各検索ワードを特定する。これにより、情報処理装置100は、ターゲット情報に合致するユーザの別の側面を浮き彫りにすることができ、ターゲットとなるユーザの潜在的な需要を調査する上で有益な情報をユーザU01に提供できる。
【0024】
そして、情報処理装置100は、特定した各検索ワードに紐づく情報を、統計的に処理した統計情報を生成し(ステップS14)、生成した統計情報を端末装置10に送信して(ステップS15)、ユーザU01に提供する。
図2~
図6は、実施形態に係る統計情報の概要を示す図である。なお、
図2~
図6は、情報処理装置100がユーザU01に提供する統計情報の一例を示すものであり、ワードクラウドなどのような
図2~
図6に示す以外の情報をユーザU01に提供してもよい。
【0025】
図2に示すように、情報処理装置100は、特定した各検索ワードに紐づく特徴度と検索数を統計的に処理した統計情報(キーワードマップ)J1をユーザU01に提供できる。
図2に示す統計情報J1は、検索ワードを示すノードNDと、ノード間を連結するリンクLKとで構成される。
図2に示す例では、検索ワード:「W111」に対応するノードND111と、検索ワード:「W222」に対応するノードND222とがリンクLK12で連結され、ノードND222と、検索ワード:「W333」に対応するノードND333とがリンクLK23で連結されている。また、ノードNDは、検索ワードに対応する検索数が多いほど面積が大きくなるように構成される。
図2に示す例では、ノードND111の面積は、ノードND222の面積よりも大きい。つまり、ノードND111に対応する検索ワード:「W111」の検索数が、ノードND222に対応する検索ワード:「W222」の検索数よりも多いことを示している。
【0026】
また、情報処理装置100は、統計情報J1のノード間をリンクLKで連結する際、検索ワード間の類似度に基づく検索ワードの分類結果を統計情報J1に反映できる。たとえば、情報処理装置100は、Word2vecなどのアルゴリズムを用いて、検索ワードを含む検索履歴を用いて検索ワードからベクトル情報を生成する。そして、情報処理装置100は、生成したベクトル情報を用いて、ベクトル間の距離を算出する。情報処理装置100は、ベクトル間の距離により、検索ワード間の意味的な類似度を評価する。たとえば、情報処理装置100は、ベクトル間の距離を評価する尺度として、コサイン類似度や、ユークリッド距離や、双曲空間等の非ユークリッド空間中での距離や、マンハッタン距離や、マハラノビス距離などを利用できる。情報処理装置100は、類似する検索ワードに対応するノード間をリンクLKで連結して分類し、分類したクラスタごとに表示態様を変更できる。これにより、情報処理装置100は、潜在層(潜在的なユーザ層)に対応する検索ワード間の関係性をユーザU01に容易に把握させることができる。
【0027】
また、
図3に示すように、情報処理装置100は、特定した各検索ワードを、特徴度とユーザ数に基づいて統計的に処理した統計情報(散布図)J2をユーザU01に提供できる。これにより、情報処理装置100は、潜在層(潜在的なユーザ層)に対応する検索ワードとユーザ数との関係をユーザU01に容易に把握させることができる。
【0028】
また、
図4に示すように、情報処理装置100は、特定した各検索ワードを、特徴度に基づいて順位付けした統計情報J3をユーザU01に提供できる。
図4に示す統計情報J3は、「順位」の項目と、「検索ワード」の項目と、「男女比」の項目と、「年齢構成」の項目とを有している。
図4は、実施形態に係る統計情報J3の一例を示すものであり、
図4に示す例には限定されず、
図4に示す例とは異なる情報を含んでもよいし、
図4に示す例とは異なる態様で表現されていてもよい。
【0029】
図4に示す統計情報J3の「順位」の項目には、たとえば、検索ワードに対応する特徴度の順位が示される。
図4に示す統計情報J3の「検索ワード」の項目には、対応する検索ワードが示される。
図4に示す統計情報J3の「男女比」の項目には、対応する検索ワードを入力した男性の数(人数)と女性の数(人数)との比を抽象的に表現した情報が示される。
図4に示す統計情報J3の「年齢構成」の項目には、対応する検索ワードを入力した年齢層を抽象的に表現した情報が示される。
図4によれば、順位が1位の検索ワードは「W111」であり、男性よりも女性による入力が多く、20代や30代による入力が多いことが示されている。
【0030】
また、
図5に示すように、情報処理装置100は、特定した各検索ワードに紐づくユーザ群の購買履歴から商品又はサービスの購買数の情報を抽出し、順位付けした統計情報J4をユーザU01に提供できる。統計情報J4は、特定した各検索ワードに紐づくユーザの購買関連性を分析した情報である。
図5に示す統計情報J4は、「順位」の項目と、「商品」の項目と、「男女比」の項目と、「年齢構成」の項目とを有している。
図5は、実施形態に係る統計情報J4の一例を示すものであり、
図5に示す例には限定されず、
図5に示す例とは異なる情報を含んでもよいし、
図5に示す例とは異なる態様で表現されていてもよい。
【0031】
図5に示す統計情報J4の「順位」の項目には、たとえば、商品又はサービスの購入数の順位が示される。
図5に示す統計情報J4の「商品/サービス」の項目には、対応する商品又はサービスが示される。
図5に示す統計情報J4の「男女比」の項目には、対応する商品/サービスを購入した男性の数(人数)と女性の数(人数)との比を抽象的に表現した情報が示される。
図5に示す統計情報J4の「年齢構成」の項目には、対応する対応する商品/サービスを購入した年齢層を抽象的に表現した情報が示される。
図5によれば、順位が1位の商品又はサービスは「商品111」であり、女性よりも男性による購入が多く、購入者は40代から60代までの年代で構成されていることが示されている。
【0032】
また、
図6に示すように、情報処理装置100は、特定した各検索ワードに紐づくユーザ群の興味関心カテゴリの情報を抽出し、順位付けした統計情報J5をユーザU01に提供できる。統計情報J5は、特定した各検索ワードに紐づくユーザの興味関心関連性を分析した情報である。
図6に示す統計情報J5は、「順位」の項目と、「興味関心カテゴリ」の項目と、「男女比」の項目と、「年齢構成」の項目とを有している。
図6は、実施形態に係る統計情報J5の一例を示すものであり、
図6に示す例には限定されず、
図6に示す例とは異なる情報を含んでもよいし、
図6に示す例とは異なる態様で表現されていてもよい。
【0033】
図6に示す統計情報J5の「順位」の項目には、対応する興味関心カテゴリの該当者数の順位が示される。
図6に示す統計情報J5の「興味関心カテゴリ」の項目には、対応する興味関心カテゴリの情報が示される。情報処理装置100は、たとえば、サービス利用者のサイコグラフィック属性を分析・管理しているサービス提供装置20から興味関心カテゴリの情報を取得できる。
図6に示す統計情報J5の「男女比」の項目には、対応する興味関心カテゴリが付与された男性の数(人数)と女性の数(人数)との比を抽象的に表現した情報が示される。
図6に示す統計情報J5の「年齢構成」の項目には、対応する興味関心カテゴリの該当者の年齢層を抽象的に表現した情報が示される。
図6によれば、順位が1位の興味関心カテゴリは「興味関心カテゴリ111」であり、女性よりも男性の該当者が多く、該当者は20代から40代までの年代で構成されていることが示されている。
【0034】
[2.情報処理装置の構成]
図7を用いて、実施形態に係る情報処理装置100の構成について説明する。
図7は、実施形態に係る情報処理装置の構成例を示す図である。
【0035】
図7に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを備える。なお、
図7は、情報処理装置100の構成例を示すものであり、
図7に示す形態には限られず、
図7に示す以外の他の機能部を備える形態であってもよい。
【0036】
(通信部110)
通信部110は、例えば、ネットワークNと有線または無線で接続され、ネットワークNを介して、他の装置との間で情報の送受信を行う。通信部110は、例えば、NIC(Network Interface Card)やアンテナなどによって実現される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網や固定電話網など)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
【0037】
通信部110は、端末装置10からターゲット情報を受信する。ターゲット情報には、ターゲットとするユーザ群(ユーザセグメント)を特定するための所定の条件が含まれる。ターゲット情報は、たとえば、デモグラフィック属性や、サイコグラフィック属性や、位置情報などが含まれる。
【0038】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリなどの半導体メモリ素子、または、ハードディスクや光ディスクなどの記憶装置によって実現される。記憶部120は、制御部130の各部により実行される情報処理を実現するためのプログラム及びデータを記憶する。
【0039】
(制御部130)
制御部130は、情報処理装置100を制御するコントローラ(controller)である。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などによって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(例えば、情報処理プログラム)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現されてもよい。
【0040】
図7に示すように、制御部130は、特定部131と、提供部132とを有する。制御部130は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図7に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。例えば、制御部130は、端末装置10からターゲット情報を取得したり、サービス提供装置20からターゲット情報に合致するユーザのデータを取得したりする取得部を備えてもよい。また、制御部130が有する各部の接続関係は、
図7に示した接続関係に限られず、他の接続関係であってもよい。
【0041】
(特定部131)
特定部131は、ターゲット情報に合致するユーザが検索した検索ワードの中から、ターゲット情報との関連性の強さを評価した第1の指標値(たとえば、特徴度)が第1の閾値未満であり、かつターゲット情報との関連性を示す第2の指標値(たとえば、検索数)が第2の閾値以上である検索ワードを特定する。
【0042】
まず、特定部131は、端末装置10から受信したターゲット情報に合致するユーザを特定し、実施形態に係る情報処理のためのデータをサンプリングする。具体的には、特定部131は、ターゲット情報に合致するユーザ数をサービス提供装置20に問合せための問合せ要求を送信する。ここで、特定部131は、ターゲット情報に合致するユーザ数を集計した結果、予め定められる所定人数(たとえば、閾値Z)に満たない場合、ユーザ数(人数)が所定人数以上となるように、ターゲット情報を拡張する。たとえば、情報処理装置100は、ターゲット情報に合致するユーザに類似する類似ユーザを探し出し、探し出した類似ユーザを特定するための条件を用いてターゲット情報を拡張する。特定部131は、拡張したターゲット情報に合致するユーザの数をサービス提供装置20に問合せための問合せ要求を改めて送信する。そして、特定部131は、ターゲット情報に合致するユーザ数(人数)が所定人数以上となった場合、ターゲット情報に合致するユーザに紐づくデータ(たとえば、各種サービスにおける検索履歴)をサービス提供装置20から取得する。
【0043】
続いて、特定部131は、取得した検索履歴の中から、ターゲット情報に合致する各ユーザが検索した検索ワードを抽出し、抽出した検索ワードについてスコアリングを行う。具体的には、特定部131は、検索ワードごとに、ターゲット情報との関連性の強さを評価した特徴度を算出する。たとえば、特定部131は、特徴度として、ターゲット情報に合致する第1ユーザ群における検索ワードの出現確率と、第1ユーザ群を含む第2ユーザ群における検索ワードの出現確率とに基づくリフト値を算出する。第2のユーザ群として、例えば、サービス提供装置20が提供する各種サービスのすべてのサービス利用者が例示される。なお、特定部131は、算出したリフト値の対数をとってもよい。また、情報処理装置100は、検索ワードごとの検索数を集計する。
【0044】
スコアリング終了後、特定部131は、ターゲット情報に合致する各ユーザが検索した検索ワードのうち、潜在層(潜在的なユーザ層)に対応する検索ワードを特定する。具体的には、情報処理装置100は、ターゲット情報に合致する各ユーザが検索した検索ワードの中から、特徴度が閾値X未満であり、かつ検索数が閾値Y以上である各検索ワードを特定する。特定部131は、特定した各検索ワードの情報を提供部132に送る。
【0045】
なお、特定部131は、ターゲット情報の内容に応じて、前述の閾値Zを動的に変更できる。たとえば、特定部131は、予め規定される複数の閾値の中から、ターゲット情報として指定された条件の数に対応する閾値を動的に選択して用いてもよい。また、特定部131は、前述の閾値Zの変更に応じて、又は前述の閾値Zの変更とは無関係に、前述の閾値Xや閾値Yを動的に変更してもよい。
【0046】
提供部132は、特定部131により特定された各検索ワードに紐づく情報を統計的に処理した統計情報をユーザU01に提供する。たとえば、提供部132は、統計情報をユーザU01に提供する際、上述した
図2~
図6に示すように、匿名化した統計情報を提供する。これにより、法規制を遵守した情報提供を実現できる。
【0047】
[3.処理手順]
以下、
図8を用いて、実施形態に係る情報処理装置100による処理手順について説明する。
図8は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。
図8に示す処理手順は、情報処理装置100の制御部130により実行される。
図8に示す処理手順は、情報処理装置100の稼働中、繰り返し実行される。
【0048】
図8に示すように、特定部131は、通信部110を通じてターゲット情報を取得すると、取得したターゲット情報に合致するユーザ数(人数)を問合せるための問合せ通知をサービス提供装置20に送信する(ステップS101)。
【0049】
また、特定部131は、サービス提供装置20から通知されたユーザ数(人数)を集計し、集計したユーザ数(人数)が閾値Z以上であるかどうかを判定する(ステップS102)。
【0050】
特定部131は、集計したユーザの数が閾値Z未満であると判定した場合(ステップS102;No)、ターゲット情報を拡張して(ステップS103)、上述したステップS101の処理手順に戻る。
【0051】
一方、特定部131は、サービス提供装置20から通知されたユーザ数(人数)が閾値Z以上であると判定した場合(ステップS102;Yes)、ターゲット情報に合致するユーザに紐づく各種サービスにおける検索履歴をサービス提供装置20から取得する(ステップS104)。
【0052】
また、特定部131は、取得した検索履歴の中から、各ユーザが検索した検索ワードを抽出し、抽出した検索ワードのスコアリングを実行する(ステップS105)。具体的には、特定部131は、検索ワードごとに、ターゲット情報との関連性の強さを評価した特徴度を算出する。また、特定部131は、検索ワードごとの検索数を集計する。
【0053】
スコアリング終了後、特定部131は、ターゲット情報に合致する各ユーザが検索した検索ワードのうち、潜在層に対応する検索ワードを特定する(ステップS106)。具体的には、特定部131は、ターゲット情報に合致する各ユーザが検索した検索ワードの中から、特徴度が閾値X未満であり、かつ検索数が閾値Y以上である各検索ワードを特定する。
【0054】
また、提供部132は、特定部131により特定された各検索ワードに紐づく情報を統計的に処理した統計情報を生成して(ステップS107)、生成した統計情報を端末装置10に送信し(ステップS108)、
図8に示す処理手順を終了する。
【0055】
[4.変形例]
上述した実施形態に係る情報処理装置100は、上述の実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上述した情報処理装置100に係る実施形態の変形例について説明する。
【0056】
(4-1.統計情報の提供例)
情報処理装置100は、潜在層に対応する検索ワードに紐づく情報を統計的に処理した統計情報をユーザU01に提供する場合、ターゲット情報を構成する条件ごとの統計情報を比較可能に提供してもよい。
図9は、変形例に係る統計情報の提供例を示す図である。
【0057】
たとえば、端末装置10から送信されるターゲット情報が条件1と条件2とで構成される場合、情報処理装置100は、各条件に対応する検索ワードの特徴度とユーザ数との関係を比較可能に表示する統計情報J6-1をユーザU01に提供できる。また、情報処理装置100は、ユーザU01からの要求に応じて、ターゲット情報を構成する条件1及び条件2の双方に対応する検索ワードの特徴度とユーザ数との関係を表示する統計情報J6-2を提供することもできる。
【0058】
(4-2.ターゲット情報の設定に関する補助機能)
情報処理装置100は、ユーザU01に対して、ターゲット情報の候補を推薦する機能を備えてもよい。たとえば、情報処理装置100は、ユーザU01から予めユーザ情報の登録を受け付けておき、登録されたユーザ情報に基づいて、ターゲット情報の候補をユーザU01に推薦する。ユーザ情報としては、たとえば、ユーザU01が属する職種または業種の情報や、競合他社の情報や、主力商品の情報などが想定される。
【0059】
[5.ハードウェア構成]
実施形態に係る情報処理装置100は、例えば
図10に示すような構成のコンピュータ1000によって実現される。
図10は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【0060】
コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0061】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラムなどを格納する。
【0062】
HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータなどを格納する。通信インターフェイス1500は、ネットワーク(通信網)Nを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、ネットワーク(通信網)Nを介して他の機器へ送信する。
【0063】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタなどの出力装置、及び、キーボードやマウスなどの入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
【0064】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)などの光学記録媒体、MO(Magneto-Optical disk)などの光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリなどである。
【0065】
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、ネットワーク(通信網)Nを介してこれらのプログラムを取得してもよい。
【0066】
[6.その他]
上述した実施形態及び変形例に係る情報処理装置100は、ターゲット情報の設定により、様々な角度から情報を提供できる。たとえば、情報処理装置100は、ユーザU01から、競合他社の製品の購入履歴があるユーザをターゲットとして受け付けることにより、競合他社の製品を購入した購入者の属性を把握するための参考情報をユーザU01に提供できる。また、情報処理装置100は、ユーザU01から、自社のホームページと、競合他社のホームページの双方の閲覧履歴があるユーザをターゲットとして受け付けることにより、自社と競合他社とを比較している潜在顧客の特徴を把握するための参考情報をユーザU01に提供できる。
【0067】
上述した実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0068】
上述の実施形態及び変形例において、情報処理装置100による情報処理方法(
図8参照)を実現するために、情報処理装置100が有する制御部130の各部(特定部131、及び提供部132)に対応する処理機能は、情報処理装置100に予めインストールされている情報処理プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の情報処理プログラムとして柔軟に記述することにより実現されてもよい。
【0069】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部130の特定部131は、ターゲット情報に合致するユーザに紐づくデータ(検索履歴)を収集する機能と、潜在層に対応する検索ワードを特定する機能とに機能的に分散されていてもよい。
【0070】
また、上述の実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0071】
[7.効果]
上述の実施形態に係る情報処理装置100は、特定部131と、提供部132とを備える。特定部131は、ターゲット情報(所定の条件)に合致するユーザが検索した検索ワードの中から、ターゲット情報(所定の条件)との関連性の強さを評価した第1の指標値が第1の閾値未満であり、かつターゲット情報(所定の条件)との関連性を示す第2の指標値が第2の閾値以上である検索ワードを特定する。提供部132は、特定部131により特定された検索ワードに紐づく情報を統計的に処理した統計情報を提供する。
【0072】
このようにして、実施形態に係る情報処理装置100は、ターゲット情報に合致するユーザの別の側面を浮き彫りにすることができ、ターゲットとなるユーザの潜在的な需要を調査する上で有益な情報を提供できる。
【0073】
また、実施形態に係る情報処理装置100において、特定部131は、特徴度(第1の指標値)として、ターゲット情報(所定の条件)に合致する第1ユーザ群における検索ワードの出現確率と、第1ユーザ群を含む第2ユーザ群における検索ワードの出現確率とに基づくリフト値を算出する。これにより、実施形態に係る情報処理装置100は、ターゲット情報に合致するユーザにより検索されている検索ワードをできるだけ顕在化させることができる。
【0074】
また、実施形態に係る情報処理装置100において、特定部131は、第2の指標値として、検索ワードの検索数を用いる。これにより、実施形態に係る情報処理装置100は、ターゲット情報と検索ワードとの関連性を示す情報を簡易に取得できる。
【0075】
また、実施形態に係る情報処理装置100において、特定部131は、ターゲット情報(所定の条件)に合致するユーザの数(人数)が第3の閾値未満である場合、ユーザの数が第3の閾値以上となるように、所定の条件を拡張する。これにより、実施形態に係る情報処理装置100は、ターゲット情報に対応する統計情報を生成するために適切な量のデータサンプルを収集できる。
【0076】
また、実施形態に係る情報処理装置100において、特定部131は、ターゲット情報(所定の条件)の内容に応じて、第3の閾値を動的に変更する。これにより、実施形態に係る情報処理装置100は、データサンプルの量を適切に調整できる。
【0077】
また、実施形態に係る情報処理装置100において、提供部132は、検索ワード間の類似度に基づく検索ワードの分類結果を反映した統計情報を提供する。これにより、実施形態に係る情報処理装置100は、潜在層(潜在的なユーザ層)に対応する検索ワード間の関係性をユーザU01に容易に把握させることができる。
【0078】
また、実施形態に係る情報処理装置100において、提供部132は、匿名化した統計情報を提供する。これにより、実施形態に係る情報処理装置100は、法規制を遵守した情報提供を実現できる。
【0079】
以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0080】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、特定部は、特定手段や特定回路に読み替えることができる。
【符号の説明】
【0081】
10 端末装置
20 サービス提供装置
100 情報処理装置
110 通信部
120 記憶部
130 制御部
131 特定部
132 提供部
【要約】
【課題】ターゲットとなるユーザの潜在的な需要を調査する上で有益な情報を提供すること。
【解決手段】本願に係る情報処理装置は、特定部と、提供部とを備える。特定部は、所定の条件に合致するユーザが検索した検索ワードの中から、所定の条件との関連性の強さを評価した第1の指標値が第1の閾値未満であり、かつ所定の条件との関連性を示す第2の指標値が第2の閾値以上である検索ワードを特定する。提供部は、特定部により特定された検索ワードに紐づく情報を統計的に処理した統計情報を提供する。
【選択図】
図7