(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-21
(45)【発行日】2024-01-04
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20231222BHJP
G06F 16/9035 20190101ALI20231222BHJP
【FI】
G06Q50/10
G06F16/9035
(21)【出願番号】P 2021150450
(22)【出願日】2021-09-15
【審査請求日】2022-09-16
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】寺中 元希
(72)【発明者】
【氏名】坪内 孝太
【審査官】星野 裕
(56)【参考文献】
【文献】特開2012-022570(JP,A)
【文献】特開2019-020930(JP,A)
【文献】特開2014-006757(JP,A)
【文献】特表2014-507036(JP,A)
【文献】特開2000-311179(JP,A)
【文献】特表2020-530628(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/9035
(57)【特許請求の範囲】
【請求項1】
所定の行動を行った複数のシードユーザが入力した検索クエリ
と、当該検索クエリの共通性に基づいて
当該検索クエリの各々に付与されるスコアとの組を、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報
として生成する第1生成部と、
前記第1リスト情報から検索クエリを削除、または前記第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する第2生成部と、
前記第2リスト情報の精度を測定するテストの結果に基づいて、前記第1リスト情報の信頼性を評価する評価部と
を備えることを特徴とする情報処理装置。
【請求項2】
前記第2生成部は、
前記第1リスト情報に含まれる複数の検索クエリの組合せを前記第1リスト情報に追加する
ことを特徴とする請求項
1に記載の情報処理装置。
【請求項3】
前記第2生成部は、
前記第1リスト情報の生成過程で採用されなかった検索クエリの中から選択した複数の検索クエリの組合せを前記第1リスト情報に追加する
ことを特徴とする請求項1
または2に記載の情報処理装置。
【請求項4】
前記第2生成部は、
前記第1リスト情報に含まれる検索クエリと、前記第1リスト情報の生成過程で採用されなかった検索クエリの中から選択した検索クエリとの組合せを前記第1リスト情報に追加する
ことを特徴とする請求項1~
3のいずれか1つに記載の情報処理装置。
【請求項5】
コンピュータが実行する情報処理方法であって、
所定の行動を行った複数のシードユーザが入力した検索クエリ
と、当該検索クエリの共通性に基づいて
当該検索クエリの各々に付与されるスコアとの組を、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報
として生成する第1生成工程と、
前記第1リスト情報から検索クエリを削除、または前記第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する第2生成工程と、
前記第2リスト情報の精度を測定するテストの結果に基づいて、前記第1リスト情報の信頼性を評価する評価工程と
を含むことを特徴とする情報処理方法。
【請求項6】
コンピュータに、
所定の行動を行った複数のシードユーザが入力した検索クエリ
と、当該検索クエリの共通性に基づいて
当該検索クエリの各々に付与されるスコアとの組を、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報
として生成する第1生成手順と、
前記第1リスト情報から検索クエリを削除、または前記第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する第2生成手順と、
前記第2リスト情報の精度を測定するテストの結果に基づいて、前記第1リスト情報の信頼性を評価する評価手順と
を実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、インターネット上におけるユーザ行動の予測をする手法が知られている。例えば、特許文献1には、ユーザの行動を従来よりも高い精度で予測することを目的として、インターネット上のユーザの検索クエリの傾向を学習し、学習した検索クエリの傾向とその後のユーザの行動との関連性スコアを算出してモデルを生成し、このモデルを用いて他のユーザの行動を予測する技術が提案されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した技術では、生成した情報を信頼してもよいかどうかの確証を得ることが難しい。たとえば、結果論として有効な成果を上げるモデルが含まれている可能性があり、仮にABテストを行ったとしても、テストの内容に応じて適切ではないモデルが採用されてしまう場合もある。
【0005】
本願は、上記に鑑みてなされたものであって、生成した情報の信頼性を確かめることができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、第1生成部と、第2生成部と、評価部とを備える。第1生成部は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部は、第1リスト情報から検索クエリを削除、または第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する。評価部は、第2リスト情報の精度を測定するテストの結果に基づいて、第1リスト情報の信頼性を評価する。
【発明の効果】
【0007】
実施形態の態様の1つによれば、生成した情報の信頼性を確かめることができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る情報処理システムの一例を説明する図である。
【
図2】
図2は、実施形態に係る第2リスト情報の一例を示す図である。
【
図3】
図3は、実施形態に係る第2リスト情報の一例を示す図である。
【
図4】
図4は、実施形態に係る情報処理装置の構成例を示す図である。
【
図5】
図5は、実施形態に係る第1リスト情報の概要を示す図である。
【
図6】
図6は、実施形態に係る非採用クエリ情報の概要を示す図である。
【
図7】
図7は、実施形態に係るユーザ情報の概要を示す図である。
【
図8】
図8は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。
【
図9】
図9は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下に説明する実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下に説明する実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
また、以下の説明において、端末装置10をユーザと表記して説明する場合がある。すなわち、ユーザを端末装置10と読み替えることができる。
【0011】
[1.情報処理システム]
図1は、実施形態に係る情報処理システムの一例を説明する図である。
図1に示すように、実施形態に係る情報処理システムSYSは、端末装置10、及び情報処理装置100を有する。なお、情報処理システムSYSは、
図1に示す例に限られず、複数の端末装置10や複数の情報処理装置100を有していてもよい。
【0012】
端末装置10、及び情報処理装置100は、それぞれ有線又は無線によりネットワークN(たとえば、
図3参照)に接続される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網、固定電話網等)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNは、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。端末装置10、及び情報処理装置100は、ネットワークNを通じて、相互に通信できる。
【0013】
図1に示す端末装置10は、検索クエリを用いた各種サービスを利用するユーザが使用する情報処理装置である。たとえば、端末装置10は、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、PDA(Personal Digital Assistant)などにより実現される。
【0014】
また、端末装置10は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)などの無線通信網や、Bluetooth(登録商標)、無線LAN(Local Area Network)などの近距離無線通信を介してネットワークNに接続できる。
【0015】
また、端末装置10は、各種サービスを利用するための情報を、ウェブブラウザやアプリケーションにより表示できる。なお、端末装置10は、情報の表示処理を実現する制御情報を情報処理装置100などから受け取った場合には、制御情報に従って表示処理を実現する。
【0016】
また、端末装置10のユーザは、各種サービスの利用を通じて、情報処理装置100に対し、検索クエリの情報を提供する。たとえば、各種サービスのウェブページやアプリケーションに設けられている検索窓に各ユーザが入力した検索クエリの情報が情報処理装置100に提供される。
【0017】
図1に示す情報処理装置100は、検索クエリを用いた各種サービスなどを提供する情報処理装置である。情報処理装置100が提供する各種サービスには、各種アプリケーションに対応するAPI(Application Programming Interface)サービスや、各種オンラインサービスが含まれていてもよい。オンラインサービスとしては、インターネット接続や、検索サービスや、SNS(Social Networking Service)や、電子商取引サービスや、電子決済サービスや、オンラインゲームや、オンラインバンキングサービスや、オンライントレーディングサービスや、宿泊予約サービスや、チケット予約サービスや、動画配信サービスや、音楽配信サービスや、ニュース配信サービスや、地図情報サービスや、ルート検索サービスや、経路案内サービスや、路線情報サービスや、運行情報サービスや、天気情報サービスなどのサービスが該当し得る。
【0018】
また、情報処理装置100は、各種サービスの提供を通じて収集した検索クエリの情報を用いて、実施形態に係る情報処理を実行する情報処理装置である。情報処理装置100は、典型的にはサーバ装置であるが、メインフレームやワークステーションなどにより実現されてもよい。
【0019】
情報処理装置100がサーバ装置で実現される場合、単独のサーバにより実現されてもよいし、複数のサーバ装置及び複数のストレージ装置が協働して動作するクラウドシステムなどにより実現されてもよい。なお、情報処理装置100は、端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)などのスクリプト言語やCSS(Cascading Style Sheets)などのスタイルシート言語により記述される。なお、情報処理装置100から配信されるアプリケーションそのものを制御情報とみなしてもよい。
【0020】
[2.情報処理]
以下、情報処理システムSYSにおける情報処理の一例を説明する。なお、以下の説明において、実施形態に係る情報処理の対象は、各種サービスを利用するユーザである。また、以下の説明において、シードユーザUの一群を「ユーザ群UG」と総称する。シードユーザUは、「〇〇を買った」、「〇〇に行った」、「〇〇している」といった所定の行動を行ったユーザや、特定の属性(興味嗜好など)を有するユーザなど、特定のユーザコンテキストを有するユーザに該当する。
【0021】
なお、以下に説明する情報処理は、情報処理の対象がシードユーザUを含む複数のユーザである場合に限られず、商品や、街や、サービスなど、情報を収集可能な対象であれば、どのような対象に対しても適用できる。
【0022】
まず、
図1に示す例において、情報処理装置100は、ユーザ群UGを特定する。そして、情報処理装置100は、ユーザ群UGに含まれるシードユーザUが入力した検索クエリの共通性に基づいて、シードユーザUが入力した検索クエリと所定の行動との関係性を数値化した第1リスト情報を生成し、記憶する。
【0023】
たとえば、情報処理装置100は、「〇〇を買った」「〇〇に興味がある」という条件(タイトル)を満たすユーザをシードユーザUとして収集し、シードユーザUが入力した検索クエリの共通性に基づいたスコアを付与した第1リストを作成する。具体的には、「眼鏡をかけている」というシードユーザUを収集し、検索クエリ:「眼鏡」に「70点」、検索クエリ:「眼鏡ふき」に「50点」、検索クエリ:「リンゴ」にスコア「-50点」といったようなスコアを付与し、検索クエリとスコアとの組である第1リストを作成する。
【0024】
上述したシードユーザUの一群であるユーザ群UGの特定は、任意の方法を用いて行うことができる。たとえば、情報処理装置100は、各種の購買履歴や利用履歴、位置履歴などの各種の情報に基づいて、想定される行動を行ったユーザをシードユーザUであると推定し、ユーザ群UGを特定してもよい。具体的には、ある所定の店舗の名称を検索クエリとして入力し、その後、その所定の店舗を実際に訪問した訪問者(シードユーザU)を推定することによりユーザ群UGを特定してもよい。また、別の例として、イベントの名称を検索クエリとして入力し、その後、そのイベントに実際に参加した参加者(シードユーザU)を推定することによりユーザ群UGを特定してもよい。また、更に別の例として、ある商品の名称を検索クエリとして入力し、その後、その名称の商品を実際に購入した購入者(シードユーザU)を推定することによりユーザ群UGを特定してもよい。また、情報処理装置100は、実際に所定の店舗(たとえば、配信済みの広告と対応する店舗)を利用した利用者(シードユーザU)を推定することによりユーザ群UGを特定してもよい。また、情報処理装置100は、所定の広告やウェブページ、映画や音楽などのコンテンツを視聴した視聴者(シードユーザU)を推定することによりユーザ群UGを特定してもよい。
【0025】
また、情報処理装置100は、第1リストにおける検索クエリのスコアは、以下のような機械学習により生成される行動モデルから求めることができる。たとえば、情報処理装置100は、シードユーザUが入力した検索クエリを正例とし、ランダムに選択したシードユーザU以外の他のユーザが入力した検索クエリを負例としたときに、正例を入力した際により高い値を出力し、負例を入力した際により低い値を出力するように学習モデルの学習を行う。このとき、学習には任意の手法が採用可能である。たとえば、モデルとしてニューラルネットワークが採用される場合は、バックプロパゲーションなどにより実現可能である。
【0026】
また、情報処理装置100は、シードユーザUが共通して入力している検索クエリについては、より高い値の数値が出力されるようにモデルを学習してもよい。たとえば、正例となる検索クエリを入力したシードユーザUの数が多ければ多い程、より高い値を出力するようにモデルを学習してもよい。また、負例となる検索クエリを入力した他のユーザの数が多い程、より小さい値(負の値)を出力するようにモデルを学習してもよい。そして、情報処理装置100は、各検索クエリと、このような学習モデルに検索クエリを入力した際に出力したスコアとの組のリストを「第1リスト情報」として生成する。すなわち、情報処理装置100は、所定の行動を行ったシードユーザUが入力した各検索クエリと、検索クエリの各々に対応する上述のスコア(検索クエリと所定の行動との間の関係性を示すスコア)との組を「第1リスト情報」として生成する。なお、この第1リスト情報は、所定の行動ごとに生成された行動モデルを用いて、所定の行動ごとに生成される。
【0027】
また、情報処理装置100は、ユーザ群UGが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動とシードユーザUを含む複数のユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて、シードユーザUを含む複数のユーザを順位付けしたユーザリストを生成できる。
【0028】
たとえば、情報処理装置100は、シードユーザUを含む各ユーザの中から処理対象とするユーザの選定を行い、選定した各ユーザが入力した検索クエリと対応付けられたスコアを第1リスト情報から特定する。なお、情報処理装置100は、処理対象とするユーザを無作為に選定してもよいし、所定の条件に基づいて選定してもよい。そして、情報処理装置100は、特定したスコアの合計を用いて、所定の行動と、複数ユーザの中から選定した各ユーザとの間の関係性を示すユーザリストを導出する。たとえば、ユーザリストにおいて、所定の行動と関係性が高いユーザはスコアが高く、所定の行動と関係性が低いユーザはスコアが低くなる。
【0029】
以下、情報処理装置100によるユーザリストの生成について具体的に説明する。シードユーザUを含む各ユーザが入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第1リスト情報から取得し、取得したスコアの合計値を算出する。このようにすれば、各ユーザが入力した複数の検索クエリと所定の行動との関係性を数値として表すことができるため、単一の検索クエリの数値化と比較してより信頼性の高い数値化を実現できる。
【0030】
次に、情報処理装置100は、各ユーザについてスコアの合計値を計算した後、スコアの高い順に各ユーザを順位付けするとともに、順位順に各ユーザが入力した検索クエリを対応付けたユーザリストを生成する。このユーザリストは、どのような検索クエリを入力したユーザが、所定の行動との関連性が強いかを示すリストとして機能する。このユーザリストは、検索クエリと所定の行動との関連性の分析や、ユーザの分析などに用いられる。なお、このユーザリストは、シードユーザUを選定する際に設定される行動(たとえば、「〇〇を買った」、「〇〇に行った」、「〇〇している」など)といった所定の行動ごとに生成される。
【0031】
上述したユーザリストを用いることにより、ユーザが興味を有する可能性が高い情報の提供を実現できると考えられる。たとえば、ある店舗を訪問したという行動と対応するユーザリストには、その行動と関連性が高いユーザのランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、ユーザリストを用いることにより、ランキングの順位が高いユーザに対し、その店舗に関する広告を提供することで、広告効果を向上させることができると考えられる。また、ある商品を購入したという行動と対応するユーザリストには、その行動と関連性が高いユーザのランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、ユーザリストを用いることにより、ランキングの順位が高いユーザに対し、その商品またはその商品と関連する商品に関する広告を提供することで、広告効果を向上させることができると考えられる。
【0032】
一方、上述したユーザリストについて、ユーザの行動を正確に反映したリストであるかどうかの確証を得ることは難しい。すなわち、スコアに基づいてユーザを順位付けした際に、果たしてどの順位までのユーザが所定の行動との関係性を有するのかという点について、実際には定かではない。たとえば、スコアが高いほど、所定の行動を取る可能性が高いという推測が働くが、スコアがどの程度高ければ所定の行動と関連性が高いのかを見極めることは難しい。また、スコアの高さと、所定の行動との関係性の高さとの相関関係の検証も十分とは言い切れない。
【0033】
そこで、実施形態に係る情報処理装置100は、以下に説明する情報処理により、ユーザリストの元となる第1リスト情報の信頼性を確認するための情報処理方法を提案する。
【0034】
まず、情報処理装置100は、第1リスト情報から検索クエリを削除、または第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する(ステップS1)。次に、情報処理装置100は、生成した第2リスト情報の精度を測定するテストを実行する(ステップS2)。そして、情報処理装置100は、第2リスト情報の精度を測定するテストの結果に基づいて、第1リスト情報の信頼性を評価する(ステップS3)。
【0035】
以下、
図2及び
図3を用いて、第2リスト情報の一例を説明する。
図2及び
図3は、実施形態に係る第2リスト情報の一例を示す図である。
【0036】
まず、
図2に示すように、情報処理装置100は、信頼性の評価対象となる第1リスト情報LT1-1と、非採用クエリ情報LT1-2とを取得する。なお、非採用クエリ情報LT1-2は、第1リスト情報LT1-1の生成過程で採用されなかった検索クエリの情報である。
図2に示す例では、行動Aに対応する第1リスト情報LT1-1と、非採用クエリ情報LT1-2とが取得されている。
【0037】
次に、
図2に示すように、情報処理装置100は、第1リスト情報LT1-1に含まれる検索クエリの一部を削除することにより、複数の第2リスト情報LT2-1を生成する。なお、情報処理装置100は、第2リスト情報LT2-1を生成する際、検索クエリを1つずつ削除してもよいし、任意の数の検索クエリを一度に削除してもよい。また、情報処理装置100は、第2リスト情報LT2-1から削除する検索クエリの数に上限を設けてもよい。
【0038】
また、
図2に示すように、情報処理装置100は、第1リスト情報LT1-1に対して、非採用クエリ情報LT1-2に含まれている検索クエリを追加することにより、複数の第2リスト情報LT2-2を生成する。なお、情報処理装置100は、第2リスト情報LT2-2を生成する際、非採用クエリ情報LT1-2に含まれている検索クエリを1つずつ追加してもよいし、第1リスト情報LT1-1から2つ以上の検索クエリを一度に削除してもよい。また、情報処理装置100は、第2リスト情報LT2-1から削除する検索クエリの数に上限を設けてもよい。なお、情報処理装置100は、第1リスト情報LT1-1に対して、非採用クエリ情報LT1-2には含まれない任意の検索クエリを追加してもよい。
【0039】
また、
図3に示すように、情報処理装置100は、第1リスト情報LT1-1に対して、第1リスト情報LT1-1に含まれる検索クエリの組合せを追加することにより、第2リスト情報LT2-3を生成することもできる。なお、
図3に示す例では、第1リスト情報LT1-1に対して、1対1の検索クエリの組合せが追加される場合を示しているが、3つ以上の検索クエリの組合せを追加してもよい。また、情報処理装置100は、検索クエリの組合せを1つずつ追加してもよいし、2つ以上の組合せを一度に追加してもよい。
【0040】
また、
図3に示すように、情報処理装置100は、第1リスト情報LT1-1に対して、非採用クエリ情報LT1-2に含まれる検索クエリの中から選択した複数の検索クエリの組合せを追加することにより、第2リスト情報LT2-4を生成することもできる。なお、
図3に示す例では、第1リスト情報LT1-1に対して、1対1の検索クエリの組合せが追加される場合を示しているが、3つ以上の検索クエリの組合せを追加してもよい。また、情報処理装置100は、検索クエリの組合せを1つずつ追加してもよいし、2つ以上の組合せを一度に追加してもよい。
【0041】
また、
図3に示すように、情報処理装置100は、第1リスト情報LT1-1に対して、第1リスト情報LT1-1に含まれる検索クエリと、非採用クエリ情報LT1-2に含まれる検索クエリの中から選択した検索クエリとの組合せを追加することにより、第2リスト情報LT2-5を生成することもできる。なお、
図3に示す例では、第1リスト情報LT1-1に対して、1対1の検索クエリの組合せが追加される場合を示しているが、1対多や多対1、多対多の組合せを追加してもよい。また、情報処理装置100は、検索クエリの組合せを1つずつ追加してもよいし、2つ以上の組合せを一度に追加してもよい。
【0042】
以下、情報処理装置100が実施する第2リスト情報の精度を測定するテスト方法の一例について説明する。
【0043】
たとえば、情報処理装置100は、複数の第2リスト情報について、一斉にABテストを実行することにより、複数の第2リスト情報の精度をそれぞれ測定する。具体的には、情報処理装置100は、生成した複数の第2リスト情報と同数のユーザグループを設定し、設定した各ユーザグループに対して、第2リスト情報を重複しないように個別に割り当てる。なお、各ユーザグループは、無作為に選択した予め定められる人数のユーザで構成される。
【0044】
続いて、情報処理装置100は、第2リスト情報を用いて、各ユーザグループのユーザリストをそれぞれ作成する。続いて、情報処理装置100は、各ユーザリストにおいて上位に位置付けられている各ユーザ(たとえば、上位100位までの各ユーザ)に対して、所定の行動に対応する広告の配信を行う。続いて、情報処理装置100は、各ユーザリストに基づいて配信した広告の効果測定を行う。広告の効果を測定するための指標には、任意の指標を用いることができる。たとえば、この指標として、インプレッション数や、インプレッション単価や、リーチや、クリック数や、クリック率や、クリック単価や、コンバージョン数や、コンバージョン率や、セッション数や、コンバージョン単価などを採用できる。
【0045】
そして、情報処理装置100は、第1リスト情報に基づくユーザリストを用いて広告配信を行った場合の広告の効果と、各第2リスト情報に基づくユーザリストの各々を用いて広告配信を行った場合の広告の効果とを比較することにより、第2リスト情報の精度をそれぞれ測定する。
【0046】
たとえば、情報処理装置100は、複数の第2リスト情報の各々に基づく各広告のうち、第1リスト情報を用いた広告の効果を上回る効果が認められた広告の数が所定の閾値未満である場合、第1リスト情報の信頼性は高いと評価する。一方、情報処理装置100は、複数の第2リスト情報の各々に基づく各広告のうち、第1リスト情報を用いた広告の効果を上回る効果が認められた広告の数が所定の閾値以上である場合、第1リスト情報の信頼性は低いと評価する。
【0047】
また、情報処理装置100は、以下に説明する方法により、第2リスト情報の精度を測定するためのテストを実施することもできる。たとえば、情報処理装置100は、生成した複数の第2リスト情報のそれぞれに対応するユーザリストを生成する。次に、情報処理装置100は、各ユーザリストの上位に位置付けられているユーザ(たとえば、上位100位までの各ユーザ)が、実際に対応する所定の行動(たとえば、行動A)を行った割合をリサーチする。
【0048】
続いて、情報処理装置100は、複数の第2リスト情報の各々に基づくユーザリストごとに、第1リスト情報に基づくユーザリストの上位に位置付けられているユーザが所定の行動を行った行動実行率と、第2リスト情報に基づくユーザリストの上位に位置付けられているユーザが所定の行動を行った行動実行率とを個別に比較する。そして、情報処理装置100は、複数の第2リスト情報の各々に基づく各ユーザリストのうち、第1リスト情報に紐づく行動実行率を上回る行動実行率を記録したユーザリストの数が所定の閾値未満である場合、第1リスト情報の信頼性は高いと評価する。一方、情報処理装置100は、複数の第2リスト情報の各々に基づく各ユーザリストのうち、第1リスト情報に紐づく行動実行率を上回る行動実行率を記録したユーザリストの数が所定の閾値以上である場合、第1リスト情報の信頼性は低いと評価する。
【0049】
このように、実施形態に係る情報処理装置100は、第1リスト情報の信頼性を評価できる。
【0050】
[3.情報処理装置の構成]
図4を用いて、実施形態に係る情報処理装置100の構成について説明する。
図4は、実施形態に係る情報処理装置の構成例を示す図である。
【0051】
図4に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを備える。なお、
図4は、情報処理装置100の構成例を示すものであり、
図4に示す形態には限られず、
図4に示す以外の他の機能部を備える形態であってもよい。
【0052】
(通信部110)
通信部110は、例えば、ネットワークNと有線または無線で接続され、ネットワークNを介して、端末装置10などの他の装置との間で情報の送受信を行う。通信部110は、例えば、NIC(Network Interface Card)やアンテナなどによって実現される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網や固定電話網など)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
【0053】
通信部110は、端末装置10から、撮影画像などの情報を受信する。また、通信部110は、提案情報を端末装置10に送信する。
【0054】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリなどの半導体メモリ素子、または、ハードディスクや光ディスクなどの記憶装置によって実現される。記憶部120は、制御部130の各部により実行される情報処理を実現するためのプログラム及びデータを記憶する。
【0055】
図4に示すように、記憶部120は、第1リスト情報記憶部121と、非採用クエリ情報記憶部122と、ユーザ情報記憶部123とを有する。
【0056】
(第1リスト情報記憶部121)
第1リスト情報記憶部121には、第1リスト情報が任意の形式で記憶されている。第1リスト情報は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した情報である。
図5は、実施形態に係る第1リスト情報の概要を示す図である。
【0057】
図5に示すように、第1リスト情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。第1リスト情報は、「検索クエリ」の項目と、「スコア」の項目とを有する。第1リスト情報が有するこれらの項目は、相互に対応付けられている。
【0058】
「検索クエリ」の項目には、所定の行動を行ったシードユーザにより入力された検索クエリの情報が記憶される。また、「スコア」の項目には、検索クエリと所定の行動との間の関係性を示すスコアの情報が記憶される。
【0059】
(非採用クエリ情報記憶部122)
非採用クエリ情報記憶部122には、非採用クエリ情報が任意の形式で記憶されている。非採用クエリ情報は、第1リスト情報の生成過程で採用されなかった検索クエリに関する情報である。
図6は、実施形態に係る非採用クエリ情報の概要を示す図である。
【0060】
図6に示すように、非採用クエリ情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。また、
図6に示すように、非採用クエリ情報は、「検索クエリ」の項目と、「スコア」の項目とを有する。第2リスト情報が有するこれらの項目は相互に対応付けられている。
【0061】
「検索クエリ」の項目には、所定の行動を行ったシードユーザにより入力された検索クエリの情報が記憶される。また、「スコア」の項目には、検索クエリと所定の行動との間の関係性を示すスコアの情報が記憶される。
【0062】
(ユーザ情報記憶部123)
ユーザ情報記憶部123には、各ユーザから提供される検索クエリなどのユーザ情報が任意の形式で記憶されている。
図7は、実施形態に係るユーザ情報の概要を示す図である。
【0063】
図7に示すように、ユーザ情報は、「ユーザID」の項目や、「検索履歴」の項目などを有する。
【0064】
「ユーザID」の項目には、検索履歴の提供元であるユーザに付与されている識別情報が記憶される。「検索履歴」の項目には、各ユーザから提供される検索履歴が記憶される。検索履歴には、各ユーザが各種サービスを利用する際に使用した検索クエリの情報が含まれる。
【0065】
(制御部130)
図4に示す制御部130は、情報処理装置100を制御するコントローラ(controller)である。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、GPU(Graphics Processing Unit)などによって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(例えば、情報処理プログラム)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現されてもよい。
【0066】
図4に示すように、制御部130は、第1生成部131と、第2生成部132と、評価部133とを有する。制御部130は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図4に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各部の接続関係は、
図4に示した接続関係に限られず、他の接続関係であってもよい。
【0067】
(第1生成部131)
第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第1生成部131は、生成した第1リスト情報を第1リスト情報記憶部121に格納する。また、第1生成部131は、第1リスト情報の生成過程で採用されなかった検索クエリに関する非採用クエリ情報を非採用クエリ情報記憶部122に格納する。
【0068】
(第2生成部132)
第2生成部132は、第1リスト情報から検索クエリを削除、または第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する(たとえば、
図2および
図3参照)。
【0069】
たとえば、第2生成部132は、第1リスト情報の生成過程で採用されなかった検索クエリ(非採用クエリ情報記憶部122に記憶されている非採用クエリ)の中から、第1リスト情報に追加する検索クエリを選択する。そして、第2生成部132は、選択した検索クエリを第1リスト情報に追加することにより、第2リスト情報を生成する。
【0070】
また、第2生成部132は、第1リスト情報に含まれる複数の検索クエリの組合せを第1リストに追加することにより、第2リスト情報を生成する。
【0071】
また、第2生成部132は、第1リスト情報の生成過程で採用されなかった検索クエリ(非採用クエリ情報記憶部122に記憶されている非採用クエリ)の中から選択した複数の検索クエリの組合せを第1リストに追加することにより、第2リスト情報を生成する。
【0072】
また、第2生成部132は、第1リスト情報に含まれる検索クエリと、第1リスト情報の生成過程で採用されなかった検索クエリ(非採用クエリ情報記憶部122に記憶されている非採用クエリ)の中から選択した検索クエリとの組合せを第1リストに追加することにより、第2リスト情報を生成する。
【0073】
(評価部133)
評価部133は、第2リスト情報の精度を測定するテストの結果に基づいて、第1リスト情報の信頼性を評価する。たとえば、評価部133は、第2生成部132により生成された複数の第2リスト情報について、一斉にABテストを実行することにより、複数の第2リスト情報の精度をそれぞれ測定する。
【0074】
具体的には、評価部133は、第2生成部132により生成された複数の第2リスト情報と同数のユーザグループを設定し、設定した各ユーザグループに対して、第2リスト情報を重複しないように個別に割り当てる。なお、各ユーザグループは、無作為に選択した予め定められる人数のユーザで構成される。
【0075】
続いて、評価部133は、第2リスト情報を用いて、各ユーザグループのユーザリストをそれぞれ作成する。続いて、評価部133は、各ユーザリストにおいて上位に位置付けられている各ユーザ(たとえば、上位100位までの各ユーザ)に対して、所定の行動に対応する広告の配信を行う。続いて、評価部133は、各ユーザリストに基づいて配信した広告の効果測定を行う。広告の効果を測定するための指標には、任意の指標を用いることができる。たとえば、この指標として、インプレッション数や、インプレッション単価や、リーチや、クリック数や、クリック率や、クリック単価や、コンバージョン数や、コンバージョン率や、セッション数や、コンバージョン単価などを採用できる。
【0076】
そして、評価部133は、第1リスト情報に基づくユーザリストを用いて広告配信を行った場合の広告の効果と、各第2リスト情報に基づくユーザリストの各々を用いて広告配信を行った場合の広告の効果とを比較することにより、第2リスト情報の精度をそれぞれ測定する。
【0077】
たとえば、評価部133は、複数の第2リスト情報の各々に基づく各広告のうち、第1リスト情報を用いた広告の効果を上回る効果が認められた広告の数が所定の閾値未満である場合、第1リスト情報の信頼性は高いと評価する。一方、情報処理装置100は、複数の第2リスト情報の各々に基づく各広告のうち、第1リスト情報を用いた広告の効果を上回る効果が認められた広告の数が所定の閾値以上である場合、第1リスト情報の信頼性は低いと評価する。
【0078】
また、評価部133は、以下に説明する方法により、第2リスト情報の精度を測定するためのテストを実施することもできる。たとえば、評価部133は、生成した複数の第2リスト情報のそれぞれに対応するユーザリストを生成する。次に、評価部133は、各ユーザリストの上位に位置付けられている各ユーザ(たとえば、上位100位までの各ユーザ)が、実際に対応する所定の行動(たとえば、行動A)を行った割合をリサーチする。
【0079】
続いて、評価部133は、複数の第2リスト情報の各々に基づくユーザリストごとに、第1リスト情報に基づくユーザリストの上位に位置付けられているユーザが所定の行動を行った行動実行率と、第2リスト情報に基づくユーザリストの上位に位置付けられているユーザが所定の行動を行った行動実行率とを個別に比較する。そして、評価部133は、複数の第2リスト情報の各々に基づく各ユーザリストのうち、第1リスト情報に紐づく行動実行率を上回る行動実行率を記録したユーザリストの数が所定の閾値未満である場合、第1リスト情報の信頼性は高いと評価する。一方、情報処理装置100は、複数の第2リスト情報の各々に基づく各ユーザリストのうち、第1リスト情報に紐づく行動実行率を上回る行動実行率を記録したユーザリストの数が所定の閾値以上である場合、第1リスト情報の信頼性は低いと評価する。
【0080】
[4.処理手順]
以下、
図8を用いて、実施形態に係る情報処理装置100による処理手順について説明する。
図8は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。
図8に示す処理手順は、情報処理装置100の制御部130により実行される。
図8に示す処理手順は、情報処理装置100の稼働中、繰り返し実行される。
【0081】
図8に示すように、第2生成部132は、第1リスト情報から検索クエリを削除、または第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する(ステップS101)。
【0082】
続いて、評価部133は、ステップS101で生成された複数の第2リスト情報の精度を測定するためのテストを実施する(ステップS102)。
【0083】
続いて、評価部133は、ステップS102で実施したテストの結果に基づいて、第1リスト情報の信頼性を評価し(ステップS103)、
図8に示す処理手順を終了する。
【0084】
[5.変形例]
上述した情報処理装置100は、上述した実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。
【0085】
(5-1.第1リスト情報について)
上述した実施形態において、情報処理装置100は、複数の所定の行動それぞれについて第1リスト情報を生成する例を説明したが、この例には特に限定される必要はない。たとえば、情報処理装置100は、ターゲットとするユーザの行動以外のコンテキスト(たとえば、デモグラフィック属性や興味嗜好など)に基づいて、第1リスト情報および第2リスト情報を作成してもよい。
【0086】
(5-2.第2リスト情報について)
上述の実施形態において、情報処理装置100は、第1リスト情報に検索クエリの組合せを追加して第2リスト情報を作成する際、相関性が高い検索クエリ同士を組み合わせてもよい。
【0087】
[6.ハードウェア構成]
実施形態に係る情報処理装置100は、たとえば、
図9に示すような構成のコンピュータ1000によって実現される。
図9は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【0088】
コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0089】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
【0090】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェイスであり、例えば、USB等により実現される。
【0091】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0092】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0093】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0094】
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)を実行することにより、制御部130と同様の機能を実現する。すなわち、演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)との協働により、実施形態に係る情報処理装置100による処理を実現する。
【0095】
[7.その他]
上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0096】
上述の実施形態において、情報処理装置100による情報処理方法(たとえば、
図8参照)を実現するために、情報処理装置100が有する制御部130の各部(第1生成部131、第2生成部132、及び評価部133)に対応する処理機能は、情報処理装置100に予めインストールされている情報処理プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の提供プログラムとして柔軟に記述することにより実現されてもよい。
【0097】
また、情報処理装置100は、ユーザ情報記憶部123に記憶するユーザ情報として、各ユーザが入力した検索クエリの検索履歴だけでなく、各ユーザの購買履歴、電子商店街で閲覧した取引対象の履歴、購入した取引対象の履歴である購買履歴、閲覧したニュース等のコンテンツの履歴である閲覧履歴、SNS(Social Networking Service)に投稿したテキストや画像等の履歴である投稿履歴、位置履歴などを収集してもよい。また、情報処理装置100は、たとえば、各ユーザが保有するスマートフォンを用いて店舗に設置されたQRコード(登録商標)を読み取り、読み取り結果を用いて実現する決済サービスの利用履歴や、各ユーザが保有するスマートフォンにQRコードを表示させ、かかるQRコードを店舗端末が読み込むことで行われる決済サービスの利用履歴(たとえば、購入日時や購入商品、購入額など)を収集してもよい。また、情報処理装置100は、各ユーザが保有するクレジットカードの利用履歴や銀行口座の利用履歴などを収集してもよい。
【0098】
また、情報処理装置100は、収集した情報に基づいて推定された情報を各ユーザの情報としてもよい。たとえば、情報処理装置100は、購買履歴から、毎月の食料品の平均的な購入総額が10万円以上である場合、たとえば、世帯月収若しくは個人月収が30万円以上であるといった収入や、3人家族であるといった家族構成、もしくは同居人構成などを推定し、各ユーザの情報としてもよい。また、情報処理装置100は、たとえば、位置履歴や購入履歴から、各ユーザが所有する物品や、各ユーザの居住地や職場などを推定し、推定した情報を各ユーザの情報としてもよい。
【0099】
また、情報処理装置100は、たとえば、各種サービスを提供するサーバ装置から、サービスの利用履歴を各ユーザの情報として取得してもよい。また、情報処理装置100は、このようなサービスを提供するサーバ装置もしくは単独のサーバ装置が、サービスの利用履歴から推定した各種情報を各ユーザの情報として収集してもよい。また、情報処理装置100は、各ユーザが登録、又は各ユーザについて推定された各種のジオグラフィック属性や趣味嗜好といったサイコグラフィック属性を示す情報を各ユーザの情報として収集してもよい。
【0100】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部130の第1生成部131と第2生成部132とは機能的に統合されていてもよい。
【0101】
また、上述の実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0102】
[8.効果]
上述の実施形態に係る情報処理装置100は、第1生成部131と、第2生成部132と、評価部133とを備える。第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部132は、第1リスト情報から検索クエリを削除、または第1リスト情報に対して検索クエリを追加した第2リスト情報を複数生成する。評価部133は、第2リスト情報の精度を測定するテストの結果に基づいて、第1リスト情報の信頼性を評価する。
【0103】
このようなことから、実施形態に係る情報処理装置100は、第1リスト情報に人為的な変化を与えた第2リストの精度を確認することにより、第1リスト情報の信頼性を評価できる。
【0104】
また、実施形態に係る情報処理装置100において、第2生成部132は、第1リスト情報の生成過程で採用されなかった検索クエリの中から、第1リスト情報に追加する検索クエリを選択する。これにより、実施形態に係る情報処理装置100は、第1リスト情報の生成過程を確認する機会を提供できる。
【0105】
また、実施形態に係る情報処理装置100において、第2生成部132は、第1リスト情報に含まれる複数の検索クエリの組合せを第1リストに追加する。
【0106】
また、実施形態に係る情報処理装置100において、第2生成部132は、第1リスト情報の生成過程で採用されなかった検索クエリの中から選択した複数の検索クエリの組合せを第1リストに追加する。
【0107】
また、実施形態に係る情報処理装置100において、第2生成部132は、第1リスト情報に含まれる検索クエリと、第1リスト情報の生成過程で採用されなかった検索クエリの中から選択した検索クエリとの組合せを第1リストに追加する。
【0108】
これらにより、実施形態に係る情報処理装置100は、第1リスト情報の精度をより高める可能性を模索できる。
【0109】
以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0110】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。
【符号の説明】
【0111】
10 端末装置
100 情報処理装置
110 通信部
120 記憶部
121 第1リスト情報記憶部
122 非採用クエリ情報記憶部
123 ユーザ情報記憶部
130 制御部
131 第1生成部
132 第2生成部
133 評価部