(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024027669
(43)【公開日】2024-03-01
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240222BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022130649
(22)【出願日】2022-08-18
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】田口 拓明
(72)【発明者】
【氏名】坪内 孝太
(72)【発明者】
【氏名】日暮 立
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC20
(57)【要約】
【課題】属性が推測できない利用者の属性を推測することが可能な情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【解決手段】本願に係る情報処理装置は、利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報を取得する取得部と、利用者情報と行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するモデル記憶部と、複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出する算出部と、算出部が特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行う質問部と、複数のモデルごとに指標の値が所定の範囲の値に算出された利用者を抽出する抽出部と、抽出部が抽出した利用者の利用者情報と、行動情報を複数のモデルに入力して、指標の値が所定の範囲の値に算出されたモデルを特定する特定部と、を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報を取得する取得部と、
前記利用者情報と前記行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するモデル記憶部と、
前記複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出する算出部と、
前記算出部が特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行う質問部と、
前記複数のモデルごとに前記指標の値が所定の範囲の値に算出された利用者を抽出する抽出部と、
前記抽出部が抽出した利用者の利用者情報と、行動情報を複数のモデルに入力して、前記指標の値が所定の範囲の値に算出されたモデルを特定する特定部と、を備える、
情報処理装置。
【請求項2】
前記算出部は、前記複数のモデルのカテゴリごとに、利用者の特定の特徴についての指標を算出し、
前記抽出部は、前記複数のモデルのカテゴリごとに、利用者の前記指標の値が所定の範囲の利用者を抽出し、
前記特定部は、前記複数のモデルのカテゴリごとに、前記指標の値が所定の範囲の値に算出されたモデルを特定する、
請求項1に記載の情報処理装置。
【請求項3】
利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報を取得するステップと、
前記利用者情報と前記行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するステップと、
前記複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出するステップと、
特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行うステップと、
前記複数のモデルごとに前記指標の値が所定の範囲の値に算出された利用者を抽出するステップと、
抽出した利用者の利用者情報と、行動情報をモデルに入力して、前記指標の値が所定の範囲の値に算出されたモデルを特定するステップと、を含む、
情報処理方法。
【請求項4】
利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報を取得するステップと、
前記利用者情報と前記行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するステップと、
前記複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出するステップと、
特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行うステップと、
前記複数のモデルごとに前記指標の値が所定の範囲の値に算出された利用者を抽出するステップと、
抽出した利用者の利用者情報と、行動情報をモデルに入力して、前記指標の値が所定の範囲の値に算出されたモデルを特定するステップと、
をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
情報の配信先となる利用者の属性を示す属性情報を配信先情報として予め登録しておき、配信先となる利用者の属性情報と対応する広告を選択的に配信するターゲティング配信が行われている。
【0003】
例えば、広告と属性情報との見かけ上の関連性の程度、及び複数の広告と属性情報との平均的な関連性の程度に基づいて、広告と属性情報との真の関連性を算出する技術が下記の特許文献1に開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
利用者の属性情報を推測する場合に、属性が推測できない利用者が含まれる場合があった。このような場合、利用者の属性に基づいて、広告配信を希望する事業者のニーズを満たすことができない。そのため、属性が推測できない利用者の属性を推測することが求められていた。
【0006】
本開示は上記の課題を鑑み、属性が推測できない利用者の属性を推測することが可能な情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本開示に係る情報処理装置は、利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報と、を取得する取得部と、前記利用者情報と前記行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するモデル記憶部と、前記複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出する算出部と、前記算出部が特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行う質問部と、前記複数のモデルごとに前記指標の値が所定の範囲の値に算出された利用者を抽出する抽出部と、前記抽出部が抽出した利用者の利用者情報と、行動情報を複数のモデルに入力して、前記指標の値が所定の範囲の値に算出されたモデルを特定する特定部と、を備える。
【発明の効果】
【0008】
実施形態の一態様によれば、属性が推測できない利用者の属性を推測することが可能な情報処理装置、情報処理方法、及び情報処理プログラムを提供することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る情報処理の一例を示す図である。
【
図2】
図2は、実施形態に係る情報処理システムの構成例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置の構成例を示す図である。
【
図4】
図4は、実施形態に係る情報処理装置の利用者情報記憶部に記憶される情報の一例を示す図である。
【
図5】
図5は、実施形態に係る情報処理装置の行動情報記憶部に記憶される情報の一例を示す図である。
【
図6】
図6は、実施形態に係る情報処理装置のモデル記憶部に記憶される情報の一例を示す図である。
【
図7】
図7は、実施形態に係る利用者端末の構成例を示す図である。
【
図8】
図8は、実施形態に係る情報処理の一例を示すフローチャートである。
【
図9】
図9は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。
【0011】
(実施形態)
〔1-1.実施形態に係る情報処理の一例〕
まず、
図1を用いて、実施形態に係る情報処理の一例について説明する。
図1は、実施形態に係る情報処理の一例を示す図である。まず、実施形態に係る情報処理の概要を説明した後に、個々の処理を詳細に説明する。
【0012】
図1では、情報処理装置100が、複数の利用者端末200から利用者情報と行動情報とを取得し、取得した利用者情報と行動情報を複数のモデルに入力し、特定の特徴についての指標を算出し、利用者に特定の特徴に関係する質問を行い、複数のモデルごとに指標の値が所定の範囲の利用者を抽出し、抽出した利用者の利用者情報と行動情報を用いて特定の特徴の指標を算出し、指標が所定の範囲の値に算出されたモデルを特定する処理が示されている。以下、
図1を用いて、実施形態に係る情報処理の一例についてステップごとに詳細に説明する。
【0013】
まず、情報処理装置100は、複数の利用者端末200から利用者情報と行動情報とを取得する(ステップS1)。例えば、情報処理装置100は、
図1に示すように、利用者U1からU6の利用者端末200Aから200Fから利用者情報と行動情報を取得する。なお、
図1に示す利用者U1からU6、及び利用者端末200Aから200Fは例示であって、情報処理装置100はこれ以上の数の利用者の利用者端末200から利用者情報と行動情報を取得してよい。
【0014】
次に、情報処理装置100は、複数のモデルを用いて、複数のモデルごとに特定の特徴についての指標を算出する(ステップS2)。なお、ここにおけるモデルとは、利用者情報と、行動情報と、利用者の特定の特徴に関する指標との関係を学習させたモデルのことを指している。モデルに利用者の利用者情報と行動情報を入力すると、利用者の特定の特徴に関する指標を0から1の値として出力する。また、ここにおける特定の特徴は、利用者の属性情報と言い換えることもでき、例えば、「眼鏡好き」や「本好き」などいった利用者の趣味嗜好や、利用者の特性などを指している。情報処理装置100は、複数の利用者端末200から取得した利用者情報と行動情報を、特定の特徴についての指標を算出する複数のモデルに入力し、モデルごとに利用者の特定の特徴についての指標を算出する。
【0015】
次に、情報処理装置100は、複数の利用者端末200に対して、特定の特徴に関係する質問情報を送信する(ステップS3)。例えば、情報処理装置100は、ステップS2において特定の特徴に関する指標を算出した複数の利用者の利用者端末200に対して、特定の特徴としての「眼鏡好き」に該当するか否かに関する質問を択一式または入力式により質問する質問情報を送信し、質問情報を受信した複数の利用者端末200が出力部230に質問情報を表示させることにより、ステップS3において特定の特徴に関する指標を算出した利用者に特定の特徴に該当するか否かについて質問してよい。
【0016】
次に、情報処理装置100は、複数の利用者端末200から特定の特徴に関係する質問に対する回答情報を受け付ける(ステップS4)。例えば、情報処理装置100は、利用者端末200に表示された特定の特徴に関係する質問を確認した利用者Uが利用者端末200の入力部220を介して入力した回答情報を利用者端末200から受け付けてよい。この場合において、利用者Uが利用者端末200の入力部220に入力する回答情報は、質問に対する回答を「はい」又は「いいえ」で表したものや、質問に対しての回答を文章で表したものであってよい。
図1に示すように、情報処理装置100は、複数の利用者端末200から利用者Uが入力した回答情報を受け付ける。
【0017】
次に、情報処理装置100は、複数のモデルごとに指標の値が所定の範囲の値の利用者を抽出する(ステップS5)。例えば、情報処理装置100は、複数のモデルごとに特定の特徴についての指標が0.0から0.4の範囲の値に算出された利用者を抽出してよい。なお、特定の特徴についての指標が低い値、例えば、0.0から0.4の範囲の値に算出された利用者は、特定の特徴を有していないと推定されたといえる。そのため、広告配信事業者が「眼鏡好き」などの属性を有する利用者を指定して広告配信を行いたいと考えた場合に、属性を推定できない利用者は広告配信の対象とはならないことから、利用者の属性を把握することが求められる。ステップS5においては、このような背景から特定の特徴についての指標が低く算出された利用者を抽出する。
【0018】
次に、情報処理装置100は、抽出した利用者の利用者情報と、行動情報を用いて、特定の特徴についての指標を算出し、指標が所定の範囲に算出されたモデルを特定する(ステップS6)。例えば、
図1に示すように、情報処理装置100は、ステップS5において抽出した利用者の利用者情報と、行動情報を、ステップS2において特定の特徴に関する指標の算出に用いたモデルAからBとは異なるモデルDからFを用いて、ステップS5において抽出した利用者の特定の特徴についての指標を算出してよい。そして、情報処理装置100は、モデルDからFを用いて算出した利用者の特定の特徴についての指標が所定の範囲の値、例えば、0.8から1.0の範囲の値に算出されたモデルを特定する。モデルごとに定められる特定の特徴が異なることから、モデルを特定することにより、利用者が有する特定の特徴を把握することができる。
【0019】
これにより、情報処理装置100は、属性が推測できなかった利用者の属性を推測することが可能となる。そのため、広告配信事業者が特定の特徴を有する利用者に対象を絞って広告配信を行う場合に、特定の特徴を有する利用者を把握して、特定の特徴を有する利用者に対象を絞って広告配信を行うことができる。
【0020】
〔1-2.実施形態に係る情報処理の他の例1〕
情報処理装置100は、複数のモデルのカテゴリごとに、利用者の特定の特徴についての指標を算出し、複数のモデルのカテゴリごとに、利用者の指標の値が所定の範囲の利用者を抽出し、複数のモデルのカテゴリごとに、指標の値が所定の範囲の値に算出されたモデルを特定する。
【0021】
この情報処理について順を追って説明する。まず、情報処理装置100は、
図1に示したステップS1と同じ処理を実行する。ステップS1の処理は、前述した処理と同じであるから説明を省略する。
【0022】
次に、情報処理装置100は、複数のモデルごとに特定の特徴に関する指標を算出する(ステップS2)。この場合、情報処理装置100は、複数のモデルのカテゴリごとに、利用者の特定の特徴についての指標を算出する。ここで、モデルは前述した通り、利用者情報と、行動情報を入力すると、特定の特徴についての指標を算出するモデルである。特定の特徴は、「眼鏡好き」や「本好き」といった利用者の趣味嗜好や特性を示す。特定の特徴は、「ファッション」、「スポーツ」、「映画」などのカテゴリに分類されており、カテゴリごとに特定の特徴が複数、例えば、「ファッション」のカテゴリであれば、「眼鏡好き」、「帽子好き」、「ジャケット好き」などが定義されている。すなわち、この場合、情報処理装置100は、例えば、カテゴリ「ファッション」に属する「眼鏡好き」、「帽子好き」、「ジャケット好き」などの特定の特徴に関する指標を算出する複数のモデルを用いて、カテゴリごとに利用者の特定の特徴についての指標を算出する。
【0023】
次に、情報処理装置100は、
図1に示したステップS3からステップS4までの処理と同じ処理を実行する。ステップS3からステップS4までの処理は、前述した処理と同じであるから説明を省略する。
【0024】
次に、情報処理装置100は、モデルごとに指標の値が所定の範囲の利用者を抽出する(ステップS5)。この場合、情報処理装置100は、複数のモデルのカテゴリごとに、利用者の特定の特徴についての指標の値が所定の範囲の利用者を抽出する。すなわち、ステップS2において、情報処理装置100は、カテゴリごとに利用者の特定の特徴についての指標を算出していることから、カテゴリごとに利用者の特定の特徴についての指標の値が所定の範囲の値の利用者を抽出する。例えば、情報処理装置100は、カテゴリ「ファッション」に属する特定の特徴「眼鏡好き」、「帽子好き」、「ジャケット好き」についての指標が、所定の範囲の値、例えば、0.0から0.4の範囲の値に算出された利用者を抽出する。
【0025】
次に、情報処理装置100は、抽出した利用者の利用者情報と、行動情報を用いて、特定の特徴についての指標を算出し、指標が所定の範囲の値に算出されたモデルを特定する(ステップS6)。この場合、情報処理装置100は、ステップS5において抽出した利用者の利用者情報と、行動情報を用いて、複数のモデルのカテゴリごとに、特定の特徴についての指標を算出し、複数のモデルのカテゴリごとに、特定の特徴についての指標が所定の範囲の値に算出されたモデルを特定する。例えば、情報処理装置100は、ステップS5において、カテゴリ「ファッション」に属する特定の特徴「眼鏡好き」、「帽子好き」、「ジャケット好き」のいずれの特定の特徴についての指標の値が所定の範囲の値、例えば、0.0から0.4の値に算出された利用者を抽出したとする。この場合、情報処理装置100は、カテゴリ「ファッション」に属する特定の特徴「眼鏡好き」、「帽子好き」、「ジャケット好き」以外の特定の特徴についての指標を算出するモデルを用いて、抽出された利用者の特定の特徴についての指標を算出する。そして、情報処理装置100は、算出された特定の特徴についての指標の値が、所定の範囲の値、例えば、0.8から1.0の値に算出されたモデルを特定する。モデルごとに特定の特徴が定められていることから、モデルを特定することにより、利用者が有する特徴を把握することができる。
【0026】
これにより、カテゴリごとに属性が推測できない利用者の属性を推測することが可能となる。そのため、広告配信を希望する事業者の事業分野に属するカテゴリについて興味関心を持っている利用者を把握して、カテゴリごとに広告配信の対象となる利用者を把握することができる。
【0027】
〔2.情報処理システムの構成〕
次に、
図2を用いて実施形態に係る情報処理システムの構成について説明する。
図2は、実施形態に係る情報処理システムの構成例を示す図である。
図2に示すように、情報処理システム1は、情報処理装置100と、利用者端末200を含む。なお、
図2に示した情報処理システム1は、複数台の情報処理装置100や、複数台の利用者端末200が含まれ構成されていてもよい。情報処理装置100と、利用者端末200は所定の通信網(ネットワークN)を介して、有線又は無線により通信可能に接続される。
【0028】
情報処理装置100は、例えばPC(Personal Computer)、WS(Work Station)、サーバの機能を備えるコンピュータなどの情報処理装置であってよい。情報処理装置100は、利用者端末200からネットワークNを介して送信されてきた情報に基づいて処理を行う。
【0029】
利用者端末200は、利用者が利用する情報処理装置である。利用者端末200は、例えば、スマートフォン、タブレット型端末、デスクトップ型PC、ノート型PC、携帯電話機、PDA(Personal Digital Assistant)等の情報処理装置であってよい。なお、
図1に示す例においては、利用者端末200がスマートフォンである場合を示している。
【0030】
〔3.情報処理装置の構成〕
次に、
図3を用いて、実施形態に係る情報処理装置100の構成について説明する。
図3は、実施形態に係る情報処理装置の構成例を示す図である。
【0031】
図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130と、を有する。なお、
図3に図示はしていないが、情報処理装置100は、情報処理装置100の管理者から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0032】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、利用者端末200との間で情報の送受信を行う。
【0033】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、SSD(Solid State Drive)、光ディスク等の記憶装置によって実現される。
図3に示すように、記憶部120は、利用者情報記憶部121と、行動情報記憶部122と、モデル記憶部123を有する。
【0034】
(利用者情報記憶部121について)
利用者情報記憶部121は、利用者に関する情報、すなわち、利用者情報を記憶する。利用者情報は、例えば、利用者が所定の情報サービスを利用する際に、情報サービスの提供事業者に提供する利用者に関する個人情報である。ここで、
図4を用いて、利用者情報記憶部121が記憶する情報の一例を説明する。
図4は、実施形態に係る情報処理装置の利用者情報記憶部に記憶される情報の一例を示す図である。
【0035】
図4に示す例において、利用者情報記憶部121は、「利用者ID」、「生年月日」、「性別」、「職業」、という項目に係る情報を紐付けて記憶する。
【0036】
「利用者ID」は、利用者を識別する識別子であり文字列や番号などによって表される。「生年月日」は、「利用者ID」に紐付けられた利用者の生年月日に関する情報である。「性別」は、「利用者ID」に紐付けられた利用者の性別に関する情報である。「職業」は、「利用者ID」に紐付けられた利用者の職業に関する情報である。
【0037】
すなわち、
図4においては、利用者ID「UID#1」により識別された利用者の生年月日が「生年月日#U1」であり、性別が「女性」であり、職業が「職業#U1」であることを示している。
【0038】
なお、利用者情報記憶部121に記憶される情報は、「利用者ID」、「生年月日」、「性別」、「職業」という項目に係る情報に限定されるものではなく、その他の任意の利用者の個人情報が記憶されてよい。
【0039】
(行動情報記憶部122について)
行動情報記憶部122は、利用者の行動を示す情報、すなわち、行動情報を記憶する。行動情報とは、利用者の所定の情報サービスの利用によって生じる利用者の所定の情報サービスを用いた行動を示す情報である。ここで、
図5を用いて、行動情報記憶部122が記憶する情報の一例を説明する。
図5は、実施形態に係る情報処理装置の行動情報記憶部に記憶される情報の一例を示す図である。
【0040】
図5に示す例において、行動情報記憶部122は、「利用者ID」、「検索履歴」、「閲覧履歴」、「購入履歴」、「路線検索履歴」、「掲示板投稿履歴」という項目に係る情報を紐付けて記憶する。
【0041】
「利用者ID」は、利用者を識別する識別子であり文字列や番号などによって表される。「検索履歴」は、「利用者ID」に紐付けられた利用者が検索に使用した検索クエリと入力時刻とを含む情報である。「閲覧履歴」は、「利用者ID」に紐付けられた利用者の閲覧サイトと閲覧時刻とを含む情報である。「購入履歴」は、「利用者ID」に紐付けられた利用者のインターネット通信販売サイトや所定のサービス契約サイトなどにおける購入商品、又は購入サービスと購入時刻とを含む情報である。「路線検索履歴」は、「利用者ID」に紐付けられた利用者の路線検索結果と検索時刻とを含む情報である。「掲示板投稿履歴」は、「利用者ID」に紐付けられた利用者の掲示板投稿と投稿時刻とを含む情報である。
【0042】
すなわち、
図5においては、利用者ID「UID#1」により識別された利用者の検索履歴が「検索履歴#U1」であり、利用者の閲覧履歴が「閲覧履歴#U1」であり、購入履歴が「購入履歴#U1」であり、路線検索履歴が「路線検索履歴#U1」であり、掲示板投稿履歴が「掲示板投稿履歴#U1」であることを示している。
【0043】
なお、行動情報記憶部122に記憶される情報は、「利用者ID」、「検索履歴」、「閲覧履歴」、「購入履歴」、「路線検索履歴」、「掲示板投稿履歴」という項目に係る情報に限定されるものではなく、その他の任意の利用者の行動に関係する情報が記憶されてよい。
【0044】
(モデル記憶部123について)
モデル記憶部123は、利用者情報と行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶する。なお、モデルに利用者情報と行動情報を入力すると特定の特徴についての指標を算出する。
図6は、実施形態に係る情報処理装置のモデル記憶部に記憶される情報の一例を示す図である。
【0045】
図6に示す例において、モデル記憶部123は、「モデルID」、「モデルデータ」という項目に係る情報を紐付けて記憶する。
【0046】
「モデルID」は、機械学習モデルを識別する識別子であり文字列や番号などによって表される。「モデルデータ」は、機械学習モデルのモデルデータを示す。例えば、機械学習モデルは、ニューラルネットワークなどであってよい。
【0047】
すなわち、
図6において、モデルID「M#1」で識別されるモデルは、機械学習モデルM#1を示す。また、モデルデータ「MDT#1」は、機械学習モデルM#1のモデルデータを示す。
【0048】
ここで、機械学習モデルがニューラルネットワークである場合は、モデルデータ「MDT#1」には、例えば、ニューラルネットワークを構成する複数の層のそれぞれに含まれるノードが互いにどのように結合するかという結合情報や、結合されたノード間で入出力される数値に掛け合わされる結合係数などの各種情報が含まれる。
【0049】
なお、モデル記憶部123は、「モデルID」、「モデルデータ」という項目に係る情報に限定されることなく、その他の任意の機械学習モデルに関係する情報が記憶されてよい。また、モデル記憶部123は、モデルを特定の特徴のカテゴリごとに、記憶してもよいし、モデルにカテゴリ情報を紐付けておき、カテゴリによってモデルを検索可能としてもよい。
【0050】
(制御部130について)
次に、
図3に戻って、制御部130について説明する。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0051】
図3に示すように、制御部130は、取得部131と、算出部132と、質問部133と、抽出部134と、特定部135を有する。
【0052】
(取得部131について)
取得部131は、利用者に関する情報を示す利用者情報と、利用者の行動を示す行動情報と、を取得する。ここで、利用者情報は、利用者に関する情報であって、例えば、利用者が所定の情報サービスを利用する際に、情報サービスの提供事業者に提供する情報である。また、行動情報は、利用者の所定の情報サービスの利用によって生じる利用者の所定の情報サービスを用いた行動を示す情報である。取得部131は、利用者情報を取得したら、取得した利用者情報を利用者情報記憶部121に記憶する。取得部131は、行動情報を取得したら、取得した行動情報を行動情報記憶部122に記憶する。なお、取得部131は、所定日時ごとに利用者情報と、行動情報とのうちのいずれか一方又は両方を取得してもよいし、利用者が情報処理装置100にアクセスする度に利用者情報と、行動情報とのうちのいずれか一方又は両方を取得してもよい。
【0053】
また、取得部131が利用者情報と行動情報とを取得する取得元は、利用者端末200に限定されるものではなく、検索サービスや、ショッピングサービス、決済サービス、路線検索サービス、地図提供サービス、旅行サービス、飲食店紹介サービス、天気予報サービス、スケジュール管理サービス、ニュース提供サービス、オークションサービス、動画コンテンツ配信サービス、金融取引(株取引等)サービスといった各種情報サービスを提供するその他のサーバ装置から取得してもよいし、外部の記憶媒体から取得してもよい。
【0054】
(算出部132について)
算出部132は、複数のモデルを用いてモデルごとに利用者の特定の特徴についての指標を算出する。算出部132は、利用者情報と、行動情報とを入力すると、特定の特徴についての指標を算出するモデルに、利用者情報と行動情報とを入力することによって、利用者の特定の特徴についての指標をモデルごとに算出する。なお、指標の算出に使用するモデルは、モデル記憶部123から読み出して使用し、算出部132はモデルごとに利用者の特定の特徴についての指標を算出する。また、算出部132が利用者の特定の特徴についての指標の算出に使用するモデルの数は任意の数であってよい。
【0055】
また、算出部132は、複数のモデルのカテゴリごとに、利用者の特定の特徴についての指標を算出してもよい。特定の特徴は、「ファッション」、「スポーツ」、「映画」などのカテゴリに分類されており、カテゴリごとに特定の特徴が複数定義されている。例えば、算出部132は、カテゴリ「ファッション」に属する「眼鏡好き」、「帽子好き」、「ジャケット好き」などの特定の特徴に関する指標を算出する複数のモデルを用いて、複数のモデルに利用者の利用者情報と、行動情報とを入力することによって、カテゴリごとに利用者の特定の特徴についての指標を算出してよい。
【0056】
(質問部133について)
質問部133は、特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行う。
図1に示したように算出部132は、利用者ごとに特定の特徴に関する指標を算出することから、質問部133は、算出部132が特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行う。例えば、質問部133は、算出部132が特定の特徴に関する指標を算出した複数の利用者の利用者端末200に対して、特定の特徴としての「眼鏡好き」に該当するか否かに関する質問を択一式または入力式により質問する質問情報を送信することにより、利用者に対して特定の特徴に関する質問を行ってよい。また、この場合において、質問部133は、質問情報を受信した複数の利用者端末200が出力部230に質問情報を表示させて、利用者端末200に表示された特定の特徴に関係する質問を確認した利用者Uが利用者端末200の入力部220を介して入力した回答情報を利用者端末200から受け付けてよい。
【0057】
(抽出部134について)
抽出部134は、複数のモデルごとに指標の値が所定の範囲の値に算出された利用者を抽出する。例えば、抽出部134は、複数のモデルごとに特定の特徴についての指標が0.0から0.4の値の範囲に算出された利用者を抽出してよい。また、抽出部134は、複数のモデルにおいて共通して、指標の値が所定の範囲に算出された利用者を抽出してもよい。例えば、利用者U1の利用者情報と行動情報をモデルAに入力して指標を算出した場合に、指標の値が0.2と算出され、モデルBを用いて指標を算出した場合に、指標の値が0.4、モデルCを用いて指標を算出した場合に、指標の値が0.3と算出された場合であれば、利用者U1はモデルA、モデルB、モデルCの3つモデルにより、指標の値が0.0から0.4の値の範囲に算出されたことになる。そのため、この場合、抽出部134は、利用者U1を複数のモデルを用いても指標の値が所定の範囲の値に算出され、特徴が推定できなかった利用者として抽出してよい。
【0058】
また、抽出部134は、複数のモデルのカテゴリごとに、利用者の指標の値が所定の範囲の利用者を抽出してもよい。算出部132が、カテゴリごとに利用者の特定の特徴についての指標を算出した場合、抽出部134は、カテゴリごとに利用者の特定の特徴についての指標の値が所定の範囲の値の利用者を抽出してよい。例えば、抽出部134は、算出部132がカテゴリ「ファッション」に属する特定の特徴「眼鏡好き」、「帽子好き」、「ジャケット好き」のいずれについての指標も、所定の範囲の値、例えば、0.0から0.4の範囲の値として算出した利用者を抽出する。
【0059】
(特定部135について)
特定部135は、抽出部134が抽出した利用者の利用者情報と、行動情報を複数のモデルに入力して、指標の値が所定の範囲の値に算出されたモデルを特定する。例えば、特定部135は、抽出部134が抽出した利用者の利用者情報と、行動情報を、算出部132が利用者の特定の特徴に関する指標の算出に用いたモデルとは異なるモデルを用いて、抽出した利用者の特定の特徴についての指標を算出してよい。特定部135は、算出部132が指標の算出に用いたモデルとは異なるモデルを用いて算出した利用者の特定の特徴についての指標が所定の範囲の値、例えば、0.8から1.0の範囲の値に算出されたモデルを特定する。ここで、モデルごとに定められる特定の特徴が異なることから、モデルを特定することにより、利用者が有する特定の特徴を把握することができる。
【0060】
また、特定部135は、複数のモデルのカテゴリごとに、指標の値が所定の範囲の値に算出されたモデルを特定してよい。例えば、抽出部134が、カテゴリ「ファッション」に属する特定の特徴「眼鏡好き」、「帽子好き」、「ジャケット好き」のいずれの指標の値についても所定の範囲の値、例えば、0.0から0.4の値に算出された利用者を抽出したとする。この場合、特定部135は、カテゴリ「ファッション」に属する特定の特徴「眼鏡好き」、「帽子好き」、「ジャケット好き」以外の特定の特徴についての指標を算出するモデルを用いて、抽出された利用者の特定の特徴についての指標を算出する。そして、特定部135は、算出された特定の特徴についての指標の値が、所定の範囲の値、例えば、0.8から1.0の値に算出されたモデルを特定する。モデルごとに特定の特徴が定められていることから、モデルを特定することにより、利用者が有する特徴を把握することができる。
【0061】
なお、ここで、利用者の特定の特徴についての指標を算出するモデルが当該指標の値を低く算出する、すなわち、利用者の特徴を推定できない原因としては、例えば、特定のアニメの特徴量を使用することによる特徴量の被りや、特定のカテゴリに属するモデルによる推定の場合や、モデルの学習に用いるデータの量が少ない場合や、検索クエリを特徴量に用いた場合や、モデルの学習に用いるデータを平均処理や分散処理した場合や、特殊なニューラルネットワークを用いた場合などが例として挙げられる。
【0062】
〔4.利用者端末の構成〕
次に、
図7を用いて、実施形態に係る利用者端末200の構成について説明する。
図7は、実施形態に係る利用者端末の構成例を示す図である。
図7に示すように、利用者端末200は、通信部210と、入力部220と、出力部230と、制御部240と、を有する。
【0063】
通信部210は、例えば、NIC等によって実現される。そして、通信部210は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、情報処理装置100との間で各種の情報の送受信を行う。
【0064】
入力部220は、利用者から各種の操作情報が入力される。例えば、入力部220は、タッチパネルにより表示面(例えば出力部230)を介して利用者からの各種操作を受け付けてもよい。また、入力部220は、利用者端末200に設けられたボタンや、利用者端末200に接続されたキーボードやマウスからの各種操作を受け付けてもよい。
【0065】
出力部230は、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ等によって実現されるタブレット型端末等の表示画面であり、各種情報を表示するための表示装置である。つまり、利用者端末200は、入力部220がタッチパネルである場合は、出力部230である表示画面により利用者の入力を受け付け、利用者への出力も行う。また、出力部230は、スピーカーであり、スピーカーにより音声を出力してよい。
【0066】
制御部240は、例えば、CPUやMPU等によって、利用者端末200に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部240は、例えば、ASICやFPGA等の集積回路により実現されてもよい。
【0067】
図7に示すように、制御部240は、受付部241を有する。
【0068】
受付部241は、利用者から質問に対する回答を受け付ける。受付部241は、情報処理装置100から送信された質問情報を、通信部210を介して受信し、質問情報を出力部230に表示させて利用者から質問に対する回答を、入力部220を介して受け付ける。なお、受付部241が受け付ける回答情報には、質問情報に含まれる質問に対して利用者が回答した「はい」、又は「いいえ」や、質問に対する回答を文章で表したものが含まれていてよい。
【0069】
〔5.情報処理のフロー〕
次に、
図8を用いて、実施形態に係る情報処理装置100による情報処理の手順について説明する。
図8は、実施形態に係る情報処理の一例を示すフローチャートである。例えば、情報処理装置100は、利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報と、を取得する(ステップS101)。そして、情報処理装置100は、利用者情報と行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶する(ステップS102)。そして、情報処理装置100は、複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出する(ステップS103)。そして、情報処理装置100は、特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行う(ステップS104)。そして、情報処理装置100は、複数のモデルごとに指標の値が所定の範囲の利用者を抽出する(ステップS105)。そして、情報処理装置100は、抽出した利用者の利用者情報と、行動情報をモデルに入力して、指標の値が所定の範囲の値に算出されたモデルを特定する(ステップS106)。
【0070】
〔6.ハードウェア構成〕
また、上述した実施形態に係る情報処理装置100は、例えば
図9に示すような構成のコンピュータ1000によって実現される。
図9は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0071】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが記憶される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0072】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0073】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0074】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0075】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0076】
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、情報処理装置100の制御部130の機能を実現する。
【0077】
〔7.構成と効果〕
本開示に係る情報処理装置100は、利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報を取得する取得部131と、利用者情報と行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するモデル記憶部123と、複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出する算出部132と、算出部132が特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行う質問部133と、複数のモデルごとに指標の値が所定の範囲の値に算出された利用者を抽出する抽出部134と、抽出部134が抽出した利用者の利用者情報と、行動情報を複数のモデルに入力して、指標の値が所定の範囲の値に算出されたモデルを特定する特定部135と、を備える。
【0078】
この構成によれば、属性が推定できない利用者の属性を推定することが可能となる。そのため、蓄積された利用者情報と行動情報を有効に活用して、特定の特徴を有する利用者を対象として広告配信を希望する事業者のニーズを満たすことができる。
【0079】
本開示に係る情報処理装置100の算出部132は、複数のモデルのカテゴリごとに、利用者の特定の特徴についての指標を算出し、抽出部134は、複数のモデルのカテゴリごとに、利用者の指標の値が所定の範囲の利用者を抽出し、特定部135は、複数のモデルのカテゴリごとに、指標の値が所定の範囲の値に算出されたモデルを特定する。
【0080】
この構成によれば、カテゴリごとに属性が推定できない利用者を抽出して、カテゴリごとに利用者の属性を推定することができる。そのため、広告配信を希望する事業者が特定のカテゴリに属する利用者の特徴を指定して広告配信を希望する場合の事業者のニーズを満たすことができる。
【0081】
本開示に係る情報処理方法は、利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報を取得するステップと、利用者情報と行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するステップと、複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出するステップと、特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行うステップと、複数のモデルごとに前記指標の値が所定の範囲の値に算出された利用者を抽出するステップと、抽出した利用者の利用者情報と、行動情報をモデルに入力して、前記指標の値が所定の範囲の値に算出されたモデルを特定するステップと、を含む。
【0082】
この構成によれば、特徴が把握できない利用者の特徴を把握することが可能となる。そのため、蓄積された利用者情報と行動情報を有効に活用して、特定の特徴を有する利用者を対象として広告配信を希望する事業者のニーズを満たすことができる。
【0083】
本開示に係る情報処理プログラムは、利用者に関する情報を示す利用者情報と、利用者の検索履歴を含む行動情報を取得するステップと、利用者情報と行動情報と利用者の特定の特徴との関係を学習させた複数のモデルを記憶するステップと、複数のモデルを用いて利用者ごとに特定の特徴についての指標を算出するステップと、特定の特徴に関する指標を算出した利用者に対して、特定の特徴に関係する質問を行うステップと、複数のモデルごとに前記指標の値が所定の範囲の値に算出された利用者を抽出するステップと、抽出した利用者の利用者情報と、行動情報をモデルに入力して、指標の値が所定の範囲の値に算出されたモデルを特定するステップと、をコンピュータに実行させる。
【0084】
この構成によれば、属性が把握できない利用者の属性を把握することが可能となる。そのため、蓄積された利用者情報と行動情報を有効に活用して、特定の特徴を有する利用者を対象として広告配信を希望する事業者のニーズを満たすことができる。
【0085】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0086】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部131は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0087】
100 情報処理装置
110 通信部
120 記憶部
121 利用者情報記憶部
122 行動情報記憶部
123 モデル記憶部
130 制御部
131 取得部
132 算出部
133 質問部
134 抽出部
135 特定部
200 利用者端末
210 通信部
220 入力部
230 出力部
240 制御部
241 受付部
N ネットワーク