(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023120850
(43)【公開日】2023-08-30
(54)【発明の名称】情報処理装置、情報処理方法、および情報処理プログラム
(51)【国際特許分類】
G06F 16/9535 20190101AFI20230823BHJP
G06Q 50/10 20120101ALI20230823BHJP
【FI】
G06F16/9535
G06Q50/10
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022023948
(22)【出願日】2022-02-18
(71)【出願人】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】森 琢郎
(72)【発明者】
【氏名】小川 知紘
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175HA01
5B175HB03
5L049CC11
(57)【要約】
【課題】ユーザが興味関心を有する可能性がある対象の情報を適切に提供すること。
【解決手段】本願に係る情報処理装置は、第1特定部と、第2特定部と、提供部とを備える。第1特定部は、複数のユーザの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つベクトルが所定期間毎に更新される興味関心空間においてユーザの興味関心範囲に含まれるようになった第1対象を特定する。第2特定部は、第1特定部によって特定された第1対象と過去に類似していた第2対象を特定する。提供部は、第2特定部によって特定された第2対象の情報をユーザに提供する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数のユーザの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つ前記ベクトルが所定期間毎に更新される興味関心空間においてユーザの興味関心範囲に含まれるようになった第1対象を特定する第1特定部と、
前記第1特定部によって特定された前記第1対象と過去に類似していた第2対象を特定する第2特定部と、
前記第2特定部によって特定された前記第2対象の情報を前記ユーザに提供する提供部と、を備える
ことを特徴とする情報処理装置。
【請求項2】
前記第2特定部は、
前記第2対象が過去の予め定められた期間に前記ユーザの前記興味関心範囲に含まれなかったか否かを判定し、
前記提供部は、
前記第2対象が前記予め定められた期間に前記ユーザの前記興味関心範囲に含まれなかったと前記第2特定部によって判定された場合に、前記第2対象の情報を前記ユーザに提供する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記第2対象の前記第1対象との過去の類似期間および類似度のうち少なくとも一方に基づいて、前記第2対象のスコアを前記第2対象毎に算出する算出部を備え、
前記提供部は、
複数の前記第2対象のうち前記算出部によって算出されるスコアが予め定められた条件を満たす第2対象の情報を前記ユーザに提供する
ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記算出部は、
前記類似期間の長さおよび新しさのうち少なくとも一方に基づいて、前記第2対象のスコアを算出する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記算出部は、
前記類似度の変化態様に基づいて、前記第2対象のスコアを算出する
ことを特徴とする請求項3または4に記載の情報処理装置。
【請求項6】
前記算出部は、
前記類似度の上昇速度または下降速度に基づいて、前記第2対象のスコアを算出する
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記提供部は、
前記第2対象と前記ユーザの前記興味関心範囲との類似度が予め定められた範囲外でない場合に、前記第2対象の情報を前記ユーザに提供する
ことを特徴とする請求項1~6のいずれか1つに記載の情報処理装置。
【請求項8】
前記興味関心空間は、
前記複数のユーザが用いた複数の検索語のうち予め定められた条件を満たす2以上の検索語を類似する特徴を有するものとして前記複数の検索語の各々が有する特徴を学習した学習済みモデルに前記複数の対象の情報を入力して得られる複数のベクトルを含み、
前記第1特定部は、
前記学習済みモデルに前記ユーザが用いた前記検索語を入力して得られる前記検索語のベクトルに基づいて、前記ユーザの前記興味関心範囲を特定する
ことを特徴とする請求項1~7のいずれか1つに記載の情報処理装置。
【請求項9】
前記複数のユーザが用いた前記複数の検索語を用いて前記学習済みモデルを生成する学習部を備える
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
コンピュータが実行する情報処理方法であって、
複数のユーザの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つ前記ベクトルが所定期間毎に更新される興味関心空間においてユーザの興味関心範囲に含まれるようになった第1対象を特定する第1特定工程と、
前記第1特定工程によって特定された前記第1対象と過去に類似していた第2対象を特定する第2特定工程と、
前記第2特定工程によって特定された前記第2対象の情報を前記ユーザに提供する提供工程と、を含む
ことを特徴とする情報処理方法。
【請求項11】
複数のユーザの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つ前記ベクトルが所定期間毎に更新される興味関心空間においてユーザの興味関心範囲に含まれるようになった第1対象を特定する第1特定手順と、
前記第1特定手順によって特定された前記第1対象と過去に類似していた第2対象を特定する第2特定手順と、
前記第2特定手順によって特定された前記第2対象の情報を前記ユーザに提供する提供手順と、をコンピュータに実行させる
ことを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、および情報処理プログラムに関する。
【背景技術】
【0002】
従来、ユーザに情報提供を行うための種々の技術が提供されている。例えば、特許文献1には、ユーザが興味関心を持っているカテゴリを、商取引に関連する要素に基づいて分類した複数の象限のうち、ユーザが興味関心を持っているカテゴリが属する象限に基づいて、象限に応じた広告を配信する技術が提案されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来技術には、改善の余地がある。上記の従来技術では、象限に依存した情報提供を行っており、情報提供を柔軟に行うという点では改善の余地があり、ユーザが興味関心を有する可能性がある対象の情報を適切に提供することが望まれている。
【0005】
本願は、上記に鑑みてなされたものであって、ユーザが興味関心を有する可能性がある対象の情報を適切に提供することができる情報処理装置、情報処理方法、および情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、第1特定部と、第2特定部と、提供部とを備える。第1特定部は、複数のユーザの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つベクトルが所定期間毎に更新される興味関心空間においてユーザの興味関心範囲に含まれるようになった第1対象を特定する。第2特定部は、第1特定部によって特定された第1対象と過去に類似していた第2対象を特定する。提供部は、第2特定部によって特定された第2対象の情報をユーザに提供する。
【発明の効果】
【0007】
実施形態の一態様によれば、ユーザが興味関心を有する可能性がある対象の情報を適切に提供することができるという効果を奏する。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る情報処理の一例を示す図である。
【
図2】
図2は、実施形態に係る情報処理装置を含む情報処理システムの構成の一例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置のユーザ情報記憶部に記憶されるユーザ情報テーブルの一例を示す図である。
【
図4】
図4は、実施形態に係る情報処理装置のコンテンツ記憶部に記憶されるコンテンツテーブルの一例を示す図である。
【
図5】
図5は、実施形態に係る情報処理装置の興味関心空間情報記憶部に記憶される興味関心空間情報の一例を示す図である。
【
図6】
図6は、実施形態に係る情報処理装置の第1特定部によって特定される第1対象の一例を示す図である。
【
図7】
図7は、実施形態に係る情報処理装置の第2特定部によって特定される第2対象の一例を示す図である。
【
図8】
図8は、実施形態に係る情報処理装置の第2特定部によって特定される第2対象の一例を示す図である。
【
図9】
図9は、実施形態に係る情報処理装置の処理部による処理手順を示すフローチャートである。
【
図10】
図10は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、情報処理方法、および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、および情報処理プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
〔1.情報処理の一例〕
まず、
図1を用いて、実施形態に係る情報処理の一例について説明する。
図1は、実施形態に係る情報処理の一例を示す図である。実施形態に係る情報処理は、情報処理装置1によって実行される処理であり、検索処理、モデル生成処理、および情報提供処理を含む。
【0011】
まず、検索処理およびモデル生成処理について説明する。
図1に示す情報処理装置1は、ユーザU
1~U
nに検索サービスを提供する。例えば、情報処理装置1は、検索対象がインデックスされて格納されたデータベースである検索対象データベースなどを有しており、かかる検索対象データベースなどの情報を対象として検索処理を実行する。例えば、検索対象データベースの情報は記憶部11(
図2参照)に格納される。
【0012】
図1に示すように、ユーザU
1~U
nは、端末装置2
1~2
nを操作することで、端末装置2
1~2
nから検索クエリを情報処理装置1に送信する処理を端末装置2
1~2
nに実行させる(ステップS1
1~S1
n)。nは、2以上の整数である。
【0013】
例えば、ステップS11において、ユーザU1は、端末装置21を操作することで、端末装置21から検索クエリを情報処理装置1に送信する処理を端末装置21に実行させる。また、ステップS1nにおいて、ユーザUnは、端末装置2nを操作することで、端末装置2nから検索クエリを情報処理装置1に送信する処理を端末装置2nに実行させる。以下において、ユーザU1~Unの各々を個別に区別せずに示す場合、ユーザUと記載し、端末装置21~2nの各々を個別に区別せずに示す場合、端末装置2と記載する場合がある。
【0014】
検索クエリは、ユーザUによって端末装置2に入力された1以上の検索語(検索キーワード)を含む。例えば、ユーザUによって端末装置2に1以上の検索語として「スニーカ」が入力された場合、検索クエリには、「スニーカ」が含まれる。また、ユーザUによって端末装置2に1以上の検索語として「スニーカ レディース」が入力された場合、検索クエリには、「スニーカ レディース」が含まれる。「スニーカ レディース」には、「スニーカ」と「レディース」の2つの検索語がスペース区切りで含まれている。
【0015】
情報処理装置1は、端末装置21~2nから各々送信される検索クエリを受け付ける(ステップS21~S2n)。例えば、情報処理装置1は、ステップS21で、端末装置21から検索クエリを受け付け、ステップS2nで、端末装置2nから検索クエリを受け付ける。
【0016】
次に、情報処理装置1は、ステップS21~S2nで受け付けた検索クエリに基づいて検索処理を実行する(ステップS31~S3n)。例えば、情報処理装置1は、ステップS31において、端末装置21から送信されステップS21で受け付けた検索クエリに含まれる1以上の検索語に対応する対象を検索対象データベースから検索する検索処理を実行する。また、情報処理装置1は、ステップS3nにおいて、端末装置2nから送信されステップS2nで受け付けた検索クエリに含まれる1以上の検索語に対応する対象を検索対象データベースから検索する検索処理を実行する。
【0017】
次に、情報処理装置1は、ステップS31~S3nによる検索処理の結果である検索結果を端末装置21~2nに送信する(ステップS41~S4n)。例えば、情報処理装置1は、ステップS41において、ステップS31の検索処理の結果である検索結果を端末装置21に送信する。また、情報処理装置1は、ステップS4nにおいて、ステップS3nの検索処理の結果である検索結果を端末装置2nに送信する。
【0018】
次に、情報処理装置1は、ステップS21~S2nで受け付けた検索クエリに基づいて、興味関心モデルを生成する(ステップS5)。ステップS5で生成される興味関心モデルは、複数の対象の各々を示す情報を入力とし、M次元のベクトルを出力とするモデルである。Mは、例えば、500~2000の範囲の整数であるが、かかる例に限定されない。また、M次元のベクトルは、例えば、分散表現で示されてもよく、分散表現以外で示されてもよい。以下、M次元のベクトルを単にベクトルと記載する。
【0019】
ステップS5において、情報処理装置1は、予め定められた条件を満たす2以上の検索語を類似する特徴を有するものとして複数の検索語の各々が有する特徴を学習することによって学習済みモデルである興味関心モデルを生成する。予め定められた条件を満たす2以上の検索語は、同一検索クエリに含まれる複数の検索語、または同一のユーザUによって予め定められた時間内に端末装置2から送信される複数の検索クエリに含まれる検索語である。
【0020】
情報処理装置1は、予め定められた条件を満たす2以上の検索語を学習データとして、2以上の検索語のベクトルが互いに類似するように学習を行う。情報処理装置1は、同一のユーザUによって端末装置2から送信される検索クエリに含まれる検索語を、検索クエリの送信時期にかかわらず、予め定められた条件を満たす2以上の検索語として扱うこともできる。
【0021】
なお、検索語は、1つの検索キーワードで構成されるが、2以上の検索キーワードから構成されてもよい。情報処理装置1は、例えば、検索クエリに文字列「スニーカ レディース」が含まれる場合、「スニーカ」と「レディース」とを異なる検索語として扱うが、「スニーカ」と「レディース」との組を1つの検索語として扱うこともできる。
【0022】
情報処理装置1は、例えば、再帰的ニューラルネットワークとも呼ばれるRNN(Recurrent Neural Network)の一種であるLSTM(Long Short-Term Memory)をベクトル生成(例えば、分散表現生成)に用いたDSSM(Deep Structured Semantic Model)の技術を用いて、検索語などの対象を示す情報からベクトル(例えば、分散表現)を出力する興味関心モデルを生成する。なお、対象を示す情報からベクトルを出力する興味関心モデルの生成方法は、上述した例に限定されない。
【0023】
情報処理装置1は、予め定められた期間TA毎に興味関心モデルの生成を行う。例えば、予め定められた期間TAが1ヶ月である場合、情報処理装置1は、2022年1月、2月、3月、・・・の各々の月単位で興味関心モデルの生成を行う。
【0024】
次に、情報提供処理について説明する。情報処理装置1は、興味関心空間での各ユーザUの興味関心範囲を特定する(ステップS6)。興味関心空間では、複数のユーザUの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示される。興味関心空間において、ベクトルで示される対象は、検索語で示される対象に限定されず、検索語で示される対象以外の対象であってもよい。
【0025】
情報処理装置1は、ステップS5で生成された興味関心モデルに対象を示す情報を入力し、興味関心モデルから出力される対象のベクトルを取得する処理を対象毎に行うことによって、各対象のベクトルを含む興味関心空間を生成する。情報処理装置1は、例えば、期間TA毎の興味関心モデルを用いて期間TA毎に興味関心空間を生成する。
【0026】
そして、情報処理装置1は、同一のユーザUによって端末装置2から送信される複数の検索クエリに含まれる検索語をステップS5で生成された興味関心モデルに入力し、興味関心モデルから出力される検索語のベクトルを取得する処理を検索語毎に行う。
【0027】
情報処理装置1は、同一のユーザUによって端末装置2から送信される複数の検索クエリに含まれる検索語のベクトルを平均化して平均ベクトルを算出し、算出した平均ベクトルをユーザ興味関心ベクトルとして判定する。そして、情報処理装置1は、ユーザ興味関心ベクトルと類似する範囲を各ユーザUの興味関心範囲として特定する。なお、情報処理装置1は、例えば、受信した日時が新しい検索クエリの検索語ほど検索語のベクトルの重みを大きくして平均ベクトルを算出することもできる。
【0028】
情報処理装置1は、期間TA毎の興味関心モデルを用いて期間TA毎に各ユーザUの興味関心範囲を特定する。情報処理装置1は、例えば、期間TA内に同一のユーザUによって端末装置2から送信された複数の検索クエリに基づいてその期間TAにおける興味関心範囲をユーザU毎に特定する。
【0029】
次に、情報処理装置1は、興味関心空間においてユーザUの興味関心範囲に含まれることとなった第1対象を特定する(ステップS7)。そして、情報処理装置1は、興味関心空間においてステップS7で特定した第1対象と過去に類似していた第2対象を特定する(ステップS8)。そして、情報処理装置1は、ステップS8で特定した第2対象の情報をユーザUに提供する(ステップS9)。ステップS6~S9の処理は、ユーザU毎に行われる。
【0030】
例えば、興味関心モデルの生成周期が1ヶ月であり、2022年2月の興味関心モデルが最新の興味関心モデルであるとする。また、2022年1月の興味関心モデルを用いて2022年1月の興味関心空間が生成され、2022年2月の興味関心モデルを用いて2022年2月の興味関心空間が生成されるとする。
【0031】
また、2022年1月の興味関心空間において、対象「タピオカ」と対象「マリトッツォ」とが互いに類似しているが、対象「タピオカ」と対象「マリトッツォ」はユーザU1の興味関心範囲に含まれないとする。また、2022年2月の興味関心空間において、対象「マリトッツォ」は継続してユーザU1の興味関心範囲に含まれないが、対象「タピオカ」がユーザU1の興味関心範囲に含まれることになったとする。
【0032】
この場合、情報処理装置1は、対象「タピオカ」を第1対象として特定し、対象「マリトッツォ」を第2対象として特定する。そして、情報処理装置1は、第2対象として特定した対象「マリトッツォ」の情報をユーザU1に提供する。
【0033】
このように、情報処理装置1は、興味関心空間においてユーザUの興味関心範囲に含まれることとなった第1対象と過去に類似していた第2対象の情報をユーザUに提供する。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報を適切に提供することができる。
【0034】
〔2.情報処理システムの構成〕
図2は、実施形態に係る情報処理装置1を含む情報処理システムの構成の一例を示す図である。
図2に示すように、情報処理システム100は、情報処理装置1と、複数の端末装置2
1~2
nとを含む。情報処理装置1および複数の端末装置2
1~2
nは、ネットワークNを介して、有線または無線により通信可能に接続される。
【0035】
情報処理装置1は、インターネットなどの所定のネットワークNを介して、各種の装置と通信可能な情報処理装置であり、例えば、サーバ装置またはクラウドシステムなどにより実現される。例えば、情報処理装置1は、ネットワークNを介して、他の各種装置と通信可能に接続される。
【0036】
また、情報処理装置1は、各ユーザUの端末装置2に対して、ウェブサービスなどのオンラインサービスを提供する。例えば、情報処理装置1は、オンラインサービスとして、上述した検索サービスおよび情報提供サービスの他、例えば、SNS(Social Networking Service)、電子商取引(EC:Electronic Commerce)サイト、投稿サイト、電子決済、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報などのサービスを提供する。なお、情報処理装置1は、上述したオンラインサービスを提供する各種サーバと連携し、オンラインサービスを仲介することもできる。
【0037】
端末装置2は、ブラウザに表示されるウェブページやアプリケーション用のコンテンツなどのコンテンツにアクセスするユーザUによって利用される情報処理装置である。例えば、端末装置2は、デスクトップ型PC(Personal Computer)、ノート型PC、タブレット端末、携帯電話機、PDA(Personal Digital Assistant)などである。なお、端末装置2は、上述した例に限定されなくともよく、例えば、スマートウォッチまたはウェアラブルデバイス(Wearable Device)などであってもよい。
【0038】
〔3.情報処理装置1の構成〕
以下、上述した情報処理装置1が有する機能構成の一例について説明する。
図2に示すように、情報処理装置1は、通信部10と、記憶部11と、処理部12とを有する。
【0039】
〔3.1.通信部10〕
通信部10は、例えば、NIC(Network Interface Card)などによって実現される。そして、通信部10は、ネットワークNと有線または無線で接続され、他の各種装置との間で情報の送受信を行う。例えば、通信部10は、端末装置21~2nとの間でネットワークNを介して情報の送受信を行う。
【0040】
〔3.2.記憶部11〕
記憶部11は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置によって実現される。また、記憶部11は、検索情報記憶部20と、ユーザ情報記憶部21と、コンテンツ記憶部22と、興味関心空間情報記憶部23とを有する。
【0041】
〔3.2.1.検索情報記憶部20〕
検索情報記憶部20は、検索サービスで情報処理装置1が提供する複数の検索対象の情報を記憶する。例えば、検索情報記憶部20は、複数の検索対象の各々がインデックスされて格納されたデータベースである検索対象データベースを格納する。
【0042】
検索対象の情報は、例えば、クローラなどによって収集されるウェブページなどの種々のコンテンツの情報である。検索情報記憶部20に記憶される検索対象の情報は、コンテンツのURL(Uniform Resource Locator)および概要などであるが、かかる例に限定されない。
【0043】
〔3.2.2.ユーザ情報記憶部21〕
ユーザ情報記憶部21は、ユーザU
1~U
nの情報を含むユーザ情報を記憶する。
図3は、実施形態に係る情報処理装置1のユーザ情報記憶部21に記憶されるユーザ情報テーブルの一例を示す図である。
【0044】
図3に示すように、ユーザ情報記憶部21に記憶されるユーザ情報テーブルは、「ユーザID(Identifier)」、「ユーザ名」、「属性」、および「検索履歴」などの情報をユーザU毎に含む。「ユーザID」は、各ユーザUに固有の識別情報である。「ユーザ名」は、ユーザUの名称を示す情報である。
【0045】
「属性」は、ユーザUの属性を示す情報である。ユーザUの属性は、ユーザUのデモグラフィック属性またはサイコグラフィック属性などである。デモグラフィック属性は、人口統計学的なユーザUの属性である。サイコグラフィック属性は、ユーザUの価値観、ライフスタイル、性格、興味関心などを示す属性である。
【0046】
図3に示す例では、ユーザUのデモグラフィック属性として、「性別」および「年齢」などの情報を含む。「性別」は、ユーザUの性別を示す情報であり、「年齢」は、ユーザUの年齢を示す情報である。なお、ユーザUのデモグラフィック属性は、例えば、ユーザUの役職、担当業務、年収、住所、通勤経路、研修履歴、家族構成などがさらに含まれる。ユーザUの嗜好は、例えば、服、旅行、車、バイク、コンピュータ、ランチなどの各対象に対するユーザUの興味関心度合いなどを含む。
【0047】
「検索履歴」は、情報処理装置1が提供するオンラインサービスまたは情報処理装置1がユーザUによって仲介されるオンラインサービスでの検索履歴の情報である。かかる「検索履歴」には、例えば、情報処理装置1による検索クエリの受信日時を示す情報、および検索クエリに含まれる1以上の検索語(検索キーワード)の情報などが検索クエリ毎に含まれる。
【0048】
〔3.2.3.コンテンツ記憶部22〕
コンテンツ記憶部22は、検索サービス以外のオンラインサービスで情報処理装置1が提供するコンテンツを記憶する。
図4は、実施形態に係る情報処理装置1のコンテンツ記憶部22に記憶されるコンテンツテーブルの一例を示す図である。
図4に示した例では、コンテンツ記憶部22は、「コンテンツID」、および「コンテンツ」などをコンテンツ毎に含む。
【0049】
「コンテンツID」は、コンテンツ毎に固有の識別情報である。「コンテンツ」は、「コンテンツID」に対応付けられたコンテンツに関する情報である。具体的には、コンテンツは、コンテンツの内容に関する情報を示してもよい。例えば、コンテンツは、オンラインサービスで提供されるコンテンツである。例えば、コンテンツは、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、またはファイナンス(株価)サイトなどに関するコンテンツである。また、コンテンツは、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログサイト、投稿サイト、音楽配信サイト、動画配信サイト、またはSNSサイトなどに関するコンテンツであってもよい。
【0050】
例えば、
図4では、コンテンツID「C1」のコンテンツは、「CO1」である。なお、
図4に示した例では、コンテンツを、「CO1」などの抽象的な符号で表現したが、コンテンツは、具体的な数値、具体的な文字列、および各種情報などを含むファイル形式などであってもよい。なお、コンテンツ記憶部22は、上述した例に限定されず、目的に応じて種々の情報を記憶してもよい。
【0051】
〔3.2.4.興味関心空間情報記憶部23〕
興味関心空間情報記憶部23は、予め定められた期間TA毎の興味関心空間情報を記憶する。興味関心空間情報には、興味関心空間に配置される複数の対象のベクトルなどの情報が含まれる。興味関心空間は、M次元の空間である。期間TAは、例えば、1ヶ月であるが、かかる例に限定されず、例えば、1週間、2週間、または3ヶ月などであってもよい。また、期間TAは、情報処理装置1によって新たに受け付けられた検索クエリの数または新たな検索語の数が予め設定された閾値以上になる期間であってもよい。
【0052】
図5は、実施形態に係る情報処理装置1の興味関心空間情報記憶部23に記憶される興味関心空間情報の一例を示す図である。
図5に示した例では、興味関心空間情報記憶部23に記憶される興味関心空間情報は、「対象ID」、「対象」、および「ベクトル」などを対象毎に含む。
【0053】
「対象ID」は、対象毎に固有の識別情報である。「対象」は、興味関心空間に配置されるユーザUの興味関心となりうる対象であり、例えば、ショッピング、旅行、ニュース、スポーツ、エンターテイメント、ファイナンス、ゲーム、映画、または音楽などの種々のカテゴリに属する対象である。
【0054】
例えば、
図5では、対象ID「Q1」の対象は、「O1」であり、ベクトルは、「V1」である。なお、
図5に示した例では、対象を、「O1」などの抽象的な符号で表現したが、対象は、具体的な文字列で示されるが、画像などで示されてもよい。また、
図5に示した例では、ベクトルを、「V1」などの抽象的な符号で表現したが、ベクトルは、M次元のベクトルであり、例えば、各次元のベクトル成分の値で示される。
【0055】
〔3.3.処理部12〕
処理部12は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などのプロセッサによって、情報処理装置1内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例)がRAMを作業領域として実行されることにより実現される。また、処理部12は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現される。
【0056】
図2に示すように、処理部12は、受付部30と、検索部31と、学習部32と、特定部33と、算出部34と、提供部35とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、処理部12の内部構成は、
図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
【0057】
〔3.3.1.受付部30〕
受付部30は、各種要求を受け付ける。受付部30は、外部の情報処理装置から各種要求を受け付ける。例えば、受付部30は、各端末装置2からの要求を受け付ける。
【0058】
受付部30は、ユーザUが入力した1以上の検索語(検索キーワード)を含む検索クエリを端末装置2からネットワークNおよび通信部10を介して受け付ける。また、受付部30は、ユーザUのコンテンツ送信要求をネットワークNおよび通信部10を介して端末装置2から受け付ける。コンテンツ送信要求は、コンテンツを特定した要求である。
【0059】
〔3.3.2.検索部31〕
検索部31は、受付部30によって受け付けられた検索クエリに含まれる1以上の検索語に応じた検索対象の情報を検索情報記憶部20に記憶されている複数の検索対象の情報の中から検索する。検索部31は、検索した検索対象の情報を検索結果としてネットワークNおよび通信部10を介して検索クエリを送信した端末装置2に送信する。
【0060】
また、検索部31は、受付部30によって受け付けられた検索クエリに含まれる1以上の検索語に応じた検索対象の情報をコンテンツ記憶部22に記憶されている複数のコンテンツの中から検索することもできる。検索部31は、検索したコンテンツを検索結果としてネットワークNおよび通信部10を介して検索クエリを送信した端末装置2に送信する。
【0061】
〔3.3.3.学習部32〕
学習部32は、予め定められた条件を満たす2以上の検索語を類似する特徴を有するものとして複数の検索語の各々が有する特徴を学習した学習済みモデルである興味関心モデルを期間TA毎に生成する。
【0062】
予め定められた条件を満たす2以上の検索語は、同一検索クエリに含まれる複数の検索語、または同一のユーザUによって予め定められた時間内に端末装置2から送信される複数の検索クエリに含まれる検索語である。なお、学習部32は、同一のユーザUによって端末装置2から送信される検索クエリに含まれる検索語を、検索クエリの送信時期にかかわらず、予め定められた条件を満たす2以上の検索語として扱うこともできる。
【0063】
学習部32は、期間TA内を検索日時とする検索クエリに含まれる検索語を用いて学習用データを生成する。例えば、学習部32は、期間TA毎に予め定められた条件を満たす2以上の検索語をユーザ情報記憶部21から取得し、取得した2以上の検索語を学習用データとして用いて興味関心モデルを生成する。例えば、学習部32は、予め定められた条件を満たす2以上の検索語を学習データとして、2以上の検索語のベクトルが互いに類似するように学習を行う。
【0064】
学習部32は、例えば、再帰的ニューラルネットワークとも呼ばれるRNNの一種であるLSTMをベクトル生成に用いたDSSMの技術を用いて、検索語などの対象を示す情報からベクトルを出力する興味関心モデルを生成する。なお、検索語などの対象を示す情報からベクトルを出力する興味関心モデルの生成方法は、上述した例に限定されず、類似する複数の対象を示すベクトルが互いに類似するように学習を行うことができればよく、種々の公知技術を用いることができる。
【0065】
学習部32は、生成した期間TA毎の興味関心モデルを用いて複数の対象の各々のベクトルを取得し、取得した複数の対象のベクトルの情報を含む情報を興味関心空間情報として期間TA毎に記憶部11における興味関心空間情報記憶部23に記憶させる。
【0066】
〔3.3.4.特定部33〕
特定部33は、複数のユーザUの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つベクトルが期間TA毎に更新される興味関心空間においてユーザUの興味関心範囲に含まれるようになった第1対象を特定し、第1対象と過去に類似していた第2対象を特定する。特定部33は、第1特定部40と、第2特定部41とを備える。
【0067】
〔3.3.4.1.第1特定部40〕
第1特定部40は、複数のユーザUの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つベクトルが期間TA毎に更新される興味関心空間においてユーザUの興味関心範囲に含まれるようになった第1対象を特定する。
【0068】
第1特定部40は、例えば、期間TA毎の興味関心モデルを用いて期間TA毎に各ユーザUの興味関心範囲を特定する。第1特定部40は、例えば、各期間TA内において同一のユーザUによって端末装置2から送信されたすべての検索クエリの各々に含まれる検索語をユーザ情報記憶部21からユーザU毎に取得する。そして、第1特定部40は、取得した複数の検索語のベクトルを平均化して平均ベクトルを算出し、算出した平均ベクトルをユーザ興味関心ベクトルとしてユーザU毎に判定する処理を期間TA毎に行う。なお、第1特定部40は、例えば、受信した日時が新しいほど検索語のベクトルの重みを大きくして平均ベクトルを算出することもできる。
【0069】
第1特定部40は、ユーザUのユーザ興味関心ベクトルと類似する範囲をユーザUの興味関心範囲としてユーザU毎に特定する。ユーザ興味関心ベクトルとの類似範囲は、例えば、コサイン類似度が予め定められた範囲であるが、かかる例に限定されない。なお、第1特定部40は、例えば、同一のユーザUの新たな検索クエリの数または新たな検索語の数が予め設定された閾値以上になる毎にそのユーザUの興味関心範囲を特定することもできる。
【0070】
第1特定部40は、複数の対象のうち最新の興味関心空間においてユーザUの興味関心範囲に含まれるようになった第1対象を特定する。例えば、2021年10月~2022年2月までの各月の興味関心空間がある場合、最新の興味関心空間は、2022年2月の興味関心空間である。2021年10月~2022年2月までの各月の興味関心空間は、2021年10月~2022年2月までの各月の興味関心モデルによって得られる。
【0071】
例えば、2021年10月の興味関心空間は、2021年10月の興味関心モデルに複数の対象の各々を示す情報を入力することによって得られ、2022年2月の興味関心空間は、2022年2月の興味関心モデルに複数の対象の各々を示す情報を入力することによって得られる。また、興味関心空間は、2021年10月の興味関心空間の状態、2021年11月の興味関心空間の状態、2021年12月の興味関心空間の状態、2022年1月の興味関心空間の状態、2022年2月の興味関心空間の状態に順次更新される。
【0072】
図6は、実施形態に係る情報処理装置1の第1特定部40によって特定される第1対象の一例を示す図である。
図6では、M次元の興味関心空間を低次元化して可視化した興味関心空間の一部が示されている。
図6に示す例では、2期間前の興味関心空間における対象O1の位置P
1(t
-2)と、1期間前の興味関心空間における対象O1の位置P
1(t
-1)と、最新の興味関心空間におけるO1の位置P
1(t
0)とが示されている。
【0073】
図6に示すように、対象O1は、2期間前の興味関心空間および1期間前の興味関心空間では、ユーザU
1の興味関心範囲に入っていないが、最新の興味関心空間では、ユーザU
1の興味関心範囲に入っている。この場合、第1特定部40は、対象O1を第1対象として特定する。なお、最新の興味関心空間が2022年2月の興味関心空間である場合、1期間前の興味関心空間は、例えば、2022年1月の興味関心空間であり、2期間前の興味関心空間は、例えば、2021年12月の興味関心空間である。
【0074】
また、第1特定部40は、例えば、過去の予め定められた期間前までの興味関心空間においてユーザUの興味関心範囲内になかったが最新の興味関心空間において、新たにユーザUの興味関心範囲に含まれるようになった対象を第1対象として特定することができる。
【0075】
なお、上述した例では、対象がユーザUの興味関心範囲内であるか否かは、同一の期間TAの興味関心モデルを用いて各々得られる興味関心空間とユーザUの興味関心範囲とを用いて判定されるが、かかる例に限定されない。例えば、第1特定部40は、各期間TAの興味関心モデルを用いて得られる各期間TAの興味関心空間で対象の各期間TAのベクトルと最新の興味関心モデルを用いて得られるユーザUの興味関心範囲とを用いて対象がユーザUの興味関心範囲内であるか否かを判定することもできる。
【0076】
〔3.3.4.2.第2特定部41〕
第2特定部41は、第1特定部40によって特定された第1対象と過去に類似していた第2対象を特定する。具体的には、第2特定部41は、第1特定部40によって特定された第1対象と1期間以上前の興味関心空間において、第1対象と類似していた対象を第2対象として特定する。第1対象の類似範囲は、例えば、第1対象とのコサイン類似度が予め定められた範囲であるが、かかる例に限定されない。
【0077】
図7は、実施形態に係る情報処理装置1の第2特定部41によって特定される第2対象の一例を示す図である。
図7では、
図6と同様に、M次元の興味関心空間を低次元化して可視化した興味関心空間の一部が示されている。
【0078】
図7に示す例では、
図6に示す例と同様に、2期間前の興味関心空間における対象O1の位置P
1(t
-2)と、1期間前の興味関心空間における対象O1の位置P
1(t
-1)と、最新の興味関心空間における対象O1の位置P
1(t
0)とが示されている。また、
図7に示す例では、2期間前の興味関心空間における対象O2の位置P
2(t
-2)と、1期間前の興味関心空間における対象O2の位置P
2(t
-1)と、最新の興味関心空間における対象O2の位置P
2(t
0)とが示されている。
【0079】
2期間前の興味関心空間と1期間前の興味関心空間において、対象O1の類似範囲には、対象O2が含まれており、第2特定部41は、対象O2を第2対象として特定する。
【0080】
また、第2特定部41は、第2対象が過去の予め定められた期間にユーザUの興味関心範囲に含まれなかったか否かを判定することもできる。
図8は、実施形態に係る情報処理装置1の第2特定部41によって特定される第2対象の一例を示す図である。
図8では、
図6および
図7と同様に、M次元の興味関心空間を低次元化して可視化した興味関心空間の一部が示されている。
【0081】
図8に示す例では、
図7に示す状態に比べて、3期間前の興味関心空間における対象O2の位置P
2(t
-3)が示されている。3期間前の興味関心空間において、対象O2がユーザUの興味関心範囲に含まれている。この場合、第2特定部41は、第2対象として特定した対象O2が過去の予め定められた期間にユーザUの興味関心範囲に含まれていると判定する。
【0082】
予め定められた期間は、例えば、K期間前までの期間TC=TA×Kである。Kは、例えば、10以上の整数であるが、かかる例に限定されない。ここで、K+1期間前以前の興味関心空間で第2対象がユーザUの興味関心範囲に含まれており、K期間前の興味関心空間から1期間前までの興味関心空間までまたはK期間前の興味関心空間から最新の興味関心空間まで第2対象がユーザUの興味関心範囲に含まれていないとする。この場合、第2特定部41は、第2対象が過去の予め定められた期間にユーザUの興味関心範囲に含まれなかったと判定する。
【0083】
〔3.3.5.算出部34〕
算出部34は、第2対象の第1対象との過去の類似期間および類似度のうち少なくとも一方に基づいて、第2対象のスコアScを第2対象毎に算出する。
【0084】
過去の類似期間は、例えば、K期間前の期間TAから1期間前の期間TAまでにおいて、第2対象が第1対象と類似していた期間のトータルの期間である。例えば、K=10であり、TA=1ヶ月である場合、10ヶ月前から1ヶ月前までの期間において、7ヶ月前の期間TAと4ヶ月前の期間TAで第1対象の類似範囲にない第2対象の類似期間は、8ヶ月間である。この場合、算出部34は、例えば、スコアScを80(=10×8)とする。
【0085】
また、算出部34は、類似期間が新しいほど重みを大きくして第2対象が第1対象と類似していた期間を重み付け加算することで、スコアScを算出することができる。例えば、K=10であり、K期間前の期間TAから1期間前の期間TAまでの重みを順に、wK、wK-1、・・・、w2、w1とし、wK<wK-1<・・・<w2<w1とすると、算出部34は、例えば、下記式(1)を用いてスコアScを算出することができる。
Sc=w1×a1+w2×a2+・・・・+wK-1×aK-1+wK×aK
・・・(1)
【0086】
上記式(1)において、a1は、1期間前の期間TAにおいて類似した場合に「1」が代入され、そうでない場合に「0」が代入され、a2は、2期間前の期間TAにおいて類似した場合に「1」が代入され、そうでない場合に「0」が代入される。また、aK-1は、K-1回前の期間TAにおいて類似した場合に「1」が代入され、そうでない場合に「0」が代入され、aKは、K期間前の期間TAにおいて類似した場合に「1」が代入され、そうでない場合に「0」が代入される。なお、以下において、重みwK、wK-1、・・・、w2、w1の各々を個別に区別せずに示す場合、重みwと記載する場合がある。
【0087】
また、算出部34は、第2対象の第1対象との過去の類似度に基づいて、第2対象のスコアを算出することができる。例えば、算出部34は、第2対象の第1対象との類似度が高い期間ほど重みwを大きくして、上記式(1)を用いて、スコアScを算出することができる。
【0088】
また、算出部34は、第2対象の第1対象との過去の類似度の変化態様に基づいて、第2対象のスコアを算出することができる。例えば、算出部34は、第2対象の第1対象との過去の類似度の上昇速度が高いほどスコアScを大きくすることができる。
【0089】
例えば、K期間前の期間TAから1期間前の期間TAまでにおいて、第2対象が第1対象と類似していた最も古い期間TAをK1期間前の期間TAとし、期間Ts1における類似度を類似度Ds1とする。また、K期間前の期間から1期間前の期間までにおいて、第2対象が第1対象と類似していた最も新しい期間TAをK2期間前の期間TAとし、期間Ts2における類似度を類似度Ds2とする。この場合、算出部34は、下記式(2)を用いて、スコアScを算出することができる。下記式(2)において、k1は、係数であり、Sc1は、固定値である。
Sc=Sc1+k1(Ds2-Ds1)/(K2-K1)・・・(2)
【0090】
また、算出部34は、例えば、上記式(1)で算出されるスコアScと上記式(2)で算出されるスコアScとを加算した結果を第2対象のスコアScとして算出することもできる。
【0091】
また、算出部34は、第2対象の第1対象との過去の類似度の下降速度が高いほどスコアScを高くすることができる。例えば、K期間前の期間TAから1期間前の期間TAまでにおいて、第2対象が第1対象と類似していた最も古い期間TAをK1期間前の期間TAとし、期間Ts1における類似度を類似度Ds1とする。また、K期間前の期間TAから1期間前の期間TAまでにおいて、第2対象が第1対象と類似していた最も新しい期間をK2期間前の期間TAとし、期間Ts2における類似度を類似度Ds2とする。この場合、算出部34は、下記式(3)を用いて、スコアScを算出することができる。下記式(3)において、k2は、係数であり、Sc2は、固定値である。
Sc=Sc2+k2(Ds1-Ds2)/(K2-K1)・・・(3)
【0092】
また、算出部34は、例えば、上記式(1)で算出されるスコアScと上記式(3)で算出されるスコアScとを加算した結果を第2対象のスコアScとして算出することもできる。また、算出部34は、例えば、第2対象の第1対象との過去の類似度の変化態様と特定の変化態様と類似度が高いほど、第2対象のスコアScを高くすることができる。また、算出部34は、記式(1)で算出されるスコアScと、第2対象の第1対象との過去の類似度の変化態様と特定の変化態様と類似度が高いほど高くなるスコアとを合算した値を、第2対象のスコアScとして算出することもできる。
【0093】
このように、算出部34は、第2対象の第1対象との過去の類似期間および類似度のうち少なくとも一方に基づいて、第2対象のスコアScを第2対象毎に算出することができる。
【0094】
〔3.3.6.提供部35〕
提供部35は、特定部33によって特定された第2対象の情報をユーザUに提供する。第2対象の情報のユーザUへの提供は、提供部35から通信部10およびネットワークNを介して端末装置2に送信することによって行われる。これにより、提供部35は、ユーザUの興味関心を有する可能性がある対象の情報を適切に提供することができる。
【0095】
第2対象の情報は、例えば、第2対象が「マリトッツォ」である場合、マリトッツォの情報であり、第2対象が「タピオカ」である場合、タピオカの情報である。提供部35は、例えば、記憶部11のコンテンツ記憶部22に記憶されているコンテンツの中から、第2対象の情報を取得し、取得した第2対象の情報を通信部10およびネットワークNを介して端末装置2に送信する。
【0096】
また、提供部35は、第2対象が予め定められた期間にユーザUの興味関心範囲に含まれなかったと特定部33によって判定された場合に、第2対象の情報をユーザUに提供する。これにより、提供部35は、ユーザUが知らない可能性が高いがユーザUの興味関心を有する可能性がある対象の情報を適切に提供することができる。
【0097】
また、提供部35は、最新の期間TAにおける興味関心空間において、第2対象とユーザUの興味関心範囲との類似度が予め定められた範囲外でない場合に、第2対象の情報をユーザに提供することができる。これによっても、提供部35は、ユーザUが知らない可能性が高いがユーザUの興味関心を有する可能性がある対象の情報を適切に提供することができる。
【0098】
また、提供部35は、複数の第2対象のうち算出部34によって算出されるスコアScが予め定められた条件を満たす第2対象の情報をユーザUに提供することもできる。例えば、提供部35は、複数の第2対象のうち算出部34によって算出されるスコアScが閾値以上である第2対象の情報をユーザUに提供する。また、提供部35は、複数の第2対象のうち算出部34によって算出されるスコアScが最も高い第2対象の情報をユーザUに提供する。
【0099】
このように、提供部35は、算出部34によって算出されるスコアScに基づいて、第2対象の情報をユーザUに提供することから、複数の第2対象がある場合において、より適切な第2対象の情報をユーザUに提供することができる。
【0100】
なお、提供部35は、第2対象の情報をプッシュ型でユーザUに提供したりプル型でユーザUに提供したりすることができる。例えば、提供部35は、第2対象の情報を端末装置2にインストールされたアプリケーションにより端末装置2にポップアップ表示させたり、電子メールでユーザUのメールアドレスへ送信したりすることができる。また、提供部35は、ユーザUが端末装置2を用いて情報処理装置1にアクセスした際に、第2対象の情報を端末装置2に送信することで、第2対象の情報をユーザUに提供することもできる。なお、ユーザUへの第2対象の情報の提供方法は、これらの方法に限定されない。
【0101】
〔4.処理手順〕
次に、
図9を用いて、実施形態に係る情報処理装置1による処理の手順について説明する。
図9は、実施形態に係る情報処理装置1の処理部12による処理手順を示すフローチャートである。
【0102】
図9に示すように、情報処理装置1の処理部12は、興味関心モデルの学習処理タイミングになったか否かを判定する(ステップS10)。興味関心モデルの学習処理タイミングは、例えば、期間TA毎に発生するタイミングであるが、かかる例に限定されない。
【0103】
処理部12は、興味関心モデルの学習処理タイミングになったと判定した場合(ステップS10:Yes)、興味関心モデルの生成を行う(ステップS11)。そして、処理部12は、ステップS11で生成した興味関心モデルを用いて興味関心空間情報を生成し、生成した興味関心空間情報を記憶部11に記憶させる(ステップS12)。
【0104】
処理部12は、ステップS12の処理が終了した場合、または興味関心モデルの学習処理タイミングになっていないと判定した場合(ステップS10:No)、ユーザ興味関心判定タイミングになったか否かを判定する(ステップS13)。ユーザ興味関心判定タイミングは、例えば、期間TA毎に発生するタイミングであるが、かかる例に限定されない。
【0105】
処理部12は、ユーザ興味関心判定タイミングになったと判定した場合(ステップS13:Yes)、ユーザUの検索クエリに基づいて、ユーザUの興味関心位置を特定する(ステップS14)。
【0106】
処理部12は、ステップS14の処理が終了した場合、またはユーザ興味関心判定タイミングになっていないと判定した場合(ステップS13:No)、情報提供対象判定タイミングになったか否かを判定する(ステップS15)。情報提供対象判定タイミングは、ステップS14でユーザUの興味関心位置が特定された後のタイミングである。例えば、情報提供対象判定タイミングは、ステップS14でユーザUの興味関心位置が特定された直後のタイミングまたはユーザUが端末装置2を用いて情報処理装置1にアクセスしたタイミングである。
【0107】
処理部12は、情報提供対象判定タイミングになったと判定した場合(ステップS15:Yes)、ステップS12で生成された興味関心空間情報で示される興味関心空間においてユーザUの興味関心範囲に含まれるようになった第1対象を特定する(ステップS16)。そして、処理部12は、ステップS16で特定した第1対象と過去に類似していた第2対象を特定し(ステップS17)、ステップS17で特定した第2対象の情報をユーザUに提供する(ステップS18)。
【0108】
処理部12は、ステップS18の処理が終了した場合、または情報提供対象判定タイミングになったと判定した場合(ステップS15:No)、動作終了タイミングになったか否かを判定する(ステップS19)。処理部12は、例えば、情報処理装置1の電源がオフにされた場合などに動作終了タイミングになったと判定する。
【0109】
処理部12は、動作終了タイミングになっていないと判定した場合(ステップS19:No)、処理をステップS10へ移行し、動作終了タイミングになったと判定した場合(ステップS19:Yes)、
図9に示す処理を終了する。
【0110】
〔5.変形例〕
上述した情報処理装置1は、上述した実施形態以外にも種々の異なる形態にて実施されてもよい。そこで、以下では、情報処理装置1の他の実施形態について説明する。
【0111】
情報処理装置1の処理部12は、興味関心モデルを複数種類生成することができる。例えば、処理部12は、地域毎の興味関心モデルを生成し、地域毎の興味関心モデルに基づいて、地域毎の興味関心空間を形成することができる。例えば、処理部12は、対象地域内の複数のユーザUが用いた複数の検索語のうち予め定められた条件を満たす2以上の検索語を類似する特徴を有するものとして複数の検索語の各々が有する特徴を学習した興味関心モデルを地域毎に生成することもできる。
【0112】
また、処理部12は、ユーザUの属性毎の興味関心モデルに基づいて、ユーザUの属性毎の興味関心空間を形成することができる。例えば、処理部12は、特定属性を有する複数のユーザUが用いた複数の検索語のうち予め定められた条件を満たす2以上の検索語を類似する特徴を有するものとして複数の検索語の各々が有する特徴を学習した興味関心モデルを特定属性毎に生成することもできる。
【0113】
また、処理部12は、期間TA内に複数のユーザUによって複数の端末装置2から送信された複数の検索クエリに基づいてその期間TAにおける興味関心モデルを生成するが、かかる例に限定されない。例えば、処理部12は、P期間前の期間TAと最新の期間TAとを含む期間において期間TA内に複数のユーザUによって複数の端末装置2から送信された複数の検索クエリに基づいて最新の期間TAにおける興味関心モデルを生成することもできる。Pは、1以上の整数である。
【0114】
また、処理部12は、期間TB毎に、期間TB内において同一のユーザUによって端末装置2から送信された複数の検索クエリに基づいて、ユーザUの興味関心範囲をユーザU毎に特定することもできる。期間TBは、例えば、期間TAよりも長いまたは短い期間である。なお、期間TBは、情報処理装置1によって同一のユーザUから新たに受け付けられた検索クエリの数または新たな検索語の数が予め設定された閾値以上になる期間であってもよい。
【0115】
〔6.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置1は、例えば
図10に示すような構成のコンピュータ80によって実現される。
図10は、実施形態に係る情報処理装置1の機能を実現するコンピュータ80の一例を示すハードウェア構成図である。コンピュータ80は、CPU81、RAM82、ROM(Read Only Memory)83、HDD(Hard Disk Drive)84、通信インターフェイス(I/F)85、入出力インターフェイス(I/F)86、およびメディアインターフェイス(I/F)87を有する。
【0116】
CPU81は、ROM83またはHDD84に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM83は、コンピュータ80の起動時にCPU81によって実行されるブートプログラムや、コンピュータ80のハードウェアに依存するプログラムなどを記憶する。
【0117】
HDD84は、CPU81によって実行されるプログラム、および、かかるプログラムによって使用されるデータなどを記憶する。通信インターフェイス85は、ネットワークN(
図2参照)を介して他の機器からデータを受信してCPU81へ送り、CPU81が生成したデータを、ネットワークNを介して他の機器に送信する。
【0118】
CPU81は、入出力インターフェイス86を介して、ディスプレイやプリンタなどの出力装置、および、キーボードまたはマウスなどの入力装置を制御する。CPU81は、入出力インターフェイス86を介して、入力装置からデータを取得する。また、CPU81は、入出力インターフェイス86を介して生成したデータを出力装置へ出力する。
【0119】
メディアインターフェイス87は、記録媒体88に記憶されたプログラムまたはデータを読み取り、RAM82を介してCPU81に提供する。CPU81は、かかるプログラムを、メディアインターフェイス87を介して記録媒体88からRAM82上にロードし、ロードしたプログラムを実行する。記録媒体88は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)などの光学記録媒体、MO(Magneto-Optical disk)などの光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリなどである。
【0120】
コンピュータ80のCPU81は、RAM82上にロードされたプログラムを実行することにより、処理部12の機能を実現する。また、HDD84には、記憶部11内のデータが記憶される。コンピュータ80のCPU81は、これらのプログラムを記録媒体88から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0121】
〔7.その他〕
また、上述した実施形態および変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上述した文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0122】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0123】
また、上述してきた実施形態および変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0124】
〔8.効果〕
上述してきたように、実施形態に係る情報処理装置1は、第1特定部40と、第2特定部41と、提供部35とを備える。第1特定部40は、複数のユーザUの興味関心に対する関連性に応じて複数の対象の各々がベクトルで示され且つベクトルが所定期間毎に更新される興味関心空間においてユーザUの興味関心範囲に含まれるようになった第1対象を特定する。第2特定部41は、第1特定部40によって特定された第1対象と過去に類似していた第2対象を特定する。提供部35は、第2特定部41によって特定された第2対象の情報をユーザUに提供する。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報を適切に提供することができる。
【0125】
また、第2特定部41は、第2対象が過去の予め定められた期間にユーザUの興味関心範囲に含まれなかったか否かを判定する。提供部35は、第2対象が予め定められた期間にユーザUの興味関心範囲に含まれなかったと第2特定部41によって判定された場合に、第2対象の情報をユーザUに提供する。これにより、情報処理装置1は、ユーザUが知らない可能性が高いがユーザUの興味関心を有する可能性がある対象の情報を適切に提供することができる。
【0126】
また、情報処理装置1は、第2対象の第1対象との過去の類似期間および類似度のうち少なくとも一方に基づいて、第2対象のスコアScを第2対象毎に算出する算出部34を備える。提供部35は、複数の第2対象のうち算出部34によって算出されるスコアScが予め定められた条件を満たす第2対象の情報をユーザUに提供する。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報をより適切に提供することができる。
【0127】
また、算出部34は、第2対象の第1対象との過去の類似期間の長さおよび新しさのうち少なくとも一方に基づいて、第2対象のスコアScを算出する。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報をより適切に提供することができる。
【0128】
また、算出部34は、第2対象の第1対象との過去の類似度の変化態様に基づいて、第2対象のスコアScを算出する。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報をより適切に提供することができる。
【0129】
また、算出部34は、第2対象の第1対象との過去の類似度の上昇速度または下降速度に基づいて、第2対象のスコアScを算出する。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報をより適切に提供することができる。
【0130】
また、提供部35は、第2対象とユーザUの興味関心範囲との類似度が予め定められた範囲外でない場合に、第2対象の情報をユーザUに提供する。これにより、情報処理装置1は、ユーザUが知らない可能性が高いがユーザUの興味関心を有する可能性がある対象の情報をより適切に提供することができる。
【0131】
また、興味関心空間は、複数のユーザUが用いた複数の検索語のうち予め定められた条件を満たす2以上の検索語を類似する特徴を有するものとして複数の検索語の各々が有する特徴を学習した学習済みモデルに複数の対象の情報を入力することによって複数のベクトルを含む。第1特定部40は、学習済みモデルにユーザUが用いた検索語を入力して得られる検索語のベクトルに基づいて、ユーザUの興味関心範囲を特定する。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報をより適切に提供することができる。
【0132】
また、情報処理装置1は、複数のユーザUが用いた複数の検索語を用いて学習済みモデルを生成する学習部32を備える。これにより、情報処理装置1は、ユーザUの興味関心を有する可能性がある対象の情報をより適切に提供することができる。
【0133】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0134】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0135】
1 情報処理装置
2,21~2n 端末装置
10 通信部
11 記憶部
12 処理部
20 検索情報記憶部
21 ユーザ情報記憶部
22 コンテンツ記憶部
23 興味関心空間情報記憶部
30 受付部
31 検索部
32 学習部
33 特定部
34 算出部
35 提供部
40 第1特定部
41 第2特定部
100 情報処理システム
N ネットワーク