IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特開2024-93156レコメンド決定装置、レコメンド決定方法、およびプログラム
<>
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図1
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図2
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図3
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図4
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図5
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図6
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図7
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図8
  • 特開-レコメンド決定装置、レコメンド決定方法、およびプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024093156
(43)【公開日】2024-07-09
(54)【発明の名称】レコメンド決定装置、レコメンド決定方法、およびプログラム
(51)【国際特許分類】
   G06F 16/9035 20190101AFI20240702BHJP
【FI】
G06F16/9035
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022209350
(22)【出願日】2022-12-27
(11)【特許番号】
(45)【特許公報発行日】2024-04-16
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】山本 康生
(72)【発明者】
【氏名】藤野 拓海
(72)【発明者】
【氏名】武田 悠佑
(72)【発明者】
【氏名】積田 大介
(72)【発明者】
【氏名】松田 崇
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175HA01
5B175HA02
(57)【要約】
【課題】テーマとレコメンドするアイテムとの対応付けを、人手を介さずに実施することができるレコメンド決定装置、レコメンド決定方法、およびプログラムを提供すること。
【解決手段】電子的手法により提供されるアイテムの利用者に対してレコメンドするレコメンドアイテムを決定するレコメンド決定装置であって、前記利用者によるアイテムの選択履歴と、前記アイテムに関連付けられたテーマとに基づいて、前記利用者にレコメンドとして提示すべきレコメンドアイテムのテーマである関心テーマを推定するテーマ推定部と、前記テーマ推定部によって推定された前記関心テーマの各テーマについて、テーマにおける各アイテムの重要度を推定するアイテム推定部と、前記関心テーマのテーマごとに、前記利用者に対するレコメンドアイテムを前記重要度のランキング結果をもとに決定するレコメンド決定部と、を備えるレコメンド決定装置。
【選択図】図1
【特許請求の範囲】
【請求項1】
電子的手法により提供されるアイテムの利用者に対してレコメンドするレコメンドアイテムを決定するレコメンド決定装置であって、
前記利用者によるアイテムの選択履歴と、前記アイテムに関連付けられたテーマとに基づいて、前記利用者にレコメンドとして提示すべきレコメンドアイテムのテーマである関心テーマを推定するテーマ推定部と、
前記テーマ推定部によって推定された前記関心テーマの各テーマについて、テーマにおける各アイテムの重要度を推定するアイテム推定部と、
前記関心テーマのテーマごとに、前記利用者に対するレコメンドアイテムを前記重要度のランキング結果をもとに決定するレコメンド決定部と、
を備えるレコメンド決定装置。
【請求項2】
前記テーマ推定部は、前記利用者およびテーマの素性を入力として素性前記利用者が各テーマを選択する割合である接触率を出力するテーマ推定モデルを機械学習の手法により学習し、前記テーマ推定モデルによって推定された前記接触率が閾値以上のテーマを利用者の関心テーマとして決定する、
請求項1に記載のレコメンド決定装置。
【請求項3】
前記テーマ推定部は、利用者が各テーマに関連付けられたアイテムを選択した回数である接触回数を文書としテーマを単語とした場合の第1のTf-Idf値を求め、前記第1のTf-Idf値に基づいて前記利用者の各テーマに対する嗜好度を推定する、
請求項1に記載のレコメンド決定装置。
【請求項4】
前記アイテム推定部は、前記利用者の各テーマに対する嗜好度と、前記利用者による前記アイテムの選択履歴とに基づいて、前記利用者が或るテーマに対する関心を根拠としてアイテムを選択した回数である根拠回数を推定し、テーマとアイテムの組み合わせごとの根拠回数をもとに、テーマを文書としアイテムを単語とした場合の第2のTf-Idf値を求め、前記第2のTf-Idf値に基づいて各テーマにおける各アイテムの重要度を前記利用者について推定する、
請求項3に記載のレコメンド決定装置。
【請求項5】
前記関心テーマとして推定された各テーマに関して、レコメンドの優先度を決定する優先度決定部をさらに備え、
前記優先度決定部は、各テーマについて推定された前記嗜好度に基づいて前記関心テーマの優先度を決定する、
請求項3に記載のレコメンド決定装置。
【請求項6】
前記優先度決定部は、過去の所定期間において前記利用者が選択したアイテムの選択状況に応じて、前記優先度を決定する際に使用する前記嗜好度を補正する、
請求項5に記載のレコメンド決定装置。
【請求項7】
電子的手法により提供されるアイテムの利用者に対してレコメンドするレコメンドアイテムを決定するレコメンド決定装置が、
前記利用者によるアイテムの選択履歴と、前記アイテムに関連付けられたテーマとに基づいて、前記利用者にレコメンドとして提示すべきレコメンドアイテムのテーマである関心テーマを推定し、
前記推定された関心テーマの各テーマについて、テーマにおける各アイテムの重要度を推定し、
前記関心テーマのテーマごとに、前記利用者に対するレコメンドアイテムを前記重要度のランキング結果をもとに決定する、
レコメンド決定方法。
【請求項8】
電子的手法により提供されるアイテムの利用者に対してレコメンドするレコメンドアイテムを決定するレコメンド決定装置に、
前記利用者によるアイテムの選択履歴と、前記アイテムに関連付けられたテーマとに基づいて、前記利用者にレコメンドとして提示すべきレコメンドアイテムのテーマである関心テーマを推定させ、
前記推定された関心テーマの各テーマについて、テーマにおける各アイテムの重要度を推定させ、
前記関心テーマのテーマごとに、前記利用者に対するレコメンドアイテムを前記重要度のランキング結果をもとに決定させる、
ためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、レコメンド決定装置、レコメンド決定方法、およびプログラムに関する。
【背景技術】
【0002】
従来、消費者の興味関心を推定し、その推定した興味関心に関する広告を提供する場合において、消費者に受け入れられ易いかたちで、広告を効果的に提供できるようにする技術が提案されている(例えば特許文献1参照)。特許文献1には、消費者に関連する情報に基づいて、当該消費者が何に対してどの程度の興味関心を持っているかの嗜好レベルを推定し、興味関心があると推定された対象または当該対象に対応するカテゴリにより特定されるテーマに関する広告を選択的に提供するとともに、推定された嗜好レベルに応じて、上記テーマに関する広告の表示態様を変更することについて記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2017-207936号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、テーマとレコメンドするアイテム(例えば広告)との対応付けは人手で行われており非効率かつ高負荷であった。
【0005】
本発明は、このような事情を考慮してなされたものであり、テーマとレコメンドするアイテム(例えば広告)との対応付けを、人手を介さずに実施することができるレコメンド決定装置、レコメンド決定方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、電子的手法により提供されるアイテムの利用者に対してレコメンドするレコメンドアイテムを決定するレコメンド決定装置であって、前記利用者によるアイテムの選択履歴と、前記アイテムに関連付けられたテーマとに基づいて、前記利用者にレコメンドとして提示すべきレコメンドアイテムのテーマである関心テーマを推定するテーマ推定部と、前記テーマ推定部によって推定された前記関心テーマの各テーマについて、テーマにおける各アイテムの重要度を推定するアイテム推定部と、前記関心テーマのテーマごとに、前記利用者に対するレコメンドアイテムを前記重要度のランキング結果をもとに決定するレコメンド決定部と、を備えるレコメンド決定装置である。
【発明の効果】
【0007】
本発明の一態様によれば、テーマとレコメンドするアイテム(例えば広告)との対応付けを、人手を介さずに実施することができるレコメンド決定装置、レコメンド決定方法、およびプログラムを提供することができる。
【図面の簡単な説明】
【0008】
図1】本実施形態の情報処理システム1のシステム構成の一例を示す図である。
図2】コンテンツサーバ100の構成の一例を示す図である。
図3】コンテンツサーバ100が実行する前処理の流れの一例を示す図である。
図4】第1前処理の概略を示す第1の図である。
図5】第1前処理の概略を示す第2の図である。
図6】第2前処理の概略を示す第1の図である。
図7】第2前処理の概略を示す第2の図である。
図8】コンテンツ配信処理の流れの一例を示す図である。
図9】サンプリング期間とリランクの効果の一例を示す図である。
【発明を実施するための形態】
【0009】
[概要]
以下、図面を参照し、本発明のレコメンド決定装置、レコメンド決定方法、およびプログラムの実施形態について説明する。レコメンド決定装置は、一以上のプロセッサにより実現される。レコメンド決定装置は、クラウドサービスを提供する装置であってもよいし、ツールやファームウェアなどのプログラムがインストールされ、単体で処理を実行可能な装置であってもよい。すなわち、レコメンド決定装置を実現するためのコンピュータ装置について、利用者の端末装置に対するコンテンツ配信が可能な限りにおいて特段の制約は存在せず、以下に説明する処理を実行可能なものであれば、如何なるコンピュータ装置によってレコメンド決定装置が実現されてもよい。
【0010】
[構成]
図1は、本実施形態の情報処理システム1のシステム構成の一例を示す図である。情報処理システム1は、利用者に電子的手法により提供される所定のアイテム群に関するコンテンツを提供するシステムである。アイテム群は、特定の種類のアイテムの集合に限定されないが、本実施形態では、アイテム群が書籍の集合である場合について説明する。この場合、情報処理システム1は、アイテム群に含まれる書籍に関する情報をコンテンツとして利用者に提供するものとする。この場合の情報処理システム1は、例えば、書籍の販売システムであってもよいし、書籍の閲覧システムであってもよい。ここで、情報処理システム1は、アイテム群に含まれる書籍の一覧を利用者に提供するとともに、提供した一覧の中から利用者が所望する書籍の選択を受け付け、選択された書籍に関するコンテンツを利用者に提供することができるものとする。利用者に提供される書籍の一覧は、アイテム群に含まれる全ての書籍の一覧であってもよいし、種々の観点で分類された書籍の一覧であってもよい。さらに、情報処理システム1は、利用者によりいずれかの書籍が選択されたことに応じて、選択された書籍に関連するおススメの書籍(以下「レコメンド」ともいう。)を選定して利用者に提示する機能を有するものとする。
【0011】
情報処理システム1は、例えば、コンテンツサーバ100と、データベースサーバ200と、利用者端末装置300と、を備える。コンテンツサーバ100は、アイテム群に含まれる書籍に関するコンテンツを利用者に提供するサーバである。コンテンツの提供に関し、コンテンツサーバ100は、上述の書籍の一覧を利用者に提供するとともに、一覧から書籍の選択を受け付ける。コンテンツサーバ100は、選択された書籍についてレコメンドする書籍(以下「レコメンド書籍」という。)を選定して利用者に提示する。コンテンツサーバ100は、コンテンツの提供に必要な情報や、レコメンドの選定に必要な情報をデータベースサーバ200から取得する。コンテンツサーバ100は本発明における「レコメンド決定装置」の一例である。
【0012】
データベースサーバ200は、コンテンツサーバ100によるコンテンツの配信に必要な情報を記憶および管理するサーバである。データベースサーバ200は、コンテンツサーバ100の要求に応じて、自身が保持する情報の中から要求された情報を抽出してコンテンツサーバ100に提供する。また、データベースサーバ200は、コンテンツサーバ100の要求に応じて、自身が保持する情報に対して追加、変更、削除等の更新処理を行う。本実施形態では、データベースサーバ200は、コンテンツサーバ100と別体に構成されるものとして説明するが、コンテンツサーバ100と一体に構成されてもよい。
【0013】
利用者端末装置300は、利用者がコンテンツサーバ100から上記コンテンツの提供サービスを受ける際に使用する情報処理端末である。例えば、利用者端末装置300は、PCやスマートフォン、タブレットなどの通信端末である。利用者端末装置300は、コンテンツサーバ100から書籍の一覧を取得して表示するとともに、一覧の中からいずれかの書籍を選択する操作を受け付け、選択された書籍をコンテンツサーバ100に通知する。利用者端末装置300は、通知した書籍に関する情報とともに、当該書籍についてレコメンドされた書籍の一覧をコンテンツサーバ100から取得して表示する。
【0014】
コンテンツサーバ100と、データベースサーバ200と、利用者端末装置300とは、通信ネットワークNWを介して互いに通信可能である。通信ネットワークNWは、例えば、インターネット、移動体通信ネットワーク、LAN(Local Area Network)及びWAN(Wide Area Network)等である。また、例えば、LANは、Ethernet等の所定規格の有線LAN(Local Area Network)又はWi-Fi及びBluetooth(登録商標)等の各種規格の無線LANであってもよい。通信ネットワークNWは、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、無線通信の伝送路および有線通信の伝送路の組み合わせであってもよい。
【0015】
図2は、コンテンツサーバ100の構成の一例を示す図である。コンテンツサーバ100は、例えば、通信部110と、コンテンツ配信部120と、前処理部130と、レコメンド決定部140と、表示優先度決定部150と、記憶部160と、を備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
【0016】
通信部110は、コンテンツサーバ100を通信ネットワークNWに接続する通信インタフェースである。コンテンツサーバ100は、通信部110を介してデータベースサーバ200および利用者端末装置300と通信可能である。
【0017】
コンテンツ配信部120は、利用者に対してアイテム群の書籍に関するコンテンツを提供する。コンテンツ配信部120は、利用者端末装置300からの要求に応じて、利用者が指定した書籍に関するコンテンツの配信データを生成して利用者端末装置300に送信する。例えば、コンテンツ配信部120は、記憶部160に格納されているコンテンツ情報161(後述)に基づいて配信データを作成する。コンテンツ情報161は、コンテンツの配信データを生成するのに必要な各種情報が含まれる。例えば、コンテンツ情報161には、アイテム群に関するアイテム情報や画像データなどが含まれる。コンテンツ情報161は、コンテンツの配信に先立って予め記憶部160に格納されているものである。
【0018】
前処理部130は、レコメンド決定部140がレコメンド書籍を決定する処理の実行に必要な情報を生成する前処理を実行する。より具体的には、前処理部130は、テーマ推定部132と、書籍推定部134とを備える。テーマ推定部132は、利用者の関心が高いテーマ(以下「関心テーマ」という。)を推定し、推定された各関心テーマについてレコメンドの優先度を決定する第1前処理を実行する。書籍推定部134は、第1前処理において利用者の関心テーマとして推定されたテーマごとに利用者に提示するレコメンド書籍を決定する第2前処理を実行する。書籍推定部134は「アイテム推定部」の一例である。
【0019】
前処理部130は、第1前処理の結果として、各関心テーマについてレコメンドの優先度を示すレコメンドリスト162を生成してデータベースサーバ200に登録する。また、前処理部130は、第2前処理の結果として、各関心テーマとレコメンド書籍との対応関係を示すテーマ書籍リスト163を生成してデータベースサーバ200に登録する。なお、前処理部130は、コンテンツサーバ100とは別の装置に備えられてもよい。この場合、前処理の結果は、通信ネットワークNWやデータベースサーバ200を介してコンテンツサーバ100に提供されてもよい。
【0020】
レコメンド決定部140は、利用者に提示するレコメンド書籍を決定する。より具体的には、レコメンド決定部140は、レコメンドリスト162を参照して利用者にレコメンドすべき関心テーマを認識し、テーマ書籍リスト163を参照して関心テーマごとにレコメンド書籍を決定する。
【0021】
表示優先度決定部150は、レコメンド決定部140によって決定された関心テーマについて利用者端末装置300における表示の優先度を決定する。表示優先度決定部150は、決定した関心テーマの表示優先度をコンテンツ配信部120に通知する。コンテンツ配信部120は通知された表示優先度で関心テーマに関するコンテンツが表示されるようにコンテンツデータを生成して利用者端末装置300に配信する。
【0022】
記憶部160は、HDDやフラッシュメモリ、RAM(Random Access Memory)などの記憶装置により実現される。記憶部160には、コンテンツ配信に必要なコンテンツ情報161や一時データ、プログラム、プログラムの設定情報などが保存される。また、記憶部160は、データベースサーバ200からダウンロードされたレコメンドリスト162やテーマ書籍リスト163などの保存領域として使用されてもよい。
【0023】
図3は、コンテンツサーバ100が実行する前処理の流れの一例を示す図である。まず、コンテンツサーバ100において、前処理部130は、第1前処理を実行することにより、利用者ごとのレコメンドリスト162を生成する(ステップS101)。例えば、前処理部130は、利用者がどのテーマにどの程度接触したかを示す割合(以下「接触率」という。)を求め、各テーマに対する利用者の接触率を教師データとした機械学習により、利用者による書籍の選択結果をもとに利用者の関心テーマを推定するためのテーマ推定モデルを学習する。なおここでいう「接触」とは利用者がテーマを選択することを意味するものとする。本実施形態では、テーマに関連付けられた書籍を閲覧(選択)することを当該テーマへの接触と位置付ける。例えば、前処理部130は、利用者による書籍の閲覧履歴をもとに利用者が接触したテーマおよび各テーマへの接触回数を認識し、全テーマへの接触回数に対する各テーマへの接触回数の割合を接触率として計算する。前処理部130は、利用者ごとかつテーマごとに接触率を計算する。
【0024】
続いて、前処理部130は、計算した接触率を用いてラベリングされた教師データを用いて機械学習を行うことにより、利用者およびテーマの組み合わせについて、利用者のテーマに対する接触率との関係性を学習する。
【0025】
図4は、第1前処理の概略を示す第1の図である。例えば、前処理部130は、この機械学習により、学習対象の利用者およびテーマの組み合わせに関する素性の情報INF1を入力として、当該利用者が当該テーマに接触する割合(接触率)を示す情報INF2を出力するテーマ推定モデルM1を学習する。利用者の素性には、利用者の性別や年齢、居住地域など、テーマの選択性に相関性を有する蓋然性が高いと考えられる任意の事項が含まれてよい。テーマの素性には、書籍のタイトルやジャンル、出版社、著者などが含まれてよい。例えば、テーマ推定モデルの学習にはlightGBM(Light Gradient Boosting Machine)を用いることができる。
【0026】
続いて、前処理部130は、学習したテーマ推定モデルを用いてレコメンドリスト162を作成する。図5は、第1前処理の概略を示す第2の図である。具体的には、前処理部130は、情報処理システム1の全利用者および全テーマの全組合せについて、利用者およびテーマの素性をテーマ推定モデルM1に入力することにより、その出力として、各テーマに対する接触率の情報INF3を利用者ごとに取得する。前処理部130は、各テーマのうち接触率が所定の閾値以上であるものを利用者の関心テーマとして決定し、関心テーマを各利用者の識別情報に対応づけたものをレコメンドリスト162としてデータベースサーバ200に登録する。
【0027】
図3の説明に戻る。第1前処理が終了すると、続いて、前処理部130は、第2前処理を実行することにより、各利用者の関心テーマについてテーマ書籍リスト163を生成する(ステップS102)。例えば、前処理部130は、関心テーマについて嗜好推定処理を実行することにより、関心テーマに対する利用者の嗜好の強さ(以下「嗜好度」という。)を推定する。例えば、嗜好推定処理は、利用者ごとに以下の(1)~(3)の各ステップを実行することによって実現される。
【0028】
(1)前処理部130は、利用者の閲覧履歴をもとに、利用者が実際に接触したテーマについて接触回数を求める。ここでの接触回数は、例えば、利用者が閲覧した各書籍について、関連付けられたテーマの出現回数を数えることによって求めることができる。
【0029】
(2)前処理部130は、(1)で求めた各テーマへの接触回数をTf-Idf(term frequency - inverse document frequency)の手法を用いてスコアリングする。Tf-Idfとは、各文書(document)中に含まれる各単語(term)が「その文書内でどれくらい重要か」を表す統計的尺度の一つであり、具体的には「ある文書内」で「ある単語」が「どれくらい多い頻度で出現するか」を表すTf(term frequency:単語頻度)値と、「全文書中」で「ある単語を含む文書」が「(逆に)どれくらい少ない頻度で存在するか」を表すIdf(inverse document frequency:逆文書頻度)値を掛け合わせた値のことである。ここでは、文書は利用者に対応し、単語はテーマに対応する。
【0030】
(3)前処理部130は、(2)で求めたテーマごとのスコアに対してSoftmax関数による重み付けを行ったものを、利用者の各テーマに対する嗜好度として出力する。図6は、第2前処理の概略を示す第1の図である。例えば、図6の例において、前処理部130は、テーマAに関する全利用者の接触回数の情報INF4を用いて利用者#1についてのIdf値を求めるとともに、利用者#1に関する全テーマの接触回数の情報INF5を用いて利用者#1についてのTf値を求め、求めたTf値およびIdf値を用いて利用者#1についてのTf-Idf値を求める。このように求めたTf-Idf値は、利用者#1におけるテーマAの重要度を示すものであり、本実施形態では、これを利用者#1のテーマAに対する嗜好度と定義するものである。
【0031】
続いて、前処理部130は、関心テーマについて推定された利用者の嗜好度をもとに根拠テーマ推定処理を実行することにより、利用者による書籍の閲覧の根拠がどのテーマに対する関心によるものであったかを推定する。以下、或る利用者が或るテーマに対する関心を根拠として或る書籍を閲覧した場合、当該テーマを、当該利用者が当該書籍を閲覧したことの根拠となったテーマとして「根拠テーマ」ということにする。例えば、根拠テーマ推定処理は、利用者ごとに以下の(4)および(5)の各ステップを実行することによって実現される。
【0032】
(4)前処理部130は、書籍と、その書籍に関連付けられたテーマの組み合わせについて、利用者のテーマへの嗜好度を考慮して当該書籍が閲覧された回数をスコアリングしたものを、当該書籍が当該テーマへの関心を根拠として閲覧された回数(以下「根拠回数」という。)として求める。例えば、前処理部130は、利用者が書籍を閲覧した回数に当該利用者のテーマに対する嗜好度を掛け合わせた量を全利用者で足し合わせた値を、当該書籍と当該テーマの組み合わせについての根拠回数として算出する。
【0033】
(5)前処理部130は、各書籍について、各テーマへの関心を根拠として閲覧された回数である根拠回数をTf-Idfの手法を用いてスコアリングする。ここでは、文書はテーマに対応し、単語は書籍に対応する。図7は、第2前処理の概略を示す第2の図である。例えば、図7の例において、前処理部130は、各利用者の嗜好度を示す情報と、各利用者による書籍の閲覧履歴INF6とをもとに、各利用者がテーマへの関心を根拠として書籍を閲覧した回数(根拠回数)の合計を書籍ごとに示す情報INF7を取得する。なお、図7の例は、各利用者の嗜好度を示す情報として第1前処理で作成されたレコメンドリスト162が用いられる場合を表しているが、レコメンドリスト162に代えて第1前処理とは別の処理または方法で推定された嗜好度が使用されてもよい。
【0034】
続いて、前処理部130は、全利用者による根拠回数の情報INF7のうち書籍aについて全テーマの根拠回数を示す情報INF71を用いて書籍aについてのIdf値を求めるとともに、テーマAについて全書籍における根拠回数を示す情報INF72を用いてテーマAについてのTf値を求め、求めたTf値およびIdf値を用いてテーマAについてのTf-Idf値を求める。このように求めたTf-Idf値は、テーマAにおける書籍aの重要度を示す、全利用者で共通の単一のスコアとなる。前処理部130は、テーマのスコアを、当該テーマが関連付けられた書籍の間でランキングし、上位の書籍を当該テーマについて、利用者に提示すべきレコメンド書籍として決定する。前処理部130は、当該利用者の各関心テーマについて決定したレコメンド書籍を記載したテーマ書籍リスト163を生成してデータベースサーバ200に登録する。
【0035】
図8は、コンテンツサーバ100がコンテンツを配信する処理(以下「コンテンツ配信処理」という。)の流れの一例を示す図である。例えば、図8の処理フローは、コンテンツサーバ100において、コンテンツ配信部120が、利用者端末装置300からのコンテンツ配信要求を受けた場合に開始される。コンテンツ配信要求は、例えば、利用者が特定の書籍を選択する操作を利用者端末装置300に入力したことに応じて、利用者端末装置300からコンテンツサーバ100に対して送信される。
【0036】
まず、コンテンツ配信部120は、利用者端末装置300から受信されたコンテンツ配信要求に基づいて、要求元の利用者(以下「対象利用者」という。)と、対象利用者が選択した書籍(以下「対象書籍」という。)を認識する(ステップS201)とともに、レコメンド決定部140に対して、対象書籍が選択されたことに対して対象利用者に提示すべきレコメンド書籍の決定を指示する。
【0037】
レコメンド決定部140は、対象利用者および対象書籍の組み合わせをもとに、対象利用者の関心テーマを推定する(ステップS202)。例えば、レコメンド決定部140は、前処理によって予め作成されたレコメンドリスト162のうち対象利用者および対象書籍の組み合わせに対応する関心テーマの一覧をデータベースサーバ200から取得する。例えば、レコメンドリスト162は、日次のバッチ処理によって生成または更新され、データベースサーバ200に登録されるものとする。なお、コンテンツサーバ100は、データベースサーバ200に対して関心テーマを問い合わせる構成に代えて、前処理によって生成または更新されたテーマ推定モデルを記憶部160に保持する構成を有してもよい。この場合、レコメンド決定部140は、テーマ推定モデルに対象利用者および対象書籍の素性を入力して得られる各テーマの接触率をランキングし、上位のテーマを関心テーマとして決定してもよい。
【0038】
続いて、レコメンド決定部140は、ステップS202で推定した関心テーマについて、対象利用者に提示すべきレコメンド書籍を決定する(ステップS203)。例えば、レコメンド決定部140は、前処理によって予め作成されたテーマ書籍リスト163のうち関心テーマに対応する書籍の一覧をデータベースサーバ200から取得する。例えば、テーマ書籍リスト163は、日次のバッチ処理によって生成または更新され、データベースサーバ200に登録されるものとする。
【0039】
続いて、表示優先度決定部150が、レコメンド決定部140によって決定された関心テーマについて利用者端末装置300における表示優先度を決定する(ステップS204)。例えば、表示優先度決定部150は、トンプソンサンプリング(Thompson Sampling)などの多腕バンディット・アルゴリズムの手法を用いて関心テーマの表示優先度を決定する。より具体的には、表示優先度決定部150は、以下の(6)および(7)の各ステップを実行することによって表示優先度を決定することができる。
【0040】
(6)表示優先度決定部150は、対象利用者による書籍の閲覧履歴をもとに、各テーマに対する利用者の接触回数をトンプソンサンプリングによってサンプリングし、サンプリング結果に対してベルヌーイ分布を想定した確率密度関数を定義する。表示優先度決定部150は、定義した確率密度関数に乱数を作用させることにより、対象利用者について比較的の最近の各テーマに対する接触状況を表示優先度に反映させるためのスコア(以下「第1スコア」という。)を算出する。なお、どの程度最近の接触状況を考慮するかは、接触回数のサンプリング期間によって調整されてよい。サンプリング期間は、アイテムの種類(ここでは書籍)や、コンテンツの提供方法などに応じて適宜調整されてよい。
【0041】
(7)表示優先度決定部150は、対象利用者の関心テーマに対する嗜好度Fに対して(6)で決定した第1スコアS1を作用させて得られる第2スコアS2により、関心テーマの表示優先度を決定する。例えば、嗜好度の高さが関心テーマに対する関心の大きさを表す場合、各テーマの優先順位は嗜好度が高いほど上位となる。この場合、表示優先度決定部150は、次の(1)および(2)式により第2スコアをS2求める。
S2(U,T)=F(U,T)×S1(U,T) ・・・(1)
F(U,T)=1/r ・・・(2)
【0042】
(1)式において、S1(U,T)は、関心テーマのテーマTごとに取得される第1スコアである。第1スコアS1(U,T)は対象利用者Uの閲覧履歴をもとに、テーマTに対する対象利用者Uの接触回数をサンプリングすることにより求められる。F(U,T)は、対象利用者UのテーマTに対する嗜好度である。例えば、F(U,T)は、対象利用者Uに対して優先するテーマTの優先順位rの逆数とすることができる。表示優先度決定部150は、対象利用者Uについてテーマごとに取得された第2スコアS2(U,T)をランキングすることにより、関心テーマの表示優先度を決定する。
【0043】
このようにして表示優先度が決定されることにより、関心テーマの表示優先度が固定化されてしまうことを抑制することができる。この結果、利用者のテーマに対する関心の変化の傾向に応じて、利用者に提示するレコメンド書籍を適切に変化させることが可能となる。以下、このようにしてテーマの表示優先度をテーマへの接触状況に応じて適宜変化させることを表示優先度の「リランク」という。「リランク」は、嗜好度を補正することの一例である。
【0044】
図9は、サンプリング期間とリランクの効果の一例を示す図である。図9の上側の第1グラフは、30日をサンプリング期間とした場合の確率密度関数を表し、図9下側の第2グラフは、180日をサンプリング期間とした場合の確率密度関数を表す。第1グラフおよび第2グラフともに、縦軸は、テーマへの接触回数を表し、横軸は対応する接触回数が発生する確率を表す。第1グラフは、第2グラフよりも確率密度関数の横軸方向への広がりが大きい。すなわち、確率密度関数(ベータ分布における定義域の範囲は0~1)に従って乱数を生成した場合、第1グラフの場合にはS1(T)の分散が大きくなり、第2グラフの場合に比べてリランクが過剰に作用する可能性がある。
【0045】
一方、第2グラフは、第1グラフよりも確率密度関数の横軸方向への広がりが小さい。すなわち、確率密度関数に従って乱数を生成した場合、第2グラフの場合にはS1(T)の分散が小さくなり、第1グラフの場合に比べてリランクの作用が抑制される。このため、利用者の接触履歴が十分に蓄積されていない場合には、サンプルデータを水増しするなどしてサンプル期間を拡大することによってリランクが作用する強度を調整してもよい。図9の例は、30日のサンプリング期間を6倍して180日に水増しした例である。
【0046】
図8の説明に戻る。続いて、コンテンツ配信部120が、表示優先度決定部150によって決定された表示優先度で関心テーマのレコメンド書籍が表示されるコンテンツデータを生成して要求元の利用者端末装置300に配信する(ステップS205)。
【0047】
以上のように構成された実施形態の情報処理システム1によれば、テーマとレコメンドする書籍を人手によって対応付けることなく、利用者に対してより適切なレコメンドを提供することが可能となる。また、実施形態の情報処理システム1によれば、上記の対応付けに人手を要しないことに加え、精度の良い対応づけを行うことができる。
【0048】
<変形例>
コンテンツサーバ100と、データベースサーバ200とは、上記実施形態のようにネットワークNWを介して通信可能な別体の装置として構成されてもよいし、一体に構成されてもよい。
【0049】
また、コンテンツサーバ100が有するコンテンツ配信の機能、利用者による書籍の閲覧(選択)に対してレコメンド書籍を決定する機能、およびレコメンド書籍を決定するための前処理を実行する機能は、それぞれが別々の装置に実装されてもよいし、2以上の機能が同じ装置に実装されてもよい。
【0050】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0051】
1…情報処理システム、100…コンテンツサーバ、110…通信部、120…コンテンツ配信部、130…前処理部、132…テーマ推定部、134…書籍推定部、140…レコメンド決定部、150…表示優先度決定部、160…記憶部、161…コンテンツ情報、162…レコメンドリスト、163…テーマ書籍リスト、200…データベースサーバ、300…利用者端末装置
図1
図2
図3
図4
図5
図6
図7
図8
図9