(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-05-15
(45)【発行日】2025-05-23
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
G06Q 30/0217 20230101AFI20250516BHJP
【FI】
G06Q30/0217
(21)【出願番号】P 2022578104
(86)(22)【出願日】2021-12-07
(86)【国際出願番号】 JP2021044986
(87)【国際公開番号】W WO2022163142
(87)【国際公開日】2022-08-04
【審査請求日】2024-10-11
(31)【優先権主張番号】P 2021013162
(32)【優先日】2021-01-29
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】392026693
【氏名又は名称】株式会社NTTドコモ
(74)【代理人】
【識別番号】100088155
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100121980
【氏名又は名称】沖山 隆
(74)【代理人】
【識別番号】100128107
【氏名又は名称】深石 賢治
(74)【代理人】
【識別番号】100183081
【氏名又は名称】岡▲崎▼ 大志
(72)【発明者】
【氏名】相場 邦宏
(72)【発明者】
【氏名】小野 素平
【審査官】田付 徳雄
(56)【参考文献】
【文献】特開2020-134998(JP,A)
【文献】特開2016-206722(JP,A)
【文献】特開2001-312511(JP,A)
【文献】米国特許出願公開第2016/0309223(US,A1)
【文献】米国特許出願公開第2001/0037335(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
ユーザに提示される第1画面内に、複数のコンテンツのうちの一部のコンテンツのリストと、前記第1画面内に表示されない非表示コンテンツのリストが表示される第2画面へのリンクと一以上の前記非表示コンテンツの画像とが関連付けられるリンク画像と、を表示させる表示制御部と、
コンテンツの画像が前記リンク画像に関連付けられた場合に前記リンク画像がユーザにより選択される確率に関するユーザ属性に応じた第1スコアをコンテンツ毎に出力するように構成された第1モデルを、前記リンク画像がユーザにより選択されたか否かを示す情報と、前記ユーザのユーザ属性と、前記リンク画像として表示されたコンテンツを示す情報と、に基づく機械学習によって生成する第1モデル生成部と、
前記第1画面が提示される対象となる対象ユーザのユーザ属性を取得するユーザ属性取得部と、
前記ユーザ属性取得部により取得された前記対象ユーザのユーザ属性を前記第1モデルに入力することによりコンテンツ毎の前記第1スコアを取得し、前記第1スコアが高い前記コンテンツの画像を優先的に、前記対象ユーザに提示される前記第1画面内の前記リンク画像に関連付けられる画像として決定する画像決定部と、
を備える情報処理装置。
【請求項2】
前記第1モデルは、コンテンツ毎のパラメータを含み、
前記第1モデル生成部は、
前記リンク画像がユーザにより選択された際に、前記リンク画像として表示されていたコンテンツに対して、前記リンク画像がユーザにより選択されなかった場合よりも大きい報酬値を付与し、
前記報酬値と前記ユーザのユーザ属性とに基づいて、当該コンテンツに対応する前記パラメータを更新する、請求項1に記載の情報処理装置。
【請求項3】
前記表示制御部は、コンテンツに関する複数のジャンルの各々に関連付けられる一部のコンテンツのリストと、前記ジャンル毎の前記リンク画像と、を前記第1画面内に表示させ、
前記画像決定部は、前記ジャンル毎に、前記リンク画像に関連付けられる画像を決定する、請求項1又は2に記載の情報処理装置。
【請求項4】
前記画像決定部は、複数の前記非表示コンテンツの各々の画像を、前記リンク画像に関連付けられる画像として決定し、
前記表示制御部は、前記リンク画像として表示される画像を時間経過に応じて変化させる、請求項1~3のいずれか一項に記載の情報処理装置。
【請求項5】
前記表示制御部は、一定のフレーム間隔で前記リンク画像として表示される画像を変化させ、
前記リンク画像がユーザにより選択される確率に関するユーザ属性に応じた第2スコアをフレーム間隔の長さ毎に出力するように構成された第2モデルを、前記リンク画像がユーザにより選択されたか否かを示す情報と、前記ユーザのユーザ属性と、適用されたフレーム間隔の長さを示す情報と、に基づく機械学習によって生成する第2モデル生成部と、
前記対象ユーザのユーザ属性を前記第2モデルに入力することによりフレーム間隔の長さ毎の前記第2スコアを取得し、前記第2スコアが高い前記フレーム間隔の長さを優先的に、前記対象ユーザに提示される前記第1画面内の前記リンク画像に適用されるフレーム間隔の長さとして決定するフレーム間隔決定部と、を更に備える、請求項4に記載の情報処理装置。
【請求項6】
前記第2モデルは、前記フレーム間隔の長さ毎のパラメータを含み、
前記第2モデル生成部は、
前記リンク画像がユーザにより選択された際に、前記リンク画像に適用されていたフレーム間隔の長さに対して、前記リンク画像がユーザにより選択されなかった場合よりも大きい報酬値を付与し、
前記報酬値と前記ユーザのユーザ属性とに基づいて、当該フレーム間隔の長さに対応する前記パラメータを更新する、請求項5に記載の情報処理装置。
【請求項7】
前記第1モデルは、コンテンツ毎のパラメータを含み、
前記第1モデル生成部は、
前記リンク画像が選択された時点に前記リンク画像として表示されていたコンテンツと、前記リンク画像が選択された時点よりも前に前記リンク画像として表示されていたコンテンツと、の各々に、前記リンク画像がユーザにより選択されなかった場合よりも大きい報酬値を付与し、
前記報酬値と前記ユーザのユーザ属性とに基づいて、各コンテンツに対応する前記パラメータを更新する強化学習によって前記第1モデルを生成し、
前記報酬値は、前記リンク画像が選択された時点からより近い時点に前記リンク画像として表示されていたコンテンツほど大きい値に設定される、
請求項5又は6に記載の情報処理装置。
【請求項8】
前記表示制御部は、前記第1画面及び前記第2画面を前記情報処理装置とは異なるユーザ端末が備える表示部に表示させ、
前記表示制御部は、前記画像決定部により決定された前記複数の前記非表示コンテンツの各々の画像のうち前記リンク画像として最初に表示させる画像を前記ユーザ端末に送信した後に、前記複数の前記非表示コンテンツの各々の画像が時間経過に応じて変化するように構成されたアニメーション画像を前記ユーザ端末に送信する、請求項4~7のいずれか一項に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一側面は、情報処理装置に関する。
【背景技術】
【0002】
動画、電子書籍等のコンテンツをユーザに提供(販売)するコンテンツ提供サービスにおいて、ユーザにレコメンドするコンテンツの一覧を表示する画面をユーザに提示する仕組みが知られている。例えば、各コンテンツに対応するアイコンが、一画面内に、縦及び横に整列して表示される。レコメンド対象のコンテンツ数が多い場合、一画面内に全てのコンテンツに対応するアイコンを表示することができないことがある。このような場合、一画面内に収まらなかったコンテンツ(最初の画面に表示されなかったコンテンツ)の一覧を表示するための別画面に遷移するためのリンク画像等が利用され得る。ユーザは最初の画面に表示されたリンク画像を選択することにより、別画面を開き、最初の画面に表示されなかったコンテンツの一覧にアクセスすることができる。このようなリンク画像には、例えばコンテンツの内容を示す画像等が関連付けられ得る(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述したようなコンテンツ提供サービスにおいては、より多くのコンテンツをユーザの目に触れさせることにより、コンバージョン率(ユーザがコンテンツを利用・購入する割合)を向上させることが期待できる。このため、上述したようなリンク画像を用いる仕組みにおいては、より多くのコンテンツをユーザの目に触れさせるために、ユーザがリンク画像を選択する確率(以下「選択確率」という。)を向上させる仕組みが求められる。
【0005】
そこで、本発明の一側面は、リンク画像の選択確率を向上させることにより、コンバージョン率の向上を図ることができる情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一側面に係る情報処理装置は、ユーザに提示される第1画面内に、複数のコンテンツのうちの一部のコンテンツのリストと、第1画面内に表示されない非表示コンテンツのリストが表示される第2画面へのリンクと一以上の非表示コンテンツの画像とが関連付けられるリンク画像と、を表示させる表示制御部と、コンテンツの画像がリンク画像に関連付けられた場合にリンク画像がユーザにより選択される確率に関するユーザ属性に応じた第1スコアをコンテンツ毎に出力するように構成された第1モデルを、リンク画像がユーザにより選択されたか否かを示す情報と、ユーザのユーザ属性と、リンク画像として表示されたコンテンツを示す情報と、に基づく機械学習によって生成する第1モデル生成部と、第1画面が提示される対象となる対象ユーザのユーザ属性を取得するユーザ属性取得部と、ユーザ属性取得部により取得された対象ユーザのユーザ属性を第1モデルに入力することによりコンテンツ毎の第1スコアを取得し、第1スコアが高いコンテンツの画像を優先的に、対象ユーザに提示される第1画面内のリンク画像に関連付けられる画像として決定する画像決定部と、を備える。
【0007】
本発明の一側面に係る情報処理装置では、一画面(第1画面)内に表示しきれない複数のコンテンツが存在する場合において、第1画面内に表示されない非表示コンテンツを表示するための第2画面へのリンク機能を有するリンク画像が、第1画面内に表示される。また、ユーザ属性を入力して選択確率に関する第1スコアを出力する第1モデルが生成される。このような第1モデルにより得られる第1スコアが高いコンテンツの画像を優先的にリンク画像に関連付けることにより、リンク画像の選択確率を向上させることができる。その結果、より多くのコンテンツをユーザの目に触れさせることが可能となり、コンバージョン率の向上を図ることができる。
【発明の効果】
【0008】
本発明の一側面によれば、リンク画像の選択確率を向上させることにより、コンバージョン率の向上を図ることができる情報処理装置を提供することができる。
【図面の簡単な説明】
【0009】
【
図1】実施形態に係るサーバの全体構成を示す図である。
【
図2】トップ画面及びジャンル詳細画面の一例を示す図である。
【
図3】リンク画像の生成処理の一例を示す図である。
【
図4】サーバの動作の一例を示すフローチャートである。
【
図5】サーバのハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、本発明の一実施形態について詳細に説明する。なお、図面の説明において同一又は相当要素には同一符号を付し、重複する説明を省略する。
【0011】
図1は、一実施形態に係るサーバ10の全体構成を示す図である。サーバ10は、従来公知のレコメンドサービスを提供するレコメンドシステムを支援するための情報処理装置である。レコメンドサービスとは、動画、書籍等のコンテンツをユーザに提供(販売)するコンテンツ提供サービスにおいて、ユーザにレコメンドするコンテンツのリストを提示するサービスである。なお、サーバ10は、レコメンドシステムとは別のシステムであってもよいし、レコメンドシステムを兼ねてもよい。
【0012】
一例として、
図2の(A)に示されるように、ユーザがユーザ端末20を操作してコンテンツ提供サービスにアクセスすると、ユーザ端末20の表示部21には、コンテンツ提供サービスのトップ画面SC1(第1画面)が表示される。トップ画面SC1内には、当該ユーザにレコメンドされるコンテンツC1のリストが表示される。本実施形態では、ユーザ端末20は、タッチパネルディスプレイを表示部21として備えたスマートフォンである。ただし、ユーザ端末20は、上記形態に限られず、表示部21を有する端末であればよく、例えば、タブレット端末、デスクトップPC、ラップトップPC等であってもよい。
【0013】
本実施形態では、コンテンツのジャンル毎に、レコメンド対象のコンテンツC1が表示されている。
図2の例では、ジャンル「ドラマ」に属する2つのコンテンツC1(「ドラマA」及び「ドラマB」)と、ジャンル「アニメ」に属する2つのコンテンツC1(「アニメA」及び「アニメB」)と、ジャンル「映画」に属する2つのコンテンツC1(「映画A」及び「映画B」)と、がトップ画面SC1に表示されている。一例として、トップ画面SC1に表示される各コンテンツC1は、各コンテンツC1の画像が関連付けられた矩形状のアイコンの形態を有している。コンテンツの画像とは、コンテンツの内容を示す画像(例えば、動画コンテンツのタイトル画面、書籍コンテンツの表紙を表す画面等)である。
【0014】
ユーザは、興味のあるコンテンツC1のアイコンを選択する操作(例えば、タッチ操作、クリック操作等)を実行することにより、当該コンテンツC1を利用(例えば、視聴、購入等)することが可能となっている。
【0015】
各ジャンルにおいて、ユーザにレコメンドすべきコンテンツは、トップ画面SC1に表示されるコンテンツC1以外にも存在し得る。しかし、ユーザ端末20の表示部21の表示領域のサイズには限界があるため、レコメンド対象の全てのコンテンツをトップ画面SC1に表示することができない場合がある。すなわち、
図2の例では、トップ画面SC1には、各ジャンルにおいてユーザに対する推奨度の順位が1位及び2位のコンテンツC1のみが表示されており、3位以下のコンテンツが表示されていない。このため、トップ画面SC1には、ジャンル毎に、トップ画面SC1に表示することができなかったコンテンツC2(非表示コンテンツ)のリストが表示されるジャンル詳細画面SC2(第2画面)へのリンクが関連付けられたリンク画像IMが表示される。リンク画像IMには、一以上のコンテンツC2の画像が関連付けられる。なお、上述したような推奨度は、レコメンドシステムによって、公知のレコメンドの仕組みを用いて算出され得る。
【0016】
図2の(B)に示されるように、例えばジャンル「ドラマ」のリンク画像IM(「リンク1」)が選択されると、トップ画面SC1から、ジャンル「ドラマ」に属するレコメンド対象のコンテンツのうちトップ画面SC1に表示されなかったコンテンツC2(
図2の例では、「ドラマC」~「ドラマK」等)のリストが表示されたジャンル詳細画面SC2へと遷移する。他のジャンルのリンク画像IM(「リンク2」、「リンク3」)が選択された場合も同様である。なお、
図2の(B)の例では、ジャンル詳細画面SC2に表示されるコンテンツのリストには、トップ画面SC1に表示されていたコンテンツC1が含まれていないが、ジャンル詳細画面SC2には、トップ画面SC1に表示されていなかったコンテンツC2と共に、トップ画面SC1に表示されていたコンテンツC1が併せて表示されてもよい。
【0017】
コンテンツ提供サービスにおいては、より多くのコンテンツをユーザの目に触れさせることにより、コンバージョン率の向上を図ることが期待できる。そのためには、リンク画像IMの選択確率(すなわち、ユーザをジャンル詳細画面SC2へと誘導できる確率)を向上させることが有効である。そこで、サーバ10は、リンク画像IMの選択確率を向上させるために、リンク画像IMをユーザの属性に応じてパーソナライズする処理を実行するように構成されている。以下、サーバ10の構成について詳細に説明する。
【0018】
図1に示されるように、サーバ10は、要求受付部11と、ユーザ属性取得部12と、リンク画像設定部13と、表示制御部14と、ユーザログ取得部15と、モデル生成部16と、を有する。また、サーバ10は、各種データを記憶する要素として、ユーザ属性記憶部10aと、コンテンツID記憶部10bと、ユーザログ記憶部10cと、を有する。
【0019】
要求受付部11は、ユーザ(ユーザ端末20)からコンテンツ提供サービスへのアクセス要求を受け付ける。より具体的には、要求受付部11は、コンテンツ提供サービスのトップ画面SC1の情報要求をユーザ端末20から受け付ける。
【0020】
ユーザ属性取得部12は、トップ画面SC1が提示される対象となる対象ユーザのユーザ属性を取得する。本実施形態では、ユーザ属性記憶部10aが、ユーザ毎のユーザ属性を予め記憶している。一例として、ユーザ属性記憶部10aには、ユーザを一意に特定するためのユーザIDに関連付けられたユーザ属性(本実施形態では、後述するユーザ属性ベクトルz)が記憶されている。ユーザ属性取得部12は、ユーザ属性記憶部10aから、対象ユーザのユーザIDに対応するユーザ属性ベクトルzを取得する。ここで、対象ユーザとは、要求受付部11が受け付けた情報要求の送信元であるユーザ端末20のユーザである。例えば、ユーザ属性取得部12は、情報要求に含まれているユーザを識別するための情報(一例として、ユーザIDと関連付けられた端末ID等)に基づいて、対象ユーザのユーザIDを特定する。
【0021】
ユーザ属性は、ユーザの特徴(属性)に関連する情報である。ユーザ属性は、例えば、ユーザの年齢(或いは年代)、性別、住所等のプロフィール情報を含み得る。また、ユーザ属性は、例えばアンケート調査又は上述したプロフィール情報等から推定されたユーザの趣味嗜好に関する情報を含み得る。ユーザの趣味嗜好に関する情報は、例えば、コンテンツの各ジャンルに対する嗜好度(例えば、ユーザの嗜好性が高いほど大きい値を取る指標)である。
【0022】
ユーザ属性記憶部10aには、上述したような各種項目を数値化及びベクトル化したユーザ属性ベクトルzが、ユーザID毎に記憶されている。ユーザ属性ベクトルzは、例えば、以下のようにして生成される。一例として、ユーザ属性ベクトルzが年代、性別、住所の各項目を含む一次元ベクトル(年代,性別,住所,…)として表現される場合について考える。この場合、各項目を予め定められたルール(例えば、性別について、男性を「0」、女性を「1」に設定するといった取り決め)に基づいて適当にラベル付け(数値化)することにより、例えば(40代,女性,九州,…)といったユーザ属性を有するユーザのユーザ属性ベクトルzとして、(0.4,1.0,0.7,…)のような数値ベクトルが得られる。
【0023】
リンク画像設定部13は、ユーザ属性取得部12により取得された対象ユーザのユーザ属性ベクトルzに基づいて、対象ユーザ向けにパーソナライズされたリンク画像IMを設定する。リンク画像設定部13は、画像決定部131と、フレーム間隔決定部132と、を有する。また、リンク画像設定部13は、画像決定部131の処理に用いられる第1モデルM1と、フレーム間隔決定部132の処理に用いられる第2モデルM2と、を有する。
【0024】
画像決定部131は、対象ユーザに提示されるリンク画像IMにおいて、どのコンテンツC2の画像を表示させるかを決定する。このために、まず、画像決定部131は、対象ユーザのユーザ属性ベクトルzを第1モデルM1に入力することにより、コンテンツC2毎の第1スコアを取得する。例えば、画像決定部131は、各コンテンツを一意に特定するためのコンテンツIDを記憶するコンテンツID記憶部10bを参照することにより、トップ画面SC1に表示されない全てのコンテンツC2のコンテンツIDを取得し、各コンテンツIDに対応する第1スコアを取得する。
【0025】
第1モデルM1は、後述する第1モデル生成部161により生成(更新する場合を含む。以下同じ。)される機械学習モデルである。より具体的には、第1モデルM1は、あるコンテンツの画像がリンク画像IMとして表示された状況下でユーザによってリンク画像IMが選択された場合に当該コンテンツに報酬を付与する強化学習を実行することによって得られるモデルである。一例として、第1モデルM1は、強化学習アルゴリズムの一種であるバンディットアルゴリズム(例えば、LinUCB等の文脈バンディット(Contextual bandit)アルゴリズム等)等を用いて得られる。第1モデルM1は、一例として、下記の(式1)により表現され得る。第1モデルM1は、コンテンツa毎のパラメータ(θ
a及びA
a)からなる。パラメータθ
a及びA
aは、強化学習によって適宜更新されるパラメータである。これらのパラメータの詳細(初期値及び更新方法)については後述する。
【数1】
【0026】
(式1)において、「a」はコンテンツIDを示す識別子である。「S_conta」は、コンテンツa(コンテンツID「a」に対応するコンテンツ)の第1スコアを示す。「z」は上述したユーザ属性ベクトルを示す。「θa」は、ユーザ属性ベクトルzと同一次元の単位ベクトルである。θaは、コンテンツaの画像をリンク画像IMとして表示させた場合に、ユーザ(ユーザ属性ベクトルzを持つユーザ)がリンク画像IMを選択する確率が高いほど「θa
Tz」が大きくなるように学習(更新)される。「θa
Tz」は、バンディットアルゴリズムにおける「活用」に寄与する項(活用項)である。
【0027】
(式1)の第2項は、バンディットアルゴリズムにおける「探索」に寄与する項(探索項)である。「α」は、探索項の重みであり任意に定められる。αの大きさを調整することにより、活用と探索の割合を調整することができる。
【0028】
画像決定部131は、ユーザ属性ベクトルzと、各コンテンツC2に対応する第1モデルM1(すなわち、各コンテンツC2に対応する(式1))とに基づいて、コンテンツC2毎の第1スコアを算出する。
【0029】
続いて、画像決定部131は、第1スコアが高いコンテンツC2の画像を優先的に、対象ユーザに提示されるトップ画面SC1内のリンク画像IMに関連付けられる画像として決定する。本実施形態では、画像決定部131は、ジャンル毎に、リンク画像IMに関連付けられる画像を決定する。また、画像決定部131は、複数(N個)のコンテンツC2の各々の画像を、リンク画像IMに関連付けられる画像として決定する。Nは、2以上の予め設定された値である。より具体的には、画像決定部131は、ジャンル毎に、第1スコアの高い順に複数のコンテンツC2の順位付けを行い、第1位から第N位までのコンテンツC2の各々の画像を、リンク画像IMに関連付けられる画像として決定する。
【0030】
本実施形態では、リンク画像IMは、画像決定部131により決定されたN個のコンテンツC2の各々の画像を一定のフレーム間隔で順次切り替えるGIF画像(アニメーション画像)として構成される。フレーム間隔決定部132は、対象ユーザに提示されるリンク画像IMに適用されるフレーム間隔の長さを決定する。このために、まず、フレーム間隔決定部132は、対象ユーザのユーザ属性ベクトルzを第2モデルM2に入力することにより、フレーム間隔の長さ毎の第2スコアを取得する。
【0031】
第2モデルM2は、後述する第2モデル生成部162により生成(更新する場合を含む。以下同じ。)される機械学習モデルである。より具体的には、第2モデルM2は、あるフレーム間隔の長さがリンク画像IMに適用された状況下でユーザによってリンク画像IMが選択された場合に当該フレーム間隔の長さに報酬を付与する強化学習を実行することによって得られるモデルである。一例として、第2モデルM2は、第1モデルM1と同様に、強化学習アルゴリズムの一種であるバンディットアルゴリズム(例えば、LinUCB等の文脈バンディット(Contextual bandit)アルゴリズム等)等を用いて得られる。第2モデルM2は、一例として、下記の(式2)により表現され得る。第2モデルM2は、予め定められたフレーム間隔の長さtの候補(例えば、0.5秒、0.8秒、1秒、1.5秒、2秒、2.5秒、3秒等)毎のパラメータ(ρ
t及びB
t)からなる。パラメータρ
t及びB
tは、強化学習によって適宜更新されるパラメータである。これらのパラメータの詳細(初期値及び更新方法)については後述する。
【数2】
【0032】
(式2)において、「t」はフレーム間隔の長さの候補を示す識別子である。「S_intt」は、フレーム間隔の長さtの第2スコアを示す。「z」は上述したユーザ属性ベクトルを示す。「ρt」は、ユーザ属性ベクトルzと同一次元の単位ベクトルである。ρtは、リンク画像IMにフレーム間隔の長さtを適用した場合に、ユーザ(ユーザ属性ベクトルzを持つユーザ)がリンク画像IMを選択する確率が高いほど「ρt
Tz」が大きくなるように学習(更新)される。「ρt
Tz」は、バンディットアルゴリズムにおける「活用」に寄与する項(活用項)である。
【0033】
(式2)の第2項は、バンディットアルゴリズムにおける「探索」に寄与する項(探索項)である。「β」は、探索項の重みであり任意に定められる。βの大きさを調整することにより、活用と探索の割合を調整することができる。
【0034】
フレーム間隔決定部132は、ユーザ属性ベクトルzと、フレーム間隔の長さの各候補に対応する第2モデルM2(すなわち、フレーム間隔の長さの各候補に対応する(式2))に基づいて、フレーム間隔の長さの候補毎の第2スコアを算出する。
【0035】
続いて、フレーム間隔決定部132は、第2スコアが高いフレーム間隔の長さを優先的に、対象ユーザに提示されるトップ画面SC1内のリンク画像IMに適用されるフレーム間隔の長さとして決定する。例えば、フレーム間隔決定部132は、最大の第2スコアを有するフレーム間隔の長さを、リンク画像IMに適用されるフレーム間隔の長さとして決定する。
【0036】
表示制御部14は、
図2に示されるように、対象ユーザに提示されるトップ画面SC1内に、複数のコンテンツのうちの一部のコンテンツC1のリストと、リンク画像IMと、を表示させる。リンク画像IMには、トップ画面SC1内に表示されないコンテンツC2のリストが表示されるジャンル詳細画面SC2へのリンクと、一以上のコンテンツC2(すなわち、画像決定部131により決定されたコンテンツC2)の画像と、が関連付けられている。
【0037】
表示制御部14は、コンテンツに関する複数のジャンル(
図2の例では、ドラマ、アニメ、及び映画)の各々に関連付けられる一部のコンテンツC1のリストと、ジャンル毎のリンク画像IM(
図2の例では、リンク1、リンク2、及びリンク3)と、をトップ画面SC1内に表示させる。
【0038】
また、表示制御部14は、リンク画像IMとして表示される画像を時間経過に応じて変化させる。より具体的には、表示制御部14は、一定のフレーム間隔(すなわち、フレーム間隔決定部132により決定されたフレーム間隔の長さ)でリンク画像IMとして表示される画像を変化させる。例えば、表示制御部14は、第1スコアの高い順に第1位から第N位までのコンテンツC2の画像が一定のフレーム間隔で切り替わるように構成されたリンク画像IMを、対象ユーザに提示されるトップ画面SC1内に表示させる。
【0039】
例えば、リンク画像IMに適用されるフレーム間隔の長さが1秒の場合、リンク画像IMには、最初に第1位のコンテンツC2の画像が表示され、1秒後に第2位のコンテンツC2の画像が表示され、2秒後に第3位のコンテンツC2の画像が表示され、N-1秒後に第N位のコンテンツC2の画像が表示される。第N位のコンテンツC2の画像がリンク画像IMとして表示された後、再度第1位のコンテンツC2の画像がリンク画像IMに表示される。このように、リンク画像IMには、第1位~第N位のコンテンツC2の画像がループして表示される。
【0040】
表示制御部14は、対象ユーザのユーザ端末20に対してリンク画像IMを表示するためのデータを送信することにより、上述したようなリンク画像IMをユーザ端末20の表示部21に表示されるトップ画面SC1内に表示させる。
【0041】
表示制御部14は、第1位~第N位のコンテンツC2の画像がこの順に一定のフレーム間隔で切り替わるGIF画像を生成し、当該GIF画像のデータを、リンク画像IMを表示するためのデータとしてユーザ端末20に送信してもよい。しかし、GIF画像の生成にはある程度の時間がかかるため、ユーザ端末20上にトップ画面SC1(リンク画像IM以外の部分)が表示されてから、リンク画像IMが適切に表示されるようになるまでタイムラグが生じるおそれがある。このようなタイムラグをなくすために、表示制御部14は、以下のような処理を行ってもよい。
【0042】
表示制御部14は、まず、画像決定部131により決定された複数のコンテンツC2(第1位~第N位のコンテンツ)の各々の画像のうちリンク画像IMとして最初に表示させる画像をユーザ端末20に送信してもよい。その後、表示制御部14は、複数のコンテンツC2(第1位~第N位のコンテンツ)の各々の画像が時間経過に応じて変化するように構成されたGIF画像(アニメーション画像)をユーザ端末20に送信してもよい。なお、各コンテンツの画像は、例えば、コンテンツIDと関連付けてサーバ10内(例えばコンテンツID記憶部10b内)に記憶されている。この場合、表示制御部14は、画像決定部131により決定された第1位~第N位の各コンテンツC2のコンテンツIDに基づいて、当該各コンテンツC2の画像を取得することができる。
【0043】
上述した表示制御部14の処理について、
図3を用いて具体的に説明する。
図3の例では、画像決定部131により、コンテンツC003(コンテンツID「C003」のコンテンツ。以下同様に表記する。)、コンテンツC006、C002、…、及びコンテンツC021が、第1位~第N位のコンテンツC2として決定されている。この場合、表示制御部14は、まず、最初にリンク画像IMに表示させるためのコンテンツC003に対応する画像(以下「C003画像」という。)のデータのみをユーザ端末20に送信してもよい。そして、表示制御部14は、ユーザ端末20に指示することにより、ユーザ端末20に、C003画像が表示されたリンク画像IMを生成及び提示させてもよい。そして、表示制御部14は、C003画像をユーザ端末20に送信した後に(或いは、送信処理と同時並行的に)、GIF画像を生成してもよい。例えば、表示制御部14は、画像決定部131により決定された第1位~第N位のコンテンツC2のリストと、フレーム間隔決定部132により決定されたフレーム間隔と、に基づいて、当該フレーム間隔で「第2位→第3位→…→第N位→第1位」の順に画像が切り替わるように構成されたGIF画像を生成する。そして、表示制御部14は、生成したGIF画像のデータをユーザ端末20に送信してもよい。この際、表示制御部14は、フレーム間隔を併せてユーザ端末20に送信してもよい。そして、表示制御部14は、ユーザ端末20に指示することにより、ユーザ端末20に、C003画像が表示されてから通知されたフレーム間隔が経過した際に、リンク画像IMとして表示される画像をC003画像からGIF画像へと変更させてもよい。以上の処理により、ユーザがトップ画面SC1にアクセスしてからリンク画像IMが表示されるまでのタイムラグの発生を抑制し、スムーズにリンク画像IMを描画させることが可能となる。
【0044】
ユーザログ取得部15は、コンテンツ提供サービスにおけるユーザの行動結果を示すユーザログを取得する。ユーザログは、コンテンツ提供サービスのトップ画面SC1にアクセスしたユーザがリンク画像IMを選択したか否かを示す情報と、当該ユーザのユーザIDと、リンク画像IMとして表示されたコンテンツC2を示す情報(本実施形態ではコンテンツID)と、リンク画像IMに適用されたフレーム間隔の長さと、を含む。また、リンク画像IMが選択された場合に対応するユーザログは、リンク画像IMが選択された際にリンク画像IMとして表示されていたコンテンツC2を特定するための特定情報も含んでいる。本実施形態では一例として、上記特定情報は、リンク画像IMが表示されてから(すなわち、トップ画面SC1が表示されてから)リンク画像IMが選択されるまでの時間(すなわち、ユーザがトップ画面SC1に滞在した滞在時間)を示す情報である。ユーザログ取得部15により取得された複数のユーザに関する所定期間分のユーザログは、ユーザログ記憶部10cに記憶される。
【0045】
モデル生成部16は、リンク画像設定部13によるリンク画像IMの設定内容に対するユーザの行動結果を示すユーザログに基づいて、上述した第1モデルM1及び第2モデルM2を生成する。本実施形態では、モデル生成部16は、ユーザログ記憶部10cを参照することにより、第1モデルM1及び第2モデルM2の生成に必要となるユーザログを取得することができる。なお、ユーザログ取得部15は、コンテンツ提供サービスがユーザに利用される度に、ユーザログを適時に取得し、ユーザログ記憶部10cに記憶させてもよい。そして、モデル生成部16は、新たなユーザログがユーザログ記憶部10cに記憶される度に(或いは、予め定められた一定期間毎に)、新たに得られたユーザログを用いて第1モデルM1及び第2モデルM2を更新してもよい。このような処理によれば、第1モデルM1及び第2モデルM2を随時適切にアップデートすることができる。
【0046】
モデル生成部16は、第1モデルM1を生成する第1モデル生成部161と、第2モデルM2を生成する第2モデル生成部162と、を有する。
【0047】
上述したように、第1モデルM1((式1)参照)は、ユーザ属性を入力することにより、コンテンツaの画像がリンク画像IMに関連付けられた場合(すなわち、コンテンツaの内容を示す画像がリンク画像IMとしてユーザに表示された場合)にリンク画像IMがユーザにより選択される確率に関する第1スコアを、コンテンツa毎に出力するように構成されている。第1モデル生成部161は、このような第1モデルM1を、上述したユーザログから得られる情報を用いた機械学習によって生成する。より具体的には、第1モデル生成部161は、リンク画像IMがユーザにより選択されたか否かを示す情報と、当該ユーザのユーザIDに対応するユーザ属性(本実施形態では、ユーザ属性記憶部10aに記憶されている、当該ユーザIDに対応するユーザ属性ベクトルz)と、リンク画像IMとして表示されたコンテンツC2を示す情報とに基づく機械学習によって、第1モデルM1を生成する。
【0048】
上述したように、本実施形態では、第1モデルM1は、コンテンツa毎のパラメータθaを含んでいる((式1)参照)。第1モデル生成部161は、リンク画像IMがユーザにより選択された際にリンク画像IMとして表示されていたコンテンツaに対して報酬値raを付与し、報酬値raと当該ユーザのユーザ属性ベクトルzとに基づいて当該コンテンツaに対応するパラメータθaを更新する。このような強化学習によれば、どのようにリンク画像IMを設定すればユーザにリンク画像IMを選択させることができるか否かについての正解データがない状況において、ジャンル詳細画面SC2へとユーザを誘導するのに適したコンテンツ(リンク画像IMに関連付けるコンテンツ)を決定するための指標(第1スコア「S_conta」)を導出可能なモデルを生成することができる。
【0049】
上記の強化学習によるパラメータの更新方法について詳細に説明する。ここでは一例として、上述したLinUCBアルゴリズムを用いた更新方法について説明する。まず、第1モデル生成部161は、(式1)に示されるコンテンツa毎のパラメータθ
a及びA
aを、下記の(式3)~(式5)に基づいて設定する。
【数3】
【0050】
パラメータbaは、パラメータθaに含まれるパラメータである。(式3)は、パラメータbaの初期値を示す。(式3)における「0d×1」は、ユーザ属性ベクトルzと同一の次元(d)のゼロベクトルである。(式4)は、パラメータAaの初期値を示す。(式4)における「Id」は、d次の単位行列である。(式5)に基づいて、パラメータθaが算出される。(式3)~(式5)に示されるように、パラメータθaの初期値はゼロベクトルである。
【0051】
第1モデル生成部161は、1回分のユーザの行動(すなわち、ユーザログ1つ分)毎に、下記の(式6)及び(式7)により、該当するコンテンツaのパラメータA
a及びb
aを更新(学習)する。
【数4】
【0052】
(式6)により、「ユーザ属性ベクトルzを有するユーザが、コンテンツaの画像が関連付けられたリンク画像IMを見た(リンク画像IMが選択されなかった場合も含む)」という情報が、パラメータAaに加わる。また、(式5)により、当該情報がパラメータθaに反映される。
【0053】
(式7)により、パラメータbaが、報酬値raと当該ユーザのユーザ属性ベクトルzとに基づいて更新される。なお、ここでの「更新」は、更新処理の前後で値が変化しない場合も含む。パラメータbaが更新されることにより、パラメータθaも、報酬値raと当該ユーザのユーザ属性ベクトルzとに基づいて更新されることになる((式5)参照)。
【0054】
ここで、第1モデル生成部161は、コンテンツaの画像が関連付けられたリンク画像IMがユーザ属性ベクトルzを有するユーザにより選択された場合に、当該リンク画像IMが当該ユーザにより選択されなかった場合よりも大きい報酬値raを付与する。一例として、コンテンツaの画像が関連付けられたリンク画像IMが選択された場合、第1モデル生成部161は当該コンテンツaの報酬値raを0より大きい値に設定する。一方、コンテンツaの画像が関連付けられたリンク画像IMが選択されなかった場合、第1モデル生成部161は当該コンテンツaの報酬値raを0に設定する。言い換えれば、コンテンツaの画像が関連付けられたリンク画像IMが選択されなかった場合、第1モデル生成部161は当該コンテンツaに対して報酬を付与しない。
【0055】
以上説明した第1モデル生成部161の処理により、θaは、コンテンツaの画像をリンク画像IMとして表示させた場合にユーザ(ユーザ属性ベクトルzを持つユーザ)がリンク画像IMを選択する確率が高いほど(式1)における活用項「θa
Tz」が大きくなるように、学習(更新)される。
【0056】
ここで、本実施形態では、上述した通り、リンク画像IMには複数のコンテンツC2の画像が関連付けられ、時間経過に伴ってリンク画像IMとして表示される画像が変化する。このようなケースにおいては、ユーザがリンク画像IMを選択した時点に表示されていたコンテンツC2の画像が、そのようなユーザの行動(すなわち、リンク画像IMの選択)の誘因に最も寄与したと考えられる。一方で、ユーザに対してリンク画像IMが提示されてからユーザがリンク画像IMを選択するまでにリンク画像IMとして表示された一以上のコンテンツC2の画像も、上記ユーザの行動の誘因に寄与したと考えられる。より具体的には、リンク画像IMがユーザに選択された時点からより近い時点にリンク画像IMとして表示されていたコンテンツC2ほど、上記ユーザの行動の誘因に寄与した度合いが大きいと考えられる。以上を踏まえて、第1モデル生成部161は、リンク画像IMが選択された時点にリンク画像IMとして表示されていたコンテンツと、リンク画像IMが選択された時点よりも前にリンク画像IMとして表示されていたコンテンツと、の各々に、リンク画像IMがユーザにより選択されなかった場合よりも大きい報酬値raを付与してもよい。そして、報酬値raは、リンク画像IMが選択された時点からより近い時点にリンク画像IMとして表示されていたコンテンツほど大きい値に設定されてもよい。
【0057】
例えば、第1モデル生成部161は、下記(式8)に基づいて、各コンテンツaの報酬値r
aを決定してもよい。
【数5】
【0058】
(式8)において、「k」はリンク画像IMとして表示されるコンテンツaの番号(表示順)を示す。リンク画像IMとしてn番目に表示されるコンテンツaの番号kは「n-1」と表される。「i」は、リンク画像IMがユーザに選択された際にリンク画像IMとして表示されていたコンテンツの番号を示す。「L」はリンク画像IMに関連付けられたコンテンツ(すなわち、GIF画像に含まれるコンテンツ)の総数を示す。「Tint」は、リンク画像IMに適用されたフレーム間隔の長さを示す。「ST」は、ユーザがトップ画面SC1に滞在した時間(すなわち、トップ画面SC1が表示されてからリンク画像IMが選択されるまでの時間)を示す。
【0059】
(式8)における1番目(上段)の式は、リンク画像IMが選択された際に表示されたコンテンツの番号よりも小さい番号を持つコンテンツに適用される。(式8)における2番目(中段)の式は、リンク画像IMが選択された際に表示されたコンテンツの番号よりも大きい番号を持つコンテンツであって、リンク画像IMが選択されるまでに一度も表示されなかったコンテンツに適用される。(式8)における3番目(下段)の式は、リンク画像IMが選択された際に表示されたコンテンツの番号よりも大きい番号を持つコンテンツであって、リンク画像IMが選択されるまでに一回以上表示されたコンテンツに適用される。
【0060】
例えば、「L=9」であって、2周目に「k=2」のコンテンツの画像がリンク画像IMに表示されていた際にリンク画像IMが選択された場合について考える。この場合、上記(式8)により、各コンテンツaの報酬値r
aが、下表1のように算出される。
【表1】
【0061】
上記のように、リンク画像IMが選択された際にリンク画像IMとして表示されていたコンテンツに最大の報酬値raを付与すると共に、リンク画像IMが選択されるまでにユーザの目に触れたコンテンツについてもリンク画像IMが選択された時点から近い順に大きくなるように傾斜配分した報酬値raを付与することにより、各コンテンツに対して、寄与度に応じた適切な報酬を付与することができる。
【0062】
上述したように、第2モデルM2((式2)参照)は、ユーザ属性を入力することにより、あるフレーム間隔の長さtがリンク画像IMに適用された場合にリンク画像IMがユーザにより選択される確率に関する第2スコアを、フレーム間隔の長さt毎(予め定められた長さtの候補毎)に出力するように構成されている。第2モデル生成部162は、このような第2モデルM2を、上述したユーザログから得られる情報を用いた機械学習によって生成する。より具体的には、第2モデル生成部162は、リンク画像IMがユーザにより選択されたか否かを示す情報と、当該ユーザのユーザIDに対応するユーザ属性(本実施形態では、ユーザ属性記憶部10aに記憶されている、当該ユーザIDに対応するユーザ属性ベクトルz)と、リンク画像IMに適用されたフレーム間隔の長さを示す情報とに基づく機械学習によって、第2モデルM2を生成する。
【0063】
上述したように、本実施形態では、第2モデルM2は、フレーム間隔の長さt毎のパラメータρtを含んでいる((式2)参照)。第2モデル生成部162は、リンク画像IMがユーザにより選択された際にリンク画像IMに適用されていたフレーム間隔の長さtに対して報酬値rtを付与し、報酬値rtと当該ユーザのユーザ属性ベクトルzとに基づいて当該フレーム間隔の長さtに対応するパラメータρtを更新する。このような強化学習によれば、どのようにリンク画像IMを設定すればユーザにリンク画像IMを選択させることができるか否かについての正解データがない状況において、ジャンル詳細画面SC2へとユーザを誘導するのに適したフレーム間隔を決定するための指標(第2スコア「S_intt」)を導出可能なモデルを生成することができる。
【0064】
上記の強化学習によるパラメータの更新方法について詳細に説明する。ここでは一例として、上述したLinUCBアルゴリズムを用いた更新方法について説明する。まず、第2モデル生成部162は、(式2)に示されるフレーム間隔の長さt毎のパラメータρ
t及びB
tを下記の(式9)~(式11)に基づいて設定する。
【数6】
【0065】
パラメータctは、パラメータρtに含まれるパラメータである。(式9)は、パラメータctの初期値を示す。(式9)における「0d×1」は、ユーザ属性ベクトルzと同一の次元(d)のゼロベクトルである。(式10)は、パラメータBtの初期値を示す。(式10)における「Id」は、d次の単位行列である。(式11)に基づいて、パラメータρtが算出される。(式9)~(式11)に示されるように、パラメータρtの初期値はゼロベクトルである。
【0066】
第2モデル生成部162は、1回分のユーザの行動(すなわち、ユーザログ1つ分)毎に、下記の(式12)及び(式13)により、該当するフレーム間隔の長さtのパラメータB
t及びc
tを更新(学習)する。
【数7】
【0067】
(式12)により、「ユーザ属性ベクトルzを有するユーザが、フレーム間隔の長さtが適用されたリンク画像IMを見た(リンク画像IMが選択されなかった場合も含む)」という情報が、パラメータBtに加わる。また、(式11)により、当該情報がパラメータθaに反映される。
【0068】
(式13)により、パラメータctが、報酬値rtと当該ユーザのユーザ属性ベクトルzとに基づいて更新される。なお、ここでの「更新」は、更新処理の前後で値が変化しない場合も含む。パラメータctが更新されることにより、パラメータρtも、報酬値rtと当該ユーザのユーザ属性ベクトルzとに基づいて更新されることになる((式11)参照)。
【0069】
ここで、第2モデル生成部162は、フレーム間隔の長さtが適用されたリンク画像IMがユーザ属性ベクトルzを有するユーザにより選択された場合に、当該リンク画像IMが当該ユーザにより選択されなかった場合よりも大きい報酬値rtを付与する。一例として、フレーム間隔の長さtが適用されたリンク画像IMが選択された場合、第2モデル生成部162は当該長さtの報酬値rtを0より大きい値(一例として「1」)に設定する。一方、フレーム間隔の長さtが適用されたリンク画像IMが選択されなかった場合、第2モデル生成部162は当該長さtの報酬値rtを0に設定する。言い換えれば、フレーム間隔の長さtが適用されたリンク画像IMが選択されなかった場合、第2モデル生成部162は当該長さtに対して報酬を付与しない。
【0070】
以上説明した第2モデル生成部162の処理により、ρtは、フレーム間隔の長さtをリンク画像IMに適用した場合にユーザ(ユーザ属性ベクトルzを持つユーザ)がリンク画像IMを選択する確率が高いほど(式2)における活用項「ρt
Tz」が大きくなるように、学習(更新)される。
【0071】
次に、
図4に示されるフローチャートを参照して、サーバ10の処理の一例について説明する。
【0072】
まず、要求受付部11は、ユーザ端末20からコンテンツ提供サービス(トップ画面SC1)へのアクセス要求を受け付ける(ステップS1)。続いて、ユーザ属性取得部12は、ユーザ属性記憶部10aを参照することにより、アクセス要求の送信元であるユーザ端末20のユーザ(対象ユーザ)のユーザ属性ベクトルzを取得する(ステップS2)。
【0073】
続いて、リンク画像設定部13は、リンク画像IMに関連付ける複数のコンテンツC2と、リンク画像IMに適用するフレーム間隔の長さと、を決定する(ステップS3~S6)。
【0074】
具体的には、画像決定部131は、対象ユーザのユーザ属性ベクトルzを第1モデルM1(コンテンツa毎の(式1))に入力することにより、複数のコンテンツC2(トップ画面SC1に表示されない非表示コンテンツ)の各々の第1スコア「S_conta」を算出する(ステップS3)。そして、画像決定部131は、各コンテンツC2の第1スコア「S_conta」に基づいて、リンク画像IMに関連付ける画像(すなわち、リンク画像IMとして表示する画像)を決定する(ステップS4)。一例として、画像決定部131は、第1スコア「S_conta」が上位N位までのN個のコンテンツC2を、リンク画像IMに関連付ける画像として決定する。
【0075】
また、フレーム間隔決定部132は、対象ユーザのユーザ属性ベクトルzを第2モデルM2(フレーム間隔の長さt毎の(式2))に入力することにより、複数のフレーム間隔の長さt(候補)毎の第2スコア「S_intt」を算出する(ステップS5)。そして、フレーム間隔決定部132は、各長さtの第2スコア「S_intt」に基づいて、リンク画像IMに適用するフレーム間隔の長さtを決定する(ステップS6)。一例として、フレーム間隔決定部132は、最大の第2スコア「S_intt」を有する長さtを、リンク画像IMに適用するフレーム間隔として決定する。
【0076】
続いて、表示制御部14は、
図2に示されるようなトップ画面SC1をユーザに提示する(ステップS7~S9)。一例として、表示制御部14は、まず、リンク画像IMとして最初に表示させる画像(すなわち、第1位の第1スコア「S_cont
a」を有するコンテンツC2の画像)をユーザ端末20に送信する(ステップS7)。その結果、ユーザ端末20において、当該画像が表示されたリンク画像IMが生成及び提示される。また、表示制御部14は、ステップS7の処理の後(或いは、ステップS7の処理と同時並行的に)、画像決定部131により決定された複数のコンテンツC2を示す情報(第1位~第N位のコンテンツC2のコンテンツID)と、フレーム間隔決定部132により決定されたフレーム間隔とに基づいて、GIF画像を生成する(ステップS8)。GIF画像は、当該フレーム間隔で「第2位→第3位→…→第N位→第1位」の順に画像が切り替わるように構成されたアニメーション画像である。続いて、表示制御部14は、当該GIF画像及びフレーム間隔を示す情報をユーザ端末20に送信する(ステップS9)。その結果、ユーザ端末20において、ステップS7でユーザ端末20に送信された画像(以下「初期画像」という。)が表示されてから、ステップS9で通知されたフレーム間隔が経過した際に、リンク画像IMとして表示される画像が初期画像からGIF画像へと変更される。
【0077】
続いて、ユーザログ取得部15は、コンテンツ提供サービスにおけるユーザの行動結果を示すユーザログを取得する(ステップS10)。すなわち、ユーザログ取得部15は、トップ画面SC1にアクセスしたユーザがリンク画像IMを選択したか否かを示す結果情報(フィードバック情報)であるユーザログを取得する。
【0078】
続いて、モデル生成部16(第1モデル生成部161及び第2モデル生成部162)は、ステップS10で取得されたユーザログに基づいて、第1モデルM1及び第2モデルM2を更新する(ステップS11)。
【0079】
以上説明したサーバ10では、一画面(トップ画面SC1)内に表示しきれない複数のコンテンツが存在する場合において、トップ画面SC1内に表示されないコンテンツC2を表示するためのジャンル詳細画面SC2へのリンク機能を有するリンク画像IMが、トップ画面SC1内に表示される。また、第1モデル生成部161によって、ユーザ属性(本実施形態ではユーザ属性ベクトルz)を入力して選択確率に関する第1スコア「S_conta」を出力する第1モデルM1が生成される。このような第1モデルM1により得られる第1スコア「S_conta」が高いコンテンツの画像を優先的にリンク画像IMに関連付けることにより、リンク画像IMの選択確率を向上させることができる。その結果、より多くのコンテンツをユーザの目に触れさせることが可能となり、コンバージョン率の向上を図ることができる。
【0080】
また、表示制御部14は、複数のジャンルの各々に関連付けられる一部のコンテンツC1のリストと、ジャンル毎のリンク画像IMと、をトップ画面SC1内に表示させる(
図2参照)。そして、画像決定部131は、ジャンル毎に、リンク画像IMに関連付けられる画像を決定する。上記構成によれば、トップ画面SC1内に複数のジャンルの各々に関するコンテンツを表示することにより、ユーザに多様なジャンルのコンテンツを提示することができる。また、ジャンル毎に上述したようなリンク画像IMを用意することにより、ジャンル毎のより多くのコンテンツをユーザの目に触れさせることが可能となるため、コンバージョン率を効果的に向上させることができる。
【0081】
また、画像決定部131は、複数のコンテンツC2の各々の画像(本実施形態では、第1スコアが第1位から第N位までのN個のコンテンツC2)を、リンク画像IMに関連付けられる画像として決定する。そして、表示制御部14は、リンク画像IMとして表示される画像を時間経過に応じて変化させる。つまり、リンク画像IMが、GIF画像(アニメーション画像)として構成されている。上記構成によれば、リンク画像IMとして表示される画像を時間経過に応じて変化させることにより、トップ画面SC1において、リンク画像IMを通して、複数のコンテンツC2をユーザの目に触れさせることが可能となる。ユーザの気を惹く可能性のある複数のコンテンツC2を順番にリンク画像IMに表示させることにより、リンク画像IMの選択確率を効果的に向上させることができる。
【0082】
また、サーバ10は、第2モデルM2を生成する第2モデル生成部162と、第2モデルM2を用いてリンク画像IMに適用されるフレーム間隔を決定するフレーム間隔決定部132とを有し、表示制御部14は、フレーム間隔決定部132により決定された一定のフレーム間隔でリンク画像IMとして表示される画像を変化させる。上記構成によれば、ユーザ属性に応じて適切なフレーム間隔をリンク画像IMに適用することにより、リンク画像IMの選択確率を効果的に向上させることができる。
【0083】
なお、上記実施形態(すなわち、サーバ10の構成及び処理内容)は、適宜変形されてもよい。例えば、リンク画像IMに関連付けられるコンテンツの画像は1つだけでもよい。すなわち、リンク画像IMは、一定のフレーム間隔で表示対象のコンテンツが切り替わるように構成されなくてもよい。つまり、リンク画像IMは、1つの特定のコンテンツの画像のみによって構成されてもよい。この場合、フレーム間隔決定部132、第2モデルM2、及び第2モデル生成部162は省略され得る。また、この場合には、画像決定部131は、第1スコア「S_conta」が最大のコンテンツの画像をリンク画像IMに関連付ける画像として決定すればよい。
【0084】
また、第1モデル生成部161が第1モデルM1を生成するために実行する機械学習のアルゴリズムは、上述したLinUCBアルゴリズム(バンディットアルゴリズム)に限られない。すなわち、第1モデルM1は、上述した第1スコア「S_conta」と同等のスコア(すなわち、リンク画像IMがユーザにより選択される確率に応じたスコア)を返却するように構成されればよく、上記実施形態で説明したアルゴリズム(パラメータ更新式)とは異なるアルゴリズムが用いられてもよい。例えば、上記実施形態では、バンディットアルゴリズムのうちいわゆるUCB方策に基づくLinUCBアルゴリズムが用いられたが、上記以外の方策(例えば、ε-greedy方策、Thompson Sampling方策等)のアルゴリズムが用いられてもよい。また、バンディットアルゴリズム以外の強化学習アルゴリズムが用いられてもよい。第2モデル生成部162及び第2モデルM2についても同様である。
【0085】
なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
【0086】
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。
【0087】
例えば、本開示の一実施の形態におけるサーバ10は、本開示の情報処理方法を行うコンピュータとして機能してもよい。
図5は、本開示の一実施の形態に係るサーバ10のハードウェア構成の一例を示す図である。上述のサーバ10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
【0088】
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。サーバ10のハードウェア構成は、
図5に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
【0089】
サーバ10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
【0090】
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。
【0091】
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、リンク画像設定部13は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
【0092】
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る通信制御方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
【0093】
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
【0094】
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
【0095】
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
【0096】
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
【0097】
また、サーバ10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
【0098】
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
【0099】
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
【0100】
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
【0101】
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
【0102】
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
【0103】
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
【0104】
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
【0105】
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
【0106】
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。
【0107】
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々な情報要素は、あらゆる好適な名称によって識別できるので、これらの様々な情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。
【0108】
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
【0109】
本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
【0110】
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
【0111】
本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
【0112】
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
【符号の説明】
【0113】
10…サーバ(情報処理装置)、11…要求受付部、12…ユーザ属性取得部、13…リンク画像設定部、14…表示制御部、15…ユーザログ取得部、16…モデル生成部、20…ユーザ端末、21…表示部、131…画像決定部、132…フレーム間隔決定部、161…第1モデル生成部、162…第2モデル生成部、C1…コンテンツ、C2…コンテンツ(非表示コンテンツ)、IM…リンク画像、M1…第1モデル、M2…第2モデル、SC1…トップ画面(第1画面)、SC2…ジャンル詳細画面(第2画面)。