IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7267965情報処理装置、情報処理方法、及び情報処理プログラム
<>
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図1
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図2
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図3
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図4
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図5
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図6
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-24
(45)【発行日】2023-05-02
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20230425BHJP
【FI】
G06Q50/10
【請求項の数】 6
(21)【出願番号】P 2020049143
(22)【出願日】2020-03-19
(65)【公開番号】P2021149552
(43)【公開日】2021-09-27
【審査請求日】2021-11-19
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】弁理士法人樹之下知的財産事務所
(72)【発明者】
【氏名】大倉 俊平
(72)【発明者】
【氏名】湯浅 翔悟
【審査官】庄司 琴美
(56)【参考文献】
【文献】特開2017-146683(JP,A)
【文献】特開2008-210010(JP,A)
【文献】米国特許出願公開第2012/0317123(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
ユーザの特徴を示すユーザ特徴ベクトル、及び、コンテンツの特徴を示すコンテンツ特徴ベクトルに基づいて、前記ユーザの前記コンテンツへの興味を示すスコアを算出するスコア算出部と、
前記コンテンツ特徴ベクトルの類似度が近い順に配置された各前記コンテンツに対する、各前記コンテンツの前記スコアの特性において、複数のピークが存在する場合には、各前記ピークの相違に基づいて、各前記コンテンツの配信すべき順位を決定する順位決定部と、
各前記ピークの前記コンテンツ及び当該コンテンツの近傍に配置された複数の前記コンテンツから配信すべき前記コンテンツを抽出し、前記順位に基づいて前記ユーザが所持する端末装置に配信する配信部と、
を備えることを特徴とする情報処理装置。
【請求項2】
請求項1に記載の情報処理装置において、
前記順位決定部は、各前記ピークの高さの比率に基づいて前記順位を決定する
ことを特徴とする情報処理装置。
【請求項3】
請求項1又は2に記載の情報処理装置において、
前記順位決定部は、前記コンテンツを配信する時間帯に応じて前記順位を変更する
ことを特徴とする情報処理装置。
【請求項4】
請求項1乃至3のいずれか一項に記載の情報処理装置において、
前記配信部により前記端末装置に配信された複数の前記コンテンツのうち、前記端末装置において選択された前記コンテンツを選択コンテンツとして取得する選択コンテンツ取得部と、
前記選択コンテンツに基づいて前記ユーザ特徴ベクトルを補正するユーザ補正部と、
をさらに備えることを特徴とする情報処理装置。
【請求項5】
コンピュータによりコンテンツを配信する情報処理方法であって、
前記コンピュータは、スコア算出部、順位決定部、及び配信部を備え、
前記スコア算出部が、ユーザの特徴を示すユーザ特徴ベクトル、及び、前記コンテンツの特徴を示すコンテンツ特徴ベクトルに基づいて、前記ユーザの前記コンテンツへの興味を示すスコアを算出するスコア算出ステップと、
前記順位決定部が、前記コンテンツ特徴ベクトルの類似度が近い順に配置された各前記コンテンツに対する、各前記コンテンツの前記スコアの特性において、複数のピークが存在する場合には、各前記ピークの相違に基づいて、各前記コンテンツの配信すべき順位を決定する順位決定ステップと、
前記配信部が、各前記ピークの前記コンテンツ及び当該コンテンツの近傍に配置された複数の前記コンテンツから配信すべき前記コンテンツを抽出し、前記順位に基づいて前記ユーザが所持する端末装置に配信する配信ステップと、
を実施することを特徴とする情報処理方法。
【請求項6】
コンピュータにより読み取り実行可能な情報処理プログラムであって、
前記コンピュータを、請求項1乃至請求項4のいずれか1項に記載の情報処理装置として機能させる
ことを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザにコンテンツをレコメンドする情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、インターネットを介して、ニュースや広告等のコンテンツを、ユーザが所有する端末装置にレコメンドする情報処理装置が知られている(例えば、特許文献1参照)。
このような従来の情報処理装置では、ユーザの特徴を示すユーザ特徴ベクトルと、コンテンツの特徴を示すコンテンツ特徴ベクトルとを用いて、ユーザに対するコンテンツのスコアを算出し、当該スコアが高い順にコンテンツを並び替えて、ユーザの端末装置に配信(レコメンド)する。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2010-262383号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、前記のようなレコメンドを配信する情報処理装置において、各コンテンツを類似度が近い順に横軸に並べ、各コンテンツに対するユーザのスコアを縦軸としたグラフ(スコアを特性曲線で示したグラフ)を用いると、特定のコンテンツでスコアがピークとなり、当該コンテンツの近傍に配置されたコンテンツのスコアも総じて高くなる。これは、特定のコンテンツ及びそれに類似したコンテンツに対して、ユーザの興味が集中していることを示している。
【0005】
従来の情報処理装置では、このようなピーク近傍のコンテンツを優先的にユーザにレコメンドする。ここで、1つのピークのスコアが十分に高い場合、ユーザの当該特定のコンテンツ及びそれに類似したコンテンツへの興味が際立っていることを示しており、適切なコンテンツのレコメンドができていると言える。
【0006】
一方、類似度が遠い複数のコンテンツ(例えば、スポーツと経済)についてそれぞれのピークのスコアが高さを競っている場合、ユーザは複数の異なるコンテンツ及びそれに類似したコンテンツへそれぞれ高い興味を持っていることを示している。この場合、興味が高い複数のコンテンツを適度に配分して配信することが好ましい。
【0007】
しかし、従来の情報処理装置では、このような場合でも、スコアが高い順にコンテンツを配信してしまうため、相対的に低いピークのコンテンツ及びそれに類似したコンテンツが配信されないことがある。
【0008】
本発明は、複数の非類似のコンテンツに興味があるユーザへ各コンテンツを適切に配信可能な情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明の情報処理装置は、ユーザの特徴を示すユーザ特徴ベクトル、及び、コンテンツの特徴を示すコンテンツ特徴ベクトルに基づいて、前記ユーザの前記コンテンツへの興味を示すスコアを算出するスコア算出部と、類似度が近い順に配置された各前記コンテンツに対する、各前記コンテンツの前記スコアの特性において、複数のピークが存在する場合には、各前記ピークの相違に基づいて、各前記コンテンツの配信すべき順位を決定する順位決定部と、各前記ピークの前記コンテンツ及び当該コンテンツの近傍に配置された複数の前記コンテンツから配信すべき前記コンテンツを抽出し、前記順位に基づいて前記ユーザが所持する端末装置に配信する配信部と、を備えることを特徴とする。
【発明の効果】
【0010】
本発明では、複数の非類似のコンテンツに興味があるユーザへ各コンテンツを適切に配信可能である。
【図面の簡単な説明】
【0011】
図1】本発明に係る一実施形態の情報処理システムの概略構成を示すブロック図である。
図2】本実施形態の情報処理装置であるサーバ装置の概略構成を示すブロック図である。
図3】本実施形態の情報処理方法に係るレコメンド処理を表すフローチャートである。
図4】本実施形態の情報処理方法に係るレコメンド処理において算出されたスコアの一例を示す図である。
図5】本実施形態の情報処理方法に係るレコメンド処理において算出されたスコアの一例を示す図である。
図6図4に示すスコアに基づいた、本実施形態のレコメンド表示欄の一例を示す図である。
図7図5に示すスコアに基づいた、本実施形態のレコメンド表示欄の一例を示す図である。
【発明を実施するための形態】
【0012】
以下、本発明に係る一実施形態について説明する。
[情報処理システムの概要]
図1は、本実施形態の情報処理システムを示す概略図である。
本実施形態の情報処理システムは、図1に示すように、情報処理装置であるサーバ装置10、サーバ装置10に対してインターネットを介して接続された複数の端末装置20を備える。この情報処理システムは、サーバ装置10から端末装置20にコンテンツであるニュースコンテンツ(以降、ニュースと略す場合がある)をレコメンドするニュース配信システムであり、端末装置20を所持するユーザの特徴に応じたニュースをレコメンドする。
以下、このような情報処理システムの、特にサーバ装置10について詳細に説明する。
【0013】
[サーバ装置10の構成]
図2は、サーバ装置10の概略構成を示すブロック図である。
サーバ装置10は、一般的なコンピュータにより構成されており、図2に示すように、通信部11、記憶部12、プロセッサ13等の、コンピュータを構成する各部を備えている。なお、サーバ装置10を構成するコンピュータの数は特に限定されない。例えば、1台のコンピュータによってサーバ装置10が構成されてもよく、複数のコンピュータをネットワークで接続して構築されるクラウドサーバをサーバ装置10としてもよい。
【0014】
通信部11は、インターネットに接続され、インターネットを介して端末装置20等の各装置と通信する。
【0015】
記憶部12は、サーバ装置10を制御するための各種情報や情報処理プログラムを記憶する。
また、記憶部12は、端末装置20に配信するニュースを記憶するニュース蓄積部121、及び、各ユーザに関するユーザ情報を記憶するユーザ情報蓄積部122等のデータベースを備えている。
【0016】
なお、ここでは、サーバ装置10の記憶部12に、ニュース蓄積部121やユーザ情報蓄積部122が設けられる例を示すが、サーバ装置10とネットワークを介して通信可能に接続された他のデータサーバやクラウドストレージに、これらの情報が記憶される構成としてもよい。
【0017】
ニュース蓄積部121には、端末装置20に配信可能なニュースが蓄積されるデータベースであり、具体的には、複数のニュース情報が記憶されている。これらのニュース情報は、例えばサーバ装置10の管理者が生成してもよく、ニュースの編集者が所有する編集者端末から送信されるものであってもよい。あるいは、サーバ装置10が、インターネット上の所定のウェブコンテンツをクローリングして収集してもよい。
【0018】
ニュース情報は、コンテンツID、入稿日時情報、ニュース詳細情報等を含む。また、ニュース情報として、さらに、ニュースのジャンル等が記憶されていてもよい。コンテンツIDは、ニュース情報を識別する識別情報である。入稿日時情報はニュースが入稿された日時である。ニュース詳細情報は、ニュースの詳細な内容であり、例えばテキストデータや、イメージデータを含んで構成されている。ニュース詳細情報に含まれるテキストデータには、ニュースの詳細に関係する多数のキーワードが含まれる。
【0019】
ユーザ情報蓄積部122は、前記のように複数のユーザ情報が記憶されている。このユーザ情報は、ユーザID、ユーザ属性情報、閲覧履歴情報等を含む。ユーザIDは、ユーザを識別する識別情報である。ユーザ属性情報は、ユーザの様々な属性を記憶する。例えば、ユーザの性別、年齢層、居所等の個人情報が含まれてもよく、ユーザの趣味等の嗜好性が記憶されていてもよい。
【0020】
閲覧履歴情報は、サーバ装置10からレコメンドされたニュースに対して、ユーザが選択(閲覧)したニュースの履歴情報である。なお、ユーザ情報としては、その他、ユーザが端末装置20を操作して実施した検索処理における検索キーワードの履歴、インターネットを介した商品売買履歴、ユーザのウェブコンテンツの閲覧履歴等が含まれてもよい。
【0021】
プロセッサ13は、CPU等の演算回路、RAM等の記憶回路により構成される。プロセッサ13は、記憶部12に記憶されている情報処理プログラムをRAMに展開し、RAMに展開されたプログラムとの協働で、各種処理を実行する。そして、プロセッサ13は、情報処理プログラムを読み込み実行することで、図2に示すように、ユーザ情報取得部131、ユーザ特徴算出部132(ユーザ補正部)、コンテンツ特徴算出部133、スコア算出部134、順位決定部135、及び配信部136として機能する。
【0022】
ユーザ情報取得部131は、本発明の選択コンテンツ取得部としても機能し、端末装置20からユーザ情報を取得する。すなわち、ユーザ情報取得部131は、サーバ装置10から端末装置20にレコメンドしたニュースに対して、ユーザがいずれかのニュースを選択及び閲覧した場合に、その選択されたニュースを選択コンテンツとして取得する。つまり、ユーザのニュースの閲覧履歴情報を取得する。また、ユーザ情報取得部131は、その他、端末装置20でのユーザの入力操作によって入力されたユーザ属性を取得したり、検索履歴等の他の行動履歴を取得したりしてもよい。
【0023】
ユーザ特徴算出部132は、本発明のユーザ補正部としても機能し、ユーザ情報取得部131によって取得されたユーザ情報に基づいて、ユーザの特徴を示す複数次元の情報であるユーザ特徴ベクトルを算出する。なお、本実施形態では、ユーザ特徴算出部132は、ユーザ情報の閲覧履歴情報に基づいて、ユーザ特徴ベクトルを算出する例を示すが、閲覧履歴情報に加え、ユーザ属性や、その他の行動履歴情報などを用いてユーザ特徴ベクトルを算出してもよい。なお、ユーザ特徴ベクトルの算出は公知の技術を利用でき、例えば、適合フィードバックなどを利用できる。
【0024】
コンテンツ特徴算出部133は、ニュースの特徴であるコンテンツ特徴ベクトルを、ニュース詳細情報に基づいて算出する。前記したように、ニュース詳細情報は、ニュースの内容を示すテキストデータを含み、多数のキーワードが含まれる。コンテンツ特徴ベクトルの算出は公知の技術を利用でき、例えば、tf-idf(Term Frequency - Inverse Document Frequency)、Key-Value方式、W2V(Word 2 Vector)等の技術を用いて、ニュース詳細情報からコンテンツ特徴ベクトルを算出する。
【0025】
スコア算出部134は、ニュース蓄積部121に記憶される各ニュースに対してユーザがどの程度興味を有するかを予測するスコアを算出する。
順位決定部135は、スコア算出部134により算出された各ニュースのスコアに基づいて、各ユーザに配信するニュースの順位を決定する。なお、スコア算出部134及び順位決定部135の詳細な処理については後述する。
配信部136は、順位決定部135により決定された順位に基づいて、ニュースを選択して端末装置20にレコメンドする。
【0026】
[端末装置20の構成]
端末装置20は、ユーザが管理するコンピュータであり、例えばスマートフォン、タブレット端末、パーソナルコンピューター等により構成されている。端末装置20の具体的な構成の図示は省略するが、端末装置20は、一般的なコンピュータが有する基本的な構成を有する。すなわち、端末装置20は、操作者の操作を受け付ける入力操作部、画像情報を表示させるディスプレイ、各種情報を記憶する記憶装置、各種情報を演算処理する演算回路(CPU等)を備えている。
【0027】
[情報処理方法]
次に、本実施形態の情報処理システムでのレコメンド方法について、特に、サーバ装置10での情報処理方法を中心に説明する。図3は、本実施形態におけるレコメンド方法を示すフローチャートである。サーバ装置10は、端末装置20へのニュースのレコメンド処理にあたり、事前にユーザ情報及びニュース情報を取得しており、記憶部12に記憶しているものとする。また、サーバ装置10のコンテンツ特徴算出部133は、ニュース情報の取得時に当該ニュースのコンテンツ特徴ベクトルを算出しているものとする。
【0028】
サーバ装置10は、端末装置20から、ニュース配信を要求する要求情報及びユーザIDを受信する(ステップS1)。そして、ユーザ特徴算出部132は、要求情報とともに受信したユーザIDに基づいてユーザ情報を読み込み、当該ユーザに対するユーザ特徴ベクトルを算出する(ステップS2)。
【0029】
この後、スコア算出部134は、算出されたユーザ特徴ベクトルと、コンテンツ特徴ベクトルとに基づいて、各ニュース情報に対するスコアを算出する(ステップS3:スコア算出ステップ)。このステップS3では、スコア算出部134は、例えばユーザ特徴ベクトルと、コンテンツ特徴ベクトルとの内積を算出することで、スコアを算出する。
【0030】
次に、順位決定部135は、ステップS3で算出されたスコアにおいて、複数のピークがあるか否かを判断する(ステップS4)。
【0031】
以下、ステップS4~S6において実行される順位決定処理について説明する。図4及び図5は、ステップS3で算出されたスコアの一例を示す図である。図4及び図5において、横軸は各ニュース、縦軸は各ニュースに対するスコアを示している。横軸には、コンテンツ特徴ベクトルの類似度が近い順にニュースを配置している。
【0032】
図4及び図5において、Nの添え字は、各ニュースのスコアに基づく順位を示している。例えば、Nはスコアが1番高いため、順位が1位であることを示し、N50はスコアが50番目の高さであるため、順位が50位であることを示している。この添え字の意味は、図6及び図7においても同様である。
【0033】
コンテンツ特徴ベクトルの類似度が近いか遠いかについては、例えば、以下に示す2つの手法、又はこれらの手法を組み合わせて判断する。
(1)各ニュースのテキストデータに含まれている単語が近いニュース同士を近くに配置する。
(2)ニュースを閲覧するユーザのユーザ情報に基づいて、同一ユーザによって閲覧されているニュース同士を近くに配置する。
【0034】
この場合、各ニュースについてジャンル(例えば、スポーツ、文化、政治、経済)を予め設定し、この設定したジャンルが近いか遠いかによって判断することが考えられる。しかし、このような処理を行うと、どのジャンルに属するか微妙なニュースの分類を誤ってしまう場合がある。
【0035】
例えば、サッカーの名選手だった人について、過去の成績を紹介しつつ、現在の芸術活動を紹介するニュースがあるとする。この場合、この人の過去の成績紹介に注目すればこのニュースはスポーツのジャンルに属するが、この人の現在の芸術活動に注目すればこのニュースは文化のジャンルに属する。つまり、各ニュースを機械的にジャンル分け、各ジャンルから上位数件ずつを選択してしまうと、ユーザの興味に沿ったレコメンドができないおそれがある。
【0036】
そこで、本実施形態では、各ニュースについて予めジャンルを設定して配置するのではなく、前記(1)、又は(2)の手法のいずれか一方、又は両方の手法の組み合わせにより、コンテンツ特徴ベクトルの類似度が近いか遠いかを判断して、各ニュースを配置する。
【0037】
例えば、図4では、スポーツに関するニュースには高い興味を有するが、他のニュースにはほとんど興味を有しないユーザの各ニュースに対するスコアの一例である。図4では、スポーツに関するニュースNでスコアがピーク値となり、ニュースNの周辺には、ニュースNとコンテンツ特徴ベクトルが類似する他のニュースが配置されているが、ニュースNから遠い位置にはピークを形成するほどスコアが高い部分がない。すなわち、図4は、ピークが1つである例を示している。
【0038】
これは、ユーザの過去のニュースの閲覧履歴において、他のニュースに比べて、スポーツに関するニュースにほぼ集中して閲覧していたことを示しており、ユーザ特徴算出部132は、このような過去のニュースの閲覧履歴を用い、機械学習によりユーザ特徴ベクトルを推算する。これにより、スポーツに関するニュースに対するスコアが、他のニュースより高くなる。
【0039】
ここで、図4を参照して、本願明細書におけるピークについて定義する。図4において、位置aは、最高部から左右ほぼ対称に大きい傾きで下降する形状を示すとともに、スコアが所定の閾値STh以上となるため、本願明細書では、これをピークとする。一方、位置b及び位置cは、最高部から左右ほぼ対称に小さい傾きで下降する形状を示すとともに、スコアが所定の閾値STh以下となるため、本願明細書では、これをピークとはしない。位置dは、最高部に対して非対称の形状を示すとともに、スコアが所定の閾値STh以下となるため、本願明細書では、これをピークとはしない。したがって、図4では、ピークは1つである。
【0040】
スコアに差がない複数のコンテンツが近接する場合、前記特性曲線は、隣接するコンテンツの間ではなだらかな曲線になる。例えば、比較的類似度が近い3つのコンテンツが近接した場合、中央部のコンテンツの特性曲線の山部はなだらかになる。この場合、左右のコンテンツの特性曲線の山部はピークとして検出されるものの、中央部のコンテンツの特性曲線の山部がピークと判定されない可能性がある。そこで、前記特性曲線を解析し、複数のコーシー分布曲線(山)の組み合わせと捉え、各コーシー分布曲線をそれぞれピークとして検出することにより、中央部のコンテンツの特性曲線の山部がなだらかであっても、当該コンテンツのレコメンド配信は可能である。
【0041】
一般に、ニュースをレコメンドする場合、スコアが高いニュースは、ユーザの最も興味が高いニュースであると予測でき、スコアが高い順にニュースを並び替えて端末装置20にレコメンドする。したがって、図4に示すように、1つのピークがある場合、当該ピークのスコアを有するニュースを配信すれば、ユーザの興味に対応したニュースを適切に配信していると言える。
【0042】
一方、図5は、互いの類似度が遠い複数のニュース(例えば、スポーツと経済)について、それぞれ周辺のニュースと比較すると高いスコアで閲覧しているユーザの、各ニュースに対するスコアの一例である。図5では、スポーツに関するニュースNでスコアがピーク値となり、ニュースNの周辺には、ニュースNとコンテンツ特徴ベクトルが類似する他のニュースが配置され、ニュースNから遠い位置に配置された経済に関するニュースN50でスコアがピーク値となり、ニュースN50の周辺には、ニュースN50とコンテンツ特徴ベクトルが類似する他のニュースが配置されている。また、ニュースNのスコア、及びニュースN50のスコアは、所定の閾値STh以上である。したがって、図5は、ピークが2つである例を示している。
【0043】
これは、ユーザの過去のニュースの閲覧履歴において、他のニュースに比べて、スポーツに関するニュースを一番多く閲覧していたが、経済に関するニュースについてにも二番目に多く閲覧していたことを示しており、ユーザ特徴算出部132は、このような過去のニュースの閲覧履歴を用い、機械学習によりユーザ特徴ベクトルを推算する。これにより、スポーツに関するニュースに対するスコア、及び経済に関するニュースに対するスコアが、他のニュースに対するスコアよりそれぞれ高くなる。
【0044】
ここで、従来のニュースレコメンド方法では、スコアが高い順にニュースを並べ替えて端末装置20に送信するので、複数のピークであっても、その中でスコアが高い順にニュースが配信されることになる。
【0045】
図5の例では、経済に関するニュースN50のスコアは50番目であるので、図4の例と同様、スポーツに関するニュースN及びその周辺のスポーツに関するニュースが、レコメンドされるニュースの上位を占めることになる。このように、従来のレコメンド方法を用いると、ユーザが経済に関するニュースにも強い興味があるのも関わらず、スポーツに関するニュースのみが上位に配信されることになる。
【0046】
これに対して、本実施形態に係るステップS4では、順位決定部135は、ステップS3で算出されたスコアにおいて、複数のピークがあるか否かを判断する。ステップS4の判断結果が「YES」の場合には、順位決定部135は、各ピークのスコアに基づいて配信の順位を決定する(ステップS5:順位決定ステップ)。
【0047】
一例として、第1及び第2のピークがあり、第1のピークのスコアと第2のピークのスコアの比率が、例えば、2:1の場合、第1のピーク及びその近傍に配置されたニュース(以下「第1グループ」という。)の中で第1及び第2順位のニュースを配信の第1及び第2順位と決定するとともに、第2のピーク及びその近傍に配置されたニュース(以下「第2グループ」という。)の中で第1順位のニュースを配信の第3順位と決定する。これ以降は、第1グループから上位2件、第2のグループから上位1件、交互に選択し、それぞれ配信の順位を決定する。
【0048】
第1のピークのスコアと第2のピークのスコアの比率と、配信順位を割り当てるニュースの件数の比率は同一である必要はない。また、ピークの個数に制限はない。さらに、時間帯によって配信順位を割り当てるニュースの件数の割当比率を変更してもよい。例えば、ユーザが通勤者又は主婦などであって、朝など忙しくて、ニュースの閲覧本数が少ない(例えば、10件ほど)時間帯には第1グループ側の割当比率を小さくする(例えば、1:1)一方、夜など、比較的時間があり、ニュースの閲覧本数が多い(例えば、100件ほど)時間帯には第1グループ側の割当比率を大きくする(例えば、3:1)。
【0049】
配信部136は、各ピークのコンテンツ及び当該コンテンツの近傍に配置された複数のコンテンツから配信すべきコンテンツを抽出し、順位決定部135によって決定された順位に基づいて、端末装置20にレコメンドする(ステップS7:配信ステップ)。
【0050】
一方、ステップS4の判断結果が「NO」の場合、すなわち、1つのピークのみがある場合には、順位決定部135は、高いスコアに基づいて配信するニュースの順位を決定する(ステップS6:順位決定ステップ)。これにより、配信部136は、当該ピークのコンテンツ及び当該コンテンツの近傍に配置された複数のコンテンツから配信すべきコンテンツを抽出し、順位決定部135によって決定された順位、すなわち、スコアの高い順に端末装置20にレコメンドする(ステップS7:配信ステップ)。
【0051】
図6は、図4に示すように、スポーツに関するニュースNのスコアがピークとなる場合に端末装置20に配信される、本実施形態のニュースのレコメンド表示欄30を示す図である。図7は、図5に示すように、スポーツに関するニュースNのスコアが第1のピークとなるとともに、経済に関するニュースN50のスコアが第2のピークとなる場合に端末装置20に配信される、本実施形態のニュースのレコメンド表示欄40を示す図である。
【0052】
なお、詳細な説明は省略するが、図6及び図7に示す例は、主にスマートフォン等の携帯端末にインストールされるニュース閲覧アプリケーションでの表示例である。通常、このようなニュース閲覧アプリケーションでは、ユーザ情報に基づいたニュースがレコメンドされる「おすすめ」タブ、最新のニュースを新着順に表示させる「TOP」タブ、各種ジャンルに対応したタブ等が表示され、これらのいずれかを選択することで、タブに対応したニュースがレコメンドされる。
【0053】
ここでは、ユーザ情報に基づいてニュースのレコメンドを行う「おすすめ」タブが選択された場合に、レコメンド表示欄30,40に表示されるニュースについて説明する。従来の情報処理装置においては、図4に示すように、例えば、スポーツに関するニュースNのスコアは際立って高いが、他のニュースのスコアが低く、1つのピークだけがある場合では、図6に示すような、上位にスポーツに関するニュースN、N、・・・N、・・・だけが配置されたレコメンド表示欄30が端末装置20に表示される。なお、ユーザが端末装置20を操作して、レコメンド表示欄30を下方にスクロールすることで、レコメンド表示欄30に他のニュースが表示される。
【0054】
また、従来の情報処理装置においては、図5に示すような、互いの類似度が遠い複数のニュース、例えば、スポーツに関するニュースNの周辺で第1のピークがあり、経済に関するニュースN50の周辺で第2のピークがある場合でも、図6に示すような、上位にスポーツに関するニュースN、N、・・・N、・・・だけが配置されたレコメンド表示欄30が端末装置20に表示される。何故なら、ニュースをスコアだけで絶対評価すれば、スポーツに関するニュースNのスコアは第1順位であるのに対し、経済に関するニュースN50のスコアは第50順位だからである。
【0055】
この場合、ユーザは、レコメンド表示欄30を下方にスクロールさせることで、自分が興味のあるニュースを探す必要がある。また、仮に、興味が無いにもかかわらず、レコメンド表示欄30に表示された上位のニュースを選択、閲覧すると、当該閲覧履歴情報に基づいてユーザ特性ベクトルが補正される。したがって、ユーザの興味に対応したユーザ特徴ベクトルを正しく算出することがより困難になってしまう。
【0056】
一方、本実施形態では、複数のピークがあるか否かを判断する。ここで、図4に示すように、1つのピークだけがある場合、スコアが高い順にレコメンドされるため、選出されるニュースは、従来と同様となり、レコメンド精度の低下はない。
【0057】
また、本実施形態では、図5に示すように、複数のピークがある場合には、各ピークの比率に応じて、各ピークが属するグループの中でスコアが高い順に交互にレコメンドされる。このため、図7に示すように、端末装置20に表示されるレコメンド表示欄40に、各グループに属するニュースが所定の比率で交互に配置される。この場合、ユーザは、レコメンド表示欄40の上位に配置されるニュースに、興味のあるニュースが含まれているので、レコメンド表示欄40を下方にスクロールさせることなく、当該ニュースを選択、閲覧することができる。
【0058】
また、レコメンド表示欄40の上位に興味のあるニュースが配置される可能性も高くなり、1つのグループのニュースのみが配置される場合に比べて、ユーザの興味に対応した閲覧履歴情報を適正に取得でき、ユーザの興味を適正に学習することができる。
【0059】
この後、端末装置20において、レコメンド表示欄40に配置されたニュースのうちのいずれかがユーザの操作によって選択されると、端末装置20から選択されたニュース(選択コンテンツ)を示す選択コンテンツ情報(例えば、コンテンツID)がサーバ装置10に送信される。
【0060】
サーバ装置10のユーザ情報取得部131は、端末装置20から選択コンテンツ情報を受信したか否かを判断する(図3のステップS8)。ステップS7の判断結果が「NO」の場合、すなわち、選択コンテンツ情報が受信されず、端末装置20において、ユーザによるニュースの閲覧が終了した場合等では、ユーザ情報取得部131は、一連の処理を終了する。
【0061】
一方、ステップS7の判断結果が「YES」の場合、すなわち、選択コンテンツ情報を受信した場合には、ユーザ情報取得部131は、閲覧履歴情報を更新する(ステップS9)。例えば、選択コンテンツ情報を受信した日時と、選択コンテンツに対応するコンテンツIDとを閲覧履歴情報に記憶する。
【0062】
次に、ユーザ特徴算出部132は、さらに、更新された閲覧履歴情報を含むユーザ情報に基づいて、ユーザ特徴ベクトルを算出する(ステップS10)。
この後、スコア算出部134は、ステップS10の処理において算出されたユーザ特徴ベクトルに基づいて、各ニュースに対するスコアを再度算出した後、スコアの再算出が終了した旨を順位決定部135へ通知する(ステップS11:スコア算出ステップ)。
【0063】
これにより、順位決定部135は、ステップ4へ戻り、前記ステップS4以降の処理を続行する。
【0064】
[本実施形態の作用効果]
本実施形態のサーバ装置10は、記憶部12と、プロセッサ13とを備え、プロセッサ13は、記憶部12に記憶された情報処理プログラムを読み込むことで、スコア算出部134、順位決定部135、及び配信部136として機能する。
【0065】
スコア算出部134は、ユーザの特徴を示すユーザ特徴ベクトル、及び、コンテンツ(ニュース)の特徴を示すコンテンツ特徴ベクトルに基づいて、ユーザのコンテンツへの興味を示すスコアを算出する。順位決定部135は、類似度が近い順に配置された各コンテンツに対する、各コンテンツのスコアの特性において、複数のピークが存在する場合には、各ピークの相違に基づいて、各コンテンツの配信すべき順位を決定する。配信部136は、順位決定部135によって決定された順位に基づいて所定数のコンテンツを選択してユーザが所持する端末装置20にレコメンドする。
【0066】
これにより、ユーザが、類似度が遠い複数のコンテンツ(例えば、スポーツと経済)へそれぞれ高い興味を持っている場合に、興味が高い複数のコンテンツを適度に配分して配信することができる。よって、当該レコメンドに対して、ユーザがいずれかを選択することにより、ユーザが興味のあるニュースを閲覧履歴情報として取得でき、ユーザの興味を学習することができる。
【0067】
本実施形態では、順位決定部135は、各ピークの高さの比率に基づいて順位を決定する。これにより、ユーザの興味の高さに応じて複数のコンテンツを適度に配分して配信することができる。
【0068】
本実施形態では、順位決定部135は、コンテンツを配信する時間帯に応じて順位を変更する。これにより、ユーザは、例えば、忙しい時間帯では非類似の複数のコンテンツを効率よく閲覧することができ、余裕のある時間帯では非類似の複数のコンテンツをじっくり閲覧することができる。
【0069】
本実施形態では、サーバ装置10のプロセッサ13は、ユーザ情報取得部131、及びユーザ特徴算出部132としても機能する。ユーザ情報取得部131は、本発明の選択コンテンツ取得部であり、配信部136により端末装置20に配信された複数のニュースのうち、端末装置20において選択及び閲覧されたニュースを選択コンテンツ情報として取得する。そして、ユーザ特徴算出部132は、本発明のユーザ補正部としても機能し、選択コンテンツ情報に基づいて更新された閲覧履歴情報に基づいて、ユーザ特徴ベクトルを算出する。
【0070】
したがって、配信されたニュースのいずれかを選択する操作が端末装置20で実施されることにより、閲覧履歴情報が更新され、ユーザ特徴算出部132は、その閲覧履歴情報に基づいたユーザ特徴ベクトルを算出する。つまり、配信されたニュースから、ユーザが興味を持つニュースを特定でき、ユーザの興味を適切に学習することができる。よって、ユーザが興味を持つニュースに対するベクトル値が高いユーザ特徴ベクトルを算出でき、これによって、真にユーザが興味を持つニュースをレコメンドすることができる。
【0071】
[変形例]
なお、本発明は、前記した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
【0072】
[変形例1]
前記実施形態では、コンテンツの一例としてニュースを例示したが、これに限定されない。コンテンツとして、例えば商品等を広告する広告コンテンツであってもよく、動画配信サービスで配信される動画コンテンツ等であってもよい。
【0073】
[変形例2]
前記実施形態では、ユーザ特徴算出部132は、ユーザ情報の閲覧履歴情報に基づいてユーザ特徴ベクトルを算出する例を示したが、ニュースの閲覧履歴情報に加え、ユーザ情報に含まれるユーザ属性や、インターネット上の検索履歴等のその他の行動履歴に基づいて、ユーザ特徴ベクトルを算出してもよい。
【符号の説明】
【0074】
10…サーバ装置(情報処理装置)、12…記憶部、13…プロセッサ、20…端末装置、30,40…レコメンド表示欄、121…ニュース蓄積部、122…ユーザ情報蓄積部、131…ユーザ情報取得部、132…ユーザ特徴算出部、133…コンテンツ特徴算出部、134…スコア算出部、135…順位決定部、136…配信部、a,b,c,d…位置、STh…閾値。
図1
図2
図3
図4
図5
図6
図7