(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022028471
(43)【公開日】2022-02-16
(54)【発明の名称】情報処理装置および情報処理プログラム
(51)【国際特許分類】
G06F 16/335 20190101AFI20220208BHJP
G06F 16/36 20190101ALI20220208BHJP
【FI】
G06F16/335
G06F16/36
【審査請求】有
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2020131892
(22)【出願日】2020-08-03
(11)【特許番号】
(45)【特許公報発行日】2021-02-10
(71)【出願人】
【識別番号】518133201
【氏名又は名称】富士通クライアントコンピューティング株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】大櫃 敏郎
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FA01
5B175HA01
5B175HA02
(57)【要約】
【課題】推薦すべきコンテンツをより適切に決定する。
【解決手段】本開示の一例としての情報処理装置は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出する抽出処理部と、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、第1コンテンツに応じてユーザに推薦すべき第2コンテンツを決定する推薦処理部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ユーザが第1コンテンツを視聴した場合に、前記第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出する抽出処理部と、
前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す関連性値に基づいて、前記第1コンテンツに応じて前記ユーザに推薦すべき第2コンテンツを決定する推薦処理部と、
を備える、情報処理装置。
【請求項2】
前記ユーザが過去に視聴したコンテンツに含まれる前記関連語に基づいて設定された前記関連性値を管理する管理処理部をさらに備え、
前記管理処理部は、前記ユーザが前記第1コンテンツを視聴した場合に、前記第1コンテンツ内における前記関連語の出現形態に基づいて、前記管理処理部が管理している前記関連性値の設定または更新を行う、
請求項1に記載の情報処理装置。
【請求項3】
前記第2単語として第3単語および第4単語が設定されている場合、前記第1単語および前記第2単語の関連性を示す前記関連性値は、前記第1単語および前記第3単語の関連性を示す第1関連性値と、前記第3単語および前記第4単語の関連性を示す第2関連性値と、前記第1関連性値および前記第2関連性値の合計を示す第3関連性値と、を含む、
請求項1または2に記載の情報処理装置。
【請求項4】
前記推薦処理部は、前記ユーザに提供されうる複数のコンテンツの各々に含まれる前記第1単語および前記第2単語の関連性を示す前記関連性値に基づいて、前記複数のコンテンツから前記第2コンテンツの候補を抽出し、当該候補から、前記第2コンテンツを決定する、
請求項1~3のうちいずれか1項に記載の情報処理装置。
【請求項5】
前記推薦処理部は、前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す前記関連性値と、前記第2コンテンツの前記候補に含まれる前記第1単語および前記第2単語の関連性を示す前記関連性値と、に基づいて、前記第2コンテンツの前記候補から、前記第1コンテンツに対応した前記第2コンテンツを決定する、
請求項4に記載の情報処理装置。
【請求項6】
ユーザが第1コンテンツを視聴した場合に、前記第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出することと、
前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す関連性値に基づいて、前記第1コンテンツに応じて前記ユーザに推薦すべき第2コンテンツを決定することと、
をコンピュータに実行させるための、情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置および情報処理プログラムに関する。
【背景技術】
【0002】
従来から、ユーザによるコンテンツの視聴に応じて、ユーザに推薦すべき(他の)コンテンツを提供する技術について検討されている。このような従来の技術として、コンテンツに含まれる単語の出現回数、コンテンツの発見にユーザが使用した検索語、またはコンテンツに含まれる単語ごとに割り当てられたスコア、などに基づいて推薦すべきコンテンツを決定する構成が知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2017-156958号公報
【特許文献2】特開2019-61442号公報
【特許文献3】特表2007-507801号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、コンテンツをユーザに推薦すべきか否かは、当該コンテンツに含まれる単語間の関係性により発生する意味によって大きく変わると考えられる。このため、コンテンツに含まれる単語間の関係性により発生する意味を考慮して、推薦すべきコンテンツをより適切に決定することが望まれている。
【0005】
そこで、本開示の課題の一つは、推薦すべきコンテンツをより適切に決定することが可能な情報処理装置および情報処理プログラムを提供することである。
【課題を解決するための手段】
【0006】
本開示の一例としての情報処理装置は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出する抽出処理部と、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、第1コンテンツに応じてユーザに推薦すべき第2コンテンツを決定する推薦処理部と、を備える。
【発明の効果】
【0007】
本開示の情報処理装置および情報処理プログラムによれば、推薦すべきコンテンツをより適切に決定することができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態にかかる情報処理システムの構成を示した例示的かつ模式的なブロック図である。
【
図2】
図2は、実施形態にかかる単語の抽出の例を例示的かつ模式的な図である。
【
図3】
図3は、実施形態にかかる関連語データベースの例を示した例示的かつ模式的な図である。
【
図4】
図4は、実施形態にかかる管理データベースの例を示した例示的かつ模式的な図である。
【
図5】
図5は、実施形態にかかる管理データベースにおいて構成されるツリー構造の例を示した例示的かつ模式的な図である。
【
図6】
図6は、実施形態にかかる関連性値を説明するための例示的かつ模式的な図である。
【
図7】
図7は、実施形態にかかるコンテンツデータベースの例を示した例示的かつ模式的な図である。
【
図8】
図8は、実施形態にかかる推薦データベースの例を示した例示的かつ模式的な図である。
【
図9】
図9は、実施形態にかかるサーバ装置がコンテンツの推薦のために実行する一連の処理を示した例示的なフローチャートである。
【
図10】
図10は、実施形態にかかる抽出処理部が主単語および従単語の抽出のために実行する一連の処理の詳細を示した例示的なフローチャートである。
【
図11】
図11は、実施形態にかかる管理処理部が関連性値の算出のために実行する一連の処理の詳細を示した例示的なフローチャートである。
【
図12】
図12は、実施形態にかかる推薦により端末装置側で出力される画像の例を示した例示的な図である。
【
図13】
図13は、実施形態にかかるサーバ装置が推薦データベースの設定のために実行する一連の処理を示した例示的なフローチャートである。
【
図14】
図14は、実施形態にかかるサーバ装置を構成するコンピュータのハードウェア構成の例を示した例示的かつ模式的なブロック図である。
【発明を実施するための形態】
【0009】
以下、本開示の実施形態を図面に基づいて説明する。以下に記載する実施形態の構成、ならびに当該構成によってもたらされる作用および効果は、あくまで一例であって、以下の記載内容に限られるものではない。
【0010】
図1は、実施形態にかかる情報処理システムの構成を示した例示的かつ模式的なブロック図である。
【0011】
実施形態にかかる情報処理システムは、ユーザによるコンテンツの視聴に応じて、ユーザに推薦すべき(他の)コンテンツを提供する技術に適用される。このような技術を実施するための構成として、従来、コンテンツに含まれる単語の出現回数、コンテンツの発見にユーザが使用した検索語、またはコンテンツに含まれる単語ごとに割り当てられたスコア、などに基づいて推薦すべきコンテンツを決定する構成が知られている。
【0012】
しかしながら、コンテンツをユーザに推薦すべきか否かは、当該コンテンツに含まれる単語間の関係性により発生する意味によって大きく変わると考えられる。このため、コンテンツに含まれる単語間の関係性により発生する意味を考慮して、推薦すべきコンテンツをより適切に決定することが望まれている。
【0013】
そこで、実施形態にかかる情報処理システムは、以下に説明するような構成および処理により、推薦すべきコンテンツをより適切に決定することを実現する。
【0014】
図1に示されるように、実施形態にかかる情報処理システムは、端末装置100と、サーバ装置200と、を備えている。端末装置100およびサーバ装置200は、ネットワーク(不図示)を介して互いに通信可能に接続されている。サーバ装置200は、本開示の「情報処理装置」の一例である。
【0015】
端末装置100は、通信処理部110と、入力処理部120と、出力処理部130と、を備えている。
【0016】
通信処理部110は、端末装置100と他の装置(
図1に示される例ではサーバ装置200)との間で実行されうる通信を司る。
【0017】
入力処理部120は、端末装置100のユーザの操作を受け付ける。当該操作の一例としては、サーバ装置200からコンテンツを取得して当該コンテンツを端末装置100側で視聴するための操作が挙げられる。なお、実施形態において、コンテンツは、テキストデータまたは音声データなどのような、少なくとも1つの単語を抽出可能なデータに対応付けられているものとする。
【0018】
出力処理部130は、端末装置100のユーザに対して各種の情報を提供する。たとえば、出力処理部130は、ユーザの操作に応じてサーバ装置200から取得されたコンテンツを、端末装置100に搭載された(または端末装置100に接続された)ディスプレイまたはスピーカを介してユーザに提供する。
【0019】
また、サーバ装置200は、通信処理部210と、抽出処理部220と、関連語データベース(DB)221と、管理処理部230と、管理データベース231と、推薦処理部240と、推薦データベース241と、コンテンツデータベース242と、を備えている。
【0020】
通信処理部210は、サーバ装置200と他の装置(
図1に示される例では端末装置100)との間で実行されうる通信を司る。
【0021】
抽出処理部220は、ユーザがコンテンツを視聴した場合に、当該コンテンツから、互いに関連する関連語として予め設定された主単語および従単語を抽出する。なお、主単語および従単語は、それぞれ、本開示の「第1単語」および「第2単語」の一例である。また、以下では、説明の便宜上、ユーザが視聴したコンテンツを第1コンテンツと記載することがある。
【0022】
より具体的に、抽出処理部220は、まず、次の
図2に示されるように、第1コンテンツに対する形態素解析により、第1コンテンツから、接続詞、助動詞、および助詞を除いた全ての単語を抽出する。
【0023】
図2は、実施形態にかかる単語の抽出の例を例示的かつ模式的な図である。
【0024】
図2に示される例において、抽出処理部220は、webページのソースデータ21から、接続詞、助動詞、および助詞を除いた全ての単語のリスト22を抽出する。
【0025】
そして、抽出処理部220は、次の
図3に示されるような関連語データベース221を参照し、上記のように抽出された全ての単語から、主単語および従単語を抽出する。
【0026】
図3は、実施形態にかかる関連語データベース221の例を示した例示的かつ模式的な図である。
【0027】
図3に示されるように、関連語データベース221には、「カテゴリ」と「主単語」と「従単語」との対応関係が設定されている。関連語データベース221は、たとえばサーバ装置200を提供する事業者により予め設定される。なお、
図3に示される例において、「カテゴリ」と「主単語」と「従単語」との各欄に設定された情報は、あくまで一例である。したがって、実施形態では、関連語データベース221の各欄に
図2に示される例とは異なる情報が設定されていてもよい。
【0028】
「主単語」および「従単語」の欄には、それぞれ、たとえばサーバ装置200を提供する事業者により関連語として予め決められた主単語および従単語が設定されている。従単語は、1つの主単語に対して複数設定されうる、主単語の下位概念的な単語である。ただし、従単語は、必ずしも主単語の完全な下位概念の意味を持つ単語ではなく、ある程度以上のレベルで主単語と意味的に関連している単語として事業者が任意に決めた単語である。そして、「カテゴリ」の欄には、対応する主単語および従単語が属するカテゴリとして事業者が任意に決めた情報が設定されている。
【0029】
図1に戻り、管理処理部230は、管理データベース231を管理する。より具体的に、管理処理部230は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツ内における上記の関連語の出現形態に基づいて、管理データベース231の設定または更新を行う。したがって、管理データベース231は、ユーザがコンテンツを視聴するごとに設定または更新されるデータベース、別の言い方をすればユーザの視聴履歴に基づいて設定されるデータベース、であると言える。
【0030】
ここで、管理データベース231には、たとえば次の
図4に示されるように、ユーザにとっての主単語および従単語の関連性(重み)が設定される。
【0031】
図4は、実施形態にかかる管理データベース231の例を示した例示的かつ模式的な図である。
【0032】
図4に示されるように、管理データベース231には、「ユーザID」と「カテゴリ」と「主単語」と「第1の従単語」と「第2の従単語」と「プロファイルID/関連性値」との対応関係が設定されている。なお、
図4に示される例において、「ユーザID」と「カテゴリ」と「主単語」と「第1の従単語」と「第2の従単語」と「プロファイルID/関連性値」との各欄に設定された情報は、あくまで一例である。したがって、実施形態では、管理データベース231の各欄に
図4に示される例とは異なる情報が設定されていてもよい。
【0033】
「ユーザID」の欄には、ユーザを識別するための識別情報が設定される。また、「カテゴリ」の欄には、対応する「ユーザID」で識別されるユーザが以前に視聴したコンテンツのカテゴリが設定される。
【0034】
そして、「主単語」の欄には、ユーザが以前に視聴したコンテンツに含まれている主単語が設定される。また、「第1の従単語」および「第2の従単語」の欄には、ユーザが以前に視聴したコンテンツに含まれている従単語が1つずつ設定される。なお、第1の従単語および第2の従単語は、本開示の「第3単語」および「第4単語」の一例である。第1の従単語は、たとえば第2の従単語よりもコンテンツ内での出現回数が多い従単語として設定される。これにより、管理データベース231には、次の
図5に示されるようなツリー構造(層構造)が構成される。
【0035】
図5は、実施形態にかかる管理データベース231において構成されるツリー構造の例を示した例示的かつ模式的な図である。
【0036】
図5に示される例は、1つのユーザIDと、3つのカテゴリと、3つの主単語と、4つの第1の従単語と、5つの第2の従単語と、により構成されるツリー構造の一部を示している。
図5に示される例では、「スポーツ」および「経済」という2つのカテゴリの先につながるツリー構造、および「記録更新」という主単語の先につながるツリー構造などが省略されているが、実際にはこれらのツリー構造も存在しうる。また、
図5に示される例は、あくまで一例である。したがって、実施形態では、
図5に示される例よりも大きい(長いまたは広い)ツリー構造も、
図5に示される例よりも小さい(短いまたは狭い)ツリー構造も想定することができる。
【0037】
図4に戻り、「プロファイルID/関連性値」の欄には、主単語および2つの従単語の関連性を示す関連性値と、ユーザID、カテゴリ、主単語、2つの従単語、および関連性値の対応関係に割り当てられる識別情報としてのプロファイルIDと、が設定される。ここで、関連性値とは、次の
図6に示されるような値である。
【0038】
図6は、実施形態にかかる関連性値を説明するための例示的かつ模式的な図である。
【0039】
図6に示されるように、関連性値は、主単語と第1の従単語との関連性を示す第1関連性値Xn1と、第1の従単語と第2の従単語との関連性を示す第2関連性値Xn2と、第1関連性値と第2関連性値との合計としての第3関連性値Xn3と、を含んでいる。詳細は後述するが、関連性値は、コンテンツ内における主単語および従単語の出現度合に応じて算出される。
【0040】
ここで、前述したように、管理データベース231は、ユーザがコンテンツを視聴するごとに設定または更新される。このため、管理データベース231に設定された関連性値は、ユーザが既に視聴したコンテンツの特徴を反映した値だと言える。したがって、管理データベース231によれば、ユーザが既に視聴したコンテンツと類似の特徴を有するコンテンツを特定することができるので、ユーザに推薦すべきコンテンツの決定に利用することができる。
【0041】
図1に戻り、推薦処理部240は、ユーザが視聴した第1コンテンツの特徴に基づいて、推薦データベース241から、ユーザに推薦すべきコンテンツを決定する。以下では、説明の便宜上、ユーザに推薦すべきコンテンツを第2コンテンツと記載することがある。推薦処理部240は、決定した第2コンテンツの端末装置100への送信を通信処理部210に実行させる。
【0042】
ここで、推薦データベース241とは、第2コンテンツの候補に関する各種の情報が設定されたデータベースである。推薦データベース241は、サーバ装置200が提供可能な(全ての)コンテンツに関する各種の情報が設定されたコンテンツデータベース242に基づいて設定される。
【0043】
図7は、実施形態にかかるコンテンツデータベース242の例を示した例示的かつ模式的な図である。
【0044】
図7に示されるように、コンテンツデータベース242には、「ユーザID」と「カテゴリ」と「コンテンツNo」と「日付」と「情報」との対応関係が設定されている。なお、
図7に示される例において、「ユーザID」と「カテゴリ」と「コンテンツNo」と「日付」と「情報」との各欄に設定された情報は、あくまで一例である。したがって、実施形態では、コンテンツデータベース242の各欄に
図7に示される例とは異なる情報が設定されていてもよい。
【0045】
「ユーザID」の欄には、対応するコンテンツを提供可能なユーザの識別情報が設定される。また、「カテゴリ」の欄には、対応するコンテンツが属するカテゴリが設定される。
【0046】
そして、「コンテンツNo」の欄には、対応するコンテンツの識別情報が設定される。また、「日付」の欄には、対応するコンテンツをユーザが視聴した日付が設定される。また、「情報」の欄には、対応するコンテンツの内容を示す情報、たとえば前述したテキストデータまたは音声データが設定される。
【0047】
実施形態において、推薦処理部240は、上記のようなコンテンツデータベース242に設定されたコンテンツに含まれる主単語および従単語の抽出を抽出処理部220に実行させるとともに、抽出された主単語および従単語の関連性を示す関連性値の算出を管理処理部230に実行させる。そして、推薦処理部240は、関連性値が閾値以上のコンテンツを第2コンテンツの候補としてコンテンツデータベース242から抽出し、当該第2コンテンツの候補に関する各種の情報を推薦データベース241に設定する。
【0048】
図8は、実施形態にかかる推薦データベース241の例を示した例示的かつ模式的な図である。
【0049】
図8に示されるように、推薦データベース241には、「コンテンツNo」と「カテゴリ」と「主単語」と「第1の従単語」と「他の従単語」と「関連性値」との対応関係が設定されている。なお、
図8に示される例において、「コンテンツNo」と「カテゴリ」と「主単語」と「第1の従単語」と「他の従単語」と「関連性値」との各欄に設定された情報は、あくまで一例である。したがって、実施形態では、推薦データベース241の各欄に
図8に示される例とは異なる情報が設定されていてもよい。
【0050】
「コンテンツNo」の欄には、第2コンテンツの候補の識別情報が設定される。また、「カテゴリ」の欄には、第2コンテンツの候補が属するカテゴリが設定される。
【0051】
そして、「主単語」の欄には、第2コンテンツの候補に含まれる主単語が設定される。また、「第1の従単語」の欄には、たとえば第2コンテンツの候補に含まれる従単語のうち出現回数(出現頻度)が最も高い従単語としての第1の従単語が設定され、「他の従単語」には、第2コンテンツの候補に含まれる従単語のうち第1の従単語以外の他の従単語が設定される。
【0052】
そして、「関連性値」の欄には、主単語と第1の従単語と他の従単語との関連性に関する関連性値が設定される。前述したように、関連性値は、主単語と従単語との関連性を示す値と、従単語同士の関連性を示す値と、これら2つの値の合計を示す値と、の3つの値を含みうる。なお、実施形態では、サーバ装置200を提供する事業者がユーザへの推薦内容をコントロールできるように、推薦データベース241に設定された関連性値が変更可能に設定されてもよい。
【0053】
以上の構成に基づき、実施形態にかかるサーバ装置200は、端末装置100のユーザがコンテンツデータベース242のコンテンツを視聴することに応じて、次の
図9に示されるような一連の処理により、ユーザに対するコンテンツの推薦を実行する。
【0054】
図9は、実施形態にかかるサーバ装置200がコンテンツの推薦のために実行する一連の処理を示した例示的なフローチャートである。
【0055】
図9に示されるように、実施形態では、まず、S901において、抽出処理部220は、端末装置100のユーザが視聴したコンテンツとしての第1コンテンツから、主単語および従単語を抽出する。主単語および従単語の抽出は、次の
図10に示されるような一連の処理により実行される。
【0056】
図10は、実施形態にかかる抽出処理部220が主単語および従単語の抽出のために実行する一連の処理の詳細を示した例示的なフローチャートである。
【0057】
図10に示されるように、実施形態において、抽出処理部220は、主単語および従単語の抽出にあたり、まず、S1001において、第1コンテンツに対する形態素解析などにより、第1コンテンツから、接続詞、助動詞、および助詞を除いた全ての単語を抽出する。
【0058】
そして、S1002において、抽出処理部220は、関連語データベース221を参照し、S1001で抽出された単語の中に、関連語データベース221に設定された主単語が存在するか否かを判定する。
【0059】
S1002において、主単語が存在しないと判定された場合、
図10に示される一連の処理が終了する。しかしながら、S1002において、主単語が存在すると判定された場合、S1003に処理が進む。
【0060】
そして、S1003において、抽出処理部220は、第1コンテンツから主単語を抽出する。
【0061】
そして、S1004において、抽出処理部220は、関連語データベース221をさらに参照し、S1001で抽出された単語の中に、S1003で抽出された主単語と関連する従単語が存在するか否かをさらに判定する。
【0062】
S1004において、従単語が存在しないと判定された場合、
図10に示される一連の処理が終了する。しかしながら、S1004において、従単語が存在すると判定された場合、S1005に処理が進む。
【0063】
そして、S1005において、抽出処理部220は、第1コンテンツから、S1003で抽出された主単語と関連する従単語を抽出する。なお、前述したように、従単語は、たとえばその出現回数(出現頻度)に応じて階層化されうる。このため、主単語および従単語は、ツリー構造を構成する。
【0064】
そして、S1006において、抽出処理部220は、第1コンテンツから全ての主単語が抽出されたか否かを判定する。
【0065】
S1006において、未抽出の主単語が存在すると判定された場合、S1002に処理が戻る。一方、S1006において、全ての主単語が抽出されたと判定された場合、
図10に示される一連の処理が終了する。
【0066】
図10に示される一連の処理の終了は、
図9に示されるS901の終了を意味する。
図9に示されるように、S901の処理が終了すると、S902に処理が進む。
【0067】
そして、S902において、管理処理部230は、S901の処理により主単語および従単語が(少なくとも1つずつ)抽出されたか否かを判定する。
【0068】
S902において、主単語および従単語が抽出されていないと判定された場合、
図6に示される一連の処理が終了する。しかしながら、S902において、主単語および従単語が抽出されたと判定された場合、S903に処理が進む。
【0069】
そして、S903において、管理処理部230は、処理対象としての第1コンテンツを視聴したユーザの識別情報、当該第1コンテンツが属するカテゴリ、およびS901の処理により抽出された主単語および従単語に基づいて管理データベース231を参照し、これらの情報に対応するプロファイルIDが管理データベース231内に存在するか否かを判定する。
【0070】
S903において、対応するプロファイルIDが存在しないと判定された場合、S9045に処理が進む。そして、S904において、管理処理部230は、新たなプロファイルIDを管理データベース231に設定する。そして、S905に処理が進む。なお、S903において、対応するプロファイルIDが存在すると判定された場合、S904の処理を経ずに、S905に処理が進む。
【0071】
そして、S905において、管理処理部230は、S901の処理により抽出された主単語および従単語の関連性を示す関連性値の算出を実行する。関連性値の算出は、主単語および従単語の抽出は、次の
図11に示されるような一連の処理により実行される。
【0072】
図11は、実施形態にかかる管理処理部230が関連性値の算出のために実行する一連の処理の詳細を示した例示的なフローチャートである。
【0073】
図11に示されるように、実施形態において、管理処理部230は、関連性値の算出にあたり、まず、S1101において、第1コンテンツ内における主単語および従単語の出現形態を取得する。たとえば、管理処理部230は、出現形態として、主単語と従単語との間隔、より具体的には主単語と従単語とが第1コンテンツ内で何語分離れているかを取得する。なお、従単語が複数存在する場合、管理処理部230は、従単語間の間隔も取得する。
【0074】
そして、S1102において、管理処理部230は、S1101で取得された出現形態に基づいて、主単語と従単語との関連性を示す関連性値(および従単語同士の関連性を示す関連性値)を算出する。たとえば、管理処理部230は、S1101で取得された間隔の逆数を、関連性値として算出する。一般に、単語間の間隔が小さいほど単語間の関連性が高いと言えるため、逆数を利用したこの算出方法は妥当である。
【0075】
なお、主単語が複数存在する場合、S1101およびS1102の処理は、各主単語に対して順次実行されるべきである。このため、S1103において、管理処理部230は、算出すべき全ての関連性値が算出されたか否か、すなわち全ての主単語および当該主単語に関連する従単語についての関連性値が算出されたか否かを判定する。
【0076】
S1103において、未算出の関連性値が存在すると判定された場合、次の主単語および当該主単語に関連する従単語についての関連性値の算出のため、S1101に処理が戻る。なお、関連性値の算出の基準となる主単語の選択順は、サーバ装置200を提供する事業者などにより予め設定されているものとする。
【0077】
一方、S1103において、全ての関連性値が算出されたと判定された場合、S1104に処理が進む。そして、S1104において、管理処理部230は、ツリー構造を有する主単語および従単語の各枝について、S1303で算出された関連性値の合計を算出する。そして、
図11に示される一連の処理が終了する。
【0078】
図11に示される一連の処理の終了は、
図9に示されるS905の終了を意味する。
図9に示されるように、S905の処理が終了すると、S906に処理が進む。
【0079】
そして、S906において、管理処理部230は、S905において算出された関連性値が所定の閾値以上か否か、より具体的には、第1コンテンツから抽出された主単語および従単語により構成されるツリー構造内に、S1104(
図11参照)において算出された関連性値の合計が所定の閾値以上となる枝が存在するか否かを判定する。
【0080】
S906において、関連性値の合計が閾値以上となる枝が存在しないと判定された場合、第1コンテンツには目立った特徴が無いと言える。したがって、この場合、管理データベース231の設定または更新は不要であるとともに、ユーザに推薦すべき第2コンテンツの決定も困難であるので、
図9に示される一連の処理が終了する。
【0081】
一方、S906において、関連性値の合計が閾値以上となる枝が存在すると判定された場合、第1コンテンツには一定以上の特徴があり、管理データベース231の設定または更新が必要だと言える。したがって、この場合、S907に処理が進む。
【0082】
そして、S907において、管理処理部230は、第1コンテンツから取得される各種の情報に基づいて、管理データベース231の設定または更新を実行する。つまり、管理処理部230は、S903において対応するプロファイルIDが存在すると判定された場合は、当該プロファイルIDに対応した各種の情報を更新し、S903において対応するプロファイルIDが存在しないと判定された場合は、S904において設定された新たなプロファイルIDに対応した各種の情報を(新たに)設定する。
【0083】
そして、S908において、推薦処理部240は、管理データベース231および推薦データベース241を参照し、ユーザに推薦すべきコンテンツとしての第2コンテンツの有無を判定する。たとえば、推薦処理部240は、まず、管理データベース231を参照し、ユーザIDが第1コンテンツと一致し、カテゴリ、主単語、および従単語が第1コンテンツと一致または類似する関連性値を取得する。そして、推薦処理部240は、推薦データベース241を参照し、管理データベース231から取得した関連性値と一致または類似し、かつカテゴリ、主単語、および従単語が第1コンテンツと一致または類似するコンテンツの有無により、第2コンテンツの有無を判定する。
【0084】
S908において、第2コンテンツが無いと判定された場合、
図9に示される一連の処理が終了する。一方、S908において、第2コンテンツがあると判定された場合、S909に処理が進む。
【0085】
そして、S909において、推薦処理部240は、推薦データベース241から、第1コンテンツに応じて推薦すべき第2コンテンツを抽出し、当該第2コンテンツの推薦を実行する。つまり、推薦処理部240は、第2コンテンツの端末装置100への送信を通信処理部210に実行させる。そして、
図9に示される一連の処理が終了する。
【0086】
以上の処理に基づき、実施形態では、ユーザによる第1コンテンツの視聴に応じて推薦すべき第2コンテンツが決定された場合、端末装置100側では、たとえば次の
図12に示されるような態様で第2コンテンツが出力される。
【0087】
図12は、実施形態にかかる推薦により端末装置100側で出力される画像の例を示した例示的な図である。
【0088】
図12に示されるように、実施形態にかかる推薦の結果は、一例として、端末装置100のユーザが視認可能な画像1200として、端末装置100に搭載された(または端末装置100に接続された)ディスプレイに出力される。この画像1200は、第1コンテンツが表示される第1領域1210と、第2コンテンツが表示される第2領域1220と、を含んでいる。第2領域1220は、一例として、第2コンテンツのタイトルのみが表示される第3領域1221を含んでいる。
【0089】
なお、実施形態の技術は、推薦の結果を画像で提供する構成のみならず、推薦の結果を音声で提供する構成も、推薦の結果を画像および音声の組み合わせで提供する構成も含んでいる。
【0090】
次に、実施形態にかかる推薦データベース241の設定手順について説明する。実施形態にかかるサーバ装置200は、次の
図13に示されるような一連の処理により、コンテンツデータベース242に基づいて推薦データベース241の設定を実行する。
【0091】
図13は、実施形態にかかるサーバ装置200が推薦データベース241の設定のために実行する一連の処理を示した例示的なフローチャートである。
【0092】
図13に示されるように、実施形態において、抽出処理部220は、推薦データベース241の設定にあたり、まず、S1301において、コンテンツデータベース242に設定されたコンテンツを対象として、主単語および従単語の抽出を実行する。このS1301の処理は、対象が第1コンテンツであるかコンテンツデータベース242に設定されたコンテンツであるかが異なるだけで、上記のS901(
図9)の処理と実質的に同様である。したがって、S1301の処理も、上記のS901の処理と同様、
図10に示されるような流れで実行される。
【0093】
そして、S1302において、管理処理部230は、S1301の処理により主単語および従単語が(少なくとも1つずつ)抽出されたか否かを判定する。
【0094】
S1302において、主単語および従単語が抽出されていないと判定された場合、
図6に示される一連の処理が終了する。しかしながら、S1302において、主単語および従単語が抽出されたと判定された場合、S1303に処理が進む。
【0095】
そして、S1303において、管理処理部230は、S1301の処理により抽出された主単語および従単語の関連性を示す関連性値の算出を実行する。このS1303の処理は、上記のS905(
図9)の処理と実質的に同様である。したがって、S1303の処理も、上記のS905の処理と同様、
図11に示されるような流れで実行される。
【0096】
そして、S1304において、推薦処理部240は、S1303の処理により算出された関連性値が所定の閾値以上か否か、より具体的には、対象のコンテンツから抽出された主単語および従単語により構成されるツリー構造内に、S1104(
図11参照)において算出された関連性値の合計が所定の閾値以上となる枝が存在するか否かを判定する。
【0097】
S1303において、関連性値の合計が閾値以上となる枝が存在しないと判定された場合、対象のコンテンツには目立った特徴が無く、対象のコンテンツを推薦データベース241に設定する必要が無いと言える。したがって、この場合、
図13に示される一連の処理が終了する。
【0098】
一方、S1303において、関連性値の合計が閾値以上となる枝が存在すると判定された場合、対象のコンテンツには一定以上の特徴があり、対象のコンテンツを、推薦すべき第2コンテンツの候補として推薦データベース241に設定する必要があると言える。したがって、この場合、S1304に処理が進む。
【0099】
そして、S1304において、推薦処理部240は、対象のコンテンツを、推薦すべき第2コンテンツの候補として推薦データベース241に設定する。そして、
図13に示される一連の処理が終了する。
【0100】
最後に、実施形態にかかるサーバ装置200のハードウェア構成について説明する。実施形態にかかるサーバ装置200は、たとえば次の
図14に示されるようなハードウェア構成を有するコンピュータ1400として構成される。
【0101】
図14は、実施形態にかかるサーバ装置200を構成するコンピュータ1400のハードウェア構成の例を示した例示的かつ模式的なブロック図である。
【0102】
図14に示されるように、コンピュータ1400は、プロセッサ1410と、メモリ1420と、ストレージ1430と、入出力インターフェース(I/F)1440と、通信インターフェース(I/F)1450と、を備えている。これらのハードウェアは、バス1460に接続されている。
【0103】
プロセッサ1410は、たとえばCPU(Central Processing Unit)として構成され、コンピュータ1400の各部の動作を統括的に制御する。
【0104】
メモリ1420は、たとえばROM(Read Only Memory)およびRAM(Random Access Memory)を含み、プロセッサ1410により実行されるプログラムなどの各種のデータの揮発的または不揮発的な記憶、およびプロセッサ1410がプログラムを実行するための作業領域の提供などを実現する。
【0105】
ストレージ1430は、たとえばHDD(Hard Disk Drive)またはSSD(Solid State Drive)を含み、各種のデータを不揮発的に記憶する。
【0106】
入出力インターフェース1440は、たとえばキーボードおよびマウスなどのような入力装置(不図示)からコンピュータ1400へのデータの入力と、たとえばコンピュータ1400からディスプレイおよびスピーカなどのような出力装置(不図示)へのデータの出力と、を制御する。
【0107】
通信インターフェース1450は、コンピュータ1400が他の装置と通信を実行することを可能にする。
【0108】
実施形態において、サーバ装置200が有する
図1に示される各構成は、プロセッサ1410がメモリ1420またはストレージ1430などに記憶された情報処理プログラムを実行した結果として、ハードウェアとソフトウェアとの協働による機能モジュールとして実現される。ただし、実施形態では、
図1に示される機能モジュール群のうち少なくとも一部が、専用のハードウェアのみによって実現されてもよい。
【0109】
なお、上述した実施形態にかかる情報処理プログラムは、必ずしもメモリ1420またはストレージ1430に予め記憶されている必要はない。たとえば、上述した実施形態にかかる情報処理プログラムは、フレキシブルディスク(FD)のような各種の磁気ディスク、またはDVD(Digital Versatile Disk)のような各種の光ディスクなどといった、コンピュータで読み取り可能な記録媒体にインストール可能な形式または実行可能な形式で記録されたコンピュータプログラムプロダクトとして提供されてもよい。
【0110】
また、上述した実施形態にかかる情報処理プログラムは、インターネットなどのネットワーク経由で提供または配布されてもよい。すなわち、上述した実施形態にかかる情報処理プログラムは、インターネットなどのネットワークに接続されたコンピュータ上に格納された状態で、ネットワーク経由でのダウンロードを受け付ける、といった形で提供されてもよい。
【0111】
なお、実施形態では、端末装置100も、サーバ装置200と同様に、
図14に示されるようなハードウェア構成を有してコンピュータ1400として構成されうる。したがって、実施形態の変形例として、サーバ装置200の機能モジュールの少なくとも一部が端末装置100に実装された構成も考えられる。したがって、実施形態の変形例として、端末装置100が本開示の「情報処理装置」に該当する例も考えられるし、端末装置100とサーバ装置200との組み合わせとしての情報処理システムが本開示の「情報処理装置」に該当する例も考えられる。
【0112】
以上説明したように、実施形態にかかるサーバ装置200は、抽出処理部220と、推薦処理部240と、を備えている。抽出処理部220は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツから、互いに関連する関連語として予め設定された第1単語(主単語)および第2単語(従単語)を抽出する。そして、推薦処理部240は、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、第1コンテンツに応じてユーザに推薦すべき第2コンテンツを決定する。
【0113】
上記のような構成によれば、関連性値に基づいて、第1コンテンツに含まれる単語間の関係性により発生する意味を考慮して、推薦すべき第2コンテンツをより適切に決定することができる。
【0114】
また、実施形態にかかるサーバ装置200は、管理処理部230をさらに備えている。管理処理部320は、たとえば管理データベース231を用いて、ユーザが過去に視聴したコンテンツに含まれる関連語に基づいて設定された関連性値を管理する。そして、管理処理部320は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツ内における関連語の出現形態に基づいて、管理処理部320が管理している関連性値の設定または更新を行う。このような構成によれば、ユーザが視聴したコンテンツの特徴を容易に管理することができる。
【0115】
ここで、実施形態では、上記の第2単語(従単語)として第3単語(第1の従単語)および第4単語(第2の従単語)が設定されている場合、第1単語および第2単語の関連性を示す関連性値は、3つの値を含む。当該3つの値とは、第1単語および第3単語の関連性を示す第1関連性値と、第3単語および第4単語の関連性を示す第2関連性値と、第1関連性値および第2関連性値の合計を示す第3関連性値と、である。このような構成によれば、3つの値に基づいて、第1単語および第2単語の関連性を詳細に把握することができる。
【0116】
また、実施形態において、推薦処理部240は、ユーザに提供されうる複数のコンテンツの各々に含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、複数のコンテンツから第2コンテンツの候補を抽出する。より具体的に、推薦処理部240は、コンテンツデータベース242に設定されたコンテンツから算出される関連性値に基づいて、推薦データベース241を設定する。このような構成によれば、関連性値に基づいて、第2コンテンツの候補を容易に抽出することができる。
【0117】
また、実施形態において、推薦処理部240は、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値と、第2コンテンツの候補に含まれる第1単語および第2単語の関連性を示す関連性値と、に基づいて、第2コンテンツの候補から、第1コンテンツに対応した第2コンテンツを決定する。このような構成によれば、2つの関係性値に基づいて、第2コンテンツを容易にかつ適切に決定することができる。
【0118】
以上、本開示の実施形態を説明したが、上述した実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上述した新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上述した実施形態およびその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0119】
200 サーバ装置(情報処理装置)
220 抽出処理部
230 管理処理部
240 推薦処理部
【手続補正書】
【提出日】2020-10-28
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ユーザが第1コンテンツを視聴した場合に、前記第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出する抽出処理部と、
前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す関連性値に基づいて、前記第1コンテンツに応じて前記ユーザに推薦すべき第2コンテンツを決定する推薦処理部と、
前記ユーザが過去に視聴したコンテンツに含まれる前記関連語に基づいて設定された前記関連性値を管理する管理処理部と、を備え、
前記管理処理部は、前記ユーザが前記第1コンテンツを視聴した場合に、前記第1コンテンツ内における前記関連語の出現形態に基づいて、前記管理処理部が管理している前記関連性値の設定または更新を行う、
情報処理装置。
【請求項2】
ユーザが第1コンテンツを視聴した場合に、前記第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出する抽出処理部と、
前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す関連性値に基づいて、前記第1コンテンツに応じて前記ユーザに推薦すべき第2コンテンツを決定する推薦処理部と、を備え、
前記第2単語として第3単語および第4単語が設定されている場合、前記第1単語および前記第2単語の関連性を示す前記関連性値は、前記第1単語および前記第3単語の関連性を示す第1関連性値と、前記第3単語および前記第4単語の関連性を示す第2関連性値と、前記第1関連性値および前記第2関連性値の合計を示す第3関連性値と、を含む、
情報処理装置。
【請求項3】
前記推薦処理部は、前記ユーザに提供されうる複数のコンテンツの各々に含まれる前記第1単語および前記第2単語の関連性を示す前記関連性値に基づいて、前記複数のコンテンツから前記第2コンテンツの候補を抽出し、当該候補から、前記第2コンテンツを決定する、
請求項1または2に記載の情報処理装置。
【請求項4】
前記推薦処理部は、前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す前記関連性値と、前記第2コンテンツの前記候補に含まれる前記第1単語および前記第2単語の関連性を示す前記関連性値と、に基づいて、前記第2コンテンツの前記候補から、前記第1コンテンツに対応した前記第2コンテンツを決定する、
請求項3に記載の情報処理装置。
【請求項5】
ユーザが第1コンテンツを視聴した場合に、前記第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出することと、
前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す関連性値に基づいて、前記第1コンテンツに応じて前記ユーザに推薦すべき第2コンテンツを決定することと、
前記ユーザが過去に視聴したコンテンツに含まれる前記関連語に基づいて設定された前記関連性値を管理することと、
前記ユーザが前記第1コンテンツを視聴した場合に、前記第1コンテンツ内における前記関連語の出現形態に基づいて、前記関連性値の設定または更新を行うこと、
をコンピュータに実行させるための、情報処理プログラム。
【請求項6】
ユーザが第1コンテンツを視聴した場合に、前記第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出することと、
前記第1コンテンツに含まれる前記第1単語および前記第2単語の関連性を示す関連性値に基づいて、前記第1コンテンツに応じて前記ユーザに推薦すべき第2コンテンツを決定すること、をコンピュータに実行させ、
前記第2単語として第3単語および第4単語が設定されている場合、前記第1単語および前記第2単語の関連性を示す前記関連性値は、前記第1単語および前記第3単語の関連性を示す第1関連性値と、前記第3単語および前記第4単語の関連性を示す第2関連性値と、前記第1関連性値および前記第2関連性値の合計を示す第3関連性値と、を含む、
情報処理プログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正の内容】
【0006】
本開示の一例としての情報処理装置は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出する抽出処理部と、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、第1コンテンツに応じてユーザに推薦すべき第2コンテンツを決定する推薦処理部と、ユーザが過去に視聴したコンテンツに含まれる関連語に基づいて設定された関連性値を管理する管理処理部と、を備え、管理処理部は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツ内における関連語の出現形態に基づいて、管理処理部が管理している関連性値の設定または更新を行う。
また、本開示の他の一例としての情報処理装置は、ユーザが第1コンテンツを視聴した場合に、第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出する抽出処理部と、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、第1コンテンツに応じてユーザに推薦すべき第2コンテンツを決定する推薦処理部と、を備え、第2単語として第3単語および第4単語が設定されている場合、第1単語および第2単語の関連性を示す関連性値は、第1単語および第3単語の関連性を示す第1関連性値と、第3単語および第4単語の関連性を示す第2関連性値と、第1関連性値および第2関連性値の合計を示す第3関連性値と、を含む。
また、本開示の一例としての情報処理プログラムは、ユーザが第1コンテンツを視聴した場合に、第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出することと、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、第1コンテンツに応じてユーザに推薦すべき第2コンテンツを決定することと、ユーザが過去に視聴したコンテンツに含まれる関連語に基づいて設定された関連性値を管理することと、ユーザが第1コンテンツを視聴した場合に、第1コンテンツ内における関連語の出現形態に基づいて、関連性値の設定または更新を行うこと、をコンピュータに実行させる。
また、本開示の他の一例としての情報処理プログラムは、ユーザが第1コンテンツを視聴した場合に、第1コンテンツから、互いに関連する関連語として予め設定された第1単語および第2単語を抽出することと、第1コンテンツに含まれる第1単語および第2単語の関連性を示す関連性値に基づいて、第1コンテンツに応じてユーザに推薦すべき第2コンテンツを決定すること、をコンピュータに実行させ、第2単語として第3単語および第4単語が設定されている場合、第1単語および第2単語の関連性を示す関連性値は、第1単語および第3単語の関連性を示す第1関連性値と、第3単語および第4単語の関連性を示す第2関連性値と、第1関連性値および第2関連性値の合計を示す第3関連性値と、を含む。