特許第6604608号(P6604608)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ Zホールディングス株式会社の特許一覧
特許6604608情報処理装置、情報処理方法および情報処理プログラム
<>
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000002
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000003
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000004
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000005
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000006
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000007
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000008
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000009
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000010
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000011
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000012
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000013
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000014
  • 特許6604608-情報処理装置、情報処理方法および情報処理プログラム 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6604608
(24)【登録日】2019年10月25日
(45)【発行日】2019年11月13日
(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20191031BHJP
【FI】
   G06Q50/10
【請求項の数】8
【全頁数】23
(21)【出願番号】特願2017-178333(P2017-178333)
(22)【出願日】2017年9月15日
(65)【公開番号】特開2019-53621(P2019-53621A)
(43)【公開日】2019年4月4日
【審査請求日】2017年10月18日
【前置審査】
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】Zホールディングス株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】塚本 浩司
(72)【発明者】
【氏名】隼田 正洋
【審査官】 上田 威
(56)【参考文献】
【文献】 特開2014−081882(JP,A)
【文献】 特開2014−164576(JP,A)
【文献】 特表2012−525654(JP,A)
【文献】 特開2017−091376(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 − 99/00
(57)【特許請求の範囲】
【請求項1】
コンテンツに付随する付随情報を取得して記憶部に記憶させる付随情報取得部と、
ネットワーク上で注目されるワードを示す注目ワード情報を取得して前記記憶部に記憶させる注目ワード情報取得部と、
前記コンテンツを利用するユーザのユーザ属性情報を取得して前記記憶部に記憶させるユーザ属性情報取得部と、
前記付随情報取得部によって前記記憶部に記憶された前記付随情報が前記注目ワード情報取得部によって前記記憶部に記憶された前記注目ワード情報に含まれる頻度と、前記ユーザ属性情報取得部によって前記記憶部に記憶された前記ユーザ属性情報に含まれる所定のユーザ属性情報であって、ユーザが利用するコンテンツに関する指数に対して関係性を有する所定のユーザ属性情報とを要素として回帰分析の統計的処理によるモデルを利用して、前記コンテンツに関する指標を予測する予測部と
を備えることを特徴とする情報処理装置。
【請求項2】
前記付随情報取得部は、
前記コンテンツに含まれるキーワードの情報を前記付随情報として取得し、
前記予測部は、
前記キーワードの情報が前記注目ワード情報に含まれる頻度に基づいて前記コンテンツに関する指標を予測する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記予測部は、
前記コンテンツに関する将来の人気を示す情報を前記コンテンツに関する指標として予測する
ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
ユーザの前記コンテンツに対する行動履歴を示す行動履歴情報を取得する履歴情報取得部
をさらに備え、
前記予測部は、
前記履歴情報取得部によって取得された前記行動履歴情報に基づいて前記コンテンツに関する指標を予測する
ことを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。
【請求項5】
前記コンテンツは電子書籍を含み、
前記履歴情報取得部は、
ユーザの前記電子書籍に対する行動履歴を前記行動履歴情報として取得する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記コンテンツは映像コンテンツを含み、
前記履歴情報取得部は、
ユーザの前記映像コンテンツに対する行動履歴を前記行動履歴情報として取得する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項7】
コンピュータが実行する情報処理方法であって、
コンテンツに付随する付随情報を取得して記憶部に記憶させる付随情報取得工程と、
ネットワーク上で注目されるワードを示す注目ワード情報を取得して前記記憶部に記憶させる注目ワード情報取得工程と、
前記コンテンツを利用するユーザのユーザ属性情報を取得して前記記憶部に記憶させるユーザ属性情報取得工程と、
前記付随情報取得工程によって前記記憶部に記憶された前記付随情報が前記注目ワード情報取得工程によって前記記憶部に記憶された前記注目ワード情報に含まれる頻度と、前記ユーザ属性情報取得工程によって前記記憶部に記憶された前記ユーザ属性情報に含まれる所定のユーザ属性情報であって、ユーザが利用するコンテンツに関する指数に対して関係性を有する所定のユーザ属性情報とを要素として回帰分析の統計的処理によるモデルを利用して、前記コンテンツに関する指標を予測する予測工程と
を含むことを特徴とする情報処理方法。
【請求項8】
コンテンツに付随する付随情報を取得して記憶部に記憶させる付随情報取得手順と、
ネットワーク上で注目されるワードを示す注目ワード情報を取得して前記記憶部に記憶させる注目ワード情報取得手順と、
前記コンテンツを利用するユーザのユーザ属性情報を取得して前記記憶部に記憶させるユーザ属性情報取得手順と、
前記付随情報取得手順によって前記記憶部に記憶された前記付随情報が前記注目ワード情報取得手順によって前記記憶部に記憶された前記注目ワード情報に含まれる頻度と、前記ユーザ属性情報取得手順によって前記記憶部に記憶された前記ユーザ属性情報に含まれる所定のユーザ属性情報であって、ユーザが利用するコンテンツに関する指数に対して関係性を有する所定のユーザ属性情報とを要素として回帰分析の統計的処理によるモデルを利用して、前記コンテンツに関する指標を予測する予測手順と
をコンピュータに実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
【背景技術】
【0002】
従来、映画について配給収入などの興行成績を予測する技術が提案されている(例えば、特許文献1参照)。かかる従来技術にあっては、未公開の映画が公開された場合の興行成績を、過去に公開された他の映画の実績データに基づいて予測している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−197233号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、上記したような映画の将来的な興行成績の予測は、映画のマーケティングなど行う上で重要となる。ここで、映画や電子書籍などを含むコンテンツに関して予測が望まれる指標としては、上記した映画の場合の興行成績の他に、電子書籍の場合の販売部数などがある。また、例えばユーザのコンテンツに対する満足度の程度を示す評価値についても、コンテンツに関する指標として予測が望まれる。
【0005】
しかしながら、上記したコンテンツに関する指標にあっては、従来技術のように過去の実績データからのみでは、精度よく予測することが難しいことがあった。このように、従来技術には、コンテンツに関する指標を精度よく予測するという点で改善の余地があった。
【0006】
本願は、上記に鑑みてなされたものであって、コンテンツに関する指標を精度よく予測することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る情報処理装置は、付随情報取得部と、注目ワード情報取得部と、予測部とを備える。前記付随情報取得部は、コンテンツに付随する付随情報を取得する。前記注目ワード情報取得部は、ネットワーク上で注目されるワードを示す注目ワード情報を取得する。前記予測部は、前記付随情報取得部によって取得された前記付随情報と前記注目ワード情報取得部によって取得された前記注目ワード情報とに基づいて、前記コンテンツに関する指標を予測する。
【発明の効果】
【0008】
実施形態の一態様によれば、コンテンツに関する指標を精度よく予測することができる。
【図面の簡単な説明】
【0009】
図1図1は、第1実施形態に係る情報処理の一例を示す説明図である。
図2図2は、情報処理システムの構成例を示す図である。
図3図3は、ユーザ端末装置の構成例を示す図である。
図4図4は、情報処理装置の構成例を示す図である。
図5図5は、モデル情報記憶部の一例を示す図である。
図6図6は、付随情報記憶部の一例を示す図である。
図7図7は、注目ワード情報記憶部の一例を示す図である。
図8図8は、情報処理装置における情報処理の流れを示すフローチャートである。
図9図9は、第2実施形態に係る情報処理装置の構成例を示す図である。
図10A図10Aは、行動履歴情報記憶部の一例を示す図(その1)である。
図10B図10Bは、行動履歴情報記憶部の一例を示す図(その2)である。
図11図11は、ユーザ属性情報記憶部の一例を示す図である。
図12図12は、第2実施形態に係る情報処理装置における情報処理の流れを示すフローチャートである。
図13図13は、プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。
【0011】
(第1実施形態)
〔1.情報処理〕
まず、第1実施形態に係る情報処理の一例について図1を参照して説明する。図1は、第1実施形態に係る情報処理の一例を示す説明図であり、図1に示す例では、情報処理装置70によって情報処理が実行される。
【0012】
情報処理装置70は、コンテンツ配信装置50および注目ワード検出装置60とインターネット等のネットワークを介して接続されており、これらの装置との間で各種情報の送受信を行うサーバである。各種情報には、後述するコンテンツの付随情報51や注目ワード情報61などが含まれており、情報処理装置70は、これらの情報等に基づき、例えばコンテンツに関する指標を予測する処理を行う。
【0013】
なお、上述した情報処理装置70、コンテンツ配信装置50および注目ワード検出装置60は、単体の処理装置である必要はなく、クラウドシステム等の複数の処理装置が協調して動作することで実現されてもよい。また、図1では、情報処理装置70、コンテンツ配信装置50および注目ワード検出装置60を別々の装置としたが、これは例示であって限定されるものではなく、例えば情報処理装置70がコンテンツ配信装置50や注目ワード検出装置60を備えるようにしてもよい。
【0014】
なお、コンテンツは、電子化された書籍である電子書籍、例えば映画やテレビ番組などの映像コンテンツ(動画コンテンツ)、ゲームなどを含むが、これらに限定されるものではなく、その他の種類のコンテンツを含んでもよい。また、コンテンツは、コンテンツ配信装置50によって例えばユーザ端末装置10(図2参照)等へ配信されて利用されるが、配信の手法はこれに限られない。
【0015】
コンテンツに関する指標とは、例えばコンテンツに関する将来の人気を示す情報であって、コンテンツが将来的にヒットする可能性、言い換えると、人気が出る可能性を示す指標である。従って、コンテンツに関する指標には、例えば予測されるコンテンツの「売上数」や「売上額」、ユーザのコンテンツに対する「評価値」などが含まれる。
【0016】
「売上数」は、例えばコンテンツの販売数やダウンロード数などを示す値である。「売上額」は、例えばコンテンツの総販売額、コンテンツが映画である場合の興行収入などを示す値である。「評価値」は、ユーザのコンテンツに対する満足度の程度を示す値であり、例えばユーザのレビュー情報に含まれる点数等である。
【0017】
なお、コンテンツに関する指標である、コンテンツに関する将来の人気を示す情報は、上記した売上数や売上額に限られない。すなわち、指標(将来の人気を示す情報)には、コンテンツに関連し、将来的にヒットする可能性がある作者やテーマなど、予測可能なものであれば、どのようなものであってもよい。
【0018】
ところで、上記したようなコンテンツに関する指標の予測は、コンテンツの今後のマーケティングなど行う上で重要となる。そこで、本実施形態に係る情報処理装置70にあっては、かかるコンテンツに関する指標を精度よく予測できるようにした。
【0019】
具体的に説明すると、情報処理装置70は、コンテンツに付随する付随情報51をコンテンツ配信装置50から取得する(ステップS1)。ここでは、理解の便宜のため、コンテンツが電子書籍である場合を例にとって、付随情報51について説明する。
【0020】
付随情報51は、例えば、書籍内の文章中で使用されるワード(以下「使用ワード」と記載する場合がある)、書籍の作者名などを示す情報である。なお、使用ワードの情報には、使用頻度の順位を示す情報が関連づけられてもよい。使用頻度の順位は、例えば、書籍内のワードの中から、形態素解析等の種々の技術を用いて、助詞や指示代名詞を除いたワードが抽出され、抽出されたワードの使用回数をカウントし、使用回数の多い順に並べることで、算出することができるが、これに限定されるものではない。
【0021】
なお、図1では、付随情報51として、使用ワードおよび作者名を示したが、これらはあくまでも例示であって限定されるものではない。すなわち、付随情報51は、使用ワード等に加えて、あるいは代えて、例えばコンテンツのカテゴリ、テーマ、コンテンツたる電子書籍の販売価格、頁数など、コンテンツに含まれる種々の情報を含んでいてもよい。なお、以下、付随情報51のうち、使用ワードや作者名、カテゴリ、テーマなどを「キーワード」という場合がある。
【0022】
次いで、情報処理装置70は、ネットワーク上で注目されるワードを示す注目ワード情報61を注目ワード検出装置60から取得する(ステップS2)。
【0023】
注目ワード検出装置60は、例えば検索サイトやニュースサイトなどにアクセスして、注目ワード情報61を検出する。なお、かかる注目ワード情報61の検出については、後述する。
【0024】
ここで、注目ワード情報61とは、例えばインターネットなどのネットワーク上で注目度が上昇しているようなワードを示す情報であり、言い換えれば、多くのユーザにとって現時点で興味や関心のあるワードを示す情報である。なお、図1の例で説明すると、注目ワード情報61には、「天気」、「人気俳優名:YY」、「ワードAA」、「作者名:XX」等の情報が含まれている。
【0025】
そして、情報処理装置70は、付随情報51と注目ワード情報61とに基づいて、コンテンツに関する指標を予測する(ステップS3)。かかる指標の予測は、指標を算出することで行われる。なお、指標の算出にあっては、例えば、回帰分析によって得られるモデルを用いることができるが、これについては後に説明する。
【0026】
図1の例では、コンテンツの付随情報51のうち「ワードAA」および「作者名XX」が、注目ワード情報61に入っていることを示している。すなわち、コンテンツに含まれる「ワードAA」などのキーワードが、多くのユーザにとって現時点で興味のあるワードを示す注目ワード情報61に含まれている。
【0027】
このように、コンテンツの付随情報51が、現時点でユーザが興味や関心のある注目ワード情報61に含まれる場合、かかるコンテンツは将来的にヒットする可能性が高いと推定される。そこで、図1のような場合に、本実施形態にあっては、コンテンツに関する指標が、将来的にヒットする可能性が比較的高いことを示す値となるようにする。
【0028】
このように、本実施形態にあっては、コンテンツの付随情報51と、現時点でユーザが興味や関心のある注目ワード情報61とを用いることで、コンテンツに関する指標を精度よく算出することができる。
【0029】
〔2.情報処理システム1〕
図2は、情報処理システム1の構成例を示す図である。図2に示すように、第1実施形態に係る情報処理システム1は、ユーザ端末装置10と、情報利用者端末装置40と、コンテンツ配信装置50と、注目ワード検出装置60と、情報処理装置70とを備える。
【0030】
これらの各種装置は、ネットワークNを介して無線または有線で互いに通信可能に接続される。ネットワークNは、例えば、LAN(Local Area Network)や、インターネットなどのWAN(Wide Area Network)である。
【0031】
ユーザ端末装置10は、図示しないユーザが利用する端末装置である。ユーザ端末装置10は、例えば、スマートフォンや、タブレット型端末や、PDA(Personal Digital Assistant)や、デスクトップ型PC(Personal Computer)や、ノート型PC等により実現される。なお、図2において、ユーザ端末装置10を複数台示したが、これに限られず、1台であってもよい。
【0032】
〔3.ユーザ端末装置10〕
図3は、ユーザ端末装置10の構成例を示す図である。図3に示すように、ユーザ端末装置10は、通信部11と、表示部12と、入力部13と、制御部20と、記憶部30とを有する。
【0033】
〔3.1.通信部11〕
通信部11は、ネットワークNと有線または無線で接続され、コンテンツ配信装置50や情報処理装置70等との間で情報の送受信を行うことができる。例えば、通信部11は、NIC(Network Interface Card)等によって実現される。
【0034】
〔3.2.表示部12〕
表示部12は、例えば電子書籍などのコンテンツを含む各種の情報等を表示する表示デバイスである。例えば、表示部12は、LCD(Liquid Crystal Display)や有機ELディスプレイである。また、表示部12は、タッチパネル式のディスプレイであってもよい。
【0035】
〔3.3.入力部13〕
入力部13は、ユーザから各種操作を受け付ける入力デバイスである。入力部13は、例えば、文字や数字などを入力するためのボタン等を有する。また、表示部12がタッチパネル式のディスプレイである場合、表示部12の一部が入力部13として機能する。
【0036】
〔3.4.記憶部30〕
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。かかる記憶部30には、各種プログラムや設定データ、受信したコンテンツの情報などが記憶される。
【0037】
〔3.5.制御部20〕
制御部20は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM、入出力ポートなどを有するマイクロコンピュータや各種の回路を含む。また、制御部20は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路等のハードウェアで構成されてもよい。制御部20は、送信部21と、受信部22と、処理部23とを備える。
【0038】
〔3.6.1.送信部21〕
送信部21は、例えば、入力部13を介して受け付けたユーザ操作に従って、コンテンツ配信装置50にコンテンツ(例えば、電子書籍や映像コンテンツ)の取得要求を送信する。
【0039】
また、例えば、送信部21は、コンテンツが表示部12に表示された状態で、ユーザのコンテンツに対する操作を受け付けた場合、かかる操作を示す信号をコンテンツ配信装置50へ送信する。なお、コンテンツに対する操作には、例えば、コンテンツが電子書籍の場合、ページを進める操作や特定の位置にマーカを付すマーカ操作など、種々の操作が含まれる。また、コンテンツが映像コンテンツである場合、映像を早送りする操作や巻き戻しする操作など、種々の操作がコンテンツに対する操作に含まれる。
【0040】
〔3.6.2.受信部22〕
受信部22は、例えば、コンテンツ配信装置50から配信されたコンテンツの情報を受信する。受信部22は、受信されたコンテンツの情報を記憶部30に記憶させることができる。
【0041】
〔3.6.3.処理部23〕
処理部23は、表示部12等を含め、ユーザ端末装置10全体を制御する。例えば、処理部23は、受信部22によって受信されたコンテンツの情報を記憶部30から読み出し、表示部12へ出力して表示させることができる。
【0042】
〔4.情報利用者端末装置40〕
図2の説明に戻ると、情報利用者端末装置40は、例えば、上記したコンテンツに関する指標などの情報を利用する者の端末装置である。従って、例えば情報処理装置70は、予測されたコンテンツに関する指標などの情報をネットワークNを介して情報処理装置70へ提供することができる。
【0043】
これにより、情報利用者は、かかる指標を利用して、コンテンツの販売戦略などマーケティングを効率よく行うことが可能となる。なお、情報利用者端末装置40は、例えば、スマートフォンや、タブレット型端末や、PDAや、デスクトップ型PCや、ノート型PC等により実現される。
【0044】
〔5.コンテンツ配信装置50〕
コンテンツ配信装置50は、例えば、ユーザ端末装置10からコンテンツの取得要求を受け付けた場合に、取得要求に対応する各種コンテンツを配信するサーバである。例えば、コンテンツ配信装置50が電子書籍配信装置である場合、コンテンツ配信装置50は、コンテンツとして、電子書籍の情報を配信する。また、例えば、コンテンツ配信装置50が映像コンテンツ配信装置である場合、コンテンツ配信装置50は、コンテンツとして、映画などの映像コンテンツの情報を配信する。
【0045】
また、コンテンツ配信装置50は、情報処理装置70からコンテンツの付随情報51(図1参照)の取得要求を受け付けた場合に、コンテンツの付随情報51を情報処理装置70へ送信することができる。
【0046】
〔6.注目ワード検出装置60〕
注目ワード検出装置60は、上述したように、注目ワード情報61(図1参照)を検出する処理を行うサーバである。例えば、注目ワード検出装置60は、図示しないウェブサーバなどから提供される検索サイトやニュースサイト、旅行サイト、ショッピングサイト、ブログサイトなど種々のサイトに所定期間ごとにアクセスし、各サイトの情報を収集する。
【0047】
そして、注目ワード検出装置60は、収集された情報を形態素解析等の種々の技術を用いて解析し、所定期間において注目されている注目ワードの検出(抽出)を行う。なお、注目ワードは、いわゆるバズワード等とも呼ばれる。
【0048】
〔7.情報処理装置70〕
図4は、情報処理装置70の構成例を示す図である。図4に示すように、情報処理装置70は、通信部71と、制御部80と、記憶部90とを有する。
【0049】
情報処理装置70は、上記したように、コンテンツの付随情報51と注目ワード情報61とを取得し、取得された付随情報51と注目ワード情報61とに基づいて、コンテンツに関する指標を予測することができる。以下、情報処理装置70の構成について具体的に説明する。
【0050】
〔7.1.通信部71〕
通信部71は、ネットワークNと有線または無線で接続され、コンテンツ配信装置50や注目ワード検出装置60などの各装置との間で情報の送受信を行う。例えば、通信部71は、NIC等によって実現される。
【0051】
〔7.2.記憶部90〕
記憶部90は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。本実施形態に係る記憶部90は、モデル情報記憶部91と、付随情報記憶部92と、注目ワード情報記憶部93とを備える。
【0052】
〔7.2.1.モデル情報記憶部91〕
モデル情報記憶部91は、上記したコンテンツに関する指標を算出するためのモデルの情報を記憶する。図5は、モデル情報記憶部91の一例を示す図である。例えば、モデル情報記憶部91には、「モデルID」、「モデル情報」といった項目が含まれる。
【0053】
「モデルID」は、モデルを識別するための識別情報を示す。「モデル情報」は、コンテンツに関する指標(以下、単に「指標」と記載する場合がある)の算出に用いられるモデルの情報を示す。図5に示す例では、モデルID「M01」は、モデル情報が「MM」であることを示している。かかる「MM」は、モデルを構成する具体的なモデルデータ(例えば後述するωに設定された重み値等)が含まれる。
【0054】
ここで、指標を算出するためのモデルの一例について説明する。例えば、モデルは、制御部80のモデル生成部81(図4参照)によって生成される。
【0055】
例えば、モデル生成部81は、所定の正解データを利用した回帰分析によってモデルを生成する。なお、以下では、コンテンツが電子書籍、指数が売上数である場合を例に挙げて説明する。
【0056】
モデル生成部81は、過去に販売された電子書籍について、実際の売上数(実績としての販売部数)を正解データ(目的変数)とし、かかる電子書籍の「販売価格」、「頁数」、「カテゴリ」、「テーマ」、「作者名」などを要素(説明変数)として回帰分析を行うことができる。
【0057】
また、モデル生成部81は、過去に販売された電子書籍の付随情報をコンテンツ配信装置50から取得し、かかる電子書籍が販売された期間における注目ワード情報を注目ワード検出装置60から取得してもよい。
【0058】
そして、モデル生成部81は、付随情報のうちのキーワードの情報と注目ワード情報とに基づいて、キーワードの情報が注目ワード情報に含まれる頻度(以下、「キーワード頻度」と記載する場合がある)を算出する。
【0059】
モデル生成部81は、算出されたキーワード頻度を要素として回帰分析を行うことができる。すなわち、モデル生成部81は、電子書籍が販売された期間にユーザに注目されたワードの中に、電子書籍に含まれるキーワードがどの程度含まれていたかを示すキーワード頻度を要素とすることができる。
【0060】
具体的には、モデル生成部81は、例えば下記式(1)のような回帰式を生成する。
【0061】
Y = ω・x + ω・x + ω・x + ・・・ + ω・x ・・・ (1)
【0062】
上記式(1)において、例えば、「Y」には、実際の電子書籍の売上数などの正解データが入力される。また、「x〜x」には、例えば、販売された電子書籍の販売価格、頁数、キーワード頻度等の各々を所定の基準で数値化した変数(例えば、販売価格や頁数、キーワード頻度等を、相互に比較できるように数値化した情報)が、それぞれ入力される。なお、式(1)中のnは任意の数を示す。
【0063】
上記式(1)を用いて学習を進める(すなわち、充分な数のサンプルを回帰的に計算する)ことで、モデル生成部81は、各項目に対応する「ω」の値を最適化する。すなわち、モデル生成部81は、例えば、電子書籍について将来の売上数たる指標を算出するにあたり、例えば「キーワード頻度」の高低等の要素が指標に対してどのくらいの影響を与えるか、といった重み値「ω」の値を求める。モデル生成部81は、求めた重み値を設定してモデルを生成する。
【0064】
下記式(2)は、コンテンツに関する指標を算出するモデルを示す。下記式(2)では、式(1)を回帰分析することにより求められた具体的な数値が各重み値ωに代入される。
【0065】
コンテンツに関する指標 = ω・x + ω・x + ω・x + ・・・ + ω・x ・・・ (2)
【0066】
コンテンツに関する指標は、制御部80の予測部84(図4参照)によって算出される。例えば、予測部84は、生成されたモデルに、予測したい電子書籍の情報を「x」〜「x」に入力することで、当該電子書籍に関する指標(ここでは売上数)を算出することができる。なお、算出される指標は、電子書籍の売上数そのものであっても、売上数を示すスコアなどであってもよい。
【0067】
なお、上記で説明したモデルは一例であり、モデル生成部81が生成するモデルは上記の例に限られない。すなわち、モデル生成部81は、キーワード頻度などを入力とし、コンテンツに関する指標を示す値を出力とするモデルであれば、既知の手法を組み合わせることによって、上記例とは異なるモデルを適宜生成してもよい。例えば、上記の例では、回帰分析によってモデルを生成する例を示したが、モデル生成部81は、他の統計的処理によりモデルを生成してもよい。
【0068】
なお、上記では、具体的にキーワード頻度や販売価格などを要素としたが、これらはあくまでも例示であって限定されるものではない。すなわち、上記したキーワード頻度や販売価格などの情報のうち、任意の情報を要素としてもよく、さらには、その他の種類の情報を要素としてもよい。例えば、モデル生成部81は、ユーザによってコンテンツにタグ付けされた情報(例えば電子書籍の内容に関する情報)や、レビュー情報を要素としてもよい。
【0069】
また、電子書籍が漫画などの画像情報を含む場合、モデル生成部81は、画像情報を解析して、線の交わりや角、濃淡、色調などに基づいて抽出されたオブジェクトを「画像の特徴物」とし、かかる画像の特徴物を要素としてもよい。なお、かかる画像の特徴物は、必ずしも画像解析に基づいて抽出されることを要さず、例えば人為的に画像の特徴物が判断されて、要素とするようにしてもよい。
【0070】
〔7.2.2.付随情報記憶部92〕
付随情報記憶部92は、上記した付随情報を記憶する。図6は、付随情報記憶部92の一例を示す図である。例えば、付随情報記憶部92には、「付随情報ID」、「情報種類」、「情報内容」といった項目が含まれる。
【0071】
「付随情報ID」は、付随情報を識別するための識別情報を示す。「情報種類」は、付随情報に含まれる情報の種類を示す。「情報内容」は、付随情報に含まれる情報の内容を示す。
【0072】
図6に示す例では、付随情報ID「A1−01」は、情報種類が「使用ワード」であり、情報内容が「ワードAA」であることを示している。情報内容には、ワードAAの使用頻度の順位を示す情報(ここでは「使用頻度1位」)が関連づけられてもよい。
【0073】
なお、上記では、使用ワードの使用頻度を順位としたが、これに限られず、使用ワードが使用された回数や、電子書籍に含まれる全ワードの数のうちに、使用ワード(ここではワードAA)が占める割合等の情報を使用頻度の情報としてもよい。
【0074】
また、図6に示すように、付随情報は、作者、カテゴリ、テーマ、販売価格、頁数などの情報を含むが、これらに限定されるものではなく、例えば、出版社、発売日などその他の種類の情報を含んでもよい。
【0075】
なお、図6では、コンテンツが電子書籍である場合の付随情報を示したが、コンテンツが映画などの映像コンテンツである場合、情報の種類が異なるようにしてもよい。すなわち、映像コンテンツの付随情報としては、出演者、セリフ、監督、監修、カテゴリ、テーマ、上映時間など種々の情報が含まれてよい。なお、上記した映像コンテンツの付随情報は、あくまでも例示であって限定されるものではない。
【0076】
〔7.2.3.注目ワード情報記憶部93〕
注目ワード情報記憶部93は、上記した注目ワード情報を記憶する。図7は、注目ワード情報記憶部93の一例を示す図である。例えば、注目ワード情報記憶部93には、「注目ワード情報ID」、「情報元」、「情報内容」といった項目が含まれる。
【0077】
「注目ワード情報ID」は、注目ワード情報を識別するための識別情報を示す。「情報元」は、注目ワード情報が検出されたサイトなどの情報を示す。「情報内容」は、注目ワード情報に含まれる情報の内容を示す。
【0078】
図7に示す例では、注目ワード情報ID「B1−01」は、情報元が「検索サイト」であり、情報内容が「天気」であることを示している。情報内容には、注目ワードたる「天気」の検索頻度の順位を示す情報(ここでは「検索頻度1位」)が関連づけられてもよい。
【0079】
なお、上記では、注目ワードの検索頻度を順位としたが、これに限られず、注目ワードが検索された回数や、検索された全ワードの数のうちに、注目ワードたる「天気」が占める割合等の情報を検索頻度の情報としてもよい。
【0080】
また、図7に示す例では、注目ワード情報には、「人気俳優名:YY」、「ワードAA」、「人気旅行先名:ワードBB」、「人気商品名:ワードCC」、「作者名:XX」を含んでいる。このように、コンテンツの付随情報に含まれる「ワードAA」、「ワードBB」、「ワードCC」、「作者名:XX」が、注目ワード情報にも含まれるような場合、上記したコンテンツに関する指標は、ヒットする可能性が高いことを示す値が算出されることとしてもよい。
【0081】
〔7.3.制御部80〕
図4の説明に戻ると、制御部80は、コントローラであり、例えば、CPU、ROM、RAM、入出力ポートなどを有するマイクロコンピュータや各種の回路を含む。かかる制御部80は、例えば、ASICやFPGA等のハードウェアで構成されてもよい。
【0082】
制御部80は、モデル生成部81と、付随情報取得部82と、注目ワード情報取得部83と、予測部84と、提供部85とを備える。
【0083】
〔7.3.1.モデル生成部81〕
モデル生成部81は、上記したモデルを生成する。例えば、モデル生成部81は、上記式(1)で示す回帰式を生成し、生成された回帰式を回帰分析することによって、上記式(2)で示すコンテンツに関する指標を算出するためのモデルを生成する。そして、モデル生成部81は、生成されたモデルの情報を、モデル情報記憶部91に記憶させる。
【0084】
〔7.3.2.付随情報取得部82〕
付随情報取得部82は、コンテンツに付随する付随情報をコンテンツ配信装置50から取得する。例えば、付随情報取得部82は、コンテンツに含まれる使用ワード、コンテンツが電子書籍の場合の作者名、コンテンツが映画など映像コンテンツである場合の出演者名や監督名等の情報を付随情報に含まれるキーワードとして取得することができる。
【0085】
また、例えば、付随情報取得部82は、コンテンツが電子書籍の場合の販売価格や頁数、コンテンツが映画などの映像コンテンツである場合の上映時間などの情報を付随情報として取得することができる。そして、付随情報取得部82は、取得された各種の付随情報を、付随情報記憶部92に記憶させる。
【0086】
〔7.3.3.注目ワード情報取得部83〕
注目ワード情報取得部83は、ネットワーク上で注目されるワードを示す注目ワード情報を、注目ワード検出装置60から取得する。そして、注目ワード情報取得部83は、取得された注目ワード情報を注目ワード情報記憶部93に記憶させる。
【0087】
〔7.3.4.予測部84〕
予測部84は、付随情報と注目ワード情報とに基づいて、コンテンツに関する指標を予測する。例えば、予測部84は、コンテンツに関する将来の人気を示す情報をコンテンツに関する指標として予測する。詳しくは、予測部84は、付随情報を付随情報記憶部92から読み出すとともに、注目ワード情報を注目ワード情報記憶部93から読み出す。また、予測部84は、付随情報に含まれるキーワードの情報が注目ワード情報に含まれる頻度、すなわちキーワード頻度を算出する。
【0088】
そして、予測部84は、モデルの情報をモデル情報記憶部91から読み出し、読み出されたモデル(式(2)参照)の「x」〜「x」に、キーワード頻度や付随情報に含まれる販売価格などの情報を入力することで、当該電子書籍に関する指標を算出することができる。
【0089】
〔7.3.5.提供部85〕
提供部85は、予測部84によって予測(算出)されたコンテンツに関する指標を示す情報を、情報利用者端末装置40に対して提供する。これにより、図示は省略するが、情報利用者端末装置40の表示部には、コンテンツに関する指標の情報が表示され、情報利用者は、かかる指標を確認し利用することが可能となる。
【0090】
〔8.情報処理装置70の処理フロー〕
次に、情報処理装置70における情報処理の手順について説明する。図8は、情報処理装置70における情報処理の流れを示すフローチャートである。
【0091】
図8に示すように、情報処理装置70の制御部80は、モデルを生成する(ステップS10)。次いで、制御部80は、コンテンツの付随情報を取得するとともに(ステップS11)、注目ワード情報を取得する(ステップS12)。
【0092】
なお、図8に示す例では、制御部80は、コンテンツの付随情報を取得した後に、注目ワード情報を取得するようにしたが、これに限られず、注目ワード情報、付随情報の順で取得してもよいし、注目ワード情報と付随情報とを同時に取得してもよい。
【0093】
次いで、制御部80は、生成されたモデル、注目ワード情報や付随情報に基づいて、コンテンツに関する指標を予測(算出)する(ステップS13)。そして、制御部80は、予測されたコンテンツに関する指標の情報を情報利用者端末装置40へ提供する(ステップS14)。
【0094】
(第2実施形態)
〔9.第2実施形態に係る情報処理装置70〕
次に、第2実施形態について説明する。ユーザは、コンテンツを利用する際、かかるコンテンツが面白かったり興味があったりする場合のコンテンツに対する行動と、面白くなかったり興味がなかったりする場合の行動とが異なることがある。
【0095】
コンテンツに対する行動とは、例えば、コンテンツが映画などの映像コンテンツである場合、映像コンテンツを巻き戻す操作や早送りする操作などであるが、これらに限定されるものではない。
【0096】
すなわち、例えば、映像コンテンツを巻き戻す操作が行われた場合、ユーザは映像コンテンツを面白いと感じてもう一度見ることを所望したと推定することができる。従って、このような映像コンテンツは、将来的にヒットする可能性が高いともいえる。
【0097】
一方、例えば、映像コンテンツを早送りする操作が行われた場合、ユーザは映像コンテンツを面白くないと感じて映像シーンを飛ばして見ることを所望したと推定することができる。従って、このような映像コンテンツは、将来的にヒットする可能性が低いともいえる。
【0098】
そこで、第2実施形態にあっては、コンテンツが将来的にヒットする可能性を示す、コンテンツに関する指標を、ユーザのコンテンツに対する行動履歴の情報を用いて予測するようにした。これにより、第2実施形態にあっては、コンテンツに関する指標をより精度よく予測することができる。なお、上記した巻き戻す操作の場合ユーザは面白いと感じているなどの説明は、一例であって限定されるものではない。
【0099】
また、第2実施形態にあっては、ユーザの属性情報を用いることで、コンテンツに関する指標をより一層精度よく予測することができるようにした。すなわち、ユーザの属性情報の一つに年齢の情報がある。そこで、例えば、コンテンツは、年齢の若い若年層のユーザ割合が多い方が将来的なヒットにつながり易い傾向がある場合、ユーザの年齢の情報(ユーザの属性情報の一例)を用いることで、コンテンツに関する指標をより一層精度よく予測することが可能となる。なお、上記したヒットにつながり易い傾向は、一例であって限定されるものではない。
【0100】
図9は、第2実施形態に係る情報処理装置70の構成例を示す図である。なお、以下においては、上記した第1実施形態と共通の構成については、同一の符号を付して説明を省略する。
【0101】
図9に示すように、第2実施形態に係る情報処理装置70の制御部80は、履歴情報取得部86と、ユーザ属性情報取得部87とをさらに備える。また、記憶部90は、行動履歴情報記憶部94と、ユーザ属性情報記憶部95とをさらに備える。
【0102】
〔9.1.1.行動履歴情報記憶部94〕
行動履歴情報記憶部94は、ユーザのコンテンツに対する行動履歴情報を記憶する。ここで、ユーザの行動履歴は、コンテンツの種類によって異なる。そこで、コンテンツが電子書籍である場合の行動履歴情報記憶部94の一例を図10Aに示し、コンテンツが映像コンテンツである場合の行動履歴情報記憶部94の一例を図10Bに示した。
【0103】
まず、図10Aについて説明すると、例えば、行動履歴情報記憶部94には、「行動履歴情報ID」、「情報種類」、「情報内容」といった項目が含まれる。「行動履歴情報ID」は、行動履歴情報を識別するための識別情報を示す。「情報種類」は、行動履歴情報に含まれる情報の種類を示す。「情報内容」は、行動履歴情報に含まれる情報の内容を示す。
【0104】
図10Aに示す例では、行動履歴情報ID「C1−01」は、情報種類が「マーカ数」であり、情報内容が「20箇所」であることを示している。なお、電子書籍にあっては、ユーザは書籍内の特定の位置にマーカを付すマーカ操作を行うことができ、ここではそのマーカの数が20箇所あることを示している。
【0105】
例えば、マーカ数が多いほど、ユーザは電子書籍を面白いと感じてマーカ操作を多く行ったと推定することができ、よって電子書籍が将来的にヒットする可能性は高いともいえる。なお、本明細書において、ユーザが面白いまたは面白くないと感じていると推定される行動の説明は、あくまでも例であって限定されるものではない。
【0106】
行動履歴情報ID「C2−01」は、情報種類が「マーカ位置」であり、情報内容が「15頁3行目、18頁6行目、・・・」であることを示している。例えば、マーカ位置が書籍の前半部分に集まっているような場合、ユーザは電子書籍の前半部分を面白いと感じ、後半部分を面白くないと感じたと推定することができ、よって電子書籍が将来的にヒットする可能性は低いともいえる。
【0107】
行動履歴情報ID「C3−01」は、情報種類が「マーカワード」であり、情報内容が「ワードAA、ワードFF、・・・」であることを示している。例えば、マーカが付されたワードAAが、上述した注目ワード情報61に含まれるような場合、ユーザが面白いと感じたワードとネットワーク上で注目された注目ワードとが一致することから、電子書籍が将来的にヒットする可能性は高いともいえる。
【0108】
行動履歴情報ID「C4−01」は、情報種類が「しおり位置」であり、情報内容が「120頁目」であることを示している。なお、電子書籍にあっては、ユーザは書籍内の特定の位置にしおりを置く操作を行うことができ、ここではそのしおりを置いた位置が120頁目であることを示している。
【0109】
また、行動履歴情報ID「C5−01」は、情報種類が「読書停止位置」(すなわちユーザが読書を途中で止めた位置)であり、情報内容が「150頁目」であることを示している。例えば、上記した「しおり位置」や「読書停止位置」が、所定期間同じ位置にあるような場合、ユーザは途中で面白くないと感じて読書を止めたと推定することができ、よって電子書籍が将来的にヒットする可能性は低いともいえる。
【0110】
行動履歴情報ID「C6−01」は、情報種類が「読書スピード」であり、情報内容が「1.5頁/分」であることを示している。例えば、読書スピードが速いほど、ユーザは電子書籍を面白いと感じて読み進めていると推定でき、よって電子書籍が将来的にヒットする可能性は高いともいえる。
【0111】
行動履歴情報ID「C7−01」は、情報種類が「読書頻度」であり、情報内容が「2回/日」であることを示している。例えば、読書頻度が多いほど、ユーザは電子書籍を面白いと感じていると推定でき、よって電子書籍が将来的にヒットする可能性は高いともいえる。
【0112】
行動履歴情報ID「C8−01」は、情報種類が「1回の読書量」であり、情報内容が「20頁」であることを示している。例えば、1回の読書量が多いほど、ユーザは電子書籍を面白いと感じて読み進めていると推定でき、よって電子書籍が将来的にヒットする可能性は高いともいえる。
【0113】
このように、ユーザの電子書籍に対する行動履歴を分析することで、電子書籍が将来的にヒットする可能性、言い換えると、電子書籍に関する指標を予測することが可能となる。
【0114】
次に、図10Bを参照し、コンテンツが映像コンテンツである場合の行動履歴情報について説明する。
【0115】
図10Bに示す例では、行動履歴情報ID「D1−01」は、情報種類が「ストップ位置」であり、情報内容が「40分、52分、・・・」(ここでは映像開始から40分、52分、・・・)であることを示している。仮に、ユーザは面白いと思ったときに映像をストップさせる操作を行うとした場合、例えばストップ位置が映像コンテンツの前半部分に集まっているような場合、ユーザは映像コンテンツの前半部分を面白いと感じ、後半部分を面白くないと感じたと推定することができ、よって映像コンテンツが将来的にヒットする可能性は低いともいえる。
【0116】
行動履歴情報ID「D2−01」は、情報種類が「ストップ頻度」であり、情報内容が「5回」であることを示している。例えば、ストップ頻度が多いほど、ユーザは映像コンテンツを面白いと感じてストップ操作を多く行ったと推定することができ、よって映像コンテンツが将来的にヒットする可能性は高いともいえる。
【0117】
行動履歴情報ID「D3−01」は、情報種類が「早送り位置」であり、情報内容が「20分」であることを示している。例えば、ユーザは映像開始から20分付近の映像シーンを面白くないと感じて早送り操作を行ったと推定でき、よって映像コンテンツは将来的にヒットする可能性が低いともいえる。
【0118】
行動履歴情報ID「D4−01」は、情報種類が「巻き戻し位置」であり、情報内容が「35分、60分、・・・」であることを示している。例えば、ユーザは映像開始から35分、60分付近の映像シーンを面白いと感じて巻き戻し操作を行ったと推定でき、よって映像コンテンツは将来的にヒットする可能性が高いともいえる。
【0119】
行動履歴情報ID「D5−01」は、情報種類が「視聴頻度」であり、情報内容が「2回/日」であることを示している。例えば、視聴頻度が多いほど、ユーザは映像コンテンツを面白いと感じていると推定でき、よって映像コンテンツが将来的にヒットする可能性は高いともいえる。
【0120】
行動履歴情報ID「D6−01」は、情報種類が「1回の視聴時間」であり、情報内容が「30分」であることを示している。例えば、1回の視聴時間が長いほど、ユーザは映像コンテンツを面白いと感じて視聴し続けていると推定でき、よって映像コンテンツが将来的にヒットする可能性は高いともいえる。
【0121】
行動履歴情報ID「D7−01」は、情報種類が「視聴画面」であり、情報内容が「全画面表示」であることを示している。なお、映像コンテンツのユーザ端末装置10(図3参照)における表示サイズは、「標準画面表示」と、標準画面表示よりも大きい「全画面表示」とで切り替えることができ、ここではユーザが全画面表示を選択したことを示している。従って、例えば、表示サイズが大きいほど、ユーザは映像コンテンツを面白いと感じていると推定でき、よって映像コンテンツが将来的にヒットする可能性は高いともいえる。
【0122】
行動履歴情報ID「D8−01」は、情報種類が「音量」であり、情報内容が「大」であることを示している。例えば、音量が大きいほど、ユーザは映像コンテンツを面白いと感じて視聴していると推定でき、よって映像コンテンツが将来的にヒットする可能性は高いともいえる。
【0123】
行動履歴情報ID「D9−01」は、情報種類が「復帰までの時間」であり、情報内容が「60分」であることを示している。なお、映像コンテンツを表示するユーザ端末装置10にあっては、例えば、ユーザの停止操作により映像を停止し、その後ユーザの復帰操作により、停止していた映像を復帰(再開)させる。従って、例えば、復帰までの時間が短いほど、ユーザは映像コンテンツを面白いと感じていると推定でき、よって映像コンテンツが将来的にヒットする可能性は高いともいえる。
【0124】
このように、ユーザの映像コンテンツに対する行動履歴を分析することで、映像コンテンツが将来的にヒットする可能性、言い換えると、映像コンテンツに関する指標を予測することが可能となる。
【0125】
〔9.1.2.ユーザ属性情報記憶部95〕
図9の説明に戻ると、ユーザ属性情報記憶部95は、コンテンツを利用するユーザの属性情報を記憶する。図11は、ユーザ属性情報記憶部95の一例を示す図である。例えば、ユーザ属性情報記憶部95には、「ユーザID」、「年齢」、「性別」、「居住地」といった項目が含まれる。
【0126】
「ユーザID」は、ユーザを識別するための識別情報を示す。「年齢」はユーザの年齢の情報を示し、「性別」はユーザの性別の情報を示し、「居住地」はユーザの居住地の情報を示す。
【0127】
図11に示す例では、ユーザ情報ID「U001」は、年齢が「21」であり、性別が「女」であり、居住地が「東京都」であることを示している。また、ユーザ情報ID「U002」は、年齢が「62」であり、性別が「男」であり、居住地が「大阪府」であることを示している。
【0128】
ここで、例えば仮に、コンテンツは、若年層の女性で東京在住のユーザの割合が多い方が将来的なヒットにつながり易い傾向があるとした場合、ユーザ情報ID「U001」のようなユーザ属性情報を有するユーザの割合を求めることで、コンテンツが将来的にヒットする可能性、言い換えると、コンテンツに関する指標を予測することが可能となる。
【0129】
〔9.2.1.第2実施形態に係るモデル生成部81〕
図9の説明に戻ると、第2実施形態に係るモデル生成部81は、第1実施形態のモデルに対し、過去に配信されたコンテンツに関する行動履歴情報やユーザ属性情報をさらに用いて、上記式(1)で示す回帰式を生成する。そして、モデル生成部81は、生成された回帰式を回帰分析することによって、上記式(2)で示すコンテンツに関する指標を算出するためのモデルを生成する。すなわち、第2実施形態では、行動履歴情報やユーザ属性情報もモデルの要素とするようにしてもよい。
【0130】
〔9.2.2.履歴情報取得部86〕
履歴情報取得部86は、ユーザのコンテンツに対する行動履歴情報をコンテンツ配信装置50から取得する。なお、履歴情報取得部86は、行動履歴情報をユーザ端末装置10から取得してもよい。そして、履歴情報取得部86は、取得された行動履歴情報を行動履歴情報記憶部94に記憶させる。
【0131】
〔9.2.3.ユーザ属性情報取得部87〕
ユーザ属性情報取得部87、ユーザ属性情報をコンテンツ配信装置50から取得する。なお、ユーザ属性情報取得部87は、ユーザ属性情報をユーザ端末装置10から取得してもよい。そして、ユーザ属性情報取得部87は、取得されたユーザ属性情報をユーザ属性情報記憶部95に記憶させる。
【0132】
〔9.2.4.予測部84〕
予測部84は、付随情報、注目ワード情報、行動履歴情報およびユーザ属性情報に基づいて、コンテンツに関する指標を予測する。例えば、予測部84は、付随情報を付随情報記憶部92から、注目ワード情報を注目ワード情報記憶部93から読み出す。また、予測部84は、行動履歴情報を行動履歴情報記憶部94から、ユーザ属性情報をユーザ属性情報記憶部95から読み出す。
【0133】
そして、予測部84は、モデルの情報をモデル情報記憶部91から読み出し、読み出されたモデル(式(2)参照)の「x」〜「x」に、行動履歴情報やユーザ属性情報などの情報を入力することで、予測したいコンテンツに関する指標を算出することができる。
【0134】
このように、第2実施形態に係る予測部84は、行動履歴情報およびユーザ属性情報を用いることで、コンテンツに関する指標をより精度よく算出することができる。
【0135】
〔10.第2実施形態に係る情報処理装置70の処理フロー〕
次に、第2実施形態に係る情報処理装置70における情報処理の手順について説明する。図12は、第2実施形態に係る情報処理装置70における情報処理の流れを示すフローチャートである。
【0136】
図12に示すように、情報処理装置70の制御部80は、上記したステップS10〜S12までの処理を行った後、ユーザのコンテンツに対する行動履歴情報を取得する(ステップS12a)。次いで、制御部80は、コンテンツを利用するユーザのユーザ属性情報を取得する(ステップS12b)。なお、図12に示す各情報の取得順は、あくまでも例示であって限定されるものではない。
【0137】
次いで、制御部80は、生成されたモデル、注目ワード情報や付随情報、行動履歴情報、ユーザ属性情報に基づいて、コンテンツに関する指標を予測(算出)する(ステップS13)。そして、制御部80は、ステップS14に進んで、予測されたコンテンツに関する指標の情報を情報利用者端末装置40へ提供する。
【0138】
なお、上記では、行動履歴情報およびユーザ属性情報を用いてコンテンツに関する指標を予測したが、これに限定されるものではなく、いずれか一方の情報を用いてもよい。
【0139】
〔11.効果〕
情報処理装置70は、付随情報取得部82と、注目ワード情報取得部83と、予測部84とを備える。付随情報取得部82は、コンテンツに付随する付随情報を取得する。注目ワード情報取得部83は、ネットワーク上で注目されるワードを示す注目ワード情報を取得する。予測部84は、付随情報取得部82によって取得された付随情報と注目ワード情報取得部83によって取得された注目ワード情報とに基づいて、コンテンツに関する指標を予測する。
【0140】
これにより、コンテンツの付随情報と、例えば現時点でユーザが興味や関心のある注目ワード情報とを用いることで、コンテンツに関する指標を精度よく算出することができる。
【0141】
また、付随情報取得部82は、コンテンツに含まれるキーワードの情報を付随情報として取得し、予測部84は、キーワードの情報が注目ワード情報に含まれる頻度(キーワード頻度)に基づいてコンテンツに関する指標を予測する。これにより、コンテンツに関する指標をより精度よく算出することができる。
【0142】
また、予測部84は、コンテンツに関する将来の人気を示す情報をコンテンツに関する指標として予測する。これにより、例えば、コンテンツの販売戦略などマーケティングに用いられる、コンテンツの売上数などの種々の情報を、コンテンツに関する指標として予測(算出)することが可能となる。
【0143】
また、情報処理装置70は、ユーザのコンテンツに対する行動履歴を示す行動履歴情報を取得する履歴情報取得部86をさらに備える。予測部84は、履歴情報取得部86によって取得された行動履歴情報に基づいてコンテンツに関する指標を予測する。これにより、コンテンツに関する指標をより精度よく予測することができる。
【0144】
また、コンテンツは電子書籍を含み、履歴情報取得部86は、ユーザの電子書籍に対する行動履歴を行動履歴情報として取得する。これにより、コンテンツが電子書籍の場合であっても、コンテンツたる電子書籍に関する指標をより精度よく予測することができる。
【0145】
また、コンテンツは映像コンテンツを含み、履歴情報取得部86は、ユーザの映像コンテンツに対する行動履歴を行動履歴情報として取得する。これにより、コンテンツが映画名などの映像コンテンツの場合であっても、コンテンツたる映像コンテンツに関する指標をより精度よく予測することができる。
【0146】
また、情報処理装置70は、コンテンツを利用するユーザのユーザ属性情報を取得するユーザ属性情報取得部87をさらに備える。予測部84は、ユーザ属性情報取得部87によって取得されたユーザ属性情報に基づいてコンテンツに関する指標を予測する。これにより、コンテンツに関する指標をより精度よく予測することができる。
【0147】
〔12.ハードウェア構成〕
上述した実施形態における情報処理装置70は、例えば図13に示すような構成のコンピュータ100がプログラムを実行することによって実現される。
【0148】
図13は、プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。コンピュータ100は、CPU(Central Processing Unit)101、RAM(Random Access Memory)102、ROM(Read Only Memory)103、HDD(Hard Disk Drive)104、通信インターフェイス(I/F)105、入出力インターフェイス(I/F)106、およびメディアインターフェイス(I/F)107を備える。
【0149】
CPU101は、ROM103またはHDD104に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM103は、コンピュータ100の起動時にCPU101によって実行されるブートプログラムや、コンピュータ100のハードウェアに依存するプログラム等を格納する。
【0150】
HDD104は、CPU101によって実行されるプログラムによって使用されるデータ等を格納する。通信インターフェイス105は、通信部71に対応し、ネットワークNを介して他の機器からデータを受信してCPU101へ送り、CPU101が生成したデータを、ネットワークNを介して他の機器へ送信する。
【0151】
CPU101は、入出力インターフェイス106を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU101は、入出力インターフェイス106を介して、入力装置からデータを取得する。また、CPU101は、生成したデータを、入出力インターフェイス106を介して出力装置へ出力する。
【0152】
メディアインターフェイス107は、記録媒体108に格納されたプログラムまたはデータを読み取り、RAM102を介してCPU101に提供する。CPU101は、当該プログラムを、メディアインターフェイス107を介して記録媒体108からRAM102上にロードし、ロードしたプログラムを実行する。記録媒体108は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0153】
コンピュータ100が情報処理装置70として機能する場合、コンピュータ100のCPU101は、RAM102上にロードされたプログラムを実行することにより、図4および図9に示すモデル生成部81、付随情報取得部82、注目ワード情報取得部83、予測部84、提供部85、履歴情報取得部86およびユーザ属性情報取得部87の各機能を実現する。
【0154】
コンピュータ100のCPU101は、これらのプログラムを、記録媒体108から読み取って実行するが、他の例として、他の装置から、ネットワークNを介してこれらのプログラムを取得してもよい。
【0155】
以上、本願の第1および第2実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0156】
〔13.その他〕
また、上記第1および第2実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0157】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0158】
また、上述してきた第1および第2実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0159】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、付随情報取得部82は、付随情報取得手段や付随情報取得回路に読み替えることができる。
【符号の説明】
【0160】
1 情報処理システム
70 情報処理装置
82 付随情報取得部
83 注目ワード情報取得部
84 予測部
86 履歴情報取得部
87 ユーザ属性情報取得部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10A
図10B
図11
図12
図13