IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 東京大学の特許一覧

特許7334928タグ推薦装置、タグ推薦方法及びタグ推薦プログラム
<>
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図1
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図2
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図3
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図4
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図5
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図6
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図7
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図8
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図9
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図10
  • 特許-タグ推薦装置、タグ推薦方法及びタグ推薦プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-21
(45)【発行日】2023-08-29
(54)【発明の名称】タグ推薦装置、タグ推薦方法及びタグ推薦プログラム
(51)【国際特許分類】
   G06F 16/907 20190101AFI20230822BHJP
   G06F 16/9536 20190101ALI20230822BHJP
【FI】
G06F16/907
G06F16/9536
【請求項の数】 11
(21)【出願番号】P 2019046846
(22)【出願日】2019-03-14
(65)【公開番号】P2020149410
(43)【公開日】2020-09-17
【審査請求日】2022-03-04
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年8月6日に第21回 画像の認識・理解シンポジウムにて発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年8月30日に「信学技報,Vol.118,No.211,pp.25-30」に発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年9月6日に電子情報通信学会にて発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年12月25日に情報系 WINTER FESTA Episode 4にて発表
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成28年度 国立研究開発法人科学技術振興機構 戦略的創造研究推進事業、産業技術力強化法第19条の適用を受けるもの
(73)【特許権者】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】山崎 俊彦
(72)【発明者】
【氏名】汪 雪テイ
【審査官】早川 学
(56)【参考文献】
【文献】米国特許出願公開第2016/0328401(US,A1)
【文献】米国特許出願公開第2015/0186503(US,A1)
【文献】特開2015-076089(JP,A)
【文献】YAMASAKI, Toshihiko et al.,FolkPopularityRank: Tag Recommendation for Enhancing Social Popularity using Text Tags in Content Sharing Services,Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence,2017年08月19日,p.3231-3237
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
複数のユーザと複数のタグとの共起関係を、前記複数のユーザの人気度に応じて重み付けした第1数値Upと、前記複数のユーザと前記複数のタグとの共起関係を、前記複数のユーザが前記複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第2数値Utとに基づいて、前記複数のタグ間の関係を表す第3数値をUp×Ut T により算出する第1算出部と、
前記第3数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、前記複数のタグの優先度を算出する第2算出部と、
前記優先度に基づいて、前記複数のタグの中から、前記新たなコンテンツに付与する1又は複数のタグを推薦する推薦部と、
を備えるタグ推薦装置。
【請求項2】
前記第1算出部は、前記複数のコンテンツと前記複数のタグとの共起関係を、前記複数のコンテンツの人気度に応じて重み付けした第4数値Bpと、前記複数のコンテンツと前記複数のタグとの共起関係を、前記複数のタグが前記複数のコンテンツに付与された頻度に応じて重み付けした第5数値Btと、に基づいて、前記複数のタグ間の関係を表す第6数値をBp×Bt T により算出し、
前記第2算出部は、前記第3数値、前記第6数値及び前記新たなコンテンツに付与された1又は複数のタグに基づいて、前記優先度を算出する、
請求項1に記載のタグ推薦装置。
【請求項3】
前記第3数値及び前記第6数値は、前記複数のタグの数の次元を有する正方行列であり、
前記第2算出部は、前記第3数値及び前記第6数値の要素積並びに前記新たなコンテンツに付与された1又は複数のタグに基づいて、前記優先度を算出する、
請求項2に記載のタグ推薦装置。
【請求項4】
前記第3数値及び前記第6数値は、前記複数のタグの数の次元を有する正方行列であり、
前記第2算出部は、前記第3数値及び前記第6数値の和並びに前記新たなコンテンツに付与された1又は複数のタグに基づいて、前記優先度を算出する、
請求項2に記載のタグ推薦装置。
【請求項5】
前記第1算出部は、前記複数のタグのうち、前記複数のユーザが所定の期間中に前記複数のコンテンツに付与した複数のタグに基づいて、前記第3数値を算出する、
請求項1から4のいずれか一項に記載のタグ推薦装置。
【請求項6】
前記第1算出部は、前記複数のユーザのうち、所定の地域に属する複数のユーザに基づいて、前記第3数値を算出する、
請求項1から5のいずれか一項に記載のタグ推薦装置。
【請求項7】
前記第1算出部は、前記複数のユーザのうち、所定の年代に属する複数のユーザに基づいて、前記第3数値を算出する、
請求項1から6のいずれか一項に記載のタグ推薦装置。
【請求項8】
前記第1算出部は、前記複数のユーザのうち、所定の性別に属する複数のユーザに基づいて、前記第3数値を算出する、
請求項1から7のいずれか一項に記載のタグ推薦装置。
【請求項9】
前記複数のユーザの人気度は、前記複数のユーザのSNSにおけるフォロワーの数、前記複数のユーザにより投稿された前記複数のコンテンツが評価された数及び前記複数のユーザにより投稿された前記複数のコンテンツが閲覧された数の少なくともいずれかに基づいて算出される、
請求項1から8のいずれか一項に記載のタグ推薦装置。
【請求項10】
タグ推薦装置に、
複数のユーザと複数のタグとの共起関係を、前記複数のユーザが前記複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第1数値Upと、前記複数のユーザと前記複数のタグとの共起関係を、前記複数のユーザの人気度に応じて重み付けした第2数値Utとに基づいて、前記複数のタグ間の関係を表す第3数値をUp×Ut T により算出することと、
前記第3数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、前記複数のタグの優先度を算出することと、
前記優先度に基づいて、前記複数のタグの中から、前記新たなコンテンツに付与する1又は複数のタグを推薦することと、
を実行させるタグ推薦方法。
【請求項11】
タグ推薦装置に、
複数のユーザと複数のタグとの共起関係を、前記複数のユーザが前記複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第1数値Upと、前記複数のユーザと前記複数のタグとの共起関係を、前記複数のユーザの人気度に応じて重み付けした第2数値Utとに基づいて、前記複数のタグ間の関係を表す第3数値をUp×Ut T により算出することと、
前記第3数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、前記複数のタグの優先度を算出することと、
前記優先度に基づいて、前記複数のタグの中から、前記新たなコンテンツに付与する1又は複数のタグを推薦することと、
を実行させるタグ推薦プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タグ推薦装置、タグ推薦方法及びタグ推薦プログラムに関する。
【背景技術】
【0002】
従来、タグは、画像や動画をコンテンツとするSNS(Social Networking Service)や、商品をコンテンツとする電子商取引サイトが広く用いられている。SNSや電子商取引サイトのユーザは、コンテンツに付与されたタグを用いて、コンテンツをテキスト検索する場合がある。ここで、コンテンツへのタグの付与は、コンテンツを投稿したユーザによって行われている。
【0003】
タグの付与について、例えば、下記非特許文献1には、ユーザ、コンテンツ及びタグをノードとし、ノードの共起関係をリンクとする無向グラフを用いて、コンテンツに付与するタグを推薦する技術が記載されている。
【0004】
また、下記非特許文献2には、SNSにおけるコンテンツの人気度とタグの共起関係に基づいて、投稿するコンテンツの人気度が高まるようにタグを推薦する技術が記載されている。
【先行技術文献】
【非特許文献】
【0005】
【文献】Andreas Hotho, Robert Jaschke, Christoph Schmitz, Gerd Stumme, "FolkRank: A Ranking Algorithm for Folksonomies", Lwa, Vol. 1, pp. 111-114 (2006)
【文献】T. Yamasaki, J. Hu, S. Sano, and K. Aizawa, "Folkpopularityrank: Tag recommendation for enhancing social popularity using text tags in content sharing services," Proceedings of the 26th International Joint Conference on Artificial Intelligence, pp.3231-3237, 2017
【発明の概要】
【発明が解決しようとする課題】
【0006】
先行技術によって、人気のあるコンテンツに付与されたタグと、そのタグと共起するタグを重要視して、新たなコンテンツに付与するタグを推薦することができる。一方、SNSや電子商取引サイト等のコミュニティでは、人気度の高いユーザが大きな影響力を有しており、人気度が高いユーザが付与しているタグを新しいコンテンツに付与することで、そのコンテンツの人気度が向上することがある。しかしながら、人気度が高いユーザによってどのようなタグが付与されているか網羅的に把握することは難しく、頻繁に付与されているタグと稀にしか付与されていないタグとのバランスを取ることも難しい。
【0007】
そこで、本発明は、人気度が高いユーザによって付与されたタグと、その付与頻度を考慮して新たなコンテンツに付与するタグを推薦するタグ推薦装置、タグ推薦方法及びタグ推薦プログラムを提供する。
【課題を解決するための手段】
【0008】
本発明の一態様に係るタグ推薦装置は、複数のユーザと複数のタグとの共起関係を、複数のユーザの人気度に応じて重み付けした第1数値と、複数のユーザと複数のタグとの共起関係を、複数のユーザが複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第2数値とに基づいて、複数のタグ間の共起関係を表す第3数値を算出する第1算出部と、第3数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、複数のタグの優先度を算出する第2算出部と、優先度に基づいて、複数のタグの中から、新たなコンテンツに付与する1又は複数のタグを推薦する推薦部と、を備える。
【0009】
この態様によれば、複数のタグ間の共起関係を表す第3数値を、ユーザがタグを付与した頻度と、ユーザの人気度とを用いて算出し、第3数値と、新たなコンテンツに予め付与された1又は複数のタグとに基づいて複数のタグの優先度を算出することで、人気度が高いユーザによって付与されたタグと、その付与頻度を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0010】
上記態様において、第1算出部は、複数のコンテンツと複数のタグとの共起関係を、複数のコンテンツの人気度に応じて重み付けした第4数値と、複数のコンテンツと複数のタグとの共起関係を、複数のタグが複数のコンテンツに付与された頻度に応じて重み付けした第5数値と、に基づいて、複数のタグ間の共起関係を表す第6数値を算出し、第2算出部は、第3数値、第6数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、優先度を算出してもよい。
【0011】
この態様によれば、複数のタグ間の共起関係を表す第6数値を、タグがコンテンツに付与された頻度と、コンテンツの人気度とを用いて算出し、第6数値と、新たなコンテンツに予め付与された1又は複数のタグとに基づいて複数のタグの優先度を算出することで、コンテンツの人気度を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0012】
上記態様において、第3数値及び第6数値は、複数のタグの数の次元を有する正方行列であり、第2算出部は、第3数値及び第6数値の要素積並びに新たなコンテンツに付与された1又は複数のタグに基づいて、優先度を算出してもよい。
【0013】
この態様によれば、ユーザの人気度及びコンテンツの人気度両方を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0014】
上記態様において、第3数値及び第6数値は、複数のタグの数の次元を有する正方行列であり、第2算出部は、第3数値及び第6数値の和並びに新たなコンテンツに付与された1又は複数のタグに基づいて、優先度を算出してもよい。
【0015】
この態様によれば、ユーザの人気度及びコンテンツの人気度両方を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0016】
上記態様において、第1算出部は、複数のタグのうち、複数のユーザが所定の期間中に複数のコンテンツに付与した複数のタグに基づいて、第3数値を算出してもよい。
【0017】
この態様によれば、所定の期間におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。
【0018】
上記態様において、第1算出部は、複数のユーザのうち、所定の地域に属する複数のユーザに基づいて、第3数値を算出してもよい。
【0019】
この態様によれば、所定の地域におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。
【0020】
上記態様において、第1算出部は、複数のユーザのうち、所定の年代に属する複数のユーザに基づいて、第3数値を算出してもよい。
【0021】
この態様によれば、所定の年代におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。
【0022】
上記態様において、第1算出部は、複数のユーザのうち、所定の性別に属する複数のユーザに基づいて、第3数値を算出してもよい。
【0023】
この態様によれば、所定の性別におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。
【0024】
上記態様において、複数のユーザの人気度は、複数のユーザのSNSにおけるフォロワーの数、複数のユーザにより投稿された複数のコンテンツが評価された数及び複数のユーザにより投稿された複数のコンテンツが閲覧された数の少なくともいずれかに基づいて算出されてもよい。
【0025】
この態様によれば、目的に応じて適切な人気度を算出し、より魅力的なタグを推薦することができる。
【0026】
本発明の他の態様に係るタグ推薦方法は、タグ推薦装置に、複数のユーザと複数のタグとの共起関係を、複数のユーザが複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第1数値と、複数のユーザと複数のタグとの共起関係を、複数のユーザの人気度に応じて重み付けした第2数値とに基づいて、複数のタグ間の共起関係を表す第3数値を算出することと、第3数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、複数のタグの優先度を算出することと、優先度に基づいて、複数のタグの中から、新たなコンテンツに付与する1又は複数のタグを推薦することと、を実行させる。
【0027】
この態様によれば、複数のタグ間の共起関係を表す第3数値を、ユーザがタグを付与した頻度と、ユーザの人気度とを用いて算出し、第3数値と、新たなコンテンツに予め付与された1又は複数のタグとに基づいて複数のタグの優先度を算出することで、ユーザの人気度を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0028】
本発明の他の態様に係るタグ推薦プログラムは、タグ推薦装置に、複数のユーザと複数のタグとの共起関係を、複数のユーザが複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第1数値と、複数のユーザと複数のタグとの共起関係を、複数のユーザの人気度に応じて重み付けした第2数値とに基づいて、複数のタグ間の共起関係を表す第3数値を算出することと、第3数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、複数のタグの優先度を算出することと、優先度に基づいて、複数のタグの中から、新たなコンテンツに付与する1又は複数のタグを推薦することと、を実行させる。
【0029】
この態様によれば、複数のタグ間の共起関係を表す第3数値を、ユーザがタグを付与した頻度と、ユーザの人気度とを用いて算出し、第3数値と、新たなコンテンツに予め付与された1又は複数のタグとに基づいて複数のタグの優先度を算出することで、ユーザの人気度を考慮して新たなコンテンツに付与するタグを推薦することができる。
【発明の効果】
【0030】
本発明によれば、人気度が高いユーザによって付与されたタグと、その付与頻度を考慮して新たなコンテンツに付与するタグを推薦するタグ推薦装置、タグ推薦方法及びタグ推薦プログラムを提供することができる。
【図面の簡単な説明】
【0031】
図1】本発明の実施形態に係るタグ推薦システムのネットワーク構成を示す図である。
図2】本実施形態に係るタグ推薦装置の機能ブロックを示す図である。
図3】本実施形態に係るタグ推薦装置の物理的構成を示す図である。
図4】本実施形態に係るタグ推薦装置により算出される第1数値の一例を示す図である。
図5】本実施形態に係るタグ推薦装置により算出される第2数値の一例を示す図である。
図6】本実施形態に係るタグ推薦装置により実行されるタグ推薦処理の第1例のフローチャートである。
図7】本実施形態に係るタグ推薦装置により算出される第4数値の一例を示す図である。
図8】本実施形態に係るタグ推薦装置により算出される第5数値の一例を示す図である。
図9】本実施形態に係るタグ推薦装置により実行されるタグ推薦処理の第2例のフローチャートである。
図10】本実施形態に係るタグ推薦装置により実行されるタグ推薦処理の第3例のフローチャートである。
図11】本実施形態に係るタグ推薦装置により推薦されたタグをコンテンツに付与した場合の実験結果を示す図である。
【発明を実施するための形態】
【0032】
添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
【0033】
図1は、本発明の実施形態に係るタグ推薦システム100のネットワーク構成を示す図である。タグ推薦システム100は、タグ推薦装置10、第1ユーザ端末20、第2ユーザ端末30及び第Nユーザ端末40を含む。ここで、第1ユーザ端末20、第2ユーザ端末30及び第Nユーザ端末40は、第1ユーザが用いるユーザ端末、第2ユーザが用いるユーザ及び第Nユーザが用いるユーザ端末を表している。以下では、第1ユーザ端末20、第2ユーザ端末30及び第Nユーザ端末40を単にユーザ端末ともいう。
【0034】
タグ推薦装置10は、ユーザ端末から投稿するコンテンツを受け付けて、そのコンテンツに付与するタグを推薦する。コンテンツは、SNSに掲載する画像、動画、テキスト及びそれらの組み合わせであったり、電子商取引サイトに掲載する商品の画像、商品の動画、商品を説明するテキスト及びそれらの組み合わせであったりしてよい。以下では、SNSに画像を投稿する場合を例に説明する。
【0035】
ユーザ端末は、汎用のコンピュータであり、例えば、スマートフォン、タブレットPC(Personal Computer)又はデスクトップPCであってよい。複数のユーザ端末は、通信ネットワークNを介してタグ推薦装置10と通信可能に接続され、タグ推薦装置10より、新たに投稿するコンテンツに付与するタグの推薦を受ける。ここで、通信ネットワークNは、有線又は無線の通信網であり、インターネットやLAN(Local Area Network)であってよい。
【0036】
図2は、本実施形態に係るタグ推薦装置10の機能ブロックを示す図である。タグ推薦装置10は、取得部11、生成部12、記憶部13、第1算出部14、第2算出部15及び推薦部16を備える。
【0037】
取得部11は、ユーザ端末から、新たに投稿するコンテンツを取得する。取得部11は、特定のSNSや電子商取引サイトと連携して、ユーザ端末からSNSや電子商取引サイトにコンテンツの投稿が行われる場合に、投稿しようとしているコンテンツを取得してよい。
【0038】
生成部12は、新たなコンテンツを解析し、コンテンツの内容を説明するタグを生成する。ここで、コンテンツの内容を説明するタグは、複数のタグの候補の中から選択されてよい。例えば、コンテンツが画像である場合、生成部12は、公知の画像認識技術を用いて、画像に写されている物の名前や画像に写されている状況を説明するタグを生成してよい。また、生成部12は、コンテンツを、予め定められた複数のカテゴリの少なくともいずれかに分類し、コンテンツが属するカテゴリに応じて、タグを生成してもよい。生成部12は、1つのコンテンツに対して、コンテンツの内容を説明する複数のタグを生成してよく、例えば、10個のタグを生成してよい。
【0039】
記憶部13は、タグ情報13a、ユーザ情報13b及びコンテンツ情報13cを記憶している。タグ情報13aは、これまでにコンテンツに付与されたタグの履歴情報を含み、どのタグがどのコンテンツに、いつ、どの地域で、どの年代のユーザによって付与されているかを示す情報を含んでよい。また、ユーザ情報13bは、コンテンツを投稿したユーザの人気度を含み、ユーザの居住する地域や年代といったプロフィール情報を含んでもよい。
【0040】
ここで、ユーザの人気度は、ユーザのSNSにおけるフォロワーの数、ユーザにより投稿された複数のコンテンツが評価された数及びユーザにより投稿された複数のコンテンツが閲覧された数の少なくともいずれかに基づいて算出されてよい。タグ推薦を受けるユーザは、どのような指標を用いてユーザの人気度を算出するか選択できてもよい。例えば、より閲覧数が増えるようにタグを付与したい場合、ユーザの人気度をユーザにより投稿された複数のコンテンツが閲覧された数に基づいて算出することとしてよい。このように、目的に応じて適切な人気度を算出し、より魅力的なタグを推薦することができる。
【0041】
コンテンツ情報13cは、投稿されたコンテンツの人気度を含み、いずれのユーザによって投稿されたコンテンツであるか示す情報を含んでもよい。コンテンツの人気度は、投稿された複数のコンテンツが評価された数及び投稿された複数のコンテンツが閲覧された数の少なくともいずれかに基づいて算出されてよい。
【0042】
第1算出部14は、複数のユーザと複数のタグとの共起関係を、複数のユーザの人気度に応じて重み付けした第1数値と、複数のユーザと複数のタグとの共起関係を、複数のユーザが複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第2数値とに基づいて、複数のタグ間の共起関係を表す第3数値を算出する。第1数値及び第2数値の具体例は、図4及び5を用いて詳細に説明する。
【0043】
第2算出部15は、第3数値及び新たなコンテンツに付与された1又は複数のタグに基づいて、複数のタグの優先度を算出する。ここで、新たなコンテンツに付与された1又は複数のタグは、生成部12によって生成されたタグであってよい。タグの優先度については、後に図6を用いて詳細に説明する。
【0044】
推薦部16は、第2算出部15により算出された優先度に基づいて、複数のタグの中から、新たなコンテンツに付与する1又は複数のタグを推薦する。推薦部16は、推薦する1又は複数のタグを特定する情報を、ユーザ端末に送信してよい。ユーザ端末は、推薦された1又は複数のタグ全てを新たなコンテンツに付与してもよいし、推薦された1又は複数のタグのうち、新たなコンテンツに付与するタグの選択をユーザから受け付けて、選択されたタグを新たなコンテンツに付与してもよい。
【0045】
図3は、本実施形態に係るタグ推薦装置10の物理的構成を示す図である。タグ推薦装置10は、演算部に相当するCPU(Central Processing Unit)10aと、記憶部に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read only Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例ではタグ推薦装置10が一台のコンピュータで構成される場合について説明するが、タグ推薦装置10は、複数のコンピュータが組み合わされて実現されてもよい。また、図3で示す構成は一例であり、タグ推薦装置10はこれら以外の構成を有してもよいし、これらの構成のうち一部を有さなくてもよい。
【0046】
CPU10aは、RAM10b又はROM10cに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10aは、新たなコンテンツに付与するタグを推薦するプログラム(タグ推薦プログラム)を実行する演算部である。CPU10aは、入力部10eや通信部10dから種々のデータを受け取り、データの演算結果を表示部10fに表示したり、RAM10bやROM10cに格納したりする。
【0047】
RAM10bは、記憶部のうちデータの書き換えが可能なものであり、例えば半導体記憶素子で構成されてよい。RAM10bは、CPU10aが実行するプログラム、ユーザの人気度、タグの付与頻度及びコンテンツの人気度といったデータを記憶してよい。なお、これらは例示であって、RAM10bには、これら以外のデータが記憶されていてもよいし、これらの一部が記憶されていなくてもよい。
【0048】
ROM10cは、記憶部のうちデータの読み出しが可能なものであり、例えば半導体記憶素子で構成されてよい。ROM10cは、例えばタグ推薦プログラムや、書き換えが行われないデータを記憶してよい。
【0049】
通信部10dは、タグ推薦装置10を他の機器に接続するインターフェースである。通信部10dは、インターネット等の通信ネットワークNに接続されてよい。
【0050】
入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード及びタッチパネルを含んでよい。
【0051】
表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば、LCD(Liquid Crystal Display)により構成されてよい。表示部10fは、タグの優先度や推薦するタグを表示してよい。
【0052】
タグ推薦プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10dにより接続される通信ネットワークを介して提供されてもよい。タグ推薦装置10では、CPU10aがタグ推薦プログラムを実行することにより、図2を用いて説明した様々な動作が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、タグ推薦装置10は、CPU10aとRAM10bやROM10cが一体化したLSI(Large-Scale Integration)を備えていてもよい。
【0053】
図4は、本実施形態に係るタグ推薦装置10により算出される第1数値Upの一例を示す図である。第1数値Upは、コンテンツへの付与候補となる複数のタグの数の行と、複数のユーザの数の列を有する行列である。本例では、複数のタグの数が3であり、複数のユーザの数が3である場合について説明する。第1数値Upは、本発明の第1数値に相当し、複数のユーザと複数のタグとの共起関係を、複数のユーザの人気度に応じて重み付けした第1数値の一例である。
【0054】
第1数値Upは、複数のユーザの数の次元を有する行ベクトルを、複数のタグの数だけ含む。以下では、第1数値Upに含まれる複数の行ベクトルを第i行ベクトルと呼ぶ。ここで、iは、1からMの値をとり、Mは複数のタグの数である。本例の場合、3次元の第1行ベクトルは、「a」という第1タグT1に対応し、第2行ベクトルは、「b」という第2タグT2に対応し、第3行ベクトルは、「c」という第3タグT3に対応する。また、本例において、第1ユーザの人気度は「100」であり、第2ユーザの人気度は「200」であり、第3ユーザの人気度は「300」である。第1行ベクトルは、第1要素が100/600であり、第2要素が200/600であり、第3要素が300/600である。また、第2行ベクトルは、第1要素が100/400であり、第2要素が0であり、第3要素が300/400である。また、第3行ベクトルは、第1要素が100/300であり、第2要素が200/300であり、第3要素が0である。各行ベクトルは、L1ノルムが1となるように規格化されている。
【0055】
第i行ベクトルの値は、第jユーザ(j=1~N、Nは複数のユーザの数)が第iタグをコンテンツに付与している場合にゼロでない値となり、第jユーザが第iタグをコンテンツに付与していない場合にゼロとなる。そして、第i行ベクトルのゼロでない値は、第jユーザの人気度に比例するように定められる。本例の場合、第i行ベクトルのゼロでない値は、第jユーザの人気度に比例し、かつ、第i行ベクトルのL1ノルムが1となるよるように定められている。
【0056】
本例の場合、第1タグT1は、第1ユーザ、第2ユーザ及び第3ユーザ全てによって何らかのコンテンツに付与された履歴があるため、第1行ベクトルの全ての要素がゼロでない値となっている。一方、第2タグT2は、第1ユーザ及び第3ユーザによって付与された履歴があるが、第2ユーザによっては付与されていないため、第2行ベクトルの第2要素はゼロとなっている。同様に、第3タグT3は、第1ユーザ及び第2ユーザによって付与された履歴があるが、第3ユーザによっては付与されていないため、第3行ベクトルの第3要素はゼロとなっている。
【0057】
図5は、本実施形態に係るタグ推薦装置10により算出される第2数値Utの一例を示す図である。第2数値Utは、コンテンツへの付与候補となる複数のタグの数の行と、複数のユーザの数の列を有する行列である。本例では、複数のタグの数が3であり、複数のユーザの数が3である場合について説明する。第2数値Utは、本発明の第2数値に相当し、複数のユーザと複数のタグとの共起関係を、複数のユーザが複数のタグを複数のコンテンツに付与した頻度に応じて重み付けした第2数値の一例である。
【0058】
第2数値Utは、複数のタグの数の次元を有する列ベクトルを、複数のユーザの数だけ含む。以下では、第2数値Utに含まれる複数の列ベクトルを第k列ベクトルと呼ぶ。ここで、kは、1からNの値をとり、Nは複数のユーザの数である。本例の場合、3次元の第1列ベクトルは第1ユーザに対応し、第2列ベクトルは第2ユーザに対応し、第3行ベクトルは第3ユーザに対応する。例えば、第1列ベクトルは、第1要素が2/6であり、第2要素が1/6であり、第3要素が3/6である。また、第2列ベクトルは、第1要素が2/3であり、第2要素が0であり、第3要素が1/3である。また、第3行ベクトルは、第1要素が3/6であり、第2要素が3/6であり、第3要素が0である。各列ベクトルは、L1ノルムが1となるように規格化されている。
【0059】
第k列ベクトルの値は、第kユーザが第iタグをコンテンツに付与している場合にゼロでない値となり、第kユーザが第iタグをコンテンツに付与していない場合にゼロとなる。そして、第k列ベクトルのゼロでない値は、第kユーザが第iタグを付与した回数に比例するように定められる。本例の場合、第k列ベクトルのゼロでない値は、第kユーザが第iタグを付与した回数に比例し、かつ、第k列ベクトルのL1ノルムが1となるように定められている。
【0060】
本例の場合、第1ユーザは、第1タグを2回、第2タグを1回、第3タグを3回付与した履歴があるため、第1列ベクトルの全ての要素がゼロでない値となっている。一方、第2ユーザは、第1タグを2回、第2タグを0回、第3タグを1回付与した履歴があるため、第2列ベクトルの第2要素はゼロとなっている。同様に、第3ユーザは、第1タグを3回、第2タグを3回、第3タグを0回付与した履歴があるため、第3列ベクトルの第3要素はゼロとなっている。
【0061】
図6は、本実施形態に係るタグ推薦装置10により実行されるタグ推薦処理の第1例のフローチャートである。はじめに、タグ推薦装置10は、ユーザが投稿するコンテンツを取得する(S10)。そして、タグ推薦装置10は、生成部12によってコンテンツを説明するタグを生成し、優先ベクトルp1を決定する(S11)。
【0062】
優先ベクトルp1は、コンテンツに付与される候補となる複数のタグの数の次元を有するM次元ベクトルであり(Mは複数のタグの数)、生成部12によって生成されたコンテンツを説明するタグに対応する要素がゼロでない値(例えば1)をとり、それ以外の要素についてゼロの値をとるベクトルであってよい。また、優先ベクトルp1は、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されていてよい。例えば、生成部12によって生成されたコンテンツを説明するタグが、第1タグ及び第2タグである場合、優先ベクトルp1は、第1タグに対応する要素が1、第2タグに対応する要素が1であり、それ以外の要素がゼロであるベクトルであってよい。
【0063】
その後、タグ推薦装置10は、第1数値及び第2数値である行列Up及びUtを算出し、第3数値AUP=Up×UtTを算出する(S12)。ここで、「T」は行列の転置を表す。第3数値AUPは、複数のタグの数の次元を有する正方行列である。第3数値AUPは、本発明の第3数値に相当し、複数のタグ間の共起関係を表す。
【0064】
さらに、タグ推薦装置10は、複数のタグの優先度r1を、r1=αAUP1+(1-α)p1により算出する(S13)。ここで、優先度r1の算出式は再帰的に定義されている。また、αは、0から1の間の値である。r1は、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されてよい。なお、r1の初期値は、p1であってよい。
【0065】
また、タグ推薦装置10は、基準優先度r0を、r0=αAUP0+(1-α)p0により算出する(S14)。ここで、p0は、複数のタグの数の次元を有するM次元ベクトルであり(Mは複数のタグの数)、全ての要素が等しい値であり、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されているベクトルであってよい。すなわち、p0は、全ての要素がm/Mであるベクトルであってよい。r0は、L1ノルムがmに規格化されてよい。なお、r0の初期値は、p0であってよい。
【0066】
タグ推薦装置10は、優先度r1及び基準優先度r0が収束したか判定する(S15)。収束したか否かは、処理S13及びS14における更新で、優先度r1及び基準優先度r0が所定量以下しか変化しないか否か、又は予め指定した繰り返し演算回数を上回ったかによって判定してよい。処理S13及びS14における更新で、優先度r1又は基準優先度r0が所定量より大きく変化し、予め指定した繰り返し演算回数を上回っていない場合、すなわち優先度r1及び基準優先度r0が収束していない場合(S15:NO)、タグ推薦装置10は、処理S13及びS14を再び実行する。
【0067】
一方、処理S13及びS14における更新で、優先度r1又は基準優先度r0が所定量以下しか変化しない場合、又は予め指定した繰り返し演算回数を上回った場合、すなわち優先度r1及び基準優先度r0が収束した場合(S15:YES)、タグ推薦装置10は、r1-r0の値により推薦する1又は複数のタグを決定する(S16)。r1-r0は、複数のタグの数の次元を有するベクトルであり、各要素は複数のタグに対応する。タグ推薦装置10は、r1-r0の要素の大きさが上位所定順位以内である1又は複数のタグを推薦してよい。以上により推薦処理の第1例が終了する。
【0068】
このように、複数のタグ間の共起関係を表す第3数値AUPを、ユーザがタグを付与した頻度と、ユーザの人気度とを用いて算出し、第3数値と、新たなコンテンツに予め付与された1又は複数のタグとに基づいて複数のタグの優先度r1を算出することで、人気度が高いユーザによって付与されたタグと、その付与頻度を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0069】
図7は、本実施形態に係るタグ推薦装置10により算出される第4数値Bpの一例を示す図である。第4数値Bpは、コンテンツへの付与候補となる複数のタグの数の行と、複数のコンテンツの数の列を有する行列である。本例では、複数のタグの数が3であり、複数のコンテンツの数が3である場合について説明する。第4数値Bpは、本発明の第4数値に相当し、複数のコンテンツと複数のタグとの共起関係を、複数のコンテンツの人気度に応じて重み付けした第5数値の一例である。
【0070】
第4数値Bpは、複数のコンテンツの数の次元を有する行ベクトルを、複数のタグの数だけ含む。以下では、第4数値Bpに含まれる複数の行ベクトルを第i行ベクトルと呼ぶ。ここで、iは、1からMの値をとり、Mは複数のタグの数である。本例の場合、3次元の第1行ベクトルは、「a」という第1タグT1に対応し、第2行ベクトルは、「b」という第2タグT2に対応し、第3行ベクトルは、「c」という第3タグT3に対応する。また、本例において、第1コンテンツの人気度は「40」であり、第2コンテンツの人気度は「7」であり、第1コンテンツの人気度は「4」である。そして、第1行ベクトルは、第1要素が40/50であり、第2要素が7/50であり、第3要素が3/50である。また、第2行ベクトルは、第1要素が40/47であり、第2要素が7/47であり、第3要素が0である。また、第3行ベクトルは、第1要素が0であり、第2要素が7/10であり、第3要素が3/10である。各行ベクトルは、L1ノルムが1となるように規格化されている。
【0071】
第i行ベクトルの値は、第mコンテンツ(m=1~C、Cは複数のコンテンツの数)に第iタグが付与されている場合にゼロでない値となり、第mコンテンツに第iタグが付与されていない場合にゼロとなる。そして、第i行ベクトルのゼロでない値は、第mコンテンツの人気度に比例するように定められる。本例の場合、第i行ベクトルのゼロでない値は、第mコンテンツの人気度に比例し、かつ、第i行ベクトルのL1ノルムが1となるよるように定められている。
【0072】
本例の場合、第1タグT1は、第1コンテンツ、第2コンテンツ及び第3コンテンツ全てに付与された履歴があるため、第1行ベクトルの全ての要素がゼロでない値となっている。一方、第2タグT2は、第1コンテンツ及び第2コンテンツに付与された履歴があるが、第3コンテンツには付与されていないため、第2行ベクトルの第3要素はゼロとなっている。同様に、第3タグT3は、第2コンテンツ及び第3コンテンツに付与された履歴があるが、第1コンテンツには付与されていないため、第3行ベクトルの第1要素はゼロとなっている。
【0073】
図8は、本実施形態に係るタグ推薦装置10により算出される第5数値Btの一例を示す図である。第5数値Btは、コンテンツへの付与候補となる複数のタグの数の行と、複数のコンテンツの数の列を有する行列である。本例では、複数のタグの数が3であり、複数のコンテンツの数が3である場合について説明する。第5数値Btは、本発明の第5数値に相当し、複数のコンテンツと複数のタグとの共起関係を、複数のタグが複数のコンテンツに付与された頻度に応じて重み付けした第5数値の一例である。
【0074】
第5数値Btは、複数のタグの数の次元を有する列ベクトルを、複数のコンテンツの数だけ含む。以下では、第5数値Btに含まれる複数の列ベクトルを第k列ベクトルと呼ぶ。ここで、kは、1からCの値をとり、Cは複数のコンテンツの数である。本例の場合、3次元の第1列ベクトルは第1コンテンツに対応し、第2列ベクトルは第2コンテンツに対応し、第3行ベクトルは第3コンテンツに対応する。例えば、第1列ベクトルは、第1要素が1/2であり、第2要素が1/2であり、第3要素が0である。また、第2列ベクトルは、第1要素が1/3であり、第2要素が1/3であり、第3要素が1/3である。また、第3行ベクトルは、第1要素が1/2であり、第2要素が0であり、第3要素が1/2である。各列ベクトルは、L1ノルムが1となるように規格化されている。
【0075】
第k列ベクトルの値は、第kコンテンツに第iタグが付与されている場合にゼロでない値となり、第kコンテンツに第iタグが付与されていない場合にゼロとなる。本例の場合、第k列ベクトルのゼロでない値は、第k列ベクトルのL1ノルムが1となるよるように均等に定められている。
【0076】
本例の場合、第1コンテンツには、第1タグ及び第2タグが付与された履歴があるが、第3タグが付与された履歴がないため、第1列ベクトルの第3要素はゼロとなっている。一方、第2コンテンツには、第1タグ、第2タグ及び第3タグが付与された履歴があるため、第2列ベクトルの全ての要素はゼロでない値となっている。また、第3コンテンツには、第1タグ及び第3タグが付与された履歴があるが、第2タグが付与された履歴がないため、第3列ベクトルの第2要素はゼロとなっている。
【0077】
図9は、本実施形態に係るタグ推薦装置10により実行されるタグ推薦処理の第2例のフローチャートである。はじめに、タグ推薦装置10は、ユーザが投稿するコンテンツを取得する(S20)。そして、タグ推薦装置10は、生成部12によってコンテンツを説明するタグを生成し、優先ベクトルp1を決定する(S21)。優先ベクトルp1は、コンテンツに付与される候補となる複数のタグの数の次元を有するM次元ベクトルであり(Mは複数のタグの数)、生成部12によって生成されたコンテンツを説明するタグに対応する要素が1であり、それ以外の要素がゼロであるベクトルであってよい。また、優先ベクトルp1は、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されていてよい。
【0078】
その後、タグ推薦装置10は、第1数値及び第2数値である行列Up及びUtを算出し、第3数値AUP=Up×UtTを算出する(S22)。第3数値AUPは、複数のタグの数の次元を有する正方行列である。第3数値AUPは、本発明の第3数値に相当し、複数のタグ間の共起関係を表す。
【0079】
また、タグ推薦装置10は、第4数値及び第5数値である行列Bp及びBtを算出し、第6数値AFP=Bp×BtTを算出する(S23)。第6数値AFPは、複数のタグの数の次元を有する正方行列である。第6数値AFPは、本発明の第6数値に相当し、複数のタグ間の共起関係を表す。
【0080】
タグ推薦装置10は、第3数値AUP及び第6数値AFPに基づいて、第7数値AUFP (1)を以下の数式(1)により算出する(S24)。
【0081】
【数1】
【0082】
ここで、数式(1)の右辺は、第3数値AUP及び第6数値AFPの要素積(アダマール積)を表す。
【0083】
さらに、タグ推薦装置10は、複数のタグの優先度r1を、r1=αAUFP (1)1+(1-α)p1により算出する(S25)。ここで、優先度r1の算出式は再帰的に定義されている。また、αは、0から1の間の値である。r1は、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されてよい。なお、r1の初期値は、p1であってよい。
【0084】
また、タグ推薦装置10は、基準優先度r0を、r0=αAUFP (1)0+(1-α)p0により算出する(S26)。ここで、p0は、複数のタグの数の次元を有するM次元ベクトルであり(Mは複数のタグの数)、全ての要素が等しい値であり、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されているベクトルであってよい。r0は、L1ノルムがmに規格化されてよい。なお、r0の初期値は、p0であってよい。
【0085】
タグ推薦装置10は、優先度r1及び基準優先度r0が収束したか判定する(S27)。収束したか否かは、処理S25及びS26における更新で、優先度r1及び基準優先度r0が所定量以下しか変化しないか否か、又は予め指定した繰り返し演算回数を上回ったかによって判定してよい。処理S25及びS26における更新で、優先度r1又は基準優先度r0が所定量より大きく変化し、予め指定した繰り返し演算回数を上回っていない場合、すなわち優先度r1及び基準優先度r0が収束していない場合(S27:NO)、タグ推薦装置10は、処理S25及びS26を再び実行する。
【0086】
一方、処理S25及びS26における更新で、優先度r1又は基準優先度r0が所定量以下しか変化しない場合、又は予め指定した繰り返し演算回数を上回った場合、すなわち優先度r1及び基準優先度r0が収束した場合(S27:YES)、タグ推薦装置10は、r1-r0の値により推薦する1又は複数のタグを決定する(S28)。r1-r0は、複数のタグの数の次元を有するベクトルであり、各要素は複数のタグに対応する。タグ推薦装置10は、r1-r0の要素の大きさが上位所定順位以内である1又は複数のタグを推薦してよい。以上により推薦処理の第2例が終了する。
【0087】
このように、複数のタグ間の共起関係を表す第6数値AFPを、タグがコンテンツに付与された頻度と、コンテンツの人気度とを用いて算出し、第6数値と、新たなコンテンツに予め付与された1又は複数のタグとに基づいて複数のタグの優先度r1を算出することで、人気度が高いコンテンツに付与されたタグと、その付与頻度を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0088】
また、第3数値AUP及び第6数値AFPの要素積並びに新たなコンテンツに付与された1又は複数のタグに基づいて、優先度r1を算出することで、ユーザの人気度及びコンテンツの人気度両方を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0089】
図10は、本実施形態に係るタグ推薦装置10により実行されるタグ推薦処理の第3例のフローチャートである。はじめに、タグ推薦装置10は、ユーザが投稿するコンテンツを取得する(S30)。そして、タグ推薦装置10は、生成部12によってコンテンツを説明するタグを生成し、優先ベクトルp1を決定する(S31)。優先ベクトルp1は、コンテンツに付与される候補となる複数のタグの数の次元を有するM次元ベクトルであり(Mは複数のタグの数)、生成部12によって生成されたコンテンツを説明するタグに対応する要素が1であり、それ以外の要素がゼロであるベクトルであってよい。また、優先ベクトルp1は、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されていてよい。
【0090】
その後、タグ推薦装置10は、第1数値及び第2数値である行列Up及びUtを算出し、第3数値AUP=Up×UtTを算出する(S32)。第3数値AUPは、複数のタグの数の次元を有する正方行列である。第3数値AUPは、本発明の第3数値に相当し、複数のタグ間の共起関係を表す。
【0091】
また、タグ推薦装置10は、第4数値及び第5数値である行列Bp及びBtを算出し、第6数値AFPBp×BtTを算出する(S33)。第6数値AFPは、複数のタグの数の次元を有する正方行列である。第6数値AFPは、本発明の第6数値に相当し、複数のタグ間の共起関係を表す。
【0092】
タグ推薦装置10は、第3数値AUP及び第6数値AFPに基づいて、第8数値AUFP (2)をAUFP (2)=AUP+AFPによって算出する(S34)。
【0093】
さらに、タグ推薦装置10は、複数のタグの優先度r1を、r1=αAUFP (2)1+(1-α)p1により算出する(S35)。ここで、優先度r1の算出式は再帰的に定義されている。また、αは、0から1の間の値である。r1は、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されてよい。なお、r1の初期値は、p1であってよい。
【0094】
また、タグ推薦装置10は、基準優先度r0を、r0=αAUFP (2)0+(1-α)p0により算出する(S36)。ここで、p0は、複数のタグの数の次元を有するM次元ベクトルであり(Mは複数のタグの数)、全ての要素が等しい値であり、L1ノルムがm(mは生成部12によって生成されたコンテンツを説明するタグの数)に規格化されているベクトルであってよい。r0は、L1ノルムがmに規格化されてよい。なお、r0の初期値は、p0であってよい。
【0095】
タグ推薦装置10は、優先度r1及び基準優先度r0が収束したか判定する(S37)。収束したか否かは、処理S35及びS36における更新で、優先度r1及び基準優先度r0が所定量以下しか変化しないか否か、又は予め指定した繰り返し演算回数を上回ったかによって判定してよい。処理S35及びS36における更新で、優先度r1又は基準優先度r0が所定量より大きく変化し、予め指定した繰り返し演算回数を上回っていない場合、すなわち優先度r1及び基準優先度r0が収束していない場合(S37:NO)、タグ推薦装置10は、処理S35及びS36を再び実行する。
【0096】
一方、処理S35及びS36における更新で、優先度r1又は基準優先度r0が所定量以下しか変化しない場合、又は予め指定した繰り返し演算回数を上回った場合、すなわち優先度r1及び基準優先度r0が収束した場合(S37:YES)、タグ推薦装置10は、r1-r0の値により推薦する1又は複数のタグを決定する(S38)。r1-r0は、複数のタグの数の次元を有するベクトルであり、各要素は複数のタグに対応する。タグ推薦装置10は、r1-r0の要素の大きさが上位所定順位以内である1又は複数のタグを推薦してよい。以上により推薦処理の第3例が終了する。
【0097】
このように、第3数値AUP及び第6数値AFPの和並びに新たなコンテンツに付与された1又は複数のタグに基づいて、優先度r1を算出することで、ユーザの人気度及びコンテンツの人気度両方を考慮して新たなコンテンツに付与するタグを推薦することができる。
【0098】
以上の例では、複数のタグを制限なく用いる場合について説明したが、タグ推薦装置10は、その他のタグの推薦を行ってもよい。第1算出部14は、複数のタグのうち、複数のユーザが所定の期間中に複数のコンテンツに付与した複数のタグに基づいて、第3数値AUPを算出してもよい。同様に、第1算出部14は、複数のタグのうち、複数のユーザが所定の期間中に複数のコンテンツに付与した複数のタグに基づいて、第6数値AFPを算出してもよい。このようにして、所定の期間におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。例えば、ある時期の流行を捉えたタグの推薦を行うことができる。
【0099】
第1算出部14は、複数のユーザのうち、所定の地域に属する複数のユーザに基づいて、第3数値AUPを算出してもよい。同様に、第1算出部14は、複数のユーザのうち、所定の地域に属する複数のユーザに基づいて、第6数値AFPを算出してもよい。ここで、所定の地域に属する複数のユーザは、ユーザの居住する地域によって判断されてよい。コンテンツにどのようなタグを付与すれば人気となるかは、国や地域によって傾向が異なることがある。ユーザの地域性を考慮することで、所定の地域におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。
【0100】
第1算出部14は、複数のユーザのうち、所定の年代に属する複数のユーザに基づいて、第3数値AUPを算出してもよい。同様に、第1算出部14は、複数のユーザのうち、所定の年代に属する複数のユーザに基づいて、第6数値AFPを算出してもよい。ここで、所定の年代に属する複数のユーザは、ユーザのプロフィール情報によって判断されてよい。コンテンツにどのようなタグを付与すれば人気となるかは、ユーザの年代によって傾向が異なることがある。ユーザの年代を考慮することで、所定の年代におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。
【0101】
第1算出部14は、複数のユーザのうち、所定の性別に属する複数のユーザに基づいて、第3数値AUPを算出してもよい。同様に、第1算出部14は、複数のユーザのうち、所定の性別に属する複数のユーザに基づいて、第6数値AFPを算出してもよい。ここで、所定の性別に属する複数のユーザは、ユーザのプロフィール情報によって判断されてよい。コンテンツにどのようなタグを付与すれば人気となるかは、ユーザの性別によって傾向が異なることがある。ユーザの性別を考慮することで、所定の性別におけるタグ付けの傾向を反映するように、新たなコンテンツに付与するタグを推薦することができる。
【0102】
図11は、本実施形態に係るタグ推薦装置10により推薦されたタグをコンテンツに付与した場合の実験結果を示す図である。同図では、特定のSNSに複数の画像を投稿する実験について、縦軸に平均閲覧数(Average Number of Views)を示し、横軸に投稿からの経過日数(Days after uploaded)を示している。実験は、本実施形態に係るタグ推薦装置10により推薦されたタグを画像に付与した場合と、比較例の場合とについて行い、それぞれ異なる期間に、異なるユーザによって、複数種類の画像を投稿した場合の平均を示している。
【0103】
実線で示す第1グラフG1は、生成部12によって生成した10個のタグに基づき優先ベクトルp1を決定し、第7数値AUFP (1)を用いた更新式で優先度r1を算出し、10個のタグの推薦を行い、合計20個のタグを付与して画像の投稿を行った場合の閲覧数の時間変化を示している。同図によると、第1グラフG1は最も良い成績を示し、10日間で平均閲覧数が50以上となり、増加傾向が続いている。
【0104】
破線で示す第2グラフG2は、生成部12によって生成した10個のタグに基づき優先ベクトルp1を決定し、第6数値AFPを用いた更新式で優先度r1を算出し、推薦部16によって10個のタグの推薦を行い、合計20個のタグを付与して画像の投稿を行った場合の閲覧数の時間変化を示している。同図によると、第2グラフG2は2番目に良い成績を示し、10日間で平均閲覧数が40以上となり、増加傾向が続いている。
【0105】
一点鎖線で示す第3グラフG3は、生成部12によって生成した10個のタグに基づき優先ベクトルp1を決定し、第8数値AUFP (2)を用いた更新式で優先度r1を算出し、推薦部16によって10個のタグの推薦を行い、合計20個のタグを付与して画像の投稿を行った場合の閲覧数の時間変化を示している。同図によると、第3グラフG3は3番目に良い成績を示し、10日間で平均閲覧数が30程度となり、増加傾向が続いている。
【0106】
二点鎖線で示す第4グラフG4は、生成部12によって生成した10個のタグに基づき優先ベクトルp1を決定し、第3数値AUPを用いた更新式で優先度r1を算出し、推薦部16によって10個のタグの推薦を行い、合計20個のタグを付与して画像の投稿を行った場合の閲覧数の時間変化を示している。同図によると、第4グラフG4は4番目に良い成績を示し、10日間で平均閲覧数が30程度となり、増加傾向が続いている。
【0107】
点線で示す第5グラフG5は、生成部12によって生成した10個のタグを付与して画像の投稿を行った場合の閲覧数の時間変化を比較例として示している。同図によると、第5グラフG5は最も悪い成績を示し、10日間で平均閲覧数が20程度となっている。なお、第5グラフG5では、画像に付与されたタグの数が10であり、本実施形態の場合の半分であるが、仮に閲覧数がタグの数に比例するとしても、第1グラフG1及び第2グラフG2は、閲覧数が第5グラフG5の倍より大きくなっており、単にタグの数を増やした以上の効果を奏していることが見て取れる。
【0108】
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
【符号の説明】
【0109】
10…タグ推薦装置、10a…CPU、10b…RAM、10c…ROM、10d…通信部、10e…入力部、10f…表示部、11…取得部、12…生成部、13…記憶部、13a…タグ情報、13b…ユーザ情報、13c…コンテンツ情報、14…第1算出部、15…第2算出部、16…推薦部、20…第1ユーザ端末、30…第2ユーザ端末、40…第Nユーザ端末、100…タグ推薦システム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11