特許第6979308号(P6979308)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

<>
  • 特許6979308-抽出装置、抽出方法及び抽出プログラム 図000002
  • 特許6979308-抽出装置、抽出方法及び抽出プログラム 図000003
  • 特許6979308-抽出装置、抽出方法及び抽出プログラム 図000004
  • 特許6979308-抽出装置、抽出方法及び抽出プログラム 図000005
  • 特許6979308-抽出装置、抽出方法及び抽出プログラム 図000006
  • 特許6979308-抽出装置、抽出方法及び抽出プログラム 図000007
  • 特許6979308-抽出装置、抽出方法及び抽出プログラム 図000008
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6979308
(24)【登録日】2021年11月17日
(45)【発行日】2021年12月8日
(54)【発明の名称】抽出装置、抽出方法及び抽出プログラム
(51)【国際特許分類】
   G06F 16/90 20190101AFI20211125BHJP
   G06F 16/903 20190101ALI20211125BHJP
【FI】
   G06F16/90
   G06F16/903
【請求項の数】8
【全頁数】15
(21)【出願番号】特願2017-167149(P2017-167149)
(22)【出願日】2017年8月31日
(65)【公開番号】特開2019-46043(P2019-46043A)
(43)【公開日】2019年3月22日
【審査請求日】2020年3月9日
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】高橋 文彦
【審査官】 松尾 真人
(56)【参考文献】
【文献】 特開2008−234580(JP,A)
【文献】 特開2017−107490(JP,A)
【文献】 特開2009−223749(JP,A)
【文献】 特開2015−185153(JP,A)
【文献】 特開2016−181056(JP,A)
【文献】 特開2013−235507(JP,A)
【文献】 特開2012−256095(JP,A)
【文献】 特開2014−137757(JP,A)
【文献】 特開2011−210157(JP,A)
【文献】 中国特許出願公開第106168953(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00−16/958
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
複数の投稿情報に対するユーザの反応である反応情報であって、第1ユーザ群に属するユーザの反応情報と、前記第1ユーザ群と異なる第2ユーザ群に属するユーザの反応情報とを取得する取得部と、
前記複数の投稿情報のうち、第1投稿情報に対する前記第ユーザ群に属するユーザの反応情報が示す値に対する、前記第1投稿情報に対する前記第ユーザ群に属するユーザの反応情報を示す値の割合が、第2投稿情報に対する前記第2ユーザ群に属するユーザの反応情報が示す値に対する、前記第2投稿情報に対する前記第1ユーザ群に属するユーザの反応情報を示す値の割合よりも大きい場合に、前記第1ユーザ群に属するユーザが興味関心を示す投稿情報として前記第1投稿情報を抽出する抽出部と、
を備えたことを特徴とする抽出装置。
【請求項2】
前記取得部は、
前記第1ユーザ群に属するユーザの反応情報として、前記第1ユーザ群に属するユーザが前記第1投稿情報及び前記第2投稿情報に反応した回数である反応回数を取得し、前記第2ユーザ群に属するユーザの反応情報として、前記第2ユーザ群に属するユーザが前記第1投稿情報及び前記第2投稿情報に反応した回数である反応回数を取得し、
前記抽出部は、
前記第ユーザ群に属するユーザが前記第1投稿情報に反応した反応回数に対する、前記第ユーザ群に属するユーザが前記第1投稿情報に反応した反応回数の割合が、前記第2ユーザ群に属するユーザが前記第2投稿情報に反応した反応回数に対する、前記第1ユーザ群に属するユーザが前記第2投稿情報に反応した反応回数の割合よりも大きい場合に、前記第1ユーザ群に属するユーザが興味関心を示す投稿情報として前記第1投稿情報を抽出する、
ことを特徴とする請求項1に記載の抽出装置。
【請求項3】
前記取得部は、
前記第1ユーザ群に属するユーザが前記第1投稿情報に対して投稿情報を投稿した回数である投稿回数と、前記第2ユーザ群に属するユーザが前記第1投稿情報に対して投稿情報を投稿した回数である投稿回数とをさらに取得し、
前記抽出部は、
前記第1ユーザ群に属するユーザが前記第1投稿情報に対して投稿情報を投稿した投稿回数に対する、前記第1ユーザ群に属するユーザが前記第1投稿情報に対して反応した反応回数の割合が、前記第2ユーザ群に属するユーザが前記第1投稿情報に対して投稿情報を投稿した投稿回数に対する、前記第2ユーザ群に属するユーザが前記第1投稿情報に対して反応した反応回数の割合よりも所定の閾値以上である場合に、前記第1ユーザ群に属するユーザが興味関心を示す投稿情報として前記第1投稿情報を抽出する、
ことを特徴とする請求項2に記載の抽出装置。
【請求項4】
前記取得部は、
前記第1ユーザ群を含むユーザ群である前記第2ユーザ群に属するユーザの反応情報を取得する、
ことを特徴とする請求項1〜3のいずれか1つに記載の抽出装置。
【請求項5】
前記取得部は、
特定の人物又は特定のキャラクターに関心を有するユーザ群である前記第1ユーザ群における反応情報を取得する、
ことを特徴とする請求項1〜4のいずれか1つに記載の抽出装置。
【請求項6】
前記取得部は、
前記特定の人物又は特定のキャラクターが含まれるプロフィール情報を有するユーザ群である前記第1ユーザ群における反応情報を取得する、
ことを特徴とする請求項5に記載の抽出装置。
【請求項7】
コンピュータが実行する抽出方法であって、
複数の投稿情報に対するユーザの反応である反応情報であって、第1ユーザ群に属するユーザの反応情報と、前記第1ユーザ群と異なる第2ユーザ群に属するユーザの反応情報とを取得する取得工程と、
前記複数の投稿情報のうち、第1投稿情報に対する前記第ユーザ群に属するユーザの反応情報が示す値に対する、前記第1投稿情報に対する前記第ユーザ群に属するユーザの反応情報を示す値の割合が、第2投稿情報に対する前記第2ユーザ群に属するユーザの反応情報が示す値に対する、前記第2投稿情報に対する前記第1ユーザ群に属するユーザの反応情報を示す値の割合よりも大きい場合に、前記第1ユーザ群に属するユーザが興味関心を示す投稿情報として前記第1投稿情報を抽出する抽出工程と、
含むことを特徴とする抽出方法。
【請求項8】
複数の投稿情報に対するユーザの反応である反応情報であって、第1ユーザ群に属するユーザの反応情報と、前記第1ユーザ群と異なる第2ユーザ群に属するユーザの反応情報とを取得する取得手順と、
前記複数の投稿情報のうち、第1投稿情報に対する前記第ユーザ群に属するユーザの反応情報が示す値に対する、前記第1投稿情報に対する前記第ユーザ群に属するユーザの反応情報を示す値の割合が、第2投稿情報に対する前記第2ユーザ群に属するユーザの反応情報が示す値に対する、前記第2投稿情報に対する前記第1ユーザ群に属するユーザの反応情報を示す値の割合よりも大きい場合に、前記第1ユーザ群に属するユーザが興味関心を示す投稿情報として前記第1投稿情報を抽出する抽出手順と、
をコンピュータに実行させることを特徴とする抽出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、抽出装置、抽出方法及び抽出プログラムに関する。
【背景技術】
【0002】
近年、インターネットの飛躍的な普及に伴い、例えば、ソーシャル・ネットワーキング・サービス(SNS)において、不特定多数のユーザがコメントの投稿を介して活発に情報交換を行っている。
【0003】
このような情報交換時にやり取りされるコメントから話題のキーワードを抽出する方法として、例えば、インターネットの投稿者の偏りを是正して、世間の話題に合ったキーワードのランキングを作成する技術が知られている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2016−139216号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の従来技術では、ユーザによって投稿された投稿情報から所定のユーザの特徴を高精度に抽出することができるとは限らない。例えば、上述の従来技術では、インターネットの投稿者の偏りを是正して、世間の話題に合ったキーワードのランキングを作成しているに過ぎず、ユーザによって投稿された投稿情報から所定のユーザの特徴を高精度に抽出することができるとは限らない。
【0006】
本願は、上記に鑑みてなされたものであって、ユーザによって投稿された投稿情報から所定のユーザの特徴を高精度に抽出することができる抽出装置、抽出方法及び抽出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る抽出装置は、所定の投稿情報に対するユーザの反応である反応情報であって、第1ユーザ群に属するユーザの反応情報と、前記第1ユーザ群と異なる第2ユーザ群に属するユーザの反応情報とを取得する取得部と、前記第1ユーザ群に属するユーザの反応情報と、前記第2ユーザ群に属するユーザの反応情報とに基づいて、前記第1ユーザ群に属するユーザが興味関心を示す投稿情報を抽出する抽出部と、を備えたことを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、ユーザによって投稿された投稿情報から所定のユーザの特徴を高精度に抽出することができるという効果を奏する。
【図面の簡単な説明】
【0009】
図1図1は、実施形態に係る抽出処理の一例を示す図である。
図2図2は、実施形態に係る抽出装置の構成例を示す図である。
図3図3は、実施形態に係るプロフィール情報記憶部の一例を示す図である。
図4図4は、実施形態に係る投稿情報記憶部の一例を示す図である。
図5図5は、実施形態に係る反応情報記憶部の一例を示す図である。
図6図6は、実施形態に係る抽出装置による抽出処理手順を示すフローチャートである。
図7図7は、抽出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る抽出装置、抽出方法及び抽出プログラムの実施形態について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。
【0011】
〔1.抽出装置の情報処理の一例〕
図1を用いて、実施形態に係る抽出処理の一例について説明する。図1は、実施形態に係る抽出処理の一例を示す図である。図1では、抽出装置100により抽出処理が実行される例を示す。
【0012】
図1に示すように、抽出システム1は、外部装置10と、端末装置20と、抽出装置100とを含む。外部装置10、端末装置20及び抽出装置100は、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、図1に示す抽出システム1には、複数台の外部装置10や、複数台の端末装置20や、複数台の抽出装置100が含まれてもよい。
【0013】
外部装置10は、SNSサーバであり、例えば、SNSに会員登録されているユーザによって投稿された記事やプロフィール画像等である投稿情報を受け付け、受け付けた投稿情報を記憶する。また、外部装置10は、あるユーザによって投稿された投稿情報に対する他のユーザの支持および不支持に関する情報や投稿情報に対する回覧や返信等に関する情報(以下、反応情報と表記する)を記憶する。そして、外部装置10は、ユーザによって投稿された投稿情報と、ユーザが投稿情報を投稿した回数である投稿回数と、投稿情報にユーザが反応した反応回数とを抽出装置100へ提供する。なお、実施形態における投稿回数とは、ユーザがあらゆる投稿情報を投稿した回数の総数を示し、反応回数とは、特定の投稿情報に対してユーザが反応した回数の総数を示す。
【0014】
端末装置20は、ブラウザに表示されるウェブページやアプリに表示されるコンテンツ等のウェブコンテンツにアクセスするユーザによって利用される情報処理装置である。例えば、端末装置20は、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット端末や、携帯電話機や、PDA(Personal Digital Assistant)等である。
【0015】
抽出装置100は、外部装置10から取得された投稿情報のうち、特定の有名人に関心を持つファンと呼ばれるユーザ(以下、ファンユーザと表記する)の特徴を示す投稿情報を抽出する。例えば、抽出装置100は、ファンユーザが所定の投稿情報に反応した反応回数およびファンユーザがある期間内に投稿情報を投稿した投稿回数の総数と、ファンユーザを含んだ全体のユーザ(以下、一般ユーザと表記する)が所定の投稿情報に反応した反応回数および一般ユーザがある期間内に投稿情報を投稿した投稿回数の総数(以下、投稿回数と表記する)とに基づいて、ファンユーザが興味関心を示す投稿情報を抽出する。
【0016】
以下、図1を用いて、抽出装置100による所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出する抽出処理の一例を流れに沿って説明する。
【0017】
まず、図1に示すように、抽出装置100は、一般ユーザによって投稿された投稿情報を外部装置10から取得する(ステップS1)。例えば、抽出装置100は、一般ユーザによって投稿された投稿情報と、一般ユーザによって投稿された投稿情報に反応した反応回数と、一般ユーザが投稿情報を投稿した投稿回数とを外部装置10から取得する。
【0018】
続いて、抽出装置100は、特定の有名人に関連するキーワードや画像等を含むプロフィールを有するユーザをファンユーザとして特定する(ステップS2)。例えば、抽出装置100は、有名人「XXXX」に関心を有するユーザのプロフィール画像や自己紹介文を含むプロフィール情報を外部装置10から取得する。そして、抽出装置100は、有名人「XXXX」とプロフィール情報を有するユーザを、有名人「XXXX」に関心のあるファンユーザとして特定する。
【0019】
続いて、抽出装置100は、ファンユーザの反応回数および投稿回数と一般ユーザの反応回数および投稿回数とに基づいて、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出する(ステップS3)。具体的には、抽出装置100は、ファンユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値が一般ユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値よりも所定の閾値以上である場合に、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出する。一方で、抽出装置100は、ファンユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値が一般ユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値よりも所定の閾値より小さい場合に、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出しない。
【0020】
例えば、投稿情報PO1に対する一般ユーザの反応回数が100であり、一般ユーザの投稿回数が1000であり、投稿情報PO1に対するファンユーザの反応回数が5であり、ファンユーザの投稿回数が100であるとする。この場合、抽出装置100は、一般ユーザの投稿回数「1000」に対する一般ユーザの投稿情報PO1に対する反応回数「100」の割合「0.1」と、ファンユーザの投稿回数「100」に対するファンユーザの投稿情報PO1に対する反応回数「5」の割合「0.05」とを算出する。ここで、投稿回数に対する反応回数の割合を算出する理由は、一般ユーザとファンユーザとの人数が異なるからである。具体的には、上記の通り、一般ユーザはファンユーザを含む全体のユーザであるので、一般ユーザの方がファンユーザよりも投稿回数や反応回数は多いことが当然に考えられる。そこで、抽出装置100は、投稿回数に対する反応回数の割合を算出することで、一般ユーザとファンユーザとの人数が異なることを解消し、正味の反応回数同士を比較する。上記例の場合、一般ユーザについて割合「0.1」が算出され、ファンユーザついて割合「0.05」が算出された。これは、一般ユーザの方がファンユーザよりも投稿情報PO1に対して興味や関心を有しているといえる。このため、抽出装置100は、ファンユーザが興味関心を示す投稿情報として、投稿情報PO1を抽出しない。
【0021】
一方、投稿情報PO2に対する一般ユーザの反応回数が100であり、一般ユーザの投稿回数が1000であり、投稿情報PO2に対するファンユーザの反応回数が50であり、ファンユーザの投稿回数が100であるとする。この場合、抽出装置100は、一般ユーザの投稿回数「1000」に対する一般ユーザの投稿情報PO2に対する反応回数「100」の割合「0.1」と、ファンユーザの投稿回数「100」に対するファンユーザの投稿情報PO2に対する反応回数「50」の割合「0.5」とを算出する。これは、ファンユーザの方が一般ユーザよりも投稿情報PO2に対して興味や関心を有しているといえる。このため、抽出装置100は、ファンユーザが興味関心を示す投稿情報として、投稿情報PO2を抽出する。なお、図1では、説明を簡単にするために、投稿回数に対する反応回数の割合を例に挙げて説明したが、投稿回数と反応回数とのカイ二乗平均値であってもよい。この点については後述する。
【0022】
続いて、抽出装置100は、ファンユーザが興味関心を示す投稿情報をユーザに提供する(ステップS4)。例えば、抽出装置100は、ユーザ用のタイムライン上にファンユーザが興味関心を示す投稿情報を表示させることで、投稿情報をユーザに提供する。なお、ユーザ用のタイムラインは、リアルタイム検索等によって実現される。
【0023】
このように、実施形態に係る抽出装置100は、ファンユーザが外部装置10から取得された投稿情報に反応した反応回数およびファンユーザが投稿情報を投稿した投稿回数と一般ユーザの反応回数および投稿回数とに基づいて、ファンユーザが興味関心を示す投稿情報を外部装置10から取得された投稿情報として抽出する。これにより、実施形態に係る抽出装置100は、ファンユーザが興味関心を示す投稿情報を高精度に抽出することができるため、ユーザに対してファンユーザ特有の情報を提供することができる。この点について説明する。第1ユーザ群に属するユーザ(例えば、ファンユーザ)と第2ユーザ群に属するユーザ(例えば、一般ユーザ)の所定の投稿情報に対する反応回数を比較することで、所定の投稿情報に対するファンユーザの興味や関心の度合いを把握することができる。ファンユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値が一般ユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値よりも所定の閾値以上である場合には、ファンユーザは所定の投稿情報に興味や関心を示すことを意味する。つまり、その所定の投稿情報は、ファンユーザが興味関心を示す投稿情報であることを意味する。したがって、抽出装置100は、ファンユーザが興味関心を示す投稿情報を高精度に抽出することができるため、ユーザに対してファンユーザにとって興味や関心の高い情報を提供することができる。
【0024】
〔2.抽出装置の構成〕
次に、図2を用いて、実施形態に係る抽出装置100の構成について説明する。図2は、実施形態に係る抽出装置100の構成例を示す図である。図2に示すように、抽出装置100は、通信部110と、記憶部120と、制御部130とを有する。
【0025】
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線又は無線で接続され、外部装置10と、端末装置20との間で情報の送受信を行う。
【0026】
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、プロフィール情報記憶部121、投稿情報記憶部122と、反応情報記憶部123とを有する。
【0027】
実施形態に係るプロフィール情報記憶部121は、SNSに会員登録されているユーザのプロフィールに関する情報を記憶する。ここで、図3に、実施形態に係るプロフィール情報記憶部121の一例を示す。図3に示した例では、プロフィール情報記憶部121は、「ユーザID」、「自己紹介文」、「プロフィール画像」といった項目を有する。
【0028】
「ユーザID」は、ユーザを識別するための識別情報を示す。「自己紹介文」は、ユーザによって投稿される自己紹介文を示す。「プロフィール画像」は、ユーザによって投稿されるプロフィール画像を示す。例えば、図3では、ユーザID「U1」によって識別されるユーザが、自己紹介文「IN1」と、プロフィール画像「PR1」とを投稿したことを示す。なお、自己紹介文は文字情報だけではなく、絵文字等の記号情報を含んでもよい。
【0029】
実施形態に係る投稿情報記憶部122は、ユーザによって投稿された投稿情報を記憶する。ここで、図4に、実施形態に係る投稿情報記憶部122の一例を示す。図4に示した例では、投稿情報記憶部122は、「ユーザID」、「投稿情報ID」、「投稿情報」といった項目を有する。
【0030】
「ユーザID」は、ユーザを識別するための識別情報を示す。「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「投稿情報」は、ユーザによって投稿される投稿内容を示す。例えば、図4では、ユーザID「U1」によって識別されるユーザが、投稿情報ID「PO1」によって識別される投稿情報である「XXXXが世界選手権でまた1位」を投稿したことを示す。なお、以下では、ユーザID「UN(Nは任意の数)」により識別されるユーザを「ユーザUN」と表記する場合がある。また、投稿情報ID「PON(Nは任意の数)」により識別される投稿情報を「投稿情報PON」と表記する場合がある。
【0031】
実施形態に係る反応情報記憶部123は、ユーザによって投稿された投稿情報に対する他のユーザの反応に関する情報を記憶する。ここで、図5に、実施形態に係る反応情報記憶部123の一例を示す。図5に示した例では、反応情報記憶部123は、「反応情報ID」、「ユーザID」、「投稿情報ID」、「反応回数」、といった項目を有する。
【0032】
「ユーザID」は、ユーザを識別するための識別情報を示す。「反応情報ID」は、ユーザによって投稿される投稿情報に対する他のユーザの反応を識別するための識別情報を示す。「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「反応回数」は、所定の投稿情報に対する一般ユーザが反応した回数を示す。例えば、図5では、ユーザU1によって投稿された投稿情報PO1が他のユーザによって反応された回数である反応回数が、10000であることを示す。
【0033】
制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、抽出装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0034】
図2に示すように、制御部130は、取得部131と、特定部132と、抽出部133と、提供部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図2に示した接続関係に限られず、他の接続関係であってもよい。
【0035】
取得部131は、所定の投稿情報に対するユーザの反応である反応情報であって、第1ユーザ群(ファンユーザ群に相当)に属するユーザの反応情報と、ファンユーザ群と異なる第2ユーザ群(一般ユーザ群に相当)に属するユーザの反応情報とを取得する。具体的には、取得部131は、ファンユーザ群に属するユーザの反応情報として、ファンユーザ群に属するユーザが所定の投稿情報に反応した回数である反応回数を取得し、一般ユーザ群に属するユーザの反応情報として、一般ユーザ群に属するユーザが所定の投稿情報に反応した回数である反応回数を取得する。また、取得部131は、ファンユーザ群に属するユーザが投稿情報を投稿した回数である投稿回数と、一般ユーザ群に属するユーザが投稿情報に投稿した回数である投稿回数とをさらに取得する。
【0036】
例えば、取得部131は、ユーザによって投稿された投稿情報を外部装置10から取得する。また、取得部131は、ユーザが所定の投稿情報に反応した回数である反応回数とユーザが投稿情報を投稿した回数である投稿回数とを外部装置10から取得する。また、取得部131は、特定の人物又は特定のキャラクターに関心を有するユーザのプロフィール画像や自己紹介文を含むプロフィール情報を外部装置10から取得する。そして、取得部131は、外部装置10から取得されたプロフィール情報をプロフィール情報記憶部121に格納し、外部装置10から取得された投稿情報と投稿回数とを投稿情報記憶部122に格納し、外部装置10から取得された反応回数を反応情報記憶部123に格納する。
【0037】
特定部132は、取得部131によって取得された投稿情報を投稿したユーザのうち、特定の有名人に関連するキーワードや画像等を含むプロフィールを有するユーザをファンユーザとして特定する。例えば、特定部132は、有名人「XXXX」とプロフィール情報記憶部121に記憶されている情報を検索することで、有名人「XXXX」に関心のあるユーザを特定する。
【0038】
抽出部133は、ファンに属するユーザの反応情報と、一般ユーザ群に属するユーザの反応情報とに基づいて、ファンユーザ群に属するユーザが興味関心を示す投稿情報を抽出する。また、抽出部133は、ファンユーザ群における反応回数および投稿回数と、一般ユーザ群における反応回数および投稿回数とに基づいて、ファンユーザ群に属するユーザが興味関心を示す投稿情報を抽出する。
【0039】
具体的には、抽出部133は、ファンユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値が一般ユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値よりも所定の閾値以上である場合に、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出する。一方で、抽出部133は、ファンユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値が一般ユーザの投稿回数に対する所定の投稿情報に反応した反応回数の割合に関する値よりも所定の閾値より小さい場合に、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出しない。
【0040】
例えば、抽出部133は、所定の投稿情報に反応した反応回数およびユーザが投稿情報を投稿した投稿回数を用いてカイ二乗平均値を算出することで、ファンユーザが興味関心を示す投稿情報を抽出するとする。また、投稿情報PO1に対する一般ユーザの反応回数は100であり、一般ユーザの投稿回数は1000であり、投稿情報PO1に対するファンユーザの反応回数は5であり、ファンユーザの投稿回数は100であるとする。また、投稿情報PO2に対する一般ユーザの反応回数は100であり、一般ユーザの投稿回数は1000であり、投稿情報PO2に対するファンユーザの反応回数は50であり、ファンユーザの投稿回数は100であるとする。この場合、抽出部133は、投稿情報PO1に対するファンユーザのカイ二乗平均値が一般ユーザのカイ二乗平均値よりも小さく、投稿情報PO2に対するファンユーザのカイ二乗平均値が一般ユーザのカイ二乗平均値よりも大きいため、ファンユーザが興味関心を示す投稿情報PO2を抽出する。
【0041】
提供部134は、抽出部133によって抽出されたファンユーザが興味関心を示す投稿情報をユーザに提供する。例えば、提供部134は、ユーザ用のタイムライン上にファンユーザが興味関心を示す投稿情報を表示させることで、かかる投稿情報をユーザに提供する。
【0042】
〔3.抽出装置による抽出処理手順の一例を示すフローチャート〕
次に、図6を用いて、抽出装置100による抽出処理手順の一例の手順について説明する。図6は、実施形態に係る抽出装置100による抽出処理手順を示すフローチャートである。
【0043】
図6に示すように、取得部131は、外部装置10から、一般ユーザによって投稿された投稿情報と、投稿回数と、反応回数とを取得する(ステップS101)。そして、特定部132は、一般ユーザから、特定の有名人に関連するキーワードや画像等を含むプロフィールを有するユーザをファンユーザとして特定する(ステップS102)。
【0044】
続いて、抽出部133は、取得部131によって取得されたファンユーザの反応回数および投稿回数とユーザの反応回数および投稿回数とに基づいて、ファンユーザのカイ二乗平均値がユーザのカイ二乗平均値より大きい場合に(ステップS103;Yes)、ファンユーザが興味関心を示す投稿情報を抽出する(ステップS104)。例えば、抽出部133は、ファンユーザの反応回数および投稿情報におけるカイ二乗平均値が一般ユーザの反応回数および投稿回数におけるカイ二乗平均値よりも所定の閾値以上である場合に、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出する。そして、提供部134は、抽出部133によって抽出された投稿情報をユーザへ提供する(ステップS105)。
【0045】
一方、抽出部133は、取得部131によって取得されたファンユーザの反応回数および投稿回数とユーザの反応回数および投稿回数とに基づいて、ファンユーザのカイ二乗平均値がユーザのカイ二乗平均値より小さい場合に(ステップS103;No)、ファンユーザが興味関心を示す投稿情報を抽出しない(ステップS106)。例えば、抽出部133は、ファンユーザの反応回数および投稿情報におけるカイ二乗平均値が一般ユーザの反応回数および投稿回数におけるカイ二乗平均値よりも所定の閾値より小さい場合に、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出しない。
【0046】
〔4.変形例〕
上述した抽出装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、抽出装置100の他の実施形態について説明する。
【0047】
〔4−1.特定処理〕
上記実施形態において、抽出装置100の特定部132は、特定の有名人に関連するキーワードや画像等を含むプロフィールを有する第1ユーザ群に属するユーザをファンユーザとして特定する例を示したが、特定部132によって特定された第1ユーザ群に属するユーザはファンユーザに限らず、ユーザの属性情報等によって第1ユーザ群に属するユーザを特定してもよい。例えば、抽出装置100の特定部132は、端末装置20から予め取得された属性情報が示す居住地域に基づいて、特定の地域に居住するユーザを第1ユーザ群に属するユーザとして特定してもよい。
【0048】
〔4−2.抽出処理〕
上記実施形態において、抽出装置100の抽出部133は、ファンユーザの反応回数および投稿回数と一般ユーザの反応回数と投稿回数とに基づいて、ファンユーザの特徴を示す投稿情報を抽出する例を示したが、ファンユーザの反応回数と一般ユーザの反応回数とに基づいて、所定の投稿情報をファンユーザが興味関心を示す投稿情報として抽出してもよい。
【0049】
具体的には、抽出装置100の抽出部133は、ファンユーザ群における反応回数と、一般ユーザ群における反応回数とに基づいて、ファンユーザ群に属するユーザが興味関心を示す投稿情報として所定の投稿情報を抽出する。例えば、投稿情報PO1に対する一般ユーザの反応回数が100であり、投稿情報PO1に対するファンユーザの反応回数5であるとする。また、投稿情報PO2に対する一般ユーザの反応回数100であり、投稿情報PO2に対するファンユーザの反応回数50であるとする。この場合、抽出装置100の抽出部133は、投稿情報PO2のファンユーザの反応回数が投稿情報PO1のファンユーザの反応回数よりも大きいため、ファンユーザが興味関心を示す投稿情報PO2を抽出してもよい。
【0050】
〔4−3.提供方法(1)〕
上記実施形態において、抽出装置100の提供部134は、上述ではファンユーザが興味関心を示す投稿情報を提供すると説明してきたが、投稿情報の提供に限らず、ファンユーザが興味関心を示す投稿情報を広告としてファンユーザに提供してもよい。
【0051】
〔4−4.提供方法(2)〕
上記実施形態において、抽出装置100の提供部134は、ファンユーザが興味関心を示す投稿情報を提供する例を示したが、ファンユーザが興味関心を示す投稿情報をランキング形式で提示してもよい。具体的には、抽出装置100の提供部134は、ファンユーザの反応回数と一般ユーザの反応回数とに基づいて、反応回数を指標として反応回数が高い順に順位付けを行ってもよい。
【0052】
例えば、抽出装置100の提供部134は、ファンユーザの反応回数と一般ユーザの反応回数とに基づいて、ファンユーザが興味関心を示す投稿情報を提供する。この場合、抽出装置100の提供部134は、ファンユーザの反応回数と一般ユーザの反応回数とに基づいて、反応回数が高い順に「1位投稿情報PO1、2位投稿情報PO4、3位投稿情報PO3、4位投稿情報PO5、5位投稿情報PO2」のように順位付けを行う。そして、抽出装置100の提供部134は、かかる投稿情報のランキングに関する情報を端末装置20へ提供する。
【0053】
〔4−5.提供方法(3)〕
上記実施形態において、抽出装置100の提供部134は、上述ではファンユーザが興味関心を示す投稿情報を提供すると説明してきたが、提供部134によって提供される投稿情報のうちファンユーザが興味関心を示すキーワードを提供してもよい。
【0054】
〔5.ハードウェア構成〕
また、上述してきた実施形態に係る外部装置10、端末装置20、抽出装置100は、例えば図7に示すような構成のコンピュータ1000によって実現される。以下、抽出装置100を例に挙げて説明する。図7は、抽出装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0055】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0056】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100がネットワークNを介して生成したデータを他の機器へ送信する。
【0057】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0058】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0059】
例えば、コンピュータ1000が実施形態に係る抽出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0060】
〔6.効果〕
上述してきたように、実施形態に係る抽出装置100は、取得部131と、抽出部133とを有する。取得部131は、所定の投稿情報に対するユーザの反応である反応情報であって、第1ユーザ群に属するユーザ(ファンユーザに相当)の反応情報と、第1ユーザ群と異なる第2ユーザ群に属するユーザ(一般ユーザに相当)の反応情報とを取得する。抽出部133は、第1ユーザ群に属するユーザの反応情報と、第2ユーザ群に属するユーザの反応情報とに基づいて、第1ユーザ群に属するユーザが興味関心を示す投稿情報を抽出する。
【0061】
これにより、実施形態に係る抽出装置100は、投稿情報に対するファンユーザの反応情報とユーザの反応情報とに基づくため、ファンユーザが興味関心を示す投稿情報を高精度に抽出することができる。
【0062】
また、実施形態に係る抽出装置100において、取得部131は、第1ユーザ群に属するユーザの反応情報として、第1ユーザ群に属するユーザが所定の投稿情報に反応した回数である反応回数を取得し、第2ユーザ群に属するユーザの反応情報として、第2ユーザ群に属するユーザが所定の投稿情報に反応した回数である反応回数を取得し、抽出部133は、第1ユーザ群における反応回数と、第2ユーザ群における反応回数とに基づいて、第1ユーザ群に属するユーザが興味関心を示す投稿情報を抽出する。
【0063】
これにより、実施形態に係る抽出装置100は、ファンユーザが投稿情報に反応した回数である反応回数とユーザの反応情報とに基づくため、ファンユーザが興味関心を示す投稿情報を高精度に抽出することができる。
【0064】
また、実施形態に係る抽出装置100において、取得部131は、第1ユーザ群に属するユーザが投稿情報を投稿した回数である投稿回数と、第2ユーザ群に属するユーザが投稿情報を投稿した回数である投稿回数とをさらに取得し、抽出部133は、第1ユーザ群における反応回数および投稿回数と、第2ユーザ群における反応回数および投稿回数とに基づいて、第1ユーザ群に属するユーザが興味関心を示す投稿情報を抽出する。
【0065】
これにより、実施形態に係る抽出装置100は、ファンユーザが投稿情報を投稿した回数である投稿回数および反応回数とユーザの投稿情報および反応情報とに基づくため、ファンユーザが興味関心を示す投稿情報を高精度に抽出することができる。
【0066】
また、実施形態に係る抽出装置100において、取得部131は、第2ユーザ群として第1ユーザ群を含むユーザ群に属するユーザの反応情報を取得する。
【0067】
また、実施形態に係る抽出装置100において、取得部131は、特定の人物又は特定のキャラクターに関心を有するユーザ群である第1ユーザ群における反応情報を取得する。
【0068】
また、実施形態に係る抽出装置100において、取得部131は、特定の人物又は特定のキャラクターが含まれるプロフィール情報を有するユーザ群である第1ユーザ群における反応情報を取得する。
【0069】
これにより、実施形態に係る抽出装置100は、ファンユーザとユーザとを明確に分けることでファンユーザの反応情報とユーザの反応情報とをより詳細に比較できるため、ファンユーザが興味関心を示す投稿情報を高精度に抽出することができる。
【0070】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【符号の説明】
【0071】
1 抽出システム
10 外部装置
20 端末装置
100 抽出装置
110 通信部
120 記憶部
121 プロフィール情報記憶部
122 投稿情報記憶部
123 反応情報記憶部
130 制御部
131 取得部
132 特定部
133 抽出部
134 提供部
図1
図2
図3
図4
図5
図6
図7