IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

<>
  • 特許-算出装置、算出方法及び算出プログラム 図1
  • 特許-算出装置、算出方法及び算出プログラム 図2
  • 特許-算出装置、算出方法及び算出プログラム 図3
  • 特許-算出装置、算出方法及び算出プログラム 図4
  • 特許-算出装置、算出方法及び算出プログラム 図5
  • 特許-算出装置、算出方法及び算出プログラム 図6
  • 特許-算出装置、算出方法及び算出プログラム 図7
  • 特許-算出装置、算出方法及び算出プログラム 図8
  • 特許-算出装置、算出方法及び算出プログラム 図9
  • 特許-算出装置、算出方法及び算出プログラム 図10
  • 特許-算出装置、算出方法及び算出プログラム 図11
  • 特許-算出装置、算出方法及び算出プログラム 図12
  • 特許-算出装置、算出方法及び算出プログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】算出装置、算出方法及び算出プログラム
(51)【国際特許分類】
   G06F 16/00 20190101AFI20231121BHJP
   G06F 16/30 20190101ALI20231121BHJP
【FI】
G06F16/00
G06F16/30
【請求項の数】 3
(21)【出願番号】P 2017166532
(22)【出願日】2017-08-31
(65)【公開番号】P2019046016
(43)【公開日】2019-03-22
【審査請求日】2020-03-09
【審判番号】
【審判請求日】2022-09-13
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】佐藤 翔太
(72)【発明者】
【氏名】バッタチャルジ アヌパム
【合議体】
【審判長】吉田 美彦
【審判官】須田 勝巳
【審判官】中村 信也
(56)【参考文献】
【文献】国際公開第2012/111226(WO,A1)
【文献】特開2016-110213(JP,A)
【文献】特開2012-155695(JP,A)
【文献】黒橋 禎夫,「知能コンピューティングとその周辺」〔第4回〕言語コンピューティング,人工知能学会誌,(社)人工知能学会,2007年09月01日,第22巻 第5号,pp.711~718
【文献】佐々木 智,取るべき行動と理由を提示するヘルプデスク指向の質問応答システム,第2回データ工学と情報マネジメントに関するフォーラム-DEIM 2010-論文集[online],電子情報通信学会データ工学研究専門委員会,2010年05月25日,Internet<URL:http://db-event.jpn.org/deim2010/proceedings/files/A8-5.pdf>
【文献】田島 真悟,短期持続型情報要求のためのTwitter上でのアドホックなフォローネットワーク構成手法,第5回データ工学と情報マネジメントに関するフォーラム(第11回日本データベース学会年次大会)[online],電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2013年05月31日,Internet<URL:http://db-event.jpn.org/deim2013/proceedings/pdf/b1-5.pdf>
【文献】池田 諭史,機能語の補完を用いた濃縮還元型要約モデル,言語処理学会第13回年次大会発表論文集,言語処理学会,2007年03月19日,pp.1152~1155
【文献】松本 悠,強化学習を用いた文圧縮手法,言語処理学会第22回年次大会 発表論文集 [online],言語処理学会,2016年02月29日,pp.465~468,Internet<URL:http://www.anlp.jp/proceedings/annual_meeting/2016/pdf_dir/P11-5.pdf>
【文献】野畑 周,複数記事に対する要約や情報抽出に関する一考察,言語処理学会第8回年次大会発表論文集,言語処理学会,2002年03月18日,pp.547~550
【文献】新田 直子,単語間の関係性の経時変化を考慮したマイクロブログからの実世界観測情報の抽出,日本データベース学会和文論文誌,日本データベース学会,2014年10月31日,第13-J巻 第1号,pp.7~12
【文献】藤村 春輝,電子投票のための意思決定支援システムにおけるアンケート作成支援システムの試み,第9回データ工学と情報マネジメントに関するフォーラム (第15回日本データベース学会年次大会) [online],電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2017年2月27日,[2017年7月6日検索]Internet<URL:http://db-event.jpn.org/deim2017/papers/2.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06F 40/20-40/58
(57)【特許請求の範囲】
【請求項1】
ユーザによって投稿される投稿情報であって、第1キーワード情報と、前記第1キーワード情報と関連する第2キーワード情報との双方を含む複数の投稿情報を取得する取得部と、
前記複数の投稿情報から前記第1キーワード情報と前記第2キーワード情報の位置の近さに基づいて、前記第1キーワード情報と前記第2キーワード情報との位置が最も近い投稿情報を選択する選択部と、
選択された前記投稿情報に含まれる前記第1キーワード情報が示す第1キーワードと、前記第2キーワード情報が示す第2キーワードとの係り受けの関係性に基づいて関連度を算出する算出部と、
選択された前記投稿情報に基づいて要約を生成する生成部と、
前記算出部によって算出された関連度が所定の閾値上である場合に、生成された前記要約ユーザに提供する提供部と
を備えたことを特徴とする算出装置。
【請求項2】
コンピュータが実行する算出方法であって、
ユーザによって投稿される投稿情報であって、第1キーワード情報と、前記第1キーワード情報と関連する第2キーワード情報との双方を含む複数の投稿情報を取得する取得工程と、
前記複数の投稿情報から前記第1キーワード情報と前記第2キーワード情報の位置の近さに基づいて、前記第1キーワード情報と前記第2キーワード情報との位置が最も近い投稿情報を選択する選択工程と、
選択された前記投稿情報に含まれる前記第1キーワード情報が示す第1キーワードと、前記第2キーワード情報が示す第2キーワードとの係り受けの関係性に基づいて関連度を算出する算出工程と、
選択された前記投稿情報に基づいて要約を生成する生成工程と、
前記算出工程によって算出された関連度が所定の閾値上である場合に、生成された前記要約ユーザに提供する提供工程と
含むことを特徴とする算出方法。
【請求項3】
ユーザによって投稿される投稿情報であって、第1キーワード情報と、前記第1キーワード情報と関連する第2キーワード情報との双方を含む複数の投稿情報を取得する取得手順と、
前記複数の投稿情報から前記第1キーワード情報と前記第2キーワード情報の位置の近さに基づいて、前記第1キーワード情報と前記第2キーワード情報との位置が最も近い投稿情報を選択する選択手順と、
選択された前記投稿情報に含まれる前記第1キーワード情報が示す第1キーワードと、前記第2キーワード情報が示す第2キーワードとの係り受けの関係性に基づいて関連度を算出する算出手順と、
選択された前記投稿情報に基づいて要約を生成する生成手順と、
前記算出手順によって算出された関連度が所定の閾値上である場合に、生成された前記要約ユーザに提供する提供手順と
をコンピュータに実行させることを特徴とする算出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、算出装置、算出方法及び算出プログラムに関する。
【背景技術】
【0002】
従来、ユーザから入力されたクエリを集計して出力する情報処理装置によって、他のユーザが入力したクエリを参考に検索したいユーザのために、検索頻度が急上昇している注目のクエリをかかるユーザへ出力することが行われている。
【0003】
注目のクエリを抽出する方法として、例えば、検索頻度が急上昇したクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をあわせて抽出できる技術が知られている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2013-37404号公報
【文献】国際公開第2012/127968号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の従来技術では、キーワード情報同士の関連度を高精度で算出できるとは限らない。例えば、上述の従来技術では、検索頻度が急上昇したクエリを抽出するとともに、何故、検索頻度が急上昇したか、その理由をあわせて抽出しているに過ぎず、キーワード情報同士の関連度を高精度で算出できるとは限らない。
【0006】
本願は、上記に鑑みてなされたものであって、キーワード情報同士の関連度を高精度で算出できる算出装置、算出方法及び算出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る算出装置は、ユーザによって投稿される投稿情報を取得する取得部と、前記取得部によって取得された投稿情報に基づいて、第1キーワード情報と、前記第1キーワード情報と関連する第2キーワード情報との関連度を算出する算出部と、を備えたことを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、キーワード情報同士の関連度を高精度で算出できるという効果を奏する。
【図面の簡単な説明】
【0009】
図1図1は、第1の実施形態に係る算出処理の一例を示す図である。
図2図2は、第1の実施形態に係る算出処理における人名と関連語との位置関係を例示する概念図である。
図3図3は、第1の実施形態に係る算出装置の構成例を示す図である。
図4図4は、第1の実施形態に係る投稿情報記憶部の一例を示す図である。
図5図5は、第1の実施形態に係る関連度情報記憶部の一例を示す図である。
図6図6は、第1の実施形態に係る要約情報記憶部の一例を示す図である。
図7図7は、第1の実施形態に係る算出装置による算出処理手順を示すフローチャートである。
図8図8は、第2の実施形態に係る算出処理の一例を示す図である。
図9図9は、第2の実施形態に係る算出装置の構成例を示す図である。
図10図10は、第2の実施形態に係る投稿情報記憶部の一例を示す図である。
図11図11は、第2の実施形態に係る算出装置による算出処理手順を示すフローチャートである。
図12図12は、変形例に係る算出処理における投稿情報を選択する処理の一例を示す図である。
図13図13は、算出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る算出装置、算出方法及び算出プログラムの実施形態について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る算出装置、算出方法及び算出プログラムが限定されるものではない。
【0011】
〔1.第1の実施形態〕
〔1-1.算出装置の情報処理の一例〕
図1を用いて、第1の実施形態に係る算出処理の一例について説明する。図1は、第1の実施形態に係る算出処理の一例を示す図である。図1では、算出装置100により算出処理が実行される例を示す。
【0012】
図1に示すように、算出システム1は、外部装置10と、端末装置20と、算出装置100とを含む。外部装置10、端末装置20及び算出装置100は、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、図1に示す算出システム1には、複数台の外部装置10や、複数台の端末装置20や、複数台の算出装置100が含まれてもよい。
【0013】
第1の実施形態に係る外部装置10は、SNSサーバであり、例えば、会員登録されているユーザから記事やプロフィール画像等を投稿された投稿情報を受け付け、受け付けた投稿情報を記憶する。そして、外部装置10は、ユーザによって投稿された投稿情報を算出装置100へ提供する。図1に示す例において、外部装置10は、ユーザによって投稿された投稿情報を提供するSNSサーバ装置である場合を例として説明する。また、図1に示す例において、外部装置10の記憶部は、ユーザによって投稿された投稿情報を記憶するものとする。
【0014】
第1の実施形態に係る端末装置20は、ブラウザに表示されるウェブページやアプリに表示されるコンテンツ等のウェブコンテンツにアクセスするユーザによって利用される情報処理装置である。例えば、端末装置20は、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット端末や、携帯電話機や、PDA(Personal Digital Assistant)等である。
【0015】
第1の実施形態に係る算出装置100は、例えば、ニュース記事やブログ等で注目されるキーワードであるバズワードを第1キーワード情報として抽出し、ニュース記事やブログ等で第1キーワード情報と共起されるキーワードや高頻度で登場するキーワードを第1キーワード情報に関連する第2キーワード情報(以下、関連語と表記する)として抽出する。そして、算出装置100は、ユーザによって投稿された投稿情報のうち、第1キーワード情報と関連語との位置の近さに基づいて、投稿情報を選択する。そして、算出装置100は、かかる投稿情報を要約として生成する。以下、算出装置100により、人名である第1キーワード情報と、サ変名詞である関連語との関連度の算出処理が実行される一例を説明する。
【0016】
具体的には、算出装置100は、ユーザによって投稿された投稿情報を外部装置10から取得する。そして、算出装置100は、外部装置10から取得された投稿情報に人名と人名に関連する関連語とが含まれる場合に、人名と関連語との位置の近さに基づいて投稿情報を選択する。続いて、算出装置100は、人名と関連語との位置が最も近い投稿情報における人名と関連語との関連度を算出する。そして、算出装置100は、人名と関連語との位置が最も近い投稿情報を要約として生成する。
【0017】
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「当選」であるとする。この場合、算出装置100は、ユーザによって投稿された投稿情報を外部装置10から取得する。そして、算出装置100は、外部装置10から取得された投稿情報に「XXXX」と「当選」とが含まれる場合に、「XXXX」と「当選」との位置の近さが最も近い投稿情報を選択する。続いて、算出装置100は、「XXXX」と「当選」との位置が近い投稿情報における「XXXX」と「当選」との関連度を算出する。そして、算出装置100は、「XXXX」と「当選」との位置の近さが最も近い投稿情報を要約として生成する。
【0018】
以下、図1を用いて、算出装置100によるユーザによって投稿された投稿情報に基づいて人名と関連語との関連度の算出処理の一例を流れに沿って説明する。
【0019】
まず、図1に示すように、算出装置100は、ユーザによって投稿された投稿情報ST11~ST16を外部装置10から取得する(ステップS1)。そして、算出装置100は、ユーザによって投稿された投稿情報に人名と関連語とが含まれる場合に、人名と関連語との位置の近さに基づいて、投稿情報ST14を選択する(ステップS2)。
【0020】
ここで、図2を用いて、ユーザに投稿された投稿情報ST21~ST24から、人名と関連語との位置の近さに基づいて、投稿情報ST22を選択する処理について説明する。図2は、第1の実施形態に係る算出処理における人名と関連語との位置関係を例示する概念図である。図2に示すように、投稿情報ST21「XXXXAAAAAAAAAAAAAAAAAAAA当選」では、人名「XXXX」と関連語「当選」との間が「A」という任意の文字によって占められており、このときの「A」の文字数は20文字である。そして、投稿情報ST22では人名と関連語との間の「A」の文字数は5文字であり、投稿情報ST23では人名と関連語との間の「A」の文字数は7文字であり、投稿情報ST24では人名と関連語との間の「A」の文字数は9文字である。そして、算出装置100は、投稿情報ST21~ST24の中から人名と関連語との間の「A」の文字数が最も小さい投稿情報ST22を選択する。すなわち、算出装置100は、人名と関連語との位置の近さが最も近い投稿情報ST22を選択する。
【0021】
図1に戻り、第1の実施形態に係る算出処理の一例を説明する。算出装置100は、人名と関連語との位置が最も近い投稿情報ST14における人名と関連語との関連度を算出する(ステップS3)。例えば、算出装置100は、KNPやCaboCha(カボチャ)等の係り受け解析を用いて、投稿情報ST14「XXXXが大統領選に当選」における人名「XXXX」と関連語「当選」との関連度を90%として算出する。
【0022】
続いて、算出装置100は、投稿情報ST14を要約としてユーザに提供する(ステップS4)。例えば、算出装置100は、プッシュ通知やリアルタイム検索等の技術により要約をユーザに提供する。なお、算出装置100は、関連度が所定の閾値以上である場合に、投稿情報ST14を要約としてユーザに提供してもよい。
【0023】
このように、第1の実施形態に係る算出装置100は、外部装置10から取得された投稿情報に含まれる人名と関連語との位置の近さに基づいて、人名と関連語との位置が最も近い投稿情報を選択する。そして、算出装置100は、投稿情報に含まれる人名と関連語との関連度を算出する。これにより、第1の実施形態に係る算出装置100は、人名と関連語との位置の近さに基づいて選択された投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
【0024】
〔1-2.算出装置の構成〕
次に、図3を用いて、第1の実施形態に係る算出装置100の構成について説明する。図3は、第1の実施形態に係る算出装置100の構成例を示す図である。図3に示すように、算出装置100は、通信部110と、記憶部120と、制御部130とを有する。
【0025】
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線又は無線で接続され、外部装置10と端末装置20との間で情報の送受信を行う。
【0026】
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、投稿情報記憶部121と、関連度情報記憶部122と、要約情報記憶部123とを有する。
【0027】
第1の実施形態に係る投稿情報記憶部121は、ユーザによって投稿された投稿情報を記憶する。ここで、図4に、第1の実施形態に係る投稿情報記憶部121の一例を示す。図4に示した例では、投稿情報記憶部121は、「ユーザID」、「投稿情報ID」、「投稿情報」といった項目を有する。
【0028】
「ユーザID」は、ユーザを識別するための識別情報を示す。「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「投稿情報」は、ユーザによって投稿される投稿内容を示す。例えば、図4では、ユーザID「U1」によって識別されるユーザが、投稿情報ID「PO1」によって識別される投稿情報である「XXXXがYYYを下し、大統領に当選」を投稿したことを示す。なお、以下では、投稿情報ID「PON(Nは任意の数)」により識別される投稿情報を「投稿情報PON」と表記する場合がある。
【0029】
第1の実施形態に係る関連度情報記憶部122は、ユーザによって投稿される投稿内容に含まれる人名と人名に関連する関連語とに関する情報を記憶する。ここで、図5に、第1の実施形態に係る関連度情報記憶部122の一例を示す。図5に示した例では、関連度情報記憶部122は、「投稿情報ID」、「人名」、「関連語」、「関連度」といった項目を有する。
【0030】
「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「人名」は、ユーザによって投稿される投稿情報に含まれる人名を示す。「関連語」は、ユーザによって投稿される投稿情報に含まれる人名に関連する関連語を示す。「関連度」は、ユーザによって投稿される投稿情報に含まれる人名と関連語との関連度(例えば、単位は%)を示す。例えば、図5では、投稿情報PO1における人名は、「XXXX」であり、かかる人名「XXXX」に関連する関連語は、「当選」であり、人名「XXXX」と関連語「当選」との関連度は、90%であることを示す。
【0031】
第1の実施形態に係る要約情報記憶部123は、ユーザによって投稿される投稿内容を要約した要約に関する情報を記憶する。ここで、図6に、第1の実施形態に係る要約情報記憶部123の一例を示す。図6に示した例では、要約情報記憶部123は、「要約情報ID」、「投稿情報ID」、「要約情報」といった項目を有する。
【0032】
「要約情報ID」は、ユーザによって投稿される投稿情報を要約した要約情報を識別するための識別情報を示す。「投稿情報ID」は、ユーザによって投稿される投稿情報を識別するための識別情報を示す。「要約情報」は、ユーザによって投稿される投稿情報を要約した要約内容を示す。例えば、図6では、要約情報ID「SU1」は、投稿情報PO1に対応した要約であり、かかる要約内容は要約情報「XXXXが大統領選に当選」であることを示す。
【0033】
制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、算出装置100内部の記憶装置に記憶されている各種プログラム(算出プログラムの一例)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0034】
図3に示すように、制御部130は、取得部131と、選択部132と、算出部133と、生成部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
【0035】
取得部131は、ユーザによって投稿される投稿情報を外部装置10から取得する。例えば、取得部131は、人名と関連語とを含む投稿情報を取得する。そして、取得部131は、投稿情報を投稿情報記憶部121に格納する。
【0036】
選択部132は、取得部131によって取得された第1キーワード情報(人名に相当)と第2キーワード情報(関連語に相当)との双方が含まれる投稿情報のうち、人名と関連語との位置の近さに基づいて投稿情報を選択する。
【0037】
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「当選」であるとする。この場合、図4の例では、選択部132は、取得部131によって取得された投稿情報に「XXXX」と「当選」とが含まれる場合に、「XXXX」と「当選」との位置の近さに基づいて投稿情報PO5を選択する。
【0038】
算出部133は、取得部131によって取得された投稿情報に基づいて、人名と、人名と関連する関連語との関連度を算出する。具体的には、算出部133は、取得部131によって取得された投稿情報のうち、人名と関連語との双方が含まれる投稿情報に基づいて、人名と関連語との関連度を算出する。例えば、図5の例では、算出部133は、選択部132によって選択された人名と関連語とを含む投稿情報において、KNPやCaboCha等の係り受け解析を用いて、人名「XXXX」と関連語「当選」との関連度を90%として算出する。そして、算出部133は、関連度を関連度情報記憶部122に格納する。
【0039】
生成部134は、取得部131によって取得された投稿情報のうち、所定の基準によって選択された投稿情報に基づいて要約を生成する。具体的には、生成部134は、選択部132によって選択された投稿情報を要約として生成する。例えば、図6の例では、生成部134は、選択部132によって選択された投稿情報「XXXXが大統領選に当選」を要約として生成する。なお、生成部134は、選択部132によって選択された投稿情報を適宜編集することで、要約を生成してもよい。例えば、人名「XXXX」と関連語「当選」を残し、他の文字を短縮する。
【0040】
提供部135は、生成部134によって生成された要約をユーザに提供する。例えば、提供部135は、算出部133によって算出された関連度が所定の閾値以上である場合に、プッシュ通知やリアルタイム検索等の技術により生成部134によって生成された要約をユーザに提供する。また、提供部135は、生成部134によって生成された要約のうち、算出部133によって算出された関連度が最も大きい要約をユーザに提供してもよい。なお、提供部135は、算出部133によって算出された関連度が所定の閾値以上である場合に、生成部134によって生成された要約をユーザに提供してもよい。
【0041】
〔1-3.算出装置による算出処理手順の一例を示すフローチャート〕
次に、図7を用いて、第1の実施形態に係る算出装置100による算出処理手順の一例の手順について説明する。図7は、第1の実施形態に係る実施形態に係る算出装置100による算出処理手順を示すフローチャートである。
【0042】
図7に示すように、取得部131は、外部装置10から、ユーザによって投稿された投稿情報を取得する(ステップS101)。そして、選択部132は、取得部131によって取得された投稿情報に人名と関連語とがともに含まれる場合に、人名と関連語との位置の近さに基づいて投稿情報を選択する(ステップS102)。そして、算出部133は、選択部132によって選択された投稿情報において人名と関連語との関連度を算出する(ステップS103)。そして、生成部134は、選択部132によって選択された人名と関連語との位置が最も近い投稿情報を要約として生成する(ステップS104)。そして、提供部135は、算出部133によって算出された関連度が所定の閾値以上である場合に(ステップS105;Yes)、生成部134によって生成された要約をユーザに提供する(ステップS106)。一方、提供部135は、算出部133によって算出された関連度が所定の閾値より小さい場合に(ステップS105;No)、ステップS102の処理の前まで戻る。
【0043】
このように、第1の実施形態に係る算出装置100は、外部装置10から取得された投稿情報に含まれる人名と関連語との位置の近さに基づいて、人名と関連語との位置が最も近い投稿情報を選択する。そして、算出装置100は、投稿情報に含まれる人名と関連語との関連度を算出する。これにより、第1の実施形態に係る算出装置100は、人名と関連語との位置の近さに基づいて選択された投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
【0044】
〔2.第2の実施形態〕
〔2-1.算出装置の情報処理の一例〕
次に、第2の実施形態について説明する。上述してきた第1の実施形態では、算出装置100は、人名と関連語とがともに含まれる投稿情報に対する算出処理の一例を説明した。第2の実施形態では、算出装置200が、人名と関連語とがともに含まれない投稿情報に対する算出処理の例を示す。なお、第2の実施形態では、第1の実施形態と同様の構成について同一の符号を付して説明を省略する。
【0045】
図8を用いて、第2の実施形態に係る算出処理の一例について説明する。図8は、第2の実施形態に係る算出処理の一例を示す図である。図8では、算出装置200により算出処理が実行される例を示す。
【0046】
図8に示すように、算出システム2は、外部装置10と、端末装置20と、算出装置200とを含む。外部装置10、端末装置20及び算出装置200は、図示しない所定の通信網を介して、有線又は無線により通信可能に接続される。なお、図8に示す算出システム2には、複数台の外部装置10や、複数台の端末装置20や、複数台の算出装置200が含まれてもよい。
【0047】
第2の実施形態に係る外部装置10は、第1の実施形態に係る外部装置10と同様の構成であるため、説明を省略する。
【0048】
第2の実施形態に係る端末装置20は、第1の実施形態に係る端末装置20と同様の構成であるため、説明を省略する。
【0049】
第2の実施形態に係る算出装置200は、外部装置10から取得された投稿情報に人名と関連語とが含まれない場合に、文長情報と出現頻度とに基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する。
【0050】
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「当選」であるとする。この場合、算出装置200は、外部装置10から取得された投稿情報に「XXXX」と「当選」とが含まれない場合に、文長情報と出現頻度とに基づいて「XXXX」のみを含む投稿情報と「当選」のみを含む投稿情報とを選択する。続いて、算出装置200は、「XXXX」のみを含む投稿情報と「当選」のみを含む投稿情報とを組み合わせた投稿情報における「XXXX」と「当選」との関連度を算出する。そして、算出装置200は、「XXXX」のみを含む投稿情報と「当選」のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する。
【0051】
以下、図8を用いて、算出装置200によるユーザによって投稿された投稿情報における文長情報と出現頻度に基づいて、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する算出処理の一例を流れに沿って説明する。
【0052】
まず、図8に示すように、算出装置200は、ユーザによって投稿された投稿情報を外部装置10から取得する(ステップS21)。そして、算出装置200は、ユーザによって投稿された投稿情報に人名と関連語とが含まれない場合に、文長情報と出現頻度とに基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する(ステップS22)。
【0053】
例えば、図8の例では、投稿情報ST34の文長情報は11文字であり、投稿情報ST35の文長情報は12文字であり、投稿情報ST36の文長情報は20文字である。そして、投稿情報ST34の人名「XXXX」の出現頻度は1回であり、投稿情報ST35の人名「XXXX」の出現頻度は1回であり、投稿情報ST36の人名「XXXX」の出現頻度は1回である。これより、算出装置200は、以下のような式(1)によりスコアSCを算出する。
【0054】
スコアSC = w1*x+w2*y ・・・ (1)
【0055】
上記式(1)では、「w1」は、任意の重みを示し、「x」は、文長情報に関する関数を示し、「w2」は、任意の重みを示し、「y」は、出現頻度に関する関数を示す。そして、算出装置200は、スコアSCが最も大きい投稿情報ST36を人名のみを含む投稿情報として選択する。
【0056】
算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する(ステップS23)。例えば、算出装置200は、KNPやCaboCha等の係り受け解析を用いて、投稿情報ST36「XXXXがAA党から出馬し、大統領に勝利」と投稿情報ST33「ZZZ国の大統領に当選」を組み合わせた投稿情報「XXXXがAA党から出馬、大統領に勝利し、ZZZ国の大統領に当選」における人名「XXXX」と関連語「当選」との関連度を90%として算出する。
【0057】
そして、算出装置200は、関連度が所定の閾値以上である場合に、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約としてユーザに提供する(ステップS24)。
【0058】
このように、算出装置200は、文長情報と出現頻度とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。これにより、算出装置200は、文長情報と出現頻度とに基づいて選択された投稿情報を組み合わせた投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
【0059】
〔2-2.決定装置の構成〕
次に、図9を用いて、第2の実施形態に係る算出装置200の構成について説明する。図9は、第2の実施形態に係る算出装置200の構成例を示す図である。図9に示すように、算出装置200は、通信部110と、記憶部220と、制御部230とを有する。
【0060】
記憶部220は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部220は、投稿情報記憶部221と、関連度情報記憶部122と、要約情報記憶部123とを有する。
【0061】
第2の実施形態に係る投稿情報記憶部221は、ユーザによって投稿された投稿情報を記憶する。ここで、図10に、第2の実施形態に係る投稿情報記憶部221の一例を示す。図10に示した例では、投稿情報記憶部221は、「順位」、「投稿情報」、「文長情報」、「出現頻度」、「スコア」といった項目を有する。
【0062】
「順位」は、文長情報と出現頻度とに基づいて順位付される投稿情報の順位を示す。「投稿情報」は、ユーザによって投稿される投稿内容を示す。「文長情報」は、投稿情報の文字数の長さを示す。「出現頻度」は、人名あるいは関連語が投稿情報中に出現する頻度を示す。「スコア」は、式(1)により文長情報と出現頻度とに基づいて算出されるスコアを示す。例えば、図10の例では、「XXXX」のみを含む投稿情報の順位を示す。図10に示すように、ユーザU1が投稿した投稿情報PO1である「XXXXがAA党から出馬し、大統領に勝利」は、式(1)により算出されたスコアが92と最も大きい値を示すため、順位が「1」であることを示す。
【0063】
制御部230は、コントローラであり、例えば、CPUやMPU等によって、算出装置200内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部230は、コントローラであり、例えば、ASICやFPGA等の集積回路により実現される。
【0064】
図9に示すように、制御部230は、取得部131と、選択部232と、算出部233と、生成部234と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部230の内部構成は、図9に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部230が有する各処理部の接続関係は、図9に示した接続関係に限られず、他の接続関係であってもよい。
【0065】
選択部232は、取得部131によって取得された第1投稿情報(人名を含む投稿情報に相当)のうち文字数に基づいて人名を含む投稿情報を選択し、第2投稿情報(関連語を含む投稿情報に相当)のうち文字数に基づいて関連語を含む投稿情報を選択する。また、選択部232は、取得部131によって取得された人名を含む投稿情報のうち人名が出現する頻度に基づいて人名を含む投稿情報を選択し、関連語を含む投稿情報のうち関連語が出現する頻度に基づいて関連語を含む投稿情報を選択する。具体的には、選択部232は取得部131によって取得された投稿情報に人名のみあるいは関連語のみが含まれる場合に、文長情報と出現頻度に基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する。
【0066】
例えば、図10の例では、選択部232は、取得部131によって取得された投稿情報に「XXXX」のみが含まれる場合に、文長情報と出現頻度とに基づいて「XXXX」のみを含む投稿情報として投稿情報「XXXXがAA党から出馬し、大統領に勝利」を選択する。
【0067】
算出部233は、取得部131によって取得された投稿情報に基づいて、人名と、人名と関連する関連語との関連度を算出する。具体的には、算出部233は、取得部131によって取得された投稿情報のうち、人名と関連語とが含まれない場合に、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。例えば、図8の例では、算出部233は、選択部232によって選択された人名と関連語とを含む投稿情報を組み合わせた投稿情報において、KNPやCaboCha等の係り受け解析を用いて、人名「XXXX」と関連語「当選」との関連度を90%として算出する。
【0068】
生成部234は、選択部232によって選択された人名を含む投稿情報と関連語を含む投稿情報とを組み合わせた投稿情報を要約として生成する。例えば、図8の例では、生成部234は、選択部232によって選択された投稿情報「XXXXがAA党から出馬し、大統領に勝利」と投稿情報「ZZZ国の大統領に当選」を組み合わせた投稿情報「XXXXがAA党から出馬し、大統領に勝利し、ZZZ国の大統領に当選」を要約として生成する。なお、生成部234は、選択部232によって選択された人名を含む投稿情報と関連語を含む投稿情報とを組み合わせた投稿情報を適宜編集することで、要約を生成してもよい。
【0069】
〔2-3.算出装置による算出処理手順の一例を示すフローチャート〕
次に、図11を用いて、第2の実施形態に係る算出装置200による算出処理手順の一例の手順について説明する。図11は、第2の実施形態に係る算出装置200による算出処理手順を示すフローチャートである。
【0070】
図11に示すように、取得部131は、外部装置10から、ユーザによって投稿された投稿情報を取得する(ステップS201)。選択部232は、取得部131によって取得された投稿情報に人名と関連語とが含まれない場合に、文長情報と出現頻度とに基づいて人名のみを含む投稿情報と関連語のみを含む投稿情報とを選択する(ステップS202)。そして、算出部233は、選択部232によって選択された人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する(ステップS203)。そして、生成部234は、選択部232によって選択された人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報を要約として生成する(ステップS204)。そして、提供部135は、算出部233によって算出された関連度が所定の閾値以上である場合に(ステップS205;Yes)、生成部234によって生成された要約をユーザに提供する(ステップS206)。一方、提供部135は、算出部233によって算出された関連度が所定の閾値より小さい場合に(ステップS205;No)、ステップS202の処理の前まで戻る。
【0071】
このように、算出装置200は、文長情報と出現頻度とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。そして、算出装置200は、人名のみを含む投稿情報と関連語のみを含む投稿情報とを組み合わせた投稿情報における人名と関連語との関連度を算出する。これにより、算出装置200は、文長情報と出現頻度とに基づいて選択された投稿情報を組み合わせた投稿情報に含まれる人名と関連語との関連度を算出するため、キーワード情報同士の関連度を高精度で算出することができる。
【0072】
〔3.変形例〕
上述した算出装置100又200は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、算出装置100又200の他の実施形態について説明する。
【0073】
〔3-1.算出装置〕
図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、第1の実施形態に係る算出装置100は、第2の実施形態で説明した算出処理を行い、第2の実施形態に係る算出装置200は、第1の実施形態で説明した算出処理を行ってもよい。
【0074】
〔3-2.キーワード情報〕
上記実施形態において、算出装置100又200の選択部132又232は、上述では人名と人名に関連する関連語とを含む投稿情報を選択すると説明してきたが、人名に限らず、他の名詞を選択してもよい。例えば、選択部132又232は、人名ではない固有名詞(例えば、ゲームの名前やスポーツの名前など)とかかる固有名詞に関連する関連語とを含む投稿情報を選択してもよい。
【0075】
〔3-3.関連語〕
上記実施形態において、算出装置100又200の選択部132又232は、上述では人名と人名に関連する関連語としてサ変名詞とを含む投稿情報を選択すると説明してきたが、サ変名詞に限らず、名詞等を選択してもよい。例えば、選択部132又232は、人名とサ変名詞ではない動詞(例えば、行うや選ぶなど)とを含む投稿情報を選択してもよい。
【0076】
〔3-4.選択処理〕
上記実施形態において、算出装置200の選択部232は、取得部131によって取得された人名および関連語以外の第3キーワード情報(共通語に相当)がともに出現する人名を含む投稿情報と関連語を含む投稿情報とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択してもよい。具体的には、算出装置200の選択部232は、取得部131によって取得された人名を含む投稿情報と関連語を含む投稿情報において文長情報と出現頻度と人名を含む投稿情報と関連語を含む投稿情報とに共通に含まれるキーワード情報を示す共通語とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択してもよい。
【0077】
例えば、人名が「XXXX」であり、かかる人名に関連する関連語としてサ変名詞である「勝利」であるとする。この場合、選択部232は、文長情報と出現頻度と共通語とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。図12の例では、投稿情報テーブルT1には、人名「XXXX」のみを含む投稿情報において、文長情報と出現頻度とに基づいて順位付された投稿情報が示されている。また、投稿情報テーブルT2には、関連語「勝利」のみを含む投稿情報において、文長情報と出現頻度とに基づいて順位付された投稿情報が示されている。図12に示すように、選択部232は、人名を含む投稿情報として、投稿情報テーブルT1から共通語である「AA党」を含む投稿情報「XXXXがAA党から大統領選に出馬」を選択する。また、選択部232は、関連語を含む投稿情報として、投稿情報テーブルT2から投稿情報「AA党が大統領選に勝利」を選択する。
【0078】
このように、選択部232は、文長情報と出現頻度と共通語とに基づいて、人名を含む投稿情報と関連語を含む投稿情報とを選択する。これにより、算出装置200は、文長情報と出現頻度と共通語とに基づいて選択された投稿情報を組み合わせた投稿情報に含まれる人名と関連語との関連度を算出するため、人名と関連語とが同一の投稿情報に含まれていない場合であっても、キーワード情報同士の関連度を高精度で算出することができる。
【0079】
〔4.ハードウェア構成〕
また、上述してきた実施形態に係る外部装置10、端末装置20、算出装置100又は200は、例えば図13に示すような構成のコンピュータ1000によって実現される。以下、算出装置100を例に挙げて説明する。図13は、算出装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0080】
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0081】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100がネットワークNを介して生成したデータを他の機器へ送信する。
【0082】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0083】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0084】
例えば、コンピュータ1000が実施形態に係る算出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0085】
〔5.効果〕
上述してきたように、実施形態に係る算出装置100は、取得部131と、算出部133とを有する。取得部131は、ユーザによって投稿される投稿情報を取得する。算出部133は、取得部131によって取得された投稿情報に基づいて、第1キーワード情報(人名に相当)と、第1キーワード情報と関連する第2キーワード情報(関連語に相当)との関連度を算出する。
【0086】
これにより、実施形態に係る算出装置100は、ユーザによって投稿される投稿情報に基づいて注目の人名とかかる人名と関連する関連語との関連度を高精度で算出できる。
【0087】
また、実施形態に係る算出装置100において、算出部133は、取得部131によって取得された投稿情報のうち、第1キーワード情報と第2キーワード情報との双方が含まれる投稿情報に基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
【0088】
また、実施形態に係る算出装置100において、算出部133は、第1キーワード情報と第2キーワード情報との双方が含まれる投稿情報のうち、第1キーワード情報と第2キーワード情報との位置の近さに基づいて選択された投稿情報に基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
【0089】
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれている投稿情報において、注目の人名とかかる人名と関連する関連語との関連度を高精度で算出できる。
【0090】
また、実施形態に係る算出装置100において、算出部133は、取得部131によって取得された投稿情報のうち、第1キーワード情報を含む第1投稿情報(人名のみを含む投稿情報)と第2キーワード情報を含む第2投稿情報(関連語のみを含む投稿情報)とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
【0091】
また、実施形態に係る算出装置100において、算出部133は、第1投稿情報のうち文字数に基づいて選択された第1投稿情報と、第2投稿情報のうち文字数に基づいて選択された第2投稿情報とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
【0092】
また、実施形態に係る算出装置100において、算出部133は、第1投稿情報のうち第1キーワード情報が出現する頻度に基づいて選択された第1投稿情報と、第2投稿情報のうち第2キーワード情報が出現する頻度に基づいて選択された第2投稿情報とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
【0093】
また、実施形態に係る算出装置100において、算出部133は、第1キーワード情報および第2キーワード情報以外の第3キーワード情報がともに出現する第1投稿情報と第2投稿情報とに基づいて、第1キーワード情報と第2キーワード情報との関連度を算出する。
【0094】
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれていない投稿情報において、注目の人名とかかる人名と関連する関連語との関連度を高精度で算出できる。
【0095】
また、実施形態に係る算出装置100は、取得部131によって取得された投稿情報のうち、所定の基準によって選択された投稿情報に基づいて要約を生成する生成部134をさらに備える。
【0096】
これにより、実施形態に係る算出装置100は、ユーザによって投稿される投稿情報のうち、所定の基準によって選択された投稿情報に基づいて要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
【0097】
また、実施形態に係る算出装置100において、生成部134は、第1キーワード情報と第2キーワード情報との双方が含まれる投稿情報のうち、第1キーワード情報と第2キーワード情報との位置の近さに基づいて選択された投稿情報に基づいて、要約を生成する。
【0098】
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれている投稿情報において、注目の人名とかかる人名と関連する関連語とを含む要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
【0099】
また、実施形態に係る算出装置100において、生成部134は、第1投稿情報のうち文字数に基づいて選択された第1投稿情報と、第2投稿情報のうち文字数に基づいて選択された第2投稿情報とに基づいて、要約を生成する。
【0100】
また、実施形態に係る算出装置100において、生成部134は、第1投稿情報のうち第1キーワード情報が出現する頻度に基づいて選択された第1投稿情報と、第2投稿情報のうち第2キーワード情報が出現する頻度に基づいて選択された第2投稿情報とに基づいて、要約を生成する。
【0101】
これにより、実施形態に係る算出装置100は、人名と関連語との双方が含まれていない投稿情報において、注目の人名とかかる人名と関連する関連語とを含む要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
【0102】
上述してきたように、実施形態に係る算出装置100は、取得部131と、生成部134とを有する。取得部131は、ユーザによって投稿される投稿情報を取得する。算出部133は、取得部131によって取得された投稿情報に基づいて、第1キーワード情報と、第1キーワード情報と関連する第2キーワード情報とを含む要約を生成する。
【0103】
これにより、実施形態に係る算出装置100は、ユーザによって投稿される投稿情報に基づいて注目の人名とかかる人名と関連する関連語とを含む要約を生成することで、注目の人名が上昇した理由をユーザに的確に提供することができる。
【0104】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【符号の説明】
【0105】
1 算出システム
2 算出システム
10 外部装置
20 端末装置
100 算出装置
110 通信部
120 記憶部
121 投稿情報記憶部
122 関連度情報記憶部
123 要約情報記憶部
130 制御部
131 取得部
132 選択部
133 算出部
134 生成部
135 提供部
200 算出装置
220 記憶部
221 投稿情報記憶部
230 制御部
232 選択部
233 算出部
234 生成部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13