(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024118200
(43)【公開日】2024-08-30
(54)【発明の名称】情報処理装置、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240823BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023024495
(22)【出願日】2023-02-20
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】菅原 陽子
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC12
5L050CC12
(57)【要約】
【課題】適切な意見を含むコンテンツを提示する。
【解決手段】情報処理装置は、取得部と、クラスタリング部と、判定部と、提示部とを備える。取得部は、所定のコンテンツに対する複数のコメントを取得する。クラスタリング部は、前記複数のコメントを複数のクラスタにクラスタリングする。判定部は、前記複数のクラスタのうち、第1のクラスタに属するコメントの数と、第2のクラスタに属するコメントの数との比率が、第1の所定の条件を満たすか否かを判定する。提示部は、前記判定結果に基づいて、前記コンテンツの提示方法を制御する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
所定のコンテンツに対する複数のコメントを取得する取得部と、
前記複数のコメントを複数のクラスタにクラスタリングするクラスタリング部と、
前記複数のクラスタのうち、第1のクラスタに属するコメントの数と、第2のクラスタに属するコメントの数との比率が、第1の所定の条件を満たすか否かを判定する判定部と、
前記判定結果に基づいて、前記コンテンツの提示方法を制御する提示部と、
を備える情報処理装置。
【請求項2】
前記クラスタリング部は、前記複数のコメントのうち、所定のコンテンツに対する肯定的なコメントを前記第1のクラスタにクラスタリングするとともに、前記所定のコンテンツに対する否定的なコメントを前記第2のクラスタにクラスタリングし、
前記提示部は、前記比率が、所定の値に近いものから優先して、前記コンテンツが提示されるように制御する、請求項1に記載の情報処理装置。
【請求項3】
複数のコメントそれぞれについて、不適切であるか否かを判別する判別部、を備え、
前記判定部は、前記複数のコメントのうち、不適切であると判定されたコメントの数が、第2の所定の条件を満たすか否かを判定し、
前記提示部は、前記第2の所定の条件を満たす前記コンテンツの提示が抑制されるように制御する、
請求項2に記載の情報処理装置。
【請求項4】
前記クラスタリング部は、前記所定のコンテンツの主題に対する肯定的な意見を含むコメントを前記第1のクラスタにクラスタリングし、前記所定のコンテンツの主題に対する否定的な意見を含むコメントを前記第2のクラスタにクラスタリングするとともに、前記所定のコンテンツの主題以外に対する意見を含むコメントを第3のクラスタにクラスタリングし、
前記判定部は、前記複数のクラスタのうち、前記第1のクラスタに属するコメントの数及び前記第2のクラスタに属するコメントの数に対する、前記第3のクラスタに属するコメントの数の割合が、所定の閾値未満であるか否かを判定し、
前記提示部は、前記割合が所定の閾値未満である前記コンテンツが優先して提示されるように制御する、
請求項1に記載の情報処理装置。
【請求項5】
コンピュータが実行する情報処理方法であって、
所定のコンテンツに対する複数のコメントを取得する取得行程と、
前記複数のコメントを複数のクラスタにクラスタリングするクラスタリング行程と、
前記複数のクラスタのうち、第1のクラスタに属するコメントの数と、第2のクラスタに属するコメントの数との比率が、第1の所定の条件を満たすか否かを判定する判定行程と、
前記判定結果に基づいて、前記コンテンツの提示方法を制御する提示行程と、
情報処理方法。
【請求項6】
所定のコンテンツに対する複数のコメントを取得する取得手順と、
前記複数のコメントを複数のクラスタにクラスタリングするクラスタリング手順と、
前記複数のクラスタのうち、第1のクラスタに属するコメントの数と、第2のクラスタに属するコメントの数との比率が、第1の所定の条件を満たすか否かを判定する判定手順と、
前記判定結果に基づいて、前記コンテンツの提示方法を制御する提示手順と、
をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
ネットワークを使用したサービスが活発に行われている。近年、EC(Electronic Commerce)サイトやポータルサイトでは、所定の対象(例えば、商品や記事等)に対してユーザがコメントの投稿を行うことが可能である。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特表2022-506274号公報
【特許文献2】特開2009-288883号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
活発な議論がされるコンテンツには、多くのコメントが集まる。しかし、議論が有用なものであるか否か、当該コンテンツに対して適切な意見が提示されているか否かは、コメントの数だけで判断することは難しい。
【0005】
一つの側面では、適切な意見を含むコンテンツを提示できる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
一つの態様において、情報処理装置は、取得部と、クラスタリング部と、判定部と、提示部とを備える。取得部は、所定のコンテンツに対する複数のコメントを取得する。クラスタリング部は、前記複数のコメントを複数のクラスタにクラスタリングする。判定部は、前記複数のクラスタのうち、第1のクラスタに属するコメントの数と、第2のクラスタに属するコメントの数との比率が、第1の所定の条件を満たすか否かを判定する。提示部は、前記判定結果に基づいて、前記コンテンツの提示方法を制御する。
【0007】
一つの態様によれば、適切な意見を含むコンテンツを提示できる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、第1の実施形態における情報処理装置が実行する処理の一例を示す図である。
【
図2】
図2は、第1の実施形態における情報処理システムの構成例を示す図である。
【
図3】
図3は、第1の実施形態における記事情報の一例を示す図である。
【
図4】
図4は、第1の実施形態におけるコメント情報の一例を示す図である。
【
図5】
図5は、第1の実施形態における評価情報の一例を示す図である。
【
図6】
図6は、第1の実施形態における情報処理装置が実行する処理の処理手順を示すフローチャートである。
【
図7】
図7は、第2の実施形態における情報処理システムの構成例を示す図である。
【
図8】
図8は、第2の実施形態におけるコメント情報の一例を示す図である。
【
図9】
図9は、第2の実施形態における評価情報の一例を示す図である。
【
図10】
図10は、第2の実施形態における記事の一覧の一例を示す図である。
【
図11】
図11は、各実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願にかかる情報処理装置、情報処理方法及び情報処理プログラムを実施するための各形態(以下、「各実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、各実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
[第1の実施形態]
まず、
図1を用いて、第1の実施形態に係る情報処理装置が実行する処理について説明する。
図1は、第1の実施形態における情報処理装置が実行する処理の一例を示す図である。なお、
図1では、実施形態に係る情報処理装置1を含む情報処理システムSの動作例を示している。
【0011】
図1に示すように、第1の実施形態に係る情報処理システムSは、情報処理装置1と、投稿者端末200と、閲覧者端末300とを含む。なお、投稿者端末200及び閲覧者端末300は、それぞれ複数であってもよい。
【0012】
実施形態に係る情報処理システムSでは、情報処理装置1が、投稿者端末200及び閲覧者端末300に対して、ニュース記事などの所定のコンテンツを配信する。また、情報処理装置1は、配信される所定のコンテンツに対して、投稿者端末200を介して入力されたコメントの投稿を受け付けるとともに、受け付けたコメントがコンテンツに対して肯定的な意見であるか否定的な意見であるかを分類する。そして、情報処理装置1は、コメントの分類結果に基づいて各種処理を行うことで、閲覧者端末300に対して、適切な意見を含むコンテンツを提示させる。
【0013】
まず、コメントを受け付ける処理について説明する。具体的には、情報処理装置1は、まず、投稿者端末200を介して、投稿者からコンテンツに対するコメントの投稿を受け付ける(ステップS1)。なお、コメントは、例えば、投稿者端末200に予め配信された記事等のコンテンツに対して投稿される。
【0014】
コンテンツは、例えば、ニュース配信サービスにおけるニュース記事の情報や、ショッピングサービスにおいて販売する商品の情報等である。言い換えれば、コンテンツは、配信したユーザからコメントを受け付け可能なコンテンツである。コメントは、ニュース記事の場合、ニュース記事に対するコメントであり、商品の場合、商品に対するレビューや、商品を販売しているストアに対するレビューである。
【0015】
つづいて、情報処理装置1は、受け付けたコメントをクラスタリングする(ステップS2)。情報処理装置1は、例えば、コメント内容がコンテンツ全体あるいはコンテンツの一部に対して好意的であるクラスタと、否定的であるクラスタとにクラスタリングする。
【0016】
クラスタリングには、例えば、機械学習における分類モデルを用いることができる。具体的には、情報処理装置1は、コメント内容と、肯定的であるか否定的であるかの判断結果とをデータセットとして学習した分類モデルにコメントを入力することで、コメントをクラスタリングする。その際、情報処理装置1は、攻撃的なコメントや、記事と関係のない宣伝目的のコメント等、不適切なコメントを除外するような処理を行ってもよい。
【0017】
この結果、情報処理装置1には、テーブルT1に示すような情報が格納される。テーブルT1は、例えばニュース記事であるコンテンツと、当該コンテンツに対して投稿されたコメントとの関係を示す。テーブルT1では、コメントに関する情報として、コンテンツに対して投稿されたコメントの総数と、投稿されたコメントのうち、肯定的なコメントの数と、否定的なコメントの数とを示す。なお、テーブルT1は、後に説明する記事情報記憶部111に格納された情報と、コメント情報記憶部112に格納された情報とを組み合わせた情報である。
【0018】
次に、記事を配信する処理について説明する。情報処理装置1は、閲覧者端末300から記事表示のリクエストを受け付ける(ステップS11)。これに対して、情報処理装置1は、テーブルT1に示すような記事を読み出す(ステップS12)。
【0019】
つづいて、情報処理装置1は、テーブルT1に示すようなコンテンツとコメントとの関係に基づいて、記事を並べ替える(ステップS13)。情報処理装置1は、例えば、
図1のテーブルT1に示す記事に対する肯定的なコメントと否定的なコメントとの割合に基づいて、記事を並べ替える。これにより、
図1のリストL1に示すような記事の一覧が生成される。
【0020】
そして、情報処理装置1は、生成した記事の一覧を、閲覧者端末300に配信する(ステップS14)。
【0021】
例えば、閲覧者から、記事に対して、多面的な意見を知りたいという要望がある。この場合、記事に対するコメントとして、肯定的な意見と、否定的な意見とをそれぞれ提示できることが好ましい。
【0022】
例えば、コメントが多く投稿されている記事から順に表示する方法が考えられる。しかし、例えば最もコメント総数が多い記事ID「000C」のような記事は、不祥事等に関するものである。この場合、行為を非難するようなコメント、すなわち否定的な意見が、
図1のリストL1に示すように多数を占めることが多い。一方、次にコメント総数が多い記事ID「000B」のような記事は、偉業等に関するものである。この場合、業績を賞賛するようなコメント、すなわち肯定的な意見が、
図1のリストL1に示すように多数を占めることが多い。
【0023】
このような記事においては、意見が肯定的なものか否定的なものかに偏っているため、大多数のコメントの中から、少数である反対側の意見を探すことが難しい。また、反対側の意見に対して、他の投稿者から悪い評価を付けられることも多く、反対側の意見が妥当であるかを見極めることも難しい。
【0024】
一般に、肯定的な意見の割合と、否定的な意見の割合とが拮抗しているような記事においては、賛否両論が活発に議論されている場合が多く、また意見に対する評価も良いものや悪いものに偏りにくい。そこで、本実施形態においては、肯定的な意見の割合と、否定的な意見の割合とが第1の所定の条件を満たすような記事が優先的に提示されるようにすることで、閲覧者に対して、多面的な意見を提示できる。
【0025】
第1の実施形態において、リストL1に示す記事の一覧の最上位には、
図1に示すテーブルT1に示す記事ID「000D」の見出しが表示される。記事ID「000D」に対して投稿されたコメントの総数は、テーブルT1に示す4つの記事の中では最も少ないが、肯定的なコメントの数と否定的なコメントの数との割合は最も拮抗している。
【0026】
一方、記事ID「000B」のように、肯定的なコメントの数が、否定的なコメントの数に対して圧倒的に多い記事は、リストL1に示す記事の一覧の下位に表示される。また、記事ID「000C」のように、否定的なコメントの数が、肯定的なコメントの数に対して圧倒的に多い記事を、記事の一覧から除外するような構成であってもよい。
【0027】
次に、
図2を用いて、実施形態に係る情報処理システムSの構成例について説明する。
図2は、第1の実施形態における情報処理システムの構成例を示す図である。
図2に示すように、実施形態に係る情報処理システムSにおいて、情報処理装置1と、投稿者端末200及び閲覧者端末300とは、ネットワークNを介して有線又は無線により接続される。ネットワークNは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)等のネットワークである。
【0028】
情報処理装置1は、実施形態に係る情報処理方法を実行するサーバ装置である。情報処理装置1は、
図1を用いて上述した処理を実行する。
【0029】
また、情報処理装置1は、複数の閲覧者端末300および複数の投稿者端末200と連携し、各投稿者端末200及び各閲覧者端末300に対して、各種アプリケーション(以下、アプリ)等に対するAPI(Application Programming Interface)サービス等と、各種データを提供する情報処理装置であり、サーバ装置やクラウドシステム等により実現される。
【0030】
また、情報処理装置1は、各閲覧者端末300および各投稿者端末200に対して、オンラインで何らかのWebサービスを提供する情報処理装置であってもよい。例えば、情報処理装置1は、Webサービスとして、インターネット接続、検索サービス、SNS(Social Networking Service)、電子商取引(EC:Electronic Commerce)、電子決済、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報等のサービスを提供してもよい。実際には、情報処理装置1は、上記のようなWebサービスを提供する各種サーバと連携し、Webサービスを仲介してもよいし、Webサービスの処理を担当してもよい。
【0031】
投稿者端末200は、コンテンツに対するコメントを投稿する投稿者が所持する端末装置である。投稿者端末200は、スマートフォン、デスクトップ型PC、ノート型PC、タブレット型PC等の任意のタイプの端末装置を用いることができる。投稿者端末200は、情報処理装置1等へ各種情報を送信したり、情報処理装置1等から提供される情報を受信したりする。
【0032】
閲覧者端末300は、コンテンツやコメント、コメントに対する評価等を閲覧する閲覧者が所持する端末装置である。閲覧者端末300は、スマートフォン、デスクトップ型PC、ノート型PC、タブレット型PC等の任意のタイプの端末装置を用いることができる。閲覧者端末300は、情報処理装置1等へ各種情報を送信したり、情報処理装置1等から提供される情報を受信したりする。
【0033】
なお、投稿者端末200及び閲覧者端末300は、同一の機能を備えており、投稿者端末200がコンテンツやコメントを表示し、また閲覧者端末300がコンテンツに対するコメントを投稿するような構成であってもよい。
【0034】
図2に示されるように、情報処理装置1は、記憶部110と、通信部120と、制御部130とを有する。記憶部110は、記事情報記憶部111と、コメント情報記憶部112と、評価情報記憶部113とを有する。制御部130は、取得部131と、クラスタリング部132と、判定部133と、提示部134とを備える。
【0035】
記憶部110は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
【0036】
記事情報記憶部111は、コンテンツの一例であるニュース記事に関する情報を記憶する。
図3は、第1の実施形態における記事情報の一例を示す図である。
図3に示すように、記事情報記憶部111に記憶される記事情報は、「記事ID」、「見出し」、「本文」等の項目を含む。
【0037】
「記事ID」は、記事を識別する識別情報である。「見出し」は、記事に付された見出しに関する情報である。「本文」は、記事の本文に関する情報であり、テキスト情報を含む。また、記事情報は、画像や動画、音声などその他のコンテンツを含んでいてもよい。
【0038】
次に、コメント情報記憶部112は、コンテンツに対して投稿されたコメントに関する情報を記憶する。
図4は、第1の実施形態におけるコメント情報の一例を示す図である。
図4に示すように、コメント情報記憶部112に記憶されるコメント情報は、「コメントID」、「記事ID」、「投稿者ID」、「本文」、「良評価数」、「悪評価数」、「クラスタ」等の項目を含む。
【0039】
「コメントID」は、コメントを識別する識別情報である。「記事ID」は、コメントがどの記事IDの記事に対して投稿されたかを示す。「投稿者ID」は、コメントを投稿した投稿者を識別する識別情報である。「本文」は、コメントの本文に関する情報であり、テキスト情報を含む。「良評価数」及び「悪評価数」は、コメントに対してユーザである投稿者や閲覧者が行った評価に関する情報であり、例えば、好意的な評価を行ったユーザ数や、否定的な評価を行ったユーザ数の情報を含む。「クラスタ」は、後に説明するクラスタリング部132により、コメントがどのクラスタに分類されたかを示す情報である。
【0040】
後に説明するように、第1の実施形態において、例えば
図4のコメントID「A00001」及び「D00001」のように、記事の内容に対して肯定的な意見を含むコメントは、第1のクラスタに分類される。また、例えばコメントID「A00002」及びB00231」のように、記事の内容に対して否定的な意見を含むコメントは、第2のクラスタに分類される。なお、クラスタリング部132は、肯定的及び否定的のいずれにも分類できないコメントを、別クラスタに分類してもよい。
【0041】
また、例えば、
図4のコメントID「B00002」に示すような単なる誹謗中傷や、コメントID「C00002」に示すような記事と関係のない商品(化粧品等)の紹介等を、不適切なコメントとして、クラスタリング処理の対象から除外してもよい。第1の実施形態において、クラスタリング処理から除外されたコメントの「クラスタ」の項目には、
図4に示すように「-」が登録される。
【0042】
次に、評価情報記憶部113は、コンテンツに対して投稿されたコメントに対する評価に関する情報を記憶する。
図5は、第1の実施形態における評価情報の一例を示す図である。
図5に示すように、評価情報記憶部113に記憶される評価情報は、「記事ID」、「コメント総数」、「肯定的」、「否定的」等の項目を含む。
【0043】
「記事ID」は、コメントが投稿される記事の識別情報を示す。「コメント総数」は、当該記事に対して投稿されたコメントの総数を示す。「肯定的」は、記事に対して肯定的な意見であると分類されたコメント(第1のクラスタに分類されたコメント)の数を示す。「否定的」は、記事に対して否定的な意見であると分類されたコメント(第2のクラスタに分類されたコメント)の数を示す。
【0044】
通信部120は、例えば、NIC(Network Interface Card)等によって実現される。通信部120は、有線または無線によりネットワーク網と接続される。
【0045】
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報処理装置1内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等を作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、GPGPU(General Purpose Graphic Processing Unit)等の集積回路により実現されてもよい。
【0046】
取得部131は、投稿者端末200からコンテンツに対するコメントを取得する。取得部131によるコメントの取得タイミングは、任意である。例えば、取得部131は、コメントの入力途中に所定の条件を満たした場合(文字数が所定数以上、入力の経過時間が所定時間以上等)に入力中のコメントを投稿者端末200から取得する。また、取得部131は、コメントを入力後、投稿者端末200に表示された投稿ボタンが押下された場合に、コメントを取得する。また、取得部131は、投稿者端末200及び閲覧者端末300から、コメントに対する評価を示す評価情報(例えば、良評価又は悪評価の選択結果)を取得する。
【0047】
クラスタリング部132は、各コメントをクラスタリングする。具体的には、クラスタリング部132は、各コメントを、記事に対して肯定的なクラスタ(第1のクラスタ)と、記事に対して否定的なクラスタ(第2のクラスタ)とに分類する。
【0048】
また、クラスタリング部132は、例えば、単なる誹謗中傷や、記事と関係のない商品の紹介など、不適切なコメントを検出して、クラスタリング処理から除外するような構成であってもよい。不適切なコメントは、例えばコメントの本文に含まれる単語を、誹謗中傷に関する文言を記憶したテーブル(不図示)に含まれる単語であるか否かを判定する等の公知の方法により検出できる。
【0049】
判定部133は、閲覧者端末300に対して提示するコンテンツに該当するか否かを判定する処理を行う。例えば、判定部133は、閲覧者端末300からコンテンツの配信要求を受信した際に、記事情報記憶部111を参照し、各記事が第1の所定の条件を満たすか否かを判定する。なお、判定部133は、記事情報記憶部111のうち、コンテンツの配信要求条件に合致するものに絞り込んで判定してもよい。また、判定部133は、例えばコンテンツの配信要求を受信したタイミング以外の任意のタイミングで処理を実行してもよい。
【0050】
具体的には、判定部133は、各記事に対して投稿されたコメントのうち、記事に対して肯定的なコメント、すなわち第1のクラスタに属するコメントの数を、記事に対して否定的なコメント、すなわち第2のクラスタに属するコメントの数で割った割合が「0.2~5.0」の間に収まる場合に、上記第1の所定の条件を満たすと判定する。なお、以下において、第1のクラスタに属するコメントの数を、第2のクラスタに属するコメントの数で割った割合を、記事に対する賛否比率と表記する場合がある。
【0051】
また、判定部133は、第1の所定の条件を満たすと判定された記事を、優先度に基づいて並び替える処理を行ってもよい。例えば、判定部133は、肯定的なコメントの数と否定的なコメントの数との比率が1に近いものから順に、各記事を並べ替える。
【0052】
具体的には、判定部133は、
図3に示す記事情報記憶部111において、記事ID「000C」に対する賛否比率が、0.2よりも小さいと判定する(43÷421≒0.10)。この場合において、判定部133は、記事ID「000C」が上記第1の所定の条件を満たさないと判定する。
【0053】
また、判定部133は、上記第1の所定の条件を満たすと判定した記事ID「000A」、「000B」及び「000D」の3つの記事を、記事に対する賛否比率が、所定の値に近いものから、すなわち優先度が高いものから順に並べ替える。第1の実施形態において、所定の値は、例えば「1」である。この場合において、複数の記事は、肯定的なコメントの数と、否定的なコメントの数とが近いものから順に並び替えられる。例えば、判定部133は、3つの記事を、記事ID「000D」(35÷28=1.25)、記事ID「000A」(42÷64=0.65625)、記事ID「000B」(180÷36=5.0)の順に並び替える。なお、記事ID「000D」の記事の賛否比率の逆数は「0.8」であり、記事ID「000A」の記事の賛否比率よりも「1」に近い。また、記事ID「000B」の賛否比率の逆数は「0.2」であり、記事ID「000A」の賛否比率よりも「1」から遠い。
【0054】
提示部134は、投稿者端末200及び閲覧者端末300に対して提示される各種情報の提示方法を制御する。例えば、提示部134は、判定部133により所定の条件を満たすと判定され、又は並び替えられた記事の一覧を、閲覧者端末300に対して配信する。
【0055】
具体的には、提示部134は、判定部133による判定結果に基づいて、
図1のリストL1に示すような記事の一覧を、閲覧者端末300に対して配信する。また、提示部134は、閲覧者端末300から、記事の選択を受け付けた場合、選択された記事を閲覧者端末300に配信する。
【0056】
また、提示部134は、投稿者端末200に対して、コメントの投稿を受け付けるための画面を配信する。
【0057】
次に、
図6を用いて、第1の実施形態に係る情報処理装置1が実行する処理の処理手順について説明する。
図6は、第1の実施形態における情報処理装置が実行する処理の処理手順を示すフローチャートである。
【0058】
図6に示すように、制御部130は、まず、投稿者端末200へコンテンツを配信する(ステップS101)。
【0059】
つづいて、制御部130は、投稿者端末200から、配信したコンテンツに対する投稿者のコメントを受け付ける(ステップS102)。
【0060】
つづいて、制御部130は、受け付けたコメントをクラスタリングする(ステップS103)。その後、制御部130は、閲覧者端末300からコンテンツの配信要求(記事表示リクエスト)を受け付けるまで待機する。
【0061】
つづいて、制御部130は、閲覧者端末300から、記事表示リクエストを受け付ける(ステップS111)。制御部130は、記憶部110から記事情報を取得し(ステップS112)、記事が所定の条件を満たすか否かを判定する(ステップS113)。その際、制御部130は、所定の条件を満たす記事を、賛否比率により並べ替える。
【0062】
つづいて、制御部130は、並べ替えた記事の一覧を、閲覧者端末300に配信し(ステップS114)、処理を終了する。
【0063】
[第2の実施形態]
ところで、コンテンツに対するコメントには、例えば
図4のコメントID「B00003」に示すような記事の筆者(〇〇記者)に対する意見や、コメントID「D00074」に示すような他のコメントの投稿者(XXYYさん)に対する意見など、コンテンツに直接関係のないコメントもある。また、コンテンツに直接関係のないコメントとしては、例えばショッピングサービスにおいて販売される商品そのものではなく、商品を配送する業者に対するコメント等も上げられる。
【0064】
そこで、第2の実施形態においては、コンテンツに直接関係のないコメントを除外できる構成について説明する。
図7は、第2の実施形態における情報処理システムの構成例を示す図である。
図7に示すように、第2の実施形態における情報処理装置4は、記憶部410と、通信部120と、制御部430とを有する。記憶部410は、記事情報記憶部111と、コメント情報記憶部412と、評価情報記憶部413とを有する。制御部430は、取得部131と、クラスタリング部432と、判定部433と、提示部134とに加えて、判別部435を備える。
【0065】
図8は、第2の実施形態におけるコメント情報の一例を示す図である。
図8に示すように、第2の実施形態におけるコメント情報記憶部412に記憶されるコメント情報は、「コメントID」、「記事ID」、「投稿者ID」、「本文」、「良評価数」、「悪評価数」、「クラスタ」等の項目に加えて、さらに「コメント対象」の項目を含む。
【0066】
「コメント対象」の項目には、後に説明する、記事と関係性が低いコメントにおける、コメントの対象が登録される。なお、第2の実施形態において、「コメント対象」の項目が登録されるのは、以下に説明する第3のクラスタに分類されたコメントのみである。
【0067】
また、「クラスタ」の項目には、第1の実施形態において説明した第1のクラスタ及び第2のクラスタ、並びに別のクラスタに分類されたことを示す情報に加えて、記事との関係性が低いクラスタ(第3のクラスタ)に分類されたことを示す情報がさらに登録される。
【0068】
例えば
図8におけるコメントID「B00003」及び「D00074」のコメントのように、第1の実施形態において、「肯定的」(第1のクラスタ)又は「否定的」(第2のクラスタ)のうちいずれかに分類されたコメントも、第2の実施形態において第3のクラスタに分類される場合がある。
【0069】
図9は、第2の実施形態における評価情報の一例を示す図である。
図9に示すように、第2の実施形態における評価情報記憶部413に記憶される評価情報は、「記事ID」、「コメント総数」、「肯定的」、「否定的」等の項目に加えて、さらに「低関係性」の項目を含む。
【0070】
第2の実施形態において、「低関係性」は、記事との関係性が低いクラスタ(第3のクラスタ)に分類されたコメントの数を示す。
【0071】
第2の実施形態においては、コメントの一部が第3のクラスタに分類されることにより、第1の実施形態と比べて「肯定的」及び「否定的」のコメントの数が低下する場合がある。例えば、記事ID「000D」の記事に対するコメントの総数は「74」であり、第1の実施形態から変化がないが、「肯定的」のコメントの数は「35」から「31」に、「否定的」のコメントの数は「28」から「11」へと、いずれも減少している。
【0072】
判別部435は、コメントが不適切であるか否かを判別する。判別部435は、上述したような不適切なコメントを検出する公知の方法により、コメントが不適切であるか否かを判定する。
【0073】
第2の実施形態におけるクラスタリング部432は、各コメントが記事に対して肯定的であるものと、否定的であるものとに加えて、上述したような記事に関係のないコメントとにさらに分類する。なお、クラスタリング部432は、コメント情報記憶部412に記憶されたコメントのうち、判別部435により不適切であると判定されたコメントについては、クラスタリング処理の対象としない。
【0074】
クラスタリング部432は、例えば、コメントの本文から、他のコメントを投稿した投稿者の投稿者IDや、記事を執筆した筆者の名前を検出する。例えば、クラスタリング部432は、
図8のコメントID「B00003」のコメントの「本文」から「〇〇記者」という筆者の名前を検出する。この場合において、クラスタリング部432は、筆者の名前を「コメント対象」として特定し、
図8に示すコメント情報に登録するとともに、当該コメントを、記事との関係性が低いクラスタ(第3のクラスタ)に分類する。
【0075】
また、クラスタリング部432は、
図8のコメントID「D00074」のコメントの本文から、「XXYY」というコメントの投稿者IDを検出する。この場合においても、クラスタリング部432は、投稿者IDを「コメント対象」として特定し、
図8に示すコメント情報に登録するとともに、当該コメントを第3のクラスタに分類する。
【0076】
なお、第2の実施形態においては、
図8のコメントID「B00003」に示すような否定的なコメント(第1の実施形態において、第2のクラスタに分類されるコメント)だけでなく、
図8のコメントID「D00074」に示すような肯定的なコメント(第1の実施形態において、第1のクラスタに分類されるコメント)であっても、記事との関係性が低いクラスタ(第3のクラスタ)に分類される。
【0077】
また、第2の実施形態における判定部433は、閲覧者端末300に対して提示するコンテンツに該当するか否かを、第3のクラスタの数に基づいて判定する。例えば、判定部433は、第1のクラスタに属するコメントの数及び第2のクラスタに属するコメントの数に対する、第3のクラスタに属するコメントの数の割合が、所定の閾値未満であるか否かを判定する。
【0078】
判定部433は、判定結果に基づいて、記事の優先度を調整する。例えば、判定部433は、「低関係性」コメントの数が「コメント総数」に占める割合が「0.2」以上である場合に、該当する記事の優先度を下げるような構成であってもよい。
【0079】
この場合において、提示部134は、コメント総数のうち、「低関係性」コメントが占める割合が所定の閾値未満であるコンテンツが、閲覧者端末300に対して優先して提示されるように制御する。
【0080】
例えば、
図9に示す記事ID「000D」の記事に対するコメント総数「74」のうち、「低関係性」コメントは「21」である。この場合、判定部433は、「低関係性」コメントの数が「コメント総数」に占める割合が「0.2」以上であると判定する(21÷74≒0.284)。この結果、判定部433は、記事ID「000D」の記事の優先度を引き下げる。
【0081】
この場合において生成される記事の一覧は、
図10のリストL2に示すように、記事が表示される順番が異なる。
図10は、第2の実施形態における記事の一覧の一例を示す図である。
図10に示すように、記事ID「000D」の見出し「〇〇教授、活躍の場求め国外へ」は、第1の実施形態において記事の一覧の先頭に表示されていたが、第2の実施形態では、優先度が引き下げられることにより、リストL2に示すように、記事の一覧の末尾に表示される。これにより、「低関係性」コメントが占める割合が所定の閾値未満である、記事ID「000A」の記事及び記事ID「000B」の記事が、優先して提示される。
【0082】
なお、第2の実施形態における判定部433は、例えば、判別部435において不適切であると判定されたコメントの数が所定の条件を満たすか否かを判定してもよい。具体的には、判定部433は、記事に対するコメントのうち、不適切であると判定されたコメントの数が、第2の所定の条件を満たすか否かを判定する。第2の所定の条件としては、例えば不適切なコメントの数であってもよく、不適切なコメントが、記事に対するコメント全体に占める割合であってもよい。この場合において、提示部134は、第2の所定の条件を満たす記事の提示が抑制されるように制御してもよい。例えば、提示部134は、第2の所定の条件を満たす記事を、リストL2に示す記事の一覧から削除してもよい。
【0083】
[ハードウェア構成]
実施形態に係る情報処理装置1は、例えば、
図11に示すような構成のコンピュータ1000によって実現される。
図11は、各実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【0084】
コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0085】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0086】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェイスであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェイスであり、例えば、USB等により実現される。
【0087】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0088】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0089】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0090】
例えば、コンピュータ1000が情報処理装置1として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)を実行することにより、制御部130と同様の機能を実現する。すなわち、演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)との協働により、実施形態に係る情報処理装置1による処理を実現する。
【0091】
[その他]
また、上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0092】
また、クラスタリング部132又は432が、不適切なコメントに加えて、悪評価数が一定以上であるコメントや、良評価数に対する悪評価数の割合が一定以上であるコメントを、クラスタリング処理の対象から除外するような構成であってもよい。
【0093】
核実施形態における賛否比率に対する所定の範囲の下限値は、上限値の逆数であるが、実施の形態はこれに限られない。例えば、所定の範囲は、コメントの数が、肯定側の意見と否定側の意見とのいずれか一方に偏った記事を含むように設定されてもよい。
【0094】
上述の実施形態において、情報処理装置1による情報処理方法(たとえば、
図6参照)を実現するために、情報処理装置1が有する制御部130の各部(取得部131、クラスタリング部132、判定部133及び提示部134)に対応する処理機能は、情報処理装置1に予めインストールされている情報処理プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の情報処理プログラムとして柔軟に記述することにより実現されてもよい。
【0095】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部130の取得部131と提示部134とは機能的に統合されていてもよい。また、制御部430と同様に、制御部130においても、不適切なコメントを除外する処理を行う判別部を、クラスタリング部132から分散させるような構成であってもよい。
【0096】
また、上述の各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0097】
[効果]
上述の実施形態に係る情報処理装置1は、取得部131と、クラスタリング部132と、判定部133と、提示部134とを備える。取得部131は、所定のコンテンツに対する複数のコメントを取得する。クラスタリング部132は、複数のコメントを複数のクラスタにクラスタリングする。判定部133は、複数のクラスタのうち、第1のクラスタに属するコメントの数と、第2のクラスタに属するコメントの数との比率が、第1の所定の条件を満たすか否かを判定する。提示部134は、判定結果に基づいて、コンテンツの提示方法を制御する。
【0098】
また、クラスタリング部132は、複数のコメントのうち、所定のコンテンツに対する肯定的なコメントを第1のクラスタにクラスタリングするとともに、所定のコンテンツに対する否定的なコメントを第2のクラスタにクラスタリングする。提示部134は、比率が、所定の値に近いものから優先して、コンテンツが提示されるように制御する。
【0099】
また、第2の実施形態にかかる情報処理装置4は、取得部131と、クラスタリング部432と、判定部433と、提示部134とに加えて、判別部435をさらに備える。判別部435は、複数のコメントそれぞれの不適切度を判別する。判定部433は、複数のコメントのうち、不適切度が所定の閾値以上であるコメントの数が、第2の所定の条件を満たすか否かを判定する。提示部134は、第2の所定の条件を満たすコンテンツの提示が抑制されるように制御する。
【0100】
また、クラスタリング部432は、は、所定のコンテンツの主題に対する肯定的な意見を第1のクラスタにクラスタリングし、所定のコンテンツの主題に対する否定的な意見を第2のクラスタにクラスタリングするとともに、所定のコンテンツの主題以外に対する意見を第3のクラスタにクラスタリングする。判定部433は、複数のクラスタのうち、第1のクラスタに属するコメントの数及び第2のクラスタに属するコメントの数に対する、第3のクラスタに属するコメントの数の割合が、所定の閾値未満であるか否かを判定する。提示部134は、割合が所定の閾値未満であるコンテンツが優先して提示されるように制御する。
【0101】
このようにして、情報処理装置1は、所定のコンテンツに対して、肯定的な意見の割合と、否定的な意見の割合とが拮抗しているような記事を優先して提示できるので、閲覧者に対して、賛否両論が活発に議論されている、適切な意見を含むコンテンツを提示できる。
【0102】
また、情報処理装置4は、コンテンツとの関係性が低いコメントが多いコンテンツの優先度を低下させるので、コンテンツに対する賛否の意見をより適切に提示できる。
【0103】
以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0104】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部130及び430は、制御手段や制御回路に読み替えることができる。
【符号の説明】
【0105】
1,4 情報処理装置
110,410 記憶部
111 記事情報記憶部
112,412 コメント情報記憶部
113,413 評価情報記憶部
120 通信部
130,430 制御部
131 取得部
132,432 クラスタリング部
133,433 判定部
134 提示部
200 投稿者端末
300 閲覧者端末