IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特開2024-1602情報処理システム、情報処理方法およびプログラム
<>
  • 特開-情報処理システム、情報処理方法およびプログラム 図1
  • 特開-情報処理システム、情報処理方法およびプログラム 図2
  • 特開-情報処理システム、情報処理方法およびプログラム 図3
  • 特開-情報処理システム、情報処理方法およびプログラム 図4
  • 特開-情報処理システム、情報処理方法およびプログラム 図5
  • 特開-情報処理システム、情報処理方法およびプログラム 図6
  • 特開-情報処理システム、情報処理方法およびプログラム 図7
  • 特開-情報処理システム、情報処理方法およびプログラム 図8
  • 特開-情報処理システム、情報処理方法およびプログラム 図9
  • 特開-情報処理システム、情報処理方法およびプログラム 図10
  • 特開-情報処理システム、情報処理方法およびプログラム 図11
  • 特開-情報処理システム、情報処理方法およびプログラム 図12
  • 特開-情報処理システム、情報処理方法およびプログラム 図13
  • 特開-情報処理システム、情報処理方法およびプログラム 図14
  • 特開-情報処理システム、情報処理方法およびプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024001602
(43)【公開日】2024-01-10
(54)【発明の名称】情報処理システム、情報処理方法およびプログラム
(51)【国際特許分類】
   G06F 16/35 20190101AFI20231227BHJP
   G06Q 50/10 20120101ALI20231227BHJP
【FI】
G06F16/35
G06Q50/10
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022100359
(22)【出願日】2022-06-22
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100106909
【弁理士】
【氏名又は名称】棚井 澄雄
(74)【代理人】
【識別番号】100134544
【弁理士】
【氏名又は名称】森 隆一郎
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(72)【発明者】
【氏名】古賀 哲雄
(72)【発明者】
【氏名】佐藤 大輔
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175DA01
5B175FA03
5L049CC11
(57)【要約】
【課題】ユーザは、自分の検索した記事のうち関心度の高い記事や関心度の高くなかった記事をまとめて確認することができる情報処理システム、情報処理方法およびプログラムを提供する。
【解決手段】情報処理システムは、テキストデータに対するユーザの関心度を推定する。情報処理システムは、ユーザから得た検索条件に合致したテキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎のテキストデータの内容に係る情報と関心度を表す情報とをユーザ端末へ出力する。
【選択図】図1
【特許請求の範囲】
【請求項1】
テキストデータに対するユーザの関心度を推定する関心度推定手段と、
前記ユーザから得た検索条件に合致した前記テキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎の前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力する出力手段と
を備える情報処理システム。
【請求項2】
前記関心度推定手段は、複数のテキストデータと各テキストデータに対する前記ユーザの関心の有無を示すデータとを教師データとして前記ユーザ毎に機械学習し、前記テキストデータを入力した場合に、前記ユーザの関心度を表す数値を出力する学習済み機械学習モデルを用いて、前記ユーザの関心度を推定する
請求項1に記載の情報処理システム。
【請求項3】
前記出力手段は、前記ユーザが指定した検索条件に合致した前記テキストデータに関する情報を出力する
請求項2に記載の情報処理システム。
【請求項4】
前記テキストデータの内容に係る情報は、前記テキストデータが属するカテゴリを表す情報を含む
請求項1~3のいずれか一項に記載の情報処理システム。
【請求項5】
前記テキストデータが記事であり、
前記出力手段は、検索条件に合致した前記記事の内容に基づいてグループを特定し、当該グループのタイトル名を生成し、前記記事を、前記グループに基づいて纏めて、前記記事の関心度のスコア、カテゴリ名、前記記事のタイトルおよび前記記事の本文と共に出力する
請求項4に記載の情報処理システム。
【請求項6】
テキストデータに対するユーザの関心度を推定するステップと、
前記ユーザから得た検索条件に合致した前記テキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎の前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力するステップと
を含む情報処理方法。
【請求項7】
テキストデータに対するユーザの関心度を推定するステップと、
前記ユーザから得た検索条件に合致した前記テキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎の前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力するステップと
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法およびプログラムに関する。
【背景技術】
【0002】
特許文献1には次のような記事配信システムが記載されている。すなわち、特許文献1に記載されている記事配信システムは、個人的注目度解析部と、記事選択部とを備える。個人的注目度解析部は、各記事に対するユーザの興味推定値である個人的注目度を求める。記事選択部は、個人的注目度と、各記事に対する他ユーザの興味推定値である社会的注目度とに基づいて、表示対象とする記事を選択する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2017-102652号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されている記事配信システムでは、代表的な1つの記事がユーザに配信される。しかしながらユーザは、自分の検索した記事のうち関心度の高い記事や、関心度が高くなかった記事をまとめて確認することができない。
【0005】
本発明は、上記課題を解決する情報処理システム、情報処理方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本発明の一態様は、テキストデータに対するユーザの関心度を推定する関心度推定手段と、前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力する出力手段とを備える情報処理システムである。
【0007】
また、本発明の一態様は、テキストデータに対するユーザの関心度を推定するステップと、前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力するステップとを含む情報処理方法である。
【0008】
また、本発明の一態様は、テキストデータに対するユーザの関心度を推定するステップと、前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力するステップと をコンピュータに実行させるプログラムである。
【発明の効果】
【0009】
本発明の各態様によれば、ユーザは、自分の検索した記事のうち関心度の高い記事や関心度の高くなかった記事をまとめて確認することができる。
【図面の簡単な説明】
【0010】
図1】本発明の実施形態に係るニュース記事整理システムの構成例を示す図である。
図2図1に示すニュース記事収集部a1の構成例を示すブロック図である。
図3図1に示すニュース記事整理処理部a2の構成例を示すブロック図である。
図4図1に示すニュース記事整理結果表示部a3の構成例を示すブロック図である。
図5図2に示すニュース記事収集部a1の動作例を示すフローチャートである。
図6図3に示すニュース記事整理処理部a2の動作例を示すフローチャートである。
図7図3に示す関心度算出部a21を説明するための模式図である。
図8図3に示すカテゴリ名判別部a22を説明するための模式図である。
図9図3に示すグルーピング判別部a23およびタイトル名生成部a24を説明するための模式図である。
図10図4に示すニュース記事整理結果表示部a3の動作例を示すフローチャートである。
図11図1に示すニュース記事整理処理部a2の変形例を示すブロック図である。
図12図11に示すニュース記事整理処理部a2rを説明するための模式図である。
図13】本発明の実施形態に係る情報処理システムの最小構成を示すブロック図である。
図14】本発明の実施形態に係る情報処理方法の最小構成を示すフローチャートである。
図15】本発明の実施形態に係るコンピュータの基本的構成例を示すブロック図である。
【発明を実施するための形態】
【0011】
以下、図面を参照して本発明の実施形態について説明する。なお、各図において同一または対応する構成には同一の符号を用いて説明を適宜省略する。
【0012】
なお、本発明の情報処理システムに係る実施形態は、大量の文章(テキストデータ)を分類し整理する分野一般で利用することができる。例えば、ニュース記事等の情報収集、分類および整理を行う分野、論文等の大量の文章を分類および整理する分野、自由記述形式アンケートを分類および整理する分野等である。以下では、本発明の実施形態を、ニュース記事を収集、分類および整理して、ユーザ端末等に表示するニュース記事整理システムとする場合について説明する。ただし、本発明の実施形態の適用分野はこの場合に限定されない。なお、ユーザ端末は、例えば、スマートフォン、タブレット端末、パーソナルコンピュータ等のユーザが使用する端末である。また、本実施形態において、テキストデータは、テキストを表す情報であり、1または複数の文を表すデータ、テキストデータのみを含むファイル、テキストデータと画像データ等のテキスト以外を表すデータを含むファイル等を含むものとする。
【0013】
図1は、本発明の実施形態に係るニュース記事整理システムの構成例を示す図である。図2は、図1に示すニュース記事収集部a1の構成例を示すブロック図である。図3は、図1に示すニュース記事整理処理部a2の構成例を示すブロック図である。図4は、図1に示すニュース記事整理結果表示部a3の構成例を示すブロック図である。図5は、図2に示すニュース記事収集部a1の動作例を示すフローチャートである。図6は、図3に示すニュース記事整理処理部a2の動作例を示すフローチャートである。図7は、図3に示す関心度算出部a21を説明するための模式図である。図8は、図3に示すカテゴリ名判別部a22を説明するための模式図である。図9は、図3に示すグルーピング判別部a23およびタイトル名生成部a24を説明するための模式図である。図10は、図4に示すニュース記事整理結果表示部a3の動作例を示すフローチャートである。
【0014】
(実施形態の構成の説明)
図1に示されるように、本実施形態に係るニュース記事整理システム1は、ニュース記事収集部a1、ニュース記事整理処理部a2およびニュース記事整理結果表示部a3を有する分析サーバaで構成されている。分析サーバaは、1または複数のサーバ等の情報処理装置を用いて構成することができる。なお、1または複数の情報処理装置は、例えばクラウド上等に構成されていてもよい。また、ニュース記事整理システム1および分析サーバaは、本発明に係る情報処理システムの一構成例である。また、ニュース記事整理処理部a2は、本発明に係る関心度推定手段の一構成例である。また、ニュース記事整理結果表示部a3は、本発明に係る出力手段の一構成例である。
【0015】
図2に示されるように、ニュース記事収集部a1は、ネットワーク装置a11、収集手段a12、記事本文抽出手段a13および記事本文格納手段a14を備える。ネットワーク装置a11および収集手段a12は、図1に示すニュース提供会社が運営するサーバ11~13からニュース記事を含むファイルを取得する。記事本文抽出手段a13は、収集したニュース記事から記事本文を抽出する。記事本文格納手段a14は、抽出した記事本文を格納する。
【0016】
また、図3に示されるように、ニュース記事整理処理部a2は、関心度算出部a21、カテゴリ名判別部a22、グルーピング判別部a23、タイトル名生成部a24、および整理結果格納手段a25を備える。
【0017】
関心度算出部a21は、記事本文の内容から読者(ユーザ)の記事内容への関心度を読者毎に推定して数値化する。関心度算出部a21は、例えば、図7に示されるように、関心度算出学習モデルS2023により読者の関心度を読者毎に算出する。関心度算出学習モデルS2023は、読者毎に複数用意される。各関心度算出学習モデルS2023は、あらかじめ、読者の関心度を読者毎に学習した学習済み機械学習モデルである。各関心度算出学習モデルS2023は、教師データとして、過去の記事本文とその記事に対する各読者の関心の有無のデータS2021を使い、学習したものである。教師データは、例えば読者のニュース記事整理結果表示部a3に対するアクセスの際に取得することができる。読者の関心の有無は、例えば、読者のその記事に対する対応に応じて決定することができる。例えば、記事を一定時間以上表示していたり、記事を保存したり、記事の内容をコピーしたりした場合に関心有りとすることができる。また、記事を開かなかったり、記事の表示時間が一定時間未満であったりした場合に関心無しとすることができる。関心度算出部a21は、1または複数の新たな教師データが取得された場合に、関心度算出学習モデルS2023を機械学習し、関心度算出学習モデルS2023を更新する。各関心度算出学習モデルS2023は、記事本文S2022を入力し、その記事に対する各読者の関心度を表すスコア(数値)S2024を出力する。例えば、スコアが高い程、関心が高い記事とすることができる。関心度算出部a21は、算出した関心度スコアを記事本文に付与し、読者毎に対応付けをしておく。
【0018】
ここで上記の関心度算出学習モデルS2023は以下のように生成することができる。例えば、学習装置が、記事と、ユーザのその記事に対する行動と、その行動に対応するスコアとの関係を複数記憶しておく、ユーザの記事に対する行動は、上記したように、記事の保存、コピー、表示時間等である。分析サーバは各ニュース提供会社のウェブサーバからこれらの行動のデータを取得することができる。各ニュース提供会社のウェブサーバは、記事の保存、コピー、表示時間などをユーザの端末からの情報を取得することにより検出する等してよい。そして学習装置は、あるユーザについての、記事の内容と、その記事に対する行動と、行動に対応するスコアとの関係を複数取得して、それらの関係を機械学習することにより関心度算出学習モデルS2023を生成する。行動に対応するスコアは予め規定されていてよい。例えば、表示時間が3分以上などの閾値以上の時間で、記事の保存またはコピーした場合には、高いスコアが規定されていてよい。また表示時間が10秒未満などの閾値未満の時間で、保存もコピーもしない場合や他の記事の表示に遷移した行動の場合には低いスコアが規定されていてよい。関心度算出学習モデルS2023は同様の公知の機械学習の技術を用いて、記事本文を入力した場合に、所定のユーザの関心度のスコアを算出する関心度算出学習モデルS2023を算出してよい。分析サーバaが関心度算出学習モデルS2023を生成する学習装置の機能を備えてよい。
【0019】
なお、記事と読者の関心の有無を教師データとして学習させた関心度算出モデルS2023を導出しておき、当該関心度算出モデルS2023を用いた推論フェーズで、ある記事に対する読者の関心を有する場合の確からしさを関心度スコアとして算出するようにしてもよい。
【0020】
カテゴリ名判別部a22は、記事本文に対して、記事のカテゴリ名を判別する。カテゴリ名とは、読者の関心事を分類する分類名である。カテゴリ名判別部a22は、例えば、図8に示されるように、カテゴリ名判別学習モデルS2043によりカテゴリ名を判別する。カテゴリ名判別学習モデルS2043は、あらかじめ、記事のカテゴリを学習した機械学習モデルである。カテゴリ名判別学習モデルS2043は、教師データとして、読者の関心事を示すグループに分類したいカテゴリに属する過去の記事本文とその記事のカテゴリ名のデータS2041を使い、学習したものである。これにより、カテゴリ名判別学習モデルS2043は、収集した記事本文S2042からカテゴリ名S2044を出力することができる。カテゴリ名判別部a22は、判別したカテゴリ名を記事本文に付与し、対応付けをしておく。
【0021】
ここで上記のカテゴリ名判別学習モデルS2043は以下のように生成することができる。例えば、学習装置が、ある関心毎のグループに属する記事本文とその記事のカテゴリ名との関係を複数取得して機械学習することによりカテゴリ名判別学習モデルS2043を生成する。カテゴリ名判別学習モデルS2043は公知の機械学習の技術を用いて、記事本文を入力した場合に、カテゴリ名を算出するカテゴリ名判別学習モデルS2043を算出すればよい。分析サーバaがカテゴリ名判別学習モデルS2043を生成する学習装置の機能を備えてよい。
【0022】
グルーピング判別部a23は、記事本文の内容からユーザが関心を示すグループに属する同一内容の記事を纏める(グルーピングする)。グルーピングとは、記事本文の内容が同じものを同一グループに纏めることである。一般的に、複数のニュース記事提供会社からニュース記事を集めた場合、同一内容のニュース記事が存在するケースが多い。グルーピング判別部a23は、例えば、図9に示されるように、グルーピング処理S2061により複数の記事本文S2062をグルーピングする。グルーピング手法としては、例えば、クラスタリング技術等を利用することができる。グルーピング判別部a23は、複数の記事本文S2062を、同一内容の記事本文のグループS2063、S2064、S2065等に纏めることができる。ニュース記事の内容に基づいてグループ毎にグルーピングされた場合、各グループは、ユーザの関心度の高い記事のグループや、ユーザの関心度の低いグループなどに、同一内容の記事が纏められて、それぞれ分類される。
【0023】
タイトル名生成部a24は、グルーピングされた各グループのタイトル名を生成する。読者は、各グループのタイトル名を参照することで、各グループの内容を容易に把握することができる。タイトル名生成部a24は、例えば、図9に示されるように、タイトル名生成処理S2071によりタイトル名を生成する。タイトル名生成部a24は、例えば、記事本文のグループS2063、S2064、S2065等に対して、各グループのタイトル名S2072、S2073、S2074等を生成する。タイトル名生成手法としては、例えば、TF-IDF(Term Frequency - Inverse Document Frequency)法によりグループの記事本文から特徴語を抽出する方法を利用することができる。あるいは、タイトル名生成手法としては、クラスタリングにおけるグループの中心となる記事の記事タイトルを利用する方法、記事本文を形態素解析および構文解析してタイトルを生成する方法等を利用することができる。
【0024】
整理結果格納手段a25は、関心度算出部a21、カテゴリ名判別部a22、グルーピング判別部a23およびタイトル名生成部a24の処理結果を格納する。
【0025】
また、図4に示されるように、ニュース記事整理結果表示部a3は、検索手段a31および表示手段a32を備える。検索手段a31は、整理結果格納手段a25に格納された整理結果を検索する。検索条件としては、ニュース記事の収集日、カテゴリ名、グループ名、関心度のスコアなどが考えられる。
【0026】
表示手段a32は、検索結果に基づき読者の端末画面等に記事本文の内容に係る情報と関心度を表す情報とを表示する。表示手段a32は、例えば、検索条件に合致したニュース記事をグループ別に纏めて、記事の関心度のスコア、カテゴリ名、記事のタイトルを表示するとともに、本文を読者の指示等に応じて表示する。読者は、記事の関心度のスコアを参照することで、自分の関心度が高いと思われる記事を容易に把握することができる。
【0027】
(実施形態の動作の説明)
図5図6および図10に示すフローチャート等を参照して、本実施形態に係るニュース記事整理システム1の動作例について説明する。はじめに、ニュース記事収集部a1において複数のニュース提供会社から対象とするニュース記事を収集する。ニュース記事収集部a1は、図5に示されるように、ニュース提供会社のウェブサーバ等からネットワーク装置a11および収集手段a12によりニュース記事を1件収集する(S101)。一般的にニュース記事には配信日、タイトル、関連情報、場合によっては広告等、様々な情報が含まれている。そのため、整理に必要な記事本文を記事本文抽出手段a13により抽出する(S102)。記事本文抽出手段a13は、抽出した記事本文を記事本文格納手段a14に格納する(S103)。例えば収集手段a12が収集対象とする複数のニュース提供会社のウェブサーバ等から全て収集し終えたかを判断し(S104)、収集を終えるまでステップS101~S104の処理が繰り返される。
【0028】
次に、ニュース記事整理処理部a2において、読者の関心事に合致するようにニュース記事を整理する。ニュース記事整理処理部a2は、図6に示されるように、関心度算出部a21が、記事本文格納手段a14から記事本文を読み込み(S201)、記事本文から各読者の関心度を算出する(S202)。関心度算出部a21は、算出した関心度スコアを記事本文に付与し、読者毎に対応付けをしておく(S203)。次に、カテゴリ名判別部a22が、記事本文に対して、記事のカテゴリ名を判別する(S204)。カテゴリ名判別部a22は、判別したカテゴリ名を記事本文に付与し、対応付けをしておく(S205)。次に、グルーピング判別部a23が、記事本文の内容でグルーピングを行う(S206)。次に、タイトル名生成部a24が、各グループのタイトル名を生成する(S207)。次に、ニュース記事整理処理部a2は、整理結果格納手段a25に、関心度の算出結果、カテゴリ名の判別結果、グルーピング結果およびグループ名の生成結果を格納する(S208)。
【0029】
また、ニュース記事整理処理部a2で処理された結果は、ニュース記事整理結果表示部a3において次のように出力される。図10に示されるように、ニュース記事整理結果表示部a3は、検索手段a31において、整理結果格納手段a25に格納された整理結果から読者が表示したい記事の検索条件を入力し(S301)、条件に合致する記事を検索する(S302)。次に、表示手段a32が、検索条件に合致したニュース記事をグループ別に纏めて、記事の関心度のスコア、カテゴリ名、記事のタイトルおよび本文を、図示していないユーザ端末で表示する(S303)。ユーザ端末では、例えば、複数のニュース記事について、グループ別に纏めて、記事のタイトル、記事毎の関心度のスコア、カテゴリ名等を一覧にして表示し、さらに、読者が指示したニュース記事について本文を表示することができる。その際、関心度のスコアは、数字や標章を用いて表示することができる。なお、表示の仕方についてはこの例に限定されない。ニュース記事整理結果表示部a3は、ステップS301~S303の処理を例えば読者が処理の終了を指示するまで(S304:Yes)、繰り返し実行する。
【0030】
(効果の説明)
本実施形態によれば、ニュース提供会社から収集したニュース記事全体から各読者の関心度が様々な記事を、記事の内容ごとに分類し、同一内容の多数の記事をグループに纏めて表示することができる。したがって、読者は自分に関心のある多数のニュース記事や、以前は関心が高くなかった多数のニュース記事をグループ毎にまとめて効率よく閲覧することができる。また、関心度のスコアを表す情報がユーザ端末で表示されるので、自分の検索した記事に対応する関心度を確認することができる。
【0031】
(実施形態の変形例)
読者が各グループの内容を容易に把握することができる方法として、各グループのタイトル名だけではなく、各グループに纏められた記事の要約を生成してもよい。図11は、図3に示すニュース記事整理処理部a2の変形例(ニュース記事整理処理部a2r)を示すブロック図である。図12は、図11に示すニュース記事整理処理部a2rを説明するための模式図である。
【0032】
図11に示されるように、図1および図3に示すニュース記事整理処理部a2の変形例であるニュース記事整理処理部a2rは、新たに要約文生成部a26を備える。要約文生成部a26は、例えば、図12に示されるように、グループに分けられた記事本文S2063、S2064、S2065等から要約文生成処理S2075により各グループの要約文S2076、S2077、S2078等を生成する。要約文生成処理に限定は無く、既存の処理手法を利用することができる。要約文生成部a26が生成した要約文は、グループ名に対応付けて整理結果格納手段a25に格納される。この変形例では、表示手段a32(図4)は、検索条件に合致したニュース記事をグループ別に纏めて、記事の関心度のスコア、カテゴリ名、記事のタイトルを表示するとともに、要約文または本文を読者の指示等に応じて表示する。読者は、各グループのタイトル名に比べ、各グループに纏められた記事内容を容易に把握することができる。
【0033】
(本実施形態の最小構成)
図13は、本発明の実施形態に係る情報処理システムの最小構成を示すブロック図である。図14は、本発明の実施形態に係る情報処理方法の最小構成を示すフローチャートである。
【0034】
図13に示すように、本実施形態に係る情報処理システム100は、少なくとも関心度推定手段101と、出力手段102とを備えればよい。
関心度推定手段101は、テキストデータに対するユーザの関心度を推定する(ステップS1)。
出力手段102は、ユーザから得た検索条件に合致したテキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎のテキストデータの内容に係る情報と関心度を表す情報とをユーザ端末へ出力する(ステップS2)。
【0035】
また、図14に示すように、本実施形態に係る情報処理方法は、ステップS1およびS2を含む。ステップS1では、テキストデータに対するユーザの関心度を推定する。ステップS2では、テキストデータの内容に係る情報と関心度を表す情報とをユーザ端末へ出力する。
【0036】
(コンピュータの構成)
図15は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ700は、CPU(Central Processing Unit)710、主記憶装置720、補助記憶装置730、およびインタフェース740を備える。インタフェース740には例えば不揮発性記憶媒体750が接続される。上述の分析サーバaは、コンピュータ700に実装される。そして、上述した各処理部の動作は、プログラムの形式で補助記憶装置730に記憶されている。CPU710は、プログラムを補助記憶装置730から読み出して主記憶装置720に展開し、当該プログラムに従って上記処理を実行する。また、CPU710は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置720に確保する。
【0037】
プログラムは、コンピュータ700に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、補助記憶装置730に既に記憶されている他のプログラムとの組み合わせ、または他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。なお、他の実施形態においては、コンピュータは、上記構成に加えて、または上記構成に代えてPLD(Programmable Logic Device)などのカスタムLSI(Large Scale Integrated Circuit)を備えてもよい。PLDの例としては、PAL(Programmable Array Logic)、GAL(Generic Array Logic)、CPLD(Complex Programmable Logic Device)、FPGA(Field Programmable Gate Array)等が挙げられる。この場合、CPU710によって実現される機能の一部または全部が当該集積回路によって実現されてよい。
【0038】
補助記憶装置730の例としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、磁気ディスク、光磁気ディスク、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、半導体メモリ等が挙げられる。補助記憶装置730は、コンピュータ700のバスに直接接続された内部メディアであってもよいし、インタフェース740または通信回線を介してコンピュータ700に接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ700に配信される場合、配信を受けたコンピュータ700が当該プログラムを主記憶装置720に展開し、上記処理を実行してもよい。少なくとも1つの実施形態において、補助記憶装置730は、一時的でない有形の記憶媒体である。
【0039】
以上、この発明の実施形態について図面を参照して説明してきたが、具体的な構成は上記実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。また、上記実施形態でコンピュータが実行するプログラムの一部または全部は、コンピュータ読取可能な記録媒体や通信回線を介して頒布することができる。
【0040】
上記実施形態の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
【0041】
(付記1)
テキストデータに対するユーザの関心度を推定する関心度推定手段と、
前記ユーザから得た検索条件に合致した前記テキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎の前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力する出力手段と
を備える情報処理システム。
【0042】
(付記2)
前記関心度推定手段は、複数のテキストデータと各テキストデータに対する前記ユーザの関心の有無を示すデータとを教師データとして前記ユーザ毎に機械学習し、前記テキストデータを入力した場合に、前記ユーザの関心度を表す数値を出力する学習済み機械学習モデルを用いて、前記ユーザの関心度を推定する
付記1に記載の情報処理システム。
【0043】
(付記3)
前記出力手段は、前記ユーザが指定した検索条件に合致した前記テキストデータに関する情報を出力する
付記1または付記2に記載の情報処理システム。
【0044】
(付記4)
前記テキストデータの内容に係る情報は、前記テキストデータが属するカテゴリを表す情報を含む
付記1~付記3の何れか一つに記載の情報処理システム。
【0045】
(付記5)
前記テキストデータが記事であり、
前記出力手段は、検索条件に合致した前記記事の内容に基づいてグループを特定し、当該グループのタイトル名を生成し、前記記事を、前記グループに基づいて纏めて、前記記事の関心度のスコア、カテゴリ名、前記記事のタイトルおよび前記記事の本文と共に出力する
付記1~付記4の何れか一つに記載の情報処理システム。
【0046】
(付記6)
テキストデータに対するユーザの関心度を推定するステップと、
前記ユーザから得た検索条件に合致した前記テキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎の前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力するステップと
を含む情報処理方法。
【0047】
(付記7)
テキストデータに対するユーザの関心度を推定するステップと、
前記ユーザから得た検索条件に合致した前記テキストデータの内容に基づいてグループ毎にまとめ、当該グループ毎の前記テキストデータの内容に係る情報と前記関心度を表す情報とをユーザ端末へ出力するステップと
をコンピュータに実行させるプログラム。
【符号の説明】
【0048】
1…ニュース記事整理システム、a…分析サーバ、a1…ニュース記事収集部、a2…ニュース記事整理処理部、a3…ニュース記事整理結果表示部、100…情報処理システム、101…関心度推定手段、102…出力手段、200…ユーザ端末
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15