(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023154640
(43)【公開日】2023-10-20
(54)【発明の名称】処理装置、処理方法及び処理プログラム
(51)【国際特許分類】
G06F 40/279 20200101AFI20231013BHJP
G06F 40/56 20200101ALI20231013BHJP
【FI】
G06F40/279
G06F40/56
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022064101
(22)【出願日】2022-04-07
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 1.公開1 (1)展示日:令和3年4月7日~令和3年4月9日 (2)展示会名、開催場所 第5回 AI・人工知能EXPO 〔春〕 東京ビッグサイト (東京都江東区有明3-11-1) (3)公開者:株式会社バズグラフ (4)出品内容 株式会社バズグラフは、第5回 AI・人工知能EXPO 〔春〕にて、西本 光治が発明した処理装置、処理方法及び処理プログラムとして、文章要約AI「タンテキ」のβ版を出品した。
(71)【出願人】
【識別番号】516330516
【氏名又は名称】株式会社バズグラフ
(74)【代理人】
【識別番号】100151448
【弁理士】
【氏名又は名称】青木 孝博
(74)【代理人】
【識別番号】230121016
【弁護士】
【氏名又は名称】小笠原 匡隆
(72)【発明者】
【氏名】西本 光治
【テーマコード(参考)】
5B091
【Fターム(参考)】
5B091CA21
(57)【要約】
【課題】テキスト情報を要約して得られる要約情報の文字数、及び要約情報の文字数のテキスト情報の文字数に対する割合の少なくとも一方に基づいて、テキスト情報を要約できるようにする。
【解決手段】本開示の一つの側面に係る処理装置は、少なくとも一つのプロセッサを含む処理装置であって、前記少なくとも一つのプロセッサは、テキスト情報から、複数の形態素が含まれた要約対象テキスト情報を選択するための操作を受け付け、前記要約対象テキスト情報を選択するための操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、前記要約対象テキスト情報から生成された前記要約情報を出力するための処理を実行するように構成される。
【選択図】
図7B
【特許請求の範囲】
【請求項1】
少なくとも一つのプロセッサを含む処理装置であって、
前記少なくとも一つのプロセッサは、
テキスト情報から、複数の形態素が含まれた要約対象テキスト情報を選択するための操作を受け付け、 前記要約対象テキスト情報を選択するための操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、前記要約対象テキスト情報から生成された前記要約情報を出力する、
ための処理を実行するように構成された、処理装置。
【請求項2】
前記要約情報は、前記設定情報を満たすように生成される、請求項1に記載の処理装置。
【請求項3】
前記要約情報は、選択した前記要約対象テキスト情報の文字数が、前記設定情報により示される前記要約情報の文字数以上の場合に生成される、
請求項1に記載の処理装置。
【請求項4】
前記要約情報を出力する処理は、前記処理装置において予めインストールされて起動され、常駐するアプリケーションプログラムに基づいて実行される、請求項1に記載の処理装置。
【請求項5】
前記要約対象テキストを選択するための操作は、前記テキスト情報のうちの少なくとも一部をコピーするための操作である、請求項4に記載の処理装置。
【請求項6】
前記要約対象テキストを選択する操作は、前記テキスト情報のうちの少なくとも一部を選択し、選択した前記テキスト情報のうちの少なくとも一部に対する処理内容を選択することによって前記要約情報を出力する処理を実行するためのアプリケーションプログラムを起動するための操作である、請求項1に記載の処理装置。
【請求項7】
前記要約情報は、
前記要約対象テキスト情報を、前記複数の形態素を個々の前記形態素又は形態素群に分割し、
分割された前記個々の形態素又は形態素群の間の関係性を特定し、
特定された前記関係性に基づいて前記要約対象テキスト情報に含まれる前記複数の形態素を構造化する
ことによって結果に基づいて前記要約対象テキスト情報から生成される、請求項1に記載の処理装置。
【請求項8】
前記関係性の特定は、前記形態素又は形態素群について予め対応付けられた属性情報と分割された前記個々の形態素又は形態素群とに基づいて行われる、請求項7に記載の処理装置。
【請求項9】
前記関係性の特定は、前記個々の形態素又は形態素群の機能を特定することによって行われる、請求項8に記載の処理装置。
【請求項10】
少なくとも一つのプロセッサを含むコンピュータにおいて、前記少なくとも一つのプロセッサが所定の指示命令を実行することによりなされる方法であって、
テキスト情報から、複数の形態素が含まれた要約対象テキスト情報を選択するための操作を受け付ける段階と、
前記要約対象テキスト情報を選択するための操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、前記要約対象テキスト情報から生成された前記要約情報を出力する段階と、
を含む処理方法。
【請求項11】
少なくとも一つのプロセッサを含むコンピュータを、
テキスト情報から、複数の形態素が含まれた要約対象テキスト情報を選択するための操作を受け付け、
前記要約対象テキスト情報を選択するための操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、前記要約対象テキスト情報から生成された前記要約情報を出力する、
処理を実行するように構成されたプロセッサとして機能させる、
処理プログラム。
【請求項12】
少なくとも一つのプロセッサを含む処理装置であって、
前記少なくとも一つのプロセッサは、
前記処理装置とネットワークを介して接続された端末装置から複数の形態素が含まれた要約対象テキスト情報を受信し、
前記端末装置の入力インターフェイスを介して入力されたユーザの操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、受信した前記要約対象テキスト情報から前記要約情報を生成する、
ための処理を実行するように構成された、処理装置。
【請求項13】
少なくとも一つのプロセッサを含むコンピュータにおいて、前記少なくとも一つのプロセッサが所定の指示命令を実行することによりなされる方法であって、
前記処理装置とネットワークを介して接続された端末装置から複数の形態素が含まれた要約対象テキスト情報を受信する段階と、
前記端末装置の入力インターフェイスを介して入力されたユーザの操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、受信した前記要約対象テキスト情報から前記要約情報を生成する段階と、
を含む処理方法。
【請求項14】
少なくとも一つのプロセッサを含むコンピュータを、
前記処理装置とネットワークを介して接続された端末装置から複数の形態素が含まれた要約対象テキスト情報を受信し、
前記端末装置の入力インターフェイスを介して入力されたユーザの操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、受信した前記要約対象テキスト情報から前記要約情報を生成する、
処理を実行するように構成されたプロセッサとして機能させる、
処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、テキスト情報から要約情報を生成する処理を行う処理装置、処理方法、及び処理プログラムに関する。
【背景技術】
【0002】
1990年代以降のコンピュータの性能向上及び自然言語処理技術の向上に伴い、近年では、テキスト情報から要約情報を生成することが可能となっている。例えば、特許文献1は、鉄道事業に関するテキスト情報から、このテキスト情報の要点を含む要約情報を生成する方法等を開示する。しかしながら、特許文献1に開示された方法は、要約情報の文字数、及びテキスト情報の文字数に対して、要約文の文字数をどの程度の割合にするかを設定できない。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
本実施形態は、上述した背景からなされたものであり、テキスト情報を要約して得られる要約情報の文字数、及び要約情報の文字数のテキスト情報の文字数に対する割合の少なくとも一方に基づいて、テキスト情報を要約できるようにすることを目的とする。
【課題を解決するための手段】
【0005】
本開示に係る第1の処理装置は、少なくとも一つのプロセッサを含む処理装置であって、前記少なくとも一つのプロセッサは、テキスト情報から、複数の形態素が含まれた要約対象テキスト情報を選択するための操作を受け付け、前記要約対象テキスト情報を選択するための操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、前記要約対象テキスト情報から生成された前記要約情報を出力するための処理を実行するように構成される。
【0006】
また、本開示に係る第1の処理方法は、少なくとも一つのプロセッサを含むコンピュータにおいて、前記少なくとも一つのプロセッサが所定の指示命令を実行することによりなされる方法であって、テキスト情報から、複数の形態素が含まれた要約対象テキスト情報を選択するための操作を受け付ける段階と、前記要約対象テキスト情報を選択するための操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、前記要約対象テキスト情報から生成された前記要約情報を出力する段階とを含む。。
【0007】
本開示に係る第1の処理プログラムは、少なくとも一つのプロセッサを含むコンピュータを、複数の形態素が含まれたテキスト情報から要約対象テキスト情報を選択する入力を受け付け、入力インターフェイスを介して入力されたユーザの操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、前記要約対象テキスト情報から生成された前記要約情報を出力する処理を実行するように構成されたプロセッサとして機能させる。
【0008】
本開示に係る第2の処理装置は、少なくとも一つのプロセッサを含む処理装置であって、前記少なくとも一つのプロセッサは、前記処理装置とネットワークを介して接続された端末装置から複数の形態素が含まれた要約対象テキスト情報を受信し、前記端末装置の入力インターフェイスを介して入力されたユーザの操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、受信した前記要約対象テキスト情報から前記要約情報を生成するための処理を実行するように構成される。
【0009】
本開示に係る第2の処理方法は、少なくとも一つのプロセッサを含むコンピュータにおいて、前記少なくとも一つのプロセッサが所定の指示命令を実行することによりなされる方法であって、前記処理装置とネットワークを介して接続された端末装置から複数の形態素が含まれた要約対象テキスト情報を受信する段階と、前記端末装置の入力インターフェイスを介して入力されたユーザの操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、受信した前記要約対象テキスト情報から前記要約情報を生成する段階とを含む。
【0010】
本開示に係る第2の処理プログラムは、少なくとも一つのプロセッサを含むコンピュータを、前記処理装置とネットワークを介して接続された端末装置から複数の形態素が含まれた要約対象テキスト情報を受信し、前記端末装置の入力インターフェイスを介して入力されたユーザの操作に応じて、前記要約対象テキスト情報を要約して生成される要約情報の文字数、及び前記要約情報の文字数の前記要約対象テキスト情報の文字数に対する割合の少なくとも一方を示す設定情報に基づいて、受信した前記要約対象テキスト情報から前記要約情報を生成する処理を実行するように構成されたプロセッサとして機能させる。
【発明の効果】
【0011】
本開示に係る処理装置等によれば、テキスト情報を要約して得られる要約情報の文字数、及び要約情報の文字数のテキスト情報の文字数に対する割合の少なくとも一方に基づいて、テキスト情報を要約できる。
【0012】
なお、上述した効果は説明の便宜のための例示的なものであるにすぎず、限定的なものではない。上述した効果に加えて、又は上述した効果に代えて、本開示中に記載されたいかなる効果や当業者であれば明らかな効果を奏することも可能である。
【図面の簡単な説明】
【0013】
【
図1】
図1は、実施形態に係るシステム1の構成を示す図である。
【
図2】
図2は、
図1に示した端末装置100の構成を例示する図である。
【
図3】
図3は、
図1に示したサーバ装置200-1及び特徴語辞書生成装置200-2の構成を例示する図である。
【
図4A】
図4Aは、端末装置100において実行されるテキスト情報処理プログラム14の機能を示す機能ブロック図である。
【
図4B】
図4Bは、サーバ装置200-1において実行される要約プログラム22の機能を示す機能ブロック図である。
【
図4C】
図4Cは、
図4Bに示した要約プログラム22の構造化処理モジュール230が生成する構造化情報を概念的に例示する図である。
【
図5】
図5は、端末装置100において実行される特徴語辞書生成プログラム26の機能を示す機能ブロック図である。
【
図6】
図6は、
図1及び
図3に示したサーバ装置200-1、及び
図4Bに示した要約プログラム22において処理に用いられる要約対象テキスト情報処理テーブルを例示する図である。
【
図7A】
図7Aは、
図1に示した端末装置100、サーバ装置200-1及び特徴語辞書生成装置200-2の間の通信シーケンス図である。
【
図7B】
図7Bは、
図1及び
図2に示した端末装置100がユーザの操作に応じて要約対象テキスト情報を選択してサーバ装置200-1に送信する第1の処理を示すフローチャートである。
【
図7C】
図7Cは、
図7Bに示した端末装置100及びテキスト情報処理プログラム14の処理に伴ってプロセッサ112が端末装置100のディスプレイに表示するUI画像を例示する第1の図である。
【
図7D】
図7Dは、
図7Bに示した端末装置100及びテキスト情報処理プログラム14の処理に伴ってプロセッサ112が端末装置100のディスプレイに表示するUI画像を例示する第2の図である。
【
図7E】
図7Eは、
図7Bに示した端末装置100及びテキスト情報処理プログラム14の処理に伴ってプロセッサ112が端末装置100のディスプレイに表示するUI画像を例示する第3の図である。
【
図7F】
図7Fは、端末装置100が、サーバ装置200-1から要約情報を受信する処理を示すフローチャートである。
【
図7G】
図7Gは、
図7Cに示したUI画像のテキスト情報表示部分に表示されたテキスト情報及び要約対象テキスト情報と、要約情報表示部分に表示された要約情報とを示す図である。
【
図7H】
図7Hは、サーバ装置200-1が、端末装置100から受信した要約対象テキスト情報から要約情報を生成し、端末装置100に送信する処理を示すフローチャートである。
【
図7I】
図7Iは、
図7Cに示したUI画像に含まれる要約対象テキスト情報表示部分及び要約情報表示部分それぞれに表示された複数の要約対象テキスト情報1~m及び複数の要約情報1~mを例示する図である。
【
図8A】
図8Aは、
図1及び
図2に示した端末装置100が、ユーザの操作に応じて要約対象テキスト情報を選択してサーバ装置200-1に送信する処理を示す第2のフローチャートである。
【
図8B】
図8Bは、
図8Aに示した端末装置100の処理に伴って、プロセッサ112が端末装置100のディスプレイに表示するUI画像を例示する図である。
【
図9A】
図9Aは、端末装置100のプロセッサ112が、サーバ装置200-1が生成した要約情報の重要部分を強調して示すUI画像を例示する図である。
【
図9B】
図9Bは、プロセッサ112が生成するキーワード出願率を示すUI画像を例示する図である。
【発明を実施するための形態】
【0014】
以下、本開示の実施形態として、テキスト情報を要約して要約情報を生成する処理等を、図面を参照して詳細に説明する。なお、図面において実質的に同じ構成要素、処理及び情報には同じ符号及び名称が付される。また、「情報」と「データ」とは厳密には区別されない。また、「ユーザ」は、一人の自然人だけでなく、複数の自然人、法人、団体及び企業等を意味しうる。
【0015】
また、図面において、構成要素及びデータの数及び種類は例示的に示され、適宜、増減されたり変更されたりしうる。また、図面において、装置の間における通信の順番は例示的に示され、適宜、変更される。また、図面において、発明の本質的な説明に関係しない構成要素は、適宜、省略されることがある。また、図示の都合上、図面において、「情報」及び「モジュール」等、構成要素及び情報の名称の一部が適宜、省略されることがある。
【0016】
1.システム1の構成及びシステム1における処理の概要
図1は、実施形態に係るシステム1の構成を示す図である。
図1に示すように、システム1は、端末装置100、サーバ装置200-1及び通信ネットワーク12を含む。さらに、サーバ装置200-1には、特徴語辞書生成装置200-2が、これらの間で情報及びデータを相互に通信可能に接続される。ただし、特徴語辞書生成装置200-2は、システム1に含まれる必要はなく、システム1と関係なく通信ネットワーク12に接続されてもよい。
【0017】
通信ネットワーク12は、インターネット、LAN、VPN、WAN及びクラウドネットワーク等である。端末装置100と、サーバ装置200-1とは、有線通信回線及び無線通信回線又はこれらの一方を介して通信ネットワーク12に接続される。端末装置100とサーバ装置200-1とは、通信ネットワーク12を介して、これらの間で情報及びデータを相互に通信可能に接続される。なお、
図1には、サーバ装置200-1と特徴語辞書生成装置200-2とが個別の装置とされる場合が示されるが、これらは一つの装置として構成されてよい。
【0018】
なお、端末装置100、サーバ装置200-1及び特徴語辞書生成装置200-2のいずれも、単独で、この実施形態に係る要約処理の全てを行う処理装置となりうる。ただし、以下の説明においては、端末装置100がテキスト情報から要約対象テキスト情報を生成してサーバ装置200-1に送信し、サーバ装置200-1が要約対象テキスト情報を受信して要約処理を行う場合が具体例とされる。また、サーバ装置200-1が生成した要約情報を端末装置100に返す場合が具体例とされる。なお、要約対象テキスト情報は、テキスト情報のうち、ユーザにより選択された一部又は全部であって、サーバ装置200-1による要約処理の対象とされる範囲である。サーバ装置200-1による要約処理には、特徴語辞書生成装置200-2からサーバ装置200-1に提供される特徴語辞書が利用される。
【0019】
端末装置100は、複数の形態素を含むテキスト情報を、ユーザの操作に応じて生成し、あるいは、通信ネットワーク12に接続されたWebサーバ等の他の装置(不図示)から受信し、メモリ113に記憶する。なお、形態素は、言語学の用語であって、意味をもつ表現要素の最小単位であり、ある言語において、それ以上分解したら意味をなさなくなるところまで分割して抽出された音素のまとまりのそれぞれである。なお、英語等のように、単語が一つずつ分かち書きされる言語においては、例外はあるが、ほぼ、一つの単語が一つの形態素である。このように、複数の形態素を含むテキスト情報は、ワードプロセッサを利用してユーザにより作成されるテキスト情報、Webサーバにより提供されるテキスト情報、及びオンライン会議の音声を認識して得られるテキスト情報等、ごく一般的で普通のテキスト情報である。
【0020】
端末装置100は、このようなテキスト情報のうち、ユーザの選択操作により選択された一部又は全部の範囲を、設定情報及び要約作成要求情報とともにサーバ装置200-1に送信し、要約情報の生成を要求する。設定情報は、要約情報の文字数等を示す。また、要約作成要求情報は、端末装置100からサーバ装置200-1に、要約情報の作成が要求されたことを示す。端末装置100は、要約処理の要求に応じ、設定情報に基づいてサーバ装置200-1が生成した要約情報を、サーバ装置200-1から受信して表示する。なお、端末装置100からサーバ装置200-1への要約対象テキスト情報の送信は、例えば、テキスト情報の一部又は全部がコピーされたこと、及び、テキスト情報の一部又は全部の範囲が選択され、選択された範囲に対して要約処理が処理内容として指定されたことを契機として行われる。
【0021】
設定情報は、上述した要約対象テキスト情報を要約して生成される要約情報の文字数、又は要約情報の文字数の要約対象テキスト情報の文字数に対する割合を示す情報を含む。なお、要約対象テキスト情報を要約して生成される要約情報の文字数を示す情報は文字数情報とも記載される。また、要約情報の文字数の要約対象テキスト情報の文字数に対する割合は、圧縮率とも呼ばれ、圧縮率を示す情報は圧縮率情報とも記載される。
【0022】
また、システム1において、サーバ装置200-1が、日本語の要約対象テキスト情報から要約情報を生成する場合が具体例とされる。例えば、要約対象テキスト情報が、「テキスト情報に」という文字列を含んでいる場合には、この文字列に含まれる形態素は、「テキスト」、「情報」及び「に」である。また、この実施形態においては、複数の形態素「テキスト」及び「情報」を含む「テキスト情報」、及び複数の形態素「情報」及び「に」を含む「情報に」等、複数の形態素を含む一連の音素は、「形態素群」と記載される。
【0023】
2.端末装置100の構成
以下、
図2を参照して、端末装置100の構成を説明する。
図2は、
図1に示した端末装置100の構成を例示する図である。なお、端末装置100は、
図2に示す構成要素の全てを備える必要はなく、端末装置100の一部の構成要素は省略されうる。また、端末装置100には、
図2に示す以外の他の構成要素が加えられうる。端末装置100は、スマートフォンといった携帯端末装置、タブレット型コンピュータといった端末装置、又はノート型パーソナルコンピュータ(PC)及びデスクトップ型PCといった汎用の情報処理装置でありうる。
【0024】
図2に示すように、端末装置100は、バスを介して相互に接続された出力インターフェイス(出力IF)111、プロセッサ112、メモリ113、通信インターフェイス(通信IF)114、及び入力インターフェイス(入力IF)116を含む。
【0025】
メモリ113は、RAM、ROM、不揮発性メモリ(NVM)、HDD(不図示)及びSSD(不図示)等を含む。通信インターフェイス114は、通信処理回路115及びアンテナを含む。入力インターフェイス116は、マウス117及びハードキー118を含む。そして、端末装置100のこれらの構成要素は、制御ライン(不図示)及びバスを介して電気的に接続され、データ及び情報を相互に送受信する。
【0026】
出力インターフェイス111は、スピーカ及びディスプレイ(不図示)等の出力デバイスを端末装置100に接続する。なお、これらの出力デバイスは、端末装置100の外部に配置され、出力インターフェイス111を介して接続されても、端末装置100と一体に構成されて出力インターフェイス111に接続されてもよい。
【0027】
プロセッサ112は、1以上のCPU(マイクロプロセッサ)又は1以上のCPUと画像処理に特化した1以上のGPU等との組み合わせと、その周辺回路とから構成される。プロセッサ112は、メモリ113に記憶された各種プログラムに基づいて、接続された他の構成要素を制御する制御部として機能する。
【0028】
具体的には、プロセッサ112は、実施形態に係る要約処理を実行するための所定の指示命令を含むアプリケーションプログラム、及びOSの処理のための所定の指示命令を含むプログラムをメモリ113から読み出して実行する。
【0029】
OSは、アプリケーションプログラムのインストール、アンインストール、起動、実行、及び常駐等のための様々な機能を提供する。なお、端末装置100にインストールされたアプリケーションプログラムが常駐すると、必要な場合にいつでも利用可能なように、当該アプリケーションプログラムは、メモリ113に常に記憶され、実行されうる状態とされる。さらに、常住したアプリケーションプログラムは、例えば、ユーザによるテキスト情報の一部又は全部をクリップボードにコピーするための操作等に応じて起動され、バックグラウンドで処理を行いうる。
【0030】
また、OSは、プロセッサ112によるアプリケーションプログラムの実行のための機能を提供する。OSにより提供されるこれらの機能は、端末装置100とサーバ装置200-1との通信のために必要とされる機能を含む。また、これらの機能は、ディスプレイに表示されたテキスト情報に対する選択に応じて、テキスト情報の一部又は全部の範囲を選択する機能を含む。テキスト情報の範囲の選択は、一例としては、ユーザによるマウス117の左ボタン(不図示)の押下、マウス117の移動に対応してマウスポインタの位置を動かす操作、及び左ボタンの押下の停止の一連の操作に応じて行われる。さらに、OSは、一連の操作によって選択されたテキスト情報に対して、例えば、クリップボードにコピーして記憶させる機能を含む。この機能は、ユーザが、上述した通りに、テキスト情報の範囲が選択された状態で、右ボタン(不図示)を押下してコピー操作を行ったり、所定のキー入力をしたりすることによって行われる。
【0031】
また、これらの機能は、一例としては、ユーザによる操作に応じて、複数の機能のいずれかを選択するために用いられるメニューボックスを表示する機能を含む。メニューボックスの表示は、例えば、ユーザがマウス117を動かして、選択されたテキスト情報の範囲にマウスポインタを移動させ、マウス117の右ボタン(不図示)を押下する一連の操作に応じて行われる。
【0032】
なお、上述したテキスト情報の一部又は全部の範囲を選択するためのユーザによるマウス117に対する操作は、単なる一例に過ぎない。例えば、テキスト情報の一部又は全部の範囲の選択は、ノートPC等のタッチパッド及びタッチセンサ(不図示)を用いたユーザの指示体(例えば指)によるタップ操作及びドラッグ操作により行われうる。また、テキスト情報の一部又は全部の範囲の選択は、当然に、マウス117、タッチパッド、又はタッチセンサ以外の入力デバイスを用いて行われてよい。
【0033】
特に、端末装置100のプロセッサ112は、複数の形態素が含まれたテキスト情報の入力を受け付けるための所定の指示命令を含むアプリケーションプログラムをメモリ113から読み出して実行する。また、端末装置100のプロセッサ112は、入力インターフェイス116を介して入力されたユーザの操作に応じて、テキスト情報を要約して生成される要約情報の文字数、又は要約情報の文字数のテキスト情報の文字数に対する割合を示す設定情報に基づいて、テキスト情報から生成された要約情報を出力する所定の指示命令を含むアプリケーションプログラムをメモリ113から読み出して実行する。プロセッサ112は、OSの機能を利用して、これらのプログラムをメモリ113にロードし、端末装置100にインストールし、端末装置100において起動されて常駐するように(常駐化)する。
【0034】
メモリ113は、記憶部として機能する。さらに、メモリ113には、端末装置100に対して着脱可能な記憶媒体及びデータベース(不図示)等が接続されうる。メモリ113において、ROMは、OS等の処理のための所定の指示命令を含むプログラムを記憶する。
【0035】
RAMは、ROMに記憶されたアプリケーションプログラム及びOSのプログラムがプロセッサ112により処理されている間に、処理に必要とされるデータの書き込み、及び読み出しが行われるメモリである。不揮発性メモリは、書き込まれたデータを電源の供給なしに保持するメモリである。不揮発性メモリには、プロセッサ112により、当該プログラムの実行によって得られたデータが書き込まれたり、書き込まれたデータが読み出されたりする。
【0036】
特に、端末装置100のメモリ113は、複数の形態素が含まれたテキスト情報の入力を受け付けるための所定の指示命令を含むアプリケーションプログラムを記憶する。また、端末装置100のメモリ113は、入力インターフェイス116を介して入力されたユーザの操作に応じて、テキスト情報を要約して生成される要約情報の文字数、又は要約情報の文字数のテキスト情報の文字数に対する割合を示す設定情報に基づいて、テキスト情報から生成された要約情報を出力する所定の指示命令を含むアプリケーションプログラムを記憶する。これらのプログラムは、プロセッサ112によりメモリ113にロードされ、インストールされ、常駐化される。
【0037】
通信インターフェイス114は、通信処理回路115及びアンテナを介して通信ネットワーク12と端末装置100とを接続し、通信ネットワーク12に接続されたサーバ装置200-1等の他の装置との間で、データの送受信を行う通信部として機能する。通信処理回路115は、広帯域又は狭帯域の無線通信方式によって、通信ネットワーク12と端末装置100の間で、アンテナを介して情報を通信するための通信処理を行う。なお、広帯域の無線通信方式は、例えばLTE方式であり、狭帯域の無線通信方式は、例えばIEEE802.11及びBluetooth(登録商標)等である。また、通信処理回路115は、無線通信の代わりに、又は無線通信に加えて、有線通信のための処理を行ってもよい。
【0038】
入力インターフェイス116は、マウス117及びハードキー118等の入力デバイスと有線通信又は無線通信によって接続され、ユーザの操作を受け入れて各種情報の入力を受ける入力部として機能する。入力インターフェイス116の例としては、シリアルポート、パラレルポート、及びUSB等が挙げられる。また、無線通信(例えば、Bluetooth(登録商標))によりマウス117を接続するような場合には、無線通信機能を有する構成要素に、入力インターフェイス116及び通信インターフェイス114の機能を兼用させることも可能である。
【0039】
マウス117は、それ自体の移動を検出するセンサ、左ボタン及び右ボタン等を含む。マウス117は、ディスプレイに表示されたマウスポインタを移動させるユーザの操作を検出する。また、マウス117は、ディスプレイに表示されたアイコン等に対する左ボタン(不図示)を用いたユーザのクリック操作を検出する。上述したように、ユーザは、マウス117の移動、マウス117の右ボタン及び左ボタンへの操作の組み合わせにより、テキスト情報の一部又は全部の範囲をクリップボードにコピーする等の機能をOSに実行させられる。なお、マウス117に対する操作により選択され、クリップボードにコピーされたテキスト情報の範囲は、要約対象テキスト情報とされる。
【0040】
ハードキー118は、機械的スイッチを含み、ユーザによる端末装置100への操作を受け入れて、入力インターフェイス116を介してプロセッサ112に出力する。なお、端末装置100とハードキー118とは一体に構成されても、別々に構成されてもよい。端末装置100とハードキー118とが別々に構成される場合には、端末装置100とマウス117及びハードキー118の間は無線通信又は有線通信によって接続される。
【0041】
出力インターフェイス111に接続されるディスプレイは、プロセッサ112の指示に応じて、メモリ113に記憶された画像情報を読み出して、各種表示を行う表示部として機能する。ディスプレイは、実施形態に係る要約処理の実行のための情報等を表示する。なお、ディスプレイは、例えば液晶ディスプレイや有機ELディスプレイから構成される。出力インターフェイス111に接続されるスピーカは、端末装置100が受信した音声データから得られた音声信号を出力するオーディオ出力部として機能する。
【0042】
3.サーバ装置200-1及び特徴語辞書生成装置200-2の構成
以下、
図3を参照して、サーバ装置200-1及び特徴語辞書生成装置200-2の構成を説明する。
図3は、
図1に示したサーバ装置200-1及び特徴語辞書生成装置200-2の構成を例示する図である。例えば、サーバ装置200-1及び特徴語辞書生成装置200-2は、PCサーバあるいは大型コンピュータ等の情報処理装置でありうる。
【0043】
サーバ装置200-1は、端末装置100から、設定情報及び要約生成要求情報を伴う要約対象テキスト情報を受信し、設定情報に基づいて要約対象テキスト情報を要約し、要約情報を生成する。サーバ装置200-1は、要約処理において、特徴語辞書生成装置200-2から提供される特徴語辞書を用いる。サーバ装置200-1は、生成した要約情報を、端末装置100に送信する。
【0044】
特徴語辞書生成装置200-2は、要約対象テキスト情報をサーバ装置200-1から継続的に受信してメモリ213に記憶する。あるいは、特徴語辞書生成装置200-2は、通信ネットワーク12に接続されたWebサーバ等(不図示)からテキスト情報を受信してメモリ213に記憶する。システム1が、多数の端末装置100を含む場合には、特徴語辞書生成装置200-2がサーバ装置200-1から受信する要約対象テキスト情報は、大量になる。特徴語辞書生成装置200-2は、さらに、記憶した大量の要約対象テキスト情報から、サーバ装置200-1において要約処理に用いられる複数の特徴語を含む特徴語辞書を生成し、サーバ装置200-1に対して送信する。なお、特徴語とは、大量の要約対象テキスト情報における出現頻度等に基づいて重み付けをすることにより抽出される単語である。
【0045】
なお、特徴語辞書生成装置200-2は、要約対象テキスト情報だけから特徴語辞書を生成しなくてよい。この場合には、
図1に点線の矢印で示すように、特徴語辞書生成装置200-2は、通信ネットワーク12に接続される。さらに、特徴語辞書生成装置200-2は、通信ネットワーク12に接続されたWebサーバ等(不図示)から、ニュース等の大量のテキスト情報を受信し、処理して特徴語辞書を生成する。あるいは、特徴語辞書生成装置200-2は、Webサーバ等から受信した大量のテキスト情報のみを処理して特徴語辞書を生成してよい。
【0046】
図3に示すように、サーバ装置200-1及び特徴語辞書生成装置200-2は、端末装置100と同様に、バス等を介して相互に接続された出力インターフェイス211と、プロセッサ212と、メモリ213と、通信インターフェイス214とを備える。そして、サーバ装置200-1のこれらの構成要素は、バス等を介して電気的に接続され、データ及び情報を相互に送受信する。メモリ213は、RAM、ROM、不揮発性メモリ、HDD(不図示)及びSSD(不図示)等を含む。
【0047】
なお、サーバ装置200-1及び特徴語辞書生成装置200-2は、
図3に示す構成要素の全てを備える必要はなく、一部の構成要素は省略されうる。また、サーバ装置200-1に、
図3に示した以外の他の構成要素が加えられうる。なお、サーバ装置200-1及び特徴語辞書生成装置200-2それぞれのメモリ213及びプロセッサ212は、1台のコンピュータにおいて一体に構成されても、複数のコンピュータに渡って分散されて構成されてもよい。
【0048】
出力インターフェイス211は、端末装置100の出力インターフェイス111と同様に、スピーカ及びディスプレイ(不図示)等の出力デバイスをサーバ装置200-1に接続する。なお、これらの出力デバイスは、サーバ装置200-1の外部に配置され、出力インターフェイス211を介して接続されても、サーバ装置200-1と一体に構成されて出力インターフェイス211に接続されてもよい。
【0049】
プロセッサ212は、端末装置100のプロセッサ112と同様に、1以上のCPU(マイクロプロセッサ)、又は1以上のCPUと1以上のGPU等との組み合わせと、その周辺回路とから構成される。プロセッサ212は、メモリ213に記憶された各種プログラムに基づいて、接続された他の構成要素を制御する制御部として機能する。具体的には、プロセッサ212は、アプリケーションプログラム及びOS等の所定の指示命令を含むプログラムをメモリ213から読み出して実行する。
【0050】
特に、サーバ装置200-1のプロセッサ212は、サーバ装置200-1とネットワークを介して接続された端末装置100から複数の形態素が含まれたテキスト情報を受信する所定の命令を含むアプリケーションプログラムをメモリ213から読み出して実行する。また、サーバ装置200-1のプロセッサ212は、端末装置100の入力インターフェイス116を介して入力されたユーザの操作に応じて、テキスト情報を要約して生成される要約情報の文字数、又は要約情報の文字数のテキスト情報の文字数に対する割合を示す設定情報に基づいて、受信したテキスト情報から要約情報を生成する所定の指示命令を含むアプリケーションプログラムをメモリ213から読み出して実行する。
【0051】
また、特に、特徴語辞書生成装置200-2のプロセッサ212は、記憶した大量の要約対象テキスト情報及びニュース等のテキスト情報又はこれらの一方から、サーバ装置200-1において要約処理に用いられる複数の特徴語を含む特徴語辞書を生成するための所定の指示命令を含むアプリケーションプログラムを、メモリ213から読み出して実行する。また、特徴語辞書生成装置200-2のプロセッサ212は、生成した特徴語辞書を、サーバ装置200-1に対して送信する処理のための所定の指示命令を含むアプリケーションプログラムを、メモリ213から読み出して実行する。
【0052】
メモリ213は、記憶部として機能する。さらに、メモリ213には、端末装置100に対して着脱可能な記憶媒体やデータベース(不図示)等が接続されうる。メモリ213において、ROMは、OS等の処理のための所定の指示命令を含むプログラムを記憶する。
【0053】
RAMは、アプリケーションプログラム及びROMに記憶された及びOSのプログラムがプロセッサ212により実行されている間に、処理に必要とされるデータの書き込み、及び読み出しが行われるメモリである。不揮発性メモリは、書き込まれたデータを電源の供給なしに保持するメモリである。不揮発性メモリには、プロセッサ112により、当該プログラムの実行によって得られたデータが書き込まれたり、書き込まれたデータが読み出されたりする。
【0054】
特に、サーバ装置200-1のメモリ213は、サーバ装置200-1とネットワークを介して接続された端末装置100から複数の形態素が含まれたテキスト情報を受信する所定の命令を含むアプリケーションプログラムを記憶する。また、サーバ装置200-1のメモリ213は、端末装置100の入力インターフェイス116を介して入力されたユーザの操作に応じて、テキスト情報を要約して生成される要約情報の文字数、又は要約情報の文字数の前記テキスト情報の文字数に対する割合を示す設定情報に基づいて、受信したテキスト情報から要約情報を生成する所定の指示命令を含むアプリケーションプログラムを記憶する。
【0055】
また、特に、特徴語辞書生成装置200-2のメモリ213は、記憶した大量の要約対象テキスト情報及びニュース等のテキスト情報又はこれらの一方から、サーバ装置200-1において要約処理に用いられる複数の特徴語を含む特徴語辞書を生成するための所定の指示命令を含むアプリケーションプログラムを記憶する。また、特徴語辞書生成装置200-2のメモリ213は、生成した特徴語辞書を、サーバ装置200-1に対して送信する処理のための所定の指示命令を含むアプリケーションプログラムを記憶する。
【0056】
サーバ装置200-1及び特徴語辞書生成装置200-2の通信インターフェイス214は、端末装置100の通信インターフェイス114と同様の機能を有する。つまり、サーバ装置200-1の通信インターフェイス214は、無線通信回線又は有線通信回線を介して通信ネットワーク12とサーバ装置200-1とを通信のために接続する通信部として機能する。サーバ装置200-1の通信インターフェイス214は、通信ネットワーク12を介して接続された端末装置100等の他の装置との間で、情報及びデータの送受信を行う。また、サーバ装置200-1及び特徴語辞書生成装置200-2の通信インターフェイス214は、これらの装置の間で、情報及びデータの送受信を行う。
【0057】
4.テキスト情報処理プログラム14
以下、端末装置100にインストールされてメモリ113に記憶され、プロセッサ112により読み出されて実行されるテキスト情報処理プログラム14を説明する。なお、テキスト情報処理プログラム14は、OSにより提供される機能により、端末装置100にインストールされ、常駐化される。
図4Aは、端末装置100において実行されるテキスト情報処理プログラム14の機能を示す機能ブロック図である。
【0058】
図4Aに示すように、テキスト情報処理プログラム14は、テキスト情報取得モジュール140、ユーザインターフェイス(UI)モジュール142、テキスト情報記憶モジュール144、要約対象テキスト情報送信モジュール146、及び要約情報受信モジュール148を含む。なお、テキスト情報処理プログラム14は、プロセッサ112により通信ネットワーク12に接続された他の装置(不図示)からダウンロードされ、メモリ113に記憶されてインストールされ、常駐化される。
【0059】
なお、テキスト情報処理プログラム14の各構成要素の機能は、これらのモジュールそれぞれが処理の全てを行うことによって実現されうる。あるいは、テキスト情報処理プログラム14の各構成要素の機能は、これらのモジュールそれぞれがOS又は他のアプリケーションプログラム等により提供される機能を利用することによっても実行されうる。つまり、テキスト情報処理プログラム14の各構成要素それぞれの機能は、OS又はワードプロセッサ等の他のアプリケーションプログラム等の機能により一部又は全部が代替されうる。
【0060】
テキスト情報処理プログラム14は、これらの構成要素により、複数の形態素が含まれた要約対象テキスト情報の入力を取得し、ディスプレイに表示する。また、テキスト情報処理プログラム14は、入力インターフェイス116を介して入力されたユーザの操作に応じて、サーバ装置200-1に要約処理を要求する要約生成要求情報、及び文字数情報又は圧縮率情報を示す設定情報を生成する。また、テキスト情報処理プログラム14は、ユーザの操作に応じて、要約対象テキスト情報を選択し、要約生成要求情報及び設定情報とともにサーバ装置200-1に送信する。また、テキスト情報処理プログラム14は、サーバ装置200-1に送信した要約対象テキスト情報の要約情報を、サーバ装置200-1から受信して出力インターフェイス111を介してディスプレイに表示する。
【0061】
端末装置100は、Webブラウザ等(不図示)を利用して、通信ネットワーク12に接続されたWebサーバ(不図示)等の他の装置から、通信インターフェイス114を介して、テキスト情報を受信し、メモリ113に記憶する。
【0062】
テキスト情報取得モジュール140は、UIモジュール142の制御に従って、上述したようにメモリ113に記憶されたテキスト情報を取得し、テキスト情報記憶モジュール144に出力する。また、テキスト情報取得モジュール140は、メモリ113に接続された記憶媒体からテキスト情報を読み出して取得し、テキスト情報記憶モジュール144に出力する。また、あるいは、テキスト情報取得モジュール140は、UIモジュール142を介したユーザの操作に応じてテキスト情報を取得し、テキスト情報記憶モジュール144に出力する。テキスト情報記憶モジュール144は、テキスト情報取得モジュール140から入力されたテキスト情報を、メモリ113に記憶する。
【0063】
UIモジュール142は、マウス117及びハードキー118等に対して行われた端末装置100のユーザの操作を、入力インターフェイス116を介して受け入れる。UIモジュール142は、受け入れたユーザの操作に従って、テキスト情報処理プログラム14の各構成要素を制御する。また、UIモジュール142は、ユーザの操作に応じて、サーバ装置200-1に要約処理を要求する要約生成要求情報と、文字数情報又は圧縮率情報を示す設定情報とを生成し、要約対象テキスト情報送信モジュール146に出力する。
【0064】
具体的には、UIモジュール142は、テキスト情報記憶モジュール144に、メモリ113から、ユーザにより選択されたテキスト情報を読み出させて取得し、出力インターフェイス111を介してディスプレイに表示する。また、UIモジュール142は、表示したテキスト情報から要約対象テキスト情報を選択するユーザの操作を受け入れる。この操作は、例えば、上述したように、ユーザが、マウス117等を用いて、表示されたテキスト情報の一部又は全部の範囲を選択してクリップボードにコピーする操作と同じである。この操作により、表示されたテキスト情報から要約対象テキスト情報が選択され、選択された要約対象テキスト情報が確定する。あるいは、例えば、この操作は、上述したように、ユーザが、マウス117等を用いてテキスト情報の範囲を選択し、メニューボックスを表示させ、メニューボックスを用いて処理内容として要約処理の機能を選択する操作と同じである。なお、上述したように、要約対象テキスト情報の選択等は、タッチパッドやタッチセンサを用いても行われうる。
【0065】
テキスト情報記憶モジュール144は、テキスト情報取得モジュール140から入力された一つ以上のテキスト情報と、テキスト情報から選択された要約対象テキスト情報とを記憶する。また、テキスト情報記憶モジュール144は、記憶した要約対象テキスト情報の一つ以上を、ユーザの操作等に応じたUIモジュール142の制御に従って、UIモジュール142に出力する。この場合、UIモジュール142は、テキスト情報記憶モジュール144から入力された要約対象テキスト情報を、ユーザの操作に応じて、出力インターフェイス111を介してディスプレイに表示する。
【0066】
要約対象テキスト情報送信モジュール146は、ユーザの操作に応じたUIモジュール142の制御に従って処理を行う。要約対象テキスト情報送信モジュール146は、テキスト情報記憶モジュール144から入力された要約対象テキスト情報と、UIモジュール142から入力された要約生成要求情報及び設定情報とを、通信インターフェイス114を介してサーバ装置200-1に送信する。
【0067】
要約情報受信モジュール148は、サーバ装置200-1から、通信インターフェイス114を介して要約情報を受信する。要約情報受信モジュール148は、受信した要約情報を、UIモジュール142の制御に従い、出力インターフェイス111を介して、ディスプレイに表示する。なお、要約情報受信モジュール148は、サーバ装置200-1から受信した要約情報を、ディスプレイに表示されたUI画像等の所定の部分等に表示する。
【0068】
5.要約プログラム22
以下、サーバ装置200-1にインストールされてメモリ213に記憶され、プロセッサ212により読み出されて実行される要約プログラム22を説明する。
図4Bは、サーバ装置200-1において実行される要約プログラム22の機能を示す機能ブロック図である。
【0069】
図4Bに示すように、要約プログラム22は、要約対象テキスト情報受信モジュール220、形態素解析処理モジュール222、関係性解析処理モジュール224、構造化処理モジュール230、要約処理モジュール232及び要約情報送信モジュール234を含む。関係性解析処理モジュール224は、機能素解析処理モジュール226及び特徴語解析処理モジュール228を含む。これらの構成要素のうち、形態素解析処理モジュール222、関係性解析処理モジュール224、構造化処理モジュール230及び要約処理モジュール232は、要約対象テキスト情報に対して要約処理を行う。
【0070】
要約プログラム22は、これらの構成要素により、端末装置100から通信インターフェイス214を介して要約対象テキスト情報を受信し、設定情報に基づいて要約処理を行う。さらに、要約プログラム22は、要約処理により生成された要約情報を、通信インターフェイス214を介して端末装置100に送信する。
【0071】
要約対象テキスト情報受信モジュール220は、通信インターフェイス214を介して、設定情報及び要約生成要求情報を伴う要約対象テキスト情報を受信し、形態素解析処理モジュール222に出力する。ただし、設定情報が文字数情報を含み、かつ、受信した要約対象テキスト情報の文字数が、文字数情報が示す文字数未満である場合がある。このような場合には、要約対象テキスト情報受信モジュール220は、受信した要約対象テキスト情報を、形態素解析処理モジュール222に出力しない。ただし、この場合には、要約対象テキスト情報受信モジュール220は、必要に応じて、メモリ213を介して、設定情報を要約情報送信モジュール234に出力することがある。一方、要約対象テキスト情報受信モジュール220は、要約対象テキスト情報の文字数が、文字数情報が示す文字数以上の場合に、要約対象テキスト情報を、形態素解析処理モジュール222に出力する。ただし、「以下」と「未満」、及び「より多い」と「以上」は、基準となる数を含むか否かだけで、この実施形態において本質的な差異はない。
【0072】
形態素解析処理モジュール222は、要約対象テキスト情報受信モジュール220から入力された要約対象テキスト情報に対して形態素解析処理を行う。形態素解析処理モジュール222は、この形態素解析処理により、入力された要約対象テキスト情報を、形態素、及び複数の形態素を含む形態素群に分割する。形態素解析処理モジュール222は、この処理により得られた要約対象テキスト情報の形態素及び形態素群を、関係性解析処理モジュール224に対して出力する。
【0073】
関係性解析処理モジュール224は、通信インターフェイス214を介して、サーバ装置200-1から特徴語辞書を受信する。関係性解析処理モジュール224の機能素解析処理モジュール226は、受信した特徴語辞書を用いて、関係性解析処理のために機能素解析処理を行う。機能素解析処理モジュール226は、機能素解析処理により、要約対象テキスト情報に含まれる個々の形態素又は形態素群それぞれの機能を特定する。関係性解析処理モジュール224は、個々の形態素又は形態素群と、特定したこれらそれぞれの機能とを対応付けて構造化処理モジュール230に出力する。
【0074】
また、関係性解析処理モジュール224において、特徴語解析処理モジュール228は、受信された特徴語辞書を用いて、関係性解析処理のために特徴語解析処理を行う。関係性解析処理モジュール224は、この特徴語解析処理により、ユーザにより選択された要約対象テキスト情報に含まれる形態素又は形態素群それぞれの属性を特定する。さらに、特徴語解析処理モジュール228は、要約対象テキスト情報の形態素又は形態素群それぞれとその属性を示す属性情報とを対応付ける。関係性解析処理モジュール224は、形態素又は形態素群と、これらそれぞれに対応付けた属性情報とを、構造化処理モジュール230に出力する。
【0075】
関係性解析処理モジュール224は、形態素又は形態素群それぞれの機能、及び属性情報に基づいて、形態素又は形態素群に対する関係性解析処理を行う。関係性解析処理モジュール224は、関係性解析処理により、形態素同士の間、形態素と形態素群との間、及び形態素群同士の間の関係性を特定する。なお、「形態素同士の間」、「形態素と形態素群との間」及び「形態素同士の間」は、「形態素及び形態素群の間」と総称される。
【0076】
構造化処理モジュール230は、特定された要約対象テキスト情報の形態素及び形態素群の間の関係性に基づいて、形態素及び形態素群の間を対応付けて、形態素及び形態素群を構造化する。構造化処理モジュール230は、構造化された要約対象テキスト情報の形態素及び形態素群を示す構造化情報を、要約処理モジュール232に出力する。
【0077】
図4Cを参照して、具体例を挙げて構造化情報をさらに説明する。
図4Cは、
図4Bに示した要約プログラム22の構造化処理モジュール230が生成する構造化情報を概念的に例示する図である。なお、
図4Cに示す構造化情報は、「AA病からの完全復活を目指すBB競技選手のCC(20歳=DD社所属)のEEがFF日、SNSアプリ「GG」を更新」との内容の要約対象テキスト情報から得られる。
【0078】
構造化処理モジュール230は、構造化処理により、この要約対象テキスト情報に含まれる形態素群「CC(20歳=DD社所属)のEE」が主語等であることを構造化により示す。また、構造化処理モジュール230は、形態素「更新」が動作状態であり、形態素群「SNSアプリ「GG」を」が対象であり、形態素群「FF日」が補足であり、形態素群「BB競技選手の」が限定修飾であり、形態素群「AA病からの完全復活を目指す」が説明修飾であることを構造化により示す。なお、
図4Cにおいて、形態要素群の間の矢印の方向は、これらの間の係り受けを示す。
【0079】
図4Bに示す要約処理モジュール232は、構造化された要約対象テキスト情報の形態素及び形態素群を処理する。さらに、要約処理モジュール232は、要約対象テキスト情報を要約して要約情報を生成する要約情報生成処理を行い、生成した要約情報を要約情報送信モジュール234に出力する。
【0080】
なお、設定情報が、文字数情報である場合、要約処理モジュール232は、例えば、要約情報の文字数を、文字数情報が示す要約情報の文字数を超えない範囲で、できるだけこの文字数に近づけるようにする。あるいは、この場合には、要約処理モジュール232は、例えば、文字数情報が示す文字数を少し超えたとしても、内容がユーザに理解されやすいように要約情報を生成する。
【0081】
また、設定情報が、圧縮率情報であると、要約処理モジュール232は、要約対象テキスト情報の文字数に、圧縮率情報が示す割合を乗算した文字数を計算する。要約処理モジュール232は、要約情報の文字数を、この乗算値を超えない範囲で、できるだけこの文字数に近づけるようにする。あるいは、この場合には、要約処理モジュール232は、例えば、この乗算値を少し超えたとても、内容がユーザに理解されやすいように要約情報を生成する。設定情報は、これらのように、文字数情報又は圧縮率情報が示す文字数と、要約情報の文字数との関係を示す関係情報を含んでよい。
【0082】
要約情報送信モジュール234は、要約情報を、通信インターフェイス214を介して端末装置100及び特徴語辞書生成装置200-2に送信する。ただし、特徴語辞書生成装置200-2が、特徴語辞書生成のための要約情報を用いない場合には、要約情報送信モジュール234は、特徴語辞書生成装置200-2に、要約情報を送信しない。また、要約情報送信モジュール234は、通信インターフェイス214を介して、要約情報をシステム1の他の装置(不図示)に送信しうる。また、あるいは、要約処理モジュール232は、メモリ213に接続された記録媒体に、要約情報を記憶させうる。
【0083】
6.特徴語辞書生成プログラム26
以下、特徴語辞書生成装置200-2にインストールされてメモリ213に記憶され、プロセッサ212により読み出されて実行される特徴語辞書生成プログラム26を説明する。
図5は、端末装置100において実行される特徴語辞書生成プログラム26の機能を示す機能ブロック図である。
【0084】
図5に示すように、特徴語辞書生成プログラム26は、データベースモジュール260、ベイジアンフィルタモジュール262、特徴語リスト生成モジュール264、及び特徴語辞書生成モジュール266を含む。
【0085】
特徴語辞書生成プログラム26は、通信ネットワーク12に接続されたWebサーバ等から、ニュース等の大量のテキスト情報を受信して記憶する。また、あるいは、特徴語辞書生成プログラム26は、大量の要約対象テキスト情報及びニュース等のテキスト情報を記憶する。
【0086】
また、特徴語辞書生成プログラム26は、記憶したニュース等のテキスト情報から、複数の特徴語を含む特徴語辞書を生成する。上述したように、生成された特徴語辞書は、サーバ装置200-1において要約処理に用いられる。さらに、特徴語辞書生成プログラム26は、生成した特徴語辞書を、通信インターフェイス214を介してサーバ装置200-1に送信する。なお、ここでは、ニュース等の大量のテキスト情報等に基づいて特徴語辞書生成プログラム26によって特徴語辞書が生成される場合について説明したが、例えば要約プログラム22によって取得された要約対象テキスト情報を、サーバ装置200-1を介して受信し、当該要約対象テキスト情報に基づいて生成されてもよい。
【0087】
データベースモジュール260は、特徴語辞書生成装置200-2から通信インターフェイス214を介して、データベースモジュール260は、Webサーバ等から受信したニュース等、大量のテキスト情報を受信する。データベースモジュール260は、受信した大量のテキスト情報をメモリ213に記憶する。データベースモジュール260は、メモリ213に記憶したテキスト情報を、ベイジアンフィルタモジュール262に出力する。
【0088】
なお、データベースモジュール260は、ベイジアンフィルタモジュール262へのテキスト情報の出力を、適宜のタイミングで行う。具体的には、例えば、データベースモジュール260は、一日に一回ずつ、テキスト情報をベイジアンフィルタモジュール262に出力する。あるいは、データベースモジュール260は、サーバ装置200-1の関係性解析処理モジュール224からの要求があるたびに、テキスト情報をベイジアンフィルタモジュール262に出力する。
【0089】
ベイジアンフィルタモジュール262は、単純ベイズ分類器を応用し、データベースモジュール260から入力されたテキスト情報に含まれる単語を解析し、学習し、分類する。ベイジアンフィルタモジュール262は、分類したテキスト情報に含まれる単語等を、特徴語リスト生成モジュール264に出力する。
【0090】
特徴語リスト生成モジュール264は、分類された単語から、特徴となる単語を示す特徴語を生成する。さらに、特徴語リスト生成モジュール264は、生成した特徴語をリスト形式で示す特徴語リストを生成し、特徴語辞書生成モジュール266に対して出力する。
【0091】
特徴語辞書生成モジュール266は、生成された特徴語リストから、特徴語辞書を生成する。上述したように、特徴語辞書は、要約プログラム22(
図4B)の関係性解析処理モジュール224及びこれに含まれる機能素解析処理モジュール226及び特徴語解析処理モジュール228における処理に用いられる。特徴語辞書生成モジュール266は、生成した特徴語辞書を、通信インターフェイス214を介してサーバ装置200-1に送信する。
【0092】
なお、特徴語辞書生成プログラム26(
図5)は、上記のとおり、特徴語辞書生成装置200-2にインストールされるが、これに限らず要約プログラム22とともにサーバ装置200-1にインストールされてもよい。このような場合、サーバ装置200-1は、特徴語辞書生成プログラム26から要約プログラム22に特徴語辞書を提供させる。また、上述したように、特徴語辞書生成プログラム26がサーバ装置200-1及び特徴語辞書生成装置200-2のいずれかにインストールされる場合に代えて、テキスト情報処理プログラム14及び要約プログラム22とともに端末装置100にインストールされてもよい。この場合にも、端末装置100は、特徴語辞書生成プログラム26から要約プログラム22に特徴語辞書を提供させる。
【0093】
7.端末装置100において処理に用いられる情報
以下、
図6を参照して、
図1及び
図3に示したサーバ装置200-1、及び
図4Bに示した要約プログラム22において処理に用いられる要約対象テキスト情報処理テーブルを説明する。要約対象テキスト情報処理テーブルは、要約プログラム22の実行に用いられ、また、要約プログラム22の実行により生成された情報により更新され、メモリ213のHDD等に記憶される。なお、
図6において、m,n,o,p,qは1以上の整数である。なお、複数の要約対象テキスト情報それぞれから常に同じ数の形態素等が生成されるとは限らないので、テキスト識別情報A1~Amそれぞれに対応付けられた情報の添え字のn,o,p,qが同じ数であるとは限らない。
【0094】
図6に示すように、要約対象テキスト情報処理テーブルは、要約対象テキスト識別情報A1~Am、要約対象テキスト情報B1~Bm、形態素情報C11~C1n,C21~C2n~Cm1~Cmn、形態素群情報D11~D1o,D21~D2o~Dm1~Dmo、関係性情報E11~E1p,E21~E2p~Em1~Emp、構造化情報F11~F1q,F21~F2q~Fm1~Fmq、要約情報G1~Gm、履歴情報H1~Hm、及び文字数情報/圧縮率情報(設定情報)Iを含む。なお、以下、この部分の説明において、これらの情報の符号A~Gに付された添え字は省略される。
【0095】
要約対象テキスト識別情報Aは、要約対象テキスト情報受信モジュール220が受信した要約対象テキスト情報Bを一意に識別する。形態素情報Cは、形態素解析処理モジュール222が要約対象テキスト情報Bに対する形態素解析処理を行って生成した形態素である。形態素群情報Dは、形態素解析処理モジュール222が要約対象テキスト情報Bに対する形態素解析処理を行って生成した形態素群である。
【0096】
関係性情報Eは、関係性解析処理モジュール224が生成した形態素情報C及び形態素群情報Dの間の関係性を示す。構造化情報は、構造化処理モジュール230が構造化した形態素情報C及び形態素群情報Dである。要約情報は、要約処理モジュール232が生成した要約対象テキスト情報Bの要約情報Gである。履歴情報Hは、テキスト識別情報Aにより識別される要約対象テキスト情報が要約処理された日時及び回数等を示す。
【0097】
文字数情報/圧縮率情報(設定情報)Iは、サーバ装置200-1のプロセッサ212が、通信インターフェイス214を介して端末装置100からテキスト範囲情報とともに受信する。なお、テキスト識別情報A(
図6)の一つ以上に対応付けられて、設定情報Iとして複数の文字数情報/圧縮率情報が要約対象テキスト情報処理テーブルに含まれうる。なお、上述したように、設定情報Iは、関係情報を含みうるので、設定情報Iが関係情報を含むときには、関係情報もまた、設定情報Iとともにテキスト情報処理テーブルに含まれる。
【0098】
8.端末装置100及びサーバ装置200-1の処理
[システム1の構成要素の第1の処理]
以下、
図1~
図3に示した端末装置100及びサーバ装置200-1の第1の処理を、
図7A~
図7Iを参照して説明する。まず、
図7Aを参照して、端末装置100、サーバ装置200-1及び特徴語辞書生成装置200-2の間の通信シーケンスを説明する。
【0099】
図7Aに示すS100において、端末装置100のプロセッサ112は、
図4Aに示したテキスト情報処理プログラム14を実行し、
図7Bを参照して後述する要約対象テキスト情報を生成するための処理(S120~S132)を行う。
【0100】
S102において、特徴語辞書生成装置200-2のプロセッサ212は、
図5に示した特徴語辞書生成プログラム26を実行し、特徴語辞典を生成する。なお、特徴語辞書生成装置200-2のプロセッサ212が特徴語辞書生成プログラム26を実行し、特徴語辞書を生成するタイミングは、
図7Aに示した他の処理と同期が取れている必要はない。従って、特徴語辞書生成装置200-2は、任意のタイミングで特徴語辞書を生成してよい。
【0101】
S104において、端末装置100のプロセッサ112は、生成した要約対象テキスト情報を、通信インターフェイス114を介してサーバ装置200-1に送信する。サーバ装置200-1のプロセッサ212は、通信インターフェイス214を介して、端末装置100から要約対象テキスト情報を受信する。
【0102】
S106において、サーバ装置200-1のプロセッサ212は、
図4Bに示した要約プログラム22を実行し、
図7Hを参照して後述するように、受信した要約対象テキスト情報から要約情報を生成するための要約処理(S160~S168)を行う。
【0103】
S108において、特徴語辞書生成装置200-2のプロセッサ212は、特徴語辞書をサーバ装置200-1に送信する。サーバ装置200-1のプロセッサ212は、通信インターフェイス214を介して特徴語辞書を受信する。ただし、S108の処理は省略されうる。つまり、特徴語辞書生成装置200-2は、任意のタイミングで、特徴語辞書を、サーバ装置200-1に送信してよい。
【0104】
S110において、サーバ装置200-1のプロセッサ212は、生成した要約情報を、通信インターフェイス214を介して端末装置100に送信する。端末装置100のプロセッサ112は、要約情報を、通信インターフェイス114を介して受信する。
【0105】
S112において、端末装置100のプロセッサ112は、
図4Aに示したテキスト情報処理プログラム14を実行し、
図7Fを参照して後述するS150~S154の処理を行う。これにより、プロセッサ112は、受信した要約情報を、入力インターフェイス116を介してディスプレイに表示する。
【0106】
[システム1の構成要素による第1の処理の概要]
次に、システム1における端末装置100、サーバ装置200-1及び特徴語辞書生成装置200-2の動作の概要を説明する。
図7B及び
図7Fに示すように、端末装置100のプロセッサ112は、テキスト情報処理プログラム14(
図4A)を実行する。これにより、端末装置100において、ユーザの操作に応じたテキスト情報からの要約対象テキスト情報の選択、選択された要約対象テキスト情報のサーバ装置200-1への送信、及びサーバ装置200-1からの要約情報の受信等が実現される。プロセッサ112がテキスト情報処理プログラム14を実行する際には、
図7C~
図7Eに示すUI画像が用いられる。
【0107】
また、サーバ装置200-1のプロセッサ212は、
図7Hに示すように、要約プログラム22(
図4B)の処理をプロセッサ212が行う。これにより、サーバ装置200-1における端末装置100からの要約対象テキスト情報の受信、要約対象テキスト情報からの要約情報の生成、及び、生成した要約情報等の端末装置100への送信等が実現される。
【0108】
端末装置100の第1の処理は、端末装置100においてテキスト情報処理プログラム14(
図4A)が常駐していることを前提とする。端末装置100の112は、テキスト情報処理プログラム14を実行する。実行されたテキスト情報処理プログラム14は、記憶したテキスト情報のうち、上述したようにユーザにより選択された要約対象テキスト情報を、通信インターフェイス114を介してサーバ装置200-1に送信する。
【0109】
サーバ装置200-1のプロセッサ212は、要約プログラム22(
図4B)を実行する。要約プログラム22は、端末装置100から要約対象テキスト情報を受信し、特徴語辞書生成装置200-2において実行される特徴語辞書生成プログラム26(
図5)により生成された特徴語辞書を用いて要約処理を行う。要約プログラム22は、この要約処理により、要約情報を生成し、生成した要約情報を、通信インターフェイス114を介して端末装置100に送信する。要約プログラム22は、サーバ装置200-1から要約情報を受信し、
図7Gに示すUI画像を用いて、テキスト情報及び要約対象テキスト情報と、要約情報とを対応付け、出力インターフェイス111を介してディスプレイに表示し、ユーザに示す。
【0110】
[端末装置100の動作]
まず、端末装置100の動作の詳細を説明する。
図7Bは、端末装置100(
図1及び
図2)が、ユーザの操作に応じて、テキスト情報から要約対象テキスト情報を選択してサーバ装置200-1に送信する第1の処理を示すフローチャートである。なお、上述したように、
図7B及び
図7Fに示す処理の全てをテキスト情報処理プログラム14が行っても、テキスト情報処理プログラム14がOS又は他のアプリケーションプログラム等の機能を利用して行ってもよい。
【0111】
また、
図7B、
図7F図7H及び
図8Aに示す処理は、端末装置100及びサーバ装置200-1において、テキスト情報が複数ある場合、及び要約情報が複数ある場合には、これらの情報それぞれについて並行して行われうる。
図7C~
図7Eは、
図7Bに示した端末装置100及びテキスト情報処理プログラム14の処理に伴って、プロセッサ112が端末装置100のディスプレイに表示するUI画像を例示する第1~3の図である。
【0112】
図7Bに示すS120において、端末装置100のプロセッサ112は、テキスト情報処理プログラム14を実行し、端末装置100に常駐化させる。
【0113】
S122において、端末装置100のプロセッサ112は、通信インターフェイス114を介して、要約対象テキスト情報の選択の対象となるテキスト情報が入力され、メモリ113に記憶されたか否かを判断する。あるいは、プロセッサ112は、メモリ113に接続された記憶媒体等から端末装置100に直接的に、要約対象テキスト情報の選択の対象となるテキスト情報の入力があり、入力されたテキスト情報をメモリ113に記憶したか否かを判断する。
【0114】
プロセッサ112は、テキスト情報の入力がなかった場合(N)にはS122の処理に留まる。一方、プロセッサ112は、テキスト情報の入力があった場合(Y)にはS124の処理に進む。
【0115】
S124において、プロセッサ112は、テキスト情報取得モジュール140の機能を利用する。プロセッサ112は、S122の処理でメモリ113に記憶されていると判断されたテキスト情報を取得する。プロセッサ112は、取得したテキスト情報により要約対象テキスト情報処理テーブル(
図6)を更新して、テキスト情報を登録し、メモリ113に記憶する。
【0116】
図7Cは、テキスト情報処理プログラム14のUIモジュール142の機能を利用したプロセッサ112により出力インターフェイス111を介してディスプレイに表示されるUI画像を例示する図である。
図7Cに示すUI画像は、S124の処理において取得されたテキスト情報が表示される部分(テキスト情報表示部分)を含む。また、このUI画像は、ユーザの操作に応じて文字数情報の設定が受け入れられる部分(文字数入力部分)と、圧縮率情報の設定が受け入れられる部分(圧縮率入力部分)とを含む。さらに、このUI画像は、要約情報が表示される部分(要約情報表示部分)を含む。
図7Dは、ワードプロセッサ等により開かれて
図7Cに示したUI情報に表示されたテキスト情報を例示する図である。
図7Eは、
図7Dに示したテキスト情報から要約対象テキスト情報を選択する操作を示す図である。
【0117】
図7Bに示すS126において、プロセッサ112は、UIモジュール142の機能を利用する。プロセッサ112は、
図7Cに示したUI画像の文字数入力部分又は圧縮率入力部分等へのユーザの操作を、入力インターフェイス116を介して受け入れる。プロセッサ112は、ユーザの操作に応じて文字数情報又は圧縮率情報を生成し、これらのいずれかを設定情報とする。なお、上述したように、設定情報は、関係情報を含みうる。
【0118】
S128において、プロセッサ112は、UIモジュール142、テキスト情報記憶モジュール144等の機能を利用する。S128において、プロセッサ112は、S124の処理において取得したテキスト情報を、例えば、ブラウザ等を用いて開く。さらに、プロセッサ112は、
図7Dに示すように、開いたテキスト情報を、ディスプレイに表示されたUI画像(
図7C)のテキスト情報表示部分のなかに表示する。ユーザが、表示したテキスト情報の一部又は全部の範囲をコピーする操作を行うと、UIモジュール142はこの操作を受け入れる。なお、例えば、
図7Eに示すように、テキスト情報のうち、ユーザにより選択された部分の背景の色は灰色とされてハイライトされる。
【0119】
S130において、プロセッサ112は、S128の処理において、ユーザにより選択されたテキスト情報の一部又は全部の範囲を、要約対象テキスト情報とする処理を行う。この処理により、プロセッサ112は、要約対象テキスト情報を生成し、メモリ113に記憶する。
【0120】
S132において、プロセッサ112は、要約対象テキスト情報送信モジュール146の機能をさらに利用する。プロセッサ112は、S130の処理において生成され、メモリ113に記憶された要約対象テキスト情報を読み出す。プロセッサ112は、読み出した要約対象テキスト情報と、S126の処理において生成した設定情報と、要約生成要求情報とを、通信インターフェイス114を介してサーバ装置200-1に送信する。
【0121】
図7Fは、端末装置100が、サーバ装置200-1から要約情報を受信する処理を示すフローチャートである。
図7Gは、
図7Fに示した端末装置100及びテキスト情報処理プログラム14の処理に伴って、プロセッサ112が端末装置100のディスプレイに表示するUI画像を例示する図である。
【0122】
図7Fに示すS150において、端末装置100のプロセッサ112は、テキスト情報処理プログラム14(
図4A)の要約情報受信モジュール148の機能を利用する。プロセッサ112は、通信インターフェイス114を介して、サーバ装置200-1から要約情報を受信したか否かを判断する。プロセッサ112は、を受信した場合(Y)にはS152の処理に進み、受信しなかった場合(N)にはS150の処理に留まる。
【0123】
S152において、プロセッサ112は、受信した要約情報をメモリ113に記憶する。
【0124】
S154において、プロセッサ112は、
図7Gに示すように、S150の処理において受信した要約情報を、出力インターフェイス111を介してディスプレイに表示する。
図7Gは、
図7Cに示したUI画像のテキスト情報表示部分に表示されたテキスト情報及び要約対象テキスト情報と、要約情報表示部分に表示された要約情報とを示す図である。プロセッサ112は、要約情報を、
図7Gに示すように、UI画像(
図7C)の要約情報表示部分に表示する。さらに、プロセッサ112は、この要約情報の生成に用いられた要約対象テキスト情報を含むテキスト情報を、この要約情報に対応付けて、UI画像のテキスト情報表示部分に表示する。
【0125】
なお、
図7Gには、テキスト情報と、このテキスト情報から生成された要約対象テキスト情報とを、UI画像のテキスト情報表示部分に表示する場合が例示されたが、テキスト情報表示部分に、要約対象テキスト情報のみが表示されてもよい。あるいは、テキスト情報部分に、テキスト情報のみが、要約対象テキスト情報なしに表示されてもよい。このように、UI画像のテキスト情報表示部分に、テキスト情報と要約対象テキスト情報とを表示するか、要約対象テキスト情報のみを表示するか、テキスト情報のみを表示するかは、ユーザによる端末装置100に対する操作に応じて決められてよい。
【0126】
[サーバ装置200-1の動作]
以下、
図7Hを参照して、サーバ装置200-1の動作を詳細に説明する。
図7Hは、サーバ装置200-1が、端末装置100から受信した要約対象テキスト情報から要約情報を生成し、端末装置100に送信する処理を示すフローチャートである。
【0127】
図7Hに示すS160において、サーバ装置200-1のプロセッサ212は、要約プログラム22(
図4B)の要約対象テキスト情報受信モジュール220の機能を利用する。プロセッサ212は、端末装置100からの要約対象テキスト情報、要約要求情報及び設定情報を、通信インターフェイス214を介して受信したか否かを判断する。プロセッサ212は、要約対象テキスト情報等を受信した場合(Y)には、受信した要約対象テキスト情報等をメモリ213に記憶してS162の処理に進み、受信しなかった場合(N)にはS160の処理に留まる。
【0128】
S162において、プロセッサ212は、設定情報が文字数情報である場合に、S160の処理において受信した要約対象テキスト情報の文字数が、文字数情報が示す文字数以上であるか否かを判断する。プロセッサ212は、要約対象テキスト情報の文字数が、文字数情報が示す文字数以上である場合、及び設定情報が圧縮率情報である場合(Y)にはS164の処理に進み、文字数情報が示す文字数未満である場合(N)には処理を終了する。なお、要約対象テキスト情報の文字数が、文字数情報が示す文字数未満である場合には、プロセッサ212は、このことを示す情報を、通信インターフェイス214を介して端末装置100に送信してもよい。
【0129】
S164において、プロセッサ212は、通信インターフェイス214を介して、特徴語辞書生成装置200-2から特徴語辞書を受信し、メモリ213に記憶する。なお、上述したように、特徴語辞書生成装置200-2の処理は、サーバ装置200-1の処理とは同期しないことがある。このような場合には、S164の処理は行われないことがある。
【0130】
S166において、形態素解析処理モジュール222、関係性解析処理モジュール224及びこれに含まれる機能素解析処理モジュール226及び特徴語解析処理モジュール228、構造化処理モジュール230及び要約処理モジュール232の機能をさらに利用する。プロセッサ212は、メモリ213から、S160の処理において受信した要約対象テキスト情報に対して、形態素解析処理、機能素解析処理、特徴語解析処理、関係性解析処理、構造化処理、及び設定情報に基づく要約処理を行う。プロセッサ212は、これらの処理の結果として、要約対象テキスト情報の要約情報を生成する。
【0131】
なお、設定情報が文字情報であり、関係情報を含まない場合には、要約情報の文字数は、文字数情報が示す文字数以下とされる。また、設定情報が圧縮率情報であり、関係情報を含まない場合には、要約情報の文字数は、要約対象テキスト情報の文字数に、圧縮率情報が示す割合を乗算した文字数以下とされる。また、設定情報が関係情報を含む場合には、要約情報の文字数は、要約処理モジュール232(
図4B)について説明したように、設定情報に従って、文字数情報又は圧縮率情報から得られる文字数を超えることがある。
【0132】
S168において、プロセッサ212は、要約情報送信モジュール234の機能を利用する。プロセッサ212は、S166の処理において要約情報が生成された場合には、要約情報を、通信インターフェイス214を介して端末装置100に送信する。端末装置100のプロセッサ112は、通信インターフェイス214を介して、サーバ装置200-1から、要約情報を受信する。なお端末装置100のプロセッサ112は、送信した要約情報を、
図7Gを参照して説明したように表示する。
【0133】
図7Iは、
図7Cに示したUI画像に含まれるテキスト情報表示部分及び要約情報表示部分それぞれに表示された複数(m)のテキスト情報1~m及び複数の要約情報1~mを例示する図である。テキスト情報記憶モジュール144(
図4A)が、mのテキスト情報をメモリに記憶することがある。このような場合には、端末装置100のプロセッサ112は、
図7Iに示すように、UI画像の2つの表示部分それぞれに、テキスト情報1~mのタブ及び要約情報1~mのタブを一覧表示してよい。
【0134】
プロセッサ112は、ユーザによるタブの選択に応じて、選択されたタブに対応するテキスト情報及び要約対象テキスト情報それぞれと、要約情報それぞれとを、UI画像(
図7C及び
図7I)のテキスト情報表示部分それぞれと、要約情報表示部分それぞれとに表示する。なお、UI画像のテキスト情報表示部分にテキスト情報のみが表示された場合には、ユーザは、このテキスト情報に対して、要約対象テキスト情報を選択するための操作等を行える。
【0135】
[システム1の構成要素の第2の処理]
以下、
図1~
図3に示した端末装置100、サーバ装置200-1及び特徴語辞書生成装置200-2の第2の処理を、
図8A及び
図8Bを参照して説明する。ただし、第2の処理においては、端末装置100が要約対象テキスト情報をサーバ装置200-1に送信する処理のみが、
図7A~
図7Iを参照して説明した端末装置100及びサーバ装置200-1の第1の処理と異なる。なお、以下に説明する第2の処理は、Webブラウザのアドオン機能として用いられうる。
【0136】
図8Aは、端末装置100(
図1及び
図2)が、ユーザの操作に応じて要約対象テキスト情報を選択してサーバ装置200-1に送信する第2の処理を示すフローチャートである。
図8Bは、
図8Aに示した端末装置100の処理に伴って、プロセッサ112が端末装置100のディスプレイに表示するUI画像を例示する図である。
【0137】
図8Aに示す処理は、
図7Aに示した通信シーケンスにおいて、
図7Bに示した処理の代わりに実行される。
図8Aに示す端末装置100の処理においては、
図7Bに示したS120~S126の処理と、S130及びS132の処理との間において、S180及びS182の処理が実行される。
【0138】
この処理は、ユーザが、テキスト情報のうちの選択された範囲に、さらに、機能選択のための操作を行った場合に、
図8Bに示すように、メニューボックスの画像が表示されることを前提とする。さらに、この処理は、このメニューボックスに処理内容として要約処理の項目が含まれ、ユーザが要約処理の項目を選択した場合に、S130及びS132の処理が行われることを前提とする。
【0139】
S180において、端末装置100のプロセッサ112は、上述したユーザによるテキスト情報の範囲の選択のための操作を受け入れる。プロセッサ112は、ユーザの操作に応じて、
図7Eに示したように、テキスト情報の一部又は全部の範囲を選択する。
【0140】
S182において、端末装置100のプロセッサ112は、
図8Bに示すように、メニューボックスを表示させる操作をユーザが行い、さらに、表示されたメニューボックスに処理内容として含まれる要約処理を選択したか否かを判断する。なお、ユーザによるこれらの操作は、プロセッサ112が実行するOSの機能の説明において上述してある。プロセッサ112は、ユーザが、メニューボックスに含まれる要約処理を選択した場合(Y)にはS130の処理に進み、選択しなかった場合(N)にはS182の処理に留まる。
【0141】
なお、上述したように、マウスを用いてテキスト情報の範囲を選択し、要約処理を選択する方法は、単なる一例に過ぎない。例えば、テキスト情報の範囲、及びメニューボックスからの要約処理の選択は、上述したように、タッチパッドやタッチセンサ(不図示)等の入力デバイスを用いて、ユーザの指示体(例えば指)によるタップ操作やドラッグ操作により行われてもよい。また、当然、マウス117やタッチパッド、タッチセンサ以外の別の方法によって選択されてもよい。
【0142】
以上説明したシステム1においては、サーバ装置200-1が、大量の要約対象テキスト情報及びニュース等のテキスト情報又はこれらのいずれかを自動的に学習して特徴語辞書を更新し、端末装置100に送信する。従って、時間が経過すればするほど、サーバ装置200-1による特徴語辞書を用いた要約処理により得られる要約情報の品質が向上する。
【0143】
また、テキスト情報処理プログラム14は、端末装置100に常駐し、ユーザによるマウス117を用いた選択操作に応じて、自動的に要約情報を生成する。従って、システム1によれば、要約情報生成処理のためのユーザの操作が簡単で済む。また、システム1によれば、要約対象テキスト情報から、重要部分、及びキーワード出現率等の様々な情報を得ることができる。
【0144】
9.変形例等
以下、システム1及びその構成要素の変形例等を説明する。
図9A及び
図9Bは、端末装置100の処理の変形例を示す第1及び第2の図である。これらのうち、
図9Aは、端末装置100のプロセッサ112が、サーバ装置200-1が生成した要約情報の重要部分を強調して示すUI画像を例示する図である。
図9Bは、プロセッサ112が生成するキーワード出願率を示すUI画像を例示する図である。
【0145】
なお、サーバ装置200-1のプロセッサ212の動作を適切に変更することにより、特徴語解析処理の結果等に基づいて、要約情報の重要部分を選択することができる。さらに、端末装置100のプロセッサ112の動作を適切に変更することにより、プロセッサ112は、サーバ装置200-1において選択された要約情報の重要部分を強調して表示できる。また、同様に、
図9Bに示すように、要約対象テキスト情報及び要約情報またはこれらのいずれかに含まれるキーワードの出現率を集計して表示することができる。また、以上、設定情報が文字数情報又は圧縮率情報が設定情報とされる場合を説明したが、文字数情報及び圧縮率情報の両方が設定情報とされてよい。この場合には、例えば、要約対象テキスト情報受信モジュール220は、要約対象テキスト情報の文字数が、文字数情報が示す文字数情報より多い場合に形態素解析処理モジュール222に要約対象テキスト情報を出力する。また、この場合には、例えば、要約処理モジュール232は、要約対象テキスト情報の文字数に、圧縮率情報が示す割合を乗算した文字数以下の要約情報を出力する。
【0146】
実施形態において明示的に説明された装置によってだけでなく、ソフトウェア、ハードウェア又はこれらの組み合わせにより実現されうる。具体的には、実施形態において説明された処理及び手順は、集積回路、揮発性メモリ、不揮発性メモリ、磁気ディスク、光ストレージ等の媒体に、当該処理に相当するロジックを実装することにより実現されうる。また、実施形態において説明された処理及び手順は、それらの処理及び手順をコンピュータプログラムとして実装されえ、端末装置及びサーバ装置を含む各種のコンピュータにより実行されうる。
【0147】
実施形態において、単一の装置、ソフトウェア、コンポーネント、及び/又は、モジュールによって実行されると説明された処理及び手順は、複数の装置、複数のソフトウェア、複数のコンポーネント、及び/又は、複数のモジュールによって実行されうる。また、実施形態において、単一のメモリ及び記憶装置に格納される旨が説明された各種情報は、単一の装置に含まれる複数のメモリ又は複数の装置に分散して配置された複数のメモリに分散して格納されうる。さらに、実施形態において説明された複数のソフトウェア及びハードウェアは、それらをより少ない構成要素に統合することにより、又は、より多い構成要素に分解することにより実現されうる。
【0148】
本発明の実施形態が説明されたが、この実施形態は、例として提示されたものであり、発明の範囲を限定することを意図されていない。これら新規な実施形態は、その他の様々な形態で実施されることができ、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更され得る。これら実施形態やその変形は、本発明の範囲及び要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0149】
1 システム、100 端末装置、111,211 出力インターフェイス、112,212 プロセッサ、113,213 メモリ、114,214 通信インターフェイス、115 通信処理回路、116 入力インターフェイス、117 マウス、118 ハードキー、12 通信ネットワーク、14 テキスト情報処理プログラム、140 テキスト情報取得モジュール、142 UIモジュール、144 テキスト情報記憶モジュール、146 要約対象テキスト情報送信モジュール、148 要約情報受信モジュール、200-1 サーバ装置、200-2 特徴語辞書生成装置、22 要約プログラム、220 要約対象テキスト情報受信モジュール、222 形態素解析処理モジュール、224 関係性解析処理モジュール、226 機能素解析処理モジュール、228 特徴語解析処理モジュール、230 構造化処理モジュール、232 要約処理モジュール、234 要約情報送信モジュール、26 特徴語辞書生成プログラム、260 データベースモジュール、262 ベイジアンフィルタモジュール、264 特徴語リスト生成モジュール、266 特徴語辞書生成モジュール