(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023184314
(43)【公開日】2023-12-28
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
G06F 40/279 20200101AFI20231221BHJP
G06F 3/0484 20220101ALI20231221BHJP
G06F 16/383 20190101ALI20231221BHJP
【FI】
G06F40/279
G06F3/0484
G06F16/383
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2022098384
(22)【出願日】2022-06-17
(71)【出願人】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】三井 稔之
【テーマコード(参考)】
5B091
5B175
5E555
【Fターム(参考)】
5B091AA15
5B175DA01
5B175FB01
5E555AA22
5E555AA25
5E555BA02
5E555BA04
5E555BB02
5E555BB04
5E555BC04
5E555BC17
5E555CA02
5E555CB03
5E555CB33
5E555CC03
5E555DB20
5E555DB41
5E555DB53
5E555DC14
5E555DC31
5E555DC33
5E555DC34
5E555DC35
5E555DD07
5E555FA00
(57)【要約】
【課題】要約文が原文から重要文を抽出して作成されたものでなくても、要約文に対する原文の対応箇所を表示させる。
【解決手段】要約処理装置10は、CPU11を備える。CPU11は、原文を要約した要約文を取得し、要約文が指定された場合に、要約文に含まれる単語の原文での頻出箇所を、要約文に対応する原文における対応箇所として表示する制御を行う。
【選択図】
図3
【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
原文を要約した要約文を取得し、
前記要約文が指定された場合に、前記要約文に含まれる単語の前記原文での頻出箇所を、前記要約文に対応する前記原文における対応箇所として表示する制御を行う
情報処理装置。
【請求項2】
前記プロセッサは、前記要約文に含まれる各単語について、前記原文を予め定めた単位に分割して得られた原文単位毎に、単語の出現頻度及び原文全体における単語の稀少度により表される指標値を算出し、算出した指標値を用いて前記頻出箇所を特定する
請求項1に記載の情報処理装置。
【請求項3】
前記頻出箇所は、前記要約文に含まれる各単語について算出された指標値の総和が閾値以上となる箇所である
請求項2に記載の情報処理装置。
【請求項4】
前記指標値は、TF-IDFである
請求項3に記載の情報処理装置。
【請求項5】
前記プロセッサは、前記頻出箇所として、前記要約文に含まれる単語及び当該単語の類似語が頻出する箇所を特定する
請求項1に記載の情報処理装置。
【請求項6】
前記要約文に含まれる特定の単語が指定された場合の前記対応箇所は、前記要約文が指定された場合の前記対応箇所と異なる
請求項1に記載の情報処理装置。
【請求項7】
前記プロセッサは、前記原文について複数の前記要約文が取得された場合、前記対応箇所がある要約文と、前記対応箇所がない要約文とを識別可能に表示する制御を行う
請求項1に記載の情報処理装置。
【請求項8】
前記プロセッサは、前記対応箇所がある要約文が指定された場合、前記要約文に含まれる単語の前記原文での頻出箇所を、前記対応箇所として表示する制御を行い、
前記対応箇所がない要約文が指定された場合、前記原文に含まれる予め定めた箇所を表示する制御を行う
請求項7に記載の情報処理装置。
【請求項9】
前記プロセッサは、前記要約文に複数の前記対応箇所がある場合、前記複数の対応箇所を予め定めた順番で表示する制御を行う
請求項1に記載の情報処理装置。
【請求項10】
前記プロセッサは、前記要約文に複数の前記対応箇所がある場合、前記要約文に含まれる単語のうち前記複数の対応箇所の各々において出現頻度及び原文全体における稀少度により表される指標値が最も高い単語を、前記複数の対応箇所の各々に対応付ける
請求項9に記載の情報処理装置。
【請求項11】
前記要約文は、第1要約文と、当該第1要約文の前又は後の第2要約文とを含み、
前記プロセッサは、前記第1要約文に対して複数の前記頻出箇所が特定された場合、前記第2要約文に対応する前記原文での頻出箇所との前後関係を用いて、前記複数の頻出箇所から1つ以上の頻出箇所を除外する
請求項1に記載の情報処理装置。
【請求項12】
前記プロセッサは、前記第2要約文に対応する前記原文での頻出箇所との前後関係に加え、更に、前記第1要約文に含まれる単語と関連する動詞及び形容詞の少なくとも一方を用いて、前記複数の頻出箇所から1つ以上の頻出箇所を除外する
請求項11に記載の情報処理装置。
【請求項13】
原文を要約した要約文を取得し、
前記要約文が指定された場合に、前記要約文に含まれる単語の前記原文での頻出箇所を、前記要約文に対応する前記原文における対応箇所として表示する制御を行うことを、
コンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
例えば、特許文献1には、翻訳元である原文と翻訳後の訳文の文対応を自動的に行う対訳文対応付け方法が記載されている。この対訳文対応付け方法は、原文と訳文を入力し、原文と訳文とからそれぞれキーワードを抽出し、抽出したキーワードを中間語生成辞書により中間語に変換し、訳文に含まれる中間語キーワードと原文に含まれる中間語キーワードの関係から、原文と訳文を対応付ける。
【0003】
また、特許文献2には、原文を短い文章にする文章要約方法が記載されている。この文章要約方法は、文章を構成する構成単位毎に原文を保持し、さらに、構成単位毎の要約結果文を原文に対応付けて保持し、表示されている構成単位の要約結果文の原文出力が指示されたとき、保持された対応する原文を出力させる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2000-148758号公報
【特許文献2】特開2000-194702号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、原文における重要な文である重要文を、原文から抽出して要約文を作成し、要約文と原文との対応箇所を決定し、要約文に対して原文の対応箇所を表示する技術がある。
【0006】
しかし、上記技術では、要約文を原文から重要文を抽出して作成しない限り、要約文に対する重要文が分からず、要約文に対して原文の対応箇所を表示することができなかった。
【0007】
本開示は、要約文が原文から重要文を抽出して作成されたものでなくても、要約文に対する原文の対応箇所を表示させることができる情報処理装置及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、第1態様に係る情報処理装置は、プロセッサを備え、前記プロセッサが、原文を要約した要約文を取得し、前記要約文が指定された場合に、前記要約文に含まれる単語の前記原文での頻出箇所を、前記要約文に対応する前記原文における対応箇所として表示する制御を行う。
【0009】
また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記要約文に含まれる各単語について、前記原文を予め定めた単位に分割して得られた原文単位毎に、単語の出現頻度及び原文全体における単語の稀少度により表される指標値を算出し、算出した指標値を用いて前記頻出箇所を特定する。
【0010】
また、第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記頻出箇所が、前記要約文に含まれる各単語について算出された指標値の総和が閾値以上となる箇所である。
【0011】
また、第4態様に係る情報処理装置は、第3態様に係る情報処理装置において、前記指標値が、TF-IDFである。
【0012】
また、第5態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記頻出箇所として、前記要約文に含まれる単語及び当該単語の類似語が頻出する箇所を特定する。
【0013】
また、第6態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記要約文に含まれる特定の単語が指定された場合の前記対応箇所が、前記要約文が指定された場合の前記対応箇所と異なる。
【0014】
また、第7態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記原文について複数の前記要約文が取得された場合、前記対応箇所がある要約文と、前記対応箇所がない要約文とを識別可能に表示する制御を行う。
【0015】
また、第8態様に係る情報処理装置は、第7態様に係る情報処理装置において、前記プロセッサが、前記対応箇所がある要約文が指定された場合、前記要約文に含まれる単語の前記原文での頻出箇所を、前記対応箇所として表示する制御を行い、前記対応箇所がない要約文が指定された場合、前記原文に含まれる予め定めた箇所を表示する制御を行う。
【0016】
また、第9態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記要約文に複数の前記対応箇所がある場合、前記複数の対応箇所を予め定めた順番で表示する制御を行う。
【0017】
また、第10態様に係る情報処理装置は、第9態様に係る情報処理装置において、前記プロセッサが、前記要約文に複数の前記対応箇所がある場合、前記要約文に含まれる単語のうち前記複数の対応箇所の各々において出現頻度及び原文全体における稀少度により表される指標値が最も高い単語を、前記複数の対応箇所の各々に対応付ける。
【0018】
また、第11態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記要約文が、第1要約文と、当該第1要約文の前又は後の第2要約文とを含み、前記プロセッサが、前記第1要約文に対して複数の前記頻出箇所が特定された場合、前記第2要約文に対応する前記原文での頻出箇所との前後関係を用いて、前記複数の頻出箇所から1つ以上の頻出箇所を除外する。
【0019】
また、第12態様に係る情報処理装置は、第11態様に係る情報処理装置において、前記プロセッサが、前記第2要約文に対応する前記原文での頻出箇所との前後関係に加え、更に、前記第1要約文に含まれる単語と関連する動詞及び形容詞の少なくとも一方を用いて、前記複数の頻出箇所から1つ以上の頻出箇所を除外する。
【0020】
更に、上記目的を達成するために、第13態様に係る情報処理プログラムは、原文を要約した要約文を取得し、前記要約文が指定された場合に、前記要約文に含まれる単語の前記原文での頻出箇所を、前記要約文に対応する前記原文における対応箇所として表示する制御を行うことを、コンピュータに実行させる。
【発明の効果】
【0021】
第1態様及び第13態様によれば、要約文が原文から重要文を抽出して作成されたものでなくても、要約文に対する原文の対応箇所を表示させることができる、という効果を有する。
【0022】
第2態様によれば、出現頻度及び稀少度のいずれか一方のみを考慮する場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0023】
第3態様によれば、特定の単語の指標値のみを考慮する場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0024】
第4態様によれば、TF-IDF以外の指標値を用いる場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0025】
第5態様によれば、要約文に含まれる単語のみを考慮する場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0026】
第6態様によれば、特定の単語が指定された場合と要約文自体が指定された場合とで同じ対応箇所を表示する場合と比較して、適切な対応箇所を表示させることができる、という効果を有する。
【0027】
第7態様によれば、対応箇所がある要約文と、対応箇所がない要約文とを一見して把握することができる、という効果を有する。
【0028】
第8態様によれば、対応箇所がない要約文が指定された場合であっても、予め定めた箇所を表示させることができる、という効果を有する。
【0029】
第9態様によれば、複数の対応箇所を順番に把握することができる、という効果を有する。
【0030】
第10態様によれば、複数の対応箇所の各々に対して、出現頻度及び原文全体における稀少度により表される指標値が最も高い単語を対応付けることができる、という効果を有する。
【0031】
第11態様によれば、要約文との関連性が比較的低い頻出箇所を除外することができる、という効果を有する。
【0032】
第12態様によれば、要約文の内容も考慮して、要約文との関連性が比較的低い頻出箇所を除外することができる、という効果を有する。
【図面の簡単な説明】
【0033】
【
図1】実施形態に係る要約処理システムの構成の一例を示す図である。
【
図2】実施形態に係る要約処理装置の電気的な構成の一例を示すブロック図である。
【
図3】実施形態に係る要約処理装置の機能的な構成の一例を示すブロック図である。
【
図4】実施形態に係る原文に含まれる原文ページの一例を示す図である。
【
図6】実施形態に係る要約文中の単語とTF-IDFとの関係の一例を示す図である。
【
図7】実施形態に係る要約文に対応する原文の頻出箇所の一例を示す図である。
【
図8】実施形態に係る要約文中の単語とTF-IDFとの関係の別の例を示す図である。
【
図9】実施形態に係る要約文に対応する原文の頻出箇所の別の例を示す図である。
【
図10】実施形態に係る頻出箇所除外処理の説明に供する図である。
【
図11】要約文に対応する対応箇所が1つの場合の対応箇所表示画面の一例を示す正面図である。
【
図12】要約文に対応する対応箇所が複数の場合の対応箇所表示画面の一例を示す正面図である。
【
図13】実施形態に係る表示順設定画面の一例を示す正面図である。
【
図14】要約文中の単語に対応する対応箇所が1つの場合の対応箇所表示画面の一例を示す正面図である。
【
図15】要約文に対応する対応箇所がない場合の対応箇所表示画面の一例を示す正面図である。
【
図16】実施形態に係る要約処理プログラムによる処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0034】
以下、図面を参照して、本開示の技術を実施するための形態の一例について詳細に説明する。なお、動作、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符号を付与し、重複する説明を適宜省略する場合がある。各図面は、本開示の技術を十分に理解できる程度に、概略的に示してあるに過ぎない。よって、本開示の技術は、図示例のみに限定されるものではない。また、本実施形態では、本開示の技術と直接的に関連しない構成や周知な構成については、説明を省略する場合がある。
【0035】
図1は、本実施形態に係る要約処理システム100の構成の一例を示す図である。
【0036】
図1に示すように、本実施形態に係る要約処理システム100は、要約処理装置10と、端末装置30と、を備えている。
図1の例では、1台の端末装置を示しているが、その数は任意である。なお、要約処理装置10は、情報処理装置の一例である。
【0037】
端末装置30は、要約処理サービスのユーザが使用する端末装置であり、例えば、スマートフォン、タブレット端末、パーソナルコンピュータ(PC:Personal Computer)等の情報端末である。ユーザは、端末装置30を操作して、ネットワークNを介して要約処理装置10にアクセスし、要約処理装置10から原文に対する要約を得る。
【0038】
要約処理装置10は、ネットワークNを介して端末装置30と接続されている。ネットワークNとしては、例えば、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等が適用される。要約処理装置10は、例えば、クラウド上に配置されたサーバコンピュータであり、端末装置30からユーザによって入力される原文を受け付け、当該原文に対する要約を端末装置30に出力する。
【0039】
なお、
図1の例では、要約処理装置10は、端末装置30からユーザにより入力された原文を受け付けるが、これに限るものではなく、端末装置30を介することなく、自装置の操作部からユーザが直接入力した原文を受け付けるようにしてもよい。
【0040】
図2は、本実施形態に係る要約処理装置10の電気的な構成の一例を示すブロック図である。
【0041】
図2に示すように、本実施形態に係る要約処理装置10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、入出力インタフェース(I/O)14と、記憶部15と、表示部16と、操作部17と、通信部18と、を備えている。
【0042】
CPU11、ROM12、RAM13、及びI/O14は、バスを介して各々接続されている。I/O14には、記憶部15と、表示部16と、操作部17と、通信部18と、を含む各機能部が接続されている。これらの各機能部は、I/O14を介して、CPU11と相互に通信可能とされる。
【0043】
CPU11、ROM12、RAM13、及びI/O14によって制御部が構成される。制御部は、要約処理装置10の一部の動作を制御するサブ制御部として構成されてもよいし、要約処理装置10の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はICチップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。
【0044】
記憶部15としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部15には、本実施形態に係る要約処理を実行するための要約処理プログラム15Aが記憶される。なお、この要約処理プログラム15Aは、ROM12に記憶されていてもよい。
【0045】
要約処理プログラム15Aは、例えば、要約処理装置10に予めインストールされていてもよい。要約処理プログラム15Aは、不揮発性の記憶媒体に記憶して、又はネットワークNを介して配布して、要約処理装置10に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
【0046】
表示部16には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)、有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部16は、タッチパネルを一体的に有していてもよい。操作部17には、例えば、キーボード、マウス等の操作入力用のデバイスが設けられている。表示部16及び操作部17は、要約処理装置10のユーザから各種の指示を受け付ける。表示部16は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
【0047】
通信部18は、一例として、インターネット、LAN、WAN等のネットワークNに接続されており、端末装置30との間でネットワークNを介して通信が可能とされる。
【0048】
ところで、上述したように、原文における重要文を原文から抽出して要約文を作成し、要約文と原文との対応箇所を決定し、要約文に対して原文の対応箇所を表示する技術では、要約文を原文から重要文を抽出して作成しない限り、要約文に対する重要文が分からず、要約文に対して原文の対応箇所を表示することができなかった。
【0049】
これに対して、本実施形態に係る要約処理装置10は、原文を要約した要約文を取得し、要約文を指定した場合に、要約文に含まれる単語の原文での頻出箇所を、要約文に対応する原文における対応箇所として表示する制御を行う。
【0050】
具体的に、本実施形態に係る要約処理装置10のCPU11は、記憶部15に記憶されている要約処理プログラム15AをRAM13に書き込んで実行することにより、
図3に示す各部として機能する。なお、CPU11は、プロセッサの一例である。
【0051】
図3は、本実施形態に係る要約処理装置10の機能的な構成の一例を示すブロック図である。
【0052】
図3に示すように、本実施形態に係る要約処理装置10のCPU11は、原文取得部11A、要約生成部11B、要約取得部11C、頻出箇所特定部11D、及び表示制御部11Eとして機能する。
【0053】
原文取得部11Aは、要約対象となる原文を取得する。ここでいう原文には、例えば、文書、画像、動画、対話・会話履歴、Webページ等が含まれる。
【0054】
要約生成部11Bは、原文取得部11Aにより取得された原文から要約文を生成する。要約文の生成には、例えば、AI(Artificial Intelligence)モデルによる要約AIアプリケーション(例えば、「ELYZA DIGEST(https://www.digest.elyza.ai/)」等)が用いられる。
【0055】
要約取得部11Cは、要約生成部11Bにより生成された要約文、あるいは、外部の提供元から要約文を取得する。
【0056】
頻出箇所特定部11Dは、原文取得部11Aにより取得された原文を入力し、要約取得部11Cにより取得された要約文を入力し、要約文に含まれる単語の原文での頻出箇所を特定する。
【0057】
具体的に、頻出箇所特定部11Dは、要約文に含まれる各単語について、原文を予め定めた単位に分割して得られた原文単位毎に、単語の出現頻度及び原文全体における単語の稀少度により表される指標値を算出し、算出した指標値を用いて頻出箇所を特定する。分割の単位は、例えば、ページ単位でもよいし、章・節・項の単位でもよい。頻出箇所は、最頻出箇所である必要はなく、例えば、要約文に含まれる各単語について算出された指標値の総和が閾値以上となる箇所である。指標値には、例えば、TF-IDF(Term Frequency-Inverse Document Frequency)が適用される。TF-IDFのうちTFは単語の出現頻度を表し、IDFは原文全体における単語の稀少度を表す。
【0058】
ここで、
図4~
図10を参照して、頻出箇所特定部11Dによる頻出箇所特定処理について具体的に説明する。
【0059】
図4は、本実施形態に係る原文に含まれる原文ページ40の一例を示す図である。
図4の例では、原文ページ40は、原文取得部11Aにより取得された原文に含まれる任意のページ(例えば、「P.11」)を示し、ページ内に複数の項である原文項40A~40Cを含む。
【0060】
頻出箇所特定部11Dは、一例として、
図4に示すように、取得した原文をページ単位に分割し、分割後のデータとして、ページ単位の要約に利用する情報と対応箇所とを対応付けて保持する。
図4の例では、原文ページ40が原文の「P.11(11ページ)」を表しており、「P.11(11ページ)」のページ全体が要約に利用する情報となり、「P.11(11ページ)」が対応箇所となる。
【0061】
また、頻出箇所特定部11Dは、取得した原文を構造単位(例えば、項単位)に分割してもよい。例えば、
図4に示す原文ページ40を項単位に分割する場合、分割後のデータとして、項単位の要約に利用する情報と対応箇所とを対応付けて保持する。
図4の例では、原文項40Aが原文ページ40の「11.1 社内外関係者とセキュアにファイル共有が可能」の項を表しており、「P.11 社内外関係者とセキュアにファイル共有が可能」の項全体が要約に利用する情報となり、「P.11 社内外関係者とセキュアにファイル共有が可能」が対応箇所となる。
【0062】
図5は、本実施形態に係る要約50の一例を示す図である。
図5の例では、要約50は、要約生成部11Bにより要約して得られた要約文である。
【0063】
頻出箇所特定部11Dは、一例として、
図5に示すように、要約50を特定の単位(例えば、一文)に分割する。
図5の例では、要約50を複数の要約文1~5に分割する。
【0064】
そして、頻出箇所特定部11Dは、複数の要約文1~5の各々に対して形態素解析を行い、接続詞、助詞を除いた単語の集合とする。そして、得られた単語の集合に含まれる各単語について、上述の
図4に示す要約に利用する情報との間でTF-IDFを算出する。
【0065】
図6は、本実施形態に係る要約文中の単語とTF-IDFとの関係の一例を示す図である。また、
図7は、本実施形態に係る要約文に対応する原文の頻出箇所の一例を示す図である。
図6及び
図7の例では、要約文に対応する頻出箇所が1つの場合について説明する。
【0066】
図6に示す表T1では、上述の
図5に示す要約文5を形態素解析し、接続詞、助詞を除いた単語の集合とし、得られた単語の集合に含まれる各単語について、TF-IDFを算出した場合について示している。また、
図6に示すグラフG1では、要約文5に含まれる各単語とTF-IDFの分布を示している。横軸は単語を示し、縦軸はTF-IDFを示す。TF-IDFの値は、原文の主旨を表現する特徴的な(つまり、対応する箇所だけで出現する)単語は値が大きくなる。また、原文全体で利用される単語は出現していても値は小さくなる。
図6の例では、「社外」、「安全」、及び「共有」の値は比較的大きくなり、「文書ファイル」の値は比較的小さくなる。
【0067】
取得した原文の「要約に利用する情報」に対して、例えば、要約文5に含まれる各単語について算出されたTF-IDFの総和が閾値以上となる箇所を頻出箇所として特定する。頻出箇所の特定に用いる閾値には、ユーザにより適切な値が設定される。
図6に示す要約文5の場合、
図7に示すように、原文ページ40の原文項40Aが頻出箇所として特定される。
【0068】
図7に示す原文項40Aでは、単語毎にベクトル変換し、類似度の高い単語(=類似語)も同じ単語とみなしている。つまり、頻出箇所特定部11Dは、頻出箇所として、要約文に含まれる単語及び当該単語の類似語が頻出する箇所を特定するようにしてもよい。類似語を抽出する手法は、特に限定されるものではなく、種々の公知技術が用いられる。この原文項40Aにおいて、実線で囲んだ単語は、要約文5に含まれる単語を表す。ここでは、「共有」が該当する。一方、点線で囲んだ単語は、要約文5に含まれる単語と類似度の高い単語を表す。ここでは、「社内外」、「セキュア」、及び「文書」が該当する。
【0069】
一方、
図7に示す原文項40Bは、
図6に示す要約文5の頻出箇所として特定されない。原文項40Bにおいて、実線で囲んだ単語は、要約文5に含まれる単語を表す。ここでは、「ユーザー登録」のみが該当する。この原文項40Bでは、要約文5に含まれる単語と類似度の高い単語は存在しない。この場合、要約文5に含まれる各単語について算出されたTF-IDFの総和が閾値未満となるため、頻出箇所として特定されない。
【0070】
上述の
図6及び
図7の例では、要約文に対応する頻出箇所が1つの場合について説明したが、以下では、要約文に対応する頻出箇所が複数ある場合について説明する。
【0071】
図8は、本実施形態に係る要約文中の単語とTF-IDFとの関係の別の例を示す図である。また、
図9は、本実施形態に係る要約文に対応する原文の頻出箇所の別の例を示す図である。
図8及び
図9の例では、要約文に対応する頻出箇所が複数ある場合について説明する。
【0072】
図8に示す表T2では、上述の
図5に示す要約文4を形態素解析し、接続詞、助詞を除いた単語の集合とし、得られた単語の集合に含まれる各単語について、複数のTF-IDF(TF-IDF1~3)を算出した場合について示している。なお、TF-IDF1では、「モバイル端末」という単語が最も大きな値となり、TF-IDF2では、「DocuWorks(登録商標)」という単語が最も大きな値となり、TF-IDF3では、「複合機」という単語が最も大きな値となる。また、
図8に示すグラフG2では、要約文4に含まれる各単語とTF-IDFの分布を示している。横軸は単語を示し、縦軸はTF-IDFを示す。なお、実線がTF-IDF1に対応し、点線がTF-IDF2に対応し、TF-IDF3は省略している。
【0073】
取得した原文の「要約に利用する情報」に対して、例えば、要約文4に含まれる各単語について算出されたTF-IDFの値が閾値以上となる単語を含む箇所を頻出箇所として特定してもよい。
図8に示す要約文4の場合、
図9に示すように、原文ページ41、42、43が複数の頻出箇所として特定される。具体的に、原文ページ41はTF-IDF1が算出された原文の「6ページ」に対応し、原文ページ42はTF-IDF2が算出された原文の「7ページ」に対応し、原文ページ43はTF-IDF3が算出された原文の「8、9ページ」に対応する。
【0074】
ここで、要約文は、第1要約文と、第1要約文の前又は後の第2要約文とを含む。頻出箇所特定部11Dは、第1要約文に対して複数の頻出箇所が特定された場合、第2要約文に対応する原文での頻出箇所との前後関係を用いて、複数の頻出箇所から1つ以上の頻出箇所を除外するようにしてもよい。この頻出箇所除外処理について
図10を参照して説明する。
【0075】
図10は、本実施形態に係る頻出箇所除外処理の説明に供する図である。
【0076】
図10に示すように、例えば、複数の頻出箇所として、原文の「8、9ページ」及び「13ページ」が特定された要約文4(第1要約文)について、後の要約文5(第2要約文)に対応する頻出箇所として、原文の「11ページ」を考慮し、以下の条件1又は条件2を満たす頻出箇所を採用する。
【0077】
(条件1)前の要約文に対応する頻出箇所の以後に存在すること。
(条件2)後の要約文に対応する頻出箇所の以前に存在すること。
【0078】
図10の例では、要約文4に対応する頻出箇所「8、9ページ」は、後の要約文5に対応する頻出箇所「11ページ」の以前であるため、条件2を満たし、要約文4に対応する頻出箇所「13ページ」は、後の要約文5に対応する頻出箇所「11ページ」の以後であるため、条件2を満たさない。このため、頻出箇所「8、9ページ」は採用され、頻出箇所「13ページ」は除外される。
【0079】
要約文は、通常、原文のページ順に従って生成されるため、前後の要約文に対応する頻出箇所を考慮することで、要約文との関連性が低い頻出箇所が除外される。これにより、ユーザは関連性が低い頻出箇所を確認する必要がなくなる。
【0080】
また、頻出箇所特定部11Dは、第2要約文に対応する原文での頻出箇所との前後関係に加え、更に、第1要約文に含まれる単語と関連する動詞及び形容詞の少なくとも一方を用いて、複数の頻出箇所から1つ以上の頻出箇所を除外するようにしてもよい。
【0081】
具体的に、要約文4(第1要約文)に含まれる単語と関連する動詞又は形容詞は、例えば、単語の近傍にある動詞又は形容詞、あるいは、単語と同じ文節に含まれる動詞又は形容詞とされる。
図10の例において、要約文4(第1要約文)に含まれる単語が例えば「複合機」である場合、「複合機」と同じ文節には「連携する」が含まれる。この場合、要約文4(第1要約文)に対応する頻出箇所「8、9ページ」に、「連携する」が含まれている場合は、頻出箇所「8、9ページ」は採用され、「連携する」が含まれない場合は、頻出箇所「8、9ページ」は除外される。
【0082】
前後の要約文に対応する頻出箇所を考慮することに加え、要約文の内容も考慮することで、要約文との関連性が低い頻出箇所が除外される。
【0083】
なお、頻出箇所特定部11Dは、上記により特定した原文での頻出箇所を要約文に対応付けて頻出箇所DB(DataBase:データベース)151に保持してもよい。頻出箇所DB151は、記憶部15に記憶されている。
【0084】
図3に戻り、表示制御部11Eは、要約文を表示させる制御を行い、要約文が指定された場合に、要約文に含まれる単語の原文での頻出箇所を、要約文に対応する原文における対応箇所として表示する制御を行う。なお、要約文、及び、要約文に対応する原文における対応箇所は、例えば、端末装置30の表示部に表示される。
【0085】
ここで、要約文に含まれる特定の単語が指定された場合の対応箇所は、要約文が指定された場合の対応箇所と異なるようにしてもよい。
【0086】
また、表示制御部11Eは、原文について複数の要約文が取得された場合、対応箇所がある要約文と、対応箇所がない要約文とを識別可能に表示する制御を行うようにしてもよい。
【0087】
また、表示制御部11Eは、対応箇所がある要約文が指定された場合、要約文に含まれる単語の原文での頻出箇所を、対応箇所として表示する制御を行い、対応箇所がない要約文が指定された場合、原文に含まれる予め定めた箇所(例えば、表紙等)を表示する制御を行うようにしてもよい。
【0088】
また、表示制御部11Eは、要約文に複数の対応箇所がある場合、複数の対応箇所を予め定めた順番で表示する制御を行うようにしてもよい。予め定めた順番は、例えば、ページ順でもよいし、指標値(例えば、TF-IDF)の順でもよい。なお、表示制御部11Eは、要約文に複数の対応箇所がある場合、要約文に含まれる単語のうち複数の対応箇所の各々において指標値(例えば、TF-IDF)が最も高い単語を、複数の対応箇所の各々に対応付けるようにし、対応箇所を表示する際に、当該対応箇所に対応付けられた単語を識別可能に表示してもよい。
【0089】
ここで、
図11~
図15を参照して、表示制御部11Eによる対応箇所表示処理について具体的に説明する。
【0090】
図11は、要約文に対応する対応箇所が1つの場合の対応箇所表示画面70の一例を示す正面図である。
図11に示す対応箇所表示画面70は、例えば、端末装置30の表示部に表示される。
【0091】
図11に示す対応箇所表示画面70は、上述の要約文1~5に分割された要約50が表示される。要約文1~3は原文での対応箇所がなく、要約文4、5は原文での対応箇所があるため、要約文1~3と要約文4、5とは識別可能に表示される。
図11の例では、要約文4、5が斜体でハイライト表示されているが、例えば、フォントの色、サイズ、太さ、種類、下線の付与、背景色の付与等、によってハイライト表示してもよい。
【0092】
図11において、マウスのカーソルCで例えば要約文5を指定すると、指定された要約文5が太字に変化し、原文での対応箇所を含むプレビュー画面60がポップアップ表示される。ここでいう指定とは、例えば、マウスオーバー、マウスクリック等による指定とされる。プレビュー画面60には、原文項40A~40Cを含む原文ページ40のプレビュー画像が表示され、要約文5に対応する原文項40Aが対応箇所として識別可能に表示される。
図11の例では、原文項40Aに背景色が付与されてハイライト表示されているが、ハイライト表示の形態は特に限定されるものではない。なお、プレビュー画面60の「開く」ボタン60AをカーソルCで操作すると、原文ページ40の「11ページ」が表示される。
【0093】
図12は、要約文に対応する対応箇所が複数の場合の対応箇所表示画面70の一例を示す正面図である。
図12に示す対応箇所表示画面70は、上述の
図11の例と同様に、例えば、端末装置30の表示部に表示される。
【0094】
図12に示す対応箇所表示画面70は、上述の
図11の例と同様に、要約文1~5に分割された要約50が表示される。要約文1~3は原文での対応箇所がなく、要約文4、5は原文での対応箇所があるため、要約文1~3と要約文4、5とは識別可能に表示される。
【0095】
図12において、マウスのカーソルCで例えば要約文4を指定すると、指定された要約文4が太字に変化し、原文での対応箇所を含むプレビュー画面61がポップアップ表示される。プレビュー画面61には、要約文4に対応する複数の原文ページ41~43(原文の「6ページ」~「9ページ」に対応)のプレビュー画像が対応箇所として表示される。
図12の例では、原文ページ41の「6ページ」が表示されており、カーソルCでページ送りボタン61Bを操作すると、表示されるページがページ順に切り替わる。なお、プレビュー画面61の「開く」ボタン61AをカーソルCで操作すると、原文ページ41の「6ページ」が表示される。
【0096】
ここで、原文ページ41の「6ページ」を表示する場合、「6ページ」に対応付けられた単語(ここでは、「モバイル端末」)を識別可能に表示してもよい。但し、「モバイル端末」という単語は、上述の
図8に示すTF-IDF1の中でTF-IDFが最も高い単語である。また、原文ページ42の「7ページ」を表示する場合、「7ページ」に対応付けられた単語(ここでは、「DocuWorks(登録商標)」)を識別可能に表示してもよい。但し、「DocuWorks(登録商標)」という単語は、上述の
図8に示すTF-IDF2の中でTF-IDFが最も高い単語である。また、原文ページ43の「8、9ページ」を表示する場合、「8、9ページ」に対応付けられた単語(ここでは、「複合機」)を識別可能に表示してもよい。但し、「複合機」という単語は、上述の
図8に示すTF-IDF3の中でTF-IDFが最も高い単語である。
【0097】
なお、複数の原文ページ41~43を対応箇所として表示する際の表示順は、ページ順に限定されるものではなく、上述したように、指標値(例えば、TF-IDFの総和)の順としてもよい。
【0098】
図13は、本実施形態に係る表示順設定画面71の一例を示す正面図である。
図13に示す表示順設定画面71は、例えば、端末装置30の表示部に表示される。
【0099】
図13に示すように、表示順設定画面71を介してユーザにより対応箇所の表示順がTF-IDF順に設定された場合、対応箇所がTF-IDFの総和が大きい順に表示される。
【0100】
図14は、要約文中の単語に対応する対応箇所が1つの場合の対応箇所表示画面70の一例を示す正面図である。
図14に示す対応箇所表示画面70は、上述の
図11の例と同様に、例えば、端末装置30の表示部に表示される。
【0101】
図14に示す対応箇所表示画面70は、上述の
図11の例と同様に、要約文1~5に分割された要約50が表示される。要約文1~3は原文での対応箇所がなく、要約文4、5は原文での対応箇所があるため、要約文1~3と要約文4、5とは識別可能に表示される。
【0102】
図14において、マウスのカーソルCで例えば要約文4の特定の単語を指定すると、指定された単語に対応する、原文での対応箇所を含むプレビュー画面62がポップアップ表示される。特定の単語とは、要約文4の中でTF-IDFが比較的高い単語(閾値以上の単語)とされ、例えば、「複合機」、「DocuWorks(登録商標)」、及び「モバイル端末」とされる。これらの特定の単語は、要約文全体と識別可能なように下線が付与され、ハイライト表示されている。ハイライト表示の方法は、下線に限定されず、識別可能な方法であればよい。
【0103】
図14の例では、カーソルCで要約文4の「DocuWorks(登録商標)」が指定されており、プレビュー画面62には、「DocuWorks(登録商標)」に対応する原文ページ42(原文の「7ページ」に対応)のプレビュー画像が対応箇所として表示される。つまり、要約文4に含まれる特定の単語が指定された場合の対応箇所は、要約文4自体が指定された場合の対応箇所と異なっている。なお、プレビュー画面62の「開く」ボタン62AをカーソルCで操作すると、原文ページ42の「7ページ」が表示される。また、原文ページ42の「7ページ」を表示する際に、「7ページ」に対応付けられた単語(ここでは、「DocuWorks(登録商標)」)を識別可能に表示してもよい。
【0104】
図15は、要約文に対応する対応箇所がない場合の対応箇所表示画面70の一例を示す正面図である。
図15に示す対応箇所表示画面70は、上述の
図11の例と同様に、例えば、端末装置30の表示部に表示される。
【0105】
図15に示す対応箇所表示画面70は、上述の
図11の例と同様に、要約文1~5に分割された要約50が表示される。要約文1~3は原文での対応箇所がなく、要約文4、5は原文での対応箇所があるため、要約文1~3と要約文4、5とは識別可能に表示される。
【0106】
図15において、マウスのカーソルCで例えば要約文1を指定すると、指定された要約文1が太字に変化し、原文に含まれる予め定めた箇所を含むプレビュー画面63がポップアップ表示される。プレビュー画面63には、予め定めた箇所の一例として、原文ページ44(例えば、原文の「表紙」)のプレビュー画像が表示される。つまり、対応箇所がない要約文が指定された場合、原文に含まれる予め定めた箇所(例えば、原文の「表紙」)が表示される。なお、表紙に限定されず、例えば、本体部分の先頭ページ、概要説明ページ等でもよい。カーソルCでページ送りボタン63Bを操作すると、表示されるページがページ順に切り替わり、原文全体をプレビューすることが可能とされる。なお、プレビュー画面63の「開く」ボタン63AをカーソルCで操作すると、原文ページ44の「表紙」が表示される。
【0107】
次に、
図16を参照して、本実施形態に係る要約処理装置10の作用について説明する。
【0108】
図16は、本実施形態に係る要約処理プログラム15Aによる処理の流れの一例を示すフローチャートである。
【0109】
まず、要約処理装置10のCPU11により要約処理プログラム15Aが起動され、以下のステップを実行する。
【0110】
図16のステップS101では、CPU11が、要約対象となる原文を取得する。ここでいう原文には、上述したように、例えば、文書、画像、動画、対話・会話履歴、Webページ等が含まれる。
【0111】
ステップS102では、CPU11が、ステップS101で取得した原文から要約文を生成する。要約文の生成には、上述したように、例えば、要約AIアプリケーション(例えば、「ELYZA DIGEST」等)が用いられる。
【0112】
ステップS103では、CPU11が、ステップS102で生成した要約文、あるいは、外部の提供元から要約文を取得する。
【0113】
ステップS104では、CPU11が、ステップS101で取得した原文を入力し、ステップS103で取得した要約文を入力し、要約文に含まれる単語の原文での頻出箇所を特定する。具体的には、一例として、上述の
図4~
図10を参照して説明したように、要約文に含まれる各単語について、原文を予め定めた単位に分割して得られた原文単位毎に、単語の出現頻度及び原文全体における単語の稀少度により表される指標値を算出し、算出した指標値を用いて頻出箇所を特定する。分割の単位は、例えば、ページ単位でもよいし、章・節・項の単位でもよい。頻出箇所は、最頻出箇所である必要はなく、例えば、要約文に含まれる各単語について算出された指標値の総和が閾値以上となる箇所である。指標値には、例えば、TF-IDFが適用される。
【0114】
ステップS105では、CPU11が、一例として、上述の
図11を参照して説明したように、要約文を表示させる制御を行う。例えば、上述の
図11に示す対応箇所表示画面70を端末装置30に表示させる。
【0115】
ステップS106では、CPU11が、一例として、上述の
図11に示す対応箇所表示画面70に表示される複数の要約文のいずれかに対してユーザから指定を受け付けたか否かを判定する。ユーザからの指定を受け付けたと判定した場合(肯定判定の場合)、ステップS107に移行し、ユーザからの指定を受け付けていないと判定した場合(否定判定の場合)、ステップS106で待機となる。
【0116】
ステップS107では、CPU11が、一例として、上述の
図11を参照して説明したように、ステップS106で指定された要約文に含まれる単語の原文での頻出箇所を、要約文に対応する原文における対応箇所として表示する制御を行い、本要約処理プログラム15Aによる一連の処理を終了する。
【0117】
このように本実施形態によれば、ユーザにより指定された要約文に含まれる単語の原文での頻出箇所が、要約文に対応する原文における対応箇所として表示される。これにより、要約文が原文から重要文を抽出して作成されたものでなくても、要約文に対する原文の対応箇所を表示させることができる。
【0118】
なお、上記各実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば、CPU:Central Processing Unit、等)や、専用のプロセッサ(例えば、GPU:Graphics processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
【0119】
また、上記各実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は、上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
【0120】
以上、実施形態に係る情報処理装置の一例として要約処理装置を例示して説明した。実施形態は、情報処理装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、これらのプログラムを記憶したコンピュータが読み取り可能な非一時的記憶媒体の形態としてもよい。
【0121】
その他、上記実施形態で説明した情報処理装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
【0122】
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
【0123】
また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。
【0124】
以上の実施形態に関し、更に以下を開示する。
【0125】
(((1)))に係る情報処理装置は、プロセッサを備え、前記プロセッサが、原文を要約した要約文を取得し、前記要約文が指定された場合に、前記要約文に含まれる単語の前記原文での頻出箇所を、前記要約文に対応する前記原文における対応箇所として表示する制御を行う。
【0126】
(((2)))に係る情報処理装置は、(((1)))に係る情報処理装置において、前記プロセッサが、前記要約文に含まれる各単語について、前記原文を予め定めた単位に分割して得られた原文単位毎に、単語の出現頻度及び原文全体における単語の稀少度により表される指標値を算出し、算出した指標値を用いて前記頻出箇所を特定する。
【0127】
(((3)))に係る情報処理装置は、(((2)))に係る情報処理装置において、前記頻出箇所が、前記要約文に含まれる各単語について算出された指標値の総和が閾値以上となる箇所である。
【0128】
(((4)))に係る情報処理装置は、(((2)))又は(((3)))に係る情報処理装置において、前記指標値が、TF-IDFである。
【0129】
(((5)))に係る情報処理装置は、(((1)))~(((4)))の何れか1に係る情報処理装置において、前記プロセッサが、前記頻出箇所として、前記要約文に含まれる単語及び当該単語の類似語が頻出する箇所を特定する。
【0130】
(((6)))に係る情報処理装置は、(((1)))~(((5)))の何れか1に係る情報処理装置において、前記要約文に含まれる特定の単語が指定された場合の前記対応箇所が、前記要約文が指定された場合の前記対応箇所と異なる。
【0131】
(((7)))に係る情報処理装置は、(((1)))~(((6)))の何れか1に係る情報処理装置において、前記プロセッサが、前記原文について複数の前記要約文が取得された場合、前記対応箇所がある要約文と、前記対応箇所がない要約文とを識別可能に表示する制御を行う。
【0132】
(((8)))に係る情報処理装置は、(((7)))に係る情報処理装置において、前記プロセッサが、前記対応箇所がある要約文が指定された場合、前記要約文に含まれる単語の前記原文での頻出箇所を、前記対応箇所として表示する制御を行い、前記対応箇所がない要約文が指定された場合、前記原文に含まれる予め定めた箇所を表示する制御を行う。
【0133】
(((9)))に係る情報処理装置は、(((1)))~(((8)))の何れか1に係る情報処理装置において、前記プロセッサが、前記要約文に複数の前記対応箇所がある場合、前記複数の対応箇所を予め定めた順番で表示する制御を行う。
【0134】
(((10)))に係る情報処理装置は、(((9)))に係る情報処理装置において、前記プロセッサが、前記要約文に複数の前記対応箇所がある場合、前記要約文に含まれる単語のうち前記複数の対応箇所の各々において出現頻度及び原文全体における稀少度により表される指標値が最も高い単語を、前記複数の対応箇所の各々に対応付ける。
【0135】
(((11)))に係る情報処理装置は、(((1)))~(((10)))の何れか1に係る情報処理装置において、前記要約文が、第1要約文と、当該第1要約文の前又は後の第2要約文とを含み、前記プロセッサが、前記第1要約文に対して複数の前記頻出箇所が特定された場合、前記第2要約文に対応する前記原文での頻出箇所との前後関係を用いて、前記複数の頻出箇所から1つ以上の頻出箇所を除外する。
【0136】
(((12)))に係る情報処理装置は、(((11)))に係る情報処理装置において、前記プロセッサが、前記第2要約文に対応する前記原文での頻出箇所との前後関係に加え、更に、前記第1要約文に含まれる単語と関連する動詞及び形容詞の少なくとも一方を用いて、前記複数の頻出箇所から1つ以上の頻出箇所を除外する。
【0137】
(((13)))に係る情報処理プログラムは、原文を要約した要約文を取得し、前記要約文が指定された場合に、前記要約文に含まれる単語の前記原文での頻出箇所を、前記要約文に対応する前記原文における対応箇所として表示する制御を行うことを、コンピュータに実行させる。
【0138】
(((1)))及び(((13)))によれば、要約文が原文から重要文を抽出して作成されたものでなくても、要約文に対する原文の対応箇所を表示させることができる、という効果を有する。
【0139】
(((2)))によれば、出現頻度及び稀少度のいずれか一方のみを考慮する場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0140】
(((3)))によれば、特定の単語の指標値のみを考慮する場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0141】
(((4)))によれば、TF-IDF以外の指標値を用いる場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0142】
(((5)))によれば、要約文に含まれる単語のみを考慮する場合と比較して、適切な頻出箇所を特定することができる、という効果を有する。
【0143】
(((6)))によれば、特定の単語が指定された場合と要約文自体が指定された場合とで同じ対応箇所を表示する場合と比較して、適切な対応箇所を表示させることができる、という効果を有する。
【0144】
(((7)))によれば、対応箇所がある要約文と、対応箇所がない要約文とを一見して把握することができる、という効果を有する。
【0145】
(((8)))によれば、対応箇所がない要約文が指定された場合であっても、予め定めた箇所を表示させることができる、という効果を有する。
【0146】
(((9)))によれば、複数の対応箇所を順番に把握することができる、という効果を有する。
【0147】
(((10)))によれば、複数の対応箇所の各々に対して、出現頻度及び原文全体における稀少度により表される指標値が最も高い単語を対応付けることができる、という効果を有する。
【0148】
(((11)))によれば、要約文との関連性が比較的低い頻出箇所を除外することができる、という効果を有する。
【0149】
(((12)))によれば、要約文の内容も考慮して、要約文との関連性が比較的低い頻出箇所を除外することができる、という効果を有する。
【符号の説明】
【0150】
10 要約処理装置
11 CPU
11A 原文取得部
11B 要約生成部
11C 要約取得部
11D 頻出箇所特定部
11E 表示制御部
12 ROM
13 RAM
14 I/O
15 記憶部
15A 要約処理プログラム
16 表示部
17 操作部
18 通信部
30 端末装置
100 要約処理システム