(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-06
(45)【発行日】2024-11-14
(54)【発明の名称】情報処理システム、プログラム及び情報処理方法
(51)【国際特許分類】
G06F 40/279 20200101AFI20241107BHJP
【FI】
G06F40/279
(21)【出願番号】P 2024143420
(22)【出願日】2024-08-23
【審査請求日】2024-08-27
【早期審査対象出願】
(73)【特許権者】
【識別番号】524318227
【氏名又は名称】Quantum Nexus株式会社
(74)【代理人】
【識別番号】100131842
【氏名又は名称】加島 広基
(74)【代理人】
【識別番号】100215267
【氏名又は名称】古屋 秀人
(74)【代理人】
【識別番号】100215555
【氏名又は名称】今井 貴裕
(74)【代理人】
【識別番号】100135530
【氏名又は名称】河野 智代
(72)【発明者】
【氏名】三津井 親彦
【審査官】成瀬 博之
(56)【参考文献】
【文献】特開2020-181387(JP,A)
【文献】特開2019-164504(JP,A)
【文献】特許第7471026(JP,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
G06F 16/00-16/958
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
テキストデータ
と共に、複数のトピックの生成を要求するプロンプトを生成モデルに入力することで、複数のトピックを取得する対話部と、
前記トピックをユーザに提示する提示部と、
前記トピックに対するユーザ操作に応じて得られた、前記トピックに対する編集指示を取得する編集指示取得部と、
を備え、
前記対話部は、前記編集指示に従い前記生成モデルに入力する入力データを生成し、前記入力データ
と、前記テキストデータと共に、要約生成を要求するプロンプトを前記生成モデルに入力することで、前記編集指示に係る前記トピックに対応する要約を取得
し、
前記入力データは、前記編集指示に応じた編集後のトピックを含む、情報処理システム。
【請求項2】
前記対話部はさらに、前記トピックに対するサブトピックの生成指示を前記生成モデルに入力することで前記サブトピックを取得し、
前記対話部は、
前記トピックと前記サブトピックとを入力データとし、前記入力データと、前記テキストデータと、
前記要約生成を要求するプロンプトと、を前記生成モデルに入力することにより、前記要約を取得する、
請求項1に記載の情報処理システム。
【請求項3】
前記対話部は
、前記トピックと、ユーザ操作に応じて得られたサブトピックと
を入力データとし、前記入力データと、前記テキストデータと、前記要約生成を要求するプロンプトと、を前記生成モデルに入力することにより、前記要約を取得する、
請求項1に記載の情報処理システム。
【請求項4】
前記編集指示は、前記サブトピックの修正指示を含み、
前記対話部は
、前記トピックと、修正後の前記サブトピックと、
を入力データとし、前記入力データと、前記テキストデータと、前記要約生成を要求するプロンプトと、を前記生成モデルに入力することにより、前記要約を取得する、
請求項2又は3に記載の情報処理システム。
【請求項5】
前記編集指示は、前記テキストデータに対する付加情報の追加指示を含み、
前記対話部は
、前記トピックと、追加された前記付加情報と、
を入力データとし、前記入力データと、前記テキストデータと、前記要約生成を要求するプロンプトと、を前記生成モデルに入力することにより、前記要約を取得する、
請求項1に記載の情報処理システム。
【請求項6】
前記編集指示は、前記付加情報の修正指示を含み、
前記対話部は
、前記トピックと、修正後の前記付加情報と、
を入力データとし、前記入力データと、前記テキストデータと、前記要約生成を要求するプロンプトと、を前記生成モデルに入力することにより、前記要約を取得する、
請求項5に記載の情報処理システム。
【請求項7】
前記対話部は、前記テキストデータ
と共に、要約生成を要求するプロンプトを生成モデルに入力することで、前記テキストデータに対する全体要約を生成し、
前記入力データと、前記テキストデータと、前記全体要約と、前記トピックに対応する要約と、
前記要約生成を要求するプロンプトと、を生成モデルに入力することで、修正された、前記トピックに対応する要約を取得する、請求項1に記載の情報処理システム。
【請求項8】
前記対話部は、前記要約
と共に、文書構造の生成を要求するプロンプトを生成モデルに入力することで、前記テキストデータの文書構造を示す構造図を取得する、請求項1に記載の情報処理システム。
【請求項9】
前記編集指示取得部は、前記文書構造に対する修正指示を取得し、
前記対話部は、前記修正指示に従い生成モデルに入力する入力データを生成し、前記入力データと
前記テキストデータと共に、文書構造の生成を要求するプロンプトを生成モデルに入力することで、前記トピックに対応する要約を取得
し、
前記入力データは、前記修正指示に応じた修正後の文書構造と、前記トピックとを、含む、
請求項8に記載の情報処理システム。
【請求項10】
前記要約を前記テキストデータと異なる言語に翻訳する翻訳部をさらに備える、請求項1に記載の情報処理システム。
【請求項11】
音声認識又は文字認識により前記テキストデータを取得する認識部をさらに備える、
請求項1に記載の情報処理システム。
【請求項12】
コンピュータを、対話部、提示部及び編集指示取得部として機能させるプログラムであって、
前記対話部は、テキストデータ
と共に、複数のトピックの生成を要求するプロンプトを生成モデルに入力することで、複数のトピックを取得し、
前記提示部は、前記トピックをユーザに提示し、
前記編集指示取得部は、前記トピックに対するユーザ操作に応じて得られた、前記トピックに対する編集指示を取得し、
前記対話部は、前記編集指示に従い前記生成モデルに入力する入力データを生成し、前記入力データ
と、前記テキストデータと共に、要約生成を要求するプロンプトを前記生成モデルに入力することで、前記編集指示に係る前記トピックに対応する要約を取得し、
前記入力データは、前記編集指示に応じた編集後のトピックを含む、プログラム。
【請求項13】
制御部を有するコンピュータにより行われる情報処理方法であって、
前記制御部が、テキストデータ
と共に、複数のトピックの生成を要求するプロンプトを生成モデルに入力することで、複数のトピックを取得する工程と、
前記制御部が、前記トピックをユーザに提示する工程と、
前制御部が、前記トピックに対するユーザ操作に応じて得られた、前記トピックに対する編集指示を取得する工程と、
前記制御部が、前記編集指示に従い前記生成モデルに入力する入力データを生成し、前記入力データ
と、前記テキストデータと共に、要約生成を要求するプロンプトを前記生成モデルに入力することで、前記編集指示に係る前記トピックに対応する要約を取得する工程と
を含
み、
前記入力データは、前記編集指示に応じた編集後のトピックを含む、
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、プログラム及び情報処理方法に関する。
【背景技術】
【0002】
従来、テキストデータから要約を生成する技術が知られている。特許文献1には、クライアントユーザから受け付けた所定の制約条件に従って制約された要約データの候補データを生成し、さらに候補データに基づいて更新された制約条件に基づいて要約データの確定データを生成する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、会議の音声データに対する音声認識により得られたテキストデータのように構造化されていないテキストデータから、ユーザに適した要約を生成するのは難しいという問題があった。
【0005】
本発明はこのような点を考慮してなされたものであり、テキストデータからユーザに適した要約を取得することができる情報処理システム、プログラム及び情報処理方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の情報処理システムは、
テキストデータを生成モデルに入力することで、複数のトピックを取得する対話部と、
前記トピックをユーザに提示する提示部と、
前記トピックに対するユーザ操作に応じて得られた、前記トピックに対する編集指示を取得する編集指示取得部と、
を備え、
前記対話部は、前記編集指示に従い前記生成モデルに入力する入力データを生成し、前記入力データを前記生成モデルに入力することで、前記編集指示に係る前記トピックに対応する要約を取得することを特徴とする。
【0007】
本発明の情報処理システムは、
前記対話部はさらに、前記トピックに対するサブトピックの生成指示を前記生成モデルに入力することで前記サブトピックを取得し、
前記対話部は、前記テキストデータと、前記トピックと、前記サブトピックと、を前記生成モデルに入力することにより、前記要約を取得してもよい。
【0008】
本発明の情報処理システムは、
前記対話部は、前記テキストデータと、前記トピックと、ユーザ操作に応じて得られたサブトピックと、を前記生成モデルに入力することにより、前記要約を取得してもよい。
【0009】
本発明の情報処理システムは、
前記編集指示は、前記サブトピックの修正指示を含み、
前記対話部は、前記テキストデータと、前記トピックと、修正後の前記サブトピックと、を前記生成モデルに入力することにより、前記要約を取得してもよい。
【0010】
本発明の情報処理システムは、
前記編集指示は、前記テキストデータに対する付加情報の追加指示を含み、
前記対話部は、前記テキストデータと、前記トピックと、追加された前記付加情報と、を前記生成モデルに入力することにより、前記要約を取得してもよい。
【0011】
本発明の情報処理システムは、
前記編集指示は、前記付加情報の修正指示を含み、
前記対話部は、前記テキストデータと、前記トピックと、修正後の前記付加情報と、を前記生成モデルに入力することにより、前記要約を取得してもよい。
【0012】
本発明の情報処理システムは、
前記対話部は、前記テキストデータを生成モデルに入力することで、前記テキストデータに対する全体要約を生成し、前記全体要約と、前記トピックに対応する要約と、を生成モデルに入力することで、修正された、前記トピックに対応する要約を取得してもよい。
【0013】
本発明の情報処理システムは、
前記対話部は、前記要約を生成モデルに入力することで、前記テキストデータの文書構造を示す構造図を取得してもよい。
【0014】
本発明の情報処理システムは、
前記要約を前記テキストデータと異なる言語に翻訳する翻訳部をさらに備えてもよい。
【0015】
本発明の情報処理システムは、
音声認識又は文字認識により前記テキストデータを取得する認識部をさらに備えてもよい。
【0016】
本発明のプログラムは、
コンピュータを、対話部、提示部及び編集指示取得部として機能させるプログラムであって、
前記対話部は、テキストデータを生成モデルに入力することで、複数のトピックを取得し、
前記提示部は、前記トピックをユーザに提示し、
前記編集指示取得部は、前記トピックに対するユーザ操作に応じて得られた、前記トピックに対する編集指示を取得し、
前記対話部は、前記編集指示に従い前記生成モデルに入力する入力データを生成し、前記入力データを前記生成モデルに入力することで、前記編集指示に係る前記トピックに対応する要約を取得することを特徴とする。
【0017】
本発明の情報処理方法は、
制御部を有するコンピュータにより行われる情報処理方法であって、
前記制御部が、テキストデータを生成モデルに入力することで、複数のトピックを取得する工程と、
前記制御部が、前記トピックをユーザに提示する工程と、
前制御部が、前記トピックに対するユーザ操作に応じて得られた、前記トピックに対する編集指示を取得する工程と、
前記制御部が、前記編集指示に従い前記生成モデルに入力する入力データを生成し、前記入力データを前記生成モデルに入力することで、前記編集指示に係る前記トピックに対応する要約を取得する工程と
を含むことを特徴とする。
【発明の効果】
【0018】
本発明の情報処理システム、プログラム及びおよび情報処理方法によれば、テキストデータからユーザに適した要約を取得することができる。
【図面の簡単な説明】
【0019】
【
図6】修正後のトピック一覧の表示例を示す図である。
【発明を実施するための形態】
【0020】
以下、図面を参照して本発明の実施形態について説明する。
図1乃至
図10は、本実施形態に係るプログラム、情報処理システム及び情報処理方法等を示す図である。
【0021】
図1は、本実施形態に係る要約生成システム1の全体構成図である。要約生成システム1は、生成モデルを用いて、入力されたテキストデータに対する要約を生成する。要約生成システム1は、要約生成装置10と、生成モデルサーバ装置20と、ユーザ装置30と、を備えている。要約生成装置10は、情報処理システムの一例である。要約生成装置10と、生成モデルサーバ装置20と、ユーザ装置30と、は、インターネット等の通信ネットワーク2を介して互いに通信可能に接続されている。
【0022】
要約生成装置10は、コンピュータ等であり生成モデルサーバ装置20に格納されている生成モデル210との対話を利用して、テキストデータから要約を生成する。要約生成装置10は、コンピュータ等により構成され、制御部100と、記憶部110と、通信部120と、を備えている。
【0023】
制御部100は、CPU(中央演算装置)等のプロセッサを含み、要約生成装置10の動作を制御する。記憶部110は、例えばHDD(Hard Disk Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)およびSSD(Solid State Drive)などを含む。また、記憶部110は、要約生成装置10に内蔵されるものに限定されることはなく、要約生成装置10に着脱自在に装着可能な記憶媒体(例えば、USBメモリ)等であってもよい。本実施形態では、記憶部110は、制御部100により実行される各種プログラムや、各種データを記憶する。
【0024】
通信部120は、無線または通信により、外部装置との間で通信を行う通信インターフェースを含む。制御部100は、通信部120を介して生成モデルサーバ装置20やユーザ装置30との間でデータの送受信を行う。
【0025】
生成モデルサーバ装置20は、コンピュータ等である。生成モデルサーバ装置20には、質問文を入力、回答文を出力とする生成モデル210が記憶されている。生成モデル210は、機械学習により生成された学習モデルであり、通信ネットワーク2を介してアクセスしてきたユーザからの質問文(プロンプト)に応じた回答文を生成する。生成モデルは、Generative Pre-trained Transformer又はこれに基づく言語モデルであればよい。生成モデル210としては、例えば、OpenAIによるChatGPT、GPT-3、GPT-4、EleutherAIによるGPT-J等が挙げられる。
【0026】
生成モデルサーバ装置20は、大規模な自然言語処理タスクに対して使用され、例えば、機械翻訳、文章生成、文書分類、質問応答等を自動で行う。生成モデル210は、膨大な量のデータを学習し、その後、新しい入力に対して予測を行う。生成モデルサーバ装置20は、生成モデル210をホストし、リクエストに応じて生成モデル210を呼び出し、結果を返す。本実施形態に係る生成モデルサーバ装置20は、要約生成装置10からプロンプトを受け付けると演算処理を行うことにより、回答文を生成する。そして、生成された回答文は、要約生成装置10に送信される。
【0027】
ユーザ装置30は、情報処理装置である。ユーザ装置30は、またスマートフォン、PCタブレット等の携帯型の装置であってもよい。制御部310と、記憶部320と、通信部330と、操作部340と、表示部350と、を備えている。制御部310、記憶部320及び通信部330は、それぞれ要約生成装置10の制御部100、記憶部110及び通信部120と同様である。通信部330は、無線又は有線により外部装置との通信を行う通信インターフェースを含む。操作部340は、ユーザ操作を受け付ける。操作部340としては、キーボードやマウスなどが挙げられる。表示部350は、例えばモニタ等であり、様々な画面を表示する。操作部340と表示部350は、タッチパネルとして一体に設けられてもよい。
【0028】
本実施形態においては、ユーザ装置30は、要約生成のためのアプリケーションがインストールされているものとする。このアプリケーションにより、要約生成装置10との情報の送受信が行われるものとする。
【0029】
次に、要約生成装置10の制御部100の構成について説明する。制御部100は、記憶部110に記憶されているプログラムを実行することにより、認識部101、対話部102、提示部103、編集指示取得部104、誤記登録部105、構造図取得部106及び翻訳部107として機能する。なお、以下において、認識部101、対話部102、提示部103、編集指示取得部104、誤記登録部105、構造図取得部106及び翻訳部107が行うこととして記載する処理は、制御部100がプログラムを実行することにより行う処理である。
【0030】
認識部101は、要約生成の対象となる音声データを、通信部120を介してユーザ装置30から取得する。音声データとしては、例えば、ある研究課題についての議論や研究発表、企業における会議に関するもの等が挙げられる。認識部101は、音声認識処理により音声データからテキストデータを得る。なお、認識部101は、音声を含む動画データを取得し、これを音声データに変換した上で音声認識を行ってもよい。
【0031】
対話部102は、通信部120を介し生成モデルサーバ装置20に対して、プロンプトを送信することで、生成モデルサーバ装置20から、生成モデル210により得られた回答文を取得する。対話部102は、例えば、テキストデータと共に、テキストデータにおいて示される内容について、複数のトピックと、各トピックに対応する要約の生成を要求するプロンプトを生成、送信する。これにより、対話部102は、複数のトピックと、トピックに対応する要約と、を取得する。
【0032】
提示部103は、生成モデル210により得られたトピック及び要約をユーザに提示する。具体的には、提示部103は、通信部120を介してユーザ装置30にトピック及び要約を送信し、表示部350に表示させる。
【0033】
編集指示取得部104は、通信部120を介してユーザ装置30から編集指示を取得する。ここで、編集指示は、トピックに含まれる誤記の修正等の指示である。
【0034】
誤記登録部105は、テキストデータに含まれる誤記と、当該誤記に対応した正しい表記とを、記憶部110に記憶された置換テーブルに登録する。構造図取得部106は、テキストデータの要約に基づいて、テキストデータで示される文書の構造を示す構造図を取得する。翻訳部107は、トピック及び要約を翻訳する。なお、各部の処理については、後に詳述する。
【0035】
図2は、要約生成装置10による要約生成処理を示すフローチャートである。ステップS100において、認識部101は、ユーザ装置30から音声データを取得する。次に、ステップS102において、認識部101は、取得した音声データに対する音声認識を行うことによりテキストデータを取得する。
図3は、テキストデータの一例を示す図である。
図3に示すテキストデータは、音声データに対する音声認識により得られたテキストデータであり、「鈴木宮浦カップリング反応」の説明を録音した音声データに対応している。本データについては、下記サイトを参照することができる。
https://www.youtube.com/watch?v=MiEqmtm3yRs
音声認識により得られたテキストデータにおいては、漢字への変換ミス等誤記が含まれ得る。
図3に示す例においては、例えば、正しくは、「鈴木宮浦カップリング」であるところ、「スズキミヤウラカップリング」とカタカナ表記で示されている。また、正しくは「鈴木章先生」であるところ、「鈴木明先生」と表記されている。
【0036】
さらに、誤記を正しい表記に変更する置換テーブルが記憶部110に記憶されているおり、認識部101は、置換テーブルを利用することで、テキストデータにおいて誤記の修正を行う。置換テーブルは、例えば、ユーザにより生成され、ユーザ装置30から要約生成装置10に送信され、記憶部110に記憶されるものとする。
【0037】
次に、ステップS104において、対話部102は、ステップS100において得られたテキストデータと共に、複数のトピックの生成と、各トピックに対する要約の生成と、を要求するプロンプトを生成する。そして、対話部102は、このプロンプトを、通信部120を介して生成モデルサーバ装置20に送信する。対話部102は、通信部120を介して、生成モデルサーバ装置20から複数のトピックと、各トピックに対応する要約と、を取得する。以下、このトピック及び要約をそれぞれ1次トピック及び1次要約と称する。対話部102は、例えば、10個のトピックの生成を要求する。さらに、対話部102は、プロンプトにおいて、トピックとして得られる文字数を制限してもよい。これにより、ユーザの所望の文字数のトピックを得ることができる。
【0038】
図3に示すテキストデータからは、例えば
図4に示す10個の1次トピックが得られる。さらに、
図5に示すように、各1次トピックに対応した1次要約が得られる。
図5に示す1次要約においては、「鈴木明先生」といった誤記が含まれている。また、「最初の論文はあまり知られていない雑誌に掲載された。」と記載されており、雑誌の情報が不足している。このように、初回生成された要約、すなわち1次要約には誤記が含まれていたり、情報が不足していたりする。
【0039】
説明を
図2に戻す。ステップS104の処理の後、ステップS106において、提示部103は、ユーザに複数の1次トピックと、各1次トピックに対応する1次要約と、を提示する。具体的には、提示部103は、ステップS104において取得された複数の1次トピックと、各1次トピックに対応する1次要約と、を通信部120を介してユーザ装置30に送信する。ユーザ装置30では、制御部310は、通信部330を介して複数の1次トピックと、各1次トピックに対応する1次要約と、を受信すると、これを表示部350に表示させる。表示部350には、例えば、
図4に示すトピック一覧と、
図5に示す要約一覧と、が表示される。これにより、ユーザは、複数の1次トピックと共に、各1次トピックに対応した1次要約を確認することができる。
【0040】
ユーザは、表示された1次トピックを修正したい場合には、操作部340の操作により、表示された1次トピックを修正することができる。例えば、
図4に示すトピック一覧の画面において、各1次トピックは編集可能に表示され、ユーザは、トピック一覧の画面において、1次トピックの文字列の追加や修正を行うことができる。
【0041】
図6は、ユーザ操作に応じて修正された後のトピック一覧の表示例を示している。
図6の例では、例えば、「スズキミヤウラカップリング」は「鈴木・宮浦カップリング」に修正されている。また、
図4に示す「4.官能基許容性が高い」、「5.水中でも反応可能」、「6.ケミカルバイオロジーへの応用」は、「4.反応スコープ」としてまとめられている。
【0042】
さらに、トピックに対する追加情報としてサブトピックが追加されてもよい。
図6の例では、サブトピックは括弧書きで示されている。例えば、「鈴木・宮浦カップリングの反応機構」のトピックに対応した要約において「パラジウム触媒の価数の変化」に特に言及して欲しい場合には、
図6に示すように、「パラジウム触媒の価数の変化」をサブトピックとして追加することができる。
【0043】
さらに、ユーザは、要約対象となるテキストデータに対して付加情報を与えることもできる。例えば、「日本人の化学者である鈴木章教授と宮浦憲夫教授によって発見された鈴木・宮浦カップリングについてYou Tube(登録商標)にて紹介されています。」といった付加情報が与えられる。なお、付加情報は、テキストデータ全体に対して付加的に追加される情報である。付加情報としては、テキストデータにより示される内容や、テキストデータの元となる音声データにおける話者の情報、テキストデータに対応する音声データの生成時期等が挙げられる。
【0044】
ユーザは、上記のように、必要に応じて、トピックの修正(追加及び削除を含む)、サブトピックの追加、付加情報の追加を行うことができる。また、後述するように、ユーザ操作に応じたトピックの編集を繰り返し行うことが可能であり、これに応じて、ユーザは、追加されたサブトピックや付加情報を修正することも可能である。ユーザは、このように、適宜トピック、サブトピック、及び付加情報それぞれの修正(追加及び削除を含む)を行った上で、操作部340を操作することで実行指示を入力する。これにより、ユーザ操作に応じて、サブトピックの追加、修正指示、付加情報の追加、修正指示等を含む編集指示がユーザ装置30から要約生成装置10へ送信される。
【0045】
説明を
図2に戻す。ステップS106の処理の後、要約生成装置10の制御部100は、ユーザ装置30から編集指示を受信すると(ステップS108でY)、処理をステップS110へ進める。ステップS110において、対話部102は、編集指示に従い、生成モデル210に入力する入力データを生成する。例えば、対話部102は、編集指示がトピックの修正の指示である場合には、編集指示に応じた修正後のトピックを入力データとして生成する。また、対話部102は、編集指示がサブトピックの追加の指示である場合には、トピックと、追加されるサブトピックと、を入力データとして生成する。また、対話部102は、編集指示が付加情報の追加の指示である場合には、トピックと、追加される付加情報と、を入力データとして生成する。
【0046】
図6は、トピックの修正と、サブトピックの追加の説明図である。例えば、
図4に示す10個の1次トピックは、
図6に示す9個のトピックに修正される。以下、1次トピックの修正後のトピックを2次トピックと称する。このように、トピックの数が変更されてもよい。さらに、
図6に示す例では、トピックの1、6、9には、サブトピックが追加されている。
【0047】
次に、ステップS112において、誤記登録部105は、編集指示に誤記の修正が含まれる場合に、誤記と正しい表記とを対応付けて置換テーブルに登録する。
図6に示すように、「スズキミヤウラ」が「鈴木・宮浦」に修正された場合には、「スズキミヤウラ」及び「鈴木・宮浦」がそれぞれ誤記及び正しい表記として置換テーブルに登録される。
図7は、置換テーブル400の一例である。置換テーブル400において、誤記と正しい表記とが対応付けて格納されている。
【0048】
図2において、ステップS112の処理の後、ステップS114において、対話部102は、テキストデータと、入力データと、要約生成を要求するプロンプトと、を、通信部120を介して生成モデルサーバ装置20に送信する。そして、対話部102は、通信部120を介して生成モデルサーバ装置20から、各2次トピックに対応する要約を取得する。なお、以下においては、ステップS114で送信される入力データに含まれるトピックを2次トピックと称し、2次トピックに対応して得られた要約を2次要約と称する。
【0049】
次に、ステップS116において、提示部103は、ユーザに複数の2次トピックと、各2次トピックに対応する2次要約とを提示する。本処理は、ステップS106の処理と同様である。これにより、ユーザは、表示部350の表示内容から、修正されたトピック(2次トピック)やサブトピック、付加情報に応じて修正された要約(2次要約)を確認することができる。
【0050】
このとき、表示部350には、例えば
図6に示すように2次トピックが表示される。さらに、表示部350には、
図8に示すように、
図6に示す2次トピックに対応した2次要約が表示される。
図8に示されるように、2次要約においては、例えば、「スズキミヤウラカップリング」は、「鈴木・宮浦カップリング」に修正されている。また、最初の論文については、「Tetrahedron Letters誌」と詳細が追加されている。
【0051】
その後、制御部100は、処理をステップS108へ進める。ユーザは、希望に応じて、再度トピックの修正等を行うことができる。このように、ステップS110~ステップS116の処理を繰り返すことができる。なお、引き続きステップS110~ステップ116が繰り返される場合には、3次トピックと3次要約が生成され、続いて4次トピックと4次要約が生成される、というように、次数が順次加算されたトピックと要約が得られる。
【0052】
なお、他の例としては、トピック及び要約が修正された場合には、音声認識から再度実行されるものとしてもよい。
【0053】
また、ステップS108において、ユーザが編集を希望しない場合、すなわち編集指示を受信しない場合には(ステップS108でN)、制御部100は、処理をステップS118へ進める。ステップS118において、対話部102は、最終的に得られたトピック及び要約(例えば2次トピック及び2次要約)を確定トピック及び確定要約とする。そして、対話部102は、確定要約と共に、文書構造の生成を要求するプロンプトを生成モデルサーバ装置20に送信することで、文書構造に対応したトピック間の関係情報を取得する。次に、ステップS120において、構造図取得部106は、関係情報に基づいて、テキストデータの文書構造を示す構造図を取得する。
【0054】
図9は、関係情報の一例を示す図である。このように、関係情報は、Markdown形式で表現されたデータであってもよい。さらに、
図10は、構造図の一例である。このように、構造図は、Mermaid図であってもよい。ステップS122において、提示部103は、この構造図をユーザに提示する。具体的には、提示部103は、構造図をユーザ装置30に送信し、表示部350に表示させる。これにより、ユーザは、各トピック間の関係を視覚的に把握することができる。
【0055】
なお、他の例としては、対話部102は、確定要約及び文書構造の生成を要求するプロンプトと共に、テキスト及び確定トピックを生成モデルサーバ装置20に送信することで、これらに基づいた関係情報を取得してもよい。
【0056】
さらに、ステップS124において、翻訳部107は、ユーザ操作に応じた指示に従い、適宜、修正後のトピック及び要約を他言語に翻訳し、翻訳されたトピック及び要約をユーザに提示する。
【0057】
以上のように、本実施形態の要約生成システム1によれば、テキストデータからトピックを生成し、ユーザ操作に応じてトピックの編集を行った上で、トピック毎の要約を取得することができる。これにより、ユーザに適した要約を取得することができる。
【0058】
なお、テキストデータからトピックを抽出すると共に要約を生成した場合には、ユーザに適した要約、対象のテキストデータに対して必要十分な情報を含んだ要約を取得することができない。また、表記揺れや要約の誤りなどが含まれる場合もある。これに対し、上記のように、本実施形態の要約生成システム1においては、ユーザに適した要約を取得することができる。さらに、専門的な内容を示すテキストデータに対しても、適切な専門用語を用いた要約を生成することができる。
【0059】
さらに、このように、ユーザに適した要約、必要十分な情報を含んだ要約を取得することができるため、この要約を用いることで、精度の高い構造図を得ることができる。また、この要約を他言語に翻訳することができる。したがって、異なる言語のユーザ間での情報共有を容易にすることができる。
【0060】
以上の実施形態は本発明を実施するための一例であり、他にも種々の実施形態を採用可能である。例えばある変形例を他の変形例に適用するなど、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。例えば、上述の実施形態の一部の構成が省略されてもよいし、処理の順序が変動または省略されてもよい。
【0061】
そうした第1の変形例について説明する。本実施形態の要約生成装置は、テキストデータの要約を生成する情報処理システムの一例であるが、他の例としては、情報処理システムは、複数の装置により実現されてもよい。すなわち、要約生成装置の一部の機能は第1の装置により実現され、要約処理装置のその他の機能は第2の装置により実現されてもよい。また、要約生成装置の機能は、ユーザ装置30により実現されてもよい。この場合には、ユーザ装置30は、生成モデルサーバ装置20と直接対話を行うことにより、要約を取得する。
【0062】
第2の変形例としては、テキストデータにより示される内容は、実施形態に限定されるものではなく、複数人が参加した会議の議事録データ、会話内容を示すデータ等であってもよい。また、テキストデータは、音声データから変換されたものに限定されるものではなく、例えば紙等の記録媒体に印字された文字からOCR(Optical Character Recognition:光学文字認識)により得られたテキストデータであってもよい。この場合には、要約生成装置10は、OCRを備えていてもよい。また、他の例としては、テキストデータは、文字と画像とを含むデータから生成モデルに基づいて得られたテキストデータであってもよい。また、他の例としては、テキストデータは、テキストデータとして生成されたものであってもよく、例えば、小説、物語、髄筆、ある対象についての感想や意見等であってもよい。このように、テキストデータは、何らかの内容を示す文書データであればよい。
【0063】
さらに、テキストデータは、プレゼンテーションに対応するものであってもよい。この場合、対話部102は、生成モデル210との対話により、プレゼンテーションの要約を取得することができる。さらに、対話部102は、これに加えて、プレゼンテーションにおいてより強調すべき点、表現を修正すべき点等のアドバイスを取得することができる。これにより、プレゼンテーションの質の向上に寄与することができる。
【0064】
第3の変形例としては、置換テーブルは、ユーザ毎に生成、管理されることとしてもよい。この場合、同一のユーザから提供された音声データに対する音声認識処理においては、当該ユーザに対応する置換テーブルが参照されるものとする。これにより、音声認識の精度を向上させることができる。また、他の例としては、置換テーブルは、ユーザが所属する部署や企業等、ユーザの属性毎に生成、管理されてもよい。この場合には、同一の属性のユーザから提供された音声認識処理においては、当該属性に対応する対応テーブルが参照されるものとする。なお、音声認識処理に限らず、OCRにおいても同様である。
【0065】
第4の変形例としては、要約生成装置10の対話部102は、複数の異なる生成モデルを利用して、トピックや要約を取得してもよい。この場合には、生成モデルサーバ装置20は複数の生成モデルを備え、要約生成装置10は、これらを利用してもよい。また、他の例としては、生成モデルサーバ装置20は、複数の生成モデルサーバ装置と通信可能であって、これら複数の生成モデルサーバ装置それぞれが備える生成モデルを利用してもよい。
【0066】
第5の変形例としては、要約生成装置10は、まず第1の数のトピックを取得し、第1の数のトピックを利用して、第1の数よりも少ない第2の数のトピックを取得するようにしてもよい。
【0067】
第6の変形例としては、要約生成装置10は、生成モデルを用いて、1次トピックを生成するとともに、各1次トピックに対応する1又は2以上のサブトピックを生成し、1次トピックと共にユーザに提示することとしてもよい。この場合には、ユーザ操作に応じて、1次トピックだけでなく、サブトピックも適宜修正されてもよい。これにより、サブトピックを考慮した要約を生成することができる。さらに、生成されたサブトピックは、ユーザ操作に応じて、追加、修正及び削除がなされてもよい。
【0068】
第7の変形例としては、提示部103は、
図9に示す関係情報又は
図10に示す構造図をユーザに提示してもよい。そして、制御部100は、ユーザ操作に応じて関係情報又は構造図の修正指示を受け付けてもよい。この場合には、修正指示を反映したMermaid図を生成することができる。さらに、この場合において、対話部102は、修正後の関係情報と、トピックと、を入力データとして作成する。そして、対話部102は、テキストデータ、当該入力データと共に要約生成のプロンプトを生成モデルサーバ装置20に送信することで、修正指示が反映された要約を得ることができる。
【0069】
以上のような構成からなる本実施形態の情報処理システム、プログラム及び情報処理方法によれば、情報処理システムは、テキストデータを生成モデル210に入力することで、複数のトピックを取得する対話部102と、トピックをユーザに提示する提示部103と、トピックに対するユーザ操作に応じて得られた、トピックに対する編集指示を取得する編集指示取得部104と、を備える。そして、対話部102は、編集指示に従い生成モデル210に入力する入力データを生成し、入力データを生成モデル210に入力することで、編集指示に係るピックに対応する要約を取得する。これにより、テキストデータからユーザに適した要約を取得することができる。
【0070】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、対話部102はさらに、トピックに対するサブトピックの生成指示を生成モデルに入力することでサブトピックを取得し、対話部102は、テキストデータと、トピックと、サブトピックと、を生成モデルに入力することにより、前記要約を取得してもよい。これにより、サブトピックが考慮された要約を取得することができる。
【0071】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、対話部102は、テキストデータと、トピックと、ユーザ操作に応じて得られたサブトピックと、を生成モデルに入力することにより、要約を取得してもよい。これにより、ユーザに適した要約を取得することができる。
【0072】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、編集指示は、トピックに対するサブトピックの修正指示を含み、対話部102は、テキストデータと、トピックと、修正後のサブトピックと、を生成モデルに入力することにより、要約を取得してもよい。これにより、サブトピックが考慮された要約を取得することができる。
【0073】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、編集指示は、テキストデータに対する付加情報の追加指示を含み、対話部102は、テキストデータと、トピックと、追加された付加情報と、を生成モデルに入力することにより、要約を取得してもよい。これにより、付加情報が考慮された要約を取得することができる。
【0074】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、編集指示は、付加情報の修正指示を含み、対話部102は、テキストデータと、トピックと、修正後の付加情報と、を前成モデルに入力することにより、要約を生成してもよい。これにより、よりユーザに適した要約を取得することができる。
【0075】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、対話部102は、テキストデータを生成モデルに入力することで、テキストデータに対する全体要約を生成し、全体要約と、トピックに対応する要約と、を生成モデルに入力することで、修正された、トピックに対応する要約を取得してもよい。これにより、よりユーザに適した要約を取得することができる。
【0076】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、対話部102は、要約を生成モデルに入力することで、テキストデータの文書構造を示す構造図を取得してもよい。これにより、テキストデータに対応した文書の構造図を取得することができる。
【0077】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、情報処理システムは、要約をテキストデータと異なる言語に翻訳する翻訳部107をさらに備えてもよい。これにより、他の言語での要約を取得することができる。
【0078】
また、本実施形態の情報処理システム、プログラム及び情報処理方法においては、情報処理システムは、音声認識又は文字認識によりテキストデータを取得する認識部101をさらに備えてもよい。これにより、音声認識及び文字認識により得られたテキストデータから要約を取得することができる。
【符号の説明】
【0079】
1 要約生成システム
10 要約生成装置
20 生成モデル鯖装置
30 ユーザ装置
100 制御部
101 認識部
102 対話部
103 提示部
104 編集指示取得部
105 誤記登録部
106 構造図取得部
107 翻訳部
110 記憶部
120 通信部
210 生成モデル
310 制御部
320 記憶部
330 通信部
340 操作部
350 表示部
【要約】
【課題】テキストデータからユーザに適した要約を取得することができる情報処理システム、プログラム及び情報処理方法を提供する。
【解決手段】テキストデータを生成モデル210に入力することで、複数のトピックを取得する対話部102と、トピックをユーザに提示する提示部103と、トピックに対するユーザ操作に応じて得られた、トピックに対する編集指示を取得する編集指示取得部104と、を備え、対話部102は、編集指示に従い生成モデル210に入力する入力データを生成し、入力データを生成モデルに入力することで、編集指示に係るトピックに対応する要約を取得する。
【選択図】
図1