IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

特開2024-158425要約システム、要約方法、及びプログラム
<>
  • 特開-要約システム、要約方法、及びプログラム 図1
  • 特開-要約システム、要約方法、及びプログラム 図2
  • 特開-要約システム、要約方法、及びプログラム 図3
  • 特開-要約システム、要約方法、及びプログラム 図4
  • 特開-要約システム、要約方法、及びプログラム 図5
  • 特開-要約システム、要約方法、及びプログラム 図6
  • 特開-要約システム、要約方法、及びプログラム 図7
  • 特開-要約システム、要約方法、及びプログラム 図8
  • 特開-要約システム、要約方法、及びプログラム 図9
  • 特開-要約システム、要約方法、及びプログラム 図10
  • 特開-要約システム、要約方法、及びプログラム 図11
  • 特開-要約システム、要約方法、及びプログラム 図12
  • 特開-要約システム、要約方法、及びプログラム 図13
  • 特開-要約システム、要約方法、及びプログラム 図14
  • 特開-要約システム、要約方法、及びプログラム 図15
  • 特開-要約システム、要約方法、及びプログラム 図16
  • 特開-要約システム、要約方法、及びプログラム 図17
  • 特開-要約システム、要約方法、及びプログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024158425
(43)【公開日】2024-11-08
(54)【発明の名称】要約システム、要約方法、及びプログラム
(51)【国際特許分類】
   G06F 16/34 20190101AFI20241031BHJP
【FI】
G06F16/34
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2023073614
(22)【出願日】2023-04-27
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】色摩 健
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FB01
5B175GA04
5B175JC04
(57)【要約】
【課題】直近の要約文を確認することを容易にする要約システムを提供する。
【解決手段】要約システムは、音声を取得する取得部と、前記音声を複数のテキストに変換する変換部と、前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する生成部と、前記要約文をユーザに提供する提供部と、を有する。
【選択図】図3
【特許請求の範囲】
【請求項1】
音声を取得する取得部と、
前記音声を複数のテキストに変換する変換部と、
前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する生成部と、
前記要約文をユーザに提供する提供部と、
を有する、要約システム。
【請求項2】
前記要約実施条件は、前記変換部が変換した前記複数のテキストのサイズが第1の閾値に達したことを含む、請求項1に記載の要約システム。
【請求項3】
前記要約実施条件は、前記変換部が変換した前記複数のテキストから算出した類似度が第2の閾値を下回ることを含む、請求項1に記載の要約システム。
【請求項4】
前記要約文と、前記複数のテキストとを対応付けて記憶するデータベースを有し、
前記複数のテキストが変更された場合、前記要約文を更新する、
請求項1に記載の要約システム。
【請求項5】
前記提供部は、前記要約文と、前記要約文の生成に用いた前記複数のテキストとを、前記ユーザが利用する端末装置に配信し、
前記端末装置は、少なくとも前記要約文を表示する表示画面を表示部に表示させる表示制御部を有する、
請求項1乃至4のいずれか一項に記載の要約システム。
【請求項6】
前記表示画面は、前記要約文と対応付けて、前記要約文の生成に用いた前記複数のテキストを編集可能に表示する、請求項5に記載の要約システム。
【請求項7】
前記表示画面は、
前記要約文の抽出、複製、又は編集が可能である、請求項5に記載の要約システム。
【請求項8】
前記音声は、複数の端末装置の間でコンテンツデータを送受信する会議の音声であり、
前記表示制御部は、前記会議の会議画面に重畳させて、前記表示画面を表示させる、請求項5に記載の要約システム。
【請求項9】
前記複数のテキストが最初に変更されてから第1の時間を経過後、又は前記複数のテキストが最後に変更されてから第2の時間を経過後に、前記要約文を更新する、請求項4に記載の要約システム。
【請求項10】
前記要約文が手動で変更されている場合、前記要約文の更新を中止する、請求項4に記載の要約システム。
【請求項11】
ユーザによる所定の操作を受け付けた後に、前記要約文を更新する、請求項4に記載の要約システム。
【請求項12】
音声を取得する処理と、
前記音声を複数のテキストに変換する処理と、
前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する処理と、
前記要約文をユーザに提供する処理と、
をコンピュータが実行する、要約方法。
【請求項13】
音声を取得する処理と、
前記音声を複数のテキストに変換する処理と、
前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する処理と、
前記要約文をユーザに提供する処理と、
をコンピュータに実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、要約システム、要約方法、及びプログラムに関する。
【背景技術】
【0002】
音声データに基づいて要約文を生成する要約システムがある。例えば、会話中の複数の人物それぞれの発言内容をテキストに変換するとともに、変換されたテキストを選択可能に表示し、ユーザにより選択されたテキストで構成される要約文を作成する要約文作成装置が知られている(例えば、特許文献1参照)。
【発明の概要】
【発明が解決しようとする課題】
【0003】
特許文献1に開示された技術では、変換された複数のテキストから、要約の対象となるテキストをユーザが選択する手間がかかるため、直近の要約文を確認することには困難を伴っていた。
【0004】
本発明の一実施形態は、上記の問題点に鑑みてなされたものであって、直近の要約文を確認することを容易にする要約システムを提供する。
【課題を解決するための手段】
【0005】
上記の課題を解決するため、本発明の一実施形態に係る要約システムは、音声を取得する取得部と、前記音声を複数のテキストに変換する変換部と、前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する生成部と、前記要約文をユーザに提供する提供部と、を有する。
【発明の効果】
【0006】
本発明の一実施形態によれば、直近の要約文を確認することを容易にする要約システムを提供することができる。
【図面の簡単な説明】
【0007】
図1】一実施形態に係る要約システムのシステム構成の例を示す図である。
図2】一実施形態に係るコンピュータのハードウェア構成の例を示す図である。
図3】一実施形態に係る要約システムの機能構成の例を示す図である。
図4】一実施形態に係る要約システムのデータ構造について説明するための図である。
図5】一実施形態に係る要約処理の例を示すシーケンス図である。
図6】一実施形態に係る端末装置の表示画面の例を示す図(1)である。
図7】一実施形態に係る端末装置の表示画面の例を示す図(2)である。
図8】一実施形態に係る端末装置の表示画面の例を示す図(3)である。
図9】第1の実施形態に係る判断処理の例を示すフローチャートである。
図10】第1の実施形態に係る判断処理について説明するための図である。
図11】第2の実施形態に係る判断処理の例を示すフローチャートである。
図12】第2の実施形態に係る判断処理について説明するための図である。
図13】一実施形態に係る変更処理の例を示すシーケンス図である。
図14】一実施形態に係る再要約処理の例を示すシーケンス図(1)である。
図15】一実施形態に係る再要約処理について説明するための図(1)である。
図16】一実施形態に係る再要約処理について説明するための図(2)である。
図17】一実施形態に係る再要約処理の例を示すシーケンス図(2)である。
図18】一実施形態に係る再要約処理の例を示すシーケンス図(3)である。
【発明を実施するための形態】
【0008】
以下、本発明の実施形態(本実施形態)について、図面を参照しながら詳細に説明する。
【0009】
<システム構成>
図1は、一実施形態に係る要約システムのシステム構成の例を示す図である。要約システム1は、例えば、インターネット及びLAN(Local Area network)等の通信ネットワーク2に接続する、要約サーバ100及び複数の端末装置110a、110b、・・・等を含む。なお、以下の説明において、複数の端末装置110a、110b、・・・のうち、任意の端末装置を示す場合、「端末装置110」を用いる。また、図1に示した端末装置110の数は一例であり、端末装置110の数は2つ以上の他の数であってよい。
【0010】
要約システム1は、例えば、端末装置110を利用するユーザの会話を要約し、直近の要約文をユーザに提供するシステムである。例えば、要約システム1は、端末装置110aを利用するユーザが、他の端末装置110bを利用するユーザと、会議サーバ10を介して会議を行うウェブ会議の音声を要約し、要約した要約文を端末装置110a、110bに配信する。なお、会議サーバ10は、要約システム1の外部のサーバであってもよいし、要約システム1内部のサーバであってもよい。
【0011】
なお、要約システム1は、例えば、ユーザが対面で行う一般の会議等の会話の要約も可能である。ここでは、一例として、要約システム1が、ウェブ会議(以下、会議と呼ぶ)の音声を要約し、要約した要約文を、会議に参加する端末装置110に配信するものとして、以下の説明を行う。
【0012】
端末装置110は、ユーザが利用する、例えば、PC(Personal Computer)、タブレット端末、又はスマートフォン等の汎用の情報端末である。ただし、これに限られず、端末装置110は、例えば、ビデオ会議装置、又はIWB(Interactive White Board)等のウェブ会議の機能を有する電子機器であってもよい。ここで、IWBは、相互通信が可能な電子式の黒板機能を有する白板であり、電子黒板とも呼ばれる。ここでは、一例として、端末装置110が、汎用の情報端末であるものとして、以下の説明を行う。
【0013】
ウェブ会議に参加するユーザは、例えば、端末装置110にインストールされたウェブ会議用のアプリケーション、又はウェブブラウザ等を利用して、会議サーバ10が提供する会議用のアドレスにアクセスすることにより、ウェブ会議に参加する。
【0014】
会議サーバ10は、例えば、コンピュータの構成を有する情報処理装置、又は複数のコンピュータを含むシステムである。会議サーバ10は、複数の端末装置110の間で、音声を含むコンテンツデータを送受信するウェブ会議サービスを提供する。なお、本実施形態では、会議サーバ10が提供するウェブ会議サービスは、任意のウェブ会議サービスであってよい。
【0015】
要約サーバ100は、例えば、コンピュータの構成を有する情報処理装置、又は複数の情報処理装置を含むシステムである。要約サーバ100は、本実施形態に係る要約サービスを提供する。
【0016】
なお、図1に示した要約システム1のシステム構成は一例である。例えば、要約システム1は、要約サーバ100が、会議サーバ10の機能を備えていてもよい。また、要約システム1は、会議サーバ10を有していなくてもよい。
【0017】
(要約システムの処理の概要)
例えば、端末装置110aを利用するユーザが、会議サーバ10が提供するウェブ会議を利用して、端末装置110bを利用する他のユーザとウェブ会議(以下、単に会議と呼ぶ)を行うものとする。
【0018】
端末装置110a、110bは、要約システム1に対応するアプリケーションプログラム(以下、アプリと呼ぶ)を実行することにより、ユーザの音声を取得し、取得した音声(音声データ)を要約サーバ100に送信する。
【0019】
要約サーバ100は、端末装置110a、110bが送信する音声を取得し、取得した音声を複数のテキスト(テキストデータ)に変換する。また、要約サーバ100は、複数のテキストが所定の要約実施条件に満たしたときに、複数のテキストを要約した要約文を生成し、生成した要約文を端末装置110a、110bに配信する。
【0020】
ここで、要約実施条件は、一例として、要約サーバ100が変換した複数のテキストのサイズ(例えば、文字数等)が、第1の閾値に達したときである。別の一例として、要約実施条件は、要約システム1が変換した複数のテキストから算出した類似度が第2のしきい値を下回ったとき(話題が変わったとき)等である。
【0021】
端末装置110a、110bは、要約サーバ100から配信された要約文を、例えば、アプリの表示画面に表示してもよいし。会議の会議画面に重畳させて表示してもよい。
【0022】
例えば、特許文献1に示されるような従来の技術では、変換された複数のテキストから、要約の対象となるテキストをユーザが選択する手間がかかるため、例えば、会議中に、ユーザが直近の要約文を確認することには困難を伴っていた。
【0023】
一方、本実施形態に係る要約システム1は、テキスト化した複数のテキストが所定の要約実施条件を満たすたびに、自動的に要約文をユーザが利用する端末装置110a、110bに配信する。従って、本実施形態によれば、直近の要約文を確認することを容易にする要約システムを提供することができる。
【0024】
<ハードウェア構成>
(コンピュータのハードウェア構成)
要約サーバ100は、例えば、図2に示すようなコンピュータ200のハードウェア構成を有している。或いは、要約サーバ100は、複数のコンピュータ200によって構成される。また、端末装置110は、一例として、図3に示すようなコンピュータ200のハードウェア構成を有している。
【0025】
図2は、一実施形態に係るコンピュータのハードウェア構成の例を示す図である。コンピュータ200は、例えば、図2に示されるように、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、HD(Hard Disk)204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)207、ネットワークI/F208、キーボード209、ポインティングデバイス210、DVD-RW(Digital Versatile Disk Rewritable)ドライブ212、メディアI/F214、及びバスライン215等を備えている。
【0026】
また、コンピュータ200が端末装置110である場合、コンピュータ200は、マイク221、スピーカ222、音入出力I/F223、CMOS(Complementary Metal Oxide Semiconductor)センサ224、及び撮像素子I/F225等を、さらに備える。
【0027】
これらのうち、CPU201は、コンピュータ200全体の動作を制御する。ROM202は、例えば、IPL(Initial Program Loader)等のコンピュータ200の起動に用いられるプログラムを記憶する。RAM203は、例えば、CPU201のワークエリア等として使用される。HD204は、例えば、OS(Operating System)、アプリケーション、デバイスドライバ等のプログラムや、各種データを記憶する。HDDコントローラ205は、例えば、CPU201の制御に従ってHD204に対する各種データの読み出し又は書き込みを制御する。なお、HD204、及びHDDコントローラ205は、コンピュータ200が備えるストレージデバイスの一例である。
【0028】
ディスプレイ206は、例えば、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。なお、ディスプレイ206は、コンピュータ200の外部に設けられていてもよい。外部機器接続I/F207は、コンピュータ200に、様々な外部装置を接続するためのインタフェースである。ネットワークI/F208は、コンピュータ200を通信ネットワーク2に接続して、他の装置と通信するためのインタフェースである。
【0029】
キーボード209は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス210は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行なう入力手段の一種である。なお、キーボード209、及びポインティングデバイス210は、コンピュータ200の外部に設けられていてもよい。
【0030】
DVD-RWドライブ212は、着脱可能な記録媒体の一例としてのDVD-RW211に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RW211は、DVD-RWに限らず、他の着脱可能な記録媒体であってもよい。メディアI/F214は、フラッシュメモリ等のメディア213に対するデータの読み出し又は書き込み(記憶)を制御する。バスライン215は、上記の各構成要素を電気的に接続するためのアドレスバス、データバス及び各種の制御信号等を含む。
【0031】
マイク221は、音を電気信号に変える内蔵型の回路である。スピーカ222は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F223は、CPU201の制御に従ってマイク221及びスピーカ222との間で音信号の入出力を処理する回路である。
【0032】
CMOSセンサ224は、CPU201の制御に従って被写体(例えば自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、コンピュータ200は、CMOSセンサ224に代えて、CCD(Charge Coupled Device)センサ等の撮像手段を有していてもよい。撮像素子I/F225は、CMOSセンサ224の駆動を制御する回路である。
【0033】
なお、図2に示したコンピュータ200のハードウェア構成は一例であり、様々な変形、及び応用が可能である。例えば、要約サーバ100は、物理マシン(コンピュータ200)に限られず、仮想マシン上で動作するプログラム等によって実現されるもの等であってもよい。
【0034】
<機能構成>
続いて、要約システム1の機能構成について説明する。図3は、一実施形態に係る要約システムの機能構成の例を示す図である。
【0035】
(端末装置の機能構成)
端末装置110は、例えば、HD204等の記憶媒体に記憶した所定のプログラムをCPU201が実行することにより、通信部311、会議制御部312、音声送信部313、表示制御部314、及び操作受付部315等を実現している。なお、上記の各機能構成のうち、少なくとも一部は、ハードウェアによって実現されるものであってもよい。なお、図3において、端末装置110bは、端末装置110aと同様の機能構成を有しているものとする。
【0036】
通信部311は、例えば、ネットワークI/F208を用いて、端末装置110を通信ネットワーク2に接続して、会議サーバ10、要約サーバ100、及び他の端末装置110等の他の装置と通信する通信処理を実行する。
【0037】
会議制御部312は、例えば、通信部311を用いて会議サーバ10に接続し、会議音声を含むコンテンツデータの送受信を行う。また、会議制御部312は、音入出力I/F223を用いた会議音声の入出力、及びディスプレイ206を用いたコンテンツ画像(会議画像、又は共有画像等)の出力等を制御する。なお、会議制御部312が実行する処理は、一般的なウェブ会議と同様の処理であってよい。
【0038】
音声送信部313は、端末装置110を利用するユーザの音声を取得し、要約サーバ100に送信する音声送信処理を実行する。例えば、音声送信部313は、音入出力I/F223から、マイク221で取得した音声を取得し、取得した音声(音声データ)を要約サーバ100に送信する。これにより、要約サーバ100は、ウェブ会議に限られず、通常の会議等における会話等を要約することも可能である。
【0039】
なお、音声送信部313は、会議制御部312から、ユーザの音声を取得し、取得した音声を要約サーバ100に送信してもよい。
【0040】
表示制御部314は、後述する様々な表示画面を、例えば、ディスプレイ206等の表示部に表示する表示制御処理を実行する。操作受付部315は、ユーザ等による操作を受け付ける操作受付処理を実行する。例えば、操作受付部315は、表示制御部314が表示した表示画面に対するユーザの操作を受け付ける。
【0041】
(要約サーバの機能構成)
要約サーバ100は、例えば、HD204等の記憶媒体に記憶した所定のプログラムを1つ以上のコンピュータ200が実行することにより、通信部301、取得部302、変換部303、判断部304、生成部305、提供部306、及びDB(Database)307等を実現している。なお、上記の各機能構成のうち、少なくとも一部は、ハードウェアによって実現されるものであってもよい。
【0042】
また、要約サーバ100は、例えば、HD204、及びHDDコントローラ205等のストレージデバイスにより、記憶部308を実現している。
【0043】
通信部301は、例えば、ネットワークI/F208等を用いて、要約サーバ100を通信ネットワーク2に接続し、端末装置110等の他の装置と通信する通信処理を実行する。
【0044】
取得部302は、ユーザの音声を取得する取得処理を実行する。例えば、取得部302は、端末装置110の音声送信部313が、要約サーバ100に送信する、ユーザの音声(音声データ)を取得する。
【0045】
変換部303は、取得部302が取得した音声を複数のテキストに変換する変換処理を実行する。なお、音声を複数のテキストに変換する処理は、例えば、文字おこし、又はテキスト化等と呼ばれる場合がある。また、変換部303は、例えば、変換サーバ、文字おこしサーバ、又はテキスト化サーバ等によって実現されるものであってもよい。
【0046】
判断部304は、変換部303が変換した複数のテキストが、所定の要約実施条件を満たしたかを判断する判断処理を実行する。一例として、判断部304は、変換部303が変換した複数のテキストのサイズが、第1の閾値に達したか(要約実施条件の一例)を判断する。別の一例として、判断部304は、変換部303が変換した複数のテキストのサイズから算出した類似度が第2の閾値を下回ったか(要約実施条件の別の一例)を判断する。なお、判断部304は、複数のテキストが、所定の要約実施条件を満たしたかを判断する要約トリガサーバ等によって実現されるものであってもよい。
【0047】
生成部305は、判断部304が、変換部303が変換した複数のテキストが所定の要約実施条件を満たしたと判断したときに、当該複数のテキストを要約した要約文を生成する生成処理を実行する。なお、本実施形態では、生成部305が要約文を生成する方法について、特に限定しない。例えば、生成部305は、自然言語処理、及びAI(Artificial Intelligence)等を使って、文章を要約する公知のクラウドサービス等を利用して、複数のテキストを要約した要約文を生成してもよい。なお、生成部305は、文章を要約する要約サーバ等によって実現されるものであってもよい。
【0048】
なお、要約システム1は、生成部305に入力される複数のテキストをキューイングするキューイングサーバを、さらに有していてもよい。或いは、生成部305が、キューイングサーバの機能を有していてもよい。
【0049】
提供部306は、生成部305が生成した要約文をユーザに提供する提供処理を実行する。例えば、提供部306は、生成部305が生成した要約文を、ユーザが利用する端末装置110に送信する。好ましくは、提供部306は、生成部305が生成した要約文に加えて、生成部305が要約文の生成に用いた複数のテキストを、ユーザが利用する端末装置110に送信する。なお、提供部306は、例えば、Publish/Subscribeメッセージングサービスを提供するPub/Subサーバ等によって実現されるものであってもよい。
【0050】
DB307は、例えば、変換部303が変換した変換テキスト、生成部305が生成した要約文、及び会話情報等を記憶するデータベースである。
【0051】
図4は、一実施形態に係る要約システムのデータ構造について説明するための図である。要約システム1が管理するデータは、例えば、図4に示すような、会話情報400、要約文410、及び変換テキスト411a、411b、411c等を含む。なお、以下の説明において、変換テキスト411a、411b、411cのうち、任意の変換テキストを示す場合、「変換テキスト411」を用いる。
【0052】
図4に示すように、会話情報400、要約文410、及び変換テキスト411は、会話を識別する「会話ID」を有している。要約システム1は、この「会話ID」により、各データがどの会話に関するデータであるのかを区別することができる。また、要約システム1は、この「会話ID」ごとに、要約文410、及び変換テキスト411を作成する。
【0053】
また、図4に示すように、要約文410、及び変換テキスト411は、要約文を識別する「要約ID」を有している。要約システム1は、この「要約ID」により、各変換テキスト411が、どの要約文410に関するデータであるのかを区別することができる。また、要約システム1は、例えば、ユーザによって変換テキスト41が変更された場合、この「要約ID」により、変更された変換テキスト41から生成された要約文410を特定することができる。
【0054】
また、要約文410は、「状態」という属性を有している。要約システム1は、この「状態」により、要約文410が、生成中の状態であるか、要約完了の状態であるか、手動で要約が修正されたであるか、等を特定することができる。要約システム1は、この「状態」により、要約文の状態を、端末装置110が実行するアプリに提供することができる。
【0055】
さらに、会話情報400、要約文410、及び変換テキスト411には、図4に示すような、様々な情報が含まれる。
【0056】
記憶部308は、例えば、要約システム1が管理する様々な情報(閾値、設定値等)、データ、及びプログラム等を記憶する。
【0057】
なお、図3において、会議サーバ10は、ウェブ会議サービスを提供する一般的なクラウドサービス等であってよいので、ここでは説明を省略する。
【0058】
<処理の流れ>
続いて、本実施形態に係るコミュニケーション支援方法の処理の流れについて説明する。
【0059】
(要約処理)
図5は、一実施形態に係る要約処理の例を示すシーケンス図である。なお、図5示す処理の開始時点において、端末装置110aと端末装置110bは、会議サーバ10を介して、音声を含むコンテンツデータを送受信する会議(Web会議)に参加しているものとする。
【0060】
ステップS501、S502において、端末装置110a、及び端末装置110bは、Pub/Subメッセージングサービスを提供する提供部306に、Subscriptionの登録を行う。端末装置110a、及び端末装置110bは、Subscriptionの登録を行うことにより、提供部306との間で双方向の通信が可能となり、提供部306からの通知を遅延なく受け取ることができる。ただし、これに限られず、端末装置110a、及び端末装置110bは、例えば、ポーリング処理等の他の方法で、提供部306から情報を取得してもよい。
【0061】
ステップS503において、端末装置110aの音声送信部313は、マイク221で取得した音声を音声データに変換し、音声データを要約サーバ100に送信する。これに応じて、ステップS504において、要約サーバ100の取得部302は、端末装置110aが送信した音声データを受信し、受信した音声データを変換部303に出力する。
【0062】
同様に、ステップS505において、端末装置110bの音声送信部313は、マイク221で取得した音声を音声データに変換し、音声データを要約サーバ100に送信する。これに応じて、ステップS506において、要約サーバ100の取得部302は、端末装置110bが送信した音声データを受信し、受信した音声データを変換部303に出力する。
【0063】
ステップS507において、要約サーバ100の変換部303は、取得部302が取得した音声データをテキストデータに変換する。また、変換部303は、変換したテキストデータ(以下、変換テキストと呼ぶ)を、提供部306に通知する。
【0064】
ステップS509において、提供部306は、変換部303から通知された変換テキストを、例えば、図4に示すようなデータ構造で、DB307に登録する。
【0065】
ステップS510において、提供部306は、変換部303から通知された変換テキストを端末装置110aに配信する。これに応じて、ステップS511において、端末装置110aの表示制御部314は、配信された変換テキストを表示画面に表示する。
【0066】
同様に、ステップS512において、提供部306は、変換部303から通知された変換テキストを端末装置110bに配信する。これに応じて、ステップS513において、端末装置110bの表示制御部314は、配信された変換テキストを表示画面に表示する。なお、端末装置110が表示する表示画面の例については後述する。
【0067】
ステップS514において、提供部306は、変換部303から通知された変換テキストを判断部304に通知する。これに応じて、ステップS515において、判断部304は、要約実行条件をチェックする。具体的には、判断部304は、テキスト変換部507が変換した変換テキスト(複数のテキスト)が、所定の要約実施条件を満たしたかをチェックする。
【0068】
ステップS516において、判断部304は、DB307に登録された変換テキストの情報を更新する。例えば、判断部304は、登録された変換テキストに、要約ID等を付与する。
【0069】
要約システム1は、例えば、会議が行われている間、ステップS503~S516の処理を繰り返し実行する。また、要約システム1は、ステップS515において、判断部304が、要約実行条件を満たしたと判断した場合、ステップS521~S528の処理520を実行する。
【0070】
ステップS521において、判断部504は、要約実行条件を満たしたと判断すると、提供部306が通知された複数の変換テキスト(以下、変換テキスト群と呼ぶ)を、生成部305に通知する。この変換テキスト群には、判断部504が、前回、要約実行条件を満たしたと判断した後に、提供部306から通知された複数の変換テキストが含まれる。
【0071】
ステップS522において、生成部305は、判断部304から通知された変換テキスト群(複数のテキスト)を要約し、要約文を生成する。また、ステップS523において、生成部305は、生成した要約文を提供部306に通知する。
【0072】
ステップS524において、提供部306は、生成部305から通知された要約文を、例えば、図4に示すようなデータ構造で、DB307に登録する。例えば、提供部306は、図4に示すように、要約文410と、要約文410の生成に用いた変換テキスト411a、411b、411cとが、同じ要約IDを有するように、要約文を登録する。
【0073】
ステップS525において、提供部306は、生成部305から通知された要約文を端末装置110aに配信する。これに応じて、ステップS526において、端末装置110aの表示制御部314は、配信された要約文を表示画面に表示する。
【0074】
同様に、ステップS527において、提供部306は、生成部305から通知された要約文を端末装置110bに配信する。これに応じて、ステップS528において、端末装置110bの表示制御部314は、配信された要約文を表示画面に表示する。
【0075】
(表示画面の例1)
図6は、一実施形態に係る端末装置の表示画面の例を示す図(1)である。図(A)は、端末装置110の表示制御部314が、要約サーバ100から通知された変換テキスト、及び要約文を表示するアプリの表示画面600の一例を示している。
【0076】
図6の例では、表示画面600は、変換テキスト(文字おこしテキスト)、及び要約文を表示する第1の表示エリア610と、決定事項、及びアクションアイテムを表示する第2の表示エリア620とを含む。なお、第2の表示エリア620はオプションであり、必須ではない。
【0077】
表示制御部314は、要約サーバ1から配信された変換テキスト611a、611b、611c、611dを、第1の表示エリア610に、受信した順に、順次に表示する。同様に、表示制御部314は、要約サーバ1から配信された要約文612a、612bを、第1の表示エリア610に、受信した順に、順次に表示する。これにより、表示制御部314は、例えば、図6に示すように、要約文612bと、要約文612bの生成に用いられた複数の変換テキスト613とを対応付けて、第1の表示エリア610に表示することができる。
【0078】
なお、以下の説明において、変換テキスト611a、611b、611c、611dのうち、任意の変換テキストを示す場合、「変換テキスト611」を用いる。また、要約文612a、612bのうち、任意の要約文を示す場合、「要約文612」を用いる。
【0079】
好ましくは、第1の表示エリア610に表示された変換テキスト611は、当該変換テキスト611を削除するための削除アイコン614を有している。ユーザは、削除アイコン614を選択することにより、削除アイコン614に対応する変換テキスト611を削除することができる。同様に、要約文612も、当該要約文612を削除するための削除アイコン614を有している。
【0080】
好ましくは、第1の表示エリア610に表示された要約文612は、当該要約文612を第2の表示エリア620に表示するためのブックマークアイコン615を有している。ユーザは、ブックマークアイコン615を選択することにより、ブックマークアイコン615に対応する要約文612のコピーを、第2の表示エリアに表示することができる。同様に、変換テキスト611も、当該変換テキスト611を第2の表示エリア620に表示するためのブックマークアイコン615を有している。
【0081】
好ましくは、第1の表示エリア610は、変換テキスト611、及び要約文612を自動スクロールするか否かを設定する「自動スクロール」ボタン616を有している。例えば、ユーザは、「自動スクロールボタン」616をオフにすることにより、自動スクロール機能を無効に設定することができる。
【0082】
好ましくは、要約文612は、要約文の生成に用いた変換テキスト611を非表示にするための非表示ボタン617を有する。例えば、ユーザは要約文612bの非表示ボタン617を選択することにより、図6(B)に示すように、要約文612bの生成に用いられた複数の変換テキスト613を非表示にすることができる。
【0083】
また、図6(B)に示すように、要約文612bの生成に用いられた複数の変換テキスト613が非表示になっている場合、要約文612bは、要約文612bの生成に用いた変換テキスト613を表示にするための表示ボタン618を有する。ユーザは、表示ボタン618を選択することにより、図6(A)に示すように、要約文612bの生成に用いた変換テキスト613を再び表示することができる。
【0084】
好ましくは、表示制御部314は、第2の表示エリア620に表示したテキスト621が編集されると、編集内容をコピー元の変換テキスト611、又は要約文612に反映する。また、第2の表示エリア620に表示したテキストは、当該テキストのコピー元の変換テキスト611、又は要約文612にジャンプするためのジャンプボタン622を有している。
【0085】
(表示画面の例2)
図7は、一実施形態に係る端末装置の表示画面の例を示す図(2)である。端末装置110が他の端末装置110と会議(ウェブ会議)を行う場合、端末装置110には、他の端末装置110が撮影した会議映像、又はプレゼンテーション資料等を表示する会議画面が表示されることが多い。そのため、端末装置110のディスプレイ206等の表示部に、例えば、図6で説明した表示画面600を表示することが困難な場合がある。
【0086】
そこで、端末装置110の表示制御部314は、例えば、図7に示すように、端末装置110の表示部に表示した会議画面700に、要約文を表示する表示画面710を重畳させて表示してもよい。図7の例では、表示制御部314は、会議画面700に重畳させて、直近の2つの要約文を表示する表示画面710を表示している。なお、表示画面710に表示する要約文の数は、1つであってもよいし、3つ以上であってもよい。
【0087】
また、表示画面710に表示した要約文は、図6で説明した要約文612と同様に、当該要約文を第2の表示エリア620に表示するためのブックマークアイコン711を有している。ユーザは、ブックマークアイコン711を選択することにより、バックグラウンドで動作している表示画面600の第2の表示エリア620に、ブックマークアイコン711に対応する要約文のコピーを表示することができる。
【0088】
(表示画面の例3)
図8は、一実施形態に端末装置の表示画面の例を示す図(3)である。図8の例では、端末装置110の表示制御部314は、端末装置110の表示部に表示した会議画面700に重畳させて、要約文を表示する表示画面800を表示させている。この場合、表示画面800に新たな要約文を表示すると、現在の表示画面800に表示されている要約文が消えてしまうという問題がある。
【0089】
そこで、図8の例では、表示画面800に、要約文を画面上にピン止めするためのピン止めアイコン801を有している。ユーザは、ピン止めアイコン801を選択することにより、表示画面800に表示されている要約文のコピー802を、端末装置110の表示部に表示し続けること(ピン止めすること)ができる。
【0090】
(判断処理)
[第1の実施形態]
図9は、第1の実施形態に係る判断処理の例を示す図である。この処理は、例えば、図5のステップS515において、要約サーバ100の判断部304が、テキスト変換部507が変換した変換テキストが、所定の要約実施条件を満たしたか否かを判断する判断処理の一例を示している。
【0091】
ステップS901において、判断部304は、提供部306から変換テキストを受け付けると、ステップS902以降の処理を実行する。
【0092】
ステップS902において、判断部304は、提供部306から受信した変換テキストの文字数を算出する。
【0093】
ステップS903において、判断部304は、算出した受信文字数が、第1の閾値に達したか否かを判断する。ここで、第1の閾値は、要約の対象となる文字数(要約対象文字数)が、予め設定されているものとする。受信文字数が第1の閾値に達していない場合、判断部304は、処理をステップS901に戻す。一方、受信文字数が第1の閾値に達した場合、判断部304は、処理をステップS904に移行させる。
【0094】
ステップS904に移行すると、判断部304は、生成部305に要約を実行させる。例えば、判断部304は、提供部306から受信した変換テキスト群を、生成部305に通知する。
【0095】
ステップS905において、判断部304は、変換テキストの受信文字数を初期化する。
【0096】
ステップS906において、判断部304は、変換テキストの受信を継続するかを判断する。変換テキストの受信を継続する場合、判断部304は、処理をステップS901に戻す。一方、変換テキストの受信を継続しない場合、判断部304は、処理を終了する。
【0097】
図10は、第1の実施形態に係る判断処理について説明するための図である。例えば、判断部304は、図10に示すような変換テキスト1~8を、提供部306から順次に受信するものとする。また、第1の閾値は、100文字に設定されているものとする。
【0098】
この場合、判断部304は、図9の処理を実行することにより、変換テキスト4を受信したときに、変換テキストの文字数が100文字になるので、変換テキスト1~4を変換テキスト群1001として、生成部305に通知する。これにより、生成部305は、変換テキスト群1001を要約した要約文を生成する。
【0099】
続いて、判断部304は、変換テキスト7を受信したときに、変換テキストの文字数が100文字になるので、変換テキスト5~7を変換テキスト群1002として、生成部305に通知する。
【0100】
このように、変換テキストの文字数を閾値とすることで、どの程度の会話量について要約を実行するのかを調整することができる。なお、第1の閾値(要約対象文字数)は、ユーザが設定可能であってもよい。
【0101】
[第2の実施形態]
図11は、第2の実施形態に係る判断処理の例を示すフローチャートである。この処理は、例えば、図5のステップS515において、要約サーバ100の判断部304が、テキスト変換部507が変換した変換テキストが、所定の要約実施条件を満たしたか否かを判断する判断処理の別の一例を示している。
【0102】
ステップS1101において、判断部304は、提供部306から変換テキストを受け付けると、ステップS1102以降の処理を実行する。
【0103】
ステップS1102において、判断部304は、提供部306から受信した複数の変換テキストをまとめてチャンクデータを生成する。これは、1つの変換テキストだけでは意味がないケースもあるため、複数の変換テキストをまとめてチャンクデータとして、判断処理を行う。
【0104】
図12は、第2の実施形態に係る判断処理について説明するための図である。例えば、判断部304は、図12に示すような変換テキスト1~8を、提供部306から順次に受信するものとする。また、図12の例では、判断部304は、一例として、直近に受信した3つ(所定の数の一例)の変換テキストを1つのチャンクデータとしている。例えば、判断部304は、変換テキスト3を受信したときに、変換テキスト1~3をチャンクデータ1201とし、変換テキスト4を受信したときに、変換テキスト2~4をチャンクデータ1202とする。同様に、判断部304は、変換テキスト5を受信したときに、変換テキスト3~5をチャンクデータ1203とし、変換テキスト6を受信したときに、変換テキスト4~6をチャンクデータ1204とする。
【0105】
このように、判断部304は、一例として、直近に受信した所定の数の変換テキストを1つのチャンクデータとしてもよい。別の一例として、受信した複数の変換テキストの文字数が所定の文字数に達したときに、受信した複数の変換テキストを1つのチャンクデータとしてもよい。
【0106】
なお、判断部304は、チャンクデータを作成するときに、複数の変換テキストを単純に結合してもよいし、複数の変換テキストを生成部305に入力して要約してもよい。
【0107】
図11のステップS1103において、生成したチャンクデータをベクトル化して、類似度を算出する。例えば、判断部304は、生成したチャンクデータと、前回生成したチャンクデータとの類似度を算出する。例えば、図12において、判断部304は、変換テキスト4を受信してチャンクデータ1202を作成した場合、チャンクデータ1202と、チャンクデータ1201との類似度を算出する。
【0108】
チャンクデータをベクトル化する方法としては、例えば、チャンクデータを単語単位に分割し、分割した単語からベクトル値を算出する。なお、ベクトル値の算出方法としては、例えば、公知のBag of Words、又はBERT(Bidirectional Encoder Representations from Transformers)等の自然言語処理を適用することができる。
【0109】
図11のステップS1104において、判断部304は、算出した類似度が第2閾値を下回ったかを判断する。ここで、第2の閾値は、チャンクデータ間の類似性が低いことを判断するための値が、予め設定されているものとする。類似度が第2の閾値を下回っていない場合、判断部304は、処理をステップS1101に戻す。一方、類似度が第2の閾値を下回った場合、判断部304は、処理をステップ1105に移行させる。
【0110】
ステップS1105に移行すると、前回のチャンクデータまで要約を実行させる。例えば、図12において、判断部304は、変換テキスト4を受信したときに、類似度が第2の閾値を下回った場合、変換テキスト1~3を変換テキスト群として、生成部305に通知する。同様に、判断部304は、変換テキスト7を受信したときに、類似度が第2の閾値を下回った場合、変換テキスト1~6を変換テキスト群として、生成部305に通知する。
【0111】
ステップS1106に移行すると、判断部304は、要約に利用した変換テキストを要約済として、要約の対象から除外する。
【0112】
ステップS1107において、判断部304は、変換テキストの受信を継続するかを判断する。変換テキストの受信を継続する場合、判断部304は、処理をステップS1101に戻す。一方、変換テキストの受信を継続しない場合、判断部304は、処理を終了する。
【0113】
なお、図11のステップS1104において、判断部304は、算出した類似度を単純に第2の閾値と比較しているが、これは一例である。例えば、算出した類似度の移動平均、又は算出した類似度の微分値等を閾値と比較してもよい。
【0114】
(変更処理)
例えば、図6で説明した表示画面600において、ユーザは要約文612を編集可能であることが望ましい。これにより、ユーザは、要約文612に違和感がある場合、要約文612を容易に修正できるようになる。
【0115】
また、例えば、端末装置110aが表示する表示画面600で行われた編集内容、及びブックマークアイコン615の選択内容等は、他の端末装置110bが表示する表示画面600にも反映されることが望ましい。
【0116】
図13は、一実施形態に係る変更処理の例を示すシーケンス図である。ステップS1300において、要約システム1は、図5で説明した要約処理を実行し、端末装置110a、110bは、図6に示すような表示画面600を表示しているものとする。
【0117】
ステップS1301、S1302において、端末装置110bは、ユーザが要約文612を編集すると、編集内容を要約サーバ100の提供部306に送信する。これに応じて、ステップS1303において、提供部306は、端末装置110bから受信した編集内容をDB307に保存する。
【0118】
ステップ1304、S1305において、提供部306は、編集結果を端末装置110a、110bに配信する。これにより、ステップS1306において、端末装置110bにおける要約文の編集内容が、端末装置110aの表示画面600に反映される。
【0119】
また、ステップS1311、S13112において、端末装置110aは、ユーザがブックマークアイコン615を選択すると、ブックマーク情報を要約サーバ100の提供部306に送信する。これにより、ステップS1313において、提供部306は、端末装置110aから受信したブックマーク情報をDB307に保存する。
【0120】
また、ステップS1314、S1315において、提供部306は、ブックマーク結果を端末装置110a、110bに配信する。これにより、ステップS1316において、端末装置110aにおけるブックマークアイコン615の選択内容が、端末装置110bに反映される。
【0121】
(再要約処理1)
例えば、図6で説明した表示画面600において、ユーザは変換テキスト611を編集可能であることが望ましい。また、変換テキスト611が編集された場合、要約システム1は、要約文612を再要約することが望ましい。
【0122】
図14は、一実施形態に係る再要約処理の例を示すシーケンス図(1)である。この処理は、要約システム1が実行する再要約処理の一例を示している。
【0123】
ステップS1400において、要約システム1は、図5で説明した要約処理を実行し、端末装置110a、110bは、図15(A)に示すような表示画面1500を表示しているものとする。また、図15(A)の例では、変換テキスト1501a、1501bに誤り(変換ミス等)1511、1512があり、その誤りにより、要約文1502にも誤りが含まれているものとする。
【0124】
ステップS1401、S1402において、端末装置110bは、ユーザが変換テキスト1501a、1501bを編集(修正)すると、編集内容を要約サーバ100の提供部306に送信する。これに応じて、ステップS1403において、提供部306は、端末装置110bから受信した編集内容をDB307に保存する。
【0125】
ステップ1404、S1405において、提供部306は、編集結果を端末装置110a、110bに配信する。これにより、ステップS1406において、端末装置110bにおける変換テキストの編集内容が、端末装置110aの表示画面1500にも反映される。これにより、例えば、図15(B)に示すように、端末装置110a、110bが表示する表示画面1500において、変換テキスト1501a、1501bの修正が反映される。
【0126】
ステップS1407において、提供部306は、端末装置110bから受信した変更内容を判断部304に通知する。これに応じて、ステップS1408において、判断部304は、受信した編集内容に関連するデータをDB307から取得する。例えば、判断部304は、編集された変換テキストと同じ要約IDを有する変換テキスト、及び要約文を取得する。
【0127】
ステップS1408において、判断部304は、取得した要約文に対する手動変更の有無を確認する。取得した要約文に手動変更がない場合、要約システム1は、ステップS1510、S1411の処理を実行する。一方、取得した要約文に手動変更がある場合、ステップS1410、S1411の処理の実行を中止する。これにより、ユーザが既に修正した要約文を、要約システム1が上書きしてしまうことを防止することができる。
【0128】
ステップS1410において、ステップS1408で取得した変換テキスト群を、生成部305に通知する。これにより、ステップS1411において、要約システム1は、要約文の再生成、及び通知処理を実行する。例えば、要約システム1は、判断部304が生成部305に通知した変換テキスト群を用いて、図5のステップS522~S528と同様の要約処理、及び通知処理を再実行する。
【0129】
好ましくは、端末装置110a、110bは、ステップS1411の処理が行われている間、図15(B)に示すように、要約文1502を再要約中であることを示す情報1523を、表示画面1500に表示する。
【0130】
図14の処理により、例えば、図16(A)に示すように、要約文1502が再要約される。また、端末装置110a、110bは、再要約が完了すると、再要約中であることを示す情報1523を元の表示に戻す。
【0131】
(変形例)
図14の例では、要約システム1は、要約文に手動変更がない場合、ステップS1410、S1411の処理を自動的に実行していた。別の一例として、要約システム1は、例えば、図16(B)に示すように、要約文1502の再要約が可能であることを示す更新アイコン1621を表示し、更新アイコン1621が選択されたときに、ステップS1410、S1411の処理を実行してもよい。
【0132】
(再要約処理2)
図17は、一実施形態に係る再要約処理の例を示すシーケンス図(2)である。この処理は、要約システム1が実行する再要約処理の別の一例を示している。なお、図17のステップS1400~S1408の処理は、図14で説明したステップS1400~S1408の処理と同様なので、ここでは説明を省略する。
【0133】
ステップS1701において、判断部304は、第1の時間を計測する要約タイマを開始する。
【0134】
ステップS1702において、同じ要約IDに対応する変換テキストに対して、ステップS1401~S1408に示すような変換テキストの編集処理が行われても、判断部304は、再要約処理を開始しない。
【0135】
ステップS1703、S1704において、要約タイマが満了すると、判断部304は、ステップS1408以降で取得した変換テキスト群を、生成部305に通知する。これにより、ステップS1705において、要約システム1は、要約文の再生成、及び通知処理を実行する。例えば、要約システム1は、判断部304が生成部305に通知した変換テキスト群を用いて、図5のステップS522~S528と同様の要約処理、及び通知処理を再実行する。
【0136】
図17の処理により、要約システム1は、要約文1502に対応する複数の変換テキスト1501a、1501bが最初に変更されてから、第1の時間を経過後に、要約文1502を更新する。これにより、例えば、ユーザが、変換テキスト1501a、1501bを修正中に、要約文1502が頻繁に再要約されてしまうことを抑制することができる。
【0137】
(再要約処理3)
図18は、一実施形態に係る再要約処理の例を示すシーケンス図(3)である。この処理は、要約システム1が実行する再要約処理の別の一例を示している。なお、図17のステップS1400~S1408の処理は、図14で説明したステップS1400~S1408の処理と同様なので、ここでは説明を省略する。
【0138】
ステップS1801において、判断部304は、第2の時間を計測する要約タイマを開始する。
【0139】
ステップS1802において、同じ要約IDに対応する変換テキストに対して、ステップS1401~S1408に示すような変換テキストの編集処理が行われると、判断部304は、ステップS1803、S1804の処理を実行する。
【0140】
ステップS1803において、判断部304は、要約タイマを停止し、ステップS1804において、第2の時間を計測する要約タイマを開始する。
【0141】
ステップS1805、S1806において、要約タイマが満了すると、判断部304は、ステップS1408以降で取得した変換テキスト群を、生成部305に通知する。これにより、ステップS1807において、要約システム1は、要約文の再生成、及び通知処理を実行する。例えば、要約システム1は、判断部304が生成部305に通知した変換テキスト群を用いて、図5のステップS522~S528と同様の要約処理、及び通知処理を再実行する。
【0142】
図18の処理により、要約システム1は、要約文1502に対応する複数の変換テキスト1501a、1501bが最後に変更されてから、第2の時間を経過後に、要約文1502を更新する。これにより、例えば、ユーザによる、変換テキスト1501a、1501bを修正量が多い場合でも、修正中に要約文1502が再要約されてしまうことを抑制することができる。
【0143】
なお、図17、18の処理においても、図14の処理と同様に、要約文に手動変更がある場合、再要約処理の実行を中止してもよい。
【0144】
以上、本発明の各実施形態によれば、直近の要約文を確認することを容易にする要約システムを提供することができる。
<補足>
上記で説明した各実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
【0145】
また、実施例に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものに過ぎない。ある実施形態では、要約サーバ100は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。
【0146】
さらに、前述したように、要約サーバ100の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていてもよい。
【0147】
<付記>
本明細書には、下記の各項の要約システム、要約方法、及びプログラムが開示されている。
(第1項)
音声を取得する取得部と、
前記音声を複数のテキストに変換する変換部と、
前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する生成部と、
前記要約文をユーザに提供する提供部と、
を有する、要約システム。
(第2項)
前記要約実施条件は、前記変換部が変換した前記複数のテキストのサイズが第1の閾値に達したことを含む、第1項に記載の要約システム。
(第3項)
前記要約実施条件は、前記変換部が変換した前記複数のテキストから算出した類似度が第2の閾値を下回ることを含む、第1項に記載の要約システム。
(第4項)
前記要約文と、前記複数のテキストとを対応付けて管理するデータ管理部を有し、
前記複数のテキストが変更された場合、前記要約文を更新する、
第1項に記載の要約システム。
(第5項)
前記提供部は、前記要約文と、前記要約文の生成に用いた前記複数のテキストとを、前記ユーザが利用する端末装置に配信し、
前記端末装置は、少なくとも前記要約文を表示する表示画面を表示部に表示させる表示制御部を有する、
第1項~第4項のいずれかに記載の要約システム。
(第6項)
前記表示画面は、前記要約文と対応付けて、前記要約文の生成に用いた前記複数のテキストを編集可能に表示する、第5項に記載の要約システム。
(第7項)
前記表示画面は、
前記要約文の抽出、複製、又は編集が可能である、第5項に記載の要約システム。
(第8項)
前記音声は、複数の端末装置の間でコンテンツデータを送受信する会議の音声であり、
前記表示制御部は、前記会議の会議画面に重畳させて、前記表示画面を表示させる、第5項に記載の要約システム。
(第9項)
前記複数のテキストが最初に変更されてから第1の時間を経過後、又は前記複数のテキストが最後に変更されてから第2の時間を経過後に、前記要約文を更新する、第4項に記載の要約システム。
(第10項)
前記要約文が手動で変更されている場合、前記要約文の更新を中止する、第4項に記載の要約システム。
(第11項)
ユーザによる所定の操作を受け付けた後に、前記要約文を更新する、第4項に記載の要約システム。
(第12項)
音声を取得する処理と、
前記音声を複数のテキストに変換する処理と、
前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する処理と、
前記要約文を前記ユーザに提供する処理と、
をコンピュータが実行する、要約方法。
(第13項)
音声を取得する処理と、
前記音声を複数のテキストに変換する処理と、
前記複数のテキストが所定の要約実施条件を満たしたときに、前記複数のテキストを要約した要約文を生成する処理と、
前記要約文を前記ユーザに提供する処理と、
をコンピュータに実行させる、プログラム。
【0148】
以上、本発明の実施形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、及び応用が可能である。
【符号の説明】
【0149】
1 要約システム
100 要約サーバ
200 コンピュータ
110、110a、110b 端末装置
302 取得部
305 生成部
306 提供部
307 DB(データベース)
314 表示制御部
600、710、800、1500 表示画面
700 会議画面
【先行技術文献】
【特許文献】
【0150】
【特許文献1】特開2022-025665号公報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18