【文献】
三浦 寛也、外1名,議事録生成技術に関するサーベイ,言語・音声理解と対話処理研究会資料,SIG−SLUD−B507−06,2017年 7月21日,pp.34−38
(58)【調査した分野】(Int.Cl.,DB名)
前記情報処理部は、前記音声認識テキスト内の内容毎に前記ユーザの第1投票を受け付けて重み付けをし、重み付けされた前記ユーザの投票による得票が所定値以上である内容を選択して前記議事録を作成する、
請求項1または2に記載の議事録作成システム。
前記情報処理部は、前記ユーザの第1投票によって所定値以上の得票を獲得した内容毎に前記ユーザによる第2投票をさらに受け付け、前記ユーザの第2投票によって所定値以上の得票を獲得した内容を前記議事録に含めない、
請求項1から3のいずれか1項に記載の議事録作成システム。
前記情報処理部は、前記ユーザの第1投票によって所定値以上の得票を獲得した内容毎に前記ユーザの第2投票を受け付けて重み付けをし、重み付けされた前記ユーザの投票による得票が所定値以上である内容を前記議事録に含めない、
請求項4に記載の議事録作成システム。
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述のとおり、特許文献1の議事録作成装置は、会議中に取得した音声をテキスト化して自動的に議事録を作成している。しかし、会議中に取得した発言内容の全てから議事録が作成されるため、不必要な発言や削除すべき発言等も議事録として残ってしまう。かかる場合、議事録の閲覧者が会議の要点を容易に把握できなくなり、会議参加者が自由に意見を言えなくなる懸念がある。
【0005】
本発明の課題は、議事録の閲覧者が会議の要点を容易に把握することができる議事録を作成することができる議事録作成システムを提供することである。
【課題を解決するための手段】
【0006】
本発明の第1局面に係る議事録作成システムは、音声認識部および情報処理部を備える。音声認識部は、マイクで取得した音声を認識する。情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。
そして、情報処理部は、音声認識テキスト内の内容毎に1または複数のユーザによる第1投票を受け付け、ユーザの第1投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。
【0007】
この議事録作成システムでは、情報処理部は、
音声認識テキスト内の内容毎に1または複数のユーザ(例えば、会議参加者等)による第1投票を受け付けて、ユーザの第1投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。例えば、会議参加者のうち権限のある1人による投票を受け付け、投票された音声認識テキスト内の内容から議事録を作成するようにすることができる。また、例えば、複数の会議参加者それぞれによる投票を受け付けて、会議参加者のうち3人以上に投票された場合に、投票された音声認識テキスト内の内容から議事録を作成するようにすることもできる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録を作成することができ、延いては議事録の閲覧者が会議の要点を容易に把握できるようにすることができる。
【0008】
本発明の第2局面に係る議事録作成システムは第1局面に係る議事録作成システムであって、表示部をさらに備える。表示部は、音声認識テキストを第1のエリアに表示し、議事録を第2のエリアに表示する。
【0009】
この議事録作成システムでは、表示部は、音声認識テキストを第1のエリアに表示し、議事録を第2のエリアに表示する。例えば、端末(例えば、パーソナルコンピュータ、タブレット端末、スマートフォン等)のディスプレイの右側に音声認識テキストを表示し、端末のディスプレイの左側に議事録を表示することで、音声認識テキスト内のどの内容が選択されて議事録が作成されているかを確認することができる。このため、この議事録作成システムでは、音声認識テキスト内の議事録に残すべき内容が選択されていないことを見落とさないようにすることができる。
【0010】
本発明の
第3局面に係る議事録作成システムは
第1局面または第2局面に係る議事録作成システムであって、情報処理部は、音声認識テキスト内の内容毎にユーザの第1投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。
【0011】
この議事録作成システムでは、情報処理部は、音声認識テキスト内の内容毎にユーザ(例えば、会議参加者等)の第1投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。例えば、企業の会議において、議事録に残すべきと判断した内容に投票する場合、部長の投票は3人分であるとみなし、課長の投票は2人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。
【0012】
本発明の
第4局面に係る議事録作成システムは
第1局面から第3局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザによる第2投票をさらに受け付け、ユーザの第2投票によって所定値以上の得票を獲得した内容を議事録に含めない。
【0013】
この議事録作成システムでは、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容(つまり、ユーザが議事録に残すべきと判断した内容)毎にユーザ(議事録に残す投票をしたユーザや、議事録に残す投票をしていないユーザ)による第2投票をさらに受け付け、ユーザの第2投票によって所定値以上の得票を獲得した内容を議事録に含めない。例えば、会議参加者等の投票によって議事録に残すべきと判断された内容があったとしても、「議事録に残す投票をしたが意見が変わった会議参加者等」や「その内容を議事録に残すべきではないと判断する会議参加者等」が居る場合がある。そして、これらの会議参加者等による投票を受け付けて、所定値以上の得票を獲得した内容を議事録に含めないようにすることができる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録を作成することができる。
【0014】
本発明の
第5局面に係る議事録作成システムは
第4局面に係る議事録作成システムであって、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザの第2投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。
【0015】
この議事録作成システムでは、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザの第2投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。例えば、企業の会議において、議事録に残すべきではないと判断した内容に投票する場合、部長の投票は3人分であるとみなし、課長は2人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。
【0016】
本発明の
第6局面に係る議事録作成システムは
第1局面から第5局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。
【0017】
この議事録作成システムでは、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。例えば、AI(Artificial Intelligence)による学習を利用して生成した学習モデルを用いることで、音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。
【0018】
本発明の
第7局面に係る議事録作成システムは
第1局面から第6局面のいずれか1局面に係る議事録作成システムであって、選択部をさらに備える。選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をする。また、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。
【0019】
この議事録作成システムでは、選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をし、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。そして、選択されたキーワード辞書に登録されているキーワードが音声認識テキスト内の内容に含まれている場合、その音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。
【0020】
本発明の第8局面に係る議事録作成システムは第1局面から第7局面のいずれか1局面に係る議事録作成システムであって、音声認識部は、音声の音量を認識する。情報処理部は、音量が閾値以上であった音声認識テキスト内の内容を選択して議事録を作成する。
【0021】
本発明の第9局面に係る議事録作成システムは第1局面から第8局面のいずれか1局面に係る議事録作成システムであって、音声認識部は、認識した音声がいずれの話者から発せられたかを特定する。また、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。
【0022】
この議事録作成システムでは、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。このため、この議事録作成システムでは、音声認識テキスト内および議事録内において、どのユーザ(例えば、会議参加者等)による発言であるかを特定することができる。
【0023】
本発明の第10局面に係る議事録作成システムは第1局面から第9局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。
【0024】
この議事録作成システムでは、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。このため、この議事録作成システムでは、例えば、多言語(少なくとも2つの言語以上)による会議が行われる場合に、ユーザ(例えば、会議参加者等)は、各ユーザの言語に翻訳された音声認識テキストおよび議事録を確認することができ、延いては多言語による会議を円滑に進めることができる。
【0025】
本発明の第11局面に係る議事録作成システムは第10局面に係る議事録作成システムであって、情報処理部は、AI(Artificial Intelligence)を利用して生成された機械学習モデルを用いて、翻訳辞書を基に、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。
【0026】
本発明の
第12局面に係る議事録作成システムは
第1局面から第11局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、議事録における音声認識テキスト内の内容を選択して議事録から削除することができる。
【0027】
この議事録作成システムでは、情報処理部は、議事録における音声認識テキスト内の内容の一部または全部を選択して議事録から削除することができる。つまり、議事録に残すべきではない内容(例えば、企業において、一定の役職以上の人にのみ共有されている情報、企業秘密情報等)が選択されて議事録として作成されていた場合に、その内容を削除することができる。このため、この議事録作成システムでは、作成された議事録から情報漏洩等が起きることを防ぐことができる。
【0028】
本発明の第13局面に係る議事録作成システムは第12局面に係る議事録作成システムであって、情報処理部は、AIを利用して生成された機械学習モデルを用いて、議事録における音声認識テキスト内の内容を選択して議事録から削除することができる。
【0029】
本発明の
第14局面に係る議事録作成システムは
第1局面から第13局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、議事録から音声データを生成することができる。
【0030】
この議事録作成システムでは、情報処理部は、議事録から音声データを生成することができる。このため、この議事録作成システムでは、会議参加者等は、視覚で確認しなくても会議の内容を把握することができる。
【0031】
本発明の第15局面に係る議事録作成システムは第1局面から第14局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、AIを利用して生成された機械学習モデルを用いて、音声認識辞書を基に、音声を認識する。
【0032】
本発明の第16局面に係る議事録作成システムは第1局面から第15局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、AIを利用して生成された機械学習モデルを用いて、変換辞書を基に、音声認識テキスト内の第1用語(例えば、企業内や業界内のみで使用される用語)を第2用語(例えば、一般的に使用される用語)に変換する。
【発明を実施するための形態】
【0034】
−第1実施形態−
<本発明の第1実施形態に係る議事録作成システム1の全体構成例>
本発明の第1実施形態に係る議事録作成システム1の全体構成について説明する。本発明の第1実施形態に係る議事録作成システム1は、例えば、1つの会議室において会議が行われる場合に使用されるものであって、
図1に示されるように、主たる装置として、サーバ100および端末200等から構成されている。以下、これらの構成要素について詳述する。
【0035】
1.サーバ
まず、本発明の第1実施形態に係る議事録作成システム1を構成するサーバ100の構成の一態様について説明する。サーバ100は、インターネットに接続され、会議参加者等の音声の認識結果を音声認識テキスト232として出力し、音声認識テキスト232内で選択した内容から議事録233を作成するサービス等を提供する。サーバ100は、
図5に示されるように、主たる構成要素として、CPU(Central Processing Unit)110、メモリ120、操作部140および通信インターフェイス150を含む。
【0036】
(1)CPU
CPU110は、メモリ120に記憶されているプログラムを実行することによって、サーバ100の各部を制御する。例えば、CPU110は、メモリ120に格納されているプログラムを実行し、各種のデータを参照することによって、後述する各種の処理を実行する。
【0037】
(2)メモリ
メモリ120は、各種のRAM(Random Access Memory)、各種のROM(Read Only Memory)等であり、サーバ100に内包されているものであってもよいし、サーバ100の各種インターフェイスに着脱可能なものであってもよいし、サーバ100からアクセス可能な他の装置の記録媒体であってもよい。メモリ120は、CPU110によって実行されるプログラムや、CPU110によるプログラムの実行により生成されたデータ、入力されたデータ、その他の第1実施形態に係るサービスに利用されるデータベース等を記憶する。
【0038】
具体的には、メモリ120は、
図6および
図7に示されるような第1照合テーブル121および第2照合テーブル122を記憶する。第1照合テーブル121は、使用される各マイクに、そのマイクの使用者名を関連付けている。第2照合テーブル122は、各会議参加者等に、重み係数を関連付けている。ここで、重み係数は、各会議参加者の投票(後述)に対して重み付け処理をする際に用いられるものである。例えば、
図7に示されるような第2照合テーブル122を参照して重み付け処理をすることで、「田中」による投票は3人分の投票とされ、「佐藤」の投票は2人分の投票とされる。なお、サービスの管理者等は、第1照合テーブル121および第2照合テーブル122に新しいデータを追加したり、第1照合テーブル121および第2照合テーブル122に格納されているデータを変更することができる。
【0039】
また、メモリ120は、キーワード辞書も記憶する。キーワード辞書は、例えば、企業内で選定した単語や用語(日付、時間または金額等の変数も含まれる)を登録したもの等であり、音声認識テキスト232のうち特定のキーワードを含んでいる音声認識テキスト232内の内容から議事録233を作成するために用いられる。なお、キーワード辞書内の単語や用語は、必要に応じて追加および変更されてメモリ120に記憶されてもよいし、新しいキーワード辞書が、必要に応じて追加されてメモリ120に記憶されてもよい。
【0040】
また、メモリ120は、AI(Artificial Intelligence)を利用して生成した学習モデルも記憶する。ここで、学習モデルは、音声認識テキスト232と議事録233との関係性に基づく学習により生成されたもの等である。なお、必要に応じて、学習モデルの再学習が行われてメモリ120に記憶されてもよい。
【0041】
(3)操作部
操作部140は、サービスの管理者等の命令を受け付けて、当該命令をCPU110に入力する。
【0042】
(4)通信インターフェイス
通信インターフェイス150は、CPU110からのデータを、インターネット、キャリア網、ルータ等を介して、端末200等の他の装置に送信する。逆に、通信インターフェイス150は、インターネット、キャリア網、ルータ等を介して端末200等の他の装置からのデータを受信して、CPU110に受け渡す。
【0043】
2.端末
次に、本発明の第1実施形態に係る議事録作成システム1を構成する端末200の一態様について説明する。端末200は、会議参加者等に使用され、主に、会議参加者等の音声を取得し、取得した音声データをサーバ100に送信したり、サーバ100から送信された音声認識結果等を受信して表示するためのものである。本発明の第1実施形態に係る議事録作成システム1おいて、端末200は、パーソナルコンピュータやタブレット端末やスマートフォン等である。また、端末200は、ルータやインターネットやキャリア網等を介して、サーバ100が提供する各種のサービスを利用可能である。端末200は、
図8に示されるように、主たる構成要素として、CPU210、メモリ220、ディスプレイ230、操作部240、通信インターフェイス250、スピーカ260、マイク270およびプロジェクタ280等を含む。
【0044】
(1)CPU
CPU210は、メモリ220あるいは外部の記憶媒体に記憶されているプログラムを実行することによって、端末200の各部を制御する。
【0045】
(2)メモリ
メモリ220は、各種のRAMや、各種のROM等である。メモリ220は、CPU210によって実行されるプログラムや、CPU210によるプログラムの実行により生成されたデータ、入力されたデータ、サーバ100から受信したデータ、操作部240を介して入力されたデータ等を記憶する。
【0046】
(3)ディスプレイ
ディスプレイ230は、CPU210からの信号に基づいて、テキスト、画像、映像等を表示する。例えば、CPU210は、通信インターフェイス250を介してサーバ100から送られてくるデータ基づいて、
図2〜4に示されるような音声認識テキスト232および議事録233を同時にディスプレイ230に表示する。なお、ディスプレイ230は、タッチパネル機能を有していてもよい。
【0047】
(4)操作部
操作部240は、マウス、キーボード、ボタンおよびタッチパネル等であり、ユーザからの各種命令をCPU210に入力する。
【0048】
(5)通信インターフェイス
通信インターフェイス250は、無線LAN通信あるいは有線LAN等の通信モジュールである。通信インターフェイス250は、サーバ100等の他の装置との間でデータの送受信を仲介する。例えば、CPU210は、操作部240を介したキーワード辞書選択命令、その他の各種の入力情報を、通信インターフェイス250を介してサーバ100に送信したり、通信インターフェイス250を介してサーバ100から受信したデータに基づいてディスプレイ230に
図2〜4に示されるような画面を表示したりする。
【0049】
(6)スピーカ
スピーカ260は、CPU210からの信号に基づいて、音声を出力する。なお、音声を出力する機器は、スピーカ260に限定されていない。つまり、ヘッドホン、イヤホンまたはヘッドセット等の機器が用いられてもよい。
【0050】
(7)マイク
マイク270は、会議参加者等の音声を取得する。マイク270は、有線接続または無線接続によって端末200に接続される。なお、ここで、マイク270は会議参加者数と同じ数だけ用意され、会議参加者1人に1つのマイクが用意されることが好ましい。
【0051】
(8)プロジェクタ
プロジェクタ280は、
図1に示されるように、ディスプレイ230に表示されている画面をスクリーンに映し出し、ディスプレイ230に表示されている画面を会議参加者が共有できるようにする場合に用いられる。
【0052】
<本発明の第1実施形態に係る議事録作成システム1の利用方法および情報処理概要>
ここでは、
図9を参照して、本発明の第1実施形態に係る議事録作成システム1の利用方法および情報処理概要について説明する。まず、会議参加者(会議主催者を含む)等は、会議が始まる前に、第1照合テーブル121(
図6参照)および第2照合テーブル122(
図7参照)を作成しておく。第1照合テーブル121および第2照合テーブル122は、サーバ100において作成されてサーバ100のメモリ120に記憶されてもよいし、端末200において作成されて通信インターフェイス150を介してサーバ100のメモリ120に記憶されてもよい。
【0053】
また、会議参加者等は、キーワードによる議事録作成(後述)を選択する場合に備えて、会議が始まる前に端末200を用いてキーワード辞書を選択する。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からのキーワード辞書の選択結果を受け付け、サーバ100のメモリ120に格納されているキーワード辞書を選択する。これによって、選択されたキーワード辞書を基に議事録233を作成する処理(後述)を実行することができる。なお、ここで、会議参加者等は、1つのキーワード辞書だけを選択してもよいし、複数のキーワード辞書を選択してもよい。また、会議参加者等は、会議中にキーワード辞書を切り換えるために改めてキーワード辞書の選択を行うことができる。なお、会議参加者等は、キーワードによる議事録作成を選択しない場合、キーワード辞書の選択をしてなくてもよい。
【0054】
また、会議参加者等は、AIによる議事録作成(後述)を選択する場合に備えて、端末200を用いて会議が始まる前に学習モデルを選択する。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からの学習モデルの選択結果を受け付け、サーバ100のメモリ120に格納されている学習モデルを選択する。これによって、選択された学習モデルを基にAIで議事録233を作成する処理(後述)を実行することができる。なお、ここで、会議参加者等は、1つの学習モデルだけを選択してもよいし、複数の学習モデルを選択してもよい。また、会議参加者等は、会議中に学習モデルを切り換えるために改めて学習モデルの選択を行うことができる。なお、会議参加者等は、AIによる議事録作成を選択しない場合、学習モデルの選択をしてなくてもよい。
【0055】
まず、会議参加者等は、会議が始まる前に端末200を用いて、
図2(B)、
図3(B)および
図4に示されるような会議開催情報238(例えば、開催日時、開催場所、会議参加者名等)の入力を行う(ステップS102)。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からの入力情報を受け付けて、会議開催情報238を記憶する。なお、この会議開催情報238は、議事録233を作成する処理(後述)が実行された際に、議事録233の一部として出力される。
【0056】
会議が始まると、会議参加者毎に用意されたマイク270が、会議参加者の音声を取得する(ステップS104)。また、端末200は、会議参加者の音声が取得された後、会議参加者の音声を取得したマイク270の識別情報を、取得した音声データとともに端末200の通信インターフェイス250を介してサーバ100に送信する。
【0057】
次に、サーバ100のCPU110は、受信したマイク270の識別情報を第1照合テーブル121に照合して、取得した音声を発した会議参加者名(マイク270の使用者名)を特定する(ステップS106)。例えば、
図6に示されるように、受信したマイク270の識別情報が「マイクA」である場合、サーバ100のCPU110は、取得した音声を発した会議参加者を「田中」と特定する。
【0058】
次に、サーバ100のCPU110は、取得した音声の内容を認識する(ステップS108)。
【0059】
次に、サーバ100のCPU110は、「会議参加者名の特定結果」および「音声の内容の認識結果」を音声認識テキスト232として出力する(ステップS110)。なお、ここで、サーバ100のCPU110は、会議参加者等が切り替わる度に音声認識テキスト232を出力してもよいし、会議参加者等の音声の内容の認識結果に応じて(例えば、会議参加者等の音声の内容の認識結果が「。」で区切られる度に)音声認識テキスト232を出力してもよい。
【0060】
次に、サーバ100のCPU110は、
図2〜4に示されるようなWebページ231を作成する。Webページ231は、エリア231Aおよびエリア231Bから構成されている。エリア231Aには議事録233が表示され、エリア231Bにはキーワードによる議事録作成ボタン234、AIによる議事録作成ボタン235、チェックボックス237、音声認識テキスト232等が表示される。なお、ここで、エリア231Aは特許請求の範囲に記載の「第2のエリア」に相当し、エリア231Bは特許請求の範囲に記載の「第1のエリア」に相当する。音声認識テキスト232は、時系列順に並べられて表示され、チェックボックス237は、各音声認識テキスト232の左側に隣接するように配設されている。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、Webページ231を端末200に送信する。そして、端末200は、Webページ231を端末200のディスプレイ230に表示することによって、音声認識テキスト232を表示する(ステップS112)。なお、Webページ231ではなく議事録作成用のアプリケーション画面が、サーバ100のCPU110によって作成され、端末200のディスプレイ230に表示させてもよい。また、Webページ231は、端末200のプロジェクタ280によってスクリーンに映し出されて会議参加者に共有される。
【0061】
次に、議事録233の作成を開始する場合(ステップS114にてYESである場合)、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成命令および議事録作成方法の選択結果を受け付け(ステップS116)、選択された議事録作成方法に基づいて議事録233を作成する処理を実行する。なお、議事録233を作成する処理は、会議の終了後に実行されてもよいし、会議中に実行されてもよい。
【0062】
議事録233をまだ作成しない場合(ステップS114にてNOである場合)、ステップS102〜ステップS112の処理が繰り返される。
【0063】
−ステップS118における処理−
図9に示されるように「キーワードによる議事録作成」が選ばれた場合、サーバ100のCPU110は、キーワード辞書を基に議事録233を自動的に作成する。より詳細には、会議参加者等は、
図2に示されるように、マウスポインタ240Aを用いて「キーワードによる議事録作成ボタン234」を選ぶ(例えば、クリックする)。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト232を選択して議事録233を自動的に作成する。例えば、キーワード辞書に「売上」「B社」が登録されている場合、サーバ100のCPU110は、
図2に示されるように、「売上」「B社」を含んでいる破線で囲まれた音声認識テキスト232を自動的に選択する。そして、サーバ100のCPU110は、
図2に示されるように、選択した音声認識テキスト232から議事録233を自動的に作成する。
【0064】
−ステップS120における処理−
図9に示されるように「AIによる議事録作成」が選ばれた場合(サーバ100のCPU110がステップS120の処理を実行する場合)、サーバ100のCPU110は、学習モデルに基づいてAIで議事録233を自動的に作成する。より詳細には、会議参加者等は、マウスポインタ240Aを用いて「AIによる議事録作成ボタン235」を選ぶ(例えば、クリックする)。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基に音声認識テキスト232を選択して議事録233をAIで自動的に作成する。
【0065】
−ステップS122における処理−
図9に示されるように「ユーザ投票による議事録作成」が選ばれた場合、サーバ100のCPU110は、会議参加者等の投票を基に議事録233を作成する。より詳細には、各会議参加者等は、
図3に示されるように、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、議事録233に残すべきと判断した音声認識テキスト232に投票する。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は3人分の投票とし、「佐藤」による投票は2人分の投票とする。そして、サーバ100のCPU110は、得票が所定値以上(例えば、3人以上)である音声認識テキスト232を選択し、選択した音声認識テキスト232から議事録233を作成する。また、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。なお、自身の名前の欄のチェックボックス237を選択した各会議参加者等がマウスポインタ240Aを用いて同じチェックボックス237をもう一度選択した場合、議事録233に残すべきと判断した音声認識テキスト232に対する投票を取り消す処理が行われてもよい。そして、この取り消し処理によってその音声認識テキスト232の得票が所定値以上から所定値未満になった場合、議事録233に残されていたその音声認識テキスト232は議事録233から削除されてもよい。
【0066】
また、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票をさらに受け付ける。言い換えれば、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、議事録233に残すべきではないと判断する会議参加者等の投票をさらに受け付ける。なお、説明の便宜上、議事録233に残すための投票をした会議参加者等を「第1会議参加者等」と称し、議事録233に残す投票をした会議参加者等(第1会議参加者等)以外の会議参加者等を「第2会議参加者等」と称する。まず、サーバ100のCPU110は、例えば、第1会議参加者等の投票によって議事録233に残すべきと判断された各音声認識テキスト232の側に投票者切換ボタンを表示させる。そして、マウスポインタ240Aを用いて投票者切換ボタンが選ばれると、サーバ100のCPU110は、その音声認識テキスト232において、第2会議参加者等からの投票を受け付ける状態になる。例えば、議事録233に残すべきと判断された音声認識テキスト232の1つにおいて、「佐藤」および「鈴木」が第1会議参加者等であり、「田中」が第2会議参加者等である場合、「田中」からの投票を受け付ける状態になる。そして、第2会議参加者等は、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、その音声認識テキスト232に投票する。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各第2会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は3人分の投票とする。そして、サーバ100のCPU110は、得票が所定値以上(例えば、3人以上)である音声認識テキスト232を議事録233に含めないようにする。なお、上述の通り、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。
【0067】
そして、ステップS118、S120またはS122のいずれかの処理が終わると、サーバ100のCPU110は、作成した議事録233を表示するためにWebページ231を更新する。そして、端末200は、Webページ231を端末200のディスプレイ230に表示することによって、議事録233を表示する(ステップS124)。
【0068】
そして、他の議事録作成方法(キーワードによる議事録作成、AIによる議事録作成およびユーザ投票による議事録作成のうち、まだ選ばれていない議事録作成方法)をさらに選ぶ場合(ステップS126にてYESである場合)、サーバ100のCPU110は、ステップS116からの処理を繰り返す。なお、他の議事録作成方法がさらに選ばれた場合であっても、他の議事録作成方法と先の議事録作成方法との両方によって選択された音声認識テキスト232は、重複して議事録233に残されない。例えば、先にステップS116においてキーワード選択が選ばれて、「田中:1週目の売り上げが・・・」という音声認識テキスト232が選択されて議事録233に残されたとする。そして、次にステップS116においてAI選択が選ばれて、「田中:1週目の売り上げが・・・」という音声認識テキスト232が選択された場合であっても、この音声認識テキスト232は重複して議事録233に残されない。
【0069】
他の議事録作成方法をさらに選ばない場合(ステップS126においてNOである場合)、サーバ100のCPU110は、会議を終了させるための入力情報(例えば、会議参加者等が会議終了ボタン(図示せず)を選んだという情報)を端末200から受け付けて今回の処理を終了し、会議が継続する場合はステップS104からの処理を繰り返す。
【0070】
なお、会議参加者等は、音声認識テキスト232が出力された後に、必要に応じて音声認識テキスト232の内容の一部または全部を修正することができる。例えば、会議参加者等は、端末200の操作部240等を用いて、Webページ231内の音声認識テキスト232の内容の一部または全部を選択し、選択した内容の修正指示を行う。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの修正指示を受け付け、音声認識テキスト232を修正する。そして、サーバ100のCPU110は、Webページ231を更新し、端末200は、修正内容が反映されたWebページ231を端末200のディスプレイ230に表示する。
【0071】
なお、会議参加者等は、議事録233が作成された後に、必要に応じて議事録233の内容の一部または全部を削除することができる。例えば、会議参加者等は、
図4に示されるように、マウスポインタ240Aを用いて、Webページ231内の議事録233の内容の一部または全部を選択し、選択した内容の削除指示を行う。
図4では、議事録233において「鈴木」が発言した内容の一部である「えーっと」が選択されている。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの削除指示を受け付け、選択された内容を削除する。そして、サーバ100のCPU110は、Webページ231を更新する。端末200は、
図4に示されるように、選択された内容の削除が反映されたWebページ231を端末200のディスプレイ230に表示する。
【0072】
また、例えば、「議事録233」と「議事録233から削除された内容」との関係性等に基づいて、AIを利用して生成されたモデルを用いて、議事録233の内容の一部または全部が自動的に削除されてもよい。
【0073】
以上の通り、本発明の第1実施形態に係る議事録作成システム1は、全体として、
図10の機能ブロック図に示すように、入力装置200Aと、音声認識部100Aと、情報処理部100Bと、選択部100Cと、表示部200B等を有する。
【0074】
そして、入力装置200Aは、例えば、端末200の操作部240、端末200のマイク270等である。音声認識部100Aは、例えば、サーバ100のCPU110がメモリ120のプログラム(
図9のステップS106〜S108等の処理を実行するためのプログラム)を実行することによって実現される。情報処理部100Bは、例えば、サーバ100のCPU110がメモリ120のプログラム(
図9のステップS110〜S122等の処理を実行するためのプログラム)を実行することによって実現される。選択部100Cは、例えば、端末200の操作部240介したキーワード辞書選択命令を受け付けたサーバ100のCPU110がメモリ120のプログラムを実行することによって実現される。表示部200Bは、例えば、端末200のディスプレイ230等である。
【0075】
<本発明の第1実施形態に係る議事録作成システム1の特徴>
(1)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、
図2〜4に示されるようなWebページ231を作成する。Webページ231は、エリア231Aおよびエリア231Bから構成されている。エリア231Aには議事録233が表示され、エリア231Bには音声認識テキスト232が表示される。そして、議事録233は、選択された音声認識テキスト232の内容から作成されている。このため、この議事録作成システム1では、議事録233の閲覧者が会議の要点を容易に把握することができる。また、どの音声認識テキスト232が選択されて議事録233が作成されているかを確認することができ、議事録233に残すべき音声認識テキスト232が選択されていないことを見落とさないようにすることができる。
【0076】
(2)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト232を選択して議事録233を自動的に作成することができる。このため、この議事録作成システム1では、手間をかけることなく議事録233を作成することができる。
【0077】
(3)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基にAIで音声認識テキスト232を選択して議事録233を自動的に作成することができる。このため、本発明の第1実施形態に係る議事録作成システム1では、手間をかけることなく議事録233を作成することができる。
【0078】
(4)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各第1会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理をする。そして、サーバ100のCPU110は、得票が所定値以上である音声認識テキスト232を選択し、選択した音声認識テキスト232から議事録233を作成する。また、サーバ100のCPU110は、第1会議参加者等によって議事録233に残すべきと判断された音声認識テキスト232において、サーバ100の通信インターフェイス150を介して、各第2会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理をする。そして、サーバ100のCPU110は、得票が所定値以上である音声認識テキスト232を議事録233に含めないようにする。このため、この議事録作成システム1では、影響力のある人物等の意思を反映させやすくすることができると共に、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録233を作成することができる。
【0079】
(5)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、「取得した音声を発した会議参加者名」および「取得した音声の認識結果」を音声認識テキスト232として出力する。そして、この音声認識テキスト232から議事録233が作成される。このため、この議事録作成システム1では、音声認識テキスト232内および議事録233内に示された発言がどの会議参加者等による発言であるかを特定することができる。
【0080】
(6)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、音声認識テキスト232が出力された後に、必要に応じて音声認識テキスト232の内容の一部または全部を修正することができる。このため、この議事録作成システム1では、音声の認識結果に誤りがある場合、その認識結果を修正することで正しい結果を会議参加者等に伝えることができ、延いては音声の誤った認識結果から議事録233が作成されることを防止することができる。
【0081】
(7)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、議事録233が作成された後に、必要に応じて議事録233の内容の一部または全部を削除することができる。つまり、議事録233に残すべきではない内容(例えば、一定の役職以上の人にのみ共有されている情報、企業秘密情報等)が選択されて議事録233として作成されていた場合に、当該内容を削除することができる。このため、この議事録作成システム1では、作成された議事録233から情報漏洩等が起きることを防ぐことができる。
【0082】
<変形例>
(A)
本発明の第1実施形態に係る議事録作成システム1のサーバ100や端末200等の各装置の役割の一部または全部を他の装置が実行してもよい。例えば、
図10に示される音声認識部100A、情報処理部100Bおよび選択部100Cが、端末200や他の装置によって実現されてもよい。あるいは、端末200のCPU210がメモリ220のプログラムを実行することによって、
図9に示される処理の一部または全部が実現されてもよい。サーバ100のCPU110が、端末200から送信された音声データ受信し、音声の内容を認識して認識結果を音声認識テキスト232として出力していたが、例えば、端末200のCPU210が、音声の内容を認識して認識結果を音声認識テキスト232として出力してもよい。かかる場合、端末200は、端末200の通信インターフェイス250を介して音声認識テキスト232をサーバ100に送信することになる。なお、
図9に示される処理の一部または全部を実行するためのプログラムを、端末200がインターネット等を介してダウンロード可能であることが好ましい。
【0083】
(B)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、端末200のマイク270の識別情報を第1照合テーブル121に照合して、取得した音声を発した会議参加者名を特定していた。しかし、例えば、会議参加者の声紋データをあらかじめサーバ100のメモリ120等に記憶しておき、サーバ100のCPU110が、取得した音声を声紋データと照合して声紋認証を行い、取得した音声を発した会議参加者名(マイク270の使用者名)を認識してもよい。
【0084】
(C)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、選択された議事録作成方法に基づいて議事録233を作成する処理を実行していた。しかし、サーバ100のCPU110は、取得した音声の音量を認識し、その音声の音量が所定値以上である場合にその音声の内容を議事録233に含めてもよい。
【0085】
(D)
本発明の第1実施形態に係る議事録作成システム1では、ステップS116にて「ユーザ投票による議事録作成」が選ばれた場合、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各会議参加者等の投票を端末200から受け付け、重み付け処理をしていた。しかし、サーバ100のCPU110は、各会議参加者等の投票を受け付けても、重み付け処理をしなくてもよい。
【0086】
(E)
本発明の第1実施形態に係る議事録作成システム1では、ステップS116にて「ユーザ投票による議事録作成」が選ばれた場合、各会議参加者等が、
図3に示されるように、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、議事録233に残すべきと判断した音声認識テキスト232に投票していた。しかし、会議参加者等のうち権限のある者を1人選任し、権限のある者のみが、議事録233に残すべきと判断した音声認識テキスト232を選択してもよい。かかる場合、
図12に示されるように、各音声認識テキスト232の左側に隣接するようにラジオボタン236が配設され、権限のある者は、ラジオボタン236を選択することで、議事録233に残すべきと判断した音声認識テキスト232を選択して議事録233を作成するとよい。なお、各音声認識テキスト232の左側にラジオボタン236およびチェックボックス237が配設され、「権限のある者のみがラジオボタン236を選択する方法」および「各会議参加者等がチェックボックス237を選択する方法」の両方によって議事録233として残す音声認識テキスト232が決められてもよい。例えば、ある音声認識テキスト232において各会議参加者等がチェックボックス237を選択して投票していない場合、権限のある者がラジオボタン236を選択すればその音声認識テキスト232は議事録233として残される。また、ある音声認識テキスト232において各会議参加者等がチェックボックス237を選択して投票している場合、その投票による得票が所定値以上であるか所定値未満であるかにかかわらず、権限のある者がラジオボタン236を選択すればその音声認識テキスト232は議事録233として残される。また、ある音声認識テキスト232において権限のある者がラジオボタン236を選択していない場合、各会議参加者がチェックボックス237を選択して投票し、その投票による得票が所定値以上であればその音声認識テキスト232は議事録233として残される。また、権限のある者は、議事録233に残すべきと判断した音声認識テキスト232を議事録233にドラッグアンドドロップすることで議事録233を作成してもよい。
【0087】
(F)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、
図4に示されるように、マウスポインタ240Aを用いて、Webページ231内の議事録233の内容の一部または全部を選択し、選択した内容の削除指示を行っていた。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの削除指示を受け付け、選択された内容を削除していた。しかし、サーバ100のCPU110は、選択された内容の削除の可否を投票によって受け付けてもよい。そして、サーバ100のCPU110は、得票が所定値以上である場合、選択された内容を削除する。なお、サーバ100のCPU110は、投票受け付けた際に、所定の重み係数に従って各投票を重み付け処理してもよい。
【0088】
(G)
本発明の第1実施形態に係る議事録作成システム1において、会議参加者等の話し方の癖、会議参加者等の方言、会議の議題、企業内や業界内でのみで使用される用語(例えば、社内用語、業界用語等)等に対応した音声認識を行うための音声認識辞書がサーバ100のメモリ120に記憶されてもよい。かかる場合、サーバ100のCPU110は、AIによる学習を利用することによって、音声認識辞書を基に、取得した音声の内容を認識する。これによって、取得した音声の内容の認識結果の精度を向上させることができる。
【0089】
(H)
本発明の第1実施形態に係る議事録作成システム1において、企業内や業界内のみで使用される用語を一般的な用語に変換するための変換辞書がサーバ100のメモリ120に記憶されてもよい。これによって、企業内や業界内のみで使用される用語を知らない者が議事録233を閲覧しても会議の内容を理解することができ、変形例(I)に記載の翻訳処理時に翻訳結果の精度を向上させることができる。
【0090】
(I)
本発明の第1実施形態に係る議事録作成システム1は、多言語(少なくとも2つ以上の言語)が用いられる場合であっても適用することができる。まず、会議参加者が発した音声の言語で出力された音声認識テキスト232が、1つのWebページ231内のエリア231Bに表示される。次に、音声認識テキスト232が、会議参加者が発した音声の言語以外の1または複数の言語に翻訳され、翻訳結果が、会議参加者が発した音声の言語以外の言語毎に翻訳テキストとして出力される。そして、会議参加者が発した音声の言語以外の言語毎にWebページ231が作成されて、各Webページ231内のエリア231Bに各翻訳テキストが表示される。つまり、会議で用いられる言語の数だけWebページ231が作成されて、各Webページ231が端末200に並べられて表示されることになる。このため、会議参加者等は、多言語による会議であっても、各会議参加者等の言語で議事録233を確認することができる。なお、音声認識テキスト232を取得した音声以外の言語に翻訳する処理は、サーバ100のCPU110によって行われるとよい。かかる場合、会議参加者等は、使用されるマイク毎にそのマイクの使用者名に加えてそのマイクの使用者の言語等を格納した照合テーブル(図示せず)を会議前に作成しておくとよい。これによって、会議参加者が発した音声の言語(例えば、日本語)を認識することができると共に、会議参加者が発した音声の言語を他のどの言語(例えば、英語、中国語等)に翻訳するかを認識することができる。
【0091】
また、かかる場合、会議参加者等は、翻訳テキストの内容の一部または全部を必要に応じて修正してもよい。例えば、会議参加者等は、端末200の操作部240等を用いて、翻訳テキストの一部または全部を選択し、選択した内容の修正指示を行う。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの修正指示を受け付け、翻訳テキストを修正する。これによって、誤った翻訳結果から議事録233が作成されることを防止することができる。
【0092】
さらに、かかる場合、サーバ100のメモリ120は、会議の議題に適した翻訳を行うための翻訳辞書(用語、対訳データ、文章データ等)を記憶してもよい。翻訳辞書は、例えば、化学分野における専門用語に重点を置いたもの、企業や業界における専門用語重点を置いたもの等である。なお、翻訳辞書内の用語は、随時追加および変更されてメモリ120に記憶されてもよいし、新しい翻訳辞書が追加されてメモリ120に記憶されてもよい。そして、会議参加者等は、会議が始まる前に、会議の議題に適した翻訳を行うための翻訳辞書の選択を行うことになる。かかる場合、AIを利用することによって、選択された翻訳辞書を基に、翻訳処理が実行される。なお、会議参加者等は、1つの翻訳辞書だけを選択してもよいし、複数の翻訳辞書を選択してもよい。会議参加者等は、複数の翻訳辞書を選択する場合に翻訳辞書毎に優先度を設定してもよく、設定された優先度の順に翻訳処理が実行される。また、会議参加者等は、会議中であっても会議の議題が変更される場合に、翻訳辞書を切り換えるために改めて翻訳辞書の選択を行ってもよい。
【0093】
(J)
第1実施形態に係る議事録作成システム1において、サーバ100のCPU110は、作成された議事録233から音声合成により音声データを生成してもよい。これによって、会議参加者等は、端末200(例えば、パーソナルコンピュータやタブレット端末やスマートフォン)のスピーカ260やデジタルオーディオプレーヤー等から出力される音声を聞くことで、視覚で確認しなくても会議の内容を把握することができる。
【0094】
(K)
第1実施形態に係る議事録作成システム1において、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、「議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票」をさらに受け付けていた。そして、サーバ100のCPU110は、その投票による得票が所定値以上である音声認識テキスト232を議事録233に含めないようにしていた。しかし、サーバ100のCPU110は、「議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票」だけでなく、「議事録233に残すための投票をした会議参加者等の投票」も受け付けてもよい。これは、一度は議事録233に残すための投票をしたが議事録233に残すべきではないという考えに変わった会議参加者等からの投票を受け付けるためである。
【0095】
−第2実施形態−
上記の第1実施形態に係る議事録作成システム1は、1つの会議室において会議が行われる場合に使用されるものであった。しかし、上記の技術は、例えば、
図11に示されるようなウェブ会議が行われる場合であっても適用することができる。ただし、本発明の第2実施形態に係る議事録作成システム2において、端末200は、各会議参加者に1つずつ用意されており、プロジェクタ280を含まなくてもよい。本発明の第2実施形態に係る議事録作成システム2において、
図11に示される各端末200が、上記の第1実施形態に係る議事録作成システム1にて説明したWebページ231を表示する。
【0096】
なお、第2実施形態に係る議事録作成システム2において、上記の変形例(A)〜(K)が適用されてもよい。ただし、変形例(I)が適用される場合、会議参加者等が使用している各端末200は、会議で用いられる言語の数だけ作成されたWebページ231を並べて表示しなくてもよく、1つのWebページ231だけを表示するとよい。例えば、「日本語」を話す会議参加者等が使用している端末200には、「日本語」による自身の音声認識テキスト232と、「日本語以外の言語(例えば、英語)」を話す会議参加者の音声認識テキスト232を「日本語」に翻訳した翻訳テキストとが表示されたWebページ231が表示されればよい。
【0097】
さらに、変形例(I)が適用される場合、音声認識テキスト232または翻訳テキストの内容の一部または全部が修正されている際、修正中であることが各端末200に表示されてもよい。例えば、音声認識テキスト232または翻訳テキストの内容の一部または全部が修正されている際、「修正されている音声認識テキスト232に対応する翻訳テキスト」または「修正されている翻訳テキストに対応する音声認識テキスト232または翻訳テキスト」の横に通知マークが表示されるとよい。そして、修正が完了すると、通知マークが表示されなくなるとよい。
【解決手段】議事録作成システム1は、音声認識部とおよび情報処理部を備えたサーバ100と端末200で構成される。サーバ100の音声認識部は、マイク270で取得した音声を認識し、サーバ100の情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。