(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024129760
(43)【公開日】2024-09-27
(54)【発明の名称】情報処理システム、情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06Q 10/10 20230101AFI20240919BHJP
G10L 15/00 20130101ALI20240919BHJP
G10L 15/22 20060101ALI20240919BHJP
【FI】
G06Q10/10
G10L15/00 200U
G10L15/22 453
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023039169
(22)【出願日】2023-03-13
(71)【出願人】
【識別番号】398018021
【氏名又は名称】株式会社アドバンスト・メディア
(74)【代理人】
【識別番号】100127384
【弁理士】
【氏名又は名称】坊野 康博
(72)【発明者】
【氏名】高木 泰之
(72)【発明者】
【氏名】志村 亮一
(72)【発明者】
【氏名】三部 瞬
(72)【発明者】
【氏名】松本 勇也
(72)【発明者】
【氏名】佐野 圭亮
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA11
5L049AA11
(57)【要約】
【課題】音声認識を用いて、より適切に議事録を作成可能な技術を実現する。
【解決手段】情報処理システム1は、タグ・議題振り分け処理部255と、議事録作成処理部257と、を備える。タグ・議題振り分け処理部255は、会議の発話内容を表すテキストデータに属性を設定するための設定条件に基づいて、会議において発話された音声に基づくテキストデータに対し、設定条件に従って属性を設定する。議事録作成処理部257は、複数の領域を含む会議の議事録の構成を表す議事録テンプレートに基づいて、タグ・議題振り分け処理部255によって属性が設定されたテキストデータを議事録の構成における所定領域に入力する。
【選択図】
図8
【特許請求の範囲】
【請求項1】
会議の発話内容を表すテキストデータに属性を設定するための設定条件に基づいて、会議において発話された音声に基づくテキストデータに対し、前記設定条件に従って前記属性を設定する属性設定手段と、
複数の領域を含む会議の議事録の構成を表す議事録テンプレートに基づいて、前記属性設定手段によって前記属性が設定された前記テキストデータを前記議事録の構成における所定領域に入力する議事録作成手段と、
を備えることを特徴とする情報処理システム。
【請求項2】
前記設定条件として、議事の特徴を表す表現及び当該表現を含む発話の構成が定義されていることを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記議事録テンプレートに含まれる前記領域は、前記設定条件が設定されている前記属性と対応付けられていることを特徴とする請求項1または2に記載の情報処理システム。
【請求項4】
会議において発話された音声に基づく前記テキストデータを前記議事録の所定領域に入力する操作を受け付ける操作受付手段を備えることを特徴とする請求項1または2に記載の情報処理システム。
【請求項5】
前記操作受付手段は、前記会議における発話の音声の進行と並行して、前記議事録に対する前記操作を受け付けることを特徴とする請求項4に記載の情報処理システム。
【請求項6】
前記議事録テンプレートには、前記会議の議題が設定され、
前記操作受付手段は、前記会議の進行と並行して、当該会議における発話内容に対する前記議題の設定を受け付けることを特徴とする請求項4に記載の情報処理システム
【請求項7】
前記操作受付手段は、前記会議における発話の音声の前記テキストデータが入力された前記議事録に対して、内容を変更する操作を受け付けることを特徴とする請求項4に記載の情報処理システム。
【請求項8】
前記議事録テンプレートには、前記会議の議題毎の予測時間が設定され、
前記議事録作成手段は、前記会議の進行に応じて、前記予測時間に対する前記議題の経過時間に関する情報を報知することを特徴とする請求項1または2に記載の情報処理システム。
【請求項9】
会議の発話内容を表すテキストデータに属性を設定するための設定条件に基づいて、会議において発話された音声に基づくテキストデータに対し、前記設定条件に従って前記属性を設定する属性設定手段と、
複数の領域を含む会議の議事録の構成を表す議事録テンプレートに基づいて、前記属性設定手段によって前記属性が設定された前記テキストデータを前記議事録の構成における所定領域に入力する議事録作成手段と、
を備えることを特徴とする情報処理装置。
【請求項10】
情報処理システムが実行する情報処理方法であって、
会議の発話内容を表すテキストデータに属性を設定するための設定条件に基づいて、会議において発話された音声に基づくテキストデータに対し、前記設定条件に従って前記属性を設定する属性設定ステップと、
複数の領域を含む会議の議事録の構成を表す議事録テンプレートに基づいて、前記属性設定ステップにおいて前記属性が設定された前記テキストデータを前記議事録の構成における所定領域に入力する議事録作成ステップと、
を含むことを特徴とする情報処理方法。
【請求項11】
コンピュータに、
会議の発話内容を表すテキストデータに属性を設定するための設定条件に基づいて、会議において発話された音声に基づくテキストデータに対し、前記設定条件に従って前記属性を設定する属性設定機能と、
複数の領域を含む会議の議事録の構成を表す議事録テンプレートに基づいて、前記属性設定機能によって前記属性が設定された前記テキストデータを前記議事録の構成における所定領域に入力する議事録作成機能と、
を実現させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
従来、会議の議事録を作成する労力を軽減するため、会議の議事録の作成を支援するシステムが提案されている。
このようなシステムでは、例えば、音声認識を用いて会議における参加者の発言をテキスト化し、発言のテキストデータを分類したり、重要と推定される発言を抽出したりすることにより、議事録が作成されている。
なお、特許文献1には、発話による音声からテキストを認識し、その発話内容が属性に応じて分類された議事録等の文書を作成する文書記録装置が記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術においては、発話内容に適切な属性を付与することが容易ではなく、属性が付与されない発話内容も生じ得る。
この場合、発話内容を属性に基づいて分類すること等が困難となり、音声認識を用いて会議の議事録を作成する上で支障を来すこととなる。
このように、従来の技術においては、音声認識を用いて適切に議事録を作成する上で、改善の余地があった。
【0005】
本発明の課題は、音声認識を用いて、より適切に議事録を作成可能な技術を実現することである。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一態様の情報処理システムは、
会議の発話内容を表すテキストデータに属性を設定するための設定条件に基づいて、会議において発話された音声に基づくテキストデータに対し、前記設定条件に従って前記属性を設定する属性設定手段と、
複数の領域を含む会議の議事録の構成を表す議事録テンプレートに基づいて、前記属性設定手段によって前記属性が設定された前記テキストデータを前記議事録の構成における所定領域に入力する議事録作成手段と、
を備えることを特徴とする。
【発明の効果】
【0007】
本発明によれば、音声認識を用いて、より適切に議事録を作成可能な技術を実現することができる。
【図面の簡単な説明】
【0008】
【
図1】第1実施形態に係る情報処理システム1のシステム構成を示す模式図である。
【
図2】議事録テンプレート作成画面の一例を示す模式図である。
【
図3】タグテンプレート作成画面の一例を示す模式図である。
【
図6】作成された議事録の一例を示す模式図である。
【
図7】端末装置10、議事録作成サーバ20あるいは音声認識サーバ30を構成する情報処理装置800のハードウェア構成を示す模式図である。
【
図8】情報処理システム1の機能的構成を示すブロック図である。
【
図9】情報処理システム1が実行するテンプレート作成処理の流れを示すフローチャートである。
【
図10】情報処理システム1が実行する議事録作成処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について、図面を用いて説明する。
[第1実施形態]
本実施形態に係る情報処理システムにおいては、議事録を作成する際に、作成される議事録のレイアウトを定義した議事録テンプレート及び発話内容に属性(タグ)を付与する条件を設定したタグテンプレートが予め用意される。議事録のレイアウトには、複数の領域が含まれ、議事録のレイアウトにおける領域の少なくとも一部は、タグテンプレートによって設定される属性(タグ)と対応付けられている。
そして、会議の音声を音声認識処理することで得られるテキストデータを対象として、タグテンプレートを適用し、タグの付与条件に適合する発話内容に対し、発話単位で自動的にタグを付与する。また、発話内容に付与されたタグに基づいて、会議の音声のテキストデータを議事録テンプレートにおける各領域に当て嵌めることで、会議の議事録を作成する。なお、議事録を作成するためのユーザインターフェース画面では、会議の音声のデータにおいて、タグが付与されていない発話をユーザの操作によって議事録に追加したり、会議において議題となっている事項を議事録に追加したりする等の操作が受け付けられる。
そのため、ユーザが想定した条件によって、発話内容に自動的にタグを付与することができると共に、ユーザが求める形態の議事録における適切な領域に、発話内容を記録することができる。
したがって、本実施形態における情報処理システムによれば、音声認識を用いて、より適切に議事録を作成可能な技術を実現することが可能となる。
【0010】
図1は、本実施形態に係る情報処理システム1のシステム構成を示す模式図である。
図1に示すように、本実施形態に係る情報処理システム1は、複数の端末装置10と、議事録作成サーバ20と、音声認識サーバ30と、を含んで構成され、端末装置10、議事録作成サーバ20及び音声認識サーバ30は、インターネット等のネットワーク40を介して通信可能に構成される。
【0011】
端末装置10は、例えば、PC(Personal Computer)あるいはタブレット端末等の情報処理装置によって構成され、議事録を作成するユーザによって使用される。端末装置10は、議事録を作成するユーザがタグテンプレート及び議事録テンプレートを作成する処理や、議事録を作成する処理におけるユーザインターフェース画面(UI画面)を表示する。また、端末装置10は、議事録の作成対象となる会議の音声データを音声認識サーバ30に送信し、会議の音声をテキストデータに変換する。なお、端末装置10から音声認識サーバ30に会議の音声データを送信することに代えて、端末装置10から議事録作成サーバ20に会議の音声データを送信し、議事録作成サーバ20が音声認識サーバ30に会議の音声データを送信することで、会議の音声をテキストデータに変換することも可能である。
【0012】
議事録作成サーバ20は、例えば、サーバコンピュータ等の情報処理装置によって構成され、タグテンプレート及び議事録テンプレートを作成する処理や、議事録を作成する処理において、端末装置10に所定のUI画面を表示させる。また、議事録作成サーバ20は、端末装置10のUI画面を介して行われた操作(議事録テンプレート及びタグテンプレートを作成するための操作や、議事録を作成するための操作等)の内容を取得し、操作内容に従って、議事録テンプレート、タグテンプレート及び議事録のデータを生成する。
【0013】
具体的には、議事録作成サーバ20は、議事録テンプレートを作成するための議事録テンプレート作成画面、タグテンプレートを作成するためのタグテンプレート作成画面、議事録に記載される会議の議題を入力する議題入力画面、議事録が作成される会議に関する情報を入力する会議情報入力画面、及び、会議の議事録を作成するための議事録作成画面等を端末装置10のUI画面として表示させ、各画面において、ユーザが入力した操作の内容を取得する。そして、議事録作成サーバ20は、タグテンプレート及び議事録テンプレートを会議の音声のテキストデータに適用して、議事録作成画面(初期画面)を生成し、議事録作成画面に対するユーザの操作を反映させながら、議事録作成画面の表示内容を更新する。議事録作成サーバ20は、議事録作成画面に入力された最終的な操作の結果を反映させて、議事録のデータを作成する。
【0014】
図2は、議事録テンプレート作成画面の一例を示す模式図である。
図2に示すように、議事録テンプレート作成画面においては、議事録名、会議日時、議事録作成者、会議参加者、会議の議題、発話内容に設定される属性(タグ)あるいは発話内容のデータ等、議事録のレイアウトを構成する要素を設定する操作(ドラッグ&ドロップ操作等)が受け付けられ、ユーザの意図に応じて、議事録のレイアウトを構成する要素を任意に配置することが可能となっている。即ち、本実施形態において、議事録のレイアウトには、レイアウトの要素に対応する複数の領域が含まれ、議事録のレイアウトにおける領域の少なくとも一部は、タグテンプレートによって設定される属性(タグ)と対応付けられている。また、議事録テンプレート作成画面においては、会議の音声のテキストデータから議事録に入力される情報のみならず、議事録を装飾等するために議事録のレイアウトに設定される破線、実線、表、自由入力可能なテキスト欄等の要素(レイアウト要素)も任意に配置することが可能となっている。議事録テンプレート作成画面において、ユーザは、会議の種類や議事録の配布先等、各種目的に応じて、議事録に適用する議事録テンプレートを作成することができる。
【0015】
図3は、タグテンプレート作成画面の一例を示す模式図である。
図3に示すように、タグテンプレート作成画面においては、発話内容の属性を表す「タグ」がアイコンの形式で用意されており、ユーザは、各アイコンにラベル(名称)を設定することが可能となっている。また、タグテンプレート作成画面において、タグを設定するための「条件」は、発話内容に自動的にタグを付与するためのルールを表している。タグを設定するための「条件」として、議事(会議で議論される事項)の特徴を表す表現及びその表現を含む発話の構成を定義することができる。例えば、議事の特徴を表す表現として、単語や句等を定義することができ、議事の特徴を表す表現を含む発話の構成として、文字数、正規表現、発話者等を定義することができる。一例として、
図3に示すタグテンプレート作成画面においては、「決定」という単語(議事の特徴を表す表現)を含む「8文字以上の文字数である」発話内容に対して、優先度が最も高い「1」の星印で表されるタグを設定するというルールが作成されている。
【0016】
なお、単一の発話内容のみならず、注目する発話内容の前後の発話に対してタグを設定するようにルールを作成すること等も可能である。また、本実施形態において、議事録テンプレートに対して1つのタグテンプレートを用意したり、議事録テンプレートの議題等に応じて複数のタグテンプレートを用意したりすることが可能である。議事録テンプレートの議題等に応じて複数のタグテンプレートが用意された場合、議事録を作成する処理において、議題が切り替えられることに対応して、タグテンプレートを自動的に切り替えることとしてもよい。
【0017】
図4は、議題入力画面の一例を示す模式図である。
図4に示すように、議題入力画面においては、議事録を作成する会議における議題名の入力が受け付けられる。議事録を作成する会議における議題名については、会議全体において1つの議題名を設定することや、会議の部分毎に異なる議題名を設定することが可能である。また、議題入力画面においては、議題名に対して、その議題に要する予測時間を入力することや、各議題の概要等を自由に入力することが可能となっている。議題入力画面において設定された議題のデータは、会議中に議事録作成画面とは別の画面として表示することが可能であり、議題毎の時間の経過や各議題の内容を確認することができる。
【0018】
図5は、議事録作成画面の一例を示す模式図である。
図5に示すように、議事録作成画面の初期画面には、会議名「2022年の開発スケジュールについて」が表示されると共に、タグが付された発話のデータ及びタグが付されていない発話のデータが議題毎に振り分けられ、全ての発話データが表示された画面として作成される。また、議事録作成画面において、会議名(あるいは会議名横に表示されるアイコン)にマウスオーバーすると、会議情報のデータが表示(ポップアップ表示等)される。会議情報のデータは、例えば、会議名、会議開催時間、会議開始時間、会議終了時間、参加者等、会議に関する情報によって構成される。会議情報のデータとしては、他の会議システムから取得したデータ、ユーザが入力したデータ、あるいは、会議の音声データから取得したデータ等を用いることができる。
【0019】
議事録作成画面には、議題毎に、自動的にタグが付与された発話内容が表示される議題別発話表示領域と、タグが付与されていない発話内容が表示される非分類発話表示領域と、キーワード、発話者、文字数、議題によって、非分類発話表示領域の発話内容の絞り込みを行う検索条件設定領域と、が含まれている。検索条件設定領域において、キーワード等の検索条件を設定して発話内容を選別することで、非分類発話表示領域に表示された発話内容のうち、議事録に使用しないものを非表示としたり、非分類発話表示領域に表示された発話内容を絞り込み、議事録に使用する発話内容として、ドラッグ&ドロップ、あるいは、チェックボックスによる選択及びボタンクリックで、議題別発話表示領域へ移動したりすることができる。また、議題別発話表示領域に表示された発話内容は、議題毎に、議題を識別する表示(発話内容を表す文字に、議題毎に共通する色を付す等)を行うこととしてもよい。また、議題別発話表示領域に表示された発話内容は、ドラッグ&ドロップ、あるいは、ボタンクリックで、非分類発話表示領域へ戻すことができる。また、プレビューボタンを押す操作を行うことで、議事録テンプレートに従い、議題別発話表示領域の発話内容毎にまとめられ、タグが付与された発話が配置された議事録を表示することができる。
【0020】
図6は、作成された議事録の一例を示す模式図である。
図6に示すように、タグテンプレート及び議事録テンプレートを適用して会議の音声のテキストデータが処理されると、タグテンプレートにおける各領域の属性に応じて、発話内容が議事録の所定領域に入力される。
図6に示す例では、議事録テンプレートに設定された会議情報のデータ、議題等が設定されていると共に、属性が付与された発話内容を表すテキストデータが、議事録における適切な属性の領域に入力されている。
【0021】
図1に戻り、音声認識サーバ30は、端末装置10から音声のデータを受け付け、当該音声のデータに対し、音声認識処理を行う。音声認識処理の結果、音声認識サーバ30によって、会議の音声のテキストデータが取得される。また、音声認識サーバ30は、会議の音声の音声認識結果であるテキストデータを議事録作成サーバ20に送信する。
【0022】
[ハードウェア構成]
図7は、端末装置10、議事録作成サーバ20あるいは音声認識サーバ30を構成する情報処理装置800のハードウェア構成を示す模式図である。
図7に示すように、情報処理装置800は、CPU(Central Processing Unit)811と、ROM(Read Only Memory)812と、RAM(Random Access Memory)813と、バス814と、入力部815と、出力部816と、記憶部817と、通信部818と、ドライブ819と、撮像部820と、を備えている。
【0023】
CPU811は、ROM812に記録されているプログラム、または、記憶部817からRAM813にロードされたプログラムに従って各種の処理を実行する。
RAM813には、CPU811が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0024】
CPU811、ROM812及びRAM813は、バス814を介して相互に接続されている。バス814には、入力部815、出力部816、記憶部817、通信部818、ドライブ819及び撮像部820が接続されている。
【0025】
入力部815は、情報処理装置800に対する各種情報の入力を受け付ける。本実施形態において、入力部815は、マウスやキーボード等によって表示画面を介した操作入力を受け付ける操作入力部815aと、マイク等によって音声の入力を受け付ける音声入力部815bとを備えている。
出力部816は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部817は、ハードディスクあるいはDRAM(Dynamic Random Access Memory)等で構成され、各サーバで管理される各種データを記憶する。
通信部818は、ネットワーク40を介して他の装置との間で行う通信を制御する。
【0026】
ドライブ819には、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリ等よりなる、リムーバブルメディア831が適宜装着される。ドライブ819によってリムーバブルメディア831から読み出されたプログラムは、必要に応じて記憶部817にインストールされる。
撮像部820は、レンズ及び撮像素子等を備えた撮像装置によって構成され、被写体のデジタル画像を撮像する。
なお、上記ハードウェア構成は、情報処理装置800の基本的構成であり、一部のハードウェアを備えない構成としたり、付加的なハードウェアを備えたり、ハードウェアの実装形態を変更したりすることができる。例えば、情報処理装置800は、撮像部820を備えない構成としたり、音声認識処理を高速に実行するためのDSP(Digital Signal Processor)を備えたりすることができる。また、情報処理装置800は、入力部815をタッチセンサによって構成し、出力部816のディスプレイに重ねて配置することにより、タッチパネルを備える構成とすることも可能である。
【0027】
[機能的構成]
次に、情報処理システム1の機能的構成について説明する。
図8は、情報処理システム1の機能的構成を示すブロック図である。
図8に示すように、端末装置10のCPU811においては、操作受付部151と、音声データ入力部152と、が機能する。また、議事録作成サーバ20のCPU811においては、議事録テンプレートデータ設定部251と、会議情報データ設定部252と、タグテンプレートデータ設定部253と、議題データ設定部254と、タグ・議題振り分け処理部255と、処理済み発話内容データ入力部256と、議事録作成処理部257と、議事録ファイル出力部258と、が機能する。また、議事録作成サーバ20の記憶部817には、タグテンプレート記憶部271と、議事録テンプレート記憶部272と、議事録記憶部273と、が形成される。さらに、音声認識サーバ30のCPU811においては、音声認識処理部351と、音声認識結果出力部352と、が機能する。
【0028】
端末装置10において、操作受付部151は、端末装置10において情報を入出力するための各種入出力画面(UI画面)の表示を制御する。例えば、操作受付部151は、議事録テンプレート作成画面、タグテンプレート作成画面、議題入力画面、会議情報入力画面及び議事録作成画面を表示する。また、操作受付部151は、UI画面に対する各種操作(情報の入力)を受け付け、受け付けた操作の内容を議事録作成サーバ20あるいは音声認識サーバ30に送信する。
【0029】
本実施形態において、操作受付部151は、会議の進行と並行して(即ち、会議における発話の音声のデータの進行と並行して)、議事録作成画面に対する操作を行い、開催されている会議に対してリアルタイムに議事録を作成する処理を受け付けることができる。また、操作受付部151は、録音された会議の音声のデータを基に作成された議事録(初期データ)に対して、自動的に入力された内容を修正することで、議事録を作成する処理を受け付けることができる。
【0030】
音声データ入力部152は、会議の議事録を作成する際に、会議の音声のデータの入力を受け付け、受け付けた音声のデータを音声認識サーバ30に送信する。これにより、会議の音声のデータがテキストデータに変換される。なお、音声データ入力部152が音声認識サーバ30に会議の音声データを送信することに代えて、音声データ入力部152から議事録作成サーバ20に会議の音声データを送信し、議事録作成サーバ20が音声認識サーバ30に会議の音声データを送信することで、会議の音声をテキストデータに変換することも可能である。
【0031】
音声認識サーバ30のタグテンプレート記憶部271には、タグテンプレート作成画面を介してユーザが作成したタグテンプレートのデータが記憶される。
議事録テンプレート記憶部272には、議事録テンプレート作成画面を介してユーザが作成した議事録テンプレートのデータが記憶される。
議事録記憶部273には、会議の音声のデータから変換されたテキストデータに対して、タグテンプレート及び議事録テンプレートが適用され、さらに、議事録作成画面を介してユーザが操作を行うことで作成された議事録のデータが記憶される。
【0032】
議事録テンプレートデータ設定部251は、議事録テンプレート作成画面を介してユーザが入力した各種情報(装飾等のレイアウト要素)を、議事録テンプレートの項目に設定し、議事録テンプレートのデータを作成する。また、議事録テンプレートデータ設定部251は、作成した議事録テンプレートのデータを議事録テンプレート記憶部272に記憶する。
なお、本実施形態においては、予め用意された議事録テンプレートのデータ(登録済みの議事録テンプレートのデータ)をユーザが選択して利用することが可能となっている。即ち、ユーザは、登録済みの議事録テンプレートのデータを選択し、変更せずに使用したり、一部を自らの要求に応じて変更して使用したりすることが可能である。登録済みの議事録テンプレートのデータとして、会議の内容や議事録の提供先に応じた異なる種類のデータを用意しておくことができる。
【0033】
会議情報データ設定部252は、会議情報入力画面を介してユーザが入力した会議情報を当該会議の議事録テンプレートに設定する。例えば、会議情報データ設定部252は、会議名、会議開催時間、会議開始時間、会議終了時間、参加者等の会議に関する情報を議事録の作成対象となる会議の議事録テンプレートに設定する。
【0034】
タグテンプレートデータ設定部253は、タグテンプレート作成画面を介してユーザが入力した各種情報を、タグテンプレートの項目に設定し、タグテンプレートのデータを作成する。また、タグテンプレートデータ設定部253は、作成したタグテンプレートのデータをタグテンプレート記憶部271に記憶する。
なお、本実施形態においては、予め用意されたタグテンプレートのデータ(登録済みのタグテンプレートのデータ)をユーザが選択して利用することが可能となっている。即ち、ユーザは、登録済みのタグテンプレートのデータを選択し、変更せずに使用したり、一部を自らの要求に応じて変更して使用したりすることが可能である。登録済みのタグテンプレートのデータとして、会議の内容や議事録の提供先に応じた異なる種類のデータを用意しておくことができる。
【0035】
議題データ設定部254は、議題入力画面を介してユーザが入力した、議事録を作成する会議における議題名を当該会議の議事録テンプレートに設定する。例えば、議題データ設定部254は、ユーザの操作に応じて、会議全体において1つの議題名を設定したり、会議の部分毎に異なる議題名を設定したりする。
【0036】
タグ・議題振り分け処理部255は、会議の音声のデータから変換されたテキストデータに対し、タグテンプレート及び当該会議に設定されている議題名を適用し、テキストデータを議題毎に振り分けると共に、設定されている条件に従って、発話内容に属性を表すタグを付与する。
【0037】
処理済み発話内容データ入力部256は、タグ・議題振り分け処理部255によってタグが付与されると共に、議題毎に発話内容が振り分けられた会議のテキストデータ(以下、「処理済み発話内容データ」と称する。)をタグ・議題振り分け処理部255から取得する。また、処理済み発話内容データ入力部256は、タグ・議題振り分け処理部255から取得した処理済み発話内容データを、議事録が作成される際に、議事録作成処理部257に入力する。
【0038】
議事録作成処理部257は、処理済み発話内容データ入力部256から処理済み発話内容データを取得して議事録作成画面の初期画面を表示し、議事録作成画面を介してユーザが行った操作に応じて、議事録の内容を変更する。例えば、議事録作成処理部257は、ユーザの操作に応じて、検索条件設定領域において、キーワード等の検索条件を設定して発話内容を選別し、非分類発話表示領域に表示された発話内容のうち、議事録に使用しないものを非表示としたり、非分類発話表示領域に表示された発話内容を絞り込み、議事録に使用する発話内容として、議題別発話表示領域へドラッグ&ドロップ、あるいは、チェックボックスによる選択及びボタンクリックで移動したりする。また、議事録作成処理部257は、ユーザの操作に応じて、議題別発話表示領域に表示された発話内容を、非分類発話表示領域へドラッグ&ドロップ、あるいは、ボタンクリックで戻したり、プレビューボタンを押す操作に応じて、議事録テンプレートに従い、議事録を表示したりする。さらに、議事録作成処理部257は、ユーザによって、議事録の内容を確定する操作が行われた場合に、議事録のデータを作成し、議事録記憶部273に記憶する。
【0039】
また、議事録作成処理部257は、会議の進行に対し、議事録テンプレートに設定されている議題の予測時間を参照し、経過時間に関する報知情報を端末装置10に送信することができる。例えば、議事録作成処理部257は、予測時間の所定時間前となっていること、予測時間となったこと及び予測時間からの超過時間等を表す報知情報を端末装置10に送信することができる。
【0040】
議事録ファイル出力部258は、議事録記憶部273に記憶された議事録のデータを所定のファイル形式で出力する。例えば、議事録ファイル出力部258は、議事録のデータを文書データ、表形式データ、PDF(Portable Document Format)データあるいはHTML(Hypertext Markup Language)データ等の汎用性の高いファイル形式で出力する。
音声認識サーバ30において、音声認識処理部351は、議事録の作成対象となる会議の音声のデータを受信し、音声認識処理を実行して、会議のテキストデータ(音声認識結果)を取得する。
音声認識結果出力部352は、音声認識処理部351によって取得された音声認識結果を議事録作成サーバ20に送信する。
【0041】
[動作]
次に、情報処理システム1の動作を説明する。
[テンプレート作成処理]
図9は、情報処理システム1が実行するテンプレート作成処理の流れを示すフローチャートである。
テンプレート作成処理は、端末装置10において、テンプレート作成処理の実行を指示する操作が行われることに対応して開始される。
【0042】
テンプレート作成処理が開始されると、ステップS1において、端末装置10の操作受付部151は、議事録テンプレートを作成するための議事録テンプレート作成画面を表示する。
ステップS2において、操作受付部151は、登録済みの議事録テンプレートのデータが選択されたか否かの判定を行う。
登録済みの議事録テンプレートのデータが選択されていない場合、ステップS2においてNOと判定されて、処理はステップS4に移行する。
一方、登録済みの議事録テンプレートのデータが選択された場合、ステップS2においてYESと判定されて、処理はステップS3に移行する。
【0043】
ステップS3において、操作受付部151は、選択された登録済みの議事録テンプレートのデータを議事録テンプレート作成画面に設定する。
ステップS3の後、処理はステップS5に移行する。
ステップS4において、操作受付部151は、ユーザが手動で議事録テンプレートを作成する操作を受け付ける。
ステップS5において、議事録作成サーバ20の議事録テンプレートデータ設定部251は、ユーザによってレイアウト要素を追加する操作が行われたか否かの判定を行う。
ユーザによってレイアウト要素を追加する操作が行われていない場合、ステップS5においてNOと判定されて、処理はステップS7に移行する。
一方、ユーザによってレイアウト要素を追加する操作が行われた場合、ステップS5においてYESと判定されて、処理はステップS6に移行する。
【0044】
ステップS6において、議事録テンプレートデータ設定部251は、追加されたレイアウト要素を議事録テンプレートのデータに反映させる。
ステップS7において、操作受付部151は、議事録テンプレートの作成を終了する操作が行われたか否かの判定を行う。
議事録テンプレートの作成を終了する操作が行われていない場合、ステップS7においてNOと判定されて、処理はステップS1に移行する。
一方、議事録テンプレートの作成を終了する操作が行われた場合、ステップS7においてYESと判定されて、処理はステップS8に移行する。
ステップS8において、議事録テンプレートデータ設定部251は、議事録テンプレートのデータを保存する。
ステップS9において、操作受付部151は、タグテンプレートを作成するためのタグテンプレート作成画面を表示する。
【0045】
ステップS10において、操作受付部151は、登録済みのタグテンプレートのデータが選択されたか否かの判定を行う。
登録済みのタグテンプレートのデータが選択されていない場合、ステップS10においてNOと判定されて、処理はステップS12に移行する。
一方、登録済みのタグテンプレートのデータが選択された場合、ステップS10においてYESと判定されて、処理はステップS11に移行する。
ステップS11において、操作受付部151は、選択された登録済みのタグテンプレートのデータをタグテンプレート作成画面に設定する。
ステップS11の後、処理はステップS13に移行する。
ステップS12において、操作受付部151は、ユーザが手動でタグテンプレートを作成する操作を受け付ける。
【0046】
ステップS13において、操作受付部151は、タグテンプレートの作成を終了する操作が行われたか否かの判定を行う。
タグテンプレートの作成を終了する操作が行われていない場合、ステップS13においてNOと判定されて、処理はステップS9に移行する。
一方、タグテンプレートの作成を終了する操作が行われた場合、ステップS13においてYESと判定されて、処理はステップS14に移行する。
ステップS14において、タグテンプレートデータ設定部253は、タグテンプレートのデータを保存する。
ステップS14の後、テンプレート作成処理は終了する。
【0047】
[議事録作成処理]
図10は、情報処理システム1が実行する議事録作成処理の流れを示すフローチャートである。
議事録作成処理は、端末装置10において、議事録作成処理の実行を指示する操作が行われることに対応して開始される。
【0048】
議事録作成処理が開始されると、ステップS21において、操作受付部151は、議事録を作成するための設定画面を表示する。
ステップS22において、操作受付部151は、ユーザによる議事録テンプレートの選択を受け付ける。
ステップS23において、操作受付部151は、ユーザによるタグテンプレートの選択を受け付ける。
ステップS24において、操作受付部151は、議事録の作成を開始するための「会議作成」ボタンの押下を受け付ける。
【0049】
ステップS25において、音声データ入力部152は、会議の音声のデータの入力を受け付け、入力された音声のデータを音声認識サーバ30に送信する。
ステップS26において、音声認識処理部351は、音声認識処理を実行して、会議のテキストデータ(音声認識結果)を取得する。
ステップS27において、議事録作成サーバ20のタグ・議題振り分け処理部255は、会議の音声のデータから変換されたテキストデータに対し、タグテンプレート及び当該会議に設定されている議題名を適用し、テキストデータを議題毎に振り分けると共に、設定されている条件に従って、発話内容に属性を表すタグを付与する。
【0050】
ステップS28において、操作受付部151は、ユーザによって議事録のデータ(順次生成される議事録のデータ)に対する操作が行われたか否かの判定を行う。
ユーザによって議事録のデータに対する操作が行われていない場合、ステップS28においてNOと判定されて、処理はステップS30に移行する。
一方、ユーザによって議事録のデータに対する操作が行われた場合、ステップS28においてYESと判定されて、処理はステップS29に移行する。
ステップS29において、議事録作成処理部257は、議事録のデータにユーザによる当該操作内容を反映させる。
【0051】
ステップS30において、操作受付部151は、会議が終了したか否か(会議の音声のデータの入力が終了したか否か)の判定を行う。
会議が終了していない場合、ステップS30においてNOと判定されて、処理はステップS25に移行する。
一方、会議が終了した場合、ステップS30においてYESと判定されて、処理はステップS31に移行する。
ステップS31において、タグ・議題振り分け処理部255は、タグが付与されたテキストデータを議事録作成処理部257に出力する。
ステップS32において、操作受付部151は、議事録のデータ(会議全体の議事録のデータ)にユーザによる操作内容を反映させる。
【0052】
ステップS33において、操作受付部151は、議事録作成処理を終了する操作が行われたか否かの判定を行う。
議事録作成処理を終了する操作が行われていない場合、ステップS33においてNOと判定されて、処理はステップS32に移行する。
一方、議事録作成処理を終了する操作が行われた場合、ステップS33においてYESと判定されて、処理はステップS34に移行する。
ステップS34において、議事録作成処理部257は、作成された議事録のデータを議事録記憶部273に記憶する。なお、作成された議事録のデータは、ユーザの要求に応じて、議事録ファイル出力部258により所定の送信先に適宜送信される。
ステップS34の後、議事録作成処理は終了する。
【0053】
以上のように、本実施形態における情報処理システム1では、会議の議事録を作成するためのタグテンプレート及び議事録テンプレートが予め用意されている。タグテンプレートには、議事の特徴を表す表現及びその表現を含む発話の構成が定義されたタグを付与するための条件が設定されている。また、議事録テンプレートには、作成される議事録のレイアウトが定義されている。議事録のレイアウトには、複数の領域が含まれ、議事録のレイアウトにおける領域の少なくとも一部は、タグテンプレートによって設定される属性(タグ)と対応付けられている。
そして、会議の音声のデータを表すテキストデータにタグテンプレートを適用することで、タグを付与する条件に従って、発話内容にタグ(属性)が自動的に付され、発話内容が議事録テンプレートにおける対応する領域に入力される。
また、端末装置10からユーザが議事録の操作を行うことが可能となっており、会議の進行とリアルタイムに、または、終了した会議の音声のデータに事後的に、議事録に対する修正等を行うことができる。
そのため、ユーザが想定した条件によって、発話内容に自動的にタグを付与することができると共に、ユーザが求める形態の議事録における適切な領域に、発話内容を記録することができる。
したがって、本実施形態における情報処理システムによれば、音声認識を用いて、より適切に議事録を作成可能な技術を実現することが可能となる。
【0054】
[変形例1]
上述の実施形態においては、本発明を情報処理システム1として構成した場合を例に挙げて説明したが、これに限られない。例えば、本発明を単体の情報処理装置として構成することができる。
この場合、
図8に示す端末装置10の機能的構成及び議事録作成サーバ20の機能的構成を1つの情報処理装置に実装することで、本発明を実現することができる。また、
図8に示す端末装置10の機能的構成及び議事録作成サーバ20の機能的構成に加え、音声認識サーバ30の機能的構成も1つの情報処理装置に実装することとしてもよい。
【0055】
以上のように構成される情報処理システム1は、タグ・議題振り分け処理部255と、議事録作成処理部257と、を備える。
タグ・議題振り分け処理部255は、会議の発話内容を表すテキストデータに属性を設定するための設定条件に基づいて、会議において発話された音声に基づくテキストデータに対し、設定条件に従って属性を設定する。
議事録作成処理部257は、複数の領域を含む会議の議事録の構成を表す議事録テンプレートに基づいて、タグ・議題振り分け処理部255によって属性が設定されたテキストデータを議事録の構成における所定領域に入力する。
これにより、ユーザが想定した条件によって、発話内容に自動的にタグを付与することができると共に、ユーザが求める形態の議事録における適切な領域に、発話内容を記録することができる。
したがって、本実施形態における情報処理システムによれば、音声認識を用いて、より適切に議事録を作成可能な技術を実現することが可能となる。
【0056】
設定条件として、議事の特徴を表す表現及び当該表現を含む発話の構成が定義されている。
これにより、会議で議論される事項を予め想定して発話内容を抽出し、その発話内容に適切な属性を付与することができる。
【0057】
情報処理システム1は、操作受付部151を備える。
操作受付部151は、会議において発話された音声に基づくテキストデータを議事録の所定領域に入力する操作を受け付ける。
これにより、自動的に発話内容が議事録の所定領域に入力された議事録に対し、ユーザの判断によって、より適切な議事録の内容に修正することができる。
【0058】
操作受付部151は、会議における発話の音声の進行と並行して、議事録に対する操作を受け付ける。
これにより、会議の進行と並行してリアルタイムに議事録を作成することができる。
【0059】
議事録テンプレートには、会議の議題が設定される。
操作受付部151は、会議の進行と並行して、当該会議における発話内容に対する議題の設定を受け付ける。
これにより、会議の進行と並行して、会議の議題を議事録に記録することができ、より適切な議事録の内容とすることができる。
【0060】
操作受付部151は、会議における発話の音声のテキストデータが入力された議事録に対して、内容を変更する操作を受け付ける。
これにより、会議が終了した後に自動的に作成された議事録のデータの内容をより適切なものに修正することができる。
【0061】
議事録テンプレートには、会議の議題毎の予測時間が設定される。
議事録作成処理部257は、会議の進行に応じて、予測時間に対する議題の経過時間に関する情報を報知する。
これにより、議事録の作成を支援すると共に、会議の進行を補助することが可能となる。
【0062】
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
例えば、上述の実施形態においては、会議の議事録を作成する場合に本発明を適用するものとした。ここで、本発明が適用される「会議」の概念には、参加者が発話する各種会合が含まれ、ミーティング、ブリーフィング、打ち合わせ、説明会、研修会等、その名称を問わず、広く本発明を適用することができる。
【0063】
また、上述の実施形態における情報処理システム1のシステム構成は一例であり、情報処理システム1の機能が全体として実現されていれば、より多くのサーバに機能を分散して実装したりすることが可能である。また、情報処理システム1における複数の情報処理装置の機能をより少ない数の情報処理装置にまとめて実装することも可能である。
また、上述の実施形態における情報処理システム1は、クラウドサーバを利用してクラウドシステムとして実現することや、オンプレミスサーバを利用してオンプレミスシステムとして実現することが可能であり、これらの組み合わせで実現することも可能である。
【0064】
また、上述の実施形態に記載された例を適宜組み合わせて、本発明を実施することが可能である。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、
図8の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理システム1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に
図8の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
【0065】
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
【0066】
プログラムを記憶する記憶媒体は、装置本体とは別に配布されるリムーバブルメディア、あるいは、装置本体に予め組み込まれた記憶媒体等で構成される。リムーバブルメディアは、例えば、磁気ディスク、光ディスク、光磁気ディスクあるいはフラッシュメモリ等により構成される。光ディスクは、例えば、CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk),Blu-ray Disc(登録商標)等により構成される。光磁気ディスクは、MD(Mini-Disk)等により構成される。フラッシュメモリは、例えば、USB(Universal Serial Bus)メモリあるいはSDカードにより構成される。また、装置本体に予め組み込まれた記憶媒体は、例えば、プログラムが記憶されているROMやハードディスク等で構成される。
【0067】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
【符号の説明】
【0068】
1 情報処理システム、10 端末装置、20 議事録作成サーバ、30 音声認識サーバ、40 ネットワーク、800 情報処理装置、811 CPU、812 ROM、813 RAM、814 バス、815 入力部、815a 操作入力部、815b 音声入力部、816 出力部、817 記憶部、818 通信部、819 ドライブ、820 撮像部、831 リムーバブルメディア、151 操作受付部、152 音声データ入力部、251 議事録テンプレートデータ設定部、252 会議情報データ設定部、253 タグテンプレートデータ設定部、254 議題データ設定部、255 タグ・議題振り分け処理部、256 処理済み発話内容データ入力部、257 議事録作成処理部、258 議事録ファイル出力部、271 タグテンプレート記憶部、272 議事録テンプレート記憶部、273 議事録記憶部、351 音声認識処理部、352 音声認識結果出力部