特開2024-71304 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ナカヨの特許一覧

特開2024-71304電話会議システム、電話会議装置、プログラム、および、電話会議における発言者の役割判断方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024071304

(43)【公開日】2024-05-24

(54)【発明の名称】電話会議システム、電話会議装置、プログラム、および、電話会議における発言者の役割判断方法

(51)【国際特許分類】

H04M 3/56 20060101AFI20240517BHJP

H04M 3/42 20060101ALI20240517BHJP

G10L 15/00 20130101ALI20240517BHJP

G10L 15/10 20060101ALI20240517BHJP

【ＦＩ】

H04M3/56 Z

H04M3/42 P

G10L15/00 200U

G10L15/10 500Z

【審査請求】未請求

【請求項の数】11

【出願形態】ＯＬ

(21)【出願番号】P 2022182179

(22)【出願日】2022-11-14

(71)【出願人】

【識別番号】000134707

【氏名又は名称】株式会社ナカヨ

(74)【代理人】

【識別番号】100104570

【弁理士】

【氏名又は名称】大関光弘

(72)【発明者】

【氏名】渡部祐太

【テーマコード（参考）】

5K201

【Ｆターム（参考）】

5K201BB10

5K201CA01

5K201CC10

5K201DC05

5K201EC06

5K201ED01

(57)【要約】

【課題】会議での発言者それぞれ実際の役割を会議の進行とともに把握できるようにする。
【解決手段】電話会議装置１は、電話会議端末２－１～２－ｎから音声データを受信する毎に、この音声データを送信元の電話会議端末２－１～２－ｎおよびその受信開始時刻に紐付けて記憶する。また、送信元の電話会議端末２－１～２－ｎおよび受信開始時刻に紐付けられて記憶された音声データ各々に対して、音声認識処理を実施してテキストデータに生成し、さらに生成したテキストデータに形態素解析を含む文章解析処理を実施して、テキストデータから所定品詞の語句を抽出して、抽出語句を対応する音声データに紐付ける。それから、電話会議装置１は、送信元の電話会議端末２－１～２－ｎおよび受信開始時刻に紐付けられて記憶された音声データ毎に、この音声データに紐付けられている抽出語句に基づいて参加者の役割を判断し、判断した役割をこの音声データに紐付ける。
【選択図】図１

【特許請求の範囲】

【請求項1】

複数の電話会議端末と、前記電話会議端末毎に、当該電話会議端末を除く前記複数の電話会議端末から受信した音声データをミキシングして電話会議データを生成し、当該電話会議端末に送信する電話会議装置と、を備えた電話会議システムであって、
前記電話会議装置は、
前記複数の電話会議端末から受信した音声データ各々を、送信元の前記電話会議端末およびその受信開始時刻に紐付けて記憶する音声データ記憶手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに対して音声認識処理を実施してテキストデータを生成し、当該生成したテキストデータを当該音声データに紐付ける音声認識手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられているテキストデータに対して文章解析処理を実施して、当該テキストデータから所定品詞の語句を抽出し、当該抽出した語句を当該音声データに紐付ける文章解析手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられている前記語句に基づいて、当該音声データの発言を行った参加者の役割を判断し、当該判断した役割を当該音声データに紐付ける役割判断手段と、を有する
ことを特徴とする電話会議システム。

【請求項2】

請求項１に記載の電話会議システムであって、
参加者の役割毎に、当該役割の参加者の発言に含まれる可能性のある所定品詞の語句リストが記憶された語句リスト記憶手段をさらに有し、
前記役割判断手段は、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられている前記語句を最も多く含む語句リストを前記語句リスト記憶手段から検索し、検索した語句リストに対応付けられる参加者の役割を、当該音声データに紐付ける参加者の役割として判断する
ことを特徴とする電話会議システム。

【請求項3】

請求項１に記載の電話会議システムであって、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データの音量レベル、発話ピッチを含む音響特性に基づいて、当該音声データの発言を行った参加者の感情を判断し、判断した参加者の感情を当該音声データに紐付ける感情判断手段と、
前記音声データ記憶手段において、受信開始時刻の順に時系列に並ぶ複数の音声データに紐付けられた参加者の感情に基づいて、電話会議で発生した支障を検出し、検出した支障を当該複数の音声データに紐付ける支障検出手段と、をさらに有する
ことを特徴とする電話会議システム。

【請求項4】

請求項２に記載の電話会議システムであって、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データの音量レベル、発話ピッチを含む音響特性に基づいて、当該音声データの発言を行った参加者の感情を判断し、判断した参加者の感情を当該音声データに紐付ける感情判断手段と、
前記音声データ記憶手段において、受信開始時刻の順に時系列に並ぶ複数の音声データに紐付けられた参加者の役割および感情の変遷に基づいて、電話会議で発生した支障を検出し、検出した支障を当該複数の音声データに紐付ける支障検出手段と、をさらに有する
ことを特徴とする電話会議システム。

【請求項5】

請求項３に記載の電話会議システムであって、
前記電話会議で想定される支障毎に、当該支障の内容を、当該支障の発生に関わる参加者の役割および感情の並びを含む支障発生パターンに紐付けて記憶する支障情報記憶手段をさらに有し、
前記支障検出手段は、
前記支障情報記憶手段に記憶されている支障発生パターン毎に、当該支障発生パターンと一致する参加者の役割および感情の並びを、前記音声データ記憶手段において受信開始時刻の順に時系列に並ぶ音声データの列から検索し、当該支障発生パターンと一致する参加者の役割および感情の並びを含む音声データの列を検出したならば、当該音声データの列が示す会話において障害が発生したものと判断し、当該変遷パターンに紐付けられている支障の内容を当該音声データの列に紐付ける
ことを特徴とする電話会議システム。

【請求項6】

請求項４に記載の電話会議システムであって、
前記電話会議で想定される支障毎に、当該支障の内容を、当該支障の発生に関わる参加者の役割および感情の並びを含む支障発生パターンに紐付けて記憶する支障情報記憶手段をさらに有し、
前記支障検出手段は、
前記支障情報記憶手段に記憶されている支障発生パターン毎に、当該支障発生パターンと一致する参加者の役割および感情の並びを、前記音声データ記憶手段において受信開始時刻の順に時系列に並ぶ音声データの列から検索し、当該支障発生パターンと一致する参加者の役割および感情の並びを含む音声データの列を検出したならば、当該音声データの列が示す会話において障害が発生したものと判断し、当該支障発生パターンに紐付けられている支障の内容を当該音声データの列に紐付ける
ことを特徴とする電話会議システム。

【請求項7】

請求項２、４、または６に記載の電話会議システムであって、
前記電話会議装置に接続された管理端末をさらに備え、
前記電話会議装置は、
前記管理端末から受け付けた指示に従い、前記語句リスト記憶手段の登録内容を更新する語句リスト更新手段をさらに有する
ことを特徴とする電話会議システム。

【請求項8】

請求項５または６に記載の電話会議システムであって、
前記電話会議装置に接続された管理端末をさらに備え、
前記電話会議装置は、
前記管理端末から受け付けた指示に従い、前記支障情報記憶手段の登録内容を更新する支障情報更新手段をさらに有する
ことを特徴とする電話会議システム。

【請求項9】

複数の電話会議端末毎に、当該電話会議端末を除く前記複数の電話会議端末から受信した音声データをミキシングして電話会議データを生成し、当該電話会議端末に送信する電話会議装置あって、
前記複数の電話会議端末から受信した音声データ各々を、送信元の前記電話会議端末およびその受信開始時刻に紐付けて記憶する音声データ記憶手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに対して音声認識処理を実施してテキストデータを生成し、当該生成したテキストデータを当該音声データに紐付ける音声認識手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられているテキストデータに対して文章解析処理を実施して、当該テキストデータから所定品詞の語句を抽出し、当該抽出した語句を当該音声データに紐付ける文章解析手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられている前記語句に基づいて、当該音声データの発言を行った参加者の役割を判断し、当該判断した役割を当該音声データに紐付ける役割判断手段と、を有する
ことを特徴とする電話会議装置。

【請求項10】

電話会議端末毎に、当該電話会議端末を除く複数の電話会議端末から受信した音声データをミキシングして電話会議データを生成し、当該電話会議端末に送信する電話会議装置としてコンピュータを機能させるプログラムであって、
前記複数の電話会議端末から受信した音声データ各々を、送信元の前記電話会議端末およびその受信開始時刻に紐付けて記憶する音声データ記憶手段、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに対して音声認識処理を実施してテキストデータを生成し、当該生成したテキストデータを当該音声データに紐付ける音声認識手段、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられているテキストデータに対して文章解析処理を実施して、当該テキストデータから所定品詞の語句を抽出し、当該抽出した語句を当該音声データに紐付ける文章解析手段、および
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられている前記語句に基づいて、当該音声データの発言を行った参加者の役割を判断し、当該判断した役割を当該音声データに紐付ける役割判断手段として、前記コンピュータを機能させる
ことを特徴とするプログラム。

【請求項11】

電話会議端末毎に、当該電話会議端末を除く前記複数の電話会議端末から受信した音声データをミキシングして電話会議データを生成し、当該電話会議端末に送信する電話会議装置を用いた電話会議における発言者の役割判断方法であって、
前記複数の電話会議端末から受信した音声データ各々を、送信元の前記電話会議端末およびその受信開始時刻に紐付けて記憶し、
記憶されている音声データ毎に、当該音声データに対して音声認識処理を実施してテキストデータを生成し、当該生成したテキストデータを当該音声データに紐付け記憶し、
記憶されている音声データ毎に、当該音声データに紐付けられているテキストデータに対して文章解析処理を実施して、当該テキストデータから所定品詞の語句を抽出し、当該抽出した語句を当該音声データに紐付けて記憶し、
記憶されている音声データ毎に、当該音声データに紐付けられている前記語句に基づいて、当該音声データの発言を行った参加者の役割を判断し、当該判断した役割を当該音声データに紐付けて記憶する
ことを特徴とする電話会議における発言者の役割判断方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、電話会議システムに関し、特に、電話会議における発言者の役割判断技術に関する。

【背景技術】

【0002】

特許文献１には、電話会議において発言がある都度、その発言者を他の参加者に通知する技術が開示されている。この技術において、各参加者は、発言を行うにあたり電話会議端末の発言ボタンを押下し、発言ボタンが押下された電話会議端末は、発言者識別情報を電話会議装置に送信する。電話会議装置は、いずれかの電話会議端末から発言者識別情報を受信すると、この発言者識別情報に紐付けられている参加者を表す音声データを、この電話会議端末から送られてくる発言の音声データとミキシングして、この電話会議端末以外の各電話会議端末に送信する。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２００８－１４１３４８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

通常、会議は、参加者が、大きく分けて、説明者、質問者、および傍聴者のいずれかの役割を適切に果たすことによって円滑に進行する。しかし、会議においては、説明者が不十分な説明を行い、一部の質問者が説明者の意図を理解できずに厳しい質問を繰り返す等、参加者の発言の応酬が会議進行に支障をきたす場合がある。また、説明者の説明が不明瞭であるために会議進行に支障が生じていると感じた傍聴者が、やむを得ず仲介者となって説明者の代わりに質問者に説明する等、参加者の役割が、会議の進行状況に応じて当初の役割から変化することもある。

【0005】

したがって、会議が支障なく円滑に進行したか否かを判断する上で、会議における発言者それぞれの実際の役割を、会議の進行とともに把握することは重要である。しかしながら、特許文献１に記載の技術は、この点を何ら考慮していない。

【0006】

本発明は上記事情に鑑みてなされたものであり、その目的は、会議における発言者それぞれの役割を、会議の進行とともに把握できるようにすることにある。

【課題を解決するための手段】

【0007】

上記課題を解決するために、本発明において、電話会議装置は、電話会議端末から音声（発言）データを受信する毎に、この音声データを、送信元の電話会議端末およびその受信（発言）開始時刻に紐付けて記憶する。また、送信元の電話会議端末および受信開始時刻に紐付けられて記憶された音声データ各々に対して、音声認識処理を実施してテキストデータを生成し、さらに、生成したテキストデータに形態素解析を含む文章解析処理を実施して、このテキストデータから、名詞、動詞、形容詞等の所定品詞に該当する語句を抽出し、テキストデータおよび抽出語句を、対応する音声データに紐付ける。それから、電話会議装置は、音声データの送信元の電話会議端末および受信開始時刻に紐付けられて記憶された音声データ毎に、この音声データに紐付けられている抽出語句に基づいて、音声データの発言を行った参加者の役割（説明者、質問者、仲介者）を判断し、判断した役割をこの音声データに紐付ける。

【0008】

例えば、本発明の電話会議システムは、
複数の電話会議端末と、前記電話会議端末毎に、当該電話会議端末を除く前記複数の電話会議端末から受信した音声データをミキシングして電話会議データを生成し、当該電話会議端末に送信する電話会議装置と、を備えた電話会議システムであって、
前記電話会議装置は、
前記複数の電話会議端末から受信した音声データ各々を、送信元の前記電話会議端末およびその受信開始時刻に紐付けて記憶する音声データ記憶手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに対して音声認識処理を実施してテキストデータを生成し、当該生成したテキストデータを当該音声データに紐付ける音声認識手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられているテキストデータに対して文章解析処理を実施して、当該テキストデータから所定品詞の語句を抽出し、当該抽出した語句を当該音声データに紐付ける文章解析手段と、
前記音声データ記憶手段に記憶されている音声データ毎に、当該音声データに紐付けられている前記語句に基づいて参加者の役割を判断し、当該判断した役割を当該音声データに紐付ける役割判断手段と、を有する。

【発明の効果】

【0009】

本発明では、音声データ毎に、音声データの音声認識結果であるテキストデータおよびそのテキストデータに含まれている所定品質の語句に基づいて判断された参加者の役割が、受信開始時刻とともにこの音声データに紐付けられる。したがって、本発明によれば、会議における発言者それぞれの実際の役割を、会議の進行状況に合わせて把握することができるので、電話会議全体の流れを把握して、電話会議進行上の問題点および改善点等を検討することができる。

【図面の簡単な説明】

【0010】

【図1】図１は、本発明の一実施の形態に係る電話会議システムの概略構成図である。

【図2】図２は、電話会議装置１の概略機能構成図である。

【図3】図３は、音声データ記憶部１０３の登録内容例を模式的に表した図である。

【図4】図４は、解析結果記憶部１０４の登録内容例を模式的に表した図である。

【図5】図５は、語句リスト記憶部１０５の登録内容例を模式的に表した図である。

【図6】図６は、支障情報記憶部１０６の登録内容例を模式的に表した図である。

【図7】図７は、電話会議装置１の電話会議録音処理を説明するためのフロー図である。

【図8】図８は、電話会議装置１の電話会議解析処理を説明するためのフロー図である。

【図9】図９は、電話会議装置１の電話会議解析処理を説明するためのフロー図であり、図８の続きである。

【発明を実施するための形態】

【0011】

以下に、本発明の一実施の形態について説明する。

【0012】

図１は、本実施の形態に係る電話会議システムの概略構成図である。

【0013】

図示するように、本実施の形態に係る電話会議システムは、複数の電話会議端末２－１～２－ｎ（以下、単に電話会議端末２とも呼ぶ）と、複数の電話会議端末２を収容し、これらの電話会議端末２に対して電話会議サービスを提供する電話会議装置１と、電話会議装置１を保守・管理する管理端末３とが、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等のネットワーク４を介して互いに接続されて構成されている。

【0014】

電話会議装置１は、電話会議端末２毎に、他の複数の電話会議端末２から受信した音声データをミキシングして電話会議データを生成し、生成した電話会議データをこの電話会議端末２に送信する（電話会議サービス）。また、電話会議装置１は、電話会議サービスにより複数の電話会議端末２間で実施された電話会議において、発言毎に発言者の役割および感情を認識し、これらの認識結果に基づいて、円滑な会議進行を妨げる支障発生（紛糾、混乱等の、電話会議進行の滞り）の有無を判断する。

【0015】

つぎに、本実施の形態に係る電話会議装置１について説明する。なお、電話会議端末２には、ボタン電話機等の既存の電話端末を用いることができる。また、管理端末３には、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）等の既存のネットワーク端末を用いることができる。そこで、これらの詳細な説明は省略している。

【0016】

図２は、電話会議装置１の概略機能構成図である。

【0017】

図示するように、電話会議装置１は、ネットワークインターフェース部１００と、電話機制御部１０１と、電話会議処理部１０２と、音声データ記憶部１０３と、解析結果記憶部１０４と、語句リスト記憶部１０５と、支障情報記憶部１０６と、音声認識部１０７と、文章解析部１０８と、役割判断部１０９と、感情判断部１１０と、支障検出部１１１と、主制御部１１２と、を有する。

【0018】

ネットワークインターフェース部１００は、ネットワーク４に接続するためのインターフェースである。

【0019】

電話機制御部１０１は、ＳＩＰ（ＳｅｓｓｉｏｎＩｎｉｔｉａｔｉｏｎＰｒｏｔｏｃｏｌ）等の呼制御プロトコルに従い、ネットワーク４を介して電話会議端末２と通話路を確立したり、確立した通話路を解放したりする。

【0020】

電話会議処理部１０２は、電話機制御部１０１により電話会議装置１との通話路が確立された複数の電話会議端末２（つまり、電話会議に参加する複数の電話会議端末２）に電話会議サービスを提供する。具体的には、電話会議に参加する電話会議端末２毎に、この電話会議端末２を除く他の複数の電話会議端末２から受信した音声データをミキシングして電話会議データを生成し、生成した電話会議データをこの電話会議端末２に送信する。

【0021】

また、電話会議処理部１０２は、電話会議に参加中のいずれかの電話会議端末２から音声データを受信する毎に、この音声データを、その受信開始時刻、送信元の電話会議端末２、および電話会議に紐付けて音声データ記憶部１０３に記憶する。

【0022】

音声データ記憶部１０３には、電話会議毎に、電話会議に参加中の電話会議端末２から受信した音声データが、その受信開始時刻および送信元の電話会議端末２に紐付けられて記憶される。

【0023】

図３は、音声データ記憶部１０３の登録内容例を模式的に表した図である。

【0024】

図示するように、音声データ記憶部１０３には、電話会議毎に、その電話会議における発言の音声データが時系列に記録された電話会議テーブル１０３０が、その電話会議の識別情報（会議ＩＤ）および会議開始日時に紐付けられて記憶される。

【0025】

電話会議テーブル１０３０には、電話会議における発言毎に、その発言の音声データのレコード１０３１が記憶される。音声データのレコード１０３１には、音声データの受信（発言）開始時刻が登録されたフィールド１０３２と、発言者の情報（音声データの送信元の電話会議端末２の番号情報あるいはその番号情報に紐付けられている参加者の氏名情報等）が登録されたフィールド１０３３と、音声データが登録されたフィールド１０３４と、を有する。

【0026】

解析結果記憶部１０４には、音声データ記憶部１０３に記憶されている電話会議テーブル１０３０毎に、電話会議における発言の音声データに対する解析結果が記憶される。

【0027】

図４は、解析結果記憶部１０４の登録内容例を模式的に表した図である。

【0028】

図示するように、解析結果記憶部１０４には、電話会議毎に、その電話会議における発言の音声データの解析結果が時系列に記録された解析結果テーブル１０４０が、その電話会議の会議ＩＤおよび会議開始日時に紐付けられて記憶される。

【0029】

解析結果テーブル１０４０には、電話会議における発言毎に、その発言の音声データに対する解析結果のレコード１０４１が記憶される。解析結果のレコード１０４１には、音声データの受信（発言）開始時刻が登録されたフィールド１０４２と、発言者の情報（音声データの送信元の電話会議端末２の番号情報あるいはその番号情報に紐付けられている参加者の氏名情報等）が登録されたフィールド１０４３と、その音声データの音声認識結果であるテキストデータが登録されたフィールド１０４４と、このテキストデータから抽出された所定品詞の語句（抽出語句）が登録されたフィールド１０４５と、抽出語句に基づいて判断された発言者の役割（説明者、質問者、補足者等）が登録されたフィールド１０４６と、音声データの音量レベル、発話ピッチ等に基づいて判断された発言者の感情が登録されたフィールド１０４７と、電話会議の進行に支障をきたしている場合に後述の支障発生パターンＩＤ（図６参照）のいずれかが登録されるフィールド１０４８と、を有する。

【0030】

語句リスト記憶部１０５には、会議において発言者が果たす役割毎に、その役割を果たすことを目的とする発言に含まれる可能性のある語句（名詞、動詞、形容詞を含む所定品詞に該当する語句）のリストが記憶されている。

【0031】

図５は、語句リスト記憶部１０５の登録内容例を模式的に表した図である。

【0032】

図示するように、語句リスト記憶部１０５には、会議において発言者が果たす役割毎に語句リストのレコード１０５０が記憶されている。語句リストのレコード１０５０には、発言者の役割が登録されたフィールド１０５１と、その役割を果たすことを目的とする発言に含まれる可能性のある語句（名詞、動詞、形容詞を含む所定品詞に該当する語句）のリストが登録されたフィールド１０５２と、を有する。

【0033】

支障情報記憶部１０６には、電話会議で想定される支障毎に、その支障の詳細に関する支障情報が記憶されている。

【0034】

図６は、支障情報記憶部１０６の登録内容例を模式的に表した図である。

【0035】

図示するように、支障情報記憶部１０６には、電話会議で想定される支障毎に支障情報のレコード１０６０が記憶されている。支障情報のレコード１０６０は、支障発生パターンの識別情報（支障発生パターンＩＤ）が登録されたフィールド１０６１と、支障発生パターン（支障を発生させた一連の発言の発言者の役割および発言中の感情の、発言順の並び）が登録されたフィールド１０６２と、支障の内容が登録されたフィールド１０６４と、を有する。また、支障発生パターンのフィールド１０６２は、支障を発生させた一連の発言の発言者の役割および発言中の感情が発言順に格納された複数のサブフィールド１０６３を有している。本実施の形態では、一例として、時系列に連続する３つの音声データについて、１番目の音声データの発言者（第１発言者）の役割・感情が登録されたサブフィールド１０６３－１、２番目の音声データの発言者（第２発言者）の役割・感情が登録されたサブフィールド１０６３－２、および３番目の音声データの発言者（第３発言者）の役割・感情が登録されたサブフィールド１０６３－３を設けている。

【0036】

音声認識部１０７は、音声データ記憶部１０３を参照し、解析対象の電話会議テーブル１０３０に記憶されている解析対象のレコード１０３１から音声データを読み出して音声認識処理を実施し、この音声データが表す発言内容のテキストデータを生成する。そして、生成したテキストデータを、解析対象の電話会議テーブル１０３０と共通の会議ＩＤおよび会議開始日時に紐付けられて解析結果記憶部１０４に記憶された解析結果テーブル１０４０のレコード１０４１（解析対象のレコード１０３１と共通の受信開始時刻および発言者が登録されているレコード１０４１）に登録する。

【0037】

文章解析部１０８は、解析結果記憶部１０４の解析結果テーブル１０４０に記憶されているレコード１０４１からテキストデータを読み出し、これに形態素解析を含む文章解析処理を実施して、このテキストデータを構成する語句（名詞、動詞、形容詞を含む所定品詞に該当する語句）を抽出する。そして、抽出語句を、この解析結果のレコード１０４１に登録する。

【0038】

役割判断部１０９は、解析結果記憶部１０４の解析結果テーブル１０４０から役割判断対象のレコード１０４１を特定し、このレコード１０４１から抽出語句を読み出す。そして、抽出語句と共通の語句を最も多く含む語句リストが登録されたレコード１０５０を語句リスト記憶部１０５から検索し、このレコード１０５０に登録されている発言者の役割を、役割判断対象のレコード１０４１に登録する。

【0039】

感情判断部１１０は、解析対象の電話会議テーブル１０３０から感情判断対象のレコード１０３１を特定し、このレコード１０３１から音声データを読み出して、この音声データの音量レベル、発話ピッチ等の音響情報に基づき発言者の感情（冷静、興奮、萎縮等）を判断する。そして、解析結果記憶部１０４を参照し、判断した発言者の感情を、解析対象の電話会議テーブル１０３０と共通の会議ＩＤおよび会議開始日時に紐付けられた解析結果テーブル１０４０のレコード１０４１（感情判断対象の音声データのレコード１０３１と共通の受信開始時刻および発言者が登録されている解析結果のレコード１０４１）に登録する。

【0040】

支障検出部１１１は、支障情報記憶部１０６に記憶されているレコード１０６０毎に、このレコード１０６０に登録されている支障発生パターン通りに発言者の役割・感情が並ぶ解析結果のレコード１０４１の配列（受信開始時刻が時系列に連続して並ぶ解析結果のレコード１０４１のグループ）を、解析結果記憶部１０４から検索する。そして、いずれかの支障発生パターンに該当する解析結果のレコード１０４１の配列を検出したならば、該当する支障発生パターンのレコード１０６０に登録されている支障発生パターンＩＤを、この解析結果のレコード１０４１の配列に紐付ける。具体的には、検出した解析結果のレコード１０４１の配列を構成するいずれかのレコード１０４１（ここでは、末尾レコード１０４１）に、該当する支障発生パターンＩＤを登録する。

【0041】

主制御部１１２は、電話会議装置１の各部１００～１１１を統括的に制御する。また、主制御部１１２は、ネットワークインターフェース部１００を介して管理端末３から受け付けた指示に従い、音声データ記憶部１０３および解析結果記憶部１０４の登録内容を管理端末３に送信する。

【0042】

なお、図２に示す電話会議装置１の機能構成は、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）などの集積ロジックＩＣによりハード的に実現されるものでもよいし、あるいはＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）などの計算機によりソフトウエア的に実現されるものでもよい。または、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）と、メモリと、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）等の補助記憶装置と、ＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ）等の通信装置と、を備えたＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）等の汎用コンピュータにおいて、ＣＰＵが所定のプログラムを補助記憶装置からメモリ上にロードして実行することでプロセスとして実現されるものでもよい。

【0043】

図７は、電話会議装置１の電話会議録音処理を説明するためのフロー図である。

【0044】

このフローは、電話機制御部１０１がネットワークインターフェース部１００を介して複数の電話会議端末２と通話路を確立し、電話会議処理部１０２がこれらの電話会議端末２に対して電話会議サービスの提供を開始することにより開始される。

【0045】

まず、電話会議処理部１０２は、新たに開催される電話会議における一連の発言の音声データを格納するための電話会議テーブル１０３０を音声データ記憶部１０３に新規登録して、この電話会議テーブル１０３０を、新たに発行した会議ＩＤおよび会議開始日時（現在日時）に紐付ける（Ｓ２００）。

【0046】

その後、電話機制御部１０１がすべての電話会議端末２との通話路を解放することにより電話会議サービスの提供を終了するまでの間（Ｓ２０３でＮＯ）、電話会議処理部１０２は、電話会議中にいずれかの参加者が発言者として発言する都度、すなわち、電話機制御部１０１を介して電話会議端末２から音声データを受信する都度（Ｓ２０１でＹＥＳ）、新規登録した電話会議テーブル１０３０にレコード１０３１を追加して、このレコード１０３１に、音声データの受信開始時刻および発言者の情報（音声データの送信元の電話会議端末２の番号情報あるいはその番号情報に紐付けられている参加者の氏名情報等）を登録するとともに、受信した音声データを登録する（Ｓ２０２）。

【0047】

図８および図９は、電話会議装置１の電話会議解析処理を説明するためのフロー図である。

【0048】

このフローは、管理端末３からネットワークインターフェース部１００を介して電話会議解析要求を受け付けることにより開始される。

【0049】

まず、主制御部１１２は、音声データ記憶部１０３に未解析の電話会議テーブル１０３０が存在するか否かを確認する（Ｓ３００）。具体的には、音声データ記憶部１０３および解析結果記憶部１０４を参照し、解析結果記憶部１０４のいずれの解析結果テーブル１０４０にも紐付けられていない会議ＩＤおよび会議開始日時に紐付けられた電話会議テーブル１０３０を音声データ記憶部１０３から検索する。そして、音声データ記憶部１０３に未解析の電話会議テーブル１０３０が存在しないならば（Ｓ３００でＮＯ）、このフローを終了する。

【0050】

一方、未解析の電話会議テーブル１０３０が存在する場合（Ｓ３００でＹＥＳ）、主制御部１１２は、いずれかの未解析の電話会議テーブル１０３０を解析対象として選択するとともに、解析結果記憶部１０４に解析結果テーブル１０４０を新規に登録して、この解析結果テーブル１０４０に、解析対象の電話会議テーブル１０３０に紐付けられている会議ＩＤおよび会議開始日時を紐付ける（Ｓ３０１）。

【0051】

つぎに、主制御部１１２は、解析対象の電話会議テーブル１０３０に未解析の音声データのレコード１０３１が存在するか否かを確認する（Ｓ３０２）。未解析の音声データのレコード１０３１が存在せず、すべての音声データのレコード１０３１を解析済みならば（Ｓ３０２でＮＯ）、Ｓ３０９に移る。一方、未解析の音声データのレコード１０３１が存在する場合（Ｓ３０２でＹＥＳ）、主制御部１１２は、未解析の音声データのレコード１０３１のなかから、最も早い受信開始時刻を含むレコード１０３１を解析対象のレコード１０３１として決定する（Ｓ３０３）。それから、新規登録した解析結果テーブル１０４０に新規レコード１０４１を追加し、この新規レコード１０４１に、解析対象のレコード１０３１に登録された受信開始時刻および発言者を登録する（Ｓ３０４）。

【0052】

つぎに、主制御部１１２は、音声認識部１０７に、解析対象の電話会議テーブル１０３０に紐付けられた会議ＩＤと、解析対象のレコード１０３１に登録された受信開始時刻および発言者とを通知して、音声データの音声認識処理を指示する。これを受けて、音声認識部１０７は、音声データ記憶部１０３を参照し、主制御部１１２より通知された会議ＩＤに紐付けられた解析対象の電話会議テーブル１０３０から、主制御部１１２より通知された受信開始時刻および発言者に紐付けられた解析対象のレコード１０３１を特定し、この解析対象のレコード１０３１に登録されている音声データに音声認識処理を実施してテキストデータを生成する。そして、解析結果記憶部１０４を参照して、主制御部１１２より通知された会議ＩＤに紐付けられた解析結果テーブル１０４０のレコード１０４１のうち、主制御部１１２より通知された受信開始時刻および発言者を含むレコード１０４１に、このテキストデータを登録する（Ｓ３０５）。

【0053】

つぎに、主制御部１１２は、文章解析部１０８に、解析対象の電話会議テーブル１０３０に紐付けられた会議ＩＤと、解析対象のレコード１０３１に登録された受信開始時刻および発言者とを通知して、テキストデータの文章解析処理を指示する。これを受けて、文章解析部１０８は、解析結果記憶部１０４を参照して、主制御部１１２より通知された会議ＩＤに紐付けられた解析結果テーブル１０４０から、主制御部１１２より通知された受信開始時刻および発言者に紐付けられた解析結果のレコード１０４１を特定し、このレコード１０４１のテキストデータに形態素解析を含む文章解析処理を実施する。これによりテキストデータから、所定品詞に該当する語句を抽出して、抽出語句を、特定した解析結果のレコード１０４１に登録する（Ｓ３０６）。

【0054】

つぎに、主制御部１１２は、役割判断部１０９に、解析対象の電話会議テーブル１０３０に紐付けられた会議ＩＤと、解析対象のレコード１０３１に登録された受信開始時刻および発言者とを通知して、発言者（参加者）の役割判断を指示する。これを受けて、役割判断部１０９は、解析結果記憶部１０４を参照して、主制御部１１２より通知された会議ＩＤに紐付けられた解析結果テーブル１０４０から、主制御部１１２より通知された受信開始時刻および発言者に紐付けられた解析結果のレコード１０４１を役割判断対象として特定し、このレコード１０４１から抽出語句を読み出して、抽出語句と共通の語句を最も多く含む語句リストが登録されているレコード１０５０を語句リスト記憶部１０５から検索する。そして、検索した語句リストのレコード１０５０に登録されている発言者の役割を、役割判断対象の解析結果のレコード１０４１に登録する（Ｓ３０７）。

【0055】

つぎに、主制御部１１２は、感情判断部１１０に、解析対象の電話会議テーブル１０３０に紐付けられた会議ＩＤと、解析対象のレコード１０３１に登録された受信開始時刻および発言者とを通知して、発言者（参加者）の感情判断を指示する。これを受けて、感情判断部１１０は、音声データ記憶部１０３を参照し、主制御部１１２より通知された会議ＩＤに紐付けられた解析対象の電話会議テーブル１０３０から、主制御部１１２より通知された受信開始時刻および発言者に紐付けられたレコード１０３１を役割判断対象として特定し、このレコード１０３１に登録されている音声データの音量レベル、発話ピッチ等の音響情報に基づき発言者の感情（冷静、興奮、萎縮等）を判断する。そして、主制御部１１２より通知された会議ＩＤに紐付けられて解析結果記憶部１０４に記憶された解析結果テーブル１０４０から、主制御部１１２より通知された受信開始時刻および発言者と共通の受信開始時刻および発言者に紐付けられたレコード１０４１を特定し、このレコード１０４１に、判断した発言者の感情を登録する（Ｓ３０８）。その後、Ｓ３０２に戻る。

【0056】

また、Ｓ３０９において、主制御部１１２は、支障検出部１１１に、解析対象の電話会議テーブル１０３０に紐付けられた会議ＩＤを通知して、電話会議における支障検出を指示する。これを受けて、支障検出部１１１は、支障情報記憶部１０６から未選択のレコード１０６０を選択し（Ｓ３０９）、このレコード１０６０に登録されている支障発生パターンと発言者の役割・感情およびその並びが一致するレコード１０４１の配列（受信開始時刻が時系列に連続して並ぶ解析結果のレコード１０４１のグループ）を解析結果記憶部１０４から検索する（Ｓ３１０）。そして、発言者の役割・感情が支障発生パターン通りに並ぶレコード１０４１の配列を検出したならば（Ｓ３１１でＹＥＳ）、このレコード１０４１の配列の末尾レコード１０４１に、選択したレコード１０６０に登録されている支障発生パターンＩＤを登録する（Ｓ３１２）。

【0057】

つぎに、支障検出部１１１は、支障情報記憶部１０６に未選択のレコード１０６０が存在するならば（Ｓ３１３でＹＥＳ）、Ｓ３０９に戻り、支障情報記憶部１０６のすべてのレコード１０６０を選択済みならば（Ｓ３１３でＮＯ）、その旨を主制御部１１２に通知して、Ｓ３００に戻る。

【0058】

以上、本発明の一実施の形態を説明した。

【0059】

本実施の形態では、電話会議中の発言毎に、その発言の音声データの音声認識結果であるテキストデータに含まれる所定品詞の語句に基づいて発言者の役割を判断し、この発言者の役割を、音声データの受信開始時刻およびその送信元（発言者）をキーとして、その発言の音声データに紐付けている。したがって、本実施の形態によれば、電話会議における発言者それぞれの発言内容およびその実際の役割を、電話会議の進行状況に合わせて時系列に把握することができるので、電話会議全体の流れを把握して、電話会議の進行上の問題点および改善点等を検討することができる。

【0060】

また、本実施の形態では、電話会議中の発言毎に、その発言の音声データの音声認識結果であるテキストデータから抽出した所定品詞の語句を最も多く含む語句リストを語句リスト記憶部１０５から検索し、検索した語句リストに紐付けられている参加者の役割を、その発言の音声データに紐付ける。したがって、本実施の形態によれば、会議中に発言した参加者のみ、その役割を効率よく判断することができる。

【0061】

また、本実施の形態では、会議中の発言毎に、その発言の音声データの音量レベル、発話ピッチを含む音響特性に基づいて発言者の感情を判断し、この発言者の感情を、音声データの受信開始時刻およびその送信元をキーとして、その発言の音声データに紐付けている。そして、電話会議中の発言順に時系列に並んだ発言者の役割および感情に基づいて、電話会議の進行を妨げる支障の発生を検出し、検出した支障を、音声データの受信開始時刻およびその送信元である発言者をキーとして、支障発生の原因となった一連の発言の音声データに紐付けている。したがって、本実施の形態によれば、電話会議のどのタイミングで支障が発生したのかを把握することができ、電話会議全体の流れを、より精度よく把握することが可能となり、電話会議の進行上の問題点および改善点等を効率よく検討することができる。

【0062】

また、本実施の形態では、支障情報記憶部１０６に記憶されている支障発生パターン毎に、支障発生パターン通りに時系列に並ぶ発言者の役割および感情を解析結果記憶部１０４から検索し、該当する発言者の役割および感情の並びを検出したならば、これらの発言者の役割および感情に紐付けられている一連の音声データ（時系列に並ぶ音声データのグループ）が録音された会話において電話会議進行上の支障が発生したものと判断する。そし、支障発生パターンに紐付けられた支障内容を、音声データの受信開始時刻およびその送信元をキーとして、電話会議進行上の支障を生じさせた会話の音声データの配列に紐付けている。したがって、本実施の形態によれば、音声会議のどのタイミングで支障が発生したのかを、その支障内容とともに把握することができ、電話会議の問題点および改善点等をさらに効率よく検討することができる。

【0063】

なお、本発明は、上記の実施の形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。

【0064】

例えば、上記の実施の形態では、電話会議テーブル１０３０および解析結果テーブル１０４０を会議ＩＤで互いに紐付けて、それぞれ音声データ記憶部１０３および解析結果記憶部１０４に記憶するとともに、電話会議テーブル１０３０に記憶されている音声データのレコード１０３１および解析結果テーブル１０４０に記憶されている解析結果のレコード１０４１を、音声データの受信開始時刻およびその送信元である発言者で互いに紐付けている。しかし、本発明はこれに限定されない。音声データのレコード１０３１と解析結果のレコード１０４１とを統合することにより、電話会議テーブル１０３０および解析結果テーブル１０４０を一体化してもよい。この場合、音声データ記憶部１０３および解析結果記憶部１０４の一方を省略することができる。

【0065】

また、上記の実施の形態において、電話会議装置１の語句リスト記憶部１０５および／または支障情報記憶部１０６は、管理端末３により更新可能としてもよい。すなわち、電話会議装置１において、主制御部１１２は、ネットワークインターフェース部１００を介して管理端末３から受け付けた指示に従い、語句リスト記憶部１０５および／または支障情報記憶部１０６の登録内容を更新する。具体的には、ネットワークインターフェース部１００を介して管理端末３から語句リストのレコード１０５０を受け付けて、このレコード１０５０を語句リスト記憶部１０５に追加する。また、ネットワークインターフェース部１００を介して管理端末３から受け付けた支障発生パターンのレコード１０６０を支障情報記憶部１０６に追加する。

【符号の説明】

【0066】

１：電話会議装置２－１～２－ｎ：電話会議端末３：管理端末
４：ネットワーク１００：ネットワークインターフェース部
１０１：電話機制御部１０２：電話会議処理部
１０３：音声データ記憶部１０４：解析結果記憶部
１０５：語句リスト記憶部１０６：支障情報記憶部１０７：音声認識部
１０８：文章解析部１０９：役割判断部１１０：感情判断部
１１１：支障検出部１１２：主制御部

【図1】