特許7293816 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7293816会話分析装置、会話分析方法および会話分析プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-06-12

(45)【発行日】2023-06-20

(54)【発明の名称】会話分析装置、会話分析方法および会話分析プログラム

(51)【国際特許分類】

G06F 40/30 20200101AFI20230613BHJP

G06F 40/216 20200101ALI20230613BHJP

G06Q 10/0639 20230101ALI20230613BHJP

【ＦＩ】

G06F40/30

G06F40/216

G06Q10/0639

【請求項の数】 5

(21)【出願番号】P 2019070723

(22)【出願日】2019-04-02

(65)【公開番号】P2020170310

(43)【公開日】2020-10-15

【審査請求日】2022-01-11

(73)【特許権者】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】原田将治

【審査官】長由紀子

(56)【参考文献】

【文献】特開２０１８－０３６８７１（ＪＰ，Ａ）

【文献】特開２００８－２１０３６７（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ４０／００－５８

Ｇ０６Ｑ１０／０６－９９／００

(57)【特許請求の範囲】

【請求項1】

会話音声に含まれる複数の発話時間のうち、最長の発話時間を特定し、会議時間に対する前記最長の発話時間の比率に応じたリスク評価値を判定する第１判定部と、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出する音声認識部と、
より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定する処理、または、前記会話音声に含まれる単語のうち、言語コーパスに含まれる単語の出現頻度を基にして、前記会話音声における会話内容の抽象度を判定する処理を行う第２判定部と、
前記リスク評価値および前記抽象度を乗算した値と、閾値との比較結果を基にして、前記会話内容を評価する評価部と
を有することを特徴とする会話分析装置。

【請求項2】

前記第１判定部は、前記会話音声に含まれる所定の単語の出現回数に応じたリスク評価値を更に判定することを特徴とする請求項１に記載の会話分析装置。

【請求項3】

前記会話音声の区間のうち、前記最長の発話区間の開始時刻から所定時間前の時刻と、前記最長の発話区間の終了時刻から所定時間後の時刻との間の区間を、前記会話の状態の判定に寄与した区間を着目区間として抽出する抽出部を更に有し、前記第２判定部は、前記着目区間に含まれる単語を基にして、前記会話内容の抽象度を判定することを特徴とする請求項１または２に記載の会話分析装置。

【請求項4】

コンピュータが実行する会話分析方法であって、
会話音声に含まれる複数の発話時間のうち、最長の発話時間を特定し、会議時間に対する前記最長の発話時間の比率に応じたリスク評価値を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定する処理、または、前記会話音声に含まれる単語のうち、言語コーパスに含まれる単語の出現頻度を基にして、前記会話音声における会話内容の抽象度を判定する処理のうちいずれか一方の処理によって、抽象度を判定し、
前記リスク評価値および前記抽象度を乗算した値と、閾値との比較結果を基にして、前記会話内容を評価する
処理を実行することを特徴とする会話分析方法。

【請求項5】

コンピュータに、
会話音声に含まれる複数の発話時間のうち、最長の発話時間を特定し、会議時間に対する前記最長の発話時間の比率に応じたリスク評価値を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定する処理、または、前記会話音声に含まれる単語のうち、言語コーパスに含まれる単語の出現頻度を基にして、前記会話音声における会話内容の抽象度を判定する処理のうちいずれか一方の処理によって、抽象度を判定し、
前記リスク評価値および前記抽象度を乗算した値と、閾値との比較結果を基にして、前記会話内容を評価する
処理を実行させることを特徴とする会話分析プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、会話分析装置等に関する。

【背景技術】

【0002】

コールセンターにおけるオペレータと顧客との会話、または、会議の参加者による会話等において、「会話対象（会話内容）」を評価することが求められている。たとえば、オペレータと顧客との会話の対象は、商品に関する問合せや、クレーム対応等となる。会議の参加者による会話の対象は、プロジェクト等となる。

【0003】

会議中の会話を録音した音声データを基にして、プロジェクトを評価する技術として、以下に説明するような従来技術がある。この従来技術は、設定ワードおよび設定ワードに類似する類似ワードを予め定義する。図１８は、設定ワードおよび類似ワードの一例を示す図である。たとえば、設定ワード「遅れている」に対応する類似ワードは「遅延、遅い、・・・」となる。以下の説明では、設定ワードおよび設定ワードに類似する類似ワードをまとめて「設定ワード」と表記する。

【0004】

従来技術は、音声データに対して音声認識を行い、音声データに含まれる設定ワードの出現回数をカウントする。従来技術は、設定ワードの出現回数に応じて、リスク評価値を特定し、会話の対象を評価する。たとえば、従来技術では、設定ワードの出現回数が多いほど、リスク評価値を大きくし、このリスク評価値が大きいほど、会話対象（プロジェクト）のリスクが高いと評価する。また、この従来技術では、会議時間に対する最大の発話時間の比率を算出し、比率が大きいほど、リスク評価値を大きくしている。

【先行技術文献】

【特許文献】

【0005】

【文献】特開２００９－１４６１２１号公報

【文献】特開２０１７－２７１０２号公報

【文献】特開２０１１－５５１６０号公報

【文献】特開２０１８－３６８６８号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

会議の会話において、要求仕様の整理が「遅れている」、「できていない」と発話された場合のリスクと、出力メッセージの決定が「遅れている」、「できていない」と発話された場合のリスクとは、同程度のリスクではない。プロジェクト全体として「要求仕様の整理」に関する作業は数日から数週間かかるものであり、要求仕様の整理が遅れている場合には、大きなリスクである。これに対して、プロジェクト全体として「出力メッセージ」に関する作業は、１時間で解決できるものであり、出力メッセージが送れていても、リスクは小さいといえる。

【0007】

しかしながら、従来技術では、要求仕様の整理に関して、「遅れている」、「できていない」と発話された回数と、出力メッセージに関して、「遅れている」、「できていない」と発話された回数とが同数の場合には、各リスクは同じリスクと評価してしまう。このため、従来技術では、リスク有無を評価できても、会話の対象としてのリスクの程度を適切に評価することができていない。

【0008】

１つの側面では、本発明は、会議の発話に基づいた会議の対象としてのリスク判定をおこなうことができる会話分析装置、会話分析方法および会話分析プログラムを提供することを目的とする。

【課題を解決するための手段】

【0009】

第１の案では、会話分析装置は、第１判定部と、音声認識部と、第２判定部と、評価部とを有する。第１判定部は、会話音声を分析して、会話の状態を判定する。音声認識部は、会話音声に対して音声認識を行い、会話音声に含まれる単語を抽出する。第２判定部は、会話音声に含まれる単語を基にして、会話音声における会話内容の抽象度を判定する。評価部は、会話の状態と抽象度とを基にして、会話対象を評価する。

【発明の効果】

【0010】

会議の発話に基づいた会議の対象としてのリスク判定をおこなうことができる。

【図面の簡単な説明】

【0011】

【図1】図１は、本実施例１に係る会話分析装置の処理を説明するための図である。

【図2】図２は、本実施例１に係る会話分析装置の構成を示す機能ブロック図である。

【図3】図３は、本実施例１に係るリスク評価値テーブルのデータ構造の一例を示す図である。

【図4】図４は、本実施例１に係る抽象度判定テーブルのデータ構造の一例を示す図である。

【図5】図５は、概念ＤＢの一例を示す図である。

【図6】図６は、本実施例１に係る第２判定部の処理を説明するための図である。

【図7】図７は、本実施例１に係る会話分析装置の処理手順を示すフローチャートである。

【図8】図８は、発明の効果を補足するための図である。

【図9】図９は、本実施例２に係る会話分析装置の構成を示す機能ブロック図である。

【図10】図１０は、本実施例２に係る設定キーワードテーブルのデータ構造の一例を示す図である。

【図11】図１１は、本実施例２に係るリスク評価値テーブルのデータ構造の一例を示す図である。

【図12】図１２は、本実施例２に係る生成部の処理を説明するための図である。

【図13】図１３は、本実施例２に係る会話分析装置の処理手順を示すフローチャートである。

【図14】図１４は、本実施例３に係る会話分析装置の構成の一例を示す機能ブロック図である。

【図15】図１５は、本実施例３に係る抽出部の処理を説明するための図である。

【図16】図１６は、本実施例３に係る会話分析装置の処理手順を示すフローチャートである。

【図17】図１７は、本実施例に係る会話分析装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

【図18】図１８は、設定ワードおよび類似ワードの一例を示す図である。

【発明を実施するための形態】

【0012】

以下に、本願の開示する会話分析装置、会話分析方法および会話分析プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

【実施例1】

【0013】

図１は、本実施例１に係る会話分析装置の処理を説明するための図である。まず、会話分析装置は、テーブル１０Ａを基にして、会議Ａの会話対象のリスクを評価する場合について説明する。テーブル１０Ａは、会議Ａで発声された単語と、回数との関係を示すテーブルである。

【0014】

会話分析装置は、テーブル１０Ａの各単語のうち、設定キーワードに対応する単語を特定し、特定した設定キーワードに対応する単語の出現回数を基にして、「会議の状態」の良し悪しを判定する。たとえば、会話分析装置は、設定キーワードに対応する単語の出現回数が閾値以上である場合、会議の状態が「悪い」と判定し、出現回数が閾値未満である場合、会議の状態が「良い」と判定する。

【0015】

たとえば、設定キーワードを「遅れている」、「できていない」とし、出現回数の閾値を「１０」とする。そうすると、会話分析装置は、テーブル１０Ａのうち、設定キーワードに対応する単語の出現回数「１６」が閾値「１０」以上となるため、会議Ａの状態が悪いと判定する。

【0016】

続いて、会話分析装置は、テーブル１０Ａの各単語の抽象度を基にして「会話内容の抽象度」を判定する。各単語の抽象度は、言語コーパスにおける出現頻度によって決定され、出現頻度が高いものほど、抽象度が高くなる。

【0017】

たとえば、テーブル１０Ａでは、抽象度の高い「仕様書」が多く出現している。このため、会話分析装置は、会議Ａの会話内容の抽象度が高いと判定する。「会話内容の抽象度が高い」ということは、会議で具体的な点が議論されておらず、抽象的な議論しかなされていないことを意味する。

【0018】

会話分析装置は、会話の状態の判定結果と、会話内容の抽象度の判定結果とを基にして、会議Ａの会話対象のリスクを評価する。上記のように、会話の状態が悪く、かつ、会話内容の抽象度が高いため、会議Ａにおける会話対象に関しては、意識合わせが求められ、解決しにくいと言える。このため、会話分析装置は、会議Ａの会話対象のリスクが「大」であると評価する。

【0019】

次に、会話分析装置は、テーブル１０Ｂを基にして、会議Ｂの会話対象のリスクを評価する場合について説明する。テーブル１０Ｂは、会議Ｂで発声された単語と、回数との関係を示すテーブルである。

【0020】

会話分析装置は、テーブル１０Ｂの各単語のうち、設定キーワードに対応する単語を特定し、特定した設定キーワードに対応する単語の出現回数を基にして、「会議の状態」の良し悪しを判定する。たとえば、会話分析装置は、テーブル１０Ｂのうち、設定キーワードに対応する単語の出現回数「１６」が閾値「１０」以上となるため、会議Ｂの状態が悪いと判定する。

【0021】

続いて、会話分析装置は、テーブル１０Ｂの各単語の抽象度を基にして「会話内容の抽象度」を判定する。たとえば、テーブル１０Ｂでは、抽象度の低い「文字コード」が多く出現している。このため、会話分析装置は、会議Ｂの会話内容の抽象度が低いと判定する。「会話内容の抽象度が低い」ということは、会議で具体的な点が議論されていることを意味する。

【0022】

会話分析装置は、会話の状態の判定結果と、会話内容の抽象度の判定結果とを基にして、会議Ｂの会話対象のリスクを評価する。上記のように、会話の状態は悪いが、会話内容の抽象度が低いため、会議Ｂにおける会話対象に関しては、論点が明確で意思疎通しやすく解決に結びつきやすいといえる。このため、会話分析装置は、会議Ｂの会話対象のリスクが「小」であると評価する。

【0023】

上記のように、本実施例１に係る会話分析装置は、設定キーワードの出現回数に基づく会議の状態の良し悪しに加えて、会議内容の抽象度を用いて、会話対象のリスクを評価している。たとえば、設定キーワードの出現回数だけでは、会議Ａ、会議Ｂともにリスクが大であると判定してしまう場合があるが、抽象度に鑑みると、会議Ｂは抽象度が低いため、具体的な議論が行われており、リスクは小さいと判定することができる。すなわち、会話の対象としてのリスクの程度を適切に評価することができる。

【0024】

次に、本実施例１に係る会話分析装置の構成の一例について説明する。図２は、本実施例１に係る会話分析装置の構成を示す機能ブロック図である。図２に示すように、この会話分析装置１００は、第１判定部１１０と、音声認識部１２０と、第２判定部１３０と、評価部１４０とを有する。

【0025】

記憶部１０５は、リスク評価値テーブル１０５ａと、抽象度判定テーブル１０５ｂとを有する。記憶部１０５は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ（Flash Memory）などの半導体メモリ素子や、ＨＤＤ（Hard Disk Drive）などの記憶装置に対応する。

【0026】

図３は、本実施例１に係るリスク評価値テーブルのデータ構造の一例を示す図である。図３に示すように、このリスク評価値テーブル１０５ａは、比率と、リスク評価値とを対応付ける。比率は、後述する第１判定部１１０により算出されるものである。リスク評価値は、会議の状態の悪さの程度を示す値であり、リスク評価値が大きいほど、会議の状態が悪いことを示す。

【0027】

図４は、本実施例１に係る抽象度判定テーブルのデータ構造の一例を示す図である。図４に示すように、抽象度判定テーブル１０５ｂは、単語と、抽象度とを対応付ける。抽象度は、単語の抽象度の程度を示す値であり、抽象度が大きいほど、単語がより抽象的であることを示す。たとえば、単語の抽象度は、概念ＤＢ（Data Base）に基づいて決定される。

【0028】

図５は、概念ＤＢの一例を示す図である。概念ＤＢ５０において、各単語が概念木構造で定義され、概念階層が高いほど、抽象度が高くなる。概念階層「１」が最も高い階層であり、概念階層２、３、４、・・・、９の順に、階層は低くなる。

【0029】

図５において、単語「事象」、「行為」の概念階層は「１」であり、抽象度は「９」となる。単語「要求仕様」の概念階層は「５」であり、抽象度は「５」となる。単語「会員」の概念階層は「６」であり、抽象度は「４」となる。単語「ＩＤ」の概念階層は「７」であり、抽象度は「３」となる。単語「ユニバーサルデザイン」の階層は「９」であり、抽象度は「１」となる。

【0030】

たとえば、単語「要求仕様」は、概念ＤＢ５０の「要求仕様」にヒットするため、単語「要求仕様」の抽象度は「５」となる。単語「ユニバーサルデザイン」は、概念ＤＢ５０の「ユニバーサルデザイン」にヒットするため、単語「ユニバーサルデザイン」の抽象度は「１」となる。

【0031】

なお、単語が複合語の場合には、複合語に含まれる複数の単語のうち、概念階層の最も低い単語を特定し、特定した単語の概念階層に１を加算した概念階層を、複合語の概念階層とする。たとえば、単語（複合語）「会員ＩＤ」は、概念ＤＢ５０の「会員」と「ＩＤ」とにヒットする。概念ＤＢの「会員」の概念階層「６」と「ＩＤ」の概念階層「７」のうち、低い方の概念階層「７」に１を加算した概念階層「８」を、単語「会員ＩＤ」の概念階層として特定し、特定した概念階層「８」の抽象度「２」を、単語「会員ＩＤ」の抽象度として特定する。

【0032】

図２の説明に戻る。図２の各処理部１１０，１２０，１３０，１４０は、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）などによって実現できる。また、各処理部１１０～１４０は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などのハードワイヤードロジックによっても実現できる。

【0033】

会話分析装置１００は、会話音声データ２０を図示しない外部装置から取得する。会話音声データ２０は、会議の会話を録音した音声データであり、たとえば、時間と音声のパワーとを対応付ける。

【0034】

第１判定部１１０は、会話音声データ２０を分析して、会話の状態を判定する処理部である。たとえば、第１判定部１１０は、会話音声データ２０の音声のパワーを走査して、音声のパワーが閾値Ｔｈｐ以上となる区間を、それぞれ発話区間として特定する。

【0035】

第１判定部１１０は、会話音声データ２０から特定する複数の発話区間のうち、最初の発話区間の開始時刻から、最後の発話区間の終了時刻までの時間を「会議時間」として算出する。

【0036】

第１判定部１１０は、複数の発話区間の長さを比較して、最長の発話区間を特定する。第１判定部１１０は、式（１）を基にして、会議時間に対する最長の発話区間の比率を算出する。

【0037】

比率＝最長の発話区間／会議時間×１００（％）・・・（１）

【0038】

第１判定部１１０は、式（１）に基づいて算出した比率と、リスク評価値テーブル１０５ａとを比較して、リスク評価値を判定する。リスク評価値は、会話の状態の一例である。第１判定部１１０は、リスク評価値の判定結果を、評価部１４０に出力する。

【0039】

なお、本実施例１で説明する第１判定部１１０は、式（１）を基にして、リスク評価値を判定する場合について説明したが、図１で説明したように、設定キーワードの出現回数に基づいて、会話の状態を判定してもよい。たとえば、第１判定部１１０は、音声認識部１２０の音声認識結果に含まれる全単語の出現回数の総数に対する設定キーワードの出現回数の比率を算出し、算出した比率と、リスク評価値テーブル１０５ａとを基にして、リスク評価値を判定してもよい。

【0040】

音声認識部１２０は、会話音声データ２０を音声解析し、発声された単語を抽出する処理部である。音声認識部１２０は、抽出した各単語の情報を、第２判定部１３０に出力する。音声認識部１２０は、どのような音声認識技術を利用してもよい。たとえば、会話音声データ２０に含まれる声の特徴を基にして、話し言葉を文字列に変換し、単語を定義した辞書情報を基にして、単語を抽出する。

【0041】

第２判定部１３０は、音声認識部１２０の音声認識結果と、抽象度判定テーブル１０５ｂとを基にして、会話内容の抽象度を判定する処理部である。第２判定部１３０は、判定した会話内容の抽象度の情報を、評価部１４０に出力する。

【0042】

たとえば、第２判定部１３０は、音声認識結果に含まれる複数の単語と、抽象度判定テーブル１０５ｂとを比較して、抽象度判定テーブル１０５ｂに登録された各単語について、単語毎の出現回数をカウントする。

【0043】

図６は、本実施例１に係る第２判定部の処理を説明するための図である。図６に示す例では、単語「要求仕様」の出現回数が「６」、単語「会員ＩＤ」の出現回数が「１」、単語「出力メッセージ」の出現回数が「１」である。単語「要求仕様」の抽象度が「１０」、単語「会員ＩＤ」の抽象度が「２」、単語「出力メッセージ」の抽象度が「４」であるため、抽象度の合計は「６６」となる。また、各単語の抽象度の平均は「８．２５」となる。第２判定部１３０は、この抽象度の平均を、判定結果の抽象度の情報として、評価部１４０に出力する。

【0044】

評価部１４０は、第１判定部１１０から出力される会話の状態（リスク評価値）と、第２判定部１３０から出力される抽象度とを基にして、会話音声データ２０に含まれる会話対象のリスクを評価する処理部である。

【0045】

たとえば、評価部１４０は、リスク評価値と、抽象度とを乗算した値が、基準評価値以上である場合、会話対象のリスクが「リスク大」であると評価する。一方、評価部１４０は、リスク評価値と、抽象度とを乗算した値が、基準評価値未満である場合、会話対象のリスクが「リスク小」であると評価する。

【0046】

評価部１４０は、評価結果を図示しない表示装置に出力して表示させてもよいし、ネットワークを介して図示しない外部装置に評価結果を通知してもよい。

【0047】

次に、本実施例１に係る会話分析装置１００の処理手順の一例について説明する。図７は、本実施例１に係る会話分析装置の処理手順を示すフローチャートである。図７に示すように、会話分析装置１００は、会話音声データ２０を取得する（ステップＳ１０１）。

【0048】

会話分析装置１００の第１判定部１１０は、会議時間に対する最長の発話時間の比率と、リスク評価値テーブル１０５ａとを基にして、会話の状態（リスク評価値）を判定する（ステップＳ１０２）。

【0049】

会話分析装置１００の音声認識部１２０は、会話音声データ２０に対して音声認識を実行し、発声された単語を抽出する（ステップＳ１０３）。会話分析装置１００の第２判定部１３０は、発声された単語と、抽象度判定テーブル１０５ｂとを基にして、会話内容の抽象度を判定する（ステップＳ１０４）。

【0050】

会話分析装置１００の評価部１４０は、会話の状態（リスク評価値）および会話内容の抽象度を基にして、会話対象のリスクを総合的に評価する（ステップＳ１０５）。評価部１４０は、評価結果を通知する（ステップＳ１０６）。

【0051】

次に、本実施例１に係る会話分析装置１００の効果について説明する。会話分析装置１００は、第１判定部１１０によって判定される会議の状態に加えて、会議内容の抽象度を用いて、会話対象のリスクを評価している。これによって、会話の対象としてのリスクの程度を適切に評価することができる。

【0052】

ここで、発明の効果の補足として、リスクの大小と、単語の出現頻度との関係について説明する。図８は、発明の効果を補足するための図である。たとえば、単語「中止処理」は、関連文書３０ａ，３０ｂ，３０ｃの様々な箇所で出現しており、出現頻度が高く、抽象度が高いと言える。抽象度が高いと、改善すべき点の範囲が広く、リスクは大きいと考えられる。抽象度が高いと、具体性にかけ、「中止処理が具体的に何の中止処理になのか」誤解のリスクもある。

【0053】

単語「文字コード」は、関連文書３０ａ，３０ｂ，３０ｃのうち、特定の関連文書３０ｃにのみ出現しており、出現頻度が低く、抽象度が低いと言える。抽象度が低いと、改善すべき点の範囲が限定的であり、リスクは小さいと考えられる。

【0054】

図８で説明したように、リスク評価値の大きい（会話の状態が悪い）会話の内容の議論の中心が、抽象度の高い単語であれば、リスクの程度も大きいと推定できる。

【0055】

ところで、本実施例１に係る会話分析装置１００の第２判定部１３０は、概念ＤＢ５０を基に生成された抽象度判定テーブル１０５ｂを基にして、単語の抽象度を特定していたがこれに限定されるものではない。第２判定部１３０は、単語（あるいは複合語）と、概念ＤＢ５０とを直接比較して、単語（あるいは複合語）に対応する抽象度を特定してもよい。

【実施例2】

【0056】

図９は、本実施例２に係る会話分析装置の構成を示す機能ブロック図である。図９に示すように、会話分析装置２００は、記憶部２０５と、音声認識部２１０と、第１判定部２２０と、第２判定部２３０と、評価部２４０と、生成部２５０とを有する。

【0057】

記憶部２０５は、設定キーワードテーブル２０５ａと、リスク評価値テーブル２０５ｂと、抽象度判定テーブル２０５ｃとを有する。記憶部２０５は、ＲＡＭ、ＲＯＭ、フラッシュメモリなどの半導体メモリ素子や、ＨＤＤなどの記憶装置に対応する。

【0058】

設定キーワードテーブル２０５ａは、会話の状態を判定するための抽出対象となる設定キーワードを定義するテーブルである。図１０は、本実施例２に係る設定キーワードテーブルのデータ構造の一例を示す図である。図１０に示すように、この設定キーワードテーブル２０５ａには、各種の設定キーワードが登録される。

【0059】

図１１は、本実施例２に係るリスク評価値テーブルのデータ構造の一例を示す図である。図１１に示すように、このリスク評価値テーブル２０５ｂは、出現回数と、リスク評価値とを対応付ける。出現回数は、会話音声データ２０の音声認識結果に含まれる単語のうち、設定キーワードの出現回数を示すものである。リスク評価値は、会議の状態の悪さの程度を示す値であり、リスク評価値が大きいほど、会議の状態が悪いことを示す。

【0060】

たとえば、出現回数が「Ｎａ以上、Ｎｂ未満」の場合、リスク評価値は「０」となる。出現回数が「Ｎｂ以上、Ｎｃ未満」の場合、リスク評価値は「１」となる。出現回数が「Ｎｃ以上」の場合、リスク評価値は「２」となる。ここで、Ｎａ、Ｎｂ、Ｎｃの値は、予め設定される値であり、大小関係をＮａ＜Ｎｂ＜Ｎｃとする。なお、２つの閾値Ｎａ、Ｎｂを用いて、リスク評価値を特定してもよい。たとえば、Ｎａ未満の場合に、リスク評価値を「０」とし、Ｎａ以上、Ｎｂ未満の場合に、リスク評価値を「１」とし、Ｎｂ以上の場合にリスク評価値「２」としてもよい。

【0061】

抽象度判定テーブル２０５ｃは、単語と抽象度とを対応付けるテーブルである。抽象度判定テーブル２０５ｃのデータ構造は、図４で説明した抽象度判定テーブル１０５ｂのデータ構造と同様である。

【0062】

図９の説明に戻る。図９の各処理部２１０，２２０，２３０，２４０は、ＣＰＵやＭＰＵなどによって実現できる。また、各処理部２１０～２４０は、ＡＳＩＣやＦＰＧＡなどのハードワイヤードロジックによっても実現できる。

【0063】

会話分析装置２００は、会話音声データ２０を図示しない外部装置から取得する。会話音声データ２０は、会議の会話を録音した音声データであり、たとえば、時間と音声のパワーとを対応付ける。

【0064】

音声認識部２１０は、会話音声データ２０を音声解析し、発声された単語を抽出する処理部である。音声認識部２１０は、抽出した各単語の情報を、第１判定部２２０および第２判定部２３０に出力する。音声認識部２１０は、どのような音声認識技術を利用してもよい。たとえば、会話音声データ２０に含まれる声の特徴を基にして、話し言葉を文字列に変換し、単語を定義した辞書情報を基にして、単語を抽出する。

【0065】

第１判定部２２０は、会話音声データ２０の音声認識結果を基にして、会話の状態を判定する処理部である。たとえば、第１判定部２２０は、音声認識部２１０の音声認識結果と、設定キーワードテーブル２０５ａとを基にして、音声認識結果の各単語のうち、設定キーワードの出現回数をカウントする。第１判定部２２０は、カウントした出現回数と、リスク評価値テーブル２０５ｂとを比較して、リスク評価値（会話の状態）を判定する。第１判定部２２０は、判定結果となる会話の状態を、評価部２４０に出力する。

【0066】

第２判定部２３０は、音声認識部２１０の音声認識結果と、抽象度判定テーブル２０５ｃとを基にして、会話内容の抽象度を判定する処理部である。第２判定部２３０は、判定した会話内容の抽象度の情報を、評価部２４０に出力する。第２判定部２３０が、会話内容の抽象度を判定する処理は、実施例１で説明した第２判定部１３０が、会話内容の抽象度を判定する処理と同様である。

【0067】

評価部２４０は、第１判定部２２０から出力される会話の状態（リスク評価値）と、第２判定部２３０から出力される抽象度とを基にして、会話音声データ２０に含まれる会話対象のリスクを評価する処理部である。評価部２４０がリスクを評価する処理は、評価部１４０がリスクを評価する処理と同様である。

【0068】

生成部２５０は、言語コーパス２５を取得し、抽象度判定テーブル２０５ｃを生成する処理部である。言語コーパス２５は、会話対象に関する言語コーパスとする。たとえば、会話対象が会議に関するものであれば、言語コーパス２５は、会議に関する言語コーパスとなる。

【0069】

生成部２５０は、言語コーパス２５を形態素解析し、各形態素（以下、単語）の出現頻度を集計する。生成部２５０は、単語の出現頻度を基にして、抽象度判定テーブル２０５ｃの各単語に対する抽象度を算出する。

【0070】

図１２は、本実施例２に係る生成部の処理を説明するための図である。図１２のテーブル１０Ｃは、単語と、言語コーパス２５での単語の出現頻度とを対応付けるテーブルである。生成部２５０は、式（２）を基にして、各単語の抽象度を算出してもよいし、出現頻度が低い順の順位を抽象度として算出してもよい。

【0071】

抽象度＝ｌｏｇ（出現頻度）×２・・・（２）

【0072】

たとえば、式（２）を基にして算出した各単語の抽象度を、第１抽象度と表記する。出現頻度の順位を基にして算出した各単語の抽象度を、第２抽象度と表記する。生成部２５０は、第１抽象度または第２抽象度のいずれか一方の抽象度を、抽象度判定テーブル２０５ｃに登録する。

【0073】

次に、本実施例２に係る会話分析装置２００の処理手順の一例について説明する。図１３は、本実施例２に係る会話分析装置の処理手順を示すフローチャートである。図１３に示すように、会話分析装置２００は、会話音声データ２０を取得する（ステップＳ２０１）。会話分析装置２００は、会話音声データ２０に対して音声認識を実行し、発声された単語を抽出する（ステップＳ２０２）。

【0074】

会話分析装置２００の第１判定部２２０は、発声された単語を基にして、設定キーワードの出現回数をカウントし、音声の状態（リスク評価値）を判定する（ステップＳ２０３）。

【0075】

会話分析装置２００の第２判定部２３０は、発声された単語と、抽象度判定テーブル２０５ｃとを基にして、会話内容の抽象度を判定する（ステップＳ２０４）。

【0076】

会話分析装置２００の評価部２４０は、会話の状態（リスク評価値）および会話内容の抽象度を基にして、会話対象のリスクを総合的に評価する（ステップＳ２０５）。評価部２４０は、評価結果を通知する（ステップＳ２０６）。

【0077】

次に、本実施例２に係る会話分析装置２００の効果について説明する。会話分析装置１００は、第１判定部１１０によって判定される、設定キーワードの出現回数に基づく会議の状態に加えて、会議内容の抽象度を用いて、会話対象のリスクを評価している。これによって、会話の対象としてのリスクの程度を適切に評価することができる。

【実施例3】

【0078】

図１４は、本実施例３に係る会話分析装置の構成の一例を示す機能ブロック図である。図１４に示すように、この会話分析装置３００は、記憶部３０５と、第１判定部３１０と、抽出部３２０と、音声認識部３３０と、第２判定部３４０と、評価部３５０とを有する。

【0079】

記憶部３０５は、リスク評価値テーブル３０５ａと、抽象度判定テーブル３０５ｂとを有する。記憶部３０５は、ＲＡＭ、ＲＯＭ、フラッシュメモリなどの半導体メモリ素子や、ＨＤＤなどの記憶装置に対応する。

【0080】

リスク評価値テーブル３０５ａは、比率と、リスク評価値とを対応付けるテーブルである。比率およびリスク評価値に関する説明は、実施例１のリスク評価値テーブル１０５ａで行った説明と同様である。リスク評価値テーブル３０５ａのデータ構造は、図３で説明したリスク評価値テーブル１０５ａのデータ構造と同様である。

【0081】

抽象度判定テーブル３０５ｂは、単語と、抽象度とを対応付けるテーブルである。抽象度に関する説明は、実施例１の抽象度判定テーブル１０５ｂで行った説明と同様である。抽象度判定テーブル３０５ｂのデータ構造は、図４で説明した抽象度判定テーブル３０５ｂのデータ構造と同様である。

【0082】

会話分析装置３００は、会話音声データ２０を図示しない外部装置から取得する。会話音声データ２０は、会議の会話を録音した音声データであり、たとえば、時間と音声のパワーとを対応付ける。

【0083】

第１判定部３１０は、会話音声データ２０を分析して、会話の状態を判定する処理部である。第１判定部３１０は、第１判定部１１０と同様にして、会議時間に対する最長の発話区間の比率を算出する。第１判定部３１０は、算出した比率と、リスク評価値テーブル３０５ａとを比較して、リスク評価値を判定する。第１判定部１１０は、リスク評価値（会話の状態）の判定結果を、評価部３５０に出力する。

【0084】

また、第１判定部３１０は、比率を算出する場合に利用した、「最長の発話区間」の情報を、抽出部３２０に出力する。

【0085】

抽出部３２０は、第１判定部３１０による会話の状態の判定に寄与した区間を「着目区間」として抽出する処理部である。図１５は、本実施例３に係る抽出部の処理を説明するための図である。たとえば、最長の発話区間を、時刻ｔ_１～時刻ｔ_２とすると、抽出部３２０は、時刻ｔ_１ａ～時刻ｔ_２ａを着目区間として抽出する。時刻ｔ_１ａは、ｔ_１よりも所定時間（たとえば、５分間）前の時刻である。時刻ｔ_２ａは、ｔ_２よりも所定時間（たとえば、５分間）後の時刻である。抽出部３２０は、着目区間の情報を、第２判定部３４０に出力する。

【0086】

音声認識部３３０は、会話音声データ２０を音声解析し、発声された単語を抽出する処理部である。音声認識部３３０は、抽出した各単語の情報を、第２判定部３４０に出力する。音声認識部３３０は、どのような音声認識技術を利用してもよい。たとえば、会話音声データ２０に含まれる声の特徴を基にして、話し言葉を文字列に変換し、単語を定義した辞書情報を基にして、単語を抽出する。

【0087】

第２判定部３４０は、音声認識部３３０の音声認識結果の単語のうち、着目区間に発声された単語と、抽象度判定テーブル３０５ｂとを基にして、会話内容の抽象度を判定する処理部である。第２判定部３４０は、判定した会話内容の抽象度の情報を、評価部３５０に出力する。

【0088】

たとえば、第２判定部３４０は、着目区間に含まれる複数の単語と、抽象度判定テーブル３０５ｂとを比較して、抽象度判定テーブル３０５ｂに登録された各単語について、単語毎の出現回数をカウントする。第２判定部３４０は、カウントした単語毎の出現回数を基にして、抽象度を判定する。カウントした単語毎の出現回数を基にして、抽象度を判定する処理は、実施例１で説明した第２判定部１３０の処理と同様である。

【0089】

評価部３５０は、第１判定部３１０から出力される会話の状態（リスク評価値）と、第２判定部３４０から出力される抽象度とを基にして、会話音声データ２０に含まれる会話対象のリスクを評価する処理部である。評価部３５０がリスクを評価する処理は、評価部１４０がリスクを評価する処理と同様である。

【0090】

次に、本実施例３に係る会話分析装置３００の処理手順の一例について説明する。図１６は、本実施例３に係る会話分析装置の処理手順を示すフローチャートである。図１６に示すように、会話分析装置３００は、会話音声データ２０を取得する（ステップＳ３０１）。

【0091】

会話分析装置３００の第１判定部１１０は、会議時間に対する最長の発話時間の比率と、リスク評価値テーブル３０５ａとを基にして、会話の状態（リスク評価値）を判定する（ステップＳ３０２）。会話分析装置３００の抽出部３２０は、会話の状態の判定に寄与した着目区間を抽出する（ステップＳ３０３）。

【0092】

会話分析装置３００の音声認識部３３０は、会話音声データ２０に対して音声認識を実行し、発声された単語を抽出する（ステップＳ３０４）。会話分析装置３００の第２判定部３４０は、着目区間中に発声された単語と、抽象度判定テーブル３０５ｂとを基にして、会話内容の抽象度を判定する（ステップＳ３０５）。

【0093】

会話分析装置３００の評価部３５０は、会話の状態（リスク評価値）および会話内容の抽象度を基にして、会話対象のリスクを総合的に評価する（ステップＳ３０６）。評価部３５０は、評価結果を通知する（ステップＳ３０７）。

【0094】

次に、本実施例３に係る会話分析装置３００の効果について説明する。会話分析装置３００は、会議内容の抽象度を判定する場合に、会議の状態の判定に寄与した着目区間で発声された単語を用いて、抽象度を判定し、会話対象のリスク評価に用いる。これにより、会議の状態に密接に関係する区間の抽象度を用いて、リスクの大小を評価できる。

【0095】

ところで、本実施例３に係る会話分析装置３００は、会話の状態の判定に寄与した着目区間を、最長の発話区間を用いて抽出していたがこれに限定されるものではない。たとえば、会話分析装置３００の抽出部３２０は、設定キーワードが含まれる発話区間を基にして、着目区間を抽出してもよい。この場合には、第１判定部３１０は、音声認識部３３０から、音声認識結果を取得し、発話区間に設定キーワードが含まれるか否かを判定し、設定キーワードの含まれる発話区間の情報を、抽出部３２０に出力する。

【0096】

次に、本実施例に示した会話分析装置１００（２００，３００）と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図１７は、本実施例に係る会話分析装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

【0097】

図１７に示すように、コンピュータ５００は、各種演算処理を実行するＣＰＵ５０１と、ユーザからのデータの入力を受け付ける入力装置５０２と、ディスプレイ５０３とを有する。また、コンピュータ５００は、記憶媒体からプログラム等を読み取る読み取り装置５０４と、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行うインタフェース装置５０５とを有する。コンピュータ５００は、各種情報を一時記憶するＲＡＭ５０６と、ハードディスク装置５０７とを有する。そして、各装置５０１～５０７は、バス５０８に接続される。

【0098】

ハードディスク装置５０７は、音声認識プログラム５０７ａ、第１判定プログラム５０７ｂ、抽出プログラム５０７ｃ、第２判定プログラム５０７ｄ、評価プログラム５０７ｅを有する。ＣＰＵ５０１は、音声認識プログラム５０７ａ、第１判定プログラム５０７ｂ、抽出プログラム５０７ｃ、第２判定プログラム５０７ｄ、評価プログラム５０７ｅを読み出してＲＡＭ５０６に展開する。

【0099】

音声認識プログラム５０７ａは、音声認識プロセス５０６ａとして機能する。第１判定プログラム５０７ｂは、第１判定プロセス５０６ｂとして機能する。抽出プログラム５０７ｃは、抽出プロセス５０６ｃとして機能する。第２判定プログラム５０７ｄは、第２判定プロセス５０６ｄとして機能する。評価プログラム５０７ｅは、評価プロセス５０６ｅとして機能する。

【0100】

音声認識プロセス５０６ａの処理は、音声認識部１２０，２１０，３３０の処理に対応する。第１判定プロセス５０６ｂの処理は、第１判定部１１０，２２０，３１０の処理に対応する。抽出プロセス５０６ｃの処理は、抽出部３２０の処理に対応する。第２判定プロセス５０６ｄの処理は、第２判定部１３０，２３０，３４０の処理に対応する。評価プロセス５０６ｅの処理は、評価部１４０，２４０，３５０の処理に対応する。

【0101】

なお、各プログラム５０７ａ～５０７ｅついては、必ずしも最初からハードディスク装置５０７に記憶させておかなくてもよい。例えば、コンピュータ５００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ５００が各プログラム５０７ａ～５０７ｅを読み出して実行するようにしてもよい。

【0102】

以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。

【0103】

（付記１）会話音声を分析して、会話の状態を判定する第１判定部と、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出する音声認識部と、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定する第２判定部と、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する評価部と
を有することを特徴とする会話分析装置。

【0104】

（付記２）前記第１判定部は、前記会話音声に含まれる所定の単語の出現回数、または、前記会話音声に含まれる複数の発話時間のうち、最長の発話時間を基にして、前記会話内容のリスクの程度を示す評価値を、前記会話の状態として判定することを特徴とする付記１に記載の会話分析装置。

【0105】

（付記３）前記第２判定部は、言語コーパスに含まれる単語の出現頻度を基にして前記抽象度を判定することを特徴とする付記１または２に記載の会話分析装置。

【0106】

（付記４）前記第２判定部は、より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語とを基にして、前記抽象度を判定することを特徴とする付記２に記載の会話分析装置。

【0107】

（付記５）前記会話音声の区間のうち、前記会話の状態の判定に寄与した区間を着目区間として抽出する抽出部を更に有し、前記第２判定部は、前記着目区間に含まれる単語を基にして、前記会話内容の抽象度を判定することを特徴とする付記１～４のいずれか一つに記載の会話分析装置。

【0108】

（付記６）コンピュータが実行する会話分析方法であって、
会話音声を分析して、会話の状態を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定し、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する
処理を実行することを特徴とする会話分析方法。

【0109】

（付記７）前記会話の状態を判定する処理は、前記会話音声に含まれる所定の単語の出現回数、または、前記会話音声に含まれる複数の発話時間のうち、最長の発話時間を基にして、前記会話内容のリスクの程度を示す評価値を、前記会話の状態として判定することを特徴とする付記６に記載の会話分析方法。

【0110】

（付記８）前記抽象度を判定する処理は、言語コーパスに含まれる単語の出現頻度を基にして前記抽象度を判定することを特徴とする付記６または７に記載の会話分析方法。

【0111】

（付記９）前記抽象度を判定する処理は、より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語とを基にして、前記抽象度を判定することを特徴とする付記７に記載の会話分析方法。

【0112】

（付記１０）前記会話音声の区間のうち、前記会話の状態の判定に寄与した区間を着目区間として抽出する処理を更に実行し、前記抽象度を判定する処理は、前記着目区間に含まれる単語を基にして、前記会話内容の抽象度を判定することを特徴とする付記６～９のいずれか一つに記載の会話分析方法。

【0113】

（付記１１）コンピュータに、
会話音声を分析して、会話の状態を判定し、
前記会話音声に対して音声認識を行い、前記会話音声に含まれる単語を抽出し、
前記会話音声に含まれる単語を基にして、前記会話音声における会話内容の抽象度を判定し、
前記会話の状態と前記抽象度とを基にして、前記会話内容を評価する
処理を実行させることを特徴とする会話分析プログラム。

【0114】

（付記１２）前記会話の状態を判定する処理は、前記会話音声に含まれる所定の単語の出現回数、または、前記会話音声に含まれる複数の発話時間のうち、最長の発話時間を基にして、前記会話内容のリスクの程度を示す評価値を、前記会話の状態として判定することを特徴とする付記１１に記載の会話分析プログラム。

【0115】

（付記１３）前記抽象度を判定する処理は、言語コーパスに含まれる単語の出現頻度を基にして前記抽象度を判定することを特徴とする付記１１または１２に記載の会話分析プログラム。

【0116】

（付記１４）前記抽象度を判定する処理は、より抽象的な単語ほど上位の層に位置する概念構造情報と、前記会話音声に含まれる単語とを基にして、前記抽象度を判定することを特徴とする付記１２に記載の会話分析プログラム。

【0117】

（付記１５）前記会話音声の区間のうち、前記会話の状態の判定に寄与した区間を着目区間として抽出する処理を更にコンピュータに実行させ、前記抽象度を判定する処理は、前記着目区間に含まれる単語を基にして、前記会話内容の抽象度を判定することを特徴とする付記１１～１４のいずれか一つに記載の会話分析プログラム。

【符号の説明】

【0118】

１００，２００，３００会話分析装置
１０５，２０５，３０５記憶部
１０５ａ，２０５ｂ，３０５ａリスク評価値テーブル
１０５ｂ，２０５ｃ，３０５ｂ抽象度判定テーブル
１１０，２２０，３１０第１判定部
１２０，２１０，３３０音声認識部
１３０，２３０，３４０第２判定部
１４０，２４０，３５０評価部
２０５ａ設定キーワードテーブル
３２０抽出部

【図1】