特許6751305 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社富士通エフサスの特許一覧

特許6751305分析装置、分析方法および分析プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6751305

(24)【登録日】2020年8月18日

(45)【発行日】2020年9月2日

(54)【発明の名称】分析装置、分析方法および分析プログラム

(51)【国際特許分類】

G10L 25/51 20130101AFI20200824BHJP

G10L 25/78 20130101ALI20200824BHJP

G10L 15/10 20060101ALI20200824BHJP

H04M 3/51 20060101ALI20200824BHJP

【ＦＩ】

G10L25/51

G10L25/78

G10L15/10 500Z

H04M3/51

【請求項の数】9

【全頁数】20

(21)【出願番号】特願2016-64591(P2016-64591)

(22)【出願日】2016年3月28日

(65)【公開番号】特開2017-181596(P2017-181596A)

(43)【公開日】2017年10月5日

【審査請求日】2018年9月21日

(73)【特許権者】

【識別番号】598057291

【氏名又は名称】株式会社富士通エフサス

(74)【代理人】

【識別番号】110002147

【氏名又は名称】特許業務法人酒井国際特許事務所

(72)【発明者】

【氏名】酒井康司

【審査官】須藤竜也

(56)【参考文献】

【文献】特開２０１１−２３８０２８（ＪＰ，Ａ）

【文献】特開２０１０−１７５６８４（ＪＰ，Ａ）

【文献】特開２０１３−１９７９０６（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ１０Ｌ２５／５１

Ｇ１０Ｌ１５／１０

Ｇ１０Ｌ２５／７８

Ｈ０４Ｍ３／５１

(57)【特許請求の範囲】

【請求項1】

第１話者および第２話者のうち、どちらの話者を優先するのかを示す優先関係情報と、コミュニケーションの状況を一意に識別する項目とを対応付けたテーブルとを記憶する記憶装置と、
複数の話者の間でなされた前記コミュニケーションの音声情報から、前記第１話者が発話した時間を示す第１発話時間と、前記第２話者が発話した時間を示す第２発話時間とを取得する取得部と、
分析対象とするコミュニケーションの状況に応じた項目に対応付けられる優先関係情報を前記記憶装置に記憶されたテーブルから選択し、選択した優先関係情報を基にして、前記第１話者が前記第２話者よりも優先されるか否かを判定し、前記第１話者が第２話者よりも優先されるか否かの判定結果と、前記第１発話時間および前記第２発話時間の関係とを基にして、前記コミュニケーションの優劣を分析する分析部と
を有することを特徴とする分析装置。

【請求項2】

前記分析部は、前記第１話者が前記第２話者よりも優先され、前記第１発話時間と前記第２発話時間との一部が重複し、前記第２発話時間の開始時刻よりも、前記第１発話時間の開始時刻の方が遅い場合に、前記コミュニケーションが優れていると判定することを特徴とする請求項１に記載の分析装置。

【請求項3】

前記分析部は、前記第２発話時間の終了時刻が、前記第２発話時間の猶予時間経過前である場合に、前記コミュニケーションの優劣を判定することをスキップすることを特徴とする請求項２に記載の分析装置。

【請求項4】

前記分析部は、前記第１話者が前記第２話者よりも優先され、前記第１発話時間に所定の単語が含まれており、前記第１発話時間の開始時刻が、前記第２発話時間の開始時刻よりも早い場合に、前記コミュニケーションが劣っていると判定することを特徴とする請求項１、２または３に記載の分析装置。

【請求項5】

前記分析部は、前記第１話者が前記第２話者よりも優先され、前記第１発話時間に前記第２発話時間が含まれ、かつ、前記第２発話時間の時間幅が所定時間幅未満である場合に、前記コミュニケーションが優れていると判定することを特徴とする請求項１〜４のいずれか一つに記載の分析装置。

【請求項6】

前記分析部は、前記第１話者が前記第２話者よりも優先され、前記第２発話時間の終了時刻から前記第１発話時間の開始時刻までの時間が所定時間以内である場合に、前記コミュニケーションの優劣を判定することをスキップすることを特徴とする請求項１〜５のいずれか一つに記載の分析装置。

【請求項7】

前記分析部によるコミュニケーションの優劣の分析結果と、時間とを対応付けて表示部に表示させる表示制御部を更に有することを特徴とする請求項１〜６のいずれか一つに記載の分析装置。

【請求項8】

コンピュータが実行する分析方法であって、
前記コンピュータは、第１話者および第２話者のうち、どちらの話者を優先するのかを示す優先関係情報と、コミュニケーションの状況を一意に識別する項目とを対応付けたテーブルとを記憶する記憶装置を有し、
複数の話者の間でなされた前記コミュニケーションの音声情報から、前記第１話者が発話した時間を示す第１発話時間と、前記第２話者が発話した時間を示す第２発話時間とを取得し、
分析対象とするコミュニケーションの状況に応じた項目に対応付けられる優先関係情報を前記記憶装置に記憶されたテーブルから選択し、
選択した前記記憶装置に記憶された優先関係情報を基にして、前記第１話者が前記第２話者よりも優先されるか否かを判定し、
前記第１話者が第２話者よりも優先されるか否かの判定結果と、前記第１発話時間および前記第２発話時間の関係とを基にして、前記コミュニケーションの優劣を分析する
処理を実行することを特徴とする分析方法。

【請求項9】

第１話者および第２話者のうち、どちらの話者を優先するのかを示す優先関係情報と、コミュニケーションの状況を一意に識別する項目とを対応付けたテーブルとを記憶する記憶装置を有するコンピュータに、
複数の話者の間でなされたコミュニケーションの音声情報から、前記第１話者が発話した時間を示す第１発話時間と、前記第２話者が発話した時間を示す第２発話時間とを取得し、
分析対象とするコミュニケーションの状況に応じた項目に対応付けられる優先関係情報を前記記憶装置に記憶されたテーブルから選択し、
選択した優先関係情報を基にして、前記第１話者が前記第２話者よりも優先されるか否かを判定し、
前記第１話者が第２話者よりも優先されるか否かの判定結果と、前記第１発話時間および前記第２発話時間の関係とを基にして、前記コミュニケーションの優劣を分析する
処理を実行させることを特徴とする分析プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、分析装置等に関する。

【背景技術】

【0002】

音声によるコミュニケーションには、電話による会話、相談窓口などによる対話、会議での議論、雑談、ロボットとの会話など様々な種類がある。ここで、話者が他の話者とコミュニケーションを行う場合に、話者が他の話者にとって優れたコミュニケーションを行っているか否かを判定し、話者にフィードバックできれば、話者にとって有用な情報となり得る。

【0003】

コミュニケーションの優劣を判定する従来技術１，２について説明する。従来技術１には、音声ファイルの顧客の声のトーンに基づいて、顧客によるクレームの有無を判断する技術が開示されている。従来技術２には、対話の重複の有無、発話割合、沈黙、話速等を評価基準にして、オペレータの会話を評価する技術が開示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１３−５１５２９号公報

【特許文献2】特開２０１４−１２３８１３号公報

【特許文献3】国際公開第２０１２／１２４１０４号

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、上述した従来技術では、コミュニケーションの優劣を適切に判定することができないという問題がある。

【0006】

１つの側面では、本発明は、コミュニケーションの優劣を適切に判定することができる分析装置、分析方法および分析プログラムを提供することを目的とする。

【課題を解決するための手段】

【0007】

第１の案では、分析装置は、取得部と、分析部とを有する。取得部は、複数の話者の間でなされたコミュニケーションの音声情報から、第１話者が発話した時間を示す第１発話時間と、第２話者が発話した時間を示す第２発話時間とを取得する。分析部は、第１話者および２話者の優先関係情報と、第１発話時間および第２発話時間の関係とを基にして、コミュニケーションの優劣を分析する。

【発明の効果】

【0008】

コミュニケーションの優劣を適切に判定することができる。

【図面の簡単な説明】

【0009】

【図1】図１は、本実施例１に係る分析装置の構成を示す図である。

【図2】図２は、音声録音機が録音する会話のパターンを説明するための図（１）である。

【図3】図３は、音声録音機が録音する会話のパターンを説明するための図（２）である。

【図4】図４は、音声録音機が録音する会話のパターンを説明するための図（３）である。

【図5】図５は、音声テーブルのデータ構造の一例を示す図である。

【図6】図６は、会話パターンテーブルのデータ構造の一例を示す図である。

【図7】図７は、分析項目テーブルのデータ構造の一例を示す図である。

【図8】図８は、分析結果テーブルのデータ構造の一例を示す図である。

【図9】図９は、「開始時のあいさつ」を分析する従来技術を説明するための図である。

【図10】図１０は、「開始時のあいさつ」を分析する分析部の処理を説明するための図である。

【図11】図１１は、「適切なあいづち」を分析する従来技術を説明するための図である。

【図12】図１２は、「適切なあいづち」を分析する分析部の処理を説明するための図（１）である。

【図13】図１３は、「適切なあいづち」を分析する分析部の処理を説明するための図（２）である。

【図14】図１４は、「さえぎり」を分析する従来技術を説明するための図である。

【図15】図１５は、「さえぎり」を分析する分析部の処理を説明するための図である。

【図16】図１６は、「さえぎり」を分析する分析部の例外処理を説明するための図である。

【図17】図１７は、「だまりこみ」を分析する従来技術を説明するための図である。

【図18】図１８は、「だまりこみ」を分析する分析部の処理を説明するための図（１）である。

【図19】図１９は、「だまりこみ」を分析する分析部の処理を説明するための図（２）である。

【図20】図２０は、分析結果表示画面の一例を示す図である。

【図21】図２１は、本実施例に係る分析装置の処理手順の一例を示すフローチャートである。

【発明を実施するための形態】

【0010】

以下に、本願の開示する分析装置、分析方法および分析プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

【実施例】

【0011】

図１は、本実施例１に係る分析装置の構成を示す図である。図１に示すように、この分析装置１００は、インタフェース部１１０と、入力部１２０と、表示部１３０と、スピーカ１３５と、記憶部１４０と、制御部１５０とを有する。

【0012】

インタフェース部１１０は、ネットワークを介して他の外部装置と通信を行う処理部である。なお、インタフェース部１１０は、直接、外部装置と接続し、通信を実行しても良い。インタフェース部１１０は、通信装置に対応する。後述する制御部１５０は、インタフェース部１１０を介して、外部装置とデータをやり取りする。

【0013】

例えば、外部装置は、複数の話者の間でなされたコミュニケーションの音声情報を録音する音声録音機に対応する。話者は、顧客、オペレータ、窓口担当者、会社の同僚などである。図２〜図４は、音声録音機が録音する会話のパターンを説明するための図である。

【0014】

図２について説明する。図２は、電話での会話を録音する例である。電話機３ａおよび電話機３ｂが接続され、電話機３ｂは、音声録音機１０に接続される。図２において、話者１は、顧客とし、話者２を、オペレータとする。音声録音機１０は、話者１と話者２との間でなされたコミュニケーションの音声情報を録音する。

【0015】

図３について説明する。図３は、窓口での会話を録音する例である。マイク４ａ，４ｂが音声録音機１０に接続される。図３において、話者１は、顧客とし、話者２を、窓口担当者とする。音声録音機１０を、話者１と話者２との間でなされたコミュニケーションの音声情報を録音する。

【0016】

図４について説明する。図４は、会議での会話を録音する例である。マイク４ａ，４ｂ，４ｃが音声録音機１０に接続される。図４において、話者１〜話者３は、会社の同僚とする。音声録音機１０は、話者１〜３の間でなされたコミュニケーションの音声情報を録音する。

【0017】

図１の説明に戻る。入力部１２０は、各種の情報を分析装置１００に入力するための装置である。例えば、入力部１２０は、キーボードやマウス、タッチパネル等に対応する。例えば、利用者は、入力部１２０を操作して、コミュニケーションの優劣に関する分析結果を参照する。

【0018】

表示部１３０は、制御部１５０から出力される各種の情報を表示する表示装置である。例えば、表示部１３０は、コミュニケーションの優劣に関する分析結果を表示する。表示部１３０は、液晶モニタやタッチパネル等に対応する。スピーカ１３５は、各種の音情報を出力するスピーカである。

【0019】

記憶部１４０は、音声テーブル１４１、会話パターンテーブル１４２、分析項目テーブル１４３、分析結果テーブル１４４を有する。記憶部１４０は、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ（Flash Memory）などの半導体メモリ素子、またはハードディスク、光ディスクなどの記憶装置に対応する。

【0020】

音声テーブル１４１は、音声録音機１０によって録音された音声情報を保持するテーブルである。図５は、音声テーブルのデータ構造の一例を示す図である。図５に示すように、この音声テーブル１４１は、音声ＩＤ、会話ＩＤ、音声情報を対応付ける。音声ＩＤは、音声情報を一意に識別する情報である。会話ＩＤは、会話を一意に識別する情報である。また、会話ＩＤによって、図６に示す会話パターンテーブル１４２のレコードと対応付けられる。

【0021】

音声情報は、各話者を識別する話者ＩＤと、話者の音声情報とをそれぞれ対応付ける。例えば、音声ＩＤ「Ａ００１」の音声情報では、第１話者ＩＤ「１００１」と第１音声情報とが対応付けられ、第２話者ＩＤ「２００１」と第２音声情報とが対応付けられる。

【0022】

会話パターンテーブル１４２は、会話のパターンや、話者の優先順に関する情報を保持するテーブルである。図６は、会話パターンテーブルのデータ構造の一例を示す図である。図６に示すように、この会話パターンテーブル１４２は、会話ＩＤ、会話パターン、優先順位、話者数、各話者を識別する話者ＩＤと、各話者名を対応付ける。

【0023】

会話ＩＤは、会話を一意に識別する情報である。また、会話ＩＤによって、音声テーブル１４１のレコードと対応付けられる。会話パターンは、会話パターンの内容を示すものである。優先順位は、話者の優先順位を示す情報である。話者数は、コミュニケーションを行った話者の人数を示すものである。例えば、会話ＩＤ「Ｔ００１」のレコードについて説明する。このレコードは、コールセンターでの電話対応に関するものであり、第１話者（お客様）と第２話者（オペレータ）とが会話しており、第１話者が第２話者よりも優先である旨の情報が格納されている。

【0024】

分析項目テーブル１４３は、分析対象となる項目や、分析する場合に利用する各種の情報を保持するテーブルである。図７は、分析項目テーブルのデータ構造の一例を示す図である。図７に示すように、この分析項目テーブル１４３は、分析項目ＩＤ、項目名、前方猶予時間、後方猶予時間、最小判定時間、最大判定時間、パラメータを対応付ける。分析項目ＩＤは、分析項目を一意に識別する情報である。項目名は、分析項目の名称である。前方猶予時間および後方猶予時間については、後述する。最小判定時間は、分析対象となる音声情報の最小判定時間である。最大判定時間は、分析対象となる音声情報の最大判定時間である。パラメータは、分析を行う場合に利用するパラメータである。

【0025】

分析結果テーブル１４４は、分析結果に関する情報を保持するテーブルである。図８は、分析結果テーブルのデータ構造の一例を示す図である。図８に示すように、この分析結果テーブル１４４は、分析結果ＩＤ、分析項目ＩＤ、タグ番号、開始時刻、終了時刻、分析結果、コメントを有する。分析結果ＩＤは、分析結果に関するレコードを一意に識別する情報である。分析項目ＩＤは、分析項目を一意に識別する情報である。タグ番号は、タグの番号を示すものである。タグに関する説明は後述する。開始時刻は、分析範囲の開始時刻である。終了時刻は、分析範囲の終了時刻である。分析結果は、分析結果を示すものである。分析結果は「優」、「劣」、「−（優でも劣でもない）」のいずれかとなる。コメントは、分析結果のコメントである。

【0026】

図１の説明に戻る。制御部１５０は、取得部１５１と、分析部１５２と、表示制御部１５３とを有する。制御部１５０は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）や、ＦＰＧＡ（Field Programmable Gate Array）などの集積装置に対応する。また、制御部１５０は、例えば、ＣＰＵやＭＰＵ（Micro Processing Unit）等の電子回路に対応する。

【0027】

取得部１５１は、インタフェース部１１０を介して、音声録音機１０から音声情報を取得する処理部である。例えば、音声録音機１０から取得する音声情報には、音声ＩＤ、会話ＩＤが添付されている。取得部１５１は、音声ＩＤと、会話ＩＤと、音声情報とを対応付けて、音声テーブル１４１に登録する。図５に示す音声情報は、初めから、第１話者の音声情報と、第２話者の音声情報が分かれている場合について説明したがこれに限定されない。取得部１５１は、第１、２話者の音声が混在する音声情報に対して、音声クリーニングを実行し、第１話者の音声情報と、第２話者の音声情報とを分離しても良い。

【0028】

分析部１５２は、音声情報を分析することで、コミュニケーションの優劣を判定する処理部である。分析部１５２が分析する分析項目には「開始時あいさつ」、「適切なあいづち」、「さえぎり」、「だまりこみ」がある。各分析項目に関する、分析部１５２の処理の一例を順に説明する。

【0029】

まず、「開始時のあいさつ」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。図９は、「開始時のあいさつ」を分析する従来技術を説明するための図である。分析結果例１について説明する。第１話者の音声が、時刻ｔ_１に開始し、時刻ｔ_２に終了し、第１話者の音声に「開始時のあいさつ」が含まれているものとする。開始時のあいさつは「おはようございます、おつかれさまです」等に対応する。また、第２話者の音声が、時刻ｔ_２に開始し、時刻ｔ_３に終了し、第２話者の音声に「開始時のあいさつ」が含まれているものとする。分析範囲をｔ_１〜ｔ_２とする。従来技術では、第１話者の開始時のあいさつに続き、第２話者が開始時のあいさつをしているため、分析範囲の分析結果を「優」と判定する。

【0030】

分析結果例２について説明する。第２話者の音声が、ｔ_１に開始し、ｔ_２に終了し、第２話者の音声に「開始時のあいさつ」が含まれているものとする。また、第１話者の音声が、ｔ_２に開始し、ｔ_３に終了し、第１話者の音声に「開始時のあいさつ」が含まれているものとする。分析範囲をｔ_１〜ｔ_２とする。従来技術では、第２話者の開始時のあいさつに続き、第１話者が開始時のあいさつをしているため、分析範囲の分析結果を「優」と判定する。

【0031】

しかしながら、従来技術では、優先する話者を判断基準に入れていないため、適切に分析できていない。例えば、第１話者が第２話者よりも優先であるとすると、図９の分析結果例１は、第１話者が第２話者よりも先にあいさつしているため、印象がわるく、「優」とは言えない。

【0032】

図１０は、「開始時のあいさつ」を分析する分析部の処理を説明するための図である。分析結果例３について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第１話者と第２話者との音声情報を取得する。第１話者の音声が、時刻ｔ_２に開始し、時刻ｔ_３に終了し、第１話者の音声に「開始時のあいさつ」が含まれているものとする。また、第２話者の音声が、時刻ｔ_３に開始し、時刻ｔ_５に終了し、第２話者の音声に「開始時のあいさつ」が含まれているものとする。分析部１５２は、会話ＩＤ「Ｔ００１」をキーとして、会話パターンテーブル１４２を参照することで、第１話者が第２話者よりも優先であると判定する。

【0033】

分析部１５２は、「開始時のあいさつ」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００１」のレコードを取得する。分析部１５２は、時刻ｔ_２〜ｔ_３を分析範囲とし、時刻ｔ_１〜ｔ_２をタグ用前方猶予時間に設定し、時刻ｔ_３〜ｔ_４をタグ用後方猶予時間に設定する。分析部１５２は、第１話者の開始時のあいさつに続き、第２話者が開始時のあいさつをしているが、優先される第１話者の方が先にあいさつをしているため、第１話者に対する印象がわるい。このため、分析部１５２は、分析範囲の分析結果を「劣」と判定する。

【0034】

分析結果例４について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第１話者と第２話者との音声情報を取得する。第１話者の音声が、時刻ｔ_３に開始し、時刻ｔ_５に終了し、第１話者の音声に「開始時のあいさつ」が含まれているものとする。また、第２話者の音声が、時刻ｔ_２に開始し、時刻ｔ_３に終了し、第２話者の音声に「開始時のあいさつ」が含まれているものとする。分析部１５２は、会話ＩＤ「Ｔ００１」をキーとして、会話パターンテーブル１４２を参照することで、第１話者が第２話者よりも優先であると判定する。

【0035】

分析部１５２は、「開始時のあいさつ」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００１」のレコードを取得する。分析部１５２は、時刻ｔ_２〜ｔ_３を分析範囲とし、ｔ_１〜ｔ_２をタグ用前方猶予時間に設定し、ｔ_３〜ｔ_４をタグ用後方猶予時間に設定する。分析部１５２は、第２話者の開始時のあいさつに続き、第１話者が開始時のあいさつをしており、優先されない第２話者の方が先にあいさつをしているため、第１話者に対する印象がよい。このため、分析部１５２は、分析範囲の分析結果を「優」と判定する。

【0036】

ここで、分析部１５２が、音声情報に「開始時のあいさつ」が含まれているか否かをどのように判定しても良い。例えば、開始時のあいさつの音声の特徴を示すテンプレートと、話者の音声情報とを比較して、開始時のあいさつが含まれているか否かを判定しても良い。

【0037】

続いて、「適切なあいづち」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。図１１は、「適切なあいづち」を分析する従来技術を説明するための図である。分析結果例１について説明する。第１話者の音声が、ｔ_１に開始し、ｔ_４に終了する。また、第２話者の音声が、ｔ_２に開始し、ｔ_３に終了し、第２話者の音声に「あいづち」が含まれているものとする。分析範囲をｔ_２〜ｔ_３とする。従来技術では、第１話者の会話中に、第２話者があいづちを打っているため、分析範囲の分析結果を「優」と判定する。

【0038】

分析結果例２について説明する。第１話者の音声が、ｔ_２に開始し、ｔ_３に終了し、第１話者の音声に「あいづち」が含まれているものとする。また、第２話者の音声が、ｔ_１に開始し、ｔ_４に終了する。分析範囲をｔ_２〜ｔ_３とする。従来技術では、第２話者の会話中に、第１話者があいづちを打っているため、分析範囲の分析結果を「優」と判定する。

【0039】

しかしながら、従来技術では、優先する話者を判断基準にいれていないため、適切に分析できていない。例えば、第１話者が第２話者よりも優先であるとすると、図１１の分析結果例２では、優先される第１話者があいづちを打っているため、実際には優劣には関係がなく、従来技術による「優」の判定結果は適切でない。

【0040】

図１２は、「適切なあいづち」を分析する分析部の処理を説明するための図（１）である。分析結果例３について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第１話者と第２話者との音声情報を取得する。第１話者の音声が、時刻ｔ_１に開始し、時刻ｔ_６に終了する。また、第２話者の音声が、時刻ｔ_３に開始し、時刻ｔ_４に終了し、第２話者の音声に「あいづち」が含まれているものとする。分析部１５２は、会話ＩＤ「Ｔ００１」をキーとして、会話パターンテーブル１４２を参照することで、第１話者が第２話者よりも優先であると判定する。

【0041】

分析部１５２は、「適切なあいづち」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００２」のレコードを取得する。分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_１〜ｔ_２をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、優先される第１話者の発話中に、第２話者があいづちを打っているため、第１話者に対する印象が良いと考えられ、分析範囲の分析結果を「優」と判定する。

【0042】

分析結果例４について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第１話者と第２話者との音声情報を取得する。第１話者の音声が、ｔ_３に開始し、ｔ_４に終了し、第１話者の音声に「あいづち」が含まれているものとする。また、第２話者の音声が、ｔ_１に開始し、ｔ_６に終了する。分析部１５２は、会話ＩＤ「Ｔ００１」をキーとして、会話パターンテーブル１４２を参照することで、第１話者が第２話者よりも優先であると判定する。

【0043】

分析部１５２は、「適切なあいづち」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００２」のレコードを取得する。分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_２〜ｔ_３をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、優先されない第２話者の発話中に、第１話者があいづちを打っているため、このあいづちについては、優劣には関係がないため、分析範囲の分析結果を「−」と判定する。

【0044】

また、分析部１５２は、所定時間（例えば、３０秒）あたりのあいづちの回数を更に利用して、「適切なあいづち」を分析しても良い。例えば、図１２で説明したように、分析部１５２は、「優」と判定したあいづちの回数が、最小あいづち数以上、最大あいづち未満である場合に、あいづちに対応する分析範囲の判定結果を、そのまま「優」とする。最小あいづち数および最大あいづち数は、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００２」のレコードに設定されている。

【0045】

図１３は、「適切なあいづち」を分析する分析部の処理を説明するための図（２）である。例えば、最小あいづち数を「２」、最大あいづち数を「３」とすると、図１３に示す例では、「優」と判定したあいづちの数が「２」であるため、各あいづちに対する分析範囲の分析結果を「優」のままとする。

【0046】

これに対して、分析部１５２は、「優」と判定したあいづちの回数が、最小あいづち数以上、最大あいづち未満でない場合に、あいづちに対する分析範囲の判定結果を、「優」から「劣」に変更してもよい。あいづちが多すぎる、または、すくなすぎる場合には、印象が悪いと考えられるためである。

【0047】

ここで、分析部１５２が、音声情報があいづちであるか否かを判定する処理の一例について説明する。分析部１５２は、分析範囲が最小時間以上、かつ、最大時間未満である場合に、分析範囲に含まれる音声情報を、あいづちと判定する。これに対して、分析部１５２は、分析範囲が、最小時間未満である場合や、最大時間以上である場合には、雑音であると判定する。分析部１５２は、分析項目テーブル１４３を参照し、最小時間および最大時間の情報を取得する。

【0048】

「さえぎり」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。図１４は、「さえぎり」を分析する従来技術を説明するための図である。分析結果例１について説明する。第１話者の音声が、時刻ｔ_１に開始し、時刻ｔ_３に終了する。第２話者の音声が、時刻ｔ_２に開始し、時刻ｔ_４に終了する。第１話者の音声と、第２話者の音声とが重複しており、重複する範囲を、分析範囲ｔ_２〜ｔ_３とする。従来技術では、この分析範囲において、さえぎりが発生していると判定する。さえぎりは、相手の会話をさえぎって会話を始めることである。一般的に、さえぎりが発生すると、相手方に対する印象が悪いため、従来技術では、分析範囲ｔ_２〜ｔ_３の分析結果を「劣」と判定する。

【0049】

分析結果例２について説明する。第１話者の音声が、時刻ｔ_２に開始し、時刻ｔ_４に終了する。第２話者の音声が、時刻ｔ_１に開始し、時刻ｔ_３に終了する。第１話者の音声と、第２話者の音声とが重複しており、重複する範囲を、分析範囲ｔ_２〜ｔ_３とする。従来技術では、分析結果例１と同様にして、分析範囲ｔ_２〜ｔ_３において、さえぎりが発生していると判定する。このため、分析範囲ｔ_２〜ｔ_３の分析結果を「劣」と判定する。

【0050】

上記のように、さえぎりが発生した場合には、相手方に対する印象が悪いといえるが、これは、各話者の優先度を考慮しないことが前提となる。例えば、優先される話者が、優先されない話者の会話をさえぎることは、相手方に対する印象が悪いのではなく、印象が良いと判定すべきである。優先する話者が、優先しない話者の発言をさえぎって、発言を訂正している場合などが考えられる。このため、従来技術による判定結果は、適切に優劣を判定できていない。

【0051】

図１５は、「さえぎり」を分析する分析部の処理を説明するための図である。分析結果例３について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第１話者と第２話者との音声情報を取得する。第１話者の音声が、時刻ｔ_１に開始し、時刻ｔ_４に終了する。また、第２話者の音声が、時刻ｔ_３に開始し、時刻ｔ_６に終了する。分析部１５２は、会話ＩＤ「Ｔ００１」をキーとして、会話パターンテーブル１４２を参照することで、第１話者が第２話者よりも優先であると判定する。

【0052】

分析部１５２は、「さえぎり」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００３」のレコードを取得する。分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_２〜ｔ_３をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、分析範囲ｔ_３〜ｔ_４が、最大判定時間以上の場合には、分析範囲が「さえぎり」であると判定する。分析結果例３における分析範囲ｔ_３〜ｔ_４は、最大判定時間以上とする。

【0053】

分析部１５２は、優先される第１話者の会話を、優先されない第２話者がさえぎっているため、分析範囲ｔ_３〜ｔ_４の分析結果を「劣」と判定する。

【0054】

分析結果例４について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第１話者と第２話者との音声情報を取得する。第１話者の音声が、時刻ｔ_３に開始し、時刻ｔ_６に終了する。また、第２話者の音声が、時刻ｔ_１に開始し、時刻ｔ_４に終了する。分析部１５２は、会話ＩＤ「Ｔ００１」をキーとして、会話パターンテーブル１４２を参照することで、第１話者が第２話者よりも優先であると判定する。

【0055】

分析部１５２は、「さえぎり」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００３」のレコードを取得する。分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_２〜ｔ_３をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、分析範囲ｔ_３〜ｔ_４が、最大判定時間以上の場合には、分析範囲が「さえぎり」であると判定する。分析結果例４における分析範囲ｔ_３〜ｔ_４は、最大判定時間以上とする。

【0056】

分析部１５２は、優先されない第２話者の会話を、優先される第１話者がさえぎっているため、分析範囲ｔ_３〜ｔ_４の分析結果を「優」と判定する。上記のように、優先される話者が、優先されない話者の会話をさえぎることは、相手方に対する印象が悪いのではなく、印象が良いと判定すべきである。

【0057】

ここで、分析部１５２の例外的な処理について説明する。分析部１５２は、優先される第１話者の会話を、優先されない第２話者がさえぎっている場合には、「劣」と判定していたが、第２話者が直ちに会話を終了した場合には、判定結果を「−」に修正する。

【0058】

図１６は、「さえぎり」を分析する分析部の例外処理を説明するための図である。図１６の分析結果例５において、第１話者の音声が、時刻ｔ_１に開始し、時刻ｔ_４に終了する。また、第２話者の音声が、時刻ｔ_３に開始し、時刻ｔ_５に終了する。第１話者が第２話者よりも優先であるものとする。

【0059】

分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_２〜ｔ_３をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、分析範囲ｔ_３〜ｔ_４が、最大判定時間以上の場合には、分析範囲が「さえぎり」であると判定する。分析結果例５における分析範囲ｔ_３〜ｔ_４は、最大判定時間以上とする。ここで、さえぎりが発生した後、時刻ｔ_５までに、第２話者の会話が終了しているため、分析部１５２は、分析範囲ｔ_３〜ｔ_４の分析結果を「−」と判定する。

【0060】

「だまりこみ」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。図１７は、「だまりこみ」を分析する従来技術を説明するための図である。分析結果例１について説明する。第２話者の音声が時刻ｔ_１に開始し、時刻ｔ_２に終了する。また、第２話者の音声が時刻ｔ_３に開始し、時刻ｔ_４に終了する。分析範囲を時刻ｔ_２〜ｔ_３とする。一般的に、無音は、相手に与える印象が悪いと考えられるため、従来技術では、分析範囲に無音区間があると、分析結果を「劣」と判定している。このため、従来技術では、分析範囲ｔ_２〜ｔ_３の分析結果を「劣」と判定する。

【0061】

分析結果例２について説明する。第２話者の音声が時刻ｔ_１に開始し、時刻ｔ_２に終了する。また、第１話者の音声が時刻ｔ_３に開始し、時刻ｔ_４に終了する。分析範囲を時刻ｔ_２〜ｔ_３とする。分析範囲ｔ_２〜ｔ_３は、無音区間であるため、判定結果は「劣」となる。

【0062】

しかしながら、分析範囲が無音区間である場合において、必ずしも、相手に悪い印象を与えているわけではないので、適切に分析できていない。例えば、会話の一時中断や、相手の会話を待っている状況の無音区間は、コミュニケーションの優劣に関係しない。

【0063】

図１８及び図１９は、「だまりこみ」を分析する分析部の処理を説明するための図である。分析結果例３について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第２話者の音声情報を取得する。第２話者の音声が、時刻ｔ_１に開始し、時刻ｔ_３に終了する。また、第２話者の音声が、時刻ｔ_４に開始し、時刻ｔ_６に終了する。

【0064】

分析部１５２は、「だまりこみ」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００４」のレコードを取得する。分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_２〜ｔ_３をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、分析範囲ｔ_３〜ｔ_４が最小判定時間よりも小さい場合には、分析範囲ｔ_３〜ｔ_４の無音区間は、会話一時中断であるとして、分析範囲ｔ_３〜ｔ_４の分析結果を「−」に設定する。

【0065】

分析結果例４について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第１話者と第２話者との音声情報を取得する。第２話者の音声が、時刻ｔ_１に開始し、時刻ｔ_３に終了する。また、第１話者の音声が、時刻ｔ_４に開始し、時刻ｔ_６に終了する。分析部１５２は、会話ＩＤ「Ｔ００１」をキーとして、会話パターンテーブル１４２を参照することで、第１話者が第２話者よりも優先であると判定する。

【0066】

分析部１５２は、「だまりこみ」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００４」のレコードを取得する。分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_２〜ｔ_３をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、分析範囲ｔ_３〜ｔ_４が最小時間よりも短い場合には、分析範囲ｔ_３〜ｔ_４の無音区間は、相手の会話待ちであるとして、分析範囲ｔ_３〜ｔ_４の分析結果を「−」に設定する。

【0067】

分析結果例５について説明する。例えば、分析部１５２は、音声テーブル１４１にアクセスし、会話ＩＤ「Ｔ００１」の音声情報を取得することで、第２話者の音声情報を取得する。第２話者の音声が、時刻ｔ_１に開始し、時刻ｔ_３に終了する。また、第２話者の音声が、時刻ｔ_４に開始し、時刻ｔ_６に終了する。

【0068】

分析部１５２は、「だまりこみ」を分析するため、分析項目テーブル１４３の分析項目ＩＤ「Ｂ００４」のレコードを取得する。分析部１５２は、時刻ｔ_３〜ｔ_４を分析範囲とし、時刻ｔ_２〜ｔ_３をタグ用前方猶予時間に設定し、時刻ｔ_４〜ｔ_５をタグ用後方猶予時間に設定する。分析部１５２は、分析範囲ｔ_３〜ｔ_４が最小判定時間よりも大きく、最大判定時間未満の場合には、分析範囲ｔ_３〜ｔ_４の無音区間は、長期間の中断であるとして、分析範囲ｔ_３〜ｔ_４の分析結果を「劣」に設定する。

【0069】

ここで、分析部１５２が、「だまりこみ」の分析範囲を判定する処理の一例について説明する。分析部１５２は、第１音声の終了時刻を基準とするタグ化用後方猶予時間に、第１音声に続く第２音声が含まれ、かつ、第２音声の開示時刻を基準とする前方タグ化用前方猶予時間に、第１音声が含まれる場合に、第１音声の終了時刻から第２音声の開始時刻までの間を、だまりこみの分析範囲と判定する。分析部１５２は、分析範囲を特定した後に、上記処理を実行する。

【0070】

以上説明してきたように、分析部１５２は、音声テーブル１４１から分析対象となる音声情報を取得し、音声情報の会話ＩＤと、会話パターンテーブル１４２に基づいて、各音声情報の話者の優先を判定したうえで、「開始時あいさつ」、「適切なあいづち」、「さえぎり」、「だまりこみ」の分析を実行する処理を、各音声情報に対し実行し、分析範囲の「優」、「劣」、「−」を判定する。分析部１５２は、判定結果を分析結果テーブル１４４に格納する。

【0071】

図８に示すように、分析部１５２は、分析結果にユニークな分析結果ＩＤを割り当て、分析結果ＩＤ、分析項目ＩＤ、タグ番号、開始時刻、終了時刻、分析結果を対応づけて、分析結果テーブル１４４に格納する。ここで、タグ番号は、上述した分析範囲を示す番号である。

【0072】

ところで、分析部１５２は、各話者の立場が対等である場合には、従来技術と同様の判定基準によって、コミュニケーションの優劣を判定しても良い。

【0073】

図１の説明に戻る。表示制御部１５３は、分析結果テーブル１４４の情報を基にして、コミュニケーションの優劣の分析結果を、時間と対応付けて表示部１３０に表示させる処理部である。例えば、表示制御部１５３は、分析結果テーブル１４４を基にして、分析結果表示画面を生成する。

【0074】

図２０は、分析結果表示画面の一例を示す図である。図２０に示すように、分析結果表示画面５０は、第１話者音声情報の時間変化に伴う波形を示す領域５１と、第２話者音声情報の時間変化に伴う波形を示す領域５２とを有する。分析結果表示画面５０は、各分析項目の分析結果を表示する結果表示領域５３〜５６を有する。また、表示制御部１５３は、優先する話者の情報を、領域５０ａに表示させても良い。

【0075】

各結果表示領域５３には、分析範囲に対応する複数のタグが、表示される。例えば、分析項目「開始時のあいさつ」の結果表示領域５３には、タグ５３ａが表示される。分析項目「適切なあいづち」の結果表示領域５４には、タグ５４ａ，５４ｂ，５４ｃが表示される。分析項目「さえぎり」の結果表示領域５５には、タグ５５ａが表示される。分析項目「だまりこみ」の結果表示領域５６には、タグ５６ａ，５６ｂ，５６ｃが表示される。

【0076】

各タグに対応する時刻は、分析結果テーブル１４４の開始時刻、終了時刻に定義されている。利用者は、入力部１２０を操作することで、気になる分析結果を表示するタグを選択し、話者の音声を視聴することができる。例えば、表示制御部１５３は、利用者によって、タグが選択されると、タグに対応する時刻の、第１利用者の音声、第２利用者の音声を再生する。

【0077】

表示制御部１５３は、タグ５３ａが選択された場合には時間Ｔ_１における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。表示制御部１５３は、タグ５４ａが選択された場合には時間Ｔ_２における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。表示制御部１５３は、タグ５４ｂが選択された場合には時間Ｔ_４における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。表示制御部１５３は、タグ５４ｃが選択された場合には時間Ｔ_７における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。

【0078】

表示制御部１５３は、タグ５５ａが選択された場合には時間Ｔ_６における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。表示制御部１５３は、タグ５６ａが選択された場合には時間Ｔ_３における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。表示制御部１５３は、タグ５６ｂが選択された場合には時間Ｔ_５における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。表示制御部１５３は、タグ５６ｃが選択された場合には時間Ｔ_７における第１話者の音声、第２話者の音声を、音声テーブル１４１から検索し、スピーカ１３５から出力させる。

【0079】

次に、本実施例に係る分析装置の処理手順の一例について説明する。図２１は、本実施例に係る分析装置の処理手順の一例を示すフローチャートである。図２１に示すように、分析装置１００の取得部１５１は、音声テーブル１４１から音声情報を取得する（ステップＳ１０１）。分析部１００は、音声情報を、第１音声情報と、第２音声情報に分離する（ステップＳ１０２）。

【0080】

分析装置１００の分析部１５２は、音声情報の会話ＩＤと、会話パターンテーブル１４２とを比較して、第１話者と第２話者とのうち、どちらの話者を優先するのかを判定する（ステップＳ１０３）。分析部１５２は、分析項目を選択し（ステップＳ１０４）、分析項目に応じて、分析範囲の優劣を判定する（ステップＳ１０５）。分析部１５２は、分析結果を、分析テーブル１４４に格納する（ステップＳ１０６）。

【0081】

分析部１５２は、他の分析項目を選択するか否かを判定する（ステップＳ１０７）。分析１５２は、他の分析項目を選択する場合には（ステップＳ１０７，Ｙｅｓ）、ステップＳ１０４に移行する。一方、分析部１５２は、他の分析項目を選択しない場合には（ステップＳ１０７，Ｎｏ）、ステップＳ１０８に移行する。

【0082】

分析部１５２は、他の音声情報を分析するか否かを判定する（ステップＳ１０８）。分析部１５２は、他の音声情報を分析する場合には（ステップＳ１０８，Ｙｅｓ）、ステップＳ１０１に移行する。分析部１５２は、他の音声情報を分析しない場合には（ステップＳ１０８，Ｎｏ）、ステップＳ１０９に移行する。

【0083】

分析装置１００の表示制御部１５３は、分析結果表示画面を生成する（ステップＳ１０９）。表示制御部１５３は、分析結果表示画面を表示し、タグ選択に応じて、音声情報を出力する（ステップＳ１１０）。

【0084】

次に、本実施例に係る分析装置１００の効果について説明する。分析装置１００は、第１話者の発話時間と、第２話者の発話時間との関係に加えて、第１話者と第２話者との立場の優先順位を判断基準に加えることで、コミュニケーションの優劣を判定する。このため、コミュニケーションの優劣を適切に判定することができる。

【0085】

なお、分析装置１００は、上述したように、会話ＩＤをキーにして、第１話者と第２話者との立場の優先順位を判定しても良いし、会話パターンに基づいて、第１話者と第２話者との立場の優先順位を判定しても良い。例えば、図６の会話パターンテーブル１４２を用いて説明すると、分析部１５２は、会話パターンが「コールセンターでの電話対応」である場合には、「第１話者優先」であると判定する。会話パターンは、例えば、音声情報に対応付けられているものとする。

【0086】

ところで、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部あるいは一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

【0087】

さらに、各装置にて行われる各処理機能は、その全部または任意の一部がＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

【符号の説明】

【0088】

１００分析装置
１１０インタフェース部
１２０入力部
１３０表示部
１３５スピーカ
１４０記憶部
１４１音声テーブル
１４２会話パターンテーブル
１４３分析項目テーブル
１４４分析結果テーブル
１５０制御部
１５１取得部
１５２分析部
１５３表示制御部

【図1】