【実施例】
【0011】
図1は、本実施例1に係る分析装置の構成を示す図である。
図1に示すように、この分析装置100は、インタフェース部110と、入力部120と、表示部130と、スピーカ135と、記憶部140と、制御部150とを有する。
【0012】
インタフェース部110は、ネットワークを介して他の外部装置と通信を行う処理部である。なお、インタフェース部110は、直接、外部装置と接続し、通信を実行しても良い。インタフェース部110は、通信装置に対応する。後述する制御部150は、インタフェース部110を介して、外部装置とデータをやり取りする。
【0013】
例えば、外部装置は、複数の話者の間でなされたコミュニケーションの音声情報を録音する音声録音機に対応する。話者は、顧客、オペレータ、窓口担当者、会社の同僚などである。
図2〜
図4は、音声録音機が録音する会話のパターンを説明するための図である。
【0014】
図2について説明する。
図2は、電話での会話を録音する例である。電話機3aおよび電話機3bが接続され、電話機3bは、音声録音機10に接続される。
図2において、話者1は、顧客とし、話者2を、オペレータとする。音声録音機10は、話者1と話者2との間でなされたコミュニケーションの音声情報を録音する。
【0015】
図3について説明する。
図3は、窓口での会話を録音する例である。マイク4a,4bが音声録音機10に接続される。
図3において、話者1は、顧客とし、話者2を、窓口担当者とする。音声録音機10を、話者1と話者2との間でなされたコミュニケーションの音声情報を録音する。
【0016】
図4について説明する。
図4は、会議での会話を録音する例である。マイク4a,4b,4cが音声録音機10に接続される。
図4において、話者1〜話者3は、会社の同僚とする。音声録音機10は、話者1〜3の間でなされたコミュニケーションの音声情報を録音する。
【0017】
図1の説明に戻る。入力部120は、各種の情報を分析装置100に入力するための装置である。例えば、入力部120は、キーボードやマウス、タッチパネル等に対応する。例えば、利用者は、入力部120を操作して、コミュニケーションの優劣に関する分析結果を参照する。
【0018】
表示部130は、制御部150から出力される各種の情報を表示する表示装置である。例えば、表示部130は、コミュニケーションの優劣に関する分析結果を表示する。表示部130は、液晶モニタやタッチパネル等に対応する。スピーカ135は、各種の音情報を出力するスピーカである。
【0019】
記憶部140は、音声テーブル141、会話パターンテーブル142、分析項目テーブル143、分析結果テーブル144を有する。記憶部140は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、またはハードディスク、光ディスクなどの記憶装置に対応する。
【0020】
音声テーブル141は、音声録音機10によって録音された音声情報を保持するテーブルである。
図5は、音声テーブルのデータ構造の一例を示す図である。
図5に示すように、この音声テーブル141は、音声ID、会話ID、音声情報を対応付ける。音声IDは、音声情報を一意に識別する情報である。会話IDは、会話を一意に識別する情報である。また、会話IDによって、
図6に示す会話パターンテーブル142のレコードと対応付けられる。
【0021】
音声情報は、各話者を識別する話者IDと、話者の音声情報とをそれぞれ対応付ける。例えば、音声ID「A001」の音声情報では、第1話者ID「1001」と第1音声情報とが対応付けられ、第2話者ID「2001」と第2音声情報とが対応付けられる。
【0022】
会話パターンテーブル142は、会話のパターンや、話者の優先順に関する情報を保持するテーブルである。
図6は、会話パターンテーブルのデータ構造の一例を示す図である。
図6に示すように、この会話パターンテーブル142は、会話ID、会話パターン、優先順位、話者数、各話者を識別する話者IDと、各話者名を対応付ける。
【0023】
会話IDは、会話を一意に識別する情報である。また、会話IDによって、音声テーブル141のレコードと対応付けられる。会話パターンは、会話パターンの内容を示すものである。優先順位は、話者の優先順位を示す情報である。話者数は、コミュニケーションを行った話者の人数を示すものである。例えば、会話ID「T001」のレコードについて説明する。このレコードは、コールセンターでの電話対応に関するものであり、第1話者(お客様)と第2話者(オペレータ)とが会話しており、第1話者が第2話者よりも優先である旨の情報が格納されている。
【0024】
分析項目テーブル143は、分析対象となる項目や、分析する場合に利用する各種の情報を保持するテーブルである。
図7は、分析項目テーブルのデータ構造の一例を示す図である。
図7に示すように、この分析項目テーブル143は、分析項目ID、項目名、前方猶予時間、後方猶予時間、最小判定時間、最大判定時間、パラメータを対応付ける。分析項目IDは、分析項目を一意に識別する情報である。項目名は、分析項目の名称である。前方猶予時間および後方猶予時間については、後述する。最小判定時間は、分析対象となる音声情報の最小判定時間である。最大判定時間は、分析対象となる音声情報の最大判定時間である。パラメータは、分析を行う場合に利用するパラメータである。
【0025】
分析結果テーブル144は、分析結果に関する情報を保持するテーブルである。
図8は、分析結果テーブルのデータ構造の一例を示す図である。
図8に示すように、この分析結果テーブル144は、分析結果ID、分析項目ID、タグ番号、開始時刻、終了時刻、分析結果、コメントを有する。分析結果IDは、分析結果に関するレコードを一意に識別する情報である。分析項目IDは、分析項目を一意に識別する情報である。タグ番号は、タグの番号を示すものである。タグに関する説明は後述する。開始時刻は、分析範囲の開始時刻である。終了時刻は、分析範囲の終了時刻である。分析結果は、分析結果を示すものである。分析結果は「優」、「劣」、「−(優でも劣でもない)」のいずれかとなる。コメントは、分析結果のコメントである。
【0026】
図1の説明に戻る。制御部150は、取得部151と、分析部152と、表示制御部153とを有する。制御部150は、例えば、ASIC(Application Specific Integrated Circuit)や、FPGA(Field Programmable Gate Array)などの集積装置に対応する。また、制御部150は、例えば、CPUやMPU(Micro Processing Unit)等の電子回路に対応する。
【0027】
取得部151は、インタフェース部110を介して、音声録音機10から音声情報を取得する処理部である。例えば、音声録音機10から取得する音声情報には、音声ID、会話IDが添付されている。取得部151は、音声IDと、会話IDと、音声情報とを対応付けて、音声テーブル141に登録する。
図5に示す音声情報は、初めから、第1話者の音声情報と、第2話者の音声情報が分かれている場合について説明したがこれに限定されない。取得部151は、第1、2話者の音声が混在する音声情報に対して、音声クリーニングを実行し、第1話者の音声情報と、第2話者の音声情報とを分離しても良い。
【0028】
分析部152は、音声情報を分析することで、コミュニケーションの優劣を判定する処理部である。分析部152が分析する分析項目には「開始時あいさつ」、「適切なあいづち」、「さえぎり」、「だまりこみ」がある。各分析項目に関する、分析部152の処理の一例を順に説明する。
【0029】
まず、「開始時のあいさつ」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。
図9は、「開始時のあいさつ」を分析する従来技術を説明するための図である。分析結果例1について説明する。第1話者の音声が、時刻t
1に開始し、時刻t
2に終了し、第1話者の音声に「開始時のあいさつ」が含まれているものとする。開始時のあいさつは「おはようございます、おつかれさまです」等に対応する。また、第2話者の音声が、時刻t
2に開始し、時刻t
3に終了し、第2話者の音声に「開始時のあいさつ」が含まれているものとする。分析範囲をt
1〜t
2とする。従来技術では、第1話者の開始時のあいさつに続き、第2話者が開始時のあいさつをしているため、分析範囲の分析結果を「優」と判定する。
【0030】
分析結果例2について説明する。第2話者の音声が、t
1に開始し、t
2に終了し、第2話者の音声に「開始時のあいさつ」が含まれているものとする。また、第1話者の音声が、t
2に開始し、t
3に終了し、第1話者の音声に「開始時のあいさつ」が含まれているものとする。分析範囲をt
1〜t
2とする。従来技術では、第2話者の開始時のあいさつに続き、第1話者が開始時のあいさつをしているため、分析範囲の分析結果を「優」と判定する。
【0031】
しかしながら、従来技術では、優先する話者を判断基準に入れていないため、適切に分析できていない。例えば、第1話者が第2話者よりも優先であるとすると、
図9の分析結果例1は、第1話者が第2話者よりも先にあいさつしているため、印象がわるく、「優」とは言えない。
【0032】
図10は、「開始時のあいさつ」を分析する分析部の処理を説明するための図である。分析結果例3について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第1話者と第2話者との音声情報を取得する。第1話者の音声が、時刻t
2に開始し、時刻t
3に終了し、第1話者の音声に「開始時のあいさつ」が含まれているものとする。また、第2話者の音声が、時刻t
3に開始し、時刻t
5に終了し、第2話者の音声に「開始時のあいさつ」が含まれているものとする。分析部152は、会話ID「T001」をキーとして、会話パターンテーブル142を参照することで、第1話者が第2話者よりも優先であると判定する。
【0033】
分析部152は、「開始時のあいさつ」を分析するため、分析項目テーブル143の分析項目ID「B001」のレコードを取得する。分析部152は、時刻t
2〜t
3を分析範囲とし、時刻t
1〜t
2をタグ用前方猶予時間に設定し、時刻t
3〜t
4をタグ用後方猶予時間に設定する。分析部152は、第1話者の開始時のあいさつに続き、第2話者が開始時のあいさつをしているが、優先される第1話者の方が先にあいさつをしているため、第1話者に対する印象がわるい。このため、分析部152は、分析範囲の分析結果を「劣」と判定する。
【0034】
分析結果例4について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第1話者と第2話者との音声情報を取得する。第1話者の音声が、時刻t
3に開始し、時刻t
5に終了し、第1話者の音声に「開始時のあいさつ」が含まれているものとする。また、第2話者の音声が、時刻t
2に開始し、時刻t
3に終了し、第2話者の音声に「開始時のあいさつ」が含まれているものとする。分析部152は、会話ID「T001」をキーとして、会話パターンテーブル142を参照することで、第1話者が第2話者よりも優先であると判定する。
【0035】
分析部152は、「開始時のあいさつ」を分析するため、分析項目テーブル143の分析項目ID「B001」のレコードを取得する。分析部152は、時刻t
2〜t
3を分析範囲とし、t
1〜t
2をタグ用前方猶予時間に設定し、t
3〜t
4をタグ用後方猶予時間に設定する。分析部152は、第2話者の開始時のあいさつに続き、第1話者が開始時のあいさつをしており、優先されない第2話者の方が先にあいさつをしているため、第1話者に対する印象がよい。このため、分析部152は、分析範囲の分析結果を「優」と判定する。
【0036】
ここで、分析部152が、音声情報に「開始時のあいさつ」が含まれているか否かをどのように判定しても良い。例えば、開始時のあいさつの音声の特徴を示すテンプレートと、話者の音声情報とを比較して、開始時のあいさつが含まれているか否かを判定しても良い。
【0037】
続いて、「適切なあいづち」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。
図11は、「適切なあいづち」を分析する従来技術を説明するための図である。分析結果例1について説明する。第1話者の音声が、t
1に開始し、t
4に終了する。また、第2話者の音声が、t
2に開始し、t
3に終了し、第2話者の音声に「あいづち」が含まれているものとする。分析範囲をt
2〜t
3とする。従来技術では、第1話者の会話中に、第2話者があいづちを打っているため、分析範囲の分析結果を「優」と判定する。
【0038】
分析結果例2について説明する。第1話者の音声が、t
2に開始し、t
3に終了し、第1話者の音声に「あいづち」が含まれているものとする。また、第2話者の音声が、t
1に開始し、t
4に終了する。分析範囲をt
2〜t
3とする。従来技術では、第2話者の会話中に、第1話者があいづちを打っているため、分析範囲の分析結果を「優」と判定する。
【0039】
しかしながら、従来技術では、優先する話者を判断基準にいれていないため、適切に分析できていない。例えば、第1話者が第2話者よりも優先であるとすると、
図11の分析結果例2では、優先される第1話者があいづちを打っているため、実際には優劣には関係がなく、従来技術による「優」の判定結果は適切でない。
【0040】
図12は、「適切なあいづち」を分析する分析部の処理を説明するための図(1)である。分析結果例3について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第1話者と第2話者との音声情報を取得する。第1話者の音声が、時刻t
1に開始し、時刻t
6に終了する。また、第2話者の音声が、時刻t
3に開始し、時刻t
4に終了し、第2話者の音声に「あいづち」が含まれているものとする。分析部152は、会話ID「T001」をキーとして、会話パターンテーブル142を参照することで、第1話者が第2話者よりも優先であると判定する。
【0041】
分析部152は、「適切なあいづち」を分析するため、分析項目テーブル143の分析項目ID「B002」のレコードを取得する。分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
1〜t
2をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、優先される第1話者の発話中に、第2話者があいづちを打っているため、第1話者に対する印象が良いと考えられ、分析範囲の分析結果を「優」と判定する。
【0042】
分析結果例4について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第1話者と第2話者との音声情報を取得する。第1話者の音声が、t
3に開始し、t
4に終了し、第1話者の音声に「あいづち」が含まれているものとする。また、第2話者の音声が、t
1に開始し、t
6に終了する。分析部152は、会話ID「T001」をキーとして、会話パターンテーブル142を参照することで、第1話者が第2話者よりも優先であると判定する。
【0043】
分析部152は、「適切なあいづち」を分析するため、分析項目テーブル143の分析項目ID「B002」のレコードを取得する。分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
2〜t
3をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、優先されない第2話者の発話中に、第1話者があいづちを打っているため、このあいづちについては、優劣には関係がないため、分析範囲の分析結果を「−」と判定する。
【0044】
また、分析部152は、所定時間(例えば、30秒)あたりのあいづちの回数を更に利用して、「適切なあいづち」を分析しても良い。例えば、
図12で説明したように、分析部152は、「優」と判定したあいづちの回数が、最小あいづち数以上、最大あいづち未満である場合に、あいづちに対応する分析範囲の判定結果を、そのまま「優」とする。最小あいづち数および最大あいづち数は、分析項目テーブル143の分析項目ID「B002」のレコードに設定されている。
【0045】
図13は、「適切なあいづち」を分析する分析部の処理を説明するための図(2)である。例えば、最小あいづち数を「2」、最大あいづち数を「3」とすると、
図13に示す例では、「優」と判定したあいづちの数が「2」であるため、各あいづちに対する分析範囲の分析結果を「優」のままとする。
【0046】
これに対して、分析部152は、「優」と判定したあいづちの回数が、最小あいづち数以上、最大あいづち未満でない場合に、あいづちに対する分析範囲の判定結果を、「優」から「劣」に変更してもよい。あいづちが多すぎる、または、すくなすぎる場合には、印象が悪いと考えられるためである。
【0047】
ここで、分析部152が、音声情報があいづちであるか否かを判定する処理の一例について説明する。分析部152は、分析範囲が最小時間以上、かつ、最大時間未満である場合に、分析範囲に含まれる音声情報を、あいづちと判定する。これに対して、分析部152は、分析範囲が、最小時間未満である場合や、最大時間以上である場合には、雑音であると判定する。分析部152は、分析項目テーブル143を参照し、最小時間および最大時間の情報を取得する。
【0048】
「さえぎり」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。
図14は、「さえぎり」を分析する従来技術を説明するための図である。分析結果例1について説明する。第1話者の音声が、時刻t
1に開始し、時刻t
3に終了する。第2話者の音声が、時刻t
2に開始し、時刻t
4に終了する。第1話者の音声と、第2話者の音声とが重複しており、重複する範囲を、分析範囲t
2〜t
3とする。従来技術では、この分析範囲において、さえぎりが発生していると判定する。さえぎりは、相手の会話をさえぎって会話を始めることである。一般的に、さえぎりが発生すると、相手方に対する印象が悪いため、従来技術では、分析範囲t
2〜t
3の分析結果を「劣」と判定する。
【0049】
分析結果例2について説明する。第1話者の音声が、時刻t
2に開始し、時刻t
4に終了する。第2話者の音声が、時刻t
1に開始し、時刻t
3に終了する。第1話者の音声と、第2話者の音声とが重複しており、重複する範囲を、分析範囲t
2〜t
3とする。従来技術では、分析結果例1と同様にして、分析範囲t
2〜t
3において、さえぎりが発生していると判定する。このため、分析範囲t
2〜t
3の分析結果を「劣」と判定する。
【0050】
上記のように、さえぎりが発生した場合には、相手方に対する印象が悪いといえるが、これは、各話者の優先度を考慮しないことが前提となる。例えば、優先される話者が、優先されない話者の会話をさえぎることは、相手方に対する印象が悪いのではなく、印象が良いと判定すべきである。優先する話者が、優先しない話者の発言をさえぎって、発言を訂正している場合などが考えられる。このため、従来技術による判定結果は、適切に優劣を判定できていない。
【0051】
図15は、「さえぎり」を分析する分析部の処理を説明するための図である。分析結果例3について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第1話者と第2話者との音声情報を取得する。第1話者の音声が、時刻t
1に開始し、時刻t
4に終了する。また、第2話者の音声が、時刻t
3に開始し、時刻t
6に終了する。分析部152は、会話ID「T001」をキーとして、会話パターンテーブル142を参照することで、第1話者が第2話者よりも優先であると判定する。
【0052】
分析部152は、「さえぎり」を分析するため、分析項目テーブル143の分析項目ID「B003」のレコードを取得する。分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
2〜t
3をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、分析範囲t
3〜t
4が、最大判定時間以上の場合には、分析範囲が「さえぎり」であると判定する。分析結果例3における分析範囲t
3〜t
4は、最大判定時間以上とする。
【0053】
分析部152は、優先される第1話者の会話を、優先されない第2話者がさえぎっているため、分析範囲t
3〜t
4の分析結果を「劣」と判定する。
【0054】
分析結果例4について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第1話者と第2話者との音声情報を取得する。第1話者の音声が、時刻t
3に開始し、時刻t
6に終了する。また、第2話者の音声が、時刻t
1に開始し、時刻t
4に終了する。分析部152は、会話ID「T001」をキーとして、会話パターンテーブル142を参照することで、第1話者が第2話者よりも優先であると判定する。
【0055】
分析部152は、「さえぎり」を分析するため、分析項目テーブル143の分析項目ID「B003」のレコードを取得する。分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
2〜t
3をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、分析範囲t
3〜t
4が、最大判定時間以上の場合には、分析範囲が「さえぎり」であると判定する。分析結果例4における分析範囲t
3〜t
4は、最大判定時間以上とする。
【0056】
分析部152は、優先されない第2話者の会話を、優先される第1話者がさえぎっているため、分析範囲t
3〜t
4の分析結果を「優」と判定する。上記のように、優先される話者が、優先されない話者の会話をさえぎることは、相手方に対する印象が悪いのではなく、印象が良いと判定すべきである。
【0057】
ここで、分析部152の例外的な処理について説明する。分析部152は、優先される第1話者の会話を、優先されない第2話者がさえぎっている場合には、「劣」と判定していたが、第2話者が直ちに会話を終了した場合には、判定結果を「−」に修正する。
【0058】
図16は、「さえぎり」を分析する分析部の例外処理を説明するための図である。
図16の分析結果例5において、第1話者の音声が、時刻t
1に開始し、時刻t
4に終了する。また、第2話者の音声が、時刻t
3に開始し、時刻t
5に終了する。第1話者が第2話者よりも優先であるものとする。
【0059】
分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
2〜t
3をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、分析範囲t
3〜t
4が、最大判定時間以上の場合には、分析範囲が「さえぎり」であると判定する。分析結果例5における分析範囲t
3〜t
4は、最大判定時間以上とする。ここで、さえぎりが発生した後、時刻t
5までに、第2話者の会話が終了しているため、分析部152は、分析範囲t
3〜t
4の分析結果を「−」と判定する。
【0060】
「だまりこみ」を分析することで、コミュニケーションの優劣を判定する処理の一例を従来技術と比較して説明する。
図17は、「だまりこみ」を分析する従来技術を説明するための図である。分析結果例1について説明する。第2話者の音声が時刻t
1に開始し、時刻t
2に終了する。また、第2話者の音声が時刻t
3に開始し、時刻t
4に終了する。分析範囲を時刻t
2〜t
3とする。一般的に、無音は、相手に与える印象が悪いと考えられるため、従来技術では、分析範囲に無音区間があると、分析結果を「劣」と判定している。このため、従来技術では、分析範囲t
2〜t
3の分析結果を「劣」と判定する。
【0061】
分析結果例2について説明する。第2話者の音声が時刻t
1に開始し、時刻t
2に終了する。また、第1話者の音声が時刻t
3に開始し、時刻t
4に終了する。分析範囲を時刻t
2〜t
3とする。分析範囲t
2〜t
3は、無音区間であるため、判定結果は「劣」となる。
【0062】
しかしながら、分析範囲が無音区間である場合において、必ずしも、相手に悪い印象を与えているわけではないので、適切に分析できていない。例えば、会話の一時中断や、相手の会話を待っている状況の無音区間は、コミュニケーションの優劣に関係しない。
【0063】
図18及び
図19は、「だまりこみ」を分析する分析部の処理を説明するための図である。分析結果例3について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第2話者の音声情報を取得する。第2話者の音声が、時刻t
1に開始し、時刻t
3に終了する。また、第2話者の音声が、時刻t
4に開始し、時刻t
6に終了する。
【0064】
分析部152は、「だまりこみ」を分析するため、分析項目テーブル143の分析項目ID「B004」のレコードを取得する。分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
2〜t
3をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、分析範囲t
3〜t
4が最小判定時間よりも小さい場合には、分析範囲t
3〜t
4の無音区間は、会話一時中断であるとして、分析範囲t
3〜t
4の分析結果を「−」に設定する。
【0065】
分析結果例4について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第1話者と第2話者との音声情報を取得する。第2話者の音声が、時刻t
1に開始し、時刻t
3に終了する。また、第1話者の音声が、時刻t
4に開始し、時刻t
6に終了する。分析部152は、会話ID「T001」をキーとして、会話パターンテーブル142を参照することで、第1話者が第2話者よりも優先であると判定する。
【0066】
分析部152は、「だまりこみ」を分析するため、分析項目テーブル143の分析項目ID「B004」のレコードを取得する。分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
2〜t
3をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、分析範囲t
3〜t
4が最小時間よりも短い場合には、分析範囲t
3〜t
4の無音区間は、相手の会話待ちであるとして、分析範囲t
3〜t
4の分析結果を「−」に設定する。
【0067】
分析結果例5について説明する。例えば、分析部152は、音声テーブル141にアクセスし、会話ID「T001」の音声情報を取得することで、第2話者の音声情報を取得する。第2話者の音声が、時刻t
1に開始し、時刻t
3に終了する。また、第2話者の音声が、時刻t
4に開始し、時刻t
6に終了する。
【0068】
分析部152は、「だまりこみ」を分析するため、分析項目テーブル143の分析項目ID「B004」のレコードを取得する。分析部152は、時刻t
3〜t
4を分析範囲とし、時刻t
2〜t
3をタグ用前方猶予時間に設定し、時刻t
4〜t
5をタグ用後方猶予時間に設定する。分析部152は、分析範囲t
3〜t
4が最小判定時間よりも大きく、最大判定時間未満の場合には、分析範囲t
3〜t
4の無音区間は、長期間の中断であるとして、分析範囲t
3〜t
4の分析結果を「劣」に設定する。
【0069】
ここで、分析部152が、「だまりこみ」の分析範囲を判定する処理の一例について説明する。分析部152は、第1音声の終了時刻を基準とするタグ化用後方猶予時間に、第1音声に続く第2音声が含まれ、かつ、第2音声の開示時刻を基準とする前方タグ化用前方猶予時間に、第1音声が含まれる場合に、第1音声の終了時刻から第2音声の開始時刻までの間を、だまりこみの分析範囲と判定する。分析部152は、分析範囲を特定した後に、上記処理を実行する。
【0070】
以上説明してきたように、分析部152は、音声テーブル141から分析対象となる音声情報を取得し、音声情報の会話IDと、会話パターンテーブル142に基づいて、各音声情報の話者の優先を判定したうえで、「開始時あいさつ」、「適切なあいづち」、「さえぎり」、「だまりこみ」の分析を実行する処理を、各音声情報に対し実行し、分析範囲の「優」、「劣」、「−」を判定する。分析部152は、判定結果を分析結果テーブル144に格納する。
【0071】
図8に示すように、分析部152は、分析結果にユニークな分析結果IDを割り当て、分析結果ID、分析項目ID、タグ番号、開始時刻、終了時刻、分析結果を対応づけて、分析結果テーブル144に格納する。ここで、タグ番号は、上述した分析範囲を示す番号である。
【0072】
ところで、分析部152は、各話者の立場が対等である場合には、従来技術と同様の判定基準によって、コミュニケーションの優劣を判定しても良い。
【0073】
図1の説明に戻る。表示制御部153は、分析結果テーブル144の情報を基にして、コミュニケーションの優劣の分析結果を、時間と対応付けて表示部130に表示させる処理部である。例えば、表示制御部153は、分析結果テーブル144を基にして、分析結果表示画面を生成する。
【0074】
図20は、分析結果表示画面の一例を示す図である。
図20に示すように、分析結果表示画面50は、第1話者音声情報の時間変化に伴う波形を示す領域51と、第2話者音声情報の時間変化に伴う波形を示す領域52とを有する。分析結果表示画面50は、各分析項目の分析結果を表示する結果表示領域53〜56を有する。また、表示制御部153は、優先する話者の情報を、領域50aに表示させても良い。
【0075】
各結果表示領域53には、分析範囲に対応する複数のタグが、表示される。例えば、分析項目「開始時のあいさつ」の結果表示領域53には、タグ53aが表示される。分析項目「適切なあいづち」の結果表示領域54には、タグ54a,54b,54cが表示される。分析項目「さえぎり」の結果表示領域55には、タグ55aが表示される。分析項目「だまりこみ」の結果表示領域56には、タグ56a,56b,56cが表示される。
【0076】
各タグに対応する時刻は、分析結果テーブル144の開始時刻、終了時刻に定義されている。利用者は、入力部120を操作することで、気になる分析結果を表示するタグを選択し、話者の音声を視聴することができる。例えば、表示制御部153は、利用者によって、タグが選択されると、タグに対応する時刻の、第1利用者の音声、第2利用者の音声を再生する。
【0077】
表示制御部153は、タグ53aが選択された場合には時間T
1における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。表示制御部153は、タグ54aが選択された場合には時間T
2における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。表示制御部153は、タグ54bが選択された場合には時間T
4における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。表示制御部153は、タグ54cが選択された場合には時間T
7における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。
【0078】
表示制御部153は、タグ55aが選択された場合には時間T
6における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。表示制御部153は、タグ56aが選択された場合には時間T
3における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。表示制御部153は、タグ56bが選択された場合には時間T
5における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。表示制御部153は、タグ56cが選択された場合には時間T
7における第1話者の音声、第2話者の音声を、音声テーブル141から検索し、スピーカ135から出力させる。
【0079】
次に、本実施例に係る分析装置の処理手順の一例について説明する。
図21は、本実施例に係る分析装置の処理手順の一例を示すフローチャートである。
図21に示すように、分析装置100の取得部151は、音声テーブル141から音声情報を取得する(ステップS101)。分析部100は、音声情報を、第1音声情報と、第2音声情報に分離する(ステップS102)。
【0080】
分析装置100の分析部152は、音声情報の会話IDと、会話パターンテーブル142とを比較して、第1話者と第2話者とのうち、どちらの話者を優先するのかを判定する(ステップS103)。分析部152は、分析項目を選択し(ステップS104)、分析項目に応じて、分析範囲の優劣を判定する(ステップS105)。分析部152は、分析結果を、分析テーブル144に格納する(ステップS106)。
【0081】
分析部152は、他の分析項目を選択するか否かを判定する(ステップS107)。分析152は、他の分析項目を選択する場合には(ステップS107,Yes)、ステップS104に移行する。一方、分析部152は、他の分析項目を選択しない場合には(ステップS107,No)、ステップS108に移行する。
【0082】
分析部152は、他の音声情報を分析するか否かを判定する(ステップS108)。分析部152は、他の音声情報を分析する場合には(ステップS108,Yes)、ステップS101に移行する。分析部152は、他の音声情報を分析しない場合には(ステップS108,No)、ステップS109に移行する。
【0083】
分析装置100の表示制御部153は、分析結果表示画面を生成する(ステップS109)。表示制御部153は、分析結果表示画面を表示し、タグ選択に応じて、音声情報を出力する(ステップS110)。
【0084】
次に、本実施例に係る分析装置100の効果について説明する。分析装置100は、第1話者の発話時間と、第2話者の発話時間との関係に加えて、第1話者と第2話者との立場の優先順位を判断基準に加えることで、コミュニケーションの優劣を判定する。このため、コミュニケーションの優劣を適切に判定することができる。
【0085】
なお、分析装置100は、上述したように、会話IDをキーにして、第1話者と第2話者との立場の優先順位を判定しても良いし、会話パターンに基づいて、第1話者と第2話者との立場の優先順位を判定しても良い。例えば、
図6の会話パターンテーブル142を用いて説明すると、分析部152は、会話パターンが「コールセンターでの電話対応」である場合には、「第1話者優先」であると判定する。会話パターンは、例えば、音声情報に対応付けられているものとする。
【0086】
ところで、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部あるいは一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0087】
さらに、各装置にて行われる各処理機能は、その全部または任意の一部がCPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。