特許6875905 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立情報通信エンジニアリングの特許一覧

特許6875905通話制御システム及び通話制御方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6875905

(24)【登録日】2021年4月27日

(45)【発行日】2021年5月26日

(54)【発明の名称】通話制御システム及び通話制御方法

(51)【国際特許分類】

H04M 3/51 20060101AFI20210517BHJP

G10L 19/00 20130101ALI20210517BHJP

G10L 15/00 20130101ALI20210517BHJP

【ＦＩ】

H04M3/51

G10L19/00 312E

G10L15/00 200B

【請求項の数】6

【全頁数】19

(21)【出願番号】特願2017-65885(P2017-65885)

(22)【出願日】2017年3月29日

(65)【公開番号】特開2018-170613(P2018-170613A)

(43)【公開日】2018年11月1日

【審査請求日】2020年3月9日

(73)【特許権者】

【識別番号】000233295

【氏名又は名称】株式会社日立情報通信エンジニアリング

(74)【代理人】

【識別番号】110001689

【氏名又は名称】青稜特許業務法人

(72)【発明者】

【氏名】仲庸

(72)【発明者】

【氏名】杉山隆司

【審査官】西巻正臣

(56)【参考文献】

【文献】特開２０１５−１７７４１１（ＪＰ，Ａ）

【文献】特開２０１１−０２９６８８（ＪＰ，Ａ）

【文献】特開２０１５−１９８３５８（ＪＰ，Ａ）

【文献】特開２０１６−１１９６３４（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１９／００

Ｇ０６Ｑ１０／００−１０／１０

３０／００−３０／０８

５０／００−５０／２０

５０／２６−９９／００

Ｇ１０Ｌ１５／００−１７／２６

Ｈ０４Ｍ３／００

３／１６−３／２０

３／３８−３／５８

７／００−７／１６

１１／００−１１／１０

(57)【特許請求の範囲】

【請求項1】

通話端末による通話の音声データを認識して表示する通話制御システムであって、
通話を録音する通話録音装置と、
前記音声データを音声認識してテキスト化する音声認識装置と、
前記音声認識装置の認識結果を格納する認識結果管理装置と、
表示手段と音声出力手段とを有する情報処理装置とを備え、
各装置は、ネットワークにより接続され、
前記通話録音装置は、通話の音声データを前記音声認識装置に送信して、
前記音声認識装置は、前記音声データの認識結果を前記認識結果管理装置に送信し、
前記認識結果管理装置は、キーワード情報テーブルを保持し、テキスト化された前記音声データの認識結果からキーワードを検知して、前記キーワードを含む通話の録音情報と前記音声認識の認識結果を対応付けて格納し、
前記情報処理装置は、内線番号をキーとして、前記認識結果管理装置に、前記キーワードを含む通話の録音情報と前記音声認識の認識結果の送信を要請し、
前記認識結果管理装置は、前記内線番号に該当する前記キーワードを含む通話の録音情報と前記音声認識の認識結果を、前記情報処理装置に送信し、
前記情報処理装置は、前記キーワードを含む通話の音声認識の認識結果を前記表示手段に表示し、
前記情報処理装置は、音声再生の指示が入力されたときに、前記表示手段により表示されたテキストと関連付けられた録音情報を前記通話録音装置に送信し、
前記通話録音装置は、前記録音情報に対応する音声データを、前記情報処理装置に送信し、
前記情報処理装置は、前記録音情報に対応する音声データを再生し、
前記キーワードを含む通話の音声認識の認識結果は、吹き出しとして表示され、
前記情報処理装置は、前記吹き出しを指示されることにより、前記吹き出しに係る通話の該当箇所から再生することを特徴とする通話制御システム。

【請求項2】

前記音声データは、過去の通話を再生する追いかけ再生では、録音された音声データであり、現在の通話を聴取する聴話再生では、前記通話録音装置に入力されるストリームのデータであることを特徴とする請求項１記載の通話制御システム。

【請求項3】

前記情報処理装置は、追いかけ再生の音声データを再生していたときに、過去の音声データがなくなったと判定したときには、前記通話録音装置に対して聴話再生の要請をすることを特徴とする請求項２記載の通話制御システム。

【請求項4】

通話端末による通話の音声データを認識して表示する通話制御システムの通話制御方法であって、
前記通話制御システムは、
通話を録音する通話録音装置と、
前記音声データを音声認識してテキスト化する音声認識装置と、
前記音声認識装置の認識結果を格納する認識結果管理装置と、
表示手段と音声出力手段とを有する情報処理装置とを備え、
各装置は、ネットワークにより接続され、
前記通話録音装置は、通話の音声データを前記音声認識装置に送信するステップと、
前記音声認識装置は、前記音声データの認識結果を前記認識結果管理装置に送信するステップと、
前記認識結果管理装置は、キーワード情報テーブルを保持し、テキスト化された前記音声データの認識結果からキーワードを検知して、前記キーワードを含む通話の録音情報と前記音声認識の認識結果を対応付けて格納するステップと、
前記情報処理装置は、前記内線番号をキーとして、前記認識結果管理装置に、前記キーワードを含む通話の録音情報と前記音声認識の認識結果の送信を要請するステップと、
前記認識結果管理装置は、前記内線番号に該当する前記キーワードを含む通話の録音情報と前記音声認識の認識結果を、前記情報処理装置に送信するステップと、
前記情報処理装置は、前記キーワードを含む通話の音声認識の認識結果を前記表示手段に表示するステップと、
前記情報処理装置は、音声再生の指示が入力されたときに、前記表示手段により表示されたテキストと関連付けられた録音情報を前記通話録音装置に送信するステップと、
前記通話録音装置は、前記録音情報に対応する音声データを、前記情報処理装置に送信するステップと、
前記情報処理装置は、前記録音情報に対応する音声データを再生するステップとを有し、
前記キーワードを含む通話の音声認識の認識結果は、吹き出しとして表示され、
前記情報処理装置は、前記吹き出しを指示されることにより、前記吹き出しに係る通話の該当箇所から再生することを特徴とする通話制御方法。

【請求項5】

前記音声データは、過去の通話を再生する追いかけ再生では、録音された音声データであり、現在の通話を聴取する聴話再生では、前記通話録音装置に入力されるストリームのデータであることを特徴とする請求項４記載の通話制御方法。

【請求項6】

前記情報処理装置は、追いかけ再生の音声データを再生していたときに、過去の音声データがなくなったと判定したときには、前記通話録音装置に対して聴話再生の要請をすることを特徴とする請求項５記載の通話制御方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、通話制御システム及び通話制御方法に係り、特に、コールセンタにおいて、顧客とオペレータとの通話内容をスーパバイザが同時に複数通話を監視する状況で、スーパバイザが顧客とオペレータとのやり取りをリアルタイムで把握し、トラブルや顧客からのクレームに適切に対処するのに好適な通話制御システム及び通話制御方法に関する。

【背景技術】

【0002】

コールセンタやオフィスにおいて、通話先の顧客とオペレータの通話内容にトラブルが発生した場合や発生しそうになった場合には、オペレータはスーパバイザ（コールセンタの監視者、業務の監督者）にアラート要請を出して、サポートを求めることがある。

【0003】

また、スーパバイザは、オペレータからのアラート要請の有無に関わらず、オペレータの通話内容を評価し、トラブルを予防したり、トラブルが発生した場合には、適切な対処をする必要がある。このようにスーパバイザがオペレータの通話内容を評価して、対応するための技術としては、例えば、特許文献１がある。特許文献１のコールセンタ装置は、顧客とオペレータ通話が終了した後に、通話内容に予め登録した特定語が含まれるかを自動的に確認して、含まれていた場合には、スーパバイザへ録音データ（音声録音ファイル）と、この録音データに対応付けられている録音データ識別子を、スーパバイザに通知するものである（図２、Ｓ１０５、段落番号００３０）。

【0004】

さらに、特許文献２には、通話に所定のキーワードが含まれているときに、座席表示ウィンドウに通話内容を吹き出しとして表示して（図１１）、スーパバイザがオペレータと顧客のやり取りをリアルタイムで把握し、適切な対処をする通話監視方法が開示されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２００９−１７０９５３号公報

【特許文献2】特開２０１６−１１９６３４号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

上記特許文献２記載の技術によれば、所定のキーワード（顧客とのやり取りで問題があると認識されるＮＧワード）が含まれる通話に対して、スーパバイザがオペレータと顧客のやり取りをリアルタイムで把握でき、また、別画面（図１２）により詳細な通話の内容を確認することも可能である。

【0007】

しかしながら、スーパバイザは、問題のありそうな通話の内容をテキストにより確認するのみであり、スーパバイザが実際の通話をダイレクトに聴取するという仕組みは提供されていない。

【0008】

本発明の目的は、コールセンタにおいて、顧客とオペレータとの通話内容をテキスト表示可能な環境で、スーパバイザが実際の通話をダイレクトに聴取することにより、スーパバイザの監視業務の効率化と、オペレータの顧客への応対品質を向上させることのできる通話制御システム及び通話制御方法を提供することにある。

【課題を解決するための手段】

【0009】

本発明に係る通話制御システムは、好ましくは、通話端末による通話の音声データを認識して表示する通話制御システムであって、通話を録音する通話録音装置と、音声データを音声認識してテキスト化する音声認識装置と、音声認識装置の認識結果を格納する認識結果管理装置と、表示手段と音声出力手段とを有する情報処理装置とを備え、各装置は、ネットワークにより接続され、通話録音装置は、通話の音声データを音声認識装置に送信して、音声認識装置は、音声データの認識結果を認識結果管理装置に送信し、認識結果管理装置は、キーワード情報テーブルを保持し、テキスト化された音声データの認識結果からキーワードを検知して、キーワードを含む通話の録音情報と音声認識の認識結果を対応付けて格納し、情報処理装置は、内線番号をキーとして、認識結果管理装置に、キーワードを含む通話の録音情報と音声認識の認識結果の送信を要請し、認識結果管理装置は、内線番号に該当するキーワードを含む通話の録音情報と音声認識の認識結果を、情報処理装置に送信し、情報処理装置は、キーワードを含む通話の音声認識の認識結果を表示手段に表示し、情報処理装置は、音声再生の指示が入力されたときに、表示手段により表示されたテキストと関連付けられた録音情報を録音装置に送信し、録音装置は、録音情報に対応する音声データを、情報処理装置に送信し、情報処理装置は、録音情報に対応する音声データを再生するようにしたものである。

【発明の効果】

【0010】

本発明によれば、コールセンタにおいて、顧客とオペレータとの通話内容をテキスト表示可能な環境で、スーパバイザが実際の通話をダイレクトに聴取することにより、スーパバイザの監視業務の効率化と、オペレータの顧客への応対品質を向上させることのできる通話制御システム及び通話制御方法を提供することができる。

【図面の簡単な説明】

【0011】

【図1】一実施形態に係る通話制御システムの全体構成図である。

【図2】通話録音装置の構成を示すブロック図である。

【図3】音声認識装置の構成を示すブロック図である。

【図4】認識結果管理装置の構成を示すブロック図である。

【図5】ＰＣ端末の構成を示すブロック図である。

【図6】ＩＰ内線情報テーブルの一例を示す図である。

【図7】録音情報テーブルの一例を示す図である。

【図8】音声データテーブルの一例を示す図である。

【図9】聴話情報テーブルの一例を示す図である。

【図10】認識結果テーブルの一例を示す図である。

【図11】キーワード情報テーブルの一例を示す図である。

【図12】キーワード検知情報テーブルの一例を示す図である。

【図13】音声データリストの一例を示す図である。

【図14】外部からの通話端末の発信から、ＰＣ端末に認識結果を表示するまでの一連の処理を示すシーケンス図である。

【図15】追いかけ再生の処理を示すシーケンス図である。

【図16】聴話再生の処理を示すシーケンス図である。

【図17】追いかけ再生と聴話再生の関係を示す概念図である。

【図18】座席図表示画面を示した図である。

【図19】通話内容表示画面を示した図である。

【図20】追いかけ再生画面の一例を示す図である。

【図21】モニタリング再生画面の一例を示す図である。

【発明を実施するための形態】

【0012】

以下、本発明に係る一実施形態を、図１ないし図２１を用いて説明する。

【0013】

先ず、図１を用いて一実施形態に係る通話制御システムの構成と処理の概要について説明する。

【0014】

本実施形態の通話制御システムは、コールセンタに使われるコールセンタシステムを例にとり説明する。

【0015】

このコールセンタシステムは、図１に示されるように、顧客等の架電者（電話をかける者）の通話端末１０１から公衆網１０２を介して接続されるＩＰ−ＰＢＸ（Internet Protocol−Private Branch eXchange、ＩＰ回線対応構内交換機）装置１０３が、ネットワーク１１４を介して、オペレータの通話端末１１１と接続し通話をする構成を有する。オペレータは、オペレータ用ＰＣ端末１１２から通話端末１１１の電話操作をすることができ、架電者からの着信が、オペレータ用ＰＣ端末１１２に表示されると、ＰＣ端末１１２から応答を操作して、通話端末１１１が応答動作を実施して架電者とオペレータは通話状態になる。

【0016】

コールセンタシステムには、オペレータを管理・監督するスーパバイザが居て、通話端末１１１とスーパバイザ用ＰＣ端末１１３により、状況を監視したり必要なときには、それらの操作を行う。スーパバイザ用ＰＣ端末１１３は、ＰＣ端末１１２が有する通話端末電話制御機能に加えて、管理者用のコールセンタ運用情報を表示する管理ツールが動作している。また、スーパバイザ用ＰＣ端末１１３は、図示していないが、通常の表示用のディスプレイと、音声を聴くためのソフトウェアと、ヘッドフォン装置などの音声出力部を有する。

【0017】

コールセンタシステムには、ネットワーク１１４を介して、ＩＰ−ＰＢＸ装置１０３、ＣＴＩ（Computer Telephony Integration）サーバ装置１０４、ＩＶＲ（Interactive Voice Response）装置１０５、通話録音装置１０６、通話録音管理装置１０７、音声認識制御装置１０８、音声認識装置１０９、認識結果管理装置１１０が接続して構成される。

【0018】

ＩＰ−ＰＢＸ装置１０３は、ＩＰ網と公衆網１０２のプロトコル変換、発着信の制御などを行う。ＣＴＩサーバ装置１０４は、コールセンタでの呼制御の中核となる装置であり、コールセンタの状況を管理し、ＩＰ−ＰＢＸ装置１０３から受取った呼の状態情報をオペレータ用ＰＣ端末１１２、スーパバイザＰＣ端末１１３に送信するなどの機能を有する。ＩＶＲ（Interactive Voice Response）装置１０５は、架電者からの呼に対して、ガイダンス誘導などの一次音声応答等の音声処理を行う装置である。通話録音装置１０６は、通話録音処理による録音データを作成する装置である。通話録音管理装置１０７は、録音データやこれに付加する通話情報を管理して、通話録音装置に音声認識を行う音声認識装置１０９を指定する装置である。音声認識制御装置１０８は、通話録音管理装置１０７から音声認識の要求があったときに、音声認識装置１０９の使用状況やハードウェアの付加を考慮して、複数の音声認識装置１０９から選択して、音声認識装置１０９を表す識別子を通話録音管理装置１０７に返す装置である。音声認識装置１０９は、音声認識エンジンを搭載し、要求に応じて録音された通話音声からキーワードを取り出したり、通話テキストに変換する装置である。認識結果管理装置１１０は、音声認識装置１０９が認識してテキスト化したデータを管理する装置である。

【0019】

次に、図２ないし図５を用いて通話制御システムの各部の構成の詳細について説明する。

【0020】

先ず、図２を用いて通話録音装置の構成について説明する。

【0021】

通話録音装置１０６は、図２に示されるように、ネットワークＩ／Ｆ（InterFace）部１０６１、録音部１０６２、認識音声制御部１０６３、端末Ｉ／Ｆ部１０６４、記憶部１０６５を有する。ネットワークＩ／Ｆ（InterFace）部１０６１は、ＩＰネットワークとのインタフェースを司り、ＲＴＰパケットを受信する構成部である。録音部１０６２は、ＲＴＰパケットにより通話の録音をする構成部である。認識音声制御部１０６３は、録音した音声データを音声認識装置に送信する構成部である。端末Ｉ／Ｆ部１０６４は、オペレータ用ＰＣ端末１１２、スーパバイザ用ＰＣ端末１１３とのインタフェースを司る構成部である。記憶部１０６５は、テーブルやデータを格納する構成部である。通話録音装置１０６の記憶部１０６５には、ＩＰ内線情報テーブル１０６６、録音情報テーブル１０６７、音声データテーブル１０６８、音声データファイル１０６９、聴話情報テーブル１０６７が格納されている。なお、各テーブルの詳細については、後述する。

【0022】

次に、図３を用いて音声認識装置１０９の構成について説明する。

【0023】

音声認識装置１０９は、図３に示されるように、認識音声受信部１０９１、認識エンジン１０９２、認識結果管理装置Ｉ／Ｆ部１０９３、記憶部１０９４を有する。認識音声受信部１０９１は、通話録音装置１０６から音声データを受信する構成部である。認識エンジン１０９２は、音声データを音声認識してテキスト化する構成部である。認識結果管理装置Ｉ／Ｆ部１０９３は、認識結果管理装置１１０とのインタフェースを司る構成部である。記憶部１０９５は、テーブルやデータを格納する構成部である。音声認識装置１０９の記憶部１０９４には、認識結果テーブル１０９５が格納されている。なお、テーブルの詳細については、後述する。

【0024】

次に、図４を用いて認識結果管理装置１１０の構成について説明する。

【0025】

認識結果管理装置１１０は、図４に示されるように、キーワード検知部１１０１、認識結果編集部１１０２、音声認識装置Ｉ／Ｆ部１１０３、端末Ｉ／Ｆ部１１０４、記憶部１１０６を有する。キーワード検知部１１０１は、音声認識装置１０９から受取った認識結果のテキストの中の所定のキーワードを検知する構成部である。認識結果編集部１１０２は、キーワードを検知したテキストをＰＣ端末１１３に送信するために編集する構成部である。音声認識装置Ｉ／Ｆ部１１０３は、音声認識装置１０９とのインタフェースを司る構成部である。端末Ｉ／Ｆ部１１０４は、オペレータ用ＰＣ端末１１２、スーパバイザ用ＰＣ端末１１３とのインタフェースを司る構成部である。記憶部１１０５は、テーブルやデータを格納する構成部である。認識結果管理装置１１０の記憶部１１０５には、キーワード情報テーブル１１０６、認識結果テーブル１１０７、キーワード検知情報テーブル１１０８が格納されている。なお、テーブルの詳細については、後述する。

【0026】

次に、図５を用いてスーパバイザ用ＰＣ端末１１３の構成について説明する。

【0027】

スーパバイザ用ＰＣ端末１１３は、図５に示されるように、電話制御部１１３１、通話操作部１１３２、管理ツール処理部１１３３、通話録音装置Ｉ／Ｆ部１１３４、認識結果管理装置Ｉ／Ｆ部１１３５、記憶部１１３６を有する。電話制御部１１３１は、ＰＣ端末１１３より接続された通話端末１１１を制御する構成部である。通話操作部１１３２は、通話に関する音声データを再生する構成部である。管理ツール処理部１１３３は、ＰＣ端末にインストールされた管理ツール（ユーティリティプログラム）を処理する構成部である。通話録音装置Ｉ／Ｆ部１１３４は、通話録音装置１０６とのインタフェースを司る構成部である。認識結果管理装置Ｉ／Ｆ部１１３５は、認識結果管理装置１１０とのインタフェースを司る構成部である。記憶部１１３６は、テーブルやデータを格納する構成部である。ＰＣ端末１１３の記憶部１１３６には、音声データリスト１１３７が格納されている。なお、音声データリスト１１３７の詳細については、後述する。

【0028】

次に、図６ないし図１３を用いて通話制御システムに用いられるデータ構造について説明する。

【0029】

ＩＰ内線情報テーブル１０６６は、図６に示されるように、内線番号とＩＰアドレス対応テーブルの対応付けを示すテーブルであり、通話録音装置１０６に保持される。ＩＰ内線情報テーブル１０６６は、内線番号１０６６ａのフィールドの内線番号の１１１が、ＩＰアドレス対応テーブル１０６６ｂのフィールドのＩＰアドレスを有することを意味している。

【0030】

録音情報テーブル１０６７は、通話の録音に関する情報を保持するためのテーブルであり、通話録音装置１０６に保持される。録音情報テーブル１０６７は、図７に示されるように、通話録音装置ＩＤ１０６７ａ、録音ＩＤ１０６７ｂ、録音開始時刻１０６７ｃ、ＩＰアドレス１０６７ｄ、音声データファイル１０６７ｅの各フィールドを有する。通話録音装置ＩＤ１０６７ａには、通話録音装置１０６を識別するためのＩＤが格納される。録音ＩＤ１０６７ｂには、通話録音のエントリを識別するためのＩＤが格納される。録音開始時刻１０６７ｃには、通話録音の開始時刻が格納される。ＩＰアドレス１０６７ｄには、通話に係る通話端末１１１のＩＰアドレスが格納される。音声データファイル１０６７ｅには、音声ファイルのファイル名（ファイルシステム上のパス名）が格納される。

【0031】

音声データテーブル１０６８は、図８に示されるように、音声データＩＤと音声データファイルの対応付けを示すテーブルであり、通話録音装置１０６に保持される。音声データテーブル１０６８は、音声データＩＤ１０６８ａのフィールドの音声データの識別子と、音声データファイル１０６８ｂのフィールドの音声データファイル名が対応していることを意味している。

【0032】

聴話情報テーブル１０６９は、図９に示されるように、聴話ＩＤと音声データファイルの対応付けを示すテーブルであり、通話録音装置１０６に保持される。聴話情報テーブル１０６９は、聴話ＩＤ１０６９ａのフィールドの聴話の識別子と、音声データファイル１０６９ｂのフィールドの音声データファイル名が対応していることを意味している。

【0033】

認識結果テーブル１０９５は、音声認識結果に関する情報を保持するためのテーブルであり、音声認識装置１０９に保持され、さらに、認識結果管理装置１１０にコピーされて、認識結果テーブル１１０７として保持される。認識結果テーブル１０９５は、図１０に示されるように、通話録音装置ＩＤ１０９５ａ、録音ＩＤ１０９５ｂ、内線番号１０９５ｃ、通話ＩＤ１０９５ｄ、発話ＩＤ１０９５ｅ、発話日時１０９５ｆ、認識結果テキスト１０９５ｇの各フィールドを有する。通話録音装置ＩＤ１０９５ａには、通話録音装置１０６を識別するためのＩＤが格納される。録音ＩＤ１０９５ｂには、通話録音のエントリを識別するためのＩＤが格納される。内線番号１０９５ｃには、通話端末１１１のセンタにおける内線番号が格納される。通話ＩＤ１０９５ｄには、通話を識別するためのＩＤが格納される。発話ＩＤ１０９５ｅには、発話を識別するためのＩＤが格納される。ここで、発話とは、通話を区切った単位であり、音声認識装置１０９は、音声認識をするときの単位として取り扱い、発話ごとに認識結果としてファイルに保存する。発話日時１０９５ｆは、発話の開始した時刻が格納される。認識結果テキスト１０９５ｇには、発話をテキスト化したときのテキストファイル名が格納される。

【0034】

キーワード情報テーブル１１０７は、スーパバイザが、オペレータと顧客の通話を監視するために、着目するキーワードを予め設定するキーワードに関する情報を格納するためのテーブルであり、認識結果管理装置１１０に保持される。キーワード情報テーブル１１０７は、図１１に示されるように、キーワード種別１１０７ａ、キーワード文字列１１０７ｂの各々のフィールドを有する。キーワード種別１１０７ａには、キーワードの分類の種別が格納される。キーワード文字列１１０７ｂには、そのキーワードの文字列が格納される。例えば、図１１では、キーワード種別１１０７ａが「オペレータ謝罪」は、オペレータが顧客に謝罪するためのキーワードであり、「申し訳ございません」、「できません」などがこれに該当することを示している。また、キーワード種別１１０７ａが「顧客感情」は、顧客の感情を推定できるキーワードであり、図１１では、「ふざけるな」がこれに該当する。また、キーワードの分類の種別は、「特定語」、「必須語」などの分類を設けて、センタにおける通話の統計、品質分析、オペレータの教育に用いることも可能である。

【0035】

キーワード検知情報テーブル１１０８は、キーワードの検知した情報を通話ごとに保持するためのテーブルであり、認識結果管理装置１１０に保持される。キーワード検知情報テーブル１１０８は、図１２に示されるように、録音ＩＤ１１０８ａ、通話ＩＤ１１０８ｂ、発話ＩＤ１１０８ｃ、キーワード種別１１０８ｄ、キーワード文字列１１０８ｅ、出現件数１１０８ｆの各フィールドを有する。録音ＩＤ１１０８ａには、通話録音のエントリを識別するためのＩＤが格納される。通話ＩＤ１１０８ｂには、通話を識別するためのＩＤが格納される。発話ＩＤ１１０８ｃには、発話を識別するためのＩＤが格納される。キーワード種別１１０８ｄ、キーワード文字列１１０８ｅには、それぞれ検知したキーワードの種別と文字列が格納される。出現件数１１０８ｆには、そのキーワード文字列の通話における出現件数のトータル値が格納される。

【0036】

音声データリスト１１３７は、図１３に示されるように、通話録音装置１０６に格納されている音声にアクセスするためにＰＣ端末１１３が保持するリストである。音声データリスト１１３７は、キュー構造で、音声データを表す識別子である音声データＩＤを保持する。

【0037】

次に、図１４ないし図１７を用いて通話制御システムの処理の詳細について説明する。

【0038】

先ず、図１４を用いて外部からの通話端末の発信から、ＰＣ端末に認識結果を表示するまでの一連の処理について説明する。

【0039】

先ず、顧客の通話端末１０１から発呼され（Ａ０１）、ＩＰ−ＰＢＸ装置１０３で交換処理されて、コールセンタのオペレータの通話端末１１１に着呼したとする（Ａ０２）。

【0040】

ＩＰ−ＰＢＸ装置１０３から通話端末１１１には、ＲＴＰパケットが送信されるが、ＩＰ−ＰＢＸ装置１０３は、同時にコピーしたＲＴＰパケットを通話録音装置１０６に転送する（Ａ０３）。

【0041】

通話録音装置１０６は、通話開始がされたことを、内線番号をパラメタとし、通話録音管理装置１０７に報告して（Ａ０４）、ＲＴＰパケットに基づいて、分割録音を開始し（Ｓ０４ａ，Ｓ０４ｂ，…）、図６に示したＩＰ内線情報テーブル１０６０を参照し、図７に示した録音情報テーブル１０６７に必要な情報を書き込む。

【0042】

通話録音管理装置１０７は、受信した内線番号をキーとして、通話認識情報テーブル（図示せず）を参照して、その内線番号にかかってきた電話に音声認識を行うか否かを判定する（Ｓ０２）。通話認識情報テーブルには、内線番号ごとに、その内線番号にかかってきた通話に対して、リアルタイムで音声認識を行うか否かの情報がふくまれているものとする。通話録音管理装置１０７は、その通話がリアルタイム音声認識を行うべきものと判定したときに、音声認識制御装置１０８に、音声認識を行う音声認識装置１０９を問い合わせる（Ａ０５）。音声認識制御装置１０８は、複数の音声認識装置１０９の使用状態、負荷を管理しており、音声認識制御装置１０８は、現段階での最も使用するのが相応しい音声認識装置１０９を判定し（Ｓ０３）、その音声認識装置１０９のＩＤを認識装置ＩＤとして、通話録音管理装置１０７に返答する（Ａ０６）。そして、通話録音管理装置１０７は、その認識装置ＩＤを通話録音装置１０６に転送する（Ａ０７）。

【0043】

通話録音装置１０６は、その認識装置ＩＤを受取り、音声認識を行うべき音声データをその認識ＩＤに対応する音声認識装置１０９に転送する（Ａ０８）。ここで、認識装置ＩＤは、音声認識装置１０９のＩＰアドレスでもよいし、その認識装置ＩＤに対応して、音声認識装置１０９をアクセスする仕組みを通話録音装置１０６が有するようにしてもよい。

【0044】

音声認識装置１０９は、通話録音装置１０６から送信されてきた音声データに対して、音声認識を行う（Ｓ０４）。ここで、通話録音装置１０６からは、音声データの外に、通話録音装置ＩＤ、録音ＩＤ、録音開始日時、内線番号がパラメタとして送信される。そして、音声認識装置１０９は、音声認識の結果を図１０に示す認識結果テーブル１０９５に書き込む。次に、音声認識装置１０９は、認識結果テーブル１０９５に書き込まれた情報を、認識結果管理装置１１０に転送する（Ａ０９）。

【0045】

認識結果管理装置１１０は、図１１に示されたキーワード情報テーブル１１０７を参照し、キーワードを検知して（Ｓ０５）、キーワード検知情報テーブル１１０８にキーワードに関する情報を書き込む。

【0046】

そして、スーパバイザ用ＰＣ端末１１３から内線番号をパラメタして、録音情報と認識結果の送信を認識結果管理装置１１０に要請する（Ａ１０）。それを受けて、スーパバイザ用ＰＣ端末１１３に表示できるデータ形式に編集して（Ｓ０６）、認識結果を送信する（Ａ１１）。ここで、少なくとも、録音ＩＤ、発話日時、キーワードと関連付けた認識結果のテキストが認識結果管理装置１１０から送信される。認識結果管理装置１１０とスーパバイザ用ＰＣ端末１１３の最も一般的なインタフェースとしては、認識結果管理装置１１０がＷｅｂサーバとなり、認識結果をＨＴＭＬ(HyperText Markup Language)形式にして、スーパバイザ用ＰＣ端末１１３に転送することが考えられる。そして、スーパバイザ用ＰＣ端末１１３は、Ｗｅｂブラウザの機能により認識結果を、通話に関する情報（例えば、内線番号）と、認識結果のテキストと関連付けて表示する。また、それに限らず、認識結果管理装置１１０が独自のフォーマットで編集し、スーパバイザ用ＰＣ端末１１３に専用のアプリケーションソフトウェアをインストールして、編集結果を表示するようにしてもよい。

【0047】

スーパバイザ用ＰＣ端末１１３は、画面にキーワードを含む認識結果を表示する（Ｓ０７）。スーパバイザ用ＰＣ端末１１３でのユーザインタフェースについては、後に詳説する。

【0048】

次に、図１５を用いて追いかけ再生の処理について説明する。

【0049】

通話録音装置１０６がＲＴＰを分割録音する所は、図１４の場合と同様である（Ａ０３、Ｓ０４ａ，Ｓ０４ｂ，…）。

【0050】

ここで、スーパバイザ用ＰＣ端末１１３から追いかけ再生の指示がされたものとする（Ｓ１０）。追いかけ再生は、オペレータと顧客が現在通話中の通話に対して、スーパバイザがモニタするために、その通話の録音された音声データを再生して（望ましくは、ｘ倍速再生（早送り再生））、聴取することである。なお、スーパバイザ用ＰＣ端末１１３から追いかけ再生の指示をするユーザインタフェースについては、後に詳説する。

【0051】

これを受けて、スーパバイザ用ＰＣ端末１１３は、録音ＩＤをパラメタとして、通話録音装置１０６に追いかけ再生の指示を行う（Ａ２０）。

【0052】

通話録音装置１０６は、その録音ＩＤに係る音声データの音声データＩＤを作成し、図８に示す音声データテーブル１０６８に音声データファイルと対にして書き込む（Ｓ１１）。そして、一定時間毎に、音声データＩＤをスーパバイザ用ＰＣ端末１１３に送信する（Ａ２１）。スーパバイザ用ＰＣ端末１１３は、図１３に示すように、音声データＩＤを音声データリスト１１３５に格納する。次に、スーパバイザ用ＰＣ端末１１３は、録音ＩＤと受信した音声データリストの音声データＩＤをペアのパラメタにして、音声再生要求を行ない（Ａ２２）、通話録音装置１０６は、対応する音声データファイルの音声データをスーパバイザ用ＰＣ端末１１３に送信して（Ａ２３）、スーパバイザ用ＰＣ端末１１３で音声再生が行なわれる（Ｓ１２）。

【0053】

次に、図１６及び図１７を用いて聴話再生の処理について説明する。

【0054】

聴話再生とは、オペレータと顧客の通話をスーパバイザがダイレクトに聴くことを意味する。聴話再生は、必ず×１倍速である。

【0055】

先ず、図１７を用いて本実施形態の通話制御システムにおける追いかけ再生と聴話再生の関係について説明する。スーパバイザが図１７（ａ）に示されるように、×２倍速でオペレータと顧客の通話を追いかけ再生で聴取しており、図１７（ｂ）に示されるように、時刻ｔ０で追いついたものとする。このときに、スーパバイザ用ＰＣ端末１１３の通話操作部１１３２は、自動的に聴話再生に切り替えるものとする。スーパバイザ用ＰＣ端末１１３が追いかけ再生から聴話再生に切り換えるタイミングは、録音結果管理装置１１０から音声ＩＤが得られなくなったとき、すなわち、録音した音声データがなくなったときである。

【0056】

先ず、通話録音装置１０６がＲＴＰを分割録音する所は、図１４、図１５の場合と同様である（Ａ０３、Ｓ０４ａ，Ｓ０４ｂ，…）。

【0057】

ここで、スーパバイザ用ＰＣ端末１１３から聴話再生の指示がされたものとする（Ｓ２０）。スーパバイザ用ＰＣ端末１１３からの聴話再生の指示は、スーパバイザが明示的に指定するか、上述のように、追いかけ再生時に再生が追いついた場合である。なお、スーパバイザ用ＰＣ端末１１３から聴話再生の指示をするユーザインタフェースについては、後に詳説する。

【0058】

これを受けて、スーパバイザ用ＰＣ端末１１３は、録音ＩＤをパラメタとして、通話録音装置１０６に聴話再生の指示を行う（Ａ３０）。

【0059】

通話録音装置１０６は、聴話ＩＤを作成し、図９に示す聴話情報テーブル１０７０に音声データファイルと対にして書き込む（Ｓ１１）。そして、一定時間毎に、聴話ＩＤをスーパバイザ用ＰＣ端末１１３に送信する（Ａ３１）。次に、スーパバイザ用ＰＣ端末１１３は、受信した聴話ＩＤパラメタとして、聴話開始要求を行ない（Ａ３２）、通話録音装置１０６は、対応する音声データファイルの音声データをスーパバイザ用ＰＣ端末１１３に送信して（Ａ３３）、スーパバイザ用ＰＣ端末１１３で聴話再生が行なわれる（Ｓ２１）。

【0060】

次に、図１８ないし図２１を用いてスーパバイザ用ＰＣ端末におけるユーザインタフェースについて説明する。

【0061】

コールセンタの運用時には、スーパバイザ用ＰＣ端末１１３には、オペレータの状況を監視するために、例えば、図１８に示されるように、座席図表示画面６００を表示する。また、内線番号１００２の「日立花子」の座席図の所に示されているように、キーワードの出現件数の多いオペレータの座席には警告アイコンが表示される。

【0062】

座席図表示画面６００では、座席枠の各々に対して、内線番号とオペレータの名前が図示されており、そのオペレータのイラストから、直接、キーワード表示吹き出し６１０が表示されている。

【0063】

スーパバイザは、キーワード表示吹き出し６１０をクリックすることにより、図１９に示した通話内容表示画面７００を開くことができる。通話内容表示画面７００には、通話内容表示吹き出し７１０が表示されている。通話内容表示画面７００に表示される通話内容表示吹き出し７０１は、クリックしたキーワード表示吹き出し６１０ａ以降の録音された通話を音声した認識をテキスト表示したものである。すなわち、座席枠に該当する通話端末が、該当内線番号により通話した内容をテキスト化したものが表示される。

【0064】

通話内容表示吹き出し７１０ａ、７１０ｃは、オペレータ会話した内容を示した吹き出しであり、７０１ｂは顧客が会話した内容を示した吹き出しとなる。登録されているキーワードには、視認しやすいように、その単語を赤色で表示したり、線を引いたりする。例えば、ＨＴＭＬを画面に表示するときには、そのキーワードを所定のタグで修飾すればよい。また、キーワードが含まれている吹き出し全体の色を変更して、そうでないものと区別するようにしてもよい。オペレータと顧客は左側と右側から吹き出す方向を分けることによって、どちらが会話したのか目視できるようにしている。また、通話内容表示吹き出し７１０の色やバックグラウンドのパターン、囲む線のタイプにより、オペレータと顧客の区別をするようにしてもよい。

【0065】

通話内容吹き出し７０１ａは、オペレータが１４時４３分１０秒に「お客様がご希望された処理を賜る事ができません。」と会話したことを示しており、通話内容吹き出し７０３は、顧客が１４時４３分２５秒に「どうしてできないんですか？」と会話したことを示しており、通話内容吹き出し７０４は、オペレータが１４時４３分４０秒に「まことに、申し訳ございません。」と会話したことを示している。なお、録音の分割は、例えば、１５秒毎に行われるものとしており、表示される時刻は、録音時刻である。

【0066】

ここで、スーパバイザが通話の追いかけ再生をするときには、通話内容吹き出し７０１ａ、７０１ｂ、７０１ｃの部分をマウスにより、クリックする。この操作により、図２０に示した追いかけ再生画面３００が表示され、その通話内容吹き出し７０１ａ、７０１ｂ、７０１ｃに係る通話が該当個所から追いかけ再生して、スーパバイザが通話の音声データを再生して、聴取できるようになる。

【0067】

追いかけ再生画面３００は、閉じるボタン３０１、通話情報欄３１０、モニタリング再生ボタン３１４、音声操作パネル３２０、チャプターリスト欄３４０よりなる。

【0068】

閉じるボタン３０１は、この画面を閉じるためのボタンである。モニタリング再生ボタン３１５は、図２１に示したモニタリング再生画面４００に遷移するためのボタンである。

【0069】

通話情報欄３１０は、該当の通話に係る情報を表示する欄であり、開始日時３１１、種別３１２、内線番号３１３に、それぞれ、その通話の開始日時、着信、発信の別、センタにおける内線番号が表示される。

【0070】

音声操作パネル３２０は、通話音声を再生するための情報の表示や操作を行うパネルである。音声操作パネル３２０には、操作ボタンとして、（最初へ）ボタン３２１、（前へ）ボタン３２２、（少し戻る）ボタン３２３、（再生）（一時停止）ボタン３２４、（少し進む）ボタン３２５、（早送り）ボタン３２６、（次へ）ボタン３２７、（最後へ）ボタン３２８、（停止）ボタン３２９、（音量下げる）ボタン３３０、（音量上げる）ボタン３３２がある。また、情報の表示として、再生位置・再生速度表示欄３３３、モード表示欄３３４、音量表示欄３３１がある。

【0071】

（最初へ）ボタン３２１は、チャプターの先頭の音声ファイルの再生を指示するボタンである。（前へ）ボタン３２２は、チャプターで再生中の一つ前の音声ファイルの再生を指示するボタンである。（少し戻る）ボタン３２３は、現在の再生位置から５秒前へ戻すことを指示するボタンである。（再生）（一時停止）ボタン３２４は、選択された音声ファイルの再生を指示したり、再生しているときに、一時停止の指示をするボタンである。この（再生）（一時停止）ボタン３２４は、再生中に押すとボタンフェイスが一時停止に変わり、一時停止中に押すと再生に変わるトグルボタンである。（少し進む）ボタン３２５は、現在の再生位置から１０秒先早送りすることを指示するボタンである。（早送り）ボタン３２６は、再生速度を指示するボタンである。このボタンを押すたびに、再生速度が「１倍速」→「１．２倍速」→「１．４倍速」→「１．６倍速」→「１．８倍速」→「２倍速」→「１倍速」のように循環して変化する。（次へ）ボタン３２７は、チャプターで再生中の一つ先の音声ファイルの再生を指示するボタンである。（最後へ）ボタン３２８は、チャプター中の最新の音声の再生を指示するボタンである。（停止）ボタン３２９は、再生を停止することを指示するボタンである。（音量下げる）ボタン３３０は、現在の再生の音量を下げることを指示するボタンである。例えば、音量が「０」〜「１００」の整数値で表現されているときに、−１０ポイントする。（音量上げる）ボタン３３２は、現在の再生の音量を上げることを指示するボタンである。例えば、音量が「０」〜「１００」の整数値で表現されているときに、＋１０ポイントする。

【0072】

再生位置・再生速度表示欄３３３は、再生の位置と再生の速度を表示する。再生の速度の表示は、s倍速（ｓは、少数点以下１桁で表される数）のときには、s×と表示される。モード表示欄３３４には、追いかけ再生か、モニタリング再生かのモードが表示される。音量表示欄３３１には、現在の音量が「０」〜「１００」の整数値で表示される。

【0073】

チャプターリスト欄３４０は、チャプターリストの情報を表示する欄であり、チャプター番号表示欄３４１、録音開始時刻欄３４２、経過時刻欄３４３、ステータス表示欄３４４を有する。チャプター番号表示欄３４１は、チャプター毎に付けられたチャプター番号の番号を降順に表示する。録音開始時刻欄３４２には、チャプターの録音開始時刻を表示する。経過時刻欄３４３には、そのチャプターの先頭からの経過時刻を表示する。ステータス表示欄３４４には、通話の状態が表示される。通話中のときには、「バッファ中」と表示され、通話が終了すると「通話終了」と表示される。

【0074】

なお、ここでのチャプターとは、音声再生のための単位として概念化されたものであり、一定時間毎（例えば、３０秒毎）の音声の区切りとしてもよいし、図１９に示したような吹き出しで音声の区切りとしてもよい。

【0075】

モニタリング再生画面４００は、追いかけ再生画面３００のモニタリング再生ボタン３１５から起動され、その通話の聴話再生を行う画面である。

【0076】

モニタリング再生画面４００は、図７に示されるように、追いかけ再生画面３００とほぼ同様のユーザインタフェースを有するが、ボタンの種類と、チャプターリスト欄３４０がないことが異なっている。モニタリング再生画面４００では、モニタリング再生ボタン３１４の変わりに、追いかけ再生ボタン４１４が表示されており、これを押すと、図２０に示した追いかけ再生画面３００が表示される。

【0077】

本実施形態によれば、音声認識をしたテキストを視認し、特定のキーワードが表示されている通話に着目して、追いかけ再生や聴話が可能になり、スーパバイザが実際の通話をダイレクトに聴取することにより、スーパバイザの監視業務の効率化と、オペレータの顧客への応対品質を向上させることができる。

【符号の説明】

【0078】

１０１…顧客の通話端末
１０２…公衆網
１０３…ＩＰ−ＰＢＸ装置
１０４…ＣＴＩサーバ装置
１０５…ＩＶＲ装置
１０６…通話録音装置
１０７…通話録音管理装置
１０８…音声認識制御装置
１０９…音声認識装置
１１０…認識結果管理装置
１１１…通話端末（オペレータとスーパバイザが使用）
１１２…オペレータ用ＰＣ端末
１１３…スーパバイザ用ＰＣ端末
１１４…ネットワーク
３００…追いかけ再生画面
４００…モニタリング再生画面
６００…座席図表示画面
７００…通話内容表示画面
７０１…通話内容表示吹き出し

【図1】