(58)【調査した分野】(Int.Cl.,DB名)
前記業務情報−認識エンジン対応テーブルは、言語ごと、業務の分野・種別ごとに異なった音声認識エンジンの情報を保持することを特徴とする請求項1記載のコールセンタシステム。
【発明を実施するための形態】
【0015】
以下、本発明に係る一実施形態を、
図1ないし
図9を用いて説明する。
【0016】
先ず、
図1ないし
図3を用いて、本発明の一実施形態に係るコールセンタシステムの構成と処理の概要について説明する。
図1は、コールセンタシステムの全体構成図である。
図2は、コールセンタシステムの機能関連図である。
図3は、音声認識サーバの音声認識部の構成図である。
【0017】
このコールセンタシステムは、
図1に示されるように、顧客等の架電者(電話をかける者)の通話端末51から公衆網6を介して接続されるIP−PBX(Internet Protocol−Private Branch eXchange、IP回線対応構内交換機)装置80が、ネットワーク7を介して、オペレータの通話端末50と接続し通話をする構成を有する。オペレータは、オペレータ用PC端末60から通話端末50の電話操作をすることができ、架電者からの着信が、オペレータ用PC端末60に表示されると、PC端末60から応答を操作して、通話端末50が応答動作を実施して架電者とオペレータは、通話状態になる。また、PC端末60では、オペレータ業務を支援するためのオペレータサポートアプリケーション503を実行する。
【0018】
コールセンタシステムは、ネットワーク7を介して、IP−PBX装置80、録音装置30、通話・録音情報管理サーバ10、通話情報取得装置40、音声認識サーバ20、通話端末50、通話端末(オペレータ1用、オペレータ2用、…)50、オペレータ用PC端末60(オペレータ1用、オペレータ2用、…)が接続されて構成されている。
【0019】
IP−PBX装置80は、顧客の通話端末51からの呼を受けて、IP網と公衆網6のプロトコル変換、発着信の呼制御などをおこなう。
【0020】
通話情報取得装置40は、IP−PBX装置から、通話の呼に関する情報(通話時刻、内線番号など)を取得する装置である。
【0021】
録音装置30は、通話端末50でやりとりされる通話のデータストリームを、IP−PBX装置80経由で、録音データとして録音する装置である。録音装置30は、データベースとして、録音DB300をアクセスする。
【0022】
通話・録音情報管理サーバ10は、通話情報と、録音情報を対応付けて管理するためのサーバである。通話・録音情報管理サーバ10は、データベースとして、通話・録音情報管理DB100をアクセスする。
【0023】
音声認識サーバ20は、音声データである録音データをテキストデータに変換するサーバである。音声認識サーバ20は、データベースとして、音声認識管理DB230をアクセスする。
【0024】
通話端末50と、PC端末60は、各オペレータ(オペレータ1、オペレータ2、…)が、オペレータ業務に使う機器である。この内、通話端末50は、顧客の通話端末51と、公衆網6を介した外線による通話をするための装置である。PC端末60は、オペレータが通話端末50の制御をしたり、必要なセンタ情報の表示や、オペレータサポートアプリケーションを実行するための情報処理端末である。
【0025】
次に、
図2を用いてコールセンタシステムの各部の機能とデータの関連について説明する。
PC端末60は、通話端末制御部601、オペレータ操作画面表示部602、オペレータサポートアプリケーション603、音声認識要求部604、音声認識結果取得部605、通話・録音情報取得・表示部606の各機能ブロックを有する。
【0026】
通話端末制御部601は、そのオペレータが使っている通話端末50を制御する部分である。
【0027】
オペレータ操作画面表示部602は、オペレータサポートアプリケーション603のためのオペレータ操作画面を表示する部分である。
【0028】
オペレータサポートアプリケーション603は、オペレータ業務を支援するためのアプリケーションソフトウェアであり、例えば、顧客との応対を記録し、管理するための応対記録システム、オペレータ業務のマニュアルを表示するためのマニュアル表示ソフトウェアなどが考えられる。
【0029】
音声認識要求部604は、音声認識サーバ20に対して録音データの音声認識を要求する部分である。
【0030】
音声認識結果取得部605は、音声認識サーバ20に要求した録音データの音声認識結果を受取る部分である。
【0031】
通話・録音情報取得・表示部606は、通話・録音情報管理サーバ10から、通話・録音情報を取得して、操作画面に表示する。
【0032】
通話端末50での通話は、IP網でのRTP(Real−time Transport Protocol)によるものであり、録音装置30に送られて、録音DB300に、一定時間ごとに分割された録音ファイル310として保存される。
【0033】
また、通話情報取得装置は、IP−PBX装置80から通話情報を取得して、通話・録音情報管理サーバ10に送信する。
【0034】
音声認識サーバ20は、音声認識制御部200、音声認識部210、認識結果管理部220からなる。音声認識サーバ20は、音声認識管理DB230をアクセスする。
【0035】
音声認識制御部200は、PC端末60からの音声認識要求を受けて、音声認識部に指示を与える部分である。音声認識部210は、録音データを音声認識エンジン(以下、単に「認識エンジン」ともいう)により、テキストデータに変換する部分である。認識結果管理部220は、音声認識部210が出力するテキストデータをデータベースに格納し、アクセスを管理する部分である。
【0036】
音声認識管理DB230には、業務情報−認識エンジン対応テーブル240と、認識ファイル250が格納される。
【0037】
業務情報−認識エンジン対応テーブル240は、コールセンタにおける業務情報に関する録音データの音声認識に使用する認識エンジンを対応付けるテーブルである。認識ファイル250は、録音データの音声認識の結果、作成されるテキストファイルである。なお、業務情報−認識エンジン対応テーブル240については、後に詳説する。
【0038】
通話・録音情報管理サーバ10は、通話・録音情報登録部101、通話情報出力部102、録音データ転送部103の機能ブロックを有し、通話・録音情報管理DB100を備える。
【0039】
通話・録音情報管理DB100は、通話・録音情報管理テーブル110を格納する。通話・録音情報管理テーブル110は、通話情報と録音情報を対応付けて管理するテーブルである。なお、通話・録音情報管理テーブル110については、後に詳説する。
【0040】
通話・録音情報登録部101は、通話情報取得装置40から通話情報を、録音装置30から録音情報を取得して、通話・録音情報管理DB100に登録する。通話情報出力部102は、音声認識サーバ20の音声認識制御部に対して、通話情報を出力する。録音データ転送部103は、録音装置30の録音DB300に格納されている録音データを、音声認識サーバ20の音声認識部201に転送する。
【0041】
次に、
図3を用いて音声認識サーバ20の音声認識部210の詳細な構成について説明する。
音声認識部210は、
図3に示されるように、音声入力部212、認識エンジン220、テキスト出力部214からなる。
【0042】
音声入力部212は、外部からの音声データを取り込む部分である。認識エンジン220は、音声認識のアルゴリズム処理をおこなう本体部分である。テキスト出力部214は、認識結果をテキストデータとして出力する部分である。
【0043】
認識エンジン220は、音響分析部222と、認識デコーダ224、認識エンジン230からなる。
【0044】
音響分析部222は、入力された音声データを、認識辞書230の音響モデルや発音辞書に当てはめて、パターン分析をおこなう。
【0045】
認識デコーダ部224では、音響分析部222の解析パターンを入力し、認識辞書230の言語モデルを参照して、デコードし、テキストに変換していく。
【0046】
音声認識辞書230は、専門分野別に分かれており、
図3では、認識エンジン220に内包されるように図示しているが、外付けにして必要に応じて参照するようにしてもよい。
【0047】
次に、
図4および
図5を用いて本実施形態のコールセンタシステムに使用されるデータ構造について説明する。
図4は、通話情報・録音情報管理テーブルの一例を示す図である。
図5は、業務情報−認識エンジン対応テーブルの一例を示す図である。
【0048】
通話・録音情報管理テーブル110は、通話端末50における呼にかかる通話と、その録音データの関する情報を管理するためのテーブルであり、通話・録音情報管理サーバ10の通話・録音情報管理DB100に格納される。
【0049】
通話・録音情報管理テーブル110は、
図4に示されるように、通話識別ID110a、オペレータID110b、種別110c、内線番号110d、着番号110e、発番号110f、録音ファイルパス110gのフィールドを有する。
【0050】
通話識別
ID110aは、通話にかかる呼を一意的に識別するためのIDである。オペレータID110bは、この通話を取り扱ったコールセンタのオペレータの識別子である。種別110
cは、この呼が発信か着信かを識別するために記録される。内線番号110
dは、この呼が発着信された内線番号である。着番号
110eは、通話が着信する先の通話端末50または通話端末51の電話番号である。発番号は110fは、通話を発信した元の通話端末50または通話端末51の電話番号である。録音ファイルパス110
gは、この呼の通話が録音されたときの録音ファイルの所在を表す情報である。これは、ファイルパスでもよいし、その録音ファイルを特定する識別子でもよい。
【0051】
業務情報−認識エンジン対応テーブル240は、業務情報とその業務情報の録音データを音声認識するときに使用する認識エンジンの対応を示すテーブルであり、音声認識サーバ20の音声認識管理DB230に格納されている。業務情報−認識エンジン対応テーブル240は、
図5に示されるように、業務ID240a、業務名240b、着番号240c、認識エンジン240dのフィールドを有する。
【0052】
業務ID240aは、コールセンタにおける業務をカテゴリー分けしたときの業務の識別子である。業務名240bは、コールセンタにおける業務をカテゴリー分けしたときの業務の名称である。着番号240cは、コールセンタにおけるその業務を担当するときの通話端末50への着番号である。本実施形態では、通話・録音情報管理サーバと音声認識サーバでやり取りされる通話に係る業務情報のキーとして、この着番号を用いることにする。例えば、着番号「03XXXYY01」にかかってきた通話の録音データは、業務名「ヘルプデスク(日本語)」の業務に関するものであり、認識エンジンは、「EngineA1(日本語対応)」のものを用いることが予定されているものとする。業務認識エンジン240dは、その業務の録音データを音声認識するときに使用される認識エンジンの識別名称である。
【0053】
一般に、音声認識は、業務の適用分野(金融、製造業、情報処理分野)、業務形態(ヘルプデスク、苦情受け付け、製品問合せ)などによって、認識辞書を変えるのが望ましく、また、ときには、認識アルゴリズムの変更も必要になることがある。本実施形態では、録音データの適用する業務ごとに、認識エンジンを変えることが可能になり、認識率の向上を図ることができる。
【0054】
次に、
図6ないし
図8を用いて本発明の一実施形態に係るコールセンタシステムにおいて音声認識処理について説明する。
図6は、PC端末からの要求を受けて、録音データに対して音声認識処理をおこなうときのシーケンス図である。
図7は、音声認識処理の認識キュー設定処理を示すフローチャートである。
図8は、認識キュー検索処理を示すフローチャートである。
図9は、認識キューの概念を示す図である。
【0055】
図6の処理の前に、
図2で示したように、顧客の通話端末51からコールセンタに着信、あるいは、コールセンタから顧客の通話端末51に発信して、録音装置30の録音DB300に録音ファイル310が格納され、そのときの通話情報が、IP−PBXと通話情報取得装置を介して、通話・録音情報管理サーバ10の通話・録音情報管理DB100の通話・録音情報管理テーブル110に格納されているものとする。また、コールセンタの業務と音声認識に使用される認識エンジンに関して、音声認識サーバ20の業務情報―認識エンジン管理テーブルに適切な値が既に格納されているものとする。
【0056】
先ず、PC端末60から
図4に示した通話・録音情報管理テーブル110の内容を表示するユーティリティを起動して、通話・録音情報管理サーバ10に対して、通話・録音情報を要求する(A090)。通話・録音情報管理サーバ10は、これに対して、通話・録音情報を返信する(A092)。図示しないが、そのユーティリティにより、PC端末60には、通話・録音情報管理テーブル110の内容が画面に表形式で表示され、オペレータは、それをマウスなどのポインティングデバイスで指定できるものとする。そのようなユーティリティを操作することにより、PC端末60のオペレータは、通話識別IDを指定して、通話・録音情報管理テーブル110に音声認識要求をおこなう(A10
0)。
【0057】
これを受けて、通話・録音情報管理サーバ10は、通話識別IDとその対応する着番号を音声認識サーバ20の音声認識制御部200に送信する(A10
1)。
【0058】
音声認識サーバ20の音声認識制御部200は、受信した通話識別IDとその対応する着番号に基づいて、認識処理キュー設定処理をおこなう(S100)。認識処理キュー設定処理は、後にフローチャートにより詳細に説明する。
【0059】
音声認識サーバ20の音声認識部210は、音声認識制御部200に対して認識対象の問合せをおこなう(A102)。
【0060】
これを受けた音声認識制御部200は、キュー検索処理をおこない(S110)、通話識別IDと認識エンジン種別を、音声認識部210に対して返信する(A104)。キュー検索処理は、後にフローチャートにより詳細に説明する。
【0061】
また、音声認識部210は、通話・録音情報管理サーバ10に対して、通話識別IDを指定して録音データ取得要求をおこなう(A106)。
【0062】
これを受けて通話・録音情報管理サーバ10は、受信した通話識別IDに基づいて、通話・録音情報管理テーブル110をサーチし、対応する録音ファイルパスを得て(S120)、録音装置30の録音データ300の録音ファイル310を読み出して、録音データを、音声認識部210に返信する
(A108)。
【0063】
音声認識部210では、受信した認識エンジンの名称の認識エンジンにより、受信した録音データの音声認識処理をおこなう(S130)。
【0064】
そして、音声認識部210は、音声認識の結果データを認識結果管理部220に送信し、認識結果管理部220は、音声認識管理DB200の認識ファイル250にテキストファイルとして書き込む(S140)。
【0065】
そして、PC端末60からの認識結果要求があったときに(A111)、認識結果管理部220は、認識結果を返信し(A113)、PC端末60で結果の表示・出力をおこなう(S150)。
【0066】
次に、
図7および
図9を用いてS100の認識キュー設定処理を説明する。
音声認識サーバ20の音声認識制御部200では、通話・録音管理サーバ10より通話識別IDと着番号を受信する(S102)。
【0067】
そして、業務情報−認識エンジン対応テーブル240を参照し、着番号に対応する認識エンジン名称を検索し、認識エンジンに対応する認識キューに通話識別IDを入れる(S104)。
【0068】
認識キューは、
図9に示されるように、通話識別IDが待ち行列として並び、First−In,First−Outで、そのキューに対応する認識エンジンにより音声認識がされるデータ構造である。例えば、キューAには、C001、C020、C022がこの順に入力され、認識エンジンのEngineA1(日本語対応)により、C001、C020、C022の順に音声認識処理がされることを示している。
【0069】
次に、
図8を用いてS110のキュー検索処理について説明する。
音声認識サーバ20の音声認識制御部200では、認識キューを検索して、通話識別IDを取得する(S112)。
【0070】
そして、通話識別IDとその認識キューに係る認識エンジン名称を、音声認識部210に送信する(S114)。
【0071】
以上のように、本実施形態によれば、コールセンタの業務ごとに適した音声認識エンジンにより、録音データに対して音声認識がされるので、認識率の向上が見込まれ、より効率的なコールセンタの運用を可能とすることができる。