特許第6687358号(P6687358)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立情報通信エンジニアリングの特許一覧

特許6687358コールセンタシステム、および、その音声認識制御方法
<>
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000002
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000003
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000004
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000005
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000006
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000007
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000008
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000009
  • 特許6687358-コールセンタシステム、および、その音声認識制御方法 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6687358
(24)【登録日】2020年4月6日
(45)【発行日】2020年4月22日
(54)【発明の名称】コールセンタシステム、および、その音声認識制御方法
(51)【国際特許分類】
   G10L 15/00 20130101AFI20200413BHJP
   G10L 15/06 20130101ALI20200413BHJP
【FI】
   G10L15/00 200A
   G10L15/06 400V
【請求項の数】3
【全頁数】13
(21)【出願番号】特願2015-205805(P2015-205805)
(22)【出願日】2015年10月19日
(65)【公開番号】特開2017-78753(P2017-78753A)
(43)【公開日】2017年4月27日
【審査請求日】2018年10月2日
(73)【特許権者】
【識別番号】000233295
【氏名又は名称】株式会社日立情報通信エンジニアリング
(74)【代理人】
【識別番号】110001689
【氏名又は名称】青稜特許業務法人
(72)【発明者】
【氏名】杉山 隆司
(72)【発明者】
【氏名】山口 純平
(72)【発明者】
【氏名】仲 庸
(72)【発明者】
【氏名】栗花 武俊
【審査官】 山下 剛史
(56)【参考文献】
【文献】 特開2014−178381(JP,A)
【文献】 特開2003−140691(JP,A)
【文献】 特開2002−150039(JP,A)
【文献】 特開2008−158511(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00−15/34
G06Q 10/00
(57)【特許請求の範囲】
【請求項1】
顧客からの呼を録音してデータとして保存するコールセンタシステムであって、
公衆回線網からの呼を内線に着信される交換をおこなう交換機と、
各オペレータが通話するために配置される通話端末と、
各オペレータが操作するオペレータ用情報処理端末と、
前記交換機から送信される通話データを録音して録音データとして保持する録音装置と、
前記交換機から通話に関する通話情報を受取り、前記録音装置から録音データに関する情報を対応付けてデータベースに保持する通話・録音情報管理サーバと、
前記録音データを音声認識してテキストデータを出力する音声認識サーバとを備え、
各装置は、ネットワークにより接続され、
前記通話・録音情報管理サーバは、通話識別情報と、通話の着番号と、録音データの管理情報とを関連付けた通話・録音情報管理テーブルを有し、
前記音声認識サーバは、通話に係る業務識別情報と、通話の着番号と、音声認識に使用する音声認識エンジンを対応付けた業務情報−認識エンジン対応テーブルを有し、
前記オペレータ用情報処理端末は、前記通話・録音情報管理サーバに、前記通話識別情報を送信して、音声認識処理を要求し、
前記通話・録音情報管理サーバは、受信した前記通話識別情報より、通話の着番号を前記通話・録音情報管理テーブルより検索して、前記通話識別情報と、前記通話の着番号を、前記音声認識サーバに送信し、
前記音声認識サーバは、受信した前記通話の着番号により、対応する音声認識エンジンを検索し、受信した前記通話識別情報を、その対応する音声認識エンジンが処理する認識キューに加え、
前記音声認識サーバは、受信した前記通話識別情報により、前記通話・録音情報管理サーバに、録音データの取得要求をし、
前記通話・録音情報管理サーバは、受信した前記通話識別情報により、前記通話・録音情報管理テーブルを検索し、その通話識別情報に対応する録音データを、前記音声認識サーバに転送し、
前記音声認識サーバは、対応する音声認識エンジンにより、前記認識キューに格納された前記通話識別情報に対応する前記録音データを、音声認識して、認識結果をテキストデータとして保持することを特徴とするコールセンタシステム。
【請求項2】
前記業務情報−認識エンジン対応テーブルは、言語ごと、業務の分野・種別ごとに異なった音声認識エンジンの情報を保持することを特徴とする請求項1記載のコールセンタシステム。
【請求項3】
顧客からの呼を録音してデータとして保存するコールセンタシステムにおける音声認識制御方法であって、
前記コールセンタシステムは、
公衆回線網からの呼を内線に着信される交換をおこなう交換機と、
各オペレータが通話するために配置される通話端末と、
各オペレータが操作するオペレータ用情報処理端末と、
前記交換機から送信される通話データを録音して録音データとして保持する録音装置と、
前記交換機から通話に関する通話情報を受取り、前記録音装置から録音データに関する情報を対応付けてデータベースに保持する通話・録音情報管理サーバと、
前記録音データを音声認識してテキストデータを出力する音声認識サーバとを備え、
各装置は、ネットワークにより接続され、
前記通話・録音情報管理サーバは、通話識別情報と、通話の着番号と、録音データの管理情報とを関連付けた通話・録音情報管理テーブルを有し、
前記音声認識サーバは、通話に係る業務識別情報と、通話の着番号と、音声認識に使用する音声認識エンジンを対応付けた業務情報−認識エンジン対応テーブルを有し、
前記オペレータ用情報処理端末が、前記通話・録音情報管理サーバに、前記通話識別情報を送信して、音声認識処理を要求するステップと、
前記通話・録音情報管理サーバは、受信した前記通話識別情報より、通話の着番号を前記通話・録音情報管理テーブルより検索して、前記通話識別情報と、前記通話の着番号を、前記音声認識サーバに送信するステップと、
前記音声認識サーバは、受信した前記通話の着番号により、対応する音声認識エンジンを検索し、前記受信した通話識別情報を、その対応する音声認識エンジンが処理する認識キューに加えるステップと、
前記音声認識サーバは、受信した前記通話識別情報により、前記通話・録音情報管理サーバに、録音データの取得要求をするステップと、
前記通話・録音情報管理サーバは、受信した前記通話識別情報により、前記通話・録音情報管理テーブルを検索し、その通話識別情報に対応する録音データを、前記音声認識サーバに転送するステップと、
前記音声認識サーバは、対応する音声認識エンジンにより、前記認識キューに格納された前記通話識別情報に対応する前記録音データを、音声認識して、認識結果をテキストデータとして保持するステップとを有することを特徴とする音声認識制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コールセンタシステム、および、その音声認識制御方法に係り、特に、コールセンタにおいて、顧客とオペレータとの通話内容の録音内容を、精度高く音声認識するのに好適なコールセンタシステム、および、その音声認識制御方法に関する。
【背景技術】
【0002】
コールセンタやオフィスにおいて、通話先の顧客とオペレータの通話内容を、録音して、後日のトラブルに備えたり、内容をレビューしたりすることがおこなわれている。録音データは、音声認識して、テキストデータに変換することにより、コンピュータシステムで、検索したり表示・印刷できるようになり、業務データとしてより有効活用することができる。
【0003】
コールセンタにおける音声認識技術に関しては、例えば、特許文献1がある。特許文献1のコールセンタ装置は、顧客とのトラブルや通信障害が発生したときに、管理者が通話内容を検証するために、通話内容を録音し、録音データを解析し(音声認識)、その録音データに特定語が含まれていた場合には、管理者端末にその録音データを送信する。
【0004】
さらに、特許文献2には、オペレータ業務支援システムに係る技術において、音声をテキストデータに変換する際に予め指定したキーワードを強調表示する技術が開示されている。この特許文献2のオペレータ業務支援システムでは、電話機から流れるアナログ通話音声を音声認識エンジンに入力し、予め音声認識辞書に単語単位のキーワードを登録しておき、音声テキスト変換し、かつ、キーワード強調表示したテキストデータに変換して、画面に表示している(図8)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−170953号公報
【特許文献2】特開2009−31810号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記特許文献1および特許文献2は、いずれもコールセンタにおいて、通話音声をテキスト変換し、キーワードを検出することにより、作業効率の向上を目指したものである。
【0007】
しかしながら、従来のコールセンタにおける音声認識では、異なる業務ごとに生成される録音データに対して、最適な音声認識をおこなうという観点については考慮されていない。すなわち、音声認識には、言語や専門辞書の別により、最適な認識エンジンを採用しなければならないが、上記従来技術は、そのような観点については、考慮されていないという問題点があった。
【0008】
本発明は、上記問題点を解決するためになされたもので、その目的は、最適な音声認識エンジンを採用することを可能にし、音声認識の認識率を向上させることにより、システムの運営を効率的におこなうことのできるコールセンタシステムを提供することにある。
【課題を解決するための手段】
【0009】
本発明に係るコールセンタシステムは、顧客からの呼を録音してデータとして保存するコールセンタシステムであって、公衆回線網からの呼を内線に着信される交換をおこなう交換機と、各オペレータが通話するために配置される通話端末と、各オペレータが操作するオペレータ用情報処理端末と、交換機から送信される通話データを録音して録音データとして保持する録音装置と、交換機から通話に関する通話情報を受取り、録音装置から録音データに関する情報を対応付けてデータベースに保持する通話・録音情報管理サーバと、録音データを音声認識してテキストデータを出力する音声認識サーバとを備えている。
【0010】
そして、各装置は、ネットワークにより接続され、通話・録音情報管理サーバは、通話識別情報と、通話に係る業務識別情報と、録音データの管理情報とを関連付けた通話・録音情報管理テーブルを有し、音声認識サーバは、通話に係る業務識別情報と、音声認識に使用する音声認識エンジンを対応付けた業務情報−認識エンジン対応テーブルを有している。この構成のもとで、オペレータ用情報処理端末は、通話・録音情報管理サーバに、通話識別情報を送信して、音声認識処理を要求する。次に、通話・録音情報管理サーバは、受信した通話識別情報より、通話に係る業務識別情報を通話・録音情報管理テーブルより検索して、通話識別情報と、その通話識別情報に対応する通話に係る業務識別情報を、音声認識サーバに送信する。次に、音声認識サーバは、受信した通話に係る業務識別情報により、対応する認識エンジンを検索し、受信した通話識別情報を、その対応する認識エンジンが処理する認識キューに加える。次に、音声認識サーバは、受信した通話識別情報により、通話・録音情報管理サーバに、録音データの取得要求をする。
【0011】
次に、通話・録音情報管理サーバは、受信した通話識別情報により、通話・録音情報管理テーブルを検索し、その通話識別情報に対応する録音データを、音声認識サーバに転送する。最後に、音声認識サーバは、対応する認識エンジンにより、認識キューに格納された通話識別情報に対応する録音データを、音声認識して、認識結果をテキストデータとして保持する。
【0012】
また、上記構成において、業務情報−認識エンジン対応テーブルは、言語ごと、業務の分野・種別ごとに異なった認識エンジンの情報を保持している。
【発明の効果】
【0013】
本発明によれば、最適な音声認識エンジンを採用することを可能にし、音声認識の認識率を向上させることにより、システムの運営を効率的におこなうことのできるコールセンタシステムを提供することができる。
【図面の簡単な説明】
【0014】
図1】コールセンタシステムの全体構成図である。
図2】コールセンタシステムの機能関連図である。
図3】音声認識サーバの音声認識部の構成図である。
図4】通話情報・録音情報管理テーブルの一例を示す図である。
図5】業務情報−認識エンジン対応テーブルの一例を示す図である。
図6】PC端末からの要求を受けて、録音データに対して音声認識処理をおこなうときのシーケンス図である。
図7】音声認識処理のキュー設定処理を示すフローチャートである。
図8】キュー検索処理を示すフローチャートである。
図9】認識キューの概念を示す図である。
【発明を実施するための形態】
【0015】
以下、本発明に係る一実施形態を、図1ないし図9を用いて説明する。
【0016】
先ず、図1ないし図3を用いて、本発明の一実施形態に係るコールセンタシステムの構成と処理の概要について説明する。図1は、コールセンタシステムの全体構成図である。図2は、コールセンタシステムの機能関連図である。図3は、音声認識サーバの音声認識部の構成図である。
【0017】
このコールセンタシステムは、図1に示されるように、顧客等の架電者(電話をかける者)の通話端末51から公衆網6を介して接続されるIP−PBX(Internet Protocol−Private Branch eXchange、IP回線対応構内交換機)装置80が、ネットワーク7を介して、オペレータの通話端末50と接続し通話をする構成を有する。オペレータは、オペレータ用PC端末60から通話端末50の電話操作をすることができ、架電者からの着信が、オペレータ用PC端末60に表示されると、PC端末60から応答を操作して、通話端末50が応答動作を実施して架電者とオペレータは、通話状態になる。また、PC端末60では、オペレータ業務を支援するためのオペレータサポートアプリケーション503を実行する。
【0018】
コールセンタシステムは、ネットワーク7を介して、IP−PBX装置80、録音装置30、通話・録音情報管理サーバ10、通話情報取得装置40、音声認識サーバ20、通話端末50、通話端末(オペレータ1用、オペレータ2用、…)50、オペレータ用PC端末60(オペレータ1用、オペレータ2用、…)が接続されて構成されている。
【0019】
IP−PBX装置80は、顧客の通話端末51からの呼を受けて、IP網と公衆網6のプロトコル変換、発着信の呼制御などをおこなう。
【0020】
通話情報取得装置40は、IP−PBX装置から、通話の呼に関する情報(通話時刻、内線番号など)を取得する装置である。
【0021】
録音装置30は、通話端末50でやりとりされる通話のデータストリームを、IP−PBX装置80経由で、録音データとして録音する装置である。録音装置30は、データベースとして、録音DB300をアクセスする。
【0022】
通話・録音情報管理サーバ10は、通話情報と、録音情報を対応付けて管理するためのサーバである。通話・録音情報管理サーバ10は、データベースとして、通話・録音情報管理DB100をアクセスする。
【0023】
音声認識サーバ20は、音声データである録音データをテキストデータに変換するサーバである。音声認識サーバ20は、データベースとして、音声認識管理DB230をアクセスする。
【0024】
通話端末50と、PC端末60は、各オペレータ(オペレータ1、オペレータ2、…)が、オペレータ業務に使う機器である。この内、通話端末50は、顧客の通話端末51と、公衆網6を介した外線による通話をするための装置である。PC端末60は、オペレータが通話端末50の制御をしたり、必要なセンタ情報の表示や、オペレータサポートアプリケーションを実行するための情報処理端末である。
【0025】
次に、図2を用いてコールセンタシステムの各部の機能とデータの関連について説明する。
PC端末60は、通話端末制御部601、オペレータ操作画面表示部602、オペレータサポートアプリケーション603、音声認識要求部604、音声認識結果取得部605、通話・録音情報取得・表示部606の各機能ブロックを有する。
【0026】
通話端末制御部601は、そのオペレータが使っている通話端末50を制御する部分である。
【0027】
オペレータ操作画面表示部602は、オペレータサポートアプリケーション603のためのオペレータ操作画面を表示する部分である。
【0028】
オペレータサポートアプリケーション603は、オペレータ業務を支援するためのアプリケーションソフトウェアであり、例えば、顧客との応対を記録し、管理するための応対記録システム、オペレータ業務のマニュアルを表示するためのマニュアル表示ソフトウェアなどが考えられる。
【0029】
音声認識要求部604は、音声認識サーバ20に対して録音データの音声認識を要求する部分である。
【0030】
音声認識結果取得部605は、音声認識サーバ20に要求した録音データの音声認識結果を受取る部分である。
【0031】
通話・録音情報取得・表示部606は、通話・録音情報管理サーバ10から、通話・録音情報を取得して、操作画面に表示する。
【0032】
通話端末50での通話は、IP網でのRTP(Real−time Transport Protocol)によるものであり、録音装置30に送られて、録音DB300に、一定時間ごとに分割された録音ファイル310として保存される。
【0033】
また、通話情報取得装置は、IP−PBX装置80から通話情報を取得して、通話・録音情報管理サーバ10に送信する。
【0034】
音声認識サーバ20は、音声認識制御部200、音声認識部210、認識結果管理部220からなる。音声認識サーバ20は、音声認識管理DB230をアクセスする。
【0035】
音声認識制御部200は、PC端末60からの音声認識要求を受けて、音声認識部に指示を与える部分である。音声認識部210は、録音データを音声認識エンジン(以下、単に「認識エンジン」ともいう)により、テキストデータに変換する部分である。認識結果管理部220は、音声認識部210が出力するテキストデータをデータベースに格納し、アクセスを管理する部分である。
【0036】
音声認識管理DB230には、業務情報−認識エンジン対応テーブル240と、認識ファイル250が格納される。
【0037】
業務情報−認識エンジン対応テーブル240は、コールセンタにおける業務情報に関する録音データの音声認識に使用する認識エンジンを対応付けるテーブルである。認識ファイル250は、録音データの音声認識の結果、作成されるテキストファイルである。なお、業務情報−認識エンジン対応テーブル240については、後に詳説する。
【0038】
通話・録音情報管理サーバ10は、通話・録音情報登録部101、通話情報出力部102、録音データ転送部103の機能ブロックを有し、通話・録音情報管理DB100を備える。
【0039】
通話・録音情報管理DB100は、通話・録音情報管理テーブル110を格納する。通話・録音情報管理テーブル110は、通話情報と録音情報を対応付けて管理するテーブルである。なお、通話・録音情報管理テーブル110については、後に詳説する。
【0040】
通話・録音情報登録部101は、通話情報取得装置40から通話情報を、録音装置30から録音情報を取得して、通話・録音情報管理DB100に登録する。通話情報出力部102は、音声認識サーバ20の音声認識制御部に対して、通話情報を出力する。録音データ転送部103は、録音装置30の録音DB300に格納されている録音データを、音声認識サーバ20の音声認識部201に転送する。
【0041】
次に、図3を用いて音声認識サーバ20の音声認識部210の詳細な構成について説明する。
音声認識部210は、図3に示されるように、音声入力部212、認識エンジン220、テキスト出力部214からなる。
【0042】
音声入力部212は、外部からの音声データを取り込む部分である。認識エンジン220は、音声認識のアルゴリズム処理をおこなう本体部分である。テキスト出力部214は、認識結果をテキストデータとして出力する部分である。
【0043】
認識エンジン220は、音響分析部222と、認識デコーダ224、認識エンジン230からなる。
【0044】
音響分析部222は、入力された音声データを、認識辞書230の音響モデルや発音辞書に当てはめて、パターン分析をおこなう。
【0045】
認識デコーダ部224では、音響分析部222の解析パターンを入力し、認識辞書230の言語モデルを参照して、デコードし、テキストに変換していく。
【0046】
音声認識辞書230は、専門分野別に分かれており、図3では、認識エンジン220に内包されるように図示しているが、外付けにして必要に応じて参照するようにしてもよい。
【0047】
次に、図4および図5を用いて本実施形態のコールセンタシステムに使用されるデータ構造について説明する。
図4は、通話情報・録音情報管理テーブルの一例を示す図である。図5は、業務情報−認識エンジン対応テーブルの一例を示す図である。
【0048】
通話・録音情報管理テーブル110は、通話端末50における呼にかかる通話と、その録音データの関する情報を管理するためのテーブルであり、通話・録音情報管理サーバ10の通話・録音情報管理DB100に格納される。
【0049】
通話・録音情報管理テーブル110は、図4に示されるように、通話識別ID110a、オペレータID110b、種別110c、内線番号110d、着番号110e、発番号110f、録音ファイルパス110gのフィールドを有する。
【0050】
通話識別ID110aは、通話にかかる呼を一意的に識別するためのIDである。オペレータID110bは、この通話を取り扱ったコールセンタのオペレータの識別子である。種別110は、この呼が発信か着信かを識別するために記録される。内線番号110は、この呼が発着信された内線番号である。着番号110eは、通話が着信する先の通話端末50または通話端末51の電話番号である。発番号は110fは、通話を発信した元の通話端末50または通話端末51の電話番号である。録音ファイルパス110は、この呼の通話が録音されたときの録音ファイルの所在を表す情報である。これは、ファイルパスでもよいし、その録音ファイルを特定する識別子でもよい。
【0051】
業務情報−認識エンジン対応テーブル240は、業務情報とその業務情報の録音データを音声認識するときに使用する認識エンジンの対応を示すテーブルであり、音声認識サーバ20の音声認識管理DB230に格納されている。業務情報−認識エンジン対応テーブル240は、図5に示されるように、業務ID240a、業務名240b、着番号240c、認識エンジン240dのフィールドを有する。
【0052】
業務ID240aは、コールセンタにおける業務をカテゴリー分けしたときの業務の識別子である。業務名240bは、コールセンタにおける業務をカテゴリー分けしたときの業務の名称である。着番号240cは、コールセンタにおけるその業務を担当するときの通話端末50への着番号である。本実施形態では、通話・録音情報管理サーバと音声認識サーバでやり取りされる通話に係る業務情報のキーとして、この着番号を用いることにする。例えば、着番号「03XXXYY01」にかかってきた通話の録音データは、業務名「ヘルプデスク(日本語)」の業務に関するものであり、認識エンジンは、「EngineA1(日本語対応)」のものを用いることが予定されているものとする。業務認識エンジン240dは、その業務の録音データを音声認識するときに使用される認識エンジンの識別名称である。
【0053】
一般に、音声認識は、業務の適用分野(金融、製造業、情報処理分野)、業務形態(ヘルプデスク、苦情受け付け、製品問合せ)などによって、認識辞書を変えるのが望ましく、また、ときには、認識アルゴリズムの変更も必要になることがある。本実施形態では、録音データの適用する業務ごとに、認識エンジンを変えることが可能になり、認識率の向上を図ることができる。
【0054】
次に、図6ないし図8を用いて本発明の一実施形態に係るコールセンタシステムにおいて音声認識処理について説明する。図6は、PC端末からの要求を受けて、録音データに対して音声認識処理をおこなうときのシーケンス図である。図7は、音声認識処理の認識キュー設定処理を示すフローチャートである。図8は、認識キュー検索処理を示すフローチャートである。図9は、認識キューの概念を示す図である。
【0055】
図6の処理の前に、図2で示したように、顧客の通話端末51からコールセンタに着信、あるいは、コールセンタから顧客の通話端末51に発信して、録音装置30の録音DB300に録音ファイル310が格納され、そのときの通話情報が、IP−PBXと通話情報取得装置を介して、通話・録音情報管理サーバ10の通話・録音情報管理DB100の通話・録音情報管理テーブル110に格納されているものとする。また、コールセンタの業務と音声認識に使用される認識エンジンに関して、音声認識サーバ20の業務情報―認識エンジン管理テーブルに適切な値が既に格納されているものとする。
【0056】
先ず、PC端末60から図4に示した通話・録音情報管理テーブル110の内容を表示するユーティリティを起動して、通話・録音情報管理サーバ10に対して、通話・録音情報を要求する(A090)。通話・録音情報管理サーバ10は、これに対して、通話・録音情報を返信する(A092)。図示しないが、そのユーティリティにより、PC端末60には、通話・録音情報管理テーブル110の内容が画面に表形式で表示され、オペレータは、それをマウスなどのポインティングデバイスで指定できるものとする。そのようなユーティリティを操作することにより、PC端末60のオペレータは、通話識別IDを指定して、通話・録音情報管理テーブル110に音声認識要求をおこなう(A10)。
【0057】
これを受けて、通話・録音情報管理サーバ10は、通話識別IDとその対応する着番号を音声認識サーバ20の音声認識制御部200に送信する(A10)。
【0058】
音声認識サーバ20の音声認識制御部200は、受信した通話識別IDとその対応する着番号に基づいて、認識処理キュー設定処理をおこなう(S100)。認識処理キュー設定処理は、後にフローチャートにより詳細に説明する。
【0059】
音声認識サーバ20の音声認識部210は、音声認識制御部200に対して認識対象の問合せをおこなう(A102)。
【0060】
これを受けた音声認識制御部200は、キュー検索処理をおこない(S110)、通話識別IDと認識エンジン種別を、音声認識部210に対して返信する(A104)。キュー検索処理は、後にフローチャートにより詳細に説明する。
【0061】
また、音声認識部210は、通話・録音情報管理サーバ10に対して、通話識別IDを指定して録音データ取得要求をおこなう(A106)。
【0062】
これを受けて通話・録音情報管理サーバ10は、受信した通話識別IDに基づいて、通話・録音情報管理テーブル110をサーチし、対応する録音ファイルパスを得て(S120)、録音装置30の録音データ300の録音ファイル310を読み出して、録音データを、音声認識部210に返信する(A108)
【0063】
音声認識部210では、受信した認識エンジンの名称の認識エンジンにより、受信した録音データの音声認識処理をおこなう(S130)。
【0064】
そして、音声認識部210は、音声認識の結果データを認識結果管理部220に送信し、認識結果管理部220は、音声認識管理DB200の認識ファイル250にテキストファイルとして書き込む(S140)。
【0065】
そして、PC端末60からの認識結果要求があったときに(A111)、認識結果管理部220は、認識結果を返信し(A113)、PC端末60で結果の表示・出力をおこなう(S150)。
【0066】
次に、図7および図9を用いてS100の認識キュー設定処理を説明する。
音声認識サーバ20の音声認識制御部200では、通話・録音管理サーバ10より通話識別IDと着番号を受信する(S102)。
【0067】
そして、業務情報−認識エンジン対応テーブル240を参照し、着番号に対応する認識エンジン名称を検索し、認識エンジンに対応する認識キューに通話識別IDを入れる(S104)。
【0068】
認識キューは、図9に示されるように、通話識別IDが待ち行列として並び、First−In,First−Outで、そのキューに対応する認識エンジンにより音声認識がされるデータ構造である。例えば、キューAには、C001、C020、C022がこの順に入力され、認識エンジンのEngineA1(日本語対応)により、C001、C020、C022の順に音声認識処理がされることを示している。
【0069】
次に、図8を用いてS110のキュー検索処理について説明する。
音声認識サーバ20の音声認識制御部200では、認識キューを検索して、通話識別IDを取得する(S112)。
【0070】
そして、通話識別IDとその認識キューに係る認識エンジン名称を、音声認識部210に送信する(S114)。
【0071】
以上のように、本実施形態によれば、コールセンタの業務ごとに適した音声認識エンジンにより、録音データに対して音声認識がされるので、認識率の向上が見込まれ、より効率的なコールセンタの運用を可能とすることができる。
【符号の説明】
【0072】
6…公衆網
7…ネットワーク
10…通話・録音情報管理サーバ、
20…音声認識サーバ
200…音声認識制御部
210…音声認識部
220…認識結果管理部
30…録音装置
40…通話情報取得装置
50…通話端末(オペレータ)
51…通話端末(顧客)
60…PC端末(オペレータ)
80…IP−PBX装置
図1
図2
図3
図4
図5
図6
図7
図8
図9