特許第6875905号(P6875905)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立情報通信エンジニアリングの特許一覧

<>
  • 特許6875905-通話制御システム及び通話制御方法 図000002
  • 特許6875905-通話制御システム及び通話制御方法 図000003
  • 特許6875905-通話制御システム及び通話制御方法 図000004
  • 特許6875905-通話制御システム及び通話制御方法 図000005
  • 特許6875905-通話制御システム及び通話制御方法 図000006
  • 特許6875905-通話制御システム及び通話制御方法 図000007
  • 特許6875905-通話制御システム及び通話制御方法 図000008
  • 特許6875905-通話制御システム及び通話制御方法 図000009
  • 特許6875905-通話制御システム及び通話制御方法 図000010
  • 特許6875905-通話制御システム及び通話制御方法 図000011
  • 特許6875905-通話制御システム及び通話制御方法 図000012
  • 特許6875905-通話制御システム及び通話制御方法 図000013
  • 特許6875905-通話制御システム及び通話制御方法 図000014
  • 特許6875905-通話制御システム及び通話制御方法 図000015
  • 特許6875905-通話制御システム及び通話制御方法 図000016
  • 特許6875905-通話制御システム及び通話制御方法 図000017
  • 特許6875905-通話制御システム及び通話制御方法 図000018
  • 特許6875905-通話制御システム及び通話制御方法 図000019
  • 特許6875905-通話制御システム及び通話制御方法 図000020
  • 特許6875905-通話制御システム及び通話制御方法 図000021
  • 特許6875905-通話制御システム及び通話制御方法 図000022
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6875905
(24)【登録日】2021年4月27日
(45)【発行日】2021年5月26日
(54)【発明の名称】通話制御システム及び通話制御方法
(51)【国際特許分類】
   H04M 3/51 20060101AFI20210517BHJP
   G10L 19/00 20130101ALI20210517BHJP
   G10L 15/00 20130101ALI20210517BHJP
【FI】
   H04M3/51
   G10L19/00 312E
   G10L15/00 200B
【請求項の数】6
【全頁数】19
(21)【出願番号】特願2017-65885(P2017-65885)
(22)【出願日】2017年3月29日
(65)【公開番号】特開2018-170613(P2018-170613A)
(43)【公開日】2018年11月1日
【審査請求日】2020年3月9日
(73)【特許権者】
【識別番号】000233295
【氏名又は名称】株式会社日立情報通信エンジニアリング
(74)【代理人】
【識別番号】110001689
【氏名又は名称】青稜特許業務法人
(72)【発明者】
【氏名】仲 庸
(72)【発明者】
【氏名】杉山 隆司
【審査官】 西巻 正臣
(56)【参考文献】
【文献】 特開2015−177411(JP,A)
【文献】 特開2011−029688(JP,A)
【文献】 特開2015−198358(JP,A)
【文献】 特開2016−119634(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F19/00
G06Q10/00−10/10
30/00−30/08
50/00−50/20
50/26−99/00
G10L15/00−17/26
H04M3/00
3/16−3/20
3/38−3/58
7/00−7/16
11/00−11/10
(57)【特許請求の範囲】
【請求項1】
通話端末による通話の音声データを認識して表示する通話制御システムであって、
通話を録音する通話録音装置と、
前記音声データを音声認識してテキスト化する音声認識装置と、
前記音声認識装置の認識結果を格納する認識結果管理装置と、
表示手段と音声出力手段とを有する情報処理装置とを備え、
各装置は、ネットワークにより接続され、
前記通話録音装置は、通話の音声データを前記音声認識装置に送信して、
前記音声認識装置は、前記音声データの認識結果を前記認識結果管理装置に送信し、
前記認識結果管理装置は、キーワード情報テーブルを保持し、テキスト化された前記音声データの認識結果からキーワードを検知して、前記キーワードを含む通話の録音情報と前記音声認識の認識結果を対応付けて格納し、
前記情報処理装置は、内線番号をキーとして、前記認識結果管理装置に、前記キーワードを含む通話の録音情報と前記音声認識の認識結果の送信を要請し、
前記認識結果管理装置は、前記内線番号に該当する前記キーワードを含む通話の録音情報と前記音声認識の認識結果を、前記情報処理装置に送信し、
前記情報処理装置は、前記キーワードを含む通話の音声認識の認識結果を前記表示手段に表示し、
前記情報処理装置は、音声再生の指示が入力されたときに、前記表示手段により表示されたテキストと関連付けられた録音情報を前記通話録音装置に送信し、
前記通話録音装置は、前記録音情報に対応する音声データを、前記情報処理装置に送信し、
前記情報処理装置は、前記録音情報に対応する音声データを再生し、
前記キーワードを含む通話の音声認識の認識結果は、吹き出しとして表示され、
前記情報処理装置は、前記吹き出しを指示されることにより、前記吹き出しに係る通話の該当箇所から再生することを特徴とする通話制御システム。
【請求項2】
前記音声データは、過去の通話を再生する追いかけ再生では、録音された音声データであり、現在の通話を聴取する聴話再生では、前記通話録音装置に入力されるストリームのデータであることを特徴とする請求項1記載の通話制御システム。
【請求項3】
前記情報処理装置は、追いかけ再生の音声データを再生していたときに、過去の音声データがなくなったと判定したときには、前記通話録音装置に対して聴話再生の要請をすることを特徴とする請求項2記載の通話制御システム。
【請求項4】
通話端末による通話の音声データを認識して表示する通話制御システムの通話制御方法であって、
前記通話制御システムは、
通話を録音する通話録音装置と、
前記音声データを音声認識してテキスト化する音声認識装置と、
前記音声認識装置の認識結果を格納する認識結果管理装置と、
表示手段と音声出力手段とを有する情報処理装置とを備え、
各装置は、ネットワークにより接続され、
前記通話録音装置は、通話の音声データを前記音声認識装置に送信するステップと、
前記音声認識装置は、前記音声データの認識結果を前記認識結果管理装置に送信するステップと、
前記認識結果管理装置は、キーワード情報テーブルを保持し、テキスト化された前記音声データの認識結果からキーワードを検知して、前記キーワードを含む通話の録音情報と前記音声認識の認識結果を対応付けて格納するステップと、
前記情報処理装置は、前記内線番号をキーとして、前記認識結果管理装置に、前記キーワードを含む通話の録音情報と前記音声認識の認識結果の送信を要請するステップと、
前記認識結果管理装置は、前記内線番号に該当する前記キーワードを含む通話の録音情報と前記音声認識の認識結果を、前記情報処理装置に送信するステップと、
前記情報処理装置は、前記キーワードを含む通話の音声認識の認識結果を前記表示手段に表示するステップと、
前記情報処理装置は、音声再生の指示が入力されたときに、前記表示手段により表示されたテキストと関連付けられた録音情報を前記通話録音装置に送信するステップと、
前記通話録音装置は、前記録音情報に対応する音声データを、前記情報処理装置に送信するステップと、
前記情報処理装置は、前記録音情報に対応する音声データを再生するステップとを有し、
前記キーワードを含む通話の音声認識の認識結果は、吹き出しとして表示され、
前記情報処理装置は、前記吹き出しを指示されることにより、前記吹き出しに係る通話の該当箇所から再生することを特徴とする通話制御方法。
【請求項5】
前記音声データは、過去の通話を再生する追いかけ再生では、録音された音声データであり、現在の通話を聴取する聴話再生では、前記通話録音装置に入力されるストリームのデータであることを特徴とする請求項4記載の通話制御方法。
【請求項6】
前記情報処理装置は、追いかけ再生の音声データを再生していたときに、過去の音声データがなくなったと判定したときには、前記通話録音装置に対して聴話再生の要請をすることを特徴とする請求項5記載の通話制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通話制御システム及び通話制御方法に係り、特に、コールセンタにおいて、顧客とオペレータとの通話内容をスーパバイザが同時に複数通話を監視する状況で、スーパバイザが顧客とオペレータとのやり取りをリアルタイムで把握し、トラブルや顧客からのクレームに適切に対処するのに好適な通話制御システム及び通話制御方法に関する。
【背景技術】
【0002】
コールセンタやオフィスにおいて、通話先の顧客とオペレータの通話内容にトラブルが発生した場合や発生しそうになった場合には、オペレータはスーパバイザ(コールセンタの監視者、業務の監督者)にアラート要請を出して、サポートを求めることがある。
【0003】
また、スーパバイザは、オペレータからのアラート要請の有無に関わらず、オペレータの通話内容を評価し、トラブルを予防したり、トラブルが発生した場合には、適切な対処をする必要がある。このようにスーパバイザがオペレータの通話内容を評価して、対応するための技術としては、例えば、特許文献1がある。特許文献1のコールセンタ装置は、顧客とオペレータ通話が終了した後に、通話内容に予め登録した特定語が含まれるかを自動的に確認して、含まれていた場合には、スーパバイザへ録音データ(音声録音ファイル)と、この録音データに対応付けられている録音データ識別子を、スーパバイザに通知するものである(図2、S105、段落番号0030)。
【0004】
さらに、特許文献2には、通話に所定のキーワードが含まれているときに、座席表示ウィンドウに通話内容を吹き出しとして表示して(図11)、スーパバイザがオペレータと顧客のやり取りをリアルタイムで把握し、適切な対処をする通話監視方法が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−170953号公報
【特許文献2】特開2016−119634号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記特許文献2記載の技術によれば、所定のキーワード(顧客とのやり取りで問題があると認識されるNGワード)が含まれる通話に対して、スーパバイザがオペレータと顧客のやり取りをリアルタイムで把握でき、また、別画面(図12)により詳細な通話の内容を確認することも可能である。
【0007】
しかしながら、スーパバイザは、問題のありそうな通話の内容をテキストにより確認するのみであり、スーパバイザが実際の通話をダイレクトに聴取するという仕組みは提供されていない。
【0008】
本発明の目的は、コールセンタにおいて、顧客とオペレータとの通話内容をテキスト表示可能な環境で、スーパバイザが実際の通話をダイレクトに聴取することにより、スーパバイザの監視業務の効率化と、オペレータの顧客への応対品質を向上させることのできる通話制御システム及び通話制御方法を提供することにある。
【課題を解決するための手段】
【0009】
本発明に係る通話制御システムは、好ましくは、通話端末による通話の音声データを認識して表示する通話制御システムであって、通話を録音する通話録音装置と、音声データを音声認識してテキスト化する音声認識装置と、音声認識装置の認識結果を格納する認識結果管理装置と、表示手段と音声出力手段とを有する情報処理装置とを備え、各装置は、ネットワークにより接続され、通話録音装置は、通話の音声データを音声認識装置に送信して、音声認識装置は、音声データの認識結果を認識結果管理装置に送信し、認識結果管理装置は、キーワード情報テーブルを保持し、テキスト化された音声データの認識結果からキーワードを検知して、キーワードを含む通話の録音情報と音声認識の認識結果を対応付けて格納し、情報処理装置は、内線番号をキーとして、認識結果管理装置に、キーワードを含む通話の録音情報と音声認識の認識結果の送信を要請し、認識結果管理装置は、内線番号に該当するキーワードを含む通話の録音情報と音声認識の認識結果を、情報処理装置に送信し、情報処理装置は、キーワードを含む通話の音声認識の認識結果を表示手段に表示し、情報処理装置は、音声再生の指示が入力されたときに、表示手段により表示されたテキストと関連付けられた録音情報を録音装置に送信し、録音装置は、録音情報に対応する音声データを、情報処理装置に送信し、情報処理装置は、録音情報に対応する音声データを再生するようにしたものである。
【発明の効果】
【0010】
本発明によれば、コールセンタにおいて、顧客とオペレータとの通話内容をテキスト表示可能な環境で、スーパバイザが実際の通話をダイレクトに聴取することにより、スーパバイザの監視業務の効率化と、オペレータの顧客への応対品質を向上させることのできる通話制御システム及び通話制御方法を提供することができる。
【図面の簡単な説明】
【0011】
図1】一実施形態に係る通話制御システムの全体構成図である。
図2】通話録音装置の構成を示すブロック図である。
図3】音声認識装置の構成を示すブロック図である。
図4】認識結果管理装置の構成を示すブロック図である。
図5】PC端末の構成を示すブロック図である。
図6】IP内線情報テーブルの一例を示す図である。
図7】録音情報テーブルの一例を示す図である。
図8】音声データテーブルの一例を示す図である。
図9】聴話情報テーブルの一例を示す図である。
図10】認識結果テーブルの一例を示す図である。
図11】キーワード情報テーブルの一例を示す図である。
図12】キーワード検知情報テーブルの一例を示す図である。
図13】音声データリストの一例を示す図である。
図14】外部からの通話端末の発信から、PC端末に認識結果を表示するまでの一連の処理を示すシーケンス図である。
図15】追いかけ再生の処理を示すシーケンス図である。
図16】聴話再生の処理を示すシーケンス図である。
図17】追いかけ再生と聴話再生の関係を示す概念図である。
図18】座席図表示画面を示した図である。
図19】通話内容表示画面を示した図である。
図20】追いかけ再生画面の一例を示す図である。
図21】モニタリング再生画面の一例を示す図である。
【発明を実施するための形態】
【0012】
以下、本発明に係る一実施形態を、図1ないし図21を用いて説明する。
【0013】
先ず、図1を用いて一実施形態に係る通話制御システムの構成と処理の概要について説明する。
【0014】
本実施形態の通話制御システムは、コールセンタに使われるコールセンタシステムを例にとり説明する。
【0015】
このコールセンタシステムは、図1に示されるように、顧客等の架電者(電話をかける者)の通話端末101から公衆網102を介して接続されるIP−PBX(Internet Protocol−Private Branch eXchange、IP回線対応構内交換機)装置103が、ネットワーク114を介して、オペレータの通話端末111と接続し通話をする構成を有する。オペレータは、オペレータ用PC端末112から通話端末111の電話操作をすることができ、架電者からの着信が、オペレータ用PC端末112に表示されると、PC端末112から応答を操作して、通話端末111が応答動作を実施して架電者とオペレータは通話状態になる。
【0016】
コールセンタシステムには、オペレータを管理・監督するスーパバイザが居て、通話端末111とスーパバイザ用PC端末113により、状況を監視したり必要なときには、それらの操作を行う。スーパバイザ用PC端末113は、PC端末112が有する通話端末電話制御機能に加えて、管理者用のコールセンタ運用情報を表示する管理ツールが動作している。また、スーパバイザ用PC端末113は、図示していないが、通常の表示用のディスプレイと、音声を聴くためのソフトウェアと、ヘッドフォン装置などの音声出力部を有する。
【0017】
コールセンタシステムには、ネットワーク114を介して、IP−PBX装置103、CTI(Computer Telephony Integration)サーバ装置104、IVR(Interactive Voice Response)装置105、通話録音装置106、通話録音管理装置107、音声認識制御装置108、音声認識装置109、認識結果管理装置110が接続して構成される。
【0018】
IP−PBX装置103は、IP網と公衆網102のプロトコル変換、発着信の制御などを行う。CTIサーバ装置104は、コールセンタでの呼制御の中核となる装置であり、コールセンタの状況を管理し、IP−PBX装置103から受取った呼の状態情報をオペレータ用PC端末112、スーパバイザPC端末113に送信するなどの機能を有する。IVR(Interactive Voice Response)装置105は、架電者からの呼に対して、ガイダンス誘導などの一次音声応答等の音声処理を行う装置である。通話録音装置106は、通話録音処理による録音データを作成する装置である。通話録音管理装置107は、録音データやこれに付加する通話情報を管理して、通話録音装置に音声認識を行う音声認識装置109を指定する装置である。音声認識制御装置108は、通話録音管理装置107から音声認識の要求があったときに、音声認識装置109の使用状況やハードウェアの付加を考慮して、複数の音声認識装置109から選択して、音声認識装置109を表す識別子を通話録音管理装置107に返す装置である。音声認識装置109は、音声認識エンジンを搭載し、要求に応じて録音された通話音声からキーワードを取り出したり、通話テキストに変換する装置である。認識結果管理装置110は、音声認識装置109が認識してテキスト化したデータを管理する装置である。
【0019】
次に、図2ないし図5を用いて通話制御システムの各部の構成の詳細について説明する。
【0020】
先ず、図2を用いて通話録音装置の構成について説明する。
【0021】
通話録音装置106は、図2に示されるように、ネットワークI/F(InterFace)部1061、録音部1062、認識音声制御部1063、端末I/F部1064、記憶部1065を有する。ネットワークI/F(InterFace)部1061は、IPネットワークとのインタフェースを司り、RTPパケットを受信する構成部である。録音部1062は、RTPパケットにより通話の録音をする構成部である。認識音声制御部1063は、録音した音声データを音声認識装置に送信する構成部である。端末I/F部1064は、オペレータ用PC端末112、スーパバイザ用PC端末113とのインタフェースを司る構成部である。記憶部1065は、テーブルやデータを格納する構成部である。通話録音装置106の記憶部1065には、IP内線情報テーブル1066、録音情報テーブル1067、音声データテーブル1068、音声データファイル1069、聴話情報テーブル1067が格納されている。なお、各テーブルの詳細については、後述する。
【0022】
次に、図3を用いて音声認識装置109の構成について説明する。
【0023】
音声認識装置109は、図3に示されるように、認識音声受信部1091、認識エンジン1092、認識結果管理装置I/F部1093、記憶部1094を有する。認識音声受信部1091は、通話録音装置106から音声データを受信する構成部である。認識エンジン1092は、音声データを音声認識してテキスト化する構成部である。認識結果管理装置I/F部1093は、認識結果管理装置110とのインタフェースを司る構成部である。記憶部1095は、テーブルやデータを格納する構成部である。音声認識装置109の記憶部1094には、認識結果テーブル1095が格納されている。なお、テーブルの詳細については、後述する。
【0024】
次に、図4を用いて認識結果管理装置110の構成について説明する。
【0025】
認識結果管理装置110は、図4に示されるように、キーワード検知部1101、認識結果編集部1102、音声認識装置I/F部1103、端末I/F部1104、記憶部1106を有する。キーワード検知部1101は、音声認識装置109から受取った認識結果のテキストの中の所定のキーワードを検知する構成部である。認識結果編集部1102は、キーワードを検知したテキストをPC端末113に送信するために編集する構成部である。音声認識装置I/F部1103は、音声認識装置109とのインタフェースを司る構成部である。端末I/F部1104は、オペレータ用PC端末112、スーパバイザ用PC端末113とのインタフェースを司る構成部である。記憶部1105は、テーブルやデータを格納する構成部である。認識結果管理装置110の記憶部1105には、キーワード情報テーブル1106、認識結果テーブル1107、キーワード検知情報テーブル1108が格納されている。なお、テーブルの詳細については、後述する。
【0026】
次に、図5を用いてスーパバイザ用PC端末113の構成について説明する。
【0027】
スーパバイザ用PC端末113は、図5に示されるように、電話制御部1131、通話操作部1132、管理ツール処理部1133、通話録音装置I/F部1134、認識結果管理装置I/F部1135、記憶部1136を有する。電話制御部1131は、PC端末113より接続された通話端末111を制御する構成部である。通話操作部1132は、通話に関する音声データを再生する構成部である。管理ツール処理部1133は、PC端末にインストールされた管理ツール(ユーティリティプログラム)を処理する構成部である。通話録音装置I/F部1134は、通話録音装置106とのインタフェースを司る構成部である。認識結果管理装置I/F部1135は、認識結果管理装置110とのインタフェースを司る構成部である。記憶部1136は、テーブルやデータを格納する構成部である。PC端末113の記憶部1136には、音声データリスト1137が格納されている。なお、音声データリスト1137の詳細については、後述する。
【0028】
次に、図6ないし図13を用いて通話制御システムに用いられるデータ構造について説明する。
【0029】
IP内線情報テーブル1066は、図6に示されるように、内線番号とIPアドレス対応テーブルの対応付けを示すテーブルであり、通話録音装置106に保持される。IP内線情報テーブル1066は、内線番号1066aのフィールドの内線番号の111が、IPアドレス対応テーブル1066bのフィールドのIPアドレスを有することを意味している。
【0030】
録音情報テーブル1067は、通話の録音に関する情報を保持するためのテーブルであり、通話録音装置106に保持される。録音情報テーブル1067は、図7に示されるように、通話録音装置ID1067a、録音ID1067b、録音開始時刻1067c、IPアドレス1067d、音声データファイル1067eの各フィールドを有する。通話録音装置ID1067aには、通話録音装置106を識別するためのIDが格納される。録音ID1067bには、通話録音のエントリを識別するためのIDが格納される。録音開始時刻1067cには、通話録音の開始時刻が格納される。IPアドレス1067dには、通話に係る通話端末111のIPアドレスが格納される。音声データファイル1067eには、音声ファイルのファイル名(ファイルシステム上のパス名)が格納される。
【0031】
音声データテーブル1068は、図8に示されるように、音声データIDと音声データファイルの対応付けを示すテーブルであり、通話録音装置106に保持される。音声データテーブル1068は、音声データID1068aのフィールドの音声データの識別子と、音声データファイル1068bのフィールドの音声データファイル名が対応していることを意味している。
【0032】
聴話情報テーブル1069は、図9に示されるように、聴話IDと音声データファイルの対応付けを示すテーブルであり、通話録音装置106に保持される。聴話情報テーブル1069は、聴話ID1069aのフィールドの聴話の識別子と、音声データファイル1069bのフィールドの音声データファイル名が対応していることを意味している。
【0033】
認識結果テーブル1095は、音声認識結果に関する情報を保持するためのテーブルであり、音声認識装置109に保持され、さらに、認識結果管理装置110にコピーされて、認識結果テーブル1107として保持される。認識結果テーブル1095は、図10に示されるように、通話録音装置ID1095a、録音ID1095b、内線番号1095c、通話ID1095d、発話ID1095e、発話日時1095f、認識結果テキスト1095gの各フィールドを有する。通話録音装置ID1095aには、通話録音装置106を識別するためのIDが格納される。録音ID1095bには、通話録音のエントリを識別するためのIDが格納される。内線番号1095cには、通話端末111のセンタにおける内線番号が格納される。通話ID1095dには、通話を識別するためのIDが格納される。発話ID1095eには、発話を識別するためのIDが格納される。ここで、発話とは、通話を区切った単位であり、音声認識装置109は、音声認識をするときの単位として取り扱い、発話ごとに認識結果としてファイルに保存する。発話日時1095fは、発話の開始した時刻が格納される。認識結果テキスト1095gには、発話をテキスト化したときのテキストファイル名が格納される。
【0034】
キーワード情報テーブル1107は、スーパバイザが、オペレータと顧客の通話を監視するために、着目するキーワードを予め設定するキーワードに関する情報を格納するためのテーブルであり、認識結果管理装置110に保持される。キーワード情報テーブル1107は、図11に示されるように、キーワード種別1107a、キーワード文字列1107bの各々のフィールドを有する。キーワード種別1107aには、キーワードの分類の種別が格納される。キーワード文字列1107bには、そのキーワードの文字列が格納される。例えば、図11では、キーワード種別1107aが「オペレータ謝罪」は、オペレータが顧客に謝罪するためのキーワードであり、「申し訳ございません」、「できません」などがこれに該当することを示している。また、キーワード種別1107aが「顧客感情」は、顧客の感情を推定できるキーワードであり、図11では、「ふざけるな」がこれに該当する。また、キーワードの分類の種別は、「特定語」、「必須語」などの分類を設けて、センタにおける通話の統計、品質分析、オペレータの教育に用いることも可能である。
【0035】
キーワード検知情報テーブル1108は、キーワードの検知した情報を通話ごとに保持するためのテーブルであり、認識結果管理装置110に保持される。キーワード検知情報テーブル1108は、図12に示されるように、録音ID1108a、通話ID1108b、発話ID1108c、キーワード種別1108d、キーワード文字列1108e、出現件数1108fの各フィールドを有する。録音ID1108aには、通話録音のエントリを識別するためのIDが格納される。通話ID1108bには、通話を識別するためのIDが格納される。発話ID1108cには、発話を識別するためのIDが格納される。キーワード種別1108d、キーワード文字列1108eには、それぞれ検知したキーワードの種別と文字列が格納される。出現件数1108fには、そのキーワード文字列の通話における出現件数のトータル値が格納される。
【0036】
音声データリスト1137は、図13に示されるように、通話録音装置106に格納されている音声にアクセスするためにPC端末113が保持するリストである。音声データリスト1137は、キュー構造で、音声データを表す識別子である音声データIDを保持する。
【0037】
次に、図14ないし図17を用いて通話制御システムの処理の詳細について説明する。
【0038】
先ず、図14を用いて外部からの通話端末の発信から、PC端末に認識結果を表示するまでの一連の処理について説明する。
【0039】
先ず、顧客の通話端末101から発呼され(A01)、IP−PBX装置103で交換処理されて、コールセンタのオペレータの通話端末111に着呼したとする(A02)。
【0040】
IP−PBX装置103から通話端末111には、RTPパケットが送信されるが、IP−PBX装置103は、同時にコピーしたRTPパケットを通話録音装置106に転送する(A03)。
【0041】
通話録音装置106は、通話開始がされたことを、内線番号をパラメタとし、通話録音管理装置107に報告して(A04)、RTPパケットに基づいて、分割録音を開始し(S04a,S04b,…)、図6に示したIP内線情報テーブル1060を参照し、図7に示した録音情報テーブル1067に必要な情報を書き込む。
【0042】
通話録音管理装置107は、受信した内線番号をキーとして、通話認識情報テーブル(図示せず)を参照して、その内線番号にかかってきた電話に音声認識を行うか否かを判定する(S02)。通話認識情報テーブルには、内線番号ごとに、その内線番号にかかってきた通話に対して、リアルタイムで音声認識を行うか否かの情報がふくまれているものとする。通話録音管理装置107は、その通話がリアルタイム音声認識を行うべきものと判定したときに、音声認識制御装置108に、音声認識を行う音声認識装置109を問い合わせる(A05)。音声認識制御装置108は、複数の音声認識装置109の使用状態、負荷を管理しており、音声認識制御装置108は、現段階での最も使用するのが相応しい音声認識装置109を判定し(S03)、その音声認識装置109のIDを認識装置IDとして、通話録音管理装置107に返答する(A06)。そして、通話録音管理装置107は、その認識装置IDを通話録音装置106に転送する(A07)。
【0043】
通話録音装置106は、その認識装置IDを受取り、音声認識を行うべき音声データをその認識IDに対応する音声認識装置109に転送する(A08)。ここで、認識装置IDは、音声認識装置109のIPアドレスでもよいし、その認識装置IDに対応して、音声認識装置109をアクセスする仕組みを通話録音装置106が有するようにしてもよい。
【0044】
音声認識装置109は、通話録音装置106から送信されてきた音声データに対して、音声認識を行う(S04)。ここで、通話録音装置106からは、音声データの外に、通話録音装置ID、録音ID、録音開始日時、内線番号がパラメタとして送信される。そして、音声認識装置109は、音声認識の結果を図10に示す認識結果テーブル1095に書き込む。次に、音声認識装置109は、認識結果テーブル1095に書き込まれた情報を、認識結果管理装置110に転送する(A09)。
【0045】
認識結果管理装置110は、図11に示されたキーワード情報テーブル1107を参照し、キーワードを検知して(S05)、キーワード検知情報テーブル1108にキーワードに関する情報を書き込む。
【0046】
そして、スーパバイザ用PC端末113から内線番号をパラメタして、録音情報と認識結果の送信を認識結果管理装置110に要請する(A10)。それを受けて、スーパバイザ用PC端末113に表示できるデータ形式に編集して(S06)、認識結果を送信する(A11)。ここで、少なくとも、録音ID、発話日時、キーワードと関連付けた認識結果のテキストが認識結果管理装置110から送信される。認識結果管理装置110とスーパバイザ用PC端末113の最も一般的なインタフェースとしては、認識結果管理装置110がWebサーバとなり、認識結果をHTML(HyperText Markup Language)形式にして、スーパバイザ用PC端末113に転送することが考えられる。そして、スーパバイザ用PC端末113は、Webブラウザの機能により認識結果を、通話に関する情報(例えば、内線番号)と、認識結果のテキストと関連付けて表示する。また、それに限らず、認識結果管理装置110が独自のフォーマットで編集し、スーパバイザ用PC端末113に専用のアプリケーションソフトウェアをインストールして、編集結果を表示するようにしてもよい。
【0047】
スーパバイザ用PC端末113は、画面にキーワードを含む認識結果を表示する(S07)。スーパバイザ用PC端末113でのユーザインタフェースについては、後に詳説する。
【0048】
次に、図15を用いて追いかけ再生の処理について説明する。
【0049】
通話録音装置106がRTPを分割録音する所は、図14の場合と同様である(A03、S04a,S04b,…)。
【0050】
ここで、スーパバイザ用PC端末113から追いかけ再生の指示がされたものとする(S10)。追いかけ再生は、オペレータと顧客が現在通話中の通話に対して、スーパバイザがモニタするために、その通話の録音された音声データを再生して(望ましくは、x倍速再生(早送り再生))、聴取することである。なお、スーパバイザ用PC端末113から追いかけ再生の指示をするユーザインタフェースについては、後に詳説する。
【0051】
これを受けて、スーパバイザ用PC端末113は、録音IDをパラメタとして、通話録音装置106に追いかけ再生の指示を行う(A20)。
【0052】
通話録音装置106は、その録音IDに係る音声データの音声データIDを作成し、図8に示す音声データテーブル1068に音声データファイルと対にして書き込む(S11)。そして、一定時間毎に、音声データIDをスーパバイザ用PC端末113に送信する(A21)。スーパバイザ用PC端末113は、図13に示すように、音声データIDを音声データリスト1135に格納する。次に、スーパバイザ用PC端末113は、録音IDと受信した音声データリストの音声データIDをペアのパラメタにして、音声再生要求を行ない(A22)、通話録音装置106は、対応する音声データファイルの音声データをスーパバイザ用PC端末113に送信して(A23)、スーパバイザ用PC端末113で音声再生が行なわれる(S12)。
【0053】
次に、図16及び図17を用いて聴話再生の処理について説明する。
【0054】
聴話再生とは、オペレータと顧客の通話をスーパバイザがダイレクトに聴くことを意味する。聴話再生は、必ず×1倍速である。
【0055】
先ず、図17を用いて本実施形態の通話制御システムにおける追いかけ再生と聴話再生の関係について説明する。スーパバイザが図17(a)に示されるように、×2倍速でオペレータと顧客の通話を追いかけ再生で聴取しており、図17(b)に示されるように、時刻t0で追いついたものとする。このときに、スーパバイザ用PC端末113の通話操作部1132は、自動的に聴話再生に切り替えるものとする。スーパバイザ用PC端末113が追いかけ再生から聴話再生に切り換えるタイミングは、録音結果管理装置110から音声IDが得られなくなったとき、すなわち、録音した音声データがなくなったときである。
【0056】
先ず、通話録音装置106がRTPを分割録音する所は、図14図15の場合と同様である(A03、S04a,S04b,…)。
【0057】
ここで、スーパバイザ用PC端末113から聴話再生の指示がされたものとする(S20)。スーパバイザ用PC端末113からの聴話再生の指示は、スーパバイザが明示的に指定するか、上述のように、追いかけ再生時に再生が追いついた場合である。なお、スーパバイザ用PC端末113から聴話再生の指示をするユーザインタフェースについては、後に詳説する。
【0058】
これを受けて、スーパバイザ用PC端末113は、録音IDをパラメタとして、通話録音装置106に聴話再生の指示を行う(A30)。
【0059】
通話録音装置106は、聴話IDを作成し、図9に示す聴話情報テーブル1070に音声データファイルと対にして書き込む(S11)。そして、一定時間毎に、聴話IDをスーパバイザ用PC端末113に送信する(A31)。次に、スーパバイザ用PC端末113は、受信した聴話IDパラメタとして、聴話開始要求を行ない(A32)、通話録音装置106は、対応する音声データファイルの音声データをスーパバイザ用PC端末113に送信して(A33)、スーパバイザ用PC端末113で聴話再生が行なわれる(S21)。
【0060】
次に、図18ないし図21を用いてスーパバイザ用PC端末におけるユーザインタフェースについて説明する。
【0061】
コールセンタの運用時には、スーパバイザ用PC端末113には、オペレータの状況を監視するために、例えば、図18に示されるように、座席図表示画面600を表示する。また、内線番号1002の「日立花子」の座席図の所に示されているように、キーワードの出現件数の多いオペレータの座席には警告アイコンが表示される。
【0062】
座席図表示画面600では、座席枠の各々に対して、内線番号とオペレータの名前が図示されており、そのオペレータのイラストから、直接、キーワード表示吹き出し610が表示されている。
【0063】
スーパバイザは、キーワード表示吹き出し610をクリックすることにより、図19に示した通話内容表示画面700を開くことができる。通話内容表示画面700には、通話内容表示吹き出し710が表示されている。通話内容表示画面700に表示される通話内容表示吹き出し701は、クリックしたキーワード表示吹き出し610a以降の録音された通話を音声した認識をテキスト表示したものである。すなわち、座席枠に該当する通話端末が、該当内線番号により通話した内容をテキスト化したものが表示される。
【0064】
通話内容表示吹き出し710a、710cは、オペレータ会話した内容を示した吹き出しであり、701bは顧客が会話した内容を示した吹き出しとなる。登録されているキーワードには、視認しやすいように、その単語を赤色で表示したり、線を引いたりする。例えば、HTMLを画面に表示するときには、そのキーワードを所定のタグで修飾すればよい。また、キーワードが含まれている吹き出し全体の色を変更して、そうでないものと区別するようにしてもよい。オペレータと顧客は左側と右側から吹き出す方向を分けることによって、どちらが会話したのか目視できるようにしている。また、通話内容表示吹き出し710の色やバックグラウンドのパターン、囲む線のタイプにより、オペレータと顧客の区別をするようにしてもよい。
【0065】
通話内容吹き出し701aは、オペレータが14時43分10秒に「お客様がご希望された処理を賜る事ができません。」と会話したことを示しており、通話内容吹き出し703は、顧客が14時43分25秒に「どうしてできないんですか?」と会話したことを示しており、通話内容吹き出し704は、オペレータが14時43分40秒に「まことに、申し訳ございません。」と会話したことを示している。なお、録音の分割は、例えば、15秒毎に行われるものとしており、表示される時刻は、録音時刻である。
【0066】
ここで、スーパバイザが通話の追いかけ再生をするときには、通話内容吹き出し701a、701b、701cの部分をマウスにより、クリックする。この操作により、図20に示した追いかけ再生画面300が表示され、その通話内容吹き出し701a、701b、701cに係る通話が該当個所から追いかけ再生して、スーパバイザが通話の音声データを再生して、聴取できるようになる。
【0067】
追いかけ再生画面300は、閉じるボタン301、通話情報欄310、モニタリング再生ボタン314、音声操作パネル320、チャプターリスト欄340よりなる。
【0068】
閉じるボタン301は、この画面を閉じるためのボタンである。モニタリング再生ボタン315は、図21に示したモニタリング再生画面400に遷移するためのボタンである。
【0069】
通話情報欄310は、該当の通話に係る情報を表示する欄であり、開始日時311、種別312、内線番号313に、それぞれ、その通話の開始日時、着信、発信の別、センタにおける内線番号が表示される。
【0070】
音声操作パネル320は、通話音声を再生するための情報の表示や操作を行うパネルである。音声操作パネル320には、操作ボタンとして、(最初へ)ボタン321、(前へ)ボタン322、(少し戻る)ボタン323、(再生)(一時停止)ボタン324、(少し進む)ボタン325、(早送り)ボタン326、(次へ)ボタン327、(最後へ)ボタン328、(停止)ボタン329、(音量下げる)ボタン330、(音量上げる)ボタン332がある。また、情報の表示として、再生位置・再生速度表示欄333、モード表示欄334、音量表示欄331がある。
【0071】
(最初へ)ボタン321は、チャプターの先頭の音声ファイルの再生を指示するボタンである。(前へ)ボタン322は、チャプターで再生中の一つ前の音声ファイルの再生を指示するボタンである。(少し戻る)ボタン323は、現在の再生位置から5秒前へ戻すことを指示するボタンである。(再生)(一時停止)ボタン324は、選択された音声ファイルの再生を指示したり、再生しているときに、一時停止の指示をするボタンである。この(再生)(一時停止)ボタン324は、再生中に押すとボタンフェイスが一時停止に変わり、一時停止中に押すと再生に変わるトグルボタンである。(少し進む)ボタン325は、現在の再生位置から10秒先早送りすることを指示するボタンである。(早送り)ボタン326は、再生速度を指示するボタンである。このボタンを押すたびに、再生速度が「1倍速」→「1.2倍速」→「1.4倍速」→「1.6倍速」→「1.8倍速」→「2倍速」→「1倍速」のように循環して変化する。(次へ)ボタン327は、チャプターで再生中の一つ先の音声ファイルの再生を指示するボタンである。(最後へ)ボタン328は、チャプター中の最新の音声の再生を指示するボタンである。(停止)ボタン329は、再生を停止することを指示するボタンである。(音量下げる)ボタン330は、現在の再生の音量を下げることを指示するボタンである。例えば、音量が「0」〜「100」の整数値で表現されているときに、−10ポイントする。(音量上げる)ボタン332は、現在の再生の音量を上げることを指示するボタンである。例えば、音量が「0」〜「100」の整数値で表現されているときに、+10ポイントする。
【0072】
再生位置・再生速度表示欄333は、再生の位置と再生の速度を表示する。再生の速度の表示は、s倍速(sは、少数点以下1桁で表される数)のときには、s×と表示される。モード表示欄334には、追いかけ再生か、モニタリング再生かのモードが表示される。音量表示欄331には、現在の音量が「0」〜「100」の整数値で表示される。
【0073】
チャプターリスト欄340は、チャプターリストの情報を表示する欄であり、チャプター番号表示欄341、録音開始時刻欄342、経過時刻欄343、ステータス表示欄344を有する。チャプター番号表示欄341は、チャプター毎に付けられたチャプター番号の番号を降順に表示する。録音開始時刻欄342には、チャプターの録音開始時刻を表示する。経過時刻欄343には、そのチャプターの先頭からの経過時刻を表示する。ステータス表示欄344には、通話の状態が表示される。通話中のときには、「バッファ中」と表示され、通話が終了すると「通話終了」と表示される。
【0074】
なお、ここでのチャプターとは、音声再生のための単位として概念化されたものであり、一定時間毎(例えば、30秒毎)の音声の区切りとしてもよいし、図19に示したような吹き出しで音声の区切りとしてもよい。
【0075】
モニタリング再生画面400は、追いかけ再生画面300のモニタリング再生ボタン315から起動され、その通話の聴話再生を行う画面である。
【0076】
モニタリング再生画面400は、図7に示されるように、追いかけ再生画面300とほぼ同様のユーザインタフェースを有するが、ボタンの種類と、チャプターリスト欄340がないことが異なっている。モニタリング再生画面400では、モニタリング再生ボタン314の変わりに、追いかけ再生ボタン414が表示されており、これを押すと、図20に示した追いかけ再生画面300が表示される。
【0077】
本実施形態によれば、音声認識をしたテキストを視認し、特定のキーワードが表示されている通話に着目して、追いかけ再生や聴話が可能になり、スーパバイザが実際の通話をダイレクトに聴取することにより、スーパバイザの監視業務の効率化と、オペレータの顧客への応対品質を向上させることができる。
【符号の説明】
【0078】
101…顧客の通話端末
102…公衆網
103…IP−PBX装置
104…CTIサーバ装置
105…IVR装置
106…通話録音装置
107…通話録音管理装置
108…音声認識制御装置
109…音声認識装置
110…認識結果管理装置
111…通話端末(オペレータとスーパバイザが使用)
112…オペレータ用PC端末
113…スーパバイザ用PC端末
114…ネットワーク
300…追いかけ再生画面
400…モニタリング再生画面
600…座席図表示画面
700…通話内容表示画面
701…通話内容表示吹き出し
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21