(58)【調査した分野】(Int.Cl.,DB名)
前記音声認識結果管理部は、あらかじめ定められた前記統計値を算出するための期間における前記認識した結果を前記記憶部から取得し、当該期間の前記非言語情報の値を対象として前記統計値を算出する、
ことを特徴とする請求項2に記載の音声認識システム。
【発明を実施するための形態】
【0012】
以下に添付図面を参照して、本発明にかかる音声認識システム、通話評価設定方法の実施の形態を詳細に説明する。
【0013】
図1は、本実施の形態における音声認識システムが用いられるコールセンタの構成例を示す図である。
図1に示すように、コールセンタ1000は、IP−PBX(Internet Protocol−Private Branch eXchange、IP回線対応構内交換機)装置100と、CTI(Computer Telephony Integration)サーバ200と、オペレータ端末300と、管理者端末400と、通話音声処理システム500とを有して構成されている。顧客の通話端末TとIP−PBX装置100との間は公衆網N1により接続され、IP−PBX装置100、CTIサーバ200、オペレータ端末300、管理者端末400、通話音声処理システム500は、コールセンタ1000の構内のIP回線網N2により接続されている。
【0014】
IP−PBX装置100は、顧客の通話端末Tからの呼を受けて、IP網と公衆網N1のプロトコル変換、発着信の呼制御などの処理を行う装置である。
【0015】
CTIサーバ200は、オペレータ端末300への呼制御を行う装置である。CTIサーバ200は、コールセンタ1000全体を管理し、IP−PBX装置100から受取った呼をオペレータ端末300や管理者端末400に送信したり、呼状態が接続中(通話中)になると、必要な指示を通話音声処理システム500に与えるなどの処理を実行する。
【0016】
オペレータ端末300は、コールセンタ1000のオペレータが操作する端末であり、例えば、通話機能を有したコンピュータから構成される。オペレータ端末300は、CTIサーバ200からの指示に従って、IP−PBX装置100から受け取った呼に対して応答し、オペレータが顧客の通話端末Tと公衆網11を介した外線による通話を行う。
【0017】
管理者端末400は、コールセンタ1000の管理者が操作する端末であり、例えば、通話の再生機能を有したコンピュータから構成される。管理者端末400は、オペレータ端末300の稼働状況やオペレータの作業状況を監視したり、通話音声処理システム500に対して通話を評価するための評価要求や録音ファイルの取得要求を行い、通話の評価や録音された通話を取得して再生することができる。管理者端末400の動作や画面例については後述する。
【0018】
通話音声処理システム500は、顧客とオペレータとの間の通話を録音および認識し、録音結果および認識結果を管理するシステムである。
【0019】
図1に示すように、通話音声処理システム500は、通話録音情報管理装置501と、通話録音装置502と、音声認識制御装置503と、音声認識装置504と、音声認識結果管理装置505とを有して構成されている。
【0020】
通話録音情報管理装置501は、顧客の通話端末Tから発せられた発番号やオペレータ端末300から発せられた内線番号等のCTI情報や、当該発番号の顧客端末Tや当該オペレータ端末300から発せられた内線番号から発せられ、通話録音装置502によりミラーリングされた通話音声を含む録音情報を蓄積する。また、通話録音情報管理装置501は、上記録音情報を通話録音装置502から受け取ると、その旨を音声認識制御装置503に通知する。
【0021】
通話録音装置502は、上記通話音声をミラーリングし、ミラーリングした通話音声を録音する。また、通話録音装置502は、当該通話音声を含む録音情報を通話録音情報管理装置501および音声認識装置504に出力する。
【0022】
音声認識制御装置503は、通話録音情報管理装置501から、上記録音情報を通話録音装置502から受け取った旨の通知を受けると、音声認識装置504に対して、上記通話音声を認識するための認識処理を実行する指示をする。
【0023】
音声認識装置504は、上記認識処理を実行する音声認識エンジンを有し、当該処理の結果として得られた認識結果と、通話録音装置502から受け取った上記録音情報に含まれるCTI情報や通話音声を音声認識結果管理装置505に出力する。
【0024】
音声認識結果管理装置505は、上記認識結果を管理する装置であり、本システムで使用する各種データを蓄積するデータベース5051を有している。データベース5051には、共通評価値テーブル5052と、顧客別評価値テーブル5053と、オペレータ別評価値テーブル5054と、通話評価結果テーブル5055と、通話情報テーブル5056と、録音情報テーブル5057と、認識結果情報テーブル5058とが蓄積される。また、音声認識結果管理装置505は、管理者端末400からの要求などに従って、上記認識結果や通話評価の結果、評価値設定画面を出力する。データベース5051に蓄積されるデータや上記認識結果、通話評価の結果、評価値設定画面については後述するが、認識結果には、通話を録音してテキスト化したテキスト情報、通話音量や話速等の通話者の特徴を示す非言語情報が含まれる。また、評価値は、通話者を評価するための基準となる項目の値である。
【0025】
通話音声処理システム500を構成する上記の各装置は、ハードウェアとしては、一般的なコンピュータにより構成される。本実施例では、通話録音情報管理装置501と、通話録音装置502と、音声認識制御装置503と、音声認識装置504と、音声認識結果管理装置505とが、それぞれ別の装置である前提で説明しているが、利用環境に応じて、これらを1または複数の装置により実現することとしてもよい。
【0026】
図2は、共通評価値テーブル5052の例を示す図である。共通評価値テーブル5052は、通話音声処理システム500に共通の評価基準としてシステム側であらかじめ設定された評価値を記憶するテーブルである。
図2に示すように、共通評価値テーブル5052には、あらかじめ、通話者と、通話者の評価値とが対応付けて記憶されている。
【0027】
図2では、例えば、通話時の顧客やオペレータの音量の大きさが50であり、話速の速さが50であれば、標準的な顧客やオペレータであると評価されることを示している。したがって、これらの値に対して一定の閾値以上乖離している場合、システム側の判断により評価が下がることとなる。
【0028】
図3は、顧客別評価値テーブル5053の例を示す図である。顧客別評価値テーブル5053は、顧客の特徴に基づいて設定した顧客別の評価基準である評価値を記憶するテーブルである。
図3に示すように、顧客別評価値テーブル5053には、通話者である顧客の発番号と、当該顧客の評価値とが対応付けて記憶されている。
【0029】
図3では、例えば、発番号が「090−3333−4444」の顧客の通話時における音量の大きさは50であり、話速の速さは50であることを示している。また、発番号が「090−1111−2222」の顧客の通話時における音量の大きさは、発番号が「090−3333−4444」の顧客よりも大きい60であり、話速の速さは、発番号が「090−3333−4444」の顧客と同じ50であることを示している。
【0030】
図4は、オペレータ別評価値テーブル5054の例を示す図である。オペレータ別評価値テーブル5054は、オペレータの特徴に基づいて設定したオペレータ別の評価基準である評価値を記憶するテーブルである。
図4に示すように、オペレータ別評価値テーブル5054には、通話者であるオペレータを識別するためのオペレータIDと、当該オペレータの評価値とが対応付けて記憶されている。
【0031】
図4では、例えば、オペレータIDが「オペレータA」で識別されるオペレータの通話時における音量の大きさは50であり、話速の速さは50であることを示している。また、オペレータIDが「オペレータB」で識別されるオペレータの通話時における音量の大きさは、オペレータIDが「オペレータA」のオペレータと同じ50であり、話速の速さは、オペレータIDが「オペレータA」のオペレータよりも速い55であることを示している。
【0032】
図3および
図4では、通話者の特徴に基づく評価値の例として、通話者の音量および話速を例示しているが、例えば、発話時間や無音時間、会話かぶりの有無、キーワードの有無等、通話を評価するための他の項目を評価値として設定してもよい。
【0033】
図5は、通話評価結果テーブル5055の例を示す図である。通話評価結果テーブル5055は、顧客とオペレータとの間で行われた通話ごとに、上記評価値に基づく評価結果を記憶するテーブルである。
図5に示すように、通話評価結果テーブル5055には、通話を識別するための通話IDと、当該通話における顧客の発番号と、当該顧客の評価結果と、当該顧客を評価するにあたり用いられたテーブルを識別するための顧客別評価フラグとが対応付けて記憶されている。
【0034】
図5では、例えば、通話IDが「1」で識別される通話は、発番号が「090−3333−4444」の顧客との間で行われた通話であり、当該顧客の音量および話速の評価は、いずれも良好であることを示す「Good」であったことを示している。また、当該通話の評価は、
図3に示した顧客別評価値テーブル5053を用いて行われたことを示している。また、通話IDが「2」で識別される通話は、発番号が「090−1111−2222」の顧客との間で行われた通話であり、当該顧客の話速の評価は「Good」であるものの、音量についての評価は良好でないことを示す「Bad」であったことを示している。また、当該通話の評価は、
図2に示した共通評価値テーブル5052を用いて行われたことを示している。
【0035】
なお、
図5では、顧客についての通話評価結果を記憶する場合について例示したが、オペレータについての通話評価結果を記憶する場合も同様に考えることができる。この場合、
図5における発番号を内線番号に読み替えるとともに、顧客別評価フラグをオペレータ別評価フラグには
図4に示したオペレータ別評価値テーブル5054を用いたことを示すフラグを設定すればよい。
【0036】
図6は、通話情報テーブル5056の例を示す図である。通話情報テーブル5056は、顧客とオペレータとの間で行われた通話ごとに、当該通話の発着信等のCTI情報を記憶するテーブルである。
図6に示すように、通話情報テーブル5056には、通話を識別するための通話IDと、当該通話の開始日時および終了日時と、当該通話における顧客の発番号と、当該通話におけるオペレータの内線番号と、当該内線番号に対する通話を担当するオペレータとが対応付けて記憶されている。
【0037】
図6では、例えば、通話IDが「1」で識別される通話は、11月1日の10時00分01秒に開始され、11月1日の10時00分01秒に終了したことを示している。また、当該通話の発番号は「090−3333−4444」の顧客と内線番号「1001」を担当するオペレータBとの間で行われた通話であることを示している。
【0038】
図7は、録音情報テーブル5057の例を示す図である。録音情報テーブル5057は、顧客とオペレータとの間で行われた通話ごとに、当該通話が録音されたときの通話音声を記憶するテーブルである。
図7に示すように、録音情報テーブル5057には、通話の開始日時および終了日時と、通話を識別するための通話IDと、録音された当該通話における通話音声の保管場所を示す録音ファイルパスとが対応付けて記憶されている。
【0039】
図7では、例えば、11月1日の10時00分01秒に開始され、11月1日の10時00分01秒に終了した通話は、通話IDが「1」で識別される通話であり、当該通話の録音データは、「E:¥Voice¥xxx1.waw」に記憶されていることを示している。
【0040】
図8は、認識結果情報テーブル5058の例を示す図である。認識結果情報テーブル5058は、現在までの顧客とオペレータとの間で行われた通話ごとに、当該通話において音声認識装置504により認識された結果を蓄積して記憶するテーブルである。
図8に示すように、認識結果情報テーブル5058には、通話に含まれる単語を発話したタイミングを示す単語列開始日時と、当該通話を識別するための通話IDと、当該通話の通話者と、当該通話者が発話した単語と、当該単語を発話したときの音量と、当該単語を発話したときの話速とが対応付けて記憶されている。
【0041】
図8では、例えば、11月1日の10時00分01秒に開始された通話IDが「1」で識別される通話では、まず、オペレータBが「お電話ありがとうございます。」と発話し、その音量が52、話速が50であったことを示している。また、その後、顧客1が「質問があります。」と発話し、そのときの実際の音量が52、話速が49であったことを示している。続いて、管理者端末400の動作や画面例について説明する。
【0042】
上述のとおり、管理者端末400は、ハードウェアとしては一般的なコンピュータから構成され、キーボードやマウスといった入力装置や、LCD(Liquid Crystal Display)等の表示装置が接続されている。
【0043】
図9、10は、管理者端末400の表示装置に表示される評価画面の例を示す図である。評価画面には、音声認識装置400により認識された結果を表示する認識結果画面(
図9)と、認識された通話が評価される通話評価画面(
図10)とが含まれる。これらの画面は、管理者によって入力装置を介してタブがクリックされることにより、表示が切りかえられる。これらの画面は、音声認識結果管理装置505が、当該管理者端末400の表示装置に表示する。
【0044】
図9は、認識結果画面の例を示す図である。
図9に示すように、認識結果画面には、オペレータと顧客との間で行われた通話がテキスト表示された通話表示領域901と、当該通話の話速を変更する話速変更領域902とが表示される。通話表示領域901に表示されるテキストは、音声認識装置504によって認識され、認識結果情報テーブル5058に記憶された結果を時系列に表示した情報である。音声認識結果管理装置505は、例えば、管理者端末400から受け取った要求などに従って、認識結果情報テーブル5058を読み出し、該当する通話の認識結果を管理者端末400に送信する。上記要求には、通話を評価するための通話IDや通話者、通話開始日時、通話終了日時等、認識結果情報テーブル5058の各項目が含まれる。
【0045】
また、話速変更領域902には、当該通話の話速を変更するためのカーソルキー(矢印キー)が表示され、管理者が入力装置を操作してカーソルキーをクリック等すると、音声認識結果管理装置505は、当該操作にしたがって、録音された通話音声の再生速度を遅くしたり、速くする。
図9では、
図8に示した認識結果情報テーブル5058に記憶されているオペレータBと顧客1との間の通話が表示されていることを示している。
【0046】
図10は、通話評価画面の例を示す図である。
図10に示すように、通話評価画面には、顧客の発番号ごとにシステムが通話を評価した結果を示す通話評価結果領域1001と、過去の当該顧客の発番号における評価値の統計値を示す過去通話参考値領域1002と、通話評価結果領域1001と過去通話参考値領域1002とを参照して今回の通話の評価値を設定する評価値設定領域1003とが表示される。
【0047】
通話評価結果領域1001には、認識結果情報テーブル5058に記憶されているデータのうち、
図9に示した認識結果画面に表示されている通話の通話IDに対応する発番号と、当該発番号に対応する評価結果とが表示される。
図10では、発番号が「090−3333−4444」である顧客に対するこれまでの評価結果は、音量については「Good」(良好)、話速については「Fair」(適正)であったことを示している。
【0048】
これらの評価結果は、音声認識結果管理装置505が、
図8に示した認識結果情報テーブル5058に記憶されている通話の通話IDに対応する音量および話速と、
図3に示した顧客別評価値テーブル5053に記憶されているデータのうち当該通話IDに対応する発番号の評価値として記憶されている音量および話速、または
図2に示した共通評価値テーブル5052に記憶されているデータのうちの顧客の評価値として記憶されている音量および話速を読み出し、両者の乖離度が一定の閾値以上であるか否かを判定することにより得ることができ、その結果が
図5に示した通話評価結果テーブル5055に記憶される。
【0049】
例えば、音声認識結果管理装置505は、
図8に示した認識結果情報テーブル5058に蓄積されているレコードの中から発番号が「090−3333−4444」である通話における顧客の音量および話速を読み出し、読み出した音量および話速が、
図2に示した共通評価値テーブル5052に記憶された音量及び話速、または
図3に示した顧客別評価値テーブル5053に記憶された音量および話速と比べて一定の閾値以上乖離しているか否かを判定し、一定の閾値以上乖離していると判定した場合には「Bad(良好でない)」と評価したり、一定の閾値以上乖離していないと判定した場合には「Good(良好である)」と評価する。さらに、音声認識結果管理装置505は、一定の閾値との乖離度が所定の数値未満である(すなわち、閾値近傍である)と判定した場合には、「Fair(適正である)」と評価し、これらの結果を
図5に示した通話評価結果テーブル5055に記憶する。
【0050】
また、過去通話参考値領域1002には、通話評価結果領域1001に表示されている発番号に対応する通話IDにより識別される認識結果を、
図8に示した認識結果情報テーブル5058の中から特定し、特定した認識結果に対応付けられている音量および話速の統計値が表示されている。
図10では、○月○日〜○月○日までに「090−3333−4444」を発番号とする通話の認識結果がn件あり、それらの通話における音量および話速の統計値は、それぞれ50および60であったことを示している。
【0051】
これらの参考値は、例えば、次のように算出される。音声認識結果管理装置505が、通話評価結果領域1001に表示されている発番号(例えば、発番号「090−3333−4444」)をキーにして
図6に示した通話情報テーブル5056にアクセスし、当該発番号に対応する通話IDを特定する。さらに、音声認識結果管理装置505は、特定した通話IDをキーにして
図8に示した認識結果情報テーブル5058にアクセスし、当該通話IDに対応する音量および話速を読み取る。音声認識結果管理装置505は、読み取った音量および話速についてそれぞれの統計値(例えば、平均値)を算出する。
【0052】
また、評価値設定領域1003には、通話評価結果領域1001に表示されている発番号の通話における音量および話速の評価値が表示される。当該評価値の設定は、音声認識結果管理装置505が、通話評価結果領域1001に表示されている評価結果および過去通話参考値領域1002に表示されている音量や話速の統計値を参照し、これらの値を比較するなどして設定する。過去通話参考値領域1002に表示されている音量や話速の統計値が、それぞれ50および60であり、通話評価結果領域1001に表示されている音量および話速の評価結果が、それぞれ「Good(良好である)」および「Fair(適正である)」である場合には、音声認識結果管理装置505は、音量が50のときには「Good(良好である)」と学習し、話速が60のときには「Fair(適正である)」と学習する。
【0053】
上記学習により、どのような評価値を設定すればどのような評価結果が得られるのかを判断することができる。したがって、音声認識結果管理装置505は、当該学習により、「Good(良好である)」との評価が得られる値(例えば、音量であれが「60」)を、
図3に示した顧客別評価値テーブル5053に設定すべき評価値と判断し、当該テーブルの評価値とする。
図10では、評価対象とされた今回の通話における音量および話速は、通話評価結果領域1001に表示されている評価結果や過去通話参考値領域1002に表示されている音量や話速の統計値を学習した結果、それぞれ50および60として設定されたことがわかる。
【0054】
なお、
図10では、顧客についての通話評価画面を例示したが、オペレータの通話評価画面についても同様に考えることができる。この場合、CTI情報として表示される発番号にかえて内線番号が表示され、オペレータについての通話評価の結果や過去通話の参考値や評価値が表示される。
【0055】
図11は、
図3に示した顧客別評価値テーブル5053の作成手順を示すフローチャートである。
図11に示すように、音声認識結果管理装置505は、まず、確認対象期間の評価結果を抽出する(ステップS1101)。確認対象期間は、顧客の評価対象となる期間のことである。例えば、ある発番号について、2017年11月1日10時00分00秒〜2017年11月10日09時59分59秒というような期間を定め、当該期間の日時をキーにして
図8に示した認識結果情報テーブル5058にアクセスし、当該期間内の単語列開始日時を含むレコードを抽出する。
【0056】
そして、抽出したレコードに含まれる通話IDをキーにして
図5に示した通話評価結果テーブル5055にアクセスし、当該通話IDに対応する顧客別評価フラグが「0」であるか否かを判定する(ステップS1102)。
【0057】
音声認識結果管理装置505は、当該通話IDに対応する顧客別評価フラグが「0」でないと判定した場合(ステップS1102;No)、ステップS1106に進み、当該通話IDに対応する顧客別評価フラグが「0」であると判定した場合(ステップS1102;Yes)、顧客別評価フラグが「0」である当該レコードを抽出する(ステップS1103)。
【0058】
音声認識結果管理装置505は、抽出した顧客別評価フラグが「0」であるレコードの通話IDをキーにして
図8に示した認識結果情報テーブル5058にアクセスし、当該通話IDの通話時に認識された音量および話速を読み取り、当該通話IDにおける過去の音量および話速の統計値である過去通話参考値を算出する(ステップS1104)。過去通話参考値の算出方法については、
図12を用いて後述する。
【0059】
音声認識結果管理装置505は、過去通話参考値として算出した音量および話速の値を、当該通話IDにより識別される通話の発番号の音量および話速の値を、
図3に示した顧客別評価値テーブル5053の評価値として記憶する(ステップS1105)。音声認識結果管理装置505は、同じ発番号について
図8に示した認識結果情報テーブル5058にレコードがあるか否かを判定し(ステップS1106)、レコードがあると判定した場合(ステップS1106;Yes)、ステップS1102に戻り、対象となるレコードがなくなるまで処理を続ける。一方、音声認識結果管理装置505は、レコードがないと判定した場合(ステップS1106;No)、処理を終了させる。
【0060】
図12は、
図11に示した顧客別評価値テーブル5053の作成手順におけるステップS1104の処理手順を示すフローチャートである。
【0061】
図12に示すように、音声認識結果管理装置505は、あらかじめシステムにより定義されている過去通話の参考期間を取得する(ステップS1201)。当該参考期間としては、例えば、2017年11月1日10時00分00秒〜2017年11月10日09時59分59秒というように、過去の通話のうち、過去通話参考値として用いる対象となる通話の期間が定められている。
【0062】
音声認識結果管理装置505は、上記参考期間をキーにして
図8に示した認識結果情報テーブル5058にアクセスし、当該期間内に評価対象とされた通話の発番号に対応する通話IDを含むレコードを抽出する(ステップS1202)。音声認識結果管理装置505は、当該期間内のレコードが1件以上存在するか否かを判定し(ステップS1203)、当該期間内のレコードが1件以上存在しないと判定した場合(ステップS1203;No)、ステップS1204に進む。
【0063】
一方、音声認識結果管理装置505は、当該期間内のレコードが1件以上存在すると判定した場合(ステップS1203;Yes)、抽出したレコードにおける音量および話速のそれぞれについての平均値を算出する(ステップS1204)。音声認識結果管理装置505は、算出した音量および話速のそれぞれについての平均値を、
図10に示した通話評価画面の過去通話参考値領域1002に表示する(ステップS1205)。なお、
図12に示した処理では、音量および話速の統計値として平均値を算出しているが、中央値や最頻値等の他の統計値を算出してもよい。
【0064】
なお、
図12では、顧客別評価値テーブル5053の作成手順におけるステップS1104の処理手順を例示したが、オペレータ別評価値テーブル5054の場合についても同様に考えることができる。この場合、ステップS1202において抽出するレコードを評価対象とされた通話の内線番号に対応する通話IDを含むレコードとすればよい。
【0065】
図13は、通話時に用いる評価値テーブルを選択し、通話を評価する処理の処理手順を示すフローチャートである。
図13に示すように、音声認識結果管理装置505は、音声認識装置400が認識した認識結果を
図8に示した認識結果情報テーブル5058の中から取得し(ステップS1301)、認識結果に含まれる通話IDに対応する発番号と、
図3に示した顧客別評価値テーブル5053に記憶されている発番号とを比較し、一致する発番号があるか否かを判定する(ステップS1302)。
【0066】
音声認識結果管理装置505は、上記一致する発番号がないと判定した場合(ステップS1302;No)、
図2に示した共通評価値テーブル5052に記憶されている評価値のうち、顧客用の評価値を読み出して評価を実行する(ステップS1303)。一方、音声認識結果管理装置505は、上記一致する発番号があると判定した場合(ステップS1302;Yes)、
図3に示した顧客別評価値テーブル5053に記憶されている評価値を読み出して評価を実行する(ステップS1304)。ステップS1303およびステップS1304における評価では、システムが設定することを前提に説明したが、管理者が管理者端末400の入力装置から手動で設定してもよい。
【0067】
音声認識結果管理装置505は、ステップS1302またはステップS1303で行われた評価の結果を、
図5に示した通話評価結果テーブル5055に記憶するとともに、
図10に示した通話評価画面を管理者端末400の表示装置に表示する(ステップS1305)。
【0068】
なお、
図12では、顧客別評価値テーブル5053を用いた場合について説明したが、オペレータ別評価値テーブル5054を用いた場合も同様に考えることができる。この場合、ステップS1304において、
図4に示したオペレータ別評価値テーブル5054に記憶されている評価値を読み出して評価を実行すればよい。
【0069】
このように、本実施例では、上述した処理を行うので、手間や時間をかけることなく、オペレータと顧客との間で行われる通話の評価基準を設定することができる。すなわち、本システムでは、システム側で定義した通話評価の評価値に加えて、顧客・オペレータ別に管理者が定義した評価値を使用して通話を評価し、定義後の通話評価の修正を不要とした。従来の音声認識システムでは、システムで一律に定義した評価値でしか通話を評価できないため、顧客やオペレータの特徴には対応できず、評価が下がったり、偏ったりする場合があり、同じ顧客・オペレータの通話評価の修正に、毎回手動で修正しなければならず時間がかかっていたが、このような手間や時間を削減することができる。また、本システムでは、システム側で定義する共通の評価値に加え、顧客やオペレータごとの特徴に合わせて評価値を定義しているため、より通話者の通話状況や通話環境に近い状態で評価することができる。