【実施例】
【0021】
図1は、(a)本願発明の実施の形態に係る行動予測システム1の構成の一例を示すブロック図と、(b)動作の一例を示すフロー図である。
【0022】
図1(a)を参照して、行動予測システム1は、サーバ3(本願請求項の「サーバ」の一例)と、組織Aが管理するP台(Pは自然数)の従業員端末11
1,…,11
P(以下では、符号の添え字は省略する場合がある。他の符号についても同様である。)と、組織Bが管理するQ台(Qは自然数)の従業員端末13
1,…,13
Qを備える。各従業員端末11
1,…,11
P及び13
1,…,13
Qは、それぞれ、履歴収集部15
1,…,15
P及び17
1,…,17
Qを備える。
【0023】
サーバ3は、記憶部21と、交流データ管理部23(本願請求項の「交流データ管理手段」の一例)と、感情分析部27(本願請求項の「感情分析部」の一例)と、特徴計算部29(本願請求項の「特徴計算部」の一例)と、行動予測部31(本願請求項の「行動予測部」の一例)と、組織比較部33(本願請求項の「要因分析部」の一例)と、表示部35を備える。
【0024】
記憶部21は、組織Aについて、基準交流データ37(本願請求項の「基準交流データ」の一例)と、特定交流データ39(本願請求項の「特定交流データ」の一例)を記憶する。基準交流データと特定交流データを併せて、交流データともいう。
【0025】
交流データは、時系列データであり、従業員が他者との間で行ったコミュニケーションを特定する。基準交流データ37及び特定交流データ39は、それぞれ、組織Aに属する基準者及び特定者が、他者との間で行ったコミュニケーションを特定する交流データである。
【0026】
基準交流データ37は、例えば、組織Aにおいて、基準行動(例えば離職や配置転換希望など)をした基準者が、基準行動の前の所定期間に顧客対応をしたときの電話での会話の音声データである。また、例えば、組織Aにおいて、基準行動をしていない基準者が顧客対応をしたときの電話での会話の音声データである。特定交流データ39は、例えば、組織Aにおいて、特定者が顧客対応をしたときの電話での会話の音声データである。
【0027】
交流データは、例えば、音声データなどをそのまま保存したものでもよく、音声データなどの特徴が明確になるように加工したものであってもよい。また、音声データに代えて及び/又は加えて、会話を撮影した映像データであってもよい。また、例えば、オペレータ業務のように、組織に所属しない外部者との間で行ったコミュニケーションであってもよく、組織内で、特定者である従業員が、上司との間で面談したときの対話などであってもよい。
【0028】
交流データ管理部23は、基準交流データ37を用いて、N個の第n基準クラスタ41
n(Nは2以上の自然数、nはN以下の自然数)にクラスタリングして管理する。
【0029】
ここで、クラスタリングは、例えば、以下のようにして行うことができる。特徴計算部29は、各基準者の基準交流データに対して特徴量を計算する。特徴計算部29は、基準者の間で特徴量を比較して、例えば、類似度が基準類似値以上の関係にあるものを一つのクラスタに分類し、基準類似値未満のものを異なるクラスタに分類する。
【0030】
記憶部21は、組織Bについても、同様に、基準交流データ43と、特定交流データ45を記憶する。基準交流データ43は、M個の第m基準クラスタ47
m(Mは2以上の自然数、mはM以下の自然数)を含む。
【0031】
図1(b)を参照して、
図1(a)の行動予測システム1の動作の一例を説明する。
【0032】
具体的に説明するために、組織A及び組織Bが共にコールセンターを運営しているものを例にして説明する。従業員端末11及び13は、各オペレータが顧客と電話をするための電話機能を有する情報処理装置である。履歴収集部15及び17は、従業員端末11及び13を使用するオペレータと顧客との間における電話での会話の音声データを収集して、サーバ3に送信する。
【0033】
また、説明を単純にするために、N及びMは3とする。第1基準クラスタは、組織に事前の相談もなく突然に離職した者が、離職前の所定期間に顧客対応をしたときの電話での会話の音声データが属する。第2基準クラスタは、組織との間で事前に調整した後に離職した者が、離職の相談前の所定期間に顧客対応をしたときの電話での会話の音声データが属する。第3基準クラスタは、継続して勤務しており離職する可能性が低い状態にある者が、顧客対応をしているときの電話での会話の音声データが属する。なお、クラスタリングは、パラメータなどを調整して、適切なクラスタを形成できる傾向を示す特徴量を選択して行われている。
【0034】
基準交流データは、必要であれば、感情分析部27により電話での会話の音声データの感情分析を行い、その感情を示す情報を加えて蓄積する。感情分析は、オペレータと顧客の少なくとも一方の発言に対して行ってもよく、オペレータと顧客の発言を併せて全体として行ってもよい。
【0035】
交流データ管理部23は、記憶部21に記憶された基準交流データ37及び43、並びに、特定交流データ39及び45を管理する(ステップST1)。
【0036】
特定交流データ39及び45について、例えば、従業員端末11及び13にログインした情報を利用して、従業員端末11及び13を使用する従業員を特定する。履歴収集部15及び17は、従業員端末11及び13により行われた電話での会話の音声データをサーバ3に送信する。交流データ管理部23は、従業員に対応して、電話での会話の音声データを蓄積する。特定交流データ39及び45は、必要であれば、感情分析部27により電話での会話の音声データの感情分析を行い、その感情を示す情報を加えて蓄積する。感情分析は、オペレータと顧客の少なくとも一方の発言に対して行ってもよく、オペレータと顧客の発言を併せて全体として行ってもよい。
【0037】
基準交流データ37及び43について、管理者の指示に従い、例えば、ある従業員が組織に事前の相談もなく突然に離職したとされるならば、当該従業員の特定交流データ39及び45を利用して第1基準クラスタ41
1及び47
1を更新する。同様に、ある従業員が組織に事前に調整して離職したとされるならば、当該従業員の特定交流データ39及び45を利用して第2基準クラスタ41
2及び47
2を更新する。第3基準クラスタ41
3及び47
3も同様に管理する。更新などに利用する当該従業員の特定交流データ39及び45は、当該従業員の全部の音声データに対して例えば重みづけを変えて利用するなど全部を利用してもよく、例えば所定の長さ以上の音声データのうち離職や事前調整をする前の所定期間や直近の所定個数のように一部を利用してもよい。
【0038】
行動予測部31は、組織A及び組織Bの管理者から、管理者の組織に所属する特定者について行動予測をするように指示がなされたか否かを判断する(ステップST2)。指示がないならばステップST1に戻って交流データを管理する処理を続ける。指示があったならば、ステップST3に進む。
【0039】
ステップST3において、行動予測部31は、管理者の指示によって行動を予測する特定者を特定する。そして、特定交流データ39及び45において、特定者が行った電話での会話の音声データを特定する(ステップST4)。なお、分析には、例えば一定の長さがある会話のうち直近の所定個数の音声データのように一部を使用してもよい。感情分析部27は、必要であれば、分析に使用する音声データの感情分析を行う(ステップST5)。感情分析は、オペレータと顧客の少なくとも一方の発言に対して行ってもよく、オペレータと顧客の発言を併せて全体として行ってもよい。
【0040】
特徴計算部29は、分析の対象となる特定交流データを分析して特徴データを計算する(ステップST6)。
【0041】
行動予測部31は、特徴計算部29が計算した特徴データを利用して特定者の行動を予測する(ステップST7)。例えば、特定者の特徴データと各クラスタに属する基準者の特徴データとの距離を用いてクラスタのいずれかに属するか否かの判断を行う。分析の対象となる特定交流データが、第3基準クラスタに属し、第1基準クラスタにも第2基準クラスタにも属さないならば、特定者が離職する可能性は低いと予測する。分析の対象となる特定交流データが、第3基準クラスタに属さないならば、特定者が離職する可能性が高まっていると予測する。このとき、第1基準クラスタに属して第2基準クラスタに属さないならば、特定者が事前の連絡なく離職する可能性が高まっていると予測する。第2基準クラスタに属して第1基準クラスタに属さないならば、特定者が離職のための事前相談を行う可能性が高まっていると予測する。
【0042】
行動予測部31は、管理者の指示により、他の特定者に対しても行動を予測するか否かを判断する(ステップST8)。他の特定者に対しても予測するならば、ステップST3に戻る。予測しないならば、ステップST1に戻る。
【0043】
組織比較部33は、例えば、基準交流データ37と基準交流データ43における各基準クラスタを比較して共通点と相違点を抽出する。そして、例えば、各組織において離職するか否かの検出精度や、離職において会社への事前の通知の有無についての検出精度などが向上する相違点などを分析する。また、組織比較部33は、検出精度が向上する共通点及び/又は相違点を利用して、例えば、離職の可能性が高まる要因、さらに、事前に調整して離職するのではなく突然に離職する要因を分析して、表示部35が分析結果を表示してもよい。
【0044】
また、組織比較部33は、例えば組織A及び組織Bにおいて、各組織において基準クラスタを比較して共通点と相違点を抽出するとともに、組織間でも比較して共通点と相違点を抽出することにより、特徴計算部29が各組織での基準クラスタの検出精度を向上させるとともに、組織比較部33が各組織に特徴的な基準クラスタに対応する従業員の行動の要因を精度よく分析して、表示部35が分析結果を表示してもよい。
【0045】
さらに、本願発明は、コールセンター運営に限定されず、例えば組織内において、部下である従業員と、その上司との間の面談などで交わされるコミュニケーションであってもよい。また、例えば、顧客との間で送受信したメールや、郵送などでやり取りした手紙などを分析するものでもよい。この場合、時系列的な要素を加味せずに例えば顧客に送信したもののみを利用してもよく、また、送信したものに加えて、例えば、従業員が顧客にメール等を送信するときに、作業者が所定の様式を決定して、これを修正してメール等を送信するまでの経緯などの時系列的な要素を加味して分析してもよい。
【0046】
なお、感情分析部27が行う感情分析は、次のようなものであってもよい。
【0047】
例えば音声データにおいて、組織に属する従業員が発言する従業員音声と他者が発言する他者音声に分け、従業員音声及び他者音声のそれぞれにおいて、怒りや悲しみなどのマイナス評価と、喜びなどのプラス評価に分析する。感情分析は、最初をゼロとすると、その後の応対で徐々にプラスになったりマイナスになったり変動する。
【0048】
従業員は、通常、他者の感情に対応する。例えば、他者の感情がマイナス側に大きくなればこれをプラス側に変化させようとして、信頼関係を構築するよう努力する。他者の感情がプラス側に移行すれば、その関係を利用して、他者の本来の要望に応えるよう努力する。他方、従業員が余裕のない状態になると、信頼関係などを考える余裕がなくなり、他者がプラス評価の感情にあってもこれに共感しづらくなったり、他者の要望に直接に形式的に答えるのみの対応が増加したりすることが予測される。そのため、例えば、他者音声において感情がプラス評価される部分とマイナス評価される部分に対応して、従業員音声でどのように対応しているかをクラスタリングすることにより、従業員の状況を精度よく分析することができる。
【0049】
また、例えば、従業員が心理的に余裕のない状態では、素直に自身の感情を表現できない状況となることが予想される。例えば、従業員の感情がプラス評価である部分とマイナス評価である部分の違いが小さくなる傾向になることもあれば、逆に、自身の感情に支配され、極端に大きく変化する傾向になることも予想される。そのため、例えば、従業員の感情についてプラス評価である部分とマイナス評価である部分の違いを利用してクラスタリングすることにより、従業員の状況を精度よく分析することができる。
【0050】
このような感情分析は、3つ以上の感情(例えば、怒り、悲しみ、喜びなど)をベースにしてもよい。また、従業員の感情と他者の感情を両方加味して分析してもよい。
【0051】
続いて、
図2及び
図3を参照して発明者らが行った実験について説明する。実験では、次のようにして分析の対象とする交流データを選択した。分析に使用する交流データは、基準者や対象者が日々蓄積された音声データなどから選択される。実験では、例えば30日などの一定期間において1日ごとに区切り、例えば第1日目〜第15日目までの各日で一般的な会話(例えば各日に含まれる複数の会話のうちで他の会話と共通する特徴が多い会話)を一つ選択し、これを基準交流データとする。他方、第16日目〜第30日目までの各日で一般的な会話を一つ選択し、これを特定交流データとした。
【0052】
図2は、
図1のサーバ3におけるクラスタリングの例を説明するための図である。ここで、二値分類ではなく多クラス分類としたのは、離職者・在職者の中にタイプがいくつか存在することが予想されたためである。
図2(a)で点在する各点は、オペレータ(基準者)の基準交流データを2つの特徴量で分析したときの分布を示す。
図2(b)は、データを塊ごとにグルーピングしたものである。
図2(b)では、5つのグループに分けられている。3つのグループは在職者のものであり、2つのグループは離職者のものである。これらは、日々の会話の中から、基準者を特徴づける会話を抽出してクラスタリングしたものと評価できる。
【0053】
図2(c)は、2人の特定者T
1及びT
2の特定交流データを2つの特徴量で分析したときの分布を示す。特定者T
1は、在籍者のグループの一つに属する。特定者T
2は、離職者のグループの一つに属する。そのため、行動予測部31は、特定者T
2が離職する可能性が高いと判断する。このように、特定者の特定交流データがいずれのクラスタに属するかによって、特定者が離職する可能性があるか否かを予測することができる。
【0054】
ただし、通常、特に導入時などにおいて、離職者は在職者よりも圧倒的に少ない。そのため、在職者のクラスタの検出精度が信頼できても、離職者のクラスタの検出精度が信頼できない場合も多い。そのため、
図2(d)にあるように、在職者のみでクラスタを形成し、在職者のクラスタに属さない場合には離職のリスクが高まっていると予測してもよい。すなわち、
図2(d)では、6名の特定者T
3〜T
8のうち、3名の特定者T
3、T
4、T
5は在職者のクラスタに属し、3名の特定者T
6、T
7、T
8は在職者のクラスタに属さない。この場合に、在職者のクラスタに属さない3名の特定者T
6、T
7、T
8は、離職のリスクが高まっていると予測してもよい。
【0055】
発明者らは、
図2(d)の手法で実験を行った。実験では、まず、会話データに対して、複数の観測点を設定して、会話の長さを同一にする。そして、会話の長さを分けた時間間隔に対して、これに含まれる観測点の観測値と観測時間の平均を算出し、複数の時刻に対応する観測値を、最近近傍点の加重平均として算出する。
【0056】
続いて、出勤日単位の代表会話の抽出は、次のようにして行った。ある出勤日の会話集合においてDTW(Dynamic Time Warping)行列を算出し、行(又は列)方向に合計を取ったリストを算出し、最小値を取るインデックスを、代表会話とした。これにより、複数ある会話の集合から、最も中心にある会話(メドイド)を選択している。この処理を行うことで、ノイズとなる会話を除き、また、1日の気持ちの遷移に影響されない、その日を特徴付ける会話の抽出を行う。実験では、DTWの計算には、単一のパラメータのみを使用した。
【0057】
話者が持つデータ集合は、単なる会話集合として扱うことができる。そのため、同様にして、DTW行列を使って話者単位での代表会話の抽出が可能である。これにより、話者を、ある一つの会話(本願請求項の「特徴データ」の一例)として表現することができ、話者同士の類似度の計算も可能となる。
【0058】
続いて、話者集合は、単なる会話集合として扱うことができる。在職者のみの集合において、行及び列の数が在職オペレータ数であるDTW行列を算出し、DTW行列をもとにk−means法によりクラスタリングを行う。これにより、似たオペレータ同士をグルーピングすることができる。ここで、k−means法は、与えられたクラスタ数kに対して、各クラスタの平均を用いてk個のクラスタに分類する手法である。
【0059】
続いて、離職懸念の有無の判定は、次のように行った。まず、あるクラスタに含まれる会話集合において、DTW行列を作成する。そして、行(又は列)方向に合計を取ったリストを算出し、最小値を取るインデックスを、そのクラスタの中心の話者とする。クラスタ中心の話者と最も離れた話者との距離を算出する。この値をd
1とする。クラスタ中心の話者とテスト対象の話者との距離を算出する。この値をd
2とする。d
2<d
1ならば、テスト対象の話者は在職者のクラスタに属するとし、離職懸念なしと判断する。反対に、条件を満たさないならば、テスト対象の話者は離職懸念ありと判断する。これを全てのクラスタに対して行う。
【0060】
発明者らは、126名のデータをk−means法により分析した。在職者のクラスタは4つとした。ただし、クラスタ半径が大きなものは除外した。音声感情解析システムLVA(例えば、特表2002−509267号公報など参照)において、パラメータの一つである「Energy」(感情の最もベースになるパラメータ)に着目して分析したところ、離職者は78%(27回の実験のうち21回)の精度でいずれのクラスタにも属さなかった。よって、在職者のクラスタによっても、離職する可能性がある者を充分高い可能性で検出することができる。このように、簡単でポピュラーなアルゴリズムであるk−means法を用いても、クラスタを利用して離職する可能性がある者を検出することができる。
【0061】
なお、k−means法は、単純なアルゴリズムである反面、特異的なオペレータ(基準者)の影響を受けやすい。そのため、今回の場合には、クラスタ半径の大きなクラスタができている。そのため、例えば、大きなクラスタを作る要因となる(特異的な)オペレータを排除したり、事前にまとめたりすることにより、精度の向上にもつながる可能性がある。ここで、特異的なオペレータとは、例えば、一般的な会話が抽出できなかったオペレータであり、例えば、出勤日(サンプル)が少なく一般的な会話が抽出できなかった場合や、サンプルはあるにもかかわらず一般的な会話が正しく抽出できなかった場合(例えば、そもそも一般的な会話が人とは違うようなオペレータなど)などである。
【0062】
また、離職者であっても、在職者のクラスタに属する者がいるが、これは、在職者でも離職懸念があるオペレータが存在したり、いずれのクラスタにも分類できそうなオペレータが存在したりするために、誤検出が生じたものと考えられる。このようなオペレータの影響を除外することにより検出精度が向上することが期待される。さらに離職者のクラスタなどを利用することにより、検出精度はさらに向上することが期待できる。
【0063】
表1は、x−medoids法(自動でクラスタ数を決定するk−medoids法)を用いた実験結果を示す。感情解析システムLVAにおける指標による2つのラベル(第1ラベルと第2ラベル)を使用して、同様にクラスタリングできる傾向が認められることを示している。
【0064】
【表1】
【0065】
図3は、定量的評価を説明する図である。
図3(a)にあるように、在籍者の3つのクラスタのそれぞれにおいて、代表者R
1、R
2及びR
3を決定する。代表者は、例えば各クラスタの中心に近い者、クラスタの他の所属者との距離(例えば、DTW距離や、特徴量の差の二乗の和の平方根など)が最も短い者などにより決定することができる。
図3(b)は、代表者の代表的な会話と、在職者の一人の第1日目、第2日目、・・・、最新日のそれぞれの会話とのDTW距離を示す。
図3(c)は、代表者の代表的な会話と、離職者の一人の第1日目、第2日目、・・・、最新日のそれぞれの会話とのDTW距離を示す。離職者は、最新日に近付くほどDTW距離が大きくなっており、スケールが大きい。他方、在職者は、離職者に比較して変化が小さく、スケールが小さい。そのため、このような時間の経過を参照することにより、離職などの基準行動の予測の精度を向上させることができる。
【0066】
離職するような状態では、オペレータは余裕がない状態で顧客対応を行っていることが予測される。このような状態では、顧客の状況に柔軟に対応できず、パターン化された対応を行いがちであることが予測される。そのため、オペレータが余裕のない状態となったとき、組織においてパターン化された顧客対応となることは、充分に予測されるものであり、これがクラスタリングにより明確にすることができたと考えられる。