【文献】
金井 貴浩,Random Forestを用いた対話破綻検知器の作成,第78回 言語・音声理解と対話処理研究会資料 (SIG−SLUD−B505),日本,一般社団法人人工知能学会,2016年10月 1日,91−93ページ
(58)【調査した分野】(Int.Cl.,DB名)
前記取得部は、前記フィードバック発話と、第1の種別が付与された前記フィードバック発話の直前の会話と、第2の種別が付与された前記フィードバック発話の直前の会話と、を取得し、
前記前段生成部は、前記取得部により取得された情報に基づいて、前段分類器を生成する、
請求項2に記載の情報処理装置。
前記前段生成部は、前記取得部により取得されたフィードバック発話および前記直前の会話に付与された種別を示すラベルを学習データとして、機械学習を行って前記前段分類器を生成する、
請求項3に記載の情報処理装置。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。以下の説明では、自動応答装置または利用者が発した言葉を「発話」、発話の集合を「会話」、第1の発話主体により発せられた発話に対する第2の発話主体の所定の反応を示していると推定される発話を「フィードバック発話」と称する。第1の発話主体の一例として自動応答装置があり、第2の発話主体の一例として利用者(人)がある。
【0010】
情報処理装置は、一以上のプロセッサにより実現される。情報処理装置は、例えば利用者と自動応答装置との間で行われる会話に対して、会話の種別を示す指標を導出する。会話の種別とは、例えば、会話が不自然であるか(その逆に会話が自然であるか)である。会話が不自然であるとは、例えば適切な自動応答がなされなかった結果、会話が成立していないことである。なお、会話の種別は、会話が不自然であるかに限らず、任意に定められてもよい。
【0011】
また、情報処理装置は、その処理の過程において、発話分類器、および会話分類器を生成する。発話分類器は、フィードバック発話に対して与えられる指標であって、フィードバック発話の直前に、不自然な会話または自然な会話が現れると推定される度合を示す指標(後述する発話スコア)を導出するものである。なお、以下に説明する実施形態では、発話スコアは、フィードバック発話の直前に、不自然な会話が現れると推定される度合を示す指標である例について説明する。また、以下、「直前に現れる会話」(あるいは「直前の会話」)とは、利用者の発話と、それに対する自動応答装置の発話との組み合わせであるものとする。会話分類器は、会話に対して与えられる指標であって、会話が不自然である度合を示す指標(後述する会話スコア)を導出するものである。
【0012】
[構成]
図1は、情報処理システム1の構成の一部を示す図である。情報処理システム1は、例えば、会話ログ記憶装置10と、フィードバック発話記憶装置12と、発話学習データ記憶装置14と、取得部20と、発話分類器生成部(前段生成部)22と、発話分類器24とを備える。なお、上述した機能構成は装置として構成されてもよい。
【0013】
取得部20、発話分類器生成部22、および発話分類器24は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0014】
情報処理システム1に含まれる各記憶装置は、例えば、例えば、ROM(Read Only Memory)、HDD(Hard Disk Drive)フラッシュメモリ、SDカード、RAM(Random Access Memory)、レジスタ等によって実現される。
【0015】
会話ログ記憶装置10には、会話のログ情報が記憶されている。この会話のログ情報は、例えば、人工知能(Artificial Intelligence; AI)により動作する自動応答装置と、利用者とによって行われた会話のテキスト情報である。テキスト情報は、音声認識によって音声による発話から変換されたものであってもよい。
【0016】
フィードバック発話記憶装置12には、フィードバック発話が記憶されている。フィードバック発話記憶装置12に記憶されるフィードバック発話は、会話ログ記憶装置10から抽出されたものである。フィードバック発話は、例えば、予め設定されたフィードバック発話である。例えば、作業者が、会話ログ記憶装置10に記憶された会話のログ情報から抽出したり、所定の装置(またはその他のシステム)が、予め設定されたフィードバック発話の文言に基づいて、会話ログ記憶装置10に記憶された会話のログ情報から自動で抽出したりしてフィードバック発話が抽出(取得)される。
【0017】
上述したようにフィードバック発話記憶装置12には、会話ログ記憶装置10から取得されたフィードバック発話が記憶される。
図2は、フィードバック発話の一例を示す図である。例えば、フィードバック発話は、(1)「違う違うどういうこと」、(2)「わかりましたありがとう」などのような発話を含む。フィードバック発話が直前の会話を否定するもの、又は肯定するものであるか否かのみでは、直前の会話が成立しているか否かの判定を正確に行うことができない。そこで本実施形態の情報処理システム1では、フィードバック発話のみで、その直前の会話が成立しているか否か等を示すスコア(確率)を出力する発話分類器24を生成する。
【0018】
まず、会話ログ記憶装置10からフィードバック発話を有する会話が取得され、
図3に示すようにフィードバック発話の直前の会話に対して自然(第1の種別を表すラベル)又は不自然(第2の種別を表すラベル)のラベルが付与される。そして、フィードバック発話の直前の会話に対して付与されたラベルをフィードバック発話の教師ラベルとした学習データが生成され、発話学習データ記憶装置14に記憶される。
【0019】
図3の例では、「ありがとう」の直前の会話が自然であるため「ありがとう」というフィードバック発話に対して、自然であるという教師ラベルが付与され、「どういう意味」の直前の会話が不自然であるため、「どういう意味」というフィードバック発話に対して不自然であるという教師ラベルが付与された学習データが生成される。
【0020】
発話分類器生成部22は、上記学習データを学習し、発話分類器24を生成する。また、発話分類器生成部22は、ニューラルネットワークなどを用いたディープラーニング技術や、SVM(Support Vector Machine)などの手法を用いた学習を行う。
【0021】
発話分類器24は、未知または既知のフィードバック発話が与えられると、その直前に現れる会話が不自然である確率を表す発話スコアを導出する。発話分類器24に与えられるフィードバック発話は、例えば、フィードバック発話記憶装置12から取得部20により取得されたフィードバック発話である。発話スコアは、フィードバック発話の直前に自動応答装置により発せられた発話が、その直前に人により発せられた発話に対して不自然であると推定される度合を示す指標である。すなわち、発話スコアが高い程、利用者と自動応答装置との間で行われたフィードバック発話の直前の会話が不自然である確率が高くなる。
【0022】
図4は、発話分類器24に入力されるフィードバック発話と、発話分類器24によって出力される発話スコアとの一例を示す図である。例えば、発話「違う違うどういうこと(図中、FB1)」に対して導出される発話スコアは、発話「なかなか素直でよろしい(図中、FB2)」に対して導出される発話スコアに比して高くなる。
【0023】
発話分類器24が導出するスコアにより、自然な会話か不自然な会話かを判断する際に、会話の中身を精査することなく、フィードバック発話のみで判断することが可能になる。また、本実施形態では、付与されるラベルは、直前の会話が自然であることを示す自然ラベル、または直前の会話が不自然であることを示す不自然ラベルの2値ラベルであるが、第1の種別を示すラベル、または第2の種別を示すラベルは、直前の会話が成立しているか(または自然であるか)、不成立であるか(または不自然であるか)に限らず、任意のフィードバック発話に対して付与されてもよい。例えば、賞賛や受諾、了解、感謝、面白さ等を示すフィードバック発話に第1の種別を示すラベルが付与されたり、失望や、伝達不良、不可解、軽蔑、退屈等を示すフィードバック発話に第2の種別を示すラベルが付与されたりしてもよい。
【0024】
発話分類器24は、フィードバック発話に対して、その発話スコアを対応付けた対応情報を、情報処理システム1の後述するスコア付きフィードバック発話記憶装置50に記憶させる。
【0025】
図5は、情報処理システム1の他の構成を示す図である。情報処理システム1は、
図1で示した構成に加え、更に会話ログ記憶装置40と、スコア付きフィードバック発話記憶装置50と、会話学習データ記憶装置52と、抽出部62と、学習データ生成部63と、会話分類器生成部(後段生成部)64と、会話分類器66とを備える。なお、これらの機能構成は、装置として構成されてもよい。また、情報処理システム1に含まれる機能構成のうち、任意の機能構成が装置として構成されてもよい。
【0026】
例えば、抽出部62、学習データ生成部63、会話分類器生成部64、および会話分類器66のうち一部または全部は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0027】
図1および
図5に示す構成要素は、例えば、ソフトウェア間通信により、或いはハードウェアネットワークを介して通信する。ハードウェアネットワークは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含んでよい。
【0028】
会話ログ記憶装置40には、例えば、会話のログ情報が記憶されている。この会話のログ情報は、会話ログ記憶装置10に記憶された情報と同一であってもよいし、異なっていてもよい。
【0029】
スコア付きフィードバック発話記憶装置50には、発話分類器24によって発話スコアが導出されたフィードバック発話と、そのフィードバック発話に対する発話スコアとが記憶されている。
【0030】
抽出部62は、スコア付きフィードバック発話記憶装置50からフィードバック発話及びそれに対応するスコアを取得し、会話ログ記憶装置40からフィードバック発話を含む会話(フィードバック発話およびその直前の会話)を取得する。会話ログ記憶装置40から、フィードバック発話を含む会話が取得される際、スコア付きフィードバック発話記憶装置50から抽出されたフィードバック発話が利用される。
【0031】
抽出部62は、会話ログ記憶装置40から抽出したフィードバック発話を含む会話を取得し、スコア付きフィードバック発話記憶装置50から抽出されたフィードバック発話に付されたスコアに基づいて、フィードバック発話の直前の会話にスコアを付与する。
【0032】
なお、スコア付きフィードバック発話記憶装置50に記憶されていないフィードバック発話を含む会話についてスコアを付与したい場合には、その会話のフィードバック発話を発話分類器24に与えてスコアを取得する。
【0033】
学習データ生成部63は、フィードバック発話の直前の会話に付与されたスコアに基づいて、種別を表すラベルをフィードバック発話の直前の会話に付与し、フィードバック発話の直前の会話とその種別を教師ラベルとした学習データを生成し、会話学習データ記憶装置52に学習データを記憶させる。
【0034】
例えば、第1閾値(例えば0.3)以下のスコアが付与されたフィードバック発話の直前の会話については、第1の種別のラベルが付与され、第2閾値(例えば0.7)以上のスコアが付与されたフィードバック発話の直前の会話については、第2の種別のラベルが付与される。ラベルの付与については、上述したようなスコアの閾値ではなく、スコアの高いもの順にフィードバック発話が並び替えられ、上位の所定割合(例えば2割)のフィードバック発話の直前の会話に第2の種別のラベルが付与され、それ以外の直前の会話に第1の種別のラベルが付与されるようにしてもよい。
【0035】
図6は、スコアが付与されたフィードバック発話の一例を示す図である。例えば0.3以下のスコアが付与されたものについては第1の種別のラベル、0.7以上のスコアが付与されたものについては第2の種別のラベルを付与した場合、「頭いいですね」、および「なかなか素直でよろしい」が、発話スコアが第1の種別側に偏しているフィードバック発話の一例であり、「違う違うどういうこと」、および「会話になっていませんけど」が、発話スコアが第2の種別側に偏しているフィードバック発話の一例となる。
【0036】
図7は、会話ログ記憶装置40から抽出された会話の一例を示す図である。フィードバック発話が「違う違うどういうこと」の直前の会話に対しては、フィードバック発話「違う違うどういうこと」のスコアに基づいてラベルが付与される。フィードバック発話が「頭いいですね」の直前の会話に対しては、フィードバック発話「頭いいですね」のスコアに基づいてラベルが付与される。例えば、0.3以下のスコアが付与されたフィードバック発話の直前の会話については、第1の種別のラベルが付与され、0.7以上のスコアが付与されたフィードバック発話の直前の会話については、第2の種別のラベルが付与される場合、「426+129は」「答えは555です」の会話については第1の種別のラベルが付与され、「閲覧履歴を見せて」「ふふふ」の会話について第2の種別のラベルが付与された学習データが学習データ生成される。
【0037】
会話学習データ記憶装置52には、学習データ生成部63により生成された(フィードバック発話を含まない)フィードバック発話の直前の会話に上記の種別(例えば第1の種別または第2の種別)を示すラベルが付与された学習データが記憶される。
【0038】
会話分類器生成部64は、抽出部62により抽出されたフィードバック発話の直前の会話に基づいて、未知の会話の種別を示す指標である会話スコアを導出する会話分類器66を生成する。会話分類器生成部64は、第1の種別側に偏したフィードバック発話の直前の会話と、第2の種別側に偏したフィードバック発話の直前の会話と、これらの直前の会話に付与されたラベル(第1の種別または第2の種別)の情報とに基づいて学習を行う。学習は、例えば機械学習によって行われる。会話分類器生成部64は、抽出部62により抽出された直前の会話、および直前の会話に付与されているラベルの情報を教師ラベルとした機械学習に基づいて会話分類器66を生成する。会話分類器生成部64は、ニューラルネットワークなどを用いたディープラーニング技術や、SVMなどの手法を用いて上記の学習をしてもよい。
【0039】
図8は、学習の処理を概念的に示す図である。例えば、第2の種別側に偏したフィードバック発話が「違う違うどういうこと」である場合、「違う違うどういうこと」の直前に現れた会話a〜cが抽出される。また、第1の種別側に偏したフィードバック発話が「頭いいですね」である場合、「頭いいですね」の直前に現れた会話d〜fが抽出される。このように、ユーザと自動応答装置による会話において、自然または不自然な会話である確率が高い会話から会話分類器66が学習される。
【0040】
会話分類器66は、未知または既知の会話が与えられると、その会話の種別を示す会話スコア(後段指標)を導出する。会話スコアは、自動応答装置により発せられた発話が、その直前に人により発せられた発話に対して不自然であると推定される度合を示す指標である。すなわち、会話スコアが高い程、利用者と自動応答装置との間で行われた会話が不自然である確率が高い。
【0041】
図9は、会話分類器66に入力される(未知の)会話と、会話分類器66により出力される情報の一例を示す図である。例えば、会話分類器66に利用者の発話「パチンコ勝てないんだけど」、および利用者の発話に対する応答である自動応答装置の発話「募金なんかいかがでしょうか」が入力されると、会話分類器66は、例えば、上記の会話が不自然である確率は95パーセントであることを出力する。このように、会話分類器66は、フィードバック発話が後続しない、未知の会話に対しても会話の自然さ、または不自然さを判断することができる。
【0042】
また、上記処理において、会話Aとして「閲覧履歴を見せて」「ふふふ」は、不自然である確率が高いことが、学習されたものとする。例えば、未知の会話「ヒストリーを見せて」「ふふふ」が、会話分類器66に入力された場合、会話分類器66は、その未知の会話に対して会話Aと同様に不自然である確率が高い会話スコアを導出する。「閲覧履歴」と「ヒストリー」は意味的に近い言葉であるためである。
【0043】
[発話分類器が生成される処理]
図10は、情報処理システム1により発話分類器24が生成される処理の流れを示すフローチャートである。まず、発話分類器生成部22が、発話学習データ記憶装置14から、学習データであるフィードバック発話およびフィード発話に付与された教師ラベルを取得する(S100)。
【0044】
次に、発話分類器生成部22が、S100で取得した学習データに基づいて、フィードバック発話の直前に不自然な会話、または自然な会話が出現する確率を学習する(S102)。次に、発話分類器生成部22が、S102の学習の結果に基づいて、発話分類器24を生成する(S104)。
【0045】
次に、取得部20は、発話スコアを付与する対象のフィードバック発話を取得し、取得したフィードバック発話を発話分類器24に入力する。発話分類器24は、入力されたフィードバック発話に発話スコアを付与し、フィードバック発話の発話スコアと、そのフィードバック発話とを対応付けた対応情報を、情報処理システム1のスコア付きフィードバック発話記憶装置50に記憶させる(S106)。これにより、本フローチャートの処理は終了する。
【0046】
上述した処理により、フィードバック発話に対して、直前の会話が不自然である度合を示す発話スコアを導出する発話分類器24が生成され、生成された発話分類器24によって所定のフィードバック発話に対してスコアが付与される。
【0047】
[会話分類器が生成される処理]
図11は、情報処理システム1により会話分類器66が生成される処理の流れを示すフローチャートである。まず、抽出部62が、スコア付きフィードバック発話記憶装置50に記憶された対応情報を取得する(S200)。次に、抽出部62が、S200で取得された対応情報から、発話スコアが付与されたフィードバック発話を自動的に抽出する(S202)。
【0048】
次に、抽出部62は、S202で抽出した各フィードバック発話を含む会話(フィードバック発話及びそのフィードバック発話の直前の会話)を、会話ログ記憶装置40に記憶されたログ情報から抽出し、スコア付きフィードバック発話記憶装置50から抽出したフィードバック発話に付与されたスコアに基づいて、抽出したフィードバック発話の直前の会話にスコアを付与する(S204)。次に、学習データ生成部63が、ステップS204で付与されたスコアに基づいて、種別を表すラベルをフィードバック発話の直前の会話に付与し、フィードバック発話の直前の会話とその種別を教師ラベルとした情報とを含む学習データを生成し、会話学習データ記憶装置52に学習データを記憶させる(S206)。
【0049】
次に、会話分類器生成部64が、S206で生成され会話学習データ記憶装置52に記憶された学習データに基づいて学習を行う(S208)。次に、会話分類器生成部64が、S208の学習の結果に基づいて、会話分類器66を生成する(S210)。これにより、本フローチャートの処理は終了する。
【0050】
上述した処理により、会話の不自然さを示す会話スコアを導出する会話分類器66がされる。
【0051】
なお、上記例では、発話分類器24が生成される処理と会話分類器66が生成される処理とを別々の処理として説明したが、これらの処理は一連の処理とされてもよい。
【0052】
[まとめ]
第1の種別を示すフィードバック発話であっても、直前の会話は不自然であったり、第2の種別を示すフィードバック発話であっても、直前の会話は自然であったりする場合がある。自動応答装置と利用者との会話が自然または不自然であるかは、フィードバック発話の種別が必ずしも示しているわけでなく、別の要因が関係する場合がある。例えば、自動応答装置によって親切な言葉が発話された場合、利用者が第1の種別を示すフィードバック発話を行うことがある。また、例えば、自動応答装置よって利用者を怒らせる発話が行われた場合、利用者は第2の種別を示すフィードバック発話を行うことがある。このため、単純に第1の種別を示すフィードバック発話の直前の会話は自然であり、第2の種別を示すフィードバック発話の直前の会話は不自然であるという判断は適切ではない。
【0053】
また、会話において、第1の種別または第2の種別を示すフィードバック発話は頻繁に現れないため、ラベルが付与された会話に対して機械学習の技術を適用しない場合、フィードバック発話が後続しない会話の自然さ、または不自然さを、幅広い範囲で判断することが困難である場合があった。
【0054】
これに対して、本実施形態の情報処理システム1は、会話のログ情報から抽出された、スコア付きのフィードバック発話の直前の会話に対して機械学習を行って、会話分類器66を生成するため、第1の種別を示すフィードバック発話の直前の会話を自然な会話として、第2の種別を示すフィードバック発話の直前の会話を不自然な会話として単純に認識する手法に比べて、会話の自然さ、または不自然さを、幅広い範囲で判断することができる。このため、この会話分類器66は、判断対象となる会話のカバー率を向上させることができ、未知の会話に対しても会話の自然さ、または不自然さを判断することができる。
【0055】
また、本実施形態の情報処理システム1は、発話スコアが第1の種別側または第2の種別側に偏したフィードバック発話の直前の会話に対して機械学習を行って、会話分類器66を生成する。このため、会話分類器66は、より精度よく会話が自然または不自然な会話であるかを判断することができる。
【0056】
また、本実施形態の情報処理システム1は、タスクやドメインに適した会話分類器66を容易に生成することができる。例えば、比較例のシステムにおいて、タスクやドメインに適した会話分類器66を生成する場合、そのタスクやドメインにおいて出現した会話のログ情報を収集し、収集した会話に対してラベルが付与する。そして、比較例のシステムは、ラベルが付与された会話に対して機械学習を行って、会話分類器66を生成する。この場合、人手で、タスクやドメインごとにその都度、会話分類器66を作成しなければならず、コストが高くなる。
【0057】
これに対して、本実施形態の情報処理システム1は、ある会話のログ情報に基づいて、発話分類器24を生成すると、色々なタスクやドメインに対して、その発話分類器24を適用することにより、容易に会話分類器66を生成することができる。例えば、情報処理システム1は、対象のタスクやドメインにおいて出現した会話のログ情報から、発話スコアが付与されたフィードバック発話の直前の会話を抽出し、抽出した会話および発話スコアに対して機械学習を行って会話分類器66を生成することで、対象のタスクやドメインに適合した会話分類器66を生成することができる。このように、情報処理システム1は、対象とするタスクやドメインにおいて出現した会話に対してラベルが付与されていなくても、発話分類器24を適用することで、会話分類器66を生成することができる。すなわち本実施形態の手法では、スコアつきフィードバック発話のデータベースを一旦作ってしまえば、新しいタスクやドメインに取り組むことになっても、そのタスクやドメインの対話ログと、スコア付きフィードバック発話記憶装置50から自動で、手間ひまかけず、つまり低コストで会話分類器66を学習できる。
【0058】
なお、上述した実施形態では、会話分類器66が、会話の不自然さを示す指標を導出するものとして説明したが、「不自然さ」を別の特性に置換しても構わない。例えば、フィードバック発話の直前の会話が所定の種別である度合を示す指標が導出されてもよい。例えば、フィードバック発話の直前の会話が、利用者にとって有益である度合を示す指標や、利用者の気分を向上させる会話である度合を示す指標等が導出されてもよい。これらの場合、フィードバック発話に対して、第1の種別を示すラベルまたは第2の種別を示すラベルに代えて、指標の種類に応じたラベルが付与され、フィードバック発話の直前の会話に対して、自然ラベルまたは不自然ラベルに代えて、指標の種類に応じたラベルが付与される。
【0059】
また、上述した実施形態では、会話分類器66は、会話が2種類の種別のうち一方の種別(例えば第2の種別)に該当する確率を導出する例について説明したが、これに代えて会話が3種類以上の種別のうち、いずれの種別であるかを示す確率を導出してもよい。この場合、例えば、3種類以上の会話の種別を示すラベルが用意される。例えば、第1の種別および第2の種別を示すラベルに加え、中立な会話を示す第3の種別を示すラベルが用意される場合について考える。この場合、発話学習データ記憶装置14に記憶されたフィードバック発話の直前の会話には、第1の種別〜第3の種別を示すラベルが付与される。そして、情報処理システム1は、第1の種別〜第3の種別と、フィードバック発話との関係を学習する。また、例えば、情報処理システム1は、対応情報から、発話スコアが予め設定された自然な会話、不自然な会話、および中立な会話を示す範囲に含まれるスコアを有するフィードバック発話を自動的に抽出する。そして、情報処理システム1が、抽出したフィードバック発話の直前の会話と、会話の種別を示すラベルとの関係を学習することで、会話分類器66を生成する。
【0060】
[比較例1、2]
図12は、比較例1および比較例2の機能構成を示す図である。
図12の上図に示す比較例1は、人手で作成したデータを使った教師あり学習に基づく手法である。比較例1では、学習部100が発話学習データ記憶装置14に記憶された情報を機械学習し、学習結果によって、会話分類器102が生成されたものである。発話学習データ記憶装置14に記憶された情報とは、自然ラベルまたは不自然ラベルが付与されたフィードバック発話の直前の会話である。
【0061】
図12の下図に示す比較例2は、会話に対して、第1の種別を示すフィードバック発話と第2の種別を示すフィードバック発話とのうち、どちらが多く後続するかでスコアが付与されるものである。比較例2では、発話分類器24および会話分類器66は用いられない。
【0062】
比較例2では、スコア導出部110が、フィードバック発話記憶装置12に記憶された情報(スコアが付与されていないフィードバック発話)と、会話ログ記憶装置40に記憶されたログ情報とに基づいて、会話に対してスコアを導出する。例えば、スコア(Scоre)は、下記の式(1)によって導出される。|NEG|は、ログ情報の着目した会話に後続する第2の種別を示すフィードバック発話の数である。|POS|は、ログ情報の着目した会話に後続する第1の種別を示すフィードバック発話の数である。
Scоre=|NEG|−|POS|…(1)
【0063】
[比較例1,2との比較]
図13は、情報処理システム1、比較例1、および比較例2の処理結果の一例を示す図である。図中の縦軸は適合率を示し、横軸は再現率を示している。適合率は、情報処理システムが不自然な会話であると判定した結果の中にどの程度正解(不自然な会話)が含まれるかを示す指標である。この場合において、会話スコアが閾値以上である場合に、不自然な会話であると判定した。正解(不自然な会話である)ラベルは、人によって付与されたものである。再現率は、正解のうち情報処理システム1が不自然な会話であると判定した度合を示す指標である。AUC(Area Under the Curve)は、グラフの曲線より下の部分の面積である。
【0064】
図示するように、本実施形態の情報処理システム1は、比較例1と同等、または比較例1以上の性能を有する。より具体的には、比較例1の手法は、会話分類器の学習データをタスクごと、ドメインごとに人手で作成しなくてはならないという高コスト手法であるが、本実施形態の手法はタスクやドメインに依存しない低コストな手法であるにも関わらず、比較例1と同等の性能を示している。また、本実施形態の情報処理システム1は、フィードバック発話が曖昧であり、フィードバック発話が低頻度であることを考慮していない比較例2に比して、顕著な性能を有する。
【0065】
以下、情報処理システム1を変形させた、変形例1の情報処理システム1A、変形例2の情報処理システム1B、および変形例3の情報処理システム1Cについて説明する。
【0066】
[変形例1]
変形例1は、発話学習データ記憶装置14に記憶された、自然ラベルまたは不自然ラベルが付与された自動応答装置と利用者との会話を、更に会話分類器生成部64に学習させた例である。
図14は、変形例1の情報処理システム1Aの機能構成の一例を示す図である。
【0067】
[変形例2]
変形例2は、発話分類器24を省略した例である。この場合、情報処理システム1Bにおいて、スコア付きフィードバック発話記憶装置50に代えて、フィードバック発話記憶装置12が設けられる。
図15は、変形例2の情報処理システム1Bの機能構成の一例を示す図である。情報処理システム1Bの会話分類器生成部64は、上述した式(1)を用いて自然な会話である確率が高い会話候補と、不自然な会話である確率が高い会話候補とを導出する。
【0068】
情報処理システム1Bは、例えば、スコアが所定の範囲内である会話を自然な会話である確率が高い会話候補とし、スコアが所定の範囲とは異なる範囲内である会話を不自然な会話である確率が高い会話候補とする。
【0069】
[変形例3]
図16は、変形例3の情報処理システム1Cの機能構成の一例を示す図である。変形例3は、学習データ生成部63および会話学習データ記憶装置52が省略され、情報処理システム1の会話分類器66に代えて、スコア導出部120を備えたものである。抽出部62が、スコア付きフィードバック発話記憶装置50に記憶されたフィードバック発話のうち、スコアが第1の範囲(例えば最小値から20や30パーセント)および第2の範囲(例えば最大値から20や30パーセント内)のスコアを有するフィードバック発話を抽出する。スコア導出部120は、抽出部62により抽出されたフィードバック発話を用いてスコアを導出する。具体的には、スコア導出部は、上述した式(1)を用いてスコアを導出する。
【0070】
[変形例との比較]
図17は、情報処理システム1、変形例1、変形例2、および変形例3の処理結果の一例を示す図である。
図13と同様の説明については省略する。
【0071】
図17に示すように、情報処理システム1、変形例1、および変形例2は、会話分類器66を有していない変形例3に比して、性能が高い。情報処理システム1、および変形例1は、発話分類器24を有していない変形例2に比して、性能が高い。すなわち会話分類器66が本実施形態の情報処理システム1の性能に大きく寄与していることが実験から明らかになった。なお、変形例1は、情報処理システム1に比して性能がやや高い。
【0072】
以上説明した実施形態によれば、情報処理システム1は、会話の集合から、第1の発話主体により発せられた発話に対する第2の発話主体の所定の反応を示していると推定されるフィードバック発話の直前の会話を、フィードバック発話に付与されている発話スコアに基づいて抽出する抽出部62と、抽出部62により抽出された直前の会話に基づいて、未知の会話の種別を示す指標を導出する会話分類器66を生成する会話分類器生成部64と、を備えることにより、未知の会話が所定の種別であるかを判定する手がかりを自動的に取得することができる。
【0073】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。