特許7216627 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 東京海上日動火災保険株式会社の特許一覧

特許7216627入力支援方法、入力支援システム、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-01-24

(45)【発行日】2023-02-01

(54)【発明の名称】入力支援方法、入力支援システム、及びプログラム

(51)【国際特許分類】

G06F 40/279 20200101AFI20230125BHJP

G06F 40/186 20200101ALI20230125BHJP

G10L 15/10 20060101ALI20230125BHJP

G10L 15/00 20130101ALI20230125BHJP

G10L 15/065 20130101ALI20230125BHJP

【ＦＩ】

G06F40/279

G06F40/186

G10L15/10 500Z

G10L15/00 200A

G10L15/065 Z

【請求項の数】 9

(21)【出願番号】P 2019163108

(22)【出願日】2019-09-06

(65)【公開番号】P2021043530

(43)【公開日】2021-03-18

【審査請求日】2022-03-03

【早期審査対象出願】

(73)【特許権者】

【識別番号】595140170

【氏名又は名称】東京海上日動火災保険株式会社

(74)【代理人】

【識別番号】110000408

【氏名又は名称】弁理士法人高橋・林アンドパートナーズ

(72)【発明者】

【氏名】川村雅之

(72)【発明者】

【氏名】河野信輝

(72)【発明者】

【氏名】松本淳太郎

(72)【発明者】

【氏名】上屋佳子

【審査官】長由紀子

(56)【参考文献】

【文献】特開２０１９－００８７２２（ＪＰ，Ａ）

【文献】特開２０１８－０８１２９８（ＪＰ，Ａ）

【文献】特開２０１５－００１９１０（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１１／０３０７２５７（ＵＳ，Ａ１）

【文献】特開２０１１－２１０１８７（ＪＰ，Ａ）

【文献】田村晃裕外２名，コールメモを利用したコールセンタ向け音声対話要約方式の提案，言語処理学会第１７回年次大会発表論文集チュートリアル本会議ワークショップ［ＣＤ－ＲＯＭ］，日本，言語処理学会，2011年03月31日，pp.924-927

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ４０／００－５８

Ｇ１０Ｌ１５／００－１０

Ｇ０６Ｑ１０／００－９９／００

Ｇ１６Ｈ１０／００－８０／００

(57)【特許請求の範囲】

【請求項1】

通話テキストデータに含まれる単語及び文字をそれぞれ抽出し、一つの単語及び連続する複数の単語、並びに一つの文字及び連続する複数の文字のそれぞれに対して出現頻度及び希少度によって重み付けされた特徴ベクトルを生成し、
前記特徴ベクトルを入力とした機械学習モデルの演算によって、案件を管理するアプリケーションに登録するために、前記通話テキストデータの内容に対応した選択可能な複数の候補の定型文を前記アプリケーションに出力する、入力支援方法。

【請求項2】

前記機械学習モデルは、ロジスティック回帰、ニューラルネットワークを含む、請求項１に記載の入力支援方法。

【請求項3】

前記特徴ベクトルと、前記通話テキストデータに対して選択された定型文に基づいて、前記機械学習モデルを更新する、請求項１又は２に記載の入力支援方法。

【請求項4】

前記特徴ベクトルは、
前記通話テキストデータから、オペレータが発話したテキストデータが抽出され、
前記オペレータが発話したテキストデータに含まれる単語及び文字がそれぞれ抽出され、一つの単語及び連続する複数の単語、並びに一つの文字及び連続する複数の文字のそれぞれに対して出現頻度及び希少度によって重み付けされている、請求項１乃至３のいずれか一項に記載の入力支援方法。

【請求項5】

前記通話テキストデータは、通話の開始を示すタグと前記通話の終了を示すタグとを含む、請求項１乃至４のいずれか一項に記載の入力支援方法。

【請求項6】

前記通話テキストデータは、通話の開始を示すタグと通話の途中を示す区切りタグとを含み、
前記通話テキストデータを取得する度に、前記通話テキストデータを前記特徴ベクトルに変換し、前記特徴ベクトルを入力とした機械学習モデルの演算によって、前記アプリケーションに出力される前記通話テキストデータに対応した選択可能な複数の候補の定型文を更新する、請求項１乃至５のいずれか一項に記載の入力支援方法。

【請求項7】

請求項１乃至６のいずれか一項に記載の入力支援方法を、
コンピュータに実行させるためのプログラム。

【請求項8】

通話音声データをテキスト化するテキストデータ変換部と、
通話テキストデータを取得するテキストデータ取得部と、
前記通話テキストデータに含まれる単語及び文字をそれぞれ抽出し、一つの単語及び連続する複数の単語、並びに一つの文字及び連続する複数の文字のそれぞれに対して出現頻度及び希少度によって重み付けされた特徴ベクトルを生成する前処理部と、
前記特徴ベクトルを入力とした機械学習モデルの演算によって、案件を管理するアプリケーションに登録するために、前記通話テキストデータの内容に対応した選択可能な複数の候補の定型文を前記アプリケーションに出力する分類器と、を含む入力支援システム。

【請求項9】

前記テキストデータ変換部は、ファイルサーバに含まれ、
前記テキストデータ取得部、前記前処理部、及び前記分類器は、分析サーバに含まれる、請求項８に記載の入力支援システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明の一実施形態は、入力支援システム、入力支援方法、及びプログラムに関する。

【背景技術】

【0002】

従来から、コールセンタにおいて、カスタマからの問い合わせ、照会、又は要求に対し、カスタマ対応を行う従業員（以下、オペレータと記す）が対応している。電話によるカスタマ対応が終了したオペレータは、カスタマ対応における進捗状況を、案件を管理するシステムに入力して、他のオペレータと情報の共有化を図っている。

【0003】

特許文献１には、コールセンタにおいて、カスタマからの問い合わせに応じて、当該問い合わせに対応づけるインシデントの種別と、インシデントの種別に対応づけて取りうるアクションの内容を表示するシステムが開示されている。また、特許文献１には、オペレータが、カスタマからの問い合わせに対してどのように対応したかを、プルダウンメニューから選択することによって、システムに入力することが記載されている。オペレータが、案件の処理の進捗状況をシステムに入力することによって、他のオペレータが、当該案件を引き継いだ場合であっても、他のオペレータが残りの処理を行うことができる。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１９－８７２２号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

コールセンタで扱う案件の種別に応じて、取りうるアクションが異なっており、案件の対応のステージにおいても取りうるアクションが異なっている。そのため、案件を管理するアプリケーション（以下、案件管理アプリケーションという）に入力するべき進捗状況の定型文は、数十以上、又は数百以上となる場合がある。オペレータがプルダウン方式で目的の定型文を選択する場合、数百以上ある項目の中から目的の定型文を探すことが困難となる。また、プルダウン方式で目的の定型文を探すのではなく、テキストで入力する場合には、案件管理アプリケーションへの入力に時間がかかってしまう。また、オペレータの熟練度が低い場合には、さらに時間がかかってしまう。

【0006】

上記問題に鑑み、本発明の一実施形態では、オペレータが案件管理アプリケーションに登録するための定型文を入力する際の入力支援方法を提供することを目的の一つとする。

【課題を解決するための手段】

【0007】

本発明の一実施形態に係る入力支援方法は、通話テキストデータに含まれる単語及び文字をそれぞれ抽出し、一つの単語及び連続する複数の単語、並びに一つの文字及び連続する複数の文字のそれぞれに対して出現頻度及び希少度によって重み付けされた特徴ベクトルを生成し、特徴ベクトルが入力されると、機械学習モデルによって、案件を管理するアプリケーションに登録するための通話テキストデータの内容に対応する候補の定型文を出力する。

【0008】

上記方法において、機械学習モデルは、ロジスティック回帰、ニューラルネットワークを含む。

【0009】

上記方法において、特徴ベクトルと、通話テキストデータに対して選択された定型文に基づいて、機械学習モデルを更新する。

【0010】

上記方法において、特徴ベクトルは、通話テキストデータから、オペレータが発話したテキストデータが抽出され、オペレータが発話したテキストデータに含まれる単語及び文字がそれぞれ抽出され、一つの単語及び連続する複数の単語、並びに一つの文字及び連続する複数の文字のそれぞれに対して出現頻度及び希少度によって重み付けされている。

【0011】

上記方法において、通話テキストデータは、通話の開始を示すタグと通話の終了を示すタグとを含む。

【0012】

上記方法において、通話テキストデータは、通話の開始を示すタグと通話の途中を示す区切りタグとを含み、通話テキストデータを取得する度に、通話テキストデータを特徴ベクトルに変換し、特徴ベクトルを入力とした機械学習モデルの演算によって、アプリケーションに出力される通話テキストデータに対応した候補の定型文を更新する。

【0013】

本発明の一実施形態に係る入力支援方法を、コンピュータに実行させるためのプログラムである。

【0014】

本発明の一実施形態に係る入力支援システムは、通話音声データをテキスト化するテキストデータ変換部と、通話テキストデータを取得するテキストデータ取得部と、通話テキストデータに含まれる単語及び文字をそれぞれ抽出し、一つの単語及び連続する複数の単語、並びに一つの文字及び連続する複数の文字のそれぞれに対して出現頻度及び希少度によって重み付けされた特徴ベクトルを生成する前処理部と、特徴ベクトルが入力されると、機械学習モデルによって、案件を管理するアプリケーションに登録するための通話テキストデータの内容に対応する候補の定型文を出力する分類器と、を含む。

【0015】

上記システムにおいて、テキストデータ変換部は、ファイルサーバに含まれ、テキストデータ取得部、前処理部、及び分類器は、分析サーバに含まれる。

【発明の効果】

【0016】

本発明の一実施形態によれば、オペレータが案件管理アプリケーションに登録するための定型文を入力する際に、目的の定型文の検索時間を短縮することができる。これにより、目的の定型文を探す時間を大幅に短縮することができるため、業務効率化を図ることができる。

【図面の簡単な説明】

【0017】

【図1】本発明の一実施形態に係る入力支援システムのブロック図である。

【図2】通話テキストデータの一例である。

【図3】分析サーバのハードウェア構成を示す図である。

【図4】分析サーバのブロック図である。

【図5】学習段階を説明するフローチャートである。

【図6】単語ベクトルを生成する方法を説明するフローチャートである。

【図7】文字ベクトルを生成する方法を説明するフローチャートである。

【図8】分析サーバのブロック図である。

【図9】推定段階を説明するフローチャートである。

【図10】端末装置の画面に表示される定型文の一例である。

【図11】通話テキストデータの一例である。

【図12】推定段階を説明するフローチャートである。

【図13】本発明の一実施形態に係る入力支援システムのブロック図である。

【発明を実施するための形態】

【0018】

以下、本発明の一実施形態について、図面を参照しながら説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明はこれらの実施形態に限定されるものではない。なお、本実施形態で参照する図面において、同一部分または同様な機能を有する部分には同一の符号または類似の符号（数字の後にＡ、Ｂなどを付しただけの符号）を付し、その繰り返しの説明は省略する場合がある。

【0019】

（第１実施形態）
本実施形態では、本発明の一実施形態に係る入力支援システム１について図１乃至図１０を参照して説明する。

【0020】

［入力支援システムの概要］
まず、本発明の一実施形態に係る入力支援システム１の概要について説明する。図１は、本発明の一実施形態に係る入力支援システム１のブロック図である。入力支援システム１は、コールセンタ業務において、カスタマとオペレータとの会話の内容から、案件に対する適切な進捗状況を示す定型文を推定する。これにより、案件管理アプリケーションに登録する定型文の入力支援を行うものである。

【0021】

コールセンタ業務において、カスタマ通話端末４１からコールセンタに電話がかかってくると、オペレータ通話端末３０に接続される。オペレータ通話端末３０は、カスタマとオペレータとの会話を、通話音声データとして記録する。通話音声データは、ファイルサーバ１０で記録される。カスタマ通話端末４１とオペレータ通話端末３０との接続が切断されると、ファイルサーバ１０で取得した通話音声データは、通話テキストデータに変換される。ファイルサーバ１０は、分析サーバ２０に、通話テキストデータを送信する。分析サーバ２０が通話テキストデータを取得すると、通話テキストデータから、単語ベクトル及び文字ベクトルが統合された特徴ベクトルを生成する。本明細書等において、特徴ベクトルとは、各通話テキストデータについて、そこに含まれる語と、その重要度によって文書の内容をベクトルで表したものをいう。特徴ベクトルを分類器２４に入力すると、学習済みの機械学習モデルによって通話テキストデータに対応する案件管理アプリケーションに登録するための候補の定型文をＷｅｂサーバ２５に出力する。Ｗｅｂサーバ２５に出力された候補の定型文は、シンクライアントサーバ３３を介して、端末装置３２に表示される。端末装置３２において、候補の定型文から、通話テキストデータに対応する定型文が選択されると、案件管理アプリケーションに、選択された定型文を入力することができる。

【0022】

分類器２４が有する機械学習モデルは、通話テキストデータから生成された特徴ベクトルと、複数の定型文とのデータセットに基づいて、予め機械学習によって生成されている。そのため、分析サーバ２０が通話テキストデータを取得すると、機械学習モデルによって、通話テキストデータに対応する候補の定型文を推定することができる。これにより、オペレータは、端末装置３２に表示された候補の定型文の中から、カスタマとの通話の内容に対応する定型文を選択すればよいため、数十以上、又は数百以上ある定型文の中から定型文を探し出す場合と比較して、定型文の検索時間を短縮することができる。これにより、オペレータの熟練度に関わらず、目的の定型文を探す時間を大幅に短縮することができるため、業務効率化を図ることができる。

【0023】

上述の入力支援システム１は、通話音声データを扱う様々な業務に適用可能である。入力支援システム１は、例えば、カスタマとオペレータとの通話が行われる保険業務、銀行業務、及び販売業務に適用することができる。ここで、通話とは、カスタマ通話端末４１と、オペレータ通話端末３０とが接続されてから、切断されるまでの間を意味する。

【0024】

以降、本発明の一実施形態に係る入力支援システム１の構成について詳細に説明する。また、通話音声データを扱う業務として、保険に関するコールセンタ業務を一例に挙げて説明する。

【0025】

［入力支援システムの構成］
図１に示す入力支援システム１は、ファイルサーバ１０及び分析サーバ２０を少なくとも有する。また、入力支援システム１は、交換機３１、オペレータ通話端末３０、端末装置３２、及びシンクライアントサーバ３３をさらに有していてもよい。図１では、ファイルサーバ１０は、通信網５２を介して分析サーバ２０と接続される。

【0026】

コールセンタにおいて、交換機３１は、通信網５１を介して、カスタマ通話端末４１と通信可能に接続されている。通信網５１は、インターネットやＰＳＴＮ（ＰｕｂｌｉｃＳｗｉｔｃｈｅｄＴｅｌｅｐｈｏｎｅＮｅｔｗｏｒｋｓ）等のような公衆網、無線ネットワーク等である。また、交換機３１は、複数のオペレータ通話端末３０と接続されている。交換機３１は、カスタマ通話端末４１からの呼び出しを受けると、複数のオペレータ通話端末３０のいずれかと接続する。

【0027】

データセンタにおいて、ファイルサーバ１０は、通話データ取得部１１、テキストデータ変換部１２、及び格納部１３を有する。通話データ取得部１１は、オペレータ通話端末３０と、カスタマ通話端末４１とが接続されると、カスタマとオペレータとの会話を通話音声データとして格納部１３に記録する。通話音声データには、通話開始時間、通話終了時間、通話開始を示すタグ及び通話終了開始を示すタグや、通話音声データを区別するための識別情報が付与されてもよい。オペレータ通話端末３０は、カスタマの通話音声データとオペレータの通話音声データとを分けて記録してもよい。

【0028】

テキストデータ変換部１２は、通話音声データを取得すると、音声認識処理によって、通話テキストデータに変換する。図２は、通話テキストデータ４００の一例である。図２に示すように、通話テキストデータ４００には、カスタマが発話した内容には、カスタマのタグが付与され、オペレータが発話した内容には、オペレータのタグが付与される。また、通話開始時間、通話終了時間、通話開始を示すタグ及び通話終了開始を示すタグや、通話テキストデータを区別するための識別情報が付与されてもよい。音声認識処理は、カスタマ通話端末４１とオペレータ通話端末３０とが接続されている間、リアルタイムで実行してもよいし、カスタマ通話端末４１とオペレータ通話端末３０との接続が切断されてから音声認識処理を実行してもよい。本実施形態では、この音声認識処理には、周知な手法が利用されればよく、音声認識処理自体及びその音声認識処理で利用される各種音声認識パラメータは特に限定されない。また、通話テキストデータは、格納部１３に格納される。

【0029】

分析サーバ２０は、テキストデータ取得部２１、前処理部２２、格納部２３、分類器２４、及びＷｅｂサーバ２５を有する。

【0030】

テキストデータ取得部２１は、テキストデータ変換部１２から通信網５２を介して通話テキストデータを取得する。

【0031】

前処理部２２は、通話テキストデータに前処理を行って特徴ベクトルを生成する。

【0032】

格納部２３には、通話テキストデータから生成された特徴ベクトルが学習データとして格納される。また、格納部２３には、案件管理アプリケーションに登録するための全ての種類の定型文が格納される。定型文は、例えば、第１段階から第３段階まで各々数１０種類以上設定されている。定型文は、第１段階で選択される定型文、第２段階で選択される定型文、第３段階で選択される定型文が組み合わされて１つのセットとする。なお、候補の定型文セットは、少なくとも第１段階で選択される定型文が含まれていればよい。また、第１段階で選択される定型文及び第２段階で選択される定型文の組み合わせであってもよい。ここでは、定型文セットの種類を、３００種類とする。また、格納部２３には、学習データに対応して、アノテーションされたメタデータ（「正解」を与えるラベル）である定型文データが格納される。また、格納部２３には、取得した通話テキストデータ、機械学習モデル、及び本発明の一実施形態に係る入力支援方法を実行するためのプログラムなどが格納される。

【0033】

分類器２４は、特徴ベクトルが入力されると、学習済みの機械学習モデルによって案件管理アプリケーションに登録するための複数の定型文（セット）各々の発生確率を出力する。機械学習のアルゴリズムとして、ロジスティック回帰、ニューラルネットワーク、サポートベクターマシン、ランダムフォレスト、又はナイーブベイズ等が挙げられる。本実施形態では、機械学習のアルゴリズムとして、ロジスティクス回帰を用いている。ロジスティック回帰は、シグモイド関数をモデルの出力に用いる。任意の値を０から１の間に写像するシグモイド関数を用いることにより、与えられたデータが正例（＋１）になるか、負例（０）になるかの確率が求められる。シグモイド関数では閾値によって正例と負例とを分類する。シグモイド関数が出力した定型文ごとの発生確率に対し、あらかじめ決められた閾値（例えば、０．８）以上の発生確率を持つ定型文を候補として推定することができる。また、別の方法として、閾値を設けず、発生確率上位の複数の定型文（例えば、上位５つの定型文）を候補と推定することもできる。

【0034】

Ｗｅｂサーバ２５は、候補の定型文を出力する。Ｗｅｂサーバ２５は、通信網５２を介してシンクライアントサーバ３３に接続されている。シンクライアントサーバ３３は、端末装置３２で使用される各種ソフトウェア（アプリケーション）を保持する。シンクライアントサーバ３３が、端末装置３２に仮想デスクトップを稼働させる場合には、その仮想デスクトップ上で稼働させるアプリケーションを保持する。アプリケーションの一つには、案件管理アプリケーションがある。端末装置３２は、シンクライアントサーバ３３を介して、Ｗｅｂサーバ２５から出力された結果を表示する。

【0035】

端末装置３２に表示された候補の定型文から、定型文が選択されると、シンクライアントサーバ３３に保持される案件管理アプリケーションに、カスタマとの通話の内容に対応する定型文を登録することができる。

【0036】

［分析サーバのハードウェア構成］
図３は、分析サーバ２０のハードウェア構成を説明するブロック図である。図３に示すように、分析サーバ２０は、制御部２０１、メモリ２０２、記憶部２０３、及び通信部２０４を有する。

【0037】

制御部２０１は、例えば、ＣＰＵ（例えば、複数のプロセッサコアを実装したマルチ・プロセッサなど）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔｓ）、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒｓ）、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙｓ）などを組み合わせることによって構成される。また、制御部２０１として、より高速な演算処理を可能にするために、ＧＰＧＰＵ（Ｇｅｎｅｒａｌ－ＰｕｒｐｏｓｅｃｏｍｐｕｔｉｎｇｏｎＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔｓ）を用いることが好ましい。

【0038】

メモリ２０２は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）及びＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等のメモリを用いる。ＲＯＭは、制御部２０１に各種の処理を実行させるための制御プログラムが予め記憶された不揮発性の記憶部である。ＲＡＭは、各種の情報を記憶する揮発性又は不揮発性のメモリであり、制御部２０１が実行する各種の処理の一時記憶メモリ（作業領域）として使用される。

【0039】

記憶部２０３は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）又はＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）などの書き換え可能な不揮発性の記録媒体で構成される。記憶部２０３には、格納部２３に格納される通話テキストデータ、学習データ、定型文データ、機械学習モデル、本発明の一実施形態に係る入力支援方法をコンピュータに実行させるためのプログラムなどが記憶される。これらのデータは、それぞれ異なる記憶媒体に格納されてもよい。

【0040】

通信部２０４は、有線通信用のネットワークカード等の通信デバイス、ファイルサーバ１０に接続する無線通信デバイス、又はアクセスポイントへの接続に対応する無線通信デバイスを用いることができる。制御部２０１は、通信部２０４により、通信網５１を介してファイルサーバ１０又はシンクライアントサーバ３３との間で通信接続又は情報の送受信が可能である。

【0041】

分析サーバ２０として、少なくとも上記のハードウェア構成を備えていれば良く、企業が提供するクラウドサービス、例えば、ＡＷＳ（登録商標）（ＡｍａｚｏｎＷｅｂＳｅｒｖｉｃｅｓ（登録商標））、Ａｚｕｒｅ（登録商標）（Ｍｉｃｒｏｓｏｆｔ（登録商標））、ＧＣＰ（登録商標）（ＧｏｏｇｌｅＣｌｏｕｄＰｌａｔｆｏｒｍ（登録商標））を用いて構築されてもよい。

【0042】

［入力支援方法のフローチャート］
次に、本発明の一実施形態に係る入力支援方法について、図４乃至図１０を参照して説明する。分析サーバ２０は、それぞれの処理を制御部２０１によって実行させる。

【0043】

［学習段階］
まず、定型文の学習段階について説明する。図４は、機械学習モデルの学習段階で使用される分析サーバ２０の機能ブロックである。図４に、分析サーバ２０のテキストデータ取得部２１、前処理部２２、格納部２３、及び分類器２４の機能ブロックを示す。図５は、学習段階を説明するフローチャートである。

【0044】

学習段階において、まず、テキストデータ取得部２１は、学習用通話テキストデータを取得する（ステップＳ３０１）。学習用通話テキストデータとは、過去から蓄積された通話テキストデータである。学習用通話テキストデータは、例えば、ファイルサーバ１０の格納部１３から取得する。本実施形態では、学習用通話テキストデータを２万件とする。ここで、通話テキストデータに特徴を持つ数値を含む場合には、数値情報を単一特徴にするために、数値はすべて「０」に変換しておくことが好ましい。

【0045】

次に、前処理部２２は、学習用通話テキストデータに前処理を実行し、単語ベクトルに変換する（ステップＳ３０２）。図６は、学習用通話テキストデータから、単語ベクトルを生成する方法について示している。

【0046】

まず、図６に示すように、取得した通話テキストデータに形態素解析を行って、品詞分解を行う（ステップＳ３１１）。形態素解析は、例えば、ＭｅＣａｂ、ＪＵＭＡＮ＋＋等の各種プログラムや、ライブラリを適宜用いて行うことができる。以下に、形態素解析前の通話テキストデータに含まれる文章の一例を示す。

【0047】

【表1】

【0048】

以下に形態素解析後の通話テキストデータに含まれる文章の一例を示す。通話テキストデータに形態素解析を行うことにより、文章を形態素に分割し、それぞれの品詞や変化を割り出す。

【0049】

【表2】

【0050】

次に、形態素解析を行った通話テキストデータをクリーニングすることにより、単語データを抽出する（ステップＳ３１２）。クリーニングとは、所定の選別基準に基づいて、予め設定された文字又は単語を除去する処理をいう。ここでは、通話テキストデータに含まれる助詞、記号を除去することで、名詞、動詞、形容詞の単語を抽出する。また、クリーニング処理により、自然言語の分類をする上で一般的過ぎて役に立たない単語をストップワードとして除去してもよい。ストップワードとは、例えば、「する」、「ます」等の言葉である。また、ストップワードは、機械学習の結果に応じて、辞書にストップワードを登録しておいてもよい。クリーニング処理の際に、辞書に登録されたストップワードを除去してもよい。これらの他に、クリーニング処理によって、ノイズ等を除去してもよい。以下に、通話テキストデータから助詞及び記号が除去されたデータを示す。以下に示す「ます」、「する」がストップワードに該当する。

【0051】

【表3】

【0052】

以下に、示すデータからストップワードが除去されたデータを示す。これにより、必要な単語データが抽出される。

【0053】

【表4】

【0054】

次に、単語データを、単語ベクトルに変換する（ステップＳ３１３）。まず、単語データを分割する。単語の分割は、例えば、Ｎ－ｇｒａｍによって行う。Ｎ－ｇｒａｍとは、任意の文字列や文書を連続したｎ個の文字又は単語で分割するテキスト分割方法をいう。例えば、ｎが１の場合をｕｎｉ－ｇｒａｍ、ｎが２の場合をｂｉ－ｇｒａｍ、ｎが３の場合をｔｒｉ－ｇｒａｍと呼ぶ。以下に、単語データを、ｔｒｉ－ｇｒａｍで分割する一例を示す。

【0055】

【表5】

【0056】

以下に、ｔｒｉ－ｇｒａｍで分割された一又は連続する複数の単語の出現頻度をカウントすることでベクトル化した結果を示す。

【0057】

【表6】

【0058】

次に、一又は連続する複数の単語に重み付け処理を実行し、重みづけされた単語ベクトルを生成する（ステップＳ３１４）。重み付け処理は、例えば、ｔｆ－ｉｄｆによって行う。ｔｆ－ｉｄｆとは、情報探索やテキストマイニングなどの分野で利用される、文書中に出現した特定の単語がどのくらい特徴的であるかを識別するための指標のことである。ここで、ｔｆ（ｔｅｒｍｆｒｅｑｕｅｎｃｙ）は、その文書の中で特定の単語が出現した回数（出現頻度）を表し、ｉｄｆ（ｉｎｖｅｒｓｅｄｏｃｕｍｅｎｔｆｒｅｑｕｅｎｃｙ）は、コーパス全体の中でその文書を含む文書数の自然対数（希少度）を表し、「ｔｆ×ｉｄｆ」が、その文書中におけるその単語のｔｆ－ｉｄｆ値となる。

【0059】

本実施形態では、例えば、２０万件の通話テキストデータからコーパスを作成する。ｔｆ－ｉｄｆによって、「私」、「昨日」等の通話特有でない単語による影響を抑制することができる。また、２０万件の通話テキストデータ全体を解析することで、各通話テキストデータの中で、定型文の分類にとって重要な単語を選択することができる。また、出現頻度が高い単語であっても、どの通話テキストデータにも出現する単語は、希少度が低くなるように調整する。以下に、重み付けされた単語ベクトルの一例を示す。

【0060】

【表7】

【0061】

次に、重み付けされた単語ベクトルのうち、重要度が上位の単語ベクトルを抽出する（ステップＳ３１５）。本実施形態では、重要度が上位の単語ベクトルを、例えば、２万件抽出する。以上により、通話テキストデータから単語ベクトルに変換することができる。

【0062】

次に、前処理部２２は、学習用通話テキストデータに前処理を実行し、文字ベクトルに変換する（ステップＳ３０３）。図７は、学習用通話テキストデータから、文字ベクトルを生成する方法について示している。なお、通話テキストデータに特徴を持つ数値を含む場合には、この段階で、数値情報を単一特徴にするために、数値はすべて「０」に変換しておくことが好ましい。

【0063】

まず、学習用通話テキストデータに、データクリーニングすることにより、文字データを抽出する（ステップＳ３２１）。文字データに関するデータクリーニングは、単語データのクリーニングと同様の方法で実行する。

【0064】

次に、文字データを、文字ベクトルに変換する（ステップＳ３２２）。文字の分割は、単語の分割と同様に、Ｎ－ｇｒａｍによって行う。本実施形態では、文字データを、ｔｒｉ－ｇｒａｍで分割する。そして、一または連続する複数の文字の出現頻度をカウントすることで文字ベクトルに変換する。

【0065】

次に、文字ベクトルに重み付け処理を実行し、重みづけされた文字ベクトルを生成する（ステップＳ３２３）。重み付け処理は、単語ベクトルと同様に、ｔｆ－ｉｄｆによって行う。

【0066】

次に、重み付けされた文字ベクトルのうち、重要度が上位の文字ベクトルを抽出する（ステップＳ３２４）。本実施形態では、重要度が上位の文字ベクトルを、例えば、６万件抽出する。以上により、通話テキストデータから文字ベクトルを抽出することができる。なお、ステップＳ３０２に示す単語ベクトルに変換する処理と、ステップＳ３０３に示す文字ベクトルに変換する処理との処理の順序を逆にして実行してもよい。

【0067】

次に、単語ベクトルと、文字ベクトルとを統合することにより、特徴ベクトルを生成する（ステップＳ３０４）。本実施形態では、特徴ベクトルは８万列であり、全て固定長とする。以上説明した処理によって、学習用通話テキストデータから特徴ベクトルを生成することができる。学習用通話テキストデータを全て特徴ベクトルに変換することで、２万行、８万列の特徴ベクトルを学習データ２７とする。

【0068】

次に、ステップＳ３０４によって得られた特徴ベクトルを学習データ２７として、格納部２３に格納する（ステップＳ３０５）。

【0069】

次に、学習データ２７と定型文データ２８とに基づいて、機械学習モデルに機械学習させる（ステップＳ３０６）。定型文データ２８は、格納部２３に格納されている。定型文データ２８は、アノテーションされたメタデータ（「正解」を与えるラベル）である。学習データ２７と定型文データ２８とを、データセット２５とも呼ぶ。データセット２５は、学習用通話テキストデータに対応して２万件、格納部２３に格納されている。学習データ２７と定型文データ２８とで構成されるデータセット２５を教師データとして、機械学習をすることで、学習済み機械学習モデルを生成することができる。

【0070】

最後に、学習済み機械学習モデルを格納部２３に格納する（ステップＳ３０７）。

【0071】

［推定段階］
次に、定型文の推定段階について説明する。図８は、推定段階で使用される分析サーバ２０の機能ブロックである。図８に、分析サーバ２０のテキストデータ取得部２１、前処理部２２、及び分類器２４の機能ブロックを示す。図９は、定型文の推定段階を説明するフローチャートである。

【0072】

推定段階において、まず、テキストデータ取得部２１は、ファイルサーバ１０から、通話テキストデータを取得する（ステップＳ３３１）。ここで、通話テキストデータとは、カスタマとオペレータとの通話によって新たに生成された通話テキストデータである。本実施形態では、通話テキストデータは、カスタマとオペレータとの通話が終了してから、通話テキストデータの分析を実行する。

【0073】

次に、前処理部２２は、通話テキストデータに前処理を実行し、特徴ベクトルに変換する（ステップＳ３３２）。通話テキストデータから特徴ベクトルに変換する方法については、図６及び図７で説明したフローチャートに従えばよい。

【0074】

次に、分類器２４は、特徴ベクトルを入力ベクトルとして、機械学習モデル２９に入力する（ステップＳ３３３）。機械学習モデル２９は、学習段階で説明した学習済み機械学習モデルである。入力ベクトルとして、単語ベクトル２万列及び文字ベクトル６万列の計８万列の特徴ベクトルを機械学習モデル２９に入力する。本実施形態では、シグモイド関数を機械学習モデルの出力として用いている。これにより、出力ベクトルとして、全ての定型文各々に対して発生確率が出力される。例えば、定型文１の発生確率が３％、定型文２の発生確率が３２％、定型文３の発生確率が９８％、・・・・・・のように出力される。シグモイド関数が出力した定型文ごとの発生確率に対し、予め決められた閾値（例えば、０．８）以上の発生確率を持つ定型文を候補として推定してもよい。本実施形態では、シグモイド関数の出力に閾値を設けず、発生確率上位の複数の定型文（例えば、上位５つの定型文）を候補として推定する。

【0075】

最後に、分類器２４は、候補の定型文を、Ｗｅｂサーバ２５に出力する（ステップＳ３３４）。Ｗｅｂサーバに出力される候補の定型文は、例えば、発生確率が高い定型文から出力される。

【0076】

Ｗｅｂサーバ２５に、候補の定型文が出力されると、端末装置３２からシンクライアントサーバ３３を介して、端末装置３２の画面に高い発生確率の少なくとも一つを出力する。

【0077】

図１０は、端末装置３２の画面に表示される定型文の一例である。図１０に示すようにウィンドウ３００に、５つの候補の定型文が表示される。なお、ウィンドウ３００に表示された候補の定型文は、図３に示す通話テキストデータに対応する可能性がある定型文の一例である。

【0078】

図３に示すウィンドウ３００には、Ｗｅｂページのアドレス３０１、通話テキストデータの付属情報３０２、事案番号３０３、登録・更新ボタン３０３、スクロールバー３０４、ページ送りボタン３０６が表示される。また、ウィンドウ３００には、候補の定型文３１１～３１５が発生確率とともに表示される。候補の定型文３１１～３１５は、発生確率が一番高いものから選択された５つの候補の定型文である。候補の定型文は、第１段階で選択される定型文、第２段階で選択される定型文、第３段階で選択される定型文が組み合わされて１つのセットとして表示される。なお、候補の定型文は、少なくとも第１段階で選択される定型文が含まれていればよい。また、第１段階で選択される定型文及び第２段階で選択される定型文の組み合わせであってもよい。

【0079】

オペレータはカーソル３０５によって、候補の選択文を選択する。オペレータによって、ウィンドウ３００に表示された候補の定型文のいずれかが選択されて、登録・更新ボタン３０３が選択されることで、選択された定型文を案件管理アプリケーションに当該定型文を登録することができる。また、提示された候補の定型文の中に適切な定型文がない場合は、ページ送りボタン３０６が選択されることで、次の候補の定型文を複数表示させてもよい。このように、端末装置３２に、通話テキストデータの内容に応じた適切な候補の定型文を表示させることができる。

【0080】

［再学習］
分類器２４において、所定の期間毎に再学習を行い、機械学習モデル２９を更新してもよい。格納部２３は、取得した通話テキストデータを格納部２３に蓄積している。また、通話テキストデータから変換された特徴ベクトルを学習データ２７として格納部２３に蓄積している。その際、通話テキストデータに対応する定型文として選択された定型文には「正解」を与えるラベルが付与されて、定型文データ２８として格納部２３に蓄積している。

【0081】

分類器２４では、蓄積された学習データ２７と定型文データ２８とに基づいて再学習することにより、機械学習モデル２９を更新する。これにより、以前の機械学習モデル２９では、正確に推定できなかった候補の定型文を、更新された機械学習モデル２９により、推定の精度を向上させることができるようになる。なお、機械学習モデル２９の更新のタイミングは、所定の期間毎に限定されず、格納部２３に学習データ２７及び定型文データ２８のデータセット２５が所定数蓄積されたタイミングで実行されてもよい。

【0082】

（第２実施形態）
第１実施形態では、カスタマとオペレータとの通話が終了してから、通話テキストデータを分析サーバ２０に送信して、進捗状況を示す定型文を推定する方法を説明したが、本発明の一実施形態はこれに限定されない。カスタマとオペレータとの通話の途中であっても、リアルタイムで通話音声データを通話テキストデータに変換し、当該通話テキストデータを順次分析してもよい。

【0083】

本実施形態では、カスタマとオペレータとの通話の途中において、通話音声データを通話テキストデータに変換し、通話テキストデータを分析することで、時間の経過毎に候補の定型文を更新する方法について、図１、図１１及び図１２を参照して説明する。

【0084】

カスタマ通話端末４１とオペレータ通話端末とが接続を開始すると、通話データ取得部１１は、通話音声データの取得を開始する。通話音声データの取得が開始されると、通話音声データに、通話開始を示すタグ（以下、開始タグという）が付与される。次に、カスタマとオペレータとの通話の途中において、通話音声データに通話の区切りを示すタグ（以下、区切りタグという）が付与される。通話音声データに付与される通話の区切りを示すタグは、例えば、カスタマの発話と、オペレータの発話が切り替わるタイミングで付与されてもよい。また、通話音声データに通話開始のタグが付与されてから、所定の時間経過後毎に、区切りのタグを付与してもよい。また、音声が途切れてから所定の時間経過後に区切りのタグを付与してもよい。オペレータ通話端末３０とオペレータ通話端末の接続が終了すると、通話音声データに、通話終了を示すタグ（以下、終了タグという）が付与される。

【0085】

テキストデータ変換部１２は、通話音声データに順次音声認識処理を実行し、通話テキストデータに変換する。変換された通話テキストデータにも、開始タグ、区切りタが付与される。終了タグが付与されるまで、通話テキストデータが格納部１３に蓄積される。図１１に、開始タグ、区切りタグ、終了タグが付与された通話テキストデータ４００Ａを示す。図１１において、開始タグから３０秒までの区切りタグを通話テキストデータ４０１とし、開始タグから１分までの区切りタグを通話テキストデータ４０２とし、開始タグから終了タグまでの区切りタグを通話テキストデータ４０３とする。

【0086】

次に、分析サーバ２０が、取得した通話テキストデータを順次分析し、通話が終了するまで候補の定型文を出力し続ける方法について、図１２を参照して説明する。図１１は、分析サーバ２０が定型文を推定する方法を説明するフローチャートである。

【0087】

まず、テキストデータ取得部２１は、ファイルサーバ１０から通話テキストデータ４０１を取得する（ステップＳ３４１）。テキストデータ取得部２１は、カスタマとオペレータとの会話の途中、つまり、ファイルサーバ１０において、通話テキストデータが蓄積されている途中に、通話テキストデータを取得する。取得した通話テキストデータ４０１には、開始タグと区切りタグとが付与されている。

【0088】

次に、前処理部２２は、通話テキストデータ４０１に前処理を実行し、特徴ベクトルに変換する（ステップＳ３４２）。なお、取得した通話テキストデータが、区切りタグよりも後までテキスト化されたものであったとしても、開始タグから区切りタグまでの通話テキストデータで、前処理を実行する。前処理部２２は、区切りタグを検出すると、開始タグから区切りタグまでの通話テキストデータ４０１を特徴ベクトルに変換する。次に、分類器２４は、特徴ベクトルを入力ベクトルとして、機械学習モデル２９に入力する（ステップＳ３４３）。次に、分類器２４は、候補の定型文を、Ｗｅｂサーバ２５に出力する（ステップＳ３４４）。以上の処理により、カスタマとオペレータとの通話の途中における候補の定型文を出力することができる。

【0089】

次に、テキストデータ取得部２１は、ファイルサーバ１０から通話テキストデータ４０２を取得する（ステップＳ３４１）。テキストデータ取得部２１は、所定の時間の経過毎に通話テキストデータを取得する。取得した通話テキストデータ４０２には、開始タグと区切りタグ、及び追加された区切りタグが付与されている。

【0090】

次に、前処理部２２は、通話テキストデータ４０２に前処理を実行し、特徴ベクトルに変換する（ステップＳ３４２）。前処理部２２は、追加された区切りタグを検出すると、開始タグから追加された区切りタグまでの通話テキストデータ４０２を特徴ベクトルに変換する。次に、分類器２４は、特徴ベクトルを入力ベクトルとして、機械学習モデル２９に入力する（ステップＳ３４３）。次に、分類器２４は、候補の定型文を、Ｗｅｂサーバ２５に出力する（ステップＳ３４４）。以上の処理により、カスタマとオペレータとの通話の途中において候補の定型文を更新することができる。

【0091】

分析サーバ２０は、図１１に示す推定処理を、カスタマとオペレータとの会話が終了するまで、つまり、前処理部２２が通話テキストデータから終了タグを検出するまで、繰り返し実行し続ける。テキストデータ取得部２１が取得する通話テキストデータの量は、時間の経過毎に増加する。そのため、通話テキストデータの量が増加するに従って、出力される候補の定型文の精度を向上させることができる。さらに、カスタマとオペレータとの通話が終了した時点で、最終的な候補の定型文を出力することができる。そのため、オペレータは、通話が終了した際に、直ちに進捗管理アプリケーションに通話の内容に対応する定型文を入力することができるため、進捗管理アプリケーションに定型文を登録するまでの時間を短縮することができる。

【0092】

（変形例１）
先に説明した実施形態では、カスタマとオペレータとの通話テキストデータを用いて、候補の定型文を出力する方法について説明したが、本発明の一実施形態はこれに限定されない。カスタマとオペレータとの通話音声データから、オペレータの発話テキストデータを抽出して、機械学習を行ってもよい。この場合、前処理部２２において、オペレータの発話テキストデータを抽出した後、オペレータの発話テキストに対して前処理を実行して特徴ベクトルを生成すればよい。カスタマとオペレータとの会話において、カスタマよりもオペレータの方が、案件に対する現在の状況を示す内容を話すことが多い。そのため、通話テキストデータから、オペレータが発話したテキストデータのみを抽出して、分析を行うことで、分析処理時間を短縮することができる。

【0093】

（変形例２）
先に説明した実施形態では、通話音声データを通話テキストデータに変換してから、分析サーバ２０のテキストデータ取得部２１に送信する方法について説明したが本発明の一実施形態はこれに限定されない。ファイルサーバ１０で取得した通話音声データを、分析サーバ２０に送信してから、音声認識処理によって通話テキストデータに変換してもよい。その後、分析サーバ２０において、通話テキストデータを特徴ベクトルに変換して、機械学習モデル２９に入力すればよい。

【0094】

（変形例３）
先に説明した実施形態では、定型文を、第１段階で選択される定型文～第３段階で選択される定型文の組み合わせを１つのセットとする例について説明したが、本発明の一実施形態はこれに限定されない。定型文は、第１段階～第３段階の定型文の組み合わせでなくてもよく、一つの定型文であってもよい。また、定型文セットは、第１段階～第３段階に限定されず、第４段階以上の定型文の組み合わせであってもよい。

【0095】

（変形例４）
先に説明した実施形態では、入力支援システム１において、ファイルサーバ１０と分析サーバ２０とが分かれている例について説明したが、本発明の一実施形態はこれに限定されない。図１３に示すように、入力支援システム１Ａに、テキストデータ変換部１２、テキストデータ取得部２１、前処理部２２、及び分類器２４を含む構成であってもよい。

【符号の説明】

【0096】

１：入力支援システム、１０：ファイルサーバ、１１：通話データ取得部、１２：テキストデータ変換部、２０：分析サーバ、２１：テキストデータ取得部、２２：前処理部、２３：格納部、２４：分類器、２５：Ｗｅｂサーバ、２７：学習データ、２８：定型文データ、２９：機械学習モデル、３０：オペレータ通話端末、３１：交換機、３２：端末装置、３３：シンクライアントサーバ、４１：カスタマ通話端末、５１：通信網、５２：通信網、２０１：制御部、２０２：メモリ、２０３：記憶部、２０４：通信部

【図1】