(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-01
(45)【発行日】2023-05-12
(54)【発明の名称】応対業務補助プログラム、応対業務補助装置及び応対業務補助方法
(51)【国際特許分類】
G10L 15/10 20060101AFI20230502BHJP
H04M 3/42 20060101ALI20230502BHJP
G06Q 10/00 20230101ALI20230502BHJP
H04M 3/51 20060101ALI20230502BHJP
G10L 15/22 20060101ALI20230502BHJP
G10L 15/00 20130101ALI20230502BHJP
【FI】
G10L15/10 200W
H04M3/42 P
G06Q10/00
H04M3/51
G10L15/22 470Z
G10L15/00 200T
G10L15/00 200A
(21)【出願番号】P 2021563519
(86)(22)【出願日】2019-12-11
(86)【国際出願番号】 JP2019048535
(87)【国際公開番号】W WO2021117169
(87)【国際公開日】2021-06-17
【審査請求日】2022-06-28
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】中村 和宏
(72)【発明者】
【氏名】篠崎 一人
【審査官】大野 弘
(56)【参考文献】
【文献】特開2000-137496(JP,A)
【文献】特開平08-249343(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/22
G10L 15/00
G10L 15/10
H04M 3/42
G06Q 10/00
H04M 3/51
(57)【特許請求の範囲】
【請求項1】
応対業務で音声データを取得し、
取得した前記音声データをテキストデータに変換し、
変換した前記テキストデータに含まれる検索対象データを特定し、
前記テキストデータに対する前記検索対象データの割合に応じて、前記検索対象データについてのテキスト検索、または前記応対業務における対応への移行処理のいずれを実行するかを決定する、
処理をコンピュータに実行させるための応対業務補助プログラム。
【請求項2】
変換した前記テキストデータを、誤変換辞書データを参照して補正し、
補正した前記テキストデータに含まれる検索対象データを特定する、処理をコンピュータに実行させる、請求項1に記載の応対業務補助プログラム。
【請求項3】
前記検索対象データは、アルファベットまたは数字を含む製品コードに関する文字である、請求項2に記載の応対業務補助プログラム。
【請求項4】
前記検索対象データは、補正した前記テキストデータから、前記製品コードに関する文字以外の文字を削除することで生成される、請求項3に記載の応対業務補助プログラム。(
図4)
【請求項5】
前記検索対象データにおける各文字と、予め定められた製品コードデータにおける各文字とを比較し、前記検索対象データと前記製品コードデータとの類似度を算出する、請求項4に記載の応対業務補助プログラム。
【請求項6】
前記テキストデータに対する前記検索対象データの割合が所定値以上である場合には、前記テキスト検索を実行し、前記テキストデータに対する前記検索対象データの割合が所定値未満である場合には、前記テキストデータに基づいて決定した前記対応への移行処理を実行する、請求項1に記載の応対業務補助プログラム。
【請求項7】
前記類似度は、前記検索対象データにおける各文字のうち、製品コードデータにおける各文字と完全一致した文字の数と、前記検索対象データにおける各文字のうち、製品コードデータにおける対応する文字と所定の関係にある文字の数と、前記検索対象データの文字数とに基づいて算出される、請求項5に記載の応対業務補助プログラム。
【請求項8】
前記類似度を、前記検索対象データの文字数と、前記製品コードデータの文字数との割合に基づいて算出した修正値を用いて修正する、
処理をコンピュータに実行させる、請求項7に記載の応対業務補助プログラム。
【請求項9】
応対業務で音声データを取得する取得部と、
取得した前記音声データをテキストデータに変換する変換部と、
変換した前記テキストデータに含まれる検索対象データを特定する特定部と、
前記テキストデータに対する前記検索対象データの割合に応じて、前記検索対象データについてのテキスト検索、または前記応対業務における対応への移行処理のいずれを実行するかを決定する決定部と
を有する応対業務補助装置。
【請求項10】
応対業務で音声データを取得し、
取得した前記音声データをテキストデータに変換し、
変換した前記テキストデータに含まれる検索対象データを特定し、
前記テキストデータに対する前記検索対象データの割合に応じて、前記検索対象データについてのテキスト検索、または前記応対業務における対応への移行処理のいずれを実行するかを決定する、
処理をコンピュータが実行する応対業務補助方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、応対業務補助プログラム、応対業務補助装置及び応対業務補助方法に関する。
【背景技術】
【0002】
従来より、コンタクトセンターやコールセンター等における応対業務(例えば、顧客による製品の発注や、製品に関する問い合わせ、苦情等に応対する業務)に人工知能を適用することで、オペレータを補助する応対業務補助装置の開発が進められている。
【0003】
かかる応対業務においてオペレータを補助するにあたっては、通話中の発話内容を精度よく音声認識することが求められる。
【先行技術文献】
【特許文献】
【0004】
【文献】特開平7-36481号公報
【文献】特開平6-96129号公報
【文献】特開平7-78183号公報
【文献】特開2004-29138号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、汎用的な音声認識エンジンを用いて応対業務におけるオペレータの補助を行う場合、音声データをテキストデータへ変換することに留まっている。
【0006】
一つの側面では、応対業務において、取得した音声データに応じた適切なオペレータ支援を提供することを目的とする。
【課題を解決するための手段】
【0007】
一態様によれば、応対業務補助プログラムは、応対業務で音声データを取得し、取得した前記音声データをテキストデータに変換し、変換した前記テキストデータに含まれる検索対象データを特定し、前記テキストデータに対する前記検索対象データの割合に応じて、前記検索対象データについてのテキスト検索、または前記応対業務における対応への移行処理のいずれを実行するかを決定する、処理をコンピュータに実行させる。
【発明の効果】
【0008】
応対業務において、取得した音声データに応じた適切なオペレータ支援を提供することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、応対業務補助システムのシステム構成の一例を示す図である。
【
図2】
図2は、応対業務補助装置のハードウェア構成の一例を示す図である。
【
図3】
図3は、検索部の機能構成の一例を示す図である。
【
図4】
図4は、誤変換補正部の機能構成の詳細及び処理の具体例を示す図である。
【
図5】
図5は、判定部の機能構成の詳細及び処理の具体例を示す図である。
【
図6】
図6は、テキスト検索部の機能構成の詳細を示す図である。
【
図7】
図7は、製品コードデータの具体例を示す図である。
【
図8】
図8は、完全一致文字算出部の処理の具体例を示す図である。
【
図9】
図9は、類似音語辞書データの具体例を示す図である。
【
図10】
図10は、半一致文字算出部の処理の具体例を示す図である。
【
図11】
図11は、類似度算出部の処理の具体例を示す図である。
【
図13】
図13は、検索処理の流れを示すフローチャートの一例である。
【発明を実施するための形態】
【0010】
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0011】
[第1の実施形態]
<応対業務補助システムのシステム構成>
はじめに、応対業務補助システムのシステム構成について説明する。
図1は、応対業務補助システムのシステム構成の一例を示す図である。
図1に示すように、応対業務補助システム100は、顧客101~103等に対する応対業務においてオペレータを補助するシステムであって、
・顧客101との通話時にオペレータ111の発話を検出し、音声データを生成するマイク112と、
・生成された音声データに基づいてオペレータ111を補助する処理、または、顧客102、102からの各種質問、各種苦情に応対する処理を行う応対業務補助装置120と、
・応対業務補助装置120において行われたオペレータ111を補助する処理の結果を、オペレータ111に表示する端末113と、
を有する。
【0012】
また、
図1に示すように、応対業務補助装置120は、
・受注補助機能、納期回答補助機能及び型番回答補助機能、
・質問受付機能、
・苦情受付機能、
を有する。
【0013】
このうち、受注補助機能は、例えば、顧客101から製品の発注があった場合に、オペレータ111が復唱した製品コードを音声認識し、音声認識した結果を端末113に表示する。また、納期回答補助機能は、例えば、顧客101から製品の納期について問い合わせがあった場合に、オペレータ111が復唱した製品コードを音声認識し、認識した結果に応じた製品についての納期を不図示のデータベースを参照することで把握する。また、納期回答補助機能は、把握した納期を端末113に表示する。
【0014】
更に、型番回答補助機能は、例えば、顧客101から製品コードについて問い合わせがあった場合に、オペレータ111が復唱した製品コードを音声認識し、音声認識した結果を端末113に表示する。
【0015】
受注業務、納期回答業務及び型番回答業務には、いずれも、業務固有の発話(製品コードに関する発話)が含まれ、これらの応対業務は、"製品コードを高い精度で音声認識することが求められる業務"といえる。このため、受注補助機能、納期回答補助機能、型番回答補助機能は、実行時に、検索部130を利用する。
【0016】
検索部130は、音声認識により音声データをテキストデータに変換した際、変換したテキストデータに対応する製品コードについて、テキスト検索を行う。これにより、検索部130では、テキストデータに誤認識した文字が含まれていた場合であっても、音声認識の結果として、正しい製品コードを出力することができる。つまり、検索部130によれば、業務固有の発話について高い認識精度を実現することができる(なお、検索部130の詳細は後述)。
【0017】
一方、質問受付機能は、例えば、オペレータ111が不在の夜間や休日に、顧客102の各種質問等を受け付ける。質問受付機能は、顧客102による自由発話を受け付ける。
【0018】
また、苦情受付機能は、例えば、顧客103からの各種苦情を受け付け、受け付けた苦情に応じた回答(謝罪等)を行う。質問受付機能と同様に、苦情受付機能も、顧客103による自由発話を受け付ける。
【0019】
つまり、質問受付業務及び苦情受付業務の場合、いずれも、自由発話が含まれ、これらの応対業務は、"製品コードを高い精度で音声認識することが求められる業務以外の業務"といえる。このため、質問受付機能及び苦情受付機能は、実行時に、検索部130を利用しない。
【0020】
このように、応対業務補助装置120では、現在の応対業務が"製品コードを高い精度で音声認識することが求められる業務"である場合に、検索部130によるテキスト検索を行う。これにより、応対業務補助装置120では、"製品コードを高い精度で音声認識することが求められる業務"において、製品コードを高い精度で音声認識することができる。
【0021】
<応対業務補助装置のハードウェア構成>
次に、応対業務補助装置のハードウェア構成について説明する。
図2は、応対業務補助装置のハードウェア構成の一例を示す図である。
図2に示すように、応対業務補助装置120は、プロセッサ201、メモリ202、補助記憶装置203、I/F(Interface)装置204、通信装置205、ドライブ装置206を有する。なお、応対業務補助装置120の各ハードウェアは、バス207を介して相互に接続されている。
【0022】
プロセッサ201は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等の各種演算デバイスを有する。プロセッサ201は、各種プログラム(例えば、後述する応対業務補助プログラム等)をメモリ202上に読み出して実行する。
【0023】
メモリ202は、ROM(Read Only Memory)、RAM(Random Access Memory)等の主記憶デバイスを有する。プロセッサ201とメモリ202とは、いわゆるコンピュータを形成し、プロセッサ201が、メモリ202上に読み出した各種プログラムを実行することで、当該コンピュータは各種機能を実現する。
【0024】
補助記憶装置203は、各種プログラムや、各種プログラムがプロセッサ201によって実行される際に用いられる各種データを格納する。なお、後述する誤変換辞書格納部、製品コードデータ格納部、類似音語辞書格納部は、補助記憶装置203において実現される。
【0025】
I/F装置204は、外部装置の一例であるマイク112、端末113と、応対業務補助装置120とを接続する接続デバイスである。I/F装置204は、マイク112より送信された音声データを受信する。また、I/F装置204は、応対業務補助装置120において処理された結果を端末113に送信する。
【0026】
通信装置205は、不図示のネットワークを介して他の装置と通信するための通信デバイスである。
【0027】
ドライブ装置206は記録媒体210をセットするためのデバイスである。ここでいう記録媒体210には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体210には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
【0028】
なお、補助記憶装置203にインストールされる各種プログラムは、例えば、配布された記録媒体210がドライブ装置206にセットされ、該記録媒体210に記録された各種プログラムがドライブ装置206により読み出されることでインストールされる。あるいは、補助記憶装置203にインストールされる各種プログラムは、通信装置205を介してネットワークからダウンロードされることで、インストールされてもよい。
【0029】
<応対業務補助装置の機能構成の詳細>
次に、応対業務補助装置120において実現される各機能のうち、受注補助機能、納期回答補助機能、型番回答補助機能が実行時に利用する検索部130の機能構成について説明する。
図3は、検索部の機能構成の一例を示す図である。
【0030】
図3に示すように、検索部130は、音声入力部310、音声認識部320、誤変換補正部330、判定部340、テキスト検索部350を有する。
【0031】
音声入力部310は取得部の一例であり、マイク112より送信された音声データを取得し、取得した音声データを音声認識部320に通知する。
【0032】
音声認識部320は変換部の一例である。音声認識部320は、汎用的な音声認識エンジンを有し、音声入力部310より通知された音声データについて音声認識処理を行うことで音声データをテキストデータに変換し、誤変換補正部330に通知する。
【0033】
誤変換補正部330は、音声認識部320より通知されたテキストデータに含まれる文字のうち、音声認識部320により誤認識された文字を、誤変換辞書を参照することで補正する。また、誤変換補正部330は、誤認識された文字を補正した補正後のテキストデータを判定部340及びテキスト検索部350に通知する。
【0034】
判定部340は、誤変換補正部330より通知された補正後テキストデータに基づいて、現在の応対業務が、"製品コードを高い精度で音声認識することが求められる業務"であるか否かを判定する。
【0035】
現在の応対業務が、"製品コードを高い精度で音声認識することが求められる業務以外の業務"であると判定した場合、検索部130は処理を終了し、他の業務を補助する機能に移行する移行処理を実行する。なお、ここでいう他の業務を補助する機能とは、質問受付機能、苦情受付機能等を指すものとする。
【0036】
一方、現在の応対業務が"製品コードを高い精度で音声認識することが求められる業務"であると判定した場合、検索部130では、判定結果をテキスト検索部350に通知する。
【0037】
テキスト検索部350は、判定部340より判定結果が通知された場合に、製品コードデータ格納部370から製品コードデータを読み出す。また、テキスト検索部350は、製品コードデータ格納部370から読み出した製品コードデータと、補正後テキストデータとを比較し、類似度を算出することでテキスト検索を行う。なお、テキスト検索部350では、類似度を算出する際、類似音語辞書格納部380を参照する。
【0038】
更に、テキスト検索部350は、算出した類似度に基づいて、製品コードデータをソートし、類似度が最も高い製品コードデータ(あるいは、所定の閾値以上の類似度を有する製品コードデータ)を、音声認識した結果として、端末113に送信する。
【0039】
<検索部に含まれる各部の詳細構成>
次に、検索部130に含まれる各部(ここでは、誤変換補正部330、判定部340、テキスト検索部350)の機能構成の詳細及び処理の具体例について説明する。
【0040】
(1)誤変換補正部の機能構成の詳細及び処理の具体例
はじめに、誤変換補正部330の機能構成の詳細及び処理の具体例について説明する。
図4は、誤変換補正部の機能構成の詳細及び処理の具体例を示す図である。
図4に示すように、誤変換補正部330は、辞書取得部410、変換部420、削除部430を有する。
【0041】
辞書取得部410は、音声認識部320よりテキストデータが通知されると、誤変換辞書格納部360より誤変換辞書データ400を取得し、変換部420に通知する。
図4に示すように、誤変換辞書データ400は、情報の項目として、"誤認識文字列"、"本来の文字列"を含む。
【0042】
"誤認識文字列"には、オペレータ111が製品コードを読み上げた際の音声データを、音声認識部320が有する汎用的な音声認識エンジンが音声認識した際に、誤認識した文字列が格納される。また、"本来の文字列"には、正しく認識された場合の文字列が格納される。誤変換辞書データ400は、オペレータ111が予め全ての製品コードを読み上げることにより生成される。
【0043】
このため、オペレータが複数いる場合、誤変換辞書データ400は、オペレータごとにわけて生成される。オペレータごとに、製品コードを読み上げる際の癖等が異なるからである。また、業務が複数ある場合、誤変換辞書データ400は、業務ごとに分けて生成される。業務ごとに、製品コードの付け方や呼び方が異なる場合があるからである。なお、誤変換辞書データ400は、あくまで、汎用的な音声認識エンジンによる誤変換の一例を示したものであり、誤変換辞書データ400に記載されてない誤変換が含まれていてもよい。
【0044】
変換部420は、辞書取得部410より通知されたテキストデータに含まれる、誤認識された文字を、誤変換辞書データ400に基づいて補正する。また、変換部420は、誤変換辞書データ400に基づいて補正したテキストデータを、補正後テキストデータ(削除前)として、テキスト検索部350に通知する。更に、変換部420は、誤変換辞書データ400に基づいて補正したテキストデータを、補正後テキストデータ(削除前)として、削除部430に通知する。
【0045】
図4において符号411は、辞書取得部410より、テキストデータとして、「製品コードははい、EQのIA1ダッシュファイル31の11万です。」が通知された様子を示している。
【0046】
また、
図4において符号411は、辞書取得部410より通知されたテキストデータのうち、変換部420が、誤変換辞書データ400に基づいて、
・「はい」を「I」に、
・「の」を「-」に、
・「ダッシュ」を「-」に、
・「ファイル」を「4L」に、
・「の」を「-」に、
・「万」を「0000」に、
それぞれ補正した様子を示している。
【0047】
また、
図4において符号421は、誤認識された文字を含むテキストデータ(符号411)が、変換部420により補正されることで補正後のテキストデータを示している。
【0048】
なお、
図4の例では、オペレータ111が日本語を発話した場合について示したが、例えば、オペレータ111が英語を発話した場合であって、英語用の汎用的な音声認識エンジンによって音声認識処理が行われた場合には、テキストデータとして、例えば、
"The product code is IEQ dash IA One dash 31 dash 110000."
等が通知され、変換部420では、
・"dash"を"-"に、
・"One"を"1"に、
・"dash"を"-"に、
それぞれ補正する。あるいは、テキストデータとして、
"The product code is PW eq900 1tb."
等が通知された場合には、変換部420では、
・スペースの削除、
・小文字から大文字への変換、
等の補正を行う。
【0049】
削除部430は、変換部420より通知された補正後テキストデータ(削除前)から、製品コード以外の文字を削除する。また、削除部430は、補正後テキストデータ(削除前)から、製品コード以外の文字を削除した補正後テキストデータを、テキスト検索部350に出力する。
【0050】
図4において、符号431は、補正後テキストデータ(削除前)(符号421)から、製品コード以外の文字(
図4の例では、「製品コードは」、「、」、「です。」)を削除した、補正後テキストデータを示している。
【0051】
このように、誤変換補正部330では、テキストデータに含まれる各文字から、製品コードとしてありえない文字を補正または削除する。
【0052】
(2)判定部の機能構成の詳細及び処理の具体例
次に、判定部340の機能構成の詳細及び処理の具体例について説明する。
図5は、判定部の機能構成の詳細及び処理の具体例を示す図である。
図5に示すように、判定部340は、文字数算出部510、文字数割合算出部520を有する。
【0053】
文字数算出部510は特定部の一例である。文字数算出部510は、誤変換補正部330より通知された補正後テキストデータ(削除前)全体の文字数を算出する。また、文字数算出部510は、誤変換補正部330より通知された補正後テキストデータ(削除前)に含まれる、製品コードに関する文字(検索対象データ)の文字数を算出する。また、文字数算出部510は、算出した全体の文字数及び製品コードに関する文字(検索対象データ)の文字数を、文字数割合算出部520に通知する。
【0054】
文字数割合算出部520は決定部の一例である。文字数割合算出部520は、全体の文字数に対する、製品コードに関する文字(検索対象データ)の文字数の割合を算出する。また、文字数割合算出部520は、算出した割合が所定の閾値以上(所定値以上)であるか否かを判定する。
【0055】
ここで、文字数割合算出部520では、全体の文字数に対する、製品コードに関する文字の文字数の割合が、所定の閾値以上である場合、現在の応対業務が、"製品コードを高い精度で音声認識することが求められる業務"であると判定する。
【0056】
一方、文字数割合算出部520では、全体の文字数に対する、製品コードに関する文字の文字数の割合が、所定の閾値未満(所定値未満)である場合、現在の応対業務が、"製品コードを高い精度で音声認識することが求められる業務以外の業務"であると判定する。
【0057】
そして、文字数割合算出部520では、所定の閾値以上である場合に、判定結果をテキスト検索部350に通知する。
【0058】
このように、文字数割合算出部520では、現在の応対業務が"製品コードを高い精度で音声認識することが求められる業務"であるか否かを、補正後テキストデータ(削除前)に対する、製品コードに関する文字(検索対象データ)の割合に基づいて判定する。
【0059】
図5の例は、補正後テキストデータ(削除前)として、符号531に示す補正後テキストデータ(削除前)と、符号541に示す補正後テキストデータ(削除前)が通知された様子を示している。
【0060】
このうち、符号531に示す補正後テキストデータ(削除前)が通知された場合、文字数算出部510では、
・全体の文字数=43文字(符号532参照)、
・製品コードに関する文字(検索対象データ)の文字数=19文字(符号533参照)、
と算出し、文字数割合算出部520では、
・全体の文字数に対する、製品コードに関する文字(検索対象データ)の文字数の割合=44%(符号534参照)、
と算出する。この場合、文字数割合算出部520では、算出した割合が所定の閾値未満であると判定し、判定結果を、テキスト検索部350に出力しない。
【0061】
一方、符号541に示す補正後テキストデータ(削除前)が通知された場合、文字数算出部510では、
・全体の文字数=29文字(符号542参照)、
・製品コードに関する文字(検索対象データ)の文字数=19文字(符号543参照)、
と算出し、文字数割合算出部520では、
・全体の文字数に対する、製品コードに関する文字(検索対象データ)の文字数の割合=66%(符号544参照)、
と算出する。この場合、文字数割合算出部520では、算出した割合が所定の閾値以上であると判定し、判定結果を、テキスト検索部350に出力する。
【0062】
(3)テキスト検索部の機能構成の詳細
次に、テキスト検索部350の機能構成の詳細について説明する。
図6は、テキスト検索部の機能構成の詳細を示す図である。
図6に示すように、テキスト検索部350は、検索対象データ取得部610、完全一致文字算出部620、半一致文字算出部630、類似度算出部640、修正部650、ソート部670、出力部680を有する。
【0063】
検索対象データ取得部610は、判定部340より判定結果が通知されると、誤変換補正部330より補正後テキストデータを取得する。なお、誤変換補正部330より取得する補正後テキストデータは、製品コード以外の文字が削除されているため、以降は、検索対象データ取得部610が取得した補正後テキストデータが検索対象データとなる。
【0064】
検索対象データ取得部610は、補正後テキストデータ(検索対象データ)を取得すると、製品コードデータを、製品コードデータ格納部370より読み出す。
【0065】
また、検索対象データ取得部610は、取得した補正後テキストデータ(検索対象データ)と、読み出した製品コードデータとを、完全一致文字算出部620と半一致文字算出部630とに通知する。
【0066】
完全一致文字算出部620は、検索対象データ取得部610より通知された、補正後テキストデータ(検索対象データ)と製品コードデータとを比較し、完全一致する文字の文字数をカウントする。また、完全一致文字算出部620は、完全一致する文字の文字数を、類似度算出部640に通知する。
【0067】
半一致文字算出部630は、検索対象データ取得部610より、補正後テキストデータ(検索対象データ)と製品コードデータとが通知されると、類似音語辞書格納部380から類似音語辞書データを読み出す。
【0068】
また、半一致文字算出部630は、補正後テキストデータ(検索対象データ)のうち、製品コードデータと完全一致する文字以外の文字について判定を行う。具体的には、半一致文字算出部630は、補正後テキストデータ(検索対象データ)の各位置の文字と、対応する各位置の製品コードデータの文字とが、類似音語辞書データが示す関係を有しているか否かを判定する。
【0069】
更に、半一致文字算出部630は、補正後テキストデータ(検索対象データ)の各位置の文字と、対応する各位置の製品コードデータの文字とが、類似音語辞書データが示す関係を有している文字(半一致文字と称す)の文字数を、類似度算出部640に通知する。
【0070】
類似度算出部640は、完全一致文字算出部620より通知された完全一致する文字の文字数と、半一致文字算出部630より通知された半一致文字の文字数とに基づいて、類似度を算出する。また、類似度算出部640は、算出した類似度を修正部650に通知する。
【0071】
修正部650は、類似度算出部640より通知された類似度を、補正後テキストデータ(検索対象データ)の文字数に基づいて下方修正し、下方修正後の類似度をソート部670に通知する。
【0072】
ソート部670は、修正部650より通知された下方修正後の類似度に基づいて、製品コードデータをソートする。
【0073】
出力部680は、ソートされた製品コードデータのうち、N個(Nは任意の整数。例えば、下方修正後の類似度が所定の閾値以上となる製品コードデータの数)の製品コードデータを、音声認識した結果として、端末113に送信する。
【0074】
(4)テキスト検索部の処理の具体例
次に、テキスト検索部350の処理の具体例について、
図7~
図12を用いて説明する。
【0075】
(4-1)製品コードデータの具体例
図7は、製品コードデータの具体例を示す図である。上述したように、製品コードデータ700は、検索対象データ取得部610によって製品コードデータ格納部370から読み出される。検索対象データ取得部610によって読み出される製品コードデータ700には、応対業務において取り扱われる各製品の製品コード(
図7の例では、アルファベット大文字、数字、またはハイフンからなる文字列)が含まれる。
【0076】
(4-2)完全一致文字算出部の処理の具体例
図8は、完全一致文字算出部の処理の具体例を示す図である。具体的には、
図8の例は、完全一致文字算出部620が、
・検索対象データ取得部610より通知された補正後テキストデータ(符号431)と、
・検索対象データ取得部610より通知された製品コードデータ700のうち、第4行目に記載された製品コードデータ(符号801)と、
を比較した様子を示している。
【0077】
図8に示すように、補正後テキストデータ(符号431)において、製品コードデータ(符号801)と完全一致する文字の数は13文字である(下線参照)。したがって、完全一致文字算出部620では、類似度算出部640に、完全一致する文字の文字数として、13文字を通知する。
【0078】
なお、完全一致文字算出部620では、補正後テキストデータ(符号431)と、製品コードデータ(符号801)との間で、
・左端の文字から右端の文字に向かう方向に1文字ずつ移動しながら、対応する位置の文字と比較する、
・対応する位置の前後所定文字数の範囲に含まれる文字と比較する、
ことで、完全一致する文字の文字数をカウントする。
【0079】
例えば、
図8の場合、完全一致文字算出部620では、点線矩形811より後に配列された文字については、1文字分、後にずらすことで、下線に示す文字分(
図8の例では11文字分)の文字が完全一致すると判定している。つまり、完全一致文字算出部620では、少なくとも、点線矩形811より後に配列された文字を製品コードデータ(符号801)と比較する際、製品コードデータ(符号801)の対応する位置の文字だけでなく、1文字後ろの文字についても比較を行っている。
【0080】
なお、
図8の例では、完全一致文字算出部620が1文字後ろの文字を比較対象の範囲に含める例について示したが、比較対象の範囲に含める文字は、1文字後ろの文字に限定されず、複数文字後ろの文字であっても、複数文字前の文字であってもよい。あるいは、文字の出現パターンに基づいて比較を行い、完全一致する文字をカウントしてもよい。
【0081】
(4-3)類似音語辞書データの具体例
図9は、類似音語辞書データの具体例を示す図である。
図9に示すように、類似音語辞書データ900は、情報の項目として、"単語1"、"単語2"、"単語3"を含む。
【0082】
"単語1"には、発話時の音声が類似する他の単語が対応付けられる文字が格納される。"単語2"には、"単語1"に格納された文字と発話時の音声が類似する第1の文字が格納される。"単語3"には、"単語1"に格納された文字と発話時の音声が類似する第2の文字が格納される。
【0083】
図9の類似音語辞書データ900の例では、"Y"を発話した際の音声と、"I"を発話した際の音声とが類似していることを示している。また、
図9の類似音語辞書データ900の例では、"P"を発話した際の音声と、"B"を発話した際の音声と、"T"を発話した際の音声とが類似していることを示している。
【0084】
(4-4)半一致文字算出部の処理の具体例
図10は、半一致文字算出部の処理の具体例を示す図である。具体的には、半一致文字算出部630が、
・検索対象データ取得部610より通知された補正後テキストデータ(符号431)と、
・検索対象データ取得部610より通知された製品コードデータ700のうち、第4行目に記載された製品コードデータ(符号801)と、
を比較した様子を示している。
【0085】
図10の場合、補正後テキストデータ(符号431)と、製品コードデータ(符号801)との間で、類似音語辞書データ900が示す関係を有している文字の文字数(つまり、半一致文字の文字数)は、5文字である(下線参照)。したがって、半一致文字算出部630では、類似度算出部640に対して、半一致文字の文字数として、5文字を通知する。
【0086】
(4-5)類似度算出部の処理の具体例
図11は、類似度算出部の処理の具体例を示す図である。具体的には、類似度算出部640が、完全一致文字算出部620から完全一致する文字の文字数として13文字を、半一致文字算出部630から半一致文字の文字数として5文字を取得した様子を示している。
【0087】
図11に示すように、類似度算出部640では、取得した完全一致する文字の文字数と、取得した半一致文字の文字数とを用いて、下式(式1)に基づいて類似度を算出する。
(式1)類似度=((完全一致する文字の文字数+(半一致文字の文字数)/2))/文字数
なお、(式1)において、"文字数"には、補正後テキストデータ(符号431)の文字数(つまり、検索対象データの文字数)が入力される(
図11の例では、19)。
【0088】
図11に示すように、補正後テキストデータ(符号431)の場合、完全一致する文字の文字数が13文字、半一致文字の文字数が5文字、補正後テキストデータ(検索対象データ)の文字数が19文字であるため、類似度は、81.6%と算出される。
【0089】
(4-6)修正部の処理の具体例
図12は、修正部の処理の具体例を示す図である。
図12に示すように、修正部650では、はじめに、下式(式2)に基づいて、文字数の差の割合を算出する。
(式2)文字数の差の割合=(製品コードデータの文字数)/(補正後テキストデータの文字数)
ここで、
図12に示すように、製品コードデータ(符号801)の文字数は、20文字であり、補正後テキストデータ(検索対象データ)の文字数は、19文字である。したがって、修正部650では、文字数の差の割合を、1.05%と算出する。
【0090】
続いて、修正部650では、下式(式3)に基づいて、類似度の下方修正値を算出する。
(式3)類似度の下方修正値=((文字数の差の割合―1)の絶対値)×係数k
ここで、
図12に示すように、文字数の差の割合は、上述したとおり、1.05%である。また、係数kは、ここでは"0.8"とおく。したがって、修正部650では、類似度の下方修正値を、4%と算出する。
【0091】
続いて、修正部650では、類似度算出部640により算出された類似度を、類似度の下方修正値を用いて下方修正する。
図12の例では、類似度算出部640により算出された類似度が81.6%であり、類似度の下方修正値が4%であることから、修正部650では、下方修正後の類似度を77.6%と算出する。
【0092】
<検索処理の流れ>
次に、検索部130による検索処理の流れについて説明する。
図13は、検索処理の流れを示すフローチャートの一例である。
【0093】
ステップS1301において、音声入力部310は、マイク112から送信された音声データを取得する。
【0094】
ステップS1302において、音声認識部320は、取得された音声データについて音声認識処理を行うことで、音声データをテキストデータに変換する。
【0095】
ステップS1303において、誤変換補正部330は、誤変換辞書格納部360に格納された誤変換辞書データに基づいて、テキストデータを補正する。
【0096】
ステップS1304において、判定部340は、補正後テキストデータ(削除前)に基づいて、現在の業務が、"製品コードを高い精度で音声認識することが求められる業務"であるか否かを判定することで、テキスト検索を行うか否かを判定する。具体的には、判定部340は、補正後テキストデータ(削除前)に対する製品コードに関する文字(検索対象データ)の割合が所定条件を満たすか否かを判定することで、テキスト検索を行うか否かを判定する。
【0097】
ステップS1304において、現在の業務が、"製品コードを高い精度で音声認識することが求められる業務以外の業務"であると判定した場合(ステップS1304においてNoの場合)、ステップS1305に進む。
【0098】
ステップS1305において、判定部340は、他の業務を補助する機能(例えば、質問受付機能、苦情受付機能)に移行する移行処理を実行し、検索処理を終了する。
【0099】
一方、ステップS1304において、現在の業務が、"製品コードを高い精度で音声認識することが求められる業務"であると判定された場合には(ステップS1304においてYesの場合には)、ステップS1306に進む。
【0100】
ステップS1306において、テキスト検索部350は、補正後テキストデータ(検索対象データ)と、製品コードデータとの類似度を算出することでテキスト検索を行う。
【0101】
ステップS1307において、テキスト検索部350は、算出した類似度が最も高い製品コードデータ(あるいは、所定の閾値以上の類似度を有する製品コードデータ)を、音声認識した結果として、端末113に送信する。
【0102】
ステップS1308において、音声入力部310は、検索処理を終了するか否かを判定する。ステップS1308において、検索処理を継続すると判定した場合には(ステップS1308においてNoの場合には)、ステップS1301に戻る。一方、ステップS1308において、検索処理を終了すると判定した場合には(ステップS1308においてYesの場合には)、検索処理を終了する。
【0103】
以上の説明から明らかなように、第1の実施形態に係る応対業務補助装置では、音声データを取得し、取得した音声データをテキストデータに変換する。また、第1の実施形態に係る応対業務補助装置では、変換したテキストデータに含まれる検索対象データを特定し、テキストデータに対する検索対象データの割合に応じて、検索対象データについてのテキスト検索、または応対業務における対応への移行処理のいずれを実行するかを決定する。
【0104】
これにより、第1の実施形態に係る応対業務補助装置によれば、"製品コードを高い精度で音声認識することが求められる業務"において、製品コードを高い精度で音声認識することができる。この結果、第1の実施形態によれば、応対業務において、取得した音声データに応じた適切なオペレータ支援を提供することができる。
【0105】
また、第1の実施形態に係る応対業務補助装置では、テキストデータに対する検索対象データの割合を算出するにあたり、テキストデータを、誤変換辞書データに基づいて補正する。また、第1の実施形態に係る応対業務補助装置では、製品コードデータと、補正後のテキストデータ(検索対象データ)との間で、完全一致する文字の文字数、半一致文字の文字数、及び、全体の文字数を用いて類似度を算出する。更に、第1の実施形態に係る応対業務補助装置では、製品コードデータの文字数と補正後のテキストデータ(検索対象データ)の文字数との差に応じて類似度を下方修正し、下方修正後の類似度に応じた製品コードデータを、音声認識の結果として出力する。
【0106】
このように、第1の実施形態に係る応対業務補助装置では、オペレータの癖等を考慮してテキストデータを補正するとともに、音声データに適した算出方法により類似度を算出する。これにより、第1の実施形態によれば、音声認識の結果として、正しい製品コードを出力することができる。
【0107】
[第2の実施形態]
上記第1の実施形態では、製品コードデータの文字数と、補正後テキストデータ(検索対象データ)の文字数との差の割合を算出する際、製品コードデータの文字数を補正後テキストデータ(検索対象データ)の文字数で除算するものとして説明した。しかしながら、修正部650では、文字数の差の割合を正規化できればよく、例えば、補正後テキストデータ(検索対象データ)の文字数を製品コードデータの文字数で除算してもよい。
【0108】
また、上記第1の実施形態では、製品コードデータとして、アルファベット大文字、ハイフン、数字を組み合わせた製品コードデータ700を例示した(
図7参照)。しかしながら、製品コードデータの形式はこれに限定されず、アルファベット小文字等、他の文字、記号が含まれていてもよい。あるいは、製品コードデータは、枝番が付加された形式であってもよい。
【0109】
また、上記第1の実施形態では、応対業務補助装置120において検索部130を実現するものとして説明したが、検索部130は、応対業務補助装置120とは別体の装置(例えば、第2の応対業務補助装置)において実現されてもよい。
【0110】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0111】
100 :応対業務補助システム
112 :マイク
113 :端末
120 :応対業務補助装置
130 :検索部
310 :音声入力部
320 :音声認識部
330 :誤変換補正部
340 :判定部
350 :テキスト検索部
400 :誤変換辞書データ
410 :辞書取得部
420 :変換部
430 :削除部
510 :文字数算出部
520 :文字数割合算出部
610 :検索対象データ取得部
620 :完全一致文字算出部
630 :半一致文字算出部
640 :類似度算出部
650 :修正部
670 :ソート部
680 :出力部
700 :製品コードデータ
900 :類似音語辞書データ