(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-24
(45)【発行日】2022-02-01
(54)【発明の名称】応答装置、応答方法、応答プログラム及び応答システム
(51)【国際特許分類】
G06F 16/90 20190101AFI20220125BHJP
G06F 16/9032 20190101ALI20220125BHJP
G06F 16/9035 20190101ALI20220125BHJP
【FI】
G06F16/90 100
G06F16/9032
G06F16/9035
(21)【出願番号】P 2018046405
(22)【出願日】2018-03-14
【審査請求日】2020-03-06
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100166006
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100124084
【氏名又は名称】黒岩 久人
(74)【代理人】
【識別番号】100153280
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】永井 浩太
(72)【発明者】
【氏名】河路 慶一
(72)【発明者】
【氏名】大坪 悠
(72)【発明者】
【氏名】中野 麻衣子
【審査官】早川 学
(56)【参考文献】
【文献】特開2005-024869(JP,A)
【文献】特開2004-333543(JP,A)
【文献】特開平09-101935(JP,A)
【文献】特開2000-207214(JP,A)
【文献】国際公開第2017/145466(WO,A1)
【文献】特開2009-163620(JP,A)
【文献】特開2016-207217(JP,A)
【文献】特開2001-022763(JP,A)
【文献】特開2006-039881(JP,A)
【文献】特開2015-225402(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G10L 13/00-99/00
G06F 3/00-3/18
(57)【特許請求の範囲】
【請求項1】
ユーザによって入力された文字列を受け付ける受付部と、
前記ユーザの属性を特定する特定部と、
前記特定部が特定した前記属性に基づいて、
前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択する選択部と、
前記選択部が選択した前記応答処理を実行することによって、前記受付部が受け付けた前記文字列に対する回答を決定する処理部と、
前記処理部が決定した前記回答を出力する出力部と、
を有し、
前記選択部が前記対話型処理を選択した場合に、前記処理部は前記対話型処理と並行して前記検索型処理を実行し、
前記出力部は、前記処理部が前記対話型処理を実行する途中において、前記検索型処理によって決定された前記回答の数又は前記検索型処理による検索結果のスコアが所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答装置。
【請求項2】
ユーザによって入力された文字列を受け付ける受付部と、
前記ユーザの属性を特定する特定部と、
前記特定部が特定した前記属性に基づいて、前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択する選択部と、
前記選択部が選択した前記応答処理を実行することによって、前記受付部が受け付けた前記文字列に対する回答を決定する処理部と、
前記処理部が決定した前記回答を出力する出力部と、
を有し、
前記選択部が前記対話型処理を選択した場合に、前記処理部は前記対話型処理と並行して前記検索型処理を実行し、
前記出力部は、前記処理部が前記対話型処理を実行する途中において、前記対話型処理の経過時間又は応答回数が所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答装置。
【請求項3】
前記特定部は、
前記ユーザの動作を前記属性として特定し、
前記選択部は、前記属性に基づいて前記ユーザの技術レベルを判定し、前記技術レベルに応じて前記応答処理を選択する、
請求項1
又は2に記載の応答装置。
【請求項4】
前記特定部は、前記動作に加えて、前記ユーザの感情と、前記ユーザに対応する登録情報とのうち少なくとも1つを前記属性として特定する、請求項
3に記載の応答装置。
【請求項5】
前記特定部は、前記文字列の内容に基づいて、前記感情を特定する、請求項
4に記載の応答装置。
【請求項6】
前記受付部は、前記ユーザの顔を撮像した画像を受け付け、
前記特定部は、前記受付部が受け付けた前記画像に基づいて、前記感情を特定する、請求項
4又は
5に記載の応答装置。
【請求項7】
前記受付部は、前記ユーザによって選択された感情を示す情報を受け付け、
前記特定部は、前記受付部が受け付けた前記選択された感情に基づいて、前記ユーザの感情を特定する、請求項
4から
6のいずれか一項に記載の応答装置。
【請求項8】
前記特定部は、前記ユーザの年齢を示す前記登録情報を特定する、請求項
4から
7のいずれか一項に記載の応答装置。
【請求項9】
前記特定部が特定した前記属性と、前記複数の応答処理それぞれによる前記文字列に対する過去の回答が適切だったか否かを示す統計情報と、に基づいて、前記応答処理を選択する、請求項1から
8のいずれか一項に記載の応答装置。
【請求項10】
プロセッサが、
ユーザによって入力された文字列を受け付けるステップと、
前記ユーザの属性を特定するステップと、
前記特定するステップで特定された前記属性に基づいて、
前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択するステップと、
前記選択するステップで選択された前記応答処理を実行することによって、前記受け付けるステップで受け付けられた前記文字列に対する回答を決定するステップと、
前記決定するステップで決定された前記回答を出力するステップと、
を実行し、
前記選択するステップで前記対話型処理が選択された場合に、前記決定するステップは前記対話型処理と並行して前記検索型処理を実行し、
前記出力するステップは、前記決定するステップが前記対話型処理を実行する途中において、前記検索型処理によって決定された前記回答の数又は前記検索型処理による検索結果のスコアが所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答方法。
【請求項11】
プロセッサが、
ユーザによって入力された文字列を受け付けるステップと、
前記ユーザの属性を特定するステップと、
前記特定するステップで特定された前記属性に基づいて、前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択するステップと、
前記選択するステップで選択された前記応答処理を実行することによって、前記受け付けるステップで受け付けられた前記文字列に対する回答を決定するステップと、
前記決定するステップで決定された前記回答を出力するステップと、
を実行し、
前記選択するステップで前記対話型処理が選択された場合に、前記決定するステップは前記対話型処理と並行して前記検索型処理を実行し、
前記出力するステップは、前記決定するステップが前記対話型処理を実行する途中において、前記対話型処理の経過時間又は応答回数が所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答方法。
【請求項12】
コンピュータに、
ユーザによって入力された文字列を受け付けるステップと、
前記ユーザの属性を特定するステップと、
前記特定するステップで特定された前記属性に基づいて、
前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択するステップと、
前記選択するステップで選択された前記応答処理を実行することによって、前記受け付けるステップで受け付けられた前記文字列に対する回答を決定するステップと、
前記決定するステップで決定された前記回答を出力するステップと、
を実行させ、
前記選択するステップで前記対話型処理が選択された場合に、前記決定するステップは前記対話型処理と並行して前記検索型処理を実行し、
前記出力するステップは、前記決定するステップが前記対話型処理を実行する途中において、前記検索型処理によって決定された前記回答の数又は前記検索型処理による検索結果のスコアが所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答プログラム。
【請求項13】
コンピュータに、
ユーザによって入力された文字列を受け付けるステップと、
前記ユーザの属性を特定するステップと、
前記特定するステップで特定された前記属性に基づいて、前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択するステップと、
前記選択するステップで選択された前記応答処理を実行することによって、前記受け付けるステップで受け付けられた前記文字列に対する回答を決定するステップと、
前記決定するステップで決定された前記回答を出力するステップと、
を実行させ、
前記選択するステップで前記対話型処理が選択された場合に、前記決定するステップは前記対話型処理と並行して前記検索型処理を実行し、
前記出力するステップは、前記決定するステップが前記対話型処理を実行する途中において、前記対話型処理の経過時間又は応答回数が所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答プログラム。
【請求項14】
応答装置と、前記応答装置と通信可能な通信端末と、を有し、
前記応答装置は、
ユーザによって入力された文字列を前記通信端末から受け付ける受付部と、
前記ユーザの属性を特定する特定部と、
前記特定部が特定した前記属性に基づいて、
前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択する選択部と、
前記選択部が選択した前記応答処理を実行することによって、前記受付部が受け付けた前記文字列に対する回答を決定する処理部と、
前記処理部が決定した前記回答を前記通信端末へ出力する出力部と、
を備え、
前記選択部が前記対話型処理を選択した場合に、前記処理部は前記対話型処理と並行して前記検索型処理を実行し、
前記出力部は、前記処理部が前記対話型処理を実行する途中において、前記検索型処理によって決定された前記回答の数又は前記検索型処理による検索結果のスコアが所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答システム。
【請求項15】
応答装置と、前記応答装置と通信可能な通信端末と、を有し、
前記応答装置は、
ユーザによって入力された文字列を前記通信端末から受け付ける受付部と、
前記ユーザの属性を特定する特定部と、
前記特定部が特定した前記属性に基づいて、前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって回答を決定する検索型処理と、を含む複数の応答処理の中から少なくとも1つの応答処理を選択する選択部と、
前記選択部が選択した前記応答処理を実行することによって、前記受付部が受け付けた前記文字列に対する回答を決定する処理部と、
前記処理部が決定した前記回答を前記通信端末へ出力する出力部と、
を備え、
前記選択部が前記対話型処理を選択した場合に、前記処理部は前記対話型処理と並行して前記検索型処理を実行し、
前記出力部は、前記処理部が前記対話型処理を実行する途中において、前記対話型処理の経過時間又は応答回数が所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力する、
応答システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザに対して応答するための応答装置、応答方法、応答プログラム及び応答システムに関する。
【背景技術】
【0002】
通信端末上でユーザからの発話を受け付け、発話に対する応答をネットワークを介して出力するシステムが知られている。特許文献1には、ユーザの情報に基づいて、コンピュータによる自律的な応答方法とオペレータによる応答方法との間で切り替えて応答するシステムが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところでコンピュータによる自律的な応答方法には、シナリオに沿って対話する応答処理や、キーワードを用いて検索した結果を提示する応答処理があり、ユーザごとに適した応答処理は異なる。しかしながら、特許文献1に記載のシステムは、自律的な応答方法とオペレータによる応答方法とを切り替えるのみであり、ユーザに適した回答をすることはできなかった。
【0005】
本発明はこれらの点に鑑みてなされたものであり、ユーザに適した回答をできる応答装置、応答方法、応答プログラム及び応答システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様の応答装置は、ユーザによって入力された文字列を受け付ける受付部と、前記ユーザの属性を特定する特定部と、前記特定部が特定した前記属性に基づいて、複数の応答処理の中から少なくとも1つの応答処理を選択する選択部と、前記選択部が選択した前記応答処理を実行することによって、前記受付部が受け付けた前記文字列に対する回答を決定する処理部と、前記処理部が決定した前記回答を出力する出力部と、を有する。
【0007】
前記特定部は、前記ユーザの感情と、前記ユーザの動作と、前記ユーザに対応する登録情報とのうち少なくとも1つを前記属性として特定してもよい。
【0008】
前記特定部は、前記文字列の内容に基づいて、前記感情を特定してもよい。
【0009】
前記受付部は、前記ユーザの顔を撮像した画像を受け付け、前記特定部は、前記受付部が受け付けた前記画像に基づいて、前記感情を特定してもよい。
【0010】
前記受付部は、前記ユーザによって選択された感情を示す情報を受け付け、前記特定部は、前記受付部が受け付けた前記選択された感情に基づいて、前記ユーザの感情を特定してもよい。
【0011】
前記特定部は、前記ユーザが前記文字列を入力した速度を示す前記動作を特定してもよい。
【0012】
前記特定部は、前記ユーザの年齢を示す前記登録情報を特定してもよい。
【0013】
前記選択部は、前記ユーザに対して質問を出力することと前記ユーザからの入力を受け付けることとを交互に行うことによって前記回答を決定する対話型処理と、前記文字列に含まれるキーワードを用いて検索することによって前記回答を決定する検索型処理との中から前記応答処理を選択してもよい。
【0014】
前記選択部が前記対話型処理を選択した場合に、前記処理部は前記対話型処理と並行して前記検索型処理を実行し、前記出力部は、前記処理部が前記対話型処理を実行する途中において、前記検索型処理によって決定された前記回答が所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力してもよい。
【0015】
前記選択部が前記対話型処理を選択した場合に、前記処理部は前記対話型処理と並行して前記検索型処理を実行し、前記出力部は、前記処理部が前記対話型処理を実行する途中において、前記対話型処理の経過時間又は応答回数が所定の条件を満たす場合に、前記検索型処理によって決定された前記回答を出力してもよい。
【0016】
本発明の第2の態様の応答方法は、プロセッサが、ユーザによって入力された文字列を受け付けるステップと、前記ユーザの属性を特定するステップと、前記特定するステップで特定された前記属性に基づいて、複数の応答処理の中から少なくとも1つの応答処理を選択するステップと、前記選択するステップで選択された前記応答処理を実行することによって、前記受け付けるステップで受け付けられた前記文字列に対する回答を決定するステップと、前記決定するステップで決定された前記回答を出力するステップと、を実行する。
【0017】
本発明の第3の態様の応答プログラムは、コンピュータに、ユーザによって入力された文字列を受け付けるステップと、前記ユーザの属性を特定するステップと、前記特定するステップで特定された前記属性に基づいて、複数の応答処理の中から少なくとも1つの応答処理を選択するステップと、前記選択するステップで選択された前記応答処理を実行することによって、前記受け付けるステップで受け付けられた前記文字列に対する回答を決定するステップと、前記決定するステップで決定された前記回答を出力するステップと、を実行させる。
【0018】
本発明の第4の態様の応答システムは、応答装置と、前記応答装置と通信可能な通信端末と、を有し、前記応答装置は、ユーザによって入力された文字列を前記通信端末から受け付ける受付部と、前記ユーザの属性を特定する特定部と、前記特定部が特定した前記属性に基づいて、複数の応答処理の中から少なくとも1つの応答処理を選択する選択部と、前記選択部が選択した前記応答処理を実行することによって、前記受付部が受け付けた前記文字列に対する回答を決定する処理部と、前記処理部が決定した前記回答を前記通信端末へ出力する出力部と、を備える。
【発明の効果】
【0019】
本発明によれば、ユーザごとに適した回答をできるという効果を奏する。
【図面の簡単な説明】
【0020】
【
図1】本実施形態に係る応答システムの模式図である。
【
図2】本実施形態に係る応答システムのブロック図である。
【
図3】本実施形態に係る応答装置が実行する応答処理の模式図である。
【
図4】本実施形態に係る応答装置が実行するユーザ属性特定処理の模式図である。
【
図5】本実施形態に係る応答装置が実行する応答処理選択処理の模式図である。
【
図6】本実施形態に係る応答装置が実行する応答処理の模式図である。
【
図7】本実施形態に係る応答装置が実行する応答処理の模式図である。
【
図8】本実施形態に係る応答装置が実行する応答処理の切り替えの模式図である。
【
図9】本実施形態に係る応答装置が実行する応答方法のフローチャートを示す図である。
【発明を実施するための形態】
【0021】
[応答システムSの概要]
図1は、本実施形態に係る応答システムSの模式図である。応答システムSは、応答装置1と、通信端末2とを含む。応答装置1及び通信端末2は、インターネット、ローカルエリアネットワーク等のネットワークNを介して接続される。応答システムSが含む応答装置1の数は限定されない。応答システムSは、その他のサーバ、端末等の機器を含んでもよい。
【0022】
通信端末2は、ユーザUからの入力を受け付けて通信を行う通信装置である。通信端末2は、例えばスマートフォン、タブレット端末、パーソナルコンピュータ等である。通信端末2は、有線又は無線でネットワークNに接続される。
【0023】
応答装置1は、後述の応答方法によって、ユーザUによって入力された言葉に対する応答を出力するコンピュータである。応答装置1は、有線又は無線でネットワークNに接続される。
【0024】
[応答システムSの構成]
図2は、本実施形態に係る応答システムSのブロック図である。
図2において、矢印は主なデータの流れを示しており、
図2に示していないデータの流れがあってよい。
図2において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、
図2に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に別れて実装されてよい。ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。
【0025】
通信端末2は、表示部21と、操作部22と、撮像部23と、通信部24とを有する。表示部21は、各種情報を表示するための、液晶ディスプレイ、有機エレクトロルミネッセンス(OLED: Organic Light Emitting Diode)ディスプレイ等の表示装置を含む。表示部21は、応答装置1から通信部24を介して受信した信号に従って情報を表示する。
【0026】
操作部22は、ユーザの操作を受け付けるための、ボタン、スイッチ、ダイヤル等の操作部材を含む。操作部22は、ユーザの操作を示す信号を応答装置1に通信部24を介して送信する。表示部21としてユーザによる接触の位置を検出可能なタッチスクリーンを用いることによって、表示部21と操作部22とを一体に構成してもよい。
【0027】
撮像部23は、通信端末2上に設けられ、通信端末2を有するユーザの顔を含む所定の撮像範囲を撮像する撮像装置である。撮像部23は、CCD(Charge Coupled Device)センサ、CMOS(Complementary Metal Oxide Semiconductor)センサ等の撮像素子を含む。撮像部23は、通信端末2に予め設定されたタイミングで撮像を行ってもよく、あるいは応答装置1から通信部24を介して受信した撮像の指示に従って撮像を行ってもよい。撮像部23は、撮像した内容を画像として応答装置1に通信部24を介して送信する。
【0028】
通信部24は、応答装置1との間で通信をするための通信インターフェースである。通信部24は、通信を実行するためのプロセッサ、コネクタ、電気回路等を含む。通信部24は、外部から受信した通信信号に所定の処理を行ってデータを取得する。また、通信部24は、送信すべきデータに所定の処理を行って通信信号を生成し、生成した通信信号を外部に送信する。
【0029】
応答装置1は、制御部11と、通信部12と、記憶部13とを有する。制御部11は、入力受付部111と、ユーザ属性特定部112と、応答処理選択部113と、対話型処理部114と、検索型処理部115と、出力部116とを有する。記憶部13は、登録情報記憶部131と、統計情報記憶部132と、対話型モデル記憶部133と、検索型モデル記憶部134とを有する。登録情報記憶部131、統計情報記憶部132、対話型モデル記憶部133及び検索型モデル記憶部134は、それぞれ記憶部13上の記憶領域であってもよく、あるいは記憶部13上で構成されたデータベースであってもよい。
【0030】
通信部12は、通信端末2との間で通信をするための通信インターフェースである。通信部12は、通信を実行するためのプロセッサ、コネクタ、電気回路等を含む。通信部12は、外部から受信した通信信号に所定の処理を行ってデータを取得し、取得したデータを制御部11に入力する。また、通信部12は、制御部11から入力されたデータに所定の処理を行って通信信号を生成し、生成した通信信号を外部に送信する。
【0031】
記憶部13は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクドライブ等を含む記憶媒体である。記憶部13は、制御部11が実行するプログラムを予め記憶する。登録情報記憶部131は、ユーザの識別情報(ユーザID)、氏名、年齢、電話番号、メールアドレス等、ユーザに対応する登録情報を予め記憶する。統計情報記憶部132は、過去に応答装置1が行った応答の統計情報を予め記憶する。対話型モデル記憶部133は、後述する対話型の応答処理で用いられる情報を予め記憶する。検索型モデル記憶部134は、後述する検索型の応答処理で用いられる情報を予め記憶する。
【0032】
制御部11は、例えばCPU(Central Processing Unit)等のプロセッサであり、記憶部13に記憶されたプログラムを実行することにより、入力受付部111、ユーザ属性特定部112、応答処理選択部113、対話型処理部114、検索型処理部115及び出力部116として機能する。入力受付部111、ユーザ属性特定部112、応答処理選択部113、対話型処理部114、検索型処理部115及び出力部116の機能については、
図3~
図8を用いて後述する。制御部11の機能の少なくとも一部は、電気回路によって実行されてもよい。また、制御部11の機能の少なくとも一部は、ネットワーク経由で実行されるプログラムによって実行されてもよい。
【0033】
本実施形態に係る応答システムSは、
図2に示す具体的な構成に限定されない。応答装置1及び通信端末2は、それぞれ1つの装置に限られず、2つ以上の物理的に分離した装置が有線又は無線で接続されることにより構成されてもよい。
【0034】
[応答処理の種類]
ユーザが入力した言葉に対して応答する処理には、
図3(a)のような対話型処理と、
図3(b)のような検索型処理とがある。
図3(a)は、本実施形態に係る応答装置1が実行する対話型の応答処理(対話型処理ともいう)の模式図である。対話型処理のために、対話型モデル記憶部133は、様々な発話(すなわちユーザが入力した言葉)に対応するシナリオを、対話型モデルとして予め記憶している。対話型モデル記憶部133は、対話型モデルをデータベースとして記憶してもよく、あるいはデータを羅列したリストとして記憶してもよい。
【0035】
シナリオは、ユーザが入力する言葉と、その言葉に応答して出力する言葉(質問又は回答)とを系列的に関連付ける情報である。すなわちシナリオは、ユーザに対して順次質問を投げかけて、その質問に対するユーザの入力を取得することによって、最終的に回答を決定するように定められた規則である。
【0036】
応答装置1は、ユーザからの発話を受け付けると、対話型モデル記憶部133に記憶されたシナリオの中から受け付けた発話に対応するシナリオを選択する。シナリオが選択できた場合に、応答装置1は、選択したシナリオに沿って、ユーザに対して質問を出力することと、再びユーザが入力した言葉を受け付けることとを交互に(すなわち対話的に)行い、最終的に回答を決定する。すなわち応答装置1は、対話型処理において、ユーザが入力した言葉を用いて対話型モデル記憶部133に記憶されたデータから一旦シナリオを取得し、その後にシナリオに従ってユーザと対話的にやり取りすることによって回答を決定する。対話型処理によれば、応答装置1は、ユーザの言葉に対してユーザが入力した言葉から回答を直接導けない場合であっても、予め定義されたシナリオに沿って状況を深堀りして適切な回答を出力することができる。
【0037】
図3(b)は、本実施形態に係る応答装置1が実行する検索型の応答処理(検索型処理ともいう)の模式図である。検索型処理のために、応答装置1の検索型モデル記憶部134は、ユーザが入力した言葉に含まれる様々なキーワードに関連付けられた回答を、検索型モデルとして予め記憶している。検索型モデル記憶部134は、検索型モデルをデータベースとして記憶してもよく、あるいはデータを羅列したリストとして記憶してもよい。
【0038】
応答装置1は、ユーザからの発話を受け付けると、発話に含まれるキーワードを用いて検索型モデル記憶部134を検索し、発話に含まれるキーワードに関連付けられた1つ以上の回答を含む検索結果を取得する。すなわち応答装置1は、検索型処理において、ユーザが入力した言葉を用いて検索型モデル記憶部134に記憶されたデータを直接検索することによって、ユーザが入力した言葉に対応する回答を決定する。そして応答装置1は、検索結果が含む回答を出力する。検索型処理によれば、応答装置1は、ユーザが入力した言葉に含まれるキーワードを用いてデータを直接検索することによって、一問一答で素早く回答を出力することができる。
【0039】
対話型処理は、想定される言葉ごとにシナリオを構築する必要があるため、多数の言葉に対応するシナリオを用意するためには大きなコストが掛かる。しかしながら対話型処理は、ユーザとの間でシナリオに沿って対話的にやり取りを行うことができるため、高齢者や初心者のように通信端末2で疑問点を示す正確な言葉を入力することが難しいユーザに対しても、適切な回答を出力できるという利点がある。また、対話型処理は、シナリオに沿って対話を重ねることで段階的にユーザの求める回答を絞り込んで誘導できるという利点がある。
【0040】
一方、検索型処理は、入力された言葉を用いてデータを直接検索するため、正確な言葉を入力することが難しいユーザに対しては適切な回答を出力できない場合がある。しかしながら検索型処理は、ユーザが疑問点を示す正確な言葉を入力できれば、素早く回答を提示でき、さらに検索により1以上の結果を取得することによってユーザに対して複数の回答案を同時に提示できるという利点がある。また、検索型処理は、検索型モデルに回答データを追加することによって容易に様々な言葉に対応できるため、低コストで多数の言葉に対応できるという利点がある。
【0041】
後述のように、応答装置1は、ユーザの属性を特定し、特定した属性に基づいてユーザが対話型処理及び検索型処理のどちらに適しているかを推定し、ユーザごとに対話型処理と検索型処理とを切り替えて実行する。これにより、ユーザに適した回答を提示できる可能性を高めることができる。
【0042】
[応答方法の説明]
本実施形態に係る応答システムSによる応答方法を、以下に説明する。まず入力受付部111は、ユーザUが入力した入力情報を、通信端末2から受け付ける。ここで入力受付部111は、ユーザUが操作部22を用いて入力した文字列(言葉)を示す情報を、入力情報として受け付ける。また、入力受付部111は、ユーザUが発した音声を音声認識処理によって変換した文字列を、入力情報として受け付けてもよい。また、入力受付部111は、撮像部23が撮像したユーザUの顔を含む画像を、入力情報として受け付けてもよい。
【0043】
次にユーザ属性特定部112は、ユーザ属性特定処理を実行することによって、入力受付部111が受け付けた入力情報に基づいてユーザUの属性を特定する。ユーザUの属性は、ユーザUの感情情報、ユーザUの登録情報及びユーザUの動作情報のうち少なくとも1つを含む。ユーザUの感情情報は、例えばユーザUが怒っているか否かの状態を示す。ユーザUの登録情報は、例えばユーザUの年齢を示す。ユーザの動作情報は、例えばユーザUが操作部22を用いて文字列を入力する入力速度を示す。
【0044】
図4(a)~
図4(c)は、本実施形態に係る応答装置1が実行するユーザ属性特定処理の模式図である。
図4(a)は、通信端末2の表示部21が表示する入力画面の一例を表している。表示部21は、ユーザUが文字列を入力するための入力欄Cと、ユーザUが入力済の文字列を応答装置1へ送信するために押下する仮想的な送信ボタンB1と、を表示する。表示部21は、応答装置1がユーザUに向けて出力した文字列を表す応答メッセージM1と、ユーザUが送信した文字列を表す入力メッセージM2とを表示する。
【0045】
ユーザ属性特定部112は、入力画面上でユーザUが入力した文字列の内容に基づいて、ユーザUの感情情報を特定する。この場合に、ユーザ属性特定部112は、入力受付部111が受け付けた文字列に基づいて感情を推定する。例えばユーザ属性特定部112は、文字列が予め定義された否定的な言葉(「悪い」、「遅い」、「だめ」等)を含む場合に、ユーザUは怒りの感情を有していると推定する。ユーザ属性特定部112は、文字列に基づいて感情を推定できる公知の技術を用いることができる。そしてユーザ属性特定部112は、推定した感情を、ユーザUの感情情報として特定する。
【0046】
また、ユーザ属性特定部112は、入力画面上で文字列を入力したユーザUの識別情報に基づいて、ユーザUの登録情報を特定する。この場合に、ユーザUの識別情報(ユーザID)は、予め通信端末2に設定される。入力受付部111は、通信端末2において入力された文字列とともに、その通信端末2に設定された識別情報を受け付ける。そしてユーザ属性特定部112は、入力受付部111が受け付けた識別情報に関連付けられた登録情報を登録情報記憶部131から読み出し、ユーザUの登録情報として特定する。
【0047】
また、ユーザ属性特定部112は、入力画面上でユーザUが文字列を入力する速度に基づいて、ユーザUの動作情報を特定する。この場合に、通信端末2は、ユーザUが文字列を入力するために掛かる入力時間(例えば文字列のうち最初の文字の入力から最後の文字の入力までの経過時間)を測定する。入力受付部111は、通信端末2において入力された文字列とともに、その文字列の入力に掛かった入力時間を受け付ける。そしてユーザ属性特定部112は、入力受付部111が受け付けた文字列及び入力時間から入力速度(すなわち単位時間あたりに入力された文字数)を算出し、ユーザUの動作情報として特定する。
【0048】
さらにユーザ属性特定部112は、ユーザUが選択した感情に基づいて、ユーザUの感情情報を特定してもよい。
図4(b)は、通信端末2の表示部21が表示する入力画面の変形例を表している。表示部21は、
図4(a)の入力画面に加えて、さらにユーザUが自身の感情を選択して応答装置1へ送信するために押下する仮想的な感情ボタンB2を表示する。感情ボタンB2は、例えば喜び、怒り、悲しみ、楽しみのそれぞれに対応するボタンを含む。表示部21は、感情の選択を受け付けるために、ボタンに限らず、リストやチェックボックス等を表示してもよい。
【0049】
入力受付部111は、通信端末2において入力された文字列とともに、ユーザUが選択した感情を示す情報を受け付ける。そしてユーザ属性特定部112は、入力受付部111が受け付けた感情を、ユーザUの感情情報として特定する。このようにユーザUが自身の感情を明示することによって、ユーザ属性特定部112は、文字列に表れないようなユーザUの感情情報を特定できるため、ユーザUの属性をより正確に特定することができる。
【0050】
さらにユーザ属性特定部112は、ユーザUの顔を含む画像に基づいて、ユーザUの感情情報を特定してもよい。
図4(c)は、通信端末2の撮像部23がユーザUの顔を撮像する様子を表している。通信端末2の撮像部23は、ユーザUが文字列を入力する際(すなわち文字列の入力の開始から終了までのいずれかの時点)にユーザUの顔を含む所定範囲を撮像し、画像として応答装置1へ送信する。入力受付部111は、通信端末2において入力された文字列とともに、その文字列が入力された際のユーザUの顔の画像を受け付ける。
【0051】
ユーザ属性特定部112は、入力受付部111が受け付けた画像に対して顔認識を行うことによって、画像中の顔を認識し、認識した顔に基づいて感情を推定する。例えばユーザ属性特定部112は、画像中の顔が予め定義された怒りの表情に合致する場合に、ユーザUは怒りの感情を有していると推定する。ユーザ属性特定部112は、画像に対して顔認識を行って感情を推定できる公知の技術を用いることができる。また、入力受付部111がユーザUの音声を変換した文字列を入力情報として受け付けた場合に、ユーザ属性特定部112は、該音声の強弱に基づいて感情情報を推定してもよい。
【0052】
そしてユーザ属性特定部112は、推定した感情を、ユーザUの感情情報として特定する。このようにユーザUの顔を含む画像から感情を推定することによって、ユーザ属性特定部112は、文字列に表れないようなユーザUの感情情報を特定できるため、ユーザUの属性をより正確に特定することができる。
【0053】
次に、応答処理選択部113は、応答処理選択処理を実行することによって、ユーザ属性特定部112が特定したユーザUの属性(すなわち感情情報、登録情報及び動作情報のうち少なくとも1つ)に基づいて、対話型処理と検索型処理とのどちらの応答処理を行うか選択する。これにより応答装置1は、ユーザごとに適切な自律的な応答処理を選択して回答できる。
【0054】
図5(a)~
図5(d)は、本実施形態に係る応答装置1が実行する応答処理選択処理の模式図である。応答処理選択部113は、ユーザ属性特定部112が特定した感情情報が所定の感情(ここでは怒り)を示す場合に、
図5(a)のように応答処理として対話型処理を選択する。これにより応答装置1は、ユーザUが所定の感情を持つに至った状況を深堀りして適切な回答を出力することができる。
【0055】
応答処理選択部113は、ユーザ属性特定部112が特定した感情情報が所定の感情を示さない場合に、
図5(b)のように応答処理として検索型処理を選択する。これにより応答装置1は、冷静なユーザUの入力に対して、素早く回答を出力することができる。
【0056】
応答処理選択部113は、ユーザ属性特定部112が特定した登録情報に基づいて、ユーザUの年齢層を判定する。例えば応答処理選択部113は、登録情報が示す年齢が所定の閾値以上である場合にユーザUを高齢者と判定し、そうでない場合に若年者と判定する。また、応答処理選択部113は、登録情報においてユーザUごとに設定されたフラグ(例えば重要人物を示すフラグ)を応答処理の選択に用いてもよい。
【0057】
また、応答処理選択部113は、ユーザ属性特定部112が特定した動作情報に基づいて、ユーザUの技術レベルを判定する。例えば応答処理選択部113は、動作情報が示す入力速度が所定の閾値以下である場合にユーザUを初心者と判定し、そうでない場合にユーザUを上級者と判定する。
【0058】
そして応答処理選択部113は、ユーザUを高齢者又は初心者と判定した場合に、
図5(c)のように応答処理として対話型処理を選択する。これにより、通信端末2の操作に不慣れな高齢者や初心者に対して、対話的にやり取りをしながら適切な回答を出力することができる。一方、応答処理選択部113は、ユーザUを若年者又は上級者と判定した場合に、
図5(d)のように応答処理として検索型処理を選択する。これにより、通信端末2の操作に慣れている若年者や上級者に対して、素早く回答を提示することができる。
【0059】
ここで説明した応答処理選択部113による応答処理の選択基準は一例であり、応答処理選択部113はユーザ属性特定部112が特定したユーザUの属性に基づく所定の規則に従って、対話型処理及び検索型処理のうち適切な方を選択することができる。
【0060】
応答処理選択部113は、ユーザ属性特定部112が特定したユーザUの属性に加えて、ユーザUが入力した文字数を用いて、応答処理を選択してもよい。例えば応答処理選択部113は、ユーザUが入力した文字数が所定の閾値以下である場合に対話型処理を選択する。すなわち応答処理選択部113は、入力された文字列の文字数が少ない場合に検索が上手くいかない場合があるため、ユーザUを対話型処理に誘導する。このように応答装置1は、文字数に基づいて適切な応答処理を選択することができる。
【0061】
応答処理選択部113は、ユーザ属性特定部112が特定したユーザUの属性に加えて、統計情報記憶部132に記憶された統計情報を用いて、応答処理を選択してもよい。ここで統計情報は、例えば今回と同様の文字列を入力したユーザUが過去に応答装置1から受けた回答が適切だったか否かを示す。ユーザUが受けた回答が適切だったか否かは、ユーザUに対してアンケートを取ることによって集計される。
【0062】
そして応答処理選択部113は、例えば過去に対話型処理で回答した場合に回答が適切でなかったと統計情報が示す場合に、ユーザUの属性に関わらず検索型処理を優先的に選択する。また、応答処理選択部113は、例えば過去に検索型処理で回答した場合に回答が適切でなかったと統計情報が示す場合に、ユーザUの属性に関わらず対話型処理を優先的に選択する。このように応答装置1は、ユーザUの属性だけでなく統計情報を用いることによって、より適切に応答処理を選択できる。
【0063】
応答処理選択部113は、ユーザ属性特定部112が特定したユーザUの属性に基づいて、対話型処理及び検索型処理に加えてオペレータ(すなわち人間)による応答から、応答処理を選択してもよい。応答処理選択部113がオペレータによる応答を選択した場合には、応答装置1は、通信端末2とオペレータが使用する端末と接続させ、ユーザの入力に対してオペレータが応答するようにする。これにより、対話型処理及び検索型処理のいずれでも適切な応答ができない場合等に、オペレータによって適切な対応をすることができる。
【0064】
次に、応答処理選択部113の選択に従って、対話型処理部114及び検索型処理部115の一方が応答処理を実行する。
図6(a)、
図6(b)は、本実施形態に係る応答装置1が実行する応答処理の模式図である。
【0065】
応答処理選択部113が対話型処理を選択した場合に、対話型処理部114は、入力受付部111が受け付けた文字列に対応するシナリオを、対話型モデル記憶部133に記憶されたシナリオの中から選択する。対話型処理部114は、選択したシナリオに沿って、ユーザUに対して出力する質問又は回答を決定する。
【0066】
出力部116は、対話型処理部114が決定した質問又は回答を示す情報を通信端末2へ出力する。そして通信端末2は、
図6(a)のように応答装置1から受信した質問又は回答を表示部21に表示させる。また、出力部116は対話型処理部114が決定した質問又は回答を示す情報を音声に変換して通信端末2へ出力し、通信端末2は応答装置1から受け取った音声を再生してもよい。さらに応答装置1及び通信端末2は、対話型処理部114が選択したシナリオに沿って、ユーザが入力した文字列を受け付けることと、質問を出力することとを交互に(すなわち対話的に)継続し、最終的な回答を出力する。
【0067】
応答処理選択部113が検索型処理を選択した場合に、検索型処理部115は、入力受付部111が受け付けた文字列に含まれるキーワードを用いて検索型モデル記憶部134を検索し、該キーワードに関連付けられた1つ以上の回答を含む検索結果を取得する。検索結果が複数の回答を含む場合に、検索型処理部115は、過去の学習データに基づいて複数の回答を並び替えてもよい。
【0068】
検索型処理部115は、ユーザUが今回入力した文字列に含まれるキーワードに加えて、同じユーザUが過去に入力した文字列に含まれるキーワードを用いて検索を行ってもよい。例えば検索型処理部115は、ユーザUが今回入力した文字列に含まれるキーワードと、ユーザUが前回入力した文字列に含まれるキーワードとを組み合わせて検索型モデル記憶部134を検索し、検索結果を取得する。これにより応答装置1は、文脈を考慮した検索結果を取得することができる。
【0069】
検索型処理部115は、ユーザUが今回入力した文字列に含まれるキーワードに加えて、文字列が入力された時間(日付又は時刻)に対応するキーワードを用いて検索を行ってもよい。検索型処理部115は、ユーザUが入力した文字列に含まれるキーワードに、ユーザUが入力した時間に対して予め定義されたキーワードを追加して検索する。例えば検索型処理部115は、特定のキャンペーンの実施期間内に文字列が入力された場合に、ユーザUが入力した文字列に含まれるキーワードと、当該キャンペーンの名称を示すキーワードとを組み合わせて用いて検索型モデル記憶部134を検索し、検索結果を取得する。これにより応答装置1は、検索が行われる時間を考慮した検索結果を取得することができる。
【0070】
出力部116は、検索型処理部115による検索結果が含む回答のうち一部又は全部を示す情報を通信端末2へ出力する。出力部116は、所定の数(例えば通信端末2の表示部21に一度に表示可能な数)以内の回答を出力してもよく、あるいは検索結果のスコアが所定値以上の回答を出力してもよい。スコアは、検索の一致度や重要度等に基づく所定の規則に従って算出される。そして通信端末2は、
図6(b)のように応答装置1から受信した回答を表示部21に表示させる。また、出力部116は検索型処理部115による検索結果が含む回答を音声に変換して通信端末2へ出力し、通信端末2は応答装置1から受け取った音声を再生してもよい。
【0071】
また、出力部116は、ユーザ属性特定部112が特定したユーザUの属性に基づいて回答を出力する数を設定してもよい。例えば出力部116は、応答処理選択部113がユーザUを高齢者又は初心者と判定した場合に、応答処理選択部113がユーザUを若年者又は上級者と判定する場合よりも回答を出力する数を少なくする。これにより、回答の表示態様をユーザUに合わせて調整することができる。
【0072】
検索型処理部115は、検索結果に加えて、統計情報を通信端末2へ出力してもよい。
図7は、本実施形態に係る応答装置1が実行する応答処理の模式図である。応答処理選択部113が検索型処理を選択した場合に、検索型処理部115は、検索型モデル記憶部134から検索結果を取得するとともに、取得した検索結果が含む回答に対応する統計情報を統計情報記憶部132から取得する。ここで回答に対応する統計情報は、例えば今回ユーザUが入力した文字列に対して過去に応答装置1が行った応答を統計的に処理することによって算出した、各回答が選択された割合(選択率)である。検索型処理部115は、検索結果において、選択率が高い順又は低い順に回答を並べ替えてもよい。また、検索型処理部115は、検索結果において、選択率が高い順にランク付けしてもよい。
【0073】
出力部116は、検索型処理部115による検索結果と統計情報とを関連付けて通信端末2へ出力する。そして通信端末2は、
図7のように応答装置1から受信した検索結果が含む各回答と各回答の選択率とを関連付けたメッセージM3を、表示部21に表示させる。これにより応答装置1は、入力された文字列に対する統計的な関連性の高さ及び低さをユーザUへ提示することができる。
【0074】
対話型処理部114及び検索型処理部115は、対話型処理の途中で検索型処理に切り替えてもよい。
図8は、本実施形態に係る応答装置1が実行する応答処理の切り替えの模式図である。対話型処理部114が対話型処理を実行している途中の状態において、出力部116は、
図8の上図のように対話型処理による質問を通信端末2へ出力する。このとき、検索型処理部115は、対話型処理と並行して検索型処理を実行し、ユーザUが入力した文字列に対する検索結果を取得する。ただし出力部116は、対話型処理による質問の出力中には検索型処理による検索結果を通信端末2へ出力しない。
【0075】
そして対話型処理の途中で所定の条件が満たされた場合に、出力部116は、対話型処理による質問の出力を停止し、
図8の下図のように検索型処理による検索結果が含む回答を通信端末2へ出力する。切り替えの条件は、例えば対話型処理の経過時間又は応答回数が所定の閾値以上になったことである。これにより応答装置1は、対話型処理では適切な回答にたどり着けない場合であっても、検索型処理に移行して回答を出力することができる。
【0076】
また、切り替えの条件は、例えば検索結果が含む回答の数が所定の数以下になったこと、あるいは検索結果のスコアが所定値以上になったことであってもよい。これにより応答装置1は、検索型処理による検索結果の確度が高くなった段階で検索型処理に移行できるため、より適切な回答を出力できる。
【0077】
[応答方法のフローチャート]
図9は、本実施形態に係る応答装置1が実行する応答方法のフローチャートを示す図である。まず入力受付部111は、ユーザUが入力した入力情報を、通信端末2から受け付ける(S11)。ユーザ属性特定部112は、上述のユーザ属性特定処理を実行することによって、ステップS11で入力受付部111が受け付けた入力情報に基づいてユーザUの属性を特定する(S12)。ユーザUの属性は、感情情報、登録情報及び動作情報のうち少なくとも1つである。
【0078】
応答処理選択部113は、上述の応答処理選択処理を実行することによって、ステップS12でユーザ属性特定部112が特定したユーザUの属性に基づいて、対話型処理と検索型処理とのどちらの応答処理を行うか選択する(S13)。
【0079】
応答処理選択部113が対話型処理を選択した場合に(S14のYES)、対話型処理部114は、ステップS11で入力受付部111が受け付けた文字列に対応するシナリオを、対話型モデル記憶部133に記憶されたシナリオの中から選択し、選択したシナリオに従って対話型処理を実行する(S15)。対話型処理部114は、ステップS15の対話型処理において、出力部116によるユーザへの質問の出力と、入力受付部111による入力の受け付けとを交互に行い、最終的な回答を決定する。
【0080】
応答処理選択部113が検索型処理を選択した場合に(S14のNO)、検索型処理部115は、入力受付部111が受け付けた文字列に含まれるキーワードを用いて検索型モデル記憶部134を検索する検索型処理を実行する(S16)。検索型処理部115は、検索型モデル記憶部134において、検索に用いたキーワードに関連付けられた1つ以上の回答を含む検索結果を取得する。
【0081】
出力部116は、ステップS15で対話型処理部114が決定した回答を示す情報、又はステップS16で検索型処理部115が取得した検索結果が含む回答を示す情報を通信端末2へ出力する(S17)。そして通信端末2は、応答装置1から受信した回答を表示部21に表示させる。
【0082】
[本実施形態の効果]
本実施形態に係る応答装置1は、ユーザの感情情報、登録情報及び動作情報のうち少なくとも1つを示す属性に基づいて、対話型処理と検索型処理とのどちらの応答処理を行うか選択する。これにより応答装置1は、ユーザごとに適切な自律的な応答処理を選択して回答できる。
【0083】
具体的には、応答装置1は、例えばユーザが怒っている場合や、高齢者又は初心者である場合等に、対話型処理を選択して実行することによって、所定のシナリオに沿って丁寧にユーザとやり取りしながら、段階的にユーザの求める回答を絞り込んで誘導できる。また、応答装置1は、例えばユーザが冷静な場合や、若年者又は上級者である場合等に、検索型処理を選択して実行することによって、ユーザに素早く回答を提示でき、また検索結果に基づいて複数の回答案を同時に提示できる。
【0084】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。
【0085】
応答装置1のプロセッサは、
図9に示す応答方法に含まれる各ステップ(工程)の主体となる。すなわち、応答装置1のプロセッサは、
図9に示す応答方法を実行するためのプログラムを記憶部から読み出し、該プログラムを実行して応答装置1の各部を制御することによって、
図9に示す応答方法を実行する。
図9に示す応答方法に含まれるステップは一部省略されてもよく、ステップ間の順番が変更されてもよく、複数のステップが並行して行われてもよい。
【符号の説明】
【0086】
S 応答システム
1 応答装置
2 通信端末
11 制御部
111 入力受付部
112 ユーザ属性特定部
113 応答処理選択部
114 対話型処理部
115 検索型処理部
116 出力部