IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セコム株式会社の特許一覧

<>
  • 特開-対話システム及びセンタ装置 図1
  • 特開-対話システム及びセンタ装置 図2
  • 特開-対話システム及びセンタ装置 図3
  • 特開-対話システム及びセンタ装置 図4
  • 特開-対話システム及びセンタ装置 図5
  • 特開-対話システム及びセンタ装置 図6
  • 特開-対話システム及びセンタ装置 図7
  • 特開-対話システム及びセンタ装置 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133767
(43)【公開日】2024-10-03
(54)【発明の名称】対話システム及びセンタ装置
(51)【国際特許分類】
   G10L 15/22 20060101AFI20240926BHJP
   G10L 13/00 20060101ALI20240926BHJP
   G10L 15/10 20060101ALI20240926BHJP
   G06F 3/16 20060101ALI20240926BHJP
【FI】
G10L15/22 300Z
G10L13/00 100M
G10L15/22 453
G10L15/10 200W
G06F3/16 690
G06F3/16 650
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023043730
(22)【出願日】2023-03-20
(71)【出願人】
【識別番号】000108085
【氏名又は名称】セコム株式会社
(74)【代理人】
【識別番号】110003339
【氏名又は名称】弁理士法人南青山国際特許事務所
(72)【発明者】
【氏名】島田 陽介
(72)【発明者】
【氏名】藤本 裕之
(57)【要約】
【課題】人的な負担を減らしつつ、一定の質が担保された対話を行うことが可能な対話システムを提供する。
【解決手段】端末装置は、ユーザからのメッセージであるユーザメッセージを入力する入力手段と、入力されたユーザメッセージを送信するメッセージ送信手段と、ユーザメッセージに対する応答メッセージを受信し出力する応答出力手段と、を有し、センタ装置は、端末装置から、ユーザメッセージを受信する受信手段と、ユーザメッセージ及びユーザメッセージに対する応答メッセージを含む対話データを記憶する記憶手段と、ユーザメッセージに基づく1以上の特徴語句の入力をオペレータより受け付ける特徴語句入力手段と、特徴語句を重みづけしてユーザメッセージの特徴量を算出する特徴量算出手段と、算出した特徴量に基づき、ユーザメッセージとの類似度が高い過去のユーザメッセージを含む対話データを記憶手段から検索する検索手段と、を有する。
【選択図】図8
【特許請求の範囲】
【請求項1】
端末装置と、
前記端末装置と通信可能なセンタ装置と、
を具備する対話システムであって、
前記端末装置は、
ユーザからのメッセージであるユーザメッセージを入力する入力手段と、
前記入力されたユーザメッセージを送信するメッセージ送信手段と、
前記ユーザメッセージに対する応答メッセージを受信し出力する応答出力手段と、
を有し、
前記センタ装置は、
前記端末装置から、前記ユーザメッセージを受信する受信手段と、
前記ユーザメッセージ及び前記ユーザメッセージに対する応答メッセージを含む対話データを記憶する記憶手段と、
前記ユーザメッセージに基づく1以上の特徴語句の入力をオペレータより受け付ける特徴語句入力手段と、
前記特徴語句を重みづけして前記ユーザメッセージの特徴量を算出する特徴量算出手段と、
前記算出した特徴量に基づき、前記ユーザメッセージとの類似度が高い過去のユーザメッセージを含む対話データを前記記憶手段から検索する検索手段と、
を有する
対話システム。
【請求項2】
請求項1に記載の対話システムであって、
抽出された前記対話データに基づき、前記ユーザメッセージに対する前記応答メッセージの候補である1以上の応答候補を生成する応答候補生成手段
をさらに具備する対話システム。
【請求項3】
請求項1または2に記載の対話システムであって、
前記センタ装置は、
前記ユーザメッセージに含まれる又は前記ユーザメッセージから類推される1以上の特徴語句を抽出する抽出手段と、
抽出した前記1以上の特徴語句を、オペレータが選択可能に表示する特徴語句表示手段と、
をさらに有し、
前記特徴語句入力手段は、前記特徴語句表示手段により表示された前記1以上の特徴語句の中から、1以上の特徴語句の選択をオペレータより受け付け、
前記特徴量算出手段は、前記特徴語句入力手段が選択を受け付けた前記1以上の特徴語句を重みづけして前記ユーザメッセージの特徴量を算出する
対話システム。
【請求項4】
請求項1または2に記載の対話システムであって、
前記特徴量算出手段は、前記1以上の特徴語句の選択順に応じて重みづけの度合いを異ならせて、前記ユーザメッセージの特徴量を算出する
対話システム。
【請求項5】
請求項1または2に記載の対話システムであって、
前記記憶手段は、
前記受信手段が順次受信する前記ユーザメッセージを含む対話データを蓄積し、
重みづけされた1以上の特徴語句が前記ユーザメッセージに含まれるとき、前記ユーザメッセージに関連付けて、前記特徴量算出手段により前記重みづけして算出された前記ユーザメッセージの特徴量を、さらに蓄積する
対話システム。
【請求項6】
請求項2に記載の対話システムであって、
前記応答候補生成手段は、抽出された前記対話データに含まれる応答メッセージの評価に基づき、1以上の応答候補を生成する
対話システム。
【請求項7】
ユーザと双方向でメッセージのやり取りを行う端末装置から、ユーザメッセージを受信する受信手段と、
前記ユーザメッセージ及び前記ユーザメッセージに対する応答メッセージを含む対話データを記憶する記憶手段と、
前記ユーザメッセージに基づく1以上の特徴語句の入力をオペレータより受け付ける特徴語句入力手段と、
前記特徴語句を重みづけして前記ユーザメッセージの特徴量を算出する特徴量算出手段と、
前記算出した特徴量に基づき、前記ユーザメッセージとの類似度が高い過去のユーザメッセージを含む対話データを前記記憶手段から検索する検索手段と、
を具備するセンタ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声の入出力機能を持つ端末装置を用いた対話システム及びセンタ装置に関する。
【背景技術】
【0002】
孤独感は認知症等の重大な健康リスクにつながる要因であるが、独居世帯(特に高齢者の独居)の増加と昨今の感染症蔓延リスクの増大とが相まって孤独感が生じやすい状況にあり、孤独感の解消は重要な社会課題となっている。孤独感の解消には雑談等の日常対話が有効と考えられる。
【0003】
そこで、近年、特に独居の高齢者宅に音声の入出力機能を持つ機器(例えば対話型ロボット)を設置して、当該機器を介して音声での雑談等の日常対話をすることで孤独感を解消するコミュニケーションサービスが提案されている。
【0004】
そのシステムでは、ユーザが自宅の機器に話しかけると、その内容が音声認識技術により文字列化されて、サービスを提供する業者の管理センタにメッセージ送信される。管理センタでは、当該メッセージの受信に気が付いたオペレータがセンタ装置に返事を入力して、それがユーザ側に返信される。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2021-157419号公報
【特許文献2】特開2007-286376号公報
【特許文献3】特開2020-77083号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
人手を介した対話サービスや、コミュニケーションロボットによる自動応答対話サービスが行われている。しかし、労働力人口減少に伴う人手不足も同様に社会課題となっており、オペレータの人手による対応には限界がある。一方、人手を介さないコミュニケーションロボットは、対話の質が低い(不適切な応答、定型的な応答など)ことにより、ユーザから敬遠される可能性がある。
【0007】
特許文献1は、オペレータの応答候補を分類(肯定、反論、話題転換)ごとに評価値とともに表示することで、オペレータの応答を支援するUIを提案する。しかしながら、ユーザからのメッセージに対してオペレータが応答する場合、オペレータが逐一、応答メッセージを考えることは負担が大きく、また、オペレータによって応答メッセージの質がバラバラになるおそれがある。特許文献1は、オペレータに対して応答候補を表示するが、オペレータがそれぞれの候補を確認して応答メッセージを決定する必要があるため、依然としてオペレータに負担がある。
【0008】
特許文献2は、ロボットが応答メッセージを決定できない場合に遠隔支援装置に応答の支援を依頼する技術を提案する。しかしながら、雑談等の日常対話のように応答メッセージの適切性についてロボットによる判定が容易ではない対話では、オペレータの負担が過剰になるおそれがある。
【0009】
特許文献3は、オペレータの応答支援において、ユーザが入力した質問文に類似する質問文を取得し、返答文の候補を表示する技術を提案する。ユーザメッセージへの応答にあたって、過去の類似会話における応答を参考にすることで効率的かつ質の担保された応答が可能になる。しかし、ユーザのメッセージが長文の場合などにおいては重要語が埋もれやすく、類似会話が適切に抽出されないおそれがある。
【0010】
以上のような事情に鑑み、本発明の目的は、人的な負担を減らしつつ、一定の質が担保された対話を行うことが可能な対話システムを提供することにある。
【課題を解決するための手段】
【0011】
本発明の一形態に係る対話システムは、
端末装置と、
前記端末装置と通信可能なセンタ装置と、
を具備する対話システムであって、
前記端末装置は、
ユーザからのメッセージであるユーザメッセージを入力する入力手段と、
前記入力されたユーザメッセージを送信するメッセージ送信手段と、
前記ユーザメッセージに対する応答メッセージを受信し出力する応答出力手段と、
を有し、
前記センタ装置は、
前記端末装置から、前記ユーザメッセージを受信する受信手段と、
前記ユーザメッセージ及び前記ユーザメッセージに対する応答メッセージを含む対話データを記憶する記憶手段と、
前記ユーザメッセージに基づく1以上の特徴語句の入力をオペレータより受け付ける特徴語句入力手段と、
前記特徴語句を重みづけして前記ユーザメッセージの特徴量を算出する特徴量算出手段と、
前記算出した特徴量に基づき、前記ユーザメッセージとの類似度が高い過去のユーザメッセージを含む対話データを前記記憶手段から検索する検索手段と、
を有する。
【0012】
本実施形態によれば、センタ装置は、オペレータが特徴語句を入力するのに応じて当該選択語句について重みづけしてユーザメッセージの特徴量を算出し、当該特徴量に基づき類似会話を検索する。重みづけした上でユーザメッセージの特徴量を算出することにより、類似度の高いユーザメッセージを適切に選択できる。このため、ユーザメッセージに対してオペレータの人的な負担を減らして、且つ、オペレータが適切に応答することを図れる。
【0013】
対話システムは、
抽出された前記対話データに基づき、前記ユーザメッセージに対する前記応答メッセージの候補である1以上の応答候補を生成する応答候補生成手段
をさらに具備してもよい。
【0014】
オペレータは応答候補を選択すればよいので、人的な負担を減らしつつ、一定の質が担保された対話を行うことが可能である。
【0015】
前記センタ装置は、
前記ユーザメッセージに含まれる又は前記ユーザメッセージから類推される1以上の特徴語句を抽出する抽出手段と、
抽出した前記1以上の特徴語句を、オペレータが選択可能に表示する特徴語句表示手段と、
をさらに有し、
前記特徴語句入力手段は、前記特徴語句表示手段により表示された前記1以上の特徴語句の中から、1以上の特徴語句の選択をオペレータより受け付け、
前記特徴量算出手段は、前記特徴語句入力手段が選択を受け付けた前記1以上の特徴語句を重みづけして前記ユーザメッセージの特徴量を算出してもよい。
【0016】
本実施形態によれば、センタ装置は、受信したユーザメッセージの表示にあたって、ユーザメッセージに基づく特徴語句を選択可能に表示する。オペレータが特徴語句を選択する操作に応じて当該選択語句について重みづけして入力メッセージの特徴量を算出し、当該特徴量に基づきデータベース内から類似会話を検索する。これにより、オペレータが特徴語句をテキスト入力等よりも選択しやすく、適切な特徴語句を選択しやすい。結果的に、適切な特徴語句を重みづけすることができる。
【0017】
前記特徴量算出手段は、前記1以上の特徴語句の選択順に応じて重みづけの度合いを異ならせて、前記ユーザメッセージの特徴量を算出してもよい。
【0018】
重みづけの度合いを異ならせることで、より適切に特徴量を算出でき、オペレータの意図に沿った類似度の高い対話データを抽出しやすい。
【0019】
前記記憶手段は、
前記受信手段が順次受信する前記ユーザメッセージを含む対話データを蓄積し、
重みづけされた1以上の特徴語句が前記ユーザメッセージに含まれるとき、前記ユーザメッセージに関連付けて、前記特徴量算出手段により前記重みづけして算出された前記ユーザメッセージの特徴量を、さらに蓄積してもよい。
【0020】
ユーザメッセージ、特徴量及び重みづけの情報を蓄積することで、類似度の高い対話データの検索の精度が向上する。
【0021】
前記応答候補生成手段は、抽出された前記対話データに含まれる応答メッセージの評価に基づき、1以上の応答候補を生成してもよい。
【0022】
これにより、応答候補の質を担保できる。
【0023】
本発明の一形態に係るセンタ装置は、
ユーザと双方向でメッセージのやり取りを行う端末装置から、ユーザメッセージを受信する受信手段と、
前記ユーザメッセージ及び前記ユーザメッセージに対する応答メッセージを含む対話データを記憶する記憶手段と、
前記ユーザメッセージに基づく1以上の特徴語句の入力をオペレータより受け付ける特徴語句入力手段と、
前記特徴語句を重みづけして前記ユーザメッセージの特徴量を算出する特徴量算出手段と、
前記算出した特徴量に基づき、前記ユーザメッセージとの類似度が高い過去のユーザメッセージを含む対話データを前記記憶手段から検索する検索手段と、
を具備する。
【発明の効果】
【0024】
本発明によれば、人的な負担を減らしつつ、一定の質が担保された対話を行うことが可能な対話システムを提供することができる。
【0025】
なお、ここに記載された効果は必ずしも限定されるものではなく、本発明中に記載されたいずれかの効果であってもよい。
【図面の簡単な説明】
【0026】
図1】本発明の一実施形態に係る対話システムの構成を示した図である。
図2】上記対話システムが有するセンタ装置のハードウェア構成を示した図である。
図3】対話システムの動作フローを示す。
図4】語句表示手段による特徴語句の表示態様の例を示す。
図5】語句表示手段による特徴語句の表示態様の例を示す。
図6】動作の一例を模式的に示す。
図7】動作の一例を模式的に示す。
図8】動作の一例を模式的に示す。
【発明を実施するための形態】
【0027】
以下、図面を参照しながら、本発明の実施形態を説明する。
【0028】
1.対話システムの構成
【0029】
図1は、本実施形態に係る対話システムの構成を示した図である。
【0030】
対話システム10は、主に雑談等の日常会話が行われるコミュニケーションサービスを実現する。対話システム10は、応答をマニュアル化しにくく、多様な応答が想定され、また、複数のユーザとの継続的な雑談等の日常会話を実現する。対話システム10は、オペレータの人手を介さずとも実現可能な製品案内や契約手続き等での自動応答システムとは異なり、共感等の感情や意思が重要であるため対話の質を担保するにはオペレータの人手が欠かせない。
【0031】
対話システム10は、対話システム10によるサービスを提供する事業者により管理されるサーバ装置としてのセンタ装置100及びセンタ装置100と接続されたオペレータ装置160と、センタ装置100と通信可能にネットワーク接続された複数の端末装置200とで構成される。
【0032】
端末装置200は、本システムのユーザ(例えば高齢者等)宅に設置される。端末装置200は、入力手段201と、メッセージ送信手段202と、応答出力手段203と、を有する。入力手段201は、マイクMからユーザからのメッセージである音声データのユーザメッセージを入力する。メッセージ送信手段202は、受信されたユーザメッセージを、ネットワークを通じてセンタ装置100に送信する。応答出力手段203は、ユーザメッセージに対する応答メッセージを、ネットワークを通じてセンタ装置100から受信し、スピーカSからユーザに音声で出力する。
【0033】
端末装置200は、少なくとも上記の構成要素を有していればよいが、ユーザにとって人との対話(特に、雑談等の日常会話)を想起でき、親しみを持てるような外見として小型の人形を模した対話ロボットであってもよい。
【0034】
センタ装置100は、本対話システム10によるサービスを提供する事業者により管理され、少なくとも受信手段101と、抽出手段102と、応答候補生成手段103と、特徴語句入力手段104と、特徴語句表示手段105と、応答候補表示手段106と、応答送信手段107と、特徴量算出手段108と、検索手段109と、を有する。またそれら手段を制御する制御手段を有する。これらは適宜周知なハードウェア(いわゆるサーバコンピュータやパーソナルコンピュータ)や記憶手段140に記憶されるソフトウェアにより実現される。
【0035】
記憶手段140は、辞書141及び対話データ142を記憶する。
【0036】
辞書141は、カテゴリ(場所、食べ物、趣味嗜好等)及び極性値(ポジティブやネガティブといった意味上のフラグ立て)を、語句に関連付けて記憶する。辞書141は、ユーザ毎に設定してもよいし、ユーザ非依存でもよいし、その両者でもよい。辞書141は、特徴語句をさらに記憶する。特徴語句の例は、図3のステップ3で具体的に説明する。
【0037】
対話データ142は、端末装置200から受信されたユーザメッセージと、このユーザメッセージに対する応答メッセージとを含む。対話データ142は、ユーザ毎に過去の対話履歴をデータベースに蓄積したデータでもよいし、複数のユーザ(複数の端末装置200)の対話履歴を総合して蓄積したユーザ非依存のデータでもよいし、その両者でもよい。対話データ142は、複数のユーザの対話履歴を順次記憶する。対話データ142は、会話例文を事前に登録しておいてもよい。対話履歴の記憶にあたって、応答内容についての評価をあわせて記憶してもよい。例えば、応答内容についてユーザの反応がポジティブ(例えば、ポジティブな極性の返答)であれば高評価、ネガティブ(例えば、ネガティブな極性の返答、返答なし等)であれば低評価とする。これにより、類似会話を検索した際に応答内容の質を担保できる。類似文の検索の効率化のために、対話履歴を蓄積する際にカテゴリ分け記憶してもよい。類似文の検索にあたって受信されたユーザメッセージに重みづけの処理がされた場合、当該重みづけの情報も含めて対話履歴として記憶する(図3のステップS5~ステップS7で具体的に説明する。)。
【0038】
オペレータ装置160は、本対話システム10によるサービスを提供する事業者により管理され、センタ装置100が受信したユーザメッセージに対する応答メッセージの候補である応答候補を、オペレータに向けてウェブブラウザに表示する。センタ装置100とオペレータ装置160とは、ウェブサーバとウェブクライアントとの関係にある。
【0039】
なお、センタ装置100とオペレータ装置160とをハードウェア的に一体化してもよい。
【0040】
2.センタ装置のハードウェア構成
【0041】
図2は、上記センタ装置100のハードウェア構成を示した図である。
【0042】
同図に示すように、センタ装置100は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、入出力インタフェース15、及び、これらを互いに接続するバス14を備える。
【0043】
CPU11は、必要に応じてRAM13等に適宜アクセスし、各種演算処理を行いながらセンタ装置100の各ブロック全体を統括的に制御する。ROM12は、CPU11に実行させるOS、プログラムや各種評価指標などのファームウェアが固定的に記憶されている不揮発性のメモリである。RAM13は、CPU11の作業用領域等として用いられ、OS、実行中の各種アプリケーション、処理中の各種データを一時的に保持する。
【0044】
入出力インタフェース15には、表示部16、操作受付部17、記憶部18、通信部19等が接続される。
【0045】
表示部16は、例えばLCD(Liquid Crystal Display)、OELD(Organic ElectroLuminescence Display)、CRT(Cathode Ray Tube)等を用いた表示デバイスである。
【0046】
操作受付部17は、例えばマウス等のポインティングデバイス、キーボード、タッチパネル、その他の入力装置である。
【0047】
記憶部18は、例えばHDD(Hard Disk Drive)や、フラッシュメモリ(SSD;Solid State Drive)、その他の固体メモリ等の不揮発性メモリである。当該記憶部18には、上記OSのほか、スケジュール情報や、各種フラグ類、評価指標類、センタ装置100の各手段を実現するソフトウェア類が記憶される。また、記憶部18は、応答メッセージ生成を含む端末装置200とのメッセージのやり取りのためのアプリケーションその他のプログラム及びデータベースを記憶している。
【0048】
通信部19は、例えばEthernet(登録商標)用のNIC(Network Interface Card)や無線LAN等の無線通信用の各種モジュールであり、上記端末装置200との間の通信処理を担う。
【0049】
オペレータ装置160及び端末装置200のハードウェア構成も基本的には上記センタ装置100のハードウェア構成と同様であるが、端末装置200は、上述のように前面にマイクM及びスピーカSを有する。
【0050】
3.対話システム10の動作フロー
【0051】
図3は、対話システムの動作フローを示す。
【0052】
端末装置200の入力手段201は、マイクMからユーザからのメッセージであるユーザメッセージを入力する(ステップS1、Yes)。ユーザメッセージは音声データである。端末装置200のメッセージ送信手段202は、受信されたユーザメッセージを、ネットワークを通じてセンタ装置100に送信する。メッセージ送信手段202は、音声データのユーザメッセージを音声認識してテキストデータのユーザメッセージに変換してセンタ装置100に送信してもよく、あるいは、音声データのユーザメッセージをセンタ装置100に送信してもよい。
【0053】
センタ装置100の受信手段101は、端末装置200から、通信部19を介してユーザメッセージを受信する(ステップS2)。受信手段101は、音声データのユーザメッセージを受信してテキストデータのユーザメッセージに変換してもよいし、あるいは、端末装置200が音声データから変換したテキストデータのユーザメッセージを受信してもよい。
【0054】
センタ装置100の抽出手段102は、テキストデータであるユーザメッセージを形態素解析して複数の語句に分割し、この複数の語句から、ユーザメッセージに含まれる1以上の特徴語句を候補として抽出する(ステップS3)。特徴語句は、受信されたユーザメッセージに含まれる語句と、受信されたユーザメッセージには含まれていないがユーザメッセージから類推される語句とがある。
【0055】
ユーザメッセージに含まれる特徴語句の具体例(1)~(2)を説明する。(1)例えば、抽出手段102は、語句毎にカテゴリを付与した辞書141を登録しておき、所定のカテゴリ(場所、食べ物、趣味嗜好等)の単語を特徴語句として抽出する。(2)また、抽出手段102は、ユーザ毎に異なる特徴語句を抽出してもよい。具体的には、各ユーザの趣味嗜好に関する語句(単語)をユーザ毎の個別特徴語句として辞書141に登録しておき、対話先のユーザに関する個別特徴語句に基づき特徴語句を抽出する。特徴語句の抽出において、個別特徴語句のみを抽出してもよいし、個別特徴語句が優先して抽出されるようにしてもよい。また、例えば、ユーザの趣味嗜好に関する単語を特徴語句として事前に辞書141に登録しておいてもよいし、ユーザとの対話を対話データ142として蓄積し、対話から各ユーザの趣味嗜好を特定して、個別特徴語句として登録してもよい。また各ユーザの過去のユーザメッセージからユーザの趣味嗜好をAIや機械学習により学習して、ユーザメッセージから当該趣味嗜好に合致する単語を個別特徴語句として登録してもよい。なお本実施形態で「語句」とは、名詞等の1単語や、複数の単語を含む句を包含する。
【0056】
ユーザメッセージには含まれていないがユーザメッセージから類推される特徴語句の具体例(3)~(5)を説明する。(3)ユーザによっては感情表現に関する語句を発話せずに省略する場合がある。そこで、抽出手段102は、口語上で省略される傾向のある語句(例えば、嬉しい、悲しいなど)を辞書141に登録しておき、省略された語句を受信されたユーザメッセージから類推して、類推した語句を特徴語句として抽出してもよい。(4)NGワード(ユーザ毎に苦手な食べ物等)を辞書141に登録しておき、抽出手段102は、受信されたユーザメッセージに関連するNGワードを抽出しないようにしてもよい。(5)抽出手段102は、受信されたユーザメッセージの時刻情報を特徴語句として抽出してもよい。例えば、「・・・ごはんおいしかったです。・・・」という受信されたユーザメッセージが属性として時刻情報(12:30)を含むとする。この場合、抽出手段102は、時刻情報(12:30)を特徴語句として抽出すればよい。
【0057】
センタ装置100の特徴語句表示手段105は、オペレータが使用するオペレータ装置160に、ユーザメッセージを表示するとともに、1以上の特徴語句を選択可能に表示する。1以上の特徴語句は、抽出手段102が抽出した1以上の特徴語句の少なくとも一部である。特徴語句表示手段105は、抽出手段102が抽出した1以上の特徴語句の全てを、1以上の特徴語句として表示してもよい。
【0058】
特徴語句表示手段105は、1以上の特徴語句が出現した回数及び/又はユーザメッセージ内での位置に基づき、1以上の特徴語句のうち一部の特徴語句を1以上の特徴語句として表示してもよい。例えば、特徴語句表示手段105は、1以上の特徴語句のうち、出現回数がより多い特徴語句や、ユーザメッセージ内で後半の位置に出現する特徴語句のみを、特徴語句として表示してもよい。1以上の特徴語句が出現した回数は、今回のユーザメッセージ内で出現した回数でもよいし、過去のユーザメッセージと応答メッセージとを含む対話データ142内で出現した回数でもよい。
【0059】
また、特徴語句表示手段105は、1以上の特徴語句のうち、対話先のユーザに関する個別特徴語句を特徴語句として優先的に決定してもよい。例えば、個別特徴語句のみを特徴語句として表示してもよいし、個別特徴語句が優先して特徴語句として表示されるようにしてもよい。
【0060】
特徴語句表示手段105が1以上の特徴語句を「選択可能に表示」するとは、ウェブサーバであるセンタ装置100が、ウェブクライアントであるオペレータ装置160のウェブブラウザ上でハイパーリンクを付して表示し、それをオペレータによる手動の操作(クリック、マウスオーバー、タップ等)により選択可能であることを意味する。
【0061】
図4及び図5は、語句表示手段による特徴語句の表示態様の例を示す。
【0062】
図4に示す様に、特徴語句表示手段105は、1以上の特徴語句111を、1以上の特徴語句以外の語句と区別可能な態様で、ユーザメッセージ112内に表示してもよい。図5に示す様に、特徴語句表示手段105は、1以上の特徴語句111を、1以上の特徴語句以外の語句と区別可能な態様で、ユーザメッセージ112外にまとめて表示してもよい。区別可能な態様とは、例えば、太字、異なる色、下線、囲み文字等を意味する。図5の様に、「キーワード」との見出し115を付して、ユーザメッセージ112外にまとめて表示することも、区別可能な態様の一種である。特徴語句111を目立つ様に表示することで、オペレータが特徴語句111を容易に選択可能である。特徴語句表示手段105は、さらに、特徴語句111を選択するためのカーソル113を表示する。
【0063】
特徴語句表示手段105は、1以上の特徴語句のうち一部の特徴語句を強調表示してもよい。強調表示とは、例えば、特徴語句が太字で示されている場合にさらにその色を変更したり、特徴語句がそれ以外の語句と異なる色で示されている場合にさらに太字にしたり、特徴語句が囲み文字で示されている場合に囲み枠を太くしたり色を変更したりする処理であるが、これらに限られない。これにより、特徴語句の中でもより重要度の高い単語(ユーザが話したい内容)を目立たせることで、ユーザの思いに沿った特徴語句を自然とオペレータが選択できるようになり、ユーザメッセージに合った対話データを抽出できる。
【0064】
例えば、1以上の特徴語句が出現した回数及び/又はユーザメッセージ内での位置に基づき、1以上の特徴語句のうち一部の特徴語句を強調表示してもよい。具体的には、特徴語句表示手段105は、1以上の特徴語句のうち、出現回数がより多い特徴語句や、ユーザメッセージ内で後半の位置に出現する特徴語句を、他の特徴語句に比べてオペレータが選択しやすくするために、強調表示してもよい。1以上の特徴語句が出現した回数は、今回のユーザメッセージ内で出現した回数でもよいし、過去のユーザメッセージと応答メッセージとを含む対話データ142内で出現した回数でもよい。これにより、特徴語句をユーザ毎に設定することで、ユーザに寄り添った対話を自然と行えるようになる。
【0065】
また、特徴語句表示手段105は、1以上の特徴語句のうち、対話先のユーザに関する個別特徴語句を強調表示してもよい。例えば、個別特徴語句のみを強調表示してもよいし、少なくとも個別特徴語句が強調表示されるようにしてもよい。これにより、強調表示する特徴語句をユーザ毎に設定することで、ユーザに寄り添った対話を自然と行えるようになる。
【0066】
オペレータは、オペレータ装置160に表示されたユーザメッセージ及び1以上の特徴語句を参照し、1個の特徴語句を操作(クリック、マウスオーバー、タップ等)して選択する。これにより、特徴語句入力手段104は、特徴語句表示手段105により表示された1以上の特徴語句の中から、1以上の特徴語句の選択をオペレータより受け付ける。なお、特徴語句入力手段104は、ユーザメッセージに基づく1以上の特徴語句の入力をオペレータより受け付ければよい。例えば、特徴語句入力手段104は、オペレータよりテキスト入力された特徴語句を受け付けてもよい(ステップS4)。
【0067】
センタ装置100の特徴量算出手段108は、特徴語句入力手段104が受け付けた特徴語句を重みづけして、受信手段101が受信したユーザメッセージの特徴量を算出する(ステップS5)。「ユーザメッセージの特徴量」とは、例えば、ユーザメッセージをベクトル化して得られたベクトル、あるいは、編集距離(レーベンシュタイン距離)でよい。ユーザメッセージのベクトルは後で詳細に説明する。
【0068】
センタ装置100の特徴量算出手段108は、1以上の特徴語句の選択順に応じて重みづけの度合いを異ならせて(先に選択された特徴語句ほど重みづけの度合いを大きくして)、ユーザメッセージの特徴量を算出してもよい。特徴量算出手段108は、1以上の特徴語句が出現した回数及び/又はユーザメッセージ内での位置に基づき、重みづけの度合いを異ならせてもよい。例えば、特徴量算出手段108は、1以上の特徴語句のうち、出現回数がより多い特徴語句や、ユーザメッセージの後半にある特徴語句(例えば、ユーザメッセージの最も後半で用いられている評価語句、ユーザメッセージの最後の文で用いられている評価語句)の重みづけの度合いを高くしてもよい。1以上の特徴語句が出現した回数は、今回のユーザメッセージ内で出現した回数でもよいし、過去のユーザメッセージと応答メッセージとを含む対話データ142内で出現した回数でもよい。また、特徴語句表示手段105は、1以上の特徴語句のうち、対話先のユーザに関する個別特徴語句(嗜好等)の重みづけの度合いを高くしてもよい。即ち、特徴量算出手段108は、ポジティブな評価語句がユーザの趣味嗜好に関するカテゴリの語句である場合には、さらに重み付けの度合いを高めてもよい。重みづけの度合い(数値)は、正の値でもよいし、0でもよいし、負の値でもよい。例えば、特徴語句がNGワードであるとき、その特徴語句の重みづけを0としてもよいし、負の値としてもよい。重みづけの度合いを異ならせることで、より適切に特徴量を算出でき、オペレータの意図に沿った類似度の高い対話データを抽出しやすい。
【0069】
センタ装置100の検索手段109は、特徴量算出手段108が算出したユーザメッセージの特徴量に基づき、ユーザメッセージとの類似度が高い過去のユーザメッセージを含む対話データを、記憶手段140の対話データ142から検索する。具体的には、検索手段109は、受信手段101により受信されたユーザメッセージの特徴量と、記憶手段140に蓄積された対話データ142に含まれるユーザメッセージの特徴量とに基づき、受信されたユーザメッセージとの類似度が高いユーザメッセージを含む対話データ142を、記憶手段140から抽出する(ステップS6)。
【0070】
センタ装置100の記憶手段140は、受信手段101が順次受信する前記ユーザメッセージを含む対話データ142を蓄積する。記憶手段140は、受信手段101が受信するユーザメッセージに関連付けて、特徴量算出手段108により算出されたユーザメッセージの特徴量(例えば、ベクトル、編集距離(レーベンシュタイン距離))を、さらに蓄積する。記憶手段140は、重みづけされた1以上の特徴語句がこのユーザメッセージに含まれるとき、重みづけして算出されたユーザメッセージの特徴量を蓄積する。また、このユーザメッセージに関連付けて、重みづけの情報を、さらに蓄積してもよい(ステップS7)。「重みづけの情報」は、重みづけの対象となる特徴語句と、重みづけの度合い(数値)とを示せばよい。ユーザメッセージ、特徴量及び重みづけの情報を蓄積することで、類似度の高い対話データ142の検索の精度が向上する。
【0071】
センタ装置100の応答候補生成手段103は、検索手段109により抽出された対話データに基づき、ユーザメッセージに対する応答メッセージの候補である1以上の応答候補を生成する(ステップS8)。応答候補は、受信したユーザメッセージに対して類似度が高い1以上の対話データ142に含まれる1以上のユーザメッセージに対する1以上の応答メッセージでよい。応答候補生成手段103は、抽出された対話データ142に含まれる応答メッセージの評価に基づき、1以上の応答候補を生成してもよい。これにより、応答候補の質を担保できる。
【0072】
センタ装置100の応答候補表示手段106は、応答候補生成手段103が生成(ステップS8)した1以上の応答候補を、オペレータ装置160に選択可能かつ編集可能に表示する(ステップS9)。ユーザメッセージの類似度に基づき生成された応答候補が複数ある場合には、応答候補表示手段106は、複数の応答候補をユーザメッセージの類似度の高い順に表示すればよい。これにより、オペレータの意思に沿った応答候補をオペレータに選択させることができる。応答候補表示手段106は、抽出された対話データ142に含まれる応答メッセージの評価に基づき、1以上の応答候補の表示順を決定してもよい。応答メッセージの評価は、極性(ポジティブ、ネガティブ)、応答メッセージとしての適切性(例えば、ユーザの趣味嗜好、ポジティブな極性値を有する語句、感情語句、特定のカテゴリの語句を含む等)、応答候補のセンシティブ指標値、ユーザメッセージと応答メッセージとを含む対話データ142内での出現の有無及び/又は所定期間の対話データ142内で出現した回数等に基づき行えばよい。
【0073】
センタ装置100の応答送信手段107は、オペレータ装置160に表示された1以上の応答候補からオペレータ装置160を介して選択された1個の応答候補を判定する(ステップS10)。応答送信手段107は、選択された応答候補を、応答メッセージとして端末装置200に送信する(ステップS11)。なお、応答送信手段107は、選択された応答候補が編集されると、編集された応答候補を応答メッセージとして端末装置200に送信する。応答送信手段107は、テキストデータの応答メッセージを音声合成技術により音声データの応答メッセージに変換して端末装置200に送信してもよく、あるいは、テキストデータの応答メッセージを端末装置200に送信してもよい。
【0074】
端末装置200の応答出力手段203は、センタ装置100から応答メッセージを受信し、所定のタイミングで(例えば、受信直後、人感センサで端末装置200の周囲に人を検知したとき)、応答メッセージをスピーカSから出力する。応答出力手段203は、音声データの応答メッセージをセンタ装置100から受信し出力してもよく、あるいは、テキストデータの応答メッセージをセンタ装置100から受信して音声合成技術により音声データの応答メッセージに変換して出力してもよい。
【0075】
図6及び図7は、ステップS5乃至ステップS11の動作の一例を模式的に示す。
【0076】
図6に示す様に、センタ装置100の特徴量算出手段108は、受信手段101が受信したユーザメッセージ「最近は物忘れ…」の特徴量(Vector0)を算出する(ステップS5)。センタ装置100の検索手段109は、ユーザメッセージ「最近は物忘れ…」の特徴量(Vector0)と、記憶手段140に蓄積された対話データ142に含まれるユーザメッセージの特徴量(Vector1,2,3)とに基づき、受信されたユーザメッセージとの類似度(類似度1,2,3)を算出する。
【0077】
図7に示す様に、センタ装置100の検索手段109は、ユーザメッセージ「最近は物忘れ…」との類似度(類似度3)が高いユーザメッセージ「最近は忘れ…」を含む対話データ142(No.3)を、記憶手段140から抽出する(ステップS6)。記憶手段140は、受信手段101が受信したユーザメッセージ及び特徴量(Vector0)等を、記憶手段140に蓄積する(ステップS7)。応答候補生成手段103は、検索手段109により抽出された対話データに基づき、ユーザメッセージに対する応答メッセージの候補である応答候補「若いころ…」を生成する(ステップS8)。応答候補表示手段106は、応答候補「若いころ…」を、オペレータ装置160に選択可能かつ編集可能に表示する(ステップS9)。応答送信手段107は、オペレータ装置160を介して選択された応答候補(ステップS10)を、応答メッセージとして端末装置200に送信する(ステップS11)。
【0078】
4.ユーザメッセージの特徴量及び類似度
【0079】
ここで、特徴語句(ステップS4)に依存するユーザメッセージの特徴量としてのベクトル(ステップS5)及び類似度(ステップS6)の一例を説明する。
【0080】
図8は、ステップS2乃至ステップS6の動作の一例を模式的に示す。
【0081】
センタ装置100の受信手段101は、ユーザメッセージ「老いるっていうのはこういうことね。悲しいわ。」を受信する(ステップS2)。抽出手段102は、ユーザメッセージに含まれる特徴語句「悲しい」を候補として抽出する(ステップS3)。オペレータは、オペレータ装置160に表示されたユーザメッセージ及び特徴語句を参照し、1個の特徴語句「悲しい」を操作して選択する。これにより、特徴語句入力手段104は、特徴語句「悲しい」の選択をオペレータより受け付ける。(ステップS4)。
【0082】
センタ装置100の特徴量算出手段108は、ユーザメッセージを重みづけせずにベクトル化し、ベクトルV1を算出する。さらに、特徴量算出手段108は、特徴語句入力手段104が受け付けた特徴語句「悲しい」のみをベクトル化し、ベクトルV2を算出する。特徴量算出手段108は、重みづけなしのベクトルV1と、特徴語句のみのベクトルV2との和を算出することにより、特徴語句「悲しい」を重みづけしたユーザメッセージのベクトルV3を算出する。これにより、特徴語句「悲しい」の重みづけの度合いが、他の語句に比べて高くなる。このベクトルV3がユーザメッセージの特徴量である(ステップS5)。変形例として、特徴量算出手段108は、特徴語句入力手段104が受け付けた特徴語句のみをベクトル化して算出されたベクトルV2を、ユーザメッセージのベクトル(特徴量)としてもよい。形態素等でシンプルにベクトル化しただけでは0の多い疎なベクトルになるおそれがある。このため、TF-IDFや深層学習モデルの中間表現利用(Sentence BERT)などで情報圧縮されたベクトルとしてもよい。
【0083】
センタ装置100の検索手段109は、ユーザメッセージの特徴量(ベクトル)と、記憶手段140に蓄積されたユーザメッセージの特徴量とに基づき、受信されたユーザメッセージとの類似度が高いユーザメッセージを含む対話データ142を、記憶手段140から抽出する。例えば、2個のユーザメッセージのベクトルA、Bの内積を、類似度として利用できる。2つのベクトルA、Bが類似しているほど、正射影ベクトルは長くなる。2つのベクトルA、Bが逆の方向を向いていると、正射影ベクトルは負の値となる。ベクトルA、Bを単位ベクトル化し、内積を計算すると、-1~1の範囲に収まるようになる。必要に応じて0~1に変換してもよい。検索手段109は、ユーザメッセージのベクトルV3との関係で、内積が最大となるベクトルを有する(即ち、Cos類似度が高い)ユーザメッセージを含む対話データ142を、記憶手段140から抽出する(ステップS6)。Cos類似度のほか、Jaccard係数を使用してもよい。すべての過去メッセージとの類似度を、毎回計算するのは時間がかかるため、事前に類似している事例を分類しておいてもよい。
【0084】
オペレータが編集(修正)した応答候補を対話データ142として蓄積してもよい。これにより、類似度を学習するための教師データの蓄積となる。「オペレータが修正したこと」は貴重な情報である。修正例として、修正されやすい(オペレータによりクリックされやすい)単語をマークアップしてもよい。類似度計算部分を修正してもよい。深層学習ベースの手法であれば、データの追加でブラッシュアップ可能である。
【0085】
5.結語
【0086】
対話システム10は、主に雑談等の日常会話が行われるコミュニケーションサービスを実現する。対話システム10は、応答をマニュアル化しにくく、多様な応答が想定され、また、複数のユーザとの継続的な雑談等の日常会話を実現する。対話システム10は、オペレータの人手を介さずとも実現可能な製品案内や契約手続き等での自動応答システムとは異なり、共感等の感情や意思が重要であるため対話の質を担保するにはオペレータの人手が欠かせない。一方、人手不足も社会課題となっており、オペレータの人手による対応には限界がある。
【0087】
そこで、本実施形態によれば、センタ装置100は、受信したユーザメッセージの表示にあたって、ユーザメッセージに基づく特徴語句を選択可能に表示する。オペレータが特徴語句を選択する操作に応じて当該選択語句について重みづけして入力メッセージの特徴量を算出し、当該特徴量に基づきデータベース内から類似会話を検索する。重みづけした上でユーザメッセージの特徴量を算出することにより、類似度の高いユーザメッセージを適切に選択できる。このため、ユーザメッセージに対してオペレータの人的な負担を減らして、且つ、オペレータが適切に応答することを図れる。
【0088】
重みづけにあたり、選択可能語句の選択順等に応じて重みづけの大きさを異ならせ、重みづけ情報を含めてデータベースに蓄積する。さらに、応答候補の表示にあたり、検索した類似会話に基づき応答候補を表示し、また、対話データにおける応答内容の評価に応じて応答候補を表示してもよい。これにより、オペレータが過去の類似会話を参照して、質の担保された応答文を効率的に作成できる。
【0089】
本技術の各実施形態及び各変形例について上に説明したが、本技術は上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
【0090】
本発明の一実施形態にかかる対話システムは、高齢者の孤独や孤立、健康寿命の延伸、高齢者の生活の質(QoL)向上、労働力人口減少などの社会課題の解決に貢献し得るものである。また、本発明の一実施形態にかかる対話システムは、国連で採択された持続可能な開発目標(SDGs)の目標3「すべての人に健康と福祉を」の実現に貢献することができる。
【符号の説明】
【0091】
10 対話システム
100 センタ装置
101 受信手段
102 抽出手段
103 応答候補生成手段
104 特徴語句入力手段
105 特徴語句表示手段
106 応答候補表示手段
107 応答送信手段
108 特徴量算出手段
109 検索手段
111 特徴語句
112 ユーザメッセージ
113 カーソル
140 記憶手段
141 辞書
142 対話データ
160 オペレータ装置
200 端末装置
201 入力手段
202 メッセージ送信手段
203 応答出力手段
M マイク
S スピーカ
図1
図2
図3
図4
図5
図6
図7
図8