IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

特開2024-5572対話装置、対話方法及び対話プログラム
<>
  • 特開-対話装置、対話方法及び対話プログラム 図1
  • 特開-対話装置、対話方法及び対話プログラム 図2
  • 特開-対話装置、対話方法及び対話プログラム 図3
  • 特開-対話装置、対話方法及び対話プログラム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024005572
(43)【公開日】2024-01-17
(54)【発明の名称】対話装置、対話方法及び対話プログラム
(51)【国際特許分類】
   G10L 15/22 20060101AFI20240110BHJP
   G10L 13/00 20060101ALI20240110BHJP
【FI】
G10L15/22 300Z
G10L13/00 100M
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022105804
(22)【出願日】2022-06-30
(71)【出願人】
【識別番号】000000295
【氏名又は名称】沖電気工業株式会社
(74)【代理人】
【識別番号】100180275
【弁理士】
【氏名又は名称】吉田 倫太郎
(74)【代理人】
【識別番号】100161861
【弁理士】
【氏名又は名称】若林 裕介
(72)【発明者】
【氏名】齋藤 彰
(72)【発明者】
【氏名】奥村 晃弘
(72)【発明者】
【氏名】白石 哲也
(72)【発明者】
【氏名】前橋 祐斗
(57)【要約】
【課題】ユーザー発話に対して対話装置が回答し、その後に取得したユーザー発話の内容を判断することで、ユーザーの目的に対して適切な回答を対話装置が発話していることを認識できる対話装置を提供しようとするものである。
【解決手段】本発明は、ユーザーとの間で対話する対話装置において、第1の発話文と、第1の発話文の直前に対話で用いられた第2の発話文とを用いて、ユーザーの発話意図に対する応答の乖離性を識別する識別部と、識別部による識別結果に応じて、ユーザーに対する発話を出力する発話生成部とを備える。
【選択図】 図1
【特許請求の範囲】
【請求項1】
ユーザーとの間で対話する対話装置において、
第1の発話文と、前記第1の発話文の直前に対話で用いられた第2の発話文とを用いて、ユーザーの発話意図に対する応答の乖離性を識別する識別部と、
前記識別部による識別結果に応じて、ユーザーに対する発話を出力する発話生成部と
を備えることを特徴とする対話装置。
【請求項2】
前記識別部が、前記第1の発話文と、前記第2の発話文との対応関係を識別して、ユーザーの発話意図に対する応答の乖離性を識別することを特徴とする請求項1に記載の対話装置。
【請求項3】
前記識別部が、前記第1の発話文内に、前記第2の発話文に対する回答が含まれているとき、ユーザーの発話意図に対して適正に応答していると判断し、含まれていないとき、ユーザーの発話意図に対して応答が乖離していると判断することを特徴とする請求項2に記載の対話装置。
【請求項4】
前記識別部により、前記第1の発話文内に、前記第2の発話文に対する回答が含まれていないと判断されると、
前記発話生成部が、所定の想定外時の発話を出力する
ことを特徴とする請求項3に記載の対話装置。
【請求項5】
ユーザーとの間で対話する対話方法において、
識別部が、第1の発話文と、前記第1の発話文の直前に対話で用いられた第2の発話文とを用いて、ユーザーの発話意図に対する応答の乖離性を識別し、
発話生成部が、前記識別部による識別結果に応じて、ユーザーに対する発話文を出力する
ことを特徴とする対話方法。
【請求項6】
ユーザーとの間で対話する対話プログラムにおいて、
コンピュータを、
第1の発話文と、前記第1の発話文の直前に対話で用いられた第2の発話文とを用いて、ユーザーの発話意図に対する応答の乖離性を識別する識別部と、
前記識別部による識別結果に応じて、ユーザーに対する発話文を生成する発話生成部と
して機能させることを特徴とする対話プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、対話装置、対話方法及び対話プログラムに関し、例えば、ユーザーとの対話において、ユーザーの意図に応じて正しく対話を行なっているか否かを識別する対話装置に適用し得るものである。
【背景技術】
【0002】
一般に、従来の対話装置は、テキスト入力または音声入力により取得したユーザーの発話を解釈し、対話の目的に応じた手段により適切な応答を導き出してユーザーに回答している(特許文献1~3参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2016-45769号公報
【特許文献2】特開2021-32912号公報
【特許文献3】特開2018-151786号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、問い合せをしているユーザーの意図に応じて、対話装置が適切な回答をユーザーに発話しているか否かを、対話装置が正しく認識することは難しかった。その結果、ユーザーの問い合わせ目的とは違う適切でない回答を対話装置が行なってしまうことが生じ得る。
【0005】
そのため、本開示は、上述した課題に鑑みて、ユーザー発話に対して対話装置が回答し、その後に取得したユーザー発話の内容を判断することで、ユーザーの目的に対して適切な回答を対話装置が発話していることを認識できる対話装置を提供しようとするものである。
【課題を解決するための手段】
【0006】
かかる課題を解決するために、第1の本開示は、ユーザーとの間で対話する対話装置において、第1の発話文と、第1の発話文の直前に対話で用いられた第2の発話文とを用いて、ユーザーの発話意図に対する応答の乖離性を識別する識別部と、識別部による識別結果に応じて、ユーザーに対する発話を出力する発話生成部とを備える。
【0007】
第2の本開示は、ユーザーとの間で対話する対話方法において、識別部が、第1の発話文と、第1の発話文の直前に対話で用いられた第2の発話文とを用いて、ユーザーの発話意図に対する応答の乖離性を識別し、発話生成部が、前記識別部による識別結果に応じて、ユーザーに対する発話文を出力する。
【0008】
第3の本開示は、ユーザーとの間で対話する対話プログラムにおいて、コンピュータを、第1の発話文と、第1の発話文の直前に対話で用いられた第2の発話文とを用いて、ユーザーの発話意図に対する応答の乖離性を識別する識別部と、識別部による識別結果に応じて、ユーザーに対する発話文を生成する発話生成部として機能させる。
【発明の効果】
【0009】
本開示によれば、ユーザーの目的に対して適切な回答を対話装置が発話していることを対話装置が認識できるので、不適切な回答発話を抑止できる。
【図面の簡単な説明】
【0010】
図1】実施形態に係る対話システムの全体構成と、対話装置の機能構成とを示すブロック図である。
図2】実施形態に係る乖離性識別部の機能構成を示すブロック図である。
図3】実施形態に係る対話装置における対話方法の処理動作を示すフローチャートである。
図4】実施形態に係る回答識別部及び乖離性識別部の処理を示すフローチャートである。
【発明を実施するための形態】
【0011】
(A)基本概念
以下に、本開示に係る対話装置の一例を説明する。ここでは、ユーザーが意図する問い合わせ目的に対して、対話装置が適切な回答を発話しているかを認識する、本開示の対話装置の基本概念を説明する。
【0012】
例えば、特許文献1は、事前に想定した代表的なユーザー発話のリファレンス文を人手で作成しておき、実際のユーザー発話とリファレンス文との類似度に基づいて、装置が回答するシステム出力文を選択する対話装置を開示している。
【0013】
また、特許文献2は、ユーザー発話の内容が「今日の天気は?」のように具体的な命令であればタスク指向型、「元気ですか?」のように意図が曖昧であれば雑談型と識別し、識別した型の種類に応じて回答する対話装置を開示している。
【0014】
さらに、特許文献3は、ユーザーと対話装置との対話内容について複数のドメインが存在すると仮定し、ドメイン毎に回答とする発話を生成可能な対話モデルを有する対話装置を開示している。そして、ユーザー発話の属するドメインを分類により対話装置が推定し、推定したドメインに対応する対話モデルにより、回答の発話を生成する対話装置を特許文献3は開示している。
【0015】
しかし、上述した特許文献1~3のそれぞれの記載技術を適用しても、ユーザーが意図する問い合わせ目的に対して、対話装置が適切に回答しているか否かについて、対話装置が認識することはできないという課題がある。
【0016】
特許文献1の記載技術は、ユーザー発話と事前に作成したリファレンス文との類似性に基づいて回答する。そのため、ユーザー発話「太宰治の本はどこにありますか?」に対して対話装置が「太宰治の書籍は30件保管しています。」と回答するなど、対話内容のドメインが一致していてもユーザーの問い合わせ目的に対して的確に回答できない場合がある。特許文献1の装置は、対話内容のドメインを広く浅く識別できるため、対話の継続性向上により満足度向上が期待できる雑談などの非タスク指向型対話に適している。しかし、ユーザーの問い合わせ目的に的確な回答が求められるタスク指向型対話には適していない。
【0017】
また、特許文献2の装置は、ユーザー発話の内容から雑談型であるか、又はタスク指向型であるかを識別する必要があり、事前に想定可能な、雑談型のユーザー発話文と、タスク指向型のユーザー発話文とを作成しておく必要がある。しかし、事前にユーザー発話のパターンをすべて予期することは極めて困難である。
【0018】
特許文献3の記載装置は、ユーザー発話から推定した特定のドメインに基づいて対話を行う。そのため、事前に作成または収集可能な当該ドメインのテキストデータのみを使用して想定外のドメインのユーザー発話に対応する必要がある。
【0019】
そこで、本開示は、今回取得したユーザー発話が、直前に対話装置が発した発話に関するものであるかを識別することにより、対話装置がユーザーとの間で正しく対話が行われていることを認識できる対話装置を提供する。
【0020】
(B)主たる実施形態
以下、本発明に係る対話装置の実施形態を、図面を参照しながら詳細に説明する。
【0021】
(B-1)実施形態の構成
(B-1-1)全体構成
図1は、実施形態に係る対話システムの全体構成と、対話装置の機能構成とを示すブロック図である。
【0022】
図1において、対話システム10は、対話装置1と、ユーザー端末2とを有する。
【0023】
なお、図1では、説明便宜上、ユーザー端末2を表記しているが、例えば、ユーザーが対話装置1に対して直接話しかけて対話をするようなシステム(すなわち、音声による対話システム)にも対話システム10を適用することができ、そのような場合、対話システム10はユーザー端末2を省略できる。
【0024】
ユーザー端末2は、対話装置1と対話を行うユーザーが使用する装置であり、例えば、パーソナルコンピュータ、携帯端末等の情報処理装置により実現される。対話システム10の利用形態にもよるが、ユーザー端末2は、キーボードやマウスなどの入力機能、ディスプレイなどの表示機能、通信機能を有し、必要に応じて、マイクとスピーカーを含む音声入出力機能を有してもよい。
【0025】
対話装置1は、例えば、ユーザー端末2を介して、ユーザーと対話を行なう情報処理装置であり、例えば、サーバ装置、クラウドシステム等により実現される。対話装置1も、必要に応じて、ディスプレイ等の表示機能、キーボードやマウス等の入力機能、通信機能、マイク、スピーカーを含む音声入出力機能等を有する。
【0026】
対話装置1は、例えば、GPU(Graphics Processing Unit)やCPU(Central Processing Unit)等のコンピュータ、ROM(Read Only Memory)、RAM(Random Access Memory)、OS(Operating System)や処理プログラム(例えば、対話プログラムを含む。)、処理プログラムの実行時に参照される種々のデータを格納する外部記憶装置などを備える。
【0027】
処理プログラム(例えば、対話プログラム等)はコンピュータにより読み取りであり、コンピュータが処理プログラムを実行することで、図1に例示する各機能ブロックの処理をコンピュータに機能させることができる。
【0028】
なお、図1の対話装置1の各機能ブロックは、ハードウェア単位の構成ではなく機能単位の構成を示している。したがって、単一の装置に、図1の機能ブロックを実装してもよいし、又は、複数の装置のそれぞれに、いずれかの機能ブロックを実装するようにしてもよい。
【0029】
対話装置1は、ユーザー端末2を介して、ユーザーとの間で対話を行なうものである。ユーザーと対話装置1との間の対話で、互いが発した発話文を記録する。対話装置1がユーザー発話を取得すると、そのユーザー発話が、その直前に対話装置1が出力した発話(以下、「システム発話」とも呼ぶ。)に対する回答であるか否かの正否を、対話装置1が識別する。ユーザー発話の受信毎に、そのユーザー発話が、システム発話に対する回答に含まれるか否かの正否を識別してもよい。
【0030】
その識別結果を用いて対話が正しく実施されているか否か(すなわちユーザーが意図する問い合わせに対して、対話装置1が適切に回答できているか否か)を、対話装置1は認識する。正しく対話を行なっていると対話装置1が判断したときには対話を継続する。他方、正しい対話ができていないと対話装置1が判断したときには、例えばユーザーの意図する問い合わせ内容を確認する発話を行なう。
【0031】
上述したように、対話装置1は、対話装置1が期待するユーザー発話と、実際に行われたユーザー発話との差異を早期に認識することができる。そして、以降の対話において、ユーザーの発話意図を対話装置1が誤認識して、不適切な回答を対話装置1が行なうことを抑止できる。
【0032】
(B-1-2)対話装置1の詳細な構成
対話装置1は、ユーザーとの対話内容を制御する対話制御部11と、ユーザーに対する発話文を生成する発話生成部12を有する。
【0033】
対話制御部11は、取得部111、解析部112、発話記録部113、回答識別部114として機能する。
【0034】
対話制御部11は、ユーザーとの対話内容を制御する。対話制御部11は、後述するように、ユーザー発話を評価する回答識別部114を有し、ユーザー発話が、直前の対話装置1の発話に対する回答であるか否かについて回答識別部114による識別結果を取得する。そして、識別結果が正の場合、対話制御部11は通常通りに対話を続ける。他方、識別結果が負の場合、対話制御部11は、想定外のユーザー発話と認識して対話内容を切り替える。なお、識別結果が負の場合の対話内容は、例えば、ユーザーに発話意図を問う対話、ユーザーに対話装置1が発話意図の解析に失敗したことを伝える対話等に切り替えることにより実現される。
【0035】
取得部111は、ユーザー発話を取得する部分である。例えば、テキストデータ又は音声として入力されたユーザー発話を取得部111は取得し、その入力されたユーザー発話を、取得部111は発話記録部113に記録する。また、取得部111は、入力されたユーザー発話を解析部112に与える。
【0036】
解析部112は、取得部111からのユーザー発話文を、例えば形態素解析などの解析処理を行ない、その解析処理で得た結果を、発話記録部113に記録する。
【0037】
発話記録部113は、ユーザー端末2を介して行うユーザーと対話装置1との対話におけるそれぞれの発話文を記録する。発話記録部113は、例えば、RAM、フラッシュメモリ、光ディスク、磁気ディスク等の記憶装置によって実現される。
【0038】
回答識別部114は、今回取得したユーザー発話と、そのユーザー発話の直前の対話装置1の発話とに基づいて、ユーザー発話が、直前の対話装置1の発話に対する回答であるか否かを識別する。また、回答識別部114は、乖離性識別部115を有し、回答識別部114は、乖離性識別部115による識別結果を発話記録部113に記録する。
【0039】
乖離性識別部115は、発話記録部113に記録されている発話文を参照して、ユーザー発話内が、その直前の対話装置1の発話に対する回答を含んでいるか否かの正否を識別する。
【0040】
ユーザー発話内に、対話装置1のシステム発話に対する回答が含まれていれば、ユーザーの発話意図に応じた対話を対話装置1が行なっていると、対話装置1は認識できる。これにより、ユーザーとの対話において、ユーザーの発話意図との認識の乖離を防止できる。
【0041】
図2に例示するように、乖離性識別部115は、発話記録部113から、ユーザー発話文と、その直前のシステム発話文とを取得する取得部1151、識別部1152、識別部1152による識別結果を出力する結果出力部1153を有する。
【0042】
乖離性識別部115による識別方法は、様々な方法を適用でき、その一例として次のような方法がある。例えば、言語モデルと、ユーザー発話と、直前のシステム発話とを用いて、ユーザー発話内に、直前のシステム発話文に対する回答が存在しているか否かを2値分類する方法を、乖離性識別部115は適用できる。2値分類した結果、「1」のときを「正」とし、「0」のときを「負」として、乖離性識別部115は識別結果を出力する。
【0043】
発話生成部12は、対話装置1のユーザーに対する発話文を生成する発話文生成部121と、発話文生成部121により生成された発話文を、ユーザー端末2に出力する発話文出力部122とを有する。例えば、発話生成部12は、事前にユーザーとの対話内容を想定して作成した発話文を、対話時に選択するプログラム等により実現される。
【0044】
(B-2)実施形態の動作
次に、実施形態に係る対話装置1における対話方法の処理動作を、図面を参照しながら詳細に説明する。
【0045】
図3は、実施形態に係る対話装置1における対話方法の処理動作を示すフローチャートである。
【0046】
ここで、ユーザー端末2のユーザーと対話装置1との対話において、今回取得したユーザ発話に、その直前に出力した対話装置1の発話に対する回答が存在しているか否かの正否を、回答識別部114が識別する。その識別結果に応じて、対話制御部11は対話内容を切り替える処理例を説明する。
【0047】
まず、対話装置1では、発話文生成部121がユーザーに対するシステム発話文SU1を生成し、発話文出力部122が、ユーザー端末2にシステム発話文SU1を送信する(ステップS101)。このとき、発話文生成部121は、システム発話文SU1を発話記録部113に記録する。
【0048】
次に、取得部111が、ユーザー端末2を介して、入力されたユーザー発話文UU1を取得すると、受信したユーザー発話文UU1を発話記録部113に記録する(ステップS102)。
【0049】
続いて、回答識別部114は、今回取得したユーザー発話文UU1と、その直前に出力した対話装置1のシステム発話文SU1とを発話記録部113から読み出し、これらユーザー発話文UU1と、その直前のシステム発話文SU1とを、乖離性識別部115に与える。そして、乖離性識別部115は、今回取得したユーザー発話文UU1に、直前の対話装置1のシステム発話文SU1に対する回答が含まれているかの正否を識別する(ステップS103)。
【0050】
ここで、図4を用いて、ステップS103の処理を詳細に説明する。図4は、実施形態に係る回答識別部114及び乖離性識別部115の処理を示すフローチャートである。
【0051】
乖離性識別部115の識別処理では、言語モデルを用いる。この実施形態では、言語モデルの一例としてBERT(Bidirectional Encoder Representations from Transformer)を用いる場合を例示する。なお、言語モデルはBERTに限定されず、ユーザー発話文とその直前の発話文との対応関係を識別する処理に適したものを適用できる。
【0052】
ここでは、機械学習により言語モデルは事前に訓練されており、チューニングされているものとする。ユーザー発話文に、直前のシステム発話に対する回答が存在しているとき「正」とし、存在していないとき「負」とし、この実施形態では、正を「1」、負を「0」として出力される。必要に応じて、「1」と「0」の2値を区分するための閾値を設けるようにしてもよい。
【0053】
図4に例示するように、発話記録部113は、ユーザーとの対話で授受した発話記録に関する情報である発話記録情報5を記録する。
【0054】
発話記録情報5は、様々な構成を適用することができるが、この実施形態では、その一例として、発話記録情報5が、発話文を識別するための「番号」、「発話文」、各発話文を形態素解析等で解析処理して得た単語列を記録する「単語列」を項目とする場合を例示している。
【0055】
図4において、回答識別部114は、今回取得したユーザー発話文UU1と、その直前のシステム発話文SU1とを、発話記録部113から取得する(ステップS201)。
【0056】
また、ユーザー発話文UU1について、解析部112を用いて解析処理した単語列WU1{wu11,wu12,…,wu1m}を取得し、同様に、直前のシステム発話文SU1について単語列WS1{wS11,wS12,…,wS1m}を得る。n,mは単語列の長さである(ステップS202)。
【0057】
なお、解析部112による発話文(ユーザー発話文、システム発話文)の解析処理をステップS202で行なってもよい。
【0058】
回答識別部114は、ユーザー発話文UU1の単語列WU1{wu11,wu12,…,wu1m}と、直前のシステム発話文SU1の単語列WS1{wS11,wS12,…,wS1m}とを、言語モデルであるBERTに入力し(ステップS203)、これにより分散表現を獲得し(ステップS204)、乖離性識別部115が、ユーザー発話文UU1に、その直前のシステム発話文SU1に対する回答が存在しているか否かの正否を識別する(ステップS205)。
【0059】
ここで、乖離性識別部115は、QNLI(Question-answering Natural Language Interface)タスクを解く識別器として機能する。QNLIタスクとは、質問文と回答文との対を、言語モデル(例えば、BERT)の識別器に入力して、その回答文内に、質問文に対する回答が含まれているか否かの正否を識別するタスクである。例えば、QNLIタスクに関する識別手法には、様々な手法があり、QNLIタスクの識別手法の一例が参考文献1に開示されている。
【0060】
[参考文献1]Alex Wang,Amanpreet Singh,Julian Michael,Felix Hill,Omer Levy,Samuel R. Bowman,“GLUE:A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding”,In Proceedings of the 2018 EMNLP Workshop BlackboxNLP:Analyzing and Interpreting Neural Networks for NLP,pp.353-355,2018。
【0061】
また、QNLIタスクを解く識別器は、例えば、参考文献2等の質問文と回答文の対のテキストデータと回答文内に回答を含むか否かの正解ラベルを使用した教師あり学習によって生成した分類器によって実現される。
【0062】
[参考文献2]Zhenzhoong Lan,Mingda Chen,Sebastian Goodman,Kevin Gimpel,Piyush Sharma,Radu Soricut,“ALBERT:A Lite BERT for Self-supervised Learning of Language Representations”,In Proceedings of ICLR 2020,pp.1-17,2020。
【0063】
乖離性識別部115は、参考文献1、2等の記載技術を適用して、ユーザー発話文UU1に、その直前のシステム発話文SU1に対する回答が存在しているか否かの正否を識別することができる。
【0064】
つまり、ユーザー発話文UU1を回答文とし、直前のシステム発話文SU1を質問文として、ユーザー発話文UU1と、直前のシステム発話文SU1とが、言語モデル(例えばBERT)の識別器(すなわち、乖離性識別部115)に入力される。そして、乖離性識別部115が、ユーザー発話文UU1内に、その直前のシステム発話文SU1に対する回答が存在しているか否かの正否を識別する。
【0065】
そして、乖離性識別部115は、ユーザー発話文UU1に、その直前のシステム発話文SU1に対する回答が存在しているとき識別結果として「1(正)」を出力し、存在しないとき識別結果として「0(負)」を出力する(ステップS206)。
【0066】
対話制御部11は、乖離性識別部115による識別結果の正否を確認し(ステップS104)、識別結果が正である場合、対話制御部11は、通常通り対話を継続する命令を発話生成部12に与える(ステップS105)。
【0067】
この場合、対話装置1がユーザーに対して発話した内容が、ユーザーの意図に適したものであり、ユーザーの意図に適した正しい対話を行なっていることを、対話装置1は認識できる。そのため、継続して対話を行なう。
【0068】
また、識別結果が負の場合、対話制御部11は、直前の対話装置1のシステム発話文SU1に対して、ユーザーは想定外の回答をしたと認識し、想定外の際に行う対話に切り替える命令を発話生成部12に与える(ステップS106)。
【0069】
この場合、対話装置1がユーザーに対して発話した内容が、ユーザーの意図に適していない可能性がある。すなわち、正しく対話を進めていないことを対話装置1が認識できる。そのため、ユーザーに対して目的を確認する発話文や、再度問い合わせを確認する発話文等を、対話装置1が発話するようにする。これにより、不適切な発話を発することを抑止できる。
【0070】
なお、図3及び図4で説明した処理は、ユーザー発話文の受信毎に実施し、ユーザー発話毎に、対話が正しく行なわれているか否かを確認する。
【0071】
(B-3)実施形態の効果
以上のように、この実施形態の対話装置1は、ユーザー発話が、その直前の対話装置1の発話に対しての回答か否かの正否という極めて限定的な発話間の対応関係の識別できる。そのため、明確な問い合わせ目的を持つユーザーとの対話を行うタスク指向型対話のように、特定のドメインを対象とする対話において、ユーザーの発話意図の誤認識を抑止できる。
【0072】
また、乖離性識別部115は、ドメインを特定しない質問文と回答文の対からなるテキストデータを用いて識別器を作成できる。そのため、識別器の作成にあたり、目的の対話が対象とする特定のドメイン以外に属するテキストデータも利用できる。加えて、特定の発話内容に対して識別器を作成しないため、対話装置により生成可能な発話文や想定可能なユーザー発話文ごとに対応した識別器を作成する必要がなく、単一の識別器により発話間の対応関係を識別できる。
【0073】
(C)他の実施形態
上述した実施形態においても種々の変形例を言及したが、以下の変形実施形態にも本発明を適用できる。
【0074】
(C-1)上述した実施形態では、ユーザー発話文内に、直前の対話装置の発話に対する回答が含まれているかを識別することにより、ユーザーの発話意図の誤認識を抑止する例を説明した。
【0075】
この例に限らず、識別の対象を入れ替えると、対話装置が行ったシステム発話文内に、直前のユーザー発話に対する回答が含まれているかを識別可能となる。このように、対話装置は、識別結果を用いて、直前のユーザー発話に対して関連性の高い発話内容を選択可能となる。
【0076】
(C-2)上述した実施形態では、言語モデルとしてBERTを用いる場合を例示したが、これに限るものではない。また事前に機械学習で訓練させていることを前提としたが、ユーザーとの対話で交わしたユーザー発話文とシステム発話文とを逐次追加した機械学習させるようにしてもよい。さらに、乖離性識別115による識別結果も、ユーザー発話文と、直前のシステム発話文とに関連付けて学習させるようにしてもよい。
【符号の説明】
【0077】
10…対話システム、1…対話装置、2…ユーザー端末、11…対話制御部、12…発話生成部、111…取得部、112…解析部、113…発話記録部、114…回答識別部、115…乖離性識別部、121…発話文生成部、122…発話文出力部、5…発話記録情報、1151…取得部、1152…識別部、1153…結果出力部。
図1
図2
図3
図4