(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-03-05
(45)【発行日】2025-03-13
(54)【発明の名称】自然言語生成装置、自然言語生成方法、およびプログラム
(51)【国際特許分類】
G06N 5/00 20230101AFI20250306BHJP
【FI】
G06N5/00
(21)【出願番号】P 2024199225
(22)【出願日】2024-11-14
【審査請求日】2024-11-14
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和2年度、国立研究開発法人科学技術振興機構、ムーンショット型研究開発事業(基金)「(1)誰もが自在に活躍できるアバター共生社会の実現(2)存在感CAの開発とCA自在操作インターフェースの研究開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
【早期審査対象出願】
(73)【特許権者】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(73)【特許権者】
【識別番号】500149555
【氏名又は名称】株式会社サイバーエージェント
(74)【代理人】
【識別番号】100149548
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100141139
【氏名又は名称】及川 周
(72)【発明者】
【氏名】吉川 雄一郎
(72)【発明者】
【氏名】石黒 浩
(72)【発明者】
【氏名】中西 惇也
(72)【発明者】
【氏名】馬場 惇
(72)【発明者】
【氏名】岡本 大和
【審査官】佐藤 直樹
(56)【参考文献】
【文献】特表2023-535913(JP,A)
【文献】中国特許出願公開第117828055(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 5/00
(57)【特許請求の範囲】
【請求項1】
利用者から提供される情報をもとに回答を生成する対話インターフェースを提供する対話装置が前記利用者との対話において生成する回答に影響を与える制約情報を更新する情報処理装置であって、
前記対話の記録をもとに改善すべき要改善箇所を抽出する抽出部と、
前記要改善箇所の改善に役立つ知識情報の入力を受け付け、前記知識情報に基づいて前記制約情報を更新するための更新指示情報を生成する生成部と、
前記更新指示情報に基づいて前記制約情報を更新する更新部と、
を備える情報処理装置。
【請求項2】
前記抽出部は、抽出した前記要改善箇所を前記対話装置の管理者に提示し、
前記生成部は、前記管理者による前記知識情報の入力を受け付ける、
請求項1に記載の情報処理装置。
【請求項3】
前記生成部に対して前記知識情報を入力する入力部をさらに備え、
前記抽出部は、前記要改善箇所を前記入力部に供給し、
前記入力部は、前記抽出部から供給された前記要改善箇所について、改善に役立つ知識情報を外部のデータソースから抽出して前記生成部に入力する、
請求項1に記載の情報処理装置。
【請求項4】
前記入力部は、前記利用者の入力に対して回答するように学習された対話モデルを用いて構成される、
請求項3に記載の情報処理装置。
【請求項5】
前記対話装置の管理者との対話のインターフェースを提供する対話部をさらに備え、
前記対話部は、
前記要改善箇所をもとに前記知識情報として必要な情報を特定して前記管理者に提示し、
前記管理者から前記知識情報の入力を受け付け、前記管理者が入力した前記知識情報を前記生成部に入力する、
請求項1に記載の情報処理装置。
【請求項6】
前記対話部は、前記利用者の入力に対して回答するように学習された対話モデルを用いて構成される、
請求項5に記載の情報処理装置。
【請求項7】
前記生成部は、生成した更新指示情報について修正に関するフィードバック情報が前記管理者から入力された場合、前記フィードバック情報に基づいて前記更新指示情報を修正する、
請求項5に記載の情報処理装置。
【請求項8】
前記生成部は、更新前の制約情報である第1の制約情報と、前記フィードバック情報をもとに修正された更新指示情報によって更新された後の制約情報である第2の制約情報と、の両方を保存しておき、前記対話部が、前記第1の制約情報と、前記第2の制約情報とのそれぞれで同じ対話を実行した場合の出力を、それぞれ比較可能な態様で前記管理者に提示する、
請求項7に記載の情報処理装置。
【請求項9】
前記抽出部および前記生成部は、前記利用者の入力に対して回答するように学習された対話モデルを用いて構成される、
請求項1に記載の情報処理装置。
【請求項10】
前記生成部は、入力された前記知識情報に対してフォーマットの整形、または前記制約情報の更新においてキーとなる情報の抽出を行う前処理を施し、前記前処理後の前記知識情報を前記対話モデルに入力する、
請求項9に記載の情報処理装置。
【請求項11】
前記抽出部は、前記要改善箇所として抽出された対話について、前記要改善箇所として抽出された原因を、前記制約情報の修正方針に応じたカテゴリに分類して前記管理者に提示する、
請求項2に記載の情報処理装置。
【請求項12】
前記対話装置は、前記利用者との間でやり取りされる言語ベースの対話情報と、前記対話情報を補足する視覚情報とによって前記利用者と対話するものであり、
前記対話の記録には、前記対話情報および前記視覚情報に関する履歴情報が含まれる、
請求項1に記載の情報処理装置。
【請求項13】
前記対話インターフェースは、身体的動作が可能なロボットとして提供され、
前記視覚情報に関する履歴情報は、前記ロボットが行った前記身体的動作に関する履歴情報を含む、
請求項12に記載の情報処理装置。
【請求項14】
前記対話装置は、前記利用者の表情を読み取るためのカメラを備え、
前記対話の記録には、前記利用者との間でやり取りされる言語ベースの対話情報、および、前記カメラによって撮像された画像または、前記画像から認識された前記利用者の表情に関する履歴情報が含まれる、
請求項1に記載の情報処理装置。
【請求項15】
前記対話装置は、前記利用者と対話する空間の音環境の状況をセンシングするためのマイクを備え、
前記対話の記録には、前記利用者との間でやり取りされる言語ベースの対話情報、および、前記マイクによって撮像された音声または、前記音声から認識された前記音環境の状況に関する履歴情報が含まれる、
請求項1に記載の情報処理装置。
【請求項16】
前記対話の記録には、前記利用者との間でやり取りされる言語ベースの対話情報、および、前記利用者の音声または、前記音声から認識された、前記利用者の前記対話装置に対する評価に関する履歴情報が含まれる、
請求項1に記載の情報処理装置。
【請求項17】
前記対話の記録には、前記対話装置の通信エラーに関する履歴情報が含まれる、
請求項1に記載の情報処理装置。
【請求項18】
コンピュータが、
利用者から提供される情報をもとに回答を生成する対話インターフェースを提供する対話装置が前記利用者との対話において生成する回答に影響を与える制約情報を更新する情報処理方法であって、
前記コンピュータが、
前記対話の記録をもとに改善すべき要改善箇所を抽出し、
前記要改善箇所の改善に役立つ知識情報の入力を受け付け、前記知識情報に基づいて前記制約情報を更新するための更新指示情報を生成し、
前記更新指示情報に基づいて前記制約情報を更新する、
情報処理方法。
【請求項19】
コンピュータに、
利用者から提供される情報をもとに回答を生成する対話インターフェースを提供する対話装置が前記利用者との対話において生成する回答に影響を与える制約情報を更新する更新処理を実行させるためのプログラムであって、
前記更新処理は、
前記対話の記録をもとに改善すべき要改善箇所を抽出する処理と、
前記要改善箇所の改善に役立つ知識情報の入力を受け付け、前記知識情報に基づいて前記制約情報を更新するための更新指示情報を生成する処理と、
前記更新指示情報に基づいて前記制約情報を更新する処理と、
を含む、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、自然言語生成装置、自然言語生成方法、およびプログラムの技術に関する。
【背景技術】
【0002】
従来、大規模言語モデル(Large Language Model, LLM)を用いた対話システムについて研究されている。例えば、特許文献1には、チャットの対話情報を教師データとして機械学習を行うことにより対話モデルを生成し、当該対話モデルによってユーザからの質問に回答するシステムについて記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、対話システムが特定のパターンに適切な回答をできない場合、対話システムの修正に多くの労力が費やされていた。例えば、分析のために失敗事例を収集するのには手間がかる。また、例えば、対話モデルを修正する場合、学習データの収集やモデルの再学習には専門性が求められるので手間がかかる。また、対話システムが使用する外部データソースを修正する場合も専門性が求められ、どのように修正するかの方針の策定にも手間がかかる。このように、従来の技術では、自然言語による対話システムの修正を効率良く実施することができない場合があった。
【0005】
上記事情に鑑み、本発明は、利用者から提供される情報をもとに回答を生成する対話システムの修正をより効率良く実施することを可能にする技術の提供を目的としている。
【課題を解決するための手段】
【0006】
本発明の一態様は、利用者から提供される情報をもとに回答を生成する対話インターフェースを提供する対話装置が前記利用者との対話において生成する回答に影響を与える制約情報を更新する情報処理装置であって、前記対話の記録をもとに改善すべき要改善箇所を抽出する抽出部と、前記要改善箇所の改善に役立つ知識情報の入力を受け付け、前記知識情報に基づいて前記制約情報を更新するための更新指示情報を生成する生成部と、前記更新指示情報に基づいて前記制約情報を更新する更新部と、を備える情報処理装置である。
【0007】
本発明の一態様は、上記の情報処理装置であって、前記抽出部は、抽出した前記要改善箇所を前記対話装置の管理者に提示し、前記生成部は、前記管理者による前記知識情報の入力を受け付けるものである。
【0008】
本発明の一態様は、上記の情報処理装置であって、前記生成部に対して前記知識情報を入力する入力部をさらに備え、前記抽出部は、前記要改善箇所を前記入力部に供給し、前記入力部は、前記抽出部から供給された前記要改善箇所について、改善に役立つ知識情報を外部のデータソースから抽出して前記生成部に入力するものである。
【0009】
本発明の一態様は、上記の情報処理装置であって、前記入力部は、前記利用者の入力に対して回答するように学習された対話モデルを用いて構成されるものである。
【0010】
本発明の一態様は、上記の情報処理装置であって、前記対話装置の管理者との対話のインターフェースを提供する対話部をさらに備え、前記対話部は、前記要改善箇所をもとに前記知識情報として必要な情報を特定して前記管理者に提示し、前記管理者から前記知識情報の入力を受け付け、前記管理者が入力した前記知識情報を前記生成部に入力するものである。
【0011】
本発明の一態様は、上記の情報処理装置であって、前記対話部は、前記利用者の入力に対して回答するように学習された対話モデルを用いて構成されるものである。
【0012】
本発明の一態様は、上記の情報処理装置であって、前記生成部は、生成した更新指示情報について修正に関するフィードバック情報が前記管理者から入力された場合、前記フィードバック情報に基づいて前記更新指示情報を修正するものである。
【0013】
本発明の一態様は、上記の情報処理装置であって、前記生成部は、更新前の制約情報である第1の制約情報と、前記フィードバック情報をもとに修正された更新指示情報によって更新された後の制約情報である第2の制約情報と、の両方を保存しておき、前記対話部が、前記第1の制約情報と、前記第2の制約情報とのそれぞれで同じ対話を実行した場合の出力を、それぞれ比較可能な態様で前記管理者に提示するものである。
【0014】
本発明の一態様は、上記の情報処理装置であって、前記抽出部および前記生成部は、前記利用者の入力に対して回答するように学習された対話モデルを用いて構成されるものである。
【0015】
本発明の一態様は、上記の情報処理装置であって、前記生成部は、入力された前記知識情報に対してフォーマットの整形、または前記制約情報の更新においてキーとなる情報の抽出を行う前処理を施し、前記前処理後の前記知識情報を前記対話モデルに入力するものである。
【0016】
本発明の一態様は、上記の情報処理装置であって、前記抽出部は、前記要改善箇所として抽出された対話について、前記要改善箇所として抽出された原因を、前記制約情報の修正方針に応じたカテゴリに分類して前記管理者に提示するものである。
【0017】
本発明の一態様は、上記の情報処理装置であって、前記対話装置は、前記利用者との間でやり取りされる言語ベースの対話情報と、前記対話情報を補足する視覚情報とによって前記利用者と対話するものであり、前記対話の記録には、前記対話情報および前記視覚情報に関する履歴情報が含まれるものである。
【0018】
本発明の一態様は、上記の情報処理装置であって、前記対話インターフェースは、身体的動作が可能なロボットとして提供され、前記視覚情報に関する履歴情報は、前記ロボットが行った前記身体的動作に関する履歴情報を含むものである。
【0019】
本発明の一態様は、上記の情報処理装置であって、前記対話装置は、前記利用者の表情を読み取るためのカメラを備え、前記対話の記録には、前記対話情報、および、前記カメラによって撮像された画像または、前記画像から認識された前記利用者の表情に関する履歴情報が含まれるものである。
【0020】
本発明の一態様は、上記の情報処理装置であって、前記対話装置は、前記利用者と対話する空間の音環境の状況をセンシングするためのマイクを備え、前記対話の記録には、前記対話情報、および、前記マイクによって撮像された音声または、前記音声から認識された前記音環境の状況に関する履歴情報が含まれるものである。
【0021】
本発明の一態様は、上記の情報処理装置であって、前記対話の記録には、前記対話情報、および、前記利用者の音声または、前記音声から認識された、前記利用者の前記対話装置に対する評価に関する履歴情報が含まれるものである。
【0022】
本発明の一態様は、上記の情報処理装置であって、前記対話の記録には、前記対話装置の通信エラーに関する履歴情報が含まれるものである。
【0023】
本発明の一態様は、コンピュータが、利用者から提供される情報をもとに回答を生成する対話インターフェースを提供する対話装置が前記利用者との対話において生成する回答に影響を与える制約情報を更新する情報処理方法であって、前記コンピュータが、前記対話の記録をもとに改善すべき要改善箇所を抽出し、前記要改善箇所の改善に役立つ知識情報の入力を受け付け、前記知識情報に基づいて前記制約情報を更新するための更新指示情報を生成し、前記更新指示情報に基づいて前記制約情報を更新する、情報処理方法である。
【0024】
本発明の一態様は、コンピュータに、利用者から提供される情報をもとに回答を生成する対話インターフェースを提供する対話装置が前記利用者との対話において生成する回答に影響を与える制約情報を更新する更新処理を実行させるためのプログラムであって、前記更新処理は、前記対話の記録をもとに改善すべき要改善箇所を抽出する処理と、前記要改善箇所の改善に役立つ知識情報の入力を受け付け、前記知識情報に基づいて前記制約情報を更新するための更新指示情報を生成する処理と、前記更新指示情報に基づいて前記制約情報を更新する処理と、を含む、プログラムである。
【発明の効果】
【0025】
本発明により、利用者から提供される情報をもとに回答を生成する対話システムの修正をより効率良く実施することが可能となる。
【図面の簡単な説明】
【0026】
【
図1】実施形態の対話システム1のシステム構成の一例を示す図である。
【
図2】実施形態の対話装置100の構成例を示す図である。
【
図3】実施形態の対話装置100が利用者との対話を通じて対話モデルの制約情報を更新する処理の流れの一例を示す図(その1)である。
【
図4】実施形態の対話装置100が利用者との対話を通じて対話モデルの制約情報を更新する処理の流れの一例を示す図(その2)である。
【
図5】実施形態の対話装置100が利用者との対話を通じて対話モデルの制約情報を更新する処理の流れの一例を示す図(その3)である。
【
図6】実施形態の対話装置100が利用者との対話を通じて対話モデルの制約情報を更新する処理の流れの一例を示す図(その4)である。
【発明を実施するための形態】
【0027】
以下、本発明の実施形態について、図面を参照して詳細に説明する。
【0028】
図1は、実施形態の対話システム1のシステム構成の一例を示す図である。対話システム1は、利用者から自然文の入力を受け付け、当該自然文に対する回答を出力するシステムである。対話システム1は、例えば、対話装置100と、利用者端末装置200と、管理者端末装置300と、を備える。対話装置100と、利用者端末装置200と、管理者端末装置300とは、ネットワークNWを介して互いに通信可能である。ネットワークNWは、無線通信を用いたネットワークであってもよいし、有線通信を用いたネットワークであってもよい。ネットワークNWは、例えばインターネットを用いて構成されてもよいし、ローカルエリアネットワーク(LAN)を用いて構成されてもよい。ネットワークNWは、複数のネットワークが組み合わされて構成されてもよい。
【0029】
利用者端末装置200は、対話システム1の利用者Uが使用する端末装置である。例えば、利用者端末装置200は、スマートフォンやタブレット、パーソナルコンピュータなどの端末装置であってよい。利用者端末装置200では、利用者向けインターフェースが動作する。利用者Uは、利用者向けインターフェースを操作することにより、対話装置100に対して任意の自然文を入力するとともに、当該自然文に対する回答を対話装置100から取得することができる。利用者向けインターフェースは、専用のアプリケーションプログラムであってもよいし、ウェブブラウザを介して提供されるウェブアプリケーションであってもよい。
【0030】
管理者端末装置300は、対話システム1の管理者Mが使用する端末装置である。例えば、管理者端末装置300は、スマートフォンやタブレット、パーソナルコンピュータなどの端末装置であってよい。利用者端末装置300では、管理者向けインターフェースが動作する。管理者Mは、管理者向けインターフェースを操作することにより、対話装置100との間で情報を送受信することができる。管理者向けインターフェースは、専用のアプリケーションプログラムであってもよいし、ウェブブラウザを介して提供されるウェブアプリケーションであってもよい。
【0031】
図2は、実施形態の対話装置100の構成例を示す図である。対話装置100は、例えば、通信部110と、記憶部120と、制御部130とを備える。制御部130は、例えばCPU(Central Processing Unit)等のプロセッサーとメモリーとを用いて構成される。制御部130は、プロセッサーがプログラムを実行することによって、対話部131、要改善箇所抽出部132、更新指示生成部133、および更新実行部134として機能する。なお、制御部130の機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されても良い。上記のプログラムは、コンピュータ読み取り可能な記録媒体に記録されても良い。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM、半導体記憶装置(例えばSSD:Solid State Drive)等の可搬媒体、コンピュータシステムに内蔵されるハードディスクや半導体記憶装置等の記憶装置である。上記のプログラムは、電気通信回線を介して送信されてもよい。
【0032】
通信部110は、対話装置100をネットワークNWに接続する通信装置である。通信部110は、例えばネットワークインターフェースである。ネットワークインターフェースは、無線通信を行う装置であってもよいし、有線通信を行う装置であってもよい。
【0033】
記憶部120は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。記憶部120は、例えば、対話ログ121と、更新パッチ122と、代替ファイル123とを記憶する。対話ログ121、更新パッチ122、および代替ファイル123の詳細については後述する。
【0034】
制御部130は、利用者が利用者端末装置200に入力した自然文の情報を利用者端末装置200から取得するとともに、当該自然文に対する回答を生成して利用者端末装置200に返信する。より具体的には、制御部130は、対話部131と、要改善箇所抽出部132と、更新指示生成部133と、更新実行部134とを備える。
【0035】
対話部131は、利用者端末装置200から供給された自然文に対する回答を生成して利用者端末装置200に送信する対話処理を実行する。例えば、対話部131は、入力された自然文に対して回答するように学習された大規模言語モデル(LLM:Large Language Model)により構成され得る。例えば、LLMには、GhatGPT(登録商標)やClaude(登録商標)、Gemini(登録商標)などが用いられてもよい。この場合、対話部131は、供給された自然文をLLMに入力することで、その出力として当該自然文に対する回答を取得することができる。
【0036】
より具体的には、対話部131のLLMには、特定のポリシーやルール、ナレッジ等による制約情報によってLLMの出力を制御するプロンプトエンジニアリング(例えば「Policy Prompt」と呼ばれる技術がある)が適用される。また、本実施形態では、制約情報は、外部データソースに格納される場合を想定する。なお、LLMが外部データソースを参照できるようにする技術には、例えば「RAG(Retrieval-Augmented Generation)」と呼ばれるものがある。本実施形態の対話装置100では、このように、制約情報を外部データソースに格納し、LLMに参照させるようにする。これにより、本実施形態の対話装置100は、外部データソースに格納された制約情報を変更することにより、LLMを再学習することなくチューニングすることが可能となるものである。
【0037】
上記のほか、対話部131は、対話処理に関する情報を後から参照できるように対話ログ121として記憶部120に保存する。例えば、対話ログ121には、利用者端末装置200から入力された自然文や、対話部131が当該自然文に対して回答した内容が含まれる。さらに、対話ログ121には、入力された自然文に対して回答を生成する過程で行われたデータ処理の履歴や、外部データソース40の参照履歴等も含まれてよい。
【0038】
要改善箇所抽出部132は、対話ログ121に記録されている対話の内容から改善すべき箇所(要改善箇所)を抽出する。要改善箇所は、利用者との間で行われた対話のケース群のうち、対話に失敗したケース(失敗ケース)ということができる。例えば、要改善箇所抽出部132は、LLMにより構成され得る。この場合、例えば、要改善箇所抽出部132は、対話ログ121と、対話ログ121の内容から要改善箇所を抽出することを指示する自然文とをLLMに入力することにより、その出力として当該対話の要改善箇所を取得することができる。
【0039】
例えば、要改善箇所抽出部132は、対話ログ121をLLMに入力し、「入力した対話ログから、場所の案内に失敗したケースを抽出してください。」といった指示をLLMに入力する。例えば、「トイレはどこですか?」という問いに対して「本館2階の南端です。」と回答したやり取りが対話ログに記録されている場合、「どこ?」という問いに対して場所が回答されていることから、LLMは適切な対話が行われたと判定することが想定される。一方で、同じ問いに対して「振り返ったら見えていますよ。」と回答したやり取りが対話ログに記録されている場合、「どこ?」という問いに対して場所が回答されていないので、LLMは適切な対話が行われていないと判定する可能性がある。このように、LLMは、コンテキスト依存の対話について、適切な対話であるにもかかわらず、改善が必要であるとご認識する場合が想定される。
【0040】
このようなケースを想定して、要改善箇所抽出部132は、以下のようなルールベースの方法で要改善箇所を判定するように構成されてもよい。
(1)対話時間が長すぎる(閾値時間以上である)ケースを、失敗ケースとして抽出する。
(2)利用者Uが同じ趣旨の質問を繰り返しているケースを、失敗ケースとして抽出する。
(3)対話が途中で打ち切られたケース(例えば、「ありがとう」や「またね」といった対話終了を示唆する文言が無いケース)を、失敗ケースとして抽出する。
要改善箇所抽出部132は、上記のようなルールベースで失敗ケースを抽出することをLLMに指示することで要改善箇所を抽出してもよい。
【0041】
また、要改善箇所抽出部132は、対話に関する内部処理の失敗を検知した場合に、そのときに行われていた対話を失敗ケースとして抽出するように構成されてもよい。例えば、対話システム1が、ChatGPT(登録商標)の「Function Calling」機能のように、LLMが外部機能を呼び出して実行できるようにする機能を有している場合、対話ログ121に加えて、外部機能との通信ログを保存するように対話部131を構成する。この場合、要改善箇所抽出部132は、当該通信ログをもとに外部機能の呼び出しの成否を判定し、外部機能の呼び出しに失敗していた(リクエストエラーが発生していた)ときの対話を失敗ケースとして抽出するように構成されてもよい。
【0042】
これらの方法のほか、要改善箇所抽出部132は、機械学習により、個々の対話の対話ログを入力として、当該対話の成否を出力するように訓練された学習済みモデルに、判定対象とする対話の対話ログを入力することにより、当該対話が失敗ケースであるか否かを判定するように構成されてもよい。
【0043】
更新指示生成部133は、外部データソースに格納されている制約情報を更新するための指示(更新指示)を生成する。より具体的には、更新指示生成部133は、要改善箇所抽出部132によって抽出された対話の要改善箇所について、LLMがどのように改善したら良いかを判断するための材料となる知識の情報(知識情報)の入力を受け付け、その知識情報をもとに更新指示を生成する。
【0044】
例えば、更新指示生成部133は、更新後の制約情報を記載した代替ファイル123と、外部データソースに格納されている制約情報を代替ファイルに記載された内容に更新するためのプログラムである更新パッチ122とを更新指示として生成する。例えば、「構内のトイレの場所」を適切に案内することができなった対話シーンが要改善箇所として抽出された場合、「トイレは本館2階の南端にあります。この知識を外部データソースに追加するための更新パッチおよび代替ファイルを生成してください。」といった内容のテキスト情報が更新指示生成部133に入力される。この場合、例えば、更新指示生成部133は、当該テキスト情報をもとに、追加すべき知識の内容を認識するとともに、当該知識を含む代替ファイル123と、当該代替ファイル123の知識を外部データソースに追加する更新パッチ122を生成する。更新指示生成部133は、このように生成した代替ファイル123および更新パッチ122を記憶部120に保存する。
【0045】
更新実行部134は、更新指示生成部133によって生成された更新指示をもとに外部データソースに格納されている制約情報を更新する。例えば、更新実行部134は、更新パッチ122を実行することによって制約情報を代替ファイル123に記載された内容に更新する。
【0046】
[第1実施例]
図3は、実施形態の対話装置100が利用者との対話を通じて対話モデル(LLM)の制約情報を更新する処理の流れの一例を示す図(その1)である。
図3において、S101~S105は利用者Uと対話装置100とが対話するフェーズ(以下「対話フェーズ」という。)を表し、S201~S206は対話フェーズで行われた対話の内容をもとに、外部データソース400に格納されている制約情報を修正して対話機能を改善するフェーズ(以下「改善フェーズ」という。)を表す。
【0047】
[対話フェーズ]
対話フェーズでは、まず、利用者Uが利用者端末装置200を介して対話装置100に自然文を入力する(S101)。対話装置100では、対話部131が外部データソース400に格納されている制約情報(ポリシー41およびナレッジ42)をもとにS101で入力された自然文に対する回答を生成する(S102)。対話部131は、S102で生成した回答を利用者Uに提示する(S104)。一方で、対話部131は、S102の対話処理に関する情報を対話ログ121に記録する(S105)。S101~S105は繰り返し実行されてもよい。
【0048】
[改善フェーズ]
続いて、改善フェーズでは、まず、要改善箇所抽出部132が、対話ログ121を参照し、対話フェーズで行われた対話の中から改善が必要と思われる箇所(要改善箇所)を抽出する(S201)。要改善箇所抽出部132は、抽出された要改善箇所の一覧(対話リスト)を管理者Mに提示する(S202)。例えば、要改善箇所抽出部132は、対話リストを管理者端末装置300に送信して表示させる。管理者Mは、S202で提示された対話リストの内容を確認し、リストアップされた対話の改善に必要な知識情報を対話装置100に入力する(S203)。なお、要改善箇所抽出部132は、要改善箇所の対話について、適切な回答をするために不足している知識情報(不足知識情報)を判断し、その不足知識情報を対話リストに含めてもよい。
【0049】
続いて、対話装置100では、更新指示生成部133が、S203で入力された知識情報を制約情報に反映させるための更新指示情報INS(更新パッチ122および代替ファイル123を含む)を生成する(S204A)。更新指示情報INSは、管理者Mが入力した知識情報をポリシー41に反映するものであってもよいし、ナレッジ42に反映するものであってもよいし、ポリシー41およびナレッジ42の両方に反映するものであってもよい。制約情報をどのような情報に更新するかは、更新指示生成部133の判断により、管理者Mが入力した知識情報に応じて適宜決定される。
【0050】
なお、更新指示生成部133は、更新指示情報INSを生成する際、必要に応じて現在の制約情報を参照するように構成されてもよい(S204B)。例えば、更新指示生成部133は、現在の制約情報と、管理者Mによって入力された新たな知識情報とを考慮して、現在の制約情報に追加すべき情報を代替ファイル123として生成してもよいし、現在の制約情報に新たな知識情報を追加したものを代替ファイル123として生成してもよい。
【0051】
続いて、更新実行部134が、S204Aで生成された更新指示情報INSをもとに外部データソース40に格納されている制約情報を更新する。例えば、本実施形態では、更新実行部134は、更新パッチ122を実行することにより(S205)、代替ファイル123の内容を制約情報に反映させる(S206)。
【0052】
制約情報の更新が完了すると、対話部131は更新後の制約情報に基づいて利用者Uと対話することが可能となる。制約情報の更新後の対話では、直前の改善フェーズで認識された要改善箇所を改善するためのナレッジ42やポリシー41が制約情報として蓄積されているので、現在の対話フェーズにおいて、対話部131は、上記要改善箇所に関する話題について、改善前の対話フェーズよりも、より好ましい対話を行うことが期待される。このような対話フェーズと改善フェーズを繰り返すことにより、対話システム1は、利用者Uとの会話をより円滑に行うことができるように更新されていく。
【0053】
[第2実施例]
図4は、実施形態の対話装置100が利用者との対話を通じて対話モデル(LLM)の制約情報を更新する処理の流れの一例を示す図(その2)である。
図4の流れは、管理者Mが更新指示生成部133に対して要改善箇所に関する知識情報を入力する構成に代えて、対話装置100が当該知識情報を入力する点で
図3の場合と異なる。すなわち、この場合、対話装置100の制御部130は、
図2の構成に加えて、知識情報入力部135を備えるものである。知識情報入力部135は、LLMにより構成され得る。
図4において、
図3と同じ処理の流れについては
図3と同じ符号を付すこととし、これにより、
図3と同じ処理の流れについての説明を省略する。
【0054】
知識情報入力部135は、S202において要改善箇所抽出部132によって抽出された要改善箇所の一覧(対話リスト)を入力し、この対話リストをもとに要改善箇所の改善に役立つ知識情報を第2外部データソース50から取得する(S203A)。知識情報入力部135は、S203Aで取得した知識情報を更新指示生成部133に入力する(S203B)。ここで、第2外部データソース50は、知識情報入力部135からアクセス可能なデータソースであって、要改善箇所の改善に役立つ情報を有するものであれば、どのようなデータソースであってもよい。例えば、第2外部データソース50は、インターネットである。この場合、知識情報入力部135は、要改善箇所の改善に役立つ情報を例えばインターネット上の検索サイトで検索することによって知識情報を取得してもよい。
【0055】
例えば、知識情報入力部135は、失敗ケースの対話ログ121をLLMに入力し、「対話が失敗した原因となる知識(またはルール)の不足を抽出してください。」といった指示をLLMに入力することにより、当該失敗ケースの対話を改善するために必要な知識(またはルール)を認識することができる。また、例えば、知識情報入力部135は、失敗ケースの対話ログ121から頻出ワードを抽出し、抽出された頻出ワードを改善に必要な知識(またはルール)として認識するように構成されてもよい。この場合、頻出ワードの抽出は、ルールベースの処理によって実現されてもよいし、LLMに頻出ワードの抽出を指示することによって実現されてもよい。
【0056】
このように、
図4の例では、知識情報の入力を管理者が行う必要がないので、システム運用に係るコストを削減することができる。
【0057】
[第3実施例]
図5は、実施形態の対話装置100が利用者との対話を通じて対話モデル(LLM)の制約情報を更新する処理の流れの一例を示す図(その3)である。
図5の流れは、更新指示生成部221に対して管理者Mが直接的に知識情報を入力する構成に代えて、管理者Mが第2対話部136を介して更新指示生成部133に知識情報を入力する点で
図3の場合と異なる。すなわち、この場合、対話装置100の制御部130は、
図2の構成に加えて、第2対話部136を備えるものである。例えば、第2対話部136は、LLMにより構成され得る。
【0058】
この場合、例えば、第2対話部136は、対話リストを入力し、この対話リストをもとに要改善箇所の改善に役立つ知識情報を、管理者Mとの対話によって取得する。例えば、第2対話部136は、対話リストにリストアップされている要改善箇所を管理者Mに提示し(S203C)、提示した要改善箇所の改善に役立つ知識情報の入力を管理者Mに要求する。この要求に対して、管理者Mは、提示された要改善箇所について、改善に役立つ知識情報を第2対話部136に回答(入力)する。なお、管理者Mが第2対話部136に入力する知識情報は、管理者M自身がもともと知っていた知識であってもよいし、S203Cの要求を受けて調査を行った結果知り得た知識であってもよい。
【0059】
また、例えば、第2対話部136は、要改善箇所の対話について、適切な回答をするために不足している知識情報(不足知識情報)を判断し、その不足知識情報の入力を管理者Mに要求するように構成されてもよい。また、この際、第2対話部136は、外部データソース40に格納されている制約情報と対話リストの内容をもとに、不足知識情報を判断するように構成されてもよい。また、第2対話部136と管理者Mとの間のインターフェースは、テキストベースのチャット形式であってもよいし、マイクやインカム等を用いた音声ベースのインターフェースとして構成されてもよい。
【0060】
このように構成された第2対話部136によれば、例えば、管理者Mは、以下の(1)~(3)のようなやり取り(対話)を行うことにより、第2対話部136に対して要改善箇所の改善に役立つ知識情報を入力することができる。
(1)第2対話部136:「2階のトイレにおむつ交換台があるのか不明だよ。」
(2)管理者M:「2階(のトイレ)には(おむつ交換台は)ないよ。でも、1階のトイレには(おむつ交換台が)あるよ」
(3)第2対話部136:「ありがとう。その内容でナレッジを更新しておくね。」
【0061】
[第4実施例]
図6は、実施形態の対話装置100が利用者との対話を通じて対話モデル(LLM)の制約情報を更新する処理の流れの一例を示す図(その4)である。
図3では、更新指示生成部133によって更新指示情報INSが生成されると、更新実行部134が、生成された更新指示情報INSをもとに制約情報を更新する流れであったのに対し、
図6の流れは、生成された更新指示情報INSを管理者Mが確認した上で更新の実行を判断した場合に、制約情報の更新が行われる点で
図3の場合と異なる。
【0062】
この場合、更新実行部134は、S204Aで更新指示情報INSが生成されても、即座には制約情報の更新は行わず、更新指示生成部133からの更新実行指示を待機する。一方、管理者Mは、S204Aで生成された更新指示情報INSを対話装置100から取得し、その内容の妥当性確認を行う(S204C)。ここで、管理者Mが更新指示情報INSについて修正すべき点があると判断した場合、その修正指示を更新指示生成部133に入力する(S204D)。例えば、修正指示には、更新指示生成部133に、修正すべき点と、どのような観点で修正すべきかを認識させるためのフィードバック情報が含まれる。更新指示生成部133は、S204Dにおいて修正指示が入力されると、そのフィードバック情報をもとに修正すべき内容を認識し、更新指示情報INSに反映する(S204E)。S204C~S204Eは、管理者Mが更新指示情報INSの妥当性を確認することができるまで繰り返される。このように、フィードバック情報の入力と、更新指示情報INSの修正とが繰り返し実行されることにより、目的の出力が得られる可能性を高めることができる。
【0063】
なお、更新指示情報INSの修正は、すでに生成されている更新指示情報INSを編集することによって実現されてもよい。また、例えば、更新指示生成部133は、フィードバック情報に基づいて更新指示情報INSを出力する処理のパラメータを変更して更新指示情報INSを再出力実行することにより、更新指示情報INSを修正してもよい。なお、更新指示生成部133は、妥当性確認の対象となった更新指示情報INSとフィードバック情報の内容をもとに更新指示情報INSの再出力を行うか否かを判定してもよい。また、更新指示生成部133は、このような出力(更新指示情報INS)とフィードバック情報をもとにした追加学習が行われてもよい。これにより、更新指示生成部133の推論の精度を高めることができる。
【0064】
一般に、人間によるフィードバックによって学習済みモデルに追加学習を行う手法は強化学習(RLHF:Reinforcement Learning from Human Feedback)と呼ばれる。RLHFでは、人間が学習済みモデルの出力に対してOK(ポジティブフィードバック)やNG(ネガティブフィードバック)を与え、そのフィードバック情報をもとに学習済みモデルを更新する。これにより、学習済みモデルの出力をより人間の意図や期待に沿ったものとなるように調整することができる。
【0065】
これに対して、第4実施例は、フィードバック情報を同じセッション情報(例えばプロンプト履歴やセッションメモリ、メタデータなど)として蓄積していき、蓄積されたフィードバック情報をもとに出力を逐次的に最適化していくものである。すなわち、第4実施例では、フィードバック情報をもとにLLMの再学習(例えば重みパラメータを更新)を行う必要がない。そのため、第4実施例によれば、より精度の高い更新指示情報INSを効率良く生成することができる。
【0066】
一方、S204Cにおいて、管理者Mが更新指示情報INSの妥当性を確認した場合、管理者Mは、更新指示生成部133に対して、制約情報の更新実行を指示する(S204F)。更新指示生成部133は、S204Fの更新実行指示を受けると、更新実行部134に対して制約情報の更新実行を指示する(S204G)。そして、更新実行部134が、S204Gの更新実行指示を受けると、生成されている更新指示情報INSをもとに、外部データソース40に格納されている制約情報を更新する(S205)。
【0067】
なお、S204Aで生成された更新指示情報INSに修正すべき点がない場合、管理者Mは、S204Dの修正指示を入力することなく、S204Fの更新実行指示を入力してもよい。この場合、S204DおよびS204Eは省略されるとともに、更新実行部134がS204Aで生成された更新指示情報INSをもとに制約情報の更新を行う。
【0068】
以上説明した実施形態の対話システム1によれば、自然言語による対話システムの修正をより効率良く実施することが可能となる。
【0069】
<変形例>
上記の実施形態では、対話部131、要改善箇所抽出部132、更新指示生成部133、更新実行部134、知識情報入力部135、および第2対話部136が対話装置100に備えられる場合について説明したが、これらの機能部のうち、対話部131以外の機能部の一部または全部は対話装置100とは別体に構成されてもよい。例えば、対話装置100は対話部131を備え、要改善箇所抽出部132、更新指示生成部133、更新実行部134、知識情報入力部135、および第2対話部136を備える別体の情報処理装置と通信可能に接続されてもよい。
【0070】
上記の実施形態では、対話装置100の対話部131が、主として自然言語による対話インターフェースを提供する場合について説明したが、対話部131は、自然言語以外の情報も認識可能な、いわゆるマルチモーダルな対話インターフェースを提供するように構成されてもよい。例えば、対話部131は、テキスト、画像、音声などを直接またはファイル経由で入力し、それらの入力に対する回答を示す音声や画像などを出力するように構成されてもよい。
【0071】
上記の実施形態では、制約情報によって対話部131の出力を制御する場合について説明したが、このような制約情報による出力の制御は、対話部131以外の機能部に適用されてもよい。例えば、対話部131と同様にLLMを用いて構成され得る要改善箇所抽出部132、更新指示生成部133、知識情報入力部135、または第2対話部136について、それぞれに専用の制約情報を適用して出力を制御するようにしてもよい。このように、専用の制約情報を適用して出力を制御する(例えば出力フォーマットやNGルール、ファイル拡張子などを規定する)ことで、無駄な情報が入出力されるのを抑制し、目的の出力を得やすくすることができるので、改善フェーズの性能を向上させることができる。
【0072】
[更新指示生成部]
(1)知識情報の前処理
更新指示生成部133は、更新指示情報INSの精度を高めるために、LLMに対して前処理の実行を指示するように構成されてもよい。例えば、更新指示生成部133は、知識情報として入力されたデータについてフォーマットの整形を行うことをLLMに指示してもよい。また、例えば、更新指示生成部133は、テキスト形式の知識情報が入力された場合、テキストデータからキーとなる情報を抽出することを指示してもよい。例えば、更新指示生成部133は、入力されたテキストデータについて「追加すべき知識についてキー(Key)とバリュー(Value)を整理して抽出してください。」という指示をLLMに対して入力してもよい。これにより、例えば、「トイレは本館2階の南端にあります。」という知識情報が入力された場合、「Info_Type=Location, Name=“トイレ”, value=“本館2階の南端”」といった形に知識情報を変換することができる。このような前処理により、LLMが扱いやすい態様に知識情報を予め変換しておくことで、LLMによる推論の精度を向上させることができる。
【0073】
(2)フィードバック情報の入力支援機能
第4実施例では、更新指示生成部133が生成した更新指示情報INSに対して管理者Mがフィードバック情報を入力する構成について説明したが、更新指示情報INSの妥当性判断には管理者Mに或る程度の専門性が必要になるケースも想定される。そこで、管理者Mが更新指示情報INSの妥当性判断をより容易に行えるようにするため、対話装置100は、管理者Mによりフィードバック情報が入力された場合、それによってどのように対話の内容が変化するかの一例を管理者Mに提示するように構成されてもよい。
【0074】
この場合、例えば、更新指示生成部133は、更新前の制約情報と、入力されたフィードバック情報をもとに修正された更新指示情報INSによって更新された後の制約情報との両方を保存しておき、両者で同じ対話を実行した場合の出力を、それぞれ比較可能な態様で管理者Mに提示するように構成されてもよい。例えば、同じ対話は、対話ログ121から抽出された失敗パターンであってよい。このように構成された更新指示生成部133によれば、更新前後のそれぞれの制約情報による対話の内容が管理者Mに提示されるので、管理者Mは、更新指示情報INSについての専門性を有しない場合であっても、更新前後での対話の内容の変化からフィードバック情報の妥当性を確認することが可能となる。
【0075】
[要改善箇所抽出部]
(1)対話に失敗した原因の分類
要改善箇所抽出部132は、上記の機能に加えて、失敗ケースの原因を分類する機能を有するように構成されてもよい。例えば、要改善箇所抽出部132は、失敗ケースの対話ログ121をLLMに入力し、当該失敗ケースの対話が失敗した原因の分類をLLMに指示するように構成されてもよい。また、例えば、要改善箇所抽出部132は、機械学習により、失敗ケースの対話ログ121を入力として、当該失敗ケースの対話が失敗した原因の分類結果を出力するように訓練された学習済みモデルに、処理対象とする失敗ケースの対話ログ121を入力することにより、当該失敗ケースの対話が失敗した原因の分類結果(原因種別)を取得するように構成されてもよい。
【0076】
このように構成された要改善箇所抽出部132によれば、失敗ケースの対話を改善する際に修正すべき制約情報の種類を認識することができるので、より正確に制約情報を修正することが可能となり、要改善箇所の改善精度を向上させることができる。例えば、原因種別が回答方針の誤りである場合には、修正対象がポリシー41であることを更新指示生成部133に通知することで改善精度の向上が期待できる。また、例えば、原因種別が知識不足や推論の誤りである場合には、修正対象がナレッジ42であることを更新指示生成部133に通知することで改善精度の向上が期待できる。また、例えば、原因種別が通信エラーや音声認識の誤りである場合には、制約情報の修正が不要であることを更新指示生成部133に通知することで、不要な修正によって対話部131の対話の精度が低下することを抑制することができる。
【0077】
(2)評価レポートの出力
要改善箇所抽出部132は、上記の機能に加えて、抽出した失敗ケースに関する情報をもとに、対話部131の性能に関する評価レポートを生成する機能を有するように構成されてもよい。例えば、評価レポートは、抽出した失敗ケースの個数、抽出した失敗ケースが対話ケース全体に占める割合、失敗ケースの具体例、原因種別などを一覧表示するものであってよい。要改善箇所抽出部132は、ルールベースまたはLLMによって評価レポートのフォーマットを整形するように構成されてもよいし、評価レポートに含める情報をLLMによって要約するように構成されてもよい。このように構成された要改善箇所抽出部132によれば、対話システム1や対話モデル(LLM)の性能測定を行ったり、測定結果をもとに顧客満足度の妥当性を評価したりすることが可能となる。
【0078】
[対話部]
対話部131は、言語ベースの対話情報(音声やチャットなど)の入出力に加えて、対話情報を補足する視覚情報を出力するように構成されてもよい。この場合、対話装置100は、視覚情報を出力するための表示装置を備えていてもよい。例えば、視覚情報は、地図の態様で表示されてもよい。例えば、利用者Uが「トイレはどこ?」という質問を対話部131に入力した場合、対話部131は、「こちらをご覧ください」という言語ベースの回答とともに、現在地から最寄りのトイレまでの経路を示す地図を表示部に表示させてもよい。このように、対話部131が対話情報とともに視覚情報を提供することにより、対話装置100は、利用者Uに対する情報伝達の精度を高めることができる。
【0079】
上記実施形態では、利用者Uが利用者端末装置200に音声を入力し、対話装置100がその音声データを利用者端末装置200から取得する態様について説明したが、対話部131が音声入力用のマイクを有してもよく、その場合、利用者端末装置200は省略されてもよい。例えば、対話部131は、人型や動物型などの身体性を備えたロボットとして構成されてもよい。この場合、ロボットは、対話装置100の本体側と通信するための通信インターフェースのほか、マイクやスピーカ、タッチパネル等の入出力装置を備えてもよい。また、この場合、ロボットは、そのような入出力装置のほか、身体の動作によって情報を伝達するように構成されてもよい。例えば、ロボットは、利用者Uとの対話において目的の場所を聞かれた場合に、腕を動かして目的の場所がある方向を指し示すような動作を行うように構成されてもよい。このような動作も利用者Uの視覚によって認知されるという意味では視覚情報の一種ということができる。
【0080】
なお、視覚情報の補足により対話情報の態様が変化し、対話情報のログのみでは、対話の成否の判断が難しくなるケースが想定される。例えば、上記の例で「こちらをご覧ください」という回答がなされた場合、テキストベースでは、そのときの視覚情報がどのようなものであったかが分からないので、対話が成功したのか否かの判断が困難である。そこで、対話情報に視覚情報を補足する場合、対話部131は、実施された対話の内容とともに、その対話が行われたときに表示された視覚情報を対応づけて対話ログ121に記録するように構成されてもよい。その際、対話部131は、視覚情報の画像そのものを対話ログ121に記録してもよいし、視覚情報の内容を要約したテキスト情報を対話ログ121に記録してもよいし、視覚情報を特徴量に変換して対話ログ121に記録してもよい。これにより、後段の要改善箇所抽出部132は、対話情報と視覚情報の両方の情報をもとに要改善箇所を抽出することが可能となる。
【0081】
[対話ログの拡張]
(1)画像データによる拡張
対話ログ121の内容から、利用者Uが対話装置100に対して「ありがとう」と発言したことがテキストベースで確認された場合であっても、実際には対話装置100との対話に必ずしも満足していない場合も想定される。このような場合、対話システム1は、対話時の利用者Uの表情を撮像するためのカメラを備え、当該カメラによって撮像された画像のデータを対話ログ121とともに要改善箇所抽出部132に入力するように構成されてもよい。この場合、要改善箇所抽出部132は、入力された画像から利用者Uの表情を読み取り、読み取った表情と対話ログ121の内容をもとに対話の失敗ケースを抽出するように構成されてもよい。画像から人の表情を読み取る方法は、既存の任意の技術を用いて実現されてよい。この場合、要改善箇所抽出部132は、画像データから利用者Uの表情を検出する処理を実行し、その検出結果を画像データそのものに代えてLLMに入力するように構成されてもよい。また、LLMがマルチモーダルに対応している場合、要改善箇所抽出部132は、画像データそのものをLLMに入力してもよい。
【0082】
(2)音声データによる拡張
また、対話システム1は、利用者Uが発した音声を入力するためのマイクを備え、当該マイクによって録音された音声のデータを対話ログ121とともに要改善箇所抽出部132に入力するように構成されてもよい。この場合、要改善箇所抽出部132は、入力された音声から利用者Uの対話装置100に対する満足度を読み取り、読み取った満足度と対話ログ121の内容をもとに対話の失敗ケースを抽出するように構成されてもよい。例えば、要改善箇所抽出部132は、音声に関する特徴のうち、声色や話し方、抑揚、速度など、利用者Uの思考や感情によって影響され得る特徴に関する特徴量を音声データから抽出し、抽出した特徴量またはそれらに基づいて取得される指標値を閾値と比較したり分類したりすることにより、対話装置100との対話に対する利用者Uの評価(満足または不満足など)を推定することができる。この場合、要改善箇所抽出部132は、推定された評価結果を音声データそのものに代えてLLMに入力するように構成されてもよい。また、LLMがマルチモーダルに対応している場合、要改善箇所抽出部132は、音声データそのものをLLMに入力してもよい。
【0083】
なお、利用者端末装置200が個々の利用者によって所持されるものである場合、上述のカメラやマイクは利用者端末装置200に搭載されたものが使用されてもよい。また、利用者端末装置200が不特定多数の利用者によって共用されるもの(例えば案内用端末など)である場合、利用者端末装置200の周辺を撮像するカメラや、利用者端末装置200の周辺の音声を入力するマイクが別途備え付けらえてもよい。このような構成によれば、テキストベースの対話ログ121を、対話時の利用者Uの音声や画像等の非言語情報によって拡張することができるので、要改善箇所抽出部132は、要改善箇所の抽出において、失敗ケースか否かをより適切に判断することが可能となる。
【0084】
(3)音環境情報による拡張
雑音が多いなど対話空間の音環境が悪い状況では、利用者は音声を聞き取りにくく、対話システム1も利用者の音声を認識する精度が低くなり、これが対話失敗の原因となるケースがある。そこで、対話装置100は、対話ログ121とともに、対話空間における対話時の音環境の状況を示す時系列情報(音環境情報)を要改善箇所抽出部132に入力するように構成されてもよい。この場合、対話システム1は、対話空間の音環境をセンシングするためのマイク(以下「環境マイク」という。)を、利用者との対話用に使用するマイクとは別に備えてもよい。この場合、対話システム1は、環境マイクから入力した音声データをもとに音環境情報を生成して保存しておく。また、この場合、要改善箇所抽出部132は、音環境情報をもとに対話時の音環境の状況を認識し、その認識結果と対話ログ121の内容をもとに対話の失敗ケースを抽出するように構成されてもよい。このような構成によれば、テキストベースの対話ログ121を、対話空間の音環境情報によって拡張することができるので、要改善箇所抽出部132は、要改善箇所の抽出において、失敗ケースか否かをより適切に判断することが可能となる。
【0085】
(4)動作制御情報による拡張
上述のとおり、対話部131は、身体的動作を行うことができるロボットなどの態様で構成されてもよい。この場合、ロボットが身体的動作によって提示した視覚情報も、上述の画像表示によって提示され得る視覚情報とともに、対話ログ121を拡張する情報として利用することができる。例えば、ロボットが利用者Uから尋ねられた場所を腕の向きによって指し示す動作を行った場合、対話装置100は、そのような動作の制御情報を対話ログ121とともに保存しておく。この場合、要改善箇所抽出部132は、当該制御情報をもとに対話時のロボットの動作を認識し、その認識結果と対話ログ121の内容をもとに対話の失敗ケースを抽出するように構成されてもよい。このような構成によれば、テキストベースの対話ログ121を、対話部131が行った動作(出力)に関する情報によって拡張することができるので、要改善箇所抽出部132は、要改善箇所の抽出において、失敗ケースか否かをより適切に判断することが可能となる。
【0086】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【産業上の利用可能性】
【0087】
本発明は、制約情報に基づいて人との対話インターフェースを提供するシステムに適用可能である。
【符号の説明】
【0088】
1 対話システム
40 外部データソース
41 ポリシー
42 ナレッジ
50 第2外部データソース
100 対話装置
110 通信部
120 記憶部
121 対話ログ
122 更新パッチ
123 代替ファイル
130 制御部
131 対話部
132 要改善箇所抽出部
133 更新指示生成部
134 更新実行部
135 知識情報入力部
136 第2対話部
200 利用者端末装置
221 更新指示生成部
300 管理者端末装置
300 利用者端末装置
400 外部データソース
【要約】
【課題】利用者から提供される情報をもとに回答を生成する対話システムの修正をより効率良く実施することを可能にする技術を提供すること。
【解決手段】利用者から提供される情報をもとに回答を生成する対話インターフェースを提供する対話装置が前記利用者との対話において生成する回答に影響を与える制約情報を更新する情報処理装置であって、前記対話の記録をもとに改善すべき要改善箇所を抽出する抽出部と、前記要改善箇所の改善に役立つ知識情報の入力を受け付け、前記知識情報に基づいて前記制約情報を更新するための更新指示情報を生成する生成部と、前記更新指示情報に基づいて前記制約情報を更新する更新部と、を備える情報処理装置。
【選択図】
図2