2023-176054 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

2023-176054対話管理装置、対話管理方法及び対話管理システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023176054

(43)【公開日】2023-12-13

(54)【発明の名称】対話管理装置、対話管理方法及び対話管理システム

(51)【国際特許分類】

G06F 16/90 20190101AFI20231206BHJP

【ＦＩ】

G06F16/90 100

【審査請求】未請求

【請求項の数】12

【出願形態】ＯＬ

(21)【出願番号】P 2022088123

(22)【出願日】2022-05-31

(71)【出願人】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110000062

【氏名又は名称】弁理士法人第一国際特許事務所

(72)【発明者】

【氏名】アマリアイスティクラリアディバ

(72)【発明者】

【氏名】本間健

【テーマコード（参考）】

5B175

【Ｆターム（参考）】

5B175EA01

(57)【要約】（修正有）

【課題】自然言語の会話に基づいて生成した参照文章を用いてＭＲＣモデルを訓練することで様々な質問に対応し、柔軟性及びロバスト性が高い対話管理手段を提供する。
【解決手段】ユーザと対話を行うクライアント端末と、対話管理装置とが、通信ネットワーク３３０を介して互いに接続される対話管理システム３００において、対話管理装置は、第１のドメインに対応する第１の質問に対する第１の回答を、第１のドメインに対応する第１の参照文章に基づいて生成する回答生成部と、第２のドメインに対応する質問及び回答を含む第２の対話データに基づいて、質問及び回答の内容を含む第２の参照文章を生成する文章生成部と、第２の対話データと、第２のドメインに対応する第２の質問に対する正しい回答を示す第２の回答ラベルと、第２の参照文章とを用いて、第２のドメインに対応する質問に対して適切な回答を生成するように回答生成部を訓練する適応部と、を含む。
【選択図】図３

【特許請求の範囲】

【請求項1】

対話管理装置であって、
第１の質問を受信し、前記第１の質問に対する第１の回答を、第１の参照文章に基づいて生成する回答生成部と、
質問及び回答を含む対話データに基づいて、前記質問及び回答の内容を含む第２の参照文章を生成する文章生成部と、
前記対話データと、第２の質問に対する正しい回答を示す第２の回答ラベルと、前記第２の参照文章とを用いて、前記第２の質問に対する適切な回答を生成するように前記回答生成部を訓練する適応部と、
を含むことを特徴とする対話管理装置。

【請求項2】

前記第１の質問は、第１のドメインに対応し、
前記第１の参照文章は、前記第１のドメインに対応し、
前記対話データは、第２のドメインに対応し、
前記第２の参照文章は、前記第２のドメインに対応し、
前記第２の回答ラベルは、前記第２のドメインに対応し、
前記第２の質問は、前記第２のドメインに対応する、
ことを特徴とする、請求項１に記載の対話管理装置。

【請求項3】

前記第１の回答の、前記第１の質問に対する正しい回答を示すグラウンドトゥルースである第１の回答ラベルに対する損失を減らすように前記回答生成部のモデルパラメータを変更することで、前記回答生成部を訓練する回答生成部訓練部、
を更に備えることを特徴とする、請求項２の対話管理装置。

【請求項4】

前記第２の参照文章の、前記対話データに関する正しい内容を含むグラウンドトゥルースである文章ラベルに対する損失を減らすように前記文章生成部のモデルパラメータを変更することで、前記文章生成部を訓練する文章生成部訓練部、
を更に備えることを特徴とする、請求項２の対話管理装置。

【請求項5】

前記文章生成部訓練部は、
前記対話データが所定の希少性基準を満たす場合、
前記対話データにおける質問に対する回答を含む元文章から、各回答を抽出し、前記文章ラベルとする、
ことを特徴とする、請求項４に記載の対話管理装置。

【請求項6】

前記文章生成部訓練部は、
前記対話データが所定の希少性基準を満たさない場合、
前記対話データと、異なる対話に対応する第２の対話データとから抽出した情報を前記文章ラベルとする、
ことを特徴とする、請求項４に記載の対話管理装置。

【請求項7】

前記回答生成部は、
前記文章生成部によって生成される、前記第２のドメインに対応する前記第２の参照文章を用いて、前記第２のドメインに対応する前記第２の質問に対する回答候補を生成し、
生成した前記回答候補の中から、所定の信用度基準を満たす回答を、前記第２の質問に対する正しい回答を示す前記第２の回答ラベルとして抽出し、
前記適応部は、
前記回答生成部によって生成される、前記第２の質問に対する第２の回答の、前記第２の回答ラベルに対する損失を減らすように前記回答生成部を訓練する、
ことを特徴とする、請求項３に記載の対話管理装置。

【請求項8】

前記適応部は、
ドメインを区別する識別ネットワークを更に含み、
前記第１の質問及び前記第１の参照文章に基づいて、前記第１のドメインに関する第１のドメイン特徴量を前記回答生成部から取得し、
前記第２の質問及び前記第２の参照文章に基づいて、前記第２のドメインに関する第２のドメイン特徴量を前記回答生成部から取得し、
前記第１のドメイン特徴量と、前記第２のドメイン特徴量とに基づいて、前記第１のドメインに関する質問と前記第２のドメインに関する質問とを区別するように前記識別ネットワークを訓練する、
ことを特徴とする、請求項３に記載の対話管理装置。

【請求項9】

前記回答生成部は、前記識別ネットワークが前記第１のドメインに関する質問と前記第２のドメインに関する質問とを区別するように訓練される、
ことを特徴とする、請求項８に記載の対話管理装置。

【請求項10】

前記回答生成部は、前記識別ネットワークが前記第１のドメインに関する質問と前記第２のドメインに関する質問とを区別しづらくなるように訓練される、
ことを特徴とする、請求項８に記載の対話管理装置。

【請求項11】

対話管理方法であって、
第１のドメインに対応する第１の質問に対する第１の回答を、前記第１のドメインに対応する第１の参照文章に基づいて生成する回答生成部を訓練する工程と、
第２のドメインに対応する質問及び回答を含む第２の対話データに基づいて、前記質問及び回答の内容を含む第２の参照文章を生成する文章生成部を訓練する工程と、
前記第２の参照文章を用いて、前記第２のドメインに対応する第２の質問に対する回答候補を前記回答生成部によって生成する工程と、
生成した前記回答候補の中から、所定の信用度基準を満たす回答を、前記第２の質問に対する正しい回答を示す第２の回答ラベルとして抽出する工程と、
前記第２の対話データと、前記第２の質問に対する正しい回答を示す前記第２の回答ラベルと、前記第２の参照文章とを用いて、前記回答生成部によって生成される、前記第２の質問に対する第２の回答の、前記第２の回答ラベルに対する損失を減らすように前記回答生成部のモデルパラメータを変更することで、前記第２のドメインに対応する質問に対して適切な回答を生成するように、前記回答生成部を訓練する工程と、
を含むことを特徴とする対話管理方法。

【請求項12】

ユーザの質問に対して適切な応答を出力するクライアント端末と、
前記応答を生成する対話管理装置とが通信ネットワークを介して接続される対話管理システムにおいて、
前記対話管理装置は、
第１のドメインに対応する第１の質問に対する第１の回答を、前記第１のドメインに対応する第１の参照文章に基づいて生成する回答生成部と、
第２のドメインに対応する質問及び回答を含む第２の対話データに基づいて、前記質問及び回答の内容を含む第２の参照文章を生成する文章生成部と、
前記第２の対話データと、前記第２のドメインに対応する第２の質問に対する正しい回答を示す第２の回答ラベルと、前記第２の参照文章とを用いて、前記第２のドメインに対応する質問に対して適切な回答を生成するように前記回答生成部を訓練する適応部と、
を含むことを特徴とする対話管理システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、対話管理装置、対話管理方法及び対話管理システムに関する。

【背景技術】

【0002】

近年、機械に言語理解能力を与えることは、自然言語処理や人工知能における中心的な課題である。ＭａｃｈｉｎｅＲｅａｄｉｎｇＣｏｍｐｒｅｈｅｎｓｉｏｎ(ＭＲＣ)は、機械の言語理解能力を開発・評価するためのタスクであり、定められた文章に関して設定された質問に正しく解答できるか否かにより、機械による理解度を測ることができる。更に、ＭＲＣの技術を産業に応用し、人間の質問に回答する対話システムで利用することができる。

【0003】

現在のＭＲＣの問題点の一つに、与えられる対象の文章中に質問の答えが存在するとは限らないことが挙げられる。質問の答えが与えられる対象の文章中に存在しない場合、ＭＲＣモデルは、学習した手掛かりに基づいて対象の文章から最善と考えられる答えを回答するが、質問に対する正しい答えが文章に存在しないため、質問への妥当な答えとはならない、不適切な応答を出力してしまうという課題がある。

【0004】

与えられる対象の文章中に質問の答えが存在しない場合に、ＭＲＣモデルが不適切な応答を出力してしまうという課題について、いくつかの提案がなされている。
例えば、中西真央、小林哲則、林良彦の研究（非特許文献１）には、「本研究では、既存のデータセットから自動的に答えのない質問データを作成する簡潔な手法を提案
する。さらに、答えのない質問に対して、その質問が文章中に答えを持たないことを識別することの難易度を自動的に付与する方法を提案する。これにより、作成するデータセットが一定の難易度を持つように制御できることを示す。」技術が開示されている。

【先行技術文献】

【非特許文献】

【0005】

【非特許文献1】中西真央、小林哲則、林良彦、「答えのないことを答えるＭａｃｈｉｎｅＲｅａｄｉｎｇＣｏｍｐｒｅｈｅｎｓｉｏｎ」、早稲田大学理工学術院、言語処理学会、第２４回年次大会、発表論文集、２０１８年３月

【発明の概要】

【発明が解決しようとする課題】

【0006】

上記の非特許文献１には、文章中に記述のない内容に関する質問に対して、「回答できない」と応答できるＭＲＣモデルを訓練するデータセットの作成方法や、質問が文章中に答えを持たないことを識別することの難易度を付与する方法が記載されている。

【0007】

上記の非特許文献１によれば、文章中に記述のない内容に関する質問に対して「回答できない」と応答できるＭＲＣモデルを訓練することができるとされている。しかし、ユーザの観点からは、「回答できない」との応答では十分と感じられず、不満につながる場合がある。このため、文章中に記述のない内容についても適切な応答を出力する手法は非特許文献１では検討されておらず、今後の検討課題となっている。

【0008】

そこで、本開示は、自然言語の会話に基づいて生成した参照文章を用いてＭＲＣモデルを訓練することで、様々な質問に対応できる、柔軟性及びロバスト性が高い対話管理手段を提供することを目的とする。

【課題を解決するための手段】

【0009】

上記の課題を解決するために、代表的な本発明の対話管理装置の一つは、第１の質問を受信し、前記第１の質問に対する第１の回答を、第１の参照文章に基づいて生成する回答生成部と、質問及び回答を含む対話データに基づいて、前記質問及び回答の内容を含む第２の参照文章を生成する文章生成部と、前記対話データと、第２の質問に対する正しい回答を示す第２の回答ラベルと、前記第２の参照文章とを用いて、前記第２の質問に対する適切な回答を生成するように前記回答生成部を訓練する適応部とを含む。

【発明の効果】

【0010】

本開示によれば、自然言語の会話に基づいて生成した参照文章を用いてＭＲＣモデルを訓練することで、様々な質問に対応できる、柔軟性及びロバスト性が高い対話管理手段を提供することができる。
上記以外の課題、構成及び効果は、以下の発明を実施するための形態における説明により明らかにされる。

【図面の簡単な説明】

【0011】

【図1】図１は、本開示の実施形態を実施するためのコンピュータシステムを示す図である。

【図2】図２は、従来のＭＲＣモデルを用いた質問応答処理の流れを示す図である。

【図3】図３は、本開示の実施形態に係る対話管理システムの構成の一例を示す図である。

【図4】図４は、本開示の実施形態に係る回答生成部を訓練するための回答生成部訓練処理の流れの一例を示すブロック図である

【図5】図５は、本開示の実施形態に係る文章生成部訓練処理の流れの一例を示すブロック図である。

【図6】図６は、本開示の実施形態に係る文脈ラベル生成処理の具体例を示す図である。

【図7】図７は、本開示の実施形態に係る対話集約処理の具体例を示す図である。

【図8】図８は、本開示の実施形態に係る適応処理の流れの一例を示すブロック図である。

【発明を実施するための形態】

【0012】

以下、図面を参照して、本発明の実施形態について説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
また、「第１」、「第２」、「第３」等の用語は、本開示において様々な要素又は構成要素を説明するのに用いられる場合があるが、これらの要素又は構成要素はこれらの用語によって限定されるべきでないことが理解されるであろう。これらの用語は、或る要素又は構成要素を別の要素又は構成要素と区別するためにのみ用いられる。したがって、以下で論述する第１の要素又は構成要素は、本発明概念の教示から逸脱することなく第２の要素又は構成要素と呼ぶこともできる。

【0013】

次に、図１を参照して、本開示の実施形態を実施するためのコンピュータシステム１００について説明する。本明細書で開示される様々な実施形態の機構及び装置は、任意の適切なコンピューティングシステムに適用されてもよい。コンピュータシステム１００の主要コンポーネントは、１つ以上のプロセッサ１０２、メモリ１０４、端末インターフェース１１２、ストレージインタフェース１１３、Ｉ／Ｏ（入出力）デバイスインタフェース１１４、及びネットワークインターフェース１１５を含む。これらのコンポーネントは、メモリバス１０６、Ｉ／Ｏバス１０８、バスインターフェースユニット１０９、及びＩ／Ｏバスインターフェースユニット１１０を介して、相互的に接続されてもよい。

【0014】

コンピュータシステム１００は、プロセッサ１０２と総称される１つ又は複数の汎用プログラマブル中央処理装置（ＣＰＵ）１０２Ａ及び１０２Ｂを含んでもよい。ある実施形態では、コンピュータシステム１００は複数のプロセッサを備えてもよく、また別の実施形態では、コンピュータシステム１００は単一のＣＰＵシステムであってもよい。各プロセッサ１０２は、メモリ１０４に格納された命令を実行し、オンボードキャッシュを含んでもよい。

【0015】

ある実施形態では、メモリ１０４は、データ及びプログラムを記憶するためのランダムアクセス半導体メモリ、記憶装置、又は記憶媒体（揮発性又は不揮発性のいずれか）を含んでもよい。メモリ１０４は、本明細書で説明する機能を実施するプログラム、モジュール、及びデータ構造のすべて又は一部を格納してもよい。例えば、メモリ１０４は、対話管理アプリケーション１５０を格納していてもよい。ある実施形態では、対話管理アプリケーション１５０は、後述する機能をプロセッサ１０２上で実行する命令又は記述を含んでもよい。

【0016】

ある実施形態では、対話管理アプリケーション１５０は、プロセッサベースのシステムの代わりに、またはプロセッサベースのシステムに加えて、半導体デバイス、チップ、論理ゲート、回路、回路カード、および/または他の物理ハードウェアデバイスを介してハードウェアで実施されてもよい。ある実施形態では、対話管理アプリケーション１５０は、命令又は記述以外のデータを含んでもよい。ある実施形態では、カメラ、センサ、または他のデータ入力デバイス（図示せず）が、バスインターフェースユニット１０９、プロセッサ１０２、またはコンピュータシステム１００の他のハードウェアと直接通信するように提供されてもよい。

【0017】

コンピュータシステム１００は、プロセッサ１０２、メモリ１０４、表示システム１２４、及びＩ／Ｏバスインターフェースユニット１１０間の通信を行うバスインターフェースユニット１０９を含んでもよい。Ｉ／Ｏバスインターフェースユニット１１０は、様々なＩ／Ｏユニットとの間でデータを転送するためのＩ／Ｏバス１０８と連結していてもよい。Ｉ／Ｏバスインターフェースユニット１１０は、Ｉ／Ｏバス１０８を介して、Ｉ／Ｏプロセッサ（ＩＯＰ）又はＩ／Ｏアダプタ（ＩＯＡ）としても知られる複数のＩ／Ｏインタフェースユニット１１２，１１３，１１４、及び１１５と通信してもよい。

【0018】

表示システム１２４は、表示コントローラ、表示メモリ、又はその両方を含んでもよい。表示コントローラは、ビデオ、オーディオ、又はその両方のデータを表示装置１２６に提供することができる。また、コンピュータシステム１００は、データを収集し、プロセッサ１０２に当該データを提供するように構成された1つまたは複数のセンサ等のデバイスを含んでもよい。

【0019】

例えば、コンピュータシステム１００は、心拍数データやストレスレベルデータ等を収集するバイオメトリックセンサ、湿度データ、温度データ、圧力データ等を収集する環境センサ、及び加速度データ、運動データ等を収集するモーションセンサ等を含んでもよい。これ以外のタイプのセンサも使用可能である。表示システム１２４は、単独のディスプレイ画面、テレビ、タブレット、又は携帯型デバイスなどの表示装置１２６に接続されてもよい。

【0020】

Ｉ／Ｏインタフェースユニットは、様々なストレージ又はＩ／Ｏデバイスと通信する機能を備える。例えば、端末インタフェースユニット１１２は、ビデオ表示装置、スピーカテレビ等のユーザ出力デバイスや、キーボード、マウス、キーパッド、タッチパッド、トラックボール、ボタン、ライトペン、又は他のポインティングデバイス等のユーザ入力デバイスのようなユーザＩ／Ｏデバイス１１６の取り付けが可能である。ユーザは、ユーザインターフェースを使用して、ユーザ入力デバイスを操作することで、ユーザＩ／Ｏデバイス１１６及びコンピュータシステム１００に対して入力データや指示を入力し、コンピュータシステム１００からの出力データを受け取ってもよい。ユーザインターフェースは例えば、ユーザＩ／Ｏデバイス１１６を介して、表示装置に表示されたり、スピーカによって再生されたり、プリンタを介して印刷されたりしてもよい。

【0021】

ストレージインタフェース１１３は、１つ又は複数のディスクドライブや直接アクセスストレージ装置１１７（通常は磁気ディスクドライブストレージ装置であるが、単一のディスクドライブとして見えるように構成されたディスクドライブのアレイ又は他のストレージ装置であってもよい）の取り付けが可能である。ある実施形態では、ストレージ装置１１７は、任意の二次記憶装置として実装されてもよい。メモリ１０４の内容は、ストレージ装置１１７に記憶され、必要に応じてストレージ装置１１７から読み出されてもよい。Ｉ／Ｏデバイスインタフェース１１４は、プリンタ、ファックスマシン等の他のＩ／Ｏデバイスに対するインターフェースを提供してもよい。ネットワークインターフェース１１５は、コンピュータシステム１００と他のデバイスが相互的に通信できるように、通信経路を提供してもよい。この通信経路は、例えば、ネットワーク１３０であってもよい。

【0022】

ある実施形態では、コンピュータシステム１００は、マルチユーザメインフレームコンピュータシステム、シングルユーザシステム、又はサーバコンピュータ等の、直接的ユーザインターフェースを有しない、他のコンピュータシステム（クライアント）からの要求を受信するデバイスであってもよい。他の実施形態では、コンピュータシステム１００は、デスクトップコンピュータ、携帯型コンピューター、ノートパソコン、タブレットコンピュータ、ポケットコンピュータ、電話、スマートフォン、又は任意の他の適切な電子機器であってもよい。

【0023】

次に、図２を参照して、従来のＭＲＣモデルを用いた質問応答処理の流れについて説明する。

【0024】

上述したように、従来から、自然言語処理や人工知能において、機械に言語理解能力を与える手段として、ＭａｃｈｉｎｅＲｅａｄｉｎｇＣｏｍｐｒｅｈｅｎｓｉｏｎ(ＭＲＣ)は知られている。ＭＲＣは、機械の言語理解能力を開発・評価するためのタスクであり、定められた文章に関して設定された質問に正しく解答できるかにより、機械による理解度を測ることができる。従来のＭＲＣを用いた質問応答処理の流れは、図２に示される。

【0025】

まず、ステップＳ２１０では、「スマホをどうやってＷｉＦｉ（登録商標）に接続する？」等の質問２１５を受け付けた後、ステップＳ２２０訓練済みのＭＲＣ部は、受け付けた質問２１５を自然言語処理で解析し、予め用意された参照文章２２５を参照し、質問２１５の回答となる箇所の始点及び終点を規定する回答インデックスを参照文章２２５において特定する。その後、ステップＳ２３０では、特定した回答インデックスに規定される文章箇所が、質問２１５の回答として出力される。

【0026】

一例として、「スマホをどうやってＷｉＦｉに接続する？」との質問２１５を受け付けた場合、訓練済みのＭＲＣ部は、参照文章２２５において、「６０～７１」との回答インデックスに規定される「スマホの「設定」画面で、ＷｉＦｉに接続することができます」との文章箇所を回答として出力する。

【0027】

このようなＭＲＣモデルは、例えばオンラインのチャットサポートやコールセンター等で使用されてきた。チャットサポートやコールセンターに対して問われた質問の回答が予め用意された文章内に存在していれば、ＭＲＣモデルに特定され、回答として出力される。

【0028】

しかし、上述したように、質問への適切な回答が、予め用意された参照文章において存在するとは限らない。質問の答えが与えられる参照文章中に存在しない場合、ＭＲＣモデルは、学習された手掛かりに基づいて参照文章から最善と考えられる答えを回答するが、質問に対する正しい答えが参照文章に存在しないため、質問への妥当な答えではない、不適切な応答を出力してしまうという課題がある。
この場合、例えばオンラインのチャットサポートやコールセンターでは、上司や責任者に交代して対応するエスカレーション対応が発生することがあるが、これは質問を発したユーザ及び対応する責任者の時間を要するため、望ましくない。

【0029】

従って、上記の課題を鑑み、本開示は、自然言語の会話に基づいて生成した参照文章を用いてＭＲＣモデルを訓練することで、様々な質問に対応できる、柔軟性及びロバスト性が高い対話管理手段に関する。

【0030】

次に、図３を参照して、本開示の実施形態に係る対話管理システムについて説明する。

【0031】

図３は、本開示の実施形態に係る対話管理システム３００の構成の一例を示す図である。図３に示すように、対話管理システム３００は、クライアント端末３２０と、対話管理装置３４０とを含む。対話管理システム３００において、クライアント端末３２０と、対話管理装置３４０とは、通信ネットワーク３３０を介して互いに接続されてもよい。

【0032】

クライアント端末３２０は、ユーザ３１０との対話を行うための装置である。一例として、クライアント端末３２０は、例えばオンラインのチャットサポートやコールセンターでユーザ３１０の質問に対する回答を提供するように構成されたコンピューティングデバイスであってもよい。ある実施形態では、クライアント端末３２０は、対話管理装置３４０と連携してユーザ３１０に対応するように構成されてもよい。

【0033】

図３に示すように、クライアント端末３２０は、受付部３２２と、第１の通信部３２４と、応答部３２６と、対話データ３２９を格納するストレージ部３２８とを含んでもよい。
受付部３２２は、ユーザ３１０からの質問を受け付ける機能部である。受付部３２２は、例えば、「住宅ローンに申し込むためにどのような条件がありますか？」や「スマホをどうやってＷｉＦｉに接続する？」などの質問を受け付けてもよい。受付部３２２は、例えば音声で発せられる質問を受け付けるように構成されてもよく、テキストで入力される質問を受け付けるように構成されてもよい。

【0034】

第１の通信部３２４は、対話管理装置３４０との双方データ通信を行うための機能部である。ある実施形態では、第１の通信部３２４は、受付部３２２によって受け付けられた質問を通信ネットワーク３３０を介して対話管理装置３４０に送信し、対話管理装置３４０によって生成される回答を受信してもよい。

【0035】

通信ネットワーク３３０は、例えばローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、衛星ネットワーク、ケーブルネットワーク、ＷｉＦｉネットワーク、またはそれらの任意の組み合わせを含むものであってもよい。

【0036】

応答部３２６は、受付部３２２がユーザ３１０から受け付けた質問への回答を応答として出力するための機能部である。ある実施形態では、応答部３２６は、対話管理装置３４０から受信した回答を用いてユーザ３１０へ応答してもよい。

【0037】

ストレージ部３２８は、ユーザ３１０との間で行われた対話の履歴を示す対話データ３２９を格納する記憶領域である。

【0038】

対話管理装置３４０は、様々な質問に対する回答を生成するための機能部である。ある実施形態では、対話管理装置３４０は、例えばクラウド等の分散コンピューティング環境におけるサーバ装置又は複数のサーバ装置として実装され、本開示の実施形態に係る対話管理手段をサービスとしてクライアント端末３２０に提供してもよい。図３に示すように、対話管理装置３４０は、回答生成部３４２、回答生成部訓練部３４４、文章生成部３４６、文章生成部訓練部３４８、適応部３５０及び第２の通信部３５２を含む。
なお、これらの機能部は、図１に示す対話管理アプリケーション１５０を構成するソフトウエアモジュールであってもよく、独立した専用ハードウェアデバイスであってもよい。また、上記の機能部は、同一のコンピューティング環境に実施されてもよく、分散されたコンピューティング環境に実施されてもよい。

【0039】

回答生成部３４２は、受け付けた質問（例えば、第１の質問）に対する適切な回答（例えば、第１の回答）を所定の参照文章（例えば、第１の参照文章）に基づいて生成するための機能部である。ある実施形態では、回答生成部３４２は、クライアント端末３２０がユーザ３１０から受け付けた質問を通信ネットワーク３３０を介して受信し、当該質問の回答となる箇所の始点及び終点を規定する回答インデックスを所定の文章において特定し、回答として生成するＭＲＣモデルであってもよい。
なお、本開示では、「適切な回答」との表現は、ユーザの質問に対する有意義な情報を提供する回答を意味する。

【0040】

回答生成部３４２が受け付ける質問は、特定のドメインに対応する質問であってもよい。ここでのドメインとは、特定の情報、内容、話題、目的、トピックの範囲を意味するものであり、例えば「レストラン予約」、「不動産の物件探し」、「送金手続き」、「住宅ローン申し込み」、「ＷｉＦｉ接続」等、任意の事柄に関連していてもよい。また、本開示において、「ドメインに対応する」との表現は、ある質問、回答、文章等が、特定のドメインとある程度の関連性を有することを意味する。一例として、「〇〇駅付近に売りに出されている新築マンションありますか？」との質問は、「不動産の物件探し」とのドメインに対応しているとみなしてもよい。

【0041】

本開示では、「第１のドメイン」や「第２のドメイン」等の用語を用いて本開示の実施形態について説明するが、これらの「第１のドメイン」及び「第２のドメイン」は、同一のドメインであってもよく、異なるドメインであってもよい。ある実施形態では、「第１のドメイン」は、ＭＲＣモデルが既に対応可能となっているソースのドメインであり、「第２のドメイン」は、ＭＲＣモデルに対応させるターゲットのドメインであってもよい。また、ある実施形態では、第２のドメインは、第１のドメインと実質的に同様の話題やトピックに該当するものの、第１のドメインには含まれない情報を含むものであってもよい。
同様に、以下の説明で用いる「第１の～」や「第２の～」等の用語は、構成要素を限定するものではなく、区別するために用いられていることに留意されたい。

【0042】

回答生成部訓練部３４４は、回答生成部３４２を訓練するための機能部である。より具体的には、回答生成部訓練部３４４は、第１のドメイン（例えば、ソースドメイン）に対応する質問に対して適切な回答を生成することができるように回答生成部３４２を訓練してもよい。後述するように、回答生成部３４２のようなＭＲＣモデルを訓練するためには、対象のドメインに対応する対話データと、当該対話データにおける質問に対する回答を含む参照文章と、質問に対する正しい回答を示すグラウンドトゥルースとなる回答ラベルとの３つのデータが必要となる。
ある実施形態では、回答生成部訓練部３４４は、回答生成部３４２によって生成される、第１のドメインに対応する第１の質問に対する第１の回答の、第１の質問に対する正しい回答を示す第１の回答ラベルに対する損失を減らすように回答生成部３４２を訓練してもよい。これにより、回答生成部３４２は、第１のドメインに対応する質問に対してより高精度の回答を生成することができるようになる。

【0043】

文章生成部３４６は、自然言語で構成される対話データから、上述した回答生成部３４２によって用いられる参照文章を生成するための機能部である。ある実施形態では、文章生成部３４６は、第２のドメインに対応する質問及び回答を含む第２の対話データに基づいて、第２のドメインに関する情報を含む第２の参照文章を生成してもよい。ここで、文章生成部３４６は、例えばユーザとの対話から収集され、上述したストレージ部３２８において格納される対話データ３２９に基づいて参照文章を生成してもよい。このように、文章生成部３４６は、第１のドメインに対応する参照文章には含まれない新たな情報（例えば、対話データ３２９からの情報）を含む第２の参照文章を生成することができる。

【0044】

文章生成部訓練部３４８は、文章生成部３４６を訓練するための機能部である。より具体的には、文章生成部訓練部３４８は、対話データにおける有意義な情報を抽出した参照文章を生成する精度を向上させるように文章生成部３４６を訓練してもよい。ある実施形態では、文章生成部訓練部３４８は、文章生成部３４６によって生成される、第２の参照文章の、対話データに関する正しい内容を含むグラウンドトゥルースとなる文章ラベルに対する損失を減らすように文章生成部３４６を訓練してもよい。これにより、文章生成部３４６は、対話データからより高精度の参照文章を生成することができるようになる。

【0045】

適応部３５０は、上述した文章生成部３４６によって生成される参照文章を用いて回答生成部３４２を訓練することで、回答生成部３４２の対応範囲を拡張するための機能部である。ここで、「回答生成部３４２の対応範囲を拡張する」との表現は、回答生成部３４２により多くの質問（例えば、より多くのドメイン、内容、話題等に関する質問）に対して適切な回答を生成可能にすることを意味する。ある実施形態では、適応部３５０は、第２のドメインに対応する第２の対話データと、回答生成部３４２によって生成される、第２のドメインに対応する質問に対する回答ラベルと、文章生成部３４６によって生成される第２の参照文章とを用いて、第２のドメインに対応する質問に対する回答を生成するように回答生成部３４２を訓練してもよい。

【0046】

なお、原則として、回答生成部３４２のようなＭＲＣ部は、上述した回答生成部訓練部３４４による訓練では、特定のドメイン（例えば、特定の内容及び形式）に対応する参照文章を学習データとして用いて訓練される。このため、学習データとなった参照文章と同様のドメインに対応する質問に対する回答を、学習データとなった文章と同様のドメインに対応する参照文章に基づいて生成することができる。しかし、学習データと異なるドメインに対応する質問については、性能が限られてしまう。そこで、本開示の実施形態に係る適応部３５０を用いて、回答生成部訓練部３４４による訓練で用いられた学習データとは異なるドメインに対応する参照文章（例えば、文章生成部３４６によって生成される、第２のドメインに対応する第２の参照文章）に基づいて回答生成部３４２を訓練することで、回答生成部３４２は、対応範囲を拡張し、様々な内容に関する質問に対して適切な回答を生成することが可能となる。

【0047】

第２の通信部３５２は、クライアント端末３２０との双方データ通信を行うための機能部である。ある実施形態では、第２の通信部３５２は、回答生成部３４２によって生成された回答を通信ネットワーク３３０を介してクライアント端末３２０に送信してもよい。

【0048】

以上説明したように構成した対話管理システム３００によれば、自然言語の会話に基づいて生成した参照文章を用いてＭＲＣモデルを訓練することで、様々な質問に対応できる、柔軟性及びロバスト性が高い対話管理手段を提供することができる。言い換えれば、本開示に係る対話管理システム３００においては、回答生成部３４２は、新たな情報を含む対話データに基づいて生成された参照文章を用いて訓練されるため、以前答えられなかった、当該新たな情報に関する質問に対しても適切な回答を生成することが可能となる。

【0049】

次に、図４を参照して、本開示の実施形態に係る回答生成部訓練処理について説明する。

【0050】

図４は、本開示の実施形態に係る回答生成部３４２を訓練するための回答生成部訓練処理４００の流れの一例を示すブロック図である。この回答生成部訓練処理４００は、第１のドメイン（例えばソースドメイン）に対応する第１の質問に対する適切な第１の回答を、第１のドメインに対応する第１の参照文章に基づいて生成することができるように回答生成部３４２を訓練するための処理であり、上述した回答生成部訓練部３４４によって実行される。

【0051】

図４に示す第１の対話データ４１０は、自然言語で構成される会話を示す情報であり、第１の質問４１４及び当該第１の質問４１４への第１の回答４１８を含む。ある実施形態では、第１の対話データ４１０、そして、第１の対話データ４１０に含まれる
第１の質問４１４及び第１の回答４１８は、第１のドメインに対応するものであってもよい。

【0052】

この第１の対話データ４１０は、例えば第１の質問４１４への第１の回答４１８を求める質問者と、質問者の第１の質問４１４への第１の回答４１８を提供する回答者との間で行われた会話の履歴であってもよい。一例として、この対話データは、オンラインのチャットサポートやコールセンターで、第１の質問４１４への第１の回答４１８を求める質問者と、エスカレーション対応が発生した後に質問者に対応することとなった担当者との間で行われた会話の履歴であってもよい。

【0053】

まず、回答生成部訓練部３４４は、第１の対話データ４１０に含まれる第１の質問４１４と、第１の質問４１４の第１の回答４１８を含む第１の参照文章４２０とを回答生成部３４２に入力する。ここでの回答生成部３４２は、例えばＢｉｄｒｅｃｔｉｏｎａｌａｎｄＡｕｔｏ－ＲｅｇｒｅｓｓｉｖｅＴｒａｎｓｆｏｒｍｅｒ（ＢＡＲＴ）やＲｏｂｕｓｔｌｙＯｐｔｉｍｉｚｅｄＢＥＲＴＰｒｅｔｒａｉｎｉｎｇＡｐｐｒｏａｃｈ（ＲＯＢＥＲＴＡ）等の訓練済みのＭＲＣモデルであってもよい。

【0054】

次に、回答生成部３４２は、入力された第１の質問４１４に対する回答となる文章箇所を第１の参照文章４２０内で特定し、特定した文章箇所の始点及び終点を規定する第１の回答インデックス４３５を判定する。より具体的には、回答生成部３４２となるＭＲＣモデルのエンコーダーは、第１の質問４１４及び第１の参照文章４２０を表す文脈表見（ｃｏｎｔｅｘｔｕａｌｒｅｐｒｅｓｅｎｔａｔｉｏｎ；中間表現ともいう）を生成し、線形レイヤに出力する。その後、当該線形レイヤは、入力したエンコーダーの文脈表現が、第１の質問４１４に対する回答の正しい文章箇所を表している確率を示すロジットを生成する。

【0055】

次に、回答生成部訓練部３４４は、回答生成部３４２によって生成される第１の回答インデックス４３５の、第１の質問４１４の正しい回答を示すグラウンドトゥルースとなる第１の回答ラベル４４０に対する損失を計算し、例えばいわゆるＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ等の手法を用いて、損失を減らすように、回答生成部３４２のモデルパラメータを変更する。

【0056】

以上説明した回答生成部訓練処理４００を繰り返すことで、回答生成部３４２は、入力された質問に対して適切な回答を出力する精度が向上する。
ただし、上述したように、この回答生成部訓練処理４００では、回答生成部３４２のようなＭＲＣ部は、上述した回答生成部訓練部３４４による訓練では、特定のドメイン（例えば、特定の内容及び形式）に対応する参照文章を学習データとして用いて訓練されるため、学習データとなった参照文章と同様のドメインに対応する質問に対する回答を、学習データとなった文章と同様のドメインに対応する参照文章に基づいて生成することができるようになるものの、学習データと異なるドメインに対応する質問については、性能が限られてしまう。そこで、後述するように、回答生成部３４２の対応範囲を拡張し、様々な質問に対して適切な回答を生成するためには、後述する文章生成部３４６及び適応部３５０による処理が必要となる。

【0057】

次に、図５を参照して、本開示の実施形態に係る文章生成部訓練処理について説明する。

【0058】

図５は、本開示の実施形態に係る文章生成部訓練処理５００の流れの一例を示すブロック図である。この文章生成部訓練処理５００は、自然言語で構成される対話データから、質問に対する適切な回答を生成するために回答生成部３４２によって用いられる参照文章を生成するように文章生成部３４６を訓練するための処理であり、上述した文章生成部訓練部３４８によって実行される。

【0059】

まず、文章生成部訓練部３４８は、第２の質問５１４及び第２の回答５１８から構成される第２の対話データ５１０を文章生成部３４６に入力する。この第２の対話データ５１０と、第２の対話データ５１０に含まれる第２の質問５１４及び第２の回答５１８は、第２のドメイン（例えば、ターゲットドメイン）に対応するものであってもよい。言い換えれば、この第２の対話データ５１０は、新たな情報（例えば、上述した回答生成部訓練処理４００において回答生成部３４２を訓練するために用いられた第１の参照文章には含まれていない情報）を含む。上述したように、この第２の対話データ５１０は、第２の質問５１４への第２の回答５１８を求める質問者と、質問者の第２の質問５１４への第２の回答５１８を提供する回答者との間で行われた会話の履歴であってもよい。

【0060】

次に、文章生成部３４６は、入力された第２の対話データ５１０に基づいて、第２の対話データ５１０の内容を含む第２の参照文章５２０を生成する。つまり、文章生成部３４６は、第２の対話データ５１０に含まれる本質的な情報（例えば、質問への回答となる情報）を抽出し、文章として構成する処理を行う。このように、文章生成部３４６は、第２の対話データ５１０に含まれる新たな情報（例えば、上述した回答生成部訓練処理４００において回答生成部３４２を訓練するために用いられた第１の参照文章には含まれていない情報）を含む参照文章を生成することができる。
ここでの文章生成部３４６は、例えばＢＡＲＴモデル等、エンコーダー及びデコーダーを含む訓練済みのＳｅｑｕｅｎｃｅ－ｔｏ－Ｓｅｑｕｅｎｃｅモデルとして実装されてもよい。

【0061】

次に、文章生成部訓練部３４８は、文章生成部３４６によって生成された第２の参照文章５２０の、第２の対話データ５１０に対する正しい文章を示すグラウンドトゥルースデータとなる第２の文章ラベル５４０に対する損失を計算することで第２の参照文章５２０を評価し、例えばいわゆるＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ等の手法を用いて、損失を減らすように、文章生成部３４６のモデルパラメータを変更する。

【0062】

文章生成部３４６によって生成される第２の参照文章５２０を評価するための第２の文章ラベル５４０は、第２の対話データ５１０における第２の質問５１４に対する第２の回答５１８を全て含む元文章（例えば、ユーザに作成された文章）であってもよく、後述する文脈ラベル生成処理６００によって生成される文脈ラベルであってもよく、後述する対話集約処理７００によって生成される集約ラベルであってもよい。
より具体的には、ある実施形態では、文章生成部訓練部３４８は、ＣＮＮコーパス等の大規模のコーパスを用いて文章生成部３４６の初期段階の訓練を行い、様々なドメインに渡る語彙の分布や文章の形式・構成を学習させた後、ＳＡＭＳｕｍ等のラベル化済みの対話データのコーパスを用いて文章生成部３４６の微調整（ＦｉｎｅＴｕｎｉｎｇ）を行い、補助的な語彙を文章生成部３４６に学習させてもよい。

【0063】

以上説明した文章生成部訓練処理５００を繰り返すことで、文章生成部３４６は、任意のドメインに対応する対話データに基づいて、当該対話データの本質的な情報（例えば、上述した回答生成部訓練処理４００において回答生成部３４２を訓練するために用いられた第１の参照文章には含まれていない情報）を含む参照文章を生成する性能を向上させることができる。また、後述するように、適応部３５０は、この文章生成部３４６によって生成された参照文章を用いて回答生成部３４２を更に訓練することで、回答生成部３４２の対応範囲を拡張させ、様々な質問（例えば、第２のドメインに対応する質問）に対して適切な回答を生成することが可能なＭＲＣモデルを得ることができる。

【0064】

上述した文章生成部訓練処理５００において、文章生成部３４６によって生成される参照文章を評価するグラウンドトゥルースのデータとして、第２の対話データ５１０における第２の質問５１４に対する第２の回答５１８を全て含む元文章（例えば、ユーザに作成された文章）のみならず、当該元文章から抽出した文脈ラベル（ｃｏｎｔｅｘｔｌａｂｅｌ）や、複数の対話データを集約した集約ラベルを用いてもよい。以下、図６及び図７を参照して、対話データにおける質問に対する回答を抽出して文脈ラベルを生成する文脈ラベル生成処理６００と、複数の対話データを集約して対話集約を生成する対話集約処理７００とについて説明する。

【0065】

図６は、本開示の実施形態に係る文脈ラベル生成処理６００の具体例を示す図である。上述したように、この文脈ラベル生成処理６００は、対話データにおける質問に対する回答を抽出して、文章生成部３４６によって生成される参照文章を評価するグラウンドトゥルースとして、文脈ラベルを生成するための処理であり、文章生成部訓練部３４８によって実行されてもよい。

【0066】

文脈ラベル生成処理６００では、図６に示すように、文章生成部３４６を訓練する学習データとして用いられる対話データに含まれる各質問６１０について、適切な回答となる文章箇所が、当該対話データにおける質問に対する回答を全て含む元文章６２０から抽出され、まとめられ、文脈ラベル６３０として生成される。この元文章６２０は、例えばユーザによって作成された文章であってもよい。

【0067】

例えば、図６に示すように、文章生成部３４６を訓練する学習データとして用いられる対話データにおいて、「スマホをＷｉＦｉに接続することはできますか？」と、「パスワードは必要ですか？」との２つの質問６１０があった場合、文章生成部訓練部３４８は、これらの質問６１０に対する回答として、「スマホの「設定」画面で、ＷｉＦｉに接続することができますが、スマホのＯＳによってはやり方が異なります。」と、「無線ＬＡＮのパスワードが必要になりますので、そこでパスワードを入力すれば接続完了です。」との２つの文章箇所を元文章６２０から抽出し、文脈ラベル６３０として生成する。

【0068】

上述したように、このように生成した文脈ラベル６３０は、文章生成部３４６の訓練段階において、文章生成部３４６によって生成される参照文章を評価するグラウンドトゥルースのデータとして用いられてもよい。このように、元文章６２０全体ではなく、質問の回答となった文章箇所のみをグラウンドトゥルースとして用いて文章生成部３４６を訓練することで、文章生成部３４６は、質問に対する回答と無関係の情報を生成した参照文章に含まなかったことによる罰則を受けず、実際に質問に対する回答となった情報を含むグラウンドトゥルースに基づいて評価されるため、より高精度の参照文章を生成するように訓練される。

【0069】

また、ある実施形態では、この文脈ラベル生成処理６００は、特定のドメイン（例えば第２のドメイン）に対応する対話データが所定の希少性基準を満たす場合に実行してもよい。この希少性基準は、使用可能な対話データの量に基づく基準であり、使用可能な対話データが所定の量未満の場合、希少性基準を満たすとみなし、使用可能な対話データが所定の量以上の場合、希少性基準を満たさないとみなす。言い換えれば、特定のドメイン（例えば第２のドメイン）に対応する対話データが少ない場合に、この文脈ラベル生成処理６００を用いることが望ましい。これは、対話データにおける質問に対する回答を元文章から抽出して文脈ラベルを生成することで、特定のドメインに対応する対話データが少ない場合であっても、良質なグラウンドトゥルースを生成することができるからである。

【0070】

図７は、本開示の実施形態に係る対話集約処理７００の具体例を示す図である。上述したように、この対話集約処理７００は、複数の対話データを集約して、文章生成部３４６によって生成される参照文章を評価するグラウンドトゥルースのデータとして、集約ラベルを生成するための処理であり、文章生成部訓練部３４８によって実行されてもよい。

【0071】

対話集約処理７００では、図７に示すように、文章生成部訓練部３４８は、複数の対話データ７１０、７２０からの情報を抽出し、集約することで、文章生成部３４６によって生成される参照文章を評価するグラウンドトゥルースとなる集約ラベル７３０を生成する。これらの対話データ７１０、７２０は、共通のドメイン（例えば、スマホのＷｉＦｉ接続）に対応する対話であってもよいが、これに限定されず、異なるドメインに対応する対話であってもよい。

【0072】

上述したように、このように生成した集約ラベル７３０は、文章生成部３４６の訓練段階において、文章生成部３４６によって生成される参照文章を評価するグラウンドトゥルースのデータとして用いられてもよい。また、この対話集約７３０は、複数の対話データから生成したため、例えば１つの対話データに基づいて生成される文脈ラベルに比べて、より多くの質問に対する適切な回答となる情報を含むが、生成するためにより多くの対話データが必要となる。従って、この対話集約処理７００は、特定のドメイン（例えば第２のドメイン）に対応する対話データが上述した所定の希少性基準を満たさない場合（つまり、対話データが多い場合）に実行することが望ましい。

【0073】

次に、図８を参照して、本開示の実施形態に係る適応処理について説明する。

【0074】

図８は、本開示の実施形態に係る適応処理８００の流れの一例を示すブロック図である。図８に示す適応処理８００は、回答生成部３４２の対応範囲を拡張し、様々な質問に対して適切な回答を生成することができるように訓練するための処理であり、主に回答生成部３４２、文章生成部３４６及び適応部３５０によって実施される。

【0075】

上述したように、図４を参照して説明した回答生成部訓練処理４００によれば、回答生成部３４２は、特定のドメイン（例えば第１のドメイン）に対応する質問（例えば第１の質問）に対する適切な回答（例えば第１の回答）を生成するように訓練される。ただし、このように訓練した回答生成部３４２は、特定のドメインに対応する参照文章を学習データとして用いて訓練されるため、学習データとなった参照文章と同様のドメインに対応する質問に対する適切な回答を、学習データとなった参照文章と同様のドメインに対応する参照文章に基づいて生成することができるものの、学習データと異なるドメインに対応する質問については、性能が限られてしまう。

【0076】

従って、回答生成部３４２の柔軟性を向上させ、より多くのドメインに対応する質問に対しても適切な回答を生成することができるように訓練することが望ましい。しかし、原則として、回答生成部３４２のようなＭＲＣモデルを訓練するためには、訓練対象のドメイン（例えば、ターゲットドメイン）に対応する対話データと、対話データにおける質問に対する回答を含む参照文章と、質問に対する正しい回答を示すグラウンドトゥルースとなる回答ラベルとの３つのデータが必要となる。このため、訓練対象のドメインに対応する対話データのみが使用可能なデータとして存在し、訓練対象のドメインに対応する質問の回答を含む参照文章や、質問に対する正しい回答を示す回答ラベルのデータがない場合には、上述した一般的なＭＲＣモデルの訓練を実施することができない。

【0077】

そこで、本開示の実施形態に係る適応処理８００では、上述した回答生成部訓練処理４００によって訓練された回答生成部３４２を用いて第２のドメインに対応する質問への正しい回答を示すグラウンドトゥルースとなる第２の回答ラベルを生成し、上述した文章生成部訓練処理５００によって訓練された文章生成部３４６を用いて第２のドメインに対応する質問への回答を含む第２の参照文章を生成する。このように生成した第２の回答ラベルと、第２の参照文章と、第２のドメインに対応する対話データとを用いて回答生成部３４２を訓練することで、回答生成部３４２は、対応範囲が拡張し、より多くのドメインに対応する質問に対して適切な回答を生成することが可能となる。

【0078】

まず、適応部３５０は、第２の質問８０４及び第２の回答８０６とから構成される第２の対話データ８０２を、上述した文章生成部訓練処理５００によって訓練された文章生成部３４６に入力する。上述したように、この第２の対話データ８０２と、第２の対話データ８０２に含まれる第２の質問８０４及び第２の回答８０６は、第２のドメイン（例えば、ターゲットドメイン）に対応するものであってもよい。この第２の対話データ８０２を入力した文章生成部３４６は、第２の対話データ８０２における第２の質問８０４への第２の回答８０６を含み、第２のドメインに対応する第２の参照文章８２０を生成する。

【0079】

次に、適応部３５０は、文章生成部３４６によって生成された第２のドメインに対応する第２の参照文章８２０と、第２の対話ドメインに対応する第２の対話データ８０２に含まれる第２の質問８０４と、第１のドメインに対応する第１の対話データ（図８に図示せず）に含まれる第１の質問８１２とを回答生成部３４２に入力する。
なお、ここでは、回答生成部３４２について、図４を参照して説明した回答生成部訓練処理４００が既に終了し、回答生成部３４２は、第１のドメインに対応する質問に対して適切な回答を生成することができることを前提としている。ただし、現時点では、回答生成部３４２は、異なるドメイン（例えば、第２のドメイン）については、性能が限定されてしまう。従って、後述する独学処理（Ｓｅｌｆ－ｌｅａｒｎｉｎｇ）及び敵対的学習（ＡｄｖｅｒｓａｒｉａｌＬｅａｒｎｉｎｇ）処理により、回答生成部３４２は、異なるドメインに対応する質問に対しても、適切な回答を生成するように訓練される。
（独学処理）

【0080】

独学処理において、まず、回答生成部３４２は、文章生成部３４６によって生成された第２のドメインに対応する第２の参照文章８２０に基づいて、入力された第２の質問８０４に対する回答として、複数の回答候補を生成する。ここでの回答候補は、第２の参照文章８２０から特定し、第２の質問８０４への適切な回答を示す可能性がある文章箇所（回答インデックス）である。ただし、現時点では、回答生成部３４２は、第２のドメインに対して適切な回答を生成することができるものの、第１のドメインと異なる第２のドメインについてはまだ未訓練であるため、これらの回答候補は、第２の質問８０４への適切な回答でない可能性がある（つまり、これらの回答候補の中には、間違っている回答が含まれている可能性がある）。また、これらの回答候補のそれぞれは、第２の質問８０４に対する適切な回答である確率を示す信用度に対応付けられている。

【0081】

従って、適応部３５０は、回答生成部３４２によって生成された回答候補の中から、信用度が所定の信用度基準を満たし、且つ、回答インデックスの値「０」でないもののみを抽出する。このように回答候補から抽出した回答は、信用度が高く、第２の質問８０４への適切な回答である可能性が高いため、第２のドメインに対応する質問への回答を評価するグラウンドトゥルースとなる第２の回答ラベル８４０として用いられる。

【0082】

次に、適応部３５０は、回答候補の中から抽出した第２の回答ラベル８４０と、文章生成部３４６によって生成された第２の参照文章８２０と、第２のドメインに対応する第２の対話データ８０２に含まれる第２の質問８０４とを対応付けて、第２のドメインに対応する学習データセット（図８に図示せず）として所定の記憶領域に保存する。ただし、この学習データセットと実質的に同様の学習データセットが既に保存されている場合、適応部３５０は、新たに生成した学習データセットを保存しなくてもよい。

【0083】

その後、適応部３５０は、回答生成部３４２によって生成された学習データセットを用いて上述した回答生成部訓練処理４００を回答生成部３４２に対して行い、ＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ等の損失関数によって回答生成部３４２のモデルパラメータを調整することで、回答生成部３４２は、第２のドメインに対応する質問に対して適切な回答を生成する精度が向上する。
これにより、回答生成部３４２は、上述した回答生成部訓練処理４００において回答生成部３４２を訓練するために用いられた第１のドメインに対応する第１の参照文章には含まれていない、新たな情報（つまり、第２のドメインに関する情報）を含む第２の参照文章を用いて訓練されるため、当該新たな情報に関する質問（つまり、第２のドメインに対応する質問）に対しても適切な回答を生成することができるようになる。
（敵対的学習処理）

【0084】

敵対的学習処理において、回答生成部３４２は、第１のドメインに対応する質問と、第２のドメインに対応する質問とを区別するように訓練される。
より具体的には、適応部３５０は、第１のドメインに対応する第１の質問８１２と、第１の質問８１２への回答を含み、第１のドメインに対応する参照文章（図８に図示せず）とを回答生成部３４２に入力した場合に回答生成部３４２となるＭＲＣモデルの最終レイヤの出力である第１のドメイン特徴量（例えば、ＭＲＣモデルがＢＥＲＴモデルの場合、ＢＥＲＴｆｅａｔｕｒｅｓ）を取得する。また、適応部３５０は、第２のドメインに対応する第２の質問８０４と、第２のドメインに対応する第２の参照文章８２０とを回答生成部３４２に入力した場合に回答生成部３４２となるＭＲＣモデルの最終レイヤの出力である第２のドメイン特徴量（例えばレイヤモデルがＢＥＲＴモデルの場合、ＢＥＲＴｆｅａｔｕｒｅｓ）を取得する。

【0085】

その後、適応部３５０は、取得した第１のドメイン特徴量と、第２のドメイン特徴量とを含む特徴量データ８４５を識別ネットワーク８５０に入力する。この識別ネットワーク８５０は、例えば３レイヤのＭｕｌｔｉｌａｙｅｒＮｅｔｗｏｒｋであってもよい。ある実施形態では、この識別ネットワーク８５０は、回答生成部３４２の一部であってもよい。
ある実施形態では、適応部３５０は、第１のドメイン特徴量及び第２のドメイン特徴量に加えて、線形レイヤの出力であるロジットを識別ネットワーク８５０に入力してもよい。

【0086】

識別ネットワーク８５０は、入力した特徴量データ８４５を解析し、それぞれの特徴が第１のドメインに属する確率及び第２のドメインに属する確率を計算する。その後、識別ネットワーク８５０は、計算した確率に基づいて、特徴量データ８４５に含まれる各特徴量に対して、どのドメインに属するかを示すドメインラベル８６０を生成する。

【0087】

その後、適応部３５０は、識別ネットワーク８５０によって生成されたドメインラベル８６０の、それぞれの特徴量が属するドメインを示すグラウンドトゥルース（図８に図示せず）に対する損失をＣｒｏｓｓＥｎｔｒｏｐｙＬｏｓｓ等の損失関数によって計算し、当該損失を減らすように回答生成部３４２のモデルパラメータを調整することで、回答生成部３４２は、第１のドメインに対応する質問及び第２のドメインに対応する質問を区別する精度が向上する。

【0088】

識別ネットワーク８５０を用いるときの学習には、いくつかの異なる実装をとることができる。
まず、識別ネットワーク８５０自体のモデルパラメータを修正する際における、回答生成部３４２のモデルパラメータの修正に関する実装である。第１の実装は、識別ネットワーク８５０のモデルパラメータを修正するときに、回答生成部３４２のモデルパラメータも識別ネットワーク８５０にてドメインを区別しやすくなるように同時に修正する方法である。第２の実装は、識別ネットワーク８５０のモデルパラメータを修正する際には、回答生成部３４２のモデルパラメータを固定しておく方法である。

【0089】

更に、回答生成部３４２のモデルパラメータの修正においても、いくつかの実装をとることができる。第１の実装は、与えられた質問に対して参照文章における回答の位置を正しく推定するように学習する方法であり、ここまで説明した方法のとおりである。第２の実装は、第１の実装に加えて、識別ネットワーク８５０がドメインの識別をしづらくなるような基準も使い回答生成部３４２を学習させる方法である。ここでの基準としては、識別ネットワーク８５０が出力するドメインの出力確率がなるべくドメインによらず均一になるような基準を用いることができる。ただし、識別ネットワーク８５０が正しいドメイン識別をできなくなるような別の基準を用いてもよい。

【0090】

そして、第１の実装の基準で求めた損失と、識別ネットワーク８５０のドメイン識別を難しくする基準で求めた損失を、所定の重みで合算し、この合算した損失を小さくするよう回答生成部３４２のモデルパラメータを更新する。または、モデルパラメータの更新を２段階に分け、第１の実装における損失を小さくする更新と、識別ネットワーク８５０の識別を難しくなる基準で求めた損失を小さくする更新を別の処理で行ってもよい。
以上の実装のうちいずれかを選択するかは、第１のドメインと第２のドメインの間で使われる質問や参照文章の語彙の違いなどにより選んでよい。

【0091】

以上説明した適応処理８００によれば、回答生成部３４２は、入力される質問が対応するドメインを高精度で判別し、判別したドメインに対応する参照文章を用いることで、様々な質問に対する適切な回答を生成することが可能となる。また、上述したように、本開示に係る適応処理８００において、回答生成部３４２を対象のドメインにおいて訓練するための学習データは、回答生成部３４２及び文章生成部３４６によって生成されるため、例えば対象のドメインに対応する対話データ以外の学習データが使用可能でない場合であっても、対象のドメインに対応する質問に対して適切な回答を生成するように回答生成部３４２を訓練することができる。

【0092】

また、本開示の実施形態に係る適応処理８００は、ユーザからの質問を受けた際にリアルタイムで実施されてもよい。より具体的には、第１のドメインに対応する第１の文章に基づいて第１のドメインに対応する質問に対する第１の回答を生成するように訓練されている回答生成部３４２は、第２のドメインに対応する第２の質問（例えば、第１の文章中に回答が存在しない質問）を受け付けた場合、上述した文章生成部３４６は、第２のドメインに対応する第２の対話データ（例えば、過去の対話履歴の中から、第２のドメインに対応するもの）を用いて、第２のドメインに対応する第２の参照文章をリアルタイムで生成してもよい。次に、適応部３５０は、このように生成した第２の参照文章を用いて、上述した適応処理８００を行うことにより、第２のドメインに対応する第２の質問に対する適切な回答を生成するように回答生成部３４２を訓練する。その後、このように訓練された回答生成部３４２は、受け付けた第２の質問に対する第２の回答を、リアルタイムで生成して、その場でユーザに応答してもよい。

【0093】

なお、上述したように、第１のドメイン（例えば、ソースのドメイン）と第２のドメイン（例えば、ターゲットのドメイン）は、異なるドメインであってもよく、同一のドメインであってもよい。
第１のドメインと第２のドメインとが異なる場合には、上述した適応処理８００によれば、回答生成部３４２は、第１のドメイン（例えば「住宅ローン申請」）に対応する質問と、第２のドメイン（例えば「火災保険申請」）に対応する質問の両方に対して適切な回答を生成できるようになるため、回答生成部３４２の対応範囲が幅広くなり、汎用性の高いＭＲＣモデルを得ることができる。
一方、第１のドメインと第２のドメインとが同一である場合には、上述した適応処理８００によれば、回答生成部３４２は、同じドメインに関する新たな情報を学習することができるため、より細かなことに関する質問に対する適切な回答を提供できる、当該ドメインに対してより理解が深いＭＲＣモデルを得ることができる。

【0094】

以上説明した本開示の実施形態によれば、自然言語の会話に基づいて生成した参照文章を用いてＭＲＣモデルを訓練することで、様々な質問に対応できる、柔軟性及びロバスト性が高い対話管理手段を提供することができる。言い換えれば、本開示の実施形態に係る対話管理手段によれば、回答生成部等のＭＲＣモデルは、新たな情報を含む対話データに基づいて生成された参照文章を用いて訓練されるため、以前答えられなかった、当該新たな情報に関する質問に対しても適切な回答を生成することが可能となる。

【0095】

本開示の実施形態に係る対話管理手段の応用場面の例として、例えばオンラインのチャットサポートやコールセンター等が考えられる。オンラインのチャットサポートやコールセンターでは、例えば質問するユーザと、ユーザに対応するスタッフとの間で行われた会話の履歴等の対話データに基づいて、当該会話の内容を含む参照文章を作成した後、当該参照文章を用いてＭＲＣモデルを訓練することで、ＭＲＣモデルの対応範囲を拡張し、様々な話題や情報に関する質問に対する適切な回答を生成することができる。

【0096】

以上、本発明の実施の形態について説明したが、本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

【符号の説明】

【0097】

３００対話管理システム
３１０ユーザ
３２０クライアント端末
３２２受付部
３２４第１の通信部
３２６応答部
３２８ストレージ部
３２９対話データ
３３０通信ネットワーク
３４０対話管理装置
３４２回答生成部
３４４回答生成部訓練部
３４６文章生成部
３４８文章生成部訓練部
３５０適応部
３５２第２の通信部

【図1】