特許7472727 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 新東工業株式会社の特許一覧

特許7472727対話システム、対話ロボット、プログラム、および情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-04-15

(45)【発行日】2024-04-23

(54)【発明の名称】対話システム、対話ロボット、プログラム、および情報処理方法

(51)【国際特許分類】

G10L 15/22 20060101AFI20240416BHJP

G10L 15/10 20060101ALI20240416BHJP

【ＦＩ】

G10L15/22 300U

G10L15/10 500T

【請求項の数】 8

(21)【出願番号】P 2020149403

(22)【出願日】2020-09-04

(65)【公開番号】P2022043901

(43)【公開日】2022-03-16

【審査請求日】2022-12-05

(73)【特許権者】

【識別番号】000191009

【氏名又は名称】新東工業株式会社

(74)【代理人】

【識別番号】110000338

【氏名又は名称】弁理士法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】三谷純司

【審査官】山下剛史

(56)【参考文献】

【文献】特開２００２－３２３７０（ＪＰ，Ａ）

【文献】特開２００６－１９５６３７（ＪＰ，Ａ）

【文献】池田智志他，マルチドメインシステムにおけるトピック推定と対話履歴の統合によるドメイン選択の高精度化，情報処理学会研究報告，2007年12月，Vol.2007，No.129，pp.277-282

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１３／００－１５／３４

(57)【特許請求の範囲】

【請求項1】

１または複数のプロセッサを備えた対話システムであって、
前記１または複数のプロセッサは、
ユーザが発話した第１のユーザ音声に基づいて話題を推定する推定処理と、
前記第１のユーザ音声に応答する応答音声を生成する生成処理と、
前記応答音声の出力に対応して前記ユーザが発話した第２のユーザ音声が、否定的な内容を示すか否かに基づいて、前記推定処理により推定した話題が正しいか否かを判断する判断処理と、を実行し、
前記判断処理により正しいと判断された話題が所定条件を満たす場合、前記ユーザに関する情報を外部に送信する送信処理をさらに実行する、
ことを特徴とする対話システム。

【請求項2】

前記１または複数のプロセッサは、
特定の話題で用いられる正解キーワードと、当該正解キーワードに類似する類似キーワードとを関連付けた類似キーワードデータベースを参照し、
前記第１のユーザ音声の音声認識結果に含まれる前記類似キーワードを、前記類似キーワードデータベースにおいて当該類似キーワードに関連付けられた正解キーワードに置換する置換処理をさらに実行し、
置換後の前記音声認識結果に基づいて前記推定処理および前記生成処理を実行する、ことを特徴とする請求項１に記載の対話システム。

【請求項3】

前記１または複数のプロセッサは、
前記特定の話題を含む複数の話題の各々に関連付けられた前記類似キーワードデータベースを参照し、
前記推定処理において、前記複数の話題の何れかを推定する、
ことを特徴とする請求項２に記載の対話システム。

【請求項4】

前記１または複数のプロセッサは、
前記第１のユーザ音声をメモリに記録する記録処理をさらに実行し、
前記送信処理において、前記メモリに記録した前記第１のユーザ音声に対するアクセス情報を、前記ユーザに関する情報に含めて送信する、
ことを特徴とする請求項１から３の何れか１項に記載の対話システム。

【請求項5】

前記１または複数のプロセッサは、
前記推定処理において、前記話題として健康に関連する話題を推定する、
ことを特徴とする請求項１から４の何れか１項に記載の対話システム。

【請求項6】

請求項１から５の何れか１項に記載の対話システムに含まれる対話ロボットであって、前記１または複数のプロセッサの何れかを備え、
前記対話ロボットが備えるプロセッサは、
前記第１のユーザ音声および前記第２のユーザ音声を取得する音声取得処理と、前記応答音声を出力する音声出力処理とを少なくとも実行する、
ことを特徴とする対話ロボット。

【請求項7】

請求項１から５の何れか１項に記載の対話システムを動作させるためのプログラムであって、前記１または複数のプロセッサに前記各処理を実行させるプログラム。

【請求項8】

１または複数のプロセッサが、ユーザが発話した第１のユーザ音声に基づいて話題を推定する推定ステップと、
前記１または複数のプロセッサが、前記第１のユーザ音声に応答する応答音声を生成する生成ステップと、
前記１または複数のプロセッサが、前記応答音声の出力に対応して前記ユーザが発話した第２のユーザ音声が、否定的な内容を示すか否かに基づいて、前記推定ステップにより推定した話題が正しいか否かを判断する判断ステップと、を含み、
前記判断ステップにおいて正しいと判断された話題が所定条件を満たす場合、前記１または複数のプロセッサは、前記ユーザに関する情報を外部に送信する、
ことを特徴とする情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ユーザと対話する技術に関する。

【背景技術】

【0002】

ユーザと対話する技術が知られている。例えば、特許文献１には、話題の種類に応じて階層的に構成された複数個の言語モデルを用いて、入力音声に対応する話題を推定する技術が記載されている。当該技術は、入力音声の仮の認識結果および各言語モデル間の類似度と、認識結果の信頼度と、階層の深さとに基づいて、１つの言語モデルを選択することにより話題を推定する。

【先行技術文献】

【特許文献】

【0003】

【文献】特許第５２１２９１０号（２０１３年３月８日公開）

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１に記載された技術は、仮の認識結果が誤っていると、話題推定の精度が低くなる。このため、当該技術は、実際の話題と異なる話題を推定してしまう可能性があり、話題の推定精度において改善の余地がある。

【0005】

本発明の一態様は、ユーザとの対話において、話題の推定精度を向上させる技術を実現することを目的とする。

【課題を解決するための手段】

【0006】

上記の課題を解決するために、本発明の一態様に係る対話システムは、１または複数のプロセッサを備える。前記１または複数のプロセッサは、推定処理と、生成処理と、判断処理とを実行する。また、本発明の一態様に係る情報処理方法は、１または複数のプロセッサが実行する情報処理方法である。当該情報処理方法は、推定ステップと、生成ステップと、判断ステップとを含む。

【0007】

推定処理（推定ステップ）において、前記１または複数のプロセッサは、ユーザが発話した第１のユーザ音声に基づいて話題を推定する。生成処理（生成ステップ）において、前記１または複数のプロセッサは、前記第１のユーザ音声に応答する応答音声を生成する。判断処理（判断ステップ）において、前記１または複数のプロセッサは、前記応答音声の出力に対応して前記ユーザが発話した第２のユーザ音声が、否定的な内容を示すか否かに基づいて、前記推定処理により推定した話題が正しいか否かを判断する。

【発明の効果】

【0008】

本発明の一態様によれば、ユーザとの対話において、話題の推定精度を向上させる技術を実現することができる。

【図面の簡単な説明】

【0009】

【図1】本発明の一実施形態に係る対話システムの構成を示すブロック図である。

【図2】本発明の一実施形態に係る情報処理方法の流れを示すフローチャートである。

【図3】図２に示す情報処理方法が含む推定処理の詳細な流れを示すフローチャートである。

【図4】本発明の一実施形態における類似キーワードデータベースの具体例を示す図である。

【図5】本発明の一実施形態に係る対話システムの適用例を説明する図である。

【発明を実施するための形態】

【0010】

以下、本発明の一実施形態について、図面を参照して説明する。

【0011】

＜対話システムの概要＞
対話システム１は、ユーザが発話したユーザ音声を取得し、取得したユーザ音声に応答する応答音声を生成して出力することにより、ユーザと対話するシステムである。対話システム１は、第１のユーザ音声に基づいて話題を推定する。また、対話システム１は、推定した話題の正誤を、第２のユーザ音声が否定的な内容を示すか否かに基づいて判断する。第２のユーザ音声は、第１のユーザ音声に応答する応答音声の出力に対応してユーザが発話した音声である。本実施形態では、対話システム１が対象とするユーザは、被介護者または高齢者等である。対話システム１は、これらのユーザと対話する用途で用いられる。ただし、対話システム１が対象とするユーザは、これらの例に限定されない。

【0012】

＜対話システム１の構成＞
対話システム１の構成について、図１を参照して説明する。図１は、本発明の一実施形態に係る対話システム１の構成を示すブロック図である。図１に示すように、対話システム１は、対話ロボット１０と、サーバ２０とを含む。

【0013】

（対話ロボット１０の構成）
対話ロボット１０の構成について、図１を参照して説明する。図１に示すように、対話ロボット１０は、コントローラ１１０と、マイク１２０と、スピーカ１３０とを含む。例えば、対話ロボット１０が顔部（不図示）を有する場合、マイク１２０およびスピーカ１３０は、顔部に含まれていてもよい。

【0014】

コントローラ１１０は、対話ロボット１０全体の動作を制御する。コントローラ１１０は、プロセッサ１１と、一次メモリ１２と、二次メモリ１３と、通信インタフェース１４と、入出力インタフェース１５とを含む。プロセッサ１１、一次メモリ１２、二次メモリ１３、通信インタフェース１４、および入出力インタフェース１５は、バスを介して相互に接続されている。

【0015】

二次メモリ１３には、プログラムＰ１が格納されている。プログラムＰ１は、後述する情報処理方法Ｓの少なくとも一部をプロセッサ１１に実行させるためのプログラムである。プロセッサ１１は、二次メモリ１３に格納されているプログラムＰ１を一次メモリ１２上に展開する。そして、プロセッサ１１は、一次メモリ１２上に展開されたプログラムＰ１に含まれる命令に従って、情報処理方法Ｓに含まれる各ステップを実行する。

【0016】

プロセッサ１１として利用可能なデバイスとしては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、マイクロコントローラ、又は、これらの組み合わせを挙げることができる。プロセッサ１１は、「演算装置」と呼ばれることもある。

【0017】

また、一次メモリ１２として利用可能なデバイスとしては、例えば、半導体ＲＡＭ（Random Access Memory）を挙げることができる。一次メモリ１２は、「主記憶装置」と呼ばれることもある。また、二次メモリ１３として利用可能なデバイスとしては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、ＯＤＤ（Optical Disk Drive）、ＦＤＤ（Floppy（登録商標） Disk Drive）、又は、これらの組み合わせを挙げることができる。二次メモリ１３は、「補助記憶装置」と呼ばれることもある。なお、二次メモリ１３は、コントローラ１１０に内蔵されていてもよいし、通信インタフェース１４または入出力インタフェース１５を介してコントローラ１１０（対話ロボット１０）と接続された他のコンピュータ（例えば、サーバ２０）に内蔵されていてもよい。なお、本実施形態においては、コントローラ１１０における記憶を２つのメモリ（一次メモリ１２および二次メモリ１３）により実現しているが、これに限定されない。すなわち、コントローラ１１０における記憶を１つのメモリにより実現してもよい。この場合、例えば、そのメモリの或る記憶領域を一次メモリ１２として利用し、そのメモリの他の記憶領域を二次メモリ１３として利用すればよい。

【0018】

通信インタフェース１４には、ネットワークＮ１を介して他のコンピュータが有線接続又は無線接続される。ここでは、他のコンピュータとして、少なくとも、サーバ２０が接続される。通信インタフェース１４としては、例えば、イーサネット（登録商標）、Ｗｉ－Ｆｉ（登録商標）などのインタフェースが挙げられる。利用可能なネットワークとしては、ＰＡＮ（Personal Area Network）、ＬＡＮ（Local Area Network）、ＣＡＮ（Campus Area Network）、ＭＡＮ（Metropolitan Area Network）、ＷＡＮ（Wide Area Network）、ＧＡＮ（Global Area Network）、又は、これらのネットワークを含むインターネットワークが挙げられる。インターネットワークは、イントラネットであってもよいし、エクストラネットであってもよいし、インターネットであってもよい。

【0019】

入出力インタフェース１５には、マイク１２０およびスピーカ１３０が接続される。入出力インタフェース１５としては、例えば、ＵＳＢ（Universal Serial Bus）、ＡＴＡ（Advanced Technology Attachment）、ＳＣＳＩ（Small Computer System Interface）、ＰＣＩ（Peripheral Component Interconnect）などのインタフェースが挙げられる。

【0020】

（サーバ２０の構成）
サーバ２０の構成について、図１を参照して説明する。図１に示すように、サーバ２０は、プロセッサ２１と、一次メモリ２２と、二次メモリ２３と、通信インタフェース２４とを含む。プロセッサ２１、一次メモリ２２、二次メモリ２３、および通信インタフェース２４は、バスを介して相互に接続されている。

【0021】

二次メモリ２３には、プログラムＰ２、複数の話題キーワードデータベース（ＤＢ）２３１、複数の類似キーワードデータベース（ＤＢ）２３２、および音声データベース（ＤＢ）２３３が格納されている。これらのＤＢ２３１～２３３の詳細については後述する。プログラムＰ２は、後述する情報処理方法Ｓの少なくとも一部をプロセッサ２１に実行させるためのプログラムである。プロセッサ２１は、二次メモリ２３に格納されているプログラムＰ２を一次メモリ２２上に展開する。そして、プロセッサ２１は、一次メモリ２２上に展開されたプログラムＰ２に含まれる命令に従って、情報処理方法Ｓに含まれる各ステップを実行する。

【0022】

プロセッサ２１として利用可能なデバイスとしては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、マイクロコントローラ、又は、これらの組み合わせを挙げることができる。プロセッサ２１は、「演算装置」と呼ばれることもある。

【0023】

また、一次メモリ２２として利用可能なデバイスとしては、例えば、半導体ＲＡＭ（Random Access Memory）を挙げることができる。一次メモリ２２は、「主記憶装置」と呼ばれることもある。また、二次メモリ２３として利用可能なデバイスとしては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、ＯＤＤ（Optical Disk Drive）、ＦＤＤ（Floppy（登録商標） Disk Drive）、又は、これらの組み合わせを挙げることができる。二次メモリ２３は、「補助記憶装置」と呼ばれることもある。なお、二次メモリ２３は、サーバ２０に内蔵されていてもよいし、通信インタフェース２４を介してサーバ２０と接続された他のコンピュータ（例えば、クラウドサーバを構成するコンピュータ）に内蔵されていてもよい。なお、本実施形態においては、サーバ２０における記憶を２つのメモリ（一次メモリ２２および二次メモリ２３）により実現しているが、これに限定されない。すなわち、サーバ２０における記憶を１つのメモリにより実現してもよい。この場合、例えば、そのメモリの或る記憶領域を一次メモリ２２として利用し、そのメモリの他の記憶領域を二次メモリ２３として利用すればよい。

【0024】

通信インタフェース２４には、ネットワークＮ１を介して他のコンピュータが有線接続又は無線接続される。ここでは、他のコンピュータとして、少なくとも、対話ロボット１０が接続される。通信インタフェース２４としては、例えば、イーサネット（登録商標）、Ｗｉ－Ｆｉ（登録商標）などのインタフェースが挙げられる。利用可能なネットワークとしては、ＰＡＮ（Personal Area Network）、ＬＡＮ（Local Area Network）、ＣＡＮ（Campus Area Network）、ＭＡＮ（Metropolitan Area Network）、ＷＡＮ（Wide Area Network）、ＧＡＮ（Global Area Network）、又は、これらのネットワークを含むインターネットワークが挙げられる。インターネットワークは、イントラネットであってもよいし、エクストラネットであってもよいし、インターネットであってもよい。

【0025】

＜情報処理方法Ｓの流れ＞
対話システム１が実行する情報処理方法Ｓについて、図２を参照して説明する。図２は、情報処理方法Ｓの流れを示すフローチャートである。図２において、左図は、プロセッサ１１（対話ロボット１０）が実行する処理を示し、右図は、プロセッサ２１（サーバ２０）が実行する処理を示す。図２に示すように、情報処理方法Ｓは、ステップＳ１０１からＳ１１４までを含む。

【0026】

（ステップＳ１０１）
ステップＳ１０１において、対話ロボット１０のプロセッサ１１は、マイク１２０を介して入力される音声を、第１のユーザ音声として取得する音声取得処理を実行する。また、プロセッサ１１は、取得した第１のユーザ音声を、一次メモリ１２または二次メモリ１３に一時的に記憶する。

【0027】

（ステップＳ１０２）
ステップＳ１０２において、プロセッサ１１は、第１のユーザ音声に対する音声認識処理を実行する。音声認識処理による音声認識結果は、第１のユーザ音声に対応するテキスト情報である。なお、音声認識処理としては、公知の技術を適用可能である。例えば、プロセッサ１１は、二次メモリ１３に記憶された公知の音声認識プログラムを読み込んで実行してもよいし、クラウドサーバ（不図示）が提供する音声認識サービスを利用してもよい。

【0028】

（ステップＳ１０３～Ｓ１０４）
ステップＳ１０３において、プロセッサ１１は、第１のユーザ音声に基づいて話題を推定する推定処理を実行する。推定処理は、ステップＳ１０２における音声認識結果を用いて実行される。当該ステップの実行により、第１のユーザ音声に含まれるキーワードが特定されるとともに、第１のユーザ音声に関連する話題が推定される。プロセッサ１１は、ステップＳ１０３を実行するためにサーバ２０に対して問い合わせを行う。ステップＳ１０４においてサーバ２０は、複数の話題キーワードＤＢ２３１および複数の類似キーワードＤＢ２３２を検索することにより問い合わせに応答する。ステップＳ１０３～Ｓ１０４の詳細については後述する。

【0029】

（ステップＳ１０５）
ステップＳ１０５において、プロセッサ１１は、第１のユーザ音声に応答する応答音声を生成する生成処理を実行する。具体的には、プロセッサ１１は、第１のユーザ音声の音声認識結果であるテキスト情報を用いて、応答用のテキスト情報を生成する。また、プロセッサ１１は、応答用のテキスト情報から、音声合成技術を用いて応答音声を生成する。

【0030】

（応答音声の具体例）
ここで、応答音声の具体例について説明する。例えば、プロセッサ１１は、第１のユーザ音声に含まれるキーワードの復唱を含む応答音声、または当該キーワードに関連する質問を含む応答音声を生成する。復唱とは、当該キーワードを繰り返すことである。また、当該キーワードに関連する質問とは、第１のユーザ音声の内容を掘り下げる質問であることが望ましい。

【0031】

例えば、第１のユーザ音声の音声認識結果としてテキスト情報「今日はいい天気です」が得られているとする。また、当該音声認識結果からキーワードとして「いい」および「天気」が特定されているとする。この場合、プロセッサ１１は、これらのキーワードの復唱を含む応答音声「いい天気ですね」を生成する。

【0032】

また、例えば、第１のユーザ音声認識結果としてテキスト情報「昨日は公園に行ったんですよ」が得られているとする。また、当該音声認識結果から、キーワードとして「公園」および「行った」が特定されているとする。この場合、プロセッサ１１は、これらのキーワードに関連する質問を含む応答音声「どこの公園に行ったんですか」を生成する。

【0033】

（ステップＳ１０６）
ステップＳ１０６において、プロセッサ１１は、応答音声をスピーカ１３０から出力する音声出力処理を実行する。

【0034】

（ステップＳ１０７）
ステップＳ１０７において、プロセッサ１１は、マイク１２０を介して入力される音声を、第２のユーザ音声として取得する音声取得処理を実行する。

【0035】

（ステップＳ１０８）
ステップＳ１０８において、プロセッサ１１は、第２のユーザ音声に対する音声認識処理を実行する。音声認識処理による音声認識結果は、第２のユーザ音声に対応するテキスト情報である。

【0036】

（ステップＳ１０９）
ステップＳ１０９において、プロセッサ１１は、第２のユーザ音声が否定的な内容を示すかを判断する。

【0037】

（否定判断処理の具体例１）
例えば、プロセッサ１１は、第２のユーザ音声が否定的な内容を示すか否かの否定判断処理を、上述した音声認識結果に基づき実行する。具体的には、プロセッサ１１は、第２のユーザ音声の音声認識結果に否定的なキーワードが含まれる場合、第２のユーザ音声が否定的な内容を示すと判断する。否定的なキーワードの一例としては、「いや」、「違う」、「そうじゃない」等が挙げられるが、これらに限られない。この場合、例えば、二次メモリ１３は、否定的なキーワードをあらかじめ記憶しておく。プロセッサ１１は、第２のユーザ音声の音声認識結果、および二次メモリ１３に記憶された否定的なキーワードを参照して、当該否定判断処理を行う。

【0038】

（否定判断処理の具体例２）
また、プロセッサ１１は、上述した否定判断処理を、具体例１で述べた音声認識結果に基づく手法に替えて、または、加えて、他の手法を用いて実行してもよい。具体例２は、他の手法の一例であり、ユーザのジェスチャまたは表情に基づき否定判断処理を行う手法である。例えば、否定的なジェスチャとして、首を横に振る等が挙げられる。また、否定的な表情として、口角が下がる等が挙げられる。例えば、プロセッサ１１は、カメラ（不図示）を用いて、第２のユーザ音声を発話しているユーザを撮影した画像を取得する。また、プロセッサ１１は、取得した画像を解析することにより、当該画像が否定的なジェスチャの特徴または否定的な表情の特徴を示すか否かを判断する。この場合、例えば、二次メモリ１３は、画像における否定的なジェスチャの特徴または表情の特徴をあらかじめ記憶しておく。プロセッサ１１は、第２のユーザ音声を発話しているユーザを撮影した画像、および二次メモリ１３に記憶された特徴を参照して、当該否定判断処理を行う。

【0039】

（ステップＳ１１０）
ステップＳ１０９でＹｅｓの場合、ステップＳ１１０において、プロセッサ１１は、第１のユーザ音声に関連する話題は、他の話題であると判断する。他の話題とは、ステップＳ１０３で推定した話題以外の話題である。換言すると、プロセッサ１１は、ステップＳ１０３で推定した話題が正しくないと判断する。例えば、このとき、プロセッサ１１は、推定した話題が誤っていたことを示す応答音声を出力してもよい。そのような応答音声の具体例としては、「すみません、間違えました」等があるが、これに限られない。

【0040】

プロセッサ１１は、ステップＳ１１０を実行すると、情報処理方法Ｓを終了する。なお、プロセッサ１１は、情報処理方法Ｓを終了する前に、一次メモリ１２または二次メモリ１３から、一時的に記憶していた第１のユーザ音声を消去する。また、例えば、プロセッサ１１は、情報処理方法Ｓを終了した後、再度情報処理方法Ｓを繰り返してもよい。

【0041】

（ステップＳ１１１）
ステップＳ１０９でＮｏの場合、ステップＳ１１１において、プロセッサ１１は、ステップＳ１０３で推定した話題が正しいと判断する。

【0042】

（ステップＳ１１２）
ステップＳ１１２において、プロセッサ１１は、推定した話題が所定条件を満たすか否かを判断する。本実施形態では、所定条件とは、「話題が健康に関連する」との条件である。

【0043】

ステップＳ１１２でＮｏの場合、情報処理方法Ｓは終了する。なお、プロセッサ１１は、情報処理方法Ｓを終了する前に、一次メモリ１２または二次メモリ１３から、一時的に記憶していた第１のユーザ音声を消去する。また、例えば、プロセッサ１１は、情報処理方法Ｓを終了した後、再度情報処理方法Ｓを繰り返してもよい。

【0044】

（ステップＳ１１３～Ｓ１１４）
ステップＳ１１２でＹｅｓの場合、ステップＳ１１３において、プロセッサ１１は、一次記憶していた第１のユーザ音声をサーバ２０に送信することにより、当該第１のユーザ音声の記録を要求する。ステップＳ１１４において、サーバ２０のプロセッサ２１は、受信した第１のユーザ音声を音声ＤＢ２３３に記録する記録処理を実行する。プロセッサ２１は、音声ＤＢ２３３に記録した第１のユーザ音声に対するアクセス情報を、対話ロボット１０に送信する。音声ＤＢ２３３に記録された第１のユーザ音声は、アクセス情報を用いてアクセスされることにより、ダウンロード、再生、またはその両方が可能である。プロセッサ１１は、アクセス情報を受信すると、一次メモリ１２または二次メモリ１３から、一時的に記憶していた第１のユーザ音声を消去する。

【0045】

（音声ＤＢ２３３）
音声ＤＢ２３３は、第１のユーザ音声を格納する。また、音声ＤＢ２３３は、第１のユーザ音声に関連付けて、関連情報を格納してもよい。関連情報の一例としては、日時、第１のユーザ音声に含まれるキーワード、推定処理により推定した話題、ユーザの識別情報、および対話ロボット１０の現在位置等が挙げられる。この場合、ステップＳ１１３において、対話ロボット１０のプロセッサ１１は、第１のユーザ音声とともに関連情報をサーバ２０に送信する。サーバ２０のプロセッサ２１は、対話ロボット１０から受信したこれらの情報を関連付けて音声ＤＢに記録する。

【0046】

（ステップＳ１１５）
ステップＳ１１５において、プロセッサ１１は、ユーザに関する情報を外部に送信する送信処理を実行する。ユーザに関する情報は、第１のユーザ音声に対するアクセス情報を含む。また、ユーザに関する情報は、第１のユーザ音声に関連付けて音声ＤＢに記憶した関連情報を含んでいてもよい。ユーザに関する情報の送信先の一例としては、ユーザの健康を管理する管理者（家族、介護者、または主治医等）が挙げられるが、これに限られない。また、ユーザに関する情報の送信手段の一例としては、電子メールが挙げられるが、これに限られない。例えば、二次メモリ１３は、あらかじめ、送信先および送信手段を示す情報を記憶している。

【0047】

（話題推定処理の詳細）
次に、ステップＳ１０３～Ｓ１０４における話題の推定処理の詳細について、図３を参照して説明する。図３は、話題の推定処理の詳細な流れを示すフローチャートである。図３に示すように、話題の推定処理は、ステップＳ２０１～Ｓ２０６を含む。

【0048】

（ステップＳ２０１）
ステップＳ２０１において、対話ロボット１０のプロセッサ１１は、第１のユーザ音声の音声認識結果から、１または複数のキーワードを抽出する。キーワードの抽出処理には、例えば、公知の自然言語処理の技術（例えば、形態素解析等）を適用可能である。

【0049】

（ステップＳ２０２）
ステップＳ２０２において、プロセッサ１１は、抽出した各キーワードが複数の話題キーワードＤＢ２３１のうち何れに含まれるかに基づいて、話題を推定する。当該ステップの処理を実行するため、プロセッサ１１は、各キーワードを含む話題キーワードＤＢ２３１をサーバ２０に問い合わせ、サーバ２０は、問い合わせに応答する。

【0050】

（話題キーワードＤＢ２３１）
ここで、話題キーワードＤＢ２３１について説明する。サーバ２０の二次メモリ２３は、複数の話題の各々に関連付けて話題キーワードＤＢ２３１を記憶している。各話題キーワードＤＢ２３１は、当該話題において用いられる１以上のキーワードを含む。同一のキーワードが、複数の話題キーワードＤＢ２３１に含まれていてもよい。複数の話題には、「健康に関連する話題」が含まれる。「健康に関連する話題」とは、例えば、体調または病気に関連する話題を含む。その他、複数の話題には、例えば、「オレオレ詐欺などの特殊詐欺にあっていることを想起させる話題」、および「人間関係に関する話題」等が含まれていてもよいが、これらに限られない。

【0051】

（キーワードを含む話題キーワードＤＢ２３１が１つの場合）
プロセッサ１１は、抽出した１または複数のキーワードが１つの話題キーワードＤＢ２３１に含まれる場合、当該話題キーワードＤＢ２３１に関連付けられた話題を、第１ユーザ音声に関連する話題として推定する。このようなケースとして、抽出したキーワードが１つであり、かつ、当該キーワードを含む話題キーワードＤＢ２３１が１つの場合がある。また、このようなケースとして、複数のキーワードが抽出され、かつ、各キーワードを含む話題キーワードＤＢ２３１が全て同一の場合がある。

【0052】

（キーワードを含む話題キーワードＤＢ２３１が複数の場合）
また、プロセッサ１１は、抽出した１または複数のキーワードが複数の話題キーワードＤＢ２３１に含まれる場合、そのうち何れかに関連付けられた話題を、第１ユーザ音声に関連する話題として推定する。このようなケースとして、抽出したキーワードが１つであり、かつ、当該キーワードが複数の話題キーワードＤＢ２３１に含まれる場合がある。また、このようなケースとして、複数のキーワードが抽出され、そのうち少なくとも２つが互いに異なる話題キーワードＤＢ２３１に含まれる場合がある。

【0053】

例えば、プロセッサ１１は、該当する複数の話題キーワードＤＢに関連付けられた話題のうち、所定のルールに基づいて何れかの話題を選択する。プロセッサ１１は、選択した話題を、第１のユーザ音声に関連する話題として推定する。所定のルールの具体例としては、（１）話題の固定的な優先順位、（２）話題の動的な優先順位、および（３）キーワードの個数が挙げられるが、これらに限られない。

【0054】

（１）話題の固定的な優先順位に基づく場合、二次メモリ１３は、複数の話題間に定められた固定的な優先順位をあらかじめ記憶しておく。プロセッサ１１は、該当する複数の話題キーワードＤＢに関連付けられた話題のうち、固定的な優先順位が最も高いものを選択する。

【0055】

（２）話題の動的な優先順位に基づく場合、二次メモリ１３は、過去に実行されたステップＳ１１１で正しいと判断された話題の履歴を記憶しておく。プロセッサ１１は、話題の履歴に応じて話題の優先順位を動的に変化させる。プロセッサ１１は、該当する複数の話題キーワードＤＢ２３１に関連付けられた話題のうち、動的な優先順位が最も高いものを選択する。例えば、プロセッサ１１は、直近のステップＳ１１１で正しいと判断された話題の優先順位を最も高くしてもよい。また、プロセッサ１１は、直近の所定回数または直近の所定期間中におけるステップＳ１１１で正しいと判断された回数が多い順に話題の優先順位を高くしてもよい。

【0056】

（３）キーワードの個数に基づく場合、プロセッサ１１は、該当する複数の話題キーワードＤＢ２３１のうち、抽出されたキーワードを最も多く含むものを選択する。

【0057】

（ステップＳ２０３）
ステップＳ２０３において、プロセッサ１１は、ステップＳ２０２において話題が推定されたか否かを判断する。例えば、抽出した１または複数のキーワードを含む話題キーワードＤＢ２３１が１つも無い場合、プロセッサ１１は、話題が推定されなかったと判断する。

【0058】

（ステップＳ２０３でＹｅｓの場合）
ステップＳ２０３でＹｅｓの場合、プロセッサ１１は、ステップＳ１０３における話題の推定処理を終了する。これにより、ステップＳ１０３で特定したキーワードとして、ステップＳ２０１で抽出した１または複数のキーワードが適用される。また、ステップＳ１０３で推定した話題として、ステップＳ２０２で推定した話題が適用される。

【0059】

（ステップＳ２０３でＮｏの場合）
ステップＳ２０３でＮｏの場合、プロセッサ１１は、ステップＳ２０４からの処理を実行する。

【0060】

（ステップＳ２０４）
ステップＳ２０４において、プロセッサ１１は、抽出した各キーワードが、類似キーワードであるか否かを判断する。当該ステップの処理を実行するため、プロセッサ１１は、各キーワードを類似キーワードとして含む話題キーワードＤＢ２３１をサーバ２０に問い合わせ、サーバ２０は、問い合わせに応答する。

【0061】

（類似キーワードＤＢ２３２）
ここで、類似キーワードＤＢ２３２について説明する。サーバ２０の二次メモリ２３は、複数の話題の各々に関連付けて、類似キーワードＤＢ２３２を記憶している。各類似キーワードＤＢ２３２は、当該話題で用いられる正解キーワードと、当該正解キーワードに類似する類似キーワードとを関連付けて格納している。類似キーワードは、正解キーワードを発話したユーザ音声に対する音声認識により、誤認識される可能性が高いキーワードである。

【0062】

図４は、類似キーワードＤＢ２３２の具体例を示す図である。図４に示すように、正解キーワード「痛い」に対して、類似キーワード「イッタイ（一体）」、「イッタ（行った）」、「イタ（居た）」、および「タイ」がそれぞれ関連付けられている。例えば、これらの類似キーワードは、「痛い」と発話したユーザ音声に対する音声認識処理によって得られた、「痛い」とは異なるキーワードである。

【0063】

なお、図４に示す正解キーワード「痛い」は、例えば、「健康に関連する話題」において用いられるキーワードであり、当該話題に関連付けられた話題キーワードＤＢ２３１に含まれている。

【0064】

（ステップＳ２０４でＮｏの場合）
ステップＳ２０４でＮｏの場合、プロセッサ１１は、図２のステップＳ１１０を実行し、第１のユーザ音声に関連する話題は、他の話題であると判断する。他の話題とは、ここでは、複数の話題キーワードＤＢ２３１に関連付けられた話題の何れでもない話題である。この場合、プロセッサ１１は、情報処理方法Ｓを終了し、その後、例えば、再度情報処理方法Ｓを実行してもよい。

【0065】

（ステップＳ２０４でＹｅｓの場合）
ステップＳ２０４でＹｅｓの場合、プロセッサ１１は、ステップＳ２０５の処理を実行する。

【0066】

（ステップＳ２０５）
ステップＳ２０５において、プロセッサ１１は、第１のユーザ音声の音声認識結果に含まれる類似キーワードを、類似キーワードＤＢ２３２において当該類似キーワードに関連付けられた正解キーワードに置換する。つまり、プロセッサ１１は、第１のユーザ音声の音声認識結果から抽出した１または複数のキーワードのうち、誤認識である可能性が高い類似キーワードを正解キーワードに置換する。

【0067】

なお、ステップＳ２０４において、抽出されたあるキーワードが、類似キーワードとして複数の類似キーワードＤＢ２３２に含まれると判定される場合がある。この場合、プロセッサ１１は、該当する複数の類似キーワードＤＢ２３２のうち、所定のルールに基づいて何れかを選択する。また、プロセッサ１１は、選択した類似キーワードＤＢ２３２を用いて、上述した置換処理を実行すればよい。なお、複数の類似キーワードＤＢ２３２から何れかを選択するルールの具体例としては、ステップＳ２０２で説明した所定のルールと同様、（１）話題の固定的な優先順位、（２）話題の動的な優先順位、および（３）キーワードの個数が挙げられるが、これらに限られない。

【0068】

例えば、第１のユーザ音声の音声認識結果から、２つのキーワード「頭」および「一体」が抽出されたとする。ここで、２つのキーワードのうち「一体」は、類似キーワードである。また、当該類似キーワード「一体」には、正解キーワード「痛い」が関連付けられている。このため、プロセッサ１１は、音声認識結果に含まれる類似キーワード「一体」を正解キーワード「痛い」に置換する。これにより、置換後の音声認識結果は、２つのキーワード「頭」および「痛い」を含む。

【0069】

（ステップＳ２０６）
ステップＳ２０６において、プロセッサ１１は、置換後の音声認識結果に基づいて、話題を推定する処理を実行する。話題を推定する処理については、ステップＳ２０２の処理と同様である。ただし、置換前の音声認識結果の代わりに、置換後の音声認識結果に含まれる各キーワードを用いる点が異なる。

【0070】

ステップＳ２０６の処理を実行すると、プロセッサ１１は、ステップＳ１０３における話題の推定処理を終了する。これにより、ステップＳ１０３で特定したキーワードとして、置換後の音声認識結果に含まれる１または複数のキーワードが適用される。また、ステップＳ１０３で推定した話題として、ステップＳ２０６で推定した話題が適用される。

【0071】

その後の図２のステップＳ１０５では、プロセッサ１１は、置換後の音声認識結果に基づいて、応答音声を生成する。例えば、前述の例では、置換後の音声認識結果には、２つのキーワード「頭」および「痛い」が含まれている。この場合、ステップＳ１０５において、プロセッサ１１は、キーワードを復唱する応答音声「頭が痛いのですか？」を生成する。

【0072】

このように、図２のステップＳ１０３における話題の推定処理では、プロセッサ１１は、複数の話題の何れかを推定する。

【0073】

以上で、対話システム１が実行する情報処理方法Ｓの流れの説明を終了する。

【0074】

＜適用例＞
対話システム１の適用例について、図５を参照して説明する。図５は、対話システム１の適用例を説明する図である。図５に示す対話ロボット１０は、被介護者との対話を行う用途で、被介護者の傍らに配置される。図５に示すように、対話ロボット１０、被介護者、および介護者は、以下のステップＮ１～Ｎ７を実行する。

【0075】

（ステップＮ１：被介護者による発話）
被介護者は、「頭が痛い」と発話する。

【0076】

（ステップＮ２：対話ロボット１０による話題の推定）
対話ロボット１０は、被介護者が発話した音声を第１のユーザ音声として取得する。また、対話ロボット１０は、第１のユーザ音声の音声認識結果「頭が一体」に対して、類似キーワードＤＢ２３２を用いて置換処理を行う。これにより、置換後の音声認識結果は、キーワード「頭」および「痛い」を含む。また、当該キーワード「頭」および「痛い」は、「健康に関連する話題」に関連付けられた話題キーワードＤＢ２３１に含まれるとする。そこで、対話ロボット１０は、「健康に関連する話題」を推定する（図２のステップＳ１０１～Ｓ１０４）。

【0077】

（ステップＮ３：対話ロボット１０による応答）
対話ロボット１０は、置換後の音声認識結果に含まれるキーワード「頭」および「痛い」を用いて、これらのキーワードを復唱する応答音声「頭が痛いのですか？」を生成して出力する（ステップＳ１０５～Ｓ１０６）。

【0078】

（ステップＮ４：被介護者による否定応答）
対話ロボット１０の応答音声に対して、被介護者が「違う」等と否定応答した場合について説明する。この場合、対話ロボット１０は、被介護者の否定応答を第２のユーザ音声として取得する。また、対話ロボット１０は、第２のユーザ音声が否定的な内容を示すため、被介護者の話題は「健康に関連する話題」以外であると判断する。また、対話ロボット１０は、「すみません、間違えました」等といった音声を出力する（ステップＳ１０７～Ｓ１０９、Ｓ１１０）。続いて、ステップＮ１からの動作が繰り返される。

【0079】

（ステップＮ５：被介護者による肯定応答）
対話ロボット１０の応答音声に対して、被介護者が「そう」等と肯定応答した場合について説明する。対話ロボット１０は、被介護者の肯定応答を第２のユーザ音声として取得する。また、対話ロボット１０は、第２のユーザ音声が否定的な内容を示していないため、推定した「健康に関連する話題」が正しいと判断する（ステップＳ１０７～Ｓ１０９、Ｓ１１１）。

【0080】

（ステップＮ６：対話ロボット１０から介護者への通知）
次に、対話ロボット１０は、被介護者の話題が健康に関連するため、第１のユーザ音声を、サーバ２０に送信することにより音声ＤＢ２３３に記録する。また、対話ロボット１０は、この被介護者の連絡先として介護者の電子メールアドレスを記憶している。そこで、対話ロボット１０は、この被介護者の情報を含む電子メールを、当該介護者の電子メールアドレス宛てに送信する。送信した電子メールには、音声ＤＢ２３３に記録した第１のユーザ音声に対するアクセス情報が含まれる（ステップＳ１１２～Ｓ１１５）。

【0081】

（ステップＮ７：介護者による第１のユーザ音声の再生）
介護者は、受信した電子メールに含まれるアクセス情報を用いて、サーバ２０の音声ＤＢ２３３にアクセスし、被介護者の第１のユーザ音声「頭が痛い」を再生する。

【0082】

＜本実施形態の効果＞
本実施形態に係る対話システム１は、第１のユーザ音声の音声認識結果に基づいて推定した話題が正しいか否かを、第２のユーザ音声が否定的な内容を示すか否かに基づいて判断する。その結果、第２のユーザ音声を考慮しない場合と比較して、話題の推定精度が向上する。

【0083】

また、本実施形態に係る対話システム１は、第１のユーザ音声の音声認識結果に含まれる類似キーワードを、当該類似キーワードに関連付けられた正解キーワードに置換し、置換後の音声認識結果に基づいて話題を推定する。その結果、第１のユーザ音声を誤認識する可能性を低減できるので、話題の推定精度がさらに向上する。

【0084】

また、本実施形態に係る対話システム１は、推定した話題が健康に関連する場合、第１のユーザ音声を音声ＤＢ２３３に記録するとともに、記録した第１のユーザ音声に対するアクセス情報をユーザの管理者の連絡先に送信する。その結果、対話ロボット１０は、ユーザが対話を楽しむ用途で利用されつつ、緊急を有する可能性が高い健康に関連する発話を検知し、検知した発話を迅速に外部に通知することができる。

【0085】

〔変形例〕
（話題の数の変形例）
本実施形態において、対話システム１は、第１のユーザ音声に関連する話題として、複数の話題のうち何れかを推定するものとして説明した。これに限らず、対話システム１は、第１のユーザ音声に関連する話題が、１つの特定の話題であるか否かを推定してもよい。この場合、サーバ２０は、特定の話題に関する話題キーワードＤＢ２３１および類似キーワードＤＢ２３２を１つずつ記憶する。１つの特定の話題は、例えば、健康に関連する話題であってもよい。この場合、対話システム１は、第１のユーザ音声に関連する話題が「健康に関連する話題」であるか否かを精度よく推定することができる。

【0086】

（所定条件の変形例）
また、本実施形態において、外部への情報送信を行うか否かを判断する所定条件として、「話題が健康に関連する」との条件を適用する例について説明した。ただし、当該所定条件はこれに限られず、他の話題に関連するとの条件であってもよい。

【0087】

（話題推定処理の変形例）
また、本実施形態の話題の推定処理において、プロセッサ１１は、音声認識結果の確度に応じて、図３のステップＳ２０２およびＳ２０３を省略してもよい。例えば、プロセッサ１１は、ステップＳ２０２およびＳ２０３を、音声認識結果の確度が閾値以上の場合には実行し、閾値未満の場合には省略してもよい。これにより、プロセッサ１１は、音声認識結果の確度が高い場合には、まずは置換処理を行わずに話題を推定する。このため、確度が高いにも関わらず置換処理を行うことによって誤った話題が推定される可能性が低減される。また、これにより、プロセッサ１１は、音声認識結果の確度が低い場合には、先に置換処理を実行してから話題を推定する。このため、確度の低い音声認識結果を用いて誤った話題が推定される可能性が低減される。

【0088】

（サーバ２０が主要なステップを実行する変形例）
また、本実施形態に係る情報処理方法Ｓにおいて、対話ロボット１０が実行するステップの一部を、サーバ２０が実行してもよい。例えば、対話ロボット１０は、音声取得処理（ステップＳ１０１、Ｓ１０７）および音声出力処理（ステップＳ１０６）を実行し、サーバ２０が、その他のステップを実行してもよい。この場合、対話ロボット１０は、取得したユーザ音声をサーバ２０に送信し、サーバ２０から応答音声を受信して出力すればよい。

【0089】

（ＤＢ２３１～２３３の格納場所の変形例）
また、本実施形態において、話題キーワードＤＢ２３１、類似キーワードＤＢ２３２、および音声ＤＢ２３３は、サーバ２０の二次メモリ２３に記憶されるものとして説明した。これに限らず、これらのＤＢ２３１～２３３の一部または全部は、対話システム１の外部（例えば、クラウドサーバ等）に記憶されてもよい。また、これらのＤＢ２３１～２３３の一部または全部は、対話ロボット１０の二次メモリ１３に記憶されてもよい。

【0090】

（対話ロボット１０が全てのステップを実行する変形例）
また、上述したＤＢ２３１～２３３の何れもサーバ２０が記憶しない場合、本実施形態に係る情報処理方法Ｓの全てのステップを対話ロボット１０が実行すればよい。この場合、サーバ２０は省略可能である。換言すると、本実施形態においては、複数のプロセッサ（対話ロボット１０のプロセッサ１１、およびサーバ２０のプロセッサ２１）が連携して情報処理方法Ｓを実行する構成を採用しているが、本発明は、これに限定されず、対話ロボット１０の単一のプロセッサ１１を用いて情報処理方法Ｓを実行する構成を採用してもよい。

【0091】

（対話ロボット１０の代わりとなる構成）
また、本実施形態において、対話システム１は、対話ロボット１０の代わりに、スマートフォン、タブレット、スマートスピーカ、パーソナルコンピュータ等といった、プロセッサおよびメモリを備えるコンピュータを含んでもよい。この場合、当該メモリに対話ロボット１０と同様のプログラムＰ１を記憶し、当該プロセッサがプログラムＰ１を読み込んで実行する。これにより、対話システム１は、上述した実施形態と同様に動作し、同様の効果を奏する。

【0092】

〔まとめ〕
態様１に係る対話システムは、１または複数のプロセッサを備える。前記１または複数のプロセッサは、推定処理と、生成処理と、判断処理とを実行する。推定処理は、ユーザが発話した第１のユーザ音声に基づいて話題を推定する処理である。生成処理は、前記第１のユーザ音声に応答する応答音声を生成する処理である。判断処理は、前記応答音声の出力に対応して前記ユーザが発話した第２のユーザ音声が、否定的な内容を示すか否かに基づいて、前記推定処理により推定した話題が正しいか否かを判断する処理である。

【0093】

上記構成により、第１のユーザ音声に基づいて推定した話題が正しいか否かを、第２のユーザ音声が否定的な内容を示すか否かに基づいて判断する。第２のユーザ音声は、第１のユーザ音声に応答するために生成した音声である。その結果、第２のユーザ音声を考慮しない場合と比較して、話題の推定精度が向上する。

【0094】

態様２に係る対話システムは、態様１に係る対話システムの特徴に加えて、以下の特徴を有している。すなわち、態様２に係る対話システムにおいて、前記１または複数のプロセッサは、特定の話題で用いられる正解キーワードと、当該正解キーワードに類似する類似キーワードとを関連付けた類似キーワードデータベースを参照する。また、前記１または複数のプロセッサは、前記第１のユーザ音声の音声認識結果に含まれる前記類似キーワードを、前記類似キーワードデータベースにおいて当該類似キーワードに関連付けられた正解キーワードに置換する置換処理をさらに実行する。また、前記１または複数のプロセッサは、置換後の前記音声認識結果に基づいて前記推定処理および前記生成処理を実行する。

【0095】

上記構成により、置換後の音声認識結果が誤っている可能性が低くなる。その結果、そのような置換後の音声認識結果に基づくことにより、話題の推定精度がさらに向上する。

【0096】

態様３に係る対話システムは、態様２に係る対話システムの特徴に加えて、以下の特徴を有している。すなわち、態様３に係る対話システムにおいて、前記１または複数のプロセッサは、前記特定の話題を含む複数の話題の各々に関連付けられた前記類似キーワードデータベースを参照し、前記推定処理において、前記複数の話題の何れかを推定する。

【0097】

上記構成により、複数の話題のそれぞれについて、第１のユーザ音声の音声認識結果が誤りである可能性を低くすることができる。

【0098】

態様４に係る対話システムは、態様１から態様３の何れか一態様に係る対話システムの特徴に加えて、以下の特徴を有している。すなわち、態様４に係る対話システムにおいて、前記１または複数のプロセッサは、前記判断処理により正しいと判断された話題が所定条件を満たす場合、前記ユーザに関する情報を外部に送信する送信処理をさらに実行する。

【0099】

上記構成により、所定条件を満たす話題に関するユーザの発話を検知して迅速に外部に通知することができる。

【0100】

態様５に係る対話システムは、態様４に係る対話システムの特徴に加えて、以下の特徴を有している。すなわち、態様５に係る対話システムにおいて、前記１または複数のプロセッサは、前記第１のユーザ音声をメモリに記録する記録処理をさらに実行する。また、前記１または複数のプロセッサは、前記送信処理において、前記メモリに記録した前記第１のユーザ音声に対するアクセス情報を、前記ユーザに関する情報に含めて送信する。

【0101】

上記構成により、当該アクセス情報の受信者は、所定条件を満たす話題に関する第１のユーザ音声にアクセスして再生することができる。

【0102】

態様６に係る対話システムは、態様１から態様５の何れか一態様に係る対話システムの特徴に加えて、以下の特徴を有している。すなわち、態様６に係る対話システムにおいて、前記１または複数のプロセッサは、前記推定処理において、前記話題として、健康に関連する話題を推定する。

【0103】

上記構成により、ユーザの話題が健康に関連するか否かを、より精度よく推定することができる。

【0104】

態様７に係る対話ロボットは、態様１から態様６の何れか一態様に記載の対話システムに含まれる対話ロボットであって、前記１または複数のプロセッサの何れかを備える。前記対話ロボットが備えるプロセッサは、前記第１のユーザ音声および前記第２のユーザ音声を取得する音声取得処理と、前記応答音声を出力する音声出力処理とを少なくとも実行する。

【0105】

上記構成により、ユーザは、態様１から態様６の何れかに係る対話システムを、ユーザと対話する対話ロボットの態様で利用することができる。

【0106】

態様８に係るプログラムは、態様１から態様６の何れか一態様の対話システムを動作させるためのプログラムであって、前記１または複数のプロセッサに前記各処理を実行させる。

【0107】

上記構成により、態様１に係る対話システムと同様の効果を奏する。

【0108】

態様９に係る情報処理方法は、推定ステップと、生成ステップと、判断ステップとを含む。推定ステップにおいて、１または複数のプロセッサは、ユーザが発話した第１のユーザ音声に基づいて話題を推定する。生成ステップにおいて、前記１または複数のプロセッサは、前記第１のユーザ音声に応答する応答音声を生成する。判断ステップにおいて、前記１または複数のプロセッサは、前記応答音声の出力に対応して前記ユーザが発話した第２のユーザ音声が、否定的な内容を示すか否かに基づいて、前記推定ステップにより推定した話題が正しいか否かを判断する。

【0109】

上記構成により、態様１に係る対話システムと同様の効果を奏する。

【符号の説明】

【0110】

１対話システム
１０対話ロボット
１１、２１プロセッサ
１２、２２一次メモリ
１３、２３二次メモリ
１４、２４通信インタフェース
１５入出力インタフェース
２０サーバ
１１０コントローラ
１２０マイク
１３０スピーカ
２３１話題キーワードＤＢ
２３２類似キーワードＤＢ
２３３音声ＤＢ

【図1】