特許7576290 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社サイバーエージェントの特許一覧 ▶ 国立大学法人大阪大学の特許一覧

特許7576290話題モジュールセット作成装置、対話装置、話題モジュールセット作成方法、対話方法及びコンピュータプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-10-23

(45)【発行日】2024-10-31

(54)【発明の名称】話題モジュールセット作成装置、対話装置、話題モジュールセット作成方法、対話方法及びコンピュータプログラム

(51)【国際特許分類】

G10L 15/22 20060101AFI20241024BHJP

G10L 15/10 20060101ALI20241024BHJP

G06F 3/16 20060101ALI20241024BHJP

【ＦＩ】

G10L15/22 300Z

G10L15/10 500Z

G06F3/16 650

【請求項の数】 12

(21)【出願番号】P 2023095767

(22)【出願日】2023-06-09

【審査請求日】2023-06-09

【新規性喪失の例外の表示】特許法第３０条第２項適用発行日（公開日）２０２３年５月３日刊行物名日本ロボット学会誌４１巻３号２０２３年４月号Ｐ．２９１～３０２一般社団法人日本ロボット学会〔Ｗｅｂ公開〕ＵＲＬ：ｈｔｔｐｓ：／／ｗｗｗ．ｊｓｔａｇｅ．ｊｓｔ．ｇｏ．ｊｐ／ａｒｔｉｃｌｅ／ｊｒｓｊ／４１／３／４１＿４１＿２９１／＿ａｒｔｉｃｌｅ／－ｃｈａｒ／ｊａＤＯＩ：ｈｔｔｐｓ：／／ｄｏｉ．ｏｒｇ／１０．７２１０／ｊｒｓｊ．４１．２９１＜資料＞日本ロボット学会誌掲載学術・技術論文

(73)【特許権者】

【識別番号】500149555

【氏名又は名称】株式会社サイバーエージェント

(73)【特許権者】

【識別番号】504176911

【氏名又は名称】国立大学法人大阪大学

(74)【代理人】

【識別番号】100149548

【弁理士】

【氏名又は名称】松沼泰史

(74)【代理人】

【識別番号】100141139

【弁理士】

【氏名又は名称】及川周

(72)【発明者】

【氏名】馬場惇

(72)【発明者】

【氏名】挾間智久

(72)【発明者】

【氏名】中西惇也

(72)【発明者】

【氏名】吉川雄一郎

(72)【発明者】

【氏名】石黒浩

【審査官】土井悠生

(56)【参考文献】

【文献】特開２０２２－１２９９５７（ＪＰ，Ａ）

【文献】特開２０２２－１０１１３７（ＪＰ，Ａ）

【文献】特開２０１８－１６７３３９（ＪＰ，Ａ）

【文献】特開２００７－０４７４８８（ＪＰ，Ａ）

【文献】特開２０２０－０７７２７２（ＪＰ，Ａ）

【文献】特開２０１９－１７４７３２（ＪＰ，Ａ）

【文献】特開２０１９－０６７４３３（ＪＰ，Ａ）

【文献】特開２０１８－０７２５６０（ＪＰ，Ａ）

【文献】特開２０１０－０４８９８０（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１０Ｌ１５／００－１７／２６

Ｇ０６Ｆ３／１６

(57)【特許請求の範囲】

【請求項1】

一方向の対話の流れが記述された１以上のシナリオに基づいて、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットを作成する話題モジュールセット作成部、
を備え、
少なくとも１つ以上の話題モジュールには、前記ユーザ又はシステムの状態を表すための候補状態と変数の組み合わせを少なくとも１つ含む起動条件が設定され、
前記話題モジュールセット作成部は、話題モジュールに示された前記話題に応じた内容を各話題モジュールに対応付けることによって前記候補状態と前記話題のセットである話題モジュールを複数作成し、作成した複数の前記話題モジュールを所定の優先順位で階層構造に配置することによって前記話題モジュールセットを作成する、話題モジュールセット作成装置。

【請求項2】

請求項１に記載の話題モジュールセット作成装置と、
前記話題モジュールセット作成装置によって作成された前記話題モジュールセットと、少なくとも前記ユーザ又はシステムの状態を表す状態情報とに基づいて、前記ユーザの状態又は前記システムの状態に応じた話題を決定する話題決定部と、
決定された前記話題に応じた内容を出力させる出力部と、
を備える対話装置。

【請求項3】

１つのシナリオは、複数の話題で構成され、
前記シナリオを構成する各話題を候補状態とし、各候補状態に変数を対応付けることによって前記状態情報を作成する状態情報作成部、をさらに備える、
請求項２に記載の対話装置。

【請求項4】

前記状態情報作成部は、前記状態情報を作成する際に、前記シナリオを構成する各話題のうち、同様の意味を示す複数の話題を１つの話題に統合する、
請求項３に記載の対話装置。

【請求項5】

少なくとも前記ユーザの発話内容又はテキストにより入力された内容に応じて前記ユーザに関する状態情報を更新し、前記システムにおける発話内容又は動作に応じて前記システムに関する状態情報を更新する状態更新部をさらに備え、
前記状態更新部は、前記ユーザの発話内容もしくはテキストにより入力された内容又は前記システムにおける発話内容もしくは動作に応じた候補状態の変数を更新することによって前記状態情報を更新する、
請求項２に記載の対話装置。

【請求項6】

前記話題決定部は、前記状態情報に基づいて、満たされた起動条件に対応付けられた話題のうち、優先順位の高い話題を前記ユーザ又は前記システムの状態に応じた話題として決定する、
請求項２に記載の対話装置。

【請求項7】

前記話題決定部は、第１のシナリオに基づく対話中において第２のシナリオを構成する話題への転換が必要な場合には、前記状態情報に基づいて、前記第２のシナリオを構成する話題の中から次の話題を決定する、
請求項２に記載の対話装置。

【請求項8】

前記話題決定部は、起動条件を満たす話題モジュールがない場合に、前記起動条件が設定されていない対話モジュールを選択する、
請求項２に記載の対話装置。

【請求項9】

前記話題決定部により決定された話題又は話題に基づく情報に基づいて、自装置に接続されたロボット、表示装置に表示されたエージェント又は音声出力装置の動作を制御する動作制御部をさらに備える、
請求項２に記載の対話装置。

【請求項10】

コンピュータが、
一方向の対話の流れが記述された１以上のシナリオに基づいて、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットを作成し、
少なくとも１つ以上の話題モジュールには、前記ユーザ又はシステムの状態を表すための候補状態と変数の組み合わせを少なくとも１つ含む起動条件が設定され、
話題モジュールに示された前記話題に応じた内容を各話題モジュールに対応付けることによって前記候補状態と前記話題のセットである話題モジュールを複数作成し、作成した複数の前記話題モジュールを所定の優先順位で階層構造に配置することによって前記話題モジュールセットを作成する、話題モジュールセット作成方法。

【請求項11】

コンピュータが、
請求項１０に記載の話題モジュールセット作成方法によって作成された前記話題モジュールセットと、少なくとも前記ユーザ又はシステムの状態を表す状態情報とに基づいて、前記ユーザ又は前記システムの状態に応じた話題を決定し、
決定された前記話題に応じた内容を出力させる、対話方法。

【請求項12】

コンピュータを、
請求項１に記載の話題モジュールセット作成装置、または、請求項２に記載の対話装置として機能させるためのコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、話題モジュールセット作成装置、対話装置、話題モジュールセット作成方法、対話方法及びコンピュータプログラムに関する。

【背景技術】

【0002】

従来、人と対話ロボットによる対話システムに関する研究がなされている（例えば、非特許文献１参照）。対話システムの実装アプローチとして、機械学習を用いる方法や、有限状態マシンを用いる方法等が挙げられる。機械学習を用いる方法では、学習したパターンでシステムを制御でき、人の発話に応じて何らかの応答を返すことができるため対話を続けることができる。一方で、機械学習を用いる方法では、学習パターンに依存してしまうため、設計者の意図した対話ができない場合もある。さらに、特定の振る舞いを修正したい場合であっても簡単に修正することができない。

【0003】

それに対して、有限状態マシンを用いる方法では、設計者が手動でルールを記述するため、設計者の意図した対話を実現しやすい。さらに、特定の振る舞いを修正したい場合には、その特定の振る舞いに関するルールを修正するだけでよい。そのため、有限状態マシンを用いる方法もよく利用されている。

【先行技術文献】

【非特許文献】

【0004】

【文献】駒谷和範, “音声対話システムの構成と今後”, ［online］, [令和５年６月９日検索], インターネット<URL: https://system.jpaa.or.jp/patent/viewPdf/3307>, Vol. 72 No. 8

【発明の概要】

【発明が解決しようとする課題】

【0005】

有限状態マシンを用いる方法では、話題の遷移の前後関係を全て設計する必要がある。そのため、想定する遷移パターンの増大に伴い、設計が複雑になってしまうことが考えられる。実際の運用上、遷移パターンを全て網羅するように設計することは困難であり、このような場合、未設計の箇所においては話題遷移ができずに対話が破綻してしまうという問題があった。このような問題は、人と対話ロボットとの発話による対話に限らず、テキストによる対話においても共通する問題である。

【0006】

上記事情に鑑み、本発明は、複雑な話題の遷移パターンを想定しきれていない場合であっても対話を継続させることができる技術の提供を目的としている。

【課題を解決するための手段】

【0007】

本発明の一態様は、一方向の対話の流れが記述された１以上のシナリオに基づいて、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットを作成する話題モジュールセット作成部、を備え、少なくとも１つ以上の話題モジュールには、前記ユーザ又はシステムの状態を表すための候補状態と変数の組み合わせを少なくとも１つ含む起動条件が設定され、前記話題モジュールセット作成部は、話題モジュールに示された前記話題に応じた内容を各話題モジュールに対応付けることによって前記候補状態と前記話題のセットである話題モジュールを複数作成し、作成した複数の前記話題モジュールを所定の優先順位で階層構造に配置することによって前記話題モジュールセットを作成する、話題モジュールセット作成装置である。

【0009】

本発明の一態様は、上記の話題モジュールセット作成装置と、前記話題モジュールセット作成装置によって作成された前記話題モジュールセットと、少なくとも前記ユーザ又はシステムの状態を表す状態情報とに基づいて、前記ユーザの状態又は前記システムの状態に応じた話題を決定する話題決定部と、決定された前記話題に応じた内容を出力させる出力部と、を備える対話装置である。

【0010】

本発明の一態様は、上記の対話装置であって、少なくとも１つ以上の話題モジュールには、前記ユーザ又は前記システムの状態を表すための候補状態と変数の組み合わせを少なくとも１つ含む起動条件が設定され、前記話題モジュールセット作成部は、話題モジュールに示された前記話題に応じた内容を各話題モジュールに対応付けて、所定の優先順位で複数の話題モジュールを階層構造に配置することによって前記話題モジュールセットを作成する。

【0011】

本発明の一態様は、上記の対話装置であって、１つのシナリオは、複数の話題で構成され、前記シナリオを構成する各話題を前記候補状態とし、各候補状態に変数を対応付けることによって前記状態情報を作成する状態情報作成部、をさらに備える。

【0012】

本発明の一態様は、上記の対話装置であって、前記状態情報作成部は、前記状態情報を作成する際に、前記シナリオを構成する各話題のうち、同様の意味を示す複数の話題を１つの話題に統合する。

【0013】

本発明の一態様は、上記の対話装置であって、少なくとも前記ユーザの発話内容又はテキストにより入力された内容に応じて前記ユーザに関する状態情報を更新し、前記システムにおける発話内容又は動作に応じて前記システムに関する状態情報を更新する状態更新部をさらに備え、前記状態更新部は、前記ユーザの発話内容もしくはテキストにより入力された内容又は前記システムにおける発話内容もしくは動作に応じた候補状態の変数を更新することによって前記状態情報を更新する。

【0014】

本発明の一態様は、上記の対話装置であって、前記話題決定部は、前記状態情報に基づいて、満たされた起動条件に対応付けられた話題のうち、優先順位の高い話題を前記ユーザ又は前記システムの状態に応じた話題として決定する。

【0015】

本発明の一態様は、上記の対話装置であって、前記話題決定部は、前記起動条件を満たす話題モジュールがない場合に、前記起動条件が設定されていない対話モジュールを選択する。

【0016】

本発明の一態様は、上記の対話装置であって、前記話題決定部により決定された話題又は話題に基づく情報に基づいて、自装置に接続されたロボット、表示装置に表示されたエージェント又は音声出力装置の動作を制御する動作制御部をさらに備える。

【0017】

本発明の一態様は、コンピュータが、一方向の対話の流れが記述された１以上のシナリオに基づいて、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットを作成し、少なくとも１つ以上の話題モジュールには、前記ユーザ又はシステムの状態を表すための候補状態と変数の組み合わせを少なくとも１つ含む起動条件が設定され、話題モジュールに示された前記話題に応じた内容を各話題モジュールに対応付けることによって前記候補状態と前記話題のセットである話題モジュールを複数作成し、作成した複数の前記話題モジュールを所定の優先順位で階層構造に配置することによって前記話題モジュールセットを作成する、話題モジュールセット作成方法である。

【0018】

本発明の一態様は、コンピュータが、上記の話題モジュールセット作成方法によって作成された前記話題モジュールセットと、少なくとも前記ユーザ又はシステムの状態を表す状態情報とに基づいて、前記ユーザ又は前記システムの状態に応じた話題を決定し、決定された前記話題に応じた内容を出力させる、対話方法である。

【0019】

本発明の一態様は、上記の話題モジュールセット作成装置、または、上記の対話装置として機能させるためのコンピュータプログラムである。

【発明の効果】

【0020】

本発明により、複雑な話題の遷移パターンを想定しきれていない場合であっても対話を継続させることが可能となる。

【図面の簡単な説明】

【0021】

【図1】実施形態における対話システムの構成の一例を示す図である。

【図2】実施形態における状態情報の一例を示す図である。

【図3】実施形態における話題モジュールセットの一例（その１）を示す図である。

【図4】実施形態における出力言語情報の一例を示す図である。

【図5】実施形態におけるシナリオの一例を示す図である。

【図6】実施形態における状態情報の作成方法を説明するための図である。

【図7】実施形態における状態情報の作成方法を説明するための図である。

【図8】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図9】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図10】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図11】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図12】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図13】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図14】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図15】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図16】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図17】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図18】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図19】実施形態における話題モジュールセットの作成方法を説明するための図である。

【図20】実施形態における対話システムの処理の流れを示すシーケンス図（その１）である。

【図21】実施形態における状態情報の更新の一例を示す図である。

【図22】実施形態における話題モジュールセットの一例（その２）を示す図である。

【図23】実施形態における対話システムの処理の流れを示すシーケンス図（その１）である。

【図24】実施形態における状態情報の更新の一例を示す図である。

【図25】実施形態における状態情報の更新の一例を示す図である。

【図26】実施形態における話題モジュールセットの一例（その３）を示す図である。

【図27】実施形態における対話システムの処理の流れを示すシーケンス図（その３）である。

【図28】実施形態における状態情報の更新の一例を示す図である。

【図29】実施形態における話題モジュールセットの一例（その４）を示す図である。

【図30】実施形態における対話システムの処理の流れを示すシーケンス図（その４）である。

【図31】実施形態における状態情報の更新の一例を示す図である。

【図32】変形例における対話システムの構成の一例を示す図である。

【図33】変形例における話題モジュールセットの一例（その５）を示す図である。

【発明を実施するための形態】

【0022】

以下、本発明の一実施形態を、図面を参照しながら説明する。
（要約）
本発明における対話装置では、所定の条件が満たされた場合に、対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットと、ユーザの動作、ユーザの発話内容又はテキストにより入力された内容に応じたユーザの状態を表す状態情報とに基づいて、ユーザに対して提供する話題を決定し、決定した話題に基づく内容をユーザに出力（音声出力又はテキスト出力）する。対話の相手であるユーザに提供する話題は、ユーザと対話するための材料であり、どのような事柄であってもよい。話題モジュールセットは、複数の話題モジュールが、優先順位に応じて階層構造で配置されて構成される。

【0023】

本発明における対話には、ユーザと対話装置との音声による対話と、ユーザと対話装置とのテキストによる対話と、ユーザ又は対話装置が音声による対話を行い、他方がテキストによる対話を行うことを含む。一実施形態の説明では、ユーザと対話装置との音声による対話を例に説明する。

【0024】

さらに、本発明における対話装置では、一方向の対話の流れが記述された１以上のシナリオに基づいて、話題モジュールセット及び状態情報を作成する。ここで一方向の対話の流れとは、ある対象が、対話の相手との対話で達成したいゴールに向かうまでにやり取りされることが想定される話題の流れを表す。例えば、対話の相手との対話で達成したいゴールが、「ラーメン店を推薦する」であるとする。この場合、ゴールに向かうためにやり取りされることが想定される一方向の対話の話題として、「お腹空いている？」、「ラーメン食べたい？」、「ラーメン店紹介ＯＫ？」等が考えられる。一方向の対話の流れとしては、「お腹空いている？」と聞いた後に、「ラーメン食べたい？」と聞き、その後に「ラーメン店紹介ＯＫ？」と聞いて「ラーメン店を推薦する」といった流れが考えられる。

【0025】

本発明における対話装置では、上述したような一方向の対話の流れが記述されたシナリオを１つ以上用いて、話題モジュールセット及び状態情報を作成する。そして、対話装置は、作成した話題モジュールセット及び状態情報を用いて、ユーザに対して提供する話題を決定し、決定した話題に基づく内容をユーザに出力（音声出力又はテキスト出力）する。

【0026】

話題モジュールセットは、移動ロボットの分野で利用されるサブサンプションアーキテクチャの技術を元に作成されるものである。本発明における話題モジュールセットが、従来のサブサンプションアーキテクチャの技術で作成されるモジュールセットと異なる点は、シナリオに基づいて自動的に話題モジュールセットを作成できる点と、ユーザの状態が加味されている点である。例えば、移動ロボットの分野で利用されるサブサンプションアーキテクチャでは、予め作成された各モジュールを所定の優先順位に応じて並べることによってモジュールセットを構成している。それに対して、本発明における対話システムでは、一方向の対話の流れが記述されたシナリオに基づいて自動的に話題モジュールセットを作成することができる。

【0027】

さらに、移動ロボットの分野で利用されるサブサンプションアーキテクチャでは、モジュールセットを構成する各モジュールに入力された情報（例えば、センサの出力）のみで起動条件が満たされたか否かが判定され、条件が満たされた振る舞いの情報が出力される。それに対して、本発明における対話システムでは、話題モジュールセットを構成する各話題モジュールに入力された情報（例えば、ユーザの発話内容に応じたユーザの状態＝現在の状態）と、その前までに行われたユーザとの対話の履歴情報（例えば、過去の対話におけるユーザの状態＝過去の状態）等のユーザの状態を表すための複数の候補となる状態に基づいて所定の条件を満たすか否かが判定され、所定の条件が満たされた振る舞いの情報が出力される。このように、本発明における対話システムでは、過去の対話の流れからユーザに対して次に提供する話題を決定するため、複雑な話題の遷移パターンを想定しきれていない場合であっても対話を継続させることが可能となる。
以下、各実施形態について詳細に説明する。

【0028】

（実施形態）
［対話システム１００の構成］
図１は、実施形態における対話システム１００の構成の一例を示す図である。対話システム１００は、対話装置１０と、カメラ２０と、マイク３０と、スピーカー４０と、表示装置５０とを備える。カメラ２０と、マイク３０と、スピーカー４０と、表示装置５０とは、有線又は無線により対話装置１０に接続される。

【0029】

対話装置１０は、対話の対象となるユーザに対して提供する話題を決定し、決定した話題に応じた内容を出力させることでユーザとの対話を実現する。例えば、対話装置１０は、決定した話題に応じた内容の音声を出力させることでユーザとの対話を実現する。対話装置１０は、例えばパーソナルコンピュータ等の情報処理装置を用いて構成される。

【0030】

カメラ２０は、対話装置１０の周辺の動画像を撮像する。カメラ２０は、撮像した動画像に応じた映像信号を生成し、映像信号に基づく画像情報を対話装置１０に入力する。

【0031】

マイク３０は、対話装置１０の周辺の音声を収音する。例えば、マイク３０は、対話装置１０に近づいたユーザの音声を取得する。マイク３０は、取得した音声に基づいて音声信号を生成する。マイク３０は、生成した音声信号を対話装置１０に出力する。なお、マイク３０は、対話装置１０の内部に備えられてもよい。

【0032】

スピーカー４０は、対話装置１０により生成される音声信号を出力する。例えば、スピーカー４０は、決定された話題による内容を音声出力する。スピーカー４０は、表示装置５０の近傍（例えば、表示装置５０の横や表示装置５０の後方）に備えられる。

【0033】

表示装置５０は、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイ、電子泳動方式ディスプレイ等の画像表示装置である。表示装置５０は、二次元で表現されたエージェントを表示する。二次元で表現されたエージェントは、例えば表示装置５０の画面上に表示されたキャラクタである。なお、スピーカー４０と表示装置５０とは、一体化されていてもよい。

【0034】

次に、対話装置１０の機能構成について説明する。対話装置１０は、記憶部１１と、制御部１２とを備える。記憶部１１には、辞書１１１と、状態情報１１２と、話題モジュールセット１１３と、出力言語情報１１４と、動作制御情報１１５等が記憶される。記憶部１１は、磁気記憶装置や半導体記憶装置などの記憶装置を用いて構成される。

【0035】

辞書１１１は、自然言語処理の意味解析に用いられる辞書である。

【0036】

状態情報１１２は、ユーザの状態を表す情報である。ここでいうユーザとは、対話装置１０と対話を行う対象となるユーザである。図２は、状態情報１１２の一例を示す図である。図２に示すように、状態情報１１２は、ユーザの状態を表すための複数の候補状態と、複数の候補状態それぞれに対応付けられた変数とで構成される。なお、図２に示す例では、候補状態としてユーザの発話に基づいて判断されるユーザの状態を示しているが、候補状態にはカメラ２０により得られる画像から検知されるユーザの動作（例えば、人物が近づいてくる、人物が立ち止まる、人物が手を振る等）に関する状態が含まれてもよい。候補状態は、例えばユーザとの対話で達成したいゴールに向かうまでにやり取りされることが想定される話題でユーザが取り得る状態を表す。

【0037】

例えば、ユーザとの対話で達成したいゴールが、「ラーメン店を推薦する」や「パスタ店を推薦する」であるとする。この場合、ゴールに向かうためにやり取りされることが想定される話題として、「疲れた？」、「お腹空いている？」、「ラーメン食べたい？」、「パスタ食べたい？」、「ラーメン店紹介ＯＫ？」、「パスタ店紹介ＯＫ？」等が考えられる。これらの話題を踏まえると、ユーザは、疲れている状態、お腹が空いている状態、ラーメンを食べたいと思っている状態、パスタを食べたいと思っている状態、ラーメン店を紹介してほしいと思っている状態、パスタ店を紹介してほしいと思っている状態、ラーメン店の推薦を聞いた状態、パスタ店の推薦を聞いた状態が、候補状態として挙げられる。

【0038】

変数としては、ユーザの状態が、対応付けられている候補状態であることを表すＹ（Ｙｅｓ）と、ユーザの状態が、対応付けられている候補状態ではないことを表すＮ（Ｎｏ）と、ユーザの状態が、対応付けられている候補状態であるか否かが特定されていないことを表すＵ（Ｕｎｋｎｏｗｎ）とが用いられる。Ｙは、第１変数の一態様であり、Ｎは、第２変数の一態様であり、Ｕは、第３変数の一態様である。対話装置１０による処理開始時には、候補状態は変数が全て初期値（例えば、Ｕ）となっている。

【0039】

上述した話題及び候補状態の内容は、一例であり、設計者が自由に話題及び候補状態の内容を設定すればよい。以下の説明では、上述した話題及び候補状態の内容を用いて構成を例に説明する。

【0040】

図１に戻って説明を続ける。話題モジュールセット１１３は、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含んで構成される。図３は、話題モジュールセット１１３の一例（その１）を示す図である。話題モジュールセット１１３は、例えば、図３に示すように予め定められた優先順位で各話題モジュール１１３－１～１１３－９が階層構造に配置されて構成される。どのような優先順位で階層構造に並べるのかは、設計者の目的に応じて自由に変更可能である。

【0041】

図３に示す例では、全ての話題モジュール１１３－ｎ（ｎは１以上の整数）を、ゴールから近い距離（ゴールまでに経由する話題の数）順に並べている。例えば、ユーザとの対話で達成したいゴールが、「ラーメン店を推薦する」と「パスタ店を推薦する」とであり、「ラーメン店を推薦する」というゴールに至るまでの話題が「お腹空いている？」⇒「ラーメン食べたい？」⇒「ラーメン店紹介ＯＫ？」⇒「ラーメン店を推薦する」であり、「パスタ店を推薦する」というゴールに至るまでの話題が「疲れた？」⇒「お腹空いている？」⇒「パスタ食べたい？」⇒「パスタ店紹介ＯＫ？」⇒「パスタ店を推薦する」であるとする。

【0042】

この場合、「疲れた？」との話題が最もゴールまでの距離が遠く（距離＝４）、「お腹空いている？」との話題が次にゴールまでの距離が遠く（距離＝３）、「ラーメン食べたい？」及び「パスタ食べたい？」との話題が次にゴールまでの距離が遠く（距離＝２）、「ラーメン店紹介ＯＫ？」及び「パスタ店紹介ＯＫ？」との話題が最もゴールまでの距離が近い（距離＝１）。そして、各話題を予め定められた優先順位（例えば、ゴールから近い距離順、かつ、パスタよりラーメン優先）で並べて、対応する起動条件を設定することで図３に示す構成となる。

【0043】

起動条件は、対応付けられた話題の内容をユーザに対して出力するための条件であり、例えば状態情報１１２で示される各状態のいずれか２つ以上の組み合わせで構成される。起動条件は、上記のように話題の並べ方に応じて変更する必要があるが、ユーザの発話内容を加味した条件とすることができる。

【0044】

図１に戻って説明を続ける。出力言語情報１１４は、話題モジュールセット１１３に基づいて決定された話題に応じた対話用の文字列の情報である。図４は、出力言語情報１１４の一例を示す図である。図４に示すように、出力言語情報１１４は話題と、出力音声文字列とが対応付けられる。例えば、話題モジュールセット１１３に基づいて決定された話題が“疲れているか聞く”である場合、対話用の文字列として“疲れてない？”が選択されることが表されている。

【0045】

図１に戻って説明を続ける。動作制御情報１１５は、表示装置５０に表示させるエージェントの動作を制御するための情報を含む。例えば、動作制御情報１１５は、話題又は出力音声文字列と、制御内容とが対応付けられたテーブルであってもよい。制御内容は、エージェントの動作（例えば、表情、身振り手振りなど）を制御するための内容である。

【0046】

図１に戻って説明を続ける。制御部１２は、対話装置１０全体を制御する。制御部１２は、ＣＰＵ（Central Processing Unit）等のプロセッサやメモリを用いて構成される。制御部１２は、プログラムを実行することによって、話題モジュールセット作成部１２０と、状態情報作成部１２１と、検出部１２２と、音声認識部１２３と、解析部１２４と、状態更新部１２５と、話題決定部１２６と、言語生成部１２７と、音声合成部１２８と、動作制御部１２９の機能を実現する。

【0047】

話題モジュールセット作成部１２０、状態情報作成部１２１、検出部１２２、音声認識部１２３、解析部１２４、状態更新部１２５、話題決定部１２６、言語生成部１２７、音声合成部１２８及び動作制御部１２９のうち一部または全部は、ＡＳＩＣ（Application Specific Integrated Circuit）やＰＬＤ（Programmable Logic Device）、ＦＰＧＡ（Field Programmable Gate Array）などのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアとの協働によって実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置などの非一時的な記憶媒体である。プログラムは、電気通信回線を介して送信されてもよい。

【0048】

話題モジュールセット作成部１２０、状態情報作成部１２１、検出部１２２、音声認識部１２３、解析部１２４、状態更新部１２５、話題決定部１２６、言語生成部１２７、音声合成部１２８及び動作制御部１２９の機能の一部は、予め対話装置１０に搭載されている必要はなく、追加のアプリケーションプログラムが対話装置１０にインストールされることで実現されてもよい。

【0049】

話題モジュールセット作成部１２０は、一方向の対話の流れが記述された１以上のシナリオに基づいて話題モジュールセットを作成する。話題モジュールセット作成部１２０は、作成した話題モジュールセットを記憶部１１に記憶する。話題モジュールセット作成部１２０によって作成された話題モジュールセットが、記憶部１１に記憶されている話題モジュールセット１１３である。シナリオは、予めユーザによって作成される。シナリオは、外部の装置で作成されて対話装置１０に入力されてもよいし、ユーザが対話装置１０を操作して作成してもよい。

【0050】

状態情報作成部１２１は、シナリオを構成する各話題を候補状態とし、各候補状態に変数を対応付けることによって状態情報を作成する。状態情報作成部１２１は、作成した状態情報を記憶部１１に記憶する。状態情報作成部１２１によって作成された状態情報が、記憶部１１に記憶されている状態情報１１２である。

【0051】

検出部１２２は、カメラ２０によって撮像された動画像に基づいて人物の行動を検知する。人物の行動としては、例えば対話装置１０に人物が近づいてくる、人物が立ち止まる、人物が手を振る等の人物が行う動作や振る舞いである。なお、人物の行動を検知する方法は、これに限られず、人物を検知できる方法であればどのような方法であってもよい。例えば、検出部１２２は、不図示のセンサにより検出された情報に基づいて人物の行動を検知してもよい。例えば、検出部１２２は、他の装置からユーザの行動に関する情報が入力されたことを契機に、人物の行動を検知してもよい。

【0052】

音声認識部１２３は、音声認識処理を実行する。音声認識処理は、音声信号に基づいて文字列を生成する処理である。音声認識部１２３は、音声認識処理を実行することで、マイク３０から出力された音声信号に基づいて文字列を生成する。音声認識部１２３は、公知の手法を用いて文字列を生成してもよい。

【0053】

解析部１２４は、音声認識部１２３により生成された文字列と、記憶部１１に記憶されている辞書１１１とを用いて自然言語処理を行うことでユーザの発話内容を解析する。

【0054】

状態更新部１２５は、解析部１２４により解析された発話内容（ユーザの発話内容）又は検出部１２２により検知された人物の行動に基づいて、状態情報１１２を更新する。具体的には、状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、発話内容に応じた候補状態の変数を更新する。さらに、状態更新部１２５は、検出部１２２により検知された人物の行動に基づいて、発話内容に応じた候補状態の変数を更新する。例えば、検出部１２２により検知された人物の行動が「人物が手を振っている」動作である場合、状態更新部１２５は状態情報１１２における「人物が手を振っている動作」に対応付けられている変数を更新する。状態更新部１２５は、状態情報１１２を更新したことを話題決定部１２６に通知する。

【0055】

話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されたことに応じて、状態情報１１２と話題モジュールセット１１３とに基づいて、ユーザの状態に応じた話題を決定する。具体的には、話題決定部１２６は、状態情報１１２で示されるユーザの状態に基づいて話題モジュールセット１１３を構成する話題モジュール１１３－ｎにおけるいずれかの起動条件を満たすか否かを判定し、条件が満たされた起動条件に対応付けられた話題のうち、優先順位の高い話題をユーザの状態に応じた話題として決定する。

【0056】

言語生成部１２７は、話題決定部１２６により決定された話題と、出力言語情報１１４とに基づいて、音声出力させる文字列を生成する。

【0057】

音声合成部１２８は、言語生成部１２７により生成された文字列に対応する音声信号を生成する。音声合成部１２８により生成された音声信号は、スピーカー４０から出力される。すなわち、音声合成部１２８は、決定された話題による内容をスピーカー４０から出力させる。音声合成部１２８は、出力部の位置態様である。

【0058】

動作制御部１２９は、話題決定部１２６により決定された話題又は話題に基づく情報と、動作制御情報１１５とに基づいて、表示装置５０に表示させるエージェントの動作を制御する。具体的には、動作制御部１２９は、動作制御情報１１５を参照し、話題決定部１２６により決定された話題に対応付けられた制御内容を取得する。動作制御部１２９は、取得した制御内容に応じた動作を行うエージェントの映像情報を生成して、生成した映像情報を表示装置５０に表示させることによって、エージェントの動作を制御する。

【0059】

なお、動作制御情報１１５として、出力音声文字列と、制御内容とが対応付けられたテーブルが用いられる場合、動作制御部１２９は、出力言語情報１１４を参照し、話題決定部１２６により決定された話題に対応付けられた出力音声文字列を取得する。動作制御部１２９は、動作制御情報１１５を参照し、取得した出力音声文字列に対応付けられた制御内容を取得する。動作制御部１２９は、取得した制御内容に応じた動作を行うエージェントの映像情報を生成して、生成した映像情報を表示装置５０に表示させることによって、エージェントの動作を制御する。

【0060】

［話題モジュールセット及び状態情報の作成］
次に話題モジュールセット及び状態情報を作成する方法について具体的に説明する。話題モジュールセット及び状態情報を作成するために、話題モジュールセット作成部１２０が用いるシナリオを図５に示す。図５は、実施形態におけるシナリオの一例を示す図である。図５には、３つのシナリオＳＣ１，ＳＣ２，ＳＣ３を示している。シナリオＳＣ１は、ユーザとの対話で達成したいゴールが「ラーメン店を推薦する」ことを想定したシナリオである。そこで、シナリオＳＣ１において、ゴールに向かうためにやり取りされることが想定される一方向の対話の流れの一例として、「お腹空いている？」⇒「ラーメン食べたい？」⇒「ラーメン店紹介ＯＫ？」⇒「ラーメン店を推薦する」といった順番で話題が設定されている。このように１つのシナリオＳＣは、複数の話題で構成されている。

【0061】

シナリオＳＣ２は、ユーザとの対話で達成したいゴールが「パスタ店を推薦する」ことを想定したシナリオである。そこで、シナリオＳＣ２において、ゴールに向かうためにやり取りされることが想定される一方向の対話の流れの一例として、「疲れた？」⇒「お腹空いている？」⇒「パスタ食べたい？」⇒「パスタ店紹介ＯＫ？」⇒「パスタ店を推薦する」といった順番で話題が設定されている。

【0062】

シナリオＳＣ３は、ユーザとの対話で達成したいゴールが「マッサージ店を推薦する」ことを想定したシナリオである。そこで、シナリオＳＣ３において、ゴールに向かうためにやり取りされることが想定される一方向の対話の流れの一例として、「疲れてない？」⇒「癒す方法を知りたい？」⇒「マッサージ店紹介ＯＫ？」⇒「マッサージ店を推薦する」といった順番で話題が設定されている。

【0063】

図５に示すように、各シナリオＳＣには、話題を変えるといったような分岐はない。話題を変えるといったような分岐をさせたい場合には、途中から別の流れになるシナリオＳＣを新たに作成すればよい。図５に示す各シナリオＳＣは、１つの話題に応じた内容に対して対話の相手であるユーザが肯定的な意見を応答する場合のみを想定して作成している。シナリオＳＣ１では、例えば、「お腹空いている？」という話題に応じた内容（例えば、「お腹空いている？」）に対して、対話の相手であるユーザが「はい」や「お腹空いている」といったような肯定的な意見を応答することを想定し、「お腹空いている？」という話題の次に「ラーメン食べたい？」といった話題を設定している。

【0064】

なお、否定的な意見（例えば、「いいえ」や「違う」等）を応答する場合を想定してシナリオＳＣを作成することもできるが、簡潔で明快な説明のため以下で説明するシナリオＳＣとしては、対話の相手であるユーザが肯定的な意見を応答する場合のみを想定したシナリオＳＣを例に説明する。図５に示した各シナリオＳＣは一例であり、シナリオＳＣ内の話題は適宜変更されてもよい。

【0065】

まず状態情報の作成方法について図６及び図７を用いて説明する。状態情報作成部１２１は、上述したように作成された１以上のシナリオＳＣを入力とする。状態情報作成部１２１は、入力したシナリオＳＣに基づいて、シナリオＳＣを構成する各話題を候補状態とし、各候補状態に変数を対応付けることによって状態情報を作成する。具体的には、図６に示すように、まず状態情報作成部１２１は、入力した各シナリオＳＣを話題毎に分割する。次に、状態情報作成部１２１は、分割した各話題を候補状態として、各候補状態に対して変数（例えば、初期値として「Ｕ」）を対応付ける。変数Ｕは、上述したように、ユーザの状態が、対応付けられている候補状態であるか否かが特定されていないことを表す変数である。次に、状態情報作成部１２１は、図７に示すように、複数の候補状態の中で同じ意味になる候補状態を検索する。

【0066】

状態情報作成部１２１は、複数の候補状態の中で同じ意味になる候補状態を検索する方法は、特に限定されない。例えば、事前学習済み言語モデルが用いられてもよいし、２変数が同じ意味であることを示す教師ラベルを学習させた学習済みモデルが用いられてもよい。事前学習済み言語モデルを用いる場合、状態情報作成部１２１は、ベクトルの類似度によって、複数の候補状態の中で同じ意味になる候補状態を検索する。言語モデルは、Ｔｒａｎｓｆｏｍｅｒベースのモデルであってもよい。状態情報作成部１２１は、上述したいずれかの方法によって同じ意味になる候補状態を検索する。図７に示す例では、状態情報作成部１２１は、「お腹空いている？」という２つの候補状態が同じ意味の候補状態であると検索され、「疲れた？」と「疲れてない？」という２つの候補状態が同じ意味の候補状態であると検索される。

【0067】

状態情報作成部１２１は、検索結果として得られた同じ意味の複数の候補状態のうち、１つの候補状態を選択し、残りの候補状態を削除する。図７に示す例では、状態情報作成部１２１は、例えば「お腹空いている？」という２つの候補状態のうち、「お腹空いている？」を示す１つの候補状態を選択し、残りの「お腹空いている？」を示す候補状態を削除する。さらに、図７に示す例では、状態情報作成部１２１は、例えば「疲れた？」と「疲れてない？」という２つの候補状態のうち、「疲れた？」を示す１つの候補状態を選択し、残りの「疲れてない？」を示す候補状態を削除する。このようにして、状態情報作成部１２１は、同じ意味の候補状態が複数存在しないように調整を行う。そして、状態情報作成部１２１は、上述した処理の結果として得られた候補状態と変数の組み合わせをまとめることによって図２に示す状態情報１１２を作成する。

【0068】

次に話題モジュールセットの作成方法について図８～図１９を用いて説明する。話題モジュールセット作成部１２０は、上述したように作成された１以上のシナリオＳＣを入力とする。話題モジュールセット作成部１２０は、入力した１以上のシナリオＳＣを構成する各話題を話題モジュールとして作成する。この際、話題モジュールセット作成部１２０は、同じ意味を示す話題については用語を統一して話題モジュールとして作成してもよい。例えば、シナリオＳＣ２を構成する話題の１つである「疲れた？」と、シナリオＳＣ３を構成する話題の１つである「疲れてない？」とは同じ意味を示す話題である。そこで、話題モジュールセット作成部１２０は、「疲れた？」又は「疲れてない？」のいずれかの用語に統一して話題モジュールとして作成する。図８では、ＳＣ３を構成する話題の１つである「疲れてない？」を「疲れた？」に変更して話題モジュールとして作成した場合を示している。

【0069】

次に、話題モジュールセット作成部１２０は、話題のつながりに基づいて、各話題モジュールに対して起動条件を設定する。話題モジュールセット作成部１２０は、起動条件を設定するための手順として、３つの手順（起動条件の設定１～設定３）を行う。まず話題モジュールセット作成部１２０は、起動条件の設定１として、図９及び図１０に示すように、各話題モジュールに対して、起動条件（ＩＦ：話題に対応する変数＝＝Ｕｎｋｎｏｗｎ）を対応付ける。起動条件の設定１の目的は、ユーザが一度答えた話題を繰り返さないことである。

【0070】

例えば、「お腹空いている？」と聞いた後に、再度「お腹空いている？」と聞かないようにするために、「お腹空いている？」という話題に対応する内容を出力するための起動条件として、話題モジュールセット作成部１２０は、「お腹空いている？」という話題に対してＩＦ：お腹空いている＝＝Ｕｎｋｎｏｗｎを設定する。これは、ユーザの状態が、お腹空いている状態か否かが特定されていない場合にのみ起動することを意味する。例えば、お腹空いているか否かを一度ユーザに問い合わせた場合、ユーザの回答に応じてユーザの状態が変化（候補状態に対応付けられた変数が変化）するため、ＩＦ：お腹空いている＝＝Ｕｎｋｎｏｗｎという条件を満たさなくなる。その結果、「お腹空いている？」という話題を選択しなくなる。これにより、起動条件の設定１の目的であるユーザが一度答えた話題を繰り返さないことを満たすことができる。ここでは、「お腹空いている？」という話題を例に説明したが、図９及び図１０に示すように他の話題モジュールに対しても同様に、ユーザが一度答えた話題を繰り返さないようにするための起動条件が設定される。

【0071】

次に話題モジュールセット作成部１２０は、起動条件の設定２として、図１１～図１３に示すように、各シナリオＳＣを構成する各話題を基準として、達成したいゴールへ向かう話題に関する起動条件（ＩＦ：各話題の未来の話題＝＝Ｕｎｋｎｏｗｎ）を追加する。例えば、シナリオＳＣ１のように「お腹空いている？」⇒「ラーメン食べたい？」⇒「ラーメン店紹介ＯＫ？」⇒「ラーメン店を推薦する」といった順番で話題が設定されている場合、「お腹空いている？」を基準として、達成したいゴール（「ラーメン店を推薦する」）へ向かうために想定される話題は、「ラーメン食べたい？」と、「ラーメン店紹介ＯＫ？」と、「ラーメン店を推薦する」である。そこで、話題モジュールセット作成部１２０は、「お腹空いている？」の話題に対応付けられている起動条件に対して、ラーメン食べたい＝＝Ｕｎｋｎｏｗｎと、ラーメン店紹介ＯＫ＝＝Ｕｎｋｎｏｗｎと、ラーメン店推薦聞いた＝＝Ｕｎｋｎｏｗｎという条件を追加で設定する。

【0072】

同様に、「ラーメン食べたい？」を基準として、達成したいゴール（「ラーメン店を推薦する」）へ向かうために想定される話題は、「ラーメン店紹介ＯＫ？」と、「ラーメン店を推薦する」である。そこで、話題モジュールセット作成部１２０は、「ラーメン食べたい？」の話題に対応付けられている起動条件に対して、ラーメン店紹介ＯＫ＝＝Ｕｎｋｎｏｗｎと、ラーメン店推薦聞いた＝＝Ｕｎｋｎｏｗｎという条件を追加で設定する。同様に、「ラーメン店紹介ＯＫ？」を基準として、達成したいゴール（「ラーメン店を推薦する」）へ向かうために想定される話題は、「ラーメン店を推薦する」である。そこで、話題モジュールセット作成部１２０は、「ラーメン店紹介ＯＫ？」の話題に対応付けられている起動条件に対して、ラーメン店推薦聞いた＝＝Ｕｎｋｎｏｗｎという条件を追加で設定する。

【0073】

以上の説明はシナリオＳＣ１に関する内容であるが、話題モジュールセット作成部１２０は同様の処理を他のシナリオＳＣ（例えば、シナリオＳＣ２及びシナリオＳＣ３）に対しても行う。これにより、図１１～図１３に示すように起動条件が追加で設定される。設定２の目的は、到達したい話題が到達済みとなっている話題モジュールを選択しないこと、である。例えば、「お腹空いている？」という話題は、「お腹空いている＝＝ＹＥＳｏｒＮＯ」に関連する次の話題をシステムが有しているとユーザは想起できると考えられる。そのため、「お腹空いている？」に返答をした際に、「お腹空いている」に関連しない次の話題が続くと、ユーザは「お腹空いている？」という話題が何のために行われたか不思議に感じられると思われる。そのような事態を防ぐために、設定２の起動条件を付け、到達したい話題がなくなっている（到達済みになっている）話題モジュールを判別する。

【0074】

次に話題モジュールセット作成部１２０は、起動条件の設定３として、図１４～図１６に示すように、各シナリオＳＣを構成する各話題のうち２個目以降の話題に対応付けられている起動条件で定義されている条件を追加で設定する。起動条件の設定３の目的は、起動条件が対応付けられている２個目以降の話題を話す根拠となる定義を設定することである。２個目以降の話題に対応する内容を出力するためには、直前の話題に対して対話の相手から肯定的な回答（例えば、「はい」や「空いている」等）が得られることが条件となる。

【0075】

例えば、シナリオＳＣ１を構成する２個目の話題である「ラーメン食べたい？」という話題に対応する内容を出力するためには、シナリオＳＣ１を構成する１個目の話題である「お腹空いている？」という話題に対して対話の相手から肯定的な回答（例えば、「はい」や「空いている」等）が得られることが条件となる。さらに、シナリオＳＣ１を構成する３個目の話題である「ラーメン店紹介ＯＫ？」という話題に対応する内容を出力するためには、シナリオＳＣ１を構成する２個目の話題である「ラーメン食べたい？」という話題に対して対話の相手から肯定的な回答（例えば、「はい」や「空いている」等）が得られることが条件となる。さらに、シナリオＳＣ１を構成する４個目の話題である「ラーメン店を推薦する」という話題に対応する内容を出力するためには、シナリオＳＣ１を構成する３個目の話題である「ラーメン店紹介ＯＫ？」という話題に対して対話の相手から肯定的な回答（例えば、「はい」や「空いている」等）が得られることが条件となる。そこで、話題モジュールセット作成部１２０は、２個目以降の話題に対応付けられている起動条件で定義されている内容のうち、直前の話題に関する定義内容を「ＹＥＳ」（直前の話題＝＝ＹＥＳ）と追加で設定する。

【0076】

話題モジュールセット作成部１２０は、例えば、図１４に示す「ラーメン食べたい？」という話題に対応付けられている起動条件の定義の内容うち、直前の話題である「お腹空いている？」という内容を“お腹空いている＝＝Ｕｎｋｎｏｗｎ”を“お腹空いている＝＝Ｙｅｓ”と追加で設定する。これにより、直前の話題である「お腹空いている？」という話題に対して対話の相手から肯定的な回答が得られた場合に、「ラーメン食べたい？」という話題に対応する内容を出力するための起動条件が満たされるように設定することができる。

【0077】

同様に、話題モジュールセット作成部１２０は、例えば、図１４に示す「ラーメン店紹介ＯＫ？」という話題に対応付けられている起動条件の定義の内容うち、直前の話題である「ラーメン食べたい？」という内容を“ラーメン食べたい＝＝Ｕｎｋｎｏｗｎ”を“ラーメン食べたい＝＝Ｙｅｓ”と追加で設定する。これにより、直前の話題である「ラーメン食べたい？」という話題に対して対話の相手から肯定的な回答が得られた場合に、「ラーメン店紹介ＯＫ？」という話題に対応する内容を出力するための起動条件が満たされるように設定することができる。

【0078】

同様に、話題モジュールセット作成部１２０は、例えば、図１４に示す「ラーメン店を推薦する」という話題に対応付けられている起動条件の定義の内容うち、直前の話題である「ラーメン店紹介ＯＫ？」という内容を“ラーメン店紹介ＯＫ＝＝Ｕｎｋｎｏｗｎ”を“ラーメン店紹介ＯＫ＝＝Ｙｅｓ”と追加で設定する。これにより、直前の話題である「ラーメン店紹介ＯＫ？」という話題に対して対話の相手から肯定的な回答が得られた場合に、「ラーメン店を推薦する」という話題に対応する内容を出力するための起動条件が満たされるように設定することができる。

【0079】

以上の説明はシナリオＳＣ１に関する内容であるが、話題モジュールセット作成部１２０は同様の処理を他のシナリオＳＣ（例えば、シナリオＳＣ２及びシナリオＳＣ３）に対しても行う。これにより、図１４～図１６に示すように起動条件で定義された内容を追加で設定することができる。以上のように、話題モジュールセット作成部１２０は、起動条件の設定１～設定３の処理を行うことによって各話題モジュールに対して起動条件を設定する。

【0080】

次に、話題モジュールセット作成部１２０は、図１７～図１９に示すように、各話題モジュールに対して出力音声文字列を設定する。これは、話題モジュールの起動条件が満たされた場合に、対話装置１０が音声で出力するための文字列である。話題モジュールセット作成部１２０は、対話の文脈に応じた出力音声文字列を自動生成してもよいし、設計者等がシナリオＳＣと一緒に作成した文字列を用いて設定してもよい。出力音声文字列を自動生成する場合には、言語モデルや生成モデルが用いられてもよい。設計者等がシナリオＳＣと一緒に作成した文字列を用いる場合には、設計者はシナリオＳＣを構成する各話題に対応付けて文字列を作成する。話題モジュールセット作成部１２０は、各話題に対応付けて文字列をそのまま出力音声文字列として各話題モジュールに対して設定する。

【0081】

話題モジュールセット作成部１２０は、図８～図１９で説明した処理が終了すると、所定の優先順位で複数の話題モジュールを階層構造に配置することによって、起動条件と話題モジュールと出力音声文字列が対応付けられたリストを生成する。話題モジュールセット作成部１２０は、生成したリストのうち、話題モジュールの内容と、出力音声文字列との組み合わせを出力言語情報として作成する。話題モジュールセット作成部１２０は、作成した出力言語情報を記憶部１１に記憶する。さらに、話題モジュールセット作成部１２０は、生成したリストのうち、起動条件と、話題モジュールとの組み合わせを話題モジュールセットとして作成する。話題モジュールセット作成部１２０は、作成した話題モジュールセットを記憶部１１に記憶する。なお、以下の説明では、説明の簡単化のため、シナリオＳＣ１及びシナリオＳＣ２の内容のみで作成した話題モジュールセットを用いて説明する。なお、必要に応じてシナリオＳＣ３を用いて作成した話題モジュールセットで説明する場合もある。

【0082】

［対話システム１００の処理（その１）］
図２０は、実施形態における対話システム１００の処理の流れを示すシーケンス図（その１）である。なお、図２０の処理の説明では、話題モジュール１１３－ｎが図３に示す階層構造で配置されているものとする。図２０において、ユーザから対話装置１０に向かう矢印上の文字列は対話装置１０が出力する音声であり、対話装置１０からユーザに向かう矢印上の文字列は対話装置１０が解析したユーザの発話内容である。さらに、図２０の処理開始時の状態情報１１２で示される各状態の変数は初期値（例えば、Ｕ）であるものとする。

【0083】

対話装置１０の話題決定部１２６は、処理開始時において検出部１２２によりユーザの行動が検知されて状態更新部１２５により状態情報１１２の情報が更新されたことを契機に、状態情報１１２と話題モジュールセット１１３とに基づいて話題を決定する。図２０の処理開始時の状態情報１１２で示される各状態の変数は、図２１（Ａ）に示す通り“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の高い話題モジュール１１３－ｎを選択する。例えば、話題決定部１２６は、図２１（Ａ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、各候補状態が“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－７を選択する。話題決定部１２６は、選択した話題モジュール１１３－７における話題（例えば、“お腹空いているか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0084】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“お腹空いているか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“お腹空いているか聞く”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“お腹空いてない？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“お腹空いてない？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“お腹空いてない？”という音声がスピーカー４０から出力される（ステップＳ１０１）。

【0085】

ユーザは、スピーカー４０から出力された音声に応じて、“空いた”と発話したとする（ステップＳ１０２）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“空いた”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0086】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“お腹空いているか聞く”であり、解析部１２４により解析された発話内容が“空いた”である。そこで、状態更新部１２５は、該当する候補状態として“お腹空いている”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0087】

状態更新部１２５は、図２１（Ｂ）に示すように、状態情報１１２で示される状態“お腹空いている”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２１（Ｂ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0088】

例えば、話題決定部１２６は、図２１（Ｂ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－５を選択する。話題決定部１２６は、選択した話題モジュール１１３－５における話題（例えば、“ラーメン食べたいか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0089】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“ラーメン食べたいか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“ラーメン食べたいか聞く”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“お腹空いているなら、ラーメン食べたくない？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“お腹空いているなら、ラーメン食べたくない？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“お腹空いているなら、ラーメン食べたくない？”という音声がスピーカー４０から出力される（ステップＳ１０３）。

【0090】

ユーザは、スピーカー４０から出力された音声に応じて、“食べたい”と発話したとする（ステップＳ１０４）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“食べたい”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0091】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“ラーメン食べたいか聞く”であり、解析部１２４により解析された発話内容が“食べたい”である。そこで、状態更新部１２５は、該当する候補状態として“ラーメン食べたい”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0092】

状態更新部１２５は、図２１（Ｃ）に示すように、状態情報１１２で示される状態“ラーメン食べたい”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２１（Ｃ）に示す通り、状態情報１１２で示される状態“お腹空いている”及び“ラーメン食べたい”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0093】

例えば、話題決定部１２６は、図２１（Ｃ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”及び“ラーメン食べたい”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－３を選択する。話題決定部１２６は、選択した話題モジュール１１３－３における話題（例えば、“ラーメン店紹介ＯＫか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0094】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“ラーメン店紹介ＯＫか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“ラーメン店紹介ＯＫか聞く”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“ラーメン食べたいなら、ラーメン店紹介してもいい？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“ラーメン食べたいなら、ラーメン店紹介してもいい？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“ラーメン食べたいなら、ラーメン店紹介してもいい？”という音声がスピーカー４０から出力される（ステップＳ１０５）。

【0095】

ユーザは、スピーカー４０から出力された音声に応じて、“いいよ”と発話したとする（ステップＳ１０６）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“いいよ”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0096】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“ラーメン店紹介ＯＫか聞く”であり、解析部１２４により解析された発話内容が“いいよ”である。そこで、状態更新部１２５は、該当する候補状態として“ラーメン店紹介ＯＫ”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0097】

状態更新部１２５は、図２１（Ｄ）に示すように、状態情報１１２で示される状態“ラーメン店紹介ＯＫ”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２１（Ｄ）に示す通り、状態情報１１２で示される状態“お腹空いている”、“ラーメン食べたい”及び“ラーメン店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0098】

例えば、話題決定部１２６は、図２１（Ｄ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”、“ラーメン食べたい”及び“ラーメン店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－１を選択する。話題決定部１２６は、選択した話題モジュール１１３－１における話題（例えば、“ラーメン店を推薦する”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0099】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“ラーメン店を推薦する”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“ラーメン店を推薦する”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“ラーメン店紹介ＯＫなら、〇〇っていうラーメン屋がおすすめ”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“ラーメン店紹介ＯＫなら、〇〇っていうラーメン屋がおすすめ”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“ラーメン店紹介ＯＫなら、〇〇っていうラーメン屋がおすすめ”という音声がスピーカー４０から出力される（ステップＳ１０７）。

【0100】

ユーザは、スピーカー４０から出力された音声に応じて、“分かった”と発話したとする（ステップＳ１０８）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“分かった”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0101】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“ラーメン店を推薦する”であり、解析部１２４により解析された発話内容が“分かった”である。そこで、状態更新部１２５は、該当する候補状態として“ラーメン店推薦聞いた”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0102】

状態更新部１２５は、図２１（Ｅ）に示すように、状態情報１１２で示される状態“ラーメン店推薦聞いた”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２１（Ｅ）に示す通り、状態情報１１２で示される状態“お腹空いている”、“ラーメン食べたい”、“ラーメン店紹介ＯＫ”及び“ラーメン店推薦聞いた”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0103】

ところが、現時点においては選択可能な話題がない。この場合、対話装置１０はユーザとの対話を終了する。なお、状態更新部１２５は、対話終了時には、状態情報１１２で示される各状態における変数を全て初期化する。これにより、新たなユーザと対話する際においても対応可能になる。

【0104】

図２２は、話題モジュールセット１１３の一例（その２）を示す図である。図２２に示す例では、全ての話題モジュール１１３－ｎを、ゴールから遠い距離（ゴールまでに経由する話題の数）順に並べている。このような順に並べることでできるだけ多くユーザの状態に関する情報を取得することができる。

【0105】

［対話システム１００の処理（その２）］
図２３は、実施形態における対話システム１００の処理の流れを示すシーケンス図（その２）である。なお、図２３の処理の説明では、話題モジュール１１３－ｎが図２２に示す階層構造で配置されているものとする。図２３において、ユーザから対話装置１０に向かう矢印上の文字列は対話装置１０が出力する音声であり、対話装置１０からユーザに向かう矢印上の文字列は対話装置１０が解析したユーザの発話内容である。さらに、図２３の処理開始時の状態情報１１２で示される各状態の変数は初期値であるものとする。

【0106】

対話装置１０の話題決定部１２６は、検出部１２２によりユーザの行動が検知されて状態更新部１２５により状態情報１１２の情報が更新されたことを契機に、状態情報１１２と話題モジュールセット１１３とに基づいて話題を決定する。図２３の処理開始時の状態情報１１２で示される各状態の変数は、図２４（Ａ）に示す通り“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。例えば、話題決定部１２６は、図２４（Ａ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、各候補状態が“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－９を選択する。話題決定部１２６は、選択した話題モジュール１１３－９における話題（例えば、“疲れているか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0107】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“疲れているか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“疲れているか聞く”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“疲れてない？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“疲れてない？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“疲れてない？”という音声がスピーカー４０から出力される（ステップＳ２０１）。

【0108】

ユーザは、スピーカー４０から出力された音声に応じて、“疲れている”と発話したとする（ステップＳ２０２）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“疲れている”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0109】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“疲れているか聞く”であり、解析部１２４により解析された発話内容が“疲れている”である。そこで、状態更新部１２５は、該当する候補状態として“疲れている”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0110】

状態更新部１２５は、図２４（Ｂ）に示すように、状態情報１１２で示される状態“疲れている”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２４（Ｂ）に示す通り、状態情報１１２で示される状態“疲れている”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0111】

例えば、話題決定部１２６は、図２４（Ｂ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“疲れている”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－８を選択する。話題決定部１２６は、選択した話題モジュール１１３－８における話題（例えば、“お腹空いているか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0112】

【0113】

ユーザは、スピーカー４０から出力された音声に応じて、“空いた”と発話したとする（ステップＳ２０４）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“空いた”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0114】

【0115】

状態更新部１２５は、図２４（Ｃ）に示すように、状態情報１１２で示される状態“お腹空いている”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２４（Ｃ）に示す通り、状態情報１１２で示される状態“疲れている”及び“お腹空いている”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0116】

例えば、話題決定部１２６は、図２４（Ｃ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“疲れている”及び“お腹空いている”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－５を選択する。話題決定部１２６は、選択した話題モジュール１１３－５における話題（例えば、“ラーメン食べたいか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0117】

【0118】

ユーザは、スピーカー４０から出力された音声に応じて、“食べたい”と発話したとする（ステップＳ２０６）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“食べたい”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0119】

【0120】

状態更新部１２５は、図２４（Ｄ）に示すように、状態情報１１２で示される状態“ラーメン食べたい”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２４（Ｄ）に示す通り、状態情報１１２で示される状態“疲れている”、“お腹空いている”及び“ラーメン食べたい”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0121】

例えば、話題決定部１２６は、図２４（Ｄ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“疲れている”、“お腹空いている”及び“ラーメン食べたい”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－６を選択する。話題決定部１２６は、選択した話題モジュール１１３－６における話題（例えば、“パスタ食べたいか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0122】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“パスタ食べたいか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“パスタ食べたいか聞く”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“お腹空いているなら、パスタ食べたくない？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“お腹空いているなら、パスタ食べたくない？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“お腹空いているなら、パスタ食べたくない？”という音声がスピーカー４０から出力される（ステップＳ２０７）。

【0123】

ユーザは、スピーカー４０から出力された音声に応じて、“食べたい”と発話したとする（ステップＳ２０８）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“食べたい”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0124】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“パスタ食べたいか聞く”であり、解析部１２４により解析された発話内容が“食べたい”である。そこで、状態更新部１２５は、該当する候補状態として“パスタ食べたい”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0125】

状態更新部１２５は、図２４（Ｅ）に示すように、状態情報１１２で示される状態“パスタ食べたい”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２４（Ｅ）に示す通り、状態情報１１２で示される状態“疲れている”、“お腹空いている”、“ラーメン食べたい”及び“パスタ食べたい”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0126】

例えば、話題決定部１２６は、図２４（Ｅ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“疲れている”、“お腹空いている”、“ラーメン食べたい”及び“パスタ食べたい”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－３を選択する。話題決定部１２６は、選択した話題モジュール１１３－３における話題（例えば、“ラーメン店紹介ＯＫか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0127】

【0128】

ユーザは、スピーカー４０から出力された音声に応じて、“いいよ”と発話したとする（ステップＳ２１０）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“いいよ”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0129】

【0130】

状態更新部１２５は、図２４（Ｆ）に示すように、状態情報１１２で示される状態“ラーメン店紹介ＯＫ”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２４（Ｆ）に示す通り、状態情報１１２で示される状態“疲れている”、“お腹空いている”、“ラーメン食べたい”、“パスタ食べたい”及び“ラーメン店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0131】

例えば、話題決定部１２６は、図２４（Ｆ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“疲れている”、“お腹空いている”、“ラーメン食べたい”、“パスタ食べたい”及び“ラーメン店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－４を選択する。話題決定部１２６は、選択した話題モジュール１１３－４における話題（例えば、“パスタ店紹介ＯＫか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0132】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“パスタ店紹介ＯＫか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“パスタ店紹介ＯＫか聞く”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“パスタ食べたいなら、パスタ店紹介してもいい？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“パスタ食べたいなら、パスタ店紹介してもいい？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“パスタ食べたいなら、パスタ店紹介してもいい？”という音声がスピーカー４０から出力される（ステップＳ２１１）。

【0133】

ユーザは、スピーカー４０から出力された音声に応じて、“いいよ”と発話したとする（ステップＳ２１２）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“いいよ”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0134】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“パスタ店紹介ＯＫか聞く”であり、解析部１２４により解析された発話内容が“いいよ”である。そこで、状態更新部１２５は、該当する候補状態として“パスタ店紹介ＯＫ”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0135】

状態更新部１２５は、図２５（Ａ）に示すように、状態情報１１２で示される状態“パスタ店紹介ＯＫ”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２５（Ａ）に示す通り、状態情報１１２で示される状態“疲れている”、“お腹空いている”、“ラーメン食べたい”、“パスタ食べたい”、“ラーメン店紹介ＯＫ”及び“パスタ店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0136】

例えば、話題決定部１２６は、図２５（Ａ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態が“疲れている”、“お腹空いている”、“ラーメン食べたい”、“パスタ食べたい”、“ラーメン店紹介ＯＫ”及び“パスタ店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－１を選択する。話題決定部１２６は、選択した話題モジュール１１３－１における話題（例えば、“ラーメン店を推薦する”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0137】

【0138】

ユーザは、スピーカー４０から出力された音声に応じて、“分かった”と発話したとする（ステップＳ２１４）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“分かった”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0139】

【0140】

状態更新部１２５は、図２５（Ｂ）に示すように、状態情報１１２で示される状態“ラーメン店推薦”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２５（Ｂ）に示す通り、状態情報１１２で示される状態“疲れている”、“お腹空いている”、“ラーメン食べたい”、“パスタ食べたい”、“ラーメン店紹介ＯＫ”、“パスタ店紹介ＯＫ”及び“ラーメン店推薦”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0141】

例えば、話題決定部１２６は、図２５（Ｂ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“疲れている”、“お腹空いている”、“ラーメン食べたい”、“パスタ食べたい”、“ラーメン店紹介ＯＫ”、“パスタ店紹介ＯＫ”及び“ラーメン店推薦”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－２を選択する。話題決定部１２６は、選択した話題モジュール１１３－２における話題（例えば、“パスタ店を推薦する”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0142】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“パスタ店を推薦する”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図４に示す出力言語情報１１４を参照し、話題決定部１２６により決定された話題（例えば、“パスタ店を推薦する”）に対応する出力音声文字列を選択する。図４に示す例では、出力言語情報１１４は、出力音声文字列として“パスタ店紹介ＯＫなら、〇〇っていうパスタ屋がおすすめ”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“パスタ店紹介ＯＫなら、〇〇っていうパスタ屋がおすすめ”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“パスタ店紹介ＯＫなら、〇〇っていうパスタ屋がおすすめ”という音声がスピーカー４０から出力される（ステップＳ２１５）。

【0143】

ユーザは、スピーカー４０から出力された音声に応じて、“分かった”と発話したとする（ステップＳ２１６）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“分かった”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0144】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“パスタ店を推薦する”であり、解析部１２４により解析された発話内容が“分かった”である。そこで、状態更新部１２５は、該当する候補状態として“パスタ店推薦聞いた”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0145】

状態更新部１２５は、図２５（Ｃ）に示すように、状態情報１１２で示される状態“パスタ店推薦聞いた”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２５（Ｃ）に示す通り、状態情報１１２で示される状態“お腹空いている”、“ラーメン食べたい”、“ラーメン店紹介ＯＫ”、“ラーメン店推薦聞いた”及び“パスタ店推薦聞いた”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0146】

【0147】

図２６は、話題モジュールセット１１３の一例（その３）を示す図である。図２６に示す例では、全ての話題モジュール１１３－ｎを、優先したいゴールに関する話題を優先的に並べている。図２６では、「ラーメン店を推薦する」というゴールを「パスタ店を推薦する」というゴールよりも優先するような配置としている。このような順に並べることで、複数あるゴールのうちどれだけゴールまでの距離が遠くてもいいので優先度の高いゴールを最優先とすることができる。

【0148】

［対話システム１００の処理（その３）］
図２７は、実施形態における対話システム１００の処理の流れを示すシーケンス図（その３）である。なお、図２７の処理の説明では、話題モジュール１１３－ｎが図２６に示す階層構造で配置されているものとする。図２７において、ユーザから対話装置１０に向かう矢印上の文字列は対話装置１０が出力する音声であり、対話装置１０からユーザに向かう矢印上の文字列は対話装置１０が解析したユーザの発話内容である。さらに、図２７の処理開始時の状態情報１１２で示される各状態の変数は初期値であるものとする。

【0149】

対話装置１０の話題決定部１２６は、検出部１２２によりユーザの行動が検知されて状態更新部１２５により状態情報１１２の情報が更新されたことを契機に、状態情報１１２と話題モジュールセット１１３とに基づいて話題を決定する。図２７の処理開始時の状態情報１１２で示される各状態の変数は、図２８（Ａ）に示す通り“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。例えば、話題決定部１２６は、図２８（Ａ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、各候補状態が“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－７を選択する。話題決定部１２６は、選択した話題モジュール１１３－７における話題（例えば、“お腹空いているか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0150】

【0151】

ユーザは、スピーカー４０から出力された音声に応じて、“空いた”と発話したとする（ステップＳ３０２）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“空いた”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0152】

【0153】

状態更新部１２５は、図２８（Ｂ）に示すように、状態情報１１２で示される状態“お腹空いている”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２８（Ｂ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0154】

例えば、話題決定部１２６は、図２８（Ｂ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－５を選択する。話題決定部１２６は、選択した話題モジュール１１３－５における話題（例えば、“ラーメン食べたいか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0155】

【0156】

ユーザは、スピーカー４０から出力された音声に応じて、“食べたくない”と発話したとする（ステップＳ３０４）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“食べたくない”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0157】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“ラーメン食べたいか聞く”であり、解析部１２４により解析された発話内容が“食べたくない”である。そこで、状態更新部１２５は、該当する候補状態として“ラーメン食べたい”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0158】

状態更新部１２５は、図２８（Ｃ）に示すように、状態情報１１２で示される状態“ラーメン食べたい”に対応付けられている変数“Ｕ”を“Ｎ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２８（Ｃ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｙ”であり、状態情報１１２で示される状態“ラーメン食べたい”が“Ｎ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0159】

例えば、話題決定部１２６は、図２８（Ｃ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態が“お腹空いている”が“Ｙ”であり、状態情報１１２で示される状態“ラーメン食べたい”が“Ｎ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－６を選択する。話題決定部１２６は、選択した話題モジュール１１３－６における話題（例えば、“パスタ食べたいか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0160】

【0161】

【0162】

【0163】

状態更新部１２５は、図２８（Ｄ）に示すように、状態情報１１２で示される状態“パスタ食べたい”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２８（Ｄ）に示す通り、状態情報１１２で示される状態“お腹空いている”及び“パスタ食べたい”が“Ｙ”であり、状態情報１１２で示される状態“ラーメン食べたい”が“Ｎ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0164】

例えば、話題決定部１２６は、図２８（Ｄ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”及び“パスタ食べたい”が“Ｙ”であり、状態情報１１２で示される状態“ラーメン食べたい”が“Ｎ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－４を選択する。話題決定部１２６は、選択した話題モジュール１１３－４における話題（例えば、“パスタ店紹介ＯＫか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0165】

【0166】

ユーザは、スピーカー４０から出力された音声に応じて、“いいよ”と発話したとする（ステップＳ２０８）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“いいよ”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0167】

【0168】

状態更新部１２５は、図２８（Ｅ）に示すように、状態情報１１２で示される状態“パスタ店紹介ＯＫ”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２８（Ｅ）に示す通り、状態情報１１２で示される状態“お腹空いている”、“パスタ食べたい”及び“パスタ店紹介ＯＫ”が“Ｙ”であり、状態情報１１２で示される状態“ラーメン食べたい”が“Ｎ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0169】

例えば、話題決定部１２６は、図２８（Ｅ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”、“パスタ食べたい”及び“パスタ店紹介ＯＫ”が“Ｙ”であり、状態情報１１２で示される状態“ラーメン食べたい”が“Ｎ”であり、それ以外の状態は“Ｕ”）の組み合わせを参照して、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－２を選択する。話題決定部１２６は、選択した話題モジュール１１３－２における話題（例えば、“パスタ店を推薦する”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0170】

【0171】

ユーザは、スピーカー４０から出力された音声に応じて、“分かった”と発話したとする（ステップＳ３１０）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“分かった”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0172】

【0173】

状態更新部１２５は、図２８（Ｆ）に示すように、状態情報１１２で示される状態“パスタ店推薦聞いた”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図２８（Ｆ）に示す通り、状態情報１１２で示される状態“お腹空いている”、“パスタ食べたい”、“パスタ店紹介ＯＫ”及び“パスタ店推薦聞いた”が“Ｙ”であり、状態情報１１２で示される状態“ラーメン食べたい”が“Ｎ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0174】

【0175】

上述した説明では、ユーザが対話装置１０からの出力に対して肯定的な回答のみをする場合の処理を示していた。一般的な対話では、否定的な回答がなされることも想定される。本発明における対話装置１０では、話題モジュールセットを構成する話題モジュールの組み合わせによって、否定的な回答がなされた場合においても自然な話題転換が可能である。以下、詳細に説明する。まず説明するにあたり、図２９に示すような話題モジュールセット１１３を用いる。図２９は、実施形態における話題モジュールセット１１３の一例（その４）を示す図である。話題モジュールセット１１３は、例えば、図２９に示すように予め定められた優先順位で各話題モジュール１１３－１１～１１３－１８が階層構造に配置されて構成される。

【0176】

図２９に示す例では、全ての話題モジュール１１３－１１～１１３－１８を、ゴールから近い距離（ゴールまでに経由する話題の数）順に並べている。例えば、ユーザとの対話で達成したいゴールが、「ラーメン店を推薦する」と「マッサージ店を推薦する」とであり、「ラーメン店を推薦する」というゴールに至るまでの話題が「お腹空いている？」⇒「ラーメン食べたい？」⇒「ラーメン店紹介ＯＫ？」⇒「ラーメン店を推薦する」であり、「マッサージ店を推薦する」というゴールに至るまでの話題が「疲れた？」⇒「癒す方法を知りたい？」⇒「マッサージ店紹介ＯＫ？」⇒「マッサージ店を推薦する」であるとする。

【0177】

この場合、「疲れた？」及び「お腹空いている？」の話題が最もゴールまでの距離が遠く（距離＝３）、「ラーメン食べたい？」及び「癒す方法を知りたい？」との話題が次にゴールまでの距離が遠く（距離＝２）、「ラーメン店紹介ＯＫ？」及び「マッサージ店紹介ＯＫ？」との話題が最もゴールまでの距離が近い（距離＝１）。そして、各話題を予め定められた優先順位（例えば、ゴールから近い距離順、かつ、マッサージよりラーメン優先）で並べて、対応する起動条件を設定することで図２９に示す構成となる。

【0178】

［対話システム１００の処理（その４）］
図３０は、実施形態における対話システム１００の処理の流れを示すシーケンス図（その４）である。なお、図３０の処理の説明では、話題モジュール１１３－ｎが図２９に示す階層構造で配置されているものとする。図３０において、ユーザから対話装置１０に向かう矢印上の文字列は対話装置１０が出力する音声であり、対話装置１０からユーザに向かう矢印上の文字列は対話装置１０が解析したユーザの発話内容である。さらに、図３０の処理開始時の状態情報１１２で示される各状態の変数は初期値（例えば、Ｕ）であるものとする。

【0179】

対話装置１０の話題決定部１２６は、処理開始時において検出部１２２によりユーザの行動が検知されて状態更新部１２５により状態情報１１２の情報が更新されたことを契機に、状態情報１１２と話題モジュールセット１１３とに基づいて話題を決定する。図３０の処理開始時の状態情報１１２で示される各状態の変数は、図３１（Ａ）に示す通り“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の高い話題モジュール１１３－ｎを選択する。例えば、話題決定部１２６は、図３１（Ａ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、各候補状態が“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－１７を選択する。話題決定部１２６は、選択した話題モジュール１１３－１７における話題（例えば、“お腹空いているか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0180】

【0181】

ユーザは、スピーカー４０から出力された音声に応じて、“空いてない”と発話したとする（ステップＳ４０２）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“空いてない”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0182】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“お腹空いているか聞く”であり、解析部１２４により解析された発話内容が“空いてない”である。そこで、状態更新部１２５は、該当する候補状態として“お腹空いている”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0183】

状態更新部１２５は、図３１（Ｂ）に示すように、状態情報１１２で示される状態“お腹空いている”に対応付けられている変数“Ｕ”を“Ｎ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図３１（Ｂ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｎ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0184】

例えば、話題決定部１２６は、図３１（Ｂ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”が“Ｎ”であり、それ以外の状態は“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－１８を選択する。話題決定部１２６は、選択した話題モジュール１１３－１８における話題（例えば、“疲れているか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0185】

【0186】

ユーザは、スピーカー４０から出力された音声に応じて、“疲れている”と発話したとする（ステップＳ４０４）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“疲れている”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0187】

【0188】

状態更新部１２５は、図３１（Ｃ）に示すように、状態情報１１２で示される状態“疲れている”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図３１（Ｃ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｎ”であり、“疲れている”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0189】

例えば、話題決定部１２６は、図３１（Ｃ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”が“Ｎ”であり、“疲れている”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－１６を選択する。話題決定部１２６は、選択した話題モジュール１１３－１６における話題（例えば、“癒す方法を知りたいか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0190】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“癒す方法を知りたいか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。ここで、図４に示す出力言語情報１１４には、シナリオＳＣ３に相当する出力音声文字列が示されていない（説明の都合上省略していた）が、図１９にはシナリオＳＣ３に相当する出力音声文字列を示している。図２９のようにシナリオＳＣ３に相当する内容が話題モジュールセットに含まれる場合には、話題モジュールセット作成部１２０において図１９にはシナリオＳＣ３に相当する出力音声文字列が出力言語情報１１４に含まれるように生成される。ここで、シナリオＳＣ３に相当する出力音声文字列については図１９を参照して説明する。

【0191】

具体的には、言語生成部１２７は、図１９に示す出力音声文字列を参照し、話題決定部１２６により決定された話題（例えば、“癒す方法を知りたいか聞く”）に対応する出力音声文字列を選択する。図１９に示す例では、決定された話題（例えば、“癒す方法を知りたいか聞く”）に対応する出力音声文字列として“疲れているなら、癒す方法知りたくない？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“疲れているなら、癒す方法知りたくない？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“疲れているなら、癒す方法知りたくない？”という音声がスピーカー４０から出力される（ステップＳ４０５）。

【0192】

ユーザは、スピーカー４０から出力された音声に応じて、“知りたい”と発話したとする（ステップＳ４０６）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“知りたい”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0193】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“癒す方法を知りたいか聞く”であり、解析部１２４により解析された発話内容が“知りたい”である。そこで、状態更新部１２５は、該当する候補状態として“癒す方法知りたい”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0194】

状態更新部１２５は、図３１（Ｄ）に示すように、状態情報１１２で示される状態“癒す方法知りたい”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図３１（Ｄ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｎ”であり、“疲れている”及び“癒す方法知りたい”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0195】

例えば、話題決定部１２６は、図３１（Ｄ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”が“Ｎ”であり、“疲れている”及び“癒す方法知りたい”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－１４を選択する。話題決定部１２６は、選択した話題モジュール１１３－１４における話題（例えば、“マッサージ店紹介ＯＫか聞く”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0196】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“マッサージ店紹介ＯＫか聞く”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図１９に示す出力音声文字列を参照し、話題決定部１２６により決定された話題（例えば、“マッサージ店紹介ＯＫか聞く”）に対応する出力音声文字列を選択する。図１９に示す例では、話題決定部１２６により決定された話題（例えば、“マッサージ店紹介ＯＫか聞く”）に対応する出力音声文字列として“癒す方法知りたいなら、マッサージ店紹介してもいい？”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“癒す方法知りたいなら、マッサージ店紹介してもいい？”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“癒す方法知りたいなら、マッサージ店紹介してもいい？”という音声がスピーカー４０から出力される（ステップＳ４０７）。

【0197】

ユーザは、スピーカー４０から出力された音声に応じて、“いいよ”と発話したとする（ステップＳ４０８）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“いいよ”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0198】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“マッサージ店紹介ＯＫか聞く”であり、解析部１２４により解析された発話内容が“いいよ”である。そこで、状態更新部１２５は、該当する候補状態として“マッサージ店紹介ＯＫ”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0199】

状態更新部１２５は、図３１（Ｅ）に示すように、状態情報１１２で示される状態“マッサージ店紹介ＯＫ”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図３１（Ｅ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｎ”であり、“疲れている”、“癒す方法知りたい”及び“マッサージ店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0200】

例えば、話題決定部１２６は、図３１（Ｅ）に示す状態情報１１２における各候補状態に対応付けられている変数（例えば、候補状態“お腹空いている”が“Ｎ”であり、“疲れている”、“癒す方法知りたい”及び“マッサージ店紹介ＯＫ”が“Ｙ”であり、それ以外の状態は“Ｕ”）の組み合わせであって、起動条件として定義されている変数の組み合わせを満たす条件を含む話題モジュール１１３－ｎのうち、優先順位の最も高い話題モジュール１１３－１２を選択する。話題決定部１２６は、選択した話題モジュール１１３－１２における話題（例えば、“マッサージ店を推薦する”）を、出力対象の話題として決定する。話題決定部１２６は、決定した話題に関する情報を状態更新部１２５に出力する。

【0201】

言語生成部１２７は、話題決定部１２６により決定された話題（例えば、“マッサージ店を推薦する”）と、出力言語情報１１４とに基づいて音声出力させる文字列を生成する。具体的には、言語生成部１２７は、図１９に示す出力音声文字列を参照し、話題決定部１２６により決定された話題（例えば、“マッサージ店を推薦する”）に対応する出力音声文字列を選択する。図１９に示す例では、話題決定部１２６により決定された話題（例えば、“マッサージ店を推薦する”）に対応する出力音声文字列として“マッサージ店紹介ＯＫなら、〇〇っていうマッサージ店がおすすめ”を選択する。音声合成部１２８は、言語生成部１２７により選択された出力音声文字列“マッサージ店紹介ＯＫなら、〇〇っていうマッサージ店がおすすめ”に対応する音声信号を生成し、生成した音声信号を、スピーカー４０を介して出力する。これにより、“マッサージ店紹介ＯＫなら、〇〇っていうマッサージ店がおすすめ”という音声がスピーカー４０から出力される（ステップＳ４０９）。

【0202】

ユーザは、スピーカー４０から出力された音声に応じて、“分かった”と発話したとする（ステップＳ４１０）。ユーザにより発話された音声はマイク３０を介して対話装置１０に入力される。音声認識部１２３は、音声認識処理によりユーザが発話した音声に対応する文字列を生成する。音声認識部１２３により生成された文字列は、解析部１２４による自然言語処理で解析される。これにより、ユーザが“分かった”と発話したことが解析される。状態更新部１２５は、解析部１２４により解析された発話内容に基づいて、状態情報１１２を更新する。

【0203】

具体的には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報と、解析部１２４により解析された発話内容とを踏まえて、状態情報１１２で示される候補状態の中から該当する候補状態を選択する。例えば、話題決定部１２６から出力された話題に関する情報が“マッサージ店を推薦する”であり、解析部１２４により解析された発話内容が“分かった”である。そこで、状態更新部１２５は、該当する候補状態として“マッサージ店推薦聞いた”を選択する。なお、話題モジュール１１３－ｎにおける話題と、状態情報１１２で示される各候補状態とが予め対応付けられている場合には、状態更新部１２５は、話題決定部１２６から出力された話題に関する情報に対応付けられている候補状態を選択すればよい。

【0204】

状態更新部１２５は、図３１（Ｆ）に示すように、状態情報１１２で示される状態“マッサージ店推薦聞いた”に対応付けられている変数“Ｕ”を“Ｙ”に更新する。話題決定部１２６は、状態更新部１２５により状態情報１１２が更新されると、更新後の状態情報１１２と、話題モジュールセット１１３とに基づいて次に話すべき話題を決定する。この時点の状態情報１１２で示される各状態の変数は、図３１（Ｆ）に示す通り、状態情報１１２で示される状態“お腹空いている”が“Ｎ”であり、“疲れている”、“癒す方法知りたい”、“マッサージ店紹介ＯＫ”及び“マッサージ店推薦聞いた”が“Ｙ”であり、それ以外の状態は“Ｕ”である。話題決定部１２６は、話題モジュールセット１１３を参照し、状態情報１１２における各候補状態に対応付けられている変数の組み合わせで満たされる条件を含む話題モジュール１１３－ｎであって、かつ、優先順位の最も高い話題モジュール１１３－ｎを選択する。

【0205】

ところが、現時点においては選択可能な話題がない。この場合、対話装置１０はユーザとの対話を終了する。なお、状態更新部１２５は、他の装置又は機能部からの指示で一部または全ての変数の初期化を行ってもよい。このように、図３０に示す処理では、ユーザから否定的な回答が得られた場合においても、自然に他の話題に転換して対話を続けることができる。

【0206】

（ユーザと対話装置１０とがテキストによる対話を行う構成）
以上が、対話装置１０が、ユーザの発話内容に応じて話題を決定し、決定された話題による内容を音声出力させる構成の一実施形態の説明である。次に、ユーザと対話装置１０とがテキストによる対話を行う構成について説明する。このように構成される場合、対話システム１００は、マイク３０及びスピーカー４０を備えなくてよい。さらに、対話装置１０は、音声認識部１２３及び音声合成部１２８を備えなくてよい。テキストにより話題に関する内容を出力する手段として、チャットボット等のテキスト出力手段が用いられる。

【0207】

ユーザと対話装置１０とがテキストによる対話を行う場合には、ユーザは、自身が保持するスマートフォン等の通信装置、又は、対話装置１０に接続されるキーボード等の入力装置を介して、対話内容に関する文字列を対話装置１０に入力する。対話装置１０の解析部１２４は、入力された文字列と、記憶部１１に記憶されている辞書１１１とを用いて自然言語処理を行うことでユーザが入力した内容を解析する。解析部１２４による内容の解析から言語生成部１２７による文字列を生成までの処理は、音声及び発話をテキストに置き換えれば処理は上述した処理と同じである。その後、対話装置１０は、不図示の表示制御部により、言語生成部１２７により生成された文字列を表示装置５０に表示させる。表示制御部は、制御部１２で実現される機能である。

【0208】

このように構成される場合、聴覚に障害があるユーザにおいても、対話システム１００を利用することが可能になる。このように、対話システム１００の利便性を向上させることが可能になる。

【0209】

（ユーザが音声による対話を行い、対話装置１０がテキストによる対話を行う構成）
ユーザが音声による対話を行い、対話装置１０がテキストによる対話を行う構成について説明する。このように構成される場合、対話システム１００は、スピーカー４０を備えなくてよい。さらに、対話装置１０は、音声合成部１２８を備えなくてよい。ユーザが音声による対話を行い、対話装置１０がテキストによる対話を行う場合には、マイク３０による音声入力から言語生成部１２７による文字列を生成までの処理は、上述した実施形態の処理と同じである。その後、対話装置１０は、不図示の表示制御部により、言語生成部１２７により生成された文字列を表示装置５０に表示させる。表示制御部は、制御部１２で実現される機能である。

【0210】

【0211】

（ユーザがテキストによる対話を行い、対話装置１０が音声出力による対話を行う構成）
ユーザがテキストによる対話を行い、対話装置１０が音声出力による対話を行う構成について説明する。このように構成される場合、対話システム１００は、マイク３０を備えなくてよい。さらに、対話装置１０は、音声認識部１２３を備えなくてよい。ユーザがテキストによる対話を行い、対話装置１０が音声出力による対話を行う場合には、ユーザは、自身が保持するスマートフォン等の通信装置、又は、対話装置１０に接続されるキーボード等の入力装置を介して、対話内容に関する文字列を対話装置１０に入力する。対話装置１０の解析部１２４は、入力された文字列と、記憶部１１に記憶されている辞書１１１とを用いて自然言語処理を行うことでユーザが入力した内容を解析する。以降の処理は、上述した実施形態に記載の処理と同じである。

【0212】

このように構成される場合、発話が困難なユーザにおいても、対話システム１００を利用することが可能になる。このように、対話システム１００の利便性を向上させることが可能になる。

【0213】

以上のように構成された対話システム１００によれば、対話装置１０の話題モジュールセット作成部１２０が、一方向の対話の流れが記述された１以上のシナリオに基づいて、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットを作成する。対話装置１０は、状態情報１１２と話題モジュールセット１１３とに基づいて、ユーザの状態に応じた話題を決定し、決定された話題による内容を出力させる。このように、対話装置１０では、状態情報１１２を参照して、複数の話題モジュール１１３－ｎの中から起動条件を満たした話題による内容を出力することができる。したがって、ユーザの状態に応じた話題による内容を出力することができる。さらに、対話装置１０は、起動条件を満たしたいずれかの話題による内容を出力することができるため、複雑な話題の遷移パターンを想定しきれていない場合であっても対話を継続させることが可能になる。

【0214】

上述したように、対話装置１０は、一方向の対話の流れが記述された１以上のシナリオＳＣを用いる。これにより、設計者は、複雑な分岐を含むシナリオＳＣを作成する必要がなく、単に一方向の対話の流れが記述された１以上のシナリオＳＣを作成すればよい。そして、対話装置１０は、一方向の対話の流れが記述された１以上のシナリオＳＣを用いることで容易に話題モジュールセットを作成することができる。

【0215】

対話装置１０は、ユーザの発話内容又はテキストにより入力された内容に応じて状態情報１１２を更新する。これにより、対話履歴を加味した話題を決定することができる。したがって、対話装置１０は、過去の会話と関係ない話題を選択してしまう確率を低減することができる。そのため、対話を継続させることが可能になる。

【0216】

話題モジュールセットは、定められた優先順位で各話題モジュールが階層構造に配置されており、対話装置１０は、状態情報に基づいて、満たされた起動条件に対応付けられた話題のうち、優先順位の最も高い話題をユーザの状態に応じた話題として決定する。これにより、設計者の意図に沿って対話を進めることができる。

【0217】

＜変形例１＞
話題モジュールセット１１３を構成する話題モジュール１１３－ｎの並び順は、処理の前後又は処理の途中で変更されてもよい。例えば、対話装置１０は、処理開始時において話題モジュール１１３－ｎの並び順が図３の並び順であったとして、処理の途中又は処理の終了後に話題モジュール１１３－ｎの並び順を図２２の並び順に変更してもよい。このように構成される場合、対話装置１０は、話題モジュール１１３－ｎの並び順に関する情報を複数保持しておき、並び替え条件が満たされたタイミングで話題モジュール１１３－ｎの並び順を変更すればよい。並び替え条件は、例えば１つの処理（例えば、図２０、図２３及び図２７等の処理）が終了することであってもよいし、予め定められた時刻になったことであってもよいし、外部から変更の指示がなされたことであってもよい。
このように構成されることによって、対話の進め方の自由度を広げることができる。そのため、利便性を向上させることが可能になる。

【0218】

＜変形例２＞
上述した対話システム１００では、表示装置５０に二次元で表現されたエージェントを表示して、エージェントが話しかけているように見せていた。これに対して、表示装置５０に代えて、対話装置１０の近傍にロボットを設置し、ロボットが話しかけているように構成されてもよい。図３０は、変形例における対話システム１００ａの構成の一例を示す図である。対話システム１００ａは、対話装置１０ａと、カメラ２０と、マイク３０と、スピーカー４０と、ロボット６０とを備える。カメラ２０と、マイク３０と、スピーカー４０と、ロボット６０とは、有線又は無線により対話装置１０ａに接続される。

【0219】

ロボット６０は、対話装置１０ａによって送信された制御情報に応じて、各駆動機構や発光部、スピーカー又はカメラ等のロボット６０に設けられた機能を制御することによって、所定の動作を実行する。例えば、ロボット６０は、首、肩又は腕の各関節部に設けられた駆動機構を作動することによって動作する。ロボット６０は、例えば、肩又は脚等の各関節部に設けられた駆動機構を作動して歩行する動物の形状であってもよい。ロボット６０は、肩又は脚等の各関節部に設けられた駆動機構を作動して自立歩行する二足歩行等のロボット（ヒューマノイド）であってもよい。ロボット６０は、車輪又は無限軌道で移動できるような移動型ロボット（エージェント化されたロボット）であってもよい。ロボット６０は、例えばテーブルや受付台等の板状の台の上に設置される。

【0220】

対話装置１０ａは、記憶部１１ａと、制御部１２ａとを備える。記憶部１１ａには、辞書１１１、状態情報１１２、話題モジュールセット１１３、出力言語情報１１４及び動作制御情報１１５ａ等が記憶される。記憶部１１ａは、磁気記憶装置や半導体記憶装置などの記憶装置を用いて構成される。動作制御情報１１５ａは、ロボット６０を制御するための情報を含む。例えば、動作制御情報１１５ａは、話題又は出力音声文字列と、制御内容とが対応付けられたテーブルであってもよい。制御内容は、各駆動機構や発光部、スピーカー又はカメラ等のロボット６０に設けられた機能を制御するための内容である。

【0221】

制御部１２ａは、対話装置１０ａ全体を制御する。制御部１２ａは、ＣＰＵ等のプロセッサやメモリを用いて構成される。制御部１２ａは、プログラムを実行することによって、話題モジュールセット作成部１２０と、状態情報作成部１２１と、検出部１２２と、音声認識部１２３と、解析部１２４と、状態更新部１２５と、話題決定部１２６と、言語生成部１２７と、音声合成部１２８と、動作制御部１２９ａの機能を実現する。

【0222】

話題モジュールセット作成部１２０、状態情報作成部１２１、検出部１２２、音声認識部１２３、解析部１２４、状態更新部１２５、話題決定部１２６、言語生成部１２７、音声合成部１２８及び動作制御部１２９ａのうち一部または全部は、ＡＳＩＣやＰＬＤ、ＦＰＧＡなどのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアとの協働によって実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置などの非一時的な記憶媒体である。プログラムは、電気通信回線を介して送信されてもよい。

【0223】

話題モジュールセット作成部１２０、状態情報作成部１２１、検出部１２２、音声認識部１２３、解析部１２４、状態更新部１２５、話題決定部１２６、言語生成部１２７、音声合成部１２８及び動作制御部１２９ａの機能の一部は、予め対話装置１０ａに搭載されている必要はなく、追加のアプリケーションプログラムが対話装置１０ａにインストールされることで実現されてもよい。

【0224】

動作制御部１２９ａは、話題決定部１２６により決定された話題又は話題に基づく情報と、動作制御情報１１５ａとに基づいて、ロボット６０の動作を制御する。具体的には、動作制御部１２９は、動作制御情報１１５ａを参照し、話題決定部１２６により決定された話題に対応付けられた制御内容を取得する。動作制御部１２９ａは、取得した制御内容を実行させるための制御情報を生成する。動作制御部１２９ａは、生成した制御情報をロボット６０に出力することによって、ロボット６０の動作を制御する。

【0225】

なお、動作制御情報１１５ａとして、出力音声文字列と、制御内容とが対応付けられたテーブルが用いられる場合、動作制御部１２９ａは、出力言語情報１１４を参照し、話題決定部１２６により決定された話題に対応付けられた出力音声文字列を取得する。動作制御部１２９ａは、動作制御情報１１５ａを参照し、取得した出力音声文字列に対応付けられた制御内容を取得する。動作制御部１２９ａは、取得した制御内容を実行させるための制御情報を生成する。動作制御部１２９ａは、生成した制御情報をロボット６０に出力することによって、ロボット６０の動作を制御する。

【0226】

＜変形例３＞
上述した実施形態では、ある話題に関するユーザ状態の情報が既に得られている場合でも、処理の流れによってはその話題に関する内容を音声出力してしまい、対話として不自然になる可能性がある。このような現象は、話題をスキップしたことにより、途中に確認すべき話題を飛ばして先の話題に関する内容を聞いてしまった際に起こりうる。例えば、シーケンス中の「パスタ屋知りたい？」という話題へのユーザ回答が既に得られているとする。上述した構成では、そのような状況であっても、「パスタ屋知りたい？」という話題の前に想定された「パスタ食べたい？」や「お腹空いた？」の話題モジュール１１３－ｎが起動条件を満たしている場合、それらの話題が選択・出力される可能性がある。したがって、「お腹空いた？」→「パスタ食べたい？」というようなパスタ店の紹介が予想できるような話題展開にもかかわらず、本来それらの次に選択される「パスタ屋知りたい？」は選択されずに、「ラーメン食べたい？」のような別の話題シーケンスのものになってしまうことがあり、ユーザがその話題展開を拍子抜けで不自然だと感じる可能性がある。

【0227】

そこで、上述した実施形態において、各話題モジュール１１３－ｎの起動条件として、シーケンス中でその話題モジュール１１３－ｎよりも後に登場する話題への回答が埋まっていないことを＆で追加する方法がある。例えば、「パスタ食べたい？」という話題を持つ話題モジュール１１３－ｎは一つ後の話題の回答を記録する状態変数「パスタ屋知りたい」＝初期値という条件を＆で追加する。同様に、「お腹空いた？」という話題を持つ話題モジュール１１３－ｎは、それ以降の話題の回答を記録する状態変数「パスタ食べたい」＝初期値、「パスタ屋知りたい」＝初期値という条件を＆で追加する。これらの起動条件よって、各シーケンスで後に登場する話題へのユーザ回答が既に得られている場合、それ以前の話題は選択されなくすることができる。

【0228】

＜変形例４＞
上述した実施形態では、ユーザからの話題転換に対応できない場合がある。これは、上述した話題の選択ルールでは必ずしもユーザの直前の発話内容に基づいて対話装置１０、１０ａにおいて次の話題が選択されるとは限らないためである。具体的には、現在選択されている話題モジュール１３－ｎよりも優先度の低い話題モジュール１３－ｎを起動させるようなユーザの発話内容が得られた場合、対話装置１０、１０ａは直前の話題をそのまま繰り返すため、ユーザの直前の発話を反映した話題は選択できない。例えば、あるシーケンスの最後のステップに該当する話題「パスタ屋知りたい？」を実行中である場合を考える。この時、ユーザが話題を転換して、別のシーケンスの話題の根拠となるような「ラーメンも食べたい」という趣旨の発言をしたとしても、次のターンでは階層構造でより優先度の高い現在の話題「パスタ屋知りたい？」が優先されるため、直前のユーザの発話「ラーメンも食べたい」を即座に反映した話題変更は行なわれない。その結果、対話装置１０、１０ａとしては、ユーザの話題転換の意図を受け付けず、対話装置１０、１０ａ自身の意図を優先させて話題を提示するように振舞ってしまうことになる。このような状況では、ユーザの対話意欲を低減させる可能性が高い。その一方で、ユーザの発言を常に踏まえ続けていると、話題誘導が全く達成できない可能性もある。一定の割合で対話装置１０、１０ａの意図を押し通すことが、対話システム１００における意図や欲求が強調され、対話感の向上に繋がる可能性もある。

【0229】

そこで、話題決定部１２６は、状態情報１１２における変数がアップデートされたことを知らせる発話（例えば、「ラーメン食べたい」の変数が“Ｙ”にアップデートされた際に、「そっか、ラーメン食べたいんだ」との発話）を行うように話題を決定してもよい。これによって、「そっか、ラーメン食べたいんだ。えっと、今の話だけど、パスタは食べたい？」のように、対話装置１０、１０ａがユーザからの話題転換に応じない場合でも、ユーザの発言自体は理解できていることをユーザに示せるため、対話感を維持することができる。

【0230】

＜変形例５＞
上述した実施形態では、継続的にターゲットの話題に可能な限り早く辿り着けるような話題を必ず選択する。しかし、これが何度も続くと、対話システム１００側に何かしらの目標の話題へ誘導しようとする意図(例えば、デートの誘い、宣伝)があるとユーザが感づく可能性がある。例えば、宣伝においては、その意図を隠すことが宣伝成功の可否にもかかわるため、この振る舞いによって宣伝の成功率が低下する恐れがある。この振る舞いの改善のために、例えば、多くの時間は宣伝の意図性が低い話題で雑談的に振る舞い、稀に宣伝に誘導する話題展開を行うというような制御が考えられる。

【0231】

そこで、このような機能を実現するための方法として、二つの方法について説明する。一つは、話題モジュール群を設定し、それらの優先順位をダイナミックに入れ替える方法である。話題モジュール群とは、同様の機能を持つ複数の話題モジュール１１３－ｎをまとめて一つのグループとして捉えた単位である。例えば、各シーケンスの序盤の話題で構成された話題モジュール１１３－ｎの階層をまとめて雑談話題モジュール群、シーケンス終盤の話題の階層構造を宣伝話題モジュール群と定義する。対話開始時や宣伝完了時から一定の話題数をこなすまでは、雑談話題モジュール群の優先順位を宣伝話題モジュール群よりも高く設定する。その後、一定の話題数をこなすと、宣伝話題モジュール群を相対的に高い優先順位に変更する。これによって、多くの時間は宣伝の意図性が低い各シーケンスの序盤の話題を集中的に選び続け、比較的小さい頻度でターゲットの話題へ誘導するシーケンスを実行することが可能となる。

【0232】

もう一つは、雑談を目的とした話題戦略シーケンスを設計し、それらのシーケンスの優先順位を高く設定するというものである。これによって、対話の初期には雑談を目的にしたシーケンスが実行・消費され、その後に宣伝を目的にしたシーケンスが実行される、といった振る舞いを実現可能である。

【0233】

＜変形例６＞
上述した実施形態では、話題誘導対話を対象としている一方で、店舗の場所や商品の特徴など、肝心の宣伝の内容やユーザからの質問への回答などといった話題は対象としていない。そこで、対話装置１０、１０ａにおいて、このような話題を音声出力するように構成されてもよい。ユーザからの質問への回答は、対話装置１０、１０ａが提示する他のどの話題よりも常に優先されるのが望ましい。そこで、対話装置１０、１０ａにおいて、上述した話題モジュールセット１１３（例えば、話題誘導対話のモジュールセット）のより上位に、回答モジュールセットを配置する。回答話題モジュールとは、ユーザからの質問を検知した際に、話題モジュールセット１１３と同様に、当てはまる話題（回答）を出力するものである。回答話題モジュールを話題誘導対話の各モジュールよりも上位に配置することで、回答話題モジュールの出力が常に話題誘導対話の出力よりも優先されて選択されるため、ユーザからの質問にいつでも回答できるようになる。

【0234】

上述した実施形態では、一度回答が得られた話題は選択されないようになっているが、時間の経過や対話の流れの中で、同じ話題を再び選びたい場合があると想定される。例えば、「お腹空いた？」「お疲れですか？」という質問は、一度回答を得ていたとしても、一定の時間経過で再び行いたい話題である。そこで、対話装置１０、１０ａにおいて所定の時間が経過したタイミングで、状態情報１１２で示される変数の一部又は全てを初期化するように構成されてもよい。

【0235】

＜変形例７＞
上述した実施形態では、ロボットや表示装置に表示されたエージェントから話題に応じた内容をユーザに提供する構成を示したが、話題に応じた内容をユーザに提供する手段としては、他の手段が用いられてもよい。他の手段として、例えばスマートスピーカー（音声出力装置）が用いられてもよい。スマートスピーカーが用いられる場合、音声合成部１２８は、決定された話題による内容をスマートスピーカーから出力させる。スマートスピーカーが用いられる場合、対話システム１００においてはカメラ２０、スピーカー４０及び表示装置５０を備えなくてよく、対話システム１００ａにおいてはカメラ２０及びスピーカー４０を備えなくてよい。対話システム１００，１００ａによる対話の開始は、ユーザからの発話をスマートスピーカーで認識したことを契機に実行される。このように構成される場合、動作制御部１２９、１２９ａは、スマートスピーカーの動作を制御する。

【0236】

上述した構成では、ユーザの発話内容又はテキストにより入力された内容に基づいて話題を決定する構成を示した。話題決定部１２６は、ユーザの発話内容又はテキストにより入力された内容の他に、ユーザの動作を加味して話題を決定するように構成されてもよい。このように構成される場合、ユーザの動作を起動条件とし、ユーザの動作に関する起動条件が満たされた場合にユーザに提供する話題を起動条件に対応付けた話題モジュールが必要になる。さらに、状態情報１１２には、ユーザの動作を状態とした情報が設定されることになる。

【0237】

ユーザの動作を起動条件とした話題モジュールとしては、起動条件として、例えば、「ロボットに手が伸びてきた」、「ロボットの電源を抜こうとしている」等のロボットに対するユーザの動作が設定される。さらに、起動条件が満たされた場合の話題として、例えば、「注意する」等のユーザの動作に対するロボットの危機回避用の話題が設定される。「注意する」という話題に応じた出力音声文字列として、出力言語情報１１４には「触らないで」や「抜かないで」等が設定される。

【0238】

このように作成されたロボットにとっての危機回避用の話題モジュールを話題モジュールセット１１３において最優先に配置することで、ロボット６０に手が伸びてきたという動作が検出部１２２により検知されると、状態更新部１２５は、検出部１２２により検知されたユーザの動作に基づいて状態情報１１２を更新する。話題決定部１２６は、話題モジュールセット１１３を参照し、「ロボットに手が伸びてきた」が“Ｙ”である起動条件に対応付けられた「注意する」を話題として決定する。そして、言語生成部１２７は、決定された話題「注意する」に対応付けられた「触らないで」という内容を音声又はテキストにより出力させる。

【0239】

同様に、ロボット６０の電源を抜こうとしているという動作が検出部１２２により検知されると、状態更新部１２５は、検出部１２２により検知されたユーザの動作に基づいて状態情報１１２を更新する。話題決定部１２６は、話題モジュールセット１１３を参照し、「ロボットの電源を抜こうとしている」が“Ｙ”である起動条件に対応付けられた「注意する」を話題として決定する。そして、言語生成部１２７は、決定された話題「注意する」に対応付けられた「抜かないで」という内容を音声又はテキストにより出力させる。ユーザの動作は、上述したように検出部１２２により検知される。

【0240】

別例として、ユーザの動作を起動条件とした話題モジュールとして以下のような構成が用いられてもよい。例えば、起動条件として、例えば、「ロボット６０や表示装置５０に表示されたエージェントに対して手を振ってきた」、「ロボット６０や表示装置５０に表示されたエージェントに対して顔を近づけてきた」等のロボットに対するユーザの動作が設定され、起動条件が満たされた場合の話題として、例えば、「ロボット、エージェント又は音声出力装置のいずれかの動作を制御する」等のユーザの動作に対する話題が設定された話題モジュールが用いられてもよい。「ロボット、エージェント又は音声出力装置のいずれかの動作を制御する」という話題に応じた動作制御として、「手を振りかえす」や「首を傾げる」等が挙げられる。なお、話題に応じた動作制御については、動作制御情報１１５，１１５ａに含まれる。

【0241】

このように作成された話題モジュールを話題モジュールセット１１３に配置することで、ユーザがロボット６０や表示装置５０に表示されたエージェントに対して手を振ってきたら、話題決定部１２６は、話題モジュールセット１１３を参照し、ロボット６０や表示装置５０に表示されたエージェントに対して手を振ってきたという動作が検出部１２２により検知されると、状態更新部１２５は、検出部１２２により検知されたユーザの動作に基づいて状態情報１１２を更新する。話題決定部１２６は、話題モジュールセット１１３を参照し、「ロボット６０や表示装置５０に表示されたエージェントに対して手を振ってきた」が“Ｙ”である起動条件に対応付けられた「ロボット、エージェント又は音声出力装置のいずれかの動作を制御する」を話題として決定する。そして、動作制御部１２９，１２９ａは、動作制御情報１１５，１１５ａを参照し、決定された話題「ロボット、エージェント又は音声出力装置のいずれかの動作を制御する」に対応付けられた「手を振りかえす」という内容に基づく動作を行うようにロボット６０又はエージェントを制御する。

【0242】

同様に、ユーザがロボット６０や表示装置５０に表示されたエージェントに対して顔を近づけてきたという動作が検出部１２２により検知されると、状態更新部１２５は、検出部１２２により検知されたユーザの動作に基づいて状態情報１１２を更新する。話題決定部１２６は、話題モジュールセット１１３を参照し、「ロボット６０や表示装置５０に表示されたエージェントに対して顔を近づけてきた」が“Ｙ”である起動条件に対応付けられた「ロボット、エージェント又は音声出力装置のいずれかの動作を制御する」を話題として決定する。そして、動作制御部１２９，１２９ａは、動作制御情報１１５，１１５ａを参照し、決定された話題「ロボット、エージェント又は音声出力装置のいずれかの動作を制御する」に対応付けられた「首を傾げる」という内容に基づく動作を行うようにロボット６０又はエージェントを制御する。

【0243】

以上のように構成されることによって、ユーザの動作に応じて話題を決定することも可能になる。そのため、様々な状況に応じた対話が可能になる。

【0244】

＜変形例８＞
上述した実施形態では、状態情報１１２がユーザの状態を表す情報である場合を例に説明したが、状態情報１１２には、ユーザの状態だけでなく対話システム１００の状態を表す情報が含まれてもよい。ここで、対話システム１００の状態とは、対話システム１００が行った動作に応じた状態を表す。例えば、対話システム１００の状態の一例として、「ＸＸ回〇〇と発話した」や、「ＹＹ回△△の動作を行った」等が挙げられる。実際の運用時には、一人のユーザに対して対話装置１０が複数回同じ内容を発話することや複数回同じ動作を実行することも想定される。このような対話システム１００を構成する装置（例えば、対話装置１０等）が行った発話や動作の状態も加味して、ユーザに対する発話内容を決定することで、ユーザの状態だけで発話内容を決定するよりも発話の幅を広げることができる。このように構成される場合、対話装置１０の記憶部１１には、状態情報１１２としてユーザの状態と対話システム１００の状態を表す情報が記憶される。さらに、話題モジュールセット１１３を構成する話題モジュールには、対話システム１００の状態も含めた起動条件が登録される。状態更新部１２５は、ユーザの発話内容又はテキストにより入力された内容に応じてユーザの状態情報の変数を更新し、対話システム１００における発話内容又は動作に応じて対話システム１００の状態情報の変数を更新する。話題決定部１２６は、状態情報１１２と話題モジュールセット１１３とに基づいて、ユーザの状態と対話システム１００の状態に応じた話題を決定する。

【0245】

話題決定部１２６は、状態情報１１２と話題モジュールセット１１３とに基づいて、対話システム１００の状態に応じた話題を決定してもよい。対話システム１００ａにおいても、状態情報１１２には、ユーザの状態だけでなく対話システム１００の状態を表す情報が含まれてもよい。

【0246】

＜変形例９＞
上述した実施形態では、起動条件が、状態情報１１２で示される各状態のいずれか２つ以上の組み合わせで構成される例を示したが、起動条件は少なくとも１つの候補状態を含んでいればよい。

【0247】

＜変形例１０＞
上述した実施形態では、話題モジュールセット１１３を構成する各話題モジュールに対して起動条件が対応付けられる構成を示したが、起動条件が対応付けられない話題モジュールを含む話題モジュールセット１１３があってもよい。図３３は、変形例におけるにおける話題モジュールセットの一例（その５）を示す図である。図３３に示す話題モジュールセット１１３は、図２に示す話題モジュールセット１１３に、新たに話題モジュール１１３－２０が追加された構成である。話題モジュール１１３－２０には、起動条件が設定されておらず、優先順位が最も低い位置に配置されている。そのため、話題モジュール１１３－２０は、話題モジュール１１３－２０より優先順位の高い話題モジュール１１３－１～１１３－９の全てにおいて起動条件が満たされなかった場合に実行されることになる。なお、起動条件が設定されていない話題モジュール１１３－ｎの配置位置は、どこであってもよい。

【0248】

図３３に示すように、起動条件が設定されていない話題モジュール１１３－ｎとして、ＡＩによる応答が設定されてもよい。例えば、ＡＩによる応答としては、ＣｈａｔＧＰＴのような入力された内容に応じて自動で文章作成を行う人工知能が用いられてもよい。このように、人工知能が、ユーザからの対話内容に応じた文章を自動で作成し、対話装置１０の音声合成部１２８が、生成された文字列に対応する音声信号を生成する。そして、音声合成部１２８により生成された音声信号は、スピーカー４０から出力される。このような構成により、シナリオで作成できていない内容であっても対話を継続させることが可能になる。

【0249】

＜変形例１１＞
上述した実施形態では、対話装置１０が話題モジュールセット作成部１２０を備える構成を示した。話題モジュールセット作成部１２０は、対話装置１０とは異なる装置に実装されてもよい。このように構成される場合、話題モジュールセット作成部１２０を備える装置を話題モジュールセット作成装置としてもよい。話題モジュールセット作成装置が備える話題モジュールセット作成部１２０は、上述した方法により話題モジュールセットを作成する。話題モジュールセット作成部１２０によって作成された話題モジュールセットは、記録媒体を介して対話装置１０に保存されてもよいし、話題モジュールセット作成装置から対話装置１０に対して通信により送信されてもよい。記録媒体は、例えばＵＳＢ（Universal Serial Bus）、ＳＤカード、ハードディスク等である。

【0250】

このように構成されることによって、対話装置１０とは異なる装置で話題モジュールセットを作成するため、実際にユーザとの対話を行う対話装置１０において話題モジュールセットを作成する必要がない。そのため、対話装置１０の処理負荷を軽減することができる。さらに、話題モジュールセットを備える話題モジュールセット作成装置では、一方向の対話の流れが記述された１以上のシナリオに基づいて、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットを作成する。これにより、設計者は、複雑な分岐を含むシナリオＳＣを作成する必要がなく、単に一方向の対話の流れが記述された１以上のシナリオＳＣを作成すればよい。そして、話題モジュールセット作成装置は、一方向の対話の流れが記述された１以上のシナリオＳＣを用いることで容易に話題モジュールセットを作成することができる。話題モジュールセットは、起動条件を満たしたいずれかの話題による内容を出力することができるように構成されている。そのため、実際の運用上において、複雑な話題の遷移パターンを想定しきれていない場合であっても対話を継続させることが可能になる。

【0251】

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

【符号の説明】

【0252】

１０、１０ａ…対話装置，２０…カメラ，３０…マイク，４０…スピーカー，５０…表示装置，６０…ロボット，１１、１１ａ…記憶部，１２、１２ａ…制御部，１２０…話題モジュールセット作成部，１２１…状態情報作成部，１２２…検出部，１２３…音声認識部，１２４…解析部，１２５…状態更新部，１２６…話題決定部，１２７…言語生成部，１２８…音声合成部，１２９、１２９ａ…動作制御部

【要約】

【課題】複雑な話題の遷移パターンを想定しきれていない場合であっても対話を継続させること。
【解決手段】一方向の対話の流れが記述された１以上のシナリオに基づいて、所定の条件が満たされた場合に対話の相手であるユーザに提供する話題が示された話題モジュールを複数含む話題モジュールセットを作成する話題モジュールセット作成部と、話題モジュールセット作成部によって作成された話題モジュールセットと、少なくともユーザ又はシステムの状態を表す状態情報とに基づいて、ユーザの状態又はシステムに応じた話題を決定する話題決定部と、決定された話題に応じた内容を出力させる出力部と、を備える対話装置。
【選択図】図１