IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7211050対話制御プログラム、対話制御システム、及び対話制御方法
<>
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図1
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図2
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図3
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図4
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図5
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図6
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図7
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図8
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図9
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図10
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図11
  • 特許-対話制御プログラム、対話制御システム、及び対話制御方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-16
(45)【発行日】2023-01-24
(54)【発明の名称】対話制御プログラム、対話制御システム、及び対話制御方法
(51)【国際特許分類】
   G06F 3/16 20060101AFI20230117BHJP
   G10L 15/10 20060101ALI20230117BHJP
   G10L 15/22 20060101ALI20230117BHJP
   G10L 15/00 20130101ALN20230117BHJP
【FI】
G06F3/16 650
G10L15/10 500T
G10L15/22 300Z
G06F3/16 690
G10L15/00 200B
【請求項の数】 14
(21)【出願番号】P 2018228410
(22)【出願日】2018-12-05
(65)【公開番号】P2020091655
(43)【公開日】2020-06-11
【審査請求日】2021-08-10
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100079049
【弁理士】
【氏名又は名称】中島 淳
(74)【代理人】
【識別番号】100084995
【弁理士】
【氏名又は名称】加藤 和詳
(74)【代理人】
【識別番号】100099025
【弁理士】
【氏名又は名称】福田 浩志
(72)【発明者】
【氏名】今井 岳
(72)【発明者】
【氏名】多比良 恵
【審査官】滝谷 亮一
(56)【参考文献】
【文献】特開2003-108581(JP,A)
【文献】特開2001-188787(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G10L 15/10
G10L 15/22
G06F 40/56
G10L 15/00
(57)【特許請求の範囲】
【請求項1】
ユーザとコンピュータとの間で会話を行う際の対話制御プログラムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータに実行させるための対話制御プログラムであり、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
現在の前記動作モードが前記第1のモードの場合で、前記興味の度合いが高いほど大きい値に設定される第1閾値よりも前記受容度が小さいか、前記興味の度合いが高いほど小さい値に設定される第2閾値よりも前記受容度の減少度が大きい場合、前記動作モードとして前記第2のモードを選択する
対話制御プログラム
【請求項2】
前記選択する処理は、更に、前記興味の度合いが一定値以上の話題が存在する場合、前記動作モードとして前記第2のモードを選択する処理である
請求項に記載の対話制御プログラム。
【請求項3】
ユーザとコンピュータとの間で会話を行う際の対話制御プログラムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータに実行させるための対話制御プログラムであり、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
現在の前記動作モードが前記第2のモードの場合で、かつ前記受容度が、現在の話題の前記興味の度合いが高いほど小さい値である第2閾値未満の場合、前記動作モードとして前記第1のモードを選択する
対話制御プログラム。
【請求項4】
ユーザとコンピュータとの間で会話を行う際の対話制御プログラムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータに実行させるための対話制御プログラムであり、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
現在の前記動作モードが前記第2のモードの場合で、前記受容度が第1閾値未満であるか又は前記受容度の減少度が第2閾値以上である場合で、かつ前記興味の度合いが一定値以上の他の話題が存在する場合、動作モードを継続とし、前記興味の度合いが一定値以上の話題に関する対話出力を生成する
対話制御プログラム。
【請求項5】
前記第1閾値は、現在の話題の前記興味の度合いが高いほど小さい値であり、
前記第2閾値は、現在の話題の前記興味の度合いが高いほど大きい値である
請求項に記載の対話制御プログラム。
【請求項6】
時間経過に伴って前記興味の度合いを減少させる
請求項1から請求項の何れか1項に記載の対話制御プログラム。
【請求項7】
現在の前記動作モードと選択した前記動作モードとが異なる場合、前記動作モードを切り替えることを前記ユーザに知らせる内容を含む対話出力を生成する
請求項1から請求項の何れか1項に記載の対話制御プログラム。
【請求項8】
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
現在の前記動作モードが前記第1のモードの場合で、選択した前記動作モードが前記第2のモードの場合、システム側が対話の主導権を取得することを前記ユーザに知らせる内容を含む対話出力を生成する
請求項に記載の対話制御プログラム。
【請求項9】
ユーザとコンピュータとの間で会話を行う対話制御システムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定する確度推定部と、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定する受容度推定部と、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択する選択部と、
前記選択部により選択された動作モードに応じた対話出力を生成する生成部と、
出力装置から前記生成部により生成された対話出力を行わせる出力部と、
を含み、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
前記選択部は、現在の前記動作モードが前記第1のモードの場合で、前記興味の度合いが高いほど大きい値に設定される第1閾値よりも前記受容度が小さいか、前記興味の度合いが高いほど小さい値に設定される第2閾値よりも前記受容度の減少度が大きい場合、前記動作モードとして前記第2のモードを選択する
対話制御システム。
【請求項10】
ユーザとコンピュータとの間で会話を行う対話制御システムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定する確度推定部と、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定する受容度推定部と、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択する選択部と、
前記選択部により選択された動作モードに応じた対話出力を生成する生成部と、
出力装置から前記生成部により生成された対話出力を行わせる出力部と、
を含み、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記選択部は、現在の前記動作モードが前記第2のモードの場合で、かつ前記受容度が、現在の話題の前記興味の度合いが高いほど小さい値である第2閾値未満の場合、前記動作モードとして前記第1のモードを選択する
対話制御システム。
【請求項11】
ユーザとコンピュータとの間で会話を行う対話制御システムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定する確度推定部と、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定する受容度推定部と、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択する選択部と、
前記選択部により選択された動作モードに応じた対話出力を生成する生成部と、
出力装置から前記生成部により生成された対話出力を行わせる出力部と、
を含み、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
前記選択部は、現在の前記動作モードが前記第2のモードの場合で、前記受容度が第1閾値未満であるか又は前記受容度の減少度が第2閾値以上である場合で、かつ前記興味の度合いが一定値以上の他の話題が存在する場合、動作モードを継続とし、前記興味の度合いが一定値以上の話題に関する対話出力を生成する
対話制御システム。
【請求項12】
ユーザとコンピュータとの間で会話を行う際の対話制御方法であって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータが実行する対話制御方法であり、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
現在の前記動作モードが前記第1のモードの場合で、前記興味の度合いが高いほど大きい値に設定される第1閾値よりも前記受容度が小さいか、前記興味の度合いが高いほど小さい値に設定される第2閾値よりも前記受容度の減少度が大きい場合、前記動作モードとして前記第2のモードを選択する
対話制御方法
【請求項13】
ユーザとコンピュータとの間で会話を行う際の対話制御方法であって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータが実行する対話制御方法であり、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
現在の前記動作モードが前記第2のモードの場合で、かつ前記受容度が、現在の話題の前記興味の度合いが高いほど小さい値である第2閾値未満の場合、前記動作モードとして前記第1のモードを選択する
対話制御方法。
【請求項14】
ユーザとコンピュータとの間で会話を行う際の対話制御方法であって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータが実行する対話制御方法であり、
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
現在の前記動作モードが前記第2のモードの場合で、前記受容度が第1閾値未満であるか又は前記受容度の減少度が第2閾値以上である場合で、かつ前記興味の度合いが一定値以上の他の話題が存在する場合、動作モードを継続とし、前記興味の度合いが一定値以上の話題に関する対話出力を生成する
対話制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
開示の技術は、対話制御プログラム、対話制御システム、及び対話制御方法に関する。
【背景技術】
【0002】
従来、電子メールの送信等のアプリケーションのコマンドを実行するためのガイダンスを音声により行う音声ガイダンス生成装置が開示されている。この音声ガイダンス生成装置は、ユーザ主導型又はシステム主導型等の予め指定されたガイダンスタイプに従って、ユーザとの対話形態を決定する。
【0003】
また、ユーザの音声入力が有から無に変わったときのユーザの身体の各部分の動きの大きさに基づいて、ユーザが発話を継続しようとしているか、又は発話権をシステムに委譲しようとしているかを判定する対話装置が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2002-342065号公報
【文献】特開2002-108388号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、前述した音声ガイダンス生成装置は、アプリケーションのコマンドを実行する等の予め定められた処理を実行するためのガイダンスを行うものであり、ユーザが飽きずに継続する対話を行うことができない場合があった。また、前述した対話装置は、発話権がユーザとシステムとの何れにあるかを判定するものであり、ユーザが飽きずに継続する対話を行うことができない場合があった。
【0006】
開示の技術は、一つの側面として、ユーザを飽きさせずにコンピュータと人との対話を継続させることを目的とする。
【課題を解決するための手段】
【0007】
開示の技術は、一つの態様として、ユーザとコンピュータとの間で会話を行う際に、対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定する。また、前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定する。また、前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択する。そして、選択した動作モードに応じた対話出力を生成し、出力装置から生成した対話出力を行わせる。
【発明の効果】
【0008】
開示の技術は、一つの側面として、ユーザを飽きさせずにコンピュータと人との対話を継続させることができる、という効果を有する。
【図面の簡単な説明】
【0009】
図1】各実施形態に係る対話制御システムの概略構成を示すブロック図である。
図2】各実施形態に係る対話装置の機能ブロック図である。
図3】各実施形態に係る対話制御装置の機能ブロック図である。
図4】確度及び受容度の時系列の推移の一例を示すグラフである。
図5】確度及び受容度の時系列の推移の一例を示すグラフである。
図6】確度及び受容度の時系列の推移の一例を示すグラフである。
図7】各実施形態に係る対話装置として機能するコンピュータの概略構成を示すブロック図である。
図8】各実施形態に係る対話制御装置として機能するコンピュータの概略構成を示すブロック図である。
図9】各実施形態に係る変換処理の一例を示すフローチャートである。
図10】第1実施形態に係る対話制御処理の一例を示すフローチャートである。
図11】各実施形態に係る対話制御処理の一例を示すフローチャートである。
図12】第2実施形態に係る対話制御処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照して、開示の技術の実施形態の例を詳細に説明する。なお、以下では、開示の技術を、ユーザとコンピュータとの間で会話を行う対話制御システムに適用した形態例を説明する。
【0011】
[第1実施形態]
まず、図1を参照して、本実施形態に係る対話制御システム10の構成を説明する。図1に示すように、対話制御システム10は、対話装置12及び対話制御装置14を含む。対話装置12及び対話制御装置14は、それぞれネットワークNに接続される。
【0012】
対話装置12は、ユーザの自宅、又はユーザが訪問する施設等に設置され、対話制御装置14による制御によって、音声によりユーザとの対話を行う。対話装置12の例としては、Artificial Intelligence(AI)スピーカー又はコミュニケーションロボット等が挙げられる。
【0013】
対話制御装置14は、データセンター等に設置され、対話装置12によるユーザとの対話を制御する。対話制御装置14の例としては、サーバコンピュータ又はクラウドサーバ等が挙げられる。
【0014】
ところで、ユーザとの対話を行う対話制御システム10では、ユーザとの対話を継続させることによって、ユーザからより多くの情報を収集することができる。また、対話制御システム10では、ユーザからより多くの情報を収集することによって、ユーザにとってより適切な情報を提供することができる。これにより、ユーザは、対話制御システム10をより利用することになり、更にユーザからより多くの情報を収集することができる結果、ユーザにとってより適切な情報を提供することができるようになる。
【0015】
そこで、本実施形態に係る対話制御システム10は、ユーザとの対話を継続させるために、ユーザに対話の主導をゆだねる傾聴モードと、特定の話題についてシステム主導で対話を進める特定話題モードとの2つの動作モードを有する。そして、対話制御システム10は、対話に含まれる話題に対するユーザの興味の確度(以下、単に「確度」という)、及び対話に対するユーザの受容度(以下、単に「受容度」という)に基づいて、傾聴モード及び特定話題モードの何れの動作モードで対話を行うかを選択する。なお、傾聴モードが開示の技術の第1のモードに相当し、特定話題モードが開示の技術の第2のモードに相当する。また、ここでいう話題に対するユーザの興味の確度は、その話題に対するユーザの興味の度合いに相当する。
【0016】
次に、図2を参照して、本実施形態に係る対話装置12の機能的な構成を説明する。図2に示すように、対話装置12は、変換部20、送信部22、及び受信部24を含む。
【0017】
変換部20は、ユーザの発話を後述する音声入力装置66を介して受け付け、受け付けた発話を示す音声データをテキストデータに変換する。音声入力装置66を介して入力されるユーザの発話が開示の技術の対話に対するユーザからの入力の一例である。また、変換部20は、後述する受信部24により受信された発話を示すテキストデータを音声データに変換する。そして、変換部20は、応答発話を示す合成音声データを後述する音声出力装置67から出力させることによって応答発話を行う。対話装置12が音声出力装置67から出力する応答発話が開示の技術の対話出力の一例である。対話出力の一例としては、合成音声出力が挙げられる。
【0018】
送信部22は、変換部20による変換により得られたユーザの発話を示すテキストデータを対話制御装置14に送信する。受信部24は、対話制御装置14から送信された発話を示すテキストデータを受信する。
【0019】
次に、図3を参照して、本実施形態に係る対話制御装置14の機能的な構成を説明する。図3に示すように、対話制御装置14は、解析部30、確度推定部32、受容度推定部34、選択部36、生成部38、及び出力部40を含む。
【0020】
解析部30は、対話装置12から送信された、ユーザの発話を示すテキストデータを受信する。そして、解析部30は、受信したテキストデータに対し、既知の自然言語処理を行うことにより、形態素解析と、質問文、肯定的、又は否定的等の文意の判定と、ユーザの感情の推定等の解析を行う。
【0021】
確度推定部32は、ユーザの発話から、ユーザが興味のある話題を推定し、かつ推定した話題に対する確度を推定する。話題の例としては、政治、経済、教育、スポーツ、及び娯楽等が挙げられる。なお、話題の粒度は、この例に限定されず、例えば、スポーツの中でも野球及びサッカー等に細かく分類してもよい。また、本実施形態に係る確度は、話題に対するユーザの興味のある確からしさを表し、この確からしさが高いほど大きい値とされる。
【0022】
具体的には、確度推定部32は、ユーザの発話における話題に関する用語の出現頻度等からユーザが興味のある話題を推定する。また、確度推定部32は、確度を0以上1以下の値に正規化し、例えば、以下の(A)から(D)に示すように確度を増減させることによって、確度を推定する。本実施形態では、例えば、政治、経済、教育、スポーツ、及び娯楽等の話題の選択肢が予め定められており、確度推定部32は、選択肢毎に、ユーザの発話から、以下の(A)から(D)に示すように確度を増減させる。
(A)ユーザが話題に関連する用語を発話した場合に、その話題の確度を増加させる。
(B)対話装置12による話題に関する発話に対するユーザの反応が肯定的な場合に、その話題の確度を増加させる。
(C)対話装置12から発話された話題に関する質問に対するユーザの応答が想定の範囲内の応答であった場合に、その話題の確度を増加させる。
(D)時間経過に伴って減少させる。
なお、(A)から(D)において増減させる確度の値(例えば、0.1)は、実験等を行うことによって予め定めておく形態が例示される。
【0023】
受容度推定部34は、ユーザの発話における肯定的又は否定的等の文意、対話装置12による発話に対する反応、発話時間、及びユーザの感情等から、対話に対するユーザの受容度を推定する。本実施形態に係る受容度は、ユーザが対話制御システム10との対話を受け入れている度合いを表し、この度合いが高いほど大きい値とされる。また、受容度は、ユーザが対話制御システム10との対話に満足している度合いも表す。
【0024】
具体的には、受容度推定部34は、受容度を0以上1以下の値に正規化し、例えば、以下の(E)から(K)に示すように受容度を増減させることによって、受容度を推定する。
(E)ユーザからの発話の文意が否定的であった場合に減少させる。
(F)対話装置12からの発話に対して所定時間以上経過してもユーザの応答がない場合に減少させる。
(G)ユーザの直近の所定期間の発話の回数が所定回数よりも多い場合に増加させる。
(H)対話装置12からの発話に対して相槌が所定回数よりも多い場合に増加させる。
(I)対話装置12が発話した話題に対して同じ又は類似する話題をユーザが応答した場合に増加させる。
(J)ユーザの1回の発話における発話時間が所定時間以上の場合に増加させる。
(K)ユーザの発話から推定したユーザの感情が肯定的な感情の場合に増加させ、否定的な感情の場合に減少させる。
なお、(E)から(K)において増減させる受容度の値(例えば、0.1)は、実験等を行うことによって予め定めておく形態が例示される。ユーザの発話を示すテキストデータ、確度、及び受容度は、履歴として対話制御装置14の所定の記憶領域に記憶される。
【0025】
なお、受容度推定部34は、受容度の推定に、ユーザの声の抑揚を用いてもよい。また、対話制御システム10がユーザの表情を撮像する撮像装置を備えている場合、受容度推定部34は、受容度の推定に、撮像装置により撮像された画像に含まれるユーザの表情を用いてもよい。
【0026】
選択部36は、確度推定部32により推定された確度、及び受容度推定部34により推定された受容度に基づいて、傾聴モード及び特定話題モードの何れの動作モードで対話を行うかを選択する。
【0027】
具体的には、選択部36は、現在の動作モードが傾聴モードの場合で、かつ確度が一定値以上の話題が存在しない場合、動作モードとして傾聴モードを選択する。従って、この場合、傾聴モードが継続する。
【0028】
また、選択部36は、現在の動作モードが傾聴モードの場合で、確度が一定値以上の話題が存在する場合で、かつ受容度が閾値TH1以上及び受容度の減少度が閾値TH2未満の場合、動作モードとして傾聴モードを選択する。従って、この場合、傾聴モードが継続する。閾値TH1が、開示の技術における現在の動作モードが第1のモードである場合の第1閾値の一例であり、閾値TH2が、開示の技術における現在の動作モードが第1のモードである場合の第2閾値の一例である。
【0029】
また、選択部36は、現在の動作モードが傾聴モードの場合で、確度が一定値以上の話題が存在する場合で、かつ受容度が閾値TH1未満であるか又は受容度の減少度が閾値TH2以上である場合、動作モードとして特定話題モードを選択する。また、この場合、選択部36は、特定話題モードにおいて対話を進める話題として、確度が一定値以上の話題を選択する。従って、この場合、動作モードが、傾聴モードから確度が一定値以上の話題について対話を進める特定話題モードへ切り替えられる。なお、確度が一定値以上の話題が複数存在する場合、選択部36は、確度が一定値以上の複数の話題から、1つの話題をランダムに選択してもよいし、新たな話題について対話を行うために、直近の所定期間以内に対話を行ってない話題を選択してもよい。また、この場合、選択部36は、確度が一定値以上の複数の話題から、確度が最も高い話題を選択してもよい。また、この場合、選択する話題は、後述する閾値TH1、TH2の算出に用いる確度に対応する話題と同じでもよいし、異なってもよい。
【0030】
また、本実施形態に係る受容度の減少度は、単位時間当たりの受容度の減少量を表し、受容度が減少する度合いが高いほど大きい値とされる。
【0031】
また、本実施形態に係る閾値TH1は、確度が高いほど大きい値とされる。これにより、現在の動作モードが傾聴モードの場合は、確度が高い話題が存在するほど、受容度が高くても特定話題モードに切り替わり易くなる。具体的には、閾値TH1は、例えば、以下の(1)式によって算出される。(1)式におけるcは確度を表し、TH1maxは閾値TH1の最大値(例えば、0.8)を表し、TH1minは閾値TH1の最小値(例えば、0.2)を表す。
TH1=c×TH1max+(1-c)×TH1min・・・(1)
【0032】
なお、閾値TH1は、例えば、以下の(2)式によって算出されてもよい。(2)式におけるα及びβは、0<α<β<1を満たす定数(例えば、α=0.3、β=0.7)を表す。(2)式によって算出されるTH1は、c(確度)<αのときにTH1minとなり、c>βのときにTH1maxとなり、α≦c≦βのときにTH1min≦TH1≦TH1maxを満たし、かつcが大きいほど大きい値となる。
【0033】
【数1】
【0034】
また、本実施形態に係る閾値TH2は、確度が高いほど小さい値とされる。これにより、現在の動作モードが傾聴モードの場合は、確度が高い話題が存在するほど、受容度の減少度が低くても特定話題モードに切り替わり易くなる。具体的には、閾値TH2は、例えば、以下の(3)式によって算出される。(3)式におけるTH2maxは閾値TH2の最大値(例えば、0.3)を表し、TH2minは閾値TH2の最小値(例えば、0.1)を表す。
TH2=(1-c)×TH2max+c×TH2min・・・(3)
【0035】
なお、閾値TH2は、例えば、以下の(4)式によって算出されてもよい。(4)式によって算出されるTH2は、c(確度)<αのときにTH2maxとなり、c>βのときにTH2minとなり、α≦c≦βのときにTH2min≦TH2≦TH2maxを満たし、かつcが大きいほど小さい値となる。また、閾値TH1、TH2を算出する際の確度について、話題が複数存在する場合は、複数の話題それぞれに対応する確度のうち、最大の確度を用いる形態が例示される。
【0036】
【数2】
【0037】
図4を参照して、現在の動作モードが傾聴モードの場合における選択部36による動作モードの選択処理の具体的な例を説明する。図4における実線は受容度を表し、一点鎖線は話題Aの確度を表す。また、図4におけるtは直近に入力された発話を用いて確度及び受容度が推定される現在の時刻を表し、tn-1は時刻tの前回に入力された発話を用いて確度及び受容度が推定された時刻を表す。ここでは、時刻tn-1に選択部36により選択された動作モード、すなわち、現在の動作モードが傾聴モードの場合について説明する。
【0038】
図4に示すように、時刻tにおいて確度が一定値以上の話題(図4の例では話題A)が存在する。また、時刻tにおいて受容度は閾値TH1以上である。ここで、以下の(5)式により算出される時刻tにおける受容度の減少度Rは閾値TH2以上とする。従って、選択部36は、動作モードとして特定話題モードを選択し、かつ特定話題モードにおいて対話を進める話題として話題Aを選択する。(5)式におけるJn-1は時刻tn-1における受容度を表し、Jは時刻tにおける受容度を表す。
R=(Jn-1-J)÷(t-tn-1)・・・(5)
【0039】
なお、選択部36は、受容度の時系列の推移を多項式等により近似し、近似して得られた曲線の時刻tにおける接線の傾きが負の値である場合の絶対値を受容度の減少度としてもよい。
【0040】
また、選択部36は、現在の動作モードが特定話題モードの場合で、確度が一定値以上の他の話題が存在しない場合で、かつ受容度が閾値TH3未満の場合、動作モードとして傾聴モードを選択する。従って、この場合、動作モードが特定話題モードから傾聴モードへ切り替えられる。なお、ここでいう他の話題とは、直前までに特定話題モードで対話を進めている現在の話題以外の話題を意味する。
【0041】
また、選択部36は、現在の動作モードが特定話題モードの場合で、確度が一定値以上の他の話題が存在しない場合で、かつ受容度が閾値TH3以上の場合、動作モードとして特定話題モードを選択する。また、この場合、選択部36は、特定話題モードにおいて対話を進める話題として現在の話題を選択する。従って、この場合、現在の話題について対話を進める特定話題モードが継続する。
【0042】
また、選択部36は、現在の動作モードが特定話題モードの場合で、確度が一定値以上の他の話題が存在する場合で、かつ受容度が閾値TH3未満であるか又は受容度の減少度が閾値TH4以上である場合、動作モードとして特定話題モードを選択する。また、選択部36は、特定話題モードにおいて対話を進める話題として、確度が一定値以上の他の話題を選択する。従って、この場合、動作モードは特定話題モードのまま、話題が切り替えられる。なお、確度が一定値以上の話題が複数存在する場合、選択部36は、前述した動作モードが傾聴モードから特定話題モードへ切り替えられるときと同様に、1つの話題を選択することが可能である。閾値TH3が、開示の技術における現在の動作モードが第2のモードである場合の第1閾値の一例であり、閾値TH4が、開示の技術における現在の動作モードが第2のモードである場合の第2閾値の一例である。
【0043】
また、選択部36は、現在の動作モードが特定話題モードの場合で、確度が一定値以上の他の話題が存在する場合で、かつ受容度が閾値TH3以上及び受容度の減少度が閾値TH4未満の場合、動作モードとして特定話題モードを選択する。また、選択部36は、特定話題モードにおいて対話を進める話題として現在の話題を選択する。従って、この場合、現在の話題について対話を進める特定話題モードが継続する。
【0044】
また、本実施形態に係る閾値TH3は、現在の話題の確度が高いほど小さい値とされる。具体的には、閾値TH3は、例えば、閾値TH2と同様に算出される。また、本実施形態に係る閾値TH4は、現在の話題の確度が高いほど大きい値とされる。具体的には、閾値TH4は、例えば、閾値TH1と同様に算出される。従って、現在の動作モードが特定話題モードの場合は、現在の話題の確度が高いほど、特定話題モードが継続し易くなり、かつ確度が一定値以上の他の話題が存在する場合は、現在の話題の確度が低いほど、話題が他の話題に切り替わり易くなる。
【0045】
図5及び図6を参照して、現在の動作モードが特定話題モードの場合における選択部36による動作モードの選択処理の具体的な例をそれぞれ説明する。図5及び図6における実線は受容度を表し、一点鎖線は話題Aの確度を表す。また、図6における二点鎖線は話題Bの確度を表す。また、図5及び図6では、現在の話題が話題Aである場合について説明する。
【0046】
図5に示すように、時刻tにおいて確度が一定値以上の話題は存在しない。また、時刻tにおいて受容度は閾値TH3未満である。従って、選択部36は、動作モードとして傾聴モードを選択する。すなわち、この場合、動作モードが特定話題モードから傾聴モードへ切り替えられる。
【0047】
一方、図6に示すように、時刻tにおいて現在の話題(図6の例では話題A)以外に確度が一定値以上の話題(図6の例では話題B)が存在する。また、時刻tにおいて受容度は閾値TH3未満である。従って、選択部36は、動作モードとして特定話題モードを選択し、かつ特定話題モードにおいて対話を進める話題として確度が一定値以上の話題Bを選択する。すなわち、この場合、特定話題モードが継続し、特定話題モードにおいて対話を進める話題が話題Aから話題Bへ切り替えられる。
【0048】
生成部38は、選択部36により選択された動作モードに応じた発話を示すテキストデータを生成する。
【0049】
具体的には、生成部38は、選択部36により選択された動作モードが傾聴モードである場合、ユーザの自由な発話を促すことによってユーザの情報を収集する発話を示すテキストデータを生成する。傾聴モードにおける生成部38が生成する発話の例としては、相槌及びユーザの発話に対する質問が挙げられる。また、傾聴モードにおける生成部38が生成する発話の例としては、「最近どこか行った?」及び「何か良いことあった?」等の発話が挙げられる。
【0050】
また、生成部38は、選択部36により選択された動作モードが特定話題モードである場合、選択部36により選択された話題についてシステム主導で対話を進める発話を示すテキストデータを生成する。特定話題モードにおける生成部38が生成する発話の例としては、選択された話題について予め作りこまれたシナリオに従った発話、及び選択された話題に関する詳細な情報を提供する発話等が上げられる。予め作りこまれたシナリオの例としては、話題が料理の場合は、料理を作るための手順が挙げられる。また、予め作りこまれたシナリオの例としては、話題が旅行の場合は、行き先の決定から交通機関及び宿泊施設の予約までの手順が挙げられる。
【0051】
出力部40は、生成部38により生成された発話を示すテキストデータを対話装置12に送信することによって、生成部38により生成された発話を対話装置12の音声出力装置67から出力させる。
【0052】
対話装置12は、例えば図7に示すコンピュータ50で実現することができる。コンピュータ50は、Central Processing Unit(CPU)51、一時記憶領域としてのメモリ52、及び不揮発性の記憶部53を備える。また、コンピュータ50は、マイクロフォン等の音声入力装置66、及びスピーカー等の音声出力装置67が接続される入出力I/F54を備える。また、コンピュータ50は、記録媒体58に対するデータの読み込みと書き込みとを制御するRead/Write(R/W)部55、及びネットワークNに接続されるネットワークI/F56を備える。CPU51、メモリ52、記憶部53、入出力I/F54、R/W部55、及びネットワークI/F56は、バス57を介して接続される。
【0053】
記憶部53は、Hard Disk Drive(HDD)、Solid State Drive(SSD)、又はフラッシュメモリ等によって実現することができる。記憶媒体としての記憶部53には、コンピュータ50を対話装置12として機能させるための変換プログラム60が記憶される。変換プログラム60は、変換プロセス61、送信プロセス62、及び受信プロセス63を有する。
【0054】
CPU51は、変換プログラム60を記憶部53から読み出してメモリ52に展開し、変換プログラム60が有するプロセスを実行する。CPU51は、変換プロセス61を実行することで、図2に示す変換部20として動作する。CPU51は、送信プロセス62を実行することで、図2に示す送信部22として動作する。CPU51は、受信プロセス63を実行することで、図2に示す受信部24として動作する。これにより、変換プログラム60を実行したコンピュータ50が、対話装置12として機能することになる。なお、変換プログラム60が有するプロセスを実行するCPU51は、ハードウェアである。
【0055】
また、変換プログラム60により実現される機能は、例えば半導体集積回路、より詳しくはApplication Specific Integrated Circuit(ASIC)等で実現することも可能である。
【0056】
対話制御装置14は、例えば図8に示すコンピュータ70で実現することができる。コンピュータ70は、CPU71、一時記憶領域としてのメモリ72、及び不揮発性の記憶部73を備える。また、コンピュータ70は、表示装置及び入力装置等の入出力装置74を備える。また、コンピュータ70は、記録媒体78に対するデータの読み込みと書き込みとを制御するR/W部75、及びネットワークNに接続されるネットワークI/F76を備える。CPU71、メモリ72、記憶部73、入出力装置74、R/W部75、及びネットワークI/F76は、バス77を介して接続される。
【0057】
記憶部73は、HDD、SSD、又はフラッシュメモリ等によって実現することができる。記憶媒体としての記憶部73には、コンピュータ70を対話制御装置14として機能させるための対話制御プログラム80が記憶される。対話制御プログラム80は、解析プロセス81、確度推定プロセス82、受容度推定プロセス83、選択プロセス84、生成プロセス85、及び出力プロセス86を有する。
【0058】
CPU71は、対話制御プログラム80を記憶部73から読み出してメモリ72に展開し、対話制御プログラム80が有するプロセスを実行する。CPU71は、解析プロセス81を実行することで、図3に示す解析部30として動作する。CPU71は、確度推定プロセス82を実行することで、図3に示す確度推定部32として動作する。CPU71は、受容度推定プロセス83を実行することで、図3に示す受容度推定部34として動作する。CPU71は、選択プロセス84を実行することで、図3に示す選択部36として動作する。CPU71は、生成プロセス85を実行することで、図3に示す生成部38として動作する。CPU71は、出力プロセス86を実行することで、図3に示す出力部40として動作する。これにより、対話制御プログラム80を実行したコンピュータ70が、対話制御装置14として機能することになる。なお、対話制御プログラム80が有するプロセスを実行するCPU71は、ハードウェアである。
【0059】
また、対話制御プログラム80により実現される機能は、例えば半導体集積回路、より詳しくはASIC等で実現することも可能である。
【0060】
次に、本実施形態に係る対話制御システム10の作用を説明する。対話装置12が変換プログラム60を実行することで、図9に示す変換処理を実行する。図9に示す変換処理は、例えば、対話装置12の電源がオン状態とされた場合、又は音声入力装置66を介して対話装置12に対して予め定められた起動ワードが入力された場合等に実行される。
【0061】
また、対話制御装置14が対話制御プログラム80を実行することで、図10及び図11に示す対話制御処理を実行する。図10及び図11に示す対話制御処理は、例えば、対話制御装置14の電源がオン状態とされた場合又は音声入力装置66を介して対話装置12に対して予め定められた起動ワードが入力され、その起動ワードがネットワークを介して受信された場合等に実行される。本実施形態では、初期の動作モードが傾聴モードである場合について説明する。
【0062】
図9のステップS10で、変換部20は、ユーザの発話を、音声入力装置66を介して受け付けるまで待機する。ユーザの発話が音声入力装置66を介して入力されると、ステップS10の判定が肯定判定となり、処理はステップS12に移行する。ステップS12で、ステップS10の処理により受け付けられた発話を示す音声データをテキストデータに変換する。
【0063】
ステップS14で、送信部22は、ステップS12の処理による変換により得られたユーザの発話を示すテキストデータを対話制御装置14に送信する。ステップS16で、受信部24は、対話制御装置14から送信されたテキストデータを受信するまで待機する。ステップS14の処理により送信されたテキストデータに対応して、後述する図10のステップS64の処理により対話制御装置14から送信されたテキストデータを受信部24が受信すると、ステップS16の判定が肯定判定となる。ステップS16の判定が肯定判定となると、処理はステップS18に移行する。
【0064】
ステップS18で、変換部20は、ステップS16の処理により受信されたテキストデータを音声データに変換する。ステップS20で、変換部20は、ステップS18の処理による変換により得られた音声データを音声出力装置67から出力させることによって応答の発話を行う。ステップS20の処理が終了すると、処理はステップS10に戻る。
【0065】
なお、図9に示す変換処理は、例えば、対話装置12の電源がオフ状態とされた場合、又は音声入力装置66を介して対話装置12に対して予め定められた終了ワードが入力された場合等に終了する。
【0066】
図10のステップS30で、解析部30は、対話装置12から送信された、ユーザの発話を示すテキストデータを受信するまで待機する。図9のステップS14の処理により対話装置12から送信されたテキストデータを解析部30が受信すると、ステップS30の判定が肯定判定となり、処理はステップS32に移行する。
【0067】
ステップS32で、解析部30は、ステップS30の処理により受信されたテキストデータに対し、既知の自然言語処理を行うことにより、形態素解析と、質問文、肯定的、又は否定的等の文意の判定と、感情の推定等の解析を行う。ステップS34で、確度推定部32は、前述したように、ステップS30の処理により受信されたテキストデータを用いて、ユーザが興味のある話題を推定し、かつ推定した話題に対する確度を前記(A)から(D)の判断項目に従って推定する。
【0068】
ステップS36で、受容度推定部34は、前述したように、ステップS30の処理により受信されたテキストデータを用いて、前記(E)から(K)の判断項目に従って受容度を推定する。また、受容度推定部34は、(5)式に従って、受容度の減少度を算出する。なお、(5)式におけるtn-1は前回にステップS36を実行した時刻に相当し、tは現在の時刻に相当する。また、(5)式におけるJn-1は前回のステップS36の処理により推定した受容度に相当し、Jは今回のステップS38の処理により推定した受容度に相当する。
【0069】
ステップS38で、選択部36は、現在の動作モードが傾聴モードであるか否かを判定する。この判定が否定判定となった場合、すなわち、現在の動作モードが特定話題モードである場合は、処理はステップS48に移行し、肯定判定となった場合は、処理はステップS40に移行する。
【0070】
ステップS40で、選択部36は、ステップS34の処理により推定された確度が一定値以上の話題が存在するか否かを判定する。この判定が否定判定となった場合は、処理はステップS46に移行し、肯定判定となった場合は、処理はステップS42に移行する。ステップS42で、選択部36は、ステップS36の処理により推定された受容度が閾値TH1未満であるか、又はステップS36の処理により算出された受容度の減少度が閾値TH2以上であるか否かを判定する。この判定が否定判定となった場合は、処理はステップS46に移行し、肯定判定となった場合は、処理はステップS44に移行する。この判定の際、選択部36は、閾値TH1を、ステップS34の処理により推定された確度を用いて、(1)式に従って算出する。また、この判定の際、選択部36は、閾値TH2を、ステップS34の処理により推定された確度を用いて、(3)式に従って算出する。
【0071】
ステップS44で、選択部36は、前述したように、動作モードとして特定話題モードを選択し、かつ特定話題モードにおいて対話を進める話題として、ステップS34の処理により推定された確度が一定値以上の話題を選択する。ステップS44の処理が終了すると、処理はステップS62に移行する。ステップS46で、選択部36は、動作モードとして傾聴モードを選択する。ステップS46の処理が終了すると、処理はステップS62に移行する。
【0072】
ステップS48で、選択部36は、前述したように、ステップS34の処理により推定された確度が一定値以上の他の話題が存在するか否かを判定する。この判定が肯定判定となった場合は、処理はステップS50に移行する。ステップS50で、選択部36は、ステップS36の処理により推定された受容度が閾値TH3未満であるか、又はステップS36の処理により算出された受容度の減少度が閾値TH4以上であるか否かを判定する。この判定が否定判定となった場合は、処理はステップS54に移行し、肯定判定となった場合は、処理はステップS52に移行する。また、この判定の際、選択部36は、前述したように、閾値TH3を閾値TH2と同様に算出し、閾値TH4を閾値TH1と同様に算出する。
【0073】
ステップS52で、選択部36は、動作モードとして特定話題モードを選択し、かつ特定話題モードにおいて対話を進める話題として、ステップS34の処理により推定された確度が一定値以上の他の話題を選択する。ステップS52の処理が終了すると、処理はステップS62に移行する。
【0074】
ステップS54で、選択部36は、動作モードとして特定話題モードを選択し、かつ特定話題モードにおいて対話を進める話題として現在の話題を選択する。ステップS54の処理が終了すると、処理はステップS62に移行する。
【0075】
一方、ステップS48の判定が否定判定となった場合は、処理は図11のステップS56に移行する。図11のステップS56で、選択部36は、ステップS36の処理により推定された受容度が閾値TH3未満であるか否かを判定する。この判定が否定判定となった場合は、処理はステップS60に移行し、肯定判定となった場合は、処理はステップS58に移行する。この判定の際、選択部36は、前述したように、閾値TH3を閾値TH2と同様に算出する。
【0076】
ステップS58で、選択部36は、動作モードとして傾聴モードを選択する。ステップS58の処理が終了すると、処理は図10のステップS62に移行する。ステップS60で、選択部36は、動作モードとして特定話題モードを選択し、かつ特定話題モードにおいて対話を進める話題として現在の話題を選択する。ステップS60の処理が終了すると、処理は図10のステップS62に移行する。
【0077】
図10のステップS62で、生成部38は、前述したように、以上の処理を経て選択された動作モードに応じた発話を示すテキストデータを生成する。すなわち、ステップS44、ステップS52、ステップS54、又はステップS60を経てステップS62が実行される場合、生成部38は、経たステップの処理により選択された話題についてシステム主導で対話を進める内容のテキストデータを生成する。一方、ステップS46又はステップS58を経てステップS62が実行される場合、生成部38は、ユーザの自由な発話を促す内容のテキストデータを生成する。
【0078】
ステップS64で、出力部40は、ステップS62の処理により生成されたテキストデータを対話装置12に送信することによって、生成部38により生成された発話を対話装置12の音声出力装置67から出力させる。ステップS64の処理が終了すると、処理はステップS30に戻る。
【0079】
なお、図10及び図11に示す対話制御処理は、例えば、対話制御装置14の電源がオフ状態とされた場合、又は音声入力装置66を介して対話装置12に対して予め定められた終了ワードが入力された場合等に終了する。
【0080】
以上説明したように、本実施形態によれば、ユーザが興味のある話題に対するユーザの興味の確度及び対話に対するユーザの受容度に基づいて、傾聴モード及び特定話題モードの何れの動作モードで対話を行うかを選択している。そして、選択した動作モードに応じた発話を音声出力装置67から出力させる。従って、ユーザ側又はシステム側が一方的に発話を行って対話が単調になることを抑制することができる結果、ユーザが飽きずに継続する対話を行うことができる。
【0081】
また、本実施形態によれば、閾値TH1、TH2、TH3、TH4を確度に応じて異ならせている。従って、確度に応じて適切な動作モードが選択される結果、よりユーザが飽きずに継続する対話を行うことができる。
【0082】
[第2実施形態]
開示の技術の第2実施形態を説明する。なお、本実施形態に係る対話制御システム10の構成、対話装置12の機能的な構成、及び対話装置12として機能するコンピュータの構成は、第1実施形態と同一であるため、説明を省略する。
【0083】
図3を参照して、本実施形態に係る対話制御装置14Aの機能的な構成を説明する。なお、第1実施形態に係る対話制御装置14の機能部と同一の機能を有する機能部については、同一の符号を付して説明を省略する。図3に示すように、対話制御装置14Aは、解析部30、確度推定部32、受容度推定部34、選択部36、生成部38A、及び出力部40を含む。
【0084】
生成部38Aは、第1実施形態に係る生成部38が有する機能に加え、以下の機能を有する。生成部38Aは、現在の動作モードと選択部36により選択された動作モードとが異なる場合、動作モードを切り替えることをユーザに知らせる内容を含む発話を示すテキストデータを生成する。具体的には、生成部38Aは、動作モードが傾聴モードから特定話題モードへ切り替えられる場合、自身が対話の主導権を取得することをユーザに知らせる内容を含む発話を示すテキストデータを生成する。自身が対話の主導権を取得することをユーザに知らせる内容を含む発話の例としては、「僕の話も聞いてよ」又は「それより、Aについて話をしたい」等が挙げられる。なお、この例における「A」は、選択部36により選択された特定話題モードで対話を進める話題を表す。
【0085】
また、生成部38Aは、動作モードが特定話題モードから傾聴モードへ切り替えられる場合、対話の主導権をユーザに委譲することをユーザに知らせる内容を含む発話を示すテキストデータを生成する。対話の主導権をユーザに委譲することをユーザに知らせる内容を含む発話の例としては、「あなたはどう思う?」、「Aと言えば他に何かある?」又は「何か話したいことがあるのではないの?」等が挙げられる。なお、この例における「A」は、それまで特定話題モードで対話を進めた話題を表す。
【0086】
また、生成部38Aは、動作モードは特定話題モードが継続し、かつ話題が切り替えられる場合、対話を進める話題を新たな話題に変更することをユーザに知らせる内容を含む発話を示すテキストデータを生成する。対話を進める話題を新たな話題に変更することをユーザに知らせる内容を含む発話の例としては、「ところで、Aについて話をしたい」又は「ところで、Aについて何か知っている?」等が挙げられる。なお、この例における「A」は、特定話題モードで対話を進める新たな話題を表す。
【0087】
対話制御装置14Aは、例えば図8に示すコンピュータ70で実現することができる。図8における第1実施形態と同一の構成要素については、同一の符号を付して説明を省略する。コンピュータ70の記憶部73には、コンピュータ70を対話制御装置14Aとして機能させるための対話制御プログラム80Aが記憶される。対話制御プログラム80Aは、解析プロセス81、確度推定プロセス82、受容度推定プロセス83、選択プロセス84、生成プロセス85A、及び出力プロセス86を有する。
【0088】
CPU71は、対話制御プログラム80Aを記憶部73から読み出してメモリ72に展開し、対話制御プログラム80Aが有するプロセスを実行する。CPU71は、解析プロセス81を実行することで、図3に示す解析部30として動作する。CPU71は、確度推定プロセス82を実行することで、図3に示す確度推定部32として動作する。CPU71は、受容度推定プロセス83を実行することで、図3に示す受容度推定部34として動作する。CPU71は、選択プロセス84を実行することで、図3に示す選択部36として動作する。CPU71は、生成プロセス85Aを実行することで、図3に示す生成部38Aとして動作する。CPU71は、出力プロセス86を実行することで、図3に示す出力部40として動作する。これにより、対話制御プログラム80Aを実行したコンピュータ70が、対話制御装置14Aとして機能することになる。なお、対話制御プログラム80Aが有するプロセスを実行するCPU71は、ハードウェアである。
【0089】
また、対話制御プログラム80Aにより実現される機能は、例えば半導体集積回路、より詳しくはASIC等で実現することも可能である。
【0090】
次に、本実施形態に係る対話制御システム10の作用を説明する。なお、本実施形態に係る対話装置12により実行される変換処理は、第1実施形態と同一であるため、説明を省略する。
【0091】
対話制御装置14Aが対話制御プログラム80Aを実行することで、図12及び図11に示す対話制御処理を実行する。なお、本実施形態に係る対話制御装置14Aにより実行される対話制御処理のうち、図11に示す部分は、第1実施形態と同一であるため、説明を省略する。また、図12における図10と同一の処理を実行するステップについては、同一の符号を付して説明を省略する。図11及び図12に示す対話制御処理は、例えば、対話制御装置14Aの電源がオン状態とされた場合、又は音声入力装置66を介して対話装置12に対して予め定められた起動ワードが入力された場合等に実行される。本実施形態では、初期の動作モードが傾聴モードである場合について説明する。
【0092】
図12のステップS44、ステップS46、ステップS52、ステップS54、図11のステップS58、又はステップS60の処理が終了すると、処理は図12のステップS70に移行する。
【0093】
ステップS70で、生成部38Aは、動作モードが傾聴モードから特定話題モードへ切り替えられるか否かを判定する。この判定が否定判定となった場合は、処理はステップS74に移行し、肯定判定となった場合は、処理はステップS72に移行する。なお、ステップS44を経てステップS70が実行される場合にステップS70の判定が肯定判定となる。また、ステップS46、ステップS52、ステップS54、ステップS58、又はステップS60を経てステップS70が実行される場合にステップS70の判定が否定判定となる。
【0094】
ステップS72で、生成部38Aは、前述したように、自身が対話の主導権を取得することをユーザに知らせる内容を含む発話を示すテキストデータを生成する。ステップS72の処理が終了すると、処理はステップS64Aに移行する。
【0095】
ステップS74で、生成部38Aは、動作モードが特定話題モードから傾聴モードへ切り替えられるか否かを判定する。この判定が否定判定となった場合は、処理はステップS78に移行し、肯定判定となった場合は、処理はステップS76に移行する。なお、ステップS58を経てステップS74が実行される場合にステップS74の判定が肯定判定となり、ステップS46、ステップS52、ステップS54、又はステップS60を経てステップS74が実行される場合にステップS74の判定が否定判定となる。
【0096】
ステップS76で、生成部38Aは、前述したように、対話の主導権をユーザに委譲することをユーザに知らせる内容を含む発話を示すテキストデータを生成する。ステップS76の処理が終了すると、処理はステップS64Aに移行する。
【0097】
ステップS78で、生成部38Aは、動作モードは特定話題モードが継続し、かつ話題が切り替えられるか否かを判定する。この判定が否定判定となった場合は、処理はステップS62に移行し、肯定判定となった場合は、処理はステップS80に移行する。なお、ステップS52を経てステップS78が実行される場合にステップS78の判定が肯定判定となり、ステップS46、ステップS54、又はステップS60を経てステップS78が実行される場合にステップS78の判定が否定判定となる。
【0098】
ステップS80で、生成部38Aは、前述したように、対話を進める話題を新たな話題に変更することをユーザに知らせる内容を含む発話を示すテキストデータを生成する。ステップS80の処理が終了すると、処理はステップS64Aに移行する。また、ステップS62の処理が終了すると、処理はステップS64Aに移行する。
【0099】
ステップS64Aで、出力部40は、ステップS62、ステップS72、ステップS76、又はステップS80の処理により生成された発話を示すテキストデータを対話装置12に送信する。これにより、出力部40は、生成部38Aにより生成された発話を対話装置12の音声出力装置67から出力させる。ステップS64Aの処理が終了すると、処理はステップS30に戻る。
【0100】
なお、図11及び図12に示す対話制御処理は、例えば、対話制御装置14Aの電源がオフ状態とされた場合、又は音声入力装置66を介して対話装置12に対して予め定められた終了ワードが入力された場合等に終了する。
【0101】
なお、第2実施形態において、生成部38Aは、動作モードが傾聴モードから特定話題モードへ切り替えられる場合に、対話を進める話題を新たな話題に変更することをユーザに知らせる内容を含む発話を示すテキストデータを生成してもよい。
【0102】
また、第2実施形態において、生成部38Aは、受容度が閾値TH5以上であるにもかかわらず動作モードが傾聴モードから特定話題モードへ切り替えられる場合に、自身が対話の主導権を取得することをユーザに知らせる内容を含む発話を生成してもよい。この場合、生成部38Aは、受容度が閾値TH5未満で、かつ動作モードが傾聴モードから特定話題モードへ切り替えられる場合に、対話を進める話題を新たな話題に変更することをユーザに知らせる内容を含む発話を示すテキストデータを生成する。この場合における閾値TH5としては、例えば、ユーザが対話制御システム10との対話に満足していることを表す値の下限値(例えば、0.7)として予め定められた値を適用する形態が例示される。
【0103】
以上説明したように、本実施形態によれば、第1実施形態と同様の効果を奏することができる。また、本実施形態によれば、現在の動作モードと選択した動作モードとが異なる場合、動作モードを切り替えることをユーザに知らせる内容を含む発話を生成している。従って、対話の主導権がユーザ及びシステムの何れにあるかをユーザが把握しやすくなる結果、ユーザとの円滑な対話を行うことができる。
【0104】
なお、上記各実施形態では、開示の技術を、音声によりユーザと対話を行う対話制御システムに適用した場合について説明したが、これに限定されない。例えば、開示の技術を、テキストチャット等のテキストによりユーザとの対話を行う対話制御システムに適用する形態としてもよい。この場合、ユーザにより入力されるテキストが開示の技術のユーザからの入力に相当し、対話装置12の表示装置等に出力されるテキストが開示の技術の対話出力に相当する。また、ユーザからの入力と対話出力との組み合わせは、音声と音声、音声とテキスト、テキストと音声、及びテキストとテキストの何れであってもよい。
【0105】
また、上記各実施形態では、対話制御システム10を対話装置12及び対話制御装置14(14A)により実現する場合について説明したが、これに限定されない。対話制御システム10を対話装置12により実現する形態としてもよい。この場合、対話制御装置14(14A)が備える各機能部を対話装置12が備える形態が例示される。
【0106】
また、上記各実施形態において、現在の動作モードが傾聴モードの場合に、確度を用いずに、受容度又は受容度の減少度を用いて、動作モードを選択してもよい。この場合、図10におけるステップS40の処理が不要となる。
【0107】
また、上記各実施形態では、閾値TH1、TH2、TH3、TH4が確度に応じて異なる場合について説明したが、これに限定されない。閾値TH1、TH2、TH3、TH4の少なくとも1つが予め定められた固定値であってもよい。
【0108】
また、上記各実施形態では、初期の動作モードが傾聴モードである場合について説明したが、これに限定されない。初期の動作モードが特定話題モードであってもよい。この場合、最初の話題としては、天気等の一般的な話題、流行の話題、又はニュースで取り上げられている話題等を適用する形態が例示される。
【0109】
また、上記各実施形態において、受容度を、ユーザが対話制御システム10との対話を受け入れている度合いが高いほど小さい値としてもよい。この場合、受容度に関連する値の大小関係を上記各実施形態とは逆にする形態が例示される。また、上記各実施形態において、確度を、話題に対するユーザの興味のある確からしさが高いほど小さい値としてもよい。この場合、確度に関連する値の大小関係を上記各実施形態とは逆にする形態が例示される。
【0110】
また、上記各実施形態では、変換プログラム60が記憶部53に予め記憶(インストール)されている態様を説明したが、これに限定されない。変換プログラム60は、CD-ROM、DVD-ROM、USBメモリ、メモリカード等の記録媒体に記録された形態で提供することも可能である。
【0111】
また、上記各実施形態では、対話制御プログラム80、80Aが記憶部73に予め記憶(インストール)されている態様を説明したが、これに限定されない。対話制御プログラム80、80Aは、CD-ROM、DVD-ROM、USBメモリ、メモリカード等の記録媒体に記録された形態で提供することも可能である。
【0112】
以上の各実施形態に関し、更に以下の付記を開示する。
【0113】
(付記1)
ユーザとコンピュータとの間で会話を行う際の対話制御プログラムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータに実行させるための対話制御プログラム。
【0114】
(付記2)
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
現在の前記動作モードが前記第1のモードの場合で、前記興味の度合いが高いほど大きい値に設定される第1閾値よりも前記受容度が小さいか、前記興味の度合いが高いほど小さい値に設定される第2閾値よりも前記受容度の減少度が大きい場合、前記動作モードとして前記第2のモードを選択する
付記1に記載の対話制御プログラム。
【0115】
(付記3)
前記選択する処理は、更に、前記興味の度合いが一定値以上の話題が存在する場合、前記動作モードとして前記第2のモードを選択する処理である
付記2に記載の対話制御プログラム。
【0116】
(付記4)
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
現在の前記動作モードが前記第2のモードの場合で、かつ前記受容度が、現在の話題の前記興味の度合いが高いほど小さい値である第2閾値未満の場合、前記動作モードとして前記第1のモードを選択する
付記1に記載の対話制御プログラム。
【0117】
(付記5)
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
現在の前記動作モードが前記第2のモードの場合で、前記受容度が第1閾値未満であるか又は前記受容度の減少度が第2閾値以上である場合で、かつ前記興味の度合いが一定値以上の他の話題が存在する場合、動作モードを継続とし、前記興味の度合いが一定値以上の話題に関する対話出力を生成する
付記1に記載の対話制御プログラム。
【0118】
(付記6)
前記第1閾値は、現在の話題の前記興味の度合いが高いほど小さい値であり、
前記第2閾値は、現在の話題の前記興味の度合いが高いほど大きい値である
付記5に記載の対話制御プログラム。
【0119】
(付記7)
時間経過に伴って前記興味の度合いを減少させる
付記1から付記6の何れか1項に記載の対話制御プログラム。
【0120】
(付記8)
現在の前記動作モードと選択した前記動作モードとが異なる場合、前記動作モードを切り替えることを前記ユーザに知らせる内容を含む対話出力を生成する
付記1から付記7の何れか1項に記載の対話制御プログラム。
【0121】
(付記9)
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
現在の前記動作モードが前記第1のモードの場合で、選択した前記動作モードが前記第2のモードの場合、システム側が対話の主導権を取得することを前記ユーザに知らせる内容を含む対話出力を生成する
付記8に記載の対話制御プログラム。
【0122】
(付記10)
ユーザとコンピュータとの間で会話を行う対話制御システムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定する確度推定部と、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定する受容度推定部と、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択する選択部と、
前記選択部により選択された動作モードに応じた対話出力を生成する生成部と、
出力装置から前記生成部により生成された対話出力を行わせる出力部と、
を含む対話制御システム。
【0123】
(付記11)
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
前記選択部は、現在の前記動作モードが前記第1のモードの場合で、前記興味の度合いが高いほど大きい値に設定される第1閾値よりも前記受容度が小さいか、前記興味の度合いが高いほど小さい値に設定される第2閾値よりも前記受容度の減少度が大きい場合、前記動作モードとして前記第2のモードを選択する
付記10に記載の対話制御システム。
【0124】
(付記12)
前記選択する処理は、更に、前記興味の度合いが一定値以上の話題が存在する場合、前記動作モードとして前記第2のモードを選択する処理である
付記11に記載の対話制御システム。
【0125】
(付記13)
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記選択部は、現在の前記動作モードが前記第2のモードの場合で、かつ前記受容度が、現在の話題の前記興味の度合いが高いほど小さい値である第2閾値未満の場合、前記動作モードとして前記第1のモードを選択する
付記10に記載の対話制御システム。
【0126】
(付記14)
前記受容度は、前記ユーザが対話を受け入れている度合いが高いほど大きい値であり、
前記興味の度合いは、前記話題に対する前記ユーザの興味のある確からしさが高いほど大きい値であり、
前記生成部は、現在の前記動作モードが前記第2のモードの場合で、前記受容度が第1閾値未満であるか又は前記受容度の減少度が第2閾値以上である場合で、かつ前記興味の度合いが一定値以上の他の話題が存在する場合、動作モードを継続とし、前記興味の度合いが一定値以上の話題に関する対話出力を生成する
付記10に記載の対話制御システム。
【0127】
(付記15)
前記第1閾値は、現在の話題の前記興味の度合いが高いほど小さい値であり、
前記第2閾値は、現在の話題の前記興味の度合いが高いほど大きい値である
付記14に記載の対話制御システム。
【0128】
(付記16)
前記確度推定部は、時間経過に伴って前記興味の度合いを減少させる
付記10から付記15の何れか1項に記載の対話制御システム。
【0129】
(付記17)
ユーザとコンピュータとの間で会話を行う際の対話制御方法であって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータが実行する対話制御方法。
【0130】
(付記18)
ユーザとコンピュータとの間で会話を行う際の対話制御プログラムであって、
対話に対するユーザからの入力に基づいて前記対話に含まれる話題に対する前記ユーザの興味の度合いを推定し、
前記対話に対するユーザからの入力に基づいて前記対話に対する前記ユーザの受容度を推定し、
前記興味の度合い及び前記受容度に基づいて、前記ユーザに対話の主導をゆだねる第1のモードと、特定の話題についてシステム主導で対話を進める第2のモードの何れの動作モードで対話を行うかを選択し、
選択した動作モードに応じた対話出力を生成し、
出力装置から生成した対話出力を行わせる
処理をコンピュータに実行させるための対話制御プログラムを記憶した記憶媒体。
【符号の説明】
【0131】
10 対話制御システム
12 対話装置
14、14A 対話制御装置
20 変換部
22 送信部
24 受信部
30 解析部
32 確度推定部
34 受容度推定部
36 選択部
38、38A 生成部
40 出力部
50、70 コンピュータ
51、71 CPU
52、72 メモリ
53、73 記憶部
58、78 記録媒体
60 変換プログラム
66 音声入力装置
67 音声出力装置
80、80A 対話制御プログラム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12