IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 稲場 真由美の特許一覧

<>
  • 特許-対話システム、及び対話方法 図1
  • 特許-対話システム、及び対話方法 図2
  • 特許-対話システム、及び対話方法 図3
  • 特許-対話システム、及び対話方法 図4
  • 特許-対話システム、及び対話方法 図5
  • 特許-対話システム、及び対話方法 図6
  • 特許-対話システム、及び対話方法 図7
  • 特許-対話システム、及び対話方法 図8
  • 特許-対話システム、及び対話方法 図9
  • 特許-対話システム、及び対話方法 図10
  • 特許-対話システム、及び対話方法 図11
  • 特許-対話システム、及び対話方法 図12
  • 特許-対話システム、及び対話方法 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-09-15
(45)【発行日】2023-09-26
(54)【発明の名称】対話システム、及び対話方法
(51)【国際特許分類】
   G10L 13/08 20130101AFI20230919BHJP
   G10L 13/00 20060101ALI20230919BHJP
   G10L 15/22 20060101ALI20230919BHJP
【FI】
G10L13/08 124
G10L13/00 100M
G10L15/22 300U
【請求項の数】 10
(21)【出願番号】P 2022087631
(22)【出願日】2022-05-30
【審査請求日】2022-06-03
【新規性喪失の例外の表示】特許法第30条第2項適用 令和4年5月12日に福祉用具展示会にて公開。
【早期審査対象出願】
【前置審査】
(73)【特許権者】
【識別番号】316008260
【氏名又は名称】稲場 真由美
(74)【代理人】
【識別番号】110001782
【氏名又は名称】弁理士法人ライトハウス国際特許事務所
(72)【発明者】
【氏名】稲場 真由美
【審査官】上田 雄
(56)【参考文献】
【文献】特開2018-054790(JP,A)
【文献】特開2017-220077(JP,A)
【文献】国際公開第2021/064947(WO,A1)
【文献】特開2017-049471(JP,A)
【文献】特開2014-222400(JP,A)
【文献】国際公開第2020/129182(WO,A1)
【文献】Ken Kohga,"世界で開発が加速化するチャットボットの進化の軌跡~元祖ELIZAの誕生から、ディープラーニングの可能性まで~",SupportTech Lab,2020年01月15日,インターネット〈URL:https://mobilus.co.jp/lab/chatbot/history-of-chatbot/〉
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10
G10L 15/00-15/34
(57)【特許請求の範囲】
【請求項1】
少なくとも1のコンピュータ装置を備える対話システムであって、
ユーザの発話の入力を受け付ける発話入力手段と、
ユーザ属性情報を項目ごとに記憶するユーザ属性記憶手段と、
ユーザの発話(システムから出力された質問に応答する発話を除く)に対する応答文を前記項目ごとに記憶する応答文記憶手段と、
発話に含まれる単語がユーザ属性情報として記憶されている場合に、該ユーザ属性情報が該当する、前記項目のうちのいずれかに対応して記憶されている応答文のいずれか1以上を選択する応答文選択手段と、
選択された応答文に対応する応答の音声を出力する応答出力手段と
を備え、
応答文記憶手段が、1の前記項目に対して、1以上のユーザの発話と、ユーザの発話に対応する応答文とを関連付けて記憶するものである、
対話システム。
【請求項2】
ユーザ属性情報が、ユーザの名前、生年月日、年齢、性別、血液型、星座、所持品、居住地、出身地、嗜好、習慣、経験、SNS(ソーシャル・ネットワーキング・サービス)、家族、友人、及び/又は知人に関する情報を含むものである、
請求項1に記載の対話システム。
【請求項3】
対話システムが、
ユーザ属性情報の入力を受け付けるユーザ属性情報入力手段
を備え、
ユーザ属性記憶手段が、入力されたユーザ属性情報を記憶するものであり、
ユーザ属性情報入力手段及びユーザ属性記憶手段が、発話入力手段による発話の入力を受け付けるよりも前に、実行されるものである、
請求項1又は2に記載の対話システム。
【請求項4】
応答文記憶手段が、1の前記項目に対応する応答文を複数記憶するものであり、
応答文選択手段が、記憶された複数の応答文のいずれか1以上を選択するものである、
請求項1又は2に記載の対話システム。
【請求項5】
対話システムが、
ユーザ属性情報を基にユーザのタイプを診断するタイプ診断手段
を備え、
応答文記憶手段が、1の前記項目に対応する応答文をタイプごとに複数記憶するものであり、
応答文選択手段が、診断されたユーザのタイプに対応する応答文のいずれか1以上を選択するものである、
請求項1又は2に記載の対話システム。
【請求項6】
対話システムが、
ユーザの発話に含まれ得る単語の発音のバリエーションの入力を受け付ける発音入力手段と、
入力された単語の発音のバリエーションを、該単語と関連付けて記憶する発音記憶手段と、
記憶された発音のバリエーションがユーザの発話に含まれる場合に、該単語を発話したと特定する発話特定手段と
を備える、
請求項1又は2に記載の対話システム。
【請求項7】
タイプ診断手段が、ユーザ以外の人物の属性情報を基に該人物のタイプを診断するものであり、
対話システムが、
ユーザのタイプと、ユーザ以外の人物のタイプとを基に、ユーザと該人物との関係性を診断する関係性診断手段
を備え、
応答文記憶手段が、関係性ごとの応答文を記憶するものであり、
応答文選択手段が、診断されたユーザと該人物との関係性に対応する応答文のいずれか1以上を選択するものである、
請求項5に記載の対話システム。
【請求項8】
対話システムが、
ユーザのSNSに関する情報を基に応答文を作成する応答文作成手段
を備え、
応答文記憶手段が、作成された応答文を記憶するものである、
請求項2に記載の対話システム。
【請求項9】
少なくとも1のコンピュータ装置を備える対話システムにおいて実行される対話方法であって、
ユーザの発話の入力を受け付ける発話入力ステップと、
ユーザ属性情報を項目ごとに記憶するユーザ属性記憶ステップと、
ユーザの発話(システムから出力された質問に応答する発話を除く)に対する応答文を前記項目ごとに記憶する応答文記憶ステップと、
発話に含まれる単語がユーザ属性情報として記憶されている場合に、該ユーザ属性情報が該当する、前記項目のうちのいずれかに対応して記憶されている応答文のいずれか1以上を選択する応答文選択ステップと、
選択された応答文に対応する応答の音声を出力する応答出力ステップと
を有し、
応答文記憶ステップが、1の前記項目に対して、1以上のユーザの発話と、ユーザの発話に対応する応答文とを関連付けて記憶するものである、
対話方法。
【請求項10】
少なくとも1のコンピュータ装置を備える対話システムであって、
ユーザ属性情報を項目ごとに記憶するユーザ属性記憶手段と、
ユーザの発話(システムから出力された質問に応答する発話を除く)に対する応答文を前記項目ごとに記憶する応答文記憶手段と、
ユーザの発話に含まれる単語がユーザ属性情報として記憶されている場合に、該ユーザ属性情報が該当する、前記項目のうちのいずれかに対応して記憶されている応答文のいずれか1以上を選択する応答文選択手段と
を備え、
応答文記憶手段が、1の前記項目に対して、1以上のユーザの発話と、ユーザの発話に対応する応答文とを関連付けて記憶するものである、
対話システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対話システム、及び対話方法に関する。
【背景技術】
【0002】
高齢者の人口増加に伴い、一人暮らしの高齢者のサポートや、施設の介護者のサポートの必要性が増大している。
【0003】
特に、高齢者が他者と対話する機会が減少することで、高齢者の認知機能や嚥下機能が低下しやすくなることが知られており、高齢者が他者と対話する機会を確保することは重要である。
【0004】
例えば、特許文献1には、高齢者と好適なコミュニケーション(雑談型対話)を図ることができるようにするロボット制御装置が記載されている。特許文献1には、ロボット制御装置が、対話中の話題について、関連性の高い話題を選び発話することが記載されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2008-158697号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の少なくとも1つの目的は、ユーザに適した対話を可能とする対話システムを提供することである。
【課題を解決するための手段】
【0007】
本発明によれば、上記目的は、
[1]少なくとも1のコンピュータ装置を備える対話システムであって、ユーザの発話の入力を受け付ける発話入力手段と、ユーザ属性情報を項目ごとに記憶するユーザ属性記憶手段と、ユーザの発話に対する応答文を項目と関連付けて記憶する応答文記憶手段と、発話に含まれる単語に関連するユーザ属性情報が該当する項目に対応する応答文のいずれか1以上を選択する応答文選択手段と、選択された応答文に対応する応答の音声を出力する応答出力手段とを備える、対話システム;
[2]ユーザ属性情報が、ユーザの名前、生年月日、年齢、性別、血液型、星座、所持品、居住地、出身地、嗜好、習慣、経験、SNS(ソーシャル・ネットワーキング・サービス)、家族、友人、及び/又は知人に関する情報を含むものである、上記[1]に記載の対話システム;
[3]対話システムが、ユーザ属性情報を入力するユーザ属性情報入力手段を備え、ユーザ属性記憶手段が、入力されたユーザ属性情報を記憶するものである、上記[1]又は[2]に記載の対話システム;
[4]応答文記憶手段が、1の項目に対応する応答文を複数記憶するものであり、応答文選択手段が、記憶された複数の応答文のいずれか1以上を選択するものである、上記[1]~[3]のいずれかに記載の対話システム;
[5]対話システムが、ユーザ属性情報を基にユーザのタイプを診断するタイプ診断手段を備え、応答文記憶手段が、1の項目に対応する応答文をタイプごとに複数記憶するものであり、応答文選択手段が、診断されたユーザのタイプに対応する応答文のいずれか1以上を選択するものである、上記[1]~[4]のいずれかに記載の対話システム;
[6]対話システムが、ユーザの発話に含まれ得る単語の発音のバリエーションを、該単語と関連付けて記憶する発音記憶手段と、記憶された発音のバリエーションがユーザの発話に含まれる場合に、該単語を発話したと特定する発話特定手段とを備える、上記[1]~[5]のいずれかに記載の対話システム;
[7]対話システムが、ユーザの属性情報と、ユーザ以外の人物の属性情報とを基に、ユーザと該人物との関係性を診断する関係性診断手段を備え、応答文記憶手段が、関係性ごとの応答文を記憶するものであり、応答文選択手段が、診断されたユーザと該人物との関係性に対応する応答文のいずれか1以上を選択するものである、上記[1]~[6]のいずれかに記載の対話システム;
[8]対話システムが、ユーザのSNSに関する情報を基に応答文を作成する応答文作成手段を備え、応答文記憶手段が、作成された応答文を記憶するものである、上記[2]~[7]のいずれかに記載の対話システム;
[9]少なくとも1のコンピュータ装置を備える対話システムにおいて実行される対話方法であって、ユーザの発話の入力を受け付ける発話入力ステップと、ユーザ属性情報を項目ごとに記憶するユーザ属性記憶ステップと、ユーザの発話に対する応答文を項目と関連付けて記憶する応答文記憶ステップと、発話に含まれる単語と関連するユーザ属性情報が該当する項目に対応する応答文のいずれか1以上を選択する応答文選択ステップと、選択された応答文に対応する応答の音声を出力する応答出力ステップとを有する、対話方法;
[10]少なくとも1のコンピュータ装置を備える対話システムであって、ユーザ属性情報を項目ごとに記憶するユーザ属性記憶手段と、ユーザの発話に対する応答文を項目と関連付けて記憶する応答文記憶手段と、ユーザの発話に含まれる単語と関連するユーザ属性情報が該当する項目に対応する応答文のいずれか1以上を選択する応答文選択手段とを備える、対話システム;
により達成することができる。
【発明の効果】
【0008】
本発明によれば、ユーザに適した対話を可能とする対話システムを提供することができる。
【図面の簡単な説明】
【0009】
図1】本発明の実施の形態にかかる、対話システムの構成を示すブロック図である。
図2】本発明の実施の形態にかかる、対話システムにおける初期設定処理のフローチャートを表す図である。
図3】本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
図4】本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
図5】本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
図6】本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
図7】本発明の実施の形態にかかる、対話システムにおける対話処理のフローチャートを表す図である。
図8】本発明の実施の形態にかかる、対話システムにおける応答選択処理のフローチャートを表す図である。
図9】本発明の実施の形態にかかる、固有名詞登録データテーブルを表す図である。
図10】本発明の実施の形態にかかる、固有名詞登録応答文マスタテーブルを表す図である。
図11】本発明の実施の形態にかかる、エピソード登録応答文テーブルを表す図である。
図12】本発明の実施の形態にかかる、関係性マスタテーブル及び対人関係応答文マスタテーブルを表す図である。
図13】本発明の実施の形態にかかる、基本対話マスタテーブルを表す図である。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、本発明の実施の形態について説明する。以下、効果に関する記載は、本発明の実施の形態の効果の一側面であり、ここに記載するものに限定されない。また、以下で説明するフローチャートを構成する各処理の順序は、処理内容に矛盾や不整合が生じない範囲で順不同である。
【0011】
以下、高齢者がユーザとなる対話システムを例としてあげるが、本発明の対話システムのユーザは、高齢者に限定されるものではない。本発明の対話システムのユーザは、例えば、子どもや、高齢ではない大人であってもよい。
【0012】
また、以下では、ユーザの補助をする補助者が、対話システムに登録し、初期設定などを行うこととするが、補助者以外の者が対話システムに登録し、初期設定などを行ってもよい。例えば、ユーザ自身が対話システムに登録し、初期設定などを行ってもよい。
【0013】
なお、「補助者」とは、ユーザの補助をする者のことであればよい。例えば、「補助者」には、ユーザの家族、ケアマネージャー、介護者、ユーザが入所している施設の職員などが含まれる。
【0014】
[対話システムの構成]
図1は、本発明の実施の形態にかかる、対話システムの構成を示すブロック図である。図示するように、対話システムは、ユーザとの対話を行う対話装置1と、ユーザを補助する補助者により操作される補助者端末2と、通信ネットワーク3と、サーバ装置4とから構成される。対話装置1と補助者端末2、対話装置1とサーバ装置4、補助者端末2とサーバ装置4は、それぞれ、通信ネットワーク3を介して接続されている。なお、対話装置1と補助者端末2、対話装置1とサーバ装置4、補助者端末2とサーバ装置4は、常時接続していなくてもよく、必要に応じて、接続が可能であればよい。
【0015】
対話装置1は、ユーザとの対話を行うことができればよく、特に限定されない。例えば、対話装置1は、制御部、マイクなどの音声の入力部、スピーカなどの音声の出力部、ストレージ部、通信インタフェースを備えていてもよい。
【0016】
対話装置1の形状は特に限定されず、適宜設計可能である。対話装置1の形状は、例えば、人や犬などの動物、草や花などの植物、雪だるまやカカシなどのオブジェクトなどを模したものであってもよい。あるいは、対話装置1の形状は、球体、円筒体などの幾何学的な形状であってもよい。つまり、対話装置1は、ロボットのような外観のものでも、スマートスピーカーのような外観のものでもよい。ユーザにとって愛着が湧きやすいという観点からは、対話装置1の外観は、ロボットのようなものであってもよい。
【0017】
また、対話装置1は、デスクトップ型・ノート型のパーソナルコンピュータ、タブレット型端末、スマートフォン、従来型の携帯電話などであってもよい。
【0018】
補助者端末2は、対話システムの初期設定を行うことができればよく、特に限定されない。補助者端末2は、例えば、制御部、入力部、表示部、及び通信インタフェースを備えていてもよい。具体的には、補助者端末2は、デスクトップ型・ノート型のパーソナルコンピュータ、タブレット型端末、スマートフォン、従来型の携帯電話などであってよい。
【0019】
サーバ装置4は、例えば、制御部、RAM、ストレージ部及び通信インタフェースを備え、それぞれ内部バスにより接続されていてもよい。制御部は、CPUやROMから構成され、ストレージ部に格納されたプログラムを実行し、サーバ装置4の制御を行う。RAMは、制御部のワークエリアである。ストレージ部は、プログラムやデータを保存するための記憶領域である。制御部は、プログラム及びデータをRAMから読み出し、対話装置1、及び補助者端末2から受信した要求情報をもとに、プログラム実行処理を行う。通信インタフェースは、無線又は有線により通信ネットワーク3に接続が可能であり、通信ネットワーク3を介してデータを受信することが可能である。通信インタフェースを介して受信したデータは、RAMにロードされ、制御部により演算処理が行われる。
【0020】
なお、ここでは、対話装置1、補助者端末2、通信ネットワーク3、及びサーバ装置4を備える対話システムを例にあげるが、対話システムは、少なくとも1のコンピュータ装置を備えていればよい。
【0021】
例えば、対話システムは、対話装置1のみから構成されるものでもよく、サーバ装置4の代わりにブロックチェーン技術を用いて構成されるものでもよく、サーバ装置4の代わりにP2P(Peer to Peer)の技術を用いて構成されるものでもよい。また、対話システムは、複数のサーバ装置4がAPI(Application Programming Interface)を利用して連携するよう構成されてもよい。
【0022】
また、例えば、対話システムは、仮想空間内での対話に用いられてもよい。つまり、対話システムは、ユーザが、仮想空間内に存在するキャラクタやオブジェクトと対話を行う際に用いられてもよい。この場合、ユーザは、仮想空間内に存在する自身のアバタを介して、仮想空間内に存在するキャラクタやオブジェクトと対話を行ってもよく、現実の空間内から、仮想空間を表示する画面を介して、仮想空間内に存在するキャラクタやオブジェクトと対話を行ってもよい。また、仮想空間内に存在するキャラクタやオブジェクトは、コンピュータ装置により自動制御されていてもよい。
【0023】
ここでは、1つの対話装置1と対話を行うユーザは1人であることとするが、1つの対話装置1と対話を行うユーザは2人以上であってもよい。1つの対話装置1と対話を行うユーザが2人以上である場合、対話システムにより、いずれのユーザが対話を求めているかが識別されることとしてもよい。例えば、対話装置1にカメラが備えられ、いずれのユーザが対話を求めているかをユーザの顔の画像により識別することとしてもよい。あるいは、対話システムにユーザごとの声の特徴に関する情報が記憶され、いずれのユーザが対話を求めているかをユーザの声の特徴を解析することにより識別することとしてもよい。ユーザを識別するための情報は、後述する初期設定処理において、対話システムに予め登録されていることとしてもよい。また、ユーザを識別するための解析処理には、従来公知の技術を利用することができる。
【0024】
本発明の対話システムを利用するにあたり、補助者は、予め、ユーザの属性に関する情報(以下、ユーザ属性情報ともいう)を対話システムに登録することとする。ユーザ属性情報は、ユーザに属する性質、及び/又は特徴を表すものである。補助者は、対話システムを利用するためのURLにアクセスし、ユーザ属性情報の登録を行う。ユーザ属性情報の登録の際には、対話システムにおいて、以下のような初期設定処理が行われる。
【0025】
[初期設定処理]
図2は、本発明の実施の形態にかかる、対話システムにおける初期設定処理のフローチャートを表す図である。
【0026】
まず、補助者端末2において、初期設定画面を表示する要求が入力される(ステップS101)。入力された初期設定画面を表示する要求は、補助者端末2からサーバ装置4へ送信される(ステップS102)。送信された初期設定画面を表示する要求は、サーバ装置4において受信される(ステップS103)。そして、サーバ装置4から補助者端末2へ、初期設定画面を表示するための情報が送信される(ステップS104)。送信された初期設定画面を表示するための情報は、補助者端末2において受信される(ステップS105)。そして、補助者端末2において、初期設定画面が表示される(ステップS106)。次に、補助者端末2において、ユーザ属性情報が入力される(ステップS107)。入力されたユーザ属性情報は、補助者端末2からサーバ装置4へ送信される(ステップS108)。送信されたユーザ属性情報は、サーバ装置4において受信される(ステップS109)。そして、受信されたユーザ属性情報は、サーバ装置4において記憶され(ステップS110)、初期設定処理が終了する。
【0027】
上記の、ステップS101~ステップS106における初期設定画面の表示、及び、ステップS107におけるユーザ属性情報の入力にかかる処理について、図3~6を参照しながら説明する。
【0028】
以下においては、ユーザ属性情報の初期設定として、ユーザの基本的な情報についての設定登録である基本情報登録、ユーザに固有の名詞に関する情報についての設定登録である固有名詞登録、ユーザに固有のエピソードに関する情報についての設定登録であるエピソード登録、ユーザにリマインドすべき情報についての設定登録であるリマインド登録、及び、ユーザの対人関係に関する情報についての設定登録である対人関係登録の5種類の初期設定を行う例について説明する。
【0029】
図3は、本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
【0030】
補助者端末2から対話システムを利用するためのURLにアクセスすると、補助者端末2の表示画面には、対話システムの実行画面1000として、対話システム利用サイトのトップページが表示される。なお、対話システム利用サイトのトップページが表示される前に、対話システムに登録している登録者のIDとパスワードの入力が求められてもよい。
【0031】
図3においては、トップページの左側の欄の上部に登録者の名前1001が表示され、トップページの左側の欄の下部に対話システムからログアウトするためのログアウトボタン1002が表示されている。図3では、対話システムの登録者の名前1001として、「特許 太郎」という名前が表示されている。
【0032】
また、図3においては、登録者の名前1001とログアウトボタン1002の間に、個人情報アイコン1100、基本情報設定アイコン1200、固有名詞設定アイコン1300、エピソード設定アイコン1400、リマインド設定アイコン1500、及び対人関係設定アイコン1600が表示されている。
【0033】
図示しないが、実行画面1000に表示された個人情報アイコン1100が押下されると、トップページの右側の欄に、対話システムに記憶された登録者やユーザに関する情報を閲覧、及び/又は編集するための個人情報画面が表示される。例えば、個人情報画面において、基本情報登録、固有名詞登録、エピソード登録、リマインド登録、対人関係登録された情報の内容を閲覧、及び/又は編集することできる。また、個人情報画面において、後述の、ユーザ属性情報を基に診断されたユーザのタイプ、ユーザ以外の人物の属性情報を基に診断された該人物のタイプ、及び、ユーザ属性情報とユーザ以外の人物の属性情報とを基に診断されたユーザと該人物の関係性を閲覧することできる。
【0034】
次に、ユーザの基本的な情報を登録するための、基本情報登録について説明する。
【0035】
対話システム利用サイトのトップページの左側の欄に表示された基本情報設定アイコン1200が押下されると、ステップS101において、ユーザの基本的な情報について設定登録を行うための初期設定画面を表示する要求が入力されたこととなる。そして、ステップS106において、図3の右側の欄に示すような、ユーザの基本的な情報について設定登録を行うための初期設定画面、すなわち、基本情報設定画面1201が表示される。
【0036】
図3に示すように、基本情報設定画面1201には、ユーザの名前1202、ユーザのニックネーム1203、ユーザの生年月日1204、ロボットの名前1205、及びロボットのID1206を入力するための欄が表示される。ステップS107において、補助者は、基本情報設定画面1201に表示された項目について、ユーザ属性情報を入力することができる。
【0037】
図3においては、ユーザの名前1202として「特許 花子」、ユーザのニックネーム1203として「はなちゃん」、ユーザの生年月日1204として「1932年1月1日」、ロボットの名前1205として「えもちゃん」、及び、ロボットのID1206として「12345」という情報が入力されている。なお、ここでは、「ロボット」は、対話装置1のことを指すものとする。
【0038】
ユーザ属性情報が入力された状態で、基本情報設定画面1201の右上に表示された保存ボタン1207が押下されると、ステップS108において、入力されたユーザ属性情報がサーバ装置4へ送信されることとなる。そして、入力されたユーザ属性情報は、ステップS110において、入力された欄の項目と関連付けて、サーバ装置4に記憶される。以下、基本情報設定画面1201において入力され、サーバ装置4に記憶された情報を、「基本情報登録された情報」ともいう。
【0039】
上記においては、基本情報登録されるユーザ属性情報は、ユーザの名前、ユーザのニックネーム、ユーザの生年月日、ユーザと対話を行うロボットの名前、及び該ロボットのIDであることとしたが、他のユーザ属性情報が基本情報登録されてもよい。例えば、基本情報登録されるユーザ属性情報には、ユーザの年齢、性別、血液型、星座、所持品、居住地、出身地、SNS(ソーシャル・ネットワーキング・サービス)などに関する情報が含まれていてもよい。
【0040】
また、ユーザの生年月日に関する情報は、生まれ年、生まれ月、及び生まれた日ごとに記憶されることとしてもよい。
【0041】
さらに、ユーザ属性情報は、入力された他のユーザ属性情報を基に、自動的に特定され、項目と関連付けて記憶されてもよい。例えば、ユーザの生年月日に関する情報を基に、ユーザの年齢や星座が特定され、項目と関連付けて記憶されてもよい。あるいは、例えば、ユーザのSNSに関する情報を基に、ユーザの名前、ニックネーム、生年月日、年齢、性別、血液型、星座、所持品、居住地、出身地などが特定され、項目と関連付けて記憶されてもよい。ユーザのSNSに関する情報とは、例えば、SNSのアカウントに関する情報、SNSのアカウントにおいて登録されているプロフィールに関する情報、SNS上で公開されている投稿内容に関する情報、SNS上で紐づいている他のユーザに関する情報などのことであってもよい。
【0042】
ユーザのSNSに関する情報を基に、他のユーザ属性情報を特定する方法は、特に限定されず、適宜設計可能である。ユーザのSNSに関する情報を基に他のユーザ属性情報を特定するためには、自然言語処理技術、グラフマイニング技術、画像処理技術など、公知の技術を利用することができる。
【0043】
例えば、基本情報設定画面1201において、ユーザのSNSのアカウントに関する情報を入力すると、SNSのアカウントにおいて登録されているプロフィールに関する情報、SNS上で公開されている投稿内容に関する情報、SNS上で紐づいている他のユーザに関する情報の中から、ユーザ属性情報が抽出されることとしてもよい。
【0044】
また、1つのロボットを複数のユーザで使用する場合には、基本情報設定画面1201において、ユーザ属性情報として、ユーザを識別するための情報が登録されることとしてもよい。例えば、基本情報設定画面1201において、ユーザの顔の画像が登録されることとしてもよく、ユーザの声の特徴に関する情報が登録されることとしてもよい。また、ユーザを識別するための情報は、例えば、ユーザのSNSに関する情報を基に、自動的に特定され、記憶されてもよい。
【0045】
ユーザ属性情報がユーザのSNSに関する情報を基に自動的に特定される場合には、補助者端末2の表示画面に、特定されたユーザ属性情報が表示され、記憶するか否かを補助者が決定できることとしてもよい。また、特定されたユーザ属性情報を、補助者が修正できることとしてもよい。そして、補助者により修正されたユーザ属性情報が記憶されることとしてもよい。後述する、固有名詞登録、エピソード登録、対人関係登録においても、ユーザ属性情報がユーザのSNSに関する情報を基に自動的に特定される場合には、同様に、補助者がユーザ属性情報を修正することができることとしてもよい。
【0046】
あるいは、ユーザ属性情報は、他のデータベースに記憶されているユーザ属性情報を基に自動的に特定され、項目と関連付けて記憶されてもよい。例えば、ユーザの入所している施設の入所者を管理するシステムにおいて、ユーザ属性情報を記憶したデータベースを備えている場合には、該データベースの中から、ユーザ属性情報が抽出されることとしてもよい。
【0047】
なお、ユーザ属性情報は、項目ごとに記憶されるが、「項目」とは、複数のユーザ属性のいずれかを表すもののことを指すものとする。例えば、「項目」は、そのユーザ属性が、ユーザにとってどのような意味や価値を有するものであるのかを示す区分けのことを指すものとしてもよい。
【0048】
上記の例では、例えば、「ユーザの名前」が「項目」に相当し、「特許 花子」が「ユーザ属性情報」に相当することとしてもよい。
【0049】
また、本発明の対話システムは、入力されたユーザ属性情報を基に、ユーザのタイプを診断することができる。「タイプ」とは、人間を何らかの基準で分類して、その共通する特性をとりだした型のことを指す。例えば、ユーザを、洞察力の高い「ビジョンタイプ」、平和主義の「ピースタイプ」、論理的な「ロジカルタイプ」などに分類してもよい。
【0050】
本発明の対話システムは、例えば、ユーザの生年月日を基にユーザのタイプを診断してもよく、ユーザの血液型を基にユーザのタイプを診断してもよく、ユーザの星座を基にユーザのタイプを診断してもよい。診断されたユーザのタイプは、前述の、個人情報画面において閲覧できることとしてもよい。
【0051】
次に、ユーザに固有の名詞、すなわちユーザの固有名詞に関する情報を登録するための、固有名詞登録について説明する。なお、ここでは、「ユーザの固有名詞」は、ユーザに固有の名詞のことを指すものとし、固有名詞でも、普通名詞でもよい。
【0052】
図4は、本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
【0053】
対話システム利用サイトのトップページの左側の欄に表示された固有名詞設定アイコン1300が押下されると、ステップS101において、ユーザの固有名詞に関する情報について設定登録を行うための初期設定画面を表示する要求が入力されたこととなる。そして、ステップS106において、図4の右側の欄に示すような、ユーザの固有名詞に関する情報について設定登録を行うための初期設定画面、すなわち、固有名詞設定画面1301が表示される。
【0054】
図4に示すように、固有名詞設定画面1301には、ユーザの固有名詞の大カテゴリ1302、ユーザの固有名詞の中カテゴリ1303、ユーザの固有名詞1304、及び、ユーザの固有名詞の発音バリエーション1305を入力するための欄が表示される。ステップS107において、補助者は、固有名詞設定画面1301に表示された項目について、ユーザ属性情報を入力することができる。
【0055】
図4においては、大カテゴリ1302として「場所」、中カテゴリ1303として「行きつけのカフェ」、ユーザの固有名詞1304として「Bカフェ」、及び、ユーザの固有名詞の発音バリエーション1305として「Bカへ、Bカへー、Bカフェー」という情報が入力されている。
【0056】
ユーザ属性情報が入力された状態で、固有名詞設定画面1301の右上に表示された保存ボタン1306が押下されると、ステップS108において、入力されたユーザ属性情報がサーバ装置4へ送信されることとなる。そして、入力されたユーザ属性情報は、ステップS110において、入力された欄の項目と関連付けて、サーバ装置4に記憶される。以下、固有名詞設定画面1301において入力され、サーバ装置4に記憶された情報を、「固有名詞登録された情報」ともいう。固有名詞登録された情報は、後述する、固有名詞登録データテーブルに記憶される。
【0057】
上記の例では、例えば、中カテゴリ1303の欄に入力された「行きつけのカフェ」が「項目」に相当し、ユーザの固有名詞1304の欄に入力された「Bカフェ」が「ユーザ属性情報」に相当することとしてもよい。
【0058】
固有名詞登録されるユーザ属性情報には、嗜好、習慣、家族、友人、知人などに関する情報が含まれていてもよい。例えば、固有名詞登録されるユーザ属性情報には、よく行く場所、よく行くスーパー、よく行くコンビニ、行きつけのカフェ、行きつけのレストラン、行きつけの美容院、行きつけの病院、通っている健康施設、よく行く友人の家、通っている職場、好きな食べ物、苦手な食べ物、好きな果物、苦手な果物、好きな野菜、苦手な野菜、得意なこと、好きなスポーツ、好きな有名人、パートナーの呼び方、同居している家族の名前などの情報が含まれていてもよい。
【0059】
また、固有名詞登録されるユーザ属性情報は、ユーザのSNSに関する情報を基に、自動的に特定され、項目と関連付けて記憶されてもよい。例えば、基本情報設定画面1201において、ユーザのSNSのアカウントに関する情報を入力すると、SNSのアカウントにおいて登録されているプロフィールに関する情報、SNS上で公開されている投稿内容に関する情報、SNS上で紐づいている他のユーザに関する情報の中から、ユーザ属性情報が抽出されることとしてもよい。具体的には、例えば、ユーザのSNS上で公開されている投稿の中に頻出する場所の名前が、ユーザのよく行く場所であると特定され、互いに関連付けて記憶されてもよい。
【0060】
ユーザの固有名詞の発音バリエーション1305の欄には、ユーザの固有名詞1304の欄に入力された単語の一般的な発音ではないが、ユーザの固有名詞1304の欄に入力された単語と同じものを指す発音を入力することができる。例えば、上記の例では、ユーザが「Bカフェ」と発音しようとする際に、実際には、「Bカへ」、「Bカへー」、又は「Bカフェー」と聞こえる発音を行っていることとする。
【0061】
そして、ユーザの固有名詞の発音バリエーション1305の欄に入力された発音がユーザの発話に含まれる場合には、ユーザの固有名詞1304の欄に入力された単語を発話したと特定されることとしてもよい。例えば、上記の例では、「Bカフェ」と関連付けて「Bカへ」、「Bカへー」、及び「Bカフェー」という発音バリエーションが記憶されているため、ユーザが「Bカへに行ってきたよ」と発音したときには、ユーザが「Bカフェに行ってきたよ」と発話したと特定することができる。
【0062】
このように、対話システムが、ユーザの発話に含まれ得る単語の発音のバリエーションを、該単語と関連付けて記憶する発音記憶手段と、記憶された発音のバリエーションがユーザの発話に含まれる場合に、該単語を発話したと特定する発話特定手段とを備えることで、ユーザに固有の発音の癖がある場合にも、ユーザの意図を正しく汲み取ることが可能となる。
【0063】
なお、ここでは、ユーザの固有名詞の発音バリエーションを登録できる態様について記載したが、ユーザの固有名詞として登録された単語以外の単語についても、ユーザの発音のバリエーションを登録できることとしてもよい。その場合、対話システム利用サイトの中に、単語の発音のバリエーションの設定を行うための発音バリエーション設定画面を表示することが可能であってもよい。そして、発音バリエーション設定画面において、ユーザの発話に含まれ得る単語と関連付けて、その単語の発音のバリエーションを登録することができることとしてもよい。
【0064】
例えば、ユーザが「ミシュラン」という単語を発音する際に、「ミシラン」と発音していることが多い場合には、「ミシュラン」という単語の発音のバリエーションとして、「ミシラン」と登録することができる。また、例えば、ユーザの出身地では、「かわいい」という単語を、「めんこい」ということが一般的である場合には、「かわいい」という単語の発音のバリエーションとして、「めんこい」と登録することができる。
【0065】
次に、ユーザに固有のエピソードに関する情報を登録するための、エピソード登録について説明する。
【0066】
図5は、本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
【0067】
対話システム利用サイトのトップページの左側の欄に表示されたエピソード設定アイコン1400が押下されると、ステップS101において、ユーザに固有のエピソードに関する情報について設定登録を行うための初期設定画面を表示する要求が入力されたこととなる。そして、ステップS106において、図5の右側の欄に示すような、ユーザに固有のエピソードに関する情報について設定登録を行うための初期設定画面、すなわち、エピソード設定画面1401が表示される。
【0068】
図5に示すように、エピソード設定画面1401には、ユーザに固有のエピソードが属する項目のカテゴリ1402、ユーザに固有のエピソードのキーワード1403、及び、ユーザに固有のエピソードの具体的な内容、すなわち具体的なエピソード1404を入力するための欄が表示される。ステップS107において、補助者は、エピソード設定画面1401に表示された項目について、ユーザ属性情報を入力することができる。
【0069】
図5においては、カテゴリ1402として「学生時代のこと」、キーワード1403として「バレーボール」、及び、具体的なエピソード1404として「はなこさんは、学生のときにバレーボールが得意で、大会で優勝されたことがあるのですよね。その時に印象的だったことを聞かせてください。」という情報が入力されている。
【0070】
ユーザ属性情報が入力された状態で、エピソード設定画面1401の右上に表示された保存ボタン1405が押下されると、ステップS108において、入力されたユーザ属性情報がサーバ装置4へ送信されることとなる。そして、入力されたユーザ属性情報は、ステップS110において、入力された欄の項目と関連付けて、サーバ装置4に記憶される。以下、エピソード設定画面1401において入力され、サーバ装置4に記憶された情報を、「エピソード登録された情報」ともいう。エピソード登録された情報は、後述する、エピソード登録応答文テーブルに記憶される。
【0071】
上記の例では、例えば、「学生時代のことのキーワード」が「項目」に相当し、キーワード1403としてとして入力された「バレーボール」が「ユーザ属性情報」に相当することとしてもよい。
【0072】
ユーザ属性情報がどのような項目に該当しているかは、補助者から閲覧可能であってもよく、補助者から閲覧不可能であってもよい。例えば、補助者がユーザ属性情報を入力する際にはカテゴリ1402の入力欄は表示されず、キーワード1403と具体的なエピソード1404の入力欄が表示されることとしてもよい。この場合であっても、入力された具体的なエピソード1404の内容から、入力されたキーワード1403がどのような項目に該当するユーザ属性情報なのかが特定され、項目と応答文が関連付けて記憶されることとしてもよい。
【0073】
エピソード登録されるユーザ属性情報には、嗜好、習慣、経験、家族、友人、知人などに関する情報が含まれていてもよい。例えば、エピソード登録されるユーザ属性情報には、学生時代のこと、仕事をしていたときのこと、頑張ったときのこと、旅行に行ったときのこと、昔のこと、家族のこと、趣味のこと、好きな食べ物のこと、好きな歌のこと、得意なことなどの情報が含まれていてもよい。
【0074】
また、エピソード登録されるユーザ属性情報は、ユーザのSNSに関する情報を基に、自動的に特定され、項目と関連付けて記憶されてもよい。例えば、基本情報設定画面1201において、ユーザのSNSのアカウントに関する情報を入力すると、SNSのアカウントにおいて登録されているプロフィールに関する情報、SNS上で公開されている投稿内容に関する情報、SNS上で紐づいている他のユーザに関する情報の中から、ユーザ属性情報が抽出されることとしてもよい。
【0075】
具体的には、例えば、ユーザのSNS上で公開されている投稿において、ユーザのエピソードに関する情報が記載されている場合、ユーザのエピソードに関する情報の中から、キーワード1403や具体的なエピソード1404が抽出されることとしてもよい。ユーザのエピソードに関する情報が記載されているか否かは、例えば、ユーザのSNS上で公開されている投稿において、所定の文字列が記載されているか否かにより判定されてもよい。例えば、ユーザのSNS上で公開されている投稿の中に、「旅行に行ってきました」という文字列が含まれていた場合には、該投稿の中から、旅行に行った場所、日付、同伴者などの情報が抽出されることとしてもよい。
【0076】
また、対話システムは、ユーザのSNSに関する情報を基に応答文を作成してもよい。応答文は、所定の応答文のテンプレートの中に、ユーザのSNSに関する情報の中から抽出された情報が挿入されることで作成されてもよく、応答文のテンプレートはない状態で、ユーザのSNSに関する情報から作成されてもよい。
【0077】
このように、対話システムが、ユーザのSNSに関する情報を基に応答文を作成する応答文作成手段を備え、応答文記憶手段が、作成された応答文を記憶するものであることで、補助者が把握していない内容や、ユーザ本人が忘れている内容に関しても、対話システムを通して話題にあげることができる。
【0078】
また、ここでは、具体的なエピソード1404として、応答文の一部が入力される例を示したが、具体的なエピソード1404として、応答文の一部とはならないエピソードが入力されることとしてもよい。例えば、上記の例では、具体的なエピソード1404として、「学生のときにバレーボールが得意で、大会で優勝したことがある。」という情報が入力されてもよい。また、具体的なエピソード1404として入力された情報に含まれる単語が、自動的にその項目のキーワードとして登録される態様とすることもできる。
【0079】
次に、ユーザにリマインドすべき情報を登録するための、リマインド登録について説明する。
【0080】
図示しないが、対話システム利用サイトのトップページの左側の欄に表示されたリマインド設定アイコン1500が押下されると、トップページの右側の欄に、ユーザにリマインドすべき情報を登録するためのリマインド設定画面が表示される。リマインド設定画面においては、起床時刻、食事の時刻、服薬の時刻、入浴の時刻、就寝時刻などの、ユーザの日常的な活動が行われる時刻をリマインドするための設定登録が可能である。例えば、リマインド設定画面において、リマインドする時刻、リマインドにおいて音声出力する内容、繰り返しリマインドする機能の使用の有無などを設定登録することができる。
【0081】
リマインド登録がなされることで、対話装置1は、リマインド登録された時刻に到達したときに、リマインド登録された内容を、音声により出力することができる。
【0082】
ユーザの日常的な活動が行われる時刻をリマインドするための設定登録が可能であることで、対話装置1によって、ユーザが規則正しい生活を送るためのサポートをすることができるようになる。
【0083】
次に、ユーザの対人関係に関する情報を登録するための、「対人関係登録」について説明する。
【0084】
図6は、本発明の実施の形態にかかる、対話システムの実行画面の一例を示す図である。
【0085】
対話システム利用サイトのトップページの左側の欄に表示された対人関係設定アイコン1600が押下されると、ステップS101において、ユーザの対人関係に関する情報について設定登録を行うための初期設定画面を表示する要求が入力されたこととなる。そして、ステップS106において、図6の右側の欄に示すような、ユーザの対人関係に関する情報について設定登録を行うための初期設定画面、すなわち、対人関係設定画面1601が表示される。
【0086】
図6に示すように、対人関係設定画面1601には、ユーザとの関係性を知りたい相手の名前1602、ユーザとの関係性を知りたい相手のニックネーム1603、及び、ユーザとの関係性を知りたい相手の生年月日1604を入力するための欄が表示される。ステップS107において、補助者は、対人関係設定画面1601に表示された項目について、ユーザとの関係性を知りたい相手についての情報を入力することができる。
【0087】
「ユーザとの関係性を知りたい相手」とは、ユーザ以外の人物であればよく、特に限定されない。例えば、「ユーザとの関係性を知りたい相手」は、ユーザの友人や知人であってもよい。ここでは、「ユーザとの関係性を知りたい相手」はユーザの友人であることとする。
【0088】
ユーザとの関係性を知りたい相手についての情報は、該相手の属性情報であるが、同時に、ユーザにとっては、ユーザの友人についての情報でもあるため、ユーザの属性情報とも言える。
【0089】
図6においては、相手の名前1602として「商標 次郎」、相手のニックネーム1603として「じろうくん」、及び、相手の生年月日1604として「1930年2月2日」という情報が入力されている。
【0090】
ユーザ属性情報(友人の属性情報)が入力された状態で、対人関係設定画面1601の右上に表示された保存ボタン1605が押下されると、ステップS108において、入力されたユーザ属性情報(友人の属性情報)がサーバ装置4へ送信されることとなる。そして、入力されたユーザ属性情報(友人の属性情報)は、ステップS110において、入力された欄の項目と関連付けて、サーバ装置4に記憶される。以下、対人関係設定画面1601において入力され、サーバ装置4に記憶された情報を、「対人関係登録された情報」ともいう。
【0091】
上記の例では、例えば、「相手の名前」が「項目」に相当し、「商標 次郎」が「ユーザ属性情報」に相当することとしてもよい。
【0092】
上記においては、対人関係登録されるユーザ属性情報(友人の属性情報)は、友人の名前、ニックネーム、及び、生年月日であることとしたが、他のユーザ属性情報(友人の属性情報)が対人関係登録されてもよい。例えば、対人関係登録されるユーザ属性情報(友人の属性情報)には、友人の年齢、性別、血液型、星座、所持品、居住地、出身地、嗜好、習慣、経験、SNS、家族、友人、知人などに関する情報が含まれていてもよい。
【0093】
対人関係登録されるユーザ属性情報は、ユーザのSNSに関する情報を基に、自動的に特定され、項目と関連付けて記憶されてもよい。例えば、基本情報設定画面1201において、ユーザのSNSのアカウントに関する情報を入力すると、SNS上で紐づいている他のユーザに関する情報の中から、該他のユーザのユーザ属性情報が抽出されることとしてもよい。他のユーザに関する情報には、例えば、他のユーザのSNSのアカウントにおいて登録されているプロフィールに関する情報、他のユーザのSNS上で公開されている投稿内容に関する情報などが含まれる。
【0094】
また、本発明の対話システムは、対人関係登録されたユーザ属性情報(友人の属性情報)を基に、該友人のタイプを診断することができる。本発明の対話システムは、例えば、友人の生年月日を基に該友人のタイプを診断してもよく、友人の血液型を基に該友人のタイプを診断してもよく、友人の星座を基に該友人のタイプを診断してもよい。診断された友人のタイプは、前述の、個人情報画面に表示されることとしてもよい。
【0095】
さらに、本発明の対話システムは、ユーザの属性情報と、ユーザとの関係性を知りたい相手の属性情報(友人の属性情報)とを基に、ユーザと該友人との関係性を診断することができる。本発明の対話システムは、診断されたユーザのタイプと診断された友人のタイプとを基に、ユーザと該友人との関係性を診断することとしてもよく、診断されたユーザのタイプと診断された友人のタイプとは関係なく、ユーザと該友人の関係性を診断することとしてもよい。診断されたユーザと該友人との関係性は、前述の、個人情報画面に表示されることとしてもよい。
【0096】
上記のような初期設定処理によって、補助者は、ユーザ属性情報を対話システムに登録することができる。また、初期設定処理によって登録されたユーザ属性情報は、上述の、個人情報画面において、随時、内容を閲覧、及び/又は編集することができる。
【0097】
このように、対話システムが、ユーザ属性情報を入力するユーザ属性情報入力手段を備え、ユーザ属性記憶手段が、入力されたユーザ属性情報を記憶するものであることで、それぞれのユーザに固有の情報に基づいた対話が容易となる。
【0098】
また、このように、ユーザ属性情報が、ユーザの名前、生年月日、年齢、性別、血液型、星座、所持品、居住地、出身地、嗜好、習慣、経験、SNS、家族、友人、及び/又は知人に関する情報を含むものであることで、ユーザに固有のさまざまな話題について、適切な対話を行うことができる。
【0099】
なお、補助者は、対話システム利用サイトのトップページの左側の欄の下部に表示されたログアウトボタン1002を押下することで、随時、対話システム利用サイトからログアウトすることができる。
【0100】
対話システムにおける初期設定が終了した後、ユーザが対話装置1に備えられた電源ボタンを押下し、電源をオンにすることで、ユーザと対話装置1との対話が可能となる。なお、対話装置1は、電源がオンの間は対話が可能であることとしてもよく、電源がオンとなっており、かつ、所定のウェイクワードが入力されることで対話が可能となることとしてもよい。ユーザと対話装置1との対話は、以下のような対話処理によって行われる。
【0101】
[対話処理]
図7は、本発明の実施の形態にかかる、対話システムにおける対話処理のフローチャートを表す図である。
【0102】
まず、対話装置1において、ユーザの発話が録音される(ステップS201)。録音されたユーザの発話の音声データ、すなわち録音データは、対話装置1からサーバ装置4へ送信される(ステップS202)。送信された録音データは、サーバ装置4において受信される(ステップS203)。そして、サーバ装置4において、受信された録音データがテキスト化される(ステップS204)。
【0103】
ステップS201においては、対話装置1が備えるマイクから入力されたユーザの発話の音声が、対話装置1が備えるストレージ部に、音声データとして記憶される。
【0104】
ステップS204における録音データのテキスト化には、公知の技術を利用することができる。また、上記においては、録音データがサーバ装置4へ送信され、サーバ装置4において録音データがテキスト化される態様を記載したが、対話装置1において音声データがテキスト化され、テキストデータがサーバ装置4へ送信される態様としてもよい。
【0105】
ステップS204において録音データがテキスト化された後に、サーバ装置4において、後述する、応答選択処理が行われる(ステップS205)。応答選択処理において選択された応答に関する応答情報は、サーバ装置4から対話装置1へ送信される(ステップS206)。送信された応答情報は、対話装置1において受信される(ステップS207)。そして、対話装置1において、応答情報に対応する応答の音声出力、及び/又は、応答情報に対応する応答の動作出力が行われ(ステップS208)、対話処理は終了する。
【0106】
ステップS206における応答情報には、応答文に関する情報や、モーション応答に関する情報が含まれる。応答文については、詳細は後述する。
【0107】
モーション応答とは、対話装置1が動作を行うことにより行われる応答のことをいう。モーション応答には、例えば、対話装置1がうなずいたり、首を傾げたり、腕をあげたり、顔を赤らめたりする動作により応答することが含まれる。モーション応答が行われる際には、動作と併せて、音声による応答が行われてもよい。例えば、対話装置1は、上記のような動作と併せて、「うん、うん」、「へー」、「ふーん」などの、相槌や感嘆詞にあたる音声を出力してもよい。
【0108】
ステップS206において応答文に関する情報が対話装置1へ送信された場合には、ステップS208において、応答文に対応する、応答の音声が出力される。一方、ステップS206においてモーション応答に関する情報が対話装置1へ送信された場合には、ステップS208において、モーション応答に対応する、応答の動作が出力される。
【0109】
また、ステップS206において、応答文に関する情報とモーション応答に関する情報とが併せて対話装置1へ送信された場合には、応答文に対応する応答の音声の出力とモーション応答に対応する応答の動作の出力とが同時に行われてもよい。
【0110】
[応答選択処理]
図8は、本発明の実施の形態にかかる、対話システムにおける応答選択処理のフローチャートを表す図である。
【0111】
対話処理のステップS204においてテキスト化された録音データのテキストの中から、トリガーワードが抽出される(ステップS301)。
【0112】
ステップS301におけるトリガーワードの抽出においては、形態素解析、構文解析、文脈解析、意味解析、文字コードの解析などの、公知の技術を利用することができる。例えば、テキストが単語に区切られ、その中からトリガーワードが抽出されることとしてもよい。
【0113】
トリガーワードとして抽出されるものは、特に限定されず、単語でも、熟語でも、文節でも、文でもよい。また、所定の品詞の単語がトリガーワードとして抽出されることとしてもよい。例えば、テキストの中に含まれる名詞が、トリガーワードとして抽出されることとしてもよい。
【0114】
抽出されたトリガーワードは、サーバ装置4に記憶されたユーザ属性情報の中から検索される(ステップS302)。ユーザ属性情報の中にトリガーワードが存在する場合(ステップS303にてYes)、トリガーワードに合致したユーザ属性情報が該当する項目に対応する発話文と、録音データのテキストが合致するか否かが判定される(ステップS304)。トリガーワードと合致したユーザ属性情報が該当する項目に対応する発話文と、録音データのテキストが合致すると判定された場合(ステップS304にてYes)、該発話文に対応する応答文が選択される(ステップS305)。
【0115】
一方、ステップS303においてユーザ属性情報の中にトリガーワードが存在しない場合(ステップS303にてNo)、ステップステップS304は行われず、サーバ装置4に基本対話として記憶された発話文と、録音データのテキストが合致するか否かが判定される(ステップS306)。基本対話として記憶された発話文と、録音データのテキストが合致すると判定された場合(ステップS306にてYes)、該発話文に対応する応答文が選択される(ステップS305)。
【0116】
また、ステップS304において、トリガーワードと合致したユーザ属性情報が該当する項目に対応する発話文と、録音データのテキストが合致すると判定されなかった場合にも(ステップS304にてNo)、サーバ装置4に基本対話として記憶された発話文と、録音データのテキストが合致するか否かが判定される(ステップS306)。
【0117】
ステップS306において、基本対話として記憶された発話文と、録音データのテキストが合致すると判定されなかった場合(ステップS306にてNo)、モーション応答が選択される(ステップS307)。
【0118】
ステップS302~ステップS307は、ステップS305において発話文に対応する応答文が選択されるまで、又は、ステップS301において抽出された全てのトリガーワードについて検索するまで、繰り返し行われる。そして、ステップS302~ステップS307における繰り返し処理が終了すると、応答選択処理は終了する。
【0119】
同一のトリガーワードが、複数の項目においてユーザ属性情報として記憶されていた場合、ステップS302において検索されるユーザ属性情報は、ランダムに決定されてもよく、予め定められた優先順位にしたがって決定されてもよい。例えば、固有名詞登録されたユーザ属性情報の優先順位が最も高く、エピソード登録されたユーザ属性情報の優先順位が次に高く、対人関係登録されたユーザ属性情報の優先順位がその次に高く、基本情報登録されたユーザ属性情報の優先順位が最も低いこととしてもよい。
【0120】
この場合、例えば、「りんご」というトリガーワードが、「好きな果物」という項目に固有名詞登録され、かつ、「ユーザのニックネーム」という項目に基本情報登録されていたときには、固有名詞登録されたユーザ属性情報の中から優先的に検索が行われ、「りんご」というトリガーワードは、「好きな果物」という項目に属していると判定される。
【0121】
ステップS303においてユーザ属性情報の中にトリガーワードが存在するか否かの判定の態様は特に限定されず、適宜設計可能である。例えば、記憶されたユーザ属性情報とトリガーワードが完全に一致している場合に存在すると判定されてもよく、記憶されたユーザ属性情報とトリガーワードの合致度が測定され、合致度が所定の値以上である場合に存在すると判定されてもよい。つまり、トリガーワードとユーザ属性情報が関連していると考えられる場合には、ユーザ属性情報の中にトリガーワードが存在すると判定されることとしてもよい。
【0122】
また、ステップS304、及びステップS306において、発話文とユーザの発話のテキストが合致するか否かの判定の態様は特に限定されず、適宜設計可能である。例えば、発話文とユーザの発話のテキストが完全に一致している場合に合致すると判定されてもよく、発話文とユーザの発話のテキストの合致度が測定され、合致度が所定の値以上である場合に合致すると判定されてもよい。
【0123】
なお、ユーザ属性情報とトリガーワードの合致度や、発話文とユーザの発話のテキストの合致度の測定には、公知の技術を利用することができる。例えば、レーベンシュタイン距離法、ジャロ・ウィンクラー距離法などを利用してもよい。
【0124】
ステップS305において発話文に対応する応答文が選択された場合にも、ステップS206において、選択された応答文に関する情報と、応答文と関連付けて記憶されたモーション応答に関する情報とが併せて対話装置1に送信されることとしてもよい。あるいは、ステップS305において発話文に対応する応答文が選択された場合、ステップS206において、ランダムで、選択された応答文に関する情報と、モーション応答に関する情報とが併せて対話装置1に送信されることとしてもよい。
【0125】
ステップS305において選択される応答文には、トリガーワードと合致したユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文と、基本対話として記憶された発話文に対応する応答文とが含まれ得る。ステップS302~ステップS307における繰り返し処理の終了条件は、いずれかの応答文が選択されるまでであっても、トリガーワードと合致したユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文が選択されるまでであっても、基本対話として記憶された発話文に対応する応答文が選択されるまでであってもよい。
【0126】
ステップS301において抽出されたトリガーワードが複数ある場合には、抽出された全てのトリガーワードについて検索するまで、ステップS302~ステップS307が繰り返し行われてもよい。そして、ステップS305において選択された応答文、及び/又はステップS307において選択された応答の中のいずれかが、前述のステップS206において、応答情報として対話装置1へ送信されることとしてもよい。
【0127】
この場合、予め定められた優先順位にしたがって、応答情報として送信される応答文、又はモーション応答が決定されることとしてもよい。例えば、トリガーワードと合致したユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文の優先順位が最も高く、基本対話として記憶された発話文に対応する応答文の優先順位が次に高く、モーション応答の優先順位が最も低いこととしてもよい。
【0128】
また、この場合、トリガーワードと合致したユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文の中にも、優先順位が定められていてもよい。例えば、固有名詞登録されたユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文の優先順位が最も高く、エピソード登録されたユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文の優先順位が次に高く、対人関係登録されたユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文の優先順位がその次に高く、基本情報登録されたユーザ属性情報が該当する項目に関連付けて記憶された発話文に対応する応答文の優先順位が最も低いこととしてもよい。
【0129】
あるいは、ステップS206において、応答情報として2以上の応答文、及び/又はモーション応答が、対話装置1へ送信されることとしてもよい。その場合、送信された応答情報に対応する複数の応答が、対話装置1において出力されてもよい。
【0130】
上記の、ステップS301~ステップS306における応答文の選択にかかる処理について、図9~13を参照しながら説明する。
【0131】
前述のように、ステップS305において選択される応答文には、ユーザ属性情報に関連する応答文と、ユーザ属性情報に関連しない応答文とが含まれ得る。そして、ユーザ属性情報に関連する応答文には、基本情報登録されたユーザ属性情報に関連する応答文、固有名詞登録されたユーザ属性情報に関連する応答文、エピソード登録されたユーザ属性情報に関連する応答文、及び、対人関係登録されたユーザ属性情報に関連する応答文が含まれ得る。
【0132】
以下、固有名詞登録されたユーザ属性情報に関連する応答文の選択にかかる処理、エピソード登録されたユーザ属性情報に関連する応答文の選択にかかる処理、対人関係登録されたユーザ属性情報に関連する応答文の選択にかかる処理、基本情報登録されたユーザ属性情報に関連する応答文の選択にかかる処理、ユーザ属性情報に関連しない、基本対話に関連する応答文の選択にかかる処理の順に説明する。
【0133】
図9は、本発明の実施の形態にかかる、固有名詞登録データテーブルを表す図である。
【0134】
固有名詞登録データテーブル10には、固有名詞設定画面1301において入力された、ユーザの固有名詞の大カテゴリ11、ユーザの固有名詞の中カテゴリ12、ユーザの固有名詞13、及び、ユーザの固有名詞の発音バリエーション14が、それぞれ関連付けて記憶されている。
【0135】
図9においては、例えば、「食べ物」という大カテゴリ11に、「好きな果物」と「苦手な果物」という2つの中カテゴリ12が属している。そして、「好きな果物」として、「りんご」というユーザの固有名詞13が、「苦手な果物」として、「バナナ」というユーザの固有名詞13が、それぞれ記憶されている。つまり、ここでは、「好きな果物」という項目と、「りんご」というユーザ属性情報が関連付けて記憶され、「苦手な果物」という項目と、「バナナ」というユーザ属性情報が関連付けて記憶されている。
【0136】
図10は、本発明の実施の形態にかかる、固有名詞登録応答文マスタテーブルを表す図である。
【0137】
固有名詞登録応答文マスタテーブル20には、ユーザの固有名詞の中カテゴリ21、発話文22、及び応答文23が、それぞれ関連付けて記憶されている。
【0138】
図10においては、例えば、「好きな果物」という中カテゴリ21と、「{{好きな果物}}/買う/たよ」、「{{好きな果物}}/買う/て/くる/たよ」、及び「{{好きな果物}}/食べる/たよ」という3つの発話文22とが関連付けて記憶されている。
【0139】
発話文としては、ユーザが発話すると想定される文が記憶される。
【0140】
発話文は、図10に示すように、単語に区切った形で記憶されていてもよい。また、図10に示すように、発話文に含まれる動詞は終止形の形で記憶されていてもよい。この場合、動詞の語尾を動詞の後に続く付属語に合わせて活用した文と、動詞が終止形の形で記憶された発話文とは、文に含まれる単語の意味と順序が同一である場合には、同一の文として判定されることとしてもよい。以下、発話文の形式については同様とする。
【0141】
また、発話文は、ユーザが発話すると想定される文の中の、全ての単語により構成されていてもよく、一部の単語により構成されていてもよい。例えば、発話文は、ユーザが発話すると想定される文の中の、名詞、形容詞、動詞などの、文の意味を解析するにあたり重要度の高い単語により構成されていてもよい。つまり、発話文は、ユーザが発話すると想定される文の中の、自立語により構成されていてもよい。この場合、発話のテキストに含まれる単語の意味と順序が、発話文に含まれる単語の意味と順序と同一である場合には、合致すると判定されることとしてもよい。
【0142】
また、図10においては、「{{好きな果物}}/買う/たよ」、及び「{{好きな果物}}/買う/て/くる/たよ」という2つの発話文22と、「{{好きな果物}}は、{{ユーザの名前}}さんの好きな果物ですよね。食べたら、また教えてくださいね。」、及び「{{好きな果物}}は、{{ユーザの名前}}さんの好きな果物ですよね。{{好きな果物}}、美味しそうで、いいですね。」という2つの応答文23とが関連付けて記憶されている。さらに、図10においては、「{{好きな果物}}/食べる/たよ」という発話文22と、「{{好きな果物}}を食べたんですね。美味しかったですか?」、及び「{{好きな果物}}を食べたんですね。{{好きな果物}}、いいなー。」という2つの応答文23とが関連付けて記憶されている。
【0143】
なお、発話文、及び応答文の中の、二重の中括弧で括られた部分には、ユーザ属性情報として記憶された情報が入ることとする。例えば、ここでは、「好きな果物」として、「りんご」というユーザ属性情報が記憶されているため、{{好きな果物}}の欄は「りんご」に差し替えられた状態で識別される。つまり、二重の中括弧で括られた部分に示された内容が「項目」に相当し、二重の中括弧で括られた部分に挿入される内容が「ユーザ属性情報」に相当する。以下、二重の中括弧で括られた部分については同様とする。
【0144】
ここでは、「好きな果物」という項目に対応して、発話文が3つ、及び、応答文が4つ記憶されていることとしたが、1の項目に対応して記憶される発話文、及び応答文の個数は特に限定されず、適宜設計可能である。1の項目に対応して記憶される応答文が複数ある場合には、ステップS305において、記憶された複数の応答文のいずれか1以上が選択されることとしてもよい。この場合、応答文はランダムに選ばれてもよく、所定の規則にしたがって選択されてもよい。例えば、前回選択された応答文とは異なる応答文が選択されることとしてもよい。
【0145】
また、応答文は、1つの発話文に対して1つ記憶されていてもよく、1つの発話文に対して2つ以上が記憶されていてもよい。1つの発話文に対して2つ以上の応答文が記憶されている場合には、選択される応答文はランダムに選ばれてもよく、所定の規則にしたがって選択されてもよい。例えば、前回選択された応答文とは異なる応答文が選択されることとしてもよい。
【0146】
ユーザが「りんご買ったよ」と発話し、発話した通りにテキスト化された場合、ステップS301においては、例えば、「りんご」という単語がトリガーワードとして抽出される。この場合、ステップS302において、抽出された「りんご」というトリガーワードが、サーバ装置4に記憶されているユーザ属性情報の中から検索される。
【0147】
ここでは、固有名詞登録されたユーザ属性情報として「りんご」が記憶されているため、ステップS303において、ユーザ属性情報の中にトリガーワード「りんご」が存在することとなる。
【0148】
トリガーワードと合致したユーザ属性情報「りんご」は、「好きな果物」という項目に該当している。そのため、ステップS304において、「好きな果物」という項目に対応する発話文と、ユーザの発話のテキストが合致するか否かが判定される。
【0149】
ここでは、「好きな果物」という項目に対応する発話文として、「{{好きな果物}}/買う/たよ、た」という発話文22が記憶されているため、該発話文とユーザの発話のテキストは合致すると判定される。
【0150】
ここでは、「{{好きな果物}}/買う/たよ」という発話文22に対応する応答文23として、「{{好きな果物}}は、{{ユーザの名前}}さんの好きな果物ですよね。食べたら、また教えてくださいね。」、及び「{{好きな果物}}は、{{ユーザの名前}}さんの好きな果物ですよね。{{好きな果物}}、美味しそうで、いいですね。」という2つの応答文23が記憶されているため、ステップS305において、該2つの応答文のうち、いずれか1以上が応答文として選択される。
【0151】
ステップS305において、「{{好きな果物}}は、{{ユーザの名前}}さんの好きな果物ですよね。食べたら、また教えてくださいね。」という応答文23が選択された場合には、ステップS208において、対話装置1から、「りんごは、特許花子さんの好きな果物ですよね。食べたら、また教えてくださいね。」という応答の音声が出力される。
【0152】
上記においては、「りんご」というユーザ属性情報が「好きな果物」という項目に記憶されている例について説明したが、もし、「りんご」というユーザ属性情報が「苦手な果物」という項目に記憶されていた場合には、「りんご買ったよ」というユーザの発話に対して、ステップS208において、上記とは異なる応答が出力されることとなる。
【0153】
例えば、図10では、「苦手な果物」という項目において、「{{苦手な果物}}/買う/たよ」という発話文22に対応して、「{{苦手な果物}}は、{{ユーザの名前}}さんの苦手な果物ですよね。苦手なのに、どうして買ったんですか?」という応答文23が記憶されている。そのため、もし、「りんご」というユーザ属性情報が「苦手な果物」という項目に記憶されていた場合には、「りんご買ったよ」というユーザの発話に対して、「りんごは、特許花子さんの苦手な果物ですよね。苦手なのに、どうして買ったんですか?」という応答の音声が出力される。
【0154】
このように、対話システムが予めユーザに固有の名詞に関するユーザ属性情報を項目ごとに記憶し、ユーザの発話中に含まれる単語がどの項目に対応する単語であるかによって応答の方向性を変更することで、ユーザにとって適切なコミュニケーションが可能となる。
【0155】
また、このように、応答文記憶手段が、1の項目に対応する応答文を複数記憶するものであり、応答文選択手段が、記憶された複数の応答文のいずれか1以上を選択するものであることで、応答のバリエーションが増え、対話システムによる対話の趣向性が向上する。
【0156】
図11は、本発明の実施の形態にかかる、エピソード登録応答文テーブルを表す図である。
【0157】
エピソード登録応答文テーブル20には、ユーザに固有のエピソードが属する項目のカテゴリ31、ユーザに固有のエピソードのキーワード32、発話文33、及び応答文34が、それぞれ関連付けて記憶されている。
【0158】
図11においては、例えば、「学生時代のこと」というカテゴリ31と、「バレーボール」、「学生時代」、「昔」という3つのキーワード32とが関連付けて記憶されている。キーワード32としては、前述の、エピソード設定画面1401において入力されたユーザに固有のエピソードのキーワード1403以外にも、所定の単語が記憶されることとしてもよい。例えば、ユーザに固有のエピソードが属する項目のカテゴリや、「昔」などの、エピソード登録された情報に関連する単語がキーワード32として記憶されていてもよい。
【0159】
また、図11においては、「バレーボール」というキーワード32と、「{{学生時代のことのキーワード}}/の/話/聞く/て」という発話文33とが関連付けて記憶され、「学生時代」というキーワード32と、「学生時代/の/話/聞く/て」という発話文33とが関連付けて記憶され、「昔」というキーワード32と、「昔/の/話/聞く/て」という発話文33とが関連付けて記憶されている。さらに、図11においては、「{{学生時代のことのキーワード}}/の/話/聞く/て」、「学生時代/の/話/聞く/て」、及び「昔/の/話/聞く/て」という3つの発話文33と、「わぁ、{{ユーザの名前}}さんとお話できるの、うれしいです。えっと、{{ユーザの名前}}さんの学生時代のことのお話が聞きたいです。はなこさんは、学生のときにバレーボールが得意で、大会で優勝されたことがあるのですよね。その時に印象的だったことを聞かせてください。」という応答文34とが関連付けて記憶されている。
【0160】
ユーザが「バレーボールの話聞いて」と発話し、発話した通りにテキスト化された場合、ステップS301においては、例えば、「バレーボール」と「話」という単語がトリガーワードとして抽出される。この場合、ステップS302において、抽出された「バレーボール」、又は「話」というトリガーワードが、サーバ装置4に記憶されているユーザ属性情報の中から検索される。
【0161】
ここでは、エピソード登録されたユーザ属性情報として「バレーボール」が記憶されているため、ステップS303において、ユーザ属性情報の中にトリガーワード「バレーボール」が存在することとなる。
【0162】
トリガーワードと合致したユーザ属性情報「バレーボール」は、「学生時代のことのキーワード」という項目に該当している。そのため、ステップS304において、「学生時代のことのキーワード」という項目に対応する発話文と、ユーザの発話のテキストが合致するか否かが判定される。
【0163】
ここでは、「学生時代のことのキーワード」という項目に対応する発話文として、「{{学生時代のことのキーワード}}/の/話/聞く/て」という発話文が記憶されているため、該発話文とユーザの発話のテキストは合致すると判定される。
【0164】
ここでは、「{{学生時代のことのキーワード}}/の/話/聞く/て」という発話文33に対応する応答文34として、「わぁ、{{ユーザの名前}}さんとお話できるの、うれしいです。えっと、{{ユーザの名前}}さんの学生時代のことのお話が聞きたいです。はなこさんは、学生のときにバレーボールが得意で、大会で優勝されたことがあるのですよね。その時に印象的だったことを聞かせてください。」という応答文34が記憶されているため、ステップS305において、該応答文が選択される。
【0165】
この場合、ステップS208において、対話装置1から、「わぁ、特許花子さんとお話できるの、うれしいです。えっと、特許花子さんの学生時代のことのお話が聞きたいです。はなこさんは、学生のときにバレーボールが得意で、大会で優勝されたことがあるのですよね。その時に印象的だったことを聞かせてください。」という応答の音声が出力される。
【0166】
なお、ここでは、応答文34としてエピソード設定画面1401において入力された具体的なエピソード1404が記憶されることとしているが、応答文34として、予め定められた応答文が記憶されていてもよい。
【0167】
このように、対話システムが予めユーザに固有のエピソードに関するユーザ属性情報を項目ごとに記憶し、ユーザの発話中に含まれる単語がどの項目に対応する単語であるかによって応答の方向性を変更することで、ユーザにとって適切なコミュニケーションが可能となる。
【0168】
図12は、本発明の実施の形態にかかる、関係性マスタテーブル及び対人関係登録応答文マスタテーブルを表す図である。
【0169】
図12(a)は、本発明の実施の形態にかかる、関係性マスタテーブルを表す図である。関係性マスタテーブル40には、ユーザのタイプ41と、相手のタイプ42とに関連付けて、ユーザと該相手との関係性43が記憶されている。
【0170】
図12(a)においては、ユーザ、及び相手のタイプとして、ビジョンタイプ、ピースタイプ、ロジカルタイプの3つのタイプが表示されている。そして、ユーザのタイプと、相手のタイプとに基づいて、ユーザと相手との関係性が特定、つまり診断される。関係性を診断する際のユーザのタイプは、対話システムに記憶されたユーザ属性情報を基に診断されたものであってよい。また、関係性を診断する際の相手のタイプは、対話システムに記憶された、ユーザとの関係性を知りたい相手の属性情報を基に診断されたものであってよい。
【0171】
例えば、図12(a)において、ユーザのタイプがビジョンタイプであり、相手のタイプもビジョンタイプである場合、ユーザと相手との関係性は「VV」となる。
【0172】
図12(b)は、本発明の実施の形態にかかる、対人関係登録応答文マスタテーブルを表す図である。対人関係登録応答文マスタテーブル50には、項目51、発話文52、関係性53、及び応答文54が、それぞれ関連付けて記憶されている。また、応答文54としては、関係性53ごとに異なる内容の応答文が記憶されている。
【0173】
例えば、図12(b)においては、「相手のニックネーム」という項目51に対して、「{{相手のニックネーム}}/との/かかわり方/教える/て」という発話文52が記憶されている。そして、該発話文52に対して、「VV」という関係性53に対応する応答文54として、「{{ユーザの名前}}さんと{{相手のニックネーム}}は似ているところがありそうですね。いつも通りの{{ユーザの名前}}さんらしく、自然にふるまうのがいいと思います。」という応答文が記憶されている。
【0174】
また、該発話文52に対して、「VP」という関係性53に対応する応答文54としては、「{{相手のニックネーム}}はやさしい人なのでしょうか。{{相手のニックネーム}}が安心できるように、やさしく声をかけるのがいいんじゃないかと思います。」という応答文が記憶されている。
【0175】
さらに、該発話文52に対して、「VL」という関係性53に対応する応答文54としては、「{{相手のニックネーム}}はロジカルなところがありそうですね。最初に何の話をしたいのか伝えてから、詳しいことを説明するといいかもしれません。」という応答文が記憶されている。
【0176】
ユーザが「じろうくんとのかかわり方教えて」と発話し、発話した通りにテキスト化された場合、ステップS301においては、例えば、「じろうくん」と「かかわり方」という単語がトリガーワードとして抽出される。この場合、ステップS302において、抽出された「じろうくん」、又は「かかわり方」というトリガーワードが、サーバ装置4に記憶されているユーザ属性情報の中から検索される。
【0177】
ここでは、対人関係登録されたユーザ属性情報である、ユーザとの関係性を知りたい相手の属性情報として「じろうくん」が記憶されているため、ステップS303において、ユーザ属性情報の中にトリガーワード「じろうくん」が存在することとなる。
【0178】
トリガーワードと合致したユーザ属性情報「じろうくん」は、「相手のニックネーム」という項目に該当している。そのため、ステップS304において、「相手のニックネーム」という項目に対応する発話文と、ユーザの発話のテキストが合致するか否かが判定される。
【0179】
ここでは、「相手のニックネーム」という項目に対応する発話文として、「{{相手のニックネーム}}/との/かかわり方/教える/て」という発話文が記憶されているため、該発話文とユーザの発話のテキストは合致すると判定される。
【0180】
ここでは、「{{相手のニックネーム}}/との/かかわり方/教える/て」という発話文52に対応する応答文54として、関係性53ごとに異なる応答文が記憶されているため、関係性マスタテーブルを参照した、ユーザと相手との関係性53に対応する応答文54が選択される。ユーザと相手との関係性53が「VV」である場合、ステップS305において、「VV」という関係性53に対応する応答文54である、「{{ユーザの名前}}さんと{{相手のニックネーム}}は似ているところがありそうですね。いつも通りの{{ユーザの名前}}さんらしく、自然にふるまうのがいいと思います。」という応答文が選択される。
【0181】
この場合、ステップS208において、対話装置1から、「特許花子さんとじろうくんは似ているところがありそうですね。いつも通りの特許花子さんらしく、自然にふるまうのがいいと思います。」という応答の音声が出力される。
【0182】
このように、対話システムが、ユーザの属性情報と、ユーザ以外の人物の属性情報とを基に、ユーザと該人物との関係性を診断する関係性診断手段を備え、応答文記憶手段が、関係性ごとの応答文を記憶するものであり、応答文選択手段が、診断されたユーザと該人物との関係性に対応する応答文のいずれか1以上を選択するものであることで、ユーザは、対話システムを利用して、気軽に対人関係の悩みを相談することができる。
【0183】
また、図示しないが、サーバ装置4には、基本情報登録されたユーザ属性情報を含む発話文と、該ユーザ属性情報が該当する項目に対応する応答文とが関連付けて記憶された、基本情報登録応答文マスタテーブルが記憶されていてもよい。
【0184】
そして、ステップS302において、基本情報登録されたユーザ属性情報中にトリガーワードが存在するかが検索され、ステップS304において、該ユーザ属性情報を含む発話文と、ユーザの発話のテキストが合致する場合には、ステップS305において、該ユーザ属性情報が該当する項目に対応する応答文のいずれか1以上が選択されることとしてもよい。
【0185】
このように、本発明の対話システムは、ユーザの発話の入力を受け付ける発話入力手段と、ユーザ属性情報を項目ごとに記憶するユーザ属性記憶手段と、ユーザの発話に対する応答文を項目と関連付けて記憶する応答文記憶手段と、発話に含まれる単語に関連するユーザ属性情報が該当する項目に対応する応答文のいずれか1以上を選択する応答文選択手段と、選択された応答文に対応する応答の音声を出力する応答出力手段とを備えることで、文字列としては同じユーザの発話に対しても、発話に含まれる単語がユーザにとってどのような意味を有する単語なのかによって、異なる応答を行うことができる。そのため、ユーザに適した対話が可能となり、ユーザは対話システムによる対話に、より魅力を感じることができる。
【0186】
なお、応答文としては、応答文に対応する項目に関連の強い内容であることが好ましい。つまり、応答文は、どの項目に属していても当たり障りのない内容ではなく、その項目に属しているからこそ、その応答となるような内容であることが好ましい。
【0187】
また、ユーザとの対話においては、ユーザの発話中にユーザ属性情報に関連する単語が含まれないこともある。あるいは、ユーザの発話中にユーザ属性情報に関連する単語が含まれてはいるが、ユーザ属性情報に関連する発話文として記憶されていない発話を行うこともある。そのような場合にもユーザとの対話を適切に行うため、本発明の対話システムは、基本的な対話としてあり得る発話文、及び応答文を記憶している。
【0188】
図13は、本発明の実施の形態にかかる、基本対話マスタテーブルを表す図である。
【0189】
基本対話マスタテーブル60には、発話文61と関連付けて、応答文62が記憶されている。
【0190】
例えば、図13においては、「おばあちゃん/て/呼ぶ/で」という発話文61と関連付けて、「おばあちゃーん。」という応答文62が記憶されている。
【0191】
ユーザが「おばあちゃんって呼んで」と発話し、発話した通りにテキスト化された場合、ステップS301においては、例えば、「おばあちゃん」という単語がトリガーワードとして抽出される。この場合、ステップS302において、抽出された「おばあちゃん」というトリガーワードが、サーバ装置4に記憶されているユーザ属性情報の中から検索される。
【0192】
ここでは、ユーザ属性情報として「おばあちゃん」という単語は記憶されていないため、ステップS303において、ユーザ属性情報の中にトリガーワード「おばあちゃん」は存在しないこととなる。
【0193】
そのため、ステップS306において、基本対話マスタテーブルに記憶された発話文61と、ユーザの発話のテキストが合致するか否かが判定される。
【0194】
ここでは、基本対話マスタテーブルに記憶された発話文61として、「おばあちゃん/て/呼ぶ/で」という発話文が記憶されているため、該発話文とユーザの発話のテキストは合致すると判定される。
【0195】
ここでは、「おばあちゃん/て/呼ぶ/で」という発話文61に対応する応答文62として、「おばあちゃーん。」という応答文が記憶されているため、ステップS305において、該応答文が選択される。
【0196】
この場合、ステップS208において、対話装置1から、「おばあちゃーん。」という応答の音声が出力される。
【0197】
このように、ユーザの発話中にユーザ属性情報に関連する単語が含まれない場合や、ユーザの発話中にユーザ属性情報に関連する単語が含まれてはいるが、ユーザ属性情報に関連する発話文として記憶されていない発話を行った場合にも、発話に対応した応答が選択されることで、様々なユーザの発話に対して適切に応答を行うことができる。
【0198】
なお、ユーザの発話の中の一部の単語が認識されなかった場合には、認識されなかった単語について聞き返すような内容の応答文が選択されることとしてもよい。
【0199】
また、上記において、ユーザ属性情報を基にユーザのタイプが診断されることについて記載したが、対話システムには、1の項目に対して、タイプごとに異なる内容の応答文が記憶されることとしてもよい。そして、ステップS305において、診断されたユーザのタイプに対応する応答文のいずれか1以上が選択されてもよい。
【0200】
例えば、「得意なこと」という項目に対応して、「ほめる」ことを目的とする応答文が記憶されていても、ユーザのタイプによって、好ましいほめ方は異なる。そのため、「ほめる」ことを目的とする応答文として、「すごいですね」、「さすがです」、「びっくりです」などの複数の表現の応答文をタイプごとに記憶し、ユーザのタイプに応じていずれか1以上の応答文を選択することとしてもよい。
【0201】
このように、対話システムがユーザ属性情報を基にユーザのタイプを診断するタイプ診断手段を備え、応答文記憶手段が1の項目に対応する応答文をタイプごとに複数記憶するものであり、応答文選択手段が、診断されたユーザのタイプに対応する応答文のいずれか1以上を選択するものであることで、ユーザのタイプに応じた、適切な対話を行うことができる。
【0202】
また、ユーザのタイプは、対話システムの初期設定時に、補助者により入力されてもよい。この場合も、対話システムには、1の項目に対して、タイプごとに異なる内容の応答文が記憶されることとしてもよい。そして、ステップS305において、入力されたユーザのタイプに対応する応答文のいずれか1以上が選択されてもよい。
【0203】
本発明の対話システムによれば、ユーザは、「自分のことを分かってくれる」対話システムに対してより愛着を感じ、積極的に対話システムによる対話を行うことが期待される。ユーザ、特に、高齢者は、対話を行う機会が増えることで、喜びや生きがいを感じやすくなり、メンタルヘルスが向上すると考えられる。また、対話を行う機会が増えることで、認知機能や嚥下機能の低下を防ぐ効果も期待できる。
【0204】
また、上述した、ユーザのタイプごとの応答を可能とする機能は、独立して成立するものである。
【0205】
つまり、本発明は、少なくとも1のコンピュータ装置を備える対話システムであって、ユーザの発話の入力を受け付ける発話入力手段と、ユーザ属性情報を記憶するユーザ属性記憶手段と、ユーザ属性情報を基にユーザのタイプを診断するタイプ診断手段と、ユーザの発話に対する応答文をタイプごとに複数記憶する応答文記憶手段と、発話に含まれる単語に対応する応答文のいずれか1以上を、診断されたユーザのタイプに応じて選択する応答文選択手段と、選択された応答文に対応する応答の音声を出力する応答出力手段とを備える、対話システムであってもよい。
【0206】
また、上述した、ユーザの発音のバリエーションを登録することで、ユーザの発音の癖に対応した応答を可能とする機能は、独立して成立するものである。
【0207】
つまり、本発明は、少なくとも1のコンピュータ装置を備える対話システムであって、ユーザの発話の入力を受け付ける発話入力手段と、ユーザの発話に含まれ得る単語の発音のバリエーションを、該単語と関連付けて記憶する発音記憶手段と、記憶された発音のバリエーションがユーザの発話に含まれる場合に、該単語を発話したと特定する発話特定手段と、ユーザの発話に対する応答文を記憶する応答文記憶手段と、発話に含まれる単語に対応する応答文のいずれか1以上を選択する応答文選択手段と、選択された応答文に対応する応答の音声を出力する応答出力手段とを備える、対話システムであってもよい。
【0208】
また、上述した、ユーザの対人関係に関する応答を可能とする機能は、独立して成立するものである。
【0209】
つまり、本発明は、少なくとも1のコンピュータ装置を備える対話システムであって、ユーザの発話の入力を受け付ける発話入力手段と、ユーザの属性情報と、ユーザ以外の人物の属性情報とを基に、ユーザと該人物との関係性を診断する関係性診断手段と、ユーザの発話に対する応答文を関係性ごとに記憶する応答文記憶手段と、発話に含まれる単語、及び、診断されたユーザと該人物との関係性に対応する応答文のいずれか1以上を選択する応答文選択手段と、選択された応答文に対応する応答の音声を出力する応答出力手段とを備える、対話システムであってもよい。
【0210】
また、上述した、ユーザのSNSに関する応答を基に応答文を作成する機能は、独立して成立するものである。
【0211】
つまり、本発明は、少なくとも1のコンピュータ装置を備える対話システムであって、ユーザの発話の入力を受け付ける発話入力手段と、ユーザのSNSに関するユーザ属性情報を記憶するユーザ属性記憶手段と、ユーザのSNSに関する情報を基に、ユーザの発話に対する応答文を作成する応答文作成手段と、作成された応答文を記憶する応答文記憶手段と、発話に含まれる単語に関連する応答文のいずれか1以上を選択する応答文選択手段と、選択された応答文に対応する応答の音声を出力する応答出力手段とを備える、対話システムであってもよい。
【符号の説明】
【0212】
1 対話装置
2 補助者端末
3 通信ネットワーク
4 サーバ装置
10 固有名詞登録データテーブル
11 大カテゴリ
12 中カテゴリ
13 固有名詞
14 固有名詞の発音バリエーション
20 固有名詞登録応答文マスタテーブル
21 中カテゴリ
22 発話文
23 応答文
30 エピソード登録応答文テーブル
31 カテゴリ
32 キーワード
33 発話文
34 応答文
40 関係性マスタテーブル
41 ユーザのタイプ
42 相手のタイプ
43 関係性
50 対人関係登録応答文マスタテーブル
51 発話文
52 関係性
53 応答文
60 基本対話マスタテーブル
61 発話文
62 応答文
1000 実行画面
1001 登録者の名前
1002 ログアウトボタン
1100 個人情報アイコン
1200 基本情報設定アイコン
1201 基本情報設定画面
1202 ユーザの名前
1203 ユーザのニックネーム
1204 ユーザの生年月日
1205 ロボットの名前
1206 ロボットのID
1207 保存ボタン
1300 固有名詞設定アイコン
1301 固有名詞設定画面
1302 大カテゴリ
1303 中カテゴリ
1304 ユーザの固有名詞
1305 ユーザの固有名詞の発音バリエーション
1306 保存ボタン
1400 エピソード設定アイコン
1401 エピソード設定画面
1402 カテゴリ
1403 キーワード
1404 具体的なエピソード
1405 保存ボタン
1500 リマインド設定アイコン
1600 対人関係設定アイコン
1601 対人関係設定画面
1602 相手の名前
1603 相手のニックネーム
1604 相手の生年月日
1605 保存ボタン
【要約】
【課題】
ユーザに適した対話を可能とする対話システムを提供することを目的とする。
【解決手段】
少なくとも1のコンピュータ装置を備える対話システムであって、ユーザの発話の入力を受け付ける発話入力手段と、ユーザ属性情報を項目ごとに記憶するユーザ属性記憶手段と、ユーザの発話に対する応答文を項目と関連付けて記憶する応答文記憶手段と、発話に含まれる単語に関連するユーザ属性情報が該当する項目に対応する応答文のいずれか1以上を選択する応答文選択手段と、選択された応答文に対応する応答の音声を出力する応答出力手段とを備える、対話システム。
【選択図】 図8
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13