IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソフトバンクグループ株式会社の特許一覧

<>
  • 特開-制御システム、及びプログラム 図1
  • 特開-制御システム、及びプログラム 図2
  • 特開-制御システム、及びプログラム 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024158721
(43)【公開日】2024-11-08
(54)【発明の名称】制御システム、及びプログラム
(51)【国際特許分類】
   G06N 3/008 20230101AFI20241031BHJP
   G06F 3/01 20060101ALI20241031BHJP
   G06F 3/16 20060101ALI20241031BHJP
   G06Q 50/10 20120101ALI20241031BHJP
   G10L 25/63 20130101ALI20241031BHJP
   G10L 13/00 20060101ALI20241031BHJP
   G10L 15/10 20060101ALI20241031BHJP
【FI】
G06N3/008
G06F3/01 510
G06F3/16 540
G06F3/16 620
G06Q50/10
G10L25/63
G10L13/00 100M
G10L15/10 500N
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023074143
(22)【出願日】2023-04-28
(71)【出願人】
【識別番号】591280485
【氏名又は名称】ソフトバンクグループ株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】孫 正義
(72)【発明者】
【氏名】畑 達彦
(72)【発明者】
【氏名】中谷 友一
【テーマコード(参考)】
5E555
5L049
5L050
【Fターム(参考)】
5E555AA48
5E555AA71
5E555BA02
5E555BA31
5E555BA90
5E555BB02
5E555BC04
5E555CA42
5E555CA47
5E555CB64
5E555CB67
5E555CC03
5E555DA23
5E555DA40
5E555EA19
5E555EA22
5E555EA23
5E555FA00
5L049CC11
5L050CC11
(57)【要約】      (修正有)
【課題】電子機器(ロボット)と会話しているユーザの状態に対して適切なロボットの行動を決定する制御システム及びプログラムを提供する。
【解決手段】サーバと、人型ロボットであるロボットとを備える制御システムにおいて、サーバ100の処理部110は、ロボット200と会話しているユーザの感情を示すユーザ感情値を決定する感情決定部と、ロボットユーザに対してオブジェクトの説明を行っているときのユーザのユーザ感情値の遷移に基づいて、ユーザのオブジェクトに対する理解度及び注目度の少なくともいずれかを判定する判定部と、判定部による判定結果に基づいて、ユーザの注目度がより高まるように、ロボットによるオブジェクトの説明の出力態様を調整する制御部と、を備える。
【選択図】図2
【特許請求の範囲】
【請求項1】
電子機器と会話しているユーザの感情を示すユーザ感情値を決定する感情決定部と、
前記電子機器が前記ユーザに対してオブジェクトの説明を行っているときの前記ユーザの前記ユーザ感情値の遷移に基づいて、前記ユーザの前記オブジェクトに対する理解度及び注目度の少なくともいずれかを判定する判定部と、
前記判定部による判定結果に基づいて、前記電子機器による前記オブジェクトの説明の出力態様を調整する制御部と
を備える制御システム。
【請求項2】
前記判定部は、前記電子機器による前記オブジェクトの説明の初期における前記ユーザの感情がネガティブな感情である場合に、前記説明の初期における前記ネガティブな感情の度合いに対して、前記ユーザのネガティブな感情の度合いが低下するほど、前記ユーザの前記理解度がより高いと判定する、請求項1に記載の制御システム。
【請求項3】
前記制御部は、前記電子機器に、前記オブジェクトの説明の途中に、前記ユーザに対して問いかけを実施させ、
前記判定部は、前記問いかけに対する前記ユーザの反応に更に基づいて、前記ユーザの前記オブジェクトに対する前記理解度及び前記注目度の少なくともいずれかを判定する、請求項1に記載の制御システム。
【請求項4】
前記制御部は、前記判定部による判定結果に基づいて、前記電子機器の声のトーン、前記電子機器の発話スピード、前記電子機器の身振り手振りの量、前記電子機器の前記ユーザに合わせて頷く量、及び前記電子機器の間をとる量の少なくともいずれかを調整する、請求項1から3のいずれか一項に記載の制御システム。
【請求項5】
前記制御部が前記調整を行ったときの前記ユーザの前記ユーザ感情値の遷移に基づいて前記判定部によって判定された前記ユーザの前記理解度又は前記注目度と、前記調整の内容とを対応付けた履歴データを記憶する記憶部
を備え、
前記制御部は、前記記憶部に記憶されている複数の前記履歴データに基づいて、前記調整の内容を決定する、請求項4に記載の制御システム。
【請求項6】
前記制御部は、前記ユーザの前記理解度がより低いほど前記電子機器の声のトーンをより強くさせる調整、前記ユーザの前記理解度がより低いほど前記電子機器の発話スピードをより遅くさせる調整、前記ユーザの前記理解度がより低いほど前記電子機器の身振り手振りの量をより多くさせる調整、前記ユーザの前記理解度がより低いほど前記ユーザに合わせて前記電子機器が頷く回数をより多くさせる調整、及び前記ユーザの前記理解度がより低いほど前記電子機器の間を取る回数をより多くさせる調整、の少なくともいずれかを行う、請求項4に記載の制御システム。
【請求項7】
前記制御部は、前記ユーザの前記注目度がより低いほど前記電子機器の声のトーンをより強くさせる調整、前記ユーザの前記注目度がより低いほど前記電子機器の発話スピードをより遅くさせる調整、前記ユーザの前記注目度がより低いほど前記電子機器の身振り手振りの量をより多くさせる調整、前記ユーザの前記注目度がより低いほど前記ユーザに合わせて前記電子機器の頷く回数をより多くさせる調整、及び前記ユーザの前記注目度がより低いほど前記電子機器の間を取る回数をより多くさせる調整、の少なくともいずれかを行う、請求項4に記載の制御システム。
【請求項8】
前記電子機器を更に備える、請求項1から3のいずれか一項に記載の制御システム。
【請求項9】
コンピュータを、請求項1から3のいずれか一項に記載の制御システムとして機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御システム、及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、ロボットの会話相手であるユーザの状態に対して適切なロボットの行動を決定する行動制御システムについて記載されている。
[先行技術文献]
[特許文献]
[特許文献1]特開2016-012341号公報
【発明の概要】
【課題を解決するための手段】
【0003】
本発明の一実施態様によれば、制御システムが提供される。前記制御システムは、電子機器と会話しているユーザの感情を示すユーザ感情値を決定する感情決定部を備えてよい。前記制御システムは、前記電子機器が前記ユーザに対してオブジェクトの説明を行っているときの前記ユーザの前記ユーザ感情値の遷移に基づいて、前記ユーザの前記オブジェクトに対する理解度及び注目度の少なくともいずれかを判定する判定部を備えてよい。前記制御システムは、前記判定部による判定結果に基づいて、前記電子機器による前記オブジェクトの説明の出力態様を調整する制御部を備えてよい。
【0004】
前記制御システムにおいて、前記判定部は、前記電子機器による前記オブジェクトの説明の初期における前記ユーザの感情がネガティブな感情である場合に、前記説明の初期における前記ネガティブな感情の度合いに対して、前記ユーザのネガティブな感情の度合いが低下するほど、前記ユーザの前記理解度及び前記注目度の少なくともいずれかがより高いと判定してよい。
【0005】
前記いずれかの制御システムにおいて、前記制御部は、前記電子機器に、前記オブジェクトの説明の途中に、前記ユーザに対して問いかけを実施させてよく、前記判定部は、前記問いかけに対する前記ユーザの反応に更に基づいて、前記ユーザの前記オブジェクトに対する前記理解度及び前記注目度の少なくともいずれかを判定してよい。
【0006】
前記いずれかの制御システムにおいて、前記制御部は、前記判定部による判定結果に基づいて、前記電子機器の声のトーン、前記電子機器の発話スピード、前記電子機器の身振り手振りの量、前記電子機器の前記ユーザに合わせて頷く量、及び前記電子機器の間をとる量の少なくともいずれかを調整してよい。前記制御システムは、前記制御部が前記調整を行ったときの前記ユーザの前記ユーザ感情値の遷移に基づいて前記判定部によって判定された前記ユーザの前記理解度又は前記注目度と、前記調整の内容とを対応付けた履歴データを記憶する記憶部を備えてよく、前記制御部は、前記記憶部に記憶されている複数の前記履歴データに基づいて、前記調整の内容を決定してよい。
【0007】
前記いずれかの制御システムにおいて、前記制御部は、前記ユーザの前記理解度がより低いほど前記電子機器の声のトーンをより強くさせる調整、前記ユーザの前記理解度がより低いほど前記電子機器の発話スピードをより遅くさせる調整、及び前記ユーザの前記理解度がより低いほど前記電子機器の身振り手振りの量をより多くさせる調整、前記ユーザの前記理解度がより低いほど前記ユーザに合わせて前記電子機器が頷く回数をより多くさせる調整、及び前記ユーザの前記理解度がより低いほど前記電子機器の間を取る回数をより多くさせる調整、の少なくともいずれかを行ってよい。
【0008】
前記いずれかの制御システムにおいて、前記制御部は、前記ユーザの前記注目度がより低いほど前記電子機器の声のトーンをより強くさせる調整、前記ユーザの前記注目度がより低いほど前記電子機器の発話スピードをより遅くさせる調整、前記ユーザの前記注目度がより低いほど前記電子機器の身振り手振りの量をより多くさせる調整、前記ユーザの前記注目度がより低いほど前記ユーザに合わせて前記電子機器の頷く回数をより多くさせる調整、及び前記ユーザの前記注目度がより低いほど前記電子機器の間を取る回数をより多くさせる調整、の少なくともいずれかを行ってよい。
【0009】
前記いずれかの制御システムは、前記電子機器を更に備えてよい。
【0010】
本発明の一実施態様によれば、コンピュータを、前記制御システムとして機能させるためのプログラムが提供される。
【0011】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0012】
図1】本実施形態に係るシステム10の全体構成の一例を概略的に示す。
図2】ロボット200及びサーバ100の機能ブロック構成を概略的に示す。
図3】サーバ100、又はロボット200の一部として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。
【発明を実施するための形態】
【0013】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0014】
図1は、本実施形態に係るシステム10の全体構成の一例を概略的に示す。システム10は、サーバ100と、ロボット200とを備える。システム10は、複数のロボット200を備えてよい。ロボット200は、人型ロボットであってよい。ロボット200は、人型以外のロボットであってもよい。ロボット200は、電子機器の一例であってよい。なお、サーバ100は、制御システムとして機能し得る。ロボット200は、制御システムの制御対象の一例であってよい。システム10は、制御システムの一例であってもよい。
【0015】
ロボット200は、任意の場所に配置される。ユーザ20は、ロボット200を利用する利用者である。
【0016】
ロボット200は、例えば、病院や診療所に配置される。ユーザ20は、病院や診療所を訪れる患者等であってよい。ロボット200は、例えば、家庭に配置される。ユーザ20は、ロボット200が配置された家庭の家族や、その家庭を訪れた他人であってよい。ロボット200は、例えば、店舗や事務所の受付等に配置される。ユーザ20は、店舗や事務所に来訪した顧客であってよい。ロボット200の利用形態は、これらの利用形態に限られない。
【0017】
サーバ100は、ロボット200とは遠隔に設けられる。サーバ100は、通信ネットワーク50を通じてロボット200を制御することができる。例えば、サーバ100は、ロボット200で検出されたセンサ情報を、通信ネットワーク50を通じて取得して、取得したセンサ情報に基づいて、ロボット200に行わせる動作を決定して、通信ネットワーク50を通じて制御情報を送信してロボット200に指示する。
【0018】
例えば、ロボット200は、ユーザ20の音声及び画像や、ロボット200が受けた外力の情報等、センサで検出した各種の情報を取得して、サーバ100に送信する。サーバ100は、ロボット200から取得した情報に基づいて、ロボット200を制御するための制御情報を生成する。サーバ100は、例えば、ロボット200から取得した情報に基づいて、ニューラルネットワーク(NN)を用いて、ロボット200を制御するための制御情報を生成する。
【0019】
システム10では、ロボット200の行動を決定すべく各種情報を処理したり、各種情報を処理した結果に基づいてロボット200の行動を決定したりする処理を、サーバ100が実行してよい。なお、それらの処理の一部又は全てを、ロボット200が実行してもよい。この場合、ロボット200の一部が、制御システムとして機能する。
【0020】
本実施形態に係るシステム10は、任意のオブジェクトをユーザ20に対して説明する処理を実行する。オブジェクトは、説明の対象となれば、どのような対象であってもよく、任意の事物を含む。システム10は、ユーザ20に対して、重要事項の説明を行ってよい。例えば、システム10は、病院や診療所に配置されたロボット200によって、ユーザ20に対してインフォームドコンセントを行う。
【0021】
サーバ100は、ユーザ20の感情を認識する機能を有する。サーバ100は、ユーザ20の表情や、ユーザ20との会話から、ユーザ20の感情を示すユーザ感情値を決定する。サーバ100は、ユーザ20に対して説明しているオブジェクトに対するユーザ20の理解度や注目度を判定する。サーバ100は、判定したユーザ20の理解度や注目度に合わせて、ロボット200によるオブジェクトの説明の出力態様を調整してよい。なお、上述したように、このような、ユーザ20の感情を認識する処理、ユーザ20の理解度や注目度を判定する処理、及びオブジェクトの説明の出力態様を調整する処理の一部又は全てをロボット200が実行してもよい。
【0022】
サーバ100は、例えば、ユーザ20の理解度22が高い場合には、単なる内容の読み上げ・発話を行い、ユーザ20の理解度22が低い場合に、単なる内容の読み上げ・発話だけでなく、声のトーン、発話スピード、身振り手振りといった動きを、相手の理解度22の変化に応じて加えることで、ユーザ20の重要事項に対する理解度を高める。
【0023】
具体例として、サーバ100は、ユーザ20の理解度22がより低いほど、ロボット200の声のトーンをより強くする調整を行う。また、例えば、サーバ100は、ユーザ20の理解度22がより低いほど、ロボット200の発話スピードをより遅くする調整を行う。また、例えば、サーバ100は、ユーザ20の理解度22がより低いほど、ロボット200の身振り手振りの量を多くさせる調整を行う。また、例えば、サーバ100は、ユーザ20の理解度22がより低いほど、ロボット200がユーザ20に合わせて頷く回数をより多くさせる調整を行う。また、例えば、サーバ100は、ユーザ20の理解度22がより低いほど、ロボット200の間をとる回数をより多くさせる調整を行う。
【0024】
通常の会話や接客では、相手の理解度はそれほど重視されず、より相手をポジティブな感情へ導くことが多いと考えられる。それに対して、特に、重要事項等の説明においては、ポジティブさよりも理解度を重視する必要があり、本実施形態に係るシステム10では、理解度を重視した処理を実行する。
【0025】
サーバ100は、ユーザ20の理解度22の測定に、ユーザ20の感情の遷移を応用する。例えば、重要事項の説明の多くは、最初に不安や恐怖、悲しみを感じるが、説明を加えたり質問に回答したりすることで徐々にネガティブな感情が薄れていく。そのため、サーバ100は、例えば、説明の初期におけるユーザ20の感情がネガティブな感情である場合に、説明の初期におけるネガティブな感情の度合いに対して、ユーザのネガティブな感情の度合いが低下するほど、ユーザ20の理解度22がより高いと判定する。
【0026】
サーバ100は、ユーザ20の感情の遷移のみではなく、ユーザ20との会話や、ユーザ20に対する質問によって、ユーザ20の理解度22を測定してもよい。例えば、サーバ100は、説明の途中で、それまでに説明した内容を確認する会話や質問をロボット200によってユーザ20に対して行い、会話に対する返答や、質問に対する回答が、説明に対して整合しているか否かを判定することによって、ユーザ20の理解度22を測定する。会話に対する返答時や、質問に対する回答時におけるユーザ20の感情に更に基づいて、ユーザ20の理解度22を測定してもよい。
【0027】
図2は、ロボット200及びサーバ100の機能ブロック構成の一例を概略的に示す。まず、ロボット200の機能ブロック構成について説明する。ロボット200は、センサ部210と、情報処理部220と、制御対象230と、通信部240とを備える。情報処理部220は、MPU等のプロセッサであってよい。通信部240は、サーバ100との通信を担う。通信部240は、ネットワークIF等の通信デバイスであってよい。
【0028】
制御対象230は、スピーカを含む。制御対象230は、表示部を含む。表示部は、ロボット200の胸部等、ロボット200の任意の位置に配置されてよい。制御対象230は、目部等に設置されたLEDを含む。制御対象230は、ロボット200の肢部や頭部等の可動部を駆動するモータ等を含む。
【0029】
センサ部210は、マイク211、ジャイロセンサ212、モータセンサ213、カメラ214、赤外線センサ215、電池残量センサ216等の各種のセンサを有する。センサ部210がこれらの全てを有することは必須とは限らず、また、センサ部210はこれら以外を有してもよい。
【0030】
マイク211は、周囲の音声を取得する。例えば、マイク211は、ユーザ20の音声を取得する。ジャイロセンサ212は、ロボット200全体及びロボット200の各部の角速度を検出する。モータセンサ213は、ロボット200の可動部を駆動するモータの駆動軸の回転角度を検出する。カメラ214は、可視光によって撮影して動画や静止画の画像情報を生成する。赤外線センサ215は、赤外線により周囲の物体を検出する。電池残量センサ216は、ロボット200が備える電池の残存容量を検出する。
【0031】
センサ部210は、マイク211で取得された音声データ、カメラ214で撮影された画像、ジャイロセンサ212で検出された角速度、モータセンサ213で検出された回転角度、電池残量センサ216で検出した残存容量、赤外線センサ215で検出した物体情報等の各種のセンサデータを、情報処理部220に出力する。情報処理部220は、取得したセンサ信号を通信部240に供給して、サーバ100へ送信させる。また、情報処理部220は、サーバ100から取得した制御情報に基づいて、ロボット200のスピーカから発話させたり、ロボット200のLEDを発光させたり、ロボット200の肢部等を動作させたりする。
【0032】
次に、サーバ100の機能ブロック構成について説明する。サーバ100は、処理部110と、通信部120と、記憶部130とを有する。処理部110は、制御部111と、ユーザ状態認識部112と、感情決定部113と、判定部114とを有する。通信部120は、情報取得部122を有する。
【0033】
通信部120は、ロボット200との通信を担う。通信部120は、ネットワークIF等の通信デバイスであってよい。情報取得部122は、各種情報を取得する。例えば、情報取得部122は、ロボット200のセンサ部210で検出された情報を、通信ネットワーク50を通じて取得する。
【0034】
記憶部130は、ハードディスク装置、フラッシュメモリ等の記憶媒体を有する。また、記憶部130は、RAM等の揮発性記憶装置を有する。記憶部130は、処理部110が実行時に読み出すプログラムコードや各種の一時データの他、処理部110の処理の実行に必要な情報等を格納する。記憶部130は、いわゆる大規模言語モデル(LLM:Large Language Models)を記憶してよい。記憶部130は、通信部120がロボット200から取得した情報を記憶する。
【0035】
制御部111は、記憶部130に記憶されている情報と、情報取得部122が取得した情報とを用いて、ロボット200の行動を決定し、決定した行動を実行させるための制御情報を、通信部120を介してロボット200に送信する。
【0036】
記憶部130は、例えば、オブジェクトの説明と、当該説明をロボット200が出力する際の出力態様とを記憶する。
【0037】
出力態様は、表示出力の内容を含んでよい。出力態様は、音声出力の内容を含んでよい。出力態様は、ロボット200の声のトーンを含んでよい。出力態様は、ロボット200の発話スピードを含んでよい。出力態様は、ロボット200の間をとる量の情報を含んでよい。出力態様は、ロボット200の身体動作の内容を含んでよい。出力態様は、ロボット200の身振り手振りの情報を含んでよい。出力態様は、ロボット200のユーザ20に合わせて頷く量の情報を含んでよい。
【0038】
例えば、インフォームドコンセントを目的とする場合、オブジェクトは、ユーザ20の状態、及び実施する予定の医療行為等であり、その具体的な説明が記憶部130に記憶される。説明は、複数の段階によって構成され、出力態様は、段階毎に登録されてよい。各段階内において、出力態様が細かく変化するようになっていてもよい。
【0039】
インフォームドコンセントにおける説明は、ユーザ20に正確に理解してもらう必要があり、ユーザ20に注目してもらう必要がある。オブジェクトに対するユーザ20の理解度や注目度は、説明の仕方に大きく依存すると考えられる。特に、ロボット200によって説明しようとした場合、ロボット200の出力態様が、ユーザ20の理解度や注目度に与える影響は大きい。そこで、本実施形態に係る制御システム10においては、例えば、オブジェクトの説明に対して基本的な出力態様を登録しておき、それを、ユーザ20の理解度や注目度が高まるように、適宜調整する。
【0040】
ユーザ状態認識部112は、情報取得部122が取得した情報に基づいて、ユーザ20の状態を認識する。ユーザ状態認識部112は、カメラ214によって撮像された撮像画像を解析して、ユーザ20の顔を認識してよい。例えば、記憶部130が、複数の人物の顔画像を記憶しておき、ユーザ状態認識部112は、撮像画像と、記憶された顔画像とをマッチングすることによって、ユーザ20の顔を認識する。ユーザ状態認識部112は、カメラ214によって撮像された撮像画像を解析して、ユーザ20の表情を認識してよい。ユーザ状態認識部112は、マイク211によって検出されたユーザ20の音声を解析して、ユーザ20の発声内容を認識してよい。ユーザ状態認識部112は、マイク211によって検出されたユーザ20の音声を解析することにより、音声感情認識を実行してもよい。例えば、ユーザ状態認識部112は、音声の周波数成分等の特徴量を抽出して、抽出した特徴量に基づいて、ユーザ20の感情を認識する。
【0041】
ユーザ状態認識部112は、情報取得部122が取得した情報に基づいて、ユーザ20の行動を認識してよい。例えば、ユーザ状態認識部112は、情報取得部122が取得した情報と、情報取得部122が当該情報を取得したときの実際のユーザ20の行動とを訓練データとして学習された、情報取得部122が取得した情報から、ユーザ20の行動を出力するニューラルネットワークを予め記憶しておき、情報取得部122が取得した情報を、当該ニューラルネットワークに入力することによって、ユーザ20の行動を特定する。当該ニューラルネットワークは、ユーザ状態認識部112によって認識されたユーザ20の表情及びユーザ20の発声内容を受け付けるように構成されてもよい。ユーザの行動を認識する方法は、これに限られず、公知の他の方法を用いてもよい。
【0042】
感情決定部113は、ロボット200と会話しているユーザ20の感情を示すユーザ感情値を決定する。感情決定部113は、情報取得部122が取得した情報を用いて、ユーザ20のユーザ感情値を決定してよい。感情決定部113は、ユーザ状態認識部112によって認識されたユーザ状態を用いて、ユーザ20のユーザ感情値を決定してよい。感情決定部113は、ユーザ状態認識部112によって音声感情認識が実行された場合に、情報取得部122が取得した情報と、音声感情認識結果とを用いて、ユーザ20のユーザ感情値を決定してもよい。
【0043】
ユーザ感情値は、ユーザ20の感情の種類と、ユーザ20の感情の正負と感情の度合を示す値とを含んでよい。ユーザ20の感情の種類として、「喜」、「楽」、「快」、「安心」、「興奮」、「安堵」、「充実感」、「怒」、「哀」、「不快」、「不安」、「悲しみ」、「心配」、及び「虚無感」等が挙げられる。なお、これらは例示であって、これらに限られない。ユーザ20の感情の正負を示す値は、例えば、ユーザ20の感情が、「喜」、「楽」、「快」、「安心」、「興奮」、「安堵」、及び「充実感」のように、快感や安らぎを伴う明るい感情であれば、正の値を示し、明るい感情であるほど、大きい値となる。ユーザの感情が、「怒」、「哀」、「不快」、「不安」、「悲しみ」、「心配」、及び「虚無感」のように、嫌な気持ちになってしまう感情であれば、負の値を示し、嫌な気持ちであるほど、負の値の絶対値が大きくなる。ユーザの感情が、上記の何れでもない場合(「普通」)、正負を示す値は、0の値を示す。
【0044】
例えば、感情決定部113は、情報取得部122が取得した情報と、情報取得部122が当該情報を取得したときの実際のユーザ20の感情を示すユーザ感情値とを訓練データとして学習された、情報取得部122が取得した情報から、ユーザ20のユーザ感情値を出力するニューラルネットワークを予め記憶しておき、情報取得部122が取得した情報を、当該ニューラルネットワークに入力することによって、ユーザ感情値を取得する。当該ニューラルネットワークは、ユーザ状態認識部112によって認識されたユーザ20の表情及びユーザ20の発声内容を受け付けるように構成されてもよい。ユーザ感情値を決定する方法は、これに限られず、公知の他の方法を用いてもよい。
【0045】
判定部114は、ロボット200がユーザ20に対してオブジェクトの説明を行っているときのユーザ20のユーザ感情値の遷移に基づいて、ユーザ20のオブジェクトに対する理解度を判定する。
【0046】
例えば、判定部114は、ロボット200によるオブジェクトの説明の初期におけるユーザ20の感情がネガティブな感情である場合に、説明の初期におけるネガティブな感情の度合いに対して、ユーザ20のネガティブな感情の度合いが低下するほど、ユーザ20の理解度がより高いと判定する。また、判定部114は、ロボット200によるオブジェクトの説明の初期におけるユーザ20の感情がネガティブな感情である場合に、説明の初期におけるネガティブな感情の度合いに対して、ユーザ20のネガティブな感情の度合いが高まるほど、ユーザ20の理解度がより低いと判定してもよい。重要事項の説明の多くは、最初はネガティブな感情を抱き、理解が進むにつれてネガティブな感情が薄れていくが、理解できていない場合は、ネガティブな感情が薄まらないか、ネガティブな感情が強まる傾向にある。そのため、ユーザ感情値の遷移に基づいて、上記のように判定することによって、ユーザ20の理解度を高い精度で判定することができる。
【0047】
制御部111は、ロボット200に、オブジェクトの説明の途中に、ユーザ20に対して問いかけを実施させてもよい。判定部114は、問いかけに対するユーザ20の反応に更に基づいて、ユーザ20のオブジェクトに対する理解度を判定してよい。これにより、ユーザ20の理解度の精度をさらに向上させることができる。オブジェクトの説明の途中のどのタイミングでどのような問いかけをするかは、予め登録されて、記憶部130に記憶されてよい。例えば、オブジェクトの説明が複数の段階を含む場合に、段階ごとに、その段階の内容について質問する問いかけが登録される。判定部114は、質問に対するユーザ20の回答が、正解である場合、不正解である場合と比較して、ユーザ20の理解度が高いと判定してよい。判定部114は、質問に対して回答したときのユーザ20のユーザ感情値にさらに基づいて、ユーザ20の理解度を判定してもよい。例えば、判定部114は、ユーザ20の回答が正解である場合に、ユーザ感情値の値が高いほど、ユーザ20の理解度が高いと判定する。これにより、回答に自信があって、ポジティブな感情の度合いが強い場合には、ユーザ20の理解度が高いと判定し、回答に自信があまりなく、ネガティブな感情の度合いが強い場合には、ユーザ20の理解度が低いと判定することができる。
【0048】
感情決定部113は、ユーザ感情値を決定したときに、その確度を合わせて出力してもよい。判定部114は、ロボット200がユーザ20に対してオブジェクトの説明を行っているときのユーザ20のユーザ感情値が、予め定められた基準を満たしている場合に、ユーザ感情値の遷移のみに基づいて、ユーザ20の理解度を判定し、基準を満たしていない場合に、制御部111に、ユーザ20に対する問いかけをロボット200に実施させて、問いかけに対する反応と、ユーザ感情値の遷移とに基づいて、ユーザ20の理解度を判定するようにしてもよい。これにより、ユーザ感情値の確度が比較的低く、ユーザ感情値に基づくユーザ20の理解度が正確である可能性が低いときには、問いかけを実施することによって、理解度をより正確に判定し、ユーザ感情値の確度が比較的高く、ユーザ感情値に基づくユーザ20の理解度が正確である可能性が高いときには、問い合わせを実施しないことによって、ユーザ20が問い合わせを煩わしいと感じてしまうことを防止できる。なお、判定部114は、予め定められた基準を満たしているか否かを、例えば、ロボット200がユーザ20に対してオブジェクトの説明を行っているときのユーザ20のユーザ感情値の平均値が、予め定められた閾値より高いか否かによって判定する。
【0049】
制御部111は、判定部114によるユーザ20の理解度の判定結果に基づいて、ロボット200の声のトーン、ロボット200の発話スピード、ロボット200の身振り手振りの量、ロボット200のユーザ20に合わせて頷く量、及びロボット200の間をとる量の少なくともいずれかを調整してよい。
【0050】
例えば、制御部111は、学習によって、調整の内容を決定する。例えば、制御部111が調整を行ったときのユーザ20のユーザ感情値の遷移に基づいて判定部114によって判定されたユーザ20の理解度と、調整の内容とを対応付けた履歴データを、記憶部130が記憶する。記憶部130は、様々な調整内容に対して、履歴データを記憶する。制御部111は、記憶部130に記憶されている複数の履歴データに基づいて、調整の内容を決定する。例えば、ロボット200がオブジェクトをユーザ20に説明しているときに、ロボット200の声のトーンを強くした場合と弱くした場合とでユーザ20の理解度がどのように遷移するのか、ロボット200の声のトーンを強くする場合に強さのレベルに応じてユーザ20の理解度がどのように遷移するのか、ロボット200の声のトーンを弱くする場合に、弱さのレベルに応じてユーザ20の理解度がどのように遷移するのか、を解析し、ユーザの理解度が高くなる声のトーンの調整内容を特定する。制御部111は、発話スピード、身振り手振りの量、ユーザ20に合わせて頷く量、及び間をとる量等についても、同様の処理を実行する。このような処理を繰り返し実行することによって、説明の流れに沿って、ユーザ20の理解度がより高まるように、ロボット200によるオブジェクトの説明の出力態様を調整することができる。
【0051】
また、例えば、制御部111は、予め定められたルールに従って、調整の内容を決定する。制御部111は、ユーザ20の理解度がより低いほどロボット200の声のトーンをより強くさせる調整を実行してよい。制御部111は、ユーザ20の理解度がより低いほどロボット200の発話スピードをより遅くさせる調整を実行してよい。制御部111は、ユーザの理解度がより低いほどロボットの身振り手振りの量をより多くさせる調整を実行してよい。制御部111は、ユーザ20の理解度がより低いほどユーザ20に合わせてロボット200が頷く回数をより多くさせる調整を実行してよい。制御部111は、ユーザ20の理解度がより低いほどロボット200の間を取る回数をより多くさせる調整を実行してよい。制御部111は、これらのうちのいずれか1つのみを実行してよく、これらの複数を実行してよく、これらの全てを実行してもよい。これらによって、オブジェクトに対するユーザ20の理解度を向上させることに貢献することができる。
【0052】
判定部114は、ロボット200がユーザ20に対してオブジェクトの説明を行っているときのユーザ20のユーザ感情値の遷移に基づいて、ユーザ20のオブジェクトに対する注目度を判定する。
【0053】
例えば、判定部114は、ロボット200によるオブジェクトの説明中のユーザ20のユーザ感情値の遷移度合が低いほど、ユーザ20の注目度がより低いと判定する。重要事項の説明をしているときには、ユーザ20の感情が大きく変化する傾向にある。それにもかかわらず、ユーザ20の感情の変化が少ない場合、ユーザ20が説明にあまり注目していない可能性が高い。そのため、ユーザ感情値の遷移に基づいて、上記のように判定することによって、ユーザ20の注目度を高い精度で判定することができる。
【0054】
制御部111は、ロボット200に、オブジェクトの説明の途中に、ユーザ20に対して問いかけを実施させてもよい。判定部114は、問いかけに対するユーザ20の反応に更に基づいて、ユーザ20のオブジェクトに対する注目度を判定してよい。これにより、ユーザ20の注目度の精度をさらに向上させることができる。オブジェクトの説明の途中のどのタイミングでどのような問いかけをするかは、予め登録されて、記憶部130に記憶されてよい。例えば、オブジェクトの説明が複数の段階を含む場合に、段階ごとに、その段階の内容について質問する問いかけが登録される。判定部114は、質問に対するユーザ20の回答が、正解である場合、不正解である場合と比較して、ユーザ20の注目度が高いと判定してよい。
【0055】
判定部114は、ロボット200がユーザ20に対してオブジェクトの説明を行っているときのユーザ20のユーザ感情値が、予め定められた基準を満たしている場合に、ユーザ感情値の遷移のみに基づいて、ユーザ20の注目度を判定し、基準を満たしていない場合に、制御部111に、ユーザ20に対する問いかけをロボット200に実施させて、問いかけに対する反応と、ユーザ感情値の遷移とに基づいて、ユーザ20の注目度を判定するようにしてもよい。
【0056】
制御部111は、判定部114によるユーザ20の注目度の判定結果に基づいて、ロボット200の声のトーン、ロボット200の発話スピード、ロボット200の身振り手振りの量、ロボット200のユーザ20に合わせて頷く量、及びロボット200の間をとる量の少なくともいずれかを調整してよい。
【0057】
例えば、制御部111は、学習によって、調整の内容を決定する。例えば、制御部111が調整を行ったときのユーザ20のユーザ感情値の遷移に基づいて判定部114によって判定されたユーザ20の注目度と、調整の内容とを対応付けた履歴データを、記憶部130が記憶する。記憶部130は、様々な調整内容に対して、履歴データを記憶する。制御部111は、記憶部130に記憶されている複数の履歴データに基づいて、調整の内容を決定する。例えば、ロボット200がオブジェクトをユーザ20に説明しているときに、ロボット200の声のトーンを強くした場合と弱くした場合とでユーザ20の注目度がどのように遷移するのか、ロボット200の声のトーンを強くする場合に強さのレベルに応じてユーザ20の注目度がどのように遷移するのか、ロボット200の声のトーンを弱くする場合に、弱さのレベルに応じてユーザ20の注目度がどのように遷移するのか、を解析し、ユーザの注目度が高くなる声のトーンの調整内容を特定する。制御部111は、発話スピード、身振り手振りの量、ユーザ20に合わせて頷く量、及び間をとる量等についても、同様の処理を実行する。このような処理を繰り返し実行することによって、説明の流れに沿って、ユーザ20の注目度がより高まるように、ロボット200によるオブジェクトの説明の出力態様を調整することができる。
【0058】
また、例えば、制御部111は、予め定められたルールに従って、調整の内容を決定する。制御部111は、ユーザ20の注目度がより低いほどロボット200の声のトーンをより強くさせる調整を実行してよい。制御部111は、ユーザ20の注目度がより低いほどロボット200の発話スピードをより遅くさせる調整を実行してよい。制御部111は、ユーザの注目度がより低いほどロボットの身振り手振りの量をより多くさせる調整を実行してよい。制御部111は、ユーザ20の注目度がより低いほどユーザ20に合わせてロボット200が頷く回数をより多くさせる調整を実行してよい。制御部111は、ユーザ20の注目度がより低いほどロボット200の間を取る回数をより多くさせる調整を実行してよい。制御部111は、これらのうちのいずれか1つのみを実行してよく、これらの複数を実行してよく、これらの全てを実行してもよい。これらによって、オブジェクトに対するユーザ20の注目度を向上させることに貢献することができる。
【0059】
以上に説明したサーバ100の機能は、1以上のコンピュータによって実装されてよい。サーバ100の少なくとも一部の機能は、仮想マシンによって実装されてよい。また、サーバ100の機能の少なくとも一部は、クラウドで実装されてよい。上記実施形態では、電子機器の例としてロボット200を主に挙げて説明したが、これに限られない。電子機器の例として、スマートフォン、タブレット端末、PC(Personal Computer)、及びスマートスピーカ等、ぬいぐるみ等、自動車や自動二輪車等の車両、家電製品等が挙げられる。なお、これらは例示であり、電子機器は、これらに限られない。
【0060】
図3は、サーバ100、又はロボット200の一部として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。コンピュータ1200は、例えば、サーバ100として機能してよい。コンピュータ1200にインストールされたプログラムは、コンピュータ1200を、本実施形態に係る装置の1又は複数の「部」として機能させ、又はコンピュータ1200に、本実施形態に係る装置に関連付けられるオペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ1200に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU1212によって実行されてよい。
【0061】
本実施形態によるコンピュータ1200は、CPU1212、RAM1214、及びグラフィックコントローラ1216を含み、それらはホストコントローラ1210によって相互に接続されている。コンピュータ1200はまた、通信インタフェース1222、記憶装置1224、DVDドライブ1226、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ1220を介してホストコントローラ1210に接続されている。DVDドライブ1226は、DVD-ROMドライブ及びDVD-RAMドライブ等であってよい。記憶装置1224は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ1200はまた、ROM1230及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ1240を介して入出力コントローラ1220に接続されている。
【0062】
CPU1212は、ROM1230及びRAM1214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ1216は、RAM1214内に提供されるフレームバッファ等又はそれ自体の中に、CPU1212によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス1218上に表示されるようにする。
【0063】
通信インタフェース1222は、ネットワークを介して他の電子デバイスと通信する。記憶装置1224は、コンピュータ1200内のCPU1212によって使用されるプログラム及びデータを格納する。DVDドライブ1226は、プログラム又はデータをDVD-ROM1227等から読み取り、記憶装置1224に提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
【0064】
ROM1230はその中に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、及び/又はコンピュータ1200のハードウェアに依存するプログラムを格納する。入出力チップ1240はまた、様々な入出力ユニットをUSBポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ1220に接続してよい。
【0065】
プログラムは、DVD-ROM1227又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置1224、RAM1214、又はROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ1200の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
【0066】
例えば、通信がコンピュータ1200及び外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース1222に対し、通信処理を命令してよい。通信インタフェース1222は、CPU1212の制御の下、RAM1214、記憶装置1224、DVD-ROM1227、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
【0067】
また、CPU1212は、記憶装置1224、DVDドライブ1226(DVD-ROM1227)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックしてよい。
【0068】
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0069】
上で説明したプログラム又はソフトウエアモジュールは、コンピュータ1200上又はコンピュータ1200近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ1200に提供する。
【0070】
本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び/又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び/又はアナログハードウェア回路を含んでよく、集積回路(IC)及び/又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ(FPGA)、及びプログラマブルロジックアレイ(PLA)等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。
【0071】
コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0072】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。
【0073】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0074】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0075】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0076】
10 システム、20 ユーザ、22 理解度、50 通信ネットワーク、100 サーバ、110 処理部、111 制御部、112 ユーザ状態認識部、113 感情決定部、114 判定部、120 通信部、122 情報取得部、130 記憶部、200 ロボット、210 センサ部、211 マイク、212 ジャイロセンサ、213 モータセンサ、214 カメラ、215 赤外線センサ、216 電池残量センサ、220 情報処理部、230 制御対象、240 通信部、1200 コンピュータ、1210 ホストコントローラ、1212 CPU、1214 RAM、1216 グラフィックコントローラ、1218 ディスプレイデバイス、1220 入出力コントローラ、1222 通信インタフェース、1224 記憶装置、1226 DVDドライブ、1227 DVD-ROM、1230 ROM、1240 入出力チップ
図1
図2
図3