特開2024-159585 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ソフトバンクグループ株式会社の特許一覧

特開2024-159585行動制御システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024159585

(43)【公開日】2024-11-08

(54)【発明の名称】行動制御システム

(51)【国際特許分類】

G06Q 50/10 20120101AFI20241031BHJP

【ＦＩ】

G06Q50/10

【審査請求】未請求

【請求項の数】4

【出願形態】ＯＬ

(21)【出願番号】P 2024066762

(22)【出願日】2024-04-17

(31)【優先権主張番号】P 2023072448

(32)【優先日】2023-04-26

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】591280485

【氏名又は名称】ソフトバンクグループ株式会社

(74)【代理人】

【識別番号】100079108

【弁理士】

【氏名又は名称】稲葉良幸

(74)【代理人】

【識別番号】100109346

【弁理士】

【氏名又は名称】大貫敏史

(74)【代理人】

【識別番号】100117189

【弁理士】

【氏名又は名称】江口昭彦

(74)【代理人】

【識別番号】100134120

【弁理士】

【氏名又は名称】内藤和彦

(74)【代理人】

【識別番号】100139066

【弁理士】

【氏名又は名称】伊藤健太郎

(72)【発明者】

【氏名】孫正義

【テーマコード（参考）】

5L050

【Ｆターム（参考）】

5L050CC11

(57)【要約】

【課題】ユーザの行動に対して適切な行動をロボットに実行させる。
【解決手段】行動制御システムは、専属カメラマンシステムに適用されるロボットの行動制御システムであって、ユーザの感情を示す感情値を決定するユーザ感情決定部と、ロボットの感情を示す感情値を決定するロボット感情決定部と、ユーザの感情値及びロボットの感情値の少なくとも一方と、ユーザとロボットを対話させる対話機能を有する文章生成モデルによって取得した情報と、に基づいて、ロボットの行動を決定する行動決定部と、を備え、行動決定部は、ロボットがユーザに提案するデジタルコンテンツを決定する。
【選択図】図２

【特許請求の範囲】

【請求項1】

専属カメラマンシステムに適用されるロボットの行動制御システムであって、
ユーザの感情を示す感情値を決定するユーザ感情決定部と、
前記ロボットの感情を示す感情値を決定するロボット感情決定部と、
前記ユーザの感情値及び前記ロボットの感情値の少なくとも一方と、前記ユーザと前記ロボットを対話させる対話機能を有する文章生成モデルによって取得した情報と、に基づいて、前記ロボットの行動を決定する行動決定部と、を備え、
前記行動決定部は、前記ロボットが前記ユーザに提案するデジタルコンテンツを決定する、
行動制御システム。

【請求項2】

前記文章生成モデルによって取得した情報は、イベントに関するおすすめの情報である、
請求項１記載の行動制御システム。

【請求項3】

前記デジタルコンテンツが提案されたユーザの状態を認識するユーザ状態認識部をさらに備え、
前記行動決定部は、
認識された前記ユーザの状態、及び前記ユーザ感情決定部によって決定された前記ユーザの感情値に基づいて、前記ユーザの反応がネガティブであると判断した場合には、前記ユーザの感情値及び前記ロボットの感情値の少なくとも一方と、前記文章生成モデルによって取得した情報に基づいて、別の前記デジタルコンテンツを決定する、
請求項１記載の行動制御システム。

【請求項4】

前記ロボットは、ぬいぐるみに搭載され、又はぬいぐるみに搭載された制御対象機器に無線又は有線で接続されている、
請求項１記載の行動制御システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、行動制御システムに関する。

【背景技術】

【0002】

特許文献１には、ユーザの状態に対してロボットの適切な行動を決定する技術が開示されている。特許文献１の従来技術は、ロボットが特定の行動を実行したときのユーザの反応を認識し、認識したユーザの反応に対するロボットの行動を決定できなかった場合、認識したユーザの状認に適した行動に関する情報をサーバから受信することで、ロボットの行動を更新する。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特許６０５３８４７号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら従来技術では、ユーザの行動に対して適切な行動をロボットに実行させる上で改善の余地がある。

【課題を解決するための手段】

【0005】

本開示の一態様に係る行動制御システムは、専属カメラマンシステムに適用されるロボットの行動制御システムであって、ユーザの感情を示す感情値を決定するユーザ感情決定部と、ロボットの感情を示す感情値を決定するロボット感情決定部と、ユーザの感情値及びロボットの感情値の少なくとも一方と、ユーザとロボットを対話させる対話機能を有する文章生成モデルによって取得した情報と、に基づいて、ロボットの行動を決定する行動決定部と、を備え、行動決定部は、ロボットがユーザに提案するデジタルコンテンツを決定する。

【発明の効果】

【0006】

本発明によれば、ユーザの行動に対して適切な行動をロボットに実行させることが可能な行動制御システムを提供することができる。

【図面の簡単な説明】

【0007】

【図1】本実施形態に係るシステム５の一例を概略的に示す。

【図2】ロボット１００の機能構成を概略的に示す。

【図3】ロボット１００による動作フローの一例を概略的に示す。

【図4】コンピュータ１２００のハードウェア構成の一例を概略的に示す。

【図5】複数の感情がマッピングされる感情マップ３００を示す。

【図6】複数の感情がマッピングされる感情マップ９００を示す。

【図7】感情テーブルの一例を示す。

【図8】感情テーブルの一例を示す。

【図9】専属カメラマンシステムに適用したロボット１００の動作フローの一例を概略的に示す。

【発明を実施するための形態】

【0008】

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

【0009】

（本実施形態）
図１は、本実施形態に係るシステム５の一例を概略的に示す。システム５は、ロボット１００、ロボット１０１、ロボット１０２、及びサーバ３００を備える。ユーザ１０、ユーザ１１及びユーザ１２は、それぞれロボット１００、ロボット１０１、ロボット１０２のユーザである。ユーザ１０、ユーザ１１及びユーザ１２は、例えばロボット１００が配置された家の家族や、その家を訪れた他人である。ロボット１００、ロボット１０１及びロボット１０２は、店舗や事務所の受付等に配置され、来訪した顧客に応対する利用形態などにも適用できる。なお、本実施形態の説明において、ロボット１０１及びロボット１０２は、ロボット１００と略同一の機能を有する。そのため、ロボット１００の機能を主として取り上げてシステム５を説明する。

【0010】

ロボット１００は、ユーザ１０と会話を行ったり、ユーザ１０に映像を提供したりする。このとき、ロボット１００は、通信網２０を介して通信可能なサーバ３００等と連携して、ユーザ１０との会話や、ユーザ１０への映像等の提供を行う。例えば、ロボット１００は、自身で適切な会話を学習するだけでなく、サーバ３００と連携して、ユーザ１０とより適切に会話を進められるように学習を行う。また、ロボット１００は、撮影したユーザ１０の映像データ等をサーバ３００に記録させ、必要に応じて映像データ等をサーバ３００に要求して、ユーザ１０に提供する。図１では、ロボット１００として、自律移動が可能な走行ロボットを想定しているが、以下に示すＡＩ感情エンジンやＡＩチャットエンジン（対話機能を有する文章生成モデル）などを搭載したあらゆるもの（例えば、車載端末や携帯端末など）に適用可能である。

【0011】

ロボット１００は、人間の感情を疑似的に生成する機能を有するＡＩ感情エンジン（後述）を搭載し、自身の感情の種類を表す感情値を決定・保持する。例えば、ロボット１００は、「喜」、「怒」、「哀」、「楽」、「快」、「不快」、「安心」、「不安」、「悲しみ」、「興奮」、「心配」、「安堵」、「充実感」、「虚無感」及び「普通」のそれぞれの感情の強さを表す感情値を持つ。ロボット１００は、例えば興奮の感情値が大きい状態でユーザ１０と会話するときは、早いスピードで音声を発する。このように、ロボット１００は、自己の感情を行動で表現することができる。

【0012】

また、ロボット１００は、ＡＩチャットエンジン（チャットエンジン）とＡＩ感情エンジン（感情エンジン）をマッチングさせることで、ユーザ１０の感情に対応するロボット１００の行動を決定するように構成してよい。具体的には、ロボット１００は、ユーザ１０の行動を認識して、当該ユーザの行動に対するユーザ１０の感情を判定し、判定した感情に対応するロボット１００の行動を決定するように構成してよい。

【0013】

より具体的には、ロボット１００は、ユーザ１０の行動を認識した場合、予め設定されたチャットエンジンを用いて、当該ユーザ１０の行動に対してロボット１００がとるべき行動内容を自動で生成する。チャットエンジンは、文字による自動対話処理のためのアルゴリズム及び演算と解釈してよい。チャットエンジンは、例えば特開２０１８－０８１４４４号公報やｃｈａｔＧＰＴ（インターネット検索＜URL: https://openai.com/blog/chatgpt＞）に開示される通り公知であるため、その詳細な説明を省略する。このような、チャットエンジンは、大規模言語モデル（ＬＬＭ：ＬａｒｇｅＬａｎｇｕａｇｅＭｏｄｅｌ）により構成されている。
以上、本実施形態は、大規模言語モデルと感情エンジンとを組み合わせることにより、ユーザ１０やロボット１００の感情と、様々な言語情報とをロボット１００の行動に反映させるということができる。つまり、本実施形態によれば、チャットエンジンと感情エンジンとを組み合わせることにより、相乗効果を得ることができる。

【0014】

また、ロボット１００は、ユーザ１０の行動を認識する機能を有する。ロボット１００は、カメラ機能で取得したユーザ１０の顔画像や、マイク機能で取得したユーザ１０の音声を解析することによって、ユーザ１０の行動を認識する。ロボット１００は、認識したユーザ１０の行動等に基づいて、ロボット１００が実行する行動を決定する。

【0015】

ロボット１００は、ユーザ１０の感情、ロボット１００の感情、及びユーザ１０の行動に基づいてロボット１００が実行する行動を定めたルールを記憶しており、ルールに従って各種の行動を行う。

【0016】

具体的には、ロボット１００には、ユーザ１０の感情、ロボット１００の感情、及びユーザ１０の行動に基づいてロボット１００の行動を決定するための反応ルールを有している。反応ルールには、例えば、ユーザ１０の行動が「笑う」である場合に対して、「笑う」という行動が、ロボット１００の行動として定められている。また、反応ルールには、ユーザ１０の行動が「怒る」である場合に対して、「謝る」という行動が、ロボット１００の行動として定められている。また、反応ルールには、ユーザ１０の行動が「質問する」である場合に対して、「回答する」という行動が、ロボット１００の行動として定められている。反応ルールには、ユーザ１０の行動が「悲しむ」である場合に対して、「声をかける」という行動が、ロボット１００の行動として定められている。

【0017】

ロボット１００は、反応ルールに基づいて、ユーザ１０の行動が「怒る」であると認識した場合、反応ルールで定められた「謝る」という行動を、ロボット１００が実行する行動として選択する。例えば、ロボット１００は、「謝る」という行動を選択した場合に、「謝る」動作を行うと共に、「謝る」言葉を表す音声を出力する。

【0018】

また、ロボット１００の感情が「普通」（すわなち、「喜」＝０、「怒」＝０、「哀」＝０、「楽」＝０）であり、ユーザ１０の状態が「１人、寂しそう」という条件が満たされた場合に、ロボット１００の感情が「心配になる」という感情の変化内容と、「声をかける」の行動を実行できることが定められている。

【0019】

ロボット１００は、反応ルールに基づいて、ロボット１００の現在の感情が「普通」であり、かつ、ユーザ１０が１人で寂しそうな状態にあると認識した場合、ロボット１００の「哀」の感情値を増大させる。また、ロボット１００は、反応ルールで定められた「声をかける」という行動を、ユーザ１０に対して実行する行動として選択する。例えば、ロボット１００は、「声をかける」という行動を選択した場合に、心配していることを表す「どうしたの？」という言葉を、心配そうな音声に変換して出力する。

【0020】

また、ロボット１００は、この行動によって、ユーザ１０からポジティブな反応が得られたことを示すユーザ反応情報を、サーバ３００に送信する。ユーザ反応情報には、例えば、「怒る」というユーザ行動、「謝る」というロボット１００の行動、ユーザ１０の反応がポジティブであったこと、及びユーザ１０の属性が含まれる。

【0021】

サーバ３００は、ロボット１００から受信したユーザ反応情報を記憶する。なお、サーバ３００は、ロボット１００だけでなく、ロボット１０１及びロボット１０２のそれぞれからもユーザ反応情報を受信して記憶する。そして、サーバ３００は、ロボット１００、ロボット１０１及びロボット１０２からのユーザ反応情報を解析して、反応ルールを更新する。

【0022】

ロボット１００は、更新された反応ルールをサーバ３００に問い合わせることにより、更新された反応ルールをサーバ３００から受信する。ロボット１００は、更新された反応ルールを、ロボット１００が記憶している反応ルールに組み込む。これにより、ロボット１００は、ロボット１０１やロボット１０２等が獲得した反応ルールを、自身の反応ルールに組み込むことができる。

【0023】

図２は、ロボット１００の機能構成を概略的に示す。ロボット１００は、センサ部２００と、センサモジュール部２１０と、格納部２２０と、ユーザ状態認識部２３０と、ユーザ感情決定部２３１と、ロボット感情決定部２３２と、行動認識部２３４と、行動決定部２３６と、記憶制御部２３８と、行動制御部２５０と、制御対象２５２と、通信処理部２８０と、を有する。

【0024】

制御対象２５２は、ロボット１００に搭載されている表示装置、スピーカ及び目部のＬＥＤ、並びに、腕、手及び足等を駆動するモータ等を含む。ロボット１００の姿勢や仕草は、腕、手及び足等のモータを制御することにより制御される。ロボット１００の感情の一部は、これらのモータを制御することにより表現できる。また、ロボット１００の目部のＬＥＤの発光状態を制御することによっても、ロボット１００の表情を表現できる。なお、ロボット１００の姿勢、仕草及び表情は、ロボット１００の態度の一例である。

【0025】

センサ部２００は、マイク２０１と、３Ｄ深度センサ２０２と、２Ｄカメラ２０３と、距離センサ２０４とを含む。マイク２０１は、音声を連続的に検出して音声データを出力する。なお、マイク２０１は、ロボット１００の頭部に設けられ、バイノーラル録音を行う機能を有してよい。３Ｄ深度センサ２０２は、赤外線パターンを連続的に照射して、赤外線カメラで連続的に撮影された赤外線画像から赤外線パターンを解析することによって、物体の輪郭を検出する。２Ｄカメラ２０３は、イメージセンサの一例である。２Ｄカメラ２０３は、可視光によって撮影して、可視光の映像情報を生成する。距離センサ２０４は、例えばレーザや超音波等を照射して物体までの距離を検出する。なお、センサ部２００は、この他にも、時計、ジャイロセンサ、タッチセンサ、モータフィードバック用のセンサ等を含んでよい。

【0026】

なお、図２に示すロボット１００の構成要素のうち、制御対象２５２及びセンサ部２００を除く構成要素は、ロボット１００の行動制御システムが有する構成要素の一例である。ロボット１００の行動制御システムは、制御対象２５２を制御の対象とする。

【0027】

格納部２２０は、反応ルール２２１及び履歴データ２２２を含む。履歴データ２２２は、ユーザ１０の過去の感情値及び行動の履歴を含む。この感情値及び行動の履歴は、例えば、ユーザ１０の識別情報に対応付けられることによって、ユーザ１０毎に記録される。格納部２２０の少なくとも一部は、メモリ等の記憶媒体によって実装される。ユーザ１０の顔画像、ユーザ１０の属性情報等を格納する人物ＤＢを含んでもよい。なお、図２に示すロボット１００の構成要素のうち、制御対象２５２、センサ部２００及び格納部２２０を除く構成要素の機能は、ＣＰＵがプログラムに基づいて動作することによって実現できる。例えば、基本ソフトウェア（ＯＳ）及びＯＳ上で動作するプログラムによって、これらの構成要素の機能をＣＰＵの動作として実装できる。

【0028】

センサモジュール部２１０は、音声感情認識部２１１と、発話理解部２１２と、表情認識部２１３と、顔認識部２１４とを含む。センサモジュール部２１０には、センサ部２００で検出された情報が入力される。センサモジュール部２１０は、センサ部２００で検出された情報を解析して、解析結果をユーザ状態認識部２３０に出力する。

【0029】

センサモジュール部２１０の音声感情認識部２１１は、マイク２０１で検出されたユーザ１０の音声を解析して、ユーザ１０の感情を認識する。例えば、音声感情認識部２１１は、音声の周波数成分等の特徴量を抽出して、抽出した特徴量に基づいて、ユーザ１０の音声及び感情を認識する。発話理解部２１２は、マイク２０１で検出されたユーザ１０の音声を解析して、ユーザ１０の発話内容を表す文字情報を出力する。

【0030】

表情認識部２１３は、２Ｄカメラ２０３で撮影されたユーザ１０の画像から、ユーザ１０の表情及びユーザ１０の感情を認識する。例えば、表情認識部２１３は、目及び口の形状、位置関係等に基づいて、ユーザ１０の表情及び感情を認識する。

【0031】

顔認識部２１４は、ユーザ１０の顔を認識する。顔認識部２１４は、人物ＤＢ（図示省略）に格納されている顔画像と、２Ｄカメラ２０３によって撮影されたユーザ１０の顔画像とをマッチングすることによって、ユーザ１０を認識する。

【0032】

ユーザ状態認識部２３０は、センサモジュール部２１０で解析された情報に基づいて、ユーザ１０の状態を認識する。例えば、センサモジュール部２１０の解析結果を用いて、主として知覚に関する処理を行う。例えば、「パパが１人です。」、「パパが笑顔でない確率９０％です。」等の知覚情報を生成する。生成された知覚情報の意味を理解する処理を行う。例えば、「パパが１人、寂しそうです。」等の意味情報を生成する。

【0033】

ユーザ感情決定部２３１は、感情認識エンジン２３１ａを備え、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態に基づいて、ユーザ１０の感情を示す感情値を決定する。例えば、センサモジュール部２１０で解析された情報、及び認識されたユーザ１０の状態を、予め学習されたニューラルネットワークに入力し、ユーザ１０の感情を示す感情値を取得する。

【0034】

ここで、ユーザ１０の感情を示す感情値とは、ユーザの感情の正負を示す値であり、例えば、ユーザの感情が、「喜」、「楽」、「快」、「安心」、「興奮」、「安堵」、及び「充実感」のように、快感や安らぎを伴う明るい感情であれば、正の値を示し、明るい感情であるほど、大きい値となる。ユーザの感情が、「怒」、「哀」、「不快」、「不安」、「悲しみ」、「心配」、及び「虚無感」のように、嫌な気持ちになってしまう感情であれば、負の値を示し、嫌な気持ちであるほど、負の値の絶対値が大きくなる。ユーザの感情が、上記の何れでもない場合（「普通」）、０の値を示す。

【0035】

ロボット感情決定部２３２は、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態に基づいて、ロボット１００の感情を示す感情値を決定する。ロボット感情決定部２３２は、内分泌制御部２３２ａと、感情生成エンジン２３２ｂを備える。内分泌制御部２３２ａは、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態などを利用して、感情生成エンジン２３２ｂにおいて用いられるニューラルネットワークのパラメータを調整する。例えば、内分泌制御部２３２ａは、ドーパミンの放出量に対応するパラメータを調整する。ドーパミンは、内分泌物質の一例である。内分泌物質とは、神経伝達物質及びホルモン等、体内で分泌されシグナルを伝達する物質を意味する。ただし、ロボット１００自身の内分泌物質とは、ロボット１００の動作に影響を及ぼす情報の１つであり、ロボット１００が内分泌物質を実際に発生するということを意味していない。なお、ロボット自身の感情を決定する際に、内分泌を利用することは、例えば特開２０１８－８１５８３号公報などに開示さている通り公知であるため、詳細な説明を省略する。

【0036】

感情生成エンジン２３２ｂは、センサモジュール部２１０で解析された情報やユーザ状態認識部２３０によって認識されたユーザ１０の状態、及び内分泌制御部２３２ａによって調整されたパラメータに基づいて、ニューラルネットワークを用いて、ロボット１００の感情を示す感情値を決定する。ロボット１００の感情値は、複数の感情分類の各々に対する感情値を含み、本実施形態では、例えば「喜」、「怒」、「哀」、「楽」それぞれの強さを示す値（０～５）を想定する。

【0037】

具体例を挙げて説明すると、例えばユーザ状態認識部２３０によってユーザ１０が寂しそうと認識された場合、内分泌制御部２３２ａによってロボット１００の「哀」の感情値に対応するパラメータを上げる制御が行われ、これにより、ロボット感情決定部２３２は、ロボット１００の「哀」の感情値を増大させる。また、ユーザ状態認識部２３０によってユーザ１０が笑顔になったと認識された場合、内分泌制御部２３２ａによってロボット１００の「喜」の感情値に対応するパラメータを上げる制御が行われ、これにより、ロボット感情決定部２３２は、ロボット１００の「喜」の感情値を増大させる。

【0038】

なお、ロボット感情決定部２３２は、ロボット１００の状態を更に考慮して、ロボット１００の感情を示す感情値を決定してもよい。例えば、ロボット１００のバッテリー残量が少ない場合やロボット１００の周辺環境が真っ暗な場合等に、内分泌制御部２３２ａによってロボット１００の「哀」の感情値に対応するパラメータを上げる制御が行われ、これにより、ロボット感情決定部２３２は、ロボット１００の「哀」の感情値を増大させてもよい。更にバッテリー残量が少ないにも関わらず継続して話しかけてくるユーザ１０の場合は、内分泌制御部２３２ａによってロボット１００の「怒」の感情値に対応するパラメータを上げる制御が行われ、これにより、ロボット感情決定部２３２は、ロボット１００の「怒」の感情値を増大させてもよい。

【0039】

行動認識部２３４は、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態に基づいて、ユーザ１０の行動を認識する。例えば、センサモジュール部２１０で解析された情報、及び認識されたユーザ１０の状態を、予め学習されたニューラルネットワークに入力し、予め定められた複数の行動分類（例えば、「笑う」、「怒る」、「質問する」、「悲しむ」）の各々の確率を取得し、最も確率の高い行動分類を、ユーザ１０の行動として認識する。

【0040】

以上のように、本実施形態では、ロボット１００は、ユーザ１０を特定したうえでユーザ１０の発話内容を取得するが、当該発話内容の取得と利用等に際してはユーザ１０から法令に従った必要な同意を取得するほか、本実施形態に係るロボット１００の行動制御システムは、ユーザ１０の個人情報及びプライバシーの保護に配慮する。

【0041】

行動決定部２３６は、ユーザ感情決定部２３１により決定されたユーザ１０の現在の感情値と、ユーザ１０の現在の感情値が決定されるよりも前にユーザ感情決定部２３１により決定された過去の感情値の履歴データ２２２と、ロボット感情決定部２３２により決定されたロボット１００の感情値とに基づいて、行動認識部２３４によって認識されたユーザ１０の行動に対応する行動を決定する。本実施形態では、行動決定部２３６は、ユーザ１０の過去の感情値として、履歴データ２２２に含まれる直近の１つの感情値を用いる場合について説明するが、開示の技術はこの態様に限定されない。例えば、行動決定部２３６は、ユーザ１０の過去の感情値として、直近の複数の感情値を用いてもよいし、一日前などの単位期間の分だけ前の感情値を用いてもよい。また、行動決定部２３６は、ロボット１００の現在の感情値だけでなく、ロボット１００の過去の感情値の履歴を更に考慮して、ユーザ１０の行動に対応する行動を決定してもよい。行動決定部２３６が決定する行動は、ロボット１００が行うジェスチャー又はロボット１００の発話内容を含む。

【0042】

本実施形態に係る行動決定部２３６は、ユーザ１０の行動に対応する行動として、ユーザ１０の過去の感情値と現在の感情値の組み合わせと、ロボット１００の感情値と、ユーザ１０の行動と、反応ルール２２１とに基づいて、ロボット１００の行動を決定する。例えば、行動決定部２３６は、ユーザ１０の過去の感情値が正の値であり、かつ現在の感情値が負の値である場合、ユーザ１０の行動に対応する行動として、ユーザ１０の感情値を正に変化させるための行動を決定する。

【0043】

反応ルール２２１には、ユーザ１０の過去の感情値と現在の感情値の組み合わせと、ロボット１００の感情値と、ユーザ１０の行動とに応じたロボット１００の行動が定められている。例えば、ユーザ１０の過去の感情値が正の値であり、かつ現在の感情値が負の値であり、ユーザ１０の行動が悲しむである場合、ロボット１００の行動として、ジェスチャーを交えてユーザ１０を励ます問いかけを行う際のジェスチャーと発話内容との組み合わせが定められている。

【0044】

例えば、反応ルール２２１には、ロボット１００の感情値のパターン（「喜」、「怒」、「哀」、「楽」の値「０」～「５」の６値の４乗である１２９６パターン）、ユーザ１０の過去の感情値と現在の感情値の組み合わせのパターン、ユーザ１０の行動パターンの全組み合わせに対して、ロボット１００の行動が定められる。すわなち、ロボット１００の感情値のパターン毎に、ユーザ１０の過去の感情値と現在の感情値の組み合わせが、負の値と負の値、負の値と正の値、正の値と負の値、正の値と正の値、負の値と普通、及び普通と普通等のように、複数の組み合わせのそれぞれに対して、ユーザ１０の行動パターンに応じたロボット１００の行動が定められる。なお、行動決定部２３６は、例えば、ユーザ１０が「この前に話したあの話題について話したい」というような過去の話題から継続した会話を意図する発話を行った場合に、履歴データ２２２を用いてロボット１００の行動を決定する動作モードに遷移してもよい。
なお、反応ルール２２１には、ロボット１００の感情値のパターン（１２９６パターン）の各々に対して、最大で一つずつ、ロボット１００の行動としてジェスチャー及び発言内容の少なくとも一方が定められていてもよい。あるいは、反応ルール２２１には、ロボット１００の感情値のパターンのグループの各々に対して、ロボット１００の行動としてジェスチャー及び発言内容の少なくとも一方が定められていてもよい。

【0045】

反応ルール２２１に定められているロボット１００の行動に含まれる各ジェスチャーには、当該ジェスチャーの強度が予め定められている。反応ルール２２１に定められているロボット１００の行動に含まれる各発話内容には、当該発話内容の強度が予め定められている。

【0046】

記憶制御部２３８は、行動決定部２３６によって決定された行動に対して予め定められた行動の強度と、ロボット感情決定部２３２により決定されたロボット１００の感情値とに基づいて、ユーザ１０の行動を含むデータを履歴データ２２２に記憶するか否かを決定する。
具体的には、ロボット１００の複数の感情分類の各々に対する感情値の総和と、行動決定部２３６によって決定された行動が含むジェスチャーに対して予め定められた強度と、行動決定部２３６によって決定された行動が含む発話内容に対して予め定められた強度との和である強度の総合値が、閾値以上である場合、ユーザ１０の行動を含むデータを履歴データ２２２に記憶すると決定する。

【0047】

記憶制御部２３８は、ユーザ１０の行動を含むデータを履歴データ２２２に記憶すると決定した場合、行動決定部２３６によって決定された行動と、現時点から一定期間前までの、センサモジュール部２１０で解析された情報（例えば、その場の音声、画像、匂い等のデータなどのあらゆる周辺情報）、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態（例えば、ユーザ１０の表情、感情など）を、履歴データ２２２に記憶する。

【0048】

行動制御部２５０は、行動決定部２３６が決定した行動に基づいて、制御対象２５２を制御する。例えば、行動制御部２５０は、行動決定部２３６が発話することを含む行動を決定した場合に、制御対象２５２に含まれるスピーカから音声を出力させる。このとき、行動制御部２５０は、ロボット１００の感情値に基づいて、音声の発声速度を決定してもよい。例えば、行動制御部２５０は、ロボット１００の感情値が大きいほど、速い発声速度を決定する。このように、行動制御部２５０は、ロボット感情決定部２３２が決定した感情値に基づいて、行動決定部２３６が決定した行動の実行形態を決定する。

【0049】

行動制御部２５０は、行動決定部２３６が決定した行動を実行したことに対するユーザ１０の感情の変化を認識してもよい。例えば、ユーザ１０の音声や表情に基づいて感情の変化を認識してよい。その他、センサ部２００に含まれるタッチセンサで衝撃が検出されたことに基づいて、ユーザ１０の感情の変化を認識してよい。センサ部２００に含まれるタッチセンサで衝撃が検出された場合に、ユーザ１０の感情が悪くなったと認識したり、センサ部２００に含まれるタッチセンサの検出結果から、ユーザ１０の反応が笑っている、あるいは、喜んでいる等と判断される場合には、ユーザ１０の感情が良くなったと認識したりしてもよい。ユーザ１０の反応を示す情報は、通信処理部２８０に出力される。

【0050】

また、行動制御部２５０は、行動決定部２３６が決定した行動をロボット１００の感情に応じて決定した実行形態で実行した後、ロボット感情決定部２３２を制御することで、当該行動が実行されたことに対するユーザの反応に基づき、ロボット１００の感情値を更に変化させる。具体的には、ロボット感情決定部２３２は、行動決定部２３６が決定した行動を行動制御部２５０が決定した実行形態でユーザに対して行ったことに対するユーザの反応が不良でなかった場合に、ロボット１００の「喜」の感情値を増大させる。また、ロボット感情決定部２３２は、行動決定部２３６が決定した行動を行動制御部２５０が決定した実行形態でユーザに対して行ったことに対するユーザの反応が不良であった場合に、ロボット１００の「哀」の感情値を増大させる。

【0051】

更に、行動制御部２５０は、決定したロボット１００の感情値に基づいて、ロボット１００の感情を表現する。例えば、行動制御部２５０は、ロボット１００の「喜」の感情値を増加させた場合、制御対象２５２を制御して、ロボット１００に喜んだ仕草を行わせる。また、行動制御部２５０は、ロボット１００の「哀」の感情値を増加させた場合、ロボット１００の姿勢がうなだれた姿勢になるように、制御対象２５２を制御する。

【0052】

通信処理部２８０は、サーバ３００との通信を担う。上述したように、通信処理部２８０は、ユーザ反応情報をサーバ３００に送信する。また、通信処理部２８０は、更新された反応ルールをサーバ３００から受信する。通信処理部２８０がサーバ３００から、更新された反応ルールを受信すると、反応ルール２２１を更新する。

【0053】

サーバ３００は、ロボット１００、ロボット１０１及びロボット１０２とサーバ３００との間の通信を行い、ロボット１００から送信されたユーザ反応情報を受信し、ポジティブな反応が得られた行動を含む反応ルールに基づいて、反応ルールを更新する。なお、サーバ３００の機能は、１以上のコンピュータによって実装されてよい。サーバ３００の少なくとも一部の機能は、仮想マシンによって実装されてよい。また、サーバ３００の機能の少なくとも一部は、クラウドで実装されてよい。

【0054】

図３は、ロボット１００において行動を決定する動作に関する動作フローの一例を概略的に示す。図３に示す動作フローは、繰り返し実行される。このとき、センサモジュール部２１０で解析された情報が入力されているものとする。なお、動作フロー中の「Ｓ」は、実行されるステップを表す。

【0055】

まず、ステップＳ１００において、ユーザ状態認識部２３０は、センサモジュール部２１０で解析された情報に基づいて、ユーザ１０の状態を認識する。

【0056】

ステップＳ１０２において、ユーザ感情決定部２３１は、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態に基づいて、ユーザ１０の感情を示す感情値を決定する。

【0057】

ステップＳ１０３において、ロボット感情決定部２３２は、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態に基づいて、ロボット１００の感情を示す感情値を決定する。ロボット感情決定部２３２は、決定したユーザ１０の感情値を履歴データ２２２に追加する。

【0058】

ステップＳ１０４において、行動認識部２３４は、センサモジュール部２１０で解析された情報及びユーザ状態認識部２３０によって認識されたユーザ１０の状態に基づいて、ユーザ１０の行動分類を認識する。

【0059】

ステップＳ１０６において、行動決定部２３６は、ステップＳ１０２で決定されたユーザ１０の現在の感情値及び履歴データ２２２に含まれる過去の感情値の組み合わせと、ロボット１００の感情値と、行動認識部２３４によって認識されたユーザ１０の行動と、反応ルール２２１とに基づいて、ロボット１００の行動を決定する。

【0060】

ステップＳ１０８において、行動制御部２５０は、行動決定部２３６により決定された行動に基づいて、制御対象２５２を制御する。

【0061】

ステップＳ１１０において、記憶制御部２３８は、行動決定部２３６によって決定された行動に対して予め定められた行動の強度と、ロボット感情決定部２３２により決定されたロボット１００の感情値とに基づいて、強度の総合値を算出する。

【0062】

ステップＳ１１２において、記憶制御部２３８は、強度の総合値が閾値以上であるか否かを判定する。強度の総合値が閾値未満である場合には、ユーザ１０の行動を含むデータを履歴データ２２２に記憶せずに、当該処理を終了する。一方、強度の総合値が閾値以上である場合には、ステップＳ１１４へ移行する。

【0063】

ステップＳ１１４において、行動決定部２３６によって決定された行動と、現時点から一定期間前までの、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態と、を、履歴データ２２２に記憶する。

【0064】

以上説明したように、ロボット１００によれば、ユーザ状態に基づいて、ロボット１００の感情を示す感情値を決定し、ロボット１００の感情値に基づいて、ユーザ１０の行動を含むデータを履歴データ２２２に記憶するか否かを決定する。これにより、ユーザ１０の行動を含むデータを記憶する履歴データ２２２の容量を抑制することができる。そして例えば、１０年後にユーザ状態が１０年前と同じ状態であるとロボット１００が判断したときに、１０年前の履歴データ２２２を読み込むことにより、ロボット１００は１０年前当時のユーザ１０の状態（例えばユーザ１０の表情、感情など）、更にはその場の音声、画像、匂い等のデータなどのあらゆる周辺情報を、ユーザ１０に提示することができる。

【0065】

また、ロボット１００によれば、ユーザ１０の行動に対して適切な行動をロボット１００に実行させることができる。従来は、ユーザの行動を分類し、ロボットの表情や恰好を含む行動を決めていた。これに対し、ロボット１００は、ユーザ１０の現在の感情値を決定し、過去の感情値及び現在の感情値に基づいてユーザ１０に対して行動を実行する。従って、例えば、昨日は元気であったユーザ１０が今日は落ち込んでいた場合に、ロボット１００は「昨日は元気だったのに今日はどうしたの？」というような発話を行うことができる。また、ロボット１００は、ジェスチャーを交えて発話を行うこともできる。また、例えば、昨日は落ち込んでいたユーザ１０が今日は元気である場合に、ロボット１００は、「昨日は落ち込んでいたのに今日は元気そうだね？」というような発話を行うことができる。また、例えば、昨日は元気であったユーザ１０が今日は昨日よりも元気である場合、ロボット１００は「今日は昨日よりも元気だね。昨日よりも良いことがあった？」というような発話を行うことができる。また、例えば、ロボット１００は、感情値が０以上であり、かつ感情値の変動幅が一定の範囲内である状態が継続しているユーザ１０に対しては、「最近、気分が安定していて良い感じだね。」というような発話を行うことができる。

【0066】

また、例えば、ロボット１００は、ユーザ１０に対し、「昨日言っていた宿題はできた？」と質問し、ユーザ１０から「できたよ」という回答が得られた場合、「偉いね！」等の肯定的な発話をするとともに、拍手又はサムズアップ等の肯定的なジェスチャーを行うことができる。また、例えば、ロボット１００は、ユーザ１０が「一昨日話したプレゼンテーションがうまくいったよ」という発話をすると、「頑張ったね！」等の肯定的な発話をするとともに、上記の肯定的なジェスチャーを行うこともできる。このように、ロボット１００がユーザ１０の状態の履歴に基づいた行動を行うことによって、ユーザ１０がロボット１００に対して親近感を覚えることが期待できる。

【0067】

上記実施形態では、ロボット１００は、ユーザ１０の顔画像を用いてユーザ１０を認識する場合について説明したが、開示の技術はこの態様に限定されない。例えば、ロボット１００は、ユーザ１０が発する音声、ユーザ１０のメールアドレス、ユーザ１０のＳＮＳのＩＤ又はユーザ１０が所持する無線ＩＣタグが内蔵されたＩＤカード等を用いてユーザ１０を認識してもよい。

【0068】

なお、ロボット１００は、行動制御システムを備える電子機器の一例である。行動制御システムの適用対象は、ロボット１００に限られず、様々な電子機器に行動制御システムを適用できる。また、サーバ３００の機能は、１以上のコンピュータによって実装されてよい。サーバ３００の少なくとも一部の機能は、仮想マシンによって実装されてよい。また、サーバ３００の機能の少なくとも一部は、クラウドで実装されてよい。

【0069】

図４は、ロボット１００及びサーバ３００として機能するコンピュータ１２００のハードウェア構成の一例を概略的に示す。コンピュータ１２００にインストールされたプログラムは、コンピュータ１２００を、本実施形態に係る装置の１又は複数の「部」として機能させ、又はコンピュータ１２００に、本実施形態に係る装置に関連付けられるオペレーション又は当該１又は複数の「部」を実行させることができ、及び／又はコンピュータ１２００に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ１２００に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、ＣＰＵ１２１２によって実行されてよい。

【0070】

本実施形態によるコンピュータ１２００は、ＣＰＵ１２１２、ＲＡＭ１２１４、及びグラフィックコントローラ１２１６を含み、それらはホストコントローラ１２１０によって相互に接続されている。コンピュータ１２００はまた、通信インタフェース１２２２、記憶装置１２２４、ＤＶＤドライブ１２２６、及びＩＣカードドライブのような入出力ユニットを含み、それらは入出力コントローラ１２２０を介してホストコントローラ１２１０に接続されている。ＤＶＤドライブ１２２６は、ＤＶＤ－ＲＯＭドライブ及びＤＶＤ－ＲＡＭドライブ等であってよい。記憶装置１２２４は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ１２００はまた、ＲＯＭ１２３０及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ１２４０を介して入出力コントローラ１２２０に接続されている。

【0071】

ＣＰＵ１２１２は、ＲＯＭ１２３０及びＲＡＭ１２１４内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ１２１６は、ＲＡＭ１２１４内に提供されるフレームバッファ等又はそれ自体の中に、ＣＰＵ１２１２によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス１２１８上に表示されるようにする。

【0072】

通信インタフェース１２２２は、ネットワークを介して他の電子デバイスと通信する。記憶装置１２２４は、コンピュータ１２００内のＣＰＵ１２１２によって使用されるプログラム及びデータを格納する。ＤＶＤドライブ１２２６は、プログラム又はデータをＤＶＤ－ＲＯＭ１２２７等から読み取り、記憶装置１２２４に提供する。ＩＣカードドライブは、プログラム及びデータをＩＣカードから読み取り、及び／又はプログラム及びデータをＩＣカードに書き込む。

【0073】

ＲＯＭ１２３０はその中に、アクティブ化時にコンピュータ１２００によって実行されるブートプログラム等、及び／又はコンピュータ１２００のハードウェアに依存するプログラムを格納する。入出力チップ１２４０はまた、様々な入出力ユニットをＵＳＢポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ１２２０に接続してよい。

【0074】

プログラムは、ＤＶＤ－ＲＯＭ１２２７又はＩＣカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置１２２４、ＲＡＭ１２１４、又はＲＯＭ１２３０にインストールされ、ＣＰＵ１２１２によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ１２００に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ１２００の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。

【0075】

例えば、通信がコンピュータ１２００及び外部デバイス間で実行される場合、ＣＰＵ１２１２は、ＲＡＭ１２１４にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース１２２２に対し、通信処理を命令してよい。通信インタフェース１２２２は、ＣＰＵ１２１２の制御の下、ＲＡＭ１２１４、記憶装置１２２４、ＤＶＤ－ＲＯＭ１２２７、又はＩＣカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。

【0076】

また、ＣＰＵ１２１２は、記憶装置１２２４、ＤＶＤドライブ１２２６（ＤＶＤ－ＲＯＭ１２２７）、ＩＣカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がＲＡＭ１２１４に読み取られるようにし、ＲＡＭ１２１４上のデータに対し様々なタイプの処理を実行してよい。ＣＰＵ１２１２は次に、処理されたデータを外部記録媒体にライトバックしてよい。

【0077】

様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。ＣＰＵ１２１２は、ＲＡＭ１２１４から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索／置換等を含む、様々なタイプの処理を実行してよく、結果をＲＡＭ１２１４に対しライトバックする。また、ＣＰＵ１２１２は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第２の属性の属性値に関連付けられた第１の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、ＣＰＵ１２１２は、当該複数のエントリの中から、第１の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第２の属性の属性値を読み取り、それにより予め定められた条件を満たす第１の属性に関連付けられた第２の属性の属性値を取得してよい。

【0078】

上で説明したプログラム又はソフトウェアモジュールは、コンピュータ１２００上又はコンピュータ１２００近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はＲＡＭのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ１２００に提供する。

【0079】

本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び／又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び／又はアナログハードウェア回路を含んでよく、集積回路（ＩＣ）及び／又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、及びプログラマブルロジックアレイ（ＰＬＡ）等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。

【0080】

コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー（登録商標）ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、電気的消去可能プログラマブルリードオンリメモリ（ＥＥＰＲＯＭ）、静的ランダムアクセスメモリ（ＳＲＡＭ）、コンパクトディスクリードオンリメモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、ブルーレイ（登録商標）ディスク、メモリスティック、集積回路カード等が含まれてよい。

【0081】

コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はＳｍａｌｌｔａｌｋ、ＪＡＶＡ（登録商標）、Ｃ＋＋等のようなオブジェクト指向プログラミング言語、及び「Ｃ」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、１又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。

【0082】

コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク（ＬＡＮ）、インターネット等のようなワイドエリアネットワーク（ＷＡＮ）を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。

【0083】

（感情マップによる感情の決定）
ユーザ感情決定部２３１は、特定のマッピングに従い、ユーザの感情を決定してよい。具体的には、ユーザ感情決定部２３１は、感情認識エンジン２３１ａを利用して、特定のマッピングである感情マップ（図５参照）に従い、ユーザの感情を決定してよい。同様に、ロボット感情決定部２３２は、感情生成エンジン２３２ｂを利用して、特定のマッピングである感情マップ（図５参照）に従い、ロボット１００の感情を決定してよい。なお、感情認識エンジン２３１ａ、感情生成エンジン２３２ｂを特に区別する必要がない場合には、これらを感情エンジンと総称する。

【0084】

図５は、複数の感情がマッピングされる感情マップ３００を示す図である。感情マップ３００において、感情は、中心から放射状に同心円に配置されている。同心円の中心に近いほど、原始的状態の感情が配置されている。同心円のより外側には、心境から生まれる状態や行動を表す感情が配置されている。感情とは、情動や心的状態も含む概念である。同心円の左側には、概して脳内で起きる反応から生成される感情が配置されている。同心円の右側には概して、状況判断で誘導される感情が配置されている。同心円の上方向及び下方向には、概して脳内で起きる反応から生成され、かつ、状況判断で誘導される感情が配置されている。また、同心円の上側には、「快」の感情が配置され、下側には、「不快」の感情が配置されている。このように、感情マップ３００では、感情が生まれる構造に基づいて複数の感情がマッピングされており、同時に生じやすい感情が、近くにマッピングされている。

【0085】

（１）例えば感情エンジンが、１００ｍｓｅｃ程度で感情を検知している場合、ロボット１００の反応動作（例えば相槌）の決定は、頻度が少なくとも、感情エンジンの検知頻度（１００ｍｓｅｃ）と同様のタイミングに設定してよく、これよりも早いタイミングに設定してもよい。感情エンジンの検知頻度はサンプリングレートと解釈してよい。

【0086】

１００ｍｓｅｃ程度で感情を検知し、即時に連動して反動動作（例えば相槌）を行うことで、不自然な相槌ではなくなり、自然な空気を読んだ対話を実現できる。ロボット１００感情マップ３００の曼荼羅の方向性とその度合い（強さ）に応じて、反動動作（相槌など）を行う。なお、感情認識エンジン２３１ａの検知頻度（サンプリングレート）は、１００ｍｓに限定されず、シチュエーション（スポーツをしている場合など）、ユーザの年齢などに応じて、変更してもよい。

【0087】

（２）感情マップ３００と照らし合わせ、感情の方向性とその度合いの強さを予め設定しておき、相槌の動き及び相槌の強弱を設定してよい。例えば、ロボット１００が安定感、安心などを感じている場合、ロボット１００は、頷いて話を聞き続ける。ロボット１００が不安、迷い、怪しい感じを覚えている場合、ロボット１００は、首をかしげてもよく、首振りを止めてもよい。

【0088】

これらの感情は、感情マップ３００の３時の方向に分布しており、普段は安心と不安のあたりを行き来する。感情マップ３００の右半分では、内部的な感覚よりも状況認識の方が優位に立つため、落ち着いた印象になる。

【0089】

（３）ロボット１００が褒められて快感を覚えた場合、「あー」というフィラーが台詞の前に入り、きつい言葉をもらって痛感を覚えた場合、「うっ！」というフィラーが台詞の前に入ってよい。また、ロボット１００が「うっ！」と言いつつうずくまる仕草などの身体的な反応を含めてよい。これらの感情は、感情マップ３００の９時あたりに分布している。

【0090】

（４）感情マップ３００の左半分では、状況認識よりも内部的な感覚（反応）の方が優位に立つ。よって、思わず反応してしまった印象を与え得る。

【0091】

ロボット１００が納得感という内部的な感覚（反応）を覚えながら状況認識においても好感を覚える場合、ロボット１００は、相手を見ながら深く頷いてよく、また「うんうん」と発してよい。このように、ロボット１００は、相手へのバランスのとれた好感、すなわち、相手への許容や寛容といった行動を生成してよい。このような感情は、感情マップ３００の１２時あたりに分布している。

【0092】

逆に、ロボット１００が不快感という内部的な感覚（反応）を覚えながら状況認識においても、ロボット１００は、嫌悪を覚えるときには首を横に振る、憎しみを覚えるくらいになると、目のＬＥＤを赤くして相手を睨んでもよい。このような感情は、感情マップ３００の６時あたりに分布している。

【0093】

（５）感情マップ３００の内側は心の中、感情マップ３００の外側は行動を表すため、感情マップ３００の外側に行くほど、感情が目に見える（行動に表れる）ようになる。

【0094】

（６）感情マップ３００の３時付近に分布する安心を覚えながら、人の話を聞く場合、ロボット１００は、軽く首を縦に振って「ふんふん」と発する程度であるが、１２時付近の愛の方になると、首を深く縦に振るような力強い頷きをしてよい。

【0095】

ユーザ感情決定部２３１は、センサモジュール部２１０で解析された情報、及び認識されたユーザ１０の状態を、予め学習されたニューラルネットワークに入力し、感情認識エンジン２３１ａを利用して感情マップ３００に示す各感情を示す感情値を取得し、ユーザ１０の感情を決定する。このニューラルネットワークは、センサモジュール部２１０で解析された情報、及び認識されたユーザ１０の状態と、感情マップ３００に示す各感情を示す感情値との組み合わせである複数の学習データに基づいて予め学習されたものである。また、このニューラルネットワークは、図６に示す感情マップ９００のように、近くに配置されている感情同士は、近い値を持つように学習される。図６では、「安心」、「安穏」、「心強い」という複数の感情が、近い感情値となる例を示している。

【0096】

一方、ロボット感情決定部２３２は、センサモジュール部２１０で解析された情報、ユーザ状態認識部２３０によって認識されたユーザ１０の状態、及びロボット１００の状態を、予め学習されたニューラルネットワークに入力し、感情生成エンジン２３２ｂを利用して感情マップ３００に示す各感情を示す感情値を取得し、ロボット１００の感情を決定する。このニューラルネットワークは、センサモジュール部２１０で解析された情報、認識されたユーザ１０の状態、及びロボット１００の状態と、感情マップ３００に示す各感情を示す感情値との組み合わせである複数の学習データに基づいて予め学習されたものである。例えば、タッチセンサ（図示省略）の出力から、ロボット１００がユーザ１０になでられていると認識される場合に、「嬉しい」の感情値「３」となることを表す学習データや、加速度センサ（図示省略）の出力から、ロボット１００がユーザ１０に叩かれていると認識される場合に、「怒」の感情値「３」となることを表す学習データに基づいて、ニューラルネットワークが学習される。また、このニューラルネットワークは、図６に示す感情マップ９００のように、近くに配置されている感情同士は、近い値を持つように学習される。

【0097】

行動決定部２３６は、ユーザの行動と、ユーザの感情、ロボットの感情とを表すテキストに、ユーザの行動に対応するロボットの行動内容を質問するための固定文を追加して、対話機能に入力することにより、ロボットの行動内容を生成する。

【0098】

例えば、行動決定部２３６は、感情決定部２３２によって決定されたロボット１００の感情から、図７に示すような感情テーブルを用いて、ロボット１００の状態を表すテキストを取得する。ここで、感情テーブルには、感情の種類毎に、各感情値に対してインデックス番号が付与されており、インデックス番号毎に、ロボット１００の状態を表すテキストが格納されている。

【0099】

ロボット感情決定部２３２によって決定されたロボット１００の感情が、インデックス番号「２」に対応する場合、「とても楽しい状態」というテキストが得られる。なお、ロボット１００の感情が、複数のインデックス番号に対応する場合、ロボット１００の状態を表すテキストが複数得られる。

【0100】

また、ユーザ１０の感情に対しても、図８に示すような感情テーブルを用意しておく。ここで、ユーザの行動が、「ごきげんようと話しかける」であり、ロボット１００の感情が、インデックス番号「２」であり、ユーザ１０の感情が、インデックス番号「３」である場合には、「ロボットはとても楽しい状態です。ユーザは普通に楽しい状態です。ユーザに「ごきげんよう」と話しかけられました。ロボットとして、どのように返事をしますか？」とチャットエンジンに入力し、ロボットの行動内容を取得する。行動決定部２３６は、この行動内容から、ロボットの行動を決定する。

【0101】

このように、ロボット１００は、ロボットの感情に応じたインデックス番号に応じて、ロボットの行動を変えることができるため、ユーザは、ロボットに心があるような印象を持ち、ロボットに対して話しかけるなどの行動をとることが促進される。

【0102】

また、行動決定部２３６は、ユーザの行動と、ユーザの感情、ロボットの感情とを表すテキストだけでなく、履歴データ２２２の内容を表すテキストも追加した上で、ユーザの行動に対応するロボットの行動内容を質問するための固定文を追加して、対話機能に入力することにより、ロボットの行動内容を生成するようにしてもよい。これにより、ロボット１００は、ユーザの感情や行動を表す履歴データに応じて、ロボットの行動を変えることができるため、ユーザは、ロボットに個性があるような印象を持ち、ロボットに対して話しかけるなどの行動をとることが促進される。また、履歴データに、ロボットの感情や行動を更に含めるようにしてもよい。

【0103】

（その他の実施形態）
その他の実施形態として、上記のロボット１００を、専属カメラマンシステムに実装されるロボットに適用してもよい。専属カメラマンシステムとしてのロボット１００は、例えば、以下のように構成される。この場合のユーザ１０は、例えば、ロボット１００が撮影する静止画や動画などのデジタルコンテンツに被写体として含まれ得る家族の構成員である。

【0104】

ロボット１００のセンサ部２００は、ユーザ１０と対話したり、ユーザ１０の状態を監視したりするためのマイクやカメラに加え、デジタルコンテンツを生成するマルチアングルカメラやマルチマイクの他、タッチセンサなどを含む。ロボット１００の制御対象２５２は、ユーザ１０と対話するためのディスプレイやスピーカに加え、デジタルコンテンツを保存するための記録装置などを含む。

【0105】

この例では、例えば、ユーザの感情が強く動いたときに、静止画や動画を撮影してデジタルコンテンツを生成し、その生成したデジタルコンテンツを保存するようにユーザに提案する。デジタルコンテンツには、例えば、静止画や動画などの画像データの他、音声データも含まれる。ユーザの感情が強く動いたかどうかは、例えば、ユーザの「喜」や「楽」などの感情値が所定値よりも増加することにより判断してもよい。

【0106】

図９は、ロボット１００においてデジタルコンテンツを提案する際の動作フローの一例である。ロボット１００は、以下のステップＳ１～ステップＳ５－２により、ユーザ１０の好み、ユーザ１０の状況、ユーザ１０の反応に合わせて、ユーザ１０の様子を撮影し、生成されたデジタルコンテンツをユーザ１０に提案する。この動作では、例示的に、専属カメラマンとしてのロボット１００がユーザ１０の様子を見守りながら静止画や動画を撮影し、生成されたジタルコンテンツをユーザ１０に提案するとともに、ユーザ１０が肯定的な反応を示したデジタルコンテンツを保存する一例について説明する。

【0107】

（ステップＳ１）
ロボット１００は、ユーザ１０の様子を常に見守り、ユーザ１０の状態、ユーザ１０の感情値、ロボット１００の感情値、履歴データ２２２を取得する。具体的には、上記ステップＳ１００～Ｓ１０３と同様の処理を行い、ユーザ１０の状態、ユーザ１０の感情値、ロボット１００の感情値、履歴データ２２２を取得する。これと並行し、ロボット１００は、例えば、取得したユーザ１０の感情値のいずれかが強く動いた日や、誕生日やクリスマスなどのイベントがある日などにおけるユーザ１０の様子をマルチアングルカメラやマルチマイクで記録する。

【0108】

（ステップＳ２）
ロボット１００は、イベントに関するユーザ１０の好みを取得する。具体的に、行動決定部２３６は、ユーザ１０に対して、思い出として残しておきたい場面などのイベントに関する好みを質問するための発話を、ロボット１００の行動として決定する。そして、行動制御部２５０は、制御対象２５２を制御し、ユーザ１０に対してイベントに関する好みを質問するための発話を行う。ユーザ状態認識部２３０は、センサモジュール部２１０で解析された情報（例えば、ユーザの回答）に基づいて、ユーザ１０のイベントに関する好みを認識する。

【0109】

例えば、ロボット１００が、ユーザ１０に対し、「どの場面を思い出として残しておきたいですか？」などの質問を発話するようにしてもよい。また、ロボット１００は、質問に対するユーザの回答内容だけでなく、カメラから取得されるユーザの表情や、対話の際の声のトーンから、ユーザの好みを分析してもよい。

【0110】

（ステップＳ３）
ロボット１００は、ユーザ１０に対して提案するデジタルコンテンツを決定する。具体的に、行動決定部２３６は、ユーザ１０のイベントに関する好み、ユーザ１０の感情、ロボット１００の感情、及び、履歴データ２２２に格納された内容を表すテキストに「このとき、ユーザにオススメの場面は何？」という固定文を追加して、ＡＩチャットエンジン（対話機能を有する文章生成モデル）に入力し、イベントに関するオススメの内容を取得する。このとき、ユーザ１０のイベントに関する好みだけでなく、ユーザ１０の感情や履歴データ２２２を考慮することにより、ユーザ１０の好みの場面を撮影したデジタルコンテンツを提案することができる。また、ロボット１００の感情を考慮することにより、ロボット１００が感情を有していることを、ユーザ１０に感じさせることができる。

【0111】

ロボット１００の感情を考慮する一例として、ロボット１００の充電が極端に少ない場合や、ロボットの周辺の環境がとても騒がしい場合や暗い時、ユーザ１０から暴言を吐かれている時、ユーザ１０がロボット１００の発する会話に対して言うことを聞かない場合などが挙げられる。これらの場合、ロボットの「悲」や「哀」の感情値が増加し、ロボット１００は、「今日は私のやる気が無くなりました。撮影を一旦中止します。」というようにロボット１００の感情に呼応した発話をすることで、ロボット１００の感情を考慮することができる。

【0112】

ロボット１００の感情値は、図５に例示するような感情マップに基づいて決定することができる。なお、ロボット１００の感情は、例えば、周辺の状況や時間帯、ユーザ１０の状態や感情によって変動してもよい。具体的には、家族がもめている時や家族が寝静まった深夜には、ロボット１００の感情がネガティブ（否定的）になるようにしてもよい。また、ユーザ１０の感情がポジティブ（肯定的）ならばロボット１００もポジティブに、ユーザ１０の感情がネガティブならばロボット１００もネガティブに、というようにユーザ１０の感情に同調するようにしてもよい。

【0113】

（ステップＳ４）
ロボット１００は、ステップ３で決定したデジタルコンテンツを、ユーザ１０に対して提案し、ユーザ１０の反応を取得する。具体的に、行動決定部２３６は、ユーザ１０に対してデジタルコンテンツを提案する発話を、ロボット１００の行動として決定し、行動制御部２５０は、制御対象２５２を制御し、ユーザ１０に対してデジタルコンテンツを提案する発話を行う。ユーザ状態認識部２３０は、センサモジュール部２１０で解析された情報に基づいて、ユーザ１０の状態を認識し、ユーザ感情決定部２３１は、センサモジュール部２１０で解析された情報、及びユーザ状態認識部２３０によって認識されたユーザ１０の状態に基づいて、ユーザ１０の感情を示す感情値を決定する。行動決定部２３６は、ユーザ状態認識部２３０によって認識されたユーザ１０の状態、及び、ユーザ１０の感情を示す感情値に基づいて、ユーザ１０の反応が、ポジティブか否かを判断し、ロボット１００の行動として、ユーザ１０に対して提案したデジタルコンテンツを保存する処理を実行するか、ユーザ１０に対して別のデジタルコンテンツを提案するかを決定する。

【0114】

（ステップＳ５）
ロボット１００は、ユーザ状態認識部２３０によって認識されたユーザ１０の状態、及び、ユーザ１０の感情を示す感情値に基づいて、ユーザ１０の反応が、ポジティブか否かを判断する。例えば、デジタルコンテンツが提案されたユーザの言動が、「この画像、気に入った」という発言や頷くなどの肯定的な状態であることが認識できた場合に、ユーザの反応はポジティブであると判断する。他方、例えば、コンテンツが提案されたユーザの言動が、「この画像はいらない」という発言や首を横に振るなどの否定的な状態であることが認識された場合に、ユーザの反応はポジティブでないと判断する。

【0115】

（ステップＳ５－１）
ステップＳ５の判定でユーザ１０の反応がポジティブである場合、ロボット１００は、ユーザ１０に提案したデジタルコンテンツを保存する処理を実行する。具体的に、ロボット１００の行動として、ユーザ１０に対して提案したデジタルコンテンツを保存すると決定した場合に、行動制御部２５０が、デジタルコンテンツを保存するために、制御対象２５２である記録装置などを制御する。

【0116】

（ステップＳ５－２）
ユーザ１０の反応がポジティブでない場合、ロボット１００が、ユーザ１０に対して提案する別のデジタルコンテンツを決定する。具体的に、ロボット１００の行動として、ユーザ１０に対して別のデジタルコンテンツを提案すると決定した場合に、行動決定部２３６は、ユーザ１０に対してイベントに関する好み、ユーザ１０の感情、ロボット１００の感情、及び、履歴データ２２２に格納された内容を表すテキストに「ユーザにオススメの場面は他にある？」という固定文を追加して、ＡＩチャットエンジンに入力し、イベントに関するオススメの内容を取得する。そして、上記ステップＳ４に戻り、ユーザ１０に対して提案したデジタルコンテンツを保存すると決定するまで、上記のステップＳ４～ステップＳ５－２の処理を繰り返す。

【0117】

このように、ロボット１００は、ユーザの好み、ユーザの状況、ユーザの反応に合わせて、ユーザが感動した場面に対応するデジタルコンテンツを保存する処理を実行することができる。さらに、ユーザに提供する内容は、ロボット１００自身の感情によっても影響を受けるため、ユーザは、感情を有する相手からデジタルコンテンツの保存を勧められているような感覚を持つことができる。

【0118】

なお、上記の例では、ロボット１００は、専属カメラマンシステムに実装されているが、人型ロボットやぬいぐるみに実装してもよい。また、人型ロボットやぬいぐるみに搭載された制御対象機器（スピーカやカメラ）に無線又は有線で接続された制御装置に適用してもよい。

【0119】

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。その様な変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

【0120】

特許請求の範囲、明細書、及び図面中において示した装置、システム、プログラム、及び方法における動作、手順、ステップ、及び段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、及び図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

【符号の説明】

【0121】

５システム、１０、１１、１２ユーザ、２０通信網、１００、１０１、１０２ロボット、２００センサ部、２０１マイク、２０２深度センサ、２０３カメラ、２０４距離センサ、２１０センサモジュール部、２１１音声感情認識部、２１２発話理解部、２１３表情認識部、２１４顔認識部、２２０格納部、２２１反応ルール、２２２履歴データ、２３０ユーザ状態認識部、２３１ユーザ感情決定部、２３２ロボット感情決定部、２３４行動認識部、２３６行動決定部、２３８記憶制御部、２５０行動制御部、２５２制御対象、２８０通信処理部、３００サーバ、１２００コンピュータ、１２１０ホストコントローラ、１２１２ＣＰＵ、１２１４ＲＡＭ、１２１６グラフィックコントローラ、１２１８ディスプレイデバイス、１２２０入出力コントローラ、１２２２通信インタフェース、１２２４記憶装置、１２２６ＤＶＤドライブ、１２２７ＤＶＤ－ＲＯＭ、１２３０ＲＯＭ、１２４０入出力チップ

【図1】