(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023056421
(43)【公開日】2023-04-19
(54)【発明の名称】制御システム、制御方法及びプログラム
(51)【国際特許分類】
G06F 3/16 20060101AFI20230412BHJP
G06F 3/01 20060101ALI20230412BHJP
G10L 13/00 20060101ALI20230412BHJP
【FI】
G06F3/16 620
G06F3/16 690
G06F3/16 610
G06F3/16 650
G06F3/01 510
G10L13/00 100A
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021165790
(22)【出願日】2021-10-07
(11)【特許番号】
(45)【特許公報発行日】2023-02-01
(71)【出願人】
【識別番号】500149555
【氏名又は名称】株式会社サイバーエージェント
(71)【出願人】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100141139
【弁理士】
【氏名又は名称】及川 周
(72)【発明者】
【氏名】高橋 ともみ
(72)【発明者】
【氏名】宋 思超
(72)【発明者】
【氏名】馬場 惇
(72)【発明者】
【氏名】吉川 雄一郎
(72)【発明者】
【氏名】石黒 浩
(72)【発明者】
【氏名】中西 惇也
【テーマコード(参考)】
5E555
【Fターム(参考)】
5E555AA16
5E555AA48
5E555AA61
5E555AA76
5E555BA02
5E555BB02
5E555BC04
5E555BD07
5E555CA42
5E555CA47
5E555CB64
5E555CC22
5E555DA23
5E555DA31
5E555DD06
5E555EA22
5E555EA23
5E555FA00
(57)【要約】
【課題】人と対話するロボットを遠隔から操作する操作者の心的負荷を軽減することが可能である制御システム、端末装置、制御方法及びプログラムを提供する。
【解決手段】制御システムは、ロボットとロボットの周囲とが撮像された画像を生成するカメラと、画像を見ながらロボットを操作することが可能な操作者がロボットを操作中でなく且つロボットの周囲にユーザが居ないと判定された場合、ロボットの顔が操作者に見えるようにロボットの顔をカメラに向けて、所定のメッセージを操作者に提示する制御部とを備える。制御部は、テキストの表示と合成音声の出力とのうちの少なくとも一方を用いて、所定のメッセージを提示する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ロボットと前記ロボットの周囲とが撮像された画像を生成するカメラと、
前記画像を見ながら前記ロボットを操作することが可能な操作者が前記ロボットを操作中でなく且つ前記ロボットの周囲にユーザが居ないと判定された場合、前記ロボットの顔が前記操作者に見えるように前記ロボットの顔を前記カメラに向けて、所定のメッセージを前記操作者に提示する制御部と
を備える制御システム。
【請求項2】
前記制御部は、テキストの表示と合成音声の出力とのうちの少なくとも一方を用いて、前記所定のメッセージを提示する、
請求項1に記載の制御システム。
【請求項3】
前記制御部は、前記操作者以外の第三者による操作に応じて、前記所定のメッセージを提示する、
請求項2に記載の制御システム。
【請求項4】
前記カメラは、前記ロボットの後ろ姿を、前記ロボットの背後から撮像し、
前記制御部は、前記ロボットの顔が前記操作者に見えるように、前記ロボットの顔を振り向かせる、
請求項1から請求項3のいずれか一項に記載の制御システム。
【請求項5】
前記制御部は、前記操作者以外の第三者による操作に応じて、前記ロボットの顔を振り向かせる、
請求項4に記載の制御システム。
【請求項6】
前記制御部は、前記操作者からの応答に応じて、前記操作者に提示される前記所定のメッセージを変更する、
請求項1から請求項5のいずれか一項に記載の制御システム。
【請求項7】
前記制御部は、前記操作者からの応答と前記操作者以外の第三者による操作とに応じて、前記操作者に提示される前記所定のメッセージを変更する、
請求項6に記載の制御システム。
【請求項8】
制御システムが実行する制御方法であって、
ロボットと前記ロボットの周囲とが撮像された画像を生成するカメラステップと、
前記画像を見ながら前記ロボットを操作することが可能な操作者が前記ロボットを操作中でなく且つ前記ロボットの周囲にユーザが居ないと判定された場合、前記ロボットの顔が前記操作者に見えるように前記ロボットの顔をカメラに向けて、所定のメッセージを前記操作者に提示する制御ステップと
を含む制御方法。
【請求項9】
請求項1から請求項7のいずれか一項に記載の制御システムとしてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御システム、制御方法及びプログラムに関する。
【背景技術】
【0002】
操作者の音声を用いてロボットの動作を遠隔から制御するシステム(制御システム)がある。このような制御システムでは、操作者の音声の認識結果に対応付けられた動作内容に応じて、ロボットが動作する。特許文献1に開示された制御システムでは、操作者は、端末装置に音声を入力する。制御装置は、端末装置から送信された音声信号に応じて、ロボットの動作を制御する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
このようなロボットは、例えばホテルのロビー等に設置され、そのホテルの顧客への接客業務に用いられることがある。接客するロボット(人と対話するロボット)を遠隔から操作する操作者は、感情を作り出すことが求められている。そのような場面においては、操作者が作り出す感情と操作者が実際に抱いている感情との不一致から、操作者は心的負担を感じやすい(感情的不協和)。例えば、接客するロボットが操作者によって操作されていることに顧客が気づいていない場合がある。このような場合、接客するロボットが顧客から高圧的な態度を取られた等の理由で、そのロボットを遠隔から操作する操作者が心的負荷を感じることがある。また例えば、接客の途中で顧客がロボットの前から立ち去った等の理由で、操作者が心的負荷を感じることがある。操作者が心的負荷を感じることは、ロボットが接客業務に用いられる場合に限られない。このように、人と対話するロボットを遠隔から操作する操作者の心的負荷を軽減することができないという問題がある。
【0005】
上記事情に鑑み、本発明は、人と対話するロボットを遠隔から操作する操作者の心的負荷を軽減することが可能である制御システム、制御方法及びプログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
本発明の一態様は、ロボットと前記ロボットの周囲とが撮像された画像を生成するカメラと、前記画像を見ながら前記ロボットを操作することが可能な操作者が前記ロボットを操作中でなく且つ前記ロボットの周囲にユーザが居ないと判定された場合、前記ロボットの顔が前記操作者に見えるように前記ロボットの顔を前記カメラに向けて、所定のメッセージを前記操作者に提示する制御部とを備える制御システムである。
【0007】
本発明の一態様は、制御システムが実行する制御方法であって、ロボットと前記ロボットの周囲とが撮像された画像を生成するカメラステップと、前記画像を見ながら前記ロボットを操作することが可能な操作者が前記ロボットを操作中でなく且つ前記ロボットの周囲にユーザが居ないと判定された場合、前記ロボットの顔が前記操作者に見えるように前記ロボットの顔をカメラに向けて、所定のメッセージを前記操作者に提示する制御ステップとを含む制御方法である。
【0008】
本発明の一態様は、上記の制御システムとしてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0009】
本発明により、人と対話するロボットを遠隔から操作する操作者の心的負荷を軽減することが可能である。
【図面の簡単な説明】
【0010】
【
図1】実施形態における、制御システムの構成例を示す図である。
【
図2】実施形態における、ロボットとカメラとの外観例を示す図である。
【
図3】実施形態における、動作内容の例を示す図である。
【
図4】実施形態における、表示画像の第1例を示す図である。
【
図5】実施形態における、表示画像の第2例を示す図である。
【
図6】実施形態における、表示画像の第3例を示す図である。
【
図7】実施形態における、表示画像の第4例を示す図である。
【
図8】実施形態における、制御システムの動作例を示すフローチャートである。
【発明を実施するための形態】
【0011】
本発明の実施形態について、図面を参照して詳細に説明する。
図1は、制御システム1の構成例を示す図である。制御システム1は、操作者の音声と操作者による所定の操作とを用いてロボットの動作を遠隔から制御するシステムである。この所定の操作とは、例えば、表示部の画面に表示された操作キー画像に対する押下操作(操作者からの応答)である。
【0012】
制御システム1は、端末装置100と、制御装置200と、中継サーバ300と、ロボット400と、マイク500と、スピーカ510と、カメラ600と、発光部700とを備える。制御システム1は、ロボット400とロボット400に係る機器とを、端末装置100に入力された音声等に基づいて制御する。ロボット400に係る機器とは、例えば、アクチュエータ(モータ等)、スピーカ及び発光部である。
【0013】
制御システム1は、ロボット400が操作者に共感しているようにその操作者に対して演出するための動作を、ロボット400に実行させる。例えば、ロボット400の背後に配置されたカメラ600が、ロボット400の後頭部等と顧客(ユーザ)の正面とが撮影された動画像をリアルタイムで送信する。遠隔の操作者は、カメラ600から送信された動画像を、端末装置100を用いてリアルタイムで見る。操作者は、音声と端末装置100の操作キーとを用いて、ロボット400の動作を操作する。
【0014】
所定のタイミング(例えば、接客の終了後)において、人型のロボット400の顔がカメラ600に向けられ、ロボット400の合成音声が端末装置100から出力される。このようにして、操作者の心的負荷を癒すための言葉をロボット400が操作者に語りかけているように演出するための動作(共感会話)を、ロボット400に実行させる。これによって、ロボット400の操作者の心的負荷を軽減させることが可能である。
【0015】
端末装置100は、通信部101と、入力部102と、表示部103と、マイク・スピーカ104と、カメラ105と、記憶部106と、制御部107とを備える。制御装置200は、通信部201と、記憶部202と、制御部203とを備える。ロボット400は、アクチュエータ401を備える。端末装置100と制御装置200と中継サーバ300とは、ネットワーク800を介して、通信可能に接続されている。
【0016】
端末装置100及び制御装置200の各機能部のうちの一部又は全部は、CPU(Central Processing Unit)等のプロセッサが、不揮発性の記録媒体(非一時的な記録媒体)を有する各記憶部のうちの少なくとも一方に記憶されたプログラムを実行することにより、ソフトウェアとして実現される。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置などの非一時的な記録媒体である。
【0017】
端末装置100及び制御装置200の各機能部のうちの一部又は全部は、例えば、LSI(Large Scale Integrated circuit)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)又はFPGA(Field Programmable Gate Array)等を用いた電子回路(electronic circuit又はcircuitry)を含むハードウェアを用いて実現されてもよい。
【0018】
次に、ネットワーク800について説明する。
端末装置100、制御装置200及び中継サーバ300は、いずれもネットワーク800を介して通信可能である。ネットワーク800は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)又はインターネット等のネットワークである。ネットワーク800は、無線通信を用いたネットワークであってもよいし、有線通信を用いたネットワークであってもよい。ネットワーク800は、複数のネットワークが組み合わされて構成されてもよい。ネットワーク800は、VPN(Virtual Private Network)等の閉域通信網であってもよい。
【0019】
なお、ネットワーク800は、各装置の通信を実現するためのネットワークの具体例にすぎず、各装置の通信を実現するためのネットワークとして他の構成が採用されてもよい。例えば、特定の装置間の通信は、他の装置間の通信に用いられるネットワークとは異なるネットワークを用いて実現されてもよい。具体的には、端末装置100と中継サーバ300との間の通信は、制御装置200及び中継サーバ300の各装置間の通信とは異なるネットワークを用いて実現されてもよい。以下では、ロボット400、マイク500、スピーカ510、カメラ600及び発光部700は、いずれも制御装置200に接続されているが、このような接続形態には限定されない。例えば、ロボット400、マイク500、スピーカ510、カメラ600及び発光部700のうちの少なくとも一つは、ネットワーク800を介して、制御装置200と通信可能に接続されていてもよい。
【0020】
次に、端末装置100について説明する。
端末装置100は、パーソナルコンピュータ、タブレットコンピュータ又はサーバ等の情報処理装置を用いて構成される。端末装置100には、ロボット400の制御に関する情報を制御装置200に送信するための制御指示機能が実装されている。制御指示機能は、ハードウェアとして端末装置100に実装されてもよいし、ソフトウェアとして端末装置100に実装されてもよい。端末装置100は、通信部101、入力部102、表示部103、マイク・スピーカ104、カメラ105及び記憶部106を備える。なお、マイク・スピーカ104では、マイクとスピーカとが別体でもよい。
【0021】
通信部101は、ネットワークインタフェース等の通信装置である。通信部101は、所定のプロトコルを用いて、ネットワーク800に通信可能に接続される。通信部101は、制御部107の制御に応じて、ネットワーク800を介して、他の装置との間でデータ通信を実行する。
【0022】
入力部102は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の入力装置を用いて構成される。入力部102は、操作者の指示を端末装置100に入力する際に、操作者によって操作される。入力部102は、入力装置を端末装置100に接続するためのインタフェースでもよい。この場合、入力部102は、操作者による入力操作(例えば、表示された操作キー画像に対する押下操作)に応じた入力信号を、端末装置100に入力する。
【0023】
表示部103は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ、電子泳動方式ディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等の画像表示装置である。表示部103は、制御部107の制御に応じて画像を表示する。表示部103は、画像表示装置を端末装置100に接続するためのインタフェースであってもよい。この場合、表示部103は、制御部107の制御に応じた画像を表示するための映像信号を生成する。表示部103は、表示部103に接続されている画像表示装置に、映像信号を出力する。
【0024】
マイク・スピーカ104は、制御装置200から送信された音声信号に基づいて生成された合成音声(例えば、業務説明文、共感文)を出力する。マイク・スピーカ104は、マイク・スピーカ104の近傍から、音声を収音する。マイク・スピーカ104は、例えば、端末装置100の操作者によって発話された音声を収音する。端末装置100の操作者は、例えば、ロボット400に向いてロボット400の近傍に居るユーザ(ロボット400と対峙している顧客)に対して、マイク・スピーカ104を用いて発話する。マイク・スピーカ104は、収音された音声に基づいて、音声信号を生成する。マイク・スピーカ104は、生成された音声信号を端末装置100に出力する。
【0025】
なお、マイク・スピーカ104は、外付けマイク等の収音装置を端末装置100に接続するためのインタフェースでもよい。この場合、マイク・スピーカ104は、収音装置に入力された音声に基づいて、操作者の音声に応じた音声信号を生成し、端末装置100に出力する。マイク・スピーカ104は、収音部の一具体例である。
【0026】
カメラ105は、端末装置100の操作者とその操作者の近傍との動画像を撮像する。カメラ105は、他のカメラを端末装置100に接続するためのインタフェースであってもよい。この場合、カメラ105は、他のカメラによって撮像された動画像に応じて映像信号を生成し、端末装置100に入力する。
【0027】
記憶部106は、磁気ハードディスク装置及び半導体記憶装置等の記憶装置を用いて構成される。記憶部106は、ロボット400に対する制御の内容を示す情報(制御内容情報)を記憶する。ロボット400に対する制御の内容は、マイク・スピーカ104によって収音された音声(音声認識結果)に基づいて生成された文字列又は文字列の一部分に対応付けられる。
【0028】
次に、制御装置200について説明する。
制御装置200は、パーソナルコンピュータ、タブレットコンピュータ又はサーバ等の情報処理装置を用いて構成される。制御装置200は、ロボット400を動作させるための動作機能が実装されている。動作機能は、ハードウェア機能部として制御装置200に実装されてもよいし、ソフトウェア機能部のインストールによって実装されてもよい。制御装置200は、通信部201、記憶部202及び制御部203を備える。
【0029】
通信部201は、ネットワークインタフェース等の通信装置である。通信部201は所定のプロトコルでネットワーク800に通信可能に接続する。通信部201は、制御部203の制御に応じてネットワーク800を介して、他の装置との間でデータ通信する。
【0030】
記憶部202は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。記憶部202は、ロボット400の動作に関して、所定条件に応じた動作内容と、ロボット400の制御の状態の遷移に関する状態遷移情報とを記憶する。状態遷移情報は、端末装置100から受信した制御情報に基づいて、ロボット400の状態を遷移させるための情報を示す。ロボット400は、同じ制御情報を受信しても、制御状態に応じて異なる動作を行う。
【0031】
制御部203は、制御装置200の各部の動作を制御する。制御部203は、CPU等のプロセッサ及びRAMを用いて構成される。制御部203は、記憶部202に記憶された所定の通信プログラムを実行することによって、他の装置と通信する。例えば、制御部203は、中継サーバ300を介して、制御情報を端末装置100から受信する。また、制御部203は、角度情報を端末装置100から受信する。
【0032】
制御部203は、制御情報又は角度情報に基づいて、ロボット400又はロボット400に係る機器を制御する。例えば、制御部203は、動作指示をロボット400又はロボット400に係る各機器に送信することで、これらの機器の動作を制御する。動作指示は、制御情報又は角度情報の内容を示す。例えば、端末装置100から制御情報を受信した場合、制御部203は、制御情報の内容を示す動作指示を、ロボット400又はロボット400に係る機器に送信する。
【0033】
また、制御部203は、角度情報を端末装置100から受信した場合、角度情報の内容を示す動作指示を、ロボット400又はロボット400に係る機器に送信する。例えば、座標情報がP=(X,Y,Z)である場合、制御部203は、ロボット400の頭部の向きを制御することで、ロボット400の頭部が座標P=(X,Y,Z)の方向を向くように、ロボット400の頭部の向きを制御するための動作指示を送信する。
【0034】
制御部203は、所定の映像制御プログラムを実行することによって、他の装置と通信する。例えば、制御部203は、マイク500によって収音された音声信号を、端末装置100に送信する。また、制御部203は、カメラ600によって出力された映像信号を制御装置200に送信する。また、制御部203は、音声信号を端末装置100から受信する。制御部203は、受信した音声信号を、スピーカ510に出力する。
【0035】
中継サーバ300は、パーソナルコンピュータ、産業用コンピュータ又はサーバ等の情報処理装置を用いて構成される。中継サーバ300は、端末装置100と制御装置200との通信を中継するための中継機能が実装されている。中継機能は、ハードウェアによって中継サーバ300に実装されてもよいし、ソフトウェアのインストールによって実装されてもよい。中継サーバ300は、例えばWebRTC(Web Real-Time Communication)シグナリングを実行することで、端末装置100と制御装置200との映像信号及び音声信号の送受信を実現させる。また、中継サーバ300は、端末装置100から制御装置200に制御情報又は角度情報を送信するためのWebSocketサーバとして機能してもよい。
【0036】
ロボット400は、制御装置200によって送信された動作指示に応じて、各駆動機構や発光部、スピーカ又はカメラ等のロボット400に設けられた機能を制御することによって、所定の動作を実行する。例えば、ロボット400は、首、肩又は腕の各関節部に設けられた駆動機構を作動することによって動作する。ロボット400は、例えば、肩又は脚等の各関節部に設けられた駆動機構を作動して歩行する動物の形状であってもよい。ロボット400は、肩又は脚等の各関節部に設けられた駆動機構を作動して自立歩行する二足歩行等のロボット(ヒューマノイド)であってもよい。ロボット400は、車輪又は無限軌道で移動できるような移動型ロボット(エージェント化されたロボット)であってもよい。ロボット400は、例えばテーブルや受付台等の板状の台の上に設置される。ロボットは所定の装置の一具体例である。
【0037】
マイク500は、マイク500の近傍から、音声を収音する。マイク500は、例えばロボット400が対峙する顧客から発話された音声を収音する。マイク500は、収音された音声に基づいて音声信号を生成する。マイク500は、生成された音声信号を制御装置200に出力する。スピーカ510は、端末装置100から送信された音声信号を出力する。このように構成されることで、ロボット400が、ロボット400に対峙する人に話しかけているように見せることができる。また、スピーカ510は、制御装置200の制御部203によって指示される動作指示に応じて、音声を出力してもよい。
【0038】
カメラ600は、動画像の撮像装置である。カメラ600は、例えば、ロボット400の背後に配置される。カメラ600は、ロボット400の後ろ姿が映るように、ロボット400の周囲(近傍)の動画像を撮像する。すなわち、カメラ600は、ロボット400とユーザとを、第三者の視点から撮像する。カメラ600は、撮像された動画像を示す映像信号を生成し、制御装置200に出力する。この第三者の視点から、ロボット400とユーザとをロボット400の操作者が見ることになる。なお、カメラ600は、ロボット400の前後左右のいずれの位置に設けられてもよい。カメラ600は、ロボット400に対峙する人(顧客)とロボット400とが撮像できる位置である限り、どの位置に設けられてもよい。カメラ600は、例えば、ロボット400の背後に配置される。
【0039】
発光部700は、LEDや電球等の発光部材である。発光部700は、例えば所定の形状をしたパネルに複数の発光部材を備えてもよい。所定の形状とは、円形であってもよいし、四角形等の多角形であってもよい。発光部700は、制御装置200の制御部203によって指示される動作指示に応じて、発光してもよい。なお、発光部700は、実行内容に応じて、異なる態様で発光してもよい。例えば、発光部700が複数の発光部材を備える場合、動作指示に応じて一部の発光部材を発光させるように構成されてもよい。
【0040】
図2は、ロボット400とカメラ600との外観例を示す図である。ロボット400は、頭部410と、左腕部420、右腕部430及び脚部440を備える胴体部とから構成される。頭部410は、マイク411、カメラ412、スピーカ413及び発光部414を備える。頭部410は、制御装置200の制御部203によって指示された動作指示に基づいて、上下左右等の3軸方向に駆動する。ロボット400は、例えば、動作指示が示す角度の方向に、頭部410の向きを制御する。
【0041】
ロボット400のマイク411は、自装置近傍の音声を収音する。マイク500が、自装置近傍の音声を収音してもよい。マイク411とマイク500とのうちの少なくとも一方は、例えばロボット400が対峙する人によって発話された音声を収音する。マイク411とマイク500とのうちの少なくとも一方は、収音された音声に基づいて音声信号を生成する。マイク411とマイク500とのうちの少なくとも一方は、生成された音声信号を制御装置200に記録してもよいし、ネットワーク800を介して外部の装置に記録してもよい。マイク411とマイク500とのうちの少なくとも一方は、制御装置200の制御部203によって指示される実行内容に応じて、音声を収音してもよい。
【0042】
ロボット400のカメラ412は、ロボット400が対峙する人及びロボット400が対峙する人の近傍の動画像又は静止画像を撮像する。カメラ412は、撮像された動画像又は静止画像を制御装置200に記録してもよいし、ネットワーク800を介して外部の装置に記録してもよい。カメラ412は、制御装置200の制御部203によって指示される動作指示に応じて、動画像又は静止画像を撮像してもよい。
【0043】
発光部414は、フルカラーLED等の発光部材である。発光部414は、制御装置200の制御部203によって指示される実行内容に応じて、所定の色で発光してもよい。このように構成されることで、スピーカ413とスピーカ510とのうちの少なくとも一方が音声を出力している時に、発光部414を点滅させることができる。このように発光部414が発光することで、ロボット400に対峙している人にロボット400が話しかけているように見せることができる。
【0044】
左腕部420は、上下左右に駆動する駆動機構である。左腕部420は、制御装置200の制御部203によって指示された動作指示に応じて、上下左右に駆動する。左腕部420は、左腕部420の回転方向に応じて開いたり閉じたりする。左腕部420は、制御装置200の制御部203によって指示された実行内容に応じて、開いたり閉じたりしてもよい。
【0045】
右腕部430は、左腕部420と同様に、制御装置200の制御部203によって指示された動作指示に応じて駆動する。
【0046】
脚部440は、制御装置200の制御部203によって指示される動作指示に応じて、ロボット400の向きを変更したり、前後左右に移動させたりする。ロボット400は、例えば動作情報が示す角度の方向に脚部440の向きを制御する。
【0047】
次に、ロボット400が操作者に共感しているようにその操作者に対して演出するための動作について説明する。
図3は、動作内容の例を示す図である。動作内容とは、端末装置100とロボット400とのうちの少なくとも一方が実行する動作内容である。動作内容には、その動作内容が実行されるための条件が定められている。なお、動作内容と条件との組み合わせは、特定の組み合わせに制限されない。
【0048】
表示部103に表示された操作キー画像「参加」が押下操作(選択)された場合、端末装置100は、中継サーバ300に通信接続する。表示部103に表示された操作キー画像「スタート」が押下操作(選択)された場合、ロボット400が、顔をカメラ600に向ける。端末装置100の表示部103が、第1テキストを表示する。端末装置100のマイク・スピーカ104が、第1テキストの音声を出力する。第1テキストは、例えば、業務説明文の文字列「こんにちは。今日のお仕事なんだけど、僕は喋るのが得意じゃないから、ユーザとの会話はキミにやってもらいたいんだ。僕はキミの言葉に合わせて動作して、現地でユーザにアピールするね。一緒に頑張ろう!」である。なお、操作キー画像「参加」及び操作キー画像「スタート」のいずれも押下操作されていない場合でも、端末装置100は、中継サーバ300に通信接続してもよい。その通信接続の一定時間後に、ロボット400が顔をカメラ600に向けて、第1テキストが表示部103に表示されてもよい。
【0049】
所定時間において操作者が発話していない、かつ、その所定時間においてユーザの顔が動画像において未検出である場合(ユーザがロボット400の近傍に居ない場合)、ロボット400が、顔をカメラ600に向ける。ロボット400が顔をカメラ600にすでに向けている場合には、ロボット400は顔をカメラ600に向けたままにする。端末装置100の表示部103が、第2テキストを表示する。端末装置100のマイク・スピーカ104が、第2テキストの音声を出力する。第2テキストは、例えば、操作者の心労を気に掛けるように演出するための共感文の文字列「しんどくない?大丈夫?」である。
【0050】
表示部103に表示された操作キー画像「しんどい」が押下操作(選択)された場合、ロボット400が、顔をカメラ600に向ける。ロボット400が顔をカメラ600にすでに向けている場合には、ロボット400は顔をカメラ600に向けたままにする。端末装置100の表示部103が、第3テキストを表示する。端末装置100のマイク・スピーカ104が、第3テキストの音声を出力する。第3テキストは、例えば、操作者の心労を気に掛けるように演出するための共感文の文字列「うんうん、疲れたね」である。
【0051】
図4は、表示画像(操作者インタフェースの画像)の第1例を示す図である。
図4に例示された操作者インタフェースの画像は、例えば、操作者が端末装置100を用いて制御装置200にログインした際に、表示部103に表示される。操作者インタフェースの画像は、ブラウザを用いて表示部103に表示される。操作者動画像950には、カメラ105によって撮影された操作者の動画像が表示される。
【0052】
図4では、操作者インタフェースの画像は、一例として、サムネイル動画像表示領域900と、操作キー画像911「参加」と、操作キー画像912「スタート」と、操作キー画像913「退出」と、動画像表示領域920と、テキスト表示領域930と、ロボット画像940と、操作者動画像950と、操作キー画像960とを含む。カメラ600によって撮影された動画像は、操作者がサムネイル動画像表示領域900を選択することによって、動画像表示領域920にリアルタイムで表示される。
【0053】
操作キー画像912「スタート」が押下操作された場合、
図3に例示された動作内容に基づいて、ロボット400が、顔をカメラ600に向ける。ロボット400が顔をカメラ600にすでに向けている場合には、ロボット400は顔をカメラ600に向けたままにする。これによって、動画像表示領域920には、カメラ600に顔を向けたロボット400の動画像であるロボット画像940が表示される。表示部103は、制御部203から送信された第1テキスト「こんにちは。今日のお仕事なんだけど、僕は喋るのが得意じゃないから、ユーザとの会話はキミにやってもらいたいんだ。僕はキミの言葉に合わせて動作して、現地でユーザにアピールするね。一緒に頑張ろう!」を、テキスト表示領域930に表示する。また、スピーカ510は、例えば、制御部203から送信された第1テキストの合成音声を出力する。
【0054】
操作者は、操作キー画像960「了解」を押下操作する。操作キー画像960「了解」が押下操作された場合、ロボット400の動作が制御可能となり、ユーザに対する接客が開始される。
【0055】
図5は、表示画像(操作者インタフェースの画像)の第2例を示す図である。
図5では、操作者インタフェースの画像は、一例として、サムネイル動画像表示領域900と、操作キー画像911「参加」と、操作キー画像913「退出」と、動画像表示領域920と、テキスト表示領域930と、ロボット画像941と、会話テキスト表示領域942と、操作者動画像950とを含む。
【0056】
動画像表示領域920には、ロボット400の近傍に居る顧客(ユーザ)が撮像された動画像が表示されている。操作キー画像912「スタート」が押下操作された場合、
図3に例示された条件と動作内容との間に予め定められた対応付けに基づいて、ロボット400が顔を顧客(ユーザ)に向ける。これによって、動画像表示領域920には、顔を顧客に向けたロボット400の動画像であるロボット画像941が表示される。表示部103は、例えば、操作者の音声に応じたテキスト「こんにちは!」を、会話テキスト表示領域942に表示する。また、スピーカ510は、例えば、操作者の音声に応じたテキストの合成音声「こんにちは!」を出力する。なお、操作者動画像950において、テキスト「こんにちは!」が重畳表示されてもよい。
【0057】
図6は、表示画像(操作者インタフェースの画像)の第3例を示す図である。
図6では、操作者インタフェースの画像は、一例として、サムネイル動画像表示領域900と、操作キー画像911「参加」と、操作キー画像913「退出」と、動画像表示領域920と、テキスト表示領域930と、ロボット画像940と、操作者動画像950と、操作キー画像961と、操作キー画像962と、操作キー画像963とを含む。
【0058】
所定時間において操作者が発話していない、かつ、その所定時間においてユーザの顔が未検出である場合、
図3に例示された条件と動作内容との間に予め定められた対応付けに基づいて、ロボット400が、顔をカメラ600に向ける。ロボット400が顔をカメラ600にすでに向けている場合には、ロボット400は顔をカメラ600に向けたままにする。これによって、動画像表示領域920には、カメラ600に顔を向けたロボット400の動画像であるロボット画像940(振り向き画像)が表示される。表示部103は、制御部203から送信された第2テキスト「しんどくない?大丈夫?」を、テキスト表示領域930に表示する。また、マイク・スピーカ104は、例えば、制御部203から送信された第2テキストの合成音声を出力する。操作者は、例えば、操作キー画像961「大丈夫」、操作キー画像962「しんどい」又は操作キー画像963「特には」を押下操作する。
【0059】
なお、ロボット画像940は、コンピュータ・グラフィックスを用いて動画像表示領域920に描かれた画像でもよい。これによって、ロボット400が実際には振り向いていない場合でも、ロボット400が振り向いている画像を操作者に提示することができる。
【0060】
図7は、表示画像(操作者インタフェース)の第4例を示す図である。
図7では、操作者インタフェースの画像は、一例として、サムネイル動画像表示領域900と、操作キー画像911「参加」と、操作キー画像913「退出」と、動画像表示領域920と、テキスト表示領域930と、ロボット画像940と、操作者動画像950とを含む。
【0061】
例えば、操作キー画像962「しんどい」が押下操作された場合、
図3に例示された条件と動作内容との間に予め定められた対応付けに基づいて、ロボット400が、顔をカメラ600に向ける。ロボット400が顔をカメラ600にすでに向けている場合には、ロボット400は顔をカメラ600に向けたままにする。これによって、動画像表示領域920には、カメラ600に顔を向けたロボット400の動画像であるロボット画像940が表示される。表示部103は、制御部203から送信された第3テキスト「うんうん、疲れたね」を、テキスト表示領域930に表示する。また、スピーカ510は、例えば、制御部203から送信された第3テキストの合成音声を出力する。なお、操作キー画像913「退出」が押下操作された場合、端末装置100と中継サーバ300との間の通信接続が切断される。
【0062】
次に、制御システム1の動作例を説明する。
図8は、制御システム1の動作例を示すフローチャートである。表示部103は、制御装置200から送信されたテキスト(業務説明文)を表示する(ステップS101)。マイク・スピーカ104は、制御装置200から送信された音声信号に応じた音声(業務説明文)を出力する(ステップS102)。
【0063】
制御部203(画像認識処理部)は、カメラ600によって撮影された動画像に対して、画像認識処理(例えば、顧客の顔を認識する処理)を実行する(ステップS103)。制御部203は、操作者が発話中であるか否かを判定する。例えば、制御部107から送信された音声信号を制御部203が受信した場合、制御部203は、操作者が発話中であると判定する(ステップS104)。
【0064】
操作者が発話中であると判定された場合(ステップS104:YES)、制御部203は、操作者の音声について、音声ミュートを解除(無効化)する。これによって、操作者の音声が、スピーカ510から出力可能となる(ステップS105)。制御部203(音声認識処理部)は、操作者の音声信号に対して、音声認識処理(例えば、制御内容に対応付けられた文字列を認識する処理)を実行する(ステップS106)。制御部203は、音声認識の結果に応じて、ロボット400等の実行内容のデータを生成する。ロボット400等は、実行内容に応じて動作する(ステップS107)。制御部203は、ステップS103に処理を戻す。
【0065】
操作者が発話中でないと判定された場合(操作者がロボット400を操作中でないと判定された場合)(ステップS104:NO)、制御部203は、ロボット400に向いてロボット400の近傍に居るユーザ(顧客)の顔が画像認識処理の結果において検出されたか否かを判定する(ステップS108)。ユーザ(顧客)の顔が検出されたと判定された場合(ロボット400の近傍にユーザが居ると判定された場合)(ステップS108:YES)、制御部203は、動作指示をロボット400に送信する。ロボット400は、制御装置200によって送信された動作指示に応じて、各駆動機構や発光部、スピーカ又はカメラ等のロボット400に設けられた機能を制御することによって、所定の動作を実行する(ステップS109)。制御部203は、ステップS103に処理を戻す。
【0066】
ユーザ(顧客)の顔が検出されていないと判定された場合(ステップS108:NO)、制御部203は、操作者の音声について、音声ミュートを設定(有効化)する。これによって、操作者の音声が、スピーカ510から出力不可となる(ステップS110)。制御部203は、ロボット400の顔をカメラ600に向けるように、動作指示をロボット400のアクチュエータ401に送信する(ステップS111)。
【0067】
表示部103は、制御装置200から送信されたテキスト(例えば、操作者の心労を気に掛けるように演出するための共感文「しんどくない?大丈夫?」)を表示する(ステップS112)。マイク・スピーカ104は、制御装置200から送信された音声信号に応じた音声(共感文)を出力する(ステップS113)。制御部203は、表示部103に表示された操作キー画像(例えば、操作キー画像961「大丈夫」)が操作されたか否かを判定する(ステップS114)。
【0068】
操作キー画像が操作されていないと判定された場合(ステップS114:NO)、制御部203は、ステップS103に処理を戻す。操作キー画像が操作されたと判定された場合(ステップS114:YES)、制御部203は、表示部103に表示された操作キー画像913「退出」が操作されたか否かを判定する(ステップS115)。
【0069】
操作キー画像913「退出」以外の操作キー画像が操作されたと判定された場合(ステップS115):NO)、制御部203は、入力部102への入力操作に応じた入力信号に基づいて、動作内容を決定する。ロボット400は、決定された動画内容に基づいて動作する(ステップS116)。制御部203は、ステップS103に処理を戻す。操作キー画像913「退出」が操作されたと判定された場合(ステップS115):YES)、制御部203は、処理を終了する。
【0070】
なお、ステップS110からステップS113までの処理を実行中に、別のユーザの顔が動画像において検出された場合(別のユーザがロボット400の近傍に居る場合)、制御部203は、ステップS110からステップS113までの処理を中断し、ステップS103に処理を戻す。
【0071】
以上のように、カメラ600は、ロボット400とロボット400の周囲とが撮像された画像を生成する。生成された画像を見ながらロボットを操作することが可能な操作者がロボットを操作中でなく、且つ、ロボットの周囲にユーザ(顧客)が居ないと判定された場合、制御部203は、ロボット400の顔が操作者に見えるように、ロボット400の顔をカメラ600に向ける。例えば、ロボット400の後ろ姿をカメラ600がロボット400の背後から撮像する場合、制御部203は、ロボット400の顔が操作者に見えるように、アクチュエータ401を用いてロボット400の顔を振り向かせる。制御部203は、所定のメッセージ(業務説明文、共感文)を、操作者に提示する。制御部203は、操作者からの応答(例えば、操作キー画像に対する押下操作)に応じて、操作者に提示される所定のメッセージを変更してもよい。制御部203は、テキストの表示と合成音声の出力とのうちの少なくとも一方を用いて、所定のメッセージ(業務説明文、共感文)を提示する。
【0072】
これらのように、ロボット400を遠隔操作のための単なるツールとせずに、ロボット400という相棒と二人で接客業務に取り組んでいるという感覚を制御システム1は操作者に与える。これによって、人と対話するロボットを遠隔から操作する操作者の心的負荷を軽減することが可能である。操作者のモチベーションを維持させることが可能である。
【0073】
制御部107は、テキスト及び音声を表す画像を表示部103に表示するだけなく、感情及び意見を表す画像を表示部103に表示してもよい。感情及び意見を表す画像とは、例えば、絵文字又はスタンプである。
【0074】
制御部107は、操作者をねぎらう言葉を操作者に提示するだけでなく、具体的な解決策を操作者に提示してもよい。これによって、操作者の心的負荷を軽減するための行動を操作者自身に促すことが可能である。
【0075】
業務開始時及び業務終了時に、制御部107は、今日の操作者の気分及び心的状況のアンケートを、操作者から取得してもよい。業務開始時及び業務終了時に、制御部107は、業務遂行のサポートとなるやりとりを、操作者に対して実行してもよい。例えば、制御部107は、今日の業務内容の確認を、操作者に対して実行してもよい。例えば、制御部107は、伝達事項の確認を、操作者に対して実行してもよい。
【0076】
(変形例)
上記の実施形態では、ロボット400が接客に用いられる場合を例として、制御システム1の説明がなされた。ロボット400は接客以外の用途に用いられてもよい。ロボット400は、例えば医療機関に設置され、操作者と患者との対話に用いられてもよい。ロボット400は、例えば教育施設に設置され、操作者と生徒との対話に用いられてもよい。ロボット400は、例えば執務室に設置され、操作者と同僚との対話(雑談)に用いられてもよい。
【0077】
ロボット400は、メンタルサポート行為について、自律的に動作してもよいし、自律的に動作しなくてもよい。このメンタルサポート行為とは、上記の実施形態において例示されたように、例えば操作者に顔を見せるようにロボット400が振り向く動作でもよいし、例えばロボット400と操作者との対話でもよい。これらのようなメンタルサポート行為については、ロボット400は、自律的に動作してもよいし、操作者以外の第三者による遠隔操作に応じて動作してもよい。例えば、人とロボット400とが対話する際の操作者(主操作者)は、人と対話するロボット400を操作して、接客等のサービスを顧客に提供する。メンタルサポート行為をロボット400が行う際の第三者(副操作者)は、所定のタイミングで、その第三者の端末装置(不図示)を用いて、ロボット400を遠隔操作する。メンタルサポート行為をロボット400が行う際、第三者(副操作者)がロボット400を遠隔操作することによって、ロボット400は振り向く。すなわち、制御部203は、操作者以外の第三者による操作に応じて、ロボット400の顔を振り向かせる。制御部203は、操作者以外の第三者による遠隔操作に応じて、所定のメッセージを提示してもよい。制御部203は、操作者からの応答と、操作者以外の第三者による遠隔操作とに応じて、操作者に提示される所定のメッセージを変更してもよい。これらのようにして、第三者(副操作者)は、操作者(主操作者)の心的状態の確認及びケアをすることが可能である。
【0078】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0079】
1…制御システム、100…端末装置、101…通信部、102…入力部、103…表示部、104…マイク・スピーカ、105…カメラ、106…記憶部、107…制御部、200…制御装置、201…通信部、202…記憶部、203…制御部、300…中継サーバ、400…ロボット、401…アクチュエータ、410…頭部、411…マイク、412…カメラ、413…スピーカ、414…発光部、420…左腕部、430…右腕部、440…脚部、500…マイク、510…スピーカ、600…カメラ、700…発光部、800…ネットワーク、900…サムネイル動画像表示領域、911…操作キー画像、912…操作キー画像、913…操作キー画像、920…動画像表示領域、930…テキスト表示領域、940…ロボット画像、941…ロボット画像、942…会話テキスト表示領域、950…操作者動画像、960…操作キー画像、961…操作キー画像、962…操作キー画像、963…操作キー画像、970…顧客画像