IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧 ▶ 株式会社ソニー・コンピュータエンタテインメントの特許一覧 ▶ ソニー・インタラクティブエンタテインメント エルエルシーの特許一覧

特開2024-12100情報処理装置、ロボット、携帯端末装置
<>
  • 特開-情報処理装置、ロボット、携帯端末装置 図1
  • 特開-情報処理装置、ロボット、携帯端末装置 図2
  • 特開-情報処理装置、ロボット、携帯端末装置 図3
  • 特開-情報処理装置、ロボット、携帯端末装置 図4
  • 特開-情報処理装置、ロボット、携帯端末装置 図5
  • 特開-情報処理装置、ロボット、携帯端末装置 図6
  • 特開-情報処理装置、ロボット、携帯端末装置 図7
  • 特開-情報処理装置、ロボット、携帯端末装置 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024012100
(43)【公開日】2024-01-25
(54)【発明の名称】情報処理装置、ロボット、携帯端末装置
(51)【国際特許分類】
   G06F 3/01 20060101AFI20240118BHJP
   H04N 7/14 20060101ALI20240118BHJP
【FI】
G06F3/01 510
H04N7/14 110
H04N7/14 150
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023096066
(22)【出願日】2023-06-12
(31)【優先権主張番号】63/389,376
(32)【優先日】2022-07-15
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(71)【出願人】
【識別番号】310021766
【氏名又は名称】株式会社ソニー・インタラクティブエンタテインメント
(71)【出願人】
【識別番号】518187455
【氏名又は名称】ソニー・インタラクティブエンタテインメント エルエルシー
(74)【代理人】
【識別番号】100105924
【弁理士】
【氏名又は名称】森下 賢樹
(74)【代理人】
【識別番号】100109047
【弁理士】
【氏名又は名称】村田 雄祐
(74)【代理人】
【識別番号】100109081
【弁理士】
【氏名又は名称】三木 友由
(74)【代理人】
【識別番号】100134256
【弁理士】
【氏名又は名称】青木 武司
(72)【発明者】
【氏名】奥村 泰史
(72)【発明者】
【氏名】今村 幸太郎
(72)【発明者】
【氏名】バット ウヂュピ ラマナス
(72)【発明者】
【氏名】河村 大輔
(72)【発明者】
【氏名】荻下 直樹
(72)【発明者】
【氏名】福山 剛
(72)【発明者】
【氏名】鈴木 龍一
(72)【発明者】
【氏名】村田 華蓮
(72)【発明者】
【氏名】安田 真理
【テーマコード(参考)】
5C164
5E555
【Fターム(参考)】
5C164FA09
5C164VA03P
5C164VA06P
5C164VA34P
5E555AA16
5E555BA02
5E555BA13
5E555BB04
5E555BC01
5E555CA42
5E555CA44
5E555CC27
5E555DB57
5E555EA22
5E555FA00
(57)【要約】
【課題】テレイグジスタンス技術を簡易に利用するための技術を提供する。
【解決手段】画像データ取得部222は、携帯端末装置におけるカメラがユーザの顔を撮影した画像を取得する。動き検出部230は、画像からユーザの顔の向きを検出する。制御信号生成部232は、検出した顔の向きにもとづいて、ロボットの第1回転装置または第2回転装置を回転させる制御信号を生成する。送信部212は、生成した制御信号をロボットに送信する。
【選択図】図4
【特許請求の範囲】
【請求項1】
胴体部および頭部を有するロボットの動作を制御する情報処理装置であって、前記ロボットは、前記胴体部に対して前記頭部を回転させる第1回転装置と、前記ロボットの接地面に対して前記胴体部を回転させる第2回転装置とを有し、
携帯端末装置におけるカメラがユーザの顔を撮影した画像を取得する取得部と、
前記画像から、ユーザの顔の向きを検出する動き検出部と、
検出した顔の向きにもとづいて、前記ロボットの前記第1回転装置または前記第2回転装置を回転させる制御信号を生成する制御信号生成部と、
生成した制御信号を前記ロボットに送信する送信部と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記取得部は、前記携帯端末装置における慣性計測装置が計測したセンサデータを取得し、
前記制御信号生成部は、前記センサデータにもとづいて、前記ロボットの前記第1回転装置または前記第2回転装置を回転させる制御信号を生成する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記制御信号生成部は、所定の回転方向において前記第1回転装置を回転させる制御信号を生成した後、同じ回転方向において前記第2回転装置を回転させる制御信号を生成する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記制御信号生成部は、前記第1回転装置が前記頭部を回転上限角度まで回転させた後に、前記第2回転装置が前記胴体部を回転させる制御信号を生成する、
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
胴体部および頭部を有するロボットであって、
前記胴体部に対して前記頭部を回転させる第1回転装置と、
前記ロボットの接地面に対して前記胴体部を回転させる第2回転装置と、
前記第1回転装置および前記第2回転装置を駆動する制御部と、を備え、
前記制御部は、前記第1回転装置により前記頭部を回転させた後、前記第2回転装置により前記胴体部を回転させる、
ことを特徴とするロボット。
【請求項6】
前記制御部は、前記第1回転装置が前記頭部を回転上限角度まで回転させた後、前記第2回転装置により前記胴体部を回転させる、
ことを特徴とする請求項5に記載のロボット。
【請求項7】
前記制御部は、ヨー方向において、前記第1回転装置により前記頭部を回転させた後、前記第2回転装置により前記胴体部を回転させる、
ことを特徴とする請求項5に記載のロボット。
【請求項8】
前記頭部は、ユーザの顔画像またはユーザに関連する画像を表示する表示部を有する、
ことを特徴とする請求項5に記載のロボット。
【請求項9】
携帯端末装置であって、
ユーザの顔を撮影するカメラと、
慣性計測装置と、
前記カメラが撮影した画像データと、前記慣性計測装置が計測したセンサデータとを、情報処理装置に送信する送信部と、
ロボットが撮影した画像を受信する受信部と、
前記ロボットが撮影した画像を表示する表示部と、
を備えることを特徴とする携帯端末装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、遠隔地に存在するロボットの視点映像をユーザが見ることのできるテレイグジスタンス技術に関する。
【背景技術】
【0002】
近年、遠隔地に配置したロボットを自分の分身として利用するテレイグジスタンスと呼ばれる技術が開発されている。遠隔地にいるロボットが周囲の画像データや音声データをユーザに送信し、ユーザ側で再生することで、ユーザは、ロボットが配置された場所に自分が存在するような臨場感をもって、ロボットの周囲の人達とコミュニケーションをとることが可能となる。
【0003】
特許文献1は、ユーザの頭部に装着されたヘッドマウントディスプレイ装置の姿勢に応じて、遠隔地に配置されたロボットのカメラの視線方向を定める情報処理システムを開示する。特許文献1におけるロボットは、3軸回転機構を有するアクチュエータ装置を備え、カメラを搭載した筐体の位置および姿勢を変更する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2017-216643号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に開示される情報処理システムは、ヘッドマウントディスプレイ装置を利用することを前提としており、そのためヘッドマウントディスプレイ装置が存在しない環境下では使用できない。そこでスマートホンなどの携帯端末装置を利用して、テレイグジスタンス技術を身近に活用できるようにする仕組みを構築することが望まれている。
【0006】
そこで本開示は、テレイグジスタンス技術を簡易に利用するための技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明のある態様の情報処理装置は、胴体部および頭部を有するロボットの動作を制御する情報処理装置であって、ロボットは、胴体部に対して頭部を回転させる第1回転装置と、ロボットの接地面に対して胴体部を回転させる第2回転装置とを有する。情報処理装置は、携帯端末装置におけるカメラがユーザの顔を撮影した画像を取得する取得部と、画像からユーザの顔の向きを検出する動き検出部と、検出した顔の向きにもとづいて、ロボットの第1回転装置または第2回転装置を回転させる制御信号を生成する制御信号生成部と、生成した制御信号をロボットに送信する送信部とを備える。
【0008】
本発明の別の態様は、胴体部および頭部を有するロボットであって、胴体部に対して頭部を回転させる第1回転装置と、ロボットの接地面に対して胴体部を回転させる第2回転装置と、第1回転装置および第2回転装置を駆動する制御部とを備える。制御部は、第1回転装置により頭部を回転させた後、第2回転装置により胴体部を回転させる。
【0009】
本発明のさらに別の態様は、携帯端末装置であって、ユーザの顔を撮影するカメラと、慣性計測装置と、カメラが撮影した画像データと慣性計測装置が計測したセンサデータとを、情報処理装置に送信する送信部と、ロボットが撮影した画像を受信する受信部と、ロボットが撮影した画像を表示する表示部とを備える。
【0010】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【図面の簡単な説明】
【0011】
図1】実施例における情報処理システムの概要を示す図である。
図2】ロボットの利用場面の例を示す図である。
図3】携帯端末装置の機能ブロックを示す図である。
図4】情報処理装置の機能ブロックを示す図である。
図5】ロボットの機能ブロックを示す図である。
図6】第1回転装置による頭部の回転方向を説明するための図である。
図7】ロボットを上面から見た状態の例を示す図である。
図8】ロボットを上面から見た状態の例を示す図である。
【発明を実施するための形態】
【0012】
図1は、実施例における情報処理システム1の概要を示す。情報処理システム1は、ユーザAが操作する携帯端末装置100と、ユーザAから離れた場所に配置されるロボット10と、情報処理装置200とを備える。携帯端末装置100は、アクセスポイント(AP)2と既知の無線通信プロトコルで接続し、AP2を介してインターネットなどのネットワーク4に接続する。同様にロボット10はAP3と既知の無線通信プロトコルで接続し、AP3を介してネットワーク4に接続する。ロボット10はAP3と既知の無線通信プロトコルで接続するが、ケーブルで接続してもよい。携帯端末装置100とロボット10は、情報処理装置200を介して通信可能に接続してよい。
【0013】
ロボット10は、頭部12と胴体部14を備え、頭部12は胴体部14の上方に配置される。実施例において頭部12および胴体部14の筐体は、それぞれ直方体の形状をもつ。頭部12および胴体部14は第1回転装置16により連結され、第1回転装置16は、胴体部14に対して頭部12を回転させる機構を備える。なお第1回転装置16は、頭部12および胴体部14を直接連結してよいが、頭部12と胴体部14の間に別のパーツが存在してもよい。実施例の第1回転装置16は、頭部12をロール方向、ピッチ方向、ヨー方向に回転させる3軸回転機構を備える。第1回転装置16は、たとえば特許文献1に開示された3軸回転機構であってよいが、別の機構であってもよい。
【0014】
胴体部14の筐体下部には、ロボット10の接地面に対して胴体部14を回転させる第2回転装置18が設けられる。第2回転装置18は、ロボット10を接地面に対して移動させる移動機構であってよく、ロボット10の脚部を構成してよい。当該移動機構は、胴体部14の筐体下部に設けられた3つ以上のオムニホイールで構成されて全方向の移動を可能とし、ある位置でヨー方向の回転運動を行うことで、接地面に対して胴体部14をヨー方向に回転させる第2回転装置18として機能する。実施例では、移動機構による前後左右の移動運動については取り扱わず、胴体部14をヨー方向に回転運動させる機能に焦点をあてて説明する。
【0015】
頭部12は、その筐体前面に、携帯端末装置100を把持するユーザAの顔画像または当該ユーザAに関連する画像(たとえば当該ユーザAのアバター画像)を表示する表示部20を備える。さらに頭部12は、ロボット10の周辺を撮影するカメラ22、音を出力するスピーカ24およびロボット10の周辺の音を取得するマイク26を備える。カメラ22は頭部12の筐体前面に設けられて、表示部20が向いている方向を含む空間を撮影する。マイク26は、筐体の両側面に設けられてよい。
【0016】
実施例の情報処理装置200は、リアルタイムコミュニケーションサービスを提供するサーバ装置であってよい。ユーザAは、リアルタイムコミュニケーションサービスを利用することで、たとえば自宅にいながらにして、会議室に配置されたロボット10を通じて会議室にいるメンバと会話できる。
【0017】
テレイグジスタンスを実現する情報処理システム1において、ロボット10は、ユーザAのいわば分身として動作する。情報処理装置200は、ユーザAの顔の向きを示す情報を携帯端末装置100から取得すると、ロボット10の頭部12の動きを制御する制御信号を生成してロボット10に提供し、ロボット10は、制御信号にもとづいて第1回転装置16および/または第2回転装置18を駆動する。たとえばユーザAが首を縦(ピッチ方向)に振ると、第1回転装置16が頭部12を縦に振るように動かし、ユーザAが首を横(ヨー方向)に向けると、第1回転装置16または第2回転装置18が頭部12を横に向けるように動かす。これによりロボット10の周囲にいる人は、ユーザAがその場にいるかのような感覚をもって、ユーザAとコミュニケーションをとることができる。またユーザAはロボット10の頭部12を動かすことで、ロボット10の視点映像を変更することができる。
【0018】
図2は、ロボット10の利用場面の例を示す。図2は会議室の様子を示しており、複数のメンバがテーブルの周りに座り、テーブルの中央には、ユーザAの分身であるロボット10が配置されている。この例で、カメラ22が設けられている頭部12の前面は4人のメンバの方向を向いており、カメラ22は、画角内に入っている4人のメンバを撮影している。このとき4人のメンバは、表示部20に表示されているユーザAの顔画像またはアバター画像を見ることができる。ロボット10は、カメラ22が撮影した画像およびマイク26が取得した音声をリアルタイムでユーザの携帯端末装置100に送信する。
【0019】
携帯端末装置100は、スマートホンやタブレットなど、ユーザAが手に持って操作することのできる端末装置である。携帯端末装置100は、ユーザAを撮影するカメラ110、ユーザが発した音声を取得するマイク112、ロボット10が撮影した画像を表示する表示部114、ロボット10が取得した音声を出力するスピーカ116を備える。カメラ110は、表示部114に表示される画像を見ているユーザAを撮影可能な位置に設けられる。
【0020】
ユーザは、スピーカ116から出力される音声を聞き、表示部114に表示されている会議室の様子を見ながら、会議に参加できる。表示部114には、ロボット10のカメラ22が撮影している画像が表示され、図2に示す状況においては、会議室にいる4人のメンバが表示される。ユーザAが発言すると、携帯端末装置100は、マイク112が取得した音声をロボット10にリアルタイムで送信し、ロボット10は、スピーカ24からユーザAの音声を出力する。
【0021】
図3は、携帯端末装置100の機能ブロックを示す。携帯端末装置100は、制御部102、カメラ110、マイク112、表示部114、スピーカ116、慣性計測装置(以下、「IMU」と呼ぶ)118および通信部120を備える。制御部102は、画像データ、音声データ、センサデータなどの各種データや命令を処理して出力するメインプロセッサである。実施例の情報処理システム1において、ユーザAは、カメラ110および表示部114を自分に向けるように携帯端末装置100を手に持ち、カメラ110が、自分の顔を撮影できるようにする。
【0022】
カメラ110は、所定の周期(たとえば1/60秒)で撮影を行い、撮影した画像データを制御部102に供給する。マイク112は、携帯端末装置100の周囲の音を電気信号に変換して音声信号を生成し、制御部102は、音声信号を符号化して音声データを生成する。IMU118は、3軸の加速度センサおよび3軸のジャイロセンサを含む姿勢センサであり、各軸の加速度および各軸回りの角速度を周期的に計測して、計測した加速度値および角速度値を含むセンサデータを制御部102に供給する。
【0023】
通信部120は送信部122および受信部124を有し、アンテナを介してAP2に接続して、情報処理装置200との間でデータを送受信する。送信部122は、制御部102から画像データ、音声データおよびセンサデータを受け取り、情報処理装置200に送信する。また受信部124は、情報処理装置200から、ロボット10が撮影した画像データおよびロボット10が取得した音声データを受信して、制御部102に提供する。制御部102は、ロボット10が撮影した画像データを表示部114から表示させ、またロボット10が取得した音声データをスピーカ116から出力させる。表示部114は、液晶ディスプレイや有機ELディスプレイなどのディスプレイ装置であってよい。
【0024】
図4は、情報処理装置200の機能ブロックを示す。情報処理装置200は、受信部210、送信部212および制御部214を備え、制御部214は、取得部220、動き検出部230および制御信号生成部232を有する。取得部220は、画像データ取得部222、センサデータ取得部224および音声データ取得部226を有する。
【0025】
情報処理装置200はコンピュータを備え、コンピュータがプログラムを実行することによって、図4に示す様々な機能が実現される。コンピュータは、プログラムをロードするメモリ、ロードされたプログラムを実行する1つ以上のプロセッサ、補助記憶装置、その他のLSIなどをハードウェアとして備える。プロセッサは、半導体集積回路やLSIを含む複数の電子回路により構成され、複数の電子回路は、1つのチップ上に搭載されてよく、または複数のチップ上に搭載されてもよい。図4に示す機能ブロックは、ハードウェアとソフトウェアとの連携によって実現され、したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
【0026】
上記したように携帯端末装置100は、ユーザAの顔を撮影した画像データ、ユーザAが発した音声を含む音声データおよびIMU118が計測したセンサデータを情報処理装置200に送信する。情報処理装置200において、受信部210は、画像データ、音声データおよびセンサデータを受信する。画像データ取得部222は画像データを取得し、センサデータ取得部224はセンサデータを取得し、音声データ取得部226は音声データを取得する。送信部212は、音声データ取得部226が取得した音声データをロボット10に送信する。
【0027】
動き検出部230は、携帯端末装置100を手に持つユーザAの顔の向きを検出する。動き検出部230は、画像データ取得部222が取得した画像データからユーザAの顔画像を特定して、当該顔画像から顔の向きを検出する。具体的に動き検出部230は、顔の向きとして、顔のロール角、ピッチ角、ヨー角を検出する。ここでロール角は頭の傾き角、ピッチ角は頷き角、ヨー角は首振り角である。動き検出部230は、既知の手法を用いて顔の向きを検出してよく、たとえば顔画像における複数の部位の位置と、顔のモデル画像における複数の部位の位置の関係を利用して、顔のロール角、ピッチ角、ヨー角を検出してよい。なお当然のことながら動き検出部230は、他の手法を用いて、顔のロール角、ピッチ角、ヨー角を検出してよい。
【0028】
制御信号生成部232は、検出した顔の向きにもとづいて、ロボット10の頭部12のロール方向の回転角度、ピッチ方向の回転角度、ヨー方向の回転角度をそれぞれ定め、第1回転装置16および/または第2回転装置18を回転させる制御信号を生成する。なお実施例において第2回転装置18は、ヨー方向の回転のみを担当し、ロール方向およびピッチ方向の回転は担当しない。送信部212は、制御信号生成部232が生成した制御信号を、ロボット10に送信する。
【0029】
ロボット10は、ユーザAの分身として会議室に配置されるため、人と同様の動きをすることが望ましい。たとえば胴体部14に対して頭部12が無制限に横回転(ヨー方向の回転)するような動きは、人の動きを超越して違和感を与えるため、分身の動きとしては好ましくない。そこで第1回転装置16は、ロール方向、ピッチ方向、ヨー方向のそれぞれの回転角度に、それ以上回転できない限界角度である回転上限角度を設定している。
【0030】
回転上限角度は、機械構造的な限界角度として設計されてよいが、ソフトウェア的に設定されてもよい。ロール方向の回転上限角度α、ピッチ方向の回転上限角度β、ヨー方向の回転上限角度γは、人体骨格構造における首の回転角度制限値に応じて設定されることが好ましい。実施例では、ロール方向の回転上限角度αの絶対値が15度、ピッチ方向の回転上限角度βの絶対値が15度、ヨー方向の回転上限角度γの絶対値が45度に設定される。なおピッチ方向の回転上限角度βは、下向き方向と上向き方向とで、異なる角度を設定されてよい。
【0031】
制御信号生成部232は、各回転上限角度の範囲内で、各方向の回転角度を定める。たとえば動き検出部230が、顔の向きとして、ロール角が-10度、ピッチ角が20度、ヨー角が40度であることを検出したとき、制御信号生成部232は、以下のように、第1回転装置16による回転角度を定める。
<第1回転装置16による回転角度>
ロール方向の回転角度:-10度
ピッチ方向の回転角度: 15度
ヨー方向の回転角度 : 40度
【0032】
以上のように、制御信号生成部232は、各回転上限角度の範囲内で、各方向の回転角度を定める。この例では、顔のピッチ角が20度と検出されているが、ピッチ方向の回転上限角度βは15度であるため、制御信号生成部232は、ピッチ方向の回転角度を15度に定めている。制御信号生成部232は、第1回転装置16によるロール方向の回転角度を-10度、ピッチ方向の回転角度を15度、ヨー方向の回転角度を40度とする制御信号を生成し、送信部212は、制御信号をロボット10に送信する。
【0033】
図5は、ロボット10の機能ブロックを示す。ロボット10は、制御部30、カメラ22、マイク26、表示部20、スピーカ24、第1回転装置16、第2回転装置18および通信部32を備える。制御部30は、画像データ、音声データ、制御信号などの各種データや信号、命令を処理して出力するメインプロセッサである。
【0034】
通信部32は送信部34および受信部36を有し、アンテナを介してAP3に接続して、情報処理装置200との間でデータまたは信号を送受信する。受信部36は、情報処理装置200から、携帯端末装置100が取得した音声データと、第1回転装置16および/または第2回転装置18を回転させる制御信号を受信して、制御部30に提供する。制御部30は、携帯端末装置100が取得した音声データをスピーカ24から出力させる。また制御部30は、ユーザAの顔画像を表示部20に表示する。表示される画像は、リアルタイムコミュニケーションの開始前に携帯端末装置100から送信されたユーザAの顔の静止画像であってよく、またはアバターの画像であってもよい。表示部20は、液晶ディスプレイや有機ELディスプレイなどのディスプレイ装置であってよい。
【0035】
図6は、第1回転装置16による頭部12の回転方向を説明するための図である。制御信号は、ロール方向の回転角度、ピッチ方向の回転角度、ヨー方向の回転角度を定め、制御部30は、制御信号にしたがって第1回転装置16を駆動する。制御部30は、上記した制御信号にもとづいて、ロール方向の回転角度が-10度、ピッチ方向の回転角度が15度、ヨー方向の回転角度が40度となるように、第1回転装置16を駆動する。
【0036】
カメラ22は、所定の周期(たとえば1/60秒)で撮影を行い、撮影した画像データを制御部30に供給する。マイク26は、ロボット10の周囲の音を電気信号に変換して音声信号を生成し、制御部30は、音声信号を符号化して音声データを生成する。送信部34は、制御部30から画像データおよび音声データを受け取り、情報処理装置200に送信する。情報処理装置200は、受信した画像データおよび音声データを携帯端末装置100に送信する。
【0037】
携帯端末装置100において、受信部124は、情報処理装置200から、ロボット10が撮影した画像データおよびロボット10が取得した音声データを受信して、制御部102に提供する。制御部102は、ロボット10が撮影した画像データを表示部114から表示させ、またロボット10が取得した音声データをスピーカ116から出力させる。これによりユーザAは、会議室におけるメンバの様子を見ることができ、またメンバの発言を聞くことができる。
【0038】
以下、ヨー方向におけるロボット10の回転動作について説明する。以下に示す動作例では、説明の便宜上、顔のロール角、ピッチ角を0度とする。
動き検出部230が、顔の向きとして、ロール角が0度、ピッチ角が0度、ヨー角が45度であることを検出した場合、制御信号生成部232は、以下のように、第1回転装置16による回転角度を定める。
<第1回転装置16による回転角度>
ロール方向の回転角度: 0度
ピッチ方向の回転角度: 0度
ヨー方向の回転角度 :45度
制御信号生成部232は、第1回転装置16によるロール方向の回転角度を0度、ピッチ方向の回転角度を0度、ヨー方向の回転角度を45度とする制御信号を生成し、送信部212は、制御信号をロボット10に送信する。
【0039】
図7(a)~(b)は、ロボット10を上面から見た状態の例を示す。図7(a)は、第1回転装置16によるヨー方向の回転角度が0度の状態を示し、上面視において、頭部12と胴体部14とが重なっている。点a、b、c、dは、それぞれ頭部12の上面の頂点を示している。
図7(b)は、制御部30が、ロール方向の回転角度を0度、ピッチ方向の回転角度を0度、ヨー方向の回転角度を45度とする制御信号にもとづいて、第1回転装置16を駆動した状態を示す。第1回転装置16は、胴体部14に対して頭部12を、正のヨー方向に45度回転させている。点e、f、g、hは、それぞれ胴体部14の上面の頂点を示している。
【0040】
この後、動き検出部230が、顔の向きとして、ロール角が0度、ピッチ角が0度、ヨー角が50度であることを検出すると、制御信号生成部232は、以下のように第1回転装置16による回転角度を定める。
<第1回転装置16による回転角度>
ロール方向の回転角度: 0度
ピッチ方向の回転角度: 0度
ヨー方向の回転角度 :45度
顔のヨー角が50度と検出されているが、ヨー方向の回転上限角度γは45度であるため、制御信号生成部232は、ヨー方向の回転角度を45度に定めている。
【0041】
このとき制御信号生成部232は、第2回転装置18による回転角度を、以下のように定める。
<第2回転装置18による回転角度>
ヨー方向の回転角度 :5度
以上のように、顔のヨー角が45度を超える場合、制御信号生成部232は、第1回転装置16によるヨー方向の回転角度を上限の45度、第2回転装置18によるヨー方向の回転角度を5度に定めることで、トータルで50度のヨー方向の回転角度を実現している。制御信号生成部232は、第1回転装置16によるロール方向の回転角度を0度、ピッチ方向の回転角度を0度、ヨー方向の回転角度を45度、第2回転装置18によるヨー方向の回転角度を5度とする制御信号を生成し、送信部212は、制御信号をロボット10に送信する。
【0042】
図8(a)は、ロボット10を上面から見た状態の例を示す。制御部30が、第1回転装置16によるヨー方向の回転角度を45度、第2回転装置18によるヨー方向の回転角度を5度とする制御信号にもとづいて、第1回転装置16の駆動状態を維持しつつ、第2回転装置18を回転させる。具体的には図7(b)に示す状態から、第2回転装置18が、ロボット10の接地面に対して胴体部14を、正のヨー方向に5度回転させている。第1回転装置16は、胴体部14に対して頭部12を正のヨー方向に45度回転させた状態を維持する。
【0043】
この後、ユーザAがさらに首を正のヨー方向に回転し、動き検出部230が、ロール角が0度、ピッチ角が0度、ヨー角が90度であることを検出したものとする。制御信号生成部232は、以下のように第1回転装置16による回転角度を定める。
<第1回転装置16による回転角度>
ロール方向の回転角度: 0度
ピッチ方向の回転角度: 0度
ヨー方向の回転角度 :45度
【0044】
このとき制御信号生成部232は、第2回転装置18による回転角度を、以下のように定める。
<第2回転装置18による回転角度>
ヨー方向の回転角度 :45度
制御信号生成部232は、第1回転装置16によるヨー方向の回転角度を上限の45度、第2回転装置18によるヨー方向の回転角度を45度に定めることで、トータルで90度のヨー方向の回転角度を実現している。制御信号生成部232は、第1回転装置16によるロール方向の回転角度を0度、ピッチ方向の回転角度を0度、ヨー方向の回転角度を45度、第2回転装置18によるヨー方向の回転角度を45度とする制御信号を生成し、送信部212は、制御信号をロボット10に送信する。
【0045】
図8(b)は、ロボット10を上面から見た状態の例を示す。制御部30が、第1回転装置16によるヨー方向の回転角度を45度、第2回転装置18によるヨー方向の回転角度を45度とする制御信号にもとづいて、第1回転装置16の駆動状態を維持しつつ、第2回転装置18をさらに回転させている。第2回転装置18は、ロボット10の接地面に対して胴体部14を、正のヨー方向に45度回転させている。第1回転装置16は、胴体部14に対して頭部12を正のヨー方向に45度回転させた状態を維持する。
【0046】
このようにロボット10においては、制御部30が、第1回転装置16により頭部12を回転させた後、第2回転装置18により胴体部14を回転させる。実施例では制御部30が、第1回転装置16により頭部12を回転上限角度まで回転させた後、第2回転装置18により胴体部14を回転させている。この動作制御によると、ロボット10は、頭部12を胴体部14に対して横方向に45度ねじった後、ねじった状態のまま体全体を横方向に回転させるため、人が横を向くときの動きに近い動作を実現できる。
【0047】
制御信号生成部232は、ヨー方向の回転角度が45度を超える場合、第1回転装置16による回転角度を45度に維持して、第2回転装置18による回転角度を(ヨー方向回転角度-45度)とする制御信号を生成する。一方、制御信号生成部232は、頭部12のヨー方向の回転角度が45度以下である場合、第2回転装置18による回転角度は0度に設定し、第1回転装置16による回転角度をヨー方向回転角度とする制御信号を生成する。このように第1回転装置16および第2回転装置18を動作制御することで、人が横を向くときの動作に近い動作を実現できる。
【0048】
なお上記した例では、制御信号生成部232が、動き検出部230が検出した顔のロール角、ピッチ角、ヨー角と一致するように、ロボット10の頭部12のロール方向の回転角度、ピッチ方向の回転角度、ヨー方向の回転角度をそれぞれ定めている。別の例では、制御信号生成部232が、動き検出部230が検出した顔のロール角、ピッチ角、ヨー角のR倍に一致するように、ロボット10の頭部12のロール方向の回転角度、ピッチ方向の回転角度、ヨー方向の回転角度をそれぞれ定めてもよい。ここでRは1未満の定数であってよい。
【0049】
実施例の動き検出部230は、撮影画像から検出されるユーザAの顔の向きに加えて、IMU118が計測したセンサデータを加味して、ユーザAの顔のロール角、ピッチ角、ヨー角を検出してもよい。具体的に動き検出部230は、携帯端末装置100の基準姿勢に対する携帯端末装置100の向きを特定して、ユーザAの顔の向きを検出する。携帯端末装置100の基準姿勢は、リアルタイムコミュニケーションの開始前に、ユーザAが頭を鉛直方向に維持した姿勢で携帯端末装置100を手に持ち、自身の顔に正対させた姿勢を登録することで設定されてよい。
【0050】
動き検出部230は、センサデータ取得部224が取得したセンサデータを用いて、基準姿勢に対する携帯端末装置100の向きを検出する。具体的に動き検出部230は、携帯端末装置100の向きとして、基準姿勢に対するロール角、ピッチ角、ヨー角を検出する。実施例においてユーザAは、携帯端末装置100を自身の顔に正対するように把持して、会議に参加する(図1参照)。そのためユーザAの顔と携帯端末装置100との相対的な位置関係は、基本的には変化しない。そこで実施例では、携帯端末装置100の向きの変化を、携帯端末装置100に正対するユーザAの顔の向きの変化として扱う。
【0051】
動き検出部230は、画像データにもとづいて、ユーザの顔の向きを、以下のように検出する。
ロール角:Ra
ピッチ角:Pa
ヨー角 :Ya
動き検出部230は、センサデータにもとづいて、携帯端末装置100の向き(つまりはユーザの顔の向き)を、以下のように検出する。
ロール角:Rb
ピッチ角:Pb
ヨー角 :Yb
【0052】
制御信号生成部232は、頭部12のロール方向の回転角度、ピッチ方向の回転角度、ヨー方向の回転角度を、以下のように定めてよい。
・ ロール方向の回転角度
=s1×Ra+s2×Rb
ここでs1、s2は、1以下の係数である。センサデータのロール方向の回転成分をロボット10の頭部12の動きに反映すると、不自然な動きが生成される場合には、s2を0ないしは0に近い値に設定してよい。また以下に示す理由からs1=0.75と設定されてよい。
【0053】
・ ピッチ方向の回転角度
=t1×Pa+t2×Pb
ここでt1、t2は、1以下の係数である。一般に、センサデータにもとづく携帯端末装置100の向きの検出精度が、画像データにもとづく顔の向きの検出精度よりも高いため、t1<t2の関係が定められてよい。たとえばt1=0.75、t2=1.0と設定されてよい。
【0054】
・ ヨー方向の回転角度
=u1×Ya+u2×Yb
ここでu1、u2は、1以下の係数である。上記理由からu1<u2の関係が定められてよく、たとえばu1=0.75、u2=1.0と設定されてよい。
【0055】
制御信号生成部232が、ユーザAの顔画像から検出される顔の向きだけでなく、センサデータから検出される携帯端末装置100の向きを加味して、頭部12の向きを定めることで、ユーザAの首の動きを高精度に反映した制御信号を生成することが可能となる。
【0056】
なお動き検出部230は、センサデータの微小な揺れを無視して、携帯端末装置100の向きを検出してもよい。会議中、ユーザAは常に携帯端末装置100を把持しているため、疲れからくる腕の揺れが携帯端末装置100に伝わることがある。そのため動き検出部230はセンサデータを処理するための所定の閾値を設定し、閾値を下回るセンサデータの振動成分を無視するようにしてもよい。
【0057】
以上、本発明を実施例をもとに説明した。この実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【0058】
実施例において、携帯端末装置100は、音声データを、情報処理装置200経由でロボット10に送信するが、変形例では、情報処理装置200を経由することなく、音声データを直接ロボット10に送信してもよい。また実施例においてロボット10は、画像データおよび音声データを、情報処理装置200経由で携帯端末装置100に送信するが、変形例では、情報処理装置200を経由することなく、画像データおよび音声データを直接携帯端末装置100に送信してもよい。
【0059】
実施例において、ロボット10の制御部30は、ユーザAの顔の静止画像を表示部20に表示することを説明したが、携帯端末装置100が撮影した画像データをロボット10に提供して、制御部30が、ユーザAの顔の動画像を表示部20に表示してもよい。
【0060】
実施例では、ヨー方向において、第1回転装置16が頭部12を回転上限角度まで回転した後に、第2回転装置18が胴体部14を接地面に対して回転させることを説明した。頭部12が回転上限角度まで回転した状態が所定時間継続すると、制御部30は、回転した状態を戻す方向(逆方向)に第1回転装置16を回転させ、同時に第2回転装置18を順方向に同じ回転速度で回転させることで、頭部12と胴体部14とがねじれた状態を解消してもよい。
【符号の説明】
【0061】
1・・・情報処理システム、10・・・ロボット、12・・・頭部、14・・・胴体部、16・・・第1回転装置、18・・・第2回転装置、20・・・表示部、22・・・カメラ、24・・・スピーカ、26・・・マイク、30・・・制御部、32・・・通信部、34・・・送信部、36・・・受信部、100・・・携帯端末装置、102・・・制御部、110・・・カメラ、112・・・マイク、114・・・表示部、116・・・スピーカ、118・・・IMU、120・・・通信部、122・・・送信部、124・・・受信部、200・・・情報処理装置、210・・・受信部、212・・・送信部、214・・・制御部、220・・・取得部、222・・・画像データ取得部、224・・・センサデータ取得部、226・・・音声データ取得部、230・・・動き検出部、232・・・制御信号生成部。
図1
図2
図3
図4
図5
図6
図7
図8