(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-11
(45)【発行日】2024-12-19
(54)【発明の名称】反射行動を実行可能な自律行動型ロボット
(51)【国際特許分類】
B25J 13/08 20060101AFI20241212BHJP
【FI】
B25J13/08 Z
(21)【出願番号】P 2019550450
(86)(22)【出願日】2018-10-31
(86)【国際出願番号】 JP2018040484
(87)【国際公開番号】W WO2019088160
(87)【国際公開日】2019-05-09
【審査請求日】2021-11-01
【審判番号】
【審判請求日】2023-04-28
(31)【優先権主張番号】P 2017211892
(32)【優先日】2017-11-01
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】515337268
【氏名又は名称】GROOVE X株式会社
(72)【発明者】
【氏名】林 要
【合議体】
【審判長】本庄 亮太郎
【審判官】鈴木 貴雄
【審判官】堀内 亮吾
(56)【参考文献】
【文献】特開2006-110707(JP,A)
【文献】特開2003-266353(JP,A)
【文献】国際公開第2017/175559(WO,A1)
【文献】特開2003-71761(JP,A)
【文献】特開2006-142470(JP,A)
【文献】前川裕明ほか2名,“多階層制御回路を用いた高速制御システム”,情報処理学会研究報告,社団法人情報処理学会,2008年1月,p.7~12
(58)【調査した分野】(Int.Cl.,DB名)
B25J 1/00 - 21/02
(57)【特許請求の範囲】
【請求項1】
ロボットのモーションを選択する動作制御部と、
前記動作制御部により選択されたモーションを実行する駆動機構と、を備え、
前記動作制御部は、
センサの検出値が閾値を超えたとき、前記センサにあらかじめ対応づけられるリアクシ
ョン・モーションを選択する低次制御回路と、
前記センサの検出値に応じて、ロボットの行動特性を変化させる高次制御回路と、を含
み、
前記高次制御回路は、センサに対応づけるべきリアクション・モーションを設定し、
前記低次制御回路は、センサの検出値が閾値を超えたとき、前記高次制御回路により前記センサに対応づけられたリアクション・モーションを選択する
ことを特徴とする自律行動型ロボット。
【請求項2】
ロボットのモーションを選択する動作制御部と、
前記動作制御部により選択されたモーションを実行する駆動機構と、を備え、
前記動作制御部は、
センサの検出値が閾値を超えたとき、前記センサにあらかじめ対応づけられるリアクシ
ョン・モーションを選択する低次制御回路と、
前記センサの検出値に応じて、ロボットの行動特性を変化させる高次制御回路と、を含み、
前記高次制御回路は、前記閾値を更新することを特徴とする自律行動型ロボット。
【請求項3】
前記高次制御回路は、前記検出値に応じて、ロボットのノーマル・モーションを選択し、
前記動作制御部は、前記低次制御回路に選択されたリアクション・モーションと前記高
次制御回路に選択されたノーマル・モーションとを前記駆動機構に実行させ、かつ、前記
検出値が前記閾値を超えると
きには、ノーマル・モーションよりもリアクション・モーションを優先実行させることを
特徴とする請求項1
又は2に記載の自律行動型ロボット。
【請求項4】
複数のセンサそれぞれに対応して複数の前記低次制御回路が設けられ、
前記高次制御回路は、前記複数の低次制御回路から出力される検出値の組み合わせに応
じて、ロボットのノーマル・モーションを選択することを特徴とする請求項1
又は2に記載の自
律行動型ロボット。
【請求項5】
前記低次制御回路は、1種類のセンサの検出値に応じて、リアクション・モーションを選
択し、
前記高次制御回路は、複数種類のセンサの検出値の組み合わせに応じて、ロボットの行
動特性を変化させることを特徴とする請求項1
又は2に記載の自律行動型ロボット。
【請求項6】
前記低次制御回路は、センサの検出値が前記閾値を超えたとき、センサにあらかじめ対応づけられる典型行動としてのリアクション・モーションを実行させ、
前記高次制御回路は、センサの検出値に応じて感情パラメータを変化させ、前記感情
パラメータの変化に応じてロボットの行動特性を変化させることを特徴とする請求項1
又は2に
記載の自律行動型ロボット。
【請求項7】
前記低次制御回路は、前記リアクション・モーションとして、前記駆動機構に含まれる
アクチュエータへの通電を停止させることを特徴とする請求項1
又は2に記載の自律行動型ロボ
ット。
【請求項8】
前記低次制御回路と、前記高次制御回路とは、ハードウェアとして別個に構成されて
いることを特徴とする請求項1~
7のうちいずれか1項に記載の自律行動型ロボット。
【請求項9】
複数のセンサのそれぞれに対応して複数の前記低次制御回路がハードウェアとして別
個に設けられていることを特徴とする請求項1~
8のうちいずれか1項に記載の自律行動型
ロボット。
【請求項10】
前記高次制御回路は、自身のおかれた環境や状態に応じて前記閾値を更新することを特徴とする請求項1~9のうちいずれか1項に記載の自律行動型ロボット。
【請求項11】
前記高次制御回路は、単位時間当たり前記閾値以上のセンサ検出値を検出した回数が所定回数を超える場合、前記閾値よりも大きな閾値を設定することを特徴とする請求項1~10のうちいずれか1項に記載の自律行動型ロボット。
【請求項12】
前記高次制御回路は、単位時間当たり前記閾値以下のセンサ検出値を検出した回数が所定回数以内である場合、前記閾値よりも小さな閾値を設定することを特徴とする請求項1~11のうちいずれか1項に記載の自律行動型ロボット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、内部状態または外部環境に応じて自律的に行動選択するロボット、に関する。
【背景技術】
【0002】
人間は、癒やしを求めてペットを飼う。その一方、ペットの世話をする時間を十分に確保できない、ペットを飼える住環境にない、アレルギーがある、死別がつらい、といったさまざまな理由により、ペットをあきらめている人は多い。もし、ペットの役割が務まるロボットがあれば、ペットを飼えない人にもペットが与えてくれるような癒やしを与えられるかもしれない(特許文献1、2参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2000-323219号公報
【文献】国際公開第2017/169826号
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年、ロボット技術は急速に進歩しつつあるが、ペットのような伴侶としての存在感を実現するには至っていない。ロボットに自由意志があるとは思えないからである。人間は、ペットの自由意志があるとしか思えないような行動を観察することにより、ペットに自由意志の存在を感じ、ペットに共感し、ペットに癒される。
【0005】
また、自由意志だけでなく、「本能」も生物を特徴づけるものである。本能とは、意識的な判断をともなうことなく、環境からの刺激によって引き起こされる生得的な行動様式である。危険回避はその代表例である。本能に基づく反射的な行動(以下、「反射行動」とよぶ)は、無意識ゆえに単純であり、即時的である。自由意志を感じさせる複雑多様な行動(以下、「意識行動」とよぶ)だけでなく、外部からの刺激に対する素早い反射行動もロボットに生物のような存在感をもたせる上で重要である。本発明者らの検討によれば、ロボットが刺激を受けてから反射行動を開始するまでの時間(タイムラグ)が200ミリ秒を超えると、反射行動として不自然に見えてしまうことがわかった。
【0006】
本発明は上記課題認識に基づいて完成された発明であり、その主たる目的は、外部で発生するさまざまな事象に対するロボットの反射行動を効率的に制御するための技術、を提供することにある。
【課題を解決するための手段】
【0007】
本発明のある態様における自律行動型ロボットは、ロボットのモーションを選択する動作制御部と、動作制御部により選択されたモーションを実行する駆動機構と、を備える。
動作制御部は、センサの検出値が閾値を超えたとき、センサにあらかじめ対応づけられるリアクション・モーションを選択する低次制御回路と、センサの検出値に応じて、ロボットの行動特性を変化させる高次制御回路と、を含む。
【発明の効果】
【0008】
本発明によれば、ロボットに自然な反射行動を実行させやすくなる。
【図面の簡単な説明】
【0009】
【
図1】ロボットによる反射行動の実現方法を説明するための概念図である。
【
図2】
図2(a)はロボットの正面外観図である。
図2(b)は、ロボットの側面外観図である。
【
図3】ロボットの構造を概略的に表す断面図である。
【
図4】基本構成におけるロボットのハードウェア構成図である。
【
図6】本実施形態におけるロボットのハードウェア構成図である。
【
図7】低次制御回路、高次制御回路および動作制御部の対応関係を示す模式図である。
【
図10】ロボットの行動制御システムの回路構成図である。
【発明を実施するための形態】
【0010】
図1は、ロボット100による反射行動の実現方法を説明するための概念図である。
生物は瞬間的に強い刺激を受けたときに反射的な行動をとる。たとえば、身体を叩かれれば身を引き、大きな音がすれば身を縮める。本実施形態におけるロボット100は、こうした反射行動を実現するための構成を備える。ロボット100は、外部環境からさまざまな刺激を受ける。ロボット100は、センサの検出値(以下、単に「センサ値」とよぶ)により外部事象(イベント)を認識し、行動を選択する。ロボット100の行動(モーション)は、「ノーマル・モーション」と「リアクション・モーション」の2種類に大別される。
【0011】
ノーマル・モーションは、生物の意識行動を模した行動である。リアクション・モーションは、生物の無意識的行動(反射行動)を模した行動である。リアクション・モーションはノーマル・モーションよりも単純である代わりに即時性(高速応答性)が求められる。
【0012】
ロボット100は、低次制御回路250と高次制御回路252を含む。高次制御回路252としては、CPU(Central Processing Unit)などの汎用プロセッサが想定される。高次制御回路252は、ソフトウェアにより複雑な行動表現が可能である。人が「瞬間的反応」と認識する反応時間(事象の発生から行動開始までの時間)は、一般的には200ミリ秒以内と言われる。したがって、ロボット100の反応時間が200ミリ秒を超えると、瞬間的反応に見えなくなる。
【0013】
高次制御回路252は多様な処理を実行することが予定される電子回路であるため、高次制御回路252が指示を受けてから処理を開始するまでの時間はロボット100の状況に応じてばらつきが生じる。本実施形態においては、一定以上の刺激に対して、常時、規定時間以内の処理を実行するための低次制御回路250を設ける。低次制御回路250は、高次制御回路252とはハードウェア的に独立しているため、高次制御回路252にかかる処理負荷に影響されることはない。低次制御回路250は、センサから順次届くセンサ値を予め定められた条件と比較することで、センサ値の異常を検知する。低次制御回路250は、異常を検知したときには即座にリアクション・モーションの実行を指示する。低次制御回路250としては、専用設計のマイクロ・コントローラが想定されるが、汎用のマイクロプロセッサでプログラムを実行することで実現されてもよい。低次制御回路250は、電子部品の組み合わせとして形成されてもよい。低次制御回路250は、高次制御回路252に比べると処理内容が定型化・典型化されるため、高次制御回路252よりも外部事象に対して高速に反応できる。
【0014】
ロボット100は、外部刺激をセンサ値SA(アナログデータ)として検出する。本実施形態においては、センサ値SAが閾値(以下、「反射閾値」とよぶ)を越えたとき、低次制御回路250はあらかじめ定義されたリアクション・モーションRの実行を指示する。たとえば、大きな音が聞こえたとき、低次制御回路250はロボット100の身体を震わせることでロボット100が大きな音にびっくりした様子を表現する。
【0015】
また、低次制御回路250は、アナログデータのセンサ値SAをデジタルデータのセンサ値SDにA/D変換(Analog/Digital Conversion)し、センサ値SDを高次制御回路252に送信する。高次制御回路252は、外部事象をセンサ値SD(デジタルデータ)により認識し、ノーマル・モーションNの実行を指示する。たとえば、ユーザP1が怒鳴り声を発したとき、高次制御回路252はユーザP1に対する親密度を低下させ、ユーザP1から離れる、着座するなどさまざまなノーマル・モーションNを選択する。
【0016】
リアクション・モーションRとノーマル・モーションNを同時に実行可能な状況においては、リアクション・モーションRがノーマル・モーションNに優先する。これを「低次優先の原則」とよぶ。低次制御回路250は、高次制御回路252に優先して外部事象について判断する機会を与えられ、必要に応じてリアクション・モーションRを優先的に実行することにより、即時的な反射行動を実現する。
以下、ロボット100の基本構成について
図2から
図5に関連して説明したあと、本実施形態における反応行動の実装方法を中心として説明する。
【0017】
[基本構成]
図2(a)は、ロボット100の正面外観図である。
図2(b)は、ロボット100の側面外観図である。
本実施形態におけるロボット100は、外部環境および内部状態に基づいて行動を決定する自律行動型のロボットである。外部環境は、カメラやサーモセンサなど各種のセンサにより認識される。内部状態はロボット100の感情を表現するさまざまなパラメータとして定量化される。ロボット100は、オーナー家庭の家屋内を行動範囲とする。以下、ロボット100に関わる人間を「ユーザ」とよぶ。
【0018】
ロボット100のボディ104は、全体的に丸みを帯びた形状を有し、ウレタンやゴム、樹脂、繊維などやわらかく弾力性のある素材により形成された外皮を含む。ロボット100に服を着せてもよい。ロボット100の総重量は5~15キログラム程度、身長は0.5~1.2メートル程度である。適度な重さと丸み、柔らかさ、手触りのよさ、といった諸属性により、ユーザがロボット100を抱きかかえやすく、かつ、抱きかかえたくなるという効果が実現される。
【0019】
ロボット100は、一対の前輪102(左輪102a,右輪102b)と、一つの後輪103を含む。前輪102が駆動輪であり、後輪103が従動輪である。前輪102は、操舵機構を有しないが、回転速度や回転方向を個別に制御可能とされている。後輪103は、キャスターであり、ロボット100を前後左右へ移動させるために回転自在となっている。後輪103はオムニホイールであってもよい。
【0020】
前輪102および後輪103は、駆動機構(回動機構、リンク機構)によりボディ104に完全収納できる。走行時においても各車輪の大部分はボディ104に隠れているが、各車輪がボディ104に完全収納されるとロボット100は移動不可能な状態となる。すなわち、車輪の収納動作にともなってボディ104が降下し、床面Fに着座する。この着座状態においては、ボディ104の底部に形成された平坦状の着座面108(接地底面)が床面Fに当接する。
【0021】
ロボット100は、2つの手106を有する。手106には、モノを把持する機能はない。手106は上げる、振る、振動するなど簡単な動作が可能である。2つの手106も個別制御可能である。
【0022】
目110は、液晶素子または有機EL素子による画像表示が可能である。ロボット100は、音源方向を特定可能なマイクロフォンアレイや超音波センサなどさまざまなセンサを搭載する。また、スピーカーを内蔵し、簡単な音声を発することもできる。
【0023】
ロボット100の頭部にはツノ112が取り付けられる。上述のようにロボット100は軽量であるため、ユーザはツノ112をつかむことでロボット100を持ち上げることも可能である。ツノ112には全天球カメラが取り付けられ、ロボット100の上部全域を一度に撮像可能である。
【0024】
図3は、ロボット100の構造を概略的に表す断面図である。
図3に示すように、ロボット100のボディ104は、ベースフレーム308、本体フレーム310、一対の樹脂製のホイールカバー312および外皮314を含む。ベースフレーム308は、金属からなり、ボディ104の軸芯を構成するとともに内部機構を支持する。ベースフレーム308は、アッパープレート332とロアプレート334とを複数のサイドプレート336により上下に連結して構成される。複数のサイドプレート336間には通気が可能となるよう、十分な間隔が設けられる。ベースフレーム308の内方には、バッテリー118、制御回路342および各種アクチュエータが収容されている。
【0025】
本体フレーム310は、樹脂材からなり、頭部フレーム316および胴部フレーム318を含む。頭部フレーム316は、中空半球状をなし、ロボット100の頭部骨格を形成する。胴部フレーム318は、段付筒形状をなし、ロボット100の胴部骨格を形成する。胴部フレーム318は、ベースフレーム308と一体に固定される。頭部フレーム316は、胴部フレーム318の上端部に相対変位可能に組み付けられる。
【0026】
頭部フレーム316には、ヨー軸320、ピッチ軸322およびロール軸324の3軸と、各軸を回転駆動するためのアクチュエータ326が設けられる。アクチュエータ326は、各軸を個別に駆動するための複数のサーボモータを含む。首振り動作のためにヨー軸320が駆動され、頷き動作のためにピッチ軸322が駆動され、首を傾げる動作のためにロール軸324が駆動される。
【0027】
頭部フレーム316の上部には、ヨー軸320を支持するプレート325が固定されている。プレート325には、上下間の通気を確保するための複数の通気孔327が形成される。
【0028】
頭部フレーム316およびその内部機構を下方から支持するように、金属製のベースプレート328が設けられる。ベースプレート328は、クロスリンク機構329(パンタグラフ機構)を介してプレート325と連結される一方、ジョイント330を介してアッパープレート332(ベースフレーム308)と連結される。
【0029】
胴部フレーム318は、ベースフレーム308と車輪駆動機構370を収容する。車輪駆動機構370は、回動軸378およびアクチュエータ379を含む。胴部フレーム318の下半部は、ホイールカバー312との間に前輪102の収納スペースSを形成するために小幅とされる。
【0030】
外皮314は、ウレタンゴムからなり、本体フレーム310およびホイールカバー312を外側から覆う。手106は、外皮314と一体成形される。外皮314の上端部には、外気を導入するための開口部390が設けられる。
【0031】
図4は、ロボット100のハードウェア構成図である。
ロボット100は、内部センサ128、通信機126、記憶装置124、プロセッサ122、駆動機構120およびバッテリー118を含む。プロセッサ122と記憶装置124は、制御回路342に含まれる。各ユニットは電源線130および信号線132により互いに接続される。バッテリー118は、電源線130を介して各ユニットに電力を供給する。各ユニットは信号線132により制御信号を送受する。バッテリー118は、リチウムイオン二次電池であり、ロボット100の動力源である。
【0032】
内部センサ128は、ロボット100が内蔵する各種センサの集合体である。具体的には、カメラ(全天球カメラ)、マイクロフォンアレイ、測距センサ(赤外線センサ)、サーモセンサ、タッチセンサ、加速度センサ、ニオイセンサなどである。タッチセンサは、外皮314と本体フレーム310の間に設置され、ユーザのタッチを検出する。ニオイセンサは、匂いの元となる分子の吸着によって電気抵抗が変化する原理を応用した既知のセンサである。
【0033】
通信機126は、各種の外部機器を対象として無線通信を行う通信モジュールである。記憶装置124は、不揮発性メモリおよび揮発性メモリにより構成され、コンピュータプログラムや各種設定情報を記憶する。プロセッサ122は、コンピュータプログラムの実行手段である。駆動機構120は、複数のアクチュエータおよび上述した車輪駆動機構370を含む。このほかには、表示器やスピーカーなども搭載される。
【0034】
駆動機構120は、主として、車輪(前輪102)と頭部(頭部フレーム316)を制御する。駆動機構120は、ロボット100の移動方向や移動速度を変化させるほか、車輪(前輪102および後輪103)を昇降させることもできる。車輪が上昇すると、車輪はボディ104に完全に収納され、ロボット100は着座面108にて床面Fに当接し、着座状態となる。また、駆動機構120は、ワイヤ134を介して、手106を制御する。
【0035】
図5は、ロボットシステム300の機能ブロック図である。
ロボットシステム300は、ロボット100、サーバ200および複数の外部センサ114を含む。ロボット100およびサーバ200の各構成要素は、CPU(Central Processing Unit)および各種コプロセッサなどの演算器、メモリやストレージといった記憶装置、それらを連結する有線または無線の通信線を含むハードウェアと、記憶装置に格納され、演算器に処理命令を供給するソフトウェアによって実現される。コンピュータプログラムは、デバイスドライバ、オペレーティングシステム、それらの上位層に位置する各種アプリケーションプログラム、また、これらのプログラムに共通機能を提供するライブラリによって構成されてもよい。以下に説明する各ブロックは、ハードウェア単位の構成ではなく、機能単位のブロックを示している。
ロボット100の機能の一部はサーバ200により実現されてもよいし、サーバ200の機能の一部または全部はロボット100により実現されてもよい。
【0036】
家屋内にはあらかじめ複数の外部センサ114が設置される。サーバ200には、外部センサ114の位置座標が登録される。ロボット100の内部センサ128および複数の外部センサ114から得られる情報に基づいて、サーバ200がロボット100の基本行動を決定する。外部センサ114はロボット100の感覚器を補強するためのものであり、サーバ200はロボット100の頭脳を補強するためのものである。ロボット100の通信機126が外部センサ114と定期的に通信し、サーバ200は外部センサ114によりロボット100の位置を特定する(特許文献2も参照)。
【0037】
(サーバ200)
サーバ200は、通信部204、データ処理部202およびデータ格納部206を含む。
通信部204は、外部センサ114およびロボット100との通信処理を担当する。データ格納部206は各種データを格納する。データ処理部202は、通信部204により取得されたデータおよびデータ格納部206に格納されるデータに基づいて各種処理を実行する。データ処理部202は、通信部204およびデータ格納部206のインタフェースとしても機能する。
【0038】
データ格納部206は、モーション格納部232と個人データ格納部218を含む。
ロボット100は、複数の動作パターン(モーション)を有する。手106を震わせる、蛇行しながらオーナーに近づく、首をかしげたままオーナーを見つめる、などさまざまなモーションが定義される。
【0039】
モーション格納部232は、モーションの制御内容を定義する「モーションファイル」を格納する。各モーションは、モーションIDにより識別される。モーションファイルは、ロボット100のモーション格納部160にもダウンロードされる。どのモーションを実行するかは、サーバ200で決定されることもあるし、ロボット100で決定されることもある。
【0040】
ロボット100のモーションの多くは、複数の単位モーションを含む複合モーションとして構成される。たとえば、ロボット100がオーナーに近づくとき、オーナーの方に向き直る単位モーション、手を上げながら近づく単位モーション、体を揺すりながら近づく単位モーション、両手を上げながら着座する単位モーションの組み合わせとして表現されてもよい。このような4つのモーションの組み合わせにより、「オーナーに近づいて、途中で手を上げて、最後は体をゆすった上で着座する」というモーションが実現される。モーションファイルには、ロボット100に設けられたアクチュエータの回転角度や角速度などが時間軸に関連づけて定義される。モーションファイル(アクチュエータ制御情報)にしたがって、時間経過とともに各アクチュエータを制御することで様々なモーションが表現される。
【0041】
先の単位モーションから次の単位モーションに変化するときの移行時間を「インターバル」とよぶ。インターバルは、単位モーション変更に要する時間やモーションの内容に応じて定義されればよい。インターバルの長さは調整可能である。
以下、いつ、どのモーションを選ぶか、モーションを実現する上での各アクチュエータの出力調整など、ロボット100の行動制御に関わる設定のことを「行動特性」と総称する。ロボット100の行動特性は、モーション選択アルゴリズム、モーションの選択確率、モーションファイル等により定義される。
【0042】
モーション格納部232は、モーションファイルのほか、各種のイベントが発生したときに実行すべきモーションを定義するモーション選択テーブルを格納する。モーション選択テーブルにおいては、イベントに対して1以上のモーションとその選択確率が対応づけられる。
【0043】
個人データ格納部218は、ユーザの情報を格納する。具体的には、ユーザに対する親密度とユーザの身体的特徴・行動的特徴を示すマスタ情報を格納する。年齢や性別などの他の属性情報を格納してもよい。
【0044】
ロボット100は、ユーザごとに親密度という内部パラメータを有する。ロボット100が、自分を抱き上げる、声をかけてくれるなど、自分に対して好意を示す行動を認識したとき、そのユーザに対する親密度が高くなる。ロボット100に関わらないユーザや、乱暴を働くユーザ、出会う頻度が低いユーザに対する親密度は低くなる。
【0045】
データ処理部202は、位置管理部208、認識部212、動作制御部222、親密度管理部220および状態管理部244を含む。
位置管理部208は、ロボット100の位置座標を特定する。状態管理部244は、充電率や内部温度、プロセッサ122の処理負荷などの各種物理状態など各種内部パラメータを管理する。また、状態管理部244は、ロボット100の感情(寂しさ、好奇心、承認欲求など)を示すさまざまな感情パラメータを管理する。これらの感情パラメータは常に揺らいでいる。感情パラメータに応じてロボット100の移動目標地点が変化する。たとえば、寂しさが高まっているときには、ロボット100はユーザのいるところを移動目標地点として設定する。
【0046】
時間経過によって感情パラメータが変化する。また、後述の応対行為によっても各種感情パラメータは変化する。たとえば、オーナーから「抱っこ」をされると寂しさを示す感情パラメータは低下し、長時間にわたってオーナーを視認しないときには寂しさを示す感情パラメータは少しずつ増加する。
【0047】
認識部212は、外部環境を認識する。外部環境の認識には、温度や湿度に基づく天候や季節の認識、光量や温度に基づく物陰(安全地帯)の認識など多様な認識が含まれる。ロボット100の認識部156は、内部センサ128により各種の環境情報を取得し、これを一次処理した上でサーバ200の認識部212に転送する。
【0048】
具体的には、ロボット100の認識部156は、画像から移動物体、特に、人物や動物に対応する画像領域を抽出し、抽出した画像領域から移動物体の身体的特徴や行動的特徴を示す特徴量の集合として「特徴ベクトル」を抽出する。特徴ベクトル成分(特徴量)は、各種身体的・行動的特徴を定量化した数値である。たとえば、人間の目の横幅は0~1の範囲で数値化され、1つの特徴ベクトル成分を形成する。人物の撮像画像から特徴ベクトルを抽出する手法については、既知の顔認識技術の応用である。ロボット100は、特徴ベクトルをサーバ200に送信する。
【0049】
サーバ200の認識部212は、ロボット100の内蔵カメラによる撮像画像から抽出された特徴ベクトルと、個人データ格納部218にあらかじめ登録されているユーザ(クラスタ)の特徴ベクトルと比較することにより、撮像されたユーザがどの人物に該当するかを判定する(ユーザ識別処理)。また、認識部212は、ユーザの表情を画像認識することにより、ユーザの感情を推定する。認識部212は、人物以外の移動物体、たとえば、ペットである猫や犬についてもユーザ識別処理を行う。
【0050】
認識部212は、ロボット100になされたさまざまな応対行為を認識し、快・不快行為に分類する。認識部212は、また、ロボット100の行動に対するオーナーの応対行為を認識することにより、肯定・否定反応に分類する。
快・不快行為は、ユーザの応対行為が、生物として心地よいものであるか不快なものであるかにより判別される。たとえば、抱っこされることはロボット100にとって快行為であり、蹴られることはロボット100にとって不快行為である。肯定・否定反応は、ユーザの応対行為が、ユーザの快感情を示すものか不快感情を示すものであるかにより判別される。抱っこされることはユーザの快感情を示す肯定反応であり、蹴られることはユーザの不快感情を示す否定反応である。
【0051】
サーバ200の動作制御部222は、ロボット100の動作制御部150と協働して、ロボット100のモーションを決定する。サーバ200の動作制御部222は、ロボット100の移動目標地点とそのための移動ルートを作成する。動作制御部222は、複数の移動ルートを作成し、その上で、いずれかの移動ルートを選択してもよい。
【0052】
動作制御部222は、モーション格納部232の複数のモーションからロボット100のモーションを選択する。各モーションには状況ごとに選択確率が対応づけられている。たとえば、オーナーから快行為がなされたときには、モーションAを20%の確率で実行する、気温が30度以上となったとき、モーションBを5%の確率で実行する、といった選択方法が定義される。
【0053】
親密度管理部220は、ユーザごとの親密度を管理する。上述したように、親密度は個人データ格納部218において個人データの一部として登録される。快行為を検出したとき、親密度管理部220はそのオーナーに対する親密度をアップさせる。不快行為を検出したときには親密度はダウンする。また、長期間視認していないオーナーの親密度は徐々に低下する。
【0054】
(ロボット100)
ロボット100は、通信部142、データ処理部136、データ格納部148、内部センサ128および駆動機構120を含む。
通信部142は、通信機126(
図4参照)に該当し、外部センサ114、サーバ200および他のロボット100との通信処理を担当する。データ格納部148は各種データを格納する。データ格納部148は、記憶装置124(
図4参照)に該当する。データ処理部136は、通信部142により取得されたデータおよびデータ格納部148に格納されているデータに基づいて各種処理を実行する。データ処理部136は、プロセッサ122およびプロセッサ122により実行されるコンピュータプログラムに該当する。データ処理部136は、通信部142、内部センサ128、駆動機構120およびデータ格納部148のインタフェースとしても機能する。
【0055】
データ格納部148は、ロボット100の各種モーションを定義するモーション格納部160を含む。
ロボット100のモーション格納部160には、サーバ200のモーション格納部232から各種モーションファイルがダウンロードされる。モーションは、モーションIDによって識別される。前輪102を収容して着座する、手106を持ち上げる、2つの前輪102を逆回転させることで、あるいは、片方の前輪102だけを回転させることでロボット100を回転行動させる、前輪102を収納した状態で前輪102を回転させることで震える、ユーザから離れるときにいったん停止して振り返る、などのさまざまなモーションを表現するために、各種アクチュエータ(駆動機構120)の動作タイミング、動作時間、動作方向などがモーションファイルにおいて時系列定義される。
データ格納部148には、個人データ格納部218からも各種データがダウンロードされてもよい。
【0056】
データ処理部136は、認識部156および動作制御部150を含む。
ロボット100の動作制御部150は、サーバ200の動作制御部222と協働してロボット100のモーションを決める。一部のモーションについてはサーバ200で決定し、他のモーションについてはロボット100で決定してもよい。また、ロボット100がモーションを決定するが、ロボット100の処理負荷が高いときにはサーバ200がモーションを決定するとしてもよい。サーバ200においてベースとなるモーションを決定し、ロボット100において追加のモーションを決定してもよい。モーションの決定処理をサーバ200およびロボット100においてどのように分担するかはロボットシステム300の仕様に応じて設計すればよい。
【0057】
ロボット100の動作制御部150は選択したモーションを駆動機構120に実行指示する。駆動機構120は、モーションファイルにしたがって、各アクチュエータを制御する。
【0058】
動作制御部150は、親密度の高いユーザが近くにいるときには「抱っこ」をせがむ仕草として両方の手106をもちあげるモーションを実行することもできるし、「抱っこ」に飽きたときには左右の前輪102を収容したまま逆回転と停止を交互に繰り返すことで抱っこをいやがるモーションを表現することもできる。駆動機構120は、動作制御部150の指示にしたがって前輪102や手106、首(頭部フレーム316)を駆動することで、ロボット100にさまざまなモーションを表現させる。
【0059】
ロボット100の認識部156は、内部センサ128から得られた外部情報を解釈する。認識部156は、視覚的な認識(視覚部)、匂いの認識(嗅覚部)、音の認識(聴覚部)、触覚的な認識(触覚部)が可能である。
【0060】
認識部156は、移動物体の撮像画像から特徴ベクトルを抽出する。上述したように、特徴ベクトルは、移動物体の身体的特徴と行動的特徴を示すパラメータ(特徴量)の集合である。移動物体を検出したときには、ニオイセンサや内蔵の集音マイク、温度センサ等からも身体的特徴や行動的特徴が抽出される。これらの特徴も定量化され、特徴ベクトル成分となる。認識部156は、特許文献2等に記載の既知の技術に基づいて、特徴ベクトルからユーザを特定する。
【0061】
検出・分析・判定を含む一連の認識処理のうち、ロボット100の認識部156は認識に必要な情報の取捨選択や抽出を行い、判定等の解釈処理はサーバ200の認識部212により実行される。認識処理は、サーバ200の認識部212だけで行ってもよいし、ロボット100の認識部156だけで行ってもよいし、上述のように双方が役割分担をしながら上記認識処理を実行してもよい。
【0062】
ロボット100に対する強い衝撃が与えられたとき、認識部156はタッチセンサおよび加速度センサによりこれを認識し、サーバ200の認識部212は、近隣にいるユーザによって「乱暴行為」が働かれたと認識する。ユーザがツノ112を掴んでロボット100を持ち上げるときにも、乱暴行為と認識してもよい。ロボット100に正対した状態にあるユーザが特定音量領域および特定周波数帯域にて発声したとき、サーバ200の認識部212は、自らに対する「声掛け行為」がなされたと認識してもよい。また、体温程度の温度を検知したときにはユーザによる「接触行為」がなされたと認識し、接触認識した状態で上方への加速度を検知したときには「抱っこ」がなされたと認識する。ユーザがボディ104を持ち上げるときの物理的接触をセンシングしてもよいし、前輪102にかかる荷重が低下することにより抱っこを認識してもよい。
まとめると、ロボット100は内部センサ128によりユーザの行為を物理的情報として取得し、サーバ200の認識部212は快・不快を判定する。また、サーバ200の認識部212は特徴ベクトルに基づくユーザ識別処理を実行する。
【0063】
サーバ200の認識部212は、ロボット100に対するユーザの各種応対を認識する。各種応対行為のうち一部の典型的な応対行為には、快または不快、肯定または否定が対応づけられる。一般的には快行為となる応対行為のほとんどは肯定反応であり、不快行為となる応対行為のほとんどは否定反応となる。快・不快行為は親密度に関連し、肯定・否定反応はロボット100の行動選択に影響する。
【0064】
認識部156により認識された応対行為に応じて、サーバ200の親密度管理部220はユーザに対する親密度を変化させる。原則的には、快行為を行ったユーザに対する親密度は高まり、不快行為を行ったユーザに対する親密度は低下する。
【0065】
以上の基本構成を前提として、次に、本実施形態におけるロボット100の実装について、特に、本実装の特徴と目的および基本構成との相違点を中心として説明する。
【0066】
[反射行動の実装]
図6は、本実施形態におけるロボット100のハードウェア構成図である。
本実施形態におけるロボット100は、プロセッサ122に加えて、CNS(Central Nervous System)基板116を搭載する。プロセッサ122は高次制御回路252(
図1参照)として機能する。CNS基板116は低次制御回路250(
図1参照)として機能する。CNS基板116は、ロボット100が外部から刺激を受けた時点から一定時間内にリアクション・モーションR(反射行動)を実行するために設計された電子回路である。以下、低次制御回路250によるリアクション・モーションRの実行判断に関わる制御を「低次制御」、高次制御回路252によるノーマル・モーションN(意識行動)に関わる制御を「高次制御」とよぶ。
【0067】
図7は、低次制御回路250、高次制御回路252および動作制御部150の対応関係を示す模式図である。
ロボット100のデータ処理部136の機能は、ロボット100のハードウェアおよびソフトウェアの協働により実現される。データ処理部136の機能の一部を担う動作制御部150は、サーバ200の動作制御部222とも協働してロボット100のモーションを決める。本実施形態における低次制御回路250は、ソフトウェアの実行が想定されていない低次制御に特化した電子回路である。高次制御回路252は、汎用のプロセッサ122であり、各種ソフトウェアを実行する。動作制御部150の機能は、低次制御回路250、高次制御回路252、高次制御回路252により実行されるソフトウェアにより実現される。
【0068】
図8は、低次制御を説明するための模式図である。
本実施形態においては、複数のセンサに対して複数の低次制御回路250が一対一にて対応づけられる。1つの低次制御回路250には1つのリアクション・モーションRが対応づけられる。1つの低次制御回路250に対しては1以上のアクチュエータが対応づけられる。複数の低次制御回路250は、ロボット100の内部に分散配置されてもよいし、制御回路342に集約的に格納されてもよい。
【0069】
複数の低次制御回路250のうち、
図8に示す低次制御回路250はセンサF1に対応づけられ、センサF1のセンサ値S1(アナログデータ)を検出する。低次制御回路250は、センサ値S1が反射閾値T1以上であれば、リアクション・モーションR1の実行を駆動機構120(アクチュエータ)に指示する。リアクション・モーションR1に関わるアクチュエータは2以上の場合もある。
【0070】
たとえば、センサF1はマイクロフォンアレイであり、センサ値S1はマイクロフォンアレイが検出した音声の音量値であるとする。リアクション・モーションR1は、ロボット100の頭部フレーム316を震わせるモーションであるとする。低次制御回路250は、センサ値S1が反射閾値T1以上であるとき、頭部フレーム316を制御するアクチュエータ326に所定の指示信号を送信して頭部フレーム316を震わせることにより、ロボット100が大きな音にびっくりした様子を行動表現する。
【0071】
低次制御回路250においては、リアクション・モーションR1にともなって指示対象となるアクチュエータとその指示信号があらかじめ定義されている。このため、低次制御回路250は、「大きな音」のような単純な外部事象に対して典型的かつ単純なリアクション・モーションRを即時実行できる。低次制御回路250の処理は単純であり、ソフトウェアの実行にともなうオーバーヘッドもないため、応答性に優れる。
【0072】
図9は、高次制御を説明するための模式図である。
ノーマル・モーションNの実行可否は、1以上のセンサのセンサ値と行動特性モデル254に基づいて高次制御回路252(プロセッサ122およびソフトウェア)により総合的に判断される。行動特性モデル254は、感情パラメータや親密度など、ロボット100の行動特性を決定するアルゴリズムであり、ソフトウェアにより構成される。行動特性モデル254は、サーバ200とも協働することで、ロボット100の行動特性を決定する。行動特性モデル254は、ロボット100の認識・関心・記憶・予測・選好・行動を表現するアルゴリズムである。
図9の高次制御回路252には、センサF1~Fnのセンサ値S1~Sn(デジタルデータ)が入力される。高次制御回路252は、センサ値S1~Snに基づいてノーマル・モーションNを決定し、その実行を駆動機構120に指示する。
【0073】
たとえば、認識部156(行動特性モデル254の一部)は、タッチセンサによりユーザP2によるボディ104への接触を検出し、かつ、カメラと加速度センサによりロボット100の上昇を検出したとき、ロボット100が「抱っこ」されたと総合的に判定する。抱っこに際し、サーバ200の親密度管理部220はユーザP2に対する親密度を上昇させる。親密度の変化により、ロボット100の行動特性が変化する。たとえば、ロボット100のカメラがユーザP2を撮像(視認)したとき、ユーザP2の親密度が高いほど、動作制御部150がユーザP2に近接する行動を選択する確率が高くなる。低次制御においては、センサ値とリアクション・モーションRが直結している。一方、高次制御においては、センサ値により外部事象を解釈し、親密度や感情パラメータ等の内部変数を変化させることで行動選択基準を変化させ、行動特性モデル254の処理結果としてノーマル・モーションNが選択される。
【0074】
図10は、ロボット100の行動制御システム170の回路構成図である。
行動制御システム170は、低次制御を担当するCNS基板116(低次制御回路250)と高次制御を担当するプロセッサ122(高次制御回路252)を含む。CNS基板116(低次制御回路250)は、コア回路174と出力回路176を含む。本実施形態においては、センサFごとにCNS基板116が設けられ、1つのCNS基板116は1以上のアクチュエータに指示信号を送信可能である。ここでいうセンサFは、カメラ等の内部センサ128であってもよいし、外部センサ114であってもよい。
【0075】
コア回路174は、センサFのセンサ値に応じてリアクション・モーションRの実行可否を決定する。また、コア回路174は、センサ値をA/D変換し、デジタルデータとしてのセンサ値をプロセッサ122(高次制御回路252)に出力するA/D変換回路を含んでもよい。コア回路174は、プロセッサ122が利用しやすい形式にセンサ値を整形する機能を含んでもよい。出力回路176は、1以上のアクチュエータ(駆動機構120)を制御する。
【0076】
(コア回路174)
コア回路174は、センサ値入力部178、整形部180、センサ値出力部182、判定部184、信号生成部186および設定入力部188を含む。
センサ値入力部178は、センサ値を取得する。センサ値は、アナログデータであってもよいし、デジタルデータであってもよい。判定部184は、センサ値があらかじめ設定された閾値(上述の「反射閾値」)以上であるか否かを判定する。以下、センサ値が反射閾値以上となる外部事象を「強度事象」とよぶ。判定部184は、強度事象が発生したときには、信号生成部186にリアクション・モーションRの実行を指示する制御信号を生成させ、キャンセル信号をプロセッサ122に送信する。信号生成部186は、判定部184から指示を受けたことを契機として、あらかじめ設定されているリアクション・モーションRの実行を出力回路176の信号出力部192に指示する。より具体的には、リアクション・モーションRに関連付けられる1以上のアクチュエータに対する指示信号(動作量、動作速度、動作方向)を信号出力部192に送信する。
【0077】
一方、強度事象であるか否かに関わらず、センサ値は、整形部180により後段の処理において利用しやすい形式に整形される。ロボット100には様々な種類のセンサFが設けられる。センサFは、センサ値を一定の間隔で出力するが、出力周期は同一ではない。高次制御回路252(プロセッサ122)は、複数のセンサFにおけるセンサ値に基づいて処理をおこなうため、処理に用いるセンサのセンサ値が異なるタイミングで届くと、タイミング調整処理が必要となるために自らの計算リソースを消費してしまう。そこで、整形部180は、各センサFから届くセンサ値を必要に応じてバッファに蓄積し、各センサ値の出力タイミングを同期させる。整形部180がセンサ値の出力タイミングの調整を担当することにより、高次制御回路252の処理負荷が低減される。整形部180において、出力タイミングを調整する場合には、他のセンサ用に設けられたCNS基板116と同期するように設計されてもよいし、複数のCNS基板116で整形部180およびセンサ値出力部182を共有してもよい。
【0078】
センサ値出力部182は、リアクション・モーションRの実行要否に関わらず、センサ値を高次制御回路252に出力する。高次制御回路252において実行されるソフトウェアは、センサ値にしたがってロボット100の行動特性を決定する。反射閾値は、ロボット100のおかれた環境や状態に応じて変更できることが好ましい。高次制御回路252は、CNS基板116(低次制御回路250)における反射閾値およびリアクション・モーションRの設定を変更するときには、設定信号を設定入力部188に送信する。設定入力部188は、判定部184における反射閾値を更新し、信号生成部186におけるリアクション・モーションRの設定を変更する。
【0079】
(出力回路176)
出力回路176は、指示入力部190と信号出力部192を含む。
高次制御回路252は、ノーマル・モーションNを実行するとき、アクチュエータごとに指示信号を送る。指示入力部190は高次制御回路252からノーマル・モーションNのための指示信号を受信し、信号出力部192に送信する。信号出力部192は、リアクション・モーションRの指示信号を信号生成部186(コア回路174)から受信し、ノーマル・モーションNの指示信号を指示入力部190(高次制御回路252)から受信する。信号出力部192は、信号生成部186からリアクション・モーションRの制御信号を受信したときには、指示入力部190から受信するノーマル・モーションNの制御信号を無効にして、リアクション・モーションRの制御信号を優先して駆動機構120に送信する。
【0080】
駆動機構120は、制御信号にしたがって動作する。信号出力部192は、リアクション・モーションRの実行を指示するときには、現在の駆動状態を停止する制御信号(コマンド)を送信した後に、リアクション・モーションRを実行するための制御信号を送信する。すなわち、信号出力部192は、駆動機構120における現在進行中の動作を中止させた上で、リアクション・モーションRを即時実行させる。信号出力部192は、信号生成部186からリアクション・モーションRの実行指示がなければ、指示入力部190から届くノーマル・モーションNの制御信号を駆動機構120に順次送信する。
【0081】
コア回路174の判定部184は、強度事象が発生したためにリアクション・モーションRを実行するときにはキャンセル信号を高次制御回路252に送信する。高次制御回路252はキャンセル信号を受信したときにはノーマル・モーションNの実行を中断し、新たにセンサ値出力部182から出力されるセンサ値に応じた処理を開始する。このような制御方法によれば、リアクション・モーションRは即時実行される一方、高次制御回路252はリアクション・モーションRの終了後に実行すべきノーマル・モーションNをリアクション・モーションRの終了を待たずに判断できる。
【0082】
図11は、リアクションテーブル194の概念図である。
反射閾値は判定部184(コア回路174)に設定される。リアクション・モーションR、より厳密には、リアクション・モーションRに関わるアクチュエータに対する指示値は信号生成部186(コア回路174)に設定される。
図11に示すリアクションテーブル194は、判定部184に設定される反射閾値と信号生成部186に設定されるリアクション・モーションRの対応関係を模式的に示したものである。低次制御回路250ごとに、いいかえれば、センサFごとに反射閾値とリアクション・モーションRのセット(リアクションテーブル194)が定義される。
【0083】
図11に示すリアクションテーブル194は、センサF1(センサ値S1)に対する反射閾値Tとリアクション・モーションRを定義する。
図11においては、反射閾値T=T1が設定される。リアクション・モーションRとしては、モーションM1~M4のいずれかが選択可能であるが、
図11においてはモーションM1が設定されている。すなわち、センサ値S1が反射閾値T1を超えるとき、コア回路174はリアクション・モーションRとしてモーションM1の実行を指示する。信号生成部186には、モーションM1を実現する上で制御対象となるアクチュエータと、その指示値(動作量、動作方向、動作速度)が設定される。
以下、リアクション・モーションRの具体例をいくつか列挙する。
【0084】
(例1:大きな音が聞こえたときの反射行動)
ロボット100は、大きな音を聞くと反射的に手106を震わせる。このようなリアクション・モーションRを実現するため、マイクロフォンアレイに対応づけられる低次制御回路250は、音量値を検出する。音量値(センサ値)が反射閾値以上となると、信号生成部186はワイヤ134を振動させる。低次制御回路250は大音量を検出したときにワイヤ134を振動させるという単純な処理を実行することにより、「大きな音に驚いて手106を震わせる」という反射行動を高い応答性にて表現できる。
【0085】
高次制御回路252は、低次制御回路250で用いられる反射閾値を変更できる。たとえば、単位時間あたり反射閾値T1以上の音声を検出した回数が所定回数を超える時、高次制御回路252(動作制御部150)は反射閾値をT1からT2(>T1)に変更してもよい。このような制御方法によれば、大きな音を聞き続けたロボット100は反射閾値T1程度の音では反応しなくなる。いいかえれば、ロボット100の大きな音に対する慣れを表現できる。単位時間あたり反射閾値T2以下の音声を検出した回数が所定回数以内であるとき、高次制御回路252(動作制御部150)は反射閾値をT2からT1に変更してもよい。
【0086】
高次制御回路252は、リアクション・モーションRも変更できる。モーションM1は手106を震わせるモーションであり、モーションM2は前輪102をボディ104に格納して着座するモーションであるとする。たとえば、反射閾値以上の音声を所定時間以上検出しなかったとき、高次制御回路252は「手106を震わせるモーションM1」から「座り込むモーションM2」にリアクション・モーションRを変更してもよい。このような制御方法によれば、大きな音に慣れていないロボット100は、大きな音が聞こえるとその場に座り込む。
【0087】
以上のように、高次制御回路252は、所定の変更条件が成立したとき、反射閾値およびリアクション・モーションRを変更する。以下、反射閾値とリアクション・モーションRをまとめて「反射特性」とよぶ。高次制御回路252が外部事象または内部事象に応じて低次制御回路250の反射特性を変更することにより、リアクション・モーションの高速な応答性と反射特性の多様化を両立させることができる。
【0088】
(例2:叩かれたときの反射行動)
ロボット100は、ユーザに頭を叩かれると反射的に後退する。このようなリアクション・モーションRを実現するため、低次制御回路250のひとつはロボット100の頭部に取り付けられるタッチセンサの接触強度をセンサ値として検出する。センサ値が反射閾値以上であれば、いいかえれば、頭部に対する強い接触が検出されたときには、信号生成部186は前輪102に後方回転を指示する。このような制御により、「頭を叩かれて後ろに逃げる」という反射行動をロボット100に実行させることができる。
【0089】
反射閾値を変更することにより、叩かれることに対する敏感度が変化する。反射閾値を低く設定すれば、ロボット100は軽く叩かれただけでも後退する。反射閾値を高く設定すれば、ロボット100は強く叩かれたときだけ後退する。タッチセンサの反射閾値を変更することにより、ロボット100の「痛み」に対する敏感さ・耐性を調整できる。
【0090】
後退以外にもさまざまなリアクション・モーションRを設定可能である。たとえば、叩かれたときにロボット100はボディ104を揺らしてもよい。低次制御回路250は目110に表示される瞳画像を変化させることにより叩かれたときに瞼を閉じてもよい。このように、低次制御回路250はアクチュエータのような機械的な制御装置以外、たとえば、表示装置などの電気的な制御装置に対して指示信号を送信してもよい。
【0091】
ロボット100は、叩かれたときなど、外部事象によってはアクチュエータへの通電を抑制または停止させて、脱力を表現してもよい。低次制御回路250は、アクチュエータの動きを固定することで「硬直」や「緊張」を表現してもよい。
【0092】
(例3:落下したときの反射行動)
ロボット100は、落下中に、全アクチュエータへの通電を反射的に停止させる。これは、アクチュエータの可動性を最大にすることで衝撃に備えるためである。いわば、アクチュエータ(関節)に柔軟性をもたせることでロボット100に受け身をとらせている。低次制御回路250は、加速度センサにより検出された加速度(センサ値)が反射閾値以上であるとき、アクチュエータへの通電停止を指示する。ロボット100は、落下検出に際しては、前輪102をボディ104に格納してもよい。通常、前輪102はボディ104から露出するため、前輪102(移動機構)をボディ104に格納することにより落下の衝撃によって前輪102が破損するのを防止できる。リアクション・モーションRは、本能的な即時反応を表現するだけでなく、ロボット100の機構保護のために実行されてもよい。
【0093】
(例4:緊急停止)
ロボット100には、緊急停止用のスイッチ(以下「緊急停止スイッチ」とよぶ)が設けられる。ユーザにより緊急停止スイッチがオンされたとき、CNS基板116は全アクチュエータへの通電を即時停止させる。緊急停止スイッチがオフのとき(正常状態)、センサ値入力部178には通電状態として「1」が入力される。緊急停止スイッチがオンされると、センサ値入力部178には通電状態として「0」が入力される。判定部184には、判定条件として「0」が設定されている。判定部184は、センサ値入力部178から供給されたセンサ値が「0」になったときに、信号生成部186にアクチュエータへの通電を停止することを指示する。
【0094】
上述したように、1つのセンサに対して複数のリアクション・モーションRを対応づけ、高次制御回路252はいずれか1つを選択する。このような制御方法によれば、センサ値に応じて、あらかじめ定義されたリアクション・モーションを高速に実行できる。複数のリアクション・モーションのうちどのリアクション・モーションを実行対象とするかを決定する変更条件は任意に設定可能である。たとえば、センサF1にリアクション・モーションとしてモーションM1~M4が選択可能に設定されているとする。高次制御回路252は、リアクション・モーションM1~M4のいずれかを定期的にランダムに選択してもよい。
【0095】
行動の内容にかぎらず、行動の運動量をモーションによって異なってもよい。たとえば、リアクション・モーションM1が1メートル以上後退するモーション、リアクション・モーションM2が10センチメートル後退するモーションであるとする。大きな音が頻発する環境においては、モーションM1よりもモーションM2を設定することにより、ロボット100の大きな音に対する慣れを行動表現できる。また、ロボット100の製造日からの経過日数が所定値を超えたことを契機として、リアクション・モーションM1をリアクション・モーションM2に変更してもよい。このような制御方法によれば、加齢にともなって大きな音に驚かなくなるという「落ち着き」を表現できる。
【0096】
以上、実施形態に基づいてロボット100およびロボット100を含むロボットシステム300について説明した。
本実施形態においては、複雑な行動特性を高次制御回路252(ソフトウェア・レベル)により表現し、本能的・即時的な行動を低次制御回路250(ハードウェア・レベル)により実行する。人間の脳が合理的思考を司る大脳新皮質と、大脳辺縁系のような旧皮質に分かれているように、ロボット100においても意識的行動の制御機構と無意識的行動の制御機構を分離させている。このような設計により、ロボット100に複雑な行動特性とともに、本能的で単純な反射行動も実行させることができる。
【0097】
低次制御回路250は、センサ値が反射閾値を超えるか否かをチェックするだけでリアクション・モーションRの実行可否を判断する。このため、強度事象が発生してからリアクション・モーションRの実行に至るまでのタイムラグは200ミリ秒以内に抑えることが可能となる。低次制御回路250はセンサ値をアナログデータとして受信してもよいし、デジタルデータとして受信してもよい。データの種類に応じて、適宜、A/D変換の機能が設けられる。
【0098】
低次制御回路250がリアクション・モーションRを実行するときには、キャンセル信号により高次制御回路252によるノーマル・モーションNの実行が抑止される。このような制御により、リアクション・モーションNとノーマル・モーションNが同時または連続実行されることにともなう不自然さを防止する制御も工夫点である。低次制御回路250のアルゴリズムは単純であるため、低次制御回路250はソフトウェアがなくても、ハードウェア・レベルで実装できる。低次制御回路250には、ソフトウェアの実行にともなうオーバーヘッドが発生しない。一方、高次制御回路252は、ソフトウェアによりアルゴリズムが実装されるため、低次制御回路250よりは判断が低速となるが、複数のセンサ値に基づく複雑な行動特性を表現できる。
【0099】
高次制御回路252は、複数のセンサ値に基づいて感情パラメータや親密度などの各種パラメータを変化させる。これらのパラメータがロボット100の「精神状態」や「性格」などの固有状態を表現する。ロボット100の固有状態と外部事象に基づいて、ロボット100の行動(ノーマル・モーションN)が決まる。
【0100】
高次制御回路252は、低次制御回路250のアルゴリズムの判断基準である反射閾値と行動内容であるリアクション・モーションRを変更する。高次制御回路252による反射特性の変更により、リアクション・モーションRの単調化を防ぐことができる。
【0101】
なお、本発明は上記実施形態や変形例に限定されるものではなく、要旨を逸脱しない範囲で構成要素を変形して具体化することができる。上記実施形態や変形例に開示されている複数の構成要素を適宜組み合わせることにより種々の発明を形成してもよい。また、上記実施形態や変形例に示される全構成要素からいくつかの構成要素を削除してもよい。
【0102】
1つのロボット100と1つのサーバ200、複数の外部センサ114によりロボットシステム300が構成されるとして説明したが、ロボット100の機能の一部はサーバ200により実現されてもよいし、サーバ200の機能の一部または全部がロボット100に割り当てられてもよい。1つのサーバ200が複数のロボット100をコントロールしてもよいし、複数のサーバ200が協働して1以上のロボット100をコントロールしてもよい。
【0103】
ロボット100やサーバ200以外の第3の装置が、機能の一部を担ってもよい。
図5において説明したロボット100の各機能とサーバ200の各機能の集合体は大局的には1つの「ロボット」として把握することも可能である。1つまたは複数のハードウェアに対して、本発明を実現するために必要な複数の機能をどのように配分するかは、各ハードウェアの処理能力やロボットシステム300に求められる仕様等に鑑みて決定されればよい。
【0104】
上述したように、「狭義におけるロボット」とはサーバ200を含まないロボット100のことであるが、「広義におけるロボット」はロボットシステム300のことである。サーバ200の機能の多くは、将来的にはロボット100に統合されていく可能性も考えられる。
【0105】
本実施形態における低次制御回路250は、コア回路174と出力回路176の双方を含むが、コア回路174を「狭義における低次制御回路250」と捉えることもできる。
【0106】
本実施形態においては、センサごとに低次制御回路250を対応づけ、低次制御回路250は1以上のアクチュエータを制御するとして説明した。変形例としてセンサごとにコア回路174を対応づけ、アクチュエータごとに出力回路176を対応づけてもよい。n個のセンサとm個のアクチュエータが存在するとき、1つのCNS基板116にn個のコア回路174とm個の出力回路176を搭載してもよい。
【0107】
1個のCNS基板116に複数のセンサを対応づけてもよい。この場合には、コア回路174のセンサ値入力部178は、複数のセンサ値を取得し、判定部184はセンサごとにリアクション・モーションRの実行可否を判定してもよい。
【0108】
低次制御回路250は、落下や衝撃など、ロボット100に危害が加えられる状況においては、前輪102以外にもツノ112等の突起部分をボディ104に格納し、保護してもよい。
【0109】
低次制御回路250のアルゴリズムは単純であるため、ハードウェアのみで実装可能であるがソフトウェアの実装を排除するものではない。低次制御回路250がシンプルなソフトウェアを実行することで低次制御機能を実現してもよい。低次制御機能をソフトウェアにより実装する場合には、単一のプロセッサ上に複数のセンサFに対応する複数の低次制御機能を実装することもできる。
【0110】
低次制御回路250には複数の反射閾値を設定してもよい。低次制御回路250は、センサ値が反射閾値T1を超えたときにはリアクション・モーションM1を実行し、センサ値が反射閾値T2(>T1)を超えたときにはリアクション・モーションM2を実行してもよい。このように、低次制御回路250は、複数の反射閾値に対応して複数のリアクション・モーションを実行させてもよい。
【0111】
音声については、音量に限らず、周波数など他のセンサ値に基づいてリアクション・モーションRの実行可否を判断してもよい。音量が小さくても、不快な高周波音が聞こえたときには、リアクション・モーションRを実行するとしてもよい。マイクロフォンアレイに対して、音量値を検出する低次制御回路250と周波数を検出する低次制御回路250を別々に設けてもよい。このように1つのセンサに対して複数の低次制御回路250(コア回路174)を対応づけてもよい。
【0112】
本実施形態においては、低次制御の低次制御回路250と高次制御の高次制御回路252の2段階制御を前提として説明した。変形例として、低次制御と高次制御の中間レベルの制御(中間制御)を行う電子回路を設けることにより3以上の電子回路に3段階以上の制御を分担させてもよい。
【0113】
低次制御回路250と高次制御回路252の2つを設けるのではなく、プロセッサ122により低次制御と高次制御の双方を実行してもよい。具体的には、プロセッサ122において低次制御用のソフトウェアLSと高次制御用のソフトウェアHSを並列実行させればよい。たとえば、ソフトウェアLSをソフトウェアHSよりも優先度の高いプロセスまたはスレッドとして実装してもよい。
【0114】
本実施形態における低次制御回路250はソフトウェアの実行が想定されていない電子回路であるとして説明したが、低次制御回路250はファームウェア(firmware)としての組み込みのソフトウェアを実行する電子回路であってもよい。低次制御回路250は、FPGA(Field-Programmable Gate Array)のようなPLD(Programmable Logic Device)として構成されてもよい。
【0115】
本実施形態においては、リアクション・モーションRの具体例として(例1)大きな音が聞こえたときの反射行動、(例2)叩かれたときの反射行動、(例3)落下したときの反射行動、(例4)緊急停止、の4つを例示した。このほかにも、下記のようなリアクション・モーションRが考えられる。
【0116】
(例5:障害物を検出したときの反射行動)
ロボット100は、ToF(Time of Flight)センサあるいはソナーなどの測距センサを搭載してもよい。低次制御回路250は、測距センサにより、壁、段差、穴、崖を検出したとき、ロボット100の移動を停止させてもよい。低次制御回路250は、たとえば、至近距離に障害物を検知したとき、前輪102の駆動停止を指示する。ロボット100の安全が脅かされると想定されるセンサ値を契機として、ロボット100の移動を停止させることにより、ロボット100を危険から守ることができる。高次制御回路252は、障害物が検出されたとき、他のセンサから収集した情報に基づいて「イベント」を判定し、「後退」などの次にとるべきノーマル・モーションNを選択する。ロボット100は、低次制御回路250からの指示により急停止したあと、高次制御回路252に指示されたノーマル・モーションNを実行する。このように、ロボット100は、リアクション・モーションRを即時実行した上で、ノーマル・モーションNを引き続き実行してもよい。
【0117】
ロボットの目前に障害物が落下したとき、あるいは、障害物が設置されたときにも、低次制御回路250は至近距離の障害物を検出したことを契機としてロボット100の移動停止を指示してもよい。上述したように、安全確保のためのリアクション・モーションR(急停止)の実行後、高次制御回路252はノーマル・モーションNを実行してもよい。たとえば、高次制御回路252は、ロボット100の手106を上げたり、目110に表示させる眼画像の瞳孔を拡大させたり、瞬きをさせることでロボット100の驚きを表現してもよい。
【0118】
(例6:熱源を検出したときの反射行動)
ロボット100は、サーモセンサにより熱源を検出してもよい。低次制御回路250は、所定閾値以上の温度(高温)を検出したとき、ロボット100の移動停止を指示する。所定閾値は、ロボット100を形成する部材の耐熱温度に応じて決めてもよい。ヒーターやストーブなどの発熱器具に近づいたとき、ロボット100の高温化を防止するためのリアクション・モーションRを実行することでロボット100の安全を確保できる。また、ロウソクやたばこ等の炎をともなう熱源に近づいたときもロボット100の熱源への接近行動を中止することにより、ロボット100の安全を確保できる。
【0119】
(例7:閃光を検出したときの反射行動)
ロボット100は、目110に眼画像を表示させる。低次制御回路250は、カメラまたは光センサにより強い光(閃光)を検出したとき、目110において瞼を閉じる眼画像を表示させる。このような制御方法によれば、ロボット100が強い光を浴びたときに思わず目を閉じる様子を即時的に表現できる。このほかにも、ロボット100の顔を背ける、頭部を下に向ける、移動を停止するなどのリアクション・モーションRを実行してもよい。
【0120】
(例8:暗転時の反射行動)
低次制御回路250は、カメラまたは光センサにより、光量が所定値以下となったことを検出したとき、移動停止させてもよい。たとえば、ユーザが部屋の電灯を切ったときには、ロボット100を移動停止させることでロボット100が暗闇で室内物体にぶつかるのを防ぐことができる。
【0121】
ロボット100の顔に光センサを取り付けてもよい。ユーザがロボット100の目110に目隠しをしたときには、低次制御回路250は手106を揺らすことでロボット100の驚きを表現してもよい。このほかにも、眼画像で瞬きを実行する、頭部を左右に揺らすなども驚きの表現として考えられる。
【0122】
低次制御回路250により指示されるリアクション・モーションRは、高次制御回路252により指示されるノーマル・モーションNに優先して実行される。ノーマル・モーションNの実行中に低次制御回路250によりリアクション・モーションRが実行指示された場合、実行中のノーマル・モーションNは即時停止され、リアクション・モーションRが先に実行される。また、実行待ちのリアクション・モーションRが存在するとき高次制御回路252によりノーマル・モーションNが選択された場合には、予定されているすべてのリアクション・モーションRの実行完了後に、ノーマル・モーションNを実行する。このように、リアクション・モーションRとノーマル・モーションNは並列実行されることはなく、リアクション・モーションRとノーマル・モーションNの実行順序はシリアライズされる。
【0123】
図10に示した低次制御回路250は、リアクション・モーションRの実行状況を高次制御回路252に通知するための実行状況通知部(図示せず)を備えてもよい。より具体的には、信号生成部186がリアクション・モーションRの実行指示信号を生成し、信号出力部192にこれを出力した後、実行状況通知部はリアクション・モーションRの実行が完了したことを高次制御回路252に通知する。実行状況通知部は、1以上のリアクション・モーションRのうちの最後の実行指示が、信号出力部192から駆動機構120に動作指示として伝えられて、駆動機構120が最後の実行指示に対応する動作を完了したことを検出する。このとき、実行状況通知部は、1以上のリアクション・モーションRをすべて完了したことを高次制御回路252に通知する。
【0124】
すなわち、すべての予定されているリアクション・モーションRの実行が完了したあと、高次制御回路252は、既に選択していたノーマル・モーションNの実行を指示する。モーションの実行は、機械的動作をともなうことが多いため、実行の開始から完了までにはある程度の時間を要する。一方、高次制御回路252(電子回路とソフトウェア)によるモーション選択は、将来的にはいっそう高速化すると考えられる。上述した制御方法によれば、実行状況通知部がリアクション・モーションRの実行状況を高次制御回路252に通知しつつ、いいかえれば、高次制御回路252によるノーマル・モーションNの実行を待たせつつ、低次制御回路250が1以上のリアクション・モーションRを優先的に実行できる。将来、ノーマル・モーションNが多様化したときでも、リアクション・モーションRの即時実行(即時反応)を実現しやすくなる。
【0125】
ノーマル・モーションNの実行中にリアクション・モーションRを実行するためにノーマル・モーションNを一時停止させることもある。この場合、リアクション・モーションRの実行後(反射行動後)、事前に実行していたノーマル・モーションNを再開してもよい。たとえば、ノーマル・モーションN1,N2の連続実行を予定している状況において、ノーマル・モーションN1の実行中にリアクション・モーションR1の実行を指示したとする。このときには、ノーマル・モーションN1の実行を中止し、リアクション・モーションR1を先に実行する。リアクション・モーションR1の完了後、ノーマル・モーションN1を途中から再開してもよいし、ノーマル・モーションN1を最初からやり直してもよいし、ノーマル・モーションN1をキャンセルしてノーマル・モーションN2を実行してもよい。また、反射行動のきっかけとなった事象に応じて、ロボット100の内部状態(感情パラメータ、親密度など)を変化させ、内部状態の変化に基づいて新たなノーマル・モーションNを選択し直してもよい。たとえば、新たな移動目標地点を設定した上で、ロボット100を移動させてもよい。