特開2024-97123 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ カシオ計算機株式会社の特許一覧

特開2024-97123動作制御装置、動作制御方法、及び、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024097123

(43)【公開日】2024-07-18

(54)【発明の名称】動作制御装置、動作制御方法、及び、プログラム

(51)【国際特許分類】

A63H 11/00 20060101AFI20240710BHJP

B25J 5/00 20060101ALI20240710BHJP

【ＦＩ】

A63H11/00 Z

B25J5/00

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2023000364

(22)【出願日】2023-01-05

(71)【出願人】

【識別番号】000001443

【氏名又は名称】カシオ計算機株式会社

(74)【代理人】

【識別番号】100095407

【弁理士】

【氏名又は名称】木村満

(72)【発明者】

【氏名】長谷川浩一

(72)【発明者】

【氏名】市川英里奈

(72)【発明者】

【氏名】小野田佳世子

(72)【発明者】

【氏名】黛幸輝

【テーマコード（参考）】

2C150

3C707

【Ｆターム（参考）】

2C150CA02

2C150DA24

2C150DA26

2C150DF04

2C150DF33

2C150EB01

2C150ED42

2C150ED47

2C150ED56

2C150EF07

2C150EF16

2C150EF23

2C150EF25

2C150EF30

2C150EF33

2C150EF36

3C707AS36

3C707CS08

3C707WA02

3C707WA16

3C707WA17

3C707WL07

(57)【要約】

【課題】音声の取得処理と動作部の動作処理との競合による互いの影響を軽減させる。
【解決手段】動作制御装置１００は、音声取得部と動作部２２０と制御部１１０とを備え、制御部１１０は、動作部２２０が動作中、音声取得部により取得された音声が人の声であると判定すると、動作部２２０を停止させ、判定後の音声を所定期間取り込み、所定期間が経過した後、動作部２２０の動作を再開するよう制御する、ことを特徴とする。
【選択図】図４

【特許請求の範囲】

【請求項1】

音声取得部と動作部と制御部とを備え、
前記制御部は、
前記動作部が動作中、前記音声取得部により取得された音声が人の声であると判定すると、前記動作部を停止させ、前記判定後の音声を所定期間取り込み、前記所定期間が経過した後、前記動作部の動作を再開するよう制御する、
ことを特徴とする動作制御装置。

【請求項2】

複数の記憶領域を有する記憶部を更に備え、
前記制御部は、
前記音声取得部により取得された音声に対応する音声データが前記複数の記憶領域の一部に記憶されると、前記記憶された音声データより、前記音声が人の声であるか否かを判定し、
前記音声が人の声であると判定すると、前記動作部を停止させ、継続して取得される前記所定期間の音声に対応する音声データを前記複数の記憶領域に順次記憶させるよう制御する、
ことを特徴とする請求項１に記載の動作制御装置。

【請求項3】

前記制御部は、
前記複数の記憶領域に順次記憶させた音声データを解析することにより、前記音声を発した対象を認識する、
ことを特徴とする請求項２に記載の動作制御装置。

【請求項4】

前記制御部は、
前記複数の記憶領域に順次記憶させた音声データのケプストラムを算出し、
前記算出したケプストラムの類似度に基づいて前記音声を発した対象を認識する、
ことを特徴とする請求項２に記載の動作制御装置。

【請求項5】

筐体と、前記動作部の動作により前記筐体との位置関係が変更される部材とを備え、
前記音声取得部は、前記筐体表面の外部環境音の取得に好適な位置に設けられ、
前記動作部は、前記筐体の内部に設けられている、
ことを特徴とする請求項１に記載の動作制御装置。

【請求項6】

前記音声取得部は前記動作部からの音を取得しづらくする指向性を持つマイクを備える、
ことを特徴とする請求項１に記載の動作制御装置。

【請求項7】

前記所定期間は、前記制御部が前記音声取得部から取得した音データを解析し前記取得された音声が人の声であると判定するために必要なサンプルデータのデータ量に対応する、
ことを特徴とする請求項１から５のいずれか１項に記載の動作制御装置。

【請求項8】

音声取得部と動作部と制御部とを備える動作制御装置の前記制御部が、
前記動作部が動作中、前記音声取得部により取得された音声が人の声であると判定すると、前記動作部を停止させ、前記判定後の音声を所定期間取り込み、前記所定期間が経過した後、前記動作部の動作を再開するよう制御する、
ことを特徴とする動作制御方法。

【請求項9】

音声取得部と動作部とを備える動作制御装置のコンピュータに、
前記動作部が動作中、前記音声取得部により取得された音声が人の声であると判定すると、前記動作部を停止させ、前記判定後の音声を所定期間取り込み、前記所定期間が経過した後、前記動作部の動作を再開するよう制御する、
処理を実行させることを特徴とするプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、動作制御装置、動作制御方法、及び、プログラムに関する。

【背景技術】

【0002】

従来から、様々なペットロボットが開発されている。ペットロボットは、ユーザが発した音声を認識するためのマイクロフォンや、頭、足等を動かすためのアクチュエータを備えるものが多い。しかし、アクチュエータ動作時に発するノイズが音声を認識する際の障害になってしまうことがある。そこで、例えば、特許文献１には、頭部にマイクロフォンを備えるとともに、アクチュエータの発するノイズが当該マイクロフォンに及ぼす影響を低減することが可能なロボットが開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２００３－１９５８８６号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１に開示されているロボットは、アクチュエータをマイクロフォンから離隔したところに配置することにより、アクチュエータの発するノイズの影響を低減できる。しかしながらマイクロフォンとアクチュエータとを離隔しても音声の音量レベルによっては相変わらずノイズの影響を受けてしまうことは避けられない。

【0005】

本発明はこのような事情に鑑みてなされたものであって、音声の取得処理と動作部の動作処理との競合による互いの影響を軽減させることを目的とする。

【課題を解決するための手段】

【0006】

前記目的を達成するため、本発明に係る動作制御装置の一様態は、
音声取得部と動作部と制御部とを備え、
前記制御部は、
前記動作部が動作中、前記音声取得部により取得された音声が人の声であると判定すると、前記動作部を停止させ、前記判定後の音声を所定期間取り込み、前記所定期間が経過した後、前記動作部の動作を再開するよう制御する、
ことを特徴とする。

【発明の効果】

【0007】

本発明によれば、音声の取得処理と動作部の動作処理との競合による互いの影響を軽減させることができる。

【図面の簡単な説明】

【0008】

【図1】実施形態１に係るロボットの外観を示す図である。

【図2】実施形態１に係るロボットの側面から見た断面図である。

【図3】実施形態１に係るロボットの筐体を説明するための図である。

【図4】実施形態１に係るロボットの機能構成を示すブロック図である。

【図5】実施形態１に係る音声バッファの一例を示す図である。

【図6】実施形態１に係る感情マップの一例を説明する図である。

【図7】実施形態１に係る制御内容テーブルの一例を説明する図である。

【図8】実施形態１に係る動作制御処理のフローチャートである。

【図9】実施形態１に係るマイク入力処理のフローチャートである。

【図10】実施形態１に係る音声特徴パラメータ算出処理のフローチャートである。

【図11】実施形態１に係るタッチ入力処理のフローチャートである。

【発明を実施するための形態】

【0009】

以下、本発明の実施形態について、図面を参照して説明する。なお、図中同一又は相当部分には同一符号を付す。

【0010】

（実施形態１）
実施形態１に係る動作制御装置を図１に示すロボット２００に適用した実施形態について、図面を参照して説明する。図１に示すように、実施形態に係るロボット２００は、小型の動物を模したペットロボットであり、目を模した装飾部品２０２及びふさふさの毛２０３を備えた外装２０１に覆われている。また、外装２０１の中には、ロボット２００の筐体２０７が収納されている。図２に示すように、ロボット２００の筐体２０７は、頭部２０４、連結部２０５及び胴体部２０６で構成され、頭部２０４と胴体部２０６とが連結部２０５で連結されている。

【0011】

胴体部２０６は、図２に示すように、胴体部２０６の前端部にひねりモータ２２１と呼ばれるサーボモータが備えられており、頭部２０４が連結部２０５を介して胴体部２０６の前端部に連結されている。そして、連結部２０５には、上下モータ２２２と呼ばれるサーボモータが備えられている。なお、図２では、ひねりモータ２２１は胴体部２０６に備えられているが、連結部２０５に備えられていてもよいし、頭部２０４に備えられていてもよい。また、図２では、上下モータ２２２は連結部２０５に備えられているが、胴体部２０６に備えられていてもよいし、頭部２０４に備えられていてもよい。いずれにしても、ひねりモータ２２１及び上下モータ２２２は、筐体２０７の内部に設けられている。

【0012】

ひねりモータ２２１は、連結部２０５を通り胴体部２０６の前後方向に延びる第１回転軸を中心として、頭部２０４を、胴体部２０６に対して、回転させることができる。また、上下モータ２２２は、連結部２０５を通り胴体部２０６の幅方向に延びる第２回転軸を中心として、頭部２０４を、胴体部２０６に対して、上方又は下方に回転させることができる。

【0013】

また、ロボット２００は、タッチセンサ２１１を備え、ユーザがロボット２００を撫でたり叩いたりしたことを検出することができる。より詳細には、図２に示すように、頭部２０４にタッチセンサ２１１Ｈを備え、ユーザが頭部２０４を撫でたり叩いたりしたことを検出することができる。また、図２及び図３に示すように、胴体部２０６の左側面の前後にそれぞれタッチセンサ２１１ＬＦ及びタッチセンサ２１１ＬＲを、胴体部２０６の右側面の前後にそれぞれタッチセンサ２１１ＲＦ及びタッチセンサ２１１ＲＲを備え、ユーザが胴体部２０６を撫でたり叩いたりしたことを検出することができる。

【0014】

また、ロボット２００は、胴体部２０６に加速度センサ２１２を備え、ロボット２００の姿勢（向き）の検出や、ユーザによって持ち上げられたり、向きを変えられたり、投げられたりしたことを検出することができる。また、ロボット２００は、胴体部２０６にジャイロセンサ２１３を備え、ロボット２００が振動したり転がったり回転したりしていることを検出することができる。

【0015】

また、ロボット２００は、胴体部２０６にマイクロフォン２１４を備え、外部の音を検出することができる。図２に示すように、マイクロフォン２１４は筐体２０７表面の、外部環境音の取得に好適な位置に設けられている。また、マイクロフォン２１４は、サーボモータ（ひねりモータ２２１及び上下モータ２２２）の音を拾い難くする集音特性を有する指向性を備えていてもよい。

【0016】

さらに、ロボット２００は、胴体部２０６にスピーカ２３１を備え、スピーカ２３１を用いて鳴き声を発したり、歌を歌ったりすることができる。

【0017】

なお、本実施形態では加速度センサ２１２、ジャイロセンサ２１３、マイクロフォン２１４及びスピーカ２３１が胴体部２０６に備えられているが、これらの全て又は一部が頭部２０４に備えられていてもよい。また、胴体部２０６に備えられた加速度センサ２１２、ジャイロセンサ２１３、マイクロフォン２１４及びスピーカ２３１に加えて、これらの全て又は一部を頭部２０４にも備えるようにしてもよい。また、タッチセンサ２１１は、頭部２０４及び胴体部２０６にそれぞれ備えられているが、頭部２０４又は胴体部２０６のいずれか片方のみに備えられていてもよい。またこれらはいずれも複数備えられていてもよい。

【0018】

次に、ロボット２００の機能構成について説明する。ロボット２００は、図４に示すように、動作制御装置１００と、センサ部２１０と、動作部２２０と、音声出力部２３０と、操作入力部２４０と、を備える。そして、動作制御装置１００は、制御部１１０と、記憶部１２０と、通信部１３０と、を備える。図４では、動作制御装置１００と、センサ部２１０、動作部２２０、音声出力部２３０及び操作入力部２４０とが、バスラインＢＬを介して接続されているが、これは一例である。動作制御装置１００と、センサ部２１０、動作部２２０、音声出力部２３０及び操作入力部２４０とは、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ケーブル等の有線インタフェースや、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の無線インタフェースで接続されていてもよい。また、制御部１１０と記憶部１２０や通信部１３０とは、バスラインＢＬを介して接続されていてもよい。

【0019】

動作制御装置１００は、制御部１１０及び記憶部１２０により、ロボット２００の動作を制御する。なお、ロボット２００は、動作制御装置１００によって制御される装置なので、被制御装置とも呼ばれる。

【0020】

制御部１１０は、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等のプロセッサで構成され、記憶部１２０に記憶されたプログラムにより、後述する各種処理を実行する。なお、制御部１１０は、複数の処理を並行して実行するマルチスレッド機能に対応しているため、後述する各種処理を並行に実行することができる。また、制御部１１０は、クロック機能やタイマー機能も備えており、日時等を計時することができる。

【0021】

記憶部１２０は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、フラッシュメモリ、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等で構成される。ＲＯＭには、制御部１１０のＣＰＵが実行するプログラム及びプログラムを実行する上で予め必要なデータが、記憶されている。フラッシュメモリは書き込み可能な不揮発性のメモリであり、電源ＯＦＦ後も保存させておきたいデータが記憶される。ＲＡＭには、プログラム実行中に作成されたり変更されたりするデータが記憶される。記憶部１２０は、例えば後述する感情データ１２１、感情変化データ１２２、成長日数データ１２３、制御内容テーブル１２４、音声バッファ１２５、音声履歴１２６、タッチ履歴１２７等を記憶する。

【0022】

通信部１３０は、無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）等に対応した通信モジュールを備え、スマートフォン等の外部装置とデータ通信する。

【0023】

センサ部２１０は、前述したタッチセンサ２１１、加速度センサ２１２、ジャイロセンサ２１３、及びマイクロフォン２１４を備える。制御部１１０は、センサ部２１０が備える各種センサが検出した検出値を、ロボット２００に作用する外部刺激を表す外部刺激データとして、取得する。なお、センサ部２１０は、タッチセンサ２１１、加速度センサ２１２、ジャイロセンサ２１３、マイクロフォン２１４以外のセンサを備えてもよい。センサ部２１０が備えるセンサの種類を増やすことにより、制御部１１０が取得できる外部刺激の種類を増やすことができる。例えば、センサ部２１０はＣＣＤ（Ｃｈａｒｇｅ－ＣｏｕｐｌｅｄＤｅｖｉｃｅ）イメージセンサ等の画像取得部を備えてもよい。この場合、制御部１１０は、画像取得部が取得した画像を認識して、周囲にいる人が誰（例えば飼い主、いつもお世話してくれる人、知らない人等）なのか等を判定することができるようになる。

【0024】

タッチセンサ２１１は、何らかの物体が接触したことを検出する。タッチセンサ２１１は、例えば圧力センサや静電容量センサにより構成される。制御部１１０は、タッチセンサ２１１からの検出値に基づいて、接触強度や接触時間を取得し、これらの値に基づいて、ユーザによってロボット２００が撫でられていることや、叩かれたりしていること等の外部刺激を検出することができる（例えば特開２０１９－２１７１２２号公報を参照）。なお、制御部１１０は、これらの外部刺激をタッチセンサ２１１以外のセンサで検出してもよい（例えば特許第６５７５６３７号公報を参照）。

【0025】

加速度センサ２１２は、ロボット２００の胴体部２０６の前後方向（Ｘ軸方向）、幅（左右）方向（Ｙ軸方向）及び上下方向（Ｚ軸方向）から成る３軸方向の加速度を検出する。加速度センサ２１２は、ロボット２００が静止しているときには重力加速度を検出するので、制御部１１０は、加速度センサ２１２が検出した重力加速度に基づいて、ロボット２００の現在の姿勢を検出することができる。また、例えばユーザがロボット２００を持ち上げたり投げたりした場合には、加速度センサ２１２は、重力加速度に加えてロボット２００の移動に伴う加速度を検出する。したがって、制御部１１０は、加速度センサ２１２が検出した検出値から重力加速度の成分を除去することにより、ロボット２００の動きを検出することができる。

【0026】

ジャイロセンサ２１３は、ロボット２００の３軸の角速度を検出する。３軸の角速度から、制御部１１０は、ロボット２００の回転の状態を判定できる。また、３軸の角速度の最大値から、制御部１１０は、ロボット２００の振動の状態を判定することができる。

【0027】

本実施形態では、後述するタッチ入力処理において、制御部１１０は、加速度センサ２１２が検出した重力加速度に基づいてロボット２００の現在の姿勢を、水平、裏返し、上向き、下向き、横向き（左横向き又は右横向き）のいずれであるかを判定する。そして、判定結果に応じて、数値０～４のいずれかの値（水平なら０、裏返しなら１、上向きなら２、下向きなら３、横向きなら４）を変数ｄｉｒの値として記憶部１２０に記憶する。

【0028】

また、後述するタッチ入力処理において、制御部１１０は、タッチセンサ２１１Ｈの検出値に基づいて頭部のタッチ強度を、タッチセンサ２１１ＬＦ及びタッチセンサ２１１ＬＲの検出値に基づいて左側面のタッチ強度を、タッチセンサ２１１ＲＦ及びタッチセンサ２１１ＲＲの検出値に基づいて右側面のタッチ強度を、ジャイロセンサ２１３の検出値に基づいて振動強度を、それぞれ取得する。そして、制御部１１０は、取得した強度を、それぞれ変数ｔｏｕｃｈ＿Ｈｅａｄ（頭部のタッチ強度）、変数ｔｏｕｃｈ＿Ｌｅｆｔ（左側面のタッチ強度）、変数ｔｏｕｃｈ＿Ｒｉｇｈｔ（右側面のタッチ強度）、変数ｇｙｒｏ＿Ｌｅｖｅｌ（振動強度）の値として記憶部１２０に記憶する。

【0029】

タッチ入力処理においては、制御部１１０は、上述のようにして取得した各種検出値を統合して、タッチ特徴パラメータとして扱う。すなわち、タッチ特徴パラメータは、ロボット２００の姿勢（ｄｉｒ）、頭部のタッチ強度（ｔｏｕｃｈ＿Ｈｅａｄ）、左側面のタッチ強度（ｔｏｕｃｈ＿Ｌｅｆｔ）、右側面のタッチ強度（ｔｏｕｃｈ＿Ｒｉｇｈｔ）、振動強度（ｇｙｒｏ＿Ｌｅｖｅｌ）の５次元の情報からなる。

【0030】

そして、タッチ特徴パラメータは記憶部１２０に、先入れ先出し（ＦＩＦＯ：ＦｉｒｓｔＩｎＦｉｒｓｔＯｕｔ）方式で履歴保存数（本実施形態では２５６個）記憶される。本実施形態では、タッチ特徴パラメータを記憶するＦＩＦＯをＴＦＩＦＯと呼び、ＴＦＩＦＯに保存されているタッチ特徴パラメータの個数はＴＦＩＦＯ＿ＳＩＺＥという変数に保存されているものとする。すなわち、ＴＦＩＦＯ＿ＳＩＺＥの初期値は０であり、新たなタッチ特徴パラメータが記憶されるたびに１ずつ増える。そして、履歴保存数まで増えた後はＴＦＩＦＯ＿ＳＩＺＥは履歴保存数のまま一定となり、ＴＦＩＦＯに新しいタッチ特徴パラメータが記憶されるたびに、最も古いタッチ特徴パラメータはＴＦＩＦＯから削除されていく。ＴＦＩＦＯは、タッチ特徴パラメータの履歴が記憶されるので、タッチ履歴とも呼ばれる。

【0031】

図４に戻り、マイクロフォン２１４は、ロボット２００の周囲の音を検出する音声取得部である。制御部１１０は、マイクロフォン２１４が検出した音を分析することにより、例えばユーザがロボット２００に呼びかけていることや、手を叩いていること等を検出することができる。

【0032】

具体的には、制御部１１０は、マイクロフォン２１４から取得した音データを規定のサンプリング周波数（本実施形態では１６，３８４Ｈｚ）及び量子化ビット数（本実施形態では１６ビット）でサンプリングし、記憶部１２０の音声バッファ１２５に保存する。本実施形態では音声バッファ１２５（音データの格納領域）は、５１２サンプルのサンプリングデータが含まれる音声サブバッファが、マイクロフォン２１４から取得した音データを解析し、その音データが話し声であり、且つ、その話し声が過去に取得した音声に類似しているか否かを判定するのに必要最小なデータ量に対応する基準数個（本実施形態では１６個）連続したものとして構成される。すなわち、図５に図示するように連続する１６個の音声サブバッファ１２５０を１つの単位として音声履歴に保存された音声との類似度を判定する。

【0033】

また、本実施形態では、この連続する１６個の音声サブバッファ１２５０を、最初（１番目）の音声サブバッファ１２５０ならｂｕｆ［０］、最後（１６番目）の音声サブバッファ１２５０ならｂｕｆ［１５］といった配列変数で表すこととする。この１６個の音声サブバッファ１２５０からなる音声バッファ１２５により、５１２サンプル×１６個／１６３８４Ｈｚ＝０．５秒の音データが格納される。そして、この０．５秒という期間は、制御部１１０がマイクロフォン２１４から取得した音データを解析し、マイクロフォン２１４から取得された音声が人の声であると判定するために必要なサンプルデータのデータ量に対応することになる。

【0034】

なお、本実施形態では、制御部１１０がマイクロフォン２１４から取得した音データを音声バッファ１２５に保存する処理は、音声バッファ保存スレッドとして、他の処理とは並行に実行されている（音声バッファ保存スレッドは、ユーザがロボット２００の電源を入れると実行開始される）。音声バッファ保存スレッドでは、制御部１１０は、マイクロフォン２１４から取得した音データを（例えばＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）による）ローパスフィルタにかけてノイズ除去を行ってから、規定のサンプリング周波数及び量子化ビット数でサンプリングして、音声バッファ１２５に保存していく。

【0035】

また、本実施形態では、後述する音声特徴パラメータ算出処理で、制御部１１０は、１つの音声サブバッファ１２５０中の５１２サンプルのサンプリングデータから、３つのケプストラム情報を算出する処理を、１６個の音声サブバッファ１２５０のそれぞれについて行う。これによって得られる４８（＝３×１６）個のデータを、制御部１１０は、４８次元の音声特徴パラメータとして扱う。

【0036】

この音声特徴パラメータは記憶部１２０に、先入れ先出し（ＦＩＦＯ）方式で履歴保存数（例えば２５６個）記憶される。本実施形態では、音声特徴パラメータを記憶するＦＩＦＯをＶＦＩＦＯと呼び、ＶＦＩＦＯに保存されている音声特徴パラメータの個数はＶＦＩＦＯ＿ＳＩＺＥという変数に保存されているものとする。ＶＦＩＦＯは、音声特徴パラメータの履歴が記憶されるので、音声履歴とも呼ばれる。

【0037】

図４に戻り、動作部２２０は、ひねりモータ２２１及び上下モータ２２２を備え、制御部１１０によって駆動される。制御部１１０が動作部２２０を制御することにより、ロボット２００は、例えば頭部２０４を持ち上げたり（第２回転軸を中心として上方に回転させたり）、横にひねったり（第１回転軸を中心として右方又は左方にひねり回転させたり）するような動作を表現することができる。これらの動作を行うための制御データ（モーションデータ）は、記憶部１２０に記録されており、検出した外部刺激や、後述する感情データ１２１、類似度等に基づいて、ロボット２００の動作が制御される。

【0038】

なお、上記は動作部２２０の一例である。動作部２２０は車輪、クローラ等の移動手段であってもよい。また、ロボット２００が手足、尻尾等の部材を備え、動作部２２０がこれらの部材（手足や尻尾等）を動かすようになっていてもよい。動作部２２０の動作により、頭部２０４や手足等の部材は、筐体２０７の胴体部２０６との位置関係が変更されることになる。

【0039】

音声出力部２３０は、スピーカ２３１を備え、制御部１１０が音のデータを音声出力部２３０に入力することにより、スピーカ２３１から音が出力される。例えば、制御部１１０がロボット２００の鳴き声のデータを音声出力部２３０に入力することにより、ロボット２００は疑似的な鳴き声を発する。この鳴き声のデータも、記憶部１２０に制御データ（効果音データ）として記録されており、検出した外部刺激や、後述する感情データ１２１、類似度等に基づいて鳴き声が選択される。

【0040】

操作入力部２４０は、例えば、操作ボタン、ボリュームつまみ等から構成される。操作入力部２４０は、ユーザ（所有者や被貸与者）による操作、例えば、電源ＯＮ／ＯＦＦ、出力音のボリューム調整等を受け付けるためのインタフェースである。なお、ロボット２００は生き物感をより高めるために、操作入力部２４０として電源スイッチのみを外装２０１の内側に備え、それ以外の操作ボタンやボリュームつまみ等を備えなくてもよい。この場合でも、通信部１３０を介して接続した外部のスマートフォン等を用いてロボット２００のボリューム調整等の操作を行うことができる。

【0041】

以上、ロボット２００の機能構成について説明した。次に、記憶部１２０に記憶されるデータである、感情データ１２１、感情変化データ１２２、成長日数データ１２３、制御内容テーブル１２４、音声バッファ１２５、音声履歴１２６及びタッチ履歴１２７について、順に説明する。

【0042】

感情データ１２１は、ロボット２００に疑似的な感情を持たせるためのデータであり、感情マップ３００上の座標を示すデータ（Ｘ，Ｙ）である。感情マップ３００は図６に示すように、Ｘ軸３１１として安心度（不安度）の軸、Ｙ軸３１２として興奮度（無気力度）の軸を持つ２次元の座標系で表される。感情マップ上の原点３１０（０，０）が通常時の感情を表す。そして、Ｘ座標の値（Ｘ値）が正でその絶対値が大きくなるほど安心度が高く、Ｙ座標の値（Ｙ値）が正でその絶対値が大きくなるほど興奮度が高い感情を表す。また、Ｘ値が負でその絶対値が大きくなるほど不安度が高く、Ｙ値が負でその絶対値が大きくなるほど無気力度が高い感情を表す。なお、図６では感情マップ３００が２次元の座標系で表されているが、感情マップ３００の次元数は任意である。

【0043】

本実施形態においては、感情マップ３００の初期値としてのサイズは、図６の枠３０１に示すように、Ｘ値もＹ値も最大値が１００、最小値が－１００となっている。そして、第１期間の間、ロボット２００の疑似的な成長日数が１日増える度に、感情マップ３００の最大値、最小値ともに２ずつ拡大されていく。ここで第１期間とは、ロボット２００が疑似的に成長する期間であり、ロボット２００の疑似的な生誕から例えば５０日の期間である。なお、ロボット２００の疑似的な生誕とは、ロボット２００の工場出荷後のユーザによる初回の起動時である。成長日数が２５日になると、図６の枠３０２に示すように、Ｘ値もＹ値も最大値が１５０、最小値が－１５０となる。そして、第１期間（この例では５０日）が経過すると、それにより、ロボット２００の疑似的な成長が完了したとして、図６の枠３０３に示すように、Ｘ値もＹ値も最大値が２００、最小値が－２００となって、感情マップ３００のサイズが固定される。

【0044】

感情変化データ１２２は、感情データ１２１のＸ値及びＹ値の各々を増減させる変化量を設定するデータである。本実施形態では、感情データ１２１のＸに対応する感情変化データ１２２として、Ｘ値を増加させるＤＸＰと、Ｘ値を減少させるＤＸＭとがあり、感情データ１２１のＹ値に対応する感情変化データ１２２として、Ｙ値を増加させるＤＹＰと、Ｙ値を減少させるＤＹＭとがある。すなわち、感情変化データ１２２は、以下の４つの変数からなり、ロボット２００の疑似的な感情を変化させる度合いを示すデータである。
ＤＸＰ：安心し易さ（感情マップでのＸ値のプラス方向への変化し易さ）
ＤＸＭ：不安になり易さ（感情マップでのＸ値のマイナス方向への変化し易さ）
ＤＹＰ：興奮し易さ（感情マップでのＹ値のプラス方向への変化し易さ）
ＤＹＭ：無気力になり易さ（感情マップでのＹ値のマイナス方向への変化し易さ）

【0045】

本実施形態では、一例として、これらの変数の初期値をいずれも１０とし、後述する動作制御処理の中の感情変化データ１２２を学習する処理により、最大２０まで増加するものとしている。この学習処理により、感情変化データ１２２、すなわち感情の変化度合いが変化するので、ロボット２００は、ユーザによるロボット２００との接し方に応じて、様々な性格を持つことになる。

【0046】

成長日数データ１２３は、初期値が１であり、１日経過する度に１ずつ加算されていく。成長日数データ１２３により、ロボット２００の疑似的な成長日数（疑似的な生誕からの日数）が表されることになる。

【0047】

制御内容テーブル１２４には、図７に示すように、制御条件と制御データとが対応して記憶されている。制御部１１０は、制御条件（例えば、何らかの外部刺激が検出された）が満たされると、対応する制御データ（動作部２２０で動作を表現するためのモーションデータ及び、音声出力部２３０から効果音を出力するための効果音データ）に基づき、動作部２２０及び音声出力部２３０を制御する。

【0048】

モーションデータは、図７に示すように、動作部２２０を制御する一連のシーケンスデータ（「時間（ミリ秒）：上下モータ２２２の回転角度（度）：ひねりモータ２２１の回転角度（度）」の並び）である。例えば、体を撫でられたら、最初（０秒時）は上下モータ２２２及びひねりモータ２２１の回転角度を０度（上下基準角度及びひねり基準角度）にし、０．５秒時に上下モータ２２２の回転角度が６０度になるように頭部２０４を上げ、１秒時にひねりモータ２２１の回転角度が６０度になるように頭部２０４をひねり、というように制御部１１０は動作部２２０を制御する。

【0049】

また、効果音データは、図７では、わかりやすく示すために、各効果音データを説明する文が記載されているが、実際にはこれらの文で説明されている効果音データ自身（サンプリングされた音のデータ）が、効果音データとして制御内容テーブル１２４に格納されている。

【0050】

なお、図７に示す制御内容テーブルでは、制御条件に感情（感情マップ３００上の座標で表される）や後述する履歴（音声履歴１２６及びタッチ履歴１２７）との類似度に関する条件が含まれていないが、これらの条件を含める等して、感情や履歴との類似度に応じて制御データを変化させてもよい。

【0051】

音声バッファ１２５は、上述したように、マイクロフォン２１４から取得した音を規定のサンプリング周波数及び量子化ビット数でサンプリングしたデータが格納される領域である。図５では音声バッファ１２５は、基準数個（１６個）の音声サブバッファ１２５０から構成されているが、基準数個以上の音声サブバッファ１２５０によるリングバッファで構成されていてもよい。

【0052】

音声履歴１２６は、上述したように、音声特徴パラメータの履歴が先入れ先出し方式で履歴保存数分記憶される記憶領域（ＶＦＩＦＯ）である。音声履歴１２６は、履歴保存数の要素からなるリングバッファで構成されており、古いデータは自動的に新しいデータに上書きされていく。

【0053】

タッチ履歴１２７は、上述したように、タッチ特徴パラメータの履歴が先入れ先出し方式で履歴保存数分記憶される記憶領域（ＴＦＩＦＯ）である。タッチ履歴１２７は、履歴保存数の要素からなるリングバッファで構成されており、古いデータは自動的に新しいデータに上書きされていく。なお、音声履歴１２６の履歴保存数とタッチ履歴１２７の履歴保存数とは異なっていてもよい。

【0054】

次に、図８に示すフローチャートを参照しながら、動作制御装置１００の制御部１１０が実行する動作制御処理について説明する。動作制御処理は、制御部１１０が、センサ部２１０からの検出値等に基づいて、ロボット２００の動作（動きや鳴き声等）を制御する処理である。ユーザがロボット２００の電源を入れると、他の必要な処理と並行に、この動作制御処理のスレッドが実行開始される。動作制御処理により、動作部２２０や音声出力部２３０が制御され、ロボット２００の動きが表現されたり、鳴き声等の効果音が出力されたりする。

【0055】

まず、制御部１１０は、感情データ１２１、感情変化データ１２２、成長日数データ１２３等の各種データを初期化処理する（ステップＳ１０１）。本実施形態で用いる各種変数（ＢｉｇＳｏｕｎｄ＿Ｆｌａｇ，ＴａｌｋＳｏｕｎｄ＿Ｆｌａｇ，Ｔｏｕｃｈ＿Ｆｌａｇ等）もステップＳ１０１でＯＦＦ又は０に初期化される。

【0056】

そして、制御部１１０は、マイクロフォン２１４で対象（ユーザ）からの外部刺激（音声）を取得するためにマイク入力処理を実行する（ステップＳ１０２）。マイク入力処理の詳細は後述する。

【0057】

次に、制御部１１０は、タッチセンサ２１１や加速度センサ２１２で対象（ユーザ）からの外部刺激（撫でられる、持ち上げられる等）を取得するためにタッチ入力処理を実行する（ステップＳ１０３）。タッチ入力処理の詳細は後述する。

【0058】

なお、本実施形態では説明を分かり易くするためにマイク入力処理とタッチ入力処理とを別々の処理として説明しているが、１つの処理（外部入力処理）として、センサ部２１０が備える各種センサから外部刺激を取得してもよい。

【0059】

そして、制御部１１０は、センサ部２１０で外部刺激が取得されたか否かを判定する（ステップＳ１０４）。例えば、上述のマイク入力処理により、大きな音を検出するとＢｉｇＳｏｕｎｄ＿ＦｌａｇがＯＮになり、人の話し声を検出するとＴａｌｋＳｏｕｎｄ＿ＦｌａｇがＯＮになる。また、上述のタッチ入力処理により、各種センサ（タッチセンサ２１１、加速度センサ２１２、ジャイロセンサ２１３）により外部刺激を検出するとＴｏｕｃｈ＿ＦｌａｇがＯＮになる。したがって、これらのフラグ変数の値に基づいて、制御部１１０は、ステップＳ１０４における外部刺激の取得の有無の判定が可能である。

【0060】

外部刺激が取得されたと判定された場合（ステップＳ１０４；Ｙｅｓ）、制御部１１０は、マイク入力処理及びタッチ入力処理で取得された外部刺激に応じて、感情データ１２１に加算又は減算する感情変化データ１２２を取得する（ステップＳ１０５）。例えば、外部刺激として頭部２０４が撫でられたことを検出すると、ロボット２００は疑似的な安心感を得るので、制御部１１０は、感情データ１２１のＸ値に加算する感情変化データ１２２としてＤＸＰを取得する。

【0061】

そして、制御部１１０は、ステップＳ１０５で取得された感情変化データ１２２に応じて感情データ１２１を設定する（ステップＳ１０６）。例えば、ステップＳ１０５で感情変化データ１２２としてＤＸＰが取得されていたなら、制御部１１０は、感情データ１２１のＸ値に感情変化データ１２２のＤＸＰを加算する。ただし、感情変化データ１２２を加算すると感情データ１２１の値（Ｘ値、Ｙ値）が感情マップ３００の最大値を超える場合には、感情データ１２１の値は感情マップ３００の最大値に設定される。また、感情変化データ１２２を減算すると感情データ１２１の値が感情マップ３００の最小値未満になる場合には、感情データ１２１の値は感情マップ３００の最小値に設定される。

【0062】

ステップＳ１０５及びステップＳ１０６において、外部刺激の各々に対して、どのような感情変化データ１２２が取得されて、感情データ１２１が設定されるかは任意に設定可能であるが、ここでは、以下に一例を示す。

【0063】

頭部２０４を撫でられる（安心する）：Ｘ＝Ｘ＋ＤＸＰ
頭部２０４を叩かれる（不安になる）：Ｘ＝Ｘ－ＤＸＭ
（これらの外部刺激は頭部２０４のタッチセンサ２１１Ｈで検出可能）
胴体部２０６を撫でられる（興奮する）：Ｙ＝Ｙ＋ＤＹＰ
胴体部２０６を叩かれる（無気力になる）：Ｙ＝Ｙ－ＤＹＭ
（これらの外部刺激は胴体部２０６のタッチセンサ２１１で検出可能）
頭を上にして抱かれる（喜ぶ）：Ｘ＝Ｘ＋ＤＸＰ及びＹ＝Ｙ＋ＤＹＰ
頭を下にして宙づりにされる（悲しむ）：Ｘ＝Ｘ－ＤＸＭ及びＹ＝Ｙ－ＤＹＭ
（これらの外部刺激はタッチセンサ２１１及び加速度センサ２１２で検出可能）
優しい声で呼びかけられる（平穏になる）：Ｘ＝Ｘ＋ＤＸＰ及びＹ＝Ｙ－ＤＹＭ
大きな声で怒鳴られる（イライラする）：Ｘ＝Ｘ－ＤＸＭ及びＹ＝Ｙ＋ＤＹＰ
（これらの外部刺激はマイクロフォン２１４で検出可能）

【0064】

そして、制御部１１０は、制御内容テーブル１２４を参照して、ステップＳ１０２及びステップＳ１０３で取得された外部刺激により満たされる制御条件に対応した制御データを取得する（ステップＳ１０７）。

【0065】

そして、制御部１１０は、制御データ再生スレッドを起動して、ステップＳ１０７で取得した制御データを再生する（ステップＳ１０８）。制御データ再生スレッドは、制御データを再生する（モーションデータに基づいて動作部２２０を制御し、効果音データに基づいて音声出力部２３０から音を出力する）だけのスレッドであるが、動作制御処理とは別のスレッドで実行させることにより、ロボット２００が制御データに基づいて動作している際にも並行して動作制御処理を進められるようにしている。

【0066】

そして、制御部１１０は、フラグ変数（ＢｉｇＳｏｕｎｄ＿Ｆｌａｇ、ＴａｌｋＳｏｕｎｄ＿Ｆｌａｇ、Ｔｏｕｃｈ＿Ｆｌａｇ）をＯＦＦに設定し（ステップＳ１０９）、ステップＳ１１２に進む。

【0067】

一方、外部刺激が取得されなかったと判定した場合（ステップＳ１０４；Ｎｏ）、制御部１１０は、動作部２２０をある一定のリズムで周期的に駆動することでロボット２００が呼吸をしているように見せる呼吸動作等の自発的な動作を行うか否かを判定する（ステップＳ１１０）。自発的な動作を行うか否かの判定方法は任意だが、本実施形態では、呼吸周期（例えば２秒）毎にステップＳ１１０での判定がＹｅｓになり、呼吸動作が行われるものとする。

【0068】

自発的な動作を行うと判定した場合（ステップＳ１１０；Ｙｅｓ）、制御部１１０は、自発的な動作（例えば呼吸動作）を実行し（ステップＳ１１１）、ステップＳ１１２に進む。

【0069】

自発的な動作を行わないと判定した場合（ステップＳ１１０；Ｎｏ）、制御部１１０は、内蔵するクロック機能により、日付が変わったか否かを判定する（ステップＳ１１２）。日付が変わっていないと判定した場合（ステップＳ１１２；Ｎｏ）、制御部１１０はステップＳ１０２に戻る。

【0070】

一方、日付が変わったと判定した場合（ステップＳ１１２；Ｙｅｓ）、制御部１１０は、第１期間中であるか否かを判定する（ステップＳ１１３）。第１期間を、ロボット２００の疑似的な生誕（例えば購入後のユーザによる初回の起動時）から例えば５０日の期間とすると、制御部１１０は、成長日数データ１２３が５０以下なら第１期間中であると判定する。第１期間中でないと判定した場合（ステップＳ１１３；Ｎｏ）、制御部１１０は、ステップＳ１１６に進む。

【0071】

第１期間中であると判定した場合（ステップＳ１１３；Ｙｅｓ）、制御部１１０は、感情変化データ１２２の学習処理を実行する（ステップＳ１１４）。感情変化データ１２２の学習処理とは、具体的には、その日のステップＳ１０６において、感情データ１２１の値が１度でも感情マップ３００の最大値又は最小値に達したら対応する感情変化データ１２２を増加させる処理である。例えば、感情データ１２１のＸ値が１度でも感情マップ３００の最大値に設定されたなら感情変化データ１２２のＤＸＰに１を加算し、Ｙ値が１度でも感情マップ３００の最大値に設定されたならＤＹＰに１を加算し、Ｘ値が１度でも感情マップ３００の最小値に設定されたならＤＸＭに１を加算し、Ｙ値が１度でも感情マップ３００の最小値に設定されたならＤＹＭに１を加算する。ただし、感情変化データ１２２の各値が大きくなりすぎると、感情データ１２１の１回の変化量が大きくなりすぎるので、感情変化データ１２２の各値は例えば２０を最大値とし、それを超えて増加しないようにする。

【0072】

そして、制御部１１０は、感情マップを拡大する（ステップＳ１１５）。感情マップの拡大とは、具体的には、制御部１１０が、感情マップ３００を最大値、最小値ともに、２だけ拡大する処理である。ただし、この拡大する数値「２」はあくまでも一例であり、３以上拡大してもよいし、１だけ拡大してもよい。また感情マップ３００の軸毎、また最大値と最小値とで、拡大する数値が同じでなくてもよい。

【0073】

そして、制御部１１０は、成長日数データ１２３に１を加算し（ステップＳ１１６）、感情データ１２１をＸ値、Ｙ値ともに０に初期化して（ステップＳ１１７）、ステップＳ１０２に戻る。

【0074】

次に、動作制御処理（図８）のステップＳ１０２で実行されるマイク入力処理について、図９を参照して説明する。

【0075】

まず、制御部１１０は、音声バッファ１２５の最初の音声サブバッファ１２５０、すなわちｂｕｆ［０］に格納されたサンプリングデータの最大レベルを変数ＭＬに代入する（ステップＳ２０１）。そして、制御部１１０は、変数ＭＬの値がＢｉｇＳｏｕｎｄＴｈよりも大きいか否かを判定する（ステップＳ２０２）。なお、ＢｉｇＳｏｕｎｄＴｈは、これよりも大きい音に対してはロボット２００が驚く動作を行う値（大音閾値）である。変数ＭＬがＢｉｇＳｏｕｎｄＴｈよりも大きいと判定した場合（ステップＳ２０２；Ｙｅｓ）、制御部１１０は、大きな音が入力されたことを示す変数ＢｉｇＳｏｕｎｄ＿ＦｌａｇをＯＮにして（ステップＳ２０３）、マイク入力処理を終了し、動作制御処理のステップＳ１０３に進む。

【0076】

一方、変数ＭＬがＢｉｇＳｏｕｎｄＴｈより大きくないと判定した場合（ステップＳ２０２；Ｎｏ）、制御部１１０は、変数ＭＬの値がＴａｌｋＳｏｕｎｄＴｈよりも大きいか否かを判定する。なお、ＴａｌｋＳｏｕｎｄＴｈは、これ以下の音ならロボット２００は話し声として聞き取ることができない値（話声閾値）である。変数ＭＬがＴａｌｋＳｏｕｎｄＴｈより大きくないと判定した場合（ステップＳ２０４；Ｎｏ）、制御部１１０は、マイク入力処理を終了し、動作制御処理のステップＳ１０３に進む。

【0077】

一方、変数ＭＬがＴａｌｋＳｏｕｎｄＴｈより大きいと判定した場合（ステップＳ２０４；Ｙｅｓ）、制御部１１０は、動作部２２０のひねりモータ２２１及び上下モータ２２２を一時停止させる（ステップＳ２０５）。これにより、制御データ再生スレッドで制御されている動作部２２０の動作が一時停止するため、動作部２２０の動作によって生じるノイズは発生しなくなる。

【0078】

そして、制御部１１０は、音データが保存された音声サブバッファ１２５０の数が基準数（ここではｂｕｆ［０］～ｂｕｆ［１５］の１６個）未満か否かを判定する（ステップＳ２０６）。音データが保存された音声サブバッファ１２５０の数が基準数未満と判定した場合（ステップＳ２０６；Ｙｅｓ）、制御部１１０はステップＳ２０６に戻り、基準数個に達するまで音声サブバッファ１２５０に音データが保存されるのを待機する。

【0079】

なお、音声バッファ保存スレッドにより、音声バッファ１２５には逐次音データが保存されていくため、マイク入力処理において待機することにより、いずれは（遅くとも、基準数個である１６個分の音声サブバッファ１２５０の全サイズに対応する０．５秒後には）音データが保存された音声サブバッファ１２５０の数が基準数個に達する。

【0080】

一方、音データを保存した音声サブバッファ１２５０の数が基準数に達したと判定した場合（ステップＳ２０６；Ｎｏ）、制御部１１０は、動作部２２０のひねりモータ２２１及び上下モータ２２２の動作を再開させる（ステップＳ２０７）。これにより、制御データ再生スレッドで制御されている動作部２２０の動作が再開するので、動作部２２０が一時停止している時間は長くとも０．５秒以下となり、ユーザにロボット２００の動きの不自然さを感じさせずにすむ。

【0081】

そして、制御部１１０は、音声特徴パラメータ算出処理を行う（ステップＳ２０８）。音声特徴パラメータ算出処理の詳細は後述する。

【0082】

そして、制御部１１０は、基準数個の音声サブバッファ１２５０に保存された音がノイズであるか否かを判定する（ステップＳ２０９）。ノイズであるか否かの判定方法としては任意の方法を適用可能だが、本実施形態では、以下の３つのノイズ判定方法（第１、第２及び第３のノイズ判定方法）を用いる。

【0083】

まず、第１のノイズ判定方法においては、制御部１１０は、まず、基準数個の音声サブバッファ１２５０のうち、先頭部（ｂｕｆ［０］）からの所定数のバッファ（例えば３個の音声バッファ、すなわちｂｕｆ［０］、ｂｕｆ［１］及びｂｕｆ［２］）について、それぞれに保存されている音データのうち、最大レベルがＴａｌｋＳｏｕｎｄＴｈより大きい音データが保存されている音声サブバッファ１２５０の数を調べる。そして、最大レベルがＴａｌｋＳｏｕｎｄＴｈ以下の音データが保存されている音声サブバッファ１２５０が１つでも存在する場合、制御部１１０は、基準数個保存されている音声サブバッファ１２５０の音データは全てノイズであると判定する。

【0084】

第２のノイズ判定方法においては、制御部１１０は、基準数個の音声サブバッファ１２５０について、音データのピーク値がＴａｌｋＳｏｕｎｄＴｈ以上になっている音声サブバッファ１２５０が基準数個中何個あるかカウントし、所定個数（例えば５個）以下なら、基準数個保存されている音声サブバッファ１２５０の音データは全てノイズであると判定する。

【0085】

第３のノイズ判定方法においては、制御部１１０は、まず、基準数個の音声サブバッファ１２５０の音データをまとめて所定時間（例えば０．５秒）分の音データについて周波数成分を確認する。なお、上述の音声特徴パラメータ算出処理において、この周波数成分は算出済みなので、制御部１１０は、算出済みの周波数成分を確認すればよい。そして、周波数成分が低域から高域まで均一な場合や、低域の方が高域よりも小さい場合は、基準数個保存されている音声サブバッファ１２５０の音データは全てノイズであると判定する。

【0086】

上述のノイズ判定方法のいずれかにおいて、制御部１１０が、基準数個の音声サブバッファ１２５０に保存された音データがノイズであると判定した場合（ステップＳ２０９；Ｙｅｓ）、制御部１１０は、現在の基準数個の音声サブバッファ１２５０に保存された音データを無視して（すなわち、音の外部刺激は存在しなかったと判断して）、マイク入力処理を終了し、動作制御処理のステップＳ１０３に進む。

【0087】

一方、上述のノイズ判定方法の全てにおいて、制御部１１０が、基準数個の音声サブバッファ１２５０に保存された音はノイズでないと判定した場合（ステップＳ２０９；Ｎｏ）、制御部１１０は、サンプリングデータが話し声であると判断し、話し声が入力されたことを示す変数ＴａｌｋＳｏｕｎｄ＿ＦｌａｇにＯＮを代入する（ステップＳ２１０）。

【0088】

次に制御部１１０は、音声特徴パラメータ算出処理で算出した音声特徴パラメータと音声履歴１２６とを比較して過去の音声との類似度を取得する（ステップＳ２１１）。

【0089】

そして、制御部１１０は、ステップＳ２０８で算出された音声特徴パラメータを音声履歴１２６（ＶＦＩＦＯ）に保存し（ステップＳ２１２）、マイク入力処理を終了して、動作制御処理のステップＳ１０３に進む。

【0090】

なお、図９において、音声特徴パラメータ算出処理（ステップＳ２０８）は、ノイズ判定（ステップＳ２０９）と順番を入れ替えて、ノイズではないと判定された場合（ステップＳ２０９；Ｎｏ）にのみ音声特徴パラメータ算出処理に進むようにしてもよい。この場合、第３のノイズ判定方法において算出された周波数成分の情報を音声特徴パラメータ算出処理でも利用することができる。

【0091】

次に、マイク入力処理（図９）のステップＳ２０８で実行される音声特徴パラメータ算出処理について、図１０を参照して説明する。なお、ここでは音声サブバッファ１２５０の基準数を１６として説明する。

【0092】

まず、制御部１１０は、配列変数としての音声サブバッファ１２５０の各要素（ｂｕｆ［０］～ｂｕｆ［１５］）を指定するための変数ｉを０に初期化する（ステップＳ２３１）。そして、制御部１１０は、変数ｉが１６以上であるか否かを判定する（ステップＳ２３２）。変数ｉは１６以上である判定した場合（ステップＳ２３２；Ｙｅｓ）、制御部１１０は音声特徴パラメータ算出処理を終了してマイク入力処理のステップＳ２０９に進む。

【0093】

一方、変数ｉは１６未満と判定した場合（ステップＳ２３２；Ｎｏ）、制御部１１０は、ｂｕｆ［ｉ］に含まれている５１２サンプルについて、高速フーリエ変換（ＦＦＴ：ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ）を行う（ステップＳ２３３）。そして、制御部１１０は、ＦＦＴにより得られた最初の２５６個の振幅成分（音声データの周波数スペクトル）を算出する（ステップＳ２３４）。ここでは、振幅成分を変数α［０］～α［２５５］に格納することとすると、制御部１１０は、
α［ｎ］＝√（ｎ番目の実数成分の２乗＋ｎ番目の虚数成分の２乗）
（ただしｎは０～２５５）
を計算することになる。

【0094】

次に、制御部１１０は、２５６個の振幅成分それぞれの自然対数を算出する（ステップＳ２３５）。ここでは自然対数を変数β［０］～β［２５５］に格納することとすると、制御部１１０は、
β［ｎ］＝ｌｎ（α［ｎ］）
（ただしｎは０～２５５）
を計算することになる。

【0095】

次に、制御部１１０は算出した２５６個の自然対数に対して、再度ＦＦＴを行う（ステップＳ２３６）。そして、制御部１１０は、ＦＦＴにより得られた成分のうち、最初の方から直流成分（最初の１個目）を除く基準数個（本実施形態では３個）の成分の振幅成分を算出する（ステップＳ２３７）。ここではケプストラムが得られるので、これを変数Ｃｐｓ［０］～Ｃｐｓ［２］に格納することとすると、制御部１１０は、
Ｃｐｓ［ｎ－１］＝√（ｎ番目の実数成分の２乗＋ｎ番目の虚数成分の２乗）
（ただしｎは１～３）
を計算することになる。

【0096】

次に、制御部１１０は算出した３個のケプストラムを、音声特徴パラメータとして保存する（ステップＳ２３８）。ここでは、音声特徴パラメータを配列変数ＶＦ［ｉ，ｎ］に格納することとすると、制御部１１０は、
ＶＦ［ｉ，ｎ］＝Ｃｐｓ［ｎ］
（ただしｎは０～２）
を実行することになる。そして、制御部１１０は、変数ｉに１を加算して（ステップＳ２３９）、ステップＳ２３２に戻る。

【0097】

以上の音声特徴パラメータ算出処理により、１６×３＝４８の要素を持つ音声特徴パラメータ（ＶＦ［０，０］～ＶＦ［１５，２］）が得られる。この音声特徴パラメータは上述のように、低い周波数から直流成分を除く３個の成分のケプストラムで構成されるため、短時間（０．５秒）の音データから算出可能であるにも関わらず、人の違いを識別する能力が高い特徴量となる。

【0098】

次に、動作制御処理（図８）のステップＳ１０３で実行されるタッチ入力処理について、図１１を参照して説明する。

【0099】

まず制御部１１０は、タッチセンサ２１１、加速度センサ２１２、ジャイロセンサ２１３から、これら各センサで検出された検出値を取得する（ステップＳ３０１）。そして、制御部１１０は、検出値に基づいて、タッチセンサ２１１でタッチを検出したか、又は、加速度センサ２１２で検出された加速度が変化したか、又は、ジャイロセンサで検出された角速度が変化したかを判定する（ステップＳ３０２）。

【0100】

タッチ又は加速度変化又は角速度変化があったなら（ステップＳ３０２；Ｙｅｓ）、制御部１１０は変数Ｔｏｕｃｈ＿ＦｌａｇをＯＮにし（ステップＳ３０３）、タッチ特徴パラメータを算出する（ステップＳ３０４）。タッチ特徴パラメータは、上述したように、ロボット２００の姿勢（ｄｉｒ）、頭部のタッチ強度（ｔｏｕｃｈ＿Ｈｅａｄ）、左側面のタッチ強度（ｔｏｕｃｈ＿Ｌｅｆｔ）、右側面のタッチ強度（ｔｏｕｃｈ＿Ｒｉｇｈｔ）、振動強度（ｇｙｒｏ＿Ｌｅｖｅｌ）の５次元の情報からなる。

【0101】

そして、制御部１１０は、ステップＳ３０４で算出したタッチ特徴パラメータとタッチ履歴１２７とを比較して過去のセンサ情報との類似度を取得する（ステップＳ３０５）。

【0102】

そして、制御部１１０は、ステップＳ３０４で算出されたタッチ特徴パラメータをタッチ履歴１２７（ＴＦＩＦＯ）に先入れ先出し方式で保存する（ステップＳ３０６）。そして制御部１１０は、タッチ入力処理を終了して、動作制御処理のステップＳ１０４に進む。

【0103】

以上説明した動作制御処理により、制御部１１０は、ロボット２００（被制御装置）に作用する外部刺激を取得し、外部刺激に応じた動作を行う。そして、マイク入力処理により、制御部１１０は、マイクロフォン２１４で話し声を取得したと判定した場合、動作部２２０の動作を一時停止させることにより、ノイズの影響を低減する。

【0104】

ロボット２００は外装２０１（毛皮）で覆われているので、動作部２２０により頭部２０４が動くと外装２０１も動く。従って、動作部２２０が動作している間は、マイクロフォン２１４は、（動作部２２０の動作による）モータ音だけでなく、外装２０１が擦れる音も拾いやすい。本実施形態では、人の話し声を取得し始めると制御部１１０は動作部２２０の動作を一時停止させるため、モータ音だけでなく外装２０１が擦れる音の発生も防止でき、音声を誤認識してしまう可能性をより低減することができる。

【0105】

また、本実施形態では０．５秒の長さの音データから音声特徴パラメータを算出することができるため、動作部２２０を一時停止する所定期間は０．５秒以下に抑えることができる。したがって、音声の取得処理と動作部の動作処理との競合による互いの影響を軽減させ、ロボット２００の動きが不自然に見えてしまうことを防ぐことができる。

【0106】

（変形例）
なお、本発明は、上述の実施形態に限定されず、種々の変形及び応用が可能である。

【0107】

例えば、上述の実施形態ではマイク入力処理（図９）のステップＳ２０９でノイズではないと判定した場合にマイクロフォン２１４により取得された音声（音声バッファ１２５に格納された音データ）は人の声であると判定しているが、人の声であると判定する基準はこれに限らない。制御部１１０は、（マイク入力処理（図９）のステップＳ２０４で）音声サブバッファの最大レベルが話声閾値より大きければマイクロフォン２１４で取得された音声が人の声であると判定してもよい。また、制御部１１０は、（マイク入力処理（図９）のステップＳ２０８で）算出した音声特徴パラメータの値に基づいてマイクロフォン２１４で取得された音声が人の声か否かを判定してもよい。

【0108】

また、制御部１１０は、マイク入力処理で取得した音声履歴１２６との類似度が所定の値以上の場合には、音声を発したユーザとの親密度が高い（飼い主、いつもお世話してくれる人）と判断して、親密さを表す特別な動作をするように動作部２２０を制御したり、親密さを表す特別な鳴き声を音声出力部２３０から出力させたりしてもよい。同様に、制御部１１０は、タッチ入力処理で取得したタッチ履歴１２７との類似度が所定の値以上の場合には、撫でたり抱っこしたりしてくれたユーザとの親密度が高いと判断して、親密さを表す特別な動作をしたり鳴き声を発したりするようにしてもよい（例えば特願２０２１－１５８６６３号や、特願２０２２－１８７９７３号を参照）。

【0109】

また、制御部１１０は、特定のユーザの発した音声から算出される音声特徴パラメータを記憶部１２０に登録音声パラメータとして登録し、マイク入力処理において、音声特徴パラメータを登録音声パラメータと比較することにより、音声を発したユーザが特定のユーザか否かを認識できるようにしてもよい（例えば特願２０２１－１５８６６３号を参照）。

【0110】

また、上述の実施形態では、マイクロフォン２１４で取得した音が人の声であると判定したら、制御部１１０は、常に動作部２２０を一時停止させているが、動作部２２０を一時停止させるか否かは所定の条件次第にしてもよい。例えば感情データ１２１のＹ値がプラスで所定の閾値を超えている場合（ロボット２００が興奮している場合）には、マイクロフォン２１４で取得した音が人の声であると判定しても、制御部１１０は、動作部２２０を一時停止させないようにしてもよい。このように制御することにより、ロボット２００が興奮している場合には、落ち着いて人の声を聞いていられない（モータが動き続けているので、音声の誤認識が増える可能性がある）状態であることを模倣することができる。

【0111】

また、上述の実施形態では、ロボット２００にロボット２００を制御する動作制御装置１００が内蔵されている構成としたが、ロボット２００を制御する動作制御装置１００は、必ずしもロボット２００に内蔵されている必要はない。例えば、動作制御装置１００が、ロボット２００とは別個の装置として構成され、動作制御装置１００の制御部１１０及び通信部１３０とは別個にロボット２００も制御部２５０及び通信部２６０を備えていてもよい。この場合、通信部２６０と通信部１３０とがお互いにデータを送受信できるように構成され、制御部１１０は、通信部１３０及び通信部２６０を介して、センサ部２１０が検出した外部刺激を取得したり、動作部２２０や音声出力部２３０を制御したりする。

【0112】

上述の実施形態において、制御部１１０のＣＰＵが実行する動作プログラムは、あらかじめ記憶部１２０のＲＯＭ等に記憶されているものとして説明した。しかしながら、本発明は、これに限定されず、上述の各種処理を実行させるための動作プログラムを、既存の汎用コンピュータ等に実装することにより、上述の実施形態に係る動作制御装置１００に相当する装置として機能させてもよい。

【0113】

このようなプログラムの提供方法は任意であり、例えば、コンピュータが読取可能な記録媒体（フレキシブルディスク、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）－ＲＯＭ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）－ＲＯＭ、ＭＯ（Ｍａｇｎｅｔｏ－ＯｐｔｉｃａｌＤｉｓｃ）、メモリカード、ＵＳＢメモリ等）に格納して配布してもよいし、インターネット等のネットワーク上のストレージにプログラムを格納しておき、これをダウンロードさせることにより提供してもよい。

【0114】

また、上述の処理をＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）とアプリケーションプログラムとの分担、又は、ＯＳとアプリケーションプログラムとの協働によって実行する場合には、アプリケーションプログラムのみを記録媒体やストレージに格納してもよい。また、搬送波にプログラムを重畳し、ネットワークを介して配信することも可能である。例えば、ネットワーク上の掲示板（ＢｕｌｌｅｔｉｎＢｏａｒｄＳｙｓｔｅｍ：ＢＢＳ）に上記プログラムを掲示し、ネットワークを介してプログラムを配信してもよい。そして、このプログラムを起動し、ＯＳの制御下で、他のアプリケーションプログラムと同様に実行することにより、上記の処理を実行できるように構成してもよい。

【0115】

また、制御部１１０は、シングルプロセッサ、マルチプロセッサ、マルチコアプロセッサ等の任意のプロセッサ単体で構成されるものの他、これら任意のプロセッサと、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）やＦＰＧＡ（Ｆｉｅｌｄ‐ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等の処理回路とが組み合わせられて構成されてもよい。

【0116】

本発明は、本発明の広義の精神と範囲とを逸脱することなく、様々な実施形態及び変形が可能とされるものである。また、前述した実施形態は、この発明を説明するためのものであり、本発明の範囲を限定するものではない。すなわち、本発明の範囲は、実施形態ではなく、特許請求の範囲によって示される。そして、特許請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、この発明の範囲内とみなされる。

【符号の説明】

【0117】

１００…動作制御装置、１１０，２５０…制御部、１２０…記憶部、１２１…感情データ、１２２…感情変化データ、１２３…成長日数データ、１２４…制御内容テーブル、１２５…音声バッファ、１２６…音声履歴、１２７…タッチ履歴、１３０，２６０…通信部、２００…ロボット、２０１…外装、２０２…装飾部品、２０３…毛、２０４…頭部、２０５…連結部、２０６…胴体部、２０７…筐体、２１０…センサ部、２１１，２１１Ｈ，２１１ＬＦ，２１１ＬＲ，２１１ＲＦ，２１１ＲＲ…タッチセンサ、２１２…加速度センサ、２１３…ジャイロセンサ、２１４…マイクロフォン、２２０…動作部、２２１…ひねりモータ、２２２…上下モータ、２３０…音声出力部、２３１…スピーカ、２４０…操作入力部、３００…感情マップ、３０１，３０２，３０３…枠、３１０…原点、３１１…Ｘ軸、３１２…Ｙ軸、１２５０…音声サブバッファ、ＢＬ…バスライン

【図1】