(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022038479
(43)【公開日】2022-03-10
(54)【発明の名称】歩行ロボットの制御装置
(51)【国際特許分類】
G05D 1/02 20200101AFI20220303BHJP
B25J 5/00 20060101ALI20220303BHJP
G05B 13/02 20060101ALI20220303BHJP
G05B 11/36 20060101ALI20220303BHJP
【FI】
G05D1/02 K
B25J5/00 C
G05B13/02 L
G05B11/36 F
【審査請求】未請求
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2020143011
(22)【出願日】2020-08-26
(71)【出願人】
【識別番号】000000011
【氏名又は名称】株式会社アイシン
(71)【出願人】
【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
(74)【代理人】
【識別番号】110000017
【氏名又は名称】特許業務法人アイテック国際特許事務所
(72)【発明者】
【氏名】伊澤 仁
(72)【発明者】
【氏名】赤塚 慎太郎
(72)【発明者】
【氏名】野田 幸裕
(72)【発明者】
【氏名】松葉 達哉
(72)【発明者】
【氏名】中村 泰
(72)【発明者】
【氏名】石井 信
(72)【発明者】
【氏名】渡辺 俊樹
(72)【発明者】
【氏名】久保 顕大
【テーマコード(参考)】
3C707
5H004
5H301
【Fターム(参考)】
3C707CS08
3C707HS27
3C707KS10
3C707KT01
3C707LW15
3C707WA14
5H004GB16
5H004HA07
5H004HB07
5H004HB08
5H004HB09
5H004KD31
5H301AA01
5H301BB14
5H301CC03
5H301CC06
5H301CC10
5H301GG07
5H301GG09
5H301GG16
(57)【要約】
【課題】歩行ロボットを様々な環境下で歩行可能にして当該歩行ロボットの実用性をより向上させる。
【解決手段】本開示の歩行ロボットの制御装置は、複数の脚部と、それぞれ対応する脚部を駆動する複数のアクチュエータと、歩行路を撮像する撮像装置とを含む歩行ロボットを制御するものであり、位相制御量に基づいて複数のアクチュエータごとに位相を設定すると共に、設定した位相に基づいて複数のアクチュエータの各々への指令値を算出する中枢パターン生成部と、中枢パターン生成部からの指令値および歩行ロボットの状態に基づいて複数のアクチュエータを制御するアクチュエータ制御部と、少なくとも歩行ロボットに対する指令値、歩行ロボットの状態、および撮像装置からの画像情報に基づいて、中枢パターン生成部への位相制御量を算出する歩容制御部とを含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の脚部と、それぞれ対応する前記脚部を駆動する複数のアクチュエータと、歩行路を撮像する撮像装置とを含む歩行ロボットの制御装置であって、
位相制御量に基づいて前記複数のアクチュエータごとに位相を設定すると共に、設定した位相に基づいて前記複数のアクチュエータの各々への指令値を算出する中枢パターン生成部と、
前記中枢パターン生成部からの前記指令値および前記歩行ロボットの状態に基づいて前記複数のアクチュエータを制御するアクチュエータ制御部と、
少なくとも前記歩行ロボットに対する指令値、前記歩行ロボットの状態、および前記撮像装置からの画像情報に基づいて、前記中枢パターン生成部への前記位相制御量を算出する歩容制御部と、
を備える歩行ロボットの制御装置。
【請求項2】
請求項1に記載の歩行ロボットの制御装置において、
前記歩容制御部は、
前記撮像装置からの画像情報を処理する画像処理ニューラルネットワークと、
前記歩行ロボットに対する指令値、前記歩行ロボットの状態、前記中枢パターン生成部からの前記位相、および前記画像処理ニューラルネットワークからの情報に基づいて、前記位相制御量を算出する位相制御量算出部とを含む歩行ロボットの制御装置。
【請求項3】
請求項2に記載の歩行ロボットの制御装置において、
前記位相制御量算出部は、
前記画像処理ニューラルネットワークからの情報に基づいて前記歩行路の状態を示す複数の重みを算出するように適合された歩行路識別ニューラルネットワークと、
それぞれ互いに異なる複数の前記歩行路の中の対応する1つについて適合され、前記歩行ロボットに対する指令値、前記歩行ロボットの状態、前記中枢パターン生成部からの前記位相、および前記画像処理ニューラルネットワークからの情報に基づいて、前記歩行ロボットを前記対応する1つの前記歩行路で歩行させるための位相制御量である個別制御量を算出する複数の個別ニューラルネットワークとを含み、
前記歩行路識別ニューラルネットワークにより算出された前記複数の重みと、前記複数の個別ニューラルネットワークにより算出された前記個別制御量とから前記位相制御量を算出する歩行ロボットの制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、複数の脚部と、それぞれ対応する脚部を駆動する複数のアクチュエータとを含む歩行ロボットの制御装置に関する。
【背景技術】
【0002】
従来、生物の運動を制御するための周期的な信号を生成する中枢パターン生成器(CPG)を歩行ロボットの制御に適用することが提案されている(例えば、非特許文献1参照)。同文献に記載された歩行ロボットの制御装置は、再帰結合型ニューラルネットワーク(神経振動子ネットワーク)である中枢パターン生成器(基本CPG)と、歩行ロボットの状態や中枢パターン生成器の出力を入力信号として当該中枢パターン生成器の出力を調整するための制御信号を生成する線形制御器(Actor)とを含む。かかる制御装置では、線形制御器が相互フィードバック結合をもたないことから、再帰結合型ニューラルネットワークである中枢パターン生成器のバックプロパゲーション学習を行うことなく、線形制御器により設定される中枢パターン生成器の結合重みの学習を実行することが可能となる。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】「Reinforcement learning for a biped robot based on a CPG-actor-critic method」Yutaka Nakamura, Takeshi Mori, Masaaki Sato, Shin Ishii著, Neural Networks Volume 20, Issue 6, August 2007, Pages 723-735
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の制御装置を用いて様々な環境下で歩行ロボットを歩行させるためには、それぞれ互いに異なる複数の歩行路の対応する1つについて適合(学習)された複数の線形制御器を用意することが必要となる。従って、上記制御装置は、歩行ロボットの実用性を向上させる上で、なお改善の余地を有している。
【0005】
そこで、本開示は、歩行ロボットを様々な環境下で歩行可能にして当該歩行ロボットの実用性をより向上させることができる歩行ロボットの制御装置の提供を主目的とする。
【課題を解決するための手段】
【0006】
本開示の歩行ロボットの制御装置は、複数の脚部と、それぞれ対応する前記脚部を駆動する複数のアクチュエータと、歩行路を撮像する撮像装置とを含む歩行ロボットの制御装置であって、位相制御量に基づいて前記複数のアクチュエータごとに位相を設定すると共に、設定した位相に基づいて前記複数のアクチュエータの各々への指令値を算出する中枢パターン生成部と、前記中枢パターン生成部からの前記指令値および前記歩行ロボットの状態に基づいて前記複数のアクチュエータを制御するアクチュエータ制御部と、少なくとも前記歩行ロボットに対する指令値、前記歩行ロボットの状態、および前記撮像装置からの画像情報に基づいて、前記中枢パターン生成部への前記位相制御量を算出する歩容制御部とを含むものである。
【0007】
本開示の歩行ロボットの制御装置は、位相制御量を算出する歩容制御部と、歩容制御部からの位相制御量に基づいて複数のアクチュエータごとに位相を設定すると共に、設定した位相に基づいて複数のアクチュエータの各々への指令値を算出する中枢パターン生成部と、中枢パターン生成部からの指令値および歩行ロボットの状態に基づいて複数のアクチュエータを制御するアクチュエータ制御部とを含む。そして、歩容制御部は、少なくとも歩行ロボットに対する指令値、歩行ロボットの状態、および歩行ロボットの歩行路を撮像する撮像装置からの画像情報に基づいて、中枢パターン生成部への位相制御量を算出する。これにより、画像情報に示される歩行路の状態を位相制御量に反映させ、中枢パターン生成部に歩行ロボットの歩行路に応じた各アクチュエータへの指令値を算出させることが可能となるので、複数のアクチュエータすなわち複数の脚部を歩行路の状態に応じて適正に作動させることができる。この結果、歩行ロボットを様々な環境下で歩行可能にして当該歩行ロボットの実用性をより向上させることが可能となる。
【図面の簡単な説明】
【0008】
【
図1】本開示の歩行ロボットの制御装置を示すブロック図である。
【
図2】本開示の歩行ロボットの制御装置の歩容制御部を示すブロック図である。
【発明を実施するための形態】
【0009】
次に、図面を参照しながら、本開示の発明を実施するための形態について説明する。
【0010】
図1は、本開示の制御装置10を含む歩行ロボット1を示すブロック図である。同図に示す歩行ロボット1は、制御装置10が搭載される胴体部2と、それぞれ胴体部2に連結された4つの脚部3とを含む、いわゆる4足ロボットである。各脚部3は、複数の関節を有し、歩行ロボット1には、それぞれ対応する関節を動作させる複数のアクチュエータ4が設けられている。本実施形態の歩行ロボット1では、複数のアクチュエータ4として、主に油圧シリンダ(流体圧アクチュエータ)が採用され、適宜、エアシリンダ、電気モータを含む電動アクチュエータ、電磁アクチュエータ、油圧式または電動式のロータリーアクチュエータも採用されている。
【0011】
更に、歩行ロボット1は、撮像装置としてのカメラ(ビジュアルセンサ)5と、歩行ロボット1の状態を取得するための複数のセンサ6とを含む。カメラ5は、歩行ロボット1が歩行する歩行路(以下、「現歩行路」という。)を撮像可能となるように胴体部2により支持されている。また、複数のセンサ6は、それぞれ対応する物理量を検出するものであり、3軸(3次元)の角速度と加速度とを検出する慣性計測装置(IMU)や、油圧センサ、回転センサ、ストロークセンサ、電流センサ、電圧センサ等を含む。
【0012】
制御装置10は、CPU,ROM,RAM、入出力インターフェース、記憶装置等を含む図示しないコンピュータ(ハードウェア)と、当該コンピュータにインストールされた制御プログラム(ソフトウェア)とにより構成される。
図1に示すように、制御装置10は、それぞれコンピュータのCPUやROM,RAMといったハードウェアと上記制御プログラムといったソフトウェアとの協働により構築される、中枢パターン生成部(CPG)11、アクチュエータ制御部12、SLAM部14、および歩容制御部15を含む。
【0013】
中枢パターン生成部11は、神経振動子と呼ばれるニューロンを多数結合した再帰結合型ニューラルネットワークである。中枢パターン生成部11は、複数のアクチュエータ4ごとに、予め定められた基本周波数と、歩容制御部15により算出される位相制御量としての少なくとも1つ(本実施形態では、複数)の重み係数に基づく調整値との和を位相θi(t)として設定すると共に、設定した複数の位相θi(t)から複数のアクチュエータ4の各々への角度指令値F(θi(t))を算出する。アクチュエータ制御部12は、歩行ロボット1の状態を示す複数のセンサ6の検出値と、中枢パターン生成部11からの複数の角度指令値F(θi(t))とに基づいて、複数のアクチュエータ4の各々を対応した角度指令値F(θi(t))に従って作動するように制御する。なお、中枢パターン生成部11からアクチュエータ制御部12に与えられる指令値は、角度指令値F(θi(t))に限られるものではなく、例えば、各脚部3の目標先端位置を示すものであってもよい。
【0014】
SLAM部14は、歩行ロボット1の起動中、所定時間(微小時間)おきに、カメラ5により撮像された画像情報(画像データ)から当該歩行ロボット1の現在位置座標(3次元座標)と環境地図とを取得する。歩容制御部15は、歩行ロボット1のユーザから与えられる当該歩行ロボット1の目標到達位置(座標)や目標速度といった指令値、歩行ロボット1の状態を示す複数のセンサ6の検出値、中枢パターン生成部11からフィードバックされる位相θi(t)、およびカメラ5からの画像情報に基づいて、所定時間おきに中枢パターン生成部11への重み係数(位相制御量)を複数のアクチュエータ4ごとに算出する。
【0015】
図2は、歩容制御部15を示すブロック構成図である。同図に示すように、歩容制御部15は、カメラ5からの画像情報を処理する画像処理ニューラルネットワーク16と、上述の重み係数を算出する位相制御量算出部17とを含む。画像処理ニューラルネットワーク16は、例えば、それぞれ複数の畳み込み層およびプーリング層(部分サンプリング層)と、全結合層とを含む畳み込みニューラルネットワークである。本実施形態において、画像処理ニューラルネットワーク16は、カメラ5からの画像データに畳み込みおよびプーリング(次元圧縮)を施して予め定められた潜在次数の特徴ベクトルを出力する。
【0016】
また、位相制御量算出部17は、
図2に示すように、歩行路識別ニューラルネットワーク18と、複数の個別ニューラルネットワーク19
1,19
2,19
3,…19
n(ただし、“n”は、対象となる歩行路の数を示す整数である。)とを含む。歩行路識別ニューラルネットワーク18は、例えば、入力層、出力層および単一または複数の中間層を含む多層パーセプトロンである。歩行路識別ニューラルネットワーク18は、歩行ロボット1の起動中、画像処理ニューラルネットワーク16からの情報(特徴ベクトル)に基づいて歩行ロボット1の現歩行路の状態を識別し、それぞれ平坦路、登坂路、降坂路、荒地、高μ路、低μ路、階段路といった互いに異なる予め定められた複数の歩行路の中の1つに対応付けられた複数の重みを所定時間おきに算出する。各重みは、現歩行路が当該重みに対応した歩行路に合致する度合いのような量を示すものである。
【0017】
位相制御量算出部17の複数の個別ニューラルネットワーク191,192,193,…,19nは、何れも、例えば入力層、出力層および単一または複数の中間層を含む多層パーセプトロンであり、それぞれ上記複数の歩行路の中の対応する1つについて適合されている。本実施形態において、複数の個別ニューラルネットワーク191-19nには、例えば、個別ニューラルネットワーク191には平坦路、個別ニューラルネットワーク192には登坂路、個別ニューラルネットワーク193には降坂路、といった具合に複数の歩行路が割り当てられる。
【0018】
歩行ロボット1の起動中、個別ニューラルネットワーク191,192,193,…,19nの各々には、歩行ロボット1に対する指令値としての目標到達位置や目標速度、SLAM部14からの現在位置座標(現在位置情報)、複数のセンサ6の検出値(各関節の角度や歩行ロボット1の姿勢情報等)、中枢パターン生成部11からフィードバックされる複数の位相θi(t)、および画像処理ニューラルネットワーク16からの情報(特徴ベクトル)が所定時間おきに与えられる。個別ニューラルネットワーク191,192,193,…,19nの各々は、これらの情報に基づいて、歩行ロボット1を対応する1つの歩行路(例えば、個別ニューラルネットワーク191であれば、平坦路)で歩行させるための位相制御量(個別制御量)としての個別係数を複数のアクチュエータ4ごとに算出する。本実施形態において、各個別ニューラルネットワーク191-19nは、それぞれに対応した歩行路に適した少なくとも1つ(本実施形態では、複数)の個別係数を複数のアクチュエータ4ごとに算出するように予め学習させられている。
【0019】
位相制御量算出部17は、同一の歩行路について歩行路識別ニューラルネットワーク18により算出された重みと個別ニューラルネットワーク191等により算出された個別係数とを乗じて複数の積値(=重み×個別係数)を得る。更に、位相制御量算出部17は、当該複数の積値から予め定められた手順に従って位相制御量としての複数の重み係数を複数のアクチュエータ4ごとに算出し、算出した複数の重み係数を中枢パターン生成部11に与える。
【0020】
上述のように、歩行ロボット1の制御装置10は、位相制御量としての複数の重み係数を算出する歩容制御部15と、歩容制御部15からの重み係数に基づいて複数のアクチュエータ4ごとに位相θi(t)を設定すると共に、設定した位相θi(t)に基づいて複数のアクチュエータ4の各々への角度指令値F(θi(t))を算出する中枢パターン生成部11と、中枢パターン生成部11からの複数の角度指令値F(θi(t))および歩行ロボット1の状態を示す複数のセンサ6の検出値に基づいて複数のアクチュエータ4を制御するアクチュエータ制御部12とを含む。そして、歩容制御部15は、少なくとも歩行ロボット1に対する指令値、歩行ロボット1の状態を示す複数のセンサ6の検出値、および歩行ロボット1の現歩行路を撮像するカメラ5からの画像情報に基づいて、中枢パターン生成部11への複数の重み係数を複数のアクチュエータ4ごとに算出する。
【0021】
これにより、制御装置10によれば、カメラ5からの画像情報に示される現歩行路の状態を複数の重み係数に反映させ、中枢パターン生成部11に現歩行路に応じた各アクチュエータ4への角度指令値F(θi(t))を算出させることが可能となるので、複数のアクチュエータ4すなわち複数の脚部3を現歩行路の状態に応じて適正に作動させることができる。この結果、歩行ロボット1を様々な環境下で歩行可能にして当該歩行ロボット1の実用性をより向上させることが可能となる。
【0022】
また、歩容制御部15は、カメラ5からの画像情報を処理する画像処理ニューラルネットワーク16と、歩行ロボット1に対する指令値、歩行ロボット1の状態を示す複数のセンサ6の検出値、中枢パターン生成部11からの複数の位相θi(t)、および画像処理ニューラルネットワーク16からの情報に基づいて、位相制御量としての複数の重み係数を算出する位相制御量算出部17とを含む。これにより、画像情報を介して現歩行路の状態を位相制御量としての重み係数により適正に反映させることが可能となる。
【0023】
更に、位相制御量算出部17は、画像処理ニューラルネットワーク16からの情報に基づいて現歩行路の状態を示す複数の重みを算出するように適合された歩行路識別ニューラルネットワーク18と、複数の個別ニューラルネットワーク191,192,193,…19nとを含む。複数の個別ニューラルネットワーク191,192,193,…19nは、それぞれ互いに異なる複数の歩行路の中の対応する1つについて適合され、歩行ロボット1に対する指令値、歩行ロボット1の状態を示す複数のセンサ6の検出値、中枢パターン生成部11からの複数の位相θi(t)、および画像処理ニューラルネットワーク16からの情報に基づいて、歩行ロボット1を対応する1つの歩行路で歩行させるための位相制御量である個別係数(個別制御量)を複数のアクチュエータ4ごとに算出する。そして、位相制御量算出部17は、歩行路識別ニューラルネットワーク18により算出された複数の重みと、複数の個別ニューラルネットワーク191-19nにより算出された個別係数とから位相制御量としての複数の重み係数を複数のアクチュエータ4ごとに算出する。
【0024】
これにより、それぞれ対応する歩行路に適した個別係数を算出するように複数の個別ニューラルネットワーク191-19nを学習させておけば、歩行ロボット1が任意の歩行路を歩行する間に画像処理ニューラルネットワーク16および歩行路識別ニューラルネットワーク18の学習を進行させることができる。この結果、歩行ロボット1の歩行性能をより向上させることが可能となる。
【0025】
なお、歩行ロボット1は、4足ロボットに限られるものではなく、2足ロボットあるいは3足ロボットであってもよく、5つ以上の脚部を含む多足ロボットであってもよい。
【0026】
また、本開示の発明は上記実施形態に何ら限定されるものではなく、本開示の外延の範囲内において様々な変更をなし得ることはいうまでもない。更に、上記実施形態は、あくまで発明の概要の欄に記載された発明の具体的な一形態に過ぎず、発明の概要の欄に記載された発明の要素を限定するものではない。
【産業上の利用可能性】
【0027】
本開示の発明は、複数の脚部と、それぞれ対応する脚部を駆動する複数のアクチュエータとを含む歩行ロボットの製造産業等において利用可能である。
【符号の説明】
【0028】
1 歩行ロボット、2 胴体部、3 脚部、4 アクチュエータ、5 カメラ、6 センサ、10 制御装置、11 中枢パターン生成部、12 アクチュエータ制御部、14 SLAM部、15 歩容制御部、16 画像処理ニューラルネットワーク、17 位相制御量算出部、18 歩行路識別ニューラルネットワーク、191,192,193,…19n 個別ニューラルネットワーク。