(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023151524
(43)【公開日】2023-10-16
(54)【発明の名称】推定装置、推定方法、プログラム、及び学習モデル生成装置
(51)【国際特許分類】
G01N 3/00 20060101AFI20231005BHJP
G06N 3/02 20060101ALI20231005BHJP
G06N 3/044 20230101ALI20231005BHJP
G06N 20/00 20190101ALI20231005BHJP
【FI】
G01N3/00 A
G06N3/02
G06N3/04 145
G06N20/00
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022061180
(22)【出願日】2022-03-31
(71)【出願人】
【識別番号】000005278
【氏名又は名称】株式会社ブリヂストン
(71)【出願人】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】西田 三博
(72)【発明者】
【氏名】櫻井 良
(72)【発明者】
【氏名】中嶋 浩平
【テーマコード(参考)】
2G061
【Fターム(参考)】
2G061AA06
2G061AB01
2G061BA06
2G061CA10
2G061CB04
2G061DA12
2G061EA01
2G061EA02
2G061EA04
2G061EA05
2G061EB03
2G061EB07
2G061EC02
(57)【要約】
【課題】部材の変形を直接計測することなく、部材の変形を推定する。
【解決手段】推定装置(1)は、部材(2)の変形に応じて変化する複数の物理量を学習用データとして用いて、ターゲット物理量以外の少なくとも1つの物理量を入力とし、ターゲット物理量を出力するように学習された学習モデル(51)であって、ターゲット物理量以外の少なくとも1つの物理量を入力とし、ターゲット物理量及び少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデル(51A)と、ターゲット物理量以外の少なくとも1つの物理量、及び第1モデルから出力される中間物理量を入力とし、ターゲット物理量を出力するように学習された第2モデル(51B)と、を含む学習モデルに対して、推定対象のターゲット物理量以外の少なくとも1つの物理量(3)を入力し、推定対象のターゲット物理量(6)を推定する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも1つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部
を含む推定装置。
【請求項2】
前記第1モデルは、前記ターゲット物理量以外の物理量のうちの第1物理量及び前記第1物理量と異なる第2物理量を入力とし、前記ターゲット物理量及び前記第1物理量及び第2物理量以外の第3物理量を中間物理量として出力するように学習され、
前記第2モデルは、前記第1物理量及び前記第2物理量と、前記第1モデルから出力される前記中間物理量である前記第3物理量と、を入力とし、前記ターゲット物理量を出力するように学習される
請求項1に記載の推定装置。
【請求項3】
前記第1モデルは、前記ターゲット物理量以外の物理量のうちの第1物理量を入力とし、前記ターゲット物理量及び前記第1物理量以外の第2物理量及び第3物理量を中間物理量として出力するように学習され、
前記第2モデルは、前記第1物理量と、前記第1モデルから出力される前記中間物理量である第2物理量及び前記第3物理量と、を入力とし、前記ターゲット物理量を出力するように学習される
請求項1に記載の推定装置。
【請求項4】
前記部材は、前記変形に応じて電気特性が変化し、
前記少なくとも3つの物理量として、前記部材の変形に応じて変化した前記電気特性を表す第1物理量、前記部材を変形させる第2物理量、前記部材を変形させ、かつ前記第2物理量と異なる物理量を表す第3物理量、及び前記部材の変形量を表すターゲット物理量を含み、
前記学習モデルは、少なくとも前記第1物理量を入力として、前記ターゲット物理量を出力するように学習される
請求項1から請求項3の何れか1項に記載の推定装置。
【請求項5】
前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、
前記第1物理量は、前記弾性体の電気抵抗値であり、
前記第2物理量は、前記弾性体に供給される前記加圧流体の供給状態を表す圧力値又は前記弾性体の内圧を表す圧力値であり、
前記第3物理量は、前記弾性体に与えられる荷重を示す値であり、
前記ターゲット物理量は、前記弾性体の前記所定方向の距離である
請求項4に記載の推定装置。
【請求項6】
前記学習モデルは、再帰型ニューラルネットワークを用いて学習させることで生成されたモデルである
請求項1から請求項5の何れか1項に記載の推定装置。
【請求項7】
前記学習モデルは、リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである
請求項1から請求項6の何れか1項に記載の推定装置。
【請求項8】
前記学習モデルは、非線形に変形する部材における前記少なくとも3つの物理量を複数蓄積したリザバを用いた物理的リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである
請求項1から請求項6の何れか1項に記載の推定装置。
【請求項9】
コンピュータが
弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも1つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する
推定方法。
【請求項10】
コンピュータを
弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも1つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部
として機能させるためのプログラム。
【請求項11】
線形又は非線形に変形する部材における前記変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量を複数を学習用データとして取得する取得部と、
前記取得部の取得結果に基づいて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルを生成する学習モデル生成部と、
を含む学習モデル生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推定装置、推定方法、プログラム、及び学習モデル生成装置に関する。
【背景技術】
【0002】
従来より、バネ部材およびゴム部材などの弾性体は、与えられた力によって伸長および収縮が可能であり、弾性体を含む部材の制御を行う場合、弾性体を含む部材の挙動を把握することが要求される。その弾性体を含む部材の挙動を把握するために、部材の長さを距離センサによって測定する技術が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、弾性体を含む部材は線形に変形する挙動を示したり、非線形に変形する挙動を示す場合がある。例えば、ゴム部材などの柔らかい弾性体を含む部材は、与えられた力に対して非線形に変形する挙動を示す。柔らかい弾性体を含む部材に力を与えた後に力を徐々に解除して元の状態に戻す場合、部材の変形(例えば、長さの変動)は、非線形の挙動を示す。このため、部材の変形を検出するためには、部材が非線形に変形することを考慮して、逐次、センサによって形状を検出することが好ましい。ところが、部材を装置に組み込む場合、より少ないセンサで部材の変形を検出すること、および装置の小型化が要求される。しかし、部材の変形を検出するセンサシステムは、部材が非線形に変形することを考慮することで大規模なものとなり、装置の大型化を招く。また、部材に専用のセンサを装備して変形を検出する場合、装備した専用のセンサが部材の挙動に影響する場合もある。従って、部材の変形を直接計測することは、実用上好ましくない。
【0005】
また、弾性体を含む部材の変形について、力等の部材に与えられたエネルギから推定する試みが行われている。ところが、部材には、付与する位置や方向を伴う圧力、及び荷重等のように種類が異なる複数のエネルギが与えられた結果で生じると考えられる。しかしながら、種類が異なる複数のエネルギを複数のセンサで検出することは、装置の大型化を招くので好ましくなく、また、センサが部材の挙動に影響する場合もある。さらに、たとえ、種類が異なる複数のエネルギを検出できたとしても、複数のエネルギがどのように部材の変形に寄与するかは不明である。従って、部材の変形を推定するのには改善の余地がある。
【0006】
本開示は、部材の変形を直接計測することなく、部材の変形を推定することを可能にする推定装置、推定方法、プログラム、及び学習モデル生成装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するために、第1態様は、弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも1つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部を含む推定装置である。
【0008】
第2態様は、第1態様の推定装置において、前記第1モデルは、前記ターゲット物理量以外の物理量のうちの第1物理量及び前記第1物理量と異なる第2物理量を入力とし、前記ターゲット物理量及び前記第1物理量及び第2物理量以外の第3物理量を中間物理量として出力するように学習され、前記第2モデルは、前記第1物理量及び前記第2物理量と、前記第1モデルから出力される前記中間物理量である前記第3物理量と、を入力とし、前記ターゲット物理量を出力するように学習される。
【0009】
第3態様は、第1態様の推定装置において、前記第1モデルは、前記ターゲット物理量以外の物理量のうちの第1物理量を入力とし、前記ターゲット物理量及び前記第1物理量以外の第2物理量及び第3物理量を中間物理量として出力するように学習され、前記第2モデルは、前記第1物理量と、前記第1モデルから出力される前記中間物理量である第2物理量及び前記第3物理量と、を入力とし、前記ターゲット物理量を出力するように学習される。
【0010】
第4態様は、第1態様から第3態様の何れか1態様の推定装置において、前記部材は、前記変形に応じて電気特性が変化し、前記少なくとも3つの物理量として、前記部材の変形に応じて変化した前記電気特性を表す第1物理量、前記部材を変形させる第2物理量、前記部材を変形させ、かつ前記第2物理量と異なる物理量を表す第3物理量、及び前記部材の変形量を表すターゲット物理量を含み、前記学習モデルは、少なくとも前記第1物理量を入力として、前記ターゲット物理量を出力するように学習される。
【0011】
第5態様は、第4態様の推定装置において、前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、前記第1物理量は、前記弾性体の電気抵抗値であり、前記第2物理量は、前記弾性体に供給される前記加圧流体の供給状態を表す圧力値又は前記弾性体の内圧を表す圧力値であり、前記第3物理量は、前記弾性体に与えられる荷重を示す値であり、前記ターゲット物理量は、前記弾性体の前記所定方向の距離である。
【0012】
第6態様は、第1態様から第5態様の何れか1態様の推定装置において、前記学習モデルは、再帰型ニューラルネットワークを用いて学習させることで生成されたモデルである。
【0013】
第7態様は、第1態様から第6態様の何れか1態様の推定装置において、前記学習モデルは、リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである。
【0014】
第8態様は、第1態様から第6態様の何れか1態様の推定装置において、前記学習モデルは、非線形に変形する部材における前記少なくとも3つの物理量を複数蓄積したリザバを用いた物理的リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである。
【0015】
第9態様は、コンピュータが線形又は非線形に変形する部材における前記変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも1つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定方法である。
【0016】
第10態様は、コンピュータを弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも1つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部として機能させるためのプログラムである。
【0017】
第11態様は、弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも3つの物理量を複数を学習用データとして取得する取得部と、前記取得部の取得結果に基づいて、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも1つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、前記ターゲット物理量以外の少なくとも1つの物理量、及び前記第1モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第2モデルと、を含む前記学習モデルを生成する学習モデル生成部と、を含む学習モデル生成装置である。
【発明の効果】
【0018】
本開示によれば、部材の変形を直接計測することなく、部材の変形を推定することができる、という効果を有する。
【図面の簡単な説明】
【0019】
【
図1】物理量推定装置の一実施形態の機能構成を示すブロック図である。
【
図3】第1実施形態に係る学習処理部の概念図である。
【
図4】第1実施形態に係る測定装置の一例を示すブロック図である。
【
図5】第1実施形態に係る学習データ収集処理の一例を示すフローチャートである。
【
図6】第1実施形態に係る学習処理部の概念図である。
【
図7】第1実施形態に係る学習処理部の概念図である。
【
図8】第1実施形態に係る学習処理の流れの一例を示すフローチャートである。
【
図9】第1実施形態に係る物理量推定装置の各種機能を実現する装置をコンピュータを含んで構成した場合の一例を示すブロック図である。
【
図10】第1実施形態に係る推定処理の流れの一例を示すフローチャートである。
【
図11】第2実施形態に係る学習処理部の概念図である。
【
図12】第2実施形態に係る学習処理の流れの一例を示すフローチャートである。
【
図13】第3実施形態に係る学習処理部の概念図である。
【
図14】第3実施形態に係る学習処理の流れの一例を示すフローチャートである。
【
図15】第4実施形態に係る学習処理部の概念図である。
【
図16】第4実施形態に係る学習処理の流れの一例を示すフローチャートである。
【
図17】第5実施形態に係る学習処理部の概念図である。
【発明を実施するための形態】
【0020】
以下、図面を参照して本開示の技術を実現する実施形態を詳細に説明する。
なお、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符合を付与し、重複する説明を適宜省略する場合がある。また、本開示は、以下の実施形態に何ら限定されるものではなく、本開示の目的の範囲内において、適宜変更を加えて実施することができる。また、本開示では、主として非線形に変形する部材に対する物理量の推定を説明するが、線形に変形する部材に対する物理量の推定に適用可能であることは言うまでもない。
【0021】
本開示において「部材」とは、弾性変形可能な部材であって、非線形に変形し、かつ変形に応じて電気特性が変化する材料を含む概念である。「弾性体」とは、部材の一例であり、ゴム、発泡材および樹脂材などの柔らかい材料を含む概念である。また、「弾性収縮体」とは、弾性体の一例であり、付与された物理量により所定方向に収縮力を発生する部材を含む概念である。収縮力を発生する所定方向は、2次元で表現される伸縮を示す直線方向であってもよく、3次元で表現される撓みを示す曲線方向であってもよい。また、弾性収縮体は、内部が中空に形成され、その中空の内部に加圧流体が供給されて所定方向に収縮力を発生する部材を含む。
【0022】
なお、本開示における部材における物理量のうち、第1物理量は、部材の変形に応じて変化する電気特性を表す物理量であり、一例として時系列の電気抵抗値が挙げられる。第2物理量は、部材を変形させる力に関する物理量であり、一例として圧力特性を表す時系列の圧力値が挙げられる。第3物理量は、第2物理量とは異なる部材を変形させる力に関する物理量であり、一例として部材に与えられる荷重を表す時系列の荷重値が挙げられる。第4物理量は、部材の変形に関する物理量であり、一例として距離、撓み、および歪を示す変形値が挙げられる。
【0023】
ところで、ゴム部材などの柔らかい弾性体は、与えられた力に対して非線形な挙動を示す。弾性体について形状変化の観点で2次元の形状変化を想定した場合、与えられた力(すなわち、物理量又はエネルギ)に応じて或る方向(例えば、直線方向)に伸縮する距離が非線形に変化する。例えば、
図2に非線形に変化する長さを概念として示すように、弾性体は、与えられた力の増減方向により長さの変化特性が相違する。
図2に示す例では、圧力P1及びP2で同一の長さL1になる。従って、力の大きさ(例えば、圧力値)から変形の大きさ(例えば、長さ)を同定することは困難である。また、弾性体に種類が異なる力(例えば、荷重)が与えられても、弾性体の長さの変化特性が変化する。そこで、本開示の推定装置は、予め学習された学習モデルを用いて、非線形に変形する部材について、部材に関する物理量のうちの1物理量以上の物理量から他の物理量を推定する。
【0024】
すなわち、本開示の推定装置は、部材における変形に応じて変化する種類が異なる少なくとも3つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む少なくとも3つの物理量の複数を学習用データとして用いて、ターゲット物理量以外の少なくとも1つの物理量を入力とし、ターゲット物理量を出力するように学習された学習モデルであって、ターゲット物理量以外の少なくとも1つの物理量を入力とし、ターゲット物理量及び少なくとも1つの物理量以外の物理量を中間物理量として出力するように学習された第1モデルと、ターゲット物理量以外の少なくとも1つの物理量、及び第1モデルから出力される中間物理量を入力とし、ターゲット物理量を出力するように学習された第2モデルと、を含む学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも1つの物理量を入力し、推定対象のターゲット物理量を推定する。
【0025】
(第1実施形態)
図1に、本開示の推定装置としての弾性体を含む部材の物理量推定装置1の構成の一例を示す。本実施形態では、予め学習された学習モデルを用いて、非線形に変形する部材について、少なくとも2つの物理量から他の物理量を推定する物理量推定装置を一例として説明する。
【0026】
なお、本開示では、弾性体を含む部材における物理量を把握するために、一例として、非線形に変形する弾性体のうちゴム部材などの柔らかい弾性体を含み、付与された物理量により所定方向に収縮力を発生する弾性収縮体に本開示の技術を適用した場合を説明する。また、本開示では、所定方向に収縮する弾性収縮体の両端の距離(すなわち、弾性収縮体の長さ)を、距離センサなどの専用のセンサを装備することなく推定する推定処理に本開示の技術を適用した場合を説明する。
【0027】
以降では、弾性収縮体の一例として、公知技術のエアバッグタイプの部材を適用する場合について説明する(例えば、特公昭52-40378号参照)。
エアバッグタイプの弾性収縮体の一例(以下、ラバーアクチュエータという。)は、ゴム部材等の柔らかい弾性体で構成される管状体の外周を、有機又は無機高張力繊維、例えば芳香族ポリアミド繊維の編組み補強構造により被覆した本体21を有し、両端開口22を閉塞部材23によって封止したものである。ラバーアクチュエータは、その閉塞部材23に設けられた接続口24を介して内部空洞に加圧流体が供給されることによって膨径変形し、軸線方向に沿って収縮力が発生するようになっている。このラバーアクチュエータは、膨径変形によって、ラバーアクチュエータの長さが変化する。ただし、ラバーアクチュエータを適用対象とするのはあくまで一例に過ぎず、本開示の推定装置はラバーアクチュエータ以外の弾性収縮体又は弾性体を含む部材にも適用可能である。
【0028】
本実施形態では、ラバーアクチュエータにおける物理量のうち、第1物理量に、ラバーアクチュエータの変形に応じて変化する時系列の電気抵抗値による電気特性を適用する。第2物理量には、時系列の圧力値による圧力特性を適用し、第3物理量には、第2物理量とは異なる力の一例としての時系列の荷重値によりラバーアクチュエータに与えられる荷重特性を適用する。第4物理量には、ラバーアクチュエータの変形値(すなわち、変形量)を適用し、当該ラバーアクチュエータの変形量を表すターゲット物理量として、距離(すなわち、ラバーアクチュエータの長さ)を適用した場合を説明する。
【0029】
なお、本開示の技術は、ラバーアクチュエータにおける物理量として、第1物理量、第2物理量、第3物理量、及び第4物理量である4つの物理量を用いることに限定されない。例えば、電気特性を示す第1物理量、荷重特性を示す第3物理量、及びラバーアクチュエータの変形量を表すターゲット物理量である距離を示す第4物理量の3つの物理量を適用する場合にも、本開示の技術は適用可能である。すなわち、圧力特性を示す第2物理量は省略可能である。
【0030】
物理量推定装置1における推定処理は、ラバーアクチュエータにおける電気特性を示す第1データ、圧力特性を示す第2データ、荷重特性を示す第3データ、及び長さを示す第4データにより学習を行った学習済みの学習モデルを用いて、未知のラバーアクチュエータに対して与えられる力に対応するラバーアクチュエータの長さを推定する。
【0031】
本実施形態では、推定処理の一例として、未知のラバーアクチュエータにおける第1データ(電気特性)及び第2データ(圧力特性)に対応するラバーアクチュエータの長さを推定する場合を説明する。これにより、非線形に変形する部材、すなわち非線形に長さが変化するラバーアクチュエータであっても、当該変形を、直接計測することなく、計測した長さに近い長さを推定することが可能となる。
【0032】
図1に示すように、物理量推定装置1は、推定部5を備えている。推定部5には、入力データ3として、ラバーアクチュエータ2における時系列の電気抵抗の大きさ(電気抵抗値)による電気特性を表す第1データ31、及びラバーアクチュエータ2への時系列の圧力の大きさ(圧力値)による圧力特性を表す第2データ32が入力される。また、推定部5は、学習モデル51を用いて推定したラバーアクチュエータ2の変形の大きさ(長さ)を表す出力データ6を出力する。
【0033】
学習モデル51は、ラバーアクチュエータ2の電気特性(第1データ31)、及びラバーアクチュエータ2の圧力特性(第2データ32)から、ラバーアクチュエータ2の長さ(出力データ6)を出力する学習を済ませたモデルである。詳細は後述するが、学習モデル51は、ラバーアクチュエータ2における荷重を考慮して学習されたモデルであり、第1モデル51Aと第2モデル51Bを含み、第1モデル51Aで荷重特性を示す荷重データを推定し、推定された荷重データを用いて第2モデルで長さを出力する。学習モデル51は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード(ニューロン)同士の間の結合の重み(強度)の情報の集合として表現される。
荷重データは、本開示の中間物理量を示すデータの一例である。
【0034】
図3に、学習モデル51を生成する学習処理部52の概念構成の一例を示す。
学習モデル51は、学習処理部52の学習処理により生成される。学習処理部52は、ラバーアクチュエータ2における時系列な物理量として測定済みの物理量を用いて学習処理を行う。すなわち、ラバーアクチュエータ2における物理量を時系列に測定した大量のデータを学習データとする。本実施形態では、ラバーアクチュエータ2における物理量について圧力特性及び荷重特性で表される力を考慮して、学習モデル51を学習する。学習データは、ラバーアクチュエータ2における電気特性(第1データ31)、圧力特性(第2データ32)及び荷重特性(第3データ33)と、ラバーアクチュエータ2の長さ(第4データ34)と、のセットを大量に含む。なお、ラバーアクチュエータ2の長さを示す第4データ34の各々に測定時刻を示す情報を付与することで時系列情報が対応付けられる。この場合、前記セットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。
【0035】
次に、学習処理部52が行う学習処理について説明する。
【0036】
まず、学習処理に用いる学習データについて説明する。
図4に、ラバーアクチュエータ2における物理量を測定する測定装置7の一例を示す。
【0037】
測定装置7は、基台71に固定された取付板72にラバーアクチュエータ2の一方の閉塞部材23は取り付けられ、他方の閉塞部材23は移動可能な可動板73に取り付けられる。ラバーアクチュエータ2の両端の閉塞部材23には、電気特性(ラバーアクチュエータ2の変形により変化する時系列の電気抵抗値R)を検出するセンサを含んだ電気特性検出部76(
図4では「A]としても表記)が接続される。ラバーアクチュエータ2の接続口24には、圧力特性(ラバーアクチュエータ2を変形させる時系列の圧力値P)を検出する圧力センサを含み、ラバーアクチュエータ2に加圧流体を供給する供給部75が連通される。
【0038】
また、他方の閉塞部材23には、荷重特性(ラバーアクチュエータ2を変形させる他の物理量である荷重値F)を検出する荷重センサを含み、ラバーアクチュエータ2に荷重を与える荷重部80が接続される。なお、荷重部80は、荷重を与える荷重付与部と荷重を検出する荷重検出部とを独立して形成してもよい。
【0039】
また、基台71には、可動板73との距離を検出するレーザセンサ等の距離センサ77が取り付けられた固定板74が固定される。距離センサ77は、長さ同定部78に接続される。長さ同定部78は、距離センサ77で検出された距離から、ラバーアクチュエータ2の長さ(ラバーアクチュエータ2の変形量を表すターゲット物理量)を同定する。例えば、長さ同定部78は、加圧流体が供給されない初期状態(
図4に初期状態200として示す。)のラバーアクチュエータ2の長さL、および距離センサ77で検出された距離(La)を初期値として記憶しておく。そして、長さ同定部78は、加圧流体が供給された状態(
図4に供給状態210として示す。)の距離の差分を、初期状態の長さから減算することで、ラバーアクチュエータ2の長さ(L=Lb-La)を同定可能である。なお、測定装置7は、ロードセルおよび空気圧シリンダから構成された空気圧検出部79を取り付け可能になっている。空気圧検出部79では、供給部75から供給された加圧流体によって変化するラバーアクチュエータ2の内圧を検出することが可能である。従って、供給部75から供給される加圧流体によるラバーアクチュエータ2を変形させる圧力値Pは、空気圧検出部79で検出されるラバーアクチュエータ2の内圧に対応させることが可能である。
【0040】
測定装置7は、供給部75、電気特性検出部76、荷重部80、及び長さ同定部78に接続されたコントローラ70を備えている。コントローラ70は、供給部75及び荷重部80の制御を行う。コントローラ70は、供給部75及び荷重部80の制御に応じてラバーアクチュエータ2の圧力特性(圧力値)、電気特性(電気抵抗値)、ラバーアクチュエータ2における荷重特性(荷重値)、及び長さをデータとして取得し、記憶する。取得したデータ、すなわち、ラバーアクチュエータ2における物理量である、電気特性(電気抵抗値)、圧力特性(圧力値)、荷重特性(荷重値)、及び長さのデータセットは時系列に複数取得可能となり、後述する学習処理で学習データとして用いる。
【0041】
具体的には、コントローラ70は、図示しないCPUを含むコンピュータを含んで構成可能であり、学習データを収集する学習データ収集処理を実行する。
【0042】
図5に、コントローラ70で実行される学習データ収集処理の流れの一例を示す。
コントローラは、ステップS100で、供給部75に対して加圧流体を供給する制御指示を行い、荷重部80に対して荷重を付与する制御指示を行う。ステップS102で、ラバーアクチュエータ2における時系列の電気抵抗値(R)による電気特性、圧力値(P)による圧力特性、荷重値(F)による荷重特性、及び長さ(L)を取得し、次のステップS104で記憶する。なお、圧力値(圧力特性)はラバーアクチュエータの内圧でもよい。コントローラ70は、これらのラバーアクチュエータ2の電気特性(電気抵抗値R)、圧力特性(圧力値P)、荷重特性(荷重値F)、及び長さ(L)のセットが予め定めた所定数、又は予め定めた所定時間に達するまで(ステップS106で、肯定判断されるまで否定判断し)、上記処理を繰り返す。
【0043】
従って、コントローラ70は、ラバーアクチュエータ2を変形させる制御(すなわち供給部75及び荷重部80の制御)を行うことによって、ラバーアクチュエータ2の電気特性(電気抵抗値R)、圧力特性(圧力値P)、荷重特性(荷重値F)、及び長さ(L)を取得し、記憶することが可能となる。このコントローラ70に記憶されたデータセットが学習データとなる。
【0044】
次に、
図6及び
図7を参照して、学習処理部52について説明する。
図6には、学習処理部52の概念構成の一例を示す。
図7には、学習処理部52の具体的な構成の一例を示す。なお、学習処理部52は、学習用データとして、上述した測定装置7で測定したラバーアクチュエータ2の電気特性(電気抵抗値R)、圧力特性(圧力値P)、荷重特性(荷重値F)、及び長さ(L)のデータセットを多数保持、又は取得する。
【0045】
図6に示すように、学習処理部52は、第1の学習処理部52Aと第2の学習処理部52Bとを含む。なお、以降では、第1の学習処理部52Aを、学習処理部52Aと称し、第2の学習処理部52Bを、学習処理部52Bと称する。学習処理部52Aは、ラバーアクチュエータ2の第1データ31(電気特性)、及び第2データ32(圧力特性)を入力として、当該入力に対応する第3データ33(荷重特性)に一致又は近い荷重特性を推定し推定結果を荷重データ40として出力するように学習処理を行う機能部である。学習処理部52Bは、ラバーアクチュエータ2の第1データ31(電気特性)、第2データ32(圧力特性)、及び学習処理部52Aから出力される荷重データ40(推定結果の荷重特性)を入力として、当該入力に対応する第4データ34(長さ)に一致又は近いラバーアクチュエータ2の長さを推定して出力データ6として出力するように学習処理を行う機能部である。
【0046】
図7に示すように、学習処理部52Aは、生成器54Aと演算器56Aとを含む。生成器54Aは、時系列入力の前後関係を考慮して出力を生成する機能を有する。演算器56Aは、荷重データ40(推定結果)と、学習データの第3データ33(荷重特性)とを比較し、その比較結果の誤差を演算する機能を有する。
【0047】
生成器54Aは、入力層540A、中間層542A、及び出力層544Aを含んで、公知の再帰型ニューラルネットワーク、例えば、リカレントニューラルネットワーク(RNN:Recurrent Neural Network)を構成している。再帰型ニューラルネットワーク(例えば、RNN)自体は公知の技術であるため詳細な説明は省略するが、中間層542Aは、ノード間結合およびフィードバック結合を有するノード群(ニューロン群)を多数含む。その中間層542Aには、入力層540Aからのデータが入力され、中間層542Aの演算結果のデータは、出力層544Aへ出力される。
【0048】
具体的には、生成器54Aは、入力された第1データ31(電気特性)及び第2データ32(圧力特性)から荷重特性を表す荷重データ40を生成するニューラルネットワークである。荷重データ40は、第1データ31(電気特性)及び第2データ32(圧力特性)からラバーアクチュエータ2における荷重特性を推定したデータである。生成器54Aは、時系列に入力された第1データ31(電気特性)及び第2データ32(圧力特性)から、ラバーアクチュエータ2における荷重に関する測定値に近い荷重特性又は荷重値を示す荷重データ40を生成する。生成器54Aは、多数の第1データ31及び第2データ32を用いて学習することで、よりラバーアクチュエータにおける荷重に関する測定値に近い荷重データ40を生成できるようになる。
【0049】
演算器56Aは、荷重データ40と、学習データの第3データ33とを比較し、その比較結果の誤差を演算する。学習処理部52Aは、荷重データ40、及び学習データの第3データ33を演算器56Aに入力する。これに応じて、演算器56Aは、荷重データ40と、学習データの第3データ33との誤差を演算し、その演算結果を示す信号を出力する。
【0050】
学習処理部52Aは、演算器56Aで演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングすることで、生成器54Aの学習を行う。具体的には、生成器54Aにおける入力層540Aと中間層542Aとのノード間の結合の重みパラメータ、中間層542A内のノード間の結合の重みパラメータ、および中間層542Aと出力層544Aとのノード間の結合の重みパラメータの各々を例えば勾配降下法や誤差逆伝搬法等の手法を用いて、生成器54Aにフィードバックする。すなわち、学習データの第3データ33を目標として、出力層544Aから出力される荷重データ40と学習データの第3データ33との誤差を最小化するように全てのノード間の結合を最適化する。
【0051】
学習処理部52Aの学習処理により第1モデル51Aが生成される。第1モデル51Aは、学習処理部52Aによる学習結果のノード間の結合の重みパラメータ(重み又は強度)の情報の集合として表現される。
【0052】
生成器54Bは、生成器54Aと同様に形成される。具体的には、生成器54Bは、入力層540B、中間層542B、及び出力層544Bを含んで構成される。中間層542Bは、ノード間結合およびフィードバック結合を有するノード群(ニューロン群)を多数含む。その中間層542Bには、入力層540Bからのデータが入力され、中間層542Bの演算結果のデータは、出力層544Bへ出力される。
【0053】
生成器54Bは、第1データ31(電気特性)及び第2データ32(圧力特性)と、上述した荷重データ40とを用いてラバーアクチュエータ2の長さを表す長さデータ42を生成するニューラルネットワークである。長さデータ42は、第1データ31(電気特性)、第2データ32(圧力特性)、及び荷重データ40からラバーアクチュエータ2の長さを推定したデータである。生成器54Bは、時系列に入力された第1データ31(電気特性)、第2データ32(圧力特性)、及び荷重データ40から、ラバーアクチュエータ2の測定値に近い長さを示す長さデータ42を生成する。生成器54Bは、多数の第1データ31及び第2データ32と、荷重データ40とを用いて学習することで、よりラバーアクチュエータにおける測定値に近い長さデータ42を生成できるようになる。
【0054】
演算器56Bは、長さデータ42と、学習データの第4データ34(長さ)とを比較し、その比較結果の誤差を演算する。学習処理部52Bは、長さデータ42、及び学習データの第4データ34を演算器56Bに入力する。これに応じて、演算器56Bは、長さデータ42と、学習データの第4データ34との誤差を演算し、その演算結果を示す信号を出力する。
【0055】
学習処理部52Bは、学習処理部52Aと同様に、演算器56Bで演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングすることで、生成器54Bの学習を行う。すなわち、学習データの第4データ34を目標として、出力層544Bから出力される長さデータ42と学習データの第4データ34との誤差を最小化するように全てのノード間の結合を最適化する。
【0056】
学習処理部52Bの学習処理により第2モデル51Bが生成される。第2モデル51Bは、学習処理部52Bによる学習結果のノード間の結合の重みパラメータ(重み又は強度)の情報の集合として表現される。
【0057】
従って、学習モデル51は、学習処理部52Aの学習処理により生成される第1モデル51Aと、学習処理部52Bの学習処理により生成される第2モデル51Bとを含む。
【0058】
図8に、学習処理部52における学習処理の流れの一例を示す。学習処理部52は、図示しないCPUを含むコンピュータを含んで構成し、学習処理を実行することが可能である。
学習処理部52は、次の各ステップを実行する。まず、ステップS110で、学習データを取得する。すなわち、時系列に測定した結果のデータとして、第1データ31(電気特性)、第2データ32(圧力特性)、第3データ33(荷重特性)、及び第4データ34(長さ)を取得する。次に、ステップS112及びステップS113では、時系列の学習データを用いて第1モデル51A及び第2モデル51Bを含む学習モデル51を生成する。すなわち、多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ(重み又は強度)の情報の集合を得る。具体的には、ステップS112で、荷重データ40を推定するための第1段目のノード間の結合の重みパラメータの情報の第1集合を得る。当該第1集合によるデータはコンピュータを第1モデル51Aとして機能するための要素データである。ステップS113では、長さデータ42を推定するための第2段目のノード間の結合の重みパラメータの情報の第2集合を得る。当該第2集合によるデータはコンピュータを第2モデル51Bとして機能するための要素データである。そして、ステップS114で、第1集合として表現されるデータを第1モデル51Aとして記憶し、第2集合として表現されるデータを第2モデル51Bとして記憶する。
【0059】
なお、上述した生成器は、時系列入力の前後関係を考慮して出力を生成する機能を有するものであり、上記では再帰型ニューラルネットワークを用いた一例を説明したが、本開示の技術は、再帰型ニューラルネットワークを用いることに限定するものではない。すなわち、本開示の技術は、時系列入力の前後関係を考慮して出力を生成する機能を有するものであればよく、他の手法を用いてもよい。
【0060】
物理量推定装置1では、以上に例示した手法により生成した学習済みの生成器(すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ)を第1モデル51Aと第2モデル51Bとを含む学習モデル51を用いる。十分に学習した学習モデル51を用いれば、非線形に変形するラバーアクチュエータについて、時系列な圧力値および電気抵抗値から荷重を考慮した長さを推定することも不可能ではない。
【0061】
なお、学習処理部52による処理は、本開示の学習モデル生成装置の処理の一例である。また、物理量推定装置1は、本開示の推定部および推定装置の一例である。さらに、ステップS110で学習データを取得することは、本開示の取得部の機能の一例である。また、取得した学習データは取得結果の一例である。また、上述した学習処理を実行する学習処理部52は、学習モデル生成部の一例である。
【0062】
物理量推定装置1は、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。
【0063】
図9に、物理量推定装置1の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで構成した場合の一例を示す。
【0064】
図9に示す物理量推定装置1として機能するコンピュータは、コンピュータ本体100を備えている。コンピュータ本体100は、CPU102、揮発性メモリ等のRAM104、ROM106、ハードディスク装置(HDD)等の補助記憶装置108、及び入出力インターフェース(I/O)110を備えている。これらのCPU102、RAM104、ROM106、補助記憶装置108、及び入出力I/O110は、相互にデータ及びコマンドを授受可能にバス112を介して接続された構成である。また、入出力I/O110には、通信インタフェース(I/F)114、及びディスプレイやキーボード等の操作表示部116が接続されている。通信I/F114は、外部装置との間で、第1データ31(電気特性)、第2データ32(圧力特性)、及び出力データ6(長さ)を入出力する入出力部として機能する。
【0065】
補助記憶装置108には、コンピュータ本体100を本開示の推定装置の一例としての物理量推定装置1として機能させるための制御プログラム108Pが記憶される。CPU102は、制御プログラム108Pを補助記憶装置108から読み出してRAM104に展開して処理を実行する。これにより、制御プログラム108Pを実行したコンピュータ本体100は、本開示の推定装置の一例として物理量推定装置1として動作する。
【0066】
なお、補助記憶装置108には、第1モデル51Aと第2モデル51Bによる学習モデル51を含む学習モデル108M、及び各種データを含むデータ108Dが記憶される。制御プログラム108Pは、CD-ROM等の記録媒体により提供するようにしても良い。
【0067】
次に、コンピュータにより実現された物理量推定装置1における推定処理について説明する。
【0068】
図10に、コンピュータ本体100において、実行される制御プログラム108Pによる推定処理の流れの一例を示す。
図10に示す推定処理は、コンピュータ本体100に電源投入されると、CPU102により実行される。すなわち、CPU102は、制御プログラム108Pを補助記憶装置108から読み出し、RAM104に展開して処理を実行する。
【0069】
まず、CPU102は、ステップS200で、補助記憶装置108の学習モデル108Mから、第1モデル51Aと第2モデル51Bとを含む学習モデル51を読み出し、RAM104に展開することで、学習モデル51を取得する。具体的には、学習モデル51としての第1モデル51Aと第2モデル51Bとの各々に表現された重みパラメータによるノード間の結合となるネットワークモデルを、RAM104に展開する。よって、重みパラメータによるノード間の結合が実現された第1モデル51Aと第2モデル51Bによる学習モデル51が構築される。
【0070】
次に、CPU102は、ステップS202で、ラバーアクチュエータ2の長さを推定する対象となる未知の第1データ31(電気特性)及び未知の第2データ32(圧力特性)を、通信I/F114を介して時系列に取得する。
【0071】
次に、CPU102は、ステップS204で、学習モデル51のうちの第1モデル51Aを用いて、ステップS202において取得した第1データ31(電気特性)及び第2データ32(圧力特性)に対応する荷重データ40を推定する。すなわち、時系列に変化する電気抵抗値(電気特性)及び圧力値(圧力特性)に対応して、或る時点の圧力値および電気抵抗値から、その時点の荷重値(荷重特性)が推定される。
【0072】
次に、CPU102は、ステップS206で、第2モデルへの入力用のデータとして、前記未知の第1データ31(電気特性)及び未知の第2データ32(圧力特性)と、ステップS204で推定した荷重データ40(荷重特性)とを取得する。
【0073】
次に、CPU102は、ステップS208で、学習モデル51のうちの第2モデル51Bを用いて、取得した第1データ31(電気特性)及び第2データ32(圧力特性)と、荷重データ40(荷重特性)とに対応する長さデータ42を推定する。すなわち、時系列に変化する電気抵抗値及び圧力値に対応して、或る時点の電気抵抗値及び圧力値から、その時点における電気抵抗値及び圧力値への変化と荷重とに応じて非線形に変化する長さが推定される。
【0074】
次のステップS210で、ステップS208での推定結果の長さデータ42を出力データ6(ラバーアクチュエータ2の長さ)として、通信I/F114を介して出力して、本処理ルーチンを終了する。
【0075】
なお、
図10に示す推定処理は、本開示の推定方法で実行される処理の一例である。
【0076】
以上説明したように、本開示によれば、ラバーアクチュエータ2に対して、未知の第1データ31(電気特性)及び第2データ32(圧力特性)から、ラバーアクチュエータ2の長さを推定することが可能となる。すなわち、非線形に変形するラバーアクチュエータ2における非線形な変形を直接計測することなく、ラバーアクチュエータ2の長さを推定することができる。これによって、本開示によれば、ラバーアクチュエータ2を用いる装置および構造物の大型化を抑制することが可能となる。
【0077】
なお、本開示の技術は、圧力特性を示す第2物理量は省略可能であって、ラバーアクチュエータ2に対して、未知の第1データ31(電気特性)から、ラバーアクチュエータ2の長さを推定することも可能となる。
【0078】
(第2実施形態)
次に、第2実施形態を説明する。第2実施形態は、ラバーアクチュエータ2の長さを推定するにあたって、推定速度を向上することを考慮したものである。なお、第2実施形態は第1実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。
【0079】
一般的な再帰型ニューラルネットワークでは、入力層から中間層へのノードの結合、中間層におけるノード間の結合およびフィードバック結合、そして中間層から出力層へのノード間の結合の各々の結合について重みパラメータの情報を最適化する。しかし、非線形に変形するラバーアクチュエータ2に対して時間的な相関を持つ時系列データを用いた学習では膨大な学習時間が要求される。また、時系列な学習データによる学習時に、時間的遡及を行うために、膨大なメモリも要求される。
【0080】
この膨大な時間が要求される学習時間を抑制することを目的とし、リザバコンピューティングと呼ばれる周知のネットワークモデルが、非線形に変形するラバーアクチュエータ2の長さ推定に適用可能である。リザバコンピューティング(RC:Reservoir Computing)と呼ばれるネットワークモデル(以下、RCNという。)自体は公知の技術であるため、詳細な説明を省略するが、RCNの一例は、再帰型ニューラルネットワークの一部を固定し(ランダムなネットワークに置き換え)、中間層から出力層へのノード間の結合のみを最適化するものである。
【0081】
図11に、RCNを用いた学習処理部の概念構成の一例を示す。
図11に示す学習処理部52は、
図7に示す学習処理部52A、52Bを学習処理部52C、52Dに代え、
図7に示す生成器54A、54Bを生成器54C、54Dに代え、演算器56A、56Bにより導出された誤差を出力層544A、544B側にのみ反映させて学習を行う点が
図7に示す学習処理部52と異なっている。
【0082】
図11に示すように、学習処理部52Cの生成器54Cは、
図7と同様の入力層540、出力層544A、及び
図7の中間層542Aに代えてリザバコンピューティングにおけるリザバであるリザバ層543Cを含んで、公知のRCNを構成する。RCNでは、入力層540Aからリザバ層543Cへのノードの結合と、リザバ層543Cにおけるノード間の結合およびフィードバック結合とに、固定の重みパラメータの情報(以下、重み係数という。)が設定される。そして、リザバ層543Cから出力層544Aへのノード間の結合は、例えば線形結合とされ、各々の重みパラメータが学習データの学習によって最適化される。
【0083】
なお、固定の重み係数は、予め設定しておくものとする。この固定の重み係数は、初期値として定めた係数を設定することが可能である。また、固定の重み係数は、学習データを用いて、学習データの第3データ33を目標として、荷重データ40と学習データの第3データ33との誤差を最小化するようにノード間等の結合を、誤差を最小化するには不十分な所定回数又は所定時間だけ最適化した場合の重み係数を設定してもよい。
【0084】
一方、リザバ層543Cから出力層544Aへのノード間の結合を規定する重みパラメータは、多数の学習データを用いて、荷重データ40と学習データの第3データ33との誤差を最小化するように学習して導出される。
【0085】
同様に、学習処理部52Dの生成器54Dは、
図7と同様の入力層540B、出力層544B、及び
図7の中間層542Bに代えてリザバコンピューティングにおけるリザバ層543Dを含んで、公知のRCNを構成する。リザバ層543Dから出力層544Bへのノード間の結合(例えば線形結合)は、各々の重みパラメータが学習データの学習によって最適化される。また、固定の重み係数は、予め設定しておく。
【0086】
一方、リザバ層543Dから出力層544Bへのノード間の結合を規定する重みパラメータは、多数の学習データを用いて、長さデータ42と学習データの第4データ34との誤差を最小化するように学習して導出される。
【0087】
図12に、本実施形態に係る学習処理の流れの一例を示す。生成器54Cを含む学習処理部52C及び生成器54Dを含む学習処理部52Dによる学習処理部52は、図示しないCPUを含むコンピュータを含んで構成し、学習処理を実行することが可能である。
【0088】
学習処理部52は、次の各ステップを実行する。まず、上記ステップS110と同様に、ステップS120で、時系列に測定した結果の学習データを取得する。すなわち、時系列に測定した結果のデータとして、第1データ31(電気特性)、第2データ32(圧力特性)、第3データ33(荷重特性)、及び第4データ34(長さ)を取得する。
【0089】
ステップS122では、第1モデル用の入力層540A及びリザバ層543Cを構築する。ここでは、
図7に示す生成器54Aと同様であるが、一部の学習データを用いて、学習処理を行う場合を説明する。具体的には、一部の学習データを用いて、学習処理を行う。この一部の学習データを用いて学習した学習結果のノード間の結合の重みパラメータの情報の集合を得て、入力層540Aからリザバ層543Cへのノードの結合と、リザバ層543Cにおけるノード間の結合及びフィードバック結合とを、重み係数として導出する。この導出した重み係数により入力層540A及びリザバ層543Cを同定することで入力層540A及びリザバ層543Cを構築する。
【0090】
次に、ステップS123では、多数の学習データを用いて第1モデル51Aを生成する。すなわち、リザバ層543Cから出力層544Aへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第1モデル用のRCNを構築する。
【0091】
次のステップS124では、上記ステップS122と同様に、第2モデル用の入力層540B及びリザバ層543Dを構築する。すなわち、一部の学習データを用いて、学習処理を行う。この一部の学習データを用いて学習した学習結果のノード間の結合の重みパラメータの情報の集合を得て、入力層540Bからリザバ層543Dへのノードの結合と、リザバ層543Dにおけるノード間の結合およびフィードバック結合とを、重み係数として導出する。この導出した重み係数により入力層540B及びリザバ層543Dを同定することで入力層540B及びリザバ層543Dを構築する。
【0092】
次に、ステップS125では、上記ステップS123と同様に、多数の学習データを用いて第2モデル51Bを生成する。すなわち、リザバ層543Dから出力層544Bへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第2モデル用のRCNを構築する。
【0093】
そして、ステップS126において、ステップS122で導出した重み係数と、ステップS123の学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータを第1モデル51Aとして記憶する。また、ステップS124で導出した重み係数と、ステップS125の学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータを第2モデル51Bとして記憶する。
【0094】
本実施形態に係る物理量推定装置1では、上記に例示した手法により生成した学習済みの生成器54C、54Dを学習モデル51として用いる。ここでは、入力層540Aからリザバ層543Cへのノードの結合と、リザバ層543Cにおけるノード間の結合及びフィードバック結合とを表す重み係数と、リザバ層543Cから出力層544Aへのノード間の結合とを表す重みパラメータとが第1モデル51Aに対応する。また、入力層540Bからリザバ層543Dへのノードの結合と、リザバ層543Dにおけるノード間の結合及びフィードバック結合とを表す重み係数と、リザバ層543Dから出力層544Bへのノード間の結合とを表す重みパラメータとが第2モデル51Bに対応する。十分に学習した第1モデル51Aと第2モデル51Bを含む学習モデル51を用いれば、非線形に変形するラバーアクチュエータについて、電気特性及び圧力特性(時系列な電気抵抗値及び圧力値)から非線形に変化する長さを同定することも不可能ではない。
【0095】
以上説明したように、本開示によれば、一般的な再帰型ニューラルネットワークに代えて、RCNによりネットワークを構築して学習モデル51を最適化する。これによって、一般的な再帰型ニューラルネットワークにより学習モデルを構築する場合と比べて、必要とされた学習時間を抑制可能となる。
【0096】
また、一般的な再帰型ニューラルネットワークでは時間的遡及を行うために、必要とされる膨大なメモリ(メモリ容量)も抑制可能となる。
【0097】
(第3実施形態)
次に、第3実施形態を説明する。第3実施形態は、ラバーアクチュエータ2の長さを推定するための学習モデル51の学習効果の向上を考慮したものである。なお、第3実施形態は第1実施形態及び第2実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。
【0098】
上述したRCNを用いることで、学習時間を低減可能となる。ところで、入力層からリザバ層へのノードの結合と、リザバ層におけるノード間の結合およびフィードバック結合とに、固定の重みパラメータを用いた場合、学習の効果が不十分な場合がある。これは、リザバ層から出力層へのノード間の結合の重みパラメータを学習しても、固定の重みパラメータによる限られた個数のノードが設定されたリザバ層では、リザバ層からの出力が最適化に足る出力とならない場合があるからである。このため、リザバ層に用いる再帰型ニューラルネットワークの構造を複雑にすることが想定されるが、リザバ層の設定時間を要することになるため、好ましくない。
【0099】
リザバコンピューティング(RCN)は、周知のように、入力を高次元空間に非線形変換により高次元の特徴空間に射影することである。この点について、再帰型ニューラルネットワークに代えて非線形な動的システムをリザバ層に用いる、物理的リザバコンピューティング(PRC:Physical Reservoir Computing)と呼ばれるネットワークモデル(以下、PRCNという。)が知られている。PRCおよびPRCN自体は公知の技術であるため、詳細な説明を省略するが、リザバ層に非線形に変形するラバーアクチュエータ2の変形に関するデータを貯留するものとして利用可能である。すなわち、PRCNは、非線形に変形するラバーアクチュエータ2の長さの推定に好適に適用可能である。
【0100】
図13に、PRCNを用いた学習処理部の概念構成の一例を示す。
図13に示す学習処理部52は、
図11に示す学習処理部52C、52Dを学習処理部52E、52Fに代え、
図11に示す生成器54C、54Dを生成器54E、54Fに代え、演算器56A、56Bにより導出された誤差を出力層544A、544B側にのみ反映させて学習を行う点が
図7に示す学習処理部52と異なっている。
【0101】
図13に示すように、学習処理部52Eの生成器54Eは、
図11と同様の入力層540Aと出力層544A、及び
図11のリザバ層543Cに代えて物理リザバ層545Eを含んで、公知のPRCNを構成する。PRCN自体は公知の技術であるため、詳細な説明を省略するが、PRCNでは、入力層540Aから物理リザバ層545Eへのノードの結合には、固定の重み係数が設定される。物理リザバ層545Eは、多数の時系列な相関関係について特徴量を貯留し、入力に近い複数の特徴量を出力する構成になっている。そして、物理リザバ層545Eから出力層544Aへのノード間の結合(例えば線形結合)は、各々の重みパラメータが、多数の学習データを用い、荷重データ40と学習データの第3データ33(荷重特性)との誤差を最小化する学習によって最適化される。
【0102】
なお、固定の重み係数は、上述したように、初期値として定めた係数を設定してもよく、学習データを用いて、所定回数又は所定時間だけ最適化した場合の重み係数を設定してもよい。
【0103】
物理リザバ層545Eは、ラバーアクチュエータ2の時系列に物理的な相関関係が多数貯留され、入力層540Aからの未知の入力データ(電気特性と圧力特性)に近い、入力データ(電気特性と圧力特性)に対応する長さを抽出し、複数の特徴量として出力層544Aへ出力する。概念的には、ラバーアクチュエータ2の挙動として、電気特性と圧力特性、すなわち時系列に変化する電気抵抗値及び圧力値に対応する荷重特性(荷重値)との相関関係を多数記憶しておき、未知の電気特性と圧力特性(時系列の電気抵抗値及び圧力値)に近い複数のラバーアクチュエータ2における荷重特性(荷重値)の各々を特徴量として選択して出力することである。これによって、複雑な計算を実行することを低減可能となる。
【0104】
同様に、学習処理部52Fの生成器54Fは、入力層540Bと出力層544B、及び物理リザバ層545Fを含んで、公知のPRCNを構成する。入力層540Bから物理リザバ層545Fへのノードの結合には、固定の重み係数が設定され、物理リザバ層545Fは、多数の時系列な相関関係について特徴量を貯留し、入力に近い複数の特徴量を出力する構成になっている。物理リザバ層545Fから出力層544Aへのノード間の結合は、各々の重みパラメータが、多数の学習データを用い、長さデータ42と学習データの第4データ34(長さ)との誤差を最小化する学習によって最適化される。
【0105】
物理リザバ層545Fは、入力層540Bからの未知の入力データ(電気特性、圧力特性、及び荷重特性)に近い、入力データに対応する長さを抽出し、複数の特徴量として出力層544Bへ出力する。これによって、複雑な計算を実行することを抑制可能となる。
【0106】
図14に、本実施形態に係る学習処理の流れの一例を示す。生成器54Eを含む学習処理部52E及び生成器54Fを含む学習処理部52Fによる学習処理部52は、図示しないCPUを含むコンピュータを含んで構成し、学習処理を実行することが可能である。
【0107】
学習処理部52は、次の各ステップを実行する。まず、上記ステップS110と同様に、ステップS130で、時系列に測定した結果の学習データを取得する。すなわち、時系列に測定した結果のデータとして、第1データ31(電気特性)、第2データ32(圧力特性)、第3データ33(荷重特性)、及び第4データ34(長さ)を取得する。
【0108】
ステップS132では、第1モデル用の入力層540A及びリザバ層543Cを構築する。入力層540Aは、予め定めた重み係数を設定するものとする。よって、入力層540Aから物理リザバ層545Eへのノードの結合を、予め定めた重み係数により同定することで入力層540Aを構築する。一方、物理リザバ層545Eは、学習データの各々、すなわち、電気特性及び圧力特性(時系列に変化する電気抵抗値及び圧力値)に対応する荷重特性(荷重値)との相関関係を多数貯留したものとする。よって、物理リザバ層545Eは、学習データによる時系列に変化する電気特性及び圧力特性(電気抵抗値及び圧力値)に対応する荷重特性(荷重値)との相関関係が特徴量として貯留され、その中から入力に近い複数の特徴量を出力するように構成することで構築する。なお、物理リザバ層545Eにおいて入力に近い複数の特徴量を出力する構成の一例には、入力された電気特性と圧力特性に近い、電気特性と圧力特性に対応する複数の荷重特性の各々を特徴量として選択して出力するフィルタ等のデータを適用すればよい。
【0109】
次に、ステップS133では、多数の学習データを用いて第1モデル51Aを生成する。すなわち、上述した物理リザバ層545Eから出力層544Aへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第1モデル用のPRCNを構築する。
【0110】
次のステップS134では、上記ステップS132と同様に、第2モデル用の入力層540B及び物理リザバ層545Fを構築する。すなわち、入力層540Bは、予め定めた重み係数を設定し、入力層540Bから物理リザバ層545Fへのノードの結合を、予め定めた重み係数により同定することで入力層540Bを構築する。物理リザバ層545Fは、学習データの各々、すなわち、電気特性及び圧力特性(時系列に変化する電気抵抗値及び圧力値)と、電気特性及び圧力特性に対応する荷重特性(荷重値)との相関関係を多数貯留する。よって、物理リザバ層545Fは、学習データによる電気特性及び圧力特性に対応する荷重特性との相関関係が特徴量として貯留され、その中から入力に近い複数の特徴量を出力するように構成することで構築する。なお、物理リザバ層545Fにおいて入力に近い複数の特徴量を出力する構成の一例には、入力された電気特性及び圧力特性と、荷重特性とに近い、対応する複数の長さの各々を特徴量として選択して出力するフィルタ等のデータを適用すればよい。
【0111】
次に、ステップS135では、上記ステップS133と同様に、多数の学習データを用いて第2モデル51Bを生成する。すなわち、物理リザバ層545Fから出力層544Bへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第2モデル用のPRCNを構築する。
【0112】
次のステップS136では、上述した構築済みの第1モデル用のPRCN及び第2モデル用のPRCNを学習モデル51として記憶する。具体的には、第1モデル用のPRCNを示すデータとして、入力層540Aから物理リザバ層545Eへのノードの結合、物理リザバ層545E、及び物理リザバ層545Eから出力層544Aへのノード間の結合を表す重みパラメータで表現されるデータを、第1モデル51Aとして記憶する。また、第2モデル用のPRCNを示すデータとして、入力層540Bから物理リザバ層545Fへのノードの結合、物理リザバ層545F、及び物理リザバ層545Fから出力層544Bへのノード間の結合を表す重みパラメータで表現されるデータを、第2モデル51Bとして記憶する。
【0113】
本実施形態に係る物理量推定装置では、上述した手法により生成した学習済みの生成器54E、54Fを学習モデル51として用いる。
【0114】
本実施形態に係る物理量推定装置1は、未知の入力データであるラバーアクチュエータ2の電気特性及び圧力特性に対して、第1モデル51Aにおいて、物理リザバ層545Eに貯留されたラバーアクチュエータ2の時系列の物理的な相関関係のうち、未知の入力データ(電気特性及び圧力特性)に近い当該入力データに対応する荷重特性(荷重値)を示すデータを、複数の特徴量として抽出する。この物理リザバ層545Eからの複数の特徴量を、学習された重みパラメータによって、例えば線形結合してラバーアクチュエータ2の荷重特性(荷重データ40)として推定する。十分に学習した第1モデル51Aを用いれば、ラバーアクチュエータにおける電気特性及び圧力特性から荷重特性を同定することも不可能ではない。そして、第2モデル51Bにおいて、未知の入力データであるラバーアクチュエータ2の電気特性及び圧力特性に対して、物理リザバ層545Fに貯留されたラバーアクチュエータ2の時系列の物理的な相関関係のうち、未知の入力データ(電気特性及び圧力特性)と、当該未知の入力データ(電気特性及び圧力特性)に対応する荷重特性とに近い、対応する長さを示すデータを、複数の特徴量として抽出する。この物理リザバ層545Fからの複数の特徴量を、学習された重みパラメータによって、例えば線形結合してラバーアクチュエータ2の長さ(長さデータ42)として推定する。十分に学習した学習モデル51を用いれば、ラバーアクチュエータ2について、電気特性及び圧力特性から長さを推定することも不可能ではない。
【0115】
以上説明したように、本開示によれば、RCNに代えて、PRCNによりネットワークを構築して学習モデル51を最適化する。これによって、RCNにより学習モデルを構築する場合と比べて、学習モデル51の学習効果の向上が図れる。
【0116】
(第4実施形態)
次に、第4実施形態を説明する。なお、第4実施形態は上述した実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。
【0117】
上述した実施形態では、少なくとも2つの物理量から他の物理量を推定する場合、すなわち、例えば、ラバーアクチュエータ2における第1データ(電気特性)及び第2データ(圧力特性)を用いて、ラバーアクチュエータ2の長さを推定する場合を説明した。第4実施形態は、1つの物理量から他の物理量を推定する場合に本開示の技術を適用したものである。
【0118】
図15に、本実施形態に係る物理量推定装置の構成の一例を示す。本実施形態では、予め学習された学習モデルを用いて、ラバーアクチュエータ2について、第1データ31(電気特性)のみからラバーアクチュエータ2の長さを推定する。
【0119】
ここで、ラバーアクチュエータ2の変形によって得られる第1データ31(電気特性)には、圧力特性、荷重特性、及び長さの各々の成分が含まれていると考えられる。そこで、本実施形態では、入力された第1データ31(電気特性)から圧力特性を示す圧力データ及び荷重特性を示す荷重データを推定し、当該推定結果を用いて、ラバーアクチュエータ2の長さを推定する。
【0120】
図15に示すように、本実施形態に係る物理量推定装置10における推定部5には、入力データ3として、ラバーアクチュエータ2における時系列の電気抵抗の大きさ(電気抵抗値)による電気特性を表す第1データ31のみが入力される。物理量推定装置10における推定部5は、学習済みの学習モデル51を用いて推定したラバーアクチュエータ2の変形の大きさ(長さ)を表す出力データ6を出力する。
【0121】
図16に、本実施形態に係る学習処理部52の概念構成の一例を示す。
学習処理部52は、ラバーアクチュエータ2における時系列な物理量として測定済みの物理量を用いて学習処理を行う。すなわち、ラバーアクチュエータ2における物理量を時系列に測定した大量のデータを学習データとする。本実施形態では、ラバーアクチュエータ2における物理量について圧力特性及び荷重特性で表される力を考慮して、学習モデル51を学習する。学習データは、ラバーアクチュエータ2における電気特性(第1データ31)、圧力特性(第2データ32)及び荷重特性(第3データ33)と、ラバーアクチュエータ2の長さ(第4データ34)と、のセットを大量に含む。
【0122】
図16に示すように、本実施形態に係る学習処理部52は、学習処理部52A、52Bを含み、学習処理部52Aは第1データ31(電気特性)から圧力特性を示す圧力データ44及び荷重特性を示す荷重データ40を出力するように学習処理を行う機能部である。具体的には、学習処理部52Aは、第1データ31(電気特性)を入力として、当該入力に対応する第2データ32(圧力特性)に一致又は近い圧力特性を推定し、推定結果を圧力データ44として出力するように学習処理を行う。また、学習処理部52Aは、第1データ31(電気特性)を入力として、当該入力に対応する第3データ33(荷重特性)に一致又は近い荷重特性を推定し、推定結果を荷重データ40として出力するように学習処理を行う。学習処理部52Bは、ラバーアクチュエータ2の第1データ31(電気特性)と、学習処理部52Aから出力される圧力データ44、及び荷重データ40と、を入力として、当該入力に対応する第4データ34(長さ)に一致又は近いラバーアクチュエータ2の長さを推定して出力データ6として出力するように学習処理を行う機能部である。
【0123】
学習処理部52Aは、学習データのうちの第1データ31(電気特性)を入力とし、学習データのうちの第2データ32(圧力特性)及び第3データ33(荷重特性)の両方を目標として、出力層544Aから出力される圧力データ44と学習データの第2データ32との誤差、及び荷重データ40と学習データの第3データ33との誤差を最小化するようにノード間の結合を最適化する。
【0124】
学習処理部52Bは、学習データのうちの第1データ31(電気特性)を入力とし、第1データ31により推定される圧力データ44と荷重データ40も入力とする。学習処理部52Bは、入力されたデータに対して、学習データのうちの第4データ34(長さ)を目標として、出力層544Bから出力される長さデータ42と学習データの第4データ34との誤差を最小化するようにノード間の結合を最適化する。
【0125】
十分に学習した第1モデル51Aを用いれば、ラバーアクチュエータ2における電気特性(電気抵抗値)から圧力特性(圧力値)及び荷重特性(荷重値)を推定することも不可能ではない。また、第1モデル51Aの推定結果を用いて十分に学習した第2モデル51Bを用いれば、ラバーアクチュエータ2における電気特性(電気抵抗値)から圧力特性(圧力値)及び荷重特性(荷重値)を考慮したラバーアクチュエータ2の長さを推定することも不可能ではない。
【0126】
以上説明したように、本実施形態によれば、1つの物理量としての電気特性(電気抵抗値)から他の物理量(ラバーアクチュエータ2の長さ)を推定できる。従って、ラバーアクチュエータ2の時系列の電気抵抗値による電気特性を検出するのみで、ラバーアクチュエータ2の長さを推定することが可能となる。
【0127】
(第5実施形態)
次に、第5実施形態を説明する。なお、第5実施形態は上述した実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。
【0128】
上述した実施形態では、物理量推定装置10における推定部5で用いる学習モデル51として、第1モデル51Aと第2モデル51Bとを独立したモデルで形成し、個別に学習処理して第1モデル51Aと第2モデルとを生成する場合を説明した。本開示の技術は、第1モデル51Aと第2モデル51Bとを独立した2つのモデルで形成することに限定されない。例えば、3つ以上のモデルによって段階的に学習モデルを形成してもよく、1つのモデルで、学習モデル51を形成してもよい。第5実施形態は、一例として、第1実施形態における第1モデル51Aと第2モデル51Bとを1つのモデルで、学習モデル51を形成する場合に本開示の技術を適用したものである。
【0129】
図17に、1つのモデルで、学習モデル51を形成する場合における学習処理部52の概念構成の一例を示す。
【0130】
図17に示すように、本実施形態に係る学習処理部52は、1つのモデルに対して2段階の学習処理を行う。第1段階の学習処理では、第1データ31(電気特性)及び第2データ32(圧力特性)から荷重特性を示す荷重データ40を出力するように学習処理を行う。具体的には、
図17に実線で示すように、学習処理部52は、第1段階の学習処理として、第1データ31(電気特性)及び第2データ(圧力特性)を入力として、当該入力に対応する第3データ33(荷重特性)に一致又は近い荷重特性を推定し、推定結果を荷重データ40として出力するように学習処理を行う。第2段階の学習処理では、
図17に点線で示すように、第1データ31(電気特性)及び第2データ(圧力特性)と、学習処理部52Aから出力される荷重データ40と、を入力として、当該入力に対応する第4データ34(長さ)に一致又は近いラバーアクチュエータ2の長さを推定して出力データ6として出力するように学習処理を行う。この第2段階の学習処理では、第1段階で学習処理したことにより得られる荷重データ40が、第2段階の学習処理においても維持されるように学習処理が行われる。
【0131】
十分に学習した学習モデル51を用いれば、1つの学習モデルであっても、ラバーアクチュエータ2における電気特性(電気抵抗値)及び圧力特性(圧力値)から荷重特性(荷重値)を中間ノードとして推定しつつ、ラバーアクチュエータ2の長さを推定することも不可能ではない。
【0132】
以上説明したように、本実施形態によれば、1つの学習モデルによって、入力された物理量(例えば、電気特性及び圧力特性)から他の物理量(ラバーアクチュエータ2の長さ)を推定できる。従って、複数の学習モデルを構築することに比べて、モデルの数量を低減可能となり、ネットワーク構成を簡略化することが可能となる。
【0133】
(実施例1)
次に、上述した実施形態を適用した推定装置を用いて、荷重を与えた際におけるラバーアクチュエータ2の長さを推定する検証を行った。次の表1に、第1データ31(電気特性)と、第2データ32(圧力特性)とを計測した実測物理量を用いてラバーアクチュエータ2の長さを推定した場合における検証結果を示す。当該検証では、荷重データ40の推定を実行せずにラバーアクチュエータ2の長さを推定した結果を比較例として例示する。また、検証結果を評価する評価指標には、ラバーアクチュエータ2の長さの実測値と予測値との誤差の総和による指標(NMSE)を用いた。
【0134】
【0135】
比較例1は、第1データ31(電気特性)であるラバーアクチュエータ2における電気抵抗値と、第2データ32(圧力特性)であるラバーアクチュエータ2における圧力値(内圧値)とを計測した計測値を実測物理量として入力し、ラバーアクチュエータ2の長さを推定した結果である。比較例2は、電気抵抗値と、圧力値(内圧値)と、第3データ33(荷重特性)として荷重値とを計測した計測値を実測物理量として入力し、ラバーアクチュエータ2の長さを推定した結果である。実施例1は、電気抵抗値と、圧力値(内圧値)とを計測した計測値を実測物理量として第1モデル51Aに入力し、第1モデル51Aによる推定結果の荷重データ40を、前記電気抵抗値及び圧力値(内圧値)に加えて第2モデル51Bに入力してラバーアクチュエータ2の長さを推定した結果である。
【0136】
比較例2では、評価指標が0.0138と小さい値となり、高精度に長さを推定可能であるが、常時、荷重を実測することは困難である。一方、比較例1に示すように、荷重を実測値を用いない場合は、評価指標が0.2200になり、比較例2に比べて推定精度が極端に低下する。一方、実施例1では、荷重特性を考慮した学習モデルを用いることで、評価指標が0.0523となり、比較例2に比べて高精度に長さを推定可能である。すなわち、実施例1では、第1モデル51Aにより電気特性(電気抵抗値)及び圧力特性(内圧)から荷重特性を推定し、その推定結果の荷重データ40を加えた物理量を用いて第2モデル51Bにより長さを推定する。このように、長さを推定するための物理量として荷重特性を用いることなく、電気特性(電気抵抗値)及び圧力特性(内圧)のみを用いた場合であっても、荷重特性を考慮した結果に近い推定結果を得ることが可能となる。従って、荷重特性を推定し、その推定結果の荷重データを用いて長さを推定することで、比較例2に比べて推定精度を大幅に向上することが可能となる。
【0137】
(実施例2)
次に、ラバーアクチュエータ2の第1データ31(電気特性)を計測した実測物理量を用いてラバーアクチュエータ2の長さを推定した検証について説明する。次の表2に、第1データ31(電気特性)を用いてラバーアクチュエータ2の長さを推定した場合における検証結果を示す。
【0138】
【0139】
比較例3は、第1データ31(電気特性)である電気抵抗値を計測した計測値を実測物理量として入力し、ラバーアクチュエータ2の長さを推定した結果である。実施例2は、第1データ31(電気特性)である電気抵抗値による実測物理量を第1モデル51Aに入力し、第1モデル51Aによる推定結果の圧力データ44及び荷重データ40を加えて第2モデル51Bに入力してラバーアクチュエータ2の長さを推定した結果である。
【0140】
実施例2では、圧力特性及び荷重特性を考慮した学習モデルを用いることで、評価指標が0.108となり、比較例3の評価指標が0.163と比べて高精度に長さを推定可能である。すなわち、実施例2では、長さを推定するための物理量として圧力特性及び荷重特性を用いることなく、電気特性(電気抵抗値)のみを用いた場合であっても、圧力特性及び荷重特性を考慮した結果に近い推定結果を得ることが可能となる。従って、圧力特性及び荷重特性を推定し、その推定結果を用いて長さを推定することで、比較例3に比べて推定精度を大幅に向上することが可能となる。
【0141】
比較例4は、電気特性に代えて圧力特性である圧力値(内圧値)の計測値を実測物理量として入力し、電気特性及び荷重特性を推定してラバーアクチュエータ2の長さを推定した結果である。比較例5は、荷重特性である荷重値の計測値を実測物理量として入力し、電気特性及び圧力特性を推定してラバーアクチュエータ2の長さを推定した結果である。
【0142】
比較例4では評価指標が0.876となり、比較例5では評価指標が0.253となり、実施例2と比べて、推定精度が極端に低下する。従って、ラバーアクチュエータ2の長さを推定するにあたって用いる物理量は、電気特性である電気抵抗値を計測した計測値を用いることで、推定精度を大幅に向上することが可能であることが理解される。
【0143】
上述のように、本開示では、部材としてラバーアクチュエータを適用した場合を説明したが、部材はラバーアクチュエータに限定されないことは勿論である。また、ラバーアクチュエータに関する物理量として電気特性、圧力特性、荷重特性、及び長さを適用した場合を説明したが、本開示の技術はこれらの物理量に限定されるものではなく、他の物理量を適用してもよい。
【0144】
また、上述した各実施形態では、圧力特性を示す第2物理量は省略可能であって、ラバーアクチュエータ2に対して、未知の第1データ31(電気特性)から、ラバーアクチュエータ2の長さを推定することも可能となる。すなわち、3つの物理量を対象として、2つの物理量から他の物理量を推定する場合にも本開示の技術は適用可能である。
【0145】
なお、上述した実施形態は、次の技術事項を含む。
<技術事項1>
弾性変形可能な部材を変形させる物理量を示す第1特徴量、
前記部材を変形させる物理量であって前記第1特徴量と異なる物理量を示す第2特徴量、
変形に応じて変化する前記部材の物理量を示す第3特徴量、及び、
変形に応じて変化する前記部材の物理量であって前記第3特徴量と異なる物理量を示す第4特徴量の4つの特徴量を用い、
前記第1特徴量及び前記第2特徴量の少なくとも一方を中間特徴量とし、かつ前記第3特徴量及び前記第4特徴量の一方をターゲット物理量を示すターゲット特徴量とし、
前記4つの特徴量のうち前記ターゲット特徴量以外の少なくとも1つの特徴量を入力とし、前記中間特徴量を出力するように学習された第1モデルと、
前記第1モデルへの入力、及び前記第1モデルから出力された中間特徴量を入力とし、前記ターゲット特徴量を出力するように学習された第2のモデルと、を含む前記学習モデルに対して、
推定対象の前記ターゲット特徴量以外の少なくとも1つの特徴量を入力し、前記推定対象の前記ターゲット特徴量を推定する推定部
を含む推定装置。
【0146】
<技術事項2>
前記第1特徴量は、前記部材を変形させる物理量を示す第2物理量であり、
前記第2特徴量は、前記部材を変形させる物理量であって前記第1特徴量と異なる物理量を示す第3物理量であり、
前記第3特徴量は、前記部材の変形に応じて変化する物理量を示す第1物理量であり、
前記第4特徴量は、前記部材の変形に応じて変化する物理量であって前記第3特徴量と異なる物理量を示す第4物理量である
技術事項1に記載の推定装置。
【0147】
<技術事項3>
前記第1特徴量は、前記部材を変形させる圧力を示す物理量であり、
前記第2特徴量は、前記部材を変形させる荷重を示す物理量であり、
前記第3特徴量は、前記部材の変形に応じて変化する電気特性を示す物理量であり、
前記第4特徴量は、前記部材の変形に応じて変化する前記部材の長さを示す第4物理量である
技術事項2に記載の推定装置。
【0148】
<技術事項4>
前記中間特徴量は、前記第1特徴量及び前記第2特徴量の一方であり、
前記第1モデルへの入力は、前記第1特徴量及び前記第2特徴量の他方、及び前記第3特徴量及び前記第4特徴量の他方である技術事項1に記載の推定装置。
【0149】
<技術事項5>
前記中間特徴量は、前記第1特徴量及び前記第2特徴量の両方であり、前記第1モデルへの入力は、前記第3特徴量及び前記第4特徴量の他方である技術事項1に記載の推定装置。
【0150】
以上、本開示の技術を実施形態を用いて説明したが、本開示の技術の技術的範囲は上記実施形態に記載の範囲には限定されない。要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も開示の技術の技術的範囲に含まれる。
【0151】
また、上記実施の形態では、補助記憶装置に記憶したプログラムを実行することにより行われる処理を説明したが、少なくとも一部のプログラムの処理をハードウエアで実現してもよい。また、上述した実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
【0152】
さらに、上述した実施形態における処理をコンピュータにより実行させるために、上述した処理をコンピュータで処理可能なコードで記述したプログラムを光ディスク等の記憶媒体等に記憶して流通するようにしてもよい。
【0153】
上述した実施形態では、汎用的なプロセッサの一例としてCPUを用いて説明したが、上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU: Central Processing Unit、等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
【0154】
また、上述した実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、複数のプロセッサが連携して成すものであってもよく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。
【0155】
本明細書に記載された全ての文献、特許出願、及び技術規格は、個々の文献、特許出願、及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
【符号の説明】
【0156】
1 物理量推定装置
2 ラバーアクチュエータ
3 入力データ
5 推定部
6 出力データ
7 測定装置
21 本体
31 第1データ
32 第2データ
33 第3データ
34 第4データ
40 荷重データ
42 長さデータ
44 圧力データ
51 学習モデル
51A 第1モデル
51B 第2モデル
52 学習処理部
54A、54B 生成器
56A、56B 演算器
70 コントローラ
76 電気特性検出部
77 距離センサ
80 荷重部
100 コンピュータ本体
108 補助記憶装置
108P 制御プログラム
540A、540B 入力層
542A、542B 中間層
543C、543D リザバ層
544A、544B 出力層
545E、545F 物理リザバ層