IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ブリヂストンの特許一覧

特開2022-174668推定装置、推定方法、プログラム、及び学習モデル生成装置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022174668
(43)【公開日】2022-11-24
(54)【発明の名称】推定装置、推定方法、プログラム、及び学習モデル生成装置
(51)【国際特許分類】
   G06N 3/04 20060101AFI20221116BHJP
   G06N 20/00 20190101ALI20221116BHJP
【FI】
G06N3/04 190
G06N20/00
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021080622
(22)【出願日】2021-05-11
(71)【出願人】
【識別番号】000005278
【氏名又は名称】株式会社ブリヂストン
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】櫻井 良
(72)【発明者】
【氏名】城 健智
(72)【発明者】
【氏名】浦田 智裕
(57)【要約】
【課題】部材に不具合が生じる前に、部材の変形に関する性能を推定する。
【解決手段】推定装置(1)は、線形又は非線形に変形する部材(2)における変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、部材の変形に関する性能状態を示す物理量と、の複数を学習用データとして用いて、複数の部材特性を示す物理量を入力し、部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデル(51)に対して、推定対象部材における複数の部材特性を示す物理量(3、4)を入力し、推定対象部材の変形に関する性能状態を示す物理量(6)を推定する。
【選択図】図1
【特許請求の範囲】
【請求項1】
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を学習用データとして用いて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルに対して、推定対象部材における複数の部材特性を示す物理量を入力し、前記推定対象部材の変形に関する性能状態を示す物理量を推定する推定部
を含む推定装置。
【請求項2】
前記部材は、前記変形に応じて電気特性が変化し、
前記複数の部材特性を示す物理量は、前記部材を変形させる圧力特性を示す第1物理量と、前記部材の変形に応じて変化する電気特性を示す第2物理量とを含み、
前記部材の変形に関する性能状態を示す物理量は、前記部材を変形させた頻度を示す第3物理量を含み、
前記学習モデルは、前記第1物理量及び前記第2物理量を入力として、前記第3物理量を出力するように学習される
請求項1に記載の推定装置。
【請求項3】
前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、
前記第1物理量は、前記加圧流体の供給及び前記加圧流体の供給の解除の場合における時系列な複数の圧力値を示す圧力特性であり、
前記第2物理量は、前記第1物理量に応じて変化する前記弾性体の時系列な複数の電気抵抗値を示す電気特性であり、
前記第3物理量は、所定性能を維持しつつ変形可能な前記部材の性能状態を示す物理量として予め定められた所定頻度を、複数の段階で分割した複数の頻度群の各々に対する性能状態を示す性能指標である
請求項2に記載の推定装置。
【請求項4】
前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、
前記第1物理量は、前記加圧流体の供給及び前記加圧流体の供給の解除の場合における時系列な複数の圧力値を示す圧力特性であり、
前記第2物理量は、前記第1物理量に応じて変化する前記弾性体の時系列な複数の電気抵抗値を示す電気特性であり、
前記第3物理量は、前記部材を変形させた頻度における性能状態から、所定性能を維持しつつ変形可能な前記部材の性能状態として予め定められた所定頻度までの性能状態を示す部品寿命指標である
請求項2に記載の推定装置。
【請求項5】
前記学習モデルは、再帰型ニューラルネットワークを用いて学習させることで生成されたモデルである
請求項1から請求項4の何れか1項に記載の推定装置。
【請求項6】
前記学習モデルは、リザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである
請求項1から請求項5の何れか1項に記載の推定装置。
【請求項7】
前記学習モデルは、前記部材の作動状態を示す物理量と、前記変形に応じて変化する部材特性を示す物理量と、前記部材の性能を示す物理量とを複数蓄積したリザーバを用いた物理的リザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである
請求項1から請求項5の何れか1項に記載の推定装置。
【請求項8】
コンピュータが
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を学習用データとして用いて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルに対して、推定対象部材における複数の部材特性を示す物理量を入力し、前記推定対象部材の変形に関する性能状態を示す物理量を推定する
推定方法。
【請求項9】
コンピュータを
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を学習用データとして用いて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルに対して、推定対象部材における複数の部材特性を示す物理量を入力し、前記推定対象部材の変形に関する性能状態を示す物理量を推定する推定部
として機能させるためのプログラム。
【請求項10】
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を取得する取得部と、
前記取得部の取得結果に基づいて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルを生成する学習モデル生成部と、
を含む学習モデル生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推定装置、推定方法、プログラム、及び学習モデル生成装置に関する。
【背景技術】
【0002】
従来より、バネ部材およびゴム部材などの弾性体を含む部材は、与えられた力によって変形が可能であり、弾性体を含む部材を装置に利用した場合、その弾性体を含む部材に障害が発生すると、装置に不具合が生じる。このため、障害が発生した弾性体を含む部材を交換して装置の不具合を解消する。弾性体を含む部材における障害を特定する技術として、ゴム部材などの弾性体に生じる障害を分析する技術が知られている(例えば、非特許文献1参照)。この技術では、空気圧人工筋(PAM)の非線形モデルで使用される未知のパラメタに焦点を当て、PAMの障害を分析している。この分析では、PAMの一部に穴を開けた故障状態と正常状態とについて収縮運動の増加に対する定常状態の応答等のダイナミクスの変化を測定し、非線形モデルのパラメタの変化に関連付けて故障状態と正常状態とに分類している。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】https://ieeexplore.ieee.org/document/8511330
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、弾性体を含む部材は、使用状況及び経年等の要素により、変形に関する性能が徐々に又は急激に低下する。このため、故障状態を分類できたとしても、弾性体を含む部材における故障などの障害が、変形に関する性能にどのように影響するのかを特定することは困難である。例えば、弾性体を含む部材を用いた装置の制御を行う場合、弾性体を含む部材の変形に関する性能を前提にして装置が形成される。弾性体を含む部材は、使用状況及び経年等の要素により、変形に関する性能が徐々に又は急激に低下する。このため、弾性体を含む部材の変形に関する性能を特定することが要求される。ところが、弾性体を含む部材に障害が発生してから部材の交換などで対応したのでは、稼働中に装置の停止を招くこととなり、改善の余地がある。
【0005】
本開示は、部材に不具合が生じる前に、部材の変形に関する性能を推定することができる推定装置、推定方法、プログラム、及び学習モデル生成装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、第1態様は、
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を学習用データとして用いて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルに対して、推定対象部材における複数の部材特性を示す物理量を入力し、前記推定対象部材の変形に関する性能状態を示す物理量を推定する推定部
を含む推定装置である。
【0007】
第2態様は、第1態様の推定装置において、
前記部材は、前記変形に応じて電気特性が変化し、
前記複数の部材特性を示す物理量は、前記部材を変形させる圧力特性を示す第1物理量と、前記部材の変形に応じて変化する電気特性を示す第2物理量とを含み、
前記部材の変形に関する性能状態を示す物理量は、前記部材を変形させた頻度を示す第3物理量を含み、
前記学習モデルは、前記第1物理量及び前記第2物理量を入力として、前記第3物理量を出力するように学習される。
【0008】
第3態様は、第2態様の推定装置において、
前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、
前記第1物理量は、前記加圧流体の供給及び前記加圧流体の供給の解除の場合における時系列な複数の圧力値を示す圧力特性であり、
前記第2物理量は、前記第1物理量に応じて変化する前記弾性体の時系列な複数の電気抵抗値を示す電気特性であり、
前記第3物理量は、所定性能を維持しつつ変形可能な前記部材の性能状態を示す物理量として予め定められた所定頻度を、複数の段階で分割した複数の頻度群の各々に対する性能状態を示す性能指標である。
【0009】
第4態様は、第2態様の推定装置において、
前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、
前記第1物理量は、前記加圧流体の供給及び前記加圧流体の供給の解除の場合における時系列な複数の圧力値を示す圧力特性であり、
前記第2物理量は、前記第1物理量に応じて変化する前記弾性体の時系列な複数の電気抵抗値を示す電気特性であり、
前記第3物理量は、前記部材を変形させた頻度における性能状態から、所定性能を維持しつつ変形可能な前記部材の性能状態として予め定められた所定頻度までの性能状態を示す部品寿命指標である。
【0010】
第5態様は、第1態様から第4態様の何れか1態様の推定装置において、
前記学習モデルは、再帰型ニューラルネットワークを用いて学習させることで生成されたモデルである。
【0011】
第6態様は、第1態様から第5態様の何れか1態様の推定装置において、
前記学習モデルは、リザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである。
【0012】
第7態様は、第1態様から第5態様の何れか1態様の推定装置において、
前記学習モデルは、前記部材の作動状態を示す物理量と、前記変形に応じて変化する部材特性を示す物理量と、前記部材の性能を示す物理量とを複数蓄積したリザーバを用いた物理的リザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである。
【0013】
第8態様は、
コンピュータが
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を学習用データとして用いて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルに対して、推定対象部材における複数の部材特性を示す物理量を入力し、前記推定対象部材の変形に関する性能状態を示す物理量を推定する
推定方法である。
【0014】
第9態様は、
コンピュータを
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を学習用データとして用いて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルに対して、推定対象部材における複数の部材特性を示す物理量を入力し、前記推定対象部材の変形に関する性能状態を示す物理量を推定する推定部
として機能させるためのプログラムである。
【0015】
第10態様は、
線形又は非線形に変形する部材における前記変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量と、前記部材の変形に関する性能状態を示す物理量と、の複数を取得する取得部と、
前記取得部の取得結果に基づいて、前記複数の部材特性を示す物理量を入力し、前記部材の変形に関する性能状態を示す物理量を出力するように学習された学習モデルを生成する学習モデル生成部と、
を含む学習モデル生成装置である。
【発明の効果】
【0016】
本開示によれば、部材に故障及び不具合が生じる前に、部材の変形に関する性能を推定することができる、という効果を有する。
【図面の簡単な説明】
【0017】
図1】第1実施形態に係る弾性体の性能推定装置の機能構成の一例を示すブロック図である。
図2】第1実施形態に係る部材の説明図である。
図3】第1実施形態に係る部材の構造の一例を示す図である。
図4】第1実施形態に係る学習モデルを学習する学習処理の説明図である。
図5】第1実施形態に係る測定装置の一例を示すブロック図である。
図6】第1実施形態に係る部材特性の一例を示す図である。
図7】第1実施形態に係る理想的な環境下における電気特性を示す図である。
図8】第1実施形態に係る学習データ収集処理の一例を示すフローチャートである。
図9A】第1実施形態に係る測定装置で収集された電気特性の一例を示す図である。
図9B】第1実施形態に係る測定装置で収集された圧力特性の一例を示す図である。
図10】第1実施形態に係る性能指標の作動サイクルにおける電気特性の一例を示す図である。
図11】第1実施形態に係る学習処理部における学習処理の説明図である。
図12】第1実施形態に係る学習処理の流れの一例を示すフローチャートである。
図13】第1実施形態に係る弾性体の性能推定装置の各種機能を実現する装置の一例を示すブロック図である。
図14】第1実施形態に係る推定処理の流れの一例を示すフローチャートである。
図15】ラバーアクチュエータの性能状態を検証した検証結果を示す図である。
図16】変形例の弾性体の性能推定装置の機能構成を示すブロック図である。
図17】第2実施形態に係る学習処理部における学習処理の説明図である。
図18】第2実施形態に係る学習処理の流れの一例を示すフローチャートである。
図19】第3実施形態に係る学習処理部における学習処理の説明図である。
図20】第3実施形態に係る学習処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0018】
以下、図面を参照して本開示の技術を実現する実施形態を詳細に説明する。
なお、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符合を付与し、重複する説明を適宜省略する場合がある。また、本開示は、以下の実施形態に何ら限定されるものではなく、本開示の目的の範囲内において、適宜変更を加えて実施することができる。また、本開示では、主として非線形に変形する部材に対する物理量の推定を説明するが、線形に変形する部材に対する物理量の推定に適用可能であることは言うまでもでもない。
【0019】
本開示において「部材」とは、非線形に変形し、かつ変形に応じて電気特性が変化する材料を含む概念である。「弾性体」とは、部材の一例であり、ゴム、発泡材および樹脂材などの柔らかい材料を含む概念である。また、「弾性収縮体」とは、弾性体の一例であり、付与された物理量により所定方向に収縮力を発生する部材を含む概念である。収縮力を発生する所定方向は、2次元で表現される伸縮を示す直線方向であってもよく、3次元で表現される撓みを示す曲線方向であってもよい。また、弾性収縮体は、内部が中空に形成され、その中空の内部に加圧流体が供給されて所定方向に収縮力を発生する部材を含む。
【0020】
ゴム部材などの柔らかい弾性体は、与えられた力に対して非線形な挙動を示す。例えば、形状変化の観点で2次元的な形状変化をみると、与えられた力(すなわち、物理量又はエネルギ)に応じて或る方向(例えば、直線方向)に伸縮する距離が非線形に変化する(図2参照)。例えば、与えられた圧力の大きさに応じて長さが変化する弾性体では、圧力の増減方向により長さの変化特性が相違する(例えば、圧力P1及びP2で同一の長さL1になる。)。
【0021】
また、ゴム部材などの柔らかい弾性体を含む部材は、膨張収縮(2次元的な形状変化では伸縮)等の変形を繰り返すことにより、製造当初の性能(例えば、膨張収縮力を示す性能)から性能が低下する場合がある。そこで、本開示の推定装置は、予め学習された学習モデルを用いて、非線形に変形する部材について、部材に故障及び不具合が生じる前に、部材の変形に関する性能状態を示す物理量を推定する。
【0022】
具体的には、本開示の推定装置は、学習モデルを含む。学習モデルは、複数の部材特性を示す物理量、及び部材の性能状態を示す物理量が対応付けられた複数の学習用データを用いて学習される。複数の部材特性を示す物理量は、変形に応じて時系列に変化する種類が異なる複数の部材特性を示す物理量を示す。この学習では、複数の部材特性を示す物理量を入力とし、部材の性能状態を示す物理量を出力するように学習される。この学習された学習モデルを用いて、推定対象部材の複数の部材特性を示す物理量を入力し、その出力を前記推定対象部材の性能状態を示す物理量として推定する。
【0023】
(第1実施形態)
図1に、本開示の推定装置としての弾性体の性能推定装置1の構成の一例を示す。
【0024】
なお、本実施形態では、弾性体における物理量を把握するために、一例として、非線形に変形する弾性体のうちゴム部材などの柔らかい弾性体を含み、付与された物理量により所定方向に収縮力を発生する弾性収縮体に本開示の技術を適用した場合を説明する。すなわち、本実施形態では、弾性収縮体の性能状態を推定する推定処理に本開示の技術を適用した場合を説明する。
【0025】
以下では、弾性収縮体の一例として、公知技術のエアバッグタイプのものを適用する場合について説明する(例えば、特公昭52-40378号参照)。
エアバッグタイプの弾性収縮体の一例(以下、ラバーアクチュエータ2という。)は、ゴム部材等の柔らかい弾性体で構成される管状体の外周を、有機又は無機高張力繊維、例えば芳香族ポリアミド繊維の編組み補強構造により被覆した本体21を有し、両端開口22を閉塞部材23によって封止したものである。ラバーアクチュエータ2は、その閉塞部材23に設けられた接続口24を介して内部空洞に加圧流体が供給されることによって膨径変形し、軸線方向に沿って収縮力が発生するようになっている。このラバーアクチュエータは、膨径変形によって、ラバーアクチュエータ2の長さが変化する。ただし、ラバーアクチュエータ2を適用対象とするのはあくまで一例に過ぎず、本開示の推定装置はラバーアクチュエータ2以外の弾性収縮体又は弾性体を含む部材にも適用可能である。また、本開示の推定装置は、圧力付与及び解除によって線形又は非線形に変形する部材であっても適用が可能である。
【0026】
ところで、ラバーアクチュエータ2は、図3に示すように、内部空洞211を有するゴム部材等で構成される管状体212の外周を、補強構造214により被覆した本体21を有する。内部空洞211に加圧流体が供給されて膨径変形し、軸線方向に沿って収縮力が発生する。また、加圧流体の供給が解除(又は加圧流体が排出)されると形状復帰する。加圧流体の供給及び供給の解除による作動サイクル、すなわち本体21の膨張収縮によって収縮力が変化する。この収縮力に応じてラバーアクチュエータ2の長さが非線形に変化する(図2)。このラバーアクチュエータ2は、本体21で膨張収縮による変形を繰り返したり経年等の使用状況によって、本体21に不具合が生じる場合がある。例えば、管状体212の一部に亀裂等の不具合箇所216が発生する場合がある。不具合箇所216の発生により、ラバーアクチュエータ2の性能は、製造当初の性能状態(例えば、収縮力)から低下する。すなわち、ラバーアクチュエータ2の性能状態は変化する。
【0027】
このようなラバーアクチュエータ2の性能状態の変化に起因するラバーアクチュエータ2の内部に生じた不具合箇所を構造の計測によって特定することは困難である。なお、コンピュータ断層撮影(CTスキャン)が可能な大規模装置を用いてラバーアクチュエータ2の内部を検査して不具合箇所を特定することは可能であるものの、現実的ではない。そこで、本実施形態では、ラバーアクチュエータ2の性能状態について予め学習された学習モデルを用いて、ラバーアクチュエータ2の変形に関する性能状態を推定する。より具体的には、管状体212に生じた不具合に起因した故障が生じる状況及び不具合により使用が困難になる状況より以前に、大規模装置を用いることなく、ラバーアクチュエータ2の性能状態を推定する。
【0028】
本実施形態では、種類が異なる複数の部材特性を示す物理量に、圧力特性を示す物理量及び電気特性を示す物理量を適用した一例を説明する。以降の説明では、部材特性を示す物理量を、部材特性という。また、圧力特性を示す物理量を、圧力特性といい、電気特性を示す物理量を、電気特性という。圧力特性には、ラバーアクチュエータ2を変形させる第1物理量として、時系列な複数の圧力値を示す圧力特性を適用する。具体的には、時系列に変化する圧力値、すなわち、圧力付与及び解除(作動サイクル)により変形させるためのラバーアクチュエータ2へ付与する時系列な複数の圧力値を示す圧力特性が適用される。また、電気特性には、ラバーアクチュエータの変形に応じて変化する第2物理量として、電気抵抗値の電気特性を適用する。具体的には、時系列に変化する電気抵抗値、すなわち、作動サイクルにより時系列に変化する複数の電気抵抗値の電気特性が適用される。
【0029】
部材の変形に関する性能状態を示す物理量には、ラバーアクチュエータ2を変形させた頻度を示す第3物理量として、ラバーアクチュエータ2の性能指標を適用する。具体的には、ラバーアクチュエータ2が所定方向に収縮及び収縮の解除による復帰が可能な性能状態である所定性能を維持しつつ変形可能な予め定められた所定頻度(例えば、作動不良状態や不具合が生じた状態の頻度)を、複数の段階で分割した複数の頻度群の各々に対する性能状態を示す性能指標を適用する。なお、詳細は後述するが、本実施形態では、性能指標は、初期状態、中期状態、及び後期状態の何れかの状態を示す。この性能指標は、部材の性能を維持可能な期間等の寿命として捉えることが可能である。この場合、ラバーアクチュエータ2の寿命、すなわち、或る頻度における性能状態から、所定性能を維持しつつ変形可能なラバーアクチュエータ2の性能状態として予め定められた所定頻度までの性能状態を示す部品寿命指標を適用可能である。
【0030】
弾性体の性能推定装置1における推定処理は、ラバーアクチュエータ2について、性能データをラベルとする圧力データ及びラバーアクチュエータ2の電気抵抗データを学習データとして機械学習を行った学習済みの学習モデルを用いる。性能データは、上述したラバーアクチュエータ2の性能状態を示す物理量(性能指標)である(図7参照)。圧力データは、上述した作動サイクルによる時系列な圧力値を示す圧力特性である(図6参照)。電気抵抗データは、作動サイクルによる時系列な複数の電気抵抗値を示す電気特性である(図6参照)。この学習済みの学習モデルを用いて、未知のラバーアクチュエータ2の圧力データ及び電気抵抗データに対応するラバーアクチュエータ2の性能データを推定する。すなわち、弾性体の性能推定装置1は、ラバーアクチュエータ2の作動サイクルにより非線形に変化するラバーアクチュエータ2の性能状態を推定する。これにより、内部が不可視でかつ非線形に変形するラバーアクチュエータ2であっても、大規模装置を用いることなく、性能状態を推定することが可能となる。
【0031】
図1に示すように、弾性体の性能推定装置1は、推定部5を備えている。推定部5には、ラバーアクチュエータ2への圧力の大きさ(作動サイクルによる圧力特性)を示す第1入力データ3が圧力データとして入力される。また、ラバーアクチュエータ2における電気特性の大きさ(作動サイクルによる電気特性)を示す第2入力データ4が電気抵抗データとして入力される。また、推定部5は、推定結果のラバーアクチュエータ2の性能状態(性能指標)を示す出力データ6を性能データとして出力する。推定部5は、学習済みの学習モデル51を含んでいる。
【0032】
学習モデル51は、変形に伴う時系列なラバーアクチュエータ2の圧力特性(第1入力データ3)及びラバーアクチュエータ2の電気特性(第2入力データ4)から、ラバーアクチュエータ2の性能状態(出力データ6)を導出する学習を済ませたモデルである。学習モデル51は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード(ニューロン)同士の間の結合の重み(強度)の情報の集合として表現される。
【0033】
学習モデル51は、学習処理部52(図4)の学習処理により生成される。学習処理部52は、ラバーアクチュエータ2における時系列な物理量として測定済みの物理量を用いて学習処理を行う。すなわち、ラバーアクチュエータ2における部材特性を時系列に測定した大量のデータを学習データとする。学習データは、圧力特性(第1入力データ3)及び電気特性(第2入力データ4)を含んだ入力データと、その入力データに対応する性能状態(出力データ6)と、のセットを大量に含む。なお、時系列な物理用は、例えば圧力値及び電気抵抗値に、測定時刻を示す情報を付与することで時系列情報が対応付けてもよい。また、上述したセットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。
【0034】
次に、学習処理部52が行う学習処理について説明する。
【0035】
まず、学習処理に用いる学習データについて説明する。
図5に、ラバーアクチュエータ2における物理量を測定する測定装置7の一例を示す。
【0036】
測定装置7は、基台71に固定された取付板72にラバーアクチュエータ2の一方の閉塞部材23は取り付けられ、他方の閉塞部材23は移動可能な可動板73に取り付けられる。ラバーアクチュエータ2の接続口24には、圧力(ラバーアクチュエータ2を変形させる第1物理量)を検出する圧力センサを含み、ラバーアクチュエータ2に加圧流体を供給する供給部75が連通される。ラバーアクチュエータ2の両端の閉塞部材23には、ラバーアクチュエータ2の電気抵抗値(電気特性を示す第2物理量)を検出するセンサを含んだ電気特性検出部76が取り付けられる。また、基台71には、可動板73との距離を検出するレーザセンサ等の距離センサ77が取り付けられた固定板74が固定される。距離センサ77は、長さ同定部78に接続される。長さ同定部78は、距離センサ77で検出された距離から、ラバーアクチュエータ2の長さを同定する。例えば、長さ同定部78は、加圧流体が供給されない初期状態(図5に初期状態200として示す。)のラバーアクチュエータ2の長さL、および距離センサ77で検出された距離(La)を初期値として記憶しておく。そして、長さ同定部78は、加圧流体が供給された状態(図5に供給状態210として示す。)の距離の差分を、初期状態の長さから減算することで、ラバーアクチュエータ2の長さ(L=Lb-La)を同定可能である。なお、測定装置7は、ロードセルおよび空気圧シリンダから構成された空気圧検出部79を取り付け可能になっている。
【0037】
なお、上述した測定装置7は、ラバーアクチュエータ2の長さを同定するための構成を含む場合を説明したが、本実施形態においてラバーアクチュエータ2の長さの同定は必須ではないため、長さを同定するための構成は省略可能である。
【0038】
また、供給部75には、カウンタ80が接続される。カウンタ80は、供給部75によりラバーアクチュエータ2への加圧流体の供給及び供給の解除による作動サイクルのサイクル数を計数する。この作動サイクルのサイクル数を計数するための構成は、供給部75にカウンタ80を接続することに限定されない。例えば、供給部75への指示回数を計数してもよいし、他の方法で作動サイクルのサイクル数を計数してもよい。
【0039】
測定装置7は、供給部75、電気特性検出部76、及びカウンタ80に接続されたコントローラ70を備えている。コントローラ70は、供給部75の制御を行い、ラバーアクチュエータ2の作動サイクル時におけるラバーアクチュエータ2の時系列な圧力値及び電気抵抗値と、作動サイクルのサイクル数(累積サイクル数)とを取得し、対応付けて記憶する。すなわち、測定装置7は、加圧流体の供給制御において、非線形に変形するラバーアクチュエータ2の、圧力特性、電気特性、およびサイクル数のデータセットを時系列に複数取得可能となる。
【0040】
具体的には、測定装置7は、作動サイクル単位で、圧力特性、及び電気特性の各々について、当該作動サイクル内における微小時間(例えば0.01秒)毎の、圧力値及び電気抵抗値を時系列に取得可能である。
【0041】
図6に、ラバーアクチュエータ2に対する圧力特性及び電気特性(部材特性)の一例を示す。図6では、計測開始の時間t0から、ラバーアクチュエータ2に対する加圧流体の供給開始の時間t1、供給の解除の時間t2、として次の作動サイクルの計測開始の時間t3を含む部材特性が示されている。また、時間t0から時間t3の時間を1周期Taによる作動サイクルとして示している。
【0042】
図6に示すように、ラバーアクチュエータ2に対する圧力特性は、加圧流体の供給開始から急激に圧力値が上昇し、供給の解除により急激に下降する。電気特性は、加圧流体の供給開始、及び供給の解除のときに急激に変動する。この作動サイクルにおける圧力特性、及び電気特性の各々について微小時間(例えば0.01秒)毎に圧力値及び電気抵抗値を時系列に計測する。時系列に計測した圧力特性及び電気特性(部材特性)は、測定時のサイクル数(頻度)における作動サイクルの圧力特性及び電気特性のプロファイルであり、各波形の形状を示すパターンとして捉えることも可能である。
【0043】
ラバーアクチュエータ2は、作動サイクルのサイクル数(累積サイクル数)が増加するに従って管状体212に発生する亀裂等の不具合箇所216(図3)の数や大きさが増大傾向になることが考えられる。不具合箇所216(図3)の数や大きさが増大するに従って、ラバーアクチュエータ2の性能が、製造当初の性能(例えば、収縮力を示す性能)から低下する。このような不具合箇所216の数や大きさが増加する状況では、ラバーアクチュエータ2の電気特性、例えば、作動サイクル内における電気抵抗値の最大値が増大する傾向になる。
【0044】
図7に、理想的な環境下でラバーアクチュエータ2の耐久試験を実行した場合における想定される電気特性を示す。
【0045】
図7に示すように、ラバーアクチュエータ2の電気特性、例えば、作動サイクル内における電気抵抗値の最大値は、累積サイクル数が増加するに従って大きくなる傾向にある。そして、終期のサイクル数Cteでラバーアクチュエータ2は性能を発揮できない、例えば故障状態となる。未使用状態のサイクル数「0」(Ct0)から終期のサイクル数Cteまでのサイクル数の範囲をラバーアクチュエータ2の作動可能範囲CtXとすると、ラバーアクチュエータ2が有する性能を維持しつつ変形可能なサイクル数の性能維持範囲CtYは一致又は狭くなる(CtX≧CtY)。本実施形態では、性能維持範囲CtYを、複数の段階(例えば3段階)で分割した複数の作動サイクル群の各々に、性能状態を示す性能指標を対応させる。具体的には、性能維持範囲CtYを3段階に分類し、分類された各々のサイクル数の群に、初期状態、中期状態、及び後期状態を示す性能指標を対応付ける。初期状態を示す性能指標はサイクル数Ct0からサイクル数Ct1の範囲のサイクル数に対して定められ、中期状態を示す性能指標はサイクル数Ct1からサイクル数Ct2の範囲のサイクル数に対して定められ、後期状態を示す性能指標はサイクル数Ct2からサイクル数Ct3(≦Cte)の範囲のサイクル数に対して定められる。これにより、サイクル数を特定すればラバーアクチュエータ2の性能状態を確認可能となる。
【0046】
なお、初期状態、中期状態、及び後期状態により示されるラバーアクチュエータ2の性能指標は、ラバーアクチュエータ2の寿命を示す指標として捉えることが可能である。すなわち、初期状態、中期状態、及び後期状態の順に、ラバーアクチュエータ2の性能維持範囲が小さくなる。換言すれば、初期状態、中期状態、及び後期状態の順に累積サイクル数が増加する。よって、ラバーアクチュエータ2に不具合が生じる終期のサイクル数Cteまでのサイクル数の量が減少する。従って、作動可能範囲CtX(又は性能維持範囲CtY)のサイクル数の総量を、ラバーアクチュエータの寿命とすると、初期状態、中期状態、及び後期状態の順に、寿命が短くなることに相当する。
【0047】
しかし、ラバーアクチュエータ2は、使用状況や個体差により性能低下の度合いが変化する。従って、電気抵抗値の最大値やサイクル数を特定したとしても、ラバーアクチュエータ2の性能状態として一律に、初期状態、中期状態、及び後期状態の何れかの性能状態を示す性能指標を対応付けることは困難である。そこで、本実施形態では、個々のラバーアクチュエータ2に対する性能指標を推定可能に学習モデル51を生成する。
【0048】
図5に示すコントローラ70は、図示しないCPUを含むコンピュータを含んで構成可能であり、学習データ収集処理を実行するようになっている。
【0049】
図8に、コントローラ70で実行される学習データ収集処理の一例を示す。
【0050】
図8に示すように、コントローラ70は、ステップS100で、供給部75に対して加圧流体の供給及び解除の作動サイクルの指示を行う。次のステップS102では、コントローラ70は、作動サイクル中におけるラバーアクチュエータ2の時系列な圧力値(圧力特性)及び時系列な電気抵抗値(電気特性)とサイクル数との物理量セットを取得する。次のステップS104では、物理量セット(現在の作動サイクルにおける物理量セット)を一時的に記憶する。コントローラ70は、ステップS106で、予め定められた判定条件に適合するか否かを判断し、否定判断の場合はステップS100へ処理を戻し、肯定判断の場合はステップS108へ処理を移行する。判定条件は、ラバーアクチュエータ2に故障などの不具合が生じたことが検知された場合、及び耐久試験として予め定められた所定数のサイクル数に到達した場合などの何れかの終了条件が適用される。
【0051】
コントローラ70は、ステップS106で肯定判断すると、ステップS108で、一時的に記憶した物理量セットに性能指標を対応付けて本処理ルーチンを終了する。具体的には、ラバーアクチュエータ2の作動可能範囲CtX、又は性能維持範囲CtYにおける作動サイクル毎の時系列な圧力値(圧力特性)及び電気抵抗値(電気特性)とサイクル数とのセット毎に、性能指標が対応付けられる。
【0052】
図9Aに、時間経過に応じて測定装置7のコントローラ70で収集されたラバーアクチュエータ2の電気特性の一例を示し、図9Bに、ラバーアクチュエータ2の圧力特性の一例を示す。図9A及び図9Bは、未使用のラバーアクチュエータ2について故障が検知されるまで作動サイクルを繰り返す耐久試験を行ったときの時間経過に応じた初期状態、中期状態及び後期状態の各状態における測定結果を示す。なお、図9A及び図9Bでは、作動サイクル単位での最大値が一致するように、電気抵抗値(電気特性)及び圧力値(圧力特性)を標準化(すなわち規格化)している。図に示す例では、ラバーアクチュエータ2の圧力特性は初期状態から後期状態まで略一致するパターンとなる(図9B)。一方、電気特性は時間経過に伴って徐々に電気特性(電気抵抗値)が相対的に相違するパターンとなる。特に、作動サイクルの後半(加圧流体の供給が解除された状態)における電気特性(電気抵抗値)に差異が現れている(図9A)。
【0053】
コントローラ70は、ラバーアクチュエータ2の測定の開始のサイクル数Ct0から終期のサイクル数Cteまでの作動可能範囲CtX(又はCtY)を、3つに按分し(図7)、初期状態、中期状態、及び後期状態の3段階の各々の性能指標を対応付ける。この按分は、サイクル数が均等になるように按分してもよく、安定した電気抵抗値を示す等の特徴的な電気抵抗値を境界として按分してもよい。初期状態、中期状態、及び後期状態の各性能指標に対応付けられた範囲内の作動サイクルでは、電気特性に特徴部分を有する。
【0054】
図10に、初期状態、中期状態、及び後期状態の各性能指標に対応付けられた範囲内の作動サイクルにおける電気特性の一例を示す。図10では、図9Aに示す初期状態の性能指標が対応付けられた作動サイクルのうちサイクル数Ct01における電気特性が示されている。同様に、中期状態の性能指標が対応付けられたサイクル数Ct11における電気特性、及び後期状態の性能指標が対応付けられたサイクル数Ct21における電気特性も示されている。なお、図10に示す電気特性は、作動サイクル単位で電気抵抗値の最大値が一致するように標準化(すなわち規格化)している。図10には標準化前の電気抵抗値Rxを各電気特性の図に一例として示す。
【0055】
図10に示すように、電気特性は、性能状態が初期状態から後期状態に移行するに従って、電気抵抗値の最大値が大きくなるものの、加圧流体の供給を解除したときの電気特性のプロファイルであるパターンが安定状態に向かうという1つの特徴部分を有する。安定状態とは電気抵抗値の変動が抑制される特性を示す。別の側面では、状態が移行するに従って電気抵抗値の最小値が小さくなるものの、標準化された電気特性のプロファイルであるパターンによる波形の形状が、加圧流体の解除側で、平坦な形状に徐々に移行する(図10には矢印の長さで示した)。他の側面では、初期状態から後期状態に移行するに従って電気抵抗値の最大値及び最小値の変動幅が大きくなる。また、他の特徴部分は、加圧流体の解除側における電気特性の低下率の度合い、例えば電気抵抗値の変化率が、初期状態から後期状態に移行するに従って小さくなる等の特徴部分を含む特性を示す。これらの特性がラバーアクチュエータ2の性能状態に影響すると考えられ、学習処理において有効に機能する。
【0056】
従って、コントローラ70は、ラバーアクチュエータ2への加圧流体の供給制御を行うことによって、ラバーアクチュエータ2の圧力特性、電気特性およびサイクル数毎に時系列に取得し、性能指標を対応付けて記憶することが可能となる。このコントローラ70に時系列に記憶されたラバーアクチュエータ2の圧力特性、電気特性およびサイクル数と性能指標とを含む性能状態を示す物理量のセットが学習データとなる。
【0057】
なお、上述した図8に示す処理ルーチンは、複数のラバーアクチュエータ2に対して実行して、より多くの学習データを収集することが好ましい。
【0058】
次に、図11参照して、学習処理部52について説明する。
学習処理部52は、生成器54と演算器56とを含む。生成器54は、時系列な入力の前後関係を考慮して出力を生成する機能を有する。
【0059】
また、学習処理部52は、学習用データとして、測定装置7で測定した作動サイクル毎の第1入力データ3(圧力特性)及び第2入力データ4(電気特性)と、出力データ6(性能状態)とのセットを多数保持している。
【0060】
図11に示す例では、生成器54は、入力層540、中間層542、および出力層544を含んで、公知の再帰型ニューラルネットワーク、例えば、リカレントニューラルネットワーク(RNN:Recurrent Neural Network)を構成している。再帰型ニューラルネットワーク(例えば、RNN)自体は公知の技術であるため詳細な説明は省略するが、中間層542は、ノード間結合およびフィードバック結合を有するノード群(ニューロン群)を多数含む。その中間層542には、入力層540からのデータが入力され、中間層542の演算結果のデータは、出力層544へ出力される。
【0061】
具体的には、生成器54は、入力された第1入力データ3(圧力特性)及び第2入力データ4(電気特性)から性能状態を示す生成出力データ6Aを生成するニューラルネットワークである。ここでは、性能状態を示す物理量として上述した性能指標を適用する。この性能状態はサイクル数でもよい。生成出力データ6Aは、第1入力データ3(圧力特性)及び第2入力データ4(電気特性)からラバーアクチュエータ2の性能状態(性能指標)を推定したデータである。生成器54は、時系列に入力された第1入力データ3(圧力)及び第2入力データ4(電気特性)から、非線形な変形によるラバーアクチュエータ2の性能状態(性能指標)について測定により得られた性能状態(性能指標)に近い性能状態(性能指標)を示す生成出力データを生成する。生成器54は、多数の第1入力データ3(圧力特性)及び第2入力データ4(電気特性)を用いて学習することで、よりラバーアクチュエータの性能状態(性能指標)の測定結果に近い生成出力データ6Aを生成できるようになる。
【0062】
演算器56は、生成出力データ6Aと、学習データの出力データ6とを比較し、その比較結果の誤差を演算する演算器である。学習処理部52は、生成出力データ6A、および学習データの出力データ6を演算器56に入力する。これに応じて、演算器56は、生成出力データ6Aと、学習データの出力データ6との誤差を演算し、その演算結果を示す信号を出力する。
【0063】
学習処理部52は、演算器56で演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングする、生成器54の学習を行う。具体的には、生成器54における入力層540と中間層542とのノード間の結合の重みパラメータ、中間層542内のノード間の結合の重みパラメータ、および中間層542と出力層544とのノード間の結合の重みパラメータの各々を例えば勾配降下法や誤差逆伝搬法等の手法を用いて、生成器54にフィードバックする。すなわち、学習データの出力データ6を目標として、生成出力データ6Aと学習データの出力データ6との誤差を最小化するように全てのノード間の結合を最適化する。
【0064】
学習モデル51は、学習処理部52の学習処理により生成される。学習モデル51は、学習処理部52による学習結果のノード間の結合の重みパラメータ(重み又は強度)の情報の集合として表現される。
【0065】
学習処理部52は、図示しないCPUを含むコンピュータを含んで構成し、学習処理を実行することが可能である。例えば、図12に学習処理の一例を示すように、学習処理部52は、ステップS110で、ラバーアクチュエータ2について時系列に測定した結果の学習データである、作動サイクル毎の第1入力データ3(圧力特性)、第2入力データ4(電気特性)、および出力データ6(性能指標)を取得する。学習処理部52は、ステップS112で、時系列に測定した結果の学習データを用いて学習モデル51を生成する。すなわち、上記のようにして多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ(重み又は強度)の情報の集合を得る。そして、ステップS114で、学習結果のノード間の結合の重みパラメータ(重み又は強度)の情報の集合として表現されるデータを学習モデル51として記憶する。
【0066】
なお、生成器54は、時系列入力の前後関係を考慮して出力を生成する機能を有するものであり、上記では、再帰型ニューラルネットワークを用いた一例を説明したが、本開示の技術は、再帰型ニューラルネットワークを用いることに限定するものではない。すなわち、本開示の技術は、時系列入力の前後関係を考慮して出力を生成する機能を有するものであればよく、他の手法を用いてもよい。
【0067】
そして、上記弾性体の性能推定装置1では、以上に例示した手法により生成した学習済みの生成器54(すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ)を学習モデル51として用いる。十分に学習した学習モデル51を用いれば、非線形に変形するラバーアクチュエータについて、作動サイクル単位の時系列な圧力値による圧力特性および電気抵抗値による電気特性から性能状態(性能指標)を推定することも不可能ではない。すなわち、弾性体の性能推定装置1は、推定対象のラバーアクチュエータ2における作動サイクルの圧力特性および電気特性から性能状態として、初期状態、中期状態、及び後期状態の何れかの性能指標を出力として推定可能である。
【0068】
なお、学習処理部52による処理は、本開示の学習モデル生成装置の処理の一例である。また、弾性体の性能推定装置1は、本開示の推定部および推定装置の一例である。
【0069】
上述の弾性体の性能推定装置1は、例えば、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。
【0070】
図13に、弾性体の性能推定装置1の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで構成した場合の一例を示す。
【0071】
図13に示す弾性体の性能推定装置1として機能するコンピュータは、コンピュータ本体100を備えている。コンピュータ本体100は、CPU102、揮発性メモリ等のRAM104、ROM106、ハードディスク装置(HDD)等の補助記憶装置108、及び入出力インターフェース(I/O)110を備えている。これらのCPU102、RAM104、ROM106、補助記憶装置108、及び入出力I/O110は、相互にデータ及びコマンドを授受可能にバス112を介して接続された構成である。また、入出力I/O110には、通信インタフェース(I/F)114、及びディスプレイやキーボード等の操作表示部116が接続されている。通信I/F114は、外部装置との間で、第1入力データ3、第2入力データ4、および出力データ6を入出力する入出力部として機能する。
【0072】
補助記憶装置108には、コンピュータ本体100を本開示の推定装置の一例として弾性体の性能推定装置1として機能させるための制御プログラム108Pが記憶される。CPU102は、制御プログラム108Pを補助記憶装置108から読み出してRAM104に展開して処理を実行する。これにより、制御プログラム108Pを実行したコンピュータ本体100は、本開示の推定装置の一例として弾性体の性能推定装置1として動作する。
【0073】
なお、補助記憶装置108には、学習モデル51を含む学習モデル108M、及び各種データを含むデータ108Dが記憶される。制御プログラム108Pは、CD-ROM等の記録媒体により提供するようにしても良い。
【0074】
次に、コンピュータにより実現された弾性体の性能推定装置における推定処理について説明する。
【0075】
図14に、コンピュータ本体100において、実行される制御プログラム108Pによる推定処理の流れの一例を示す。
【0076】
図14に示す推定処理は、コンピュータ本体100に電源投入されると、CPU102により実行される。すなわち、CPU102は、制御プログラム108Pを補助記憶装置108から読み出し、RAM104に展開して処理を実行する。
【0077】
まず、CPU102は、ステップS200で、補助記憶装置108の学習モデル108Mから学習モデル51を読み出し、RAM104に展開することで、学習モデル51を取得する。具体的には、学習モデル51として表現された重みパラメータによるノード間の結合となるネットワークモデルを、RAM104に展開する。よって、重みパラメータによるノード間の結合が実現された学習モデル51が構築される。
【0078】
次に、CPU102は、ステップS202で、ラバーアクチュエータ2の性能状態を推定する対象となる未知の第1入力データ3(圧力特性)及び未知の第2入力データ4(電気特性)を、通信I/F114を介して取得する。すなわち、性能状態が未知のラバーアクチュエータ2における作動サイクルによる圧力特性と電気特性とを取得する。
【0079】
次に、CPU102は、ステップS204で、取得済の学習モデル51を用いて、取得済の第1入力データ3(圧力特性)及び第2入力データ4(電気特性)に対応する出力データ6(ラバーアクチュエータ2の性能状態を示す性能指標)を推定する。
【0080】
そして、次のステップS206で、推定結果の出力データ6(性能指標)を、通信I/F114を介して出力して、本処理ルーチンを終了する。
【0081】
なお、図14に示す推定処理は、本開示の推定方法で実行される処理の一例である。
【0082】
以上説明したように、本実施形態によれば、性能状態が未知のラバーアクチュエータ2に対して、当該ラバーアクチュエータ2における作動サイクルによる第1入力データ3(圧力特性)及び第2入力データ4(電気特性)から、ラバーアクチュエータ2の性能状態を推定することが可能となる。すなわち、性能状態が未知のラバーアクチュエータ2における作動サイクルによる圧力特性及び電気特性を入力することで、ラバーアクチュエータ2の性能状態として初期状態、中期状態、及び後期状態の何れかの性能指標を推定することが可能となる。よって、作動サイクルにおけるラバーアクチュエータ2の圧力値及び電気抵抗値を時系列に検出することで、ラバーアクチュエータ2の性能状態を推定でき、その性能状態を大規模な装置を用いて計測する必要はない。これによって、本実施形態によれば、ラバーアクチュエータ2の構造を直接計測して特定することが困難であった、ラバーアクチュエータ2の性能状態を特定することが可能となる。
【0083】
次に、ラバーアクチュエータ2の性能状態を推定した推定結果を検証した。
【0084】
図15には、複数のラバーアクチュエータ2について、作動サイクルによる圧力特性と電気特性とから推定した性能指標の推定結果を検証した検証結果が示されている。
【0085】
この検証では、管状体212に発生した亀裂等の不具合箇所216(図3)の数や大きさを計測し、その計測結果から、初期状態、中期状態、及び後期状態の何れかの性能指標に分類した複数のラバーアクチュエータ2の各々を推定対象とした。そして、推定対象のラバーアクチュエータ2の各々について、上述した分類時点における作動サイクルの圧力特性と、電気特性とを取得し、各々の性能指標を推定した。図15における推定結果は、計測による分類結果と、作動サイクルの圧力特性及び電気特性による推定結果との対応数を示す。
【0086】
図15に示すように、上述した弾性体の性能推定装置1によれば、ラバーアクチュエータ2に対して計測による分類結果と、推定結果とが適切に対応関係にあることが確認可能である。
【0087】
(第1変形例)サイクル数
上記では、性能状態を示す物理量として、性能指標を推定する場合を説明したが、本開示はこれに限定されない。例えば、性能状態を示す物理量として、予め定められた標準的なラバーアクチュエータ2の作動可能範囲CtX、又は性能維持範囲CtYにおけるサイクル数を推定してもよい。
【0088】
具体的には、上述した出力データ6の性能指標を、予め定められた標準的なラバーアクチュエータ2のサイクル数(累積サイクル数)に代えて、学習処理部52の学習処理により、学習モデル51を生成すればよい。なお、標準的なラバーアクチュエータ2のサイクル数(累積サイクル数)は、複数のラバーアクチュエータにおける作動可能範囲CtX、又は性能維持範囲CtYの平均値や標準偏差などの演算により導出することが可能である。
【0089】
このように、標準的なラバーアクチュエータ2のサイクル数を推定することで、推定対象のラバーアクチュエータ2の性能状態の推定時における性能状態を作動サイクルのサイクル数(累積サイクル数)により定量的に確認することが可能となる。
【0090】
(第2変形例)寿命推定
上記では、性能状態を示す物理量として、性能指標又はサイクル数を推定する場合を説明したが、本開示はこれに限定されない。例えば、ラバーアクチュエータ2の寿命を示す情報を、性能状態を示す物理量として推定してもよい。
【0091】
具体的には、上述した標準的なラバーアクチュエータ2におけるサイクル数の推定を用いて、推定対象のラバーアクチュエータ2において作動可能なサイクル数を、部品寿命指標として適用すればよい。例えば、上述した標準的なラバーアクチュエータ2における終期のサイクル数Cteを予めメモリに記憶しておき、終期のサイクル数Cteから推定したサイクル数を減算することで、推定対象のラバーアクチュエータ2に対する性能状態の推定時において残存するサイクル数を、部品寿命指標として適用可能である。
【0092】
このように、ラバーアクチュエータ2の寿命を推定することで、推定対象のラバーアクチュエータ2に残存する作動サイクルのサイクル数、すなわち寿命を定量的に確認することが可能となる。これによって、例えば、推定対象のラバーアクチュエータ2に不具合が生じる以前に、交換する等の保守を行う時期を設定することが可能になる。
【0093】
なお、上述した例の3段階による性能指標を、4段階以上の多数の段階的な性能指標を適用することでもラバーアクチュエータ2の寿命を示す情報として適用することが可能である。すなわち、推定した性能指標が終期のサイクル数Cteまでにどの段階かを特定することで、ラバーアクチュエータ2の寿命を示す情報とすることが可能である。
【0094】
(第3変形例)電気特性のみで推定
上記では、性能状態が未知のラバーアクチュエータ2に対して、当該ラバーアクチュエータ2における作動サイクルによる第1入力データ3(圧力特性)及び第2入力データ4(電気特性)から、ラバーアクチュエータ2の性能状態を推定した。本開示の技術は、入力データとして、圧力特性及び電気特性の両方を用いることに限定されない。例えば、推定対象のラバーアクチュエータ2が予め定められた定常的な圧力特性による作動サイクルで作動される場合、圧力特性を予め記憶し、記憶した圧力特性を用いることで、第1入力データ3(圧力特性)を省略可能である。
【0095】
具体的には、図16に示すように、推定部5に第1入力データ3(圧力特性)を示す情報3Mを記憶しておけばよい。このように構成することで、推定対象のラバーアクチュエータ2に対して、圧力刺激3Pを与えたときの電気特性を第2入力データ4として取得するのみで、性能状態を推定可能になる。
【0096】
(第2実施形態)
次に、第2実施形態を説明する。第2実施形態は、ラバーアクチュエータ2の性能状態を推定するにあたって、推定速度を向上することを考慮したものである。なお、第2実施形態は第1実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。
【0097】
一般的な再帰型ニューラルネットワークでは、入力層540から中間層542へのノードの結合、中間層542におけるノード間の結合およびフィードバック結合、そして中間層542から出力層544へのノード間の結合の各々の結合について重みパラメータの情報を最適化する(図11)。しかし、非線形に変形するラバーアクチュエータ2に対して時間的な相関を持つ時系列データを用いた学習では膨大な学習時間が要求される。また、時系列な学習データによる学習時に、時間的遡及を行うために、膨大なメモリも要求される。
【0098】
この膨大な時間が要求される学習時間を抑制することを目的とし、リザーバコンピューティングと呼ばれる周知のネットワークモデルが、非線形に変形するラバーアクチュエータ2の長さ推定に適用可能である。リザーバコンピューティング(RC:Reservoir Computing)と呼ばれるネットワークモデル(以下、RCNという。)自体は公知の技術であるため、詳細な説明を省略するが、RCNの一例は、再帰型ニューラルネットワークの一部を固定し(ランダムなネットワークに置き換え)、中間層542から出力層544へのノード間の結合のみを最適化するものである。
【0099】
図17を参照して、RCNを用いた学習処理部52Aにおける学習処理について説明する。図17に示す学習処理部52Aは、図11に示す生成器54を生成器54Aに代え、演算器56により導出された誤差を出力層544側にのみ反映させて学習を行う点が図11に示す学習処理部52と異なっている。
【0100】
図17に示すように、学習処理部52の生成器54Aは、図11と同様の入力層540、図11の中間層542に代えて図11と同様の構成のリザーバ層543、および図11と同様の出力層544を含んで、公知のRCNを構成している。RCNでは、入力層540からリザーバ層543へのノードの結合と、リザーバ層543におけるノード間の結合およびフィードバック結合とに、固定の重みパラメータの情報(以下、重み係数という。)が設定される。そして、リザーバ層543から出力層544へのノード間の結合は、例えば線形結合とされ、各々の重みパラメータが学習データの学習によって最適化される。
【0101】
なお、固定の重み係数は、予め設定しておくものとする。この固定の重み係数は、初期値として定めた係数を設定することが可能である。また、固定の重み係数は、学習データを用いて、学習データの出力データ6を目標として、生成出力データ6Aと学習データの出力データ6との誤差を最小化するようにノード間等の結合を、誤差を最小化するには不十分な所定回数又は所定時間だけ最適化した場合の重み係数を設定してもよい。
【0102】
一方、リザーバ層543から出力層544へのノード間の結合を規定する重みパラメータは、多数の学習データを用いて、生成出力データ6Aと学習データの出力データ6との誤差を最小化するように学習して導出される。
【0103】
生成器54Aを含む学習処理部52Aは、図示しないCPUを含むコンピュータを含んで構成し、学習処理を実行することが可能である。例えば、図18に学習処理の一例を示すように、学習処理部52Aは、学習データとして、第1入力データ3(圧力特性)、第2入力データ4(電気特性)、及び出力データ6(性能指標)を取得し(ステップS120)、入力層540及びリザーバ層543を構築する(ステップS122)。ここでは、図11に示す生成器54と同様であるが、一部の学習データを用いて、学習処理を行う。具体的には、一部の学習データを用いて学習した学習結果のノード間の結合の重みパラメータの情報の集合を得て、入力層540からリザーバ層543へのノードの結合と、リザーバ層543におけるノード間の結合およびフィードバック結合とを、重み係数として導出する。この導出した重み係数により入力層540及びリザーバ層543を同定することで入力層540及びリザーバ層543を構築する。
【0104】
次に、学習処理部52Aは、時系列に測定した結果の多数の学習データを用いて学習モデル51を生成する(ステップS124)。すなわち、リザーバ層543から出力層544へのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、RCNを構築する。そして、ステップS122で導出した重み係数と、ステップS124の学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータを学習モデル51として記憶する(ステップS126)。
【0105】
そして、上記弾性体の性能推定装置1では、生成した学習済みの生成器54Aを学習モデル51として用いる。すなわち、ここでは、入力層540からリザーバ層543へのノードの結合と、リザーバ層543におけるノード間の結合およびフィードバック結合とを表す重み係数と、リザーバ層543から出力層544へのノード間の結合とを表す重みパラメータとが学習モデル51に対応する。十分に学習した学習モデル51を用いれば、非線形に変形するラバーアクチュエータについて、作動サイクルにおける圧力特性及び電気特性から性能指標を推定することも不可能ではない。
【0106】
以上説明したように、本実施形態によれば、一般的な再帰型ニューラルネットワークに代えて、RCNによりネットワークを構築して学習モデル51を最適化する。これによって、一般的な再帰型ニューラルネットワークにより学習モデルを構築する場合と比べて、必要とされた学習時間を抑制可能となる。また、一般的な再帰型ニューラルネットワークでは時間的遡及を行うために、必要とされる膨大なメモリ(メモリ容量)も抑制可能となる。
【0107】
(第3実施形態)
次に、第3実施形態を説明する。第3実施形態は、ラバーアクチュエータ2の性能状態を推定するための学習モデル51の学習効果の向上を考慮したものである。なお、第3実施形態は第1実施形態および第2実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。
【0108】
上述のように、再帰型ニューラルネットワークの一部を固定したRCNを用いることで、学習時間を抑制可能となる。しかし、入力層540からリザーバ層543へのノードの結合と、リザーバ層543におけるノード間の結合およびフィードバック結合とに、固定の重みパラメータを用いた場合、学習の効果が不十分な場合がある。これは、リザーバ層543から出力層544へのノード間の結合の重みパラメータを学習しても、固定の重みパラメータによる限られた個数のノードが設定されたリザーバ層543では、リザーバ層543からの出力が最適化に足る出力とならない場合があるからである。このため、リザーバ層543に用いる再帰型ニューラルネットワークの構造を複雑にすることが想定されるが、リザーバ層543の設定時間を要することになるため、好ましくない。
【0109】
ところで、リザーバコンピューティング(RCN)は、周知のように、入力を高次元空間に非線形変換により高次元の特徴空間に射影することである。この点について、再帰型ニューラルネットワークに代えて非線形な動的システムをリザーバ層543に用いる、物理的なリザーバコンピューティング(PRC:Physical Reservoir Computing)と呼ばれるネットワークモデル(以下、PRCNという。)が知られている。PRCおよびPRCN自体は公知の技術であるため、詳細な説明を省略するが、リザーバ層543に非線形に変形するラバーアクチュエータ2の変形に関するデータを貯留するものとして利用可能である。すなわち、PRCNは、非線形に変形するラバーアクチュエータ2の性能状態の推定に好適に適用可能である。
【0110】
ここで、図19を参照して、学習処理部52Bにおける学習処理について説明する。図19に示す学習処理部52Bは、図17に示す生成器54Aを生成器54Bに代え、演算器56により導出された誤差を出力層544側にのみ反映させて学習を行う点が図17に示す学習処理部52Aと異なっている。
【0111】
図19に示すように、学習処理部52Bの生成器54Bは、図11と同様の入力層540、図17のリザーバ層543に代えて物理リザーバ層545、および図11と同様の出力層544を含んで、公知のPRCNを構成している。PRCN自体は公知の技術であるため、詳細な説明を省略するが、PRCNでは、入力層540からリザーバ層543へのノードの結合には、上述したように固定の重み係数が設定される。物理リザーバ層545は、多数の時系列な相関関係について特徴量を貯留し、入力に近い複数の特徴量を出力する構成になっている。そして、物理リザーバ層545から出力層544へのノード間の結合は、例えば線形結合とされ、各々の重みパラメータが、多数の学習データを用い、生成出力データ6Aと学習データの出力データ6との誤差を最小化する学習によって最適化される。
【0112】
なお、固定の重み係数は、上述したように、初期値として定めた係数を設定してもよく、学習データを用いて、所定回数又は所定時間だけ最適化した場合の重み係数を設定してもよい。
【0113】
物理リザーバ層545は、ラバーアクチュエータ2の時系列に物理的な相関関係が多数貯留され、入力層540からの未知の入力データ(圧力特性と電気特性)に近い入力データ(圧力特性と電気特性)に対応する性能状態(性能指標)を抽出し、複数の特徴量として出力層544へ出力する。概念的には、ラバーアクチュエータ2の挙動として、作動サイクルで時系列に変化する圧力特性および電気特性に対して性能状態である性能指標との相関関係を多数記憶しておき、未知の入力(圧力特性および電気特性)に近い複数のラバーアクチュエータ2の性能状態(性能指標)の各々を特徴量として選択して出力することである。これによって、複雑な計算を実行することを抑制可能となる。
【0114】
生成器54Bを含む学習処理部52Bは、図示しないCPUを含むコンピュータを含んで構成し、学習処理を実行することが可能である。例えば、図20に学習処理の一例を示すように、学習処理部52Bは、時系列に測定した結果の学習データである、第1入力データ3(圧力特性)、第2入力データ4(電気特性)、及び出力データ6(性能状態)を取得し(ステップS130)、入力層540及び物理リザーバ層545を構築する(ステップS132)。入力層540は、予め定めた重み係数を設定するものとする。よって、入力層540から物理リザーバ層545へのノードの結合を、予め定めた重み係数により同定することで入力層540を構築する。一方、物理リザーバ層545は、学習データの各々、すなわち、作動サイクルの圧力特性及び電気特性に対して性能状態との相関関係を多数貯留したものとする。よって、物理リザーバ層545は、学習データによる時系列に変化する圧力値および電気抵抗値に対して非線形な挙動となる長さとの相関関係が特徴量として貯留され、その中から入力に近い複数の特徴量を出力するように構成することで構築する。
【0115】
次に、学習処理部52Bは、ステップS134で、時系列に測定した結果の多数の学習データを用いて学習モデル51を生成する。すなわち、物理リザーバ層545から出力層544へのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、PRCNを構築する。次に、ステップS132で導出した重み係数と、ステップS134の学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータを学習モデル51として記憶する(ステップS136)。
【0116】
そして、上記弾性体の性能推定装置1では、生成した学習済みの生成器54Bを学習モデル51として用いる。すなわち、ここでは、入力層540から物理リザーバ層545へのノードの結合と、物理リザーバ層545と、物理リザーバ層545から出力層544へのノード間の結合とを表す重みパラメータとが学習モデル51に対応する。
【0117】
弾性体の性能推定装置1は、未知の入力データである作動サイクルに対するラバーアクチュエータ2の圧力特性及び電気特性に対して、物理リザーバ層545に貯留されたラバーアクチュエータ2の時系列に物理的な相関関係のうち、入力層540からの未知の入力データ(圧力特性と電気特性)に近い入力データ(圧力特性と電気特性)に対応する性能状態(性能指標)を抽出し、複数の特徴量として出力層544へ出力する。そして、出力層544は、物理リザーバ層545からの複数の特徴量を、学習された重みパラメータによって、例えば線形結合してラバーアクチュエータ2の性能状態(性能指標)として推定する。十分に学習した学習モデル51を用いれば、ラバーアクチュエータ2に対して、圧力特性および電気特性から性能状態(性能指標)を推定することも不可能ではない。
【0118】
以上説明したように、本開示によれば、RCNに代えて、PRCNによりネットワークを構築して学習モデル51を最適化する。これによって、RCNにより学習モデルを構築する場合と比べて、学習モデル51の学習効果の向上が図れる。
【0119】
このように、RCNに代えてPRCNによりネットワークを構築して学習モデル51を最適化することによって、実際のラバーアクチュエータ2の長さに極めて近いラバーアクチュエータ2の長さを推定することができる。
【0120】
上述のように、本開示では、部材としてラバーアクチュエータを適用した場合を説明したが、部材はラバーアクチュエータに限定されないことは勿論である。また、部材の変形に応じて変化する種類が異なる少なくとも3つの物理量として、圧力の大きさを表す圧力値を第1物理量とし、電気特性の大きさを表す電気抵抗値を第2物理量とし、変形の大きさを表す長さをターゲット物理量とし、圧力値および電気抵抗値から長さを推定する場合を説明した。しかし、第1物理量、第2物理量およびターゲット物理量の各々は、これに限定されるものではなく、ターゲット物理量は圧力値又は電気抵抗値を設定してもよい。
【0121】
以上、各実施の形態を用いて説明したが、本開示の技術的範囲は上記実施形態に記載の範囲には限定されない。要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も本開示の技術的範囲に含まれる。
【0122】
また、上記実施形態では、検査処理を、フローチャートを用いた処理によるソフトウエア構成によって実現した場合について説明したが、これに限定されるものではなく、例えば各処理をハードウェア構成により実現する形態としてもよい。
【0123】
また、弾性体の性能推定装置の一部、例えば学習モデル等のニューラルネットワークを、ハードウェア回路として構成してもよい。
【符号の説明】
【0124】
1 弾性体の性能推定装置
2 ラバーアクチュエータ
3 第1入力データ
4 第2入力データ
5 推定部
6 出力データ
6A 生成出力データ
7 測定装置
51 学習モデル
52、52A、52B 学習処理部
54、54A、54B 生成器
56 演算器
70 コントローラ
75 供給部
76 電気特性検出部
100 コンピュータ本体
108 補助記憶装置
108D データ
108M 学習モデル
108P 制御プログラム
540 入力層
542 中間層
543 リザーバ層
544 出力層
545 物理リザーバ層
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20