IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特開2024-70487ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム
<>
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図1
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図2
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図3
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図4
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図5
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図6
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図7
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図8
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図9
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図10
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図11
  • 特開-ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024070487
(43)【公開日】2024-05-23
(54)【発明の名称】ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム
(51)【国際特許分類】
   G06N 3/08 20230101AFI20240516BHJP
   G06N 20/00 20190101ALI20240516BHJP
   G05B 23/02 20060101ALI20240516BHJP
【FI】
G06N3/08
G06N20/00
G05B23/02 R
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022181009
(22)【出願日】2022-11-11
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【弁理士】
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100107331
【弁理士】
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100131015
【弁理士】
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】棗田 昌尚
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA12
3C223BA01
3C223CC01
3C223DD01
3C223EB02
3C223EB03
3C223FF04
3C223FF05
3C223FF12
3C223FF22
3C223FF26
3C223FF46
3C223FF52
3C223GG01
3C223HH08
3C223HH22
(57)【要約】
【課題】機器の余寿命を推定するニューラルネットワークを適切に学習する。
【解決手段】ニューラルネットワークの学習方法は、保全の対象である対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、ニューラルネットワークの重みパラメータを更新する。
【選択図】図3
【特許請求の範囲】
【請求項1】
保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、
前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、
前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、
ニューラルネットワークの学習方法。
【請求項2】
前記メンテナンスサイクルデータにおける余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテンナンスサイクルデータからランダムに選択した点における余寿命の予測値との差である、
請求項1に記載のニューラルネットワークの学習方法。
【請求項3】
前記メンテナンスサイクルデータにおける余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテンナンスサイクルデータの終端に対応する点における余寿命の予測値との差である、
請求項1に記載のニューラルネットワークの学習方法。
【請求項4】
前記参照点を、前記メンテナンスサイクルデータごとに予め決定し、
前記参照点のすべてを用いて前記重みパラメータを更新するごとに、前記重みパラメータを検証するための検証値を算出し、
前記検証値に基づいて前記重みパラメータを上書き保存する、
請求項1から3のいずれか一項に記載のニューラルネットワークの学習方法。
【請求項5】
前記参照点は、前記メンテナンスサイクルデータにおける余寿命が小さい部分から、より多く決定される、
請求項4に記載のニューラルネットワークの学習方法。
【請求項6】
前記ニューラルネットワークは、稼働データを特徴量ベクトルに変換する特徴抽出器と、前記特徴量ベクトルを余寿命の予測値に変換する予測層と、を備えており、
同一のメンテナンスサイクルに属する稼働データにおける二点間の余寿命の差が、前記特徴抽出器から出力される前記二点間の特徴量ベクトルの距離となるように、前記特徴抽出器の重みパラメータの事前学習を行い、
前記事前学習で学習された前記特徴抽出器の重みパラメータを初期値とする本学習として、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、
請求項1から3のいずれか一項に記載のニューラルネットワークの学習方法。
【請求項7】
前記事前学習における余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテナンスサイクルデータの前記参照点より余寿命が小さい部分からランダムに選択した点における余寿命の予測値との差であり、
前記本学習における余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテナンスサイクルデータの終端に対応する点における余寿命の予測値との差である、
請求項6に記載のニューラルネットワークの学習方法。
【請求項8】
保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、
前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、
前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、
ニューラルネットワークの学習方法をコンピュータに実行させるコンピュータプログラム。
【請求項9】
保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測システムであって、
前記ニューラルネットワークは、
前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、
前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、
ことで学習されている余寿命予測システム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システムの技術分野に関する。
【背景技術】
【0002】
各種機器のメンテナンスを行うために、機器の余寿命(即ち、故障発生までの期間)を推定する方法が知られている。例えば特許文献1では、機械学習モデルによって、工作機械の数値制御装置に設けられるNANDフラッシュメモリの余寿命を予測することが開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第6386523号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記特許文献1では、余寿命を推定するモデルを学習するために、故障発生に至るまでのデータを十分に入手できることが前提となっている。しかしながら、実際の保全方法では故障発生より前にメンテナンスが実行されるため、故障発生に至るまでのデータを収集することは容易ではない。仮に、学習に用いるデータが不十分な状態であると、学習したモデルによる余寿命の推定精度は低くなってしまう。また、疑似ラベルを付与したデータを用いることも考えられるが、この場合は疑似ラベルの推定にかかるコストが大きくなってしまう。この開示は、上述した技術的問題点を改善することを目的とする。
【課題を解決するための手段】
【0005】
この開示のニューラルネットワークの学習方法の一の態様は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する。
【0006】
この開示のコンピュータプログラムの一の態様は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、ニューラルネットワークの学習方法をコンピュータに実行させる。
【0007】
この開示の余寿命予測システムの一の態様は、保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測システムであって、前記ニューラルネットワークは、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、ことで学習されている。
【図面の簡単な説明】
【0008】
図1】第1実施形態に係る余寿命予測システムのハードウェア構成を示すブロック図である。
図2】第1実施形態に係る余寿命予測システムの機能的構成を示すブロック図である。
図3】第1実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。
図4】第1実施形態に係る余寿命予測システムの予測動作の流れを示すフローチャートである。
図5】メンテナンスサイクルデータ及びライフサイクルデータにおける機器の健全度の時間変化の一例を示す概念図である。
図6】第1実施形態に係る余寿命予測システムにおけるラベルありデータを用いる場合の学習方法を示す概念図である。
図7】第1実施形態に係る余寿命予測システムにおけるラベルなしデータを用いる場合の学習方法を示す概念図である。
図8】第2実施形態に係る余寿命予測システムにおける他方の点の選択方法の一例を示すグラフ(その1)である。
図9】第2実施形態に係る余寿命予測システムにおける他方の点の選択方法の一例を示すグラフ(その2)である。
図10】第3実施形態に係る余寿命予測システムが実行する学習処理の流れを示すフローチャートである。
図11】第4実施形態に係る余寿命予測システムにおける事前学習の方法を示す概念図である。
図12】第4実施形態に係る余寿命予測システムにおける各学習段階での他方の点の選択方法の違いを示す表である。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら、ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システムの実施形態について説明する。なお、以下では、余寿命予測システムにおいてニューラルネットワークの学習方法が実行される例を挙げて説明を進める。
【0010】
<第1実施形態>
第1実施形態に係る余寿命予測システムについて、図1から図7を参照して説明する。
【0011】
(ハードウェア構成)
まず、図1を参照しながら、第1実施形態に係る余寿命予測システムのハードウェア構成について説明する。図1は、第1実施形態に係る余寿命予測システムのハードウェア構成を示すブロック図である。
【0012】
図1に示すように、第1実施形態に係る余寿命予測システム10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。余寿命予測システム10は更に、入力装置15と、出力装置16と、を備えていてもよい。上述したプロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16とは、データバス17を介して接続されている。
【0013】
プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、余寿命予測システム10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、対象機器の余寿命を予測するための機能ブロック、及びニューラルネットワークを学習するための機能ブロックが実現される。即ち、プロセッサ11は、本実施形態に係る余寿命予測システム10における各制御を実行するコントローラとして機能してよい。
【0014】
プロセッサ11は、例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)、量子プロセッサとして構成されてよい。プロセッサ11は、これらのうち一つで構成されてもよいし、複数を並列で用いるように構成されてもよい。
【0015】
RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。また、RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic Random Access Memory)や、SRAM(Static Random Access Memory)であってよい。また、RAM12に代えて、他の種類の揮発性メモリが用いられてもよい。
【0016】
ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable Read Only Memory)や、EPROM(Erasable Read Only Memory)であってよい。また、ROM13に代えて、他の種類の不揮発性 メモリが用いられてもよい。
【0017】
記憶装置14は、余寿命予測システム10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
【0018】
入力装置15は、余寿命予測システム10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。入力装置15は、スマートフォンやタブレット等の携帯端末として構成されていてもよい。入力装置15は、例えばマイクを含む音声入力が可能な装置であってもよい。
【0019】
出力装置16は、余寿命予測システム10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、余寿命予測システム10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。また、出力装置16は、余寿命予測システム10に関する情報を音声出力可能なスピーカ等であってもよい。出力装置16は、スマートフォンやタブレット等の携帯端末として構成されていてもよい。また、出力装置16は、画像以外の形式で情報を出力する装置であってもよい。例えば、出力装置16は、余寿命予測システム10に関する情報を音声で出力するスピーカであってもよい。
【0020】
なお、図1では、複数の装置を含んで構成される余寿命予測システム10の例を挙げたが、これらの全部又は一部の機能を、1つの装置で実現してもよい。その場合、余寿命予測システム10は、例えば上述したプロセッサ11、RAM12、ROM13のみを備えて構成され、その他の構成要素(即ち、記憶装置14、入力装置15、及び出力装置16)については、余寿命予測システム10に接続される外部の装置が備えるようにしてもよい。また、余寿命予測システム10は、一部の演算機能を外部の装置(例えば、外部サーバやクラウド等)によって実現するものであってもよい。
【0021】
(機能的構成)
次に、図2を参照しながら、第1実施形態に係る余寿命予測システム10の機能的構成について説明する。図2は、第1実施形態に係る余寿命予測システムの機能的構成を示すブロック図である。
【0022】
図2に示すように、第1実施形態に係る余寿命予測システム10は、その機能を実現するための構成要素として、データ収集部110と、学習部120と、予測部130と、出力部140と、記憶部150と、を備えて構成されている。データ収集部110、学習部120、予測部130、及び出力部140の各々は、例えば上述したプロセッサ11(図1参照)によって実現される処理ブロックであってよい。また、記憶部150は、例えば上述した記憶装置14(図1参照)によって実現されてよい。
【0023】
データ収集部110は、保全の対象である対象機器のメンテナンスサイクルデータを収集可能に構成されている。メンテナンスサイクルデータは、対象機器の保全直後から次回保全直前までの期間における時系列の稼働データである。メンテナンスサイクルデータは、故障がまだ発生していない状態のデータであるため、故障時刻に関する情報を含まないラベルなしデータである。以下では、メンテナンスサイクルデータ、又は複数のメンテナンスデータを含むデータ群のことを、適宜「ラベルなしデータ」と称する。
【0024】
データ収集部110は更に、保全の対象である対象機器のライフサイクルデータを収集可能に構成されている。ライフサイクルデータは、対象機器の故障発生までの時系列稼働データである。このため、ライフサイクルデータは、故障時刻に関する情報を含むラベルありデータである。以下では、ライフサイクルデータ、又は複数のライフサイクルデータを含むデータ群のことを、適宜「ラベルありデータ」と称する。
【0025】
なお、対象機器は、保全を行う機器であれば特に限定されないが、一例として、ハードディスク、NANDフラッシュメモリ、回転機器(例えば、ポンプやファン等)が挙げられる。ハードディスクの場合、メンテナンスサイクルデータには、S.M.A.R.T情報や、例えばRAIDコントローラらから入手できるWrite Count、Average Write Response Time、Max Write Response Time、Write Transfer Rate、Read Count,Average Read Response Time、Max Read Time、Read Transfer Rate、Busy Ratio、Busy Time等が含まれていてよい。NANDフラッシュメモリの場合、メンテナンスサイクルデータ及びライフサイクルデータには、書き換え回数、書き換え間隔、読み出し回数、使用環境における温度、エラー率、製造メーカに関する情報及び製造ロットに関する情報、並びに、NANDフラッシュメモリに対して誤り訂正符号化(ECC)処理を行うメモリコントローラのECC性能に関する情報、製造メーカに関する情報及び製造ロットに関する情報等が含まれていてよい。回転機器の場合、メンテナンスサイクルデータ及びライフサイクルデータには、加速度センサ、超音波(AEセンサ)、電流、モータのトルク、歪ゲージ等の出力値等が含まれていてよい。
【0026】
学習部120は、データ収集部110で収集されたメンテナンスサイクルデータ及びライフサイクルデータを学習データとして用いることで、対象機器の余寿命(即ち、故障が発生するまでの期間)を予測するモデルを学習可能に構成されている。具体的には、学習部120は、メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、ニューラルネットワークの重みパラメータを更新する。
【0027】
予測部130は、学習部120で学習されたモデルを用いて、対象機器の余寿命を予測可能に構成されている。具体的には、予測部130は、データ収集部110で収集されたメンテナンスサイクルデータを、余寿命予測用のデータとして学習済みのモデルに入力することで、そのメンテナンスサイクルデータに対応する対象機器の余寿命を予測可能に構成されている。予測部130による予測動作については、後に詳しく説明する。
【0028】
出力部140は、余寿命予測システム10における各種情報を出力可能に構成されている。例えば、出力部140は、予測部130で予測した対象機器の余寿命に関する情報を出力するように構成されてよい。この場合、出力される情報は、余寿命の値を示すものであってもよいし、余寿命に応じたアラーム(例えば、メンテナンスを促すための情報)等であってもよい。出力部140は、上述した出力装置16を介して、各種情報を出力可能に構成されてよい。例えば、出力部140は、モニタやスピーカ等を介して各種情報を出力するように構成されてよい。
【0029】
記憶部150は、余寿命予測システム10で扱う各種情報を記憶可能に構成されている。記憶部150は、例えば学習部120で学習されたモデルを記憶可能に構成されてよい。また、記憶部150は、データ収集部110で収集されたメンテナンスサイクルデータやライフサイクルデータを記憶可能に構成されてよい。
【0030】
(学習動作)
次に、図3を参照しながら、第1実施形態に係る余寿命予測システム10による学習動作(即ち、余寿命を予測するモデルを学習する際の動作)について説明する。図3は、第1実施形態に係る余寿命予測システムの学習動作の流れを示すフローチャートである。
【0031】
図3に示すように、第1実施形態に係る余寿命予測システム10の学習動作が開始されると、まずデータ収集部110がラベルありデータ(即ち、ライフサイクルデータ)及びラベルなしデータ(即ち、メンテナンスサイクルデータ)を取得する(ステップS101)。この際、データ収集部110は、対象機器から新たに各データを収集してもよいし、記憶部150から過去に収集した各データを取得してもよい。データ収集部110が取得したラベルありデータ及びラベルなしデータは、それぞれ学習部120に出力される。
【0032】
続いて、学習部120がラベルありデータ及びラベルなしデータを学習データとして用いることで、対象機器の余寿命を予測するモデルを学習する(ステップS102)。なお、学習部120によるモデルの学習動作については、後に詳しく説明する。学習が終了すると、学習部120は、学習済みのモデルを記憶部150に保存する(ステップS103)。
【0033】
(予測動作)
次に、図4を参照しながら、第1実施形態に係る余寿命予測システム10による予測動作(即ち、学習済みのモデルを用いて余寿命を予測する際の動作)について説明する。図4は、第1実施形態に係る余寿命予測システムの予測動作の流れを示すフローチャートである。
【0034】
図4に示すように、第1実施形態に係る余寿命予測システム10の予測動作が開始されると、まず予測部130が学習済みのモデルを記憶部150から読み込む(ステップS201)。
【0035】
続いて、データ収集部110が、余寿命予測用のメンテナンスサイクルデータを取得する(ステップS202)。この際、データ収集部110は、対象機器から新たにメンテナンスサイクルデータを収集してもよいし、記憶部150から過去に収集したメンテナンスサイクルデータを取得してもよい。データ収集部110が取得したメンテナンスサイクルデータは、予測部130に出力される。
【0036】
続いて、予測部130が、学習済みのモデルを用いて対象機器の余寿命を予測する(ステップS203)。そして、予測部130は、予測した余寿命が所定閾値を下回っているか否かを判定する(ステップS204)。なお、ここでの「所定閾値」は、対象機器のメンテナンスを行うべきか否かを判定するための閾値であり、予め任意の値が設定されていてよい。
【0037】
予測した余寿命が所定閾値を下回っている場合(ステップS204:YES)、出力部140がユーザにアラームを出力する(ステップS205)。アラームには、例えばメンテナンス作業を促すような情報が含まれていてよい。一方、予測した余寿命が所定閾値を下回っていない場合(ステップS204:NO)、上述したステップS205の処理は省略されてよい。ただし、予測した余寿命が所定閾値を下回っていない場合であっても、予測した余寿命に基づいて、次回のメンテナンス作業をいつ頃行えばよいかを示す情報を出力するようにしてもよい。
【0038】
(学習方法)
次に、図5から図7を参照しながら、第1実施形態に係る余寿命予測システム10における学習方法ついて詳しく説明する。図5は、メンテナンスサイクルデータ及びライフサイクルデータにおける機器の健全度の時間変化の一例を示す概念図である。図6は、第1実施形態に係る余寿命予測システムにおけるラベルありデータを用いる場合の学習方法を示す概念図である。図7は、第1実施形態に係る余寿命予測システムにおけるラベルなしデータを用いる場合の学習方法を示す概念図である。
【0039】
図5において、第1実施形態に係る余寿命予測システム10は、ラベルなしの学習データとして複数のメンテナンスサイクルデータ(例えば、図中のデータA~Fを参照)を用いる。これら複数のメンテナンスサイクルデータは、それぞれ別々の機器から取得されるものであってもよいし、同一の機器から別タイミングで取得されるものであってもよい。メンテナンスサイクルデータは、メンテンナンスサイクル毎に、対象機器や、その周辺に敷設されたセンサから取得される値、或いはその統計値(メンテナンスサイクル全体ではない一定期間ごと)であり、典型的には多次元の時系列データであってよい。なお、図中の健全度は、仮想的な指標であり、実際には観測できない値であってよい。ここでの健全度は、劣化領域(即ち、健全度が低下している領域)において余寿命に一致する。
【0040】
第1実施形態に係る余寿命予測システム10は更に、ラベルありの学習データとしてライフサイクルデータを用いる。ライフサイクルデータも、メンテナンスサイクルデータと同様に、対象機器や、その周辺に敷設されたセンサから取得される値、或いはその統計値(メンテナンスサイクル全体ではない一定期間ごと)であり、典型的には多次元の時系列データであってよい。ただし、ライフサイクルデータは、メンテナンスサイクルデータとは異なり、対象機器に故障が発生したタイミングに関する情報を含むデータである。なお、学習に用いるライフサイクルデータの数は、メンテナンスサイクルデータよりも相対的に少ない数であってよい。
【0041】
図6及び図7に示すように、第1実施形態に係る余寿命予測システム10は、対象機器の余寿命を予測するモデルにラベルありデータ及びラベルなしデータを入力して学習を行う。なお、余寿命を予測するモデルは、入力されたデータから特徴量を抽出する特徴抽出器200と、特徴量から余寿命を予測する予測層300と、を備える。特徴抽出器200は、例えば回帰型ニューラルネットワーク(RNN、LSTM、GRU等)、CNN、Transformerなど、系列データをベクトルに変換できるニューラルネットワーク)や、Multilayer Perceptron等のベクトルを別のベクトルに変換するニューラルネットワークを含んでいてよい。予測層30は、Multilayer Perceptron等のベクトルを別のベクトルに変換するニューラルネットワークを含んでいてよい。
【0042】
図6において、ラベルありデータが学習データとして入力された場合、余寿命を予測するモデルは、ラベルありデータから予測される余寿命y^を出力する。ラベルありデータの場合、もともとのデータに正解となる余寿命yが含まれているため、正解となる余寿命yと、予測された余寿命y^との予測誤差を学習に用いることができる。具体的には、後述するように、正解となる余寿命yと、予測された余寿命y^との予測誤差を含む損失関数を用いて学習を行えばよい。
【0043】
図7において、ラベルなしデータが学習データとして入力された場合、余寿命を予測するモデルは、ラベルなしデータに含まれる2つの部分データを入力として学習を行う。具体的には、これら2つの部分データを入力して得られる余寿命の差d^ijと、2つの部分データの余寿命の差dijとの差を用いて学習を行う。即ち、2つの部分データの余寿命の差dijと、予測された余寿命の差d^ijとが一致するであろうという仮定のもと、dijとd^ijとの予測誤差を小さくするように学習を行う。
【0044】
ラベルありデータ及びラベルなしデータを用いる学習での損失関数は、例えば、ラベルありデータを入力した場合の予測誤差と、ラベルなしデータを入力した場合の予測誤差との重み付き和として計算されてよい。具体的には、損失Lは、例えば下記式(1)のように計算されてよい。
【0045】
【数1】
【0046】
なお、ここでのBは、サンプリングされたラベルありデータのインデックスであり、Bulは、サンプリングされたラベルなしデータのインデックスペアである。またλは、正則化パラメータである。
【0047】
学習する際には、上述した損失Lが小さくなっていくように(望ましくは最小化するように)、モデルの重みパラメータを更新していけばよい。学習処理のより具体的な流れについては、後述する他の実施形態で詳しく説明する。
【0048】
(技術的効果)
次に、第1実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
【0049】
図1から図7で説明したように、第1実施形態に係る余寿命予測システム10では、ラベルなしデータにおける二点間の余寿命の差の予測誤差と、ラベルありデータにおける余寿命の予測誤差とを小さくするように学習が行われる。このようにすれば、ラベルありデータの数が十分でない場合であっても、ラベルなしデータを活用して適切に学習を行うことができる。その結果、学習データの収集コストを抑制しつつ、対象機器の余寿命を高精度に予測可能な余寿命予測システムを実現することができる。
【0050】
<第2実施形態>
第2実施形態に係る余寿命予測システム10について、図8及び図9を参照して説明する。なお、第2実施形態は、上述した第1実施形態のより具体的な動作例を説明するものであり、システム構成や全体的な動作の流れ等については第1実施形態と同一であってよい。このため、以下では、すでに説明した第1実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0051】
(二点の選択)
まず、図8を参照しながら、第2実施形態に係る余寿命予測システム10におけるラベルなしデータの扱いについて説明する。図8は、第2実施形態に係る余寿命予測システムにおける他方の点の選択方法の一例を示すグラフ(その1)である。図9は、第2実施形態に係る余寿命予測システムにおける他方の点の選択方法の一例を示すグラフ(その2)である。
【0052】
上述した第1実施形態で説明したように、ラベルなしデータを用いる学習では、メンテナンスサイクルデータにおける二点間の余寿命の差が用いられる。この二点は、メンテンナンスサイクルデータごとに、参照点及び他方の点として選択される。参照点は、予め選択されていてもよいし、都度選択されるものであってよい。参照点は、メンテナンスサイクルデータからランダムに選択されるものであってもよい。一方、他方の点は、参照点に対応するもう一つの点として選択される。他方の点は、下記のように異なる基準で選択されるものであってよい。
【0053】
図8に示すように、他方の点は、参照点と同一のメンテンナンスサイクルデータからランダムに選択されてよい。この場合、他方の点の位置が限定されないため、メンテナンスサイクルデータにおける様々な特徴を捉えることが可能となる。なお、他方の点は、完全にランダムに選択されてもよいし、予め定められた範囲からランダムに選択されてもよい。例えば、他方の点は、メンテンナンスサイクルデータにおける参照点よりも余寿命が小さい部分からランダムに選択されてよい。或いは、他方の点は、メンテナンスサイクルデータにおける終端(データの最終時刻)付近に設定された範囲からランダムに選択されてもよい。
【0054】
図9に示すように、他方の点は、参照点と同一のメンテンナンスサイクルデータにおける終端に対応する点として選択されてよい。この場合、メンテナンスサイクルデータにおける余寿命が最も短くなった点が選択されることになるため、余寿命を予測する精度を高める学習が行える。
【0055】
(技術的効果)
次に、第2実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
【0056】
図8及び図9で説明したように、第2実施形態に係る余寿命予測システム10では、参照点と他方の点とがそれぞれ選択され、それらの余寿命の差を用いて学習が行われる。このようにすれば、故障発生時刻に関する時刻を含まないラベルなしデータを用いて、適切に学習を行うことが可能となる。
【0057】
<第3実施形態>
第3実施形態に係る余寿命予測システム10について、図10を参照して説明する。なお、第3実施形態は、上述した第1実施形態における学習処理の具体例を説明するものであり、その他の部分については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0058】
(学習処理の流れ)
まず、図10を参照しながら、第3実施形態に係る余寿命予測システム10が実行する学習処理(具体的には、図3で説明したステップS102の処理)の流れについて詳しく説明する。図10は、第3実施形態に係る余寿命予測システムが実行する学習処理の流れを示すフローチャートである。
【0059】
図10に示すように、第3実施形態に係る余寿命予測システム10による学習処理が開始されると、まず学習部130は、直前の評価値(詳しくは後述)を初期化する(ステップS301)。また、学習部130は、学習するモデルの重みパラメータを初期化する(ステップS302)。重みパラメータの初期値は、所定の方法でランダムに設定された値であってよい。或いは、重みパラメータの初期値は、事前学習(後述する他の実施形態を参照)によって設定される値であってもよい。
【0060】
続いて、学習部130は、ラベルありデータを学習用と検証用とに分ける(ステップS303)。なお、ラベルありデータは、ランダムに学習用と検証用とに分けられてよい。以下では、学習用に分けられたラベルありデータを「学習用ラベルありデータ」、検証用に分けられたラベルありデータを「検証用ラベルありデータ」と称することがある。
【0061】
続いて、学習部130は、学習用ラベルありデータから損失Lの第1項を計算し、ラベルなしデータから損失Lの第2項を計算する(ステップS304)。即ち、学習部130は、上述した式(1)を用いて損失Lを計算する。そして学習部130は、計算した損失Lが最小化するようにモデルの重みパラメータを更新する(ステップS305)。
【0062】
ここで特に、上述したステップS304及びS305の処理は、ラベルなしデータにおける全ての参照点が損失Lの計算に用いられるまで繰り返される。なお、ラベルなしデータの数よりも学習用ラベルありデータの数が少ない場合、ラベルありデータは重複して用いられてよいが、できるだけ同じデータが重複して用いられないようにするのが好ましい。
【0063】
なお、参照点は、メンテナンスサイクルデータにおける余寿命が小さい部分から、より多く決定されてもよい。即ち、余寿命が比較的大きい部分(即ち、時間があまり経過していない部分)からは相対的に少ない数の参照点が決定され、余寿命が比較的小さい部分(即ち、長い時間が経過している部分)からは相対的に多い数の参照点が決定されてよい。例えば、参照点は、余寿命が小さくなる程より多く決定されてよい。このようにすれば、故障に近づいた状態のデータがより多く考慮されることになるため、余寿命の予測精度を高める学習が行える。
【0064】
すべての参照点が用いられた後、学習部130は、更新された重みパラメータを検証するための評価値(言い換えれば、検証値)を計算する(ステップS306)。ここでの「評価値」は、更新された重みパラメータを最良値として保存するかを決定するための指標であり、例えば損失L又は損失Lの第1項を含む関数であってもよいし、損失Lそのものであってもよい。
【0065】
続いて、学習部130は、評価値が改善していれば、第1のモデルの重みパラメータを記憶部150に上書き保存する(ステップS307)。即ち、ここまでに更新してきた重みパラメータを一旦確定させる。なお、上述したステップS304からS307の処理は、予め設定されたイテレーション数だけ繰り返される。このように学習処理では、重みパラメータの更新と上書き保存とが繰り返される。
【0066】
(技術的効果)
次に、第3実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
【0067】
図10で説明したように、第3実施形態に係る余寿命予測システム10では、各メンテナンスサイクルデータに設定された参照点のすべてを用いて重みパラメータを更新するごとに評価値を算出し、その評価値に検証値に基づいて重みパラメータを上書き保存する。このようにすれば、学習処理におけるエポック数がラベルなしデータの数を基準とするものなるため、ラベルありデータ(即ち、ライフサイクルデータ)の数が、ラベルなしデータ(即ち、メンテナンスサイクルデータ)の数より少ない場合であっても、少量のラベルありデータに過適合することなく、適切に学習処理を実行することができる。
【0068】
<第4実施形態>
第4実施形態に係る余寿命予測システム10について、図11及び図12を参照して説明する。なお、第4実施形態は、上述した第1から第3実施形態と一部の動作が異なるのみであり、その他の部分については第1から第3実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0069】
(事前学習)
まず、図11を参照しながら、第4実施形態に係る余寿命予測システム10が実行する事前学習について説明する。図11は、第4実施形態に係る余寿命予測システムにおける事前学習の方法を示す概念図である。
【0070】
第4実施形態に係る余寿命予測システム10では、上述した第1から第3実施形態で説明した学習(以下、適宜「本学習」と称する)に先立ち、事前学習が行われる。即ち、まずは事前学習が実行され、その事前学習の結果を引き継いで本学習が実行される。
【0071】
図11において、事前学習は、余寿命を予測するモデルに含まれる特徴抽出器200の重みパラメータを更新する処理として実行される。具体的には、同一のメンテナンスサイクルに属する稼働データにおける二点間の余寿命の差dijが、特徴抽出器200から出力される二点間の特徴量ベクトルの距離となるように、特徴抽出器200の重みパラメータが更新される。なお、事前学習は、上述した本学習と同じ手法で実行されてよい。このため、事前学習における具体的な学習手法については、説明を省略するものとする。
【0072】
(学習段階における違い)
次に、図12を参照しながら、上述した事前学習及び本学習における他方の点の選択方法の違いについて説明する。図12は、第4実施形態に係る余寿命予測システムにおける各学習段階での他方の点の選択方法の違いを示す表である。
【0073】
図12に示すように、第4実施形態に係る余寿命予測システム10は、学習段階に応じて他方の点(即ち、参照点に対応するもう一つの点)の選択方法を変更してよい。具体的には、事前学習においては、参照点より余寿命が小さい部分からランダムに他方の点を選択する。このようにすれば、メンテナンスサイクルデータを広く考慮して事前学習を実行することができる。一方、本学習においては、メンテナンスサイクルデータの終端に対応する点を他方の点として選択する。このようにすれば、故障に近づいた状態のデータがより多く考慮されることになるため、余寿命の予測精度を更に高める学習が行える。
【0074】
(技術的効果)
次に、第4実施形態に係る余寿命予測システム10によって得られる技術的効果について説明する。
【0075】
図11で説明したように、第4実施形態に係る余寿命予測システム10では、まず特徴抽出器200が事前学習され、その後に余寿命を予測するモデル全体の本学習が行われる。このようにすれば、事前学習で特徴抽出器200の重みパラメータを適切な値へと近づけておくことができるため、最初から本学習を行う場合(即ち、事前学習を行わない場合)と比べると、全体としてより適切な学習を行うことができる。
【0076】
上述した各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記録媒体はもちろん、そのプログラム自体も各実施形態に含まれる。
【0077】
記録媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。更に、プログラム自体がサーバに記憶され、ユーザ端末にサーバからプログラムの一部または全てをダウンロード可能なようにしてもよい。プログラムは、例えばSaaS(Software as a Service)形式でユーザに提供されてもよい。
【0078】
<付記>
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
【0079】
(付記1)
付記1に記載のニューラルネットワークの学習方法は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、ニューラルネットワークの学習方法である。
【0080】
(付記2)
付記2に記載のニューラルネットワークの学習方法は、前記メンテナンスサイクルデータにおける余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテンナンスサイクルデータからランダムに選択した点における余寿命の予測値との差である、付記1に記載のニューラルネットワークの学習方法である。
【0081】
(付記3)
付記3に記載のニューラルネットワークの学習方法は、前記メンテナンスサイクルデータにおける余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテンナンスサイクルデータの終端に対応する点における余寿命の予測値との差である、付記1のいずれか一項に記載のニューラルネットワークの学習方法である。
【0082】
(付記4)
付記4に記載のニューラルネットワークの学習方法は、前記参照点を、前記メンテナンスサイクルデータごとに予め決定し、前記参照点のすべてを用いて前記重みパラメータを更新するごとに、前記重みパラメータを検証するための検証値を算出し、前記検証値に基づいて前記重みパラメータを上書き保存する、付記1から3のいずれか一項に記載のニューラルネットワークの学習方法である。
【0083】
(付記5)
付記5に記載のニューラルネットワークの学習方法は、前記参照点は、前記メンテナンスサイクルデータにおける余寿命が小さい部分から、より多く決定される、付記4のいずれか一項に記載のニューラルネットワークの学習方法である。
【0084】
(付記6)
付記6に記載のニューラルネットワークの学習方法は、前記ニューラルネットワークは、稼働データを特徴量ベクトルに変換する特徴抽出器と、前記特徴量ベクトルを余寿命の予測値に変換する予測層と、を備えており、同一のメンテナンスサイクルに属する稼働データにおける二点間の余寿命の差が、前記特徴抽出器から出力される前記二点間の特徴量ベクトルの距離となるように、前記特徴抽出器の重みパラメータの事前学習を行い、前記事前学習で学習された前記特徴抽出器の重みパラメータを初期値とする本学習として、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、付記1から5のいずれか一項に記載のニューラルネットワークの学習方法である。
【0085】
(付記7)
付記7に記載のニューラルネットワークの学習方法は、前記事前学習における余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテナンスサイクルデータの前記参照点より余寿命が小さい部分からランダムに選択した点における余寿命の予測値との差であり、前記本学習における余寿命の差は、前記メンテナンスサイクルデータの参照点における余寿命の予測値と、前記参照点と同一のメンテナンスサイクルデータの終端に対応する点における余寿命の予測値との差である、付記6に記載のニューラルネットワークの学習方法である。
【0086】
(付記8)
付記8に記載のコンピュータプログラムは、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、ニューラルネットワークの学習方法をコンピュータに実行させるコンピュータプログラムである。
【0087】
(付記9)
付記9に記載の記録媒体は、保全の対象である対象機器の余寿命を予測するニューラルネットワークの学習方法であって、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、ニューラルネットワークの学習方法をコンピュータに実行させるコンピュータプログラムが記録された記録媒体である。
【0088】
(付記10)
付記10に記載の余寿命予測システムは、保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測システムであって、前記ニューラルネットワークは、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、ことで学習されている余寿命予測システムである。
【0089】
(付記11)
付記11に記載の余寿命予測装置は、保全の対象である対象機器の余寿命を予測するニューラルネットワークを備える余寿命予測装置であって、前記ニューラルネットワークは、前記対象機器の時系列稼働データであるメンテナンスサイクルデータを含むラベルなしデータと、前記対象機器の故障発生までの時系列稼働データであるライフサイクルデータを含むラベルありデータとを取得し、前記メンテナンスサイクルデータにおける二点間の余寿命の差の予測誤差と、前記ライフサイクルデータにおける余寿命の予測誤差とを小さくするように、前記ニューラルネットワークの重みパラメータを更新する、ことで学習されている余寿命予測装置である。
【0090】
この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴うニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システムもまたこの開示の技術思想に含まれる。
【符号の説明】
【0091】
10 余寿命予測システム
11 プロセッサ
14 記憶装置
110 データ収集部
120 学習部
130 予測部
140 出力部
150 記憶部
200 特徴抽出器
300 予測層
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12