IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 方正株式会社の特許一覧

<>
  • 特許-学習処理装置、方法及びプログラム 図1
  • 特許-学習処理装置、方法及びプログラム 図2
  • 特許-学習処理装置、方法及びプログラム 図3
  • 特許-学習処理装置、方法及びプログラム 図4
  • 特許-学習処理装置、方法及びプログラム 図5
  • 特許-学習処理装置、方法及びプログラム 図6
  • 特許-学習処理装置、方法及びプログラム 図7
  • 特許-学習処理装置、方法及びプログラム 図8
  • 特許-学習処理装置、方法及びプログラム 図9
  • 特許-学習処理装置、方法及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-31
(45)【発行日】2023-02-08
(54)【発明の名称】学習処理装置、方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230201BHJP
   G06F 17/18 20060101ALI20230201BHJP
   G05B 23/02 20060101ALI20230201BHJP
【FI】
G06N20/00 130
G06F17/18 Z
G05B23/02 R
【請求項の数】 6
(21)【出願番号】P 2020179978
(22)【出願日】2020-10-27
(65)【公開番号】P2022070744
(43)【公開日】2022-05-13
【審査請求日】2021-10-04
(73)【特許権者】
【識別番号】515200940
【氏名又は名称】HOUSEI株式会社
(74)【代理人】
【識別番号】100176072
【弁理士】
【氏名又は名称】小林 功
(74)【代理人】
【識別番号】100169225
【弁理士】
【氏名又は名称】山野 明
(72)【発明者】
【氏名】若井 秀之
【審査官】杉浦 孝光
(56)【参考文献】
【文献】国際公開第2018/159169(WO,A1)
【文献】国際公開第2020/059099(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 17/18
G05B 23/02
(57)【特許請求の範囲】
【請求項1】
機器又は該機器を構成する部品である予測対象物の状態を示す状態値セットを取得する状態取得部と、
前記予測対象物の劣化度を正規化した値であるラベル値を付与又は補正するラベル算出部と、
前記状態取得部により取得された前記状態値セットと、前記ラベル算出部により付与又は補正された前記ラベル値と、からなる学習データの母集団である学習データセットを用いて、前記状態値セットを入力して前記ラベル値を出力する学習器に対して学習処理を行う学習処理部と、
を備え、
前記学習データセットには、同一の予測対象物から時系列的に取得された複数組の状態値セットと、前記ラベル算出部により付与された複数のラベル値と、からなる時系列的な学習データが含まれ、
前記ラベル算出部は、前記時系列的な学習データの中に、前記学習処理の際に算出される学習誤差が閾値よりも大きい学習データがある場合、ラベル値が増加するにつれて大きくなる補正量を元のラベル値にそれぞれ加算することで、前記時系列的な学習データにおける複数のラベル値を一括して補正する、学習処理装置。
【請求項2】
前記補正量は、前記複数のラベル値のうち最大値である学習データに関する学習誤差を前記最大値で除算して求められる補正係数を、前記元のラベル値に乗算した値である、
請求項に記載の学習処理装置。
【請求項3】
前記学習処理部により学習処理がなされた学習器を用いて、前記学習データセットに含まれる学習データの除外又は該学習データのラベル値の補正を行うか否かを判定するデータ判定部をさらに備える、
請求項1又は2に記載の学習処理装置。
【請求項4】
前記学習処理部は、前記ラベル算出部によりラベル値が補正された学習データセットを用いて、前記学習器に対する再学習又は追加学習を繰り返す、
請求項1~のいずれか1項に記載の学習処理装置。
【請求項5】
一又は複数のコンピュータが、
機器又は該機器を構成する部品である予測対象物の状態を示す状態値セットを取得する取得ステップと、
前記予測対象物の劣化度を正規化した値であるラベル値を付与又は補正する算出ステップと、
前記取得ステップで取得された前記状態値セットと、前記算出ステップで付与又は補正された前記ラベル値と、からなる学習データの母集団である学習データセットを用いて、前記状態値セットを入力して前記ラベル値を出力する学習器に対して学習処理を行う学習ステップと、
を実行し、
前記学習データセットには、同一の予測対象物から時系列的に取得された複数組の状態値セットと、前記算出ステップで付与された複数のラベル値と、からなる時系列的な学習データが含まれ、
前記算出ステップでは、前記時系列的な学習データの中に、前記学習処理の際に算出される学習誤差が閾値よりも大きい学習データがある場合、ラベル値が増加するにつれて大きくなる補正量を元のラベル値にそれぞれ加算することで、前記時系列的な学習データにおける複数のラベル値を一括して補正する、学習処理方法。
【請求項6】
一又は複数のコンピュータを、
機器又は該機器を構成する部品である予測対象物の状態を示す状態値セットを取得する状態取得手段、
前記予測対象物の劣化度を正規化した値であるラベル値を付与又は補正するラベル算出手段、
前記状態取得手段により取得された前記状態値セットと、前記ラベル算出手段により付与又は補正された前記ラベル値と、からなる学習データの母集団である学習データセットを用いて、前記状態値セットを入力して前記ラベル値を出力する学習器に対して学習処理を行う学習処理手段、
として機能させ、
前記学習データセットには、同一の予測対象物から時系列的に取得された複数組の状態値セットと、前記ラベル算出手段により付与された複数のラベル値と、からなる時系列的な学習データが含まれ、
前記ラベル算出手段は、前記時系列的な学習データの中に、前記学習処理の際に算出される学習誤差が閾値よりも大きい学習データがある場合、ラベル値が増加するにつれて大きくなる補正量を元のラベル値にそれぞれ加算することで、前記時系列的な学習データにおける複数のラベル値を一括して補正する、学習処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習処理装置、方法及びプログラムに関する。
【背景技術】
【0002】
近時、機器又は該機器を構成する部品(以下、「予測対象物」という)の劣化度あるいは新鮮度を、機械学習を利用して予測する技術が提案されている。この予測の際に、予測対象物の状態を示す状態値の集合体(以下、「状態値セット」という)を入力とし、劣化度又は新鮮度を示すラベル値を出力とする学習器が用いられる。
【0003】
特許文献1には、劣化加速実験を通じて、設備が正常から劣化に至るまでの一連の測定データを取得し、この一連の測定データから学習データを作成する劣化診断システムが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第2018/159169号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、予測精度が高い学習器を獲得すべく、様々な場所で設置された稼働中の機器からネットワークを通じて状態値セットを逐次収集し、より多くの学習データを蓄積することが望ましい。ところが、実際の運用では、システムの保全を優先し、故障が発生する前に機器が交換又は撤去される場合が多い。例えば、製造業者又は保守業者が、実体寿命よりも短い耐用期間(つまり、設定寿命)を設けておき、この設定寿命を経過した機器を新品に交換することがある。
【0006】
そうすると、実体寿命を全うすることなく稼働を終えた機器の場合には実際の劣化度又は新鮮度を特定できず、正しいラベル値を算出することが困難になる。一方、実体寿命を全うした機器の状態値セットのみを抽出して学習データを生成することも考えられるが、その分だけ収集可能な学習データが少なくなり、学習不足に起因する予測精度の低下を招いてしまう。また、何らかの理由により、設定寿命を経過する前に機器が交換又は撤去された場合についても同様である。
【0007】
本発明はこのような問題に鑑みてなされたものであり、その目的は、実体寿命又は設定寿命を迎えていない予測対象物から取得した状態値セットを用いる場合であっても、ラベル値の不確定性に起因する予測精度の低下を抑制可能な学習処理装置、方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0008】
本発明の第一態様における学習処理装置は、機器又は該機器を構成する部品である予測対象物の状態を示す状態値セットを取得する状態取得部と、前記予測対象物の劣化度又は新鮮度を示すラベル値を付与又は補正するラベル算出部と、前記状態取得部により取得された前記状態値セットと、前記ラベル算出部により付与又は補正された前記ラベル値と、からなる学習データの母集団である学習データセットを用いて、前記状態値セットを入力して前記ラベル値を出力する学習器に対して学習処理を行う学習処理部と、を備え、前記ラベル算出部は、同一の予測対象物から時系列的に取得された複数組の状態値セットに関して、該複数組の状態値セットにそれぞれ対応する複数のラベル値を一括して付与又は補正する。
【0009】
本発明の第二態様における学習処理装置では、前記ラベル値は、前記劣化度を正規化した値であり、前記ラベル算出部は、ラベル値が増加するにつれて大きくなる補正量を元のラベル値にそれぞれ加算することで、前記複数のラベル値を一括して補正する。
【0010】
本発明の第三態様における学習処理装置では、前記補正量は、前記複数のラベル値のうち最大値である学習データに関する学習誤差を前記最大値で除算して求められる補正係数を、前記元のラベル値に乗算した値である。
【0011】
本発明の第四態様における学習処理装置は、前記学習処理部により学習処理がなされた学習器を用いて、前記学習データセットに含まれる学習データの除外又は該学習データのラベル値の補正を行うか否かを判定するデータ判定部をさらに備える。
【0012】
本発明の第五態様における学習処理装置では、前記学習処理部は、前記ラベル算出部によりラベル値が補正された学習データセットを用いて、前記学習器に対する再学習又は追加学習を繰り返す。
【0013】
本発明の第六態様における学習処理方法では、一又は複数のコンピュータが、機器又は該機器を構成する部品である予測対象物の状態を示す状態値セットを取得する取得ステップと、前記予測対象物の劣化度又は新鮮度を示すラベル値を付与又は補正する算出ステップと、前記取得ステップで取得された前記状態値セットと、前記算出ステップで付与又は補正された前記ラベル値と、からなる学習データの母集団である学習データセットを用いて、前記状態値セットを入力して前記ラベル値を出力する学習器に対して学習処理を行う学習ステップと、を実行し、前記算出ステップでは、同一の予測対象物から時系列的に取得された複数組の状態値セットに関して、該複数組の状態値セットにそれぞれ対応する複数のラベル値を一括して付与又は補正する。
【0014】
本発明の第七態様における学習処理プログラムでは、一又は複数のコンピュータを、機器又は該機器を構成する部品である予測対象物の状態を示す状態値セットを取得する状態取得手段、前記予測対象物の劣化度又は新鮮度を示すラベル値を付与又は補正するラベル算出手段、前記状態取得手段により取得された前記状態値セットと、前記ラベル算出手段により付与又は補正された前記ラベル値と、からなる学習データの母集団である学習データセットを用いて、前記状態値セットを入力して前記ラベル値を出力する学習器に対して学習処理を行う学習処理手段、として機能させ、同一の予測対象物から時系列的に取得された複数組の状態値セットに関して、該複数組の状態値セットにそれぞれ対応する複数のラベル値を一括して付与又は補正する。
【発明の効果】
【0015】
本発明によれば、実体寿命又は設定寿命を迎えていない予測対象物から取得した状態値セットを用いる場合であっても、ラベル値の不確定性に起因する予測精度の低下を抑制することができる。
【図面の簡単な説明】
【0016】
図1】本発明の一実施形態における学習処理装置が組み込まれた機器診断システムの全体構成図である。
図2図1に示すプロセッサの機能ブロック図である。
図3】学習処理装置の動作に関するフローチャートである。
図4】IoTデータが有するデータ構造の一例を示す図である。
図5】複数組の状態値セットに対応するラベル値の付与方法の一例を示す図である。
図6図2の学習器が有するネットワーク構造の一例を示す図である。
図7】学習データの判定方法の一例を示す図である。
図8】複数組の状態値セットに対応するラベル値の補正方法の一例を示す図である。
図9】ラベル値の一括補正による予測精度の向上効果を示す第一のグラフである。
図10】ラベル値の一括補正による予測精度の向上効果を示す第二のグラフである。
【発明を実施するための形態】
【0017】
以下、添付図面を参照しながら本発明の実施形態について説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては可能な限り同一の符号を付して、重複する説明は省略する。
【0018】
[機器診断システム10の構成]
図1は、本発明の一実施形態における学習処理装置30が組み込まれた機器診断システム10の全体構成図である。機器診断システム10は、予測対象物の機器年齢を予測し、予測対象物の劣化度又は新鮮度を診断する機器診断サービスを提供可能に構成される。「予測対象物」とは、機器20又は機器20を構成する部品22であり、その用途は業務向けあるいは家庭向けのいずれであってもよい。「機器年齢」とは、機器20の稼働開始時点から故障時点までの状態を定量的に示した指標であり、この最大値が機器20の実体寿命に対応する。
【0019】
この機器診断システム10は、具体的には、一又は複数の機器20と、学習処理装置30と、年齢予測装置40と、を含んで構成される。機器20、学習処理装置30及び年齢予測装置40は、ネットワークNTを通じて相互に通信可能である。
【0020】
機器20は、複数の部品22を協働させて一連の動作を行うことで、様々な機能を実現する。機器20には、機器20又は部品22の状態を示す物理量を検出するセンサ24が内蔵又は外付けされる。機器20は、自身が生成した情報をIoT(Internet Of Things)データD1として外部に送信する。これにより、学習処理装置30又は年齢予測装置40は、各々の機器20からIoTデータD1を収集することができる。
【0021】
学習処理装置30は、各々の機器20から収集したIoTデータD1を用いて学習処理を実行し、学習器LN(図2及び図6)の演算規則を特定可能なモデルデータD2を生成するコンピュータである。この学習処理装置30は、通信I/F32と、プロセッサ34と、メモリ36と、記憶装置38と、を含んで構成される。
【0022】
通信I/F32は、外部装置に対して電気信号を送受信するインターフェースである。これにより、学習処理装置30は、IoTデータD1を機器20から受信可能であるとともに、自身が生成したモデルデータD2を年齢予測装置40に送信可能である。プロセッサ34は、CPU(Central Processing Unit)を含む汎用プロセッサであってもよいし、FPGA(Field Programmable Gate Array)、GPU(Graphics Processing Unit)を含む専用プロセッサであってもよい。
【0023】
メモリ36は、非一過性の記憶媒体であり、プロセッサ34が各構成要素を制御するのに必要なプログラム及びデータを記憶している。記憶装置38は、例えば、ハードディスクドライブ(HDD:Hard Disk Drive)やソリッドステートドライブ(SSD:Solid State Drive)を含む非一過性の記憶媒体である。
【0024】
年齢予測装置40は、学習処理装置30と概ね同様の装置構成を有するコンピュータである。年齢予測装置40は、学習処理装置30により提供されたモデルデータD2を取得することで、学習済みの学習器LNを構築する。そして、年齢予測装置40は、予測対象物である機器20からIoTデータD1を受信し、学習器LNを用いて予測対象物の機器年齢を予測する。
【0025】
図2は、図1に示すプロセッサ34の機能ブロック図である。プロセッサ34は、状態取得部50、ラベル算出部52、学習処理部54、データ判定部56、及び年齢予測部58として機能する。また、記憶装置38には、学習データセット60及び学習パラメータ群62が格納される。
【0026】
状態取得部50は、機器20又は該機器20を構成する部品22(つまり、予測対象物)の状態を示す状態値の集合体(以下、「状態値セット」という)を取得する。状態値の一例として、[1]予測対象物に関する測定量(例えば、電流、電圧、温度、光量など)、[2]外部環境に関する測定量(例えば、時刻、場所、外部の温湿度など)、[3]部品22を駆動する際の制御指令値、[4]機器20のログデータ(正常/異常のステータス情報など)が挙げられる。
【0027】
ラベル算出部52は、予測対象物の劣化度又は新鮮度を示すラベル値を付与又は補正する。ラベル算出部52は、同一の予測対象物から時系列的に取得された複数組の状態値セットに関して、該複数組の状態値セットにそれぞれ対応する複数のラベル値を一括して付与又は補正する。ここで、「付与」とは、ラベリングが未了である状態値セットに対してラベル値を新たに対応付けることを意味する。また、「補正」とは、ラベリングが既になされた状態値セットに対応するラベル値をより適切な値に変更することを意味する。
【0028】
第一に、ラベル算出部52は、キー状態値を所定の範囲で正規化することで各々のラベル値を付与してもよい。ここで、キー状態値は、機器年齢との間に相応の相関性を有する状態値であり、ラベル値の付与に用いられる。キー状態値の一例として、設定寿命の判断根拠となり得る各種パラメータ(具体的には、作動回数、稼働時間、設置日数など)が挙げられる。なお、キー状態値は、状態値セットに含まれてもよいが、学習への依存度が過度に高くならないように状態値セットから除外されることが望ましい。
【0029】
第二に、ラベル算出部52は、ラベル値が予測対象物の劣化度を正規化した値であり、かつ、複数組の学習データの中に学習誤差が大きい学習データがある場合、ラベル値が増加するにつれて大きくなる補正量を元のラベル値にそれぞれ加算することで、複数のラベル値を一括して補正してもよい。この補正量は、複数のラベル値のうち最大値である学習データに関する学習誤差を最大値で除算して求められる補正係数を、元のラベル値に乗算した値である。
【0030】
第三に、ラベル算出部52は、ラベル値が予測対象物の新鮮度を正規化した値であり、かつ、複数組の学習データの中に学習誤差が大きい学習データがある場合、ラベル値が増加するにつれて小さくなる補正量を元のラベル値にそれぞれ加算することで、複数のラベル値を一括して補正してもよい。この補正量は、複数のラベル値のうち最小値である学習データに関する学習誤差を最大値で除算して求められる補正係数を、元のラベル値に乗算した値である。
【0031】
学習処理部54は、学習器LNに対して様々な学習処理(ここでは、教師あり学習)を行うことで、学習パラメータ群62を構成する学習パラメータの各値を決定する。学習器LNは、状態値セットを入力してラベル値を出力する学習モデルからなる。学習処理部54は、ラベル算出部52によりラベル値が補正された学習データセット60を用いて、学習器LNに対する再学習又は追加学習を繰り返す。なお、この学習手法は、バッチ学習、ミニバッチ学習、オンライン学習のいずれにも適用し得る。
【0032】
データ判定部56は、学習処理部54により学習処理がなされた学習器LNを用いて、学習データセット60に含まれる学習データの除外又は該学習データのラベル値の補正を行うか否かを判定する。具体的には、データ判定部56は、判定対象の学習データに関する学習誤差(例えば、L1誤差、L2誤差)との間の閾値判定を行う。例えば、データ判定部56は、[1]学習誤差が第一閾値未満である場合には学習データをそのまま維持する、[2]学習誤差が第一閾値以上かつ第二閾値未満である場合には該当するラベル値を補正する、[3]学習誤差が第二閾値以上である場合には該当する学習データを削除する、との判定をそれぞれ行う。
【0033】
年齢予測部58は、学習処理がなされた学習器LNを用いて、予測対象物の劣化度又は新鮮度を予測する。劣化度の一例として機器年齢が、新鮮度の一例として残存耐用期間(Remaining Useful Life)がそれぞれ挙げられる。なお、年齢予測部58は、学習処理を行う学習処理装置30で実行されてもよいし、別の装置(具体的には、図1の年齢予測装置40)で実行されてもよい。
【0034】
学習データセット60は、状態値セットとラベル値から構成される学習データの集合体である。学習データは、[1]学習パラメータ群62の更新に用いられる「訓練用データ」、[2]学習パラメータ群62による汎化性能の評価に用いられる「検証用データ」、及び[3]学習がなされた学習器LNの予測性能の評価に用いられる「テスト用データ」の3種類に分類される。
【0035】
学習パラメータ群62は、学習器LNの演算に用いられる学習パラメータの集合体である。学習パラメータ群62は、学習時の更新対象である「可変パラメータ」と、学習時の更新対象でない「固定パラメータ」(いわゆるハイパーパラメータ)から構成される。可変パラメータの一例として、演算ユニットの活性化関数を記述する係数、演算ユニット間の結合強度などが挙げられる。固定パラメータの一例として、演算ユニットの個数、中間層の数、畳み込み演算のカーネルサイズなどが挙げられる。
【0036】
[学習処理装置30の動作]
この実施形態における学習処理装置30が組み込まれた機器診断システム10は、以上のように構成される。続いて、学習処理装置30による学習動作について、図3のフローチャート及び図4図10を参照しながら説明する。
【0037】
図3のステップSP10において、状態取得部50は、IoTデータD1に対して解析及び前処理を行うことで、予測対象物の状態を示す状態値の集合体(つまり、状態値セット)を取得する。
【0038】
図4は、IoTデータD1が有するデータ構造の一例を示す図である。このIoTデータD1は、機器20の識別情報である「機器ID」と、(N+1)個の状態値との間の対応関係を示すテーブル形式のデータである。(N+1)個の状態値は、1個の「キー状態値」(ここでは、機器20の作動回数)と、N個の「状態値セット」とに分類される。
【0039】
ステップSP12において、ラベル算出部52は、ステップSP10で取得された状態値セットに対応するラベル値を付与する。ここでは、ラベル算出部52は、同一の予測対象物から複数の時点で取得された複数組の状態値セットに対応するラベル値を一括して付与する。
【0040】
図5は、複数組の状態値セットに対応するラベル値の付与方法の一例を示す図である。グラフの横軸は作動回数(単位:回)を、グラフの縦軸は機器年齢(単位:歳)をそれぞれ示している。説明の便宜上、5個のプロットのみ表記しているが。状態値セットの組数は4組以下あるいは6組以上であってもよい。
【0041】
例えば、最後に取得された状態値セットに対応する作動回数がN回、つまり、作動回数の最大値が「N」であることを想定する。このNの値は、機器20を交換又は撤去した状況によっては、実体寿命に相当する場合もあるし、実体寿命より小さい場合もあり得る。ここでは、ラベル算出部52は、作動回数を[0,100]の範囲で正規化することで各々のラベル値を付与する。具体的には、作動回数が0である場合に「0」歳とし、作動回数がNである場合に「100」歳とする。
【0042】
図3のステップSP14において、プロセッサ34は、ステップSP10で取得された状態値セットと、ステップSP12で生成されたラベル値と、を対応付けた状態にて記憶装置38に記憶させる。新たな学習データの蓄積により、学習データセット60が更新される。
【0043】
ステップSP16において、学習処理部54は、学習器LNに対する学習処理の実行要否を確認する。学習処理の実行が必要でない場合(ステップSP16:NO)、ステップSP10に戻って、実行が必要になるまでの間、ステップSP10~SP16を順次繰り返す。一方、学習処理の実行が必要である場合(ステップSP16:YES)、次のステップSP18に進む。
【0044】
ステップSP18において、学習処理部54は、学習データセット60を用いて、学習器LNに対する学習処理を実行する。ここでは、学習データの組数が十分に蓄積されたことを契機として、新たな学習が行われる場合を想定する。
【0045】
図6は、図2の学習器LNが有するネットワーク構造の一例を示す図である。学習器LNは、入力層、中間層及び出力層からなる階層型ニューラルネットワークである。入力層は、N個の状態値を入力するためのN個の演算ユニットから構成される。中間層は、次元圧縮されたM(1<M<N)次元の特徴ベクトルを生成するためのM個の演算ユニットから構成される。出力層は、ラベル値を出力するための21個の演算ユニットから構成される。
【0046】
本図の例では、機器年齢が0~100歳の範囲を5歳おきに区分し、かつ、出力層ではソフトマックス関数を作用する。これにより、学習器LNは、0,5,10,・・・,95,100歳である確率をそれぞれ出力する。例えば、出力された確率分布のうち確率が最大であるラベル値が、機器年齢の予測値として求められる。
【0047】
なお、学習データのバッチ選択規則、損失項を含む目的関数の演算式、学習パラメータの更新則を含む学習アルゴリズムは、様々な手法が採用され得る。この学習処理を繰り返して実行した結果、所定の収束条件を満たす学習パラメータ群62が決定される。
【0048】
図3のステップSP20において、データ判定部56は、ステップSP18で学習処理がなされた学習器LNを用いて、学習データセット60に含まれる学習データの判定を行う。具体的には、データ判定部56は、状態値データから得られる「予測値」と、この状態値データに対応する「教示値」との学習誤差(ここでは、L1誤差)を評価する。
【0049】
図7は、学習データの判定方法の一例を示す図である。グラフの軸は、機器年齢(単位:歳)を示している。ここでは、ラベル値(あるいは、教示値)が100歳である場合を想定する。[条件A]学習誤差が15未満である場合、データ判定部56は、付与されたラベル値が妥当であるので、学習データをそのまま維持する旨の判定を行う。[条件B]学習誤差が15以上かつ30未満である場合、データ判定部56は、付与されたラベル値が妥当でないため、ラベル値を補正する旨の判定を行う。[条件C]学習誤差が30以上である場合、データ判定部56は、学習データ自体が不適切であるため、学習データを除外する旨の判定を行う。
【0050】
図3のステップSP22において、データ判定部56は、ステップSP20での判定結果に基づいて、変更が必要とされる学習データの有無を確認する。変更対象の学習データがない場合(ステップSP22:NO)、そのままフローチャートを終了する。一方、変更対象の学習データがある場合(ステップSP22:YES)、次のステップSP24に進む。
【0051】
ステップSP24において、データ判定部56は、記憶装置38に記憶されている学習データセット60を更新(「ラベル値を一括補正」又は「学習データを削除」)する旨の指示を行う。ここでは、ラベル算出部52は、同一の予測対象物から複数の時点で取得された複数組の状態値セットに対応するラベル値を一括して補正する。
【0052】
図8は、複数組の状態値セットに対応するラベル値の補正方法の一例を示す図である。グラフの横軸は補正前の年齢(単位:歳)を、グラフの縦軸は補正後の年齢(単位:歳)をそれぞれ示している。図5の場合と同様に、状態値セットの組数が5である。
【0053】
例えば、5個のラベル値のうちの最大値が100歳であり、対応する学習誤差が20歳であったとする。この場合、補正係数Cは、(100-20)/100=0.8と求められる。そして、元のラベル値に対して補正係数C=0.8を乗算することで、それぞれのラベル値が線形的に補正される。このように、特定のラベル値を一括で補正することで、時系列で取得された状態値セット同士の関係性が維持されやすくなる。
【0054】
その後、ステップSP18に戻って、学習データの変更が不要になるまで、ステップSP18~SP24を順次繰り返す。なお、学習処理部54は、ステップSP24で学習データが変更された後、学習パラメータ群62を初期化した上で、学習器LNに対して再学習を行ってもよい。あるいは、学習処理部54は、ステップSP24で変更された複数組の学習データのみを用いて、学習途中である学習器LNに対して追加学習を行ってもよい。
【0055】
図9は、ラベル値の一括補正による予測精度の向上効果を示す第一のグラフである。より詳しくは、図9(a)はラベル値の一括補正を行わない「比較例」を、図9(b)はラベル値の一括補正を行う「実施例」をそれぞれ示している。また、図5の場合と同様に、グラフの横軸は作動回数(単位:回)を、グラフの縦軸は機器年齢(単位:歳)をそれぞれ示している。
【0056】
ここでは、正常に寿命に達した機器20から全時系列のIoTデータD1を収集し、機器年齢をそれぞれ予測してグラフを作成した。なお、部品22を定期的に交換しながら機器20の稼働を継続しているので、機器年齢のグラフは微視的に変動する点に留意する。つまり、部品22の交換直前では機器年齢が高くなり、部品22の交換直後では機器年齢が低くなる傾向がある。
【0057】
図9(a)の「比較例」では、作動回数が少ない領域から中間領域にわたって、機器年齢が大局的に線形的に増加している。ところが、作動回数が多い領域(つまり、実体寿命に近い領域)では、機器年齢のクリッピング現象が発生するので、その分だけ予測精度が低下してしまう。その理由は、設定寿命(装置の交換時期)が実体寿命からマージンを差し引いて定められるので、そのマージン領域内での機器年齢の微妙な違いを予測できないからである。一方、図9(b)の「実施例」では、ラベル値の一括補正を通じて、上記したクリッピング現象が抑制されるので、作動回数の全領域(つまり、全範囲の機器年齢)を高精度に予測することができる。
【0058】
図10は、ラベル値の一括補正による予測精度の向上効果を示す第二のグラフである。より詳しくは、図9(a)はラベル値の一括補正を行わない「比較例」を、図9(b)はラベル値の一括補正を行う「実施例」をそれぞれ示している。ここでは、実体寿命を全うする前に何らかの理由で故障が発生した機器20から、全時系列のIoTデータD1を収集し、機器年齢をそれぞれ予測してグラフを作成した。
【0059】
図10(a)の「比較例」では、作動回数にかかわらず機器年齢が略一定であると予測されるため、機器20の状態変化の兆候を検出することが困難である。一方、図10(b)の「実施例」では、図9(b)の場合と同様に、作動回数と機器年齢の間の関係性を適切に表現できるため、機器20の状態変化の兆候を高精度に予測することができる。
【0060】
[実施形態のまとめ]
以上のように、この実施形態における学習処理装置30は、機器20又は該機器20を構成する部品22である予測対象物の状態を示す状態値セットを取得する状態取得部50と、予測対象物の劣化度又は新鮮度を示すラベル値を付与又は補正するラベル算出部52と、状態取得部50により取得された状態値セットと、ラベル算出部52により付与又は補正されたラベル値と、からなる学習データの母集団である学習データセット60を用いて、状態値セットを入力してラベル値を出力する学習器LNに対して学習処理を行う学習処理部54と、を備える。そして、ラベル算出部52は、同一の予測対象物から時系列的に取得された複数組の状態値セットに関して、該複数組の状態値セットにそれぞれ対応する複数のラベル値を一括して付与又は補正する。
【0061】
また、この実施形態における学習処理方法及びプログラムでは、一又は複数のコンピュータが、機器20又は該機器20を構成する部品22である予測対象物の状態を示す状態値セットを取得する取得ステップ(SP10)と、予測対象物の劣化度又は新鮮度を示すラベル値を付与又は補正する算出ステップ(SP12,SP24)と、取得された状態値セットと、付与又は補正されたラベル値と、からなる学習データの母集団である学習データセット60を用いて、状態値セットを入力してラベル値を出力する学習器LNに対して学習処理を行う学習ステップ(SP18)と、を実行する。そして、算出ステップ(SP24)では、同一の予測対象物から時系列的に取得された複数組の状態値セットに関して、該複数組の状態値セットにそれぞれ対応する複数のラベル値を一括して付与又は補正する。
【0062】
このように、同一の予測対象物から時系列的に取得された複数組の状態値セットに関して、該複数組の状態値セットにそれぞれ対応する複数のラベル値を一括して付与又は補正するので、複数組の状態値セット同士の相対的な関係性を保ったまま複数のラベル値が設定される。つまり、実際の劣化度又は新鮮度を特定できない場合には、一括的な付与又は補正を通じて、実体寿命の予測が反映された適正なラベル値を設定可能となる。これにより、実体寿命又は設定寿命を迎えていない予測対象物から取得した状態値セットを用いる場合であっても、ラベル値の不確定性に起因する予測精度の低下を抑制することができる。
【0063】
また、ラベル算出部52は、ラベル値が予測対象物の劣化度を正規化した値であり、かつ複数組の学習データの中に学習誤差が大きい学習データがある場合、ラベル値が増加するにつれて大きくなる補正量を元のラベル値にそれぞれ加算することで、複数のラベル値を一括して補正してもよい。
【0064】
また、補正量は、複数のラベル値のうち最大値である学習データに関する学習誤差を最大値で除算して求められる補正係数を、元のラベル値に乗算した値であってもよい。これにより、ラベル値が最大である学習データに関する学習誤差をより小さくことができる。
【0065】
また、学習処理装置30は、学習処理部54により学習処理がなされた学習器LNを用いて、学習データセット60に含まれる学習データの除外又は該学習データのラベル値の補正を行うか否かを判定するデータ判定部56をさらに備えてもよい。
【0066】
また、学習処理部54は、ラベル算出部52によりラベル値が補正された学習データセット60を用いて、学習器LNに対する再学習又は追加学習を繰り返してもよい。これにより、学習データのクレンジングが逐次的に行われ、学習器LNの予測精度が向上する。
【0067】
[変形例]
なお、本発明は、上記した実施形態に限定されるものではなく、この発明の主旨を逸脱しない範囲で自由に変更できることは勿論である。あるいは、技術的に矛盾が生じない範囲で各々の構成を任意に組み合わせてもよい。
【0068】
上記した実施形態では、学習処理装置30を単体のコンピュータとして図示しているが、これに代わって、学習処理装置30は、分散システムを構築するコンピュータ群であってもよい。また、学習処理装置30は、クラウド型のサーバ(いわゆる、クラウドサーバ)であってもよいし、オンプレミス型のサーバであってもよい。
【0069】
上記した実施形態では、階層型ニューラルネットワークを用いて学習器LN(図6参照)を構築したが、機械学習の手法はこれに限られない。例えば、サポートベクターマシン、ディシジョンツリー(一例として、ランダムフォレスト)、ブースティング法(一例として、勾配ブースティング法)を含む様々な手法を採用してもよい。
【0070】
上記した実施形態では、機器年齢を複数の区分又は度数(つまり、離散値)によって分類し、確率が最大値であるラベル値を機器年齢として計算する場合について説明したが、機器年齢の計算方法はこれに限られない。例えば、機器年齢は、度数と確率の積和(つまり、期待値)であってもよい。また、学習器LNの出力層に設けられる演算ユニットを一個に減らして、[0,1]などに正規化された機器年齢が、一個の連続値として出力されてもよい。
【符号の説明】
【0071】
10…機器診断システム、20…機器(予測対象物)、22…部品(予測対象物)、30…学習処理装置、50…状態取得部、52…ラベル算出部、54…学習処理部、56…データ判定部、60…学習データセット、LN…学習器

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10