(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-21
(45)【発行日】2024-11-29
(54)【発明の名称】学習装置、状態推論装置、状態監視システム、及び学習方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20241122BHJP
G06F 18/211 20230101ALI20241122BHJP
G06F 18/27 20230101ALI20241122BHJP
【FI】
G06N20/00
G06F18/211
G06F18/27
(21)【出願番号】P 2024556622
(86)(22)【出願日】2023-02-15
(86)【国際出願番号】 JP2023005086
【審査請求日】2024-09-25
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110003166
【氏名又は名称】弁理士法人山王内外特許事務所
(72)【発明者】
【氏名】太中 裕貴
(72)【発明者】
【氏名】脇本 浩司
(72)【発明者】
【氏名】中村 隆顕
(72)【発明者】
【氏名】植村 美優
【審査官】大倉 崚吾
(56)【参考文献】
【文献】特開2010-092355(JP,A)
【文献】特開2018-055424(JP,A)
【文献】特開2020-128975(JP,A)
【文献】米国特許出願公開第2011/0112998(US,A1)
【文献】特開2008-117381(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 18/00-18/40
(57)【特許請求の範囲】
【請求項1】
複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、前記複数の説明変数のうちの一つである第1の説明変数とに基づいて、前記学習データと前記第1の説明変数とにあてはまる第1の回帰モデルを構築する大域モデル構築部と、
前記複数の説明変数の中から第2の説明変数を選択する変数選択部であって、前記学習データのうち、前記大域モデル構築部により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、前記学習データから分離可能な第2の説明変数を選択する変数選択部と、
前記変数選択部により選択された第2の説明変数と、前記第1の説明変数とに基づいて、前記対象データが分離された後の学習データを用いて、当該学習データと前記第1の説明変数とにあてはまる第2の回帰モデルを構築する局所モデル構築部と、
を備えた学習装置。
【請求項2】
前記変数選択部は、
前記大域モデル構築部により構築された第1の回帰モデルに基づいて、前記学習データを、ばらついているとみなされる前記対象データと、ばらついていないとみなされる非対象データとに分類するフィルタ処理部と、
前記フィルタ処理部により分類された前記対象データ及び前記非対象データに基づいて、前記第1の説明変数が取り得る範囲のうちの所定範囲を選択する範囲選択部と、
前記範囲選択部により選択された所定範囲に含まれる学習データを用いて、前記第2の説明変数を選択する変数選択処理部と、
を備えたことを特徴とする請求項1記載の学習装置。
【請求項3】
前記フィルタ処理部は、
前記大域モデル構築部により構築された第1の回帰モデルに基づいて得られる予測線に対して設定される、当該予測線を中心とした所定の信頼区間の外側に位置する学習データを前記対象データとし、当該予測線を中心とした所定の信頼区間の内側に位置する学習データを前記非対象データとすることを特徴とする請求項2記載の学習装置。
【請求項4】
前記範囲選択部は、
前記フィルタ処理部により分類された前記対象データ及び前記非対象データが、前記第1の説明変数に対してどの程度の頻度で出現するかを示す確率分布を、前記対象データ及び前記非対象データ毎に算出する分布計算部と、
前記分布計算部により算出された前記対象データの確率分布と、前記分布計算部により算出された前記非対象データの確率分布との差分を算出し、当該算出した差分が所定値以上となる前記第1の説明変数の範囲を、前記所定範囲として選択する分布差比較部と、
を備えたことを特徴とする請求項2又は請求項3に記載の学習装置。
【請求項5】
前記分布差比較部は、
外部から受け付けた探索幅であって、前記第1の説明変数の範囲のうち、前記非対象データが存在する割合が比較的高いと想定される範囲を示す探索幅の中から、前記所定範囲を選択することを特徴とする請求項4記載の学習装置。
【請求項6】
前記変数選択処理部は、
前記範囲選択部により選択された所定範囲に含まれる学習データが、ある説明変数に対してどの程度の頻度で出現するかを示す確率分布を生成し、当該生成した確率分布において、前記学習データの数に対して前記対象データが占める割合が所定値以上となる第1の説明変数の範囲を第1の範囲とし、当該第1の範囲を除く第1の説明変数の範囲を第2の範囲としたとき、
当該第2の範囲に含まれる学習データのうち、前記非対象データが占める割合が所定値以上となるような説明変数を、前記第2の説明変数として選択することを特徴とする請求項2
又は請求項3に記載の学習装置。
【請求項7】
前記局所モデル構築部は、
前記変数選択部により選択された第2の説明変数と、前記第1の説明変数との組み合わせにより定められる領域のうち、ばらついているとみなされる前記対象データが出現した領域と、ばらついていないとみなされる非対象データが出現した領域とが示された画像を示すデータを生成する領域評価部と、
前記第1の説明変数と前記第2の説明変数との組み合わせにより定められる領域のうち、前記領域評価部により生成されたデータが示す画像に基づいて外部から指定された領域を受け付け、当該受け付けた領域に含まれる学習データを用いて、前記第2の回帰モデルを構築するモデル構築部と、
を備えたことを特徴とする請求項1から請求項
3のうちのいずれか1項に記載の学習装置。
【請求項8】
前記大域モデル構築部により構築された第1の回帰モデルに対する外部からの評価を受け付ける第1のモデル評価部と、
前記局所モデル構築部により構築された第2の回帰モデルに対する外部からの評価を受け付ける第2のモデル評価部と、
を備えたことを特徴とする請求項1から請求項
3のうちのいずれか1項に記載の学習装置。
【請求項9】
前記大域モデル構築部は、
前記第2のモデル評価部により受け付けられた評価が、所望の第2の回帰モデルが存在しないことを示すものである場合、前記学習データと、外部から指定された新たな第1の説明変数であって、前記複数の説明変数のうちの一つである新たな第1の説明変数とに基づいて、前記学習データと当該新たな第1の説明変数とにあてはまる第1の回帰モデルを再構築するモデル更新部を備える
ことを特徴とする請求項8記載の学習装置。
【請求項10】
複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、前記複数の説明変数のうちの一つである第1の説明変数とに基づいて、前記学習データと前記第1の説明変数とにあてはまる第1の回帰モデルを構築する大域モデル構築部と、
前記複数の説明変数の中から第2の説明変数を選択する変数選択部であって、前記学習データのうち、前記大域モデル構築部により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、前記学習データから分離可能な第2の説明変数を選択する変数選択部と、
前記変数選択部により選択された第2の説明変数と、前記第1の説明変数とに基づいて、前記対象データが分離された後の学習データを用いて、当該学習データと前記第1の説明変数とにあてはまる第2の回帰モデルを構築する局所モデル構築部と、を備えた学習装置の前記局所モデル構築部により構築された第2の回帰モデルと、
対象機器から取得された、前記学習データに対応するデータ及び前記第1の説明変数に対応するデータと、を用いて、前記対象機器の状態を推論する状態推論装置。
【請求項11】
外部から受け付けた補正値であって、前記第2の回帰モデルにおける回帰係数を補正するための補正値に基づいて、前記第2の回帰モデルにおける回帰係数を補正するフィードバック情報生成部を備えた
ことを特徴とする請求項10記載の状態推論装置。
【請求項12】
複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、前記複数の説明変数のうちの一つである第1の説明変数とに基づいて、前記学習データと前記第1の説明変数とにあてはまる第1の回帰モデルを構築する大域モデル構築部と、
前記複数の説明変数の中から第2の説明変数を選択する変数選択部であって、前記学習データのうち、前記大域モデル構築部により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、前記学習データから分離可能な第2の説明変数を選択する変数選択部と、
前記変数選択部により選択された第2の説明変数と、前記第1の説明変数とに基づいて、前記対象データが分離された後の学習データを用いて、当該学習データと前記第1の説明変数との間にあてはまる第2の回帰モデルを構築する局所モデル構築部と、を備えた学習装置と、
前記局所モデル構築部により構築された第2の回帰モデルと、対象機器から取得された、前記学習データに対応するデータ及び前記第1の説明変数に対応するデータと、を用いて、前記対象機器の状態を推論する状態推論装置と、
を備えた状態監視システム。
【請求項13】
学習装置による学習方法であって、
大域モデル構築部が、複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、前記複数の説明変数のうちの一つである第1の説明変数とに基づいて、前記学習データと前記第1の説明変数とにあてはまる第1の回帰モデルを構築するステップと、
前記複数の説明変数の中から第2の説明変数を選択するステップであって、変数選択部が、前記学習データのうち、前記大域モデル構築部により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、前記学習データから分離可能な第2の説明変数を選択するステップと、
局所モデル構築部が、前記変数選択部により選択された第2の説明変数と、前記第1の説明変数とに基づいて、前記対象データが分離された後の学習データを用いて、当該学習データと前記第1の説明変数との間にあてはまる第2の回帰モデルを構築するステップと、
を有する学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習装置、状態推論装置、状態監視システム、及び学習方法に関するものである。
【背景技術】
【0002】
製造業分野では、機械学習により学習された学習済みモデルを用いて、プラント及び回転機などの機器(以下、「対象機器」ともいう。)の異常検知が行われている。ここで、対象機器の異常とは、例えば対象機器の劣化である。一般に、対象機器からは、正常データを収集するよりも、異常データを収集する方が難しい。そこで、学習済みモデルの学習に際しては、学習装置は対象機器から収集された正常データのみを学習データとして用いて教師なし学習を行い、当該モデルを学習する場合が多い。この場合、対象機器の状態を推論する推論装置では、当該学習したモデルを用いて、対象機器の状態が正常状態からどの程度乖離しているかを表す異常度を算出する。このとき、推論装置では、異常度に対して異常と判定するための閾値が設定されており、算出した異常度が閾値を超えた場合に対象機器が異常であると判定する。このような異常検知技術に関連して、例えば非特許文献1及び非特許文献2には、線形回帰モデル及びガウス過程回帰モデルによる異常検知技術について記載されている。
【先行技術文献】
【非特許文献】
【0003】
【文献】井手 剛、“入門 機械学習による異常検知”、コロナ社、2019
【文献】井手 剛、“異常検知と変化検知”、コロナ社、2018
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記非特許文献1及び非特許文献2は、学習装置が学習する正常データにばらつきが生じない場合の異常検知技術について述べている。一方、プラント及び回転機などの対象機器は、一定の稼働条件(例えば、一定の運転パターン及び動作パターン)で稼働し続けている場合は少なく、さまざまな稼働条件で稼働する場合が多い。この場合、対象機器から収集される正常データは、当該稼働条件の違いによってばらつきが生じることがある。なお、対象機器の稼働条件は、例えば当該対象機器の稼働に必要な電力の電流値又は電圧値など、数十から数百に及ぶ多数の制御情報(パラメータ)で決定される。
【0005】
このように、正常データにばらつきが生じる場合に対し、上記非特許文献1及び非特許文献2に記載の異常検知技術を適用する場合、当該異常検知技術を適用した学習装置(計算機)によって所望の回帰モデルを学習することが考えられる。この場合、当該学習装置(以下、「従来装置」ともいう。)では、すべてのパターンを網羅するように正常データをクラスタリングし、その結果学習された回帰モデルを用いて、推論装置が異常検知を実施することになる。ここで、物理的な観点で見れば、異常検知に向いている対象機器の稼働条件は限定的であることが少なくない。例えば、回転機の異常検知においては、通電時に当該回転機から収集した正常データには、電流による電磁ノイズの影響が含まれることがある。したがって、この場合、従来装置は無通電時に当該回転機から収集した正常データに限定して分析(回帰モデルの構築及び評価)を行うのが望ましい。しかしながら、従来装置は、現状では上記のような分析を行うことが困難であり、その結果、回帰モデルの学習にかかる工数が増大するという問題があった。
【0006】
本開示は上記のような課題を解決するためになされたもので、ばらつきのある学習データを用いて対象機器の異常を検知するための回帰モデルを学習するに際し、学習にかかる工数を従来よりも削減可能な学習装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示に係る学習装置は、複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、複数の説明変数のうちの一つである第1の説明変数とに基づいて、学習データと第1の説明変数とにあてはまる第1の回帰モデルを構築する大域モデル構築部と、複数の説明変数の中から第2の説明変数を選択する変数選択部であって、学習データのうち、大域モデル構築部により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、学習データから分離可能な第2の説明変数を選択する変数選択部と、変数選択部により選択された第2の説明変数と、第1の説明変数とに基づいて、対象データが分離された後の学習データを用いて、当該学習データと第1の説明変数とにあてはまる第2の回帰モデルを構築する局所モデル構築部と、を備えたものである。
【発明の効果】
【0008】
本開示によれば、対象機器から収集されたばらつきのあるデータを用いて、当該対象機器の異常を検知するためのモデルを学習するに際し、学習にかかる工数を従来よりも削減可能となる。
【図面の簡単な説明】
【0009】
【
図1】実施の形態1に係る状態監視システムの構成例を示す図である。
【
図2】実施の形態1に係る学習装置の構成例を示す図である。
【
図3】実施の形態1における振動データ及び制御情報データの一例を示す図である。
【
図4】実施の形態1における大域的学習部(大域モデル構築部及びモデル評価部)の構成例を示す図である。
【
図5】実施の形態1における大域モデルの画像例を示す図である。
【
図6】実施の形態1における大域モデルの画像例を示す図である。
【
図7】実施の形態1におけるフィルタ処理部による分類処理の具体例を説明する図である。
【
図8】実施の形態1における局所的学習部(範囲選択部、局所モデル構築部及びモデル評価部)の構成例を示す図である。
【
図9】実施の形態1における分布計算部による処理の具体例を説明する図である。
【
図10】実施の形態1における第二変数選択処理部により生成される確率分布図の例を示す図である。
【
図11】実施の形態1における領域評価部により生成される振動データの分布図の例を示す図である。
【
図12】実施の形態1における画像出力部により生成される、予測誤差の算出結果を示す画像の例を示す図である。
【
図13】実施の形態1に係る学習装置の動作例を説明するためのフローチャートである。
【
図15】実施の形態1に係る状態推論装置の構成例を示す図である。
【
図16】実施の形態1に係る状態推論装置における評価部の構成例を示す図である。
【
図17】実施の形態1における画像出力部により生成される、比較結果を示す画像の例を示す図である。
【
図18】実施の形態1に係る状態推論装置の動作例を説明するためのフローチャートである。
【
図20】
図20Aは、従来装置において適切な回帰モデルを選択することの困難性を説明するための図であり、
図20Bは、従来装置において学習データ(正常データ)のばらつきを評価することの困難性を説明するための図である。
【発明を実施するための形態】
【0010】
以下、本開示の実施の形態について、図面を参照しながら詳細に説明する。
実施の形態1.
【0011】
図1は、実施の形態1に係る状態監視システム1000の構成例を示す図である。状態監視システム1000は、例えば
図1に示すように、記録部100と、学習データ記録部200と、学習装置300と、状態推論装置600とを含んで構成される。
【0012】
記録部100は、例えばHDD(Hard Disk Drive)及びSDD(Solid State Drive)などの記録媒体で構成される。記録部100は、学習装置300により構築された学習済みモデルを示すデータを記録する。
【0013】
学習データ記録部200は、例えばHDD(Hard Disk Drive)及びSDD(Solid State Drive)などの記録媒体で構成される。学習データ記録部200は、学習装置300が学習済みモデルを構築するために用いる学習データを記録する。
【0014】
学習装置300及び状態推論装置600は、それぞれ記録部100に接続可能に構成されている。また、学習装置300は、学習データ記録部200に接続可能に構成されている。
【0015】
学習装置300は、学習データ記録部200に記録されている学習データを用いて、プラント及び回転機などの機器(対象機器)の異常検知を行うための学習済みモデルを機械学習により構築する。学習装置300は、構築した学習済みモデルを示すデータを記録部100に記録させる。
【0016】
状態推論装置600は、学習装置300により記録部100に記録されたデータが示す学習済みモデルを用いて、対象機器の状態を推論することにより、当該対象機器の異常(例えば劣化)を検知する。
【0017】
また、状態監視システム1000は、例えば
図1に示すように、第一外部評価装置400と、第二外部評価装置500と、第三外部評価装置700とを含んで構成される。
【0018】
第一外部評価装置400及び第二外部評価装置500は、学習装置300に接続可能に構成されている。第一外部評価装置400及び第二外部評価装置500は、ユーザからの指示を学習装置300に送信したり、学習装置300による処理内容をユーザに提示するなど、学習装置300に対するインタフェースとしての役割を担う装置である。
【0019】
第三外部評価装置700は、状態推論装置600に接続可能に構成されている。第三外部評価装置700は、ユーザからの指示を状態推論装置600に送信したり、状態推論装置600による処理内容をユーザに提示するなど、状態推論装置600に対するインタフェースとしての役割を担う装置である。
【0020】
以下の説明では、説明の便宜上、まず学習装置300の詳細について説明し、次に状態推論装置600の詳細について説明する。
【0021】
<学習装置300>
図2は、実施の形態1に係る学習装置300の構成例を示す図である。学習装置300は、例えば
図2に示すように、大域的学習部301と、局所的学習部350と、中間記録部390とを含んで構成される。
【0022】
学習装置300は、任意の複数の説明変数(以下、「説明変数群」ともいう。)によって説明される目的変数を学習データとして、大域的学習部301による学習と、局所的学習部350による学習との二段階の機械学習を行うことにより、対象機器の異常を検知するための学習済みモデルを構築する。
【0023】
具体的には、まず、大域的学習部301は、対象機器に関する技能及び知識を有するユーザによって、説明変数群の中から選択された第1の説明変数を取得する。また、大域的学習部301は、当該取得した第1の説明変数によって説明される目的変数を学習データとして機械学習を行い、当該学習データと第1の説明変数との間にあてはまる学習済みモデルを構築する。また、大域的学習部301は、第一外部評価装置400を介して、ユーザから当該学習済みモデルに対する評価を得る。これにより、大域的学習部301は、物理的な観点からの妥当性を獲得した大局的な学習済みモデルを構築する。大域的学習部301は、当該構築した学習済みモデルを示すデータを中間記録部390に記録させる。
【0024】
次いで、局所的学習部350は、大域的学習部301により中間記録部390に記録されたデータが示す学習済みモデルを用いて、上述の学習データを、「ばらついている(ばらつきが大きい)とみなされるデータ」と「ばらついていない(ばらつきが小さい)とみなされるデータ」とに分類する。また、局所的学習部350は、上述の学習データから、「ばらついている(ばらつきが大きい)とみなされるデータ」を精度よく分離することが可能な説明変数であって、ユーザによって選択された第1の説明変数とは異なる第2の説明変数を、上述の説明変数群の中から探索する。なお、ここでは、「分離することが可能」もしくは「分離可能」とは、学習データから「ばらついている(ばらつきが大きい)とみなされるデータ」を完全に分離可能であることを意味するのではなく、前者から後者を大まかに分離可能であることを意味する。
【0025】
そして、局所的学習部350は、探索された第2の説明変数と、上述の第1の説明変数とに基づいて、「ばらついている(ばらつきが大きい)とみなされるデータ」が分離された後の学習データを用いて機械学習を行うことにより、当該分離後の学習データと、第1の説明変数との間にあてはまる局所的な学習済みモデルを構築する。ここで、局所的な学習済みモデルとは、物理的な観点から「ばらついている(ばらつきが大きい)とみなされるデータ」が分離された後の学習データを用いて学習されたモデルを意味する。
【0026】
ここで、学習装置300が学習に用いる学習データは、学習データ記録部200に記録されている。学習データ記録部200は、例えば
図2に示すように、振動DB210と、制御情報DB220とを備えている。
【0027】
振動DB210は、振動データを記録する。振動データは、例えば
図3の一番上のグラフに示すように、振動振幅値の時間変化を示すデータである。なお、振動データは、振動振幅値の特徴量の時間変化を示すデータであってもよい。その場合、振動振幅値の特徴量とは、例えば振動振幅値のRMS値などであればよい。なお、以下の説明では、振動データが振動振幅値のRMS値である場合を例に説明する。
【0028】
制御情報DB220は、説明変数である制御情報データを記録する。制御情報データは、例えば
図3の上から二番目から四番目のグラフに示すように、制御情報の時間変化を示すデータである。ここで、制御情報とは、対象機器の稼働条件を決定するパラメータであり、例えば対象機器が回転機である場合の回転数、当該回転機の駆動電力の電流値、及び、Accel/Decelなどである。
【0029】
なお、制御情報DB220に記録されている各制御情報データと、振動DB210に記録されている振動データとは、時間的に同期している。また、この場合、振動データは目的変数に相当し、各制御情報データは当該振動データを説明する説明変数に相当する。
【0030】
なお、以下の説明では、振動データが目的変数に相当し、各制御情報データが説明変数に相当する場合を例に説明するが、これはあくまで一例であり、目的変数及び説明変数は上記以外のデータであってもよい。また、以下の説明では、説明変数群を制御情報群ともいう。
【0031】
<大域的学習部301>
大域的学習部301は、例えば
図2に示すように、データ抽出部302と、説明変数取得部303と、大域モデル構築部304と、モデル評価部305とを含んで構成される。
【0032】
(説明変数取得部303)
まず、ユーザは、振動データを説明する説明変数群(制御情報群)の中から、任意の制御情報を選択し、当該選択した制御情報を第一外部評価装置400に入力する。ここでは、説明を分かり易くするため、ユーザは制御情報として「回転数」を選択したものとする。説明変数取得部303は、ユーザが第一外部評価装置400に入力した制御情報を、第1の説明変数x1として、第一外部評価装置400から取得する。また、説明変数取得部303は、当該取得した第1の説明変数x1を示すデータを、変数記述子D13として、データ抽出部302に出力する。
【0033】
(データ抽出部302)
データ抽出部302は、説明変数取得部303から変数記述子D13を取得する。データ抽出部302は、当該取得した変数記述子D13に該当する制御情報データを、学習データ記録部200内の制御情報DB220から取得する。ここでは、データ抽出部302は、変数記述子D13が「回転数」を示しているため、
図3の上から二番目に示す制御情報データを制御情報DB220から取得する。
【0034】
また、データ抽出部302は、学習データ記録部200内の振動DB210から振動データを取得する。そして、データ抽出部302は、当該取得した制御情報データ及び振動データを、学習用データD12として、大域モデル構築部304へ出力する。
【0035】
(大域モデル構築部304)
大域モデル構築部304は、複数の説明変数により説明可能な振動データと、外部から指定された説明変数であって、複数の説明変数のうちの一つである第1の説明変数x1とに基づいて、振動データと第1の説明変数x1とにあてはまる回帰モデルを学習する。大域モデル構築部304は、例えば
図4に示すように、モデル構築部311と、モデル更新部312とを含んで構成される。
【0036】
モデル構築部311は、データ抽出部302から学習用データD12を取得する。モデル構築部311は、当該取得した学習用データD12を用いて、教師なし学習による学習を行うことにより、回帰モデルを構築する。このとき、モデル構築部311は、学習用データD12に含まれる制御情報データ(回転数)を説明変数とし、学習用データD12に含まれる振動データ(振動振幅値のRMS値)を目的変数として、教師なし学習による学習を行う。なお、この場合の学習方法としては、線形回帰、多項式回帰、及びガウス過程回帰等の既知の学習方法を用いればよい。また、以下の説明では、ここで構築される回帰モデルを「大域モデル」ともいう。
【0037】
なお、大域モデルは、第1の説明変数x1(制御情報データ)を入力とし、目的変数(振動データ)を出力するモデルであるが、大域モデルでは、制御情報データと振動データとの間のおおまかな回帰の傾向が再現できればよい。そのため、モデル構築部311は、大域モデルの構築に際し、必ずしも学習用データD12に含まれるすべての制御情報データ及び振動データを用いる必要はない。例えば、モデル構築部311は、ユーザにより指定された任意の時間範囲に対応する制御情報データ及び振動データを用いて、大域モデルの構築を行ってもよい。
【0038】
モデル構築部311は、構築した大域モデルを示すデータ(以下、「大域モデルデータ」ともいう。)、及び、当該大域モデルの学習に用いた制御情報データ及び振動データを、データD18としてモデル更新部312に出力する。
【0039】
なお、モデル構築部311は、複数パターンの大域モデルを構築してもよい。その場合、モデル構築部311は、パターン毎の大域モデルデータと、その学習に用いた制御情報データ及び振動データとを、データD18としてモデル更新部312に出力する。
【0040】
モデル更新部312は、モデル構築部311からデータD18を取得する。また、モデル更新部312は、後述する局所的学習部350のモデル評価部355がデータD60を出力した場合、当該データD60をモデル評価部355から取得し、ユーザの指示に応じて大域モデルの更新(再構築)を行う。この場合の更新処理については後述する。
【0041】
モデル更新部312は、大域モデルを更新した場合、更新後の大域モデルを示すデータと、更新の際に用いた制御情報データ及び振動データとを合わせたデータを、データD14として、モデル評価部305に出力する。また、モデル更新部312は、上記モデル評価部355がデータD60を出力しておらず、大域モデルを更新しなかった場合、データD18をそのままデータD14として、モデル評価部305に出力する。
【0042】
(モデル評価部305)
モデル評価部305は、データD14に含まれるデータが示す大域モデルに対する外部(例えばユーザ)からの評価を受け付ける。モデル評価部305は、例えば
図4に示すように、画像出力部313と、モデル決定部314とを含んで構成される。
【0043】
画像出力部313は、モデル更新部312からデータD14を取得する。画像出力部313は、当該取得したデータD14に含まれる大域モデルデータに基づいて、当該データが示す大域モデルを画像化し、大域モデルの画像を示すデータ(以下、「大域モデル画像データ」ともいう。)を生成する。画像出力部313は、生成した大域モデル画像データを、データD15として、第一外部評価装置400に出力する。
【0044】
大域モデルの画像の例を
図5に示す。例えば
図5において、符号501は大域モデルにより得られる回帰式を示す曲線(予測線)であり、符号502は回帰式を示す曲線(予測線)に対して設定される信頼区間(例えば曲線501±5%)の境界を示している。
【0045】
なお、画像出力部313は、データD14に複数パターンの大域モデルデータが含まれている場合、各大域モデルデータに基づいて、例えば
図6のように、パターン毎の大域モデル画像データを生成し、生成した各大域モデル画像データを、データD15として、第一外部評価装置400に出力する。
【0046】
第一外部評価装置400は、画像出力部313からデータD15を取得する。第一外部評価装置400は、当該取得したデータD15に基づいて、大域モデルの画像をディスプレイなどの表示部(不図示)に1つ以上表示する。ユーザは、当該表示部に表示された大域モデルの画像が1つである場合、当該画像を確認し、物理的な観点から当該大域モデルが正しいと考えられるか否かを判定し、正しいと考えられる場合はその旨を示す判定結果を第一外部評価装置400に入力する。また、ユーザは、当該表示部に表示された大域モデルの画像が複数である場合、当該各画像を確認し、物理的な観点から正しいと考えられる大域モデルを選択し、選択結果を第一外部評価装置400に入力する。
【0047】
また、このとき、ユーザは、上記学習に用いた制御情報データ(ここでは回転数)の時系列上の時間範囲のうち、振動データのばらつきが比較的少ないと考えられる範囲、又は、振動データに対象機器の特性が反映されていると考えられる範囲を、探索幅Sとして指定し、第一外部評価装置400に入力する。ここで、探索幅Sとは、後述する局所的学習部350の範囲選択部352において、振動データのばらつきが少ない領域を探索する際に用いられる変数である。
【0048】
第一外部評価装置400は、ユーザによる上記判定結果又は上記選択結果を示すデータと、ユーザから入力された探索幅Sを示すデータとを合わせたデータを、データD16として、モデル決定部314へ出力する。
【0049】
なお、ユーザは、物理的な観点から正しいと考えられる大域モデルが存在しない場合、例えば以下の二つの動作のうちのいずれかを行えばよい。例えば、ユーザは、第一外部評価装置400を用いて、その時点で構築されている大域モデルを棄却し、最初に入力した制御変数(ここでは回転数)とは別の制御情報を第一外部評価装置400に入力する。そして、当該別の制御情報を、新たな第1の説明変数x1として説明変数取得部303に取得させ、以降は上記と同様の処理を経て、大域モデル構築部304に大域モデルを再構築させればよい。
【0050】
あるいは、ユーザは第1の説明変数x1をそのままとし、第一外部評価装置400を用いて、大域モデルの画像に基づいて、ばらついているとみなされるデータを振動データから除外し、その上で大域モデル構築部304に大域モデルを再構築させる。ユーザは、上記いずれかの動作を、物理的な観点から正しいと考えられる大域モデルが構築されるまで繰り返せばよい。
【0051】
モデル決定部314は、第一外部評価装置400からデータD16を取得する。モデル決定部314は、当該取得したデータD16に基づき、ユーザが物理的な観点から正しいと判定した大域モデルを示すデータ、又はユーザが物理的な観点から正しいモデルとして選択した大域モデルを示すデータを、データD17として中間記録部390へ記録させる。このデータD17が示すモデルが、上述した大局的な学習済みモデルに相当する。
【0052】
なお、その際、モデル決定部314は、データD16に含まれている上記探索幅Sを示すデータを範囲記述子とし、当該範囲記述子と、上記大域モデルの学習に用いられた制御情報データの識別子(例えば名称)とを、データD17に含めて中間記録部390へ記録させる。
【0053】
(中間記録部390)
中間記録部390は、データD17を記録する。すなわち、中間記録部390は、大局的な学習済みモデルに相当する大域モデルを示すデータ(大域モデルデータ)、制御情報データの識別子、及び、範囲記述子を記録する。
【0054】
<局所的学習部350>
局所的学習部350は、例えば
図2に示すように、第二変数選択部360と、局所モデル構築部354と、モデル評価部355とを含んで構成される。また、第二変数選択部360は、例えばフィルタ処理部351と、範囲選択部352と、第二変数選択処理部353とを含んで構成される。
【0055】
(フィルタ処理部351)
フィルタ処理部351は、中間記録部390に記録されているデータD17(大域モデルデータ、制御情報データの識別子、及び、範囲記述子)を大域的モデル記述子D51として取得する。
【0056】
また、フィルタ処理部351は、学習データ記録部200を参照し、振動DB210に記録されている振動データと、制御情報DB220に記録されている制御情報データのうちデータD17に含まれる制御情報データの識別子に該当するデータとを、データD52として取得する。
【0057】
そして、フィルタ処理部351は、当該取得した大域的モデル記述子D51及びデータD52に基づいて、データD52に含まれる振動データを、ばらついているとみなされるデータと、ばらついていないとみなされるデータとに分類(フィルタリング)し、分類した双方のデータにラベル付けを行う。
【0058】
例えば、フィルタ処理部351は、大域モデルに基づいて振動データのばらつき具合を判定し、振動データのうちばらついているとみなされるデータに対して「DataA」とのラベルを付し、振動データのうちばらついていないとみなされるデータに対して「DataB」とのラベルを付す。そして、フィルタ処理部351は、当該ラベルを付与した振動データと、上述の大域的モデル記述子D51と合わせたデータを、データD53として、範囲選択部352に出力する。
【0059】
フィルタ処理部351による分類処理の具体例を
図7に示す。例えば、
図7Aは、横軸に第1の説明変数x1(回転数)を取り、縦軸に振動データを取った場合の振動データ(RMS値)の分布図を示している。また、
図7Bは、中間記録部390に記録されているデータD17に含まれる大域モデルデータが示す大域モデルの画像を示している。また、
図7Cは、フィルタ処理部351による分類処理後の振動データの分布図である。
【0060】
例えば、フィルタ処理部351は、
図7Aと
図7Bとを重ね合わせ、
図7Aに示す振動データのうち、
図7Bの大域モデルにおける曲線(予測線)701に対して設定された信頼区間の外側に位置する振動データを、ばらついているとみなされるデータとし、それらのデータに「DataA」とのラベルを付す(
図7Cの下側の図)。また、フィルタ処理部351は、
図7Aに示す振動データのうち、上記信頼区間の内側に位置する振動データを、ばらついていないとみなされるデータとし、それらのデータに「DataB」とのラベルを付す(
図7Cの上側の図)。
【0061】
なお、以下の説明では、説明を分かり易くするため、フィルタ処理部351により、ばらついているとみなされたデータを単に「DataA」ともいい、ばらついていないとみなされたデータを単に「DataB」ともいう。また、これらのデータを合わせて「ラベル付きデータ」ともいう。
【0062】
(範囲選択部352)
範囲選択部352は、例えば
図8に示すように、分布計算部361と、分布差比較部362とを含んで構成される。
【0063】
分布計算部361は、フィルタ処理部351からデータD53を取得する。分布計算部361は、当該取得したデータD53に含まれるラベル付きデータに基づいて、DataAとDataBとの分布を解析する。具体的には、分布計算部361は、例えば
図9に示すように、第1の説明変数x1に対するDataAの確率分布pAとDataBの確率分布pBとをそれぞれ算出し、当該算出した確率分布を示すデータと、データD53とを、分布差比較部362に出力する。
【0064】
なお、
図9に示されている「探索幅」は、ユーザが第一外部評価装置400を介して入力した、上述の探索幅を示している。
図9の例では、探索幅は回転数が500~1000の間に設定されている。これは、回転数が500~1000の間であれば、振動データのばらつきが比較的小さいとユーザが判断したということを意味している。
【0065】
分布差比較部362は、分布計算部361から確率分布pA及びpBを示すデータと、データD53とを取得する。分布差比較部362は、当該取得した確率分布pA及びpBを示すデータに基づいて、確率分布pAと確率分布pBとの差分を取る。このとき、分布差比較部362は、差分が最も大きくなるような制御情報データ(回転数)の時系列上の範囲であって、確率分布pBが確率分布pAよりも大きい範囲を、データD53に含まれる範囲記述子が示す探索幅の中から選択する。
【0066】
具体的には、分布差比較部362は、分布計算部361から取得した確率分布pA及びpBに基づいて、それぞれの差分pB-pAを算出する。このとき、探索幅をSとすると、分布差比較部362は、探索幅Sの中から、pB|Ω-pA|Ω(ここでΩ=[a、a+S]、aは第1の説明変数x1の任意の値)が最大となる範囲Ωを選択し、選択した範囲Ωを新たな範囲記述子とする。そして、分布差比較部362は、当該新たな範囲記述子と、ラベル付きデータ(DataA及びDataB)と、大域的モデル記述子D51とを合わせたデータを、データD54として、第二変数選択処理部353に出力する。
【0067】
なお、ここでは、分布差比較部362が、pB|Ω-pA|Ωが最大となる範囲Ωを選択する例を説明したが、分布差比較部362はこれに限らず、例えばpB|Ω-pA|Ωが所定値以上となる範囲Ωを選択し、選択した範囲Ωを新たな範囲記述子としてもよい。
【0068】
(第二変数選択処理部353)
第二変数選択処理部353は、範囲選択部352からデータD54を取得する。そして、第二変数選択処理部353は、大域的学習部301における学習の際に、ユーザにより選ばれた第1の説明変数x1以外の説明変数(制御情報)であって、DataAとDataBとを精度よく分離することが可能な説明変数を、説明変数群の中から選択する。なお、以下の説明では、ここで選択される説明変数を「第2の説明変数x2」ともいう。
【0069】
例えば、第二変数選択処理部353は、
図10に示すような確率分布図を生成する。
図10において、横軸は、第1の説明変数x1以外のある説明変数であって、第2の説明変数x2の候補となる説明変数である。また、縦軸は、データD54に含まれる上述の範囲Ωに存在するDataA及びDataBの出現頻度を示している。
【0070】
このとき、第二変数選択処理部353は、第2の説明変数x2の候補となる説明変数を順次変えながら、以下の手順で説明変数を探索し、探索した説明変数を、第2の説明変数x2として選択する。
【0071】
(1)第二変数選択処理部353は、例えば
図10に示すような確率分布図において、横軸全体の長さを「100」としたとき、すべてのDataAのうち、DataAが占める割合が「100-ε」%以上(εは小さい正の整数)となる横軸の範囲をY(第1の範囲)とする。例えば、第二変数選択処理部353は、ε=5とし、すべてのDataAのうちの95%以上のDataAが含まれるような横軸の範囲をYとする。
【0072】
(2)次に、第二変数選択処理部353は、上記確率分布図の横軸において、範囲Yを除く範囲を範囲X(第2の範囲)とし、範囲Xに含まれるすべてのデータのうち、DataBが占める割合が所定値(例えば80%)以上となるような説明変数を探索する。そして、第二変数選択処理部353は、探索した説明変数を、第2の説明変数x2として選択する。なお、第二変数選択処理部353は、範囲Xに含まれるすべてのデータのうち、DataBが占める割合が所定値以上となるような説明変数を複数探索した場合、例えば範囲XにおいてDataBが占める割合が最も大きくなるような説明変数を、第2の説明変数x2として選択する。
【0073】
なお、第二変数選択処理部353は、上記探索に失敗した場合は、第2の説明変数x2の候補となる説明変数を順次変えながら、上記(1)及び(2)を繰り返す。そして、第二変数選択処理部353は、上記の手順により選択した第2の説明変数x2と、上述したデータD54とを合わせたデータを、データD56として局所モデル構築部354に出力する。
【0074】
この第2の説明変数x2は、大域的学習部301における学習の際に、ユーザが指定した第1の説明変数x1とは異なる変数であり、第1の説明変数x1と組み合わせることにより、DataAとDataBとを精度よく(正確に)分離できる可能性の高い変数である。
【0075】
(局所モデル構築部354)
局所モデル構築部354は、例えば
図8に示すように、領域評価部363と、モデル構築部364とを含んで構成される。
【0076】
(領域評価部363)
領域評価部363は、第二変数選択処理部353からデータD56を取得する。領域評価部363は、当該取得したデータD56に含まれる第2の説明変数x2と、第1の説明変数x1(ここでは回転数)とを用いて、例えば
図11に示すような振動データの分布図を生成する。
【0077】
この分布図は、例えば
図11に示すように、横軸に第1の説明変数x1(回転数)を取り、縦軸に第2の説明変数x2を取り、双方の変数の組み合わせにより定められる領域(以下、「組み合わせ領域」ともいう。)に振動データを表示した図であり、当該組み合わせ領域においてDataAとDataBとのそれぞれが出現した領域を示した図である。なお、
図11では、DataAをグレーのドットで示し、DataBを黒のドットで示している。
【0078】
このように、領域評価部363は、組み合わせ領域にDataAとDataBとを表示することにより、組み合わせ領域において、DataAが比較的多い領域と、DataAが比較的少ない領域(
図11では符号U1~U3で表示)とを明示することができる。領域評価部363は、生成した分布図を示すデータを、データD62として第二外部評価装置500へ出力する。
【0079】
第二外部評価装置500は、領域評価部363からデータD62を取得する。第二外部評価装置500は、当該取得したデータD62に基づいて、上記分布図の画像をディスプレイなどの表示部(不図示)に表示する。
【0080】
ユーザは、当該表示部に表示された分布図の画像を参照し、例えば
図11の領域U1~U3のような、上記組み合わせ領域のうちDataAが比較的少ない領域を選択し、選択した領域を第二外部評価装置500に入力する。このとき、ユーザは、例えば領域U1などのように、領域を1か所のみ選択してもよいし、例えば領域U1~U3などのように、領域を複数個所選択してもよい。第二外部評価装置500は、当該入力された領域を示すデータを、領域範囲データD63として、モデル構築部364へ出力する。
【0081】
モデル構築部364は、第二外部評価装置500から領域範囲データD63を取得する。また、モデル構築部364は、第二変数選択処理部353からデータD56を取得する。そして、モデル構築部364は、当該取得した領域範囲データD63及びデータD56に基づいて、例えば
図11の領域U1~U3に含まれる振動データを特定し、当該特定した振動データと、振動データに対応する制御情報データとを学習データとして教師なし学習を行い、回帰モデルを構築する。なお、以下の説明では、ここで構築される回帰モデルを「局所モデル」ともいう。局所モデルは、第1の説明変数x1(制御情報データ)を入力とし、目的変数(振動データ)を出力するモデルである。
【0082】
なお、モデル構築部364は、ユーザにより領域が複数選択された場合、当該選択された領域ごとに局所モデルを構築する。また、このとき、モデル構築部364は、大域的学習部301の大域モデル構築部304が用いた学習モデルと同様の学習モデルを用いる。ただし、両学習モデルは必ずしも同じモデルでなくともよい。
【0083】
モデル構築部364は、構築した局所モデルを示すデータ(以下、「局所モデルデータ」ともいう。)と、学習に用いた振動データ(DataA及びDataB)とを合わせたデータを、データD57としてモデル評価部355へ出力する。
【0084】
(モデル評価部355)
モデル評価部355は、データD57に含まれる局所モデルデータが示す局所モデルに対する外部(例えばユーザ)からの評価を受け付ける。モデル評価部355は、例えば
図8に示すように、予測誤差算出部365と、画像出力部366と、モデル決定部367とを含んで構成される。
【0085】
予測誤差算出部365は、モデル構築部364からデータD57を取得する。予測誤差算出部365は、当該取得したデータD57に基づいて、局所モデルの予測誤差を算出する。
【0086】
例えば、予測誤差算出部365は、データD57に含まれる局所モデルデータが示す局所モデルに、第1の説明変数x1(回転数)を入力し、このときに局所モデルから出力される振動データ(RMS値)が、本来出力されるべき振動データに対してどのくらい誤差があるかを算出する。このとき、予測誤差算出部365は、例えば平均絶対誤差率(MAPE:Mean Absolute Percentage Error)のような値で予測誤差を算出する。予測誤差算出部365は、当該予測誤差の算出に用いた第1の説明変数x1及び振動データと、当該算出した予測誤差を示すデータとを、画像出力部366に出力する。
【0087】
画像出力部366は、予測誤差算出部365から、第1の説明変数x1及び振動データと、予測誤差を示すデータとを取得する。そして、画像出力部366は、当該取得したデータに基づき、例えば
図12の右側に示すような、予測した結果が分かる画像を示すデータを領域ごとに生成する。そして、画像出力部366は、当該生成した画像を示すデータと、予測誤差を示すデータとを合わせたデータを、データD58として第二外部評価装置500に出力する。なお、
図12の右側に示す画像では、
図5に示した大域モデルの画像と同様に、局所モデルにより得られる回帰式を示す曲線(予測線)と、当該回帰式を示す曲線(予測線)に対して設定される信頼区間(例えば曲線±5%)の境界とが示されている。
【0088】
第二外部評価装置500は、画像出力部366からデータD58を取得する。第二外部評価装置500は、当該取得したデータD58に基づいて、例えば
図12の右側に示す画像をディスプレイなどの表示部(不図示)に表示する。ユーザは、当該表示部に表示された画像を参照し、局所モデルの中から最終的に記録部100に出力する局所モデルを決定し、決定した局所モデルの識別子を第二外部評価装置500に入力する。第二外部評価装置500は、当該入力された局所モデルの識別子を、データD59としてモデル決定部367に出力する。
【0089】
モデル決定部367は、第二外部評価装置500からデータD59を取得する。モデル決定部367は、当該取得したデータD59に基づき、ユーザが最終的に出力すると決定した局所モデルを示すデータを、データD61として記録部100に記録させる。
【0090】
また、このとき、モデル決定部367は、ユーザが出力すると決定した局所モデルを構築した際の制御情報(説明変数)の条件(以下、「制御条件」ともいう。)を示すデータ(以下、「制御条件データ」ともいう。)を、データD61に含めて記録部100に記録させる。ここで、制御条件とは、例えば第1の説明変数x1の種類(回転数など)、第2の説明変数x2の種類(回転数以外)、局所モデルを構築した際の学習データが存在した第1の説明変数x1の範囲及び第2の説明変数x2の範囲などをいう。
【0091】
なお、モデル決定部367は、ユーザが複数の局所モデルを出力対象とした場合、当該複数の局所モデルデータを記録部100に記録させる。また、この場合、モデル決定部367は、複数の局所モデル毎に、制御条件データを対応させて記録部100に記録させる。
【0092】
なお、ユーザは、上記表示部に表示された画像を参照したが、最終的に記録部100に出力する局所モデルを見出せなかった場合、例えばその旨を第二外部評価装置500に入力する。第二外部評価装置500は、出力する局所モデルが存在しなかった旨を示すデータを、データD59としてモデル決定部367に出力する。
【0093】
モデル決定部367は、データD59を取得すると、予測誤差算出部365からデータD57(局所モデルデータと、局所モデルの学習に用いた振動データ(DataA及びDataB)とを合わせたデータ)を取得し、当該取得したデータD57を、データD60として、大域的学習部301のモデル更新部312に出力する。
【0094】
モデル更新部312は、モデル決定部367からデータD60を取得する。モデル更新部312は、当該データD60を取得すると、第一外部評価装置400の表示部にデータD60の内容を表示させる。また、モデル更新部312は、大域モデルの更新処理(つまり作り直し)を行うようにユーザに指示する旨を第一外部評価装置400の表示部にさせる。
【0095】
この表示を受けて、ユーザは、大域モデルの構築の際に最初に選択した第1の説明変数x1とは別の説明変数を選択し直し、当該選択した新たな説明変数を第一外部評価装置400に入力する。以下、モデル更新部312は、上述したモデル構築部311と同様の方法で、大域モデルを更新(再構築)する。
【0096】
なお、ここでは、ユーザが、大域モデルの構築の際に最初に選択した第1の説明変数x1とは別の説明変数を選択し直して、大域モデルを更新(再構築)する例を説明したが、大域モデルの更新(再構築)の方法はこれに限られない。例えば、ユーザは、大域モデルの構築の際に最初に選択した第1の説明変数x1はそのままに、当該第1の説明変数x1の範囲を狭めるなど、当該第1の説明変数x1の範囲を最初の状態から変更させてもよい。この場合、モデル更新部312は、当該変更された範囲に含まれる学習データを用いて、大域モデルを更新(再構築)すればよい。
【0097】
また、モデル更新部312は、例えば大域モデルは更新せずに、第一外部評価装置400を介して、探索幅の入力のし直しをユーザに指示してもよい。この場合、ユーザは第一外部評価装置400を介して新たな探索幅を入力し、当該新たな探索幅が範囲記述子として中間記録部390に記録される。以下、この新たな範囲記述子に基づいて、第二変数選択処理部353により新たな第2の説明変数x2が選択され、局所的学習部350により局所モデルが再構築される。
【0098】
または、モデル更新部312は、大域モデルは更新せずに、第二外部評価装置500を介して、
図11に示す領域U1~U3の選択のし直しをユーザに指示してもよい。この場合、ユーザは第二外部評価装置500を介して新たな領域を入力し、当該新たな領域を示すデータが領域範囲データとしてモデル構築部364に送られる。以下、この新たな領域範囲データを用いて、モデル構築部364により局所モデルが再構築される。
【0099】
次に、実施の形態1に係る学習装置300の動作例について、
図13に示すフローチャートを参照しながら説明する。
【0100】
まず、説明変数取得部303は、ユーザが第一外部評価装置400に入力した制御情報を、第1の説明変数x1として、第一外部評価装置400から取得する(ステップST1)。説明変数取得部303は、当該取得した第1の説明変数x1を示すデータを、変数記述子D13として、データ抽出部302に出力する。
【0101】
次に、データ抽出部302は、当該取得した変数記述子D13に該当する制御情報データを、学習データ記録部200内の制御情報DB220から取得する。また、データ抽出部302は、学習データ記録部200内の振動DB210から学習データである振動データを取得する(ステップST2)。
【0102】
次に、モデル構築部311は、ステップST2で取得されたデータを用いて、大域モデルを構築する(ステップST3)。
【0103】
次に、画像出力部313は、大域モデル画像データを生成し、生成した大域モデル画像データを第一外部評価装置400に出力する(ステップST4)。第一外部評価装置400は、当該取得したデータに基づいて、大域モデルの画像をディスプレイなどの表示部に表示し、ユーザによる判定結果又は選択結果を受け付ける。第一外部評価装置400は、ユーザによる判定結果又は選択結果を示すデータをモデル決定部314に出力する。
【0104】
次に、モデル決定部314は、ユーザによる判定結果又は選択結果を示すデータを取得し、当該結果が、いずれかの大域モデルが選択されたことを示しているか否かを判定する(ステップST5)。その結果、当該結果が、いずれの大域モデルも選択されていないことを示している場合(ステップST5;No)、処理はステップST1へ戻り、説明変数取得部303は、第一外部評価装置400を介して、ユーザから新たな第1の説明変数x1を取得する。以下、ステップST2~ST5を繰り返す。
【0105】
一方、上記結果が、いずれかの大域モデルが選択されたことを示している場合(ステップST5;Yes)、処理はステップST6へ移り、フィルタ処理部351は、振動データを、ばらついているとみなされるデータ(DataA)と、ばらついていないとみなされるデータ(DataB)とに分類(フィルタリング)する(ステップST6)。
【0106】
次に、分布計算部361は、第1の説明変数x1に対するDataAの確率分布pAとDataBの確率分布pBとをそれぞれ算出する。また、分布差比較部362は、探索幅Sの中から、pB|Ω-pA|Ω(Ω=[a、a+S]、aは第1の説明変数x1の任意の値)が最大となる範囲Ωを選択する(ステップST7)。
【0107】
次に、第二変数選択処理部353は、第1の説明変数x1以外の説明変数であって、DataAとDataBとを精度よく分離することが可能な第2の説明変数x2を選択する(ステップST8)。
【0108】
次に、領域評価部363は、第1の説明変数x1と第2の説明変数x2との組み合わせにより定められる領域に振動データを表示した分布図を生成する。そして、モデル構築部364は、当該分布図に基づいてユーザによりなされた領域の選択を受け付ける(ステップST9)。
【0109】
次に、モデル構築部364は、ステップST9で選択された領域に含まれる振動データ及び制御情報データを用いて、局所モデルを構築する(ステップST10)。
【0110】
次に、予測誤差算出部365は、局所モデルの予測誤差を算出し、画像出力部366は、予測結果を示す画像データを生成し、第二外部評価装置500に出力する。第二外部評価装置500は、予測結果を示す画像を表示部に表示し、ユーザによる判定結果又は選択結果を受け付ける。第二外部評価装置500は、ユーザによる判定結果又は選択結果を示すデータをモデル決定部367に出力する。
【0111】
次に、モデル決定部367は、ユーザによる判定結果又は選択結果を示すデータを取得し、当該結果が、いずれかの局所モデルが選択されたことを示しているか否かを判定する(ステップST11)。その結果、当該結果が、いずれの局所モデルも選択されていないことを示している場合(ステップST11;No)、モデル更新部312は、第一外部評価装置400を介して、ユーザに新たな第1の説明変数x1の選択を指示する。その後、処理はステップS21へ移り、説明変数取得部303は、第一外部評価装置400を介して、ユーザから新たな第1の説明変数x1を取得する。以下、ステップST2~ST11を繰り返す。
【0112】
なお、
図13のフローチャートには示していないが、上記結果が、いずれの局所モデルも選択されていないことを示している場合(ステップST11;No)、モデル更新部312は、第一外部評価装置400を介して、ユーザに対し、第1の説明変数x1の範囲を狭めさせるなど、第1の説明変数x1の範囲を変更することを指示してもよい。モデル更新部312が、ユーザに対し、第1の説明変数x1の範囲の変更を指示した場合、処理はステップST2に戻ればよい。
【0113】
また、同様に、上記結果が、いずれの局所モデルも選択されていないことを示している場合(ステップST11;No)、モデル更新部312は、第一外部評価装置400を介して、ユーザに対し、探索幅の入力し直し、又は、領域U1~U3の選択のし直しを指示してもよい。モデル更新部312が、ユーザに対し、探索幅の入力し直しを指示した場合、処理はステップST7に戻り、領域U1~U3の選択のし直しを指示した場合、処理はステップST9に戻ればよい。
【0114】
一方、上記結果が、いずれかの局所モデルが選択されたことを示している場合(ステップST11;Yes)、処理はステップS32へ移り、モデル決定部367は、選択された局所モデルを示すデータを記録部100に記録させる(ステップST12)。また、モデル決定部367は、上記制御条件データを併せて記録部100に記録させる。
【0115】
実施の形態1に係る学習装置300は、以上のように構成されることにより、対象機器から収集されたばらつきのあるデータを用いて、当該対象機器の異常を検知するためのモデルを学習するに際し、学習にかかる工数を従来よりも削減可能となる。
【0116】
この点について補足すると、例えば、従来装置では、ばらつきのある正常データ(学習データ)について、すべてのパターンを網羅するように正常データをクラスタリングするが、物理的な観点で見れば、異常検知に向いている対象機器の稼働条件は限定的であることが少なくない。しかしながら、従来装置では、当該限定的な稼働条件のもとで収集された正常データを用いて学習を行うことは困難であり、その結果、回帰モデルの学習にかかる工数が増大するという問題があった。また、従来装置では、稼働条件を決定する制御情報(パラメータ)が多数に及ぶ場合、あるいは、それぞれの制御情報が連続値をとる場合、条件分けの方法が無数に考えられ、計算コストがかかるという問題があった。さらに、従来装置では、すべてのパターンを網羅するように正常データをクラスタリングすることにより、例えば
図20Aに示すように、いくつかの回帰モデルを構築できたとしても、これらの中から適切な回帰モデルを選択することは困難であった。また、従来装置では、どの回帰モデルを選択するかによって、正常データのばらつきの評価も異なってくることが想定される。したがって、従来装置では、例えば
図20Bに示すように、四角の枠内に存在する正常データが、真にばらつきのあるデータであるといえるかどうかを評価することも困難であった。
【0117】
この点、実施の形態1に係る学習装置300は、上記のように、まず大域モデル構築部304により、物理的な観点からの妥当性を獲得した大局的な学習済みモデル(大域モデル)を構築し、次に、第二変数選択部360により、ばらついているとみなされる対象データを、学習データから分離可能な第2の説明変数x2を選択し、局所モデル構築部354により、第2の説明変数x2と、第1の説明変数x1とに基づいて、対象データが分離された後の学習データを用いて、当該学習データと第1の説明変数x1との間にあてはまる回帰モデル(局所モデル)を構築する。このように、学習装置300では、ばらついているとみなされる対象データを、学習データから分離可能な第2の説明変数x2を選択することにより、対象機器の限定的な稼働条件を見出す可能性が高まり、従来装置よりも学習にかかる工数及び計算コストを削減可能となる。また、学習装置300では、ばらついているとみなされる対象データを、学習データから分離可能であるため、従来装置では困難であった、適切な回帰モデルの選択及び学習データのばらつきの評価が容易となるのに加え、推論精度の高い回帰モデルを構築することができる。
【0118】
次に、
図14を参照して、実施の形態1に係る学習装置300のハードウェア構成例を説明する。学習装置300における大域的学習部301及び局所的学習部350の各機能は、処理回路により実現される。処理回路は、
図14Aに示すように、専用のハードウェアであってもよいし、
図14Bに示すように、メモリ73に格納されるプログラムを実行するCPU(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、又はDSP(Digital Signal Processor)ともいう)72であってもよい。
【0119】
処理回路が専用のハードウェアである場合、処理回路71は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、又はこれらを組み合わせたものが該当する。大域的学習部301及び局所的学習部350の各部の機能それぞれを処理回路71で実現してもよいし、各部の機能をまとめて処理回路71で実現してもよい。
【0120】
処理回路がCPU72の場合、大域的学習部301及び局所的学習部350の機能は、ソフトウェア、ファームウェア、又はソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェア及びファームウェアはプログラムとして記述され、メモリ73に格納される。処理回路は、メモリ73に記録されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、学習装置300は、処理回路により実行されるときに、例えば
図13に示した各ステップが結果的に実行されることになるプログラムを格納するためのメモリを備える。また、これらのプログラムは、大域的学習部301及び局所的学習部350の手順及び方法をコンピュータに実行させるものであるともいえる。ここで、メモリ73としては、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(Electrically EPROM)等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、又はDVD(Digital Versatile Disc)等が該当する。
【0121】
なお、大域的学習部301及び局所的学習部350の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェア又はファームウェアで実現するようにしてもよい。例えば、大域的学習部301については専用のハードウェアとしての処理回路でその機能を実現し、局所的学習部350については処理回路がメモリ73に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。
【0122】
このように、処理回路は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせによって、上述の各機能を実現することができる。
【0123】
<状態推論装置600>
次に、実施の形態1に係る状態推論装置600について説明する。
図15は、実施の形態1に係る状態推論装置600の構成例を示す図である。状態推論装置600は、例えば
図15に示すように、取得部601と、データ選択部602と、評価部603と、フィードバック情報生成部604とを含んで構成される。
【0124】
状態推論装置600は、学習装置300により記録部100に記録されたデータ(局所モデルデータ)が示す局所モデルを用いて、対象機器の状態を推論することにより、当該対象機器の異常を検知する。なお、以下の説明では、対象機器の異常とは、対象機器の劣化であるものとする。
【0125】
(取得部601)
取得部601は、対象機器に付設された振動センサ50から振動データA1を取得する。この振動データA1は、対象機器に付設された振動センサ50により、当該対象機器から取得された、当該対象機器の振動振幅値の時間変化を示すデータである。なお、振動データA1は、振動振幅値の特徴量の時間変化を示すデータであってもよい。その場合、振動振幅値の特徴量とは、例えば振動振幅値のRMS値などであればよい。なお、以下の説明では、振動データが振動振幅値のRMS値である場合を例に説明する。
【0126】
また、取得部601は、制御情報記録機器60から制御情報データB1~Bnを取得する。ここで、制御情報データB1~Bnは、上述の
図3の上から二番目から四番目のグラフに示したように、制御情報の時間変化を示すデータであり、振動データと時間的に同期したデータである。また、nは制御情報の数である。ここで、制御情報とは、対象機器の稼働条件を決定するパラメータであり、例えば対象機器が回転機である場合の回転数、当該回転機の駆動電力の電流値などである。なお、制御情報記録機器60は、制御情報データB1~Bnを記録するための専用の機器である。
【0127】
取得部601は、当該取得した振動データA1と制御情報データB1~Bnとをまとめたデータを、データD1として、データ選択部602に出力する。
【0128】
(データ選択部602)
データ選択部602は、記録部100を参照し、記録部100から局所モデルデータMA1~MAnと制御条件データMB1~MBnとを取得する。ここで、nは局所モデルの数であり、局所モデルデータと制御条件データとは1対1に対応する。なお、ここでは、説明を分かり易くするため、n=1であるものとする。
【0129】
データ選択部602は、当該取得した制御条件データMB1が示す制御条件を満たす振動データ及び制御情報データを、上述のデータD1に含まれる振動データ及び制御情報データから抽出し、抽出した各データと、局所モデルデータMA1及び制御条件データMB1とをまとめたデータを、データD2として評価部603へ出力する。
【0130】
(評価部603)
評価部603は、例えば
図16に示すように、劣化度算出部631と、パラメータ調整部632と、画像出力部633とを含んで構成される。
【0131】
(劣化度算出部631)
劣化度算出部631は、データ選択部602からデータD2を取得する。劣化度算出部631は、当該取得したデータD2を解析して、対象機器の劣化度を算出する。具体的には、劣化度算出部631は、例えばデータD2に含まれる制御情報データB1の任意の値(例えば回転数=500)を、データD2に含まれる局所モデルデータMA1が示す局所モデルに入力する。局所モデルは、入力された値に基づいて、当該値に対応する振動データ(例えばRMS値=1.5)を出力する。
【0132】
そして、劣化度算出部631は、当該局所モデルから出力された振動データと、上記データD2に含まれる、上記任意の値に対応する振動データとを比較し、両者の誤差を算出する。そして、劣化度算出部631は、算出した誤差と、予め定められた閾値との比較により、対象機器の劣化度を算出する。なお、劣化度算出部631は、例えば平均絶対誤差率(MAPE)、又はT2ホテリングなどを用いて劣化度を算出できる。劣化度算出部631は、算出した劣化度を示すデータを、状態記述子として画像出力部633に出力する。
【0133】
(画像出力部633)
画像出力部633は、劣化度算出部631から状態記述子を取得する。また、画像出力部633は、データ選択部602から上記データD2を取得する。そして、画像出力部633は、当該取得した各データを用いて、例えば
図17に示すような比較画像を示すデータを生成する。
図17において、左側は局所モデルの構築の際に使用した振動データ(学習データ)の分布を示す画像であり、右側は実際に対象機器から取得した制御情報データB1を局所モデルに入力して得られた振動データの分布を示す画像である。このような画像により、ユーザは、実際に対象機器から取得した制御情報データB1を局所モデルに入力して得られた振動データの分布が、局所モデルの構築の際に使用した振動データ(学習データ)の分布からどの程度乖離しているかを容易に把握することができる。画像出力部633は、生成した比較画像を示すデータを、第三外部評価装置700へ出力する。
【0134】
第三外部評価装置700は、画像出力部633から比較画像を示すデータを取得する。第三外部評価装置700は、当該取得したデータに基づいて、
図17に示すような比較画像を表示部(不図示)に表示する。ユーザは、当該表示部に表示された比較画像を確認し、必要に応じて、第三外部評価装置700を用いてパラメータ調整を行う。
【0135】
例えば、
図17に示すように、上記双方の分布は、偶発的な原因によってわずかな差が生じることがある。この場合、劣化とは無関係な偶発的な原因によって生じるわずかな差により、劣化度が変化してしまう場合がある。例えば
図17の例では、実際には対象機器はさほど劣化していないにもかかわらず、「劣化度18%」と算出されている。そこで、ユーザは、このようなわずかな差を調整するためにパラメータ調整を行う。
【0136】
例えば、ユーザは、
図17の左側に示す局所モデルにより得られる予測線1701の位置と、当該予測線1701に対して設定された信頼区間の境界を示す線1702の位置とを調整する。この場合、ユーザは、例えば
図17の左右の分布図の差を目視で確認して各線の位置を調整するか、あるいは、左右の振動データの平均値同士の差を算出して各線の位置を調整する。
【0137】
または、ユーザは、
図17の左側に示す局所モデルにより得られる予測線1701と、当該予測線1701に対して設定された信頼区間の境界を示す線1702との間隔を調整する。この場合も、ユーザは、例えば
図17の左右の分布図における振動データのばらつきの比率を目視で確認して間隔を調整するか、あるいは、左右の振動データの標準偏差値の倍率をとることで間隔を調整する。
【0138】
第三外部評価装置700は、ユーザにより入力された調整内容を示すデータを、調整記述子D4として、パラメータ調整部632へ出力する。調整記述子D4には、調整対象の回帰モデルデータ、制御条件データ、モデル調整に必要なデータ(具体的には回帰係数の補正値)などが含まれる。特に、モデル調整に必要なデータのことをパラメータ調整子ともいう。また、調整記述子D4には、ユーザにより入力された、フィードバック情報生成部604へ調整記述子D4を出力するか否かを決定する判定子も含まれる。例えば、判定子が1であれば、フィードバック情報生成部604へ調整記述子D4を出力することを示し、判定子が0であれば、フィードバック情報生成部604へ調整記述子D4を出力しないことを示す。
【0139】
なお、調整記述子D4のうち、パラメータ調整子については、例えばユーザが
図17の左右の分布図を目視して調整する場合はユーザが入力するが、それ以外の場合(例えば、左右の振動データの平均値同士の差を算出して各線の位置を調整する場合)は、例えばパラメータ調整部632が自動で計算可能であるため、必ずしもユーザが入力する必要はない。
【0140】
(パラメータ調整部632)
パラメータ調整部632は、第三外部評価装置700から調整記述子D4を取得する。パラメータ調整部632は、当該取得した調整記述子D4を劣化度算出部631に出力するとともに、当該調整記述子D4に基づいて局所モデルの調整をする旨を劣化度算出部631に指示する。この指示を受け、劣化度算出部631は、局所モデルを調整し、当該調整後の局所モデルを用いて、上記の手順により劣化度を再度算出する。また、劣化度算出部631は、再度算出した劣化度を示すデータを、状態記述子として画像出力部633に出力する。以下、画像出力部633、第三外部評価装置700、及びパラメータ調整部632は、上述した処理を繰り返す。
【0141】
なお、パラメータ調整部632は、上記の繰り返しにおいて、第三外部評価装置700から調整記述子D4を取得しなくなると、画像出力部633に対し、最終的な劣化度の算出結果を第三外部評価装置700の表示部に表示させる旨を指示する。
【0142】
また、パラメータ調整部632は、上記取得した調整記述子D4に含まれる判定子の内容を確認する。パラメータ調整部632は、判定子の内容が、フィードバック情報生成部604へ調整記述子D4を出力することを示している場合、調整記述子D4をデータD5としてフィードバック情報生成部604へ出力する。一方、パラメータ調整部632は、判定子の内容が、フィードバック情報生成部604へ調整記述子D4を出力しないことを示している場合、調整記述子D4をフィードバック情報生成部604へ出力しない。
【0143】
(フィードバック情報生成部604)
フィードバック情報生成部604は、パラメータ調整部632からデータD5を取得する。フィードバック情報生成部604は、当該取得したデータD5に基づいて、フィードバック情報D6を生成し、当該生成したフィードバック情報D6を記録部100に記録させる。フィードバック情報D6には、調整記述子D4とほぼ同様に、調整対象の回帰モデルデータ、制御条件データ、モデル調整に必要なデータ(具体的には回帰係数の補正値)などが含まれる。なお、フィードバック情報生成部604は、既に記録部100に記録されている局所モデルデータMA1及び制御条件データMB1とは別の情報として、フィードバック情報D6を記録部100に記録させる。
【0144】
その後、ユーザは、記録部100に記録されたフィードバック情報D6を適宜局所モデルデータMA1及び制御条件データMB1に反映させてもよい。これにより、局所モデルデータMA1及び制御条件データMB1がフィードバック情報D6に基づいて更新されることになり、実際に対象機器から取得されるデータと、第2の回帰モデルを構築した際に用いた学習データとの間における、当該第2の回帰モデルの構築時点では分からないような差分(例えば、上述した偶発的な原因による差分)から生じる検知誤りの可能性を低減することができる。
【0145】
次に、実施の形態1に係る状態推論装置600の動作例について、
図18に示すフローチャートを参照しながら説明する。
【0146】
まず、取得部601は、対象機器に付設された振動センサ50から振動データを受信する。また、取得部601は、制御情報記録機器60から制御情報データを取得する(ステップST21)。
【0147】
次に、データ選択部602は、記録部100から局所モデルデータと制御条件データとを取得し、当該取得した制御条件データが示す制御条件を満たす振動データ及び制御情報データを、ステップST21で取得した振動データ及び制御情報データから抽出する(ステップST22)。
【0148】
次に、劣化度算出部631は、ステップST22で抽出されたデータを用いて、対象機器の劣化度を算出する(ステップST23)。
【0149】
次に、画像出力部633は、ステップST23での算出結果を用いて、例えば
図17に示すような比較画像を示すデータを生成する(ステップST24)。画像出力部633は、生成した比較画像を示すデータを、第三外部評価装置700へ出力する。
【0150】
次に、パラメータ調整部632は、第三外部評価装置700から調整記述子D4を取得したか否かを判定する(ステップST25)。その結果、パラメータ調整部632は、第三外部評価装置700から調整記述子D4を取得したと判定した場合(ステップST25;Yes)、パラメータ調整部632は、調整記述子D4を劣化度算出部631に出力するとともに、当該調整記述子D4に基づいて局所モデルの調整をする旨を劣化度算出部631に指示する。劣化度算出部631は、調整記述子D4に基づいて局所モデルを調整する(ステップST26)。その後、処理はステップST23に戻る。
【0151】
一方、パラメータ調整部632は、第三外部評価装置700から調整記述子D4を取得していないと判定した場合(ステップST25;No)、処理はステップST26へ遷移する。
【0152】
ステップST26において、パラメータ調整部632は、それまでに第三外部評価装置700から一度でも調整記述子D4を取得したか否かを判定する(ステップST26)。その結果、パラメータ調整部632は、それまでに第三外部評価装置700から一度でも調整記述子D4を取得していないと判定した場合(ステップST26;No)、処理はステップST29へ遷移する。
【0153】
一方、パラメータ調整部632は、それまでに第三外部評価装置700から一度でも調整記述子D4を取得したと判定した場合(ステップST26;Yes)、最後に取得した調整記述子D4に含まれる判定子の内容を確認する。そして、判定子の内容が、フィードバック情報生成部604へ調整記述子D4を出力することを示している場合、最後に取得した調整記述子D4をデータD5としてフィードバック情報生成部604へ出力する。
【0154】
フィードバック情報生成部604は、パラメータ調整部632から取得したデータD5に基づいて、フィードバック情報D6を生成し(ステップST27)、当該生成したフィードバック情報D6を記録部100に記録させる(ステップST28)。その後、処理はステップST29へ遷移する。
【0155】
ステップST29において、画像出力部633は、対象機器の劣化度の最終的な算出結果を示すデータを生成し、当該生成したデータを第三外部評価装置700へ出力することにより、対象機器の劣化度の最終的な算出結果を表示部に表示させる(ステップST29)。
【0156】
次に、
図19を参照して、実施の形態1に係る状態推論装置600のハードウェア構成例を説明する。状態推論装置600における取得部601、データ選択部602、評価部603、及びフィードバック情報生成部604の各機能は、処理回路により実現される。処理回路は、
図19Aに示すように、専用のハードウェアであってもよいし、
図19Bに示すように、メモリ83に格納されるプログラムを実行するCPU(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、又はDSP(Digital Signal Processor)ともいう)82であってもよい。
【0157】
処理回路が専用のハードウェアである場合、処理回路81は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、又はこれらを組み合わせたものが該当する。取得部601、データ選択部602、評価部603、及びフィードバック情報生成部604の各部の機能それぞれを処理回路81で実現してもよいし、各部の機能をまとめて処理回路81で実現してもよい。
【0158】
処理回路がCPU82の場合、取得部601、データ選択部602、評価部603、及びフィードバック情報生成部604の機能は、ソフトウェア、ファームウェア、又はソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェア及びファームウェアはプログラムとして記述され、メモリ83に格納される。処理回路は、メモリ83に記録されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、状態推論装置600は、処理回路により実行されるときに、例えば
図18に示した各ステップが結果的に実行されることになるプログラムを格納するためのメモリを備える。また、これらのプログラムは、取得部601、データ選択部602、評価部603、及びフィードバック情報生成部604の手順及び方法をコンピュータに実行させるものであるともいえる。ここで、メモリ83としては、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(Electrically EPROM)等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、又はDVD(Digital Versatile Disc)等が該当する。
【0159】
なお、取得部601、データ選択部602、評価部603、及びフィードバック情報生成部604の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェア又はファームウェアで実現するようにしてもよい。例えば、取得部601については専用のハードウェアとしての処理回路でその機能を実現し、データ選択部602、評価部603、及びフィードバック情報生成部604については処理回路がメモリ83に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。
【0160】
このように、処理回路は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせによって、上述の各機能を実現することができる。
【0161】
以上のように、実施の形態1によれば、学習装置300は、複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、複数の説明変数のうちの一つである第1の説明変数x1とに基づいて、学習データと第1の説明変数x1とにあてはまる第1の回帰モデル(大域モデル)を構築する大域モデル構築部304と、複数の説明変数の中から第2の説明変数x2を選択する第二変数選択部360であって、学習データのうち、大域モデル構築部304により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、学習データから分離可能な第2の説明変数x2を選択する第二変数選択部360と、第二変数選択部360により選択された第2の説明変数x2と、第1の説明変数x1とに基づいて、対象データが分離された後の学習データを用いて、当該学習データと第1の説明変数x1とにあてはまる第2の回帰モデル(局所モデル)を構築する局所モデル構築部354と、を備えた。これにより、実施の形態1に係る学習装置300は、対象機器から収集されたばらつきのあるデータを用いて、当該対象機器の異常を検知するためのモデルを学習するに際し、学習にかかる工数を従来よりも削減可能となる。
【0162】
また、第二変数選択部360は、大域モデル構築部304により構築された第1の回帰モデルに基づいて、学習データを、ばらついているとみなされる対象データ(DataA)と、ばらついていないとみなされる非対象データ(DataB)とに分類するフィルタ処理部351と、フィルタ処理部351により分類された対象データ及び非対象データに基づいて、第1の説明変数x1が取り得る範囲のうちの所定範囲を選択する範囲選択部352と、範囲選択部352により選択された所定範囲に含まれる学習データを用いて、第2の説明変数x2を選択する第二変数選択処理部353と、を備えた。これにより、実施の形態1に係る学習装置300は、第1の回帰モデルと学習データとに基づいて、第2の説明変数x2を適切に選択することができる。
【0163】
また、フィルタ処理部351は、大域モデル構築部304により構築された第1の回帰モデルに基づいて得られる予測線に対して設定される、当該予測線を中心とした所定の信頼区間の外側に位置する学習データを対象データとし、当該予測線を中心とした所定の信頼区間の内側に位置する学習データを非対象データとする。これにより、実施の形態1に係る学習装置300は、学習データを、ばらついているとみなされる対象データ(DataA)と、ばらついていないとみなされる非対象データ(DataB)とに容易に分類することができる。
【0164】
また、範囲選択部352は、フィルタ処理部351により分類された対象データ及び非対象データが、第1の説明変数x1に対してどの程度の頻度で出現するかを示す確率分布を、対象データ及び非対象データ毎に算出する分布計算部361と、分布計算部361により算出された対象データの確率分布と、分布計算部361により算出された非対象データの確率分布との差分を算出し、当該算出した差分が所定値以上となる第1の説明変数x1の範囲を、所定範囲として選択する分布差比較部362と、を備えた。これにより、実施の形態1に係る学習装置300は、第2の説明変数x2を選択するために用いられる第1の説明変数x1の所定範囲を容易に選択することができる。
【0165】
また、分布差比較部362は、外部から受け付けた探索幅Sであって、第1の説明変数x1の範囲のうち、非対象データが存在する割合が比較的高いと想定される範囲を示す探索幅Sの中から、所定範囲を選択する。これにより、実施の形態1に係る学習装置300は、外部から受け付けた探索幅Sに基づいて、第1の説明変数x1の所定範囲を適切に選択することができる。
【0166】
また、第二変数選択処理部353は、範囲選択部352により選択された所定範囲に含まれる学習データが、ある説明変数に対してどの程度の頻度で出現するかを示す確率分布を生成し、当該生成した確率分布において、学習データの数に対して対象データが占める割合が所定値以上となる第1の説明変数x1の範囲を第1の範囲Yとし、当該第1の範囲Yを除く第1の説明変数x1の範囲を第2の範囲Xとしたとき、当該第2の範囲Xに含まれる学習データのうち、非対象データが占める割合が所定値以上となるような説明変数を、第2の説明変数x2として選択する。これにより、実施の形態1に係る学習装置300は、第2の説明変数x2を適切かつ効率的に選択することができる。
【0167】
また、局所モデル構築部354は、第二変数選択部360により選択された第2の説明変数x2と、第1の説明変数x1との組み合わせにより定められる領域のうち、対象データが出現した領域と、非対象データが出現した領域とが示された画像を示すデータを生成する領域評価部363と、第1の説明変数x1と第2の説明変数x2との組み合わせにより定められる領域のうち、領域評価部363により生成されたデータが示す画像に基づいて外部から指定された領域を受け付け、当該受け付けた領域に含まれる学習データを用いて、第2の回帰モデルを構築するモデル構築部364と、を備えた。これにより、実施の形態1に係る学習装置300は、外部(例えばユーザ)の意向が反映された第2の回帰モデルを構築することができる。
【0168】
また、学習装置300は、大域モデル構築部304により構築された第1の回帰モデルに対する外部からの評価を受け付けるモデル評価部305と、局所モデル構築部354により構築された第2の回帰モデルに対する外部からの評価を受け付けるモデル評価部355と、を備えた。これにより、実施の形態1に係る学習装置300は、第1の回帰モデル及び第2の回帰モデルに対する外部(例えばユーザ)からの評価を得ることができる。
【0169】
また、大域モデル構築部304は、モデル評価部355により受け付けられた評価が、所望の第2の回帰モデルが存在しないことを示すものである場合、学習データと、外部から指定された新たな第1の説明変数x1であって、複数の説明変数のうちの一つである新たな第1の説明変数x1とに基づいて、学習データと当該新たな第1の説明変数x1とにあてはまる第1の回帰モデルを再構築するモデル更新部312を備える。これにより、実施の形態1に係る学習装置300は、所望の第2の回帰モデルが構築されなかった場合、第1の回帰モデルから再構築することができる。
【0170】
また、実施の形態1によれば、状態推論装置600は、複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、複数の説明変数のうちの一つである第1の説明変数x1とに基づいて、学習データと第1の説明変数x1とにあてはまる第1の回帰モデル(大域モデル)を構築する大域モデル構築部304と、複数の説明変数の中から第2の説明変数x2を選択する第二変数選択部360であって、学習データのうち、大域モデル構築部304により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、学習データから分離可能な第2の説明変数x2を選択する第二変数選択部360と、第二変数選択部360により選択された第2の説明変数x2と、第1の説明変数x1とに基づいて、対象データが分離された後の学習データを用いて、当該学習データと第1の説明変数x1とにあてはまる第2の回帰モデル(局所モデル)を構築する局所モデル構築部354と、を備えた学習装置300の局所モデル構築部354により構築された第2の回帰モデルと、対象機器から取得された、学習データに対応するデータ及び第1の説明変数に対応するデータと、を用いて、対象機器の状態を推論する。これにより、実施の形態1に係る状態推論装置600は、対象機器の状態を精度よく推論することができる。
【0171】
また、状態推論装置600は、外部から受け付けた補正値であって、第2の回帰モデルにおける回帰係数を補正するための補正値に基づいて、第2の回帰モデルにおける回帰係数を補正するフィードバック情報生成部604を備えた。これにより、実施の形態1に係る状態推論装置600は、実際に対象機器から取得されるデータと、第2の回帰モデルを構築した際に用いた学習データとの間における、構築時点では分からないような差分から生じる検知誤りの可能性を低減することができる。
【0172】
また、実施の形態1によれば、状態監視システム1000は、複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、複数の説明変数のうちの一つである第1の説明変数x1とに基づいて、学習データと第1の説明変数x1とにあてはまる第1の回帰モデル(大域モデル)を構築する大域モデル構築部304と、複数の説明変数の中から第2の説明変数x2を選択する第二変数選択部360であって、学習データのうち、大域モデル構築部304により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、学習データから分離可能な第2の説明変数x2を選択する第二変数選択部360と、第二変数選択部360により選択された第2の説明変数x2と、第1の説明変数x1とに基づいて、対象データが分離された後の学習データを用いて、当該学習データと第1の説明変数x1との間にあてはまる第2の回帰モデル(局所モデル)を構築する局所モデル構築部354と、を備えた学習装置300と、局所モデル構築部354により構築された第2の回帰モデルと、対象機器から取得された、学習データに対応するデータ及び第1の説明変数x1に対応するデータと、を用いて、対象機器の状態を推論する状態推論装置600と、を備えた。これにより、実施の形態1に係る状態監視システム1000は、対象機器から収集されたばらつきのあるデータを用いて、当該対象機器の異常を検知するためのモデルを学習するに際し、学習にかかる工数を従来よりも削減可能となるとともに、当該モデルを用いて、対象機器の状態を精度よく推論することができる。
【0173】
最後に、実施の形態1に係る学習装置300及び状態推論装置600の好適な適用例について説明する。実施の形態1に係る学習装置300は、例えば、鉄道車両に搭載された電動機の監視システムに用いられるのに適している。鉄道車両に搭載された電動機では、振動データと同時に、電動機のブレーキ情報、回転数情報、電流情報、及び電圧情報といった多数の制御情報が存在する。電動機の状態が反映される振動データを、制御情報を下に監視するシステムを構築する場合、ユーザの知見(例えば、振動と回転数とは密接に関係し、低速時に高周波の振動特徴が現れやすいといった知見)を活用するために、まず、大域モデル構築部304により、回転数を説明変数としたモデル(大域モデル)を構築する。次に、当該モデルの精度を向上させるために、ユーザによる回転数の領域の指定、及び、大域モデルからはずれたデータを除外しうる他の制御情報を活用した条件の絞り込みを経て、モデル(局所モデル)を構築する。これにより、監視システムでは、モデルの構築にユーザの知見を取り込み、劣化検知に必要がないと考えられる説明変数及び条件を用いたモデル構築及び評価の工程を減らし、モデルを効率的に構築することが可能となる。
【0174】
また、実施の形態1に係る状態推論装置600も、学習装置300と同様に、例えば、鉄道車両に搭載された電動機の監視システムに用いられるのに適している。例えば、実施の形態1に係る状態推論装置600にさらに警報装置を設け、対象機器に付設された振動センサ50から取得した振動データに基づき、当該対象機器が、監視対象として設定されたオブジェクトと同一のオブジェクトでないと状態推論装置600により判定された場合に、監視システムの使用者に警報を出力するように構成する。実施の形態1に係る状態推論装置600は、このようにして、監視システムに適用可能である。
【0175】
また、実施の形態1に係る状態監視システム1000も、学習装置300及び状態推論装置600と同様に、例えば鉄道車両に搭載された電動機の監視システムに用いられるのに適している。
【0176】
なお、本開示は、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。たとえば、上記の説明では、目的変数である学習データが振動データであり、当該目的変数を説明する説明変数が制御情報データである場合を例に挙げて説明した。しかしながら、目的変数である学習データ、及び説明変数は上記の例に限らず、説明変数が目的変数を説明するものであれば、任意の種類のデータであってもよい。
【0177】
また、上記の説明では、記録部100が学習装置300及び状態推論装置600とは別個に設けられている例を説明した。しかしながら、記録部100はこれに限らず、例えば学習装置300及び状態推論装置600のうちのいずれか一方に内蔵されていてもよい。
あるいは、記録部100は、第一外部評価装置400、第二外部評価装置500、及び第三外部評価装置700のうちのいずれか1つに内蔵されていてもよい。
【0178】
また、上記の説明では、第一外部評価装置400、第二外部評価装置500、及び第三外部評価装置700がそれぞれ別個に設けられている例を説明した。しかしながら、当該各装置はこれに限らず、当該各装置の機能がいずれか1つの装置に集約されていてもよいし、いずれか2つの装置の機能が1つの装置に集約されていてもよい。
【符号の説明】
【0179】
50 振動センサ、60 制御情報記録機器、71 処理回路、72 CPU、73 メモリ、81 処理回路、82 CPU、83 メモリ、100 記録部、200 学習データ記録部、300 学習装置、301 大域的学習部、302 データ抽出部、303 説明変数取得部、304 大域モデル構築部、305 モデル評価部(第1のモデル評価部)、311 モデル構築部、312 モデル更新部、313 画像出力部、314 モデル決定部、350 局所的学習部、351 フィルタ処理部、352 範囲選択部、353 第二変数選択処理部(変数選択処理部)、354 局所モデル構築部、355 モデル評価部(第2のモデル評価部)、360 第二変数選択部(変数選択部)、361 分布計算部、362 分布差比較部、363 領域評価部、364 モデル構築部、365 予測誤差算出部、366 画像出力部、367 モデル決定部、390 中間記録部、400 第一外部評価装置、500 第二外部評価装置、501 予測線、502 信頼区間の境界を示す線、600 状態推論装置、601 取得部、602 データ選択部、603 評価部、604 フィードバック情報生成部、631 劣化度算出部、632 パラメータ調整部、633 画像出力部、700 第三外部評価装置、1000 状態監視システム、1701 予測線、1702 信頼区間の境界を示す線、A1 振動データ、B1 制御情報データ、210 振動DB、220 制御情報DB、U1 領域、U2 領域、U3 領域。
【要約】
学習装置(300)は、複数の説明変数により説明可能な学習データと、外部から指定された説明変数であって、複数の説明変数のうちの一つである第1の説明変数(x1)とに基づいて、学習データと第1の説明変数とにあてはまる第1の回帰モデル(大域モデル)を構築する大域モデル構築部(304)と、複数の説明変数の中から第2の説明変数(x2)を選択する変数選択部(360)であって、学習データのうち、大域モデル構築部により構築された第1の回帰モデルに基づいてばらついているとみなされる対象データを、学習データから分離可能な第2の説明変数を選択する変数選択部と、変数選択部により選択された第2の説明変数と、第1の説明変数とに基づいて、対象データが分離された後の学習データを用いて、当該学習データと第1の説明変数とにあてはまる第2の回帰モデル(局所モデル)を構築する局所モデル構築部(354)と、を備えた。