(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024040716
(43)【公開日】2024-03-26
(54)【発明の名称】故障予測装置および故障予測方法
(51)【国際特許分類】
G06F 11/30 20060101AFI20240318BHJP
G06F 11/22 20060101ALI20240318BHJP
【FI】
G06F11/30 140H
G06F11/22 675E
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022145240
(22)【出願日】2022-09-13
(71)【出願人】
【識別番号】300050367
【氏名又は名称】株式会社日立ハイテクフィールディング
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール弁理士法人
(72)【発明者】
【氏名】王 植
(72)【発明者】
【氏名】新谷 寛
(72)【発明者】
【氏名】南谷 林太郎
(72)【発明者】
【氏名】箕輪 隆志
(72)【発明者】
【氏名】三城 多佳記
【テーマコード(参考)】
5B042
5B048
【Fターム(参考)】
5B042GA11
5B042JJ06
5B042KK13
5B042MA08
5B042MA14
5B042MC08
5B048AA11
5B048CC17
(57)【要約】
【課題】故障予測するためにモニタリングした稼働データにおいて、外気温、振動などの外因による一時的なデータ変動が発生した場合でも、予測精度の低下を抑制することが可能な故障予測技術を提供する。
【解決手段】故障予測装置は、電子機器に設けられた二つまたは二つ以上のコア半導体装置のコア毎の時系列の稼働データを入力する入力部と、コア毎の時系列の稼働データの同時点の値または統計量の差分を用い、電子機器の故障または故障予兆の有無を算出するデータ解析部と、電子機器の故障または故障予兆の有無を出力する出力部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
電子機器に設けられた二つまたは二つ以上のコア半導体装置のコア毎の時系列の稼働データを入力する入力部と、
前記コア毎の時系列の稼働データの同時点の値または統計量の差分を用い、前記電子機器の故障または故障予兆の有無を算出するデータ解析部と、
前記電子機器の故障または故障予兆の有無を出力する出力部と、を備える、
故障予測装置。
【請求項2】
請求項1に記載の故障予測装置において、
前記データ解析部は、前記コア毎の時系列の稼働データの同時点の値または統計量の差分を算出する機能を有する、故障予測装置。
【請求項3】
請求項1に記載の故障予測装置において、
前記入力部は、前記コア毎の時系列の稼働データの同時点の値または統計量の差分を算出する機能を有し、
前記差分の算出結果を前記データ解析部、もしくはログとして外部装置へ出力することを特徴とする故障予測装置。
【請求項4】
請求項1に記載の故障予測装置において、
前記データ解析部は、正常動作時の前記コア毎の時系列の稼働データの時間的に同時点の値または統計量の差分を基に、故障予測モデルを生成し、現時点から一定な期間内に故障が発生する確率を算出する機能を有することを特徴とする故障予測装置。
【請求項5】
請求項1に記載の故障予測装置において、
前記コア半導体装置が三つまたは三つ以上のコアを有す場合、前記データ解析部は、異なる二つのコア半導体装置ずつに対応する複数の前記コア毎の時系列の稼働データの値または統計量の差分を算出し、
前記データ解析部は、前記複数の前記コア毎の時系列の稼働データの値または統計量の差分により、複数の故障または故障予兆の有無を算出し、結果の比較により故障または故障の予兆が発生するコア半導体装置を特定する、故障予測装置。
【請求項6】
請求項1に記載の故障予測装置において、
前記データ解析部は複数の故障予測アルゴリズムと複数の前記コア毎の時系列稼働データの組み合わせによって、複数の故障予測モデルを生成し、複数の故障または故障予兆の有無の計算を行い、
前記出力部は、前記データ解析部に行われる複数の計算の内、少なくとも一つの計算によりコア半導体装置の故障または故障予兆が算出されたら、その結果を出力する、故障予測装置。
【請求項7】
電子機器に設けられた二つまたは二つ以上のコア半導体装置のコア毎の時系列の稼働データを入力し、
前記コア毎の時系列の稼働データの同時点の値または統計量の差分を用い、前記電子機器の故障または故障予兆の有無を算出し、
前記電子機器の故障または故障予兆の有無を出力する、故障予測方法。
【請求項8】
請求項7に記載の故障予測方法において、
正常動作時の前記コア毎の時系列の稼働データの時間的に同時点の値または統計量の差分を基に、故障予測モデルを生成し、現時点から一定な期間内に故障が発生する確率を算出する、故障予測方法。
【請求項9】
請求項7に記載の故障予測方法において、
複数の故障予測アルゴリズムと複数の前記コア毎の時系列の稼働データの組み合わせによって、複数の故障予測モデルを生成し、複数の故障または故障予兆の有無の計算を行い、
前記複数の計算の内、少なくとも一つの計算によりコア半導体装置の故障または故障予兆が算出されたら、その結果を出力する、故障予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、故障予測装置および故障予測方法に関し、特に、複数の半導体装置を有する電子機器に適用可能な故障予測装置および故障予測方法に関する。
【背景技術】
【0002】
インフラやIoT(Internet of Things)センサの長期安定稼働のため、制御処理やエッジ処理などに用いられる電子機器(電子装置)の心臓部である半導体装置(LSI:大規模半導体集積回路装置)の高精度な故障予測技術の開発が必要である。このような故障予測技術は、電子機器の稼働データをモニタリングして取得し、それを基に機械学習手法で故障または故障の予兆を検知することが一般的である。また、このような電子機器には、安全性および稼働効率を配慮し、マルチコア半導体装置を有することが一般的である。
【0003】
特開2015-184818号公報は、分布差異計算部と判定部を備えるサーバを開示している。このサーバは、端末装置に精度の低いモデルを適用することを回避するために、第1機種の端末装置(新世代のハードディスクドライブ)に、第2機種の端末装置(過去のハードディスクドライブ)の稼働データから計算される特徴量に基づき第2機種の端末装置の故障の発生可能性を予測するモデルを、適用可能か否か決定する。分布差異計算部は、第1機種の端末装置の稼働データから算出される特徴量の第1分布と、第2機種の端末装置の稼働データから算出される特徴量の第2分布との差異情報を計算する。判定部は、差異情報に応じて、モデルを第1機種の端末装置で適用可能かを判定する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示者らの検討によれば、制御処理やエッジ処理などに用いられる電子機器(電子装置)において、複数の半導体装置(マルチコア半導体装置)から取得したコア毎稼働データの適宜な組み合わせ、もしくは、データ処理による故障予測の精度の向上が期待されている。また、故障予測するためにモニタリングした稼働データにおいて、外気温、振動などの外因による一時的なデータ変動が発生し、それによる予測精度の低下が問題となり、それを解決する手段の開発が必要である。
【0006】
特開2015-184818号公報においては、第1機種の端末装置の稼働データから算出される特徴量の第1分布と、第2機種の端末装置の稼働データから算出される特徴量の第2分布とは、同じ時刻の稼働データではない。したがって、制御処理やエッジ処理などに用いられる電子機器(電子装置)において、同じ時刻の稼働データにおける外気温、振動などの外因による一時的なデータ変動ついては考慮されていないと考えられる。
【0007】
本開示の課題は、故障予測するためにモニタリングした稼働データにおいて、外気温、振動などの外因による一時的なデータ変動が発生した場合でも、予測精度の低下を抑制することが可能な故障予測技術を提供することにある。
【0008】
その他の課題と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
【課題を解決するための手段】
【0009】
本開示のうち代表的なものの概要を簡単に説明すれば下記の通りである。
【0010】
一実施の形態によれば、故障予測装置は、故障予測装置は、電子機器に設けられた二つまたは二つ以上のコア半導体装置のコア毎の時系列の稼働データを入力する入力部と、コア毎の時系列の稼働データの同時点の値または統計量の差分を用い、電子機器の故障または故障予兆の有無を算出するデータ解析部と、電子機器の故障または故障予兆の有無を出力する出力部と、を備える。
【0011】
外因によるデータ変動は、複数のコアに同時に現れるため、コア毎の稼働データの同時点の値または統計量の差分を取ることで、その外因の影響がキャンセルでき、故障予測精度が向上できる。
【発明の効果】
【0012】
上記一実施の形態に係る故障予測装置によれば、稼働データの同時点の値または統計量の差分を用いるので、外気温、振動などの外因による一時的なデータ変動が発生した場合でも、故障予測精度の低下を抑制して、故障予測精度を向上させることが可能である。
【図面の簡単な説明】
【0013】
【
図1】
図1は、実施形態1における故障予測装置の概念的構成例を示す図である。
【
図3】
図3は、稼働データ処理方法の一例を説明する図である。
【
図4】
図4は、実施形態2における故障予測装置の概念的構成例を示す図である。
【
図5】
図5は、実施形態1におけるデータ解析部の構成例を説明する図である。
【発明を実施するための形態】
【0014】
以下、実施形態について、図面を用いて説明する。ただし、以下の説明において、同一構成要素には同一符号を付し繰り返しの説明を省略することがある。なお、図面は説明をより明確にするため、実際の態様に比べ、模式的に表される場合があるが、あくまで一例であって、本発明の解釈を限定するものではない。
(実施形態1)
まず、実施形態1の故障予測装置および故障予測方法について、
図1を参照して詳細に説明する。
図1は、実施形態1における故障予測装置の概念的構成例を示す図である。
図2は、差分算出機能を説明する図である。
図3は、稼働データ処理方法の一例を説明する図である。
図5は、実施形態1におけるデータ解析部の構成例を説明する図である。
【0015】
図1には、故障予測装置10を含む電子機器1が示されている。電子機器1は、インフラやIoT(Internet of Things)センサの長期安定稼働のために設けられた、制御処理やエッジ処理などに用いられる電子機器(電子装置)である。電子機器1には、複数のコア(コア1(101)、コア2(102)、・・・、コアn(103))が設けられている。ここで、コア1(101)、コア2(102)、・・・、コアn(103)の各々は、半導体装置(LSI:大規模半導体集積回路装置)として構成されている。したがって、電子機器1は、複数のコア半導体装置(マルチコア半導体装置)で構成されている。
【0016】
複数のコア(101、102、103)のおのおのには、モニタリングプログラムMP1、MP2、MP3が稼働している。モニタリングプログラムMP1、MP2、MP3は、各コア(101、102、103)のコア毎の時系列の稼働データ1~n(121,122,123)を収集し、収集したコア毎の時系列の稼働データ1~n(121,122,123)を故障予測装置10へ送付する構成とされている。以下、コア毎の時系列の稼働データ1~n(121,122,123)を、単に、コア毎の稼働データ1~nという場合がある。
【0017】
モニタリングプログラムMP1、MP2、MP3は、同様なモニタリングプログラムとするのが好ましい。ここで、同様なモニタリングプログラムとは、同一の時刻または同時点に、同一のセンサなどのデータを稼働データとして取得して収集し、その収集した稼働データを故障予測装置10へ送付する機能を有するということである。各コアを構成する半導体装置が同一のデータ処理演算部を有する場合、同一のデータ処理演算部で実行されるモニタリングプログラムは同一のプログラムとするのが、プログラム開発時間の短縮および開発コストの低減の観点から、好ましい。各コアを構成する半導体装置のデータ処理演算部が異なる構成とされていた場合でも、各データ処理演算部で実行されるモニタリングプログラムが前述のような同様なモニタリングプログラムとされていればよい。
【0018】
故障予測装置10は、入力部13と、データ解析部14と、出力部15とを含む。故障予測装置10のデータ解析部14は、データ分析と故障予測とを実行する。故障予測装置10は、専用の半導体装置に形成された専用の故障予測回路としてのハードウエア回路(たとえば、入力回路13と、データ解析回路14と、出力回路15等)により構成できる。また、故障予測装置10は、故障予測用プログラム(例えば、入力プログラム13と、データ解析プログラム14と、出力プログラム15等)としてソフトウエハプログラムにより構成できる。この場合は、故障予測装置10は、故障予測用プログラムを実行する中央処理装置(CPU)や記憶装置などを含む半導体装置により構成できる。
【0019】
入力部13は、コア毎の稼働データ1~n(121,122,123)が入力される。
【0020】
データ解析部14は、入力部13に入力されたコア毎の時系列の稼働データ1~nの時間的に同時点の値または時間的に同時点の統計量の差分を算出する。また、データ解析部14は、算出された差分による故障予測を実行し、電子機器1の異常または異常予兆の有無を算出する。また、データ解析部14は、正常動作時のコア毎の時系列の稼働データ1~n(121,122,123)の時間的に同時点の値または統計量の差分を基に、故障予測モデルを生成し、現時点から一定な期間内に電子機器1において故障が発生する確率を算出する機能を有する。また、前記データ解析部14は、前記コア毎の時系列の稼働データ1~n(121,122,123)の値または統計量の差分により、複数の故障または故障予兆の有無を算出し、前記コア毎の時系列の稼働データ1~n(121,122,123)の値または統計量の差分の結果の比較により故障または故障の予兆が発生するコア半導体装置を特定することができる。
【0021】
出力部15は、データ解析部14により算出された電子機器1の異常または異常予兆の有無を出力する。電子機器1が表示装置を有する場合は、電子機器1は表示装置の表示領域に、異常または異常予兆の有無を表示する。電子機器1が通信回路を有する場合には、電子機器1は通信回路を介して電子機器1の管理者の管理装置や携帯端末装置等に、異常または異常予兆の有無を通報する。つまり、出力部15は、データ解析部14によって行われる複数の計算の内、少なくとも一つの計算により、少なくとも1つのコア半導体装置についての故障または故障予兆が算出されたら、その結果を出力するものである。
【0022】
本実施形態におけるコア毎の稼働データ1~n(121,122,123)は、複数のコア(101、102、103)に稼働するモニタリングプログラムMP1,MP2,MP3による収集される。モニタリング方法は自由であり、常時モニタリングが好ましいが、これに限らない。例えば、コア毎の稼働データ1~n(121,122,123)を、一定間隔ごとに取得する形でもよい。例えば、一定間隔として1時間ごとに、1分間の間、コア毎の稼働データ1~n(121,122,123)を取得するようにしてもよい。つまり、1時間ごとに、1分間の間、データ処理演算部を間欠的に動作させてモニタリングプログラムを実行さる。これにより、電子機器1や故障予測装置10の低消費電力化を図ることができる。
【0023】
本実施形態における複数のコア(101、102、103)に稼働するモニタリングプログラムMP1,MP2,MP3は、同様なモニタリングプログラムが好ましいが、これに限らない。データ解析に必要なデータが取得できれば、異なるモニタリングプログラムでもよい。モニタリングプログラムMP1,MP2,MP3は、少なくとも、データ解析に必要な同じデータ(たとえば、時間的に同時点の値または統計量の差分の演算が可能なデータ)を取得することが可能な機能を有していれば良い。
【0024】
入力部13は、データ解析部14へコア毎の稼働データ1~n(121,122,123)を入力する機能を有するが、これに限らない。場合によって、外部へデータを転送する機能、または一定な(または、所定の)データ処理機能を備えてもよい。
【0025】
図5は、実施形態1におけるデータ解析部14の構成を説明する図である。
図5に示すように、データ解析部14は、差分算出機能141と、故障予測モデル生成機能142と、故障確率算出機能143を有する。差分算出機能141と、故障予測モデル生成機能142と、故障確率算出機能143はハードウエア回路(たとえば、差分算出回路141と、故障予測モデル生成回路142と、故障確率算出回路143等)により構成できる。また、差分算出機能141と、故障予測モデル生成機能142と、故障確率算出機能143はソフトウエハプログラム(例えば、差分算出プログラム141と、故障予測モデル生成プログラム142と、故障確率算出プログラム143等)により構成できる。
【0026】
図2を用いて、差分算出機能141を説明する。
図2では、時間t1から時間tnまでの稼働データ1,2と差分とを示している。
図2において、横軸は時間であり、縦軸は特徴量として稼働データ1(121)、稼働データ2(122)、差分を示している。たとえは、時間taにおいて、稼働データ1(121)にはやや大きなデータの変化(D1)があり、稼働データ2(122)にはやや小さなデータの変化(D2)がある。ここで、稼働データ2(122)に生じたデータの変化(D2)が外気温、振動などの外因による現れた一時的なデータ変動であるものとする。したがって、この一時的なデータ変動は、データの変化(D1)にも含まれているので、データの変化(D1)からデータの変化(D2)を引いて差分データ(D3)を求めることにより、データの変化(D1)とデータの変化(D2)とに現れた一時的なデータ変動がキャンセルされたデータ(ここでは、差分データ(D3))を得ることができる。
【0027】
この様に、稼働データ1と稼働データ2との差分を計算することにより、故障予測するための稼働データにおいて、外気温、振動などの外因による現れた一時的なデータ変動がキャンセルできるので、故障予測精度が向上できる。
【0028】
差分算出機能141は、
図2に示すように、コアが二つある場合(コア1(101)とコア2(102))、コア1から取得した稼働データ1(121)とコア2から取得した稼働データ(122)の時系列値の同時点の差分を算出する差分算出方法を実行する機能または差分算出回路を有することを特徴とする。つまり、差分算出機能141は、稼働データのデータ分析を実行する機能または回路と見なすことも可能である。
【0029】
また、コアが二つ以上ある場合、二つずつペアを組み、それぞれ時系列値の差分を算出する。つまり、異なる二つのコア半導体装置ずつに対応する複数のコア毎の時系列の稼働データの値または統計量の差分を算出する。例えば、コアが三つある場合、コア1とコア2をペアとして、コア1の時系列の稼働データとコア2の時系列の稼働データを用いて差分算出方法によって差分1を算出する。そして、コア2とコア3をペアとして、コア2の時系列の稼働データとコア3の時系列の稼働データを用いて差分算出方法によって差分2を算出し、コア1とコア3をペアとして、コア1の時系列の稼働データとコア3の時系列の稼働データを用いて差分算出方法によって差分3を算出する。ここで、時系列値の差分を例として示しているが、これに限らない。
図3で説明するように、コア毎の時系列の稼働データの統計量の差分を算出してもよい。
【0030】
例えば、差分算出機能141は、
図3に示すように、X時間の時系列の稼働データ(稼働データ1(121)と稼働データ2(122))を、1時間ごとの一定間隔毎にグループに分け、各グループ内の稼働データの平均値(または分散など)の統計量を計算し、その統計量の同時点の差分を算出してもよい。つまり、「稼働データ1(121)の同時点の1時間の統計量(平均値):平均値1,平均値2,・・・、平均値n」と「稼働データ2(122)の同時点の1時間の統計量(平均値):平均値1,平均値2,・・・、平均値n」との差分(差分1,差分2,・・・、差分n)を算出する。例えば、差分1は、稼働データ1(121)の平均値1と稼働データ2(122)の平均値1と差分である。稼働データ1(121)の1時間毎の平均値と稼働データ2(122)の1時間毎の平均値と差分を取るので、計算に利用するデータ量を低減できるので、電子機器1や故障予測装置10の低消費電力化を図ることができる。また、故障予測装置10の規模を小さくできる。
【0031】
ここで、
図3に示す例では、X時間の時系列の稼働データを1時間ごとにグループ化して、間隔を設けているが、これに限らず任意な間隔(例えば、2時間ごとにグループ化、3時間ごとにグループ化)でもよい。
【0032】
故障予測モデル生成機能142は、差分算出機能141により算出された差分または差分の一部を用い、1または複数の機械学習アルゴリズムにより1または複数の故障予測モデルを生成することを特徴とする。 故障予測モデル生成機能142は、例えば、正常動作時のコア毎の時系列の稼働データ1~n(121,122,123)の時間的に同時点の値または統計量の差分を基に、故障予測モデルを生成する。つまり、故障予測モデル生成機能142は、機械学習アルゴリズムとしての故障予測アルゴリズムと複数のコア毎の時系列の稼働データ1~n(121,122,123)の組み合わせによって、複数の故障予測モデルを生成し、複数の故障または故障予兆の有無の計算を行う。故障予測モデル生成機能142は、また、差分のみを用いて故障予測モデルを生成することに限らない。故障予測モデル生成機能142は、例えば、差分と稼働データの任意な組み合わせを用いて故障予測モデルを生成してもよい。
【0033】
故障確率算出機能143は、複数のコア(101、102、103)から取得した直近の稼働データもしくは稼働データの差分を用い、故障予測モデルによって現時点から一定な期間内に故障が発生する確率を算出することを特徴とする。故障予測モデル生成機能142と故障確率算出機能143とは、故障予測を実行する機能または回路と見なすことも可能である。故障予測モデル生成機能142と故障確率算出機能143とは、コア毎の時系列の稼働データ1~n(121,122,123)の値または統計量の差分により、複数の故障または故障予兆の有無を算出し、コア毎の時系列の稼働データ1~n(121,122,123)の値または統計量の差分結果の比較により故障または故障の予兆が発生するコア半導体装置を特定することができる。
【0034】
なお、機械学習アルゴリズム、故障予測アルゴリズム、故障予測モデルの生成、故障予測モデルに基づく故障発生確率の算出、故障または故障予兆の有無の判断など自体は、当業者にとっては公知であり、公知の方法を利用できるので、ここではそれらの詳細な説明は省略する。
【0035】
この様に、稼働データ1と稼働データ2との差分を計算することにより、故障予測するための稼働データにおいて、外気温、振動などの外因による現れた一時的なデータ変動がキャンセルでき、故障予測精度が向上できる。
(実施形態2)
図4は、実施形態2における故障予測装置の概念的構成例を示す図である。
【0036】
実施形態1では、データ分析と故障予測をすべて電子機器1の内部に設けた故障予測装置10で実行する場合について説明した。本実施形態は、
図4を参照し、稼働データ(121,122,123)をログデータとして外部装置24へ転送し、データ分析と故障予測を外部装置24で実施する構成例である。
【0037】
図4に示すように、二つまたは二つ以上である複数のコア(コア1(101)、コア2(102)、・・・、コアn(103))を有する電子機器1aは、実施形態1と同様に、複数のコア(101、102、103)で稼働する同様なモニタリングプログラムMP1,MP2,MP3を有する。モニタリングプログラムMP1,MP2,MP3により収集したコア毎の時系列の稼働データ1~n(121,122,123)は、電子機器1aの内部に設けたデータ処理部23を介して、電子機器1aの外部に設けた外部装置24へログとして転送される。外部装置24は、コア毎の時系列の稼働データ1~n(121,122,123)を用いて、実施形態1で説明した故障予測装置10のデータ解析部14の実行するデータ分析と故障予測とを実施することを特徴とする。また、データ処理部23は、実施形態1で説明した故障予測装置10の入力部13に対応し、データ処理部23と外部装置24とが
図1の故障予測装置10に対応すると見なすことができる。
【0038】
データ処理部23は、コア毎の稼働データ1~n(121、122,123)を外部装置24へ転送する機能を有するが、これに限らない。例えば、データ処理部23には、必要に応じ、例えば、実施形態1において説明した差分算出方法を備える差分算出機能141が設けられてもよい。この場合、差分算出方法によって算出した差分(差分結果)をログとして、外部装置24へ転送することとする。算出した差分はデータ量が少ないので、外部装置24への転送は短時間であり、データ処理部23のデータ転送の電力および外部装置24の電力を削減できる。
【0039】
以上、本発明者によってなされた発明を実施例に基づき具体的に説明したが、本発明は、上記実施形態および実施例に限定されるものではなく、種々変更可能であることはいうまでもない。
【符号の説明】
【0040】
1:電子機器
10:故障予測装置
13:入力部13
14:データ解析部
15:出力部
101,102,103:コア(コア半導体装置)
121,122,123:コア毎の稼働データ1~n
141:差分算出機能
142:故障予測モデル生成機能
143:故障確率算出機能