(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-04-10
(45)【発行日】2025-04-18
(54)【発明の名称】学習装置、推論装置、断線位置特定システム、学習方法、推論方法、および、プログラム
(51)【国際特許分類】
G01R 31/08 20200101AFI20250411BHJP
G01R 31/58 20200101ALI20250411BHJP
G01R 31/54 20200101ALI20250411BHJP
【FI】
G01R31/08
G01R31/58
G01R31/54
(21)【出願番号】P 2024564990
(86)(22)【出願日】2024-07-10
(86)【国際出願番号】 JP2024024988
【審査請求日】2024-11-01
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】100095407
【氏名又は名称】木村 満
(74)【代理人】
【識別番号】100131152
【氏名又は名称】八島 耕司
(74)【代理人】
【識別番号】100147924
【氏名又は名称】美恵 英樹
(74)【代理人】
【識別番号】100148149
【氏名又は名称】渡邉 幸男
(74)【代理人】
【識別番号】100181618
【氏名又は名称】宮脇 良平
(74)【代理人】
【識別番号】100174388
【氏名又は名称】龍竹 史朗
(72)【発明者】
【氏名】名女松 諭
(72)【発明者】
【氏名】塩野谷 浩生
(72)【発明者】
【氏名】後田 太樹
【審査官】小川 浩史
(56)【参考文献】
【文献】特開2022-129353(JP,A)
【文献】特開2021-148778(JP,A)
【文献】中国特許出願公開第105912792(CN,A)
【文献】特開2023-44616(JP,A)
【文献】中国特許出願公開第112255500(CN,A)
【文献】特表2009-534650(JP,A)
【文献】米国特許出願公開第2022/0021207(US,A1)
【文献】特開2015-62010(JP,A)
【文献】楠和浩,産業用イーサネット入門,CQ出版株式会社,2009年05月01日,pp. 211-220,ISBN: 978-4-7898-4086-6
【文献】名女松諭;角尾光宏;安味大輔,“リモートIO-Linkユニット”,三菱電機技報,三菱電機エンジニアリング株式会社,2019年04月20日,Vol. 93, No. 4,pp. 8-11,ISSN: 0369-2302
【文献】NAMEMATSU, Satoshi,“Development of IO-Link Master Module”,Mitsubishi Electric ADVANCE,三菱電機株式会社,2020年06月,vol. 170,pp. 2-6,https://www.advance.mitsubishielectric.com/advance/pdf/2020/170_complete.pdf,ISSN: 1345-3041
(58)【調査した分野】(Int.Cl.,DB名)
G01R 31/08-31/11
G01R 31/50-31/74
(57)【特許請求の範囲】
【請求項1】
診断対象のセンサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成する学習装置であって、
前記センサネットワークの伝送路を流れる信号の実測波形と、前記センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各前記断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを取得する学習用データ取得部と、
前記学習用データ取得部により取得された学習用データを用いた機械学習によって、前記実測波形から、前記センサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成するモデル生成部と、
を備える学習装置。
【請求項2】
前記モデル生成部は、
前記実測波形と、前記断線シナリオ毎のシミュレーション波形との電位差に基づいて報酬を計算する報酬計算部と、
前記報酬計算部によって計算された報酬に基づいて、前記センサネットワークの断線位置と断線状態とを推論するための関数を更新する関数更新部と、
を備える請求項1に記載の学習装置。
【請求項3】
前記モデル生成部は、
前記学習済モデルの生成後に前記センサネットワークか
ら取得され
た実測波形を前記学習用データとして用いて
、前記学習済モデルを再学習する、
請求項1または2に記載の学習装置。
【請求項4】
前記モデル生成部は、前記センサネットワークの稼働時に測定されて予め蓄積された前記実測波形を取得して、前記学習用データとして用いる、
請求項1または2に記載の学習装置。
【請求項5】
診断対象のセンサネットワークの断線位置と断線状態とを推論する推論装置であって、
前記センサネットワークの伝送路を流れる信号の実測波形を取得するデータ取得部と、
前記実測波形と、前記センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各前記断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを用いた機械学習によって生成された学習済モデルに、前記データ取得部により取得された前記実測波形を入力することにより、前記センサネットワークの断線位置と断線状態とを含む推論結果を出力する推論部と、
を備える推論装置。
【請求項6】
診断対象のセンサネットワークの断線位置と断線状態とを特定する断線位置特定システムであって、
請求項1または2に記載の学習装置と、
請求項5に記載の推論装置と、
前記センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオを生成し、各前記断線シナリオに対してシミュレーションを実行することによりシミュレーション波形を出力するシミュレーション装置と、
を備える断線位置特定システム。
【請求項7】
診断対象のセンサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成するコンピュータが、
前記センサネットワークの伝送路を流れる信号の実測波形と、前記センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各前記断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを取得するステップと、
取得された学習用データを用いた機械学習によって、前記実測波形から、前記センサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成するステップと、
を実行する学習方法。
【請求項8】
診断対象のセンサネットワークの断線位置と断線状態とを推論するコンピュータが、
前記センサネットワークの伝送路を流れる信号の実測波形を取得するステップと、
前記実測波形と、前記センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各前記断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを用いた機械学習によって生成された学習済モデルに、取得された前記実測波形を入力することにより、前記センサネットワークの断線位置と断線状態とを含む推論結果を出力するステップと、
を実行する推論方法。
【請求項9】
診断対象のセンサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成するコンピュータに、
前記センサネットワークの伝送路を流れる信号の実測波形と、前記センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各前記断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを取得する処理と、
取得された学習用データを用いた機械学習によって、前記実測波形から、前記センサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成する処理と、
を実行させるプログラム。
【請求項10】
診断対象のセンサネットワークの断線位置と断線状態とを推論するコンピュータに、
前記センサネットワークの伝送路を流れる信号の実測波形を取得する処理と、
前記実測波形と、前記センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各前記断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを用いた機械学習によって生成された学習済モデルに、取得された前記実測波形を入力することにより、前記センサネットワークの断線位置と断線状態とを含む推論結果を出力する処理と、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習装置、推論装置、断線位置特定システム、学習方法、推論方法、および、プログラムに関する。
【背景技術】
【0002】
ケーブル、電線等を含む伝送路の断線位置と断線状態とを特定するために、目視検査といった物理的検査、および、電気的測定等が行われている。
【0003】
物理的検査は、断線位置が目視しやすい場所にある場合、外部から損傷が明らかな場合等は、断線位置の特定は早いが、そうでない場合、広範囲の伝送路を一つ一つ確認する必要があるため、時間とコストの大きな負担となる。また、電気的測定では、限定的なデータしか得られないため、正確な位置を特定するのが困難であった。したがって、これらの方法では、断線位置、断線状態の特定に時間がかかり、その間、システムが停止する可能性がある。
【0004】
特許文献1には、電気機械装置に組み込まれたワイヤーハーネスにおける異常を検査する異常検査装置が開示されている。この異常検査装置は、ワイヤーハーネスに送信された入力波に起因して生じる反射波を検出する反射波検出器を備え、ワイヤーハーネスに異常があるとき、及び、異常がないときの反射波の周波数特性から得た特徴量によって生成された異常判定モデルに基づいて、ワイヤーハーネスの異常を判定する。
【0005】
特許文献2には、管理対象装置の配線として用いられているケーブルの断線進行状態を管理するケーブル状態管理装置が開示されている。このケーブル状態管理装置は、ケーブルを周期的に繰り返し動作させた際のケーブルの抵抗値の時系列的な変化である抵抗値データを基に、ケーブルの断線進行状態を推定する。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2022-120857号公報
【文献】特開2023-044616号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1、2に記載された装置は、学習データとして、反射波、抵抗値の時系列的な変化等実測波形のみを用いている。測定環境により波形データは変化するため、特許文献1、2に記載された装置は、学習により多くの時間がかかってしまう。したがって、より効率的に断線位置と断線状態とを特定するという観点からは改善の余地があった。
【0008】
本開示は、上記のような問題点に鑑みてなされたものであり、より効率的に断線位置と断線状態とを特定することができる学習装置、推論装置、断線位置特定システム、学習方法、推論方法、および、プログラムを提案することを目的にする。
【課題を解決するための手段】
【0009】
上記の目的を達成するため、本開示に係る学習装置は、診断対象のセンサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成する学習装置であって、センサネットワークの伝送路を流れる信号の実測波形と、センサネットワークをモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、抵抗の抵抗値と抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを取得する学習用データ取得部と、学習用データ取得部により取得された学習用データを用いた機械学習によって、実測波形から、センサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成するモデル生成部と、を備える。
【発明の効果】
【0010】
本開示によれば、実測波形と、複数の断線シナリオそれぞれのシナリオ情報と、各断線シナリオのシミュレーション波形とを含む学習用データを用いて、実測波形から、センサネットワークの断線位置と断線状態とを推論するための学習済モデルを生成する。したがって、実測波形のみを用いる場合に比べて、データ取得、学習等をより効率的に行うことができる。したがって、この学習装置により生成された学習済モデルを用いて推論処理を行うことにより、効率的に断線位置と断線状態とを特定することができる。
【図面の簡単な説明】
【0011】
【
図1】本開示の実施の形態1に係る断線位置特定システムの構成を示す図
【
図2】情報処理装置の物理構成の一例を示すブロック図
【
図3】
図1に示す学習装置の機能構成を示すブロック図
【
図4】学習装置による学習処理を示すフローチャート
【
図5】
図1に示す推論装置の機能構成を示すブロック図
【
図6】推論装置による推論処理を示すフローチャート
【発明を実施するための形態】
【0012】
以下、本開示の実施の形態に係る学習装置、推論装置、断線位置特定システム、学習方法、推論方法、および、プログラムについて図面を参照して説明する。なお、図中同一又は相当する部分には同じ符号を付す。
【0013】
図1は、断線位置特定システム100の全体を示した概略図である。断線位置特定システム100は、診断対象のセンサネットワーク10の断線位置と、断線具合、すなわち、切れかけ具合といった断線状態と、を特定するシステムである。断線状態は、ケーブルが完全に断線している状態に限定されず、例えば、ケーブルに含まれる芯線あるいは素線等の一部の破線あるいは破損、経年劣化によるケーブルの電気的特性の低下等のケーブルの劣化状態を含む。図示する通り、断線位置特定システム100は、診断対象であるセンサネットワーク10と、センサネットワーク10の構成を模擬したセンサネットワークモデルに基づいて断線シナリオを生成し、生成した断線シナリオの伝送路シミュレーションを実行するシミュレーション装置20と、センサネットワーク10の断線位置と断線状態とを特定するための学習済モデルを生成する学習装置30と、学習装置30により生成された学習済モデルを記憶する学習済モデル記憶部40と、センサネットワーク10の断線位置と断線状態とを推論する推論装置50とを備える。
【0014】
センサネットワーク10は、センサネットワーク10を管理するマスタユニットであるユニット11と、各種測定データを取得するセンサ12a、12b、12c、・・・と、を含み、ユニット11とセンサ12a、12b、12c、・・・とは伝送路13を介して接続される。なお、以下の説明では、センサ12a、12b、12c、・・・を総称して、センサ12ともいう。ユニット11とセンサ12は、伝送路を流れる信号の波形データをロギングする機能を備える。
【0015】
シミュレーション装置20は、断線シナリオ21を生成し、シミュレーション部22、を備える。
【0016】
シミュレーション装置20は、診断対象のセンサネットワーク10の構成を模擬したセンサネットワークモデルにおいて、伝送路の特定の位置に抵抗を挿入し、抵抗値と挿入された抵抗の挿入位置とを変更した複数の断線シナリオ21を生成する。断線シナリオ21において、抵抗の位置は、断線位置を示し、抵抗値は、断線状態を示す。
【0017】
シミュレーション部22は、各断線シナリオ21に対して伝送路シミュレーションを実行し、断線シナリオ21毎に伝送路を流れる信号のシミュレーション波形を出力する。伝送路シミュレーションは、例えば、センサネットワーク10の入力端から特定の波形の信号を入力した場合の、センサネットワーク10の観測点における信号を模擬すること、センサネットワーク10を分布定数系で表し、インピーダンスの変化点における反射と伝送路の群速度から観測点における信号波形を計算すること等をいう。
【0018】
学習装置30は、センサネットワーク10のユニット11およびセンサ12でロギングされた波形データである実測波形と、シミュレーション装置20により生成された断線シナリオ21の抵抗値と抵抗の位置とを含むシナリオ情報と、各断線シナリオ21のシミュレーション波形とを含む学習用データを用いて、実測波形から断線位置と断線状態とを推論するための学習済モデルを生成する。
【0019】
なお、学習用データに用いられる実測波形は、商用稼働前のセンサネットワーク10のデモ稼働時に取得されるデータであってもよいし、過去にセンサネットワーク10で取得されて予め蓄積されたデータであってもよいし、現在稼働中のセンサネットワーク10から取得されたデータであってもよい。
【0020】
学習済モデル記憶部40は、学習装置30により生成された学習済モデルを記憶する。
【0021】
推論装置50は、センサネットワーク10から実測波形を取得し、学習装置30により生成された学習済モデルを用いて、取得された実測波形から断線位置および断線状態を推論する。
【0022】
断線位置特定システム100において、シミュレーション装置20、学習装置30、学習済モデル記憶部40、推論装置50が実現される情報処理装置60は、物理的に、
図2に例示する通り、プログラムに従った処理を実行するCPU(Central Processing Unit)61と、揮発性メモリであるRAM(Random Access Memory)62と、不揮発性メモリであるROM(Read Only Memory)63と、データを記憶する記憶部64と、情報の入力を受け付ける入力部65と、情報を可視化して表示する表示部66と、情報の送受信を行う通信部67と、を備え、これらが内部バス99を介して接続されている。
【0023】
CPU61は、記憶部64に記憶されたプログラムをRAM62に読み出して実行することにより、各種処理を実行する。CPU61は、プログラムにより提供される主要な機能として、シミュレーション装置20のシミュレーション部22、
図3に例示する学習装置30のモデル生成部32、報酬計算部33、関数更新部34、および、
図5に例示する推論装置50の推論部52による処理を実行する。
【0024】
RAM62は、CPU61のワークエリアとして使用される。ROM63は、CPU61が実行する制御プログラム、BIOS(Basic Input Output System)等を記憶する。
【0025】
記憶部64は、ハードディスクドライブを備え、CPU61が実行するプログラムを記憶し、プログラム実行の際に使用される各種データを記憶する。記憶部64は、学習済モデル記憶部40として機能する。
【0026】
入力部65は、キーボード、マウス、通信装置等を備えるユーザインタフェースである。
【0027】
表示部66は、情報を可視化して表示する液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等の表示装置である。
【0028】
通信部67は、ネットワークに接続する網終端装置または無線通信装置、およびそれらと接続するシリアルインタフェースまたはLAN(Local Area Network)インタフェースである。通信部67は、
図3に例示する学習装置30のデータ取得部31、
図5に例示する推論装置50のデータ取得部51として機能する。
【0029】
<学習フェーズ>
図3は、学習装置30の構成図である。学習装置30は、学習用データを取得するデータ取得部31と、データ取得部31により取得された学習用データに基づいて、学習済モデルを生成するモデル生成部32と、を備える。
【0030】
データ取得部31は、シミュレーション装置20により生成された複数の断線シナリオ21それぞれの抵抗値と抵抗の位置とを含むシナリオ情報と、断線シナリオ21それぞれに対してシミュレーションを行って得られたシミュレーション波形と、をシミュレーション装置20から取得する。また、データ取得部31は、センサネットワーク10のユニット11、および、センサ12でロギングされた実測波形をセンサネットワーク10から取得する。なお、データ取得部31は、学習用データ取得部の一例である。
【0031】
モデル生成部32は、データ取得部31により取得されたシナリオ情報とシミュレーション波形と実測波形とを含む学習用データに基づいて、センサネットワーク10の断線位置と断線状態とを推論する学習済モデルを生成する。すなわち、センサネットワーク10の実測波形から断線位置と断線状態とを推論する学習済モデルを生成する。
【0032】
モデル生成部32が用いる学習アルゴリズムは、教師あり学習、教師なし学習、強化学習等の公知のアルゴリズムを用いることができる。一例として、強化学習(Reinforcement Learning)を適用した場合について説明する。強化学習では、ある環境内における行動主体であるエージェントが、現在の状態を示す環境パラメータを観測し、取るべき行動を決定する。エージェントの行動により環境が動的に変化する。エージェントには、環境の変化に応じて報酬が与えられる。エージェントは、これを繰り返し、一連の行動を通じて報酬が最も多く得られる行動方針を学習する。
【0033】
強化学習の代表的な手法として、Q学習(Q-learning)、TD学習(TD-learning)等が知られている。例えば、Q学習の場合、行動価値関数Q(s,a)の一般的な更新式は、以下の数1に示す式により表される。
【0034】
【0035】
数1において、stは時刻tにおける環境の状態を表し、atは時刻tにおける行動を表す。行動atにより、状態はst+1に変わる。rt+1はその状態の変化によってもらえる報酬を表し、γは割引率を表し、αは学習係数を表す。なお、γは0<γ≦1、αは0<α≦1の範囲とする。シミュレーション装置20で生成された各断線シナリオ21の抵抗値と抵抗の位置とを含むシナリオ情報、各断線シナリオ21により出力されたシミュレーション波形が行動atとなり、センサネットワーク10の実測波形が状態stとなり、時刻tの状態stにおける最良の行動atを学習する。
【0036】
数1で表される更新式は、時刻t+1における最もQ値の高い行動aの行動価値Qが、時刻tにおいて実行された行動aの行動価値Qよりも大きければ、行動価値Qを大きくし、逆の場合は、行動価値Qを小さくする。換言すれば、時刻tにおける行動aの行動価値Qを、時刻t+1における最良の行動価値に近づけるように、行動価値関数Q(s,a)を更新する。それにより、或る環境における最良の行動価値が、それ以前の環境における行動価値に順次伝播していく。
【0037】
上記のように、強化学習によって学習済モデルを生成する場合、モデル生成部32は、報酬計算部33と、関数更新部34と、を備える。
【0038】
報酬計算部33は、各断線シナリオ21の抵抗値と抵抗の位置とを含むシナリオ情報と、断線シナリオ21をそれぞれシミュレーションして出力されたシミュレーション波形と、センサネットワーク10のユニット11、および、センサ12でロギングされた実測波形とに基づいて報酬を計算する。報酬計算部33は、シミュレーション波形と実測波形との電位差に基づいて、報酬rを計算する。報酬計算部33は、シミュレーション波形と実測波形の電位差が減少の場合には、報酬rを増大させ(例えば「1」の報酬を与える。)、他方、シミュレーション波形と実測波形の電位差が増加の場合には報酬rを低減する(例えば「-1」の報酬を与える。)。なお、報酬計算部33は、実測波形とシミュレーション波形それぞれの、長時間又は短時間での傾向、波形の長さ、周波数等の類似度に基づいて報酬rを計算してもよい。
【0039】
関数更新部34は、報酬計算部33によって計算される報酬rに従って、断線位置と断線状態とを決定するための関数を更新し、学習済モデル記憶部40に出力する。例えばQ学習の場合、式1で表される行動価値関数Q(st,at)を、断線位置と断線状態とを算出するための関数として用いる。
【0040】
関数更新部34は、以上の学習を繰り返し実行して学習済モデルを生成する。学習済モデル記憶部40は、関数更新部34によって更新された行動価値関数Q(st,at)、すなわち、学習済モデルを記憶する。
【0041】
次に、
図4に例示するフローチャートを用いて学習装置30が学習済モデルを生成し、出力する動作について説明する。学習装置30は、電源をオンにすると、学習処理の実行を開始する。学習処理は、初めてセンサネットワーク10の診断処理を実施する前、センサネットワーク10の構成変更により学習モデルの更新が必要となった場合、より多くの学習データを用いて学習済モデルを再学習させ、推論の精度を向上させたい場合等に実行される。
【0042】
学習装置30のデータ取得部31は、センサネットワーク10およびシミュレーション装置20から学習用データを取得する(ステップS11)。具体的に、データ取得部31は、シミュレーション装置20で生成された各断線シナリオ21の抵抗値および抵抗の位置を含むシナリオ情報と、断線シナリオ21をそれぞれシミュレーションすることにより出力されたシミュレーション波形と、センサネットワーク10のユニット11、および、センサ12でロギングされた実測波形と、を学習用データとして取得する。
【0043】
次に、報酬計算部33は、ステップS11で取得された断線シナリオ21のシナリオ情報とシミュレーション波形と実測波形とに基づいて報酬を計算する(ステップS12)。具体的に、報酬計算部33は、複数の断線シナリオ21のシナリオ情報と断線シナリオ21毎のシミュレーション波形と実測波形とを取得し、予め定められたシミュレーション波形と実測波形の信号間の電位差に基づいて報酬を増加させるか又は報酬を減じるかを判定する。
【0044】
報酬計算部33は、シミュレーション波形と実測波形の信号間の電位差が減少する場合に、報酬を増大させる(ステップS13)。一方、報酬計算部33は、シミュレーション波形と実測波形の信号間の電位差が増加する場合に、報酬を減少させる(ステップS14)。
【0045】
次に、関数更新部34は、報酬計算部33によって計算された報酬に基づいて、学習済モデル記憶部40が記憶する数1で表される行動価値関数Q(st,at)を更新する(ステップS15)。
【0046】
学習装置30は、以上のステップS11からS15までのステップを繰り返し実行し、生成された行動価値関数Q(st,at)を学習済モデルとして記憶する。
【0047】
学習装置30は、学習済モデルを学習装置30の外部に設けられた学習済モデル記憶部40に記憶するものとしたが、学習済モデル記憶部40を学習装置30の内部に備えていてもよい。
【0048】
<活用フェーズ>
図5は、推論装置50の構成図である。推論装置50は、センサネットワーク10から実測波形を取得するデータ取得部51と、センサネットワーク10の断線位置と断線状態とを推論する推論部52とを備える。
【0049】
データ取得部51は、センサネットワーク10のユニット11およびセンサ12でロギングされた実測波形を取得する。
【0050】
推論部52は、学習装置30により生成された学習済モデルを利用して断線位置と断線状態とを推論する。すなわち、この学習済モデルに、データ取得部51により取得された実測波形を入力することで、実測波形に基づく断線位置と断線状態とを推論することができる。
【0051】
なお、本実施の形態では、断線位置特定システム100のモデル生成部32で学習した学習済モデルを用いて断線位置と断線状態とを出力するものとして説明したが、他の断線位置特定システムから学習済モデルを取得し、この学習済モデルに基づいて断線位置と断線状態とを出力するようにしてもよい。
【0052】
次に、
図6を用いて、学習済モデルを使って推論結果を得るための推論処理を説明する。
【0053】
推論装置50のデータ取得部51は、センサネットワーク10から実測波形を取得する(ステップS21)。具体的に、データ取得部51は、センサネットワーク10のユニット11、および、センサ12でロギングされた実測波形を取得する。
【0054】
次に、推論部52は学習済モデル記憶部40に記憶された学習済モデルに、ステップS21で取得された実測波形を入力し(ステップS22)、断線位置と断線状態とを含む推論結果を得る。推論部52は得られた断線位置と断線状態とを含む推論結果を断線位置特定システム100に出力する(ステップS23)。
【0055】
次に、断線位置特定システム100は、推論部52により出力された断線位置を用いて、断線位置を管理端末(図示せず)へ表示したり、設備担当者へ通知する。これにより、早期に断線位置を特定することができる。
【0056】
以上のように、断線位置特定システム100は、診断対象のセンサネットワーク10の実測波形と、複数の断線シナリオ21それぞれの抵抗値と抵抗の位置とを含むシナリオ情報と、各断線シナリオ21のシミュレーション波形とを含む学習データを用いて学習を行い、学習済モデルを用いて断線位置と断線状態とを推論する。したがって、より効率的に断線位置を特定し、経年劣化によるケーブルの劣化具合を含む断線状態を推論することが可能となる。
【0057】
なお、本実施の形態では、推論部52が用いる学習アルゴリズムに強化学習を適用した場合について説明したが、これに限られるものではない。学習アルゴリズムについては、強化学習以外にも、教師あり学習、教師なし学習、又は半教師あり学習等を適用することも可能である。
【0058】
また、モデル生成部32に用いられる学習アルゴリズムとしては、特徴量そのものの抽出を学習する深層学習(Deep Learning)を用いることもでき、他の公知の方法、例えばニューラルネットワーク、遺伝的プログラミング、機能論理プログラミング、サポートベクターマシン等に従って機械学習を実行してもよい。
【0059】
なお、学習装置30および推論装置50は、例えば、ネットワークを介して断線位置特定システム100に接続され、この断線位置特定システム100とは別個の装置であってもよい。また、学習装置30および推論装置50は、断線位置特定システム100に内蔵されていてもよい。さらに、シミュレーション装置20、学習装置30、推論装置50は、クラウドサーバ上に存在していてもよい。
【0060】
また、モデル生成部32は、複数の断線位置特定システム100から取得される学習用データを用いて、断線位置を学習するようにしてもよい。なお、モデル生成部32は、同一のエリアで使用される複数の断線位置特定システム100から学習用データを取得してもよいし、異なるエリアで独立して動作する複数の断線位置特定システム100から収集される学習用データを利用して断線位置を学習してもよい。また、学習用データを収集する断線位置特定システム100を途中で対象に追加し、または、対象から除去することも可能である。さらに、ある断線位置特定システム100に関して断線位置を学習した学習装置30を、これとは別の断線位置特定システム100に適用し、当該別の断線位置特定システム100に関して断線位置を再学習して更新するようにしてもよい。
【0061】
上記実施の形態において、断線位置特定システム100が備える機能は、シミュレーション装置20、学習装置30、学習済モデル記憶部40、推論装置50のそれぞれ個別の装置により実行されるものとして説明したが、それに限られず、各装置の機能を1台のコンピュータである情報処理装置により実行してもよい。また、例えば、一部の装置の機能を1台のコンピュータにより実行し、その他の装置の機能を1台のコンピュータにより実行する等、いくつかの装置の機能を実行する複数のコンピュータにより、断線位置特定システム100の各処理を実行してもよい。
【0062】
また、断線シナリオ21、シミュレーション波形、実測波形、学習済モデル等の学習処理および推論処理で使用されるデータは、ネットワーク上に存在するクラウドサーバで一括管理され、学習装置30および推論装置50は、必要に応じて当該クラウドサーバにアクセスして情報の読み書きを行ってもよい。この場合、断線位置特定システム100は学習済モデル記憶部40を備えなくてもよい。
【0063】
また、シミュレーション装置20、学習装置30、学習済モデル記憶部40、推論装置50は、専用の装置によらず、通常のコンピュータシステムを用いて実現可能である。例えば、各機能を実現するためのプログラムを、コンピュータが読み取り可能なCD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)等の記録媒体に格納して配布し、このプログラムをコンピュータにインストールすることにより、上述の各機能を実現することができるコンピュータを構成してもよい。
【0064】
また、各機能をOS(Operating System)とアプリケーションとの分担、またはOSとアプリケーションとの協同により実現する場合には、アプリケーションのみを記録媒体に格納してもよい。
【0065】
本開示は、本開示の広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能とされるものである。また、上述した実施の形態は、本開示を説明するためのものであり、本開示の範囲を限定するものではない。つまり、本開示の範囲は、実施の形態ではなく、請求の範囲によって示される。そして、請求の範囲内及びそれと同等の開示の意義の範囲内で施される様々な変形が、本開示の範囲内とみなされる。
【符号の説明】
【0066】
100 断線位置特定システム、10 センサネットワーク、11 ユニット、12,12a、12b,12c センサ、13 伝送路、20 シミュレーション装置、21 断線シナリオ、22 シミュレーション部、30 学習装置、31 データ取得部、32 学習済モデル生成部、33 報酬計算部、34 関数更新部、40 学習済モデル記憶部、50 推論装置、51 データ取得部、52 推論部、60 情報処理装置、61 CPU、62 RAM、63 ROM、64 記憶部、65 入力部、66 表示部、67 通信部、99 内部バス。
【要約】
学習装置(30)は、診断対象のセンサネットワーク(10)の断線位置と断線状態とを推論するための学習済モデルを生成する学習装置(30)であって、センサネットワーク(10)の伝送路を流れる信号の実測波形と、センサネットワーク(10)をモデル化し、伝送路の特定の位置に抵抗を挿入したセンサネットワークモデルにおける、前記抵抗の抵抗値と該抵抗の挿入位置とを変更した複数の断線シナリオそれぞれのシナリオ情報と、各断線シナリオに対してシミュレーションを実行することにより得られたシミュレーション波形と、を含む学習用データを取得する学習用データ取得部と、学習用データ取得部により取得された学習用データを用いた機械学習によって、実測波形から、センサネットワーク(10)の断線位置と断線状態とを推論するための学習済モデルを生成するモデル生成部(32)と、を備える。