(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023042527
(43)【公開日】2023-03-27
(54)【発明の名称】データドライブの能動配電網異常状態検知方法及びシステム
(51)【国際特許分類】
G06N 20/00 20190101AFI20230317BHJP
G05B 23/02 20060101ALI20230317BHJP
【FI】
G06N20/00
G05B23/02 R
【審査請求】有
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2022071358
(22)【出願日】2022-04-25
(11)【特許番号】
(45)【特許公報発行日】2023-03-16
(31)【優先権主張番号】202111046394.0
(32)【優先日】2021-09-08
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】521017642
【氏名又は名称】山東大学
【氏名又は名称原語表記】SHANDONG UNIVERSITY
【住所又は居所原語表記】No.17923, Jingshi Road, Lixia District Jinan, Shandong 250061, China
(74)【代理人】
【識別番号】100146374
【弁理士】
【氏名又は名称】有馬 百子
(72)【発明者】
【氏名】呂 天光
(72)【発明者】
【氏名】王 邵瑞
(72)【発明者】
【氏名】陳 建
(72)【発明者】
【氏名】李 文博
(72)【発明者】
【氏名】孫 東磊
(72)【発明者】
【氏名】艾 ▲千▼
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA24
3C223BA01
3C223CC01
3C223EB03
3C223FF04
3C223FF22
3C223FF24
3C223FF26
3C223FF52
(57)【要約】 (修正有)
【課題】データセットの利用効率を向上し、異常状態の予測精度を向上し、予測誤差を低減するデータドライブの能動配電網異常状態検知方法及びシステムを提供する。
【解決手段】方法は、配電網異常状態発生後のノードパラメータデータを取得し、データを訓練済みの配電網異常状態予測モデルに入力して、配電網異常状態予測結果を出力し、配電網履歴異常状態ノードパラメータデータをクラスタリングし、相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成し、サンプルデータセットに基づいて配電網異常状態予測モデルの訓練を行い、三層データマイニング構造を用いて、データ分類と相関ルールにより、対応する故障タイプと強い相関を有するデータサンプルを抽出して取得する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
データドライブの能動配電網異常状態検知方法であって、配電網異常状態発生後のノードパラメータデータを取得し、前記データを訓練済みの配電網異常状態予測モデルに入力して、配電網異常状態予測結果を出力するステップを含み、
前記配電網異常状態予測モデルの訓練工程は、
配電網履歴異常状態ノードパラメータデータをクラスタリングし、クラスタリング後のデータサンプルを自己エンコードし、第1サンプルデータセットを形成するステップであって、第1サンプルデータセットにおける元素はベクトルであり、各ベクトルはTV及びF
iから構成され、TV={N0C
1,N0C
2,...,N0C
a}は自己エンコーディング後のデータであり、C値の範囲は[1, K]であり、Kはクラスタリング数であり、aはデータ収集が行われるノード番号であり、F
iは異常状態タイプの値であり、前記自己エンコーディング後のデータは少なくともデータの位置するノード位置情報とデータの属するクラスタリングカテゴリ情報を含むステップと、
相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップであって、具体的に、第1サンプルデータセットにおける各ベクトルのTV及びF
iの2種類元素を1種類元素として併合し、新たなデータセットM:{Z
1,Z
2,…,Z
i}を構成し、Z
iは1つの自己エンコーディング後のデータと対応する異常状態タイプとからなる新たなベクトルを表し、iは新たなベクトルの数であり、頻繁なアイテムセットの支持度及び信頼度を用いて前記新たなベクトルのうちの2つ又は複数の元素の間の繋がりを数値化し、支持度及び信頼度要求を満たす非0ベクトルを抽出して、訓練用のサンプルデータセットである第2サンプルデータセットを形成することを含むステップと、
前記訓練用のサンプルデータセットに基づいて前記配電網異常状態予測モデルの訓練を行うステップであって、
前記配電網異常状態予測モデルは、具体的に、
であり、
ただし、wは予測モデル関数の重みベクトルであり、bは予測モデル関数のインターセプトを表し、w
T(CV
j)はベクトルwとベクトルCV
jのスカラー積を表し、ベクトルCV
jは訓練サンプルであるステップと、
目的関数を最適化することによって前記配電網異常状態予測モデルのフィット度を測定するステップであって、前記目的関数の最適化は具体的に、
であり、
ただし、L(F
i,f(CV
j))はロス関数を表し、αがハイパーパラメータで設定値であり、R(w)は正則化項であり、nはサンプルデータセット総量であり、F
iは異常状態タイプの値であるステップと、
得られたサンプルデータセットに基づいて、確率的勾配降下アルゴリズムを用いて回帰訓練を行い、配電網異常状態予測モデルの最適なパラメトリック解を取得するステップであって、確率的勾配降下アルゴリズムは毎回に一部分テストセットを利用して反復算出し、反復する時に、モデルパラメータは下記の式で更新され、
ただし、ηは、経時的な学習率であり、算出式としては、
であり、
ただし、tはタイムステップであり、t
0は始まる時間であるステップと、を含む、
ことを特徴とするデータドライブの能動配電網異常状態検知方法。
【請求項2】
配電網履歴異常状態ノードパラメータデータをクラスタリングする前記工程は、具体的に、
ユークリッド距離に基づいてデータサンプルを分類するステップと、
判別関数によってデータサンプルクラスタリングが完成したか否かを判断するステップと、
誤差二乗和を算出し、SSE-Kグラフによって参照されるクラスタリング数を特定し、前記参照されるクラスタリング数に基づいて最終的なクラスタリング数を特定するステップと、を含む、
ことを特徴とする請求項1に記載のデータドライブの能動配電網異常状態検知方法。
【請求項3】
データドライブの能動配電網異常状態感知システムであって、
配電網異常状態発生後のノードパラメータデータを取得するためのデータ取得モジュールと、
前記データを訓練済みの配電網異常状態予測モデルに入力し、配電網異常状態予測結果を出力する異常状態予測モジュールと、を含み、
前記配電網短絡異常状態モデルの訓練工程は、
配電網履歴異常状態ノードパラメータデータをクラスタリングし、クラスタリング後のデータサンプルを自己エンコードし、第1サンプルデータセットを形成するステップであって、第1サンプルデータセットにおける元素はベクトルであり、各ベクトルはTV及びF
iから構成され、TV={N0C
1,N0C
2,...,N0C
a}は自己エンコーディング後のデータであり、C値の範囲は[1, K]であり、Kはクラスタリング数であり、aはデータ収集が行われるノード番号であり、F
iは異常状態タイプの値であり、前記自己エンコーディング後のデータは少なくともデータの位置するノード位置情報とデータの属するクラスタリングカテゴリ情報を含むステップと、
相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップであって、具体的に、第1サンプルデータセットにおける各ベクトルのTV及びF
iの2種類元素を1種類元素として併合し、新たなデータセットM:{Z
1,Z
2,…,Z
i}を構成し、Z
iは1つの自己エンコーディング後のデータと対応する異常状態タイプとからなる新たなベクトルを表し、iは新たなベクトルの数であり、頻繁なアイテムセットの支持度及び信頼度を用いて前記新たなベクトルのうちの2つ又は複数の元素の間の繋がりを数値化し、支持度及び信頼度要求を満たす非0ベクトルを抽出して、訓練用のサンプルデータセットである第2サンプルデータセットを形成することを含むステップと、
前記訓練用のサンプルデータセットに基づいて前記配電網異常状態予測モデルの訓練を行うステップであって、
前記配電網異常状態予測モデルは、具体的に、
であり、
ただし、wは予測モデル関数の重みベクトルであり、bは予測モデル関数のインターセプトを表し、w
T(CV
j)はベクトルwとベクトルCV
jのスカラー積を表し、ベクトルCV
jは訓練サンプルであるステップと、
目的関数を最適化することによって前記配電網異常状態予測モデルのフィット度を測定するステップであって、前記目的関数の最適化は具体的に、
であり、
ただし、L(F
i,f(CV
j))はロス関数を表し、αはハイパーパラメータで設定値であり、R(w)は正則化項であり、nはサンプルデータセット総量であり、F
iは異常状態タイプの値であるステップと、
得られたサンプルデータセットに基づいて、確率的勾配降下アルゴリズムを用いて回帰訓練を行い、配電網異常状態予測モデルの最適なパラメトリック解を取得するステップであって、確率的勾配降下アルゴリズムは毎回に一部分テストセットを利用して反復算出し、反復する時に、モデルパラメータは下記の式で更新され、
ただし、ηは、経時的な学習率であり、算出式としては、
であり、
ただし、tはタイムステップであり、t
0は始まる時間であるステップと、を含む、
ことを特徴とするデータドライブの能動配電網異常状態感知システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、配電網異常状態分類及び予測技術分野に関し、特にデータドライブの能動配電網異常状態検知方法及びシステムに関する。
【背景技術】
【0002】
本部分の説明は、本発明に関連する背景技術を提供するだけであり、従来技術を必然的に構成するものではない。
【0003】
能動配電網知能リアルタイム監視の深化に伴い、監視・保護装置は能動配電網に多く取り付けられ、これらの装置によって電網運転状態データを収集し、データ分析処理から、能動配電網の運転状態が正常であるか否かを判断する。しかし、このような診断方案は、監視装置の設置のために多くのコストがかかると同時に、診断精度が低いという問題がある。
【0004】
上記従来の故障診断方案の問題を回避するために、人工知能は自己学習や自己最適化という利点に頼んで、能動配電網短絡故障、断線故障や過負荷等の異常状態の診断に用いられる。一般的な故障診断方法としては、エキスパートシステム、ファジー理論、人工ニューラルネットワーク、ベイジアンネットワーク、及びペトリネットワーク等の方法がある。エキスパートシステムに基づく故障診断方法では、能動配電網の運転状態等のデータを用いて、エキスパートの経験知識と合わせて、エキスパートモデルを構築して、故障タイプを推論する。ファジィー理論に基づく診断方法では、ファジィー制御によって任意の非線形連続関数の近似シミュレーションを実現する。人工ニューラルネットワークに基づく診断方法では、人間の脳や自然のニューラルネットワークを模倣し、既存の履歴データをモデル化し、関連パラメータの訓練を完了し、問題の解決セットを取得する。ペトリネットワークに基づく診断手法では、複雑な情報ベースが必要なく、離散的な動的能動配電網故障を効果的に処理することができるが、フォールトトレランスが低いという問題がある。
【0005】
能動配電網の規模が非常に大きく、故障データが多い場合に、故障データに対する分析効果は、アルゴリズムの選択に大幅に依存する。そして、現在の人工知能が取り入れた故障診断方案は、いつも単一の人工知能アルゴリズムやモデルのみを採用し、その診断精度に向上する余裕があり、且つフォールトトレランスが低く、エキスパートの経験に強く依存するなどの制限がある。
【発明の概要】
【0006】
上記課題を解決するために、本発明は、三層データマイニングを用いて能動配電網異常状態に対して分類及び予測を行って、異常状態分類及び予測の精度が低く時間が長い問題を対応的に解決することができるデータドライブの能動配電網異常状態検知方法及びシステムが抽出される。
【0007】
上記目的を実現するために、いくつかの実施形態において、下記の技術的解決策を採用する。
【0008】
データドライブの能動配電網異常状態検知方法であって、
配電網異常状態発生後のノードパラメータデータを取得し、前記データを訓練済みの配電網異常状態予測モデルに入力して、配電網異常状態予測結果を出力するステップを含み、
前記配電網異常状態予測モデルの訓練工程は、配電網履歴異常状態ノードパラメータデータをクラスタリングし、相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップと、前記サンプルデータセットに基づいて前記配電網異常状態予測モデルの訓練を行うステップとを含む。
【0009】
さらなる解決策として、配電網履歴異常状態ノードパラメータデータをクラスタリングする前記工程は、具体的に、
ユークリッド距離に基づいてデータサンプルを分類するステップと、
判別関数によってデータサンプルクラスタリングが完成したか否かを判断するステップと、
誤差二乗和を算出し、SSE-Kグラフによって参照されるクラスタリング数を特定し、前記参照されるクラスタリング数に基づいて最終的なクラスタリング数を特定するステップと、を含む。
【0010】
さらなる解決策として、配電網履歴異常状態ノードパラメータデータをクラスタリングした後に、
クラスタリング後のデータサンプルを自己エンコードし、第1サンプルデータセットを形成するステップをさらに含み、第1サンプルデータセットにおける元素はベクトルであり、各ベクトルはTV及びFiから構成され、(ただし、TV={N0C1,N0C2,...,N0Ca}は自己コーディング後のデータであり、C値の範囲は[1, K]であり、aはデータ収集が行われるノード番号であり、Fiは異常状態タイプの値である)、
前記自己コーディング後のデータは、少なくともデータの位置するノード位置情報及びデータの属するクラスタリングカテゴリ情報を含む。
【0011】
さらなる解決策として、相関ルールアルゴリズムによって配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成する前記ステップは、具体的に、
第1サンプルデータセットにおける各ベクトルのTV及びFiの2種類元素を1種類元素として併合し、新たなデータセットM:{Z1,Z2,…,Zi}を構成するステップと(ただし、Ziは1つの自己コーディング後のデータと対応する異常状態タイプとからなる新たなベクトルを表し、iは新たなベクトルの数である)、
頻繁なアイテムセットの支持度及び信頼度を用いて前記新たなベクトルのうちの2つ又は複数の元素間の繋がりを数値化し、支持度及び信頼度要求を満たす非0ベクトルを抽出して、配電網異常状態予測モデルの訓練を行うための第2サンプルデータセットを形成するステップと、を含む。
【0012】
さらなる解決策として、前記サンプルデータセットに基づいて前記配電網異常状態予測モデルの訓練を行う前記ステップは、具体的に、
得られたサンプルデータセットに基づいて、確率的勾配降下アルゴリズムを用いて回帰訓練を行い、配電網異常状態予測モデルの最適なパラメトリック解を取得するステップを含む。
【0013】
さらなる解決策として、前記配電網異常状態予測モデルは具体的に、
である
(ただし、wは予測モデル関数の重みベクトルであり、bは予測モデル関数のインターセプトを表し、w
T(CV
j)はベクトルwとベクトルCV
jのスカラー積を表し、ベクトルCV
jは訓練サンプルである)。
【0014】
さらなる解決策として、目的関数を最適化することによって前記配電網異常状態予測モデルのフィット度を測定するステップをさらに含み、前記目的関数の最適化は具体的に、
である
(ただし、L(F
i,f(CV
j))はロス関数を表し、αはハイパーパラメータで設定値であり、R(w)は正則化項であり、nはサンプルデータセット総量であり、F
iは異常状態タイプの値である)。
【0015】
他のいくつかの実施形態において、下記の技術的解決策を採用する。
【0016】
データドライブの能動配電網異常状態感知システムであって、
配電網異常状態発生後のノードパラメータデータを取得するためのデータ取得モジュールと、
前記データを訓練済みの配電網異常状態予測モデルに入力し、配電網異常状態予測結果を出力する異常状態予測モジュールと、を含み、
前記配電網短絡異常状態モデルの訓練工程は、配電網履歴故障ノードパラメータデータをクラスタリングし、相関ルールアルゴリズムにより、配電網短絡異常状態と強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップと、前記サンプルデータセットに基づいて前記配電網異常状態予測モデルの訓練を行うステップとを含む。
【0017】
従来技術に比べて、本発明の有益な効果は以下のとおりである。
(1)本発明の分散型電源含有の配電網異常状態予測は、三層データマイニング構造を用いて、データ分類と相関ルールにより、対応する故障タイプと強い相関を有するデータサンプルを抽出して取得し、データセットの利用効率を向上することができ、三層データマイニング構造により異常状態の予測精度を向上し、算出時間を短くし、予測誤差を低減することができる。
(2)本発明は、自己エンコーディングによるデータフォーマット簡略化の方法を抽出し、異なる異常状態タイプラベルを設置することで、データ関連性が不明瞭、不明確である問題を効果的に回避して、異常状態タイプと強い相関を有するデータを正確的に抽出することができ、データセットの有効性を増強する。
【図面の簡単な説明】
【0018】
【
図1】
図1は本発明の実施例における第1層データマイニング工程のフローチャートである。
【
図2】
図2は本発明の実施例における第3層データマイニング工程のフローチャートである。
【
図3】
図3は本発明の実施例における誤差二乗和SSE及び参照K値のカーブダイアグラムである。
【発明を実施するための形態】
【0019】
指摘すべきこととして、以下の詳細な説明は例示的なものであり、本出願にさらなる説明を提供することを目的とする。特に明示しない限り、本発明で使用される全ての技術及び科学的用語は本出願の属する技術分野の当業者によって一般的に理解される意味と同じものを有する。
【0020】
注意すべきこととして、ここで使用される用語は具体的な実施形態を説明するためのものに過ぎず、本出願の例示的な実施形態を限定する意図ではない。ここで使用されるように、文脈が明確に示されない限り、そうでなければ単数形も複数の形式を含み、また、理解すべきこととして、本明細書において用語「含有」及び/又は「含む」を使用する場合、それは特徴、ステップ、操作、デバイス、コンポーネント及び/又はそれらの組み合わせが存在することを示す。
実施例1
【0021】
1つ又は複数の実施形態において、下記の工程を含むデータドライブの能動配電網異常状態検知方法を開示する。
(1)配電網異常状態発生後のノードパラメータデータを取得し、ノードパラメータデータは、ノード電圧データ又はノード電流データを含むが、これらに限定されない。
(2)前記データを訓練済みの配電網異常状態予測モデルに入力し、配電網異常状態予測結果を出力する。
【0022】
前記配電網異常状態予測モデルの訓練工程は、配電網履歴異常状態ノードパラメータデータをクラスタリングし、相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップと、得られたサンプルデータセットに基づいて配電網異常状態予測モデルの訓練を行うステップとを含む。
【0023】
本実施例の配電網異常状態予測は、主に単相対地間短絡、二相相間短絡、二相対地間短絡、三相対地間短絡の4種類の能動配電網短絡故障、及び負荷異常と断線故障に対するものである。
【0024】
本実施例において、各異常状態について、1つの予測モデルをそれぞれ構築し、4種類の短絡故障、負荷異常及び断線故障を例として、これらの異常状態のそれぞれに対して予測モデルを構築し、モデリング方法及び思想がいずれも同じで、予測システム全体にこれらの異常状態が含まれてもよく、異常状態発生後のデータを入力し、モデルを予測し算出し、最後に信頼性のより高い予測結果を取得する。
【0025】
本実施例で三層データマイニング方法を用いて配電網異常状態予測モデルの訓練を実現する。
【0026】
第1層データマイニングは、K平均値クラスタリングアルゴリズムを用いて生異常状態データを分類し、次に自己エンコードルールにより生異常状態データのフォーマットを簡略化する。
【0027】
第2層データマイニングは、第1層で得られた分類済の異常状態データの上で、相関ルールにより、異常状態予測結果に与える影響が小さいデータをカリングし、配電網異常状態タイプと強い相関を有するデータを、予測モデルパラメータ回帰訓練のデータセットとして抽出する。
【0028】
配電網異常状態タイプと強い相関を有するデータサンプルとは、設定された最小支持度を満たし設定された最小信頼度を満たすデータサンプルである。
【0029】
第3層データマイニングは、確率的勾配降下アルゴリズムにより、第2層データマイニングで得られたデータを訓練セットとして、各種の異常状態タイプの予測モデルを取得する。
【0030】
以下、三層データマイニング工程のそれぞれを詳しく説明する。
1.第1層データマイニング
【0031】
まず、異常状態発生後のノード電圧データを収集し、次にK平均値クラスタリングアルゴリズムによってこれらのデータを分類する。本実施例では、分類済のデータをエンコードして、データのフォーマットを簡略化するための自己エンコードルールを抽出する。K平均値クラスタリングアルゴリズムは、自己エンコーディングとともに第1層データマイニング工程を構成し、第1層データマイニング処理によって生成されたデータは第1サンプルデータセットを構成する。
【0032】
図1を参照すると、K平均値クラスタリングアルゴリズムは主として、ユークリッド距離がデータサンプル分類のために用いられること、判別関数がサンプルクラスタリングが完成したか否かを判断するために用いられること、エルボー法が参照されるクラスタリング数K値を特定して、次に参照されるクラスタリング数K値に基づいて最終的なK値を特定するために用いられることという3つの面を含む。
【0033】
具体的に、K平均値クラスタリングアルゴリズムは、サンプル点と各類中心サンプル点との間のユークリッド距離に基づいて当該データサンプルがあるクラスタリングに属することを判断する。1つのデータサンプルとある種類の中心サンプル点との間のユークリッド距離が最小となる時に、当該データサンプルはこの中心サンプル点の位置するクラスタリングに属する。ユークリッド距離の算出式は、
であり、
ただし、P=(p
1,p
2,...,p
n)はn次元空間内の1つのデータサンプルを表し、例えば、三機九ノードシステムにおいて、n=9となると、P=(p
1,p
2,...,p
9)はある時刻で9つのノードの電圧データを表す。
【0034】
はj番目のクラスタリングの中心サンプル点を表し、P、Q
jはいずれもベクトルである。最初に、ユークリッド距離を反復算出する工程において、各クラスタリングの中心サンプル点を任意に選択することができる。
【0035】
分類が完成していない場合に、各クラスタリングの中心点を更新する必要がある。各クラスタリングのうちのすべてのサンプルデータの平均値を、次回の反復の新たな中心点とし、同時に判別関数を用いて反復更新が停止したか否か、即ち分類が完成したか否かを判断する。ここの判別関数は、すべてのクラスタリングのうちのサンプルとサンプル中心との差の二乗和が最小であることを表し、その算出式は、
であり、
ただし、Kは分類の数を表し、
はj番目のクラスタリングのサンプル中心を表し、P
jはj番目のクラスタリングのうちのいずれも1つのサンプルデータを表し、
はいずれもn次元のサンプルデータのうちの1つの元素を表す。
【0036】
式(2)で表す判別関数は最小に収束する時に、各クラスタリングのサンプル中心が明らかに変化せず、この場合に反復を停止し、分類工程が完成し、すべてのサンプル点がK類として分類される。
【0037】
K平均値クラスタリングアルゴリズムの欠点の1つとしては、分類の数を事前に知ることができないため、クラスタリング工程が順調に行われにくく、同時にクラスタリング品質が高くない。故に、参照されるクラスタリング数Kは、このクラスタリングアルゴリズムのキーポイントである。
【0038】
本実施例はエルボー法により、誤差二乗和(SSE)を算出して、参照されるK値を取得する。Kが大きくなると、生データはどんどん細かく分類されると同時に、各クラスタリングの集約度はますます高くなり、二乗誤差の和はますます小さくなる。したがって、Kをある値にすると、二乗誤差和は急落し、SSE-Kグラフに反映されて、SSE曲線の傾斜は急に遅くなり、傾斜低下の速度が最速であり、さらにKが大きくなると、SSEはゆっくりと変化することとなる。このような変化の傾向が、曲がった肘のような形の肘と似ていることから、この方法をエルボー法と呼んでいる。エルボ部位に対応するK値は、参照されるクラスタリング数である。
【0039】
【0040】
SSEを反復算出する工程において、Kは人為的に取られた値で、しばしば1から適当な上限値(例えば15であり、曲線の傾向をよりよく観察できる)まで増加し、最終的にSSE-K曲線によって参照されるK値が決められる。Ciはi番目のクラスタリングを表し、pはCiのうちのいずれか1つのデータサンプルを表し、miはCiのうちのすべてのサンプルデータの平均値、つまりそのサンプル中心を表す。
【0041】
参照されるK値に基づいて、データサンプル容量及びデータフォーマットの煩雑度合を特定し、最終的なK値は参照K値以上の数である。
【0042】
K平均値クラスタリングアルゴリズムの後、各クラスタリングのデータサンプルは特定の類似性を持っているが、この場合にまだデータフォーマットが複雑で、さらなる処理に適していない。本実施例では自己エンコーディングの方法を採用して、分類済のデータを簡略化する。生データのキー情報、例えば当該データの位置するノード及び当該データの位置するクラスタリングを保留するために、下記のエンコーディングルールN0C(4)に応じて自己エンコードする。
【0043】
ここで、Nは当該データの位置するノード位置を表し、Cは当該データの属するクラスタリングを表し、中間の0は識別するためのもので、実際な意義がない。あるデータが自己エンコーディングされた後、データフォーマットが406であることを例として、406は、ある時刻のノード4の電圧データがクラスタリング6に属することを表す。
【0044】
上記自己エンコードルールはノードデータのみに対するものであり、異常状態タイプのデータラベルは人に設定されたものであり、例えば、本実施例で異常状態タイプの値
Fi ε {110,120,130,100,140,150}
については、Fi=110の場合に、異常状態が単相対地間故障であり、Fi=120の場合に、異常状態が二相相間故障であり、Fi=130の場合に、異常状態が二相対地間故障であり、Fi=100の場合に、異常状態が三相短絡故障であり、Fi=140の場合に、異常状態が負荷異常であり、Fi=150の場合に、異常状態が断線故障である。
【0045】
初期データセット{NV,Fi}は、上記したK平均値クラスタリング及び自己エンコーディング処理の後に、第1サンプルデータセットを構成し、第1サンプルデータセットにおける元素はベクトルであり、各ベクトルは、TV及びFiから構成され、TV={N0C1,N0C2,...,N0Ca}は、自己エンコーディング後のデータであり、C値の範囲は[1, K]であり、aはデータ収集が行われるノード番号であるが、故障ノードが含まれず、Fiは異常状態タイプの値である。
2.第2層データマイニング
【0046】
能動配電網において、異常状態タイプとノード電圧との間に一定の繋がりがあり、異常状態発生時に、ノード電圧波形にも対応する変化が生じ、本実施例では相関ルールアルゴリズムを第2層データマイニングに用いて、対応する異常状態タイプと強い相関を有するデータサンプルを見つけて、これらのデータを訓練セットとして、異常状態予測モデルを訓練することにより、モデルの精度を向上させる。
【0047】
Aprioriアルゴリズムは、頻繁なアイテムセットをマイニングする相関ルールアルゴリズムである。まず、第1サンプルデータセットにおけるTV及びFiの2種類の元素を1種類の元素として併合し、即ち対応する異常状態タイプとノード電圧データを1つのベクトルとして構成し、新たなデータセットM:{Z1,Z2,…,Zi}を形成し、Ziは1つの自己エンコーディング後のデータと対応する異常状態タイプからなる新たなベクトルを表し、iは新たなベクトルの数を表す。
【0048】
頻繁なアイテムセットの支持度及び信頼度を用いて前記新たなベクトルのうちの2つ又は複数の元素間の繋がりを数値化し、支持度及び信頼度要求を満たす非0ベクトルを抽出して、配電網異常状態予測モデルの訓練を行うための第2サンプルデータセットを形成する。
【0049】
頻繁なアイテムセットの相関ルールは、1つのベクトルのうちの2つ又は複数の元素間の繋がりであり、このような繋がりは、頻繁なアイテムセットの支持度及び信頼度を用いて数値化して、元素間の関連度を測定する。支持度及び信頼度要求を満たす非0ベクトルは抽出されて、第2サンプルデータセットを構成する。
【0050】
Z
x、Z
yをそれぞれデータセットMのうちの2つの非0ベクトルとすると、支持度及び信頼度の算出式は下記に説明する。
支持度はZ
xとZ
yが同時に現れる確率を表し、算出式として、
であり、
ただし、Z
x、Z
yはそれぞれデータセットMのうちの2つの非0ベクトルである。
【0051】
信頼度は、Z
xが現れる時にZ
yが同時に現れる確率を表し、算出式として、
である。
【0052】
データセットMのうち、上記支持度、信頼度要求を満たす非0ベクトルは、抽出され、次にデータセットMのうちの各元素は、ノードデータ及び異常状態タイプに応じて[CV,Fi]の形式に分割し、第2サンプルデータセットを構成し、CVは、抽出されたサンプルデータを表し、異常状態タイプの値Fiに対応する。
【0053】
生データセット、第1サンプルデータセット及び第2サンプルデータセットの相違としては、
生データセット、第1サンプルデータセットは、同じ次元及びサンプル数を有し、第1サンプルデータセットは、生データセットにK平均値クラスタリング及び自己エンコーディング処理が行われて生成されたものである一方、第2サンプルデータセットは、第1サンプルデータセットに相関ルールアルゴリズム処理が行われて生成されたものであり、対応する異常状態タイプと強い相関を有するデータサンプルのみを含み、そのサンプル数量は第1サンプルデータセットよりも大幅に少なくなる。
3.第3層データマイニング
【0054】
先の二層データマイニングの後、生データは分類され、能動配電網異常状態タイプと強い相関関係を有するデータサンプルはマイニングされて、第2サンプルデータセットを構成した。
【0055】
具体的な例として、生データセットにおいて40,000セットのデータがあり、処理後の第2サンプルデータセットにおいてデータが25,000~30,000セットとなり、データ量が大幅に低減した。
【0056】
図2を参照すると、第3層データマイニングは、第2サンプルデータセットを訓練セットとし、確率的勾配降下(SGD)アルゴリズムを採用して回帰訓練により、異常状態予測モデルの最適パラメータを取得する。
【0057】
確率的勾配降下アルゴリズムは、反復最適化アルゴリズムであり、常に、機械学習におけるモデルパラメータの最適化問題を解決するために用いられる。確率的勾配降下アルゴリズムは、勾配降下アルゴリズムの改良形式であり、テキスト分類、自然言語処理等の大規模スパース機械学習の問題に成功に適用された。勾配は、多変量関数のパラメータ偏微分を取得し、それを1つのベクトルを構成するためのものである。勾配におけるすべての偏微分がいずれも0となると、モデルパラメータの最適解が得られる。確率的勾配降下アルゴリズムでは、反復するたびに、1つサンプルデータのみをランダム使用し、サンプルの総量が多い場合、一部のサンプルしか反復算出に使用されないため、モデルの訓練時間を短縮する。
【0058】
本実施例は、第2サンプルデータセットを訓練セットとし、各ノードの電圧データの重みが線形的であるとすると、これによって線形的モデル関数が構築され、下記の通りである。
ただし、wは予測モデル関数の重みベクトルであり、bは予測モデル関数のインターセプトを表し、w
T(CV
j)はベクトルwとベクトルCV
jとのスカラー積を表す。
【0059】
ロス関数は、実際異常状態タイプ値F
iとモデル予測値f(CV
j)との間の差を測定するためのもので、L(F
i,f(CV
j))で表され、本発明はロジスティック回帰ロス関数を採用し、算出式として、
である。
【0060】
リスク関数はロス関数の所望値であり、Erで表され、算出式として、
である。
【0061】
これによって分かるように、目的関数はリスク関数を最小化することになるが、履歴データが多く、関数が複雑であるため、予測結果のオーバーフィッティングにつながりやすい。このような状況を回避するために、本発明は、構造リスク関数を導入して、Srで表すと、
であり、
ただし、αは設定されたハイパーパラメータ、例えば0.1であり、αを設定することでパラメータの範囲を小さくして、モデルを簡略化する目的を達成するとともに、モデルによい一般化能力を具備させる。正則化項R(w)は、ロス関数の複雑さを測定するためのもので、ロス関数パラメータを規制する役割を果たす。本実施例では、L2正則化を採用し、即ち、
である。
【0062】
本実施例では、最適化目的関数により予測モデルのフィット度を測定し、リスク関数及び構造リスク関数が小さいほど、モデルフィット度合いは高くなり、最終的に最適化目的関数として、
であり、
wは予測モデル関数の重みベクトルであり、bは予測モデル関数のインターセプトを表し、nは第2サンプルデータセット総量であり、F
iは異常状態タイプの値である。
【0063】
確率的勾配降下アルゴリズムでは、毎回に一部のテストセットを用いて反復算出し、反復する時に、モデルパラメータは下記式で更新される。
ただし、ηは、経時的な学習率であり、算出式として、
であり、
ただし、tはタイムステップであり、t
0は始まる時間である。
【0064】
本実施例では、三層データマイニング構造から、順次にクラスタリングアルゴリズム、相関ルール、確率的勾配降下により生データを処理して、能動配電網異常状態の予測モデルを訓練し、異常状態分類、及び予測精度が低く、時間が長い問題を対応的に解決することができ、異常状態継続時間を短縮し、断電損失を低減するように、タイムリーに対応措置を講じることに寄与する。
【0065】
他の異常状態の感知予測方法は上記工程と類似する。
【0066】
本実施例方法の効果を検証するために、本実施例では、IEEE三機九ノードシステムを例とし、このモデルの上で、一般的な4種類の短絡故障及び負荷異常と断線故障をデバッグするとともに、ノード電圧データを収集し、短絡故障は、故障ノードをノード8に設定し、負荷異常設置はノード8での負荷脱落であり、断線故障設置は、線路7-8切断であり、,ノード8を除く他のノードの電圧データを収集する。
(1)第1層データマイニング
【0067】
K平均値クラスタリングアルゴリズムでは、まずエルボー法で適当なK値をクラスタリング数として特定し、四タイプの短絡故障が発生した時に、ノード2の短絡電圧幅値データを抽出し、エルボー法により、取得した誤差二乗和SSEとK値の曲線を
図3に示す。
図3から分かるように、K=5の時に、傾斜の低下速度が最速であり、K>5の時に、SSEの変化が緩やかなので、エルボ部位に対応する参照K値が5となり、最終的なK値を5以上の値としてもよい(最終的なK値が5未満の場合に、分類が十分に細かくなく、データの集約度が十分に高くない)。このようにK値の範囲を小さくし、より適当なK値を速く取ることに寄与する。
【0068】
最終的なK値は5以上である場合に、データ間の類似性特徴が失われないが、数値が大きすぎると、再びクラスタリング数が多すぎるようになってしまう。本実施例のデータサンプル容量を合わせて、以降の自己エンコーディングの工程において、クラスタリング数が小さいためデータフォーマットが頻繁に重複することがなく、クラスタリング数が多すぎるとデータフォーマットが煩雑にならず、第2層データマイニングがスムーズに進むように、今回の実験で、K=5である上で、K値を順次増加して選択する試験を行い、最終的にK=8を決め、全てのデータサンプルが8類に分けられ、各クラスタリングのデータがより大きな類似性を有する。
【0069】
データは分類された後、自己エンコードルールに応じてデータフォーマットを簡略化し、三相短絡故障発生後のノード2の電圧データを例とし、その電圧値は区間[-16.01kV,15.85kV]にあり、8類に分けられると、各類が[-16.01kV,-12.03kV]、[-12.03kV,-8.04kV]、[-8.04kV,-4.06kV]、[-4.06kV,-0.08kV]、[-0.08kV,3.90kV]、[3.90kV,7.88kV]、[7.88kV,11.87kV]、[11.87kV,15.85kV]となり、ある時刻の電圧値が5.36kVとなる時に、自己エンコードルールに応じて、そのデータフォーマットが206になり、負荷異常発生後のノード4の電圧データを例として、その電圧値は区間[-196.582kV,206.754kV]にあり、8類に分けられると、各類が[-196.582kV,-146.1648kV]、[-146.164kV,-95.747kV]、[-95.747kV,-45.330kV]、[-45.330kV,5.086kV]、[5.086kV,55.503kV]、[55.503kV,105.920kV]、[105.920kV,156.337kV]、[156.337kV,206.754kV]となり、ある時刻の電圧値が20.048kVとなる時に、自己エンコードルールに応じて、そのデータフォーマットが405になり、断線故障発生後のノード1電圧データを例として、その電圧値は区間[-14.454kV,14.468kV]にあり、8類に分けられると、各類が[-14.454kV,-10.839kV]、[-10.839kV,-7.224kV]、[-7.224kV,-3.608kV]、[-3.608kV,0.006kV]、[0.006kV,3.621kV]、[3.621kV,7.237kV]、[7.237kV,10.852kV]、[10.852kV,14.468kV]となり、ある時刻の電圧値が9.581kVとなる時に、自己エンコードルールに応じて、そのデータフォーマットが107になる。残りのノードの電圧データは同様の処理工程が行われて、その最終的な結果を表1に示す。
【0070】
表1データベースI一部の自己エンコーディングデータ
(2)第2層データマイニング
【0071】
1回目のデータマイニングの後に、将データベースIにおけるデータをAprioriアルゴリズムに入力して、強い相関データマイニングを行う。まず、予め最小支持度を0.2、最小信頼度を0.8、データベースIのうち最小支持度を満たすデータサンプルを頻繁なアイテムセット、頻繁なアイテムセットのうち最小信頼度を満たすデータを強い相関データとして設定する。2回目のデータマイニングの結果を表2に示す。
【0072】
【0073】
番号8の相関ルール{205、407、603}→{130}を例として、ノード2の電圧が第5クラスタリングにあり、ノード4の電圧が第7クラスタリングにあり、ノード6の電圧が第3クラスタリングにある時に、異常状態タイプが二相対地間短絡である可能性が非常に高いことが表され、番号11の相関ルール{508}→{140}を例として、ノード5の電圧が第8クラスタリングにある時に、異常状態タイプが負荷異常である可能性が非常に高いことが表され、番号14の相関ルール{105、405、603}→{150}を例として、ノード1の電圧が第5クラスタリングにあり、ノード4の電圧が第5クラスタリングにあり、ノード6の電圧が第3クラスタリングにある時に、異常状態タイプが断線故障である可能性が非常に高いことが表される。相関ルールアルゴリズムにより、得られたデータベースIIを表3に示す。
【0074】
表3 データベースII部分のデータ
(3)3回目のデータマイニング
【0075】
3回目のデータマイニングにおいて、ハイパーパラメータαを0.1、反復回数を500回に設定する。データベースIIデータサンプルを確率的勾配降下アルゴリズムに入力して訓練されたモデルパラメータを表4に示す。
【0076】
【0077】
上記分類及び予測モデルの正確性を測定するために、本明細書で10000個のデータサンプルをテストセットとする。異常状態分類及び予測の正確性は高く、三相短絡故障予測モデルの正確率が85.30%、単相対地間短絡故障モデルの正確率が74.80%、二相相間短絡モデルの正確率が78.20%、二相対地間短絡予測モデルの正確率が87%、負荷異常予測モデルの正確率が93.29%、断線故障予測モデルの正確率が89.25%である。
【0078】
本方法では、三層データマイニングから、まずクラスタリング及び自己エンコーディングにより、すべてのデータサンプルフォーマットを簡略化し、あるノードのデータに固定のK種類フォーマットのみがあることについて、生成する可能性がある異常データ及びドット抜けと正常データとの違いを効果的に消去し(例えば幅値の急激な変化やデータの欠落)、同時にデータ間の類似性を十分にマイニングし、例えば負荷異常時に、ノード4における電圧データのうち、15個の異常データサンプルが生じ、クラスタリング及び自己エンコーディングの後に、これらの異常データ点はいずれも第8クラスタリングに属し、即ちこれらのデータフォーマットがいずれも408であり、この場合に、第8クラスタリングに多量データがあれば、自己エンコーディングによりこれらの異常データ点を正常データに同化して、異常データ及びドット抜けの影響を低減させ、第8クラスタリングにこの15個のデータサンプルのみがあれば,第2層強い相関により抽出すると、これらのデータを低減することができる。
【0079】
第2層データマイニングにより、支持度及び信頼度の2つの数値化基準従って、異常状態強い相関のデータサンプルを抽出して、アルゴリズムがモデル訓練を行うフォールトトレランスを向上させ、モデル訓練の正確さを増加する。
【0080】
従来方法のフォールトトレランスに比べると、本方法で、生データの状況を直接に考慮せず、まずデータを処理し、フォールトトレランスが向上するとともに、データサンプルの数が低減し、訓練時間が短縮し、モデルが訓練を行う時間は約350秒であり、予測時間は20秒内である。
【0081】
本実施例の異常状態検知方法と、従来のサポートベクターマシンを直接に利用して異常状態感知を行う方法とを比較すると、表5、表6及び表7は、それぞれ予測正確さ、予測時間及びフォールトトレランスの面で比較結果を出す。
【0082】
【0083】
【0084】
表7 フォールトトレランス比較(予測正確さによる数値化)
【0085】
上記の比較結果から、本実施例の方法では、予測時間、予測正確さ及びフォールトトレランスの面で、いずれも従来のサポートベクターマシンの方法よりも明らかに優れることが得られる。
実施例2
【0086】
1つ又は複数の実施形態において、
配電網異常状態発生後のノードパラメータデータを取得するためのデータ取得モジュールと、
前記データを訓練済みの配電網異常状態予測モデルに入力し、配電網短絡異常状態予測結果を出力する故障予測モジュールと、を含み、
前記配電網異常状態予測モデルの訓練工程は、配電網履歴異常状態ノードパラメータデータをクラスタリングし、相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップと、前記サンプルデータセットに基づいて配電網異常状態予測モデルの訓練を行うステップとを含むデータドライブの能動配電網異常状態検知システムを開示する。
【0087】
説明すべきこととしては、本実施例の上記モジュールの具体的な実現方法は既に実施例1において詳細に説明され、ここでは重複に説明しない。
【0088】
上記図面を参照しながら本発明の具体的な実施形態を説明したが、本発明の保護範囲を限定するものではなく、当業者は、本発明の技術的解決策の上で、当業者が創造的な労力の必要がなく行い得る様々な修正又は変形が依然として本発明の保護範囲内にあることを理解すべきである。
【手続補正書】
【提出日】2022-11-02
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
能動配電網異常状態感知システムがデータドライブの能動配電網異常状態検知
する方法であって、
データ取得モジュールが、配電網異常状態発生後のノードパラメータデータ
として複数のノードのノード電圧データを取得し、
異常状態予測モジュールが、前記データを訓練済みの配電網異常状態予測モデルに入力して、配電網異常状態予測結果を出力するステップを含み、
能動配電網異常状態感知システムが、前記配電網異常状態予測モデル
を訓練
する工程は、
配電網履歴異常状態
発生後に取得した複数の前記ノードの前記ノード電圧データを、ノードごとに予め定められたノード電圧データをクラス分けする複数の電圧区間にそれぞれ参照することにより、取得した前記ノード電圧データが該当するクラスの番号Cを前記ノードごとに求め、これにより、各ノードのノード電圧データをクラスタリング
するとともにクラスタリング後のデータサンプルを自己エンコードし、
ノードごとのノード番号Nとノード電圧データのクラスの番号Cとを並べたN0C、および、予め定めた複数の異常状態タイプのうち現在発生している異常状態タイプを示す値F
i
から構成される第1サンプルデータセットを形成するステップであって、第1サンプルデータセットにおける元素はベクトルであり、各ベクトルはTV及びF
iから構成され、TV={N0C
1,N0C
2,...,N0C
a}
であり、
Nは、データを収集した各ノードの位置を表し、C値の範囲は[1, K]であり、Kはクラスタリング数であり、aはデータ収集
したノード番号であり、F
iは
、予め定めた複数の異常状態タイプ
のうち現在発生している異常状態タイプを示す値であ
るステップと、
相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップであって、具体的に、第1サンプルデータセットにおける各ベクトルのTV及びF
iの2種類元素を1種類元素として併合し、新たなデータセットM:{Z
1,Z
2,…,Z
i}を構成し、Z
iは1つの自己エンコーディング後のデータと対応する異常状態タイプとからなる新たなベクトルを表し、iは新たなベクトルの数であり、頻繁なアイテムセットの支持度及び信頼度を用いて前記新たなベクトルのうちの2つ又は複数の元素の間の繋がりを数値化し、支持度及び信頼度要求を満たす非0ベクトルを抽出して、訓練用のサンプルデータセットである第2サンプルデータセットを形成することを含むステップと、
前記訓練用のサンプルデータセットに基づいて前記配電網異常状態予測モデルの訓練を行うステップであって、
前記配電網異常状態予測モデルは、具体的に、
であり、
ただし、wは予測モデル関数の重みベクトルであり、bは予測モデル関数のインターセプトを表し、w
T(CV
j)はベクトルwとベクトルCV
jのスカラー積を表し、ベクトルCV
jは訓練サンプルであるステップと、
目的関数を最適化することによって前記配電網異常状態予測モデルのフィット度を測定するステップであって、前記目的関数の最適化は具体的に、
であり、
ただし、L(F
i,f(CV
j))はロス関数を表し、αがハイパーパラメータで設定値であり、R(w)は正則化項であり、nはサンプルデータセット総量であり、F
iは異常状態タイプの値であるステップと、
得られたサンプルデータセットに基づいて、確率的勾配降下アルゴリズムを用いて回帰訓練を行い、配電網異常状態予測モデルの最適なパラメトリック解を取得するステップであって、確率的勾配降下アルゴリズムは毎回に一部分テストセットを利用して反復算出し、反復する時に、モデルパラメータは下記の式で更新され、
ただし、ηは、経時的な学習率であり、算出式としては、
であり、
ただし、tはタイムステップであり、t
0は始まる時間であるステップと、を含む、
ことを特徴とするデータドライブの能動配電網異常状態検知方法。
【請求項2】
配電網履歴異常状態ノードパラメータデータをクラスタリングする前記工程は、具体的に、
ユークリッド距離に基づいてデータサンプルを分類するステップと、
判別関数によってデータサンプルクラスタリングが完成したか否かを判断するステップと、
誤差二乗和を算出し、SSE-Kグラフによって参照されるクラスタリング数を特定し、前記参照されるクラスタリング数に基づいて最終的なクラスタリング数を特定するステップと、を含む、
ことを特徴とする請求項1に記載のデータドライブの能動配電網異常状態検知方法。
【請求項3】
データドライブの能動配電網異常状態感知システムであって、
配電網異常状態発生後のノードパラメータデータ
としてノード電圧データを取得するためのデータ取得モジュールと、
前記データを訓練済みの配電網異常状態予測モデルに入力し、配電網異常状態予測結果を出力する異常状態予測モジュールと、を含み、
前記配電網異常状態モデルの訓練工程は、
配電網履歴異常状態
発生後に取得した前記ノード電圧データを、ノードごと予め定められたノード電圧データをクラス分けする複数の電圧区間に参照することにより、取得した前記ノード電圧データが該当するクラスの番号Cを求め、これにより、各ノードのノード電圧データをクラスタリング
するとともにクラスタリング後のデータサンプルを自己エンコードし、
ノードごとのノード番号Nとノード電圧データのクラスの番号Cとを並べたN0C、および、予め定めた複数の異常状態タイプのうち現在発生している異常状態タイプを示す値F
i
から構成される第1サンプルデータセットを形成するステップであって、第1サンプルデータセットにおける元素はベクトルであり、各ベクトルはTV及びF
iから構成され、TV={N0C
1,N0C
2,...,N0C
a}
であり、
Nは、データを収集した各ノードの位置を表し、C値の範囲は[1, K]であり、Kはクラスタリング数であり、aはデータ収集
したノード番号であり、F
iは
、予め定めた複数の異常状態タイプ
のうち現在発生している異常状態タイプを示す値であ
るステップと、
相関ルールアルゴリズムにより、配電網異常状態タイプと強い相関を有するデータサンプルを見つけて、訓練用のサンプルデータセットを形成するステップであって、具体的に、第1サンプルデータセットにおける各ベクトルのTV及びF
iの2種類元素を1種類元素として併合し、新たなデータセットM:{Z
1,Z
2,…,Z
i}を構成し、Z
iは1つの自己エンコーディング後のデータと対応する異常状態タイプとからなる新たなベクトルを表し、iは新たなベクトルの数であり、頻繁なアイテムセットの支持度及び信頼度を用いて前記新たなベクトルのうちの2つ又は複数の元素の間の繋がりを数値化し、支持度及び信頼度要求を満たす非0ベクトルを抽出して、訓練用のサンプルデータセットである第2サンプルデータセットを形成することを含むステップと、
前記訓練用のサンプルデータセットに基づいて前記配電網異常状態予測モデルの訓練を行うステップであって、
前記配電網異常状態予測モデルは、具体的に、
であり、
ただし、wは予測モデル関数の重みベクトルであり、bは予測モデル関数のインターセプトを表し、w
T(CV
j)はベクトルwとベクトルCV
jのスカラー積を表し、ベクトルCV
jは訓練サンプルであるステップと、
目的関数を最適化することによって前記配電網異常状態予測モデルのフィット度を測定するステップであって、前記目的関数の最適化は具体的に、
であり、
ただし、L(F
i,f(CV
j))はロス関数を表し、αはハイパーパラメータで設定値であり、R(w)は正則化項であり、nはサンプルデータセット総量であり、F
iは異常状態タイプの値であるステップと、
得られたサンプルデータセットに基づいて、確率的勾配降下アルゴリズムを用いて回帰訓練を行い、配電網異常状態予測モデルの最適なパラメトリック解を取得するステップであって、確率的勾配降下アルゴリズムは毎回に一部分テストセットを利用して反復算出し、反復する時に、モデルパラメータは下記の式で更新され、
ただし、ηは、経時的な学習率であり、算出式としては、
であり、
ただし、tはタイムステップであり、t
0は始まる時間であるステップと、を含む、
ことを特徴とするデータドライブの能動配電網異常状態感知システム。