【文献】
山本 貴大、外2名,クラスタリングを用いた直交変調信号の同定,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2008年 5月22日,第108巻,第62号,p.65−69
【文献】
殿村 正延、外1名,多層パーセプトロンにおける内部情報最適化アルゴリズムと汎化能力の解析,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,2001年 5月 1日,第J84−D−II巻,第5号,p.830−842
(58)【調査した分野】(Int.Cl.,DB名)
前記処理装置による前記クラスタの生成が、前記獲得された遷移信号を再整合するステップと、遷移と遷移、遷移とシグネチャ、およびシグネチャとシグネチャの距離の比較の少なくとも1つを行うステップとを含む請求項1に記載の方法。
前記処理装置による前記クラスタの生成が、同様の遷移信号および同様のクラスタをマージするステップと、獲得された新たな遷移信号のクラスタリングに適用可能な前記比較およびクラスタ規則の新たなパラメータを計算するステップとを含む請求項1に記載の方法。
請求項1〜5のいずれか一項に記載の方法のステップを行うための、処理装置と、前記処理装置によって実行される実行可能命令を記憶するメモリとを有するコンピュータシステム。
請求項1〜5のいずれか一項に記載の方法のステップを行うためのコンピュータシステムによって実行される実行可能命令を記憶する非一時的な有形のコンピュータ可読記憶媒体。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の目的は、遷移信号をクラスタリングするシステムおよび方法であって、同様の遷移を1つの特性シグネチャに再グループ化して、各グループに関してより少数のシグネチャ、例えば1グループ当たり1つのシグネチャを処理するシステムおよび方法を提供することである。シグネチャがより少ないので、計算時間が短縮される。個々の成分よりも雑音の少ないシグネチャにより、処理結果がはるかに正確になり、また結果が予め分類されている。
【課題を解決するための手段】
【0006】
本発明の一態様によれば、遷移信号をクラスタリングするための方法であって、
遷移信号が来たときに遷移信号を獲得するステップと、
獲得された新たな遷移信号がそれぞれ、前に獲得された同様の遷移信号と共に1つのクラスタに入るように、比較およびクラスタリング規則に基づいて、同様の遷移信号からなるクラスタを超空間内で動的に生成するステップと、
クラスタを解析して、クラスタに集められた遷移信号によって定義されるそれぞれのシグネチャを決定するステップと、
シグネチャを処理して、遷移信号の固有の属性に関連付けることができる現象を検出するステップと
を含む方法が提供される。
【0007】
本発明の別の態様によれば、処理装置と、上記の方法のステップを行うために処理装置によって実行すべき実行可能命令を記憶するメモリとを有するコンピュータシステムも提供される。
【0008】
本発明の別の態様によれば、上記の方法のステップを行うためにコンピュータシステムが実行すべき実行可能命令を記憶する非一時的な有形のコンピュータ可読記憶媒体が提供される。
【0009】
以下、本明細書において、以下の図面を参照しながら好ましい実施形態の詳細な説明を述べる。
【発明を実施するための形態】
【0011】
本開示において、時間または空間は、任意の他の性質を有する任意の他の次元に置き換えることができる。
【0012】
本発明は、母集団の一部に関して反復的な特性を有する遷移信号に関する。用語「反復」は、その時間または空間内で同じ遷移を複数回観察することができることを意味するものと理解されたい。これらの遷移は、変化することがある振幅を有し、また、雑音、測定誤差、遷移キャリアの時間的もしくは空間的な歪み、または任意の他のモデル化可能な現象によって(デジタルで、解析的に、または統計的に)説明することができる低い非類似特性も有する。
【0013】
本発明は、遷移が測定システムによって捕捉されるか、または適切なデバイスによって獲得されるときに、遷移を動的に再グループ化することを提案する。用語「再グループ化」によって、同様の遷移が同じグループに集められることを意味するものと理解されたい。したがって、所与のグループが少なくとも1つの遷移を含み、その結果、複数の遷移が関連付けられる少なくとも1つのグループが生じる。用語「非動的なグループ化」は、得られるすべての遷移との比較が行われることを意味する。これは、より最適に近いが、この手法の計算時間は膨大である。
【0014】
空間
【数1】
(ここで、Nは、遷移を特徴付ける時間点または空間点の数)内で表すと、グループ化は、この超空間内に点の雲のように現れる。グループ化の遷移の平均に対応するグループ化の質量中心をシグネチャと呼ぶ。
【0015】
遷移と遷移、遷移とシグネチャ、またはシグネチャとシグネチャの比較は、比較する両要素間の相関を最大にするため、または距離を最小にするために、時間または空間シフトを必要とする。距離ベースの比較基準の場合、このシフトは、
【数2】
が遷移XとシグネチャSとの間の距離を表すように、ゼロ次で、1ブロックで実現される。遷移(またはシグネチャ)を補間して伸縮させることによって、1次シフトを実現することが可能である。2次についても同じである。さらに、動的時間伸縮型の方法を、距離計算のためのシフティング手段とみなすことができる。基本的には、比較する両要素間の適切なシフトは、比較時に行われる。
【0016】
図1を参照すると、本発明による方法は以下のように進む。ブロック2によって示されるように、遷移が捕捉され、ブロック4によって示されるように、遷移は、クラスタシグネチャを有する動的クラスタ構成に関してクラスタリングを受ける。ブロック6によって示されるように、シグネチャが解析され、ブロック8によって示される精査中の遷移の特性に関係付けられるさらなる処理に有用なシグネチャ特性を決定する。この方法は、処理装置と、上述したステップを行うために処理装置によって実行すべき実行可能命令を記憶するメモリとを有するコンピュータシステムで実装することができる。また、この方法は、この方法のステップを行うためにコンピュータシステムが実行すべき実行可能命令を記憶する非一時的な有形のコンピュータ可読記憶媒体の形態を取ることもできる。
【0017】
以下に、部分放電検出、位置特定、および解析に関連した本発明の一実施形態の一例を与える。本発明は、そのような実施形態および適用例に限定されず、本発明から逸脱することなく変更および修正を施すことができることを理解されたい。
【0018】
本発明による方法は、動的時間クラスタリングによる電圧遷移分類のために使用することができる。地下配電網において、数秒で数百の信号遷移を捕捉することができ、それらの多くが部分放電(PD)である。各遷移ごとの信号処理およびパターン認識には時間がかかる。M個の遷移をI個のクラスタにグループ化することにより、処理時間が劇的に短縮され、対応するI個のシグネチャの信号対雑音比が大幅に高められる。クラスタリングは、数百次元Nにわたって行うことができ、各次元が信号時間サンプルに対応する。遷移の時間位置は時間ジッタによって損なわれるので、T回の異なる時間整合に関して距離関数が計算される。k−meansアルゴリズムと同様のヒューリスティックが、「スフェアハードニング(sphere hardening)」現象に基づいて説明され、I個のクラスタに関してO(T×N×M×I)の複雑さを有する。クラスタリングプロセスの精度を査定するため、およびこの方法のいくつかのパラメータを最適化するために、様々なツールが提案される。
【0019】
本発明により処理すべき信号は、例えば、1Gs/sでサンプリングし、フィルタし、補間し、切り捨てることができる。数百個の時間サンプルNが遷移パターンを表す。PD放出位置「i」に関して、様々な振幅にわたる一定の正規化時間シグネチャs
i(t)を仮定すると、
x
m(t)=a
m・s
i(t−t
m)+n
m(t) (1)
が得られる。これは、遷移シグネチャの測定「m」の実現であり、ここで、a
mは実現振幅であり、t
mは実現遅延であり、n
mは加法性雑音である。対応するモデリングは、打切りにより、
X
mn=a
m・S
n-dm+n
mn (2)
となる。1つのアナログ入力スケールにわたって取られる連続する測定値を、シーケンスと呼ぶ。a
mダイナミックレンジは、1シーケンスに関して10dB未満でよく、すなわち、トリガ設定レベルに対するクリッピングレベルの比である。第1のクラスタリングステップは、固定スケールに関して行うことができる。次いで、第2のステップで、様々なA/Dスケールから得られるクラスタをマージすることによって、フルダイナミックレンジを得ることができる。いくつかの場合には、a
mダイナミックレンジは、30dBを超えることがある。
【0020】
ガウス雑音を仮定し、a
mダイナミクスを無視すると、
【数3】
投射は、「i」シグネチャ
S
i={S
i,1,S
i,2,...,S
i,N} (3)
を中心とする超球を示す。ここで、測定値
X
m={X
m,1,X
m,2,...,X
m,N} (4)
は、超球境界に近い。境界の厚さは、計量、測定信号対雑音比(SNR)、および時間サンプルNの数の関数である。ユークリッド計量では、距離
【数4】
は、x
m∈クラスタ「i」に関して、期待平均値
【数5】
と、標準偏差
【数6】
とを有する。
【0021】
図2を参照すると、半径および超球境界厚さは、
【数7】
において、それぞれr
iおよび2・σ
iで示される。超球半径に対する境界厚さの比は、N→∞のときには0となる傾向がある。この現象は、スフェアハードニングと呼ばれる。多数の雑音サンプルを使用して計算すると、距離X
m−S
iは、ほとんど一定でない。超球の境界付近以外では、超球内に測定値はない。
【0022】
【数8】
では、クラスタ確率密度は、同様の半径および厚さを有する分散されたシェルのように見える。大きなa
mダイナミクスが存在する場合、単一点のシグネチャが、軸の原点に向いたロッドに置き換えられる。対応するシェルは、ロッドの軸に沿って拡げられる。シェル厚さは、ロッドの方向で増加する。シグネチャは、異なる振幅ダイナミクス伸長関数を有する分散されたシェルのように見える。適切な計量の使用により、このシェル歪みを一部克服することができる。
【0023】
動的クラスタリングでは、クラスタの数およびクラスタ重心位置を動的に調節することができる。作業次元は、I
max(最大許容シグネチャ)およびI
min(最小許容シグネチャ)によって制限されることがある。シーケンスのプロセス中に、シグネチャに対する平均距離測定値の移動推定(running estimation)を行うことができる。平均距離は、雑音と振幅ダイナミクスの寄与を含む。最大許容距離は、平均距離rに距離係数c
distを乗算した値として定義される。この係数は、約1.5に設定することができる。プロセスは、比較およびクラスタリング規則に基づいて以下のように進むことがある。
− 新たなシグネチャとして、第1のI
min測定値を記憶する;
− 次の測定値に関して、シグネチャに対する最も近い距離測定値を見出す;
− 最も近い距離が最大許容距離未満である場合、
− 測定値を最も近いシグネチャにマージして、平均距離rを再推定する、
− そうでない場合、シグネチャ対シグネチャ距離を計算して、最も近いシグネチャ対シグネチャ距離を見出す;
− 距離が最大許容距離未満である場合、
− 最も近い2つのシグネチャをマージして、平均距離rを再推定する、
− そうでない場合には、測定値を新たなシグネチャとするか、あるいは、I
maxを超えている場合には、測定値を最も近いシグネチャとマージさせる;
− 最後の測定後、2T→Tに関して、時間整合のスパンが倍増され:
1.シグネチャ対シグネチャ距離を計算し;
2.最も近いシグネチャ対シグネチャ距離を見出し;
3.最も近い距離が最大許容距離未満である場合:
4.最も近い2つのシグネチャをマージし、新たなシグネチャに対するシグネチャ距離を計算し、結果を、シグネチャ対シグネチャ距離三角行列に挿入し、ステップ2に戻る:
5.そうでない場合には、停止する。
【0024】
スフェアハードニングを使用して結果を精密化することができる。すなわち、球面境界から離れた測定値を再処理して、別のクラスタに割り振りし直すことができる。しきい値は、
【数9】
に比例的に固定することができ、ここで、var(σ
i)は、σ
i推定値に対する分散の不確かさである。
【0025】
r
i≒r
jと仮定すると、平均距離
【数10】
は、クラスタ生成中に計算された最小距離D
m,iから再帰的に推定される。この平均距離
【数11】
は、測定値の雑音と、シグネチャ位置誤差とを含む。右側の因子、すなわちクラスタ母集団P
iの関数は、シグネチャ位置の分散を考慮に入れる。係数bは、重み付け係数>1である。
【0026】
新たなシグネチャ計算に関して、マージプロセス
【数12】
は、
【数13】
であり、ここで、P
iおよびP
jは、クラスタ母集団である。マージ前、シグネチャは、最小距離に対して時間整合される。シグネチャ時間整合も、クラスタ母集団によって重み付けされる。
【数14】
ここで、dは、サンプルの数で表現されるシグネチャ間の距離である(式5)。測定値の到着の順序は、最終結果へわずかに影響を及ぼすが、最後には、
【数15】
となる。
【0027】
様々な計量のうち、試験されたT回の時間整合にわたって計算された二乗距離
【数16】
の最小値が、最良の結果を生み出すことができる。右側の項を最小にすることが、相関を最大にすることに相当することに留意されたい。多くの小さな雑音パターンがいくつかのPDシグネチャに相関するので、相関の最大化のみでは効果がないことがある。この計量では、PD振幅のばらつきの影響は、第2の項によって減少される。
【0028】
様々な測定スケールによって生成されるクラスタをマージするために行われる第2のクラスタリングで、相関(すなわち、ブラベ−ピアソン(Bravais−Pearson)係数)を使用することができる。この第2のステップでは、クラスタシグネチャSNRは高く、PDクラスタシグネチャと雑音シグネチャを間違うことはあり得ない。
【0029】
計算の複雑さは、シグネチャに対する距離測定に関しては、O(N×T×M×I)であり、シグネチャ対シグネチャ距離三角行列に関しては、O(N×T×M×I(I−1)/2)である。係数c
dist、I
max、およびI
minは、計算時間と、誤ったマージが生じる確率との折衷点を見出す。多数の測定値に関して、クラスタの数が安定化されるとき、シグネチャ対シグネチャ距離の計算はもはや必要ない。すなわち全体的な計算の複雑さは、O(N×T×M×I)になる傾向がある。
【0030】
精度測定値は、クラスタ分散およびクラスタ重畳に関するいくつかの情報を含むことがある。後者の情報はデータセットにわたって一定であるので、クラスタリングの誤りを表す1つまたは複数の精度推定値を使用してプロセスを最適化することがその狙いである。提案される推定値は、2つの相反する方向に基づく。一方で、クラスタ半径に対するクラスタ間の距離の比として定義される解像力が、クラスタ同士の重畳に関係する。他方で、コヒーレンシー、すなわち合計のクラスタエネルギーに対するコヒーレントエネルギーの比が、クラスタ自体に関係する。
【0031】
解像力
【数17】
は、クラスタ解像能力の尺度である。解像力
【数18】
は、信号対雑音比に対応し、ここで、RMSクラスタ間距離が信号であり、RMSクラスタ半径が雑音である。等式
【数19】
が、第1の項の分母を説明し、ΣP
i=Mである。
【0032】
クラスタ「i」のコヒーレンシー
【数20】
は、このクラスタのP
i要素から計算される。平均コヒーレンシー
【数21】
は、寄与するすべてのクラスタを考慮するシーケンスに関して定義される。最良の解に関して、解像力と平均コヒーレンシーはそれらの最大レベルであり、クラスタリングプロセスでの誤りの累積と共に減少するという仮説を使用することができる。
【0033】
図3は、典型的なPDシグネチャを示す。これらの結果は、地下配電網で取られた1730個のシーケンス(118932個の測定値)に関して得られている。最初のローブは、最も鋭く、ここではPD極性を負の値に設定する。解像力の値の範囲1〜10000は、対数(dB)スケーリングを必要とする。距離係数c
distは、解像力未満に設定しなければならない。
図4の左で、c
dist=10に関する0dBでの20カウントは、c
dist>解像力であるので、クラスタリングの誤りとして説明される。
【0034】
クラスタコヒーレンシーは、主に、小さな解像力を有するシーケンスに関して変えられる。
図5で、シーケンスのほとんどは、大きな解像力を有する。すなわち、c
distの値を10にシフトしても、コヒーレンシーに対してほとんど影響がない。しかし、同じシフトが、いくつかのシーケンスのクラスタ母集団を大幅に減少させる(
図6)。
図6は、最大許容シグネチャI
maxを30に設定することができることを示す。
図7は、c
distと共に減少する処理時間を示す。処理時間とクラスタリングの誤りの確率との折衷点は、データ自体と、診断目的での望ましい信頼度とによって設定される。後者および他の結果に基づいて、c
dist=1.5の設定が、データ母集団の99%超を対象とし、測定時間(約8秒)に近い処理時間を生み出す。
【0035】
時間領域での遷移のクラスタリングの寄与は、PRPD図でクラスタ区別によって認識される。
図8は、合計1182個の測定値に関する9個の他のクラスタのうち、65個の測定値からなる1つのクラスタを強調する。
【0036】
クラスタシグネチャに対して適用されるさらなる信号処理による、最初のステップの解析としての時間領域での遷移信号のクラスタリングは、少なくとも以下の点において有利である。すなわち、(1)情報が、多数の測定値ではなくいくつかのシグネチャに減少され、(2)SNRシグネチャが、クラスタ母集団と共に増加し、また(3)後処理の時間が短縮される。さらに、重畳されたクラスタが、PRPD図において区別される。説明した次善のヒューリスティックも、高速で正確である。複数のフィールドデータを使用する試験を、パラメータを調整するため、および本発明による方法での計量の選択を行うために実現することができる。