(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022029304
(43)【公開日】2022-02-17
(54)【発明の名称】クラスタ分類システム及びクラスタ分類方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20220209BHJP
G06F 16/906 20190101ALI20220209BHJP
【FI】
G06N20/00 160
G06F16/906
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2020132577
(22)【出願日】2020-08-04
(71)【出願人】
【識別番号】504255685
【氏名又は名称】国立大学法人京都工芸繊維大学
(71)【出願人】
【識別番号】000227467
【氏名又は名称】日東精工株式会社
(74)【代理人】
【識別番号】100137486
【弁理士】
【氏名又は名称】大西 雅直
(72)【発明者】
【氏名】寶珍 輝尚
(72)【発明者】
【氏名】成田 翔
(72)【発明者】
【氏名】林 喜弘
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FA03
(57)【要約】 (修正有)
【課題】複数のデータについてクラスタ分類を行った後でデータを追加して再分類した場合でも、クラスタ分類を適正に行うクラスタ分類システム及びクラスタ分類方法を提供する。
【解決手段】クラスタ分類システムは、複数の電気的信号に対する複数の特徴量ベクトルx
i(i=1~N)が、所定次数に基づいて第1所定数のクラスタに分類された後において、特徴量ベクトルx
N+1を追加して、それらの特徴量ベクトルx
i(i=1~N+1)を再分類する場合に、それらの特徴量ベクトルx
iの再分類に対する適正な次数を導出する適正次数導出部12と、適正次数導出手段12で導出された適正次数と所定次数とが同一でない場合に、それらの特徴量ベクトルx
iを、適正次数導出手段12で導出された適正次数に基づいて、第1所定数より多い第2所定数または第1所定数より少ない第3所定数のクラスタに再分類するクラスタ分析部14と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の電気的信号に対する複数の特徴量ベクトルxi(i=1~N)が、所定次数に基づいて第1所定数のクラスタに分類された後において、特徴量ベクトルxN+1の数を追加して、それらの特徴量ベクトルxi(i=1~N+1)を再分類する場合に、当該それらの特徴量ベクトルxiの再分類に対する適正な次数を導出する適正次数導出手段と、
前記適正次数導出手段で導出された適正次数と前記所定次数とが同一でない場合に、当該それらの特徴量ベクトルxiを前記適正次数導出手段で導出された適正次数に基づいて、前記第1所定数より多い第2所定数または前記第1所定数より少ない第3所定数のクラスタに再分類するクラスタ分析手段とを備えることを特徴とするクラスタ分類システム。
【請求項2】
前記クラスタ分析手段は、
前記適正次数導出手段で導出された適正次数が前記所定次数より大きい場合に、前記第1所定数のクラスタの少なくとも1つのクラスタを2つ以上のクラスタに分割して再分類することを特徴とする請求項1に記載のクラスタ分類システム。
【請求項3】
前記クラスタ分析手段は、
前記適正次数導出手段で導出された適正次数が前記所定次数より小さい場合に、前記第1所定数のクラスタに含まれる2つ以上のクラスタを1つのクラスタに統合して再分類することを特徴とする請求項1または2に記載のクラスタ分類システム。
【請求項4】
複数の電気的信号に対する複数の特徴量ベクトルxi(i=1~N)が、所定次数に基づいて第1所定数のクラスタに分類された後において、特徴量ベクトルxN+1の数を追加して、それらの特徴量ベクトルxi(i=1~N+1)を再分類する場合に、当該それらの特徴量ベクトルxiの再分類に対する適正な次数を導出する適正次数導出ステップと、
前記適正次数導出ステップで導出された適正次数と前記所定次数とが同一でない場合に、当該それらの特徴量ベクトルxiを前記適正次数導出手段で導出された適正次数に基づいて、前記第1所定数より多い第2所定数または前記第1所定数より少ない第3所定数のクラスタに再分類するクラスタ分析ステップとを備えることを特徴とするクラスタ分類方法。
【請求項5】
前記クラスタ分析ステップでは、
前記適正次数導出ステップで導出された適正次数が前記所定次数より大きい場合に、前記第1所定数のクラスタの少なくとも1つのクラスタを2つ以上のクラスタに分割して再分類することを特徴とする請求項4に記載のクラスタ分類方法。
【請求項6】
前記クラスタ分析ステップでは、
前記適正次数導出ステップで導出された適正次数が前記所定次数より小さい場合に、前記第1所定数のクラスタに含まれる2つ以上のクラスタを1つのクラスタに統合して再分類することを特徴とする請求項4または5に記載のクラスタ分類方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば複数のデータをクラスタリングにより分類するクラスタ分類システム及びクラスタ分類方法に関する。
【背景技術】
【0002】
従来から、複数の要素からなる集合の中から類似する要素を見つけ出して、いくつかの部分集合に分割するクラスタリングが知られている。クラスタリングには、階層的クラスタリングと非階層的クラスタリングとがあり、代表的な非階層的クラスタリングとして、k-meansやFuzzy c-means法がある。例えば、Fuzzy c-means法では、指定された数のクラスタ数に対する特徴量ベクトルxi(i=1~N)の帰属度ukiを初期化した後、クラスタ中心ベクトルμkの計算と帰属度ukiの更新とをクラスタ中心ベクトルμkが収束するまで繰り返すことにより、クラスタ中心ベクトルμkが計算される。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特徴量ベクトルxiは、振動波形データiに対するパワースペクトルspciを座標変換して得られた特徴量ベクトル(以下の説明では、振動波形データiに対する特徴量ベクトルと称する場合がある)であるが、複数の方向に対応した複数の成分を有しているのが一般的である。そのため、複数の成分から所定数の成分が抽出されて、その所定数の成分を使用して、クラスタ分類が行われる。例えば主成分分析により各成分の寄与率を演算して、その寄与率に基づいて適正な次数が導出され、寄与率の大きい成分が複数の成分のなかから抽出される場合がある。また、複数の振動波形データに対する特徴量ベクトルxiについてクラスタ分類を行った後で、振動波形データを追加して再分類することが考えられる。そのとき、当初、複数の特徴量ベクトルxiについてクラスタ分類を行う際には、所定数の成分を抽出して(所定次数に基づいて)クラスタ分類を行うのが適正であったが、新たに振動波形データを追加することにより、クラスタ分類を行う際に使用すべき適正な成分の数(適正な次数)が変化する場合がある。そのような場合に、適正でない次数に基づいてクラスタ分類を行うと、複数の振動波形データについてのクラスタ分類が適正に行われない問題がある。そこで、振動波形データを追加して再分類する場合に、クラスタ分類するときの次数を増減させて再分類することが考えられる。そのとき、次数が増加した場合は、分類されるクラスタ数が増える可能性があり、次数が減少した場合は、分類されるクラスタ数が減少する可能性がある。そのような場合に、クラスタ数を増減させて再分類した方が、複数の振動波形データについてのクラスタ分類が適正に行われる。
【0005】
本発明は、複数の特徴量ベクトルxiについてクラスタ分類を行った後で電気的信号を追加して再分類した場合でも、クラスタ分類を適正に行うことができるクラスタ分類システム及びクラスタ分類方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、かかる目的を達成するために、次のような手段を講じたものである。
すなわち、本発明に係るクラスタ分類システムは、複数の電気的信号に対する複数の特徴量ベクトルxi(i=1~N)が、所定次数に基づいて第1所定数のクラスタに分類された後において、特徴量ベクトルxN+1の数を追加して、それらの特徴量ベクトルxi(i=1~N+1)を再分類する場合に、当該それらの特徴量ベクトルxiの再分類に対する適正な次数を導出する適正次数導出手段と、前記適正次数導出手段で導出された適正次数と前記所定次数とが同一でない場合に、当該それらの特徴量ベクトルxiを前記適正次数導出手段で導出された適正次数に基づいて、前記第1所定数より多い第2所定数または前記第1所定数より少ない第3所定数のクラスタに再分類するクラスタ分析手段とを備えることを特徴とする。
【0007】
本発明に係るクラスタ分類方法は、複数の電気的信号に対する複数の特徴量ベクトルxi(i=1~N)が、所定次数に基づいて第1所定数のクラスタに分類された後において、特徴量ベクトルxN+1の数を追加して、それらの特徴量ベクトルxi(i=1~N+1)を再分類する場合に、当該それらの特徴量ベクトルxiの再分類に対する適正な次数を導出する適正次数導出ステップと、前記適正次数導出ステップで導出された適正次数と前記所定次数とが同一でない場合に、当該それらの特徴量ベクトルxiを前記適正次数導出手段で導出された適正次数に基づいて、前記第1所定数より多い第2所定数または前記第1所定数より少ない第3所定数のクラスタに再分類するクラスタ分析ステップとを備えることを特徴とする。
【0008】
本発明に係るクラスタ分類システム及びクラスタ分類方法では、複数の特徴量ベクトルxiが所定次数に基づいてクラスタ分類された後において、特徴量ベクトルxiを追加して再分類する場合に、クラスタ分類を行う際に使用すべき適正次数が新たに導出され、その適正次数が変動した場合に、クラスタ数が増減された後で再分類が行われる。そのため、複数のデータについての特徴量ベクトルxiについてクラスタ分類を行った後でデータを追加して再分類した場合でも、クラスタ分類を適正に行うことができる。
【0009】
本発明に係るクラスタ分類システムにおいて、前記クラスタ分析手段は、前記適正次数導出手段で導出された適正次数が前記所定次数より大きい場合に、前記第1所定数のクラスタの少なくとも1つのクラスタを2つ以上のクラスタに分割して再分類することを特徴とする。
【0010】
本発明に係るクラスタ分類方法において、前記クラスタ分析ステップでは、前記適正次数導出ステップで導出された適正次数が前記所定次数より大きい場合に、前記第1所定数のクラスタの少なくとも1つのクラスタを2つ以上のクラスタに分割して再分類することを特徴とする。
【0011】
本発明に係るクラスタ分類システム及びクラスタ分類方法では、データを追加することにより適正次数が増加した場合、既に複数のデータを分類したときに1つのクラスタに属するとされた複数のデータが、2つ以上のクラスタに属するように分類される方が適正である場合において、クラスタ分類を適正に行うことができる。
【0012】
本発明に係るクラスタ分類システムにおいて、前記クラスタ分析手段は、前記適正次数導出手段で導出された適正次数が前記所定次数より小さい場合に、前記第1所定数のクラスタに含まれる2つ以上のクラスタを1つのクラスタに統合して再分類することを特徴とする。
【0013】
本発明に係るクラスタ分類方法において、前記クラスタ分析ステップでは、前記適正次数導出ステップで導出された適正次数が前記所定次数より小さい場合に、前記第1所定数のクラスタに含まれる2つ以上のクラスタを1つのクラスタに統合して再分類することを特徴とする。
【0014】
本発明に係るクラスタ分類システム及びクラスタ分類方法では、データを追加することにより適正次数が減少した場合、既に複数のデータを分類したときに2つのクラスタに属するとされた複数のデータが、1つのクラスタに属するように分類される方が適正である場合において、クラスタ分類を適正に行うことができる。
【発明の効果】
【0015】
以上、本発明によれば、複数の電気的信号(データ)に対する特徴量ベクトルxiについてクラスタ分類を行った後で電気的信号(データ)を追加して再分類した場合でも、クラスタ分類を適正に行うことができる。
【図面の簡単な説明】
【0016】
【
図1】本発明の実施形態に係るクラスタ分類システムの構成を示した図である。
【
図2】
図1のクラスタ分類システムにおける分類方法を説明する図である。
【
図3】
図1のクラスタ分類システムにおける分類方法を説明する図である。
【
図4】カーネル密度推定により極値の個数を演算する方法を説明する図である。
【
図5】カーネル密度推定により極値の個数を演算する方法を説明する図である。
【
図6】カーネル密度推定により極値の個数を演算する方法を説明する図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態のクラスタ分類システム及びクラスタ分類方法について、図面を参照して説明する。本発明の実施形態に係るクラスタ分類システムは、
図1に示すように、振動検出センサ1と、振動検出センサ1が接続されたクラスタ分類装置2を備える。
【0018】
振動検出センサ1は、振動波形データを検出するものであり、ねじの圧造工程において、ねじを圧造する製造装置に取り付けられる。振動検出センサ1は、工具に割れがあるか否かの検査を行うための振動波形データを検出し、振動波形データはクラスタ分類装置2に供給される。ここで、振動検出センサ1は、圧電式、ストレンゲージ式、電磁式など任意の方式ものを使用することができる。
【0019】
クラスタ分類装置2は、制御部10によって制御される。制御部10は、CPU、メモリ及びインターフェースを含む通常のマイクロコンピュータを主体として構成されるもので、メモリに記憶されているクラスタ分類プログラムに従い所定の演算、処理を行って、周辺ハードウェアとの協働の下に、上記の振動検出センサ1から取り込んだ振動波形データを複数のクラスタに分類する。
【0020】
制御部10には、振動波形データ記憶部11と、適正次数導出部12と、特徴量ベクトル計算部13と、クラスタ分析部14と、集合決定部15と、演算部16と、判定部17とを有している。制御部10には、振動検出センサ1が接続される。
【0021】
振動波形データ記憶部11は、振動検出センサ1から供給された振動波形データを記憶する。
【0022】
適正次数導出部12は、クラスタ分析する際に使用する適正な次数を導出する。その適正次数は、クラスタ分析する複数のデータに応じて変化する場合がある。適正次数導出部12は、寄与率演算部12aを有している。
【0023】
寄与率演算部12aは、主成分分析法を使用して、振動波形データに対するパワースペクトルspciに含まれる複数の成分について各成分の寄与率を演算する。
【0024】
本実施形態において、適正次数導出部12は、既に集められた複数のデータについてクラスタ分類する場合に、その複数のデータについて適正な次数を導出する。また、適正次数導出部12は、複数のデータについてクラスタ分類した後で、新たにデータを追加してクラスタ分類する場合に、既にクラスタ分類された複数のデータおよび新たに追加されたデータについて適正な次数を導出する。
【0025】
以下、クラスタ分析する際に使用すべき適正な次数を導出する方法について説明する。
【0026】
クラスタ分析するための複数の振動波形データに対するパワースペクトルspc
iは、複数の方向に対応した複数の成分をそれぞれ有している。
【数1】
なお、番号は、第1成分、第2成分、・・・・・・第M成分(但し、Mは整数)を示している。
【0027】
N個のパワースペクトルspciの要素同士の積の和と、N個のパワースペクトルspciのm番目の要素の総和とは、それぞれ、下記のように表される。
【0028】
【数2】
なお、Nはデータ数、l及びmは要素番号を示している。
【0029】
【数3】
なお、Nはデータ数、mは要素番号を示している。
【0030】
そのため、N個の振動波形データに対するパワースペクトルspc
iを示した共分散行列Σの各要素は、下記のようになる。
【数4】
なお、Nはデータ数、l及びmは要素番号を示している。
【0031】
また、複数の振動波形データについてクラスタ分類した後で、新たに振動波形データを追加してクラスタ分類する場合は、既にクラスタ分類した際の共分散行列Σを更新する方法について説明する。
【0032】
N個の振動波形データに対するパワースペクトルspciの要素同士の積の和と、N個の振動波形データに対するパワースペクトルspciのm番目の要素の総和とは、それぞれ、下記のようにして更新する。
【0033】
【数5】
なお、Nは既にクラスタ分類したデータ数、l及びmは要素番号を示している。
【0034】
【数6】
なお、Nは既にクラスタ分類したデータ数、mは要素番号を示している。
【0035】
そのため、N+1個の振動波形データに対するパワースペクトルspc
iを示した共分散行列Σの各要素は、下記のようになる。
【数7】
なお、Nは既にクラスタ分類したデータ数、l及びmは要素番号を示している。
【0036】
N個のパワースペクトルspciを示した共分散行列Σを対角化すると、下記のようになる。なお、複数の振動波形データについてクラスタ分類した後で、新たに振動波形データを追加して共分散行列Σを更新した場合、N+1をNとする。
【0037】
【0038】
【0039】
上述した固有値から振動波形データに対するパワースペクトルspc
iが有する複数の成分の寄与率λを求める。
【数10】
なお、Nは振動波形データ数、Mは振動波形データに対するパワースペクトルの次数、kは要素番号を示している。
【0040】
複数のデータについてクラスタ分類するときの適正次数を評価するための寄与率λを含んで表される評価指標である平均情報量は、下記のように表される。
【数11】
【0041】
平均情報量は、複数のデータについてクラスタ分類するときの適正次数を評価するための評価指標と使用される。平均情報量の整数部分は、クラスタ分析する際に使用すべき適正な次数を示している。但し、平均情報量の整数部が0の場合は、適正次数を1とする。例えば、平均情報量の整数部分が2の場合は、適正次数が2であることを示し、平均情報量の整数部分が3の場合は、適正次数が3であることを示す。
【0042】
特徴量ベクトル計算部13は、振動波形データ記憶部11に記憶された複数の振動波形データに対するパワースペクトルspc
iから寄与率演算部12aで求められた変換行列T
Nおよびパワースペクトルの平均値M
N/Nを用いて、特徴量ベクトルx
iをそれぞれ計算する。
【数12】
【0043】
クラスタ分析部14は、適正次数導出部12により導出された適正次数に基づいて、クラスタkの数であるクラスタ数Cについて、クラスタ分析法により帰属度u
ki及びクラスタ中心ベクトルμ
kを計算する。本実施形態では、クラスタ分析法として、目的関数Jを最小化する手法であるFuzzy c-means法が使用される。適正次数が3の場合、分類に使用される特徴量ベクトルx
iは3つの要素からなるベクトルとなる。
【数13】
【0044】
クラスタ分析法において使用される目的関数Jは、下記のように表される。
【数14】
但し、x
iは振動波形データiに対する特徴量ベクトル、μ
kは各クラスタkの中心ベクトル(以下、クラスタ中心ベクトルという)、u
kiは振動波形データiの各クラスタkへの帰属度、Cはクラスタ数であり、qは2である。すなわち、添え字のiは振動波形データの識別、kはクラスタの識別を表す。
【0045】
(初期化)
まず、帰属度u
kiを初期化する。
【数15】
【0046】
本実施形態において、クラスタ分析部14は、初期化部14aと、初期値決定部14bと、座標変換部14cと、計算部14dと、記憶部14eとを有している。記憶部14eには、クラスタ分析部14により使用された種々の値が記憶され、記憶部14eに記憶される内容には、例えばクラスタ数C(第1クラスタ数)のクラスタkに分類する際に計算された帰属度uki及びクラスタ中心ベクトルukiなど、クラスタ分類を行う際に計算された帰属度uki及びクラスタ中心ベクトルukiなどが含まれる。
【0047】
初期化部14aは、クラスタ数Cについての分類を最初に行う際に、特徴量ベクトルxiの各クラスタに対する帰属度ukiを初期化する。したがって、初期化部14aは、最初に分類を行う際のクラスタ数をCとすると、1以上且つC以下のクラスタk(1≦k≦C)、1以上且つN以下の振動波形データi(1≦i≦N)についての帰属度ukiを初期化する。本実施形態では、帰属度ukiの初期値を乱数により初期化する。
【0048】
初期値決定部14bは、最初のクラスタ数Cについての分類を行った後、最初のクラスタ数Cと異なるクラスタ数についての分類を行う場合、及び、振動波形データを追加して分類を行う場合において、特徴量ベクトルxiの帰属度ukiまたはクラスタ中心ベクトルμkの初期値を決定する。
【0049】
初期値決定部14bにより初期値が決定されるのは、下記のクラスタ追加処理、クラスタ統合処理、データ追加処理、次数変動処理のいずれかが行われる場合である。
(A1)クラスタ追加処理:クラスタ数Cを増加させた場合
(A2)クラスタ統合処理:クラスタ数Cを減少させた場合
(A3)次数変動を伴うデータ追加処理:振動波形データを追加したことにより適正次数が増加または減少した場合
(A4)次数変動を伴わないデータ追加処理:振動波形データを追加したことにより適正次数が変化しない場合
【0050】
(A1)クラスタ追加処理での初期値の決定
【0051】
複数の振動波形データiに対する複数の特徴量ベクトルxiがクラスタ数Cのクラスタkに分類された後において、クラスタkの数を増加させて、複数の特徴量ベクトルxiをクラスタ数Cより多い数(C+1)のクラスタkに分類する場合には、初期値決定部14bは、追加したクラスタkに対する特徴量ベクトルxiの帰属度uki、または、追加したクラスタkのクラスタ中心ベクトルμkの初期値を決定する。
【0052】
(帰属度u
kiの初期値の決定)
初期値決定部14bは、追加したクラスタkに対する特徴量ベクトルx
iの帰属度u
kiの初期値を乱数とする。即ち、1以上且つC以下のクラスタk(1≦k≦C)、1以上且つN以下の振動波形データi(1≦i≦N)の帰属度u
kiについては、クラスタkを追加するまでに計算された帰属度u
kiを初期値とし、追加したクラスタk(k=C+1)、1以上且つN以下の振動波形データi(1≦i≦N)についての帰属度u
kiの初期値を乱数とする。
【数16】
【0053】
(クラスタ中心ベクトルμkの初期値の決定)
初期値決定部14bは、1以上且つC以下のクラスタk(1≦k≦C)のクラスタ中心ベクトルμ
kについては、クラスタkを追加するまでに計算されたクラスタ中心ベクトルμ
kを初期値とし、追加したクラスタのクラスタ中心ベクトルμ
kについては、どのクラスタにも属さないデータの中心座標を初期値とする。
【数17】
但し、Nは、特徴量ベクトルx
iの数であり、n(∪C
k)は、後述の和集合∪C
kの要素数(全てのクラスタkの少なくとも1つに属した特徴量ベクトルx
iの数)である。したがって、和集合∪C
kに属さない特徴量ベクトルx
iの振動波形データiについて特徴量ベクトルx
iの合計を、どのクラスタにも属さない特徴量ベクトルx
iの数であるN-n(∪C
k) で除算することにより、初期値を計算する。
【0054】
(A2)クラスタ統合処理での初期値の決定
【0055】
複数の振動波形データiに対する複数の特徴量ベクトルxiがクラスタ数Cのクラスタkに分類された後において、クラスタkの数を減少させて、複数の特徴量ベクトルxiをクラスタ数Cより少ない数(C-1)のクラスタkに分類する場合には、初期値決定部13bは、クラスタ数Cのクラスタkから選択された2つのクラスタkに対する特徴量ベクトルxiの帰属度ukiを統合して初期値を決定する、または、クラスタ数Cのクラスタkから選択された2つのクラスタkのクラスタ中心ベクトルμkを統合して初期値を決定する。
【0056】
(帰属度ukiの初期値の決定)
まず、クラスタ数Cのクラスタにおいて統合する2つのクラスタk1及びk2(但し、k1<k2)を決定する。統合する2つのクラスタk1及びk2としては、2つのクラスタの少なくともいずれかに属する要素数に対する両方のクラスタに属する要素数の割合が最大となるものとする。即ち、2つのクラスタk1及びk2の少なくとも1つに属した和集合の要素数に対する2つのクラスタk1及びk2の両方に属した積集合の要素数の割合が最大となるものとする。
【0057】
統合する2つのクラスタk1及びk2(但し、k1<k2)を決定した後、クラスタk2をクラスタk1に統合する場合について説明する。
【0058】
(1)1以上且つk2より小さい(但しk1ではない)クラスタk(1≦k<k2(但し、k≠k1)、1以上且つN以下の振動波形データi(1≦i≦N)の帰属度ukiについては、統合するまでの帰属度ukiを初期値とする。
【0059】
(2)クラスタk2が統合されるクラスタk1、1以上且つN以下の振動波形データi(1≦i≦N)の帰属度ukiについては、統合するまでのクラスタk1とクラスタk2に対する帰属度ukiの和または乱数を初期値とする。
【0060】
(3)k
2以上且つCより小さいクラスタk(k
2≦k<C)、1以上且つN以下の振動波形データi(1≦i≦N)の帰属度u
kiについては、統合するまでの帰属度u
kiを、帰属度u
k+1 iとして初期値とする。即ち、クラスタk
2がクラスタk
1に統合されることにより、クラスタ数が1だけ減少することから、k
2より大きいクラスタkについては、統合するまでの帰属度u
kiを、帰属度u
k+1 iとして初期値とする。
【数18】
【0061】
(クラスタ中心ベクトルμkの初期値の決定)
まず、C個のクラスタにおいて統合する2つのクラスタk1及びk2(但し、k1<k2)を決定する。統合する2つのクラスタk1及びk2としては、2つのクラスタの少なくともいずれかに属する要素数に対する両方のクラスタに属する要素数の割合が最大となるものとする。即ち、2つのクラスタk1及びk2の少なくとも1つに属した和集合の要素数に対する2つのクラスタk1及びk2の両方に属した積集合の要素数の割合が最大となるものとする。
【0062】
統合する2つのクラスタk1及びk2(但し、k1<k2)を決定した後、クラスタk2をクラスタk1に統合する場合について説明する。
【0063】
(1)1以上且つk2より小さい(但しk1ではない)クラスタk(1≦k<k2(但し、k≠k1)、1以上且つN以下の振動波形データi(1≦i≦N)のクラスタ中心ベクトルμkについては、統合するまでのクラスタ中心ベクトルμkを初期値とする。
【0064】
(2)クラスタk2が統合されるクラスタk1、1以上且つN以下の振動波形データi(1≦i≦N)のクラスタ中心ベクトルμkについては、統合するまでのクラスタk1とクラスタk2の中心座標の加重平均を初期値とする。
【0065】
(3)k
2以上且つCより小さいクラスタk(k
2≦k<C)、1以上且つN以下の振動波形データi(1≦i≦N)のクラスタ中心ベクトルμ
kについては、統合するまでのクラスタ中心ベクトルμkを、クラスタ中心ベクトルμ
k+1として初期値とする。即ち、クラスタk
2がクラスタk
1に統合されることにより、クラスタ数が1だけ減少することから、k
2より大きいクラスタkについては、統合するまでのクラスタ中心ベクトルμkを、クラスタ中心ベクトルμ
k+1として初期値とする。
【数19】
【0066】
(A3)次数変動を伴うデータ追加処理での初期値の決定
【0067】
座標変換部14cは、複数の振動波形データについての分類を行った後、振動波形データを追加して分類を行う場合において、適正次数が変動したときに、分類された既存データを新たな座標系の値に更新するとともに、新たに追加する振動波形データに対するパワースペクトルを新たな座標系の値に変換する。座標変換部14cにより座標変換が行われるのは、新たに振動波形データを追加したとき適正次数が増加または減少した場合と新たに追加された振動波形データに対してである。
【0068】
新たに振動波形データを追加して適正次数が増加または減少した時の振動波形データ数をN
2とすると、既に分類されたN
2-1個の振動波形データnに対する特徴量ベクトルx
n’(但し、nは1以上N
2-1以下の整数)を新たな座標系の特徴量ベクトルx
nに更新する。
【数20】
なお、TおよびT
Tは座標変換行列とその転置行列を示しており、N
1は前回適正次数が増加または減少した時の振動波形データ数を示しており、N
2は今回適正次数が増加または減少した時の振動波形データ数を示している。
【0069】
新たに追加する振動波形データに対するパワースペクトルspc
N2を新たな座標系の値x
N2に変換する。
【数21】
なお、Tは座標変換行列を示しており、M
N2はパワースペクトルの総和であり、N
2は今回適正次数が増加または減少した時の振動波形データ数であり、M
N2/N
2はパワースペクトルの平均値を示している。
【0070】
(帰属度u
kiの初期値の決定)
新たに追加する1個のデータx
N2について、クラスタkに対する帰属度u
kN2の初期値を、乱数により決定する。
【数22】
【0071】
(A4)次数変動を伴わないデータ追加処理での初期値の決定
【0072】
N個の振動波形データiに対するN個の特徴量ベクトルxiがクラスタ数Cのクラスタに分類された後において、振動波形データiに対する特徴量ベクトルxiを追加して、N+1個の特徴量ベクトルxiをクラスタ数Cのクラスタkに分類する場合には、初期値決定部14bは、追加した特徴量ベクトルxiのクラスタ数Cのクラスタkに対する帰属度ukiの初期値を決定する。
【0073】
新たに追加する振動波形データに対するパワースペクトルspc
N+1を新たな座標系の値x
N+1に変換する。
【数23】
なお、Tは座標変換行列を示しており、M
N+1はパワースペクトルの総和であり、N+1はデータ数であり、M
N+1/N+1はパワースペクトルの平均値であり、N
3は直近に適正次数が増加または減少した時のデータ数を示している。
【0074】
(帰属度u
kiの初期値の決定)
新たに追加する1個のデータx
N+1について、クラスタkに対する帰属度u
kN+1の初期値を、乱数により決定する。
【数24】
【0075】
計算部14dは、初期化部14aでの初期化、または初期値決定部14bでの初期値の決定、または座標変換部14での座標変換が行われた後、クラスタ中心ベクトルμkの計算と帰属度ukiの更新とを、クラスタ中心ベクトルμkが収束するまで繰り返す。以下、計算部14dにおけるクラスタ中心ベクトルμkの計算と帰属度ukiの更新について説明する。
【0076】
(クラスタ中心ベクトルμ
kの計算)
帰属度u
kiを用いて、クラスタ中心ベクトルμ
kを下記の式で計算する。但し、qは2である。
【数25】
【0077】
(帰属度u
kiの更新)
クラスタ中心ベクトルμ
kを用いて振動波形データiの各クラスタkへの帰属度u
kiを下記の式で更新する。但し、Cはクラスタ数であり、qは2である。
【数26】
【0078】
(収束計算)
ここで、クラスタ中心ベクトルμk、及び、振動波形データiのクラスタkへの帰属度ukiの計算を繰り返し、全てのクラスタの中心が変化しなければ終了する。即ち、クラスタ中心ベクトルμkの計算、及び、振動波形データiのクラスタkへの帰属度ukiの更新を、クラスタ中心ベクトルμkが収束するまで繰り返す。
【0079】
集合決定部15は、特徴量ベクトルxiのクラスタkへの帰属度ukiが下式を満たす特徴量ベクトルxiをクラスタkごとに集めた集合Ckを決定する。集合Ckは「クラスタkに対する帰属度が指定値αより大きいデータあるいはどのクラスタに対してもほぼ同じくらい帰属する可能性のあるデータの集合」を表している。集合決定部15は、集合Ckとして、クラスタ分類で決定されたパラメータ(帰属度、中心座標)を数学的に処理して求められるもので、クラスタの分類結果とかけ離れていない集合Ckを決定している。
【0080】
下式において、前者が後者を含んでしまうのを防ぐために、
【数27】
の部分が記載されている。また、±εは、ほぼ同じくらい帰属する可能性があると判断される程度を表している。
【0081】
【数28】
但し、α及びεは正数であり、Cはクラスタ数ある。
【0082】
演算部16は、全てのクラスタkの集合Ckについて、全てのクラスタkに対する和集合の要素数と、全てのクラスタkに対する積集合の要素数とを算出する。和集合の要素数とは、全てのクラスタkの少なくとも1つに属した特徴量ベクトルxiの数であり、積集合の要素数とは、全てのクラスタkに属した特徴量ベクトルxiの数である。
【0083】
判定部17は、演算部16により演算された和集合の要素数及び積集合の要素数に基づいて、クラスタkの数であるクラスタ数Cについての判定として、下記のいずれの状態であるかを判定する。
【0084】
(適正状態):クラスタ数Cが適正なクラスタ数である状態
(不足状態):クラスタ数Cが適正なクラスタ数より少ない状態
(過剰状態):クラスタ数Cが適正なクラスタ数より多い状態
【0085】
判定部17は、和集合の要素数が電気的信号の数Nと同一であり、且つ、積集合の要素数が0である場合、すべての特徴量ベクトルxiがクラスタ数Cのクラスタkのいずれかに属し、且つ、クラスタ数Cのクラスタkの全てに属した特徴量ベクトルxiがないことから、クラスタ数Cが適正なクラスタ数である適正状態と判定する。
【0086】
また、判定部17は、和集合の要素数が特徴量ベクトルxiの数Nより少ない場合、クラスタ数Cのクラスタkのいずれにも属してない特徴量ベクトルxiがあることから、クラスタ数Cが適正なクラスタ数より少ない不足状態と判定する。
【0087】
また、判定部17は、和集合の要素数が特徴量ベクトルxiの数Nと同一であり、且つ、積集合の要素数が0より多い場合、すべての特徴量ベクトルxiがクラスタ数Cのクラスタkのいずれかに属し、且つ、クラスタ数Cのクラスタkの全てに属した特徴量ベクトルxiがあることから、クラスタ数Cが適正なクラスタ数より多い過剰状態と判定する。
【0088】
本実施形態のクラスタ分類システムにおける分類方法について、
図2及び
図3に基づいて説明する。
【0089】
(ステップS1)
ねじの圧造工程において、振動波形センサ1により、ねじを圧造する際の振動波形データが検出される。本実施形態のクラスタ分類システムでは、多数のねじを圧造する際の振動波形データが、振動検出センサ1により検出される。
【0090】
(ステップS2)
振動波形センサ1により検出された振動波形データが、クラスタ分類装置2の振動波形データ記憶部11に記憶される。本実施形態では、多数のねじを圧造する際に振動検出センサ1により検出された振動波形データが振動波形データ記憶部11に記憶されるが、1つのねじを圧造する度に、1つの振動波形データが振動波形データ記憶部11に記憶されてもよいし、多数のねじを圧造した後、多数の振動波形データが振動波形データ記憶部11にまとめて記憶されてもよい。
【0091】
(ステップS3)
適正次数導出部12により、クラスタ分析する際に使用すべき適正な次数が導出される。
【0092】
(ステップS4)
特徴量ベクトル計算部13により、適正次数導出部12にて決定された座標変換行列Tを用いて、振動波形データ記憶部11に記憶された各振動波形データに対するパワースペクトルspciの特徴量ベクトルxiが計算される。特徴量ベクトルxiは、複数の成分を有している。
【0093】
(ステップS5~ステップS7)
クラスタ分析部14により、ステップS4で導出された適正次数に基づいて、所定のクラスタ数について、帰属度uki及びクラスタ中心ベクトルμkが計算される。
【0094】
(ステップS5)
クラスタ数Cについての分類を最初に行う際に、初期化部14aにより、特徴量ベクトルxiの各クラスタに対する帰属度ukiが初期化される。
【0095】
(ステップS6、S7)
ステップS6において、計算部14dにより、クラスタ中心ベクトルμkの計算と帰属度ukiの更新とが行われる。その後、ステップS7において、クラスタ中心ベクトルμkが収束したか否かが判定され、クラスタ中心ベクトルμkが収束してない場合、ステップS6に戻り、クラスタ中心ベクトルμkが収束するまで繰り返す。
【0096】
(ステップS8)
集合決定部15により、特徴量ベクトルxiのクラスタkへの帰属度ukiに基づいて、特徴量ベクトルxiをクラスタkごとに集めた集合Ckを決定する。
【0097】
(ステップS9)
演算部16により、全てのクラスタkの集合Ckについて、全てのクラスタkに対する和集合の要素数と、全てのクラスタkに対する積集合の要素数とを演算する。
【0098】
(ステップS10)
判定部17により、演算部16で演算された和集合の要素数及び積集合の要素数に基づいて、クラスタkの数であるクラスタ数Cが適正、不足、過剰のいずれであるかを判定する。
【0099】
(ステップS11)
ステップS10において、クラスタ数Cが適正なクラスタ数より少ない不足状態と判定された場合、ステップS14において、クラスタ追加処理を行う。具体的には、クラスタ追加処理として、クラスタ数Cを増加させると共に、初期値決定部14bにより、追加したクラスタkに対する特徴量ベクトルxiの帰属度uki、または、追加したクラスタkのクラスタ中心ベクトルμkの初期値が決定される。その後、ステップS6に移行する。
【0100】
(ステップS11)
ステップS10において、クラスタ数Cが適正なクラスタ数より多い過剰状態と判定された場合、ステップS12において、クラスタ統合処理を行う。具体的には、クラスタ統合処理として、クラスタ数Cを減少させると共に、初期値決定部14bにより、C個のクラスタkから選択された2つのクラスタkに対する特徴量ベクトルxiの帰属度ukiまたはクラスタ中心ベクトルμkが統合して初期値が決定される。その後、ステップS6に移行する。
【0101】
(ステップS13)
ステップS10において、クラスタ数Cが適正なクラスタ数である適正状態と判定された場合、ステップS13において、振動波形データが追加されたか否かを繰り返し判定する。
【0102】
(ステップS14)
ステップS13において、振動波形データが追加されたと判定された場合、ステップS14において、既に分類された振動波形データ及び新たに追加された振動波形データに対応するように、共分散行列が更新される。その後、ステップS15に進む。
【0103】
(ステップS15)
ステップS14で更新された共分散行列が対角化され、振動波形データの各成分の寄与率が演算される。
【0104】
(ステップS16)
ステップS15で演算された寄与率に基づいて、既に分類された振動波形データ及び新たに追加された振動波形データをクラスタ分類する場合における適正次数が導出される。その後、ステップS17に進む。
【0105】
(ステップS17)
ステップS16で導出された適正次数が、振動波形データが追加されるまでの複数の振動波形データをクラスタ分類したときの次数と異なるか否かが判定される。
【0106】
ステップS17では、振動波形データが追加されるまでの複数の振動波形データをクラスタ分類したときの平均情報量H
Nの整数部分と、既に分類された振動波形データ及び新たに追加された振動波形データをクラスタ分類するときの平均情報量H
N+1の整数部分とが、同一であるかまたは変動したかが判定される。
【数29】
【0107】
ステップS17において、ステップS16で導出された適正次数が、振動波形データが追加されるまでの複数の振動波形データをクラスタ分類したときの次数と同一であると判定された場合、ステップS18に移行する。ステップS17において、ステップS16で導出された適正次数が、振動波形データが追加されるまでの複数の振動波形データをクラスタ分類したときの次数と異なると判定された場合、ステップS19に進む。
【0108】
(ステップS18)
追加された振動波形データに対するパワースペクトルから特徴量ベクトルxN+1が計算され、適正次数に対応したデータが選択される。その後、追加された特徴量ベクトルxN+1に対する帰属度uk N+1(k=1~C)が初期化され、ステップS6に移行する。
【0109】
(ステップS19)
ステップS16で導出された適正次数に基づいてクラスタ分類するために、全ての振動波形データをその適正次数に対応した振動波形データに更新するともに、追加された振動波形データに対するパワースペクトルから特徴量ベクトルxN+1が計算され、適正次数に対応したデータが選択される。その後、追加された特徴量ベクトルxN+1に対する帰属度uk N+1(k=1~C)が初期化され、ステップS20に移行する。
【0110】
(ステップS20)
ステップS16で導出された適正次数が、データが追加されるまでの複数のデータをクラスタ分類したときの次数より増加したか否かが判定される。適正次数が、データが追加されるまでの複数のデータをクラスタ分類したときの次数より増加した場合、ステップS21に移行する。ステップS20において、適正次数が、データが追加されるまでの複数のデータをクラスタ分類したときの次数より減少した場合、ステップS23に移行する。なお、ステップS21からステップS23までのクラスタ再分類および統合処理では、追加された特徴量ベクトルxN+1は使用しない。
【0111】
(ステップS21)
ステップS21において、クラスタごとに、カーネル密度推定により極値の個数が演算される。カーネル密度推定により極値の個数を演算する方法は、後で説明する。その後、ステップS22に移行する。
【0112】
(ステップS22)
ステップS21で演算された極値の個数が2以上であるクラスタを、すべて極値の個数のクラスタに再分類する。このとき、再分類に使用する振動波形データに対する特徴量ベクトルは対象となるクラスタに帰属するもの(該当クラスタに対する帰属度が最大値となるもの)のみを使用する。極値の個数に応じて増加させるクラスタについては、帰属度の初期値がないため、帰属度の初期値を乱数により設定して、
図2のステップS6及びS7と同様の収束計算を行う。極値の個数が2以上であるクラスタを、極値の個数のクラスタに再分類した後で、増加したクラスタ数を全て加算したクラスタ数を新たなクラスタ数とし、さらに、クラスタ数が増加したことにより、追加された特徴量ベクトルを含めた全特徴量ベクトルの初期値のない帰属度に対して、乱数により初期値を設定し、ステップS6に移行する。
【0113】
(ステップS23)
適正次数が減少した場合、複数のクラスタにおいて、2つのクラスタを統合する。なお、ステップS23において、2つのクラスタを統合する方法は、上述したステップS12において2つのクラスタを統合する方法と同様であり説明は省略する。その後、統合されたクラスタ数の総数を減算したクラスタ数を新たなクラスタ数とし、ステップS6に移行する。
【0114】
(カーネル密度推定により極値の個数を演算する方法)
ステップS21において、クラスタごとに、カーネル密度推定により極値の個数を演算する方法について、
図4~
図6に基づいて説明する。
【0115】
(ステップS101)
クラスタ番号cが1に設定される。
【0116】
(ステップS102)
要素番号mが1に設定される。
【0117】
(ステップS103)
モード数(極大値数)kが1に設定される。
【0118】
その後、ステップS104~S111において、クラスタ番号に属する特徴量ベクトルxi(i=1~Nc)の要素番号mのデータxm
iに基づき、カーネル密度推定(核関数はガウス関数)により、核関数のバンド幅を決定(確率密度関数fh(x)の決定)する。
【0119】
(ステップS104)
バンド幅(階級幅)とその増分の初期値を設定する。
【数30】
【0120】
(ステップS105)
データxm
iに対するヒストグラムを作成する(面積が1となるように規格化)。
【0121】
(ステップS106)
ヒストグラムと確率密度関数fh(x)の誤差を計算する。すまわち、データの区間(最小値と最大値の間)をL等分して得られた標本値xl(l=1~L)に対する確率密度fh(xl)と標本値とバンド幅で決まる階級値に対応する頻度との二乗誤差の総和を求める。
【0122】
(ステップS107)
ループ1回目もしくは最小誤差より誤差が小さいか否かを判定する。最小誤差より誤差が小さいと判定された場合、ステップS108に移行する。ステップS107において、ループ1回目もしくは最小誤差より誤差が小さいと判定されない場合、ステップS109に移行する。
【0123】
(ステップS108)
バンド幅を記憶し、誤差を最小誤差として記憶する。
【0124】
(ステップS109)
確率密度関数fh(x)の極大値数がモード数kと一致するか否かを判定する。すなわち、一定値以上の頻度の連続区間数がモード数kと一致するかどうかを判定する。確率密度関数fh(x)の極大値数がモード数kと一致すると判定された場合、ステップS112に移行する。
【0125】
(ステップS110)
ステップS109において、確率密度関数fh(x)の極大値数がモード数kと一致しないと判定された場合であり、バンド幅がデータの最大値と最小値の範囲の1/2を超えた場合、Δh=Δh/2にするとともに、記憶してあるバンド幅をhとする。
【0126】
(ステップS111)
バンド幅を更新(h=h+Δh)し、ステップS105に移行する。
【0127】
(ステップS112)
確率密度関数fh(x)に従うNc個の乱数x*
iを発生させる。
【0128】
(ステップS113)
N
c個の乱数x
*
iから次式にて、平滑化ブートストラップ標本y
*
iを生成する(s
2はx
l
iの分散)。
【数31】
【0129】
その後、ステップS114~S117において、バンド幅hとして、Nc個のy*
iからカーネル密度推定により、極値数N(fh)を決定する。
【0130】
(ステップS114)
データy*
iに対するヒストグラムを作成する(面積が1となるように規格化)。
【0131】
ヒストグラムと確率密度関数fh(x)の誤差を計算する。すなわち、データの区間(最小値と最大値の間)をL等分して得られた標本値xl(l=1~L)に対する確率密度fh(xl)と標本値とバンド幅で決まる階級値に対応する頻度との二乗誤差の総和を求める
【0132】
(ステップS116)
一定値以上の頻度の連続区間数を探索する。
【0133】
(ステップS117)
連続区間数を極値数N(fh)とする。
【0134】
(ステップS118)
ステップS112~S117を指定数繰返したか否かを判定する。
【0135】
(ステップS119)
ステップS112~S117を指定数回繰返すことにより、N(fh)>kとなる回数を求め、確率Pv値を算出する。
【0136】
(ステップS120)
Pv値が有意水準αより大きいかつ一定値を超えたか否かを判定する。すなわち、ループ1回目または極大値数<モード値kであるか否かを判定する。ループ1回目または極大値数<モード値kであると判定された場合、ステップS121に移行する。
【0137】
(ステップS121)
モード値kを極大値数として記憶して、その後、ステップS123に移行する。
【0138】
(ステップS122)
ステップS120において、ループ1回目または極大値数<モード値kであると判定されない場合、モード数を更新(k=k+1)して、ステップS103に移行する。
【0139】
(ステップS123)
要素数がMとなったか否かを判定する。要素数がMとなったと判定された場合、ステップS124に移行する。
【0140】
(ステップS124)
クラスタ番号cの極大値数として記憶する。その後、ステップS126に移行する。
【0141】
(ステップS125)
ステップS123において、要素数がMとなったと判定されない場合、要素数を更新(m=m+1)して、ステップS103に移行する。
【0142】
(ステップS126)
クラスタ番号がクラスタ数Cとなったか否かを判定する。クラスタ番号がクラスタ数Cと判定された場合、処理を終了する。
【0143】
(ステップS127)
クラスタ番号がクラスタ数Cと判定されない場合、クラスタ番号を更新(c=c+1)して、ステップS102に移行する。
【0144】
本実施形態のクラスタ分類システムは、複数の電気的信号に対する複数の特徴量ベクトルxi(i=1~N)が、所定次数に基づいて第1所定数のクラスタに分類された後において、特徴量ベクトルxN+1を追加して、それらの特徴量ベクトルxi(i=1~N+1)を再分類する場合に、それらの特徴量ベクトルxiの再分類に対する適正な次数を導出する適正次数導出部12と、適正次数導出手段12で導出された適正次数と所定次数とが同一でない場合に、それらの特徴量ベクトルxiを適正次数導出手段12で導出された適正次数に基づいて、第1所定数より多い第2所定数または第1所定数より少ない第3所定数のクラスタに再分類するクラスタ分析部14とを備える。
【0145】
本実施形態のクラスタ分類方法は、複数の電気的信号に対する複数の特徴量ベクトルxiが(i=1~N)が、所定次数に基づいて第1所定数のクラスタに分類された後において、特徴量ベクトルxN+1を追加して、それらの特徴量ベクトルxi(i=1~N+1)を再分類する場合に、それらの特徴量ベクトルxiの再分類に対する適正な次数を導出する適正次数導出ステップと、適正次数導出ステップで導出された適正次数と所定次数とが同一でない場合に、それらの特徴量ベクトルxiを適正次数導出ステップで導出された適正次数に基づいて、第1所定数より多い第2所定数または第1所定数より少ない第3所定数のクラスタに再分類するクラスタ分析ステップとを備える。
【0146】
このように、本実施形態のクラスタ分類システム及びクラスタ分類方法では、複数の特徴量ベクトルxiが所定次数に基づいてクラスタ分類された後において、特徴量ベクトルxiを追加して再分類する場合に、クラスタ分類を行う際に使用すべき適正次数が新たに導出される。そのため、複数のデータについての特徴量ベクトルxiについてクラスタ分類を行った後でデータを追加して再分類した場合でも、クラスタ分類を適正に行うことができる。
【0147】
本実施形態のクラスタ分類システムにおいて、クラスタ分析部14は、適正次数導出部12で導出された適正次数が所定次数より大きい場合に、第1所定数のクラスタの少なくとも1つのクラスタを2つ以上のクラスタに分割して再分類することを特徴とする。
【0148】
本実施形態のクラスタ分類方法において、クラスタ分析ステップでは、適正次数導出ステップで導出された適正次数が所定次数より大きい場合に、第1所定数のクラスタの少なくとも1つのクラスタを2つ以上のクラスタに分割して再分類することを特徴とする。
【0149】
このように、本実施形態のクラスタ分類システム及びクラスタ分類方法では、データを追加することにより適正次数が増加した場合、既に複数のデータを分類したときに1つのクラスタに属するとされた複数のデータが、2つ以上のクラスタに属するように分類される方が適正である場合において、クラスタ分類を適正に行うことができる。
【0150】
本実施形態のクラスタ分類システムにおいて、クラスタ分析部14は、適正次数導出部12で導出された適正次数が所定次数より小さい場合に、第1所定数のクラスタに含まれる2つのクラスタを1つのクラスタに統合して再分類することを特徴とする。
【0151】
本実施形態のクラスタ分類方法において、クラスタ分析ステップでは、適正次数導出ステップで導出された適正次数が所定次数より小さい場合に、第1所定数のクラスタに含まれる2つのクラスタを1つのクラスタに統合して再分類することを特徴とする。
【0152】
このように、本実施形態のクラスタ分類システム及びクラスタ分類方法では、データを追加することにより適正次数が減少した場合、既に複数のデータを分類したときに2つのクラスタに属するとされた複数のデータが、1つのクラスタに属するように分類される方が適正である場合において、クラスタ分類を適正に行うことができる。
【0153】
以上、本発明の実施形態を説明したが、各部の具体的な構成は上述した実施形態のみに限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形が可能である。
【0154】
上記実施形態では、クラスタごとに、カーネル密度推定により極値の個数を演算して、極値の個数のクラスタに再分類してクラスタ数を増加させたが、何れかのクラスタを複数のクラスタに再分類してクラスタ数を増加させる方法は、それに限られない。また、上記実施形態では、2つのクラスタを1つのクラスタに統合してクラスタ数を減少させる方法の例を示したが、その方法は、それに限られない。クラスタ数を減少させる場合に、3つ以上のクラスタを1つのクラスタに統合してクラスタ数を減少させてもよい。
【0155】
上記実施形態では、データ追加処理として、1つの振動波形データが追加される場合を説明したが、複数の振動波形データが追加される場合も同様に本発明の効果が得られる。上記実施形態では、集合決定部が特徴量ベクトルxiについての集合Ckを決定する方法の例を示したが、集合Ckを決定する方法は、それに限られない。
【0156】
上記実施形態では、電気的信号が振動波形データであったが、電気的信号は振動波形データに限られない。上記実施形態では、クラスタ分析法として、Fuzzy c-means法が使用されたが、例えばk-means法などの非階層的クラスタリングが使用されてよい。
【0157】
上記実施形態では、線形計算を行う主成分分析法を使用して各成分の寄与率を演算したが、各成分の寄与率を演算する方法は、それに限られない。例えば、非線形計算を行うカーネル法を使用して各成分の寄与率を演算してもよい。
【符号の説明】
【0158】
1 振動検出センサ
2 クラスタ分類装置
11 振動波形データ記憶部
12 適正次数導出部(適正次数導出手段)
12a 寄与率演算部(寄与率演算手段)
13 特徴量ベクトル計算部
14 クラスタ分析部
14a 初期化部
14b 初期値決定部
14c 座標変換部
14d 計算部
14e 記憶部
15 集合決定部
16 演算部
17 判定部