(58)【調査した分野】(Int.Cl.,DB名)
前記第1のグループに入れることができる近隣オブジェクトがなくなるまで、前記アクセスすべきオブジェクトの所定の近傍ドメイン内の前記近隣オブジェクトである直接的に密度可到達の近隣オブジェクトを対象として拡張的に前記第1のグループへのクラスタリングを実行することは、
前記複数の近傍ドメインの最大走査半径よりも小さい走査半径を有する前記所定の近傍ドメインであって、前記アクセスすべきオブジェクトの前記所定の近傍ドメイン内の各直接的に密度可到達の近隣オブジェクトを取得することと、
各直接的に密度可到達の近隣オブジェクトが、コアオブジェクトであるであるか否かを1つずつ判断することと、
前記直接的に密度可到達の近隣オブジェクトがコアオブジェクトであると判断された場合に、前記第1のグループに入る近隣オブジェクトがなくなるまで、前記直接的に密度可到達の近隣オブジェクトの含まれる前記所定の近傍ドメイン内の前記近隣オブジェクトを前記第1のグループに追加することと、
を備える請求項1〜4のいずれか一項に記載のクラスタリング方法。
【発明の概要】
【発明が解決しようとする課題】
【0005】
関連技術における問題を克服するために、クラスタリング方法、装置および端末装置は、本開示の実施形態によって提供される。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本開示の実施形態は、以下の技術的解決策を提供する。
【0007】
本開示の第1の態様の実施形態は、
アクセスすべきオブジェクトの各近隣オブジェクトを取得することと、
前記アクセスすべきオブジェクトを中心とし、且つ、それぞれ異なる走査半径を有する複数の近傍ドメインのうち、その近傍ドメイン内の前記近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かを判断するこ
とと、
前記近隣オブジェクトの数が前記所定値以上であると判断された場合に、前記アクセスすべきオブジェクトを第1のグループにクラスタリングすることと、
前記第1のグループに入れることができる近隣オブジェクトがなくなるまで、前記アクセスすべきオブジェクトの所定の
近傍ドメイン内の
前記近隣オブジェクトである直接的に密度可到達の近隣オブジェクト
を対象として拡張
的に前記第1のグループへのクラスタリングを実行することと、
を含む
クラスタリング装置によるクラスタリング方法を提供する。
【0008】
第1の態様に関して、第1の態様の第1の可能な実施形態において、該近隣オブジェクトの数が該所定値以上である少なくとも1つの
近傍ドメインが存在するか否かを判断することは、
近隣オブジェクトと、該アクセスすべきオブジェクトとの距離を取得することと、
該複数の
近傍ドメインの走査半径の昇順の距離に従って、第1の
近傍ドメイン内の該近隣オブジェクトの数が該所定値以上であるか否かを判断することと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が該所定値以上である場合に、該アクセスすべきオブジェクトをコアオブジェクトとして判断することと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が該所定値未満である場合に、該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が、既に判断されているか否かを判断することと、
該アクセスすべきオブジェクトの複数の
近傍ドメインの全てが判断されていない場合に、該複数の
近傍ドメインの走査半径の昇順の距離に従って、第2の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かを判断することと、
該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合に、該アクセスすべきオブジェクトをコアオブジェクトではないと判断することと、を含む。
【0009】
第1の態様に関して、第1の態様の第2の可能な実施形態において、該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かを判断することは、
近隣オブジェクトと前記アクセスすべきオブジェクトとの距離を取得することと、
該距離と関連付けられ且つ該近傍ドメイン内の前記近隣オブジェクトの数に変換される重み係数であって、該距離に対応する
対応重み係数を取得することと、
該距離と、該対
応重み係数とに従って、
該複数の近傍ドメインを走査半径により昇順で順序づけたときの第1の
近傍ドメイン内の該近隣オブジェクトの数を計算することと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が、複数の
近傍ドメインの走査半径の昇順で所定値以上であるか否かを判断することと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が該所定値以上である場合に、該アクセスすべきオブジェクトをコアオブジェクトとして判断することと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が該所定値未満である場合に、該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かを判断することと、
該アクセスすべきオブジェクトの複数の
近傍ドメインの全てが判断されていない場合に、該複数の
近傍ドメインの走査半径の昇順の距離に従って、第2の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かを判断することと、
該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合に、該アクセスすべきオブジェクトをコアオブジェクトではないと判断することと、を含む。
【0010】
第1の態様の第2の可能な実施形態に関して、第1の態様の第3の可能な実施形態において、該距離に関連付けられた対応する重み係数を取得することは、
該近隣オブジェクトから該アクセスすべきオブジェクト
までの距離と
該近隣オブジェクトが該アクセスすべきオブジェクトと同じであるか否かの確率との対応
性を取得することと、
該対応性を問い合わせることにより、
該距離に対応する、該近隣オブジェクト
が該アクセスすべきオブジェクトと同じであるか否かの確率を取得することと、
該距離に該確率を掛けることにより、該距離に関連付けられ
且つ該確率と正の相関関係にある対
応重み係数を取得するこ
とと、を含む。
【0011】
第1の態様、または、第1の態様の第1の実施形態から第3の実施形態のうちのいずれか1つに関して、第1の態様の第4の可能な実施形態において、該第1のグループに入れることができる近隣オブジェクトがなくなるまで、該アクセスすべきオブジェクトの所定の
近傍ドメイン内の
該近隣オブジェクトである直接的に密度可到達の近隣オブジェクト
を対象として拡張
的に該第1のグループへのクラスタリングを実行することは、
該複数の近傍ドメインの最大走査半径よりも小さい走査半径を有する該所定の近傍ドメインであって、該アクセスすべきオブジェクトの該所定の
近傍ドメイン内の各直接的に密度可到達の近隣オブジェクトを取得するこ
とと、
各直接的に密度可到達の近隣オブジェクトが、コア
オブジェクトであるであるか否かを1つずつ判断することと、
該直接的に密度可到達の近隣オブジェクトがコアオブジェクトであると判断された場合に
、該第1のグループに入る近隣オブジェクトがなくなるまで、
該直接的に密度可到達の近隣オブジェクトの含まれる該所定の
近傍ドメイン内
の該近隣オブジェクトを
該第1のグループに追加するこ
とと、を含む。
【0012】
第1の態様の第4の可能な実施形態に関して、第1の態様の第5の可能な実施形態において、各直接的に密度可到達の近隣オブジェクトがコアオブジェクトであるか否かを1つずつ判断することは、
該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが、直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメイン内に存在するか否かを判断することと、
該近隣オブジェクトの数が所定値以上である場合に、該直接的に密度可到達の近隣オブジェクトをコアオブジェクトとして判断することと、
該直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメインの各々における近隣オブジェクトの数が所定値未満である場合に、該直接的に密度可到達の近隣オブジェクトをコアオブジェクトではないと判断することと、を含む。
【0013】
第1の態様の第1の可能な実施形態に関して、第1の態様の第6の可能な実施形態において、複数の
近傍ドメインの走査半径の昇順の距離に従って、第1の
近傍ドメイン内の近隣オブジェクトの数が、所定値以上であるか否かを判断することは、
各近隣オブジェクトと、アクセスすべきオブジェクトとの距離を順序付けることおよび該距離の順序を取得することと、
該距離の順序に従って、該
近傍ドメインの走査半径未満のアクセスすべきオブジェクトに関する距離を有する近隣オブジェクトの数を計数することと、
該
近傍ドメインの走査半径未満のアクセスすべきオブジェクトに関する距離を有する近隣オブジェクトの数が所定値以下であるか否かを判断することと、を含む。
【0014】
本開示の第2の態様の実施形態は、アクセスすべきオブジェクトの各近隣オブジェクトを取得するように構成された第1の取得ユニットと、
該アクセスすべきオブジェクトを中心とし、且つ、それぞれ異なる走査半径を有する複数の近傍ドメインのうち、その近傍ドメイン内の該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かを判断するように構成された第1の判定ユニッ
トと、
該近隣オブジェクトの数が該所定値以上である該少なくとも1つの
近傍ドメインが存在すると判断された場合に、該アクセスすべきオブジェクトを第1のグループにクラスタリングするように構成されたクラスタリングユニットと、
該第1のグループに入れることができる近隣オブジェクトがなくなるまで、該アクセスすべきオブジェクトの所定の
近傍ドメイン内の
該近隣オブジェクトである直接的に密度可到達の近隣オブジェクトに対して拡張
的にクラスタリングを実行するように構成された拡張クラスタリングユニットと、を含むクラスタリング装置を提供する。
【0015】
第2の態様に関して、第2の態様の第1の可能な実施形態において、該第1の判定ユニットは、
近隣オブジェクトと、アクセスすべきオブジェクトとの距離を取得するように構成された第1の取得サブユニットと、
複数の
近傍ドメインの走査半径の昇順の距離に従って、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かを判断するように構成された第1の判定サブユニットと、
該第1の
近傍ドメイン内の該近隣オブジェクトの数が所定値以上である場合に、該アクセスすべきオブジェクトをコアオブジェクトとして判断するように構成された第1の判断サブユニットと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が所定値未満である場合に、該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かを判断するように、該アクセスすべきオブジェクトの複数の
近傍ドメインの全てが判断されていない場合には、複数の
近傍ドメインの走査半径の昇順の距離に従って、第2の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かを判断するように該第1の判定サブユニットを実行させるように構成された第2の判定サブユニットと、
該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合に、該アクセスすべきオブジェクトをコアオブジェクトではないと判断するように構成された第2の判断サブユニットと、を含む。
【0016】
第2の態様に関して、第2の態様の第2の可能な実施形態において、該第1の判定ユニットは、
近隣オブジェクトとアクセスすべきオブジェクトとの距離を取得するように構成された第2の取得サブユニットと、
該距離と関連付けられ且つ該近傍ドメイン内の該近隣オブジェクトの数に変換される重み係数であって、該距離に対応する
対応重み係数を取得するように構成された第3の取得サブユニッ
トと、
該距離および
該対
応重み係数に従って、
該複数の近傍ドメインを走査半径により昇順で順序づけたときの第1の
近傍ドメイン内の近隣オブジェクトの数を計算するように構成された計算サブユニットと、
該第1の
近傍ドメイン内の近隣オブジェクトの数
が所定値以上であるか否かを判断するように構成された第3の判定サブユニットと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が該所定値以上である場合に、該アクセスすべきオブジェクトをコアオブジェクトとして判断するように構成された第3の判断サブユニットと、
該第1の
近傍ドメイン内の近隣オブジェクトの数が該所定値未満である場合に、該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かを判断するように、該アクセスすべきオブジェクトの複数の
近傍ドメインの全てが判断されていない場合には、該距離および対応する重み係数に従って、第2の
近傍ドメイン内の近隣オブジェクトの数を計算するように計算サブユニットを実行させるように構成された第4の判定サブユニットと、
該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合に、該アクセスすべきオブジェクトをコアオブジェクトではないと判断するように構成された第4の判断サブユニットと、を含む
【0017】
第2の態様の第2の可能な実施形態に関して、第2の態様の第3の可能な実施形態において、該第3の取得サブユニットは、
該近隣オブジェクトから該アクセスすべきオブジェクトまで
の距離と、該近隣オブジェクトが該アクセスすべきオブジェクトと同じであるか否かの確率との対応性を取得するように構成された計数サブユニットと、
該近隣オブジェクトが、該距離に対応する、該アクセスすべきオブジェクトと同じであるか否かの確率を取得するために、該対応性を問い合わせるように構成された問い合わせサブユニットと、
該距離に該確率を掛けることにより、該距離に関連付けられ
且つ該確率と正の相関関係にある対
応重み係数を取得するように構成された第4の取得ユニッ
トと、を含む。
【0018】
第2の態様、または、第2の態様の第1の実施形態から第3の実施形態のうちのいずれか1つに関して、第2の態様の第4の可能な実施形態において、該拡張クラスタリングユニットは、
該複数の近傍ドメインの最大走査半径よりも小さい走査半径を有する該所定の近傍ドメインであって、該アクセスすべきオブジェクトの所定の
近傍ドメイン内の各直接的に密度可到達の近隣オブジェクトを取得するように構成された第5の取得サブユニッ
トと、
各直接的に密度可到達の近隣オブジェクトが、コア
オブジェクトであるであるか否かを1つずつ判断するように構成された第5の判定サブユニットと、
直接的に密度可到達の近隣オブジェクトがコアオブジェクトであると判断された場合に、
該第1のグループに入る近隣オブジェクトがなくなるまで、該直接的に密度可到達の近隣オブジェクトの含まれる所定のドメイン内
の該近隣オブジェクトを
該第1のグループに追加するように構成された拡張クラスタリングサブユニッ
トと、を含む。
【0019】
第2の態様の第4の可能な実施形態に関して、第2の態様の第5の可能な実施形態において、該第5の判定サブユニットは、
該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが、直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメイン内に存在するか否かを判断するように構成された第6の判定サブユニットと、
該近隣オブジェクトの数が所定値以上である場合に、該直接的に密度可到達の近隣オブジェクトをコアオブジェクトとして判断するように構成された第5の判断サブユニットと、
該直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメインの各々における近隣オブジェクトの数が所定値未満である場合に、該直接的に密度可到達の近隣オブジェクトをコアオブジェクトではないと判断するように構成された第6の判断サブユニットと、を含む。
【0020】
第2の態様の第1の可能な実施形態に関して、第2の態様の第6の可能な実施形態において、該第1の判定サブユニットは、
各近隣オブジェクトと、アクセスすべきオブジェクトとの距離を順序付けし、および該距離の順序を取得するように構成された順序付けユニットと、
該距離の順序に従って、該
近傍ドメインの走査半径未満のアクセスすべきオブジェクトに関する距離を有する近隣オブジェクトの数を計数するように構成された第2の計数サブユニットと、
該
近傍ドメインの走査半径未満のアクセスすべきオブジェクトに関する距離を有する近隣オブジェクトの数が所定値以上であるか否かを判断するように構成された第7の判定サブユニットと、を含む。
【0021】
本開示の第3の態様の実施形態は、
プロセッサと、
実行可能な命令を該プロセッサによって格納するように構成された記憶装置であって、該プロセッサは、
アクセスすべきオブジェクトの各近隣オブジェクトを取得するように、
該アクセスすべきオブジェクトを中心とし、且つ、それぞれ異なる走査半径を有する複数の近傍ドメインのうち、その近傍ドメイン内の該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かを判断するように、
該近隣オブジェクトの数が所定値以上である該少なくとも1つの
近傍ドメインが、該アクセスすべきオブジェクトの該複数の
近傍ドメイン内に存在していると判断された場合に、該アクセスすべきオブジェクトを第1のグループにクラスタリングするように、および
該第1のグループに入れることができる近隣オブジェクトがなくなるまで、該アクセスすべきオブジェクトの所定の
近傍ドメイン内の
該近隣オブジェクトである直接的に密度可到達の近隣オブジェクト
を対象として拡張
的に該第1のグループへのクラスタリングを実行するように、
構成される記憶装置と、を含む端末装置を提供する。
【0022】
本開示の実施形態によってもたらされる技術的解決策には、次の有利な効果がある。該クラスタリング方法に従って、該アクセスすべきオブジェクトの各近隣オブジェクトが取得され、該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在することが判断されて、該アクセスすべきオブジェクトがコアオブジェクトとして判断される。該アクセスすべきオブジェクトは、第1のグループにクラスタリングされ、拡張クラスタリングが、該アクセスすべきオブジェクトの所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトに対して実行される。該直接的に密度可到達の近隣オブジェクトがコアオブジェクトではない場合、該拡張クラスタリングは停止され、その後、アクセスすべき全てのオブジェクトがクラスタリングされるまで、アクセスすべき次のオブジェクトが判断される。該複数の
近傍ドメインは、該クラスタリング方法において、アクセスすべきオブジェクトがコアオブジェクトであるか否かを判断するのに用いられるため、Eps(走査半径)およびMinPts(含まれるドットの最小数)に関する制約は低減される。したがって、EpsおよびMinPtsに対するクラスタリング結果の感度は低下し、およびクラスタリング結果の精度が向上する。
【0023】
上記の概要および以下の詳細な説明はともに例示的で説明のためのものであり、およびクレームされているように、本開示を制限するものではないことを理解すべきである。
【発明を実施するための形態】
【0025】
この明細書に組み込まれ、該明細書の一部を構成する添付図面は、本開示と一致する実施形態を示しており、該説明とともに、本開示の原理を説明するのに役立つものである。
【0026】
上記の図面を用いて、本開示によって開示されている実施形態が提示されており、詳細な説明が以下に記載されている。これらの図面は、本開示の範囲を多少なりとも限定しようとするものではなく、特定の実施形態を参照することにより、当業者のために、本開示のアイデアを説明するものである。
【0027】
次に、例示的な実施形態を詳細に説明するが、それらの実施例は、添付図面に図示されている。以下の説明は、添付図面を参照し、異なる図における同じ数字は、説明のない限り、同じまたは同様の要素を示すものとする。例示的な実施形態の以下の説明に記載されている実施態様は、本開示に一致する全ての実施態様を示すものではない。むしろ、それらの実施態様は、単に、添付クレームに列挙されているような本開示に関連する態様に一致する装置および方法の実施例である。
【0028】
本開示の実施形態の詳細な説明の前に、まず、本願明細書の以下の用語の概念を紹介する。
【0029】
E隣接ドメイン:特定のオブジェクトを中心とし、および走査半径Eを有するドメインを、オブジェクトのE隣接ドメインという。
コアオブジェクト:オブジェクトPのEドメイン内の近隣オブジェクトの数がオブジェクト閾値MinPtsに含まれる最小値以上である場合、該オブジェクトをコアオブジェクトという。
近隣オブジェクト:オブジェクトPに直接接続することができるオブジェクトを、オブジェクトPの近隣オブジェクトという。
直接的に密度可到達:サンプルセットに対して、近隣オブジェクトQが、オブジェクトPのE隣接ドメイン内にあり、オブジェクトPがコアオブジェクトである場合、オブジェクトQは、オブジェクトP、すなわち、E隣接ドメイン内のオブジェクトPの近隣オブジェクトから直接的に密度可到達である。
【0030】
図1は、本開示の例示的な実施形態によるクラスタリング方法のフローチャートである。
図1に示すように、該方法は、以下のステップを含む。
【0031】
ステップS100において、オブジェクトの各近隣オブジェクトが取得される。
【0032】
本開示のクラスタリング方法におけるオブジェクトは、顔画像とすることができ、および同一人物に属する画像は、1つのクラスターにクラスタリングされる。顔画像の特徴は、ベクトルのセットに変換され、そのため、2つのオブジェクト間の距離は、それらのベクトル間の距離である。本開示の実施形態によるクラスタリング方法は、確かに、画像以外の他のデータにも適用することができる。
【0033】
処理すべきオブジェクトのセットに対して、該セット内の各オブジェクトが、アクセスすべきオブジェクトとして処理されて、該アクセスすべきオブジェクトの各近隣オブジェクトが取得される。
図2に示すように、オブジェクト5は、オブジェクト4,6および7と直接接続されており、したがって、オブジェクト4,6および7は、オブジェクト5の近隣オブジェクトである。
【0034】
アクセス識別が、各オブジェクトのために設定される。あるオブジェクトがアクセスされた場合、該オブジェクトのアクセス識別は、アクセスされたとマークされる。例えば、あるオブジェクトがアクセスされていない場合、対応するアクセス識別は、「0」であり、あるオブジェクトがアクセスされている場合は、対応するアクセス識別は、「1」である。該オブジェクトが、該オブジェクトのアクセス識別に従ったアクセスすべきオブジェクトであるか否かが識別される。該オブジェクトが、該オブジェクトのアクセス識別に従ったアクセスすべきオブジェクトであるか否かが判断される。
【0035】
ステップS200において、該アクセスすべきオブジェクトは、複数の
近傍ドメインを有し、該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かが判断される。このステップは、主に、該アクセスすべきオブジェクトがコアオブジェクトであるか否かを判断するために用いられる。肯定の場合、ステップS300が実行され、否定の場合には、該アクセスすべきオブジェクトは、ノイズドットとしてマークされ、アクセスすべきオブジェクトが存在しなくなるまで、該アクセスすべきオブジェクトの次の判断を実行するために、ステップS100が実行される。
【0036】
図3に示すように、該アクセスすべきオブジェクトに関する3つの
近傍ドメインは、E1隣接ドメイン、E2隣接ドメインおよびE3隣接ドメインである。E1隣接ドメインの走査半径はE1であり、E2隣接ドメインの走査半径はE2であり、E3隣接ドメインの走査半径はE3であり、この場合、E1<E2<E3である。まず、アクセスすべきオブジェクトPのE1隣接ドメイン内の近隣オブジェクトの数Pst1がMinPst1以上であるか否かが判断され、Pst1≧MinPst1である場合、アクセスすべきオブジェクトPはコアオブジェクトであると判断され、そうでない場合は、さらに、E2隣接ドメイン内のアクセスすべきオブジェクトPの近隣オブジェクトの数Pst2がMinPst2以上であるか否かが判断され、Pst2≧MinPst2である場合、アクセスすべきオブジェクトPはコアオブジェクトであると判断され、そうでない場合は、さらに、アクセスすべきオブジェクトPのE3隣接ドメイン内の近隣オブジェクトの数Pst3がMinPst3以上であるか否かが判断され、Pst3≧MinPst3である場合は、アクセスすべきオブジェクトPはコアオブジェクトであると判断され、そうでない場合は、アクセスすべきオブジェクトPは、コアオブジェクトではないと判断される。該走査半径は、該オブジェクトのデータタイプの異なる特徴に従って設定することができる。
【0037】
ステップS300において、アクセスすべきオブジェクトは、第1のグループにクラスタリングされ、すなわち、該アクセスすべきオブジェクトは、第1のグループとして処理される。
【0038】
グループ番号Cが、該オブジェクトに対して設定される。初期状態において、グループ番号Cはゼロである。1つのグループが追加される度に、その追加されたグループに対応するグループ番号が1つ増える。例えば、オブジェクトPがコアオブジェクトである場合、オブジェクトPは第1のグループにクラスタリングされ、第1のグループに対応するグループ番号は、1になるように更新される。オブジェクトPがある第1のグループに属していないコアオブジェクトQが見つけられた場合、コアオブジェクトQは、第2のグループにクラスタリングされ、第2のグループに対応するグループ番号が2になるように更新される。このようにして、追加されたグループのグループ番号は、現在のグループのグループ番号に基づいて1つ増える。
【0039】
ステップS400においては、第1のグループに入れることができる近隣オブジェクトがなくなるまで、アクセスすべきオブジェクトの所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトに対して、拡張クラスタリングが実行される。
【0040】
該所定の
近傍ドメインは、アクセスすべきオブジェクトの複数の
近傍ドメインのうちの1つ以上とすることができる。例えば、
図3に示すように、
近傍ドメインの走査半径が大きくなるほど、
近傍ドメインの信頼性は低くなり、および該拡張クラスタリングは、高い信頼性を有する
近傍ドメイン内のオブジェクトに対してのみ実行してもよい。例えば、
図3に示すような本開示の例示的な実施形態において、該拡張クラスタリングは、アクセスすべきオブジェクトのE1隣接ドメインおよびE2隣接ドメイン内の近隣オブジェクトに対してのみ実行してもよい。該複数の
近傍ドメインの各々が高い信頼性を有している場合、該拡張クラスタリングは、該複数の
近傍ドメインの各々における近隣オブジェクトに対して実行することができる。
【0041】
図4に示すような本開示の例示的な実施形態において、ステップS400は、以下のステップを含む。
【0042】
ステップS401において、アクセスすべきオブジェクトの所定の
近傍ドメイン内の各直接的に密度可到達の近隣オブジェクトが取得され、この場合、該所定の
近傍ドメインの走査半径は、該複数の
近傍ドメインの最大走査半径未満である。
【0043】
該走査半径が大きくなるほど、ノイズドットの状態に至る確率が大きくなるであろう。したがって、該所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトは、アクセスすべきオブジェクトが中にある第1のグループに追加される。
【0044】
アクセスすべきオブジェクトPの所定の
近傍ドメイン内の全ての近隣オブジェクトのキューNeighborPtsが取得されて、アクセスすべきオブジェクトPと、オブジェクトPの近隣オブジェクトとの距離が直接計算される。次いで、その距離が、所定のドメインの走査半径と比較される。該距離が該走査半径以上である場合、該近隣オブジェクトは、キューNeighborPts内のオブジェクトであることを示している。該距離は、コサイン類似度またはユークリッド距離であってもよい。本願明細書において、2つのオブジェクト間のコサイン類似度が、2つのオブジェクト間の距離関係を示すのに用いられる場合、1とコサイン類似度との距離(1−cosθ)は、その2つのオブジェクト間の距離を表すのに用いられ、この場合、2つのオブジェクト間の距離が短くなるほど、それら2つのオブジェクト間の類似度は高くなることに留意すべきである。
【0045】
別法として、各近隣オブジェクトと、アクセスすべきオブジェクトとの距離が取得された後、該距離は、各距離のサイズに従って順序付けされる。このようにして、取得された距離の順序付けに従って、
近傍ドメイン内のオブジェクトの数を判断する場合、該アクセスすべきオブジェクトに対する距離が、所定の
近傍ドメインの走査半径未満である近隣オブジェクトは、キューNeighborPtsを形成するようにカウントされる。
【0046】
ステップS402においては、各直接的に密度可到達の近隣オブジェクトがコアオブジェクトであるか否かが1つずつ判断される。
【0047】
キューNeighborPts内のオブジェクトPiが詳しく検討されて、オブジェクトPiがコアオブジェクトであるか否かが判断され、この場合、アクセスすべきオブジェクトの直接的に密度可到達の近隣オブジェクトがコアオブジェクトであるか否かを判断する処理は、ステップS200での処理と同じである。
【0048】
各直接的に密度可到達の近隣オブジェクトに対して、該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが、該直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメイン内に存在するか否かが判断される。該近隣オブジェクトの数が該所定値以上である場合、該直接的に密度可到達の近隣オブジェクトは、コアオブジェクトとして判断される。該直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメインの各々における近隣オブジェクトの数が該所定値未満である場合には、該直接的に密度可到達の近隣オブジェクトは、コアオブジェクトとして判断されない。
【0049】
ステップS403においては、該直接的に密度可到達の近隣オブジェクトがコアオブジェクトであると判断された場合、直接的に密度可到達の近隣オブジェクトがその中にある該所定の
近傍ドメイン内の近隣オブジェクトは、第1のグループに入れることができる近隣オブジェクトがなくなるまで、第1のグループに追加される。
【0050】
拡張クラスタリングの実行中には、アクセスすべきオブジェクトを格納するためにキューが生成される。例えば、該拡張クラスタリングを、アクセスすべきオブジェクトPに対して実行する場合、まず、キューが生成されて、該アクセスすべきオブジェクトPの所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトが該キューに追加され、例えば、該キューは、{P1,P2,P3,P4}である。最初に、P1がコアオブジェクトであるか否かが判断される。肯定の場合、P1の所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトが、Pがその中にある第1のグループに追加され、およびP1の所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトは、該キュー(スタックデータ構造)に追加される。該キュー内の次のオブジェクト(例えば、P2)がアクセスされて、オブジェクト(P2)がアクセスされたとマークされ、該オブジェクトがコアオブジェクトであるか否かが判断される。該オブジェクトがコアオブジェクトではない場合は、該オブジェクトが別のグループのメンバーであるか否かが判断される。該オブジェクトが、他のグループのメンバーではない場合、該オブジェクトは、オブジェクトPがその中にある第1のグループに追加される。該キュー内のオブジェクトがなくなるまで、該キュー内の次のオブジェクトがアクセスされる。
【0051】
ステップS404において、直接的に密度可到達の近隣オブジェクトがコアオブジェクトではない場合、各直接的に密度可到達の近隣オブジェクトが既に判断されているか否かが判断される。全ての直接的に密度可到達の近隣オブジェクトが判断されていない場合、ステップS402が実行されて、次の直接的に密度可到達の近隣オブジェクトがコアオブジェクトであるか否かが判断される。各直接的に密度可到達の近隣オブジェクトが既に判断されている場合には、この拡張クラスタリングが終了する。
【0052】
本開示の実施形態によるクラスタリング方法を用いて、アクセスすべきオブジェクトの各近隣オブジェクトが取得されて、近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かが判断され、そして、該アクセスすべきオブジェクトがコアオブジェクトとして判断される。該アクセスすべきオブジェクトは、第1のグループにクラスタリングされ、該アクセスすべきオブジェクトの所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトに対して、該拡張クラスタリングが実行される。該直接的に密度可到達の近隣オブジェクトがコアオブジェクトではない場合、該拡張クラスタリングが停止され、アクセスすべき全てのオブジェクトがクラスタリングされるまで、アクセスすべき次のオブジェクトが判断される。該クラスタリング方法においては、複数の
近傍ドメインは、アクセスすべきオブジェクトがコアオブジェクトであるか否かを判断するのに用いられるため、Eps(走査半径)およびMinPts(含まれるドットの最小数)に関する制約が低減される。したがって、EpsおよびMinPtsに対するクラスタリング結果の感度は低下し、クラスタリング結果の精度が向上する。
【0053】
図5に示すような例示的な実施形態において、
図1のステップS200は、次のステップを含む。
【0054】
ステップS210において、近隣オブジェクトと、アクセスすべきオブジェクトとの距離が取得される。その距離は、コサイン類似度またはユークリッド距離であってもよい。
【0055】
本願明細書においては、2つのオブジェクト間のコサイン類似度が、2つのオブジェクト間の距離関係を示し、1とコサイン類似度との差(1−cosθ)は、2つのオブジェクト間の距離を表すのに用いられ、この場合、2つのオブジェクト間の距離が短くなるほど、それら2つのオブジェクト間の類似度は高くなることに留意すべきである。
【0056】
ステップS220において、複数の
近傍ドメインの走査半径の昇順の距離に従って、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かが判断される。第1の
近傍ドメイン内の近隣オブジェクトの数が所定値以上である場合、ステップS230が実行され、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値未満である場合には、ステップS240が実行される。
【0057】
別法として、各近隣オブジェクトと、アクセスすべきオブジェクトとの距離が取得された後、該距離は、各距離のサイズに従って順序付けされる。このようにして、取得された距離の順序付けに従って、
近傍ドメイン内のオブジェクトの数を判断する場合、該アクセスすべきオブジェクトに対する距離が、
近傍ドメインの走査半径未満である近隣オブジェクトの数がカウントされる。そして、該近隣オブジェクトの数が、対応する所定の閾値以上であるか否かが判断される。
【0058】
例えば、
図3に示すように、まず、E1隣接ドメイン内のオブジェクトの数が判断される。E1隣接ドメイン内のオブジェクトと、オブジェクトPとの距離は、距離の順序付けを取得するために各距離のサイズに従って順序付けされる。まず、該距離の順序付けにおいて、走査半径E1に最も近い距離を、探索法(例えば、2進チョップ)に従って判断してもよく、また、E1隣接ドメイン内のオブジェクトの数を判断するために、該距離の順序付けにおいて、走査半径E1に最も近い距離未満の距離の数がカウントされ、それによって、判断効率が向上する。
【0059】
さらに、E2隣接ドメイン内の近隣オブジェクトの数を判断し続ける必要がある場合、該距離の順序付けを探索することにより、オブジェクトPに対する距離が、走査半径E2未満で、かつ走査半径E1超である近隣オブジェクトの数Pts21がカウントされ、Pts21をPts1に追加することによって、E2隣接ドメイン内の近隣オブジェクトの数が取得される。同様に、該距離の順序付けを探索することにより、オブジェクトPに対する距離が、走査半径E3未満であり、かつ走査半径E2超である近隣オブジェクトの数Pts32がカウントされ、Pts32を、Pts21とPts1の合計に加えることにより、E3隣接ドメイン内の近隣オブジェクトの数が取得される。これ以上の
近傍ドメインがある場合、他の
近傍ドメイン内の近隣オブジェクトの数は、このようにして取得することができる。
【0060】
アクセスすべきオブジェクトPの複数の
近傍ドメインにおいて、該近隣オブジェクトの数は、該複数の
近傍ドメインの走査半径の昇順で判断されることに留意すべきである。ある
近傍ドメイン内の近隣オブジェクトの数が所定値以上であると判断された場合、後の
近傍ドメイン内の近隣オブジェクトの数を判断し続けることは必要ない。
【0061】
ステップS230において、アクセスすべきオブジェクトは、コアオブジェクトとして判断される。
【0062】
ステップS240において、アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かが判断される。該アクセスすべきオブジェクトの複数の
近傍ドメインの全てが判断されていない場合、ステップS220が実行され、さらに、該複数の
近傍ドメインの走査半径の昇順の距離に従って、第2の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かが判断され、および該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合には、ステップS250が実行される。
【0063】
例えば、その最初の値がゼロである変数iを設定することができる。第1の
近傍ドメインを判断する場合、変数iは、1つずつ増加する(すなわち、i=i+1)。変数iと、該アクセスすべきオブジェクトの複数の
近傍ドメインの数を比較することにより、該アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かを判断することができる。
【0064】
ステップS250においては、該アクセスすべきオブジェクトがコアオブジェクトではないと判断される。
【0065】
アクセスすべきオブジェクトPがコアオブジェクトではないと判断された場合、オブジェクトPはノイズドットであり、アクセスすべきオブジェクトがなくなるまで、アクセスすべき次のオブジェクトの各近隣オブジェクトを取得するステップが実行される。
【0066】
本開示の実施形態による、該オブジェクトがコアオブジェクトであるか否かを判断するための方法を用いて、
近傍ドメイン内の近隣オブジェクトの数が、該近隣オブジェクトと、アクセスすべきオブジェクトとの距離に従って直接判断される。アクセスすべきオブジェクトの複数の
近傍ドメインの特定の
近傍ドメイン内の近隣オブジェクトの数が所定の閾値以上である場合、該アクセスすべきオブジェクトはコアオブジェクトである。換言すれば、Eps(走査半径)およびMinPts(含まれるドットの最小数)に関する制約は低減される。したがって、EpsおよびMinPtsに対するクラスタリング結果の感度は低下し、およびクラスタリング結果の精度が向上する。
【0067】
図6に示すような本開示の別の例示的な実施形態においては、
図1のステップS200は、次のステップを含む。
【0068】
ステップS211において、近隣オブジェクトと、アクセスすべきオブジェクトとの距離が取得される。その距離は、コサイン類似度またはユークリッド距離であってもよい。
【0069】
本願明細書においては、2つのオブジェクト間のコサイン類似度が、2つのオブジェクト間の距離関係を示し、1とコサイン類似度との差(1−cosθ)は、2つのオブジェクト間の距離を表すのに用いられ、この場合、2つのオブジェクト間の距離が短くなるほど、それら2つのオブジェクト間の類似度は高くなることに留意すべきである。
【0070】
ステップS221においては、該距離に対応する重み係数が取得され、この場合、該重み係数は、該距離と、2つのオブジェクト間の類似度とに関連付けられている。
【0071】
該重み係数は、2つのオブジェクト間の距離と、2つのオブジェクト間の類似度との関係を反映することが可能である。例えば、該距離が長くなるほど、類似度は低くなり、対応する重み係数は小さくなる。対照的に、該距離が短くなるほど、類似度は高くなり、対応する重み係数は大きくなる。
【0072】
本開示の例示的な実施形態において、該重み係数は、2つのオブジェクト間の距離と、該2つのオブジェクトが互いに同一であるか否かの確率とによって判断してもよい。
図7に示すように、該重み係数は、次のステップによって取得される。
【0073】
ステップS2211においては、サンプルオブジェクト統計に従って、近隣オブジェクトからの距離と、アクセスすべきオブジェクトとの対応性と、該近隣オブジェクトが該アクセスすべきオブジェクトと同じであるか否かの確率とが取得される。
【0074】
2つのオブジェクト間の距離(例えば、コサイン類似度またはユークリッド距離)が取得される。該2つのオブジェクトを、それぞれAおよびBであると仮定すると、該2つのオブジェクト間のコサイン類似度は、式(1)に従って計算することができる。
【0075】
【数1】
ただし、A・Bは、ベクトルAとベクトルBの内積であり、|A|は、ベクトルAの長さであり、|B|は、ベクトルBの長さである。
【0076】
例えば、顔認識において、高次元の特徴に従って計算された2つの顔画像のコサイン類似度cosθは、[0,1]の範囲内にある。大量の顔画像統計データによれば、コサイン類似度が[0.4,1]の範囲内にある場合、2つのオブジェクトが互いに同一であるか否かの確率は98%であり、コサイン類似度が[0.35,0.4]の範囲内にある場合、2つのオブジェクトが互いに同一であるか否かの確率は90%であり、コサイン類似度が[0.3,0.35]の範囲内にある場合、2つのオブジェクトが互いに同一であるか否かの確率は70%であり、コサイン類似度が[0.25,0.3]の範囲内にある場合、2つのオブジェクトが互いに同一であるか否かの確率は40%であり、コサイン類似度が[0,0.25]の範囲内にある場合、2つのオブジェクトが互いに同一であるか否かの確率は10%である。
【0077】
上記の統計結果によれば、2つのオブジェクト間の距離と、該2つのオブジェクトが互いに同一であるか否かの確率との関係を得ることができる。その関係は、テーブルに、または他の形式で格納することができる。
【0078】
ステップS2212においては、該対応性を問い合わせることにより、近隣オブジェクトが、該距離に一致するアクセスすべきオブジェクトと同じであるか否かの確率を取得する。
【0079】
ステップS2213においては、該距離に該確率を掛けることにより、その距離に関連付けられた対応する重み係数が取得され、この場合、該重み係数は該確率と正の相関関係にある。
【0080】
ステップS2211における統計結果によれば、該重み係数と、コサイン類似度との関係は、式(2)として示すことができる。
【0082】
式(2)は、コサイン類似度と、2つのオブジェクトが同一人物であるか否かの確率との関係を表す。他の種類の距離の場合、関係式は、該距離と、対応する確率との関係に従ってまとめて推論することができるが、本願明細書においては省略する。
【0083】
重み係数は、該重み係数が、2つのオブジェクト間の距離と、2つのオブジェクト間の類似度との関係を表すことができる限り、他の手段によって確実に取得することができる。
【0084】
ステップS231において、指定され
近傍ドメイン内の近隣オブジェクトの数は、該重み係数および該距離に従って計算される。
【0085】
別法として、各近隣オブジェクトと、アクセスすべきオブジェクトとの距離が取得された後、該距離は、各距離のサイズに従って順序付けされる。このようにして、
近傍ドメイン内のオブジェクトの数を判断する場合、該アクセスすべきオブジェクトに対する距離が、
近傍ドメインの走査半径未満である近隣オブジェクトの数が、該距離の順序付けに従ってカウントされる。そして、指定された
近傍ドメイン内の近隣オブジェクトと、アクセスすべきオブジェクトとの距離と、対応する重み係数とに従って、E隣接ドメイン内の近隣オブジェクトの数が取得される。
【0086】
指定された
近傍ドメインは、アクセスすべきオブジェクトの複数の
近傍ドメインのうちのいずれか1つとすることができ、および該複数の
近傍ドメインの走査半径の昇順で変えてもよい。
【0087】
式(2)における重み係数に従って、近隣オブジェクトの数は、式(3)として表すことができる。
【0089】
式(3)は、E
近傍ドメイン内の全てのオブジェクトの総数を表す。実際には、各オブジェクトの数は、1から、該オブジェクトと、アクセスすべきオブジェクトとの距離に対応する重み係数W(di)に変えられる。換言すれば、E隣接ドメイン内のオブジェクトの数を計算するだけではなく、オブジェクトが中心点に近づくほど、該オブジェクトの数の変換割合が大きくなり、対照的に、オブジェクトが中心点から離れるほど、該オブジェクトの数の変換割合は小さくなるということが取得される。
【0090】
ステップS241においては、アクセスすべきオブジェクトの
近傍ドメイン内の近隣オブジェクトの数が、対応する所定の閾値以上であるか否かが判断される。肯定の場合、ステップS251が実行され、否定の場合は、ステップS261が実行される。
【0091】
図5における所定の閾値とは異なる所定の閾値は、重み係数により調節することができる。さらに、本開示の例示的な実施形態における所定の閾値は、
図5における所定の閾値よりも小さい。
【0092】
各
近傍ドメイン内のオブジェクトの数が、走査半径に従って順に、対応する閾値要件を満たすか否かが判断される。肯定の場合、次の
近傍ドメイン内のオブジェクトの数が判断されることになる。
【0093】
ステップS251において、
近傍ドメイン内の近隣オブジェクトの数が所定の閾値以上である場合に、アクセスすべきオブジェクトは、コアオブジェクトとして判断される。
【0094】
ステップS261においては、
近傍ドメイン内の近隣オブジェクトの数が所定の閾値未満である場合には、アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かが判断される。肯定の場合、ステップS271が実行され、否定の場合には、ステップS231が実行されて、アクセスすべきオブジェクトの次の
近傍ドメイン内の近隣オブジェクトの数が、該重み係数および該距離に従って計算される。
【0095】
例えば、その最初の値がゼロである変数iを設定することができる。第1の
近傍ドメインが判断されると、変数iは、1つ増加する(すなわち、i=i+1)。変数iと、アクセスすべきオブジェクトの複数の
近傍ドメインの数とを比較することにより、アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かを判断することができ、この場合、i番目の
近傍ドメインの走査半径は、(i+1)番目の
近傍ドメインの走査半径よりも小さい。
【0096】
アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合、該アクセスすべきオブジェクトは、コアオブジェクトとして判断されない。
【0097】
アクセスすべきオブジェクトPがコアオブジェクトではないと判断された場合、オブジェクトPはノイズドットであり、該アクセスすべきオブジェクトは、アクセスされたとマークされ、アクセスすべきオブジェクトがなくなるまで、アクセスすべき次のオブジェクトの各近隣オブジェクトを取得するステップが実行される。
【0098】
アクセスすべきオブジェクトがコアオブジェクトであるか否かを判断するための方法を用いて、中心点に近い近隣オブジェクトが、該数の大きな変換割合を有し、および
近傍ドメイン内の近隣オブジェクトの数に対する大きな寄与を有するように、近隣オブジェクトの数が、近隣オブジェクトと、アクセスすべきオブジェクトとの距離に対応する重み係数に従って変換され、対照的に、中心点から遠く離れている近隣オブジェクトは、該数の低い変換割合を有し、および
近傍ドメイン内の近隣オブジェクトの数に対する小さな寄与を有し、それに伴って、EpsおよびMinPtsに対するクラスタリング結果の感度がさらに低減され、およびクラスタリング結果の精度が向上する。
【0099】
図8は、本開示の例示的な実施形態によるクラスタリング装置の概略図である。
図8を参照すると、該装置は、第1の取得ユニット100と、第1の判定ユニット200と、クラスタリングユニット300と、拡張クラスタリングユニット400とを含む。
【0100】
第1の取得ユニット100は、アクセスすべきオブジェクトの各近隣オブジェクトを取得するように構成されている。
【0101】
第1の判定ユニット200は、近隣オブジェクトの数が所定値以上である、少なくとも1つの
近傍ドメインが存在するか否かが判断され、この場合、アクセスすべきオブジェクトは、複数の
近傍ドメインを有する。
【0102】
図3の
近傍ドメイン分布の概略図を参照して、第1の判定ユニット200は、まず、アクセスすべきオブジェクトPのE1隣接ドメイン内の近隣オブジェクトの数Pst1がMinPst1以上であるか否かを判断し、Pst1≧MinPst1の場合、第1の判定ユニット200は、アクセスすべきオブジェクトPがコアオブジェクトであると判断し、そうでない場合は、アクセスすべきオブジェクトPのE2隣接ドメイン内の近隣オブジェクトの数Pst2がMinPst2以上であるか否かを判断し、Pst2≧MinPst2である場合、第1の判定ユニット200は、アクセスすべきオブジェクトPがコアオブジェクトであると判断し、そうでない場合は、第1の判定ユニット200は、さらに、E3隣接ドメイン内のアクセスすべきオブジェクトPの近隣オブジェクトの数Pst3がMinPst3以上であるか否かを判断し、Pst3≧MinPst3である場合、第1の判定ユニット200は、アクセスすべきオブジェクトPはコアオブジェクトであると判断し、そうでない場合は、第1の判定ユニット200は、コアオブジェクトではないと判断する。
【0103】
クラスタリングユニット300は、近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かが判断される場合に、アクセスすべきオブジェクトを第1のグループにクラスタリングするように構成されている。
【0104】
拡張クラスタリングユニット400は、第1のグループに入れられる近隣オブジェクトがなくなるまで、アクセスすべきオブジェクトの所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトに対して拡張クラスタリングを実行するように構成されている。
【0105】
本開示の例示的な実施形態において、該拡張クラスタリングユニットは、第5の取得サブユニットと、第5の判定サブユニットと、拡張クラスタリングサブユニットとを含むことができる。
【0106】
第5の取得サブユニットは、アクセスすべきオブジェクトの所定の
近傍ドメイン内の各直接的に密度可到達の近隣オブジェクトを取得するように構成され、この場合、該所定の
近傍ドメインの走査半径は、複数の
近傍ドメインの最大走査半径よりも小さい。
【0107】
走査半径が大きくなるほど、ノイズドットの状態に至る確率が大きくなるであろう。したがって、該所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトは、アクセスすべきオブジェクトが中にある第1のグループに追加される。
【0108】
第5の判定サブユニットは、各直接的に密度可到達の近隣オブジェクトがコア近隣であるか否かを1つずつ判断するように構成されている。
【0109】
拡張クラスタリングサブユニットは、所定の
近傍ドメイン内の近隣オブジェクトを追加するように構成され、この場合、直接的に密度可到達の近隣オブジェクトがコアオブジェクトであると判断されると、第1のグループに入れることができる近隣オブジェクトがなくなるまで、該直接的に密度可到達の近隣オブジェクトは、第1のグループに入れられる。
【0110】
本開示の例示的な実施形態において、第5の判定サブユニットは、第6の判定サブユニットと、第5の判断サブユニットと、第6の判断サブユニットとを含むことができる。
【0111】
第6の判定サブユニットは、近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが、直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメイン内に存在するか否かを判断するように構成されている。
【0112】
第5の判断サブユニットは、近隣オブジェクトの数が所定値以上である場合に、該直接的に密度可到達の近隣オブジェクトをコアオブジェクトとして判断するように構成されている。
【0113】
第6の判断サブユニットは、直接的に密度可到達の近隣オブジェクトの複数の
近傍ドメインの各々における近隣オブジェクトの数が所定値未満である場合に、該直接的に密度可到達の近隣オブジェクトをコアオブジェクトではないと判断するように構成されている。
【0114】
本開示の実施形態によるクラスタリング装置を用いて、第1の判定ユニットは、近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かを判断し、すなわち、第1の判定ユニットは、アクセスすべきオブジェクトがコアオブジェクトであるか否かを判断し、該アクセスすべきオブジェクトがコアオブジェクトである場合、該クラスタリングユニットは、該アクセスすべきオブジェクトを第1のグループにクラスタリングし、該拡張クラスタリングユニットは、アクセスすべきオブジェクトの所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトに対して拡張クラスタリングを実行し、該直接的に密度可到達の近隣オブジェクトがコアオブジェクトである場合、該直接的に密度可到達の近隣オブジェクトがその中にある所定の
近傍ドメイン内の近隣オブジェクトは、第1のグループに追加され、該直接的に密度可到達の近隣オブジェクトがコアオブジェクトではない場合、該拡張クラスタリングは停止される。そして、第1のグループに入れることができる近隣オブジェクトがなくなるまで、アクセスすべき次のオブジェクトが判断される。該クラスタリング装置においては、複数の
近傍ドメインが、アクセスすべきオブジェクトがコアオブジェクトであるか否かを判断するのに用いられるため、Eps(走査半径)およびMinPts(含まれるドットの最小数)に関する制約が低減される。したがって、EpsおよびMinPtsに対するクラスタリング結果の感度は低下し、クラスタリング結果の精度が向上する。
【0115】
図7に示すような本開示の例示的な実施形態において、第1の判定ユニットは、第1の取得サブユニットと、第1の判定サブユニットと、第1の判断サブユニットと、第2の判定サブユニットと、第2の判断サブユニットとを含む。
【0116】
第1の取得サブユニットは、近隣オブジェクトとアクセスすべきオブジェクトとの距離を取得するように構成されている。
【0117】
第1の判定サブユニットは、複数の
近傍ドメインの走査半径の昇順の距離に従って、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かを判断するように構成されている。
【0118】
別法として、各近隣オブジェクトと、アクセスすべきオブジェクトとの距離が取得された後、各距離のサイズに従って該距離が順序付けされる。このようにして、
近傍ドメイン内のオブジェクトの数が、得られた距離の順序付けに従って判断される場合、アクセスすべきオブジェクトに関する距離が、
近傍ドメインの走査半径未満である近隣オブジェクトの数がカウントされる。そして、近隣オブジェクトの数が、対応する所定の閾値以上であるか否かが判断される。
【0119】
第1の判断サブユニットは、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値以上である場合に、アクセスすべきオブジェクトをコアオブジェクトとして判断するように構成されている。
【0120】
第2の判定サブユニットは、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値未満である場合に、アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かを判断するように、アクセスすべきオブジェクトの複数の
近傍ドメインの全てが判断されていない場合には、複数の
近傍ドメインの走査半径の昇順の距離に従って、第2の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かを判断するように第1の判定サブユニットを実行させるように構成されている。
【0121】
第2の判断サブユニットは、アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合に、該アクセスすべきオブジェクトをコアオブジェクトではないと判断して、該アクセスすべきオブジェクトをマークし、およびアクセスすべき次のオブジェクトの各近隣オブジェクトを取得するように、第1の取得ユニットを制御するように構成されている。
【0122】
本開示の実施形態による第1の判定ユニットを用いて、
近傍ドメイン内の近隣オブジェクトの数は、該近隣オブジェクトと、アクセスすべきオブジェクトとの距離に従って直接判断される、アクセスすべきオブジェクトの複数の
近傍ドメインのうちの特定の1つにおける近隣オブジェクトの数が所定の閾値以上である場合、該アクセスすべきオブジェクトは、コアオブジェクトである。換言すれば、Eps(走査半径)およびMinPts(含まれるドットの最小数)に関する制約は低減される。したがって、EpsおよびMinPtsに対するクラスタリング結果の感度は低下し、およびクラスタリング結果の精度が向上する。
【0123】
本開示の例示的な実施形態においては、判断効率を向上させるために、第1の判定サブユニットは、順序付けユニットと、第2の計数サブユニットと、第7の判定サブユニットとを含む。
【0124】
順序付けユニットは、各近隣オブジェクトと、アクセスすべきオブジェクトとの距離を順序付けして、該距離の順序を得るように構成されている。
【0125】
第2の計数サブユニットは、アクセスすべきオブジェクトに関して、
近傍ドメインの走査半径未満の距離を有する近隣オブジェクトの数を、該距離の順序付けに従って計数するように構成されている。
【0126】
第7の判定サブユニットは、アクセスすべきオブジェクトに関して、
近傍ドメインの走査半径未満の距離を有する近隣オブジェクトの数が所定値以上であるか否かを判断するように構成されている。
【0127】
本開示の実施形態による第1の判定サブユニットを用いて、順序付けユニットは、特定の
近傍ドメイン内の各オブジェクトと、アクセスすべきオブジェクトとの距離を順序付けして、該距離の順序付けを得る。そして、該距離の順序付けにおける走査半径に最も近い距離が、探索法(例えば、2進チョップ)に従って判断され、特定の
近傍ドメイン内のオブジェクトの数を判断するために、該走査半径に最も近い距離未満の距離の数がカウントされ、それによって、判断効率が向上する。
【0128】
図7に示すような本開示の別の例示的な実施形態においては、第1の判定ユニット200は、第2の取得サブユニットと、第3の取得サブユニットと、計算サブユニットと、第3の判定サブユニットと、第3の判断サブユニットと、第4の判定サブユニットと、第4の判断サブユニットとを含む。
【0129】
第2の取得サブユニットは、近隣オブジェクトと、アクセスすべきオブジェクトとの距離を取得するように構成されている。
【0130】
第3の取得サブユニットは、該距離に対応する重み係数を取得するように構成され、この場合、該重み係数は該距離に関連付けられる。
【0131】
該重み係数は、2つのオブジェクト間の距離と、2つのオブジェクト間の類似度との関係を反映することが可能である。例えば、該距離が長くなるほど、類似度は低くなり、および対応する重み係数は小さくなる。対照的に、該距離が短くなるほど、類似度は高くなり、対応する重み係数は大きくなる。
【0132】
本開示の例示的な実施形態において、第3の取得サブユニットは、計数サブユニットと、問い合わせサブユニットと、第4の取得ユニットとを含む。
【0133】
該計数サブユニットは、近隣オブジェクトおよびアクセスすべきオブジェクトからの距離と、該近隣オブジェクトが、該アクセスすべきオブジェクトが同じであるか否かの確率との対応性を得るように構成されている。
【0134】
該問い合わせサブユニットは、該対応性を問い合わせて、近隣オブジェクトが、該距離に対応するアクセスすべきオブジェクトと同じであるか否かの確率を取得するように構成されている。
【0135】
第4の取得ユニットは、該距離に該確率を掛けることによって、該距離に関連付けられた対応する重み係数を得るように構成され、この場合、該重み係数は、該確率と正の相関関係にある。
【0136】
該計算サブユニットは、該重み係数と、該距離とに従って、
近傍ドメイン内の近隣オブジェクトの数を計算するように構成されている。別法として、各近隣オブジェクトと、アクセスすべきオブジェクトとの距離が取得された後、該距離は、各距離のサイズに従って順序付けされる。このようにして、
近傍ドメイン内のオブジェクトの数の場合、該距離の順序付けに従って、該アクセスすべきオブジェクトに対する距離が、
近傍ドメインの走査半径未満である近隣オブジェクトの数がカウントされる。そして、指定された
近傍ドメイン内の近隣オブジェクトと、アクセスすべきオブジェクトとの距離と、対応する重み係数とに従って、E隣接ドメイン内の近隣オブジェクトの数が取得される。
【0137】
第3の判定サブユニットは、複数の
近傍ドメインの走査半径の昇順で、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であるか否かを判断するように構成されている。
【0138】
第3の判断サブユニットは、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値以上である場合に、該アクセスすべきオブジェクトをコアオブジェクトとして判断するように構成されている。
【0139】
第4の判定サブユニットは、第1の
近傍ドメイン内の近隣オブジェクトの数が所定値未満である場合に、アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されているか否かを判断するように、アクセスすべきオブジェクトの複数の
近傍ドメインの全てが判断されていない場合には、該距離および該対応する重み係数に従って、第2の
近傍ドメイン内の近隣オブジェクトの数を計算するように該計算サブユニットを実行させ、さらに、第3の判定サブユニットは、第2の
近傍ドメイン内の近隣オブジェクトの数が所定値以上であることを判断する。
【0140】
第4の判断サブユニットは、アクセスすべきオブジェクトの複数の
近傍ドメインの各々が既に判断されている場合に、該アクセスすべきオブジェクトをコアオブジェクトではないと判断して、該アクセスすべきオブジェクトをアクセスされたとマークし、およびアクセスすべき次のオブジェクトの各近隣オブジェクトを取得するように、第1の取得ユニットを制御するように構成されている。
【0141】
アクセスすべきオブジェクトがコアオブジェクトであるか否かを判断するための方法を用いて、中心点に近い近隣オブジェクトが、該数の大きな変換割合を有し、および
近傍ドメイン内の近隣オブジェクトの数に対する大きな寄与を有するように、近隣オブジェクトの数が、近隣オブジェクトと、アクセスすべきオブジェクトとの距離に対応する重み係数に従って変換され、対照的に、中心点から遠く離れている近隣オブジェクトは、該数の低い変換割合を有し、および
近傍ドメイン内の近隣オブジェクトの数に対する小さな寄与を有し、それに伴って、EpsおよびMinPtsに対するクラスタリング結果の感度がさらに低減され、およびクラスタリング結果の精度が向上する。
【0142】
上記の実施形態における装置に関しては、動作を実行する各ユニットのモードが、関連する方法の実施形態において詳細に記載されており、本願明細書においては省略されている。
【0143】
図9は、例示的な実施形態によるクラスタリング装置800のブロック図である。例えば、装置800は、携帯電話、コンピュータ、ディジタル放送端末、メッセージング装置、ゲーム機、タブレット、医療装置、運動器具、携帯情報端末等とすることができる。
【0144】
図9を参照すると、装置800は、次のコンポーネント、すなわち、処理コンポーネント802、記憶装置804、電力コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)インタフェース812、センサコンポーネント814および通信コンポーネント816のうちの1つ以上を含んでもよい。
【0145】
処理コンポーネント802は、典型的には、ディスプレイ、電話の発呼・着呼、データ通信、カメラ操作および記録動作に関連する動作等の装置800の全体の動作を制御する。処理コンポーネント802は、上述した方法におけるステップの全てまたは一部を行うための命令を実行する1つ以上のプロセッサ820を含んでもよい。さらに、処理コンポーネント802は、処理コンポーネント802と、その他のコンポーネントとの相互作用を容易にする1つ以上のモジュールを含んでもよい。例えば、処理コンポーネント802は、マルチメディアコンポーネント808と処理コンポーネント802との相互作用を容易にするマルチメディアモジュールを含んでもよい。
【0146】
記憶装置804は、装置800の動作をサポートするための様々な種類のデータを格納するように構成されている。このようなデータの実例は、装置800上で機能される何らかのアプリケーションまたは方法のための命令、接触データ、電話帳データ、メッセージ、写真、ビデオ等を含む。記憶装置804は、スタティックランダムアクセスメモリ(SRAM)、電気的消去可能読取専用メモリ(EEPROM)、消去可能プログラム可能読取専用メモリ(EPROM)、プログラム可能読取専用メモリ(PROM)、読取専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気または光ディスク等の何らかのタイプの揮発性または不揮発性メモリデバイス、またはそれらの組合せを用いて実施することができる。
【0147】
電力コンポーネント806は、装置800のさまざまなコンポーネントに電力を供給する。電力コンポーネント806は、電力管理システムと、1つ以上の電源と、装置800における電力の生成、管理および配電に関連する他の何らかのコンポーネントとを含むことができる。
【0148】
マルチメディアコンポーネント808は、装置800とユーザとの間の出力インタフェースを形成するスクリーンを含む。いくつかの実施形態において、該スクリーンは、液晶ディスプレイ(LCD)およびタッチパネル(TP)を含むことができる。該スクリーンがタッチパネルを含む場合、該スクリーンは、ユーザからの入力信号を受け取るタッチスクリーンとして実施してもよい。該タッチパネルは、該タッチパネルへの接触、スワイプおよびジェスチャーを感知する1つ以上のタッチセンサを含む。該タッチセンサは、接触またはスワイプ動作の境界を感知するだけではなく、接触またはスワイプ動作に関連する周期および圧力も感知することができる。いくつかの実施形態において、マルチメディアコンポーネント808は、前方カメラおよび/または後方カメラを含む。該前方カメラおよび後方カメラは、装置800が、撮影モードまたはビデオモード等の動作モードになっている間、外部マルチメディアデータを受け取ることができる。該前方カメラおよび後方カメラの各々は、固定光学レンズシステムであってもよく、および焦点および光学ズーム性能を有することができる。
【0149】
オーディオコンポーネント810は、オーディオ信号を出力および/または入力するように構成されている。例えば、オーディオコンポーネント810は、装置800が、発呼モード、記録モードおよび音声認識モード等の動作モードになっているときに、外部音声信号を受け取るように構成されたマイクロフォン(MIC)を含む。受け取ったオーディオ信号は、さらにメモリ804に格納してもよく、または、通信コンポーネント816を介して送信してもよい。いくつかの実施形態において、オーディオコンポーネント810はさらに、オーディオ信号を出力するスピーカーを含む。
【0150】
I/Oインタフェース812は、処理コンポーネント802と、キーボード、クリックホイール、ボタン等の周辺インタフェースモジュールとの間のインタフェースを形成する。該ボタンは、限定するものではないが、ホームボタン、ボリュームボタン、スタートボタンおよびロッキングボタンを含んでもよい。
【0151】
センサコンポーネント814は、装置800のさまざまな様子に関する状態評価を実行できる1つ以上のセンサを含む。例えば、センサコンポーネント814は、装置800の開/閉状態、装置800のコンポーネント、例えば、ディスプレイおよびキーボードの相対的位置、装置800または装置800のコンポーネントの位置の変化、装置800と接触するユーザの存在の有無、装置800の方向性または加速/減速、および装置800の温度の変化を検出してもよい。センサコンポーネント814は、何らかの物理的接触を伴うことなく、すぐ近くのオブジェクトの存在を検出するように構成された近接センサを含んでもよい。また、センサコンポーネント814は、撮像用途に用いるための、CMOSまたはCCD等の光センサも含んでもよい。いくつかの実施形態においては、センサコンポーネント814は、加速度計、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサも含んでもよい。
【0152】
通信コンポーネント816は、装置800と他の装置との有線または無線の通信を容易にするように構成されている。装置800は、WiFi,2Gまたは3G、またはこれらの組合せ等の通信規格に基づいて無線ネットワークにアクセスすることができる。1つの実施例において、通信コンポーネント816は、放送チャネルを介して外部放送管理システムからの放送信号または放送関連情報を受信する。1つの例示的な実施形態において、通信コンポーネント816は、近距離通信を容易にするために、近距離無線通信(NFC)モジュールをさらに含む。例えば、NFCモジュールは、無線自動識別(RFID)技術、赤外線通信(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)技術およびその他の技術に基づいて実施することができる。
【0153】
例示的な実施形態において、装置800は、1つ以上の特定用途向け集積回路(ASIC)、ディジタル信号プロセッサ(DSP)、ディジタル信号処理装置(DSPD)、プログラム可能論理素子(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、制御装置、マイクロコントローラ、マイクロプロセッサ、または、上述した方法を実行するための他の電子コンポーネントを用いて実施することができる。
【0154】
例示的な実施形態においては、上述した方法を実行するための、装置800のプロセッサ820によって実行可能な、例えば、記憶装置804に含まれる命令を含む、非持続性コンピュータ可読記憶媒体も設けられている。例えば、該非持続性コンピュータ可読記憶媒体は、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ記憶装置等であってもよい。
【0155】
該記憶媒体内の命令が、携帯端末のプロセッサによって実行される場合に、該携帯端末が、
アクセスすべきオブジェクトの各近隣オブジェクトを取得することと、
該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在するか否かを判断することであって、該アクセスすべきオブジェクトが複数の
近傍ドメインを有することと、
該近隣オブジェクトの数が所定値以上である少なくとも1つの
近傍ドメインが存在する場合に、該アクセスすべきオブジェクトを第1のグループにクラスタリングすることと、
第1のグループに入れることができる近隣オブジェクトがなくなるまで、該アクセスすべきオブジェクトの所定の
近傍ドメイン内の直接的に密度可到達の近隣オブジェクトに対して拡張クラスタリングを実行することと、を含むクラスタリング方法を実行することができる非持続性コンピュータ可読記憶媒体が設けられる。
【0156】
本開示が、上述され、および添付図面に図示されている正確な構成に限定されないこと、および本発明の範囲から逸脱することなく、さまざまな変更および変形が実行可能であることは正しく認識されるであろう。本開示の範囲は、添付クレームによってのみ限定されることが意図されている。
【0157】
「第1の」および「第2の」等の本願明細書における関連する用語は、単に存在物または動作と別の存在物または動作を区別することが意図され、それらの存在物または動作間の何らかの関係または順序をほのめかすことは意図されていないことに留意すべきである。さらに、「含む」、「備える」またはその他の変形等の用語は、非排他的な意味をカバーするように意図され、そのため、一連の要素を含むプロセス、方法、オブジェクトまたは装置は、明確に概説されていない他の要素をさらに含んでもよく、または、該プロセス、方法、オブジェクトまたは装置の固有の要素を含んでもよい。
【0158】
上記は、単に本開示の実施形態であり、および当業者が本開示を理解または実施するのに役に立つように意図されている。それらの実施形態のさまざまな変更は、当業者には明らかであり、また、本願明細書で定義されている一般的原理は、本開示の趣旨および範囲から逸脱することなく、他の実施形態において実行することができる。したがって、本開示は、本願明細書のそれらの実施形態に限定されないが、本開示の原理および新規な特徴に適合する最も広い範囲を請求する。