(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024174681
(43)【公開日】2024-12-17
(54)【発明の名称】情報処理装置の制御方法、情報処理装置、及びプログラム
(51)【国際特許分類】
G06F 17/16 20060101AFI20241210BHJP
G06T 7/00 20170101ALI20241210BHJP
G06V 10/762 20220101ALI20241210BHJP
G06N 20/00 20190101ALI20241210BHJP
【FI】
G06F17/16 K
G06T7/00 300F
G06V10/762
G06N20/00
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2023092640
(22)【出願日】2023-06-05
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100090273
【弁理士】
【氏名又は名称】國分 孝悦
(72)【発明者】
【氏名】野呂 英生
(72)【発明者】
【氏名】舘 俊太
【テーマコード(参考)】
5B056
5L096
【Fターム(参考)】
5B056BB42
5B056BB83
5L096FA35
5L096GA51
5L096JA05
5L096JA11
5L096MA07
(57)【要約】
【課題】非教師型のデータ分類をより好適な態様で実現する。
【解決手段】算出部12は、分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する。補正部13は、類似度行列の少なくとも一部の要素を対象として、当該要素に対応する類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する。分類部14は、補正部13による補正後の類似度行列に基づき、上記一連のデータを1以上のグループに分類する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
情報処理装置の制御方法であって、
分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する生成ステップと、
前記類似度行列の少なくとも一部の前記要素を対象として、当該要素に対応する前記類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する補正ステップと、
前記補正ステップにおける補正後の類似度行列に基づき、前記一連のデータを1以上のグループに分類する分類ステップと、
を含むことを特徴とする、情報処理装置の制御方法。
【請求項2】
前記補正ステップは、前記類似度行列の一連の前記要素それぞれに対応する前記類似度のうち、第1の閾値を超える類似度を対象として、当該類似度に応じた変換を施すことで、当該類似度行列を補正することを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項3】
前記第1の閾値は、あらかじめ指定された定数値であることを特徴とする、請求項2に記載の情報処理装置の制御方法。
【請求項4】
前記第1の閾値は、前記類似度行列の行または列ごとに作成されたヒストグラムを対象として、当該ヒストグラムが二峰分布をなすと仮定した場合の二峰の谷となる値であることを特徴とする、請求項2に記載の情報処理装置の制御方法。
【請求項5】
前記補正ステップは、基準値を超える類似度と、当該基準値未満の類似度と、に対して互いに異なる変換を施すことを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項6】
前記補正ステップは、
単調増加関数により、
前記基準値を超える類似度を、変換前よりも値の大きい類似度に変換し、
前記基準値未満の類似度を、変換前よりも値の小さい類似度に変換する
ことを特徴とする、請求項5に記載の情報処理装置の制御方法。
【請求項7】
前記補正ステップは、前記基準値を超える第1の類似度に対して、当該第1の類似度の算出元となる2つの特徴量のうちの一方に対して変動を与えた場合における、当該2つの特徴量の第2の類似度に基づき変換を施すことを特徴とする、請求項6に記載の情報処理装置の制御方法。
【請求項8】
前記補正ステップは、第1の類似度及び第2の類似度の平均、最大値、及び最小値のうちのいずれかを変換後の類似度として適用することを特徴とする、請求項7に記載の情報処理装置の制御方法。
【請求項9】
前記補正ステップは、前記基準値を超える第1の類似度に対して、当該第1の類似度の算出元となる2つの特徴量を抽出した第1の抽出手段とは異なる第2の抽出手段により、当該2つの特徴量の抽出元となる2つのデータを入力として抽出された他の2つの特徴量間の第3の類似度に基づき変換を施すことを特徴とする、請求項6に記載の情報処理装置の制御方法。
【請求項10】
前記類似度行列の少なくとも一部の前記要素を対象として選択する選択ステップを含み、
前記基準値は、前記選択ステップにおいて対象として選択された要素の平均値である
ことを特徴とする、請求項5に記載の情報処理装置の制御方法。
【請求項11】
前記類似度行列の少なくとも一部の前記要素を対象として選択する選択ステップを含み、
前記基準値は、前記選択ステップにおいて対象として選択された要素の平均値と、0または1と、の加重平均である
ことを特徴とする、請求項5に記載の情報処理装置の制御方法。
【請求項12】
前記類似度行列は、N個(Nは1以上の整数)のデータそれぞれから抽出された特徴量F1乃至FNを対象として、i番目(iは1以上の整数)の特徴量Fiと、j番目(jは1以上の整数)の特徴量Fjと、の類似度をi行j列の要素とする、N行N列の行列であることを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項13】
前記補正ステップは、前記補正後の類似度行列に対して、i行j列の値と、j行i列の値と、が等しくなるように対象化を施すことを特徴とする、請求項12に記載の情報処理装置の制御方法。
【請求項14】
前記補正ステップは、
i<jとした場合に、前記補正後の類似度行列に対して、
i行j列の値をj行i列の値に置き換えるか、または、
j行i列の値をi行j列の値に置き換えることで、
前記対象化を施す
ことを特徴とする、請求項13に記載の情報処理装置の制御方法。
【請求項15】
前記補正ステップは、前記補正後の類似度行列に対して、i行j列の値及びj行i列の値を、当該i行j列の値及び当該j行i列の値の平均値、最大値、及び最小値のいずれかで置き換えることで、前記対象化を施すことを特徴とする、請求項13に記載の情報処理装置の制御方法。
【請求項16】
前記分類ステップは、
前記類似度行列の行または列ごとの要素群ごとに、
第2の閾値を超える値の要素の数が第3の閾値以上の場合に、
当該要素のそれぞれについて、対応する類似度の算出元となる2つの特徴量が同一のグループに属するように、前記一連のデータを分類する
ことを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項17】
前記生成ステップは、事前に実施された複数のデータの分類結果のうち、共通のグループに含まれるデータそれぞれから抽出された特徴量間の分散が閾値以上のグループごとに、当該グループに含まれる特徴量の集合を、分類対象となる前記一連のデータとして前記類似度行列を生成し、
前記分類ステップにおける前記補正後の類似度行列に基づく前記一連のデータの分類結果に基づき、前記事前に実施された複数のデータの分類結果を更新する更新ステップを含む
ことを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項18】
事前に実施された複数のデータの分類結果のうち、外れ値または要素数が閾値以下のグループに含まれる特徴量の集合を選択する選択ステップをさらに有し、
前記分類ステップは前記選択された特徴量と同じグループに分類すべき特徴量を判断し、前記判断の結果をもとに、前記事前に実施された複数のデータの分類結果を更新し、かつ、前記分類結果の更新後におけるグループに含まれる要素が、前記事前に実施された複数のデータの分類結果に含まれる場合に、当該グループを破棄する
ことを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項19】
分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する生成手段と、
前記類似度行列の少なくとも一部の前記要素を対象として、当該要素に対応する前記類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する補正手段と、
前記補正手段による補正後の類似度行列に基づき、前記一連のデータを1以上のグループに分類する分類手段と、
を有することを特徴とする、情報処理装置。
【請求項20】
コンピュータを、
分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する生成手段と、
前記類似度行列の少なくとも一部の前記要素を対象として、当該要素に対応する前記類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する補正手段と、
前記補正手段による補正後の類似度行列に基づき、前記一連のデータを1以上のグループに分類する分類手段と、
を有することを特徴とする情報処理装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データの分類方法に関する。
【背景技術】
【0002】
AIを利用した認識技術の発展に伴い、音声認識、物体識別、顔認証、類似画像検索等のように、様々な分野において人間を超える性能を持つシステムが実用化されてきている。これらを支える技術として、ディープラーニングと称される機械学習の技術が挙げられる。ディープラーニングの性能(換言すると、構築されるAIの性能)を上げるためには、一般的には、正解ラベルの付与された大量の学習データが必要となる。例えば、顔認証技術においては、数千から数千万を超える画像データがAIの学習に用いられる。
ディープラーニングにより顔認証に利用されるAIの学習を行う場合には、多数の同一人物の画像ペア(画像とラベルとのペア)と他人の画像ペアとを与え、対象となる人物が本人か他人かを見分ける訓練が行われる。この学習方法では、教師値として同一人物に正しく同一のラベルが付与され(内的結合)、他人どうしには異なるラベルが付与されていること(外的分離)が重要である。なお、本開示では、内的結合と外的分離を合わせて学習データの「質」とも称する。大規模の画像データには教師値が付与されていないことも多く、このような状況下ではラベルを人手で付与することはコストが高いため、対象となる画像データに対してラベルを自動的に付与するような技術が適用される。非特許文献1には、対象となるデータに対してラベルを自動的に付与する技術が開示されている。これらの方法では、画像を特徴量に変換し、特徴量のペア間における類似度からなる類似度行列を作成したうえで、類似度ベースのクラスタリングを行うことでラベルが決定される。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Zheng Zhu et al., WebFace260M:A Benchmark Unveiling the Power of Million-Scale Deep Face Recognition, arXiv:2103.04098v1, 2021
【非特許文献2】Hubert, Min and max hierarchical clustering using asymmetric similarity measures, Psychometrika, 1973
【発明の概要】
【発明が解決しようとする課題】
【0004】
顔認証のためのAIの学習に利用される学習データセットには、IDの数が数千万以上とデータ数の規模としては比較的大きいが、一方で、1つのIDあたりデータ数については数個と比較的少ないといった傾向にあるものが多い。また、一連のデータの中には、兄弟等のような類似している他人のデータや、画質が悪く本人とわかりにくいデータ等が含まれ得る。このようなデータセットに対して従来の非教師型のクラスタリング手法を適用すると、質の悪い結果(例えば、認識精度が低い等)となりやすい。また、例え質の良い結果が得られるような手法が適用されたとしても、クラスタの数が少ない等のような、質と量のトレードオフが生じることも多い。
【0005】
本発明は上記の問題に鑑み、非教師型のデータ分類をより好適な態様で実現することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る情報処理装置の制御方法は、分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する生成ステップと、前記類似度行列の少なくとも一部の前記要素を対象として、当該要素に対応する前記類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する補正ステップと、前記補正ステップにおける補正後の類似度行列に基づき、前記一連のデータを1以上のグループに分類する分類ステップと、を含むことを特徴とする。
【発明の効果】
【0007】
本発明によれば、非教師型のデータ分類をより好適な態様で実現することが可能となる。
【図面の簡単な説明】
【0008】
【
図1】情報処理装置の機能構成の一例を示した図である。
【
図3】類似度行列の補正について概要を示した概念図である。
【
図4】類似度行列の補正に係る処理の一例を示した図である。
【
図5】情報処理装置の処理の一例を示した図である。
【
図6】クラスタリングについて概要を説明するための図である。
【
図7】情報処理装置の処理の一例を示した図である。
【
図8】類似度行列の補正について説明するための概念図である。
【
図9】情報処理装置の処理の一例を示した図である。
【
図10】情報処理装置の機能構成の一例を示した図である。
【
図11】クラスタリングの結果の一例を示した図である。
【
図12】情報処理装置の機能構成の一例を示した図である。
【
図13】クラスタリングの結果の一例を示した図である。
【
図14】情報処理装置の機能構成の一例を示した図である。
【
図15】情報処理装置の処理の一例を示した図である。
【
図16】変動類似度の算出方法の一例を示した図である。
【
図17】変動類似度の算出方法の一例を示した図である。
【
図18】変動類似度の算出方法の一例について説明するための図である。
【
図19】情報処理装置のハードウェア構成の一例を示した図である。
【発明を実施するための形態】
【0009】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、主に顔認証システム向けの学習用データセットの作成を例にとって説明するが、本発明はこれに限るものではなく、手書き文字認識システム向けでもよいし、他のいかなるシステム向けでもよい。また、目的も学習用データセットの作成には限定されず、自動アルバム編集のために画像を人物ごとに分類すること、などを目的としてもよい。
【0010】
<ハードウェア構成>
図19を参照して、本実施形態に係る情報処理装置のハードウェア構成の一例について説明する。
図19に示す情報処理装置900は、例えば、
図1を参照して後述する情報処理装置として適用され得る。
【0011】
情報処理装置900は、CPU(Central Processing Unit)904、RAM(Random Access Memory)905、及びROM(Read Only Memory)906を有する。また、情報処理装置900は、HDD(Hard Disk Drive)907、入力部901、表示部902、及びネットワークI/F部903を有する。入力部901、表示部902、ネットワークI/F部903、CPU904、RAM905、ROM906、及びHDD907のそれぞれは、データバス908を介して相互に情報を送受信可能に接続されている。
【0012】
CPU904は、ROM906に記憶された制御用コンピュータプログラムを読み出してRAM905に展開したうえで、当該制御用コンピュータプログラムを実行することで、各種制御を行う。RAM905は、ワークエリアやCPU904により実行されるプログラムを展開するための一時記憶領域として用いられる。
HDD907は、画像データや設定パラメータ、各種プログラム等を記憶するための記憶領域である。また、HDD907に替えて、またはHDD907とともに、SSD(Solid State Drive)に代表される不揮発性メモリ等のような他の補助記憶装置が利用されてもよい。
【0013】
ネットワークI/F部903は、情報処理装置900をインターネット等のようなネットワークに接続させるためのネットワークI/Fであり、当該ネットワークを介して他の装置と間で各種情報の送受信を行う。ネットワークI/F部903を介して外部装置から受信した画像データ等は、データバス908を介してCPU904、RAM905、及びHDD907との間で送受信される。
【0014】
CPU904がROM906やHDD907に格納された画像処理プログラムを実行することによって、画像データに対する画像処理が実現される。また、HDD907は、ネットワークI/F部903を介して外部装置からデータの入力が可能であるものとする。
【0015】
入力部901は、例えば、キーボード、マウス、タッチパネル等の入力デバイスにより実現される。表示部902は、例えば、液晶ディスプレイ等の表示装置により実現される。
【0016】
<第1の実施形態>
本開示の第1の実施形態として、非教師クラスタリングと称される一連のデータを1以上のグループに分類する仕組みの一例について説明する。なお、本実施形態では、便宜上、顔認証に用いられる学習データの分類がなされる場合に着目して種々の説明を行うものとする。顔認証に用いられる人物の顔の画像(以下、顔画像と称する)は、顔の向きの角度、兄弟等の類似する他人、加齢による変化、画像のボケといった諸条件により、必ずしも他人の画像間より本人の画像間の方が、類似度が高くなるとは限らない。そこで、本実施形態では、このような関連性のあるデータ間の類似度が不完全な状況下においても、クラスタ数(分類後の集合の数、グルーピングの数)の量を一定以上確保しながら、分類結果の質をより向上させるための仕組みの一例について説明する。
【0017】
図1を参照して、本実施形態に係る情報処理装置の機能構成の一例について説明する。本実施形態に係る情報処理装置は、入力部11と、算出部12と、補正部13と、分類部14と、出力部15とを含む。
入力部11は、分類対象となる一連のデータの入力を受け付け、当該一連のデータそれぞれの特徴量111(すなわち、データの特徴を定量的に表した情報)を取得する。
算出部12は、入力部11により取得された分類対象となる一連のデータそれぞれから抽出された特徴量111を対象として、一連のペアそれぞれの類似度を算出する。そのうえで、算出部12は、算出した一連の類似度を要素として含む類似度行列121を生成する。なお、類似度行例121については、
図2を参照して詳細を別途後述する。
補正部13は、算出部12により生成された類似度行列121に対して補正を施すことで補正類似度行列131を生成する。また、補正部13は、補正類似度行列131の生成に際して、補正が行われた要素のテーブル(以下、補正要素テーブル132とも称する)を出力する。
分類部14は、補正類似度行列131と補正要素テーブル132とに基づき、分類対象となる一連のデータのクラスタリング(すなわち、1以上のグループへの分類)を行い、クラスタリング結果141を出力する。
出力部15は、クラスタリング結果141を所定の出力先(例えば、後続の処理)に出力する。
【0018】
以下、
図1に示した本実施形態に係る情報処理装置の各構成要素についてより詳しく説明する。
入力部11は、入力されたデータ(すなわち、分類対象となるデータ)から特徴量を取得(抽出)する。具体的な一例として、顔認証システムに用いられるデータセットの作成が行われる際の、各データからの特徴量の抽出について以下に説明する。
データセットに含められる多数の顔画像の各々に対して特徴量抽出を適用することで、各顔画像に対応する特徴量が得られる。特徴量は、一般的には100~1000次元程度のベクトルで表される。また、特徴抽出器は、例えば、同一人物の顔画像からは互いに似た特徴、すなわち類似度がより高い値を示す特徴を抽出するように設計される。なお、類似度については、算出部12の詳細とあわせて説明する。このような特徴抽出器としては、FaceNetやArcFaceといったものが良く知られているが、他のものが用いられてもよい。
例えば、1人あたり平均10枚の顔画像が100万人分与えられた場合には、1000万の特徴量が得られることとなる。なお、以降では特に説明が無い限りは、特徴量111は、特徴量F
1~F
NのN個(Nは1以上の整数)の特徴量の集合を示すものとする。
入力部11は、上記N個の特徴量を特徴量111として取得する。
【0019】
算出部12は、特徴量111に含まれる一連の特徴量(すなわち、特徴量F
1~F
N)それぞれのペアの類似度を算出し、当該類似度を要素とする類似度行列121を生成する。
ここで、
図2を参照して、類似度行列121の一例についてより詳細に説明する。類似度行列121は、N×Nの行列であり、i行j列(i及びjのそれぞれは1以上の整数)の要素S
ijとして、特徴量F
iと特徴量F
jとの間の類似度が設定される。
一般的には、2つの特徴量が似ているか否かの指標として、類似度または距離が用いられる。類似度は、比較対象が似ているほどより高い値を示す。また、距離は、比較対象が似ているほどより低い値を示す。
特徴量が互いに似ているか否かの指標に何が用いられるのが最適かについては、例えば、適用される特徴抽出器によって定まり得る。具体的な一例として、ArcFaceの場合には、コサイン類似度と称される指標が用いられる。
なお、以降では便宜上、類似度として0~1の範囲の値をとるものとして説明を行うが、必ずしも類似度として取り得る値を限定するものではない。具体的な一例として、コサイン類似度の場合には、-1~1の範囲の値を取り得、負の値を0とすれば、結果として0~1の値をとることとなる。また、距離dから類似度sへの変換については、mを0<m<1の定数、nをn>0の定数とした場合に、例えば、以下に(式1)として示す関係式により実現され得る。
【0020】
【0021】
なお、本実施形態では、類似度行列が以下に(式2)及び(式3)として示す関係式を満たすものとして種々の説明を行うが、必ずしも本実施形態に係る類似度行列の特性を限定するものではない。
【0022】
【0023】
例えば、クラスタリング手法の一例であるAP法では、対角成分の値に特別な意味を持たせるため、(式2)として示す条件を満たさない。
また、非特許文献2には、(式3)として示す条件を満たさない非対称な類似度行列を用いたクラスタリング手法が開示されている。
上記に例示したいずれの手法においても、本開示に係る技術を適用することが可能である。
【0024】
補正部13は、類似度行列121に対して補正を施すことで補正類似度行列131を生成する。通常のクラスタリング手法では、類似度行列121をそのまま用いてクラスタリングが行われるのに対し、本実施形態では以下に
図3を参照して説明するように類似度行列121に対して補正が施される。
図3は、類似度行列の補正について概要を示した概念図である。
多くの場合には、特徴量は高次元ベクトルとして表現されるが、ここでは説明を簡単にするために、2次元上に各特徴量(特徴量31~39、310、311)がプロットされているものとする。なお、
図3(b)~
図3(d)については、図が煩雑になるため特徴量を示すマーカに対して附番を行っていないが、
図3(a)に示す例において同様の位置の特徴量に付された符号と、同様の特徴量が対応付けられているものとする。
【0025】
図3(a)は、11点の特徴量(特徴量31~39、310、311)が与えられた状態を模式的に示している。なお、
図3(a)~
図3(d)に示す例では、2つの特徴量それぞれの位置がより近いほど、当該2つの特徴量がより似ている、すなわち類似度がより高いことを示しており、2つの特徴量それぞれの位置が遠いほど類似度がより低いことを示している。以降の説明では、便宜上、特徴量間の距離が近いことを類似度が高いとも称し、特徴量間の距離が遠いことを類似度が低いとも称する。
図3に示す例では、上述した11点の特徴量に対してクラスタリングが行われる。ここでは、単純に各特徴量を周囲の特徴量と比較し、特徴量どうしの類似度が高いものをクラスタとしてまとめていく場合の一例について説明する。
【0026】
図3(a)を観察すると、直感的には
図3(d)に示すようにクラスタリングが行われると良いように見受けられる。具体的には、
図3(d)に示す例では、特徴量31~35で一つのクラスタ301、特徴量36~39及び310で一つのクラスタ302が形成され、特徴量311についてはどのクラスタにも属さない孤立特徴量となっている。
一方で、特徴量どうしの類似度の比較により、複数の特徴量を併合するか否かを閾値に基づき決定するような手法によりクラスタリングが行われると、
図3(b)や
図3(c)に例示するような結果となるような状況が想定され得る。特に
図3(c)のように一部の特徴量(例えば、特徴量34)が複数のクラスタに属すると判断された場合には、結果として当該複数のクラスタに属する一連の特徴量(すなわち、11点の特徴量)が一つのクラスタに属するように併合されることもある。
【0027】
図3(b)に示す例では、特徴量36~39及び310により一つのクラスタ302が形成されている一方で、特徴量31~35がいずれもクラスタを形成しておらず、
図3(d)に示す例に比べてクラスタの数(量)が少ない。
また、
図3(c)に示す例では、特徴量31~35により一つのクラスタ301が形成されている一方で、特徴量36~39及び310に加えてさらに特徴量34及び311を含むように一つのクラスタ303が形成されている。クラスタ303に着目すると、当該クラスタ303に含まれる特徴量34及び311は、他の特徴量36~39及び310とは離間しており、当該他の特徴量36~39及び310に対応する人物とは異なる他の人物に対応している可能性が高い。すなわち、
図3(c)に示す例では、必ずしも質の高いクラスタリングが行われたとは言えないこととなる。さらに、
図3(c)においてクラスタ301及び303が併合されて一つのクラスタが形成されると、質と量が顕著に低くなることとなる。
【0028】
以上を踏まえ、本実施形態では、
図3(d)に例示するような結果が得られるようなクラスタリング方法の一例について説明する。すなわち、本実施形態に係るクラスタリング方法を適用することで、
図3(b)に示す例に比べてより多くの数(量)のクラスタを得ることが可能となり、
図3(c)に示す例に比べてより質の高い(より類似度の純度が高い)クラスタを得ることが可能となる。
具体的には、補正部13は、
図3(d)に例示するようなクラスタリング結果を得られるように、類似度行列121に対して補正を施す。
【0029】
ここで、
図4を参照して、補正部13による類似度行列121の補正に係る処理の内容について説明する。
図4(a)及び
図4(b)は、特徴量41~44を対象として補正部13により補正が施される場合の一例を示している。具体的には、
図4(a)が補正前の状態を示しており、
図4(b)が補正後の状態を示している。
図4(a)及び
図4(b)において矢印は補正の内容、すなわち、どの特徴量を対象としてどのような補正が施されたかを模式的に示している。なお、補正部13による補正は類似度に対して行われ、実際には特徴量は移動しないこととなる。すなわち、
図4(a)及び
図4(b)に示す矢印は、補正部13による補正により、対象となる特徴量の類似度が、矢印の先に移動した特徴量の類似度に変換されることを表している。なお、以降では、説明を分かりやすくするために、類似度を補正することを、便宜上「特徴量が移動する」と記載する場合がある。
【0030】
図4(a)及び
図4(b)に示す例では、特徴量41を基準として、当該特徴量41と他の特徴量42~44のそれぞれとの類似度が以下に示すような状態となっているものとする。
・特徴量43は、他の特徴量42及び44に比べて特徴量41との類似度が高い
・特徴量44は、他の特徴量42及び43に比べて特徴量41との類似度が低い
・特徴量42は、特徴量41と43の類似度と、特徴量41と44の類似度の中間の類似度を持つ
これに対して、補正部13は、以下に示すように類似度を補正する。なお、カッコ内は補正後の類似度に相当する特徴量を示している。
・特徴量41と特徴量43の類似度をより高くする(特徴量431)
・特徴量41と特徴量44の類似度をより低くする(特徴量441)
・特徴量41と特徴量42の類似度は変えない (特徴量42)
すなわち、補正部13は、類似度が高い場合にはより高くなるように当該類似度を補正し、類似度が低い場合にはより低くなるように当該類似度を補正する。
【0031】
図4及び
図5を参照して、補正部13の処理についてより詳しく説明する。
S51において、補正部13は、
図1及び
図2を参照して説明した類似度行列121を取得する。そのうえで、補正部13は、類似度行列121の行ごとに、S52~S56の処理を繰り返し実行する。
繰り返し処理では、補正部13は、対象となる行を類似度行ベクトル511とし、この行ベクトルを対象として以下に説明する処理を実行する。
【0032】
図2からわかるように、i回目の繰り返しでは、類似度行ベクトル511は、類似度行列121のi行目が対象となる。これは、特徴量F
iと他の特徴量との類似度に相当し、j番目の要素の値は、特徴量F
iと特徴量F
jとの類似度となる。
クラスタリングにおいて、同じクラスタとなるのは、比較的高い類似度の要素(特徴量)であり、明らかに低い類似度については同じクラスタとなる可能性は極めて低い。
そこで、補正部13は、明らかに低い類似度の要素を補正の対象外とする。以降では、この対象外とするか否かの判定に適用される閾値(補正要素選択閾値)をth
1とする。
【0033】
類似度行ベクトル511の全要素の分布のヒストグラムを作成すると、ほとんどの要素は他人の顔画像との類似度となるため、0近辺に集中し、非常に高い山ができる。このような特性を鑑み、補正部13は、この0近辺に集中した要素を除いた他の要素を補正対象とする。これによりほとんどの要素が補正対象から除外されることとなり、結果として補正対象となる要素の数が非常に少なくなるため、補正に係る演算量を大幅に削減する効果が見込まれる。
【0034】
S52において、補正部13は、補正要素選択閾値(th1)を決定する。
補正要素選択閾値(th1)の決定には種々の方法を適用することが可能である。以下に補正要素選択閾値(th1)の決定方法の一例を挙げる。
(方法1)所定の値を補正要素選択閾値(th1)として適用する
(方法2)類似度行ベクトル511の要素の値のヒストグラムを作成し、二峰分布をなすと仮定して二峰の谷となる値を補正要素選択閾値(th1)として適用する
特に、0近辺の要素の集合がどの程度まで分布しているかが予めわかっている場合には、例えば、方法1を適用することで処理を簡便化する効果が見込まれる。顔認証システム向けの大規模データセット作成をはじめとして、多くの場合にはこの方法1を適用することが可能である。
一方で、小規模なデータセットを作成する場合等のように、予め分布を予測できない場合には、方法2として示すように、類似度行ベクトル511の要素の値で実際にヒストグラムを作成して、二峰分布をなすと仮定して二峰の谷となる値をとるとよい。なぜならば、すでに説明したように、ほとんどの要素(類似度)は0近辺に集中し、非常に大きな山を作るからである。この方法2では、二峰分布と仮定して、この大きな山を分離することとなる。方法2の具体例としては、判別分析法(大津の二値化)が挙げられる。当該判別分析法については公知のため詳細な説明は省略する。
なお、上記に例示した補正要素選択閾値(th1)の決定はあくまで一例であり、上記に例示した手法に限らず、補正要素選択閾値(th1)の決定に際して種々の手法を適用することが可能である。
【0035】
S53において、補正部13は、類似度行ベクトル511の各要素が、S52にて決定した補正要素選択閾値(th1)よりも大きい場合に、当該要素を補正要素として選択する。そのうえで、補正部13は、補正要素の値を対象としてベクトル化した補正要素ベクトル512と、補正要素を特定できる情報が含まれる補正要素リスト513とを出力する。
補正要素リスト513は、例えば、選択された補正要素が類似度行ベクトル511の何番目の要素であるかというインデックスのベクトルとして実現され得る。この場合には、補正要素ベクトル512の長さと補正要素リスト513(ベクトル)の長さとは等しくなる。また、類似度行ベクトル511のi番目の要素をs(i)、補正要素ベクトル512のj番目の要素をsmod(j)、補正要素リスト513のk番目の要素をsidx(k)とすると、以下に(式4)として示す関係式を満たすこととなる。
【0036】
【0037】
なお、以降では、上述したように補正要素リスト513がインデックスのベクトルとして実現されるものとして説明を行うが、補正要素を特定することが可能であれば、補正要素リスト513として適用される情報の種別は特に限定はされない。
【0038】
S54において、補正部13は、補正基準値(th
2)を決定する。例えば、
図4(a)に示す例の場合には、補正基準値(th
2)は、特徴量41と特徴量42との類似度に相当する。
【0039】
ここで、
図6を参照して、本実施形態におけるクラスタリングの基本的な考え方と、補正基準値(th
2)がどのように影響するかについて以下に説明する。
まず、
図6(a)を参照して、クラスタリングの基本的な考え方について説明する。
図6において小さな丸いマーカは個々の特徴量を示している。なお、
図6に示す例では、
図3に示す例と同様に説明をわかりやすくするために、各特徴量が2次元上にプロットされている。中心に位置するマーカに対応する特徴量61は、注目している特徴量に相当し、類似度行ベクトル511が類似度行列121のi行目の行ベクトルである場合に、特徴量F
iとして示される。なお、以降では説明を簡単にするために、注目している特徴量を特徴量F
iとしたうえで、当該特徴量F
iと他の特徴量F
jとの類似度を「特徴量F
jの類似度」とも称する。
【0040】
円形状の境界601は、特徴量61との類似度が補正要素選択閾値(th
1)である等類似度線である。この境界601よりも外側は、類似度が補正要素選択閾値(th
1)よりも小さい領域である。特徴量62については、この境界601よりも外側の領域に位置するため、
図5のS53の処理により、補正要素としての選択対象から除外されている。つまり、境界601よりも内側の領域に位置する特徴量が、類似度の補正の対象となる。
【0041】
円形状の境界602は、特徴量61との類似度がクラスタ境界類似度である等類似度線であり、この境界602よりも内側の領域にある特徴量が、注目している特徴量61と同じクラスタ(の候補)と判断される。
例えば、特徴量63は、境界602よりも内側の領域に位置するため、特徴量61と同じクラスタになると判断される。また、特徴量64については、境界602の外側の領域に位置するため、特徴量61と同じクラスタにはなるとは判断されない。
【0042】
図6(b)は、特徴量61との類似度が比較的高い特徴量が多い場合に、どのように補正がなされるかいついて一例を示した図である。
図6(b)では、破線で示した円形状の境界603が追加されている。この境界603は、特徴量61との類似度が補正基準値(th
2)である等類似度線である。
図6(b)に示す例では、境界603の外側に位置する特徴量については、より外側に向けた方向、つまり類似度がより小さくなる方向に移動するように補正がなされている。また、境界603の内側に位置する特徴量については、より内側に向けた方向、つまり類似度がより大きくなる方向に移動するように補正がなされている。
ここで、特徴量631及び632に注目する。特徴量631及び632それぞれの類似度は、クラスタ境界類似度よりわずかに大きい。また、特徴量631及び632のそれぞれは、補正前は境界602の内側に位置していたが、補正後は当該境界602の外側に移動している。この場合には、特徴量631及び632のそれぞれは、補正前は特徴量61と同じクラスタとの判断がなされる状態となっていたが、補正後は特徴量61と同じクラスタとの判断がなされない状態となっている。
【0043】
一方で、
図6(c)は、特徴量61との類似度が比較的高い特徴量が少ない場合に、どのように補正がなされるかについて一例を示した図である。
図6(c)においても、
図6(b)と同様に、破線で示した円形状の境界603が追加されている。
ここで、特徴量641~643に注目する。特徴量641~643それぞれの類似度は、クラスタ境界類似度よりわずかに小さい。また、特徴量641~643のそれぞれは、補正前は境界602の外側に位置していたが、補正後は当該境界602の内側に移動している。この場合には、特徴量641~643のそれぞれは、補正前は特徴量61と同じクラスタとの判断がなされない状態となっていたが、補正後は特徴量61と同じクラスタとの判断がなされる状態となっている。
【0044】
以上のような効果を言い換えると、以下のようになる。
(効果1)注目している特徴量(特徴量61)に対して類似度が比較的高い特徴量が多い場合(つまり
図6(b)に示すように類似度が比較的高い特徴量が高密度に分布している場合)には、クラスタ境界類似度(境界602)よりわずかに大きい類似度をもつ特徴量については、特徴量61と同じクラスタとする、との判断は行わない。その結果、クラスタの質を高める、という効果がある。
(効果2)注目している特徴量(特徴量61)に対して類似度が比較的高い特徴量が少ない場合(つまり
図6(c)に示すように類似度が比較的高い特徴量が低密度に分布している場合)には、クラスタ境界類似度(境界602)よりわずかに小さい類似度をもつ特徴量については、特徴量61と同じクラスタとする、との判断を行う。その結果、クラスタの数を増やす、という効果がある。
【0045】
このような効果をもたらすためには、境界603に対応する類似度、すなわち補正基準値(th2)を、類似度が比較的高い特徴量の多寡(密度)によって決定すればよい。
【0046】
補正基準値(th2)の具体的な定め方については、例えば以下に例示するような方法が挙げられる。なお、いずれの方法についても、対象とする特徴量の類似度は、補正要素選択閾値(th1)よりも高いものである。
(方法3)類似度の平均値
(方法4)類似度の平均値と0との加重平均
(方法5)類似度の平均値と1との加重平均
(方法6)類似度のRパーセンタイル(0<R<100)
これらの方法は、密度が高い場合には補正基準値(th2)として小さな値を、密度が低い場合には大きな値を決定する。
なお、上記に例示した方法はあくまで一例であり、補正基準値(th2)の定め方を限定するものではない。すなわち、上述したように、類似度が比較的高い特徴量の多寡(密度)によって決定させる方法であれば、補正基準値(th2)を定める方法として適用され得る。
【0047】
ここで、改めて
図5を参照する。
S55において、補正部13は、S54にて決定された補正基準値(th
2)を用いて、補正要素ベクトル512に対して補正を施し、補正後要素ベクトル514を算出する。
図4(c)に、S55の処理にて類似度の補正に適用される補正関数の一例を示す。
図4(c)に示すグラフは、横軸が補正前の類似度を示しており、縦軸が補正後の類似度を示している。なお、前述したように、
図4(c)に示す例では、補正前後の類似度の範囲を0以上1以下に限定している。
th
2は、S54の処理にて決定された補正基準値を示している。
図4(c)を参照するとわかるように、補正前類似度をs
in、補正関数をf
mod()とすると、補正後類似度s
out=f
mod(s
in)であり、以下に(式5)~(式7)として示すような性質を持つ。
【0048】
【0049】
(式5)~(式7)として示す関係式は、補正関数が単調増加関数(単調非減少関数)であり、補正前類似度が補正基準値より小さい領域では下に凸、大きい領域では上に凸であることを表している。
このような補正関数としては、例えば、p,qを定数として以下に(式8)~(式10)として示す関数が挙げられる。なお、以下に(式8)~(式10)として示す関数はあくまで一例であり、(式5)~(式7)として示した関係式を満たすものであれば特に限定はされない。
【0050】
【0051】
(式5)~(式7)として示した関係式を満たす補正関数が用いられると、
図4(a)に示す特徴量43の類似度は、補正基準値th
2より大きい(補正基準値th
2を超える)ため、さらに大きな類似度である特徴量431(
図4(b))に移動するように補正がなされる。
また、特徴量44の類似度は、補正基準値th
2より小さい(補正基準値th
2未満となる)ため、さらに小さな類似度である特徴量441に移動するように補正がなされる。
一方で、特徴量42の類似度については、補正基準値th
2と等しいため、補正後も類似度は変わらない。
【0052】
S56において、補正部13は、補正後要素ベクトル514を、類似度行ベクトル511に反映させて、補正後類似度行ベクトル515を生成する。
補正後要素ベクトル514は、類似度行ベクトル511に比べて、要素の数が少ない。そこで、補正部13は、出力をN×Nの補正類似度行列とするために、要素数Nの補正後類似度行ベクトル515を生成する。補正後類似度行ベクトル515は、類似度行ベクトル511のうち、補正要素リスト513で特定される要素を、補正後要素ベクトル514の対応する要素で置き換えることで生成することが可能である。
【0053】
ここで、
図7を参照して、
図5に示すS56の処理の詳細について説明する。
S56の処理では、補正部13は、最初にS561において、類似度行ベクトル511のコピーを作成する。つまり、補正部13は、
図5に示す類似度行ベクトル511をコピーして、補正後類似度行ベクトル515を作成する。この時点では、補正後類似度行ベクトル515は、類似度行ベクトル511の単なるコピーであるが、この後の処理で一部の要素を置き換えることにより、最終的な補正後類似度行ベクトル515となる。
【0054】
S562において、補正部13は、補正後要素ベクトル514及び補正要素リスト513を読み込む。前述した通り、補正要素リスト513は、類似度行ベクトル511(及び補正後類似度行ベクトル515)のインデックスを示している。具体的な一例として、3番目の要素が10であったとすると、補正要素リスト513は、「補正後類似度行ベクトル515の10番目の要素が、補正要素ベクトル512の3番目の要素である」ということを表すこととなる。
そこで、補正部13は、S563の処理を、補正要素リスト513の長さ分だけ繰り返して、補正後類似度行ベクトル515を更新していく。
具体的には、補正部13は、補正後要素ベクトル514の要素を先頭から取り出し、当該要素を補正要素701とする。同様に、補正部13は、補正要素リスト513の要素を先頭から取り出し、当該要素を補正要素インデックス702とする。そして、S563において、補正部13は、類似度置換処理として、補正後類似度行ベクトル515の、補正要素インデックス702番目の要素を、補正要素701で置換する処理を実行する。
補正部13は、S563の繰り返し処理を完了すると、補正後類似度行ベクトル515が更新された状態となるため、この更新された補正後類似度行ベクトル515をS564で出力する。
【0055】
図8に、類似度行ベクトル511、補正要素リスト513、補正後要素ベクトル514、及び補正後類似度行ベクトル515の関係の一例を示す。
図8に示す例では、便宜上、類似度行ベクトル511の長さを25、補正後要素ベクトル514及び補正要素リスト513の長さを5としている。補正後類似度行ベクトル515は、類似度行ベクトル511をコピーしたものがベースとなるため、長さは25となる。
補正要素リスト513は、最初の要素が3であるため、補正後要素ベクトル514の最初の要素が、補正後類似度行ベクトル515の3番目の値となる。同様に補正後要素ベクトル514の2、3、4、5番目の値は、補正後類似度行ベクトル515の5、10、17、21番目の値となる。なお、これ以外の補正後類似度行ベクトル515の要素の値については、対応する位置の類似度行ベクトル511の値となる。
以上により、補正後類似度行ベクトル515が得られる。
【0056】
ここで、改めて
図5を参照する。
補正部13は、補正後類似度行ベクトル515を繰り返し処理の分だけまとめることで、補正類似度行列131を生成する。なお、補正類似度行列131については、1行目が1回目の繰り返し処理にて生成された補正後類似度行ベクトル515となり、2行目が2回目の繰り返し処理で生成された補正後類似度行ベクトル515となる。同様にして、補正類似度行列131は、最終行がN回目の繰り返し処理で生成された補正後類似度行ベクトル515となる。
また、補正部13は、補正類似度行列のどの要素が補正対象になったかを記録するために、補正要素リスト513をまとめることで補正要素テーブル132を作成する。
【0057】
ここで、改めて
図1を参照する。
分類部14は、補正類似度行列131と補正要素テーブル132とに基づき、分類対象となる一連のデータのクラスタリング(すなわち、1以上のグループへの分類)を行い、その結果をクラスタリング結果141として出力する。
なお、分類部14による分類対象となる一連のデータのクラスタリングに適用される手法については、補正類似度行列131が用いられれば特に限定はされない。
【0058】
ここで、
図9を参照して、分類部14の処理の一例について、分類対象となる一連のデータのクラスタリングに係る処理に着目して説明する。
S141において、分類部14は、補正部13の出力である補正類似度行列131と補正要素テーブル132とを取得する(
図1参照)。そのうえで、分類部14は、補正類似度行列131の行ごとにS142~S145の処理を繰り返し実行する。
補正類似度行ベクトル921は、補正類似度行列131の行に対応するベクトル(換言すると、行に対応する要素群)である。具体的には、1回目の繰り返し処理では、補正類似度行列131の1行目が、当該繰り返し処理における補正類似度行ベクトル921として扱われる。また、2回目の繰り返し処理では、補正類似度行列131の2行目が、当該繰り返し処理における補正類似度行ベクトル921として扱われる。同様にして、最後の繰り返し処理(N回目の繰り返し処理)では、補正類似度行列131のN行目が、当該繰り返し処理における補正類似度行ベクトル921として扱われる。
補正要素リスト922は、補正類似度行ベクトル921に対応する行の補正要素のリストである。
補正類似度行ベクトル921のうち、補正要素リスト922で表される要素が、補正部13が補正対象とした要素である。S142において、分類部14は、これらの要素をまとめた補正要素ベクトル923を生成する。補正要素リスト922及び補正要素ベクトル923は、
図7に示す補正後要素ベクトル514及び補正要素リスト513と同様のものとなる。
【0059】
S143において、分類部14は、クラスタ候補に含まれる要素の抽出を行う。具体的には、分類部14は、補正要素ベクトル923の要素のうち、所与のクラスタ類似度閾値911(th3)以上の値を持つもののインデックスをクラスタ候補要素リスト924として出力する。例えば、補正要素ベクトル923の3番目の要素がクラスタ類似度閾値911(th3)以上の値であった場合には、補正要素リスト922の3番目の値がクラスタ候補要素リスト924に含まれる。
なお、クラスタ候補要素リスト924には、S142~S145の処理の繰り返しの回数もインデックスとして加えられる。例えば、5回目の繰り返し処理では、5番目の特徴量(F5)との類似度が補正類似度行ベクトル921に格納される。つまり、5番目の特徴量(F5)との補正類似度がクラスタ類似度閾値911(th3)以上のもののインデックスがクラスタ候補要素リスト924に含まれることとなる。なお、クラスタ候補要素リスト924には繰り返しの回数である「5」もインデックスに含まれるが、これは5番目の特徴量(F5)と自分自身(F5)とが、当然ではあるが、同じクラスタになるためである。
【0060】
クラスタ候補要素リスト924に含まれているインデックスの要素どうしは同一クラスタに含まれる可能性が高いと考えられるが、外れ値どうしが含まれている可能性もある。このような外れ値どうしのクラスタを生成するのを避けるため、S144において、分類部14は、クラスタ候補リスト924に含まれる要素数が、所与のクラスタ要素閾値912(th4)以上であるか否かを確認する。
【0061】
S145において、分類部14は、十分な要素数がない場合(つまり、要素数がクラスタ要素閾値912未満の場合)には、クラスタ候補要素リスト924は破棄して、次の繰り返し処理を実行する。一方で、分類部14は、十分な要素数がある場合(つまり、要素数がクラスタ要素閾値912以上の場合)には、クラスタ候補リスト924に含まれる要素が同一クラスタを構成するものとして、クラスタ候補要素リスト924を出力する。
【0062】
S146において、分類部14は、S145におけるクラスタ候補要素リスト924をまとめて、クラスタリング結果141を生成する。このクラスタ候補要素リスト924は、同一クラスタに分類される要素の部分集合を示している。そのため、一連のクラスタ候補要素リスト924をまとめることで、一連のクラスタそれぞれの要素を、クラスタリング結果141として得ることが可能となる。出力部15は、このクラスタリング結果141を所定の出力先(例えば、
図1では不図示の後続の処理)に出力する。
【0063】
以上、本開示の第1の実施形態として、非教師クラスタリングと称される一連のデータを1以上のグループに分類する仕組みの一例について説明した。
なお、本実施形態では、補正部13及び分類部14が、類似度行列121や補正類似度行列131を行単位に処理を実行する場合の一例について説明したが、例えば、列単位のように他の処理単位ごとに処理が実行されてもよい。
また、本実施形態では、補正部13が補正類似度行列131と補正要素テーブル132とを出力する場合の一例について説明したが、補正類似度行列131の要素が、0や類似度の範囲外の値(負の値や1を超える値)とされてもよい。このような制御が適用されることで、補正要素テーブル132の出力が不要となる。この場合には、分類部14は、要素の値を調べることで、補正要素か否かを判断すればよい。
また、補正部13が補正類似度行列131と補正要素テーブル132とを出力する例について説明したが、補正類似度行列131に替えて、
図5に示す補正後類似度行ベクトル515のリストが用いられてもよい。
以上のような仕組みにより、学習用データセットの作成において、データの量の減少を抑えつつ、データの質を向上させることが可能となる。
【0064】
<第2の実施形態>
本開示の第2の実施形態について以下に説明する。第1の実施形態では、(式3)として示したように、類似度行列121は対称行列であったが、補正類似度行列131については対称行列ではなかった。すなわち、補正類似度行列のi行j列目の要素をSmod(i,j)とすると、以下に(式11)として示す関係式を満たさないこととなる。
【0065】
【0066】
一方で、第1の実施形態では、分類部14が適用するクラスタリング手法は、非対称な補正類似度行列131を用いるものであったが、対称行列を前提とするクラスタリング手法を適用することも可能である。そこで、本実施形態では、対称行列を前提とするクラスタリング手法を適用する場合の一例について説明する。
【0067】
図10を参照して、本実施形態に係る情報処理装置の機能構成の一例について説明する。本実施形態では、
図1に示す補正部13に相当する部分の構成を、
図10に示す構成に置き換える。
具体的には、本実施形態では、補正部13の後段に対象化部1301が設けられており、この補正部13及び対象化部1301により補正部1300をなしている。すなわち、本実施形態では、
図1に例示した機能構成において、補正部13を、
図10に示す補正部1300に置き換えることとなる。補正部13の動作については第1の実施形態と同様である。なお、本実施形態では、便宜上、補正部13の出力を、補正要素テーブル1320及び対称化前補正類似度行列1310とも称する。
【0068】
対象化部1301は、入力として非対象行列である対称化前補正類似度行列1310を受け付け、当該対称化前補正類似度行列1310に対して対象行列化を施し、その結果を対称化後補正類似度行列1311として出力する。
非対象行列を対象行列にする方法については、種々の方法を適用することが可能である。対称化前補正類似度行列1310及び対称化後補正類似度行列1311のi行j列の値を、それぞれSbefore(i,j)及びSafter(i,j)とすると、例えば以下に例示するような方法を適用することが可能である。
【0069】
【0070】
方法7は、対称化前補正類似度行列1310の転置行列の上三角行列により、対称化前補正類似度行列1310の上三角行列を置き換えたものを、対称化後補正類似度行列1311とする方法である。
方法8は、対称化前補正類似度行列1310の転置行列の下三角行列により、対称化前補正類似度行列1310の下三角行列を置き換えたものを、対称化後補正類似度行列1311とする方法である。
方法9は、対称化前補正類似度行列1310と、その転置行列との、要素ごとの平均をとったものを、対称化後補正類似度行列1311とする方法である。
方法10は、対称化前補正類似度行列1310と、その転置行列との、要素ごとの最大値を、対称化後補正類似度行列1311とする方法である。
方法11は、対称化前補正類似度行列1310と、その転置行列との、要素ごとの最小値を、対称化後補正類似度行列1311とする方法である。
【0071】
補正部1300は、対称化後補正類似度行列1311を補正類似度行列131とし、補正要素テーブル1320を補正要素テーブル132として、後続の分類部14(
図1参照)に出力する。
【0072】
以上のように、
図1に示す補正部13を、
図10に示す対象化部1301を含む補正部1300に置き換えることで、分類部14において対称行列を前提とするクラスタリング手法を適用することが可能となる。
また、補正類似度行列131については、i行j列の値をS
mod(i,j)とすると、S
mod(i,j)=S
mod(j,i)となることから、メモリ使用量を半分程度に抑えることが可能となる。そのため、本実施形態に係る技術を適用することで、メモリの実使用量を大幅に削減する効果が期待できる。
【0073】
<第3の実施形態>
本開示の第3の実施形態について以下に説明する。種々の分類方法(クラスタリング手法)において、データの分類結果に、内的結合が達成されない質の悪いクラスタが含まれる可能性がある。具体的な一例として、人物の顔画像の分類が行われる状況下において、一連の顔画像の分類結果に、他人の顔画像が含まれた質の悪いクラスタが含まれる場合がある。このような質の悪いクラスタは、他のクラスタに比べて、特徴量どうしの類似度の分散が大きいことが少なくない。このような状況の一例を
図11に示す。
図11では、
図3に示す例と同様に、説明を簡単にするために、2次元上に各特徴量がプロットされている。なお、
図11に示す例では、クラスタ204、2041、及び2042に含まれる特徴量に対して、他の特徴量と区別するためにハッチングを施している。
【0074】
図11(a)では、クラスタ201~204の4つのクラスタができており、クラスタ204については他の3つのクラスタに比べて広い範囲に分布している。このように広い範囲に分布しているクラスタは、内的結合が達成されない質の悪いクラスタである可能性が高い傾向にある。そこで、本実施形態に係る情報処理装置は、クラスタ204に注目して、当該クラスタ204に含まれる8つの特徴量を対象として、第1の実施形態及び第2の実施形態として説明した手法により、再度のクラスタリングを行う。
図11(b)は、再度のクラスタリングの結果の一例を示している。
図11(b)に示す例では、クラスタ204が、クラスタ2041及び2042の2つのクラスタに分けられている。
【0075】
ここで、
図12を参照して、本実施形態に係る情報処理装置の機能構成の一例について説明する。本実施形態に係る情報処理装置は、予備入力部101と、予備分類部102と、第一の選択部103と、第一の再分類部104と、第一の更新部105と、予備出力部106とを含む。なお、クラスタリング結果1021については、複数の構成要素からアクセスされるため、破線によりデータの流れの方向を示している。
【0076】
予備入力部101は、分類対象となる予備特徴量1011を取得する。予備入力部101は、
図1に示す例における入力部11に相当する。
予備分類部102は、予備入力部101により取得された予備特徴量1011を対象としてクラスタリングを行い、その結果をクラスタリング結果1021として出力する。なお、予備分類部102が予備特徴量1011のクラスタリングに適用する手法については特に限定はされない。具体的な一例として、第1の実施形態や第2の実施形態として説明した手法が適用されてもよいし、既存のクラスタリング手法が適用されてもよい。また、クラスタリング結果1021が、事前に実施された複数のデータの分類結果の一例に相当する。
【0077】
第一の選択部103は、クラスタリング結果1021のうち、特徴量どうしの類似度の分散が所定の値以上のクラスタ群を選択する。特徴量どうしの類似度については、多くのクラスタリング手法で用いられているものであり、予備分類部102において追加の出力として持たせれば、それをそのまま利用することが可能である。クラスタ群の選択に係る類似度の分散の評価に使用される所定の値の求め方については、例えば、全クラスタの類似度の分散を求めてヒストグラムを作成し、二峰分布をなすと仮定して二峰の谷となる値とする方法が適用されてもよい。また、既知のデータ集合に対して算出されたこの値がそのまま用いられてもよい。
なお、予備分類部102にて類似度が使用されていない場合や、類似度が追加の出力とされていない場合には、第一の選択部103が特徴量どうしの類似度の算出を行えばよい。特徴量どうしの類似度の算出方法については、例えば、第1の実施形態で説明した方法が適用可能である。
【0078】
第一の選択部103は、選択したクラスタ群を、クラスタごとに構成する特徴量の集合とし、それらをリストとしてまとめて第一の部分特徴量リスト1031に出力する。具体的な一例として、10個のクラスタが選択されたとすれば、10個の特徴量の集合がリスト化されることとなる。
さらに、第一の選択部103は、第一の部分特徴量リスト1031に含まれる各々の特徴量を、クラスタリング結果1021から取り除く。なお、第一の選択部103は、特徴量が削除された結果として、特徴量の数が0となったクラスタについては、クラスタ自体も削除する。
【0079】
次いで、第一の再分類部104及び第一の更新部105が、第一の部分特徴量リスト1031の各々の特徴量集合に対して処理を実行する。
第一の再分類部104は、第一の部分特徴量リスト1031の各々の特徴量集合をクラスタリングする。この第一の再分類部104による第一の部分特徴量リスト1031の各々の特徴量集合のクラスタリングには、例えば、第1の実施形態及び第2の実施形態として説明した手法が適用され得る。また、第1の実施形態及び第2の実施形態として説明した手法のみに限らず、本実施形態に係る手法が再帰的に適用されてもよく、本開示に係る種々の形態の分類方法を適用することが可能である。
第一の再分類部104は、第一の部分特徴量リスト1031の各々の特徴量集合のクラスタリングの結果を、第一の部分クラスタリング結果1041として出力する。
第一の更新部105は、第一の部分クラスタリング結果1041をクラスタリング結果1021に反映する。具体的な一例として、第一の更新部105は、第一の部分クラスタリング結果1041をクラスタリング結果1021に追加する。以上により、クラスタリング結果1021が更新される。
上記した第一の再分類部104及び第一の更新部105の処理が、第一の部分特徴量リスト1031に含まれる一連の特徴量集合に対して繰り返し適用される。以上のような処理が実行されることで、クラスタリング結果1021には、最終的なクラスタリング結果が収められることとなる。
【0080】
予備出力部106は、上述した一連の処理が反映されたクラスタリング結果1021を、所定の出力先(例えば、不図示の後続処理)に出力する。
【0081】
以上のような仕組みにより、任意のクラスタリング結果を元に、質の悪いクラスタを対象として再分類を行うことが可能となる。
このようにクラスタリングの対象が絞られることで、実施済のクラスタリング結果に対して、量と質が確保できているクラスタには影響を与えることなく、質の悪いクラスタを減少させ、質の良いクラスタの拡充を図ること(質の向上及び量の確保)が可能となる。
【0082】
<第4の実施形態>
本開示の第4の実施形態について以下に説明する。第3の実施形態では、任意のクラスタリング結果に含まれる質の悪いクラスタを対象として再分類を行う方法の一例について説明した。本実施形態では、任意のクラスタリング結果に含まれる、孤立要素、または十分な数の要素を含まないクラスタ(例えば、要素の数が閾値未満のクラスタ)を対象として、再分類を行う方法の一例について説明する。
なお、孤立要素とは、クラスタリングの結果、どのクラスタにも属さないと判定された要素(特徴量)を示すものとする。クラスタリング手法によってはすべての要素をいずれかのクラスタに含める場合もあり、その場合には要素の数が1あるいは少数のクラスタ(数が閾値未満のクラスタ)が該当し得る。
【0083】
種々の分類方法(クラスタリング手法)において、データの分類結果には、孤立要素、または十分な数の要素を含まないクラスタが含まれる可能性がある。十分な数の要素を含まないクラスタは、外れ値どうしがたまたま偽クラスタを形成したものであることも多く、孤立要素とともに、信頼のおけない要素として、最終的なクラスタリング結果からは排除されることが望ましい場合がある。このような状況を鑑み、本実施形態に係る情報処理装置は、孤立要素、及び十分な数の要素を含まないクラスタに注目して再度のクラスタリングを行う。
【0084】
図13を参照して、本実施形態に係る情報処理装置によるクラスタリングが適用されることにより奏され得る効果について説明するための、特徴量とクラスタとの関係の一例について説明する。
図13では、
図3に示す例と同様に、説明を簡単にするために、2次元上に各特徴量がプロットされている。また、
図13に示す例では、一部の特徴量に対して、他の特徴量と区別するためにハッチングを施している。
【0085】
図13(a)に示す例では、クラスタ211~216として示す6つのクラスタができており、このうちのクラスタ214~216については、クラスタに含まれる要素の数が3未満となっており、十分な数の要素が含まれていない。なお、ここでは要素の数が十分か否かの判定に係る閾値を「3」としているが、あくまで一例であり、実応用においては、想定されるユースケースに応じて適宜好適な値が設定されることが望ましい。
図13(a)に示す例において、クラスタ214~216に含まれるハッチングが施された4つの特徴量は、最終的なクラスタの数(ID数)には貢献しないものとなる。
【0086】
図13(b)に示す例は、
図13(a)に示す例に対する再クラスタリングの結果の一例を示している。
図13(b)に示す例では、ハッチングが施された4つの特徴量に注目して、クラスタ214及び2151の2つのクラスタが生成されている。クラスタ214は、要素数が3未満であるため、最終的なクラスタ数(ID数)には貢献しないものとなる。一方で、クラスタ2151については、要素数が3以上となるため、最終的なクラスタリング結果に組み入れられることとなる。
【0087】
また、
図13(c)に示す例は、
図13(b)に示す例とは異なる再クラスタリングの結果の一例を示している。
図13(c)に示す例では、ハッチングが施された4つの特徴量に注目して、クラスタ214及び2152の2つのクラスタが生成されている。クラスタ214は、要素数が3未満であるため、最終的なクラスタ数(ID数)には貢献しないものとなる。一方で、クラスタ2152については、要素数が3以上となっている。しかしながら、クラスタ2152には、既に実行されているクラスタリングの結果として規定されたクラスタ213に含まれる要素2131が、含まれている。このような場合には、クラスタ2152が質の悪いクラスタと判断され、最終的なクラスタリングの結果には含まれないこととなる。
【0088】
なお、クラスタ2152が有効なクラスタとされるのであれば、当該クラスタ2152とクラスタ213とがマージされ、6つの要素を含むクラスタ2130が規定されることとなる。一方で、クラスタ2130に含まれる一連の要素のうち、クラスタ213には含まれない3つの要素については、クラスタ213が表す人物とは別人(例えば、似ている他人)である可能性が高い。すなわち、クラスタ2130は、内的結合を達成していない質の悪いクラスタである可能性が高いこととなる。そのため、このような場合には、クラスタ2152が無効なクラスタと判断され、最終的なクラスタリングの結果には含まれないこととなる。
すなわち、
図13(c)に示す例の場合には、結果として
図13(a)に示す例と比べて、クラスタリング結果に変化が生じないこととなる。
【0089】
ここで、
図14を参照して、本実施形態に係る情報処理装置の機能構成の一例について説明する。なお、本実施形態に係る情報処理装置は、第一の選択部103、第一の再分類部104、及び第一の更新部105に替えて、第二の選択部107と、第二の再分類部108と、第二の更新部109を含む点で、
図12に示す例と異なる。そこで、以降では、主に
図12に示す例と異なる部分に着目して説明を行うものとする。
【0090】
第二の選択部107は、クラスタリング結果1021のうち、孤立要素や十分な数の要素を含まないクラスタを構成する要素を抽出して、第二の部分特徴量集合1071を出力する。また、第二の選択部107は、第二の部分特徴量集合1071に含まれる各々の特徴量を、クラスタリング結果1021から取り除く。なお、第二の選択部107は、特徴量が削除された結果として、特徴量の数が0となったクラスタについては、クラスタ自体も削除する。
【0091】
第二の再分類部108は、第二の部分特徴量集合1071に含まれる特徴量に注目して、一連の特徴量(クラスタリング結果1021及び第二の部分特徴量集合1071に含まれる特徴量)のクラスタリングを行う。具体的には、第二の再分類部108は、
図9に示すS142~S145の繰り返し処理を、補正類似度行列131のすべての行に対して行うのではなく、第二の部分特徴量集合1071に含まれる特徴量に対応した行に対してのみ行う。
例えば、N個の特徴量F
1~F
Nから補正類似度行列131が作成され、第二の部分特徴量集合1071には3つの特徴量F
i、F
j、及びF
kが含まれているものとする。この場合には、補正類似度行列131のi行目、j行目、k行目の3行を順に補正類似度行ベクトル921として、
図9に示すS142~S145の繰り返し処理が行われればよい。
そして、第二の再分類部108は、第二の部分クラスタリング結果1081を出力する。
【0092】
第二の更新部109は、第二の部分クラスタリング結果1081を、クラスタリング結果1021に反映させる。
ここで、
図15を参照して第二の更新部109の処理の一例について説明する。
S1091において、第二の更新部109は、第二の部分クラスタリング結果1081を取得する。
そして、第二の更新部109は、取得した第二の部分クラスタリング結果1081に含まれる一連のクラスタそれぞれ(クラスタ候補10811)を対象として、S10911及びS10912の処理を実行する。
具体的には、S10911において、第二の更新部109は、クラスタ候補10811を構成するいずれかの要素がクラスタリング結果1021に含まれているか否かを確認する。
第二の更新部109は、クラスタ候補10811を構成するいずれかの要素がクラスタリング結果1021に含まれている場合には、当該クラスタ候補10811を対象とした処理を中断し、次のクラスタ候補10811を対象とした処理を開始する。
一方で、第二の更新部109は、クラスタ候補10811を構成するいずれかの要素もクラスタリング結果1021に含まれていない場合には、当該クラスタ候補10811をクラスタリング結果1021に追加する。
以上のようにして、第二の更新部109は、一連のクラスタ候補10811それぞれを対象とした処理を完了させる。この一連の処理の結果として、クラスタリング結果1021には、最終的なクラスタリング結果が収められることとなる。
【0093】
そして、予備出力部106は、クラスタリング結果1021を所定の出力先(例えば、不図示の後段処理)に出力する。予備出力部106については、
図12に示す予備出力部106と実質的に同様である。
【0094】
以上のような制御が適用されることで、任意のクラスタリング結果を元に、孤立特徴量、または十分な数の特徴量を含まないクラスタを対象として再分類を行うことが可能となる。
このようにクラスタリングの対象が絞られることで、実施済のクラスタリング結果に対して、量と質が確保できているクラスタには影響を与えることなく、質の悪いクラスタを減少させ、質の良いクラスタの拡充を図ること(質の向上及び量の確保)が可能となる。
【0095】
<第5の実施形態>
本開示の第5の実施形態について以下に説明する。第1の実施形態では、補正部13が類似度を補正するための補正関数fmod()として、1入力の補正関数が適用される場合の一例について説明した。これは特徴量Fiと特徴量Fjの類似度Sijを補正するものであるが、類似度の比較対象となる特徴量を同じクラスタとするか否か(例えば、同一人物か否か)の判断に際して、一つの類似度Sijを根拠としていることを意味する。類似度算出のもとは特徴量であるが、多様な見え方の他人の画像から算出した特徴量どうしで、常に低い類似度が得られるとは限らず、比較的高い類似度が得られる他人どうしの画像ペアが存在し得る。
【0096】
このような状況を鑑み、本実施形態に係る情報処理装置は、高い特徴量を示す特徴量どうしが本人どうしのものであるか否かを、類似度Sijとは異なる類似度も用いて精査する。換言すると、本実施形態に係る情報処理装置は、高い特徴量を示す特徴量どうしの類似度Sijに対して、当該類似度Sijとは異なる類似度も用いて変換を施す。具体的には、情報処理装置は、特徴量Fjの算出元となる顔画像Djに対して変動を与えた変動画像D’jを生成し、変動画像D’jに対して特徴抽出器を通して得られた特徴量、すなわち変動特徴量F’jも用いて類似度の補正を行う。変動画像D’jは、顔画像Djと同じ人物の顔画像であるため、特徴量Fjと特徴量Fiが同じクラスタ(本人)であるならば、変動特徴量F’jも特徴量Fiと同じクラスタになることが予想される。
【0097】
ここで、
図16を参照して、変動特徴量F’
jを用いて算出する変動類似度の算出方法の一例について説明する。
図16に示す例では、顔画像1001(D
j)から、特徴抽出器191によって特徴量1101(F
j)が算出される。同様に、基準となる不図示の顔画像から特徴量1100(F
i)が算出される。そのうえで、類似度算出器192によって特徴量1100(F
i)と特徴量1101(F
j)の類似度1201(S
ij)が算出される。なお、類似度算出器192は、
図1に示す例における算出部12のうち特に類似度算出に係る部分に相当する。以上が、前述した実施形態で使用された類似度(本実施形態では、類似度1201(S
ij)と称する)の算出方法の一例である。
【0098】
次いで、変動類似度1202(S’ij)の算出方法について説明する。当該算出方法では、まず顔画像1001(Dj)から変動顔画像1002(D’j)が生成される。そして、類似度1201(Sij)の算出と同様に、変動特徴量1102(F’j)が算出され、さらに特徴量1100(Fj)と変動特徴量1102(F’j)との類似度1202(S’ij)が算出される。
【0099】
なお、顔画像1001(Dj)から変動顔画像1002(D’j)を生成する方法について、データ拡張(DA:Data Augmentation)と称される一般的な手法が適用可能であるため詳細な説明は省略する。画像に対して適用されるDAの手法のうち一般的に用いられるものとしては、以下に例示する手法が挙げられる。なお、下記の手法はあくまで一例であり、顔画像1001(Dj)から変動顔画像1002(D’j)を生成する方法を限定するものではない。
・色合いを変える(たとえば、赤味を加える)
・ぼかす、または高精細にする
・回転を加える
・ノイズを加える
・画像の一部を特定の色で塗り潰す
・(顔画像の場合)眼鏡やサングラスをかける
・(顔画像の場合)マスクをする
【0100】
本実施形態において、補正関数fmod(Sin,S’in)は、類似度Sin及び変動類似度S’inの2つのパラメータを入力とする。以下に(式12)及び(式13)として、本実施形態に係る補正関数fmod(Sin,S’in)の一例を示す。なお、入力パラメータが1つの補正関数fmod(Sin)については、第1実施形態において(式8)~(式10)として例示した補正関数が適用され得る。また、下記においてavarage()は、引数で渡された一連の値の平均をとる関数を示すものとする。
【0101】
【0102】
なお、上記に示す例では、式12に示すように、Sin<th2の場合に変動類似度S’inが用いてられていないが、式13と同様に類似度Sin及び変動類似度S’inの双方が用いられてもよい。
また、上記に示す例では、Sin≧th2の場合に類似度Sin以外の類似度(すなわち変動類似度S’in)も用いたが、所与の値th4を用いてSin≧th4のときとしてもよい。Sinが大きい場合に、Sin以外の類似度も用いることが重要である。
また、式13では類似度Sin及び変動類似度S’inの平均が適用されているが、当該平均に替えて最大値や最小値が適用されてもよく、他の条件式が適用されてもよい。
また、上記に示す例では、類似度Sin及び変動類似度S’inの2つの値が用いられる場合の一例について示したが、さらに多くの変動顔画像から算出された変動類似度が用いられてもよい。
【0103】
また、特徴量及び変動特徴量の抽出に際して、複数の特徴抽出器が適用されてもよい。例えば、
図17は、変動類似度の算出方法の他の一例について示した図である。
図17に示す例では、特徴抽出器191に加えて、当該特徴抽出器191とは特徴量の抽出に係る特性が異なる他の特徴抽出器1911が設けられている。
【0104】
具体的には、顔画像1001(D
j)から、特徴抽出器191によって特徴量1101(F
j)が算出される。同様に、基準となる顔画像1000(D
i)から、特徴抽出器191によって特徴量1100(F
i)が算出される。そのうえで、類似度算出器192によって特徴量1100(F
i)と特徴量1101(F
j)の類似度1201(S
ij)が算出される。
また、
図17に示す例では、類似度1201(S
ij)の算出元となる特徴量1100(F
i)及び特徴量1101(F
j)を抽出する特徴抽出器191とは異なる特徴抽出器1911が設けられている。この特徴抽出器1911に対して、特徴抽出器191と共通のデータ、すなわち特徴量1101(F
j)及び特徴量1100(F
i)の抽出元となる顔画像1001(D
j)及び顔画像1000(D
i)が入力される。具体的には、顔画像1001(D
j)から、特徴抽出器1911によって他の特徴量1111(F
оj)が算出される。同様に、顔画像1000(D
i)から、特徴抽出器1911によって他の特徴量1110(F
оi)が算出される。そのうえで、他の類似度算出器1921によって他の特徴量1110(F
оi)と他の特徴量1111(F
оj)の類似度である他の類似度1203(S
оij)が算出される。
このとき、顔画像1001(D
j)及び顔画像1000(D
i)が同一人物の顔画像である場合には、特徴抽出器191及び特徴抽出器1911のいずれが適用されたとしても、高い確率で類似度がより高い値を示すこととなる。そのため、このような場合においても、
図16を参照して説明した変動類似度と同様に扱うことが可能となる。
【0105】
また、他の一例として、顔画像1001(D
j)や顔画像1000(D
i)から算出される画像の特徴(例えば、画像の明暗、ノイズの多寡等)に応じて、適用される補正関数f
mod()自体が制御(例えば、変更)されてもよい。例えば、
図18は、補正関数の制御に伴う補正前後における類似度の関係の一例を示した図である。
図18に示す例では、画像がより暗く、よりノイズが多いほど、補正前後の類似度の関係が矢印で示す方向に変化するように補正関数の制御がなされている。
【0106】
以上説明したように、類似度に加えて変動類似度が1つまたは複数用いられることで、分類対象となる一連のデータのクラスタリングに際して、同一のクラスタに属するか否かの判定に係るロバスト性を向上させる効果が期待できる。そのため、例えば他人が本人と判断されるといったような、内的結合が達成されない質の悪いクラスタが形成されづらくなるという効果が期待できる。
【0107】
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、上述した本開示の一実施形態に係る技術の基本的な技術思想を逸脱しない範囲であれば種々の変更がなされてもよい。具体的な一例として、上述した各実施形態では、主に顔認証に適用される顔画像を対象としてクラスタリングが行われる場合の一例について説明したが、クラスタリングの対象となるデータの種別は特に限定はされない。すなわち、非教師型のデータ分類の適用対象となり得るデータであれば、本開示に係る技術に基づくクラスタリングに対しても同様に適用することが可能である。
【0108】
また、本実施形態の開示は、以下の方法、構成、及びプログラムを含む。
(方法1)情報処理装置の制御方法であって、分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する生成ステップと、前記類似度行列の少なくとも一部の前記要素を対象として、当該要素に対応する前記類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する補正ステップと、前記補正ステップにおける補正後の類似度行列に基づき、前記一連のデータを1以上のグループに分類する分類ステップと、を含むことを特徴とする、情報処理装置の制御方法。
(方法2)前記補正ステップは、前記類似度行列の一連の前記要素それぞれに対応する前記類似度のうち、第1の閾値を超える類似度を対象として、当該類似度に応じた変換を施すことで、当該類似度行列を補正することを特徴とする、方法1に記載の情報処理装置の制御方法。
(方法3)前記第1の閾値は、あらかじめ指定された定数値であることを特徴とする、方法2に記載の情報処理装置の制御方法。
(方法4)前記第1の閾値は、前記類似度行列の行または列ごとに作成されたヒストグラムを対象として、当該ヒストグラムが二峰分布をなすと仮定した場合の二峰の谷となる値であることを特徴とする、方法2に記載の情報処理装置の制御方法。
(方法5)前記補正ステップは、基準値を超える類似度と、当該基準値未満の類似度と、に対して互いに異なる変換を施すことを特徴とする、方法1乃至4のいずれか1項に記載の情報処理装置の制御方法。
(方法6)前記補正ステップは、単調増加関数により、前記基準値を超える類似度を、変換前よりも値の大きい類似度に変換し、前記基準値未満の類似度を、変換前よりも値の小さい類似度に変換することを特徴とする、方法5に記載の情報処理装置の制御方法。
(方法7)前記補正ステップは、前記基準値を超える第1の類似度に対して、当該第1の類似度の算出元となる2つの特徴量のうちの一方に対して変動を与えた場合における、当該2つの特徴量の第2の類似度に基づき変換を施すことを特徴とする、方法6に記載の情報処理装置の制御方法。
(方法8)前記補正ステップは、第1の類似度及び第2の類似度の平均、最大値、及び最小値のうちのいずれかを変換後の類似度として適用することを特徴とする、方法7に記載の情報処理装置の制御方法。
(方法9)前記補正ステップは、前記基準値を超える第1の類似度に対して、当該第1の類似度の算出元となる2つの特徴量を抽出した第1の抽出手段とは異なる第2の抽出手段により、当該2つの特徴量の抽出元となる2つのデータを入力として抽出された他の2つの特徴量間の第3の類似度に基づき変換を施すことを特徴とする、方法6乃至8のいずれか1項に記載の情報処理装置の制御方法。
(方法10)前記類似度行列の少なくとも一部の前記要素を対象として選択する選択ステップを含み、前記基準値は、前記選択ステップにおいて対象として選択された要素の平均値であることを特徴とする、方法5乃至9のいずれか1項に記載の情報処理装置の制御方法。
(方法11)前記類似度行列の少なくとも一部の前記要素を対象として選択する選択ステップを含み、前記基準値は、前記選択ステップにおいて対象として選択された要素の平均値と、0または1と、の加重平均であることを特徴とする、方法5乃至9のいずれか1項に記載の情報処理装置の制御方法。
(方法12)前記類似度行列は、N個(Nは1以上の整数)のデータそれぞれから抽出された特徴量F1乃至FNを対象として、i番目(iは1以上の整数)の特徴量Fiと、j番目(jは1以上の整数)の特徴量Fjと、の類似度をi行j列の要素とする、N行N列の行列であることを特徴とする、方法1乃至11のいずれか1項に記載の情報処理装置の制御方法。
(方法13)前記補正ステップは、前記補正後の類似度行列に対して、i行j列の値と、j行i列の値と、が等しくなるように対象化を施すことを特徴とする、方法12に記載の情報処理装置の制御方法。
(方法14)前記補正ステップは、i<jとした場合に、前記補正後の類似度行列に対して、i行j列の値をj行i列の値に置き換えるか、または、j行i列の値をi行j列の値に置き換えることで、前記対象化を施すことを特徴とする、方法13に記載の情報処理装置の制御方法。
(方法15)前記補正ステップは、前記補正後の類似度行列に対して、i行j列の値及びj行i列の値を、当該i行j列の値及び当該j行i列の値の平均値、最大値、及び最小値のいずれかで置き換えることで、前記対象化を施すことを特徴とする、方法13に記載の情報処理装置の制御方法。
(方法16)前記分類ステップは、前記類似度行列の行または列ごとの要素群ごとに、第2の閾値を超える値の要素の数が第3の閾値以上の場合に、当該要素のそれぞれについて、対応する類似度の算出元となる2つの特徴量が同一のグループに属するように、前記一連のデータを分類することを特徴とする、方法1乃至15のいずれか1項に記載の情報処理装置の制御方法。
(方法17)前記生成ステップは、事前に実施された複数のデータの分類結果のうち、共通のグループに含まれるデータそれぞれから抽出された特徴量間の分散が閾値以上のグループごとに、当該グループに含まれる特徴量の集合を、分類対象となる前記一連のデータとして前記類似度行列を生成し、前記分類ステップにおける前記補正後の類似度行列に基づく前記一連のデータの分類結果に基づき、前記事前に実施された複数のデータの分類結果を更新する更新ステップを含むことを特徴とする、方法1に記載の情報処理装置の制御方法。
(方法18)事前に実施された複数のデータの分類結果のうち、外れ値または要素数が閾値以下のグループに含まれる特徴量の集合を選択する選択ステップをさらに有し、前記分類ステップは前記選択された特徴量と同じグループに分類すべき特徴量を判断し、前記判断の結果をもとに、前記事前に実施された複数のデータの分類結果を更新し、かつ、前記分類結果の更新後におけるグループに含まれる要素が、前記事前に実施された複数のデータの分類結果に含まれる場合に、当該グループを破棄することを特徴とする、方法1に記載の情報処理装置の制御方法。
(構成1)分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する生成手段と、前記類似度行列の少なくとも一部の前記要素を対象として、当該要素に対応する前記類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する補正手段と、前記補正手段による補正後の類似度行列に基づき、前記一連のデータを1以上のグループに分類する分類手段と、を有することを特徴とする、情報処理装置。
(プログラム1)コンピュータを、分類対象となる一連のデータそれぞれから抽出された特徴量それぞれの間の類似度を要素とする類似度行列を生成する生成手段と、前記類似度行列の少なくとも一部の前記要素を対象として、当該要素に対応する前記類似度の高さに応じて変換が施された当該類似度に置き換えることで、当該類似度行列を補正する補正手段と、前記補正手段による補正後の類似度行列に基づき、前記一連のデータを1以上のグループに分類する分類手段と、を有することを特徴とする情報処理装置として機能させるためのプログラム。
【符号の説明】
【0109】
12 算出部
13 補正部
14 分類部