(58)【調査した分野】(Int.Cl.,DB名)
前記表示部は、前記表示面に対する前記3次元空間の座標の向きの変更に伴って、前記3次元空間において前記表示面に直交する方向における距離に応じて前記サムネイルのサイズを変更して表示する、請求項2に記載の画像分類システム。
【発明の概要】
【発明が解決しようとする課題】
【0006】
前述したように、特許文献2は、3次元空間上に複数のサムネイルを配置して表示することを開示する。しかしながら、ディスプレイのような表示装置は2次元(平面)的であるため、ユーザは、サムネイルどうしの位置関係(距離)を正確に把握し難いことがある。
【0007】
特に、ユーザは、ディスプレイに正対して奥行き方向における距離を認識し難い。したがって、ユーザは、実際には奥行き方向において遠く離れた位置にあるサムネイル、すなわち類似度の低いサムネイルを、類似度の高いサムネイルと誤って認識してしまうことも起こり得る。
【0008】
よって、分類した画像の類似度をよりわかり易く表示することが可能な画像分類システムが望まれる。
【課題を解決するための手段】
【0009】
一態様に係る画像分類システムは、指定された条件に基づいて画像を分類するための複数の画像データを抽出する画像群抽出部と、抽出された前記複数の画像データの特徴量に基づき、前記複数の画像データを複数のクラスタに分類するクラスタリング部と、前記画像データの特徴量に基づいて前記複数の画像データのそれぞれに対応するサムネイルの3次元空間上の座標を決定する座標決定部と、前記座標決定部で決定された前記座標に基づき、前記サムネイルを表示装置に表示させる表示部と、を有し、前記表示部は、前記3次元空間において前記表示装置の表示面に直交する方向における距離に応じたサイズで前記サムネイルを表示させる。
【0010】
好ましい一態様によれば、画像分類システムは、ユーザの指令に応じて、前記表示面に対する前記3次元空間の座標の向きを変更可能に構成されている。
【0011】
好ましい一態様によれば、前記表示部は、前記表示面に対する前記3次元空間の座標の向きの変更に伴って、前記3次元空間において前記表示面に直交する方向における距離に応じて前記サムネイルのサイズを変更して表示する。
【0012】
好ましい一態様によれば、画像分類システムは、前記複数の画像データを複数のクラスタに分類する前に、画像データの特徴ベクトルを導出し、導出した特徴ベクトルの次元を削減する次元削減部を有し、前記クラスタリング部は、前記特徴ベクトルに基づき、前記複数の画像データを複数のクラスタに分類するよう構成されている。
【0013】
好ましい一態様によれば、前記次元削減部及び前記クラスタリング部は、複数のハイパーパラメータで複数回実行されるよう構成されており、前記画像分類システムは、少なくとも前記クラスタに属する前記画像データの分布に基づき、複数回実行された画像分類結果のうち、前記表示面に表示させる分類結果を決定する分類結果決定部を有する。
【0014】
好ましい一態様によれば、前記次元削減部及び前記クラスタリング部は、複数のハイパーパラメータで複数回実行されるよう構成されており、前記画像分類システムは、少なくとも前記クラスタの数が所定の範囲内であるか否かに基づき、複数回実行された画像分類結果のうち、前記表示面に表示させる分類結果を決定する分類結果決定部を有する。
【0015】
一態様に係る画像分類方法は、指定された条件に基づいて画像を分類するための複数の画像データを抽出するステップと、抽出された前記複数の画像データの特徴量に基づき、前記複数の画像データを複数のクラスタに分類するステップと、前記画像データの特徴量と前記クラスタに基づいて前記複数の画像データのそれぞれに対応するサムネイルの3次元空間上の座標を決定するステップと、決定された前記座標に基づき前記サムネイルを表示装置に表示させる表示ステップと、を有し、前記表示ステップでは、前記3次元空間において前記表示装置の表示面に直交する方向における距離に応じたサイズで前記サムネイルが表示させる。
【0016】
一態様に係るプログラムは、上記の画像分類方法をコンピュータに行わせるプログラムである。
【発明の効果】
【0017】
上記態様によれば、分類した画像の類似度をよりわかり易く表示することが可能になる。
【発明を実施するための形態】
【0019】
以下、本開示の実施形態について説明する。なお、以下に説明する実施形態は、特許請求の範囲に記載された発明を限定するものではない。また本実施形態で説明される構成の全てが、本開示の必須構成要件であるとは限らない。
【0020】
図1は、一実施形態における画像分類システムを含む全システムの構成を示す概略ブロック図である。
図2は、一実施形態における画像分類方法のフローチャートである。
【0021】
本実施形態に係る画像分類システム100は、画像分類方法を実行するコンピュータ端末200と、記憶部300と、表示装置400と、を有していてよい。記憶部300は、分類対象の複数の画像データを記憶していてよい。
【0022】
表示装置400は、画像データの分類結果や各種情報等を表示する。
図3及び
図4は、後述するように、画像分類システムの各状態の画面を示している。
【0023】
画像分類システム100は、複数の画像データを、類似した画像毎に分類するシステムである。また、画像分類システム100は、分類した画像データ群を3次元空間上で可視化し、表示装置400に出力させるよう構成されていてよい。
【0024】
コンピュータ端末200は、分類対象の画像群を抽出する画像群抽出部202と、画像データの特徴ベクトルを導出する特徴ベクトル導出部204と、特徴ベクトルの次元を削減する次元削減部206と、画像データ群を分類するクラスタリング部208と、分類された画像データ群を表示装置400に表示させる表示部216と、を有していてよい。
【0025】
さらに、コンピュータ端末200は、複数回クラスタリング部208による分類を行った場合に、各々の分類結果の評価値を導出する評価値導出部210と、良い評価の分類結果を選択する分類結果選択部212と、を有していてよい。また、表示装置400に表示させる際に、3次元座標における各画像データの表示位置を決定する座標決定部214を有していてもよい。
【0026】
以下、本実施形態における画像分類方法とともに、画像分類システム100の各構成についてより詳細に説明する。
【0027】
まず、画像群抽出部202は、指定された条件に基づいて画像を分類するための複数の画像データを抽出する(ステップS1)。画像群抽出部202は、データベース、又はネットワーク経由で、分類対象の複数の画像データ(画像データ群)を抽出すればよい。画像群抽出部202により抽出された複数の画像データは、記憶部300に記憶される。
【0028】
指定された条件は、例えばユーザにより指定されるものであってよい。そのような条件として、例えばキーワードによる条件が挙げられる。
【0029】
次に、特徴ベクトル導出部204は、ステップS1において抽出された各々の画像データについて、特徴ベクトルを導出する(ステップS2)。特徴ベクトルの導出は、公知の任意の手段を用いることができる。特徴ベクトルの導出は、例えば、畳み込みニューラルネットワーク(CNN)を用いた学習済みの学習モデルにより実施できる。そのような学習モデルとして、例えばInception V3を用いることができる。
【0030】
ステップS2において導出される特徴ベクトルの次元数は、特に限定されないが、例えば2042次元のような高次元であってよい。
【0031】
次に、必要に応じて、次元削減部206が、ステップS2において導出された特徴ベクトルの次元数を削減する処理を実行する(ステップS3)。次元削減処理は、複数の画像データを複数のクラスタに分類する後述の処理の前に実施される。
【0032】
次元削減処理は、画像データの特徴ベクトルの次元を削減する公知の任意の方法により実施することができる。そのような方法の1つとして、例えばUMAP(Uniform Manifold Approximation and Projection)が利用可能である。この代わりに、PCA、Isomap、t-SNEなども利用可能である。
【0033】
ステップS3における次元削減処理の結果、各々の画像データに対して、ステップS2で導出された特徴ベクトルの次元よりも低い次元を有する特徴ベクトルが導出される。ステップS3により導出される特徴ベクトルの次元数は、特に限定されないが、例えば2〜7次元であってよい。
【0034】
なお、UMAPを用いた次元削減処理では、出力される特徴ベクトルの次元数、ある点の周辺として扱う点の数、及び次元削減処理で行われる繰り返し計算の回数は、パラメータ(ハイパーパラメータと称する)として、設定可能になっている。
【0035】
ここで、出力される特徴ベクトルの次元数は、例えば2〜7の範囲に設定されることが好ましい。また、ある点の周辺として扱う点の数は、例えば5〜50の範囲に設定されることが好ましい。さらに、繰り返し計算の回数は、例えば200〜500の範囲に設定されることが好ましい。
【0036】
なお、次元削減処理は、必須の処理ではなく、必要に応じて実施されればよい。例えば、ステップS2において導出される特徴ベクトルの次元が十分に小さい場合、ステップS3における次元削減処理は不要である。
【0037】
次に、クラスタリング部208は、ステップS1にて抽出された複数の画像データを、当該画像データの特徴量に基づき複数のクラスタに分類する(ステップS4)。好ましくは、クラスタリング部208は、ステップS3の次元削減後の特徴ベクトルに基づき、複数の画像データを複数のクラスタに分類する。
【0038】
この代わりに、次元削減処理(ステップS3)が行われない場合には、クラスタリング部208は、ステップS2で導出された特徴ベクトルに基づき、複数の画像データを複数のクラスタに分類してもよい。
【0039】
クラスタリング部208によるクラスタリング処理は、公知の任意の方法により実施することができる。そのような方法の1つとして、例えばHDBSCAN(Density-Based Clustering Based on Hierarchical Density Estimates)が挙げられる。
【0040】
具体的一例として、複数の画像データは、特徴ベクトルどうしの距離に応じて、複数の画像データがクラスタに分類される。ここで、特徴ベクトルどうしの距離は、公知の任意の方法により定義されていてよい。例えば、特徴ベクトルどうしの距離は、ユークリッド距離、シティブロック距離、ミンコフスキー距離又はマハラノビス距離などであってよい。
【0041】
すなわち、特徴ベクトルどうしの距離が小さい場合、それらの画像データは同じクラスタに分類される。一方、特徴ベクトルどうしの距離が大きい場合には、それらの画像データは互いに異なるクラスタに分類される。これにより、互いに類似する画像データは同じクラスタに分類され、非類似の画像データは互いに異なるクラスタに分類されることになる。
【0042】
なお、HDBSCANを用いたクラスタリング処理では、最小クラスターサイズは、パラメータ(ハイパーパラメータと称する)として、設定可能になっている。この場合、最小クラスターサイズは、例えば5以上、かつ分類すべき画像データの数の1/50以下の値に設定されることが好ましい。
【0043】
次に、必要に応じて、評価値導出部210が、ステップS4で分類された分類結果について、評価値を算出する(ステップS5)。評価値の算出は、後述するように、次元削減処理及びクラスタリング処理を複数回施行する場合に、実施される。
【0044】
評価値の算出方法は、特に制限されず、画像データの分類結果がなるべく好ましくなるよう設定されていればよい。
【0045】
この評価値は、少なくともクラスタに属する画像データの分布と、クラスタの数が所定の範囲内であるか否か、の少なくとも一方に基づき算出されることが好ましい。より好ましくは、評価値は、少なくともクラスタに属する画像データの分布と、クラスタの数が所定の範囲内であるか否か、の両方に基づき算出される。
【0046】
一例では、評価値は、各クラスタに分類された画像データの分布と、均等な分布(理想分布)との差異を数値化することにより算出される。より具体的な一例では、評価値は、クラスタに分類された画像データの離散確率分布と、均一に画像データが分布した場合の離散確率分布との差異によって定義されていてよい。この場合、2つの確率分布の差異は、例えばカルバック・ライブラー情報量(情報利得又は情報エントロピー)により算出される。なお、この場合、評価値の数値が低いほど分布どうしの差異が小さくなる。したがって、評価値が低いほど、分類結果が良いことを意味する。
【0047】
前段落の条件により算出された評価値は、例えばクラスタの数が所定の範囲内であるか否かによって、修正されてもよい。すなわち、ステップS4の後にクラスタの数が所定の範囲外にある場合、評価値の数値を増大させてもよい。
【0048】
例えば、ステップS4の後にクラスタの数が1になった場合、評価値の数値を所定の値だけ増大させてもよい。また、クラスタの数が予め設定した上限値を超えた場合、評価値の数値を所定の値だけ増大させてもよい。これにより、クラスタの数が所定の範囲外にある場合、評価値の数値が高くなり、分類結果がよくないという方にバイアスをかけることができる。
【0049】
次に、クラスタリング部208による分類処理を所定回数行ったかどうか判断する(ステップS6)。クラスタリング部208による分類処理が所定回数行われていない場合、前述した次元削減処理(ステップS3)と、前述した分類処理(ステップS4)と、評価値導出の処理(ステップS5)と、を繰り返す。この際、前述したハイパーパラメータを変更して各処理を実行する。
【0050】
ステップS3〜S5の繰り返しの回数は、特に制限されず、予め設定されていてよい。なお、各回におけるハイパーパラメータの設定は、例えば公知の最適化手法により決定されていてよい。そのような最適化手法として、Tree-structured Parzen Estimatorと称される公知のアルゴリズムが知られている。この代わりに、例えばベイズ最適化のような手法を用いることもできる。
【0051】
ステップS3〜S5が所定の回数繰り返されたら、分類結果選択部212が、複数回実行された画像分類結果のうち表示装置400の表示面に表示させる分類結果を決定する(ステップS7)。
【0052】
すなわち、分類結果選択部212が、複数回実行された画像分類結果のうち、良い評価値の分類結果を選択する。したがって、分類結果選択部212は、少なくともクラスタに属する画像データの分布に基づき、複数回実行された画像分類結果のうち、表示面に表示させる分類結果を決定すればよい。より好ましくは、分類結果選択部212は、少なくともクラスタの数が所定の範囲内であるか否かに基づき、複数回実行された画像分類結果のうち、表示面に表示させる分類結果を決定すればよい。または、分類結果選択部212は、これらの両方の条件に基づき、表示面に表示させる分類結果を決定すればよい。
【0053】
分類結果選択部212によるステップS7は、ステップS3〜S5が複数回繰り返された場合に実施されればよい。特にクラスタリング部208による分類処理(ステップS4)が一回のみ実施される場合には、その分類結果が、表示装置400の表示面に表示されることとなる。
【0054】
次に、座標決定部214が、ステップS1で抽出された画像データの特徴量に基づいて、複数の画像データのそれぞれに対応するサムネイルの3次元空間上の座標を決定する(ステップS8)。
【0055】
具体的には、ステップS4の分類処理で用いられた特徴ベクトルどうしの距離に基づいて、特定の画像データのサムネイルを表示するための3次元空間上の位置を決定することが好ましい。すなわち、特徴ベクトルどうしの距離が近い場合に、3次元空間上で近い位置に画像データのサムネイルが割り当てられ、特徴ベクトルどうしの距離が遠い場合に、3次元空間上で遠い位置に画像データのサムネイルが割り当てられればよい。
【0056】
より具体的には、例えば、ステップS4の分類処理で用いられた特徴ベクトルが3次元である場合、当該3次元ベクトルを、3次元空間のX軸、Y軸、Z軸に割り当てればよい。これにより、特定の画像データのサムネイルを表示するための3次元空間上の位置を決定することができる。
【0057】
ステップS4の分類処理で用いられた特徴ベクトルが3次元よりも高い次元を有する場合、ステップS3と同様の次元削減処理をさらに実行すればよい。この際に、出力として得られる特徴ベクトルが3次元となるように、前述したハイパーパラメータを調整すればよい。
【0058】
次元削減処理により特徴ベクトルが3次元になれば、当該3次元ベクトルを、3次元空間のX軸、Y軸、Z軸に割り当てればよい。これにより、特定の画像データのサムネイルを表示するための3次元空間上の位置を決定することができる。
【0059】
次に、表示部216が、座標決定部214で決定された座標に基づき、サムネイル500を表示装置400に表示させる。これにより、類似する画像データどうしのサムネイル500が3次元空間上で近くに配置され、類似しない画像データどうしのサムネイル500が3次元空間上で遠くに配置されることになる(
図3及び
図4参照)。
【0060】
なお、
図3及び
図4は、画像分類システムの一状態の画面を示す図であり、それぞれ、画像の分類処理後に、表示装置400の表示面に表示された多数のサムネイル500を示している。
【0061】
ここで、表示部216は、3次元空間(XYZ空間)において表示装置400の表示面に直交する方向における距離に応じたサイズでサムネイル500を表示させる。すなわち、ユーザの視線方向から見て、3次元座標においてユーザに近ければ近いほど、サムネイル500のサイズは大きい。ユーザの視線方向から見て、3次元座標においてユーザから遠ければ遠いほど、サムネイル500のサイズは小さい。
【0062】
これにより、ユーザは、表示装置400の表示面が2次元平面であったとしても、複数のサムネイルの3次元空間上の配置を理解し易くなる。したがって、分類された画像データの類似度が、一見してよりわかり易くなる。
【0063】
ここで、3次元空間(XYZ空間)において表示装置400の表示面に直交する方向における距離は、3次元空間上のベクトル成分に基づき容易に算出できることに留意されたい。
【0064】
また、画像分類システム100は、ユーザの指令に応じて、表示装置400の表示面に対する3次元空間の座標の向きを変更可能に構成されていることが好ましい。例えば、3次元空間の座標の向きは、ユーザによるドラッグ操作により変更可能であってよい。すなわち、ユーザは、マウスやタッチパネルを用いて表示装置400に表示されている3次元区間の軸の向きを、ドラッグ操作に回転させることができる。
【0065】
例えば、
図3は、ユーザによる操作前の表示装置400上のサムネイル500の様子を示しており、
図4は、ユーザによる3次元空間の軸の回転操作後の表示装置400上のサムネイル500の様子を示している。より具体的には、
図4は、Z軸まわりに約90°回転されている。
【0066】
この座標軸の向きの変更に伴い、サムネイルの表示位置も変更される。より好ましくは、表示部216は、表示装置400の表示面に対する3次元空間の座標の向きの変更に伴って、3次元空間において当該表示面に直交する方向における距離に応じてサムネイルのサイズを変更して表示する。これにより、ユーザが軸の向きを変更したとしても、ユーザは、常に、複数のサムネイルの3次元空間上の配置を理解し易くなる。
【0067】
本発明は、前述した画像分類方法をコンピュータに行わせるプログラムをも含むことに留意されたい。
【0068】
このようなコンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)に格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。
【0069】
一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0070】
上述したように、実施形態を通じて本発明の内容を開示したが、この開示の一部をなす論述及び図面は、本発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替の実施形態、実施例及び運用技術が明らかとなる。したがって、本発明の技術的範囲は、上述の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
【0071】
前述した実施形態では、コンピュータ端末200と表示装置400は、互いに別個の機器であり、無線又は有線により互いに通信可能に構成されていてよい。この場合、コンピュータ端末200はローカル端末であってもよく、ネットワーク上に置かれたサーバであってもよい。
【0072】
画像分類システムがネットワーク上に置かれたサーバとして機能する場合、ユーザは、前述した表示装置400の機能を含むユーザ端末から、ネットワークを介して、前述した画像分類方法を実行可能なコンピュータ端末(サーバ)にアクセスすればよい。
【0073】
上記態様の代わりに、表示装置400は、例えば携帯電話やタブレットのような携帯端末のように、コンピュータ端末200の一部の部品として構成されていてもよい。
【解決手段】画像分類システムは、指定された条件に基づいて画像を分類するための複数の画像データを抽出する画像群抽出部と、抽出された複数の画像データの特徴量に基づき、複数の画像データを複数のクラスタに分類するクラスタリング部と、画像データの特徴量に基づいて複数の画像データのそれぞれに対応するサムネイルの3次元空間上の座標を決定する座標決定部と、座標決定部で決定された座標に基づき、サムネイルを表示装置に表示させる表示部と、を有する。表示部は、3次元空間において上記表示面に直交する方向における距離に応じたサイズでサムネイルを表示させる。