(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-01
(45)【発行日】2024-11-12
(54)【発明の名称】画像分類装置、画像分類方法及びプログラム
(51)【国際特許分類】
G06T 1/00 20060101AFI20241105BHJP
G06T 7/00 20170101ALI20241105BHJP
G06F 16/55 20190101ALI20241105BHJP
G06F 16/56 20190101ALI20241105BHJP
【FI】
G06T1/00 200D
G06T7/00 300F
G06F16/55
G06F16/56
(21)【出願番号】P 2020158880
(22)【出願日】2020-09-23
【審査請求日】2023-09-14
(73)【特許権者】
【識別番号】512079738
【氏名又は名称】株式会社グルーヴノーツ
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】最首 英裕
【審査官】鈴木 明
(56)【参考文献】
【文献】国際公開第2010/041377(WO,A1)
【文献】特開2011-134115(JP,A)
【文献】特開2013-242810(JP,A)
【文献】国際公開第2015/146101(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06T 7/00
G06F 16/55
G06F 16/56
(57)【特許請求の範囲】
【請求項1】
対象物画像の特徴ベクトルを算出する算出部と、
前記対象物画像の特徴ベクトルをクラスタリングすることで、新規の前記対象物画像の特徴ベクトルと所属クラスタとを対応づけた新規クラスタ情報を生成する分類部と、
既存の前記対象物画像の特徴ベクトルと所属クラスタとを対応付けたマスタ・クラスタ情報を記憶する記憶部と、
前記新規クラスタ情報と、前記マスタ・クラスタ情報とを統合し、前記マスタ・クラスタ情報を更新する統合部と、
更新後の前記マスタ・クラスタ情報に基づき、クラスタリングの結果を出力する出力部と
を具備する画像分類装置。
【請求項2】
前記統合部は、新規の前記対象物画像の特徴ベクトルが、既存の前記対象物画像の特徴ベクトルに類似しているか否かを判断し、類似していると判断した場合には、前記マスタ・クラスタ情報に含まれる既存の前記対象物画像の特徴ベクトルを、新規の前記対象物画像の特徴ベクトルに更新する一方、類似していないと判断した場合には、新規の前記対象物画像の特徴ベクトルを、前記マスタ・クラスタ情報に追加する、請求項1に記載の画像分類装置。
【請求項3】
前記出力部は、前記クラスタリングの結果を、ユーザの端末に出力し、
前記ユーザから、前記所属クラスタを識別するためのクラスタ識別情報を受け付ける受付部をさらに具備する、請求項1または2に記載の画像分類装置。
【請求項4】
前記出力部は、前記クラスタリングの結果として、
分割画像に示される前記対象物画像と、前記対象物画像の所属クラスタに関するクラスタ関連情報とを、前記ユーザの端末の表示装置に表示する、請求項3に記載の画像分類装置。
【請求項5】
前記対象物画像に基づいて、対象物の向きを変更した向き変更画像を生成する生成部をさらに備え、
前記算出部は、前記向き変更画像の特徴ベクトルを算出する、請求項1から4のいずれか一項に記載の画像分類装置。
【請求項6】
対象物画像の特徴ベクトルを算出する算出ステップと、
前記対象物画像の特徴ベクトルをクラスタリングすることで、新規の前記対象物画像の特徴ベクトルと所属クラスタとを対応づけた新規クラスタ情報を生成する分類ステップと、
前記新規クラスタ情報と、既存の前記対象物画像の特徴ベクトルと所属クラスタとを対応付けたマスタ・クラスタ情報とを統合し、前記マスタ・クラスタ情報を更新する統合ステップと、
更新後の前記マスタ・クラスタ情報に基づき、クラスタリングの結果を出力する出力ステップと
を含む画像分類方法。
【請求項7】
コンピュータに、
対象物画像の特徴ベクトルを算出する算出ステップと、
前記対象物画像の特徴ベクトルをクラスタリングすることで、新規の前記対象物画像の特徴ベクトルと所属クラスタとを対応づけた新規クラスタ情報を生成する分類ステップと、
前記新規クラスタ情報と、既存の前記対象物画像の特徴ベクトルと所属クラスタとを対応付けたマスタ・クラスタ情報とを統合し、前記マスタ・クラスタ情報を更新する統合ステップと、
更新後の前記マスタ・クラスタ情報に基づき、クラスタリングの結果を出力する出力ステップと
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像分類装置、画像分類方法及びプログラムに関する。
【背景技術】
【0002】
番組に登場する各人物(タレントなど)を特定するために、当該番組の映像から各人物の顔画像を取得する技術が知られている(例えば、非特許文献1参照)。
かかる技術によれば、映像の主要な人物の顔画像一覧を自動で生成してユーザに提示することができるため、ユーザは、提示された顔画像一覧を参考にして視聴する番組を選択することができる。
【先行技術文献】
【非特許文献】
【0003】
【文献】“人物の顔を検出・表示して映像一覧を自動生成する技術を開発”,[online],平成20年1月10日,日本電気株式会社,[令和2年7月29日検索],インターネット<http://www.nec.co.jp/press/ja/0801/1004.html>
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1の開示技術では、例えば特定の人物(対象物)がどの映像に映っているかを確認するためには、テレビ番組の制作スタッフなどが全ての映像ファイルをチェックし、目視確認する必要があり、膨大な時間がかかるとともに煩雑な作業を強いられるという問題があった。
【0005】
本発明は、以上説明した事情を鑑みてなされたものであり、映像ファイルに含まれる膨大な画像の中から、対象物が映っている画像を迅速かつ容易に確認することが可能な技術を提供することを目的の1つとする。
【課題を解決するための手段】
【0006】
本開示の一態様に係る画像分類装置は、対象物画像の特徴ベクトルを算出する算出部と、対象物画像の特徴ベクトルをクラスタリングすることで、新規の対象物画像の特徴ベクトルと所属クラスタとを対応づけた新規クラスタ情報を生成する分類部と、既存の対象物画像の特徴ベクトルと所属クラスタとを対応付けたマスタ・クラスタ情報を記憶する記憶部と、新規クラスタ情報と、マスタ・クラスタ情報とを統合し、マスタ・クラスタ情報を更新する統合部と、更新後のマスタ・クラスタ情報に基づき、クラスタリングの結果を出力する出力部とを具備することを要旨とする。
【発明の効果】
【0007】
本発明の所定の態様によれば、映像ファイルに含まれる膨大な画像の中から、対象物が映っている画像を迅速かつ容易に確認することが可能となる。
【図面の簡単な説明】
【0008】
【
図1】本実施形態に係るクラスタリングシステムの構成の一例を示す図である。
【
図2】ユーザ端末、画像分類装置のハードウェア構成の一例を示す図である。
【
図3】画像分類装置の機能構成を示すブロック図である。
【
図4】画像分類装置の機能概要を説明するための模式図である。
【
図5】画像分類装置の機能概要を説明するための模式図である。
【
図6】画像分類装置の機能概要を説明するための模式図である。
【
図8】クラスタリング結果画面を例示した図である。
【
図9】再クラスタリング前後のマスタ・クラスタ結果テーブルを例示した図である。
【
図10】再クラスタリング前後のマスタ・クラスタテーブルを例示した図である。
【発明を実施するための形態】
【0009】
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
【0010】
A.本実施形態
<システム構成>
図1は、本実施形態に係るクラスタリングシステム1000の構成の一例を示す図である。
クラスタリングシステム1000は、ユーザが操作するユーザ端末100と、画像分類装置200とを含んで構成される。ユーザ端末100と画像分類装置200とは、ネットワークNを介して相互通信可能となっている。
【0011】
ネットワークNのうちの1つまたは複数の部分は、有線ネットワークや無線ネットワークであってもよい。ネットワークNは、限定でなく例として、アドホック・ネットワーク(Ad Hoc Network)、イントラネット、エクストラネット、仮想プライベート・ネットワーク(Virtual Private Network:VPN)、ローカル・エリア・ネットワーク(Local Area Network:LAN)、ワイヤレスLAN(Wireless LAN:WLAN)、広域ネットワーク(Wide Area Network:WAN)、ワイヤレスWAN(Wireless WAN:WWAN)、大都市圏ネットワーク(Metropolitan Area Network:MAN)、インターネットの一部、公衆交換電話網(Public Switched Telephone Network:PSTN)の一部、携帯電話網、ISDNs(Integrated Service Digital Networks)、無線LANs、LTE(Long Term Evolution)、CDMA(Code Division Multiple Access)、ブルートゥース(Bluetooth(登録商標))、衛星通信など、または、これらの2つ以上の組合せを含むことができる。
【0012】
<クラスタリングシステム1000の概要>
本実施形態に係るクラスタリングシステム1000において、画像分類装置200は、映像ファイルから多数の分割画像を取得し、取得した分割画像ごとに、顔画像を検出する。画像分類装置200は、検出した顔画像ごとに、顔特徴ベクトルを算出し、顔特徴ベクトルをクラスタリングする。画像分類装置200は、クラスタリングした結果をユーザ端末100に出力する。ユーザは、ユーザ端末100に表示されるクラスタリング結果を確認することで、例えば特定の人物(タレントなど)の顔画像が、どの分割画像に含まれるのかを、速やかに把握することが可能となる。なお、本実施形態では、顔画像をクラスタリング対象とするが、映像ファイルに含まれるあらゆる対象物の画像(例えば、車、バイク、飛行機、船、鳥、魚などの画像)をクラスタリング対象とすることができる。
【0013】
ユーザ端末100は、ユーザ(例えば、番組制作スタッフなど)が操作する端末であり、パーソナルコンピュータ、ハンドヘルドコンピュータデバイス、スマートフォン、携帯電話、ウェアラブル端末などによって構成されている。ユーザは、ユーザ端末100を適宜操作することで、クラスタリングの実行指示などを入力する。
【0014】
画像分類装置200は、例えばサーバコンピュータにより構成され、顔画像のクラスタリングなどを実行する(詳細は後述)。なお、ユーザ端末100や画像分類装置200を構成するコンピュータは、必ずしも1台である必要はなく、ネットワークN上に分散する複数のコンピュータやストレージから構成されてもよい。
【0015】
<ハードウェア構成>
図2は、ユーザ端末100、画像分類装置200のハードウェア構成の一例を示す図である。ユーザ端末100及び画像分類装置200は、それぞれ、CPU(Central Processing Unit)1、ROM(Read Only Memory)やRAM(Random Access Memory)等の記憶装置2、有線又は無線通信を行う通信IF(Interface)3、入力操作を受け付ける入力デバイス4、及び情報の出力を行う出力デバイス5を有する。入力デバイス4は、例えばキーボード、マウス、タッチパネル、マイク等である。出力デバイス5は、例えば、ディスプレイ(画面)及び/又はスピーカ等である。
【0016】
以下、
図3~
図6を参照しながら、画像分類装置200の機能構成及び機能概要について説明する。
【0017】
<機能構成及び機能概要>
図3は、画像分類装置200の機能構成を示すブロック図であり、
図4~
図6は、画像分類装置200の機能概要を説明するための模式図である。
【0018】
画像分類装置200は、記憶部210と、受付部220と、分割部230と、検出部240と、生成部250と、算出部260と、分類部270と、統合部280と、出力部290とを含む。
受付部220と、分割部230と、検出部240と、生成部250と、算出部260と、分類部270と、統合部280と、出力部290は、画像分類装置200のCPU1が記憶装置2に記憶された各種プログラムを実行することによって実現される。なお、プログラムは、USBメモリやCD-ROM等の記憶媒体に格納することができる。
【0019】
記憶部210は、記憶装置2によって実現され、顔画像のクラスタリングを実現するための制御プログラムP1のほか、様々な映像ファイル、クラスタリングに関わる各種データなどを記憶する。
【0020】
受付部220は、ユーザによるユーザ端末100の操作に応じて、顔画像のクラスタリングに関わる様々な指示を受け付ける。
【0021】
分割部230は、ユーザによって指定された映像ファイル(動画ファイルなど)を記憶部210から取得し、映像ファイルから多数の静止画像を特定し、これを分割画像として順次出力する(
図4に示すS1参照)。
【0022】
検出部240は、分割画像ごとに、顔及び顔の各パーツ(例えば眉、目、鼻、口など)を検出し、これを顔画像として特定するとともに(
図4に示すS2参照)、顔及び顔の各パーツの座標(以下、「顔座標」と総称する。)を取得する。検出部240は、顔画像及び顔座標を生成部250に出力する。
【0023】
生成部250は、検出部240から供給される顔画像及び顔座標に基づき、顔を正面に向けた画像(以下、「正面化顔画像」ともいう。)を生成し、算出部260に出力する(
図4に示すS3参照)。顔を正面に向けることで顔の認識精度などを向上することが可能となる。なお、正面化顔画像(向き変更画像)を生成するために、例えば顔の各パーツを元に補正する方法や、GAN(Generative Adversarial Networks)などを利用する方法を採用することができる。
【0024】
算出部260は、生成部250から供給されるすべての正面化顔画像について、正面化顔画像ごとに、顔特徴ベクトルを算出し、顔特徴ベクトルテーブルTA1を生成する(
図4に示すS4参照)。
【0025】
顔特徴ベクトルテーブルTA1には、特徴ベクトルIDと、画像IDと、顔座標と、顔特徴ベクトルが対応づけて登録される。特徴ベクトルIDは、顔特徴ベクトルを識別するための識別情報であり、画像IDは、顔画像を含む分割画像を識別するための識別情報である。顔座標は、検出部240によって取得された顔画像である。顔特徴ベクトルは、正面化顔画像の512次元の特徴ベクトルである。なお、
図4に示す顔特徴ベクトルテーブルTA1の例では、画像ID(=「10」)が同一で、特徴ベクトルID(=「30」、「31」)が異なる2つの特徴ベクトルが示されている。これは、1枚の分割画像の中に複数(ここでは2つ)の顔が存在していることを意味する。
【0026】
算出部260は、顔特徴ベクトルテーブルTA1を生成すると、これを記憶部210に記憶するとともに、特徴ベクトルIDが付加された各顔特徴ベクトルを分類部270に出力する。
【0027】
分類部270は、算出部260から供給されるすべての正面化顔画像の顔特徴ベクトルをクラスタリングする(
図5に示すS5参照)。ここで、「クラスタリング」とは、顔特徴ベクトルのデータセットをクラスタと呼ばれるグループに分類する処理をいい、DBSCAN(Density-based spatial clustering of applications with noise)、OPTICS(Ordering Points To Identify the Clustering Structure)、x-means、G-meansなどのクラスタリングアルゴリズムを利用ことができる。もっとも、事前にクラス数を決定する必要のない他のクラスタリングアルゴリズムを採用してもよい。
【0028】
分類部270は、クラスタリングによって、各顔特徴ベクトルに対して暫定的な仮クラスタラベル(所属クラスタ)を付与し、仮クラスタ結果テーブルTA2と、仮クラスタテーブルTA3を生成し、統合部280に出力する。仮クラスタ結果テーブルTA2には、特徴ベクトルIDと仮クラスタラベルが対応づけて登録される。なお、マイナスの仮クラスタラベル(=「-1」)が付与された顔特徴ベクトル(例えば、顔ではなく人の後頭部が映っている画像の特徴ベクトルなど)は、ノイズとして取り扱われる。
【0029】
一方、仮クラスタテーブルTA3には、仮クラスタラベルと、今回、クラスタリングを行った新規の正面化顔画像の顔特徴ベクトル(新規のクラスタの重心)が対応づけて登録される。
【0030】
統合部280は、分類部270から仮クラスタ結果テーブルTA2と、仮クラスタテーブルTA3を受け取ると、記憶部210にアクセスし、マスタ・クラスタ結果テーブルTA4と、マスタ・クラスタテーブルTA5を読み出す(
図5に示すS6参照)。マスタ・クラスタ結果テーブルTA4には、既存の特徴ベクトルIDとクラスタラベル(所属クラスタ)が対応づけて登録されている。一方、マスタ・クラスタテーブルTA5には、クラスタラベルと、既存の正面化顔画像の顔特徴ベクトルが対応づけて登録されている。マスタ・クラスタ結果テーブルTA4及びマスタ・クラスタテーブルTA5は、分類部270が前回以前に行ったクラスタリングで生成・登録したテーブルである。
【0031】
統合部280は、仮クラスタ結果テーブルTA2及び仮クラスタテーブル(新規クラスタ情報)TA3と、マスタ・クラスタ結果テーブルTA4及びマスタ・クラスタテーブル(既存クラスタ情報)TA5とを比較し、統合(クラスタリング)することで、マスタ・クラスタ結果テーブルTA4及びマスタ・クラスタテーブルTA5の登録内容を更新する(
図6に示すS7)。
なお、以下では便宜上、更新後のマスタ・クラスタ結果テーブルTA4及びマスタ・クラスタテーブルTA5を、それぞれマスタ・クラスタ結果テーブル(最新)TA4及びマスタ・クラスタテーブル(最新)TA5と呼ぶ。
【0032】
マスタ・クラスタ結果テーブル(最新)TA4に示すように、仮クラスタラベル「1」は、クラスタラベル「5」に更新され、仮クラスタラベル「-1」は、ノイズのため登録されず、・・・仮クラスタラベル「32」は、対応するクラスタラベルが存在しないため、新たに追加される。
【0033】
また、マスタ・クラスタテーブル(最新)TA5に示すように、既存のクラスタの重心(すなわち、既存の顔特徴ベクトル)は適宜更新される。具体的には、新規の顔特徴ベクトルが既存の顔特徴ベクトルに類似する場合、統合部280は、既存の顔特徴ベクトルを新規の顔特徴ベクトルに更新する。一方、新規の顔特徴ベクトルが既存の顔特徴ベクトルに類似していない場合には、統合部280は、マスタ・クラスタテーブルTA5に新規の顔特徴ベクトルを追加する。
【0034】
なお、新規の顔特徴ベクトルが既存の顔特徴ベクトルに類似するか否かは、例えば類似度に基づいて判断する。類似度が設定された閾値を超えている場合、統合部280は、類似していると判断する一方、類似度が設定された閾値を超えていない場合には、類似していないと判断する。
【0035】
統合部280は、マスタ・クラスタ結果テーブル(最新)TA4及びマスタ・クラスタテーブル(最新)TA5を記憶部に記憶するとともに、統合(クラスタリング)が終了した旨を出力部290に通知する。
【0036】
出力部290は、ユーザ端末100からクラスタリングの結果確認の要求を受け取ると、かかる要求に応じてクラスタリングの結果をユーザ端末100に送信する。
具体的には、出力部290は、顔特徴ベクトルテーブルTA1や、マスタ・クラスタ結果テーブル(最新)TA4、マスタ・クラスタテーブル(最新)TA5、分割画像を記憶部210から読み出し、ラベル名設定画面及びクラスタリング結果画面をユーザ端末100のディスプレイに表示する。
【0037】
<ラベル名設定画面>
図7は、ラベル名設定画面G1を例示した図である。
各クラスタラベルは、画像分類装置200によってランダムに付与されるものであるから、どの人物の顔に、どのクラスタラベルが設定されているのかをユーザが覚えておくのは難しい。そこで、本実施形態では、ユーザが各クラスタを検索しやすいように、各クラスタラベルにわかりやすい名前(クラスタ識別情報)を登録できるようにしている。
【0038】
図7に示すように、ラベル名設定画面G1には、クラスタラベル、顔画像と並んでラベル名の登録欄が設けられている。
ユーザは、クラスタラベルと顔画像を確認しながら、ラベル名を順次登録していく。例えば人物が芸能人であれば、ユーザはその芸能人の芸名(「ANDY」や「JACK」など)を、ラベル名として登録する。受付部220は、ユーザによるラベル名の入力を受け付けると、これを統合部280に出力する。統合部280は、受付部220からラベル名を受け取ると、クラスタラベルと、ラベル名とが対応付けられたマスタ・クラスタ名テーブルTA6を記憶部210に格納する(
図6に示すS8)。
【0039】
図6に示すマスタ・クラスタ名テーブルTA6では、クラスタラベル「39」及び「40」に、同じラベル名「JJ」が登録されている。これは、同一人物であっても、例えば“メイク有り”の場合と、“メイク無し”の場合などがあるためである。なお、単純に、人物を検索したい場合であれば、メイクの有無の情報は不要であるため、
図6に示すように「JJ」といった名前のみ登録すればよい。もっとも、メイクの有無で区別して検索したい場合(例えば、メイク有りの「JJ」を検索したい場合など)には、「JJ(メイク有り)」、「JJ(メイク無し)」という形でマスタ・クラスタ名テーブルTA6に登録してもよい。
【0040】
<クラスタリング結果画面>
図8は、クラスタリング結果画面G2を例示した図である。
クラスタリング結果画面G2には、クラスタ名と、検出した分割画像の画像IDと、サムネイル形式の分割画像と、分割画像のURLが対応付けて表示される。
【0041】
図8に示すように、分割画像上の顔画像について、検出した顔ごとに、顔を縁取る枠Fと、その顔のクラスタ関連情報Cが表示される。ここで、「クラスタ関連情報」とは、例えば特徴ベクトルIDや、クラスタラベルなど、クラスタに関連する情報である。なお、クラスタ関連情報は、顔画像の上に直接表示されると顔画像の確認が難しくなるため、例えばマウスオーバーなどによって吹き出し表示する。
図8に示す例では、1枚の分割画像に複数の顔画像が存在する場合を例示しているが、単数の顔画像が存在する場合もあり得る。
【0042】
(特定の人物を検索する場合)
ユーザは、
図8に示すプルダウン表示される複数のラベル名NMの中から、特定の人物のラベル名(例えば、「JACK」)を選択する。
【0043】
かかる選択操作が行われると、特定の人物「JACK」の顔画像を含む分割画像が、クラスタリング結果画面G2に表示される。このように、ユーザは、ラベル名を選択するという簡単な操作を行うことで、所望の人物の顔が映っている分割画像を、迅速に確認することができる。
【0044】
なお、上記例では、ユーザが設定したラベル名を利用して、所望の人物の顔が映っている分割画像を検索する場合を想定したが、ラベル名の代わりにクラスタラベルを利用して検索してもよい。
【0045】
さらに、画像を利用して、所望の人物の顔が映っている分割画像を検索できるようにしてもよい。例えば、ユーザは、ユーザ端末100などに格納されている所望の人物の顔画像(例えば、「TARO」)を選択し、この顔と一致する顔を含む分割画像を検索するよう、画像分類装置200に指示してもよい。
【0046】
次に、ユーザがクラスタリング結果画面の確認後、再クラスタリングを指示する場合について説明する。なお、以下では、クラスタに属する顔を確認した結果、双子の兄弟(「ICHIRO」と「JIRO」)の顔が似ていたことから、同一のクラスタに分類されていた場合を想定する。
【0047】
図9は、再クラスタリング前後のマスタ・クラスタ結果テーブルTA4を例示した図である。
図9のAに示すように、再クラスタリング前のマスタ・クラスタ結果テーブルTA4では、特徴ベクトルID=「36」(「ICHIRO」)と、特徴ベクトルID=「37」(「JIRO」)において、同一のクラスタ(クラスタラベル=「25」)が設定されている。ユーザは、「ICHIRO」と「JIRO」が同一のクラスタに設定されていることから、ユーザ端末100を操作してクラスタラベル=「25」を対象に、閾値をより厳しく設定し、再クラスタリングの実行を指示する。この「閾値」は、既存のクラスタ(ここでは、クラスタラベル=「25」)に類似しているか否かを判断するための閾値であり、クラスタごとに、ユーザがユーザ端末100を操作することで適宜設定・変更可能となっている。
【0048】
画像分類装置200の分類部270は、ユーザ端末100から再クラスタリングの実行指示を受け取ると、クラスタラベル=「25」に対応する顔特徴ベクトルに対して再クラスタリングを行う。なお、分類部270による再クラスタリングの後の動作については、上述したS5~S8の動作と同様であるため、説明を割愛する。
【0049】
再クラスタリングの結果、分類部270によって「ICHIRO」と「JIRO」は、別クラスタであると判断されると、統合部280は、「JIRO」に対して、新たなクラスタラベル(=「26」)を設定する。この結果、
図9のBに示すように、再クラスタリング後のマスタ・クラスタ結果テーブル(最新)TA4には、特徴ベクトルID=「37」(「JIRO」)に対して新たなクラスタラベル=「26」が設定される。一方、特徴ベクトルID=「36」(「ICHIRO」)のクラスタラベル=「25」は、維持される。
【0050】
図10は、再クラスタリング前後のマスタ・クラスタテーブルTA5を例示した図である。
図10のAと
図10のBを比較して明らかなように、再クラスタリングが行われることで、マスタ・クラスタテーブル(最新)TA5には、新たなクラスタラベル=「26」に対して、「JIRO」(特徴ベクトルID=「37」)の512次元の特徴ベクトルが登録される。一方、クラスタラベル=「25」については、登録済みの「ICHIRO」(特徴ベクトルID=「36」)の512次元の特徴ベクトルが維持される。
【0051】
以上説明したように、本実施形態によれば、ユーザは自身が設定したラベル名を選択するといった簡単な操作で、映像ファイルに含まれる膨大な分割画像の中から、所望の人物の顔が映っている分割画像を、迅速かつ容易に確認することが可能となる。
【0052】
B.変形例
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。
【0053】
例えば、画像処理によるオブジェクト・トラッキング技術を利用することで、ユーザが指定した人物の顔など(対象物)を追跡できるようにしてもよい。また、分割画像に含まれる背景やシーン(場面)を学習させ、背景やシーンなどから検索できるようにしてもよい。
また、本実施形態では、顔(対象物)の認識精度を上げるために、顔を正面に向けた正面化顔画像を生成したが、これに限る趣旨ではない。例えば顔を右向きに向けた右向き顔画像や、左に向けた左向き顔画像などを生成し、特徴ベクトルを算出してもよい。もちろん、1姿勢の顔画像を利用して特徴ベクトルを算出するだけでなく、複数姿勢の顔画像(例えば、正面、右向き、左向きの3姿勢の顔画像)を利用して特徴ベクトルを算出してもよい。これにより、顔の認識精度をより高めることが可能となる。
【0054】
C.その他
本明細書において、「部」とは、単に物理的構成を意味するものではなく、その「部」が実行する処理をソフトウェアによって実現する場合も含む。また、1つの「部」や装置が実行する処理を2つ以上の物理的構成や装置により実現されても、2つ以上の「部」や装置が実行する処理を1つの物理的手段や装置により実現されてもよい。
【0055】
本明細書において上述した各処理におけるステップは、処理内容に矛盾を生じない範囲で任意に順番を変更し、または並列に実行することができる。
【符号の説明】
【0056】
1000…クラスタリングシステム、100…ユーザ端末、200…画像分類装置、210…記憶部、220…受付部、230…分割部、240…検出部、250…生成部、260…算出部、270…分類部、280…統合部、290…出力部、P1…制御プログラム、TA1…顔特徴ベクトルテーブル、TA2…仮クラスタ結果テーブル、TA3…仮クラスタテーブル、TA4…マスタ・クラスタ結果テーブル、TA5…マスタ・クラスタテーブル、TA6…マスタ・クラスタ名テーブル、G1…ラベル名設定画面、G2…クラスタリング結果画面。