IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シェンチェン センスタイム テクノロジー カンパニー リミテッドの特許一覧

特表2022-526381画像処理方法及び装置、電子機器並びに記憶媒体
<>
  • 特表-画像処理方法及び装置、電子機器並びに記憶媒体 図1
  • 特表-画像処理方法及び装置、電子機器並びに記憶媒体 図2
  • 特表-画像処理方法及び装置、電子機器並びに記憶媒体 図3
  • 特表-画像処理方法及び装置、電子機器並びに記憶媒体 図4
  • 特表-画像処理方法及び装置、電子機器並びに記憶媒体 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-05-24
(54)【発明の名称】画像処理方法及び装置、電子機器並びに記憶媒体
(51)【国際特許分類】
   G06T 7/00 20170101AFI20220517BHJP
   G06F 16/55 20190101ALI20220517BHJP
   G06F 16/56 20190101ALI20220517BHJP
【FI】
G06T7/00 Z
G06F16/55
G06F16/56
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021558009
(86)(22)【出願日】2020-05-26
(85)【翻訳文提出日】2021-09-29
(86)【国際出願番号】 CN2020092391
(87)【国際公開番号】W WO2021031645
(87)【国際公開日】2021-02-25
(31)【優先権主張番号】201910779555.3
(32)【優先日】2019-08-22
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.SMALLTALK
(71)【出願人】
【識別番号】518209698
【氏名又は名称】シェンチェン センスタイム テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】SHENZHEN SENSETIME TECHNOLOGY CO.,LTD
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100186716
【弁理士】
【氏名又は名称】真能 清志
(72)【発明者】
【氏名】ドウ ハオシュエン
(72)【発明者】
【氏名】シュイ ジン
(72)【発明者】
【氏名】リ クアンリャン
(72)【発明者】
【氏名】ヤン ユフェイ
(72)【発明者】
【氏名】リ ミンミャオ
【テーマコード(参考)】
5B175
5L096
【Fターム(参考)】
5B175DA02
5B175FA03
5L096BA02
5L096CA02
5L096DA02
5L096EA11
5L096GA51
5L096JA11
5L096MA07
(57)【要約】
本開示は、画像処理方法及び装置、電子機器並びに記憶媒体に関する。前記方法は、被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることと、前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することと、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新することと、を含む。本開示の実施例によれば、画像検索の速度及び精度を向上させることができる。
【選択図】図1
【特許請求の範囲】
【請求項1】
被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることと、
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することと、
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新することと、を含むことを特徴とする画像処理方法。
【請求項2】
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記被処理画像の第2のクラスタのクラスタ中心特徴を得ることと、
前記第1の特徴及び前記第2のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第2のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得ることと、
各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、前記第3のクラスタのクラスタ中心特徴を得ることと、
前記第1の特徴及び前記第3のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第3のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することは、
前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することと、
複数の第1の距離のうち最も小さい距離値の距離である第2の距離が距離閾値以下である場合、前記被処理画像の画像クラスタを前記第2の距離に対応する第1のクラスタとして決定することと、を含むことを特徴とする請求項1に記載の方法。
【請求項5】
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することは、
前記第2の距離が前記距離閾値よりも大きい場合、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもないとして決定することを含むことを特徴とする請求項4に記載の方法。
【請求項6】
前記クラスタ中心特徴は、N個(Nは正の整数)のクラスタ中心特徴を含み、
前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することは、
N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得ることと、
前記第1の特徴と前記N個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得することと、
前記N個の第3の距離のうち最も小さいからのK個(Kは正の整数であり、かつK<N)の近似距離に対応するK個のクラスタ中心特徴を決定することと、
前記第1の特徴と前記K個のクラスタ中心特徴との間のK個の第1の距離を決定することと、を含むことを特徴とする請求項4又は5に記載の方法。
【請求項7】
特徴ライブラリにおける各参照画像クラスタの特徴情報に対してそれぞれクラスタ中心抽出を行って、各画像クラスタのクラスタ中心特徴を得ることをさらに含むことを特徴とする請求項1~6のいずれか1項に記載の方法。
【請求項8】
被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることは、
被処理画像に対して特徴抽出を行って、前記被処理画像の第2の特徴を得ることと、
前記第2の特徴を正規化処理して、前記被処理画像の第1の特徴を得ることと、を含むことを特徴とする請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記特徴ライブラリにおける複数の第4のクラスタが同一のオブジェクトに対応する場合、前記複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得ることと、
前記第5のクラスタに対してクラスタ中心抽出を行って、前記第5のクラスタのクラスタ中心特徴を得ることと、
前記第5のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第5のクラスタを複数の参照画像クラスタに追加することと、をさらに含むことを特徴とする請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記特徴ライブラリから前記複数の第4のクラスタのクラスタ中心特徴を削除し、前記複数の参照画像クラスタから前記複数の第4のクラスタを削除することをさらに含むことを特徴とする請求項9に記載の方法。
【請求項11】
被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得るための第1の特徴抽出モジュールと、
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定するためのクラスタ決定モジュールと、
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新するための第1の更新モジュールと、を含むことを特徴とする画像処理装置。
【請求項12】
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記被処理画像の第2のクラスタのクラスタ中心特徴を得るための第2の特徴抽出モジュールと、
前記第1の特徴及び前記第2のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第2のクラスタを前記複数の参照画像クラスタに追加するための第2の更新モジュールと、をさらに含むことを特徴とする請求項11に記載の装置。
【請求項13】
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得るための第1のクラスタリングモジュールと、
各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、前記第3のクラスタのクラスタ中心特徴を得るための第3の特徴抽出モジュールと、
前記第1の特徴及び前記第3のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第3のクラスタを前記複数の参照画像クラスタに追加するための第3の更新モジュールと、をさらに含むことを特徴とする請求項11に記載の装置。
【請求項14】
前記クラスタ決定モジュールは、
前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得するための距離決定サブモジュールと、
複数の第1の距離のうち最も小さい距離値の距離である第2の距離が距離閾値以下である場合、前記被処理画像の画像クラスタを前記第2の距離に対応する第1のクラスタとして決定するための第1のクラスタ決定サブモジュールと、を含むことを特徴とする請求項11に記載の装置。
【請求項15】
前記クラスタ決定モジュールは、
前記第2の距離が前記距離閾値よりも大きい場合、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもないとして決定するための第2のクラスタ決定サブモジュールを含むことを特徴とする請求項14に記載の装置。
【請求項16】
前記クラスタ中心特徴は、N個(Nは正の整数)のクラスタ中心特徴を含み、
前記距離決定サブモジュールは、
N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得て、
前記第1の特徴と前記N個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得し、
前記N個の第3の距離のうち最も小さいからのK個(Kは正の整数であり、かつK<N)の近似距離に対応するK個のクラスタ中心特徴を決定し、
前記第1の特徴と前記K個のクラスタ中心特徴との間のK個の第1の距離を決定することを特徴とする請求項14又は15に記載の装置。
【請求項17】
特徴ライブラリにおける各参照画像クラスタの特徴情報に対してそれぞれクラスタ中心抽出を行って、各画像クラスタのクラスタ中心特徴を得るための第4の特徴抽出モジュールをさらに含むことを特徴とする請求項11~16のいずれか1項に記載の装置。
【請求項18】
前記第1の特徴抽出モジュールは、
被処理画像に対して特徴抽出を行って、前記被処理画像の第2の特徴を得るための特徴抽出サブモジュールと、
前記第2の特徴を正規化処理して、前記被処理画像の第1の特徴を得るための正規化サブモジュールと、を含むことを特徴とする請求項11~17のいずれか1項に記載の装置。
【請求項19】
前記特徴ライブラリにおける複数の第4のクラスタが同一のオブジェクトに対応する場合、前記複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得るための第2のクラスタリングモジュールと、
前記第5のクラスタに対してクラスタ中心抽出を行って、前記第5のクラスタのクラスタ中心特徴を得るための第5の特徴抽出モジュールと、
前記第5のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第5のクラスタを複数の参照画像クラスタに追加するための第4の更新モジュールと、をさらに含むことを特徴とする請求項11~18のいずれか1項に記載の装置。
【請求項20】
前記特徴ライブラリから前記複数の第4のクラスタのクラスタ中心特徴を削除し、前記複数の参照画像クラスタから前記複数の第4のクラスタを削除するための削除モジュールをさらに含むことを特徴とする請求項19に記載の装置。
【請求項21】
プロセッサと、
プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、
前記プロセッサは、請求項1~10のいずれか1項に記載の方法を実行するように構成されることを特徴とする電子機器。
【請求項22】
コンピュータプログラム命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラム命令がプロセッサによって実行されると、請求項1~10のいずれか1項に記載の方法を実現させることを特徴とするコンピュータ読み取り可能な記憶媒体。
【請求項23】
コンピュータ可読コードを含むコンピュータプログラムであって、前記コンピュータ可読コードが電子機器において動作すると、前記電子機器のプロセッサに、請求項1~10のいずれか1項に記載の方法を実現するための命令を実行させることを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
「関連出願の相互参照」
本願は、2019年8月22日に中国特許局に提出された、出願番号が201910779555.3で、発明の名称が「画像処理方法及び装置、電子機器並びに記憶媒体」の中国特許出願の優先権を主張し、その全ての内容は参照により本願に組み込まれる。
【0002】
本開示は、コンピュータ技術の分野に関し、特に画像処理方法及び装置、電子機器並びに記憶媒体に関する。
【背景技術】
【0003】
関連技術の発展に伴い、顔検索は幅広く使用されてきた。特に警察が事件を解決する際には、身元不明の容疑者の画像によって大規模な肖像画データベースから検索する必要がある。一般的に使用される顔検索方法は、被検索画像をデータベースの画像と逐一照合するものである。
【発明の概要】
【0004】
本開示は、画像処理の技術的解決手段を提供する。
【0005】
本開示の一局面によれば、被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることと、前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することと、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新することと、を含む画像処理方法を提供する。
【0006】
本実施例では、被処理画像の第1の特徴及び参照画像クラスタのクラスタ中心特徴に基づいて、被処理画像の画像クラスタを決定することができる。被処理画像が既存の第1のクラスタである場合、第1の特徴及び第1のクラスタの複数の特徴情報に基づいて、第1のクラスタのクラスタ中心特徴を更新し、被処理画像に対するクラスタリングを実現するため、画像検索時にクラスタリングしてから検索し、画像検索の精度及び再現率を向上させることができるとともに、被処理画像とクラスタ中心特徴との照合により検索時の画像照合回数を低減し、画像検索速度を向上させることができる。また、被処理画像の特徴を特徴ライブラリに追加し、各クラスタに対応する画像及び特徴の数を増やして、検索の精度をさらに向上させることができる。
【0007】
可能な一実現形態では、前記方法は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記被処理画像の第2のクラスタのクラスタ中心特徴を得ることと、前記第1の特徴及び前記第2のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第2のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含む。
【0008】
本実施例では、画像クラスタのマッチングに失敗した場合、第1の特徴に基づいて被処理画像に新たな画像クラスタを作成することにより、特徴ライブラリにおける特徴情報及び画像クラスタを新たな画像の増加に伴って更新することができるため、特徴ライブラリにおける特徴情報及び画像クラスタを豊富にし続け、画像検索の精度を向上させることができる。
【0009】
可能な一実現形態では、前記方法は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得ることと、各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、前記第3のクラスタのクラスタ中心特徴を得ることと、前記第1の特徴及び前記第3のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第3のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含む。
【0010】
本実施例では、被処理画像が複数の画像である場合、画像クラスタのマッチングに失敗したときに被処理画像をクラスタリングして、1つ以上の新たな画像クラスタを得ることができるとともに、新たな画像クラスタ及びクラスタ中心特徴を特徴ライブラリに追加することにより、特徴ライブラリにおける特徴情報及び画像クラスタを新たな画像の増加に伴って更新することができるため、特徴ライブラリにおける特徴情報及び画像クラスタを豊富にし続け、画像検索の精度を向上させることができる。
【0011】
可能な一実現形態では、前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することは、前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することと、複数の第1の距離のうち最も小さい距離値の距離である第2の距離が距離閾値以下である場合、前記被処理画像の画像クラスタを前記第2の距離に対応する第1のクラスタとして決定することと、を含む。
【0012】
本実施例では、第2の距離と距離閾値との関係によって被処理画像の画像クラスタを決定するとともに、第2の距離が距離閾値以下である場合、被処理画像の画像クラスタを第2の距離に対応する第1のクラスタとして決定するため、簡単かつ高速であり、画像分類の効率及び精度を向上させることができる。
【0013】
可能な一実現形態では、前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することは、前記第2の距離が前記距離閾値よりも大きい場合、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもないとして決定することを含む。
【0014】
本実施例では、第2の距離が距離閾値よりも大きい場合、被処理画像は特徴ライブラリにおける複数の参照画像クラスタのうちのいずれのクラスタにも該当しないと考えられ、被処理画像に新たな画像クラスタを決定する必要があるため、画像分類の精度を向上させることができる。
【0015】
可能な一実現形態では、前記クラスタ中心特徴は、N個(Nは正の整数)のクラスタ中心特徴を含み、前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することは、N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得ることと、前記第1の特徴と前記N個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得することと、前記N個の第3の距離のうち最も小さいからのK個(Kは正の整数であり、かつK<N)の近似距離に対応するK個のクラスタ中心特徴を決定することと、前記第1の特徴と前記K個のクラスタ中心特徴との間のK個の第1の距離を決定することと、を含む。
【0016】
本実施例では、N個のクラスタ中心特徴に対して量子化と次元低減を行うことにより、N個のクラスタ中心特徴のうちK個のクラスタ中心特徴を用いて第1の距離を計算すると、演算量を低減することができるため、複数の第1の距離の計算効率を向上させることができる。
【0017】
可能な一実現形態では、前記方法は、特徴ライブラリにおける各参照画像クラスタの特徴情報に対してそれぞれクラスタ中心抽出を行って、各画像クラスタのクラスタ中心特徴を得ることをさらに含む。
【0018】
本実施例では、各参照画像クラスタの特徴情報に対してクラスタ中心抽出を行って、各参照画像クラスタのクラスタ中心特徴を得ることにより、クラスタ中心特徴の精度を向上させることができる。
【0019】
可能な一実現形態では、被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることは、被処理画像に対して特徴抽出を行って、前記被処理画像の第2の特徴を得ることと、前記第2の特徴を正規化処理して、前記被処理画像の第1の特徴を得ることと、を含む。
【0020】
本実施例では、被処理画像の第2の特徴を正規化処理し、正規化された特徴値を被処理画像の第1の特徴とし、第1の特徴の特徴値をすべて一定の範囲内にすることにより、計算の複雑さを低減し、計算効率を向上させることができる。
【0021】
可能な一実現形態では、前記方法は、前記特徴ライブラリにおける複数の第4のクラスタが同一のオブジェクトに対応する場合、前記複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得ることと、前記第5のクラスタに対してクラスタ中心抽出を行って、前記第5のクラスタのクラスタ中心特徴を得ることと、前記第5のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第5のクラスタを複数の参照画像クラスタに追加することと、をさらに含む。
【0022】
本実施例では、再クラスタリングによって特徴ライブラリにおける同一のオブジェクトの複数の画像クラスタを結合することにより、画像分類の精度を向上させ、さらに画像検索の精度を向上させることができる。
【0023】
可能な一実現形態では、前記方法は、前記特徴ライブラリから前記複数の第4のクラスタのクラスタ中心特徴を削除し、前記複数の参照画像クラスタから前記複数の第4のクラスタを削除することをさらに含む。
【0024】
本実施例では、特徴ライブラリに存在しないクラスタ中心特徴及び複数の参照画像クラスタに存在しない画像クラスタを削除することにより、画像検索の効率を向上させることができる。
【0025】
本開示の一局面によれば、被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得るための第1の特徴抽出モジュールと、前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定するためのクラスタ決定モジュールと、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新するための第1の更新モジュールと、を含む画像処理装置を提供する。
【0026】
可能な一実現形態では、前記装置は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記被処理画像の第2のクラスタのクラスタ中心特徴を得るための第2の特徴抽出モジュールと、前記第1の特徴及び前記第2のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第2のクラスタを前記複数の参照画像クラスタに追加するための第2の更新モジュールと、をさらに含む。
【0027】
可能な一実現形態では、前記装置は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得るための第1のクラスタリングモジュールと、各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、前記第3のクラスタのクラスタ中心特徴を得るための第3の特徴抽出モジュールと、前記第1の特徴及び前記第3のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第3のクラスタを前記複数の参照画像クラスタに追加するための第3の更新モジュールと、をさらに含む。
【0028】
可能な一実現形態では、前記クラスタ決定モジュールは、前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得するための距離決定サブモジュールと、複数の第1の距離のうち最も小さい距離値の距離である第2の距離が距離閾値以下である場合、前記被処理画像の画像クラスタを前記第2の距離に対応する第1のクラスタとして決定するための第1のクラスタ決定サブモジュールと、を含む。
【0029】
可能な一実現形態では、前記クラスタ決定モジュールは、前記第2の距離が前記距離閾値よりも大きい場合、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもないとして決定するための第2のクラスタ決定サブモジュールを含む。
【0030】
可能な一実現形態では、前記クラスタ中心特徴は、N個(Nは正の整数)のクラスタ中心特徴を含み、前記距離決定サブモジュールは、N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得て、前記第1の特徴と前記N個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得し、前記N個の第3の距離のうち最も小さいからのK個(Kは正の整数であり、かつK<N)の近似距離に対応するK個のクラスタ中心特徴を決定し、前記第1の特徴と前記K個のクラスタ中心特徴との間のK個の第1の距離を決定する。
【0031】
可能な一実現形態では、前記装置は、特徴ライブラリにおける各参照画像クラスタの特徴情報に対してそれぞれクラスタ中心抽出を行って、各画像クラスタのクラスタ中心特徴を得るための第4の特徴抽出モジュールをさらに含む。
【0032】
可能な一実現形態では、前記第1の特徴抽出モジュールは、被処理画像に対して特徴抽出を行って、前記被処理画像の第2の特徴を得るための特徴抽出サブモジュールと、前記第2の特徴を正規化処理して、前記被処理画像の第1の特徴を得るための正規化サブモジュールと、を含む。
【0033】
可能な一実現形態では、前記装置は、前記特徴ライブラリにおける複数の第4のクラスタが同一のオブジェクトに対応する場合、前記複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得るための第2のクラスタリングモジュールと、前記第5のクラスタに対してクラスタ中心抽出を行って、前記第5のクラスタのクラスタ中心特徴を得るための第5の特徴抽出モジュールと、前記第5のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第5のクラスタを複数の参照画像クラスタに追加するための第4の更新モジュールと、をさらに含む。
【0034】
可能な一実現形態では、前記装置は、前記特徴ライブラリから前記複数の第4のクラスタのクラスタ中心特徴を削除し、前記複数の参照画像クラスタから前記複数の第4のクラスタを削除するための削除モジュールをさらに含む。
【0035】
本開示の一局面によれば、プロセッサと、プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、前記プロセッサは、上記画像処理方法を実行するように構成される電子機器を提供する。
【0036】
本開示の一局面によれば、コンピュータプログラム命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラム命令がプロセッサによって実行されると、上記画像処理方法を実現させるコンピュータ読み取り可能な記憶媒体を提供する。
【0037】
本開示の一局面によれば、コンピュータ可読コードを含むコンピュータプログラムであって、前記コンピュータ可読コードが電子機器において動作すると、前記電子機器のプロセッサに、上記画像処理方法を実現するための命令を実行させるコンピュータプログラムを提供する。
【0038】
本開示の実施例では、被処理画像の第1の特徴及び参照画像クラスタのクラスタ中心特徴に基づいて、被処理画像の画像クラスタを決定することができる。被処理画像が既存の第1のクラスタである場合、第1の特徴及び第1のクラスタの複数の特徴情報に基づいて、第1のクラスタのクラスタ中心特徴を更新し、被処理画像に対するクラスタリングを実現するため、画像検索時にクラスタリングしてから検索し、画像検索の精度及び再現率を向上させることができるとともに、被処理画像とクラスタ中心特徴との照合により検索時の画像照合回数を低減し、画像検索速度を向上させることができる。また、被処理画像の特徴を特徴ライブラリに追加し、各クラスタに対応する画像及び特徴の数を増やして、検索の精度をさらに向上させることができる。
【0039】
以上の一般的な説明及び以下の詳細的な説明は、例示的や解釈的なものに過ぎず、本開示を制限するものではないことを理解すべきである。
【0040】
以下、図面を参考しながら例示的な実施例を詳細に説明することによって、本開示の他の特徴及び局面はより分かりやすくなる。
【図面の簡単な説明】
【0041】
ここで、明細書の一部として含まれる図面は、本開示の実施例を示し、明細書と共に本開示の技術的解決手段を説明するものである。
図1】本開示の実施例に係る画像処理方法のフローチャートを示す。
図2】本開示の実施例に係る画像処理方法の応用シーンの模式図を示す。
図3】本開示の実施例に係る画像処理装置のブロック図を示す。
図4】本開示の実施例に係る電子機器のブロック図を示す。
図5】本開示の実施例に係る電子機器のブロック図を示す。
【発明を実施するための形態】
【0042】
以下に図面を参照しながら本開示の様々な例示的な実施例、特徴及び局面を詳細に説明する。図面において、同じ符号が同じまたは類似する機能の要素を示す。図面において実施例の様々な局面を示したが、特に断らない限り、比例に従って図面を描く必要がない。
【0043】
ここの用語「例示的」とは、「例、実施例とするものまたは説明的なもの」を意味する。ここで「例示的」に説明されるいかなる実施例も他の実施例より好ましいまたは優れるものであると理解すべきではない。
【0044】
本明細書において、用語「及び/又は」は、関連対象の関連関係を記述するものに過ぎず、3つの関係が存在可能であることを示し、例えば、A及び/又はBは、Aのみが存在し、AとBの両方が存在し、Bのみが存在するという3つの場合を示すことができる。また、本明細書において、用語「少なくとも1つ」は複数のうちのいずれか1つ又は複数のうちの少なくとも2つの任意の組合を示し、例えば、A、B、Cのうちの少なくとも1つを含むということは、A、B及びCからなる集合から選択されたいずれか1つ又は複数の要素を含むことを示すことができる。
【0045】
また、本開示をより効果的に説明するために、以下の具体的な実施形態において様々な具体的な詳細を示す。当業者であれば、何らかの具体的な詳細がなくても、本開示は同様に実施できるということを理解すべきである。いくつかの実施例では、本開示の趣旨を強調するために、当業者に既知の方法、手段、要素および回路について、詳細な説明を省略する。
【0046】
図1は、本開示の実施例に係る画像処理方法のフローチャートを示す。図1に示すように、前記画像処理方法は、
ステップS11:被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることと、
ステップS12:前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することと、
ステップS13:前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新することと、を含む。。
【0047】
本開示の実施例によれば、被処理画像の第1の特徴及び参照画像クラスタのクラスタ中心特徴に基づいて、被処理画像の画像クラスタを決定することができる。被処理画像が既存の第1のクラスタである場合、第1の特徴及び第1のクラスタの複数の特徴情報に基づいて、第1のクラスタのクラスタ中心特徴を更新し、被処理画像に対するクラスタリングを実現するため、画像検索時にクラスタリングしてから検索し、画像検索の精度及び再現率を向上させることができるとともに、被処理画像とクラスタ中心特徴との照合により検索時の画像照合回数を低減し、画像検索速度を向上させることができる。また、被処理画像の特徴を特徴ライブラリに追加し、各クラスタに対応する画像及び特徴の数を増やして、検索の精度をさらに向上させることができる。
【0048】
可能な一実現形態では、前記画像処理方法は、ユーザ側装置(User Equipment、UE)、携帯機器、ユーザ端末、端末、セルラーホン、コードレス電話、パーソナル・デジタル・アシスタント(Personal Digital Assistant、PDA)、手持ちの機器、計算装置、車載装置、ウエアラブル装置などの端末装置やサーバなどの電子機器により実行されてもよい。前記方法は、プロセッサによりメモリに記憶されているコンピュータ読み取り可能な命令を呼び出すことで実現されてもよいし、サーバによって実行されてもよい。
【0049】
可能な一実現形態では、前記被処理画像は、顔を含む1枚以上の画像又は映像フレームを含むことができる。複数の被処理画像については、顔、時間、場所などの要素に応じて1つ以上のクラスタに分類することができる。クラスタは、被処理画像に対する初期的な分類であり、1つのクラスタは、1つ以上の被処理画像を含むことができる。例えば、同じ人物をそれぞれ異なる時間に複数回画像収集し、収集時間によって、同じ人物の画像を複数のクラスタに分類することができる。
【0050】
可能な一実現形態では、前記画像処理方法を用いて被処理画像をリアルタイムまたは定期的に処理することができる。例えば、1日または週に1回の画像処理を行ってもよいし、一定数の被処理画像を収集した後に画像処理を開始してもよいし、画像検索を行う前に、画像処理を行ってもよい。本開示では、画像処理の開始タイミングは限定されない。
【0051】
可能な一実現形態では、ステップS11において、被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることができる。第1の特徴は、被処理画像の1つ以上の特徴情報を含むことができ、例えば、第1の特徴は、顔の複数の特徴情報を含むことができる。被処理画像が複数枚の画像である場合、第1の特徴は、複数枚の画像の複数の特徴情報を含むことができる。被処理画像に対して特徴抽出を行った後、抽出された特徴情報をその第1の特徴とすることができる。本開示では、特徴抽出の形態は限定されない。
【0052】
可能な一実現形態では、ステップS11は、被処理画像に対して特徴抽出を行って、前記被処理画像の第2の特徴を得ることと、前記第2の特徴を正規化処理して、前記被処理画像の第1の特徴を得ることと、を含むことができる。正規化処理は、特徴情報を正規化して、特徴値を一定の範囲内に統一することができる。正規化処理は例えば、正則化処理を含むことができる。本開示では、正規化処理の具体的な形態は限定されない。
【0053】
被処理画像の第2の特徴を正規化処理し、正規化された特徴値を被処理画像の第1の特徴として、第1の特徴の特徴値をすべて一定の範囲内にすることにより、計算の複雑さを低減し、計算効率を向上させることができる。
【0054】
可能な一実現形態では、被処理画像の第1の特徴を得た後、ステップS12において、前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することができる。
【0055】
参照画像クラスタは、特徴ライブラリにおける分類された画像クラスタであってもよく、1つの画像クラスタは、ある種類の画像の集合、例えば、同じ人物の画像の集合であってもよい。
【0056】
各参照画像クラスタに対して、そのクラスタ中心特徴を決定することができる。様々なクラスタリングアルゴリズム(例えば、K平均法、平均値シフト法、階層型クラスタリング法など)のクラスタ中心決定形態を用いて参照画像クラスタのクラスタ中心特徴を決定することができる。クラスタリングアルゴリズムが異なる場合、その対応するクラスタ中心特徴の計算方法も異なる。当業者は実際の状況に応じて、クラスタ中心特徴の決定形態を決定することができる。本開示では、これについて限定されない。
【0057】
複数の参照画像クラスタのクラスタ中心特徴を決定した後、被処理画像の第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、被処理画像の画像クラスタを決定することができる。すなわち、被処理画像の第1の特徴を複数の参照画像クラスタのクラスタ中心特徴と照合して、被処理画像の画像クラスタを決定することができる。例えば、K平均法を用いる場合、被処理画像の第1の特徴と複数の参照画像クラスタのクラスタ中心特徴との距離をそれぞれ計算し、当該距離に基づいて被処理画像の画像クラスタを決定することができる。
【0058】
可能な一実現形態では、ステップS12の前に、前記方法は、特徴ライブラリにおける各参照画像クラスタの特徴情報に対してそれぞれクラスタ中心抽出を行って、各画像クラスタのクラスタ中心特徴を得ることをさらに含むことができる。すなわち、特徴ライブラリにおける各参照画像クラスタについては、その特徴情報に対してクラスタ中心抽出をそれぞれ行って、抽出された特徴情報を各参照画像クラスタのクラスタ中心特徴とすることができる。クラスタリングアルゴリズムによってクラスタ中心の抽出形態を決定することができる。例えば、K平均法を用いてクラスタ中心抽出を行う場合、参照画像クラスタにおける各画像の特徴情報を決定し、各特徴情報間の距離(例えば、ユークリッド距離)を計算した後、各距離の平均値を決定し、当該平均値に対応する特徴情報を参照画像クラスタのクラスタ中心特徴として決定することができる。本開示では、クラスタ中心抽出の形態は限定されない。
【0059】
本実施例では、各参照画像クラスタの特徴情報に対してクラスタ中心抽出を行って、各参照画像クラスタのクラスタ中心特徴を得ることにより、クラスタ中心特徴の精度を向上させることができる。
【0060】
可能な一実現形態では、ステップS12は、前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することと、複数の第1の距離のうち最も小さい距離値の距離である第2の距離が距離閾値以下である場合、前記被処理画像の画像クラスタを前記第2の距離に対応する第1のクラスタとして決定することと、を含むことができる。距離閾値は予め設定することができる。本開示では、距離閾値の取り得る値は限定されない。
【0061】
可能な一実現形態では、被処理画像の第1の特徴と複数のクラスタ中心特徴との間の距離をそれぞれ計算して、複数の第1の距離を得ることができる。複数の第1の距離のうち、最も小さい距離値の距離である第1の距離を第2の距離とする。その後、第2の距離と予め設定された距離閾値との関係を判断する。第2の距離が距離閾値以下である場合、被処理画像の画像クラスタを第2の距離に対応する第1のクラスタとして決定することができる。
【0062】
本実施例では、第2の距離と距離閾値との関係によって被処理画像の画像クラスタを決定し、第2の距離が距離閾値以下である場合、被処理画像の画像クラスタを第2の距離に対応する第1のクラスタとして決定するため、簡単かつ高速であり、画像分類の効率及び精度を向上させることができる。
【0063】
可能な一実現形態では、前記クラスタ中心特徴は、N個(Nは正の整数)のクラスタ中心特徴を含み、前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することは、N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得ることと、前記第1の特徴と前記N個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得することと、前記N個の第3の距離のうち最も小さいからのK個(Kは正の整数であり、かつK<N)の第3の距離に対応するK個のクラスタ中心特徴を決定することと、前記第1の特徴と前記K個のクラスタ中心特徴との間のK個の第1の距離を決定することと、を含む。
【0064】
可能な一実現形態では、N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得ることができる。例えば、Faiss(Facebook AI Similarity Search、Facebookによって提供されるオープンソース類似性検索ライブラリ)におけるIVFADCアルゴリズムを用いてN個のクラスタ中心特徴を量子化処理することができる。IVFADCアルゴリズムは、粗量子化器(例えば、K平均法)と、直積量子化器とを含む。まず、粗量子化器(例えば、K平均法)を用いてN個のクラスタ中心特徴を粗量子化し、N個のクラスタ中心特徴をPグループ(Pは正の整数であり、P<Nである)に分け、各グループの量子化の中心、及びグループ内の各ベクトルと量子化の中心との残差ベクトルをそれぞれ計算し、その後、直積量子化器を用いて各残差ベクトルを直積量子化し、D次元残差ベクトルを次元に沿ってM(D、Mはいずれも、正の整数であり、M<Dである)個のサブベクトルに分けるとともに、1個のサブベクトルを粗量子化し、D次元残差ベクトルをM次元に圧縮することにより、N個のクラスタ中心特徴に対応するN個のM次元特徴ベクトルを得る。
【0065】
可能な一実現形態では、第1の特徴とN個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得することができる。例えば、非対称距離を用いて第1の特徴とN個の特徴ベクトルとの間のN個の第3の距離を計算することができる。第3の距離は、近似距離(例えば、近似ユークリッド距離)である。
【0066】
可能な一実現形態では、下記式(1)を用いて第3の距離を計算することができる。
【数1】
式(1)では、xは第1の特徴を表し、yはクラスタ中心特徴を表し、qは量子化処理を表し、qは粗量子化器を表し、q(y)は粗量子化器の量子化結果(量子化の中心)を表し、qは直積量子化器を表し、q(y-q(y))は直積量子化の結果を表し、その入力であるy-q(y)はyと量子化の中心との残差を表す。
【0067】
可能な一実現形態では、N個の第3の距離から最も小さいからのK個の第3の距離を選択し、K個の第3の距離に対応するK個のクラスタ中心特徴を決定することができる。K個のクラスタ中心特徴については、第1の特徴と各クラスタ中心特徴の正確な距離(例えば、内積距離)をそれぞれ計算し、計算結果を第1の特徴とK個のクラスタ中心特徴との間のK個の第1の距離とすることができる。
【0068】
N個のクラスタ中心特徴に対して量子化と次元低減を行うことにより、N個のクラスタ中心特徴のうちのK個のクラスタ中心特徴を用いて第1の距離を計算すると、演算量を低減することができるため、複数の第1の距離の計算効率を向上させることができる。
【0069】
可能な一実現形態では、ステップS12は、前記第2の距離が前記距離閾値よりも大きい場合、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもないとして決定することを含むことができる。すなわち、第2の距離が距離閾値よりも大きい場合、被処理画像は特徴ライブラリにおける複数の参照画像クラスタのうちのいずれのクラスタにも該当しないと考えられ、被処理画像に新たな画像クラスタを決定する必要があるため、画像分類の精度を向上させることができる。
【0070】
可能な一実現形態では、ステップS13において、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新することができる。例えば、K平均法を用いて第1のクラスタのクラスタ中心特徴を更新するとき、第1の特徴を新たな特徴情報として第1のクラスタに追加し、第1のクラスタにおける各特徴情報間の距離をそれぞれ計算し、各距離の平均値を決定し、当該平均値に対応する特徴情報を用いて第1のクラスタのクラスタ中心特徴を更新することができる。また、他のクラスタリングアルゴリズムを用いて第1のクラスタのクラスタ中心特徴を更新することができるが、本開示では、これについて限定されない。このような形態により、特徴ライブラリにおける参照画像クラスタのクラスタ中心特徴を新たな画像の追加時に更新することができる。
【0071】
可能な一実現形態では、前記方法は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記被処理画像の第2のクラスタのクラスタ中心特徴を得ることと、前記第1の特徴及び前記第2のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第2のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含むことができる。
【0072】
可能な一実現形態では、被処理画像が1枚の画像であり、かつ被処理画像の画像クラスタが複数の参照画像クラスタのうちのいずれのクラスタにも該当しない場合、クラスタのない被処理画像を新たなクラスタである第2のクラスタにクラスタリングすることができる。この場合、被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記第2のクラスタのクラスタ中心特徴を得ることができる。クラスタ中心の抽出形態は上述したものと類似するので、ここで詳細な説明を省略する。
【0073】
可能な一実現形態では、第2のクラスタのクラスタ中心特徴を決定した後、第1の特徴及び第2のクラスタのクラスタ中心特徴を特徴ライブラリに追加し、第2のクラスタを複数の参照画像クラスタに追加することにより、新たに追加された特徴情報及び画像クラスタを特徴ライブラリにタイムリーに更新することができる。
【0074】
本実施例では、画像クラスタのマッチングに失敗した場合、第1の特徴に基づいて被処理画像に新たな画像クラスタを作成することにより、特徴ライブラリにおける特徴情報及び画像クラスタを新たな画像の増加に伴って更新することができるため、特徴ライブラリにおける特徴情報及び画像クラスタを豊富にし続け、画像検索の精度を向上させることができる。
【0075】
可能な一実現形態では、前記方法は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得ることと、各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、前記第3のクラスタのクラスタ中心特徴を得ることと、前記第1の特徴及び前記第3のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第3のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含むことができる。
【0076】
例えば、被処理画像が複数枚の画像であり、かつ被処理画像の画像クラスタが複数の参照画像クラスタのうちのいずれのクラスタにも該当しない場合、被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得ることができる。被処理画像が1つのオブジェクトの複数枚の画像である場合、クラスタリングを行った後、1つの第3のクラスタを得る可能性がある。被処理画像が複数のオブジェクトの複数枚の画像である場合、クラスタリングを行った後、複数の第3のクラスタを得る可能性がある。
【0077】
例えば、1つの被処理画像の第1の特徴に基づいて、他の複数の被処理画像の中で検索(例えば、Faissによって検索)して、前のK個の類似度結果を得ることができる。K個の類似度結果については、アフィニティマップを作成することにより、リンクフラックスを探してクラスタリングを決定するか、またはDFS(Deep First Search、深さ優先探索)再帰染色によってクラスタリングを決定することができる。染色するかどうかは、類似度の閾値に基づいて決定することができる。例えば、類似度の閾値が0.7である場合、類似度の閾値よりも大きい類似度結果を染色する一方、類似度の閾値よりも小さい類似度結果をスキップする。また、他のクラスタリングアルゴリズムを用いて被処理画像をクラスタリングすることもできることを理解すべきである。本開示では、これについて限定されない。
【0078】
可能な一実現形態では、被処理画像をクラスタリングして1つ以上の第3のクラスタを得た後、各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、第3のクラスタのクラスタ中心特徴を得ることができる。被処理画像の第1の特徴及び第3のクラスタのクラスタ中心特徴を特徴ライブラリに追加し、第3のクラスタを複数の参照画像クラスタに追加することにより、新たに追加された特徴情報及び画像クラスタを特徴ライブラリにタイムリーに更新することができる。クラスタ中心の抽出形態は上述したものと類似するため、ここで詳細な説明を省略する。
【0079】
本実施例では、被処理画像が複数の画像である場合、画像クラスタのマッチングに失敗したときに被処理画像をクラスタリングして、1つ以上の新たな画像クラスタを得ることができるとともに、新たな画像クラスタ及びクラスタ中心特徴を特徴ライブラリに追加することにより、特徴ライブラリにおける特徴情報及び画像クラスタを新たな画像の増加に伴って更新することができるため、特徴ライブラリにおける特徴情報及び画像クラスタを豊富にし続け、画像検索の精度を向上させることができる。
【0080】
可能な一実現形態では、前記方法は、前記特徴ライブラリにおける複数の第4のクラスタが同一のオブジェクトに対応する場合、前記複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得ることと、前記第5のクラスタに対してクラスタ中心抽出を行って、前記第5のクラスタのクラスタ中心特徴を得ることと、前記第5のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第5のクラスタを複数の参照画像クラスタに追加することと、をさらに含む。
【0081】
複数の第4のクラスタが同一のオブジェクトに対応するとは、同一のオブジェクト(例えば、同じ人物の顔)について、特徴ライブラリに複数の画像クラスタ、すなわち、第4のクラスタを有することを意味する。この場合、複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得ることができる。すなわち、同一のオブジェクトの複数の画像クラスタを再クラスタリングして1つの画像クラスタに結合する。
【0082】
第5のクラスタを得た後、第5のクラスタに対してクラスタ中心抽出を行って、第5のクラスタのクラスタ中心特徴を得るとともに、第5のクラスタのクラスタ中心特徴を特徴ライブラリに追加し、第5のクラスタを複数の参照画像に追加することができる。
【0083】
本実施例では、再クラスタリングにより特徴ライブラリにおける同一のオブジェクトの複数の画像クラスタを結合することができるため、画像分類の精度が向上され、さらに画像検索の精度が向上される。
【0084】
可能な一実現形態では、前記方法は、前記特徴ライブラリから前記複数の第4のクラスタのクラスタ中心特徴を削除し、前記複数の参照画像クラスタから前記複数の第4のクラスタを削除することをさらに含む。
【0085】
すなわち、第5のクラスタに再クラスタリングされた複数の第4のクラスタのクラスタ中心特徴を特徴ライブラリから削除し、複数の第4のクラスタを複数の参照画像クラスタから削除することができる。このような形態により、特徴ライブラリに存在しないクラスタ中心特徴及び複数の参照画像クラスタに存在しない画像クラスタをタイムリーに削除することができるため、画像検索の効率が向上される。
【0086】
図2は、本開示の実施例に係る画像処理方法の応用シーンの模式図を示す。図2に示すように、被処理画像21に対して、まず、特徴抽出を行って、その第1の特徴22を得ることができる。その後、第1の特徴22及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴23に基づいて、類似性検索ライブラリ29(すなわち、Faiss)におけるアルゴリズムによって被処理画像の画像クラスタ24を決定することができる。被処理画像21の画像クラスタ24が複数の参照画像クラスタのうちの第1のクラスタ26である場合、第1の特徴22及び第1のクラスタ26の特徴ライブラリにおける複数の特徴情報に基づいて、第1のクラスタ26のクラスタ中心特徴を更新することができる。被処理画像21の画像クラスタ24が無クラスタ25である場合、類似性検索ライブラリ29(すなわち、Faiss)におけるアルゴリズムにより被処理画像21をクラスタリング27し、クラスタリング結果に基づいて、新たな画像クラスタ28を決定し、第1の特徴及び新たな画像クラスタ28のクラスタ中心特徴を特徴ライブラリに追加し、新たな画像クラスタ28を複数の参照画像クラスタに追加することができる。
【0087】
本開示の実施例に係る画像処理方法によれば、被処理画像の特徴情報及び特徴ライブラリにおけるクラスタ中心特徴に基づいて、被処理画像の画像クラスタを決定し、特徴ライブラリ及び画像クラスタを更新して、被処理画像に対するクラスタリングを実現することができる。これにより、画像検索、特に顔検索の検索速度及び再現率を向上させるだけでなく、人物のプロファイルを自動的に生成して、画像利用率を向上させることができる。
【0088】
画像検索を行う前に、被処理画像をクラスタリングすることにより、画像検索、特に顔検索の検索速度及び再現率を向上させることができる。例えば、顔検索は、警察が事件を解決する重要なシーンであり、身元不明の容疑者の画像によって大規模な肖像画データベースから検索して容疑者の身元などの一連の情報を決定する必要がある。検索する前に、容疑者の画像に対して画像処理を行って、その画像クラスタを決定(クラスタリング)することができる。検索時に、容疑者画像とクラスタ中心特徴との照合により、検索速度及び再現率を向上させることができるため、より正確な容疑者情報をより迅速に返すことができ、警察が容疑者情報をより迅速に特定して事件を解決することに寄与する。
【0089】
本開示の実施例に係る画像処理方法によれば、被処理画像に対するクラスタリングを実現して、人物のプロファイルを自動的に生成することにより、画像の利用率を向上させることができる。例えば、公安情報システムに、大量のスナップ写真があるが、これらのスナップ写真に対して画像処理を行った後、スナップ写真を人的次元でクラスタリングして、大量でばらばらの写真の統合を実現することができるため、システムで同じ人物に関するすべてのスナップ写真を見ることができ、該人物の軌跡を形成し、ビッグデータ分析を実現し、事件状況の研究判断に寄与する。
【0090】
本開示の実施例に係る画像処理方法によれば、クラスタリングにより画像システムの自動反復を実現することができる。新たに追加され続ける被処理画像に対して、クラスタリングを行うたびに、画像クラスタ及びそのクラスタ中心を更新することができるため、システムは増分的にトレーニングされ続け、正のフィードバックループが形成され、システム能力が向上される。
【0091】
本開示で言及される上記各方法の実施例は、原理と論理に違反しない限り、相互に組み合わせて実施例を形成することができることが理解すべきである。紙数に限りがあるので、本開示では詳細な説明を省略する。
【0092】
さらに、本開示では、画像処理装置、電子機器、コンピュータ読み取り可能な記憶媒体、プログラムが提供される。これらはいずれも本開示に係る画像処理方法のいずれか1つを実現するために利用できる。対応する技術的解決手段と説明は、方法の対応する記載を参照すればよく、詳細な説明を省略する。
【0093】
また、当業者であれば、具体的な実施形態に係る上記の方法では、各ステップの記載順序は、実行順序を厳密に限定して実施の手順を限定するものではなく、各ステップの実行順序がその機能と内部の論理によって具体的に決定されることが理解すべきである。
【0094】
図3は、本開示の実施例に係る画像処理装置のブロック図を示す。図3に示すように、前記画像処理装置は、
被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得るための第1の特徴抽出モジュール31と、
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定するためのクラスタ決定モジュール32と、
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新するための第1の更新モジュール33と、を含む。
【0095】
可能な一実現形態では、前記装置は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記被処理画像の第2のクラスタのクラスタ中心特徴を得るための第2の特徴抽出モジュールと、前記第1の特徴及び前記第2のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第2のクラスタを前記複数の参照画像クラスタに追加するための第2の更新モジュールと、をさらに含む。
【0096】
可能な一実現形態では、前記装置は、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得るための第1のクラスタリングモジュールと、各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、前記第3のクラスタのクラスタ中心特徴を得るための第3の特徴抽出モジュールと、前記第1の特徴及び前記第3のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第3のクラスタを前記複数の参照画像クラスタに追加するための第3の更新モジュールと、をさらに含む。
【0097】
可能な一実現形態では、前記クラスタ決定モジュール32は、前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得するための距離決定サブモジュールと、複数の第1の距離のうち最も小さい距離値の距離である第2の距離が距離閾値以下である場合、前記被処理画像の画像クラスタを前記第2の距離に対応する第1のクラスタとして決定するための第1のクラスタ決定サブモジュールと、を含む。
【0098】
可能な一実現形態では、前記クラスタ決定モジュール32は、前記第2の距離が前記距離閾値よりも大きい場合、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもないとして決定するための第2のクラスタ決定サブモジュールを含む。
【0099】
可能な一実現形態では、前記クラスタ中心特徴は、N個(Nは正の整数)のクラスタ中心特徴を含み、前記距離決定サブモジュールは、N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得て、前記第1の特徴と前記N個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得し、前記N個の第3の距離のうち最も小さいからのK個(Kは正の整数であり、かつK<N)の近似距離に対応するK個のクラスタ中心特徴を決定し、前記第1の特徴と前記K個のクラスタ中心特徴との間のK個の第1の距離を決定する。
【0100】
可能な一実現形態では、前記装置は、特徴ライブラリにおける各参照画像クラスタの特徴情報に対してそれぞれクラスタ中心抽出を行って、各画像クラスタのクラスタ中心特徴を得るための第4の特徴抽出モジュールをさらに含む。
【0101】
可能な一実現形態では、前記第1の特徴抽出モジュール31は、被処理画像に対して特徴抽出を行って、前記被処理画像の第2の特徴を得るための特徴抽出サブモジュールと、前記第2の特徴を正規化処理して、前記被処理画像の第1の特徴を得るための正規化サブモジュールと、を含む。
【0102】
可能な一実現形態では、前記装置は、前記特徴ライブラリにおける複数の第4のクラスタが同一のオブジェクトに対応する場合、前記複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得るための第2のクラスタリングモジュールと、前記第5のクラスタに対してクラスタ中心抽出を行って、前記第5のクラスタのクラスタ中心特徴を得るための第5の特徴抽出モジュールと、前記第5のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第5のクラスタを複数の参照画像クラスタに追加するための第4の更新モジュールと、をさらに含む。
【0103】
可能な一実現形態では、前記装置は、前記特徴ライブラリから前記複数の第4のクラスタのクラスタ中心特徴を削除し、前記複数の参照画像クラスタから前記複数の第4のクラスタを削除するための削除モジュールをさらに含む。
【0104】
いくつかの実施例では、本開示の実施例に係る装置が備える機能又はモジュールは、上述した方法の実施例に説明される方法を実行するために利用でき、その具体的な実現について、上述した方法の実施例の説明を参照すればよく、簡素化のために、ここで詳細な説明を省略する。
【0105】
本開示の実施例では、コンピュータプログラム命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラム命令がプロセッサによって実行されると、上記方法を実現させるコンピュータ読み取り可能な記憶媒体をさらに提供する。コンピュータ読み取り可能な記憶媒体は、不揮発性のコンピュータ読み取り可能な記憶媒体であってもよく、揮発性のコンピュータ読み取り可能な記憶媒体であってもよい。
【0106】
本開示の実施例では、プロセッサと、プロセッサにより実行可能な命令を記憶するメモリと、を含み、前記プロセッサは、上記の方法を実行するように構成される電子機器をさらに提供する。
【0107】
本開示の実施例では、コンピュータ可読コードを含むコンピュータプログラム製品であって、前記コンピュータ可読コードが電子機器において動作すると、前記電子機器のプロセッサに、上記いずれかの実施例に係る画像処理方法を実現するための命令を実行させるコンピュータプログラム製品をさらに提供する。
【0108】
電子機器は、端末、サーバ又は他の形態の機器として提供されてもよい。
【0109】
図4は、本開示の実施例に係る電子機器800のブロック図を示す。例えば、電子機器800は、携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット装置、医療機器、フィットネス器具、パーソナル・デジタル・アシスタントなどの端末であってよい。
【0110】
図4を参照すると、電子機器800は処理コンポーネント802、メモリ804、電源コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)インターフェイス812、センサコンポーネント814、および通信コンポーネント816のうちの一つ以上を含んでもよい。
【0111】
処理コンポーネント802は通常、電子機器800の全体的な動作、例えば表示、電話の呼び出し、データ通信、カメラ動作および記録動作に関連する動作を制御する。処理コンポーネント802は、命令を実行して上記方法の全てまたは一部のステップを実行するための一つ以上のプロセッサ820を含んでもよい。また、処理コンポーネント802は、他のコンポーネントとのインタラクションための一つ以上のモジュールを含んでもよい。例えば、処理コンポーネント802は、マルチメディアコンポーネント808とのインタラクションのために、マルチメディアモジュールを含んでもよい。
【0112】
メモリ804は電子機器800での動作をサポートするための様々なタイプのデータを記憶するように構成される。これらのデータは、例として、電子機器800において操作するためのあらゆるアプリケーションプログラムまたは方法の命令、連絡先データ、電話帳データ、メッセージ、ピクチャー、ビデオなどを含む。メモリ804は、例えば静的ランダムアクセスメモリ(SRAM)、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなどのあらゆるタイプの揮発性または不揮発性記憶装置またはそれらの組み合わせによって実現できる。
【0113】
電源コンポーネント806は電子機器800の各コンポーネントに電力を供給する。電源コンポーネント806は電源管理システム、一つ以上の電源、および電子機器800のための電力生成、管理および配分に関連する他のコンポーネントを含んでもよい。
【0114】
マルチメディアコンポーネント808は前記電子機器800とユーザとの間で出力インターフェイスを提供するスクリーンを含む。いくつかの実施例では、スクリーンは液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでもよい。スクリーンがタッチパネルを含む場合、ユーザからの入力信号を受信するために、タッチスクリーンとして実現してもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャを検知するために、一つ以上のタッチセンサを含む。前記タッチセンサはタッチまたはスライド動きの境界を検知するのみならず、前記タッチまたはスライド操作に関連する持続時間および圧力を検出するようにしてもよい。いくつかの実施例では、マルチメディアコンポーネント808は前面カメラおよび/または後面カメラを含む。電子機器800が動作モード、例えば撮影モードまたは撮像モードになる場合、前面カメラおよび/または後面カメラは外部のマルチメディアデータを受信するようにしてもよい。各前面カメラおよび後面カメラは固定された光学レンズ系、または焦点距離および光学ズーム能力を有するものであってもよい。
【0115】
オーディオコンポーネント810はオーディオ信号を出力および/または入力するように構成される。例えば、オーディオコンポーネント810は、マイク(MIC)を含み、マイク(MIC)は電子機器800が動作モード、例えば呼び出しモード、記録モードおよび音声認識モードになる場合、外部のオーディオ信号を受信するように構成される。受信されたオーディオ信号はさらにメモリ804に記憶されるか、または通信コンポーネント816によって送信されてもよい。いくつかの実施例では、オーディオコンポーネント810はさらに、オーディオ信号を出力するためのスピーカーを含む。
【0116】
I/Oインターフェイス812は処理コンポーネント802と周辺インターフェイスモジュールとの間でインターフェイスを提供し、上記周辺インターフェイスモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンはホームボタン、音量ボタン、スタートボタンおよびロックボタンを含んでもよいが、これらに限定されない。
【0117】
センサコンポーネント814は電子機器800の各面での状態評価のために一つ以上のセンサを含む。例えば、センサコンポーネント814は電子機器800のオン/オフ状態、例えば電子機器800の表示装置およびキーパッドであるコンポーネントの相対的位置決めを検出でき、センサコンポーネント814はさらに、電子機器800または電子機器800のあるコンポーネントの位置の変化、ユーザと電子機器800との接触の有無、電子機器800の方位または加減速および電子機器800の温度変化を検出できる。センサコンポーネント814は、いかなる物理的接触もない場合に近傍の物体の存在を検出するように構成された近接センサを含んでもよい。センサコンポーネント814はさらに、CMOSまたはCCDイメージセンサのような、イメージングアプリケーションにおいて使用するための光センサを含んでもよい。いくつかの実施例では、該センサコンポーネント814はさらに、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサを含んでもよい。
【0118】
通信コンポーネント816は電子機器800と他の機器との有線または無線通信を実現するように配置される。電子機器800は通信規格に基づく無線ネットワーク、例えばWiFi、2Gまたは3G、またはそれらの組み合わせにアクセスできる。一例示的実施例では、通信コンポーネント816は放送チャネルによって外部の放送管理システムからの放送信号または放送関連情報を受信する。一例示的実施例では、前記通信コンポーネント816はさらに、近距離通信を促進させるために、近距離無線通信(NFC)モジュールを含む。例えば、NFCモジュールは無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標/BT)技術および他の技術によって実現できる。
【0119】
例示的な実施例では、電子機器800は一つ以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子要素によって実現され、上記方法を実行するために用いられることができる。
【0120】
例示的な実施例では、さらに、不揮発性のコンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ804が提供され、上記コンピュータプログラム命令は電子機器800のプロセッサ820によって実行されると、上記方法を実行させることができる。
【0121】
図5は、本開示の実施例に係る電子機器1900のブロック図を示す。例えば、電子機器1900はサーバとして提供されてもよい。図5を参照すると、電子機器1900は、一つ以上のプロセッサを含む処理コンポーネント1922、および、処理コンポーネント1922によって実行可能な命令、例えばアプリケーションプログラムを記憶するための、メモリ1932を代表とするメモリ資源を含む。メモリ1932に記憶されたアプリケーションプログラムはそれぞれが1つの命令群に対応する一つ以上のモジュールを含んでもよい。また、処理コンポーネント1922は命令を実行することによって上記方法を実行するように構成される。
【0122】
電子機器1900はさらに、電子機器1900の電源管理を実行するように構成された電源コンポーネント1926、電子機器1900をネットワークに接続するように構成された有線または無線ネットワークインターフェイス1950、および入出力(I/O)インターフェイス1958を含んでもよい。電子機器1900はメモリ1932に記憶されたオペレーティングシステム、例えばWindows(登録商標) ServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTMまたは類似するものに基づいて動作できる。
【0123】
例示的な実施例では、さらに、不揮発性のコンピュータ読み取り可能な記憶媒体、例えばコンピュータプログラム命令を含むメモリ1932が提供され、上記コンピュータプログラム命令は、電子機器1900の処理コンポーネント1922によって実行されると、上記方法を実行させることができる。
【0124】
本開示はシステム、方法および/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品はプロセッサに本開示の各方面を実現させるためのコンピュータ読み取り可能なプログラム命令が有しているコンピュータ読み取り可能な記憶媒体を含んでもよい。
【0125】
コンピュータ読み取り可能な記憶媒体は命令実行装置により使用される命令を保存および記憶可能な有形装置であってもよい。コンピュータ読み取り可能な記憶媒体は例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置または上記の任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能な記憶媒体のさらに具体的な例(非網羅的リスト)としては、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、静的ランダムアクセスメモリ(SRAM)、携帯型コンパクトディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、例えば命令が記憶されているせん孔カードまたはスロット内突起構造のような機械的符号化装置、および上記の任意の適当な組み合わせを含む。ここで使用されるコンピュータ読み取り可能な記憶媒体は瞬時信号自体、例えば無線電波または他の自由に伝播される電磁波、導波路または他の伝送媒体を経由して伝播される電磁波(例えば、光ファイバーケーブルを通過するパルス光)、または電線を経由して伝送される電気信号と解釈されるものではない。
【0126】
ここで記述したコンピュータ読み取り可能なプログラム命令はコンピュータ読み取り可能な記憶媒体から各計算/処理機器にダウンロードされてもよいし、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、広域ネットワークおよび/または無線ネットワークによって外部のコンピュータまたは外部記憶装置にダウンロードされてもよい。ネットワークは銅伝送ケーブル、光ファイバー伝送、無線伝送、ルーター、ファイアウォール、交換機、ゲートウェイコンピュータおよび/またはエッジサーバを含んでもよい。各計算/処理機器内のネットワークアダプタカードまたはネットワークインターフェイスはネットワークからコンピュータ読み取り可能なプログラム命令を受信し、該コンピュータ読み取り可能なプログラム命令を転送し、各計算/処理機器内のコンピュータ読み取り可能な記憶媒体に記憶させる。
【0127】
本開示の動作を実行するためのコンピュータプログラム命令はアセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、C++などのオブジェクト指向プログラミング言語、および「C」言語または類似するプログラミング言語などの一般的な手続き型プログラミング言語を含む一つ以上のプログラミング言語の任意の組み合わせで書かれたソースコードまたは目標コードであってもよい。コンピュータ読み取り可能なプログラム命令は、完全にユーザのコンピュータにおいて実行されてもよく、部分的にユーザのコンピュータにおいて実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて実行されてもよく、または完全にリモートコンピュータもしくはサーバにおいて実行されてもよい。リモートコンピュータに関与する場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含む任意の種類のネットワークを経由してユーザのコンピュータに接続されてもよく、または、(例えばインターネットサービスプロバイダを利用してインターネットを経由して)外部コンピュータに接続されてもよい。いくつかの実施例では、コンピュータ読み取り可能なプログラム命令の状態情報を利用して、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)またはプログラマブル論理アレイ(PLA)などの電子回路をパーソナライズし、該電子回路によりコンピュータ読み取り可能なプログラム命令を実行することにより、本開示の各方面を実現するようにしてもよい。
【0128】
ここで本開示の実施例に係る方法、装置(システム)およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照しながら本開示の各方面を説明したが、フローチャートおよび/またはブロック図の各ブロックおよびフローチャートおよび/またはブロック図の各ブロックの組み合わせは、いずれもコンピュータ読み取り可能なプログラム命令によって実現できることが理解すべきである。
【0129】
これらのコンピュータ読み取り可能なプログラム命令は、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサへ提供されて、これらの命令がコンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行されると、フローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作を実現するように機械を製造してもよい。また、これらのコンピュータ読み取り可能なプログラム命令は、コンピュータ読み取り可能な記憶媒体に記憶し、コンピュータ、プログラマブルデータ処理装置および/または他の機器を特定の方式で動作させるようにしてもよい。命令を記憶しているコンピュータ読み取り可能な記憶媒体には、フローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作の各方面を実現するための命令を有する製品を含む。
【0130】
コンピュータ読み取り可能なプログラム命令は、コンピュータ、他のプログラマブルデータ処理装置、または他の機器にロードし、コンピュータ、他のプログラマブルデータ処理装置または他の機器において一連の動作ステップを実行させることにより、コンピュータにより実施されるプロセスを生成し、コンピュータ、他のプログラマブルデータ処理装置、または他の機器において実行される命令によりフローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作を実現する。
【0131】
図面のうちフローチャートおよびブロック図は本開示の複数の実施例に係るシステム、方法およびコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能および動作を示す。この点では、フローチャートまたはブロック図における各ブロックは一つのモジュール、プログラムセグメントまたは命令の一部分を代表することができ、前記モジュール、プログラムセグメントまたは命令の一部分は指定された論理機能を実現するための一つ以上の実行可能命令を含む。いくつかの代替としての実現形態では、ブロックに表記される機能は図面に付した順序と異なって実現してもよい。例えば、二つの連続的なブロックは実質的に同時に実行してもよく、また、係る機能によって、逆な順序で実行してもよい場合がある。なお、ブロック図および/またはフローチャートにおける各ブロック、およびブロック図および/またはフローチャートにおけるブロックの組み合わせは、指定される機能または動作を実行するハードウェアに基づく専用システムによって実現してもよいし、または専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことに注意すべきである。
【0132】
論理に違反しない場合、本開示の異なる実施例同士を互いに組み合わせることができる。異なる実施例は重点を置いて説明されており、重点を置いて説明されていない部分は、他の実施例の記載を参照することができる。
【0133】
以上、本開示の各実施例を記述したが、上記説明は例示的なものに過ぎず、網羅的なものではなく、かつ披露された各実施例に限定されるものでもない。当業者にとって、説明された各実施例の範囲および精神から逸脱することなく、様々な修正および変更が自明である。本明細書に選ばれた用語は、各実施例の原理、実際の適用または市場における技術への技術的改善を好適に解釈するか、または他の当業者に本文に披露された各実施例を理解させるためのものである。
図1
図2
図3
図4
図5
【手続補正書】
【提出日】2021-09-29
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることと、
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することと、
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新することと、を含むことを特徴とする画像処理方法。
【請求項2】
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴に対してクラスタ中心抽出を行って、前記被処理画像の第2のクラスタのクラスタ中心特徴を得ることと、
前記第1の特徴及び前記第2のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第2のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもない場合、前記被処理画像の第1の特徴をクラスタリングして、1つ以上の第3のクラスタを得ることと、
各第3のクラスタに対してそれぞれクラスタ中心抽出を行って、前記第3のクラスタのクラスタ中心特徴を得ることと、
前記第1の特徴及び前記第3のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第3のクラスタを前記複数の参照画像クラスタに追加することと、をさらに含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することは、
前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することと、
複数の第1の距離のうち最も小さい距離値の距離である第2の距離が距離閾値以下である場合、前記被処理画像の画像クラスタを前記第2の距離に対応する第1のクラスタとして決定することと、を含むことを特徴とする請求項1に記載の方法。
【請求項5】
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定することは、
前記第2の距離が前記距離閾値よりも大きい場合、前記被処理画像の画像クラスタが前記複数の参照画像クラスタのいずれでもないとして決定することを含むことを特徴とする請求項4に記載の方法。
【請求項6】
前記クラスタ中心特徴は、N個(Nは正の整数)のクラスタ中心特徴を含み、
前記第1の特徴と複数のクラスタ中心特徴との間の複数の第1の距離を取得することは、
N個のクラスタ中心特徴をそれぞれ量子化処理して、N個の特徴ベクトルを得ることと、
前記第1の特徴と前記N個の特徴ベクトルとの間のN個の第3の距離をそれぞれ取得することと、
前記N個の第3の距離のうち最も小さいからのK個(Kは正の整数であり、かつK<N)の近似距離に対応するK個のクラスタ中心特徴を決定することと、
前記第1の特徴と前記K個のクラスタ中心特徴との間のK個の第1の距離を決定することと、を含むことを特徴とする請求項4又は5に記載の方法。
【請求項7】
特徴ライブラリにおける各参照画像クラスタの特徴情報に対してそれぞれクラスタ中心抽出を行って、各画像クラスタのクラスタ中心特徴を得ることをさらに含むことを特徴とする請求項1~6のいずれか1項に記載の方法。
【請求項8】
被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得ることは、
被処理画像に対して特徴抽出を行って、前記被処理画像の第2の特徴を得ることと、
前記第2の特徴を正規化処理して、前記被処理画像の第1の特徴を得ることと、を含むことを特徴とする請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記特徴ライブラリにおける複数の第4のクラスタが同一のオブジェクトに対応する場合、前記複数の第4のクラスタの特徴情報を再クラスタリングして、第5のクラスタを得ることと、
前記第5のクラスタに対してクラスタ中心抽出を行って、前記第5のクラスタのクラスタ中心特徴を得ることと、
前記第5のクラスタのクラスタ中心特徴を前記特徴ライブラリに追加し、前記第5のクラスタを複数の参照画像クラスタに追加することと、をさらに含むことを特徴とする請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記特徴ライブラリから前記複数の第4のクラスタのクラスタ中心特徴を削除し、前記複数の参照画像クラスタから前記複数の第4のクラスタを削除することをさらに含むことを特徴とする請求項9に記載の方法。
【請求項11】
被処理画像に対して特徴抽出を行って、前記被処理画像の第1の特徴を得るための第1の特徴抽出モジュールと、
前記第1の特徴及び特徴ライブラリにおける複数の参照画像クラスタのクラスタ中心特徴に基づいて、前記被処理画像の画像クラスタを決定するためのクラスタ決定モジュールと、
前記被処理画像の画像クラスタが前記複数の参照画像クラスタのうちの第1のクラスタである場合、前記第1の特徴及び前記第1のクラスタの前記特徴ライブラリにおける複数の特徴情報に基づいて、前記第1のクラスタのクラスタ中心特徴を更新するための第1の更新モジュールと、を含むことを特徴とする画像処理装置。
【請求項12】
プロセッサと、
プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、
前記プロセッサは、請求項1~10のいずれか1項に記載の方法を実行するように構成されることを特徴とする電子機器。
【請求項13】
コンピュータプログラム命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラム命令がプロセッサによって実行されると、請求項1~10のいずれか1項に記載の方法を実現させることを特徴とするコンピュータ読み取り可能な記憶媒体。
【請求項14】
コンピュータ可読コードを含むコンピュータプログラムであって、前記コンピュータ可読コードが電子機器において動作すると、前記電子機器のプロセッサに、請求項1~10のいずれか1項に記載の方法を実現するための命令を実行させることを特徴とするコンピュータプログラム。
【国際調査報告】