IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 深▲セン▼須弥雲図空間科技有限公司の特許一覧

特表2024-542639歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体
<>
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図1
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図2
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図3
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図4
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図5
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図6
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図7
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図8
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図9
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図10
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図11
  • 特表-歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-15
(54)【発明の名称】歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体
(51)【国際特許分類】
   G06T 7/00 20170101AFI20241108BHJP
   G06V 10/77 20220101ALI20241108BHJP
   G06T 7/60 20170101ALI20241108BHJP
   G06F 18/2115 20230101ALI20241108BHJP
   G06N 3/08 20230101ALI20241108BHJP
【FI】
G06T7/00 300F
G06V10/77
G06T7/60 150D
G06T7/60 180A
G06T7/00 350B
G06F18/2115
G06N3/08
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024532210
(86)(22)【出願日】2021-12-31
(85)【翻訳文提出日】2024-05-29
(86)【国際出願番号】 CN2021143571
(87)【国際公開番号】W WO2023097858
(87)【国際公開日】2023-06-08
(31)【優先権主張番号】202111453596.7
(32)【優先日】2021-12-01
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】524179651
【氏名又は名称】深▲セン▼須弥雲図空間科技有限公司
【氏名又は名称原語表記】SHENZHEN XUMI YUNTU SPACE TECHNOLOGY CO., LTD.
【住所又は居所原語表記】25F2504, Wired Information Transmission Building, No. 3369, Binhai Avenue, Haizhu Community, Yuehai Street, Nanshan District. Shenzhen, Guangdong 518054 (CN)
(74)【代理人】
【識別番号】100146374
【弁理士】
【氏名又は名称】有馬 百子
(72)【発明者】
【氏名】祁 暁▲亭▼
(72)【発明者】
【氏名】蒋 召
(72)【発明者】
【氏名】楊 戦波
(72)【発明者】
【氏名】黄 澤元
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA08
5L096EA23
5L096FA09
5L096FA72
5L096JA11
5L096KA04
(57)【要約】
歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体であって、該方法は、第1画像、第2画像を取得するステップと、第1画像、第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するステップであって、第1局所特徴及び第2局所特徴に、人体の各重要なポイントが対応する局所特徴ベクトルがそれぞれ含まれるステップと、第1局所特徴、第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するステップと、第1高次特徴及び第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するステップと、第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、第1画像と第2画像に同一の歩行者が含まれるか否かを特定するステップと、を含む。本方法は、画像における異常点の歩行者マッチングに対する影響を低減させることができ、マッチング結果がより正確である。
【選択図】図1
【特許請求の範囲】
【請求項1】
歩行者マッチング方法であって、
第1画像、第2画像を取得するステップと、
前記第1画像、前記第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するステップであって、前記第1局所特徴及び前記第2局所特徴に、人体の各重要なポイントが対応する局所特徴ベクトルがそれぞれ含まれるステップと、
前記第1局所特徴、前記第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するステップと、
前記第1高次特徴及び前記第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するステップと、
前記第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、前記第1画像と前記第2画像に同一の歩行者が含まれるか否かを特定するステップと、を含む
ことを特徴とする歩行者マッチング方法。
【請求項2】
前記第1画像、前記第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するステップは、
前記第1画像及び前記第2画像に対してそれぞれ人体局所特徴抽出を行い、前記第1局所特徴、前記第2局所特徴を取得するステップと、
前記第1局所特徴に対して特徴集約を行い第1高次特徴を取得し、前記第2局所特徴に対して特徴集約を行い前記第2高次特徴を取得するステップと、を含む
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記人体の重要なポイントは2つ以上含まれ、
局所特徴に対して特徴集約を行い高次特徴を取得するステップは、
各前記人体の重要なポイントが対応する局所特徴ベクトルに基づいて前記局所特徴が対応する第1パラメータ、第2パラメータ及び第3パラメータを学習し特定するステップと、
前記第1パラメータ、第2パラメータ及び第3パラメータに基づき、各前記局所特徴ベクトルが対応するクエリ、キー及び値を生成するステップと、
前記クエリ及び前記キーに基づいて、2つずつの前記局所特徴ベクトル間の重み係数を特定するステップと、
任一の前記局所特徴ベクトルに対して、前記局所特徴ベクトルと他の各前記局所特徴ベクトルとの間の関係に基づいて、調節係数を特定するステップと、
前記重み係数、調節係数及び前記値に基づいて、前記局所特徴が対応する集約特徴を取得するステップと、
各前記局所特徴が対応する集約特徴によって、前記高次特徴をが特定されるステップと、を含み、
前記局所特徴が前記第1局所特徴及び前記第2局所特徴を含み、前記高次特徴が前記第1高次特徴及び前記第2高次特徴を含む
ことを特徴とする請求項2に記載の方法。
【請求項4】
前記第1局所特徴、前記第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するステップは、
前記第1局所特徴と前記第2局所特徴との局所特徴類似性を算出するステップと、
前記第2局所特徴、前記局所特徴類似性に基づいて前記第2局所特徴の前記第1局所特徴における第1マッチング特徴を特定するステップと、
前記第1局所特徴、前記局所特徴類似性に基づいて前記第1局所特徴の前記第2局所特徴における第2マッチング特徴を特定するステップと、
前記第1マッチング特徴に対して特徴抽出を行い、前記第1融合特徴を取得し、前記第2マッチング特徴に対して特徴抽出を行い、前記第2融合特徴を取得するステップと、を含む
ことを特徴とする請求項1に記載の方法。
【請求項5】
前記第2局所特徴、前記局所特徴類似性に基づいて前記第2局所特徴の前記第1局所特徴における第1マッチング特徴を特定するステップは、
前記局所特徴類似性と前記第2局所特徴との第1積を算出するステップと、前記第1積と前記第1局所特徴との和値を前記第1マッチング特徴として特定するステップを、含み、
前記第1局所特徴、前記局所特徴類似性に基づいて前記第1局所特徴の前記第2局所特徴における第2マッチング特徴を特定するステップは、
前記局所特徴類似性を転置して、転置後局所特徴類似性を取得ステップと、
前記転置後局所特徴類似性と前記第1局所特徴との第2積を算出するステップと、
前記第2積と前記第2局所特徴との和値を前記第2マッチング特徴として特定するステップと、を含む
ことを特徴とする請求項4に記載の方法。
【請求項6】
前記第1高次特徴及び前記第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するステップは、
前記第1高次特徴と前記第2高次特徴との高次特徴類似性を算出するステップと、
前記第2高次特徴、前記高次特徴類似性に基づいて、前記第2高次特徴の前記第1高次特徴における第1高次マッチング特徴を特定するステップと、
前記第1高次特徴、前記高次特徴類似性に基づいて、前記第1高次特徴の前記第2高次特徴における第2高次マッチング特徴を特定するステップと、
前記第1高次マッチング特徴に対して特徴抽出を行い、前記第1高次融合特徴を取得し、前記第2高次マッチング特徴に対して特徴抽出を行い、前記第2高次融合特徴を取得するステップと、を含む
ことを特徴とする請求項1に記載の方法。
【請求項7】
前記第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、前記第1画像と前記第2画像に同一の歩行者が含まれるか否かを特定するステップは、
前記第1融合特徴、前記第1高次融合特徴に対してスプライスを行い、第1スプライス特徴を取得するステップと、
前記第2融合特徴、前記第2高次融合特徴に対してスプライスを行い、第2スプライス特徴を取得するステップと、
前記第1スプライス特徴と前記第2スプライス特徴との比較損失値を算出し、前記比較損失値に基づいて前記第1画像と前記第2画像に同一の歩行者が含まれるか否かを特定するステップと、を含む
ことを特徴とする請求項1に記載の方法。
【請求項8】
歩行者マッチング装置であって、
第1画像、第2画像を取得するための取得モジュールと、
前記第1画像、前記第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するための特徴抽出モジュールであって、前記第1局所特徴及び前記第2局所特徴に、人体の各重要なポイントが対応する局所特徴ベクトルがそれぞれ含まれる特徴抽出モジュールと、
前記第1局所特徴、前記第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するための第1特徴整列モジュールと、
前記第1高次特徴及び前記第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するための第2特徴整列モジュールと、
前記第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、前記第1画像と前記第2画像に同一の歩行者が含まれるか否かを特定するためのマッチングモジュールと、を備える
ことを特徴とする歩行者マッチング装置。
【請求項9】
メモリ、プロセッサ、前記メモリ内に記憶され前記プロセッサで実行可能なコンピュータプログラムを備える電子機器であって、
前記プロセッサは、前記コンピュータプログラムを実行する時に、請求項1に記載の方法のステップを実現する
ことを特徴とする電子機器。
【請求項10】
コンピュータプログラムが記憶されるコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータプログラムは、プロセッサによって実行される時に、請求項1に記載の方法のステップを実現する
ことを特徴とするコンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本公開は画像処理技術分野に関し、特に歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体に関する。
【背景技術】
【0002】
画像マッチングとは、画像内容、特徴、構造、関係、テクスチャ及びグレースケール等の対応関係により、類似性と一貫性の分析を行い、類似の画像ターゲットを求める方法を意味する。画像マッチング方法は、歩行者マッチングに用いられてもよく、歩行者マッチングは、異なる画像間に出る歩行者が同一歩行者であるか否かを比較することができる。
【0003】
従来の歩行者マッチングの方式は、多く人体の全局特徴マッチングをそのまま利用し、或いは人体の局所特徴マッチングに基づくが、実際な状況で、ほとんどの画像は通常に品質がさまざまで、例えば画像において人体が遮られ、人体の姿勢が異なり、画像の明るさが異なり、即ちいくつかの異常点又は外れ点があり、歩行者マッチングを行う時に特徴整列がマッチングしない状況が容易に現れるので、歩行者マッチングの結果が十分に正確ではない問題になる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
これに鑑みて、本公開の実施例は、従来技術において画像にいくつかの異常点や外れ点があることによって歩行者マッチング結果が正確ではないという問題を解決するように、歩行者マッチング方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体が提供される。
【課題を解決するための手段】
【0005】
本公開の実施例の第1態様は、
第1画像、第2画像を取得するステップと、
前記第1画像、前記第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するステップであって、前記第1局所特徴及び前記第2局所特徴に、人体の各重要なポイントが対応する局所特徴ベクトルがそれぞれ含まれるステップと、
前記第1局所特徴、前記第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するステップと、
前記第1高次特徴及び前記第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するステップと、
前記第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、前記第1画像と前記第2画像に同一の歩行者が含まれるか否かを特定するステップと、を含む歩行者マッチング方法が提供される。
【0006】
本公開の実施例の第2態様は、
第1画像、第2画像を取得するための取得モジュールと、
前記第1画像、前記第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するためのものであって、前記第1局所特徴及び前記第2局所特徴に、人体の各重要なポイントが対応する局所特徴ベクトルがそれぞれ含まれる特徴抽出モジュールと、
前記第1局所特徴、前記第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するための第1特徴整列モジュールと、
前記第1高次特徴及び前記第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するための第2特徴整列モジュールと、
前記第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、前記第1画像と前記第2画像に同一の歩行者が含まれるか否かを特定するためのマッチングモジュールと、を備える歩行者マッチング装置が提供される。
【0007】
本公開の実施例の第3態様は、メモリ、プロセッサ、メモリ内に記憶されプロセッサで実行可能なコンピュータプログラムを備える電子機器であって、該プロセッサがコンピュータプログラムを実行する時に上記方法のステップを実現する電子機器が提供される。
【0008】
本公開の実施例の第4態様は、コンピュータプログラムが記憶されるコンピュータ読み取り可能な記憶媒体であって、該コンピュータプログラムがプロセッサによって実行される時に、上記方法のステップを実現するコンピュータ読み取り可能な記憶媒体が提供される。
【発明の効果】
【0009】
本公開の実施例が従来技術に比べて存在する有益効果:取得した第1画像及び第2画像に対して特徴抽出をそれぞれ行うことにより、2枚の画像において人体の重要なポイントが対応する局所特徴及び高次特徴を取得し、それぞれ第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴と記し、第1局所特徴、第2局所特徴に対して特徴整列を行い、第1融合特徴及び第2融合特徴を取得し、第1高次特徴、第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得し、第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて2枚の画像に同一の歩行者が含まれるか否かを特定する。画像における人体局所特徴及び高次特徴を抽出し、異なる特徴整列策略を用いて局所特徴及び高次特徴に対してそれぞれ特徴整列を行い、特徴相互間の関係を組み込み、特徴相互間の情報を統合的に利用し、より効果的な特徴を取得し、画像における異常点又は外れ点の歩行者マッチングに対する影響を低減させ、より正確的なマッチング結果を取得する。
【図面の簡単な説明】
【0010】
本公開の実施例における技術的解決手段をより明確に説明するために、以下、実施例又は従来技術の説明に必要な図面を簡単に紹介し、明らかに、以下に説明する図面は本公開のいくつかの実施例に過ぎず、当業者にとって、創造的作業の必要がない前提で、これらの図面に基づいて他の図面を取得することができる。
【0011】
図1】本公開の実施例で提供される歩行者マッチング方法のフローチャットである。
図2】本公開の実施例で提供される、第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて第1画像と第2画像に同一の歩行者が含まれるか否かを特定するフローチャットである。
図3】本公開の実施例で提供される、局所特徴に対して特徴集約を行い高次特徴を取得するフローチャットである。
図4】本公開の実施例で提供される人体の重要なポイント番号の概略図である。
図5】本公開の実施例で提供される、第1局所特徴、第2局所特徴に対して特徴整列を行い第1融合特徴、第2融合特徴を取得するフローチャットである。
図6】本公開の実施例で提供される、第1局所特徴、第2局所特徴に対してそれぞれ特徴整列を行うフローチャットである。
図7】本公開の実施例で提供される、第1高次特徴及び第2高次特徴に対して特徴整列を行い第1高次融合特徴及び第2高次融合特徴を取得するフローチャットである。
図8】本公開の実施例で提供される、第1高次特徴、第2高次特徴に対してそれぞれ特徴整列を行うフローチャットである。
図9】本公開の実施例で提供される別の歩行者マッチング方法のフローチャットである。
図10】本公開の実施例で提供される歩行者マッチング装置の構造概略図である。
図11】本公開の実施例で提供される別の歩行者マッチング装置の構造概略図である。
図12】本公開の実施例で提供される電子機器の構造概略図である。
【発明を実施するための形態】
【0012】
下記の説明において、限定ではなく、説明するために、例えば特定のシステム構造、技術のような具体的詳細を提供することにより、本公開の実施例を徹底的に理解する。しかしながら、当業者は、これらの具体的詳細がない他の実施例においても本公開を実現できることを分かるすべきである。他の場合には、周知のシステム、装置、回路及び方法についての詳細な説明を省略し、不要な詳細が本公開の説明を妨げることを回避する。
【0013】
以下、図面を参照しながら、本公開の実施例による歩行者マッチング方法及び装置を詳細に説明する。
【0014】
図1は、本公開の実施例で提供される歩行者マッチング方法のフローチャットである。図1に示すように、該歩行者マッチング方法は、ステップS101からステップS105を含む。
【0015】
S101であって、第1画像、第2画像を取得する。
【0016】
第1画像及び第2画像は、歩行者をマッチングするための画像であり、本実施例において、第1画像と第2画像を比較することによって、そのうちに同一の歩行者が含まれるか否かを特定する。
【0017】
具体的には、第1画像及び第2画像は、データベースから取得されたものであってもよいし、モニタリング装置が収集した画像からリアルタイムに抽出されたものであってもよい。一実施例において、歩行者マッチング方法を人々が滞在するシーンに用いる場合、第1画像及び第2画像はいずれもモニタリング装置が収集した画像から抽出されたものであってもよく、所定の時間ごとにモニタリング装置が収集した画像から2枚の画像を抽出して比較し、同一の歩行者が含まれるか否かを特定し、さらに同一の場所で長い間滞在する人々がいるか否かを特定する。更には、一実施例において、モニタリング装置が収集した画像から人々を検出した時に、歩行者マッチング方法をトリガーし、所定の時間ごとに2枚の画像を抽出し、歩行者マッチングによって、人々が同一の位置で長い間滞在するか否かを判断することができる。他の実施例において、歩行者マッチング方法は、他のシーンにも適用されてもよい。
【0018】
なお、本願に公開されるの実施例において、言及される「第1」、「第2」等の概念は、異なる名前を区別するためのものに過ぎず、実際な意味を示すものではない。
【0019】
S102であって、第1画像、第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得する。
【0020】
コンピュータに画像を「理解」させるために、通常に画像から役立つデータや情報を抽出し、例えば、数値、ベクトル及び符号等のような画像の「非画像」の表現又は説明を取得する。このような過程は特徴抽出であるが、抽出されたこれらの「非画像」の表現又は説明は特徴である。画像にとって、それぞれの画像はいずれも他タイプの画像と区別できる自体特徴を有し、例えば明るさ、エッジ、テクスチャ、カラーなどの直感的に感じられる自然な特徴があり、例えばモーメント、ヒストグラム、主成分などの取得するための変換や処理が必要な特徴もある。
【0021】
いくつかの実施例において、画像に対して特徴抽出を行うのは、ニューラルネットワークを用いて実現することができる。本実施例において、歩行者マッチングを行うことを目的とするので、特徴抽出時に、画像に含まれる人体の特徴を抽出する必要があるため、人体検出モジュール、人体の重要なポイント推定モデルを用いて特徴抽出を行うことができる。
【0022】
局所特徴は人体の各重要なポイントが対応する局所特徴ベクトルの局所特徴を含み、本実施例において、区別させるために、第1画像から抽出された特徴を第1局所特徴、第1高次特徴と記し、第2画像から抽出された特徴を第2局所特徴及び第2高次特徴と記する。
【0023】
いくつかの実施例において、第1画像、第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するステップは、第1画像及び第2画像に対してそれぞれ人体局所特徴抽出を行い、第1局所特徴、第2局所特徴を取得するステップと、第1局所特徴に対して特徴集約を行い第1高次特徴を取得し、第2局所特徴に対して特徴集約を行い第2高次特徴を取得するステップと、を含む。
【0024】
具体的な一実施例において、第1画像に対して特徴抽出を行い第1局所特徴を取得するステップは、第1画像を人体検出モデルに入力し、第1画像に対して人体検出を行い、第1画像における人体検出フレームを取得するステップと、人体検出フレームを人体の重要なポイント推定モデルに入力し、人体検出フレームが対応する各人体の重要なポイントの特徴である第1局所特徴を取得するステップと、を含み、当然のことながら、第2画像に対して特徴抽出を行い第2局所特徴を取得するのは、第1画像の局所特徴抽出と類似し、ここで重複に説明しない。ここで、任意の1種類の人体検出モデル、人体の重要なポイント推定モデルを用いて画像に対して特徴抽出を行うことができる。
【0025】
更には、具体的な一実施例において、人体検出モデルにより画像に対して特徴抽出を行い人体検出フレームを取得した後、人体検出フレームを人体の重要なポイント推定モデルに入力し、ここで、人体の重要なポイント推定モデルが、入力された人体検出フレームを処理する具体的なプロセスは、まずそれぞれの特徴図を1*1畳み込みによって1024に統合的に変換し、その後、ROIAlign(校正)によって特徴図の長さと幅を[16,8]に統合的にプーリングし、この際に、それぞれの人体特徴図G1の次元を[1024,16,8]として取得する。G1を3つの畳み込みblock(conv(3,3)、BN、relu)によって、特徴図[1024,16,8]、[512,16,8]、[256,16,8]を順に取得する。最後にconv(1,1)、BN、reluによって、すべての人体の重要なポイントのヒートマップを取得し、人体の重要なポイントが14個である場合に、ヒートマップを[14,16,8]として表してもよい。ここで、BN(Batch Normalization,バッチ正規化)は、各層の入力に対して正規化する。relu(Rectified Linear Unit,リニア整流関数)は、修正リアルユニットとも称され、人工ニューラルネットワークでよく用いられる活性化関数(activation function)であり、通常にランプ関数及びその変形で表される非線形関数を指す。
【0026】
それぞれの重要なポイントのヒートマップ次元は[1,16,8]であり、その後、スタックを繰り返して、その次元を[1024,16,8]に変え、人体の特徴図G1[1024,16,8]と乗算し、該重要なポイントの特徴図[2048,16,8]を取得し、最後に全体平均プーリングして、重要なポイントの特徴ベクトル[1024]を取得する。同様に、上記方法によれば、人体のそれぞれの重要なポイントの特徴ベクトルを取得することができ、第1画像において人体のそれぞれの重要なポイントは第1局所特徴であり、第2画像において人体のそれぞれの重要なポイントは第2局所特徴である。
【0027】
いくつかの実施例において、局所特徴を取得した後、それぞれ局所特徴に対して特徴集約を行うことにより、高次特徴を取得することができ、同様に、本実施例において、第1局所特徴を集約して取得した高次特徴を第1高次特徴と記し、第2局所特徴に対して特徴集約を行って取得した高次特徴を第2高次特徴と記する。具体的には、局所特徴に対して特徴集約を行い高次特徴を取得する具体的な過程について、後の実施例で詳しく説明し、ここで重複に説明しない。
【0028】
S103であって、第1局所特徴、第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得する。
【0029】
歩行者が異なる時刻で異なる画像に出る姿勢が同じではなく、異なる画像に対して歩行者マッチングを行う時に、画像特徴を整列することにより、2枚の画像における同名点を探して、そのうちに同じ歩行者が含まれるか否かを求める。本実施例において、2枚の画像からそれぞれ抽出された人体局所特徴に対して特徴整列を行い、整列による特徴を第1融合特徴、第2融合特徴と記する。具体的に、第1局所特徴、第2局所特徴に対して特徴整列を行い第1融合特徴、第2融合特徴を取得する具体的なステップについては、後の実施例で詳しく説明する。
【0030】
S104であって、第1高次特徴及び第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得する。
【0031】
本実施例において、特徴抽出を行う場合に、低次の人体局所特徴が取得され、低次の人体局所特徴により画像の高次特徴が取得されたため、特徴整列を行う場合に、低次の局所特徴に対して低次特徴整列を行い、高次特徴に対して高次特徴整列策略を用い、収集した画像特徴を十分に利用して、抽出された特徴をより良くする。更には、本実施例において、高次特徴を整列した後、取得した特徴を第1高次融合特徴、第2高次融合特徴と記する。
【0032】
S105であって、第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、第1画像と第2画像に同一の歩行者が含まれるか否かを特定する。
【0033】
一実施例において、図2に示すように、第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて第1画像と第2画像に同一の歩行者が含まれるか否かを特定するステップは、ステップS201からステップS203を含む。
【0034】
S201であって、第1融合特徴、第1高次融合特徴に対してスプライスを行い、第1スプライス特徴を取得する。
【0035】
S202であって、第2融合特徴、第2高次融合特徴に対してスプライスを行い、第2スプライス特徴を取得する。
【0036】
いくつかの実施例において、特徴スプライスはconcat関数によって完了されることができ、concat関数は、2つ以上のアレイを接続するためのものである。本実施例において、第1融合特徴、第1高次融合特徴に対してスプライスを行って取得した特徴を第1スプライス特徴と記し、第2融合特徴、第2高次融合特徴に対してスプライスを行って取得した特徴を第2スプライス特徴と記する。他の実施例において、特徴スプライスは他の方式によって実現されてもよい。
【0037】
S203であって、第1スプライス特徴と第2スプライス特徴との比較損失値を算出し、比較損失値に基づいて第1画像と第2画像に同一の歩行者が含まれるか否かを特定する。
【0038】
いくつかの実施例において、比較損失関数により第1スプライス特徴と第2スプライス特徴との比較損失値を算出し、比較損失関数は、サンプルに対するマッチング度合としてうまく表されることができ、本実施例において、比較損失関数を利用して第1スプライス特徴と第2スプライス特徴について比較損失値を算出し、第1画像と第2画像とのマッチング度合の説明に用いることができる。具体的には、本実施例において、任一の比較損失関数を用いて2つのスプライス特徴間の比較損失値を算出することができる。
【0039】
比較損失値を取得した後、比較損失値に基づき、第1画像と第2画像に同一の歩行者が含まれるか否かを特定することができる。一実施例において、比較損失値に基づき、第1画像と第2画像に同一の歩行者が含まれるか否かを特定するのは、所定の条件を設定することによって行うことができ、比較損失値が所定の条件を満たすと、第1画像と第2画像に同一の歩行者が含まれると判定でき、所定の条件は実際状況に応じて設定されることができ、比較損失値に基づき第1画像と第2画像とのマッチング度合が高いと判定するほど、第1画像と第2画像に同一の歩行者が含まれる可能性が高くなる。
【0040】
他の実施例において、第1スプライス特徴、第2スプライス特徴を取得した後、第1スプライス特徴、第2スプライス特徴に基づき、他の方式で第1画像、第2画像に同一歩行者が含まれるか否かを特定することができ、例えば、第1スプライス特徴と第2スプライス特徴との類似性を算出し、類似性に基づいて第1画像、第2画像に同一歩行者が含まれるか否かを特定する。
【0041】
本公開の実施例で提供される技術的解決手段によれば、取得した第1画像及び第2画像に対して特徴抽出をそれぞれ行うことにより、2枚の画像において人体の重要なポイントが対応する局所特徴及び高次特徴を取得し、それぞれ第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴と記し、第1局所特徴、第2局所特徴に対して特徴整列を行い、第1融合特徴及び第2融合特徴を取得し、第1高次特徴、第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得し、第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて2枚の画像に同一の歩行者が含まれるか否かを特定する。画像における人体局所特徴及び高次特徴を抽出し、異なる特徴整列策略を用いて局所特徴及び高次特徴に対してそれぞれ特徴整列を行い、特徴相互間の関係を組み込み、特徴相互間の情報を統合的に利用し、より効果的な特徴を取得し、画像における異常点又は外れ点の歩行者マッチングに対する影響を低減させ、より正確的なマッチング結果を取得する。
【0042】
いくつかの実施例において、人体の重要なポイントは2つ以上含まれ、本実施例において、図3に示すように、局所特徴に対して特徴集約を行い高次特徴を取得するステップは、ステップS301からステップS306を含み、局所特徴が第1局所特徴及び第2局所特徴を含み、高次特徴が第1高次特徴及び第2高次特徴を含む。
【0043】
S301であって、各人体の重要なポイントが対応する局所特徴ベクトルに基づいて局所特徴が対応する第1パラメータ、第2パラメータ及び第3パラメータを学習し特定する。
【0044】
人体の重要なポイントは通常に2つ以上含まれ、人体局所特徴の抽出時に、それぞれの人体の重要なポイントが対応する局所特徴ベクトルを取得することができ、局所特徴に含まれる局所特徴ベクトル数は、人体の重要なポイントの数に対応する。本実施例における局所特徴は、第1画像及び第2画像からそれぞれ抽出された第1局所特徴及び第2局所特徴を含む。
【0045】
具体的には、各人体の重要なポイントが対応する局所特徴ベクトルに基づき局所特徴が対応する第1パラメータ、第2パラメータ及び第3パラメータを学習するのは、任意の一方式で実現されてもよく、例えば、ニューラルネットワークによって実現されてもよく、具体的な一実施例において、Transformerネットワーク(Ashish Vaswani提出)によって実現されてもよい。いくつかの実施例において、局所ベクトルが対応する第1パラメータ、第2パラメータ及び第3パラメータの範囲はいずれもR1024×256である。
【0046】
S302であって、第1パラメータ、第2パラメータ及び第3パラメータに基づき、各局所特徴ベクトルが対応するクエリ、キー及び値を生成する。
【0047】
クエリ、キー及び値は、Transformerネットワークでの概念である。第1パラメータ、第2パラメータ及び第3パラメータに基づいて、各局所特徴ベクトルが対応するクエリquery、キーkey及び値valueを生成し、下記のように表してもよい。
【0048】
query:Q=f*Wであり、Wが第1パラメータを表し、
key:K=f*Wであり、Wが第2パラメータを表し、
value:V=f*Wであり、Wが第3パラメータを表す。
【0049】
S303であって、クエリ及びキーに基づいて、2つずつの局所特徴ベクトル間の重み係数を特定する。
【0050】
いくつかの実施例において、クエリ及びキーに基づいて、2つずつの局所特徴ベクトル間の重み係数を特定するステップは、2つの局所特徴ベクトルを第1対象局所特徴ベクトル、第2対象局所特徴ベクトルとして選択し、第1対象局所特徴ベクトルのクエリ及び第2対象局所特徴ベクトルのキーで、第1対象局所特徴ベクトルと第2対象局所特徴ベクトルとの重み係数を算出する。
【0051】
更には、具体的な一実施例において、第1対象局所特徴ベクトルのクエリ及び第2対象局所特徴ベクトルのキーで、第1対象局所特徴ベクトルと第2対象局所特徴ベクトルとの重み係数を算出し、下記のように表してもよい。
【0052】
ijは、番号i及び番号jの局所特徴ベクトル間の重み係数を表し、i、jはそれぞれ人体の重要なポイントが対応する番号を表し、人体の重要なポイントを予め番号つけることができ、Qは第1対象局所特徴ベクトルが対応するクエリを表し、Kは第2対象局所特徴ベクトルのキーを表し、K TはKを転置することを表し、256はQ、Kの次元であり、softmax()はロジスティック回帰アルゴリズムを表し、aijは第1対象局所特徴ベクトルと第2対象局所特徴ベクトルとの重み係数を表す。ここで、転置の定義としては、Aの全部要素を、1行目、1列目の要素から始まる右下からの45度の射線のまわりに、ミラー反転すると、Aの転置を取得する。
【0053】
上記方法によれば、2つずつの人体の重要なポイントが対応する局所特徴ベクトル間の重み係数を算出することができる。
【0054】
S304であって、任一の局所特徴ベクトルに対して、局所特徴ベクトルと他の各局所特徴ベクトルとの間の関係に基づいて、調節係数を特定する。
【0055】
局所特徴ベクトルと他の局所特徴ベクトルとの間の関係は、人体の重要なポイントについて予め設定された番号から特定されることができる。具体的な一実施例において、それぞれの人体の重要なポイントについて1つの番号を設定し、図4に示すように、頭=1、首=2、左肩=右肩=3、左肘=右肘=4、左手=右手=5、左腰 = 右腰=6、左膝=右膝=7、左足 = 右足=8である。歩行者マッチングを行う時に、位置が近いほど、人体の重要なポイントの間の影響が大きくなるため、本実施例で、調節係数を設定することによって、重要なポイントの間の影響度合に応じて集約して高次特徴を取得する。
【0056】
具体的な一実施例において、局所特徴ベクトルと他の局所特徴ベクトルとの間の関係に基づいて、調節係数を特定し、下記のように表してもよい。
【0057】
pは調節係数を表し、rはハイパーパラメータであり、ハイパーパラメータの数値について実際状況に応じて定義することができ、i、jはそれぞれ重要なポイントの番号を表す。
【0058】
S305であって、重み係数、調節係数及び値に基づいて、局所特徴が対応する集約特徴を取得する。
【0059】
いくつかの実施例において、重み係数、調節係数及び値に基づいて局所特徴が対応する集約特徴を取得するステップは、下記のように表されてもよい。
【0060】
atは、番号iの局所特徴ベクトルが対応する集約特徴を表し、aijは、番号i及び番号jの局所特徴ベクトル間の重み係数を表し、pは調節係数を表し、Vは、番号jの局所特徴ベクトルが対応する値を表し、i、jはそれぞれ重要なポイントの番号を表し、14は局所特徴ベクトル(人体の重要なポイント)の数を表す。
【0061】
S306であって、各局所特徴が対応する集約特徴によって、高次特徴をが特定される。
【0062】
ステップS305で、それぞれの人体の重要なポイント(局所特徴ベクトル)が対応する集約特徴を取得することができ、それぞれの集約特徴を一緒に合わせると、対応する高次特徴を取得する。本実施例において、第1局所特徴に基づき集約して取得したものは第1高次特徴であり、第2局所特徴に基づき集約して取得したものは第2高次特徴である。
【0063】
更には、上記した局所特徴に基づき集約して高次特徴を取得するプロセスは、transformerモデルによって実現されてもよい。
【0064】
本公開の実施例で提供される技術的解決手段によれば、transformerモデルにより、入力された第1局所特徴及び第2局所特徴に対して、対応する第1パラメータ、第2パラメータ及び第3パラメータをそれぞれ学習し、第1パラメータ、第2パラメータ及び第3パラメータに基づいて各局所特徴ベクトルのクエリ、キー及び値を算出してから、各局所特徴ベクトルが対応するクエリ、キーに基づいて2つずつの局所特徴ベクトル間の重み係数を算出するとともに、2つずつの局所特徴ベクトル間の関係に基づいて調節係数を特定し、最後に重み係数、局所特徴ベクトルが対応する値及び調節係数に基づいて、集約して新しい局所特徴を取得し、最後に局所特徴の集約による融合特徴を取得する。本実施例は、局所特徴ベクトル間の関係、即ち人体の重要なポイントの先験的な位相構造関係に基づき、調節係数を設計し、調節係数により局所特徴ベクトル間の影響度合を特徴集約に追加し、集約して取得した高次特徴をより良くする。
【0065】
いくつかの実施例において、図5に示すように、第1局所特徴、第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するステップは、ステップS501からステップS504を含む。
【0066】
S501であって、第1局所特徴と第2局所特徴との局所特徴類似性を算出する。
【0067】
局所特徴間の類似性の算出は、任意の一方式によって実現されてもよい。一実施例において、第1局所特徴及び第2局所特徴を同一の特徴空間にマッピングすることにより、2つの局所特徴間のコサイン距離を2つの局所特徴間の特徴類似性として算出する。更には、第1局所特徴及び第2局所特徴を同一の特徴空間にマッピングするステップは、第1局所特徴及び第2局所特徴の分布を正規化処理することによって実現されてもよい。一実施例において、第1局所特徴及び第2局所特徴を同一の特徴空間にマッピングするとともに、2つの局所特徴間のコサイン距離を2つの局所特徴間の特徴類似性として算出するステップは、下記のように表されてもよい。
M1=normalize(F)*[normalize(F)]
【0068】
Fpは第1局所特徴を表し、Fgは第2局所特徴を表し、normalize()は局所特徴を正規化処理することを表し、M1は第1局所特徴Fpと第2局所特徴Fgとの類似性を表す。
【0069】
他の実施例において、第1局所特徴と第2局所特徴との局所特徴類似性の算出は、其他の方式によって実現されてもよい。
【0070】
S502であって、第2局所特徴、局所特徴類似性に基づいて第2局所特徴の第1局所特徴における第1マッチング特徴を特定する。
【0071】
いくつかの実施例において、第2局所特徴、局所特徴類似性に基づいて第2局所特徴の第1局所特徴における第1マッチング特徴を特定するステップは、局所特徴類似性と第2局所特徴との第1積を算出するステップと、第1積と第1局所特徴との和値を第1マッチング特徴として特定するステップと、を含む。
【0072】
局所特徴類似性と第2局所特徴との第1積を算出し、第1局所特徴に含まれる、第2局所特徴とマッチングするポイントを表し、マッチングポイントに基づき、第1局所特徴においてどのようなポイントを重点として利用するかを特定して、外れ点又はオクルージョン点を排除することができる。
【0073】
第1積と第1局所特徴との和値を算出し、第1局所特徴が含まれる元の特徴にも第2局所特徴との関係が含まれ、本実施例において、該和値を第1マッチング特徴と記し、第1マッチング特徴に基づき、第1画像においてどのようなポイントが第2画像との間でマッチングする必要があるかを特定することができる。
【0074】
具体的な一実施例において、局所特徴類似性と第2局所特徴との第1積を算出し、
=M1*F
として表してもよい。
【0075】
は第1積を表し、M1は局所特徴類似性を表し、Fgは第2局所特徴を表す。
【0076】
第1積と第1局所特徴との和値を第1マッチング特徴として特定し、
=F+F
として表す。
【0077】
は第1マッチング特徴を表し、Fpは第1局所特徴を表す。
【0078】
S503であって、第1局所特徴、局所特徴類似性に基づいて第1局所特徴の第2局所特徴における第2マッチング特徴を特定する。
【0079】
第1マッチング特徴の特定に類似するが、第1局所特徴、局所特徴類似性に基づき、第2マッチング特徴を特定することができる。相違点としては、本実施例でまず局所特徴類似性を転置し、転置後の局所特徴類似性を用いて第2マッチング特徴を特定することである。
【0080】
いくつかの実施例において、第1局所特徴、局所特徴類似性に基づいて第1局所特徴の第2局所特徴における第2マッチング特徴を特定するステップは、局所特徴類似性を転置して、転置後局所特徴類似性を取得ステップと、転置後局所特徴類似性と第1局所特徴との第2積を算出するステップと、第2積と第2局所特徴との和値を第2マッチング特徴として特定するステップと、を含む。
【0081】
転置後局所特徴類似性と第1局所特徴との第2積を算出し、第2局所特徴に含まれる、第1局所特徴とマッチングするポイントを表し、マッチングポイントに基づき、第2局所特徴においてどのようなポイントを重点として利用するかを特定して、外れ点又はオクルージョン点を排除することができる。
【0082】
第2積と第2局所特徴との和値を算出し、第1局所特徴が含まれる元の特徴にも第2局所特徴との関係が含まれ、本実施例において、該和値を第2マッチング特徴と記し、第2マッチング特徴に基づき、第2画像においてどのようなポイントが第1画像との間でマッチングする必要があるか、どのようなポイントがマッチングしないかを特定することができる。
【0083】
具体的な一実施例において、転置後局所特徴類似性と第1局所特徴との第2積を算出し、F =M *Fp
として表してもよい。
【0084】
は第2積を表し、M は転置後局所特徴類似性を表し、Fは第1局所特徴を表す。
【0085】
第2積と第2局所特徴との和値を第2マッチング特徴として特定し、
=F+F として表す。
【0086】
は第2マッチング特徴を表し、Fは第2局所特徴を表す。
【0087】
S504であって、第1マッチング特徴に対して特徴抽出を行い、第1融合特徴を取得し、第2マッチング特徴に対して特徴抽出を行い、第2融合特徴を取得する。
【0088】
第1マッチング特徴及び第2マッチング特徴を取得した後、それぞれ特徴抽出を行い、低次特徴整列後に融合した新しい特徴を取得し、即ち第1融合特徴、第2融合特徴となる。
【0089】
いくつかの実施例において、入力されたマッチング特徴に対してそれぞれ特徴抽出を行い、fc+reluによって実現することができる。fc層は全結合層であり、全結合層のそれぞれのノードは、前の層のすべてのノードに繋がり、前に抽出された特徴を結合するために用いられる。Relu層は、通常に活性化関数から組成される。マッチング特徴は、第1マッチング特徴及び第2マッチング特徴を含む。
【0090】
具体的な一実施例において、図6に示すように、第1局所特徴、第2局所特徴に対してそれぞれ特徴整列を行うステップフローチャートであり、Fが第1局所特徴、Fが第2局所特徴、F tが第1融合特徴、Fg tが第2融合特徴を表す。
【0091】
本公開の実施例で提供される技術的解決手段によれば、局所特徴間の局所特徴類似性を算出し、局所特徴類似性に基づき第1マッチング特徴及び第2マッチング特徴を算出し、最後に第1マッチング特徴及び第2マッチング特徴に対してそれぞれ特徴抽出を行い、低次特徴整列した新しい特徴、即ち第1融合特徴及び第2融合特徴を取得する。その後、整列した局所特徴に基づいて、歩行者マッチングを行うと、より正確なマッチング結果を取得することができる。
【0092】
別のいくつかの実施例において、図7に示すように、第1高次特徴及び第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するステップは、ステップS701乃至ステップS704を含む。
【0093】
S701であって、第1高次特徴と第2高次特徴との高次特徴類似性を算出する。
【0094】
高次特徴間の類似性の算出は、任意の一方式によって実現されてもよい。一実施例において、ネットワークにより高次特徴間の類似性を学習して特定してもよく、下記のように表してもよい。
【0095】
Aは、ネットワークパラメータマトリックスを表す。ネットワークパラメータマトリックスAの次元は[1024,1024]である。
【0096】
他の実施例において、第1高次特徴と第2高次特徴との類似性の算出は、他の任意の一方式によって実現されてもよい。
【0097】
S702であって、第2高次特徴、高次特徴類似性に基づいて、第2高次特徴の第1高次特徴における第1高次マッチング特徴を特定する。
【0098】
いくつかの実施例において、第2高次特徴、高次特徴類似性に基づいて、第2高次特徴の第1高次特徴における第1高次マッチング特徴を特定するステップは、高次特徴類似性と第2高次特徴との第3積を算出するステップと、第3積と第1高次特徴との和値を第1高次マッチング特徴として特定するステップとを含む。
【0099】
具体的な一実施例において、高次特徴類似性と第2高次特徴との第3積を算出し、
として表してもよい。
【0100】
【0101】
第3積と第1高次特徴との和値を第1高次マッチング特徴として特定し、
として表す。
【0102】
【0103】
S703であって、第1高次特徴、高次特徴類似性に基づいて、第1高次特徴の第2高次特徴における第2高次マッチング特徴を特定する。
【0104】
第1高次マッチング特徴の特定と類似し、第1高次特徴、高次特徴類似性に基づいて第2高次マッチング特徴を特定することができる。相違点としては、本実施例でまず高次特徴類似性を転置し、転置後の高次特徴類似性を用いて第2高次マッチング特徴を特定することである。
【0105】
いくつかの実施例において、第1高次特徴、高次特徴類似性に基づいて、第1高次特徴の第2高次特徴における第2高次マッチング特徴を特定するステップは、高次特徴類似性を転置して転置後高次特徴類似性を取得するステップと、転置後高次特徴類似性と第1高次特徴との第4積を算出するステップと、第4積と第2高次特徴との和値を第2高次マッチング特徴として特定するステップと、を含む。
【0106】
具体的な一実施例において、転置後高次特徴類似性と第1高次特徴との第4積を算出し、
として表してもよい。
【0107】
【0108】
第4積と第2高次特徴との和値を第2高次マッチング特徴として特定し、
【0109】
【0110】
S704であって、第1高次マッチング特徴に対して特徴抽出を行い、第1高次融合特徴を取得し、第2高次マッチング特徴に対して特徴抽出を行い、第2高次融合特徴を取得する。
【0111】
第1高次マッチング特徴及び第2高次マッチング特徴を取得した後、それぞれ特徴抽出を行い、高次特徴整列後に融合した新しい特徴を取得し、即ち第1高次融合特徴、第2高次融合特徴となる。
【0112】
いくつかの実施例において、入力された高次マッチング特徴に対してそれぞれ特徴抽出を行い、fc+reluによって実現することができる。fc層は全結合層であり、全結合層のそれぞれのノードは、前の層のすべてのノードに繋がり、前に抽出された特徴を結合するために用いられる。Relu層は、通常に活性化関数から組成される。高次マッチング特徴は、第1高次マッチング特徴及び第2高次マッチング特徴を含む。
【0113】
具体的な一実施例において、図8に示すように、第1高次特徴、第2高次特徴に対してそれぞれ特徴整列を行うステップフローチャートであり、
【0114】
本公開の実施例で提供される技術的解決手段によれば、高次特徴間の高次特徴類似性を算出し、高次特徴類似性に基づき第1高次マッチング特徴及び第2高次マッチング特徴を算出し、最後に第1高次マッチング特徴及び第2高次マッチング特徴に対してそれぞれ特徴抽出を行い、高次特徴整列した新しい特徴、即ち第1高次融合特徴及び第2高次融合特徴を取得する。その後、整列した高次特徴に基づいて、歩行者マッチングを行うと、より正確なマッチング結果を取得することができる。
【0115】
具体的な一実施例において、図9に示すように、具体的な一実施例において歩行者マッチング方法の具体的なフローチャットである。
【0116】
(1)2枚の写真probe及びgalleryの入力:
それぞれ人体検出モデルを通して、人体検出フレームbboxを取得し、人体の重要なポイント推定モジュールに送る。
【0117】
(2)第(1)ステップで取得した人体検出フレームの入力:
まず、それぞれの人体検出フレームが対応する特徴図を1*1畳み込みによって1024に統合的に変換し、その後、ROIAlignによって特徴図の長さと幅を[16,8]に統合的にプーリングし、この際に、それぞれの人体特徴図G1の次元を[1024,16,8]として取得する。
【0118】
G1を3つの畳み込みblock(conv(3,3)、BN、relu)によって、特徴図[1024,16,8]、[512,16,8]、[256,16,8]を順に取得する。最後に、conv(1,1)、BN、reluによって、すべての重要なポイントのヒートマップ[14,16,8]を取得する。(ここで、人体の重要なポイントについて、頭、首、左手、左肘、左肩、左腰、左膝、左足、右手、右肘、右肩、右腰、右膝、右足などの14個が設けられる)。
【0119】
それぞれの重要なポイントのヒートマップ次元は[1,16,8]であり、各重要なポイントのヒートマップを繰り返して、その次元を[1024,16,8]に変え、人体の特徴図G1[1024,16,8]と乗算し、該重要なポイントの特徴図[2048,16,8]を取得し、最後に全体平均プーリングして、重要なポイントの特徴ベクトル[1024]を取得する。同様に、それぞれの重要なポイントの特徴ベクトルを取得することができる。即ち、第1局所特徴F及び第2局所特徴Fを取得し、F及びFの次元は、いずれも[14,1024]である。
【0120】
(3)F及びFをtransformerコーディングモジュールに送り、
具体的に、如何に集約して高次特徴を取得するかについて、図3に示す実施例の説明を参照する。
【0121】
(4)F及びFを低次特徴整列策略モジュールに送り、
その次元がいずれも[14,1024]である。ここで、具体的に、如何に低次特徴整列を行うかについて、図5に示す実施例の説明を参照する。
【0122】
(5)第(3)ステップに従って、
その次元がいずれも[14,1024]である。高次特徴マッチング策略モジュールに送り、
その次元がいずれも[14,1024]である。ここで、具体的に、如何に高次特徴整列を行うかについて、図7に示す実施例の説明を参照する。
【0123】
最後に比較損失値に基づいて写真probeとgalleryに同一歩行者が含まれるか否かを判断する。
【0124】
本公開の実施例における歩行者マッチング方法によれば、特徴整列モジュールを設計し、低次特徴整列策略及び高次特徴整列策略により、特徴相互間の関係を組み込み、特徴相互間の情報を統合的に利用し、抽出された特徴をより良くする。ここで、低次特徴整列策略は、人体の重要なポイントの局所特徴の類似性によりマッチングするが、2つのポイントの間にマッチングするか否かについては、2つのポイント間の類似性によって決められるだけではなく、2つのポイントがマッチングすると、他のマッチングへの影響も考えられる必要もあり、よって、全体のエネルギーを最大するように、1つのマッチングを選択する。このため、本公開の実施例の歩行者マッチング方法に高次特徴マッチング策略(高次特徴をエッジの特徴情報として理解できる)も追加され、具体的に、transformerコーディングモジュールにより前に抽出された人体の重要なポイントの局所特徴を集約して高次特徴情報とし、その後、ネットワークに、これらの高次特徴を如何にマッチングするかを学習させ、ロバストネスがより高くなる。また、transformerコーディングによって高次特徴を集約する場合に、人体の重要なポイントの先験的な位相構造関係に基づき、1つの調節係数pを算出して重要なポイントの相互間の影響度合に基づいて高次意味情報を集約する。
【0125】
本願は、上記した歩行者マッチング方法が応用される応用シナリオがさらに提供される。具体的には、該応用シナリオでの該歩行者マッチング方法の応用は下記の通りである。
【0126】
本実施例において、歩行者マッチング方法をビデオ監視における人の滞留検出の応用シナリオで応用し、該応用シナリオで、人の長時間の滞在や徘徊による不審な現象を検出し、報知する必要がある。連続する複数のフレームで検出された人体特徴を比較することによって、同一人物であるか否かを判定し、同じ場所で人が長時間滞在しているか否かを判定することができる。
【0127】
本応用シナリオで、監視画像に人が出ると検出されると、歩行者マッチング方法をトリガーする。所定時間ごとにモニタリング装置から2枚の画像を取得し、2枚の画像に対して歩行者マッチング検出を行う。更には、所定時間ごとの2枚の画像に同一歩行者が含まれると連続して複数回検出すると、監視画像に出る人がここで長い時間滞在していることを表し、この状況を報知することができる。ここで、所定時間は、実際な状況に応じて設定されてもよく、例えば1分間、3分間、5分間等として設定されてもよい。実際な状況に応じて、同一歩行者が監視画像に出ると連続して検出する回数が所定回数に達すると、報知をトリガーするように、設定することができる。
【0128】
上記したすべての選択可能な技術的解決手段は、任意の組み合わせで本願の選択可能な実施例を形成してもよいが、ここで一つずつに説明しない。
【0129】
下記は、本公開の方法実施例を実行するための本公開の装置実施例である。本公開の装置実施例に公開されない詳細については、本公開の方法実施例を参照してください。
【0130】
図10は本公開の実施例で提供される歩行者マッチング装置の概略図である。図10に示すように、該歩行者マッチング装置は、
第1画像、第2画像を取得するための取得モジュール1001と、
第1画像、第2画像に対してそれぞれ特徴抽出を行い、第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴を取得するためのものであって、第1局所特徴及び第2局所特徴に、人体の各重要なポイントが対応する局所特徴ベクトルがそれぞれ含まれる特徴抽出モジュール1002と、
第1局所特徴、第2局所特徴に対して特徴整列を行い、第1融合特徴、第2融合特徴を取得するための第1特徴整列モジュール1003と、
第1高次特徴及び第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得するための第2特徴整列モジュール1004と、
第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて、第1画像と第2画像に同一の歩行者が含まれるか否かを特定するためのマッチングモジュール1005と、を備える。
【0131】
本公開の実施例で提供される技術的解決手段によれば、取得した第1画像及び第2画像に対して特徴抽出をそれぞれ行うことにより、2枚の画像において人体の重要なポイントが対応する局所特徴及び高次特徴を取得し、それぞれ第1局所特徴、第2局所特徴、第1高次特徴及び第2高次特徴と記し、第1局所特徴、第2局所特徴に対して特徴整列を行い、第1融合特徴及び第2融合特徴を取得し、第1高次特徴、第2高次特徴に対して特徴整列を行い、第1高次融合特徴及び第2高次融合特徴を取得し、第1融合特徴、第2融合特徴、第1高次融合特徴及び第2高次融合特徴に基づいて2枚の画像に同一の歩行者が含まれるか否かを特定する。画像における人体局所特徴及び高次特徴を抽出し、異なる特徴整列策略を用いて局所特徴及び高次特徴に対してそれぞれ特徴整列を行い、特徴相互間の関係を組み込み、特徴相互間の情報を統合的に利用し、より効果的な特徴を取得し、画像における異常点又は外れ点の歩行者マッチングに対する影響を低減させ、より正確的なマッチング結果を取得する。
【0132】
いくつかの実施例において、上記歩行者マッチング装置の特徴抽出モジュールは、
第1画像及び第2画像に対して、それぞれ人体局所特徴抽出を行い、第1局所特徴、第2局所特徴を取得するための局所特徴抽出サブモジュールと、
第1局所特徴に対して特徴集約を行い第1高次特徴を取得し、第2局所特徴に対して特徴集約を行い第2高次特徴を取得するための集約サブモジュールと、を備える。
【0133】
いくつかの実施例において、人体の重要なポイントは2つ以上含まれ、図11に示すように、本実施例において、上記装置の特徴抽出モジュールは、
各人体の重要なポイントが対応する局所特徴ベクトルに基づいて局所特徴が対応する第1パラメータ、第2パラメータ及び第3パラメータを学習し特定するためのパラメータ学習サブモジュール1101と、
第1パラメータ、第2パラメータ及び第3パラメータに基づき、各局所特徴ベクトルが対応するクエリ、キー及び値を生成するためのパラメータ特定サブモジュール1102と、
クエリ及びキーに基づいて、2つずつの局所特徴ベクトル間の重み係数を特定するための重み係数特定サブモジュール1103と、
任一の局所特徴ベクトルに対して、局所特徴ベクトルと他の各局所特徴ベクトルとの間の関係に基づいて、調節係数を特定するための調節係数特定サブモジュール1104と、
重み係数、調節係数及び値に基づいて、局所特徴が対応する集約特徴を取得するための集約サブモジュール1105と、
各局所特徴が対応する集約特徴によって、高次特徴をが特定されるためのものであって、局所特徴が第1局所特徴及び第2局所特徴を含み、高次特徴が第1高次特徴及び第2高次特徴を含む高次特徴特定サブモジュール1106と、を備える。
【0134】
いくつかの実施例において、図11を引き続き参照すると、上記装置の第1特徴整列モジュールは、
第1局所特徴と第2局所特徴との局所特徴類似性を算出するための局所特徴算出サブモジュール1107と、
第2局所特徴、局所特徴類似性に基づいて第2局所特徴の第1局所特徴における第1マッチング特徴を特定するための第1マッチング特徴特定サブモジュール1108と、
第1局所特徴、局所特徴類似性に基づいて第1局所特徴の第2局所特徴における第2マッチング特徴を特定するための第2マッチング特徴特定サブモジュール1109と、
第1マッチング特徴に対して特徴抽出を行い、第1融合特徴を取得し、第2マッチング特徴に対して特徴抽出を行い、第2融合特徴を取得するための特徴抽出サブモジュール1110と、を備える。
【0135】
いくつかの実施例において、上記装置の第1マッチング特徴特定サブモジュールは、局所特徴類似性と第2局所特徴との第1積を算出するための乗算ユニットと、第1積と第1局所特徴との和値を第1マッチング特徴として特定するための加算ユニットとを備える。
【0136】
いくつかの実施例において、上記装置の第2マッチング特徴特定サブモジュールは、局所特徴類似性を転置して転置後局所特徴類似性を取得するための転置ユニットと、転置後局所特徴類似性と第1局所特徴との第2積を算出するための乗算ユニットと、第2積と第2局所特徴との和値を第2マッチング特徴として特定するための加算ユニットと、を備える。
【0137】
いくつかの実施例において、図11を引き続き参照すると、上記装置の第2特徴整列モジュールは、
第1高次特徴と第2高次特徴との高次特徴類似性を算出するための高次特徴類似性算出サブモジュール1111と、
第2高次特徴、高次特徴類似性に基づいて、第2高次特徴の第1高次特徴における第1高次マッチング特徴を特定するための第1高次マッチング特定サブモジュール1112と、
第1高次特徴、高次特徴類似性に基づいて、第1高次特徴の第2高次特徴における第2高次マッチング特徴を特定するための第2高次マッチング特定サブモジュール1113と、
第1高次マッチング特徴に対して特徴抽出を行い、第1高次融合特徴を取得し、第2高次マッチング特徴に対して特徴抽出を行い、第2高次融合特徴を取得するための特徴抽出サブモジュール1114と、を備える。
【0138】
いくつかの実施例において、図11を引き続き参照すると、上記装置のマッチングモジュールは、
第1融合特徴、第1高次融合特徴に対してスプライスを行い、第1スプライス特徴を取得するための第1スプライスサブモジュール1115と、
第2融合特徴、第2高次融合特徴に対してスプライスを行い、第2スプライス特徴を取得するための第2スプライスサブモジュール1116と、
第1スプライス特徴と第2スプライス特徴との比較損失値を算出し、比較損失値に基づいて第1画像と第2画像に同一の歩行者が含まれるか否かを特定するための比較損失算出サブモジュール1117と、を備える。
【0139】
理解すべきこととして、上記実施例における各ステップの番号の大きさは実行順序の前後を意味するものではなく、各プロセスの実行順序はその機能及び固有論理で確定されるべきであり、本公開の実施例の実施プロセスを任意に限定するものではない。
【0140】
図12は本公開の実施例で提供される電子機器12の概略図である。図12に示すように、該実施例の電子機器12は、プロセッサ1201、メモリ1202、該メモリ1202内に記憶されプロセッサ1201で実行可能なコンピュータプログラム1203を備える。プロセッサ1201は、コンピュータプログラム1203を実行する時に、上記各方法実施例におけるステップを実現する。或いは、プロセッサ1201は、コンピュータプログラム1203を実行する時に、上記各装置実施例における各モジュール/ユニットの機能を実現する。
【0141】
例示として、コンピュータプログラム1203は、1つ又は複数のモジュール/ユニットに分割され、1つ又は複数のモジュール/ユニットがメモリ1202内に記憶され、プロセッサ1201によって実行されて、本公開を完成するようにしてもよい。1つ又は複数のモジュール/ユニットは、特定機能を発揮することができるシリーズのコンピュータプログラムコマンドセクションであってもよく、該コマンドセクションは、コンピュータプログラム1203が電子機器12で実行されるプロセスを説明するためのものである。
【0142】
電子機器12は、デスクトップコンピュータ、ノートパソコン、パームトップコンピュータ及びクラウドサーバ等の電子機器であってもよい。電子機器12は、プロセッサ1201及びメモリ1202を備えてもよいが、それらに限定されない。当業者であれば理解できるように、図12は電子機器12の例示に過ぎず、電子機器12を限定するものではなく、図示より多いか又は少ない部品を含み、或いはある部品や異なる部品を組み合わせることができ、例えば電子機器は、入出力機器、ネットワークアクセス機器、バスなどを含んでもよい。
【0143】
プロセッサ1201は、中央処理ユニット(Central Processing Unit,CPU)であってもよく、他の汎用プロセッサ、デジタル信号プロセッサ(Digital Signal Processor,DSP)、特定用途向け集積回路(Application SpecificIntegrated Circuit,ASIC)、フィールドプログラマブルゲートアレイ(Field-Programmable GateArray,FPGA)又は他のプログラマブルロジックデバイス、ディスクリートゲート又はトランジスタ論理デバイス、ディスクリートハードウェアコンポーネント等であってもよい。汎用プロセッサはマイクロプロセッサであってもよいし、任意の一般的なプロセッサ等であってもよい。
【0144】
メモリ1202は、電子機器12の内部記憶ユニット、例えば電子機器12のハードディスク又はRAMであってもよい。メモリ1202は、電子機器12の外部記憶機器、例えば電子機器12に装備するプラグインハードディスク、スマートメモリカード(Smart Media Card,SMC)、セキュリティデジタル(SecureDigital,SD)カード、フラッシュカード(FlashCard)等であってもよい。さらに、メモリ1202は、電子機器12の内部記憶ユニットを含むだけでなく外部記憶機器も含むことができる。メモリ1202は、コンピュータプログラムと、電子機器に所要のほかのプログラム及びデータを記憶するためのものである。メモリ1202は、出力された、又は出力されるべきデータを一時的に記憶するために用いられてもよい。
【0145】
当業者であれば、説明の利便性及び簡潔のために、上記各機能ユニット、モジュールの分割のみを例に挙げて説明したが、実際の適用において、必要に応じて上記機能を異なる機能ユニット、モジュールに割り当てて完成させることができ、すなわち装置の内部構造を異なる機能ユニット又はモジュールに分割することにより、以上に説明した全て又は一部の機能を完了することを明確に理解することができる。実施例における各機能ユニット、モジュールは一つの処理ユニットに統合されてもよく、各ユニットが単独で物理的に存在してもよく、二つ以上のユニットが一つのユニットに統合されてもよく、上記統合されたユニットはハードウェアの形式で実現されてもよく、ソフトウェア機能ユニットの形式で実現されてもよい。なお、各機能ユニット、モジュールの具体的な名称について互いに区別されやすいためのものであり、本願の保護範囲を限定するものではない。上記システムにおけるユニット、モジュールの具体的な動作過程については、前述方法の実施例における対応過程を参照することができ、ここで説明を省略する。
【0146】
上記実施例において、各実施例に対する説明はそれぞれの重点を有し、ある実施例において詳しく説明又は記載されていない部分については、他の実施例の関連説明を参照することができる。
【0147】
当業者であれば、本明細書に公開された実施例で説明された各例のユニット及びアルゴリズムステップを、電子ハードウェア、又はコンピュータソフトウェアと電子ハードウェアとの組み合わせで実現することができることを意識することができる。これらの機能がハードウェアで実行されるか、あるいはソフトウェアで実行されるかについては、技術的解決手段の特定の適用及び設計の制約条件に決められる。当業者はそれぞれの特定の適用に対して異なる方法を用いて説明された機能を実現してもよいが、このような実現は本公開の範囲を超えると考えられるべきではない。
【0148】
本公開で提供される実施例において、公開された装置/電子機器及び方法は、他の方式で実現することができると理解すべきである。例えば、上記説明された装置/電子機器の実施例は例示的なものに過ぎず、例えば、モジュール又はユニットの分けは、論理的機能分けに過ぎず、実際に実現時に他の分け方式があてもよく、例えば複数のユニット又はコンポーネントを結合するか又は他のシステムに統合することができ、又はいくつかの特徴を無視するか、あるいは実行しなくてもよい。また、表示されるか又は議論される相互間の結合又は直接結合又は通信接続はいくつかのインタフェース、装置又はユニットによる間接結合又は通信接続であってもよく、電気的、機械的又は他の形式であってもよい。
【0149】
分離部材として説明されるユニットは物理的に分離されてもよいし、又はそうでなくてもよく、ユニットとして表示される部材は物理的ユニットであってもよいし又はそうでなくてもよく、即ち1つの箇所に位置してもよいし、又は複数のネットワークユニットに分布してもよい。実際な需要に応じてそのうちの一部又は全部のユニットを選択して本実施例の方案の目的を達成することができる。
【0150】
なお、本公開における各機能ユニットは一つの処理ユニットに統合されてもよいし、各ユニットが単独で物理的に存在してもよいし、二つ以上のユニットが一つのユニットに統合されてもよい。上記統合されたユニットはハードウェアの形式で実現されてもよく、ソフトウェア機能ユニットの形式で実現されてもよい。
【0151】
統合されたモジュール/ユニットは、ソフトウェア機能ユニットの形式で実現されるとともに、独立した製品として販売されるか又は使用される場合に、コンピュータ読取可能な記憶媒体に記憶されてもよい。このような理解により、本公開は上記実施例の方法における全部又は一部のプロセスの実現について、コンピュータプログラムにより関連するハードウェアを指令して完了することができ、コンピュータプログラムをコンピュータ読み取り可能な記憶媒体に記憶することができ、該コンピュータプログラムがプロセッサにより実行される場合に、上記それぞれの方法実施例のステップを実現することができる。コンピュータプログラムは、コンピュータプログラムコードを含んでもよく、コンピュータプログラムコードはソースコード形式、オブジェクトコード形式、実行可能なファイル又はある中間形式等であってもよい。コンピュータ読み取り可能な記憶媒体は、コンピュータプログラムコードをキャリア可能な任意のエンティティ又は装置、記録媒体、Uディスク、リムーバブルハードディスク、磁気ディスク、光ディスク、コンピュータメモリ、リードオンリーメモリ(Read-Only Memory,ROM)、ランダムアクセスメモリ(Random Access Memory,RAM)、電気搬送波信号、電気通信信号及びソフトウェア配布媒体等を含んでもよい。なお、コンピュータ読み取り可能な記憶媒体に含まれた内容は司法管轄エリア内立法及び特許実践の要求に応じて適当に増減を行うことができ、例えばある司法管轄エリアにおいて、立法及び特許実践に基づいて、コンピュータ読み取り可能な記憶媒体は電気搬送波信号及び電気通信信号を含まない。
【0152】
上記した実施例は本公開の技術的解決手段を説明するためのものに過ぎず、それを限定するものではなく、前述の実施例を参照して本公開を詳細に説明したが、当業者は、依然として前述の各実施例に記載の技術的解決手段を補正してもよく、又はそのうちの一部の技術的特徴を同等置換することができるが、これらの補正又は置換が、対応する技術的解決手段の実質が本公開の各実施例の技術的解決手段の思想及び範囲から逸脱することがなく、いずれも本公開の保護範囲内に含まれるべきであることを理解すべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【国際調査報告】