IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッドの特許一覧

<>
  • 特許-人体認識方法、機器及び記憶媒体 図1
  • 特許-人体認識方法、機器及び記憶媒体 図2
  • 特許-人体認識方法、機器及び記憶媒体 図3
  • 特許-人体認識方法、機器及び記憶媒体 図4
  • 特許-人体認識方法、機器及び記憶媒体 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-04-08
(45)【発行日】2022-04-18
(54)【発明の名称】人体認識方法、機器及び記憶媒体
(51)【国際特許分類】
   G06T 7/292 20170101AFI20220411BHJP
   G06T 7/70 20170101ALI20220411BHJP
   H04N 7/18 20060101ALI20220411BHJP
【FI】
G06T7/292
G06T7/70 A
H04N7/18 K
【請求項の数】 16
(21)【出願番号】P 2020526101
(86)(22)【出願日】2019-06-04
(65)【公表番号】
(43)【公表日】2021-01-28
(86)【国際出願番号】 CN2019089969
(87)【国際公開番号】W WO2020007156
(87)【国際公開日】2020-01-09
【審査請求日】2020-05-12
(31)【優先権主張番号】201810719692.3
(32)【優先日】2018-07-03
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】512015127
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
(74)【代理人】
【識別番号】110002952
【氏名又は名称】特許業務法人鷲田国際特許事務所
(72)【発明者】
【氏名】ワン ジャン
(72)【発明者】
【氏名】リ シュビン
(72)【発明者】
【氏名】カン リ
(72)【発明者】
【氏名】リュウ ゼユ
(72)【発明者】
【氏名】チ ジジェン
(72)【発明者】
【氏名】ジャン チェンユー
(72)【発明者】
【氏名】リュウ シャオ
(72)【発明者】
【氏名】ソン ハオ
(72)【発明者】
【氏名】ウェン シレイ
(72)【発明者】
【氏名】バオ インゼ
(72)【発明者】
【氏名】チェン ミンユー
(72)【発明者】
【氏名】ディン エルイ
【審査官】秦野 孝一郎
(56)【参考文献】
【文献】特表2016-521892(JP,A)
【文献】特開2017-17441(JP,A)
【文献】特開2016-139949(JP,A)
【文献】特開2017-174105(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
人体認識方法であって、
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定するステップと、
三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算するステップと、
カメラごとについて、前記カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定するステップと、
人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行うステップと、を含むことを特徴とする人体認識方法。
【請求項2】
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する前記ステップの前に、
歩行者再認識技術ReIDを用いてシーンにおける複数のカメラによって収集された画像に対して人体認識を行い、複数のカメラでのターゲット人物の対応関係を得るステップと、
複数のカメラでのターゲット人物の対応関係に基づき、少なくとも2台のカメラによって収集されたターゲット人物の入る画像を選別するステップと、をさらに含むことを特徴とする請求項1に記載の方法。
【請求項3】
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する前記ステップは、
任意の2台のカメラで同時刻に収集されたターゲット人物の入る画像を選出するステップと、
前記2台のカメラによって収集されたターゲット人物の入る画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスをそれぞれ取得するステップであって、前記カメラマトリックスは既知のカメラパラメータに基づいて取得される、ステップと、
前記画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得るステップと、を含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得る前記ステップは、
とXはそれぞれ、前記2台のカメラでの前記画像内のターゲット人物の座標であり、PはXに対応するカメラのカメラマトリックスであり、PはXに対応するカメラのカメラマトリックスであるとみなすステップであって、X、Xと三次元空間における前記ターゲット人物の座標Wとは以下のような対応関係があり、
=P*W、X=P*W、
そのうち、*は乗算を表す、ステップを含むことを特徴とする請求項3に記載の方法。
【請求項5】
三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算する前記ステップは、
=P*Wであるようにするステップであって、
そのうち、Uはi番目のカメラでのWの逆投影座標であり、Pはi番目のカメラのカメラマトリックスであり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、ステップと、
=U-Xであるようにするステップであって、
そのうち、eはi番目のカメラでの逆投影エラーであり、Xはi番目のカメラに対応する画像内での前記ターゲット人物の座標であり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数であるステップと、を含むことを特徴とする請求項4に記載の方法。
【請求項6】
前記カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定する前記ステップは、
前記カメラの逆投影エラーがプリセットの閾値より大きい場合、前記カメラは人体認識エラーがあると決定するステップを含むことを特徴とする請求項1に記載の方法。
【請求項7】
前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行う前記ステップの後に、
異なるカメラに対応する画像内での前記ターゲット人物の座標、及び、画像タグを取得するステップと、
前記座標と画像タグを監視プラットフォームに送信するステップと、をさらに含むことを特徴とする請求項1~請求項6のいずれか1項に記載の方法。
【請求項8】
人体認識機器であって、
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定するための決定モジュールと、
三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算するための計算モジュールと、
カメラごとについて、前記カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定するための判別モジュールと、
人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行うための認識モジュールと、を含むことを特徴とする人体認識機器。
【請求項9】
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する前に、歩行者再認識技術ReIDを用いてシーンにおける複数のカメラによって収集された画像に対して人体認識を行い、複数のカメラでのターゲット人物の対応関係を得て、
複数のカメラでのターゲット人物の対応関係に基づき、少なくとも2台のカメラによって収集されたターゲット人物の入る画像を選別するための予め認識モジュールをさらに含むことを特徴とする請求項8に記載の機器。
【請求項10】
前記決定モジュールは
意の2台のカメラで同時刻に収集されたターゲット人物の入る画像を選出し、
前記2台のカメラによって収集されたターゲット人物の入る画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスをそれぞれ取得し、そのうち、前記カメラマトリックスは既知のカメラパラメータに基づいて取得されるものであり、
前記画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得るためのものであることを特徴とする請求項8に記載の機器。
【請求項11】
前記画像内のターゲット人物の座標、及び2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得ることは、
とXはそれぞれ、2台のカメラでの前記画像内のターゲット人物の座標であり、PはXに対応するカメラのカメラマトリックスであり、PはXに対応するカメラのカメラマトリックスであるとみなすことであって、X、Xと三次元空間における前記ターゲット人物の座標Wとは以下のような対応関係があり、
=P*W、X=P*W、
そのうち、*は乗算を表す、前記みなすことを含むことを特徴とする請求項10に記載の機器。
【請求項12】
三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算することは、
=P*Wであるようにすることであって、
そのうち、Uはi番目のカメラでのWの逆投影座標であり、Pはi番目のカメラのカメラマトリックスであり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、前記することと、
=U-Xであるようすることであって、
そのうち、eはi番目のカメラでの逆投影エラーであり、Xはi番目のカメラに対応する画像内での前記ターゲット人物の座標であり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、前記することと、を含むことを特徴とする請求項11に記載の機器。
【請求項13】
前記判別モジュールは
記カメラの逆投影エラーがプリセットの閾値より大きい場合、前記カメラは人体認識エラーがあると決定するためのものであることを特徴とする請求項8に記載の機器。
【請求項14】
前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行った後に、異なるカメラに対応する画像内での前記ターゲット人物の座標、及び、画像タグを取得し、
前記座標と画像タグを監視プラットフォームに送信するための送信モジュールをさらに含むことを特徴とする請求項8~請求項13のいずれか1項に記載の機器。
【請求項15】
サーバであって、プロセッサとメモリを含み、メモリには前記プロセッサによる実行可能な命令が記憶され、そのうち、前記プロセッサは、前記実行可能な命令を実行することで請求項1~請求項7のいずれか1項に記載の人体認識方法を実行させるように構成されていることを特徴とするサーバ。
【請求項16】
コンピュータプログラムを記憶するコンピュータ可読記憶媒体であって、当該コンピュータプログラムがプロセッサによって実行されると、請求項1~請求項7のいずれか1項に記載の人体認識方法を実現することを特徴とするコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像認識技術の分野に関し、特に人体認識方法、機器及び記憶媒体に関する。
【背景技術】
【0002】
監視技術の発展に伴い、配備されているカメラの数は徐々に増加し、これによりクローズドシーンでの人体に対するリアルタイム追跡と認識を可能にする。
【0003】
現在、多視点条件での複数人追跡と認識は、主に二次元画像情報に依存し、人体が二次元画像におけるセマンティック特徴により人体に対するクロスカメラの認識と関連付けを行う。
【0004】
しかしながら、複数のカメラで呈する人体の姿勢の違いは非常に大きい場合があり、これによって二次元画像における人体の視覚的特徴は大きな偏差があるようになった。これにより、二次元画像で提供された情報をもって行われるクロスカメラの認識も、精度が低く、人体認識エラーが発生しやすくなった。
【0005】
「関連出願の相互参照」
本願は、2018年7月3日に中国特許局に提出した、出願番号が2018107196923であり、出願人が百度在線網絡技術(北京)有限公司で、発明の名称が「人体認識方法、機器及び記憶媒体」である中国特許出願の優先権を主張し、その開示内容の全ては援用により本願に組み入れられる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、人体認識方法、機器及び記憶媒体を提供し、人体再認識技術において人体の三次元空間座標を導入することで、画像の認識結果に対して予め判断の処理を行い、且つ認識エラーのある画像を再認識し、これにより、人体認識結果の精度を効率的に高めることができる。
【課題を解決するための手段】
【0007】
第1の態様では、本発明は、人体認識方法を提供し、
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定するステップと、
三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算するステップと、
カメラごとについて、前記カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定するステップと、
人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行うステップと、を含む。
【0008】
本実施例において、人体再認識技術において人体の三次元空間座標を導入することで、画像の認識結果に対して予め判断の処理を行い、認識エラーのある画像を再認識し、これにより、人体認識結果の精度を効率的に高めることができる。
【0009】
1つの可能な設計では、少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定するステップの前に、
歩行者再認識技術ReIDを用いてシーンにおける複数のカメラによって収集された画像に対して人体認識を行い、複数のカメラでのターゲット人物の対応関係を得るステップと、
複数のカメラでのターゲット人物の対応関係に基づき、少なくとも2台のカメラによって収集されたターゲット人物の入る画像を選別するステップと、をさらに含む。
【0010】
本実施例において、シーンに少なくとも2台のカメラを予め配置し、カメラごとの観察視点が異なり、これらのカメラを介してシーンにおける人体の活動に対して追跡と認識を行うことができ、歩行者再認識技術ReIDによってターゲット人物と複数のカメラとの対応関係を得て、これによりターゲット人物の入る画像を取得して、ターゲット人物の追跡精度を向上させる。
【0011】
1つの可能な設計では、少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する前記ステップは、
任意の2台のカメラで同時刻に収集されたターゲット人物の入る画像を選出するステップと、
前記2台のカメラによって収集されたターゲット人物の入る前記画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスをそれぞれ取得するステップであって、前記カメラマトリックスは、既知のカメラパラメータに基づいて取得される、ステップと、
前記画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得るステップと、を含む。
【0012】
本実施例において、ターゲット人物の入る画像内のターゲット人物の座標、及び、2台のカメラのカメラマトリックスによって、三次元空間におけるターゲット人物の座標を正確に算出することができる。
【0013】
1つの可能な設計では、前記画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得る前記ステップは、
とXはそれぞれ、前記2台のカメラでの前記画像内のターゲット人物の座標であり、PはXに対応するカメラのカメラマトリックスであり、PはXに対応するカメラのカメラマトリックスであるとみなすステップであって、X、Xと三次元空間における前記ターゲット人物の座標Wとは以下のような対応関係があり、
=P*W、X=P*W、
そのうち、*は乗算を表す、ステップを含む。
【0014】
1つの可能な設計では、三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算する前記ステップは、
=P*Wであるようにするステップであって、
そのうち、Uはi番目のカメラでのWの逆投影座標、Pはi番目のカメラのカメラマトリックスであり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、ステップと、
=U-Xであるようにするステップであって、
そのうち、eはi番目のカメラでの逆投影エラーであり、Xはi番目のカメラに対応する画像内での前記ターゲット人物の座標、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、ステップと、を含む。
【0015】
本実施例において、三次元空間における座標、及び、カメラのカメラマトリックスに基づいてカメラによって収集された画像での三次元空間における座標の逆投影座標を計算し、当該逆投影座標と、カメラによって収集された画像内の対応する座標(既存の二次元画像座標アルゴリズムに従って得たものである)との差を計算し、三次元空間における座標に対応する逆投影エラーを正確に計算することができる。
【0016】
1つの可能な設計では、カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定する前記ステップは、
前記カメラの逆投影エラーがプリセットの閾値より大きい場合、前記カメラは人体認識エラーがあると決定するステップを含む。
【0017】
本実施例において、逆投影エラーを利用して人体認識結果を評価し、これにより人体認識結果をより正確にすることができる。
【0018】
1つの可能な設計では、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行う前記ステップの後に、
異なるカメラに対応する画像内での前記ターゲット人物の座標、及び、画像タグを取得するステップと、
前記座標と画像タグを監視プラットフォームに送信するステップとをさらに含む。
【0019】
本実施例において、取得した異なるカメラに対応する画像内でのターゲット人物の座標、及び、画像タグを監視プラットフォームに送信し、これによりターゲット人物に対する監視プラットフォームの監視が正確であるようにすることができる。
【0020】
第2の態様では、本発明の実施例は、人体認識機器を提供し、
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定するための決定モジュールと、
三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算するための計算モジュールと、
カメラごとについて、前記カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定するための判別モジュールと、
人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行うための認識モジュールと、を含む。
【0021】
1つの可能な設計では、
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する前に、歩行者再認識技術ReIDを用いてシーンにおける複数のカメラによって収集された画像に対して人体認識を行い、複数のカメラでのターゲット人物の対応関係を得て、
複数のカメラでのターゲット人物の対応関係に基づき、少なくとも2台のカメラによって収集されたターゲット人物の入る画像を選別するための予め認識モジュールをさらに含む。
【0022】
1つの可能な設計では、前記決定モジュールは
意の2台のカメラで同時刻に収集されたターゲット人物の入る画像を選出し、
前記2台のカメラによって収集されたターゲット人物の入る画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスをそれぞれ取得し、そのうち、前記カメラマトリックスは既知のカメラパラメータに基づいて取得されるものであり、
前記画像内のターゲット人物の座標、及び、前記2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得るためのものである。
【0023】
1つの可能な設計では、前記画像内のターゲット人物の座標、及び、2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得ることは、
とXはそれぞれ、2台のカメラでの前記画像内のターゲット人物の座標であり、PはXに対応するカメラのカメラマトリックスであり、PはXに対応するカメラのカメラマトリックスであるとみなすことであって、X、Xと三次元空間における前記ターゲット人物の座標Wとは以下のような対応関係があり、
=P*W、X=P*W、
そのうち、*は乗算を表す、前記みなすことを含む。
【0024】
1つの可能な設計では、三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算することは、
=P*Wであるようにすることであって、
そのうち、Uはi番目のカメラでのWの逆投影座標であり、Pはi番目のカメラのカメラマトリックスであり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、前記することと、
=U-Xであるようにすることであって、
そのうち、eはi番目のカメラでの逆投影エラーであり、Xはi番目のカメラに対応する画像内での前記ターゲット人物の座標であり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、前記することと、を含む。
【0025】
1つの可能な設計では、前記判別モジュールは
記カメラの逆投影エラーがプリセットの閾値より大きい場合、前記カメラは人体認識エラーがあると決定するためのものである。
【0026】
1つの可能な設計では、
前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行った後に、異なるカメラに対応する画像内での前記ターゲット人物の座標、及び、画像タグを取得し、
前記座標と画像タグを監視プラットフォームに送信するための送信モジュールをさらに含む。
【0027】
第3の態様では、本発明の実施例は、プロセッサとメモリを含むサーバを提供し、メモリには前記プロセッサによる実行可能な命令が記憶され、そのうち、前記プロセッサは、前記実行可能な命令を実行することで第1の態様のいずれか1項に記載の人体認識方法を実行させるように構成されている。
【0028】
第4の態様では、本発明の実施例は、コンピュータプログラムを記憶するコンピュータ可読記憶媒体を提供し、当該プログラムがプロセッサによって実行されると、第1の態様のいずれか1項に記載の人体認識方法を実現する。
【発明の効果】
【0029】
本発明に係る人体認識方法、機器及び記憶媒体は、少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定し、三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算し、カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定し、人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行う。本発明は、人体再認識技術において人体の三次元空間座標を導入することで、画像の認識結果に対して予め判断の処理を行い、認識エラーのある画像を再認識し、これにより、人体認識結果の精度を効率的に高めることができる。
【図面の簡単な説明】
【0030】
本発明の実施例又は従来技術の技術的解決手段をより明確に説明するため、以下に実施例又は従来技術の記述において必要な図面を用いて簡単に説明を行うが、当然ながら、以下に記載する図面は本発明のいくつかの実施例であり、当業者であれば、創造的な労力を要することなく、これらの図面に基づいて他の図面に想到しうる。
図1】本発明の1つの応用シーンの概略構造図である。
図2】本発明の実施例1に係る人体認識方法のフローチャートである。
図3】本発明の実施例2に係る人体認識機器の概略構造図である。
図4】本発明の実施例3に係る人体認識機器の概略構造図である。
図5】本発明の実施例4に係るサーバである。
【発明を実施するための形態】
【0031】
本発明の実施例の目的、技術的解決手段及び利点をより明瞭にするために、以下、本発明の実施例に係る図面を参照しながら、その技術的解決手段について明瞭、且つ完全に説明し、当然のことながら、記載される実施例は本発明の実施例の一部にすぎず、そのすべての実施例ではない。当業者は、本発明における実施例に基づいて創造的な労働を要することなく、取得されたその他のすべての実施例は、いずれも本発明の保護範囲に属する。
【0032】
本発明の明細書と特許請求の範囲、及び、上記の図面における用語「第1」、「第2」、「第3」、「第4」など(存在する場合)は、類似の対象を区別するためのものであり、特定の順序又はシーケンスを説明するためのものである必要はない。本明細書に説明する本発明の実施例を、例えば、本明細書で図示又は説明したもの以外の順序で実施できるように、使用されるデータを適宜交換できると理解すべきである。また、「含む」と「持つ」という用語、及び、それらの任意の変形は、いずれも非排他的含有を網羅することを意図し、例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品、又はデバイスは、明示的にリストされているステップ又はユニットに限定される必要はなく、明示的にリストされていないもの、又は、これらのプロセス、方法、製品又はデバイスに固有の他のステップ又はユニットを含んでもよい。
【0033】
以下、具体的な実施例をもって本発明の技術的解決手段を詳細に説明する。以下のこのいくつかの具体的な実施例は、互いに組み合わせられることができ、いくつかの実施例では同様又は類似のコンセプト又はプロセスを繰り返して説明しない場合がある。
【0034】
以下、当業者が理解できるように、本願における用語の一部を解釈して説明する。
【0035】
1)歩行者再認識技術(Person re-identification、略称ReID)は、コンピュータビジョンテクノロジーを使用して画像又はビデオシーケンスには特定の歩行者が存在するかどうかを判断する技術である。画像検索の副問題として広く考えられている。監視対象としての歩行者画像を与え、クロスデバイスでの当該歩行者画像を検索する。これは、現在の固定されているカメラの視覚的な制限を補うように設計され、さらに、歩行者検出/歩行者追跡技術と組み合わせることができ、インテリジェントビデオ監視、インテリジェントセキュリティなどの分野で広く適用できる。
【0036】
1つのシーンにおいて、異なる視点からシーンにおける人体の活動を観察できる複数のカメラを予め配置した。具体的に、図1は、本発明の1つの応用シーンの概略構造図であり、図1に示すように、シーンにおける全てのカメラは、カメラグループ10を構成し、カメラグループ10における異なるカメラ11は、収集されたターゲット人物の画像をサーバ20に送信し、サーバ20は、少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する。本実施例での三次元空間はシーンにおける空間のことを指す。サーバ20は、三次元空間におけるターゲット人物の座標に基づいて異なるカメラ11でのターゲット人物の逆投影エラーをそれぞれ計算し、カメラ11の逆投影エラーに基づいてカメラ11は人体認識エラーがあるかどうかを決定し、人体認識エラーがある場合、ターゲット人物の入る全てのカメラ11の逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いてカメラ11でのターゲット人物に対して改めて再認識処理を行う。サーバ20は、最終的に認識した異なるカメラでのターゲット人物に対応する画像内での座標、及び、画像タグを監視プラットフォーム30に送信する。本実施例は人体再認識技術において人体の三次元空間座標を導入することで、画像の認識結果に対して予め判断の処理を行い、認識エラーのある画像を再認識し、これにより、人体認識結果の精度を効率的に高めることができる。
【0037】
以下、具体的な実施例をもって本発明の技術的解決手段及び本願の技術的解決手段で上記技術的課題を如何に解決するかを詳細に説明する。以下のこのいくつかの具体的な実施例は、互いに組み合わせられることができ、いくつかの実施例では同様又は類似のコンセプト又はプロセスを繰り返して説明しない場合がある。以下、図面を参照しながら、本発明の実施例を説明する。
【0038】
図2は、本発明の実施例1に係る人体認識方法のフローチャートであり、図2に示すように、本実施例での方法は以下のステップを含むことができる。
【0039】
S101において、少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する。
【0040】
1つ選択的な実施形態では、任意の2台のカメラで同時刻に収集されたターゲット人物の入る画像を選出し、2台のカメラによって収集されたターゲット人物の入る画像内のターゲット人物の座標、及び、2台のカメラのカメラマトリックスをそれぞれ取得し、そのうち、前記カメラマトリックスは既知のカメラパラメータに基づいて取得したものであり、前記画像内のターゲット人物の座標、及び、2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得ることができる。
【0041】
本実施例において、シーンに複数のカメラを予め配置し、カメラごとの観察視点が異なり、これらのカメラを介してシーンにおける人体の活動に対して追跡と認識を行うことができる。1つ選択的な実施形態では、歩行者再認識技術ReIDを用いてシーンにおける複数のカメラによって収集された画像に対して人体認識を行い、複数のカメラでのターゲット人物の対応関係を得て、複数のカメラでのターゲット人物の対応関係に基づき、少なくとも2台のカメラによって収集されたターゲット人物の入る画像を選別することができる。
【0042】
具体的に、XとXはそれぞれ、2台のカメラでの前記画像内のターゲット人物の座標であり、PはXに対応するカメラのカメラマトリックスであり、PはXに対応するカメラのカメラマトリックスであると仮定すると、X、Xと三次元空間における前記ターゲット人物の座標Wとは以下のような対応関係があり、
=P*W、X=P*W、
そのうち、*は乗算を表す。
【0043】
S102において、三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算する。
【0044】
本実施例において、三次元空間における座標、及び、カメラのカメラマトリックスに基づいてカメラによって収集された画像での三次元空間における座標の逆投影座標を計算し、当該逆投影座標と、カメラによって収集された画像内の対応する座標(既存の二次元画像座標アルゴリズムに従って得たものである)との差を計算し、対応する逆投影エラーを得ることができる。
【0045】
1つ選択的な実施形態では、三次元空間におけるターゲット人物の座標Wをすでに得たと仮定し、U=P*Wであるようにし、
そのうち、Uはi番目のカメラでのWの逆投影座標であり、Pはi番目のカメラのカメラマトリックスであり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数であり、
=U-Xであるようにし、
そのうち、eはi番目のカメラでの逆投影エラーであり、Xはi番目のカメラに対応する画像内での前記ターゲット人物の座標であり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である。
【0046】
S103において、カメラごとについて、前記カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定する。
【0047】
本実施例において、逆投影エラーの大きさによってカメラに対応する画像は人体認識エラーがあるかどうかを決定することができる。1つの選択的な実施形態では、とあるカメラの逆投影エラーがプリセットの閾値より大きい場合、前記カメラは人体認識エラーがあると決定する。とあるカメラの逆投影エラーがプリセットの閾値より大きくない場合、前記カメラの人体認識結果が正しいと決定する。
【0048】
S104において、人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行う。
【0049】
本実施例において、従来の歩行者再認識技術ReIDによって人体認識エラーのあるカメラでのターゲット人物に対して再認識処理を行い、これにより、認識エラーの結果を効率的に除外し、人体認識の精度を高めることができる。
【0050】
1つ選択的な実施形態では、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行った後に、さらに、最後、異なるカメラに対応する画像内での前記ターゲット人物の座標、及び、画像タグを取得し、前記座標と画像タグを監視プラットフォームに送信する。
【0051】
本実施例において、少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定し、三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算し、カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定し、人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行う。本発明は、人体再認識技術において人体の三次元空間座標を導入することで、画像の認識結果に対して予め判断の処理を行い、認識エラーのある画像を再認識し、これにより、人体認識結果の精度を効率的に高めることができる。
【0052】
図3は、本発明の実施例2に係る人体認識機器の概略構造図であり、図3に示すように、本実施例に係る人体認識機器は、
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定するための決定モジュール41と、
三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算するための計算モジュール42と、
カメラごとについて、前記カメラの逆投影エラーに基づいて前記カメラは人体認識エラーがあるかどうかを決定するための判別モジュール43と、
人体認識エラーがある場合、前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行うための認識モジュール44と、を含むことができる。
【0053】
1つの可能な設計では、前記決定モジュール41は
意の2台のカメラで同時刻に収集されたターゲット人物の入る画像を選出し、
2台のカメラによって収集されたターゲット人物の入る画像内のターゲット人物の座標、及び、2台のカメラのカメラマトリックスをそれぞれ取得し、そのうち、前記カメラマトリックスは既知のカメラパラメータに基づいて取得したものであり、
前記画像内のターゲット人物の座標、及び、2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得るためのものである。
【0054】
1つの可能な設計では、前記画像内のターゲット人物の座標、及び、2台のカメラのカメラマトリックスに基づき、三次元空間におけるターゲット人物の座標を得ることは、
とXはそれぞれ、2台のカメラでの前記画像内のターゲット人物の座標であり、PはXに対応するカメラのカメラマトリックスであり、PはXに対応するカメラのカメラマトリックスであるとみなすことであって、X、Xと三次元空間における前記ターゲット人物の座標Wとは以下のような対応関係があり、
=P*W、X=P*W、
そのうち、*は乗算を表す、前記みなすことを含む。
【0055】
1つの可能な設計では、三次元空間における前記ターゲット人物の座標に基づいて異なるカメラでの前記ターゲット人物の逆投影エラーをそれぞれ計算することは、
=P*Wであるようにすることであって、
そのうち、Uはi番目のカメラでのWの逆投影座標であり、Pはi番目のカメラのカメラマトリックスであり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、前記することと、
=U-Xであるようにすることであって、
そのうち、eはi番目のカメラでの逆投影エラーであり、Xはi番目のカメラに対応する画像内での前記ターゲット人物の座標であり、i=1、2、3・・・Nであり、Nはターゲット人物の入る画像を収集したカメラの総数である、前記することと、を含む。
【0056】
1つの可能な設計では、前記判別モジュール43は
記カメラの逆投影エラーがプリセットの閾値より大きい場合、前記カメラは人体認識エラーがあると決定するためのものである。
【0057】
本実施例に係る人体認識機器は、上記いずれか1つの方法の実施例の方法における技術的解決手段を実行することができ、その実現原理及び技術的効果は類似し、本実施例では繰り返して説明しない。
【0058】
図4は、本発明の実施例3に係る人体認識機器の概略構造図である。図4に示すように、図3に示すような機器を基にし、本実施例に係る人体認識機器は、
少なくとも2台のカメラによって収集されたターゲット人物の入る画像に基づき、三次元空間におけるターゲット人物の座標を決定する前に、歩行者再認識技術ReIDを用いてシーンにおける複数のカメラによって収集された画像に対して人体認識を行い、複数のカメラでのターゲット人物の対応関係を得て、
複数のカメラでのターゲット人物の対応関係に基づき、少なくとも2台のカメラによって収集されたターゲット人物の入る画像を選別するための予め認識モジュール45をさらに含むことができる。
【0059】
1つの可能な設計では、
前記ターゲット人物の入る全てのカメラの逆投影エラーがプリセットの閾値より大きくなくなるまで、歩行者再認識技術ReIDを用いて前記カメラでのターゲット人物に対して改めて再認識処理を行った後に、異なるカメラに対応する画像内での前記ターゲット人物の座標、及び、画像タグを取得し、
前記座標と画像タグを監視プラットフォームに送信するための送信モジュール46をさらに含む。
【0060】
本実施例に係る人体認識機器は、上記いずれか1つの方法の実施例の方法における技術的解決手段を実行することができ、その実現原理及び技術的効果は類似し、本実施例では繰り返して説明しない。
【0061】
図5は、本発明の実施例4に係るサーバであり、図5に示すように、本実施例におけるサーバ50は、プロセッサ51とメモリ52を含む。
【0062】
メモリ52は、コンピュータプログラム(例えば、上記人体認識方法を実現するアプリケーションプログラム、機能モジュールなど)、コンピュータ命令などを記憶するためのものであり、上記のコンピュータプログラム、コンピュータ命令などは、1つ又は複数のメモリ52に仕切りに記憶されてもよい。さらに、上記のコンピュータプログラム、コンピュータ命令、データなどは、プロセッサ51によって呼び出されることができる。
【0063】
プロセッサ51は、前記メモリ52が記憶する前記コンピュータプログラムを実行することで、上記実施例に係る方法における各ステップを実現するためのものである。具体的に、前の方法の実施例における関連説明を参照することができる。そのうち、メモリ52、プロセッサ51は、バス53を介して結合的に接続されてもよい。
【0064】
本実施例に係るサーバは、上記いずれか1つの方法の実施例の方法における技術的解決手段を実行することができ、その実現原理及び技術的効果は類似し、本実施例では繰り返して説明しない。
【0065】
また、本願の実施例はさらに、コンピュータによる実行の命令を記憶するコンピュータ可読記憶媒体を提供し、当該コンピュータによる実行の命令がユーザデバイスの少なくとも1つのプロセッサによって実行される場合、ユーザデバイスは上記様々可能な方法を実行する。
【0066】
そのうち、コンピュータ可読媒体は、コンピュータ記憶媒体と通信媒体を含み、そのうち、通信媒体は、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む。記憶媒体は、汎用又は専用コンピュータからアクセスできる任意の利用可能な媒体であってもよい。例示的な記憶媒体は、プロセッサが当該記憶媒体から情報を読み取り、当該記憶媒体に情報を書き込むことができるように、プロセッサに結合される。当然ながら、記憶媒体はまた、プロセッサを構成する一部であってもよい。プロセッサと記憶媒体は、ASICにあってもよい。なお、当該ASICは、ユーザデバイスにあってもよい。当然ながら、プロセッサと記憶媒体もディスクリートコンポーネントとして通信デバイスに存在してもよい。
【0067】
当業者であれば、上記各方法の実施例を実現するすべて又は一部のステップはプログラムコマンドに関連するハードウェアにより完了することができると理解すべきである。前述のプログラムはコンピュータ読み取り可能な記憶媒体に記憶することができる。該プログラムを実行する場合、上記各方法の実施例を含むステップを実行し、前述の記憶媒体は、ROM、RAM、磁気ディスク又はコンパクトディスクなどのプログラムコードを記憶できる様々な媒体を含む。
【0068】
最後に説明すべきものとして、以上の各実施例は、本発明の技術的解決手段を説明するためのものであって、これを制限するものではなく、前述の各実施例を参照しながら本発明を詳細に説明するが、当業者であれば、依然として前述の各実施例に記載の技術的解決手段を修正するか、又はそのうちの一部又はすべての技術的特徴に対して同等置換を行うことができ、これらの修正又は置換は、対応する技術的解決手段の本質を本発明の各実施例の技術的解決手段の範囲から逸脱しないと理解すべきである。
図1
図2
図3
図4
図5