特許7182021 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ベイジン・センスタイム・テクノロジー・デベロップメント・カンパニー・リミテッドの特許一覧

特許7182021キーポイント検出方法、キーポイント検出装置、電子機器及び記憶媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-11-22

(45)【発行日】2022-12-01

(54)【発明の名称】キーポイント検出方法、キーポイント検出装置、電子機器及び記憶媒体

(51)【国際特許分類】

G06T 7/00 20170101AFI20221124BHJP

G06T 7/60 20170101ALI20221124BHJP

G06V 10/426 20220101ALI20221124BHJP

G06V 10/82 20220101ALI20221124BHJP

【ＦＩ】

G06T7/00 300F

G06T7/00 350C

G06T7/60 180A

G06V10/426

G06V10/82

【請求項の数】 15

(21)【出願番号】P 2021565761

(86)(22)【出願日】2021-02-10

(65)【公表番号】

(43)【公表日】2022-10-17

(86)【国際出願番号】 CN2021076467

(87)【国際公開番号】W WO2022001123

(87)【国際公開日】2022-01-06

【審査請求日】2021-11-04

(31)【優先権主張番号】202010622135.7

(32)【優先日】2020-06-30

(33)【優先権主張国・地域又は機関】CN

(73)【特許権者】

【識別番号】321006888

【氏名又は名称】ベイジン・センスタイム・テクノロジー・デベロップメント・カンパニー・リミテッド

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】金晟

(72)【発明者】

【氏名】▲劉▼文▲韜▼

(72)【発明者】

【氏名】▲錢▼晨

【審査官】新井則和

(56)【参考文献】

【文献】米国特許出願公開第２０２０／００６５６１２（ＵＳ，Ａ１）

【文献】米国特許第１０６４３０８５（ＵＳ，Ｂ１）

【文献】欧州特許出願公開第３６０５３９４（ＥＰ，Ａ１）

【文献】中国特許出願公開第１１１３４１４３８（ＣＮ，Ａ）

【文献】中国特許出願公開第１１０５３２８７３（ＣＮ，Ａ）

【文献】Alejandro Newell et al.，Associative Embedding: End-to-End Learning for Joint Detection and Grouping，[オンライン]，2016年11月16日，[検索日 2022.11.02], インターネット: <URL:https://arxiv.org/pdf/1611.05424.pdf>

【文献】Yue Wang et al.，Dynamic Graph CNN for Learning on Point Clouds， [オンライン]，2018年01月24日，[検索日 2022.11.02], インターネット: <URL:https://arxiv.org/pdf/1801.07829.pdf>

【文献】Sheng Jin et al.，Differentiable Hierarchical Graph Grouping for Multi-Person Pose Estimation， [オンライン]，2020年07月23日，[検索日 2022.11.02], インターネット: <URL:https://arxiv.org/pdf/2007.11864.pdf>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００－７／９０

Ｇ０６Ｖ１０／００－１０／９８

(57)【特許請求の範囲】

【請求項1】

検出すべき画像を取得するステップと、
前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するステップであって、前記画像特徴マップは前記検出すべき画像中の各目標対象間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する、ステップと、
前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するステップであって、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である、ステップと、
処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るステップと、を含む、キーポイント検出方法。

【請求項2】

前記キーポイントの情報は位置情報、カテゴリ情報及び画素特徴情報を含み、
前記キーポイントヒートマップに基づいて各キーポイントの位置情報を決定するステップと、
各前記キーポイントの位置情報に基づいて前記画像特徴マップから前記キーポイントの画素特徴情報を抽出し、且つ前記キーポイントの所属するキーポイントヒートマップのカテゴリラベルに基づいて前記キーポイントに対応するカテゴリ情報を決定するステップと、により、前記初期キーポイントグラフィックモデル中の各キーポイントの情報を決定する
請求項１に記載のキーポイント検出方法。

【請求項3】

前記初期キーポイントグラフィックモデル中の各前記キーポイントに対して、前記キーポイントの情報、及び前記キーポイントグラフィックモデルにおける前記キーポイントの間に接続辺が存在する他のキーポイントの情報に基づいて、前記キーポイントの融合特徴を決定するステップを更に含み、
前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップは、
前記初期キーポイントグラフィックモデルに含まれる各前記キーポイントの融合特徴に基づいて、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップを含む
請求項１に記載のキーポイント検出方法。

【請求項4】

前記処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップは、
現在キーポイントグラフィックモデルに対して第１処理プロセスを実行するステップであって、
前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、クラスタリングされた複数の隣接キーポイントを含む少なくとも１つのマクロノードを得、各前記マクロノードに含まれるキーポイントの融合特徴に基づいて前記マクロノードの融合特徴を決定するステップと、
得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む、第１処理プロセスを実行するステップと、
今回の前記第１処理プロセスを実行した後、今回の枝刈り処理後のキーポイントグラフィックモデルを現在キーポイントグラフィックモデルとし、今回決定された前記マクロノード及び前記マクロノードの融合特徴を前記現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴とし、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記第１処理プロセスを再度実行するステップと、を含む
請求項１～３のいずれか一項に記載のキーポイント検出方法。

【請求項5】

前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップは、
前記接続辺に対応する２つのキーポイントの融合特徴に基づいて前記接続辺の重みを決定するステップであって、前記重みは前記接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、ステップと、
前記現在キーポイントグラフィックモデルに含まれる各接続辺の重みに基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップと、を含む
請求項４に記載のキーポイント検出方法。

【請求項6】

前記得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップは、
前記得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定し、且つ前記現在キーポイントグラフィックモデルから前記削除すべき接続辺を削除するステップと、
前記少なくとも１つの前記マクロノード、及び前記現在キーポイントグラフィックモデルにおける前記マクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む
請求項４に記載のキーポイント検出方法。

【請求項7】

前記得られた少なくとも１つのマクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定するステップは、
前記少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するステップを含む
請求項６に記載のキーポイント検出方法。

【請求項8】

前記少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するステップは、
前記現在キーポイントグラフィックモデルにおけるいずれかの接続辺に対して、このいずれかの接続辺に対応する２つのキーポイントが異なるマクロノード中のキーポイントであり、且つこのいずれかの接続辺に対応する２つのマクロノードにカテゴリ情報が同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、
このいずれかの接続辺に対応する２つのキーポイントが同一マクロノード中のキーポイントである場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、
このいずれかの接続辺に対応する２つのキーポイントの一方がマクロノード中のキーポイントであり、他方がマクロノード中のキーポイントでなく、且つこのいずれかの接続辺に対応する前記マクロノードに他方のキーポイントのカテゴリ情報と同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、を含む
請求項７に記載のキーポイント検出方法。

【請求項9】

前記各目標対象のキーポイント情報は事前トレーニング済み目標ニューラルネットワークによって生成され、前記目標ニューラルネットワークはマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして得られたものであり、前記マクロノード弁別器は各マクロノードに含まれる複数のキーポイントが同一目標対象に属するかを判別するためのものであり、
サンプル画像を取得するステップと、
前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、によって、前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得る
請求項１～８のいずれか一項に記載のキーポイント検出方法。

【請求項10】

前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップは、
前記サンプル画像に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、予測結果を得るステップであって、前記予測結果は前記マクロノード弁別器の検出結果、各キーポイントの予測カテゴリ及び各キーポイントの予測位置情報を含む、ステップと、
前記マクロノード弁別器の検出結果に基づいて第１損失値を決定し、また、前記各キーポイントの予測カテゴリ、前記各キーポイントの予測位置情報及び前記サンプル画像に含まれるラベリング結果に基づいて第２損失値を決定するステップであって、前記ラベリング結果は対応する目標対象に属する各キーポイントのラベリングカテゴリ及び各キーポイントのラベリング位置情報を含む、ステップと、
前記第１損失値と前記第２損失値に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、を含む
請求項９に記載のキーポイント検出方法。

【請求項11】

前記検出すべき画像中の各目標対象のキーポイント情報を得た後、
各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の行動種類を決定するステップ、及び／又は
各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の少なくとも１つの目標部位の位置情報を決定し、且つ前記少なくとも１つの目標部位の位置情報により前記少なくとも１つの目標部位に対する特殊効果情報を生成するステップを更に含む
請求項１～１０のいずれか一項に記載のキーポイント検出方法。

【請求項12】

検出すべき画像を取得するように構成される取得モジュールと、
前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するように構成される第１生成モジュールであって、前記画像特徴マップは前記検出すべき画像中の各目標対象のキーポイント間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する、第１生成モジュールと、
前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するように構成される第２生成モジュールであって、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である、第２生成モジュールと、
処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るように構成される処理モジュールと、を備える、キーポイント検出装置。

【請求項13】

電子機器であって、
プロセッサと、前記プロセッサによって実行可能な機器可読命令を記憶するメモリと、バスと、を備え、電子機器が実行する時に、前記プロセッサと前記メモリが前記バスによって通信し、前記プロセッサは、前記機器可読命令を実行して、請求項１～１１のいずれか一項に記載のキーポイント検出方法を実行する、電子機器。

【請求項14】

コンピュータに請求項１～１１のいずれか一項に記載のキーポイント検出方法を実行させるためのコンピュータプログラムを記憶した、コンピュータ可読記憶媒体。

【請求項15】

コンピュータに請求項１～１１のいずれか一項に記載のキーポイント検出方法を実行させる、コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願の相互参照）
本開示は、出願番号が２０２０１０６２２１３５．７、出願日が２０２０年６月３０日の中国特許出願に基づいて提案され、且つこの中国特許出願の優先権を主張し、この中国特許出願の全てが参照によって本願に組み込まれる。

【0002】

本開示は、画像処理の技術分野に関し、特に、キーポイント検出方法、キーポイント検出装置、電子機器及び記憶媒体に関するものである。

【背景技術】

【0003】

人体キーポイントの検出と追跡は、ビデオ解析の基礎となり、安全保障分野や動作解析分野において今後でも重要なものと言える。ボトムアップの多人姿勢検出技術は、高い計算効率を有するので、幅広く応用されている。一般的には、ボトムアップ手法は、まず予測して各キーポイントの位置を得、次に各キーポイントに対してクラスタリングを行い、全体的な人体姿勢を得るようになっている。

【0004】

従来の方法において、グラフカットアルゴリズム又は発見的クラスタリングアルゴリズムを用いて各キーポイントに対してクラスタリングを行うことができ、クラスタリングプロセスはただ後処理操作となり、クラスタリング結果に対する直接的な教師がなく、キーポイントクラスタリングプロセスの正確度が低い。

【発明の概要】

【課題を解決するための手段】

【0005】

係る事情に鑑みて、本開示は、少なくともキーポイント検出方法、キーポイント検出装置、電子機器及び記憶媒体を提供する。

【0006】

第１態様では、本開示は、キーポイント検出方法を提供する。前記方法は、検出すべき画像を取得するステップと、前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するステップであって、前記画像特徴マップは前記検出すべき画像中の各目標対象間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する、ステップと、前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するステップであって、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である、ステップと、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るステップと、を含む。

【0007】

上記方法を採用すれば、生成した画像特徴マップと複数のキーポイントヒートマップに基づいて検出すべき画像に対応する初期キーポイントグラフィックモデルを生成することができ、初期キーポイントグラフィックモデルは画像特徴マップとキーポイントヒートマップ中の情報を含み、画像特徴マップが検出すべき画像における異なる目標対象間の相対的位置関係を表すことができるので、初期キーポイントグラフィックモデルに対して、接続辺の枝刈り処理を行って各目標対象のキーポイント情報を得ることができ、異なる目標対象のキーポイントを正確に区別して、キーポイントクラスタリングの精度を高める。

【0008】

可能な一実施形態では、前記キーポイントの情報は位置情報、カテゴリ情報及び画素特徴情報を含み、前記キーポイントヒートマップに基づいて各キーポイントの位置情報を決定するステップと、各前記キーポイントの位置情報に基づいて前記画像特徴マップから前記キーポイントの画素特徴情報を抽出し、且つ前記キーポイントの所属するキーポイントヒートマップのカテゴリラベルに基づいて前記キーポイントに対応するカテゴリ情報を決定するステップと、により、前記初期キーポイントグラフィックモデル中の各キーポイントの情報を決定する。

【0009】

可能な一実施形態では、前記方法は、前記初期キーポイントグラフィックモデル中の各前記キーポイントに対して、前記キーポイントの情報、及び前記キーポイントグラフィックモデルにおける前記キーポイントの間に接続辺が存在する他のキーポイントの情報に基づいて、前記キーポイントの融合特徴を決定するステップを更に含み、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップは、前記初期キーポイントグラフィックモデルに含まれる各前記キーポイントの融合特徴に基づいて、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップを含む。

【0010】

可能な一実施形態では、前記処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップは、現在キーポイントグラフィックモデルに対して第１処理プロセスを実行するステップであって、前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、クラスタリングされた複数の隣接キーポイントを含む少なくとも１つのマクロノードを得、各前記マクロノードに含まれるキーポイントの融合特徴に基づいて前記マクロノードの融合特徴を決定するステップと、得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む、第１処理プロセスを実行するステップと、今回の前記第１処理プロセスを実行した後、今回の枝刈り処理後のキーポイントグラフィックモデルを現在キーポイントグラフィックモデルとし、今回決定された前記マクロノード及び前記マクロノードの融合特徴を前記現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴とし、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記第１処理プロセスを再度実行するステップと、を含む。

【0011】

可能な一実施形態では、前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップは、前記接続辺に対応する２つのキーポイントの融合特徴に基づいて前記接続辺の重みを決定するステップであって、前記重みは前記接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、ステップと、前記現在キーポイントグラフィックモデルに含まれる各接続辺の重みに基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップと、を含む。ここで、接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、各接続辺の重みを決定することで、各接続辺の重みに基づいて現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得ることができ、例えば、対応する重みの大きい２つのキーポイントを１グループにクラスタリングして、１つのマクロノードを得て、マクロノードが正確に決定される。

【0012】

可能な一実施形態では、得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップは、得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定し、且つ前記現在キーポイントグラフィックモデルから前記削除すべき接続辺を削除するステップと、少なくとも１つの前記マクロノード、及び前記現在キーポイントグラフィックモデルにおける前記マクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む。

【0013】

可能な一実施形態では、得られた少なくとも１つのマクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定するステップは、少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するステップを含む。

【0014】

可能な一実施形態では、少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するステップは、前記現在キーポイントグラフィックモデルにおけるいずれかの接続辺に対して、このいずれかの接続辺に対応する２つのキーポイントが異なるマクロノード中のキーポイントであり、且つこのいずれかの接続辺に対応する２つのマクロノードにカテゴリ情報が同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、このいずれかの接続辺に対応する２つのキーポイントが同一マクロノード中のキーポイントである場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、このいずれかの接続辺に対応する２つのキーポイントの一方がマクロノード中のキーポイントであり、他方がマクロノード中のキーポイントでなく、且つこのいずれかの接続辺に対応する前記マクロノードに他方のキーポイントのカテゴリ情報と同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、を含む。

【0015】

可能な一実施形態では、前記各目標対象のキーポイント情報は事前トレーニング済み目標ニューラルネットワークによって生成され、前記目標ニューラルネットワークはマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして得られたものであり、前記マクロノード弁別器は各マクロノードに含まれる複数のキーポイントが同一目標対象に属するかを判別するためのものである。

【0016】

可能な一実施形態では、サンプル画像を取得するステップと、前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、によって、前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得る。

【0017】

可能な一実施形態では、前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップは、前記サンプル画像に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、予測結果を得るステップであって、前記予測結果は前記マクロノード弁別器の検出結果、各キーポイントの予測カテゴリ及び各キーポイントの予測位置情報を含む、ステップと、前記マクロノード弁別器の検出結果に基づいて第１損失値を決定し、また、前記各キーポイントの予測カテゴリ、前記各キーポイントの予測位置情報及び前記サンプル画像に含まれるラベリング結果に基づいて第２損失値を決定するステップであって、前記ラベリング結果は対応する目標対象に属する各キーポイントのラベリングカテゴリ及び各キーポイントのラベリング位置情報を含む、ステップと、前記第１損失値と前記第２損失値に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、を含む。

【0018】

可能な一実施形態では、前記検出すべき画像中の各目標対象のキーポイント情報を得た後、各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の行動種類を決定するステップを更に含む。

【0019】

可能な一実施形態では、前記検出すべき画像中の各目標対象のキーポイント情報を得た後、各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の少なくとも１つの目標部位の位置情報を決定し、且つ前記少なくとも１つの目標部位の位置情報により前記少なくとも１つの目標部位に対する特殊効果情報を生成するステップを更に含む。

【0020】

以下において、装置、電子機器等の効果の記述については上記方法の説明を参照し、ここで詳細な説明を省略する。

【0021】

第２態様では、本開示は、キーポイント検出装置を提供する。前記装置は、検出すべき画像を取得するように構成される取得モジュールと、前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するように構成される第１生成モジュールであって、前記画像特徴マップは前記検出すべき画像中の各目標対象のキーポイント間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する、第１生成モジュールと、前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するように構成される第２生成モジュールであって、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である、第２生成モジュールと、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るように構成される処理モジュールと、を備える。

【0022】

第３態様では、本開示は、電子機器を提供する。前記電子機器は、プロセッサと、前記プロセッサによって実行可能な機器可読命令を記憶するメモリと、バスと、を備え、電子機器が実行する場合に、前記プロセッサと前記メモリがバスによって通信し、前記プロセッサは前記機器可読命令を実行して上記第１態様又はいずれかの実施形態に記載のキーポイント検出方法のステップを実行する。

【0023】

第４態様では、本開示は、コンピュータ可読記憶媒体を提供する。前記コンピュータ可読記憶媒体は、プロセッサにより実行する時に前記プロセッサに上記第１態様又はいずれかの実施形態に記載のキーポイント検出方法のステップを実行させるコンピュータプログラムを記憶する。

【0024】

第５態様では、本開示は、コンピュータプログラム製品を提供する。前記コンピュータプログラム製品は、電子機器で実行する時に、前記電子機器中のプロセッサに上記１つ又は複数の実施例に記載のキーポイント検出方法を実行するためのコンピュータ可読コードを含む。

【0025】

本開示の上記の目的、特徴及びメリットをより明らかで分かりやすくするために、以下において、特に好ましい実施例を挙げ、添付された図面を参照しながら詳細に説明する。
例えば、本願は以下の項目を提供する。
（項目１）
検出すべき画像を取得するステップと、
前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するステップであって、前記画像特徴マップは前記検出すべき画像中の各目標対象間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する、ステップと、
前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するステップであって、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である、ステップと、
処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るステップと、を含む、キーポイント検出方法。
（項目２）
前記キーポイントの情報は位置情報、カテゴリ情報及び画素特徴情報を含み、
前記キーポイントヒートマップに基づいて各キーポイントの位置情報を決定するステップと、
各前記キーポイントの位置情報に基づいて前記画像特徴マップから前記キーポイントの画素特徴情報を抽出し、且つ前記キーポイントの所属するキーポイントヒートマップのカテゴリラベルに基づいて前記キーポイントに対応するカテゴリ情報を決定するステップと、により、前記初期キーポイントグラフィックモデル中の各キーポイントの情報を決定する
項目１に記載のキーポイント検出方法。
（項目３）
前記初期キーポイントグラフィックモデル中の各前記キーポイントに対して、前記キーポイントの情報、及び前記キーポイントグラフィックモデルにおける前記キーポイントの間に接続辺が存在する他のキーポイントの情報に基づいて、前記キーポイントの融合特徴を決定するステップを更に含み、
前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップは、
前記初期キーポイントグラフィックモデルに含まれる各前記キーポイントの融合特徴に基づいて、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップを含む
項目１に記載のキーポイント検出方法。
（項目４）
前記処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うステップは、
現在キーポイントグラフィックモデルに対して第１処理プロセスを実行するステップであって、
前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、クラスタリングされた複数の隣接キーポイントを含む少なくとも１つのマクロノードを得、各前記マクロノードに含まれるキーポイントの融合特徴に基づいて前記マクロノードの融合特徴を決定するステップと、
得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む、第１処理プロセスを実行するステップと、
今回の前記第１処理プロセスを実行した後、今回の枝刈り処理後のキーポイントグラフィックモデルを現在キーポイントグラフィックモデルとし、今回決定された前記マクロノード及び前記マクロノードの融合特徴を前記現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴とし、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記第１処理プロセスを再度実行するステップと、を含む
項目１～３のいずれか一項に記載のキーポイント検出方法。
（項目５）
前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップは、
前記接続辺に対応する２つのキーポイントの融合特徴に基づいて前記接続辺の重みを決定するステップであって、前記重みは前記接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、ステップと、
前記現在キーポイントグラフィックモデルに含まれる各接続辺の重みに基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップと、を含む
項目４に記載のキーポイント検出方法。
（項目６）
前記得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップは、
前記得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定し、且つ前記現在キーポイントグラフィックモデルから前記削除すべき接続辺を削除するステップと、
前記少なくとも１つの前記マクロノード、及び前記現在キーポイントグラフィックモデルにおける前記マクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む
項目４に記載のキーポイント検出方法。
（項目７）
前記得られた少なくとも１つのマクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定するステップは、
前記少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するステップを含む
項目６に記載のキーポイント検出方法。
（項目８）
前記少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するステップは、
前記現在キーポイントグラフィックモデルにおけるいずれかの接続辺に対して、このいずれかの接続辺に対応する２つのキーポイントが異なるマクロノード中のキーポイントであり、且つこのいずれかの接続辺に対応する２つのマクロノードにカテゴリ情報が同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、
このいずれかの接続辺に対応する２つのキーポイントが同一マクロノード中のキーポイントである場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、
このいずれかの接続辺に対応する２つのキーポイントの一方がマクロノード中のキーポイントであり、他方がマクロノード中のキーポイントでなく、且つこのいずれかの接続辺に対応する前記マクロノードに他方のキーポイントのカテゴリ情報と同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、を含む
項目７に記載のキーポイント検出方法。
（項目９）
前記各目標対象のキーポイント情報は事前トレーニング済み目標ニューラルネットワークによって生成され、前記目標ニューラルネットワークはマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして得られたものであり、前記マクロノード弁別器は各マクロノードに含まれる複数のキーポイントが同一目標対象に属するかを判別するためのものである
項目１～８のいずれか一項に記載のキーポイント検出方法。
（項目１０）
サンプル画像を取得するステップと、
前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、によって、前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得る
項目９に記載のキーポイント検出方法。
（項目１１）
前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップは、
前記サンプル画像に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、予測結果を得るステップであって、前記予測結果は前記マクロノード弁別器の検出結果、各キーポイントの予測カテゴリ及び各キーポイントの予測位置情報を含む、ステップと、
前記マクロノード弁別器の検出結果に基づいて第１損失値を決定し、また、前記各キーポイントの予測カテゴリ、前記各キーポイントの予測位置情報及び前記サンプル画像に含まれるラベリング結果に基づいて第２損失値を決定するステップであって、前記ラベリング結果は対応する目標対象に属する各キーポイントのラベリングカテゴリ及び各キーポイントのラベリング位置情報を含む、ステップと、
前記第１損失値と前記第２損失値に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、を含む
項目１０に記載のキーポイント検出方法。
（項目１２）
前記検出すべき画像中の各目標対象のキーポイント情報を得た後、
各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の行動種類を決定するステップを更に含む
項目１～１１のいずれか一項に記載のキーポイント検出方法。
（項目１３）
前記検出すべき画像中の各目標対象のキーポイント情報を得た後、
各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の少なくとも１つの目標部位の位置情報を決定し、且つ前記少なくとも１つの目標部位の位置情報により前記少なくとも１つの目標部位に対する特殊効果情報を生成するステップを更に含む
項目１～１１のいずれか一項に記載のキーポイント検出方法。
（項目１４）
検出すべき画像を取得するように構成される取得モジュールと、
前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するように構成される第１生成モジュールであって、前記画像特徴マップは前記検出すべき画像中の各目標対象のキーポイント間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する、第１生成モジュールと、
前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するように構成される第２生成モジュールであって、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である、第２生成モジュールと、
処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るように構成される処理モジュールと、を備える、キーポイント検出装置。
（項目１５）
前記キーポイントの情報は位置情報、カテゴリ情報及び画素特徴情報を含み、前記第２生成モジュールは、
前記キーポイントヒートマップに基づいて各キーポイントの位置情報を決定するステップと、
各前記キーポイントの位置情報に基づいて前記画像特徴マップから前記キーポイントの画素特徴情報を抽出し、且つ前記キーポイントの所属するキーポイントヒートマップのカテゴリラベルに基づいて前記キーポイントに対応するカテゴリ情報を決定するステップと、により、前記初期キーポイントグラフィックモデル中の各キーポイントの情報を決定するように構成される
項目１４に記載のキーポイント検出装置。
（項目１６）
前記初期キーポイントグラフィックモデル中の各前記キーポイントに対して、前記キーポイントの情報、及び前記キーポイントグラフィックモデルにおける前記キーポイントの間に接続辺が存在する他のキーポイントの情報に基づいて、前記キーポイントの融合特徴を決定するように構成される決定モジュールを更に備え、
前記処理モジュールは、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行う場合に、
前記初期キーポイントグラフィックモデルに含まれる各前記キーポイントの融合特徴に基づいて、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うように構成される
項目１４に記載のキーポイント検出装置。
（項目１７）
前記処理モジュールは、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行う場合に、
現在キーポイントグラフィックモデルに対して第１処理プロセスを実行するステップであって、
前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、クラスタリングされた複数の隣接キーポイントを含む少なくとも１つのマクロノードを得、各前記マクロノードに含まれるキーポイントの融合特徴に基づいて前記マクロノードの融合特徴を決定するステップと、
得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む、第１処理プロセスを実行するステップと、
今回の前記第１処理プロセスを実行した後、今回の枝刈り処理後のキーポイントグラフィックモデルを現在キーポイントグラフィックモデルとし、今回決定された前記マクロノード及び前記マクロノードの融合特徴を前記現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴とし、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記第１処理プロセスを再度実行するステップと、を実行するように構成される
項目１４～１６のいずれか一項に記載のキーポイント検出装置。
（項目１８）
前記処理モジュールは、前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得る場合に、
前記接続辺に対応する２つのキーポイントの融合特徴に基づいて前記接続辺の重みを決定するステップであって、前記重みは前記接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、ステップと、
前記現在キーポイントグラフィックモデルに含まれる各接続辺の重みに基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップと、を実行するように構成される
項目１７に記載のキーポイント検出装置。
（項目１９）
前記処理モジュールは、得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得る場合に、
前記得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定し、且つ前記現在キーポイントグラフィックモデルから前記削除すべき接続辺を削除するステップと、
少なくとも１つの前記マクロノード、及び前記現在キーポイントグラフィックモデルにおける前記マクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を実行するように構成される
項目１７に記載のキーポイント検出装置。
（項目２０）
前記処理モジュールは、得られた少なくとも１つのマクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定する場合に、
前記少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するように構成される
項目１９に記載のキーポイント検出装置。
（項目２１）
前記処理モジュールは、前記少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定する場合に、
前記現在キーポイントグラフィックモデルにおけるいずれかの接続辺に対して、このいずれかの接続辺に対応する２つのキーポイントが異なるマクロノード中のキーポイントであり、且つこのいずれかの接続辺に対応する２つのマクロノードにカテゴリ情報が同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、
このいずれかの接続辺に対応する２つのキーポイントが同一マクロノード中のキーポイントである場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、
このいずれかの接続辺に対応する２つのキーポイントの一方がマクロノード中のキーポイントであり、他方がマクロノード中のキーポイントでなく、且つこのいずれかの接続辺に対応する前記マクロノードに他方のキーポイントのカテゴリ情報と同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、を実行するように構成される
項目２０に記載のキーポイント検出装置。
（項目２２）
前記各目標対象のキーポイント情報は事前トレーニング済み目標ニューラルネットワークによって生成され、前記目標ニューラルネットワークはマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして得られたものであり、前記マクロノード弁別器は各マクロノードに含まれる複数のキーポイントが同一目標対象に属するかを判別するためのものである
項目１４～２１のいずれか一項に記載のキーポイント検出装置。
（項目２３）
サンプル画像を取得するステップと、
前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、によって、前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るように構成されるトレーニングモジュールを更に備える
項目２２に記載のキーポイント検出装置。
（項目２４）
前記トレーニングモジュールは、前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得る場合に、
前記サンプル画像に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、予測結果を得るステップであって、前記予測結果は前記マクロノード弁別器の検出結果、各キーポイントの予測カテゴリ及び各キーポイントの予測位置情報を含む、ステップと、
前記マクロノード弁別器の検出結果に基づいて第１損失値を決定し、また、前記各キーポイントの予測カテゴリ、前記各キーポイントの予測位置情報及び前記サンプル画像に含まれるラベリング結果に基づいて第２損失値を決定するステップであって、前記ラベリング結果は対応する目標対象に属する各キーポイントのラベリングカテゴリ及び各キーポイントのラベリング位置情報を含む、ステップと、
前記第１損失値と前記第２損失値に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、を実行するように構成される
項目２３に記載のキーポイント検出装置。
（項目２５）
前記検出すべき画像中の各目標対象のキーポイント情報を得た後、
各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の行動種類を決定するように構成される行動種類決定モジュールを更に備える
項目１４～２４のいずれか一項に記載のキーポイント検出装置。
（項目２６）
前記検出すべき画像中の各目標対象のキーポイント情報を得た後、
各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の少なくとも１つの目標部位の位置情報を決定し、且つ前記少なくとも１つの目標部位の位置情報により前記少なくとも１つの目標部位に対する特殊効果情報を生成するように構成される特殊効果生成モジュールを更に備える
項目１４～２４のいずれか一項に記載のキーポイント検出装置。
（項目２７）
電子機器であって、
プロセッサと、前記プロセッサによって実行可能な機器可読命令を記憶するメモリと、バスと、を備え、電子機器が実行する時に、前記プロセッサと前記メモリが前記バスによって通信し、前記プロセッサは、前記機器可読命令を実行して、項目１～１３のいずれか一項に記載のキーポイント検出方法のステップを実行する、電子機器。
（項目２８）
プロセッサにより実行する時に、前記プロセッサに項目１～１３のいずれか一項に記載のキーポイント検出方法のステップを実行させるためのコンピュータプログラムを記憶した、コンピュータ可読記憶媒体。
（項目２９）
電子機器で実行する時に、前記電子機器中のプロセッサに項目１～１３のいずれか一項に記載のキーポイント検出方法のステップを実行させるためのコンピュータ可読コードを含む、コンピュータプログラム製品。

【図面の簡単な説明】

【0026】

【図1】本開示の実施例に係るキーポイント検出方法を模式的に示すフローチャートである。

【図2A】本開示の実施例に係るキーポイント検出方法における枝刈り処理を模式的に示すフローチャートである。

【図2B】本開示の実施例に係るキーポイント検出方法を実現するネットワーク構成の模式図である。

【図3】本開示の実施例に係るキーポイント検出装置の構成の模式図である。

【図4】本開示の実施例に係る電子機器４００の構成の模式図である。

【発明を実施するための形態】

【0027】

本開示の実施例の目的、技術的解決手段及び利点をより明確にするために、以下に本開示の実施例における図面を参照し、本開示の実施例における技術的解決手段を明確に、完全に説明し、当然ながら、説明される実施例はただ本開示の実施例の一部に過ぎず、全ての実施例ではない。一般的には、この図面に記載され示された本開示の実施例のアセンブリは様々な配置方式によって配置、設定され得る。従って、以下において図面で提供された本開示の実施例に加えられる詳細な記載は、保護を主張される本開示の範囲を限定する意図がなく、本開示の選択実施例を示すものに過ぎない。本開示における実施例に基づき、当業者が創造的な労力を要することなく、得られた他の全ての実施例は、いずれも本開示の保護範囲に属する。

【0028】

一般的には、ボトムアップ手法は、まず予測して各キーポイントの位置を得、次に各キーポイントに対してクラスタリングを行い、全体的な人体姿勢を得るようになっている。従来の方法において、グラフカットアルゴリズム又は発見的クラスタリングアルゴリズムを用いて各キーポイントに対してクラスタリングを行うことができ、クラスタリングプロセスはただ後処理操作となり、クラスタリング結果に対する直接的な教師がなく、キーポイントクラスタリングプロセスの正確度が低い。

【0029】

キーポイントクラスタリングプロセスの正確度を高くするために、本開示の実施例はキーポイント検出方法を提供する。

【0030】

本開示の実施例を理解しやすくするために、まず本開示の実施例で開示されるキーポイント検出方法について詳細に説明する。

【0031】

本開示の実施例に係るキーポイント検出方法を模式的に示すフローチャートである図１に示すように、この方法はＳ１０１－Ｓ１０４を含む。

【0032】

Ｓ１０１で、検出すべき画像を取得する。

【0033】

Ｓ１０２で、検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成し、画像特徴マップは検出すべき画像中の各目標対象間の相対的位置関係を表すためのものであり、各キーポイントヒートマップは検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが目標対象の異なる部位に対応する。

【0034】

Ｓ１０３で、画像特徴マップと複数のキーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成し、初期キーポイントグラフィックモデルは検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である。

【0035】

Ｓ１０４で、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、初期キーポイントグラフィックモデルに対して接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得る。

【0036】

上記方法において、生成した画像特徴マップと複数のキーポイントヒートマップに基づいて検出すべき画像に対応する初期キーポイントグラフィックモデルを生成することができ、初期キーポイントグラフィックモデルは画像特徴マップとキーポイントヒートマップ中の情報を含み、画像特徴マップが検出すべき画像における異なる目標対象間の相対的位置関係を表すことができるので、初期キーポイントグラフィックモデルに対して、接続辺の枝刈り処理を行って各目標対象のキーポイント情報を得ることができ、異なる目標対象のキーポイントを正確に区別して、キーポイントクラスタリングの精度を高める。

【0037】

Ｓ１０１及びＳ１０２に関しては、検出すべき画像は複数の目標対象を含む任意の画像であってよい。目標対象は人間であってよく、即ち、被検出対象に含まれる複数の人体キーポイントを検出する。

【0038】

実施過程で、取得した検出すべき画像をトレーニングされたキーポイント検出ニューラルネットワークに入力して画像特徴マップと複数のキーポイントヒートマップを生成し、且つ画像特徴マップ、複数のキーポイントヒートマップ及びトレーニングされたキーポイント検出ニューラルネットワークに基づいて各目標対象の各キーポイントを決定することができる。

【0039】

ここで、各キーポイントヒートマップは検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが目標対象の異なる部位に対応する。例えば、キーポイントのカテゴリは頭部、頚部、手部等であってもよく、更にキーポイントヒートマップは頭部キーポイントを含む画像であってもよく、又は、キーポイントヒートマップは頚部キーポイントを含む画像等であってもよく、又は、キーポイントのカテゴリは設定された第１カテゴリ、第２カテゴリ等であってもよく、そのうち、第１カテゴリキーポイントは親指におけるキーポイントであってもよく、第２カテゴリキーポイントは人差し指におけるキーポイント等であってもよく、更にキーポイントヒートマップは第１カテゴリのキーポイントを含む画像であってもよく、又は、キーポイントヒートマップは第２カテゴリのキーポイントを含む画像等であってもよい。ここで、キーポイントのカテゴリとカテゴリの数量は実際の需要に応じて設定可能である。また、各目標対象に対応するキーポイントの数量は実際の需要に応じて設定可能であり、例えば、各目標対象に対応するキーポイントの数量は１７、１０５等であってよい。

【0040】

ここで、キーポイントヒートマップの数量は設定されたキーポイントカテゴリの数量と同じであり、例えば、設定されたキーポイントのカテゴリの数量が１７である場合に、検出すべき画像に基づいて生成されるキーポイントヒートマップの数量も１７である。そのうち、それぞれのカテゴリのキーポイントの数量は１であってよい。

【0041】

画像特徴マップの数量は１であっても、複数であってもよい。ここで、画像特徴マップの数量が１である場合に、この画像特徴マップは検出すべき画像中の各目標対象の各種カテゴリのキーポイントに対応する部位間の相対的位置関係を表現可能である。画像特徴マップの数量が複数である場合に、画像特徴マップの数量はキーポイントヒートマップの数量と同じであってもよく、即ち、各画像特徴マップは検出すべき画像中の各目標対象の１種のカテゴリのキーポイントに対応する部位間の相対的位置関係を表現可能である。ここで、画像特徴マップはサイズがキーポイントヒートマップのサイズと同じである。

【0042】

実施過程で、キーポイント検出ニューラルネットワークに異なる損失関数を設定することによって画像特徴マップと複数のキーポイントヒートマップを得ることができる。

【0043】

Ｓ１０３に関しては、ここで、複数のキーポイントヒートマップと画像特徴マップから各キーポイントの情報を抽出し、情報を含む各キーポイントをノードとし、異なるカテゴリのキーポイントの間の辺を接続辺として、初期キーポイントグラフィックモデルを構成することができる。ここで、接続辺の情報は対応する２つのキーポイントの間に接続関係が存在する情報であってよく、例えば、接続辺１の情報は、接続辺１に対応するキーポイントＰ１とキーポイントＰ２に接続関係が存在する情報であってよい。

【0044】

本開示のいくつかの実施例では、キーポイントの情報は位置情報、カテゴリ情報及び画素特徴情報を含む。ここで、キーポイントヒートマップに基づいて各キーポイントの位置情報を決定するステップと、各キーポイントの位置情報に基づいて画像特徴マップからキーポイントの画素特徴情報を抽出し、且つキーポイントの所属するキーポイントヒートマップのカテゴリラベルに基づいてキーポイントに対応するカテゴリ情報を決定するステップと、により、初期キーポイントグラフィックモデル中の各キーポイントの情報を決定することができる。

【0045】

実施過程で、キーポイントヒートマップ中の各画素点の画素値に基づいて各キーポイントの位置情報を決定することができる。例示的に、各キーポイントヒートマップに対して、画素値が極大値の画素点を選択してキーポイントに決定し、且つ選択されたこの画素点の位置情報をキーポイントの位置情報に決定することができる。ここで、キーポイントヒートマップにおけるある画素点の画素値が周辺画素点の画素値より大きい場合に、この画素点の画素値が極大値であると考えられ、この画素点をキーポイントとする。各画素点の位置情報が得られた後、画像特徴マップからこの位置情報に対応する画素点の画素値を抽出し、抽出した画素値をキーポイントの画素特徴情報に決定することができる。同時に、各キーポイントの所属するキーポイントヒートマップのカテゴリラベルによりキーポイントに対応するカテゴリ情報を決定するようにしてもよい。例えば、キーポイントヒートマップＧ１のカテゴリラベルが頭部である場合に、キーポイントヒートマップＧ１に含まれる各キーポイントのカテゴリ情報は頭部キーポイントであり、キーポイントヒートマップＧ２のカテゴリラベルが頚部である場合に、キーポイントヒートマップＧ２に含まれる各キーポイントのカテゴリ情報は頚部キーポイントである。

【0046】

Ｓ１０４に関しては、本開示のいくつかの実施例では、初期キーポイントに対して枝刈り処理を複数回行う前に、初期キーポイントグラフィックモデル中の各キーポイントに対して、キーポイントの情報、及びキーポイントグラフィックモデルにおけるキーポイントの間に接続辺が存在する他のキーポイントの情報に基づいて、キーポイントの融合特徴を決定するステップを更に含んでもよい。更に、初期キーポイントグラフィックモデルに対して接続辺の枝刈り処理を複数回行うステップは、初期キーポイントグラフィックモデルに含まれる各キーポイントの融合特徴に基づいて、初期キーポイントグラフィックモデルに対して接続辺の枝刈り処理を複数回行うステップを含むことができる。

【0047】

ここで、先に初期キーポイントグラフィックモデル中の各キーポイントに対応の融合特徴を生成し、次に各キーポイントの融合特徴に基づいて、初期キーポイントグラフィックモデルに対して接続辺の枝刈り処理を複数回行うことができる。

【0048】

実施過程で、各キーポイントに対して、初期キーポイントグラフィックモデルにおけるこのキーポイントの間に接続辺が存在する他のキーポイントを決定し、このキーポイントの情報と他のキーポイントの情報に基づいてこのキーポイントの融合特徴を生成することができる。例示的に、グラフニューラルネットワーク（ＧｒａｐｈＮｅｕｒａｌＮｅｔｗｏｒｋ：ＧＮＮ）を用いて初期キーポイントグラフィックモデルにおける各キーポイントの融合特徴を決定し、且つ初期キーポイントグラフィックモデルに含まれる各キーポイントの融合特徴に基づいて、初期キーポイントグラフィックモデルに対して接続辺の枝刈り処理を複数回行うことができる。

【0049】

上記実施形態では、各キーポイントに対して、このキーポイントの情報及びこのキーポイントの間に接続辺が存在する他のキーポイントの情報に基づいて、このキーポイントに対応する融合特徴を生成することによって、このキーポイントの融合特徴はこのキーポイントの特徴を表現可能であることに加えて、このキーポイントと他のキーポイントの間の関連関係を表すことができ、そのため、各キーポイントにそれぞれ対応する融合特徴に基づいて、初期キーポイントグラフィックモデルに対する複数回の接続辺の枝刈り処理を正確に行うことができ、更に各目標対象に対応するキーポイント情報を正確に決定できる。

【0050】

本開示のいくつかの実施例では、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、初期キーポイントグラフィックモデルに対して接続辺の枝刈り処理を複数回行うステップは、
現在キーポイントグラフィックモデルに対して第１処理プロセスを実行するステップであって、現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、クラスタリングされた複数の隣接キーポイントを含む少なくとも１つのマクロノードを得、各マクロノードに含まれるキーポイントの融合特徴に基づいてマクロノードの融合特徴を決定するステップ１と、得られた少なくとも１つのマクロノードと現在キーポイントグラフィックモデルに基づいて、現在キーポイントグラフィックモデルに対して今回の接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップ２と、を含む、第１処理プロセスを実行するステップと、今回の第１処理プロセスを実行した後、今回の枝刈り処理後のキーポイントグラフィックモデルを現在キーポイントグラフィックモデルとし、今回決定されたマクロノード及びマクロノードの融合特徴を現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴とし、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、第１処理プロセスを再度実行するステップ３と、を含む。ここで、初期キーポイントグラフィックモデルを現在キーポイントグラフィックモデルとして１回目の第１処理プロセスを実行して、枝刈り処理後のキーポイントグラフィックモデルを得、また、１回目の枝刈り処理後のキーポイントグラフィックモデルを現在キーポイントグラフィックモデルとし、１回目の枝刈り処理後に得られた各マクロノードと各マクロノードに対応する融合特徴を現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴として、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、２回目の第１処理プロセスを実行することができ、クラスタリングして得られたクラスタの数量は検出すべき画像に含まれる目標対象の数量と同じであり、各クラスタにそれぞれ１つの目標対象に対応する全てのキーポイントを含み、即ち、検出すべき画像中の各目標対象の各キーポイントが得られた。

【0051】

上記実施形態で、毎回の第１処理プロセスにおいて、隣接するキーポイントに対してクラスタリングを一回行って少なくとも１つのマクロノードを得、各マクロノードに含まれる複数のキーポイントが同一目標対象のキーポイントであり、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、初期キーポイントグラフィックモデルに対して第１処理プロセスを複数回行って、各目標対象のキーポイント情報を得ることによって、得られる各目標対象に対応するキーポイント情報が正確になる。

【0052】

以下において第１処理プロセスを詳細に説明する。本開示のいくつかの実施例で、現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップ１は、接続辺に対応する２つのキーポイントの融合特徴に基づいて接続辺の重みを決定するステップであって、重みは接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、ステップＡ１と、現在キーポイントグラフィックモデルに含まれる各接続辺の重みに基づいて、現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップＡ２と、を含む。ここで、各接続辺に対応する重みを決定してよく、この重みは接続辺の両側の２つのキーポイントが同一目標対象に属する確率を表す。例示的に、トレーニングされた辺弁別器によって、各接続辺に対応する２つのキーポイントの融合特徴に対して、各接続辺の重みを決定してよい。

【0053】

本開示のいくつかの実施例では、現在キーポイントグラフィックモデルに含まれる各接続辺の重みに基づいて、現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対してキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得ることができ、ここで、各マクロノードに含まれる複数のキーポイントは同一目標対象に属するキーポイントである。例えば、重みの大きい接続辺に対応する２つのキーポイントを１グループにクラスタリングして、１つのマクロノードを得ることができる。各マクロノードには現在キーポイントグラフィックモデル中の２つのキーポイントを含み、クラスタリングされた後に得られた少なくとも１つのマクロノードに含まれる接続辺の重みの和が大きくなる。例えば、現在キーポイントグラフィックモデルに対して今回のキーポイントクラスタリングを行った後、２つのマクロノードが得られた場合に、クラスタリングした後に得られたこの２つのマクロノードに含まれる接続辺の重みの和が大きくなることが可能である。

【0054】

マクロノードが得られた後、次回の第１処理プロセスを行う前に、各マクロノードの融合特徴を決定してよい。即ち、マクロノードに含まれる各キーポイントの融合特徴に対して融合処理を行ってマクロノードに対応する融合特徴を得ることができる。実施過程で、マクロノードに含まれる各キーポイントの融合特徴に対してプーリング処理を行ってこのマクロノードの融合特徴を得ることができる。

【0055】

ここで、接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、各接続辺の重みを決定し、各接続辺の重みに基づいて、現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行うことによって、少なくとも１つのマクロノードを得ることができ、例えば、対応する重みの大きい２つのキーポイントを１グループにクラスタリングして１つのマクロノードを得て、マクロノードが正確に決定される。

【0056】

得られた少なくとも１つのマクロノードと現在キーポイントグラフィックモデルに基づいて、現在キーポイントグラフィックモデルに対して今回の接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップ２は、得られた少なくとも１つのマクロノードと現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定し、且つ現在キーポイントグラフィックモデルから削除すべき接続辺を削除するステップＢ１と、少なくとも１つのマクロノード、及び現在キーポイントグラフィックモデルにおけるマクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップＢ２と、を含む。

【0057】

ここで、ステップＢ１で、先に得られた少なくとも１つのマクロノードと現在キーポイントグラフィックモデルにより、今回の枝刈り処理中の削除すべき接続辺を決定し、この削除すべき接続辺を現在キーポイントグラフィックモデルから削除することができる。

【0058】

本開示のいくつかの実施例では、得られた少なくとも１つのマクロノードと現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定するステップＢ１は、少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、削除すべき接続辺を決定するステップを含む。ここで、各目標対象には同じカテゴリのキーポイントを１つしか包含してならなく、例えば、各目標対象には頭部カテゴリのキーポイント、頚部カテゴリのキーポイント、左足カテゴリのキーポイントをそれぞれ１つしか包含してならないことを考慮すれば、少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、削除すべき接続辺を決定することができる。

【0059】

本開示のいくつかの実施例では、少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、削除すべき接続辺を決定するステップは、以下を含む。

【0060】

現在キーポイントグラフィックモデル中のいずれかの接続辺に対して、条件１で、このいずれかの接続辺に対応する２つのキーポイントが異なるマクロノード中のキーポイントであり、且つこのいずれかの接続辺に対応する２つのマクロノードにカテゴリ情報が同じなキーポイントが存在する場合に、このいずれかの接続辺を削除すべき接続辺に決定する。条件２で、このいずれかの接続辺に対応する２つのキーポイントが同一マクロノード中のキーポイントである場合に、このいずれかの接続辺を削除すべき接続辺に決定する。条件３で、このいずれかの接続辺に対応する２つのキーポイントの一方がマクロノード中のキーポイントであり、他方がマクロノード中のキーポイントでなく、且つこのいずれかの接続辺に対応するマクロノードに他方のキーポイントのカテゴリ情報と同じなキーポイントが存在する場合に、このいずれかの接続辺を削除すべき接続辺に決定する。

【0061】

ここで、現在キーポイントグラフィックモデル中のいずれかの接続辺に対して、この接続辺が条件１、条件２及び条件３のいずれかを満たした場合に、この接続辺が削除すべき接続辺となると考えられ、でなければ、この接続辺が削除すべき接続辺とならない。

【0062】

条件１で、接続辺に対応する２つのキーポイントが異なるマクロノード中のキーポイントである場合に、この接続辺に対応する２つのマクロノードにはカテゴリ情報が同じなキーポイントが存在するかを判断してよく、カテゴリ情報が同じなキーポイントが存在する場合に、この接続辺が削除すべき接続辺となり、カテゴリ情報が同じなキーポイントが存在しない場合に、この接続辺が削除すべき接続辺とならない。条件２で、接続辺に対応する２つのキーポイントが同一マクロノード中のキーポイントである場合に、この接続辺が削除すべき接続辺となる。条件３で、この接続辺に対応するキーポイントの一方がマクロノードに含まれるキーポイントであり、他方がマクロノード中のキーポイントでなく、即ち他方のキーポイントが現在キーポイントグラフィックモデルにおけるマクロノードに含まれるキーポイント以外の他のキーポイントである場合に、この接続辺に対応するマクロノードには他方のキーポイントのカテゴリ情報と同じなキーポイントが存在するかを判断してよく、前記キーポイントが存在する場合に、この接続辺が削除すべき接続辺となり、前記キーポイントが存在しない場合に、この接続辺が削除すべき接続辺とならない。

【0063】

上記実施形態で、各目標対象のキーポイント情報には同じカテゴリのキーポイントを１つしか包含しなく、即ち各目標対象のキーポイント情報には頭部キーポイント、頚部キーポイント、左足キーポイント等をそれぞれ１つしか包含しないことを考慮すれば、ここで、接続辺に対応する２つのキーポイントのカテゴリに基づいて、削除すべき接続辺を決定し、且つ枝刈り後のキーポイントグラフィックモデルを生成することができ、更に、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、次回の第１処理プロセスを行ってよい。

【0064】

Ｂ２で、削除すべき接続辺を削除した後、少なくとも１つのマクロノード、及び現在キーポイントグラフィックモデルにおけるマクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデルを得ることができる。即ち、今回の枝刈り処理後のキーポイントグラフィックモデルにおいて、キーポイントがマクロノードである場合に、このキーポイントの融合特徴はこのマクロノードに対応する融合特徴である。

【0065】

ステップ３で、今回の第１処理プロセスを実行した後、今回の枝刈り処理後のキーポイントグラフィックモデルを次回の枝刈り処理時に対応する現在キーポイントグラフィックモデルとし、今回決定されたマクロノード及びマクロノードの融合特徴を現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴として、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、即ち処理後のキーポイントグラフィックモデルにいずれの接続辺も存在しなくなるまで、第１処理プロセスを再度実行して、検出すべき画像に含まれる各目標対象の各キーポイントを得ることができる。

【0066】

キーポイント検出方法における枝刈り処理を模式的に示すフローチャートである図２Ａに示すように、検出すべき画像に基づいて画像特徴マップ２２（即ち、Ｆｅａｔｕｒｅｍａｐｓ）と複数のキーポイントヒートマップ２１（即ち、Ｈｅａｔｍａｐｓ）を生成し、次に画像特徴マップ２２と複数のキーポイントヒートマップ２１に基づいて初期キーポイントグラフィックモデル２３を生成することができ、ここで、初期キーポイントグラフィックモデル２３中の円形マークがキーポイントであり、点線が異なるカテゴリのキーポイント間の接続辺である。続いて、各キーポイントに対応の融合特徴を生成し、トレーニングされた辺弁別器２４によって各接続辺の重みを決定し、且つ初期キーポイントグラフィックモデル２３に含まれる各接続辺の重みに基づいて、初期キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノード２５を得ることができる。続いて、得られた少なくとも１つのマクロノード２５と初期キーポイントグラフィックモデル２３に基づいて削除すべき接続辺を決定し、且つ初期キーポイントグラフィックモデルから削除すべき接続辺を削除し、更に少なくとも１つのマクロノード、及び初期キーポイントグラフィックモデルにおけるマクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデル２６を得、今回の枝刈り処理後のキーポイントグラフィックモデル２６を現在キーポイントグラフィックモデルとして、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、即ち、例えば図２Ａに示す最後のステップで得られる処理結果になるまで、再度第１処理プロセスを行うことができる。ここで、トレーニング待ちニューラルネットワークをトレーニングする場合に、生成した各マクロノードをマクロノード弁別器２７によって判別し、即ち各マクロノードに含まれるキーポイントが同一目標対象に属するかを判断し、且つマクロノード弁別器２７の検出結果に基づいてトレーニング待ちニューラルネットワークをトレーニングして、トレーニング済み目標ニューラルネットワークを得るようにしてもよい。

【0067】

本開示のいくつかの実施例では、各目標対象のキーポイント情報は事前トレーニング済み目標ニューラルネットワークによって生成され、ここで、目標ニューラルネットワークはマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして得られたものであり、マクロノード弁別器は各マクロノードに含まれる複数のキーポイントが同一目標対象に属するかを判別するためのものである。検出すべき画像を事前トレーニング済み目標ニューラルネットワークに入力し、検出すべき画像に含まれる各目標対象のキーポイント情報を得ることができる。ここで、各目標対象に対応する各キーポイントのカテゴリとキーポイントの数量は、実際の需要に応じて設定可能である。

【0068】

実施過程で、この事前トレーニング済み目標ニューラルネットワークはマクロノード弁別器を備えなくてもよい。即ち、このマクロノード弁別器はトレーニング待ちニューラルネットワークのトレーニング工程で、得られた各マクロノード中の複数のキーポイントが同一目標対象に属するかを判断するようになってもよい。上記実施形態で、マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングすることによって、目標ニューラルネットワークを得、ここで、マクロノード弁別器は各マクロノードに含まれる複数のキーポイントが同一目標対象に属するかを判別するためのものであり、トレーニングして得られた目標ニューラルネットワークの正確度を向上可能である。

【0069】

本開示のいくつかの実施例では、下記ステップによってトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得る。

【0070】

サンプル画像を取得し、且つサンプル画像に基づいてマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得る。

【0071】

サンプル画像に基づいてマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップは、サンプル画像に基づいてトレーニング待ちニューラルネットワークをトレーニングして、予測結果を得るステップであって、予測結果はマクロノード弁別器の検出結果、各キーポイントの予測カテゴリ及び各キーポイントの予測位置情報を含む、ステップ一と、マクロノード弁別器の検出結果に基づいて第１損失値を決定し、また、各キーポイントの予測カテゴリ、各キーポイントの予測位置情報及びサンプル画像に含まれるラベリング結果に基づいて第２損失値を決定するステップであって、ラベリング結果は対応する目標対象に属する各キーポイントのラベリングカテゴリ及び各キーポイントのラベリング位置情報を含む、ステップ二と、第１損失値と第２損失値に基づいてトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップ三と、を含むことができる。ここで、サンプル画像にはラベリング結果が含まれており、このラベリング結果には対応する目標対象に属する各キーポイントのラベリングカテゴリ及び各キーポイントのラベリング位置情報を含む。サンプル画像をトレーニング待ちニューラルネットワークに入力して予測結果を得、ここで、予測結果にはマクロノード弁別器の検出結果、各キーポイントの予測カテゴリ及び各キーポイントの予測位置情報を含む。更に、予測結果とラベリング結果に基づいてトレーニング待ちニューラルネットワークをトレーニングして、トレーニング済み目標ニューラルネットワークを得ることができる。マクロノード弁別器の検出結果に基づいて第１損失値を決定し、また、各キーポイントの予測カテゴリ、各キーポイントの予測位置情報及びサンプル画像に含まれるラベリング結果に基づいて第２損失値を決定し、第１損失値と第２損失値の和によって、トレーニング待ちニューラルネットワークをトレーニングして、目標ニューラルネットワークを得ることができる。

【0072】

本開示のいくつかの実施例では、検出すべき画像中の各目標対象のキーポイント情報が得られた後、各目標対象に対応するキーポイント情報に基づいてこの目標対象の行動種類を決定するステップを更に含む。ここで、各目標対象の各キーポイントの情報が得られた後、各目標対象の各キーポイントの情報を行動検出ニューラルネットワークに入力し、この目標対象の行動種類を決定することができ、例えば、この行動種類はランニング、ウォーキング、両腕を挙げている等であってよい。

【0073】

本開示のいくつかの実施例では、検出すべき画像中の各目標対象のキーポイント情報が得られた後、各目標対象に対応するキーポイント情報に基づいて、この目標対象の少なくとも１つの目標部位の位置情報を決定し、且つ少なくとも１つの目標部位の位置情報により少なくとも１つの目標部位に対する特殊効果情報を生成するステップを更に含む。ここで、各目標対象の各キーポイントの情報に対して、この目標対象の少なくとも１つの目標部位の位置情報を決定し、予め設定された目標部位に対応する特殊効果情報に基づいて、目標部位の位置で対応する特殊効果情報を生成することができる。ここで、目標部位は腕、頭部、手部等であってよい。例えば、目標対象の各キーポイントの情報に対して、目標対象の腕位置を決定し、予め設定された腕の特殊効果情報に基づいて、目標対象の腕位置で腕に対応する特殊効果情報を生成することができる。

【0074】

関連技術において、人体キーポイントの検出と追跡は、ビデオ解析の基礎となり、安全保障分野や動作解析分野において今後でも重要なものと言える。ボトムアップの多人姿勢検出技術は、高い計算効率を有するので、幅広く応用されている。一般的には、ボトムアップ手法は、通常、２つのステップに分けられる。１番目のステップは、キーポイントのガウス応答グラフを予測して各キーポイントの位置を得る。２番目のステップは、各キーポイントに対してクラスタリングを行って全体的な人体姿勢を得る。しかしながら、関連技術において、クラスタリングのステップでグラフカットアルゴリズム又は発見的クラスタリングアルゴリズムが採用されている。クラスタリングはただ後処理操作となり、クラスタリング結果に対する直接的な教師がない。以上から分かるように、関連技術は下記欠点がある。（１）クラスタリングのステップでグラフカットアルゴリズム又は発見的クラスタリングアルゴリズムを採用することが一般であり、それはただ後処理操作となり、クラスタリング結果に対する直接的な教師がない。（２）一般のグラフクラスタリングアルゴリズムは、人体の階層化構造先験的情報を十分に利用できなく、例えば、階層化情報としては、人間を上半身と下半身に区別可能であり、上半身を更に頭、肩、腕に区別可能であり、頭部が更に顔部の５個のキーポイントからなることが挙げられる。（３）一般のグラフクラスタリングアルゴリズムは、ローカル情報のみを利用するが、グローバル人体情報を無視する。

【0075】

上記問題を解決するために、本開示の実施例はキーポイント検出方法を提供し、この方法において、まず、微分可能な「階層化グラフクラスタリングモジュール」に基づいてキーポイントの検出とクラスタリングを結合して、エンドツーエンドのトレーニングを行う。続いて、クラスタリング結果に教師を与え、クラスタリングの損失は直接的に下層特徴抽出ネットワークに逆伝播して、ネットワーク全体を最適化可能である。このようにして、ネットワークはクラスタリング結果が間違ったキーポイントにより多い注意を払い、より効率的に特徴学習を行うことができるようになる。一方で、階層化グラフクラスタリングアルゴリズムは目標対象キーポイントに対するクラスタリングを逐次反復し、キーポイント－肢体－目標対象全体のような階層構造を構成し、各階層のクラスタリング構造に教師を与えることができ、目標対象の階層構造先験的情報をより好適に保留することができる。他方で、マクロノード弁別器（Ｍａｃｒｏ－ｎｏｄｅＤｉｓｃｒｉｍｉｎａｔｏｒ）を導入することによって、マクロノード全体内部の特徴を判別でき、グローバル特徴情報をより好適に保留する。

【0076】

図２Ａは本開示の実施例に係るキーポイント検出方法における枝刈り処理を模式的に示すフローチャートであり、キーポイントが２つずつ同一目標対象に属するかを判断することによって、同一目標対象のキーポイントを１グループに集約する。

【0077】

１）検出すべき画像中のキーポイント情報を抽出し、且つ前記キーポイント情報により初期キーポイントグラフィックモデルを構築し、ここで、まず、キーポイントの情報を抽出して初期キーポイントグラフィックモデルＧ＝｛Ｖ，Ｅ｝を構築する必要がある。初期キーポイントグラフィックモデルＧはキーポイントＶと辺Ｅの２部分に分けられ、そのうち、キーポイントＶは各キーポイントの情報であり、即ち「キーポイントのカテゴリＴ、キーポイントの座標Ｘ、キーポイントの特徴Ｆ」を含む。辺Ｅはキーポイント間の関係を表し、即ち同一目標対象に属するかを表す。初期キーポイントグラフィックモデルが構築された後、相関的特徴の抽出を行う。

【0078】

２）ＧＮＮを用いて相関的特徴の学習を行う。エッジ畳み込み（ＥｄｇｅＣｏｎｖ）によってグラフ畳み込みニューラルネットワークモデルを構築し、構築されたキーポイントグラフィックモデル（Ｇｒａｐｈ）に対して畳み込みを行って、キーポイントの特徴を更新する。

【0079】

３）キーポイント間の類似度行列を更新する。即ち、次に、辺弁別器（ＥｄｇｅＤｉｓｃｒｉｍｉｎａｔｏｒ）をトレーニングし、キーポイントペア毎に判別し、このキーポイントペアが同一目標対象に属するかを判断する。判別情報によってキーポイント間の類似度行列を更新する。

【0080】

４）クラスタリング（Ｇｒｏｕｐｉｎｇ）：キーポイント間の類似度行列を用いてクラスタリングアルゴリズムを実行し、隣接するキーポイントを一グループに集約して、新しいマクロノードとする（クラスタリングした後に得られたキーポイントがマクロノードとなる）。マクロノードの弁別器（Ｍａｃｒｏ－ＮｏｄｅＤｉｓｃｒｉｍｉｎａｔｏｒ）をトレーニングし、マクロノード内部のキーポイントが同一目標対象に属するかを判断する。

【0081】

５）枝刈り処理（ＧｒａｐｈＰｒｕｎｉｎｇ）：何らかの目標対象構造の先験的制約により、キーポイントグラフィックモデル（Ｇｒａｐｈ）に対して枝刈り処理を行って、相関性のない辺を削除する。

【0082】

６）特徴集約（ＦｅａｔｕｒｅＡｇｇｒｅｇａｔｉｏｎ）：各マクロノードに対して特徴を更新する。キーポイントグラフィックモデルにおける全ての辺が削除されるまで、又は全てのキーポイントが成功的に複数のクラスタにクラスタリングされるまで、クラスタリングプロセス全体を反復的に行う。

【0083】

本開示の実施例はキーポイント検出方法を提供し、オンライン階層化グラフクラスタリング（ＯｎｌｉｎｅＨｉｅｒａｒｃｈｉｃａｌＧｒａｐｈＣｌｕｓｔｅｒｉｎｇ：ＯＨＧＣ）を例とし、１枚の多目標対象ＲＧＢ画像（目標対象数をＰと仮定する）を入力し、Ｐ個の目標対象キーポイントクラスタ（１つの目標対象の全てのキーポイントが１つのクラスタを構成する）を出力し、前記方法は、
検出すべき画像中のキーポイント情報を抽出するステップＳ１と、多目標対象のキーポイントヒートマップを構築するステップＳ２と、ＧＮＮの相関性に基づいて特徴学習を行うステップＳ３と、前記キーポイントグラフィックモデルにおいて枝刈り待ちの辺がなくなるまで、複数回反復するステップＳ４と、を含む。

【0084】

本開示のいくつかの実施例では、前記キーポイントグラフィックモデルにおいて枝刈り待ちの辺がなくなるまで、複数回反復する前記ステップＳ４は、プーリング層（ａｖｇ－ｐｏｏｌｉｎｇ）を用いてキーポイント特徴融合を行うステップＳ４１と、キーポイント間の類似度行列を更新するステップＳ４２と、前記キーポイントに対してクラスタリングを行うステップであって、前記クラスタリングはキーポイントの統合を実現できるステップＳ４３と、現在キーポイントグラフィックモデルに対して枝刈り処理を行うステップＳ４４と、を含む。目標対象構造制約により、現在キーポイントグラフィックモデルにおける不合理な辺を削除する。例えば、１つの目標対象には１つの頭頂点しかない。

【0085】

図２Ｂは本開示の実施例に係るキーポイント検出方法を実現するネットワーク構成の模式図であり、図２Ｂに示すように、前記ネットワーク構成はＧＮＮモジュール２１、辺弁別器２２（ＥｄｇｅＤｉｓｃｒｉｍｉｎａｔｏｒ）及びマクロノード弁別器２３（Ｍａｃｒｏ－ｎｏｄｅＤｉｓｃｒｉｍｉｎａｔｏｒ）を備え、その中で、ＧＮＮモジュール２１は、エッジ畳み込みＥｄｇｅＣｏｎｖ層と多層ニューラルネットワーク（Ｍｕｌｔｉ－ＬａｙｅｒＰｅｒｃｅｐｔｒｏｎ：ＭＬＰ）を重ねてなったものである。その中で、ＥｄｇｅＣｏｎｖ層は微分可能で、既存のネットワークアーキテクチャに組み込み可能なニューラルネットワークモジュールであり、ローカル領域情報を含み、ＥｄｇｅＣｏｎｖモジュールを重ね又は循環して使用することでグローバル形状情報を抽出できる等のメリットを有する。辺弁別器２２は、１対のキーポイントの特徴を入力して、これら２つのキーポイントが同一目標対象に属するかを判断するように構成される。マクロノード弁別器２３は、１つのマクロノード内部のキーポイントが完全に同一目標対象に属するかを判断するように構成される。

【0086】

上記方法は、インターネットビデオにおいて目標対象キーポイントの位置を正確に予測することに利用してもよく、目標対象の行動種類を解析することに利用してもよく、更に目標対象の異なる部位にリアルタイムな特殊効果を施すことに利用してもよい。上記方法において、階層化グラフクラスタリングモジュールに基づいて、オンライン階層化グラフクラスタリングアルゴリズムを実現し、目標対象の構造先験的情報と目標対象のグローバル情報を保留する。一方で、エンドツーエンドのトレーニングによって、クラスタリング結果に発生した誤りに更に注目し、より効率的に特徴学習を行うようになり、クラスタリング結果を直接最適化して、クラスタリング精度を高くすることができる。他方で、目標対象の構造先験的情報とグローバル特徴情報が利用可能であり、キーポイントのクラスタリング精度を高くする。

【0087】

実施形態の上記方法において、各ステップの記述順序は厳しい実行順序であるというわけではなく、実施プロセスの何の制限にもならず、各ステップの実行順序はその機能と可能な内在的論理に依存することが当業者に理解される。

【0088】

同様な構想に基づいて、本開示の実施例は、本開示の実施例に係るキーポイント検出装置の構成の模式図である図３に示すように、取得モジュール３０１、第１生成モジュール３０２、第２生成モジュール３０３、処理モジュール３０４、決定モジュール３０５、トレーニングモジュール３０６、行動種類決定モジュール３０７及び特殊効果生成モジュール３０８を備えるキーポイント検出装置を更に提供する。

【0089】

取得モジュール３０１は、検出すべき画像を取得するように構成される。

【0090】

第１生成モジュール３０２は、前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するように構成され、前記画像特徴マップは前記検出すべき画像中の各目標対象のキーポイント間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する。

【0091】

第２生成モジュール３０３は、前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するように構成され、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である。

【0092】

処理モジュール３０４は、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るように構成される。

【0093】

可能な一実施形態では、前記キーポイントの情報は位置情報、カテゴリ情報及び画素特徴情報を含み、前記第２生成モジュール３０３は、前記キーポイントヒートマップに基づいて各キーポイントの位置情報を決定するステップと、各前記キーポイントの位置情報に基づいて前記画像特徴マップから前記キーポイントの画素特徴情報を抽出し、且つ前記キーポイントの所属するキーポイントヒートマップのカテゴリラベルに基づいて前記キーポイントに対応するカテゴリ情報を決定するステップと、により、前記初期キーポイントグラフィックモデル中の各キーポイントの情報を決定するように構成される。

【0094】

可能な一実施形態では、前記装置は、前記初期キーポイントグラフィックモデル中の各前記キーポイントに対して、前記キーポイントの情報、及び前記キーポイントグラフィックモデルにおける前記キーポイントの間に接続辺が存在する他のキーポイントの情報に基づいて、前記キーポイントの融合特徴を決定するように構成される決定モジュール３０５を更に備え、前記処理モジュール３０４は、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行う場合に、前記初期キーポイントグラフィックモデルに含まれる各前記キーポイントの融合特徴に基づいて、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行うように構成される。

【0095】

可能な一実施形態では、前記処理モジュール３０４は、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行う場合に、現在キーポイントグラフィックモデルに対して第１処理プロセスを実行するステップであって、前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、クラスタリングされた複数の隣接キーポイントを含む少なくとも１つのマクロノードを得、各前記マクロノードに含まれるキーポイントの融合特徴に基づいて前記マクロノードの融合特徴を決定するステップと、得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を含む、第１処理プロセスを実行するステップと、今回の前記第１処理プロセスを実行した後、今回の枝刈り処理後のキーポイントグラフィックモデルを現在キーポイントグラフィックモデルとし、今回決定された前記マクロノード及び前記マクロノードの融合特徴を前記現在キーポイントグラフィックモデル中のキーポイント及びキーポイントの融合特徴とし、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記第１処理プロセスを再度実行するステップと、を実行するように構成される。

【0096】

可能な一実施形態では、前記処理モジュール３０４は、前記現在キーポイントグラフィックモデル中の各接続辺に対応する２つのキーポイントの融合特徴に基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得る場合に、前記接続辺に対応する２つのキーポイントの融合特徴に基づいて前記接続辺の重みを決定するステップであって、前記重みは前記接続辺に対応する２つのキーポイントが同一目標対象に属する確率を表す、ステップと、前記現在キーポイントグラフィックモデルに含まれる各接続辺の重みに基づいて、前記現在キーポイントグラフィックモデルに含まれる複数のキーポイントのうちの隣接キーポイントに対して同一目標対象のキーポイントクラスタリングを行って、少なくとも１つのマクロノードを得るステップと、を実行するように構成される。

【0097】

可能な一実施形態では、前記処理モジュール３０４は、得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて、前記現在キーポイントグラフィックモデルに対して今回の前記接続辺の枝刈り処理を行って、今回の枝刈り処理後のキーポイントグラフィックモデルを得る場合に、得られた少なくとも１つの前記マクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定し、且つ前記現在キーポイントグラフィックモデルから前記削除すべき接続辺を削除するステップと、少なくとも１つの前記マクロノード、及び前記現在キーポイントグラフィックモデルにおける前記マクロノードに含まれるキーポイント以外の他のキーポイントを枝刈り処理後のキーポイントとし、削除後に残された接続辺を枝刈り処理後の接続辺として、今回の枝刈り処理後のキーポイントグラフィックモデルを得るステップと、を実行するように構成される。

【0098】

可能な一実施形態では、前記処理モジュール３０４は、得られた少なくとも１つのマクロノードと前記現在キーポイントグラフィックモデルに基づいて削除すべき接続辺を決定する場合に、少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定するように構成される。

【0099】

可能な一実施形態では、前記処理モジュール３０４は、少なくとも１つのマクロノードに含まれる各キーポイントのカテゴリ情報、及び前記現在キーポイントグラフィックモデルにおける少なくとも１つのマクロノードに含まれるキーポイント以外の他のキーポイントのカテゴリ情報に基づいて、前記削除すべき接続辺を決定する場合に、前記現在キーポイントグラフィックモデルにおけるいずれかの接続辺に対して、このいずれかの接続辺に対応する２つのキーポイントが異なるマクロノード中のキーポイントであり、且つこのいずれかの接続辺に対応する２つのマクロノードにカテゴリ情報が同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、このいずれかの接続辺に対応する２つのキーポイントが同一マクロノード中のキーポイントである場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、このいずれかの接続辺に対応する２つのキーポイントの一方がマクロノード中のキーポイントであり、他方がマクロノード中のキーポイントでなく、且つこのいずれかの接続辺に対応する前記マクロノードに他方のキーポイントのカテゴリ情報と同じなキーポイントが存在する場合に、このいずれかの接続辺を前記削除すべき接続辺に決定するステップと、を実行するように構成される。

【0100】

可能な一実施形態では、前記各目標対象のキーポイント情報は事前トレーニング済み目標ニューラルネットワークによって生成され、前記目標ニューラルネットワークはマクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして得られたものであり、マクロノード弁別器は各マクロノードに含まれる複数のキーポイントが同一目標対象に属するかを判別するためのものである。

【0101】

可能な一実施形態では、前記装置は、サンプル画像を取得するステップと、前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、によって、前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るように構成されるトレーニングモジュール３０６を更に備える。

【0102】

可能な一実施形態では、前記トレーニングモジュール３０６は、前記サンプル画像に基づいて前記マクロノード弁別器を備えるトレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得る場合に、前記サンプル画像に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、予測結果を得るステップであって、前記予測結果は前記マクロノード弁別器の検出結果、各キーポイントの予測カテゴリ及び各キーポイントの予測位置情報を含む、ステップと、前記マクロノード弁別器の検出結果に基づいて第１損失値を決定し、また、前記各キーポイントの予測カテゴリ、前記各キーポイントの予測位置情報及び前記サンプル画像に含まれるラベリング結果に基づいて第２損失値を決定するステップであって、前記ラベリング結果は対応する目標対象に属する各キーポイントのラベリングカテゴリ及び各キーポイントのラベリング位置情報を含む、ステップと、前記第１損失値と前記第２損失値に基づいて前記トレーニング待ちニューラルネットワークをトレーニングして、事前トレーニング済み目標ニューラルネットワークを得るステップと、を実行するように構成される。

【0103】

可能な一実施形態では、前記検出すべき画像中の各目標対象のキーポイント情報を得た後、各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の行動種類を決定するように構成される行動種類決定モジュール３０７を更に備える。

【0104】

可能な一実施形態では、前記検出すべき画像中の各目標対象のキーポイント情報を得た後、各目標対象に対応する前記キーポイント情報に基づいてこの目標対象の少なくとも１つの目標部位の位置情報を決定し、且つ前記少なくとも１つの目標部位の位置情報により前記少なくとも１つの目標部位に対する特殊効果情報を生成するように構成される特殊効果生成モジュール３０８を更に備える。

【0105】

いくつかの実施例では、本開示の実施例に係る装置に備える機能又はそれに含まれるモジュールは上述した方法実施例に記載のキーポイント検出方法を実行するために用いられ、その実現のプロセスについては上述した方法実施例の記載を参照してもよく、簡潔化するために、ここで詳細な説明を省略する。

【0106】

同様な技術構想に基づいて、本開示の実施例は電子機器を更に提供する。本開示の実施例に係る電子機器の構成の模式図である図４に示すように、プロセッサ４０１、メモリ４０２及びバス４０３を含む。ここで、メモリ４０２は実行命令を記憶するように構成され、内部メモリ４０２１と外部メモリ４０２２を含み、上述した内部メモリ４０２１は内部記憶装置とも呼ばれ、プロセッサ４０１中の演算データ及びハードディスク等の外部メモリ４０２２と交換するデータを一時保存するように構成される。プロセッサ４０１は、内部メモリ４０２１を経由して外部メモリ４０２２とデータ交換を行い、電子機器４００が実行する場合に、プロセッサ４０１は、バス４０３によってメモリ４０２と通信して、
検出すべき画像を取得するステップと、前記検出すべき画像に基づいて画像特徴マップと複数のキーポイントヒートマップを生成するステップであって、前記画像特徴マップは前記検出すべき画像中の各目標対象間の相対的位置関係を表すためのものであり、各前記キーポイントヒートマップは前記検出すべき画像の１種のカテゴリのキーポイントを含み、異なるカテゴリのキーポイントが前記目標対象の異なる部位に対応する、ステップと、前記画像特徴マップと複数の前記キーポイントヒートマップに基づいて初期キーポイントグラフィックモデルを生成するステップであって、前記初期キーポイントグラフィックモデルは前記検出すべき画像における異なるカテゴリのキーポイントの情報及び接続辺の情報を含み、各接続辺は２つの異なるカテゴリのキーポイントの間の辺である、ステップと、処理後のキーポイントグラフィックモデル中の複数のキーポイントが複数のクラスタにクラスタリングされるまで、前記初期キーポイントグラフィックモデルに対して前記接続辺の枝刈り処理を複数回行って、それぞれ各目標対象に属するキーポイント情報を得るステップと、を実施する命令を実行する。また、本開示の実施例は、プロセッサによって実行する時に、プロセッサに上記の方法実施例に記載のキーポイント検出方法のステップを実行させるコンピュータプログラムを記憶したコンピュータ可読記憶媒体を更に提供する。

【0107】

本開示の実施例に係るキーポイント検出方法によるコンピュータプログラム製品は、プログラムコードを記憶したコンピュータ可読記憶媒体を含み、前記プログラムコードに含まれる命令は上記の方法実施例に記載のキーポイント検出方法のステップを実行することに利用可能であり、上記の方法実施例を参照してもよく、ここで詳細な説明を省略する。

【0108】

説明の便宜上、上述したシステムと装置の動作プロセスについては上記の方法実施例に対応するプロセスを参照してもよいことが当業者に明らかであるため、ここで詳細な説明を省略する。本開示により提供されるいくつかの実施例では、開示するシステム、装置及び方法は、他の形態で実現できることを理解すべきである。上述した装置実施例は例示的なものに過ぎず、例えば、前記ユニットの分割は、論理機能の分割に過ぎず、実際に実現時に別の形態で分割してもよく、更に例えば、複数のユニット又はコンポーネントは組み合わせてもよく、又は別のシステムに統合してもよく、又はいくつかの特徴を省略もしくは実行しなくてもよい。一方、図示又は説明した相互の結合又は直接結合又は通信接続はいくつかの通信インタフェース、機器又はユニットを介した間接結合又は通信接続であり得、電気的、機械的又は他の形態であり得る。

【0109】

分離部材として説明した前記ユニットは物理的に分離されたものであってもなくてもよく、ユニットとして示した部材は物理ユニットであってもなくてもよく、一箇所に位置してもよく、又は複数のネットワークユニットに分布してもよい。実際の必要に応じてその一部又は全てのユニットを選択して本実施例の解決手段の目的を実現できる。また、本開示の各実施例における各機能ユニットは一つの処理ユニットに統合されてもよく、それぞれ独立して物理的に存在してもよく、二つ又は二つ以上で一つのユニットに統合されてもよい。

【0110】

前記機能がソフトウェア機能ユニットの形式で実現され且つ独立した製品として販売又は使用される場合、プロセッサに実行可能な非揮発性コンピュータ可読記憶媒体に記憶されてもよい。このような見解をもとに、本開示の技術的解決手段は実質的に従来技術に寄与する部分またはこの技術的解決手段の一部がソフトウェア製品の形で実施することができ、該コンピュータソフトウェア製品は記憶媒体に記憶され、コンピュータ機器（パーソナルコンピュータ、サーバ、又はネットワーク機器等であってもよい）に本開示の各実施例に記載のキーポイント検出方法のステップの全部又は一部を実行させる複数の命令を含む。前記記憶媒体は、ＵＳＢメモリ、モバイルハードディスク、読出し専用メモリ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ：ＲＯＭ）、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ：ＲＡＭ）、磁気ディスク又は光ディスク等のプログラムコードを記憶可能である様々な媒体を含む。以上は本開示の具体的な実施形態に過ぎず、本開示の保護範囲がそれに限定されるものでなく、本開示に記載された技術範囲内に当業者に容易に想到される変化又は取り替えは、全て本開示の保護範囲に含まれる。従って、本開示の保護範囲は請求項の保護範囲に準ずるものとする。

【産業上の利用可能性】

【0111】

本開示は、生成した画像特徴マップと複数のキーポイントヒートマップに基づいて検出すべき画像に対応する初期キーポイントグラフィックモデルを生成し、初期キーポイントグラフィックモデルは画像特徴マップとキーポイントヒートマップ中の情報を含み、画像特徴マップが検出すべき画像における異なる目標対象間の相対的位置関係を表すことができるので、初期キーポイントグラフィックモデルに対して、接続辺の枝刈り処理を行って各目標対象のキーポイント情報を得ることができ、異なる目標対象のキーポイントを正確に区別して、キーポイントクラスタリングの精度を高める。

【図1】

【図2A】

【図2B】

【図3】

【図4】

知財求人

青山学院大学 (神奈川県相模原市中央区淵野辺)

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版