特表2023-512282 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 深▲せん▼市洲明科技股▲ふん▼有限公司の特許一覧

特表2023-512282複数人三次元モーションキャプチャ方法、記憶媒体及び電子機器

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-03-24

(54)【発明の名称】複数人三次元モーションキャプチャ方法、記憶媒体及び電子機器

(51)【国際特許分類】

G06T 7/20 20170101AFI20230316BHJP

【ＦＩ】

G06T7/20 300A

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2022546634

(86)(22)【出願日】2021-07-09

(85)【翻訳文提出日】2022-08-01

(86)【国際出願番号】 CN2021105486

(87)【国際公開番号】W WO2022100119

(87)【国際公開日】2022-05-19

(31)【優先権主張番号】202011260863.4

(32)【優先日】2020-11-12

(33)【優先権主張国・地域又は機関】CN

(81)【指定国・地域】

(71)【出願人】

【識別番号】514173711

【氏名又は名称】深▲せん▼市洲明科技股▲ふん▼有限公司

【氏名又は名称原語表記】ＵＮＩＬＵＭＩＮＧＲＯＵＰＣＯ．，ＬＴＤ．

【住所又は居所原語表記】ＢｕｉｌｄｉｎｇＡ＃１１２，ＹｏｎｇｆｕＲｄ，ＱｉａｏｔｏｕＶｉｌｌａｇｅ，ＦｕｙｏｎｇＴｏｗｎ，ＢａｏａｎＤｉｓｔｒｉｃｔ，Ｓｈｅｎｚｈｅｎ，Ｇｕａｎｇｄｏｎｇ５１８１０３Ｃｈｉｎａ

(74)【代理人】

【識別番号】100205936

【弁理士】

【氏名又は名称】崔海龍

(74)【代理人】

【識別番号】100132805

【弁理士】

【氏名又は名称】河合貴之

(72)【発明者】

【氏名】邱又海

(72)【発明者】

【氏名】唐毅

(72)【発明者】

【氏名】徐倩茹

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096AA09

5L096CA05

5L096DA02

5L096FA09

5L096FA67

5L096FA69

5L096GA34

5L096HA02

5L096MA07

(57)【要約】

本発明は複数人三次元モーションキャプチャ方法、記憶媒体及び電子機器を開示し、複数のカメラの同期ビデオフレームを取得し、各カメラの各同期ビデオフレームに対して、それぞれ関節ポイント認識及び位置測定を行い、各カメラによる各人物の２Ｄ関節ポイント情報を得るステップと、各２Ｄ関節ポイントの逆投影射線を計算し、逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るステップであって、逆投影射線は、２Ｄ関節ポイントに対応するカメラから２Ｄ関節ポイントを指す射線であるステップと、三次元モーションキャプチャを行うために、最適な２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するステップと、を含む。
【選択図】図１

【特許請求の範囲】

【請求項1】

複数人三次元モーションキャプチャ方法であって、前記方法は、
複数のカメラの同期ビデオフレームを取得し、各前記カメラの各前記同期ビデオフレームに対して、それぞれ関節ポイント認識及び位置測定を行い、各前記カメラによる各人物の２Ｄ関節ポイント情報を得るステップと、
各２Ｄ関節ポイントの逆投影射線を計算し、前記逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るステップであって、前記逆投影射線は、前記２Ｄ関節ポイントに対応するカメラから前記２Ｄ関節ポイントを指す射線であるステップと、
三次元モーションキャプチャを行うために、最適な前記２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するステップと、
を含む複数人三次元モーションキャプチャ方法。

【請求項2】

前記の各２Ｄ関節ポイントの逆投影射線を計算し、前記逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るステップは、具体的には、
全ての前記２Ｄ関節ポイント情報を関節ポイントのタイプ別に分けて、各前記関節タイプに対応する全ての前記２Ｄ関節ポイント情報を得るステップと、
各前記関節ポイントタイプの各前記２Ｄ関節ポイント情報に対して、それぞれ逆投影射線の計算を行い、前記逆投影射線間の最短距離に基づいてクラスタリングすることで、各前記関節ポイントタイプの関節ポイントマッチングスキームを得るステップと、
全ての前記関節ポイントタイプの関節ポイントマッチングスキームをマージして、最適な２Ｄ人物マッチングスキームを得るステップと、
を含む請求項１に記載の複数人三次元モーションキャプチャ方法。

【請求項3】

前記の各２Ｄ関節ポイントの逆投影射線を計算するステップは、具体的には、
各前記２Ｄ関節ポイントについて、座標原点及び対応するカメラ外部パラメータに基づいてカメラ３Ｄ座標を得て、前記カメラ３Ｄ座標を前記逆投影射線の端点として、対応するカメラ内部パラメータ、カメラ外部パラメータ及び各前記２Ｄ関節ポイントの２Ｄ関節ポイント座標情報に基づいて、前記逆投影射線の方向ベクトルを得ることで、各前記２Ｄ関節ポイントの逆投影射線を得るステップを含む
請求項１に記載の複数人三次元モーションキャプチャ方法。

【請求項4】

前記の前記逆投影射線間の最短距離に基づいてクラスタリングすることで、各前記関節ポイントタイプの関節ポイントマッチングスキームを得るステップは、
各前記カメラ内の各前記２Ｄ関節ポイントの逆投影射線と、同一の前記関節ポイントタイプの他の前記カメラ内の各前記２Ｄ関節ポイントの逆投影射線とについて、それぞれ２つずつ最短線分の計算を行って、２本の前記逆投影射線間の最短線分である場合の２つの端点の端点座標を得るステップと、
各前記関節ポイントタイプ内の全ての前記端点をクラスタリングしてクラスタリング結果を出力し、前記クラスタリング結果に基づいて、組み合わせにより各前記関節ポイントタイプの関節ポイントマッチングスキームを生成するステップと、
を含む請求項２に記載の複数人三次元モーションキャプチャ方法。

【請求項5】

前記の２本の逆投影射線間の最短線分である場合の２つの端点の端点座標を得るステップは、具体的には、
前記逆投影射線

【数1】

の始点座標と方向ベクトルがそれぞれｓ_０と

【数2】

であり、前記逆投影射線

【数3】

の始点座標と方向ベクトルがそれぞれｔ_０と

【数4】

であるとすると、前記逆投影射線

【数5】

のベクトル表現式を

【数6】

として、前記逆投影射線

【数7】

のベクトル表現式を

【数8】

とするステップと、
前記逆投影射線

【数9】

と前記逆投影射線

【数10】

と間の最短線分である場合の２つの端点の端点座標がそれぞれｓ_ｊとｔ_ｊであるとすると、２つの前記端点座標のベクトル表現式を

【数11】

と

【数12】

として、ベクトルを

【数13】

と記すと、前記逆投影射線

【数14】

と前記逆投影射線

【数15】

との間の最短線分のベクトル表現式を、第１式：

【数16】

とするステップであって、前記ｓ_ｃと前記ｔ_ｃはスカラであるステップと、
前記最短線分のベクトル表現式を

【数17】

と

【数18】

にそれぞれ代入して第２式と第３式を得るステップであって、前記第２式は

【数19】

で、前記第３式は

【数20】

であり、

【数21】

と記すと、前記スカラｓ_ｃ＝（ｂｅ－ｃｄ）／（ａｃ－ｂ^２）と前記スカラｔ_ｃ＝（ａｅ－ｂｄ）／（ａｃ－ｂ^２）とを得るステップと、
前記ａｃ－ｂ^２が０に等しいか否かを判断し、そうであれば、前記逆投影射線

【数22】

と前記逆投影射線

【数23】

は平行関係であり、何れか一つの前記逆投影射線上で１つの固定点を端点の１つとして指定し、前記第２式と前記第３式を代入すると、２つの前記端点座標ｓ_ｊとｔ_ｊを得ることができ、そうでなければ、前記スカラｓ_ｃ＝（ｂｅ－ｃｄ）／（ａｃ－ｂ^２）と前記スカラｔ_ｃ＝（ａｅ－ｂｄ）／（ａｃ－ｂ^２）とに基づいて、２つの前記端点座標ｓ_ｊとｔ_ｊを求めるステップと、
を含む請求項４に記載の複数人三次元モーションキャプチャ方法。

【請求項6】

前記の各前記関節ポイントタイプ内の全ての前記端点をクラスタリングしてクラスタリング結果を出力し、前記クラスタリング結果に基づいて、組み合わせにより各前記関節ポイントタイプの関節ポイントマッチングスキームを生成するステップは、具体的には、
何れか２本の前記逆投影射線間の最短線分である場合の２つの端点座標を得たときに、２つの前記端点座標ｓ_ｊとｔ_ｊから、前記最短線分の最短距離ｄ_ｍｉｎ＝｜ｓ_ｊ－ｔ_ｊ｜を得るステップと、
各前記関節ポイントタイプ内の、最短距離ｄ_ｍｉｎが既定距離閾値を超える前記最短線分をフィルタリングして削除し、各前記関節ポイントタイプ内の残された前記最短線分に対応する端点を端点集合Ｒとして形成させるステップであって、各前記端点は、２Ｄ関節ポイント、カメラ識別子及び人物識別子に対応するステップと、
ｋ最近傍分類アルゴリズムによって、各前記関節ポイントタイプ内の前記端点集合Ｒ内の全ての端点に対して、近傍マッチングを行って、近傍端点で形成されるクラスタを得て、各前記クラスタ内の端点の数の多い順に、前記クラスタをソートして、各前記関節ポイントタイプ内のソート後のクラスタ情報を得るステップと、
各前記関節ポイントタイプに対して、それぞれマッチングスキームを生成するステップであって、現在のマッチング項目を取得し、各クラスタ内の各端点をトラバースし、トラバースされた端点が前記現在のマッチング項目に使用されておらず、かつ、前記現在のマッチング項目がトラバースされた端点の前記カメラ識別子を有さない場合、現在のマッチング項目に前記端点を追加し、前記クラスタ内の各端点に対するトラバースが完了すると、各関節ポイントタイプの関節ポイントマッチングスキームを得るステップと、
前記の全ての前記関節ポイントタイプの関節ポイントマッチングスキームをマージして、最適な２Ｄ人物マッチングスキームを得るステップは、具体的には、
全ての関節ポイントタイプの関節ポイントマッチングスキーム内の各マッチング項目の出現回数を統計し、出現回数が最も多いマッチング項目を組み合わせて最適な２Ｄ人物マッチングスキームとするステップを含む
請求項４に記載の複数人三次元モーションキャプチャ方法。

【請求項7】

前記の最適な前記２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するステップは、具体的には、
前記２Ｄ人物マッチングスキームの各マッチング項目をトラバースして、各前記マッチング項目内の各関節ポイントに含まれる２Ｄ関節ポイント座標情報及び対応するカメラパラメータ情報を取得するステップと、
マルチカメラビジュアル三次元計測技術によって、複数の前記２Ｄ関節ポイント座標情報を３Ｄ三次元空間座標として計算して、３Ｄ関節ポイント情報を得るステップと、
前記３Ｄ関節ポイント情報に基づいて、再投影誤差を計算し、前記再投影誤差が既定投影誤差を超えた前記３Ｄ関節ポイント情報をフィルタリングで除去するステップと、
各前記マッチング項目内の全ての関節ポイントに対するトラバースが完了すると、残された全ての前記３Ｄ関節ポイント情報に基づいて、１つの人物の３Ｄ情報を生成するステップと、
全ての前記マッチング項目に対するトラバースが完了すると、前記マッチング項目の数に対応する複数人物の３Ｄ情報を得るステップと、
を含む請求項４に記載の複数人三次元モーションキャプチャ方法。

【請求項8】

現在の同期ビデオフレーム及び次の同期ビデオフレームによってそれぞれ得られた複数人物の３Ｄ情報を取得して、前後２つの同期ビデオフレームにおける各人物の人体重心位置のオフセット距離が、既定最大移動距離閾値よりも小さいか否かを判断し、そうであれば、前記次の同期ビデオフレームの各人物の人体重心位置に応じて、過去人物位置集合内の人物一意ＩＤに対応する位置情報を更新するステップと、
前記次の同期ビデオフレームのある人物の、前記現在の同期ビデオフレーム内の全ての人物の人体重心位置からのオフセット距離が、前記既定最大移動距離閾値より大きければ、その人物を新たな人物として判定し、前記新たな人物に新たな人物一意ＩＤを付与して、前記新たな人物の位置情報を、前記過去人物位置集合に追加するステップと、
前記現在の同期ビデオフレームのある人物の、前記次の同期ビデオフレーム内の全ての人物の人体重心位置からのオフセット距離が、前記既定最大移動距離閾値より大きければ、その人物を退出人物として判定し、前記過去人物位置集合から、前記退出人物に対応する人物一意ＩＤの位置情報を除去するステップと、
をさらに含む請求項１に記載の複数人三次元モーションキャプチャ方法。

【請求項9】

プロセッサによって実行されたときに、請求項１～８の何れか一項に記載の複数人三次元モーションキャプチャ方法を実現するコンピュータプログラムが記憶された
コンピュータ読み取り可能な記憶媒体。

【請求項10】

メモリとプロセッサを含む電子機器であって、
前記メモリにはプロセッサ上で実行可能なコンピュータプログラムが記憶されており、前記プロセッサによって前記コンピュータプログラムを実行したときに、請求項１～８の何れか一項に記載の複数人三次元モーションキャプチャ方法を実現する
電子機器。

【請求項11】

複数人三次元モーションキャプチャ装置であって、前記装置は、
複数のカメラの同期ビデオフレームを取得し、各前記カメラの各前記同期ビデオフレームに対して、それぞれ関節ポイント認識及び位置測定を行い、各前記カメラによる各人物の２Ｄ関節ポイント情報を得るように構成された同期ビデオフレーム取得モジュールと、
各２Ｄ関節ポイントの逆投影射線を計算し、前記逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るように構成されたクラスタリングモジュールであって、前記逆投影射線は、前記２Ｄ関節ポイントに対応するカメラから前記２Ｄ関節ポイントを指す射線であるクラスタリングモジュールと、
三次元モーションキャプチャを行うために、最適な前記２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するように構成された再構築モジュールと、
を含む複数人三次元モーションキャプチャ装置。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願の相互参照）
本願は２０２０年１１月１２日に提出された、出願番号が２０２０１１２６０８６３．４で、名称が「複数人三次元モーションキャプチャ方法、記憶媒体及び電子機器」ある中国特許出願の優先権を主張し、その全ての内容を引用により本願に組み入れる。

【0002】

本発明はヒューマンマシンインタラクションの技術分野に関し、特に複数人三次元モーションキャプチャ方法、記憶媒体及び電子機器に関する。

【背景技術】

【0003】

２０１３年からＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ、仮想現実）技術が世界的に段々普及し始めているが、中でもモーションキャプチャ技術はＶＲ技術の中でもキーテクノロジーである。

【0004】

現段階では、伝統的なモーションキャプチャシステムは、光学式、慣性式或いは機械式の動作原理を採用しており、その使用者は誰もが、第三者のハードウェアを利用して、特定のモーションキャプチャスーツ及び道具を着用して、システムとインタラクションする必要があり、これでは、ヒューマンマシンインタラクションが十分に直接的ではないという問題が存在する。

【0005】

深層学習の技術進展に伴い、コンピュータの計算能力、アルゴリズムの精度が効果的に向上しており、特に画像処理分野では、コンピュータによって、画像内の人体の動き、顔の表情や指の動きなどに対して、姿勢の推定を実現することができる。このうち、ＯｐｅｎＰｏｓｅ（Ｇｉｔｈｕｂのオープンソース人体姿勢認識プロジェクト）人体姿勢認識プロジェクトは、人体の動き、顔の表情や指の動きなどの姿勢推定を実現し、単一人物のモーションキャプチャ機能をサポートできる。単一の人物がシーンに入ると、ＯｐｅｎＰｏｓｅは人物の２Ｄ（ｔｗｏｄｉｍｅｎｓｉｏｎａｌ、二次元）関節ポイントに対して、３Ｄ（ｔｈｒｅｅｄｉｍｅｎｓｉｏｎａｌ、三次元）再構築を良好に行うことができるが、人が密集しているシーンでは、カメラの視野角のカバレッジが原因で、カメラが認識する人物の数が異なり、そのアルゴリズムによって人物を選択するアルゴリズムでは、正しい人物２Ｄ関節ポイントをマッチングさせることが難しいゆえ、人物の３Ｄ関節ポイント情報を誤って再構築することがある。

【発明の概要】

【課題を解決するための手段】

【0006】

本願の一態様によれば、複数人三次元モーションキャプチャ方法を提供し、前記方法は、
複数のカメラの同期ビデオフレームを取得し、各前記カメラの各前記同期ビデオフレームに対して、それぞれ関節ポイント認識及び位置測定を行い、各前記カメラによる各人物の２Ｄ関節ポイント情報を得るステップと、
各２Ｄ関節ポイントの逆投影射線を計算し、前記逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るステップであって、前記逆投影射線は、前記２Ｄ関節ポイントに対応するカメラから前記２Ｄ関節ポイントを指す射線であるステップと、
三次元モーションキャプチャを行うために、最適な前記２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するステップと、
を含む。

【0007】

本発明の別の態様によれば、プロセッサによって実行されたときに、上記の複数人三次元モーションキャプチャ方法を実現するコンピュータプログラムを記憶したコンピュータ読み取り可能な記憶媒体を提供する。

【0008】

本明細書のさらに別の態様によれば、メモリとプロセッサを含む電子機器を提供し、メモリにはプロセッサ上で実行可能なコンピュータプログラムが記憶されており、前記プロセッサによって前記コンピュータプログラムを実行したときに、上記の複数人三次元モーションキャプチャ方法を実現する。

【0009】

本願の一態様によれば、複数人三次元モーションキャプチャ装置を提供し、前記装置は、
複数のカメラの同期ビデオフレームを取得し、各前記カメラの各前記同期ビデオフレームに対して、それぞれ関節ポイント認識及び位置測定を行い、各前記カメラによる各人物の２Ｄ関節ポイント情報を得るように構成された同期ビデオフレーム取得モジュールと、
各２Ｄ関節ポイントの逆投影射線を計算し、前記逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るように構成されたクラスタリングモジュールであって、前記逆投影射線は、前記２Ｄ関節ポイントに対応するカメラから前記２Ｄ関節ポイントを指す射線であるクラスタリングモジュールと、
三次元モーションキャプチャを行うために、最適な前記２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するように構成された再構築モジュールと、
を含む。

【0010】

以下の図面及び説明を通じて、本発明の各実施例の詳細を説明する。明細書、図面及び特許請求の範囲の記載から、当業者は、本発明の他の特徴、解決しようとする問題及び有益効果を容易に理解することができるであろう。

【図面の簡単な説明】

【0011】

本願の実施例をより良く例示して説明するために、１つ又は複数の図面を参照することがあるが、図面を説明するための追加の詳細または例示は、本願の発明創造、現在説明されている実施例又は好ましい態様の何れか一つの範囲を限定するものとみなされるべきではない。

【図1】本発明の実施例の複数人三次元モーションキャプチャ方法の模式フローチャートである。

【図2】本発明の実施例に係る複数人三次元モーションキャプチャ方法の全体としての模式フローチャートである。

【図3】本発明の実施例に係る２Ｄ関節ポイントのマッチングの模式フローチャートである。

【図4】本発明の実施例に係る人物の３Ｄ関節ポイントの再構築の模式フローチャートである。

【図5】本発明の実施例に係るＯｐｅｎＰｏｓｅの２５種類の関節ポイントの構造模式図である。

【図6】本発明の実施例に係る複数人三次元モーションキャプチャ方法のシミュレーションシーンの模式図である。

【図7】本発明の実施例に係る複数人三次元モーションキャプチャ方法の、シミュレーションシーンにおけるクラスタリング効果の模式図である。

【図8】本発明の実施例に係る２Ｄ関節ポイントのマッチングの模式図である。

【図9】本発明の実施例に係る関節ポイント信頼度フィルタリングの効果の模式図である。

【図10】本発明の実施例に係る５人の人物の左手関節のマッチング模式図である。

【図11】本発明の実施例に係る複数人三次元モーションキャプチャ方法の、複数人シーンにおけるマッチング効果の模式図である。

【図12】本発明の実施例に係る２本の逆投影射線間の最短線分の計算模式図である。

【図13】本発明の実施例の電子機器の構造模式図である。

【発明を実施するための形態】

【0012】

本発明の技術的内容、実現する目的及び効果を詳しく説明するために、以下では、実施形態を組み合わせて、且つ図面を合わせて説明する。

【0013】

図１から図１１を参照し、複数人三次元モーションキャプチャ方法は、
複数のカメラの同期ビデオフレームを取得し、各前記カメラの各前記同期ビデオフレームに対して、それぞれ関節ポイント認識及び位置測定を行い、各前記カメラによる各人物の２Ｄ関節ポイント情報を得るステップと、
各２Ｄ関節ポイントの逆投影射線を計算し、前記逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るステップであって、前記逆投影射線は、前記２Ｄ関節ポイントに対応するカメラから前記２Ｄ関節ポイントを指す射線であるステップと、
三次元モーションキャプチャを行うために、最適な前記２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するステップと、を含む。

【0014】

上記の説明から分かるように、本発明の有益効果は以下である。複数のカメラによって、シーン内の異なる視角に対して収集と認識を行うとともに、同一の関節ポイントに対する異なるカメラからの逆投影射線同士が交差するはずであるという原理に基づいて、最短距離の計算とクラスタリングを行うことで、異なるカメラの複数の関節ポイントに対して正確なマッチングと対応を行うので、密集シーンに存在する遮蔽、２Ｄの誤認識による２Ｄ点集合マッチングの問題を解決し、複数人に対するモーションキャプチャを実現した。

【0015】

さらに、前記の各２Ｄ関節ポイントの逆投影射線を計算し、前記逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得るステップは、具体的には、
全ての前記２Ｄ関節ポイント情報を関節ポイントのタイプ別に分けて、各前記関節タイプに対応する全ての前記２Ｄ関節ポイント情報を得るステップと、
各前記関節ポイントタイプの各前記２Ｄ関節ポイント情報に対して、それぞれ逆投影射線の計算を行い、前記逆投影射線間の最短距離に基づいてクラスタリングすることで、各前記関節ポイントタイプの関節ポイントマッチングスキームを得るステップと、
全ての前記関節ポイントタイプの関節ポイントマッチングスキームをマージして、最適な２Ｄ人物マッチングスキームを得るステップと、を含む。

【0016】

以上の説明から分かるように、関節ポイントの位置測定を行う際に、関節ポイントのタイプに基づいて複数の関節ポイントを分類し、同一関節ポイントタイプの関節ポイントのみに対してマッチング計算するので、マッチング演算の回数を減らし、処理速度を向上させた。

【0017】

さらに、前記の各２Ｄ関節ポイントの逆投影射線を計算するステップは、具体的には、
各前記２Ｄ関節ポイントについて、座標原点及び対応するカメラ外部パラメータに基づいてカメラ３Ｄ座標を得て、前記カメラ３Ｄ座標を前記逆投影射線の端点として、対応するカメラ内部パラメータ、カメラ外部パラメータ及び各前記２Ｄ関節ポイントの２Ｄ関節ポイント座標情報に基づいて、前記逆投影射線の方向ベクトルを得ることで、各前記２Ｄ関節ポイントの逆投影射線を得るステップを含む。

【0018】

以上の説明から分かるように、作成しようとする座標系には座標原点があり、実際の空間における相対関係から、カメラ３Ｄ座標と２Ｄ関節ポイントに対応する３Ｄ座標が得られるので、各２Ｄ関節ポインの逆投影射線が得られる。

【0019】

さらに、前記の前記逆投影射線間の最短距離に基づいてクラスタリングすることで、各前記関節ポイントタイプの関節ポイントマッチングスキームを得るステップは、
各前記カメラ内の各前記２Ｄ関節ポイントの逆投影射線と、同一の前記関節ポイントタイプの他の前記カメラ内の各前記２Ｄ関節ポイントの逆投影射線とについて、それぞれ２つずつ最短線分の計算を行って、２本の前記逆投影射線間の最短線分である場合の２つの端点の端点座標を得るステップと、
各前記関節ポイントタイプ内の全ての前記端点をクラスタリングしてクラスタリング結果を出力し、前記クラスタリング結果に基づいて、組み合わせにより各前記関節ポイントタイプの関節ポイントマッチングスキームを生成するステップと、
を含む。

【0020】

さらに、前記の２本の逆投影射線間の最短線分である場合の２つの端点の端点座標を得るステップは、具体的には、
前記逆投影射線

【数1】

の始点座標と方向ベクトルがそれぞれｓ_０と

【数2】

であり、前記逆投影射線

【数3】

の始点座標と方向ベクトルがそれぞれｔ_０と

【数4】

であるとすると、前記逆投影射線

【数5】

のベクトル表現式を

【数6】

として、前記逆投影射線

【数7】

のベクトル表現式を

【数8】

とするステップと、
前記逆投影射線

【数9】

と前記逆投影射線

【数10】

と間の最短線分である場合の２つの端点の端点座標がそれぞれｓ_ｊとｔ_ｊであるとすると、２つの前記端点座標のベクトル表現式を

【数11】

と

【数12】

として、ベクトルを

【数13】

と記すと、前記逆投影射線

【数14】

と前記逆投影射線

【数15】

との間の最短線分のベクトル表現式を、第１式：

【数16】

とするステップであって、前記ｓ_ｃと前記ｔ_ｃはスカラであるステップと、
前記最短線分のベクトル表現式を

【数17】

と

【数18】

にそれぞれ代入して第２式と第３式を得るステップであって、前記第２式は

【数19】

で、前記第３式は

【数20】

であり、

【数21】

【数22】

と前記逆投影射線

【数23】

【0021】

上記の説明から分かるように、同一の関節ポイントに対する異なるカメラからの逆投影射線同士は交差するはずであるが、観測の誤差や２Ｄ認識の誤差により、同一の関節ポイントに対する異なるカメラからの逆投影射線同士が交差しない可能性があるものの、必ず近接しているので、空間における２つの直線間の最短距離の計算方式を用いて逆投影射線間の最短距離を求めることで、異なるカメラの関節ポイントが同一関節ポイントであるか否かを判断する。

【0022】

さらに、前記の各前記関節ポイントタイプ内の全ての前記端点をクラスタリングしてクラスタリング結果を出力し、前記クラスタリング結果に基づいて、組み合わせにより各前記関節ポイントタイプの関節ポイントマッチングスキームを生成するステップは、具体的には、
何れか２本の前記逆投影射線間の最短線分である場合の２つの端点座標を得たときに、２つの前記端点座標ｓ_ｊとｔ_ｊから、前記最短線分の最短距離ｄ_ｍｉｎ＝｜ｓ_ｊ－ｔ_ｊ｜を得るステップと、
各前記関節ポイントタイプ内の、最短距離ｄ_ｍｉｎが既定距離閾値を超える前記最短線分をフィルタリングして削除し、各前記関節ポイントタイプ内の残された前記最短線分に対応する端点を端点集合Ｒとして形成させるステップであって、各前記端点は、２Ｄ関節ポイント、カメラ識別子、及び人物識別子に対応するステップと、
ｋ最近傍分類アルゴリズムによって、各前記関節ポイントタイプ内の前記端点集合Ｒ内の全ての端点に対して、近傍マッチングを行って、近傍端点で形成されるクラスタを得て、各前記クラスタ内の端点の数の多い順に、前記クラスタをソートして、各前記関節ポイントタイプ内のソート後のクラスタ情報を得るステップと、
各前記関節ポイントタイプに対して、それぞれマッチングスキームを生成するステップであって、現在のマッチング項目を取得し、各クラスタ内の各端点をトラバースし、トラバースされた端点が前記現在のマッチング項目に使用されておらず、かつ、前記現在のマッチング項目がトラバースされた端点の前記カメラ識別子を有さない場合、現在のマッチング項目に前記端点を追加し、前記クラスタ内の各端点に対するトラバースが完了すると、各関節ポイントタイプの関節ポイントマッチングスキームを得るステップと、
を含み、
前記の全ての前記関節ポイントタイプの関節ポイントマッチングスキームをマージして、最適な２Ｄ人物マッチングスキームを得るステップは、具体的には、
全ての関節ポイントタイプの関節ポイントマッチングスキーム内の各マッチング項目の出現回数を統計し、出現回数が最も多いマッチング項目を組み合わせて最適な２Ｄ人物マッチングスキームとするステップを含む。

【0023】

上記の説明から分かるように、誤差が存在するが、同一の関節ポイントに対する異なるカメラからの逆投影射線同士が近接しているはずであるので、既定距離閾値を超えたら、同一の関節ポイントに属していないと見なすことで、関節ポイントマッチングの正確性に影響を与えないだけではなく、端点の数を減らすことでアルゴリズムの計算量を削減して、処理速度と作業効率をさらに向上させることができるとともに、端点クラスタリングアルゴリズムとして、密度クラスタリングアルゴリズムを採用することで、アルゴリズムは領域半径パラメータを設定することのみを必要とし、事前にクラスタの数を与える必要がないので、当該クラスタリングアルゴリズム及び組み合わせ最適化アルゴリズムを通じて人物マッチングスキームを生成すれば、シーン内の人物の数を最大限に認識できる。

【0024】

さらに、前記の最適な前記２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成するステップは、具体的には、
前記２Ｄ人物マッチングスキームの各マッチング項目をトラバースして、各前記マッチング項目内の各関節ポイントに含まれる２Ｄ関節ポイント座標情報及び対応するカメラパラメータ情報を取得するステップと、
マルチカメラビジュアル三次元計測技術によって、複数の前記２Ｄ関節ポイント座標情報を３Ｄ三次元空間座標として計算して、３Ｄ関節ポイント情報を得るステップと、
前記３Ｄ関節ポイント情報に基づいて、再投影誤差を計算し、前記再投影誤差が既定投影誤差を超えた前記３Ｄ関節ポイント情報をフィルタリングで除去するステップと、
各前記マッチング項目内の全ての関節ポイントに対するトラバースが完了すると、残された全ての前記３Ｄ関節ポイント情報に基づいて、１つの人物の３Ｄ情報を生成するステップと、
全ての前記マッチング項目に対するトラバースが完了すると、前記マッチング項目の数に対応する複数人物の３Ｄ情報を得るステップと、を含む。

【0025】

以上の説明から分かるように、２人の人物の距離が非常に近い場合、関節ポイントの１つが同時に２人の人物に属していることになりやすいため、このような関節ポイントを削除することで、２人の人物それぞれの関節ポイントクラスタを得て、誤認識の発生確率を低減し、３Ｄ再構築の精度を向上させることができる。

【0026】

さらに、
現在の同期ビデオフレーム及び次の同期ビデオフレームによってそれぞれ得られた複数人物の３Ｄ情報を取得して、前後２つの同期ビデオフレームにおける各人物の人体重心位置のオフセット距離が、既定最大移動距離閾値よりも小さいか否かを判断し、そうであれば、前記次の同期ビデオフレームの各人物の人体重心位置に応じて、過去人物位置集合内の人物一意ＩＤに対応する位置情報を更新するステップと、
前記次の同期ビデオフレームのある人物の、前記現在の同期ビデオフレーム内の全ての人物の人体重心位置からのオフセット距離が、前記既定最大移動距離閾値より大きければ、その人物を新たな人物として判定し、前記新たな人物に新たな人物一意ＩＤを付与して、前記新たな人物の位置情報を、前記過去人物位置集合に追加するステップと、
前記現在の同期ビデオフレームのある人物の、前記次の同期ビデオフレーム内の全ての人物の人体重心位置からのオフセット距離が、前記既定最大移動距離閾値より大きければ、その人物を退出人物として判定し、前記過去人物位置集合から、前記退出人物に対応する人物一意ＩＤの位置情報を除去するステップと、
を含む。

【0027】

以上の説明から分かるように、人物一意ＩＤと前後フレームの人体重心位置のオフセット距離とによって、人物３Ｄ位置情報を追跡する。

【0028】

【0029】

図１３を参照し、本発明の別の実施例によれば、メモリとプロセッサを含む電子機器を提供し、メモリにはプロセッサ上で実行可能なコンピュータプログラムが記憶されており、前記プロセッサによって前記コンピュータプログラムを実行したときに、上記の複数人三次元モーションキャプチャ方法を実現する。

【0030】

なお、上述した２つの実施態様におけるコンピュータプログラムに含まれる複数人三次元モーションキャプチャ方法の具体的な実現過程及び対応の効果については、その前の実施態様の複数人三次元モーションキャプチャ方法での説明を参照できる。

【0031】

これにより、以下の実施例において、１つのシーン内の人物に対して三次元モーションキャプチャ、例えば、ＶＲシーンでの複数人三次元モーションキャプチャなどを行うために、当該シーン内に複数のカメラを設けており、具体的には、以下のとおりである。

【0032】

図１から図１１を参照し、本発明の実施例１は、
複数人三次元モーションキャプチャ方法であり、前記方法は、以下のステップを含む。

【0033】

Ｓ１において、複数のカメラの同期ビデオフレームを取得し、各カメラの各同期ビデオフレームに対して、それぞれ関節ポイント認識及び位置測定を行い、各カメラによる各人物の２Ｄ関節ポイント情報を得る。

【0034】

本実施例において、三次元モーションキャプチャが必要なシーンに複数のカメラを設置し、複数のカメラの同期ビデオフレームを取得し、ここで、各ビデオフレームは３チャンネルＢＧＲ形式の画像である。Ａ＝｛ｎ｜１≦ｎ≦Ｎ｝として、Ａはカメラの集合で、ｎはカメラ番号である。本実施例において、カメラを１２台設置しているが、他の均等な実施例において、実際のニーズに応じてカメラの台数を設定することができる。

【0035】

本実施例において、ＯｐｅｎＰｏｓｅを利用して、全てのカメラ内の各人体の関節ポイントを検出して位置を測定し、各カメラによる各人物の２Ｄ関節ポイント情報を取得する。ここで、各カメラが認識した２Ｄ人物の数は、それぞれＫ^ｎであり、ｋが人物番号を表すとして、その値の範囲は１．．．Ｋ^ｎである。Ｘ＝｛Ｒｎｏｄｅ_ｎｋ｜ｎ∈Ａ，１≦ｋ≦Ｋｎ｝が全てのカメラが認識した２Ｄ人物を表し、Ｒｎｏｄｅ_ｎｋが認識された２Ｄ人物を表すとして、各３Ｄ人物の再構築入力パラメータは、１セットの２Ｄ人物からなり、２Ｄ人物が属するカメラは共通部分を持たない。シーンに入る人物が不確定なので、複数セットの２Ｄ人物のマッチングを行う必要がある。

【0036】

ここで、図９に示すように、２Ｄ点マッチングアルゴリズムにおいて、関節ポイントの信頼度に対して閾値フィルタリングを行い、誤認識された関節ポイントをフィルタリングで除去する。この方法によれば、ユーザに閾値条件を変更や設定させてフィルタリングして、現場の干渉による誤認識現象を解消することができる。ここで、信頼度の閾値は、現場のシーンや実際の応用に応じて柔軟に設定することができる。

【0037】

Ｓ２において、各２Ｄ関節ポイントの逆投影射線を計算し、逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、最適な２Ｄ人物マッチングスキームを得て、逆投影射線は、２Ｄ関節ポイントに対応するカメラから２Ｄ関節ポイントを指す射線である。

【0038】

本実施例において、同一の関節ポイントに対する異なるカメラからの逆投影射線同士は交差するはずであるが、観測の誤差や２Ｄ認識の誤差により、同一の関節ポイントに対する異なるカメラからの逆投影射線同士は、交差しない可能性があるものの、必ず近接しているので、逆投影射線間の最短距離である場合の２つの端点座標に基づいてクラスタリングすることで、異なるカメラ内の関節ポイントのマッチング関係を判断し、これにより、異なるカメラ内の異なる人物の対応関係を確定し、２Ｄ人物マッチングスキームを取得することができる。こうして、シーン内の異なる視角に対して収集と認識を行うとともに、同一関節ポイントに対する異なるカメラからの逆投影射線同士が交差するはずであるという原理に基づいて、最短距離の計算とクラスタリングを行うことで、異なるカメラの複数の関節ポイントに対して正確なマッチングと対応を行うので、密集シーンに存在する遮蔽、２Ｄの誤認識による２Ｄ点集合マッチングの問題を解決し、複数人に対するモーションキャプチャを実現した。

【0039】

Ｓ３において、三次元モーションキャプチャを行うために、最適な２Ｄ人物マッチングスキームに従って、各人物の３Ｄ再構築を行い、各人物の３Ｄ情報を生成する。

【0040】

図１から図１１を参照し、本発明の実施例２は、
複数人三次元モーションキャプチャ方法であり、上記実施例１に基づいて、本実施例による更なる限定は以下のとおりである。

【0041】

ここで、ステップＳ２は、具体的には、以下のステップを含む。

【0042】

Ｓ２１において、全ての２Ｄ関節ポイント情報を関節ポイントのタイプ別に分けて、各関節タイプに対応する全ての２Ｄ関節ポイント情報を得る。

【0043】

図５に示すように、ＯｐｅｎＰｏｓｅにとって言えば、認識される２Ｄ関節ポイントは２５種類からなるので、本実施例における関節ポイントのタイプは２５種類である。他の実施例においても、実際のニーズに応じて関節ポイントタイプを適切に選択していれば、本願の均等な実施例に該当する。

【0044】

Ｓ２２において、各関節ポイントタイプの各２Ｄ関節ポイント情報に対して、それぞれ逆投影射線の計算を行い、逆投影射線間の最短距離に基づいてクラスタリングすることで、各前記関節ポイントタイプの関節ポイントマッチングスキームを得る。

【0045】

本実施例において、２５種類の２Ｄ関節ポイントのそれぞれについて、同一関節ポイントタイプの関節ポイントのみに対してマッチング計算するので、マッチング演算の回数を減らし、処理速度を向上させた。特に人物の数が多い場合、処理速度を著しく向上させることが可能である。

【0046】

Ｓ２３において、全ての関節ポイントタイプの関節ポイントマッチングスキームをマージして、最適な２Ｄ人物マッチングスキームを得る。

【0047】

すなわち、２５種類の関節ポイントマッチングスキームで１つの２Ｄ人物マッチングスキームを得て、当該２Ｄ人物マッチングスキームは幾つかのマッチング項目を含み、当該マッチング項目の数は、シーンに入っている人数と同じである。

【0048】

図１から図１１を参照し、本発明の実施例３は、
複数人三次元モーションキャプチャ方法であり、上記実施例２に基づいて、図２に示すように、本実施例による更なる限定は以下のとおりである。

【0049】

図３に示すように、ステップＳ２２は、具体的には、以下のステップを含む。

【0050】

Ｓ２２１において、各２Ｄ関節ポイントについて、座標原点及び対応するカメラ外部パラメータに基づいてカメラ３Ｄ座標を得て、カメラ３Ｄ座標を逆投影射線の端点として、対応するカメラ内部パラメータ、カメラ外部パラメータ及び各２Ｄ関節ポイントの２Ｄ関節ポイント座標情報に基づいて、逆投影射線の方向ベクトルを得ることで、各２Ｄ関節ポイントの逆投影射線を得る。

【0051】

本実施例において、２Ｄ関節ポイントｕｖ_ｎｋを通る逆投影射線を算出し、ｕｖ_ｎｋ∈Ｒｎｏｄｅ_ｎｋである。

【0052】

ここで、逆投影射線はカメラ３Ｄ座標と２Ｄ関節ポイントｕｖ_ｎｋ上の方向ベクトルで構成される。

【0053】

ここで、カメラ３Ｄ座標Ｐ_ｎは座標原点にカメラ外部パラメータを乗じることで算出でき、その式はＰ_ｎ＝ｅｘｔｒｉｎｓｉｃ_ｎ＊０である。ここで、ｅｘｔｒｉｎｓｉｃ_ｎはカメラ外部パラメータで、Ｏは座標原点（０，０，０）である。

【0054】

ここで、方向ベクトルは、２Ｄ関節ポイント座標情報、所属カメラの内部パラメータ及び外部パラメータから算出でき、その式は

【数24】

である。ここで、

【数25】

はカメラの内部パラメータである。

【0055】

Ｓ２２２において、各カメラ内の各２Ｄ関節ポイントの逆投影射線と、同一の関節ポイントタイプの他の前記カメラ内の各２Ｄ関節ポイントの逆投影射線とについて、それぞれ２つずつ最短線分の計算を行って、２本の逆投影射線間の最短線分である場合の２つの端点の端点座標を得る。

【0056】

本実施例において、マルチカメラ視覚の基本原理によれば、複数のカメラで観測されたある人物のある３Ｄ関節ポイントについて、その逆投影射線は必ず当該関節ポイントで交差するが、観測の誤差や２Ｄ認識の誤差により、同一の関節ポイントに対する異なるカメラからの逆投影射線同士は、交差しない可能性があるものの、必ず近接している。このため、３Ｄ空間において、３Ｄ関節ポイントの近傍には大量の端点が集まっているはずである。

【0057】

なお、本実施例において、図１２に示すように、２本の逆投影射線間の距離は空間における２本線間の距離であり、図１２の場合、交差する点があるように見えるが、三次元空間内では交差していない可能性もあるので、図１２は計算時の図示にすぎない。このため、２本の逆投影射線間の最短線分である場合の２つの端点の端点座標を得るステップは、具体的には、
逆投影射線

【数26】

の始点座標と方向ベクトルがそれぞれｓ_０と

【数27】

であり、逆投影射線

【数28】

の始点座標と方向ベクトルがそれぞれｔ_０と

【数29】

であるとすると、逆投影射線

【数30】

のベクトル表現式を

【数31】

として、逆投影射線

【数32】

のベクトル表現式を

【数33】

とするステップＳ２２２１と、
逆投影射線

【数34】

と逆投影射線

【数35】

と間の最短線分である場合の２つの端点の端点座標がそれぞれｓ_ｊとｔ_ｊであるとすると、２つの端点座標のベクトル表現式を

【数36】

と

【数37】

として、ベクトルを

【数38】

と記すと、逆投影射線

【数39】

と逆投影射線

【数40】

との間の最短線分のベクトル表現式を、第１式：

【数41】

とするステップであって、ｓ_ｃとｔ_ｃはスカラであるステップＳ２２２２と、
最短線分のベクトル表現式を

【数42】

と

【数43】

にそれぞれ代入して第２式と第３式を得て、第２式は

【数44】

で、第３式は

【数45】

であり、

【数46】

と記すと、スカラｓ_ｃ＝（ｂｅ－ｃｄ）／（ａｃ－ｂ^２）とスカラｔ_ｃ＝（ａｅ－ｂｄ）／（ａｃ－ｂ^２）とを得るステップＳ２２２３と、
ａｃ－ｂ^２が０に等しいか否かを判断し、そうであれば、逆投影射線

【数47】

と逆投影射線

【数48】

は平行関係であり、何れか１つの逆投影射線上で１つの固定点を端点の１つとして指定し、第２式と第３式を代入すると、２つの端点座標ｓ_ｊとｔ_ｊを得ることができ、そうでなければ、スカラｓｃ＝（ｂｅ－ｃｄ）／（ａｃ－ｂ^２）とスカラｔｃ＝（ａｅ－ｂｄ）／（ａｃ－ｂ^２）とに基づいて、２つの端点座標ｓ_ｊとｔ_ｊを求めるステップＳ２２２４と、
を含む。

【0058】

ａｃ－ｂ^２が０に等しければ、逆投影射線

【数49】

と逆投影射線

【数50】

とは平行関係であり、両者間の距離は定数であるため、どの端点を選んでも、算出される距離は同じである。

【0059】

Ｓ２２３において、各関節ポイントタイプ内の全ての端点をクラスタリングしてクラスタリング結果を出力し、クラスタリング結果に基づいて、組み合わせにより各関節ポイントタイプの関節ポイントマッチングスキームを生成する。

【0060】

本実施例において、ステップＳ２２３は、具体的には、
何れか２本の逆投影射線間の最短線分である場合の２つの端点座標を得たときに、２つの端点座標ｓ_ｊとｔ_ｊから、最短線分の最短距離ｄ_ｍｉｎ＝｜ｓ_ｊ－ｔ_ｊ｜を得るステップＳ２２３１と、
各関節ポイントタイプ内の、最短距離ｄ_ｍｉｎが既定距離閾値を超える最短線分をフィルタリングして削除し、各関節ポイントタイプ内の残された最短線分に対応する端点を端点集合Ｒとして形成させるステップであって、各端点は、２Ｄ関節ポイント、カメラ識別子及び人物識別子に対応するステップＳ２２３２と、
ｋ最近傍分類アルゴリズムによって、各関節ポイントタイプ内の端点集合Ｒ内の全ての端点に対して、近傍マッチングを行って、近傍端点で形成されるクラスタを得て、各クラスタ内の端点の数の多い順に、クラスタをソートして、各関節ポイントタイプ内のソート後のクラスタ情報を得るステップＳ２２３３と、を含み、
ここで、本実施例において、空間における稠密度に基づいてクラスタリングし、ユーザが入力する唯一のパラメータはε（Ｅｐｓ）近傍エリアである。この方法は、具体的には、以下のように実現される。

【0061】

ｋ最近傍分類アルゴリズムｋｎｎによって、端点と端点との距離を求め、ε（Ｅｐｓ）近傍エリアに最大で２つの端点が現れると仮定すると、ｋｎｎの値は次式に設定できる。

【0062】

【数51】

探索が完了した後に、結果セットをトラバースし、ε（Ｅｐｓ）で探索結果内の近傍距離をフィルタリングし、各端点に近傍マッチング関係を生成し、
その後、端点の近傍マッチング関係をソートし、
全ての近傍マッチング関係の処理が完了するまで、未処理の端点を順次抽出し、その端点から直接密度到達可能な近傍端点を見つけてクラスタを形成する。最後に、密度の高い順にクラスタをソートし、クラスタ情報を出力し、その効果は図８に示されている。

【0063】

Ｓ２２３４において、各関節ポイントタイプに対して、それぞれマッチングスキームを生成し、即ち、現在のマッチング項目を取得し、各クラスタ内の各端点をトラバースし、トラバースされた端点が現在のマッチング項目に使用されておらず、かつ、現在のマッチング項目がトラバースされた端点のカメラ識別子を有さない場合、現在のマッチング項目に端点を追加し、クラスタ内の各端点に対するトラバースが完了すると、各関節ポイントタイプの関節ポイントマッチングスキームを得る。

【0064】

本実施例において、クラスタ内の各端点は、１つの２Ｄ関節ポイントｕｖ_ｎｋ、２Ｄ人物Ｒｎｏｄｅ_ｎｋに関連付けられることが可能である。アルゴリズムが実行されると、Ｒｎｏｄｅ_{ａｖａｉｌａｂｅ}が未使用の２Ｄ関節ポイント集合を表すとして、現在のマッチング項目はｍ_{ｃｕｒｒｅｎｔ}で表され、Ｒｎｏｄｅ_{ａｖａｉｌａｂｌｅ}＝Ｘ、ｍ_{ｃｕｒｒｅｎｔ}＝Φであり、各端点Ｒｎｏｄｅ_ｎｋをトラバースして、カメラの相互排他原則によって、端点が使用されておらず、かつ、現在のマッチング項目ｍ_{ｃｕｒｒｅｎｔ}に同じカメラの端点がなければ、ｍ_{ｃｕｒｒｅｎｔ}＋＝Ｒｎｏｄｅ、Ｒｎｏｄｅ_{ａｖａｉｌａｂｅ}－＝Ｒｎｏｄｅであり、クラスタ内の全ての端点をトラバースして、端点の処理が完了すると終了し、これでマッチング項目が生成される。

【0065】

全てのクラスタに対する順次処理が終わる、又はＲｎｏｄｅ_{ａｖａｉｌａｂｌｅ}＝Φになると、アルゴリズムの実行が終了し、複数のマッチング項目が生成されて、マッチングスキームの生成が完了する。

【0066】

ここで、本実施例において、図１０に示すように、５人の人物の左手関節のマッチングスキームである。

【0067】

Ｓ２２３５において、全ての前記関節ポイントタイプの関節ポイントマッチングスキームをマージして、最適な２Ｄ人物マッチングスキームを得るステップは、具体的には、
全ての関節ポイントタイプの関節ポイントマッチングスキーム内の各マッチング項目の出現回数を統計し、出現回数が最も多いマッチング項目を組み合わせて最適な２Ｄ人物マッチングスキームとするステップを含む。

【0068】

本実施例において、２５組の関節ポイントマッチングスキームをマージする必要があり、具体的な手順は以下である。２５組のマッチングスキーム内の全てのマッチング項目を統計し、マッチング項目の出現回数に基づいてソートし、アルゴリズムが実行されると、マッチングスキームが空Ｍ＝Φであり、そして、マッチング項目ｍを順番にトラバースし、ｍがマッチングスキームと衝突しなければ、当該マッチング項目をスキームに追加し、その式は

【数52】

で、ｉｓＣｏｎｆｌｉｃｔ（ｍ，Ｍ）は、衝突関数である。

【0069】

図４に示すように、ステップＳ３は、具体的には、
２Ｄ人物マッチングスキームの各マッチング項目をトラバースして、各マッチング項目内の各関節ポイントに含まれる２Ｄ関節ポイント座標情報及び対応するカメラパラメータ情報を取得するステップＳ３１と、
マルチカメラビジュアル三次元計測技術によって、複数の２Ｄ関節ポイント座標情報を３Ｄ三次元空間座標として計算して、３Ｄ関節ポイント情報を得るステップＳ３２と、
３Ｄ関節ポイント情報に基づいて、再投影誤差を計算し、再投影誤差が既定投影誤差を超えた３Ｄ関節ポイント情報をフィルタリングで除去するステップＳ３３と、
各マッチング項目内の全ての関節ポイントに対するトラバースが完了すると、残された全ての３Ｄ関節ポイント情報に基づいて、１つの人物の３Ｄ情報を生成するステップＳ３４と、
全てのマッチング項目に対するトラバースが完了すると、マッチング項目の数に対応する複数人物の３Ｄ情報を得るステップＳ３５と、
を含む。

【0070】

ここで、図６及び図７に示すように、カメラ４台＋ボウリングピン２個を用いて３Ｄ再構築を行う過程を実演し、ここで、カメラは左から［０ー３］の順に番号付けされ、画面中のボウリング２Ｄポイントは、［０ー０］、［０ー１］、［１ー０］、［１ー１］、［２ー０］、［２ー１］、［３ー０］、［３ー１］と番号付けされている。ボウリングピンの３Ｄ再構築の正しい２Ｄマッチングスキームは、｛０－１，１－０，２－０，３－０｝，｛０－０，１－１，２－１，３－１｝になるべきである。

【0071】

図７に示すように、カメラ４台＋ボウリングピン２個では、８つのボウリングピン２Ｄ点があり、各点は１本の逆投影射線に対応しており、各直線と異なるカメラの直線とで最短直線距離を求める。２４本の最短線分、合計４８個の端点を得ることができ、密度クラスタリングアルゴリズムの半径を０．２メートルとすると、クラスタリングで１３個の結果を得ることができ、そのうちの２つの結果の端点の個数は丸内に示されるように１２個で、当該１２個の点はちょうど４本の直線間の最短線分の端点であるので、近接点のクラスタリング結果に基づいて、以下の２Ｄ点マッチングスキームを生成する。

【0072】

第０グループのクラスタリング結果：｛０－１，１－０，２－０，３－０｝、
第１グループのクラスタリング結果：｛０－０，１－１，２－１，３－１｝。

【0073】

以上の２Ｄ点マッチングスキームは予想と一致しているので、ボウリングピンの２Ｄポイントに対する正確な認識を実現した。

【0074】

図１１に示すように、実際の応用シーンにおいて、本実施例では、カメラ４台に２人の人物という応用シーンで説明し、４台のカメラは、左から右へ順に０、１、２、３で、２人の人物はそれぞれ０と１であるので、最終的なマッチングスキームは、｛０－０，１－０，２－１，３－０｝，｛０－１，１－１，２－０，３－１｝になるべきである。

【0075】

関節ポイントの認識とマッチング関係の計算により、最終的に得られた２５組のマッチングスキームをそれぞれ表１に示す。

【0076】

表１：２５グループのマッチングスキーム

【表1】

【0077】

以上より分析すると、｛０－１，１－１，２－０，３－１｝、｛０－０，１－０，２－１，３－０｝は、関節ポイントの大部分がマッチングするスキームであり、２１回もあり、他の関節ポイントのマッチングスキームがこのスキームの部分集合であるので、この｛０－１，１－１，２－０，３－１｝、｛０－０，１－０，２－１，３－０｝という人物マッチングスキームを選択し、予想のスキームと一致する。

【0078】

図１から図１１を参照し、本発明の実施例４は、
複数人三次元モーションキャプチャ方法であり、上記実施例３に基づいて、本実施例はさらに、
現在の同期ビデオフレーム及び次の同期ビデオフレームによってそれぞれ得られた複数人物の３Ｄ情報を取得して、前後２つの同期ビデオフレームにおける各人物の人体重心位置のオフセット距離が、既定最大移動距離閾値よりも小さいか否かを判断し、そうであれば、次の同期ビデオフレームの各人物の人体重心位置に応じて、過去人物位置集合内の人物一意ＩＤ（Ｉｄｅｎｔｉｔｙｄｏｃｕｍｅｎｔ、身分識別子）に対応する位置情報を更新するステップＳ３６と、
次の同期ビデオフレームのある人物の、現在の同期ビデオフレーム内の全ての人物の人体重心位置からのオフセット距離が、既定最大移動距離閾値より大きければ、その人物を新たな人物として判定し、新たな人物に新たな人物一意ＩＤを付与して、新たな人物の位置情報を、過去人物位置集合に追加するステップＳ３７と、
現在の同期ビデオフレームのある人物の、次の同期ビデオフレーム内の全ての人物の人体重心位置からのオフセット距離が、既定最大移動距離閾値より大きければ、その人物を退出人物として判定し、過去人物位置集合から、退出人物に対応する人物一意ＩＤの位置情報を除去するステップＳ３８と、
を含む。

【0079】

本実施形態では、過去人物位置集合をとすると、最初の実行時にＬＣ＝Φであり、次のフレームで１セットの人物３Ｄ情報が認識され、当該セットの人物の中心位置情報Ｃ＝｛ｃ^＊｝を算出し、ｃは単一人物の中心位置を表し、その計算式は

【数53】

であり、近傍探索アルゴリズムにより、ＬＣ、Ｃ内の各人物の中心の相互位置距離を求め、式はｄ（ｃ，ｃ’）＝｜ｃ－ｃ’｜、ｃ∈Ｃ、ｃ’∈ＬＣであり、ここで、ｃはＣ内の人員中心位置を表し、ｃ’は過去人物ＬＣ内の人物中心位置であり、人物の最大移動距離をＤ_ｍａｘとして、ｄ（ｃ，ｃ’）≦Ｄ_ｍａｘが成立すれば、人物の中心位置距離の変化が閾値より小さいことになり、ｃとｃ’を同一人物とみなし、人物ｃ’の中心位置を更新し、ｄ（ｃ，∀ｃ’）＞Ｄ_ｍａｘ、ｃ∈Ｃ、∀ｃ’∈ＬＣの場合、ｃとＬＣの全ての人物との距離が閾値より大きく、ｃは新たな人物であり、当該人物にＩＤを生成し、ＬＣに当該人物を追加し、ｄ（∀ｃ，ｃ’）＞Ｄ_ｍａｘ、∀ｃ∈Ｃ、ｃ’∈ＬＣの場合、ｃ’とＣの全ての人物との距離が閾値をより大きく、ｃ’を退出人物とみなし、ＬＣから当該人物を除去する。

【0080】

本発明の実施例５は、以下のとおりである。

【0081】

本発明の別の態様によれば、コンピュータプログラムを記憶したコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータプログラムがプロセッサによって実行されたときに、上記の実施例１から４の何れか１つの実施例の複数人三次元モーションキャプチャ方法を実現する。

【0082】

図１３を参照し、本発明の実施例６は、
電子機器１であり、電子機器１はメモリ３、プロセッサ２及びメモリに記憶され且つプロセッサ２上で実行可能なコンピュータプログラムを含み、プロセッサ２によってコンピュータプログラムを実行したときに、上記の実施例１から４の何れか１つの実施例の複数人三次元モーションキャプチャ方法を実現する。

【0083】

以上のように、本発明が提供する複数人三次元モーションキャプチャ方法、記憶媒体及び電子機器によれば、ＯｐｅｎＰｏｓｅ姿勢検出により、深層畳み込みネットワークを用いて姿勢検出を行うことにより、いかなるウェアラブルデバイスに頼らずに、人体姿勢検出を行うことができる。複数のカメラによって、シーン内の異なる視角に対して収集と認識を行うとともに、同一関節ポイントに対する異なるカメラからの逆投影射線同士が交差するはずであるという原理に基づいて、最短距離の計算とクラスタリングを行うことで、異なるカメラの複数の関節ポイントに対して正確なマッチングと対応を行うので、密集シーンに存在する遮蔽、２Ｄの誤認識による２Ｄ点集合マッチングの問題を解決し、複数人に対するモーションキャプチャを実現した。それとともに、関節ポイントタイプに応じて複数の関節ポイントを分類し、既定距離閾値を設定してフィルタリングを行い、信頼度フィルタリングを行い、端点クラスタリングアルゴリズムとして密度クラスタリングアルゴリズムを採用し、そして遮蔽された関節ポイントを削除するなど、さらに限定することにより、処理速度を向上させ、作業効率を向上させることができるとともに、認識の正確性を保証することができる。

【0084】

以上に述べたのは本発明の実施例にすぎず、それによって本発明の保護範囲を制限するわけではない。本発明の明細書及び図面の内容を利用してなされた均等な変換、或いは直接または間接的な関連する技術分野への応用は、同じ理由で本発明の特許の保護範囲に含まれる。

【図1】