IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 北京▲極▼智▲簡▼▲單▼科技有限公司の特許一覧

<>
  • 特許-三次元再構成の方法及び装置 図1
  • 特許-三次元再構成の方法及び装置 図2
  • 特許-三次元再構成の方法及び装置 図3
  • 特許-三次元再構成の方法及び装置 図4
  • 特許-三次元再構成の方法及び装置 図5
  • 特許-三次元再構成の方法及び装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-07
(45)【発行日】2023-12-15
(54)【発明の名称】三次元再構成の方法及び装置
(51)【国際特許分類】
   G06T 7/55 20170101AFI20231208BHJP
   G01B 11/245 20060101ALI20231208BHJP
【FI】
G06T7/55
G01B11/245 H
【請求項の数】 11
(21)【出願番号】P 2021540143
(86)(22)【出願日】2019-03-26
(65)【公表番号】
(43)【公表日】2022-03-15
(86)【国際出願番号】 CN2019079686
(87)【国際公開番号】W WO2020151078
(87)【国際公開日】2020-07-30
【審査請求日】2021-07-08
(31)【優先権主張番号】201910074343.5
(32)【優先日】2019-01-25
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】521301817
【氏名又は名称】北京▲極▼智▲簡▼▲單▼科技有限公司
【氏名又は名称原語表記】BEIJING AINFINIT TECHNOLOGY CO., LTD
【住所又は居所原語表記】Room 1613, 16th Floor, Building 6, No. 9, Guang’an Road, Fengtai District, Beijing 100055,China
(74)【代理人】
【識別番号】110000729
【氏名又は名称】弁理士法人ユニアス国際特許事務所
(72)【発明者】
【氏名】王 淞
(72)【発明者】
【氏名】▲張▼ ▲鋒▼
(72)【発明者】
【氏名】于 新然
【審査官】大塚 俊範
(56)【参考文献】
【文献】特開2018-205788(JP,A)
【文献】特開2014-164525(JP,A)
【文献】国際公開第2016/021411(WO,A1)
【文献】特開2007-180932(JP,A)
【文献】特開2000-172878(JP,A)
【文献】特開2000-324509(JP,A)
【文献】内田 恭輔、他2名,雑踏における複数歩行者の追跡 ,システム制御情報学会論文誌 マシンビジョンの産業応用特集号,日本,システム制御情報学会,2001年04月15日,第14巻, 第4号,p.8-13
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G01B 11/245
(57)【特許請求の範囲】
【請求項1】
三次元再構成の方法であって、
物体が再構成空間に進入する場合、前記再構成空間に対するN(前記Nは2以上の正整数)台のカメラの撮影画像をN個の現在画像として取得するステップであって、前記N台のカメラのそれぞれの視野が前記再構成空間の全体を覆うステップと、
前記N個の現在画像及び対応するN個の初期背景画像に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得するステップであって、前記N個の初期背景画像は、前記再構成空間に物体が存在しない場合の、前記再構成空間に対する前記N台のカメラの撮影画像であるステップと、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得するステップと、
前記再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、前記再構成空間の各位置点を選別して前記物体を三次元再構成するステップと、を含み、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得する前記ステップは、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分を特定するステップと、
前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分及び融合関数に基づいて、前記再構成空間の各位置点に対応する前景背景差分を取得するステップと、を含むことを特徴とする方法。
【請求項2】
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係は、前記再構成空間の縁に固定的に配置された前記N台のカメラの位置情報及び角度情報によって特定されることを特徴とする請求項1に記載の方法。
【請求項3】
前記N個の現在画像及び対応するN個の初期背景画像に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得する前記ステップは、
前記N個の現在画像の各位置点の画素値、及び対応する前記N個の初期背景画像の各位置点の画素値を取得するステップと、
前記N個の現在画像の各位置点の画素値、対応する前記N個の初期背景画像の各位置点の画素値及び差分関数に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得するステップと、を含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記差分関数は、混合ガウスモデルのモデリングにより特定されるか、或いは、前記差分関数は、ベクトル距離式により特定されることを特徴とする請求項3に記載の方法。
【請求項5】
前記ベクトル距離式は、ユークリッド距離式、マンハッタン距離式またはコサイン距離式を含むことを特徴とする請求項4に記載の方法。
【請求項6】
前記融合関数は、加算関数または乗算関数を含むことを特徴とする請求項に記載の方法。
【請求項7】
前記再構成空間の境界として、濃淡が互い違いになったテクスチャを採用することを特徴とする請求項1に記載の方法。
【請求項8】
照明が変化し且つ前記再構成空間に物体が存在しない場合、前記再構成空間に対する前記N台のカメラの撮影画像を取得して前記N個の初期背景画像を更新するステップをさらに含むことを特徴とする請求項1に記載の方法。
【請求項9】
物体が再構成空間に進入する場合、前記再構成空間に対するN(前記Nは2以上の正整数)台のカメラの撮影画像をN個の現在画像として取得するための取得ユニットであって、前記N台のカメラのそれぞれの視野が前記再構成空間の全体を覆う取得ユニットと、
前記N個の現在画像及び対応するN個の初期背景画像に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得するための第1取得ユニットであって、前記N個の初期背景画像は、前記再構成空間に物体が存在しない場合の、前記再構成空間に対する前記N台のカメラの撮影画像である第1取得ユニットと、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得するための第2取得ユニットと、
前記再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、前記再構成空間の各位置点を選別して前記物体を三次元再構成するための再構成ユニットと、を含み、
前記第2取得ユニットは、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分を特定し、
前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分及び融合関数に基づいて、前記再構成空間の各位置点に対応する前景背景差分を取得することを特徴とする三次元再構成の装置。
【請求項10】
プロセッサ及びメモリを含み、
前記メモリが、プログラムコードを記憶するとともに、前記プログラムコードを前記プロセッサに伝送し、
前記プロセッサが、前記プログラムコードにおけるコマンドに応じて請求項1~8のいずれか1項に記載の三次元再構成の方法を実行することを特徴とする端末機器。
【請求項11】
請求項1~8のいずれか1項に記載の三次元再構成の方法を実行するためのプログラムコードを記憶することを特徴とするコンピュータ読み取り可能記憶媒体。
【発明の詳細な説明】
【相互参照】
【0001】
本出願は、2019年01月25日にて中国特許庁に提出され、出願番号が201910074343.5であり、発明の名称が「三次元再構成の方法及び装置」である中国特許出願の優先権を主張し、その全ての内容が本出願に援用される。
【技術分野】
【0002】
本出願は、画像分析処理技術分野に関し、特に三次元再構成の方法及び装置に関する。
【背景技術】
【0003】
科学技術の急速な発展に伴い、コンピュータの表示及び処理に適した数学的モデルを物体に構築するように、三次元再構成(英語:3D Reconstruction;略称:3D再構成)技術の適用が必要であるシーンがますます多くなり、客観的な世界を表現する仮想現実をコンピュータで構築するキー技術である。現在、主流の3D再構成技術には、主に直接的な3D再構成技術及び間接的な3D再構成技術が含まれる。
【0004】
なお、直接的な3D再構成技術とは、レーザー測距付きの専用測定機器を使用することにより、物体の3D形状及び3D構造を実際に測定することであり、間接的な3D再構成技術とは、物体に対して異なる角度の画像を撮影することにより、アルゴリズムで画像上の特徴点を抽出し、特徴点の照合マッチングにより、最終的に物体の3D形状及び3D構造を生成することである。
【0005】
発明者は研究を通じて、直接的な3D再構成技術は、物体に対して全面的なレーザー測距を行って多くの時間がかかり、間接的な3D再構成技術は、異なる角度の物体の画像における特徴点を比較して演算することが比較的に複雑で計算量が大きい、と発見し、即ち、上記2種類の3D再構成技術は、一回の3D再構成を完成するために、ともに数分ひいては数時間が必要である。それでは、上記2種類の3D再構成技術は、リアルタイムの3D再構成が必要なシーン、例えば、人間の動きへのキャプチャ、物体の移動へのキャプチャ等に適用できない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本出願が解決しようとする技術的課題は、再構成空間に進入した物体の三次元再構成を快速でリアルタイムに完成でき、リアルタイムの三次元再構成が必要なシーンに非常に適する、三次元再構成の方法及び装置を提供することである。
【課題を解決するための手段】
【0007】
第1点、本出願の実施例は、
物体が再構成空間に進入する場合、前記再構成空間に対するN(前記Nが2以上の正整数)台のカメラの撮影画像をN個の現在画像として取得し、前記カメラの視野が前記再構成空間を覆うことと、
前記N個の現在画像及び対応するN個の初期背景画像に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得し、前記N個の初期背景画像は、前記再構成空間に物体が存在しない場合の、前記再構成空間に対する前記N台のカメラの撮影画像であることと、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得することと、
前記再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、前記再構成空間の各位置点を選別して前記物体を三次元再構成することと、を含む三次元再構成の方法を提供する。
【0008】
任意に、前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係は、前記再構成空間の縁に固定的に配置された前記N台のカメラの位置情報及び角度情報によって特定される。
【0009】
任意に、前記N個の現在画像及び対応するN個の初期背景画像に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得することは、
前記N個の現在画像の各位置点の画素値、及び対応する前記N個の初期背景画像の各位置点の画素値を取得することと、
前記N個の現在画像の各位置点の画素値、対応する前記N個の初期背景画像の各位置点の画素値と差分関数に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得することと、を含む。
【0010】
任意に、前記差分関数は、混合ガウスモデルのモデリングにより特定されるか、或いは、前記差分関数は、ベクトル距離式により特定される。
【0011】
任意に、前記ベクトル距離式は、ユークリッド距離式、マンハッタン距離式またはコサイン距離式を含む。
【0012】
任意に、前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得することは、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分を特定することと、
前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分及び融合関数に基づいて、前記再構成空間の各位置点に対応する前景背景差分を取得することと、を含む。
【0013】
任意に、前記融合関数は、加算関数または乗算関数を含む。
【0014】
任意に、前記再構成空間の境界は、濃淡が互い違いになったテクスチャを使用する。
【0015】
任意に、
照明が変化し且つ前記再構成空間に物体が存在しない場合、前記再構成空間に対する前記N台のカメラの撮影画像を取得して前記N個の初期背景図を更新することをさらに含む。
【0016】
第2点、本出願の実施例は、
物体が再構成空間に進入する場合、前記再構成空間に対するN(前記Nが2以上の正整数)台のカメラの撮影画像をN個の現在画像として取得するためのものであり、前記カメラの視野が前記再構成空間を覆う取得ユニットと、
前記N個の現在画像及び対応するN個の初期背景画像に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得するためのものであり、前記N個の初期背景画像は、前記再構成空間に物体が存在しない場合の、前記再構成空間に対する前記N台のカメラの撮影画像である第1取得ユニットと、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得するための第2取得ユニットと、
前記再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、前記再構成空間の各位置点を選別して前記物体を三次元再構成するための再構成ユニットと、を含む三次元再構成の装置を提供する。
【0017】
第3点、本出願の実施例は、プロセッサ及びメモリを含み、
前記メモリが、プログラムコードを記憶するとともに、前記プログラムコードを前記プロセッサに伝送し、
前記プロセッサが、前記プログラムコードにおけるコマンドに応じて上記第1点のいずれか1項に記載の三次元再構成の方法を実行する、端末機器を提供する。
【0018】
第4点、本出願の実施例は、上記第1点のいずれか1項に記載の三次元再構成の方法を実行するためのプログラムコードを記憶する、コンピュータ読み取り可能記憶媒体を提供する。
【発明の効果】
【0019】
従来技術と比較すると、本出願は少なくとも以下の利点を有する。即ち、
本出願の実施例の技術案を使用すると、まず、物体が再構成空間に進入する場合、視野が再構成空間を覆うN台のカメラの再構成空間に対する撮影画像をN個の現在画像として取得し、そして、N個の現在画像及び対応するN個の初期背景画像に基づいて、N個の現在画像の各位置点に対応する前景背景差分を取得し、N個の初期背景画像は、再構成空間に物体が存在しない場合の、再構成空間に対するN台のカメラの撮影画像であり、次に、N個の現在画像の各位置点と再構成空間の各位置点との対応関係に基づいて、N個の現在画像の各位置点に対応する前景背景差分を対応融合して再構成空間の各位置点に対応する前景背景差分を取得し、最後に、再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、再構成空間の各位置点を選別して物体を三次元再構成する。このように、物体が再構成空間に進入する場合、N個の現在画像及び対応するN個の初期背景画像により前景背景の分離を行って物体を三次元再構成し、前景背景の分離の演算は比較的に簡単で便利であり、再構成空間に進入した物体の三次元再構成を快速でリアルタイムに完成でき、該方法は、リアルタイムの三次元再構成が必要なシーンに非常に適する。
【図面の簡単な説明】
【0020】
本出願の実施例における技術案をより明瞭に説明するために、以下、本出願の実施例への記載に使用する図面を簡単に紹介し、明らかに、以下の記載における図面は、本出願に記載されるいくつかの実施例に過ぎず、当業者にとって、創造的な労働をせず、さらにこれらの図面に応じて他の図面を得ることができる。
図1】本出願の実施例における適用シーンに係るシステムフレーム概略図である。
図2】本出願の実施例が提供する三次元再構成の方法のフロー概略図である。
図3】本出願の実施例が提供する再構成空間及びN台のカメラの構造概略図である。
図4】本出願の実施例が提供する、真っ白な再構成空間における真っ黒な円柱体の三次元再構成の平面概略図である。
図5】本出願の実施例が提供する黒白のテクスチャである。
図6】本出願の実施例が提供する三次元再構成の装置の構造概略図である。
【発明を実施するための形態】
【0021】
当業者に本出願の技術案をよりよく理解させるために、以下、本出願の実施例における図面を結合して本出願の実施例における技術案を明瞭で完全に記載し、明らかに、記載される実施例は、本出願の一部の実施例に過ぎず、全ての実施例ではない。本出願における実施例に基づいて、当業者が創造的な労働をせずに取得した全ての他の実施例は、いずれも本出願の保護する範囲に属する。
【0022】
現在、主流の3D再構成技術には、主に2種類が含まれ、1つは、直接的な3D再構成技術であり、レーザー測距付きの専用測定機器を使用することにより、物体の3D形状及び3D構造を実際に測定することであり、もう1つは間接的な3D再構成技術であり、物体に対して異なる角度の画像を撮影することにより、アルゴリズムで画像上の特徴点を抽出し、特徴点の照合マッチングにより、最終的に物体の3D形状及び3D構造を生成することである。しかしながら、発明者は研究を通じて、直接的な3D再構成技術は、物体に対して全面的なレーザー測距を行って多くの時間がかかり、間接的な3D再構成技術は、異なる角度の物体の画像における特徴点を比較して演算することが比較的に複雑であって計算量が大きい、と発見した。即ち、一回の3D再構成を完成するために、ともに数分ひいては数時間が必要であり、リアルタイムの3D再構成が必要なシーンに適用できず、例えば、スマート自動販売機が顧客の商品を取る動きを判断することや生産設備が労働者の操作が安全規制を満たすか否かを検出する等のような、人間の動きをリアルタイムにキャプチャする必要があるシーンや、別の例として、工場の生産ラインでの部品の運送状況を検出する等のような、物体の移動をリアルタイムにキャプチャする必要があるシーンに適用できない。
【0023】
この課題を解決するために、本出願の実施例において、まず、物体が再構成空間に進入する場合、視野が再構成空間を覆うN台のカメラの再構成空間に対する撮影画像をN個の現在画像として取得し、そして、N個の現在画像及び対応するN個の初期背景画像に基づいて、N個の現在画像の各位置点に対応する前景背景差分を取得し、N個の初期背景画像は、再構成空間に物体が存在しない場合の、再構成空間に対するN台のカメラの撮影画像である。次に、N個の現在画像の各位置点と再構成空間の各位置点との対応関係に基づいて、N個の現在画像の各位置点に対応する前景背景差分を対応融合して再構成空間の各位置点に対応する前景背景差分を取得し、最後に、再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に応じて、再構成空間の各位置点を選別して物体を三次元再構成する。このように、物体が再構成空間に進入する場合、N個の現在画像及び対応するN個の初期背景画像により前景背景の分離を行って物体を三次元再構成し、前景背景の分離の演算は比較的に簡単で便利であり、再構成空間に進入した物体の三次元再構成を快速でリアルタイムに完成でき、当該方法は、リアルタイムの三次元再構成が必要なシーンに非常に適する。
【0024】
例を挙げると、本出願の実施例のシーンの1つは、図1に示すようなシーンに適用してもよく、該シーンは、N(Nが2以上の正整数)台のカメラ101、プロセッサ102、及びユーザ端末103を含み、カメラの視野が再構成空間を覆う。
【0025】
再構成空間に物体が存在しない場合、N台のカメラ101は再構成空間を撮影し、撮影画像を得てプロセッサ102に送信し、プロセッサ102はそれをN個の初期背景画像とする。物体が再構成空間に進入する場合、N台のカメラ101は再構成空間を撮影し、撮影画像を得てプロセッサ102に送信し、プロセッサ102はそれをN個の現在画像とする。プロセッサ102は、N個の現在画像及び対応するN個の初期背景画像に応じて、N個の現在画像の各位置点に対応する前景背景差分を取得する。プロセッサ102は、N個の現在画像の各位置点と再構成空間の各位置点との対応関係に基づいて、N個の現在画像の各位置点に対応する前景背景差分を対応融合し、再構成空間の各位置点に対応する前景背景差分を取得する。プロセッサ102は、再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に応じて、再構成空間の各位置点を選別して物体を三次元再構成し、物体の三次元再構成画像を得てユーザ端末103に送信し、ユーザ端末103は物体の三次元再構成画像をユーザに表示する。
【0026】
上記の適用シーンにおいて、本出願の実施形態の処理がプロセッサ102によって実行されるが、本出願は、実行主体を限定せず、本出願の実施形態に開示した処理を実行すればよい。
【0027】
上記シーンは、本出願の実施例が提供する1つのシーンの例示に過ぎず、本出願の実施例はこのシーンに限定されない。
【0028】
以下、図面を結合して、実施例により本出願の実施例における三次元再構成の方法及び装置の具体的な実現形態を詳しく説明する。
【0029】
例示的な方法
図2を参照し、本出願の実施例における三次元再構成の方法のフロー概略図を示す。本実施例において、前記方法は例えば、以下のステップを含むことができる。
【0030】
ステップ201:物体が再構成空間に進入する場合、前記再構成空間に対するN(前記Nが2以上の正整数)台のカメラの撮影画像をN個の現在画像として取得し、前記カメラの視野が前記再構成空間を覆う。
【0031】
なお、再構成空間とは、進入した物体に対して三次元再構成を行う必要がある空間であり、本出願の実施では、当該再構成空間の形状を限定せず、四角体であってもよいし、円柱体であってもよく、さらに球体等であってもよい。本出願の実施例を実現する前提は、再構成空間の縁にカメラを配置する必要があることであり、仮にN(Nが2以上の正整数)台のカメラを配置すれば、N台のカメラは再構成空間の縁に分散して配置されるべきであり、各台のカメラのレンズが再構成空間の内部に面し、且つ視野が全再構成空間を覆う。それ以外、本出願の実施では、カメラの数量及びカメラの配置位置について限定がなく、カメラの数量の多少は、後続のステップの操作及び算出に影響を与えたり変更したりすることがなく、配置されるカメラが多いほど、後続の使用可能なデータが多くなり、三次元再構成の精度が高くなる。ここで、カメラを配置した後、N台のカメラはいずれも固定する必要があり、適用中に、各台のカメラが移動したり回動したりしないようにする等を必ず確保する。
【0032】
例えば、図3に示すような再構成空間及びN台のカメラの構造概略図である。再構成空間が立方体であれば、その特定の4つのエッジの中点に4台のカメラを配置でき、Nが4であり、或いは、その8つの頂点に8台のカメラを配置し、Nが8である。再構成空間が円柱体であれば、その天面及び底面に互いにずれる4台のカメラを配置でき、Nが4である。
【0033】
なお、物体が再構成空間に進入する場合、三次元再構成が必要な物体が該再構成空間に存在することを示し、この場合、N台のカメラは再構成空間を撮影してN個の撮影画像を得て、プロセッサは上記N個の撮影画像をN個の現在画像として取得する。N個の現在画像はいずれも物体部分の画像を含み、それを前景画像とし、他の部分の画像を背景画像とする。
【0034】
ステップ202:前記N個の現在画像及び対応するN個の初期背景画像に応じて、前記N個の現在画像の各位置点に対応する前景背景差分を取得し、前記N個の初期背景画像は、前記再構成空間に物体が存在しない場合の、前記再構成空間に対する前記N台のカメラの撮影画像である。
【0035】
なお、N個の初期背景画像は実際には、N台のカメラを配置し固定した後、再構成空間に物体が存在しない場合、N台のカメラを起動させて再構成空間を撮影してN個の撮影画像を取得し、プロセッサがN個の撮影画像を取得することで得られたものである。初期背景図を取得する場合、再構成領域内に他の物体の進入がないように確保する必要がある。N個の初期背景画像はプロセッサに記憶され、且つ各初期背景画像上に再構成空間に進入した物体部分の画像がなく、純粋な再構成空間の背景画像のみがある。
【0036】
なお、N個の初期背景図における各初期背景画像上に再構成空間に進入した物体部分の画像がないので、即ち、各初期背景画像における全ての部分画像がいずれも背景画像に属する。各台のカメラにとって、カメラが固定されているため、現在画像の各位置点と対応する初期背景図の各位置点とは1対1の対応関係があり、現在画像と対応する初期背景図とを比較することで、現在画像の各位置点に対応する前景背景差分が得られ、前景部分の画像を現在画像から分離させて後続の物体の三次元再構成に使用する。
【0037】
ここで、現在画像及び対応する初期背景図における任意の1つの位置点について、現在画像の当該位置点の画素値と対応する初期背景図の当該位置点の画素値との間の差分で現在画像の当該位置点に対応する前景背景差分を示すことができる。現在画像の各位置点の画素値及び対応する初期背景図の各位置点の画素値を確定した後、予め定義された差分関数を使用すれば、画素値差分を前景背景差分として取得できる。前景背景差分が大きいほど、その対応する位置点が前景画像に属する確率が高いことを示し、前景背景差分が小さいほど、その対応する位置点が背景画像に属する確率が高いことを示す。従って、本出願の実施例のいくつかの実施形態では、前記ステップ202は例えば、
ステップA:前記N個の現在画像の各位置点の画素値、及び対応する前記N個の初期背景画像の各位置点の画素値を取得することと、
ステップB:前記N個の現在画像の各位置点の画素値、対応する前記N個の初期背景画像の各位置点の画素値及び差分関数に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得することと、を含む。
【0038】
例えば、(u,v)が現在画像及び対応する初期背景図における1つの位置点を示し、(R,G,B)が現在画像の当該位置点の画素値を示し、(R,G,B)が対応する初期背景画像の当該位置点の画素値を示し、予め定義された差分関数がFであるとすれば、現在画像の当該位置点に対応する前景背景差分DiffはDiff=F(R,G,B,R,G,B)である。当該位置点が現在画像において前景画像に属せず背景画像であれば、(R,G,B)=(R,G,B)であり、現在画像の当該位置点に対応する前景背景差分Diffは0である。
【0039】
なお、予め定義される差分関数は多種多様であってもよく、本出願の実施例では、2つの方式で差分関数を定義することができる。一つ目は古典的であり、混合ガウスモデルのモデリングにより差分関数を特定でき、二つ目は、画素値を3次元ベクトルと見なし、古典的なベクトル距離式に基づいて差分関数を特定できる。なお、よく見られるベクトル距離式は、ユークリッド距離式、マンハッタン距離式、及びコサイン距離式等であり、そのうちのいずれか1つの距離式を選択して、差分関数を特定できる。従って、本出願の実施例のいくつかの実施形態では、前記差分関数は、混合ガウスモデルのモデリングにより特定されるか、或いは、前記差分関数は、ベクトル距離式により特定され、前記ベクトル距離式は、ユークリッド距離式、マンハッタン距離式またはコサイン距離式を含む。
【0040】
例えば、ユークリッド距離式を使用して差分関数Fを特定する場合、現在画像の各位置点に対応する前景背景差分Diffは
【数1】
であり、マンハッタン距離式を使用して差分関数Fを特定する場合、現在画像の各位置点に対応する前景背景差分Diffは、
【数2】
であり、コサイン距離式を使用して差分関数Fを特定する場合、現在画像の各位置点に対応する前景背景差分Diffは、
【数3】
である。
【0041】
ステップ203:前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得する。
【0042】
なお、ステップ202でN個の現在画像の各位置点に対応する前景背景差分を取得し、N個の現在画像の各位置点が前景画像に属する確率を示し、再構成空間の各位置点が物体に属する確率を特定するように、再構成空間の各位置点に対応する前景背景差分を取得する必要がある。再構成空間の各位置点のうち任意の1つの位置点について、N個の現在画像においてそれぞれ対応する位置点があり、現在画像における対応する位置点はそれぞれ、前景画像に属する確率を示す1つの前景背景差分に対応し、融合関数を使用してN個の現在画像において対応する位置点が対応する前景背景差分を融合すれば、再構成空間の当該位置点が物体に属する確率を示す前景背景差分が得られる。従って、本出願の実施例のいくつかの実施形態では、前記ステップ203は例えば、
ステップC:前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分を特定することと、
ステップD:前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分及び融合関数により、前記再構成空間の各位置点に対応する前景背景差分を取得することと、を含む。
【0043】
例えば、(x,y,z)が再構成空間の1つの位置点を示し、Diffiが、当該位置点に対応するプロセッサが第i台のカメラから取得した現在画像の位置点に対応する前景背景差分を示し、i=1,2,3,・・・,Nであり、予め定義された融合関数がRであるとすれば、再構成空間の当該位置点に対応する前景背景差分Diff3Dは
Diff3D=R(Diff,Diff,・・・,Diff,)である。
【0044】
ここで、再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分について、まず、N個の現在画像の各位置点と再構成空間の各位置点との対応関係に基づいて再構成空間の各位置点のN個の現在画像における対応する位置点を特定し、さらに、その対応する前景背景差分を特定する。なお、N個の現在画像が、再構成空間の縁に固定的に配置されたN台のカメラによって撮影して得られたものであるので、N台のカメラの位置情報及び角度情報は固定される。カメライメージングの原理は、再構成空間中の異なる位置点を1つのイメージング平面に投射して1枚の撮影画像を生成することであり、(x,y,z)は再構成空間の1つの位置点を示し、カメラの固定された位置情報及び角度情報に基づいて、当該カメラに対応する現在画像上の上記位置点に対応する位置点(u,v)が得られ、つまり、カメラの位置情報及び角度情報は、現在画像の位置点(u,v)と再構成空間の位置点(x,y,z)との対応関係を特定できる。従って、本出願の実施例のいくつかの実施形態では、前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係は、前記再構成空間の縁に固定的に配置された前記N台のカメラの位置情報及び角度情報によって特定される。
【0045】
カメラがイメージングする場合、カメラに入射する各光線上の全ての位置点は撮影画像上の同じ点に対応するので、カメラに進入するこの光線上にある全ての位置点は、対応する現在画像上での位置点が同じである。例えば、カメラに進入する同一光線上にある位置点A及び位置点Bについて、位置点A及び位置点Bは、当該カメラに対応する現在画像上の同一位置点に対応し、(x,y,z)が再構成空間における位置点Aを示し、
(x,y,z)が再構成空間における位置点Bを示すとすれば、当該カメラに対応する現在画像における(u,v)位置点が再構成空間における位置点A及び位置点Bに対応することが得られる。
【0046】
ここで、差分関数と類似するように、予め定義された融合関数は、多種多様であってもよい。融合関数の作用は、再構成空間の各位置点に対応するN個の現在画像の位置点に対応する前景背景差分を融合することであるので、N個の現在画像の位置点に対応する前景背景差分に対して、加算の方式で融合してもよいし、乗算の方式で融合してもよい。本出願の実施例では、加算関数と、乗算関数との2種類の関数を融合関数として使用でき、上記2種類の関数のうち任意の1種類の関数は、融合関数とすることができる。従って、本出願の実施例のいくつかの実施形態では、前記融合関数は、加算関数または乗算関数を含む。
【0047】
例えば、加算関数を融合関数Rとして使用する場合、再構成空間の各位置点に対応する前景背景差分Diff3Dは、
【数4】
であり、乗算関数を融合関数Rとして使用する場合、再構成空間の各位置点に対応する前景背景差分Diff3Dは
【数5】
である。
【0048】
ステップ204:前記再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、前記再構成空間の各位置点を選別して前記物体を三次元再構成する。
【0049】
ここで、再構成空間の各位置点に対応する前景背景差分が、各位置点が物体に属する確率を示すことができるので、即ち、再構成空間の各位置点に対応する前景背景差分が大きいほど、各位置点が物体に属する確率が大きいことを示す。ステップ203で再構成空間の各位置点に対応する前景背景差分を取得した後、プリセット前景背景閾値により再構成空間の各位置点を選別でき、例えば、再構成空間のある位置点に対応する前景背景差分がプリセット前景背景閾値以上であれば、当該位置点が物体に属するとみなし、再構成空間の各位置点のうち物体に属する位置点を選別すれば、物体を三次元再構成できる。
【0050】
例えば、再構成空間の境界は、真っ白なテクスチャを使用し、N個の初期背景画像の各位置点の画素値は、(R,G,B)=(255,255,255)であり、1つの真っ黒な円柱体が再構成空間に進入すれば、N個の現在画像における物体部分の画像(前景画像)の各位置点の画素値が(R,G,B)=(0,0,0)であり、他の部分の画像(背景画像)の各位置点の画素値が(R,G,B)=(255,255,255)であり、ユークリッド距離式で差分関数Fを特定する場合、現在画像の位置点が前景画像に属すれば、その対応する前景背景差分Diffは、
【数6】
に算出できる。現在画像の位置点が背景画像に属すれば、その対応する前景背景差分Diffは、
【数7】
に算出できる。図4に示す真っ白な再構成空間における真っ黒な円柱体の三次元再構成の平面概略図のように、説明を容易にするために、平面図で平面上に三次元再構成を行う。左図に示すように、再構成空間は立方体であり、再構成空間の平面図の4つの頂点に4台のカメラが固定的に配置されており、図における各台のカメラが射出する2つの放射線の間の領域が物体であり、その他の領域は背景である。それでは、図における位置点は、あるカメラの2つの射線の間にあり、当該位置点がこのカメラに対応する現在画像の位置点に対応する前景背景差分Diffが441であり、逆であれば0である。加算関数を融合関数Rとして使用する場合、再構成空間の各位置点に対応する前景背景差分Diff3Dは
【数8】
である。
【0051】
領域1の各位置点に対して、そのDiff=0、Diff=0、Diff=0、Diff=0であれば、そのDiff3D=0であり、領域2の各位置点に対して、そのDiff=441、Diff=0、Diff=0、Diff=441であれば、Diff3D=882であり、領域3の各位置点に対して、そのDiff=441、Diff=441、Diff=441、Diff=441であれば、そのDiff3D=1764である。なお、プリセット前景背景閾値が1764であると、領域1、領域2及び領域3における各位置点のDiff3Dの大きさとプリセット前景背景閾値1764の大きさとを比較し、ある位置点のDiff3Dがプリセット前景背景閾値1764以上であれば、当該位置点が物体に属するとみなし、領域3における各位置点が物体に属し、三次元再構成して領域3に示す多角形が得られる。なお、進入した物体が実際に円柱体であるので、その平面図が円形であり、三次元再構成により構造された形状は多角形であって一定の誤差がある。例えば、図4における右図に示すように、固定的に配置する4台のカメラを8台のカメラまで増加すれば、三次元再構成により構造された形状がさらに円形に近く、即ち、配置するカメラが多いほど、後続に使用可能なデータが多くなり、三次元再構成の精度が高くなる。
【0052】
ここで、実際に適用する場合、再構成空間に進入した物体の外面のテクスチャ色は特定されず、濃色テクスチャであってもよいし、淡色テクスチャであってもよい。外面が濃色テクスチャである物体と淡色テクスチャの初期背景図との比較が強く、外面が淡色テクスチャである物体と濃色テクスチャの初期背景図との比較が強い。濃色テクスチャ、淡色テクスチャという2種類の外面の物体を同時に対応できるように、濃淡が互い違いになったテクスチャを使用して再構成空間の境界を配置してもよく、即ち、再構成空間の境界について、よりよい前景背景分離效果を達成するように、さらに濃淡が互い違いになったテクスチャを使用してもよい。従って、本出願の実施例のいくつかの実施形態では、前記再構成空間の境界について、濃淡が互い違いになったテクスチャを使用する。例えば、図5に示すような黒白の濃淡が互い違いになったテクスチャを使用して再構成空間の境界を配置する。
【0053】
ここで、再構成空間の照明が安定すれば、予め取得された初期背景図は依然として再構成空間に適用でき、初期背景図は更新せず使用できる。再構成空間の照明が変化すれば、予め取得された初期背景図は照明変化後の再構成空間に適用できず、初期背景図を更新する必要がある。初期背景図の更新原則は、現在の再構成空間に物体がさらに存在するか否かを判断することにより、存在しなければ、初期背景図を更新するように、各台のカメラはいずれも再構成空間を再度撮影して撮影画像を得ることになる。従って、本出願の実施例のいくつかの実施形態では、例えば、ステップE:照明が変化し且つ前記再構成空間に物体が存在しない場合、前記再構成空間に対する前記N台のカメラの撮影画像を取得して前記N個の初期背景図を更新することをさらに含むことができる。
【0054】
本実施例が提供する各種の実施形態により、まず、物体が再構成空間に進入する場合、視野が再構成空間を覆うN台のカメラの再構成空間に対する撮影画像をN個の現在画像として取得し、そして、N個の現在画像及び対応するN個の初期背景画像に基づいて、N個の現在画像の各位置点に対応する前景背景差分を取得し、N個の初期背景画像は、再構成空間に物体が存在しない場合の、再構成空間に対するN台のカメラの撮影画像である。次に、N個の現在画像の各位置点と再構成空間の各位置点との対応関係に基づいて、N個の現在画像の各位置点に対応する前景背景差分を対応融合して再構成空間の各位置点に対応する前景背景差分を取得し、最後に、再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、再構成空間の各位置点を選別して物体を三次元再構成する。このように、物体が再構成空間に進入する場合、N個の現在画像及び対応するN個の初期背景画像により前景背景の分離を行って物体を三次元再構成し、前景背景の分離の演算は比較的に簡単で便利であり、再構成空間に進入した物体の三次元再構成を快速でリアルタイムに完成でき、該方法は、リアルタイムの三次元再構成が必要なシーンに非常に適する。
【0055】
例示的な装置
図6を参照すれば、本出願の実施例における三次元再構成の装置の構造概略図を示す。本実施例において、前記装置は例えば、
物体が再構成空間に進入する場合、前記再構成空間に対するN(前記Nが2以上の正整数)台のカメラの撮影画像をN個の現在画像として取得するための取得ユニットであって、前記カメラの視野が前記再構成空間を覆う取得ユニット601と、
前記N個の現在画像及び対応するN個の初期背景画像に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得するための第1取得ユニット602であって、前記N個の初期背景画像は、前記再構成空間に物体が存在しない場合の、前記再構成空間に対する前記N台のカメラの撮影画像である第1取得ユニット602と、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を対応融合し、前記再構成空間の各位置点に対応する前景背景差分を取得するための第2取得ユニット603と、
前記再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、前記再構成空間の各位置点を選別して前記物体を三次元再構成するための再構成ユニット604と、を具体的に含むことができる。
【0056】
本出願の実施例の任意選択の方式では、前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係は、前記再構成空間の縁に固定的に配置された前記N台のカメラの位置情報及び角度情報によって特定される。
【0057】
本出願の実施例の任意選択の方式では、前記第1取得ユニット602は、
前記N個の現在画像の各位置点の画素値、及び対応する前記N個の初期背景画像の各位置点の画素値を取得するための第1取得サブユニットと、
前記N個の現在画像の各位置点の画素値、対応する前記N個の初期背景画像の各位置点の画素値及び差分関数に基づいて、前記N個の現在画像の各位置点に対応する前景背景差分を取得するための第2取得サブユニットと、を含む。
【0058】
本出願の実施例の任意選択の方式では、前記差分関数は、混合ガウスモデルのモデリングにより特定されるか、或いは、前記差分関数は、ベクトル距離式により特定される。
【0059】
本出願の実施例の任意選択の方式では、前記ベクトル距離式は、ユークリッド距離式、マンハッタン距離式またはコサイン距離式を含む。
【0060】
本出願の実施例の任意選択の方式では、前記第2取得ユニット603は、
前記N個の現在画像の各位置点と前記再構成空間の各位置点との対応関係に基づいて、前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分を特定するための特定サブユニットと、
前記再構成空間の各位置点のそれぞれに対応する前記N個の現在画像の位置点に対応する前景背景差分及び融合関数に基づいて、前記再構成空間の各位置点に対応する前景背景差分を取得するための第3取得サブユニットと、を含む。
【0061】
本出願の実施例の任意選択の方式では、前記融合関数は、加算関数または乗算関数を含む。
【0062】
本出願の実施例の任意選択の方式では、前記再構成空間の境界は、濃淡が互い違いになったテクスチャを使用する。
【0063】
本出願の実施例の任意選択の方式では、
照明が変化し且つ前記再構成空間に物体が存在しない場合、前記再構成空間に対する前記N台のカメラの撮影画像を取得して前記N個の初期背景図を更新するための更新ユニットをさらに含む。
【0064】
本実施例が提供する各種の実施形態により、取得ユニットは、物体が再構成空間に進入する場合、視野が再構成空間を覆うN台のカメラの再構成空間に対する撮影画像をN個の現在画像として取得し、第1取得ユニットは、N個の現在画像及び対応するN個の初期背景画像に基づいて、N個の現在画像の各位置点に対応する前景背景差分を取得し、N個の初期背景画像は、再構成空間に物体が存在しない場合の、再構成空間に対するN台のカメラの撮影画像であり、第2取得ユニットは、N個の現在画像の各位置点と再構成空間の各位置点との対応関係に基づいて、N個の現在画像の各位置点に対応する前景背景差分を対応融合して再構成空間の各位置点に対応する前景背景差分を取得し、再構成ユニットは、再構成空間の各位置点に対応する前景背景差分及びプリセット前景背景閾値に基づいて、再構成空間の各位置点を選別して物体を三次元再構成する。このように、物体が再構成空間に進入する場合、N個の現在画像及び対応するN個の初期背景画像により前景背景の分離を行って物体を三次元再構成し、前景背景の分離の演算は比較的に簡単で便利であり、再構成空間に進入した物体の三次元再構成を快速でリアルタイムに完成でき、該方法は、リアルタイムの三次元再構成が必要なシーンに非常に適する。
【0065】
また、本出願の実施例はさらに、プロセッサ及びメモリを含み、
前記メモリが、プログラムコードを記憶するとともに、前記プログラムコードを前記プロセッサに伝送し、
前記プロセッサが、前記プログラムコードにおけるコマンドに応じて上記方法実施例のいずれか1項に記載の三次元再構成方法を実行する、端末機器を提供する。
【0066】
なお、本出願の実施例はさらに、上記方法実施例のいずれか1項に記載の三次元再構成方法を実行するためのプログラムコードを記憶することを特徴とするコンピュータ読み取り可能記憶媒体を提供する。
【0067】
本明細書における各実施例は、累進的な方式で記載しており、各実施例が重点的に説明することは、他の実施例との異なる点であり、各実施例の間の同様、類似部分は、互いに参照すればよい。実施例に開示された装置にとって、実施例に開示された方法に対応しているので、比較的に簡単に記載しており、関連要素について、方法部分の説明を参照すればよい。
【0068】
また、本文に開示した実施例を結合して記載した各例示のユニット及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または両者の結合によって実現でき、ハードウェア、ソフトウェアの互換性を明瞭に説明するために、上記説明において、機能に応じて各例示の構成及びステップを一般的に記載している。これらの機能がハードウェアの方式で実行されるか、それともソフトウェアの方式で実行されるかは、技術案の特定の適用及び設計の拘束条件に依存する。当業者はそれぞれの特定の適用に対して、異なる方法を使用して記載した機能を実現することができるが、このような実現は、本出願の範囲を超えると認識されるべきではない。
【0069】
本文では、第1、第2等のような関係用語は、1つの実体または操作を他の実体または操作と区別するために使用されるものであり、必ずしも、これらの実体または操作の間にこのような実際の関係または順位付けが存在することを要求する、または暗示するわけではない。用語である「含む」、「包含」、または他の変形は、非排他的な包含をカバーすることを意味することで、一連の要素を含むプロセス、方法、物品または機器は、それらの要素だけでなく、明確に列挙されていない他の要素も含む、或いは、このようなプロセス、方法、物品または機器が固有する要素をさらに含む。より多い制限がない状況では、語句「1つの…を含む」ことによって限定される要素は、前記要素を含むプロセス、方法、物品または機器には他の同様な要素がさらに存在することを排除しない。
【0070】
上記の説明は、本出願の好ましい実施例に過ぎず、本出願を制限することを意図したものではない。本出願について、好ましい実施例を以上のように開示したが、本出願を限定するわけではない。当業者は、本出願の技術案の範囲を逸脱しない状況で、上記に開示した方法及び技術的内容を利用して本出願の技術案に対して様々な変動及び修飾を行う、或いは同等に変化した等価実施例に補正することができる。従って、本出願の技術案を逸脱しない内容であれば、本出願の技術的実質に応じて以上の実施例について行った簡単な補正、同等変化及び修飾はいずれも、本出願の技術案の保護範囲内に属する。
図1
図2
図3
図4
図5
図6