【文献】
SUSANTO, Wandi, et al.,”3D Object Detection with Multiple Kinects”,Lecture Notes in Computer Science,[online],ドイツ,Springer,2012年,Vol. 7584,p.93−102,[検索日 2020.08.13],インターネット <URL:https://link.springer.com/chapter/10.1007/978-3-642-33868-7_10>,<DOI https://doi.org/10.1007/978-3-642-33868-7_10>
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0012】
以下、図面を参照しながら本願の実施例をさらに詳細に説明する。図面に本願のいくつかの実施例が示されているが、なお、本願は様々な形態で実現することができ、ここで説明する実施例に制限されるものではなく、むしろ、これらの実施例は本願のより徹底的且つ完全な理解のために提供されている。なお、本願の図面及び実施例は例示的なものに過ぎず、本願の保護範囲を制限するものではない。
【0013】
本願の実施例の明細書、特許請求の範囲及び上記図面における用語「第1」、「第2」、「第3」、「第4」など(存在する場合)は類似した対象を区別するためのものであり、必ずしも特定の順番又は優先順位を説明すると限らない。なお、ここで説明される本願の実施例が例えばここで図示又は説明される順番以外の順番に従って実施できるように、このように使用されるデータは適宜交換してもよい。また、用語「含む」、「有する」及びこれらの任意の変形は、非排他的な包含をカバーすることを意図し、例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品又は機器は必ずしも明確に挙げられたステップ又はユニットに制限されるものではなく、明確に挙げられていない又はこれらのプロセス、方法、製品又は機器に固有のほかのステップ又はユニットを含んでもよい。
【0014】
無人スーパーマーケットなどの新しい小売場面では、如何に複数のカメラによって顧客の位置を判断し持続的に追跡するかは技術的に困難である。ショッピングプロセスにわたって顧客と顧客が取る商品とを関連付けて、持続的に顧客の位置を取得することが必要とされる。現在、人体位置の判断方法としては、主に予め訓練されて得られた検出モデルに基づいて、画像から人体及び/又は四肢が位置する2次元位置を検出して取得し、当該2次元位置に基づいて測位を行う。しかしながら、上記2次元位置がモデルの正確性に非常に依存して決定されるため、誤検出又はほかの物体による対象物体の遮断の場合、2次元位置の検出が不正確になり、その結果、測位の失敗又は測位の不正確さの問題が生じやすい。
【0015】
従来技術に存在する上記問題に対して、本願の実施例は、画像に基づく位置検出方法を提供し、当該方法は、複数の撮影機器が同一時刻に異なる方位で撮影して得られた複数の画像での対象物体の2次元位置に基づいて、複数の撮影機器の内部パラメータと外部パラメータと組み合わせて、対象物体の3次元位置を決定する。したがって、ある画像において対象物体がほかの物体により遮断された場合においても、当該対象物体のほかの画像での2次元位置に基づいて正確な3次元位置を取得できる。また、複数の画像に基づいて3次元位置を決定する手段は、単一画像における2次元位置の認識の不正確さにより3次元位置の測位が不正確になるという問題をも回避し、物体測位の正確性及び信頼性を向上させることができる。
【0016】
以下、図面を参照しながら、本願の実施例の技術案を具体的に説明する。
【0017】
図1は本願の実施例による画像に基づく位置検出方法のフローチャートであり、当該方法は、画像に基づく位置検出装置(以下、位置検出装置と略称)によって実行できる。
図1に示されるように、当該方法は、ステップS11〜S13を含む。
【0018】
S11、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得する。
【0019】
本実施例の前記複数の撮影機器は、同一の標定物に合わせてもよいし、それぞれ異なる標定物に合わせてもよく、各撮影機器の位置、向き及び撮影角度が必要に応じて設定できる。また、当該複数の撮影機器は、ネットワークタイムを読み取ることで時間を同期化させてもよいし、特定装置が送信した同期化信号を受信することで同期化させてもよいが、本実施例では、特に限定しない。
【0020】
本実施例に係る撮影機器が撮影した画像はRGB画像又は深度画像である。
【0021】
S12、対象物体の各画像での2次元位置を検出する。
【0022】
本実施例における対象物体は、人体であってもよいし、ほかの生物体又は物体であってもよい。
【0023】
本実施例では、対象物体の各画像での2次元位置を検出する際、少なくとも下記方法のうちの1種を採用できる。
【0024】
利用可能な方法の1つとして、予め設定された重要点検出モデルに基づいて、各画像における対象物体の重要点を検出し、対象物体の重要点の各画像での分布領域を対象物体の各画像での2次元位置として決定する。好ましくは、上記重要点検出モデルは予め訓練して得られたニューラルネットワークモデルであってよい。本実施例の前記重要点は、対象物体上のいずれかの点であり得、例えば、対象物体が人間である場合、重要点は人体の手での点、腕での点、足での点などとしてもよいが、これらの位置での点に制限されない。
【0025】
別の利用可能な方法として、予め設定された四肢検出モデルに基づいて、対象物体での各部分(例えば、人体の胴体や頭部など)を検出してよい。対象物体の各部分の各画像での2次元位置を決定し、各画像において対象物体の各部分が位置する2次元位置に基づいて、各画像において対象物体全体が位置する2次元位置を決定する。
【0026】
さらなる利用可能な方法として、画像において重要点検出と対象物体での各部分の検出の両方を行う。例えば、利用可能な一形態では、まず、各画像において対象物体での各部分を検出して、対象物体の各部分の各画像での2次元位置を取得し、対象物体の各部分の各画像での2次元位置に基づいて、対象物体全体の各画像でのおおよその領域の位置を決定し、次に、上記おおよその領域の位置において重要点検出を行い、両方の検出結果に基づいて対象物体の各画像での正確な2次元位置を決定する。このような手段によれば、重要点の検出漏れ又は誤検出により測位が不正確になるという問題を回避するとともに、重要点検出の計算量を減少させて、検出効率を向上させることができる。別の利用可能な形態では、各画像において重要点検出及び対象物体の各部分の検出を同時に行い、各画像における対象物体での重要点の分布領域、及び対象物体の各部分が位置する領域の組み合わせに基づいて、対象物体の各画像での2次元位置を決定し、重要点の誤検出又は検出漏れによる第1の領域の位置決定への干渉を解消する。
【0027】
さらなる利用可能な方法として、予め設定されたエッジ検出方法によって、対象物体の各画像での2次元位置を検出できる。
【0028】
S13、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定する。
【0029】
本実施例の前記撮影機器の内部パラメータには、焦点距離、視野(FOV)、解像度が含まれるが、これらに制限されない。本実施例の前記撮影機器の外部パラメータには、座標位置、向き及びピッチ角が含まれるが、これらに制限されない。
【0030】
対象物体の各画像での2次元位置が既知である場合、各撮影機器の内部パラメータ及び外部パラメータに基づいて、従来の幾何学理論と組み合わせることで、対象物体の実空間での3次元位置を取得できる。
【0031】
同様に、対象物体の実空間での3次元位置を取得した後、上記撮影して得られた画像において対象物体がほかの物体により遮断されることによって、対象物体の当該画像での2次元位置を直接判断できない場合、対象物体の3次元位置、及び撮影機器が当該画像を撮影するときの内部パラメータと外部パラメータに基づいて、対象物体の当該画像での位置を逆方向に決定することができ、このようにして、対象物体が画像においてほかの物体により遮断された場合においても、対象物体の実際な3次元位置に基づいて、対象物体の画像での位置を推定することができ、それによって、対象物体が画像において遮断されることにより測位できないという問題を解決する。又は、対象物体の3次元位置を取得した後、各撮影機器の内部パラメータと外部パラメータに基づいて、幾何学的原理と組み合わせることで、対象物体の各画像での2次元位置を補正し、それによって、2次元位置測位の正確性を向上させてもよい。
【0032】
本実施例では、異なる方位に配置された複数の撮影機器が同一時刻に撮影して得られた画像を取得し、対象物体の各画像での2次元位置を検出し、検出して得られた対象物体の各画像での2次元位置及び複数の撮影機器の内部パラメータと外部パラメータに基づいて、対象物体の実空間での3次元位置を決定する。これにより、本実施例では、対象物体の複数の画像での2次元位置を組み合わせることで、対象物体の実空間での3次元位置を決定するため、対象物体がある画像においてほかの物体により遮断された場合においても、当該対象物体のほかの画像での2次元位置に基づいて正確な3次元位置を取得することができる。また、複数の画像に基づいて3次元位置を決定する手段は、単一画像における2次元位置の認識の不正確さにより3次元位置の測位が不正確になるという問題を回避し、物体測位の正確性及び信頼性を向上させることができる。
【0033】
以下、図面を参照しながら、上記実施例をさらに最適化させて拡張させる。
【0034】
図2は、本願の実施例による画像に基づく位置検出方法のフローチャートであり、
図2に示されるように、
図1の実施例を基に、当該方法はステップS21〜S23を含む。
【0035】
S21、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得する。
【0036】
S22、予め設定された検出モデルに基づいて、対象物体の各画像での2次元位置を検出する。
【0037】
一例として、本実施例における検出モデルは、予め訓練して得られたニューラルネットワークモデルであってよく、当該ニューラルネットワークモデルは、対象物体での各部分の位置を検出し、対象物体の各部分の各画像での位置を取得した後、各画像において対象物体の各部分が位置する領域を直列接続して対象物体全体の各画像での2次元位置を取得することに用いられることができる。つまり、本実施例は、予め設定されたモデルに基づいて、対象物体の各部分の各画像での位置の領域を検出し、且つ各画像において対象物体の各部分が位置する2次元位置に基づいて、各画像において対象物体全体が位置する2次元位置を決定することができる。
【0038】
上記検出モデルの正確性を向上させるために、モデル訓練を行うときに、モデルでの異なるネットワーク層が対象物体での異なる部分を検出するように訓練できる。例えば、モデルでの比較的下層のネットワーク層が対象物体での小寸法の部分を検出し、モデルでの比較的上層のネットワーク層が対象物体での大寸法の部分を検出するように訓練することができる。
【0039】
上記例は、本実施例の技術案を明瞭に説明するために過ぎず、本願を一意に限定するものではない。
【0040】
S23、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定する。
【0041】
本実施例では、予め設定された検出モデルによって対象物体の各画像での2次元位置を検出し、対象物体の各画像での2次元位置、及び各撮影機器の内部パラメータと外部パラメータに基づいて、対象物体の実空間での3次元位置を決定することによって、対象物体の2次元位置の認識効率及び正確性を向上させるとともに、本実施例では、対象物体の複数の画像での2次元位置に基づいて、対象物体の実空間での3次元位置を決定するという技術案は、単一画像に基づいて測位する場合、対象物体が画像において遮断されることによって、正確に測位できないという問題を解決できる。
【0042】
図3は、本願の実施例による画像に基づく位置検出方法のフローチャートであり、
図3に示されるように、
図1の実施例を基に、当該方法はステップS31〜S34を含む。
【0043】
S31、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた深度画像を取得する。
【0044】
S32、前記複数の撮影機器が撮影して得られた実空間において対象物体がない場合の深度画像を基準画像として取得する。
【0045】
S33、各撮影機器ごとに、前記撮影機器が前記時刻に撮影した深度画像の深度情報と前記撮影機器が撮影した基準画像の深度情報との間の差異に基づいて、前記対象物体の各画像での2次元位置を決定する。
【0046】
S34、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定する。
【0047】
本実施例における撮影機器が深度カメラであってもよく、当該撮影機器が撮影した画像が深度画像である。
【0048】
対象物体が人体である場合、まず、撮影機器が撮影した人体を含む深度画像、及び撮影機器が撮影した場面に人体がない画像を取得し、同一場面に人体を含むときの画像の深度情報と人体を含まないときの画像の深度情報とに差異があるため、両方の深度情報の間の差異に基づいて人体の画像での2次元領域を決定することができ、次に、人体の複数の画像での2次元領域、及び各撮影機器の内部パラメータと外部パラメータに基づいて、幾何学的方法により人体の実場面での3次元位置を取得することができる。
【0049】
勿論、上記例示は人間を例にして行われる例示的な説明に過ぎず、本願を一意に限定するものではなく、実際には、上記方法は人間を含める任意の物体に適用できる。
【0050】
本実施例は、異なる方位に位置する複数の撮影機器が同一時刻に撮影して得られた深度画像、及び当該複数の撮影機器が撮影して得られた基準画像を取得し、各深度画像の深度情報とそれに対応した基準画像の深度情報との間の差異に基づいて、対象物体の各深度画像での2次元位置を決定し、それによって、対象物体の2次元位置の測位の正確性を向上させ、対象物体の3次元位置の測位を確保することができる。
【0051】
図4は、本願の実施例による画像に基づく位置検出装置の構造概略図であり、
図4に示されるように、当該装置40は、
異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得するための第1の取得モジュール41と、
対象物体の各画像での2次元位置を検出するための検出モジュール42と、
前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定するための決定モジュール43とを備える。
【0052】
一つの利用可能な設計では、前記画像は深度画像を含む。
【0053】
別の利用可能な設計では、前記装置はさらに、
前記対象物体の実空間での3次元位置、及び各撮影機器の外部パラメータと内部パラメータに基づいて、前記対象物体の各撮影機器が撮影した画像での2次元位置を補正するための補正モジュールを備える。
【0054】
本実施例による装置は、
図1の実施例の方法の実行に適用でき、その実行手段及び有益な効果が類似したため、ここで詳細な説明を省略する。
【0055】
図5は、本願の実施例による検出モジュール42の構造概略図であり、
図5に示されるように、
図4の実施例を基に、検出モジュール42は、
予め設定された検出モデルに基づいて、対象物体の各画像での2次元位置を検出するための第1の検出サブモジュール421を備える。
【0056】
一つの利用可能な設計では、前記第1の検出サブモジュール421は、具体的には、
予め設定された検出モデルに基づいて、各画像において前記対象物体の各部分が位置する2次元位置を検出し、
各画像において前記対象物体の各部分が位置する2次元位置に基づいて、各画像において前記対象物体全体が位置する2次元位置を決定することに用いられる。
【0057】
本実施例による装置は、
図2の実施例の方法の実行に適用でき、その実行手段及び有益な効果が類似したため、ここで詳細な説明を省略する。
【0058】
図6は、本願の実施例による画像に基づく位置検出装置の構造概略図であり、
図6に示されるように、
図4の実施例を基に、前記装置40はさらに、
前記複数の撮影機器が撮影して得られた実空間において対象物体がない場合の深度画像を基準画像として取得するための第2の取得モジュール44を備え、
前記検出モジュール42は、
各撮影機器ごとに、前記撮影機器が前記時刻に撮影した深度画像の深度情報と前記撮影機器が撮影した基準画像の深度情報との間の差異に基づいて、前記対象物体の各画像での2次元位置を決定するための第2の検出サブモジュール422を備える。
【0059】
本実施例による装置は、
図3の実施例の方法の実行に適用でき、その実行手段及び有益な効果が類似したため、ここで詳細な説明を省略する。
【0060】
本願の実施例はさらに、1つ又は複数のプロセッサと、前記1つ又は複数のプロセッサにより実行されると前記1つ又は複数のプロセッサに上記いずれかの実施例の前記方法を実現させる1つ又は複数のプログラムを記憶するための記憶装置とを備えるコンピュータ機器を提供する。
【0061】
本願の実施例はさらに、プロセッサにより実行されると上記いずれかの実施例の前記方法を実現するコンピュータプログラムが記憶されたコンピュータ可読記憶媒体を提供する。
【0062】
本明細書において、以上説明した機能は、少なくとも部分的に1つ又は複数のハードウェアロジックコンポーネントにより実行できる。例えば、使用可能な例示的なハードウェアロジックコンポーネントは、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け製品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブルロジック機械(CPLD)などを含むが、それらに制限されない。
【0063】
本開示の方法を実施するためのプログラムコードは1つ又は複数のプログラミング言語の任意の組み合わせを用いてプログラミングできる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又はほかのプログラマブルデータ処理装置のプロセッサ又はコントローラに提供でき、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び/又はブロック図に規定された機能/操作が実施される。プログラムコードは、完全に機械において実行されてもよく、部分的に機械において実行されてもよく、独立したソフトウェアパッケージとして部分的に機械において実行され且つ部分的にリモート機械において実行されてもよく、又は完全にリモート機械又はサーバーにおいて実行されてもよい。
【0064】
本明細書において、機械可読媒体は物理的な媒体であってよく、命令実行システム、装置又は機器が使用した又は命令実行システム、装置又は機器と組み合わせて使用するプログラムを含んだり記憶したりすることができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であり得る。機械可読媒体は、電子、磁性、光学、電磁気、赤外線、又は半導体のシステム、装置又は機器、又は上記内容の任意の適切な組み合わせを含むが、それらに制限されない。機械可読記憶媒体のさらなる具体例には、1つ又は複数のワイヤに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD−ROM)、光学式記憶機器、磁気記憶機器、又は上記内容の任意の適切な組み合わせが含まれる。
【0065】
また、特定の順番に従って各操作を説明したが、このような操作が示された特定の順序に従って又は順次実行されるか、又は所望の結果を達成させるために図示されたすべての操作が実行されることが要求されると理解すべきである。マルチタスク処理および並列処理は、特定の状況では有益な場合がある。同様に、上記の記述では複数の詳細が説明されたが、本開示の範囲を制限するものとして理解できない。別々の実施例の文脈で説明されているいくつかの特徴は、単一の実施形態において組み合わせて実施することもできる。逆に、単一の実施形態の文脈で説明されている様々な特徴は、個別にまたは任意の適切なサブ組み合わせの形で複数の実施形態において実施することもできる。
【0066】
本主旨は構造特徴及び/又は方法の理論的な動作に特有の言語で説明されているが、添付の特許請求の範囲により限定された主旨は必ずしも上記で説明された特定の特徴又は動作に限定されない。むしろ、上記で説明された特定の特徴及び動作は単に特許請求の範囲を実施するための例示的な形態に過ぎない。