IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

<>
  • 特許-画像処理システム、および画像処理方法 図1
  • 特許-画像処理システム、および画像処理方法 図2
  • 特許-画像処理システム、および画像処理方法 図3
  • 特許-画像処理システム、および画像処理方法 図4
  • 特許-画像処理システム、および画像処理方法 図5
  • 特許-画像処理システム、および画像処理方法 図6
  • 特許-画像処理システム、および画像処理方法 図7
  • 特許-画像処理システム、および画像処理方法 図8
  • 特許-画像処理システム、および画像処理方法 図9
  • 特許-画像処理システム、および画像処理方法 図10
  • 特許-画像処理システム、および画像処理方法 図11
  • 特許-画像処理システム、および画像処理方法 図12
  • 特許-画像処理システム、および画像処理方法 図13
  • 特許-画像処理システム、および画像処理方法 図14
  • 特許-画像処理システム、および画像処理方法 図15
  • 特許-画像処理システム、および画像処理方法 図16
  • 特許-画像処理システム、および画像処理方法 図17
  • 特許-画像処理システム、および画像処理方法 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-07-14
(45)【発行日】2025-07-23
(54)【発明の名称】画像処理システム、および画像処理方法
(51)【国際特許分類】
   H04N 7/18 20060101AFI20250715BHJP
   G06T 7/20 20170101ALI20250715BHJP
【FI】
H04N7/18 K
G06T7/20 300Z
【請求項の数】 9
(21)【出願番号】P 2023565764
(86)(22)【出願日】2021-12-08
(86)【国際出願番号】 JP2021045065
(87)【国際公開番号】W WO2023105666
(87)【国際公開日】2023-06-15
【審査請求日】2024-05-30
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】吉田 登
(72)【発明者】
【氏名】川合 諒
(72)【発明者】
【氏名】劉 健全
(72)【発明者】
【氏名】尾形 一気
(72)【発明者】
【氏名】菅谷 直樹
(72)【発明者】
【氏名】戸澤 信之
【審査官】西島 篤宏
(56)【参考文献】
【文献】特開2021-077295(JP,A)
【文献】特開2017-069748(JP,A)
【文献】特開2002-183216(JP,A)
【文献】特開2018-160219(JP,A)
【文献】特開2021-132267(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/18
G06T 7/20
(57)【特許請求の範囲】
【請求項1】
互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムであって、
前記第1端末は、所定の空間を撮影するカメラから前記空間の画像にかかる画像データを取得する画像データ取得手段を備え、
記第2端末は、前記画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析する解析手段と、
前記解析の結果に基づいて、人物の姿勢又は動作に起因する所定の事象の検出を行う検出手段と、
前記検出の結果である結果情報を出力する出力手段と、を備え、
前記第1端末は、前記画像データに、前記画像に含まれる人物の数が閾値未満の場合の前記画像の第1解像度を、前記画像に含まれる人物の数が閾値以上の場合の前記画像の第2解像度よりも低く設定する前処理を施した前処理データを前記第2端末に供給する、
画像処理システム。
【請求項2】
前記検出手段は、前記画像に同時に含まれる少なくとも二人の前記骨格データに基づいて所定の前記事象の検出を行う、
請求項1に記載の画像処理システム。
【請求項3】
前記第1端末または前記第2端末の少なくともいずれか一方は、人物の姿勢に関する所定の参照データを記憶する記憶手段をさらに備える、
請求項1または2に記載の画像処理システム。
【請求項4】
前記第1端末は、前記前処理として、前記画像のうち人物が含まれる人物画像を抽出した抽出画像データを生成し、前記抽出画像データを前記第2端末に供給する、
請求項1~3のいずれか一項に記載の画像処理システム。
【請求項5】
前記第1端末は、
前記画像データから第1人物画像を抽出した抽出画像データを生成する第1抽出手段と、
前記第1人物画像と第1参照骨格データとが類似しているか否かを解析して第1解析結果情報を生成する第1解析手段と、を備え、
前記第2端末は、
前記画像データから第2人物画像を抽出した抽出画像データを生成する第2抽出手段と、
前記第2人物画像と第2参照骨格データとが類似しているか否かを解析して第2解析結果情報を生成する第2解析手段と、を備え、
前記検出手段は、前記第1解析結果情報と前記第2解析結果情報とに基づいて、前記事象の検出を行う
請求項1~3のいずれか一項に記載の画像処理システム。
【請求項6】
前記第1端末が、
前記画像データから人物画像を抽出した抽出画像データを生成する第1抽出手段と、
前記人物画像と前記参照骨格データとが類似しているか否かを解析して第1解析結果情報を生成する解析手段と、を備え、
前記第2端末は、複数の前記第1端末から取得した複数の第1解析結果情報に基づいて、前記事象の検出を行う
請求項1~3のいずれか一項に記載の画像処理システム。
【請求項7】
互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムであって、
前記第1端末は、
所定の空間を撮影するカメラから前記空間の画像にかかる画像データを取得する画像データ取得手段と、
前記画像データから第1人物画像を抽出した抽出画像データを生成する第1抽出手段と、
前記第1人物画像に含まれる人物の身体の構造に関する骨格データと第1参照骨格データとが類似しているか否かを解析して第1解析結果情報を生成する第1解析手段と、を備え、
記第2端末は、
前記画像データから第2人物画像を抽出した抽出画像データを生成する第2抽出手段と、
前記第2人物画像に含まれる人物の身体の構造に関する骨格データと第2参照骨格データとが類似しているか否かを解析して第2解析結果情報を生成する第2解析手段と、
前記第1解析結果情報と前記第2解析結果情報とに基づいて、人物の姿勢又は動作に起因する所定の事象の検出を行う検出手段と、
前記検出の結果である結果情報を出力する出力手段と、を備える、
画像処理システム。
【請求項8】
互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムが実行する画像処理方法であって、
前記第1端末は、所定の空間を撮影するカメラから前記空間の画像にかかる画像データを取得し、
記第2端末は、前記画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析し、
前記解析の結果に基づいて、人物の姿勢又は動作に起因する所定の事象の検出を行う検出を行い、
前記検出の結果である結果情報を出力し、
前記第1端末は、前記画像データに、前記画像に含まれる人物の数が閾値未満の場合の前記画像の第1解像度を、前記画像に含まれる人物の数が閾値以上の場合の前記画像の第2解像度よりも低く設定する前処理を施した前処理データを前記第2端末に供給する、
画像処理方法。
【請求項9】
互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムが実行する画像処理方法であって、
前記第1端末は、所定の空間を撮影するカメラから前記空間の画像にかかる画像データを取得し、
前記画像データから第1人物画像を抽出した抽出画像データを生成し、
前記第1人物画像に含まれる人物の身体の構造に関する骨格データと第1参照骨格データとが類似しているか否かを解析して第1解析結果情報を生成し、
記第2端末は、前記画像データから第2人物画像を抽出した抽出画像データを生成し、
前記第2人物画像に含まれる人物の身体の構造に関する骨格データと第2参照骨格データとが類似しているか否かを解析して第2解析結果情報を生成し、
前記第1解析結果情報と前記第2解析結果情報とに基づいて、人物の姿勢又は動作に起因する所定の事象の検出を行い、
前記検出の結果である結果情報を出力する、
画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像処理システム、画像処理方法、および非一時的なコンピュータ可読媒体に関する。
【背景技術】
【0002】
街などの広域空間に複数のカメラを設置してこの空間の監視を行う技術が開発されている。
【0003】
例えば特許文献1の技術は、カメラから入力される画像内の人物を追尾し、この人物の行動が非日常行動であるか否かを判定し、人物の行動が不審な特異行動か否かを判定し、これらの判定結果に基づいて人物の不審行動を検知する。
【0004】
特許文献2の技術は、検知エリア内に存在する物体の物体情報から検知エリア内に存在する物体を歩行者および車両に分類し、歩行者および車両が互いに同じ時刻に同一位置に移動する可能性があると判断した場合、それらを監視対象として設定する。
【0005】
特許文献3の技術は、受信した画像情報から、人物の顔画像のリストに含まれないが所定基準を満たす人物を検出すると所定基準を満たす人物の顔画像をリストに追加するとともに追加した顔画像の識別子を出力する。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2011-035571号公報
【文献】特開2014-194686号公報
【文献】特開2019-009529号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述のような複数のカメラを設置して空間の監視を行う技術に関して、効率よく種々の事象に対応できる技術が期待されている。
【0008】
本開示の目的は、上述した課題に鑑み、複数のカメラが撮影した画像を効率よく処理できる画像処理システム等を提供することにある。
【課題を解決するための手段】
【0009】
本開示の一態様にかかる画像処理システムは、互いに通信可能に接続された第1端末と第2端末とを有する。第1端末は、所定の空間を撮影するカメラから空間の画像にかかる画像データを取得する画像データ取得手段を有する。第1端末または第2端末の少なくともいずれか一方は、画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析する解析手段を有する。第2端末は、解析の結果に基づいて、所定の事象の検出を行う検出手段と、検出の結果である結果情報を出力する出力手段を有する。
【0010】
本開示の一態様にかかる画像処理方法は、互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムが以下の処理を実行する。第1端末は、所定の空間を撮影するカメラから空間の画像にかかる画像データを取得する。第1端末または第2端末の少なくともいずれか一方は、画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析する。第2端末は、解析の結果に基づいて、所定の事象の検出を行い、検出の結果である結果情報を出力する。
【0011】
本開示の一態様にかかる非一時的なコンピュータ可読媒体は、互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムに以下の画像処理方法を実行させるプログラムである。第1端末は、所定の空間を撮影するカメラから空間の画像にかかる画像データを取得する。第1端末または第2端末の少なくともいずれか一方は、画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析する。第2端末は、解析の結果に基づいて、所定の事象の検出を行い、検出の結果である結果情報を出力する。
【発明の効果】
【0012】
本開示により、複数のカメラが撮影した画像を効率よく処理できる画像処理システム等を提供できる。
【図面の簡単な説明】
【0013】
図1】実施形態1にかかる画像処理システムの構成を示すブロック図である。
図2】実施形態1にかかる画像処理方法の流れを示すフローチャートである。
図3】実施形態2にかかる画像処理システムの全体構成を示す図である。
図4】実施形態2にかかる画像処理システムの使用例を示す図である。
図5】実施形態2にかかる撮影装置の構成を示すブロック図である。
図6】実施形態2にかかる第1端末の構成を示すブロック図である。
図7】実施形態2にかかる第2端末の構成を示すブロック図である。
図8】画像データから抽出された骨格データを示す図である。
図9】実施形態2にかかる登録動作データベースを説明するための図である。
図10】実施形態2にかかる登録動作の第1の例を説明するための図である。
図11】実施形態2にかかる登録動作の第2の例を説明するための図である。
図12】実施形態3にかかる第2端末の構成を示すブロック図である。
図13】実施形態3にかかる画像処理システムにおける検索処理を示す図である。
図14】実施形態4にかかる第1端末の構成を示すブロック図である。
図15】実施形態4にかかる登録動作データベースを説明するための図である。
図16】実施形態4にかかる画像処理システムにおける検索処理を示す図である。
図17】画像処理システムの構成のバリエーション示すブロック図である。
図18】コンピュータのハードウェア構成を例示するブロック図である。
【発明を実施するための形態】
【0014】
以下、実施形態を通じて本開示を説明するが、請求の範囲にかかる開示を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
【0015】
<実施形態1>
まず、本開示の実施形態1について説明する。図1は、実施形態1にかかる画像処理システム1の構成を示すブロック図である。図1に示す画像処理システム1は、例えばカメラが撮影した画像に含まれる人物の姿勢や動作を解析し、その人物の姿勢や動作が予め設定された姿勢や動作に該当することを検出する。画像処理システム1は第1端末10と第2端末20とを有する。第1端末10と第2端末20とは互いに通信可能に接続されている。
【0016】
第1端末10は、所定の空間を撮影するカメラから空間の画像にかかる画像データを取得する画像データ取得部11を有する。第1端末10は、画像データ取得部11が取得した画像データを、第2端末20に送信する。
【0017】
第2端末20は第1端末10と通信可能に接続しており、第1端末10から画像データを受け取る。第2端末20は、解析部21、検出部22および出力部23を有している。また第2端末20は、画像処理システム1を利用するユーザが利用する管理端末と通信可能に接続している。
【0018】
解析部21は、画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析する。ここで、骨格データとは、人物の姿勢または動作を検出するための、人物の身体の構造を示すデータであって、複数の擬似的な関節点や擬似的な骨格構造の組み合わせにより構成される。骨格データを抽出するための画像データは、1フレームの画像を含む画像データであってもよいし、動画として撮影された複数の異なる時刻にかかる複数の連続したフレームの画像を含むものであってもよい。なお、以降の説明において1フレーム分の画像を、フレーム画像または単にフレームと称する場合がある。
【0019】
画像処理システム1は、例えば解析部21が、画像データにかかる画像に人物が含まれることを抽出し、抽出した人物の画像に対して擬似的な骨格の画像である骨格データを設定してもよい。画像処理システム1は、第1端末10が取得した画像データの画像に含まれる人物の骨格データを外部から受け取ってもよい。
【0020】
人物の画像に対して設定される骨格データと対比するための所定の参照骨格データは、予め設定された参照用の画像データである。参照骨格データは、上述の骨格データと比較可能に構成された骨格データを含む。
【0021】
検出部22は、解析部21が解析した結果の信号を受け取り、受け取った信号から、所定の事象の検出を行う。解析の結果は、人物の画像にかかる骨格データと所定の参照骨格データとが一致したか否かを示す情報が含まれる。あるいは解析の結果は、参照骨格データが複数存在する場合には、人物の画像にかかる骨格データと所定の参照骨格データとが一致した場合に、どの参照骨格データと一致したかという情報を含み得る。
【0022】
所定の事象とは、人物の姿勢や動作に起因する事象である。すなわち所定の事象とは例えば人物の姿勢や動作それ自体を示すものであってもよい。この場合、所定の事象は例えば、立っている、歩いている、走っている、座っている、などである。所定の事象は、人物の姿勢や動作に紐づけられた抽象的な概念を示すものであってもよい。この場合、所定の事象は例えば、集まっている、逃げている、喧嘩をしている、などである。
【0023】
出力部23は、検出の結果である結果情報を出力する。出力部23が出力する先は、例えば上述の管理端末である。第2端末20は、第2端末20自体が図示しない表示装置を有しており、ユーザに対して所定の情報を出力するものであってもよい。
【0024】
次に、図2を参照して画像処理システム1の処理について説明する。図2は、実施形態1にかかる画像処理方法の流れを示すフローチャートである。図2に示すフローチャートは、例えば画像処理システム1が画像データを取得することにより開始される。
【0025】
まず、第1端末10は、所定の空間を撮影するカメラから空間の画像にかかる画像データを取得する(ステップS11)。
【0026】
次に、第2端末20は、画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析する(ステップS12)。
【0027】
次に、第2端末20は、解析の結果に基づいて、所定の事象の検出を行い(ステップS13)、検出の結果である結果情報を出力する(ステップS14)。
【0028】
以上、実施形態1について説明したが、画像処理システム1の構成は上述のものに限られない。画像処理システム1は、第1端末10または第2端末20の少なくともいずれか一方が、解析部21を有していればよい。すなわち画像処理システム1は、第2端末20に代えて第1端末10が解析部21を有していてもよい。
【0029】
画像処理システム1は、第1端末10を複数有していてもよい。また第1端末10は複数のカメラから複数の画像データを取得してもよい。この場合、画像処理システム1は、複数の第1端末10がそれぞれ複数の画像データを取得し、取得した画像データを第2端末20に供給する。第2端末20は、それぞれのカメラが撮影した画像の画像データを、第1端末10を介して受け取り、それぞれの画像に含まれる人物の姿勢や動作についての事象を検出する。画像処理システム1において、複数のカメラからの画像データを第1端末10が取得し、さらに第2端末20がこれらの画像を取得して解析を行うという構成は、例えば街や居住区などの多数の人が往来する所定の空間に採用され得る。
【0030】
尚、第1端末10および第2端末20は、図示しない構成としてプロセッサおよび記憶装置を有するものである。画像処理システム1が有する記憶装置は、例えばフラッシュメモリやSSD(Solid State Drive)などの不揮発性メモリを含む記憶装置を含む。この場合に、画像処理システム1が有する記憶装置は、上述の画像処理方法を実行するためのコンピュータプログラム(以降、単にプログラムとも称する)を記憶している。またプロセッサは、記憶装置からコンピュータプログラムをDRAM(Dynamic Random Access Memory)等のバッファメモリへ読み込ませ、当該プログラムを実行する。
【0031】
画像処理システム1の第1端末10および第2端末20がそれぞれ有する各構成は、それぞれが専用のハードウェアで実現されていてもよい。また、各構成要素の一部または全部は、汎用または専用の回路(circuitry)、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部または全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。また、プロセッサとして、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)等を用いることができる。なお、ここに説明した構成に関する説明は、本開示において以下に説明するその他の装置またはシステムにおいても、適用され得る。
【0032】
また、画像処理システム1の各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。また、画像処理システム1の機能がSaaS(Software as a Service)形式で提供されてもよい。
【0033】
本実施形態によれば、カメラが撮影した画像を効率よく処理できる画像処理システム等を提供できる。
【0034】
<実施形態2>
次に、本開示の実施形態2について説明する。図3は、実施形態2にかかる画像処理システム2の全体構成を示す図である。画像処理システム2は、複数の第1端末100(100A、100B)と第2端末200とを有している。第1端末100A、第1端末100Bおよび第2端末200は、ネットワークN1を介して互いに通信可能に接続している。第1端末100Aは、3つの撮影装置90(撮影装置90A1、撮影装置90A2および撮影装置90A3)と通信可能に接続している。第1端末100Bは2つの撮影装置90(撮影装置90B1および撮影装置90B2)と通信可能に接続している。
【0035】
また画像処理システム1はネットワークN1を介して管理端末80とも通信可能に接続している。管理端末80は例えばスマートフォン、タブレット端末またはパーソナルコンピュータ等であって、第1端末100または第2端末200を管理する。また管理端末80は所定の情報をユーザから受け付け、受け付けた情報を第1端末100または第2端末200に供給しうる。管理端末80は、第1端末100または第2端末200が出力する所定の情報を受け取り、ユーザに通知しうる。
【0036】
図4は、実施形態2にかかる画像処理システムの使用例を示す図である。図4は車道および歩道を含む任意の市街地を示している。図4に示す市街地には、撮影装置90A、撮影装置90B、撮影装置90Cおよび第1端末100Aが設置されている。撮影装置90A、撮影装置90Bおよび撮影装置90Cは、所定の鉄柱の上部に設置されており、人の背の高さより高い位置から街路を俯瞰して撮影する。撮影装置90A、撮影装置90Bおよび撮影装置90Cは、それぞれが撮影した画像の画像データを、無線通信により第1端末100Aに送信する。
【0037】
第1端末100Aは、撮影装置90Aと同じ鉄柱の上部に設置されており、撮影装置90A、撮影装置90Bおよび撮影装置90Cのそれぞれが供給する画像データを受信する。また第1端末100Aは、受信した画像データに所定の処理を施し、処理を施したデータを第2端末200に送信する。第2端末200は、第1端末100と離間して任意の場所に設置されており、第1端末100Aから送信されたデータを受信する。このような構成により、画像処理システム2は、所定の空間における人物の行動を監視できる。
【0038】
次に、図5を参照して、撮影装置90の構成の例について説明する。図5は、実施形態2にかかる撮影装置90の構成を示すブロック図である。撮影装置90は主な構成として、撮影部91、撮影制御部92およびカメラ通信部93を有している。撮影装置90はカメラと称されてもよい。撮影装置90は所定の期間ごとにこの画像を撮影し、撮影した画像のそれぞれにかかる画像データを生成し、第1端末100に順次供給する。所定の期間とは例えば15分の1秒、30分の1秒または60分の1秒等である。
【0039】
撮影部91は、対物レンズやイメージセンサを含み、市街地の風景を撮影する。撮影部91はパン、チルトまたはズームなどの機能を有していてもよい。撮影制御部92は、撮影部91の動作を制御する。また撮影制御部92は、撮影部91が撮影した画像にかかる画像データを生成する。画像データには、撮影の日時、位置情報、または撮影時の絞り、シャッタースピードなどの撮影条件が含まれ得る。また撮影制御部92は、カメラ通信部93を介して、画像データを送信する制御を行う。カメラ通信部93は第1端末100と通信するためのインタフェースを含む。カメラ通信部93は、撮影制御部92が生成した画像データを第1端末100に送信する。
【0040】
次に、図6を参照して、第1端末100について説明する。図6は、実施形態2にかかる第1端末100の構成を示すブロック図である。第1端末100は主な構成として、画像データ取得部101、前処理部102および第1通信部103を有している。
【0041】
画像データ取得部101は、第1通信部103を介して撮影装置90から供給される画像データを順次取得する。
【0042】
前処理部102は、撮影装置90から供給された画像データに対して所定の前処理を施して前処理データを生成する。所定の前処理は、例えば画像のコントラストやトーンなどの調整であってもよいし、画像を所定のサイズに拡大または縮小するものであってもよい。また所定の前処理は、画像を切り出しする処理であってもよい。所定の前処理は、人物が含まれる画像を抽出した抽出画像データを生成する処理であってもよい。
【0043】
所定の前処理は、画像の解像度の設定であってもよい。その場合例えば前処理部102は、画像に含まれる人物の数が閾値未満の場合の画像の解像度を第1解像度と設定し、画像に含まれる人物の数が閾値以上の場合の画像の解像度を第2解像度と設定する。そしてこの場合に前処理部102は例えば、第1解像度を第2解像度よりも低く設定して前処理を行う。第1端末100は、このようにして前処理部102が処理を施した前処理データを、第2端末200に供給する。
【0044】
第1通信部103は、撮影装置90との通信を行うインタフェースである。第1通信部103はまた、第2端末200との通信を行うインタフェースでもある。第1端末100は第1通信部103を介して撮影装置90から画像データを受信する。また第1端末100は、第1通信部103を介して、前処理部102が生成した前処理データを第2端末200に送信する。
【0045】
図7は、実施形態2にかかる第2端末200の構成を示すブロック図である。第2端末200は主な構成として、画像データ取得部201、抽出部202、解析部203、検出部204、出力部205、第2通信部206および記憶部210を有している。
【0046】
画像データ取得部201は、第2通信部206を介して第1端末100から受け取った画像データを取得する。第2端末200は、受け取った画像データを抽出部202に供給する。
【0047】
抽出部202は、画像データから骨格データを抽出する。より詳細には、抽出部202は、画像データに含まれるフレーム画像から人物の身体の画像領域(身体領域)を検出し、身体画像として抽出する(例えば、切り出す)。そして抽出部202は、機械学習を用いた骨格推定技術を用いて、身体画像において認識される人物の関節等の特徴に基づき人物の身体の少なくとも一部の骨格データを抽出する。骨格データは、関節等の特徴的な点である「キーポイント」と、キーポイント間のリンクを示す「ボーンリンク」とを含む情報である。抽出部202は、例えばOpenPose等の骨格推定技術を用いてよい。なお本開示において上述のボーンリンクを単に「ボーン」と称する場合もある。ボーンは擬似的な骨格を意味する。
【0048】
解析部203は、抽出された人物の骨格データから人物の姿勢に紐づく所定の姿勢または動作を検出する。解析部203は姿勢または動作を検出する際に、記憶部210が記憶している登録動作データベース211に登録されている登録動作を検索する。そして解析部203は、人物の骨格データと登録動作にかかる骨格データとが類似している場合に、この骨格データを所定の姿勢または動作と認識する。すなわち解析部203は、人物の骨格データと類似している登録動作を検出した場合に、この骨格データにかかる動作を、登録動作と紐づけて所定の姿勢または動作として認識する。
【0049】
上述の類否判定において、解析部203は、骨格データを構成する要素の形態の類似度を算出することにより姿勢または動作を検出する。骨格データは、その構成要素として、身体の姿勢を示すための擬似的な関節点または骨格構造が設定される。骨格データを構成する要素の形態とは例えば、あるキーポイントまたはボーンを基準とした場合の他のキーポイントやボーンの位置、距離、角度等の相対的な幾何学関係ということもできる。あるいは骨格データを構成する要素の形態とは例えば、複数のキーポイントやボーンが形成する1つのまとまった形態ということもできる。
【0050】
解析部203は、この構成要素同士の相対的な形態が、比較する2つの骨格データ同士で類似しているか否かを解析する。このとき、解析部203は、2つの骨格データ同士の類似度を算出する。類似度を算出する際には、解析部203は、例えば骨格データが有する構成要素から算出される特徴量により類似度を算出し得る。
【0051】
なお、解析部203の算出対象は、上記類似度に代えて、抽出した骨格データの一部と登録動作にかかる骨格データとの間の類似度、または抽出した骨格データと登録動作にかかる骨格データの一部との間の類似度、または抽出した骨格データの一部と登録動作にかかる骨格データの一部との間の類似度であってもよい。
【0052】
なお、解析部203は、上述した類似度を、骨格データを直接用いて算出してもよいし、間接的に用いて算出してもよい。例えば解析部203は、骨格データの少なくとも一部を、他の形式に変換し、変換したデータを用いて上述した類似度を算出してよい。この場合、類似度は、変換したデータ間の類似度そのものであってもよいし、変換したデータ間の類似度を用いて算出される値であってもよい。
【0053】
変換の手法は、骨格データにかかる画像サイズの正規化であっても良いし、骨格構造のなす角(すなわち、関節の曲がり具合)を用いた特徴量に変換することであっても良い。あるいは変換の手法は、予め学習された機械学習の学習済みモデルによって変換される3次元の姿勢であってもよい。
【0054】
なお、解析部203は、1つの画像データから抽出された骨格データから姿勢または動作を検出するものであってもよい。また、解析部203は、複数の異なる時刻に撮影された複数の画像データのそれぞれから抽出された骨格データから、人物の時系列に沿った作業動作を解析するものであってもよい。このような構成により、画像処理システム2は、検出の対象となる姿勢または動作の変化の状態に対応して柔軟に動作を解析できる。
【0055】
検出部204は、解析部203が解析した結果の信号を受け取り、受け取った信号から、所定の事象の検出を行う。すなわち本実施形態における検出部204は、実施形態1における検出部22と同等の機能を有する。
【0056】
出力部205は、検出の結果である結果情報を出力する。出力部205が出力する先は、管理端末80である。なお、第2端末200は、第2端末200自体が図示しない表示装置を有しており、ユーザに対して所定の情報を出力するものであってもよい。
【0057】
第2通信部206は、第1端末100および管理端末80との通信を行うための手段であって、例えばネットワークN1に接続するためのインタフェースを含む。
【0058】
記憶部210は、不揮発性メモリを含む記憶手段である。記憶部210は、登録動作データベース211を少なくとも記憶している。登録動作データベース211は、登録動作としての骨格データを含む。
【0059】
以上、画像処理システム2の構成について説明したが、実施形態2にかかる画像処理システム2は、上述の構成に限られない。例えば、画像処理システム2が有する抽出部202の一部または全部は、撮影装置90が有していてもよい。この場合例えば、撮影装置90は、撮影した画像を処理することにより、人物にかかる身体画像を抽出してもよい。あるいは撮影装置90は、身体画像からさらに、身体画像において認識される人物の関節等の特徴に基づき人物の身体の少なくとも一部の骨格データを抽出してもよい。撮影装置90がこのような機能を担う場合、撮影装置90は少なくとも、骨格データを画像処理システム2に供給する。撮影装置90は、骨格データに加えて、画像データを撮影装置90に供給する。上述の構成例の他に、画像処理システム2は、撮影装置90を含んでいても良い。
【0060】
次に、図8を参照して、人物の姿勢を検出する例について説明する。図8は、画像データから抽出された骨格データを示す図である。図8に示す画像は、撮影装置90が撮影した画像から人物Pの身体を抽出した身体画像F10である。画像処理システム10において、抽出部202は、撮影装置90が撮影した画像から身体画像F10を切り出し、さらに骨格構造を設定する。
【0061】
抽出部202は、例えば、画像の中から人物Pのキーポイントとなり得る特徴点を抽出する。さらに抽出部202は、抽出した特徴点からキーポイントを検出する。キーポイントの検出をする場合、抽出部202は、例えばキーポイントの画像について機械学習した情報を参照する。
【0062】
図8に示す例では、抽出部202は、人物Pのキーポイントとして、頭A1、首A2、右肩A31、左肩A32、右肘A41、左肘A42、右手A51、左手A52、右腰A61、左腰A62、右膝A71、左膝A72、右足A81、左足A82を検出している。
【0063】
さらに、抽出部202は、作業者Pの擬似的な骨格構造として、これらのキーポイントを連結したボーンを以下に示すとおりに設定する。ボーンB1は、頭A1と首A2とを結ぶ。ボーンB21は首A2と右肩A31とを結び、ボーンB22は、首A2と左肩A32とを結ぶ。ボーンB31は、右肩A31と右肘A41とを結び、ボーンB32は、左肩A32と左肘A42とを結ぶ。ボーンB41は、右肘A41と右手A51とを結び、ボーンB42は、左肘A42と左手A52とを結ぶ。ボーンB51は、首A2と右腰A61とを結び、ボーンB52は、首A2と左腰A62とを結ぶ。ボーンB61は、右腰A61と右膝A71とを結び、ボーンB62は、左腰A62と左膝A72とを結ぶ。そしてボーンB71は、右膝A71と右足A81とを結び、ボーンB72は、左膝A72と左足A82とを結ぶ。抽出部202は、上述の骨格構造に関する骨格データを生成すると、生成した骨格データを、解析部103に供給する。
【0064】
次に、図9を参照して登録動作データベースの例について説明する。図9は、実施形態2にかかる登録動作データベースを説明するための図である。図9に示す表は、登録動作ID(identification, identifier)と、複数の関連ワードがそれぞれ対応づけられている。登録動作ID(または動作ID)が「R01」の動作に関する関連ワードは、「走っている」、「急いでいる」等である。登録動作IDが「R02」の関連ワードは、「歩いている」、「ゆっくり」等であり、登録動作IDが「R03」の関連ワードは、「座り込んでいる」、「しゃがんでいる」等であり、登録動作IDが「R04」の関連ワードは、「座り込んでいる」、「うずくまっている」等である。
【0065】
上述のように、登録動作データベース211が含む登録動作に関するデータは、動作ごとに動作IDと関連ワードとが紐づけられて記憶されている。それぞれの登録動作IDは、1以上の骨格データに紐づいている。すなわち例えば動作IDが「R01」の登録動作は、走っている動作または急いでいる動作を示す骨格データを含む。
【0066】
図10を参照して、登録動作にかかる骨格データについて説明する。図10は、実施形態2にかかる登録動作の第1の例を説明するための図である。図10は、登録動作データベース211に含まれる登録動作のうち、動作IDが「R01」の動作に関する骨格データを示している。図10には骨格データF11および骨格データF12を含む複数の骨格データが左右方向に配置された状態で示されている。骨格データF11は、骨格データF12より左側に位置している。骨格データF11は、走っている人物の一場面を捉えた姿勢である。骨格データF12は、走っている人物の一場面であって、骨格データF11とは異なる姿勢である。
【0067】
これは動作IDが「R01」の登録動作は、人物が骨格データF11に対応する姿勢を取った後に、骨格データF12の姿勢を取るということを意味している。なお、ここでは2つの骨格データについて説明したが、動作IDが「R01」の登録動作は、上述の骨格データ以外の骨格データを含んでいてもよい。
【0068】
図11は、実施形態2にかかる登録動作の第2の例を説明するための図である。図11図9に示した動作IDが「R03」の動作に関する骨格データF31を示している。動作IDが「R03」の登録動作は、座り込んでいる人物を示す1つの骨格データF31のみが登録されている。
【0069】
上述のように、登録動作データベース211に含まれる登録動作は、1つの骨格データのみを含むものであってもよいし、2以上の骨格データを含むものであってもよい。第2端末200の解析部203は、上述の骨格データを含む登録動作と、抽出部202から受け取った骨格データとを比較して、類似している登録動作が存在するか否かを判定する。
【0070】
以上、実施形態2について説明したが、実施形態2にかかる画像処理システム2は上述の構成に限られない。第1端末100は、1以上の撮影装置90と通信可能に接続していればよい。第1端末100と撮影装置90とはネットワークN1を介して接続していてもよい。画像処理システム2は、1以上の第1端末100を有していればよい。画像処理システム2は1以上の撮影装置90を含んでいてもよい。画像処理システム2は1以上の管理端末80を含んでいてもよい。
【0071】
画像処理システム2において、複数のカメラからの画像データを第1端末100が取得し、さらに第2端末200がこれらの画像を取得して解析を行うという構成は、例えば街や居住区などの多数の人が往来する所定の空間に採用される。このような場合、複数の撮影装置90と第1端末100との通信や、第1端末100と第2端末200との通信は帯域幅が広いものが好ましい。例えばこれらの通信を実現するために、画像処理システム2は、転送レートが10ギガビット毎秒程度の5G(第5世代移動通信システム)回線を採用してもよい。このような高速通信回線を利用することにより、画像処理システム2は高いフレームレートや高解像度を有する画像データを送受信して解析可能となる。
【0072】
以上のように、実施形態2によれば、複数のカメラが撮影した画像を効率よく処理できる画像処理システム等を提供できる。またこれにより、広域にわたって多数のカメラが設置されている場合であっても、本画像処理システム等は、広域の各地を撮像した画像を効率よく処理することができる。
【0073】
<実施形態3>
次に、実施形態3について説明する。実施形態3は、検索情報受付部207をさらに有する点が実施形態2と異なる。図12は、実施形態3にかかる画像処理システム3のブロック図である。図12に示す画像処理システム3は、撮影装置90、管理端末80およびネットワークN1を省略して示している。また図12に示す第1端末100は実施形態2と同様の構成であって、詳細は省略して示されている。画像処理システム3は、第2端末220を有している。第2端末220は、検索情報受付部207を有している点が、実施形態2に示した第2端末200と異なる。
【0074】
検索情報受付部207は、人物の姿勢または行動に関する所定の検索情報を受け付ける。検索情報は例えば管理端末80が第2端末220に供給する情報である。検索情報受付部207が検索情報を受け取ると、解析部203は、検索情報にかかる姿勢に対応した参照骨格データを設定し、参照骨格データと画像にかかる骨格データとが類似しているか否かを解析する。さらに検出部204は、解析の結果に基づいて、検索情報に対応する事象を検出する。そして出力部205は管理端末80から受け取った検索情報に対応する検出結果を管理端末80に供給する。
【0075】
図13は、実施形態3にかかる画像処理システム3における検索処理を示す図である。図13は、画像処理システム3に入力される情報と、入力されたデータに応じて画像処理システム3が出力するデータが示されている。
【0076】
画像処理システム3は、検索条件として、人物の姿勢または動作を示す検索データとこれに付帯する付帯データとを受け付ける。ここで、検索データは、検索にかかる姿勢または動作を示す検索ワード、身体画像データ、骨格データのいずれかを含む。
【0077】
この場合、検索ワードは例えば図9に示した登録動作データベース211の関連ワードに含まれるフレーズである。あるいは検索ワードは、登録動作データベース211の関連ワードに対応づけが可能なフレーズであってもよい。また検索条件としての身体画像は、登録動作データベース211に含まれる登録動作と比較可能な骨格データが抽出できる態様であることが好ましい。検索条件として骨格データもまた登録動作データベース211に含まれる登録動作と比較可能な骨格データが抽出できる態様であることが好ましい。検索条件としての付帯データは、検索対象となる撮影領域、撮影日時等が含まれる。これらの検索条件は管理端末80から画像処理システム3に供給される。
【0078】
また画像処理システム3は、取得データとして撮影装置90が撮影した画像データを取得する。なお画像データは、撮影に関連する付帯データが含まれる。付帯データは、例えば画像データにかかる画像の撮影場所、撮影した撮影装置90のID、撮影日時などが含まれ得る。
【0079】
画像処理システム3は、検索情報受付部207が検索情報を受け付ける。画像処理システム3は受け付けた検索情報に応じた処理を行う。具体的には例えば検出部204は、所定の事象として検索情報により示された姿勢に対応する人物の画像を検出しうる。そして画像処理システム3は、検索条件に対応した検索結果として、画像データおよび画像データに付帯する付帯データを出力する。画像処理システム3は検索結果を、管理端末80に供給する。
【0080】
上述の構成により、画像処理システム3は例えば、管理端末80から「走っている」という検索ワードを受け付け、取得した画像データから人物が走っている動作の画像を含む画像データを管理端末80に回答する。あるいは画像処理システム3は、検出した動作に付帯する情報として、「走っている」に該当する画像を撮影した場所や日時に関するデータを管理端末80に回答する。
【0081】
以上、実施形態3について説明した。実施形態3によればユーザが設定する所望の検索条件に応じた検索を効率的に行うことができる。すなわち実施形態3によれば、カメラが撮影した画像を効率よく処理できる画像処理システム等を提供できる。
【0082】
<実施形態4>
次に、実施形態4について説明する。実施形態4は、第1端末100に代えて第1端末130を有する点が、実施形態3にかかる画像処理システム3と異なる。図14は、実施形態4にかかる画像処理システム4のブロック図である。図14に示す画像処理システム4は、撮影装置90、管理端末80およびネットワークN1を省略して示している。また図14に示す画像処理システム4は、2つの第1端末130(130A、130B)のうち、130Aのみ詳細を示し、130Bの構成は省略して示しているが、2つの第1端末130は同様の構成を有しているものとする。
【0083】
第1端末130は、抽出部112、解析部113、検出部114、出力部115および記憶部120を有する。なお、第1端末130が有する抽出部112、解析部113、検出部114、出力部115および記憶部120は、第2端末200が有する抽出部202、解析部203、検出部204、出力部205および記憶部210と同様の機能を有している。そのためここでは詳述を省略する。なお、第1端末130が有する出力部115は、検出の結果に関するデータを第2端末200または第2端末220に出力する。
【0084】
上述の構成により、本実施形態にかかる画像処理システム2は、第1端末130が第1解析手段である解析部113を有し、第2端末220は、第2解析手段である解析部203を有する。この場合、第1端末130の解析部113は、人物画像と第1参照骨格データとが類似しているか否かを解析して第1解析結果情報を生成する。第1検出手段である検出部114は、第1解析結果情報から、事象の検出を行う。また第2端末220の解析部203は、人物画像と第2参照骨格データとが類似しているか否かを解析して第2解析結果情報を生成する。第2検出手段である検出部204は、第1解析結果情報と第2解析結果情報とから、事象の検出を行う。このように画像処理システム4は、第1端末130と第2端末220とがそれぞれ骨格データを抽出し、さらに事象を検出する機能を有する。これにより画像処理システム4は、第1端末130と第2端末220との間で負荷を分散したり、参照する登録動作を分担したりできる。
【0085】
なお、画像処理システム4は、第1端末130が有する解析部113が第1解析結果情報を生成し、第2端末220が、複数の第1端末130から取得した複数の第1解析結果情報に基づいて、事象の検出を行うものであってもよい。このように、画像処理システム4は、第1端末130と第2端末220との機能分担を柔軟に行うことができる。
【0086】
次に、本実施形態における画像処理システム4が有する検索機能について説明する。本実施形態における検索情報受付部207は、人物の行動に起因する所定の事象を示す検索ワードを検索情報として受け付ける。人物の行動に起因する所定の事象とは、人物の姿勢や動作を直接的に示すものではない「ひったくり」「喧嘩」「集会」「路上パフォーマンス」「パニック」「暴動」などの抽象的な概念を含む。なお、人物の行動に起因する所定の事象とは、人物の姿勢や動作を直接的に示す意味を有する「歩く」「走る」などの検索ワードも含み得る。
【0087】
図15は、実施形態4にかかる登録動作データベースを説明するための図である。ここに示す登録動作データベースは、複数の動作IDと、これら複数の動作IDに対応する事象を示すワードまたはフレーズが紐づけられている。具体的には例えば、動作IDが「R01」の骨格データと「R11」の骨格データとは、「ひったくり」という事象に紐づいている。これは「ひったくり」という事象においては、所定期間内に、あるいは同時に並行して、複数の異なる姿勢または動作(例えば、「走る」を示す「R01」と、「転倒」を示す「R11」など)を行う人物が出現することを示している。同様に、図15に示す登録動作データベースにおいて、動作IDが「R02」、「R12」、「R22」の骨格データは、「喧嘩」という事象と紐づいており、動作IDが「R03」、「R13」の骨格データは「集会」という事象とが紐づいている。
【0088】
なお、図15に示す登録動作データベースは、第1端末130が有していてもよいし、第2端末220が有していてもよい。第1端末130と第2端末220とは互いに分担して登録動作データベースを記憶していてもよいし、いずれか一方が有している登録動作データベースを他方が利用してもよい。
【0089】
次に、図16を参照して、上述の登録動作データベースを利用する例について説明する。図16は、実施形態4にかかる画像処理システムにおける検索処理を示す図である。図16は、画像処理システム4に入力される情報と、入力されたデータに応じて画像処理システム4が出力するデータが示されている。
【0090】
画像処理システム4は、検索条件として、図15に示す登録動作データベースに含まれる事象を示す検索ワードおよびその付帯データを受け付ける。これらの検索条件は管理端末80から画像処理システム4に供給される。あるいは検索ワードは、図15に示した登録動作データベースの事象に対応づけが可能なフレーズであってもよい。画像処理システム4は、取得データとして撮影装置90が撮影した画像データおよびその付帯データを取得する。
【0091】
上述の構成により、画像処理システム4は例えば、管理端末80から「ひったくり」という検索ワードを受け付け、取得した画像データから「ひったくり」に関連する動作の画像を含む画像データを管理端末80に回答する。あるいは画像処理システム4は、検出した動作に付帯する情報として、「ひったくり」に該当する画像を撮影した場所や日時に関するデータを管理端末80に回答する。このように、本実施形態における検索情報受付部207は、人物の行動に起因する所定の事象を示す検索ワードを検索情報として受け付ける。そして第1端末130の検出部114および第2端末220の検出部204は、事象として検索ワードに対応する人物の画像を検出する。上記構成により、画像処理システム4は、画像に同時に映る少なくとも二人の骨格データに基づいて特定される所定の事象を検出できる。よって、画像処理システム4は、転倒など単なる姿勢を検知するにとどまらず、ひったくりや喧嘩などの複雑な状況を検知できる。
【0092】
以上、実施形態4について説明した。実施形態4にかかる画像処理システム4は、第1端末130または第2端末220の少なくともいずれか一方が、人物の姿勢に関する所定の参照データを記憶する記憶手段を備えるものであってもよい。上述の構成において、第1端末130が取得した画像データから所定の事象の検出までを行い、第2端末220は画像データの解析を行わない場合には、第2端末200は例えば、抽出部202、解析部203、検出部204を有さないものであってもよい。この場合、第2端末220は、第1端末130がそれぞれ検出した事象の結果を取得し、取得した結果を集計する機能を有し得る。以上のように、実施形態4によれば、カメラが撮影した画像を効率よく処理できる画像処理システム等を提供できる。またこれにより、広域にわたって多数のカメラが設置されている場合であっても、本画像処理システム等は、広域の各地を撮像した画像を効率よく処理することができる。
【0093】
<実施形態の変形例>
図17は、画像処理システムの構成のバリエーションを示すブロック図である。図17には画像処理システム5が示されている。画像処理システム5は、第1端末130、第2端末220および第3端末300を有している。画像処理システム5において、第1端末130、第2端末220および第3端末300は、それぞれMEC(Multi-access Edge Computing)と称される端末である。ここでは例えば第1端末130をL-MEC(Lower-MEC)、第2端末220をM-MEC(Middle-MEC)、第3端末300をU-MEC(Upper-MEC)と称してもよい。
【0094】
第1端末130は複数の撮影装置90から画像データを取得する。第1端末130は撮影装置90から取得した画像データに対して所定の第1処理を施す。所定の第1処理とは、上述した前処理や、所定の骨格データを検出する処理である。第1端末130は、このような第1処理を施して、第2端末220に第1処理データを供給する。
【0095】
第2端末220は、複数の第1端末130から第1処理データを受け取り、受け取った複数の第1処理データを用いて第2処理を施す。第2処理とは、第1処理データを集計する処理や、第1処理データから所定の骨格データを検出する処理である。第2端末220は、このような第2処理を施して、第3端末300に第2処理データを供給する。
【0096】
第3端末300は、複数の第2端末220から第2処理データを受け取り、受け取った複数の第2処理データを用いて第3処理を施す。第3処理は、例えば第2処理データを集計する処理であってもよいし、第2処理データからさらに所定の骨格データを検出する処理であってもよい。第3端末300は、所定の管理端末に通信可能に接続していてもよい。
【0097】
以上、実施形態の変形例について説明した。ここで説明した変形例は、上述の画像処理システムいずれにも適用できる。このようなカスケード状の処理構成を有する端末を分散配置することにより、画像処理システム5は、より遅延を抑制し、効率よく画像処理を行うことができる。またこのような分散システムまたはカスケード状のシステムにより、広域にわたって多数のカメラが設置されている場合であっても、本画像処理システム等は、広域の各地を撮像した画像を効率よく処理することができる。
【0098】
以上に本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。上述した実施形態の構成は、互いに組み合わせたり、一部の構成を他の構成に入れ替えたりしてもよい。また、上述した実施形態の構成は、趣旨を逸脱しない範囲内において種々の変更を加えてもよい。また、上述した各実施形態や変形例に開示される構成や処理を互いに組み合わせてもよい。
【0099】
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施の形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施の形態では、図示される工程の順番を本実施形態が実現する機能に支障のない範囲において変更することができる。また、上述の各実施の形態は、内容が相反しない範囲で組み合わせることができる。
【0100】
<ハードウェア構成の例>
以下、本開示における判定装置の各機能構成がハードウェアとソフトウェアとの組み合わせで実現される場合について説明する。
【0101】
図18は、コンピュータのハードウェア構成を例示するブロック図である。本開示における判定装置は、図に示すハードウェア構成を含むコンピュータ500により上述の機能を実現できる。コンピュータ500は、スマートフォンやタブレット端末などといった可搬型のコンピュータであってもよいし、PCなどの据え置き型のコンピュータであってもよい。コンピュータ500は、各装置を実現するために設計された専用のコンピュータであってもよいし、汎用のコンピュータであってもよい。コンピュータ500は、所定のアプリケーションをインストールされることにより、所望の機能を実現できる。
【0102】
コンピュータ500は、バス502、プロセッサ504、メモリ506、ストレージデバイス508、入出力インタフェース510(インタフェースはI/F(Interface)とも称される)およびネットワークインタフェース512を有する。バス502は、プロセッサ504、メモリ506、ストレージデバイス508、入出力インタフェース510、およびネットワークインタフェース512が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ504などを互いに接続する方法は、バス接続に限定されない。
【0103】
プロセッサ504は、CPU、GPUまたはFPGAなどの種々のプロセッサである。メモリ506は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。
【0104】
ストレージデバイス508は、ハードディスク、SSD、メモリカード、またはROM(Read Only Memory)などを用いて実現される補助記憶装置である。ストレージデバイス508は、所望の機能を実現するためのプログラムが格納されている。プロセッサ504は、このプログラムをメモリ506に読み出して実行することで、各装置の各機能構成部を実現する。
【0105】
入出力インタフェース510は、コンピュータ500と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース510には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
【0106】
ネットワークインタフェース512は、コンピュータ500をネットワークに接続するためのインタフェースである。
【0107】
以上、本開示におけるハードウェア構成の例を説明したが、上述の実施形態は、これに限定されるものではない。本開示は、任意の処理を、プロセッサにコンピュータプログラムを実行させることにより実現することも可能である。
【0108】
上述の例において、プログラムは、コンピュータに読み込まれた場合に、実施形態で説明された1またはそれ以上の機能をコンピュータに行わせるための命令群(またはソフトウェアコード)を含む。プログラムは、非一時的なコンピュータ可読媒体または実体のある記憶媒体に格納されてもよい。限定ではなく例として、コンピュータ可読媒体または実体のある記憶媒体は、random-access memory(RAM)、read-only memory(ROM)、フラッシュメモリ、solid-state drive(SSD)またはその他のメモリ技術、CD-ROM、digital versatile disc(DVD)、Blu-ray(登録商標)ディスクまたはその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたはその他の磁気ストレージデバイスを含む。プログラムは、一時的なコンピュータ可読媒体または通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体または通信媒体は、電気的、光学的、音響的、またはその他の形式の伝搬信号を含む。
【0109】
上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、以下には限られない。
(付記1)
互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムであって、
前記第1端末は、所定の空間を撮影するカメラから前記空間の画像にかかる画像データを取得する画像データ取得手段を備え、
前記第1端末または前記第2端末の少なくともいずれか一方は、前記画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析する解析手段を備え、
前記第2端末は、前記解析の結果に基づいて、所定の事象の検出を行う検出手段と、
前記検出の結果である結果情報を出力する出力手段と、を備える、
画像処理システム。
(付記2)
前記検出手段は、前記画像に同時に含まれる少なくとも二人の前記骨格データに基づいて所定の前記事象の検出を行う、
付記1に記載の画像処理システム。
(付記3)
前記第1端末または前記第2端末の少なくともいずれか一方は、人物の姿勢に関する所定の参照データを記憶する記憶手段をさらに備える、
付記1または2に記載の画像処理システム。
(付記4)
前記第2端末が、前記解析手段を備え、
前記第1端末は、前記画像データに所定の前処理を施した前処理データを前記第2端末に供給する、
付記1~3のいずれか一項に記載の画像処理システム。
(付記5)
前記第1端末は、前記前処理として、前記画像のうち人物が含まれる人物画像を抽出した抽出画像データを生成し、前記抽出画像データを前記第2端末に供給する、
付記4に記載の画像処理システム。
(付記6)
前記第1端末は、前記前処理として、前記画像に含まれる人物の数が閾値未満の場合の前記画像の第1解像度を、前記画像に含まれる人物の数が閾値以上の場合の前記画像の第2解像度よりも低く設定して、前記第2端末に供給する、
付記4または5に記載の画像処理システム。
(付記7)
前記第1端末は、
前記画像データから第1人物画像を抽出した抽出画像データを生成する第1抽出手段と、
前記第1人物画像と第1参照骨格データとが類似しているか否かを解析して第1解析結果情報を生成する第1解析手段と、を備え、
前記第2端末は、
前記画像データから第2人物画像を抽出した抽出画像データを生成する第2抽出手段と、
前記第2人物画像と第2参照骨格データとが類似しているか否かを解析して第2解析結果情報を生成する第2解析手段と、を備え、
前記検出手段は、前記第1解析結果情報と前記第2解析結果情報とに基づいて、前記事象の検出を行う
付記1~3のいずれか一項に記載の画像処理システム。
(付記8)
前記第1端末が、
前記画像データから人物画像を抽出した抽出画像データを生成する第1抽出手段と、
前記人物画像と前記参照骨格データとが類似しているか否かを解析して第1解析結果情報を生成する解析手段と、を備え、
前記第2端末は、複数の前記第1端末から取得した複数の第1解析結果情報に基づいて、前記事象の検出を行う
付記1~3のいずれか一項に記載の画像処理システム。
(付記9)
前記第2端末は、人物の姿勢または行動に関する所定の検索情報を受け付ける検索情報受付部をさらに備え、
前記解析手段は、前記検索情報にかかる姿勢に対応した前記参照骨格データを設定し、前記参照骨格データと前記画像にかかる前記骨格データとが類似しているか否かを解析し、
前記検出手段は、前記解析の結果に基づいて、前記検索情報に対応する前記事象を検出する、
付記1~8のいずれか一項に記載の画像処理システム。
(付記10)
前記検索情報受付部は、人物の姿勢を示す前記検索情報を受け付け、
前記検出手段は、前記事象として前記検索情報により示された姿勢に対応する人物の画像を検出する、
付記9に記載の画像処理システム。
(付記11)
前記検索情報受付部は、人物の行動に起因する所定の事象を示す検索ワードを前記検索情報として受け付け、
前記検出手段は、前記事象として前記検索ワードに対応する人物の画像を検出する、
付記9に記載の画像処理システム。
(付記12)
互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムが実行する画像処理方法であって、
前記第1端末は、所定の空間を撮影するカメラから前記空間の画像にかかる前記画像データを取得し、
前記第1端末または前記第2端末の少なくともいずれか一方は、前記画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析し、
前記第2端末は、前記解析の結果に基づいて、所定の事象の検出を行い、
前記検出の結果である結果情報を出力する、
画像処理方法。
(付記13)
互いに通信可能に接続された第1端末と第2端末とを有する画像処理システムに以下の画像処理方法を実行させるプログラムが格納された非一時的なコンピュータ可読媒体であって、
前記第1端末は、所定の空間を撮影するカメラから前記空間の画像にかかる前記画像データを取得し、
前記第1端末または前記第2端末の少なくともいずれか一方は、前記画像に含まれる人物の身体の構造に関する骨格データと所定の参照骨格データとが類似しているか否かを解析し、
前記第2端末は、前記解析の結果に基づいて、所定の事象の検出を行い、
前記検出の結果である結果情報を出力する、
非一時的なコンピュータ可読媒体。
【符号の説明】
【0110】
1、2、3、4、5 画像処理システム
10 第1端末
11 画像データ取得部
20 第2端末
21 解析部
22 検出部
23 出力部
80 管理端末
90 撮影装置
91 撮影部
92 撮影制御部
93 カメラ通信部
100 第1端末
101 画像データ取得部
102 前処理部
103 第1通信部
112 抽出部
113 解析部
114 検出部
115 出力部
120 記憶部
121 登録動作データベース
130 第1端末
200 第2端末
201 画像データ取得部
202 抽出部
203 解析部
204 検出部
205 出力部
206 第2通信部
207 検索情報受付部
210 記憶部
220 第2端末
211 登録動作データベース
300 第3端末
500 コンピュータ
504 プロセッサ
506 メモリ
508 ストレージデバイス
510 入出力インタフェース
512 ネットワークインタフェース
N1 ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18