IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許7073179画像抽出装置、画像抽出方法及び画像抽出プログラム
<>
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図1
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図2
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図3
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図4
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図5
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図6
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図7
  • 特許-画像抽出装置、画像抽出方法及び画像抽出プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-05-13
(45)【発行日】2022-05-23
(54)【発明の名称】画像抽出装置、画像抽出方法及び画像抽出プログラム
(51)【国際特許分類】
   G06T 7/60 20170101AFI20220516BHJP
   G06T 7/12 20170101ALI20220516BHJP
   H04N 7/18 20060101ALI20220516BHJP
【FI】
G06T7/60 180D
G06T7/12
G06T7/60 300A
H04N7/18 K
【請求項の数】 17
(21)【出願番号】P 2018078648
(22)【出願日】2018-04-16
(65)【公開番号】P2019185616
(43)【公開日】2019-10-24
【審査請求日】2020-05-29
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100124084
【弁理士】
【氏名又は名称】黒岩 久人
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】巻渕 有哉
【審査官】佐野 潤一
(56)【参考文献】
【文献】特開2014-093023(JP,A)
【文献】特開2018-032078(JP,A)
【文献】特開2009-110486(JP,A)
【文献】特開2013-210968(JP,A)
【文献】特開2017-059207(JP,A)
【文献】特開2010-102396(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06T 1/00
H04N 7/18
H04N 5/222
G08B 13/00-31/00
(57)【特許請求の範囲】
【請求項1】
所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するオブジェクト特定部と、
前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定する輪郭領域特定部と、
前記画像における、特定した前記オブジェクトに対応する矩形領域を特定する矩形領域特定部と、
前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域を示す画像を、機械学習における前記オブジェクトの正例を示す正例画像として抽出する抽出部と、
を備える画像抽出装置。
【請求項2】
前記矩形領域特定部は、特定した前記オブジェクトの輪郭領域に基づいて、前記矩形領域を特定する、
請求項1に記載の画像抽出装置。
【請求項3】
前記矩形領域特定部は、特定した前記オブジェクトの輪郭領域から、前記オブジェクトの輪郭を構成する点群を近似する矩形として矩形領域を特定する、
請求項2に記載の画像抽出装置。
【請求項4】
前記矩形領域特定部は、前記オブジェクトの輪郭を構成する点群を内包する複数の矩形候補のうち、当該矩形の面積が相対的に小さい矩形領域を前記矩形領域として特定する、
請求項3に記載の画像抽出装置。
【請求項5】
前記矩形領域特定部は、前記撮像装置が全方位画像を撮像する撮像装置である場合に、前記全方位画像の中心を示す点又は前記全方位画像の中心を示す点の近傍点から、前記オブジェクトの位置に向かう方向と平行な二辺を有する複数の矩形領域のうち、面積が相対的に小さい矩形領域を前記オブジェクトに対応する矩形領域として特定する、
請求項2から4のいずれか1項に記載の画像抽出装置。
【請求項6】
前記オブジェクト特定部は、前記所定エリアにおける一以上の前記オブジェクトのそれぞれの位置を示す位置情報を取得することにより前記オブジェクトを特定し、
前記輪郭領域特定部は、前記所定エリアにおける前記位置情報が示す位置に前記オブジェクトに対応する三次元モデルを仮想的に配置した場合に前記撮像装置が撮像した画像に含まれる前記三次元モデルに対応する輪郭領域を特定する、
請求項1から5のいずれか1項に記載の画像抽出装置。
【請求項7】
前記撮像装置が撮像する画像における複数の位置のそれぞれと、当該複数の位置のそれぞれに前記三次元モデルを仮想的に配置したときの前記輪郭領域を示す情報とを関連付けた位置別領域情報を記憶する記憶部を備え、
前記輪郭領域特定部は、前記位置別領域情報を参照し、前記オブジェクト特定部が取得した位置情報が示す位置に関連付けられている輪郭領域を、当該三次元モデルの輪郭領域と特定する、
請求項6に記載の画像抽出装置。
【請求項8】
前記三次元モデルを構成する点群を示す点群情報と、前記撮像装置のキャリブレーションに関するパラメータとを記憶する記憶部を備え、
前記輪郭領域特定部は、前記記憶部から当該点群情報と当該パラメータとを取得し、前記三次元モデルを仮想的に配置した場合に、当該点群情報が示す点群の少なくとも一部について、当該パラメータに基づいて、前記撮像装置が撮像する画像上への投影点を算出し、当該投影点の点群を近似する多角形領域を、当該三次元モデルの輪郭領域として特定する、
請求項6に記載の画像抽出装置。
【請求項9】
前記オブジェクト特定部は、前記撮像装置が撮像した第1画像に含まれる第1オブジェクトを特定するとともに、前記第1画像に含まれる一以上の第2オブジェクトを特定し、
前記抽出部は、前記第1オブジェクトに対応する前記矩形領域と、前記一以上の第2オブジェクトのそれぞれに対応する前記輪郭領域との重複率が前記所定値以下である場合、前記第1オブジェクトに対応する前記矩形領域を前記非重複矩形領域に特定する、
請求項1から8のいずれか1項に記載の画像抽出装置。
【請求項10】
前記オブジェクト特定部は、前記撮像装置が撮像した第1画像に含まれる前記オブジェクトである第1オブジェクトを特定するとともに、前記第1画像よりも後に撮像された第2画像に含まれる前記オブジェクトである第2オブジェクトを特定し、
前記抽出部は、前記第1画像と前記第2画像とを重ねた場合に、前記第1オブジェクトに対応する前記輪郭領域又は前記矩形領域のうち、前記第2オブジェクトに対応する前記輪郭領域又は前記矩形領域との重複率が前記所定値以下の前記非重複矩形領域を特定する、
請求項1から8のいずれか1項に記載の画像抽出装置。
【請求項11】
前記矩形領域特定部は、前記画像において、前記オブジェクトに対応しない矩形領域であって、特定した全ての前記オブジェクトの輪郭領域との重複率が所定値以下となる矩形領域である第2矩形領域を特定し、
前記抽出部は、前記第2矩形領域を示す画像を、前記機械学習における前記オブジェクトの負例を示す負例画像として抽出する、
請求項1から10のいずれか1項に記載の画像抽出装置。
【請求項12】
所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するオブジェクト特定部と、
前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定する輪郭領域特定部と、
前記画像における、特定した前記オブジェクトに対応する矩形領域を特定する矩形領域特定部と、
前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域を示す画像を、入力された画像が前記オブジェクトを示しているか否かを判定する判定器に入力し、前記判定器により、当該画像が前記オブジェクトを示していると判定されると、当該画像を機械学習における前記オブジェクトの正例を示す正例画像として抽出する抽出部と、
を備える画像抽出装置。
【請求項13】
所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するオブジェクト特定部と、
前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定する輪郭領域特定部と、
前記画像における、特定した前記オブジェクトに対応する矩形領域を特定する矩形領域特定部と、
前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域に対応する前記画像上の位置と、前記撮像装置に対応する前記画像上の位置との間の距離を算出し、当該距離に基づいて、前記非重複矩形領域を示す画像を機械学習における前記オブジェクトの正例を示す正例画像として抽出するか否かを判定し、前記非重複矩形領域を示す画像を前記正例画像として抽出すると判定すると、当該画像を前記正例画像として抽出する抽出部と、
を備える画像抽出装置。
【請求項14】
前記撮像装置は、全方位画像を撮像する撮像装置であり、
前記抽出部は、特定した前記非重複矩形領域に対応する前記画像上の位置と、前記撮像装置が撮像した画像の中心との距離を算出し、当該距離が第1距離よりも大きい場合、前記非重複矩形領域を示す画像を前記正例画像として抽出し、当該距離が前記第1距離以下である場合、前記非重複矩形領域を示す画像を前記正例画像として抽出しないように制御する、
請求項13に記載の画像抽出装置。
【請求項15】
前記抽出部は、算出した前記距離が前記第1距離よりも大きい第2距離よりも小さい場合、前記非重複矩形領域を示す画像を前記正例画像として抽出し、当該距離が前記第2距離以上である場合、前記非重複矩形領域を示す画像を前記正例画像として抽出しないように制御する、
請求項14に記載の画像抽出装置。
【請求項16】
コンピュータが実行する、
所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するステップと、
前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定するステップと、
前記画像における、特定した前記オブジェクトに対応する矩形領域を特定するステップと、
前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域を示す画像を、機械学習における前記オブジェクトの正例を示す正例画像として抽出するステップと、
を備える画像抽出方法。
【請求項17】
コンピュータを、
所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するオブジェクト特定部、
前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定する輪郭領域特定部、
前記画像における、特定した前記オブジェクトに対応する矩形領域を特定する矩形領域特定部、及び、
前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域を示す画像を、機械学習における前記オブジェクトの正例を示す正例画像として抽出する抽出部、
として機能させる画像抽出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像装置が撮像した画像から機械学習に用いるオブジェクトを示す画像を抽出する画像抽出装置、画像抽出方法及び画像抽出プログラムに関する。
【背景技術】
【0002】
従来、店内等の所定エリアを行動する人物の動線を解析するにあたり、所定エリアを撮像した撮像画像から、人物を示すオブジェクトを認識することが行われている。オブジェクトの認識は、例えば、画像の入力に対して、当該画像がオブジェクトを示すか否かを分類する分類器により行われる(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2014-130583号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
所定エリアにおけるオブジェクトの判定精度を高めるためには、オブジェクトを示す多くの画像を用いて分類器に予め学習させる必要がある。このため、所定エリアにおけるオブジェクトを示す画像を効率よく収集することが求められている。また、オブジェクトの正例を示す正例画像には、単一のオブジェクトのみが含まれていることが好ましい。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、機械学習に適した画像を効率よく収集することができる画像抽出装置、画像抽出方法及び画像抽出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る画像抽出装置は、所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するオブジェクト特定部と、前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定する輪郭領域特定部と、前記画像における、特定した前記オブジェクトに対応する矩形領域を特定する矩形領域特定部と、前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域を示す画像を、機械学習における前記オブジェクトの正例を示す正例画像として抽出する抽出部と、を備える。
【0007】
前記矩形領域特定部は、特定した前記オブジェクトの輪郭領域に基づいて、前記矩形領域を特定してもよい。
前記矩形領域特定部は、特定した前記オブジェクトの輪郭領域から、前記オブジェクトの輪郭を構成する点群を近似する矩形として矩形領域を特定してもよい。
前記矩形領域特定部は、前記オブジェクトの輪郭を構成する点群を内包する複数の矩形候補のうち、当該矩形の面積が相対的に小さい矩形領域を前記矩形領域として特定してもよい。
【0008】
前記矩形領域特定部は、前記撮像装置が全方位画像を撮像する撮像装置である場合に、前記輪郭領域に対応する一点と、当該撮像装置が撮像した画像の中心との位置関係に基づいて、基準軸に対する前記矩形領域の回転成分を算出し、当該回転成分を有する矩形領域のうち、面積が相対的に小さい矩形領域を前記オブジェクトに対応する矩形領域として特定してもよい。
【0009】
前記オブジェクト特定部は、前記所定エリアにおける一以上の前記オブジェクトのそれぞれの位置を示す位置情報を取得することにより前記オブジェクトを特定し、前記輪郭領域特定部は、前記所定エリアにおける前記位置情報が示す位置に前記オブジェクトに対応する三次元モデルを仮想的に配置した場合に前記撮像装置が撮像した画像に含まれる前記三次元モデルに対応する輪郭領域を特定してもよい。
【0010】
前記画像抽出装置は、前記撮像装置が撮像する画像における複数の位置のそれぞれと、当該複数の位置のそれぞれに前記三次元モデルを仮想的に配置したときの前記輪郭領域を示す情報とを関連付けた位置別領域情報を記憶する記憶部を備え、前記輪郭領域特定部は、前記位置別領域情報を参照し、前記オブジェクト特定部が取得した位置情報が示す位置に関連付けられている輪郭領域を、当該三次元モデルの輪郭領域と特定してもよい。
【0011】
前記画像抽出装置は、前記三次元モデルを構成する点群を示す点群情報と、前記撮像装置のキャリブレーションに関するパラメータとを記憶する記憶部を備え、前記輪郭領域特定部は、前記記憶部から当該点群情報と当該パラメータとを取得し、前記三次元モデルを仮想的に配置した場合に、当該点群情報が示す点群の少なくとも一部について、当該パラメータに基づいて、前記撮像装置が撮像する画像上への投影点を算出し、当該投影点の点群を近似する多角形領域を、当該三次元モデルの輪郭領域として特定してもよい。
【0012】
前記オブジェクト特定部は、前記撮像装置が撮像した第1画像に含まれる第1オブジェクトを特定するとともに、前記第1画像に含まれる一以上の第2オブジェクトを特定し、前記抽出部は、前記第1オブジェクトに対応する前記矩形領域と、前記一以上の第2オブジェクトのそれぞれに対応する前記輪郭領域との重複率が前記所定値以下である場合、前記第1オブジェクトに対応する前記矩形領域を前記非重複矩形領域に特定してもよい。
【0013】
前記オブジェクト特定部は、前記撮像装置が撮像した第1画像に含まれる前記オブジェクトである第1オブジェクトを特定するとともに、前記第1画像よりも後に撮像された第2画像に含まれる前記オブジェクトである第2オブジェクトを特定し、前記抽出部は、前記第1画像と前記第2画像とを重ねた場合に、前記第1オブジェクトに対応する前記輪郭領域又は前記矩形領域のうち、前記第2オブジェクトに対応する前記輪郭領域又は前記矩形領域との重複率が前記所定値以下の前記非重複矩形領域を特定してもよい。
【0014】
前記矩形領域特定部は、前記画像において、前記オブジェクトに対応しない矩形領域であって、特定した全ての前記オブジェクトの輪郭領域との重複率が所定値以下となる矩形領域である第2矩形領域を特定し、前記抽出部は、前記第2矩形領域を示す画像を、前記機械学習における前記オブジェクトの負例を示す負例画像として抽出してもよい。
【0015】
前記抽出部は、特定した前記非重複矩形領域を示す画像を、入力された画像が前記オブジェクトを示しているか否かを判定する判定器に入力し、前記判定器により、当該画像が前記オブジェクトを示していると判定されると、当該画像を前記正例画像として抽出してもよい。
【0016】
前記抽出部は、特定した前記非重複矩形領域に対応する位置と、前記撮像装置に対応する位置との間の距離を算出し、当該距離に基づいて、前記非重複矩形領域を示す画像を前記正例画像として抽出するか否かを判定してもよい。
【0017】
前記撮像装置は、全方位画像を撮像する撮像装置であり、前記抽出部は、特定した前記非重複矩形領域に対応する位置と、前記撮像装置が撮像した画像の中心との距離を算出し、当該距離が第1距離よりも大きい場合、前記非重複矩形領域を示す画像を前記正例画像として抽出し、当該距離が前記第1距離以下である場合、前記非重複矩形領域を示す画像を前記正例画像として抽出しないように制御してもよい。
【0018】
前記抽出部は、特定した前記非重複矩形領域に対応する位置と、前記撮像装置が撮像した画像の中心との距離を算出し、当該距離が第2距離よりも小さい場合、前記非重複矩形領域を示す画像を前記正例画像として抽出し、当該距離が前記第2距離以上である場合、前記非重複矩形領域を示す画像を前記正例画像として抽出しないように制御してもよい。
【0019】
本発明の第2の態様に係る画像抽出方法は、コンピュータが実行する、所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するステップと、前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定するステップと、前記画像における、特定した前記オブジェクトに対応する矩形領域を特定するステップと、前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域を示す画像を、機械学習における前記オブジェクトの正例を示す正例画像として抽出するステップと、を備える。
【0020】
本発明の第3の態様に係る画像抽出プログラムは、コンピュータを、所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定するオブジェクト特定部、前記画像における、特定した前記オブジェクトの輪郭を示す輪郭領域を特定する輪郭領域特定部、前記画像における、特定した前記オブジェクトに対応する矩形領域を特定する矩形領域特定部、及び、前記矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する前記輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した前記非重複矩形領域を示す画像を、機械学習における前記オブジェクトの正例を示す正例画像として抽出する抽出部、として機能させる。
【発明の効果】
【0021】
本発明によれば、機械学習に適した画像を効率よく収集することができるという効果を奏する。
【図面の簡単な説明】
【0022】
図1】第1実施形態に係る画像抽出装置の概要を示す図である。
図2】第1実施形態に係る画像抽出装置の構成を示す図である。
図3】第1実施形態に係る画像抽出装置における処理の流れを示すフローチャートである。
図4】撮像時刻が最も古い画像が表示部に表示された例を示す図である。
図5図4に示す画像から特定されたオブジェクトの位置に配置された三次元モデルの輪郭領域を示す図である。
図6図5に示す複数の三次元モデルの輪郭領域のそれぞれに対して特定された矩形領域を示す図である。
図7】撮像装置が撮像した画像から、非重複矩形領域に対応する画像を正例画像として抽出する例を示す図である。
図8図6に示す例に対して第2矩形領域が特定された例を示す図である。
【発明を実施するための形態】
【0023】
<第1実施形態>
[画像抽出装置1の概要]
図1は、第1実施形態に係る画像抽出装置1の概要を示す図である。画像抽出装置1は、撮像装置が撮像した画像から機械学習に用いるオブジェクトを示す画像を抽出するコンピュータである。
【0024】
画像抽出装置1は、所定エリアを撮像する1台の撮像装置が撮像した動画と、当該動画に基づいて生成された、所定エリアを移動する所定の属性のオブジェクトの移動の軌跡を示す一以上の動線情報とを取得する(図1の(1))。ここで、所定エリアは、例えば店舗内の空間であり、所定の属性は、例えば、オブジェクトを検出する対象を示す属性である。所定の属性のオブジェクトは、例えば、所定エリア内を行動する店員である。
【0025】
画像抽出装置1は、一以上の動線情報に基づいて、所定時刻における一以上のオブジェクトの位置に対応し、当該オブジェクトに対応する三次元モデルを、所定エリアを示す三次元空間に仮想的に配置する(図1の(2))。画像抽出装置1は、撮像装置が撮像した画像Pに当該三次元モデルが投影されるときの、当該三次元モデルの輪郭を示す輪郭領域をオブジェクトの輪郭領域として特定するとともに、当該三次元モデルを囲む矩形領域をオブジェクトの矩形領域として特定する(図1の(3))。
【0026】
画像抽出装置1は、特定した矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する輪郭領域と重複していない矩形領域を、非重複矩形領域として特定する。例えば、図1に示す例では、オブジェクトO1に対応する矩形領域は、他のオブジェクトO2、O3の輪郭と重複しておらず、非重複矩形領域である。また、オブジェクトO2に対応する矩形領域は、他のオブジェクトO3の輪郭と重複しているので、非重複矩形領域ではない。
【0027】
画像抽出装置1は、動画を構成する複数の画像のうち、所定時刻における画像における非重複矩形領域に対応する画像を、入力された画像がオブジェクトであるか否かを判定する判定器の機械学習におけるオブジェクトの正例を示す正例画像として抽出する(図1の(4))。このようにすることで、画像抽出装置1は、機械学習に適した画像を効率よく収集することができる。
【0028】
[画像抽出装置1の構成]
続いて、画像抽出装置1の構成を説明する。図2は、第1実施形態に係る画像抽出装置1の構成を示す図である。図2に示すように、画像抽出装置1は、入力部11と、表示部12と、記憶部13と、制御部14とを備える。なお、表示部12については、オブジェクト特定部142で、画像上でのユーザの指定操作を受け付ける場合には必要になるが、受け付けない場合は不要である。
【0029】
入力部11は、例えば、マウスやキーボードである。入力部11は、画像抽出装置1のユーザから操作入力を受け付ける。
表示部12は、例えば、液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ等により構成される。表示部12は、制御部14の制御に応じて各種情報を表示する。
【0030】
記憶部13は、ROM(Read Only Memory)及びRAM(Random Access Memory)等を含む記憶媒体である。記憶部13は、制御部14が実行するプログラムを記憶している。例えば、記憶部13は、画像抽出装置1を、取得部141、オブジェクト特定部142、輪郭領域特定部143、矩形領域特定部144、及び抽出部145として機能させる画像抽出プログラムを記憶している。
【0031】
制御部14は、例えばCPU(Central Processing Unit)である。制御部14は、記憶部13に記憶された画像抽出プログラムを実行することにより、取得部141、オブジェクト特定部142、輪郭領域特定部143、矩形領域特定部144、及び抽出部145として機能する。
【0032】
以下、画像抽出装置1における処理の流れを参照しながら、取得部141、オブジェクト特定部142、輪郭領域特定部143、矩形領域特定部144、及び抽出部145の詳細について説明する。図3は、第1実施形態に係る画像抽出装置1に係る処理の流れを示すフローチャートである。
【0033】
まず、取得部141は、所定エリアを撮像する撮像装置が撮像した動画と、当該動画に基づいて生成されたオブジェクトの移動の軌跡を示す一以上の動線情報とを取得する(S1)。
【0034】
動画は、撮像装置が撮像した複数の画像を含んで構成されている。複数の画像のそれぞれには、画像の撮像時刻が関連付けられている。動線情報は、時刻と、当該時刻におけるオブジェクトの所定エリア内の位置を示す位置情報とを関連付けた情報である。動線情報に含まれている時刻は、動画に含まれている複数の画像に関連付けられている複数の撮像時刻のいずれかに対応しているものとする。なお、第1実施形態における取得部141は、必ずしも複数の時刻に関連付けられた情報を取得する必要はなく、特定の時刻における画像と、その時刻におけるオブジェクトの位置を示す情報とを取得しても良い。
【0035】
続いて、オブジェクト特定部142は、動画に含まれている複数の画像の中から未選択の画像を特定する。オブジェクト特定部142は、未選択の画像のうち、撮像時刻が最も古い画像を選択する(S2)。
【0036】
続いて、オブジェクト特定部142は、本フローチャートにおいて初めて画像を選択したか否かを判定する(S3)。オブジェクト特定部142は、初めて画像を選択したと判定すると、S4に処理を移し、初めて画像が選択したものではないと判定すると、S6に処理を移す。
【0037】
続いて、オブジェクト特定部142は、所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性のオブジェクトを特定する(S4、S6)。例えば、オブジェクト特定部142は、所定エリアを撮像する撮像装置が撮像した第1画像に含まれる第1オブジェクトを特定するとともに、当該第1画像に含まれる一以上の第2オブジェクトを特定する。
【0038】
具体的には、オブジェクト特定部142は、S3における判定がYESの場合、すなわち、初めて画像を選択した場合、選択されている画像から一以上のオブジェクトを特定する(S4)。
【0039】
より具体的には、オブジェクト特定部142は、S2において選択された画像、すなわち、撮像装置が撮像した動画に含まれる複数の画像のうち、撮像時刻が最も古い画像を特定する。オブジェクト特定部142は、当該画像に対応する撮像時刻を含む一以上の動線情報を特定する。そして、オブジェクト特定部142は、特定した一以上の動線情報のそれぞれに対応するオブジェクトを特定する。
【0040】
なお、オブジェクト特定部142は、ユーザから、オブジェクトを特定するための動線情報の選択を受け付けてもよい。そして、オブジェクト特定部142は、選択された動線情報に対応するオブジェクトを特定してもよい。
【0041】
また、オブジェクト特定部142は、S2において選択された画像、すなわち、撮像装置が撮像した動画に含まれる複数の画像のうち、撮像時刻が最も古い画像を表示部12に表示させ、当該画像からユーザの操作によってオブジェクトを特定してもよい。この場合、オブジェクト特定部142は、ユーザから、表示部12に表示されている画像に含まれる1以上のオブジェクトのそれぞれを囲う矩形領域の設定操作を受け付けることにより、オブジェクトの位置を示す情報の入力を受け付ける。ここで、矩形領域は、例えば画像に対して予め定められた基準軸に対して二辺が平行する矩形である直立矩形領域である。
【0042】
図4は、撮像時刻が最も古い画像Pが表示部12に表示された例を示す図である。図4(a)は、最も古い画像Pを示す図であり、図4(b)は、ユーザが画像Pからオブジェクトを囲う矩形領域を設定した後の例を示す図である。図4(a)には、オブジェクトO1~O3が表示されていることが確認できる。また、図4(b)に示すように、ユーザの設定操作により、オブジェクトO1~O3に対して矩形領域R1~R3が設定されていることが確認できる。
【0043】
なお、オブジェクト特定部142は、撮像時刻が最も古い画像Pに対して、ユーザからオブジェクトを特定することとしたが、これに限らない。例えば、オブジェクト特定部142は、選択された画像に対応する撮像時刻を開始時刻とする動線情報が存在する場合に、当該動線情報に対応するオブジェクトを特定したり、当該開始時刻に対応する画像を表示部12に表示させて、ユーザからオブジェクトの指定を受け付けたりしてもよい。
【0044】
ここで、図4に示す例では、オブジェクト特定部142は、オブジェクトO1~O3のそれぞれに対応する動線情報を特定しているものとする。
【0045】
続いて、オブジェクト特定部142は、一以上のオブジェクトのそれぞれに対応する動線情報に基づいて、所定エリアにおける一以上のオブジェクトのそれぞれの位置を示す位置情報を取得することにより一以上のオブジェクトの位置を特定する(S5)。オブジェクト特定部142は、S4において特定された動線情報を参照し、選択されている画像の撮像時刻と同じ時刻に関連付けられている位置情報を取得することにより、一以上のオブジェクトのそれぞれの位置を特定する。
【0046】
オブジェクト特定部142は、S3における判定がNOの場合、すなわち、初めて画像が選択されたものではない場合、S5と同様に、特定されている動線情報に基づいて所定エリアにおける一以上のオブジェクトのそれぞれの位置を示す位置情報を取得することにより一以上のオブジェクトを特定する(S6)。
【0047】
続いて、輪郭領域特定部143は、特定したオブジェクトの輪郭を示す輪郭領域を特定する(S7)。具体的には、輪郭領域特定部143は、S5又はS6において特定された位置情報が示す所定エリア上の位置に、オブジェクトに対応する三次元モデルを仮想的に配置した場合に、撮像装置が撮像した画像に含まれる三次元モデルに対応する輪郭領域を算出する。そして、輪郭領域特定部143は、算出した輪郭領域を、オブジェクトの輪郭領域として特定する。
【0048】
より具体的には、記憶部13には、撮像装置が撮像する画像における複数の位置を示す位置情報のそれぞれと、当該複数の位置のそれぞれに三次元モデルを仮想的に配置したときの輪郭領域を示す情報とを関連付けた位置別領域情報を予め記憶する。そして、輪郭領域特定部143は、記憶部13に記憶されている位置別領域情報を参照し、オブジェクト特定部142が特定した位置情報が示す位置に関連付けられている輪郭領域を、仮想的に配置した三次元モデルの輪郭領域として特定してもよい。このようにすることで、画像抽出装置1は、選択された画像の解析を行うことなく、高速にオブジェクトの輪郭領域を特定することができる。
【0049】
なお、輪郭領域特定部143は、位置別領域情報に基づいて三次元モデルの輪郭領域を特定せずに、三次元モデルを構成する点群に基づいて、三次元モデルの輪郭領域を特定してもよい。この場合、例えば、記憶部13に、三次元モデルを構成する点群を示す点群情報を記憶させておくとともに、撮像装置により撮像された画像の歪みを補正するための撮像装置のキャリブレーションに関するパラメータを記憶させておく。ここで、三次元モデルを構成する点群を構成する複数の点のそれぞれは、三次元空間における座標により表現される。また、パラメータには、撮像装置の設置位置及び設置方向によって定まる外部パラメータと、撮像装置の画像歪みに関する内部パラメータとが含まれる。
【0050】
そして、輪郭領域特定部143は、記憶部13から当該点群情報と当該パラメータとを取得し、特定された所定エリア上の位置に三次元モデルを仮想的に配置した場合に、当該点群情報が示す点群の少なくとも一部について、当該パラメータに基づいて、撮像装置が撮像する画像上への投影点を算出する。そして、輪郭領域特定部143は、当該投影点の点群を含む領域の輪郭を近似する多角形領域を、当該三次元モデルの輪郭領域として特定する。このようにすることで、画像抽出装置1は、複数の点群の画像上への投影点の算出に基づいて、精度良く三次元モデルの輪郭領域を特定することができる。
【0051】
図5は、図4に示す画像Pから特定されたオブジェクトO1~O3の位置に配置された三次元モデルの輪郭領域を示す図である。なお、図5に示す輪郭領域は画像に実際に描かれるものではなく、輪郭領域特定部143により算出されるものである。図5に示す例では、オブジェクトO1~O3のそれぞれに対応して輪郭領域OL1~OL3が算出されたことが確認できる。
【0052】
続いて、矩形領域特定部144は、S7において特定したオブジェクトの輪郭に基づいて、当該オブジェクトに対応する矩形領域を特定する(S8)。具体的には、矩形領域特定部144は、特定したオブジェクトの輪郭領域から、オブジェクトの輪郭を構成する点群を近似する矩形として、矩形領域を特定する。
【0053】
より具体的には、矩形領域特定部144は、オブジェクトの輪郭を構成する点群を内包する複数の矩形候補のうち、当該矩形の面積が相対的に小さい矩形領域を矩形領域として特定する。例えば、矩形領域として、直立矩形領域を特定する場合、点群を内包する直立矩形として、大きさが異なる複数の直立矩形の候補が考えられる。矩形領域特定部144は、複数の直立矩形の候補のうち、矩形の面積が最小となる直立矩形を、オブジェクトに対応する矩形領域として特定する。直立矩形に限定するものではなく、矩形の面積が最小となる回転矩形を特定しても良い。
【0054】
図6は、図5に示す複数の三次元モデルの輪郭領域のそれぞれに対して特定された矩形領域を示す図である。なお、図6に示す矩形領域は画像に実際に描かれるものではなく、矩形領域特定部144により算出されるものである。図6に示す例では、輪郭領域OL1~OL3に対して矩形領域UR1~UR3が算出されたことが確認できる。
【0055】
なお、矩形領域特定部144は、オブジェクトに対応する矩形領域として、直立矩形を特定することとしたが、これに限らない。全方位画像に投影されるオブジェクトである人物は、画像の中心からオブジェクトの位置に向かう方向に伸びるように投影されることから、矩形領域特定部144は、当該方向に対して二辺が平行する矩形領域を特定してもよい。
【0056】
例えば、矩形領域特定部144は、輪郭領域に対応する一点と、当該撮像装置が撮像した全方位画像の中心との位置関係に基づいて、当該画像に対して予め定められた基準軸に対する矩形領域の回転成分を算出してもよい。そして、矩形領域特定部144は、基準軸に対して算出した回転成分を有する回転矩形領域のうち、面積が相対的に小さい矩形領域を、オブジェクトに対応する矩形領域として特定してもよい。ここで、全方位画像の中心は、例えば、画像の中心点であるものとするが、これに限らず、画像の中心近傍点であってもよい。また、輪郭領域に対応する一点は、例えば、輪郭領域の中心点であるものとするが、これに限らず、輪郭領域の中心近傍点であってもよい。このようにすることで、画像抽出装置1は、全方位画像においてオブジェクト(人物)の足元位置が矩形領域の一辺に対応するように矩形領域を特定することができる。
【0057】
続いて、抽出部145は、一以上のオブジェクトのそれぞれに対して特定した矩形領域のうち、他のオブジェクトと重複しない矩形領域を示す非重複矩形領域を特定する。例えば、抽出部145は、第1オブジェクトに対応する矩形領域と、一以上の第2オブジェクトのそれぞれに対応する輪郭領域との重複率が所定値以下である場合、第1オブジェクトに対応する矩形領域を非重複矩形領域に特定する。そして、抽出部145は、特定した非重複矩形領域を示す画像を、機械学習における前記オブジェクトの正例を示す正例画像として抽出する(S9~S11)。
【0058】
以下に、抽出部145が正例画像を抽出するまでの処理の例について説明する。まず、抽出部145は、一以上のオブジェクトのそれぞれに対して特定した矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する輪郭領域との重複率を算出する(S9)。具体的には、抽出部145は、オブジェクトに対して特定した矩形領域と、当該オブジェクトとは異なる他のオブジェクトのそれぞれに対応する輪郭領域のそれぞれとの重複率を算出する。
【0059】
図6に示す例では、抽出部145は、オブジェクトO1に対応する矩形領域UR1について、オブジェクトO2に対応する輪郭領域OL2との重複率を算出するとともに、オブジェクトO3に対応する輪郭領域OL3との重複率を算出する。同様に、抽出部145は、オブジェクトO2に対応する矩形領域UR2について、輪郭領域OL1との重複率を算出するとともに、輪郭領域OL3との重複率を算出する。また、抽出部145は、オブジェクトO3に対応する矩形領域UR3について、輪郭領域OL1との重複率を算出するとともに、輪郭領域OL2との重複率を算出する。
【0060】
続いて、抽出部145は、算出した重複率が、所定値以下の矩形領域を示す非重複矩形領域を特定する(S10)。例えば、図6に示す例において、所定値が0である場合、抽出部145は、いずれの輪郭領域とも重なっていない矩形領域UR3を、非重複矩形領域として特定する。
【0061】
続いて、抽出部145は、特定した非重複矩形領域を示す画像を、オブジェクトを判定する判定器の機械学習におけるオブジェクトの正例を示す正例画像として抽出する(S11)。具体的には、抽出部145は、S2において選択した画像から、S10において特定した非重複矩形領域に対応する画像を正例画像として抽出し、抽出した正例画像を、正例を示すラベルと関連付けて記憶部13に記憶させる。
【0062】
図7は、撮像装置が撮像した画像から、非重複矩形領域に対応する画像を正例画像として抽出する例を示す図である。図7に示す画像Pは、図4(a)に示す画像Pと同じ画像である。図7に示すように、画像Pから、非重複矩形領域としての矩形領域UR3に含まれる画像が正例画像PEとして抽出されていることが確認できる。
【0063】
なお、抽出部145は、特定した非重複矩形領域に対応する位置と、撮像装置に対応する位置との間の距離を算出し、当該距離に基づいて、非重複矩形領域を示す画像を正例画像として抽出するか否かを判定してもよい。
【0064】
具体的には、抽出部145は、非重複矩形領域に対応する位置と、撮像装置が撮像した画像の中心との距離を算出してもよい。この場合において、非重複矩形領域に対応する位置は、非重複矩形領域の中心位置である。そして、抽出部145は、算出した距離が、予め定められた第1距離よりも大きい場合、非重複矩形領域を示す画像を正例画像として抽出し、当該距離が第1距離以下である場合、非重複矩形領域を示す画像を正例画像として抽出しないように制御することにより、画像の中心に近い非重複矩形領域を正例画像として抽出しないようにしてもよい。
【0065】
撮像装置が撮像する画像が全方位画像である場合、画像の中心に近い非重複矩形領域に含まれるオブジェクトを示す画像は、オブジェクトを真上に近い位置から撮像したものとなり、オブジェクトの特定精度が低くなる。画像抽出装置1は、このようにオブジェクトを真上に近い位置から撮像した画像を正例画像として抽出しないようにすることで、分類器の精度が低下することを抑制することができる。
【0066】
また、抽出部145は、非重複矩形領域に対応する位置と、撮像装置が撮像した画像の中心との距離が、予め定められた第2距離よりも小さい場合、非重複矩形領域を示す画像を正例画像として抽出し、当該距離が第2距離以上である場合、非重複矩形領域を示す画像を正例画像として抽出しないように制御することにより、画像の中心から離れすぎている非重複矩形領域を正例画像として抽出しないようにしてもよい。
【0067】
画像の中心から遠い非重複矩形領域に含まれるオブジェクトを示す画像は、オブジェクトが小さく投影されるので、オブジェクトの特定精度が低くなる。画像抽出装置1は、画像の中心から離れすぎているオブジェクトの画像を正例画像として抽出しないようにすることで、分類器の精度が低下することを抑制することができる。
【0068】
また、抽出部145は、入力された画像が前記オブジェクトを示しているか否かを判定する判定器に、非重複矩形領域を示す画像を入力し、判定器により当該非重複矩形領域を示す画像がオブジェクトを示していると判定されると、当該画像を正例画像として抽出するようにしてもよい。この場合において、判定器は、記憶部13に記憶されていてもよいし、画像抽出装置1がアクセス可能な外部装置に記憶されていてもよい。判定器の判定結果に基づいて正例画像を抽出することにより、オブジェクトではない画像を正例画像から除外することができる。
【0069】
続いて、オブジェクト特定部142は、動画に含まれている全ての画像を選択したか否かを判定する(S12)。オブジェクト特定部142は、全ての画像を選択したと判定すると、本フローチャートにおける処理を終了し、全ての画像を選択していないと判定すると、S2に処理を移す。
【0070】
なお、本フローチャートにおいて、矩形領域特定部144が、オブジェクトに対応する矩形領域を特定し、抽出部145が、当該矩形領域のうち、他のオブジェクトの輪郭領域と重なっていない矩形領域としての非重複矩形領域を正例画像として抽出したが、これに限らない。
【0071】
矩形領域特定部144は、撮像部が撮像した画像において、オブジェクトに対応しない矩形領域であって、特定された一以上のオブジェクトの輪郭領域の全てとの重複率が所定値以下となる第2矩形領域を特定してもよい。ここで、矩形領域特定部144は、1つの画像に対して複数の第2矩形領域を特定してもよい。また、第2矩形領域の大きさは、第2矩形領域の位置に三次元モデルを配置したときの当該三次元モデルの輪郭領域を囲む最小の矩形領域の大きさであることとしてもよい。
【0072】
図8は、図6に示す例に対して第2矩形領域が特定された例を示す図である。図8に示す例では、図6に示される矩形領域UR1~UR3に加えて、第2矩形領域UR4が特定されていることが確認できる。
【0073】
そして、抽出部145は、第2矩形領域を示す画像を、機械学習におけるオブジェクトの負例を示す負例画像として抽出してもよい。このようにすることで、画像抽出装置1は、負例画像についても自動的に収集することができる。
【0074】
[第1実施形態における効果]
以上説明したように、第1実施形態に係る画像抽出装置1は、所定エリアを撮像する撮像装置が撮像した画像に含まれる所定の属性の一以上のオブジェクトを特定し、当該画像における、特定したオブジェクトの輪郭を示す輪郭領域と、特定したオブジェクトに対応する矩形領域とを特定する。画像抽出装置1は、特定した矩形領域のうち、当該矩形領域に囲まれているオブジェクトとは異なる他のオブジェクトに対応する輪郭領域との重複率が所定値以下の矩形領域を示す非重複矩形領域を特定し、特定した非重複矩形領域を示す画像を、機械学習におけるオブジェクトの正例を示す正例画像として抽出する。このようにすることで、画像抽出装置1は、機械学習に適した画像を効率よく収集することができる。
【0075】
<第2実施形態>
[撮像時刻が異なる複数の画像に基づいて正例画像を抽出する]
続いて、第2実施形態について説明する。第1実施形態に係る画像抽出装置1は、動線情報に対応するオブジェクトが着席等により長時間にわたって移動していない場合に、同等の画像が正例画像として抽出されてしまう。そこで、第2実施形態に係る画像抽出装置1は、撮像時刻が異なる複数の画像に基づいて、同等の画像が正例画像として抽出されないようにする点で第1実施形態と異なる。以下に、第2実施形態に係る画像抽出装置1について説明する。なお、第1実施形態と同じ部分については適宜説明を省略する。
【0076】
第2実施形態において、オブジェクト特定部142は、撮像装置が撮像した第1画像に含まれるオブジェクトである第1オブジェクトを特定するとともに、第1画像よりも後に撮像された第2画像に含まれるオブジェクトである第2オブジェクトを特定する。ここで、第2画像は、第1画像よりも後に撮像された複数の画像であってもよい。また、第1オブジェクトと、第2オブジェクトは、同一の動線情報から特定されたオブジェクトとしてもよい。
【0077】
輪郭領域特定部143は、第1画像において特定された第1オブジェクトの輪郭を示す輪郭領域を特定し、矩形領域特定部144は、当該第1オブジェクトに対応する矩形領域を特定する。
【0078】
また、輪郭領域特定部143は、第2画像において特定された第2オブジェクトの輪郭を示す輪郭領域を特定し、矩形領域特定部144は、当該第2オブジェクトに対応する矩形領域を特定する。
【0079】
抽出部145は、第1画像と、1以上の第2画像とを重ねた場合に、第1オブジェクトに対応する輪郭領域又は矩形領域のうち、1以上の第2オブジェクトのそれぞれに対応する輪郭領域又は矩形領域との重複率が所定値以下の矩形領域を、非重複矩形領域として特定する。そして、抽出部145は、第1画像において、非重複矩形領域を示す画像を、機械学習におけるオブジェクトの正例を示す正例画像として抽出する。
【0080】
[第2実施形態における効果]
以上説明したように、第2実施形態に係る画像抽出装置1は、第1画像と、第1画像よりも後に撮像された第2画像とを重ねた場合に、第1画像に含まれる第1オブジェクトに対応する輪郭領域又は矩形領域のうち、第2画像に含まれる第2オブジェクトに対応する輪郭領域又は矩形領域との重複率が所定値以下の非重複矩形領域を特定し、非重複矩形領域を示す画像を、機械学習におけるオブジェクトの正例を示す正例画像として抽出する。
【0081】
このようにすることで、画像抽出装置1は、時間が経過しても動かないオブジェクトに対応する複数の撮像時刻における画像から、当該オブジェクトに対応する画像が正例画像として抽出されることを抑制することができる。
【0082】
以上、本発明を実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。例えば、上述の実施形態では、撮像装置が撮像する画像が全方位画像であることとしたが、これに限らず、全方位画像ではない画像であってもよい。
【0083】
また、上述の実施形態では、画像抽出装置1が初めて画像を選択していない場合に、動線情報に基づいてオブジェクトの位置を特定したが、これに限らない。画像抽出装置1が選択した全ての画像において、ユーザの指定によりオブジェクトの位置を特定してもよい。
【0084】
また、上述の実施形態では、撮像装置が1台であることとして説明を行ったが、これに限らず、撮像装置が所定エリアに複数台設けられていてもよい。この場合、画像抽出装置1は、第1の撮像装置が撮像した画像に基づいて特定した一以上のオブジェクトに対応する一以上の動線情報に基づいて、第2の撮像装置が示す画像に対応する当該オブジェクトの正例画像を抽出する。
【0085】
具体的には、画像抽出装置1は、当該一以上の動線情報に含まれる位置に一以上の三次元モデルが仮想的に配置された場合における、第2の撮像装置が示す画像における当該一以上の三次元モデルに対応する輪郭領域及び矩形領域を、一以上のオブジェクトに対応する輪郭領域及び矩形領域として特定する。そして、画像抽出装置1は、特定した一以上のオブジェクトに対応する輪郭領域及び矩形領域に基づいて、非重複矩形領域を特定し、第2の撮像装置が示す画像における当該矩形領域に対応する画像を、正例画像として抽出する。
【0086】
また、特に、装置の分散・統合の具体的な実施形態は以上に図示するものに限られず、その全部又は一部について、種々の付加等に応じて、又は、機能負荷に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
【符号の説明】
【0087】
1・・・画像抽出装置、11・・・入力部、12・・・表示部、13・・・記憶部、14・・・制御部、141・・・取得部、142・・・オブジェクト特定部、143・・・輪郭領域特定部、144・・・矩形領域特定部、145・・・抽出部
図1
図2
図3
図4
図5
図6
図7
図8