(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-17
(45)【発行日】2022-01-17
(54)【発明の名称】特定装置、特定方法及び特定プログラム
(51)【国際特許分類】
G06T 7/70 20170101AFI20220106BHJP
【FI】
G06T7/70 Z
(21)【出願番号】P 2018142822
(22)【出願日】2018-07-30
【審査請求日】2020-06-26
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100166006
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100124084
【氏名又は名称】黒岩 久人
(74)【代理人】
【識別番号】100153280
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】巻渕 有哉
【審査官】佐藤 実
(56)【参考文献】
【文献】特開2018-036848(JP,A)
【文献】国際公開第2011/046128(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/70
(57)【特許請求の範囲】
【請求項1】
所定エリアを
、前記所定エリアに存在する所定のオブジェクトよりも上方の位置から撮像する撮像装置が撮像した画像を取得する取得部と、
前記取得部が取得した第1画像に含まれる
前記所定のオブジェクト
であって、実空間を移動中の前記オブジェクトの実空間における向きが当該オブジェクトの実空間における移動方向と同一である前記所定のオブジェクトを特定するオブジェクト特定部と、
前記取得部が取得した前記第1画像に対応する第1時刻における前記所定のオブジェクトの
前記画像の座標系に対応する位置を示す第1位置と、当該第1時刻
よりも前の第2時刻における前記所定のオブジェクトの
前記座標系に対応する位置を示す第2位置とを特定するオブジェクト位置特定部と、
前記撮像装置が撮像した画像の平面である画像平面を仮想的に延長した平面と、前記撮像装置の光学中心から前記所定エリアに降ろした垂線との交点の、当該平面上への投影点を前記座標系における基準点とし、前記第1位置から前記基準点の位置に向かう方向を基準方向と特定し、前記オブジェクト位置特定部が特定した
前記第2位置から前記第1位置
に向かう方向を前記所定のオブジェクトの移動方向と特定し、特定した移動方向と前記基準方向とがなす角度に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するオブジェクト向き特定部と、
を備える特定装置。
【請求項2】
所定エリアを、前記所定エリアに存在する所定のオブジェクトよりも上方の位置から撮像する撮像装置が撮像した画像を取得する取得部と、
前記取得部が取得した第1画像に含まれる前記所定のオブジェクトであって、実空間を移動中の前記オブジェクトの実空間における向きが当該オブジェクトの実空間における移動方向と同一である前記所定のオブジェクトを特定するオブジェクト特定部と、
前記取得部が取得した前記第1画像に対応する第1時刻における前記所定のオブジェクトの前記画像の座標系に対応する位置を示す第1位置と、当該第1時刻よりも後の第2時刻における前記所定のオブジェクトの前記座標系に対応する位置を示す第2位置とを特定するオブジェクト位置特定部と、
前記撮像装置が撮像した画像の平面である画像平面を仮想的に延長した平面と、前記撮像装置の光学中心から前記所定エリアに降ろした垂線との交点の、当該平面上への投影点を前記座標系における基準点とし、前記第1位置から前記基準点の位置に向かう方向を基準方向と特定し、前記オブジェクト位置特定部が特定した前記第1位置から前記第2位置に向かう方向を前記所定のオブジェクトの移動方向と特定し、特定した移動方向と前記基準方向とがなす角度に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するオブジェクト向き特定部と、
を備える特定装置。
【請求項3】
前記取得部は、前記所定のオブジェクトの時刻ごとの位置を示す動線情報を取得し、
前記オブジェクト位置特定部は、前記取得部が取得した前記第1画像に基づいて前記第1時刻における前記所定のオブジェクトの位置を示す前記第1位置を特定し、前記動線情報に基づいて、前記第1時刻とは異なる時刻である前記第2時刻における前記所定のオブジェクトの位置を示す第2位置を特定する、
請求項1
又は2に記載の特定装置。
【請求項4】
前記オブジェクト位置特定部は、前記取得部が取得した前記第1画像に基づいて前記第1時刻における前記所定のオブジェクトの位置を示す前記第1位置を特定し、前記取得部が取得した前記第2時刻に撮像された第2画像に基づいて、前記第2時刻における前記所定のオブジェクトの位置を示す第2位置を特定する、
請求項1
又は2に記載の特定装置。
【請求項5】
前記オブジェクト位置特定部は、前記第1位置から所定距離以上離れたオブジェクトの位置を前記第2位置として特定する、
請求項1から
4のいずれか1項に記載の特定装置。
【請求項6】
複数の角度範囲のそれぞれに、1つの前記オブジェクトの向きが関連付けられており、
前記オブジェクト向き特定部は、前記所定のオブジェクトの向きを、前記角度が含まれる前記角度範囲に関連付けられている1つの前記オブジェクトの向きに特定する、
請求項
1から
5のいずれか1項に記載の特定装置。
【請求項7】
前記オブジェクト位置特定部は、前記取得部が取得した第1画像に関連する3つ以上の時刻のそれぞれにおける前記所定のオブジェクトの位置を特定し、
前記オブジェクト向き特定部は、特定された3つ以上の時刻のそれぞれについて、当該時刻における前記所定のオブジェクトの位置に基づいて前記オブジェクトの移動方向を特定し、特定された3つ以上の時刻のそれぞれにおける前記オブジェクトの移動方向に基づいて前記所定のオブジェクトの向きを特定する、
請求項
1から
6のいずれか1項に記載の特定装置。
【請求項8】
複数の角度範囲のそれぞれに、1つの前記オブジェクトの向きが関連付けられており、
前記オブジェクト向き特定部は、特定された3つ以上の時刻のそれぞれについて、当該時刻のそれぞれに対応する角度が含まれる前記角度範囲に関連付けられている1つの前記オブジェクトの向きを特定し、特定されたオブジェクトの向きが含まれる割合に基づいて、前記所定のオブジェクトの向きを特定する、
請求項
7に記載の特定装置。
【請求項9】
前記所定のオブジェクトの前記第1画像中の領域を特定するオブジェクト領域特定部と、
前記オブジェクト領域特定部が特定した領域が示す画像と、前記オブジェクト向き特定部が特定した前記向きを示す向き情報とを、機械学習における学習データとして抽出する抽出部とをさらに備える、
請求項1から
8のいずれか1項に記載の特定装置。
【請求項10】
前記抽出部は、前記角度が所定の範囲外に存在する場合、学習データを抽出しないように制御する、
請求項
9に記載の特定装置。
【請求項11】
前記抽出部は、前記第1位置と、前
記基準点との距離が所定値未満である場合に、学習データを抽出しないように制御する、
請求項
9又は
10に記載の特定装置。
【請求項12】
コンピュータが実行する、
所定エリアを
、前記所定エリアに存在する所定のオブジェクトよりも上方の位置から撮像する撮像装置が撮像した画像を取得するステップと、
前記取得するステップにおいて取得された第1画像に含まれる
前記所定のオブジェクト
であって、実空間を移動中の前記オブジェクトの実空間における向きが当該オブジェクトの実空間における移動方向と同一である前記所定のオブジェクトを特定するステップと、
前記取得するステップにおいて取得された前記第1画像に対応する第1時刻における前記所定のオブジェクトの
前記画像の座標系に対応する位置を示す第1位置と、当該第1時刻
よりも前の第2時刻における前記所定のオブジェクトの
前記座標系に対応する位置を示す第2位置とを特定するステップと、
前記撮像装置が撮像した画像の平面である画像平面を仮想的に延長した平面と、前記撮像装置の光学中心から前記所定エリアに降ろした垂線との交点の、当該平面上への投影点を前記座標系における基準点とし、前記第1位置から前記基準点の位置に向かう方向を基準方向と特定するステップと、
特定された
前記第2位置から前記第1位置
に向かう方向を前記所定のオブジェクトの移動方向と特定し、特定した移動方向と前記基準方向とがなす角度に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するステップと、
を備える特定方法。
【請求項13】
コンピュータが実行する、
所定エリアを、前記所定エリアに存在する所定のオブジェクトよりも上方の位置から撮像する撮像装置が撮像した画像を取得するステップと、
前記取得するステップにおいて取得された第1画像に含まれる前記所定のオブジェクトであって、実空間を移動中の前記オブジェクトの実空間における向きが当該オブジェクトの実空間における移動方向と同一である前記所定のオブジェクトを特定するステップと、
前記取得するステップにおいて取得された前記第1画像に対応する第1時刻における前記所定のオブジェクトの前記画像の座標系に対応する位置を示す第1位置と、当該第1時刻よりも後の第2時刻における前記所定のオブジェクトの前記座標系に対応する位置を示す第2位置とを特定するステップと、
前記撮像装置が撮像した画像の平面である画像平面を仮想的に延長した平面と、前記撮像装置の光学中心から前記所定エリアに降ろした垂線との交点の、当該平面上への投影点を前記座標系における基準点とし、前記第1位置から前記基準点の位置に向かう方向を基準方向と特定するステップと、
特定された前記第1位置から前記第2位置に向かう方向を前記所定のオブジェクトの移動方向と特定し、特定した移動方向と前記基準方向とがなす角度に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するステップと、
を備える特定方法。
【請求項14】
コンピュータを、
所定エリアを
、前記所定エリアに存在する所定のオブジェクトよりも上方の位置から撮像する撮像装置が撮像した画像を取得する取得部、
前記取得部が取得した第1画像に含まれる
前記所定のオブジェクト
であって、実空間を移動中の前記オブジェクトの実空間における向きが当該オブジェクトの実空間における移動方向と同一である前記所定のオブジェクトを特定するオブジェクト特定部、
前記取得部が取得した前記第1画像に対応する第1時刻における前記所定のオブジェクトの
前記画像の座標系に対応する位置を示す第1位置と、当該第1時刻
よりも前の第2時刻における前記所定のオブジェクトの
前記座標系に対応する位置を示す第2位置とを特定するオブジェクト位置特定部、及び、
前記撮像装置が撮像した画像の平面である画像平面を仮想的に延長した平面と、前記撮像装置の光学中心から前記所定エリアに降ろした垂線との交点の、当該平面上への投影点を前記座標系における基準点とし、前記第1位置から前記基準点の位置に向かう方向を基準方向と特定し、前記オブジェクト位置特定部が特定した
前記第2位置から前記第1位置
に向かう方向を前記所定のオブジェクトの移動方向と特定し、特定した移動方向と前記基準方向とがなす角度に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するオブジェクト向き特定部、
として機能させる特定プログラム。
【請求項15】
コンピュータを、
所定エリアを、前記所定エリアに存在する所定のオブジェクトよりも上方の位置から撮像する撮像装置が撮像した画像を取得する取得部、
前記取得部が取得した第1画像に含まれる前記所定のオブジェクトであって、実空間を移動中の前記オブジェクトの実空間における向きが当該オブジェクトの実空間における移動方向と同一である前記所定のオブジェクトを特定するオブジェクト特定部、
前記取得部が取得した前記第1画像に対応する第1時刻における前記所定のオブジェクトの前記画像の座標系に対応する位置を示す第1位置と、当該第1時刻よりも後の第2時刻における前記所定のオブジェクトの前記座標系に対応する位置を示す第2位置とを特定するオブジェクト位置特定部、及び、
前記撮像装置が撮像した画像の平面である画像平面を仮想的に延長した平面と、前記撮像装置の光学中心から前記所定エリアに降ろした垂線との交点の、当該平面上への投影点を前記座標系における基準点とし、前記第1位置から前記基準点の位置に向かう方向を基準方向と特定し、前記オブジェクト位置特定部が特定した前記第1位置から前記第2位置に向かう方向を前記所定のオブジェクトの移動方向と特定し、特定した移動方向と前記基準方向とがなす角度に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するオブジェクト向き特定部、
として機能させる特定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オブジェクトの向きを特定する特定装置、特定方法及び特定プログラムに関する。
【背景技術】
【0002】
従来、マーケティング等を目的として店内等の所定エリアに滞在する店員や客の行動を解析するにあたり、所定エリアを撮像した撮像画像から、人物を示すオブジェクトの位置を特定し、人物動線を生成する技術が用いられている。さらに、高度な行動分析を可能とするため、機械学習や深層学習を用いて、人物を示すオブジェクトの画像から、人物の向きを推定する技術が提案されている(例えば、非特許文献1を参照)。
【先行技術文献】
【非特許文献】
【0003】
【文献】Chen, Cheng, and Jean-Marc Odobez. "We are not contortionists: Coupled adaptive learning for head and body orientation estimation in surveillance video." Computer Vision and Pattern Recognition (CVPR), 2012.
【発明の概要】
【発明が解決しようとする課題】
【0004】
機械学習や深層学習による画像分類器を構築するためには、オブジェクトの画像に対して、オブジェクトの向き情報が教師データ(教師ラベル)として与えられた、大量の学習データが必要となる。
図11は、学習データの例を示す図である。例えば、画像に写るオブジェクトの向きとして、正面、左側面、背面及び右側面という4クラスを定義した場合、
図11に示すように、各クラスラベルのいずれかを教師ラベルとして有する大量の画像が必要となる。一方で、1枚1枚のオブジェクトの画像に対して、向き情報を人手で付与する場合、作業者が、画像に含まれるオブジェクトの向きを特定する必要がある。このため、向き情報を人手で付与する作業は、多大な労力を要する。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、画像に写るオブジェクトの向きを効率的に特定することができる特定装置、特定方法及び特定プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る特定装置は、所定エリアを撮像する撮像装置が撮像した画像を取得する取得部と、前記取得部が取得した第1画像に含まれる所定のオブジェクトを特定するオブジェクト特定部と、前記取得部が取得した前記第1画像に対応する第1時刻における前記所定のオブジェクトの位置を示す第1位置と、当該第1時刻とは異なる時刻である第2時刻における前記所定のオブジェクトの位置を示す第2位置とを特定するオブジェクト位置特定部と、前記オブジェクト位置特定部が特定した前記第1位置及び前記第2位置に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するオブジェクト向き特定部と、を備える。
【0007】
前記取得部は、前記所定のオブジェクトの時刻ごとの位置を示す動線情報を取得し、前記オブジェクト位置特定部は、前記取得部が取得した前記第1画像に基づいて前記第1時刻における前記所定のオブジェクトの位置を示す前記第1位置を特定し、前記動線情報に基づいて、前記第1時刻とは異なる時刻である前記第2時刻における前記所定のオブジェクトの位置を示す第2位置を特定してもよい。
【0008】
前記オブジェクト位置特定部は、前記取得部が取得した前記第1画像に基づいて前記第1時刻における前記所定のオブジェクトの位置を示す前記第1位置を特定し、前記取得部が取得した前記第2時刻に撮像された第2画像に基づいて、前記第2時刻における前記所定のオブジェクトの位置を示す第2位置を特定してもよい。
【0009】
前記オブジェクト位置特定部は、前記第1位置から所定距離以上離れたオブジェクトの位置を前記第2位置として特定してもよい。
前記オブジェクト向き特定部は、前記第1位置と前記第2位置とに基づいて定められる前記所定のオブジェクトの移動方向と、前記第1画像において定められる基準方向とがなす角度に基づいて前記所定のオブジェクトの向きを特定してもよい。
【0010】
前記オブジェクト向き特定部は、前記第1位置から前記第1画像において定められる基準点の位置に向かう方向を前記基準方向として特定してもよい。
前記オブジェクト向き特定部は、前記撮像装置の画像平面を仮想的に延長した平面と、前記撮像装置の光学中心から前記所定エリアに降ろした垂線との交点の、当該平面上への投影点を前記基準点としてもよい。
【0011】
複数の角度範囲のそれぞれに、1つの前記オブジェクトの向きが関連付けられており、前記オブジェクト向き特定部は、前記所定のオブジェクトの向きを、前記角度が含まれる前記角度範囲に関連付けられている1つの前記オブジェクトの向きに特定してもよい。
【0012】
前記オブジェクト位置特定部は、前記取得部が取得した第1画像に関連する3つ以上の時刻のそれぞれにおける前記所定のオブジェクトの位置を特定し、前記オブジェクト向き特定部は、特定された3つ以上の時刻のそれぞれについて、当該時刻における前記所定のオブジェクトの位置に基づいて前記オブジェクトの移動方向を特定し、特定された3つ以上の時刻のそれぞれにおける前記オブジェクトの移動方向に基づいて前記所定のオブジェクトの向きを特定してもよい。
【0013】
複数の角度範囲のそれぞれに、1つの前記オブジェクトの向きが関連付けられており、前記オブジェクト向き特定部は、特定された3つ以上の時刻のそれぞれについて、当該時刻のそれぞれに対応する角度が含まれる前記角度範囲に関連付けられている1つの前記オブジェクトの向きを特定し、特定されたオブジェクトの向きが含まれる割合に基づいて、前記所定のオブジェクトの向きを特定してもよい。
【0014】
前記特定装置は、前記所定のオブジェクトの前記第1画像中の領域を特定するオブジェクト領域特定部と、前記オブジェクト領域特定部が特定した領域が示す画像と、前記オブジェクト向き特定部が特定した前記向きを示す向き情報とを、機械学習における学習データとして抽出する抽出部とをさらに備えてもよい。
【0015】
前記オブジェクト向き特定部は、前記第1位置と前記第2位置とに基づいて定められる前記所定のオブジェクトの移動方向と、前記第1画像において定められる基準方向とがなす角度に基づいて前記所定のオブジェクトの向きを特定し、前記抽出部は、前記角度が所定の範囲外に存在する場合、学習データを抽出しないように制御してもよい。
前記抽出部は、前記第1位置と、前記第1画像において定められる画像上の基準点との距離が所定値未満である場合に、学習データを抽出しないように制御してもよい。
【0016】
本発明の第2の態様に係る特定方法は、コンピュータが実行する、所定エリアを撮像する撮像装置が撮像した画像を取得するステップと、前記取得するステップにおいて取得された第1画像に含まれる所定のオブジェクトを特定するステップと、前記取得するステップにおいて取得された前記第1画像に対応する第1時刻における前記所定のオブジェクトの位置を示す第1位置と、当該第1時刻とは異なる時刻である第2時刻における前記所定のオブジェクトの位置を示す第2位置とを特定するステップと、特定された前記第1位置及び前記第2位置に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するステップと、を備える。
【0017】
本発明の第3の態様に係る特定プログラムは、コンピュータを、所定エリアを撮像する撮像装置が撮像した画像を取得する取得部、前記取得部が取得した第1画像に含まれる所定のオブジェクトを特定するオブジェクト特定部、前記取得部が取得した前記第1画像に対応する第1時刻における前記所定のオブジェクトの位置を示す第1位置と、当該第1時刻とは異なる時刻である第2時刻における前記所定のオブジェクトの位置を示す第2位置とを特定するオブジェクト位置特定部、及び、前記オブジェクト位置特定部が特定した前記第1位置及び前記第2位置に基づいて前記第1画像における前記所定のオブジェクトの向きを特定するオブジェクト向き特定部、として機能させる。
【発明の効果】
【0018】
本発明によれば、画像に写るオブジェクトの向きを効率的に特定することができるという効果を奏する。
【図面の簡単な説明】
【0019】
【
図1】本実施形態に係る学習データ生成装置の概要を示す図である。
【
図2】本実施形態に係る学習データ生成装置の構成を示す図である。
【
図3】所定距離を画像座標系での所定ピクセル数とした場合に第2位置を特定する例を示す図である。
【
図4】撮像装置が撮像した第1画像が全方位画像である場合にオブジェクトの向きを特定する例について説明する図である。
【
図5】撮像装置が撮像した第1画像が通常画像である場合にオブジェクトの向きを特定する例について説明する図である。
【
図7】オブジェクトの正面を撮像したものと推定されるオブジェクトに対してオブジェクトの向きが特定された例を示す図である。
【
図8】オブジェクトの背面を撮像したものと推定されるオブジェクトに対してオブジェクトの向きが特定された例を示す図である。
【
図9】第1画像に関連する3つ以上の時刻のそれぞれにおけるオブジェクトの位置を特定した例を示す図である。
【
図10】本実施形態に係る学習データ生成装置が第1画像を取得してから学習データを抽出するまでの処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0020】
[学習データ生成装置1の概要]
図1は、本実施形態に係る学習データ生成装置1の概要を示す図である。学習データ生成装置1は、撮像装置(不図示)が撮像した所定エリアの撮像画像に含まれる所定のオブジェクトの画像と、所定のオブジェクトが当該画像に写る向きとを関連付けた、機械学習において用いられる学習データを生成するコンピュータであり、所定のオブジェクトの向きを特定する特定装置として機能する。
【0021】
ここで、所定エリアは、例えば店舗のフロアである。所定エリアには、動きを分析する対象の所定のオブジェクトとして、店員等の人物が存在する。なお、以下の説明では、所定のオブジェクトを単にオブジェクトという。
【0022】
図1に示すように、学習データ生成装置1は、撮像装置が撮像した所定エリアの撮像画像を取得し(
図1の(1))、撮像画像に含まれるオブジェクトを特定する(
図1の(2))。学習データ生成装置1は、撮像画像に対応する第1時刻におけるオブジェクトの位置を特定するとともに(
図1の(3))、第1時刻と異なる第2時刻のオブジェクトの位置を特定する(
図1の(4))。
【0023】
学習データ生成装置1は、特定した第1時刻のオブジェクトの位置と、第2時刻のオブジェクトの位置と、第1画像における基準方向との関係に基づいて、オブジェクトの向きを特定する(
図1の(5))。このようにすることで、学習データ生成装置1は、撮像画像に写っているオブジェクトの移動方向を特定し、当該移動方向と基準方向との関係に基づいて、当該オブジェクトが当該画像に写る向きを高精度かつ効率的に特定することができる。
【0024】
その後、学習データ生成装置1は、撮像画像に写っているオブジェクトの画像と、特定したオブジェクトが当該画像に写る向きを示す向き情報とを、機械学習における学習データとして抽出する(
図1の(6))。このようにすることで、学習データ生成装置1は、人手により学習データを生成する場合に比べて学習データを高速に生成することができる。
【0025】
[学習データ生成装置1の構成]
続いて、学習データ生成装置1の構成を説明する。
図2は、本実施形態に係る学習データ生成装置1の構成を示す図である。
図2に示すように、学習データ生成装置1は、記憶部11と、制御部12とを備える。
【0026】
記憶部11は、ROM(Read Only Memory)及びRAM(Random Access Memory)等を含む記憶媒体である。記憶部11は、制御部12が実行するプログラムを記憶している。例えば、記憶部11は、学習データ生成装置1を、取得部121、オブジェクト特定部122、オブジェクト位置特定部123、オブジェクト領域特定部124、オブジェクト向き特定部125、及び抽出部126として機能させる学習データ生成プログラムを記憶している。学習データ生成プログラムは、学習データ生成装置1を、取得部121、オブジェクト特定部122、オブジェクト位置特定部123、オブジェクト領域特定部124、オブジェクト向き特定部125として機能させるオブジェクト向き特定プログラムを含んでいてもよい。
【0027】
また、記憶部11は、所定エリアを撮像する撮像装置が撮像した一以上の画像を記憶する。撮像装置は、例えば、所定エリアの天井等に設置されたカメラであり、所定エリアの上方から、真下方向や斜め下方向を撮像することにより画像を生成する。複数の撮像画像のそれぞれには、画像の撮像時刻が関連付けられている。撮像画像としては、例えば、所定エリアの天井等に設置された全方位カメラにより生成された全方位画像や一般的なカメラにより生成された画像が挙げられる。本実施形態では、一般的なカメラにより撮像された画像を通常画像という。
【0028】
また、記憶部11は、所定エリアを撮像した一以上の撮像画像に基づいて生成された、所定エリアにおけるオブジェクトの時刻ごとの位置を示す動線情報が一以上記憶されている。動線情報は、時刻と、当該時刻におけるオブジェクトの所定エリアにおける位置を示す位置情報とを関連付けた情報である。動線情報に含まれている時刻は、所定エリアを撮像した一以上の撮像画像のそれぞれに関連付けられている撮像時刻のいずれかに対応しているものとする。動線情報には、少なくとも2つの時刻のそれぞれに対応する位置情報が含まれているものとする。
【0029】
ここで、動線情報に含まれる位置情報は、例えば、撮像画像における位置であるローカル位置(例えば、画像座標系)を示すものとする。なお、ローカル位置とグローバル位置(例えば、世界座標系)との対応関係が記憶部11に記憶されている場合は、動線情報に含まれる位置情報は、例えば、所定エリアの位置であるグローバル位置を示すものであってもよい。
【0030】
制御部12は、例えばCPU(Central Processing Unit)である。制御部12は、記憶部11に記憶された学習データ生成プログラムを実行することにより、取得部121、オブジェクト特定部122、オブジェクト位置特定部123、オブジェクト領域特定部124、オブジェクト向き特定部125、及び抽出部126として機能する。
【0031】
取得部121は、所定エリアを撮像する撮像装置が撮像した画像を取得する。また、取得部121は、記憶部11に記憶されている動線情報を取得する。ここで、取得部121が取得した画像を第1画像という。
【0032】
オブジェクト特定部122は、取得部121が取得した第1画像に含まれているオブジェクトを特定する。具体的には、オブジェクト特定部122は、取得部121が取得した動線情報のうち、第1画像に関連付けられている撮像時刻に対応する時刻を含む動線情報を特定することにより、取得部121が取得した第1画像に含まれているオブジェクトを特定する。
【0033】
なお、動線情報には、店員や客といったオブジェクトの属性を示す属性情報が関連付けられていてもよい。オブジェクト特定部122は、例えば学習データ生成装置1のユーザからオブジェクトの属性を受け付けてもよい。そして、オブジェクト特定部122は、受け付けた属性を有する動線情報を特定することにより、受け付けた属性に対応するオブジェクトのみを特定してもよい。
【0034】
オブジェクト位置特定部123は、取得部121が取得した第1画像に対応する撮像時刻である第1時刻におけるオブジェクトの位置と、当該第1時刻とは異なる時刻である第2時刻におけるオブジェクトの位置とを特定する。ここで、第2時刻は、第1時刻よりも前の時刻であるものとする。また、第1時刻におけるオブジェクトの位置を第1位置、第2時刻におけるオブジェクトの位置を第2位置ともいう。
【0035】
オブジェクト位置特定部123は、取得部121が取得した第1画像に基づいて、第1位置を特定する。例えば、オブジェクト位置特定部123は、第1画像に関連付けられている撮像時刻に対応する時刻を含む動線情報を参照し、当該時刻に関連付けられている位置情報を特定することにより、第1画像に対応する第1位置を特定する。
【0036】
オブジェクト位置特定部123は、第1画像に関連付けられている撮像時刻に対応する時刻を含む動線情報に基づいて、第2時刻における所定のオブジェクトの位置を示す第2位置を特定する。ここで、オブジェクト位置特定部123は、第1位置から所定距離以上離れたオブジェクトの位置を第2位置として特定してもよい。
【0037】
所定距離は、例えば、撮像画像の座標系である画像座標系での距離(例えば、ピクセル単位)、又は、所定エリアの座標系である世界座標系での距離(例えば、メートル単位)に基づいて定められる。
図3は、所定距離を画像座標系での所定ピクセル数(例えば50ピクセル)とした場合に第2位置を特定する例を示す図である。ここで、第1画像に関連付けられている撮像時刻を時刻tとする。
図3に示す例では、時刻tの1フレーム前、2フレーム前の時刻である時刻t-1及び時刻t-2では、時刻tにおけるオブジェクト位置に対する距離が所定ピクセル未満であり、時刻tの3フレーム前の時刻である時刻t-3で初めて当該距離が所定ピクセル以上となる。したがって、オブジェクト位置特定部123は、時刻t-3に対応する位置を第2位置として特定する。
【0038】
オブジェクトの移動軌跡は、実際にはほぼ静止している場合でも、足元位置が若干移動する場合がある。これに対して、オブジェクト位置特定部123は、第1位置から所定距離以上離れたオブジェクトの位置を第2位置として特定することにより、オブジェクトが実際に移動したときの移動前の位置を第2位置として特定することができる。これにより、学習データ生成装置1は、オブジェクトの移動方向の特定精度を高めることができる。
【0039】
なお、オブジェクト位置特定部123は、取得部121が取得した第1画像の画像解析を行うことにより、第1位置を特定してもよい。また、取得部121が、第1画像に関連付けられている撮像時刻としての第1時刻とは異なる撮像時刻である第2時刻に撮像された撮像画像を第2画像として取得してもよい。そして、オブジェクト位置特定部123が、取得部121が取得した第2画像に基づいて第2位置を特定してもよい。例えば、オブジェクト位置特定部123は、取得部121が取得した第2画像の画像解析を行うことにより、第2位置を特定してもよい。この場合において、オブジェクト位置特定部123は、後述のオブジェクト領域特定部124が特定したオブジェクト領域に基づいて第1位置及び第2位置を特定してもよい。例えば、オブジェクト位置特定部123は、オブジェクト領域の中心点の位置を、オブジェクトの位置としてもよい。また、オブジェクト位置特定部123は、後述するオブジェクトに対応する三次元モデルを構成する点群のうち、一点(例えば、オブジェクトが人物である場合は、足元位置)を特定し、当該点の画像上への投影点の位置をオブジェクトの位置としてもよい。このようにすることで、学習データ生成装置1は、動線情報を用いることなく第1位置及び第2位置を特定することができる。
【0040】
オブジェクト領域特定部124は、オブジェクトの第1画像中の領域であるオブジェクト領域を特定する。例えば、記憶部11に、第1画像と、第1画像から予め抽出したオブジェクト領域とを関連付けて記憶させておき、オブジェクト領域特定部124は、第1画像に関連付けられているオブジェクト領域を記憶部11から取得することにより、オブジェクト領域を特定する。
【0041】
また、オブジェクト領域特定部124は、オブジェクト位置特定部123が特定した第1画像中のオブジェクトの位置に、当該オブジェクトに対応する三次元モデルを仮想的に配置した場合に、撮像装置が撮像した画像に含まれる三次元モデルに対応する領域を算出することにより、オブジェクト領域を特定してもよい。具体的には、記憶部11に、三次元モデルを構成する点群を示す点群情報と、撮像装置の投影パラメータとを記憶させておく。そして、オブジェクト領域特定部124は、記憶部11から当該点群情報と当該パラメータとを取得し、三次元モデルを仮想的に配置した場合に、当該点群情報が示す点群の少なくとも一部について、当該投影パラメータに基づいて、撮像装置が撮像する画像上への投影点を算出し、当該投影点の点群を近似する多角形の輪郭領域をオブジェクト領域として特定する。
【0042】
また、オブジェクト領域特定部124は、特定した輪郭領域を内包する矩形領域をオブジェクト領域として特定してもよい。オブジェクト領域特定部124は、特定した輪郭領域を内包する複数の矩形領域のうち、当該矩形の面積が相対的に小さい矩形領域をオブジェクト領域として特定してもよい。
【0043】
また、オブジェクト領域特定部124は、撮像装置が全方位画像を撮像する撮像装置である場合に、矩形領域に対応する一点と、当該撮像装置が撮像した画像の中心とを通る直線と、全方位画像に対して予め定められた基準軸に対応する直線とがなす角度に基づいて、矩形領域の回転成分を算出してもよい。そして、オブジェクト領域特定部124は、算出した回転成分を有する矩形領域のうち、面積が相対的に小さい矩形領域をオブジェクト領域として特定してもよい。
【0044】
オブジェクト向き特定部125は、オブジェクト位置特定部123が特定した第1時刻におけるオブジェクトの位置を示す第1位置と、第2時刻におけるオブジェクトの位置を示す第2位置とに基づいて、第1画像におけるオブジェクトの向きを特定する。
【0045】
以下、
図4~
図6を参照して、オブジェクト向き特定部125がオブジェクトの向きを特定する処理の詳細について説明する。
図4は、撮像装置が撮像した第1画像が全方位画像である場合にオブジェクトの向きを特定する例について説明する図である。
図5は、撮像装置が撮像した第1画像が通常画像である場合にオブジェクトの向きを特定する例について説明する図である。
図6は、基準点を特定する例を示す図である。
【0046】
オブジェクト向き特定部125は、オブジェクトの向きを特定するにあたり、移動中のオブジェクトの向きが移動方向と同一という前提を用いる。例えば、オブジェクトが前方に移動している場合、オブジェクトは前方を向いており、オブジェクトが左方向に移動している場合、オブジェクトは左方向を向いているものとする。
【0047】
オブジェクト向き特定部125は、第1位置から第1画像において定められる基準点の位置に向かう方向を基準方向として特定する。例えば、
図4に示すように、撮像装置が撮像した画像が真下方向を撮像した画像である場合、基準点Pbは、画像の中心位置であり、基準方向Dbは、第1位置P1から基準点Pbに向かう方向である。オブジェクト向き特定部125は、撮像装置が撮像した画像が真下方向を撮像した画像である場合、画像の中心位置を特定し、当該中心位置を基準点に特定する。なお、基準方向Dbは、第2位置P2から基準点Pbに向かう方向であってもよい。
【0048】
また、撮像装置が撮像した画像が真下方向を撮像した画像ではない場合、オブジェクト向き特定部125は、
図6に示すように基準点Pbを特定する。具体的には、撮像装置が撮像した画像が真下方向を撮像した画像ではない場合、オブジェクト向き特定部125は、
図6に示すように、撮像装置の画像平面を仮想的に延長した平面と、撮像装置の光学中心から所定エリアに降ろした垂線との交点の、当該平面上への投影点を基準点Pbとする。オブジェクト向き特定部125は、撮像装置が撮像した画像が真下方向を撮像した画像ではない場合、撮像装置の画像平面を仮想的に延長した平面と、撮像装置の光学中心から所定エリアに降ろした垂線との交点の、当該平面上への投影点を特定し、当該投影点を基準点に特定する。
図6に示すように、撮像装置の設置角度が斜めであり、画像平面が光学中心の真下とならない場合、基準点Pbは、
図5に示すように画像平面(撮像平面)の外側となる場合がある。なお、撮像装置が撮像した画像が真下方向を撮像した画像である場合に、上記に従って特定した基準点は画像の中心位置となる。
【0049】
なお、基準点の位置を示す基準点情報を記憶部11に予め記憶させておいてもよい。そして、オブジェクト向き特定部125が、記憶部11に記憶されている基準点情報を参照し、基準点を特定してもよい。オブジェクト向き特定部125は、第1画像における第1位置から、特定した基準点に向かう方向を基準方向として特定する。
【0050】
なお、
図5に示すように通常カメラの画像であり、画像平面において基準点がオブジェクト位置から大きく離れている場合、基準方向は真下方向に近似することができる。この場合には、基準方向を示す基準方向情報を記憶部11に予め記憶させておき、オブジェクト向き特定部125が、記憶部11に記憶されている基準方向情報を参照し、基準方向を特定してもよい。
【0051】
オブジェクト向き特定部125は、第1位置と第2位置とに基づいて定められるオブジェクトの移動方向を特定する。オブジェクト向き特定部125は、第1位置を示す座標成分から第2位置を示す座標成分を減算することにより、オブジェクトの移動方向を特定する。例えば、オブジェクト向き特定部125は画像上の位置を示す画像座標系に対応する第1位置の座標成分から第2位置の座標成分を減算することにより、オブジェクトの移動方向を特定する。なお、オブジェクト向き特定部125は、所定エリア上の位置を示す世界座標系に対応する第1位置の座標成分から第2位置の座標成分を減算することにより、オブジェクトの移動方向を特定してもよい。
【0052】
なお、本実施形態では、第2時刻は、第1時刻よりも前の時刻であるものとし、オブジェクト向き特定部125が、第1位置を示す座標成分から第2位置を示す座標成分を減算することにより、オブジェクトの移動方向を特定したが、これに限らない。第2時刻は、第1時刻よりも後の時刻であってもよい。この場合、オブジェクト向き特定部125は、第2位置を示す座標成分から第1位置を示す座標成分を減算することにより、オブジェクトの移動方向を特定してもよい。
【0053】
オブジェクト向き特定部125は、特定したオブジェクトの移動方向と、第1画像において定められる基準方向とがなす角度に基づいてオブジェクトの画像に写る向きを特定する。
図4及び
図5に示す例では、オブジェクト向き特定部125は、第2位置P2から第1位置P1に向かう方向をオブジェクトの移動方向Dmとする。そして、オブジェクト向き特定部125は、移動方向Dmと、基準方向Dbとがなす角度θをオブジェクトの向きを示す向き情報とする。オブジェクト向き特定部125は、移動方向Dmと、基準方向Dbとがなす複数の角度のうち、相対的に小さい角度θをオブジェクトの画像に写る向きを示す向き情報とする。
【0054】
オブジェクト向き特定部125は、
図4及び
図5のいずれの場合も、オブジェクトの左側面を撮像したものと推定されるオブジェクト領域画像に対して、θ=約90°というオブジェクト向き情報を自動的に付与することができる。
【0055】
図7は、オブジェクトの正面を撮像したものと推定されるオブジェクトに対してオブジェクトの向きが特定された例を示す図である。
図8は、オブジェクトの背面を撮像したものと推定されるオブジェクトに対してオブジェクトの向きが特定された例を示す図である。
図7に示す例では、θが約0°であり、
図8に示す例では、θが約180°であることが確認できる。
【0056】
図7及び
図8に示すように、基準点が画像内に存在する場合、画像上のオブジェクトの移動方向が同一方向(
図7及び
図8では、移動方向はいずれも右下方向)であっても、オブジェクトの向き(
図7では正面、
図8では背面)が異なる。これに対して、学習データ生成装置1は、移動体の移動方向と、基準方向とのなす角度を特定することにより、オブジェクトの画像に写る向きを精度良く特定することができる。
【0057】
なお、複数の角度範囲のそれぞれには、1つのオブジェクトの向きが関連付けられていてもよい。例えば、θが0°±α、90°±α、180°±α、270°±αのそれぞれの範囲に、オブジェクトの向きとして、正面、左側面、背面、右側面の4つのクラスが関連付けられていてもよい。そして、オブジェクト向き特定部125は、オブジェクトの向きを、角度θが含まれる角度範囲に関連付けられている1つのオブジェクトの向き(クラス)に特定してもよい。また、オブジェクト向き特定部125は、オブジェクトの向きを示す向き情報として、オブジェクトの向きに対応する教師データのラベル値を特定してもよい。例えば、正面クラスのラベル値を0、左側面クラスのラベル値を1、背面クラスのラベル値を2、右側面クラスのラベル値を3とし、オブジェクト向き特定部125が、特定したオブジェクトの向きに対応するラベル値を特定してもよい。教師データのラベル値として離散値を付与することで、機械学習における分類問題(例えば、上記例では4クラス)として学習させることができる。
【0058】
また、オブジェクト位置特定部123は、取得部121が取得した第1画像に関連する3つ以上の時刻のそれぞれにおけるオブジェクトの位置を特定してもよい。そして、オブジェクト向き特定部125は、特定された3つ以上の時刻のそれぞれについて、当該時刻におけるオブジェクトの位置に基づいてオブジェクトの移動方向を特定し、特定された3つ以上の時刻のそれぞれにおけるオブジェクトの移動方向に基づいてオブジェクトの向きを特定してもよい。
【0059】
この場合、オブジェクト向き特定部125は、特定された3つ以上の時刻のそれぞれについて、当該時刻のそれぞれに対応するオブジェクトの移動方向と、基準方向とがなす角度を特定する。
図9は、第1画像に関連する3つ以上の時刻のそれぞれにおけるオブジェクトの位置を特定した例を示す図である。
図9に示す例では、第1画像に関連付けられている撮像時刻(時刻t1)に対応するオブジェクトの位置である第1位置P1の他に、撮像時刻よりも前の時刻に対応する第2位置P2、第3位置P3、第4位置P4が特定された例を示す。ここで、第2位置P2、第3位置P3、及び第4位置P4は、撮像時刻の1フレーム前、2フレーム前、及び3フレーム前の時刻に対応するオブジェクトの位置である。オブジェクト向き特定部125は、第2位置P2、第3位置P3、第4位置P4における移動方向のなす角度として、角度θ1、角度θ2、及び角度θ3を特定する。
【0060】
オブジェクト向き特定部125は、オブジェクトの向き情報として、角度θ1、θ2、及びθ3の平均値や中央値を用いてもよい。また、オブジェクト向き特定部125は、上述したように、特定された3つ以上の時刻のそれぞれについて、当該時刻のそれぞれに対応する角度が含まれる角度範囲に関連付けられている1つのオブジェクトの向きを特定してもよい。そして、オブジェクト向き特定部125は、特定したオブジェクトの向きが含まれる割合に基づいて、オブジェクトの向きを特定してもよい。
【0061】
例えば、上述したように、正面クラスのラベル値を0、左側面クラスのラベル値を1、背面クラスのラベル値を2、右側面クラスのラベル値を3とした場合において、オブジェクト向き特定部125が、角度θ1、θ2、及びθ3に対して、ラベル値として0、0、1と特定した場合には、多数決によりオブジェクトの向きを示すラベル値を0に特定する。このようにすることで、オブジェクトの移動方向を精度良く特定し、当該移動方向に基づいてオブジェクトの向きを精度良く特定することができる。
【0062】
抽出部126は、オブジェクト領域特定部124が特定した領域が示す画像と、オブジェクト向き特定部125が特定したオブジェクトの向きを示す向き情報とを、機械学習における学習データとして抽出し、抽出した学習データを記憶部11に記憶させる。ここで、機械学習には、深層学習が含まれるものとする。機械学習としては、サポートベクターマシン(Support Vector Machine)やCNN(Convolutional Neural Network)が含まれる。
【0063】
抽出部126は、オブジェクト向き特定部125が、角度θを示す角度情報、すなわち、連続値をオブジェクトの向きを示す向き情報として抽出する場合、抽出した学習データを、機械学習における回帰問題として学習させることができる。
【0064】
抽出部126は、角度θが所定の範囲外に存在する場合、当該角度θに対応する学習データを抽出しないように制御してもよい。例えば、機械学習において、上述した4クラスの分類問題として学習させる場合に、学習データ生成装置1は、正面と左側面の中間方向のような、明確にクラス分類するのが困難な画像を学習データから省くことで、学習を効率的に実施させることができる。
【0065】
また、オブジェクト向き特定部125が、第1画像に関連する3つ以上の時刻のそれぞれにおけるオブジェクトの位置に対応して複数の角度θ1、θ2、及びθ3をそれぞれ、0、0、1(上記の4クラス問題の場合)と離散化する場合、抽出部126は、離散値が含まれる割合が所定値未満の場合は、学習データを抽出しないように制御してもよい。例えば、抽出部126は、所定値を100%に設定した場合、全ての離散値が同一の場合にのみ、学習データを抽出する。このようにすることでも、学習データ生成装置1は、明確にクラス分類するのが困難な画像を学習データから省くことで、学習を効率的に実施させることができる。
【0066】
また、抽出部126は、第1画像に対応する所定のオブジェクトの位置を示す第1位置と、当該第1画像において定められる画像上の基準点との距離が所定値未満である場合に、学習データを抽出しないように制御してもよい。第1画像上の基準点に近い位置では、オブジェクトを真上から撮像した画像となり、オブジェクトの向き推定には適していない。これに対して、学習データ生成装置1は、第1位置と、基準点との距離が所定値未満であり、オブジェクトを真上から撮像したような画像を抽出しないので、不要な学習を抑制することができる。
【0067】
[学習データ生成装置1における処理の流れ]
続いて、学習データ生成装置1における処理の流れについて説明する。
図10は、本実施形態に係る学習データ生成装置1が第1画像を取得してから学習データを抽出するまでの処理の流れを示すフローチャートである。なお、本フローチャートでは、オブジェクト位置の特定に動線情報を用い、かつ、オブジェクトの画像に写る向きを4つのクラスのいずれかに分類するときの処理の流れについて説明する。
【0068】
まず、取得部121は、第1画像を取得する(S1)。
続いて、オブジェクト特定部122は、第1画像に対応する動線情報を特定することにより、第1画像に含まれているオブジェクトを特定する(S2)。
【0069】
続いて、オブジェクト位置特定部123は、特定された動線情報に基づいて、第1画像に対応する撮像時刻である第1時刻におけるオブジェクトの位置である第1位置と、当該第1時刻とは異なる時刻である第2時刻におけるオブジェクトの位置である第2位置とを特定する(S3)。
【0070】
続いて、オブジェクト向き特定部125は、第1位置及び第2位置に基づいてオブジェクトの移動方向を特定する(S4)。
続いて、オブジェクト向き特定部125は、特定した移動方向と、第1画像における基準方向とのなす角度を特定し(S5)、特定した角度に基づいてオブジェクトの向きに対応するクラスを特定する(S6)。
【0071】
続いて、抽出部126は、オブジェクト向き特定部125がオブジェクトの向きに対応するクラスを特定できたか否かを判定する(S7)。抽出部126は、クラスを特定できたと判定すると、S8に処理を移し、クラスを特定できなかったと判定すると、本フローチャートに係る処理を終了する。
【0072】
続いて、抽出部126は、第1位置と、第1画像における基準点との距離が所定値以上であるか否かを判定する(S8)。抽出部126は、第1位置と基準点との距離が所定値以上であると判定すると、S9に処理を移し、第1位置と基準点との距離が所定値未満であると判定すると、本フローチャートに係る処理を終了する。なお、抽出部126は、S8に係る処理を、S3の直後等、S3からS8の処理が行われる間の任意のタイミングで実行してもよい。
【0073】
続いて、オブジェクト領域特定部124は、オブジェクトの第1画像中の領域であるオブジェクト領域を特定する(S9)。
続いて、抽出部126は、特定されたオブジェクト領域とオブジェクトの向きに対応するクラスとを関連付けた学習データを抽出する(S10)。
【0074】
なお、本フローチャートにおいて、オブジェクト位置特定部123は、特定された動線情報に基づいてオブジェクトの位置を特定しているが、これに限らない。オブジェクト位置特定部123は、取得部121が取得した第1画像及び第2画像の少なくともいずれかに対して画像解析を行うことにより、オブジェクトの位置である第1位置及び第2位置の少なくともいずれかを特定するようにしてもよい。
【0075】
[本実施形態における効果]
以上説明したように、本実施形態に係る学習データ生成装置1は、所定エリアを撮像する撮像装置が撮像した第1画像に含まれる所定のオブジェクトを特定し、第1画像に対応する第1時刻における所定のオブジェクトの位置を示す第1位置と、当該第1時刻とは異なる時刻である第2時刻における所定のオブジェクトの位置を示す第2位置とを特定する。学習データ生成装置1は、特定した第1位置及び第2位置に基づいて第1画像における所定のオブジェクトの向きを特定する。このようにすることで、学習データ生成装置1は、人手によりオブジェクトの向きを特定する場合に比べて、オブジェクトの画像に写る向きを効率的に特定することができる。
【0076】
また、学習データ生成装置1は、第1位置と第2位置とに基づいて定められる所定のオブジェクトの移動方向と、第1画像において定められる基準方向とがなす角度に基づいて所定のオブジェクトの向きを特定する。このようにすることで、学習データ生成装置1は、オブジェクトの画像に写る向きを精度良く特定することができる。
【0077】
以上、本発明を実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。
【0078】
例えば、上述の実施形態では、記憶部11が、撮像装置が撮像した一以上の画像と、動線情報とを記憶し、取得部121が、記憶部11に記憶されている画像及び動線情報を取得することとしたが、これに限らない。学習データ生成装置1とは異なる装置が、撮像装置が撮像した一以上の画像及び動線情報を記憶し、取得部121が、当該装置に記憶されている画像及び動線情報を取得してもよい。
【0079】
また、特に、装置の分散・統合の具体的な実施形態は以上に図示するものに限られず、その全部又は一部について、種々の付加等に応じて、又は、機能負荷に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
【符号の説明】
【0080】
1・・・学習データ生成装置、11・・・記憶部、12・・・制御部、121・・・取得部、122・・オブジェクト特定部、123・・・オブジェクト位置特定部、124・・・オブジェクト領域特定部、125・・・オブジェクト向き特定部、126・・・抽出部