(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-27
(45)【発行日】2022-10-05
(54)【発明の名称】表示制御装置、表示制御システム、表示制御方法、及びプログラム
(51)【国際特許分類】
G06T 7/20 20170101AFI20220928BHJP
G06V 40/20 20220101ALI20220928BHJP
H04N 7/18 20060101ALI20220928BHJP
【FI】
G06T7/20 300Z
G06V40/20
H04N7/18 D
(21)【出願番号】P 2020501872
(86)(22)【出願日】2018-02-20
(86)【国際出願番号】 JP2018005886
(87)【国際公開番号】W WO2019162988
(87)【国際公開日】2019-08-29
【審査請求日】2021-01-13
(73)【特許権者】
【識別番号】514315159
【氏名又は名称】株式会社ソシオネクスト
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】田上 祐也
(72)【発明者】
【氏名】小泉 拓史
【審査官】新井 則和
(56)【参考文献】
【文献】国際公開第2017/170084(WO,A1)
【文献】国際公開第2015/129210(WO,A1)
【文献】国際公開第2015/033577(WO,A1)
【文献】特開2011-205212(JP,A)
【文献】米国特許第08009863(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
G06V 40/00-40/70
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
動画像データに基づいて検出された、被写体の移動を示すデータ、及び前記被写体の顔または体の向きを示すデータが入力される受信部と、
前記動画像データの各時点における前記被写体の位置、前記被写体の移動方向、及び前記被写体の顔または体の向きをそれぞれ示す図形データを出力する表示制御部と、
を有
し、
前記図形データは、
指定された期間の最後の時点における、前記被写体の位置と前記被写体の顔または体の向きを示すアイコンと、
前記被写体が滞在した位置に表示される、前記被写体の滞在時間の長さに応じた大きさの円と、
前記円の中心位置間の方向と長さで、前記被写体の移動方向と移動速度とを示す矢印と、
を含む、
表示制御装置。
【請求項2】
前記円は、前記被写体の顔または体の向きに対応する複数の領域に分割され、分割された各領域の表示形態は、前記被写体の顔又は体の向きが各領域に対応する方向に向いていた期間の長さによって決定される、請求項1に記載の表示制御装置。
【請求項3】
前記表示制御部は、前記被写体が位置している時間の長さに応じた図形データを出力する、
請求項1に記載の表示制御装置。
【請求項4】
前記表示制御部は、前記被写体の位置を示す図形データに対応付けて、当該位置における前記被写体の顔または体の向きの分布を示すデータを出力する、
請求項1または
3に記載の表示制御装置。
【請求項5】
前記受信部は、前記動画像データに基づいて検出された、前記被写体が物品に対して手を伸ばした際の前記被写体の手の位置を示すデータが入力され、
前記表示制御部は、前記被写体の手の位置を示す図形データを出力する、
請求項1乃至
4のいずれか一項に記載の表示制御装置。
【請求項6】
前記受信部は、前記動画像データに基づいて検出された、前記被写体が手を伸ばした物品の情報が入力され、
前記表示制御部は、前記被写体が手を伸ばした物品の情報を、前記被写体の位置を示す図形データに対応付けて出力する、
請求項1乃至
5のいずれか一項に記載の表示制御装置。
【請求項7】
前記受信部は、前記被写体が購入した物品の情報が入力され、
前記表示制御部は、前記被写体が購入した物品が配置されていた位置、及び前記被写体が手を伸ばしたが購入していない物品が配置されていた位置の少なくとも一つのデータを出力する、
請求項
6に記載の表示制御装置。
【請求項8】
動画像解析装置、及び表示制御装置を有する表示制御システムであって、
前記動画像解析装置は、
動画像を符号化する符号化部と、
前記符号化部による前記動画像が圧縮されて符号化処理に用いられるデータを取得する取得部と、
前記取得部により取得されたデータに基づいて、被写体の移動、及び前記被写体の顔または体の向きの情報を含む特徴データを前記動画像から検出する検出部と、
を有し、
前記表示制御装置は、
前記特徴データが入力される受信部と、
前記動画像の各時点における前記被写体の位置、前記被写体の移動方向を示すデータ、及び前記被写体の顔または体の向きをそれぞれ示す図形データを出力する表示制御部と、を有
し、
前記図形データは、
指定された期間の最後の時点における、前記被写体の位置と前記被写体の顔または体の向きを示すアイコンと、
前記被写体が滞在した位置に表示される、前記被写体の滞在時間の長さに応じた大きさの円と、
前記円の中心位置間の方向と長さで、前記被写体の移動方向と移動速度とを示す矢印と、
を含む、
表示制御システム。
【請求項9】
表示制御装置が、
動画像データに基づいて検出された、被写体の移動を示すデータ、及び前記被写体の顔または体の向きを示すデータを受信する処理と、
前記動画像データの各時点における前記被写体の位置、前記被写体の移動方向、及び前記被写体の顔または体の向きをそれぞれ示す図形データを出力する処理と、
を実行
し、
前記図形データは、
指定された期間の最後の時点における、前記被写体の位置と前記被写体の顔または体の向きを示すアイコンと、
前記被写体が滞在した位置に表示される、前記被写体の滞在時間の長さに応じた大きさの円と、
前記円の中心位置間の方向と長さで、前記被写体の移動方向と移動速度とを示す矢印と、
を含む、
表示制御方法。
【請求項10】
表示制御装置に、
動画像データに基づいて検出された、被写体の移動を示すデータ、及び前記被写体の顔または体の向きを示すデータを受信する処理と、
前記動画像データの各時点における前記被写体の位置、前記被写体の移動方向、及び前記被写体の顔または体の向きをそれぞれ示す図形データを出力する処理と、
を実行
させ、
前記図形データは、
指定された期間の最後の時点における、前記被写体の位置と前記被写体の顔または体の向きを示すアイコンと、
前記被写体が滞在した位置に表示される、前記被写体の滞在時間の長さに応じた大きさの円と、
前記円の中心位置間の方向と長さで、前記被写体の移動方向と移動速度とを示す矢印と、
を含む、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、表示制御装置、表示制御システム、表示制御方法、及びプログラムに関する。
【背景技術】
【0002】
従来、店舗や施設等に設置された監視カメラ等で撮影された動画像(映像)から、被写体の行動を監視する技術が知られている(例えば、特許文献1-3を参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2009-134688号公報
【文献】特開2015-125671号公報
【文献】特開2012-014543号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、店舗や施設等において、顧客等の被写体がどのような経路で移動し、どの場所で滞在し、どこに興味を示していたか等の活動状況を把握する場合、店舗や施設等の状況を、目視で動画像を確認する必要がある。
【0005】
そこで、一側面では、被写体の行動を比較的容易に把握できる技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
一つの案では、動画像データに基づいて検出された、被写体の移動、及び前記被写体の顔または体の向きを取得する受信部と、各時点における前記被写体の位置、前記被写体の移動方向、及び前記被写体の顔または体の向きをそれぞれ表す各図形データを表示するためのデータを出力する表示制御部と、を有し、前記図形データは、指定された期間の最後の時点における、前記被写体の位置と前記被写体の顔または体の向きを示すアイコンと、 前記被写体が滞在した位置に表示される、前記被写体の滞在時間の長さに応じた大きさの円と、前記円の中心位置間の方向と長さで、前記被写体の移動方向と移動速度とを示す矢印と、を含む表示制御装置を提供する。
【発明の効果】
【0007】
一側面によれば、被写体の行動を比較的容易に把握できる。
【図面の簡単な説明】
【0008】
【
図1】実施形態に係る通信システムの構成例を示す図である。
【
図2】実施形態に係る撮像端末、動画像解析装置、表示制御装置、及び表示端末のハードウェア構成例を示す図である。
【
図3】実施形態に係る動画像解析装置の構成ブロック図の一例を示す図である。
【
図4】実施形態に係る表示制御装置の機能ブロック図の一例を示す図である。
【
図5】動画像解析装置における被写体の行動を検出する処理の一例を示すフローチャートである。
【
図6】処理対象フレームから特徴データを検出する処理の一例について説明する図である。
【
図8A】HEVCにおける動きベクトルについて説明する図である。
【
図8B】HEVCにおける動きベクトルについて説明する図である。
【
図9】被写体の行動を表示する処理の一例を示すフローチャートである。
【
図11A】被写体の行動を表す表示画面の一例について説明する図である。
【
図11B】被写体の行動を表す表示画面の一例について説明する図である。
【
図11C】被写体の行動を表す表示画面の一例について説明する図である。
【
図12A】被写体の行動を表す表示画面の一例について説明する図である。
【
図12B】被写体の行動を表す表示画面の一例について説明する図である。
【
図13】被写体が手を伸ばした商品等の物品の位置を表す表示画面の一例について説明する図である。
【
図14】被写体の行動を表す表示画面の一例について説明する図である。
【
図15A】忘れ物を報知する処理の一例について説明する図である。
【
図15B】忘れ物を報知する処理の一例について説明する図である。
【
図15C】忘れ物を報知する処理の一例について説明する図である。
【
図15D】忘れ物を報知する処理の一例について説明する図である。
【発明を実施するための形態】
【0009】
以下、図面に基づいて本発明の実施形態を説明する。
【0010】
<システム構成>
図1は、実施形態に係る通信システム1(「表示制御システム」)の構成例を示す図である。
図1において、通信システム1は、撮像端末10-1、10-2、・・・(以下で、それぞれを区別する必要がない場合は、単に「撮像端末10」と称する。)、動画像解析装置20、表示制御装置30、及び表示端末40-1、40-2、・・・(以下で、それぞれを区別する必要がない場合は、単に「表示端末40」と称する。)を有する。
【0011】
撮像端末10と動画像解析装置20、動画像解析装置20と表示制御装置30、及び表示制御装置30と表示端末40は、それぞれ、例えば、インターネット、携帯電話網、無線LAN(Local Area Network)、またはLAN等のネットワーク50、ネットワーク60、及びネットワーク70により、通信可能な状態で接続されている。
【0012】
撮像端末10は、例えば、監視カメラ、ビデオカメラ、スマートフォン、または動画像(映像)ファイルサーバ等の情報処理装置(コンピュータ)である。撮像端末10は、カメラにより撮像された動画像と、マイクにより集音された音声とを、所定の方式(「第1の方式」)で符号化する。そして、撮像端末10は、符号化した動画像及び音声を、ストリーミング配信等によりリアルタイムで動画像解析装置20に配信する。または、撮像端末10は、符号化した動画像及び音声をファイルとして蓄積し、所定のタイミングで当該ファイルを動画像解析装置20にアップロードする。
【0013】
動画像解析装置20は、例えば、撮像端末10により撮像されて符号化された動画像を、復号し、所定の方式(「第2の方式」)により符号化するトランスコーダでもよい。動画像解析装置20は、撮像端末10から受信した動画像及び音声を復号、及び符号化し、符号化した動画像及び音声を、ストリーミング配信等によりリアルタイムで表示制御装置30に出力する。または、動画像解析装置20は、符号化した動画像及び音声をファイルとして蓄積し、所定のタイミングで当該ファイルを表示制御装置30にアップロードする。これにより、撮像端末10から受信した、各種の符号化方式により符号化された動画像を、所定の符号化方式に変換して表示制御装置30に出力することができる。
【0014】
また、動画像解析装置20は、撮像端末10により撮像された動画像の各フレームから、各被写体の位置、各被写体の顔または体(胴体)の向きを検出する。また、動画像解析装置20は、撮像端末10により撮像された動画像における複数のフレームから、各被写体の移動方向、及び移動量を検出する。
【0015】
表示制御装置30は、例えば、動画像解析装置20から受信した動画像及び特徴データを用い、AI(Artificial Intelligence)等による処理により、被写体の行動を解析し、来客の行動分析、店舗等のマーケティング、不審者等の監視等のサービスを提供する。表示制御装置30は、AIにより解析された被写体の行動を、表示端末40に表示する。また、表示制御装置30は、動画像解析装置20により所定の行動が検出された場合、表示端末40に所定の通知を行う。
【0016】
動画像解析装置20、表示制御装置30は、例えば、パーソナルコンピュータ、AIアクセラレータ、データサーバー、クラウド、等の情報処理装置(コンピュータ)である。
【0017】
表示端末40は、例えば、パーソナルコンピュータ、スマートフォン、タブレット端末、等の情報処理装置(コンピュータ)である。表示端末40は、表示制御装置30から提供された情報を画面に表示する。
【0018】
<変形例>
また、通信システム1は、動画像解析装置20を複数有し、動画像解析装置20-1、20-2、・・・とし、表示制御装置30にデータを出力し、データを統合することもできる。
【0019】
<ハードウェア構成>
図2は、実施形態に係る撮像端末10、動画像解析装置20、表示制御装置30、及び表示端末40のハードウェア構成例を示す図である。以下では、表示制御装置30を例に説明する。
図2の表示制御装置30は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、インタフェース装置105等を有する。
【0020】
表示制御装置30での処理を実現する動画像処理プログラムは、記録媒体101によって提供される。動画像処理プログラムを記録した記録媒体101がドライブ装置100にセットされると、動画像処理プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、動画像処理プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされた動画像処理プログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0021】
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って表示制御装置30に係る機能を実現する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
【0022】
なお、記録媒体101の一例としては、CD-ROM、DVDディスク、又はUSBメモリ等の可搬型の記録媒体が挙げられる。また、補助記憶装置102の一例としては、HDD(Hard Disk Drive)又はフラッシュメモリ等が挙げられる。記録媒体101及び補助記憶装置102のいずれについても、コンピュータ読み取り可能な記録媒体に相当する。なお、動画像解析装置20、及び表示制御装置30は、GPU(Graphics Processing Unit)を有してもよい。そして、当該GPUにより、動画像、及び被写体の行動等を解析する処理を実行させてもよい。
【0023】
撮像端末10及び表示端末40のハードウェア構成は、表示制御装置30と同様でもよい。なお、撮像端末10は、
図2に示すハードウェア構成に加えて、動画像を撮影するカメラ(撮像装置)を有する。
【0024】
<構成>
≪動画像解析装置≫
次に、
図3を参照し、動画像解析装置20の構成について説明する。
図3は、実施形態に係る動画像解析装置20の構成の一例を示す図である。動画像解析装置20は、復号部211、符号化部212、取得部213、検出部214、出力部215、及び制御部216を有する。
【0025】
復号部211は、復号回路、または動画像解析装置20にインストールされた1以上のプログラムが、動画像解析装置20のCPUに実行させる処理により実現する。動画像解析装置20が、ビデオケーブル等を介して、符号化されていないRAWデータの動画像を撮像端末10から受信する場合は、復号部211を有しないようにしてもよい。
【0026】
符号化部212は、符号化回路、または動画像解析装置20にインストールされた1以上のプログラムが、動画像解析装置20のCPUに実行させる処理により実現する
なお、復号部211及び符号化部212の少なくとも一方をCPUにより実現する場合、CPUをマルチコアのプロセッサとし、CPUで実行する復号処理または符号化処理と、検出部214による特徴データ(メタデータ)を検出する処理とを異なるコアを用いて並列に処理するようにしてもよい。
【0027】
検出部214、出力部215、及び制御部216は、動画像解析装置20にインストールされた1以上のプログラムが、動画像解析装置20のCPUに実行させる処理により実現する。なお、動画像解析装置20は、検出部214、出力部215、または制御部216を実現する回路を備えてもよい。
【0028】
復号部211は、撮像端末10から受信した動画像を復号する。
【0029】
符号化部212は、HEVC(High Efficiency Video Coding)/H.265(以下で「HEVC」と称する。)、またはAVC(Advanced Video Coding)/H.264、VP9、AV1等の動画像の圧縮規格を用いて、復号部211により復号された動画像の各フレームを圧縮して符号化する。
【0030】
取得部213は、符号化部212により動画像の各フレームの圧縮乃至符号化処理に用いられているデータをそれぞれ取得する。
【0031】
検出部214は、動画像の各フレームと、取得部213により取得されたデータに基づいて、特徴データを検出する。
【0032】
出力部215は、符号化部212により動画像が符号化されたデータと、特徴データとを表示制御装置30に出力する。出力部215から表示制御装置30への動画像が符号化されたデータと特徴データの出力は、動画像のフレーム毎に出力してもよいし、複数フレーム分を纏めて出力してもよい。
【0033】
制御部216は、動画像解析装置20の全体の制御を行う。
【0034】
≪表示制御装置≫
次に、
図4を参照し、表示制御装置30の機能構成について説明する。
図4は、実施形態に係る表示制御装置30の機能ブロック図の一例を示す図である。表示制御装置30は、受信部31、蓄積部32、受付部33、及び表示制御部34を有する。これら各機能部は、表示制御装置30にインストールされた1以上のプログラムが、表示制御装置30のCPU104に実行させる処理により実現する。
【0035】
受信部31は、動画像が符号化されたデータと動画像のフレーム毎の特徴データを動画像解析装置20から受信する。なお、当該特徴データには、当該動画像データに基づいて検出された、被写体の移動、及び被写体の顔または体の向きの情報が含まれる。
【0036】
蓄積部32は、受信した動画像が符号化されたデータと特徴データとを蓄積(記憶)する。受付部33は、表示端末40から、操作データを受信することにより、操作を受け付ける。
【0037】
表示制御部34は、各時点における被写体の位置、被写体の移動方向、及び被写体の顔または体の向き等の被写体の行動を表す図形データを含む表示画面のデータを出力し、表示端末40の画面に表示する。
【0038】
<処理>
(被写体の行動を検出する処理)
次に、
図5、及び
図6を参照し、動画像解析装置20における被写体(人物等)の行動を検出する処理について説明する。
図5は、動画像解析装置20における被写体の行動を検出する処理の一例を示すフローチャートである。なお、以下の処理は、動画像中の各フレームに対して行われる。以下では、動画像中の任意の一フレームを、処理対象フレームと称する。
【0039】
まず、ステップS1において、動画像解析装置20の符号化部212は、処理対象フレームを圧縮して符号化する処理を行う。
【0040】
続いて、動画像解析装置20の符号化部212は、当該符号化の処理に用いられるデータを、メモリ装置に出力する(ステップS2)。符号化処理に用いられるデータには、例えば、符号化処理が行われる単位である各ブロック(CTU(Coding Tree Unit))のデータ、フレームの縮小画像、動画像において連続する複数のフレーム間の変化を示すデータ(当該各ブロックの動きを示すデータ)、同色の領域を示すデータ、及び当該各ブロックの輪郭のデータ等が含まれてもよい。
【0041】
なお、符号化部212によるステップS1の符号化処理と、検出部214による検出処理は、並列に実行されてもよい。
【0042】
続いて、動画像解析装置20の検出部214は、処理対象フレーム、及びメモリ装置に記憶されたデータを用いて、処理対象フレームに対する、被写体等の特徴を示す特徴データを検出する(ステップS3)。
図6は、処理対象フレームから特徴データを検出する処理の一例について説明する図である。動画像解析装置20の検出部214は、予め設定されている人体の各部位の長さのデータを用いて、処理対象フレームから、被写体の各関節の位置を推定する。この場合、動画像解析装置20の検出部214は、例えば、メモリ装置に記憶されたデータに基づいて、処理対象フレームにおいて探索する領域を決定する。そして、決定した領域内から、予め設定されている人体の各部位の長さのデータを用いて、処理対象フレームにおける、フレーム内の被写体の位置(座標)、被写体の顔、胴体、右手、左手、右足、左足の位置を検出する。
【0043】
図6の例では、処理対象フレームにおいて探索する領域601乃至604の各々において検出された、被写体611乃至被写体614のそれぞれの部位621乃至624が示されている。なお、検出部214は、例えば、ディープラーニング等の機械学習を用いたAIにより、特徴データを検出してもよい。このように、符号化処理に用いられるデータを利用することで、処理対象フレーム毎の特徴データを検出する処理の負荷を大きく削減することができる。
【0044】
続いて、動画像解析装置20の出力部215は、符号化部212により動画像が符号化されたデータと、動画像解析装置20の検出部214により検出された特徴データとを表示制御装置30に出力する(ステップS4)。
【0045】
上述した特徴データの検出処理によれば、例えば、監視カメラからの動画像及び音声を監視する監視カメラシステムにおいて、画像中の被写体の顔の位置及びサイズ、年齢、性別の推定情報、服の色やメガネ、帽子、鞄といった服装等に関する特徴データを検出できる。
【0046】
また、カメラの設置位置や向き、レンズの画角、歪、特性等が既知である場合や、所定のマーカ等で事前にカメラのキャリブレーションが行われている場合は、撮影された被写体の大きさや、カメラからの距離に関する特徴データを検出できる。
【0047】
また、認識した人や物の動きを追跡し、どのような動きを行ったかという行動または動作に関する特徴データを検出できる。この場合、特徴データには、例えば、顔(視線)、体(胴体)、足の向き、手や足の動き、各関節の位置、(顔の表情)等の情報と、これらを含めて推定した姿勢、行動や動作などの情報が含まれてもよい。なお、検出部214は、当該情報を、数フレームや数秒毎に検出するようにしてもよい。
【0048】
また、複数のカメラによりそれぞれ撮影された動画像により、比較的広範囲における行動を検出し、検出した行動の範囲を特徴データとしてもよい。これにより、被写体(人物等)や物が移動した軌跡を表示端末に表示することができる。
【0049】
<特徴データの検出処理の例>
以下で、特徴データを検出する処理の例について説明する。なお、以下の各例は、適宜組み合わせて実施することができる。
【0050】
≪特徴データの検出処理の例1≫
特徴データの検出処理の例1として、HEVC等の符号化処理中に得られるCTU(Coding Tree Unit)(「符号化処理に用いられるデータ」、及び「ブロック」の一例。)を用いて、背景以外の構造物、または背景に関する特徴データを比較的高速に検出する例について説明する。
【0051】
符号化部212は、HEVC等を用いて、動画像中の各フレーム(ピクチャ)の符号化処理を、CTUと称される正方画素ブロックの単位で行う。符号化部212は、HEVC等において、フレーム中の各ブロックの大きさを、フレーム画像中の輪郭の存在、及び輪郭の複雑さに応じて決定する。
【0052】
図7は、CTUの一例について説明する図である。符号化部212は、
図7に示すように、平坦な背景部分を、比較的大きいブロック(CB:Coding Block)501により分割する。また、符号化部212は、物体の輪郭を、比較的小さいブロック502により分割する。
【0053】
符号化部212は、CTUを決定するブロック分割処理が完了すると、CTUのデータを、メモリ装置に格納する。メモリ装置に格納されたCTUのデータには、構成する各色成分信号のブロックである各CTB(Coding Tree Block)の階層構造とCBサイズ、及び隣接するCTB等のデータが含まれる。
【0054】
これにより、例えば、符号化処理に用いられるデータであるCTUを用いて、空や壁等の背景と、人や建物等の構造を有する物体とを区別したり、蓄積されているデータから、構図が類似しているデータを抽出したりすることができる。
【0055】
また、検出部214は、当該CTUのデータを用いて、例えば、画像中の各オブジェクトの領域等を検出してもよい。この場合、検出部214は、例えば、被写体の人物等を検出対象とする場合、CBのサイズが所定値以下の領域を優先的に検索し、顔を検出する処理を実行してもよい。これにより、例えば、リアルタイムで動画像を解析する場合に、被写体の人物等の物体を検出する処理の精度をより向上させるとともに、当該処理をより高速化できる。この場合、被写体の人物等を検出するアルゴリズムとしては、公知のアルゴリズムを用いてもよい。また、CTUのデータを用いてCBのサイズが所定値(例えば、16×16)以下の領域のみを検索範囲としてもよい。これにより、従来の画像全体を探索範囲する方法と比較して、より高速に検出できる。
【0056】
また、検出部214は、例えば、空や道路等の背景を検出対象とする場合、CBのサイズが所定値(例えば、32×32)以上の領域を探索範囲として、背景を検出する処理を実行してもよい。
【0057】
≪特徴データの検出処理の例2≫
特徴データの検出処理の例2として、符号化処理中に得られる縮小画像(「符号化処理に用いられるデータ」の一例。)を用いて、物体の動きに関する特徴データを比較的高速に検出する例について説明する。
【0058】
符号化部212は、HEVCやAVC等において、動き補償のために、各フレームの縮小画像(予測画像)を生成する。符号化部212は、動き補償のための縮小画像を生成すると、生成した縮小画像のデータを、メモリ装置に格納する。
【0059】
また、検出部214は、当該縮小画像のデータを用いて、例えば、画像中の各オブジェクトの動き等を検出してもよい。この場合、検出部214は、例えば、複数の探索起点領域の候補を求め、複数の候補のなかから類似度の高い探索起点領域を選出し、選出した起点領域に含まれる探索起点及びその周囲を、等倍画像を用いて細かく探索してもよい。
【0060】
≪特徴データの検出処理の例3≫
特徴データの検出処理の例3として、符号化処理中に得られる、連続する複数のフレーム間の変化を示すデータ(ブロックの動きを示すデータ。「符号化処理に用いられるデータ」の一例。)を用いて、物体の動きに関する特徴データを比較的高速に検出する例について説明する。
【0061】
符号化部212は、HEVCやAVC等において、動き補償等のために、連続する複数のフレーム間の変化を示すデータを生成する。各フレーム間の変化を示すデータには、例えば、差分、及び動きベクトル等が含まれる。
【0062】
差分は、今回のフレームに含まれる所定の範囲の各画素の輝度と色差の値と、前回のフレームに含まれる当該所定の範囲の各画素の輝度と色差の値との差分絶対値和(SAD:Sum of Absolute Difference)、差分二乗和(SSD:Sum of Squared Difference)、絶対値変換差分和(SATD:Sum of Absolute Transformed Difference)等である。動きベクトルは、連続する各フレーム間において予測された符号化対象ブロックの移動方向を示すデータである。
【0063】
また、HEVCやAVC等では、予測ブロック(PU: Prediction Unit)ごとに動き補償予測が行われる。
【0064】
図8A、及び
図8Bは、HEVCにおける動き情報について説明する図である。隣接し合う各予測ブロックは、似たような動きを有すると考えられるため、HEVCでは、予測ブロック毎に別々の動きベクトルを符号化するのではなく、隣接し合う各予測ブロックの動きベクトルを統合して符号化する。
図8Aの例では、予測ブロック毎の動きベクトルが矢印801等により示されている。
図8Bの例では、隣接し合う各予測ブロックにて統合された動きベクトルが矢印802等により示されている。
【0065】
符号化部212は、動き補償のための当該各データを生成すると、生成した各データを、メモリ装置に格納する。
【0066】
また、検出部214は、当該各データを用いて、例えば、画像中の各オブジェクトの動き等を検出してもよい。この場合、検出部214は、所定数以上の予測ブロックの集合であって、各予測ブロックのサイズが所定値以下である予測ブロックの集合の動きが符号化部212により統合されている場合に、当該集合に含まれる各予測ブロックの領域を優先的に検索するようにしてもよい。これにより、例えば、リアルタイムで動画像を解析する場合に、動いている物体を検出する処理の精度をより向上させるとともに、当該処理をより高速化できる。
【0067】
≪特徴データの検出処理の例4≫
特徴データの検出処理の例4として、符号化処理中に得られる、フレームの複雑度を示すデータ(「符号化処理に用いられるデータ」の一例。)を用いて、複雑度に関する特徴データを比較的高速に検出する例について説明する。
【0068】
符号化部212は、HEVCやAVC等のイントラ予測において、1つのフレーム内の輝度、色差のSAD(差分絶対値和)、及びSATD(絶対値変換差分和)等の各データを算出する。
【0069】
符号化部212は、イントラ予測における当該各データを生成すると、生成した各データを、メモリ装置に格納する。
【0070】
<被写体の行動を表示する処理>
次に、
図9を参照し、表示制御装置30における被写体の行動を表示する処理について説明する。
図9は、被写体の行動を表示する処理の一例を示すフローチャートである。
【0071】
ステップS101において、表示制御装置30の受信部31は、動画像と特徴データを動画像解析装置20から受信し、蓄積部32に格納する。
図10は、特徴データ111の一例を示す図である。
図10に示す特徴データ111には、フレームIDに対応付けて、日時と、被写体ID毎の年齢、性別、身長(cm)、位置、及び向き等が記憶されている。フレームIDは、動画像におけるフレームの識別情報である。日時は、当該フレームが撮影された日時である。被写体IDは、当該フレームから検出された被写体の識別情報である。年齢は、当該フレームから推定された被写体の年齢である。性別は、当該フレームから推定された被写体の年齢である。身長は、当該フレームから推定された被写体の身長である。位置は、当該フレームを撮像した撮像端末10が設置されている空間における、当該被写体の位置である。向きは、当該空間における、当該被写体の顔または体の向きである。
【0072】
続いて、表示制御装置30の受付部33は、表示に関する条件を受け付ける(ステップS102)。ここで、表示制御装置30の受付部33は、例えば、表示対象とする被写体の属性、表示対象とする期間等の指定を受け付ける。
【0073】
表示制御装置30の受付部33は、例えば、建屋、季節、気温、天気、時間、日、週、月、曜日等の条件の指定を受け付けてもよい。
【0074】
続いて、表示制御装置30の表示制御部34は、指定された条件に応じて、被写体の行動を表す表示画面のデータを生成する(ステップS103)。
【0075】
続いて、表示制御装置30の表示制御部34は、生成した表示画面を、表示端末40に表示する(ステップS104)。
【0076】
図11A乃至
図11Cは、表示制御装置30の表示制御部34により表示端末40の画面に表示する、被写体の行動を表す表示画面の一例について説明する図である。
図11Aの例では、表示対象とする被写体の属性として、性別が「男性」、年齢が「20代」と指定されており、日付が「12月26日」、時間が「12:10~12:15」、フロアが「1F」と指定されている。表示制御装置30の表示制御部34は、指定された各条件を抽出条件の表示領域1001に表示するとともに、当該抽出条件に基づいて、12月26日の12:10~12:15の間に1階を訪れた20代の男性の被写体を表示対象としている。
図11Aの例では、表示対象とする被写体の属性として、性別が「男性」、年齢が「20代」と指定されているが、被写体の属性は未設定で表示可能としてもよい。未設定の属性については、選択可能なすべての属性が表示対象となる。
【0077】
図11Aの例では、表示制御装置30の表示制御部34は、棚1002A乃至棚1002Dの配置と、被写体A乃至被写体Eの行動とが表示されている。表示制御装置30の表示制御部34は、棚1002A乃至棚1002Dが配置された位置を、表示制御装置30において予め設定されているデータを用いて判定してもよいし、動画像解析装置20により動画像から検出された位置としてもよい。
【0078】
アイコン1011、アイコン1021、アイコン1031、アイコン1041、及びアイコン1051は、それぞれ、被写体A乃至被写体Eの、指定された期間における最後の時点(12:15)での位置を示す。なお、抽出条件の表示領域1001において、時間が「12:10~現在」と指定された場合は、アイコン1011等は、リアルタイムな被写体A等の現在の位置の変化を示す。
【0079】
以下では、被写体Aに関するアイコンについて説明するが、他の被写体に関するアイコンについても同様である。アイコン1011の尖った方向1012は、当該最後の時点での被写体Aでの顔または体の向きを示している。
【0080】
表示制御装置30の表示制御部34は、円1013、円1014A乃至円1014Jに示すように、被写体の滞在時間の長さに応じた大きさの図形データを、当該被写体が滞在している位置に表示する。この場合、表示制御装置30の表示制御部34は、例えば、被写体の一の時点における位置からの移動距離が閾値以下である時間長に応じた大きさの図形データを、当該位置に表示する。
【0081】
円1013は、アイコン1011の位置における被写体Aの滞在時間の長さを示す。当該滞在時間が長い程、円1013の面積(大きさ)を大きく表示する。円1014A乃至円1014Jの中心位置は、被写体Aがアイコン1011の位置に移動するよりも前の時点における被写体Aの位置を示している。なお、円1014Jの中心位置は指定された期間における最初の時点の被写体Aの位置を示している。矢印1015A乃至矢印1015Jは、それぞれ、円1013、円1014A乃至円1014Jの中心位置間の方向、すなわち、被写体Aの移動方向を示している。矢印が長いほど、移動速度が速いことを示す。
【0082】
円1013、円1014A乃至円1014Jは、例えば、所定の時間間隔(例えば、5秒毎)における被写体Aの位置を示している。また、円1013、円1014A乃至円1014Jに対応付けて、被写体Aが円1013、円1014A乃至円1014Jの中心位置に位置した時点から所定時間以内、または各中心位置から所定距離以内における、被写体Aの顔または体の向きが示されている。
図11Aの例では、円1013、円1014A乃至円1014Jについて、各円の中心からの角度に応じて所定数の領域に等分し、当該所定時間以内または当該所定距離以内における被写体Aの顔または体の向きの分布を、色の明るさで示している。
図11Aの例では、45度ずつ8つに分割された領域の色が暗い程(または明るい程)、被写体Aが長い時間、各円の中心から当該領域の円弧の方向を向いていたことを示している。
【0083】
図11Aの例では、各被写体に対するアイコンや円等の図形データを、同様の形状とする例について説明した。これに代えて、表示制御装置30の表示制御部34は、動画像解析装置20により推定された各被写体の性別、及び年齢等に応じて、各被写体に対する図形データの形状または色等の表示態様を、それぞれ異なるように表示させてもよい。例えば、アイコンや円等の図形データを点滅、形状・色の変更をし、アラーム通知機能としてもよい。また、移動経路の線の種類の変更、点線、破線、波線に変更してもよい。被写体に対するアイコンを停止時間に応じて、図形データの代わりに面積(大きさ)を大きく表示するようにしてもよい。
【0084】
図11Aの例では、表示端末40の画面に1の撮像端末10で撮像されたフレームに応じた特定の場所(地域、エリア、ゾーン)を表示する例が示されているが、表示制御部34は、複数の撮像端末10でそれぞれ撮像されたフレームに応じた、連続する場所を同時に表示してもよい。
図11Bの例では、表示制御部34は、4つの撮像端末10でそれぞれ撮像されたフレームに応じた場所1111乃至場所1114を同時に並べて表示している。この場合、表示制御部34は、4つの撮像端末10でそれぞれ撮像された各フレームに関するデータを連携し、フレーム内に表示する各被写体に対するアイコンを連続的に表示してもよい。
図11Bの例では、被写体Fは、移動経路1121を通り、場所1112から場所1111に移動している。また、被写体Gは、移動経路1122を通り、場所1112から場所1114を通り、場所1113に移動している。
【0085】
表示制御部34は、複数の撮像端末10でそれぞれ撮像されたフレームに応じた別の場所を切り替えて表示してもよい。
図11Cの例では、表示制御部34は、4つの撮像端末10でそれぞれ撮像されたフレームに応じた場所1131乃至場所1134を切り替えて表示している。
図11Cの例では、場所1131は、表示領域1001のフロアの項目で指定されている「1F」、すなわち建物の1階部分の場所である。場所1132乃至場所1134は、それぞれ、当該建物の2階乃4階部分の場所である。表示領域1001のフロアの項目の指定が変更されると、表示制御部34は、指定された場所を一番手前に表示する。
【0086】
図12A乃至
図12Bは、被写体の行動を表す表示画面の一例について説明する図である。
図12Aの例では、出入り口1201乃至出入り口1203にそれぞれ対応付けて、指定された期間等の条件により抽出された、入場者数1201A乃至1203A、及び退場者数1201B乃至1203Bが表示されている。
図12の画面において、出入り口1201が選択操作されると、表示制御装置30の表示制御部34は、
図12Bの画面を表示する。
【0087】
図12Bの例では、出入り口1201から入場し出入り口1202から退場した被写体の経路1211、及び出入り口1201から入場し出入り口1203から退場した被写体の経路1212が示されている。
【0088】
また、出入り口1202から入場し出入り口1201から退場した被写体の経路1213、及び出入り口1203から入場し出入り口1201から退場した被写体の経路1214が示されている。ここで、経路1211乃至経路1214の線が太い程、各径路を通過した被写体の数が多いことを表している。
図12Bの画面で、経路1211乃至経路1214のいずれかが選択操作されると、表示制御装置30の表示制御部34は、選択された経路を通過した各被写体の行動を、上述した
図10、
図11と同様の表示態様により表示する。
【0089】
図13は、被写体が手を伸ばした商品等の物品の位置を表す表示画面の一例について説明する図である。
図11、
図12A、または
図12Bの表示画面において、棚1002A乃至棚1002Dのいずれかが選択されると、表示制御装置30の表示制御部34は、選択された棚に対し、被写体が手を伸ばした商品等の位置を表す表示画面を表示する。
図13の例では、選択された棚における位置1301乃至位置1309に対する、1以上の被写体が手を伸ばした回数の分布を示している。表示制御装置30の表示制御部34は、例えば、位置1301乃至位置1309に対し、当該被写体が手を伸ばした回数が多い程、暗い色(または明るい色)で表示する。滞在位置1311乃至1313は、当該棚に当該被写体が手を伸ばしている際の、当該被写体の滞在位置であり、各滞在位置の円が大きい程、当該被写体が長く滞在していることが示されている。
【0090】
図14は、被写体の行動を表す表示画面の一例について説明する図である。円1401A乃至円1401Mは、
図11の円1013、円1014A乃至円1014J等と同様であり、被写体の位置や向き等を表している。
【0091】
図14の例では、表示制御装置30の表示制御部34は、図形データ1411乃至図形データ1415により、被写体が手を伸ばした各位置に配置されている各商品等を示している。また、表示制御装置30の表示制御部34は、図形データ1411乃至図形データ1415の領域内に、各商品等の名称(「物品の情報」の一例。)を表示させている。なお、表示制御装置30の表示制御部34は、被写体が手を伸ばした位置に商品等の図形データが配置されていない場合、例えば、被写体が手を伸ばした位置に、人間の手の形のアイコン等を表示させてもよい。なお、表示制御装置30の表示制御部34は、図形データ1411乃至図形データ1415が配置された位置、及び名称を、表示制御装置30において予め設定されているデータを用いて表示させてもよいし、動画像解析装置20により動画像から検出されたデータを用いて表示させてもよい。
【0092】
また、表示制御装置30の表示制御部34は、被写体により購入された商品等と、被写体が手を伸ばしたものの購入していない商品等を、例えば、色を異ならせる等、異なる表示態様で表示させてもよい。
図14の例では、表示制御装置30の表示制御部34は、図形データ1412、及び図形データ1414により、手に取って購入した商品等が配置されていた位置を示している。また、図形データ1411、図形データ1413、及び図形データ1415により、被写体が手を伸ばしたものの購入していない商品等が配置されていた位置を示している。
【0093】
なお、表示制御装置30の表示制御部34は、手に取って購入した商品等と、被写体が手を伸ばしたものの購入していない商品等を、動画像解析装置20により動画像から検出されたデータにより判定してもよい。この場合、動画像解析装置20の検出部214は、例えば、商品等が当該被写体によりレジの位置に持って行かれた場合に、購入したと推定してもよい。また、表示制御装置30の表示制御部34は、手に取って購入した商品等と、被写体が手を伸ばしたものの購入していない商品等を、動画像解析装置20により動画像から検出されたデータと、撮像端末10が設置されている店舗のPOS(Point Of Sales)システムから取得したデータとに基づいて判定してもよい。
【0094】
<変形例1>
動画像解析装置20の検出部214は、動画像から、棚、及び商品等の静止物の変化を検出し、表示制御装置30の表示制御部34は、
図11等の表示画面において、被写体の行動とともに、当該静止物の変化を示す図形データを表示させてもよい。これにより、物体の置き去り、忘れ物、万引き、商品の補充タイミング、商品等の配列の乱れ、火事、開閉が禁止されたドアの開閉等を検知できる。
【0095】
この場合、表示制御部34は、常設されている棚等や、被写体(人物)と認識する被写体以外の物をフレーム内で検出した場合、当該物を画像認識し、例えばバック、火、及び煙等の当該物を示す図形データを、当該物の位置に表示してもよい。
図15A乃至
図15Dは、忘れ物を報知する処理の一例について説明する図である。
図15Aの例では、表示制御部34は、棚1501乃至棚1503が設置されている場所において、所定の被写体が、移動経路1511で移動していることを示している。
図15Bは、
図15Aの状態から所定時間経過した状態の例である。
図15Bの例では、表示制御部34は、当該所定の被写体が、移動経路1512で移動していること、及び当該所定の被写体以外の被写体として認識したバッグ等の物品を示す図形データ1513を表示している。ここで、表示制御部34は、当該所定の被写体と、当該物品との距離が所定の閾値以下であるため、当該所定の被写体と、当該物品とを対応付けて記憶しておく。
【0096】
図15Cは、
図15Bの状態から所定時間経過した状態の例である。
図15Cの例では、当該所定の被写体が、移動経路1514で移動していることを示している。
図15Dは、
図15Cの状態から所定時間経過した状態の例である。
図15Dの例では、当該所定の被写体はフレーム内で検出されなくなっている。表示制御部34は、例えば、当該物品と当該所定の被写体との距離が所定の閾値以上となった場合、または、当該物品に対応付けて記憶している当該所定の被写体が検出されない状態が所定時間以上継続した場合、表示端末40にその旨を通知してもよい。または当該物体の近傍に設置されているデジタルサイネージ等のディスプレイにその旨を通知してもよい。
【0097】
<変形例2>
表示制御装置30の表示制御部34は、被写体が所定の行動をとった場合に、
通知を行うようにしてもよい。この場合、表示制御装置30の表示制御部34は、例えば、動画像解析装置20の検出部214により、被写体の転倒、うずくまり、立入禁止区間への立ち入り、徘徊等を検知した場合に、その旨を表示端末40に報知する。
【0098】
<変形例3>
表示制御装置30の表示制御部34は、例えば、被写体が迷っていることが検知された場合、表示端末40にその旨を通知する、または当該被写体の近傍に設置されているデジタルサイネージ等のディスプレイに、店舗の地図等を表示させてもよい。この場合、表示制御装置30の表示制御部34は、所定の位置での滞在時間が閾値以上であり、顔等の向きの分布のバラつきが所定の閾値以上であり周囲をしきりに見回している場合に、被写体が迷っていると判定してもよい。
【0099】
<その他>
上述した実施形態によれば、動画像データに基づいて検出された、被写体の移動、及び前記被写体の顔または体の向きを取得し、各時点における前記被写体の位置、前記被写体の移動方向、及び前記被写体の顔または体の向きをそれぞれ表す各図形データを表示する。これにより、被写体の行動を比較的容易に把握できる。
【0100】
上述した実施形態は、店舗において顧客が商品を手に取ったか、当該商品を購入したか等を分析するデジタルマーケティングシステム、画像から人を認識する監視カメラシステム等に適用できる。また、店舗において顧客の歩行経路を分析することで、フロアレイアウトの検討、火災時の避難経路検討、迷子検索に適応することができる。
【0101】
上述した実施形態は、個人を特定せずに行動を追跡することができプライバシーの保護をすることができる。また、個人を特定することで、行動を追跡することもできる。
【0102】
また、上述した実施形態は、医療施設・介護施設・老人ホーム・高齢者向け住宅において、施設利用者の行動を把握し、施設内で安全に過ごし事故を少なくするための経路を分析するために、画像から人を認識する監視カメラシステム等に適用できる。
【0103】
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【0104】
動画像解析装置20、及び表示制御装置30の各機能部は、例えば1以上のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。また、動画像解析装置20、及び表示制御装置30を一体の装置として構成してもよい。動画像解析装置20の各機能部のうち少なくとも一部を、表示制御装置30が有するようにしてもよい。
【符号の説明】
【0105】
1 通信システム
10 撮像端末
20 動画像解析装置
211 復号部
212 符号化部
213 取得部
214 検出部
215 出力部
216 制御部
30 表示制御装置
31 受信部
32 蓄積部
33 受付部
34 表示制御部
40 表示端末