(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-01
(45)【発行日】2024-11-12
(54)【発明の名称】情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
G06T 1/00 20060101AFI20241105BHJP
H04N 7/18 20060101ALI20241105BHJP
G06T 7/00 20170101ALI20241105BHJP
【FI】
G06T1/00 200E
H04N7/18 D
G06T7/00 510F
G06T1/00 340A
(21)【出願番号】P 2024104043
(22)【出願日】2024-06-27
【審査請求日】2024-07-01
【早期審査対象出願】
(73)【特許権者】
【識別番号】515029558
【氏名又は名称】セーフィー株式会社
(74)【代理人】
【識別番号】100128886
【氏名又は名称】横田 裕弘
(72)【発明者】
【氏名】橋本 貴博
(72)【発明者】
【氏名】沖 総一朗
(72)【発明者】
【氏名】中島 賢史
(72)【発明者】
【氏名】碇石 慶子
(72)【発明者】
【氏名】松木 辰真
(72)【発明者】
【氏名】前田 祐貴
(72)【発明者】
【氏名】平田 牧子
(72)【発明者】
【氏名】今野 裕也
(72)【発明者】
【氏名】木村 有希
(72)【発明者】
【氏名】寺田 裕也
【審査官】鈴木 明
(56)【参考文献】
【文献】特開2004-258764(JP,A)
【文献】特開2009-048447(JP,A)
【文献】特開2014-063251(JP,A)
【文献】国際公開第2020/136794(WO,A1)
【文献】特開2021-005300(JP,A)
【文献】特開2023-129429(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
H04N 7/18
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
カメラで撮影された映像を情報端末で表示させる情報処理システムであって、
前記映像から顔画像を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像と共に前記映像に含まれる顔画像を表示し、
ユーザーの指示に応じて前記顔画像を登録する、
情報処理システム。
【請求項2】
カメラで撮影された映像を情報端末で表示させる情報処理システムであって、
登録された複数の顔画像を表示し、
ユーザーの指示に応じて前記複数の顔画像から顔画像を選択し、
前記選択された顔画像に対応する人物を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像を表示する、
情報処理システム。
【請求項3】
請求項1に記載の情報処理システムであって、
前記表示する顔画像は、同一人物の複数の顔画像である、
情報処理システム。
【請求項4】
請求項3に記載の情報処理システムであって、
前記複数の顔画像は、同一人物を互いに異なる角度から撮影した顔画像を含む、
情報処理システム。
【請求項5】
請求項4に記載の情報処理システムであって、
前記複数の顔画像は、正面を向いている顔画像と、右を向いている顔画像と、左を向いている顔画像と、体全体を含んでいる顔画像と、のうち少なくとも1つ以上を含む、
情報処理システム。
【請求項6】
請求項1に記載の情報処理システムであって、
前記顔画像と共に前記顔画像が登録済か否かを識別可能な態様で表示する、
情報処理システム。
【請求項7】
請求項1に記載の情報処理システムであって、
前記顔画像と共に、前記顔画像を登録するためのボタンを表示する、
情報処理システム。
【請求項8】
請求項1又は請求項2に記載の情報処理システムであって、
前記映像と共に、前記映像に関するタイムラインを表示する、
情報処理システム。
【請求項9】
請求項8に記載の情報処理システムであって、
前記タイムラインは、登録された顔画像が映っている部分を識別可能な態様で表示する、
情報処理システム。
【請求項10】
請求項8に記載の情報処理システムであって、
前記タイムラインを含む画面を介した所定の操作に基づき前記映像に関するムービークリップを作成する画面を表示する、
情報処理システム。
【請求項11】
請求項1又は請求項2に記載の情報処理システムであって、
前記顔画像を含む映像の検索は、ユーザーにより入力された検索条件に基づいて実行し、
前記検索条件は、期間と、キーワードと、のうち少なくとも1つ以上を含む、
情報処理システム。
【請求項12】
請求項1又は請求項2に記載の情報処理システムであって、
前記複数の映像は、前記複数の映像それぞれを撮影したカメラごとに縮小表示画像の態様で表示される、
情報処理システム。
【請求項13】
請求項1又は請求項2に記載の情報処理システムであって、
登録された前記顔画像が映像より検知された場合に、ユーザーに通知する、
情報処理システム。
【請求項14】
請求項13に記載の情報処理システムであって、
登録された前記顔画像が映像より検知された場合の通知先は、前記複数のカメラそれぞれごと、又はカメラのグループごとに設定可能に構成される、
情報処理システム。
【請求項15】
請求項1又は請求項2に記載の情報処理システムであって、
登録された前記顔画像は、ユーザーの指示に基づいて変更、又は顔画像を追加することが可能である、
情報処理システム。
【請求項16】
請求項1又は請求項2に記載の情報処理システムであって、
前記顔画像は、前記選択された映像に含まれる人物であることが分かる態様で表示される、
情報処理システム。
【請求項17】
請求項1又は請求項2に記載の情報処理システムであって、
前記映像と共に、前記選択された映像に含まれる人物のうち顔が判別可能な人物の画像を表示する、
情報処理システム。
【請求項18】
カメラで撮影された映像を情報端末で表示させる情報処理システムが実行する情報処理方法であって、
前記映像から顔画像を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像と共に前記映像に含まれる顔画像を表示し、
ユーザーの指示に応じて前記顔画像を登録する、
情報処理方法。
【請求項19】
カメラで撮影された映像を情報端末で表示させる情報処理システムが実行する情報処理方法であって、
登録された複数の顔画像を表示し、
ユーザーの指示に応じて前記複数の顔画像から顔画像を選択し、
前記選択された顔画像に対応する人物を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像を表示する、
情報処理方法。
【請求項20】
カメラで撮影された映像を情報端末で表示させるコンピュータに、
前記映像から顔画像を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像と共に前記映像に含まれる顔画像を表示し、
ユーザーの指示に応じて前記顔画像を登録する、
処理を実行させるためのプログラム。
【請求項21】
カメラで撮影された映像を情報端末で表示させるコンピュータに、
登録された複数の顔画像を表示し、
ユーザーの指示に応じて前記複数の顔画像から顔画像を選択し、
前記選択された顔画像に対応する人物を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像を表示する、
処理を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には表示装置に複数のカメラアイコンを表示させる処理と、表示装置に表示された複数のカメラアイコンの中から、少なくとも二つ以上のカメラアイコンを囲う入力を受け付ける処理と、少なくとも二つ以上のカメラアイコンを囲う入力を受け付けたことに応じて、少なくとも二つ以上のカメラアイコンのそれぞれに対応するカメラが撮影した映像に基づいて、人物の検索を行う処理と、を一以上のコンピュータに実行させるプログラムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
カメラの設置場所の拡大に伴い、カメラで撮影された映像から特定の人物を探したいというニーズが高まっている。
【課題を解決するための手段】
【0005】
カメラで撮影された映像を情報端末で表示させる情報処理システムが提供される。情報処理システムは、映像から顔画像を含む映像を検索し、検索の結果として複数の映像を表示し、ユーザーの指示に応じて複数の映像から映像を選択し、選択された映像と共に映像に含まれる顔画像を表示し、ユーザーの指示に応じて顔画像を登録する。
【図面の簡単な説明】
【0006】
【
図1】
図1は、情報処理システムのシステム構成の一例を示す図である。
【
図2】
図2は、サーバー装置のハードウェア構成の一例を示す図である。
【
図3】
図3は、クライアント装置のハードウェア構成の一例を示す図である。
【
図4】
図4は、監視カメラのハードウェア構成の一例を示す図である。
【
図5】
図5は、情報処理システムにおける顔画像の登録に係る情報処理の一例を示すフローチャートである。
【
図6】
図6は、一覧表示画面の一例を示す図である。
【
図7】
図7は、カレンダー画面を重畳表示させた一例を示す図である。
【
図8】
図8は、映像詳細画面の一例を示す図(その1)である。
【
図9】
図9は、映像詳細画面の一例を示す図(その2)である。
【
図12】
図12は、ムービークリップの作成画面の一例を示す図である。
【
図13】
図13は、情報処理システムにおける顔画像検索に係る情報処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0007】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせることができる。
【0008】
<実施形態1>
1.システム構成図
図1は、情報処理システム1000のシステム構成の一例を示す図である。
図1に示されるように、情報処理システム1000は、システム構成として、サーバー装置100と、クライアント装置110と、クライアント装置120と、複数の監視カメラ160と、を含む。サーバー装置100と、クライアント装置110と、クライアント装置120と、監視カメラ160とは、ネットワーク150を介して通信可能に接続されている。ネットワーク150は、WAN(Wide Area Network)及びインターネットの何れか又は双方を含んでもよい。ネットワーク150はネットワーク150に接続される複数の装置同士を有線及び無線を介して通信可能に構成されている。
【0009】
情報処理システム1000は、映像検索のサービスを提供するシステムである。
【0010】
サーバー装置100は、情報処理システム1000の主な機能を提供する装置であり、以下に示す実施形態の主な処理を実行する。サーバー装置100は、複数の監視カメラ160で撮影された映像をクライアント装置110又はクライアント装置120で出力(表示)させる装置である。
【0011】
監視カメラ160は、監視及び/又は記録を目的として設置されるカメラである。明細書では所定の店舗の複数個所それぞれに監視カメラ160が設置されているものとして説明を行う。複数個所としては例えば、店舗の複数の出入り口(例えば、入店口東口、入店口西口、出口専用口等)である。なお、これらは例であって監視カメラ160が設置される場所を限定するものではない。
図1では簡略化のため監視カメラ160を3台しか示していないが、2台であってもよいし、4台以上であってもよい。複数の監視カメラ160が情報処理システム1000に含まれていればよい。また明細書では1つの店舗に複数のカメラが設置されているものとして説明を行うが、複数の店舗それぞれに複数のカメラが設置されていてもよい。
【0012】
クライアント装置110は、監視カメラ160の所有者又は管理者(以下、単に所有者という)が操作する端末装置である。クライアント装置110には、後述する
図17及び
図18に示されるような画面が表示される。
【0013】
クライアント装置120は、監視カメラ160が設置される店舗の管理者等が操作する端末装置である。クライアント装置120には、後述する
図6~
図12、
図14~
図16に示されるような画面が表示される。
【0014】
ここで、特許請求の範囲に記載の情報処理システムは、複数の装置で構成されてもよいし、一つの装置で構成されてもよい。特許請求の範囲に記載の情報処理システムが一つの装置で構成される場合、その装置の一例はサーバー装置100である。特許請求の範囲に記載の情報処理システムが複数の装置で構成される場合、複数の装置の例は、サーバー装置100及び複数の監視カメラ160のうち少なくとも1つ以上の監視カメラ160及びクライアント装置110又はクライアント装置120、又はサーバー装置100の機能を提供する複数のサーバー装置で構成されたクラウドサーバー等である。
【0015】
2.ハードウェア構成
(1)サーバー装置100のハードウェア構成
図2は、サーバー装置100のハードウェア構成の一例を示す図である。
図2に示されるように、サーバー装置100は、ハードウェア構成として、制御部210と、記憶部220と、通信部230と、内部バス240と、を含む。制御部210と、記憶部220と、通信部230と、は内部バス240を介して電気的に接続されている。
【0016】
制御部210は、CPU(Central Processing Unit)等であって、サーバー装置100の全体を制御する。
【0017】
記憶部220は、HDD(Hard Disk Drive)、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid Sate Drive)等の何れか、又はこれらの任意の組み合わせであって、プログラム、制御部210がプログラムに基づき処理を実行する際に利用するデータ等を記憶する。記憶部220は、記憶媒体の一例である。制御部210がプログラムに基づき処理を実行する際に利用するデータとしては、例えば、監視カメラ160から送られてきた映像データ、検知対象の顔画像等、検知対象に関するデータ、後述する
図17及び
図18等で設定される送信先に関するデータ等がある。
【0018】
明細書では制御部210がプログラムに基づき処理を実行する際に利用するデータは記憶部220に記憶されるものとして説明するが、サーバー装置100と通信可能な他の装置の記憶部等に記憶されていてもよい。データは、制御部210が参照又は取得可能であればどの装置の記憶部に記憶されていてもよい。制御部210が、記憶部220に記憶されているプログラムに基づき、処理を実行することによって、サーバー装置100の機能及び後述する
図5及び
図13に示されるフローチャートの処理等が実現される。なお、この処理は主にサーバー装置100が実行するものとして説明するが、その代わりにクライアント装置110又はクライアント装置120、複数の監視カメラ160の何れかが実行することとしてもよい。
【0019】
通信部230は、サーバー装置100をネットワーク150に接続し、他の装置との通信を司る。
【0020】
なお、制御部210、記憶部220、通信部230の各ハードウェア構成は1つに限られない。例えば、複数の制御部がサーバー装置100に含まれてもよい。以下に示すクライアント装置110及びクライアント装置120も同様である。
【0021】
(2)クライアント装置110/120のハードウェア構成
図3は、クライアント装置110/120のハードウェア構成の一例を示す図である。
図3に示されるように、クライアント装置110は、ハードウェア構成として、制御部310と、記憶部320と、入力部330と、出力部340と、通信部350と、内部バス360と、を含む。制御部310と、記憶部320と、入力部330と、出力部340と、通信部350と、は内部バス360を介して電気的に接続されている。
【0022】
制御部310は、CPU等であって、クライアント装置110の全体を制御する。
【0023】
記憶部320は、HDD、ROM、RAM、SSD等の何れか、又はこれらの任意の組み合わせであって、プログラム、制御部310がプログラムに基づき処理を実行する際に利用するデータ等を記憶する。記憶部320は、記憶媒体の一例である。
【0024】
明細書では制御部310がプログラムに基づき処理を実行する際に利用するデータは記憶部320に記憶されるものとして説明するが、クライアント装置110と通信可能な他の装置の記憶部等に記憶されていてもよい。データは、制御部310が参照又は取得可能であればどの装置の記憶部に記憶されていてもよい。制御部310が、記憶部320に記憶されているプログラムに基づき、処理を実行することによって、クライアント装置110の機能等が実現される。
【0025】
入力部330は、操作者の操作に応じて情報をクライアント装置110に入力する装置である。入力部330は、ユーザーによってなされた操作入力を受け付ける。操作入力は、命令信号として内部バス360を介して制御部310に転送される。制御部310は、必要に応じて、転送された命令信号に基づいて所定の制御及び/又は演算を実行し得る。入力部330は、クライアント装置110の筐体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部330は、出力部340と一体となってタッチパネルとして実施されてもよい。入力部330がタッチパネルとして実施される場合、ユーザーは、入力部330に対してタップ操作、スワイプ操作等を入力することができる。入力部330としては、タッチパネルに代えて、スイッチボタン、マウス、トラックパッド、キーボード等が採用することができる。
【0026】
出力部340は、例えば、ディスプレイに代表される表示部であって、ユーザーが操作可能なグラフィカルユーザインターフェース(Graphical User Interface:GUI)の画面として情報を出力(表示)する装置である。出力部340は、クライアント装置110の筐体に含まれるものであってもよいし、外付けされるものであってもよい。より具体的には、出力部340は、液晶ディスプレイ、有機EL(Electron-Luminescence)ディスプレイ、又はプラズマディスプレイ等の表示デバイスとして実施され得る。これらの表示デバイスは、クライアント装置110の種類に応じて使い分けて実施されることが好ましい。
【0027】
通信部350は、クライアント装置110をネットワーク150に接続し、他の装置との通信を司る。
【0028】
クライアント装置120のハードウェア構成もクライアント装置110のハードウェア構成と同様である。
【0029】
なお、明細書ではクライアント装置110及びクライアント装置120の例としてPC(Personal Computer)を用いて説明する。しかし、クライアント装置110及びクライアント装置120は、スマートフォン、タブレット型コンピュータ等であってもよい。クライアント装置は、後述するような画面を表示し、画面等を介したユーザー操作を受け付け、サーバー装置100に情報を送信することができればどのような装置であってもよい。
【0030】
(3)監視カメラ160のハードウェア構成
図4は、監視カメラ160のハードウェア構成の一例を示す図である。
図4に示されるように、監視カメラ160は、ハードウェア構成として、制御部410と、記憶部420と、撮影部430と、通信部440と、内部バス450と、を含む。制御部410と、記憶部420と、撮影部430と、通信部440と、は内部バス450を介して電気的に接続されている。
【0031】
制御部410は、CPU等であって、監視カメラ160の全体を制御する。
【0032】
記憶部420は、HDD、ROM、RAM、SSD等の何れか、又はこれらの任意の組み合わせであって、プログラム、制御部410がプログラムに基づき処理を実行する際に利用するデータ等を記憶する。記憶部420は、記憶媒体の一例である。
【0033】
明細書では制御部410がプログラムに基づき処理を実行する際に利用するデータは記憶部420に記憶されるものとして説明するが、監視カメラ160と通信可能な他の装置の記憶部等に記憶されていてもよい。データは、制御部310が参照又は取得可能であればどの装置の記憶部に記憶されていてもよい。制御部410が、記憶部420に記憶されているプログラムに基づき、処理を実行することによって、監視カメラ160の機能等が実現される。
【0034】
撮影部430は、被写体を撮影するカメラである。カメラには例えばイメージセンサー、レンズ及びIRカットフィルター等が含まれる。
【0035】
通信部440は、監視カメラ160をネットワーク150に接続し、他の装置との通信を司る。
【0036】
3.情報処理
以下、実施形態1の情報処理を説明する。
【0037】
(1)処理の概要
(1-1)顔画像登録
制御部210は、情報処理システム1000に含まれる監視カメラ160で撮影されている映像から顔画像が含まれる映像を検索し、顔画像が含まれる複数の映像を検索結果として出力(表示)する。制御部210は、検索結果に含まれる複数の映像からユーザーの選択操作に応じて映像を選択し、選択された映像と共に映像に含まれる人物の顔画像を出力(表示)する。制御部210は、ユーザーの指示に応じて顔画像を登録する。
【0038】
このような処理を実行することによって、簡単に映像から人物を探し出し、気になる人物の顔画像を情報処理システム1000に登録することができる。
【0039】
(1-2)顔画像検索
制御部210は、登録された複数の顔画像を出力(表示)する。制御部210は、ユーザーの選択操作に応じて複数の顔画像から顔画像を選択し、選択された顔画像を含む映像を検索し、選択された顔画像が含まれる複数の映像を検索結果として出力(表示)する。制御部210は、検索結果に含まれる複数の映像からユーザーの選択操作に応じて映像を選択し、選択された映像を出力(表示)する。
【0040】
このような処理を実行することによって、登録された顔画像から選択した顔画像の人物の映像を検出し、出力することができる。
【0041】
(2)処理の詳細
(2-0)前処理
まず、事前の設定として、顔の正面角度と判定する角度、正面角度と十分差があると判定する角度差、信頼のおける画像pixel数、ベストショット取得指定時間、等を設定しておく。これらの設定は、例えばクライアント装置120を介したユーザーの指示に応じて設定され、各監視カメラ160(又はサーバー装置100)に記憶される。
【0042】
そして、本システムでは基本的に各監視カメラ160が映像を撮影してサーバー装置100に送信して記憶する処理を常時実行するが、その際にベストショットの抽出処理を併せて行うものとする。ここで、ベストショットとは、同一人物を異なる所定の角度から撮影した顔画像(又は全身画像)として最適なものであり、後述する
図8及び/又は
図10の顔画像(740、750、760、770、910、920、930、940)に対応する。なお、この処理は主に各監視カメラ160側で実行するが、サーバー装置100側で実行してもよい。カメラ側で処理を実行するメリットは、その分、サーバー側の処理負荷及び利用料金が軽減されることにあるが、その反面カメラ側で該当する処理を行うためのスペックが要求されることになる。
【0043】
ベストショットの抽出処理の詳細は、次の通りである。まず、監視カメラ160は、カメラの映像から、人の全身像をトラッキングする。次に、全身像のデータから顔を検出し、追跡する。そして、追跡した顔から角度を検出し、顔の正面角度範囲内に収まっている画像を、ベストショットの1stとし、顔の角度を記録する。ベストショットの1stは、例えば顔の正面画像を検出するAIモデルを用いて、そのスコアが最も高くなったものを採用してもよい。さらに、追跡した顔から角度を検出し続け、ベストショット1stの顔の角度に対して正面角度との角度差以上の顔があったら、ベストショット2ndとして保存する。ベストショットの2ndは、例えばカメラに対する顔の左向き(又は右向き)画像を検出するAIモデルを用いて、そのスコアが最も高くなったものを採用してもよい。さらに、ベストショット1st,2nd両方と角度差がある画像をベストショット3rdとして保存する。ベストショットの3rdは、例えばカメラに対する顔の右向き(又は左向き)画像を検出するAIモデルを用いて、そのスコアが最も高くなったものを採用してもよい。さらに、ベストショット1st,2nd,3rdのうち少なくとも何れか1つ以上に対応する人物について、その人物の全身画像(又はバストアップ画像等)をベストショット4thとして保存してもよい。バストアップ画像とは、人物の上半身が写った画像のことである。ベストショットの4thは、例えば全身画像(又はバストアップ画像等)を検出するAIモデルを用いて、そのスコアが最も高くなったものを採用してもよい。なお、追跡した顔を検出し続け、正面角度範囲内に収まっている画像で、信頼のおける画像pixel数を上回る画像があった場合、ベストショット1stを入れ替えてもよい。同様に、2nd,3rd,4thも入れ替えてもよい。また、ベストショット取得の指定時間を超えた場合、ベストショット抽出を停止してもよい。また、ベストショット1st,2nd,3rd,4thは夫々の観点で最もスコアが高かったものを採用するとしたが、これに加え夫々において次点以降のスコアのものも含めた複数採用することとしてもよい。そして、トラッキングが終了した時点で、ベストショット1st,2nd,3rd,4thを、夫々の画像を撮影したカメラ及び日時を示すメタデータとともに、サーバー装置100に送信する。監視カメラ160は、ベストショット1st,2nd,3rd,4thと、夫々の画像を撮影したカメラ及び日時を示すメタデータとを受信したうえで、それら画像同士/各画像とメタデータとを対応付けて記憶する。なお、この段階で、ベストショット1st,2nd,3rdに基づいて顔画像の平均処理を行い、顔の特徴量を計算したうえで、画像及びメタデータと対応付けて記憶しておいてもよい。以下、これら対応付けられた情報のセット(ベストショット1st,2nd,3rd,4th/夫々の画像を撮影したカメラ及び日時を示すメタデータ/顔の特徴量)を、ベストショット情報と呼ぶ。ベストショット情報は、人物ごと/シーンごとに、互いに異なる複数のベストショット情報として記憶される。
【0044】
(2-1)顔画像登録
図5は、情報処理システム1000における顔画像の登録に係る情報処理の一例を示すフローチャートである。なお、この処理は主にサーバー装置100が実行するものとして説明するが、その代わりにクライアント装置110又はクライアント装置120、複数の監視カメラ160の何れかが実行することとしてもよい。
【0045】
ステップS510において、制御部210は、情報処理システム1000に含まれる監視カメラ160で撮影された映像から顔画像が含まれる映像を検索する。具体的には、まず、前述した前処理にて記憶された複数のベストショット情報を読み出す。そして、夫々のベストショット情報について、ベストショット1st(又は4th)を撮影したカメラ及び日時を示すメタデータに基づいて、映像を特定する。
【0046】
なお、ステップS510は次のように実現してもよい。情報処理システム1000に含まれる複数の監視カメラ160で撮影された映像は、ネットワーク150を介してサーバー装置100に送信され、記憶部220等の所定の記憶領域に記憶される。映像は、どの監視カメラ160で撮影された映像か識別可能な態様で記憶部220等の所定の記憶領域に記憶される。どの監視カメラ160で撮影された映像か識別可能な態様としては、監視カメラごとに異なるフォルダ(ディレクトリ)が記憶部220等に作成され、フォルダ内に映像が記憶されてもよいし、映像のファイル名に監視カメラを識別する識別情報が記述されてもよいし、映像のファイルのメタデータ内に監視カメラを識別する識別情報が記述されてもよい。また、映像は、いつ撮影された映像か識別可能な態様で記憶部220等の所定の記憶領域に記憶される。いつ撮影された映像か識別可能な態様としては、日付ごとに異なるフォルダ(ディレクトリ)が記憶部220等に作成され、フォルダ内に映像が記憶されてもよいし、映像のファイル名に映像が撮影された日時情報が記述されてもよいし、映像のファイルのメタデータ内に映像が撮影された日時情報が記述されてもよい。制御部210は、記憶部220等の所定の記憶領域に記憶された映像から顔画像が含まれる映像を検索し、検索結果を取得する。
【0047】
例えば、制御部210は、映像を学習済みモデルに入力する。この学習済みモデルは、映像を入力データ、映像に顔画像が含まれるか否か、及び、映像に顔画像が含まれる場合は顔画像の人物が出現してから消失するまでの時間情報を出力データとして学習された学習済みモデルである。さらに、学習済みモデルは、同じ映像に複数の顔画像が含まれる場合には複数の顔画像それぞれの人物が出現してから消失するまでの時間情報を出力データとして学習された学習済みモデルである。
制御部210は、学習済みモデルから映像に顔画像が含まれるか否かの情報、及び、映像に顔画像が含まれる場合は顔画像の人物が出現してから顔画像の人物が消失するまでの時間情報を検索結果として取得する。
【0048】
ステップS520において、制御部210は、検索結果に基づき、顔画像が含まれる映像の顔画像が出現したタイミングの縮小画像(以下、単にサムネイルともいう)を含む一覧表示画面を生成する。制御部210は、生成した一覧表示画面をクライアント装置120に送信し、クライアント装置120の出力部に表示されるよう制御する。
【0049】
図6は、一覧表示画面600の一例を示す図である。
図6に示される一覧表示画面600には、人物映像タグ610と、人物映像領域670と、が含まれる。人物映像タグ610は、画面のサイドメニューに含まれる。なお、サイドメニューが含まれる画面においては、サイドメニューを含めた全体を画面と言ってもよいし、サイドメニューは含めない部分を画面と言ってもよい。以下の画面においても同様である。人物映像タグ610が選択されると、上述したステップS510及びステップS520の処理が実行され、人物映像領域670に検索結果のサムネイルが表示される。
図6の例では一覧表示画面600において人物映像タグ610が選択された状態であることが示されている。
【0050】
人物映像領域670のデバイスセクション620には入店口東口の監視カメラ160で撮影された映像から検知された人物のサムネイルの一覧が表示されている。サムネイルのそれぞれには人物のトラッキング開始時間(不図示)が表示されてもよい。監視カメラ160で撮影された映像から検知された人物のサムネイルの一覧として
図6では3つが表示されているがこれに限定されるものではない。画面の大きさに応じて画面に表示するサムネイルの数は変化させてもよい。また「もっと見るボタン」が選択されると、制御部210は、監視カメラ160で撮影された映像から検知された人物のサムネイルをさらに表示させるよう制御する。
【0051】
人物映像領域670のデバイスセクション630には入店口西口の監視カメラ160で撮影された映像から検知された人物のサムネイルの一覧が表示されている。
人物映像領域670のデバイスセクション640には出口専用口の監視カメラ160で撮影された映像から検知された人物のサムネイルの一覧が表示されている。
なお、画面に含まれるデバイスセクションの並びは、サムネイルがあるデバイス(監視カメラ160)、かつ、サムネイルに表示されるトラッキング開始時間が新しい順に一覧表示画面600の先頭(画面の一番上)から順に表示される。後述する
図15の一覧表示画面1300においても同様である。
【0052】
一覧表示画面600においては、検索結果として出力される複数の映像は、複数の映像それぞれを撮影した撮影デバイスごとに縮小表示画像の態様で出力(表示)されている。
ステップS520の処理は、顔画像が含まれる複数の映像それぞれの縮小画像を検索結果として出力(表示)する処理の一例である。
【0053】
一覧表示画面600には、キーワード入力領域650と、期間入力領域660と、が含まれる。キーワード入力領域650は、キーワードを入力可能な領域である。キーワード入力領域650においてキーワードが入力されると、制御部210は、キーワードに基づき、監視カメラ160のデバイス名、監視カメラ160を識別可能な監視カメラ160のシリアル番号、及び監視カメラ160に設定されているデバイスタグ等を検索する。そして、制御部210は、該当する監視カメラ160の映像から顔画像を検索し、検索結果を人物映像領域670に表示させる。この処理は、画面を介して入力された検索条件に基づき顔画像が含まれる映像を検索する処理の一例である。
【0054】
期間入力領域660は、期間を入力可能な領域である。制御部210は、期間入力領域660が選択されると、一覧表示画面600にカレンダー画面を重畳表示させる。
図7は、カレンダー画面1510を重畳表示させた一例を示す図である。
カレンダー画面1510は、日付及び曜日を表形式で表示する画面であり、検索対象の映像の開始時間と終了時間とを選択可能に構成されている。カレンダー画面1510において期間(開始時間と終了時間と)が入力されると、制御部210は、入力された期間において撮影された映像を検索対象として検索を行い、検索結果を人物映像領域670に表示させる。この処理は、画面を介して入力された検索条件に基づき顔画像が含まれる映像を検索する処理の一例である。
図7の例では、期間として2024年3月29日から2024年4月16日までが選択されている。なお、期間入力領域660は期間として2024年3月29日以降等と指定可能に構成されていてもよい。すなわち、期間としてある時点以降と指定可能に構成されていてもよい。同様に期間入力領域660は期間として2024年4月16日以前等と指定可能に構成されてもよい。すなわち、期間としてある時点までと指定可能に構成されていてもよい。
【0055】
上述したように、一覧表示画面600は、期間と、キーワードと、のうち少なくとも1つ以上の情報を検索条件として入力可能に構成されている。なお、一覧表示画面600を映像が撮影された撮影デバイスを検索条件として入力可能に構成するようにしてもよい。
【0056】
図6の人物映像領域670においてサムネイルの一つが選択されると、選択されたサムネイルを識別する識別情報を含むサムネイル選択情報がクライアント装置120からサーバー装置100に送信される。
【0057】
図5のステップS530において、制御部210は、サムネイル選択情報を受信したか否かを判定する。制御部210は、サムネイル選択情報を受信した場合には、ステップS540に処理を進め、サムネイル選択情報を受信していない場合には、ステップS520に処理を戻す。
【0058】
ステップS540において、制御部210は、サムネイル選択情報で識別されるサムネイルの映像を選択する。
ステップS550において、制御部210は、選択した映像のタイムラインと共に映像に含まれる人物の顔画像を含む映像詳細画面を生成する。より具体的には、制御部210は、S540で選択された映像について、ベストショット情報に基づいて対応するベストショット1st,2nd,3rd,4thを特定し、映像のタイムラインとともに表示するための映像詳細画面を生成する。制御部210は、生成した映像詳細画面をクライアント装置120に送信し、クライアント装置120の出力部に表示されるよう制御する。
【0059】
図8は、映像詳細画面700の一例を示す図(その1)である。映像詳細画面700には表示領域790が含まれる。表示領域790には、該当する監視カメラ160で撮影された映像が表示される。映像には人物735が含まれる。人物735はサムネイルで選択された映像に含まれる人物である。また
図8では簡略化のため省略してあるが映像には背景736が含まれる。背景736は該当する監視カメラ160で撮影される街並み、室内、自然風景等が該当する。表示領域790に人物735及び背景736が含まれることにより、操作者は、人物がどのような状況で何をしているのか等を把握することができる。
【0060】
映像詳細画面700にはタイムライン710が含まれる。タイムライン710は、表示領域790に表示される映像の時間を示すものである。より具体的に説明すると、タイムラインは、映像の開始時点から映像の終了時点まで時間軸を帯状に表示したものである。本実施形態のタイムラインには、目盛りとして開始時点からの経過時間を表示している。ただし、タイムラインには、目盛りとして時刻又は日時を表示してもよい。再生位置表示オブジェクト720は、表示領域790に表示されている映像の撮影日時を示すオブジェクト(GUI部品)である。再生位置表示オブジェクト720が一番左にあるときは映像の再生の開始位置であり、一番右にあるときは映像の再生の終了位置である。再生位置表示オブジェクト720は、表示領域790で再生されている映像のタイムライン710上の位置を示す。クライアント装置120の操作者(監視カメラ160が設置される店舗の管理者等)は、再生位置表示オブジェクト720を操作して、表示領域790に表示されている映像の撮影日時を指定することもできる。フラグ730は、タイムライン710に表示される、映像に人物が映っている期間を示すフラグである。フラグ730は一番左の位置の時刻に人物が現れたことを示し、一番右の位置の時刻に人物が消えたことを示している。
制御部210は、選択された映像に関するタイムラインを出力する。タイムラインは登録された顔画像の人物が映っている部分と顔画像の人物が映っていない部分とを識別可能な態様で出力される。
【0061】
顔画像表示領域795には、表示領域790に表示されている映像に映っている人物の顔画像が表示される。
図8の例では、顔画像表示領域795に、顔画像740、顔画像750、顔画像760、顔画像770が含まれている。
顔画像740は、監視カメラ160に対して正面を向いている顔画像である。これは、表示された映像に対応するベストショット1stである。両目が映っている顔画像は監視カメラ160に対して正面を向いている顔画像と言ってもよい。また顔の向きが監視カメラ160に向いている顔画像を、正面を向いている顔画像と言ってもよい。また視点が監視カメラ160の方向にある顔画像を、正面を向いている顔画像と言ってもよい。
顔画像750は、監視カメラ160に対して左を向いている顔画像である。これは、表示された映像に対応するベストショット2ndである。両目ではなく右目だけが映っている顔画像は監視カメラ160に対して左を向いている顔画像と言ってもよい。また顔の右側が撮影されており顔の左側が撮影されていない画像を監視カメラ160に対して左を向いている顔画像と言ってもよい。
顔画像760は、監視カメラ160に対して右を向いている顔画像である。これは、表示された映像に対応するベストショット3rdである。両目ではなく左目だけが映っている顔画像は監視カメラ160に対して右を向いている顔画像と言ってもよい。また顔の左側が撮影されており顔の右側が撮影されていない画像を監視カメラ160に対して右を向いている顔画像と言ってもよい。
なお、顔の向きとしては正面/左向き/右向き以外として、例えば斜め左向き/斜め右向き/後向き等の向きを、追加的/代替的に用いることとしてもよい。
顔画像770は、人物の体全体を含んでいる顔画像である。これは、表示された映像に対応するベストショット4thである。体全体とは顔画像のみではなく人物の胴体、手、足等が含まれることをいう。
なお、体全体以外に、例えばバストアップ等を、追加的/代替的に用いることとしてもよい。
【0062】
顔画像表示領域795には、複数の顔画像には、正面を向いている顔画像と、右を向いている顔画像と、左を向いている顔画像と、体全体を含んでいる顔画像と、のうち少なくとも1つ以上の顔画像が含まれる。
顔画像表示領域795には、同一人物を互いに異なる角度から撮影された複数の顔画像が含まれる、ということもできる。
【0063】
制御部210は、選択された映像に含まれる人物の画像のうち人物の顔が判別可能な画像を映像と共に出力(表示)する。
【0064】
制御部210は、フラグ730の一番左の位置の時刻に顔画像表示領域795に顔画像を表示し、フラグ730の一番右の位置の時刻に顔画像表示領域795の顔画像を非表示とする(又は削除する)ようにしてもよい。制御部210は、表示領域790に表示されている映像に人物が映っている間は、その人物の顔画像を顔画像表示領域795に表示するようにしてもよい。このような処理を実行することによって、制御部210は、選択された映像に含まれる人物であることが分かる態様で人物の顔画像を表示することができる。
選択された映像に含まれる人物であることが分かる態様とは、例えば、同じ画面に表示領域790(又は人物735)及び顔画像表示領域795が表示される、又は表示領域790に重畳されて顔画像表示領域795が表示される等の態様である。
【0065】
ステップS550の処理は、人物映像領域670において選択された映像と映像のタイムラインとを含む画面を出力(表示)する処理の一例である。
またステップS550の処理は、人物映像領域670において選択されたサムネイルの映像と共に、映像に含まれる人物と同一人物の複数の顔画像を出力(表示)する処理の一例である。
【0066】
顔画像表示領域795には、さらに「人物を登録」ボタン775が含まれる。表示領域790に表示されている映像に映っている人物が情報処理システム1000にまだ登録されていない人物であった場合、制御部210は、顔画像表示領域795に「人物を登録」ボタン775を含めて出力する。この処理は、表示領域790に表示されている映像に映っている人物が情報処理システム1000にまだ登録されていない人物であった場合、制御部210は、「人物を登録」ボタン775を活性化させて顔画像表示領域795に表示する、ともいえる。ボタンを活性化させるとは、ボタンを選択可能にすることである。
映像に含まれる人物の顔画像が登録済みでないでない場合、制御部210は、顔画像を登録する登録ボタンをユーザーが選択可能な態様で出力(表示)する。
【0067】
表示領域790に表示されている映像に映っている人物が情報処理システム1000にすでに登録されている人物であった場合、制御部210は、顔画像表示領域795に「登録済み」ボタン810を含めて出力する。
図9は、映像詳細画面700の一例を示す図(その2)である。「登録済み」ボタン810は、顔画像表示領域795に含まれる顔画像の人物はすでに情報処理システム1000に検索対象の人物として登録されていることを示すボタンである。なお、顔画像表示領域795に含まれる顔画像の人物が情報処理システム1000にすでに登録されていることを示すことができればボタンに限られずどのようなGUI部品又は画像等であってもよい。
映像に含まれる人物の顔画像はすでに登録済みか否かを識別可能な態様で出力(表示)される。
【0068】
図8の「人物を登録」ボタン775が選択されると、制御部210は、人物登録画面を生成する。制御部210は、生成した人物登録画面をクライアント装置120に送信し、クライアント装置120の出力部に表示されるよう制御する。
【0069】
図10は、人物登録画面900の一例を示す図である。
図10に示されるように、人物登録画面900には、顔画像表示領域795に表示されている顔画像と同じ顔画像の顔画像910、顔画像920、顔画像930及び顔画像940が含まれる。制御部210は、クライアント装置120の操作者によるドラッグ操作に基づき、顔画像(顔画像910、顔画像920、顔画像930、顔画像940等)の位置を入れ替えることができる。顔画像910の位置にある画像がカバー写真として用いられる。カバー写真は、例えば、後述する
図14、
図15等に示される保存人物の顔画像として画面等に用いられる。
また、制御部210は、クライアント装置120の操作者が各顔画像(顔画像910、顔画像920、顔画像930、顔画像940等)の右上にある「×」ボタンをクリックしたことに応じて、その顔画像を削除することができる。これは、顔画像の中に誤って所望の人物とは異なる顔画像が含まれていた場合に、後述のステップS1140における検索の精度低下を防止するためのものである。なお、検索の精度向上のため、単に顔画像を削除するのみならず、その代わりに例えば同じ向きの顔画像で次なる候補となるものを自動的にセットしたり、同じ向きの顔画像で次なる候補となるものを幾つか一覧表示してユーザーが選択したものをセットしたりしてもよい。
【0070】
また、人物登録画面900には、プラスを示すGUI部品950が含まれる。GUI部品950が選択されると、制御部210は、顔画像を追加するための画面を生成する。制御部210は、生成した画面をクライアント装置120に送信し、クライアント装置120に表示するよう制御する。制御部210は、顔画像を追加するための画面において、顔画像910、顔画像920、顔画像930及び顔画像940に表示されている顔画像と同じ人物の別の顔画像を選択可能に表示する。クライアント装置120の操作者はこの画面を介して、同じ人物の別の顔画像を選択し、顔画像を追加することができる。なお、これ以外の顔画像の追加方法として、例えばクライアント装置120において別途用意した顔画像をアップロード可能としてもよい。
【0071】
また、制御部210は、顔画像910、顔画像920、顔画像930及び顔画像940の何れかの顔画像が選択され、所定の操作が行われると、制御部210は、顔画像を変更するための画面を生成する。制御部210は、生成した画面をクライアント装置120に送信し、クライアント装置120に表示するよう制御する。制御部210は、顔画像を変更するための画面において、選択された顔画像を選択された顔画像と同一の人物の別の顔画像を選択可能に表示する。クライアント装置120の操作者はこの画面を介して、顔画像を同じ人物の別の顔画像に変更することができる。
これらの処理は、ユーザーの所定の操作に基づいて登録された顔画像を変更、又は顔画像を追加/削除する処理の一例である。
【0072】
クライアント装置120の操作者は、
図10に示されるような人物登録画面900において、例えば、人物名、人物タグ、メモ等を入力し、検索対象の人物として人物の顔画像を登録する操作を行う。人物登録画面900において「この内容で保存する」ボタンが選択されると、人物登録画面900に含まれる、顔画像等を含む登録情報がクライアント装置120からサーバー装置100に送信される。
【0073】
図5のステップS560において、制御部210は、登録情報を受信したか否かを判定する。制御部210は、登録情報を受信した場合には、ステップS570に処理を進め、サムネイル選択情報を受信していない場合には、ステップS550の処理を繰り返す。
【0074】
ステップS570において、制御部210は、登録情報に含まれる顔画像を検索対象の人物(保存人物ともいう)として登録する。具体的には、複数のベストショット情報のうち、S560で受信した登録情報に対応するものについて、フラグを立てる等して識別可能にする。
【0075】
人物登録画面900上においてクライアント装置120の操作者により所定の操作(例えば、顔画像上で右クリックし、表示されたメニューから編集ボタンを選択する操作等)を受けると、制御部210は、顔画像を編集可能な編集画面を生成する。制御部210は、生成した編集画面をクライアント装置120に送信し、クライアント装置120の出力部に表示されるよう制御する。
【0076】
図11は、編集画面1010の一例を示す図である。編集画面1010には人物登録画面900で選択された顔画像が含まれる。編集画面1010では顔画像のトリミング、回転・傾き補正、明るさ及びコントラストの調整等を行うことが可能に構成されている。
【0077】
図8の映像詳細画面700は、「ムービークリップを作成」ボタン780が含まれる。「ムービークリップを作成」ボタン780が選択されると、制御部210は、ムービークリップの作成画面1700を作成する。そして、制御部210は、ムービークリップの作成画面1700をクライアント装置120に送信し、クライアント装置120の出力部に表示されるよう制御する。
【0078】
図12は、ムービークリップの作成画面1700の一例を示す図である。ムービークリップの作成画面1700は、ムービークリップを作成可能に構成されている。ムービークリップとは、映像から残しておきたい時間を指定して映像を切り取り、記憶部220等に保存しておく機能である。なお、ムービークリップには、指定された映像である保存用動画と指定された映像の早送り動画であるタイムラプスとが含まれていてもよい。
【0079】
ムービークリップの作成画面1700には、映像のタイムライン1710が表示されている。操作者は、タイムライン1710上のアンカー1740及びアンカー1750を操作することで切り取る映像の始まりの時間と終わりの時間とを指定することができる。アンカー1740が映像の始まりの時間を指定するGUI部品である。アンカー1750が映像の終わりの時間を指定するGUI部品である。アンカー1740で指定された時間の映像の静止画が表示領域1720に表示される。アンカー1750で指定された時間の映像の静止画が表示領域1730に表示される。
【0080】
制御部210は、クライアント装置120の操作者の操作に基づき、映像のムービークリップを作成し、記憶部220等の所定の記憶領域に保存することができる。
【0081】
制御部210は、選択された映像に関するタイムラインを出力し、タイムラインを含む画面を介した所定の操作に基づき映像に関するムービークリップを作成する画面を出力する。
【0082】
(2-2)顔画像検索
図13は、情報処理システム1000における顔画像検索に係る情報処理の一例を示すフローチャートである。なお、この処理は主にサーバー装置100が実行するものとして説明するが、その代わりにクライアント装置110又はクライアント装置120、複数の監視カメラ160の何れかが実行することとしてもよい。
ステップS1110において、制御部210は、クライアント装置120からの要求に応じて、登録されている複数の顔画像を含む画面(保存人物表示画面)を生成する。具体的には、複数のベストショット情報のうち、ステップS570でフラグが立てられたものを抽出し、夫々ベストショット1stを特定したうえで、それらを表示するための保存人物表示画面を生成する。制御部210は、生成した保存人物表示画面をクライアント装置120に送信する。
【0083】
図14は、人物検索画面1200の一例を示す図である。
図14に示されるように、人物検索画面1200には、保存人物タブ1210と、保存人物表示領域1250と、が含まれる。保存人物タブ1210が選択されると、保存事物表示画面の表示要求がクライアント装置120からサーバー装置100に送信される。そして、表示要求に応じて、保存人物表示領域1250にステップS570で顔画像が登録された人物の顔画像の一覧が表示される。
図14では保存人物タブ1210が選択されていることが示されている。
図14の保存人物表示領域1250には、一例として、顔画像1220、顔画像1230、顔画像1240が保存人物の一覧として表示されている。
【0084】
クライアント装置120の操作者(監視カメラ160の所有者等)は、保存人物表示領域1250に表示されている顔画像から検索対象とする人物の顔画像を選択する。クライアント装置120の操作者が顔画像を選択すると、選択した顔画像を識別する識別情報等を含む選択情報がクライアント装置120からサーバー装置100に送信される。
【0085】
ステップS1120において、制御部210は、クライアント装置120から選択情報を受信したか否かを判定する。制御部210は、選択情報を受信した場合には、ステップS1130に処理を進め、選択情報を受信していない場合には、ステップS1120の処理を繰り返す。
【0086】
ステップS1130において、制御部210は、選択情報に含まれる識別情報に基づき顔画像を選択する。
ステップS1140において、制御部210は、選択した顔画像を含む、監視カメラ160で撮影された映像を検索する。具体的には、まず、ステップS1130で選択された顔画像のベストショット情報を参照し、対応する顔の特徴量を用いて、AIモデル等によりその人物が含まれる映像を特定する。なお、前述した前処理において顔の特徴量を算出しなかった場合、この時点で同様にして顔の特徴量を算出すればよい。
なお、ステップS1140は次のように実現してもよい。例えば、制御部210は、顔画像と、記憶部220等に記憶されている複数の映像と、を入力データとして学習済みモデルに入力する。この学習済みモデルは、顔画像と、複数の映像とを入力データ、映像に顔画像の人物と同一人物が含まれるか否か、及び、映像に顔画像の人物と同一人物が含まれる場合は顔画像の人物が出現してから消失するまでの時間情報を出力データとして学習された学習済みモデルである。さらに、学習済みモデルは、同じ映像に複数の顔画像が含まれる場合には複数の顔画像それぞれが出現してから消失するまでの時間情報を出力データとして学習された学習済みモデルである。
【0087】
制御部210は、学習済みモデルから映像に顔画像の人物と同一人物が含まれるか否かの情報、及び、映像に顔画像の人物と同一人物が含まれる場合はこの人物が出現してから消失するまでの時間情報を検索結果として取得する。
【0088】
ステップS1150において、制御部210は、検索結果に基づき、選択された顔画像の人物の同一の人物が含まれる映像の顔画像が出現したタイミングのサムネイルを含む一覧表示画面を生成する。制御部210は、生成した一覧表示画面をクライアント装置120に送信し、クライアント装置120の出力部に表示されるよう制御する。
【0089】
図15は、一覧表示画面1300の一例を示す図である。
図15に示される一覧表示画面1300には、保存人物表示領域1320が含まれる。保存人物表示領域1320には、人物検索画面1200で選択された顔画像1310と、顔画像1310の人物と同一の人物が含まれる映像のサムネイルの一覧が表示されている。サムネイルの一覧は、デバイスごとに表示される。
図15では簡略化のため、デバイスセクション1340として、入店口東口の監視カメラ160で撮影された映像のサムネイルの一覧のみが表示されているが、これに限定されるものではない。
図6の一覧表示画面600に示したのと同様、デバイスセクションごとにサムネイルの一覧が表示される。
【0090】
図15の一覧表示画面1300においてサムネイルの一つが選択されると、選択されたサムネイルを識別する識別情報を含む、サムネイル選択情報がクライアント装置120からサーバー装置100に送信される。
【0091】
図13のステップS1160において、制御部210は、サムネイル選択情報を受信したか否かを判定する。制御部210は、サムネイル選択情報を受信した場合には、ステップS1170に処理を進め、サムネイル選択情報を受信していない場合には、ステップS1150及びステップS1160の処理を繰り返す。
【0092】
ステップS1170において、制御部210は、サムネイル選択情報で識別されるサムネイルの映像を選択する。
ステップS1180において、制御部210は、選択した映像のタイムラインと共に映像に含まれる人物の顔画像を含む映像詳細画面を生成する。制御部210は、生成した映像詳細画面をクライアント装置120に送信し、クライアント装置120の出力部に表示されるよう制御する。
【0093】
図16は、映像詳細画面1400の一例を示す図である。映像詳細画面1400は、
図8に示した映像詳細画面700及び
図9に示した映像詳細画面700とほぼ同様である。ただし、映像詳細画面1400に含まれる顔画像表示領域1410には
図8の映像詳細画面700に含まれる「人物を登録」ボタン775及び
図9の「登録済み」ボタン810は含まれない。
【0094】
(2-3)送信先設定
制御部210は、クライアント装置110からの要求に応じて、通知設定(送信先設定ともいう)画面を生成し、クライアント装置110に送信する。
【0095】
図17は、通知設定画面1800の一例を示す図である。
図17に示されるように、通知設定画面1800には、通知設定タグ1810と、通知設定領域1820と、が含まれる。通知設定タグ1810が選択されると、通知設定画面の生成要求がクライアント装置110からサーバー装置100に送信される。そして、生成要求に応じて、通知設定領域1820にデバイスごとに送信先を設定可能なGUI部品1830が表示される。
図17の例では通知設定タグ1810が選択されていることが示されている。
この処理は、登録された顔画像の人物が映像より検知された場合に、顔画像の人物が検知されたことを示す情報を送信する送信先の通知設定画面1800を出力する処理の一例である。
【0096】
GUI部品1830では、デバイス名ごとにメール及びWebhook連携の連携先を設定可能に構成されている。なお、デバイス名はデバイスを一意に識別可能なものであってもよいし、デバイスに付されたタグ(デバイスタグ)を識別可能なものであってもよい。デバイスタグは、監視カメラ160のグループに対して付することができるものである。通知設定画面1800は、複数のカメラそれぞれごと、又はカメラのグループごとに送信先を設定可能に構成されている。
【0097】
GUI部品1830においてデバイス名(例えば「入店口 東口」1820)が選択されると、制御部210は、通知設定画面1900を生成し、クライアント装置110の出力部340に表示されるよう制御する。
【0098】
図18は、通知設定画面1900の一例を示す図である。項目1910では通知メールの送信先が設定可能になっている。項目1920ではWebhook連携の連携先を設定可能になっている。Webhook連携の連携先としては複数の連絡先が設定可能となっている。
図18では通知設定画面1900では、送信先としてユーザーを設定可能に構成されているといえる。
【0099】
以上、実施形態1によれば、簡単に映像から人物を探し出し、気になる人物の顔画像を情報処理システム1000に登録することができる。また、実施形態1によれば、登録された顔画像から選択した顔画像の人物の映像を検出し、出力することができる。
【0100】
<付記>
次に記載の各態様で提供されるようにしてもよい。
(付記1)
カメラで撮影された映像を情報端末で表示させる情報処理システムであって、
前記映像から顔画像を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像と共に前記映像に含まれる顔画像を表示し、
ユーザーの指示に応じて前記顔画像を登録する、
情報処理システム。
(付記2)
カメラで撮影された映像を情報端末で表示させる情報処理システムであって、
登録された複数の顔画像を表示し、
ユーザーの指示に応じて前記複数の顔画像から顔画像を選択し、
前記選択された顔画像に対応する人物を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像を表示する、
情報処理システム。
(付記3)
付記1に記載の情報処理システムであって、
前記表示する顔画像は、同一人物の複数の顔画像である、
情報処理システム。
(付記4)
付記3に記載の情報処理システムであって、
前記複数の顔画像は、同一人物を互いに異なる角度から撮影した顔画像を含む、
情報処理システム。
(付記5)
付記4に記載の情報処理システムであって、
前記複数の顔画像は、正面を向いている顔画像と、右を向いている顔画像と、左を向いている顔画像と、体全体を含んでいる顔画像と、のうち少なくとも1つ以上を含む、
情報処理システム。
(付記6)
付記1に記載の情報処理システムであって、
前記顔画像と共に前記顔画像が登録済か否かを識別可能な態様で表示する、
情報処理システム。
(付記7)
付記1に記載の情報処理システムであって、
前記顔画像と共に、前記顔画像を登録するためのボタンを表示する、
情報処理システム。
(付記8)
付記1又は付記2に記載の情報処理システムであって、
前記映像と共に、前記映像に関するタイムラインを表示する、
情報処理システム。
(付記9)
付記8に記載の情報処理システムであって、
前記タイムラインは、登録された顔画像が映っている部分を識別可能な態様で表示する、
情報処理システム。
(付記10)
付記8に記載の情報処理システムであって、
前記タイムラインを含む画面を介した所定の操作に基づき前記映像に関するムービークリップを作成する画面を表示する、
情報処理システム。
(付記11)
付記1又は付記2に記載の情報処理システムであって、
前記顔画像を含む映像の検索は、ユーザーにより入力された検索条件に基づいて実行し、
前記検索条件は、期間と、キーワードと、のうち少なくとも1つ以上を含む、
情報処理システム。
(付記12)
付記1又は付記2に記載の情報処理システムであって、
前記複数の映像は、前記複数の映像それぞれを撮影したカメラごとに縮小表示画像の態様で表示される、
情報処理システム。
(付記13)
付記1又は付記2に記載の情報処理システムであって、
登録された前記顔画像が映像より検知された場合に、ユーザーに通知する、
情報処理システム。
(付記14)
付記13に記載の情報処理システムであって、
登録された前記顔画像が映像より検知された場合の通知先は、前記複数のカメラそれぞれごと、又はカメラのグループごとに設定可能に構成される、
情報処理システム。
(付記15)
付記1又は付記2に記載の情報処理システムであって、
登録された前記顔画像は、ユーザーの指示に基づいて変更、又は顔画像を追加することが可能である、
情報処理システム。
(付記16)
付記1又は付記2に記載の情報処理システムであって、
前記顔画像は、前記選択された映像に含まれる人物であることが分かる態様で表示される、
情報処理システム。
(付記17)
付記1又は付記2に記載の情報処理システムであって、
前記映像と共に、前記選択された映像に含まれる人物のうち顔が判別可能な人物の画像を表示する、
情報処理システム。
(付記18)
カメラで撮影された映像を情報端末で表示させる情報処理システムが実行する情報処理方法であって、
前記映像から顔画像を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像と共に前記映像に含まれる顔画像を表示し、
ユーザーの指示に応じて前記顔画像を登録する、
情報処理方法。
(付記19)
カメラで撮影された映像を情報端末で表示させる情報処理システムが実行する情報処理方法であって、
登録された複数の顔画像を表示し、
ユーザーの指示に応じて前記複数の顔画像から顔画像を選択し、
前記選択された顔画像に対応する人物を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像を表示する、
情報処理方法。
(付記20)
カメラで撮影された映像を情報端末で表示させるコンピュータに、
前記映像から顔画像を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像と共に前記映像に含まれる顔画像を表示し、
ユーザーの指示に応じて前記顔画像を登録する、
処理を実行させるためのプログラム。
(付記21)
カメラで撮影された映像を情報端末で表示させるコンピュータに、
登録された複数の顔画像を表示し、
ユーザーの指示に応じて前記複数の顔画像から顔画像を選択し、
前記選択された顔画像に対応する人物を含む映像を検索し、
前記検索の結果として複数の映像を表示し、
ユーザーの指示に応じて前記複数の映像から映像を選択し、
前記選択された映像を表示する、
処理を実行させるためのプログラム。
【0101】
本発明に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。実施形態及び実施形態の変形は、発明の範囲及び要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【0102】
例えば、上述したサーバー装置100の処理の一部をクライアント装置110及び/又はクライアント装置120が実行するようにしてもよい。また、上述したサーバー装置100の処理の一部を監視カメラ160が実行するようにしてもよい。
【符号の説明】
【0103】
100 :サーバー装置
110 :クライアント装置
150 :ネットワーク
160 :監視カメラ
210 :制御部
220 :記憶部
230 :通信部
1000 :情報処理システム
【要約】 (修正有)
【課題】カメラの設置場所の拡大に伴い、カメラで撮影された映像から特定の人物を探したいというニーズが高まっている。
【解決手段】本開示の一態様によれば、カメラで撮影された映像を情報端末で表示させる情報処理システムが提供される。前記情報処理システムは、映像から顔画像を含む映像を検索し、検索の結果として複数の映像を表示し、ユーザーの指示に応じて複数の映像から映像を選択し、選択された映像と共に映像に含まれる顔画像を表示し、ユーザーの指示に応じて顔画像を登録する。
【選択図】
図5