特表2024-536355 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特表2024-536355検出領域を適応的に調整するための方法、装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-10-04

(54)【発明の名称】検出領域を適応的に調整するための方法、装置及びプログラム

(51)【国際特許分類】

G06T 7/00 20170101AFI20240927BHJP

G06V 10/70 20220101ALI20240927BHJP

G06V 20/52 20220101ALI20240927BHJP

H04N 23/69 20230101ALI20240927BHJP

H04N 23/695 20230101ALI20240927BHJP

H04N 23/611 20230101ALI20240927BHJP

H04N 7/18 20060101ALI20240927BHJP

【ＦＩ】

G06T7/00 660Z

G06V10/70

G06V20/52

H04N23/69

H04N23/695

H04N23/611

H04N7/18 D

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2024520653

(86)(22)【出願日】2022-09-28

(85)【翻訳文提出日】2024-04-03

(86)【国際出願番号】 JP2022036316

(87)【国際公開番号】W WO2023063088

(87)【国際公開日】2023-04-20

(31)【優先権主張番号】10202111442R

(32)【優先日】2021-10-14

(33)【優先権主張国・地域又は機関】SG

(81)【指定国・地域】

(71)【出願人】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100103894

【弁理士】

【氏名又は名称】家入健

(72)【発明者】

【氏名】オングフイラム

(72)【発明者】

【氏名】ジャンシンライ

(72)【発明者】

【氏名】オングホンイェン

(72)【発明者】

【氏名】ペーウェイジアン

【テーマコード（参考）】

5C054

5C122

5L096

【Ｆターム（参考）】

5C054CA04

5C054CC02

5C054CF06

5C054FC01

5C054FC12

5C054FC13

5C054FC14

5C054FC15

5C054HA19

5C122DA11

5C122FE05

5C122FH11

5C122GD06

5C122HA29

5C122HB01

5L096BA02

5L096CA04

5L096GA51

5L096JA11

(57)【要約】

撮像デバイス（４０２）によって撮像される画像の検出領域を調整するための方法（３００）は、一定期間にわたって撮像デバイス（４０２）によって以前に撮像された入力画像から検出領域内の人物の外観を検出すること（３０２）と、人物の外観に基づいて検出領域に対応するマップを生成することであって、マップは、入力画像にわたる検出領域の複数の部分の各々において検出された人物の外観の尺度を含む、生成すること（３０４）と、複数の部分に対する未利用部分の比が閾値比を超えるか決定すること（３０６）と、利用部分の一部を含む検出領域内の焦点領域が、決定に応じて撮像される画像の調整された検出領域の中心に配置されるように、検出領域を調整すること（３０８）とを含む。
【選択図】図３

【特許請求の範囲】

【請求項1】

撮像デバイスによって撮像される画像の検出領域を適応的に調整するためにコンピュータによって実行される方法であって、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の１人又は複数の人物の外観を検出することと、
前記１人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第１のマップを生成することであって、前記第１のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記１人又は複数の人物の前記外観の第１の尺度を含む、生成することと、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定することであって、前記未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、前記検出領域の前記複数の部分のうちの部分であり、前記１人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示す、決定することと、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整することと
を含む、方法。

【請求項2】

前記複数の入力画像の各々から、複数の第２のマップを生成することをさらに含み、
複数の第２のマップの各々は、前記検出領域に対応し、前記１人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも１つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観の異なる第２の尺度を含み、
前記第１のマップを生成することは、前記複数の入力画像の各々から生成された前記複数の第２のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観のそれぞれの第２の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第１のマップ内の前記１人又は複数の人物の前記外観の前記第１の尺度を決定することを含む、
請求項１に記載の方法。

【請求項3】

前記１人又は複数の人物の前記身体部分、前記特性又は前記動きのうちの前記少なくとも１つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観のカウントと、前記撮像デバイスによって顔の特徴、前記身体部分、前記特性又は前記動きのうちの前記少なくとも１つに基づいて検出された外観の予め設定された検出重みとに基づいて、前記人物の前記外観の前記第２の尺度を決定すること
をさらに含む、請求項２に記載の方法。

【請求項4】

前記検出領域に対応する第３のマップを生成することをさらに含み、
前記第３のマップは、前記複数の入力画像の各々における前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観の第３の尺度を含み、前記第３の尺度は、前記複数の入力画像の各々からの前記検出領域の前記複数の部分の各々において検出された前記複数の第２のマップの前記１人又は複数の人物の前記外観のそれぞれの第２の尺度の和であり、
前記第１のマップを生成することは、前記複数の入力画像から生成された前記第３のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観のそれぞれの第３の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第１のマップ内の前記１人又は複数の人物の前記外観の前記第１の尺度を決定することを含む、
請求項２又は３に記載の方法。

【請求項5】

前記利用部分の前記少なくとも一部の各々が、前記１人又は複数の人物の前記外観の閾値尺度以上である前記１人又は複数の人物の前記外観の尺度に関連付けられるか決定することをさらに含む、請求項１～４のいずれか１項に記載の方法。

【請求項6】

前記第１のマップにおいて生成された前記１人又は複数の人物の前記外観の前記第１の尺度のうち、前記１人又は複数の人物の前記外観の最高尺度を決定することと、
前記１人又は複数の人物の前記外観の前記最高尺度に基づいて前記人物の前記外観の前記閾値尺度を計算することと
をさらに含む、請求項５に記載の方法。

【請求項7】

前記検出領域を調整することは、
前記検出領域に対する前記撮像デバイスのデバイス角度を変更するために、水平軸及び／又は垂直軸を中心に前記撮像デバイスを回転させることと、
前記焦点領域が、前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心の周りの予め設定された中心部分を占めるように、前記撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも１つを含む、請求項１～６のいずれか１項に記載の方法。

【請求項8】

前記焦点領域を前記検出領域の中心に移動させるために必要な検出領域の調整量を計算することと、
前記検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定することとをさらに含み、
前記検出領域を調整することは、前記検出の量が前記予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
請求項１～７のいずれか１項に記載の方法。

【請求項9】

撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置であって、
少なくとも１つのプロセッサと、
コンピュータプログラムコードを含む少なくとも１つのメモリと
を備え、
前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の１人又は複数の人物の外観を検出させ、
前記１人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第１のマップを生成させ、前記第１のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記１人又は複数の人物の前記外観の第１の尺度を含み、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、前記未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、前記検出領域の前記複数の部分のうちの部分であり、前記１人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示し、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整させる、
装置。

【請求項10】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、前記複数の入力画像の各々から、複数の第２のマップを生成させ、複数の第２のマップの各々は、前記検出領域に対応し、前記１人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも１つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観の異なる第２の尺度を含み、
前記第１のマップを生成することは、前記複数の入力画像の各々から生成された前記複数の第２のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観のそれぞれの第２の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第１のマップ内の前記１人又は複数の人物の前記外観の前記第１の尺度を決定することを含む、
請求項９に記載の装置。

【請求項11】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、
前記１人又は複数の人物の身体部分、特性又は動きのうちの前記少なくとも１つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観のカウントと、前記撮像デバイスによって顔の特徴、前記身体部分、前記特性又は前記動きのうちの前記少なくとも１つに基づいて検出された外観の予め設定された検出重みとに基づいて、前記１人又は複数の人物の前記外観の第２の尺度を決定させる、
請求項９に記載の装置。

【請求項12】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、前記検出領域に対応する第３のマップを生成させ、前記第３のマップは、前記複数の入力画像の各々における前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観の第３の尺度を含み、前記第３の尺度は、前記複数の入力画像の各々からの前記検出領域の前記複数の部分の各々において検出された複数の第２のマップの前記１人又は複数の人物の前記外観のそれぞれの第２の尺度の和であり、
前記第１のマップを生成することは、前記複数の入力画像から生成された前記第３のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記１人又は複数の人物の前記外観のそれぞれの第３の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第１のマップ内の前記１人又は複数の人物の前記外観の前記第１の尺度を決定することを含む、
請求項１０又は１１に記載の装置。

【請求項13】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、
前記利用部分の前記少なくとも一部の各々が、前記１人又は複数の人物の前記外観の閾値尺度以上である前記１人又は複数の人物の前記外観の尺度に関連付けられるか決定させる、
請求項９～１２のいずれか１項に記載の装置。

【請求項14】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、
前記第１のマップにおいて生成された前記１人又は複数の人物の前記外観の前記第１の尺度のうち、前記１人又は複数の人物の前記外観の最高尺度を決定させ、
前記１人又は複数の人物の前記外観の前記最高尺度に基づいて前記人物の前記外観の前記閾値尺度を計算させる、
請求項１３に記載の装置。

【請求項15】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、
前記検出領域に対する前記撮像デバイスのデバイス角度を変更するために、水平軸及び／又は垂直軸を中心に前記撮像デバイスを回転させることと、
前記焦点領域が、前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の前記中心の周りの予め設定された中心部分を占めるように、前記撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも１つを実行させる、請求項９～１４のいずれか１項に記載の装置。

【請求項16】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、
前記焦点領域を前記検出領域の中心に移動させるために必要な検出領域の調整量を計算させ、
前記検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定させ、前記検出領域を調整することは、前記検出の量が前記予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
請求項９～１５のいずれか１項に記載の装置。

【請求項17】

請求項９～１６のいずれか１項に記載の装置と撮像デバイスとを備える、前記撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステム。

【請求項18】

撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムを記憶する非一時的なコンピュータ可読媒体であって、前記プログラムは、コンピュータに、少なくとも、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の１人又は複数の人物の外観を検出させ、
前記１人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第１のマップを生成させ、前記第１のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記１人又は複数の人物の前記外観の第１の尺度を含み、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、前記未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、前記検出領域の前記複数の部分のうちの部分であり、前記１人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示し、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整させる、非一時的なコンピュータ可読媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、撮像デバイス及び撮像デバイスによって撮像された画像の検出領域に関し、より詳細には、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法、装置、システム及びプログラムに関する。

【背景技術】

【0002】

何百万もの監視カメラが、安全性測定のために、特に駅及びバス停などの公共交通ハブで世界中に配備されている。これらの画像及びビデオ映像の大部分は、リアルタイムのビデオ分析がリソースを必要としすぎ、それを設定及び構成するために高度な熟練者を必要とするため、処理なしで達成される。画像及びビデオ映像は、証拠として後調査目的のためにオンデマンドで検索される。

【発明の概要】

【発明が解決しようとする課題】

【0003】

これらの膨大な数の監視カメラの保守は、カメラのいずれかが、照明の変更、カメラレンズのほこり／汚れ、さらには改修、ソフトウェアシステムの上でのクリーニングサービス、及びハードウェアの問題又は故障を含む外的要因などの環境条件の変更によって任意の瞬間に誤動作又は誤調整される可能性があるため、単に手作業に依存する場合には非常に困難であり得る。

【0004】

さらに、監視カメラは、入ってくる人間の交通を監視するなどの特定の目的のために以前に設定されるが、改修作業のために、人間の交通流が焦点の合っていない方向に別の流れに導かれる可能性があるため、監視目標の行動変化は別の動作上の課題となり得る。これにより、監視カメラは、例えば、不審者の検出、事件後調査のための現場理解及び証拠収集、ならびに必要とされる有用な画像及びビデオ映像の提供など、その本来の目標に従って実装されない可能性がある。

【0005】

したがって、上記の問題に対処するための方法、装置、システム及びプログラムを提供する必要がある。

【0006】

さらに、他の望ましい特徴及び特性は、添付の図面及び本開示のこの背景と併せて、以下の詳細な説明及び添付の特許請求の範囲から明らかになるであろう。

【課題を解決するための手段】

【0007】

第１の態様では、本開示は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためにコンピュータによって実行される方法を提供し、方法は、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出することと、
１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成することであって、第１のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含む、生成することと、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定することであって、未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示す、決定することと、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整することと
を含む。

【0008】

第２の態様では、本開示は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置を提供し、装置は、
少なくとも１つのプロセッサと、
コンピュータプログラムコードを含む少なくとも１つのメモリと
を備え、
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出させ、
１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成させ、第１のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる。

【0009】

第３の態様では、本開示は、第２の態様による装置と撮像デバイスとを備える、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステムを提供する。

【0010】

第４の態様では、本開示は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムを記憶する非一時的なコンピュータ可読媒体を提供し、プログラムは、コンピュータに、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出させ、
１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成させ、第１のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる。

【0011】

開示される実施の形態のさらなる利益及び利点は、明細書及び図面から明らかになるであろう。利益及び／又は利点は、明細書及び図面の種々の実施の形態及び特徴によって個別に得ることができ、かかる利益及び／又は利点のうちの１つ又は複数を得るためにすべてが提供される必要はない。

【図面の簡単な説明】

【0012】

本発明の実施形態は、単なる例として、図面と併せて、以下に記載される説明から、当業者によりよく理解され、容易に明らかになるであろう。

【図1A】検出領域内の人物の外観を検出するためにビデオ分析検出を実行することを目標として構成された撮像デバイス（例えば、カメラ）を示す図である。

【図1B】人の交通又は環境の変化があるときに検出領域内の人物の外観を検出するためにビデオ分析検出を実行する図１Ａの撮像デバイスを示す図である。

【図1C】本開示の実施の形態による、図１Ｂのカメラの画像（又は視野）内の焦点領域及びカメラに対する視野調整を示す図である。

【図2】本開示の実施の形態による、その中の入力画像に対して実行された異なるビデオ分析検出の出力を示す図である。

【図3】本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法を示すフローチャートである。

【図4】本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステムを示すブロック図である。

【図5】本開示の実施の形態による、撮像デバイスの検出領域を適応的に調整する動作の一部を実行するシステムを示すフロー図である。

【図6】撮像デバイスの検出領域を適応的に調整する動作の他の一部を実行する図５のシステムを示すフロー図である。

【図7】本開示の実施の形態による、入力画像から検出された１人又は複数の人物の外観に基づいて検出マップ及び合成検出マップを生成するプロセスを示すフロー図である。

【図8】本開示の実施の形態による、カメラによって撮像された複数の入力画像にわたって検出された人物の外観に基づいて分析密度マップを生成するプロセスを示すフロー図である。

【図9】本開示の実施の形態による、８時間の期間にわたってカメラによって以前に検出された複数の入力画像から検出された複数の人物の外観に基づいて生成された例示的な分析密度マップを示す図である。

【図10】本開示の実施の形態による、図９の分析密度マップに基づく検出領域の未利用部分及び利用部分を示す図である。

【図11】本開示の実施の形態による、図９の分析密度マップで生成された外観の最高尺度を示す図である。

【図12】本開示の実施の形態による、図９の分析密度マップで生成された外観の尺度に基づいて利用部分から選択された焦点領域を示す図である。

【図13】本開示の実施の形態による、焦点領域に対する検出領域内の基準中心部分を示す図である。

【図14】本開示の実施の形態による、検出領域内の基準中心部分に焦点領域を再配置するための視野調整を示す図である。

【図15】本開示の実施の形態による、検出領域を調整するための撮像デバイスの倍率の変化を示す図である。

【図16】本開示の実施の形態による、ピクセル座標差及び視野角（ＡＦＯＶ）を使用して焦点領域を基準中心部分に再配置するための検出領域内の調整に対応する例示的なカメラビュー調整を示す図である。

【図17】本開示の実施の形態による、検出領域内の調整に対応する例示的なカメラズーム調整を示す図である。

【図18】本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスを示すフローチャートである。

【図19】本開示の実施の形態による、図１８の人物外観データベースにおいて第１のレベルの分析検出を実行及び記憶するプロセスを示すフローチャートである。

【図20】本開示の実施の形態による、図１８のカメラビュー調整提案を生成するために利用スペースを処理するプロセスを示すフローチャートである。

【図21】本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスの概要を示す概略図である。

【図22】図３の方法を実行し、図４の装置を実装するために使用するのに適した例示的なコンピューティングデバイスの概略図である。

【図23】本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置を示すブロック図である。

【発明を実施するための形態】

【0013】

用語の説明
検出領域－撮像デバイスによって撮像された画像の検出領域は、撮像デバイスの視野に対応し得る。以下の様々な実施の形態では、「検出領域」及び「視野」という用語は互換的に使用される。撮像デバイスの視野は、（ｉ）異なる視野を有するように視野に対する撮像デバイスの水平及び／又は垂直装置角度を変更するために、水平軸、すなわちパン調整、及び／又は垂直軸、すなわちチルト調整の周りで撮像デバイスを回転させること、及び／又は（ｉｉ）撮像デバイスの倍率、すなわちズーム調整を増減させ、撮像デバイスによって撮像される画像の異なる検出領域をもたらすこと、によって調整することができる。画像に反映された検出領域は、複数の部分に分割又はセグメント化することができる。簡単にするために、本開示の様々な実施の形態は、検出領域がグリッドマップに変わるように、画像に反映された検出領域が複数の等しい部分、すなわち正方形領域又はグリッドセルに分割される検出領域上のグリッド分割を示す。ｘ座標及びｙ座標を使用して、分割線を指定し、各セルを配置してもよい。次いで、画像又は画像の検出領域を部分ごとに分析及び処理することができる。対称／非対称、等しい／等しくない形状、面積及びサイズを使用する他のセグメント化方法が使用されてもよいことが理解される。様々な実施の形態では、複数の入力画像に反映された同じ検出領域は、各部分が複数の入力画像にわたって検出領域の同じ部分を反映するように、同じ分割及び同じ複数の部分への分割を受ける。各画像又は各画像の検出領域も、部分ごとに同じ分析及び処理を受ける。

【0014】

外観－画像内の人物の外観は、人物の顔の特徴、身体部分、特性及び動き、又はそれらの組合せに基づいて検出される。顔の特徴の例は、目、鼻、頬骨、顎及び顎の相対的な位置、サイズ、形状及び／又は輪郭、ならびに虹彩模様、皮膚色、毛髪色又はそれらの組合せを含む。特性は、身長、体格、身体の比率、四肢の長さ、毛髪の色、皮膚の色、衣服、所有物、他の同様の特性又は組合せなどの物理的特性を含む。動きは、身体の動き、四肢の位置、動きの方向、移動速度、歩行パターン、人の立ち方、動き、話し方、他の同様の特徴又は組合せなどの行動特性を含み得る。

【0015】

様々な実施の形態では、各画像は、異なる顔の特徴、身体部分、特性、動き、又はそれらの組合せに基づいて、少なくとも２つの外観検出及び測定（以下、ビデオ分析検出と呼ぶことがある）を受ける。例えば、画像内で顔検出及び姿勢検出を実行して、その画像内のすべての人物の外観を検出してもよい。そのような複数の外観検出は、検出領域調整のためのより包括的な人物外観測定値を提供するために使用することができる。

【0016】

代替的又は追加的に、各画像は、検出された外観を有する画像のみがさらなる処理のためにデータベースに記憶されることを確実にするために、１つの顔の特徴、身体部分、特性、動き、又はそれらの組合せ（例えば、顔検出）に基づいて１つのビデオ分析検出のみを受けてもよい。続いて、ある期間にわたって撮影されたデータベース内の画像が続いて検索され、別の異なる顔の特徴、身体部分、特性、動き、又はそれらの組合せ（例えば、姿勢検出）に基づく少なくとも１つの他のビデオ分析検出に供され得る。

【0017】

外観の尺度－外観の尺度は、一般に、例えば、入力画像の検出領域の一部、複数の部分もしくは全体内、又は複数の入力画像の同じ検出領域の同じ部分、複数の同じ部分もしくは全体内で検出された外観のカウントに関する。本開示の様々な実施の形態では、撮像デバイスは、検出重みプロファイルで事前構成され、撮像デバイスによって異なる顔の特徴、身体部分、特性、動き、又はそれらの組合せに基づいて検出された外観の各カウントは、異なる検出重みをさらに受け（例えば、加算又は乗算され）、それにより、異なる外観の尺度が得られる。検出重みのそのようなプロファイルは、撮像デバイスが使用される、設置される、又は実行するように構成される目標に基づいて、ユーザによって撮像デバイスに対して事前構成されてもよい。

【0018】

マップ－マップは、検出領域のすべてのセグメント化された部分で決定された外観の尺度の編集を含む２次元（２Ｄ）データ配列を指す。マップはまた、２つのマップにおいて決定された対応する部分における外観の尺度を合計することによって、別のマップと組み合わせることができる。

【0019】

同様に、検出領域の各セグメント化された部分は、異なる顔の特徴、身体部分、特性及び動き、又はそれらの画像の組合せに基づいて、少なくとも２つの外観検出及び測定を受ける。例えば、検出領域のセグメント化された部分ごとに顔検出及び姿勢検出を行い、その部分で人物の外観（この場合、いずれかの人物の顔や姿勢）が検出されたかどうかを検出するようにしてもよい。検出された外観（この場合、顔及び姿勢）がどのセグメント化された部分に入るかを決定することによって、同じ効果が奏され得る。

【0020】

結果として、異なる顔の特徴、身体部分、特性及び動き又はそれらの組合せに基づいて、検出領域のすべてのセグメント化された部分から検出された人物の外観を測定することによって、画像から少なくとも２つの異なる検出マップを生成することができる。さらに、画像から生成された異なる検出マップを組み合わせて、合成検出マップを形成してもよい。また、さらに、ある期間にわたって撮影された異なる画像から生成された異なる合成検出マップを組み合わせて、ある期間にわたる検出領域のすべてのセグメント化された部分におけるすべての人物の外観の尺度を反映し、分析密度マップを使用して分析することができる分析密度マップを形成してもよい。

【0021】

未利用部分－未利用部分は、外観が検出されない検出領域のセグメント化された部分を指す。言い換えれば、そのようなセグメント化された部分は、外観の尺度なし、又は外観の尺度が０であることに関連付けられる。

【0022】

利用部分－利用部分は、１人の人物の少なくとも１つの外観が検出される検出領域のセグメント化された部分を指す。言い換えれば、そのようなセグメント化された部分は、非ゼロ値の外観の尺度に関連付けられる。

【0023】

焦点領域－焦点領域は、撮像デバイスの検出領域又は視野内の関心領域を指す。様々な実施の形態では、焦点領域は、検出領域の残りの領域と比較してより高い外観の尺度が決定される部分（又は複数の部分）に関する。以下の様々な実施の形態では、焦点領域が、撮像デバイスの検出領域又は視野の中心又は予め設定された中心部分から離れる場合、焦点領域が、撮像デバイスの調整された検出領域又は視野の中心又は予め設定された中心部分又はその近くになるように、撮像デバイスの検出領域又は視野に対する調整が実行される。このように、調整された検出領域又は視野を有する撮像デバイスによって撮像される画像は、画像の中央又は予め設定された中央部分の近く又は中央に人物の外観を検出する可能性がより高い。

【0024】

実施の形態
本発明の実施の形態は、単なる例として、図面を参照して説明される。図面における同様の参照番号及び文字は、同様の要素又は同等物を指す。

【0025】

以下の説明のいくつかの部分は、コンピュータメモリ内のデータに対する動作のアルゴリズム及び機能的又は記号的表現に関して明示的又は暗示的に提示される。これらのアルゴリズム的記述及び機能的又は記号的表現は、データ処理技術の当業者によって、彼らの作業の内容を他の当業者に最も効果的に伝えるために使用される手段である。アルゴリズムは、本明細書では、概して、所望の結果をもたらす自己矛盾のない一連のステップであると考えられる。これらのステップは、記憶、転送、結合、比較、及びその他の操作が可能な電気信号、磁気信号、又は光信号などの物理量の物理的操作を必要とするものである。

【0026】

特に明記しない限り、以下から明らかなように、本明細書を通して、「受信する」、「計算する」、「決定する」、「更新する」、「生成する」、「初期化する」、「出力する」、「受信する」、「検索する」、「識別する」、「分散させる」、「認証する」などの用語を利用する説明は、コンピュータシステム内の物理量として表されるデータを操作し、コンピュータシステム又は他の情報記憶、伝送、もしくは表示デバイス内の物理量として同様に表される他のデータに変換する、コンピュータシステム又は同様の電子デバイスのアクション及びプロセスを指すことが理解されよう。

【0027】

本明細書はまた、方法の動作を実施するための装置を開示する。かかる装置は、必要とされる目的のために特別に構築されてもよく、又はコンピュータ内に記憶されたコンピュータプログラムによって選択的にアクティブ化もしくは再構成されるコンピュータもしくは他のデバイスを備えてもよい。本明細書に提示されるアルゴリズム及び表示は、任意の特定のコンピュータ又は他の装置に本質的に関連しない。本明細書の教示によるプログラムとともに、種々の機械を使用することができる。代替的に、必要とされる方法ステップを実施するためのより特化された装置の構築が適切であり得る。コンピュータの構造は、以下の説明から明らかになるであろう。

【0028】

加えて、本明細書はまた、本明細書に記載される方法の個々のステップがコンピュータコードによって実施され得ることが当業者に明らかであるという点で、コンピュータプログラムを暗示的に開示する。コンピュータプログラムは、任意の特定のプログラム言語及びその実装形態に限定されることを意図していない。種々のプログラミング言語及びそのコーディングが、本明細書に含まれる本開示の教示を実装するために使用され得ることが理解されよう。さらに、コンピュータプログラムは、任意の特定の制御フローに限定されることを意図していない。本発明の趣旨又は範囲から逸脱することなく、異なる制御フローを使用することができる、コンピュータプログラムの多くの他の変形形態がある。

【0029】

さらに、コンピュータプログラムのステップのうちの１つ又は複数は、順次ではなく並列に実施され得る。かかるコンピュータプログラムは、任意のコンピュータ可読媒体上に記憶され得る。コンピュータ可読媒体は、磁気ディスクもしくは光ディスク、メモリチップ、又はコンピュータとインタフェースするのに適した他の記憶デバイスなどの記憶デバイスを含み得る。コンピュータ可読媒体はまた、インターネットシステムにおいて例示されるようなハードワイヤード媒体、又はＧＳＭモバイル電話システムにおいて例示されるような無線媒体を含み得る。コンピュータプログラムは、かかるコンピュータにロードされて実行されると、好ましい方法のステップを実装する装置を効果的にもたらす。

【0030】

本開示の様々な実施の形態は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法及び装置に関する。そのような装置及び撮像デバイスは、同じ技術的効果を提供するためにシステムの一部として実装されてもよいことが当業者には理解される。

【0031】

図１Ａは、検出領域内の人物の外観を検出するためにビデオ分析検出を実行することを目標として構成された撮像デバイス（例えば、カメラ１０２）を示す。検出領域は、カメラ１０２の視野１０５に対応する。この例では、カメラ１０２は、身体検出と顔検出との組合せに基づいて人物の外観を検出する検出／監視を目標として（例えば、ユーザによって）構成されていてもよく、カメラ１０２は、検出領域で改修が行われる前に設定された。通常、検出領域、すなわちカメラ１０２の視野１０５内に方向１０６に移動している人の外観１０４が撮像され、カメラ１０２の画像１００内で検出される。

【0032】

図１Ｂは、人の交通又は環境の変化があるときに検出領域内の人物の外観を検出するためにビデオ分析検出を実行する図１Ａの撮像デバイスを示す。上述したように、人間の交通流は、検出領域（ボックス１１８に示す）で行われた改修のために、焦点の方向から外れて変化するか、又は別の方向に導かれる可能性がある。改修のために、人物１１４は、今度は検出領域の周りの方向１１６に移動し、検出領域内の人物の外観を検出するために身体及び顔の両方の検出を実行するように元々構成されているカメラ１０２は、人物の外観を検出してその目標を実行することができない。

【0033】

したがって、人の交通及び環境のこのような変化を採用するために、カメラ１０２の視野（したがって検出領域）を適応的に調整することができる方法及び装置を提供する必要がある。図１Ｃは、本開示の実施の形態による、図１Ｂのカメラ１０２の画像１２０（すなわち、視野又は検出領域）内の焦点領域１２２及びカメラ１０２に対する視野調整を示す。焦点領域１２２は、画像１２０の残りの領域と比較して高い外観の尺度が決定される関心領域である。この実施の形態では、画像１２０の左下隅の焦点領域は、画像１２０の残りの領域よりも高い外観の尺度を有するように決定され、その後、カメラの視野１２０に対する調整は、焦点領域１２２がその予め設定された部分、この場合は破線のボックス１２２’に示される予め設定された中央部分に、又はその近くになるようにシフトされるように実行される。したがって、調整された視野１２０’の下でカメラ１０２によって撮像される後続の画像は、画像１２０’の予め設定された部分１２２’の近く又はそこで人物の外観を検出する可能性がより高い。

【0034】

本開示によれば、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法及び装置は、人間の関与を必要とせずに人間／身体検出を使用することによって一連の画像又はビデオにおける人物の外観（又は存在）の証拠及びデータを収集する際に利点を提供する。

【0035】

さらに、各ビデオ分析検出（例えば、身体検出、ポーズ検出、顔検出）は、それ自体の利点を有することに留意されたい。例えば、身体検出は、顔検出分析と比較して人の外観サイズをより小さく検出することができ、一方、ポーズ検出は、身体検出分析と比較して人の姿勢／ジェスチャなどのより多くの人の外観の詳細を検出することができる。本開示による方法及び装置はまた、オンデマンドの複数のビデオ分析検出（例えば、身体検出及びポーズ検出）を組み合わせて、より包括的な人物の外観検出及び検出領域調整を提供するのに役立つ利点を提供する。

【0036】

図２は、本開示の実施の形態による、入力画像２００に対して実行された異なるビデオ分析検出の出力２０２ａ～２０２ｃを示す。この実施の形態では、３つの異なるビデオ分析検出、すなわち、身体検出、ポスト検出、及び顔検出が入力画像２００に対して実行される。それらの検出出力は、それぞれ画像２００ａ、２００ｂ及び２００ｃに示されている。２人の外観２０２ａ、２０４ａは、身体検出を使用して検出することができ、２人の外観２０２ｂ、２０４ｂはまた、ポーズ検出を使用して検出することができ、また、１人の人物の外観２０２ｃのみが顔検出により検出されるが、これは、他の人物の外観が顔検出には小さすぎる可能性があるためである。

【0037】

本開示によれば、方法及び装置はまた、撮像デバイスが、例えばユーザによって、撮像デバイスが使用され、設置され、又は動作するように構成されることを目標として（事前）構成され得ることを提供する。目標の例は、顔認識、行動認識、又は群衆推定を含む。各目標は異なる検出重みプロファイルを有し、異なるビデオ分析検出が実行され、異なる検出重みが異なるビデオ分析検出にも適用される。例えば、撮像デバイスは、１及び３のそれぞれの検出重みで画像ごとに身体検出及び顔検出が実行される顔認識を実行することを目標として構成されてもよい。これは、画像から人物の顔を通して検出された外観は、同じ画像から人物の身体を通して検出された外観よりも高い尺度／カウント（３倍高い）が与えられることを意味する。一方、行動認識下では、撮像デバイスは、１、２、及び３のそれぞれの検出重みで身体検出、顔検出、及びポーズ検出を実行するように構成されてもよく、群衆推定の下では、１及び３のそれぞれの検出重みで身体検出及びポーズ検出が実行される。

【0038】

有利には、関心領域又は焦点領域（例えば、焦点矩形）は、撮像デバイスの予め設定された目標に関する検出重みプロファイルに基づいて決定され、その視野及び検出領域は、撮像デバイスの焦点領域に基づいて調整され、その予め設定された検出及び監視目標に従ってビデオ分析検出をより良好に実行する。

【0039】

図３は、本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法を示すフローチャートを示す。ステップ３０２で、一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出するステップが実行される。ステップ３０４で、１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成するステップが実行される。マップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含む。ステップ３０６で、検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定するステップが実行される。未利用部分の各々は、外観の第１の尺度に関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示す。ステップ３０８で、複数の部分のうちの利用部分の少なくとも一部を含む検出領域内の焦点領域が、ステップ３０６における決定に応じて、撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整するステップ。

【0040】

図４は、本開示の様々な実施の形態による、撮像デバイス４０２によって撮像される画像の検出領域を適応的に調整するためのシステム４００を示すブロック図を示す。

【0041】

一例では、画像入力の管理は、少なくとも撮像デバイス４０２及び装置４０４によって実行される。システム４００は、装置４０４と通信する撮像デバイス４０２を備える。一実装形態では、装置４０４は、概して、少なくとも１つのプロセッサ４０６と、コンピュータプログラムコードを含む少なくとも１つのメモリ４０８とを備える物理デバイスとして説明され得る。少なくとも１つのメモリ４０８及びコンピュータプログラムコードは、少なくとも１つのプロセッサ４０６とともに、物理デバイスに、図３で説明される動作を実行させるように構成される。プロセッサ４０６は、撮像デバイス４０２から複数の入力画像を受信するか、又はデータベースから複数の入力画像を検索するように構成される。代替的又は追加的に、撮像デバイス４０２によって撮像された複数の入力画像は、データベース４１０に記憶され、プロセッサ４０６は、データベース４１０から複数の入力画像を検索するように構成される。

【0042】

撮像デバイス４０２は、１人又は複数の人物の外観を検出するためにシステムによって使用され得る外観データの様々なデータを提供する閉回路テレビ（ＣＣＴＶ）などのデバイスであり得る。一実装形態では、撮像デバイス４０２から導出された外観データは、装置４０４のメモリ４０８又は装置４０４によってアクセス可能なデータベース４１０に記憶され得る。外観データは、（ｉ）目、鼻、頬骨、顎及び顎の相対的な位置、サイズ、形状及び／又は輪郭、ならびに虹彩模様、皮膚の色、髪の色又はそれらの組合せなどの顔特徴データ、（ｉｉ）身長、身体の大きさ、身体比率、四肢の長さ、髪の色、皮膚の色、衣服、所有物、他の同様の特性又は組合せなどの物理的特性データ、及び（ｉｉｉ）身体の動き、四肢の位置、動きの方向、移動速度、歩行パターン、人の立ち方、動き、話し方、他の同様の特性又は組合せなどの行動特性データを含み得る。

【0043】

一実装形態では、位置及び解像度などのカメラデータ、ならびに／又は１人もしくは複数の人物が識別されたタイムスタンプを含む時間データも、撮像デバイス４０２から導出され得る。カメラデータ及び／又は時間データは、装置４０４のメモリ４０８又は装置４０４によってアクセス可能なデータベース４１０に記憶されてもよく、プロセッサ４０６は、時間データに基づいて外観データ又は画像を識別及び検索するように構成される。データベース４１０は、装置４０４の一部であってもよいことを理解されたい。

【0044】

装置４０４は、撮像デバイス４０２及びデータベース４１０と通信するように構成され得る。一例では、装置４０４は、入力として撮像デバイスの同じ視野に関連する複数の画像を撮像デバイス４０２から受信するか、又はデータベース４１０から検索し、装置４０４のプロセッサ４０６による処理の後に、後続の画像を撮像するために撮像デバイス４０２の視野を調整するために使用され得る出力を生成し得る。

【0045】

本開示によれば、撮像デバイス４０２から画像を受信するか、又はデータベース４１０から画像を検索した後、メモリ４０８及びそれに記憶されたコンピュータプログラムコードは、プロセッサ４０６を用いて、装置４０４に、一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出させ、１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成させ、第１のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含み、検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる。

【0046】

図５は、本開示の実施の形態による、撮像デバイスの検出領域を適応的に調整する動作の一部を実行するシステム５００を示すフロー図を示す。システムは、カメラ５０２の各々によって撮像された一連の入力画像（例えば、オンラインビデオアーカイブシステム又はオフラインのビデオファイル入力からの画像又はビデオファイル５０４の履歴シーケンス）を検索し、第１のレベルのビデオ分析検出（例えば、身体／顔検出）を実行するように構成されたビデオアーカイブ検索システム５０６を備えてもよい。第１のレベルのビデオ分析検出出力（例えば、検出された人物外観データ）及びその対応する入力画像は、位置、解像度、タイムスタンプなどのすべての必要なカメラ情報とともに、人物外観データベース５０８に記憶される。一例では、分析検出出力を有さない、すなわち、ビデオ分析検出に基づいて人物の外観が検出されない入力画像は破棄され、さらなる処理のために人物外観データベース５０８に記憶されない。様々な実施の形態では、人物外観データベース５０８は、追加的及び任意選択的ポーズ、身体及び顔の検出のために画像及び検出データを検索するように構成される。

【0047】

図６は、撮像デバイスの検出領域を適応的に調整する動作の他の一部を実行する図５のシステム５００を示すフロー図を示す。ユーザは、撮像デバイス、この場合はカメラ１６０２を指定してもよく、分析のための時間範囲、及び時間期間内に撮像された（又は時間データに関連付けられた）画像６０４ａ～６０４ｄが入力として検索され、第１のレベルの検出出力及びカメラ情報などのすべての関連情報が、さらなる処理のために人物外観データベース５０８から検索される。本開示によれば、カメラ５０２（カメラ１６０２を含む）の各々は、カメラが使用され、設置され、又は実行するように構成されることを目標として構成される。この場合、カメラ１６０２は顔認識目標プロファイルで構成され、したがって、身体検出、ポーズ検出、及び顔検出が実行され、それぞれ１、３、及び３の検出重みが与えられる。身体検出に関する第１のレベルのビデオ分析が実行されると、システム５００は、次に、所定の顔認識目標プロファイルに基づいて、目標プロファイル要件を満たすために、検索された入力画像６０４ａ～６０４ｄを使用して、ポーズ検出及び顔検出に関するオンデマンド追加ビデオ分析を実行してもよい。

【0048】

図７は、本開示の実施の形態による、入力画像７０４ａ～７０４ｄから検出された１人又は複数の人物の外観に基づいて検出マップ７０６、７０８及び合成検出マップ７１０を生成するプロセスを示すフロー図７００を示す。選択された期間にわたって撮影されたカメラ１の同じ検出領域又は視野を反映する入力画像７０４ａ～７０４ｄと、目標プロファイル７０３及び７０５に示すような解像度（例えば、１０２４×７６８）などのカメラ１データとが検索される。目標プロファイル７０３に基づいて、身体検出及び顔検出に関するビデオ分析は、それぞれ１及び３の検出重みで入力画像７０４ａ～７０４ｄの各々に対して実行されるべきである。

【0049】

各検索画像について、ビデオ分析ごとに選択されたカメラ１の解像度に従って２Ｄアレイメモリストレージが構築され、２Ｄアレイ検出マップを０の値で初期化する。本開示の実施の形態によれば、各検索画像７０４ａ～７０４ｄの検出領域は、複数の正方格子セルに分割されて、選択されたカメラ１の解像度７０５に従って２Ｄアレイ検出マップを形成する。２Ｄアレイ検出マップは０の値で初期化される。外観の尺度は、ビデオ分析検出ごとに２Ｄアレイ内で検出された１人又は複数の人物の外観に基づいて２Ｄアレイ検出マップのセルの各々について決定され、したがって、すべてのセルにわたる外観の尺度の集計を反映する２Ｄアレイ検出マップが、ビデオ分析検出ごとに生成される。

【0050】

検出マップ７０６、７０８は、１つの入力画像（７０４ａ、７０４ｂ、７０４ｃ又は７０４ｄ）から生成された検出マップのうち、身体検出と顔検出とに基づいて人の外観を検出する部分を示している。身体検出に基づく検出マップ７０６の１２個のセルと、顔検出に基づく検出マップ７０８の４個のセルとにおいて、人物の外観が検出される。このような外観の検出は、外観が検出されたそれぞれのセルにおける外観のカウントを構成するが、外観の尺度（すなわち、ビデオ分析検出出力の出力）は、ビデオ分析検出のそれぞれの検出重みに基づいて増加される。この実施の形態では、身体検出及び顔検出の検出重みはそれぞれ１及び３であり、したがって、身体検出によって人の外観が検出される１２個のセルは、検出マップ７０６に示すように、１の外観の尺度を有し、一方、顔検出面を介して人物の外観が検出される４つのセルは、したがって、検出マップ７０８に示すように、３の外観の尺度を有する。

【0051】

さらに、対応して複数の検出マップ７０６、７０８内の外観の尺度を合計することによって、入力画像（７０４ａ、７０４ｂ、７０４ｃ又は７０４ｄ）からの複数のビデオ分析検出を通じてカメラ１の視野の同じ検出領域内で検出された人物の外観を示す１０２４×７６８の合成検出マップ（合成検出マップ７１０の一部のみが示されている）が生成される。

【0052】

図８は、本開示の実施の形態による、カメラによって撮像された複数の入力画像にわたって検出された人物の外観に基づいて分析密度マップを生成するプロセスを示すフロー図を示す。各入力画像から同じ視野を反映する合成検出マップが生成され、分析データベース８０４に記憶される。次いで、選択された期間内に同じ視野を有する複数の入力画像から生成された合成検出マップ８０２は、分析データベース８０４から検索され、検索されたすべての合成検出マップ８０２の外観の尺度を対応して合計することによって分析密度マップを生成する。本開示によれば、そのような分析密度マップ８０６は、選択された期間にわたって検出されたすべてのセル内のすべての人物の外観の尺度（以下、「検出密度値」と呼ぶことがある）を示し、カメラの検出及び視野を調整するためのさらなる処理及び分析に使用することができる。

【0053】

図９は、本開示の実施の形態による、８時間の期間にわたってカメラ（この場合、カメラ１）によって以前に検出された複数の入力画像から検出された複数の人物の外観に基づいて生成された例示的な分析密度マップ９０６を示す。簡単にするために、１４×９（幅×高さ）の解像度を有する２Ｄ分析密度マップ９０６が示されている。分析密度マップ９０６内の各セルの値は、８時間にわたってカメラ１によって撮像された１４×９の同じ解像度を有する複数の画像９０２から生成された合成検出マップを合計することによって計算される。

【0054】

図１０は、本開示の実施の形態による、図９の分析密度マップに基づく検出領域の未利用部分及び利用部分を示す。未利用部分又はスペースは、選択された期間にわたって外観が検出されない検出領域内の部分である。そのような未利用部分又はスペースは、図１０のハッチングされたブロック１００４を用いて示されるように、分析密度マップ９０６においてゼロの外観の尺度として反映される。一方、利用部分又はスペースは、選択された期間にわたって少なくとも１人の外観が検出された検出内の部分であり、そのような利用部分又はスペースは、図１０の白地のブロック１００６を用いて示すように、分析密度マップ９０６において非ゼロの外観の尺度として反映される。本開示によれば、未利用スペース百分率は、式（１）を用いて計算される：

【数1】

ここで、全スペース数は、カメラ解像度による分析密度マップ内の検出領域からのセル（部分又はスペース）の総数を指す。

【0055】

この実施の形態では、カメラ解像度は、幅×高さ（又は列×行）に関して１４×９であり、検出領域は、１×１の解像度で複数のセルにセグメント化される。したがって、分析密度マップ９０６の未利用スペース百分率は、５１／（９×１４）＝５１／１２６＝０．４０４７６１又は４０．４７６１％である。次いで、そのような未利用スペース百分率が、予め設定された利用不足閾値を上回っているかどうかがチェックされる。利用スペース百分率が利用不足閾値を上回る場合、検出領域内の焦点領域を決定する後続のステップが実行され、そうでなければ、さらなる動作又はプロセスは実行されない。この場合、予め設定された利用不足閾値は０．４又は４０％である。未利用スペース百分率が利用不足閾値よりも高いので、システムは、以下で説明する焦点領域決定ステップの実行に進み得る。

【0056】

検出領域内の焦点領域（以下、焦点矩形と呼ぶことがある）は、検出密度値範囲を使用して決定され得る。プロセスは、２Ｄ分析密度マップ内の最大密度値を見つけることから開始し得る。図１１は、本開示の実施の形態による、図９の分析密度マップ９０６で生成された外観の最高尺度を、ハッチングされたブロック１１０４で強調している。

【0057】

続いて、最大密度値に基づいて焦点領域の最小密度値が決定される。１つの実施の形態では、最小密度値は、事前定義された焦点密度閾値又は最大密度値と乗算された乗数を使用することによって計算される。この場合、事前定義された焦点密度閾値が０．６である場合、最小密度値は１５×０．６０又は９である。このように、焦点矩形を特定するために９～１５の検出密度範囲が決定される。

【0058】

図１２は、本開示の実施の形態による、図９の分析密度マップで生成された外観の尺度に基づいて利用部分から選択された焦点領域を示す。９の最小密度値が使用され、分析密度マップ９０６内のすべての利用部分の外観の尺度と比較され、最小密度値よりも高い外観の尺度を有する利用部分の一部を識別する。最小密度値よりも高い外観の尺度を有する識別された利用部分は、図１２のハッチングされたブロックに示されている。すべての識別された利用部分を囲む矩形領域１２０６が焦点矩形１２０６として決定される。マップ９０６内の焦点矩形１２０６を形成する４つのエッジのｘ座標及びｙ座標も識別される。

【0059】

一例では、焦点矩形は、識別された利用部分のうちの最小及び最大座標によって、最小密度値から最大密度値までの範囲内にある密度値を有する識別された利用部分の各々の座標と焦点矩形の４つのエッジとを最初に識別することによって識別される。この場合、最大ｘ座標は４と１３、最大ｙ座標は５と９であるため、焦点矩形を定義する｛４，５｝、｛４，９｝、｛１３，５｝、｛１３，９｝の４つのエッジの座標が識別される。

【0060】

図１３は、本開示の実施の形態による、焦点領域１３０４に対する検出領域１３０２内の基準中心部分を示す。決定された焦点矩形１３０４の基準中心部分又は位置１３０６は、焦点矩形１３０４の幅及び高さ（この場合は９×４）ならびに検出領域又はマップ１３０２の幅及び高さ（１４×９）を使用して計算することができる。特に、基準中心部分１３０６の左上エッジのｘ座標及びｙ座標は、以下の式を使用して計算され得る：

【数2】

【数3】

ここで、全幅は検出領域の幅（この実施の形態では１４）であり、全高さは検出領域の高さ（この実施の形態では９）であり、焦点幅は焦点矩形の幅（この実施の形態では９）であり、焦点高さは焦点矩形の高さ（この実施の形態では４）である。基準中心部分１３０６の左上エッジのｘ及びｙ座標は｛３，３｝である。

【0061】

図１４は、本開示の実施の形態による、検出領域内の基準中心部分に焦点領域１４０４を再配置するための視野調整を示す。検出領域内の焦点矩形及びその基準中心部分のｘ座標及びｙ座標が識別されると、焦点矩形１４０４を基準中心部分に再配置するように、カメラ１４００の現在の視野１４０２を新しい視野１４１２に調整するために必要なカメラ設定の変更を決定することができる。焦点領域１４０４を検出領域内の基準中心部分に再配置するために必要なパン、チルト及びズーム調整の計算の例は、図１６～図１８及びそれらの付随する説明において詳述される。

【0062】

カメラ１４００の現在の視野１４０２に関連する現在のカメラ設定（例えば、パン角、チルト角及びズーム値）が検索され、新しい視野１４１２に関連する新しい提案候補カメラ設定が決定される。１つの実施の形態では、現在のカメラ設定と新しいカメラ設定との間の調整差が計算され、調整差が予め設定された最小変化閾値よりも大きいかどうかがチェックされる。調整差が最小変化閾値よりも大きい場合、ズーム調整（倍率の変更）を提案するかどうかの決定が行われ、そうでなければ、調整差が最小変化閾値よりも小さく、カメラ設定の大きな変更が必要とされないことを示す場合、例えば、焦点領域が既に基準中心部分又は検出領域の中心部分の近く又はそこにあってもよく、さらなる動作又はプロセスは実行されない。

【0063】

例えば、現在の視野１４０２に対する現在のカメラチルト角は３０°であり、４５°の新しい視野１４１２に対する新しいカメラチルト角が、焦点矩形１４０４を基準中心部分に再配置するために必要であると決定され、カメラ角度変化百分率（調整差）は、（４５°－３０°）／３０°又は０．５又は５０％である。この場合、予め設定された最小カメラ角度変化百分率閾値は０．３又は３０％である。調整差が最小変化閾値よりも大きいので、４５°のカメラ角度提案候補が提案となる。

【0064】

ズーム調整を提案するかどうかの決定は、例えば、カメラ設定から導出されるプロファイルのズームイン値を決定することにより行われる。プロファイルのズームイン値が真である場合、フル解像度への焦点矩形のズーム計算が新しい提案候補設定に追加され得る。プロファイルのズームイン値が偽である場合、ズームの提案又は倍率の変更は新しい提案候補設定に含まれない。

【0065】

さらに、ズーム調整提案はまた、入力画像から検出された人物の外観の解像度に基づいて決定されてもよい。図１５は、本開示の実施の形態による、検出領域を調整するための撮像デバイスの倍率の変化を示す。この実施の形態では、複数の入力画像１５０２にわたる検出された人物の外観は、平均して３０ピクセル（又は特定の数のセグメント化された部分）を占めることが決定される。そのような場合、カメラによって取り込まれた後続の画像１５０６で検出された人物の外観が少なくとも又は特定の予め設定された解像度に近い解像度を有するように、倍率の変更が新しい提案候補設定に含まれてもよい。

【0066】

追加的又は代替的に、検出領域又は予め設定された焦点領域サイズ１５０６内に予め設定された中央部分があってもよい。焦点矩形１５０４のサイズが予め設定された中央部分（又はサイズ１５０６）よりも大きい又は小さい場合、焦点矩形が予め設定された中央部分又はサイズ１５０６に適合又は一致するように、ズームイン又はズームアウトするためのカメラの倍率の変化。

【0067】

続いて、計算されたカメラ設定、すなわちパン＋チルト＋ズーム、再調整提案が提供される。

【0068】

実施の形態によれば、カメラビューのパン及びチルト調整は、ピクセル座標差及び視野角（ＡＦＯＶ）を使用して計算することができる。図１６は、本開示の実施の形態による、ピクセル座標差及び視野角（ＡＦＯＶ）を使用して焦点領域１６０４を基準中心部分１６０６に再配置するための検出領域内の調整に対応する例示的なカメラビュー調整を示す。この実施の形態では、焦点領域１６０４の左上隅のｘ座標及びｙ座標、すなわち｛４，５｝、ならびに基準中心部分１６０６、すなわち｛３，３｝が決定される。ｘ座標及びｙ座標を用いて、焦点領域１６０４と基準中心部分１６０６との間のピクセル座標差は、以下の式を使用して計算することができる：

【数4】

【数5】

式中、ａｄｊＸは、焦点領域１６０４と基準中心部分１６０６との間のＸ軸（横軸）におけるピクセル座標差であり、ａｄｊＹは、Ｙ軸（縦軸）におけるピクセル座標差であり、ｎｅｗＸ及びｎｅｗＹは、それぞれ基準中心部分１６０６のｘ座標及びｙ座標を指し、ｏｒｇＸ及びｏｒｇＹは、それぞれ焦点領域１６０２のｘ座標及びｙ座標を指す。

【0069】

さらに、カメラセンサ１６１０のセンサ幅（１４．５９２７ｍｍ）及びセンサ高さ（８．２０８４ｍｍ）、ならびに焦点距離（２．８ｍｍ）などの現在のカメラ設定も検索される。

【0070】

水平ＡＦＯＶと垂直ＡＦＯＶの両方は、以下の式を使用して計算することができる：

【数6】

【数7】

【数8】

【数9】

ここで、Ｗはセンサ幅、Ｈはセンサ高さ、ｆは焦点距離、全体Ｗは画像又は検出領域１６０２の全幅（この場合は１４）、全体Ｈは画像又は検出領域１６０２の全高さ（この場合は９）である。この実施の形態では、計算された水平及び垂直ＡＦＯＶは、それぞれ１３８．０１１°及び１１１．３９４１°である。

【0071】

カメラパン調整（横軸周り）及びチルト調整（縦軸周り）は、以下の式を使用して計算することができる：

【数10】

【数11】

ハードウェア実装の目的のために調整を変換するために－１の逆方向係数が適用される。この実施の形態では、計算されたカメラのパン及びチルト調整は、それぞれ９．８５７９°及び２４．４５４２°である。

【0072】

図１７は、本開示の実施の形態による、検出領域内の調整に対応する例示的なカメラズーム調整を示す。焦点矩形１７０２のサイズとフル画像（現在の検出領域）１７０４の解像度に基づいて、以下の式（１２）、式（１３）を用いて、幅と高さのズーム調整を計算する：

【数12】

【数13】

ここで、ｆｕｌｌＲｅｓＷはフル画像解像度の幅、ｆｕｌｌＲｅｓＨはフル画像解像度の高さ、ｆｏｃｕｓＷは焦点領域の幅、ｆｏｃｕｓＨは焦点領域の高さである。カメラのズームイン又は拡大係数は、以下の式（１４）に示すように、ａｄｊＷ値とａｄｊＨ値との低いほうの値をとることによって決定することができる：

【数14】

【0073】

この実施の形態では、フル画像解像度（幅×高さ）は１４×９であり、焦点領域解像度は９×４である。計算されたａｄｊＷ及びａｄｊＨは、式（１２）及び式（１３）を使用してそれぞれ１．５５５５及び２．２５であり、式（１４）を使用して計算されたカメラズームイン係数は１．５５５５である。

【0074】

図１８は、本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスを示すフローチャート１８００を示す。ステップ１８０２で、人物外観データベースにおいて第１のレベルの分析検出を実行及び記憶するステップが実行される。ステップ１８０２は、図１９及びその付随する説明においてさらに詳述される。ステップ１８０４で、システム内の複数のカメラのうちのカメラ及び時間範囲を選択するステップがユーザによって実行される。ステップ１８０６で、ユーザ選択カメラの予め設定されたカメラ目標プロファイルを検索するステップが実行される。ステップ１８０８で、人物外観データベースから、選択された時間範囲内のユーザ選択カメラの画像及び検出データを検索するステップが実行される。ステップ１８１０で、人物外観データベースにおいて、選択された時間範囲内に、ユーザ選択カメラの画像及び検出データがさらにあるかどうかが決定される。存在しない場合、プロセスは終了してよく、そうでなければ、ステップ１８１２が実行される。

【0075】

ステップ１８１２で、画像及びその検出データから検出マップを生成するステップ。ステップ１８１４で、選択されたカメラ目標プロファイルで定義された重み付けに基づいて、ビデオ分析検出のための新しい検出マップを初期化及び更新するステップが実行される。ステップ１８１６で、カメラ目標プロファイルに定義された別のビデオ分析検出があるかどうかが決定される。決定が肯定的である場合、ステップ１８１４が他のビデオ分析検出のために実行される。存在しない場合、ステップ１８１８が実行される。

【0076】

ステップ１８１８で、合成検出マップを生成するステップが、ステップ１８１２及び１８１４で生成及び更新された画像のすべての検出マップを合計することによって実行される。ステップ１８２０で、ステップ１８１８で生成された合成検出マップを分析データベースに記憶するステップが実行される。ステップ１８２２で、他の画像があるかどうかが決定される。決定が肯定的である場合、他の画像を使用してステップ１８１２～１８２２が実行され、存在しない場合、ステップ１８２４が実行される。

【0077】

ステップ１８２４で、ユーザ選択カメラの画像及び時間範囲から生成された分析データベースから合成検出マップを検索するステップが実行される。ステップ１８２６で、分析密度マップを生成するステップが、ステップ１８２４で検索された合成検出マップを合計することによって実行される。ステップ１８２８で、分析密度マップにおける利用スペースを計算するステップが実行される。ステップ１８３０で、未利用スペース百分率を計算するステップが実行される。ステップ１８３２で、未利用スペース百分率が、事前定義された利用不足閾値を上回るかどうかが決定される。未利用スペース百分率が、事前定義された利用不足閾値よりも低い場合、プロセスは終了してもよく、そうでない場合、ステップ１８３４が実行され、カメラビュー調整提案を生成するために利用スペースを処理するステップが実行される。ステップ１８３４は、図２０及びその付随する説明においてさらに詳述される。

【0078】

図１９は、本開示の実施の形態による、図１８の人物外観データベース１８０２において第１のレベルの分析検出を実行及び記憶するプロセスを示すフローチャート１９００を示す。ステップ１８０２は、ステップ１９０２で画像の履歴シーケンスを取得することによって開始し得る。ステップ１９０４で、第１のレベルの分析検出を実行するステップが画像に対して実行される。ステップ１９０６で、第１のレベルの分析検出に基づいて、少なくとも１人の人物の外観が画像内で検出されたかどうかが決定される。人物の外観が検出されない場合、ステップ１９１０が実行され、そうでなければ、ステップ１９０８が実行される。ステップ１９０８で、画像、その検出データ及びカメラ情報を人物外観データベースに記憶するステップが実行される。ステップ１９１０で、他の画像があるかどうかが決定される。決定が肯定的である場合、他の画像を使用してステップ１９０４～１９１０が実行される。存在しない場合、プロセスは終了し得る。

【0079】

図２０は、本開示の実施の形態による、図１８のカメラビュー調整提案を生成するために利用スペースを処理するプロセス１８３４を示すフローチャート２０００を示す。ステップ２００２で、分析密度マップ内の最大密度値を見つけるステップが実行される。ステップ２００４で、最小密度値を計算するステップが実行される。ステップ２００６で、最小密度値から最大密度値までの範囲のすべての密度値の座標を求めるステップが実行される。ステップ２００８で、最小座標と最大座標で焦点矩形を定義するステップが実行される。ステップ２０１０で、焦点矩形の基準中心部分を計算するステップが実行される。ステップ２０１２で、カメラ調整を計算及び実行するステップが実行される。

【0080】

図２１は、本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスの概要を示す概略図２１００を示す。ビデオ及び／又は連続画像２１０２は、複数の撮像デバイスによって撮影されてもよく、各画像は、各画像から人物の外観を識別するために第１のレベルの分析検出（この場合は身体検出２１０４）を受ける。そして、少なくとも１人の人物の外観の画像が人物外観データベース２１０６に記憶される。ユーザは、時間範囲及びカメラを指定又は選択してもよく、時間範囲内でカメラによって撮像された画像２１０８が検索される。

【0081】

各検索された画像２１０８ａについて、画像のすべての部分における第１のレベルの分析検出（身体検出）に基づいて検出された外観の尺度を示す検出マップ２１１２ａが最初に生成され得る。選択されたカメラの目標プロファイルに基づいて、さらなるオンデマンドのビデオ分析検出２１１０が必要とされ得る。この場合、ポーズ及び顔検出に対する追加のビデオ分析が必要であり、したがって、それぞれの追加のビデオ分析検出に基づいて検出された外観の尺度を示す検出マップ２１１２ｂ及び２１１２ｃが生成される。任意選択的に、分析データベース２１１６に記憶する前に、複数の分析検出に基づいて生成されたすべての検出マップ２１１２ａ～２１１２ｃを合計することによって、処理された画像ごとに合成検出マップも生成される。

【0082】

続いて、すべての検索画像２１０８が処理され、検索画像２１０８から生成された検出マップ（及び合成検出マップ２１１４）が分析データベース２１１６に記憶された後、検出マップ（又は合成検出マップ）を合計することによって分析密度マップ２１１８が生成される。次いで、分析密度マップ２１１８を使用して、焦点矩形を識別し、焦点矩形を再配置するための基準中心部分の座標を計算し、ズーム調整が必要かどうかを決定する。次に、必要なカメラのパン及びチルト調整、ならびに選択されたカメラの視野を調整し、調整された視野の中央部分に焦点領域を再配置するためのズーム調整２１２０が計算される。次いで、パン、チルト及びズーム調整を実行して、選択されたカメラの視野を調整し、選択されたカメラの後続の画像が調整された検出領域の下で撮影されるようにする。

【0083】

図２２は、以下でコンピュータシステム２２００と交換可能に称される例示的なコンピューティングデバイス２２００の概略図を示し、１つ又は複数のかかるコンピューティングデバイス２２００は、図３の方法を実行し、図４の装置を実装するために使用され得るか、又は使用に適し得る。コンピューティングデバイス２２００の以下の説明は、例としてのみ提供され、限定することを意図するものではない。

【0084】

図２２に示すように、例示的なコンピューティングデバイス２２００は、ソフトウェアルーチンを実行するためのプロセッサ２２０４を含む。明確にするためにシングルプロセッサが示されているが、コンピューティングデバイス２２００はまた、マルチプロセッサシステムを含んでもよい。プロセッサ２２０４は、コンピューティングデバイス２２００の他の構成要素と通信するための通信インフラストラクチャ２２０６に接続される。通信インフラストラクチャ２２０６は、例えば、通信バス、クロスバー、又はネットワークを含み得る。

【0085】

コンピューティングデバイス２２００は、ランダムアクセスメモリ（ＲＡＭ）などのメインメモリ２２０８と、二次メモリ２２１０とをさらに含む。二次メモリ２２１０は、例えば、ハードディスクドライブ、ソリッドステートドライブ又はハイブリッドドライブであり得るストレージドライブ２２１２、及び／又は磁気テープドライブ、光ディスクドライブ、ソリッドステートストレージドライブ（例えば、ＵＳＢフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカード）などを含んでもよいリムーバブルストレージドライブ２２１４を含んでもよい。リムーバブルストレージドライブ２２１４は、周知の方法でリムーバブル記憶媒体２２１８から読み出し、かつ／又はそれに書き込む。リムーバブル記憶媒体２２１８は、リムーバブルストレージドライブ２２１４によって読み出され、書き込まれる磁気テープ、光学ディスク、不揮発性記憶媒体などを含み得る。当業者（複数可）には理解されるように、リムーバブル記憶媒体２２１８は、コンピュータ実行可能プログラムコード命令及び／又はデータを記憶したコンピュータ可読記憶媒体を含む。

【0086】

代替的な実装形態では、二次メモリ２２１０は、追加的又は代替的に、コンピュータプログラム又は他の命令がコンピューティングデバイス２２００にロードされることを可能にするための他の同様の手段を含み得る。かかる手段は、例えば、リムーバブルストレージユニット２２２２及びインタフェース２２２０を含み得る。リムーバブルストレージユニット２２２２及びインタフェース２２２０の例は、プログラムカートリッジ及びカートリッジインタフェース（ビデオゲームコンソールデバイスに見られるものなど）、リムーバブルメモリチップ（ＥＰＲＯＭ又はＰＲＯＭなど）及び関連するソケット、リムーバブルソリッドステートストレージドライブ（ＵＳＢフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカードなど）、ならびにソフトウェア及びデータをリムーバブルストレージユニット２２２２からコンピュータシステム２２００に転送することを可能にする他のリムーバブルストレージユニット２２２２及びインタフェース２２２０を含む。

【0087】

コンピューティングデバイス２２００はまた、少なくとも１つの通信インタフェース２２２４を含む。通信インタフェース２２２４は、ソフトウェア及びデータが通信パス２２２６を介してコンピューティングデバイス２２００と外部デバイスとの間で転送されることを可能にする。本発明の種々の実施の形態では、通信インタフェース２２２４は、データが、コンピューティングデバイス２２００と、パブリックデータ又はプライベートデータ通信ネットワークなどのデータ通信ネットワークとの間で転送されることを可能にする。通信インタフェース２２２４は、異なるコンピューティングデバイス６００間でデータを交換するために使用されてもよく、かかるコンピューティングデバイス２２００は、相互接続されたコンピュータネットワークの一部を形成する。通信インタフェース２２２４の例としては、モデム、ネットワークインタフェース（イーサネットカードなど）、通信ポート（シリアル、パラレル、プリンタ、ＧＰＩＢ、ＩＥＥＥ１３９４、ＲＪ４５など）、関連回路を有するアンテナなどを挙げることができる。通信インタフェース２２２４は、有線であってもよいし、無線であってもよい。通信インタフェース２２２４を介して転送されるソフトウェア及びデータは、通信インタフェース２２２４によって受信されることが可能な電子信号、電磁信号、光信号、又は他の信号であり得る信号の形態である。これらの信号は、通信パス２２２６を介して通信インタフェースに提供される。

【0088】

図２２に示すように、コンピューティングデバイス２２００は、関連するディスプレイ２２３０に画像をレンダリングするための動作を実施するディスプレイインタフェース２２０２と、関連するスピーカ（複数可）２２３４を介してオーディオコンテンツを再生するための動作を実施するオーディオインタフェース２２３２とをさらに含む。

【0089】

本明細書で使用する「コンピュータプログラム製品」という用語は、部分的に、リムーバブル記憶媒体２２１８、リムーバブルストレージユニット２２２２、ストレージドライブ２２１２にインストールされたハードディスク、又は通信パス２２２６（無線リンク又はケーブル）を介して通信インタフェース２２２４にソフトウェアを搬送するキャリア波を指すことがある。コンピュータ可読記憶媒体は、実行及び／又は処理のために、記録された命令及び／又はデータをコンピューティングデバイス２２００に提供する任意の非一時的な不揮発性有形記憶媒体を指す。かかる記憶媒体の例は、かかるデバイスがコンピューティングデバイス２２００の内部にあるか外部にあるかにかかわらず、磁気テープ、ＣＤ－ＲＯＭ、ブルーレイディスク、ハードディスクドライブ、ＲＯＭ又は集積回路、ソリッドステートストレージドライブ（ＵＳＢフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカードなど）、ハイブリッドドライブ、光磁気ディスク、又はＰＣカードなどのコンピュータ可読カードなどを含む。コンピューティングデバイス２２００へのソフトウェア、アプリケーションプログラム、命令、及び／又はデータの提供にも関与し得る一時的又は非有形のコンピュータ可読伝送媒体の例は、無線又は赤外線伝送チャネル、ならびに別のコンピュータ又はネットワーク化されたデバイスへのネットワーク接続、及び電子メール伝送及びウェブサイトなどに記録された情報を含むインターネット又はイントラネットを含む。

【0090】

コンピュータプログラム（コンピュータプログラムコードとも称される）は、メインメモリ２２０８及び／又は二次メモリ２２１０に記憶される。コンピュータプログラムは、通信インタフェース２２２４を介して受信することもできる。かかるコンピュータプログラムは、実行されると、コンピューティングデバイス２２００が本明細書で論じられる実施の形態の１つ又は複数の特徴を実施することを可能にする。種々の実施の形態では、コンピュータプログラムは、実行されると、プロセッサ１２０７が上述の実施の形態の特徴を実施することを可能にする。したがって、かかるコンピュータプログラムは、コンピュータシステム２２００のコントローラを表す。

【0091】

ソフトウェアは、コンピュータプログラム製品に記憶され、リムーバブルストレージドライブ２２１４、ストレージドライブ２２１２、又はインタフェース２２２０を使用して、コンピューティングデバイス２２００にロードされ得る。コンピュータプログラム製品は、非一時的なコンピュータ可読媒体であってもよい。代替的に、コンピュータプログラム製品は、通信パス２２２６を介してコンピュータシステム２２００にダウンロードされてもよい。ソフトウェアは、プロセッサ２２０４によって実行されると、コンピューティングデバイス２２００に、図３に示される方法を実行し図４の装置を実装するために必要な動作を実施させる。

【0092】

図２２の実施の形態は、装置２２００の動作及び構造を説明するための単なる例として提示されていることを理解されたい。したがって、一部の実施の形態では、コンピューティングデバイス２２００の１つ又は複数の特徴が省略されてもよい。また、一部の実施の形態では、コンピューティングデバイス２２００の１つ又は複数の特徴を一緒に組み合わせてもよい。加えて、一部の実施の形態では、コンピューティングデバイス２２００の１つ又は複数の特徴は、１つ又は複数の構成要素部分に分割され得る。

【0093】

図２３は、本開示の様々な実施の形態による、撮像デバイス４０２によって撮像される画像の検出領域を適応的に調整するための装置４０４を示すブロック図を示す。装置４０４は、少なくとも１つのプロセッサ４０６と、コンピュータプログラムコードを含む少なくとも１つのメモリ４０８とを備える。

【0094】

当業者であれば、広範に記載された本発明の精神又は範囲から逸脱することなく、特定の実施の形態に示された本発明に対して多数の変形及び／又は修正を行い得ることを理解するであろう。したがって、本実施の形態は、あらゆる点で例示的であり、限定的ではないと考えられるべきである。

【0095】

本出願は、２０２１年１０月１４日に出願されたシンガポール特許出願第１０２０２１１１４４２Ｒ号を基礎とする優先権を主張し、その開示は、参照によりその全体が本明細書に組み込まれる。

【0096】

付記
上記の実施の形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
（付記１）
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためにコンピュータによって実行される方法であって、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出することと、
１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成することであって、第１のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含む、生成することと、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定することであって、未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示す、決定することと、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整することと
を含む、方法。
（付記２）
複数の入力画像の各々から、複数の第２のマップを生成すること
をさらに含み、
複数の第２のマップの各々は、検出領域に対応し、１人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも１つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の異なる第２の尺度を含み、
第１のマップを生成することは、複数の入力画像の各々から生成された複数の第２のマップに関して、検出領域の複数の部分の各々において検出された１人又は複数の人物の外観のそれぞれの第２の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第１のマップ内の１人又は複数の人物の外観の第１の尺度を決定することを含む、
付記１に記載の方法。
（付記３）
１人又は複数の人物の身体部分、特性又は動きのうちの少なくとも１つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された１人又は複数の人物の外観のカウントと、撮像デバイスによって顔の特徴、身体部分、特性又は動きのうちの少なくとも１つに基づいて検出された外観の予め設定された検出重みとに基づいて、人物の外観の第２の尺度を決定すること
をさらに含む、付記２に記載の方法。
（付記４）
検出領域に対応する第３のマップを生成することをさらに含み、第３のマップは、複数の入力画像の各々における検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第３の尺度を含み、第３の尺度は、複数の入力画像の各々からの検出領域の複数の部分の各々において検出された複数の第２のマップの１人又は複数の人物の外観のそれぞれの第２の尺度の和であり、
第１のマップを生成することは、複数の入力画像から生成された第３のマップに関して、検出領域の複数の部分の各々において検出された１人又は複数の人物の外観のそれぞれの第３の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第１のマップ内の１人又は複数の人物の外観の第１の尺度を決定することを含む、
付記２又は３に記載の方法。
（付記５）
利用部分の少なくとも一部の各々が、１人又は複数の人物の外観の閾値尺度以上である１人又は複数の人物の外観の尺度に関連付けられるか決定すること
をさらに含む、付記１～４のいずれか１項に記載の方法。
（付記６）
第１のマップにおいて生成された１人又は複数の人物の外観の第１の尺度のうち、１人又は複数の人物の外観の最高尺度を決定することと、
１人又は複数の人物の外観の最高尺度に基づいて人物の外観の閾値尺度を計算することと
をさらに含む、付記５に記載の方法。
（付記７）
検出領域を調整することは、
検出領域に対する撮像デバイスのデバイス角度を変更するために、水平軸及び／又は垂直軸を中心に撮像デバイスを回転させることと、
焦点領域が、撮像デバイスによって撮像される画像の調整された検出領域の中心の周りの予め設定された中心部分を占めるように、撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも１つを含む、付記１～６のいずれか１項に記載の方法。
（付記８）
焦点領域を検出領域の中心に移動させるために必要な検出領域の調整量を計算することと、
検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定することと
をさらに含み、
検出領域を調整することは、検出の量が予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
付記１～７のいずれか１項に記載の方法。
（付記９）
撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置であって、
少なくとも１つのプロセッサと、
コンピュータプログラムコードを含む少なくとも１つのメモリと
を備え、
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出させ、
１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成させ、第１のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる、
装置。
（付記１０）
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、複数の入力画像の各々から、複数の第２のマップを生成させ、複数の第２のマップの各々は、検出領域に対応し、１人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも１つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の異なる第２の尺度を含み、
第１のマップを生成することは、複数の入力画像の各々から生成された複数の第２のマップに関して、検出領域の複数の部分の各々において検出された１人又は複数の人物の外観のそれぞれの第２の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第１のマップ内の１人又は複数の人物の外観の第１の尺度を決定することを含む、
付記９に記載の装置。
（付記１１）
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、
１人又は複数の人物の身体部分、特性又は動きのうちの少なくとも１つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された１人又は複数の人物の外観のカウントと、撮像デバイスによって顔の特徴、身体部分、特性又は動きのうちの少なくとも１つに基づいて検出された外観の予め設定された検出重みとに基づいて、１人又は複数の人物の外観の第２の尺度を決定させる、
付記９に記載の装置。
（付記１２）
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、検出領域に対応する第３のマップを生成させ、第３のマップは、複数の入力画像の各々における検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第３の尺度を含み、第３の尺度は、複数の入力画像の各々からの検出領域の複数の部分の各々において検出された複数の第２のマップの１人又は複数の人物の外観のそれぞれの第２の尺度の和であり、
第１のマップを生成することは、複数の入力画像から生成された第３のマップに関して、検出領域の複数の部分の各々において検出された１人又は複数の人物の外観のそれぞれの第３の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第１のマップ内の１人又は複数の人物の外観の第１の尺度を決定することを含む、
付記１０又は１１に記載の装置。
（付記１３）
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、
利用部分の少なくとも一部の各々が、１人又は複数の人物の外観の閾値尺度以上である１人又は複数の人物の外観の尺度に関連付けられるか決定させる、
付記９～１２のいずれか１項に記載の装置。
（付記１４）
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、
第１のマップにおいて生成された１人又は複数の人物の外観の第１の尺度のうち、１人又は複数の人物の外観の最高尺度を決定させ、
１人又は複数の人物の外観の最高尺度に基づいて人物の外観の閾値尺度を計算させる、
付記１３に記載の装置。
（付記１５）
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、
検出領域に対する撮像デバイスのデバイス角度を変更するために、水平軸及び／又は垂直軸を中心に撮像デバイスを回転させることと、
焦点領域が、撮像デバイスによって撮像される画像の調整された検出領域の中心の周りの予め設定された中心部分を占めるように、撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも１つを実行させる、付記９～１４のいずれか１項に記載の装置。
（付記１６）
少なくとも１つのメモリ及びコンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、装置に、少なくとも、
焦点領域を検出領域の中心に移動させるために必要な検出領域の調整量を計算させ、
検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定させ、検出領域を調整することは、検出の量が予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
付記９～１５のいずれか１項に記載の装置。
（付記１７）
付記９～１６のいずれか１項に記載の装置と撮像デバイスとを備える、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステム。
（付記１８）
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムを記憶する非一時的なコンピュータ可読媒体であって、プログラムは、コンピュータに、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の１人又は複数の人物の外観を検出させ、
１人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第１のマップを生成させ、第１のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された１人又は複数の人物の外観の第１の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、検出領域の複数の部分のうちの部分であり、１人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる、
非一時的なコンピュータ可読媒体。

【符号の説明】

【0097】

１００画像
１０２カメラ
１０４外観
１０５ビュー
１０６方向
１１０画像
１１４人物
１１６方向
１１８検出領域
１２０、１２０’ ビュー、画像
１２２、１２２’ 焦点領域
２００入力画像
２００ａ～２００ｃ画像
２０２ａ～２０２ｃ人物外観
２０４ａ、２０４ｂ人物外観
３００方法、フローチャート
４００システム
４０２撮像デバイス
４０４装置
４０６プロセッサ
４０８メモリ
４１０データベース
５００システム
５０２カメラ
５０４画像又はビデオファイル
５０６ビデオアーカイブ検索システム
５０８人物外観データベース
６０２カメラ１
６０４ａ～６０４ｄ検索された入力画像
７００フロー図
７０３目標プロファイル
７０４ａ～７０４ｄ入力画像
７０５選択されたカメラ１の解像度
７０６、７０８検出マップ
７１０合成検出マップ
８０２合成検出マップ
８０４分析データベース
８０６分析密度マップ
９０２入力画像
９０６２Ｄ分析密度マップ
１００４未利用部分又はスペース
１２０６焦点矩形、矩形領域
１２０７プロセッサ
１３０２検出領域、検出マップ
１３０４焦点矩形、矩形領域
１３０６基準中心部分
１４００カメラ
１４０２現在の視野
１４０４焦点矩形、矩形領域
１４１２新しい視野
１５０２入力画像
１５０４焦点矩形
１５０６後続の画像、予め設定された焦点領域サイズ、予め設定された中心部分又はサイズ
１６０２検出領域又は焦点領域
１６０４焦点領域
１６０６基準中心部分
１６１０カメラセンサ
１７０２焦点矩形
１７０４フル画像
１８００フローチャート
１９００フローチャート
２０００フローチャート
２１００概略図
２１０２ビデオ画像／連続画像
２１０４身体検出
２１０６人物外観データベース
２１０８、２１０８ａ検索画像
２１１０オンデマンドビデオ分析検出
２１１２ａ～２１１２ｃ検出マップ
２１１４合成検出マップ
２１１６分析データベース
２１１８分析密度マップ
２１２０ズーム調整
２２００コンピュータシステム、コンピュータデバイス又は装置
２２０２ディスプレイインタフェース
２２０４プロセッサ
２２０６通信インフラストラクチャ
２２０８メインメモリ
２２１０二次メモリ
２２１２ストレージドライブ
２２１４リムーバブルストレージドライブ
２２１８リムーバブル記憶媒体
２２２０インタフェース
２２２２リムーバブルストレージユニット
２２２４通信インタフェース
２２２６通信パス
２２３０ディスプレイ
２２３２オーディオインタフェース
２２３４スピーカ（複数可）

【図1A】

【図1B】

【図1C】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16】

【図17】

【図18】

【図19】

【図20】

【図21】

【図22】

【図23】

【手続補正書】

【提出日】2024-04-03

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

【請求項5】

前記少なくとも１つのメモリ及び前記コンピュータプログラムコードは、少なくとも１つのプロセッサを用いて、前記装置に、少なくとも、
前記利用部分の前記少なくとも一部の各々が、前記１人又は複数の人物の前記外観の閾値尺度以上である前記１人又は複数の人物の前記外観の尺度に関連付けられるか決定させる、
請求項１～３のいずれか１項に記載の装置。

【請求項6】

【請求項7】

【請求項8】

【請求項9】

【請求項10】

撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムであって、コンピュータに、少なくとも、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の１人又は複数の人物の外観を検出させ、
前記１人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第１のマップを生成させ、前記第１のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記１人又は複数の人物の前記外観の第１の尺度を含み、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、前記未利用部分の各々は、外観の第１の尺度が関連付けられていないか、又は外観の第１の尺度が０である、前記検出領域の前記複数の部分のうちの部分であり、前記１人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示し、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整させる、プログラム。

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版