IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特表2024-536355検出領域を適応的に調整するための方法、装置及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-04
(54)【発明の名称】検出領域を適応的に調整するための方法、装置及びプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240927BHJP
   G06V 10/70 20220101ALI20240927BHJP
   G06V 20/52 20220101ALI20240927BHJP
   H04N 23/69 20230101ALI20240927BHJP
   H04N 23/695 20230101ALI20240927BHJP
   H04N 23/611 20230101ALI20240927BHJP
   H04N 7/18 20060101ALI20240927BHJP
【FI】
G06T7/00 660Z
G06V10/70
G06V20/52
H04N23/69
H04N23/695
H04N23/611
H04N7/18 D
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024520653
(86)(22)【出願日】2022-09-28
(85)【翻訳文提出日】2024-04-03
(86)【国際出願番号】 JP2022036316
(87)【国際公開番号】W WO2023063088
(87)【国際公開日】2023-04-20
(31)【優先権主張番号】10202111442R
(32)【優先日】2021-10-14
(33)【優先権主張国・地域又は機関】SG
(81)【指定国・地域】
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】オング フイ ラム
(72)【発明者】
【氏名】ジャン シンライ
(72)【発明者】
【氏名】オング ホン イェン
(72)【発明者】
【氏名】ペー ウェイ ジアン
【テーマコード(参考)】
5C054
5C122
5L096
【Fターム(参考)】
5C054CA04
5C054CC02
5C054CF06
5C054FC01
5C054FC12
5C054FC13
5C054FC14
5C054FC15
5C054HA19
5C122DA11
5C122FE05
5C122FH11
5C122GD06
5C122HA29
5C122HB01
5L096BA02
5L096CA04
5L096GA51
5L096JA11
(57)【要約】
撮像デバイス(402)によって撮像される画像の検出領域を調整するための方法(300)は、一定期間にわたって撮像デバイス(402)によって以前に撮像された入力画像から検出領域内の人物の外観を検出すること(302)と、人物の外観に基づいて検出領域に対応するマップを生成することであって、マップは、入力画像にわたる検出領域の複数の部分の各々において検出された人物の外観の尺度を含む、生成すること(304)と、複数の部分に対する未利用部分の比が閾値比を超えるか決定すること(306)と、利用部分の一部を含む検出領域内の焦点領域が、決定に応じて撮像される画像の調整された検出領域の中心に配置されるように、検出領域を調整すること(308)とを含む。
【選択図】図3
【特許請求の範囲】
【請求項1】
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためにコンピュータによって実行される方法であって、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の1人又は複数の人物の外観を検出することと、
前記1人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第1のマップを生成することであって、前記第1のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第1の尺度を含む、生成することと、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定することであって、前記未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、前記検出領域の前記複数の部分のうちの部分であり、前記1人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示す、決定することと、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整することと
を含む、方法。
【請求項2】
前記複数の入力画像の各々から、複数の第2のマップを生成することをさらに含み、
複数の第2のマップの各々は、前記検出領域に対応し、前記1人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも1つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観の異なる第2の尺度を含み、
前記第1のマップを生成することは、前記複数の入力画像の各々から生成された前記複数の第2のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のそれぞれの第2の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第1のマップ内の前記1人又は複数の人物の前記外観の前記第1の尺度を決定することを含む、
請求項1に記載の方法。
【請求項3】
前記1人又は複数の人物の前記身体部分、前記特性又は前記動きのうちの前記少なくとも1つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のカウントと、前記撮像デバイスによって顔の特徴、前記身体部分、前記特性又は前記動きのうちの前記少なくとも1つに基づいて検出された外観の予め設定された検出重みとに基づいて、前記人物の前記外観の前記第2の尺度を決定すること
をさらに含む、請求項2に記載の方法。
【請求項4】
前記検出領域に対応する第3のマップを生成することをさらに含み、
前記第3のマップは、前記複数の入力画像の各々における前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第3の尺度を含み、前記第3の尺度は、前記複数の入力画像の各々からの前記検出領域の前記複数の部分の各々において検出された前記複数の第2のマップの前記1人又は複数の人物の前記外観のそれぞれの第2の尺度の和であり、
前記第1のマップを生成することは、前記複数の入力画像から生成された前記第3のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のそれぞれの第3の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第1のマップ内の前記1人又は複数の人物の前記外観の前記第1の尺度を決定することを含む、
請求項2又は3に記載の方法。
【請求項5】
前記利用部分の前記少なくとも一部の各々が、前記1人又は複数の人物の前記外観の閾値尺度以上である前記1人又は複数の人物の前記外観の尺度に関連付けられるか決定することをさらに含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
前記第1のマップにおいて生成された前記1人又は複数の人物の前記外観の前記第1の尺度のうち、前記1人又は複数の人物の前記外観の最高尺度を決定することと、
前記1人又は複数の人物の前記外観の前記最高尺度に基づいて前記人物の前記外観の前記閾値尺度を計算することと
をさらに含む、請求項5に記載の方法。
【請求項7】
前記検出領域を調整することは、
前記検出領域に対する前記撮像デバイスのデバイス角度を変更するために、水平軸及び/又は垂直軸を中心に前記撮像デバイスを回転させることと、
前記焦点領域が、前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心の周りの予め設定された中心部分を占めるように、前記撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも1つを含む、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記焦点領域を前記検出領域の中心に移動させるために必要な検出領域の調整量を計算することと、
前記検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定することとをさらに含み、
前記検出領域を調整することは、前記検出の量が前記予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
請求項1~7のいずれか1項に記載の方法。
【請求項9】
撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置であって、
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つのメモリと
を備え、
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の1人又は複数の人物の外観を検出させ、
前記1人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第1のマップを生成させ、前記第1のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第1の尺度を含み、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、前記未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、前記検出領域の前記複数の部分のうちの部分であり、前記1人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示し、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整させる、
装置。
【請求項10】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、前記複数の入力画像の各々から、複数の第2のマップを生成させ、複数の第2のマップの各々は、前記検出領域に対応し、前記1人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも1つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観の異なる第2の尺度を含み、
前記第1のマップを生成することは、前記複数の入力画像の各々から生成された前記複数の第2のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のそれぞれの第2の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第1のマップ内の前記1人又は複数の人物の前記外観の前記第1の尺度を決定することを含む、
請求項9に記載の装置。
【請求項11】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記1人又は複数の人物の身体部分、特性又は動きのうちの前記少なくとも1つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のカウントと、前記撮像デバイスによって顔の特徴、前記身体部分、前記特性又は前記動きのうちの前記少なくとも1つに基づいて検出された外観の予め設定された検出重みとに基づいて、前記1人又は複数の人物の前記外観の第2の尺度を決定させる、
請求項9に記載の装置。
【請求項12】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、前記検出領域に対応する第3のマップを生成させ、前記第3のマップは、前記複数の入力画像の各々における前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第3の尺度を含み、前記第3の尺度は、前記複数の入力画像の各々からの前記検出領域の前記複数の部分の各々において検出された複数の第2のマップの前記1人又は複数の人物の前記外観のそれぞれの第2の尺度の和であり、
前記第1のマップを生成することは、前記複数の入力画像から生成された前記第3のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のそれぞれの第3の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第1のマップ内の前記1人又は複数の人物の前記外観の前記第1の尺度を決定することを含む、
請求項10又は11に記載の装置。
【請求項13】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記利用部分の前記少なくとも一部の各々が、前記1人又は複数の人物の前記外観の閾値尺度以上である前記1人又は複数の人物の前記外観の尺度に関連付けられるか決定させる、
請求項9~12のいずれか1項に記載の装置。
【請求項14】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記第1のマップにおいて生成された前記1人又は複数の人物の前記外観の前記第1の尺度のうち、前記1人又は複数の人物の前記外観の最高尺度を決定させ、
前記1人又は複数の人物の前記外観の前記最高尺度に基づいて前記人物の前記外観の前記閾値尺度を計算させる、
請求項13に記載の装置。
【請求項15】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記検出領域に対する前記撮像デバイスのデバイス角度を変更するために、水平軸及び/又は垂直軸を中心に前記撮像デバイスを回転させることと、
前記焦点領域が、前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の前記中心の周りの予め設定された中心部分を占めるように、前記撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも1つを実行させる、請求項9~14のいずれか1項に記載の装置。
【請求項16】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記焦点領域を前記検出領域の中心に移動させるために必要な検出領域の調整量を計算させ、
前記検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定させ、前記検出領域を調整することは、前記検出の量が前記予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
請求項9~15のいずれか1項に記載の装置。
【請求項17】
請求項9~16のいずれか1項に記載の装置と撮像デバイスとを備える、前記撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステム。
【請求項18】
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムを記憶する非一時的なコンピュータ可読媒体であって、前記プログラムは、コンピュータに、少なくとも、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の1人又は複数の人物の外観を検出させ、
前記1人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第1のマップを生成させ、前記第1のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第1の尺度を含み、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、前記未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、前記検出領域の前記複数の部分のうちの部分であり、前記1人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示し、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整させる、非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像デバイス及び撮像デバイスによって撮像された画像の検出領域に関し、より詳細には、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法、装置、システム及びプログラムに関する。
【背景技術】
【0002】
何百万もの監視カメラが、安全性測定のために、特に駅及びバス停などの公共交通ハブで世界中に配備されている。これらの画像及びビデオ映像の大部分は、リアルタイムのビデオ分析がリソースを必要としすぎ、それを設定及び構成するために高度な熟練者を必要とするため、処理なしで達成される。画像及びビデオ映像は、証拠として後調査目的のためにオンデマンドで検索される。
【発明の概要】
【発明が解決しようとする課題】
【0003】
これらの膨大な数の監視カメラの保守は、カメラのいずれかが、照明の変更、カメラレンズのほこり/汚れ、さらには改修、ソフトウェアシステムの上でのクリーニングサービス、及びハードウェアの問題又は故障を含む外的要因などの環境条件の変更によって任意の瞬間に誤動作又は誤調整される可能性があるため、単に手作業に依存する場合には非常に困難であり得る。
【0004】
さらに、監視カメラは、入ってくる人間の交通を監視するなどの特定の目的のために以前に設定されるが、改修作業のために、人間の交通流が焦点の合っていない方向に別の流れに導かれる可能性があるため、監視目標の行動変化は別の動作上の課題となり得る。これにより、監視カメラは、例えば、不審者の検出、事件後調査のための現場理解及び証拠収集、ならびに必要とされる有用な画像及びビデオ映像の提供など、その本来の目標に従って実装されない可能性がある。
【0005】
したがって、上記の問題に対処するための方法、装置、システム及びプログラムを提供する必要がある。
【0006】
さらに、他の望ましい特徴及び特性は、添付の図面及び本開示のこの背景と併せて、以下の詳細な説明及び添付の特許請求の範囲から明らかになるであろう。
【課題を解決するための手段】
【0007】
第1の態様では、本開示は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためにコンピュータによって実行される方法を提供し、方法は、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出することと、
1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成することであって、第1のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含む、生成することと、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定することであって、未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示す、決定することと、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整することと
を含む。
【0008】
第2の態様では、本開示は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置を提供し、装置は、
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つのメモリと
を備え、
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出させ、
1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成させ、第1のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる。
【0009】
第3の態様では、本開示は、第2の態様による装置と撮像デバイスとを備える、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステムを提供する。
【0010】
第4の態様では、本開示は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムを記憶する非一時的なコンピュータ可読媒体を提供し、プログラムは、コンピュータに、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出させ、
1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成させ、第1のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる。
【0011】
開示される実施の形態のさらなる利益及び利点は、明細書及び図面から明らかになるであろう。利益及び/又は利点は、明細書及び図面の種々の実施の形態及び特徴によって個別に得ることができ、かかる利益及び/又は利点のうちの1つ又は複数を得るためにすべてが提供される必要はない。
【図面の簡単な説明】
【0012】
本発明の実施形態は、単なる例として、図面と併せて、以下に記載される説明から、当業者によりよく理解され、容易に明らかになるであろう。
図1A】検出領域内の人物の外観を検出するためにビデオ分析検出を実行することを目標として構成された撮像デバイス(例えば、カメラ)を示す図である。
図1B】人の交通又は環境の変化があるときに検出領域内の人物の外観を検出するためにビデオ分析検出を実行する図1Aの撮像デバイスを示す図である。
図1C】本開示の実施の形態による、図1Bのカメラの画像(又は視野)内の焦点領域及びカメラに対する視野調整を示す図である。
図2】本開示の実施の形態による、その中の入力画像に対して実行された異なるビデオ分析検出の出力を示す図である。
図3】本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法を示すフローチャートである。
図4】本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステムを示すブロック図である。
図5】本開示の実施の形態による、撮像デバイスの検出領域を適応的に調整する動作の一部を実行するシステムを示すフロー図である。
図6】撮像デバイスの検出領域を適応的に調整する動作の他の一部を実行する図5のシステムを示すフロー図である。
図7】本開示の実施の形態による、入力画像から検出された1人又は複数の人物の外観に基づいて検出マップ及び合成検出マップを生成するプロセスを示すフロー図である。
図8】本開示の実施の形態による、カメラによって撮像された複数の入力画像にわたって検出された人物の外観に基づいて分析密度マップを生成するプロセスを示すフロー図である。
図9】本開示の実施の形態による、8時間の期間にわたってカメラによって以前に検出された複数の入力画像から検出された複数の人物の外観に基づいて生成された例示的な分析密度マップを示す図である。
図10】本開示の実施の形態による、図9の分析密度マップに基づく検出領域の未利用部分及び利用部分を示す図である。
図11】本開示の実施の形態による、図9の分析密度マップで生成された外観の最高尺度を示す図である。
図12】本開示の実施の形態による、図9の分析密度マップで生成された外観の尺度に基づいて利用部分から選択された焦点領域を示す図である。
図13】本開示の実施の形態による、焦点領域に対する検出領域内の基準中心部分を示す図である。
図14】本開示の実施の形態による、検出領域内の基準中心部分に焦点領域を再配置するための視野調整を示す図である。
図15】本開示の実施の形態による、検出領域を調整するための撮像デバイスの倍率の変化を示す図である。
図16】本開示の実施の形態による、ピクセル座標差及び視野角(AFOV)を使用して焦点領域を基準中心部分に再配置するための検出領域内の調整に対応する例示的なカメラビュー調整を示す図である。
図17】本開示の実施の形態による、検出領域内の調整に対応する例示的なカメラズーム調整を示す図である。
図18】本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスを示すフローチャートである。
図19】本開示の実施の形態による、図18の人物外観データベースにおいて第1のレベルの分析検出を実行及び記憶するプロセスを示すフローチャートである。
図20】本開示の実施の形態による、図18のカメラビュー調整提案を生成するために利用スペースを処理するプロセスを示すフローチャートである。
図21】本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスの概要を示す概略図である。
図22図3の方法を実行し、図4の装置を実装するために使用するのに適した例示的なコンピューティングデバイスの概略図である。
図23】本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置を示すブロック図である。
【発明を実施するための形態】
【0013】
用語の説明
検出領域-撮像デバイスによって撮像された画像の検出領域は、撮像デバイスの視野に対応し得る。以下の様々な実施の形態では、「検出領域」及び「視野」という用語は互換的に使用される。撮像デバイスの視野は、(i)異なる視野を有するように視野に対する撮像デバイスの水平及び/又は垂直装置角度を変更するために、水平軸、すなわちパン調整、及び/又は垂直軸、すなわちチルト調整の周りで撮像デバイスを回転させること、及び/又は(ii)撮像デバイスの倍率、すなわちズーム調整を増減させ、撮像デバイスによって撮像される画像の異なる検出領域をもたらすこと、によって調整することができる。画像に反映された検出領域は、複数の部分に分割又はセグメント化することができる。簡単にするために、本開示の様々な実施の形態は、検出領域がグリッドマップに変わるように、画像に反映された検出領域が複数の等しい部分、すなわち正方形領域又はグリッドセルに分割される検出領域上のグリッド分割を示す。x座標及びy座標を使用して、分割線を指定し、各セルを配置してもよい。次いで、画像又は画像の検出領域を部分ごとに分析及び処理することができる。対称/非対称、等しい/等しくない形状、面積及びサイズを使用する他のセグメント化方法が使用されてもよいことが理解される。様々な実施の形態では、複数の入力画像に反映された同じ検出領域は、各部分が複数の入力画像にわたって検出領域の同じ部分を反映するように、同じ分割及び同じ複数の部分への分割を受ける。各画像又は各画像の検出領域も、部分ごとに同じ分析及び処理を受ける。
【0014】
外観-画像内の人物の外観は、人物の顔の特徴、身体部分、特性及び動き、又はそれらの組合せに基づいて検出される。顔の特徴の例は、目、鼻、頬骨、顎及び顎の相対的な位置、サイズ、形状及び/又は輪郭、ならびに虹彩模様、皮膚色、毛髪色又はそれらの組合せを含む。特性は、身長、体格、身体の比率、四肢の長さ、毛髪の色、皮膚の色、衣服、所有物、他の同様の特性又は組合せなどの物理的特性を含む。動きは、身体の動き、四肢の位置、動きの方向、移動速度、歩行パターン、人の立ち方、動き、話し方、他の同様の特徴又は組合せなどの行動特性を含み得る。
【0015】
様々な実施の形態では、各画像は、異なる顔の特徴、身体部分、特性、動き、又はそれらの組合せに基づいて、少なくとも2つの外観検出及び測定(以下、ビデオ分析検出と呼ぶことがある)を受ける。例えば、画像内で顔検出及び姿勢検出を実行して、その画像内のすべての人物の外観を検出してもよい。そのような複数の外観検出は、検出領域調整のためのより包括的な人物外観測定値を提供するために使用することができる。
【0016】
代替的又は追加的に、各画像は、検出された外観を有する画像のみがさらなる処理のためにデータベースに記憶されることを確実にするために、1つの顔の特徴、身体部分、特性、動き、又はそれらの組合せ(例えば、顔検出)に基づいて1つのビデオ分析検出のみを受けてもよい。続いて、ある期間にわたって撮影されたデータベース内の画像が続いて検索され、別の異なる顔の特徴、身体部分、特性、動き、又はそれらの組合せ(例えば、姿勢検出)に基づく少なくとも1つの他のビデオ分析検出に供され得る。
【0017】
外観の尺度-外観の尺度は、一般に、例えば、入力画像の検出領域の一部、複数の部分もしくは全体内、又は複数の入力画像の同じ検出領域の同じ部分、複数の同じ部分もしくは全体内で検出された外観のカウントに関する。本開示の様々な実施の形態では、撮像デバイスは、検出重みプロファイルで事前構成され、撮像デバイスによって異なる顔の特徴、身体部分、特性、動き、又はそれらの組合せに基づいて検出された外観の各カウントは、異なる検出重みをさらに受け(例えば、加算又は乗算され)、それにより、異なる外観の尺度が得られる。検出重みのそのようなプロファイルは、撮像デバイスが使用される、設置される、又は実行するように構成される目標に基づいて、ユーザによって撮像デバイスに対して事前構成されてもよい。
【0018】
マップ-マップは、検出領域のすべてのセグメント化された部分で決定された外観の尺度の編集を含む2次元(2D)データ配列を指す。マップはまた、2つのマップにおいて決定された対応する部分における外観の尺度を合計することによって、別のマップと組み合わせることができる。
【0019】
同様に、検出領域の各セグメント化された部分は、異なる顔の特徴、身体部分、特性及び動き、又はそれらの画像の組合せに基づいて、少なくとも2つの外観検出及び測定を受ける。例えば、検出領域のセグメント化された部分ごとに顔検出及び姿勢検出を行い、その部分で人物の外観(この場合、いずれかの人物の顔や姿勢)が検出されたかどうかを検出するようにしてもよい。検出された外観(この場合、顔及び姿勢)がどのセグメント化された部分に入るかを決定することによって、同じ効果が奏され得る。
【0020】
結果として、異なる顔の特徴、身体部分、特性及び動き又はそれらの組合せに基づいて、検出領域のすべてのセグメント化された部分から検出された人物の外観を測定することによって、画像から少なくとも2つの異なる検出マップを生成することができる。さらに、画像から生成された異なる検出マップを組み合わせて、合成検出マップを形成してもよい。また、さらに、ある期間にわたって撮影された異なる画像から生成された異なる合成検出マップを組み合わせて、ある期間にわたる検出領域のすべてのセグメント化された部分におけるすべての人物の外観の尺度を反映し、分析密度マップを使用して分析することができる分析密度マップを形成してもよい。
【0021】
未利用部分-未利用部分は、外観が検出されない検出領域のセグメント化された部分を指す。言い換えれば、そのようなセグメント化された部分は、外観の尺度なし、又は外観の尺度が0であることに関連付けられる。
【0022】
利用部分-利用部分は、1人の人物の少なくとも1つの外観が検出される検出領域のセグメント化された部分を指す。言い換えれば、そのようなセグメント化された部分は、非ゼロ値の外観の尺度に関連付けられる。
【0023】
焦点領域-焦点領域は、撮像デバイスの検出領域又は視野内の関心領域を指す。様々な実施の形態では、焦点領域は、検出領域の残りの領域と比較してより高い外観の尺度が決定される部分(又は複数の部分)に関する。以下の様々な実施の形態では、焦点領域が、撮像デバイスの検出領域又は視野の中心又は予め設定された中心部分から離れる場合、焦点領域が、撮像デバイスの調整された検出領域又は視野の中心又は予め設定された中心部分又はその近くになるように、撮像デバイスの検出領域又は視野に対する調整が実行される。このように、調整された検出領域又は視野を有する撮像デバイスによって撮像される画像は、画像の中央又は予め設定された中央部分の近く又は中央に人物の外観を検出する可能性がより高い。
【0024】
実施の形態
本発明の実施の形態は、単なる例として、図面を参照して説明される。図面における同様の参照番号及び文字は、同様の要素又は同等物を指す。
【0025】
以下の説明のいくつかの部分は、コンピュータメモリ内のデータに対する動作のアルゴリズム及び機能的又は記号的表現に関して明示的又は暗示的に提示される。これらのアルゴリズム的記述及び機能的又は記号的表現は、データ処理技術の当業者によって、彼らの作業の内容を他の当業者に最も効果的に伝えるために使用される手段である。アルゴリズムは、本明細書では、概して、所望の結果をもたらす自己矛盾のない一連のステップであると考えられる。これらのステップは、記憶、転送、結合、比較、及びその他の操作が可能な電気信号、磁気信号、又は光信号などの物理量の物理的操作を必要とするものである。
【0026】
特に明記しない限り、以下から明らかなように、本明細書を通して、「受信する」、「計算する」、「決定する」、「更新する」、「生成する」、「初期化する」、「出力する」、「受信する」、「検索する」、「識別する」、「分散させる」、「認証する」などの用語を利用する説明は、コンピュータシステム内の物理量として表されるデータを操作し、コンピュータシステム又は他の情報記憶、伝送、もしくは表示デバイス内の物理量として同様に表される他のデータに変換する、コンピュータシステム又は同様の電子デバイスのアクション及びプロセスを指すことが理解されよう。
【0027】
本明細書はまた、方法の動作を実施するための装置を開示する。かかる装置は、必要とされる目的のために特別に構築されてもよく、又はコンピュータ内に記憶されたコンピュータプログラムによって選択的にアクティブ化もしくは再構成されるコンピュータもしくは他のデバイスを備えてもよい。本明細書に提示されるアルゴリズム及び表示は、任意の特定のコンピュータ又は他の装置に本質的に関連しない。本明細書の教示によるプログラムとともに、種々の機械を使用することができる。代替的に、必要とされる方法ステップを実施するためのより特化された装置の構築が適切であり得る。コンピュータの構造は、以下の説明から明らかになるであろう。
【0028】
加えて、本明細書はまた、本明細書に記載される方法の個々のステップがコンピュータコードによって実施され得ることが当業者に明らかであるという点で、コンピュータプログラムを暗示的に開示する。コンピュータプログラムは、任意の特定のプログラム言語及びその実装形態に限定されることを意図していない。種々のプログラミング言語及びそのコーディングが、本明細書に含まれる本開示の教示を実装するために使用され得ることが理解されよう。さらに、コンピュータプログラムは、任意の特定の制御フローに限定されることを意図していない。本発明の趣旨又は範囲から逸脱することなく、異なる制御フローを使用することができる、コンピュータプログラムの多くの他の変形形態がある。
【0029】
さらに、コンピュータプログラムのステップのうちの1つ又は複数は、順次ではなく並列に実施され得る。かかるコンピュータプログラムは、任意のコンピュータ可読媒体上に記憶され得る。コンピュータ可読媒体は、磁気ディスクもしくは光ディスク、メモリチップ、又はコンピュータとインタフェースするのに適した他の記憶デバイスなどの記憶デバイスを含み得る。コンピュータ可読媒体はまた、インターネットシステムにおいて例示されるようなハードワイヤード媒体、又はGSMモバイル電話システムにおいて例示されるような無線媒体を含み得る。コンピュータプログラムは、かかるコンピュータにロードされて実行されると、好ましい方法のステップを実装する装置を効果的にもたらす。
【0030】
本開示の様々な実施の形態は、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法及び装置に関する。そのような装置及び撮像デバイスは、同じ技術的効果を提供するためにシステムの一部として実装されてもよいことが当業者には理解される。
【0031】
図1Aは、検出領域内の人物の外観を検出するためにビデオ分析検出を実行することを目標として構成された撮像デバイス(例えば、カメラ102)を示す。検出領域は、カメラ102の視野105に対応する。この例では、カメラ102は、身体検出と顔検出との組合せに基づいて人物の外観を検出する検出/監視を目標として(例えば、ユーザによって)構成されていてもよく、カメラ102は、検出領域で改修が行われる前に設定された。通常、検出領域、すなわちカメラ102の視野105内に方向106に移動している人の外観104が撮像され、カメラ102の画像100内で検出される。
【0032】
図1Bは、人の交通又は環境の変化があるときに検出領域内の人物の外観を検出するためにビデオ分析検出を実行する図1Aの撮像デバイスを示す。上述したように、人間の交通流は、検出領域(ボックス118に示す)で行われた改修のために、焦点の方向から外れて変化するか、又は別の方向に導かれる可能性がある。改修のために、人物114は、今度は検出領域の周りの方向116に移動し、検出領域内の人物の外観を検出するために身体及び顔の両方の検出を実行するように元々構成されているカメラ102は、人物の外観を検出してその目標を実行することができない。
【0033】
したがって、人の交通及び環境のこのような変化を採用するために、カメラ102の視野(したがって検出領域)を適応的に調整することができる方法及び装置を提供する必要がある。図1Cは、本開示の実施の形態による、図1Bのカメラ102の画像120(すなわち、視野又は検出領域)内の焦点領域122及びカメラ102に対する視野調整を示す。焦点領域122は、画像120の残りの領域と比較して高い外観の尺度が決定される関心領域である。この実施の形態では、画像120の左下隅の焦点領域は、画像120の残りの領域よりも高い外観の尺度を有するように決定され、その後、カメラの視野120に対する調整は、焦点領域122がその予め設定された部分、この場合は破線のボックス122’に示される予め設定された中央部分に、又はその近くになるようにシフトされるように実行される。したがって、調整された視野120’の下でカメラ102によって撮像される後続の画像は、画像120’の予め設定された部分122’の近く又はそこで人物の外観を検出する可能性がより高い。
【0034】
本開示によれば、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法及び装置は、人間の関与を必要とせずに人間/身体検出を使用することによって一連の画像又はビデオにおける人物の外観(又は存在)の証拠及びデータを収集する際に利点を提供する。
【0035】
さらに、各ビデオ分析検出(例えば、身体検出、ポーズ検出、顔検出)は、それ自体の利点を有することに留意されたい。例えば、身体検出は、顔検出分析と比較して人の外観サイズをより小さく検出することができ、一方、ポーズ検出は、身体検出分析と比較して人の姿勢/ジェスチャなどのより多くの人の外観の詳細を検出することができる。本開示による方法及び装置はまた、オンデマンドの複数のビデオ分析検出(例えば、身体検出及びポーズ検出)を組み合わせて、より包括的な人物の外観検出及び検出領域調整を提供するのに役立つ利点を提供する。
【0036】
図2は、本開示の実施の形態による、入力画像200に対して実行された異なるビデオ分析検出の出力202a~202cを示す。この実施の形態では、3つの異なるビデオ分析検出、すなわち、身体検出、ポスト検出、及び顔検出が入力画像200に対して実行される。それらの検出出力は、それぞれ画像200a、200b及び200cに示されている。2人の外観202a、204aは、身体検出を使用して検出することができ、2人の外観202b、204bはまた、ポーズ検出を使用して検出することができ、また、1人の人物の外観202cのみが顔検出により検出されるが、これは、他の人物の外観が顔検出には小さすぎる可能性があるためである。
【0037】
本開示によれば、方法及び装置はまた、撮像デバイスが、例えばユーザによって、撮像デバイスが使用され、設置され、又は動作するように構成されることを目標として(事前)構成され得ることを提供する。目標の例は、顔認識、行動認識、又は群衆推定を含む。各目標は異なる検出重みプロファイルを有し、異なるビデオ分析検出が実行され、異なる検出重みが異なるビデオ分析検出にも適用される。例えば、撮像デバイスは、1及び3のそれぞれの検出重みで画像ごとに身体検出及び顔検出が実行される顔認識を実行することを目標として構成されてもよい。これは、画像から人物の顔を通して検出された外観は、同じ画像から人物の身体を通して検出された外観よりも高い尺度/カウント(3倍高い)が与えられることを意味する。一方、行動認識下では、撮像デバイスは、1、2、及び3のそれぞれの検出重みで身体検出、顔検出、及びポーズ検出を実行するように構成されてもよく、群衆推定の下では、1及び3のそれぞれの検出重みで身体検出及びポーズ検出が実行される。
【0038】
有利には、関心領域又は焦点領域(例えば、焦点矩形)は、撮像デバイスの予め設定された目標に関する検出重みプロファイルに基づいて決定され、その視野及び検出領域は、撮像デバイスの焦点領域に基づいて調整され、その予め設定された検出及び監視目標に従ってビデオ分析検出をより良好に実行する。
【0039】
図3は、本開示の様々な実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するための方法を示すフローチャートを示す。ステップ302で、一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出するステップが実行される。ステップ304で、1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成するステップが実行される。マップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含む。ステップ306で、検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定するステップが実行される。未利用部分の各々は、外観の第1の尺度に関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示す。ステップ308で、複数の部分のうちの利用部分の少なくとも一部を含む検出領域内の焦点領域が、ステップ306における決定に応じて、撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整するステップ。
【0040】
図4は、本開示の様々な実施の形態による、撮像デバイス402によって撮像される画像の検出領域を適応的に調整するためのシステム400を示すブロック図を示す。
【0041】
一例では、画像入力の管理は、少なくとも撮像デバイス402及び装置404によって実行される。システム400は、装置404と通信する撮像デバイス402を備える。一実装形態では、装置404は、概して、少なくとも1つのプロセッサ406と、コンピュータプログラムコードを含む少なくとも1つのメモリ408とを備える物理デバイスとして説明され得る。少なくとも1つのメモリ408及びコンピュータプログラムコードは、少なくとも1つのプロセッサ406とともに、物理デバイスに、図3で説明される動作を実行させるように構成される。プロセッサ406は、撮像デバイス402から複数の入力画像を受信するか、又はデータベースから複数の入力画像を検索するように構成される。代替的又は追加的に、撮像デバイス402によって撮像された複数の入力画像は、データベース410に記憶され、プロセッサ406は、データベース410から複数の入力画像を検索するように構成される。
【0042】
撮像デバイス402は、1人又は複数の人物の外観を検出するためにシステムによって使用され得る外観データの様々なデータを提供する閉回路テレビ(CCTV)などのデバイスであり得る。一実装形態では、撮像デバイス402から導出された外観データは、装置404のメモリ408又は装置404によってアクセス可能なデータベース410に記憶され得る。外観データは、(i)目、鼻、頬骨、顎及び顎の相対的な位置、サイズ、形状及び/又は輪郭、ならびに虹彩模様、皮膚の色、髪の色又はそれらの組合せなどの顔特徴データ、(ii)身長、身体の大きさ、身体比率、四肢の長さ、髪の色、皮膚の色、衣服、所有物、他の同様の特性又は組合せなどの物理的特性データ、及び(iii)身体の動き、四肢の位置、動きの方向、移動速度、歩行パターン、人の立ち方、動き、話し方、他の同様の特性又は組合せなどの行動特性データを含み得る。
【0043】
一実装形態では、位置及び解像度などのカメラデータ、ならびに/又は1人もしくは複数の人物が識別されたタイムスタンプを含む時間データも、撮像デバイス402から導出され得る。カメラデータ及び/又は時間データは、装置404のメモリ408又は装置404によってアクセス可能なデータベース410に記憶されてもよく、プロセッサ406は、時間データに基づいて外観データ又は画像を識別及び検索するように構成される。データベース410は、装置404の一部であってもよいことを理解されたい。
【0044】
装置404は、撮像デバイス402及びデータベース410と通信するように構成され得る。一例では、装置404は、入力として撮像デバイスの同じ視野に関連する複数の画像を撮像デバイス402から受信するか、又はデータベース410から検索し、装置404のプロセッサ406による処理の後に、後続の画像を撮像するために撮像デバイス402の視野を調整するために使用され得る出力を生成し得る。
【0045】
本開示によれば、撮像デバイス402から画像を受信するか、又はデータベース410から画像を検索した後、メモリ408及びそれに記憶されたコンピュータプログラムコードは、プロセッサ406を用いて、装置404に、一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出させ、1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成させ、第1のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含み、検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる。
【0046】
図5は、本開示の実施の形態による、撮像デバイスの検出領域を適応的に調整する動作の一部を実行するシステム500を示すフロー図を示す。システムは、カメラ502の各々によって撮像された一連の入力画像(例えば、オンラインビデオアーカイブシステム又はオフラインのビデオファイル入力からの画像又はビデオファイル504の履歴シーケンス)を検索し、第1のレベルのビデオ分析検出(例えば、身体/顔検出)を実行するように構成されたビデオアーカイブ検索システム506を備えてもよい。第1のレベルのビデオ分析検出出力(例えば、検出された人物外観データ)及びその対応する入力画像は、位置、解像度、タイムスタンプなどのすべての必要なカメラ情報とともに、人物外観データベース508に記憶される。一例では、分析検出出力を有さない、すなわち、ビデオ分析検出に基づいて人物の外観が検出されない入力画像は破棄され、さらなる処理のために人物外観データベース508に記憶されない。様々な実施の形態では、人物外観データベース508は、追加的及び任意選択的ポーズ、身体及び顔の検出のために画像及び検出データを検索するように構成される。
【0047】
図6は、撮像デバイスの検出領域を適応的に調整する動作の他の一部を実行する図5のシステム500を示すフロー図を示す。ユーザは、撮像デバイス、この場合はカメラ1602を指定してもよく、分析のための時間範囲、及び時間期間内に撮像された(又は時間データに関連付けられた)画像604a~604dが入力として検索され、第1のレベルの検出出力及びカメラ情報などのすべての関連情報が、さらなる処理のために人物外観データベース508から検索される。本開示によれば、カメラ502(カメラ1602を含む)の各々は、カメラが使用され、設置され、又は実行するように構成されることを目標として構成される。この場合、カメラ1602は顔認識目標プロファイルで構成され、したがって、身体検出、ポーズ検出、及び顔検出が実行され、それぞれ1、3、及び3の検出重みが与えられる。身体検出に関する第1のレベルのビデオ分析が実行されると、システム500は、次に、所定の顔認識目標プロファイルに基づいて、目標プロファイル要件を満たすために、検索された入力画像604a~604dを使用して、ポーズ検出及び顔検出に関するオンデマンド追加ビデオ分析を実行してもよい。
【0048】
図7は、本開示の実施の形態による、入力画像704a~704dから検出された1人又は複数の人物の外観に基づいて検出マップ706、708及び合成検出マップ710を生成するプロセスを示すフロー図700を示す。選択された期間にわたって撮影されたカメラ1の同じ検出領域又は視野を反映する入力画像704a~704dと、目標プロファイル703及び705に示すような解像度(例えば、1024×768)などのカメラ1データとが検索される。目標プロファイル703に基づいて、身体検出及び顔検出に関するビデオ分析は、それぞれ1及び3の検出重みで入力画像704a~704dの各々に対して実行されるべきである。
【0049】
各検索画像について、ビデオ分析ごとに選択されたカメラ1の解像度に従って2Dアレイメモリストレージが構築され、2Dアレイ検出マップを0の値で初期化する。本開示の実施の形態によれば、各検索画像704a~704dの検出領域は、複数の正方格子セルに分割されて、選択されたカメラ1の解像度705に従って2Dアレイ検出マップを形成する。2Dアレイ検出マップは0の値で初期化される。外観の尺度は、ビデオ分析検出ごとに2Dアレイ内で検出された1人又は複数の人物の外観に基づいて2Dアレイ検出マップのセルの各々について決定され、したがって、すべてのセルにわたる外観の尺度の集計を反映する2Dアレイ検出マップが、ビデオ分析検出ごとに生成される。
【0050】
検出マップ706、708は、1つの入力画像(704a、704b、704c又は704d)から生成された検出マップのうち、身体検出と顔検出とに基づいて人の外観を検出する部分を示している。身体検出に基づく検出マップ706の12個のセルと、顔検出に基づく検出マップ708の4個のセルとにおいて、人物の外観が検出される。このような外観の検出は、外観が検出されたそれぞれのセルにおける外観のカウントを構成するが、外観の尺度(すなわち、ビデオ分析検出出力の出力)は、ビデオ分析検出のそれぞれの検出重みに基づいて増加される。この実施の形態では、身体検出及び顔検出の検出重みはそれぞれ1及び3であり、したがって、身体検出によって人の外観が検出される12個のセルは、検出マップ706に示すように、1の外観の尺度を有し、一方、顔検出面を介して人物の外観が検出される4つのセルは、したがって、検出マップ708に示すように、3の外観の尺度を有する。
【0051】
さらに、対応して複数の検出マップ706、708内の外観の尺度を合計することによって、入力画像(704a、704b、704c又は704d)からの複数のビデオ分析検出を通じてカメラ1の視野の同じ検出領域内で検出された人物の外観を示す1024×768の合成検出マップ(合成検出マップ710の一部のみが示されている)が生成される。
【0052】
図8は、本開示の実施の形態による、カメラによって撮像された複数の入力画像にわたって検出された人物の外観に基づいて分析密度マップを生成するプロセスを示すフロー図を示す。各入力画像から同じ視野を反映する合成検出マップが生成され、分析データベース804に記憶される。次いで、選択された期間内に同じ視野を有する複数の入力画像から生成された合成検出マップ802は、分析データベース804から検索され、検索されたすべての合成検出マップ802の外観の尺度を対応して合計することによって分析密度マップを生成する。本開示によれば、そのような分析密度マップ806は、選択された期間にわたって検出されたすべてのセル内のすべての人物の外観の尺度(以下、「検出密度値」と呼ぶことがある)を示し、カメラの検出及び視野を調整するためのさらなる処理及び分析に使用することができる。
【0053】
図9は、本開示の実施の形態による、8時間の期間にわたってカメラ(この場合、カメラ1)によって以前に検出された複数の入力画像から検出された複数の人物の外観に基づいて生成された例示的な分析密度マップ906を示す。簡単にするために、14×9(幅×高さ)の解像度を有する2D分析密度マップ906が示されている。分析密度マップ906内の各セルの値は、8時間にわたってカメラ1によって撮像された14×9の同じ解像度を有する複数の画像902から生成された合成検出マップを合計することによって計算される。
【0054】
図10は、本開示の実施の形態による、図9の分析密度マップに基づく検出領域の未利用部分及び利用部分を示す。未利用部分又はスペースは、選択された期間にわたって外観が検出されない検出領域内の部分である。そのような未利用部分又はスペースは、図10のハッチングされたブロック1004を用いて示されるように、分析密度マップ906においてゼロの外観の尺度として反映される。一方、利用部分又はスペースは、選択された期間にわたって少なくとも1人の外観が検出された検出内の部分であり、そのような利用部分又はスペースは、図10の白地のブロック1006を用いて示すように、分析密度マップ906において非ゼロの外観の尺度として反映される。本開示によれば、未利用スペース百分率は、式(1)を用いて計算される:
【数1】
ここで、全スペース数は、カメラ解像度による分析密度マップ内の検出領域からのセル(部分又はスペース)の総数を指す。
【0055】
この実施の形態では、カメラ解像度は、幅×高さ(又は列×行)に関して14×9であり、検出領域は、1×1の解像度で複数のセルにセグメント化される。したがって、分析密度マップ906の未利用スペース百分率は、51/(9×14)=51/126=0.404761又は40.4761%である。次いで、そのような未利用スペース百分率が、予め設定された利用不足閾値を上回っているかどうかがチェックされる。利用スペース百分率が利用不足閾値を上回る場合、検出領域内の焦点領域を決定する後続のステップが実行され、そうでなければ、さらなる動作又はプロセスは実行されない。この場合、予め設定された利用不足閾値は0.4又は40%である。未利用スペース百分率が利用不足閾値よりも高いので、システムは、以下で説明する焦点領域決定ステップの実行に進み得る。
【0056】
検出領域内の焦点領域(以下、焦点矩形と呼ぶことがある)は、検出密度値範囲を使用して決定され得る。プロセスは、2D分析密度マップ内の最大密度値を見つけることから開始し得る。図11は、本開示の実施の形態による、図9の分析密度マップ906で生成された外観の最高尺度を、ハッチングされたブロック1104で強調している。
【0057】
続いて、最大密度値に基づいて焦点領域の最小密度値が決定される。1つの実施の形態では、最小密度値は、事前定義された焦点密度閾値又は最大密度値と乗算された乗数を使用することによって計算される。この場合、事前定義された焦点密度閾値が0.6である場合、最小密度値は15×0.60又は9である。このように、焦点矩形を特定するために9~15の検出密度範囲が決定される。
【0058】
図12は、本開示の実施の形態による、図9の分析密度マップで生成された外観の尺度に基づいて利用部分から選択された焦点領域を示す。9の最小密度値が使用され、分析密度マップ906内のすべての利用部分の外観の尺度と比較され、最小密度値よりも高い外観の尺度を有する利用部分の一部を識別する。最小密度値よりも高い外観の尺度を有する識別された利用部分は、図12のハッチングされたブロックに示されている。すべての識別された利用部分を囲む矩形領域1206が焦点矩形1206として決定される。マップ906内の焦点矩形1206を形成する4つのエッジのx座標及びy座標も識別される。
【0059】
一例では、焦点矩形は、識別された利用部分のうちの最小及び最大座標によって、最小密度値から最大密度値までの範囲内にある密度値を有する識別された利用部分の各々の座標と焦点矩形の4つのエッジとを最初に識別することによって識別される。この場合、最大x座標は4と13、最大y座標は5と9であるため、焦点矩形を定義する{4,5}、{4,9}、{13,5}、{13,9}の4つのエッジの座標が識別される。
【0060】
図13は、本開示の実施の形態による、焦点領域1304に対する検出領域1302内の基準中心部分を示す。決定された焦点矩形1304の基準中心部分又は位置1306は、焦点矩形1304の幅及び高さ(この場合は9×4)ならびに検出領域又はマップ1302の幅及び高さ(14×9)を使用して計算することができる。特に、基準中心部分1306の左上エッジのx座標及びy座標は、以下の式を使用して計算され得る:
【数2】
【数3】
ここで、全幅は検出領域の幅(この実施の形態では14)であり、全高さは検出領域の高さ(この実施の形態では9)であり、焦点幅は焦点矩形の幅(この実施の形態では9)であり、焦点高さは焦点矩形の高さ(この実施の形態では4)である。基準中心部分1306の左上エッジのx及びy座標は{3,3}である。
【0061】
図14は、本開示の実施の形態による、検出領域内の基準中心部分に焦点領域1404を再配置するための視野調整を示す。検出領域内の焦点矩形及びその基準中心部分のx座標及びy座標が識別されると、焦点矩形1404を基準中心部分に再配置するように、カメラ1400の現在の視野1402を新しい視野1412に調整するために必要なカメラ設定の変更を決定することができる。焦点領域1404を検出領域内の基準中心部分に再配置するために必要なパン、チルト及びズーム調整の計算の例は、図16図18及びそれらの付随する説明において詳述される。
【0062】
カメラ1400の現在の視野1402に関連する現在のカメラ設定(例えば、パン角、チルト角及びズーム値)が検索され、新しい視野1412に関連する新しい提案候補カメラ設定が決定される。1つの実施の形態では、現在のカメラ設定と新しいカメラ設定との間の調整差が計算され、調整差が予め設定された最小変化閾値よりも大きいかどうかがチェックされる。調整差が最小変化閾値よりも大きい場合、ズーム調整(倍率の変更)を提案するかどうかの決定が行われ、そうでなければ、調整差が最小変化閾値よりも小さく、カメラ設定の大きな変更が必要とされないことを示す場合、例えば、焦点領域が既に基準中心部分又は検出領域の中心部分の近く又はそこにあってもよく、さらなる動作又はプロセスは実行されない。
【0063】
例えば、現在の視野1402に対する現在のカメラチルト角は30°であり、45°の新しい視野1412に対する新しいカメラチルト角が、焦点矩形1404を基準中心部分に再配置するために必要であると決定され、カメラ角度変化百分率(調整差)は、(45°-30°)/30°又は0.5又は50%である。この場合、予め設定された最小カメラ角度変化百分率閾値は0.3又は30%である。調整差が最小変化閾値よりも大きいので、45°のカメラ角度提案候補が提案となる。
【0064】
ズーム調整を提案するかどうかの決定は、例えば、カメラ設定から導出されるプロファイルのズームイン値を決定することにより行われる。プロファイルのズームイン値が真である場合、フル解像度への焦点矩形のズーム計算が新しい提案候補設定に追加され得る。プロファイルのズームイン値が偽である場合、ズームの提案又は倍率の変更は新しい提案候補設定に含まれない。
【0065】
さらに、ズーム調整提案はまた、入力画像から検出された人物の外観の解像度に基づいて決定されてもよい。図15は、本開示の実施の形態による、検出領域を調整するための撮像デバイスの倍率の変化を示す。この実施の形態では、複数の入力画像1502にわたる検出された人物の外観は、平均して30ピクセル(又は特定の数のセグメント化された部分)を占めることが決定される。そのような場合、カメラによって取り込まれた後続の画像1506で検出された人物の外観が少なくとも又は特定の予め設定された解像度に近い解像度を有するように、倍率の変更が新しい提案候補設定に含まれてもよい。
【0066】
追加的又は代替的に、検出領域又は予め設定された焦点領域サイズ1506内に予め設定された中央部分があってもよい。焦点矩形1504のサイズが予め設定された中央部分(又はサイズ1506)よりも大きい又は小さい場合、焦点矩形が予め設定された中央部分又はサイズ1506に適合又は一致するように、ズームイン又はズームアウトするためのカメラの倍率の変化。
【0067】
続いて、計算されたカメラ設定、すなわちパン+チルト+ズーム、再調整提案が提供される。
【0068】
実施の形態によれば、カメラビューのパン及びチルト調整は、ピクセル座標差及び視野角(AFOV)を使用して計算することができる。図16は、本開示の実施の形態による、ピクセル座標差及び視野角(AFOV)を使用して焦点領域1604を基準中心部分1606に再配置するための検出領域内の調整に対応する例示的なカメラビュー調整を示す。この実施の形態では、焦点領域1604の左上隅のx座標及びy座標、すなわち{4,5}、ならびに基準中心部分1606、すなわち{3,3}が決定される。x座標及びy座標を用いて、焦点領域1604と基準中心部分1606との間のピクセル座標差は、以下の式を使用して計算することができる:
【数4】
【数5】
式中、adjXは、焦点領域1604と基準中心部分1606との間のX軸(横軸)におけるピクセル座標差であり、adjYは、Y軸(縦軸)におけるピクセル座標差であり、newX及びnewYは、それぞれ基準中心部分1606のx座標及びy座標を指し、orgX及びorgYは、それぞれ焦点領域1602のx座標及びy座標を指す。
【0069】
さらに、カメラセンサ1610のセンサ幅(14.5927mm)及びセンサ高さ(8.2084mm)、ならびに焦点距離(2.8mm)などの現在のカメラ設定も検索される。
【0070】
水平AFOVと垂直AFOVの両方は、以下の式を使用して計算することができる:
【数6】
【数7】
【数8】
【数9】
ここで、Wはセンサ幅、Hはセンサ高さ、fは焦点距離、全体Wは画像又は検出領域1602の全幅(この場合は14)、全体Hは画像又は検出領域1602の全高さ(この場合は9)である。この実施の形態では、計算された水平及び垂直AFOVは、それぞれ138.011°及び111.3941°である。
【0071】
カメラパン調整(横軸周り)及びチルト調整(縦軸周り)は、以下の式を使用して計算することができる:
【数10】
【数11】
ハードウェア実装の目的のために調整を変換するために-1の逆方向係数が適用される。この実施の形態では、計算されたカメラのパン及びチルト調整は、それぞれ9.8579°及び24.4542°である。
【0072】
図17は、本開示の実施の形態による、検出領域内の調整に対応する例示的なカメラズーム調整を示す。焦点矩形1702のサイズとフル画像(現在の検出領域)1704の解像度に基づいて、以下の式(12)、式(13)を用いて、幅と高さのズーム調整を計算する:
【数12】
【数13】
ここで、fullResWはフル画像解像度の幅、fullResHはフル画像解像度の高さ、focusWは焦点領域の幅、focusHは焦点領域の高さである。カメラのズームイン又は拡大係数は、以下の式(14)に示すように、adjW値とadjH値との低いほうの値をとることによって決定することができる:
【数14】
【0073】
この実施の形態では、フル画像解像度(幅×高さ)は14×9であり、焦点領域解像度は9×4である。計算されたadjW及びadjHは、式(12)及び式(13)を使用してそれぞれ1.5555及び2.25であり、式(14)を使用して計算されたカメラズームイン係数は1.5555である。
【0074】
図18は、本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスを示すフローチャート1800を示す。ステップ1802で、人物外観データベースにおいて第1のレベルの分析検出を実行及び記憶するステップが実行される。ステップ1802は、図19及びその付随する説明においてさらに詳述される。ステップ1804で、システム内の複数のカメラのうちのカメラ及び時間範囲を選択するステップがユーザによって実行される。ステップ1806で、ユーザ選択カメラの予め設定されたカメラ目標プロファイルを検索するステップが実行される。ステップ1808で、人物外観データベースから、選択された時間範囲内のユーザ選択カメラの画像及び検出データを検索するステップが実行される。ステップ1810で、人物外観データベースにおいて、選択された時間範囲内に、ユーザ選択カメラの画像及び検出データがさらにあるかどうかが決定される。存在しない場合、プロセスは終了してよく、そうでなければ、ステップ1812が実行される。
【0075】
ステップ1812で、画像及びその検出データから検出マップを生成するステップ。ステップ1814で、選択されたカメラ目標プロファイルで定義された重み付けに基づいて、ビデオ分析検出のための新しい検出マップを初期化及び更新するステップが実行される。ステップ1816で、カメラ目標プロファイルに定義された別のビデオ分析検出があるかどうかが決定される。決定が肯定的である場合、ステップ1814が他のビデオ分析検出のために実行される。存在しない場合、ステップ1818が実行される。
【0076】
ステップ1818で、合成検出マップを生成するステップが、ステップ1812及び1814で生成及び更新された画像のすべての検出マップを合計することによって実行される。ステップ1820で、ステップ1818で生成された合成検出マップを分析データベースに記憶するステップが実行される。ステップ1822で、他の画像があるかどうかが決定される。決定が肯定的である場合、他の画像を使用してステップ1812~1822が実行され、存在しない場合、ステップ1824が実行される。
【0077】
ステップ1824で、ユーザ選択カメラの画像及び時間範囲から生成された分析データベースから合成検出マップを検索するステップが実行される。ステップ1826で、分析密度マップを生成するステップが、ステップ1824で検索された合成検出マップを合計することによって実行される。ステップ1828で、分析密度マップにおける利用スペースを計算するステップが実行される。ステップ1830で、未利用スペース百分率を計算するステップが実行される。ステップ1832で、未利用スペース百分率が、事前定義された利用不足閾値を上回るかどうかが決定される。未利用スペース百分率が、事前定義された利用不足閾値よりも低い場合、プロセスは終了してもよく、そうでない場合、ステップ1834が実行され、カメラビュー調整提案を生成するために利用スペースを処理するステップが実行される。ステップ1834は、図20及びその付随する説明においてさらに詳述される。
【0078】
図19は、本開示の実施の形態による、図18の人物外観データベース1802において第1のレベルの分析検出を実行及び記憶するプロセスを示すフローチャート1900を示す。ステップ1802は、ステップ1902で画像の履歴シーケンスを取得することによって開始し得る。ステップ1904で、第1のレベルの分析検出を実行するステップが画像に対して実行される。ステップ1906で、第1のレベルの分析検出に基づいて、少なくとも1人の人物の外観が画像内で検出されたかどうかが決定される。人物の外観が検出されない場合、ステップ1910が実行され、そうでなければ、ステップ1908が実行される。ステップ1908で、画像、その検出データ及びカメラ情報を人物外観データベースに記憶するステップが実行される。ステップ1910で、他の画像があるかどうかが決定される。決定が肯定的である場合、他の画像を使用してステップ1904~1910が実行される。存在しない場合、プロセスは終了し得る。
【0079】
図20は、本開示の実施の形態による、図18のカメラビュー調整提案を生成するために利用スペースを処理するプロセス1834を示すフローチャート2000を示す。ステップ2002で、分析密度マップ内の最大密度値を見つけるステップが実行される。ステップ2004で、最小密度値を計算するステップが実行される。ステップ2006で、最小密度値から最大密度値までの範囲のすべての密度値の座標を求めるステップが実行される。ステップ2008で、最小座標と最大座標で焦点矩形を定義するステップが実行される。ステップ2010で、焦点矩形の基準中心部分を計算するステップが実行される。ステップ2012で、カメラ調整を計算及び実行するステップが実行される。
【0080】
図21は、本開示の実施の形態による、撮像デバイスによって撮像される画像の検出領域を適応的に調整するプロセスの概要を示す概略図2100を示す。ビデオ及び/又は連続画像2102は、複数の撮像デバイスによって撮影されてもよく、各画像は、各画像から人物の外観を識別するために第1のレベルの分析検出(この場合は身体検出2104)を受ける。そして、少なくとも1人の人物の外観の画像が人物外観データベース2106に記憶される。ユーザは、時間範囲及びカメラを指定又は選択してもよく、時間範囲内でカメラによって撮像された画像2108が検索される。
【0081】
各検索された画像2108aについて、画像のすべての部分における第1のレベルの分析検出(身体検出)に基づいて検出された外観の尺度を示す検出マップ2112aが最初に生成され得る。選択されたカメラの目標プロファイルに基づいて、さらなるオンデマンドのビデオ分析検出2110が必要とされ得る。この場合、ポーズ及び顔検出に対する追加のビデオ分析が必要であり、したがって、それぞれの追加のビデオ分析検出に基づいて検出された外観の尺度を示す検出マップ2112b及び2112cが生成される。任意選択的に、分析データベース2116に記憶する前に、複数の分析検出に基づいて生成されたすべての検出マップ2112a~2112cを合計することによって、処理された画像ごとに合成検出マップも生成される。
【0082】
続いて、すべての検索画像2108が処理され、検索画像2108から生成された検出マップ(及び合成検出マップ2114)が分析データベース2116に記憶された後、検出マップ(又は合成検出マップ)を合計することによって分析密度マップ2118が生成される。次いで、分析密度マップ2118を使用して、焦点矩形を識別し、焦点矩形を再配置するための基準中心部分の座標を計算し、ズーム調整が必要かどうかを決定する。次に、必要なカメラのパン及びチルト調整、ならびに選択されたカメラの視野を調整し、調整された視野の中央部分に焦点領域を再配置するためのズーム調整2120が計算される。次いで、パン、チルト及びズーム調整を実行して、選択されたカメラの視野を調整し、選択されたカメラの後続の画像が調整された検出領域の下で撮影されるようにする。
【0083】
図22は、以下でコンピュータシステム2200と交換可能に称される例示的なコンピューティングデバイス2200の概略図を示し、1つ又は複数のかかるコンピューティングデバイス2200は、図3の方法を実行し、図4の装置を実装するために使用され得るか、又は使用に適し得る。コンピューティングデバイス2200の以下の説明は、例としてのみ提供され、限定することを意図するものではない。
【0084】
図22に示すように、例示的なコンピューティングデバイス2200は、ソフトウェアルーチンを実行するためのプロセッサ2204を含む。明確にするためにシングルプロセッサが示されているが、コンピューティングデバイス2200はまた、マルチプロセッサシステムを含んでもよい。プロセッサ2204は、コンピューティングデバイス2200の他の構成要素と通信するための通信インフラストラクチャ2206に接続される。通信インフラストラクチャ2206は、例えば、通信バス、クロスバー、又はネットワークを含み得る。
【0085】
コンピューティングデバイス2200は、ランダムアクセスメモリ(RAM)などのメインメモリ2208と、二次メモリ2210とをさらに含む。二次メモリ2210は、例えば、ハードディスクドライブ、ソリッドステートドライブ又はハイブリッドドライブであり得るストレージドライブ2212、及び/又は磁気テープドライブ、光ディスクドライブ、ソリッドステートストレージドライブ(例えば、USBフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカード)などを含んでもよいリムーバブルストレージドライブ2214を含んでもよい。リムーバブルストレージドライブ2214は、周知の方法でリムーバブル記憶媒体2218から読み出し、かつ/又はそれに書き込む。リムーバブル記憶媒体2218は、リムーバブルストレージドライブ2214によって読み出され、書き込まれる磁気テープ、光学ディスク、不揮発性記憶媒体などを含み得る。当業者(複数可)には理解されるように、リムーバブル記憶媒体2218は、コンピュータ実行可能プログラムコード命令及び/又はデータを記憶したコンピュータ可読記憶媒体を含む。
【0086】
代替的な実装形態では、二次メモリ2210は、追加的又は代替的に、コンピュータプログラム又は他の命令がコンピューティングデバイス2200にロードされることを可能にするための他の同様の手段を含み得る。かかる手段は、例えば、リムーバブルストレージユニット2222及びインタフェース2220を含み得る。リムーバブルストレージユニット2222及びインタフェース2220の例は、プログラムカートリッジ及びカートリッジインタフェース(ビデオゲームコンソールデバイスに見られるものなど)、リムーバブルメモリチップ(EPROM又はPROMなど)及び関連するソケット、リムーバブルソリッドステートストレージドライブ(USBフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカードなど)、ならびにソフトウェア及びデータをリムーバブルストレージユニット2222からコンピュータシステム2200に転送することを可能にする他のリムーバブルストレージユニット2222及びインタフェース2220を含む。
【0087】
コンピューティングデバイス2200はまた、少なくとも1つの通信インタフェース2224を含む。通信インタフェース2224は、ソフトウェア及びデータが通信パス2226を介してコンピューティングデバイス2200と外部デバイスとの間で転送されることを可能にする。本発明の種々の実施の形態では、通信インタフェース2224は、データが、コンピューティングデバイス2200と、パブリックデータ又はプライベートデータ通信ネットワークなどのデータ通信ネットワークとの間で転送されることを可能にする。通信インタフェース2224は、異なるコンピューティングデバイス600間でデータを交換するために使用されてもよく、かかるコンピューティングデバイス2200は、相互接続されたコンピュータネットワークの一部を形成する。通信インタフェース2224の例としては、モデム、ネットワークインタフェース(イーサネットカードなど)、通信ポート(シリアル、パラレル、プリンタ、GPIB、IEEE 1394、RJ45など)、関連回路を有するアンテナなどを挙げることができる。通信インタフェース2224は、有線であってもよいし、無線であってもよい。通信インタフェース2224を介して転送されるソフトウェア及びデータは、通信インタフェース2224によって受信されることが可能な電子信号、電磁信号、光信号、又は他の信号であり得る信号の形態である。これらの信号は、通信パス2226を介して通信インタフェースに提供される。
【0088】
図22に示すように、コンピューティングデバイス2200は、関連するディスプレイ2230に画像をレンダリングするための動作を実施するディスプレイインタフェース2202と、関連するスピーカ(複数可)2234を介してオーディオコンテンツを再生するための動作を実施するオーディオインタフェース2232とをさらに含む。
【0089】
本明細書で使用する「コンピュータプログラム製品」という用語は、部分的に、リムーバブル記憶媒体2218、リムーバブルストレージユニット2222、ストレージドライブ2212にインストールされたハードディスク、又は通信パス2226(無線リンク又はケーブル)を介して通信インタフェース2224にソフトウェアを搬送するキャリア波を指すことがある。コンピュータ可読記憶媒体は、実行及び/又は処理のために、記録された命令及び/又はデータをコンピューティングデバイス2200に提供する任意の非一時的な不揮発性有形記憶媒体を指す。かかる記憶媒体の例は、かかるデバイスがコンピューティングデバイス2200の内部にあるか外部にあるかにかかわらず、磁気テープ、CD-ROM、ブルーレイディスク、ハードディスクドライブ、ROM又は集積回路、ソリッドステートストレージドライブ(USBフラッシュドライブ、フラッシュメモリデバイス、ソリッドステートドライブ又はメモリカードなど)、ハイブリッドドライブ、光磁気ディスク、又はPCカードなどのコンピュータ可読カードなどを含む。コンピューティングデバイス2200へのソフトウェア、アプリケーションプログラム、命令、及び/又はデータの提供にも関与し得る一時的又は非有形のコンピュータ可読伝送媒体の例は、無線又は赤外線伝送チャネル、ならびに別のコンピュータ又はネットワーク化されたデバイスへのネットワーク接続、及び電子メール伝送及びウェブサイトなどに記録された情報を含むインターネット又はイントラネットを含む。
【0090】
コンピュータプログラム(コンピュータプログラムコードとも称される)は、メインメモリ2208及び/又は二次メモリ2210に記憶される。コンピュータプログラムは、通信インタフェース2224を介して受信することもできる。かかるコンピュータプログラムは、実行されると、コンピューティングデバイス2200が本明細書で論じられる実施の形態の1つ又は複数の特徴を実施することを可能にする。種々の実施の形態では、コンピュータプログラムは、実行されると、プロセッサ1207が上述の実施の形態の特徴を実施することを可能にする。したがって、かかるコンピュータプログラムは、コンピュータシステム2200のコントローラを表す。
【0091】
ソフトウェアは、コンピュータプログラム製品に記憶され、リムーバブルストレージドライブ2214、ストレージドライブ2212、又はインタフェース2220を使用して、コンピューティングデバイス2200にロードされ得る。コンピュータプログラム製品は、非一時的なコンピュータ可読媒体であってもよい。代替的に、コンピュータプログラム製品は、通信パス2226を介してコンピュータシステム2200にダウンロードされてもよい。ソフトウェアは、プロセッサ2204によって実行されると、コンピューティングデバイス2200に、図3に示される方法を実行し図4の装置を実装するために必要な動作を実施させる。
【0092】
図22の実施の形態は、装置2200の動作及び構造を説明するための単なる例として提示されていることを理解されたい。したがって、一部の実施の形態では、コンピューティングデバイス2200の1つ又は複数の特徴が省略されてもよい。また、一部の実施の形態では、コンピューティングデバイス2200の1つ又は複数の特徴を一緒に組み合わせてもよい。加えて、一部の実施の形態では、コンピューティングデバイス2200の1つ又は複数の特徴は、1つ又は複数の構成要素部分に分割され得る。
【0093】
図23は、本開示の様々な実施の形態による、撮像デバイス402によって撮像される画像の検出領域を適応的に調整するための装置404を示すブロック図を示す。装置404は、少なくとも1つのプロセッサ406と、コンピュータプログラムコードを含む少なくとも1つのメモリ408とを備える。
【0094】
当業者であれば、広範に記載された本発明の精神又は範囲から逸脱することなく、特定の実施の形態に示された本発明に対して多数の変形及び/又は修正を行い得ることを理解するであろう。したがって、本実施の形態は、あらゆる点で例示的であり、限定的ではないと考えられるべきである。
【0095】
本出願は、2021年10月14日に出願されたシンガポール特許出願第10202111442R号を基礎とする優先権を主張し、その開示は、参照によりその全体が本明細書に組み込まれる。
【0096】
付記
上記の実施の形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
(付記1)
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためにコンピュータによって実行される方法であって、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出することと、
1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成することであって、第1のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含む、生成することと、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定することであって、未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示す、決定することと、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整することと
を含む、方法。
(付記2)
複数の入力画像の各々から、複数の第2のマップを生成すること
をさらに含み、
複数の第2のマップの各々は、検出領域に対応し、1人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも1つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の異なる第2の尺度を含み、
第1のマップを生成することは、複数の入力画像の各々から生成された複数の第2のマップに関して、検出領域の複数の部分の各々において検出された1人又は複数の人物の外観のそれぞれの第2の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第1のマップ内の1人又は複数の人物の外観の第1の尺度を決定することを含む、
付記1に記載の方法。
(付記3)
1人又は複数の人物の身体部分、特性又は動きのうちの少なくとも1つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された1人又は複数の人物の外観のカウントと、撮像デバイスによって顔の特徴、身体部分、特性又は動きのうちの少なくとも1つに基づいて検出された外観の予め設定された検出重みとに基づいて、人物の外観の第2の尺度を決定すること
をさらに含む、付記2に記載の方法。
(付記4)
検出領域に対応する第3のマップを生成することをさらに含み、第3のマップは、複数の入力画像の各々における検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第3の尺度を含み、第3の尺度は、複数の入力画像の各々からの検出領域の複数の部分の各々において検出された複数の第2のマップの1人又は複数の人物の外観のそれぞれの第2の尺度の和であり、
第1のマップを生成することは、複数の入力画像から生成された第3のマップに関して、検出領域の複数の部分の各々において検出された1人又は複数の人物の外観のそれぞれの第3の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第1のマップ内の1人又は複数の人物の外観の第1の尺度を決定することを含む、
付記2又は3に記載の方法。
(付記5)
利用部分の少なくとも一部の各々が、1人又は複数の人物の外観の閾値尺度以上である1人又は複数の人物の外観の尺度に関連付けられるか決定すること
をさらに含む、付記1~4のいずれか1項に記載の方法。
(付記6)
第1のマップにおいて生成された1人又は複数の人物の外観の第1の尺度のうち、1人又は複数の人物の外観の最高尺度を決定することと、
1人又は複数の人物の外観の最高尺度に基づいて人物の外観の閾値尺度を計算することと
をさらに含む、付記5に記載の方法。
(付記7)
検出領域を調整することは、
検出領域に対する撮像デバイスのデバイス角度を変更するために、水平軸及び/又は垂直軸を中心に撮像デバイスを回転させることと、
焦点領域が、撮像デバイスによって撮像される画像の調整された検出領域の中心の周りの予め設定された中心部分を占めるように、撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも1つを含む、付記1~6のいずれか1項に記載の方法。
(付記8)
焦点領域を検出領域の中心に移動させるために必要な検出領域の調整量を計算することと、
検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定することと
をさらに含み、
検出領域を調整することは、検出の量が予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
付記1~7のいずれか1項に記載の方法。
(付記9)
撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置であって、
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つのメモリと
を備え、
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出させ、
1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成させ、第1のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる、
装置。
(付記10)
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、複数の入力画像の各々から、複数の第2のマップを生成させ、複数の第2のマップの各々は、検出領域に対応し、1人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも1つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の異なる第2の尺度を含み、
第1のマップを生成することは、複数の入力画像の各々から生成された複数の第2のマップに関して、検出領域の複数の部分の各々において検出された1人又は複数の人物の外観のそれぞれの第2の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第1のマップ内の1人又は複数の人物の外観の第1の尺度を決定することを含む、
付記9に記載の装置。
(付記11)
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、
1人又は複数の人物の身体部分、特性又は動きのうちの少なくとも1つに基づいて複数の入力画像の各々から検出領域の複数の部分の各々において検出された1人又は複数の人物の外観のカウントと、撮像デバイスによって顔の特徴、身体部分、特性又は動きのうちの少なくとも1つに基づいて検出された外観の予め設定された検出重みとに基づいて、1人又は複数の人物の外観の第2の尺度を決定させる、
付記9に記載の装置。
(付記12)
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、検出領域に対応する第3のマップを生成させ、第3のマップは、複数の入力画像の各々における検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第3の尺度を含み、第3の尺度は、複数の入力画像の各々からの検出領域の複数の部分の各々において検出された複数の第2のマップの1人又は複数の人物の外観のそれぞれの第2の尺度の和であり、
第1のマップを生成することは、複数の入力画像から生成された第3のマップに関して、検出領域の複数の部分の各々において検出された1人又は複数の人物の外観のそれぞれの第3の尺度に基づいて複数の入力画像にわたる検出領域の複数の部分の各々において検出された第1のマップ内の1人又は複数の人物の外観の第1の尺度を決定することを含む、
付記10又は11に記載の装置。
(付記13)
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、
利用部分の少なくとも一部の各々が、1人又は複数の人物の外観の閾値尺度以上である1人又は複数の人物の外観の尺度に関連付けられるか決定させる、
付記9~12のいずれか1項に記載の装置。
(付記14)
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、
第1のマップにおいて生成された1人又は複数の人物の外観の第1の尺度のうち、1人又は複数の人物の外観の最高尺度を決定させ、
1人又は複数の人物の外観の最高尺度に基づいて人物の外観の閾値尺度を計算させる、
付記13に記載の装置。
(付記15)
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、
検出領域に対する撮像デバイスのデバイス角度を変更するために、水平軸及び/又は垂直軸を中心に撮像デバイスを回転させることと、
焦点領域が、撮像デバイスによって撮像される画像の調整された検出領域の中心の周りの予め設定された中心部分を占めるように、撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも1つを実行させる、付記9~14のいずれか1項に記載の装置。
(付記16)
少なくとも1つのメモリ及びコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、
焦点領域を検出領域の中心に移動させるために必要な検出領域の調整量を計算させ、
検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定させ、検出領域を調整することは、検出の量が予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
付記9~15のいずれか1項に記載の装置。
(付記17)
付記9~16のいずれか1項に記載の装置と撮像デバイスとを備える、撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのシステム。
(付記18)
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムを記憶する非一時的なコンピュータ可読媒体であって、プログラムは、コンピュータに、少なくとも、
一定期間にわたって撮像デバイスによって以前に撮像された複数の入力画像の各々から検出領域内の1人又は複数の人物の外観を検出させ、
1人又は複数の人物のそれぞれの外観に基づいて検出領域に対応する第1のマップを生成させ、第1のマップは、複数の入力画像にわたる検出領域の複数の部分の各々において検出された1人又は複数の人物の外観の第1の尺度を含み、
検出領域の複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、検出領域の複数の部分のうちの部分であり、1人又は複数の人物の外観が複数の入力画像にわたってその部分で検出されなかったことを示し、
複数の部分のうちの未利用部分の少なくとも一部を含む検出領域内の焦点領域が、決定に応じて撮像デバイスによって撮像される画像の調整された検出領域の中心又はその近くに配置されるように、検出領域を調整させる、
非一時的なコンピュータ可読媒体。
【符号の説明】
【0097】
100 画像
102 カメラ
104 外観
105 ビュー
106 方向
110 画像
114 人物
116 方向
118 検出領域
120、120’ ビュー、画像
122、122’ 焦点領域
200 入力画像
200a~200c 画像
202a~202c 人物外観
204a、204b 人物外観
300 方法、フローチャート
400 システム
402 撮像デバイス
404 装置
406 プロセッサ
408 メモリ
410 データベース
500 システム
502 カメラ
504 画像又はビデオファイル
506 ビデオアーカイブ検索システム
508 人物外観データベース
602 カメラ1
604a~604d 検索された入力画像
700 フロー図
703 目標プロファイル
704a~704d 入力画像
705 選択されたカメラ1の解像度
706、708 検出マップ
710 合成検出マップ
802 合成検出マップ
804 分析データベース
806 分析密度マップ
902 入力画像
906 2D分析密度マップ
1004 未利用部分又はスペース
1206 焦点矩形、矩形領域
1207 プロセッサ
1302 検出領域、検出マップ
1304 焦点矩形、矩形領域
1306 基準中心部分
1400 カメラ
1402 現在の視野
1404 焦点矩形、矩形領域
1412 新しい視野
1502 入力画像
1504 焦点矩形
1506 後続の画像、予め設定された焦点領域サイズ、予め設定された中心部分又はサイズ
1602 検出領域又は焦点領域
1604 焦点領域
1606 基準中心部分
1610 カメラセンサ
1702 焦点矩形
1704 フル画像
1800 フローチャート
1900 フローチャート
2000 フローチャート
2100 概略図
2102 ビデオ画像/連続画像
2104 身体検出
2106 人物外観データベース
2108、2108a 検索画像
2110 オンデマンドビデオ分析検出
2112a~2112c 検出マップ
2114 合成検出マップ
2116 分析データベース
2118 分析密度マップ
2120 ズーム調整
2200 コンピュータシステム、コンピュータデバイス又は装置
2202 ディスプレイインタフェース
2204 プロセッサ
2206 通信インフラストラクチャ
2208 メインメモリ
2210 二次メモリ
2212 ストレージドライブ
2214 リムーバブルストレージドライブ
2218 リムーバブル記憶媒体
2220 インタフェース
2222 リムーバブルストレージユニット
2224 通信インタフェース
2226 通信パス
2230 ディスプレイ
2232 オーディオインタフェース
2234 スピーカ(複数可)
図1A
図1B
図1C
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
【手続補正書】
【提出日】2024-04-03
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
撮像デバイスによって撮像される画像の検出領域を適応的に調整するための装置であって、
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つのメモリと
を備え、
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の1人又は複数の人物の外観を検出させ、
前記1人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第1のマップを生成させ、前記第1のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第1の尺度を含み、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、前記未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、前記検出領域の前記複数の部分のうちの部分であり、前記1人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示し、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整させる、
装置。
【請求項2】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、前記複数の入力画像の各々から、複数の第2のマップを生成させ、複数の第2のマップの各々は、前記検出領域に対応し、前記1人又は複数の人物の顔の特徴、身体部分、特性又は動きのうちの少なくとも1つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観の異なる第2の尺度を含み、
前記第1のマップを生成することは、前記複数の入力画像の各々から生成された前記複数の第2のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のそれぞれの第2の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第1のマップ内の前記1人又は複数の人物の前記外観の前記第1の尺度を決定することを含む、
請求項に記載の装置。
【請求項3】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記1人又は複数の人物の身体部分、特性又は動きのうちの前記少なくとも1つに基づいて前記複数の入力画像の各々から前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のカウントと、前記撮像デバイスによって顔の特徴、前記身体部分、前記特性又は前記動きのうちの前記少なくとも1つに基づいて検出された外観の予め設定された検出重みとに基づいて、前記1人又は複数の人物の前記外観の第2の尺度を決定させる、
請求項に記載の装置。
【請求項4】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、前記検出領域に対応する第3のマップを生成させ、前記第3のマップは、前記複数の入力画像の各々における前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第3の尺度を含み、前記第3の尺度は、前記複数の入力画像の各々からの前記検出領域の前記複数の部分の各々において検出された複数の第2のマップの前記1人又は複数の人物の前記外観のそれぞれの第2の尺度の和であり、
前記第1のマップを生成することは、前記複数の入力画像から生成された前記第3のマップに関して、前記検出領域の前記複数の部分の各々において検出された前記1人又は複数の人物の前記外観のそれぞれの第3の尺度に基づいて前記複数の入力画像にわたる前記検出領域の前記複数の部分の各々において検出された前記第1のマップ内の前記1人又は複数の人物の前記外観の前記第1の尺度を決定することを含む、
請求項又はに記載の装置。
【請求項5】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記利用部分の前記少なくとも一部の各々が、前記1人又は複数の人物の前記外観の閾値尺度以上である前記1人又は複数の人物の前記外観の尺度に関連付けられるか決定させる、
請求項のいずれか1項に記載の装置。
【請求項6】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記第1のマップにおいて生成された前記1人又は複数の人物の前記外観の前記第1の尺度のうち、前記1人又は複数の人物の前記外観の最高尺度を決定させ、
前記1人又は複数の人物の前記外観の前記最高尺度に基づいて前記人物の前記外観の前記閾値尺度を計算させる、
請求項に記載の装置。
【請求項7】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記検出領域に対する前記撮像デバイスのデバイス角度を変更するために、水平軸及び/又は垂直軸を中心に前記撮像デバイスを回転させることと、
前記焦点領域が、前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の前記中心の周りの予め設定された中心部分を占めるように、前記撮像デバイスの倍率を増大又は減少させることと
のうちの少なくとも1つを実行させる、請求項のいずれか1項に記載の装置。
【請求項8】
前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、前記装置に、少なくとも、
前記焦点領域を前記検出領域の中心に移動させるために必要な検出領域の調整量を計算させ、
前記検出領域の調整量が、予め設定された最小調整閾値よりも大きいか決定させ、前記検出領域を調整することは、前記検出の量が前記予め設定された最小調整閾値よりも大きいとの決定に応じて実行される、
請求項のいずれか1項に記載の装置。
【請求項9】
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためにコンピュータによって実行される方法であって、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の1人又は複数の人物の外観を検出することと、
前記1人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第1のマップを生成することであって、前記第1のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第1の尺度を含む、生成することと、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定することであって、前記未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、前記検出領域の前記複数の部分のうちの部分であり、前記1人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示す、決定することと、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整することと
を含む、方法。
【請求項10】
撮像デバイスによって撮像される画像の検出領域を適応的に調整するためのプログラムあって、ンピュータに、少なくとも、
一定期間にわたって前記撮像デバイスによって以前に撮像された複数の入力画像の各々から前記検出領域内の1人又は複数の人物の外観を検出させ、
前記1人又は複数の人物のそれぞれの外観に基づいて前記検出領域に対応する第1のマップを生成させ、前記第1のマップは、前記複数の入力画像にわたる前記検出領域の複数の部分の各々において検出された前記1人又は複数の人物の前記外観の第1の尺度を含み、
前記検出領域の前記複数の部分に対する未利用部分の比が閾値比を超えるか決定させ、前記未利用部分の各々は、外観の第1の尺度が関連付けられていないか、又は外観の第1の尺度が0である、前記検出領域の前記複数の部分のうちの部分であり、前記1人又は複数の人物の外観が前記複数の入力画像にわたって前記部分で検出されなかったことを示し、
前記複数の部分のうちの利用部分の少なくとも一部を含む前記検出領域内の焦点領域が、前記決定に応じて前記撮像デバイスによって撮像される前記画像の前記調整された検出領域の中心又はその近くに配置されるように、前記検出領域を調整させる、プログラム
【国際調査報告】