特許第6604019号(P6604019)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

特許6604019画像処理装置、画像処理方法、および画像処理システム
<>
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000002
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000003
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000004
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000005
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000006
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000007
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000008
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000009
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000010
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000011
  • 特許6604019-画像処理装置、画像処理方法、および画像処理システム 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6604019
(24)【登録日】2019年10月25日
(45)【発行日】2019年11月13日
(54)【発明の名称】画像処理装置、画像処理方法、および画像処理システム
(51)【国際特許分類】
   H04N 5/232 20060101AFI20191031BHJP
   G06T 3/00 20060101ALI20191031BHJP
【FI】
   H04N5/232 290
   H04N5/232 960
   G06T3/00 775
【請求項の数】17
【全頁数】20
(21)【出願番号】特願2015-82275(P2015-82275)
(22)【出願日】2015年4月14日
(65)【公開番号】特開2016-201756(P2016-201756A)
(43)【公開日】2016年12月1日
【審査請求日】2018年3月20日
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】綱島 宣浩
【審査官】 大西 宏
(56)【参考文献】
【文献】 特開2008−104130(JP,A)
【文献】 特開2013−232869(JP,A)
【文献】 特開2014−053859(JP,A)
【文献】 特開2014−222825(JP,A)
【文献】 特開2002−092600(JP,A)
【文献】 特開2002−230531(JP,A)
【文献】 特開2009−238222(JP,A)
【文献】 特開2013−172446(JP,A)
【文献】 特開2003−296741(JP,A)
【文献】 特開2009−147727(JP,A)
【文献】 米国特許出願公開第2008/0158361(US,A1)
【文献】 NILS T SIEBEL ET AL,FUSION OF MULTIPLE TRACKING ALGORITHMS FOR ROBUST PEOPLE TRACKING,ECCV 2002 COMPUTER VISION,SPRINGER,2002年 4月29日,LNCS, VOLUME 2353,373-387
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/222−5/257
H04N 7/18
G06T 1/00 −1/40
G06T 3/00 −5/50
G06T 9/00 −9/40
(57)【特許請求の範囲】
【請求項1】
動画像に含まれるフレーム画像のうちの第1のフレーム画像から第1の物体を選択し、前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、第2のフレーム画像から第2の物体を選択する物体検出部と、
前記選択した物体の検出位置が含まれるように前記フレーム画像の切り出し領域を決定する切り出し領域決定部と、
を備え
像処理装置。
【請求項2】
前記物体検出部は、前記第1の物体が停止していると推測される時間の長さが停止上限時間より大きいか否かに基づいて、前記第2のフレーム画像から前記第2の物体を選択する、請求項1に記載の画像処理装置。
【請求項3】
前記第2のフレーム画像が、前記第1の物体が停止していると推測される時間が前記停止上限時間を超えた際もしくは後のフレーム画像である場合には、前記物体検出部は、前記第2のフレーム画像から第2の物体を選択する
求項2に記載の画像処理装置。
【請求項4】
前記第2のフレーム画像が、前記第1の物体が停止していると推測される時間が前記停止上限時間以下である際のフレーム画像である場合には、前記物体検出部は、前記第2のフレーム画像から前記第1の物体を選択する、請求項2または3に記載の画像処理装置。
【請求項5】
前記第1の物体が停止していると推測される時間の長さは、連続するフレーム画像間での前記第1の物体の検出位置の変化量が所定の範囲内である間の時間の長さである、請求項〜4のいずれか一項に記載の画像処理装置。
【請求項6】
前記画像処理装置は、ユーザにより指定された停止上限時間の長さを取得する取得部をさらに備え、
前記物体検出部は、前記第1の物体が停止していると推測される時間の長さが、前記取得部により取得された停止上限時間以上であるか否かに基づいて、前記第2のフレーム画像から前記第2の物体を選択する、請求項5に記載の画像処理装置。
【請求項7】
前記第2のフレーム画像の切り出し領域の形状およびサイズは、前記第1のフレーム画像の切り出し領域と同一である、請求項〜6のいずれか一項に記載の画像処理装置。
【請求項8】
前記画像処理装置は、前記フレーム画像から物体を選択するための複数の目標情報の中からユーザにより選択された目標情報を取得する取得部をさらに備え、
前記物体検出部は、さらに、前記取得部により取得された目標情報に基づいて、前記第2のフレーム画像から第2の物体を選択する、請求項〜5のいずれか一項に記載の画像処理装置。
【請求項9】
前記複数の目標情報は、切り出し領域に対応する切り出し対象の物体を同一に維持する時間の上限値である追跡上限時間を含み、
前記第2のフレーム画像が、前記物体検出部による前記第1の物体の検出の継続時間が前記取得部により取得された追跡上限時間を超えた際もしくは後のフレーム画像である場合には、前記物体検出部は、前記第2のフレーム画像から第2の物体を選択する
求項8に記載の画像処理装置。
【請求項10】
前記物体検出部は、さらに、所定の数の物体を前記第2のフレーム画像から選択し、
前記切り出し領域決定部は、前記所定の数の物体の各々の検出位置に基づいて、前記第2のフレーム画像の中から前記所定の数の切り出し領域をそれぞれ決定する、請求項1〜9のいずれか一項に記載の画像処理装置。
【請求項11】
前記画像処理装置は、前記フレーム画像から物体を選択するための複数の目標情報の中からユーザにより選択された目標情報を取得する取得部をさらに備え、
前記複数の目標情報は、複数の切り出し領域の重なりを判定するための重なり判定条件を含み、
前記取得部により取得された重なり判定条件に基づいて前記所定の数の切り出し領域のうち第1の切り出し領域と第2の切り出し領域とが一部重複すると判定された場合には、前記物体検出部は、前記第2の切り出し領域に対応づけて選択された物体とは異なる第3の物体を前記第2のフレーム画像から選択し、
前記切り出し領域決定部は、前記第3の物体の検出位置が含まれるように前記第2の切り出し領域の位置を変更する、請求項10に記載の画像処理装置。
【請求項12】
前記動画像において監視対象領域が予め設定されており、
前記複数の目標情報は、切り出し領域に対応する切り出し対象の物体と前記監視対象領域との間の距離の上限値である監視上限距離を含み、
前記第2のフレーム画像が、前記第1の物体と前記監視対象領域との間の距離が前記取得部により取得された監視上限距離を超えた際もしくは後のフレーム画像である場合には、前記物体検出部は、前記第2のフレーム画像から第2の物体を選択する
求項8に記載の画像処理装置。
【請求項13】
前記第2の物体は、前記第2のフレーム画像に含まれる複数の物体のうち前記監視対象領域の最も近くに位置する物体である、請求項12に記載の画像処理装置。
【請求項14】
前記複数の目標情報は、検出対象の物体の領域サイズ、検出対象の物体の移動速度、検出対象の物体の滞在時間、検出対象の物体の縦横比、または、検出対象の物体が前記動画像の領域外に移動するまでの予測時間を含む、請求項8、または11のいずれか一項に記載の画像処理装置。
【請求項15】
前記画像処理装置は、前記切り出し領域決定部により決定された前記切り出し領域を前記第2のフレーム画像から切り出すことにより切り出し画像を生成する切り出し画像生成部をさらに備える、請求項1〜14のいずれか一項に記載の画像処理装置。
【請求項16】
動画像に含まれるフレーム画像のうちの第1のフレーム画像から第1の物体を選択し前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、第2のフレーム画像から第2の物体を選択することと、
前記選択した物体の検出位置が含まれるように前記フレーム画像の切り出し領域を決定することと、
備える、画像処理方法。
【請求項17】
動画像に含まれるフレーム画像のうちの第1のフレーム画像から第1の物体を選択し前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、第2のフレーム画像から第2の物体を選択する物体検出部と、
前記選択した物体の検出位置が含まれるように前記フレーム画像の切り出し領域を決定する切り出し領域決定部と、
前記切り出し領域決定部により決定された前記切り出し領域を前記フレーム画像から切り出すことにより切り出し画像を生成する切り出し画像生成部と、
生成された前記切り出し画像を記憶する記憶部と、
を備え
像処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像処理装置、画像処理方法、および画像処理システムに関する。
【背景技術】
【0002】
従来、撮影された画像の中から、検出対象の人物などの物体の領域を切り出すための技術が各種開発されている。
【0003】
例えば、特許文献1には、魚眼レンズカメラにより撮影された画像の中から移動体を検出し、検出した各移動体の外接四角形の領域をそれぞれ切り出す技術が記載されている。また、特許文献2には、直前のフレーム画像で抽出した部分領域の位置情報と、現在のフレーム画像から解析される物理的特徴量とに基づいて、各フレーム画像から部分領域を抽出する技術が記載されている。また、特許文献3には、映像データから抽出される動体のうちサイズ、存在時間、もしくは移動速度が最も大きい動体を検出し、そして、検出した動体を含む領域を切り出す技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−333422号公報
【特許文献2】特開2004−334587号公報
【特許文献3】特開2014−222825号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1〜特許文献3に記載の技術では、切り出し領域の位置が制約される場合がある。例えば、特許文献3に記載の技術では、一度検出対象に定められた物体が同じ場所に位置し続けると、同じ場所が切り出し領域として長時間設定され続ける。
【0006】
そこで、本開示では、検出対象の物体が停止している時間の長さに適応的に切り出し領域を決定することが可能な、新規かつ改良された画像処理装置、画像処理方法、および画像処理システムを提案する。
【課題を解決するための手段】
【0007】
本開示によれば、動画像に含まれる第1のフレーム画像から第1の物体を検出する物体検出部と、前記第1の物体の検出位置が含まれるように前記第1のフレーム画像の切り出し領域を決定する切り出し領域決定部と、を備え、前記切り出し領域決定部は、前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、前記第2のフレーム画像の切り出し領域を決定する、画像処理装置が提供される。
【0008】
また、本開示によれば、動画像に含まれる第1のフレーム画像から第1の物体を検出することと、前記第1の物体が停止していると推測される時間の長さに基づいて、前記第1のフレーム画像よりも後の第2のフレーム画像の切り出し領域を決定することと、を備える、画像処理方法が提供される。
【0009】
また、本開示によれば、動画像に含まれる第1のフレーム画像から第1の物体を検出する物体検出部と、前記第1の物体の検出位置が含まれるように前記第1のフレーム画像の切り出し領域を決定する切り出し領域決定部と、前記切り出し領域決定部により決定された前記切り出し領域を前記第1のフレーム画像から切り出すことにより切り出し画像を生成する切り出し画像生成部と、生成された前記切り出し画像を記憶する記憶部と、を備え、前記切り出し領域決定部は、前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、前記第2のフレーム画像の切り出し領域を決定する、画像処理システムが提供される。
【発明の効果】
【0010】
以上説明したように本開示によれば、検出対象の物体が停止している時間の長さに適応的に切り出し領域を決定することができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
【図面の簡単な説明】
【0011】
図1】本開示の実施形態による画像処理システムの構成例を示した説明図である。
図2】カメラ10により生成された縮小画像32の一例を示した説明図である。
図3】フレーム画像30から生成された複数のクロッピング画像50の一例を示した説明図である。
図4】同実施形態によるカメラ10の構成を示した機能ブロック図である。
図5】フレーム画像30とクロッピング領域40との関係を示した説明図である。
図6】同実施形態による監視端末22の構成を示した機能ブロック図である。
図7】同実施形態による評価基準設定画面の表示例を示した説明図である。
図8】同実施形態による領域設定部104の構成を示した機能ブロック図である。
図9】同実施形態による動作を示したフローチャートである。
図10】同実施形態によるクロッピング画像生成処理の動作の一部を示したフローチャートである。
図11】同実施形態によるクロッピング画像生成処理の動作の一部を示したフローチャートである。
【発明を実施するための形態】
【0012】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0013】
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成を有する複数の構成を、必要に応じて映像クロッピング部106aおよび映像クロッピング部106bのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。例えば、映像クロッピング部106aおよび映像クロッピング部106bを特に区別する必要が無い場合には、単に映像クロッピング部106と称する。
【0014】
また、以下に示す項目順序に従って当該「発明を実施するための形態」を説明する。
1.画像処理システムの基本構成
2.実施形態の詳細な説明
3.変形例
【0015】
<<1.画像処理システムの基本構成>>
本開示は、一例として「2.実施形態の詳細な説明」において詳細に説明するように、多様な形態で実施され得る。最初に、本実施形態による画像処理システムの基本構成について、図1を参照して説明する。
【0016】
図1に示したように、本実施形態による画像処理システムは、カメラ10、ストレージ20、監視端末22、および、通信網24を含む。
【0017】
<1−1.カメラ10>
カメラ10は、本開示における画像処理装置の一例である。カメラ10は、外環境の動画像を撮影するための装置である。このカメラ10は、人や車の交通量が多い場所や、監視対象の場所などに設置され得る。例えば、カメラ10は、道路、駅、空港、商業用ビルディング、アミューズメントパーク、公園、駐車場、または立ち入り禁止区域などに設置されてもよい。
【0018】
また、カメラ10は、撮影したフレーム画像を用いて別の画像を生成することや、生成した別の画像を後述する通信網24を介して他の装置へ送信することが可能である。ここで、フレーム画像は、例えば、カメラ10が撮影可能な上限の解像度を有する画像である。一例として、フレーム画像は、4Kの画像であってもよい。
【0019】
例えば、カメラ10は、フレーム画像に基づいてデータ量の小さい別の画像を生成する。この理由は、フレーム画像はデータ量が大きいので、例えば伝送に時間がかかるなどの理由により、フレーム画像自体を他の装置へ送信することは望ましくないからである。
【0020】
ここで、カメラ10が生成する別の画像の例は、フレーム画像の解像度を単純に下げた画像である縮小画像や、注視対象の領域をクロッピング(切り取り)した画像であるクロッピング画像である。なお、縮小画像は、例えばフルHDの画像であってもよい。
【0021】
図2は、縮小画像の一例(縮小画像32)を示した説明図である。縮小画像32は、フレーム画像に含まれる全ての領域を含む。一方で、図2に示したように、縮小画像32では、例えば人の顔などの、注視対象の領域が非常に小さくなり得るので、視認し辛くなり得る。なお、図2に示した領域40は、後述するクロッピング領域に対応する領域である。通常、クロッピング領域はフレーム画像内に設定されるが、図2では、説明の便宜上、縮小画像32における、クロッピング領域に対応する領域を領域40と記載している。
【0022】
また、図3は、一枚のフレーム画像から生成された複数のクロッピング画像の一例(クロッピング画像50の集合52)を示した説明図である。クロッピング画像50は、フレーム画像と同じ解像度を有するが、図3に示したように、個々のクロッピング画像50は、フレーム画像のうちの一部の領域だけしか含まない。そこで、本実施形態によるカメラ10は、基本的には、一枚のフレーム画像から一枚の縮小画像、および、一以上のクロッピング画像を生成する。この生成例によれば、カメラ10により撮影された全景をユーザが確認でき、かつ、注視対象の領域を高解像度でユーザは確認することができる。そして、フレーム画像と比較して合計のデータ量を抑制することができる。
【0023】
ここで、図4を参照して、カメラ10の内部構成について説明する。図4に示したように、カメラ10は、撮影部100、映像縮小部102、領域設定部104、複数の映像クロッピング部106、および、通信部108を含む。なお、図4では、映像クロッピング部106が四個設けられる例を示しているが、かかる例に限定されず、一以上の任意の個数設けられてもよい。
【0024】
[1−1−1.撮影部100]
撮影部100は、外部の映像を、レンズを通して例えばCCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子に結像させることにより、フレーム画像を取得する機能を有する。例えば、撮影部100は、所定のフレームレートごとに外部の映像を撮影することにより、フレーム画像を取得する。
【0025】
[1−1−2.映像縮小部102]
映像縮小部102は、撮影部100により取得されたフレーム画像を所定のサイズに縮小することにより縮小画像を生成する。
【0026】
[1−1−3.領域設定部104]
領域設定部104は、撮影部100により取得されたフレーム画像において、クロッピング画像の生成元となる領域であるクロッピング領域を設定する。例えば、領域設定部104は、撮影部100により取得されたフレーム画像から、カメラ10に設けられている映像クロッピング部106の個数だけクロッピング領域を設定する。
【0027】
図5は、領域設定部104によるクロッピング領域の設定例を示した説明図である。なお、図5では、クロッピング領域40の横幅の長さを“crop_width”、クロッピング領域40の縦幅の長さを“crop_height”とそれぞれ記載している。
【0028】
図5に示したように、領域設定部104は、フレーム画像30の中から人物300などの検出対象の物体を検出し、そして、物体の検出位置302に基づいてクロッピング領域40を設定する。
【0029】
[1−1−4.映像クロッピング部106]
映像クロッピング部106は、本開示における切り出し画像生成部の一例である。映像クロッピング部106は、領域設定部104により設定されたクロッピング領域を、撮影部100により取得されたフレーム画像から切り出すことによりクロッピング画像を生成する。
【0030】
例えば、図3に示した例では、四個の映像クロッピング部106の各々により生成された四枚のクロッピング画像50を示している。図3に示したように、例えば、映像クロッピング部106aは、領域設定部104により設定された、図2に示した領域40aに対応するクロッピング領域からクロッピング画像50aを生成する。また、映像クロッピング部106bは、領域設定部104により設定された、図2に示した領域40bに対応するクロッピング領域からクロッピング画像50bを生成する。
【0031】
[1−1−5.通信部108]
通信部108は、本実施形態による取得部の一例である。通信部108は、後述する通信網24を介して、通信網24に接続された装置との間で各種の情報の送受信を行う。例えば、通信部108は、映像縮小部102により取得された縮小画像、および、複数の映像クロッピング部106により生成された複数のクロッピング画像をストレージ20へ送信する。また、通信部108は、ユーザにより設定された、クロッピング対象を選択するための検出指定情報を監視端末22から受信する。
【0032】
なお、検出指定情報は、監視端末22から受信される代わりに、カメラ10が最初から記憶していてもよい。以下では、検出指定情報が監視端末22から受信される例を中心として説明を行う。
【0033】
<1−2.ストレージ20>
ストレージ20は、カメラ10から受信される縮小画像およびクロッピング画像を記憶するための記憶装置である。例えば、ストレージ20は、カメラ10の識別情報、撮影日時、受信された縮小画像、および受信された複数のクロッピング画像を対応づけて記憶する。なお、ストレージ20は、例えばデータセンタや、監視員が勤務する監視センタなどに設置され得る。
【0034】
<1−3.監視端末22>
監視端末22は、カメラ10により生成された縮小画像およびクロッピング画像を表示するための情報処理端末である。この監視端末22は、例えば監視センタに設置され、そして、監視員に使用され得る。
【0035】
ここで、監視端末22の構成について詳細に説明する。図6は、本実施形態による監視端末22の構成を示した機能ブロック図である。図6に示したように、監視端末22は、制御部220、通信部222、表示部224、および入力部226を有する。
【0036】
[1−3−1.制御部220]
制御部220は、監視端末22に内蔵されるCPU(Central Processing Unit)、RAM(Random Access Memory)、およびROM(Read Only Memory)などのハードウェアを用いて、監視端末22の動作を全般的に制御する。
【0037】
[1−3−2.通信部222]
通信部222は、後述する通信網24を介して、通信網24に接続された装置との間で各種の情報の送受信を行う。例えば、通信部222は、ストレージ20に格納されている縮小画像およびクロッピング画像をストレージ20から受信する。なお、通信部222は、カメラ10により生成された縮小画像、および複数のクロッピング画像をカメラ10から直接受信することも可能である。
【0038】
また、通信部222は、制御部220の制御に従って、後述する評価基準設定画面においてユーザにより入力された、クロッピング対象の物体を選択するための検出指定情報をカメラ10へ送信する。
【0039】
[1−3−3.表示部224]
表示部224は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や、OLED(Organic Light Emitting Diode)などのディスプレイにより構成される。この表示部224は、例えば、ストレージ20から受信された縮小画像またはクロッピング画像を含む監視画面などを表示する。
【0040】
また、表示部224は、制御部220の制御に従って、評価基準設定画面を表示する。この評価基準設定画面は、カメラ10により撮影されたフレーム画像の中からクロッピング対象の物体を決定するために用いられる検出指定情報をユーザが設定(または変更)するための画面である。例えば、検出指定情報は、評価基準設定画面において選択された1以上の評価項目、および、当該評価項目の評価基準を含むように設定される。
【0041】
ここで、図7を参照して、評価基準設定画面(評価基準設定画面60)の表示例について説明する。図7に示したように、評価基準設定画面60は、例えば物体のサイズ設定欄600aや、物体のスピード設定欄600bなどの複数の評価項目の設定欄600を含む。図7に示したように、複数の評価項目は、例えば、物体のサイズ、物体のスピード、物体の滞在時間、物体の縦横比、物体が画面外に出るまでの予測時間、物体とホームポジションとの距離、物体の追跡時間、または、物体の停止時間などを含む。ここで、物体の縦横比は、例えば人と自動車とを区別するなど、検出対象の物体の種類を区別するために用いられる評価項目である。なお、縦横比を用いることのメリットとして、少ない計算量で物体の種類を識別できることが挙げられる。
【0042】
また、物体が画面外に出るまでの予測時間は、例えば過去のフレームにおける位置の変化に基づいて物体の移動速度を算出し、そして、算出された移動速度に基づいて予測される時間である。この「物体が画面外に出るまでの予測時間」は、例えば、高速に移動する物体であっても、少なくとも一回だけは撮影しておきたいような場合に利用される評価項目である。なお、ホームポジションは、本開示における監視対象領域の一例である。このホームポジションは、例えば、物体の検出枠ごとに定められる。一例として、検出枠は、例えば、通り、建物の入り口、立ち入り禁止区域などユーザが監視を希望する場所ごとに決められ得る。また、物体の検出枠は、カメラ10に含まれる複数の映像クロッピング106の各々に対応づけて設定されてもよい。
【0043】
例えば、図7に示した例では、物体のスピード、物体の縦横比、ホームポジションまでの距離、および、物体の停止時間がユーザにより評価項目として選択されたことを示している。さらに、図7では、物体のスピードが規定値よりも速い物体、物体の縦横比が規定値よりも小さい物体、ホームポジションまでの距離が規定値よりも長い物体、または、物体の停止時間が規定値よりも短い物体であるほど、評価が高くなるように評価基準が指定されたことを示している。
【0044】
[1−3−4.入力部226]
入力部226は、例えばマウス、キーボード、タッチパネル、または、マイクロフォンなどの入力装置を含む。この入力部226は、監視端末22に対するユーザによる各種の入力を受け付ける。例えば、入力部226は、表示部224に表示された評価基準設定画面に対する検出指定情報の入力を受け付ける。
【0045】
<1−4.通信網24>
通信網24は、通信網24に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、通信網24は、電話回線網、インターネット、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、通信網24は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。
【0046】
なお、本実施形態による画像処理システムは、上述した構成に限定されない。例えば、ストレージ20および監視端末22は一体的に構成されてもよい。または、本画像処理システムは、ストレージ20もしくは監視端末22を含まないことも可能である。
【0047】
上述した画像処理システムにおいて、本実施形態によるカメラ10は、ユーザにより指定された検出指定情報に基づいて、最適なクロッピング対象を自動的に選択することが可能である。
【0048】
<<2.実施形態の詳細な説明>>
<2−1.構成>
以上、本実施形態による画像処理システムの構成について説明した。次に、本実施形態によるカメラ10の構成について詳細に説明する。
【0049】
本実施形態によるカメラ10の構成の特徴は、特に領域設定部104の構成に関する。以下では、図8を参照して、領域設定部104の構成についてさらに詳細に説明する。
【0050】
図8に示したように、領域設定部104は、物体検出部120、クロッピング領域決定部122、および、重なり判定部124を含む。
【0051】
[2−1−1.物体検出部120]
(2−1−1−1.検出例1)
物体検出部120は、例えば監視端末22から受信された検出指定情報に基づいて、撮影部100により取得されたフレーム画像(以下、現在のフレーム画像と称する)における検出枠の中からクロッピング対象の物体を検出する。例えば、物体検出部120は、検出枠に含まれる複数の物体のうち、受信された検出指定情報に含まれる評価項目の評価基準で評価した値が最も高い物体をクロッピング対象として検出する。
【0052】
なお、受信された検出指定情報が複数の評価項目を含む場合には、物体検出部120は、検出枠に含まれる複数の物体のうち、当該検出指定情報に含まれる複数の評価項目の各々の評価基準による評価値の組み合わせに基づいてクロッピング対象の物体を検出することも可能である。例えば、上記の場合には、物体検出部120は、まず、検出枠に含まれる複数の物体の各々について、当該検出指定情報が示す複数の評価項目の各々について評価基準に従って評価し、そして、各評価項目の評価値の合計を算出する。そして、物体検出部120は、各評価項目の評価値の合計が最も高い物体をクロッピング対象として検出する。
【0053】
(2−1−1−2.検出例2)
また、受信された検出指定情報が評価項目「物体の停止時間」を含む場合には、物体検出部120は、現在の検出対象の物体が停止していると推測される時間の長さと、当該検出指定情報に含まれる停止上限時間との比較に基づいて、検出対象の物体を切り替えるか否かを判断する。
【0054】
例えば、現在の検出対象の物体が停止していると推測される時間の長さが停止上限時間より大きい場合には、物体検出部120は、検出対象の物体を別の物体に切り替えることを判断する。また、現在の検出対象の物体が停止していると推測される時間の長さが停止上限時間以下である場合には、物体検出部120は、検出対象の物体を、前のフレーム画像と同一にすることを判断する。なお、物体検出部120は、例えば、連続するフレーム画像間での検出対象の物体の検出位置の変化量が所定の範囲内である場合には、当該物体が停止していると推測することが可能である。
【0055】
また、受信された検出指定情報が評価項目「物体の追跡時間」を含む場合には、物体検出部120は、現在の検出対象の物体の検出の継続時間と、当該検出指定情報に含まれる追跡上限時間との比較に基づいて、検出対象の物体を切り替えるか否かを判断する。なお、追跡上限時間は、クロッピング対象の物体を同一の物体に維持する時間の上限値である。
【0056】
例えば、現在の検出対象の物体の検出の継続時間が追跡上限時間を超えた場合には、物体検出部120は、検出対象の物体を別の物体に切り替えることを判断する。また、現在の検出対象の物体の検出の継続時間が追跡上限時間以下である場合には、物体検出部120は、検出対象の物体を、前のフレーム画像と同一にすることを判断する。
【0057】
また、受信された検出指定情報が評価項目「物体とホームポジションとの間の距離」を含む場合には、物体検出部120は、動画像において予め設定されているホームポジションと現在の検出対象の物体との間の距離と、当該検出指定情報に含まれる監視上限距離との比較に基づいて、検出対象の物体を切り替えるか否かを判断する。
【0058】
例えば、ホームポジションと現在の検出対象の物体との間の距離が監視上限距離を超えた場合には、物体検出部120は、検出対象の物体を、例えばホームポジションの最も近くに位置する物体などの、別の物体に切り替えることを判断する。また、ホームポジションと現在の検出対象の物体との間の距離が監視上限距離以内である場合には、物体検出部120は、検出対象の物体を、前のフレーム画像と同一にすることを判断する。
【0059】
(2−1−1−3.検出例3)
また、後述する重なり判定部124によりクロッピング領域が重なっていると判定された場合には、物体検出部120は、判定されたクロッピング領域のうちいずれかのクロッピング対象の物体を別の物体に切り替えることを判断する。
【0060】
例えば、物体検出部120は、重なり判定部124によりクロッピング領域が重なっていると判定されたときから、受信された検出指定情報に含まれる「検出対象の切り替え時間」が経過した場合に、重なっているクロッピング領域のうちいずれかのクロッピング対象の物体を別の物体に切り替えることを判断する。
【0061】
なお、変形例として、重なり判定部124によりクロッピング領域が重なっていると判定されたクロッピング領域のうち、クロッピング対象の物体を別の物体に切り替えるクロッピング領域(以下、クロッピング対象切り替え領域と称する)を、物体検出部120は、受信された検出指定情報に従って判断してもよい。例えば、物体検出部120は、重なっているクロッピング領域のうち、受信された検出指定情報に含まれる評価項目の値がより低いクロッピング対象を含むクロッピング領域をクロッピング対象切り替え領域に決定してもよい。また、物体検出部120は、重なっているクロッピング領域のうち、より早い時刻からクロッピング対象の物体の検出(追跡)を継続しているクロッピング領域をクロッピング対象切り替え領域に決定してもよい。
【0062】
(2−1−1−4.検出例4)
なお、物体検出部120は、現在のフレーム画像の中から、例えば映像クロッピング部106の個数以内の数など、所定の数の物体を検出することが可能である。
【0063】
(2−1−1−5.検出例5)
また、物体検出部120は、検出枠の中にクロッピング対象(追跡対象)の物体が存在しない場合には、いずれの物体も検出しないことが可能である。
【0064】
[2−1−2.クロッピング領域決定部122]
(2−1−2−1.決定例1)
クロッピング領域決定部122は、本開示における切り出し領域決定部の一例である。クロッピング領域決定部122は、物体検出部120により検出された物体の検出位置が含まれるように、現在のフレーム画像におけるクロッピング領域を決定する。例えば、クロッピング領域決定部122は、物体検出部120により検出された物体の検出位置がクロッピング領域の中心になるように、現在のフレーム画像におけるクロッピング領域を決定する。
【0065】
なお、フレーム画像におけるクロッピング領域の形状およびサイズは、基本的には、全てのフレーム画像において同一に定められる。また、クロッピング領域のサイズは、基本的には、所定の大きさに定められている。
【0066】
(2−1−2−2.決定例2)
なお、物体検出部120によりいずれの物体も検出されなかった場合には、クロッピング領域決定部122は、いずれの領域も出力しないことを決定してもよい。または、上記の場合には、クロッピング領域決定部122は、ホームポジションを含む領域をクロッピング領域として決定してもよい。
【0067】
[2−1−3.重なり判定部124]
重なり判定部124は、クロッピング領域決定部122によりクロッピング領域が決定された際に、受信された検出指定情報に含まれる重なり判定条件に基づいて、当該クロッピング領域が他のクロッピング領域と重なっているか否かを判定する。例えば、重なり判定部124は、クロッピング領域の面積に対する、重なっている領域の面積の割合が所定の閾値以上である場合には、当該クロッピング領域は他のクロッピング領域と重なっていると判定する。また、重なり判定部124は、当該クロッピング領域の中心から他のクロッピング領域までの距離が所定の閾値以下である場合には、当該クロッピング領域は他のクロッピング領域と重なっていると判定する。
【0068】
<2−2.動作>
以上、本実施形態による構成について説明した。続いて、本実施形態による動作について、図9図11を参照して説明する。なお、ここでは、カメラ10が映像クロッピング部106を四個有しており、そして、一枚のフレーム画像から一枚の縮小画像および四枚のクロッピング画像を生成する場面における動作例について説明する。なお、この動作は、所定のフレームレートごとに繰り返し実行される。
【0069】
[2−2−1.全体の動作]
図9は、本実施形態による動作例を示したフローチャートである。図9に示したように、まず、カメラ10の撮影部100は、所定の撮影タイミングが到来したら、外部の映像を撮影することによりフレーム画像を取得する(S101)。
【0070】
続いて、映像縮小部102は、S101で取得されたフレーム画像(以下、現在のフレーム画像と称する)を所定のサイズに縮小することにより縮小画像を生成する(S103)。
【0071】
その後、カメラ10は、後述する「クロッピング画像生成処理」を映像クロッピング部106の個数、つまり4回繰り返して行う(S105〜S111)。
【0072】
その後、通信部108は、S103で生成された縮小画像、およびS107で生成された4枚のクロッピング画像をストレージ20へ送信する(S113)。
【0073】
[2−2−2.クロッピング画像生成処理]
ここで、図10図11を参照して、S107における「クロッピング画像生成処理」の動作について詳細に説明する。図10に示したように、まず、カメラ10の物体検出部120は、I箇所目のクロッピング対象として設定されている物体、つまり、追跡中の物体を検出する(S151)。
【0074】
続いて、クロッピング領域決定部122は、S151で検出された物体の検出位置がクロッピング領域の中心になるように、現在のフレーム画像におけるクロッピング領域を決定する(S153)。
【0075】
ここで、図11を参照して、S153よりも後の動作について説明する。図11に示したように、S153の後、物体検出部120は、S151で検出された物体の(追跡開始からの)追跡時間の合計が追跡上限時間を経過したか否かを判定する(S161)。物体の追跡時間の合計が追跡上限時間を経過した場合には(S161:Yes)、物体検出部120は、I箇所目のクロッピング対象を別の物体に切り替える(S163)。その後、カメラ10は、再びS153の動作を行う。
【0076】
一方、物体の追跡時間が追跡上限時間を経過していない場合には(S161:No)、物体検出部120は、次に、S151で検出された物体の(停止が検出されたときからの)停止時間の合計が停止上限時間を経過したか否かを判定する(S165)。物体の停止時間の合計が停止上限時間を経過した場合には(S165:Yes)、物体検出部120は、S163の動作を行う。
【0077】
一方、物体の停止時間の合計が停止上限時間を経過していない場合には(S165:No)、重なり判定部124は、S153で決定されたクロッピング領域が、同じフレーム画像内の他のクロッピング領域と重なっているか否かを判定する(S167)。該当のクロッピング領域が、他のクロッピング領域と重なっている場合には(S167:Yes)、物体検出部120は、S163の動作を行う。
【0078】
一方、該当のクロッピング領域が、他のクロッピング領域と重なっていない場合には(S167:No)、映像クロッピング部106は、該当のクロッピング領域を現在のフレーム画像から切り出すことにより、クロッピング画像を生成する(S169)。
【0079】
<2−3.効果>
[2−3−1.効果1]
以上、例えば図4図8図11などを参照して説明したように、本実施形態によるカメラ10は、複数の評価項目の中からユーザにより選択された評価項目に基づいて物体を検出し、そして、検出された物体の検出位置が含まれるように、現在のフレーム画像におけるクロッピング領域を決定する。このため、フレーム画像に含まれる複数の物体のうち、最適なクロッピング対象を自動的に選択することができる。また、クロッピング対象の物体をクロッピングする時間の長さに関しても同様に最適化することができる。
【0080】
[2−3−2.効果2]
また、カメラ10は、クロッピング対象の物体が停止していると推測される時間が停止上限時間を超えた場合には、クロッピング対象の物体を別の物体に切り替え、そして、切り替え後の物体が中心となるようにクロッピング領域を決定する。このため、仮に、一度クロッピング対象に定められた物体が同じ場所に位置し続けたとしても、停止条件時間が経過すれば、クロッピング対象の物体は別の物体に変更される。従って、長時間同じ場所が切り出し領域に設定され続けることを防止できる。
【0081】
[2−3−3.効果3]
また、クロッピング領域決定部122によるクロッピング領域の決定方法は簡易な方法であるので、カメラ10は、クロッピング画像の生成をリアルタイムに行うことができる。
【0082】
[2−3−4.効果4]
また、本実施形態によれば、カメラ10単体で縮小画像およびクロッピング画像を生成することが可能である。このため、縮小画像およびクロッピング画像を生成するための例えばサーバなどの他の装置に、カメラ10はフレーム画像を送信する必要がないので、通信量を軽減することができる。
【0083】
<<3.変形例>>
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0084】
<3−1.変形例1>
上述した実施形態では、本開示による画像処理装置がカメラ10である例について説明したが、かかる例に限定されない。例えば、監視端末22(の制御部220)が、カメラ10の代わりに、上述した映像縮小部102、領域設定部104、および、複数の映像クロッピング部106の全てを有する場合には、本開示による画像処理装置は、監視端末22であってもよい。
【0085】
また、別途設けられたサーバ(図示省略)が例えば通信網24を介してカメラ10と通信可能であり、かつ、このサーバが、カメラ10の代わりに、上述した映像縮小部102、領域設定部104、および、複数の映像クロッピング部106の全てを有する場合には、本開示による画像処理装置は、サーバであってもよい。また、このサーバとストレージ20とは一体的に構成されてもよい。
【0086】
<3−2.変形例2>
また、上記の説明では、物体の追跡上限時間、および、物体の停止上限時間は検出指定情報に含まれる値、つまり固定値である例について説明したが、かかる例に限定されず、カメラ10は、追跡上限時間、または、停止上限時間を動的に決定してもよい。例えば、カメラ10は、検出枠ごとに、追跡上限時間、または、停止上限時間を動的に決定してもよい。一例として、カメラ10は、検出枠ごとに、未追跡の物体の数が少ないほど、追跡上限時間を長くしてもよい。また、カメラ10は、検出枠に例えば監視対象領域が含まれる場合には、追跡上限時間をより長くしてもよい。
【0087】
<3−3.変形例3>
また、上述した実施形態によれば、例えばCPU、ROM、およびRAMなどのハードウェアを、上述した映像縮小部102、領域設定部104、および、映像クロッピング部106と同等の機能を発揮させるためのコンピュータプログラムも提供可能である。また、該コンピュータプログラムが記録された記録媒体も提供される。
【0088】
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
動画像に含まれる第1のフレーム画像から第1の物体を検出する物体検出部と、
前記第1の物体の検出位置が含まれるように前記第1のフレーム画像の切り出し領域を決定する切り出し領域決定部と、
を備え、
前記切り出し領域決定部は、前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、前記第2のフレーム画像の切り出し領域を決定する、画像処理装置。
(2)
前記切り出し領域決定部は、前記第1の物体が停止していると推測される時間の長さが停止上限時間より大きいか否かに基づいて、前記第2のフレーム画像の切り出し領域を決定する、前記(1)に記載の画像処理装置。
(3)
前記第2のフレーム画像が、前記第1の物体が停止していると推測される時間が前記停止上限時間を超えた際もしくは後のフレーム画像である場合には、前記物体検出部は、前記第2のフレーム画像から第2の物体を検出し、
前記切り出し領域決定部は、前記第2の物体の検出位置が含まれるように前記第2のフレーム画像の切り出し領域を決定する、前記(2)に記載の画像処理装置。
(4)
前記第2のフレーム画像が、前記第1の物体が停止していると推測される時間が前記停止上限時間以下である際のフレーム画像である場合には、前記切り出し領域決定部は、前記第1の物体の検出位置が含まれるように前記第2のフレーム画像の切り出し領域を決定する、前記(2)または(3)に記載の画像処理装置。
(5)
前記第1の物体が停止していると推測される時間の長さは、連続するフレーム画像間での前記第1の物体の検出位置の変化量が所定の範囲内である間の時間の長さである、前記(2)〜(4)のいずれか一項に記載の画像処理装置。
(6)
前記画像処理装置は、ユーザにより指定された停止上限時間の長さを取得する取得部をさらに備え、
前記切り出し領域決定部は、前記第1の物体が停止していると推測される時間の長さが、前記取得部により取得された停止上限時間以上であるか否かに基づいて、前記第2のフレーム画像の切り出し領域を決定する、前記(5)に記載の画像処理装置。
(7)
前記第2のフレーム画像の切り出し領域の形状およびサイズは、前記第1のフレーム画像の切り出し領域と同一である、前記(2)〜(6)のいずれか一項に記載の画像処理装置。
(8)
前記画像処理装置は、前記動画像からの切り出し領域を決定するための複数の目標情報の中からユーザにより選択された目標情報を取得する取得部をさらに備え、
前記切り出し領域決定部は、さらに、前記取得部により取得された目標情報に基づいて、前記第2のフレーム画像の切り出し領域を決定する、前記(2)〜(5)のいずれか一項に記載の画像処理装置。
(9)
前記複数の目標情報は、切り出し領域に対応する切り出し対象の物体を同一に維持する時間の上限値である追跡上限時間を含み、
前記第2のフレーム画像が、前記物体検出部による前記第1の物体の検出の継続時間が前記取得部により取得された追跡上限時間を超えた際もしくは後のフレーム画像である場合には、前記物体検出部は、前記第2のフレーム画像から第2の物体を検出し、
前記切り出し領域決定部は、前記第2の物体の検出位置が含まれるように前記第2のフレーム画像の切り出し領域を決定する、前記(8)に記載の画像処理装置。
(10)
前記物体検出部は、さらに、所定の数の物体を前記第2のフレーム画像から検出し、
前記切り出し領域決定部は、前記所定の数の物体の各々の検出位置に基づいて、前記第2のフレーム画像の中から前記所定の数の切り出し領域をそれぞれ決定する、前記(8)に記載の画像処理装置。
(11)
前記複数の目標情報は、複数の切り出し領域の重なりを判定するための重なり判定条件を含み、
前記取得部により取得された重なり判定条件に基づいて前記所定の数の切り出し領域のうち第1の切り出し領域と第2の切り出し領域とが一部重複すると判定された場合には、前記物体検出部は、前記第2の切り出し領域に対応づけて検出された物体とは異なる第3の物体を前記第2のフレーム画像から検出し、
前記切り出し領域決定部は、前記第3の物体の検出位置が含まれるように前記第2の切り出し領域の位置を変更する、前記(10)に記載の画像処理装置。
(12)
前記動画像において監視対象領域が予め設定されており、
前記複数の目標情報は、切り出し領域に対応する切り出し対象の物体と前記監視対象領域との間の距離の上限値である監視上限距離を含み、
前記第2のフレーム画像が、前記第1の物体と前記監視対象領域との間の距離が前記取得部により取得された監視上限距離を超えた際もしくは後のフレーム画像である場合には、前記物体検出部は、前記第2のフレーム画像から第2の物体を検出し、
前記切り出し領域決定部は、前記第2の物体の検出位置が含まれるように前記第2のフレーム画像の切り出し領域を決定する、前記(8)に記載の画像処理装置。
(13)
前記第2の物体は、前記第2のフレーム画像に含まれる複数の物体のうち前記監視対象領域の最も近くに位置する物体である、前記(12)に記載の画像処理装置。
(14)
前記複数の目標情報は、検出対象の物体の領域サイズ、検出対象の物体の移動速度、検出対象の物体の滞在時間、検出対象の物体の縦横比、または、検出対象の物体が前記動画像の領域外に移動するまでの予測時間を含む、前記(9)〜(13)のいずれか一項に記載の画像処理装置。
(15)
前記画像処理装置は、前記切り出し領域決定部により決定された前記切り出し領域を前記第2のフレーム画像から切り出すことにより切り出し画像を生成する切り出し画像生成部をさらに備える、前記(1)〜(14)のいずれか一項に記載の画像処理装置。
(16)
動画像に含まれる第1のフレーム画像から第1の物体を検出することと、
前記第1の物体の検出位置が含まれるように前記第1のフレーム画像の切り出し領域を決定することと、
前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、前記第2のフレーム画像の切り出し領域を決定することと
を備える、画像処理方法。
(17)
動画像に含まれる第1のフレーム画像から第1の物体を検出する物体検出部と、
前記第1の物体の検出位置が含まれるように前記第1のフレーム画像の切り出し領域を決定する切り出し領域決定部と、
前記切り出し領域決定部により決定された前記切り出し領域を前記第1のフレーム画像から切り出すことにより切り出し画像を生成する切り出し画像生成部と、
生成された前記切り出し画像を記憶する記憶部と、
を備え、
前記切り出し領域決定部は、前記第1のフレーム画像よりも後の第2のフレーム画像において、前記第1の物体が停止していると推測される時間の長さに基づいて、前記第2のフレーム画像の切り出し領域を決定する、画像処理システム。
【符号の説明】
【0089】
10 カメラ
20 ストレージ
22 監視端末
24 通信網
100 撮影部
102 映像縮小部
104 領域設定部
106 映像クロッピング部
108 通信部
120 物体検出部
122 クロッピング領域決定部
124 重なり判定部
220 制御部
222 通信部
224 表示部
226 入力部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11