特許第6028972号(P6028972)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人産業技術総合研究所の特許一覧

特許6028972画像処理装置、画像処理方法および画像処理プログラム
<>
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000005
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000006
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000007
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000008
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000009
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000010
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000011
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000012
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000013
  • 特許6028972-画像処理装置、画像処理方法および画像処理プログラム 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6028972
(24)【登録日】2016年10月28日
(45)【発行日】2016年11月24日
(54)【発明の名称】画像処理装置、画像処理方法および画像処理プログラム
(51)【国際特許分類】
   G06T 7/00 20060101AFI20161114BHJP
【FI】
   G06T7/00 200C
【請求項の数】9
【全頁数】15
(21)【出願番号】特願2012-221034(P2012-221034)
(22)【出願日】2012年10月3日
(65)【公開番号】特開2014-74977(P2014-74977A)
(43)【公開日】2014年4月24日
【審査請求日】2015年7月13日
【新規性喪失の例外の表示】特許法第30条第2項適用 画像ラボ、2012年4月号(Vol.23 No.4)、第8〜15頁に発表
(73)【特許権者】
【識別番号】301021533
【氏名又は名称】国立研究開発法人産業技術総合研究所
(72)【発明者】
【氏名】ペレラ ジェイ.エイチ.マノジ ヴィンセント
【審査官】 ▲広▼島 明芳
(56)【参考文献】
【文献】 特開2008−158984(JP,A)
【文献】 特開2005−063309(JP,A)
【文献】 特開2006−195525(JP,A)
【文献】 特開2005−190142(JP,A)
【文献】 特開2012−181710(JP,A)
【文献】 特開平06−207909(JP,A)
【文献】 特開2005−055744(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 − 7/60
(57)【特許請求の範囲】
【請求項1】
入力フレーム画像からオブジェクトが存在するオブジェクトウィンドウを検出するオブジェクト検出部と、
前記オブジェクト検出部で検出された複数の近傍のオブジェクトウィンドウをクラスタリングで統合することで、オブジェクト領域を設定するクラスタリング統合部と、
前記オブジェクト領域をオブジェクト候補領域とし、過去のフレーム画像のオブジェクト領域に基づいて予測される領域をオブジェクト予測領域とし、ウィンドウ幅の差異が所定範囲内であるオブジェクト候補領域であって、かつ前記オブジェクト予測領域から最短距離にあるオブジェクト候補領域について、前記過去のフレーム画像のオブジェクト領域と関連付けて登録すると共に、前記オブジェクト候補領域が、二以上のオブジェクト予測領域に関連付けられた場合には、オブジェクト候補領域から最短距離にあるオブジェクト予測領域に対応する前記過去のフレーム画像のオブジェクト領域にのみ関連付けて登録するオブジェクトトラッキング部と、を有する画像処理装置。
【請求項2】
前記オブジェクトトラッキング部は、複数のオブジェクト候補領域のうち、ウィンドウ幅の差異が所定範囲内であって、オブジェクト予測領域から所定の距離内にあるオブジェクト候補領域を関連オブジェクト候補領域として抽出し、関連オブジェクト候補領域のうち、オブジェクト予測領域から最短距離にある関連オブジェクト候補領域について、前記過去のフレーム画像のオブジェクト領域と関連付けて登録することを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記オブジェクトトラッキング部は、前記過去のフレーム画像のオブジェクト領域に付与されている識別子と同一の識別子をオブジェクト候補領域に付与することで関連付けて登録することを特徴とする請求項1又は2記載の画像処理装置。
【請求項4】
前記オブジェクトトラッキング部は、二フレーム前のフレーム画像の第一のオブジェクト領域と、前記第一のオブジェクト領域と関連付けられた一フレーム前のフレーム画像における第二のオブジェクト領域における座標の変化量に基づいて前記入力フレーム画像におけるオブジェクト予測領域を決定することを特徴とする請求項1〜3のいずれか1つに記載の画像処理装置。
【請求項5】
前記オブジェクトトラッキング部は、二フレーム前のフレーム画像に関連付けられたオブジェクト領域がない場合には、一フレーム前のフレーム画像におけるオブジェクト領域の座標から所定量変化させることで、入力フレーム画像におけるオブジェクト予測領域を決定することを特徴とする請求項記載の画像処理装置。
【請求項6】
前記オブジェクト検出部は、前記入力フレーム画像にウィンドウを設け、ウィンドウ内を所定領域を有するブロックでオーバーラップスキャンすることで、ウィンドウの特徴量を算出し、算出した特徴量に基づいてオブジェクトウィンドウを検出することを特徴とする請求項1〜5のいずれか1つに記載の画像処理装置。
【請求項7】
前記オブジェクト検出部は、オーバーラップスキャンする場合に、スキャンレイヤごとに、オーバーラップ領域の特徴量は一度算出した特徴量を再利用することで、ウィンドウの特徴量を算出することを特徴とする請求項記載の画像処理装置。
【請求項8】
入力フレーム画像からオブジェクトが存在するオブジェクトウィンドウを検出するステップ、
検出された複数の近傍のオブジェクトウィンドウをクラスタリングで統合することで、オブジェクト領域を設定するステップ、
前記オブジェクト領域をオブジェクト候補領域とし、過去のフレーム画像のオブジェクト領域に基づいて予測される領域をオブジェクト予測領域とし、ウィンドウ幅の差異が所定範囲内であるオブジェクト候補領域であって、かつ前記オブジェクト予測領域から最短距離にあるオブジェクト候補領域について、前記過去のフレーム画像のオブジェクト領域と関連付けて登録すると共に、前記オブジェクト候補領域が、二以上のオブジェクト予測領域に関連付けられた場合には、オブジェクト候補領域から最短距離にあるオブジェクト予測領域に対応する前記過去のフレーム画像のオブジェクト領域にのみ関連付けて登録するステップを有する画像処理方法。
【請求項9】
コンピュータに、
入力フレーム画像からオブジェクトが存在するオブジェクトウィンドウを検出するステップ、
検出された複数の近傍のオブジェクトウィンドウをクラスタリングで統合することで、オブジェクト領域を設定するステップ、
前記オブジェクト領域をオブジェクト候補領域とし、過去のフレーム画像のオブジェクト領域に基づいて予測される領域をオブジェクト予測領域とし、ウィンドウ幅の差異が所定範囲内であるオブジェクト候補領域であって、かつ前記オブジェクト予測領域から最短距離にあるオブジェクト候補領域について、前記過去のフレーム画像のオブジェクト領域と関連付けて登録すると共に、前記オブジェクト候補領域が、二以上のオブジェクト予測領域に関連付けられた場合には、オブジェクト候補領域から最短距離にあるオブジェクト予測領域に対応する前記過去のフレーム画像のオブジェクト領域にのみ関連付けて登録するステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、人物や物体等のオブジェクトの検出と追跡を行なう画像処理装置及びそのプログラムに関し、高速に検出を行い、少ない特徴量でオブジェクトの追跡を確実に行えるようにすることで、オブジェクトの検出と追跡がリアルタイムで行うことを可能にしたものである。
【背景技術】
【0002】
定点カメラで来場者映像を撮影し、人物を検出して追跡するシステムは、来場者の人数を計測し、年齢や性別を調査するために検討されてきている。
【0003】
撮影したオブジェクト、特に人物検出の手法としては、HOG(Histograms of oriented Gradients)と呼ばれる輝度勾配ヒストグラムを特徴量とした識別手法が広く用いられている。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】N.Dalal and B.Triggs: “Histgrams of Oriented Gradients for Human Detection”, IEEE Computer Society Conference on ComputerVision and Pattern Recognition, vol.1, pp.886-893(2005)
【非特許文献2】X. Wang, T.X. Han and S. Yan: “An HOG-LBP Human Detector with Partial Occlusion Handling”, IEEE 12th International Conference on ComputerVision, pp.32-39(2009)
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記のHOG特徴量を用いた人物検出においては、精度高く人物検出が行える一方、計算に時間がかかるという問題があった。また、人物の追跡(トラッキング)においては、プライバシーへの配慮から各クレーム画像を高速にリアルタイムに処理を行って画像を捨てる必要があるため、人物のトラッキングを行う場合に適用することは困難であった。また、人物の追跡についても高速に行う必要がある。
【0006】
本発明は、人物や物体等のオブジェクト検出及び追跡を高速に行え、検出精度を向上させた画像処理装置に関する。
【課題を解決するための手段】
【0007】
本発明の画像処理装置は、入力フレーム画像からオブジェクトが存在するオブジェクトウィンドウを検出するオブジェクト検出部と、オブジェクト検出部で検出された複数の近傍のオブジェクトウィンドウをクラスタリングで統合することで、オブジェクト領域を設定するクラスタリング統合部と、オブジェクト領域をオブジェクト候補領域とし、過去のフレーム画像のオブジェクト領域に基づいて予測される領域をオブジェクト予測領域とし、ウィンドウ幅の差異が所定範囲内であるオブジェクト候補領域であって、かつ前記オブジェクト予測領域から最短距離にあるオブジェクト候補領域について、前記過去のフレーム画像のオブジェクト領域と関連付けて登録するオブジェクトトラッキング部と、を有する画像処理装置を提供する。
【0008】
上記画像処理装置において、オブジェクトトラッキング部は、複数のオブジェクト候補領域のうち、ウィンドウ幅の差異が所定範囲内であって、オブジェクト予測領域から所定の距離内にあるオブジェクト候補領域を関連オブジェクト候補領域として抽出し、関連オブジェクト候補領域のうち、オブジェクト予測領域から最短距離にある関連オブジェクト候補領域について、前記過去のフレーム画像のオブジェクト領域と関連付けて登録するようにしてもよい。
【0009】
上記画像処理装置において、オブジェクトトラッキング部は、オブジェクト候補領域が、二以上のオブジェクト予測領域に関連付けられた場合、オブジェクト候補領域から最短距離にあるオブジェクト予測領域に対応する過去のフレーム画像のオブジェクト領域にのみ関連付けて登録するようにしてもよい。
【0010】
また、上記画像処理装置において、オブジェクトトラッキング部は、過去のフレーム画像のオブジェクト領域に付与されている識別子と同一の識別子をオブジェクト候補領域に付与することで関連付けて登録するようにしてもよい。
【0011】
上記画像処理装置において、オブジェクトトラッキング部は、二フレーム前のフレーム画像の第一のオブジェクト領域と、第一のオブジェクト領域と関連付けられた一フレーム前のフレーム画像における第二のオブジェクト領域における座標の変化量に基づいて入力フレーム画像におけるオブジェクト予測領域を決定してもよい。
【0012】
上記画像処理装置において、オブジェクトトラッキング部は、二フレーム前のフレーム画像に関連付けられたオブジェクト領域がない場合には、一フレーム前のフレーム画像におけるオブジェクト領域の座標から所定量変化させることで、入力フレーム画像におけるオブジェクト予測領域を決定してもよい。
【0013】
上記画像処理装置において、オブジェクト検出部は、入力フレーム画像にウィンドウを設け、ウィンドウ内を所定領域を有するブロックでオーバーラップスキャンすることで、ウィンドウの特徴量を算出し、算出した特徴量に基づいてオブジェクトウィンドウを検出してもよい。
【0014】
上記画像処理装置において、オブジェクト検出部は、オーバーラップスキャンする場合に、スキャンレイヤごとに、オーバーラップ領域の特徴量は一度算出した特徴量を再利用することで、ウィンドウの特徴量を算出してもよい。
【0015】
本発明は、入力フレーム画像からオブジェクトが存在するオブジェクトウィンドウを検出するステップ、検出された複数の近傍のオブジェクトウィンドウをクラスタリングで統合することで、オブジェクト領域を設定するステップ、オブジェクト領域をオブジェクト候補領域とし、過去のフレーム画像のオブジェクト領域に基づいて予測される領域をオブジェクト予測領域とし、ウィンドウ幅の差異が所定範囲内であるオブジェクト候補領域であって、かつ前記オブジェクト予測領域から最短距離にあるオブジェクト候補領域について、過去のフレーム画像のオブジェクト領域と関連付けて登録すると共に、オブジェクト候補領域が、二以上のオブジェクト予測領域に関連付けられた場合には、オブジェクト候補領域から最短距離にあるオブジェクト予測領域に対応する上記過去のフレーム画像のオブジェクト領域にのみ関連付けて登録するステップを有する画像処理方法を提供する。
【0016】
また、本発明は、コンピュータに、入力フレーム画像からオブジェクトが存在するオブジェクトウィンドウを検出するステップ、検出された複数の近傍のオブジェクトウィンドウをクラスタリングで統合することで、オブジェクト領域を設定するステップ、 前記オブジェクト領域をオブジェクト候補領域とし、過去のフレーム画像のオブジェクト領域に基づいて予測される領域をオブジェクト予測領域とし、ウィンドウ幅の差異が所定範囲内であるオブジェクト候補領域であって、かつオブジェクト予測領域から最短距離にあるオブジェクト候補領域について、過去のフレーム画像のオブジェクト領域と関連付けて登録すると共に、オブジェクト候補領域が、二以上のオブジェクト予測領域に関連付けられた場合には、オブジェクト候補領域から最短距離にあるオブジェクト予測領域に対応する上記過去のフレーム画像のオブジェクト領域にのみ関連付けて登録するステップと、を実行させるプログラムを提供する。
【発明の効果】
【0017】
本発明によれば、入力フレーム画像において、過去フレーム画像に基づいてオブジェクト予測領域を設定し、オブジェクト検出部においてオブジェクトが存在するとして検出されたオブジェクト候補領域であって、所定条件を満たしかつ最短距離にあるオブジェクト候補領域を過去フレーム画像のオブジェクト領域と関連付けて登録することができるため、同一人物をフレーム画像間でトラッキングすることが可能となる。
【0018】
また、トラッキング処理において、ヒストグラムや色情報などの比較を行うことなく、トラッキングを行うため、リアルタイムでトラッキング処理を行うことができる。さらに、オブジェクト候補領域は、輝度等の特徴量に基づいて検出されているため、少ないパラメータであっても精度高くトラッキングを行うことができる。
【0019】
さらに、オブジェクト検出部において、入力フレーム画像にウィンドウを設け、ウィンドウ内の所定領域を有するブロックでオーバーラップスキャンし、オーバーラップスキャンするときに、スキャンレイヤごとに、一度算出した特徴量を再利用することで高速にオブジェクト検出を行うことができる。
【図面の簡単な説明】
【0020】
図1】本発明にかかる一つの実施形態における画像処理装置のブロック図の一例である。
図2】本発明の画像処理装置のハードウェア構成図の一例である。
図3】本発明の画像処理装置において、オブジェクト検出部12が入力フレーム画像からオブジェクトを検出する場合のフローチャートの一例である。
図4】スキャンテーブル記憶部11に記憶されているスキャンテーブルの一例である。
図5】セルとブロックの関係を示す概念図である。
図6】ウィンドウとブロックの関係を示す概念図である。
図7】本発明の画像処理装置においてオブジェクトトラッキング部14がフレーム画像間で同一のオブジェクト領域を対応づける場合の処理の一例である。
図8】フレーム画像間におけるオブジェクト領域の関連付けのイメージ図である。
図9図7のステップ703におけるオブジェクト予測領域とオブジェクト候補領域の関係を示す図である。
図10】本発明の画像処理装置においてオブジェクト検出を行った場合の実験結果を示すテーブルである。
【発明を実施するための形態】
【0021】
この発明を画像内に撮影されている人物の上半身領域を検出し、人物のトラッキングに適用した実施の形態を以下に説明する。この実施の形態では、カメラが所定の位置に設置され、撮影場所を通過する人物を撮影している。撮影された画像から人物を検出し、フレーム画像間でトラッキングを行うことで、一人の人物を動画像において追跡を行う。但し、ここでは人物の上半身領域であるが、検出するオブジェクトは人物の上半身に限らず、他の人物の一部分、目や鼻などであってもよく、また、車や車のナンバープレートなど、物体や物体の一部であってもよい。
【0022】
図1は、本発明にかかる一つの実施形態における画像処理装置のブロック図の一例である。画像処理装置100は、画像記憶部10、スキャンテーブル記憶部11、オブジェクト検出部12、クラスタリング都合部13、オブジェクトトラッキング部14と、を有する。画像記憶部10は、ネットワークや有線ケーブル等を介して接続されるカメラから入力される画像を記憶する。カメラは、動画像を撮像しており、画像処理装置100には、動画像の時系列データである画像データが、例えば、通信インターフェースを介して、順次入力される。入力される各々の画像データはフレーム画像である。入力されたフレーム画像は、画像記憶部10に順次、一時的又は長期間記憶される。
【0023】
スキャンテーブル記憶部11は、フレーム画像をスキャンする際のウィンドウサイズやスキャンストライドの値、ウィンドウの数などを記憶しているテーブルである。フレーム画像からオブジェクト検出処理を行う際に、画像にウィンドウを設定し、ウィンドウ内をオーバーラップさせながらスキャンすることで当該ウィンドウ内の特徴量を算出している。ウィンドウサイズは様々なものが設定可能であり、ウィンドウサイズによってスキャンストライド値や画像データ全体をスキャンするために必要なウィンドウ数が変化するため、ウィンドウサイズに対応づけてテーブルとして記憶しており、オブジェクト検出部12は、スキャンテーブル記憶部11からスキャンテーブルを読み出して、所定のウィンドウサイズでスキャンを行う。
【0024】
オブジェクト検出部12は、画像記憶部10に記憶されたフレーム画像を順次読み出して、入力フレーム画像からオブジェクトが存在するオブジェクトウィンドウの検出処理を行う。例えば、オブジェクト検出部12は、スキャンテーブル記憶部11からスキャンテーブルを読み出して、予め決められたスキャンレイヤのウィンドウサイズで、入力フレーム画像全体において探索する。一例として、定められたウィンドウサイズを有するウィンドウ内で所定のスキャンストライド値でオーバーラップスキャンを行うことで、ウィンドウ内の輝度勾配方向ヒストグラムを生成し、HOG特徴量を算出する。
【0025】
例えば、人物の上半身をオブジェクトとして検出する場合、オブジェクト検出部12は、サポート・ベクター・マシン(SVM)などを用いて、輝度勾配方向ヒストグラムの特徴量(HOG特徴量)を予め学習しておき、SVM識別器を得ておく。そして、入力フレーム画像から抽出されたHOG特徴量が人物の上半身かどうかを、SVM識別器によって評価することで、人物の上半身の領域であるオブジェクトウィンドウを検出する。つまりSVM識別器によって、人物の上半身である特徴量を有するウィンドウを、オブジェクトウィンドウとして検出する。
【0026】
また、オブジェクト検出部12は、様々なウィンドウサイズを有するウィンドウで入力フレーム画像内を逐次スキャンを行って、上半身が撮影されている領域であるオブジェクト領域を検出する。
【0027】
クラスタリング統合部13は、オブジェクト検出部12で検出されたウィンドウであるオブジェクトウィンドウをクラスタリングによって統合する。つまり、様々なウィンドウで入力フレーム画像をスキャンすると、一つの上半身に対して複数の近傍のオブジェクトウィンドウが存在することになる。言い換えれば、複数の位置が異なったウィンドウやサイズが異なったウィンドウが重なりあってオブジェクトウィンドウとして検出される。そこで、これら複数のオブジェクトウィンドウを、例えばMeanshiftクラスタリングを用いて一つのオブジェクト領域として統合して、設定する。
【0028】
クラスタリング統合部13は、例えばMeanshiftクラスタリングを用いる場合、識別されたオブジェクトウィンドウの位置(xi、yi)とスケールscaleiの三次元でのクラスタリング統合を下記式のガウシアン・カーネル関数を用いて、その累積値から位置とスケールのシフト値を算出し、それぞれのシフト値から位置とスケールを修正更新することで収束させ、一つのオブジェクト領域としている。
【数1】
ここにいうbandwidth_positionとbandwidth_scaleは、位置とスケールにおけるそれぞれのクラスタリング探索領域として設定するパラメータである。
【0029】
オブジェクトトラッキング部14は、入力フレーム画像におけるオブジェクト領域をオブジェクト候補領域とし、過去フレーム画像でのオブジェクト領域に基づいて入力フレーム画像においてオブジェクトが存在すると予測される領域をオブジェクト予測領域として、所定条件を満たすオブジェクト候補領域をオブジェクト予測領域に対応する過去フレーム画像のオブジェクト領域に関連付けて登録することで、オブジェクトのトラッキングを行い、その結果を出力する。過去フレーム画像とは、例えば、入力フレーム画像の一フレーム前の画像である。
【0030】
例えば、オブジェクトトラッキング部14は、ウィンドウ幅の差異が所定の範囲内であるオブジェクト候補領域であって、他のオブジェクト候補領域とも比較してオブジェクト予測領域から最短距離であるオブジェクト候補領域を、過去フレーム画像のオブジェクト領域に関連付けて登録する。また、例えば、オブジェクトトラッキング部14は、関連付けて登録する場合に、過去フレーム画像のオブジェクト領域に付与されていた識別子(人物ID)と同じ識別子をオブジェクト候補領域へ付与する。トラッキング方法の詳細については後述する。
【0031】
図2は、本発明の実施の形態に係る画像処理装置100のハードウェア構成の一例を示すブロック図である。図2において、画像処理装置100を構成するコンピュータは、従前から存在する汎用的なハードウェア構成で実現できる。すなわち、画像処理装置100を形成するコンピュータは、図2に示したようにCPU101、ROM102、RAM103、外部記憶装置104、通信インターフェース105、入出力インターフェース106と接続されたマウス107とキーボード108、及び表示装置として設けられたディスプレイ109を、バスに接続して構成される。
【0032】
画像処理装置100は、一つの態様では、ハードウェア資源とソフトウェアの協働で実現される。具体的には、画像処理装置100の各種機能は、ROM102や外部記憶装置104等の記録媒体に記録されたプログラムがCPU101によって実行されることで実現される。また、画像処理装置100は、物理的に一つの装置により実現されてもよく、複数の装置により実現されていてもよい。
【0033】
図3は、本発明の画像処理装置において、オブジェクト検出部12が入力フレーム画像からオブジェクトを検出する場合のフローチャートの一例である。オブジェクト検出部12は、画像記憶部10から入力されるフレーム画像を受け付ける(ステップ301)。オブジェクト検出部12は、入力を受け付けたフレーム画像におけるオブジェクトが存在するオブジェクトウィンドウの検出処理を開始する。
【0034】
オブジェクト検出部12は、スキャンテーブル記憶部11からスキャンテーブルを読み出し、入力フレーム画像をスキャンする際のウィンドウサイズを決定する(ステップ302)。ウィンドウサイズは、例えば、予め決定されたスキャンレイヤに基づいて決められている。スキャンテーブルに記憶されたスキャンレイヤのうち一又は二のスキャンレイヤのウィンドウサイズで入力フレーム画像のスキャンを行ってもよい。また、スキャンテーブル記憶部11に記憶されているスキャンレイヤ全てのスキャン処理を行ってもよい。
【0035】
次に、オブジェクト検出部12は、決定したウィンドウサイズに基づいて、入力フレーム画像における算出ウィンドウを設定する(ステップ303)。入力フレーム画像全体をスキャンするために必要なウィンドウ数は、ウィンドウサイズによって異なるが、所定のウィンドウサイズに基づいて入力フレーム画像において特徴量を算出するウィンドウの位置を設定する。算出ウィンドウの位置は、ウィンドウサイズと該ウィンドウサイズにおける何番目のスキャンウィンドウかによって決定される。
【0036】
オブジェクト検出部12は、算出対象として設定されたウィンドウ内のブロックでの輝度勾配ヒストグラムを生成する(ステップ304)。ここでは、例えば、上半身であるオブジェクトを検出するためにHOG特徴量を用いる。そのためには、入力フレーム画像内の各画素における近傍4画素から水平垂直方向の輝度勾配をもとめ、輝度勾配強度と方向を算出する。そして各画素に対する輝度勾配強度を輝度勾配方向によって、0度から180度までの20度ごとのビンイメージ数9に割り振る。各ビンイメージをカーネルを利用しながらフィルタする。こちらでは大きさが7×7のカーネルを使っても良い。そして各ビンイメージに関するインテグラルイメージを生成する。一例として、ブロックに対する各セル内の輝度勾配強度累積をヒストグラムとし、ブロック内のセル4個分の輝度勾配方向ヒストグラムを連結し、ブロックごとにノーマライズすることで36次元のブロック内輝度勾配方向ヒストグラムを生成する。なお、スキャンとは、画像の各画素の特徴量を解析することを意味する。
【0037】
さらに、オブジェクト検出部12は、ウィンドウ内をブロックでオーバーラップスキャンする(ステップ305)。スキャンテーブルに記憶されているスキャンレイヤ、セル幅に基づいてオーバーラップスキャンを行う。つまり、ウィンドウ内を定められたセル幅ずつ位置をずらしながらブロック内の輝度勾配ヒストグラムを順次作成していく。つまり、ウィンドウ内を水平方向に7回、垂直方向に7回の計49回のスキャンを行う。この際、オブジェクト検出部12は、オーバーラップ領域の特徴量については、前のブロックをスキャンした際に算出した特徴量を用いる。算出結果を再利用することでオブジェクト検出処理を高速化するためである。
【0038】
そして、オブジェクト検出部12は、算出ウィンドウ内の特徴量を算出する(ステップ306)。一例として、オブジェクト検出部12は、算出ウィンドウ内を49回のスキャンを行うことで、ウィンドウ内において1764次元のHOG特徴量を得る。
【0039】
オブジェクト検出部12は、算出ウィンドウにおける特徴量をSVMで識別する(ステップ307)。ここでは識別器としてサポート・ベクター・マシン(SVM)を用いているが、識別器としてはこれに限らない。予め上半身が含まれている画像と上半身が含まれていない画像とでHOG特徴量を学習しておき、SVM識別器を得ておく。オブジェクト検出部12は、SVM識別器を用いて、人物の上半身である特徴量を有するウィンドウをオブジェクトウィンドウとして検出する。算出ウィンドウがオブジェクトウィンドウであると判定された場合、クラスタリング統合部13への処理へうつる。
【0040】
オブジェクト検出部12は、所定のスキャンレイヤにおける全てのウィンドウで特徴量の算出を行ったか、判定を行う(ステップ308)。全てのウィンドウでの特徴量算出が終わっていない場合、次の算出ウィンドウを設定する(ステップ303)。そして、同様に特徴量の算出を行う。全てのウィンドウでの特徴量算出が終わった場合、オブジェクト検出部12は、そのスキャンレイヤにおけるオブジェクト検出処理を終了する。
【0041】
なお、上記では、一つのスキャンレイヤにおけるオブジェクト検出処理を説明したが、スキャンテーブルに記憶されている全てのスキャンレイヤを行う場合、また2以上のスキャンレイヤの処理を行う場合、図3において説明したフローを所定回数分同様に行う。スキャンレイヤを変えるとウィンドウサイズが変化する。従って、画像に映っている人物の大きさが様々である場合、複数のスキャンレイヤでオブジェクト検出処理を行うことが望ましい。
【0042】
図4は、スキャンテーブル記憶部11に記憶されているスキャンテーブルの一例である。本スキャンテーブルは、入力画像の解像度が640×480画素である場合の一例である。ウィンドウサイズごとにスキャンレイヤの番号が付与されており、スキャンレイヤに対応づけて、ウィンドウサイズ、セルサイズ、スキャンストライド値、ウィンドウ数が記憶されている。ウィンドウサイズは、入力画像のなかでオブジェクトを検出する際に設定するウィンドウである。ここではウィンドウサイズは、ピクセル数で表されている。セルサイズは、上述したようにウィンドウ内において設定されるセルのサイズである。スキャンストライド値は、画像全体をスキャンするためにウィンドウをずらす、画素距離の値である。ウィンドウ数は、画像全体をスキャンするために必要なウィンドウの数をしめしている。オブジェクト検出部12は、スキャンテーブル記憶部11に記憶されているスキャンテーブルを参照しながら、入力フレーム画像のスキャンを行う。
【0043】
図5は、セルとブロックの関係を示す概念図である。図3のステップ304において、オブジェクト検出部12はウィンドウ内にブロックを設け、輝度勾配ヒストグラムを生成している。この際に、ブロックの中にセルを設けている。それぞれのセルにおいて水平・垂直方向の輝度勾配をもとめ、セル1、セル2、セル3、セル4の順に連結することで36次元のブロック内輝度勾配方向ヒストグラムを生成している。
【0044】
図6は、ウィンドウとブロックの関係を示す概念図である。一例では、ウィンドウを水平・垂直方向に4等分した各々の領域をブロックとし、さらに水平・垂直方向にそれぞれ2等分した4個の領域をセルとしている。セル幅ずつずらしてオーバーラップスキャンさせるため、点線のブロック領域が次に輝度勾配を求めるブロックとなる。このように、ブロックをオーバーラップスキャンさせた場合、次のブロックのスキャンにおいて、前のブロックと、2つのセルがオーバーラップ(重複)することとなる。このため、オブジェクト検出部12は、2つのセルの特徴量の算出においては、前のブロックの輝度勾配を算出した際のセルの特徴量をそのまま再利用する。ここでは、最初に垂直方向にスキャンをし、次に水平方向にスキャンすることとしている。しかし、これに限らず、水平方向に最初にスキャンをして次に垂直方向にスキャンしてもよい。
【0045】
図7は、本発明の画像処理装置においてオブジェクトトラッキング部14がフレーム画像間で同一のオブジェクト領域を対応づける場合の処理の一例である。オブジェクトトラッキング部14は、入力フレーム画像においてクラスタリング統合部13でオブジェクト領域として設定された領域をオブジェクト候補領域として設定する(ステップ701)。
【0046】
次に、オブジェクトトラッキング部14は、過去フレーム画像におけるオブジェクト領域に基づいて入力フレーム画像におけるオブジェクト予測領域を設定する(ステップ702)。例えば、オブジェクトトラッキング部14は、画像記憶部10に記憶されている入力フレーム画像から二フレーム前のフレーム画像や一フレーム前のフレーム画像など、過去のフレーム画像を読み出す。そして、二フレーム前のフレーム画像におけるオブジェクト領域と、一フレーム前のフレーム画像におけるオブジェクト領域であって、二フレーム前のフレーム画像におけるオブジェクト領域と関連付けられたオブジェクト領域との間での座標の変化量を計算する。そして、オブジェクトトラッキング部14は、一フレーム前のフレーム画像におけるオブジェクト領域の座標と、算出した座標の変化量に基づいて入力フレーム画像におけるオブジェクト予測領域を算出し、設定する。他の一例として、所定の変化量を設定しておき、一フレーム前にフレーム画像におけるオブジェクト領域に基づいて、入力フレーム画像におけるオブジェクト予測領域を算出してもよい。この場合、人間の歩く速度など、オブジェクト対象の動く速度に基づいて、座標変化量を予め設定しておくことで、二フレーム前にオブジェクトが映っていない場合であっても、オブジェクト予測領域を設定することが可能となる。また、他の一例として、過去のフレーム画像として一フレーム前のフレーム画像ではなく、数フレーム前のフレーム画像を用いて数フレーム前のフレーム画像のオブジェクト領域と所定の座標変化量に基づいてオブジェクト予測領域を設定してもよい。つまり、過去のフレーム画像は、一フレーム前のフレーム画像に限らない。
【0047】
オブジェクトトラッキング部14は、オブジェクト予測領域からの距離、ウィンドウ幅の差異が所定範囲内のオブジェクト候補領域を抽出する(ステップ703)。具体的には、オブジェクト予測領域であるウィンドウの四角形の左上端の座標をP(a(x1),a(y1))としオブジェクト予測領域のウィンドウ幅をWaとし、オブジェクト候補領域のウィンドウの四角形の左上端の座標をP(b(x1),b(y1))としオブジェクト候補領域のウィンドウ幅をWbとした場合、オブジェクトトラッキング部14は、下記の4つの条件を満たすウィンドウ候補領域を抽出する。
【数2】
ここで、Tは、所定の閾値である。
【0048】
上記式の(2)及び(4)は、オブジェクト候補領域のうち、座標値の差異が所定の閾値の範囲内であるオブジェクト領域、つまりオブジェクト予測領域からオブジェクト候補領域まで所定の距離の範囲内にあるオブジェクト候補領域を抽出しようとするものである。また、(3)及び(5)は、オブジェクト候補領域のうち、オブジェクト予測領域のウィンドウ幅との差異が所定の範囲内であるオブジェクト候補領域を抽出しようとするものである。ここで、オブジェクトトラッキング部14は、これら4つの条件を満たすウィンドウ候補領域を抽出し、抽出したオブジェクト領域を関連オブジェクト候補領域とする。
【0049】
なお、閾値であるTは任意の値に設定可能であるが、一例として下記式に基づいてTを定めてもよい。βは、任意の変数である。
【数3】
【0050】
次に、オブジェクトトラッキング部14は、抽出したオブジェクト候補領域、つまり関連オブジェクト候補領域のなかから最短距離であるオブジェクト候補領域を抽出する(ステップ704)。所定条件を満たす関連オブジェクト候補領域のなかでオブジェクト予測領域と最も近い座標値、つまり最短距離を有するオブジェクト候補領域を抽出する。
【0051】
さらに、オブジェクトトラッキング部14は、抽出したオブジェクト候補領域が他のオブジェクト予測領域に関連付けられているか、チェックを行う(ステップ705)。抽出したオブジェクト候補領域が既に他のオブジェクト予測領域に関連づけられている場合があるからである。なお、このチェックは、「オブジェクト予測領域」と関連づけられているかとしているか、「オブジェクト予測領域に対応する過去フレーム画像(例えば一フレーム前のフレーム画像)のオブジェクト領域」と置き換えてもよい。抽出したオブジェクト候補領域が他にも関連付けられている場合(ステップ705でYes)、複数のオブジェクト予測領域のうち、抽出したオブジェクト候補領域から最短距離であるオブジェクト予測領域にのみ関連付け、最短ではないオブジェクト予測領域との関連付けを破棄する(ステップ706)。
【0052】
次に破棄されたオブジェクト予測領域について、そのオブジェクト予測領域について抽出されている関連オブジェクト候補領域のうち、残りのオブジェクト候補領域のなかで最短距離のオブジェクト候補領域を抽出する(ステップ707)。破棄されたオブジェクト予測領域については、対応するオブジェクト候補領域がなくなってしまうため、再度算出をし直すのである。再度の抽出にあたっては、予め抽出していた関連オブジェクト候補領域のなかで、最短距離の関連オブジェクト候補領域を抽出することで行う。
【0053】
抽出したオブジェクト領域が他のオブジェクト予測領域に関連付けられていない場合(ステップ705でNo)、オブジェクト予測領域に対応付けられた人物IDを付与する(ステップ708)。つまり、オブジェクト予測領域に対応する過去のフレーム画像(例えば一フレーム前のフレーム画像)におけるオブジェクト領域に付与されている識別子である人物IDを付与する。同じ識別子を付与することで、フレーム間でのオブジェクトトラッキングが可能となる。付与された人物IDは、オブジェクト領域の近傍に表示部で表示されるようにしてもよい。
【0054】
図8は、フレーム画像間におけるオブジェクト領域の関連付けのイメージ図である。フレーム画像I1、I2、I3は時系列的に取得されたフレーム画像であり、例えば、I3を入力フレーム画像とすると、I1は二フレーム前のフレーム画像、I2は一フレーム前のフレーム画像である。それぞれに検出されたオブジェクト領域が存在しており、オブジェクトが人間などの動体である場合は、図8のように同じオブジェクトであったとしても、それぞれのフレーム画像での検出位置が異なる。そこで、これらのオブジェクトを関連付けるために、オブジェクトトラッキング部14は、図7で示したようなフローに従って、フレーム画像間のオブジェクトの関連付けを行って、オブジェクトトラッキングを実現している。
【0055】
図9は、図7のステップ703におけるオブジェクト予測領域とオブジェクト候補領域の関係を示す図である。Aがオブジェクト予測領域であるオブジェクトウィンドウであり、Bがオブジェクト候補領域のウィンドウの一例である。前述したようにオブジェクト予測領域の左上端の座標Pの位置及びウィンドウ幅Wの差異が閾値内であるかどうか4つの式に基づいて判定を行い、条件を満たすオブジェクト候補領域を抽出する。
【0056】
図10は、本発明の画像処理装置においてオブジェクト検出を行った場合の実験結果を示すテーブルである。それぞれのスキャンレイヤ及びウィンドウサイズにおける特徴量の計算にかかった時間を示している。本発明においては、オブジェクト検出において、オーバーラップスキャンを行ってウィンドウの特徴量を算出している。その際に、スキャンレイヤごとに、オーバーラップ領域の特徴量について過去の算出結果を再利用することで、オブジェクト検出処理の高速化を図っている。その結果、HOG特徴量のような計算数が多く、精度高く検出が行える特徴量を採用した場合であっても、図に示すようにきわめて短時間でオブジェクト検出を行うことが可能となる。そのため、フレーム画像が次々と入力される場合であっても、リアルタイムでオブジェクト検出を行うことができる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10