(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0018】
<画像監視装置の構成>
図1を参照して本発明の好適な実施形態の一例である画像監視装置1の構成を説明する。
【0019】
画像監視装置1は、複数の監視カメラ2−1,2−2,…,2−Nが画像通信網3を介して画像認識装置4に接続されてなる。
【0020】
各監視カメラ2−1,2−2,…,2−Nは、不審者の検知が要請された監視領域に設置され、予め設定された撮影周期で監視領域を撮影して監視領域の画像を画像通信網3に出力する。各監視カメラ2−1,2−2,…,2−Nが出力する画像は、後述する解像度変換処理によって不審者の画像認識を妨げない範囲で撮影画像の一部を低解像度化した画像であり、以下、当該画像を認識用画像と称する。
【0021】
画像通信網3は、各監視カメラ2−1,2−2,…,2−Nから出力された認識用画像を画像認識装置4に伝送するネットワークである。画像通信網3は、例えば、各監視カメラ2−1,2−2,…,2−Nと画像認識装置4をイーサネットケーブル(イーサネットは登録商標)等にて接続したLAN(Local Area Network)とすることができる。或いは画像通信網3は、各監視カメラ2−1,2−2,…,2−Nと画像認識装置4を同軸ケーブルで接続したアナログ網とすることもできる。
【0022】
画像認識装置4は、各監視カメラ2−1,2−2,…,2−Nから認識用画像を受信すると当該画像を画像処理して監視領域に存在する人物を認識する。さらに、画像認識装置4は、当該人物が不審者であるか否かを判定し、不審者が存在すると判定した場合に監視センターへ所定の異常信号を出力する。
【0023】
〔監視カメラの構成〕
以下、監視カメラ2−1の構成について説明する。
【0024】
監視カメラ2−1は、高解像撮影部20、撮影画像記憶部21、エッジレベル推定部22、解像度変換部23、認識用画像記憶部24、画像出力部25を備える。
【0025】
高解像撮影部20は、予め設定された撮影周期で監視領域を撮影して第一解像度の撮影画像を生成する。そのために高解像撮影部20は、受光量に応じた電気信号を出力するCCDセンサ又はC−MOSなどの光電変換素子アレイと、光電変換素子アレイ上に監視領域の像を結像するための結像光学系と、光電変換素子アレイが出力したアナログの電気信号をデジタルの撮影画像に変換するA/D変換回路を有する。
【0026】
高解像撮影部20が生成する撮影画像は、認識用画像よりも高解像度でデータ量が多い。第一解像度は例えば横8000×縦4500画素である。なお、本例において撮影画像は濃淡画像であるとする。
【0027】
高解像撮影部20は、撮影画像記憶部21に接続され、生成した撮影画像を順次、撮影画像記憶部21に記憶させる。
【0028】
撮影画像記憶部21は、撮影画像等を記憶するメモリ装置であり、RAM(Random Access Memory)等で構成される。撮影画像記憶部21は、高解像撮影部20及びエッジレベル推定部22に接続され、高解像撮影部20により書き込まれた撮影画像は、エッジレベル推定部22により順次読み出される。なお、撮影画像記憶部21は、現フレームの書き込みと前フレームの読み出しを同時に行えるよう、撮影画像2フレーム分の記憶容量を有する。
【0029】
エッジレベル推定部22は、撮影画像を複数のブロックに区分して各ブロックに含まれるエッジの強度を複数段階に分ける演算装置であり、DSP(Digital Signal Processor)又はMCU(Micro Control Unit)等で構成される。この段階(エッジレベル)は、例えば、2つの閾値を用いて、ブロック内に強いエッジが含まれる最高段階のレベル、ブロック内に弱いエッジが含まれる中間段階のレベル、ブロック内に強いエッジも弱いエッジも無い最低段階のレベルの3段階とすることができる。
【0030】
エッジレベル推定部22は、撮影画像記憶部21及び解像度変換部23に接続され、撮影画像記憶部21から撮影画像を読み出してエッジレベルを推定し、読み出した撮影画像(各画素の輝度値)及び各ブロックのエッジレベルを解像度変換部23に出力する。
【0031】
各ブロックの大きさは例えば12×12画素とすることができ、撮影画像は横666×縦375個のブロックに区分される。
【0032】
エッジレベル推定部22は、各ブロックを構成する画素間の輝度変化量を算出し、輝度変化量を予め定めた1又は複数の閾値と比較して各ブロックに含まれるエッジの強度を複数段階に分ける。具体的には、エッジレベル推定部22は、各ブロックにおける撮影画像のエッジ強度の平均値E1を当該ブロックの輝度変化量として算出し、E1が下限値T1L未満であれば当該ブロックは最低段階のエッジレベル、E1が下限値T1L以上且つ上限値T1H未満であれば当該ブロックは中間段階のエッジレベル、E1が上限値T1H以上であれば当該ブロックは最高段階のエッジレベルと判定する。
【0033】
上述したエッジレベルと輝度変化量の関係を
図2に示す。また、
図2を参照してエッジレベルとブロックの推定状態の関係を以下に説明する。
【0034】
下限値T1Lはエッジの有無を判定する閾値として事前の実験結果等に基づき予め設定することができる。すなわち、エッジレベルが最低段階のブロックは弱エッジすら無い平坦な領域であると推定される。そのため、この領域を低解像度化しても画像認識の精度は低下しにくく、且つこの領域の低解像度化によって認識用画像のデータ量を減らすことができる。
【0035】
また、上限値T1H(>T1L)は弱エッジと強エッジを弁別するしきい値として事前の実験結果等に基づき予め設定することができる。すなわち、エッジレベルが最高段階のブロックは強いエッジが存在する領域であると推定される。そのため、この領域を低解像度化しても認識対象物体のエッジが抽出できるため画像認識の精度は低下しにくく、且つこの領域の低解像度化によって認識用画像のデータ量を減らすことができる。
【0036】
一方、エッジレベルが中間段階のブロックは弱いエッジが存在する領域であると推定され、この領域を低解像度化すると認識対象物体のエッジが抽出不能となって画像認識の精度が低下するおそれがある。そのため、この領域を高解像度とすることで画像認識の精度向上が期待できる。
【0037】
解像度変換部23は、撮影画像の一部を低解像度の画像に置換して認識用画像を生成する演算装置であり、DSP又はMCU等で構成される。
【0038】
解像度変換部23は、エッジレベル推定部22及び認識用画像記憶部24に接続され、エッジレベル推定部22から撮影画像及び弱エッジ領域が入力されると、認識用画像を生成し、当該認識用画像を認識用画像記憶部24に記憶させる。
【0039】
再度、
図2を参照して、認識用画像の生成処理例を説明する。
【0040】
解像度変換部23は、撮影画像において少なくともエッジレベルが最低段階のレベル1であるブロックを、撮影画像の解像度である第一解像度R1よりも低い第二解像度R2の画像に置換する。例えば、解像度変換部23は、レベル1のブロックを、その輝度値に当該ブロックの代表輝度値を設定した1画素に置換して認識用画像を生成する。代表輝度値は撮影画像における当該ブロック内の平均輝度値とすることができる。或いは、代表輝度値は撮影画像における当該ブロック内の最頻輝度値としてもよく、又は撮影画像における当該ブロック内のブロック内のいずれか1画素の輝度値としてもよい。
【0041】
また、解像度変換部23は、撮影画像において少なくともエッジレベルが最高段階のレベル3であるブロックを第一解像度R1よりも低い第三解像度R3の画像に置換する。例えば、解像度変換部23は、レベル3のブロックを、その輝度値に当該ブロックの代表輝度値を設定した1画素に置換して認識用画像を生成する。ブロック内の輝度変化はレベル3の方がレベル1よりも大きいため、画像認識精度向上の観点からR3≧R2とするのが好適である。本例においてはR2が認識対象物体の強エッジを分析するのに十分な解像度であるとしてR3=R2とする。
【0042】
一方、エッジレベルが中間段階のレベル2であるブロックの解像度(第四解像度R4)は、第一解像度R1のままとし、解像度変換部23は、撮影画像における12×12画素の輝度値をそのまま認識用画像において対応する画素の輝度値に設定する。
なお、第四解像度R4は、第三解像度R3よりも高い範囲で第一解像度R1よりも低く設定してもよい。
【0043】
以上に示した解像度の関係をまとめると、R1≧R4>R3≧R2となる。
【0044】
認識用画像記憶部24は、認識用画像等を記憶するメモリ装置であり、RAM等で構成される。認識用画像記憶部24は、解像度変換部23及び画像出力部25と接続され、解像度変換部23により書き込まれた認識用画像は、画像出力部25により順次読み出される。なお、認識用画像記憶部24は、現フレームの書き込みと前フレームの読み出しを同時に行えるよう、認識用画像2フレーム分の記憶容量を有する。
【0045】
画像出力部25は、認識用画像をカメラ装置2−1から外部に出力する通信インターフェース回路である。画像出力部25は、認識用画像記憶部24及び画像通信網3に接続され、認識用画像記憶部24から認識用画像を読み出し、読み出した認識用画像を画像通信網3の通信プロトコルに適合した画像認識装置宛ての信号に変換して画像通信網3に送出する。
【0046】
なお、エッジレベル推定部22と解像度変換部23はひとつの演算装置で実現してもよい。また、撮影画像記憶部21と認識用画像記憶部24をひとつのメモリ装置で実現することもできる。
【0047】
監視カメラ2−2,…,2−Nの構成は、監視カメラ2−1と同様であるため説明を省略する。
【0048】
〔画像認識装置の構成〕
以下、画像認識装置4の構成について説明する。
【0049】
画像認識装置4は、画像入力部40、特徴抽出部41、不審者認識部(認識部)42及び異常出力部43を含んで構成される。
【0050】
画像入力部40は、認識用画像を受信する通信回路である。画像入力部40は、画像通信網3及び特徴抽出部41に接続され、画像通信網3を介して監視カメラ2−1,2−2,…,2−Nからの認識用画像を受信すると、当該認識用画像を特徴抽出部41に出力する。認証用画像のデータ量は撮影画像よりも格段に小さく、画像入力部40の通信負荷は低減されている。
【0051】
特徴抽出部41は、認識用画像から、不審者の画像認識に有用な所定特徴量を抽出する演算装置であり、CPU(Central Processing Unit)、DSP又はMCU等で構成される。特徴抽出部41は、画像入力部40及び不審者認識部42に接続され、画像入力部40から認識用画像が入力されると所定特徴量を抽出して不審者認識部42に出力する。
【0052】
特徴抽出部41が抽出する特徴量は、エッジ強度、エッジ方向、HOG(Histograms of Oriented Gradients)特徴量、ハールライク特徴量等のエッジ特徴量、及び輝度ヒストグラム等である。
【0053】
上述したように認識用画像には、高解像度領域と低解像度領域が含まれる。特徴抽出部41は、解像度ごとに認識用画像を分割し、分割画像のそれぞれに対して特徴量の抽出を行う。なお、
図4を参照して説明したように、認識用画像は各ブロックの画素数を示すデータと当該画素数分の輝度値データがブロック順に並んだデータ構成となっており、特徴抽出部41は、この画素数から各ブロックの解像度を判別し、画素数が示す数の輝度値を各ブロックに応じた座標に並べて、解像度ごとの分割画像を生成することができる。
【0054】
このように特徴抽出部41は解像度ごとに監視領域に存在する認識対象物体の特徴量を抽出することで、強いエッジ特徴量のみならず、色の類似した領域同士が接して弱くなってしまったエッジ特徴量を含めて認識対象物体の特徴量を確実に抽出できる。また、処理負荷の大きな高解像度領域からの抽出処理は画像認識精度確保に必要な分だけとなるので、特徴抽出部41の処理負荷の増加は適正に抑制される。
【0055】
不審者認識部42は、特徴抽出部41により抽出された特徴量を用いて不審者の存在を認識する演算装置であり、CPU、DSP又はMCU等で構成される。不審者認識部42は、特徴抽出部41及び異常出力部43に接続され、特徴抽出部41から特徴量が入力されると不審者が存在するか否かを判定し、不審者が存在すると判定した場合にその旨を表す所定信号を異常出力部43へ出力する。なお、特徴抽出部41と不審者認識部42はひとつの演算装置で実現してもよい。
【0056】
不審者認識部42は、例えば、認識用画像から抽出されたエッジ強度及びエッジ方向を予め設定された人の形状パターンと比較するパターンマッチング処理により人を検出し、検出した人物の輝度ヒストグラムを前後するフレームにて比較する追跡処理により当該人物の動きを解析して、動きが異常な人物を不審者と判定することができる。或いは、不審者認識部42は、認識用画像から抽出されたHOG特徴量を予め人のHOG特徴量を学習した識別器に入力することで人を検出し、追跡処理により当該人物の動き解析を行って不審者の存在を判定することもできる。
【0057】
このように不審者認識部(認識部)42は、解像度ごとに抽出された特徴量を用いて監視領域に存在する物体を認識することで、物体間及び物体と背景の間で色が類似することによるエッジ強度低下の影響を軽減して認識対象物体を高精度に認識できる。
【0058】
異常出力部43は、異常信号を外部に出力する通信回路等である。異常出力部43は、不審者認識部42及びセンター装置に接続され、不審者認識部42から不審者の存在を表す所定信号が入力されると、センター装置に所定の異常信号を送信する。
【0059】
<画像監視装置の動作>
以下、画像監視装置1の動作について説明する。
【0060】
〔監視カメラの動作〕
まず、
図3のフローチャート及び
図4の模式図を参照して監視カメラ2−1の動作を説明する。
【0061】
監視カメラ2−1において、以下に説明する
図3のステップS100〜S108の動作は高解像撮影部20の撮影周期にて繰り返し行われる。
【0062】
ステップS100にて、監視カメラ2−1の高解像撮影部20は監視領域を撮影し、第一解像度R1の撮影画像を監視カメラ2−1の撮影画像記憶部21に記憶させる。
【0063】
新たな撮影画像が撮影されると、監視カメラ2−1のエッジレベル推定部22は、ステップS101にて、上述した666×375個のブロックのうち先頭ブロックを注目ブロックに設定し、ブロックについてのループ処理を開始する。以降、ステップS102〜S107のループ処理は予め定めた順序にて順次注目ブロックを変更して全ブロックに対し行われる。
【0064】
ステップS102にて、エッジレベル推定部22は、注目ブロックにおける撮影画像のエッジ強度の平均値E1を算出する。
【0065】
そのためにエッジレベル推定部22は、撮影画像記憶部21に記憶されている撮影画像のうち注目ブロックと対応する12×12(=144)画素とその周囲画素を読み出し、注目ブロック内の各画素におけるエッジ強度を算出し、それらの平均値を求める。
【0066】
エッジ強度は、ソーベルフィルタ、ラプラシアンフィルタ、キャニーフィルタなど、公知の各種フィルタを用いて算出することができる。また、エッジ強度を算出する際のフィルタサイズは、カメラ設置高や認識対象物体までの距離、撮影画像の解像度などの条件に合わせて適宜に設定することができる。
【0067】
ステップS103にて、エッジレベル推定部22は、算出したエッジ強度の平均値E1を予め定めた下限値T1L及び上限値T1Hと比較して、注目ブロックのエッジレベルを判定する。
【0068】
すなわち、エッジレベル推定部22は、注目ブロックのエッジ強度の平均値E1が下限値T1L以上且つ上限値T1H未満であれば当該ブロックが弱エッジを含んだレベル2であると判定し(S103にてYES)、そうでなければ当該ブロックがエッジの無いレベル1又は強エッジからなるレベル3であると判定する(S103にてNO)。
【0069】
エッジレベル推定部22は、注目ブロックのエッジレベルとともに注目ブロックの座標及び注目ブロックを構成する撮影画像の各輝度値を監視カメラ2−1の解像度変換部23に出力する。
【0070】
注目ブロックがレベル2と判定された場合、処理はステップS104へと進む。ステップS104にて、解像度変換部23は、認識用画像において注目ブロックと対応するブロック内に撮影画像の各輝度値を設定することで、認識用画像における当該ブロックの解像度R4を解像度R1のままとし、高解像度を維持する。例えば、
図4において、撮影画像のブロック50のエッジレベルがレベル2と判定された場合、認識用画像の対応ブロック51は144画素のままとなる。解像度変換部23は、認識用画像記憶部24にブロック51の画素数に続いて左上画素から右下画素までの144個の輝度値を順番に並べた数値列52を記憶させる。
【0071】
他方、注目ブロックがレベル1又は3と判定された場合、処理はステップS105へと進む。ステップS105にて、解像度変換部23は、認識用画像において対応するブロックに撮影画像の代表輝度値を設定し、認識用画像における当該ブロックの解像度を解像度R2及びR3(R2=R3)に低解像化する。例えば、
図4において、撮影画像のブロック53のエッジレベルがレベル1又は3と判定された場合、認識用画像の対応ブロック54は1画素となる。解像度変換部23は、認識用画像記憶部24にブロック54の画素数に続いてブロック53の代表輝度値を並べた数値列55を記憶させる。
【0072】
注目ブロックの解像度変換が行われると、解像度変換部23は、S106にて全ブロックの処理が終了したか否かを確認する。全ブロックの処理が終了していなければ解像度変換部23はエッジレベル推定部22にその旨を通知し(S106にてNO)、これを受けたエッジレベル推定部22は、S107にて次ブロックを注目ブロックに設定し、処理をステップS102に戻して次ブロックに対する処理を行う。
【0073】
他方、全ブロックの処理が終了すると解像度変換部23は画像出力部25にその旨を通知し(S106にてYES)、これを受けた画像出力部25は、ステップS108にて認識用画像記憶部24から認識用画像を読み出し、読み出した認識用画像を画像通信網3経由で画像認識装置4に出力する。
【0074】
認識用画像を出力した画像出力部25はエッジレベル推定部22にその旨を通知し、これを受けたエッジレベル推定部22は、処理をステップS100に戻して次フレームの撮影画像に対する処理を行う。なお、画像出力部25による認識用画像の出力処理はエッジレベル推定部22及び解像度変換部23の処理と並列して行ってもよく、この場合、画像出力部25が読み出しの開始時点でエッジレベル推定部22に出力の通知をすればよい。
【0075】
図5及び
図6を参照して、撮影画像と認識用画像を例示する。
【0076】
図5の撮影画像60は白い壁61の前に白いシャツ62と黒いズボンを着用した人物が立っている監視領域を撮影したものである。
【0077】
図6は
図5の撮影画像60に対して監視カメラ2−1から出力される認識用画像70の高解像度領域71,72,73及び低解像度領域74を表したものである。
【0078】
認識用画像70において、壁61とシャツ62の境界付近、シャツ62内の構造線付近及びズボン内の構造線付近が中間段階のエッジレベル2と判定されて高解像度領域71,72,73となる。一方、壁61と窓の境界、壁61とズボンの境界、壁61と肌の境界など色が大きく異なり強いエッジが生じる領域は最高段階のエッジレベル3と判定され、エッジの無い領域は最低段階のエッジレベル1と判定され、これらの領域は低解像度領域74となる。
【0079】
高解像度領域71,72,73では、物体の境界画素において混色が生じにくくなるため(例えば、壁61とシャツ62の境界画素が、壁61の白とシャツ62の白の中間色となりにくくなるため)、画像認識装置4において色の類似した領域が接している物体の輪郭であっても認識可能となり、誤認識を防止できる。
【0080】
他方、低解像度領域74は、元々エッジが強い(太い)ため物体の境界画素において混色が生じても物体の輪郭が認識可能である、或いは元々エッジが無いため、低解像度化することで画像認識装置4における認識精度を低下させることなく、画像監視装置1における通信量及び画像認識装置4における処理量を減じることができる。
【0081】
監視カメラ2−2,…,2−Nの動作は、監視カメラ2−1と同様であるため説明を省略する。
【0082】
〔画像認識装置の動作〕
次に、
図7のフローチャートを参照して画像認識装置4の動作を説明する。
【0083】
画像認識装置4において、以下に説明する
図7のステップS200〜S207の動作は認識用画像を受信するたびに実行される。
【0084】
ステップS200にて、画像認識装置4の画像入力部40は、画像通信網3を介して認識用画像を受信する。監視カメラ2−1,2−2,…,2−Nのいずれかから認識用画像を受信すると、画像入力部40は当該画像を画像認識装置4の特徴抽出部41に出力し、処理はステップS201に進む。
【0085】
ステップS201にて、特徴抽出部41は、入力された認識用画像を解像度別に分割して分割画像を生成する。例えば、
図6に示した認識用画像が入力された場合、高解像度領域71,72,73のみに有効な輝度値を有する解像度R4(=R1)の分割画像と、低解像度領域74のみに有効な輝度値を有する解像度R2(=R3)の分割画像が生成される。
【0086】
ステップS202にて、特徴抽出部41は、各分割画像からエッジ特徴量を抽出し、抽出したエッジ特徴量を画像認識装置4の不審者認識部42に出力する。
【0087】
ステップS203にて、不審者認識部42は抽出したエッジ特徴量を用いて人検出処理を行う。すなわち、不審者認識部42は、まず互いに解像度が異なる分割画像から抽出されたエッジ特徴量をいずれかひとつの解像度に統一して合成エッジ画像を生成する。例えば、
図6に示した認識用画像が処理対象であれば、低い方の解像度R2に統一することができる。この場合、不審者認識部42は、高解像度領域71,72,73においてブロックごとにエッジ特徴量の平均値を求め、当該平均値を解像度R2の分割画像において対応する画素の値とすることで合成エッジ画像を生成すればよい。次に、不審者認識部42は、合成エッジ画像のエッジ特徴量を人の形状パターンと比較し、或いは当該エッジ特徴量を人の特徴を学習させた識別器に入力して、人の特徴を表すエッジ特徴量が含まれているかを判定する。
【0088】
人のエッジ特徴量が検出されなかった場合(ステップS204にてNO)、不審者認識部42は処理をステップS200に戻し、画像認識装置4は新たに認識用画像が受信されるまで待機する。他方、人のエッジ特徴量が検出された場合(ステップS204にてYES)、処理はステップS205に進められる。
【0089】
ステップS205にて、不審者認識部42は検出された人物の動きを解析する。すなわち、不審者認識部42は、特徴抽出部41に人が検出された領域における輝度ヒストグラムを抽出させ、当該輝度ヒストグラムを、送信元が同一の認識用画像から前回検出した人物の輝度ヒストグラムと比較することにより、当該人物の位置を追跡する。また、追跡のために、不審者認識部42は検出された人物の輝度ヒストグラムを、送信元を表す情報、当該人物の位置履歴とともに記憶部(不図示)に記憶させる。
【0090】
ステップS206にて、不審者認識部42は、動きを解析により得た人物の位置履歴から不審者が存在するか否かを判定する。例えば、不審者認識部42は、人物の位置履歴のいずれかが長時間の滞在、高速移動などを表しているときに当該人物を不審者と判定する。不審者が存在しないと判定した場合(ステップS206にてNO)、不審者認識部42は処理をステップS200に戻し、画像認識装置4は新たに認識用画像が受信されるまで待機する。他方、不審者が存在すると判定した場合(ステップS206にてYES)、処理はステップS207に進められる。
【0091】
ステップS207にて、不審者認識部42が存在する旨を画像認識装置4の異常出力部43に出力し、これを受けた異常出力部43は異常信号を生成して当該異常信号をセンター装置に送信する。
【0092】
以上の処理を終えると、不審者認識部42は処理をステップS200に戻し、画像認識装置4は新たに認識用画像が受信されるまで待機する。
【0093】
<輝度変化量の変形例>
上記実施形態において、エッジレベル推定部22は各ブロックのエッジ強度の平均値E1を輝度変化量として算出し、これらを下限値T1L及び上限値T1Hと比較してエッジレベルを推定した。別の実施例において、エッジレベル推定部22は輝度変化量として次に示す各指標を用いることもできる。
【0094】
(1)輝度分散値
エッジレベル推定部22は輝度変化量として各ブロックにおける撮影画像の輝度分散値E2を算出する。エッジレベル推定部22は、輝度分散値E2が下限値T2L未満のブロックを最低段階のレベル1、輝度分散値E2が下限値T2L以上且つ上限値T2H未満のブロックを中間段階のレベル2、輝度分散値E2が上限値T2H以上のブロックを最高段階のレベル3と判定する。
輝度分散値は、隣接画素の輝度値の差を累積することで算出が可能であるため、処理負荷が小さく、また逐次処理に適している。そのため輝度変化量を用いれば、エッジレベル推定部22の処理を逐次処理とし、撮影画像記憶部20のメモリ量を減じることができる。
【0095】
(2)FFTによる高周波成分量
エッジレベル推定部22は各ブロックにおける撮影画像の輝度値をFFT(Fast Fourier Transform)分析することによりその高周波成分量を輝度変化量として算出する。なお、FFTを用いる場合、ブロックの画素数を2の累乗とすることが好適であり、例えば、ブロックサイズを16×16画素とすることができる。すなわち、エッジレベル推定部22は、各ブロックにおける撮影画像の256画素の輝度値を並べたデータをFFT分析して、高域の最大強度値E3(高周波成分量)を算出する。そしてエッジレベル推定部22は、高周波成分量E3が下限値T3L未満のブロックを最低段階のレベル1、高周波成分量E3が下限値T3L以上且つ上限値T3H未満のブロックを中間段階のレベル2、高周波成分量E3が上限値T2H以上のブロックを最高段階のレベル3と判定する。
【0096】
(3)ウェーブレット変換による高周波成分量
エッジレベル推定部22は各ブロックにおける撮影画像の輝度値をウェーブレット(Wavelet)変換することによりその高周波成分量を輝度変化量として算出する。エッジレベル推定部22は各ブロックの撮影画像に離散ウェーブレット変換を施して得られる高周波成分画像の平均値E4(高周波成分量)を算出する。そしてエッジレベル推定部22は、高周波成分量E4が下限値T4L未満のブロックを最低段階のレベル1、高周波成分量E4が下限値T4L以上且つ上限値T4H未満のブロックを中間段階のレベル2、高周波成分量E4が上限値T4H以上のブロックを最高段階のレベル3と判定する。
ウェーブレット変換はLSI化が進んでいるため、ウェーブレット変換を用いれば装置コストを低減できる。また、離散ウェーブレット変換の過程で高周波成分画像とともに得られる低周波成分画像は解像度変換部23における低解像度化処理にて利用できるため、エッジレベル推定部22と解像度変換部23の一部を共通化することで装置コストを低減できる。
【0097】
(4)低周波画像と撮影画像の差分値(高周波成分量)
エッジレベル推定部22は撮影画像から生成した低周波画像と撮影画像の差分値を輝度変化量として用いる。すなわち、エッジレベル推定部22は、撮影画像の各画素を中心とするフィルタサイズが3×3のメディアンフィルタを施して低周波画像を生成し、生成した低周波画像と撮影画像の対応する輝度値の差の絶対値を求めて、その平均値E5をブロックごとに算出する。そして、エッジレベル推定部22は、差分平均値E5が下限値T5L未満のブロックを最低段階のレベル1、差分平均値E5が下限値T5L以上且つ上限値T5H未満のブロックを中間段階のレベル2、差分平均値E5が上限値T5H以上のブロックを最高段階のレベル3と判定する。メディアンフィルタの代わりに平滑化フィルタを用いてもよい。
この処理の過程で得られる低周波画像は解像度変換部23における低解像度化処理にて利用できるため、エッジレベル推定部22と解像度変換部23の一部を共通化することで装置コストを低減できる。
【0098】
また、以上例示した以外にも撮影画像の輝度分布又は撮影画像の高周波成分量を分析する各種手法を適用して輝度変化量を算出することが可能である。
【0099】
<エッジレベルの変形例>
上記実施形態において、エッジレベル推定部22は上限値及び下限値を用いて輝度変化量を3段階に分けることにより、エッジレベルを推定した。別の実施形態において、エッジレベル推定部22は下限値のみを用いて輝度変化量を2段階に分けてエッジレベルを推定ことができる。
図8に、この場合のエッジレベルと輝度変化量、解像度の関係例を示す。すなわち、エッジレベル推定部22は各ブロックのエッジ強度の平均値E1を下限値T1Lと比較して、E1≧T1Lであるブロックをレベル2(少なくとも弱エッジが含まれる領域)と判定し、E1<T1Lであるブロックをレベル1と判定する。これに応じて解像度変換部23は、撮影画像におけるレベル1のブロックの解像度を、少なくともレベル2のブロックの解像度R4よりも低い解像度R2の画像に置換して認識用画像を生成する。
【0100】
同様に、エッジレベル推定部22は各ブロックの輝度分散値E2を下限値T2Lと比較して、E2≧T2Lであるブロックをレベル2、E2<T2Lであるブロックをレベル1と判定することもできる。或いは、エッジレベル推定部22は各ブロックをFFT分析して得た高周波成分量E3を下限値T3Lと比較して、E3≧T3Lであるブロックをレベル2、E3<T3Lであるブロックをレベル1と判定することもできる。さらには各ブロックをウェーブレット変換して得た高周波成分量E4、各ブロックにて低周波画像と撮影画像の差分値を平均して得た平均値E5、その他の輝度変化量を用いる場合も同様に、下限値のみを用いて輝度変化量を2段階に分けてエッジレベルを推定することが可能である。
【0101】
このように輝度変化量を2段階に分ける場合、撮影画像においてエッジが存在する領域全てが高解像度領域となるが、背景が単純な監視領域では十分なデータ量削減効果を奏することができる。
【0102】
また、別の実施形態において、エッジレベル推定部22は輝度変化量を3つの閾値と比較して各ブロックのエッジレベルを4段階に分けることができる。
図9に、この場合のエッジレベルと輝度変化量、解像度の関係例を示す。すなわち、エッジレベル推定部22は各ブロックのエッジ強度の平均値E1を下限値T1L、中間値T1M、上限値T1H(T1L<T1M<T1H)と比較して、E1<T1Lであるブロックをレベル1と判定し、T1L≦E1<T1Mであるブロックをレベル2.1と判定し、T1M≦E1<T1Hであるブロックをレベル2.2と判定し、E1≧T1Hであるブロックをレベル3と判定する。解像度変換部23はこれに対応し、撮影画像において、レベル1のブロックを解像度R2の画像に置換し、レベル2.1のブロックを解像度R4.1の画像に置換する又はその解像度R1を維持し、レベル2.2のブロックを解像度R4.1よりも低い中間解像度R4.2の画像に置換し、レベル3のブロックを解像度R3の画像に置換して認識用画像を生成する。すなわち、解像度変換部23は、中間段階であるレベル2のブロックを細分し、当該段階が高いほど低く設定された第四解像度R4.1,R4.2の画像に置換して認識用画像を生成する。なお、解像度変換部23は、12×12画素のブロックを6×6画素の4ブロックなどに再分割し、再分割したブロックごとに撮影画像の代表輝度値を設定した4画素などとすることで中間解像度R5.2に変換することができる。
【0103】
同様に、エッジレベル推定部22は、各ブロックの輝度分散値E2を下限値T2L、中間値T2M、上限値T2H(T2L<T2M<T2H)と比較して、E2<T2Lであるブロックをレベル1、T2L≦E2<T2Mであるブロックをレベル2.1、T2M≦E2<T2Hであるブロックをレベル2.2、E2≧T2Hであるブロックをレベル3と判定することもできる。或いは、エッジレベル推定部22は各ブロックをFFT分析して得た高周波成分量E3を下限値T3L、中間値T3M、上限値T3H(T3L<T3M<T3H)と比較して、E3<T3Lであるブロックをレベル1、T3L≦E3<T3Mであるブロックをレベル2.1、T3M≦E3<T3Hであるブロックをレベル2.2、E3≧T3Hであるブロックをレベル3と判定することもできる。さらには各ブロックをウェーブレット変換して得た高周波成分量E4、各ブロックにて低周波画像と撮影画像の差分値を平均して得た平均値E5、その他の弱エッジ指標を用いる場合も、同様に中間値を設定してエッジレベルを4段階に分けることが可能である。
【0104】
輝度変化量に対して適用する中間値と中間解像度を実現するために再分割するブロックサイズの関係は事前の実験を通じて適宜に設定することができる。
【0105】
また、さらにはブロックの再分割が可能な範囲内で4つ以上の閾値を用いて5段階以上にするなど、段階を増やすこともできる。このように中間解像度を設定すれば、データ量の削減効果をさらに高めることが可能となる。
【0106】
<その他の変形例>
上記実施形態においては、撮影画像の解像度が横8000×縦4500画素である例を示したが、撮影画像の解像度はこれに限らず、例えば7680×4320画素(8K UHDTV)、3840×2160(4K UHDTV)、1920×1080画素(HD)など他の解像度であってもよい。
【0107】
また上記実施形態においては、撮影画像が濃淡画像である例を示したが、撮影画像をカラー画像とすることもできる。この場合、エッジレベル推定部22はステップS102において注目ブロックのカラー画像をグレースケール変換してから輝度変化量を算出すればよい。
【0108】
以上のようにして監視カメラが生成する認識用画像は色の類似した領域同士が接している領域において高解像度であるため、これを利用する画像認識装置における認識対象物体の特徴の抽出し損ねを低減でき、画像監視装置において高精度な画像認識が可能となる。また、エッジの弱い領域を解像度が高い撮影画像に基づいて判定し、認識用画像において当該領域を高解像度領域とするので、色の類似した領域が接してエッジが弱くなっている領域を認識用画像において確実に高解像度領域とすることができ、画像監視装置において高精度な画像認識が可能となる。
【0109】
その一方で、認識用画像において、高解像度でなくとも認識対象物体の特徴を十分に抽出可能な上記領域以外の領域は低解像度であるため、通信、画像認識の対象となるデータ量を低減でき、画像監視装置を低コストで提供できる。また認識用画像における高解像度領域は、認識対象物体全体でなく、その一部に限定されるためデータ量を大幅に低減でき、画像監視装置を低コストで提供できる。また、1フレームの撮影画像に対して1フレームの認識用画像が生成されるため、認識用画像を受信する画像認識装置において処理が複雑とならず画像監視装置を低コストで提供できる。
【0110】
なお、上記実施形態においては、画像監視装置が不審者を認識する例を示したが、本発明は人の認識に限らず車両、船舶、災害など各種物体、各種事象の認識に適用でき、エッジ特徴量を用いて監視領域の状態を画像認識する様々な用途に有用である。