特許第6398979号(P6398979)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許6398979映像処理装置、映像処理方法および映像処理プログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6398979
(24)【登録日】2018年9月14日
(45)【発行日】2018年10月3日
(54)【発明の名称】映像処理装置、映像処理方法および映像処理プログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20180920BHJP
   G06T 7/00 20170101ALI20180920BHJP
   H04N 5/232 20060101ALI20180920BHJP
【FI】
   G06F17/30 210A
   G06T7/00 300F
   G06F17/30 170D
   G06F17/30 350C
   H04N5/232
【請求項の数】15
【全頁数】44
(21)【出願番号】特願2015-532795(P2015-532795)
(86)(22)【出願日】2014年8月5日
(86)【国際出願番号】JP2014070547
(87)【国際公開番号】WO2015025704
(87)【国際公開日】20150226
【審査請求日】2017年7月10日
(31)【優先権主張番号】特願2013-173165(P2013-173165)
(32)【優先日】2013年8月23日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100134430
【弁理士】
【氏名又は名称】加藤 卓士
(72)【発明者】
【氏名】大網 亮磨
【審査官】 山本 俊介
(56)【参考文献】
【文献】 特開2012−8791(JP,A)
【文献】 特開2013−65119(JP,A)
【文献】 国際公開第2013/088707(WO,A1)
【文献】 特開2009−110349(JP,A)
【文献】 米国特許出願公開第2012/0030208(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06T 7/00
H04N 5/232
(57)【特許請求の範囲】
【請求項1】
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定手段と、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出手段と、
前記検索対象となるオブジェクトの特徴量を格納する特徴量データベースと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定手段が推定した画像劣化の度合いに基づいて制御するマッチング手段と、
を備える映像処理装置。
【請求項2】
前記オブジェクトの特徴量は、前記オブジェクトが有する模様の特徴量である請求項1に記載の映像処理装置。
【請求項3】
前記画像劣化推定手段は、前記オブジェクトが有する模様の種類に対応して、異なる度合いの画像劣化を推定する請求項2に記載の映像処理装置。
【請求項4】
前記オブジェクトの特徴量は、前記オブジェクトが有する色の特徴量をさらに含み、
前記マッチング手段は、前記画像劣化により前記模様の特徴量によるマッチングの信頼度が低下する場合に、前記色の特徴量によるマッチングを行なうように制御する請求項2または3に記載の映像処理装置。
【請求項5】
前記画像領域は、前記検索対象となるオブジェクトの一部である請求項1乃至4のいずれか1項に記載の映像処理装置。
【請求項6】
前記検索対象となるオブジェクトは人物であり、
前記画像劣化推定手段は、人物画像の一部である顔画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記人物の服または携帯物の特徴量である、請求項5に記載の映像処理装置。
【請求項7】
前記検索対象となるオブジェクトは車両であり、
前記画像劣化推定手段は、車両画像の一部であるナンバープレート画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記車両の車体または取付物ないし積載物の特徴量である、請求項5に記載の映像処理装置。
【請求項8】
前記画像領域は、前記映像中の特定領域である請求項1乃至7のいずれか1項に記載の映像処理装置。
【請求項9】
前記画像劣化推定手段は、既知の標識画像のエッジから画像劣化の度合いを推定する請求項8に記載の映像処理装置。
【請求項10】
前記画像劣化推定手段は、既知のフラット画像の画素のばらつきから画像劣化の度合いを推定する請求項8に記載の映像処理装置。
【請求項11】
前記画像劣化推定手段は、前記映像中から画像劣化の要因を認識して、前記要因に基づいて画像劣化の度合いを推定する請求項1乃至10のいずれか1項に記載の映像処理装置。
【請求項12】
少なくとも、前記画像劣化の度合いと、前記抽出した特徴量と、前記マッチングの結果との組み合わせを前記特徴量データベースにフィードバックする請求項1乃至11のいずれか1項に記載の映像処理装置。
【請求項13】
前記マッチング手段は、前記画像劣化の度合いと前記抽出した特徴量との、少なくとも2つの組み合わせをマッチングする請求項1乃至12のいずれか1項に記載の映像処理装置。
【請求項14】
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定ステップと、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出ステップと、
前記検索対象となるオブジェクトの特徴量を特徴量データベースに格納する格納ステップと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定ステップにおいて推定した画像劣化の度合いに基づいて制御するマッチングステップと、
を含む映像処理方法。
【請求項15】
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定ステップと、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出ステップと、
前記検索対象となるオブジェクトの特徴量を特徴量データベースに格納する格納ステップと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定ステップにおいて推定した画像劣化の度合いに基づいて制御するマッチングステップと、
をコンピュータに実行させる映像処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像中から対象とするオブジェクトを検索する技術に関する。
【背景技術】
【0002】
上記技術分野において、特許文献1には、映像中から、服装クエリーテキストで指定した色あるいは模様の服装をした人物を検索する技術が開示されている。また、特許文献2には、映像中の人物の服装の色あるいは模様の特徴量を、あらかじめ記憶した色あるいは模様の特徴量と比較して、エリアセキュリティーを判定する技術が開示されている。そして、非特許文献1には、映像中から人物位置を頭部により検出し、胴体モデルの上半身の色および模様の特徴量を人物特徴量として抽出する技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開WO2011/046128号公報
【特許文献2】特開2010−198207号公報
【非特許文献】
【0004】
【非特許文献1】高橋祐介、平川康史、大網 亮磨、「プライバシーを考慮した人物特徴量抽出方式の検討」、映像情報メディア学会技術報告、36(18)、23−26、2012−03−23
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記文献に記載の技術では、カメラで取得した映像中の画像そのものが、カメラのぶれなどの機器状態、あるいは、天候などの撮像環境により劣化することが考慮されていない。その結果、映像中の劣化した画像から抽出した特徴量に基づく人物の検索精度が低下する、という問題に対処ができなかった。
【0006】
本発明の目的は、上述の課題を解決し、映像中の劣化した画像から抽出した特徴量に基づく検索対象であるオブジェクトの検索精度の低下を抑制する技術を提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明に係る映像処理装置は、
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定手段と、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出手段と、
前記検索対象となるオブジェクトの特徴量を格納する特徴量データベースと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定手段が推定した画像劣化の度合いに基づいて制御するマッチング手段と、
を備える。
【0008】
上記目的を達成するため、本発明に係る映像処理方法は、
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定ステップと、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出ステップと、
前記検索対象となるオブジェクトの特徴量を特徴量データベースに格納する格納ステップと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定ステップにおいて推定した画像劣化の度合いに基づいて制御するマッチングステップと、
を含む。
【0009】
上記目的を達成するため、本発明に係る映像処理プログラムは、
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定ステップと、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出ステップと、
前記検索対象となるオブジェクトの特徴量を特徴量データベースに格納する格納ステップと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定ステップにおいて推定した画像劣化の度合いに基づいて制御するマッチングステップと、
をコンピュータに実行させる。
【発明の効果】
【0010】
本発明によれば、映像中の劣化した画像から抽出した特徴量に基づく検索対象であるオブジェクトの検索精度の低下を抑制することができる。
【図面の簡単な説明】
【0011】
図1】本発明の第1実施形態に係る映像処理装置の構成を示すブロック図である。
図2】本発明の第2実施形態に係る映像処理装置の処理概要を示す図である。
図3】本発明の第2実施形態に係る映像処理装置を含む映像処理システムの構成を示すブロック図である。
図4A】本発明の第2実施形態に係る映像処理装置の機能構成を示すブロック図である。
図4B】本発明の第2実施形態に係る映像処理装置の人物特徴量DBの構成を示す図である。
図4C】本発明の第2実施形態に係る検索人物マッチング部が使用する人物マッチングテーブルの構成を示す図である。
図4D】本発明の第2実施形態に係る映像選別部が使用する映像選別テーブルの構成を示す図である。
図5A】本発明の第2実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図5B】本発明の第2実施形態に係る服マッチング部の服特徴量DBの構成を示す図である。
図6】本発明の第2実施形態に係る服マッチング部の顔検出部の機能構成を示すブロック図である。
図7A】本発明の第2実施形態に係る服マッチング部の第1例の顔画像劣化量推定部の機能構成を示すブロック図である。
図7B】本発明の第2実施形態に係る服マッチング部の第2例の顔画像劣化量推定部の機能構成を示すブロック図である。
図7C】本発明の第2実施形態に係る顔画像劣化量推定部が使用する顔画像劣化量推定テーブルの構成を示す図である。
図8A】本発明の第2実施形態に係る服マッチング部の服特徴量マッチング部の機能構成を示すブロック図である。
図8B】本発明の第2実施形態に係る服特徴量マッチング部が使用する服特徴量マッチングテーブルの構成を示す図である。
図9】本発明の第2実施形態に係る映像処理装置のハードウェア構成を示すブロック図である。
図10】本発明の第2実施形態に係る映像処理装置の処理手順を示すフローチャートである。
図11A】本発明の第2実施形態に係る服マッチング処理の手順を示すフローチャートである。
図11B】本発明の第2実施形態に係る画像劣化推定処理の手順を示すフローチャートである。
図11C】本発明の第2実施形態に係る特徴量抽出処理の手順を示すフローチャートである。
図11D】本発明の第2実施形態に係る特徴量マッチング処理の手順を示すフローチャートである。
図12】本発明の第3実施形態に係る映像処理装置の処理概要を示す図である。
図13A】本発明の第3実施形態に係る映像処理装置の機能構成を示すブロック図である。
図13B】本発明の第3実施形態に係る検索車両マッチング部が使用する車両マッチングテーブルの構成を示す図である。
図14A】本発明の第3実施形態に係る映像処理装置の車体マッチング部の機能構成を示すブロック図である。
図14B】本発明の第3実施形態に係る車体マッチング部の車体特徴量DBの構成を示す図である。
図14C】本発明の第3実施形態に係る車体マッチング部のナンバープレート検出部の機能構成を示すブロック図である。
図15】本発明の第4実施形態に係る映像処理装置の処理概要を示す図である。
図16A】本発明の第4実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図16B】本発明の第4実施形態に係る服マッチング部の標識抽出部の機能構成を示すブロック図である。
図16C】本発明の第4実施形態に係る標識画像劣化量推定部が使用する標識画像劣化量推定テーブルの構成を示す図である。
図17】本発明の第5実施形態に係る映像処理装置の処理概要を示す図である。
図18A】本発明の第5実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図18B】本発明の第5実施形態に係るフラット画像劣化量推定部が使用するフラット画像劣化量推定テーブルの構成を示す図である。
図19】本発明の第6実施形態に係る映像処理装置の処理概要を示す図である。
図20A】本発明の第6実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図20B】本発明の第6実施形態に係る推定劣化量選択部が使用する推定劣化量選択テーブルの構成を示す図である。
図21A】本発明の第7実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図21B】本発明の第7実施形態に係る画像劣化量推定部が使用する画像劣化量推定テーブルの構成を示す図である。
図22】本発明の第8実施形態に係る映像処理装置の処理概要を示す図である。
図23】本発明の第8実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図24】本発明の第8実施形態に係る制定劣化量算出部が使用する推定劣化量算出テーブルの構成を示す図である。
図25A】本発明の第9実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図25B】本発明の第9実施形態に係る服マッチング部の服特徴量DBの構成を示す図である。
図26】本発明の第10実施形態に係る映像処理装置の服マッチング部の機能構成を示すブロック図である。
図27A】本発明の第10実施形態に係る服マッチング部の服特徴量マッチング部の機能構成を示す図である。
図27B】本発明の第10実施形態に係る服特徴量マッチング部が使用する服特徴量マッチングテーブルの構成を示す図である。
【発明を実施するための形態】
【0012】
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素は単なる例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
【0013】
本明細書で使用される「検索対象であるオブジェクト」としては、特徴を有する人物や車両が含まれるが、これに限定されず、映像中から検索したい対象を全て含む概念である。例えば、人物の着る服や人物の携帯物として特定のカバンなどをオブジェクトとしても、車両の取付物や積載する荷物をオブジェクトとしてもよい。すなわち、検索しようとする全ての対象物がオブジェクトとなり得る。
【0014】
[第1実施形態]
本発明の第1実施形態としての映像処理装置100について、図1を用いて説明する。映像処理装置100は、映像中から対象とするオブジェクトを検索する装置である。
【0015】
図1に示すように、映像処理装置100は、画像劣化推定部101と、特徴量抽出部102と、特徴量データベース103と、マッチング部104と、を含む。画像劣化推定部101は、映像中から画像劣化の指標となる画像領域の画像を抽出して、画像領域の画像の画像劣化の度合いを推定する。特徴量抽出部102は、映像中から検索対象となるオブジェクトの特徴量を抽出する。特徴量データベース103は、検索対象となるオブジェクトの特徴量を格納する。マッチング部104は、オブジェクトを映像中から検索する際に、抽出された特徴量と格納された特徴量とのマッチングを、画像劣化推定部101が推定した画像劣化の度合いに基づいて制御する。
【0016】
本実施形態によれば、映像中の劣化した画像から抽出した特徴量に基づく検索対象であるオブジェクトの検索精度の低下を抑制することができる。
【0017】
[第2実施形態]
次に、本発明の第2実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、映像中からオブジェクトとして人物を検索して、その人物が写った映像を選別する。また、本実施形態においては、人物を検索する特徴量の1つとして人物が有する服の色や模様の特徴量あるいは携帯物の色や模様の特徴量などを使用する。そして、画像劣化の度合いを映像中の検索対象となる人物の一部である顔画像の輪郭または顔領域内に含まれるパターンやエッジなどから推定し、推定画像劣化量に基づいて、例えば服特徴量マッチングを制御する。
【0018】
ここで、画像劣化量とは、検索対象となるオブジェクトの画像の劣化の度合いを表す指標であり、劣化の要因(例えば、ぼけやぶれ、逆光など)ごとに定義されていてもよいし、要因ごとに求めた値から、要因ごとによらない抽象化した値に変換したものであってもよい。例えば、ぼけの場合には、推定される点広がり関数のパラメータの値でぼけの度合いを表現できるが、このパラメータと対応付けて画像劣化量を定義してもよい。あるいは、このパラメータそのものを画像劣化量として定義してもよい。なお、ぼけの度合いの記述方法はこの方式に限定されず、他の方法であってもよい。
【0019】
《映像処理装置の処理概要》
図2は、本実施形態に係る映像処理装置200の処理概要を示す図である。
【0020】
映像処理装置200は、種々の映像211〜21nの映像データから特徴ある人物を検索する。例えば、映像240からドクロ模様の服を着た人物241を特定して、人物241が映った映像を選別する。この人物検索において、人物が着る服の色や模様などの特徴を特徴量として抽出して、あらかじめ格納された服の色や模様などの特徴量220と服特徴量マッチング部230においてマッチングして人物を特定する。
【0021】
この時に、映像211〜21nは、カメラの状態(例えば、ぶれや焦点ずれなど)によって画像劣化が発生したり、天候などの撮像環境(例えば、霧や雨滴、あるいは逆光など)によって画像劣化が発生したりする。図2において、映像211は画像劣化のない映像、映像212は霧による画像劣化がある映像、映像21nはぶれや焦点ずれによる画像劣化がある映像である。かかる画像劣化の映像から、人物の服の模様を特徴量としてマッチングを行なうと、特徴量の精度劣化により人物検索の信頼性が低下することになる。例えば、ストライプや水玉あるいは格子模様の服であれば、画像劣化により線や水玉が明確に分離して認識されなくなる。一方、もともとぼやけた模様の服を着ている人物を検索対象と認識してしまうこともあり得る。
【0022】
本実施形態においては、服の模様を1つの特徴量として、人物検索の特徴量マッチングを行なう場合に、服の模様の特徴量マッチングの精度が低下しやすい画像劣化の度合いを、顔画像の比較から推定して推定劣化量を生成する。そして、特徴量マッチングにおいて、推定劣化量に対応してマッチングの信頼度を生成して通知する。あるいは、推定劣化量が所定閾値を超えて信頼度が著しく低下した場合には、例えば、服の模様の特徴量マッチングは行なわずに、特徴量マッチングの信頼度が低下しない、例えば、服の色の特徴量マッチングの結果を採用する。なお、中間の状態では、それぞれの特徴量マッチングに重み付けをしてマッチング結果を生成する。
【0023】
このように処理することにより、画像劣化の発生による特徴量マッチングの精度低下を防ぎ、画像劣化においても人物検索の精度を維持する。
【0024】
《システム構成》
図3は、本実施形態に係る映像処理装置200を含む映像処理システム300の構成を示すブロック図である。
【0025】
映像処理システム300は、監視用のカメラ310と、映像送信部320と、ネットワーク330と、本実施形態の映像処理装置200と、を有する。映像送信部320は、カメラ310が撮像した映像を、ネットワーク330を介して、映像処理装置200に送信する。なお、映像送信部320は、カメラ310と一体でもよい。本実施形態の映像処理装置200は、図2で示したように、カメラ310からの映像から検索対象であるオブジェクト(本例では、人物)を検索して、オブジェクトを含む映像を選別(例えば類似度が一定以上のものを選別)する。また、選別した映像からさらにオブジェクトを解析するようにしてもよい。なお、本実施形態においては、選別した映像からさらにオブジェクトを解析する処理については、詳説しない。
【0026】
《映像処理装置の機能構成》
図4Aは、本実施形態に係る映像処理装置200の機能構成を示すブロック図である。
【0027】
映像処理装置200は、複数のマッチング部401〜403と、人物特徴量DB404と、検索人物マッチング部405と、映像蓄積部406とを備える。さらに、映像処理装置200は、破線で示した映像選別部407も備えていてもよい。複数のマッチング部401〜403は、例えば、検索人物の顔によるマッチングを行なう顔マッチング部401と、検索人物の服によるマッチングを行なう服マッチング部402と、検索人物の携帯物によるマッチングを行なう携帯物マッチング部403と、を含む。人物特徴量DB404は、複数のマッチング部401〜403に、あらかじめ格納されたマッチングのための人物のそれぞれの特徴量を提供する。映像蓄積部406は、カメラ310から送信された映像を検索可能に蓄積する。検索人物マッチング部405は、複数のマッチング部401〜403のマッチング結果を組み合わせて、映像中の人物を検索する。映像選別部407は、検索人物マッチング部405によりマッチングした人物を含む映像を、映像蓄積部406から取り出して、解析などの次の処理に送る。なお、選別する映像は、映像単位、時間単位、あるいは検索人物を含む映像であってもよい。
【0028】
(人物特徴量DB)
図4Bは、本実施形態に係る映像処理装置200の人物特徴量DB404の構成を示す図である。人物特徴量DB404は、人物検索において種々のマッチングに使用される特徴量を格納する。なお、人物特徴量DB404の構成は、図4Bに限定されない。例えば、特徴量は、テキスト形式で数値化されたデータでなくてもよく、バイナリデータとして格納するようになっていてもよい。例えばMPEG−7で規格化された特徴量形式のバイナリデータであってもよい。また、顔特徴量は目鼻口などの個々の部分領域ごとに特徴化されていなくてもよく、顔全体として特徴量化されていてもよい。
【0029】
人物特徴量DB404は、検索するマッチングオブジェクトID(本例では、検索する人物ID)に対応付けて、使用される特徴量を格納する。例えば、顔マッチングに使用される顔特徴量412、服マッチングに使用される服特徴量413、携帯物マッチングに使用される携帯物特徴量414、姿(体形)マッチングに使用される姿(体形)特徴量415などを格納する。
【0030】
(人物マッチングテーブル)
図4Cは、本実施形態に係る検索人物マッチング部405が使用する人物マッチングテーブル405aの構成を示す図である。人物マッチングテーブル405aは、種々のマッチング結果からトータルの人物検索を行なうために、検索人物マッチング部405が使用するテーブルである。ここでは、便宜上、テーブル形式で記述した例を示すが、マッチング結果の格納は、必ずしもテーブル形式で行う必要はなく、同等の内容を格納可能な任意の形式(例えば、これらの値を格納するための変数を有する構造体など)でもよい。
【0031】
人物マッチングテーブル405aは、各マッチング特徴量ID421に対応付けて、各マッチング部401〜403において抽出された抽出特徴量422と、それぞれのマッチング結果423と、マッチング結果の信頼度424と、を記憶する。そして、人物マッチングテーブル405aは、それらを考慮したトータルマッチング結果425を記憶する。
【0032】
(映像選別テーブル)
図4Dは、本実施形態に係る映像選別部407が使用する映像選別テーブル407aの構成を示す図である。映像選別テーブル407aは、検索人物マッチング部405のトータルマッチング結果から検索人物である信頼度が所定閾値より高ければ、その検索人物を含む映像の選別を行なうために、映像選別部407が使用するテーブルである。ここでは、便宜上、テーブル形式で記述した例を示すが、選別結果の格納は、図4Cと同様に、必ずしもテーブル形式でなくてもよい。
【0033】
映像選別テーブル407aは、映像ID431に対応付けて、検索する追跡人物ID432と、トータルのマッチング結果433と、映像選別結果434と、を記憶する。映像選別結果434には、選別あるいは非選別を記憶するが、例えば、後続の解析時に使用できるように信頼度を付してもよい。すなわち、後続の解析処理を行う際に、信頼度情報を見て、映像を用いるかどうかをそのときに判断するようにしてもよい。
【0034】
《服マッチング部の機能構成》
図5Aは、本実施形態に係る映像処理装置200の服マッチング部402の機能構成を示すブロック図である。以下、本実施形態においては、服マッチング部402を主に説明するが、他のマッチング部の構成も同様である。本実施形態においては、服マッチングにおいて画像劣化の影響を受ける服の模様について詳細に説明する。しかしながら、他のマッチング部における画像劣化の影響を受ける特徴量についても、服の模様と同様の処理が可能である。
【0035】
服マッチング部402は、顔検出部501と、顔画像劣化量推定部502と、服特徴量抽出部503と、服特徴量DB504と、服特徴量マッチング部230と、を備える。顔検出部501は、映像から人物の顔を検出する。顔画像劣化量推定部502は、顔検出部501が検出した顔画像から画像劣化量を推定する。なお、顔検出部501と顔画像劣化量推定部502とにより、本実施形態の画像劣化推定部を構成する。服特徴量抽出部503は、映像蓄積部406から読み出された映像に映った人物の服の特徴量を抽出する。服特徴量DB504は、服特徴量抽出部503が抽出した特徴量とマッチングするための、検索用の服の特徴量を格納する。なお、服特徴量DB504は、図4Aの人物特徴量DB404と共用であっても、人物特徴量DB404から取得した服の特徴量を格納してもよい。服特徴量マッチング部230は、服特徴量抽出部503が抽出した特徴量と服特徴量DB504に格納された特徴量とをマッチングして、マッチした場合は服マッチング結果を、検索人物マッチング部405に出力する。
【0036】
(服特徴量DB)
図5Bは、本実施形態に係る服マッチング部402の服特徴量DB504の構成を示す図である。服特徴量DB504は、人物検索のための服マッチング用の服の特徴量を人物特徴量DB404から取得して格納する。なお、服特徴量DB504の構成は、図5Bに限定されない。例えば、色はHSVヒストグラムや代表色特徴量、模様はエッジヒストグラムやガボールウェーブレット特徴など、バイナリの特徴量データを格納するようになっていてもよい。
【0037】
服特徴量DB504は、検索人物の服を識別するための特徴量テーブル510と、マッチング結果への画像劣化の影響を格納する画像劣化テーブル520と、を含む。なお、本実施形態においては、画像劣化テーブル520は、服特徴量DB504に格納されて、服特徴量マッチング部230がマッチングを制御するために使用するが、服特徴量マッチング部230や顔画像劣化量推定部502に格納されていてもよい。
【0038】
特徴量テーブル510は、検索人物の服を識別する検索服ID511に対応付けて、服マッチングに使用される色特徴量512と、模様特徴量513と、形状特徴量514と、を格納する。一方、画像劣化テーブル520は、服マッチングの特徴量対象521に対応付けて、判定信頼度523を格納する。また、特徴量テーブル510は、信頼度低下要因522と、マッチング時の重み付け524も格納してもよい。ここで、信頼度低下要因とは、信頼度が低下した要因が推定可能な場合に、その推定結果を格納するものである。例えば、ぶれが要因と推定される場合には、そのことを示す情報を記述する。なお、画像劣化の影響が大きく人物検索には使用されない場合には、マッチング時の重み付け524にゼロが格納されて、かかる特徴量は人物検索には使用しない。また、画像劣化テーブル520では、特徴量対象の詳細に対して信頼度を判定するようになっているが、詳細まで分かれていなくてもよく、色、模様、形状といった対象の単位ごとに算出するようになっていてもよい。
【0039】
(顔検出部)
図6は、本実施形態に係る服マッチング部402の顔検出部501の機能構成を示すブロック図である。顔検出部501は、映像蓄積部406からの映像から顔を検出する。
【0040】
顔検出部501は、顔画像特徴点抽出部601と、顔検出用DB602と、顔画像抽出部603と、を備える。顔画像特徴点抽出部601は、映像中から顔の輪郭、顔の色、顔の部位(眉毛、目、鼻、口など)の特徴点を抽出して、顔検出用DB602に格納された特徴点とマッチングして、顔領域であることを判定する。顔検出用DB602は、顔画像であることを示す特徴点を格納する。顔画像抽出部603は、顔画像特徴点抽出部601で顔領域と判定された領域の画像を顔画像として抽出する。なお、ここで述べた顔検出方法はあくまでも一例であり、これ以外の顔検出方法を用いてもよい。例えば、顔画像の特徴を学習させたニューラルネットワークに画像を直接入力し、個別の特徴点を検出することなく、入力された画像が顔かどうかを判定するようにしてもよい。
【0041】
なお、顔検出用DB602には、種々の特徴ある顔画像の輪郭やエッジ、例えば、日本人と外人、男性と女性、大人と子供の顔画像の輪郭やエッジを格納してもよい。また、検出する顔画像は、映像中に存在するどの顔画像でもよいが、複数の顔画像が検出された場合は、顔検出部501において、所定サイズの顔画像(カメラからの距離に対応する)を選択したり、他のマッチングにより検索人物候補となった人物の顔画像を選択したりしてもよい。あるいは、複数の顔画像について顔画像劣化量推定部502に出力し、顔画像劣化量推定部502において複数の顔画像の平均劣化量を算出したり、劣化量の推定に適した顔画像を選択したりしてもよい。
【0042】
(顔画像劣化量推定部)
図7Aは、本実施形態に係る服マッチング部402の第1例の顔画像劣化量推定部502Aの機能構成を示すブロック図である。顔画像劣化量推定部502Aは、顔検出部501が検出した顔画像から画像劣化量を推定する。
【0043】
顔画像劣化量推定部502Aは、顔画像比較部701と、顔画像DB702と、劣化量算出部703と、を備える。顔画像比較部701は、顔検出部501が検出した顔画像の輪郭やエッジなどを、顔画像DB702に格納された標準の顔画像の輪郭やエッジなどと比較して、その相違量、例えばシャープさの違いなどを出力する。顔画像DB702は、標準の顔画像の輪郭やエッジなどを格納する。なお、実際には、各カメラが撮像する環境における標準の顔画像と比較するのが望ましいので、あらかじめ各カメラで撮像した顔画像の輪郭やエッジなどを格納しておき、撮像場所に対応づけられた映像IDを用いて標準の顔画像を選択してもよい。また、撮像場所に対応する標準の顔画像、あるいはその顔から抽出した輪郭やエッジなどの特徴量を、映像IDを用いて選択して顔画像DB702にダウンロードしてもよい。劣化量算出部703は、顔画像比較部701が出力した標準顔画像と映像から検出した顔画像とのシャープさなどの相違から、画像の劣化量を推定算出する。
【0044】
図7Bは、本実施形態に係る服マッチング部402の第2例の顔画像劣化量推定部502Bの機能構成を示すブロック図である。顔画像劣化量推定部502Bも、顔検出部501が検出した顔画像から画像劣化量を推定する。
【0045】
顔画像劣化量推定部502Bは、顔画像DB702と、画像劣化量識別部704と、を備える。画像劣化量識別部704では、顔画像の劣化度ごとに学習させた識別器を用いて顔画像劣化量を判定する。例えば、ぼけの程度ごとに学習させたニューラルネットワークに対して顔画像を入力し、ぼけの程度を判定するようにしてもよい。また、用いる識別器はニューラルネットワークに限らない。例えば、SVM(サポートベクターマシン)識別器やGLVQ(一般化学習ベクトル)識別器でもよい。これらの場合には、顔画像の輪郭やエッジなどの特徴量を抽出し、識別器に入力する。このため、ぼけの程度ごとに学習画像を用意し、これらの画像の特徴量を用いて識別器を学習させておき、画像劣化量を判定する。
【0046】
図7Cは、本実施形態に係る顔画像劣化量推定部502Aが使用する顔画像劣化量推定テーブル502aの構成を示す図である。本テーブルは、画像劣化量が画像劣化要因ごとに、その程度を表すパラメータと対応付けて決められている場合に用いる。顔画像劣化量推定テーブル502aは、顔画像比較部701が出力した標準顔画像と映像から検出した顔画像との相違から、その劣化要因などに対応して画像劣化量を推定するため、顔画像劣化量推定部502Aが使用するテーブルである。
【0047】
顔画像劣化量推定テーブル502aは、画像劣化指標711に対応付けて画像劣化量712を記憶する。なお、図7Cにおいては、劣化要因などに対応して画像劣化量を推定するようにしたが、顔画像比較部701が出力した標準顔画像と映像から検出した顔画像との相違の程度をそのまま数値化してもよい。また、画像劣化要因とそのパラメータを対応づけたもの自体を画像劣化量として定義する場合には、このテーブルは用いずに、推定する画像劣化要因とパラメータを合わせて画像劣化量とする。
【0048】
(服特徴量マッチング部)
図8Aは、本実施形態に係る服マッチング部402の服特徴量マッチング部230の機能構成を示すブロック図である。服特徴量マッチング部230は、映像から抽出した特徴量と格納された特徴量とをマッチングして、その特徴量に類似する服が映像中に有るか否かを判定する。
【0049】
服特徴量マッチング部230は、特徴量比較部801とマッチング信頼度付加部802とを備える。特徴量比較部801は、服特徴量抽出部503が映像から抽出した特徴量と、服特徴量DB504に格納された特徴量とを比較する。マッチング信頼度付加部802は、特徴量比較部801の比較結果に画像劣化推定部からの画像劣化量を付加して、服マッチング結果として出力する。あるいは、画像劣化量を画像劣化の度合いに応じた特徴量の信頼性を表す信頼度に変換して付加するようにしてもよい。信頼度の値は、例えば、服特徴量によるマッチング結果がどの程度正しいかを各画像劣化量に対してあらかじめ算出し、その割合を信頼度として算出しておけばよい。
【0050】
なお、図8Aにおいては、画像劣化量を特徴量比較部801の比較結果に付加したが、画像劣化量に基づいて、特徴量比較部801の比較を変更したり、特徴量比較部801の比較結果に重み付けをしたりしてもよい。重み付けの場合に、例えば、画像劣化により服の模様のマッチング結果は使用せず、色のマッチング結果を使用する場合には、模様の比較結果の重み付けをゼロにする。
【0051】
図8Bは、本実施形態に係る服特徴量マッチング部230が使用する服特徴量マッチングテーブル230aの構成を示す図である。服特徴量マッチングテーブル230aは、服特徴量マッチングを行なうために、服特徴量マッチング部230が使用するテーブルである。ここでは、便宜上、テーブル形式で記述した例を示すが、マッチング結果の格納は、図4Cと同様に、必ずしもテーブル形式でなくてもよい。
【0052】
服特徴量マッチングテーブル230aは、識別対象ID811と特徴量対象812とに対応付けて、画像劣化推定部からの推定画像劣化量813を記憶する。さらに、服特徴量マッチングテーブル230aは、推定画像劣化量813に基づく信頼度判定結果814と、マッチング時の重み付け815と、を記憶してもよい。そして、特徴量対象のマッチング結果を組み合わせた1つの服IDに対応して、マッチング結果816を記憶する。
【0053】
《映像処理装置のハードウェア構成》
図9は、本実施形態に係る映像処理装置200のハードウェア構成を示すブロック図である。なお、図9には、映像中の人物検索時に使用する1つの特徴量である服の特徴量に関連する構成が図示されており、他の特徴量に関連する構成や複数の特徴量によるトータルマッチングのための構成については省略されている。しかしながら、それらは図9と同様の構成により実現できる。
【0054】
図9で、CPU910は演算制御用のプロセッサであり、CPU910がRAM940を使用しながらストレージ950に格納されたプログラムおよびモジュールを実行することで、図4Aに示された映像処理装置200の各機能構成部の機能が実現される。ROM920は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。また、通信制御部930は、ネットワークを介して外部装置と通信する。なお、CPU910は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPUを含んでもよい。
【0055】
RAM940は、CPU910が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM940には、本実施形態の実現に必要なデータを記憶する領域が確保されている。入力映像941は、映像蓄積部406に蓄積する映像あるいは映像蓄積部406からオブジェクト(本例では人物)を検索するための読み出された映像である。抽出顔画像942は、映像の画像劣化を推定するために抽出された顔画像である。画像劣化量943は、抽出顔画像942から推定された画像の劣化量である。抽出服特徴量944は、映像中の人物が着ている服から抽出された特徴量である。なお、服領域については、例えば、頭部あるいは顔領域の抽出から胴体部位を推定するなどの既知の方法により抽出が可能である。検索服特徴量945は、服特徴量DB504に格納された検索人物の着ている検索服の特徴量である。マッチング結果946は、画像劣化量943を考慮して、抽出服特徴量944と検索服特徴量945との比較から得られた、対象服か否かを示す結果情報である。信頼度(重み付け)947は、画像劣化量943に対応するマッチング結果946の信頼の程度である。なお、信頼度(重み付け)947は、マッチング結果946に添付されても、あるいは、マッチング結果946に組み込まれていてもよい。入出力データ948は、入出力インタフェース960を介して入出力される入出力データを示す。送受信データ949は、通信制御部930を介して送受信される送受信データを示す。
【0056】
ストレージ950には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。映像蓄積部406は、各カメラ310から収集された映像を蓄積する。人物特徴量DB404は、検索する人物の特徴量を人物IDに対応付けて格納するデータベースである。服特徴量DB504は、検索する人物の服の特徴量を服IDに対応付けて格納するデータベースである。なお、服特徴量DB504は人物特徴量DB404に含まれてもよい。顔検出用DB602は、映像から顔画像を検出ための顔の特徴(輪郭、色、部位など)を格納するデータベースである。顔画像劣化量推定テーブル502aは、顔画像劣化量推定部502が画像劣化量の推定のために使用するテーブルである。服特徴量抽出テーブル503aは、服特徴量抽出部503が映像から服特徴量を抽出するために使用するテーブルである。服特徴量マッチングテーブル230aは、服特徴量マッチング部230が服特徴量のマッチングにために使用するテーブルである。なお、各テーブルはRAM940に確保されてもよい。
【0057】
ストレージ950には、以下のプログラムが格納される。映像処理装置制御プログラム951は、本映像処理装置200の全体を制御する制御プログラムである。服マッチングモジュール952は、映像処理装置制御プログラム951における人物検索のため、映像中の服特徴量と服特徴量DB504に格納された服特徴量とをマッチングするモジュールである。画像劣化推定モジュール953は、映像から所定領域の画像を抽出して、抽出画像に基づいて映像中の画像劣化を推定するモジュールである。特徴量抽出モジュール954は、映像から人物検索のために人物の有する特徴量を抽出するモジュールである。特徴量マッチングモジュール955は、検索対象の人物を見付けるため、特徴量抽出モジュール954が抽出した特徴量と検索する人物の特徴量とをマッチングするモジュールである。なお、本実施形態において、画像劣化推定モジュール953は顔画像から画像劣化を推定し、特徴量抽出モジュール954および特徴量抽出モジュール954は服特徴量、特に服の模様の特徴量の抽出およびマッチングを行なう。
【0058】
入出力インタフェース960は、入出力機器との入出力データをインタフェースする。入出力インタフェース960には、表示部961、キーボード、タッチパネル、ポインティンデバイスなどの操作部962が接続される。
【0059】
なお、図9のRAM940やストレージ950には、映像処理装置200が有する汎用の機能や他の実現可能な機能に関連するプログラムやデータは図示されていない。
【0060】
《映像処理装置の処理手順》
図10は、本実施形態に係る映像処理装置200の処理手順を示すフローチャートである。このフローチャートは、図9のCPU910がRAM940およびストレージ950を使用しながら実行し、図4Aあるいは図5Aの機能構成部を実現する。
【0061】
映像処理装置200は、ステップS1001において、映像蓄積部406から対象人物を検索するための映像を取得する。次に、映像処理装置200は、ステップS1003において、取得した映像中から人物画像を検出する。映像処理装置200は、ステップS1005において、検出した人物について特定の服の服マッチングを実行するか否かを判定する。
【0062】
服マッチングを実行する場合、映像処理装置200は、ステップS1007において、服マッチング処理を実行する(図11A参照)。服マッチング処理を完了すると、映像処理装置200は、ステップS1009において、他のマッチング(顔や携帯物など)を実行するか否かを判定する。マッチングがオブジェクトとして特定の服を検索する場合、映像処理装置200は、ステップS1011において、服マッチング結果から検索対象オブジェクトを含む映像を選別する。一方、他のマッチングも含めたオブジェクトを検索する場合、映像処理装置200は、ステップS1013において、他のマッチング処理を実行し、ステップS1011においては、複数のマッチング結果を組み合わせて検索対象オブジェクトを含む映像を選別する。
【0063】
(服マッチング処理)
図11Aは、本実施形態に係る服マッチング処理(S1007)の手順を示すフローチャートである。
【0064】
映像処理装置200は、ステップS1101において、映像から顔画像を検出して画像劣化を推定する画像劣化推定処理を実行する。次に、映像処理装置200は、ステップS1103において、映像から検出した服の特徴量を抽出する服特徴量抽出処理を実行する。そして、映像処理装置200は、ステップS1105において、抽出した服特徴量とあらかじめ準備した検索人物の服特徴量とをマッチングする服特徴量マッチング処理を実行する。
【0065】
(画像劣化推定処理)
図11Bは、本実施形態に係る画像劣化推定処理(S1101)の手順を示すフローチャートである。
【0066】
映像処理装置200は、ステップS1111において、映像から顔画像を検出する。次に、映像処理装置200は、ステップS1113において、標準顔画像を読み出す。次に、映像処理装置200は、ステップS1115において、映像から抽出した顔画像と標準顔画像とのシャープさなどを比較する。そして、映像処理装置200は、ステップS1117において、ステップS1115の顔画像の比較結果から画像劣化量を推定する。なお、画像劣化量は、標準顔画像との比較ではなく、検出した顔画像の輪郭や部位エッジなどのシャープさの数値に対応する画像劣化量を生成してもよい。なお、ここで述べた画像劣化量推定処理はあくまでも一例であり、標準画像を用いない、前述の他の方法でもよい。
【0067】
(服特徴量抽出処理)
図11Cは、本実施形態に係る特徴量抽出処理(S1103)の手順を示すフローチャートである。
【0068】
映像処理装置200は、ステップS1131において、映像から服領域の画像を抽出する。なお、服領域については、例えば、頭部あるいは顔領域の抽出から胴体部位を推定するなどの既知の方法により抽出が可能である。次に、映像処理装置200は、ステップS1133において、服領域中の服画像から特徴量を抽出する。特徴量は、例えば、色特徴量や模様特徴量など、あるいはそれらの組み合わせ特徴量である。
【0069】
(服特徴量マッチング処理)
図11Dは、本実施形態に係る特徴量マッチング処理(S1105)の手順を示すフローチャートである。
【0070】
映像処理装置200は、ステップS1151において、画像劣化量推定処理で推定した画像劣化量を取得する。次に、映像処理装置200は、ステップS1153において、服特徴量抽出処理で抽出した特徴量を取得する。次に、映像処理装置200は、ステップS1155において、検索する人物(あるいは検索する服)の服特徴量を服特徴量DB504から取得する。次に、映像処理装置200は、ステップS1157において、ステップS1151において取得した画像劣化量に基づいて、服マッチングに使用する特徴量を選択する。あるいは、複数の特徴量に対して服マッチングへの寄与率を示す重み付けをする。そして、映像処理装置200は、ステップS1159において、画像劣化量を考慮した服特徴量のマッチングを実行する。映像処理装置200は、ステップS1161において、服マッチングの結果を出力する。
【0071】
本実施形態によれば、映像中の人物の顔画像に基づいて画像劣化を推定し、特に、画像劣化に影響され易い服の模様の特徴量のマッチングを制御することによって、映像中の劣化した画像から抽出した特徴量に基づく人物の検索精度の低下を抑制することができる。
【0072】
[第3実施形態]
次に、本発明の第3実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第2実施形態と比べると、検索対象のオブジェクトが車両である点で異なる。特に、本実施形態においては、車両を検索する特徴量の1つとして車両が有する車体の色や模様の特徴量あるいは積載物の色や模様の特徴量などを使用する。本実施形態においては、車両画像の一部であるナンバープレート画像の輪郭またはエッジから画像劣化の度合いを推定する。そして、この画像劣化の度合いに基づいて、車体または取付物ないし積載物の色や模様の特徴量のマッチングを制御して、車両の検索を行なう。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
【0073】
《映像処理装置の処理概要》
図12は、本実施形態に係る映像処理装置1200の処理概要を示す図である。なお、図12においては、検索対象が図2の人物から車両に変わり、画像劣化を推定する領域が図2の顔からナンバープレートに変わっているが、その処理は同様である。
【0074】
映像処理装置1200は、種々の映像1211〜21nの映像データから特徴ある車両を検索する。例えば、映像1240から車両1241を特定して、車両1241が映った映像を選別する。この車両検索において、車体の色や模様(輪郭線の模様)などの特徴を特徴量として抽出して、あらかじめ格納された検索対象の車体色や車体模様などの特徴量1220と車体特徴量マッチング部1230においてマッチングして車両を特定する。
【0075】
この時に、映像1211〜121nは、カメラの状態(例えば、ぶれや焦点ずれなど)
によって画像劣化が発生したり、天候などの撮像環境(例えば、霧や雨滴、あるいは逆光など)によって画像劣化が発生したりする。図12において、映像1211は画像劣化のない映像、映像1212は霧による画像劣化がある映像、映像121nはぶれや焦点ずれによる画像劣化がある映像である。かかる画像劣化の映像から、特に車体模様を特徴量としてマッチングを行なうと、特徴量の精度劣化により車両検索の信頼性が低下することになる。すなわち、車体の模様は線模様なので、画像劣化により線がぼやけたりぶれたりすると、明確に認識されなくなる。
【0076】
本実施形態においては、車体模様を1つの特徴量として、車両検索の特徴量マッチングを行なう場合に、車体模様の特徴量マッチングの精度が低下しやすい画像劣化の度合いを、ナンバープレート画像の比較から推定して推定劣化量を生成する。そして、特徴量マッチングにおいて、推定劣化量に対応してマッチングの信頼度を生成して通知する。あるいは、推定劣化量が所定閾値を超えて信頼度が著しく低下した場合には、例えば、車体模様の特徴量マッチングは行なわずに、特徴量マッチングの信頼度が低下しない、例えば、車体色の特徴量マッチングの結果を採用する。なお、中間の状態では、それぞれの特徴量マッチングに重み付けをしてマッチング結果を生成する。
【0077】
このように処理することにより、画像劣化の発生による特徴量マッチングの精度低下を防ぎ、画像劣化においても車両検索の精度を維持する。
【0078】
《映像処理装置の機能構成》
図13Aは、本実施形態に係る映像処理装置1200の機能構成を示すブロック図である。
【0079】
映像処理装置1200は、複数のマッチング部1301〜1303と、車両特徴量DB1304と、検索車両マッチング部1305と、映像蓄積部1306とを備える。さらに、映像処理装置1200は、破線で示す映像選別部1307も備えていてもよい。複数のマッチング部1301〜1303は、例えば、ナンバープレートマッチング部1301と、車体マッチング部1302と、取付物マッチング部1303と、を含む。ここで、ナンバープレートマッチング部1301は、検索車両のナンバープレートによるマッチングを行なう。車体マッチング部1302は、検索車両によるマッチングを色と線模様とを含む車体に対して行なう。取付物マッチング部1303は、検索車両の取付物によるマッチングを行なう。なお、車両の積載物の色や模様によるマッチングを含んでもよい。車両特徴量DB1304は、複数のマッチング部1301〜1303に、あらかじめ格納されたマッチングのための車両を検索するためのそれぞれの特徴量を提供する。映像蓄積部1306は、カメラ310から送信された映像を検索可能に蓄積する。検索車両マッチング部1305は、複数のマッチング部1301〜1303のマッチング結果を組み合わせて、映像中の車両を検索する。映像選別部1307は、検索車両マッチング部1305によりマッチングした車両を含む映像を、映像蓄積部1306から取り出して、解析などの次の処理に送る。なお、選別する映像は、映像単位、時間単位、あるいは検索車両を含む映像であってもよい。
【0080】
(車両マッチングテーブル)
図13Bは、本実施形態に係る検索車両マッチング部1305が使用する車両マッチングテーブル1305aの構成を示す図である。車両マッチングテーブル1305aは、種々のマッチング結果からトータルの車両検索を行なうために、検索車両マッチング部1305が使用するテーブルである。ここでは、便宜上、テーブル形式で記述した例を示すが、マッチング結果の格納は、図4Cと同様に、必ずしもテーブル形式でなくてもよい。
【0081】
車両マッチングテーブル1305aは、各マッチング特徴量ID1321に対応付けて、各マッチング部1301〜1303において抽出された抽出特徴量1322と、それぞれのマッチング結果1323と、マッチング結果の信頼度1324と、を記憶する。そして、車両マッチングテーブル1305aは、それらを考慮したトータルマッチング結果1325と、を記憶する。
【0082】
《車両マッチング部の機能構成》
図14Aは、本実施形態に係る映像処理装置1200の車体マッチング部1302の機能構成を示すブロック図である。以下、本実施形態においては、車体マッチング部1302を主に説明するが、他のマッチング部の構成も同様である。本実施形態においては、車両マッチングにおいて画像劣化の影響を受ける車体の線模様について詳細に説明する。しかしながら、他のマッチング部における画像劣化の影響を受ける特徴量についても、線模様と同様の処理が可能である。
【0083】
車体マッチング部1302は、ナンバープレート検出部1401と、プレート画像劣化量推定部1402と、車体特徴量抽出部1403と、車体特徴量DB1404と、車体特徴量マッチング部1230と、を備える。ナンバープレート検出部1401は、映像から車両のナンバープレート画像(以下、プレート画像と呼ぶ)を検出する。プレート画像劣化量推定部1402は、ナンバープレート検出部1401が検出したプレート画像から画像劣化量を推定する。なお、ナンバープレート検出部1401とプレート画像劣化量推定部1402とにより、本実施形態の画像劣化推定部を構成する。車体特徴量抽出部1403は、映像蓄積部1306から読み出された映像に映った車両の車体の特徴量(色や輪郭線模様)を抽出する。車体特徴量DB1404は、車体特徴量抽出部1403が抽出した特徴量とマッチングするための、検索用の車体特徴量を格納する。なお、車体特徴量DB1404は、図13Aの車両特徴量DB1304と共用であっても、車両特徴量DB1304から取得した車体の特徴量を格納してもよい。車体特徴量マッチング部1230は、車体特徴量抽出部1403が抽出した特徴量と車体特徴量DB1404に格納された特徴量とをマッチングして、マッチした場合は車体マッチング結果を、検索車両マッチング部1305に出力する。
【0084】
(車両特徴量DB)
図14Bは、本実施形態に係る車体マッチング部1302の車体特徴量DB1404の構成を示す図である。車体特徴量DB1404は、車両検索のための車体マッチング用の車体特徴量を車両特徴量DB1304から取得して格納する。なお、車体特徴量DB1404の構成は、図14Bに限定されない。例えば、色はHSVヒストグラムや代表色特徴量、模様はエッジヒストグラムやガボールウェーブレット特徴など、バイナリの特徴量データを格納するようになっていてもよい。
【0085】
車体特徴量DB1404は、検索車両の車体を識別するための特徴量テーブル1410と、マッチング結果への画像劣化の影響を格納する画像劣化テーブル1420と、を含む。なお、本実施形態においては、画像劣化テーブル1420は、車体特徴量DB1404に格納されて、車体特徴量マッチング部1230がマッチングを制御するために使用するが、車体特徴量マッチング部1230やプレート画像劣化量推定部1402に格納されていてもよい。
【0086】
特徴量テーブル1410は、検索車両の車体を識別する検索車体ID1411に対応付けて、車体マッチングに使用される色特徴量1412と、模様特徴量1413と、形状特徴量1414と、を格納する。一方、画像劣化テーブル1420は、車体マッチングの特徴量対象1421に対応付けて、判定信頼度1423を格納する。また、特徴量テーブル1410は、信頼度低下要因1422と、マッチング時の重みづけ1424も格納してもよい。信頼度低下要因については、画像劣化テーブル520の場合と同様である。なお、画像劣化の影響が大きく車両検索には使用されない場合には、マッチング時の重み付け1424にゼロが格納されて、かかる特徴量は車両検索には使用しない。また、画像劣化テーブル1420では、特徴量対象の詳細に対して信頼度を判定するようになっているが、詳細まで分かれていなくてもよく、色、模様、形状といった対象の単位ごとに算出するようになっていてもよい。
【0087】
(ナンバープレート検出部)
図14Cは、本実施形態に係る車体マッチング部1302のナンバープレート検出部1401の機能構成を示すブロック図である。ナンバープレート検出部1401は、映像蓄積部1306からの映像からナンバープレートを検出する。
【0088】
ナンバープレート検出部1401は、プレート画像特徴点抽出部1431と、プレート検出用DB1432と、プレート画像抽出部1433と、を備える。プレート画像特徴点抽出部1431は、映像中からナンバープレートの輪郭、ナンバープレートの色、ナンバープレートの部位の特徴点を抽出して、プレート検出用DB1432に格納された特徴点とマッチングして、ナンバープレート領域であることを判定する。プレート検出用DB1432は、プレート画像であることを示す特徴点を格納する。プレート画像抽出部1433は、プレート画像特徴点抽出部1431でナンバープレート領域と判定された領域の画像をプレート画像として抽出する。なお、ここで述べたナンバープレート検出方法はあくまでも一例であり、これ以外のナンバープレート検出方法を用いてもよいのは、顔検出部501の場合と同様である。
【0089】
なお、プレート検出用DB1432には、種々の特徴あるプレート画像の輪郭やエッジ、例えば、乗用車と貨物車、自家用と事業用、軽自動車、二輪車などのプレート画像の輪郭やエッジを格納してもよい。また、検出するプレート画像は、映像中に存在するどのプレート画像でもよいが、複数のプレート画像が検出された場合は、ナンバープレート検出部1401において、所定サイズのプレート画像(カメラからの距離に対応する)を選択する。あるいは、他のマッチングにより検索車両候補となった車両のプレート画像を選択してもよい。あるいは、複数のプレート画像についてプレート画像劣化量推定部1402に出力し、プレート画像劣化量推定部1402において複数のプレート画像の平均劣化量を算出したり、劣化量の推定に適したプレート画像を選択したりしてもよい。
【0090】
本実施形態によれば、映像中の車両のプレート画像に基づいて画像劣化を推定し、特に、画像劣化に影響され易い車両の車体の特徴量のマッチングを制御することによって、映像中の劣化した画像から抽出した特徴量に基づく車両の検索精度の低下を抑制することができる。
【0091】
[第4実施形態]
次に、本発明の第4実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第2実施形態と比べると、映像劣化の度合い推定を顔画像でなく、固定カメラにおいては映像中の特定領域にある既知の標識画像を使用する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、本実施形態においては、人物検索を例に説明するが、車両検索など他のオブジェクト検索にも適用され、同様の効果を奏する。
【0092】
《映像処理装置の処理概要》
図15は、本実施形態に係る映像処理装置1500の処理概要を示す図である。なお、図15において、図2と同様の要素には同じ参照番号を付して、説明を省略する。
【0093】
映像処理装置1500は、種々の映像1511〜151nの映像データから特徴ある人物を検索する。例えば、映像1540からドクロ模様の服を着た人物241を特定して、人物241が映った映像を選別する。この人物検索において、人物が着る服の色や模様などの特徴を特徴量として抽出して、あらかじめ格納された服の色や模様などの特徴量220と服特徴量マッチング部230においてマッチングして人物を特定する。
【0094】
この時に、映像1511〜151nは、カメラの状態(例えば、ぶれや焦点ずれなど)
によって画像劣化が発生したり、天候などの撮像環境(例えば、霧や雨滴、あるいは逆光など)によって画像劣化が発生したりする。図15において、映像1511は画像劣化のない映像、映像1512は霧による画像劣化がある映像、映像151nはぶれや焦点ずれによる画像劣化がある映像である。かかる画像劣化の映像から、人物の服の模様を特徴量としてマッチングを行なうと、特徴量の精度劣化により人物検索の信頼性が低下することになる。例えば、ストライプや水玉あるいは格子模様の服であれば、画像劣化により線や水玉が明確に分離して認識されなくなる。一方、もともとぼやけた模様の服を着ている人物を検索対象と認識してしまうこともあり得る。
【0095】
本実施形態においては、服の模様を1つの特徴量として、人物検索の特徴量マッチングを行なう場合に、服の模様の特徴量マッチングの精度が低下しやすい画像劣化の度合いを、映像内の特定位置に撮像された標識画像の比較から推定して推定劣化量を生成する。そして、特徴量マッチングにおいて、推定劣化量に対応してマッチングの信頼度を生成して通知する。あるいは、推定劣化量が所定閾値を超えて信頼度が著しく低下した場合には、例えば、服の模様の特徴量マッチングは行なわずに、特徴量マッチングの信頼度が低下しない、例えば、服の色の特徴量マッチングの結果を採用する。なお、中間の状態では、それぞれの特徴量マッチングに重み付けをしてマッチング結果を生成する。
【0096】
このように処理することにより、映像内の特定位置に撮像された標識画像から画像劣化を推定して、画像劣化の発生による特徴量マッチングの精度低下を防ぎ、画像劣化においても人物検索の精度を維持する。
【0097】
《服マッチング部の機能構成》
図16Aは、本実施形態に係る映像処理装置1500の服マッチング部1600の機能構成を示すブロック図である。なお、図16Aにおいて、図5Aと同様の機能構成部には同じ参照番号を付して、説明を省略する。
【0098】
服マッチング部1600は、標識抽出部1601と、標識画像劣化量推定部1602と、服特徴量抽出部503と、服特徴量DB504と、服特徴量マッチング部230と、を備える。標識抽出部1601は、映像から特定領域に撮像された標識を抽出する。標識画像劣化量推定部1602は、標識抽出部1601が抽出した標識画像から画像劣化量を推定する。なお、標識抽出部1601と標識画像劣化量推定部1602とにより、本実施形態の画像劣化推定部を構成する。
【0099】
(標識抽出部)
図16Bは、本実施形態に係る服マッチング部1600の標識抽出部1601の機能構成を示すブロック図である。
【0100】
標識抽出部1601は、標識画像抽出部1611と、映像フレーム・テンプレート1612とを備える。標識画像抽出部1611は、映像フレーム・テンプレート1612に記憶された映像内の特定位置の特定領域から標識画像を抽出する。映像フレーム・テンプレート1612は、標識の映像中の特定位置の特定領域を記憶している。なお、本実施形態において、カメラは固定であり、カメラ位置や撮像方向、あるいは標識位置が変更された場合は、映像フレーム・テンプレート1612を変更して、常に標識を抽出できるようにする。
【0101】
(標識画像劣化量推定テーブル)
図16Cは、本実施形態に係る標識画像劣化量推定部1602が使用する標識画像劣化量推定テーブル1602aの構成を示す図である。標識画像劣化量推定テーブル1602aは、常態で撮像された標準標識画像と映像から検出した標識画像との相違から、その劣化要因などに対応して画像劣化量を推定するため、標識画像劣化量推定部1602が使用するテーブルである。
【0102】
標識画像劣化量推定テーブル1602aは、標識ID1621に対応付けて、標識位置1622と、抽出した標識画像1623と、輪郭やエッジなどの抽出データ1624と、参照する標準標識画像1625と、を記憶する。そして、標識画像劣化量推定テーブル1602aは、抽出した標識画像1623と参照する標準標識画像1625との比較結果から生成された画像劣化量1626を記憶する。
【0103】
本実施形態によれば、映像中の標識画像に基づいて画像劣化を推定し、特に、画像劣化に影響され易い特徴量のマッチングを制御することによって、映像中の劣化した画像から抽出した特徴量に基づく検索対象となるオブジェクトの検索精度の低下を抑制することができる。
【0104】
[第5実施形態]
次に、本発明の第5実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第4実施形態と比べると、映像中の特定領域として表面がフラットな画像を抽出して画素のばらつきから画像劣化を推定する点で異なる。その他の構成および動作は、第4実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、本実施形態においては、人物検索を例に説明するが、車両検索など他のオブジェクト検索にも適用され、同様の効果を奏する。
【0105】
《映像処理装置の処理概要》
図17は、本実施形態に係る映像処理装置1700の処理概要を示す図である。なお、図17において、図2と同様の要素には同じ参照番号を付して、説明を省略する。
【0106】
映像処理装置1700は、種々の映像1711〜171nの映像データから特徴ある人物を検索する。例えば、映像1740からドクロ模様の服を着た人物241を特定して、人物241が映った映像を選別する。この人物検索において、人物が着る服の色や模様などの特徴を特徴量として抽出して、あらかじめ格納された服の色や模様などの特徴量220と服特徴量マッチング部230においてマッチングして人物を特定する。
【0107】
この時に、映像1711〜171nは、カメラの状態(例えば、ぶれや焦点ずれなど)
によって画像劣化が発生したり、天候などの撮像環境(例えば、霧や雨滴、あるいは逆光など)によって画像劣化が発生したりする。図17において、映像1711は画像劣化のない映像、映像1712は霧による画像劣化がある映像、映像171nはぶれや焦点ずれによる画像劣化がある映像である。かかる画像劣化の映像から、人物の服の模様を特徴量としてマッチングを行なうと、特徴量の精度劣化により人物検索の信頼性が低下することになる。例えば、ストライプや水玉あるいは格子模様の服であれば、画像劣化により線や水玉が明確に分離して認識されなくなる。一方、もともとぼやけた模様の服を着ている人物を検索対象と認識してしまうこともあり得る。
【0108】
本実施形態においては、人物検索の特徴量マッチングを行なう場合に、服の模様の特徴量マッチングの精度が低下しやすい画像劣化の度合いを、映像内の特定位置に撮像されたフラット画像の撮像環境による画素ばらつきなどから推定する。なお、フラット画像としては、表面がフラットな標識や看板、あるいは、建物の一部などの経時変化の無い映像内の物が選択される。図17においては、路側にある大型看板の周囲のフラット面が選択されている。そして、特徴量マッチングにおいて、推定劣化量に対応してマッチングの信頼度を生成して通知する。あるいは、推定劣化量が所定閾値を超えて信頼度が著しく低下した場合には、例えば、服の模様の特徴量マッチングは行なわずに、特徴量マッチングの信頼度が低下しない、例えば、服の色の特徴量マッチングの結果を採用する。なお、中間の状態では、それぞれの特徴量マッチングに重み付けをしてマッチング結果を生成する。
【0109】
このように処理することにより、映像内の特定位置に撮像された標識画像から画像劣化を推定して、画像劣化の発生による特徴量マッチングの精度低下を防ぎ、画像劣化においても人物検索の精度を維持する。
【0110】
《服マッチング部の機能構成》
図18Aは、本実施形態に係る映像処理装置1700の服マッチング部1800の機能構成を示すブロック図である。なお、図16Aにおいて、図5Aと同様の機能構成部には同じ参照番号を付して、説明を省略する。
【0111】
服マッチング部1800は、フラット領域抽出部1801と、フラット画像劣化量推定部1802と、服特徴量抽出部503と、服特徴量DB504と、服特徴量マッチング部230と、を備える。フラット領域抽出部1801は、映像から特定領域に撮像されたフラット領域を抽出する。フラット画像劣化量推定部1802は、フラット領域抽出部1801が抽出したフラット画像の撮像環境による画素ばらつきなどから画像劣化量を推定する。なお、フラット領域抽出部1801とフラット画像劣化量推定部1802とにより、本実施形態の画像劣化推定部を構成する。
【0112】
(フラット画像劣化量推定テーブル)
図18Bは、本実施形態に係るフラット画像劣化量推定部1802が使用するフラット画像劣化量推定テーブル1802aの構成を示す図である。フラット画像劣化量推定テーブル1802aは、常態で撮像されたフラット画像と映像から検出したフラット画像との相違から、その劣化要因などに対応して画像劣化量を推定するため、フラット画像劣化量推定部1802が使用するテーブルである。
【0113】
フラット画像劣化量推定テーブル1802aは、フラット領域ID1821に対応付けて、フラット領域位置1822と、抽出したフラット画像1823と、画素ばらつきなどの抽出データ1824と、参照するフラット画像1825と、を記憶する。そして、フラット画像劣化量推定テーブル1802aは、抽出したフラット画像1823と参照するフラット画像1825との比較結果から生成された画像劣化量1826を記憶する。
【0114】
本実施形態によれば、映像中のフラット画像の画素ばらつきなどに基づいて画像劣化を推定し、特に、画像劣化に影響され易い特徴量のマッチングを制御する。かかる制御によって、映像中の劣化した画像から抽出した特徴量に基づく検索対象となるオブジェクトの検索精度の低下を抑制することができる。
【0115】
[第6実施形態]
次に、本発明の第6実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第2実施形態乃至第5実施形態と比べると、複数の領域の画像に基づいて生成した推定画像劣化の度合いからオブジェクトの特徴に基づいて選択して、特徴量のマッチングの制御に使用する点で異なる。その他の構成および動作は、第2実施形態乃至第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、本実施形態においては、人物検索を例に説明するが、車両検索など他のオブジェクト検索にも適用され、同様の効果を奏する。
【0116】
《映像処理装置の処理概要》
図19は、本実施形態に係る映像処理装置1900の処理概要を示す図である。なお、図19には、画像劣化量の生成までを示すが、画像劣化量を使用して映像からオブジェクトを検索する処理は図2と同様であり、図示および説明を省略する。
【0117】
映像処理装置1900は、種々の映像1911〜191nの映像データから特徴ある人物を検索する。この時に、映像1911〜191nは、カメラの状態(例えば、ぶれや焦点ずれなど)によって画像劣化が発生したり、天候などの撮像環境(例えば、霧や雨滴、あるいは逆光など)によって画像劣化が発生したりする。図19において、映像1911は霧による画像劣化がある映像、映像1912は雨滴による画像劣化がある映像、映像1913は逆光による画像劣化がある映像、映像1914は夜街燈による画像劣化がある映像、映像21nはぶれや焦点ずれによる画像劣化がある映像である。なお、画像劣化の要因は上記例に限定されない。例えば、朝日などの照り返しやスモッグなども含む。かかる画像劣化の映像から、人物の服の模様を特徴量としてマッチングを行なうと、特徴量の精度劣化により人物検索の信頼性が低下することになる。例えば、ストライプや水玉あるいは格子模様の服であれば、画像劣化により線や水玉が明確に分離して認識されなくなる。一方、もともとぼやけた模様の服を着ている人物を検索対象と認識してしまうこともあり得る。
【0118】
本実施形態においては、推定劣化量選択部1902が、既知画像との比較で画像劣化を推定できる複数の画像領域から得られた複数の画像劣化量から、マッチングする特徴量に影響を与える画像劣化量を選択する。あるいは、複数の画像劣化量を組み合わせて、服特徴量マッチングに使用する画像劣化量を生成する。そして、特徴量マッチングにおいて、推定劣化量に対応してマッチングの信頼度を生成して通知する。あるいは、推定劣化量が所定閾値を超えて信頼度が著しく低下した場合には、例えば、服の模様の特徴量マッチングは行なわずに、特徴量マッチングの信頼度が低下しない、例えば、服の色の特徴量マッチングの結果を採用する。なお、中間の状態では、それぞれの特徴量マッチングに重み付けをしてマッチング結果を生成する。
【0119】
複数の画像劣化量を組み合わせて服特徴量マッチングに使用する画像劣化量を算出する方式はいろいろとあるが、例えば、最も画像劣化量が大きいものを選択する方式や、モデル化して算出する方式などがある。モデル化は、経験的な値からヒューリスティックに定めてもよいし、複数の画像を用いて学習させることにより、定めてもよい。
【0120】
このように処理することにより、複数の画像劣化量からマッチングする特徴量に対応した画像劣化量を生成して、画像劣化の発生による特徴量マッチングの精度低下を防ぎ、画像劣化においても人物検索の精度を維持する。
【0121】
《服マッチング部の機能構成》
図20Aは、本実施形態に係る映像処理装置1900の服マッチング部2000の機能構成を示すブロック図である。なお、図20Aにおいて、図5Aと同様の機能構成部には同じ参照番号を付して、説明を省略する。
【0122】
服マッチング部2000は、画像劣化推定部を構成する、顔画像による画像劣化推定部2001と、標識画像による画像劣化推定部2002と、フラット画像による画像劣化推定部2003と、推定劣化量選択部1902と、を備える。なお、各画像劣化推定部2001、2002および2003は、図5A図16Aおよび図18Aの画像劣化推定部に相当する。推定劣化量選択部1902は、複数の画像劣化推定部2001〜2003から使用する画像劣化量を選択する。
【0123】
(推定劣化量選択テーブル)
図20Bは、本実施形態に係る推定劣化量選択部1902が使用する推定劣化量選択テーブル1902aの構成を示す図である。推定劣化量選択テーブル1902aは、複数領域の画像に基づいて画像劣化量を推定するため、推定劣化量選択部1902が使用するテーブルである。
【0124】
推定劣化量選択テーブル1902aは、劣化量を推定する画像2011に対応付けて、推定された推定劣化量2012と、特徴量マッチングへの寄与度を決める重み付け2013と、選択する場合の優先順位2014と、を記憶する。そして、推定劣化量選択テーブル1902aは、推定劣化量選択部1902が生成した画像劣化量2015を記憶する。
【0125】
本実施形態によれば、映像中の複数領域の画像に基づいて、検索対象となるオブジェクトの特徴に対応して適切な画像劣化を推定し、特に、画像劣化に影響され易い特徴量のマッチングを制御する。この制御によって、映像中の劣化した画像から抽出した特徴量に基づく検索対象となるオブジェクトの検索精度の低下を抑制することができる。
【0126】
[第7実施形態]
次に、本実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第2実施形態乃至第6実施形態と比べると、複数の画像劣化要因に基づいて生成した推定画像劣化の度合いから適切な劣化要因に基づいて選択して、特徴量のマッチングの制御に使用する点で異なる。その他の構成および動作は、第2実施形態乃至第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、本実施形態においては、人物検索を例に説明するが、車両検索など他のオブジェクト検索にも適用され、同様の効果を奏する。
【0127】
《服マッチング部の機能構成》
図21Aは、本実施形態に係る映像処理装置の服マッチング部2100の機能構成を示すブロック図である。なお、図21Aにおいて、図5Aと同様の機能構成部には同じ参照番号を付して、説明を省略する。
【0128】
服マッチング部2100は、画像劣化推定部を構成する、映像から霧が出ていることを検出する霧検出部2111と、映像から雨滴があることを検出する雨滴検出部2112と、標識抽出部1601と、画像劣化量推定部2102と、を備える。画像劣化量推定部2102は、霧検出部2111と、雨滴検出部2112と、標識抽出部1601とからの情報に基づいて、マッチングする特徴量に影響する画像劣化量を推定する。
【0129】
ここで、霧検出部2111は、例えば、画面全体が霧によって全体的に見えにくくなる傾向を学習した検出器を用いて霧を検出する。例えば、霧の状態とそうでない状態の両方の学習用画像を準備し、ニューラルネットワークを学習させ、学習させたニューラルネットワークを用いて霧を検出することができる。この際、現場の画像を事前に取得可能な場合には、学習画像に現場の画像を含めることで、より正確な霧検出が可能となる。同様に、雨滴についても、降雨状態の画像とそうでない画像とを入力し、学習させることで、検出器を構築可能である。カメラのレンズに雨滴が付着する場合も、同様に検出可能である。なお、ここで示した霧や雨滴の検出方法はあくまでも一例であり、これ以外の方法を用いてもよい。さらに、単に霧や雨滴を検出するだけでなく、その程度(霧の濃さや雨滴の量など)も同時に検出可能になっていてもよい。これは、霧や雨滴の程度ごとに映像を取得し、学習させることにより実現できる。
【0130】
(画像劣化量推定テーブル)
図21Bは、本実施形態に係る画像劣化量推定部2102が使用する画像劣化量推定テーブル2102aの構成を示す図である。画像劣化量推定テーブル2102aは、複数の劣化要因の画像に基づいて画像劣化量を推定するため、画像劣化量推定部2102が使用するテーブルである。
【0131】
画像劣化量推定テーブル2102aは、画像劣化の原因となる劣化要因2121に対応付けて、特徴量マッチングへの寄与度を決める重み付け2122と、選択する場合の優先順位2123と、を記憶する。そして、画像劣化量推定テーブル2102aは、画像劣化量推定部2102が生成した画像劣化量2124を記憶する。
【0132】
本実施形態によれば、映像中からの複数の劣化要因に基づいて推定した画像劣化の度合いから、劣化要因に対応してあるいは組み合わせて適切な画像劣化を推定し、特に、画像劣化に影響され易い特徴量のマッチングを制御する。この制御によって、映像中の劣化した画像から抽出した特徴量に基づく検索対象となるオブジェクトの検索精度の低下を抑制することができる。
【0133】
[第8実施形態]
次に、本発明の第8実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第2実施形態乃至第7実施形態と比べると、オブジェクトを検索するための特徴量の基となる対象画像の種類に対応して、画像劣化を推定する点で異なる。本実施形態においては、映像中から人物を検索する場合に、服の模様の種類に対応して異なる度合いの画像劣化を推定する例を説明する。その他の構成および動作は、第2実施形態乃至第7実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、本実施形態においては、人物検索を例に説明するが、車両検索など他のオブジェクト検索にも適用され、同様の効果を奏する。
【0134】
《映像処理装置の処理概要》
図22は、本実施形態に係る映像処理装置2200の処理概要を示す図である。なお、図22には、画像劣化量の生成までを示すが、画像劣化量を使用して映像からオブジェクトを検索する処理は図2と同様であり、図示および説明を省略する。また、図19と同様の要素には同じ参照番号を付して、説明を省略する。
【0135】
映像処理装置2200は、種々の映像1911〜191nの映像データから特徴ある人物を検索する。この時に、映像1911〜191nは、カメラの状態(例えば、ぶれや焦点ずれなど)によって画像劣化が発生したり、天候などの撮像環境(例えば、霧や雨滴、あるいは逆光など)によって画像劣化が発生したりする。かかる画像劣化の映像から、人物の服の模様を特徴量としてマッチングを行なうと、特徴量の精度劣化により人物検索の信頼性が低下することになる。例えば、ストライプや水玉あるいは格子模様の服であれば、画像劣化により線や水玉が明確に分離して認識されなくなる。一方、もともとぼやけた模様の服を着ている人物を検索対象と認識してしまうこともあり得る。
【0136】
本実施形態においては、推定劣化量算出部2202が、既知画像との比較で画像劣化を推定できる複数の画像領域から得られた複数の画像劣化量から、マッチングする特徴として本例では模様種類により特徴量に影響を与える画像劣化量を選択する。あるいは、複数の画像劣化量を組み合わせて、服特徴量マッチングに使用する画像劣化量を算出する。
【0137】
このように処理することにより、マッチングする特徴に対応した画像劣化量を算出して、画像劣化の発生による特徴量マッチングの精度低下を防ぎ、画像劣化においても人物検索の精度を維持する。
【0138】
《服マッチング部の機能構成》
図23は、本実施形態に係る映像処理装置2200の服マッチング部2300の機能構成を示すブロック図である。なお、図23において、図5Aおよび図20Aと同様の機能構成部には同じ参照番号を付して、説明を省略する。
【0139】
服マッチング部2300は、画像劣化推定部を構成する、顔画像による画像劣化推定部2001と、標識画像による画像劣化推定部2002と、フラット画像による画像劣化推定部2003と、推定劣化量算出部2202と、を備える。推定劣化量算出部2202は、複数の画像劣化推定部2001〜2003から特徴量マッチングする模様種類に基づいて推定劣化量を算出する。
【0140】
(推定劣化量算出テーブル)
図24は、本実施形態に係る推定劣化量算出部2202が使用する推定劣化量算出テーブル2202aの構成を示す図である。推定劣化量算出テーブル2202aは、特徴量マッチングする模様種類に基づいて推定劣化量を算出するため、推定劣化量算出部2202が使用するテーブルである。
【0141】
推定劣化量算出テーブル2202aは、特徴量マッチングする模様種類2401に対応付けて、複数の劣化量推定画像2402を記憶する。そして、推定劣化量算出テーブル2202aは、劣化量推定画像2402に対応して、劣化量推定画像2402から推定された推定劣化量2403と、推定劣化量2403から模様種類に対応して算出された算出劣化量2404と、を記憶する。さらに、推定劣化量算出テーブル2202aは、特徴量マッチングの重み付け2405を記憶する。
【0142】
ここで、算出劣化量は、推定劣化量を模様の種類に応じて補正した劣化量である。例えば、もともと無地に近い模様であれば、劣化の影響を受けにくいが、細かいエッジが多く出現するストライプのような模様の場合には、劣化の度合いが大きくなるにつれ、急激にマッチングの精度が落ちる。このため、無地に近い模様に対しては、算出劣化量が小さくなるように設定し、ストライプのような模様に対しては算出劣化量が大きくなるように設定する。この度合いは、学習によって算出してもよいし、経験等に基づいて、ヒューリスティックに定めてもよい。なお、ここでは、直接、劣化量推定画像を記憶している場合について述べたが、推定劣化量から算出劣化量を求める変換モデルのみを記憶するようにしてもよい。具体的には、劣化推定量の各値に対して対応する算出劣化量を記憶するようにしておけばよい。あるいは、劣化推定量と算出推定量の関係を近似する回帰モデルを求め、このモデルを記述するパラメータを格納しておき、劣化推定量から算出推定量を算出するようにしてもよい。
【0143】
本実施形態によれば、オブジェクトを検索するための特徴量の基となる対象画像の種類に対応して適切な画像劣化を推定し、特に、画像劣化に影響され易い特徴量のマッチングを制御する。この制御によって、映像中の劣化した画像から抽出した特徴量に基づく検索対象となるオブジェクトの検索精度の低下を抑制することができる。
【0144】
[第9実施形態]
次に、本実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第2実施形態乃至第8実施形態と比べると、マッチングのための特徴量を格納する特徴量データベースに、画像劣化の推定、特徴量の抽出、特徴量のマッチング結果をフィードバックすることにより、以後の処理のために学習する点で異なる。その他の構成および動作は、第2実施形態乃至第8実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、本実施形態においては、人物検索を例に説明するが、車両検索など他のオブジェクト検索にも適用され、同様の効果を奏する。
【0145】
《服マッチング部の機能構成》
図25Aは、本実施形態に係る映像処理装置の服マッチング部2500の機能構成を示すブロック図である。なお、図25Aにおいて、図5Aと同様の機能構成部には同じ参照番号を付して、説明を省略する。
【0146】
服マッチング部2500の服特徴量DB2504は、服特徴量抽出部503が抽出した特徴量とマッチングするための、検索用の服の特徴量を格納する。さらに、服特徴量DB2504は、フィードバックされた、画像劣化推定部からの画像劣化量と、服特徴量抽出部503が抽出した服特徴量と、検索人物マッチング部405の人物マッチング結果とを対応付けて、格納する。そして、以降の人物検索のための特徴量マッチングに、画像劣化をより反映させて、かつ、より精度の高い人物検索をするために使用される。
【0147】
具体的には、画像劣化量と信頼度の関係を学習し、画像劣化量から信頼度を算出するモデルのパラメータを更新する。例えば、画像劣化がぶれの場合には、フィードバックした結果から、同一人物の服の特徴量が、ぶれていない場合に比べてぶれた場合にどの程度変化したかを求め、画像劣化量として求まるぶれの量と特徴量の変化の度合いを対応づける。これを複数のサンプルに対して行うことで、画像劣化量と信頼度の関係を求め、逐次更新していく。ここで、異なるフレーム間で同一人物の特徴量を対応づけるには、対象人物を追跡する必要があるが、この追跡処理には、既存の様々な方式を利用可能である。あるいは、オペレータが明示的に同一人物か否かを入力し、対応づけるようにしてもよい。同様に、霧や雨滴の場合も、その程度が異なるフレーム間で同一人物の特徴量同士を比較することによって、画像劣化量と信頼度の関係をフィードバックした結果から算出できる。
【0148】
(服特徴量DB)
図25Bは、本実施形態に係る服マッチング部2500の服特徴量DB2504の構成を示す図である。なお、図25Bにおいて、図5Bと同様の要素には同じ参照番号を付して、説明を省略する。
【0149】
服特徴量DB2504は、図5Bの特徴量テーブル510と画像劣化テーブル520とに加えて、フィードバックされたマッチング情報2530が格納される。マッチング情報2530は、検索対象の服ID2531に対応付けて、抽出特徴量2532と、推定した画像劣化量と、服マッチング結果2534と、人物マッチング結果2535と、を格納する。
【0150】
本実施形態によれば、画像劣化の推定、特徴量の抽出、特徴量のマッチング結果を特徴量データベースにフィードバックして、以後の処理のために利用する。この学習によって、映像中の劣化した画像から抽出した特徴量に基づく検索対象となるオブジェクトの検索精度の低下を、さらに抑制することができる。
【0151】
[第10実施形態]
次に、本発明の第3実施形態に係る映像処理装置について説明する。本実施形態に係る映像処理装置は、上記第2実施形態乃至第9実施形態と比べると、特徴量データベースの特徴量とのマッチングに加えて、映像中の異なる画像の画像劣化の度合いおよび抽出した特徴量をマッチングする点で異なる。その他の構成および動作は、第2実施形態乃至第9実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、本実施形態においては、人物検索を例に説明するが、車両検索など他のオブジェクト検索にも適用され、同様の効果を奏する。
【0152】
《服マッチング部の機能構成》
図26は、本実施形態に係る映像処理装置の服マッチング部2600の機能構成を示すブロック図である。図26において、図5Aと同様の機能構成部には同じ参照番号を付して、説明を省略する。
【0153】
服マッチング部2600は、複数組みの、顔検出部501と、顔画像劣化量推定部502と、服特徴量抽出部503と、を備える。あるいは、同じ顔検出部501と、顔画像劣化量推定部502と、服特徴量抽出部503と、を繰り返して使用してもよい。服特徴量マッチング部2630は、この複数組みの、画像劣化推定部からの画像劣化量と、服特徴量抽出部503からの服特徴量とをマッチングさせて、マッチング結果を生成する。
【0154】
(服特徴量マッチング部)
図27Aは、本実施形態に係る服マッチング部2600の服特徴量マッチング部2630の機能構成を示す図である。なお、図27Aにおいては、比較する一方を画像劣化量Aおよび服特徴量A、他方を画像劣化量Bおよび服特徴量B、とする。
【0155】
服特徴量マッチング部2630は、画像劣化量Aと画像劣化量Bとを比較する劣化量比較部2701と、服特徴量Aと服特徴量Bとを比較する特徴量比較部2702と、を備える。そして、服特徴量マッチング部2630は、画像劣化量の比較結果と服特徴量との比較結果から、服のマッチング結果を算出するマッチング結果算出部2703を備える。
【0156】
(服特徴量マッチングテーブル)
図27Bは、本実施形態に係る服特徴量マッチング部2630が使用する服特徴量マッチングテーブル2630aの構成を示す図である。服特徴量マッチングテーブル2630aは、複数の画像劣化量および服特徴量から服マッチング結果を生成するために服特徴量マッチング部2630により使用されるテーブルである。ここでは、便宜上、テーブル形式で記述した例を示すが、マッチング結果の格納は、図4Cと同様に、必ずしもテーブル形式でなくてもよい。
【0157】
服特徴量マッチングテーブル2630aは、検索対象の服ID2711に対応付けて、画像劣化量A2712と、画像劣化量B2713と、劣化量比較結果2714と、を記憶する。また、服特徴量マッチングテーブル2630aは、検索対象の服ID2711に対応付けて、服特徴量A2715と、服特徴量B2716と、服特徴量比較結果2717と、を記憶する。そして、服特徴量マッチングテーブル2630aは、劣化量比較結果2714と、を記憶する。また、服特徴量マッチングテーブル2630aは、劣化量比較結果2714と服特徴量比較結果2717とにから服マッチング結果を生成するマッチングアルゴリズム2718と、生成された服マッチング結果1719と、を記憶する。
【0158】
本実施形態によれば、推定した画像劣化の度合いおよび抽出した特徴量の組み合わせでマッチングをする。したがって、映像中の劣化した画像から抽出した特徴量に基づく検索対象となるオブジェクトの検索精度の低下を抑制しながら、同じ環境中の画像から精度よくオブジェクトを検索できる。
【0159】
[他の実施形態]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
【0160】
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する映像処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。特に、少なくとも、上述した実施形態に含まれる処理ステップをコンピュータに実行させるプログラムを格納した非一時的コンピュータ可読媒体(non-transitory computer readable medium)は本発明の範疇に含まれる。
【0161】
[実施形態の他の表現]
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定手段と、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出手段と、
前記検索対象となるオブジェクトの特徴量を格納する特徴量データベースと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定手段が推定した画像劣化の度合いに基づいて制御するマッチング手段と、
を備える映像処理装置。
(付記2)
前記オブジェクトの特徴量は、前記オブジェクトが有する模様の特徴量である付記1に記載の映像処理装置。
(付記3)
前記画像劣化推定手段は、前記オブジェクトが有する模様の種類に対応して、異なる度合いの画像劣化を推定する付記2に記載の映像処理装置。
(付記4)
前記オブジェクトの特徴量は、前記オブジェクトが有する色の特徴量をさらに含み、
前記マッチング手段は、前記画像劣化により前記模様の特徴量によるマッチングの信頼度が低下する場合に、前記色の特徴量によるマッチングを行なうように制御する付記2または3に記載の映像処理装置。
(付記5)
前記画像領域は、前記検索対象となるオブジェクトの一部である付記1乃至4のいずれか1項に記載の映像処理装置。
(付記6)
前記検索対象となるオブジェクトは人物であり、
前記画像劣化推定手段は、人物画像の一部である顔画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記人物の服または携帯物の特徴量である、付記5に記載の映像処理装置。
(付記7)
前記検索対象となるオブジェクトは車両であり、
前記画像劣化推定手段は、車両画像の一部であるナンバープレート画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記車両の車体または取付物ないし積載物の特徴量である、付記5に記載の映像処理装置。
(付記8)
前記画像領域は、前記映像中の特定領域である付記1乃至7のいずれか1項に記載の映像処理装置。
(付記9)
前記画像劣化推定手段は、既知の標識画像のエッジから画像劣化の度合いを推定する付記8に記載の映像処理装置。
(付記10)
前記画像劣化推定手段は、既知のフラット画像の画素のばらつきから画像劣化の度合いを推定する付記8に記載の映像処理装置。
(付記11)
前記画像劣化推定手段は、前記映像中から画像劣化の要因を認識して、前記要因に基づいて画像劣化の度合いを推定する付記1乃至10のいずれか1項に記載の映像処理装置。
(付記12)
少なくとも、前記画像劣化の度合いと、前記抽出した特徴量と、前記マッチングの結果との組み合わせを前記特徴量データベースにフィードバックする付記1乃至11のいずれか1項に記載の映像処理装置。
(付記13)
前記マッチング手段は、前記画像劣化の度合いと前記抽出した特徴量との、少なくとも2つの組み合わせをマッチングする付記1乃至12のいずれか1項に記載の映像処理装置。
(付記14)
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定ステップと、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出ステップと、
前記検索対象となるオブジェクトの特徴量を特徴量データベースに格納する格納ステップと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定ステップにおいて推定した画像劣化の度合いに基づいて制御するマッチングステップと、
を含む映像処理方法。
(付記15)
前記オブジェクトの特徴量は、前記オブジェクトが有する模様の特徴量である付記14に記載の映像処理方法。
(付記16)
前記画像劣化推定ステップにおいては、前記オブジェクトが有する模様の種類に対応して、異なる度合いの画像劣化を推定する付記15に記載の映像処理方法。
(付記17)
前記オブジェクトの特徴量は、前記オブジェクトが有する色の特徴量をさらに含み、
前記マッチングステップにおいては、前記画像劣化により前記模様の特徴量によるマッチングの信頼度が低下する場合に、前記色の特徴量によるマッチングを行なうように制御する付記15または16に記載の映像処理方法。
(付記18)
前記画像領域は、前記検索対象となるオブジェクトの一部である付記14乃至17のいずれか1項に記載の映像処理方法。
(付記19)
前記検索対象となるオブジェクトは人物であり、
前記画像劣化推定ステップにおいては、人物画像の一部である顔画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記人物の服または携帯物の特徴量である、付記18に記載の映像処理方法。
(付記20)
前記検索対象となるオブジェクトは車両であり、
前記画像劣化推定手段においては、車両画像の一部であるナンバープレート画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記車両の車体または取付物ないし積載物の特徴量である、付記18に記載の映像処理方法。
(付記21)
前記画像領域は、前記映像中の特定領域である付記14乃至20のいずれか1項に記載の映像処理方法。
(付記22)
前記画像劣化推定ステップにおいては、既知の標識画像のエッジから画像劣化の度合いを推定する付記21に記載の映像処理方法。
(付記23)
前記画像劣化推定ステップにおいては、既知のフラット画像の画素のばらつきから画像劣化の度合いを推定する付記21に記載の映像処理方法。
(付記24)
前記画像劣化推定ステップにおいては、前記映像中から画像劣化の要因を認識して、前記要因に基づいて画像劣化の度合いを推定する付記14乃至23のいずれか1項に記載の映像処理方法。
(付記25)
少なくとも、前記画像劣化の度合いと、前記抽出した特徴量と、前記マッチングの結果との組み合わせを前記特徴量データベースにフィードバックする付記14乃至24のいずれか1項に記載の映像処理方法。
(付記26)
前記マッチングステップにおいては、前記画像劣化の度合いと前記抽出した特徴量との、少なくとも2つの組み合わせをマッチングする付記14乃至25のいずれか1項に記載の映像処理方法。
(付記27)
映像中から画像劣化の指標となる画像領域の画像を抽出して、前記画像領域の画像の画像劣化の度合いを推定する画像劣化推定ステップと、
前記映像中から検索対象となるオブジェクトの特徴量を抽出する特徴量抽出ステップと、
前記検索対象となるオブジェクトの特徴量を特徴量データベースに格納する格納ステップと、
前記オブジェクトを前記映像中から検索する際に、前記抽出された特徴量と前記格納された特徴量とのマッチングを、前記画像劣化推定ステップにおいて推定した画像劣化の度合いに基づいて制御するマッチングステップと、
をコンピュータに実行させる映像処理プログラム。
(付記28)
前記オブジェクトの特徴量は、前記オブジェクトが有する模様の特徴量である付記27に記載の映像処理プログラム。
(付記29)
前記画像劣化推定ステップにおいては、前記オブジェクトが有する模様の種類に対応して、異なる度合いの画像劣化を推定する付記28に記載の映像処理プログラム。
(付記30)
前記オブジェクトの特徴量は、前記オブジェクトが有する色の特徴量をさらに含み、
前記マッチングステップにおいては、前記画像劣化により前記模様の特徴量によるマッチングの信頼度が低下する場合に、前記色の特徴量によるマッチングを行なうように制御する付記28または29に記載の映像処理プログラム。
(付記31)
前記画像領域は、前記検索対象となるオブジェクトの一部である付記27乃至30のいずれか1項に記載の映像処理プログラム。
(付記32)
前記検索対象となるオブジェクトは人物であり、
前記画像劣化推定ステップにおいては、人物画像の一部である顔画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記人物の服または携帯物の特徴量である、付記31に記載の映像処理プログラム。
(付記33)
前記検索対象となるオブジェクトは車両であり、
前記画像劣化推定手段においては、車両画像の一部であるナンバープレート画像の輪郭またはエッジから画像劣化の度合いを推定し、
前記特徴量は、前記車両の車体または取付物ないし積載物の特徴量である、付記31に記載の映像処理プログラム。
(付記34)
前記画像領域は、前記映像中の特定領域である付記27乃至33のいずれか1項に記載の映像処理プログラム。
(付記35)
前記画像劣化推定ステップにおいては、既知の標識画像のエッジから画像劣化の度合いを推定する付記34に記載の映像処理プログラム。
(付記36)
前記画像劣化推定ステップにおいては、既知のフラット画像の画素のばらつきから画像劣化の度合いを推定する付記34に記載の映像処理プログラム。
(付記37)
前記画像劣化推定ステップにおいては、前記映像中から画像劣化の要因を認識して、前記要因に基づいて画像劣化の度合いを推定する付記27乃至36のいずれか1項に記載の映像処理プログラム。
(付記38)
少なくとも、前記画像劣化の度合いと、前記抽出した特徴量と、前記マッチングの結果との組み合わせを前記特徴量データベースにフィードバックする付記27乃至37のいずれか1項に記載の映像処理プログラム。
(付記39)
前記マッチングステップにおいては、前記画像劣化の度合いと前記抽出した特徴量との、少なくとも2つの組み合わせをマッチングする付記27乃至38のいずれか1項に記載の映像処理プログラム。
【0162】
この出願は、2013年8月23日に出願された日本国特許出願 特願2013−173165号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
図1
図2
図3
図4A
図4B
図4C
図4D
図5A
図5B
図6
図7A
図7B
図7C
図8A
図8B
図9
図10
図11A
図11B
図11C
図11D
図12
図13A
図13B
図14A
図14B
図14C
図15
図16A
図16B
図16C
図17
図18A
図18B
図19
図20A
図20B
図21A
図21B
図22
図23
図24
図25A
図25B
図26
図27A
図27B