(58)【調査した分野】(Int.Cl.,DB名)
さらに、予めの学習により定められた、前記対象を含む標本データ及び前記対象を含まない標本データを分ける識別境界と、前記各標本データとの間の第1距離値を予め記憶した距離値記憶手段を有し、
前記学習用データ選出手段は、前記識別境界と前記入力データとの間の第2距離値を算出して、前記標本データと前記入力データとの前記相違度として前記第1距離値と前記第2距離値との差を算出すること、
を特徴とする請求項1に記載の対象識別装置。
前記学習用データ選出手段は、前記入力データと前記対象を含むと識別された標本データとの前記相違度に基づいて前記対象を含むと識別された標本データのうちの複数の標本データを前記学習用データとして選出可能な前記疎隔値を決定すること、を特徴とする請求項1から請求項3のいずれか1つに記載の対象識別装置。
前記学習用データは前記対象を含む標本データと前記対象を含まない標本データとを予め定めた同じ数ずつ含むこと、を特徴とする請求項1から請求項4のいずれか1つに記載の対象識別装置。
【発明を実施するための形態】
【0016】
本発明の実施の形態(以下実施形態という)である画像センサー1は監視空間を撮影して侵入者を検知する。画像センサー1は本発明に係る対象識別装置を備える。当該対象識別装置は撮影した画像、又は当該画像から抽出した特徴量を入力データとし、入力データに所定の対象が含まれているか否かを識別する。対象識別装置の基本構成における原理では、予め用意した複数クラスの標本データのうちの比較的少数であって入力データの識別に有効なものを学習用データとして選択し、これら選択した学習用データで識別境界を生成し入力データの識別を行う。以下、標本データ全てを用いて生成され各入力データに共通に適用される従来の識別器、識別境界をグローバル識別器、グローバル識別境界と呼び、一方、用意した標本データから各入力データに対応して選択したものを用いて生成される識別器、識別境界をローカル識別器、ローカル識別境界と呼ぶことにする。本発明の発明者は、入力データに対して一定以下の相違度を有する標本データを選択対象から除外し、相違度が一定より大きな標本データだけを用いてローカル識別器、ローカル識別境界を生成すると、入力データの識別精度が格段に向上するとの知見を得た。本発明は上記知見に基づいてなされたものである。以下、本発明の実施形態である画像センサー1を図面に基づいて説明する。
【0017】
《第1の実施形態》
[画像センサー1の構成]
画像センサー1は監視空間を撮影して侵入者を検知する。そのため画像センサー1は人の像を識別対象とした対象識別装置を備える。
図1は画像センサー1の概略の構成を示すブロック図である。画像センサー1は撮影部2、記憶部3、画像処理部4及び出力部5を含んで構成される。画像処理部4は撮影部2、記憶部3及び出力部5と接続される。
【0018】
撮影部2は例えば、CCDイメージセンサまたはC−MOSイメージセンサなどの撮像素子を用いて、監視空間から受光した光をグレースケールまたはカラーの画像信号に変換するカメラである。撮影部2は監視空間を所定時間おきに撮影し、撮影した画像を順次、画像処理部4に入力する。
【0019】
記憶部3は、ROM(Read Only Memory)、RAM(Random Access Memory)等の記憶装置である。記憶部3は画像処理部4を後述する各手段として動作させるためのプログラム、学習データや各手段が生成したデータなどの各種データを記憶し、画像処理部4との間でこれらのプログラムやデータを入出力する。
【0020】
画像処理部4はCPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の少なくとも1つのプロセッサ、及びその周辺回路を用いて構成される。画像処理部4は記憶部3からプログラムを読み出して実行することで、後述する各手段として動作し、撮影部2から入力された画像に人の像が含まれているか否かを識別し、人の像が含まれていた場合、侵入者を検知したとして出力部5に検知信号を出力する。
【0021】
出力部5は検知信号を入力されると外部出力を行うインターフェース機器であり、例えば、ネットワークに接続されて警備センターに通報を行う。また例えば、ブザー等に接続されてブザー鳴動による報知を行わせる。
【0022】
図2は第1の実施形態である画像センサー1の概略の機能ブロック図である。画像処理部4は、切り出し手段10、特徴抽出手段11、学習用データ選出手段13、ローカル識別器生成手段14及び入力データ識別手段15として適宜動作する。記憶部3は標本データ記憶手段12、信頼度記憶手段、及び距離値記憶手段として機能する。対象識別装置は、少なくとも標本データ記憶手段12、学習用データ選出手段13、ローカル識別器生成手段14及び入力データ識別手段15を含む。
【0023】
切り出し手段10は撮影部2から入力された画像(入力画像)から一部の領域を切り出して、切り出した部分画像を特徴抽出手段11に入力する。切り出し手段10は入力画像全体の各所から切り出しを行う。また切り出しは、入力画像中で検出したい人サイズの範囲に応じて画像または切り出す領域を拡大及び縮小して行われる。部分画像のサイズ(幅及び高さ)は標本データの基となった画像と同サイズに規格化する。切り出し手段10は、例えば、入力画像を予め定めた範囲で複数通りに拡大及び縮小し、入力画像、並びにその拡大画像及び縮小画像それぞれの画像上にて、標本データを抽出した画像のサイズと同一サイズの窓領域を垂直方向及び水平方向に所定画素ずつずらして順次配置し、各配置における窓領域内の画像を部分画像として順次出力する。
【0024】
特徴抽出手段11は切り出し手段10が切り出した部分画像から予め定めた種類の特徴量を抽出し、抽出した特徴量を学習用データ選出手段13へ出力する。特徴量として輝度勾配方向分布に関するヒストグラム・オブ・オリエンティッド・グラディエント(Histograms of Oriented Gradients:HoG)を用いることができる。または、ハール(Haar)特徴量、ローカル・バイナリー・パターン(Local Binary Pattern:LBP)、スパースコーディング(Sparse Coding)係数、部分画像そのもの、エッジ画像など、対象の識別に適した特徴量を用いることができる。いずれの特徴量も複数の要素からなる特徴ベクトルで表現される。この部分画像から抽出した特徴量が本実施形態における入力データである。
【0025】
標本データ記憶手段12は予め対象を含むことが識別された複数の対象データと予め対象を含まないことが識別された複数の非対象データとを標本データとして予め記憶している。標本データは、ローカル識別器の学習用データとして学習用データ選出手段13により読み出され、ローカル識別器生成手段14によるローカル識別器の学習・生成に用いられる。
【0026】
具体的には、対象データは、人の全身が写っているN
G枚の画像それぞれから特徴抽出手段11が事前に抽出したN
G個の特徴量と、それらが対象データであることを示す符号(例えば値“1”)とを対応付けたデータである。また、非対象データは、人が写っていないM
G枚の画像それぞれから特徴抽出手段11が事前に抽出したM
G個の特徴量と、それらが対象データでないことを示す符号(例えば値“0”)とを対応付けたデータである。
【0027】
標本データを抽出する画像のサイズは規格化され、全て一定サイズであり、例えば、幅64×高さ128画素である。また、標本データは抽出元の画像の特徴量(特徴ベクトル)であり、その種類は特徴抽出手段11が抽出する特徴量と同種である。
【0028】
ここで、標本データ記憶手段12に格納される全ての対象データと全ての非対象データ、つまり全ての標本データを用いて予め機械学習を行い、入力データが対象データと非対象データとのいずれのクラスであるかを識別するグローバル識別器を生成することができる。例えば、グローバル識別器はサポートベクターマシーン(SVM)で構成することができる。また、サポートベクターマシーンに代えて、全ての対象データと全ての非対象データにフィッシャー(Fisher)判別分析法あるいはアダブースト(AdaBoost)法などを適用することによって生成したグローバル識別器を用いることもできる。グローバル識別器の構成情報は予め記憶部3に記憶される。
【0029】
グローバル識別器を用いてグローバル識別境界と各標本データとの間の距離値(第1距離値)を予め求めることができる。グローバル識別境界は、全ての標本データを用いた予めの学習により定められた、これらの標本データを対象データと非対象データとに分ける識別境界であり、グローバル識別器の構成情報として記憶部3に記憶される。ちなみに、当該距離値はグローバル識別器に各標本データを入力したときの出力値として得られる。記憶部3は、予め算出された当該距離値、すなわちグローバル識別境界から対象データそれぞれまでの距離値及びグローバル識別境界から非対象データそれぞれまでの距離値を記憶する(距離値記憶手段)。
【0030】
なお、識別器の種類によっては、尤度をその出力値とするものもあるが、尤度も距離値と同質のものとして扱うことができる。
【0031】
また、記憶部3は標本データを表す特徴ベクトルの各成分が有する識別の信頼度を予め記憶する(信頼度記憶手段)。当該信頼度は、グローバル識別器における特徴ベクトルの各成分の重みであり、グローバル識別器の構成情報として予め記憶部3に記憶される。
【0032】
学習用データ選出手段13は、対象を含む標本データである対象データN
L個と、対象を含まない標本データである非対象データM
L個との両方を学習用データとして選出する。特に、学習用データ選出手段13は、標本データのうち入力データの近傍のものを除外して当該入力データに対する相違度が疎隔値を超えるものの一部または全部を学習用データとして選出する。
【0033】
疎隔値は、入力データ近傍の標本データとそれ以外の標本データとを弁別するための閾値であり、相違度と比較される。疎隔値は事前の実験に基づいて予め設定される、或いは入力データと標本データとの関係に基づいて入力データごとに設定される。
【0034】
例えば、学習用データ選出手段13は、標本データのうち当該入力データとの相違度が予め定めた疎隔値未満のものを除いた残存標本データから学習用データを選出する。つまり、学習用データ選出手段13は標本データ記憶手段12に記憶されている標本データの中から、少なくとも入力データとの相違度が疎隔値T
D以上であるものを学習用データとして選出し、当該学習用データをローカル識別器生成手段14へ出力する。これにより、ローカル識別器の学習に用いる学習用データは、特徴空間において入力データの近傍に存在する標本データを含まないデータ集合となる。
【0035】
具体的にはこの選出方法では、学習用データ選出手段13は標本データ記憶手段12に記憶されている対象データの中から入力データとの相違度が疎隔値T
D以上であるN
L個の対象データを選出すると共に、標本データ記憶手段12に記憶されている非対象データの中から入力データとの相違度が疎隔値T
D以上であるM
L個の非対象データを選出する。但し、N
L<N
G、M
L<M
Gであり、N
L及びM
Lは予め定めておく。
【0036】
ここで、選出する対象データの数N
Lと非対象データの数M
Lは同数とし、ローカル識別器の学習用データが対象データと非対象データとのいずれかに偏らないようにするのが好適である。このようにすることでローカル識別器が対象データ側、又は非対象データ側に偏ることが防げ、識別精度が向上する。
【0037】
また、ローカル識別器生成手段14における学習が確実に収束するよう、特徴量の次元数Pと比べて、N
L+M
Lを十分小さくするのが望ましい。例えば、P=5000のときにN
L=M
L=100とする。
【0038】
学習用データ選出手段13における学習用データの選出の仕方についてはさらに後述する。
【0039】
ローカル識別器生成手段14は学習用データ選出手段13にて選出した学習用データを用いた機械学習によりローカル識別器を生成する。すなわち、ローカル識別器生成手段14は、選出されたN
L個の対象データ及びM
L個の非対象データを用い、当該対象データ及び当該非対象データによって形成される特徴空間において、当該対象データが帰属する対象領域と当該非対象データが帰属する非対象領域とを分けるローカル識別境界を学習し、入力データ識別手段15へ出力する。
【0040】
例えば、ローカル識別器はサポートベクターマシーンで構成される。また、フィッシャー判別分析法、アダブースト法などを用いた機械学習により生成することもできる。なお、ローカル識別器はグローバル識別器と同種の識別器である必要はない。
【0041】
入力データ識別手段15は入力データをローカル識別器生成手段14により生成されたローカル識別器に入力して、入力データに対象が含まれているか否かを識別する。対象が含まれていると識別した場合、入力データ識別手段15は検知信号を生成して出力部5へ出力する。すなわち、入力データ識別手段15は入力データをローカル識別器に入力することでローカル識別境界から入力データまでの距離値を算出し、当該距離値が正であれば入力データが対象を含むと識別し、距離値が0又は負であれば入力データが対象を含まないと識別する。
【0042】
[学習用データの選出方法]
学習用データ選出手段13による学習用データの選出方法を説明する。N
L,N
G,M
L,M
G,T
D等の記号は上述した選出方法と共通とする。なお、T
Dは入力データの近傍にて学習用データが選出されない領域(空白領域)を規定する相違度の上限値であり、上述した選出方法では学習用データの選出範囲の下限閾値として選出に利用している。
【0043】
以下に説明する選出方法は、入力データと標本データとの相違度として入力データから標本データまでの距離値を直接算出するのではなく、グローバル識別境界から入力データまでの距離値(第2距離値)とグローバル識別境界から標本データまでの距離値(第1距離値)との差を相違度として算出する。
【0044】
グローバル識別境界から入力データまでの距離値は、入力データを記憶部3に記憶しているグローバル識別器に入力したときの出力値として得られる。一方、グローバル識別境界から各標本データまでの距離値は記憶部3に予め記憶されており、これを読み出して利用することができる。
【0045】
なお、グローバル識別器に入力して得られる距離値は、特徴ベクトルにて識別性の高い要素(成分)ほど高く重み付けた重み付け距離値となっている。ここで、重み付けを行わない場合、入力データと標本データとの間の識別性の低い要素における違いによって相違度が不当に高くなり、特徴空間において入力データの近傍に存在する標本データが学習用データとして選出されてしまう可能性が高まってしまうが、重み付け距離値を相違度とすることでその可能性を低減できる。
【0046】
また、グローバル識別境界から各標本データまでの距離値は予め算出しておくことができるため、入力データごとに相違度を算出するための負荷を減じることができる。標本データの数が多いほど当該効果は大きくなる。
【0047】
空白領域の疎隔値T
Dは上述した選出方法のように予め定めて選出範囲の閾値として利用することができるが、対象データを基準にして動的に定まるような選出方法もある。
図3はこのT
Dが動的に定まる学習用データの選出の仕方を説明する模式図である。同図において横軸はグローバル識別器の出力値(スコアS)であり、S=0がグローバル識別境界の位置であり、対象データのスコアは主に正の領域(境界から右側)に分布し、非対象データのスコアは主に負の領域(境界から左側)に分布する。
【0048】
学習用データ選出手段13はまず、学習用データの選出範囲の基準位置として、入力データと対象データとの相違度の最大値D
MAXを求める。そして対象データの中から相違度が当該最大値D
MAXに近い順、つまり入力データとの相違度が大きい順にN
L個の対象データを学習用データとして選出する。例えば、入力データのスコアS
Iを0.3、標本データのうちの対象データのスコア最大値S
P−MAXを0.8とすると、D
MAX=0.5となる。学習用データの対象データはS
P−MAXを起点にSが大きい順にN
L個選出される。選出された対象データのスコアの範囲(選出範囲)を[S
P−L,S
P−H]とする。ここでS
P−H=S
P−MAXであり、対象データについての選出範囲はD
MAXを基準にして入力データ側に設定される。
【0049】
標本データのうちの学習用データとして選出する非対象データのスコア最小値S
N−Lを入力データとの相違度がD
MAXとなる値に定める。具体的にはS
N−L=S
I−D
MAXであり、
図3の例ではS
N−Lは−0.2となる。学習用データとしての非対象データはS
N−Lを起点にSが小さい順(入力データとの相違度が大きい順)にM
L個選出される。選出された対象データのスコアの範囲を[S
N−L,S
N−H]とする。非対象データについての選出範囲は入力データに対して相違度がD
MAX異なるS
N−Lを基準にして入力データ側に設定される。
【0050】
この学習用データの選出では、選出した対象データに対する相違度の最小値(S
P−L−S
I)と、選出した非対象データに対する相違度の最小値(S
I−S
N−H)とのいずれか小さい方が上述したT
Dに相当する。すなわち、或る入力データについて選出した学習用データは、当該入力データとの相違度がT
D未満のものを除いた標本データから選出されている。
【0051】
識別対象が人である本実施形態のように対象データ数よりも非対象データ数が多い場合は(S
I−S
N−H)>(S
P−L−S
I)となる。よって、D
MAXとN
Lとによって疎隔値T
Dが定まり、相違度がT
D未満の標本データを除外した残存標本データの中から学習用データを選出したことになる。
【0052】
別の選出方法として、標本データの対象データの中から入力データとの相違度が大きい順にN
L個を学習用データの対象データとして選出すると共に選出した対象データの相違度の最小値(S
P−L−S
I)を疎隔値T
Dとし、これを非対象データの選出に際して閾値として用い、標本データの非対象データのうち入力データとの相違度が疎隔値T
D以上であるものの中から相違度が小さい順にM
L個の非対象データを選出する方法がある。この選出方法においてもD
MAXとN
Lとによって疎隔値T
Dが定まり、相違度がT
D未満の標本データを除外した残存標本データの中から学習用データを選出したことになる。
【0053】
ここで説明した入力データと対象データとの相違度の最大値D
MAXを用いた選出方法では、対象データの中から入力データとの相違度ができるだけ大きなものを選出できる。このようにすれば、識別対象を人とした場合のように標本データにおいて非対象データよりも対象データの分布範囲の方が狭いデータを識別する場合に、特徴空間において入力データの近傍に存在する標本データが学習用データに選出される可能性を好適に排除できる。
【0054】
D
MAXを用いたこれらの選出方法によって、学習用データ選出手段13は入力データと対象データとの相違度に基づいて複数の対象データを選出可能な疎隔値を決定している。これにより、複数の対象データ及び複数の非対象データを確実に含んだ学習用データを選出できる。
【0055】
[画像センサー1の動作]
図4は画像センサー1の概略の動作を示すフロー図である。例えば、装置の管理者が電源を投入すると画像センサー1の各部が動作を始める。撮影部2は所定の時間間隔で監視空間を撮像し、撮像した画像を画像処理部4に入力する。画像処理部4は画像が入力されるたびにS1〜S7の処理を繰り返す。
【0056】
画像処理部4は、撮影部2から順次、画像を取得する(ステップS1)。画像処理部4は切り出し手段10として機能し、例えば、0 .75倍〜1.5倍まで0.125刻みの7段階で監視画像を順次、拡大または縮小し、各倍率の画像の各所から64×128画素の部分画像を順次切り出す(ステップS2)。次に、画像処理部4は特徴抽出手段11として機能し、ステップS2にて切り出した部分画像から特徴量を抽出する(ステップS3)。ここでは、この部分画像から抽出された特徴量が上述した入力データに当たる。当該特徴量は画像センサー1の対象識別装置に入力され、当該特徴量に人の情報が含まれるかを識別する識別処理が行われる(ステップS4)。
【0057】
図5は識別処理S4の概略のフロー図である。画像処理部4は本発明の対象識別装置を構成する学習用データ選出手段13として機能し、標本データ記憶手段12から標本データである対象データ及び非対象データを読み出すと共に、記憶部3の信頼度記憶手段から信頼度を、記憶部3の距離値記憶手段から距離値をそれぞれ読み出し、上述した相違度を算出する(S10)。具体的には、部分画像から抽出した特徴量と各対象データとの間で信頼度にて重み付けた相違度を算出し、相違度で対象データをソートする。また部分画像から抽出した特徴量と各非対象データとの間で信頼度にて重み付けた相違度を算出し、相違度で非対象データをソートする。そして、学習用データ選出手段13は、対象データの相違度の最大値D
MAXを求め(ステップS11)、対象データの中から相違度が上位のN
L個を学習用データとして選出する(ステップS12)。また、非対象データのうち相違度がD
MAX以下のものの中から相違度が上位のM
L個を学習用データとして選出する(ステップS13)。
【0058】
次に、画像処理部4は本発明の対象識別装置を構成するローカル識別器生成手段14として機能し、特徴量に対応してステップS12及びS13にて選出した(N
L+M
L)個の学習用データを用いて当該特徴量に対応したローカル識別器を生成する(ステップS14)。
【0059】
ローカル識別器が得られると、画像処理部4は本発明の対象識別装置を構成する入力データ識別手段15として機能し、ステップS14にて生成したローカル識別器に部分画像から抽出した特徴量を入力し、ローカル識別器の出力を識別結果として得る(ステップS15)。人の情報が含まれていることを示す識別結果が得られた場合、例えば、人を検知したことと、当該部分画像の切り出し位置及び倍率を記憶部3に記録する(ステップS16)。なお、侵入者を検知する画像センサー1においては、人の情報が含まれていないことを示す識別結果が得られた場合の記録は省略してもよい。
【0060】
図4に戻り説明を続ける。監視画像から切り出される全ての部分画像についてステップS2〜S4の処理が繰り返され(ステップS5)、それが完了すると、画像処理部4はステップS4にて記録した識別結果に、人の情報が含まれていたことを示すものがあるかを調べる(ステップS6)。人の情報が含まれていたことを示す識別結果があれば、画像処理部4は侵入者を検知した旨を表す検知信号を出力部5に送出して、ステップS1に戻り次の監視画像の処理を開始する。一方、人の情報が含まれていたことを示す識別結果がなければ、画像処理部4は侵入者を検知しないとしてステップS1に戻り次の監視画像の処理を開始する。
【0061】
[学習用データの選出方法の変形例]
(1)
図3を用いて説明した上述の選出方法では、入力データに対する対象データの相違度の最大値D
MAXを基準に学習用データとする対象データ及び非対象データをそれぞれ選出したが、基準とする値はD
MAXに代えて、入力データに対する対象データの相違度の平均値D
AVEとしてもよい。
【0062】
図6は平均値D
AVEを基準にした学習用データの選出の仕方を説明する模式図であり、
図3と同様、横軸はグローバル識別器のスコアSである。学習用データ選出手段13は、学習用データとする対象データを、標本データにおける対象データのスコアの平均値S
P−AVE又は、入力データと対象データとの相違度の平均値D
AVEを求める。なお、S
P−AVEとD
AVEとはS
P−AVE=S
I+D
AVEなる関係にある。
【0063】
学習用データとするN
L個の対象データとして、スコアS
P−AVEの両側からそれぞれN
L/2個選出する。つまり、D
AVEより相違度が大きい(つまりスコアがS
P−AVEより大きい)対象データとD
AVEより相違度が小さい(つまりスコアがS
P−AVEより小さい)対象データとをそれぞれN
L/2個選出する。
【0064】
非対象データに関しては、対象データに基づいて求めたD
AVEを用いてS
N−M=S
I−D
AVEで与えられる基準点を定め、学習用データとするM
L個の非対象データとして、当該基準点S
N−Mの両側からそれぞれM
L/2個選出する。つまり、D
AVEより相違度が大きい(つまりスコアがS
N−Mより小さい)対象データとD
AVEより相違度が小さい(つまりスコアがS
N−Mより大きい)対象データとをそれぞれM
L/2個選出する。
【0065】
たとえば、
図6の例では、標本データにおける対象データの分布に応じてS
P−AVE=0.7またはスコアS
I=0.3なる入力データに対してD
AVE=0.4が定まり、その結果、非対象データの選出基準点S
N−MはS
N−M=−0.1に設定される。
【0066】
なお、この選出方法を実行すると、D
AVEとN
Lとによって疎隔値T
Dが定まり、相違度がT
D未満の標本データを除外した残存標本データの中から学習用データを選出したことになる。
【0067】
この方法によっても、学習用データ選出手段13は入力データと対象データとの相違度に基づいて複数の対象データを選出可能な疎隔値を決定している。これにより、複数の対象データ及び複数の非対象データを確実に含んだ学習用データを選出できる。
【0068】
(2)
図3や
図6で説明した選出方法では入力データ及び標本データそれぞれのグローバル識別境界からの距離値の差を相違度として求めたが、入力データから各標本データまでの距離値を直接求めて相違度とすることもできる。その際、特徴ベクトルで表現された入力データ及び標本データそれぞれの各要素(ベクトル成分)を、全ての対象データと全ての非対象データを用いて機械学習した識別の信頼度にて重み付けた重み付け距離値(重み付けユークリッド距離)とするのがよい。なお、各要素に対する識別の信頼度は、グローバル識別器における当該要素に対する重みとして標本データ記憶手段12に記憶されている。
【0069】
重み付け距離値を用いることで、識別性の低い要素が入力データと偶然に相違している標本データの相違度が不当に高くなることを防止でき、特徴空間において入力データの近傍に存在する標本データが学習用データに含まれてしまう可能性を減じることができる。
【0070】
図7はこの選出方法の一例を示す特徴空間の模式図であり、▲印は入力データ、標本データのうち対象データを●及び○印で、また非対象データを■及び□印で示している。このうち●及び■印は本手法で学習用データとして選出され得る候補であり、○及び□印は選出されないデータである。
【0071】
図7に示す選出方法では、空白領域の上限相違度として予め設定された疎隔値T
Dを用い、相違度が疎隔値T
D以上の対象データの中からN
L個をランダムに選出し、相違度が疎隔値T
D以上の非対象データの中からM
L個をランダムに選出する。この方法では簡単な方法でローカルデータにおける対象データ及び非対象データのそれぞれが偏りなく選出でき、ローカル識別器の識別精度が向上する。なお、距離値の代わりに正規化相関値の逆数を相違度としてもよい。
【0072】
図8は他の例を示す特徴空間の模式図であり、図に示す記号は
図7と共通である。
図8に示す選出方法では、相違度が疎隔値T
D以上の対象データと相違度が疎隔値T
Dより大きな非対象データとを比較して、N
L個の対象データ及びM
L個の非対象データを確保可能な相違度の範囲[T
MIN,T
MAX]を決定し、当該範囲の中からN
L個の対象データ及びM
L個の非対象データをランダムに選出する。この方法では規定数の学習用データを確実に確保でき、ローカル識別器の識別精度が向上する。
【0073】
なお、相違度が疎隔値T
D以上の対象データの中から相違度の分散を最大化するN
L個を選出し、相違度が疎隔値T
D以上の非対象データの中から相違度の分散を最大化するM
L個を選出してもよい。具体的には、選出するN
L個の対象データを変えながらこれらN
L個の相違度の分散を求め、先に求めた分散と比較することを繰り返すことで、相違度の分散を最大化するN
L個を選出する。非対象データについても同様にして分散の最大化を図る。
【0074】
《第2の実施形態》
本発明の第2の実施形態に係る画像センサー1では、本発明の特徴である、学習用データの選出及びそれに基づくローカル識別器の生成の中核処理が予め行われ、生成されたローカル識別器の構成情報を記憶部から読み出して各入力データに対応したローカル識別器を生成する。この点で第1の実施形態の画像センサー1と基本的に相違する。
【0075】
以下、第1の実施形態と同一の構成要素には同一の符号を付して第1の実施形態での説明を援用しここでの説明の簡素化を図ることとし、主に、第2の実施形態の画像センサー1が第1の実施形態と異なる点について説明する。
【0076】
図9は第2の実施形態である画像センサー1の概略の機能ブロック図である。画像処理部4は、切り出し手段10、特徴抽出手段11、ローカル識別器生成手段17及び入力データ識別手段15として適宜動作する。記憶部3は識別器テーブル記憶手段16として動作する。対象識別装置は、少なくとも識別器テーブル記憶手段16、ローカル識別器生成手段17及び入力データ識別手段15を含む。
【0077】
識別器テーブル記憶手段16は、入力データがとり得る範囲内の特徴データそれぞれに付与したインデックスと、当該インデックスを付与した特徴データの識別に適したローカル識別器の構成情報とを対応付けるテーブルである。各特徴データの識別に適したローカル識別器は、特徴空間における各点で表される特徴データ(特徴ベクトル)を仮想的な入力データとして第1の実施形態で説明した方法を適用して予め生成することができる。すなわち、識別器テーブル記憶手段16に記載する構成情報は、対象を含むか否かが予め識別された複数の標本データの中から、インデックスを介して当該構成情報と対応付けられた特徴データとの相違度が疎隔値を超えない標本データを除外した残余の標本データの一部又は全部を用いた学習により生成された構成情報である。
【0078】
ローカル識別器は線形結合された識別関数で与えられ、その線形式の各項の係数のセットを識別器の構成情報とすることができる。なお、係数の個数は基本的には特徴量の次元数で定まるが、スパースコーディングや、主成分分析、独立成分分析などの手法を用いることで、実質的な係数の個数を減らすことができ、そのような手法により、識別器テーブル記憶手段16に格納するテーブルのサイズを小さくすることができる。
【0079】
例えば、入力データがとり得る範囲は、特徴空間における標本データの分布範囲とすることができ、この範囲において、特徴空間の各次元を予め定めた間隔で離散化して得られる微小空間ごとに、当該微小空間を代表する特徴ベクトル定め、これに対応するローカル識別器の構成情報を求める。
【0080】
微小空間にはそれらを代表するインデックスを付与し、識別器テーブル記憶手段16には当該インデックスとローカル識別器の構成情報とを対応付けたテーブルが格納される。
【0081】
ローカル識別器生成手段17は、特徴抽出手段11から入力データが入力されると、入力データと対応する特徴データを求め、求めた特徴データからそのインデックスを特定する。例えば、入力データとの距離が最も近い特徴データのインデックスを求める。そして、これをキーとして識別器テーブル記憶手段16のテーブルを検索して当該インデックスに対応するローカル識別器の構成情報を読み出し、ローカル識別器を作る。
【0082】
入力データ識別手段15は入力データをローカル識別器生成手段17により生成されたローカル識別器に入力して、ローカル識別器により入力データが対象をが含むか否かを識別させる。対象が含まれていると識別された場合、入力データ識別手段15は検知信号を生成して出力部5へ出力する。
【0083】
このテーブルに予めローカル識別器の構成情報を格納しておく構成は、入力データごとに学習用データの選出、及びローカル識別器の生成のための演算処理を省略することができ、画像センサー1の処理負荷が軽減され、処理速度が向上する効果がある。
【0084】
特に当該効果は、テーブルがグローバル識別器の出力値(スコア)をローカル識別器の構成情報に対応付けた場合に顕著となる。この場合には、テーブルは離散化されたスコアごとにローカル識別器の構成情報を格納する。対象識別装置は予め用意した標本データから予め生成されたグローバル識別器を有し、ローカル識別器生成手段17は入力データに対してグローバル識別器のスコアを算出し、それに対応するインデックスを求めテーブルを検索する。
【0085】
この構成では、インデックスは1次元であるスコア軸を離散化して設定され、インデックスの数は多次元の空間を離散化する場合よりはるかに少なくなる。つまり、テーブルのサイズを小さくでき、記憶部3の容量を少なくできると共に画像処理部4におけるテーブルの検索処理時間を短縮できる。
【0086】
なお、グローバル識別器は例えば、その構成情報を識別器テーブル記憶手段16に格納しておき、ローカル識別器生成手段17が読み出して利用する構成とすることができる。
【0087】
[その他の変形例]
(1)入力データは、入力画像そのもの、入力画像の全体から特徴抽出手段11により抽出した特徴量または切り出し手段10が切り出した部分画像とすることもできる。
【0088】
撮影部2に代えて画像ファイルを格納している録画装置やコンピューターを接続し、過去に撮影された画像又はその特徴量を対象識別装置への入力データとしてもよい。
【0089】
さらに、入力データは画像に限らない。音響信号、マイクロ波センサー等のセンサー信号又はそれらの特徴量などとしてもよい。
【0090】
(2)上記実施形態では人の像と人以外の像を識別する例を示したが、対象はこれに限らない。例えば、入力データが画像又はその特徴量の場合は対象を人の顔、性別または車両などとすることができ、入力データが音響信号又はその特徴量の場合は対象を悲鳴などとすることができる。
【0091】
(3)上記実施形態では対象と非対象を識別する2クラス問題を例示したが、車種判定、文字認識、顔による個人識別などの多クラス問題にも適用できる。この場合、クラスのペアごとに学習データを選出して該ペア間のローカル識別境界を学習すればよい。
【0092】
(4)上記第1の実施形態では、標本データ記憶手段12が記憶している全ての標本データを用いてグローバル識別器、グローバル識別境界及び信頼度を学習しておくとしたが、記憶している標本データ数と学習に用いた標本データ数とは異なっていてもよく、N
L個より十分多い個数の対象データ及びM
L個より十分多い個数の非対象データを用いて学習しておけばよい。例えば、グローバル識別器、グローバル識別境界及び信頼度の学習後に、標本データ記憶手段12に新たな標本データを追記してローカル識別器の生成に利用可能なデータを増やす運用などが考えられる。要するにグローバル識別器、グローバル識別境界及び信頼度は入力データの近傍の標本データを除外した学習によって生成できない代わりに、ローカル識別器の学習用データよりも多くの標本データを用いて予めの学習により生成しておける点が重要である。
【0093】
なお、この場合、標本データの追記と共に当該標本データの第1距離値を算出して距離値記憶手段に追記しておく。
【0094】
(5)上記実施形態では、対象識別装置が入力データの全てに対してローカル識別器を生成または読み出し、当該ローカル識別器により入力データを識別したが、別の実施形態において対象識別装置はグローバル識別境界付近の入力データに限定してローカル識別器を用い、その他の入力データに対してはグローバル識別器により入力データを識別することで識別精度を維持しつつ計算量を削減する。
【0095】
すなわち、対象識別装置はまずグローバル識別器に入力データを入力して、出力値であるスコア(グローバル・スコア)の絶対値|S
G|を予め定めた閾値T
Sと比較する。|S
G|>T
Sの場合、対象識別装置はS
Gに基づき入力データが対象を含むか否かを識別する。例えばS
G>0であれば対象を含み、S
G≦0であれば対象を含まないと識別する。他方、|S
G|≦T
Sの場合、対象識別装置は上述したように入力データに対応してローカル識別器を生成または読み出して、当該ローカル識別器により入力データを識別する。