(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-26
(45)【発行日】2024-02-05
(54)【発明の名称】特徴量の評価装置および評価装置方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20240129BHJP
【FI】
G06T7/00 350B
(21)【出願番号】P 2020009951
(22)【出願日】2020-01-24
【審査請求日】2023-01-19
(73)【特許権者】
【識別番号】318006365
【氏名又は名称】JRCモビリティ株式会社
(74)【代理人】
【識別番号】100126561
【氏名又は名称】原嶋 成時郎
(74)【代理人】
【識別番号】100141678
【氏名又は名称】佐藤 和彦
(72)【発明者】
【氏名】矢野 邦哲
(72)【発明者】
【氏名】時枝 幸伸
(72)【発明者】
【氏名】星 将広
【審査官】片岡 利延
(56)【参考文献】
【文献】国際公開第2019/235116(WO,A1)
【文献】特開2019-144607(JP,A)
【文献】特開2012-073761(JP,A)
【文献】特開2019-003527(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
サポートベクタマシンの識別境界の計算に用いる学習データの特徴量の値を
最大値が1になるとともに最小値が0になるように正規化する特徴量正規化部と、
前記正規化された特徴量の値
及び前記学習データのラベルに対応する教師変数を用いて前記識別境界を計算して前記特徴量のそれぞれに対応する重み係数を算定する係数算定部と、
前記算定された重み係数の値を
前記教師変数に対応する重み係数の値が1になるように正規化する係数正規化部と、を備
える、
ことを特徴とする特徴量の評価装置。
【請求項2】
前記学習データの前記特徴量が、検知対象の物標をレーダスキャンして取得されるレーダデータが用いられて計算される特徴量である、
ことを特徴とする請求項1に記載の特徴量の評価装置。
【請求項3】
サポートベクタマシンの識別境界の計算に用いる学習データの特徴量の値を
最大値が1になるとともに最小値が0になるように正規化する処理と、
前記正規化された特徴量の値
及び前記学習データのラベルに対応する教師変数を用いて前記識別境界を計算して前記特徴量のそれぞれに対応する重み係数を算定する処理と、
前記算定された重み係数の値を
前記教師変数に対応する重み係数の値が1になるように正規化する処理と、を有
する、
ことを特徴とする特徴量の評価方法。
【請求項4】
前記学習データの前記特徴量が、検知対象の物標をレーダスキャンして取得されるレーダデータが用いられて計算される特徴量である、
ことを特徴とする請求項3に記載の特徴量の評価方法。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、特徴量の評価装置および評価方法に関し、特に、分類対象のデータから抽出される特徴量の有効性をサポートベクタマシンを用いて評価する技術に関する。
【背景技術】
【0002】
線形サポートベクタマシン(SVM:Support Vector Machine の略)は、教師あり学習による2クラスのパターン識別手法として知られている。サポートベクタマシンを用いて識別処理を行う技術として、検査対象物を撮像して得られたスペクトル画像に基づいて、該検査対象物中に混在する異物または不良品を検出する装置であって、検査対象物を撮像する撮像部と、撮像部による撮像により得られたスペクトル画像を、サポートベクタマシンを用いて解析し、検査対象物中に混在する異物または不良品を検出する制御部と、を備える検出装置が知られている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、線形サポートベクタマシンは、特徴空間において超平面の識別関数を学習することで2クラスの分類を行う。線形サポートベクタマシンは、多入力に対して1つの出力を返す識別器として利用され、入力された特徴量のそれぞれに対して重み係数を掛け合わせることで、分類対象の識別結果を出力する。重み係数は、特徴量と当該の特徴量に対応する識別結果との組み合わせを識別器に学習させることによって算定される。しかしながら、特許文献1に記載の検出装置では、入力された特徴量について、適切な識別への影響の度合い(言い換えると、特徴量の有効性)を評価するようにはしていないので、特徴量の選択が妥当であるか否かが客観的に検証されていない、という問題がある。特許文献1に記載の検出装置では、また、線形サポートベクタマシンによる識別の難易度を評価するようにはしていないので、線形サポートベクタマシンによる識別処理(言い換えると、識別結果)が妥当であるか否かが客観的に検証されていない、という問題がある。
【0005】
そこでこの発明は、特徴量それぞれが識別結果に与える影響度と識別の難易度とを同時に評価することが可能な特徴量の評価装置および評価方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1に記載の発明は、サポートベクタマシンの識別境界の計算に用いる学習データの特徴量の値を最大値が1になるとともに最小値が0になるように正規化する特徴量正規化部と、前記正規化された特徴量の値及び前記学習データのラベルに対応する教師変数を用いて前記識別境界を計算して前記特徴量のそれぞれに対応する重み係数を算定する係数算定部と、前記算定された重み係数の値を前記教師変数に対応する重み係数の値が1になるように正規化する係数正規化部と、を備える、ことを特徴とする特徴量の評価装置である。
【0007】
請求項2に記載の発明は、請求項1に記載の特徴量の評価装置において、前記学習データの前記特徴量が、検知対象の物標をレーダスキャンして取得されるレーダデータが用いられて計算される特徴量である、ことを特徴とする。
【0008】
また、請求項3に記載の発明は、サポートベクタマシンの識別境界の計算に用いる学習データの特徴量の値を最大値が1になるとともに最小値が0になるように正規化する処理と、前記正規化された特徴量の値及び前記学習データのラベルに対応する教師変数を用いて前記識別境界を計算して前記特徴量のそれぞれに対応する重み係数を算定する処理と、前記算定された重み係数の値を前記教師変数に対応する重み係数の値が1になるように正規化する処理と、を有する、ことを特徴とする特徴量の評価方法である。
【0009】
請求項4に記載の発明は、請求項3に記載の特徴量の評価方法において、前記学習データの前記特徴量が、検知対象の物標をレーダスキャンして取得されるレーダデータが用いられて計算される特徴量である、ことを特徴とする。
【発明の効果】
【0010】
請求項1に記載の発明や請求項3に記載の発明によれば、サポートベクタマシンの学習に用いられる学習データが特徴量の1つとして学習データのラベルに対応する教師変数を含むとともに算定された重み係数を正規化するようにしているので、教師変数に対応する重み係数の値を基準として、特徴量それぞれが識別結果に与える影響度(別言すると、特徴量それぞれの有効性)と識別の難易度とを数値化して同時に評価することが可能となる。請求項1に記載の発明や請求項3に記載の発明によれば、また、多次元の特徴量の影響度/有効性を横ならびで数値化した上で比較して評価することが可能となり、しかも、複数の識別結果の多次元の特徴量の影響度/有効性を横ならびで数値化した上で比較して評価することが可能となる。
【0011】
請求項2に記載の発明や請求項4に記載の発明によれば、レーダデータを用いて検知対象の物標の種別などを識別する際に、上記の作用効果を発揮することが可能となる。
【図面の簡単な説明】
【0012】
【
図1】この発明の実施の形態に係る特徴量の評価装置の概略構成を示す機能ブロック図である。
【
図2】
図1の特徴量の評価装置における処理手順であるとともにこの発明の実施の形態に係る特徴量の評価方法の処理手順を示すフローチャートである。
【
図3】レーダデータを取得する際の人や自動車の移動の内容を説明する図である。
【発明を実施するための形態】
【0013】
以下、この発明を図示の実施の形態に基づいて説明する。
【0014】
図1は、この発明の実施の形態に係る特徴量の評価装置1の概略構成を示す機能ブロック図である。
図2は、特徴量の評価装置1における処理手順であるとともにこの発明の実施の形態に係る特徴量の評価方法の処理手順を示すフローチャートである。
【0015】
この特徴量の評価装置1は、サポートベクタマシンを用いてデータの特徴量を評価する装置であり、主として、入力部2と、表示部3と、記憶部4と、メインタスク5と、中央処理部6と、を備える。
【0016】
線形サポートベクタマシン(SVM:Support Vector Machine の略)は、教師あり学習による2クラスのパターン識別手法であり、入力xを2つのクラスに分類するための識別境界(「超平面」と呼ばれる)としての関数y=f(x)(数式1参照)を学習データの集合(数式2参照)から学習して求めて、入力xの分類処理を行う手法である。
(数1) y=sgn[w・x+w0]
ただし、w・x=w1x1+w2x2+・・・+wnxn
sgn[u]=+1(u≧0),-1(u<0)
ここに、x1,x2,・・・,xn:特徴量
w1,w2,・・・,wn:重み係数
w0:バイアス
sgn[u]:符号関数(ここでは、+1か-1を返す)
(数2) (x1,y1),(x2,y2),・・・,(xm,ym)∈Rn×{+1,-1}
【0017】
超平面を求める学習では、重み係数w1,w2,・・・,およびwnを求める。具体的には、学習データの集合を用いて学習を行って、内積空間Rn内でym=+1であるxmベクトルとym=-1であるxmベクトルとを分離する識別境界の中でマージンが最も大きくなる識別境界を超平面として計算する。マージンは、ym=+1であるxmベクトルおよびym=-1であるxmベクトルの中で識別境界(超平面)に最も近いxmベクトルと前記識別境界(超平面)との間の距離である。
【0018】
各xmベクトルは、特徴量x1,x2,・・・,およびxnを要素とするベクトルであり、「特徴ベクトル」とも呼ばれる。また、識別境界の最も近くに位置する学習データ(別言すると、特徴ベクトル)は「サポートベクトル」とも呼ばれる。また、yの値は、入力xを2つのクラスに分類する際のクラスであり、「ラベル」とも呼ばれる。つまり、学習データは、特徴量の値とラベルとの組み合わせデータとして構成され、「ラベル付きデータ」や「ラベル付き特徴ベクトル」とも呼ばれる。
【0019】
線形サポートベクタマシンの超平面の計算の仕法は、周知の手法であり、また、この発明では特定の手法には限定されないので、ここでは詳細な説明を省略する。
【0020】
なお、上記の説明では入力xを2つのクラスに分類する場合を例に挙げて説明したが、この発明は、2つのクラスに分類する場合に限定されるものではなく、3つ以上のクラスに分類する場合(「カーネル化サポートベクタマシン」などとも呼ばれる)に対しても適用され得る。また、この発明は、学習データの全てを分離可能な場合(「ハードマージンサポートベクタマシン」などとも呼ばれる)だけでなく、学習データの全てを完全には分離することができない場合(「ソフトマージンサポートベクタマシン」などとも呼ばれる)に対しても適用され得る。さらに付け加えると、この発明は、クラスに分類するための識別境界が超平面である場合だけでなく、前記識別境界が超曲面である場合に対しても適用され得る。
【0021】
そして、この実施の形態に係る特徴量の評価装置1は、サポートベクタマシンの識別境界の計算に用いる学習データの特徴量x
1,x
2,・・・,およびx
n-1の値を正規化する特徴量正規化部としての特徴量正規化タスク5aと、正規化された特徴量x
1’,x
2’,・・・,およびx
n-1’ならびにx
nの値を用いて識別境界を計算して特徴量x
1’,x
2’,・・・,およびx
n-1’ならびにx
nのそれぞれに対応する重み係数w
1,w
2,・・・,およびw
nを算定する係数算定部としての係数算定タスク5bと、算定された重み係数w
1,w
2,・・・,およびw
nの値を正規化する係数正規化部としての係数正規化タスク5cと、を備え、学習データが、特徴量の1つとして、学習データのラベルに対応する教師変数x
nを含む、ようにしている(
図1参照)。
【0022】
また、この実施の形態に係る特徴量の評価方法は、サポートベクタマシンの識別境界の計算に用いる学習データの特徴量x
1,x
2,・・・,およびx
n-1の値を正規化する処理(ステップS2)と、正規化された特徴量x
1’,x
2’,・・・,およびx
n-1’ならびにx
nの値を用いて識別境界を計算して特徴量x
1’,x
2’,・・・,およびx
n-1’ならびにx
nのそれぞれに対応する重み係数w
1,w
2,・・・,およびw
nを算定する処理(ステップS3)と、算定された重み係数w
1,w
2,・・・,およびw
nの値を正規化する処理(ステップS4)と、を有し、学習データが、特徴量の1つとして、学習データのラベルに対応する教師変数x
nを含む、ようにしている(
図2参照)。
【0023】
特徴量の評価装置1の中央処理部6は、特徴量の評価装置1を構成する各部を統制して制御などするための機序であり、例えば、CPUなどを用いたプロセッサによって構成されたり、記憶部4に格納されたプログラムに従って各機能を実現するものとして構成されたりする。
【0024】
入力部2は、各種情報や指令などを入力するためのインターフェイスであり、例えばキーボードやマウスなどで構成される。入力部2は、装置利用者の操作を受け付けて、前記操作に対応する入力データや指令の内容を表す信号を中央処理部6に転送する。
【0025】
表示部3は、各種情報や画像などを表示するための表示装置であり、例えば液晶画面などで構成される。
【0026】
記憶部4は、各種情報、プログラム、およびデータなどを記憶するための記憶装置/記憶領域であり、例えばハードディスクやメモリなどで構成される。なお、記憶部4として、特徴量の評価に纏わる処理を実行する際の作業領域として機能する揮発性メモリが含まれるようにしてもよい。
【0027】
記憶部4には、特に、学習データベース4aが格納される。学習データベース4aは、識別境界としての超平面を計算する際に用いられる学習データの集合が記録されるデータベースである。
【0028】
この発明では、学習データが教師項を含むことを特徴とする。例えば数式1について、w1x1,w2x2,・・・,およびwn-1xn-1は特徴量があてはめられる項として用いられ、wnxnは教師項として用いられる。この場合、分類対象の性質を表す特徴量x1,x2,・・・,およびxn-1の実際の値の組み合わせに対応するクラスを表すラベルyが+1である場合にはxn=1とし、前記ラベルyが-1である場合にはxn=0とする(数式3参照)。特徴ベクトルを構成する要素の1つとして、言い換えると、学習データを構成する特徴量の1つとして用いられる、或いは、学習データを構成する特徴量に加えられるxnのことを「教師変数」と呼ぶ。
(数3) xn=sgn[y]
ただし、sgn[u]=1(y=+1),0(y=-1)
ここに、xn:教師変数
y :ラベル
sgn[u]:符号関数(ここでは、1か0を返す)
【0029】
メインタスク5は、特徴量の評価に纏わる処理を実行するためのタスク・プログラム群であり、主として、特徴量正規化タスク5aと、係数算定タスク5bと、係数正規化タスク5cと、結果表示タスク5dと、を備える。ここで、分類対象の性質を表す特徴量x1,x2,・・・,およびxn-1のそれぞれに対応する特徴量の種類を区別して一意に特定するための符号をNとする(N=1,2,・・・,n-1)。つまり、特徴量の種類1に関する特徴量の具体的な値がx1であり、特徴量の種類2に関する特徴量の具体的な値がx2であり、・・・となる。
【0030】
特徴量正規化タスク5aは、分類対象に関する特徴量の値を正規化するためのタスク・プログラムである。特徴量正規化タスク5aは、具体的には、記憶部4に格納されている学習データベース4aに記録されている学習データの集合を読み込み、特徴量の種類Nごとに、当該の特徴量の種類Nに関する、分類対象の性質を表す特徴量x1,x2,・・・,xn-1の値の集合について最大値が1になるとともに最小値が0になるように、下記の数式4によって前記特徴量の値の正規化を行う。
(数4) X’=[X-min(x)]/[max(x)-min(x)]
ここに、X’:正規化後の、特徴量の種類Nに関する特徴量の値
X :正規化前の、特徴量の種類Nに関する特徴量の値
min(x):特徴量の種類Nに関する特徴量xの値の最小値
max(x):特徴量の種類Nに関する特徴量xの値の最大値
【0031】
特徴量正規化タスク5aは、特徴量の種類Nごとに正規化した特徴量x1’,x2’,・・・,xn-1’の値(さらに、教師変数xnの値)を含む学習データの集合を、記憶部4に記憶させたり、或いは、係数算定タスク5bへとそのまま転送したりする。
【0032】
係数算定タスク5bは、サポートベクタマシンの識別境界を計算して重み係数を算定するためのタスク・プログラムである。係数算定タスク5aは、具体的には、記憶部4に記憶されたり特徴量正規化タスク5aから転送されたりする、正規化された特徴量x1’,x2’,・・・,xn-1’ならびに教師変数xnの値を含む学習データを用いて、入力xを2つのクラスに分類するための識別境界に最も近いxmベクトル(即ち、サポートベクトルと位置づけられるもの)と前記識別境界との間の距離(即ち、マージン)を最大化する最適化問題を解いて、正規化された特徴量x1’,x2’,・・・,およびxn-1’ならびに教師変数xnのそれぞれに対応する(言い換えると、サポートベクタマシンの識別境界を特定するための)重み係数w1,w2,・・・,およびwnを算定する。
【0033】
ここで、分類対象の性質を表す特徴量x1,x2,・・・,およびxn-1の値については特徴量の種類Nごとに最大値が1になるとともに最小値が0になるように正規化され、且つ、教師変数xnは1か0の値をとるようにしているので、正規化された特徴量x1’,x2’,・・・,およびxn-1’のそれぞれに対応する重み係数w1,w2,・・・,およびwn-1は、教師変数xnに対応する重み係数wnに対する相対的な値として算定される。つまり、正規化された特徴量x1’,x2’,・・・,xn-1’のそれぞれに対応する重み係数w1,w2,・・・,wn-1は、特徴量それぞれの影響度(別言すると、有効性)が数値化されたものとして算定される。
【0034】
係数算定タスク5bは、算定した重み係数w1,w2,・・・,およびwnの値を係数正規化タスク5cへと転送する。
【0035】
係数正規化タスク5cは、係数算定タスク5bによって算定された重み係数の値を正規化するためのタスク・プログラムである。係数正規化タスク5cは、具体的には、係数算定タスク5bから転送される重み係数w1,w2,・・・,およびwnの値の入力を受け、教師変数xnに対応する重み係数wnの値が1になるように、下記の数式5によって重み係数w1,w2,・・・,およびwnの値(絶対値)の正規化を行う。
(数5) wi’= |wi/wn|
ここに、wi’:正規化後の重み係数の値
wi :正規化前の重み係数の値
wn :教師変数xnに対応する重み係数の値
なお、i=1,2,・・・,n
【0036】
ここで、重み係数w1,w2,・・・,およびwnの値は、教師変数xnに対応する重み係数wnの値が1になるように正規化されることにより、分類の難易度、言い換えると分類の確からしさや確定の程度が数値化されたものとして捉えることができる。
【0037】
係数正規化タスク5cは、計算した正規化後の重み係数w1’,w2’,・・・,およびwn’の値を結果表示タスク5dへと転送する。
【0038】
結果表示タスク5dは、係数正規化タスク5cによって計算された正規化後の重み係数の値を表示部3に表示するためのタスク・プログラムである。結果表示タスク5dは、具体的には、係数正規化タスク5cから転送される正規化後の重み係数w1’,w2’,・・・,およびwn’の値の入力を受け、これらの値を表示部3に表示させる。
【0039】
次に、このような構成の特徴量の評価装置1および特徴量の評価方法の動作や作用などについて
図2も用いて説明する。
【0040】
まず、学習データの集合が、学習データベース4aに記録されて記憶部4に格納される。各学習データは、この発明では、分類対象の性質を表す特徴量x1,x2,・・・,およびxn-1ならびに教師変数xnとラベルyとの組み合わせとして構成される。
【0041】
その上で、特徴量正規化タスク5aが、記憶部4に格納されている学習データベース4aから学習データの集合を読み込み(ステップS1)、分類対象の性質を表す特徴量x1,x2,・・・,およびxn-1の値の正規化を行う(ステップS2)。次に、係数算定タスク5bが、正規化された特徴量x1’,x2’,・・・,およびxn-1’ならびに教師変数xnの値を含む学習データの集合を用いて、サポートベクトルと位置づけられるxmベクトルと識別境界との間の距離(即ち、マージン)を最大化する最適化問題を解いて、正規化された特徴量x1’,x2’,・・・,およびxn-1’ならびに教師変数xnのそれぞれに対応する(言い換えると、サポートベクタマシンの識別境界を特定するための)重み係数w1,w2,・・・,およびwnを算定する(ステップS3)。
【0042】
続いて、係数正規化タスク5cが、算定された重み係数w1,w2,・・・,wnの値の正規化を行う(ステップS4)。そして、結果表示タスク5dが、正規化後の重み係数w1’,w2’,・・・,wn’の値を表示部3に表示させる(ステップS5)。
【0043】
ここで、サポートベクタマシンでは、識別境界を挟んで分離度が良好である場合には重み係数の絶対値が大きくなる。したがって、重み係数wiの絶対値が大きい場合には、当該の重み係数wiに対応する特徴量xiは、識別が容易な特徴量(言い換えると、分類に適当で有効な特徴量)であると言え、クラス別の特徴量間の直交性が優れている特徴量であると言える。一方で、識別境界を挟んで分離度が不良である場合には重み係数の絶対値が小さくなる。したがって、重み係数wiの絶対値が小さい場合には、当該の重み係数wiに対応する特徴量xiは、識別に不向きな特徴量(言い換えると、分類に不適当で有効でない特徴量)であると言え、クラス別の特徴量間の直交性が乏しい特徴量である、或いは、分類対象の特徴を反映していない特徴量であると言える。
【0044】
ここで、人と自動車とのそれぞれに関する特徴量の評価の例を説明する。ここでは、下記の〈パターン1〉と〈パターン2〉とのそれぞれの内容で人や自動車について取得されたレーダデータが用いられる。
【0045】
〈パターン1〉人と自動車とのそれぞれの特徴量を評価するデータ
1)物標が人単一の状態と、物標が自動車単一の状態と、のそれぞれをレーダスキャンしてレーダデータを取得する。
2)人も自動車も速度は5km/h程度とする。
3)
図3に示すように、レーダから2m離れた地点Aから15m離れた地点Bまで移動する状況のレーダデータを取得する。
【0046】
〈パターン2〉人の動作に関する特徴量を評価するデータ
1)物標が歩いている人単一の状態と、物標が走っている人単一の状態と、のそれぞれをレーダスキャンしてレーダデータを取得する。
2)歩いている人の速度は5km/h程度とし、走っている人の速度は10km/h程度とする。
3)
図3に示すように、レーダから2m離れた地点Aから15m離れた地点Bまで移動する状況のレーダデータを取得する。
【0047】
上記の〈パターン1〉と〈パターン2〉とのそれぞれの内容で取得されたレーダデータについて高速フーリエ変換処理を施してからレーダ信号点の周波数の抽出を行うとともに抽出されたレーダ信号点のクラスタ(即ち、物標に関するレーダ信号点の集まり)を生成した上で、下記の7種類の特徴量を計算する。
【0048】
特徴量の種類1)点群数
~物標に関するクラスタを構成するレーダ信号点の個数
特徴量の種類2)左右方向の距離(横幅の寸法)
~レーダの設置位置を基準とした、物標に関するクラスタの左右方向の寸法
特徴量の種類3)奥行方向の距離(奥行の寸法)
~レーダの設置位置を基準とした、物標に関するクラスタの奥行方向の寸法
特徴量の種類4)点群の面積
~物標に関するクラスタの平面視における面積
特徴量の種類5)距離に応じた信号強度
~レーダから遠くなることによる信号強度の減衰をキャンセルした信号強度
特徴量の種類6)速度の最大最小差
~物標に関するクラスタを構成するレーダ信号点各々の速度の最大値と最小値との差
特徴量の種類7)速度の平均
~物標に関するクラスタを構成するレーダ信号点各々の速度の平均
【0049】
なお、レーダ信号点の速度は、レーダの受信アンテナに対する物標の相対的な速度である。
【0050】
上記の特徴量の種類1~7に教師変数を加えた上でラベルと組み合わせたものを学習データとする。具体的には、上記の〈パターン1〉については、人に関するクラスタについてはクラスを表すラベルyの値を-1とするとともに教師変数xの値を0とし、自動車に関するクラスタについてはラベルyの値を+1とするとともに教師変数xの値を1とする。また、上記の〈パターン2〉については、歩いている人に関するクラスタについてはクラスを表すラベルyの値を-1とするとともに教師変数xの値を0とし、走っている人に関するクラスタについてはラベルyの値を+1とするとともに教師変数xの値を1とする。
【0051】
また、比較のため、上記の特徴量の種類1~7のみとラベルとを組み合わせたものを比較用学習データとして準備する。すなわち、比較用学習データは、教師変数を含まない学習データの集合である。
【0052】
上記によって作成した学習データと比較用学習データとのそれぞれについて、特徴量正規化タスク5aが特徴量の値の正規化を行い(ステップS2)、係数算定タスク5bが正規化された特徴量の値を含む学習データの集合を用いて重み係数を算定するとともに比較用学習データの集合を用いて重み係数を算定する(ステップS3)。また、教師変数を含む学習データを用いて算定された重み係数については、係数正規化タスク5cが、算定された重み係数の値の正規化を行う(ステップS4)。
【0053】
教師変数を含まない比較用学習データを用いて算定された重み係数の値(即ち、ステップS3の結果)を下掲の表1に示す。
【0054】
【0055】
表1に示される〈パターン1〉と〈パターン2〉とのそれぞれの重み係数を比較しても、〈パターン1〉と〈パターン2〉とで、どちらの方が分類し易く(別言すると、平明)でどちらの方が分類がし辛い(別言すると、難解)であるのかを判断することはできない。言い換えると、〈パターン1〉と〈パターン2〉とで、どちらの方が分類が確かであって確定的であるかを判断することはできない。
【0056】
一方、教師変数を含む学習データを用いて算定された重み係数の値(即ち、ステップS3の結果)を下掲の表2に示す。
【0057】
【0058】
さらに、表2に示す重み係数の値を正規化した値(即ち、ステップS4の結果)を下掲の表3に示す。
【0059】
【0060】
表3に示される〈パターン1〉と〈パターン2〉とのそれぞれの重み係数を比較することにより、〈パターン1〉の方が重み係数の値が全般的に大きいので分類し易く、〈パターン2〉の方が重み係数の値が全般的に小さいので分類し辛いことが確認される。言い換えると、〈パターン1〉と〈パターン2〉とを比べると、〈パターン1〉の方が分類が確かであって確定的であると判断することができる。
【0061】
さらに、〈パターン1〉の結果から、人との自動車との識別/分類においては、特徴量の種類3の重み係数の値が最も大きいので識別への影響が大きいと判定されるため、奥行き方向の距離が特徴量として有効であり、一方で、特徴量の種類6の重み係数の値が最も小さいので識別への影響が小さいと判定されるため、速度の最大最小差は特徴量として有効でないと判断することができる。
【0062】
また、〈パターン2〉の結果から、歩いている人と走っている人との識別/分類においては、分類はし辛いものの、特徴量の種類7の重み係数の値が最も大きいので識別への影響が最も大きいと判定されるため、速度の平均が特徴量として有効であると判断することができる。
【0063】
以上の結果から、学習データが、特徴量の1つとして、学習データのラベルに対応する教師変数xnを含むようにすることにより、教師変数xnに対応する重み係数wnの値を基準として、特徴量それぞれが識別結果に与える影響度(別言すると、特徴量それぞれの有効性)と識別の難易度とを数値化して同時に評価することが可能となること、および、多次元の特徴量の影響度/有効性を横ならびで数値化した上で比較して評価することが可能となり、しかも、複数の識別結果の多次元の特徴量の影響度/有効性を横ならびで数値化した上で比較して評価することが可能となることが確認される。
【0064】
なお、この発明における、分類対象の性質を表す特徴量は、上記の特徴量の種類1~7に限定されるものではなく、例えば検知対象の物標の種別や前記物標の特性が考慮されるなどした上で、適当な特徴量が適宜選択され得る。さらに言えば、この発明は、分類対象のデータが、検知対象の物標をレーダスキャンして取得されるレーダデータに限定されるものではなく、種々のデータに対して適用され得る。
【0065】
この実施の形態に係る特徴量の評価装置1によれば、サポートベクタマシンの学習に用いられる学習データが特徴量の1つとして学習データのラベルyに対応する教師変数xnを含むとともに算定された重み係数w1,w2,・・・,およびwnを正規化するようにしているので、教師変数xnに対応する重み係数wnの値を基準として、特徴量それぞれが識別結果に与える影響度(別言すると、特徴量それぞれの有効性)と識別の難易度とを数値化して同時に評価することが可能となる。この実施の形態に係る特徴量の評価装置1によれば、また、多次元の特徴量の影響度/有効性を横ならびで数値化した上で比較して評価することが可能となり、しかも、複数の識別結果の多次元の特徴量の影響度/有効性を横ならびで数値化した上で比較して評価することが可能となる。
【0066】
以上、この発明の実施の形態について説明したが、具体的な構成は、上記の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。具体的には、この発明の要旨はサポートベクタマシンの学習に用いられる学習データが特徴量の1つとして学習データのラベルに対応する教師変数を含むことであり、この要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。
【符号の説明】
【0067】
1 特徴量の評価装置
2 入力部
3 表示部
4 記憶部
4a 学習データベース
5 メインタスク
5a 特徴量正規化タスク
5b 係数算定タスク
5c 係数正規化タスク
5d 結果表示タスク
6 中央処理部