特開2017-174054 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ セコム株式会社の特許一覧

特開2017-174054属性推定装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】特開2017-174054(P2017-174054A)

(43)【公開日】2017年9月28日

(54)【発明の名称】属性推定装置

(51)【国際特許分類】

G06T 7/00 20170101AFI20170901BHJP

G06T 1/00 20060101ALI20170901BHJP

A61B 5/107 20060101ALI20170901BHJP

【ＦＩ】

G06T7/00 350B

G06T7/00 300F

G06T1/00 340A

A61B5/10 300P

A61B5/10 300Z

【審査請求】有

【請求項の数】5

【出願形態】ＯＬ

【全頁数】16

(21)【出願番号】特願2016-58137(P2016-58137)

(22)【出願日】2016年3月23日

(71)【出願人】

【識別番号】000108085

【氏名又は名称】セコム株式会社

(74)【代理人】

【識別番号】110001210

【氏名又は名称】特許業務法人ＹＫＩ国際特許事務所

(72)【発明者】

【氏名】糸賀健

【テーマコード（参考）】

4C038

5B057

5L096

【Ｆターム（参考）】

4C038VA04

4C038VB02

4C038VB03

4C038VC05

5B057BA02

5B057CA08

5B057CA12

5B057CA16

5B057CC02

5B057CH11

5B057DA07

5B057DA08

5B057DA12

5B057DA16

5B057DA20

5B057DB02

5B057DB09

5B057DC05

5B057DC19

5B057DC30

5B057DC36

5B057DC40

5L096AA06

5L096CA02

5L096DA02

5L096EA39

5L096FA06

5L096FA32

5L096FA35

5L096FA64

5L096JA03

5L096JA11

5L096JA16

5L096JA18

5L096JA22

5L096KA04

5L096KA13

5L096KA15

(57)【要約】

【課題】学習に使う画像の数を増やすことなく、従来よりも細かい刻みで属性区分を推定する属性推定装置を提供する。
【解決手段】属性の推定をする対象に関する画像を取得する画像取得手段１１０と、属性特徴量を画像から求める特徴量演算手段１２１と、求められた属性特徴量が識別区分の各々の特徴を有する度合いを表わす属性尤度を求める第一年齢層尤度演算手段１２２、第二年齢層尤度演算手段１２３、世代尤度演算手段１２４と、これらによって求められた尤度を統合することによって属性特徴量が識別区分のうち重複する重複区分の特徴を有する度合いを表わす重複区分尤度を求め、重複区分尤度を用いて対象が属する属性区分を推定する統合推定手段１２５と、を設けた属性推定装置であり、人物の年齢を推定対象の属性に選ぶと年齢推定装置１００が実現できる。
【選択図】図３

【特許請求の範囲】

【請求項1】

属性の推定をする対象に関する情報を取得する情報取得手段と、
前記対象に関し複数の属性区分に分けられる属性に関する属性特徴量を前記情報から求める属性特徴量演算手段と、
前記属性において互いに異なる識別区分の特徴を学習し、学習した前記識別区分が互いに重複する前記属性区分である重複区分を有する識別器の組を含む複数の識別器を用いて、前記属性特徴量が前記識別区分の各々の特徴を有する度合いを表わす属性尤度を求める属性尤度演算手段と、
前記識別器の組において求められた前記属性尤度を統合することによって前記属性特徴量が前記重複区分の特徴を有する度合いを表わす重複区分尤度を求め、少なくとも前記重複区分尤度を用いて前記対象が属する前記属性区分を推定する統合推定手段と、
を備えることを特徴とする属性推定装置。

【請求項2】

請求項１に記載の属性推定装置であって、
前記識別器の組は、前記属性の所定範囲の全範囲を第１の区分にて割り当てた前記識別区分の各々の特徴を学習した識別器と、前記全範囲を前記第１の区分とは異なる第２の区分にて割り当てた前記識別区分の各々の特徴を学習した識別器と、を含むことを特徴とする属性推定装置。

【請求項3】

請求項１又は２に記載の属性推定装置であって、
前記識別器の組は、互いに異なる幅の前記識別区分の各々の特徴を学習した識別器を含むことを特徴とする属性推定装置。

【請求項4】

請求項３に記載の属性推定装置であって、
前記統合推定手段は、前記識別区分の範囲が広いほど当該識別区分に対して求められた前記属性尤度に大きな重み付けをして統合することによって前記重複区分尤度を求めることを特徴とする属性推定装置。

【請求項5】

請求項１〜４のいずれか１項に記載の属性推定装置であって、
前記属性は、人の年齢又は人の毛髪長のいずれか１つであることを特徴とする属性推定装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、対象である人物等に関する画像等の情報から年齢等の属性を推定する属性推定装置に関する。

【背景技術】

【0002】

対象の特徴を表わす量として表現される属性を推定するにあたって、例えば人物の年齢を推定する場合には、人物の顔画像を取得して学習処理により構築された年齢推定手段に入力して結果を得る技術が提案されている。

【0003】

特許文献１には、推定に用いる特徴量を複数として、それぞれの特徴量を用いた年齢推定手段は予め学習処理に依って年齢層を推定するモデルからなるものとして、１０歳刻みの年齢層を出力し、その多数決にて年齢層を決定する技術が開示されている。そして、さらに細かな年齢層を推定したい場合には、年齢層を分割すればよい旨も開示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００４−３１８６３２号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１のように、入力顔画像の人物について年齢層らしさを得るためには、それぞれの年齢層について、その年齢層を正解、それ以外の年齢層を不正解とする識別器を年齢層ごとに用意した識別器群を構築することになる。

【0006】

ここで、特許文献１に開示があるように結果として求めたい年齢層を分割すると、各年齢層の識別器の学習処理において、正解としてラベル付与される顔画像が分割に伴って減少する。その場合、少ない正解の顔画像について学習処理を行うため、その年齢層の人物の顔の特徴を学習するというよりも、顔画像の人物の顔の特徴自体を学習することに近くなる。そうすると、例えば、瓜二つの親子の片方が正解の顔画像、もう一方が入力顔画像となった場合のように、正解の顔画像の人物と年齢は全く異なるが顔つきが良く似た人物の顔画像が入力されたときに、全く異なった年齢層として認識される可能性がある。

【0007】

そのような事態を避けるためには、分割した年齢層ごとに十分な数の正解の顔画像を用意すれば良いが、実際には学習のための顔画像を収集するのは作業負担が大きく困難である。特に正解の顔画像を潤沢に集めるのは困難である。

【0008】

そこで本発明は、上記問題を鑑みてなされたものであり、学習に使うデータの数を増やすことなく、細かい刻みで属性を推定することのできる属性推定装置を提供することを目的とする。

【課題を解決するための手段】

【0009】

本発明の１つの態様は、属性の推定をする対象に関する情報を取得する情報取得手段と、前記対象に関し複数の属性区分に分けられる属性に関する属性特徴量を前記情報から求める属性特徴量演算手段と、前記属性において互いに異なる識別区分の特徴を学習し、学習した前記識別区分が互いに重複する前記属性区分である重複区分を有する識別器の組を含む複数の識別器を用いて、前記属性特徴量が前記識別区分の各々の特徴を有する度合いを表わす属性尤度を求める属性尤度演算手段と、前記識別器の組において求められた前記属性尤度を統合することによって前記属性特徴量が前記重複区分の特徴を有する度合いを表わす重複区分尤度を求め、少なくとも前記重複区分尤度を用いて前記対象が属する前記属性区分を推定する統合推定手段と、を備えることを特徴とする属性推定装置である。

【0010】

ここで、前記識別器の組は、前記属性の所定範囲の全範囲を第１の区分にて割り当てた前記識別区分の各々の特徴を学習した識別器と、前記全範囲を前記第１の区分とは異なる第２の区分にて割り当てた前記識別区分の各々の特徴を学習した識別器と、を含むことが好適である。

【0011】

また、前記識別器の組は、互いに異なる幅の前記識別区分の各々の特徴を学習した識別器を含むことが好適である。

【0012】

また、前記統合推定手段は、前記識別区分の範囲が広いほど当該識別区分に対して求められた前記属性尤度に大きな重み付けをして統合することによって前記重複区分尤度を求めることが好適である。

【0013】

また、前記属性は、人の年齢又は人の毛髪長のいずれか１つであることが好適である。

【発明の効果】

【0014】

本発明によれば、学習に使うデータの数を増やすことなく、細かい刻みで属性を推定する属性推定装置を提供することができる。

【図面の簡単な説明】

【0015】

【図1】本発明の実施の形態における属性識別処理の概要を説明する図である。

【図2】本発明の実施の形態における尤度分布の統合処理を説明する図である。

【図3】第１の実施の形態における年齢推定装置の構成を示す図である。

【図4】第１の実施の形態における年齢層推定モデルを示す図である。

【図5】第１の実施の形態における顔画像の特徴量を説明する図である。

【図6】第１の実施の形態における年齢層尤度分布及び世代尤度分布の統合処理を説明する図である。

【図7】第１の実施の形態における識別器の構成の別例を説明する図である。

【図8】第２の実施の形態における毛髪長と属性区分の関係を示す図である。

【図9】第２の実施の形態における毛髪長推定モデルを示す図である。

【図10】第２の実施の形態における毛髪長の特徴量を説明する図である。

【図11】本発明の変形例における推定モデルを示す図である。

【発明を実施するための形態】

【0016】

［発明の概要説明］
具体的な人の属性についての例を示す前に、本発明の基本的な考えを説明する。図１（ａ）は、本発明にかかる識別器群を模式的に示す。

【0017】

本発明では、推定対象の特徴の１つを示す属性について、当該属性を区分した属性区分のどこに属する可能性が高いかを推定する。本発明では、属性を２以上の識別器群によって推定する。各識別器群は、所定数の属性区分に対する識別器を有する。

【0018】

第一識別区分識別器群１１は、識別区分識別器Ａ〜識別区分識別器Ｇの７つを含む。また、第二識別区分識別器群１２は、識別区分識別器Ｈ〜識別区分識別器Ｍの６つを含む。

【0019】

第一識別区分識別器群１１に含まれる識別区分識別器Ａは、属性区分が“０”と“１”のデータを正解とし、それ以外の属性区分のデータを不正解として学習処理により構築されている。識別区分識別器Ｂは、属性区分が“２”と“３”のデータを正解とし、それ以外の属性区分のデータを不正解として学習処理により構築されている。以下同様に、識別区分識別器Ｇは、属性区分が“１２”と“１３”のデータを正解とし、それ以外の属性区分のデータを不正解として学習処理により構築されている。

【0020】

また、第二識別区分識別器群１２に含まれる識別区分識別器Ｈは、属性区分が“１”と“２”のデータを正解とし、それ以外の属性区分のデータを不正解として学習処理により構築されている。識別区分識別器Ｉは、属性区分が“３”と“４”のデータを正解とし、それ以外の属性区分のデータを不正解として学習処理により構築されている。以下同様に、識別区分識別器Ｍは、属性区分が“１１”と“１２”のデータを正解とし、それ以外の属性区分のデータを不正解として学習処理により構築されている。

【0021】

このように、第一識別区分識別器群１１と第二識別区分識別器群１２は、その属性区分が重複する区間（以下、重複区分という）が存在するように区分されており、それぞれの属性区分に属するデータを正解として用意された学習用データを用いた学習処理により構築されている。例えば、第一識別区分識別器群１１の識別区分識別器Ａの属性区分は“０”と“１”であり、第二識別区分識別器群１２の識別区分識別器Ｈの属性区分は“１”と“２”であり、互いに属性区分“１”を重複区分としている。

【0022】

そして、図１（ｂ）に示すように、入力画像を第一識別区分識別器群１１及び第二識別区分識別器群１２に含まれる識別区分識別器に入力し、入力画像についてそれぞれの識別区分識別器がデータの特徴を学習した属性の区分（以下、識別区分という）らしさを表わすとして出力されるスコアを並べ、正規化した第一識別区分尤度分布と第二識別区分尤度分布を求める。その後、両者を統合して統合尤度分布を求める。

【0023】

第一識別区分尤度分布と第二識別区分尤度分布の統合について、図２を用いて説明する。図２には、入力データの属性区分が“５”の場合の第一識別区分尤度分布３０と第二識別区分尤度分布３１が模式的に示されている。

【0024】

入力データの正解の属性区分は“５”であるので、識別区分識別器Ｄが出力した尤度が高い値を示している。しかしその一方で、識別区分識別器Ｆが出力した尤度も高い値を示しており、識別区分識別器Ｃが出力した尤度より高くなっている。仮に、従来通りに第一識別区分識別器群１１のみに含まれる識別区分識別器を用いた場合、入力データは最高の尤度を示す識別区分である属性区分“１０”または“１１”と判定される。実際には入力データの正解の属性区分は“５”であるので、これは誤りとなる。一方、第二識別区分尤度分布３１を参照すると、識別区分識別器Ｊが最も高い尤度を示す。

【0025】

そこで本発明では、属性区分の１つ毎に、第一識別区分尤度分布３０と第二識別区分尤度分布３１を統合して、統合尤度分布３２を求める。例えば、統合の方法は、属性区間ごとに尤度の平均を求めて、その平均の総和で除算する正規化処理をする。正規化処理を省略してもよい。この統合処理により、識別区分識別器Ｆが正解とする属性区分“１０”と“１１”の尤度は値が大きく下がり、正解とする属性区分“５”の尤度が最高値となり、入力データの属性区分は“５”と正しく求められる。

【0026】

すなわち本発明においては、重複区分を含む識別区分を学習した識別器をそれぞれ含む複数の識別区分識別器群を準備し、識別区分識別器群において求められた属性尤度を統合することによって重複区分の特徴を有する度合いを表わす重複区分尤度を求める。そして、この重複区分尤度を用いて対象が属する属性区分を推定する。これにより、何らかの原因で正解以外の属性区分で最高の尤度が算出されることで、推定結果が誤ることを防止することができる。

【0027】

［第１の実施形態（年齢推定装置）］
第１の実施形態として、本発明を年齢推定装置に適用した場合について説明する。すなわち対象は人物であり、属性は年齢であり、属性区分は年齢層となる。また、図１で示した第一識別区分識別器群１１は第一年齢層識別器群、第二識別区分識別器群１２は第二年齢層識別器群となる。対象の情報は顔画像とする。

【0028】

図３に年齢推定装置１００のブロック図を示す。年齢推定装置１００は、入力画像、本実施の形態では人物の顔画像を取得するための撮像装置５０に接続され、図示しない外部の装置へ推定結果を出力するよう構成されている。

【0029】

撮像装置５０は、いわゆるカメラでありＣＣＤやＣ−ＭＯＳといった撮像素子とレンズを含んで構成される。撮像装置５０の解像度は、年齢推定装置１００において推定対象となる属性、撮像装置５０の設置環境、推定処理部１２０の処理能力等に応じて決定すればよく、例えば１６００×１２００画素とされる。撮像装置５０は、年齢の推定対象の人物の顔や頭部の画像を撮影して、入力画像として年齢推定装置１００に入力する。

【0030】

年齢推定装置１００は、ＣＰＵ／ＭＰＵ、各種メモリ類、周辺回路などから構成され、撮像装置５０が取得した入力画像から顔画像を抽出して、それに写っている人物の年齢を推定して出力する。年齢推定装置１００は、画像取得手段１１０、推定処理部１２０、記憶部１３０及び出力部１４０を含んで構成される。

【0031】

情報取得手段として動作する画像取得手段１１０は、撮像装置５０と接続されるインターフェース回路であり、撮像装置５０によって撮影された入力画像を取得し、推定処理部１２０へ出力する。撮像装置５０の代わりに、ハードディスク等の記憶媒体から過去に撮像されていた入力画像を取得するようにしてもよい。また、ネットワークを介して外部装置から送信されてきた入力画像を取得してもよい。

【0032】

出力部１４０は、推定処理部１２０において入力画像の人物について推定された年齢層を外部機器（不図示）に出力するためのインターフェース及びその制御回路である。外部機器は、表示装置（モニタ）でもよいし、または別途推定の履歴を記憶しておくための記憶装置でもよい。または、ネットワークを介してサーバーマシンに推定された年齢層を送信してもよい。

【0033】

記憶部１３０は、ＲＯＭ、ＲＡＭなど半導体メモリやハードディスク等の大規模記憶手段を含んで構成され、年齢推定装置１００を制御するためのプログラム（不図示）、プログラムモジュールにて実現される推定処理部１２０のプログラム（不図示）及び各種データを記憶し、推定処理部１２０との間で情報を入出力する。各種データには、少なくとも、年齢層推定モデル１３１が含まれる。

【0034】

図４に、年齢層推定モデル１３１を模式的に示す。年齢層推定モデル１３１は、第一年齢層識別器群１３２、第二年齢層識別器群１３３、世代識別器群１３４から構成される。

【0035】

第一年齢層識別器群１３２は、年齢層識別器Ａ、年齢層識別器Ｂ・・・年齢層識別器Ｇの７つから構成される。年齢層識別器Ａは、年齢１０〜１９歳の識別区分に該当する人物の顔画像を正解、それ以外の年齢層を不正解とした学習処理により構築される。年齢層識別器Ｂは、年齢２０〜２９歳の識別区分に該当する人物の顔画像を正解、それ以外の年齢層を不正解とした学習処理により構築される。同様に、年齢層識別器Ｃから年齢層識別器Ｇまでがそれぞれ年齢３０〜３９歳、４０〜４９歳、５０〜５９歳、６０〜６９歳、７０〜７９歳の識別区分に該当する人物の顔画像を正解、それ以外を不正解とした学習処理により構築される。

【0036】

第二年齢層識別器群１３３は、年齢層識別器Ｈ、年齢層識別器Ｉ・・・年齢層識別器Ｍの６つから構成される。年齢層識別器Ｈは、年齢１５〜２４歳の識別区分に該当する人物の顔画像を正解、それ以外の年齢層を不正解とした学習処理により構築される。年齢層識別器Ｉは、年齢２５〜３４歳の識別区分に該当する人物の顔画像を正解、それ以外の年齢層を不正解とした学習処理により構築される。同様に、年齢層識別器Ｊから年齢層識別器Ｍまでがそれぞれ年齢３５〜４４歳、４５〜５４歳、５５〜６４歳、６５〜７４歳の識別区分に該当する人物の顔画像を正解、それ以外を不正解とした学習処理により構築される。

【0037】

さらに、本実施の形態における年齢層推定モデル１３１は、世代識別器群１３４も備える。世代識別器群１３４は、若年世代識別器Ｎ、壮年世代識別器Ｏ、老年世代識別器Ｐから構成される。若年世代識別器Ｎは、年齢１０〜３４歳の識別区分に該当する人物の顔画像を正解、それ以外の年齢層を不正解とした学習処理により構築される。壮年世代識別器Ｏは、年齢３５〜５４歳の識別区分の人物に該当する顔画像を正解、それ以外の年齢層を不正解として学習処理により構築される。老年世代識別器Ｐは、年齢５５〜８０歳の識別区分の人物に該当する顔画像を正解、それ以外の年齢層を不正解として学習処理により構築される。世代識別器群１３４は、第一年齢層識別器群１３２及び第二年齢層識別器群１３３と比較すると、正解とする年齢層の幅が広く、それぞれの名称どおりに入力画像に写されている人物の世代らしさを出力する。

【0038】

第一年齢層識別器群１３２と第二年齢層識別器群１３３に加え、世代識別器群１３４をも併用することにより、顔が良く似た親子のように、年齢層がまったく異なるが顔つきの特徴が共通しており誤った結果を出力する可能性がある場合にも、世代識別器群１３４によりまずは大まかに正解の世代を特定し、加えて年齢層を推定することによって推定精度を向上させることができる。

【0039】

推定処理部１２０は、メモリ、その周辺回路及びそのマイクロプロセッサなどのいわゆるコンピュータにより構成され、画像取得手段１１０から入力された入力画像に対し各種処理を実行し、その処理結果を出力部１４０に出力する。

【0040】

そのために推定処理部１２０は、特徴量演算手段１２１、第一年齢層尤度演算手段１２２、第二年齢層尤度演算手段１２３、世代尤度演算手段１２４、統合推定手段１２５を有する。各手段は、マイクロプロセッサ上で動作するソフトウェアにより実現させる機能モジュールである。

【0041】

特徴量演算手段１２１は、画像取得手段１１０から入力画像を取得し、顔画像を抽出した後に、年齢層を推定するための属性特徴量を算出する。入力画像からの顔画像の抽出は周知の技術を用いればよい。例えば背景差分を施したうえで顔らしい楕円形状を検出したり、顔の特徴を学習した識別器を用意して入力画像を順次走査し顔らしい形状を検出したりすればよい。

【0042】

属性特徴量は、特に制限されるものではない。例えば、図５に示すように、顔画像３００から特徴点３０１を抽出の後、ハールライク（Haar-Like）特徴量３０２、特徴点同士の距離３０３、ガボール(Gabor)特徴量３０４、ＨＯＧ（Histogram of Oriented Gradient）特徴量３０５、ＬＢＰ（Local Binary Pattern）特徴量（不図示）から適宜選択して成分とした特徴量ベクトルとすればよい。

【0043】

特徴量演算手段１２１は、算出した属性特徴量を、第一年齢層尤度演算手段１２２、第二年齢層尤度演算手段１２３、世代尤度演算手段１２４に出力する。

【0044】

第一年齢層尤度演算手段１２２は、属性特徴量を用い、記憶部１３０に記憶されている第一年齢層識別器群１３２を読み出して、年齢層毎の尤度を算出して並べ、正規化した尤度分布を求める。例えば、第一年齢層識別器群１３２の年齢層識別器Ａを用いて、属性特徴量が入力顔画像の人物の１０〜１９歳らしさを表わす尤度を求める。同様に、年齢層識別器Ｂ〜年齢層識別器Ｇによってそれぞれの年齢層らしさを表わす尤度を求める。これにより、図６に示すように、年齢層識別器Ａ〜年齢層識別器Ｇによって求められた尤度を正規化した第一年齢層尤度分布４００が得られる。なお、図６は、実際の年齢が３９歳の人物の顔画像について識別区分毎に尤度を求めた結果を示している。

【0045】

同様に、第二年齢層尤度演算手段１２３は、第二年齢層識別器群１３３に含まれる年齢層識別器Ｈ〜年齢層識別器Ｍを用いて、属性特徴量がそれぞれの年齢層らしさを表わす尤度を求める。これにより、図６に示すように、年齢層識別器Ｈ〜年齢層識別器Ｍによって求められた尤度を正規化した第二年齢層尤度分布４１０が得られる。

【0046】

同様に、世代尤度演算手段１２４は、世代識別器群１３４に含まれる若年世代識別器Ｎ、壮年世代識別器Ｏ及び老年世代識別器Ｐを用いて、属性特徴量がそれぞれの世代らしさを表わす尤度を求める。これにより、図６に示すように、若年世代識別器Ｎ、壮年世代識別器Ｏ及び老年世代識別器Ｐによって求められた尤度を正規化した世代尤度分布４２０が得られる。

【0047】

統合推定手段１２５は、第一年齢層尤度分布４００、第二年齢層尤度分布４１０及び世代尤度分布４２０を統合して、最も高い尤度を示した属性区分である年齢層を入力顔画像に写った人物の年齢層として推定する。統合方法は、発明の概要説明において説明した方法と同様である。

【0048】

統合推定手段１２５は、属性区分の１つ毎に、第一年齢層尤度分布４００、第二年齢層尤度分布４１０及び世代尤度分布４２０を統合して統合尤度分布４３０を求める。例えば、統合の方法は、属性区分毎に第一年齢層尤度分布４００、第二年齢層尤度分布４１０及び世代尤度分布４２０の尤度の平均を求めて、全ての平均の総和で除算する正規化を施して統合尤度とする。正規化処理を省略してもよい。

【0049】

なお、統合推定手段１２５が行う統合処理の際に、識別区分の中間の値が最高値となり、識別区分の境界に近づくほど値が小さくなるような重みを付けてもよい。これは、入力画像が識別区分の境界に近い年齢を正解とする場合には、その隣接する識別区分でも高い尤度を示すことが多く、どちらの識別区分が正しいかの、いわば信頼性が低いと考えられるからである。

【0050】

重みは、識別区分の中間における最高値が１．０、識別区分の境界に近づくほど０に近い値とするのが好適である。例えば、グラフを描画すると三角波や正規分布に似た形となるように重みを設定する。

【0051】

本実施の形態では、第一年齢層尤度分布４００及び第二年齢層尤度分布４１０では５歳刻みの属性区分を２つ組み合わせた１０歳刻みの識別区分毎の尤度を求めており、世代尤度分布４２０では５歳刻みの属性区分をそれぞれ５つ、４つ、５つ組み合わせた識別区分毎の尤度を求めているのに対して、統合尤度分布４３０では重複区分について尤度を統合することにより５歳刻みの重複区分尤度が得られる。

【0052】

第一年齢層尤度分布４００では、正解となる年齢層識別器Ｃの尤度が高く、すぐ上の年齢層を正解とした年齢層識別器Ｄの尤度も高い。しかし、全く異なる年齢層を正解とする年齢層識別器Ｆの尤度の方が高く、第一年齢層尤度分布４００のピークの尤度を参照して推定結果とすると、実際の年齢が３９歳の人物が６０〜６９歳の年齢層として推定されてしまう。一方、第二年齢層尤度分布４１０では、正解となる年齢層識別器Ｊの尤度が最も高い。さらに、世代尤度分布４２０でも、正解となる世代である壮年世代識別器Ｏの尤度が最も高い。

【0053】

そして、第一年齢層尤度分布４００、第二年齢層尤度分布４１０及び世代尤度分布４２０を統合した統合尤度分布４３０では、正解である３５〜３９歳の属性区分（年齢層）の尤度（重複区分尤度）が最大値を示しており、統合推定手段１２５は人物を“３５〜３９歳”と推定してその結果を出力部１４０に出力する。

【0054】

なお、統合推定手段１２５は、最大値の尤度を示した属性区分の中央値（ここでは“３７歳”）を推定年齢として出力してもよい。また、統合推定手段１２５は、各属性区分の代表値を用いて、その年齢層の尤度を重みとした重み付き平均値を推定結果として出力してもよい。属性区分の代表値とは、その属性区分の上限と下限の平均値である。例えば“３０〜３９歳”の属性区分では代表値として３４．５歳とする。さらには重み付き平均の計算においては、尤度の高い上位所定数の属性区分のみを用いてもよい。

【0055】

本実施の形態では、第一年齢層識別器群１３２及び第二年齢層識別器群１３３に含まれる年齢層識別器Ａ〜年齢層識別器Ｍでは１０歳幅の識別区分毎を学習領域としているが、５歳幅の重複区分を有する識別器の組を含んでいる。単純に年齢層識別器の識別区分の幅を５歳としてしまうと、それに応じて正解の学習用顔画像が少なくなってしまうので当該識別区分に該当する年齢層の顔の特徴よりも、むしろ学習用顔画像の人物自身の顔の特徴を学習した年齢層識別器が構築される傾向が避けられない。その場合、入力顔画像に写っている人物の年齢よりも、顔つきが似ている人物について学習した年齢層識別器の出力に引き摺られて、誤った属性区分（年齢層）に該当するという推定がなされる可能性が高まる。これに対して、本実施の形態では、各年齢層識別器の識別区分は１０歳としつつ、重複区分を有する複数の年齢層識別器を用意して、重複区分毎に統合された尤度を求めることで、５歳刻みの属性区分における年齢の推定の確度を高めることができる。

【0056】

さらに、識別区分の幅をさらに大きくして世代毎の顔の特徴を学習した若年世代識別器Ｎ、壮年世代識別器Ｏ及び老年世代識別器Ｐを用意することで、１０歳幅の年齢層識別器を含む第一年齢層識別器群１３２及び第二年齢層識別器群１３３の組み合わせでも抑えられないような世代を超えた誤推定を回避することができる。

【0057】

なお、属性区分は５歳刻みに限定されない。例えば、属性区分を２歳刻みとして、同様な処理によって２歳幅で年齢を推定することが可能となる。また、各年齢層識別器の識別区分を１０歳幅に固定する必要はない。年齢層識別器同士の識別区分が重複区分を含むという条件下、学習に用いる顔画像の年齢層毎の数に応じて識別区分の幅を調整してもよい。例えば、識別区分毎の学習に使用する正解の顔画像の下限数（例えば、顔画像の全体数の５％）を設定しておき、正解の顔画像の数が下限数に到達しない場合には識別区分の幅を広くしてもよい。また、正解の顔画像の数が多いほど識別区分の幅を狭くするようにしてもよい。

【0058】

以上のように、年齢推定装置１００の構築にあたって用意された学習用の顔画像を最大限に利用して、誤推定を回避しつつ、従来よりも細かく年齢層を推定できる。

【0059】

なお、年齢層推定モデル１３１として、第一年齢層識別器群１３２及び第二年齢層識別器群１３３のみを用いて、世代識別器群１３４を用いなくてもよい。この場合、年齢層識別器の数は減るが、第二年齢層識別器群１３３の年齢の刻みの幅（属性区分の刻みの幅）を、第一年齢層識別器群１３２よりも広くしてもよい。これにより、世代識別器群１３４を併用した場合と同様に、全く異なった年齢層に推定されることを防ぐことができる。すなわち、属性区分毎に用意される正解の画像が少ないと、その属性区分毎に共通した特徴より画像自体の特徴が学習される傾向があるが、属性区分の幅を広く設定することで属性区分毎の特徴を学習させることができるからである。

【0060】

また、統合推定手段１２５では、属性区分毎に第一年齢層尤度分布４００と第二年齢層尤度分布４１０の平均を算出するものとしているがこれに限定されるもりではない。

【0061】

例えば、各識別器に割り当てられた属性区分の幅に応じて尤度に重み付けをして統合処理を施すことが好適である。図７に示すように、第一年齢層識別器群１３２と第二年齢層識別器群１５０を構築した場合、統合推定手段１２５は属性区分１５１については年齢層識別器Ｃと年齢層識別器Ｑから出力される尤度を合成する。年齢層識別器Ｃの年齢層の範囲は１０歳、年齢層識別器Ｑの年齢層の範囲は２５歳であるので統合する際には両者の年齢層の比に応じて重み付けするのが好適である。すなわち、年齢層識別器Ｃが出力した尤度に対しては重み１．０、年齢層識別器Ｑが出力した尤度に対しては重み２．５を乗算して重み付け平均を求めればよい。同様に、属性区分１５２については、年齢層識別器Ｅの年齢層の範囲は１０歳、年齢層識別器Ｒの年齢層の範囲は２０歳であるので、年齢層識別器Ｅが出力した尤度に対しては重み１．０、年齢層識別器Ｒが出力した尤度に対しては重み２．０を乗算して重み付け平均を求めればよい。そして、統合推定手段１２５は、そのほかの年齢層についても同様に重み付けを考慮して尤度の重み付け平均を求め、全体について正規化することで統合尤度分布とする。

【0062】

［第２の実施形態（毛髪長推定装置）］
第二の実施形態として、本発明を毛髪長推定装置に適用した場合について説明する。すなわち推定すべき属性は人の毛髪（頭髪）の長さであり、属性区分は単位をセンチメートルとした毛髪の長さとなる。また図１で示した第一識別区分識別器群１１は第一毛髪長識別器群、第二識別区分識別器群１２は第二毛髪長識別器群となる。

【0063】

図８は、毛髪の長さと属性区分との関係を示す。毛髪長の長さが０ｃｍ（すなわちスキンヘッド）から１ｃｍの範囲では属性区分０、以下、４０ｃｍ以上のロングヘアである属性区分６まで定義する。髪の長さは、頭皮上の位置に依って多少の違いはあるものの、一見した印象において支配的な部分の長さとして定義する。

【0064】

図９は、当該年齢層推定モデルに対応する毛髪長推定モデル７００を模式的に示す。毛髪長推定モデル７００は、第一毛髪長識別器群７１０と第二毛髪長識別器群７２０からなる。各識別器群は毛髪長に応じて、それぞれの長さの髪を持つ人物の上半身画像を正解、それ以外の長さの髪を持つ人物の上半身画像を不正解とした学習処理により構築される。

【0065】

毛髪長識別器Ａは、毛髪長が０〜１ｃｍに該当する人物の上半身画像を正解、それ以外を不正解とした学習処理により構築される。毛髪長識別器Ｂは、毛髪長が１〜１０ｃｍに該当する人物の上半身画像を正解、それ以外を不正解とした学習処理により構築される。同様に、毛髪長識別器Ｃ〜毛髪長識別器Ｈは、それぞれ毛髪長が１０ｃｍ〜３０ｃｍ、３０ｃｍ〜５０ｃｍ、０ｃｍ〜５ｃｍ、５ｃｍ〜２０ｃｍ、２０ｃｍ〜４０ｃｍ、４０ｃｍ以上に該当する人物の上半身画像を正解、それ以外を不正解として学習処理により構築される。そして、毛髪長識別器Ａ〜毛髪長識別器Ｈは、入力画像中の人物の髪の長さがそれぞれの識別区分である尤度を出力する。

【0066】

次に、本実施の形態にかかる毛髪長推定装置の構成要素とその作用を説明する。毛髪長推定装置は、図３に示した第１の実施形態の年齢推定装置にかかるブロック図において、「年齢層」を「毛髪長」に読み替え、「世代尤度演算手段」と「世代識別器群」を省略して実現される。

【0067】

推定処理部１２０の特徴量演算手段１２１は、入力画像から人物の上半身画像（胸から上）を抽出する。また、特徴量演算手段１２１は、顎の高さより上の頭部画像を抽出してもよい。図１０は、抽出された上半身画像６００の例を示す。さらに、特徴量演算手段１２１は、上半身画像６００から顔の特徴点６０１を周知な手法にて抽出し、それを基準に顔画像領域６０２（図１０では点線で示す）を決定して顔画像領域６０２の周囲に毛髪領域６０３を定義する。毛髪領域６０３の下端は女性のロングヘアを捉えられるよう顎よりも下、肩の辺りまで伸ばすように定義するのが好適である。

【0068】

次に、特徴量演算手段１２１は、毛髪領域６０３の内部の画素を用い、毛髪長推定に用いる属性特徴量を抽出する。属性特徴量としてはＨＯＧ特徴量６０４、ハールライク特徴量６０５、ＬＢＰ特徴量６０６を成分とする特徴量ベクトルとすることが好適である。また、これらの特徴量のいずれかのみを用いてもよい。

【0069】

第一毛髪長尤度演算手段１２２と第二毛髪長尤度演算手段１２３のそれぞれは、記憶部に記憶されている第一毛髪長識別器群７１０と第二毛髪長識別器群７２０を用いて、特徴量演算手段１２１において得られた属性特徴量の第一毛髪長尤度分布と第二毛髪長尤度分布を求める。

【0070】

統合推定手段１２５は、第一毛髪長尤度分布と第二毛髪長尤度分布を統合して統合尤度分布を求め、最高の尤度を示した属性区分（毛髪長）を推定結果として出力部１４０に出力する。例えば、属性区分（毛髪長）が３０〜４０ｃｍにおいて尤度が最高を示した場合には“セミロング”であるとの推定結果を出力する。

【0071】

以上説明してきたように、第二の実施の形態による毛髪長推定装置は、第一の実施の形態にかかる年齢推定装置と同様に、重複区分を有する識別区分について学習した毛髪長識別器の組を含む第一毛髪長識別器群７１０及び第二毛髪長識別器群７２０を用意することで、学習に用いる人の画像を増やすことなく、誤推定を回避しつつ、従来よりも細かく毛髪長を推定できる。

【0072】

なお、第一の実施の形態における世代識別器のように、より幅の広い区分けの識別区分を学習した毛髪長識別器を用意して、３種類以上の識別器群を組み合わせて尤度を統合するようにしてもよい。

【0073】

［変形例］
上記のいずれの実施の形態においても、属性の値域（第１の実施例では１０〜８０歳、第２の実施例では０〜５０ｃｍという最大と最小の間）の全範囲をいずれかの属性区分（第１の実施例では年齢層の区分、第２の実施例では毛髪長の区分）に割り当てたが必ずしもそれに限られない。

【0074】

例えば、図１１に示すように、第一識別区分識別器群１１及び第二識別区分識別器群１２を構成してもよい。第一識別区分識別器群１１は、属性区分０〜５までを識別区分識別器ＡＣに割り当て、属性区分６〜１３までを識別区分識別器ＤＧに割り当てる。一方、第二識別区分識別器群１２は、属性区分５〜６を識別区分識別器Ｊに割り当て、他の属性区分については識別器を設けない。これは、第一の実施の形態でいうと全年齢層を均等に推定する必要が無い場合に好適な構成となる。すなわち属性区分５と属性区分６を重点的に詳細に年齢層推定をしたいが、それ以外の属性区分０〜４と属性区分７〜１３は、それぞれ単に若齢と老齢と推定すれば十分という場合である。

【0075】

なお、この場合、第二識別区分識別器群１２では、識別区分識別器が割り当てられていない属性区分０〜４、７〜１３が存在することになる。年齢層推定装置では、年齢１０〜３５歳、４５〜８０歳の範囲には年齢層識別器が設けられないことになる。したがって、この属性区分の範囲について、統合推定手段１２５は、統合処理は行わず、第一識別区分識別器群１１（第一年齢層識別器群１３２）のそれぞれの識別器が出力した尤度をそのまま統合尤度として尤度分布全体で正規化処理を行うものとする。

【0076】

また、双方の識別区分識別器群（年齢層識別器群）の属性区分の範囲を同じものとして、一方の識別区分識別器群（年齢層識別器群）が存在しない属性区分（年齢層）が無いようにすることで、属性区分の全範囲について性質が揃った尤度の統合が可能となる。

【0077】

また、いずれの実施の形態においても、識別器及びその学習手法は特に限定されるものではない。例えば、サポートベクターマシンやロジスティック回帰など２クラス識別問題でよく使われる公知の手法を採用することができる。

【0078】

サポートベクターマシンを採用する場合は、各識別器が出力する尤度をそのまま用いるのではなく、尤度を数式（１）に示すシグモイド関数に入力し、０〜１区間の値に変換してクラス事後確率とするのが望ましい。ここで、Ａは勾配パラメータ、Ｂはバイアスパラメータと呼ばれ、シグモイド関数の形を決めるパラメータであり、検証用サンプルを用いて最適な値を求める。求める方法は、例えば、文献“Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods” In Advances in Large Margin Classifiers. MIT Press, 1999に開示されているような、公知の方法を適宜採用すればよい。

【数1】

【0079】

また、これまで述べてきた属性推定装置では、画像から抽出した特徴量であるハールライク特徴量などを採用して識別器を構築しているが画像以外の情報を用いて推定を行うこともできる。例えば、画像情報に代えて音声情報を用いても同様に属性推定装置を構築することができる。

【0080】

具体的には、年齢推定を行う場合、上記第１の実施の形態に準じて第一年齢層推定器群、第二年齢層推定器群から構成される年齢層推定モデル１３１を準備し、正解の年齢がわかっている話者が発声した音声データを学習データとして用意して、年齢層毎に正解の学習データを用いて年齢層推定器に学習させる。この際、推定器の構築に用いる特徴量としては周知のメル周波数ケプストラム係数（ＭＦＣＣ：Mel-Frequency Cepstral Coefficients）を用いることができる。すなわち、年齢層毎の推定器の学習処理においては、音声データから抽出したＭＦＣＣを特徴量とし、特徴量空間において各年齢層における混合ガウスモデル（ＧＭＭ：Gaussian Mixture Model）をそれぞれについて生成する。そして入力された音声データが、それぞれの年齢層に属するかの事後確率をＧＭＭから求め、その事後確率の値をこれまでに述べてきた属性尤度として、同様の統合処理を行えばよい。

【0081】

上記のような、正解データのみを用いて学習した推定器を構築して、各年齢層の属性尤度を用いる方法は、扱うデータを画像情報にしても同様に処理することができる。

【0082】

なお、上記実施の形態では、属性の推定対象を人としたが、これに限定されるものではなく、動物、車両、航空機等の様々な対象物の属性についてどの属性区分に属するかを推定する技術に適用することができる。属性としては、例えば、動物の毛色、車両や航空機のサイズ等の様々な属性について推定が可能である。

【符号の説明】

【0083】

１１第一識別区分識別器群、１２第二識別区分識別器群、３０第一識別区分尤度分布、３１第二識別区分尤度分布、３２統合尤度分布、５０撮像装置、１００年齢推定装置、１１０画像取得手段、１２０推定処理部、１２１特徴量演算手段、１２２第一年齢層尤度演算手段（第一毛髪長尤度演算手段）、１２３第二年齢層尤度演算手段（第二毛髪長尤度演算手段）、１２４世代尤度演算手段、１２５統合推定手段、１３０記憶部、１３１年齢層推定モデル、１３２第一年齢層識別器群、１３３第二年齢層識別器群、１３４世代識別器群、１４０出力部、１５０第二年齢層識別器群、１５１，１５２属性区分、３００顔画像、３０１特徴点、３０２ハールライク特徴量、３０３特徴点同士の距離、３０４ガボール特徴量、３０５ＨＯＧ特徴量、４００第一年齢層尤度分布、４１０第二年齢層尤度分布、４２０世代尤度分布、４３０統合尤度分布、６００上半身画像、６０１特徴点、６０２顔画像領域、６０３毛髪領域、６０４ＨＯＧ特徴量、６０５ハールライク特徴量、６０６ＬＢＰ特徴量、７００毛髪長推定モデル、７１０第一毛髪長識別器群、７２０第二毛髪長識別器群。

【図1】