(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2015-88168(P2015-88168A)
(43)【公開日】2015年5月7日
(54)【発明の名称】学習サンプル生成装置、学習サンプル生成プログラム、及び自動認識装置
(51)【国際特許分類】
G06T 7/00 20060101AFI20150410BHJP
【FI】
G06T7/00 350B
【審査請求】未請求
【請求項の数】9
【出願形態】OL
【全頁数】19
(21)【出願番号】特願2014-133657(P2014-133657)
(22)【出願日】2014年6月30日
(31)【優先権主張番号】特願2013-197750(P2013-197750)
(32)【優先日】2013年9月25日
(33)【優先権主張国】JP
(71)【出願人】
【識別番号】390023249
【氏名又は名称】国際航業株式会社
(74)【代理人】
【識別番号】100158883
【弁理士】
【氏名又は名称】甲斐 哲平
(72)【発明者】
【氏名】武田 浩志
(72)【発明者】
【氏名】藤吉 弘亘
(72)【発明者】
【氏名】山内 悠嗣
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096CA24
5L096FA66
5L096JA22
5L096KA04
(57)【要約】
【課題】本願発明の課題は、従来技術が抱える問題を解決することであり、すなわち多大な労力を伴うことなく従来よりも高い確度で抽出結果を得ることができ、しかもポジティブサンプル/ネガティブサンプルの判断を必要とすることなく、学習サンプルを作成する技術を提供することであり、具体的には、一つの学習サンプルを作成するだけでその周辺に多くの学習サンプルを自動生成することのできる学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムを提供することである。
【解決手段】本願発明の学習サンプル生成装置は、画像を表示する表示手段と、特定点入力手段、主学習サンプル生成手段、従学習サンプル生成手段、記憶手段を備えたものである。このうち主学習サンプル生成手段は、特定点に基づいてオブジェクトを含む主領域を設定し、その領域を構成する画素の集合を主学習サンプルとして生成する手段である。
【選択図】
図2
【特許請求の範囲】
【請求項1】
任意の画像から所定の対象物を自動認識するために用いられる学習サンプルを生成する装置において、
画像を表示する表示手段と、
前記表示手段で表示された画像から、前記対象物を特定する特定点を入力する特定点入力手段と、
前記特定点に基づいて、前記対象物を含む領域である主領域を設定し、該主領域を構成する画素の集合を主学習サンプルとして生成する主学習サンプル生成手段と、
前記主学習サンプルの周囲に、複数の従学習サンプルを生成する従学習サンプル生成手段と、
前記主学習サンプル及び前記従学習サンプルを、前記対象物のポジティブサンプルとして記憶するポジティブサンプル記憶手段と、を備え、
前記従学習サンプル生成手段は、前記主領域を所定距離だけ移動させた従領域を設定するとともに、該従領域を構成する画素の集合を前記従学習サンプルとして生成する、ことを特徴とする学習サンプル生成装置。
【請求項2】
前記従学習サンプルの周囲に複数のネガティブサンプルを生成するネガティブサンプル生成手段と、
前記ネガティブサンプルを、前記対象物のネガティブサンプルとして記憶するネガティブサンプル記憶手段と、を備え、
前記ネガティブサンプル生成手段は、前記主領域を所定距離だけ移動させたネガティブサンプル領域を設定するとともに、該ネガティブサンプル領域を構成する画素の集合を前記ネガティブサンプルとして生成し、
前記ネガティブサンプル領域と前記主領域との離隔は、前記従領域と前記主領域との離隔よりも大きく設定された、ことを特徴とする請求項1記載の学習サンプル生成装置。
【請求項3】
前記対象物のネガティブサンプルを生成するネガティブサンプル生成手段と、該ネガティブサンプルを記憶するネガティブサンプル記憶手段と、を備え、
前記ネガティブサンプル生成手段は、前記対象物の一部又は全部を含む近傍ネガティブサンプルを生成する近傍ネガティブサンプル生成手段と、前記対象物を含まない背景ネガティブサンプルを生成する背景ネガティブサンプル生成手段を有し、
前記近傍ネガティブサンプル生成手段は、前記主領域を所定距離だけ2以上の方向に移動させて、前記主領域の周辺に2以上の近傍ネガティブサンプル領域を設定し、
さらに前記近傍ネガティブサンプル生成手段は、前記2以上の近傍ネガティブサンプル領域に、それぞれ異なる領域として分類する分類識別子を付与するとともに、該近傍ネガティブサンプル領域を構成する画素の集合をそれぞれ前記近傍ネガティブサンプルとして生成し、
前記ネガティブサンプル記憶手段は、前記近傍ネガティブサンプルと前記背景ネガティブサンプルをそれぞれ別のネガティブサンプルとして記憶するとともに、異なる分類識別子を具備する前記近傍ネガティブサンプルはそれぞれ別のネガティブサンプルとして記憶し、
前記近傍ネガティブサンプル領域と前記主領域との離隔は、前記従領域と前記主領域との離隔よりも大きく設定された、ことを特徴とする請求項1又は請求項2記載の学習サンプル生成装置。
【請求項4】
前記近傍ネガティブサンプル生成手段は、生成された前記近傍ネガティブサンプルを左右反転させて、新たに反転した近傍ネガティブサンプルを生成し、
さらに前記近傍ネガティブサンプル生成手段は、前記反転した近傍ネガティブサンプルに対応する前記近傍ネガティブサンプル領域が設定されているときは、該近傍ネガティブサンプル領域が具備する前記分類識別子を、当該反転した近傍ネガティブサンプルに付与する、ことを特徴とする請求項3記載の学習サンプル生成装置。
【請求項5】
コンピュータで実行されることにより、複数の画像から所定の対象物を自動認識するために用いられる学習サンプルを生成するプログラムにおいて、
表示手段で表示された画像に基づいて入力された、前記対象物を特定する特定点を記憶させる特定点記憶処理と、
前記特定点に基づいて、前記対象物を含む領域である主領域を設定し、該主領域を構成する画素の集合を主学習サンプルとして生成する主学習サンプル生成処理と、
前記主学習サンプルの周囲に、複数の従学習サンプルを生成する従学習サンプル生成処理と、
前記主学習サンプル及び前記従学習サンプルを、前記対象物のポジティブサンプルとして記憶させるポジティブサンプル記憶処理と、を前記コンピュータに実行させる機能を備え、
前記主学習サンプル生成処理は、前記主領域を所定距離だけ移動させた従領域を設定するとともに、該従領域を構成する画素の集合を前記従学習サンプルとして生成する、ことを特徴とする学習サンプル生成プログラム。
【請求項6】
前記従学習サンプルの周囲に複数のネガティブサンプルを生成するネガティブサンプル生成処理と、
前記ネガティブサンプルを、前記対象物のネガティブサンプルとして記憶させるネガティブサンプル記憶処理と、を前記コンピュータに実行させる機能を備え、
前記ネガティブサンプル生成処理は、前記主領域を所定距離だけ移動させたネガティブサンプル領域を設定するとともに、該ネガティブサンプル領域を構成する画素の集合を前記ネガティブサンプルとして生成し、
前記ネガティブサンプル領域と前記主領域との離隔は、前記従領域と前記主領域との離隔よりも大きく設定された、ことを特徴とする請求項5記載の学習サンプル生成プログラム。
【請求項7】
前記対象物のネガティブサンプルを生成するネガティブサンプル生成処理と、該ネガティブサンプルを記憶させるネガティブサンプル記憶処理と、を前記コンピュータに実行させる機能を備え、
前記ネガティブサンプル生成処理は、前記対象物の一部又は全部を含む近傍ネガティブサンプルを生成する近傍ネガティブサンプル生成処理と、前記対象物を含まない背景ネガティブサンプルを生成する背景ネガティブサンプル生成処理を含み、
前記近傍ネガティブサンプル生成処理は、前記主領域を所定距離だけ2以上の方向に移動させて、前記主領域の周辺に2以上の近傍ネガティブサンプル領域を設定し、
さらに前記近傍ネガティブサンプル生成処理は、前記2以上の近傍ネガティブサンプル領域に、それぞれ異なる領域として分類する分類識別子を付与するとともに、該近傍ネガティブサンプル領域を構成する画素の集合をそれぞれ前記近傍ネガティブサンプルとして生成し、
前記ネガティブサンプル記憶処理は、前記近傍ネガティブサンプルと前記背景ネガティブサンプルをそれぞれ別のネガティブサンプルとして記憶させるとともに、異なる分類識別子を具備する前記近傍ネガティブサンプルはそれぞれ別のネガティブサンプルとして記憶させ、
前記近傍ネガティブサンプル領域と前記主領域との離隔は、前記従領域と前記主領域との離隔よりも大きく設定された、ことを特徴とする請求項5又は請求項6記載の学習サンプル生成プログラム。
【請求項8】
前記近傍ネガティブサンプル生成処理は、生成された前記近傍ネガティブサンプルを左右反転させて、新たに反転した近傍ネガティブサンプルを生成し、
さらに前記近傍ネガティブサンプル生成処理は、前記反転した近傍ネガティブサンプルに対応する前記近傍ネガティブサンプル領域が設定されているときは、該近傍ネガティブサンプル領域が具備する前記分類識別子を、当該反転した近傍ネガティブサンプルに、付与する、ことを特徴とする請求項7記載の学習サンプル生成プログラム。
【請求項9】
任意の画像から所定の対象物を自動認識する自動認識装置において、
前記対象物のポジティブサンプル、及び前記対象物のネガティブサンプルを処理することによって、該ポジティブサンプルと該ネガティブサンプルの識別境界を設定するサンプル学習手段と、
前記識別境界に基づいて、任意の画像から前記対象物を識別する識別手段と、を備え、
前記ポジティブサンプルは、主学習サンプルと従学習サンプルからなり、
前記ネガティブサンプルは、前記対象物の一部又は全部を含む近傍ネガティブサンプルと、前記対象物を含まない背景ネガティブサンプルからなり、
前記主学習サンプルは、前記対象物を含む領域である主領域を構成する画素の集合であり、
前記従学習サンプルは、前記主領域を所定距離だけ移動させた従領域を構成する画素の集合であり、
前記近傍ネガティブサンプルは、前記主領域を所定距離だけ移動させた近傍ネガティブサンプル領域を構成する画素の集合であり、
前記主領域からの移動方向が異なる前記近傍ネガティブサンプは、それぞれ異なる領域として異なる分類識別子を具備し、
前記サンプル学習手段は、前記近傍ネガティブサンプルと前記背景ネガティブサンプルとの識別境界を設定するととともに、異なる分類識別子を具備する前記近傍ネガティブサンプルどうしの識別境界を設定し、
前記近傍ネガティブサンプル領域と前記主領域との離隔は、前記従領域と前記主領域との離隔よりも大きく設定された、ことを特徴とする自動認識装置。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、画像認識の技術に関するものであり、より具体的には、人や自動車、自転車、電柱、ポストなどある特定の対象を画像から自動認識するために用いられる学習サンプルを生成することのできる学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムに関するものである。
【背景技術】
【0002】
近年、計測技術の発達に伴い、例えば沿道状況を写した画像を位置情報とともに扱うことができる仕組みが提供されている。モバイルマッピングシステム(以下、「MMS」という。)もその一つで、全方位カメラや、GPS(Global Positioning System)などの測位計、IMU(Inertial Measurement Unit)などの慣性計測装置を装備した移動車で計測を行う仕組みである。具体的にはこの移動車で移動しながら、沿道状況の写真(例えば、パノラマ写真)を一定間隔で撮影し、しかも撮影時における撮影位置(座標)や撮影方向も同時に取得する。MMSで取得される多数の写真は球座標系に展開されることもあり、これを利用すれば移動車から見る沿道状況をディスプレイで再現することができる。
【0003】
MMSで取得されるパノラマ画像は位置座標も備えていることから、様々な場面で利用されており、閲覧される機会も増えてきた。ところで不特定の人が閲覧する場合、所定の対象物(以下、「オブジェクト」ともいう。)は隠すか、あるいは不鮮明な状態で閲覧させたいケースがある。例えば、個人を特定できる人の画像を閲覧させると、その個人がその時間その場所に居たことを図らずも証明することになり、プライバシー保護の観点から不都合なこともある。このような場合、人の画像は不鮮明とした状態で提供するよう要望されることが多い。
【0004】
ところが、MMSでは1〜3m進むたびに(又は数秒間ごとに)撮影することから大量の画像が取得され、しかも取得したパノラマ画像には沿道に居る全ての人が収められる。つまり、人の画像を不鮮明にする処理を行うためには、大量のパノラマ画像に写る全ての人を漏れなく抽出する必要があり、これを人手によって処理する場合、著しく多大な労力が必要とされるうえ、いわゆるヒューマンエラーによる抽出漏れが生ずるおそれもある。
【0005】
昨今では、このように大量の画像から特定のオブジェクトを抽出する場合、コンピュータを利用した自動認識技術の利用が主流となっている。あらかじめ、オブジェクトを含む種々の画像から、そのオブジェクトの特徴量(色や形状などを定量化したもの)を記憶し、この記憶した特徴量に基づいて特定のオブジェクトを抽出する。換言すれば、オブジェクトの画像パターンを学習し、その学習結果によって目的のオブジェクトを自動的に認識する訳である。
【0006】
オブジェクトを自動認識するために記憶するデータは「学習サンプル」と言われ、より精度良く、つまり高い確度で(高いロバスト性で)オブジェクトを自動認識するためには多くの学習サンプルを記憶する必要がある。例えば、画像中の人を自動認識する場合、1,000人を超える学習サンプルが必要であると言われている。また、そのオブジェクトの画像(「正事例」と言われることもあるが、ここでは、「ポジティブサンプル」という。)を記憶するだけでなく、そのオブジェクトではない画像(「負事例」と言われることもあるが、ここでは、「ネガティブサンプル」という。)を記憶すると、さらに認識精度が上がる。特に、ポジティブサンプルの周辺にあるネガティブサンプルを用意すると、より良い結果が得られるとされている。なお、「ポジティブサンプル」や「ネガティブサンプル」という用語は、非特許文献1にも示すように、本願発明の技術分野において現在一般的に使用されている。
【0007】
いずれにしろ、高い確度でオブジェクトを自動認識するためには膨大な量の学習サンプルを用意する必要がある。この学習サンプルは、自動認識するための基礎データであるから、当然人の手によって作成することになる。画像から適当なオブジェクトを探し、これを抽出し、ポジティブサンプルとして記憶させる、という一連の作業を相当数(例えば1,000人以上)繰り返す。そのうえ、高い確度で自動抽出しようとすれば、ポジティブサンプルに加えてさらに数多くのネガティブサンプル(特にポジティブサンプルの周辺にあるもの)を用意しなければならない。つまり、自動認識技術は著しく多大な労力を避けるために採用される訳であるが、高い確度で結果を得るためには、結局、学習サンプル作成のため多大な労力が必要になる。このような背景のもと、多大な労力を伴うことなく高い確度で抽出結果を得ることができる技術が望まれてきた。
【0008】
そこで特許文献1では、ウェブ上で収集した任意の画像から自動的に学習サンプルを作成する技術について提案している。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2012−022419号公報
【0010】
【非特許文献1】「統計的学習手法による物体検出の高精度化と効率化 −人検出の実用化に向けて−」 (情報処理学会研究報告 Vol.2013−CVIM−186 No.26 2013/3/15)
【発明の概要】
【発明が解決しようとする課題】
【0011】
特許文献1は、ウェブ上でテキスト検索した結果得られる画像から、適切な学習サンプルを選出する技術であり、いわば選別する手法であって自ら積極的に学習サンプルを作成するものではない。ましてや、自動的にポジティブサンプルとネガティブサンプルを分類して学習サンプルを作成することはない。したがって、例えばMMSで取得されるパノラマ画像から自発的に多くの学習サンプルを作成する場合、特許文献1を利用することはできず、多大な労力を必要とするうえに、ポジティブサンプルかネガティブサンプルの分類は人によって判断しなければならないため誤りも生じやすい。
【0012】
本願発明の課題は、上記問題を解決することであり、すなわち多大な労力を伴うことなく従来よりも高い確度で抽出結果を得ることができ、しかもポジティブサンプル/ネガティブサンプルの判断を必要とすることなく、学習サンプルを作成する技術を提供することであり、具体的には、一つの学習サンプルを作成するだけでその周辺に多くの学習サンプルを自動生成することのできる学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムを提供することである。
【課題を解決するための手段】
【0013】
本願発明は、ポジティブサンプルの学習サンプルを短い距離だけ移動させた画像もやはりポジティブサンプルとして利用でき、ある程度長い距離だけ移動させた画像はネガティブサンプルとして利用できるという点に着目したものであり、従来にはなかった発想に基づいてなされた発明である。
【0014】
本願発明の学習サンプル生成装置は、画像を表示する表示手段と、特定点入力手段、主学習サンプル生成手段、従学習サンプル生成手段、ポジティブサンプル記憶手段を備えたものである。このうち特定点入力手段は、表示手段で表示された画像から所定オブジェクトを特定する特定点を入力する手段であり、主学習サンプル生成手段は、特定点に基づいてオブジェクトを含む主領域を設定し、その領域を構成する画素の集合を主学習サンプルとして生成する手段である。また従学習サンプル生成手段は、主学習サンプルの周囲に複数の従学習サンプルを生成する手段で、ポジティブサンプル記憶手段は、学習サンプル及び従学習サンプルをオブジェクトのポジティブサンプルとして記憶する。なお、従学習サンプル生成手段は、主領域を所定距離だけ移動させた従領域を設定するとともに、この領域を構成する画素の集合を従学習サンプルとして生成する。
【0015】
本願発明の学習サンプル生成装置は、ネガティブサンプル生成手段とネガティブサンプル記憶手段を備えたものとすることもできる。このネガティブサンプル生成手段は、従学習サンプルの周囲に複数のネガティブサンプルを生成するものであり、ネガティブサンプル記憶手段は、ネガティブサンプルをオブジェクトのネガティブサンプルとして記憶する。なお、ネガティブサンプル生成手段は、主領域を所定距離だけ移動させたネガティブサンプル領域を設定するとともに、この領域を構成する画素の集合をネガティブサンプルとして生成する。ただし、ネガティブサンプル領域と主領域との離隔は、従領域と主領域との離隔よりも大きく設定される。
【0016】
本願発明の学習サンプル生成装置は、オブジェクトのネガティブサンプルを生成するネガティブサンプル生成手段と、このネガティブサンプルを記憶するネガティブサンプル記憶手段を備えたものとすることもできる。ネガティブサンプル生成手段は、近傍ネガティブサンプル(オブジェクトの一部又は全部を含む)を生成する近傍ネガティブサンプル生成手段と、背景ネガティブサンプル(オブジェクトを含まない)を生成する背景ネガティブサンプル生成手段を有している。近傍ネガティブサンプル生成手段は、主領域を所定距離だけ2以上の方向に移動させて、主領域の周辺に2以上の近傍ネガティブサンプル領域を設定する。そして、これら2以上の近傍ネガティブサンプル領域に、それぞれ異なる領域として分類する分類識別子を付与し、近傍ネガティブサンプル領域を構成する画素の集合をそれぞれ近傍ネガティブサンプルとして生成する。ネガティブサンプル記憶手段は、近傍ネガティブサンプルと背景ネガティブサンプルをそれぞれ別のネガティブサンプルとして記憶するとともに、異なる分類識別子を具備する近傍ネガティブサンプルはそれぞれ別のネガティブサンプルとして記憶する。ただし、近傍ネガティブサンプル領域と主領域との離隔は、従領域と主領域との離隔よりも大きく設定される。
【0017】
本願発明の学習サンプル生成装置は、近傍ネガティブサンプルを左右反転させて、新たに反転した近傍ネガティブサンプルを生成する、近傍ネガティブサンプル生成手段を備えたものとすることもできる。この場合の近傍ネガティブサンプル生成手段は、反転した近傍ネガティブサンプルに対応する近傍ネガティブサンプル領域が設定されているときは、この近傍ネガティブサンプル領域が具備する分類識別子を、反転した近傍ネガティブサンプルに付与する。
【0018】
本願発明の学習サンプル生成プログラムは、特定点記憶処理と、主学習サンプル生成処理、従学習サンプル生成処理、ポジティブサンプル記憶処理をコンピュータに実行させる機能を備えたものである。このうち特定点記憶処理は、表示手段で表示された画像に基づいて入力された、オブジェクトを特定する特定点を記憶させ、主学習サンプル生成処理は、特定点に基づいてオブジェクトを含む主領域を設定し、この領域を構成する画素の集合を主学習サンプルとして生成する。従学習サンプル生成処理は、主学習サンプルの周囲に複数の従学習サンプルを生成し、ポジティブサンプル記憶処理は、主学習サンプル及び従学習サンプルをオブジェクトのポジティブサンプルとして記憶させる。なお、主学習サンプル生成処理は、主領域を所定距離だけ移動させた従領域を設定するとともに、この領域を構成する画素の集合を従学習サンプルとして生成する。
【0019】
本願発明の学習サンプル生成プログラムは、ネガティブサンプル生成処理とネガティブサンプル記憶処理をコンピュータに実行させる機能を備えたものとすることもできる。このネガティブサンプル生成処理は、従学習サンプルの周囲に複数のネガティブサンプルを生成するものであり、ネガティブサンプル記憶処理は、ネガティブサンプルをオブジェクトのネガティブサンプルとして記憶させる。なお、ネガティブサンプル生成処理は、主領域を所定距離だけ移動させたネガティブサンプル領域を設定するとともに、この領域を構成する画素の集合をネガティブサンプルとして生成する。ただし、ネガティブサンプル領域と主領域との離隔は、従領域と主領域との離隔よりも大きく設定される。
【0020】
本願発明の学習サンプル生成プログラムは、オブジェクトのネガティブサンプルを生成するネガティブサンプル生成処理と、このネガティブサンプルを記憶させるネガティブサンプル記憶処理をコンピュータに実行させる機能を備えたものとすることもできる。ネガティブサンプル生成処理は、近傍ネガティブサンプル(オブジェクトの一部又は全部を含む)を生成する近傍ネガティブサンプル生成処理と、背景ネガティブサンプル(オブジェクトを含まない)を生成する背景ネガティブサンプル生成処理を含む。近傍ネガティブサンプル生成処理は、主領域を所定距離だけ2以上の方向に移動させて、主領域の周辺に2以上の近傍ネガティブサンプル領域を設定する。そして、これら2以上の近傍ネガティブサンプル領域に、それぞれ異なる領域として分類する分類識別子を付与し、近傍ネガティブサンプル領域を構成する画素の集合をそれぞれ近傍ネガティブサンプルとして生成する。ネガティブサンプル記憶処理は、近傍ネガティブサンプルと背景ネガティブサンプルをそれぞれ別のネガティブサンプルとして記憶させるとともに、異なる分類識別子を具備する近傍ネガティブサンプルはそれぞれ別のネガティブサンプルとして記憶させる。ただし、近傍ネガティブサンプル領域と主領域との離隔は、従領域と主領域との離隔よりも大きく設定される。
【0021】
本願発明の学習サンプル生成プログラムは、近傍ネガティブサンプルを左右反転させて、新たに反転した近傍ネガティブサンプルを生成する、近傍ネガティブサンプル生成処理を備えたものとすることもできる。この場合の近傍ネガティブサンプル生成処理は、反転した近傍ネガティブサンプルに対応する近傍ネガティブサンプル領域が設定されているときは、この近傍ネガティブサンプル領域が具備する分類識別子を、反転した近傍ネガティブサンプルに付与する。
【0022】
本願発明の自動認識装置は、任意の画像から所定のオブジェクトを自動認識するものであり、サンプル学習手段と、識別手段を備えたものである。このうちサンプル学習手段は、オブジェクトのポジティブサンプル、及びオブジェクトのネガティブサンプルを数多く処理することによって、ポジティブサンプルとネガティブサンプルの識別境界を設定する。また識別手段は、設定された識別境界に基づいて、任意の画像から目的のオブジェクトを識別する。なお、ポジティブサンプルは、主学習サンプルと従学習サンプルからなり、ネガティブサンプルは、近傍ネガティブサンプル(オブジェクトの一部又は全部を含む)と背景ネガティブサンプル(オブジェクトを含まない)からなる。また主学習サンプルは、オブジェクトを含む領域である主領域を構成する画素の集合であり、従学習サンプルは、主領域を所定距離だけ移動させた従領域を構成する画素の集合である。さらに近傍ネガティブサンプルは、主領域を所定距離だけ移動させた近傍ネガティブサンプル領域を構成する画素の集合である。主領域からの移動方向が異なる近傍ネガティブサンプは、それぞれ異なる領域として扱われ、それぞれ異なる分類識別子を具備する。この場合のサンプル学習手段は、近傍ネガティブサンプルと背景ネガティブサンプルとの識別境界を設定するととともに、異なる分類識別子を具備する近傍ネガティブサンプルどうしの識別境界を設定する。ただし、近傍ネガティブサンプル領域と主領域との離隔は、従領域と主領域との離隔よりも大きく設定される。
【発明の効果】
【0023】
本願発明の学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムには、次のような効果がある。
(1)画像中に目的のオブジェクトを探し出す必要はあるものの、オブジェクトのうち特定の点を指定するだけで一つの学習サンプルが自動生成され、さらにその周辺に多数の学習サンプルが自動生成される。したがって、学習サンプル作成にかかる労力が従来に比べると飛躍的に軽減される。
(2)特定点を指定することで一つの学習サンプルが自動生成されると、自動的に複数のポジティブサンプルが作成されるとともに、自動的に複数のネガティブサンプルが作成される。つまり、人がポジティブサンプルとネガティブサンプルを分類する必要がなく、この点でも労力軽減が図られる。
(3)自動的に多数の学習サンプルが作成できるうえ、ポジティブサンプルとネガティブサンプルの両方が相当数用意される結果、目的のオブジェクトをより高い確度で自動抽出することができる。
【0024】
本願発明の学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムは、複数のオブジェクトを扱うことも可能であり、この場合、上記効果がより顕著に表れる。通常、画像に含まれるオブジェクトには種別の多様性(人,車・・・,背景)があり、しかもそれぞれの種別を細分する多様性(例えば、人に関しては服装,色,体格,性別など、車に関しては車種,色,大きさ,見た目の角度など)もある。そこで、例えば人と車の複数の種別を選択するとともに、同一種別内の多様なサンプルを選択し、それぞれのサンプルに対して本願発明を適用すると、上記効果は極めて顕著に表れる。
【図面の簡単な説明】
【0025】
【
図2】本願発明の学習サンプル生成装置を説明するブロック図。
【
図3】MMSで取得した画像に含まれる「人」に対して特定点を指定し、その特定点に基づいて主学習サンプルが生成される状況を説明するモデル図。
【
図4】主領域を基準に従領域が設定される状況を示すモデル図で、(a)は主領域に対して左下にシフトして設定された従領域を示すモデル図、(b)は主領域に対して右上にシフトして設定された従領域を示すモデル図。
【
図5】主領域中心点を基準に許容範囲を定め、この許容範囲内に中心をもつ従領域を示すモデル図。
【
図6】主領域を基準にネガティブサンプル領域が設定される状況を示すモデル図。
【
図7】ネガティブサンプルから生成された近傍ネガティブサンプルと背景ネガティブサンプルを、ネガティブサンプル記憶手段に記憶することを示すモデル図。
【
図8】主領域の周辺に生成された、複数の近傍ネガティブサンプルを示すモデル図。
【
図9】(a)は反転前の近傍ネガティブサンプルを示すモデル図、(b)は反転後の近傍ネガティブサンプルを示すモデル図。
【発明を実施するための形態】
【0026】
本願発明の学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムの実施形態の一例を、図に基づいて説明する。
【0027】
1.全体概要
図1は、本願発明の主な処理の流れを示すフロー図である。まずはこのフロー図を参考に、本願発明の全体概要について説明する。
【0028】
はじめに、学習サンプルを作成しようとする目的のオブジェクトを含む複数の画像を用意する。なお、ここでは目的のオブジェクトを「人」の場合で説明するが、もちろん本願発明では人以外(例えば、自動車や自転車、電柱、ポストなど)のオブジェクトを選択することもできる。用意した画像をディスプレイ等の表示手段で表示し(Step10)、表示された画像から人を抽出する(Step20)。このとき、画像中にある任意の人を選出できるが、例えば全身が写された人といった具合に一つの規則のもと選出するとよい。
【0029】
画像中の人を抽出できると、その人の画像のうち特定の点(以下、「特定点」という。)を指定する(Step30)。特定点は、一人の人に対して1点とすることもできるし、頭部と足元の2点など複数の特定点を指定することもできる。また、特定点の指定は、ディスプレイ上の画像を確認しながら、マウス等のポインティングデバイスで入力するとよい。
【0030】
ここまでの処理は、オペレータの操作によって行われるが、以降はコンピュータでプログラムを実行することによって処理される。Step40では主学習サンプルが作成される。具体的には、指定された特定点を基準として所定の領域(以下、「主領域」という。)を設定する(Step41)。この主領域は、画像中の人を含み、しかも所定の余裕(バッファ)を有する範囲であって、あらかじめ定められた形状である。その形状は、例えば事前に設定した縦横比の長方形とすることができる。主領域が設定できると、その中に含まれる画素を抽出し、その集合を主学習サンプルとする(Step42)。
【0031】
次のStep50では従学習サンプルが作成される。具体的には、Step41で設定した対象物領域を所定量だけ移動させた領域(以下、「従領域」という。)を設定する(Step51)。この従領域は、主領域と同じ大きさ・形状の領域であるが、主領域とは位置が異なるものである。つまり、主領域と従領域の間には、所定の移動量分の離れ(以下、「離隔」という。)が生じている。ここで所定の移動量(つまり離隔)とは、あらかじめ定められるもので、例えば「右に5画素分と上方に5画素分」など画素単位で設定するとよい。従領域が設定できると、その中に含まれる画素を抽出し、その集合を従学習サンプルとする(Step52)。
【0032】
なお、一つの主学習サンプルに対して複数の従学習サンプルを生成することができる。この場合、従領域は主領域の周辺に複数設定され、例えば離隔を5画素単位とした場合は主領域の周辺に4つの従領域が設定され、離隔を5画素単位及び10画単位とした場合は主領域の周辺に8つの従領域が設定される。そして、すべての従領域に対して従学習サンプルが生成される。
図1のフローではN個の従学習サンプルが生成される例を示している。
【0033】
一つの画像に対して一連の処理(Step10〜Step50)が行われ、主学習サンプルと従学習サンプルが生成できると、異なる画像に対して再度一連の処理を行う。これを必要な画像の数だけ繰り返し、それぞれの画像に対して主学習サンプルと従学習サンプルを得る。なお、一つの画像内に選出すべき人が複数含まれる場合は、Step20〜Step50が繰り返されることになる。また、人に加えて人以外の物(例えば車など)をオブジェクトとする場合、やはり同じ画像に対して一連の処理(Step20〜Step50)を繰り返し行い、学習サンプル(主学習サンプル及び従学習サンプル)を生成する。
【0034】
必要数の主学習サンプルと従学習サンプルが得られると、これらをまとめてポジティブサンプルとして記憶する(Step60)。
【0035】
次に、本願発明の学習サンプル生成装置の主な構成について説明する。
図2は、本願発明の学習サンプル生成装置100を説明するブロック図である。画像記憶手段101は、例えばMMSで取得した沿道状況の画像を記憶する。ここで記憶した画像の中から選択した画像を表示するのが表示手段102である。特定点入力手段103は、オブジェクト(ここでは人)の特徴となる特定点を指定するもので、既述のとおりマウス等のポインティングデバイスが利用される。ここで指定された特定点の情報(特に画像中の座標)は一時的に記憶され、主学習サンプル生成手段104に引き渡される。主学習サンプル生成手段104は、既述した処理(主領域の設定〜主領域内の画素抽出)によって主学習サンプルを生成するものである。ここで設定された主領域は、従学習サンプル生成手段105に引き渡され、既述した処理(従領域の設定〜従領域内の画素抽出)によって従学習サンプルが生成される。生成された主学習サンプルと従学習サンプルは、ポジティブサンプルとしてポジティブサンプル記憶手段106に記憶される。
【0036】
ネガティブサンプル生成手段107は、ネガティブサンプルを生成するものである。後述するように、ネガティブサンプルとは「オブジェクトではない」データであり、従学習サンプルと同様、主領域を基に生成される。ネガティブサンプルを生成するときの移動量(つまり離隔)は、従学習サンプルの離隔より大きく設定される。つまり、主学習サンプルから大きく離れた位置にある画像は、たとえオブジェクトの一部を含んでいたとしても、もはやオブジェクトを表す画像ではないと考える訳である。ネガティブサンプル生成手段107で生成されたネガティブサンプルは、ネガティブサンプル記憶手段108に記憶される。
【0037】
ポジティブサンプル記憶手段106に記憶されたポジティブサンプルと、ネガティブサンプル記憶手段108に記憶されたネガティブサンプルは、自動認識装置200で利用される。自動認識装置200は、ポジティブサンプル及びネガティブサンプルから人の特徴量を記憶し、これに基づいて所定の画像から人のみを自動的に検出していく。ここで検出された人の画像は、オブジェクト画像記憶手段で記憶される。なお自動認識装置200は、本願発明の学習サンプル生成装置100とは別の装置として構築することもできるし、学習サンプル生成装置100の一部として構築することもできる。
【0038】
以下、学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムを構成する主な要素ごとに詳述する。
【0039】
2.主学習サンプル
図3は、MMSで取得した画像に含まれる「人」に対して特定点300を指定し、その特定点300に基づいて主学習サンプル400が生成される状況を説明するモデル図である。
図3のうち上方に示す図は、MMSによって取得された沿道状況を表す画像であり、この中には学習サンプル400として適切なオブジェクト(人)が写されている。この画像を表示手段102で表示し、人に対して特定点300を指定する。既述のとおり、一つのオブジェクトに対して1点の特定点300を指定してもよいし、この図のように頭部と足元に1点ずつ特定点300を指定してもよい。なお
図3では、便宜上特定点を三角形の頂点で示しているが、画像に表示される目印はこれに限らず種々のものを用いることができる。
【0040】
特定点300が指定できると、この特定点300の画像上の座標を基準に主領域410が設定される。
図3では、人の頭部で指定した特定点300と、足元で指定した特定点300によって上下方向の長さ(縦長さ)が決定され、その縦長さにあらかじめ定めた縦横比を乗じて横長さが決定される。なお、縦長さを決定する際、上下の特定点300から求められる実寸法に所定の余裕長が上下ともに加えられ、いわゆるバッファが設けられる。また、縦横比は任意に設計することができるが、いくつかのサンプル画像を基に適切な値を採用するとよい。
【0041】
特定点300を1点だけ指定した場合、主領域410の縦長さ、横長さ、特定点からのオフセットなどをあらかじめ定めておく。また、特定点300を4点指定する場合は、その4点で構成される領域(4点を通過する4直線で形成される長方形)の周囲にバッファを設けて主領域410を設定する。いずれにしろ主領域410が設定されると、その中に含まれるすべての画素を抽出し、これら画素で構成される主学習サンプル400を生成する。
【0042】
3.従学習サンプル
主学習サンプルは、一つのオブジェクト(人)に対して一つだけ生成される。一方の従学習サンプルは、一つのオブジェクトに対して複数生成される。
図4は、主領域410を基準に従領域510が設定される状況を示すモデル図で、(a)は主領域410に対して左下にシフトした従領域510を示すモデル図、(b)は主領域410に対して右上にシフトした従領域510を示すモデル図である。
【0043】
図4に示すように従領域510(図では太枠で示す)は、主領域410(図では網がけで示す)の一部を含みつつ、主領域410の周辺に設定される。具体的には、主領域410に対して離隔δp(横離隔δpx、及び縦離隔δpy)を設け、主領域410と同様の形状・寸法の領域(以下、定型領域)という。)で設定される。
図4(a)では、主領域410から左方向に横離隔δpx、下方向に縦離隔δpyを設けて従領域510が設定され、
図4(b)では、主領域410から右方向に横離隔δpx、上方向に縦離隔δpyを設けて従領域510が設定されている。さらに、主領域410に対して左上にシフトした従領域510と、主領域410に対して右下にシフトした従領域510を設定することができ、つまり一つの(一組の)離隔δpに対して4つの従領域510を設定することができる。
【0044】
離隔δpは、既述のとおり画素単位で設定される。また、一つの主領域410に対して複数の離隔δpを設定することもできる。例えば、第1の離隔δpを横離隔δpx=5画素,縦離隔δpy=5画素とし、第2の離隔δpを横離隔δpx=5画素,縦離隔δpy=10画素とし、さらに第3の離隔δpを横離隔δpx=10画素,縦離隔δpy=5画素とすれば、一つの主領域410に対して12の従領域510を設定することができる。なお、離隔δpの大きさは定型領域の大きさに応じて設定することもでき、例えば、定型領域の画像サイズが横100×縦200画素であれば、その10%を離隔δpサイズ(つまり重複長さが90%)とし、横離隔δpx=10画素,縦離隔δpy=20画素と設定することもできる。
【0045】
いずれにしろ従領域510は、その一部が主領域410と重複(オーバーラップ)するものであり、換言すれば主領域410と一部でも重複すれば(つまり重複率が0%でなければ)従領域510として扱うことができる。この重複率が大きい従学習サンプル500ほど高い確度で抽出結果を得ることができるという点で好適であり、重複率が80%以上であって離隔δpサイズ(つまり、主領域410から従領域510を「ずらす」距離)が5%程度(より望ましくは1%以下)であれば、より好適な従学習サンプル500となることが事前の試算により確認された。ただし、離隔δpサイズを小さく(重複率を大きく)設定し、その離隔δpサイズ刻みで数多くの従学習サンプル500を作成すると、機会学習に係る処理速度に影響を及ぼすこととなる。したがって、離隔δpサイズは状況に応じて適宜設計することが望ましい。
【0046】
従領域510は、主領域410の中心(図心)を基準に定められる許容範囲420に基づいて設定することもできる。
図5は、主領域中心点410aを基準に許容範囲420を定め、この許容範囲420内に中心(図心)をもつ従領域510を示すモデル図である。
【0047】
具体的には、
図5に示すように、主領域410の中心である主領域中心点410aを基準に所定の許容範囲420を定め、中心が許容範囲420内にある定型領域すべてを従領域510とする。図では、主領域中心点410aを中心として楕円形の許容範囲420を定め、この楕円内に中心点をもつ定型領域すべてを従領域510とする。
図5では、従領域中心点511aが許容範囲420内にある従領域511と、従領域中心点512aが許容範囲420内にある従領域512を例示している。つまりこの場合の離隔δpは、主領域中心点410aと従領域中心点512aとの「中心間距離」と考えることができる。なお、許容範囲420の大きさは状況に応じて適宜設計することができるし、許容範囲420の形状も楕円形に限らず、矩形やひし形、円形など種々の形状とすることができる。
【0048】
従領域510が設定されると、その中に含まれるすべての画素を抽出し、これら画素で構成される従学習サンプル500を生成する。
【0049】
4.ネガティブサンプル
図6は、主領域410を基準にネガティブサンプル領域610が設定される状況を示すモデル図である。この図に示すように、従領域510(図では破線で示す)と同様、ネガティブサンプル領域610(図では太枠で示す)は、主領域410(図では網がけで示す)の一部を含みつつ、主領域410の周辺に設定される。具体的には、主領域410に対してネガティブサンプル離隔δn(ネガティブサンプル横離隔δnx、及びネガティブサンプル縦離隔δny)を設けて定型領域で設定される。この図では、主領域410から左方向にネガティブサンプル横離隔δnx、下方向にネガティブサンプル縦離隔δnyを設けてネガティブサンプル領域610が設定されているが、従領域510と同様、一つの(一組の)ネガティブサンプル離隔δnに対して4つのネガティブサンプル領域610を設定することができる。
【0050】
ネガティブサンプル離隔δnは、従領域510の離隔δpと同様に画素単位で設定される。ただし、主領域410から大きく離れた位置にネガティブサンプル領域610は設定されるため、ネガティブサンプル離隔δnは従領域510の離隔δpよりも大きな値が採用される。また、従領域510の設定と同様、一つの主領域410に対して複数の(複数組の)ネガティブサンプル離隔δnを設定することもできる。
【0051】
さらに従領域510の設定と同様、主領域中心点410aを基準に定めた許容範囲420に基づいてネガティブサンプル領域610を設定することもできる。ネガティブサンプル領域610を設定するための許容範囲420は、従領域510を設定するための許容範囲420より広い範囲であって、しかも従領域510における許容範囲420は除かれる。既述のとおりこの場合の離隔δpは、主領域中心点410aと従領域中心点512aとの「中心間距離」と考えることができ、ネガティブサンプル離隔δn(すなわち、ネガティブサンプル領域610の中心間距離)は、従領域510の離隔δp(すなわち、従領域510の中心間距離)よりも大きな値が採用される。ただし、このときの距離の大小判断は、2点間の直線距離(ユークリッド距離)を基準としたり、所定の「矩形」領域の内外を指標とするマンハッタン距離を基準としたり、所定の「ひし形」領域の内外を指標とするチェビシェフ距離を基準としたり、その他、所定の領域の内外を指標とする種々の手法による距離を基準とすることができる。
【0052】
ネガティブサンプル領域610が設定されると、その中に含まれるすべての画素を抽出し、これら画素で構成されるネガティブサンプル600を生成する。
【0053】
5.近傍ネガティブサンプルと背景ネガティブサンプル
ネガティブサンプル600を「近傍ネガティブサンプル」と「背景ネガティブサンプル」に分類した上で、利用することもできる。背景ネガティブサンプルは、主領域410から大きく離れた位置にある画像であって、オブジェクトを含まない背景画像である。したがって、この背景ネガティブサンプルは、明らかにポジティブサンプルと相違することが分かるサンプルといえる。
【0054】
一方、近傍ネガティブサンプルは、主領域410に比較的近い位置の画像であって、オブジェクトの一部又は全部を含む画像である。また、近傍ネガティブサンプルは、ポジティブサンプルと背景ネガティブサンプルの識別境界の周辺にあるサンプルといえる。ポジティブサンプルと背景ネガティブサンプルの識別境界の周辺に多くの学習データ(つまり、近傍ネガティブサンプル)を配置することで、識別境界の確度を高めることができ、ひいては目的とするオブジェクトの識別確度を高めることができる訳である。なお、ポジティブサンプルと背景ネガティブサンプルの識別境界は、例えば、ポジティブサンプルから特徴量(例えば、HOG特徴量:Histograms of Oriented Gradients)を求め、さらに背景ネガティブサンプルからも特徴量を求め、それぞれの特徴量に基づき分類アルゴリズム(例えば、サポートベクターマシン(SVM)や、Random Forest、など)で処理することによって設定することができる。
【0055】
図7は、ネガティブサンプル600から生成された近傍ネガティブサンプルと背景ネガティブサンプルを、ネガティブサンプル記憶手段に記憶することを示すモデル図である。この図に示すように、ネガティブサンプル600を生成するネガティブサンプル生成手段107は、近傍ネガティブサンプル生成手段107Sと、背景ネガティブサンプル生成手段107Bを有している。
【0056】
近傍ネガティブサンプル生成手段107Sは、主領域410の周辺に複数の近傍ネガティブサンプルを生成するもので、これらの近傍ネガティブサンプルは近傍ネガティブサンプル記憶手段108Sに記憶される。また、複数の近傍ネガティブサンプルは、それぞれ異なるサンプルとして扱うべく分類識別子が付与される。例えば
図7では、第1の近傍ネガティブサンプルに「Class−1」という分類識別子が、第2の近傍ネガティブサンプルに「Class−2」という分類識別子が、第Nの近傍ネガティブサンプルに「Class−n」という分類識別子が、それぞれ付与されている。そして、これら異なる分類識別子を具備する近傍ネガティブサンプルは、それぞれ別の近傍ネガティブサンプルとして記憶される。なお
図7では、分類識別子Class−1を具備する第1の近傍ネガティブサンプルが、近傍ネガティブサンプル記憶手段108_S1に記憶され、分類識別子Class−2を具備する第2の近傍ネガティブサンプルが、近傍ネガティブサンプル記憶手段108_S2に記憶され、分類識別子Class−nを具備する第Nの近傍ネガティブサンプルが、近傍ネガティブサンプル記憶手段108_Snに記憶されているが、必ずしも別の記憶手段を用意する必要はなく、それぞれ異なる近傍ネガティブサンプルとして記憶することができればひとつの記憶手段に記憶させることもできる。
【0057】
背景ネガティブサンプル生成手段107Bは、主領域410から離れた位置に複数の背景ネガティブサンプルを生成するもので、これらの背景ネガティブサンプルは背景ネガティブサンプル記憶手段108_Bに記憶される。なお
図7では、近傍ネガティブサンプルが近傍ネガティブサンプル記憶手段108_Sに記憶され、背景ネガティブサンプルが背景ネガティブサンプル記憶手段108_Bに記憶されているが、必ずしも別の記憶手段を用意する必要はなく、それぞれ異なるものとして記憶することができればひとつの記憶手段に記憶させることもできる。
【0058】
図8は、主領域410の周辺に生成された、複数の近傍ネガティブサンプルを示すモデル図である。記述のとおりネガティブサンプル600は、主領域410を所定距離だけ移動させたネガティブサンプル領域610を設定し、このネガティブサンプル領域610内にある画像を集合することで生成される。近傍ネガティブサンプルも同様に、主領域410を所定距離だけ移動させた近傍ネガティブサンプル領域を設定し、この近傍ネガティブサンプル領域内にある画像を集合することで生成される。
図8では、中央にある主領域410を8方向に移動させて近傍ネガティブサンプル領域を設定している。具体的には、主領域410を右方向に所定距離だけ移動したもの、左方向に所定距離だけ移動したもの、上方向に所定距離だけ移動したもの、下方向に所定距離だけ移動したもの、右上方向に所定距離だけ移動したもの、右下方向に所定距離だけ移動したもの、左上方向に所定距離だけ移動したもの、左下方向に所定距離だけ移動したものである。
【0059】
異なる方向あるいは異なる距離で移動させた近傍ネガティブサンプル領域(つまり、位置が相違する近傍ネガティブサンプル領域)は、それぞれ異なる領域として扱うため、それぞれ異なる分類識別子が付与される。例えば
図8では、主領域410が左上方向に移動した近傍ネガティブサンプル領域(オブジェクトが右下方向に移動したように見える領域)には分類識別子Class−1が、左方向に移動した近傍ネガティブサンプル領域には分類識別子Class−2が、左下方向に移動した近傍ネガティブサンプル領域には分類識別子Class−3が、下方向に移動した近傍ネガティブサンプル領域には分類識別子Class−4が、右下方向に移動した近傍ネガティブサンプル領域には分類識別子Class−5が、右方向に移動した近傍ネガティブサンプル領域には分類識別子Class−6が、右上方向に移動した近傍ネガティブサンプル領域には分類識別子Class−7が、上方向に移動した近傍ネガティブサンプル領域には分類識別子Class−8が、それぞれ付与されている。なお、この図では中央の主領域410には分類識別子Class−0を付与している。図中の破線枠は、オブジェクトの位置を明確にするため便宜上設けたものである。これら異なる分類識別子を具備する近傍ネガティブサンプル領域に基づいて、異なる分類識別子を具備する「近傍ネガティブサンプル」が生成され、これらの近傍ネガティブサンプルは、ネガティブサンプル記憶手段108(近傍ネガティブサンプル記憶手段108_S)に記憶される。
【0060】
図8では、主領域410の周辺に8個の近傍ネガティブサンプルを生成する例を示したが、これに限らず左右(あるいは上下)に2個の近傍ネガティブサンプルを生成することも、主領域410の周囲に12個の近傍ネガティブサンプルを生成することも、あるいはさらに多数の近傍ネガティブサンプルを生成することもできる。また、近傍ネガティブサンプルは、必ずしも主領域410に対して対称形で生成される必要はなく、任意の配置で任意の数の近傍ネガティブサンプルを生成することができる。
【0061】
近傍ネガティブサンプルの数を増やすため、近傍ネガティブサンプルを反転させて新たな近傍ネガティブサンプルを生成することもできる。
図9は、
図8に示す近傍ネガティブサンプルのうち分類識別子Class−2を具備するものを反転させた図であり、(a)は反転前の近傍ネガティブサンプルを示すモデル図、(b)は反転後の近傍ネガティブサンプルを示すモデル図である。この図に示すように、近傍ネガティブサンプル(Class−2)を反転させると、異なる近傍ネガティブサンプルが生成される。しかしながら、反転前と反転後で比較すると、近傍ネガティブサンプル領域は相違していることが分かる。例えば
図9では、反転前は主領域410を左方向に移動した近傍ネガティブサンプル領域であるが、反転後は主領域410を右方向に移動した近傍ネガティブサンプル領域となっている。したがって、この場合は反転して生成された新たな近傍ネガティブサンプルは、
図8で分類識別子Class−6を具備する近傍ネガティブサンプル領域に対応し、すなわち、この反転した近傍ネガティブサンプルには分類識別子Class−6が付与される。なお、反転した近傍ネガティブサンプルに対応する近傍ネガティブサンプル領域が存在しない場合は、新たな分類識別子(例えば、
図8ではClass−10など)を付与して利用することもできる。
【0062】
図2に示す自動認識装置200が近傍ネガティブサンプルを利用する場合について、HOG特徴量に基づくSVM処理の例で説明する。まず、複数のポジティブサンプル(主学習サンプル、従学習サンプル)と、複数の近傍ネガティブサンプルと、複数のブ背景ネガティブサンプルからもHOG特徴量を求める。このとき、異なる分類識別子を具備する近傍ネガティブサンプルは、それぞれ別の近傍ネガティブサンプルとしてHOG特徴量を求める。そして、HOG特徴量を基にSVMで処理することによって、識別境界を設定する。この識別境界は、当然ながら、ポジティブサンプルと近傍ネガティブサンプルとの間で設定され、ポジティブサンプルと背景ネガティブサンプルとの間で設定される。また、近傍ネガティブサンプルと背景ネガティブサンプルとの間でも識別境界は設定され、さらに、異なる分類識別子を具備する近傍ネガティブサンプどうし(例えば、分類識別子Class−2を具備する近傍ネガティブサンプルと、分類識別子Class−3を具備する近傍ネガティブサンプルとの間)でも識別境界は設定される。このように識別境界が設定されると、自動認識装置200はこれら識別境界を基礎として、任意の画像から目的のオブジェクトを自動認識する。なお本願発明を実施するに当たって、HOG特徴量に限らず他の特徴量(物理量)を利用することもできるし、SVMに限らず他の分類アルゴリズムを利用することもできる。
【産業上の利用可能性】
【0063】
本願発明の学習サンプル生成装置、自動認識装置、及び学習サンプル生成プログラムは、MMSで取得した画像中に写る顔をぼかす場合や、沿道にある標識や看板等をぼかす場合などに、好適に利用することができる。また、画像中に写る人を数えるなど、目的のオブジェクトの数量計上にも応用することができる。
【符号の説明】
【0064】
100 学習サンプル生成装置
101 画像記憶手段
102 表示手段
103 特定点入力手段
104 主学習サンプル生成手段
105 従学習サンプル生成手段
106 ポジティブサンプル記憶手段
107 ネガティブサンプル生成手段
108 ネガティブサンプル記憶手段
200 自動認識装置
300 特定点
400 主学習サンプル
410 主領域
410a 主領域中心点
420 許容範囲
500 主学習サンプル
510 従領域
510a 従領域中心点
600 ネガティブサンプル
610 ネガティブサンプル領域
δp (従領域と主領域との)離隔
δpx (従領域の)横離隔
δpy (従領域の)縦離隔
δn (ネガティブサンプル領域と主領域との)離隔
δnx ネガティブサンプル横離隔
δny ネガティブサンプル縦離隔