(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024127101
(43)【公開日】2024-09-20
(54)【発明の名称】車種識別装置、車種識別モデル生成装置および車種識別モデル生成方法
(51)【国際特許分類】
G06V 10/82 20220101AFI20240912BHJP
G06T 7/00 20170101ALI20240912BHJP
G06V 10/22 20220101ALI20240912BHJP
G06V 20/62 20220101ALI20240912BHJP
G06V 20/54 20220101ALI20240912BHJP
G06V 10/774 20220101ALI20240912BHJP
G08G 1/015 20060101ALI20240912BHJP
【FI】
G06V10/82
G06T7/00 350C
G06T7/00 650B
G06V10/22
G06V20/62
G06V20/54
G06V10/774
G08G1/015 A
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023035991
(22)【出願日】2023-03-08
(71)【出願人】
【識別番号】000003942
【氏名又は名称】日新電機株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】安井 達哉
(72)【発明者】
【氏名】森本 充
(72)【発明者】
【氏名】竹原 輝巳
(72)【発明者】
【氏名】服部 公祐
(72)【発明者】
【氏名】小林 正憲
【テーマコード(参考)】
5H181
5L096
【Fターム(参考)】
5H181AA01
5H181BB13
5H181BB20
5H181CC04
5H181DD10
5H181EE02
5H181EE07
5H181FF10
5H181FF13
5H181KK01
5H181KK02
5H181KK03
5H181KK04
5H181MC19
5L096BA04
5L096BA18
5L096EA35
5L096FA69
5L096GA59
5L096HA11
5L096KA04
5L096KA15
5L096MA03
(57)【要約】
【課題】自動車の車種を正確に識別することが可能な技術を提供する。
【解決手段】切出し領域サイズ計算部(21)は、自動車を撮影した撮影画像におけるナンバープレート位置座標に基づいて、切出し領域サイズを計算する。切出し処理部(23)は、切出し領域サイズ計算部(21)によって計算された切出し領域サイズに応じて、撮影画像から、自動車の車種を識別するための画像を切出す。そして、識別部(24)は、自動車の車種を識別するための学習用画像とラベルとの関係を学習した学習モデルを用いて、切出し処理部(23)によって切出された画像から、自動車の車種を識別する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
自動車を撮影した撮影画像におけるナンバープレート位置座標に基づいて、切出し領域サイズを計算する切出し領域サイズ計算部と、
前記切出し領域サイズ計算部によって計算された前記切出し領域サイズに応じて、前記撮影画像から、前記自動車の車種を識別するための画像を切出す切出し処理部と、
前記自動車の車種を識別するための学習用画像とラベルとの関係を学習した学習モデルを用いて、前記切出し処理部によって切出された画像から、前記自動車の車種を識別する識別部と、を備える車種識別装置。
【請求項2】
前記学習用画像は、第1の学習画像と、当該第1の学習画像に対して画像処理を行うことによって得られた第2の学習画像とを含む、請求項1に記載の車種識別装置。
【請求項3】
前記第2の学習画像は、前記第1の学習画像に対して、ホモグラフィ変換行列を用いて変換した画像である、請求項2に記載の車種識別装置。
【請求項4】
前記第2の学習画像は、前記第1の学習画像に対して、画像を左右にシフトするための第1の変換行列、画像を上下にシフトするための第2の変換行列、画像を台形補正するための第3の変換行列、および画像を拡大縮小するための第4の変換行列、の少なくともいずれかを用いて変換した画像である、請求項3に記載の車種識別装置。
【請求項5】
前記学習用画像は、前記第1の学習画像に対して、前記第1の変換行列、前記第2の変換行列、前記第3の変換行列、および前記第4の変換行列のうちの複数の変換行列の順序を並び替えた行列積を用いて変換した複数の前記第2の学習画像を含む、請求項4に記載の車種識別装置。
【請求項6】
前記第2の学習画像は、前記第1の学習画像に対して、明るさ補正を行った画像である、請求項2~5のいずれか1項に記載の車種識別装置。
【請求項7】
前記第2の学習画像は、前記第1の学習画像に対して、色反転を行った画像である、請求項2~5のいずれか1項に記載の車種識別装置。
【請求項8】
前記切出し領域サイズ計算部は、前記ナンバープレート位置座標の高さ方向の座標と、前記切出し処理部が画像を切出すときの基準となる基準ナンバープレート位置座標の高さ方向の座標とが一致するときに、前記切出し領域サイズを計算する、請求項1~5のいずれか1項に記載の車種識別装置。
【請求項9】
前記ナンバープレート位置座標の高さ方向の座標をY座標とし、前記撮影画像の縦方向のサイズをα、当該Y座標が最大のときの切出し領域サイズをβ、当該Y座標が最小のときの切出し領域サイズをγとすると、前記切出し領域サイズ計算部は、次式(式1a)によって切出し領域サイズL×Lを計算する、請求項8に記載の車種識別装置。
L=(β-γ)×y/α+γ ・・・(式1a)
【請求項10】
自動車の車種を識別するための第1の学習画像に対して、画像処理を行うことによって第2の学習画像を生成する画像処理部と、
前記第1の学習画像および前記第2の学習画像とラベルとの関係を学習して学習モデルを生成する学習部と、を備える、車種識別モデル生成装置。
【請求項11】
自動車の車種を識別するための第1の学習画像に対して、画像処理を行うことによって第2の学習画像を生成する工程と、
前記第1の学習画像および前記第2の学習画像とラベルとの関係を学習して学習モデルを生成する工程と、を含む、車種識別モデル生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車種識別装置、車種識別モデル生成装置および車種識別モデル生成方法に関する。
【背景技術】
【0002】
例えば、視野内に侵入した走行中の車両をITV(Industrial Television)カメラで連続的に撮像し、そのITVカメラにより撮像された画像情報に基づいて、車両のナンバープレートを映し出した画像をコンピュータ処理で検出し、そのナンバープレート中の文字情報を読み取ることにより車両を識別する車両ナンバー読取装置がある。これに関連する技術として、下記の特許文献1に開示された発明がある。
【0003】
特許文献1には、撮像カメラにより得られたナンバープレートのグレースケール画像を二値化した二値画像からナンバープレート中の記号の水平エッジ位置を特定し、記号の水平エッジ位置を中心としてグレースケール画像上で水平方向左右に所定の画素数オフセットした勾配値計測範囲および基準値計測範囲を設定し、その勾配値計測範囲内でのグレースケール濃度の勾配値を計測値として算出すると共に、基準値計測範囲内でのコントラスト値を基準値として算出し、その基準値に対する計測値の割合をフォーカス評価値として算出するフォーカス評価部が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009-140160号公報(2009年6月25日公開)
【発明の概要】
【発明が解決しようとする課題】
【0005】
車両ナンバー読取装置は、車両のナンバープレート中の文字情報を読み取ることで、駐車場や構内の入出管理、道路上における不審車両の追跡調査等を行うことができる。ナンバープレート情報は車両を一意に識別できるため、管理を行ううえでは十分であるが、ナンバープレート情報に加えて車種の情報があれば、管理者、監視者が該当の車両を目視で発見しやすくなる。
【0006】
しかしながら、ナンバープレート情報は、車両の種類についての大まかな区別(乗用車、軽自動車等)しか識別することができず、詳細な車種(車名)を識別することはできない。このような問題は、上述の特許文献1を用いたとしても解決することはできない。
【0007】
本発明の一態様は、自動車の車種を正確に識別することが可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するために、本発明の一態様に係る車種識別装置は、自動車を撮影した撮影画像におけるナンバープレート位置座標に基づいて、切出し領域サイズを計算する切出し領域サイズ計算部と、前記切出し領域サイズ計算部によって計算された前記切出し領域サイズに応じて、前記撮影画像から、前記自動車の車種を識別するための画像を切出す切出し処理部と、前記自動車の車種を識別するための学習用画像とラベルとの関係を学習した学習モデルを用いて、前記切出し処理部によって切出された画像から、前記自動車の車種を識別する識別部と、を備える。
【0009】
上記の課題を解決するために、本発明の一態様に係る車種識別モデル生成装置は、自動車の車種を識別するための第1の学習画像に対して、画像処理を行うことによって第2の学習画像を生成する画像処理部と、前記第1の学習画像および前記第2の学習画像と、ラベルとの関係を学習して学習モデルを生成する学習部と、を備える。
【0010】
また、上記の課題を解決するために、本発明の一態様に係る車種識別モデル生成方法は、自動車の車種を識別するための第1の学習画像に対して、画像処理を行うことによって第2の学習画像を生成する工程と、前記第1の学習画像および前記第2の学習画像と、ラベルとの関係を学習して学習モデルを生成する工程と、を含む。
【発明の効果】
【0011】
本発明の一態様によれば、自動車の車種を正確に識別することが可能となる。
【図面の簡単な説明】
【0012】
【
図1】本発明の一実施形態に係る車種識別システムの概略構成を示すブロック図である。
【
図2】ナンバープレート位置座標を説明するための図である。
【
図3】ナンバープレート位置座標のY座標と切出し領域サイズとの関係を示すテーブルである。
【
図5】切出し処理部によって切出された画像の一例を示す図である。
【
図6】本発明の一実施形態に係る車種識別装置の切出し領域サイズ計算部および切出し処理部の処理手順を説明するためのフローチャートである。
【
図7】本発明の一実施形態に係る車種識別装置の識別部の処理手順を説明するためのフローチャートである。
【
図8】本発明の一実施形態に係る車種識別モデル生成装置の概略構成を示すブロック図である。
【
図9】本発明の一実施形態に係る車種識別モデル生成装置の処理手順を説明するためのフローチャートである。
【
図10】
図9に示す画像処理の詳細を説明するためのフローチャートである。
【
図11】
図10に示す変換行列作成処理の詳細を説明するためのフローチャートである。
【発明を実施するための形態】
【0013】
(車種識別システム100の構成例)
図1は、本発明の一実施形態に係る車種識別システム100の概略構成を示すブロック図である。車種識別システム100は、撮像装置1と、車種識別装置2とを備える。この車種識別システム100は、道路を走行する自動車を撮影し、車種を識別するための画像を切出すことができる。また、車種識別システム100は、駐車場を出入りする自動車を撮影し、車種を判別するための画像を切出すようにしてもよい。なお、車種とは、トラック、軽自動車等の車種だけでなく、自動車の車名(通称名)をも意味している。したがって、車種識別装置2は、自動車の車名を識別できるように画像を切出し、予め学習させた学習モデルを用いて切出した画像から車種を識別するものである。
【0014】
撮像装置1は、撮像部11と、位置座標検出部12とを含む。撮像部11は、カメラ等によって構成され、走行する自動車の画像を撮影する。撮像部11は、例えば、6m程度の高さに設置され、走行する自動車の前面(フロント部)を斜め上から撮影する。なお、撮像部11は、走行する自動車の背面を撮影するようにしてもよい。
【0015】
位置座標検出部12は、撮影した自動車の前面の画像から、ナンバープレートの画像部
分を抽出し、ナンバープレート位置座標を検出する。このナンバープレート位置座標の検出を、
図2を用いて説明する。
【0016】
図2は、ナンバープレート位置座標を説明するための図である。
図2に示すように、ナンバープレートには、地域名「京都」および分類番号「×××」を示す行と、用途「あ」および一連番号「××-××」を示す行とが記載されている。位置座標検出部12は、地域名および分類番号を示す行と、用途および一連番号を示す行との間であり、かつ、横幅の中央となる点Pの座標をナンバープレート位置座標として検出し、車種識別装置2に出力する。なお、ナンバープレート位置座標は、これに限定されるものではなく、ナンバープレートを基準とした他の座標であってもよい。
【0017】
図2に示すように、点Pからナンバープレートの左端までの長さをW
L、点Pからナンバープレートの右端までの長さをW
Rとすると、位置座標検出部12は、W
L=W
Rとなるように点Pを定める。撮像部11によって撮影された画像における点Pの座標が、ナンバープレート位置座標となる。以下、ナンバープレート位置座標、すなわち、点Pの座標をP(x,y)とする。なお、ナンバープレート位置座標P(x,y)は、撮影画像をXY座標で表した場合におけるナンバープレートの位置座標となる。
【0018】
なお、図示しない画像処理装置が、撮像部11によって撮影された画像およびナンバープレート位置座標を参照し、車両のナンバープレート中の文字情報を読み取ることで、車両のナンバープレート情報を取得することができる。したがって、撮像部11によって撮影された画像を、車両のナンバープレート情報の取得と、車両の車種を識別するための画像の切出しとの両方に使用することができる。
【0019】
再び、
図1の説明に戻る。車種識別装置2は、切出し領域サイズ計算部21と、設定ファイル22と、切出し処理部23と、識別部24とを含む。なお、撮像装置1と車種識別装置2との間の情報の入出力は、有線による通信であってもよいし、無線による通信であってもよく、特に限定されるものではない。
【0020】
切出し領域サイズ計算部21は、位置座標検出部12から出力されるナンバープレート位置座標P(x,y)のY座標が、設定ファイル22に記憶される基準ナンバープレート位置座標のY座標と一致するときに、切出し領域サイズを計算する。なお、基準ナンバープレート位置座標は、切出し処理部23が画像を切出すときの基準となる位置座標であり、予め決められている。
【0021】
上述のように、撮像部11が高さ6m程度の高さに設置されており、上方から自動車の前面を撮影しているため、自動車が遠くであればナンバープレート位置座標P(x,y)のY座標(高さ方向の座標)が、撮影画像において上方に位置することになる。自動車が近づくに従ってナンバープレート位置座標P(x,y)が下方に移動し、自動車と撮像部11との距離が所定距離となった時点で、ナンバープレート位置座標と、基準ナンバープレート位置座標とが一致することになる。このときの撮影画像(静止画像)を切出し処理対象の画像とする。
【0022】
設定ファイル22には、撮影画像の大きさ(縦横の画素数)、基準ナンバープレート位置座標、切出し領域サイズを計算する際に使用されるパラメータα、β、γ等の情報が定義されている。
【0023】
αは、処理対象画像(例えば、撮影画像の全部であってもよいし、撮影画像の一部であってもよい。)の縦サイズ(縦方向の画素数)である。βは、ナンバープレート位置座標P(x,y)のY座標が最大のときの切出し領域サイズである。また、γは、ナンバープ
レート位置座標P(x,y)のY座標が最小のときの切出し領域サイズである。なお、切出し領域サイズは、縦サイズと横サイズとが同じ正方形である場合について説明するが、縦サイズと横サイズとが異なる長方形であってもよく、特に限定されるものではない。以下、処理対象画像が撮影画像の全部である場合について説明するものとする。
【0024】
例えば、処理対象画像のサイズが1024×768であり、ナンバープレート位置座標P(x,y)のY座標が最大のときの切出し領域サイズが300×300であり、ナンバープレート位置座標P(x,y)のY座標が最小のときの切出し領域サイズが200×200であるとする。この場合、α=768、β=300、γ=200となる。これらのパラメータが、設定ファイル22に予め定義されている。なお、対象処理画像の左上を原点とした場合、ナンバープレート位置座標P(x,y)のY座標の最小は「0」であり、最大は「767」となる。
【0025】
切出し領域サイズ計算部21は、パラメータα、β、γを用いて、ナンバープレート位置座標のY座標に対応した切出し領域サイズL×Lを次式(式1)によって計算し、切出し領域サイズテーブルとして設定ファイル22に定義する。
【0026】
L=(β-γ)×y/α+γ ・・・(式1)
なお、処理対象画像は、左上を原点としている。したがって、処理対象画像の最上部のY座標が「0」となり、処理対象画像の最下部のY座標が「767」となる。
【0027】
また、上記(式1)にパラメータα、β、γの値を代入すると次式(式2)のようになる。切出し領域サイズ計算部21は、次式(式2)を用いて切出し領域サイズを計算するようにしてもよい。
【0028】
L=0.13×Y+200 ・・・(式2)
図3は、ナンバープレート位置座標のY座標と切出し領域サイズとの関係を示すテーブルである。
図3に示すように、ナンバープレート位置座標のY座標が最小「0」のとき、切出し領域サイズは200×200であり、Y座標の増加に伴って切出し領域サイズが徐々に大きくなる。そして、ナンバープレート位置座標のY座標が最大「767」のとき、切出し領域サイズは300×300となる。
【0029】
このように、撮像装置1から自動車までの距離が大きい場合に、切出し領域サイズを小さくする。また、撮像装置1から自動車までの距離が小さい場合に、切出し領域サイズを大きくする。これによって、自動車の前面の同じ部分を含むように画像が切出されることになる。なお、基準ナンバープレート位置座標が固定の場合には、切出し領域サイズ計算部21は、基準ナンバープレート位置座標に対応する切出し領域サイズのみを計算し、この値を設定ファイル22に定義するようにしてもよい。
【0030】
切出し領域サイズ計算部21は、ナンバープレート位置座標のY座標と基準ナンバープレート位置座標のY座標とが一致するときの撮影画像、ナンバープレート位置座標、および切出し領域サイズを切出し処理部23に出力する。
【0031】
切出し処理部23は、切出し領域サイズ計算部21から出力される撮影画像、ナンバープレート位置座標、および切出し領域サイズを用いて、処理対象画像から、車種を識別するための切出し領域の画像を切出して、識別部24へ出力する。
【0032】
識別部24は、切出し処理部23によって切出された画像を、後述の車種識別モデル生成装置により畳み込みニューラルネットワーク(CNN)で機械学習させた学習モデルに入力することによって、切出された画像から自動車の車種を識別する。この学習モデルは
、後述のように、自動車の車種を識別するための学習用画像とラベルとの関係を学習させたものである。
【0033】
なお、機械学習はCNNに限定されるものではなく、一般的なNN、RNN、DNN、R-CNN、Fast R-CNN、Faster R-CNN、SegNet、U-Net、U-Net++等であってもよい。
【0034】
図4は、切出し領域の一例を示す図である。
図4に示すように、例えば、ナンバープレート位置座標P(x,y)を基準とし、横方向(x方向)においてW
L’:W
R’=1:1となるように切出し領域を決定する。なお、W
L’はナンバープレート位置座標のX座標から左端までのサイズ(画素数)であり、W
R’はナンバープレート位置座標のX座標から右端までのサイズ(画素数)である。なお、W
L’とW
R’との比率は、これ以外の値であってもよい。
【0035】
また、縦方向(y方向)においてHU:HL=3:1となるように切出し領域を決定する。なお、HUはナンバープレート位置座標のY座標から上端までのサイズ(画素数)であり、HLはナンバープレート位置座標のY座標から下端までのサイズ(画素数)である。なお、HUとHLとの比率は、これ以外の値であってもよい。
【0036】
なお、切出し処理部23は、切出し領域が、撮影画像の範囲を超えてしまう場合には、撮影画像の範囲を超えてしまう部分を黒色パディングし、正方形を保つようにしてもよい。
【0037】
図5は、切出し処理部23によって切出された画像の一例を示す図である。
図5に示すように、自動車の前面が背景を含まない程度の大きさで切出される。設定ファイル22が、自動車の背景画像を含まないように、基準ナンバープレート位置座標、α、β、γを定義する。
【0038】
(切出し領域サイズ計算部21および切出し処理部23の処理フロー)
図6は、本発明の一実施形態に係る車種識別装置2の切出し領域サイズ計算部21および切出し処理部23の処理手順を説明するためのフローチャートである。まず、切出し領域サイズ計算部21に、撮影画像と、ナンバープレート位置座標とが入力される(S1)。
【0039】
次に、切出し領域サイズ計算部21は、ナンバープレート位置座標のY座標が、設定ファイルに定義される基準ナンバープレート位置座標のY座標と一致するか否かを判定する(S2)。ナンバープレート位置座標のY座標と、基準ナンバープレート位置座標のY座標とが一致しなければ(S2,No)、ステップS1に戻って以降の処理を繰り返す。
【0040】
また、ナンバープレート位置座標のY座標と、基準ナンバープレート位置座標のY座標とが一致すれば(S2,Yes)、切出し領域サイズ計算部21は、上述の方法によって、切出し処理対象となる撮影画像(静止画像)を選択し、切出し領域サイズを計算する(S3)。
【0041】
最後に、切出し処理部23は、切出し領域サイズ計算部21から出力される撮影画像、ナンバープレート位置座標、および切出し領域サイズを用いて、処理対象画像から、車種を判別するための切出し領域の画像を切出して、識別部24へ出力する(S4)。
【0042】
(識別部24の処理フロー)
図7は、本発明の一実施形態に係る車種識別装置2の識別部24の処理手順を説明する
ためのフローチャートである。まず、識別部24は、切出し処理部23によって切出された画像を入力する(S11)。
【0043】
次に、識別部24は、後述の車種識別モデル生成装置によって生成された学習モデルを入力する(S12)。そして、識別部24は、切出し処理部23によって切出された画像を学習モデルに入力することによって、画像から自動車の車種を識別し(S13)、識別結果を出力して(S14)、処理を終了する。
【0044】
(車種識別装置2の効果)
以上説明したように、本実施形態に係る車種識別装置2によれば、切出し処理部23が、切出し領域サイズ計算部21によって計算された切出し領域サイズに応じて、撮影画像から、自動車の車種を識別するための画像を切出す。そして、識別部24が、自動車の車種を識別するための学習用画像とラベルとの関係を学習した学習モデルを用いて、切出し処理部23によって切出された画像から、自動車の車種を識別する。したがって、撮像部11によって撮影された画像を、車両のナンバープレート情報の取得と、車両の車種を識別するための画像の切出しとの両方に使用することができる。
【0045】
また、切出し処理部23が、ナンバープレート位置座標を基準として、切出し領域サイズ計算部21によって計算された切出し領域サイズの縦方向および横方向のサイズが所定の比率となるように画像を切出す。したがって、切出し処理部23が、自動車の前面の同じ部分を含むように画像を切出すことができるため、識別部24は、自動車の車種を正確に識別することが可能となる。
【0046】
(車種識別モデル生成装置3の構成例)
図8は、本発明の一実施形態に係る車種識別モデル生成装置3の概略構成を示すブロック図である。車種識別モデル生成装置3は、学習画像入力部31と、画像処理部32と、学習部33と、学習モデル出力部34とを含む。
【0047】
学習画像格納部4は、予め自動車の車種を識別するために使用される学習画像を複数格納しており、例えば、様々な車種の自動車を前面から撮影した画像と、その画像に対応するラベルとの組を学習データとして格納している。
【0048】
学習画像入力部31は、学習画像格納部4から、1つの学習画像と、その画像に対応するラベルとの組を学習データとして入力し、学習画像とラベルとの組を画像処理部32へ出力する。
【0049】
機械学習等で車種を識別する場合には学習画像を必要とするが、撮像装置1の設置箇所ごとに、撮像装置1の設置角度などの環境が異なるため、学習画像の準備も困難である。そこで、画像処理部32は、学習画像に対して、運用上の環境を考慮した画像処理を施して、学習部33へ出力する。具体的には、撮像装置1の設置箇所ごとに、撮像装置1の設置角度、周囲の明るさ等の環境が異なるため、画像処理部32は、学習画像に対して、ホモグラフィ変換行列を用いた座標変換、明るさ補正、色補正等の画像処理を行い、1つの学習画像(第1の学習画像)から複数の学習画像(第2の学習画像)を生成する。なお、画像処理部32は、学習画像格納部4に格納される様々な車種の自動車の学習画像に対して、同様の画像処理を行う。
【0050】
学習部33は、画像処理部32によって生成された学習画像(第1の学習画像、第2の学習画像)と、その学習画像に対応するラベルとの関係を、機械学習により学習して学習モデルを生成する。なお、第1の学習画像に付与されているラベルと同じラベルが、画像処理によって生成された第2の学習画像にも付与される。
【0051】
学習モデル出力部34は、学習部33によって学習させた学習モデルを学習モデル格納部5へ出力して、学習済の学習モデルを学習モデル格納部5に格納する。この学習モデルは、学習画像格納部4に格納された様々な車種の自動車の学習画像(第1の学習画像)および画像処理によって生成された学習画像(第2の学習画像)と、対応するラベルとの関係を全て学習したものである。
【0052】
(車種識別モデル生成装置3の処理フロー)
図9は、本発明の一実施形態に係る車種識別モデル生成装置3の処理手順を説明するためのフローチャートである。まず、学習画像入力部31が、学習画像格納部4から、学習画像とその画像に対応するラベルとの組を学習データとして入力する(S21)。
【0053】
次に、画像処理部32が、学習画像に対して、ホモグラフィ変換行列を用いた座標変換、明るさ補正、色補正等の画像処理を行い、1つの学習画像(第1の学習画像)から複数の学習画像(第2の学習画像)を生成する(S22)。なお、このステップS22の処理の詳細は、後述する。
【0054】
次に、学習部33が、第1の学習画像および画像処理部32によって生成された第2の学習画像と、その第1の画像に対応するラベルとの関係を、機械学習により学習して学習モデルを生成する(S23)。
【0055】
最後に、学習モデル出力部34が、学習部33によって生成された学習済みの学習モデルを学習モデル格納部5に出力して(S24)、処理を終了する。なお、学習画像格納部4に格納された様々な車種の自動車の学習画像の全てに対して、ステップ21~S24の処理が行われる。
【0056】
図10は、
図9に示す画像処理(S22)の詳細を説明するためのフローチャートである。まず、画像処理部32は、入力された学習画像をリサイズすることにより、車種識別装置2の切出し処理部23によって切出された画像と同じサイズの画像を生成する(S31)。例えば、画像処理部32は、学習画像をリサイズした後の画像の画素数と、切出し処理部23によって切出された画像の画素数とが同じになるように、学習画像をリサイズする。
【0057】
次に、画像処理部32は、リサイズした後の学習画像を複製する(S32)。画像処理部32は、複製して2つになった学習画像の一方を色反転し(S33)、他方の学習画像を色反転せずにそのままステップS34以降の処理を行う。例えば、学習画像がカラー画像であれば、学習画像の各ピクセルのRGBの値をRi,j、Gi,j、Bi,j(但し、学習画像の縦横のサイズをそれぞれN、Mとすると、i∈N、j∈M)と表すことができる。
【0058】
RGBの値がそれぞれ0~255で表現されているとすると、色反転後の各ピクセルのRGBの値(R’i,j,G’i,j,B’i,j)は、次式(式3)で表すことができる。
【0059】
R’i,j=255-Ri,j
G’i,j=255-Gi,j
B’i,j=255-Bi,j ・・・(式3)
なお、この手法によって学習画像を色反転したとしても、任意の色に変換できる訳ではないので、任意の色に変換したい場合には、そのような手法を採用することも可能である。また、カラー画像をグレー画像に変換した後、グレー画像を反転するようにしてもよい
。
【0060】
次に、画像処理部32は、色反転した学習画像および色反転していない学習画像のそれぞれに対して明るさ補正を行う(S34)。この明るさ補正により、撮像対象の車両の撮影時刻(昼夜)による光量の影響を減らすことができる。
【0061】
学習画像の各ピクセルのRGBの値をimgi,j=(Ri,j、Gi,j、Bi,j)とすると、明るさ補正後の学習画像の各ピクセルのRGBの値img’i,j=(R’i,j、G’i,j、B’i,j)は、次式(式4)の通りである。但し、α’はゲインと呼ばれる画像のコントラストを調整するパラメータであり、β’はバイアスと呼ばれる画像の明るさを調整するパラメータである。また、int(x)関数は引数を整数型に変換する関数であり、clip(dst,min,max)関数は、dst値がminより小さければminに値を変更し、maxより大きければmaxに値を変更する関数である。
【0062】
img’i,j=α’×imgi,j+β’
int(clip(img’i,j,0,255)) ・・・(式4)
なお、画像処理部32は、ノイズ付加や別のアルゴリズムによる明るさ補正等の他の画像処理を行うようにしてもよい。
【0063】
次に、画像処理部32は、学習画像に対してホモグラフィ変換を行うための変換行列を作成する(S35)。なお、このステップS35の処理の詳細は、後述する。
【0064】
最後に、画像処理部32は、明るさ補正が行われた後の学習画像に対してホモグラフィ変換を行って(S36)、処理を終了する。
【0065】
図11は、
図10に示す変換行列作成処理(S35)の詳細を説明するためのフローチャートである。まず、画像処理部32は、学習画像を左右ランダムにシフトする第1の変換行列を作成する(S41)。なお、ホモグラフィ変換行列は、次式(式5)の通りである。(x、y)は、変換前の学習画像の各ピクセルの座標であり、(x’、y’)は、変換後の学習画像の各ピクセルの座標であり、sは、比例定数である。
【0066】
【0067】
画像処理部32は、例えば、第1の変換行列を作成する場合、ホモグラフィ変換行列の要素a=e=1とし、b=d=f=g=h=0とし、cを所定範囲内の任意の値とする。これによって、画像処理部32は、学習画像を左右ランダムにシフトする第1の変換行列を作成することができる。なお、後述の第2の変換行列~第4の変換行列についても同様に作成することができる。
【0068】
次に、画像処理部32は、学習画像を所定範囲内で上下ランダムにシフトする第2の変換行列を作成し(S42)、学習画像を所定範囲内でランダムに台形補正する第3の変換行列を作成し(S43)、学習画像を所定範囲内でランダムに拡大縮小する第4の変換行列を作成する(S44)。なお、ステップS41~S44において、ホモグラフィ変換行列の要素をランダムに変更することによって、様々な変換行列を作成することができ、こ
れらを用いることによって様々な学習画像を作成することができる。
【0069】
次に、画像処理部32は、作成した4つの変換行列(第1の変換行列~第4の変換行列)をランダムな順序で並び替える(S45)。最後に、画像処理部32は、4つの変換行列(第1の変換行列~第4の変換行列)の行列積を計算して(S46)、処理を終了する。
【0070】
なお、(式5)に示すホモグラフィ変換行列の8つの要素a~hは、変換前と変換後の学習画像中の座標のペアを4つ定めることにより8元連立方程式の解として求めることができる。以上説明したホモグラフィ変換行列を用いた画像処理は、指定の画像処理になるように、それぞれの画像処理において変換前と変換後の画像中の座標のペアを4つ定めて変換行列を求めている。このようなホモグラフィ変換によって、撮像装置1の設置場所、設置角度、撮像対象の車両と撮像装置1との間の距離等の影響を減らすことができる。
【0071】
(車種識別モデル生成装置3の効果)
以上説明したように、本実施形態に係る車種識別モデル生成装置3によれば、画像処理部32が、第1の学習画像に対して画像処理を行うことによって第2の学習画像を生成する。そして、学習部33が、第1の学習画像および第2の学習画像と、対応するラベルとの関係を学習して学習モデルを生成する。したがって、車種識別装置2の識別部24は、車種識別モデル生成装置3によって学習させた学習モデルを用いて、切出し処理部23によって切出された画像から、自動車の車種を識別するので、自動車の車種を正確に識別することが可能となる。
【0072】
また、画像処理部32は、第1の学習画像に対して、ホモグラフィ変換行列を用いて第2の学習画像を生成するので、学習部33は、撮像装置1の設置場所、設置角度、撮像対象の車両と撮像装置1との間の距離等の影響を減らすことができるような学習モデルを作成することができる。
【0073】
また、画像処理部32は、第1の学習画像に対して、明るさ補正を行って第2の学習画像を生成するので、学習部33は、撮像装置1の設置場所の時間帯等による明るさの影響を減らすことができるような学習モデルを作成することができる。
【0074】
〔ソフトウェアによる実現例〕
車種識別装置2および車種識別モデル生成装置3の制御ブロック(特に、切出し領域サイズ計算部21、切出し処理部23、識別部24、画像処理部32、学習部33)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
【0075】
後者の場合、車種識別装置2および車種識別モデル生成装置3は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば1つ以上のプロセッサを備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing
Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電
子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0076】
〔まとめ〕
本発明の態様1に係る車種識別装置は、自動車を撮影した撮影画像におけるナンバープレート位置座標に基づいて、切出し領域サイズを計算する切出し領域サイズ計算部と、前記切出し領域サイズ計算部によって計算された前記切出し領域サイズに応じて、前記撮影画像から、前記自動車の車種を識別するための画像を切出す切出し処理部と、前記自動車の車種を識別するための学習用画像とラベルとの関係を学習した学習モデルを用いて、前記切出し処理部によって切出された画像から、前記自動車の車種を識別する識別部と、を備える。
【0077】
本発明の態様2に係る車種識別装置は、上記態様1において、前記学習用画像は、第1の学習画像と、当該第1の学習画像に対して画像処理を行うことによって得られた第2の学習画像とを含む。
【0078】
本発明の態様3に係る車種識別装置は、上記態様2において、前記第2の学習画像は、前記第1の学習画像に対して、ホモグラフィ変換行列を用いて変換した画像である。
【0079】
本発明の態様4に係る車種識別装置は、上記態様3において、前記第2の学習画像は、前記第1の学習画像に対して、画像を左右にシフトするための第1の変換行列、画像を上下にシフトするための第2の変換行列、画像を台形補正するための第3の変換行列、および画像を拡大縮小するための第4の変換行列、の少なくともいずれかを用いて変換した画像である。
【0080】
本発明の態様5に係る車種識別装置は、上記態様4において、前記学習用画像は、前記第1の学習画像に対して、前記第1の変換行列、前記第2の変換行列、前記第3の変換行列、および前記第4の変換行列のうちの複数の変換行列の順序を並び替えた行列積を用いて変換した複数の前記第2の学習画像を含む。
【0081】
本発明の態様6に係る車種識別装置は、上記態様2~5のいずれかにおいて、前記第2の学習画像は、前記第1の学習画像に対して、明るさ補正を行った画像である。
【0082】
本発明の態様7に係る車種識別装置は、上記態様2~6のいずれかにおいて、前記第2の学習画像は、前記第1の学習画像に対して、色反転を行った画像である。
【0083】
本発明の態様8に係る車種識別装置は、上記態様1~7のいずれかにおいて、前記切出し領域サイズ計算部は、前記ナンバープレート位置座標の高さ方向の座標と、前記切出し処理部が画像を切出すときの基準となる基準ナンバープレート位置座標の高さ方向の座標とが一致するときに、前記切出し領域サイズを計算する。
【0084】
本発明の態様9に係る車種識別装置は、上記態様1~8のいずれかにおいて、前記ナンバープレート位置座標の高さ方向の座標をY座標とし、前記撮影画像の縦方向のサイズをα、当該Y座標が最大のときの切出し領域サイズをβ、当該Y座標が最小のときの切出し領域サイズをγとすると、前記切出し領域サイズ計算部は、次式(式1a)によって切出し領域サイズL×Lを計算する。
【0085】
L=(β-γ)×y/α+γ ・・・(式1a)
本発明の態様10に係る車種識別モデル生成装置は、自動車の車種を識別するための第1の学習画像に対して、画像処理を行うことによって第2の学習画像を生成する画像処理
部と、前記第1の学習画像および前記第2の学習画像とラベルとの関係を学習して学習モデルを生成する学習部と、を備える。
【0086】
本発明の態様11に係る車種識別モデル生成方法は、自動車の車種を識別するための第1の学習画像に対して、画像処理を行うことによって第2の学習画像を生成する工程と、前記第1の学習画像および前記第2の学習画像とラベルとの関係を学習して学習モデルを生成する工程と、を含む。
【0087】
〔付記事項〕
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0088】
1 撮像装置
2 車種識別装置
3 車種識別モデル生成装置
4 学習画像格納部
5 学習モデル格納部
11 撮像部
12 位置座標検出部
21 切出し領域サイズ計算部
22 設定ファイル
23 切出し処理部
24 識別部
31 学習画像入力部
32 画像処理部
33 学習部
34 学習モデル出力部
100 車種識別システム