(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022184043
(43)【公開日】2022-12-13
(54)【発明の名称】画像処理装置、および画像処理方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20221206BHJP
H04N 7/18 20060101ALI20221206BHJP
【FI】
G06T7/00 650B
H04N7/18 U
H04N7/18 J
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2021091661
(22)【出願日】2021-05-31
(71)【出願人】
【識別番号】000000011
【氏名又は名称】株式会社アイシン
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】武藤 拓馬
【テーマコード(参考)】
5C054
5L096
【Fターム(参考)】
5C054CA04
5C054CC02
5C054FC12
5C054FD07
5C054FE14
5C054HA30
5L096BA04
5L096CA02
5L096DA02
5L096EA35
5L096FA69
5L096HA09
5L096JA03
5L096JA11
(57)【要約】
【課題】目標物を高い精度でかつ少ない計算量で解析する。
【解決手段】本実施形態の画像処理装置は、撮像装置から出力されて記憶装置に格納された第1画素数の第1画像を読み出して、読み出した前記第1画像を縮小することによって前記第1画素数よりも小さい第2画素数の第2画像を生成する縮小部と、前記第2画像を入力として目標物の検出を行う第1AIモデルと、前記記憶装置に格納された前記第1画像から、前記第1AIモデルによって検出された前記目標物が写っている領域を切り抜いて、前記領域を含む前記第1画素数よりも小さい第3画素数の第3画像を生成する切り抜き部と、前記第3画像を入力として前記目標物の解析を行う第2AIモデルと、を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
撮像装置から出力されて記憶装置に格納された第1画素数の第1画像を読み出して、読み出した前記第1画像を縮小することによって前記第1画素数よりも小さい第2画素数の第2画像を生成する縮小部と、
前記第2画像を入力として目標物の検出を行う第1AI(Artificial Intelligence)モデルと、
前記記憶装置に格納された前記第1画像から、前記第1AIモデルによって検出された前記目標物が写っている領域を切り抜いて、前記領域を含む前記第1画素数よりも小さい第3画素数の第3画像を生成する切り抜き部と、
前記第3画像を入力として前記目標物の解析を行う第2AIモデルと、
を備える画像処理装置。
【請求項2】
前記第1画像は、車両に設けられた撮像装置によって撮像された前記車両の周辺環境を写した画像であり、
前記目標物は、前記周辺環境に存在する車両のナンバープレートであり、
前記目標物の解析は、前記ナンバープレートに表示された車両ナンバーの取得である、
請求項1に記載の画像処理装置。
【請求項3】
前記目標物は、人であり、
前記目標物の解析は、前記人の特定部位の検出である、
請求項1に記載の画像処理装置。
【請求項4】
撮像装置から出力されて記憶装置に格納された第1画素数の第1画像を読み出すステップと、
前記第1画像を縮小することによって前記第1画素数よりも小さい第2画素数の第2画像を生成するステップと、
第1AIモデルによって前記第2画像に基づく目標物の検出を行うステップと、
前記記憶装置に格納された前記第1画像から、前記第1AIモデルによって検出された前記目標物が写っている領域を切り抜いて、前記領域を含む前記第1画素数よりも小さい第3画素数の第3画像を生成するステップと、
第2AIモデルによって前記第3画像に基づく前記目標物の解析を行うステップと、
を含む画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、画像処理装置、および画像処理方法に関する。
【背景技術】
【0002】
撮像装置によって得られた画像に写っている目標物の解析のためにAI(Artificial Intelligence)モデルが用いられることがある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開第2018/037665号
【特許文献2】特開2010-74540号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
一般に、AIモデルに入力可能な画像の画素数が大きいほど、高い精度の解析が可能となる。しかしながら、AIモデルに入力される画像の画素数が大きくなると、必要な計算量が多くなる。その結果、より高性能なプロセッサが必要となったり、プロセッサでの消費電力量が増大したり、プロセッサでの発熱量が増大したりする。また、プロセッサでの発熱量の増大に対応するためにファンなどの冷却機構をシステム搭載する必要が生じる。冷却機構をシステムに搭載する場合、システムが大型化する。
【0005】
これに対し、プロセッサでの計算量を抑制するために、画像を縮小してAIモデルに入力する方法が考えられる。しかしながら、この方法では、目標物を写した像の解像度が低下するため、解析の精度が低下する。
【0006】
本発明の実施形態は、上述の事情に鑑みてなされたものであり、目標物を高い精度でかつ少ない計算量で解析することが可能な画像処理装置および画像処理方法を提供することを課題とする。
【課題を解決するための手段】
【0007】
本実施形態の画像処理装置は、撮像装置から出力されて記憶装置に格納された第1画素数の第1画像を読み出して、読み出した前記第1画像を縮小することによって前記第1画素数よりも小さい第2画素数の第2画像を生成する縮小部と、前記第2画像を入力として目標物の検出を行う第1AIモデルと、前記記憶装置に格納された前記第1画像から、前記第1AIモデルによって検出された前記目標物が写っている領域を切り抜いて、前記領域を含む前記第1画素数よりも小さい第3画素数の第3画像を生成する切り抜き部と、前記第3画像を入力として前記目標物の解析を行う第2AIモデルと、を備える。この構成により、目標物を高い精度でかつ少ない計算量で解析することが可能となる。
【0008】
また、画像処理装置において、前記第1画像は、車両に設けられた撮像装置によって撮像された前記車両の周辺環境を写した画像であり、前記目標物は、前記周辺環境に存在する車両のナンバープレートであり、前記目標物の解析は、前記ナンバープレートに表示された車両ナンバーの取得である。この構成により、車両ナンバーを高い精度でかつ少ない計算量で読み取ることが可能となる。
【0009】
また、画像処理装置において、前記目標物は、人であり、前記目標物の解析は、前記人の特定部位の検出である。この構成により、人の特定部位を高い精度でかつ少ない計算量で検出することが可能となる。
【0010】
また、本実施形態の画像処理方法は、撮像装置から出力されて記憶装置に格納された第1画素数の第1画像を読み出すステップと、前記第1画像を縮小することによって前記第1画素数よりも小さい第2画素数の第2画像を取得するステップと、第1AIモデルによって前記第2画像に基づく目標物の検出を行うステップと、前記記憶装置に格納された前記第1画像から、前記第1AIモデルによって検出された前記目標物が写っている領域を切り抜いて、前記領域を含む前記第1画素数よりも小さい第3画素数の第3画像を取得するステップと、第2AIモデルによって前記第3画像に基づく前記目標物の解析を行うステップと、を含む。この構成により、目標物を高い精度でかつ少ない計算量で解析することが可能となる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、第1の実施形態の画像処理装置が搭載された車両の一例を示す模式的な平面図である。
【
図2】
図2は、第1の実施形態の画像処理装置を含む周辺監視システムの構成の一例を示す模式的なブロック図である。
【
図3】
図3は、第1の実施形態の画像処理装置としてのECUの機能構成の一例を示す模式的なブロック図である。
【
図4】
図4は、第1の実施形態の画像処理装置としてのECUによる解析の動作の一例を示すフローチャートである。
【
図5】
図5は、第1の実施形態の縮小部によって第1画像から第2画像が生成される過程の具体例を説明するための図である。
【
図6】
図6は、第1の実施形態の第1AIモデルによるナンバープレートの検出の動作の一例を示すための図である。
【
図7】
図7は、第1の実施形態の切り抜き部によって切り抜かれる領域の一例を示す図である。
【
図8】
図8は、第1の実施形態の切り抜き部によって切り抜かれた領域を含む第3画像の一例を示す図である。
【
図9】
図9は、第2の実施形態の縮小部によって第1画像から第2画像が生成される過程の具体例を説明するための図である。
【
図10】
図10は、第2の実施形態の第1AIモデルによる人の検出の動作の一例を示すための図である。
【
図11】
図11は、第2の実施形態の切り抜き部によって切り抜かれる領域の一例を示す図である。
【
図12】
図12は、第2の実施形態の切り抜き部によって切り抜かれた領域を含む第3画像の一例を示す図である。
【発明を実施するための形態】
【0012】
実施形態の画像処理装置は、任意のシステムに具備され得る。一例では、車両の周辺監視システムに実施形態の画像処理装置を適用することができる。別の例では、駅、空港、またはマンションなどの施設に設けられた監視カメラの画像を解析するコンピュータに実施形態の画像処理装置を適用することができる。
【0013】
以下では、一例として、車両の周辺監視システムに適用された実施形態の画像処理装置について図面を用いて説明する。
【0014】
(第1の実施形態)
図1は、第1の実施形態の画像処理装置が搭載された車両10の一例を示す模式的な平面図である。車両10は、例えば、内燃機関を駆動源とする自動車であってもよいし、電動機を駆動源とする自動車であってもよいし、それらの双方を駆動源とする自動車であってもよい。
【0015】
図1に例示されるように、車両10には、複数の撮像装置11として、例えば4つの撮像装置11a~11dが設けられている。各撮像装置11は、例えば、CCD(Charge Coupled Device)またはCIS(CMOS Image Sensor)等の撮像素子を内蔵するデジタルカメラである。各撮像装置11は、所定のフレームレートで撮像画像を出力することができる。各撮像装置11は、広角レンズまたは魚眼レンズなどの広い視野を有し、視野内の領域を撮像することができる。
【0016】
4つの撮像装置11は、車両10の外周部に設けられている。撮像装置11aは、例えば、車両10の後側、すなわち車両前後方向の後方側で車幅方向のほぼ中央の端部、例えばリヤバンパ10aの上方位置に設けられて、車両10の後方の領域を撮像可能である。また、撮像装置11bは、例えば、車両10の前側、すなわち車両前後方向の前方側で車幅方向のほぼ中央の端部、例えばフロントバンパ10bやフロントグリル等に設けられて、車両10の前方の画像を撮像可能である。また、撮像装置11cは、例えば、車両10の右側の端部、例えば右側のドアミラー10cに設けられて、車両10の右側方の領域を撮像可能である。撮像装置11dは、例えば、車両10の左側の端部、例えば左側のドアミラー10dに設けられて、車両10の左側方の領域を撮像可能である。4つの撮像装置11によって、物体(例えば、車両、歩行者、標識等)を含む車両10の外部の周辺環境が逐次撮像され、周辺環境を写した撮像画像が出力される。
【0017】
なお、各撮像装置11が設けられる位置はこれらに限定されない。また、車両10に設けられる撮像装置11の数は、1つであってもよいし、4つ以外の複数であってもよい。
【0018】
画像処理装置は、撮像画像に目標物が写っている場合、当該目標物の解析を行う。第1の実施形態では、一例として、目標物はナンバープレートであり、目標物を解析することは、ナンバープレートに表示された車両ナンバーを読み取ることであることとする。以降、各撮像装置11から出力された撮像画像を、第1画像と表記する。
【0019】
図2は、実施形態の画像処理装置を含む周辺監視システム100の構成の一例を示す模式的なブロック図である。
【0020】
周辺監視システム100は、撮像装置11(11a~11d)と、ECU20(Electronic Control Unit)と、を備える。ECU20は、車両10に設けられている。各撮像装置11はECU20に接続されており、各撮像装置11から出力された第1画像はECU20に送られる。
【0021】
ECU20は、CPU(Central Processing Unit)21、RAM(Random Access Memory)22、ROM(Read Only Memory)23、およびバス24を備える。CPU21、RAM22、およびROM23は、バス24に電気的に接続されている。
【0022】
ROM23は、不揮発性の記憶装置である。ROM23には、コンピュータプログラムである画像処理プログラム25が予め格納されている。ROM23は、フラッシュメモリなどの書き換え可能な記憶装置であってもよいし、書き換えが不可能な記憶装置であってもよいし、それらの組み合わせで構成されてもよい。
【0023】
RAM22は、ROM23に比べて高速なアクセスが可能な書き換え可能な記憶装置である。RAM22は、DRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)、またはこれらの組み合わせによって構成され得る。なお、RAM22を構成する記憶装置の種類はこれらに限定されない。RAM22は、コンピュータプログラムがロードされる領域、データが一時的に保持される領域、キャッシュメモリ、またはバッファメモリなどとして機能する。
【0024】
CPU21は、コンピュータプログラムに従って所定の動作を実行するプロセッサである。
【0025】
このように、ECU20は、プロセッサ(ここではCPU21)と記憶装置(ここではRAM22およびROM23)を備える。つまり、ECU20は、通常のコンピュータと同等の構成を備える。
【0026】
画像処理プログラム25は、ECU20を画像処理装置として機能させる。CPU21は、ROM23に格納された画像処理プログラム25を起動時にRAM22にロードし、RAM22にロードされた画像処理プログラム25に従って実施形態の画像処理装置としての種々の動作を行う。CPU21は、画像処理プログラム25に従って、各撮像装置11から出力された第1画像に基づき、車両10の周辺に存在する車両の車両ナンバーの取得を行う。
【0027】
図3は、実施形態の画像処理装置としてのECU20の機能構成の一例を示す模式的なブロック図である。
【0028】
画像処理プログラム25は、ECU20を、縮小部31、第1AIモデル32、切り抜き部33、第2AIモデル34、および記憶装置35を含む画像処理装置として機能させる。例えば、CPU21は、画像処理プログラム25に従って、縮小部31、第1AIモデル32、切り抜き部33、および第2AIモデル34として機能する。記憶装置35は、例えばRAM22によって構成される。
【0029】
記憶装置35は、各撮像装置11から順次出力された第1画像201(第1画像201-1,201-2,・・・)が格納される。
【0030】
画像処理装置としてのECU20は、各撮像装置11から順次出力され記憶装置35に格納された各第1画像201から他の車両の車両ナンバーの取得を行う。以降では、説明の簡素化のために、1つの第1画像201から車両ナンバーの取得を行う処理について説明する。
【0031】
縮小部31は、記憶装置35から第1画像201を読み出して、読み出した第1画像201を縮小することによって、第1AIモデル32が扱うことが可能な画素数の画像を取得する。
【0032】
近年入手可能な撮像装置は、比較的大きな画素数の撮像画像を出力することができる。撮像画像の画素数が大きい場合、撮像画像に写っている像の解像度が高いため、当該撮像画像をそのままAIモデルで解析できれば、高い精度で目標物を解析することが可能である。その反面、大きな画素数の撮像画像をそのままAIモデルで解析しようとした場合、高性能なプロセッサが必要となる、プロセッサを冷却する機構の搭載によってシステムが大型化する、消費電力量が増大する、などのデメリットが生じる。また、車両に搭載される周辺監視システムの場合、ECUに割けるコスト、スペース、および電力が、据え置き型のサーバ装置などと比べて限定されるため、これらのデメリットの影響をより大きく受ける。
【0033】
そこで、第1の実施形態では、第1AIモデル32は、各撮像装置11から出力された撮像画像、即ち第1画像201、の画素数よりも小さい画素数の画像を入力として解析を行うように構成されている。第2AIモデル34も同様である。第1画像201の画素数をP1と表記する。第1AIモデル32および第2AIモデル34が解析することができる画像の画素数をP2と表記する。
【0034】
例えば、第1AIモデル32および第2AIモデル34のそれぞれは、入力層、中間層、および出力層を備えたニューラルネットワークモデルである。ニューラルネットワークモデルは、例えば、RNN(Recurrent Neural Network)、CNN(Convolution Neural Network)、またはLSTM(Long Short-Term Memory)などである。ニューラルネットワークモデルの例はこれらに限定されない。第1AIモデル32および第2AIモデル34のそれぞれの入力層は、複数のノードで構成される。それぞれの入力層のノードの数は、画素数P2と対応する。これによって、第1AIモデル32および第2AIモデル34のそれぞれは、画素数P2の画像を入力として解析を実行することが可能である。
【0035】
縮小部31は、画素数P1の第1画像を縮小することによって、画素数P2の画像を生成する。縮小部31によって生成される画像を、第2画像と表記する。
【0036】
なお、P1は第1画素数の一例である。また、第2画像の画素数としてのP2は第2画素数の一例である。
【0037】
第1AIモデル32は、第2画像を入力として、目標物、つまりナンバープレート、の検出を行う。より詳細には、第1AIモデル32は、第2画像におけるナンバープレートが写っている位置を特定する。つまり、第1AIモデル32は、入力層に第2画像が入力された場合にナンバープレートが写っている位置を出力層から出力するよう構成された、学習済みモデルである。ナンバープレートが写っている位置は、所定の範囲を有する領域として出力されてもよいし、ナンバープレートが写っている領域の代表位置(例えば中心位置)として出力されてもよい。以降、第1AIモデル32によって特定された位置を第1位置と表記する。
【0038】
切り抜き部33は、記憶装置35に格納された第1画像から、第1AIモデル32によって検出されたナンバープレートが写っている領域を切り抜いて、当該領域を含む画素数P2の画像を生成する。より詳細には、切り抜き部33は、第1AIモデル32によって特定された位置、即ち第1位置、に対応する第1画像における位置を特定する。切り抜き部33によって特定された位置を、第2位置と表記する。切り抜き部33は、第2位置からナンバープレートが写っている領域を切り抜き、切り抜いた領域を含む画像を生成する。切り抜き部33によって生成される画像を、第3画像と表記する。
【0039】
なお、第3画像の画素数としてのP2は第3画素数の一例である。
【0040】
第2AIモデル34は、第3画像を入力として目標物の解析、即ち車両ナンバーの取得を行う。つまり、第2AIモデル34は、入力層に第3画像が入力された場合にナンバープレートに表示された車両ナンバーを出力層から出力するよう構成された、学習済みモデルである。
【0041】
第2AIモデル34に入力される第3画像は、第1画像から切り抜かれることによって作製された画像である。つまり、第3画像に含まれる車両ナンバーの像の解像度は、第1画像に含まれる車両ナンバーの像の解像度と等しい。よって、画像処理装置としてのECU20は、第1画像をそのままAIモデルに入力した場合と同等の高い精度で車両ナンバーを検出することが可能である。
【0042】
また、第1AIモデル32および第2AIモデル34に入力される画像の画素数P2は、第1画像の画素数P1よりも小さい。よって、画像処理装置としてのECU20は、第1画像をそのままAIモデルに入力した場合よりも少ない計算量で車両ナンバーを検出することが可能である。つまり、CPU21として高性能なCPUを適用しなくても、高い精度での車両ナンバーの検出を達成することができる。また、CPU21での発熱量を抑制することができるので、ファンなどの冷却機構の搭載が不要となり、その結果、システムの大型化を抑制することが可能である。また、CPU21での消費電力を抑制することが可能である。
【0043】
なお、第1AIモデル32には、第1画像を縮小することによって得られた画素数P2の第2画像が入力される。第2画像に基づいて車両ナンバーを取得しようとすると、第2画像に含まれている車両ナンバーの像の解像度が低いため、高精度な検出は困難である。しかしながら、車両ナンバーの取得ではなくナンバープレートの検出であれば、縮小された画像からでも高い精度で達成することが可能である。
【0044】
よって、第1の実施形態では、画像処理装置としてのECU20は、縮小された画素数の小さい画像に基づいてナンバープレートを検出し、検出されたナンバープレートに表示された車両ナンバーを、撮像画像から切り抜かれた小さい画像に基づいて取得する。これによって、計算量の抑制と高い解析精度との両立が可能とされる。
【0045】
続いて、第1の実施形態の画像処理装置としてのECU20の動作を、具体例を交えて説明する。
【0046】
図4は、第1の実施形態の画像処理装置としてのECU20による解析の動作の一例を示すフローチャートである。このフローチャートは、ある撮像装置11から出力され記憶装置35に格納された1つの第1画像201に対して実行される一連の動作の一例を示している。この一連の動作は、例えば、記憶装置35に順次格納される各第1画像201に対して実行される。
【0047】
まず、縮小部31は、撮像装置11によって撮像された画素数P1の第1画像201を記憶装置35から読み出す(S101)。そして、縮小部31は、第1画像201を縮小することによって、画素数P2の第2画像を生成する(S102)。
【0048】
図5は、第1の実施形態の縮小部31によって第1画像201から第2画像が生成される過程の具体例を説明するための図である。本図の説明では、第1AIモデル32は、縦方向の画素数および横方向の画素数がともに256個であるフォーマットの画像を扱うことが可能とされていることとしている。つまり、本図に示される例では、P2は、65536(=256×256)である。
【0049】
図5に示される画像301は、第1画像201の一例である。画像301には、車両を前方から見た像401が含まれている。また、像401には、ナンバープレートの像402が含まれている。ナンバープレートの像402から、像401として写っている車両の車両ナンバーは「ABCDE」であることが読み取れる。第1画像201としての画像301は、縦方向の画素数が480個であり横方向の画素数が640個であるフォーマットの画像として構成されている。つまり、この例では、P1は、307200(=480×640)である。
【0050】
画像301の内容を縦方向の画素数および横方向の画素数がともに256個のフォーマットの画像に収めるために、縮小部31は、画像301の大きさを0.4倍の大きさに縮小する処理を行う。これによって、縮小部31は、縦方向の画素数が192個であり横方向の画素数が256個である画像302を得る。そして、縮小部31は、画像302の上方および下方にマージン領域303-1,303-2を足すことによって、縦方向の画素数および横方向の画素数がともに256個であるフォーマットの画像304を生成する。画像304は、第2画像の一例である。
【0051】
なお、マージン領域303-1,303-2のようなマージン領域は、縮小によって得られた画像が第2画像のフォーマットよりも小さい場合に、縮小によって得られた画像を第2画像のフォーマットに合わせるために縮小によって得られた画像に足される。よって、縮小によって得られた画像が第2画像のフォーマットに則している場合には、マージン領域を足す処理は省略される。マージン領域が足され得る位置は、縮小によって得られた画像の周囲の一部または全部である。マージン領域は、縮小によって得られた画像の縦方向および横方向のうちの第2画像のフォーマットに満たない方向に足される。例えば、縮小によって得られた画像の横方向の画素数が第2画像のフォーマットとして定められた横方向の画素数に満たない場合には、縮小によって得られた画像の左方および右方の両方または一方のみにマージン領域が足され得る。縮小によって得られた画像の縦方向の画素数が第2画像のフォーマットとして定められた縦方向の画素数に満たない場合、縮小によって得られた画像の上方および下方の両方または一方のみにマージン領域が足され得る。
【0052】
図4に説明を戻す。
S102に続いて、第1AIモデル32は、第2画像を入力としてナンバープレートの検出を実行し、第2画像においてナンバープレートが写っている位置、即ち第1位置、を特定する(S103)。
【0053】
図6は、第1の実施形態の第1AIモデル32によるナンバープレートの検出の動作の一例を示すための図である。本図には、第2画像である画像304が描画されている。第1AIモデル32は、画像304から、ナンバープレートの像501の位置を第1位置として特定する。
図6に示される例では、第1AIモデル32は、ナンバープレートの像501が含まれる所定サイズの小さい矩形の領域502の位置を特定する。
【0054】
再び
図4に説明を戻す。
S103に続いて、切り抜き部33は、第1AIモデル32によって特定された第1位置に基づき、第1画像201においてナンバープレートが写っている位置、つまり第2位置を特定する(S104)。そして、切り抜き部33は、第2位置からナンバープレートが写っている領域を切り抜いて、当該領域を含む画素数P2の第3画像を生成する(S105)。
【0055】
第2画像は、第1画像201を縮小して生成された画像である。よって、第1画像201内の各位置と、第2画像内の各位置との対応関係は既知である。S104では、切り抜き部33は、この対応関係に基づいて第2位置を特定する。
【0056】
図7は、第1の実施形態の切り抜き部33によって切り抜かれる領域の一例を示す図である。例えば、切り抜き部33は、S104では、所定サイズの矩形の領域403の位置を、第1位置、つまり矩形の領域502の位置、に対応する第2位置として特定する。矩形の領域403の形状およびサイズは、例えば矩形の領域502を、縮小部31による縮小の倍率の逆数の倍率で拡大して得られたものである。なお、矩形の領域403の形状およびサイズは、これに限定されない。切り抜き部33は、矩形の領域403を画像301から切り抜く。
【0057】
図8は、第1の実施形態の切り抜き部33によって切り抜かれた領域を含む第3画像の一例を示す図である。切り抜き部33は、切り抜きによって得られた矩形の領域403の周囲にマージン領域305を足すことによって、矩形の領域403を含む縦方向の画素数および横方向の画素数がともに256個であるフォーマットの画像306を生成する。画像306は、第3画像の一例である。
【0058】
なお、マージン領域305のようなマージン領域は、切り抜きによって得られた矩形の領域が第3画像のフォーマットよりも小さい場合に、切り抜きによって得られた矩形の領域に足される。よって、切り抜きによって得られた矩形の領域が第3画像のフォーマットに則している場合には、マージン領域を足す処理は省略される。マージン領域が足され得る位置は、切り抜きによって得られた矩形の領域の周囲の一部または全部である。マージン領域は、切り抜きによって得られた矩形の領域の縦方向および横方向のうちの第3画像のフォーマットに満たない方向に足される。例えば、切り抜きによって得られた矩形の領域の横方向の画素数が第3画像のフォーマットとして定められた横方向の画素数に満たない場合には、切り抜きによって得られた矩形の領域の左方および右方の両方または一方のみにマージン領域が足され得る。切り抜きによって得られた矩形の領域の縦方向の画素数が第3画像のフォーマットとして定められた縦方向の画素数に満たない場合、切り抜きによって得られた矩形の領域の上方および下方の両方または一方のみにマージン領域が足され得る。
【0059】
画像306に含まれる領域403には、ナンバープレートの像402が含まれている。そして、領域403は、撮像装置11から出力された画像301から切り抜かれたものである。よって、画像306に含まれるナンバープレートの像402の解像度は、撮像装置11から出力された画像301に含まれるナンバープレートの像402の解像度と等しい。
【0060】
再び
図4に説明を戻す。
S105に続いて、第2AIモデル34は、第3画像を入力として、ナンバープレートに表示された車両ナンバーの取得を実行する(S106)。
図5~
図8に示された例に従えば、第2AIモデル34は、画像306から、車両ナンバーとして「ABCDE」を読み取る。S106によって、1つの第1画像201に対する解析が終了する。
【0061】
以上に述べたように、第1の実施形態によれば、縮小部31は、撮像装置11から出力されて記憶装置35に格納された画素数P1の第1画像201を読み出して、読み出した第1画像を縮小することによって画素数P2(ただしP2<P1)の第2画像を生成する。第1AIモデル32は、第2画像を入力としてナンバープレートの検出を行う。切り抜き部33は、記憶装置35に格納された第1画像201から、第1AIモデル32によって検出されたナンバープレートが写っている領域を切り抜いて、当該領域を含む画素数P2の第3画像を生成する。第2AIモデル34は、第3画像を入力として車両ナンバーの取得を行う。
【0062】
第2AIモデル34に入力される第3画像に含まれる車両ナンバーの像の解像度は、第1画像201に含まれる車両ナンバーの像の解像度と等しいため、画像処理装置としてのECU20は、第1画像をそのままAIモデルに入力した場合と同等の高い精度で車両ナンバーを取得することが可能である。また、第1AIモデル32に入力される第2画像の画素数および第2AIモデル34に入力される第3画像の画素数は、ともに第1画像の画素数よりも小さい。よって、画像処理装置としてのECU20は、第1画像をそのままAIモデルに入力した場合よりも少ない計算量で車両ナンバーを取得することが可能である。つまり、第1の実施形態によれば、画像処理装置としてのECU20は、ナンバープレートを高い精度でかつ少ない計算量で取得することが可能である。
【0063】
なお、以上の説明では、第1AIモデル32に入力される第2画像の画素数と、第2AIモデル34に入力される第3画像の画素数と、は等しい、とした。第1AIモデル32に入力される第2画像の画素数と、第2AIモデル34に入力される第3画像の画素数と、は相違してもよい。
【0064】
例えば、第1AIモデル32に入力される第2画像の画素数はP2(ただしP2<P1)であり、第2AIモデル34に入力される第3画像の画素数はP3(ただしP3<P1)であってもよい。そのような場合、切り抜き部33は、記憶装置35に格納された第1画像201から、第1AIモデル32によって特定された第1位置に対応する第2位置からナンバープレートが写っている領域を切り抜いて、当該領域を含む画素数P3の第3画像を生成する。この構成により、第1AIモデル32に入力される第2画像の画素数と第2AIモデル34に入力される第3画像の画素数とが等しい場合と同様、画像処理装置としてのECU20は、少ない計算量かつ高い精度で車両ナンバーの検出が可能となる。
【0065】
なお、P3は、第3画素数の別の一例である。
【0066】
また、第1AIモデル32に入力される第2画像は、第1画像201が縮小された後、拡大/縮小を除く任意の処理が施されたものであってもよい。ここでいう任意の処理は、例えばエッジ抽出、減色、または二値化などである。
【0067】
また、第2AIモデル34に入力される第3画像は、第1画像201から切り抜かれた領域を含む画像に対し、拡大/縮小を除く任意の処理が施されたものであってもよい。ここでいう任意の処理は、例えばエッジ抽出、減色、または二値化などである。
【0068】
なお、第1画像201は、縦方向の画素数が480個であり横方向の画素数が640個であるフォーマットの画像として構成され、第2画像および第3画像は、縦方向の画素数および横方向の画素数がともに256個であるフォーマットの画像として構成されている、として説明した。第2画像の縦方向のサイズおよび横方向のサイズが画素数ベースでともに第1画像201よりも小さく、第3画像の縦方向のサイズおよび横方向のサイズが画素数ベースでともに第1画像201よりも小さければ、第1画像201、第2画像、および第3画像のフォーマットは上記された例と異なっていてもよい。
【0069】
(第2の実施形態)
第1の実施形態では、目標物はナンバープレートであり、目標物を解析することはナンバープレートに表示された車両ナンバーを取得することであるとした。目標物および目標物を解析することはこれらに限定されない。目標物は、標識(例えば道路標識または信号など)であり、目標物を解析することは標識の意味を取得することであってもよい。また、目標物は、人であってもよい。
【0070】
第2の実施形態では、目標物は人であり、目標物を解析することは人の特定部位を検出することであることとする。特定部位は、一例として、つま先とする。以下に、第2の実施形態について説明する。なお、第1の実施形態と異なる点について説明し、第1の実施形態と同じ点については説明を省略する。
【0071】
第2の実施形態の画像処理装置としてのECU20は、第1の実施形態と同様のハードウェア構成(即ち
図2を用いて説明された構成)を備える。また、第2の実施形態の画像処理装置としてのECU20は、第1の実施形態と同様の機能構成(即ち
図3を用いて説明された構成)を備える。
【0072】
ただし、第2の実施形態では、第1AIモデル32は、第2画像を入力として、目標物としての人の検出を行う。より詳細には、第1AIモデル32は、第2画像における人が写っている位置を特定する。つまり、第1AIモデル32は、入力層に第2画像が入力された場合に人が写っている位置を出力層から出力するように構成された、学習済みモデルである。
【0073】
また、第2の実施形態では、第2AIモデル34は、第3画像を入力として目標物である人の解析、即ちつま先の検出を行う。つまり、第2AIモデル34は、入力層に第3画像が入力された場合につま先が写っている位置を出力層から出力層から出力ように構成された、学習済みモデルである。
【0074】
第2の実施形態の画像処理装置としてのECU20は、目標物および目標物を解析することが異なる点を除き、第1の実施形態と同様の動作(即ち
図4を用いて説明された動作)を実行する。
【0075】
図9は、第2の実施形態の縮小部31によって第1画像201から第2画像が生成される過程の具体例を説明するための図である。本図に示される例においても、第1の実施形態と同様、第1画像201は、縦方向の画素数が480個であり横方向の画素数が640個であるフォーマットの画像として構成されていることとする。また、第2画像は、縦方向の画素数および横方向の画素数がともに256個であるフォーマットの画像として構成されていることとする。
【0076】
図9に示される画像311は、撮像装置11c(
図1参照)による撮像画像であり、第1画像201の一例である。画像311には、車両10の右側方の車体の像411が含まれている。また、画像311には、車両10の車体の右側方後方にアプローチする人の像412が含まれている。
【0077】
縮小部31は、S101において第1画像201である画像311を記憶装置35から読み出す。そして、縮小部31は、S102においては、画像311の大きさを0.4倍の大きさに縮小する処理を行うことによって、縦方向の画素数が192個であり横方向の画素数が256個である画像312を生成する。そして、縮小部31は、画像312の上方および下方にマージン領域313-1,313-2を足すことによって、縦方向の画素数および横方向の画素数がともに256個であるフォーマットの画像314を生成する。画像314は、第2画像の一例である。
【0078】
S103では、第1AIモデル32は、第2画像である画像314を入力として人の検出を実行し、人が写っている位置を第1位置として特定する。
【0079】
図10は、第2の実施形態の第1AIモデル32による人の検出の動作の一例を示すための図である。本図には、第2画像である画像314が描画されている。第1AIモデル32は、画像314から、人の像511の位置を第1位置として特定する。
図10に示される例では、第1AIモデル32は、人の像511が含まれる所定サイズの小さい矩形の領域512の位置を第1位置として特定する。
【0080】
S104では、切り抜き部33は、第1AIモデル32によって特定された第1位置に対応する第1画像201における第2位置を特定する。そして、S105では、切り抜き部33は、第2位置から人が写っている領域を切り抜いて、当該領域を含む第3画像を取得する。
【0081】
図11は、第2の実施形態の切り抜き部33によって切り抜かれる領域の一例を示す図である。例えば、切り抜き部33は、S104では、所定サイズの矩形の領域413の位置を、第1位置、つまり矩形の領域512の位置、に対応する第2位置として特定する。矩形の領域413の形状およびサイズは、例えば矩形の領域512を、縮小部31による縮小の倍率の逆数の倍率で拡大して得られたものである。なお、矩形の領域413の形状およびサイズは、これに限定されない。切り抜き部33は、矩形の領域413を画像311から切り抜く。
【0082】
図12は、第2の実施形態の切り抜き部33によって切り抜かれた領域を含む第3画像の一例を示す図である。切り抜き部33は、切り抜きによって得られた矩形の領域413の左右にマージン領域315-1,315-2を足すことによって、矩形の領域413を含む縦方向の画素数および横方向の画素数がともに256個であるフォーマットの画像316を生成する。画像316は、第3画像の一例である。
【0083】
S106では、第2AIモデル34は、第3画像である画像316を入力として、人のつま先(例えば
図12の像414)を検出する。
【0084】
以上述べたように、目標物は人であってもよい。また、目標物を解析することは、人の特定部位を検出することであってもよい。
【0085】
目標物が人である場合、解析の対象である特定部位は、つま先でなくてもよい。例えば、特定部位は、腕、手先、または指であってもよい。また、目標物が人である場合、目標物を解析することは、特定部位の姿勢を取得することであってもよい。特定部位の姿勢は、つま先の向き、腕の向き、特定の指(例えば人差し指)の向きであってもよい。特定部位の姿勢は、出している指の本数であってもよい。
【0086】
また、目標物が人である場合、目標物を解析することは、写っている人の属性を特定することであってもよい。属性は、車両10のオーナーであるか否かなどであってもよい。
【0087】
なお、第1および第2の実施形態では、車両の周辺監視システムに適用された画像処理装置について説明した。実施形態の画像処理装置が適用された周辺監視システムは、自動車に限らず、任意の移動体(例えば鉄道車両や飛行機)に適用され得る。
【0088】
また、既に述べたように、実施形態の画像処理装置は、車両の周辺監視システムの他にも、任意のシステム、例えば監視カメラの画像を解析するコンピュータ装置、に適用され得る。
【0089】
また、第1および第2の実施形態では、CPU21は、画像処理プログラム25に従って、縮小部31、第1AIモデル32、切り抜き部33、および第2AIモデル34として機能する、として説明した。縮小部31、第1AIモデル32、切り抜き部33、および第2AIモデル34は、2以上のプロセッサの協働によって実現してもよい。
【0090】
例えば、コンピュータとしてのECU20は、ニューラルネットワークモデルとしての演算処理を実行する専用のプロセッサであるAIチップを具備し得る。当該AIチップが、第1AIモデル32、第2AIモデル34、またはそれら両方として機能するよう、コンピュータとしてのECU20が構成されてもよい。
【0091】
また、コンピュータとしてのECU20は、CPU21に加えてGPU(Graphics Processing Unit)を備え、GPUが第1AIモデル32、第2AIモデル34、またはそれら両方として機能するよう、ECU20が構成されてもよい。その場合、GPUが備えるフレームバッファが記憶装置35として構成されてもよい。
【0092】
また、縮小部31、第1AIモデル32、切り抜き部33、および第2AIモデル34の一部または全部は、FPGA(Field-Programmable Gate Array)またはASIC(Application Specific Integrated Circuit)などによって構成されてもよい。
【0093】
第1の実施形態および第2の実施形態のECU20で実行される画像処理プログラム25は、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
【0094】
さらに、画像処理プログラム25を、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、画像処理プログラム25をインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0095】
以上述べたように、画像処理装置は、縮小部31、第1AIモデル32、切り抜き部33、および第2AIモデル34を備える。縮小部31は、撮像装置11から出力されて記憶装置35に格納された第1画素数(上記の例ではP1)の第1画像201を読み出して、読み出した前記第1画像201を縮小することによって第1画素数よりも小さい第2画素数(上記の例ではP2)の第2画像を生成する。第1AIモデル32は、第2画像を入力として目標物の検出を行う。切り抜き部33は、記憶装置35に格納された第1画像201から第1AIモデルによって検出された目標物が写っている領域を切り抜いて、当該領域を含む第1画素数よりも小さい第3画素数(上記の例ではP2またはP3)の第3画像を生成する。第2AIモデル34は、第3画像を入力として目標物の解析を行う。
【0096】
よって、目標物を高い精度でかつ少ない計算量で解析することが可能となる。
【0097】
上述の本発明の実施形態は、発明の範囲を限定するものではなく、発明の範囲に含まれる一例に過ぎない。本発明のある実施形態は、上述の実施形態に対して、例えば、具体的な用途、構造、形状、作用、及び効果の少なくとも一部について、発明の要旨を逸脱しない範囲において変更、省略、及び追加がされたものであっても良い。
【符号の説明】
【0098】
10…車両、11,11a,11b,11c,11d…撮像装置、20…ECU(画像処理装置)、21…CPU、22…RAM、23…ROM、24…バス、25…画像処理プログラム、31…縮小部、32…第1AIモデル、33…切り抜き部、34…第2AIモデル、35…記憶装置、100…周辺監視システム、201…第1画像、301,311…画像(第1画像)、302,312…画像(第2画像)、303-1,303-2,305,313-1,313-2,315-1,315-2…マージン領域、304,315…画像(第2画像)、306,316…画像(第3画像)、401,402,411,412,414,501,511…像、403,413,502,512…領域