(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022101321
(43)【公開日】2022-07-06
(54)【発明の名称】物体検出装置
(51)【国際特許分類】
G06T 7/70 20170101AFI20220629BHJP
【FI】
G06T7/70 A
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2020215837
(22)【出願日】2020-12-24
(71)【出願人】
【識別番号】520320446
【氏名又は名称】中部電力パワーグリッド株式会社
(71)【出願人】
【識別番号】000213297
【氏名又は名称】中部電力株式会社
(74)【代理人】
【識別番号】110003052
【氏名又は名称】特許業務法人勇智国際特許事務所
(72)【発明者】
【氏名】瀧本 隆
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096FA69
5L096GA19
5L096HA09
5L096HA11
5L096JA22
5L096KA04
(57)【要約】
【課題】画像情報に基づいた物体検出の精度を向上させることができる技術を提供する。
【解決手段】撮像手段20は、元画像を示す画像情報を出力する。画像分割手段11bは、画像情報で示される元画像を複数の分割画像に分割する。画像処理手段11aは、各分割画像を示す分割画像情報に基づいて、各分割画像に含まれている物体を検出する。検出結果合成手段11cは、各分割画像に対する物体検出結果を合成し、検出結果として出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
撮像手段と、物体検出手段を備え、
前記撮像手段は、撮像した元画像を示す画像情報を出力し、
前記物体検出手段は、画像処理手段と、画像分割手段と、検出結果合成手段と、を有し、
前記画像分割手段は、前記撮像手段から出力された画像情報で示される元画像を複数の分割画像に分割し、
前記画像処理手段は、前記各分割画像を示す分割画像情報に基づいて、各分割画像に含まれている物体を検出し、
前記検出結果合成手段は、前記各分割画像に対する物体検出結果を合成し、元画像の物体検出結果として出力することを特徴とする物体検出装置。
【請求項2】
請求項1に記載の物体検出装置であって、
前記画像分割手段は、前記元画像を、少なくとも、第1の数の第1の分割画像に分割するとともに第2の数の第2の分割画像に分割し、
前記第1の数と前記第2の数は、前記第1の分割画像の境界部分と前記第2の分割画像の境界部分が、平行に重ならないように設定されていることを特徴とする物体検出装置。
【請求項3】
請求項1または2に記載の物体検出装置であって、
前記画像分割手段は、前記元画像を、少なくとも、第1の奇数の2乗個の第1の分割画像に分割するとともに第1の偶数の2乗個の第2の分割画像に分割することを特徴とする物体検出装置。
【請求項4】
請求項1~3のうちのいずれか一項に記載の物体検出装置であって、
前記画像分割手段は、前記元画像を、少なくとも1種類の分割画像を含み、分割画像の総数が異なる複数の分割画像グループに分割可能であり、
前記検出結果合成手段は、1つの分割画像グループを構成する各分割画像を示す分割画像情報に基づいて、各分割画像に含まれている物体を検出し、各分割画像に対する物体検出結果のいずれかに物体が含まれている場合には、各分割画像に対する物体検出結果を合成し、元画像の物体検出結果として出力し、各分割画像に対する物体検出結果に物体が含まれていない場合には、異なる分割画像グループに対して同様の処理を行うことを特徴とする物体検出装置。
【請求項5】
請求項1~3のうちのいずれか一項に記載の物体検出装置であって、
前記画像処理手段は、前記画像情報に基づいて、前記元画像に含まれている物体を検出し、
前記検出結果合成手段は、前記各分割画像に対する物体検出結果と前記元画像に対する物体検出結果を合成し、元画像の物体検出結果として出力することを特徴とする物体検出装置。
【請求項6】
請求項1~3のうちのいずれか一項に記載の物体検出装置であって、
前記画像処理手段は、前記画像情報に基づいて、前記元画像に含まれている物体を検出し、前記元画像に対する物体検出結果に物体が含まれていない場合に、前記各分割画像を示す分割画像情報に基づいて、前記各分割画像に含まれている物体を検出し、
前記検出結果合成手段は、前記元画像に対する物体検出結果に物体が含まれている場合には、前記元画像に対する物体検出結果を、元画像の物体検出結果として出力し、前記元画像に対する物体検出結果に物体が含まれていない場合には、前記各分割画像に対する検出結果を合成し、元画像の物体検出結果として出力することを特徴とする物体検出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像情報に基づいて物体を検出する物体検出装置に関する。
【背景技術】
【0002】
ディープラーニング(多層ニューラルネットワークによる機械学習手法)を用いて物体を検出する技術が研究されている。例えば、撮像手段で撮像した撮像画像を示す画像情報に基づいて物体の位置とカテゴリを同時に検出するSSD(Single Shot MultiBox Detector)やYOLO(You Only Look Once)といったエンド・ツー・エンド(end-to-end)の手法が多数提案されている。これらの手法は、物体の位置検出のための多層ニューラルネットワークによる学習と、物体のカテゴリ判別のための多層ニューラルネットワークによる学習を同時に行うマルチタスク学習を基本としている。
SSDによる物体検出技術は、例えば、非特許文献1に開示され、YOLOによる物体検出技術は、例えば、非特許文献2に開示されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】“SSD: Single Shot MulitiBox Detector”, Wei Liu, Dragomir Anguelov. Domitru Erhan, Christian Szegedy, Scott reed, Cheng-Yang Fu and Alexsander C. berg (2015), https://arxiv.org/pdf/1512.02325.pdf
【非特許文献2】“You Only Look Once Unified, Real-Time Object Detection”, Joseph Redmon, Santosh Divvala, Ross Girshick and Ali Farhadi (2016), https://pjreddie,com/media/files/papers/yolo.pdf
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年、撮像手段の性能が向上し、撮像画像を示す画像情報の画素数(解像度)が増大する傾向にある。例えば、現在、多くの監視カメラは、2K(200万画素)以下の対応のものが用いられているが、今後、4K(800万画素)や8K(3300万画素)対応のものが普及することが考えられる。画素数が多い(解像度が高い)撮像手段を用いることができれば、高精細な画像情報を得ることができ、物体の検出精度が向上する。
一方、現行の物体検出装置は、2K未満の解像度(例えば、数百×数百画素)の画像情報を処理するように構成されている。このため、現行の物体検出装置により、4Kや8K対応やそれ以上の高解像度の画像情報を処理すると、検出取りこぼしが多くなり、物体の検出精度が低下するおそれがある。現行の物体検出装置を、高解像度の画像情報を処理可能に構成するには、多大の労力と費用を要する。
そこで、本発明者は、現行の物体検出装置を用いた物体の検出精度を向上させることができる技術について種々検討した。その結果、画像情報を複数の分割画像情報に分割し、分割画像情報を処理することにより、容易かつ安価に物体の検出精度を高めることができることを見出した。
本発明は、容易かつ安価に物体検出装置による物体の検出精度を向上させることができる技術を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の物体検出装置は、撮像手段と、物体検出手段を備えている。
撮像手段は、撮像した元画像を示す画像情報を出力する。撮像手段としては、CCD素子等により構成される公知の撮像手段を用いることができる。
物体検出手段は、画像処理手段と、画像分割手段と、検出結果合成手段を有している。
画像分割手段は、撮像手段から出力された画像情報で示される元画像を複数の分割画像に分割する。元画像を複数の分割画像に分割する方法(分割画像の数、分割画像の大きさ、分割回数等)としては、適宜の方法を用いることができるが、好適には、縦方向および横方向に等間隔に分割する方法、より好適には、縦方向および横方向に等間隔に同じ分割数で分割する方法が用いられる。
画像処理手段は、分割画像を示す分割画像情報に基づいて、分割画像に含まれている物体を検出する。画像処理手段としては、ディープラーニングを用いて、画像情報に基づいて物体の位置とカテゴリを同時に検出する、SSDやYOLO等の公知の画像処理手段が用いられる。
検出結果合成手段は、画像処理手段による、各分割画像に対する物体検出結果を合成して、元画像の物体検出結果(各分割画像に対する物体検出結果に基づいた元画像の物体検出結果)として出力する。各分割画像に対する物体検出結果を合成する方法としては、例えば、分割画像における物体の位置情報を、元画像における位置情報に変換する方法が用いられる。
本発明では、容易かつ安価に物体検出装置による物体の検出精度を向上させることができる。
本発明の異なる形態では、画像分割手段は、元画像を、少なくとも、第1の数の第1の分割画像に分割するとともに、第2の数の第2の分割画像に分割する。第1の数と第2の数は、第1の分割画像の境界部分と第2の分割画像の境界部分が、平行に重ならないように設定される。なお、本形態では、第1の分割画像の境界部分と第2の分割画像の境界部分が交差することは許容される。これにより、例えば、一方の分割画像に対する物体検出では検出することができない、一方の分割画像の境界部分に跨って存在する物体を、他方の分割画像に対する物体検出によって検出することができる。第1の数および第2の数としては、適宜の数を設定することができる。分割画像の種類は、第1の数の第1の分割画像と第2の数の第2の分割画像の2種類に限定されない。
本形態では、第1の分割画像と第2の分割画像のうちの一方の分割画像の境界部分における物体の検出精度の低下を、他方の分割画像に対する物体の検出結果によって補うことができる。
本発明の異なる形態では、画像分割手段は、元画像を、少なくとも、第1の奇数の2乗個の第1の分割画像に分割するとともに、第1の偶数の2乗個の第2の分割画像に分割する。典型的には、元画像を、縦方向および横方向に、等間隔で同じ分割数(奇数あるいは偶数)で分割する。分割画像の種類は、第1の奇数個の2乗個の第1の分割画像と第1の偶数個の2乗個の第2の分割画像の2種類に限定されない。
本形態では、第1の分割画像および第2の分割画像として、元画像の縦横比(アスペクト比)とほぼ同じ縦横比の分割画像を用いることができるため、現行の物体検出装置で用いられている画像処理手段を用いて、分割画像に対して物体検出処理を実行した場合でも、画像の縮尺変更によるひずみが無く、物体検出性能に影響はない。
本発明の異なる形態では、画像分割手段は、元画像を、少なくとも1種類の分割画像を含み、分割画像の総数が異なる複数の分割画像グループに分割可能である。各分割画像グループを構成する分割画像の数、形状等は適宜設定することができる。
検出結果合成手段は、1つの分割画像グループを構成する各分割画像を示す分割画像情報に基づいて、各分割画像に含まれている物体を検出する。そして、各分割画像に対する物体検出結果のいずれかに物体が含まれている場合には、各分割画像に対する物体検出結果を合成して、元画像の物体検出結果として出力する。一方、各分割画像に対する物体検出結果に物体が含まれていない場合には、異なる分割画像グループに対して同様の処理を行う。異なる分割画像グループに対する物体検出処理の繰り返しは、適宜のタイミングで終了させることができる。例えば、物体検出処理を実行した分割画像グループの数が設定値に達した時点あるいは物体検出処理の開始から設定時間経過した時点で終了させることができる。
本形態は、好適には、元画像に少なくとも一つの物体が存在していることを検出する場合に用いることができる。
本形態では、元画像に物体が存在することを検出した時点で物体件処理を終了させることができるため、物体検出手段の処理負担を軽減することができる。
本発明の異なる形態では、画像処理手段は、画像情報に基づいて、元画像に含まれている物体を検出する。
検出結果合成手段は、各分割画像に対する物体検出結果と元画像に対する物体検出結果を合成し、元画像の物体検出結果(各分割画像に対する物体検出結果と元画像に対する物体検出結果に基づいた元画像の物体検出結果)として出力する。各分割画像に対する物体検出結果と元画像に対する物体検出結果を合成する方法としては、例えば、分割画像における物体の位置情報を元画像における位置情報に変換する方法を用いることができる。また、複数の物体検出結果に、カテゴリと位置が同じ物体が含まれている場合には、例えば、物体検出処理において用いた、物体らしさを示すスコアが高い方の物体を選択する方法を用いることができる。
本形態では、物体の検出精度をより向上させることができる。
本発明の異なる形態では、画像処理手段は、画像情報に基づいて、元画像に含まれている物体を検出し、元画像に対する物体検出結果に物体が含まれていない場合に、各分割画像を示す分割画像情報に基づいて、各分割画像に含まれている物体を検出する。
検出結果合成手段は、元画像に対する物体検出結果に物体が含まれている場合には、元画像に対する物体検出結果を、元画像の物体検出結果として出力し、元画像に対する物体検出結果に物体が含まれていない場合には、各分割画像に対する物体検出結果を、元画像の物体検出結果として出力する。
本形態は、好適には、元画像に少なくとも一つの物体が存在していることを検出する場合に用いることができる。
本形態は、物体検出手段の処理負担を軽減することができる。
【発明の効果】
【0006】
本発明は、容易かつ安価に物体の検出精度を向上させることができる。
【図面の簡単な説明】
【0007】
【
図1】本発明の物体検出装置の一実施形態のブロック図である。
【
図2】ディープラーニングを用いて物体を検出する画像処理手段の一例の概要を示す図である。
【
図3】分割画像に基づいて物体を検出する場合と元画像に基づいて物体を検出する場合の検出精度を示す図である。
【
図4】一実施形態の物体検出装置の動作の第1実施例を説明する図である。
【
図5】一実施形態の物体検出装置の動作の第2実施例を説明する図である。
【
図6】一実施形態の物体検出装置の動作の第3実施例を説明する図である。
【発明を実施するための形態】
【0008】
以下に、本発明の物体検出装置の実施形態を、図面を参照して説明する。
図1は、一実施形態の物体検出装置のブロック図を示している。
一実施形態の物体検出装置は、有線通信回線や無線通信回線等により接続されている、処理手段10、撮像手段20、記憶手段30、入力手段40、出力手段50等により構成されている。
撮像手段20は、例えば、CCDやCMOSを用いたデジタルカメラにより構成される。撮像手段20は、撮像画像を示す画像情報を出力する。
撮像手段20が、本発明の「元画像を撮像する画像手段」に対応し、撮像手段20から出力される画像情報が、本発明の「元画像を示す画像情報」に対応する。
記憶手段30は、ROMやRAM等により構成され、処理手段10の処理を実行するプログラムや種々のデータが記憶される。
入力手段40は、キーボードやタッチパネル等により構成され、種々の情報を入力する。
出力手段50は、液晶表示装置や有機EL表示装置等により構成される表示手段や、印刷手段等により構成され、種々の情報を出力する。なお、表示手段として、表示画面に表示されている表示部をタッチすることによって情報を入力することができる表示手段が用いられる場合には、入力手段40を省略することもできる。
撮像手段20、記憶手段30、出力手段50等は、処理手段10と離れた場所に配置されていてもよい。
【0009】
処理手段10は、CPU等により構成される。
処理手段10は、物体検出手段11を有している。物体検出手段11は、画像処理手段11a、画像分割手段11b、検出結果合成手段11cを有している。
【0010】
画像分割手段11bは、撮像手段20から出力された画像情報で示される撮像画像(以下、「元画像」という)を複数の分割画像に分割する。画像情報には、撮像手段20から出力されて記憶手段30に記憶されている画像情報も含まれる。画像分割手段11bによる元画像を分割する方法については後述する。
【0011】
画像処理手段11aは、画像分割手段11bで分割された分割画像を示す分割画像情報に基づいて、分割画像に含まれている物体のカテゴリおよび位置を検出する。なお、画像処理手段11aは、元画像を示す画像情報に基づいて、元画像に含まれている物体のカテゴリおよび位置を検出することもできる。
画像処理手段11aとしては、ディープラーニングを用いて、元画像を示す画像情報あるいは分割画像を示す分割画像情報に基づいて、元画像あるいは分割画像に含まれている物体のカテゴリと位置を検出する、公知の種々の画像処理手段を用いることができる。例えば、SSDやYOLOの手法を用いて物体を検出する画像処理手段を用いることができる。
例えば、SSDは、
図2に示されているように、多層のCNN(Convolutional neural network)(畳み込みニューラルネットワーク)を基本とし、物体の存在領域候補を推定するレイヤと、存在領域候補内の物体のカテゴリを判別するレイヤとにより構成される。物体の存在領域候補を推定するレイヤでは、画像情報を、複数の所定サイズの矩形領域(デフォルトボックス)に分割し、矩形領域のずれを考慮しながら物体の存在領域候補(バウンディングボックス)を推定する。存在領域候補内の物体のカテゴリを判別するレイヤでは、別途学習済のCNNを用いて存在領域候補内の物体のカテゴリを判別する。
【0012】
検出結果合成手段11cは、画像処理手段11aによる、各分割画像に対する物体検出結果を合成し、元画像の物体検出結果として出力する。
例えば、各分割画像に対する物体検出結果を、各分割画像における物体の位置情報を元画像における位置情報に変換した状態で合成して、元画像の物体検出結果(この場合、各分割画像に対する物体検出結果に基づいた元画像の物体検出結果)として出力する。
なお、検出結果合成手段11cは、画像処理手段11aによる、各分割画像に対する物体検出結果と元画像に対する物体検出結果を合成し、元画像の物体検出結果(この場合、各分割元画像に対する物体検出結果と元画像に対する物体検出結果に基づいた元画像の物体検出結果)として出力することができる。この時、合成される物体検出結果に、カテゴリと位置がほぼ同じ物体が含まれている場合には、例えば、物体検出時に用いられる、物体らしさを示すスコアが高い方を選択する。あるいは、両方を出力することもできる。
また、検出結果合成手段11cは、元画像に対する物体検出結果を、元画像の物体検出結果(この場合、「元画像に対する物体検出結果に基づいた元画像の物体検出結果」)として出力することもできる。
【0013】
先ず、画像処理手段として現行の画像処理手段を用い、元画像に対して物体検出処理を実行する場合と、元画像を分割した分割画像に対して物体検出処理を実行する場合の物体の検出精度を、
図3を参照して説明する。
M1は、遠方に配置した人形を撮像した画像を示している。
M2は、人形の画像M1を、物体検出処理に用いられる元画像に対応する大きさに縮小した画像を示している。なお、撮像手段20のズーム機能を用いることによって、元画像中における画像M2の大きさは変化する。
M3は、人形の画像M1を、元画像を分割した分割画像(
図3では、縦方向および横方向それぞれに等間隔に2分割した4分割画像)に対応する大きさに縮小した画像を示している。
N1は、元画像における、縮小した人形の画像M2に対応する領域の画像(処理対象画像)を示している。
N2は、分割画像における、縮小した人形の画像M3に対応する領域の画像(処理対象画像)を示している。
現行の画像処理手段を用いて、元画像の処理対象画像N1に対して物体検出処理を実行した場合、人形の画像M2を検出することができなかった。一方、分割画像の処理対象画像N2に対して物体検出処理を実行した場合には、人形の画像M3を検出することができた。
このように、元画像を分割した分割画像に対して、画像処理手段による物体検出処理を実行することにより、元画像では検出することができない物体を検出することが可能となる。すなわち、元画像を分割画像に分割し、分割画像に対して物体検出処理を実行することにより、物体の検出精度を向上させることができる。
実験では、元画像における物体の最小検出サイズは、約[17×40画素]であったが、4分割画像における物体の最小検出サイズは、約[6×12画素]であった。
【0014】
次に、本実施形態の物体検出装置の動作を説明する。
本実施形態の物体検出装置の動作の第1実施例を、
図4を参照して説明する。
第1実施例では、画像分割手段11bは、元画像を、4分割線(1本の横方向分割線、1本の縦方向分割線)によって、4個(横方向に等間隔に2個×縦方向に等間隔に2個)の4分割画像(a)~(d)に分割する。なお、元画像における、各4分割画像(a)~(d)の位置(例えば、元画像の座標上における、各4分割画像の角部の位置)は、記憶手段30に記憶される。
第1実施例では、元画像は、2の2乗個(2
2)(縦方向および横方向それぞれに等間隔に2個)の4分割画像(a)~(d)に分割されている。すなわち、4分割画像(a)~(d)の縦横比(アスペクト比)が、元画像の縦横比(アスペクト比)と等しい(「ほぼ等しい」を含む)。このため、画像処理手段11aにより、各4分割画像(a)~(d)に対して物体検出処理を実行する場合に、画像の縮尺変更によるひずみが無く、物体検出性能に影響はない。
【0015】
画像処理手段11aは、各4分割画像(a)~(d)に対する物体検出処理を実行して、各4分割画像(a)~(d)に対する物体検出結果を出力する。
また、画像処理手段(11a)は、元画像に対する物体検出処理を実行して、元画像に対する物体検出結果を出力する。
検出結果合成手段11cは、各4分割画像(a)~(d)に対する物体検出結果と元画像に対する物体検出結果を合成し、元画像の物体検出結果(各分割画像に対する物体検出結果と元画像に対する物体検出結果に基づいた元画像の物体検出結果)として出力する。例えば、各4分割画像(a)~(d)に対する物体検出結果に含まれている物体の位置情報を、元画像における位置情報に変換した状態で、各4分割画像(a)~(d)に対する物体検出結果と元画像対する物体検出結果を合成する。
【0016】
第1実施例では、元画像を4分割した4個の4分割画像(a)~(d)に対して物体検出処理を実行することにより、元画像に対する物体検出処理では検出することができない物体を検出することができる。
これにより、物体の検出精度を向上させることができる。
なお、元画像を4個の4分割画像(a)~(d)に分割した場合、各4分割画像(a)~(d)の境界部分に存在する物体、例えば、4分割画像(a)~(d)の境界部分を跨いで存在する物体を検出することができない可能性がある。例えば、
図5に示されているように、4分割画像(a)と(b)に跨って存在する物体(P)は、4分割画像(a)、(b)に対する物体検出処理では検出することができない可能性がある。
第1実施例では、元画像に対する物体検出処理を実行することにより、元画像に対する物体検出結果を出力する。そして、元画像に対する物体検出結果と各4分割画像(a)~(d)に対する物体検出結果を合成している。これにより、各4分割画像(a)~(d)に対する物体検出処理では検出することができない、各4分割画像(a)~(d)の境界部分に存在する物体を、元画像に対する物体検出処理によって検出することができる。
【0017】
本実施形態の物体検出装置の動作の第2実施例を、
図5を参照して説明する。
第2実施例では、画像分割手段11bは、元画像を、4分割線によって4個の4分割画像(a)~(d)に分割するとともに、9分割線(3本の横方向分割線、3本の縦方向分割線)によって9個(横方向に等間隔に3個×縦方向に等間隔に3個)の9分割画像(A)~(I)に分割する。なお、元画像における、各4分割画像(a)~(d)および各9分割画像(A)~(I)の位置(例えば、元画像の座標上における、各分割画像の角部の位置)は、記憶手段30に記憶される。
第2実施例では、元画像は、2の2乗個(2
2)(縦方向および横方向それぞれに等間隔に2個)の4分割画像(a)~(d)と、3の2乗個(3
2)(縦方向および横方向それぞれに等間隔に3個)の9分割画像(A)~(I)に分割されている。すなわち、4分割画像(a)~(d)および9分割画像(A)~(I)の縦横比(アスペクト比)が、元画像の縦横比(アスペクト比)と等しい(「ほぼ等しい」を含む)。このため、画像処理手段11aにより、4分割画像(a)~(d)および9分割画像(A)~(I)に対して物体検出処理を実行する場合に、画像の縮尺変更によるひずみが無く、物体検出性能に影響はない。
【0018】
画像処理手段11aは、各4分割画像(a)~(d)および各9分割画像(A)~(I)に対して物体検出処理を実行し、各4分割画像(a)~(d)および各9分割画像(A)~(I)に対する物体検出結果を出力する。
また、画像処理手段11aは、元画像に対して物体検出処理を実行し、元画像に対する物体検出結果を出力する。
検出結果合成手段11cは、各4分割画像(a)~(d)に対する物体検出結果および各9分割画像(A)~(I)に対する物体検出結果と、元画像に対する物体検出結果を合成し、元画像の物体検出結果(各分割画像に対する物体検出結果と元画像に対する物体検出結果に基づいた元画像の物体検出結果)として出力する。例えば、各4分割画像(a)~(d)および各9分割画像(A)~(I)に対する物体検出結果に含まれている物体の位置情報を、元画像における位置情報に変換した状態で、各4分割画像(a)~(d)および各9分割画像に対する物体検出結果と元画像対する物体検出結果を合成する。検出結果合成手段11cによる物体検出結果の合成処理は、第1実施例における合成処理と同様の方法を用いることができる。
【0019】
第2実施例では、元画像を4分割した4個の4分割画像(a)~(d)および9分割した9個の9分割画像(A)~(I)に対して物体検出処理を実行することにより、元画像に対する物体検2出処理では検出することができない物体を検出することができる。
これにより、物体の検出精度を向上させることができる。
また、元画像を、偶数である2の2乗個(2
2)に4分割するとともに、奇数である3の2乗個(3
2)に9分割している。これにより、4分割画像(a)~(d)の境界部分(縦方向境界線、横方向境界線)と、9分割画像(A)~(I)の境界部分(縦方向境界線、横方向境界線)は、交差するが、平行に重ならない。
のため、各4分割画像(a)~(d)の境界部分における物体検出精度の低下(例えば、境界部分を跨いで存在する物体を検出することができない)を、各9分割画像(A)~(I)の物体検出結果によって補うことができる。例えば、
図5に示されているように、4分割画像(a)と(b)に跨って存在する物体(P)は、4分割画像(a)、(b)に対する物体検出処理によって検出することができない可能性があるが、9分割画像(B)に対する物体検出処理によって検出することができる。同様に、各9分割画像(A)~(I)の境界部分における物体検出精度の低下を、各4分割画像(a)~(d)の物体検出結果によって補うことができる。さらに、元画像に対する物体検出処理によって補うこともできる。
したがって、物体の検出精度をより向上させることができる。
【0020】
本実施形態の物体検出装置の動作の第3実施例を、
図6を参照して説明する。
第3実施例では、画像分割手段11bは、元画像を、4分割線によって4個の4分割画像(a)~(d)を得、9分割線によって9個の9分割画像(A)~(I)を得るとともに、16分割線(4本の横方向分割線、4本の縦方向分割線)によって16個(横方向に等間隔に4個×縦方向に等間隔に4個)の16分割画像(1)~(16)に分割する。なお、元画像における、各4分割画像(a)~(d)、各9分割画像(A)~(I)及び各16分割画像(1)~(16)の位置(例えば、元画像の座標上における、各分割画像の角部の位置)は、記憶手段30に記憶される。
第3実施例では、元画像は、2の2乗個(2
2)(縦方向および横方向それぞれに等間隔に2個)の4分割画像(a)~(d)と、3の2乗個(3
2)(縦方向および横方向それぞれに等間隔に3個)の9分割画像(A)~(I)と、4の2乗個(4
2)(縦方向および横方向それぞれに等間隔に4個)の16分割画像(1)~(16)に分割されている。すなわち、4分割画像(a)~(d)、9分割画像(A)~(I)および16分割画像(1)~(16)の縦横比(アスペクト比)が、元画像の縦横比(アスペクト比)と等しい(「ほぼ等しい」を含む)。このため、画像処理手段11aにより、4分割画像(a)~(d)、9分割画像(A)~(I)および16分割画像(1)~(16)に対して物体検出処理を実行する場合に、画像の縮尺変更によるひずみが無く、物体検出性能に影響はない。
【0021】
画像処理手段11aは、各4分割画像(a)~(d)、各4分割画像(A)~(I)および各16分割画像(1)~(16)に対して物体検出処理を実行し、各4分割画像(a)~(d)、各9分割画像(A)~(I)および各16分割画像(1)~(16)に対する物体検出結果を出力する。
また、画像処理手段(11a)は、元画像に対する物体検出処理を実行して、元画像に対する物体検出結果を出力する。
検出結果合成手段11cは、各4分割画像(a)~(d)に対する物体検出結果、各9分割画像(A)~(I)に対する物体検出結果および各16分割画像(1)~(16)に対する物体検出結果と、元画像に対する物体検出結果を合成し、元画像の物体検出結果(各分割画像に対する物体検出結果と元画像に対する物体検出結果に基づいた元画像の物体検出結果)として出力する。検出結果合成手段11cによる物体検出結果の合成処理は、第1実施例や第2実施例における合成処理と同様の方法を用いることができる。
【0022】
第3実施例では、元画像を4分割した4個の4分割画像(a)~(d)、9分割した9個の9分割画像(A)~(I)および16分割した16個の16分割画像(1)~(16)に対して物体検出処理を実行することにより、元画像に対する物体検出処理では検出することができない物体を検出することができる。
これにより、物体の検出精度を向上させることができる。
また、元画像を、偶数である2の2乗個(22)に4分割および4の2乗個(42)に16分割するとともに、奇数である3の2乗個(32)に9分割している。これにより、4分割画像(a)~(d)と16分割画像(1)~(16)の境界部分の一部が平行に重なっているが、4分割画像(a)~(d)の境界部分および16分割画像(1)~(16)の境界部分と、9分割画像(A)~(I)の境界部分は、平行に重なっていない。
このため、各9分割画像(A)~(I)の境界部分における物体検出精度の低下(例えば、境界部分を跨いで存在する物体を検出することができない)を、各4分割画像(a)~(d)および各16分割画像(1)~(16)の物体検出結果によって補うことができる。同様に、各4分割画像(a)~(d)および各16分割画像(1)~(16)の境界部分における物体検出精度の低下を、各9分割画像(A)~(I)の物体検出結果によって補うことができる。さらに、元画像の物体検出結果によって補うこともできる。
したがって、物体の検出精度をより向上させることができる。
【0023】
以上の実施形態では、画像処理手段11aにより、各分割画像に対する物体検出処理を実行するとともに、元画像に対する物体検出処理を実行し、検出結果合成手段11cにより、各分割画像に対する物体検出結果と元画像に対する物体検出結果を合成し、元画像に含まれている物体のカテゴリと位置を検出するよう構成したが、本発明は、以下のように構成することもできる。
分割画像として、元画像を2の2乗(22)個(縦方向および横方向に等間隔に2分割)に分割した4分割画像を含む分割画像グループ、元画像を2の2乗(22)個に分割した4分割画像および3の2乗(32)個(縦方向および横方向に等間隔に3分割)に分割した9分割画像を含む分割画像グループ、2の2乗(22)個に分割した4分割画像、3の2乗(32)個に分割した9分割画像および4の2乗(42)個(縦方向および横方向に等間隔に4分割)に分割した16分割画像を含む分割画像グループを用いたが、分割画像グループを構成する分割画像あるいは分割画像の組み合わせは、これに限定されない。
各分割画像に対する物体検出結果と元画像に対する物体検出結果を合成して元画像の物体判別結果を出力したが、分割画像に対する物体判別結果を合成して元画像の物体判別結果を出力するように構成することもできる。
1つの分割画像グループを用いたが、複数の分割画像グループを用い、選択した1つの分割画像グループを構成する分割画像に対して物体判別処理を実行し、物体判別結果に物体が含まれていない場合は、異なる分割画像グループを選択し、選択した分割画像グループを構成する分割画像に対して物体判別処理を実行するように構成することもできる。異なる分割画像グループに対する物体判別処理の繰り返しは、適宜のタイミングで終了させることができる。例えば、物体検出処理を実行した分割画像グループの数が設定値に達した時点あるいは物体検出処理の開始から設定時間経過した時点で終了させることができる。
物体の存在の有無(少なくとも一つの物体が存在していること)を検出することを目的とする場合には、以下のように構成することができる。
画像処理手段11aは、元画像に対する物体検出処理を実行し、元画像に対する物体検出結果に物体が含まれていない場合には、各分割画像に対する物体検出処理を実行する。検出結果合成手段11cは、元画像に対する物体検出結果に物体が含まれている場合には、元画像に対する物体検出結果を、元画像の物体検出結果として出力し、元画像に対する物体検出結果に物体が含まれていない場合には、各分割画像に対する物体検出結果を合成し、元画像の物体検出結果として出力する。なお、各分割画像に対する物体検出結果に物体が含まれていない場合には、異なる数の各分割画像に対する物体検出処理を実行し、異なる数の各分割画像に対する物体検出結果を合成し、元画像の物体検出結果として出力するように構成することもできる。異なる数の各分割画像に対する物体判別処理の繰り返しは、例えば、前述した、異なる分割画像グループに対する物体判別処理の繰り返しを終了させるタイミングと同様のタイミングで終了させることができる。
この場合、画像処理手段11aによる物体検出処理の回数を軽減することができる。
【0024】
本発明は、実施形態で説明した構成に限定されず、種々の変更、追加、削除が可能である。
画像分割手段、画像処理手段、検出結果合成手段は、実施形態で説明した構成に限定されない。
物体検出手段の構成は、実施形態で説明した構成に限定されない。
実施形態で説明した各構成は、単独で用いることもできるし、適宜選択した複数を組み合わせて用いることもできる。
【符号の説明】
【0025】
10 処理手段
11 物体検出手段
11a 画像処理手段
11b 画像分割手段
11c 処理結果処理手段
20 撮像手段
30 記憶手段
40 入力手段
50 出力手段