IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社豊田自動織機の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024082924
(43)【公開日】2024-06-20
(54)【発明の名称】物体検出装置
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240613BHJP
【FI】
G06T7/00 300D
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022197142
(22)【出願日】2022-12-09
(71)【出願人】
【識別番号】000003218
【氏名又は名称】株式会社豊田自動織機
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(72)【発明者】
【氏名】岡山 健
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA08
5L096CA04
5L096DA02
5L096EA35
5L096FA59
5L096FA69
5L096GA17
5L096GA51
5L096HA05
5L096HA08
5L096JA03
5L096JA09
(57)【要約】
【課題】物体の検出精度を向上できる物体検出装置を提供する。
【解決手段】物体検出装置は、比較用画像に対して出力された対象物体の領域を示すバウンディングボックスを記憶する。物体検出装置は、検出対象画像を取得する。物体検出装置は、検出対象画像に対して対象物体の領域の候補を示す矩形枠を複数付与する。物体検出装置は、比較用画像に対して出力されたバウンディングボックスと検出対象画像に対して付与された矩形枠との類似度の指標である類似度スコアを算出する。物体検出装置は、複数の矩形枠のうち、類似度スコアが所定の条件を満たしている矩形枠の信頼度スコアを増加させる加算処理を行う。物体検出装置は、加算処理後に、複数の矩形枠のうち、信頼度スコアが所定の信頼度閾値未満である矩形枠を削除する削除処理を行う。物体検出装置は、削除処理後に残った矩形枠を比較用画像に対するバウンディングボックスとして出力する。
【選択図】図9
【特許請求の範囲】
【請求項1】
カメラによって撮像された画像から対象物体の領域を検出する物体検出処理を行う物体検出装置であって、
前記画像である比較用画像に対して出力された前記対象物体の領域を示すバウンディングボックスを記憶する記憶部と、
前記比較用画像よりも後の時刻に撮像された前記画像である検出対象画像を取得する取得部と、
前記検出対象画像に対して前記対象物体の領域の候補を示す矩形枠を複数付与する付与部と、
前記比較用画像に対して出力された前記バウンディングボックスと前記検出対象画像に対して付与された前記矩形枠との類似度の指標である類似度スコアを算出する算出処理を行う算出部と、
複数の前記矩形枠のうち、前記類似度スコアが所定の条件を満たしている前記矩形枠の信頼度スコアを増加させる加算処理を行う加算部と、
前記加算処理後に、複数の前記矩形枠のうち、前記信頼度スコアが所定の信頼度閾値未満である前記矩形枠を削除する削除処理を行う削除部と、
前記削除処理後に残った前記矩形枠を前記比較用画像に対する前記バウンディングボックスとして出力する出力部と、
を備えることを特徴とする物体検出装置。
【請求項2】
前記算出部は、
前記比較用画像に対して出力された前記バウンディングボックスの位置と前記検出対象画像に対して付与された前記矩形枠の位置との類似度の指標である位置スコア、
前記比較用画像に対して出力された前記バウンディングボックスのアスペクト比と前記検出対象画像に対して付与された前記矩形枠のアスペクト比との類似度の指標であるアスペクト比スコア、
及び前記比較用画像に対して出力された前記バウンディングボックスの面積と前記検出対象画像に対して付与された前記矩形枠の面積との類似度の指標である面積スコア
の少なくとも1つを用いて前記類似度スコアを算出する請求項1に記載の物体検出装置。
【請求項3】
前記算出部は、前記位置スコア、前記アスペクト比スコア、及び前記面積スコアの積を前記類似度スコアとする請求項2に記載の物体検出装置。
【請求項4】
前記物体検出装置は、車両に搭載されるとともに、前記車両の動作を検出する動作検出部を備え、
前記算出部は、前記動作検出部によって検出された前記車両の動作に基づいて、前記位置スコア、前記アスペクト比スコア、及び前記面積スコアの重要度を調整する請求項3に記載の物体検出装置。
【請求項5】
前記付与部によって付与された前記複数の矩形枠について、互いに重複している2つの前記矩形枠の積集合の領域を当該2つの前記矩形枠の和集合の領域で除算することで重複割合を算出し、前記重複割合が重複割合閾値を超えている場合には、互いに重複している2つの前記矩形枠のうち前記信頼度スコアが低い方の前記矩形枠を削除するNMS処理を行うNMS処理部を備え、
前記算出部は、前記算出処理として、前記比較用画像に対して出力された前記バウンディングボックスと前記NMS処理後の前記矩形枠との前記類似度スコアを算出する請求項1に記載の物体検出装置。
【請求項6】
前記物体検出装置は、前記比較用画像に対して出力された前記バウンディングボックスを利用して前記検出対象画像から前記対象物体の領域を検出する高精度検出処理を繰り返し行い、
前記記憶部は、前記比較用画像に対して出力された前記バウンディングボックスの元となる前記矩形枠が、前記加算処理前の前記信頼度スコアが前記信頼度閾値未満である低信頼度矩形枠であるか、前記加算処理前の前記信頼度スコアが前記信頼度閾値以上である高信頼度矩形枠であるかを記憶しており、
前記類似度スコアが前記所定の条件を満たしている前記矩形枠が前記低信頼度矩形枠であり、かつ当該矩形枠との前記類似度スコアの算出に用いられた前記バウンディングボックスの元となる前記矩形枠が前記低信頼度矩形枠である場合を低信頼度連鎖としたとき、
前記加算部は、
複数回の前記物体検出処理に亘って前記低信頼度連鎖が連続する回数をカウントし、
カウントした前記回数に応じて前記加算処理における前記信頼度スコアの増加量を減少させる請求項1に記載の物体検出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物体検出装置に関する。
【背景技術】
【0002】
特許文献1には、カメラによって撮像された画像から対象物体の領域を検出する物体検出処理を行う物体検出装置が開示されている。物体検出装置は、例えば、次のように物体検出処理を行う。物体検出装置は、画像に対して対象物体の領域の候補を示す矩形枠を複数付与する。各矩形枠には、矩形枠内の物体が対象物体であることの信頼度の指標である信頼度スコアが紐付けられている。物体検出装置は、複数の矩形枠のうち、信頼度スコアが信頼度閾値未満の矩形枠を削除する削除処理を行う。物体検出装置は、削除処理後に複数の矩形枠が残っている場合、NMS処理を行う。NMS処理は、互いに重複する2つの矩形枠の重複割合が閾値を超えた場合、信頼度スコアの低い方の矩形枠を削除する処理である。重複割合は、互いに重複している2つの矩形枠の積集合の領域を当該2つの矩形枠の和集合の領域で除算することで算出される。そして、物体検出装置は、NMS処理後に残った矩形枠を対象物体の領域を示すバウンディングボックスとして出力する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-163127号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記物体検出処理では、矩形枠内の物体が対象物体であるにも関わらず、当該矩形枠の信頼度スコアが信頼度閾値未満になることがある。この場合、当該矩形枠は、削除処理によって削除されるため、バウンディングボックスとして出力されない。すなわち、当該矩形枠内の対象物体は未検出となる。
【課題を解決するための手段】
【0005】
上記問題点を解決するための物体検出装置は、カメラによって撮像された画像から対象物体の領域を検出する物体検出処理を行う物体検出装置であって、前記画像である比較用画像に対して出力された前記対象物体の領域を示すバウンディングボックスを記憶する記憶部と、前記比較用画像よりも後の時刻に撮像された前記画像である検出対象画像を取得する取得部と、前記検出対象画像に対して前記対象物体の領域の候補を示す矩形枠を複数付与する付与部と、前記比較用画像に対して出力された前記バウンディングボックスと前記検出対象画像に対して付与された前記矩形枠との類似度の指標である類似度スコアを算出する算出処理を行う算出部と、複数の前記矩形枠のうち、前記類似度スコアが所定の条件を満たしている前記矩形枠の信頼度スコアを増加させる加算処理を行う加算部と、前記加算処理後に、複数の前記矩形枠のうち、前記信頼度スコアが所定の信頼度閾値未満である前記矩形枠を削除する削除処理を行う削除部と、前記削除処理後に残った前記矩形枠を前記比較用画像に対する前記バウンディングボックスとして出力する出力部と、を備えることを要旨とする。
【0006】
検出対象画像における対象物体の写りが比較用画像における対象物体の写りと類似しているとき、検出対象画像に対して付与された複数の矩形枠のうち、対象物体の領域を示す矩形枠は、比較用画像に対して出力されたバウンディングボックスと類似している。このため、算出部は、バウンディングボックスと矩形枠との類似度スコアを算出する。加算部は、複数の矩形枠のうち、類似度スコアが所定の条件を満たしている矩形枠の信頼度スコアを増加させることによって、バウンディングボックスと類似している矩形枠の信頼度スコアを増加させる。その後、削除部は、複数の矩形枠のうち、信頼度スコアが信頼度閾値未満である矩形枠を削除する。これにより、従来の物体検出処理では、対象物体の領域を示す矩形枠であるにも関わらず、信頼度スコアが信頼度閾値未満であることによって削除されていた矩形枠を残すことができる。このように、検出対象画像から対象物体の領域を検出する際に前回の物体検出処理の検出結果を利用することによって、対象物体の検出精度を向上できる。
【0007】
上記物体検出装置において、前記算出部は、前記比較用画像に対して出力された前記バウンディングボックスの位置と前記検出対象画像に対して付与された前記矩形枠の位置との類似度の指標である位置スコア、前記比較用画像に対して出力された前記バウンディングボックスのアスペクト比と前記検出対象画像に対して付与された前記矩形枠のアスペクト比との類似度の指標であるアスペクト比スコア、及び前記比較用画像に対して出力された前記バウンディングボックスの面積と前記検出対象画像に対して付与された前記矩形枠の面積との類似度の指標である面積スコアの少なくとも1つを用いて前記類似度スコアを算出してもよい。
【0008】
検出対象画像における対象物体の写りが比較用画像における対象物体の写りと類似している場合として、例えば、次の3つの場合が考えられる。1つ目は、比較用画像における対象物体の位置と検出対象画像における対象物体の位置とが類似している場合である。この場合、比較用画像におけるバウンディングボックスの位置と検出対象画像における対象物体の領域を示す矩形枠の位置とは類似している。2つ目は、比較用画像における対象物体の形状と検出対象画像における対象物体の形状とが類似している場合である。この場合、バウンディングボックスのアスペクト比と対象物体の領域を示す矩形枠のアスペクト比とは類似している。3つ目は、比較用画像における対象物体の大きさと検出対象画像における対象物体の大きさとが類似している場合である。この場合、バウンディングボックスの面積と対象物体の領域を示す矩形枠の面積とは類似している。
【0009】
以上のことから、算出部は、位置スコア、アスペクト比スコア、及び面積スコアの少なくとも1つを用いて類似度スコアを算出する。これにより、検出対象画像に対して付与された複数の矩形枠から、位置、アスペクト比、及び面積の少なくとも1つがバウンディングボックスと類似している矩形枠を特定しやすくなる。
【0010】
上記物体検出装置において、前記算出部は、前記位置スコア、前記アスペクト比スコア、及び前記面積スコアの積を前記類似度スコアとしてもよい。
上記構成によれば、検出対象画像に対して付与された複数の矩形枠から、位置、アスペクト比、及び面積の全てがバウンディングボックスと類似している矩形枠を特定しやすくなる。すなわち、バウンディングボックスにより類似している矩形枠を特定しやすくなる。
【0011】
上記物体検出装置において、前記物体検出装置は、車両に搭載されるとともに、前記車両の動作を検出する動作検出部を備え、前記算出部は、前記動作検出部によって検出された前記車両の動作に基づいて、前記位置スコア、前記アスペクト比スコア、及び前記面積スコアの重要度を調整してもよい。
【0012】
上記構成によれば、物体検出装置は、車両の動作を考慮した上で類似度スコアを算出する。このため、物体検出装置は、車両の動作に応じた物体検出処理を行うことができる。したがって、対象物体の検出精度をより向上できる。
【0013】
上記物体検出装置において、前記付与部によって付与された前記複数の矩形枠について、互いに重複している2つの前記矩形枠の積集合の領域を当該2つの前記矩形枠の和集合の領域で除算することで重複割合を算出し、前記重複割合が重複割合閾値を超えている場合には、互いに重複している2つの前記矩形枠のうち前記信頼度スコアが低い方の前記矩形枠を削除するNMS処理を行うNMS処理部を備え、前記算出部は、前記算出処理として、前記比較用画像に対して出力された前記バウンディングボックスと前記NMS処理後の前記矩形枠との前記類似度スコアを算出してもよい。
【0014】
上記構成によれば、NMS処理によって矩形枠の数が減少するため、その後に行われる算出部による算出処理の負荷を軽減できる。
上記物体検出装置において、前記物体検出装置は、前記比較用画像に対して出力された前記バウンディングボックスを利用して前記検出対象画像から前記対象物体の領域を検出する高精度検出処理を繰り返し行い、前記記憶部は、前記比較用画像に対して出力された前記バウンディングボックスの元となる前記矩形枠が、前記加算処理前の前記信頼度スコアが前記信頼度閾値未満である低信頼度矩形枠であるか、前記加算処理前の前記信頼度スコアが前記信頼度閾値以上である高信頼度矩形枠であるかを記憶しており、前記類似度スコアが前記所定の条件を満たしている前記矩形枠が前記低信頼度矩形枠であり、かつ当該矩形枠との前記類似度スコアの算出に用いられた前記バウンディングボックスの元となる前記矩形枠が前記低信頼度矩形枠である場合を低信頼度連鎖としたとき、前記加算部は、複数回の前記物体検出処理に亘って前記低信頼度連鎖が連続する回数をカウントし、カウントした前記回数に応じて前記加算処理における前記信頼度スコアの増加量を減少させてもよい。
【0015】
上記構成によれば、物体検出装置は高精度検出処理を繰り返し行う。このため、前回の物体検出処理において誤検出が発生すると、前回の検出結果を利用する今回の物体検出処理でも誤検出が発生するおそれがある。また、今回の物体検出処理において誤検出が発生すると、今回の検出結果を利用する次回の物体検出処理でも誤検出が発生するおそれがある。このような誤検出の連鎖は、複数回の物体検出処理において低信頼度連鎖が連続することによって発生する。このため、加算部は、複数回の物体検出処理に亘って低信頼度連鎖が連続する回数をカウントする。そして、加算部は、カウントした回数に応じて加算処理における信頼度スコアの増加量を減少させる。これにより、誤検出の原因となり得る低信頼度矩形枠の信頼度スコアが増加されることが抑制される。したがって、誤検出の連鎖を抑制できる。
【発明の効果】
【0016】
本発明によれば、対象物体の検出精度を向上できる。
【図面の簡単な説明】
【0017】
図1】実施形態におけるフォークリフトを示す平面図である。
図2】実施形態におけるフォークリフトの構成を示すブロック図である。
図3】物体検出装置の検出結果の一例を示す図である。
図4】従来の物体検出処理を示すフローチャートである。
図5】1フレーム目の画像の一例を示す図である。
図6】矩形枠が付与された1フレーム目の画像を示す図である。
図7】削除処理後の1フレーム目の画像を示す図である。
図8】NMS処理後の1フレーム目の画像を示す図である。
図9】高精度検出処理を示すフローチャートである。
図10】2フレーム目の画像の一例を示す図である。
図11】矩形枠が付与された2フレーム目の画像を示す図である。
図12】NMS処理後の2フレーム目の画像を示す図である。
図13】位置スコア、アスペクト比スコア、及び面積スコアを説明するための図である。
図14】算出処理を説明するための図である。
図15】削除処理後の2フレーム目の画像を示す図である。
図16】バウンディングボックスが出力された2フレーム目の画像を示す図である。
図17】フォークリフトが急旋回する前の比較用画像を示す図である。
図18】フォークリフトが急旋回した後の検出対象画像を示す図である。
図19】フォークリフトが急加速する前の比較用画像を示す図である。
図20】フォークリフトが急加速した後の検出対象画像を示す図である。
図21】n回目の物体検出処理を示す図である。
図22】n+1回目の物体検出処理を示す図である。
図23】n+2回目の物体検出処理を示す図である。
【発明を実施するための形態】
【0018】
以下、物体検出装置を具体化した一実施形態を図1図16にしたがって説明する。本実施形態では、物体検出装置は、車両としてのフォークリフトに搭載されている。
<フォークリフト>
図1及び図2に示すように、フォークリフト10は、車両本体11と、制御ユニット12と、カメラ13とを備えている。車両本体11は、車体14と、駆動装置15とを有している。制御ユニット12は、車両制御装置16と、物体検出装置17とを有している。
【0019】
図1に示すように、車体14は、ヘッドガード14aと4つのピラー14bとを有している。ヘッドガード14aは、4つのピラー14bに支持されている。
図2に示すように、車両制御装置16は、プロセッサ16aと、記憶部16bと、を備える。プロセッサ16aとしては、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、又はDSP(Digital Signal Processor)が用いられる。記憶部16bは、RAM(Random Access Memory)及びROM(Read Only Memory)を含む。記憶部16bは、処理をプロセッサ16aに実行させるように構成されたプログラムコードまたは指令を格納している。記憶部16b、即ち、コンピュータ可読媒体は、汎用または専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含む。車両制御装置16は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェア回路によって構成されていてもよい。処理回路である車両制御装置16は、コンピュータプログラムに従って動作する1つ以上のプロセッサ、ASICやFPGA等の1つ以上のハードウェア回路、或いは、それらの組み合わせを含み得る。
【0020】
車両制御装置16は、駆動装置15と接続されている。車両制御装置16は、駆動装置15を制御する。また、車両制御装置16は、物体検出装置17と接続されている。車両制御装置16は、物体検出装置17の検出結果に基づいて駆動装置15を制御する。
【0021】
カメラ13は、撮像素子を有している。撮像素子としては、CCDイメージセンサやCOMSイメージセンサを挙げることができる。カメラ13は、RGBカメラである。カメラ13は、赤、緑、及び青の3色のカラー信号で構成された画像を出力する。本実施形態のカメラ13は、単眼カメラである。
【0022】
図1に示すように、カメラ13は、ヘッドガード14aに対して車幅方向における両側に取り付けられている。カメラ13は、フォークリフト10の側方を撮像する。カメラ13は、所定の撮像周期で繰り返し撮像を行う。
【0023】
<物体検出装置>
図2に示すように、物体検出装置17は、プロセッサ17aと、記憶部17bと、を備える。プロセッサ17aとしては、例えば、CPU、GPU、又はDSPが用いられる。記憶部17bは、RAM及びROMを含む。記憶部17bは、処理をプロセッサ17aに実行させるように構成されたプログラムコードまたは指令を格納している。記憶部17b、即ち、コンピュータ可読媒体は、汎用または専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含む。物体検出装置17は、ASICやFPGA等のハードウェア回路によって構成されていてもよい。処理回路である物体検出装置17は、コンピュータプログラムに従って動作する1つ以上のプロセッサ、ASICやFPGA等の1つ以上のハードウェア回路、或いは、それらの組み合わせを含み得る。
【0024】
物体検出装置17は、カメラ13によって撮像された画像から対象物体の領域を検出する物体検出処理を行う。具体的には、物体検出装置17は、カメラ13によって撮像された画像から物体のクラスと当該物体の領域とを検出することによって、対象物体の領域を検出する。物体のクラスは、物体検出装置17が少なくとも対象物体を検出できるように設定されている。このため、物体のクラスは、少なくとも対象物体を含んでいる。なお、物体のクラスに複数の対象物体を設定することによって、物体検出装置17に他クラス分類を行わせてもよい。
【0025】
図3は、カメラ13によって撮像された画像IMの一例である。図1に示すように、フォークリフト10の側方に対象物体Tが存在している場合、画像IMには対象物体Tが写り込む。本実施形態では、対象物体Tは人である。物体検出装置17は、画像IMに対し、対象物体Tの領域を示すバウンディングボックスBを出力する。バウンディングボックスBは、対象物体Tの領域を示す矩形状の枠である。
【0026】
<物体検出処理>
物体検出装置17が行う物体検出処理について説明する。物体検出処理は、所定の検出周期で繰り返し行われる。検出周期は、カメラ13の撮像周期以上の長さに設定されている。物体検出処理の処理内容は、1回目の物体検出処理と2回目以降の物体検出処理とで異なる。なお、1回目の物体検出処理とは、物体検出開始時の物体検出処理のことである。
【0027】
まず、1回目の物体検出処理について詳述する。1回目の物体検出処理の処理内容は、従来の物体検出処理の処理内容と同じである。
図4に示すように、ステップS11において、物体検出装置17は、カメラ13によって撮像された画像IMを取得する。物体検出装置17は、ステップS11において、1フレーム目の画像IM1を取得する。
【0028】
図5に示すように、1フレーム目の画像IM1には、2人の人P1,P2が写っている。すなわち、1フレーム目の画像IM1には、2つの対象物体Tが写っている。
図4に示すように、ステップS12において、物体検出装置17は、画像IMに対して複数の矩形枠Aを付与する。したがって、物体検出装置17は、画像IMに対して複数の矩形枠Aを付与する付与部を備えている。矩形枠Aは、画像IMにおける対象物体Tの領域の候補を示す矩形状の枠である。矩形枠Aには、矩形枠A毎に信頼度スコアが紐付けられている。信頼度スコアとは、矩形枠A内の物体が対象物体Tであることの信頼度の指標である。矩形枠A内の物体が対象物体Tである確率が高いほど、信頼度スコアは高くなる。本実施形態の信頼度スコアは、矩形枠A内の物体が人であることの信頼度の指標である。矩形枠A内の物体が人である確率が高いほど、信頼度スコアは高くなる。
【0029】
ステップS12の処理は、例えば、機械学習によって学習を行った学習済みモデルを用いて行われる。学習済みモデルは、物体検出装置17の記憶部17bに記憶されている。学習済みモデルは、物体検出を行うモデルである。学習モデルとしては、例えば、faster R-CNN(Regional Convolutional Neural Network)や、YOLO(You Only Look Once)v3を挙げることができる。
【0030】
物体検出装置17は、画像IMから特徴マップを作成する。物体検出装置17は、作成された特徴マップに対して複数のアンカーボックスを設定する。複数のアンカーボックスは、矩形状の枠である。複数のアンカーボックスは、アンカーボックス毎のアスペクト比が異なるように設定されている。物体検出装置17は、学習済みモデルを用いて物体を含むアンカーボックスの位置及び大きさを調整することによって、複数の矩形枠Aを付与する。
【0031】
図6に示すように、ステップS12によって、1フレーム目の画像IMには、多数の矩形枠Aが付与されている。多数の矩形枠Aには、対象物体Tである人の領域を示す矩形枠Aと、人以外の物体の領域を示す矩形枠Aとが混在している。人の領域を示す矩形枠Aの信頼度スコアは、人以外の物体の領域を示す矩形枠Aの信頼度スコアよりも高い。
【0032】
図4に示すように、ステップS13において、物体検出装置17は、画像IMに対して付与された複数の矩形枠Aのうち、信頼度スコアが信頼度閾値未満の矩形枠Aを削除する削除処理を行う。したがって、物体検出装置17は、信頼度スコアが信頼度閾値未満の矩形枠Aを削除する削除処理を行う削除部を備えている。ステップS13により、矩形枠Aの数は減少する。
【0033】
図7に示すように、ステップS13によって、1フレーム目の画像IM1に対して付与されていた多数の矩形枠Aのうち、人以外の物体の領域を示す矩形枠Aは削除されている。一方、人の領域を示す矩形枠Aは、削除されることなく残っている。
【0034】
図4に示すように、ステップS14において、物体検出装置17は、ステップS13の削除処理後に複数の矩形枠Aが残っている場合、NMS(Non Maximum Suppression)処理を行う。したがって、物体検出装置17は、NMS処理を行うNMS処理部を備えている。ステップS14により、矩形枠Aの数はさらに減少する。
【0035】
物体検出装置17は、NMS処理として次のような処理を行う。
物体検出装置17は、重複割合を算出する。重複割合は、IoU(Intersection over Union)とも呼ばれる。IoUは、以下の(1)式で表現される。
【0036】
IoU=(Area of intersection)/(Area of union)…(1)
Area of intersectionは、互いに重複している2つの矩形枠Aの積集合の領域である。Area of intersectionは、2つの矩形枠Aが互いに重なり合う部分の面積ともいえる。Area of unionは、互いに重複している2つの矩形枠Aの和集合の領域である。Area of unionは、2つの矩形枠Aのうち少なくともいずれかに含まれる部分の面積ともいえる。このように、重複割合は、互いに重複している2つの矩形枠Aの積集合の領域を当該2つの矩形枠Aの和集合の領域で除算することで算出される。物体検出装置17は、重複割合が重複割合閾値を超えている場合には、互いに重複している2つの矩形枠Aのうち、信頼度スコアが低い方の矩形枠Aを削除する。
【0037】
物体検出装置17は、削除処理後に残った複数の矩形枠Aの全ての組み合わせについてNMS処理を行う。これにより、複数の矩形枠Aのうち、重複割合が閾値を超えており、かつ重複している矩形枠Aよりも信頼度スコアが低い方の矩形枠Aは削除される。
【0038】
図8に示すように、ステップS14によって、1フレーム目の画像IM1には、人P1の領域を示す矩形枠A、及び人P2の領域を示す矩形枠Aが1つずつ残っている。
図4に示すように、ステップS15において、物体検出装置17は、NMS処理後に残った矩形枠Aを、対象物体Tの領域を示すバウンディングボックスBとして出力する。記憶部17bは、画像IMに対して出力したバウンディングボックスBを記憶する。すなわち、記憶部17bは、1回目の物体検出処理の検出結果を記憶する。
【0039】
図3に示すように、ステップS15によって、1フレーム目の画像IM1には、2つのバウンディングボックスBが出力される。2つのバウンディングボックスBのうち、一方のバウンディングボックスBを第1バウンディングボックスB1とし、他方のバウンディングボックスBを第2バウンディングボックスB2とする。第1バウンディングボックスB1は、人P1の領域を示している。第2バウンディングボックスB2は、人P2の領域を示している。
【0040】
次に、2回目以降の物体検出処理について説明する。2回目以降の物体検出処理は、高精度検出処理である。高精度検出処理とは、nフレーム目の画像IMに対して出力されたバウンディングボックスBを利用して、n+1フレーム目の画像IMから対象物体Tの領域を検出する処理である。以下では、nフレーム目の画像IMを比較用画像IMpという。n+1フレーム目の画像IMを検出対象画像IMcという。検出対象画像IMcは、比較用画像IMpよりも後の時刻に撮像された画像IMである。言い換えると、比較用画像IMpは、検出対象画像IMcよりも前の時刻に撮像された画像IMである。
【0041】
例えば、2回目の物体検出処理では、1フレーム目の画像IM1に対して出力されたバウンディングボックスBを利用して、2フレーム目の画像IM2から対象物体Tの領域を検出する。この場合、1フレーム目の画像IM1は、比較用画像IMpである。2フレーム目の画像IM2は、検出対象画像IMcである。
【0042】
例えば、3回目の物体検出処理では、2フレーム目の画像IM2に対して出力されたバウンディングボックスBを利用して、3フレーム目の画像IM3から対象物体Tの領域を検出する。この場合、2フレーム目の画像IM2は、比較用画像IMpである。3フレーム目の画像IM3は、検出対象画像IMcである。
【0043】
以下では、高精度検出処理について2回目の物体検出処理を例に詳述するが、3回目以降の物体検出処理でも同様の処理が行われる。
図9に示すように、ステップS21において、物体検出装置17は、カメラ13によって撮像された画像IMを取得する。物体検出装置17は、ステップS21において、検出対象画像IMcを取得する。したがって、物体検出装置17は、検出対象画像IMcを取得する取得部である。
【0044】
図10に示すように、2回目の物体検出処理では、物体検出装置17は、検出対象画像IMcとして2フレーム目の画像IM2を取得する。2フレーム目の画像IM2は、1フレーム目の画像IM1よりも後の時刻に撮像された画像IMである。2フレーム目の画像IM2にも、1フレーム目の画像IM1と同様、2人の人P1,P2が写っている。なお、図10では、2フレーム目の画像IM2に対して、1フレーム目の画像IM1に写る2人の人P1,P2を二点鎖線で図示している。
【0045】
カメラ13の撮像周期が短く、かつカメラ13と対象物体Tとの相対速度が小さいとき、画像IMにおける対象物体Tの写りは、比較用画像IMpと検出対象画像IMcとで大きく変化しないはずである。ここで、対象物体Tの写りとは、例えば、画像IMに写る対象物体Tの位置、形状、及び大きさである。すなわち、カメラ13の撮像周期が短く、かつカメラ13と対象物体Tとの相対速度が小さいとき、画像IMに写る対象物体Tの位置、形状、及び大きさは、比較用画像IMpと検出対象画像IMcとで大きく変化しないはずである。
【0046】
本実施形態では、1フレーム目の画像IM1の撮像時刻と2フレーム目の画像IM2の撮像時刻との撮像間隔が短く、かつカメラ13が取り付けられたフォークリフト10と人P1,P2との相対速度が小さい。このため、2フレーム目の画像IM2における人P1,P2の位置、形状、及び大きさは、1フレーム目の画像IM1における人P1,P2の位置、形状、及び大きさから大きく変化していない。
【0047】
図9に示すように、ステップS22において、物体検出装置17は、検出対象画像IMcに対して複数の矩形枠Aを付与する。なお、ステップS22の処理は、ステップS12の処理と同じ処理であるため、詳細な説明は省略する。
【0048】
図11に示すように、2回目の物体検出処理では、物体検出装置17は、2フレーム目の画像IM2に対して複数の矩形枠Aを付与する。
図9に示すように、ステップS23において、物体検出装置17は、検出対象画像IMcに対して付与された複数の矩形枠AについてNMS処理を行う。なお、ステップS23の処理は、ステップS14の処理と同じ処理であるため、詳細な説明は省略する。
【0049】
図12に示すように、2回目の物体検出処理では、物体検出装置17は、2フレーム目の画像IM2に対して付与された複数の矩形枠AについてNMS処理を行う。NMS処理後の複数の矩形枠Aには、人の領域を示す矩形枠Aと、人以外の物体の領域を示す矩形枠Aとが混在している。人の領域を示す矩形枠Aは、2つ存在している。人の領域を示す2つの矩形枠Aのうち、一方の矩形枠Aを第1矩形枠A1とし、他方の矩形枠Aを第2矩形枠A2とする。第1矩形枠A1は、人P1の領域を示す矩形枠Aである。第2矩形枠A2は、人P2の領域を示す矩形枠Aである。
【0050】
第1矩形枠A1の信頼度スコアは、信頼度閾値以上である。第2矩形枠A2の信頼度スコアは、信頼度閾値未満である。なお、第2矩形枠A2は人の領域を示す矩形枠Aであるため、本来、第2矩形枠A2の信頼度スコアは信頼度閾値以上になるはずであるが、何らかの理由によって信頼度閾値未満になっている。第1矩形枠A1及び第2矩形枠A2以外の他の矩形枠Aの信頼度スコアは、信頼度閾値未満である。
【0051】
図9に示すように、ステップS24において、物体検出装置17は、比較用画像IMpに対して出力されたバウンディングボックスBと、検出対象画像IMcに対して付与された矩形枠Aとの類似度の指標である類似度スコアを算出する。したがって、物体検出装置17は、比較用画像IMpに対して出力されたバウンディングボックスBと、検出対象画像IMcに対して付与された矩形枠Aとの類似度の指標である類似度スコアを算出する算出部を備えている。比較用画像IMpに対して出力されたバウンディングボックスBと検出対象画像IMcに付与された矩形枠Aとが類似しているほど、類似度スコアは高くなる。
【0052】
物体検出装置17は、比較用画像IMpに対して出力されたバウンディングボックスBと、検出対象画像IMcに対して付与された矩形枠Aとの全ての組み合わせについて、類似度スコアを算出する。すなわち、比較用画像IMpに対して出力されたバウンディングボックスBの数がM個であり、検出対象画像IMcに対して付与されている矩形枠Aの数がN個であるとき、物体検出装置17が算出する類似度スコアの数はM×N個となる。
【0053】
2回目の物体検出処理では、物体検出装置17は、1フレーム目の画像IM1に対して出力された2つのバウンディングボックスBのそれぞれと、2フレーム目の画像IM2に対して付与された矩形枠Aのうち、NMS処理後に残った複数の矩形枠Aのそれぞれとの類似度スコアを算出する。
【0054】
本実施形態では、類似度スコアをRとしたとき、Rは以下の(2)式で表現される。
R=Rdα×Raβ×Rsγ…(2)
Rdは位置スコアである。Raはアスペクト比スコアである。Rsは面積スコアである。位置スコア、アスペクト比スコア、及び面積スコアについては後述する。αは、位置スコアの重要度を調整するための0以上の係数である。位置スコアの重要度が高いほど、αは大きな値に設定される。βは、アスペクト比スコアの重要度を調整するための0以上の係数である。アスペクト比スコアの重要度が高いほど、βは大きな値に設定される。γは、面積スコアの重要度を調整するための0以上の係数である。面積スコアの重要度が高いほど、γは大きな値に設定される。
【0055】
位置スコアは、比較用画像IMpにおけるバウンディングボックスBの位置と検出対象画像IMcにおける矩形枠Aの位置との類似度の指標である。比較用画像IMpにおけるバウンディングボックスBの位置と検出対象画像IMcにおける矩形枠Aの位置とが類似しているほど、位置スコアは高くなる。位置スコアは、取り得る値が0~1となるように正規化されている。
【0056】
位置スコアをRdとしたとき、Rdは、例えば、以下の(3)式で表される。
Rd=1-d/c…(3)
図13に示すように、dは、バウンディングボックスBの中心Cpと矩形枠Aの中心Ccとの距離である。cは、バウンディングボックスB及び矩形枠Aを含む最小の矩形Dの対角線の長さである。
【0057】
アスペクト比スコアは、バウンディングボックスBのアスペクト比Apと矩形枠Aのアスペクト比Acとの類似度の指標である。バウンディングボックスBのアスペクト比Apと矩形枠Aのアスペクト比Acとが類似しているほど、アスペクト比スコアは高くなる。アスペクト比スコアは、取り得る値が0~1となるように正規化されている。
【0058】
アスペクト比スコアをRaとしたとき、Raは、例えば、以下の(4)式で表される。
Ra=1-|Ac-Ap|…(4)
Apは、Sp/Lpで表される。バウンディングボックスBの幅をWpとする。バウンディングボックスBの高さをHpとする。Lpは、Wp,Hpのうち、大きい方の値である。Spは、Wp,Hpのうち、小さい方の値である。例えば、Wp>Hpの場合、Lp=Wp、Sp=Hpである。Wp<Hpの場合、Lp=Hp、Sp=Wpである。
【0059】
Acは、Sc/Lcで表される。矩形枠Aの幅をWcとする。矩形枠Aの高さをHcとする。Lcは、Wc,Hcのうち、大きい方の値である。Scは、Wc,Hcのうち、小さい方の値である。例えば、Wc>Hcの場合、Lc=Wc、Sc=Hcである。Wc<Hcの場合、Lc=Hc、Sc=Wcである。
【0060】
面積スコアは、バウンディングボックスBの面積Spと矩形枠Aの面積Scとの類似度の指標である。バウンディングボックスBの面積Spは、Hp×Wpで表される。矩形枠Aの面積Scは、Hc×Wcで表される。バウンディングボックスBの面積Spと矩形枠Aの面積Scとが類似しているほど、面積スコアは大きくなる。面積スコアは、取り得る値が0~1となるように正規化されている。
【0061】
面積スコアをRsとしたとき、Rsは、例えば、以下の(5)式で表される。
Rs=Ss/Sl…(5)
Slは、Sp,Scのうち、大きい方の値である。Ssは、Sp,Scのうち、小さい方の値である。例えば、Sp>Scの場合、Sl=Sp、Ss=Scである。Sp<Scの場合、Sl=Sc、Ss=Spである。
【0062】
図14に示すように、2回目の物体検出処理では、複数の矩形枠Aのうち、第1矩形枠A1が第1バウンディングボックスB1と最も類似している。したがって、第1バウンディングボックスB1と各矩形枠Aとの類似度スコアのうち、第1バウンディングボックスB1と第1矩形枠A1との類似度スコアが最も高くなる。また、複数の矩形枠Aのうち、第2矩形枠A2が第2バウンディングボックスB2と最も類似している。したがって、第2バウンディングボックスB2と各矩形枠Aとの類似度スコアのうち、第2バウンディングボックスB2と第2矩形枠A2との類似度スコアが最も高くなる。
【0063】
図9に示すように、ステップS25において、物体検出装置17は、複数の矩形枠Aのうち、類似度スコアが所定の条件を満たしている矩形枠Aの信頼度スコアを増加させる加算処理を行う。したがって、物体検出装置17は、類似度スコアが所定の条件を満たしている矩形枠Aの信頼度スコアを増加させる加算処理を行う加算部を備えている。
【0064】
本実施形態では、物体検出装置17は、複数の矩形枠Aのうち、類似度スコアが最も高く、かつ類似度スコアが類似度閾値以上である矩形枠Aの信頼度スコアを増加させる。したがって、本実施形態の所定の条件とは、類似度スコアが最も高いこと、及び類似度スコアが類似度閾値以上であることである。信頼度スコアの増加量は、加算処理後の信頼度スコアが信頼度閾値以上となるように設定されている。
【0065】
上述したように、図13に示す2回目の物体検出処理では、第1バウンディングボックスB1と各矩形枠Aとの類似度スコアのうち、第1バウンディングボックスB1と第1矩形枠A1との類似度スコアが最も高くなる。また、第1バウンディングボックスB1と第1矩形枠A1との類似度スコアは、類似度閾値以上である。したがって、物体検出装置17は、第1矩形枠A1の信頼度スコアを増加させる。これにより、加算処理前から信頼度閾値以上であった第1矩形枠A1の信頼度スコアは、加算処理によってさらに高いスコアになる。
【0066】
また、第2バウンディングボックスB2と各矩形枠Aとの類似度スコアのうち、第2バウンディングボックスB2と第2矩形枠A2との類似度スコアが最も高くなる。また、第2バウンディングボックスB2と第2矩形枠A2との類似度スコアは、類似度閾値以上である。したがって、物体検出装置17は、第2矩形枠A2の信頼度スコアを増加させる。これにより、加算処理前には信頼度閾値未満であった第2矩形枠A2の信頼度スコアは、加算処理によって信頼度閾値以上になる。
【0067】
図9に示すように、ステップS26において、物体検出装置17は、検出対象画像IMcに対して付与された複数の矩形枠Aのうち、信頼度スコアが信頼度閾値未満である矩形枠Aを削除する。なお、ステップS26の処理は、ステップS13の処理と同じ処理であるため、詳細な説明は省略する。
【0068】
図15に示すように、2回目の物体検出処理では、物体検出装置17は、2フレーム目の画像IM2に対して付与された矩形枠Aのうち、NMS処理後に残った複数の矩形枠Aから、信頼度スコアが信頼度閾値未満である矩形枠Aを削除する。複数の矩形枠Aのうち、第1矩形枠A1及び第2矩形枠A2の信頼度スコアは信頼度閾値以上であるため、削除されない。一方、複数の矩形枠Aのうち、第1矩形枠A1及び第2矩形枠A2以外の矩形枠Aの信頼度スコアは信頼度閾値未満であるため、削除される。したがって、第1矩形枠A1及び第2矩形枠A2のみが残る。
【0069】
図9に示すように、ステップS27において、物体検出装置17は、ステップS26の削除処理によって削除されることなく残った矩形枠Aを、検出対象画像IMcに対するバウンディングボックスBとして出力する。物体検出装置17の記憶部17bは、比較用画像IMpに対するバウンディングボックスBの出力結果を記憶する。すなわち、物体検出装置17の記憶部17bは、今回の物体検出処理の検出結果を記憶する。なお、ステップS27の処理は、ステップS15の処理と同じ処理であるため、詳細な説明は省略する。
【0070】
図15及び図16に示すように、2回目の物体検出処理では、物体検出装置17は、削除処理によって削除されることなく残った第1矩形枠A1及び第2矩形枠A2を、2フレーム目の画像IM2に対するバウンディングボックスBとして出力する。物体検出装置17は、2フレーム目の画像IM2に対するバウンディングボックスBの出力結果を記憶する。すなわち、物体検出装置17は、2回目の物体検出処理の検出結果を記憶する。
【0071】
[本実施形態の作用]
本実施形態の作用を説明する。
第2矩形枠A2は、対象物体Tである人P2の領域を示す矩形枠Aであるため、バウンディングボックスBとして出力されるべき矩形枠Aである。しかしながら、加算処理前の第2矩形枠A2の信頼度スコアは信頼度閾値よりも低い。このため、従来の物体検出処理の場合、第2矩形枠A2は削除されてしまう。
【0072】
2フレーム目の画像IM2における人P2の写りは、1フレーム目の画像IM1における人P2の写りと類似している。したがって、1フレーム目の画像IM1に対して出力された第2バウンディングボックスB2と2フレーム目の画像IM2に対して付与された第2矩形枠A2とは類似しているはずである。すなわち、第2バウンディングボックスB2と第2矩形枠A2との類似度スコアは高くなるはずである。
【0073】
このため、本実施形態の物体検出装置17は、第2バウンディングボックスB2と各矩形枠Aとの類似度スコアを算出する。物体検出装置17は、複数の矩形枠Aのうち、第2バウンディングボックスB2との類似度スコアが最も高く、かつ類似度閾値以上である第2矩形枠A2の信頼度スコアを増加させる。これにより、第2バウンディングボックスB2と類似している第2矩形枠A2の信頼度スコアは増加する。その後、物体検出装置17は、複数の矩形枠Aのうち、信頼度スコアが信頼度閾値未満である矩形枠Aを削除する。これにより、従来の物体検出処理では、削除されていた第2矩形枠A2を残すことができる。
【0074】
[本実施形態の効果]
本実施形態の効果を説明する。
(1)検出対象画像IMcにおける対象物体Tの写りが比較用画像IMpにおける対象物体Tの写りと類似しているとき、検出対象画像IMcに対して付与された複数の矩形枠Aのうち、対象物体Tの領域を示す矩形枠Aは、比較用画像IMpに対して出力されたバウンディングボックスBと類似している。このため、物体検出装置17は、バウンディングボックスBと矩形枠Aとの類似度スコアを算出する。物体検出装置17は、複数の矩形枠Aのうち、類似度スコアが最も高く、かつ類似度閾値以上である矩形枠Aの信頼度スコアを増加させることによって、バウンディングボックスBと類似している矩形枠Aの信頼度スコアを増加させる。その後、物体検出装置17は、複数の矩形枠Aのうち、信頼度スコアが信頼度閾値未満である矩形枠Aを削除する。これにより、従来の物体検出処理では、対象物体Tの領域を示す矩形枠Aであるにも関わらず、信頼度スコアが信頼度閾値未満であることによって削除されていた矩形枠Aを残すことができる。このように、検出対象画像IMcから対象物体Tの領域を検出する際に前回の物体検出処理の検出結果を利用することによって、対象物体Tの検出精度を向上できる。
【0075】
(2)検出対象画像IMcにおける対象物体Tの写りが比較用画像IMpにおける対象物体Tの写りと類似している場合として、例えば、次の3つの場合が考えられる。1つ目は、比較用画像IMpにおける対象物体Tの位置と検出対象画像IMcにおける対象物体Tの位置とが類似している場合である。この場合、バウンディングボックスBの位置と対象物体Tの領域を示す矩形枠Aの位置とは類似している。2つ目は、比較用画像IMpにおける対象物体Tの形状と検出対象画像IMcにおける対象物体Tの形状とが類似している場合である。この場合、バウンディングボックスBのアスペクト比Apと対象物体Tの領域を示す矩形枠Aのアスペクト比Acとは類似している。3つ目は、比較用画像IMpにおける対象物体Tの大きさと検出対象画像IMcにおける対象物体Tの大きさとが類似している場合である。この場合、バウンディングボックスBの面積Spと対象物体Tの領域を示す矩形枠Aの面積Scとは類似している。
【0076】
以上のことから、物体検出装置17は、位置スコア、アスペクト比スコア、及び面積スコアを用いて類似度スコアを算出する。これにより、検出対象画像IMcに対して付与された複数の矩形枠Aから、位置、アスペクト比、及び面積がバウンディングボックスBと類似している矩形枠Aを特定しやすくなる。
【0077】
(3)物体検出装置17は、位置スコア、アスペクト比スコア、及び面積スコアの積を類似度スコアとする。この構成によれば、検出対象画像IMcに対して付与された複数の矩形枠Aから、位置、アスペクト比、及び面積の全てがバウンディングボックスBと類似している矩形枠Aを特定しやすくなる。すなわち、バウンディングボックスBにより類似している矩形枠Aを特定しやすくなる。
【0078】
(4)物体検出装置17は、検出対象画像IMcに対して付与された複数の矩形枠AについてNMS処理を行う。物体検出装置17は、算出処理として、比較用画像IMpに対して出力されたバウンディングボックスBとNMS処理後の矩形枠Aとの類似度スコアを算出する。この構成によれば、NMS処理によって矩形枠Aの数が減少するため、その後に行われる算出処理の負荷を軽減できる。
【0079】
(5)高精度検出処理のうち、ステップS22、ステップS23、ステップS26は、従来の物体検出処理でも行われている処理である。したがって、高精度検出処理を採用しやすい。
【0080】
(6)フォークリフト10の車両制御装置16は、物体検出装置17の検出結果に基づいて駆動装置15を制御する。この場合、対象物体Tの未検出が発生すると、車両制御装置16による駆動装置15の制御に遅れが生じるおそれがあるため、対象物体Tを常時検出することが求められる。したがって、本実施形態の物体検出装置17によって対象物体Tの検出精度を向上させることが特に効果的である。
【0081】
(7)物体検出装置17が従来の物体検出処理に加えて算出処理及び加算処理といった軽い処理を行うことによって、対象物体Tの検出精度を向上させることができる。したがって、例えば、オプティカルフロー等の重い処理によって対象物体Tの検出精度を向上する場合よりも検出間隔を短くすることができる。
【0082】
(8)対象物体Tの未検出の少なさの指標である再現率を高くする方法として、例えば、従来の物体検出処理において信頼度閾値を下げることが考えられる。この場合、対象物体Tの領域を示す矩形枠Aの信頼度スコアが低くなっても削除されにくくなる。しかしながら、対象物体Tではない他の物体の領域を示す矩形枠Aも削除されにくくなることによって、誤検出の少なさの指標である適合率は低下する。これに対し、本実施形態では、信頼度閾値を変更しなくても、対象物体Tの領域を示す矩形枠Aが削除されないようにすることができる。よって、適合率の低下を抑制しつつ再現率を高めることができる。
【0083】
[変更例]
なお、上記実施形態は、以下のように変更して実施できる。上記実施形態及び以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施できる。
【0084】
○ 上記実施形態の類似度スコアの式は一例である。類似度スコアの式は、バウンディングボックスBと矩形枠Aとが類似しているほど、類似度スコアが高くなるような式であれば、適宜変更されてもよい。
【0085】
類似度スコアは、位置スコア、アスペクト比スコア、及び面積スコアの積でなくてもよい。類似度スコアは、例えば、位置スコア、アスペクト比スコア、及び面積スコアの和であってもよい。すなわち、R=Rd+Ra+Rsであってもよい。
【0086】
類似度スコアの算出に用いられるスコアの種類は、3種類でなくてもよい。類似度スコアの算出に用いられるスコアの種類は、1種類、2種類、又は4種類以上であってもよい。例えば、類似度スコアが位置スコア、アスペクト比スコア、及び面積スコアの少なくとも1つを用いて算出される場合、上記実施形態の(2)と同様の効果を得ることができる。なお、「位置スコア、アスペクト比スコア、及び面積スコアの少なくとも1つ」とは、位置スコア、アスペクト比スコア、及び面積スコアのうちの「1つのみ」又は「2つ以上の任意の組み合わせ」を意味する。
【0087】
類似度スコアの算出に用いられるスコアは、位置スコア、アスペクト比スコア、及び面積スコアに限定されない。類似度スコアの算出に用いられる他のスコアとしては、例えば、角度スコア、幅スコア、高さスコア、特徴量スコアが挙げられる。
【0088】
角度スコアは、画像IMの所望の基準点に対するバウンディングボックスBの角度と、画像IMの上記基準点に対する矩形枠Aの角度とが類似しているほど高くなるスコアである。幅スコアは、バウンディングボックスBの幅Wpと矩形枠Aの幅Wcとが類似しているほど高くなるスコアである。高さスコアは、バウンディングボックスBの高さHpと矩形枠Aの高さHcとが類似しているほど高くなるスコアである。特徴量スコアは、バウンディングボックスB内で抽出された特徴量と矩形枠A内で抽出された特徴量とが類似しているほど高くなるスコアである。
【0089】
○ 上記実施形態の位置スコアの式は一例である。位置スコアの式は、比較用画像IMpにおけるバウンディングボックスBの位置と検出対象画像IMcにおける矩形枠Aの位置とが類似しているほど、位置スコアが高くなるような式であれば、適宜変更されてもよい。
【0090】
物体検出装置17は、例えば、カメラ13が搭載されたフォークリフト10の移動方向及び対象物体Tの移動方向を把握可能である場合、画像IMにおいて移動方向に該当する方向ベクトルの距離及び角度を用いて位置スコアを算出してもよい。
【0091】
○ 上記実施形態のアスペクト比スコアの式は一例である。アスペクト比スコアの式は、バウンディングボックスBのアスペクト比Apと矩形枠Aのアスペクト比Acとが類似しているほど、アスペクト比スコアが高くなるような式であれば、適宜変更されてもよい。
【0092】
○ 上記実施形態の面積スコアの式は一例である。面積スコアの式は、バウンディングボックスBの面積Spと矩形枠Aの面積Scとが類似しているほど、面積スコアが高くなるような式であれば、適宜変更されてもよい。
【0093】
○ 物体検出装置17は、フォークリフト10の動作を検出してもよい。すなわち、物体検出装置17は、フォークリフト10の動作を検出する動作検出部を備えていてもよい。物体検出装置17は、例えば、フォークリフト10から入力される情報に基づいて、フォークリフト10の動作を検出してもよい。フォークリフト10から入力される情報としては、例えば、慣性計測装置(IMU:Inertial Measurement Unit)の計測結果、フォークリフト10の運転者によるハンドル操作、及びフォークリフト10の運転者によるアクセルペダルの操作量が挙げられる。また、物体検出装置17は、取得した画像IMに対してオプティカルフロー等の処理を行うことによって、フォークリフト10の動作を検出してもよい。そして、物体検出装置17は、検出したフォークリフト10の動作に応じてα、β、γを調整する。すなわち、物体検出装置17は、フォークリフト10の動作に応じて位置スコア、アスペクト比スコア、及び面積スコアの重要度を調整する。
【0094】
一例として、カメラ13が比較用画像IMpを撮像してから検出対象画像IMcを撮像するまでの間に、カメラ13が取り付けられたフォークリフト10が急旋回したとする。
この場合、図17及び図18に示すように、画像IMにおける対象物体Tの位置は、比較用画像IMpと検出対象画像IMcとで異なる。このため、比較用画像IMpに対して出力されたバウンディングボックスBの位置と、検出対象画像IMcに対して付与された対象物体Tの領域を示す矩形枠Aの位置とは異なる。一方、画像IMにおける対象物体Tの形状及び大きさは、比較用画像IMpと検出対象画像IMcとで大きく変化しない。このため、比較用画像IMpに対して出力されたバウンディングボックスBのアスペクト比Ap及び面積Spと、検出対象画像IMcに対して付与された対象物体Tの領域を示す矩形枠Aのアスペクト比Ac及び面積Scとは、類似している。
【0095】
以上のことから、物体検出装置17は、フォークリフト10の動作としてフォークリフト10の急旋回を検出した場合、β及びγをαよりも大きい値に設定する。すなわち、物体検出装置17は、アスペクト比スコア及び面積スコアの重要度を位置スコアの重要度よりも高くする。
【0096】
他の例として、カメラ13が比較用画像IMpを撮像してから検出対象画像IMcを撮像するまでの間に、カメラ13が取り付けられたフォークリフト10が急加速したとする。
【0097】
この場合、図19及び図20に示すように、画像IMにおける対象物体Tの大きさは、比較用画像IMpと検出対象画像IMcとで異なる。このため、比較用画像IMpに対して出力されたバウンディングボックスBの面積Spと、検出対象画像IMcに対して出力された対象物体Tの領域を示す矩形枠Aの面積Scとは異なる。一方、画像IMにおける対象物体Tの位置及び形状は、比較用画像IMpと検出対象画像IMcとで大きく変化しない。このため、比較用画像IMpに対して出力されたバウンディングボックスBの位置及び形状と、検出対象画像IMcに対して付与された対象物体Tの領域を示す矩形枠Aの位置及び形状とは、類似している。
【0098】
以上のことから、物体検出装置17は、フォークリフト10の動作としてフォークリフト10の急加速を検出した場合、α及びβをγよりも大きい値に設定する。すなわち、物体検出装置17は、位置スコア及びアスペクト比スコアの重要度を面積スコアの重要度よりも高くする。
【0099】
このように物体検出装置17は、フォークリフト10の動作を考慮した上で類似度スコアを算出することによって、フォークリフト10の動作に応じた物体検出処理を行うことができる。したがって、対象物体Tの検出精度をより向上できる。
【0100】
○ 画像IMにおける対象物体Tの写りが変化することが予測される場合には、物体検出装置17は、予測される対象物体Tの写りの変化に応じてα、β、γを調整してもよい。
【0101】
例えば、対象物体Tである人が立ったりしゃがんだりすることが予測されている場合、カメラ13が比較用画像IMpを撮像するときには立っていた人が、検出対象画像IMcを撮像するときにはしゃがむことが起こり得る。
【0102】
この場合、画像IMにおける対象物体Tの形状及び大きさは、比較用画像IMpと検出対象画像IMcとで異なる。このため、画像IMにおける対象物体Tのアスペクト比及び面積は、比較用画像IMpと検出対象画像IMcとで異なる。具体的には、比較用画像IMpに対して出力されたバウンディングボックスBのアスペクト比Ap及び面積Spは、検出対象画像IMcに対して付与された対象物体Tの領域を示す矩形枠Aのアスペクト比Ac及び面積Scよりも小さくなる。一方、画像IMにおける対象物体Tの位置は、比較用画像IMpと検出対象画像IMcとで大きく変化しない。このため、比較用画像IMpに対して出力されたバウンディングボックスBの位置と、検出対象画像IMcに対して付与された対象物体Tの領域を示す矩形枠Aの位置とは、類似している。
【0103】
以上のことから、物体検出装置17は、対象物体Tである人が立ったりしゃがんだりすることが予測される場合、αをβ及びγよりも大きい値に設定する。すなわち、物体検出装置17は、位置スコアの重要度をアスペクト比スコア及び面積スコアの重要度よりも高くする。
【0104】
このように物体検出装置17は、予測される対象物体Tの写りの変化を考慮した上で類似度スコアを算出することによって、対象物体Tの写りの変化に応じた物体検出処理を行うことができる。したがって、対象物体Tの検出精度をより向上できる。
【0105】
○ 物体検出装置17は、取得した画像I全体から対象物体Tの領域を検出しなくてもよい。例えば、画像IMにおける対象物体Tの位置が時系列的に右から左に向かって移動している場合、物体検出装置17は、画像IMにおける右側の領域については、対象物体Tの領域を検出しなくてもよい。
【0106】
○ 例えば、図21に示すように、物体検出装置17は、n回目の物体検出処理において検出対象画像IMcに対して複数の矩形枠Aを付与する。なお、図21では、説明の便宜上、2つの矩形枠Aのみが図示されている。第1の矩形枠Aは、対象物体Tの領域を示す矩形枠Atである。第2の矩形枠Aは、対象物体T以外の物体の領域を示す矩形枠Aoである。矩形枠At及び矩形枠Aoの信頼度スコアはそれぞれ、信頼度閾値未満である。図21では、n-1回目の物体検出処理において出力されたバウンディングボックスBを二点鎖線で図示している。
【0107】
矩形枠Aoは、矩形枠Atの近くに位置している。また、矩形枠Aoのアスペクト比及び面積は、矩形枠Atのアスペクト比及び面積と同程度である。この場合、矩形枠AoとバウンディングボックスBとの類似度スコアは、矩形枠AtとバウンディングボックスBとの類似度スコアよりも高くなることがある。すると、物体検出装置17は、加算処理において、矩形枠Atではなく矩形枠Aoの信頼度スコアを増加させる。そして、物体検出装置17は、削除処理において、信頼度スコアが信頼度閾値未満である矩形枠Atを削除する。一方、加算処理によって信頼度スコアが信頼度閾値以上になった矩形枠Aoは、削除されずに残る。その結果、矩形枠AoがバウンディングボックスBとして出力される誤検出が発生する。
【0108】
図22に示すように、物体検出装置17は、n+1回目の物体検出処理では、n回目の物体検出処理の処理結果を利用して検出対象画像IMcから対象物体Tの領域を検出する。すなわち、物体検出装置17は、n+1回目の物体検出処理では、誤検出を含む検出結果を利用して検出対象画像IMcから対象物体Tの領域を検出する。このため、n+1回目の物体検出処理において、矩形枠AoとバウンディングボックスBとの類似度スコアは、矩形枠AtとバウンディングボックスBとの類似度スコアよりも高くなる。したがって、物体検出装置17は、加算処理において、矩形枠Atではなく矩形枠Aoの信頼度スコアを増加させる。そして、物体検出装置17は、矩形枠Atの信頼度スコアが信頼度閾値未満である場合、削除処理において矩形枠Atを削除する。一方、加算処理によって信頼度スコアが信頼度閾値以上になった矩形枠Aoは、削除されずに残る。その結果、n+1回目の物体検出処理においても、矩形枠AoがバウンディングボックスBとして出力される誤検出が発生する。
【0109】
図23に示すように、物体検出装置17は、n+2回目の物体検出処理では、n+1回目の物体検出処理の処理結果を利用して検出対象画像IMcから対象物体Tの領域を検出する。すなわち、物体検出装置17は、n+2回目の物体検出処理では、誤検出を含む検出結果を利用して検出対象画像IMcから対象物体Tの領域を検出する。このため、n+2回目の物体検出処理において、矩形枠AoとバウンディングボックスBとの類似度スコアは、矩形枠AtとバウンディングボックスBとの類似度スコアよりも高くなる。したがって、物体検出装置17は、加算処理において、矩形枠Atではなく矩形枠Aoの信頼度スコアを増加させる。そして、物体検出装置17は、矩形枠Atの信頼度スコアが信頼度閾値未満である場合、削除処理において矩形枠Atを削除する。一方、加算処理によって信頼度スコアが信頼度閾値以上になった矩形枠Aoは、削除されずに残る。その結果、n+2回目の物体検出処理においても、矩形枠AoがバウンディングボックスBとして出力される誤検出が発生する。このように1回の物体検出処理において誤検出が発生すると、その後の物体検出処理において誤検出が連鎖することがある。
【0110】
このような誤検出の連鎖を抑制するため、物体検出装置17は、次のように物体検出処理を行ってもよい。
加算処理前の信頼度スコアが信頼度閾値未満である矩形枠Aを低信頼度矩形枠とする。加算処理前の信頼度スコアが信頼度閾値以上である矩形枠Aを高信頼度矩形枠とする。物体検出装置17の記憶部17bは、比較用画像IMpに対して出力されたバウンディングボックスBの元になる矩形枠Aが、低信頼度矩形枠であるか、高信頼度矩形枠であるかを記憶する。
【0111】
上述した誤検出の連鎖は、複数回の物体検出処理に亘って低信頼度連鎖が連続することによって発生する。低信頼度連鎖とは、類似度スコアが所定の条件を満たしている矩形枠Aが低信頼度矩形枠であり、かつ当該矩形枠Aの類似度スコアの算出に用いられたバウンディングボックスBの元となる矩形枠Aが低信頼度矩形枠である場合を指す。
【0112】
物体検出装置17は、複数回の物体検出処理に亘って低信頼度連鎖が連続する回数をカウントする。そして、物体検出装置17は、カウントした回数に応じて加算処理における信頼度スコアの増加量を減少させる。例えば、物体検出装置17は、カウントした回数が増えるにつれて、加算処理における信頼度スコアの増加量を減衰させてもよい。
【0113】
例えば、n回目の物体検出処理において、加算処理前における矩形枠Atの信頼度スコアは閾値未満である。したがって、矩形枠Atは、低信頼度矩形枠である。一方、矩形枠Atとの類似度スコアの算出に用いられたn-1回目の物体検出処理の検出結果であるバウンディングボックスBの元となる矩形枠Aは高信頼度矩形枠であるとする。この場合、物体検出装置17は、低信頼度連鎖でないと判断する。
【0114】
n+1回目の物体検出処理において、加算処理前における矩形枠Atの信頼度スコアは信頼度閾値未満である。したがって、矩形枠Atは、低信頼度矩形枠である。また、矩形枠Atとの類似度スコアの算出に用いられたn回目の物体検出処理の検出結果であるバウンディングボックスBの元となる矩形枠Aは低信頼度矩形枠である。このため、物体検出装置17は、低信頼度連鎖である判断する。また、物体検出装置17は、低信頼度連鎖が連続する回数を1回とカウントする。
【0115】
n+2回目の物体検出処理において、加算処理前における矩形枠Atの信頼度スコアは信頼度閾値未満である。したがって、矩形枠Atは、低信頼度矩形枠である。また、矩形枠Atとの類似度スコアの算出に用いられたn+1回目の物体検出処理の検出結果であるバウンディングボックスBの元となる矩形枠Aは低信頼度矩形枠である。このため、物体検出装置17は、低信頼度連鎖であると判断する。また、物体検出装置17は、低信頼度連鎖が連続する回数を2回にカウントアップする。そして、物体検出装置17は、n+2回目の物体検出処理の加算処理において矩形枠Atの信頼度スコアを増加させる際、その増加量をn+1回目の物体検出処理の加算処理における増加量よりも少ない量に設定する。これにより、矩形枠Atは加算処理によって信頼度スコアが増加されたとしても、加算処理後の矩形枠Atの信頼度スコアは信頼度閾値未満になる。したがって、物体検出装置17は、削除処理において矩形枠Atを削除する。その結果、n+2回目の物体検出処理において誤検出の連鎖を止めることができる。
【0116】
○ 物体検出装置17が検出する対象物体Tは、人以外であってもよい。
○ 物体検出装置17は、フォークリフト10以外の車両に適用されてもよい。
○ 物体検出装置17は、車両以外の移動体や構造物に適用されてもよい。
【0117】
○ カメラ13は、単眼カメラでなくてもよい。カメラ13は、ステレオカメラや魚眼カメラであってもよい。
○ カメラ13の数は、適宜変更されてもよい。
【0118】
○ フォークリフト10に対するカメラ13の取り付け位置は、適宜変更されてもよい。例えば、フォークリフト10の前方に存在する対象物体Tを検出する場合には、カメラ13は、フォークリフト10の前方を撮像するようにフォークリフト10に取り付けられていてもよい。例えば、フォークリフト10の後方に存在する対象物体Tを検出する場合には、カメラ13は、フォークリフト10の後方を撮像するように、フォークリフト10に取り付けられていてもよい。
【0119】
○ 物体検出装置17は、車両制御装置16と同一の装置であってもよい。すなわち、物体検出装置17は、車両制御装置16の一機能であってもよい。
○ 車両制御装置16は、物体検出装置17の検出結果を図示しないディスプレイに表示させてもよい。
【0120】
○ 物体検出装置17は、NMS処理を行わなくてもよい。すなわち、物体検出装置17は、NMS処理部を備えていなくてもよい。
○ 物体検出装置17は、ステップS23の前に、複数の矩形枠Aのうち、信頼度スコアが0に近いスコアの矩形枠Aを削除してもよい。すなわち、物体検出装置17は、NMS処理の前に、信頼度スコアが明らかに低い矩形枠Aを削除してもよい。そして、物体検出装置17は、信頼度スコアが0に近い矩形枠Aが削除された後でNMS処理を行う。これにより、NMS処理の負荷を軽減できる。
【0121】
○ ステップS25の加算処理において、類似度スコアに対する所定の条件は、バウンディングボックスBに類似している矩形枠Aを特定できるような条件であれば、適宜変更されてもよい。
【0122】
○ 1回目の物体検出処理の具体的な処理内容は、1フレーム目の画像IM1から対象物体Tの領域を検出できるのであれば、上記実施形態の処理内容と異なっていてもよい。
[付記]
上記各実施形態及び変更例から把握できる技術的思想を以下に記載する。
【0123】
[1]カメラによって撮像された画像から対象物体の領域を検出する物体検出処理を行う物体検出装置であって、前記画像である比較用画像に対して出力された前記対象物体の領域を示すバウンディングボックスを記憶する記憶部と、前記比較用画像よりも後の時刻に撮像された前記画像である検出対象画像を取得する取得部と、前記検出対象画像に対して前記対象物体の領域の候補を示す矩形枠を複数付与する付与部と、前記比較用画像に対して出力された前記バウンディングボックスと前記検出対象画像に対して付与された前記矩形枠との類似度の指標である類似度スコアを算出する算出処理を行う算出部と、複数の前記矩形枠のうち、前記類似度スコアが所定の条件を満たしている前記矩形枠の信頼度スコアを増加させる加算処理を行う加算部と、前記加算処理後に、複数の前記矩形枠のうち、前記信頼度スコアが所定の信頼度閾値未満である前記矩形枠を削除する削除処理を行う削除部と、前記削除処理後に残った前記矩形枠を前記比較用画像に対する前記バウンディングボックスとして出力する出力部と、を備えることを特徴とする物体検出装置。
【0124】
[2]前記算出部は、前記比較用画像に対して出力された前記バウンディングボックスの位置と前記検出対象画像に対して付与された前記矩形枠の位置との類似度の指標である位置スコア、前記比較用画像に対して出力された前記バウンディングボックスのアスペクト比と前記検出対象画像に対して付与された前記矩形枠のアスペクト比との類似度の指標であるアスペクト比スコア、及び前記比較用画像に対して出力された前記バウンディングボックスの面積と前記検出対象画像に対して付与された前記矩形枠の面積との類似度の指標である面積スコアの少なくとも1つを用いて前記類似度スコアを算出する[1]に記載の物体検出装置。
【0125】
[3]前記算出部は、前記位置スコア、前記アスペクト比スコア、及び前記面積スコアの積を前記類似度スコアとする[2]に記載の物体検出装置。
[4]前記物体検出装置は、車両に搭載されるとともに、前記車両の動作を検出する動作検出部を備え、前記算出部は、前記動作検出部によって検出された前記車両の動作に基づいて、前記位置スコア、前記アスペクト比スコア、及び前記面積スコアの重要度を調整する[3]に記載の物体検出装置。
【0126】
[5]前記付与部によって付与された前記複数の矩形枠について、互いに重複している2つの前記矩形枠の積集合の領域を当該2つの前記矩形枠の和集合の領域で除算することで重複割合を算出し、前記重複割合が重複割合閾値を超えている場合には、互いに重複している2つの前記矩形枠のうち前記信頼度スコアが低い方の前記矩形枠を削除するNMS処理を行うNMS処理部を備え、前記算出部は、前記算出処理として、前記比較用画像に対して出力された前記バウンディングボックスと前記NMS処理後の前記矩形枠との前記類似度スコアを算出する[1]~[4]の何れか1つに記載の物体検出装置。
【0127】
[6]前記物体検出装置は、前記比較用画像に対して出力された前記バウンディングボックスを利用して前記検出対象画像から前記対象物体の領域を検出する高精度検出処理を繰り返し行い、前記記憶部は、前記比較用画像に対して出力された前記バウンディングボックスの元となる前記矩形枠が、前記加算処理前の前記信頼度スコアが前記信頼度閾値未満である低信頼度矩形枠であるか、前記加算処理前の前記信頼度スコアが前記信頼度閾値以上である高信頼度矩形枠であるかを記憶しており、前記類似度スコアが前記所定の条件を満たしている前記矩形枠が前記低信頼度矩形枠であり、かつ当該矩形枠との前記類似度スコアの算出に用いられた前記バウンディングボックスの元となる前記矩形枠が前記低信頼度矩形枠である場合を低信頼度連鎖としたとき、前記加算部は、複数回の前記物体検出処理に亘って前記低信頼度連鎖が連続する回数をカウントし、カウントした前記回数に応じて前記加算処理における前記信頼度スコアの増加量を減少させる[1]~[5]の何れか1つに記載の物体検出装置。
【符号の説明】
【0128】
10…車両としてのフォークリフト、13…カメラ、17…物体検出装置、17b…記憶部、A…矩形枠、B…バウンディングボックス、T…対象物体、IM…画像、IMp…比較用画像、IMc…検出対象画像。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23