(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-13
(45)【発行日】2022-07-22
(54)【発明の名称】移動物体検出装置および移動物体検出方法
(51)【国際特許分類】
G06T 7/254 20170101AFI20220714BHJP
G06V 10/30 20220101ALI20220714BHJP
G06V 10/34 20220101ALI20220714BHJP
G08G 1/16 20060101ALI20220714BHJP
【FI】
G06T7/254 B
G06V10/30
G06V10/34
G08G1/16 C
(21)【出願番号】P 2018157668
(22)【出願日】2018-08-24
【審査請求日】2021-06-25
(73)【特許権者】
【識別番号】504165591
【氏名又は名称】国立大学法人岩手大学
(73)【特許権者】
【識別番号】000002082
【氏名又は名称】スズキ株式会社
(74)【代理人】
【識別番号】100120400
【氏名又は名称】飛田 高介
(74)【代理人】
【識別番号】100124110
【氏名又は名称】鈴木 大介
(72)【発明者】
【氏名】明石 卓也
(72)【発明者】
【氏名】ガンボルド ウーガンバヤル
(72)【発明者】
【氏名】富田 浩行
【審査官】笠田 和宏
(56)【参考文献】
【文献】特開2009-076076(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/254
G06V 10/30
G06V 10/34
G08G 1/16
(57)【特許請求の範囲】
【請求項1】
動画像を入力する入力部と、
動画像から連続的に複数のフレーム画像を取り出すフレーム取得部と、
フレーム画像において地平線を検出する地平線検出部と、
フレーム画像からエッジ画像を生成するエッジ画像生成部と、
前記移動物体に検出枠を設定する移動物体検出部とを備え、
前記エッジ画像生成部は、
前記地平線検出部が検出した地平線の下側のエッジ画像を抽出し、
地平線の下側のエッジ画像から背景差分法を用いて差分を抽出し、
前記移動物体検出部は、
フレーム画像をグレースケール画像にして背景差分法を用いて差分を抽出し、
前記グレースケール画像の差分と前記地平線の下側のエッジ画像の差分とを合成することによって前景を生成することを特徴とする移動物体検出装置。
【請求項2】
前記移動物体検出部は、前記地平線の下側のエッジ画像の差分のノイズが少ない場合に、前記グレースケール画像の差分と合成することを特徴とする請求項1に記載の移動物体検出装置。
【請求項3】
前記エッジ画像生成部は、
前記地平線検出部が検出した地平線と繋がったエッジ画像を抽出し、
前記移動物体検出部は、
前記地平線と繋がったエッジ画像によって前記前景をフィルタリングすることを特徴とする請求項1または2に記載の移動物体検出装置。
【請求項4】
前記移動物体検出部は、当該移動物体検出装置が移動している場合に、前記地平線と繋がったエッジ画像によって前記前景をフィルタリングすることを特徴とする請求項3に記載の移動物体検出装置。
【請求項5】
動画像を入力する入力部と、
動画像から連続的に複数のフレーム画像を取り出すフレーム取得部と、
フレーム画像において地平線を検出する地平線検出部と、
フレーム画像からエッジ画像を生成するエッジ画像生成部と、
前記移動物体に検出枠を設定する移動物体検出部とを備え、
前記エッジ画像生成部は、
前記地平線検出部が検出した地平線と繋がったエッジ画像を抽出し、
前記移動物体検出部は、
フレーム画像をグレースケール画像にして背景差分法を用いて前景を抽出し、
前記前景を前記地平線と繋がったエッジ画像によってフィルタリングすることを特徴とする移動物体検出装置。
【請求項6】
前記移動物体検出部は、当該移動物体検出装置が移動している場合に、前記地平線と繋がったエッジ画像によって前記前景をフィルタリングすることを特徴とする請求項5に記載の移動物体検出装置。
【請求項7】
動画像を入力し、
動画像から連続的に複数のフレーム画像を取り出し、
フレーム画像から地平線の下側のエッジ画像を抽出し、
地平線の下側のエッジ画像から背景差分法を用いて差分を抽出し、
フレーム画像をグレースケール画像にして背景差分法を用いて差分を抽出し、
前記グレースケール画像の差分と前記地平線の下側のエッジ画像の差分とを合成することによって前景を生成することを特徴とする移動物体検出方法。
【請求項8】
動画像を入力し、
動画像から連続的に複数のフレーム画像を取り出し、
フレーム画像から地平線と繋がったエッジ画像を抽出し、
フレーム画像をグレースケール画像にして背景差分法を用いて前景を抽出し、
動画像の撮影位置が移動している場合に、前記地平線と繋がったエッジ画像によって前記前景をフィルタリングすることを特徴とする移動物体検出方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、単眼カメラの動画像から移動物体を高い精度で高速に検出することが可能な移動物体検出装置および移動物体検出方法に関する。
【背景技術】
【0002】
現在、交通事故を未然に防ぐことを目的とした、多くの予防安全技術の研究開発が進められている。そのひとつに、交差点等での自動車と歩行者、自転車、自動車等との出合い頭の交通事故を防止する要請がある。そのようなシステムにおいては、車載センサや車載カメラを利用して移動物体を検出することが考えられる。
【0003】
車載センサを用いた物体検出技術としては、レーザーレンジセンサ等の補助装置を使用するシステムがある。しかしレーザー装置は高価である上に、強いレーザーを人体に照射することができないため、出力を上げにくいという問題がある。
【0004】
車載カメラを用いる場合、背景差分法を用いることが考えられる。背景差分法は高速に処理可能であり、動的なシーンの変化を用いた信頼性の高い手法である。しかし、物体が平坦なテクスチャを有する場合や、物体の一部が背景と似た色である場合には、物体の一部しか検出できない場合がある。
【0005】
特許文献1には、検出対象領域の候補が複数ある場合(顔部分と足部分)、検出対象領域が撮像画像中で占めるべき大きさを特定し、その大きさの範囲に、他の候補が含まれている場合、前記候補と他の候補とを結合した領域を新たな一の検出対象領域の候補として抽出する画像処理装置が提案されている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1の技術は、撮像画像中の検出対象領域の候補の位置に基づいて、占めるべき大きさを特定している。すると、まず検出対象の距離を判定する必要がある。特許文献1では撮像装置は交差点を俯瞰するように固定設置されている(段落0038、
図1)。この限定的な条件により画像上の位置から距離を測ることが可能となっているが、車載カメラの画像を基にした場合は距離を測ることは困難である。
【0008】
また特許文献1では、検出対象の種類(人物であるかどうか)を判定し、占めるべき大きさを特定する必要がある。このような判定は非常に不確実である。さらに、特許文献1では赤外線カメラを使用しているため肌が露出している部分が検出されるが、肌が見える面積は人物の向きや、服装、髪型により全く異なる点でも、不確実性が増してしまう。
【0009】
また、赤外線カメラではなく安価な単眼カメラを用いたり、さらに広範囲を撮影するために魚眼レンズや広角レンズを用いた場合には、赤外線カメラを用いた場合よりもノイズが大きくなる可能性がある。
【0010】
これに対し出願人らは、特願2017-178431において、単眼カメラの動画像から移動物体を高い精度で高速に検出することが可能な、安価で安全性の高い移動物体検出装置および移動物体検出方法を提案している。そして本発明は、特願2017-178431をさらに改良し、さらに検出率を向上させた移動物体検出装置および移動物体検出方法を提供することを目的としている。
【課題を解決するための手段】
【0011】
上記課題を解決するために、本発明にかかる移動物体検出装置の代表的な構成は、動画像を入力する入力部と、動画像から連続的に複数のフレーム画像を取り出すフレーム取得部と、フレーム画像において地平線を検出する地平線検出部と、フレーム画像からエッジ画像を生成するエッジ画像生成部と、移動物体に検出枠を設定する移動物体検出部とを備え、エッジ画像生成部は、地平線検出部が検出した地平線の下側のエッジ画像を抽出し、地平線の下側のエッジ画像から背景差分法を用いて差分を抽出し、移動物体検出部は、フレーム画像をグレースケール画像にして背景差分法を用いて差分を抽出し、グレースケール画像の差分と地平線の下側のエッジ画像の差分とを合成することによって前景を生成することを特徴とする。
【0012】
上記構成によれば、移動物体が地面と接している部分の画像位置を正確に検出することができる。このため、物体が平坦なテクスチャを有する場合や、ゆっくりと移動する場合であっても、物体の全体を前景として検出することができ、検出率を向上させることができる。したがって単眼カメラの動画像から移動物体を高い精度で高速に検出することができ、安価に安全性の向上を図ることができる。
【0013】
移動物体検出部は、地平線の下側のエッジ画像の差分のノイズが少ない場合に、グレースケール画像の差分と合成することが好ましい。
【0014】
エッジ画像生成部は、地平線検出部が検出した地平線と繋がったエッジ画像を抽出し、移動物体検出部は、地平線と繋がったエッジ画像によって前景をフィルタリングすることが好ましい。上記構成によれば、道路や建物の境界をノイズとして除去することができる。
【0015】
移動物体検出部は、移動物体検出装置が移動している場合に、地平線と繋がったエッジ画像によって前景をフィルタリングすることが好ましい。移動物体検出装置が移動する場合には、道路と建物の画像位置が変化するため、背景差分法におけるノイズが増加する。したがって、移動している場合に上記のフィルタリングを行うことにより、ノイズを大幅に減少させることができる。
【0016】
本発明にかかる移動物体検出装置の他の代表的な構成は、動画像を入力する入力部と、動画像から連続的に複数のフレーム画像を取り出すフレーム取得部と、フレーム画像において地平線を検出する地平線検出部と、フレーム画像からエッジ画像を生成するエッジ画像生成部と、移動物体に検出枠を設定する移動物体検出部とを備え、エッジ画像生成部は、地平線検出部が検出した地平線と繋がったエッジ画像を抽出し、移動物体検出部は、フレーム画像をグレースケール画像にして背景差分法を用いて前景を抽出し、前景を地平線と繋がったエッジ画像によってフィルタリングすることを特徴とする。
【0017】
本発明にかかる移動物体検出方法の代表的な構成は、動画像を入力し、動画像から連続的に複数のフレーム画像を取り出し、フレーム画像から地平線の下側のエッジ画像を抽出し、地平線の下側のエッジ画像から背景差分法を用いて差分を抽出し、フレーム画像をグレースケール画像にして背景差分法を用いて差分を抽出し、グレースケール画像の差分と地平線の下側のエッジ画像の差分とを合成することによって前景を生成することを特徴とする。
【0018】
上記方法によれば、移動物体が地面と接している部分の画像位置を正確に検出することができる。このため、物体が平坦なテクスチャを有する場合や、ゆっくりと移動する場合であっても、物体の全体を前景として検出することができ、検出率を向上させることができる。上記移動物体検出装置と同様の技術的思想を、当該移動物体検出方法にも適用することができる。
【0019】
本発明にかかる移動物体検出方法の他の代表的な構成は、動画像を入力し、動画像から連続的に複数のフレーム画像を取り出し、フレーム画像から地平線と繋がったエッジ画像を抽出し、フレーム画像をグレースケール画像にして背景差分法を用いて前景を抽出し、前景を地平線と繋がったエッジ画像によってフィルタリングすることを特徴とする。
【0020】
上記方法によれば、道路や建物の境界をノイズとして除去することができる。特に、移動物体検出装置が移動している場合に、ノイズを大幅に減少させることができる。上記移動物体検出装置と同様の技術的思想を、当該移動物体検出方法にも適用することができる。
【発明の効果】
【0021】
本発明によれば、移動物体が地面と接している部分の画像位置を正確に検出することができる。このため、物体が平坦なテクスチャを有する場合や、ゆっくりと移動する場合であっても、物体の全体を前景として検出することができ、検出率を向上させることができる。したがって単眼カメラの動画像から移動物体を高い精度で高速に検出することが可能な、安価で安全性の高い移動物体検出装置および移動物体検出方法を提供することができる。
【図面の簡単な説明】
【0022】
【
図1】本実施形態にかかる移動物体検出装置の全体構成を説明する図である。
【
図2】本実施形態にかかる移動物体検出方法を説明するフローチャートである。
【
図3】移動物体の検出の手順を説明するフローチャートである。
【
図4】前景の抽出の手順を説明するフローチャートである。
【
図6】エッジ画像(E)の生成を説明する画像例である。
【
図7】地平線下側のエッジ画像(BE)の抽出を説明する画像例である。
【
図8】地平線下側のエッジ画像(BE)の背景との差分(DBE)の抽出を説明する画像例である。
【
図9】エッジ画像のノイズ除去を説明する画像例である。
【
図10】エッジ画像(RBDBE)の合成を説明する画像例である。
【
図11】地平線と繋がったエッジ画像(CE)を説明する画像例である。
【
図12】二値化画像(BDG’)のフィルタリングを説明する画像例である。
【
図13】前景の膨張と収縮を説明する画像例である。
【
図14】検出枠の設定について説明する画像例である。
【
図16】検出枠のフィルタリング処理を説明する画像例である。
【
図17】背景画像の生成について説明する画像例である。
【
図18】地平線を用いたフィルタリング処理について説明する画像例である。
【
図19】遺伝的アルゴリズムの条件等を説明する図である。
【
図20】遺伝的アルゴリズムのフローチャートである。
【
図21】遺伝的アルゴリズムの目的関数を説明する図である。
【発明を実施するための形態】
【0023】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値などは、発明の理解を容易とするための例示に過ぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書および図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0024】
本発明にかかる移動物体検出装置および移動物体検出方法の実施形態について説明する。
図1は本実施形態にかかる移動物体検出装置100の全体構成を説明する図である。
図2は本実施形態にかかる移動物体検出方法を説明するフローチャートである。
【0025】
図1(a)に示すように、移動物体検出装置100は自動車10に搭載される車載システムである。代表的な例として、自動車10の車載カメラ12が撮影した動画像が移動物体検出装置100に入力されて、移動物体を検出する。移動物体検出装置100によって検出された移動物体の情報は、ブレーキングシステム14や不図示のモニター等に送られて利用される。
【0026】
車載カメラ12は、安価な単眼カメラであり、一般的な動画像を撮影する。動画像はカラー画像であってもよいし、グレースケール画像(モノクローム画像)であってもよい。また車載カメラ12は、魚眼レンズや広角レンズを備えていてもよい。本発明によれば、単眼カメラの動画像からでも、後述するように移動物体を高い精度で高速に検出することが可能であるため、安価で安全性の高い移動物体検出装置および移動物体検出方法を提供することができる。
【0027】
図1(b)には移動物体検出装置100の構成が示されている。移動物体検出装置100は具体的にはコンピュータシステムで構築することができる。以下、移動物体検出装置100の構成について、
図2に示すフローチャートを参照しながら説明する。
【0028】
入力部110には、車載カメラ12が撮影した動画像が入力される(ステップ210)。動画像が映像信号である場合にはコンポジット端子やHDMI(登録商標)端子を備えるビデオエンコーダチップが入力部110に該当する。動画像がエンコードされたデジタルデータになっている場合にはUSBやIEEE1394インターフェースが入力部110に該当する。いずれにしても入力部110は、移動物体検出装置100内で処理可能なように動画像のデータを入力できればよい。
【0029】
フレーム取得部112は、入力された動画像から連続的に複数のフレーム画像(静止画)を取得する(ステップ212)。動画像からフレームを取得する具体的な処理は、動画像のフォーマットに依存する。例えば動画像がMotionJPEGのように静止画を配列したフォーマットであれば、単純に各フレームを抜き出せばよい。なお、動画像のfps(frame per second)に依存することなく、一定時間単位(例えば0.1秒単位)で抜き出してもよい。MPEGのように差分圧縮されているものは、GOP(Group Of Pictures)のIフレームごとに抜き出してもよい。
【0030】
前処理部114は、取得したフレーム画像に対して前処理を行う(ステップ214)。本実施形態では、入力される動画像がカラー画像であり、前処理としてグレースケール画像に変換する。なお前処理としては、必要に応じてノイズ除去を行ったり、画像処理の対象となる領域を切り出すクロップ処理を行ってもよい。
【0031】
移動物体検出部118は、処理対象となるフレーム画像を現フレームとしたとき、現フレームから背景差分法を用いて移動物体を検出し、その検出枠を設定する(ステップ216)。なお以下の説明において、処理対象となるフレームの前のフレームを「前フレーム」と称し、次のフレームを「次フレーム」と称する。
【0032】
図3は移動物体の検出の手順(サブルーチン)を説明するフローチャート、
図4は前景の抽出の手順(ステップ232)を説明するフローチャートである。
【0033】
図4に示すように、移動物体検出部118は、現フレームのグレースケール画像の背景との差分(DG)の抽出を行う(ステップ250)。
図5は背景差分法の画像例である。
図5(a)に示す現フレームの画像において、画像中央に地平線があり、右側に歩行者と建物がある。また地平線に沿って植え込みやフェンスが写っている。この中では、歩行者が移動物体である。
【0034】
図5(b)に示す背景画像は、後述する背景画像生成部116から取得する。背景画像においても移動物体は写っているが、位置が少しずつ異なっている。これらの画像に背景差分法を適用する(輝度の減算を行う)と、
図5(c)に示す差分画像のように、差異のある画素が抽出される。この差異のある画素が前景である。
【0035】
背景差分法によって抽出した前景は、輝度が低く、また細かく分断された状態である。そこで、ガウシアンフィルタ等による平滑化(ぼかし処理)を行って近接する前景を連結した後に、二値化画像(BDG)を生成して明瞭化する(ステップ252)。
【0036】
移動物体検出部118は、グレースケール画像の処理と並行して、エッジ画像(E)の処理を行う。
図6はエッジ画像(E)の生成を説明する画像例である。エッジ画像生成部122は、
図6(a)に示すフレーム画像において隣接する画素との画素値が閾値以上である場合に1、閾値未満である場合に0として、
図6(b)に示すようなエッジ画像(E)を生成する(ステップ254)。エッジ画像の生成は、輪郭抽出処理ともいう。
【0037】
次にエッジ画像生成部122は、地平線下側のエッジ画像(BE)を抽出する(ステップ256)。地平線は、地平線検出部124によって現フレームの画像から遺伝的アルゴリズムを用いて検出する。地平線を検出する処理については後述する。
【0038】
図7は地平線下側のエッジ画像(BE)の抽出を説明する画像例である。
図7(a)に示すエッジ画像(E)において地平線検出部124が検出した地平線HLを引く。そして、
図7(b)に示すように地平線HLの下側のエッジ画像(BE)を抽出する(ステップ258)。
【0039】
図8は地平線下側のエッジ画像(BE)の背景との差分(DBE)の抽出を説明する画像例である。背景画像生成部116は、
図8(a)に示すような地平線下側のエッジ画像(BE)を用いて、
図8(b)に示すような背景画像を生成する。そしてエッジ画像生成部122は、
図8(c)に示すようにエッジ画像(BE)の背景との差分(DBE)を得る。
【0040】
エッジ画像は粗であるため、エッジ画像の背景との差分(DBE)においてもノイズが多い。
図9はエッジ画像のノイズ除去を説明する画像例である。エッジ画像生成部122は、
図9(a)に示すようなエッジ画像の背景との差分(DBE)に対し、
図9(b)に示すように二値化処理を行って二値化画像(BDBE)を生成する。さらに膨張と収縮を行って、
図9(c)に示すようなノイズ除去した地平線下側のエッジ画像(RBDBE)を得る(ステップ260)。膨張と収縮については、
図13を用いて後に説明する。
【0041】
移動物体検出部118は、グレースケール画像の二値化画像(BDG)と、ノイズ除去した地平線下側のエッジ画像(RBDBE)を合成する。ただし、ノイズ除去したとはいえ、エッジ画像(RBDBE)においては、まだノイズが多すぎる可能性がある。
【0042】
そこで移動物体検出部118は、ノイズ除去した地平線下側のエッジ画像(RBDBE)のノイズの程度を判定する(ステップ262)。
図10はエッジ画像(RBDBE)の合成を説明する画像例である。
図10に示すように、エッジ画像(RBDBE)が高ノイズであった場合には(ステップ262のYES)、合成をせず、二値化画像(BDG’)にはグレースケール画像の二値化画像(BDG)をそのまま使用する(ステップ264)。エッジ画像(RBDBE)のノイズが少ない場合には(ステップ262のNO)、二値化画像(BDG’)はグレースケール画像の二値化画像(BDG)とエッジ画像(RBDBE)を合成したものとする(ステップ266)。
【0043】
上記構成によれば、移動物体が地面と接している部分の画像位置を正確に検出することができる。このため、物体が平坦なテクスチャを有する場合や、ゆっくりと移動する場合であっても、物体の全体を前景として検出することができ、検出率を向上させることができる。したがって単眼カメラの動画像から移動物体を高い精度で高速に検出することができ、安価に安全性の向上を図ることができる。
【0044】
上記のようにして生成した二値化画像(BDG’)を、そのまま前景(EF)としてもよい。しかし本実施形態においては、さらに検出率を向上させるために、地平線と繋がったエッジ画像によって前景をフィルタリングする。
【0045】
上記説明において、移動物体検出部118は、エッジ画像(E)を生成すると(ステップ254)、地平線下側のエッジ画像(BE)の抽出した(ステップ256)。これと並行して、エッジ画像(E)から地平線と繋がったエッジ画像(CE)を抽出する(ステップ270)。
【0046】
図11は地平線と繋がったエッジ画像(CE)を説明する画像例である。
図11(a)は、
図6(b)および
図7(a)と同じエッジ画像(E)である。このエッジ画像(E)において、地平線検出部124が検出した地平線と繋がった画素のみを抽出すると、
図11(b)に示すように地平線と繋がったエッジ画像(CE)を得ることができる。
図11(c)は画素を抽出するための条件式の例である。
【0047】
そして移動物体検出部118は、自動車10が移動しているかどうか、すなわち移動物体検出装置100が移動しているかどうかについて判定する(ステップ272)。移動物体検出装置が移動する場合には、道路と建物の画像位置が変化するため、これらの輪郭の位置にずれが生じて、背景差分法においてエッジを検出してしまう。道路と建物の境界は移動物体ではないため、これらのエッジはノイズである。
【0048】
図12は二値化画像(BDG’)のフィルタリングを説明する画像例である。
図12に示すように、自動車10が移動していない場合には(ステップ272のNO)、二値化画像(BDG’)をそのまま前景(EF)とする(ステップ276)。自動車10が移動している場合には(ステップ272のYES)、二値化画像(BDG’)と地平線と繋がったエッジ画像(CE)のAND処理を行う(共通する画素のみを残す)ことによってフィルタリングする(ステップ274)。
【0049】
上記構成によれば、移動物体検出装置が移動している場合に生じる道路や建物の境界のエッジを、ノイズとして除去することができる。したがってノイズを大幅に減少させることができ、さらに移動物体の検出率を向上させることが可能となる。
【0050】
次に移動物体検出部118は、前景(EF)から、ノイズ除去を行う(ステップ278)。
図13は前景の膨張と収縮を説明する画像例である。
図13これでもまだ中抜けや細かな分断があるため、
図13(b)に示すように前景の膨張を行った後に、
図13(c)に示すように前景の収縮を行う(ステップ236)。
【0051】
膨張とは、背景画素が黒、前景が白として、フィルタ径を例えば5×5とすると、総ての白い画素を中心とするフィルタ径内の画素を白にする処理である。収縮はその逆で、総ての黒い画素を中心とするフィルタ径内の画素を黒にする処理である。膨張と収縮を行うと、外縁の輪郭は元の位置に戻るものの、膨張によって埋められた中抜けや分断(不連続)は収縮しても埋められたままであるので、近接する前景同士を連結することができる。
【0052】
ここで、冒頭で説明したように、背景差分法においては物体が平坦なテクスチャを有する場合や、物体の一部が背景と似た色である場合には、背景画像と現フレームの画像で輝度差が生じないため、物体の一部しか検出できない場合がある。この場合、前景が離れて存在するため、上記のような平滑化や、膨張と収縮だけでは、前景同士を連結することはできない。そこで本発明においては、次に述べる候補枠の統合と分離を行う。
【0053】
統合とは、本来1つの移動物体であるものを、誤検出により複数の検出枠として抽出されたものであると判定して、1つの検出枠にする処理である。分離とは、近接する検出枠を、近接する複数の移動物体であると判定して独立した検出枠とする処理である。
【0054】
図14は検出枠の設定について説明する画像例である。移動物体検出部118は、抽出した前景の輪郭を検出して、
図14(a)に示すように前景を囲う枠を1次候補枠150a~fとする(ステップ238)。そして移動物体検出部118は、記憶部120から前フレームの検出枠を取得する(ステップ240)。なお、現フレームにおいてまだ前フレームの検出枠が存在しない場合には、この統合と分離の処理(ステップ240 ~ステップ244)はスキップする。
【0055】
そして移動物体検出部118は、
図14(a)に示す1次候補枠150a~fのうち、
図14(b)に示すように前フレームの検出枠152a~cと面積が所定以上(例えば50%以上)重なるものを2次候補枠154a~dに設定する(ステップ242)。
図14(b)において前フレームの検出枠152は一点鎖線で示し、2次候補枠154は破線で示している。1次候補枠150a~fのうち、2次候補枠にならなかった1次候補枠150e、150fは、そのまま検出枠となる(「検出枠」は、候補ではない)。
【0056】
移動物体検出部118は、2次候補枠154のうち、同じ前フレームの検出枠152と重なるものをグループ化する。
図14(b)において左側にある前フレームの検出枠152aには2次候補枠154a、154bが重なっているため、これらをグループ化する。そして、グループ化された2次候補枠154a、154bのうち、
図14(c)に示すように、y軸方向に所定以上(例えば30%以上)重なるものは統合した検出枠156aとする。y軸方向に所定以上重ならないものは分離(独立)した検出枠とする(ステップ244)。なお「y軸方向に所定以上重なる」とは、枠のx軸方向の座標の範囲が所定以上重複していることと同義である。
【0057】
上記を整理すると、「検出枠」となるのは次の3通りである。
・1次候補枠のうち、2次候補枠にならなかったもの(150e、150f)
・2次候補枠のうち、統合したもの(156a)
・2次候補枠のうち、統合せずに分離したままのもの(154c、154d)
なお、グループ化された2次候補枠が多数ある場合には、複数の統合した検出枠が設定される場合がある。例えば1つのグループに2次候補枠が4つある場合に、2つずつ統合されて、2つの検出枠が設定される場合がある。
【0058】
図15は統合と分離を説明する他の画像例であり、重なって見えていた2人の歩行者が離れていくときの処理例である。
図15(a)は現フレームの画像である。道路上に2人の歩行者が歩いている。
図15(b)は現フレームにおいて抽出した前景を示していて、現フレームの中央部に対応している。右側の人物の前景は1つの1次候補枠150gになっているが、左側の人物の前景は上下で切れた2つの1次候補枠150h、150iになっている。2人の歩行者についての前景のブロックは合計3つである。
図15(c)は前フレームにおいて抽出した前景および検出枠を示している。前フレームでは2人の歩行者がまだ重なって見えていたため、2人で1つの大きな検出枠152dとなっている。
【0059】
そして移動物体検出部118は、
図15(d)に示すように、1次候補枠150に前フレームの検出枠152dを重ねて、面積が所定以上重なるものを2次候補枠に設定する。本例では3つの1次候補枠150g~iは、総て3つの2次候補枠154e~gとなる。また、3つの2次候補枠154e~gは同じ前フレームの検出枠152dに重なっているから、これらはグループ化される。
【0060】
図15(d)において2次候補枠154f、154gはy軸方向に所定以上重なっているから、
図15(e)に示すように統合した検出枠156bとする。2次候補枠154eはy軸方向に所定以上重なっていないから、統合せずに分離したままとする。結果として、
図15(f)に示すように、2人の歩行者にそれぞれ検出枠(2次候補枠154e、統合した検出枠156b)が設定される。なお、重なり度合いを判定するとき、2つの候補枠のx軸方向に重複する大きさ(長さ)を、2つの候補枠のうちx軸方向の大きさが小さい方と比較するとよい。
【0061】
このようにして、3つの前景を適切に統合して、2つの移動物体に検出枠を設定することができる。また同時に、前フレームでは1つであった検出枠を現フレームでは2つの検出枠に分離することができる。
【0062】
図16は検出枠のフィルタリング処理(ステップ246)を説明する画像例である。
図16(a)は統合と分離が終了した後の検出枠を示している(
図14(c)参照)。
図16(a)において、画像左側の自転車に乗った人物は統合した検出枠156aとなり、画像中央の2台の自動車は2次候補枠154c、154dとして検出されている。そして1次候補枠150e、150fは、検出枠として残っているものの、極端に小さいため、ノイズと考えることができる。
【0063】
そこで本実施形態においては、フィルタ部126が、現フレームにおいて検出された1または複数の検出枠に対し、所定の面積または縦横比を満たさない検出枠を除去する(ASF:Area Size Filtering)。すなわち、極端に小さい検出枠や、極端に細長い検出枠を除去する。
【0064】
図16(b)の例では、フィルタリング処理によって極端に小さな検出枠(1次候補枠150e、150f)が除去されて、統合した検出枠156a、2次候補枠154c、154dが残っている。なお
図16(b)では、これらの最終的な検出枠を、二値画像ではなく現フレームのグレースケール画像に重ねて示している。
【0065】
動画像が移動しながら撮影されたものであること、単眼カメラの画像であること、さらに魚眼レンズや広角レンズを使用することは、ノイズが増える要因となる。そこで上記のフィルタリング処理を行うことにより、ノイズを除去して、移動物体の検出精度を向上させることができる。
【0066】
移動物体検出部118は、フィルタ部126がフィルタリング処理を施した最終的な検出枠を、記憶部120に登録する(ステップ218)。検出枠はフレームの番号と対応付けて記憶され、任意のフレームの画像に対して検出済みの検出枠を読み出すことができる。特に、上記説明において現フレームの画像処理に前フレームの検出枠を利用したように、次フレームの画像処理に現フレームの検出枠を利用する。また移動物体検出装置100が設定した検出枠は、出力部130によってブレーキングシステム14や不図示のモニター等に送られる。
【0067】
背景画像生成部116は、次フレームの画像を処理するときのために、背景画像の生成(更新)を行う(ステップ220)。フレーム取得部112が取得した複数のフレーム画像のうち、1番目のフレーム画像は前景の抽出は行われず、背景画像としてのみ用いられる。2番目のフレーム画像から前景の抽出を行うとき、1番目のフレーム画像が背景画像に用いられる。3番目以降のフレーム画像から前景の抽出を行うとき、背景画像生成部116が生成(更新)した背景画像を用いる。
【0068】
図17は背景画像の生成について説明する画像例である。背景画像生成部116は、背景画像と現フレームの画像を合成して背景画像を更新し、次フレームを処理する際の背景画像とする。具体例として、
図17に示すように、現フレームの輝度を25%に落とした画像と背景画像の輝度を75%に落とした画像を合成して背景画像を生成する。このようにして順繰りに背景画像の合成(更新)を行うことにより、移動しながら撮影された動画像であっても、また移動物体が存在しない状態がない動画像であっても、背景画像を適宜生成することができる。
【0069】
また、背景差分法において、学習に基づいた背景モデルの更新は計算コストが高いため、高速な動画像処理に応用が困難であるとされてきた。しかし本実施形態のように過去の背景画像と現フレームの画像を組み合わせることは、計算量が少なくて済むため、システム全体として計算コストの効率化を図ることができる。
【0070】
背景画像の生成が完了すると、次のフレーム画像があるか否かを判定する(ステップ222)。次フレームの画像があれば上記一連の処理を繰り返す。次フレームの画像がなければ処理を終了する。
【0071】
上記説明したように、本実施形態にかかる移動物体検出装置および移動物体検出方法によれば、現フレームの候補枠に対して、前フレームの検出枠と重なった範囲内で統合と分離を行う。移動物体の種類や距離を判定する必要がなく、またノイズが多くても候補枠の統合と分離を行うことができる。
【0072】
これにより安価な単眼カメラの画像であっても、そして車載カメラのように移動しながら撮影した画像であっても、移動物体に適切に対応した検出枠を設定することができる。また、背景差分法は高速に処理可能であり、また上記の候補枠の統合と分離の処理やフィルタリング処理も高速に処理可能である。したがって、接近する移動物体を高い精度で高速に検出することができ、安全性の向上を図ることができる。
【0073】
特に、統合と分離のアルゴリズムがシンプルであるため、従来の単なる背景差分法と比較すると、移動物体の検出率を大幅に上げたにもかかわらず、計算量の増加が少ない。従来技術と比較して本手法は実用性が高く、技術的な優位性も十分に高い。また本発明では1つの単眼カメラだけを使用するため、複数のカメラやレーザーレーダや赤外カメラ等を使用するような従来手法と比較すると、コスト面で大きな優位性がある。
【0074】
本発明は、出合い頭における交通事故を防ぐ車載の安全運転システムや、ロボットなどの移動装置の自動走行システムへの応用が可能である。また自動車やロボットなどに搭載されるシステムに限定されず、広角防犯カメラを用いた固定設置の監視システムに応用することもできる。
【0075】
上記実施形態においては、フィルタ部126が所定の面積または縦横比を満たさない検出枠を除去する(ASF)ように説明した。これに対し、ASFに代えて、またはASFに追加して、地平線検出部124が地平線を検出し、現フレームにおいて検出された1または複数の検出枠に対し、地平線に所定の割合で重なっていない検出枠を除去してもよい(HLF:Horizontal Line Filtering)。
【0076】
図18は地平線を用いたフィルタリング処理について説明する画像例である。
図18(a)は二値化画像と検出枠(統合と分離まで完了したもの)を示している。
図18(b)は現フレームのグレースケール画像にフィルタリング処理後の検出枠を重ねて示している。
【0077】
図18(a)を
図18(b)と対比するとわかるように、車載カメラなどで移動しながら撮影した動画像においては、下方については道路標示や横断歩道(横断歩道の検出枠160b)、上方については建物や看板、信号機、電線、街路灯など(看板の検出枠160c、電線の検出枠160d、街路灯の検出枠160e)も移動物体として検知してしまう可能性がある。しかし本発明において検出したい移動体は、歩行者や自動車など地上を移動するもの(自動車の検出枠160a)である。
【0078】
そこで
図18(c)に示す判定式のように、総ての検出枠160について、地平線HLによって分断される面積a、bを取得し、地平線HLに所定の割合で重なっていない検出枠を除去する。本実施形態では、判定式:|a-b|/(a+b)≦0.6となる検出枠を残し(Correct=1)、それ以外の検出枠は除去する(Correct=0)。
【0079】
判定式の具体例として、地平線HLが検出枠の中央を通るとき、a=bであるから判定式の値は0となり、Correct=1となってその検出枠160は残る。地平線HLが検出枠に重ならないとき、判定式の値は1となり、Correct=0となってその検出枠160は除去される。
【0080】
なお閾値を0.6としたのは一例であって、閾値の数値は適宜定めてよい。例えば|a-b|/(a+b)<1としてもよい。この場合、検出枠に地平線HLが全く重なっていない検出枠のみが除去される。
【0081】
このようにして、移動体でない検出枠160を適切かつ高速な処理で除去することができる。これにより危険回避のために検出したい移動物体の検出精度を高めることができる。
【0082】
地平線を検出するための手法はさまざまなものが考えられるが、本実施形態では地平線の検出に遺伝的アルゴリズムを用いて地平線を検出する。遺伝的アルゴリズムは常に局所的に良好な解を複数保持しながら解の改良を図る多点探索であることから、大域的に最良の解を探索しうるため、最も好ましい方法である。これにより、建物や道路の形状に邪魔されて簡単にはわかりにくい地平線を、高い精度で検出することができる。
【0083】
図19は遺伝的アルゴリズムの条件等を説明する図である。以下に説明する地平線の検出を簡潔に説明すると、路面とそれ以外(建物等の構造物や空など)との境界線を遺伝的アルゴリズムによって検出することにより、これを地平線とする。P
i(x
i,y
i)は地平線上のi番目のピクセル(点)である。x
iは地平線上のi番目の点のx座標である。y
iは地平線上のi番目の点のy座標であり、ベースラインの高さB+定数a+変数b
iで表される。そして、a,b
0,b
1,…b
Mを遺伝的アルゴリズムの染色体とする。
【0084】
図20は遺伝的アルゴリズムのフローチャートである。フィルタ部126は、まず所定の初期値を用いてアルゴリズムを初期化する(ステップ250)。アルゴリズムの初期値は、一例として、世代数50、初期個体数50、交叉レート0.7、突然変異レート0.01としてよい。
【0085】
次に初期個体に仮パラメータを与えて、地平線の候補線を生成する(ステップ252)。遺伝的アルゴリズムのロジックに基づいて交叉と突然変異を繰り返しながら、候補線の目的関数に対する適合度の評価を行う(ステップ254)。なお、遺伝的アルゴリズムにおける交叉と突然変異については既知の技術であるため、ここでの詳述は省略する。
【0086】
図21は遺伝的アルゴリズムの目的関数を説明する図である。目的関数Fは、閾値を超えるピクセル値の差が認められるピクセルDiff(j,x)の個数である。jは評価幅であり、評価範囲Lが最大値である。xはピクセルP
i(x
i,y
i)とP
i+1(x
i+1,y
i+1)の中間位置のx座標である。y
xはピクセルPのy座標を線形補間(1次方程式)によって表したxの関数である。
【0087】
i番目のピクセルPi(xi,yi)のピクセル値(グレースケール値)をP(xi,yi)と表す。差が認められるピクセルDiff(j,x)の判定は、ピクセル値の差|P(x,yx+j)-P(x,yx-j)|が閾値以上であれば1、閾値未満であれば0とする。DiffTB(j,x)は、y軸方向に上下2j離れた位置のピクセル値を比較して、閾値以上にピクセル値(グレースケール値)が異なっていれば1となる。したがって目的関数Fは、染色体a,b0,b1,…bMによって形成する地平線が路面とそれ以外との境界線に沿っているほど値が大きくなる。換言すれば、この遺伝的アルゴリズムによる地平線検出は、路面の上縁の輪郭抽出である。
【0088】
また評価関数FにあるDiffTN、DiffBNは、それぞれP(x,yx-j)、P(x,yx+j)と隣の(次の)ピクセルとでピクセル値を比較している。これにより評価関数Fは、水平線(横線)のみでなく建物等の輪郭(縦線)にさしかかった場合も値が大きくなる。横線と縦線の交点で値が高くなるため、すなわち建物と地面との交点で値が高くなる。これにより地平線検出の精度を向上させることができる。
【0089】
フィルタ部126は、所定の世代数の計算を終えると、選択された候補線を地平線として出力する(ステップ256)。出力された地平線は、
図18(c)で説明した判定式に使用する。
【0090】
そしてフィルタ部126は、次フレームがあるか否かを判定し(ステップ258)、次フレームがあれば遺伝的アルゴリズムによる地平線検出を繰り返し、次フレームがなければ地平線検出の処理を終了する。
【0091】
遺伝的アルゴリズムを用いた地平線の検出は、1枚の画像に対して処理を行うことが可能である。この場合、総てのフレームに対して処理を行ってもよいが、一定時間おきのフレームに対して行うことによって大幅に高速化を図ることができる。また、画像に変化がない間は一定時間おきに処理し、画像が大幅に変化したときにも処理を行うことにより、処理の高速化と精度の向上を図ることができる。
【0092】
また、加速度センサを搭載したり、ナビゲーションシステムから加速度センサの信号を受け取れるのであれば、角を曲がったときや上り下りが変化したときにも処理してよい。これにより地平線の変化に追従しやすくなり、検出精度の向上を図ることができる。
【0093】
また遺伝的アルゴリズムを用いた地平線の検出は、前フレームの演算結果を用いる(前フレームの画像を用いるのではない)ことによって高速化と精度の向上を図ることができる。具体的には、前フレームにおいて算出した最適解を含む遺伝的アルゴリズムのすべての個体の染色体情報を初期個体集団の初期の染色体として用いて演算を行う(進化的動画像処理)。特に総てのフレームに対して処理を行うとき、または短時間おきのフレームに対して処理を行うときには、画像内での地平線の移動はわずかであるため、前フレームの演算結果を用いれば最適解までの収束が極めて短時間となる。したがって、車載コンピュータのCPUでもリアルタイム処理に十分な速度で演算することができ、地平線を検出しつづけることが可能となる。
【0094】
上記のように、地平線に所定の割合で重なっていない検出枠を除去することにより、移動物体の検出精度を高めることができる。また、地平線の検出に遺伝的アルゴリズムを用いることにより、地平線を高い精度で検出することができる。
【産業上の利用可能性】
【0095】
本発明は、単眼カメラの動画像から移動物体を高い精度で高速に検出することが可能な、安価で安全性の高い移動物体検出装置および移動物体検出方法として利用することができる。
【符号の説明】
【0096】
10…自動車、12…車載カメラ、14…ブレーキングシステム、100…移動物体検出装置、110…入力部、112…フレーム取得部、114…前処理部、116…背景画像生成部、118…移動物体検出部、120…記憶部、122…エッジ画像生成部、124…地平線検出部、126…フィルタ部、130…出力部、150…1次候補枠、152…前フレームの検出枠、154…2次候補枠、156…統合した検出枠、160…検出枠