(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6571658
(24)【登録日】2019年8月16日
(45)【発行日】2019年9月4日
(54)【発明の名称】奥行分解された画像データからのオブジェクトを認識するための方法ならびに装置
(51)【国際特許分類】
G06T 1/00 20060101AFI20190826BHJP
G06T 7/00 20170101ALI20190826BHJP
G08G 1/015 20060101ALI20190826BHJP
G08G 1/16 20060101ALI20190826BHJP
【FI】
G06T1/00 330B
G06T7/00 C
G08G1/015 A
G08G1/16 C
【請求項の数】10
【全頁数】8
(21)【出願番号】特願2016-539421(P2016-539421)
(86)(22)【出願日】2014年9月4日
(65)【公表番号】特表2016-530639(P2016-530639A)
(43)【公表日】2016年9月29日
(86)【国際出願番号】DE2014200443
(87)【国際公開番号】WO2015032399
(87)【国際公開日】20150312
【審査請求日】2017年8月9日
(31)【優先権主張番号】102013217915.4
(32)【優先日】2013年9月9日
(33)【優先権主張国】DE
(73)【特許権者】
【識別番号】503355292
【氏名又は名称】コンティ テミック マイクロエレクトロニック ゲゼルシャフト ミット ベシュレンクテル ハフツング
【氏名又は名称原語表記】Conti Temic microelectronic GmbH
(74)【代理人】
【識別番号】100069556
【弁理士】
【氏名又は名称】江崎 光史
(74)【代理人】
【識別番号】100111486
【弁理士】
【氏名又は名称】鍛冶澤 實
(74)【代理人】
【識別番号】100173521
【弁理士】
【氏名又は名称】篠原 淳司
(74)【代理人】
【識別番号】100153419
【弁理士】
【氏名又は名称】清田 栄章
(72)【発明者】
【氏名】ティール・ローベルト
(72)【発明者】
【氏名】バッハマン・アレクサンダー
【審査官】
山田 辰美
(56)【参考文献】
【文献】
特開2012−168838(JP,A)
【文献】
特開2012−257107(JP,A)
【文献】
特開2009−037622(JP,A)
【文献】
米国特許第05410346(US,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06T 7/00−7/90
G08G 1/015
G08G 1/16
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
以下のステップを包含する、オブジェクトを認識するための方法:
− 3Dカメラの三次元画像から三次元的につながったオブジェクトを生成するステップ、
− 該三次元画像内に生成された三次元的につながったオブジェクト(1)に相当する、2D画像(5)の画像領域内の一又は複数のオブジェクト(2,3)を評価、分類するステップ、
− 2D画像内のオブジェクト(2,3)の分類に基づいて、クラス毎に異なる特徴のある3D寸法の割り当てを行うステップ、
− クラス毎に異なる特徴のある3D寸法を考慮し、三次元画像から生成された三次元的につながったオブジェクト(1)を、複数の個々の三次元的なオブジェクト(2;3)に分割するステップ。
【請求項2】
ドライバー・アシスタント・システムの3Dカメラや車載ステレオ・カメラにより三次元画像が、ドライバー・アシスタント・システムのモノレンズ・カメラセンサーにより2D画像(5)が、捕捉され、車両周辺部の少なくとも一部が重なり合っている領域を表している
ことを特徴とする請求項1に記載の方法。
【請求項3】
車載ステレオ・カメラの二つのカメラセンサーの一方のカメラセンサーがモノレンズ・カメラセンサーである
ことを特徴とする請求項2に記載の方法。
【請求項4】
少なくとも一つの3Dプレースホルダ(6)が、2D画像(5)内のオブジェクト(2, 3)の分類結果に基づいて、定められ、このオブジェクト用の前記3Dプレースホルダとして、三次元画像内において考慮される
ことを特徴とする請求項1乃至3のいずれか一項に記載の方法。
【請求項5】
3Dプレースホルダ(6)が、錐台であることを特徴とする請求項4に記載の方法。
【請求項6】
前記3Dプレースホルダ(6)が、3D画像捕捉及び/或いは2D画像捕捉並びにこれらの評価から生じる公差を考慮していることを特徴とする請求項4乃至5のうち何れか一項に記載の方法。
【請求項7】
前記3Dプレースホルダ(6)が、オブジェクトのクラス内における3D寸法の分布を考慮していることを特徴とする請求項4乃至6のうち何れか一項に記載の方法。
【請求項8】
該3Dプレースホルダ(6)が、三次元画像から生成された三次元的につながったオブジェクト(1)と比較され、類似する一致性が認められる場合、該三次元的につながったオブジェクトは、分割されないことを特徴とする請求項4乃至7のうち何れか一項に記載の方法。
【請求項9】
少なくとも一つの前記3Dプレースホルダ(6)を考慮したうえで、三次元画像から改めてオブジェクトが生成されるが、該3Dプレースホルダ(6)の境界を超えるオブジェクト生成が、困難にされていることを特徴とする請求項4乃至8のうち何れか一項に記載の方法。
【請求項10】
三次元画像を捕捉できるように構成された3Dカメラ、
三次元的につながったオブジェクトを該三次元画像から生成することができるように構成された第一オブジェクト生成ユニット、
2D画像(5)を撮影することができるように構成されたカメラセンサー、
三次元画像内の少なくとも一つの生成された三次元的につながったオブジェクト(1)に対応する、2D画像(5)の画像領域内の一または複数のオブジェクト(2,3)をクラス分類し、
2D画像内の分類されたオブジェクト(2,3)に基づいて、クラス毎に異なる特徴のある3D寸法の割り当てを行い、
三次元画像から生成された三次元的につながったオブジェクト(1)を、分類されたオブジェクト(2,3)のクラス毎に異なる特徴のある3D寸法を考慮した上で、複数の個々の三次元的なオブジェクト(2,3)に分割する
ことができるように構成された2D画像・評価・クラス分類ユニット、
を包含する、車両周辺部においてオブジェクトを認識するための装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特に3Dカメラやステレオ・カメラを備えたドライバー・アシスタント・システムにおいて用いられる、奥行分解された画像データからのオブジェクト認識方法ならびに装置に関する。
【背景技術】
【0002】
車載カメラを備えたドライバー・アシスタント・システムが、普及してきている。モノカメラに加え、3Dカメラやステレオ・カメラも使用されるようになった。ステレオ・カメラにおいては、双方のカメラセンサーの画像情報からピクセル毎の奥行情報を算出することも可能である。結果として得られる奥行画像は、カメラ前方の浮き出たオブジェクトを認識するために、クラスター化することができる。
【0003】
特許文献1には、少なくとも一つの周辺センサーを用いて、オブジェクトを捕捉し、その三次元的形状と寸法からクラス分類を実施する、少なくとも一つの車両周辺部にあるオブジェクトをクラス分類するための装置が、開示されている。
ここでは、その三次元的形状と寸法が、予め定められている、例えば、商用車、乗用車、単車、自転車、歩行者などのクラスにおいて特徴的な三次元的形状と寸法に合致しないオブジェクトに対する破棄クラスも考慮されている。
【0004】
しかし、例えば、周辺センサーの捕捉時や評価時のエラーによって、破棄クラスのオブジェクトとして分類され、破棄されたがために、ドライバー・アシスタント機能においては考慮されないが、実は重要なオブジェクトが、該破棄クラスに含まれる可能性は否めない。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】欧州特許第1652161号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
よって本発明が解決しようとする課題は、従来の技術における上記の問題や欠点を解消した、奥行分解された画像データからのオブジェクト認識の改善された方法を提供することである。
【課題を解決するための手段】
【0007】
本発明では、例えば、空間的に重なっているオブジェクトは、奥行情報だけからは、二つの独立したオブジェクトとしてではなく、一つの大きなオブジェクトとして認識されてしまうと言う問題が、出発点であった。このような大きな(合体した)オブジェクトは、三次元的形状を基にしても、大きさを基にしても、正しく分類することはできない。
【0008】
本発明に係るオブジェクト認識の方法は、以下のステップを包含している:
− 3Dカメラの奥行画像から少なくとも一つのオブジェクトを生成するステップ、
− 該少なくとも一つの生成されたオブジェクトに相当する、2D画像内のオブジェクトを評価、分類するステップ、
− 2D画像内のオブジェクトの分類を考慮し、奥行画像から生成された少なくとも一つのオブジェクトを、可能であれば、複数の個々のオブジェクトに分類するステップ。
【0009】
尚、該3Dカメラは、特にステレオ・カメラであることが好ましく、該2Dカメラは、双方のステレオ・カメラセンサーのうちの一方であることが好ましい。代案的3Dカメラとしては、例えば、タイム・オブ・フライト・カメラ、特に、光波混合センサー(Photonic Mixer Device, PMD)が好ましい。そして、これらの3Dカメラによって、三次元画像、或いは、奥行分解された画像、乃至、奥行画像が撮影される。該奥行分解された画像データ(奥行画像)からは、3次元的につながったオブジェクトが生成される。生成されたオブジェクトの空間的位置や広がりは、既知であるため、モノレンズ・カメラセンサーの結像特性を知っていれば、生成されたオブジェクトが映っている2D画像内の領域を割り出すことができる。少なくとも、2D画像の該領域は、評価され、そこに見つかった(2D)オブジェクトは、分類できる。2D画像における評価には、エッジ認識、彩度や色の分析、セグメント化、及び/或いは、パターン認識も、含まれることが好ましい。そしてこれに続いて、2Dオブジェクト生成が実施されることが好ましい。分類においては、2D画像データからの該オブジェクトは、様々なオブジェクト・クラスに割り当てられる。この割り当ては、確率データに基づいて実施されることもできる。例えば、「軽自動車」、「小型車」、「中型車」、「大型車」、「SUV」、「バン」、「単車」、「自転車」、「大人歩行者」、「子供」、「車椅子」などと言ったオブジェクト・クラスには、その平均的な3D寸法と、可能であれば、形状が割り当てられている。2D画像から得られるこの様なクラス毎に異なる特徴や3D寸法を考慮すれば、生成された(三次元)オブジェクトを、少なくとも二つの個々のオブジェクトに分割することが可能である。少なくとも、クラス毎に異なる特徴が、生成されたオブジェクトと十分に一致する限り、生成されたオブジェクトを検証することはできる。
【0010】
尚、奥行画像と2D画像は、車両周辺部の少なくとも部分的に重なった部分を示していることが好ましい。これは特に、周辺監視のための車載ステレオ・カメラの場合に、好ましい。奥行画像と2D画像は、少なくとも一つのドライバー・アシスタント機能用にデータを提供することが好ましい。既知のカメラベースのドライバー・アシスタント機能には、例えば、レーン逸脱警告機能(LDW, Lane Departure Warning)、レーン維持アシスト機能(LKA/LKS, Lane Keeping Assistance/System)、交通標識認識機能(TSR, Traffic Sign Recognition)、速度制限推奨機能(SLA, Speed Limit Assist)、自動ハイビーム制御機能(IHC, Intelligent Headlamp Control)、衝突警告機能(FCW, Forward Collision Warning)、降水認識/雨認識及び/或いはデイライト認識機能、自動縦方向制御機能(ACC, Adaptive Cruise Control)、駐車サポート機能並びに自動非常ブレーキ乃至緊急操舵機能(EBA, Emergency Brake Assist oder ESA, Emergency Steering Assist)などがある。
【0011】
ある好ましい実施形態においては、少なくとも一つの3Dプレースホルダが、2D画像内のオブジェクトの分類結果に基づいて、定められ、このオブジェクト用のプレースホルダとして、奥行画像内において考慮される。
【0012】
3Dプレースホルダとしては、錐台が好ましく用いられる。該錐台は、2D画像においてクラス分類されたオブジェクトの典型的な三次元寸法と、奥行画像から得られる距離から生成される。錐台の三次元的形状としては、遠近法に基づいて、先をカットしたピラミッド型を用いることもできる。
【0013】
ある好ましい実施形態によれば、3Dプレースホルダは、3D画像捕捉及び/或いは2D画像捕捉並びにこれらの評価から生じる公差を考慮している。三次元位置割出しにエラーがある、2D画像に例えばノイズがあるなどは、クラス分類において不正確さの原因になり得る。
【0014】
3Dプレースホルダは、オブジェクトのクラス内における3D寸法の分布も考慮することが好ましい。クラス「大人歩行者」では例えば、平均値1.70メートルを中心に、1.50から2.30メートルの範囲で分布し得る。
【0015】
奥行画像から生成された少なくとも一つのオブジェクトから3Dプレースホルダの領域が分離されることが好ましい。
【0016】
ある好ましい実施形態においては、少なくとも一つの3Dプレースホルダを考慮したうえで、奥行画像から改めてオブジェクトが生成されるが、該3Dプレースホルダの境界を超えるオブジェクト生成は、困難にしておく。この際、公差と分布も、異なる「難易度」を用いることによって考慮できる。
【0017】
好ましくは、該3Dプレースホルダは、奥行画像から生成された少なくとも一つのオブジェクトと比較され、対応する空間体積の類似する一致性が認められる場合、該オブジェクトは、分割されない。これにより、生成されたオブジェクトが、検証される。
【0018】
本発明は、更に、奥行画像を捕捉できるように構成された3Dカメラ、少なくとも一つのオブジェクトを該奥行画像から生成することができるように構成された第一オブジェクト生成ユニット、2D画像撮影用のカメラセンサー、奥行画像内の少なくとも一つの生成されたオブジェクトに対応する2D画像内のオブジェクトをクラス分類するための2D画像・評価・クラス分類ユニット、並びに、奥行画像内で生成された少なくとも一つのオブジェクトを、2D画像内のオブジェクトのクラス分類を考慮した上で、複数の個々のオブジェクトに分割するオブジェクト分割ユニットを包含する車両周辺部においてオブジェクトを認識するための装置にも関する。
【0019】
以下、本発明を、実施例と図面に基づいて詳しく説明する。
【図面の簡単な説明】
【0020】
【
図1】ステレオ・カメラによって撮影されたオブジェクトの奥行画像用の平行6面体を模式的に示す図である。
【発明を実施するための形態】
【0021】
唯一の図面は、ステレオ・カメラによって撮影されたオブジェクト(1)の奥行画像用の平行6面体を模式的に示している。該オブジェクトは、車椅子に乗っている女性(2)とバンなどの乗用車から構成されている。車椅子の女性(2)が、乗用車(3)の直前にいるため、即ち、双方の間に空間的な隔離が無いため、ステレオ・カメラの3D画像では、一つのオブジェクトとして割り出され、クラスター化される。
【0022】
図1の描写には、好ましくは、双方のステレオ・カメラセンサーのうちの一つによって撮影された2D画像(5)も含まれている。示されている2D画像(5)は、撮影するカメラの仮想画像レベル上にあり、ここでは、車椅子の女性(2)と乗用車(3)の少なくとも一部を包含している。奥行画像において割り出されたオブジェクト(1)に相当する2D画像の画像領域は、予め割り出すことができるため、2D画像では、この領域のみが分析される。2D画像における分析には、既知の二次元画像データ用の画像処理方法、特に、エッジ認識、彩度や色の分析、セグメント化、及び/或いは、パターン認識が、好ましい。尚、画像処理方法に、2D画像データに基づいたオブジェクト生成とオブジェクト・クラス分類も含まれることが好ましい。ここでは、2D画像におけるオブジェクト・クラス分類から、第一オブジェクトは、「車椅子の人」と分類され、第二オブジェクトに関しては、「乗用車」或いは「バン」として分類できるかもしれない。即ち、該第二オブジェクトは、乗用車が、2D画像内に完全には映っていないため、しかも、車椅子の女性によってその一部が覆われているため、分類できない可能性もある。しかしこれは、この方法にとってそれほど重要なことではない。
【0023】
次に、「車椅子の人」としてクラス分類が成功したオブジェクトに対しては、奥行画像用のプレースホルダ(6)が、生成される。この際、2D画像(5)内でクラス分類されたオブジェクト「車椅子の人」の大きさと、奥行画像から得られる距離、並びに、そのクラスにおいて典型的なオブジェクトの奥行から、錐台(6)が、セットされる。該錐台(6)では、3D捕捉の精度、2D画像のノイズ、及び/或いは、あるクラスに属するオブジェクトの平均寸法を中心としたオブジェクト寸法の分布などを含む公差と偏差も考慮される。これにより、該錐台(6)は、プレースホルダの役割を果たす。即ち、「車椅子の人」の典型的な空間的寸法を想定している。これらの寸法と、奥行画像から既知のカメラから各ピクセルまでの距離を用いることにより、該錐台は、ステレオ・カメラの空間的視野(4)への投影として割り出される。該錐台(6)は、視野(4)の遠近法において、この図では、先をカットしたピラミッドのような三次元の形状として模式的に示されている。
【0024】
該錐台(6)を用いることにより、空間における、該錐台外へ至るクラスター化用の接続は、パラメータ化できる方法によって困難にされている(7)。これにより、奥行画像においては分離が困難なオブジェクトであっても、空間内において明確に分離できる。このことは、本例の車椅子の女性(2)と乗用車のケースにおいてのみならず、歩行者のグループや、家の壁にもたれている人、密集して駐車されている複数の自動車、その他、空間的に重なり合っているオブジェクトの分解(オブジェクト・スプリッティング)においても同様に有効である。
【0025】
この方法は更に、認識されたオブジェクトを基にするドライバー・アシスタント機能に対して、例示されているシーンにおいて車椅子の女性(2)が、独立したオブジェクトとして信頼性高く認識され、続いて、同様の方法で、乗用車、乃至、バン(3)も認識されると言う長所を提供している。
【0026】
一方、このシーンの奥行画像からのみでは、実際に存在している双方のオブジェクト・クラスよりも空間的に広く、然るに、全くクラス分類できないと言う恐れのある一つのオブジェクト(1)しか認識できなかったであろう。即ち該オブジェクトが、「車椅子の人」として認識されないのであるから、ドライバー・アシスタント機能によって、車椅子の女性(2)を保護するような対策は、実施されなかったであろう。
【符号の説明】
【0027】
1 奥行画像から生成されたオブジェクト
2 車椅子の女性
3 乗用車
4 視野
5 2D画像
6 プレースホルダ/錐台
7 クラスター化の際に、困難にされた、錐台内への或いは錐台から外への接続