特開2015-187855(P2015-187855A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ タタ コンサルタンシー サービシズ リミテッドの特許一覧

特開2015-187855多範囲オブジェクト検出装置および方法
<>
  • 特開2015187855-多範囲オブジェクト検出装置および方法 図000008
  • 特開2015187855-多範囲オブジェクト検出装置および方法 図000009
  • 特開2015187855-多範囲オブジェクト検出装置および方法 図000010
  • 特開2015187855-多範囲オブジェクト検出装置および方法 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2015-187855(P2015-187855A)
(43)【公開日】2015年10月29日
(54)【発明の名称】多範囲オブジェクト検出装置および方法
(51)【国際特許分類】
   G06T 7/00 20060101AFI20151002BHJP
   G08G 1/16 20060101ALI20151002BHJP
【FI】
   G06T7/00 300G
   G06T7/00 200C
   G08G1/16 C
【審査請求】有
【請求項の数】12
【出願形態】OL
【外国語出願】
【全頁数】33
(21)【出願番号】特願2015-45865(P2015-45865)
(22)【出願日】2015年3月9日
(31)【優先権主張番号】794/MUM/2014
(32)【優先日】2014年3月7日
(33)【優先権主張国】IN
(71)【出願人】
【識別番号】510337621
【氏名又は名称】タタ コンサルタンシー サービシズ リミテッド
【氏名又は名称原語表記】TATA Consultancy Services Limited
(74)【代理人】
【識別番号】100137095
【弁理士】
【氏名又は名称】江部 武史
(74)【代理人】
【識別番号】100173532
【弁理士】
【氏名又は名称】井上 彰文
(74)【代理人】
【識別番号】100091627
【弁理士】
【氏名又は名称】朝比 一夫
(72)【発明者】
【氏名】マノジ シ―.アール.
(72)【発明者】
【氏名】ティヤガラジャン パラマシヴァム
(57)【要約】      (修正有)
【課題】車両からの多数の範囲に位置する複数のオブジェクトを検出する装置及び方法を提供する。
【解決手段】複数のオブジェクト1、2の画像が、車両内に設けられた画像取得ユニット108によって取得される。画像は、複数のサブ画像に分割される。複数のサブ画像から1つ以上の特徴が抽出される。複数のサブ画像に関連付けられた勾配を算出するために、複数のサブ画像のそれぞれが同時に処理される。勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることによって、セルヒストグラムが生成される。空間的ブロック内においてセルをグループ化することにより、算出された勾配が正規化される。近距離オブジェクト及び遠距離オブジェクトを、歩行者カテゴリー又は車両カテゴリーに分類するため、サポートベクターマシーン(SVM)線型分類器が複数のサブ画像に適用される。
【選択図】図3
【特許請求の範囲】
【請求項1】
車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するための方法であって、
プロセッサーによって、前記車両の前記経路上に現れた複数のオブジェクトに対応する入力として、画像を受信する工程と、
前記プロセッサーによって、前記画像を、前記車両から前記オブジェクトまでの距離に基づいて算出されたピクセルの矩形窓の形態をとり、関心のある領域(ROIs)を示す複数のサブ画像に分割する工程と、
前記プロセッサーによって、前記複数のサブ画像から近距離オブジェクトおよび遠距離オブジェクトを検出する工程と、を含み、
前記検出する工程は、
前記複数のサブ画像から1つ以上の特徴を抽出する工程と、
抽出した前記1つ以上の特徴に基づいて、前記複数のサブ画像のそれぞれに関連付けられた勾配を算出するために、前記複数のサブ画像のそれぞれを同時に処理する工程と、
算出した前記勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることにより、複数のセルを含むセルヒストグラムを生成する工程と、
前記複数のサブ画像を正規化するため、空間的ブロック内において前記複数のセルのセルをグループ化することにより算出された前記勾配を正規化する工程と、
前記近距離オブジェクトおよび前記遠距離オブジェクトを検出し、カテゴリーに分類するため、前記正規化の後、前記複数のサブ画像に対しサポートベクターマシーン(SVM)線型分類器を適用する工程と、により実行されることを特徴とする方法。
【請求項2】
前記画像は、前記車両の1つ以上の画像取得ユニットにより取得される請求項1に記載の方法。
【請求項3】
前記近距離オブジェクトおよび前記遠距離オブジェクトは、前記車両から0〜Nメートルの範囲内において、それぞれ、Xメートル以下およびX〜Nメートルの範囲内に位置する請求項1に記載の方法。
【請求項4】
前記複数のサブ画像のそれぞれは、前記車両から前記オブジェクトまでの距離の所定の範囲に基づいて、特定のROI用に規定される請求項1に記載の方法。
【請求項5】
前記SVM線型分類器は、以下の式を用いて、前記オブジェクトを前記カテゴリーに分類し、
上記式中、Xiは勾配のヒストグラム(HOG)の特徴ベクトルを示し、YiはSVM学習済データの特徴ベクトルを示し、
前記SVM学習済データは、所定のカテゴリーに分類された前記オブジェクトに関連付けられた所定の特徴を含み、
前記分類する工程は、前記1つ以上の特徴と、前記SVM学習済データの前記所定の特徴とを比較する工程をさらに含む請求項1に記載の方法。
【請求項6】
前記複数のサブ画像は、
前記車両から前記近距離オブジェクトおよび前記遠距離オブジェクトまでの前記距離に基づいて、前記1つ以上のサブ画像を補間する工程と、
前記1つ以上のサブ画像からノイズを低減し、前記1つ以上のサブ画像から個々の要素を分離し、前記1つ以上のサブ画像の非接続部分を接合するために、前記1つ以上のサブ画像に対し、収縮および膨張を適用する工程と、
3x3カーネルのメディアンを用いた2次元画像鮮明化フィルターを用いて、前記1つ以上のサブ画像を鮮明化する工程と、
3x3ガウシアンカーネルを用いた2次元平滑化フィルターを用いて、前記1つ以上のサブ画像を平滑化する工程と、によってさらに処理される請求項1に記載の方法。
【請求項7】
車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するための装置102であって、
プロセッサー202と、
前記プロセッサー202に接続されたメモリ206と、を含み、
前記プロセッサー202は、前記メモリ206内に保存された複数のモジュール208を実行し、前記複数のモジュール208は、
前記車両の前記経路上に現れた複数のオブジェクトに対応する入力として、画像を受信する受信モジュール210と、
前記画像を、前記車両から前記オブジェクトまでの距離に基づいて算出されたピクセルの矩形窓の形態をとり、関心のある領域(ROIs)を示す複数のサブ画像に分割する分割モジュール212と、
前記複数のサブ画像から近距離オブジェクトおよび遠距離オブジェクトを検出する検出モジュール214と、を含み、
前記近距離オブジェクトおよび前記遠距離オブジェクトの検出は、
前記複数のサブ画像から1つ以上の特徴を抽出する工程と、
抽出した前記1つ以上の特徴に基づいて、前記複数のサブ画像のそれぞれに関連付けられた勾配を算出するために、前記複数のサブ画像のそれぞれを同時に処理する工程と、
算出した前記勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることにより、複数のセルを含むセルヒストグラムを生成する工程と、
前記複数のサブ画像を正規化するため、空間的ブロック内において前記複数のセルのセルをグループ化することにより算出された前記勾配を正規化する工程と、
前記近距離オブジェクトおよび前記遠距離オブジェクトを検出し、カテゴリーに分類するため、前記正規化の後、前記複数のサブ画像に対しサポートベクターマシーン(SVM)線型分類器を適用する工程と、により実行されることを特徴とする装置102。
【請求項8】
前記画像は、前記車両の1つ以上の画像取得ユニットによって取得される請求項7に記載の装置102。
【請求項9】
前記近距離オブジェクトおよび前記遠距離オブジェクトは、前記車両から0〜Nメートルの範囲内において、それぞれ、Xメートル以下およびX〜Nメートルの範囲内に位置する請求項7に記載の装置102。
【請求項10】
前記複数のサブ画像のそれぞれは、前記車両から前記オブジェクトまでの距離の所定の範囲に基づいて、特定のROI用に規定され、
20メートル以下の前記オブジェクトの前記距離は、ROI1に該当する請求項7に記載の装置102。
【請求項11】
前記複数のサブ画像を処理する画像処理モジュール216をさらに含み、
前記複数のサブ画像の処理は、
前記車両から前記近距離オブジェクトおよび前記遠距離オブジェクトまでの前記距離に基づいて、前記1つ以上のサブ画像を補間する工程と、
前記1つ以上のサブ画像からノイズを低減し、前記1つ以上のサブ画像の個々の要素を分離し、前記1つ以上のサブ画像の非接続部分を接合するために、前記1つ以上のサブ画像に対し、収縮および膨張を適用する工程と、
3x3カーネルのメディアンを用いた2次元画像鮮明化フィルターを用いて、前記1つ以上のサブ画像を鮮明化する工程と、
3x3ガウシアンカーネルを用いた2次元平滑化フィルターを用いて、前記1つ以上のサブ画像を平滑化する工程と、によって実行される請求項7に記載の装置102。
【請求項12】
車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するために演算装置において実行可能なプログラムを具体化する非一時的コンピューター可読媒体であって、前記プログラムは、
前記車両の前記経路上に現れた複数のオブジェクトに対応する入力として、画像を受信するためのプログラムコードと、
前記画像を、前記車両から前記オブジェクトまでの距離に基づいて算出されたピクセルの矩形窓の形態をとり、関心のある領域(ROIs)を示す複数のサブ画像に分割するためのプログラムコードと、
前記複数のサブ画像から近距離オブジェクトおよび遠距離オブジェクトを検出するためのプログラムコードと、を含み、
前記近距離オブジェクトおよび前記遠距離オブジェクトの検出は、
前記複数のサブ画像から1つ以上の特徴を抽出する工程と、
抽出した前記1つ以上の特徴に基づいて、前記複数のサブ画像のそれぞれに関連付けられた勾配を算出するために、前記複数のサブ画像のそれぞれを同時に処理する工程と、
算出した前記勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることにより、複数のセルを含むセルヒストグラムを生成する工程と、
前記複数のサブ画像を正規化するため、空間的ブロック内において前記複数のセルのセルをグループ化することにより算出された前記勾配を正規化する工程と、
前記近距離オブジェクトおよび前記遠距離オブジェクトを検出し、カテゴリーに分類するため、前記正規化の後、前記複数のサブ画像に対しサポートベクターマシーン(SVM)線型分類器を適用する工程と、により実行されることを特徴とする非一時的コンピューター可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照および優先権
本発明は、2014年3月7日に出願されたインド国仮特許出願第794/MUM/2014号を基礎とする優先権を主張する。該インド国仮特許出願の開示内容の全ては、参照により、本明細書に組み込まれる。
【0002】
ここに詳述される本発明は、多範囲(multi-range)オブジェクト検出方法および装置一般に関する。
【背景技術】
【0003】
輸送システムにおいて、運転の安全およびドライバー支援(driving safety and driver assistance)の確保は、重要な要求である。交通事故の原因となる要因の1つは、ドライバーの見落としや視野範囲の減少である。シートベルト、エアバック、アンチロックブレーキシステム(ABS)等の従来の安全機能は、事故の重大度を軽減するために利用されている。さらに、今日におけるその他の安全機能としては、ドライバーに早期警戒を提供し、もし必要なら、車両のコントロールをドライバーから引き継ぐことによって、ドライバーの事故回避を補助するドライバー支援システムが挙げられる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
このようなドライバー支援システムの1つは、車両の経路内のオブジェクトを検出し、ドライバーに警告を行うことを可能とする衝突回避システムを含んでいる。オブジェクトを検出するために、画像が取得され、さらに、車両からのオブジェクトの実際の位置を検出するため、該画像が処理される。しかしながら、衝突回避システムを提供するために利用可能な現在の技術は、車両から遠い距離または近い距離に位置するオブジェクトを1つずつ検出している。よって、現在のドライバー衝突回避システムは、車両から遠い範囲および近い範囲に位置する複数のオブジェクトを同時に検出するという技術的課題に直面している。さらに、既存のシステムにおいて、異なる範囲(遠距離および近距離)に位置する複数のオブジェクトの算出は、多くの演算時間を必要とする。演算時間の増大は、ドライバーに対する警告通知の形態で提供される応答の遅延に繋がってしまう。
【課題を解決するための手段】
【0005】
本概要は、多数の範囲における複数のオブジェクトを検出するための装置および方法に関する様態を説明するために提供されるものであり、そのコンセプトは、以下の詳細な説明においてさらに説明される。本概要は、本発明の本質的特徴を特定するものではなく、また、特許請求の範囲に記載された本発明の範囲を決定または限定するために用いられるものでもない。
【0006】
実施形態の1つにおいて、車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するための装置が開示される。該装置は、プロセッサーと、該プロセッサーに接続されたメモリとを含む。プロセッサーは、メモリ内に保存されている複数のモジュールを実行する。複数のモジュールは、受信モジュールと、分割モジュールと、検出モジュールとを含む。受信モジュールは、車両の経路上に現れたオブジェクトに対応する入力として、画像を受信する。さらに、分割モジュールは、画像を、関心のある領域(ROIs:Regions of interest)を示す複数のサブ画像に分割する。さらに、複数のサブ画像のそれぞれは、車両からオブジェクトまでの距離に基づいて算出されたピクセルの矩形窓(rectangular window)の形態をとる。さらに、検出モジュールは、複数のサブ画像から1つ以上の特徴を抽出することにより、複数のサブ画像から近距離オブジェクトおよび遠距離オブジェクトを検出する。さらに、検出モジュールは、抽出された1つ以上の特徴に基づいて、複数のサブ画像のそれぞれに関連付けられた勾配(gradient)を算出するため、複数のサブ画像のそれぞれを同時に処理する。さらに、検出モジュールは、算出された勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネル(orientation based histogram channel)の重みづけ票(weighted vote)を投じることにより、複数のセル(cell)を含むセルヒストグラムを生成する。さらに、検出モジュールは、複数のサブ画像を正規化するために、空間的ブロック内の複数のセルのセルをグループ化することによって算出された勾配を正規化する。さらに、検出モジュールは、近距離オブジェクトおよび遠距離オブジェクトを歩行者カテゴリーまたは車両カテゴリーに分類するため、正規化の後、サポートベクターマシーン(SVM:Support Vector Machine)線型分類器を複数のサブ画像に適用する。
【0007】
別の実施形態の1つにおいて、車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するための方法が開示される。該方法は、プロセッサーによって、車両の経路上に現れたオブジェクトに対応する入力として、画像を受信する工程を含む。該方法は、さらに、プロセッサーによって、画像を、関心のある領域(ROIs)を示す複数のサブ画像に分割する工程を含む。さらに、複数のサブ画像のそれぞれは、車両からオブジェクトまでの距離に基づいて算出されたピクセルの矩形窓の形態をとる。該方法は、さらに、プロセッサーによって、複数のサブ画像から1つ以上の特徴を抽出することにより、複数のサブ画像から近距離オブジェクトおよび遠距離オブジェクトを検出する工程を含む。さらに、該方法は、抽出された1つ以上の特徴に基づいて、複数のサブ画像のそれぞれに関連付けられた勾配を算出するため、複数のサブ画像のそれぞれを同時に処理する工程を含む。さらに、該方法は、算出された勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることにより、複数のセルを含むセルヒストグラムを生成する工程を含む。該方法は、複数のサブ画像を正規化するために、空間的ブロック内の複数のセルのセルをグループ化することによって算出された勾配を正規化する工程を含む。さらに、該方法は、近距離オブジェクトおよび遠距離オブジェクトを歩行者カテゴリーまたは車両カテゴリーに分類するため、正規化の後、サポートベクターマシーン(SVM)線型分類器を複数のサブ画像に適用する工程を含む。
【0008】
さらに別の実施形態の1つにおいて、車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するために演算装置において実行可能なプログラムを具体化(embodying)する非一時的コンピューター可読媒体(non-transitory computer readable medium)が開示される。該プログラムは、車両の経路上に現れたオブジェクトに対応する入力として、画像を受信するためのプログラムコードを含む。該プログラムは、さらに、画像を、関心のある領域(ROIs)を示す複数のサブ画像に分割するためのプログラムコードを含む。さらに、複数のサブ画像のそれぞれは、車両からオブジェクトまでの距離に基づいて算出されたピクセルの矩形窓の形態をとる。該プログラムは、さらに、複数のサブ画像から、近距離オブジェクトおよび遠距離オブジェクトを検出するためのプログラムコードを含む。該近距離オブジェクトおよび遠距離オブジェクトの検出は、複数のサブ画像から1つ以上の特徴を抽出する工程と、抽出された1つ以上の特徴に基づいて、複数のサブ画像のそれぞれに関連付けられた勾配を算出するために、複数のサブ画像のそれぞれを同時に処理する工程と、算出された勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることによって、複数のセルを含むセルヒストグラムを生成する工程と、複数のサブ画像を正規化するために、空間的ブロック内の複数のセルのセルをグループ化することにより算出された勾配を正規化する工程と、近距離オブジェクトおよび遠距離オブジェクトを歩行者カテゴリーまたは車両カテゴリーに分類するため、正規化の後、サポートベクターマシーン(SVM)線型分類器を複数のサブ画像に適用する工程と、により実行される。
【図面の簡単な説明】
【0009】
添付の図面を参照して、本発明の詳細な説明が提供される。添付の図面中の各参照番号の左端の数字は、その参照番号が最初に現れる図番号を表している。各図面において、同様の特徴およびコンポーネントには、同じ参照番号が付されている。
【0010】
図1図1は、本発明の実施形態に係る多数の範囲における複数のオブジェクトを検出するための装置およびサーバーのネットワーク実施を示す図である。
【0011】
図2図2は、本発明の実施形態に係る装置を示す図である。
【0012】
図3図3は、本発明の実施形態に係る装置の詳細な動作を示す図である。
【0013】
図4図4は、本発明の実施形態に係る多数の範囲における複数のオブジェクトを検出するための方法を示す図である。
【発明を実施するための形態】
【0014】
車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するための装置および方法が説明される。道路上で運転をしていると、様々なオブジェクト(例えば、車両、歩行者、動物、その他任意のオブジェクト)が車両の前に現れることがある。運転の安全のため、これらオブジェクトが車両に接近しすぎる前に、これらオブジェクトの位置を検出する必要がある。本発明の実施形態によれば、車両に設けられた1つ以上のオンボードカメラまたは画像取得ユニットは、車両からの多数の範囲において現れた複数のオブジェクトの画像を取得する。複数のオブジェクトはそれぞれ、車両から近い距離および遠い距離に位置している。本明細書において開示される装置は、近距離および遠距離に位置する複数のオブジェクトを同時に検出することができ、よって、多範囲オブジェクト検出を提供可能である。
【0015】
画像取得ユニットによって取得されたオブジェクトの画像は、様々な段階で、本装置によって処理される。最初に、ユニットによって取得された入力画像フレームが、関心のある領域(ROI)を示す画像の複数の画像スライス(片)に分割される。画像に対する処理は、ノイズを低減し、個々の要素を分離し、非接続部分を結合し、エッジを鮮明化し、平滑化フィルターを用いて複数の画像を平滑化(smoothening)するため、複数の画像に対して施される。様々な段階を経て画像を処理した後、1つ以上の特徴が抽出される。1つ以上の特徴に基づいて、これら複数の画像のそれぞれに対応する勾配が同時に算出される。さらに、該勾配に関連した値に基づいて、セルヒストグラムが生成される。該セルヒストグラムは、配向ベースのヒストグラムチャンネルの重みづけ票を投じることにより生成される。さらに、画像の明るさおよびコントラストの変化の影響を低減するため、算出された勾配が正規化ファクターを用いて正規化される。正規化の後、近距離オブジェクトおよび遠距離オブジェクトを歩行者カテゴリーまたは車両カテゴリーに同時に分類するために、サポートベクターマシーン(SVM)線型分類器が適用される。よって、本装置によって、車両からの多数の範囲に位置する複数の様々なオブジェクト(近距離オブジェクトおよび遠距離オブジェクト)を同時に検出することができる。多数の範囲における複数のオブジェクトの検出は、車両安全(vehicle’s safety)に利用することができる。
【0016】
以下説明される多数の範囲における複数のオブジェクトを同時に検出するための装置および方法の様態は、任意の数の異なる演算装置、環境および/または構成によって実施することができ、実施形態は以下の例示的な装置についてのコンテキスト(context:文脈、内容)において説明される。
【0017】
図1には、本発明の実施形態に係る多数の範囲における複数のオブジェクトを同時に検出するための装置102およびサーバー104のネットワーク実施100が図示されている。実施形態の1つにおいて、装置102は、車両110の経路内の1つ以上のオブジェクトの検出を容易にする。本発明はサーバー104が演算システムとして実施されているものとして説明されるが、サーバー104は多様な演算システム(例えば、ラップトップコンピューター、デスクトップコンピューター、ノート型コンピューター、ワークステーション、メインフレームコンピューター、サーバー、ネットワークサーバー、タブレット型コンピューター、携帯電話等)として実施されてもよいことは理解されるであろう。実施形態の1つにおいて、サーバー104は、クラウドベース環境内で実施されていてもよい。実施形態の1つによれば、装置102は、車両110を用いて実施されていてもよい。さらに、サーバー104は装置102の活動を追跡(track)し、装置102はネットワーク106を介してサーバー104と通信可能に接続されている。
【0018】
実施形態の1つにおいて、ネットワーク106は、無線ネットワーク、有線ネットワークまたはこれらの組み合わせであってもよい。ネットワーク106は、異なる種類のネットワーク(例えば、イントラネット、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット等)の1つとして実施することができる。ネットワーク106は、専用ネットワークであってもよいし、共有ネットワークであってもよい。共有ネットワークは、異なる種類のネットワークの接続を意味し、様々なプロトコル(例えば、ハイパーテキストトランスファープロトコル(HTTP)、トランスミッションコントロールプロトコル/インターネットプロトコル(TCP/IP)、ワイヤレスアプリケーションプロトコル(WAP)等)を用いて、互いに通信する。さらに、ネットワーク106は、様々なネットワークデバイス(例えば、ルーター、ブリッジ、サーバー、演算装置、ストレージ装置等)を含んでいてもよい。
【0019】
図2には、本発明の実施形態に係る装置102が図示されている。実施形態の1つにおいて、装置102は、少なくとも1つのプロセッサー202と、入出力(I/O)インターフェース204と、メモリ206とを備える。少なくとも1つのプロセッサー202は、1つ以上のマイクロプロセッサー、マイクロコンピューター、マイクロコントローラー、デジタル信号プロセッサー、中央演算装置(CPU)、状態マシーン、論理回路および/または操作可能(operational)な命令に基づいて信号を操作する任意の装置として実施することができる。その他の機能の中でも、少なくとも1つのプロセッサー202は、メモリ206内に保存されているコンピューター可読命令またはモジュールをフェッチ(fetch:命令コードを読み出すこと)し、実行するよう構成されている。
【0020】
I/Oインターフェース204は、様々なソフトウェアインターフェースおよびハードウェアインターフェース(例えば、ウェブインターフェース、グラフィックユーザーインターフェース等)を含む。I/Oインターフェース204は、デバイス102がユーザーと直接またはクライアント装置204を介して相互通信することを可能とする。さらに、I/Oインターフェース204は、装置102がその他の演算装置(例えば、ウェブサーバーおよび外部データサーバー)(図示せず)と通信を行うことを可能とする。I/Oインターフェース204は、有線ネットワーク(例えば、LAN、ケーブル等)および無線ネットワーク(例えば、WLAN、セルラー、衛星等)を含む広範な種類のネットワークおよびプロトコル内での多数の通信を容易にする。I/Oインターフェース204は、多数の装置を互いにまたは他のサーバーに接続するための1つ以上のポートを含む。
【0021】
メモリ206は、本分野において既知のコンピューター可読媒体またはコンピュータープログラム製品(例えば、静的ランダムアクセスメモリ(SRAM)や動的ランダムアクセスメモリ(DRAM)等の揮発性メモリおよび/またはリードオンリーメモリ(ROM)、消去可能プログラム可能ROM(EPROM)、フラッシュメモリ、ハードディスク、光学ディスク、コンパクトディスク(CDs)、デジタル多用途ディスクまたはデジタルビデオディスク(DVDs)および磁気テープ等の不揮発性メモリ)を含む。メモリ206は、モジュール208と、データ220とを含む。
【0022】
モジュール208は、特定のタスクを実行または特定の抽象データ型(abstract data type)を実装するルーチン(routine)、プログラム、オブジェクト、コンポーネント、データ構造等を含む。実施形態の1つにおいて、モジュール208は、受信モジュール210と、分割モジュール212と、検出モジュール214と、画像処理モジュール216と、その他モジュール218とを含む。その他モジュール218は、装置102のアプリケーションおよび機能を補完するプログラムまたはコード化命令を含んでいる。
【0023】
とりわけ、データ220は、1つ以上のモジュール208によって処理され、受信され、生成されたデータを保存するためのレポジトリ(repository:データやプログラム等の一元的な保存場所)として機能する。また、データ220は、画像データベース222と、その他データ224とを含む。
【0024】
図3は、本発明の実施形態に係る装置102の詳細な動作を図示している。本明細書において開示される装置102は、任意の種類の車両を用いて実施することができる。本説明では、四輪車、すなわち車両110が示されている(図1)。装置102は車両110からの近距離および遠距離(すなわち、多数の範囲)における複数のオブジェクトを検出し、車両110とオブジェクトとの衝突を回避するために設けられる。車両110が動いている間、車両110の経路内のオブジェクトを正確に検出することは、極めて重要である。オブジェクトは、車両110からの近距離においても遠距離においても出現し得る。さらに、オブジェクトは、静止しているかもしれないし、動いているかもしれない。1つの例では、図3に示すように、オブジェクト1は車両110からの遠距離に位置し、オブジェクト2は車両110からの近距離に位置する。よって、車両110からの遠距離に位置するオブジェクト(オブジェクト1)と近距離に位置するオブジェクト(オブジェクト2)の同時検出が要求される。本発明の装置102は、車両110からの近距離および遠距離における複数のオブジェクトの同時検出を容易にする。さらに、本発明の1つの実施形態によれば、遠距離は、80メートル以下の範囲であり、近距離は5メートル以下の範囲である。本分野における当業者であれば、車両110からの近距離および遠距離に対応する範囲は変更可能であり、本発明は、上述の近距離および遠距離の範囲に限定されないことを理解できるであろう。
【0025】
本発明の実施形態によれば、オブジェクト1およびオブジェクト2の画像を車両110の画像取得ユニット108によって取得することができる。画像取得ユニット108は、車両110からの近距離および遠距離に位置する1つ以上のオブジェクトの画像を取得するために用いられるモノタイプカメラまたはステレオタイプカメラ(撮像装置のペア)であってもよい。取得された画像は、装置102の画像データベース220内に保存される。装置102の受信モジュール210は、車両110の経路上に現れたオブジェクトに対応する画像を受信する。最初に、装置102の分割モジュール212は、受信した画像を、関心のある領域(ROIs)を示す複数のサブ画像/スライスに分割する。さらに、複数のサブ画像の各サブ画像は、検出距離(すなわち、オブジェクトと車両110との間の距離)に基づいて算出されたピクセルの矩形窓(rectangular windows of pixel)の形態をとってもよい。近距離範囲にあるオブジェクトはより大きく、遠距離範囲にあるオブジェクトはより小さく見えるため、短い距離範囲に対応する大きな矩形窓と、長い距離範囲に対応する小さな矩形窓が存在する。例示的な実施形態の1つにおいて、車両110から20メートル以下、50メートル以下、80メートル以下の距離に位置するサブ画像が、それぞれROI1、ROI2およびROI3となるようスライスされるように、関心のある領域(ROI)の範囲が規定されてもよい。上述のROIsの規定された範囲の上述の例は、VGAタイプのカメラに適用することができる。本分野における当業者であれば、検出距離(すなわち、ROIsの規定された範囲)は、カメラの解像度とともに拡充し、さらに、ROIの選択は、それに伴い変更し得ることを理解できるであろう。
【0026】
長距離(例えば、50メートル)におけるオブジェクトは、知覚可能であるがサイズが小さいので、オリジナルの縮尺(original scale)においては、オブジェクト画像を検出することが困難である。装置102の画像処理モジュール216は、車両からの近距離オブジェクトおよび遠距離オブジェクトの距離に基づいて、複数のサブ画像の1つ以上のサブ画像を拡大してもよい。本発明の実施形態によれば、1つ以上のサブ画像は、バイリニア補間法(bilinear interpolation method)を用いて、ROI2のオリジナルサイズの2倍、またはROI3のオリジナルサイズの3倍に拡大されてもよい。1つ以上のサブ画像の補間の後、画像処理モジュール216は、1つ以上のサブ画像の補間による膨張(dilation)に続いて、収縮(erosion)処理を適用してもよい。収縮および膨張の適用は、1つ以上のサブ画像のノイズの低減、個々の要素の分離および1つ以上のサブ画像内における非接続部分の結合をもたらすことができる。さらに、膨張は、円形のカーネルを用いた1つ以上のサブ画像のコンボリューション(畳み込み積分)をもたらす。カーネルが1つ以上のサブ画像に対して走査されると、カーネルによって重ね合わせされた(オーバーラップされた)最大ピクセル値が見いだされ、ピクセル値が最大ピクセル値によって置き換えられる。また、膨張は、この動作と反対の動作を実行し、カーネル範囲のローカルミニマム(極小)を見いだすことを試みる。これにより、1つ以上のサブ画像内の明るい領域をより明るく(薄く)することができ、一方、暗い領域をより暗く(濃く)することができる。
【0027】
収縮および膨張の適用の際に、さらに、画像処理モジュール216は、3x3カーネルのメディアンを用いた2次元画像鮮明化フィルターを用いて、1つ以上のサブ画像を鮮明化してもよい。このステップは、1つ以上のサブ画像からノイズを除去する一方、エッジの鮮明化に有用である。本発明の実施形態によれば、画像鮮明化フィルターとして用いられるカーネルは、以下で与えられる。
Image[fx][fy]=inputPixelValue[x+fx−edgex][y+fy−edgey]
ここで、edgex=窓の幅/2(window width/2)であり、edgey=窓の高さ/2(window height/2)である。
【0028】
続いて、画像処理モジュール216は、3x3ガウシアンカーネルを用いた2次元平滑化フィルターを用いて、1つ以上のサブ画像を平滑化するよう、さらに構成されていてもよい。ガウシアンカーネルを用いることは、1つ以上のサブ画像から、画像取得ユニット108の動き(モーション)に起因するボケ(blur)を低減させるために有用である。本発明の実施形態によれば、用いられるガウシアン関数は、以下で与えられる。
ここで、xは横軸における原点からの距離であり、yは縦軸における原点からの距離であり、αは標準偏差である。
【0029】
1つ以上のサブ画像の平滑化および1つ以上のサブ画像からのボケの低減に続いて、装置102の検出モジュール214は、複数のサブ画像から1つ以上の特徴を抽出することにより、複数のサブ画像から近距離オブジェクトおよび遠距離オブジェクトを検出してもよい。検出モジュール214は、さらに、抽出した1つ以上の特徴に基づいて、複数のサブ画像のそれぞれに関連付けられた勾配を算出するために、複数のサブ画像のそれぞれを同時に処理してもよい。実施形態の1つにおいて、3つの異なるROIs(ROI1、ROI2およびROI3)に関連付けられた勾配を算出するため、3つの異なる窓サイズが同時に処理されてもよい。実施形態によれば、1次元微分マスクが水平方向及び垂直方向に走査されてもよい。さらに、画像データの強度チャンネルが、以下で与えられるカーネルを用いてフィルタリングされる。
【0030】
さらに、検出モジュール214は、算出された勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることにより、セルヒストグラムを生成してもよい。セルヒストグラムは矩形状の複数のセルを含み、チャンネルのヒストグラムは9つのヒストグラムチャンネルを用いた符号なしの勾配(unsigned gradient)を用いて180度の横軸(0〜180度の横軸)上に、配置される。
【0031】
さらに、装置102の検出モジュール214は、明るさおよびコントラストの変化の影響を低減するため、勾配強度(gradient strength)を正規化してもよい。勾配強度を正規化するため、空間的ブロック内において複数のセルのセルがグループ化される。本発明の実施形態によれば、勾配が算出されたROIs(サブ画像)のそれぞれ用に、ROIに対して特有(固有)な窓サイズに勾配値が分け与えられる。例示的な例の1つにおいて、ROI1用に、128x64ピクセルの窓サイズが使用され、勾配値が16x16ピクセルのブロックに分け与えられ、8x8ピクセルの4つのセルが順にブロック内に収納され、各セルに9つのヒストグラムビン値(histogram bin values)が順に収納される。よって、最終的に、36の重みづけビン値(weighted bin values)が算出され、3780のディスクリプタ値(descriptor values)を生成する105のブロックと乗算される。よって、ROIsのそれぞれおよび窓サイズ用に上述の方法の処理を実行することにより、検出モジュール214は、各窓の勾配を別々に算出する従来の方法と比較して、処理スピードを大幅に改善することができる。さらに、3つの異なるROIsに関連付けられた勾配を算出するために3つの異なる窓サイズを同時に処理することにより、本発明による配向勾配の強調ヒストグラム(EHOG: Enhanced Histogram of Oriented Gradients)の考え方(コンセプト)が開示される。よって、3つの異なる窓サイズを同時に処理することにより、EHOGは、配向勾配のヒストグラム(HOG: Histogram of Oriented Gradients)の制限、すなわち、同時に1つの窓サイズしか処理できないという制限を克服することができる。さらに、ブロック正規化は、以下の正規化ファクターを用いた検出モジュールによって実行されてもよい。
【0032】
正規化の後、装置102の検出モジュール214は、近距離オブジェクトおよび遠距離オブジェクトを歩行者カテゴリーまたは車両カテゴリーに分類するため、複数のサブ画像に対し、サポートベクターマシーン(SVM)線型分類器を適用する。実施形態において、SVM学習は、上述の複数の窓サイズの1つのサイズにトリミングされている関心のあるオブジェクト(例えば、車両)の画像を含むサンプルを用いて実行される。さらに、検出モジュール214は、以下の式を用いて、各窓サイズおよび各ROI用に、効率的に1つ以上のオブジェクト画像を同時に分類してもよい。
ここで、Xiは配向勾配のヒストグラム(HOG)の特徴ベクトルであり、YiはSVM学習済データの特徴ベクトルであり、Nはブロック毎のサンプルの数であり、M1は128x64の窓毎のブロックの数であり、M2は64x64の窓毎のブロックの数であり、M3は32x32の窓毎のブロックの数である。SVM学習済データは、所定のカテゴリーとして分類されたオブジェクトに関連付けられた所定の特徴を含む。(画像取得ユニット108によって取得された画像の)オブジェクトが検出され、カテゴリーに分類されるとき、SVM分類器は、オブジェクトの1つ以上の特徴と、SVM学習済データの所定の特徴とを比較する。比較に基づいて、オブジェクトが近距離オブジェクトおよび遠距離オブジェクトとして検出され、同時に、オブジェクトがカテゴリー毎に分類される。上述の式により、分類のため、3つの異なる大きさの窓が同時に処理される。これにより、演算の複雑性における(on the computational complexity)主要なオーバーヘッド(overhead:作業そのものに必要なコストとは別の付帯的コスト)なしに、カテゴリー(すなわち、歩行者、車両)へのオブジェクトのマルチスケール分類を保証することができる。本分野における当業者であれば、SVM学習済データの所定の特徴に基づいて、オブジェクトがその他のカテゴリー(歩行者または車両以外)に分類されてもよいことは理解できるであろう。例えば、カテゴリー「歩行者」用の所定の特徴は、手、眼、足等である。同様に、カテゴリー「車両」用の所定の特徴は、ナンバープレート、車輪、ハンドル等である。
【0033】
図4には、本発明の実施形態に係る車両の経路上の多数の範囲における複数のオブジェクトを同時に検出するための方法が図示されている。方法400は、コンピューター実行可能命令の一般的なコンテキストにおいて説明される。一般的に、コンピューター実行可能命令は、特定の機能を実行するか特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造、プロシージャー、モジュール、ファンクション等を含む。また、方法400は、通信ネットワークを介してリンクされる遠隔処理装置によって機能が実行される分散型演算環境(distributed computing environment)において実行されてもよい。分散型演算環境において、コンピューター実行可能命令は、ローカルおよび遠隔双方の演算ストレージ媒体(例えば、メモリストレージ装置)内に位置していてもよい。
【0034】
ここに説明される方法400の順番は、限定と解釈される意図はなく、説明される方法の任意の数のブロックが方法400および代替的な方法を実施するために用いられてもよい。さらに、ここに説明される本発明の原理および範囲から逸脱しない範囲において、各ブロックを方法400から削除することができる。さらに加えて、該方法は、任意の適したハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせによって実施されてもよい。しかしながら、説明の簡易化のため、以下に説明する本実施形態では、方法400は、上述の装置102において実行されるものとする。
【0035】
ブロック402において、車両の経路上に現れたオブジェクトに対応する画像が受信される。受信された画像は、車両に設置された画像取得ユニットによって取得される。
【0036】
ブロック404において、受信された画像は、関心のある領域(ROIs)を示す複数のサブ画像に分割される。さらに、複数のサブ画像のそれぞれは、車両からオブジェクトまでの距離に基づいて算出されたピクセルの矩形窓の形態をとる。複数のサブ画像は、画像からノイズを除去し、画像から個々の要素を分離し、画像の非接続部分を結合し、画像のエッジを鮮明化し、さらに、平滑化フィルターを用いて画像を平滑化するために、さらに処理される。
【0037】
ブロック406において、ブロック406A〜406Eに示されるステップを実行することにより、近距離オブジェクトおよび遠距離オブジェクトが複数のサブ画像から検出される。
【0038】
ブロック406Aにおいて、1つ以上の特徴が、複数のサブ画像から抽出される。
【0039】
ブロック406Bにおいて、抽出した1つ以上の特徴に基づいて、複数のサブ画像のそれぞれに関連付けられた勾配を算出するために、複数のサブ画像のそれぞれが同時に処理される。
【0040】
ブロック406Cにおいて、勾配に関連付けられた値に基づいて、配向ベースのヒストグラムチャンネルの重みづけ票を投じることにより、複数のセルを含むセルヒストグラムが生成される。
【0041】
ブロック406Dにおいて、複数のサブ画像を正規化するために、空間的ブロック内において複数のセルのセルをグループ化することにより、算出された配向が正規化される。
【0042】
ブロック406Eにおいて、近距離オブジェクトおよび遠距離オブジェクトを検出し、カテゴリーに分類するため、正規化の後、サポートベクターマシーン(SVM)線型分類器が複数のサブ画像に適用される。
【0043】
複数のオブジェクトを検出するための方法および装置の実施が、構造的特徴および/または方法を特定する説明において説明されたが、添付の特許請求の範囲は説明された特定の特徴または方法に必ずしも限定されないことは理解されるであろう。また、特定の特徴および方法が、近距離および遠距離における複数のオブジェクトを同時に検出するための実施形態の例として開示された。
図1
図2
図3
図4
【外国語明細書】
























































図1
図2
図3
図4