(58)【調査した分野】(Int.Cl.,DB名)
前記認識処理部は、前記人間及び動物の全身認識辞書を用いて検出した前記被写体の検出範囲が縦長形状である場合に、動物の頭部、顔部又は臀部を検出するための部分認識辞書を用いた検出を行う
請求項1乃至請求項3のいずれか1項記載の認識装置。
【発明を実施するための形態】
【0011】
以下、図面を参照して本実施の形態に係る認識システム及び認識方法について説明する。
なお、本明細書における「画像」には、静止画像及び動画像が含まれる。
また、本明細書における「動物」は、人間以外の動物を指すものとする。
【0012】
本実施の形態に係る認識システム又は認識方法は、自車両の進行方向を撮影した画像から人間又は動物を検出し、当該人間又は動物を検出した範囲において、動物を検出しようとするもので、人間及び動物を精度良く検出及び判別することができるものである。
【0013】
まず、本実施の形態に係る認識システムの構成について説明する。
図1は、本実施の形態に係る認識システム1の概略構成を示すブロック図である。
認識システム1は、例えば、車両に搭載されて用いられるシステムであり、前方カメラ10、認識装置20、辞書データ記憶装置30、表示装置40などを備える。
【0014】
前方カメラ10は、自車両の進行方向の画像を撮像し、当該画像を認識装置20に入力する。前方カメラ10は、遠赤外光カメラであるが、他の波長領域を用いるカメラ、例えば、可視光カメラと、遠赤外光カメラとを組み合わせたようなものであっても良い。
【0015】
認識装置20は、前方カメラ10が撮像した画像を用いて、人間及び動物を検出し、必要に応じて、警告信号を表示装置40などに出力する。認識装置20は、例えば、前方カメラ10が撮像した画像のフレーム毎又は数フレーム毎に人間及び動物を検出する。このために、認識装置20は、画像取得部21、認識処理部22、表示制御部23などを有する。
【0016】
画像取得部21は、前方カメラ10が撮像した画像を入力し、当該画像に各種の画像処理を施して、認識処理部22に出力する。
認識処理部22は、入力した画像に対して、辞書データ記憶装置30に記憶した人間認識辞書、動物認識辞書を用いて、人間及び動物を検出し、必要に応じて運転者に警告するように、表示制御部23に信号を出力する。
【0017】
表示制御部23は、表示装置40で警告画像を表示したり、警告音声を出力したりするための制御を行う。
辞書データ記憶装置30は、人間認識辞書、動物認識辞書などの様々な認識辞書を記憶する。
人間認識辞書には、人間全身認識辞書などが含まれる。人間全身認識辞書は、歩行者がその正面又は背面を見せて写っている全身画像、及び、歩行者が側面を見せて写っている全身画像、すなわち、歩行者が横向きで写っている全身画像を機械学習して作成したものである。
【0018】
図2は、本実施の形態に係る歩行者の全身画像の例である。これらは、遠赤外光カメラを用いて夜間に撮影されたものであり、左から順番に、歩行者がその正面、背面、側面を見せて写っている全身画像である。いずれの画像も、肌が露出している領域などの熱放射の大きい部分が、より白くなっている。
人間の画像を機械学習したり、検出したりするときは、人間の全身が入るような矩形の検出範囲を用いる。
【0019】
また、動物認識辞書には、動物全身認識辞書、動物部分認識辞書などが含まれる。
動物全身認識辞書も、動物がその正面又は背面を見せて写っている全身画像及び動物がその側面を見せて写っている全身画像などを機械学習して作成したものである。
【0020】
図3は、本実施の形態に係る動物の全身画像の例である。これらも、遠赤外光カメラを用いて夜間に撮影されたものであり、左から順番に、四足歩行の動物がその正面(頭部上)、正面(頭部下)、背面、側面を見せて写っている全身画像である。いずれの画像も、目の領域などの熱放射の大きい部分が、より白くなっている。
【0021】
動物の画像を機械学習したり、検出したりするときも、動物の全身が入るような矩形の検出範囲を用いる。このため、例えば、動物がその正面又は背面を見せて写っているときは縦長の検出範囲を用い、動物がその側面を見せて写っているときは正方形又は横長の検出範囲を用いる。
【0022】
また、動物部分認識辞書は、動物の体の一部分が写っている画像、又は、動物の全身画像からその一部を切り出した画像を機械学習して作成したもので、動物部分認識辞書には、動物頭部認識辞書、動物顔部認識辞書、動物臀部認識辞書などが含まれる。
【0023】
特に、動物の頭部には尖った角やピンと立った耳があり、また、動物の臀部には垂れ下がった尻尾があり、いずれも人間にはないものであって、動物を検出するための重要な特徴となり得る。
表示装置40は、運転者に対して、自車両の進行方向に人間、動物などが存在する旨の警告を画像、音声などで通知する。
【0024】
なお、認識装置20の構成の一部分は、図示しない通信手段を介して接続された他の装置で置き換えられても良い。例えば、認識処理部22は、通信手段を介して接続された認識サーバで置き換えられても良い。
また、辞書データ記憶装置30も、通信手段を介して接続されたサーバで置き換えられても良い。
【0025】
また、認識装置20が実現する各構成要素は、例えば、コンピュータである認識装置20が備える演算装置(図示せず)の制御によって、プログラムを実行することによって実現できる。より具体的には、認識装置20は、記憶部(図示せず)に格納したプログラムを主記憶装置(図示せず)にロードし、演算装置の制御によってプログラムを実行して実現する。
【0026】
また、各構成要素は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア及びソフトウェアのうちのいずれかの組み合わせなどにより実現しても良い。
上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、認識装置20に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。
【0027】
非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。
【0028】
また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によって認識装置20に供給されても良い。一時的なコンピュータ可読媒体の例は、電気信号、光信号及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバなどの有線通信路、又は、無線通信路を介して、プログラムを認識装置20に供給できる。
【0029】
次に、本実施の形態に係る認識システム1の動作、すなわち、認識方法について説明する。
図4は、本実施の形態に係る認識方法の処理手順を示すフローチャートである。
認識システム1が動作を開始すると、前方カメラ10が自車両の進行方向の画像を撮影し、画像取得部21が当該画像を認識対象画像として取得する(ステップS10)。画像取得部21は、例えば、
図2、3に示したような人間又は動物が写っている画像領域を含む撮影画像を取得する。
【0030】
次に、認識処理部22が撮影画像全体又は撮影画像の一部を認識対象領域にして、辞書データ記憶装置30に記憶した人間全身認識辞書及び動物全身認識辞書を用いて、人間及び動物を検出する(ステップS20)。
次に、認識処理部22がステップS20の検出結果について、人間又は動物のいずれであるかが明確となっているか否かを判定する(ステップS30)。
【0031】
このステップS30の処理は、ステップS20の検出結果が、例えば、人間全身認識辞書によって人間である確率が40%であるとされ、動物全身認識辞書によって動物である確率が60%であるとされた場合のように、人間であるのか動物であるのか明確になっていない場合を判定する。
【0032】
具体的にどの程度の確率を基準として明確であるか否かを判定するかは任意であるが、例えば、人間又は動物のいずれか一方である確率が80%以上であり、他方である確率との差が50%以上であるような場合に、確率の高い一方であることが明確であると判定しても良い。
【0033】
認識処理部22は、人間又は動物のいずれかを明確に検出したとき(ステップS30のYes)は、ステップS60に移行する。そして、表示制御部23は、ステップS20の検出処理で明確に検出された人間又は動物について、運転者に警告する。
【0034】
また、認識処理部22は、検出結果が人間又は動物のいずれであるか明確ではないとき(ステップS30のNo)は、検出したときの検出枠(検出矩形)全体を認識対象領域にして、辞書データ記憶装置30に記憶した動物部分認識辞書を用いて、動物の頭部、顔部又は臀部を検出する(ステップS40)。
【0035】
また、認識処理部22は、検出結果が人間又は動物のいずれであるのか明確ではないとき(ステップS30のNo)に、検出したときの検出枠が縦に長い形状である場合は、検出枠全体を認識対象領域にして、辞書データ記憶装置30に記憶した動物部分認識辞書を用いて、動物の頭部、顔部又は臀部を検出するようにしても良い。
【0036】
これは、ステップS20の処理で人間又は動物が検出されたときに、検出したときの検出枠が正方形または横長形状である場合は、動物を側面から見た場合であることが多く、更に、動物を側面から見た場合は、動物全身認識辞書によって動物である確率が高い検出結果が得られることを考慮したものである。
【0037】
このとき、認識処理部22は、認識対象領域の下側の所定の範囲、例えば、認識対象領域の下側半分、認識対象領域の下側3分の1などで動物の頭部又は顔部を検出したときに、動物検出の確信度を大きくする。動物が草を食むときなどは、動物の頭部又は顔部が、認識対象領域の下側の動物の足元又は地面に近いところにあることが多く、これは人間には見られない特徴である。
【0038】
また、認識処理部22は、認識対象領域の上側の所定の範囲、例えば、認識対象領域の上側半分、認識対象領域の上側3分の1などで動物の臀部を検出したときに、動物検出の確信度を大きくする。動物が4本足で立った状態で背面を見せているとき、すなわち、後方を見せているときは、動物の臀部が、認識対象領域の上側に近いところにあることが多く、これも人間には見られない特徴である。
【0039】
そして、認識処理部22は、ステップS20の人間又は動物の検出結果及びステップS40の動物の検出結果に基づいて、ステップS20で検出したのが、人間なのか動物なのかを判別する(ステップS50)。
【0040】
例えば、認識処理部22は、ステップS20で人間である確率が動物である確率より高く、しかしながら、人間であるとまでは明確に判定できないときに、ステップS40の検出で人とは異なる範囲で動物の頭部、顔部又は臀部を検出した場合は、ステップS20で検出したものを動物であると判定する。
【0041】
また、認識処理部22は、ステップS20で人間である確率が動物である確率より高く、しかしながら、人間であるとまでは明確に判定できないときに、ステップS40の検出で人とは異なる範囲で動物の頭部、顔部又は臀部を検出しなかった場合は、ステップS20で検出したものを人間であると判定しても良い。
【0042】
また、ステップS20で動物である確率が人間である確率より高く、しかしながら、動物であるとまでは明確に判定できないときに、ステップS40の検出で人とは異なる範囲で動物の頭部、顔部又は臀部を検出した場合は、ステップS20で検出したものを動物であると判定する。
【0043】
また、ステップS20で動物である確率が人間である確率より高く、しかしながら、動物であるとまでは明確に判定できない場合に、ステップS40の検出で人とは異なる範囲で動物の頭部、顔部又は臀部を検出しなかったときは、ステップS20で検出したものを人間であると判定しても良い。
【0044】
そして、認識処理部22が人間又は動物を検出したときは、表示制御部23が表示装置40を介して、運転者に歩行者又は動物を検出したことを通知する。
次に、認識装置20は、認識方法を終了するか判定し(ステップS60)、終了すると判定したとき(ステップS60のYes)は、処理を終了する。
【0045】
このように、本実施の形態に係る認識システム1又は認識方法は、撮影した画像から人間又は動物を検出し、人間又は動物を検出した範囲において、動物を検出しようと試みるもので、人間及び動物を精度良く検出及び判別することができる
【0046】
なお、本実施の形態に係る認識システム1又は認識方法では、いろいろな追加、修正又は変更が可能である。
例えば、認識処理部22は、人間又は動物を検出したときに、画像に写っている人間又は動物を検出した検出枠の画像上の位置や大きさに基づいて、自車両から人間又は動物までの距離や、人間又は動物の大きさを算出し、運転者に通知しても良い。
【0047】
検出枠の大きさに基づいて人間又は動物までの距離を算出するときは、例えば、人間の身長が1.7m、動物の体長が1.0mであると仮定して計算するので、同じ検出枠で検出されたものが人間であったときと動物であったときとでは、算出される距離が1.7倍も変わってくる。このため、本実施の形態に係る認識システム1により人間と動物とを正確に判別することで、検出した人間、動物などまでの距離を、より精度良く算出することができる。
【0048】
また、表示制御部23は、歩行者などの人間を検出したときと動物を検出したときとで、運転者に対する報知方法を変えても良い。例えば、動物は群れをなしていたり、飛び出しなどの予測不能な行動をしたりすることがあるので、動物を検出したときは、運転者に早めに報知するようにしても良い。
【0049】
また、認識方法において、ステップS20で同一領域内又は近傍領域内で人間及び動物を検出したときにだけ、ステップS40以降で動物を検出しようと試みても良い。
また、ステップS40において、動物の部分認識辞書に加えて、人間の部分認識辞書を用いて、人間も検出するように試みても良い。
【0050】
また、認識システム1の構成は、上記に限られるものではなく、複数の装置、例えば、認識装置20及び辞書データ記憶装置30を一体化して、辞書データ記憶部を備えた認識装置としても良い。また、認識システム1の全ての構成を一体化して、前方カメラ、辞書データ記憶部、表示部を備えた認識装置としても良い。もちろん、人間認識システム、動物認識システム、人間動物判別システムなどとして構成しても良い。
【0051】
また、車両における利用も、車両に一部又は全部が搭載されている形態に加えて、可搬可能又は後付け可能に車両に搭載されている形態であっても良い。
また、車両での利用以外にも、例えば、建物内に設置して、自動ドア前などにカメラを設け、自動ドアの開閉の判断に用いる形態であっても良い。この場合、人間であると判断したときのみ自動ドアを開く、あるいは、動物であると判断したときに自動ドアを閉じるといった判断が可能になる。
【0052】
また、認識処理部22は、人間、動物などの画像を機械学習して作成した辞書を用いる画像認識に代えて、又は、機械学習して作成した辞書を用いる画像認識に加えて、例えば、人間、動物などのテンプレートを用いたパターンマッチングなどの別の画像認識を行うようにしても良い。
【0053】
以上、説明したように、本実施の形態に係る認識装置20は、被写体を撮影した画像を取得する画像取得部21と、取得した画像に対して人間及び動物の全身認識辞書を用いて人間又は動物を検出し、検出した人間又は動物の検出範囲に対して動物の頭部、顔部又は臀部を検出するための部分認識辞書を用いて当該検出範囲における人間とは異なる範囲で動物の頭部、顔部又は臀部を検出したときに、当該被写体が動物であることの確信度を大きくすることで動物を検出する認識処理部22とを備えるものである。
このような構成により、画像から人間又は動物を正しく検出することができる。
【0054】
また、本実施の形態に係る認識方法は、被写体を撮影した画像を取得するステップS10と、取得した画像に対して人間及び動物の全身認識辞書を用いて人間又は動物を検出し、検出した人間又は動物の検出範囲に対して動物の頭部、顔部又は臀部を検出するための部分認識辞書を用いて当該検出範囲における人間とは異なる範囲で動物の頭部、顔部又は臀部を検出したときに、当該被写体が動物であることの確信度を大きくすることで動物を検出するステップS20〜S50とを有するものである。
このような構成により、画像から人間又は動物を正しく検出することができる。