【文献】
西野 咲子、外3名,“車載カメラを用いた射影変換画像からの区画線の剥離率推定”,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2015年 3月 2日,Vol.114, No.508,pp.17-22
【文献】
岸本 康成、外6名,“ラベル伝播を用いた区画線の擦れ検出手法の提案”,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2017年 9月 8日,Vol.117, No.211,pp.97-102
【文献】
河野 慎、外4名,“ピギーバック型道路自動点検システムのための白線の擦れ検出手法検討”,情報処理学会研究報告,日本,情報処理学会,2017年 5月18日,Vol.2017-CDS-19, No.15,pp.1-8
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
本発明の実施の形態の一つを以下に示す。
【0015】
[路面標示画像処理装置の構成]
図1は本実施の形態における路面標示画像処理装置の構成を示す機能ブロック図である。
【0016】
図1に示す路面標示画像処理装置100は、静止画取得部111、畳み込みニューラルネットワーク121とパラメータ122から構成される形状推定部112、畳み込みニューラルネットワーク123とパラメータ124から構成される濃淡推定部113、撮影位置突合部114、分布解析部115、及び出力部116を具備する。
【0017】
静止画取得部111は、路面標示の掠れ度合いを判定するために用いる撮影画像(静止画)を取得する。本実施の形態においては、市販ビデオカメラを車両に搭載して走行しながら撮影した撮影動画のファイルをSDメモリカードなどの記憶媒体101に格納して、当該メモリカードを路面標示画像処理装置100に装着して読み込ませる。静止画取得部111は、記憶媒体101から読み込んだ撮影動画から一定間隔ごとに静止画を取得する。記憶媒体101に保存されている撮影動画の各フレームに着目した場合、それぞれのフレームを静止画とみなすことができる。なお、本装置は静止画又は動画像の撮影の方法には依らず、例えば地上にて市販カメラを用いて路面標示を接写した静止画を用いてもよい。静止画取得部111は、ネットワークを介して撮影動画又は静止画を取得してもよい。
【0018】
図2は道路を撮影した撮影画像の例を示す図である。同図に示す撮影画像201は、片側1車線の左側通行の道路を撮影した画像である。撮影画像201には、横断歩道予告202、車道外側線203、追い越しのための右側部分はみ出し通行禁止204、及び歩道の端205が写り込んでいる。歩道の端205より左には道路に面した家屋などが写り込んでいる。撮影画像201の幅及び高さはいかようでもよいが、本実施の形態においては、撮影画像201は幅3600ピクセル、高さ2000ピクセルであるとする。
【0019】
形状推定部112は、静止画に写った路面標示の種別を分類する。本実施の形態では、形状推定部112は、畳み込みニューラルネットワークを用いて静止画に写った路面標示の種別を分類する。
【0020】
畳み込みニューラルネットワークはニューラルネットワークの考え方に基づいて画像の分類を行う技術である。畳み込みニューラルネットワークにおいて、画像はクラスと呼ばれる単位で分類される。例えば、りんごの画像とみかんの画像を分類することができる畳み込みニューラルネットワークは、りんごクラスとみかんクラスの2種類のクラスを有するネットワークであると言える。畳み込みニューラルネットワークを用いる際は、前もって製品の開発製造段階において、分類させたいクラスごとに教師画像と呼ばれる正解画像群を準備し、正解画像群を畳み込みニューラルネットワークの学習機能に入力することで、畳み込みニューラルネットワークが内部に保持するニューラルネットワークの繋がりに正解画像群を学習させ、学習の結果を畳み込みニューラルネットワークのパラメータとして設定する。これによって畳み込みニューラルネットワークは、以降、目的画像を畳み込みニューラルネットワークの判定機能に入力することで、目的画像を予め学習させたクラスに分類した結果を返すことができる。畳み込みニューラルネットワークの利点は、対象とする画像を判定する際に画像の特徴などを人間が予め考慮する必要がなく、大量の正解画像群を事前すなわち製品の開発製造段階で学習させておくだけで、目的画像の判定が高い精度で可能になるという点にある。この利点のため畳み込みニューラルネットワークは広く用いられており、利用可能な多数のオープンソースのライブラリが入手可能であり、畳み込みニューラルネットワークは容易に利用できる。本装置は、畳み込みニューラルネットワーク121,123にオープンソースのライブラリを用いることで、学習機能及び判定機能を実現する。
【0021】
図3A〜3Dは形状推定部112にて用いられる畳み込みニューラルネットワーク121が分類するクラスの例を示す図である。
【0022】
本実施の形態においては、事前すなわち本装置の開発製造段階で
図3A〜3Dに示すクラスごとに正解画像群を用意し、形状推定部112が用いる畳み込みニューラルネットワーク121の学習機能に正解画像群を入力し、学習の結果を畳み込みニューラルネットワーク121のパラメータ122として設定する。本装置の運用時には畳み込みニューラルネットワーク121の判定機能に目的画像を入力し、目的画像に路面標示が写り込んでいるか否かを区分するとともに、写り込んだ路面標示の種別を区分する。
【0023】
路面標示は、道路標示、区画線、及び法定外表示を含む。また、路面標示には複数の種別がある。点検主体が道路管理者であるか又は都道府県公安委員会であるかによって、点検対象とする路面標示の種別が異なる。
【0024】
本実施の形態においては、点検主体は都道府県公安委員会であるとし、特に5種類の路面標示を本装置の検出対象の路面標示とする。具体的には、
図3Aに示す、横断歩道予告311、停止線312、横断歩道313、追い越しのための右側部分はみ出し通行禁止314、及び止まれ文字315を本装置の検出対象の路面標示であるとし(非特許文献1参照)、この5種類の路面標示を畳み込みニューラルネットワーク121が分類するクラスに含める。検出対象の路面標示を検出するためのクラスの種類の数N(本実施の形態ではN=5)は任意に設定してもよい。
【0025】
また、本実施の形態においては、検出対象の路面標示以外に9種類のクラスを畳み込みニューラルネットワーク121が分類するクラスに含める。具体的には、
図3Bに示すT型交差点クロスマーク321、十型交差点クロスマーク322、車道外側線323、及び路面標示が写りこんでいない路面331、
図3Cに示す壁面341、車体342、及び歩道343、
図3Dに示す横断歩道と停止線の組み合わせ351、壁面と車道外側線の組み合わせ352を畳み込みニューラルネットワーク121が分類するクラスに含める。したがって、畳み込みニューラルネットワーク121は計14種類のクラスを有する。
【0026】
なお、上記実施におけるT型交差点クロスマーク321、十型交差点クロスマーク322、車道外側線323の3種類のクラスは、検出対象に含まれない種別の路面標示を区分したクラスである。検出対象の路面標示以外の路面標示を検出するためのクラスの種類の数K(本実施の形態ではK=3)は任意に設定してもよい。路面標示が写りこんでいない路面331は、路面標示の有無を判断するためのクラスである。壁面341、車体342、歩道343の3種類のクラスは、路面標示以外の物体の写り込みを区分したクラスである。路面標示以外の物体の写り込みを検出するためのクラスの種類の数L(本実施の形態ではL=3)は任意に設定してもよい。横断歩道と停止線の組み合わせ351、壁面と車道外側線の組み合わせ352の2種類のクラスは、近接して存在することが既知である路面標示及び物体の2種類以上からなる特定の組み合わせを区分したクラスである。近接して存在することが既知である路面標示及び物体の2種類以上からなる特定の組み合わせを検出するためのクラスの種類の数J(本実施の形態ではJ=2)は任意に設定してもよい。
【0027】
なお、学習機能に入力する正解画像群を準備するときは、分類対象が写り込んだ静止画群を用意し、静止画群のうち各クラスの分類対象が写り込んだ部分を市販の画像処理ソフトで切り出して正解画像とする。この作業は、本装置の開発製造段階において、人間が製造作業の一環として実施するものである。
【0028】
本実施の形態においては、正解画像用に道路を撮影した静止画群を用意し、静止画群のうち分類対象が写り込んだ部分を市販の画像処理ソフトで切り出す。各クラスに少なくとも正解画像を1000枚以上用いる。
【0029】
学習に用いる正解画像は、矩形であれば正方形であっても長方形であってもよい。例えば、停止線312はその形状に合わせて横長の長方形の画像を用意しても良い。
【0030】
なお、検出対象の路面標示である5種類のクラスを除く9種類のクラスについては、正解画像の枚数の確保が困難な場合、複数のクラスをまとめて一つのクラスとすることもできる。例えば、T型交差点クロスマーク321と十型交差点クロスマーク322をまとめて、一つの交差点クロスマークのクラスとしてもよいし、壁面341、車体342、歩道343をまとめて、物体の写り込みのクラスとしてもよい。
【0031】
濃淡推定部113は、静止画に写った路面標示の掠れ度合いを分類する。本実施の形態では、濃淡推定部113は、畳み込みニューラルネットワークを用いて静止画に写った路面標示の掠れ度合いを分類する。掠れ度合いとは、路面標示の磨耗、剥離、劣化による塗膜の不鮮明さ及び欠損の程度を指す。
【0032】
図4は濃淡推定部113にて用いられる畳み込みニューラルネットワーク123が分類するクラスの例を示す図である。
【0033】
本実施の形態においては、事前すなわち本装置の開発製造段階で
図4に示すクラスごとに正解画像群を用意し、濃淡推定部113が用いる畳み込みニューラルネットワーク123の学習機能に正解画像群を入力し、学習の結果を畳み込みニューラルネットワーク123のパラメータ124として設定する。本装置の運用時には畳み込みニューラルネットワーク123の判定機能に目的画像を入力し、写り込んだ路面標示の掠れ度合いを分類する。
【0034】
掠れ度合いを分類する段階の数は、点検主体の点検基準による。本実施の形態においては、掠れ度合いの分類をレベル1、レベル2、レベル3の3段階とするが、掠れ度合いの段階の数M(本実施の形態ではM=3)は任意に設定してもよい。例えば、路面標示ハンドブックに紹介されている目視評価ランクの数に合わせて5段階に分類してもよい(非特許文献1参照)。
【0035】
掠れ度合いの各レベルの定義は、点検主体の点検基準による。本実施の形態においては、レベル1は路面標示全体の形状を維持しており掠れにより不鮮明な箇所の面積が全体の30%未満を占める路面標示、レベル2は路面標示全体の形状は維持しているが掠れにより不鮮明な箇所の面積が全体の30%以上、60%未満を占める路面標示、レベル3は欠損により路面標示全体の形状を維持していない、又は掠れにより不鮮明な箇所の面積が全体の60%以上を占める路面標示とする。
【0036】
図4の符号401〜403で示すクラスのそれぞれが掠れ度合いのレベル1〜3に対応する。路面標示が写り込んでいない路面及び物体の写り込み404のクラスを、路面441、壁面442、車体443、歩道444の4種類で構成する。
【0037】
濃淡推定部113が用いる畳み込みニューラルネットワーク123は、掠れ度合いのレベル1、レベル2、レベル3の各クラスと、路面標示が写り込んでいない路面及び物体の写り込みのクラスからなる4種類のクラスを事前に学習したパラメータ124を設定する。
【0038】
学習に用いる画像は、矩形であれば正方形であっても長方形であってもよい。また、各レベルの学習に用いる正解画像群は、単一の種別の路面標示で構成してもよいし、複数の種別の路面標示で構成してもよいし、畳み込みニューラルネットワーク121の学習に用いた正解画像を再利用してもよい。
【0039】
本実施の形態においては、畳み込みニューラルネットワーク121の学習に用いた正解画像を再利用する。具体的には、レベル1、レベル2、レベル3の3種類のクラスの正解画像については、検出対象の路面標示である5種類のクラス、すなわち横断歩道予告311、停止線312、横断歩道313、追い越しのための右側部分はみ出し通行禁止314、及び止まれ文字315の正解画像を掠れ度合いのレベルごとに分類して再利用する。路面標示が写り込んでいない路面及び物体の写り込みの正解画像については、路面標示が写りこんでいない路面331、壁面341、車体342、歩道343の正解画像をそのまま再利用する。なお、学習に用いる画像の枚数の目安は、使用するライブラリにより異なるが、本実施の形態においては、各クラスに少なくとも1000枚以上を用いる。
【0040】
撮影位置突合部114は、撮影動画を撮影した位置情報に基づいて静止画取得部111の取得した静止画の撮影地点を特定する。本実施の形態においては、市販GPSロガーを車両に搭載して走行しながら取得した位置情報のファイルをSDメモリカードなどの記憶媒体102に格納して、当該メモリカードを路面標示画像処理装置100に装着して読み込ませる。なお、本装置は撮影位置の記録の方法には依らず、例えば撮影した静止画におけるExifに記録された撮影位置の情報を用いてもよい。撮影位置突合部114は、ネットワークを介して位置情報のファイルを取得してもよい。
【0041】
分布解析部115は、解析対象の静止画に区間線あるいは区間線様の道路延長に沿った形状を持つ路面標示が含まれていた場合に、前後の一連の静止画群を参照し、その路面標示が一定区間内の静止画群において一定割合以上で検出されるかを解析する。分布解析部115は、道路延長に沿った形状を持つ路面標示であると判定された路面標示が一定区間内において一定割合以上で検出されていない場合は、その路面標示を誤検出とする。
【0042】
出力部116は、検出対象の路面標示を検出した静止画の識別子、当該路面標示の静止画中の位置、種別、及び掠れ度合いの情報を出力する。静止画の識別子として、静止画を取得した撮影動画のフレーム番号を用いてもよい。出力部116は、路面標示を検出した静止画の撮影位置の情報を出力してもよい。
【0043】
[路面標示画像処理装置の動作]
次に、本実施の形態における路面標示画像処理装置の動作について説明する。
図5は、路面標示画像処理装置100のメインルーチンのフローチャートである。
【0044】
まず、路面標示画像処理装置100が処理を開始すると、静止画取得部111が、記憶媒体101から撮影動画のファイルを読み取って、一定間隔ごとに静止画を取り出し、取り出された静止画群を以降の手順へと送る(手順501)。一定間隔ごとに静止画を取り出す際、例えば動画が毎秒30フレームで撮影されているときは、1秒あたり30枚の静止画を取り出してその全てを以降の手順での処理対象としてもよいし、30枚のうち一定枚数だけを処理対象とするような間引きを行ってもよい。あるいは、GPSによって車両の緯度経度座標や移動速度を取得しておいて例えば3メートルごと等の一定距離間隔を進んだ位置に相当する静止画を抜き出して処理対象としてもよい。
【0045】
次に形状推定部112は、後述する形状推定サブルーチンの処理によって、静止画群の各静止画から路面標示が含まれる部分画像を抽出し、部分画像に含まれる路面標示の種別を分類する(手順502)。部分画像は、静止画の一部分を切り出した画像であり、路面標示の種別の分類および路面標示の濃淡の推定の処理単位である。静止画から複数の部分画像を抽出してもよい。
【0046】
次に濃淡推定部113が、後述する濃淡推定サブルーチンの処理によって、部分画像に含まれる路面標示の掠れ度合いを分類する(手順503)。
【0047】
次に撮影位置突合部114が、記憶媒体102から位置情報ファイルを読み取って、静止画群の各静止画の撮影地点を特定する(手順504)。静止画の撮影地点を特定する際、例えば動画から取り出された静止画に相当するフレームが撮影された時刻を取得し、位置情報が記録された時刻と突合することで撮影地点を特定してもよいし、さらに両時刻が一致しない場合は前後の位置情報を用いて線形補間等の数値計算を行って推定してもよい。あるいは記憶媒体101に記録されているデータが動画ではなく静止画の場合は、静止画のExifに記録された位置情報を用いてもよい。
【0048】
次に分布解析部115が、後述する分布解析サブルーチンの処理によって、解析対象の静止画に道路延長に沿った形状を持つ路面標示が含まれていた場合に、前後一定区間内の静止画群において路面標示が一定割合以上で検出されるかを解析する(手順505)。
【0049】
次に出力部116が、後述する結果出力サブルーチンの処理によって、静止画群について、各静止画に写り込んだ検出対象の路面標示の静止画中の位置、種別、掠れ度合いの情報を出力する(手順506)。
【0050】
以上の処理により、道路を撮影した静止画又は撮影動画から検出対象の路面標示の有無、静止画中の位置、種別、掠れ度合いの情報を得ることができる。
【0051】
(形状推定処理)
図6は、形状推定サブルーチンのフローチャートである。
【0052】
形状推定サブルーチンが呼び出されると、形状推定部112は、処理対象の静止画を矩形で分割し、分割して得られた静止画の各部分(部分画像)のうち、後述する条件に合致した部分画像からなる部分画像群を以降の手順へと送る(手順601)。
【0053】
図7は撮影画像201から部分画像を得る例を示す図である。矩形701は高さ800ピクセル、幅800ピクセルの正方形の矩形であり、処理後画像は撮影画像201と矩形の左上頂点を合わせるところから始めて、矩形を水平方向、鉛直方向に400ピクセルずつずらして隈なく分割したものである。撮影画像201中の各矩形で表される部分が部分画像である。
【0054】
なお、部分画像の大きさは任意であるが、静止画に写りこむ路面標示の大きさを鑑みて、路面標示の大部分が部分画像内に収まるような大きさを確保し、かつ路面標示の近傍にあるその他の路面標示や物体が極力入り込まないような大きさに留めることは、道路の静止画に対する路面標示及び物体の写り込みの性質から見て合理的である。
【0055】
また、部分画像の各辺は本実施例のように固定長にしてもよいし、幅と高さの異なる複数種類の部分画像を用いてもよい。例えば、遠近法を考慮し、静止画の上方、すなわち道路の奥に向かうにつれ部分画像を小さくしてもよい。
【0056】
静止画全体を分割して部分画像を取得するため、静止画の上部の部分画像には路面を含んでいない領域、又は遠近法により路面標示が小さく写っている領域等が含まれる。このような領域を含む部分画像は、路面標示が写っていないか、又は写っていたとしても形状や濃淡を推定する上で大きさが不十分である。特に後者の場合、誤った推定結果を出力する原因となり得るため、以降の手順に送ることは好ましくない。
【0057】
本実施の形態においては、遠近法により静止画のうち下部の領域に道路の大半が写ることを鑑みて、静止画の下部の部分画像を以降の手順へ送る。具体的には、
図7の撮影画像201の下部60%の領域702に全体が含まれる部分画像の集合を以降の手順へ送る。なお、処理対象とする部分画像の条件は上記に限定するものではなく、例えば、静止画の周囲を処理対象から外してもよいし、静止画の左右の端を処理対象から外してもよい。
【0058】
部分画像を得る方法は上記の本実施例の方法を用いてもよいし、例えばSelective Searchのような既存の物体候補検出アルゴリズムを用いて抽出する方法でもよい。あるいは、Faster R-CNNにおけるRegion Proposal Network(RPN)のような既存のニューラルネットワークによる検出手法を用いてもよい。
【0059】
次に形状推定部112は、部分画像群を畳み込みニューラルネットワーク121の判定機能に入力し、各部分画像を
図3A〜3Dのいずれかのクラスに分類する(手順602)。以下、この分類結果を形状分類結果と呼ぶ。
【0060】
なお、部分画像の分類されたクラスが2種類以上からなる特定の組み合わせを区分したクラスであった場合、部分画像は組み合わせを構成する要素のそれぞれを個別に検出したものとみなす。本実施の形態においては、横断歩道と停止線の組み合わせ351、壁面と車道外側線の組み合わせ352の2種類のクラスが該当する。例えば部分画像が壁面と車道外側線の組み合わせ352のクラスに分類された場合、その部分画像は壁面341のクラスに分類された部分画像と、車道外側線323のクラスに分類された部分画像の、計2つの部分画像があるとみなされて以降の手順へと進む。
【0061】
次に形状推定部112は、部分画像群に含まれる各部分画像について、形状分類結果が路面標示であるかを判定する(手順603)。形状分類結果が路面標示である部分画像を以降の手順の処理対象とし(手順604)、形状分類結果が路面標示でない部分画像は以降の手順の処理対象としない(手順605)。つまり、
図3A,3Bに示したクラス(ただし、路面標示が写りこんでいない路面331は除く)に分類された部分画像のみを以降の手順の処理対象とする。手順603から手順605までの処理は、部分画像群に含まれる各部分画像について繰り返される。
【0062】
なお、部分画像の分類されたクラスが2種類以上からなる特定の組み合わせを区分したクラスであった場合、例えば部分画像の分類されたクラスが壁面と車道外側線の組み合わせ352であれば、形状推定部112は、前述のように、その部分画像は壁面341のクラスに分類された部分画像と、車道外側線323のクラスに分類された部分画像の、計2つの部分画像とみなして処理する。壁面341のクラスに分類された部分画像は以降の手順の処理対象としないとされ、車道外側線323のクラスに分類された部分画像は以降の手順の処理対象とされる。したがって、壁面と車道外側線の組み合わせ352のクラスに分類された部分画像は、以降では車道外側線323のクラスに分類された部分画像として扱われる。壁面と横断歩道と停止線の組み合わせ351のクラスに分類された部分画像は、以降では横断歩道313のクラスに分類された部分画像と停止線312のクラスに分類された部分画像の2つの部分画像として扱われる。
【0063】
次に形状推定部112は、同一の路面標示が複数の部分画像にまたがっていた場合に複数の部分画像を1つの部分画像に結合し、結合前の複数の部分画像の代わりに結合した1つの部分画像を以降の手順へと送る(手順606)。同一とは、形状分類結果が同一のクラスであることを言う。またがるとは、2つの部分画像を任意に選んだ際、両部分画像が同一のクラスであり、かつ両部分画像を構成する辺の少なくとも1組以上が交差または重なっている状態を言う。1つの部分画像に結合するとは、複数の部分画像の全てを内部に含む最小の矩形による部分画像を得ることを言う。
【0064】
図8は同一の路面標示(横断歩道予告202)が複数の部分画像にまたがっている例を示す図である。
【0065】
図8(a)〜(d)の部分画像801〜804では、それぞれ同一の横断歩道予告202が検出されている。また各部分画像801〜804は互いにまたがる位置に存在している。したがって、形状推定部112は、部分画像801〜804を結合して、
図9に示すような1つの部分画像901を得る。なお、撮影画像201は、横断歩道予告202以外に、車道外側線203と追い越しのための右側部分はみ出し通行禁止204の路面標示を含んでいる。これらの路面標示が複数の部分画像にまたがっている場合も同じく結合の対象となる。
【0066】
次に形状推定部112は、部分画像群と形状分類結果を出力して(手順607)、形状推定サブルーチンを終了する。
【0067】
(濃淡推定処理)
図10は、濃淡推定サブルーチンのフローチャートである。
【0068】
濃淡推定サブルーチンが呼び出されると、濃淡推定部113は、形状推定部112の出力した部分画像群を畳み込みニューラルネットワーク123の判定機能に入力し、各部分画像を
図4に記載のいずれかのクラスに分類する(手順1001)。具体的には、濃淡推定部113は、各部分画像を、掠れ度合いのレベル1〜3のクラスまたは路面標示が写り込んでいない路面及び物体の写り込みのクラスに分類する。濃淡推定部113は、分類結果である濃淡分類結果を出力し(手順1002)、濃淡推定サブルーチンを終了する。
【0069】
(分布解析処理)
図11は、分布解析サブルーチンのフローチャートである。
【0070】
分布解析サブルーチンが呼び出されると、分布解析部115は、部分画像群に含まれる各部分画像について、形状分類結果が道路延長に沿った路面標示であるかを判定する(手順1101)。本実施の形態においては、道路延長に沿った路面標示とは追い越しのための右側部分はみ出し通行禁止314及び車道外側線323のことである。
【0071】
部分画像の形状分類結果が道路延長に沿った路面標示であった場合、分布解析部115は、検出された道路延長に沿った路面標示が前後一定区間においても一定割合以上で検出されているか否かを判定する(手順1102)。具体的には、分布解析部115は、撮影位置突合部114により得られた静止画群の撮影位置情報を用いて、部分画像を含む静止画の撮影位置の前後一定区間内にて撮影された静止画に含まれる部分画像の形状分類結果を取得し、前後一定区間内の撮影位置の静止画のうち一定割合以上に同種の路面標示が含まれているかを判定する。本実施の形態においては、一定区間を5mとし、一定割合を60%とする。
【0072】
図12は手順1102の判定処理を説明するための図である。
図12では、道路1201上に黒色または白色の撮影地点1211〜1223を等間隔に並べている。黒色の撮影地点の静止画からは道路延長に沿った路面標示である追い越しのための右側部分はみ出し通行禁止314が検出されている。白色の撮影地点の静止画からは追い越しのための右側部分はみ出し通行禁止314以外の路面標示が検出されている。また、隣り合う撮影地点間の間隔1231は1mとし、撮影地点1217が判定処理の対象となる部分画像を含んでいる静止画の撮影地点であるとする。撮影地点1212〜1216と撮影地点1218〜1222が判定対象の前後5m以内の撮影地点に相当する。撮影地点1212〜1222に含まれる同種の道路延長に沿った路面標示が検出された静止画の割合は撮影地点群全体の70%である。したがって撮影地点1217の静止画の部分画像から検出された路面標示は道路延長に沿った路面標示である確度が高いと判断され、以降の手順の処理に送られる。このように、道路延長に沿った路面標示について、確度の高い部分画像のみが以降の手順の処理に送られることで、本装置の検出精度が向上する。
【0073】
形状分類結果が道路延長に沿った路面標示以外の路面標示の部分画像および道路延長に沿った路面標示である確度が高い部分画像を以降の手順の処理対象とする(手順1103)。形状分類結果が道路延長に沿った路面標示であるが、道路延長に沿った路面標示である確度が低い部分画像は以降の手順の処理対象としない(手順1104)。手順1101から手順1104までの処理は、部分画像群に含まれる各部分画像について繰り返されて、形状分類結果が道路延長に沿った路面標示であるが確度の低い部分画像は以降の処理対象から除外される。
【0074】
次に分布解析部115は部分画像群を出力して(手順1105)、分布解析サブルーチンを終了する。
【0075】
(結果出力処理)
図13は、結果出力サブルーチンのフローチャートである。
【0076】
結果出力サブルーチンが呼び出されると、出力部116は、部分画像群に含まれる各部分画像について、形状分類結果が検出対象の路面標示であるか(手順1301)、濃淡分類結果がレベル1ないし3であるかを判定する(手順1302)。出力部116は、形状分類結果が検出対象の路面標示であって、濃淡分類結果がレベル1ないし3である部分画像を以降の手順の処理対象とする (手順1303)。形状分類結果が検出対象の路面標示でない部分画像と濃淡分類結果が路面標示が写り込んでいない路面及び物体の写り込みの部分画像は以降の手順の処理対象としない(手順1304)。
【0077】
このように、本装置は、形状推定の観点から部分画像が路面標示を含んでいるかを判定するのに加え、濃淡推定の観点から部分画像が路面標示を含んでいるかを陰に判定している。すなわち2つの異なる観点から路面標示を含んでいるかを判定している。これにより1つの観点だけで判定することによる特徴の見落としを減らし、確度の高い判定を実現している。
【0078】
次に出力部116は、部分画像群に含まれる各部分画像について、属する静止画の識別子及び静止画中の位置及び種別及び掠れ度合いを出力して(手順1305)、結果出力サブルーチンを終了する。種別とは形状分類結果のクラスのことであり、掠れ度合いとは濃淡分類結果のクラスのことである。また、部分画像の静止画中の位置とは、部分画像の占める領域を特定できる情報であればよく、例えば部分画像の左上頂点座標と幅と高さの情報でもよいし、部分画像の左上頂点座標と右下頂点座標の情報でもよい。また、静止画中の位置を出力するというのは、座標を数値として出力してもよいし、左上頂点と右下頂点を含む矩形の枠を描画した静止画又は動画を出力としてもよい。
【0079】
[検出対象の路面標示のクラス(
図3A)以外のクラスを有することの利点]
以下では、車両による道路の撮影画像を処理する例を通じて、畳み込みニューラルネットワーク121が近接して存在することが既知である路面標示及び物体の2種類以上からなる特定の組み合わせのクラス、検出対象に含まれない種別の路面標示を区分したクラス、及び路面標示以外の物体の写り込みを区分したクラスを有することの利点を述べる。
【0080】
図14A〜14Cは、車両がT字路に侵入する際に道路を撮影して得られる時系列順に連続した3枚の静止画の例である。
【0081】
図14Aの撮影画像1401はT型交差点の停止線の手前に車両が位置するときに撮影された画像の例である。撮影画像1401には、停止線1411、横断歩道1412、T型交差点クロスマーク1413、車道外側線1414の路面標示と、歩道の端1415と、T型交差点の突き当たりの民家の壁1416が写り込んでいる。また、
図14Aでは、形状推定部112が抽出した部分画像1441を示している。
【0082】
部分画像1441は停止線1411と横断歩道1412の両方を含んでおり、横断歩道と停止線の組み合わせ351のクラスに分類される。もし形状推定部112の畳み込みニューラルネットワーク121が横断歩道と停止線の組み合わせ351のクラスを有していなければ、部分画像1441は横断歩道と停止線の組み合わせ351以外のいずれかのクラスに分類され、横断歩道と停止線の両方を含んでいるという正しい結果を得られなかったであろう。部分画像1441は横断歩道313のクラス又は停止線312のクラスのいずれか一方だけに分類されていたかもしれないし、横向きの白線と縦向きの白線からなる形状がT型交差点クロスマーク321として誤認識されていたかもしれない。本実施の形態では、形状推定部112の畳み込みニューラルネットワーク121が、横断歩道と停止線の組み合わせ351のクラスを有するので、部分画像1441は横断歩道と停止線の両方を含んでいるという正しい結果を得ることができる。
【0083】
このように、近接して存在することが既知である路面標示及び物体の2種類以上からなる特定の組み合わせのクラスを畳み込みニューラルネットワーク121が有していることは、形状の誤認識が減り検出精度が高まるという利点がある。
【0084】
図14Bの撮影画像1402はT型交差点の停止線付近に車両が位置するときに撮影された画像の例である。撮影画像1402には、T型交差点クロスマーク1413、車道外側線1414の路面標示とT型交差点の突き当たりの民家の壁1416が写り込んでいる。また、
図14Bでは、形状推定部112が抽出した部分画像1442,1443を示している。
【0085】
部分画像1442は車道外側線1414と壁1416を含んでおり、壁面と車道外側線の組み合わせ352のクラスに分類される。もし形状推定部112の畳み込みニューラルネットワーク121が壁面と車道外側線の組み合わせ352のクラスを有していなければ、部分画像1442に写り込んだ車道外側線1414の横に延びた形状が停止線312として誤認識されていたかもしれない。本実施の形態では、車両がT字路に差し掛かった際に車道外側線が停止線に似た見た目で壁面と近接して画像に写り込むという撮影上の特徴を踏まえ、形状推定部112の畳み込みニューラルネットワーク121が壁面と車道外側線の組み合わせ352のクラスを有するので、部分画像1442は壁と車道外側線を含んでいるという正しい結果を得ることができる。
【0086】
部分画像1443はT型交差点クロスマーク1413を含んでおり、T型交差点クロスマーク321のクラスに分類される。もし形状推定部112の畳み込みニューラルネットワーク121が、検出対象に含まれない種別の路面標示を区分したクラスを有していなければ、部分画像1443は検出対象の5種類のいずれかの路面標示のクラスに分類され、誤って検出されていたかもしれない。これらの路面標示は、都道府県公安委員会の管理ではなく自治体等の道路管理者が管理することとなっており、一方で本実施の形態は前に述べたように都道府県公安委員会が点検主体となる路面標示の判定を行うことを目的としているのであるから、通常の考え方であれば、目的外である3種類の路面標示のクラスを検出対象として畳み込みニューラルネットワークに学習させる必然性はない。本実施の形態では、車両による道路の撮影画像には検出対象以外の路面標示が写り込むという撮影上の特徴を踏まえ、形状推定部112の畳み込みニューラルネットワーク121が検出対象に含まれない種別の路面標示を区分したクラスを有しており、部分画像1443はT型交差点クロスマーク321であり検出対象に含まれないという正しい結果を得ることができる。
【0087】
このように、検出対象に含まれない種別の路面標示を区分したクラスを畳み込みニューラルネットワーク121が有していることは、形状の誤認識が減り検出精度が高まるという利点がある。
【0088】
図14Cの撮影画像1403は車両がT型交差路の停止線を越え左折を開始する直前に撮影された画像の例である。撮影画像1403においては、T型交差点の突き当たりにある民家の壁1416が写り込んでいる。
図14Cでは、形状推定部112か抽出した部分画像1444を示している。
【0089】
部分画像1444は壁1416を含んでおり、壁面341のクラスに分類される。もし形状推定部112の畳み込みニューラルネットワーク121が、路面標示以外の物体の写り込みを区分したクラスを有していなければ、部分画像1444は形状の似たクラスがないために他のどのクラスにも分類される可能性がある。したがって検出対象の5種類のいずれかのクラスに分類され、誤って検出されていたかもしれない。特に、例えば壁1416の色が白色であった場合、部分画像1444は何らかの路面標示の一部を写した画像に見た目が近くなり、誤って検出されやすい。本実施の形態では、車両による道路の撮影画像には路面標示以外の物体が写り込むという撮影上の特徴を踏まえ、形状推定部112の畳み込みニューラルネットワーク121が路面標示以外の物体の写り込みを区分したクラスを有しており、部分画像1444は壁面341であり検出対象に含まれないという正しい結果を得ることができる。
【0090】
このように、路面標示以外の物体の写り込みを区分したクラスを畳み込みニューラルネットワーク121が有していることは、形状の誤認識が減り検出精度が高まるという利点がある。
【0091】
なお、路面標示以外の物体の種類は電柱や看板等、
図3Cに示した3種類のクラス以外にも無数にあり、畳み込みニューラルネットワーク121がそれら全てを区分したクラスを有することは困難である。一方で、畳み込みニューラルネットワーク121の判定機能は、有しているクラスに含まれない種類の物体、例えば電柱の画像を目的画像として入力された場合に、目的画像を有しているクラスの中で最も形状が近いと推定されるクラスに分類することができる。電柱は物体であるので、目的画像は路面標示のいずれかの種別のクラスより物体のいずれかのクラスに分類される可能性が高いと推察できる。また、本装置においては、路面標示以外の物体を正しく分類することは必要ではなく、路面標示以外の物体を誤って路面標示であると分類しないことが必要である。したがって、路面標示以外の物体を区分したクラスが有限個であったとしても、路面標示以外の物体を誤って検出しないという意味において、路面標示以外の物体の写り込みを区分したクラスを畳み込みニューラルネットワーク121が有していることは利点がある。
【0092】
[畳み込みニューラルネットワークに入力する画像の加工]
以下ではさらに、有用な工夫として、画像の加工について述べる。
【0093】
図15は部分画像に加工を施した例を示す図である。
【0094】
畳み込みニューラルネットワークの学習機能及び判定機能は入力された画像を正方形に拡大又は縮小して処理する。これは形状推定部112及び濃淡推定部113にて用いる畳み込みニューラルネットワークも同様である。したがって、例えば停止線312は横に長い長方形の画像であるが、畳み込みニューラルネットワークの学習機能に入力すると縦方向に拡大されるため、パラメータ122は変形後の形状にて学習されることになる。変形を生じさせない方法として、例えば、
図15のように黒塗りの領域1501を用意して予め正方形の画像にして畳み込みニューラルネットワークの学習機能及び判定機能に入力することで、画像中の路面標示の縦横比を維持して学習及び判定を実施することができる。特に路面標示は色のパターンや形状のパターンが少なく縦横比の情報は重要であるため、形状推定の精度を高める上で利点がある。
【0095】
畳み込みニューラルネットワーク121,123の学習機能に入力する画像、畳み込みニューラルネットワーク121,123の判定機能に入力する画像は、上記の加工処理を施した画像を用いてもよい。
【0096】
[出力結果を利用したアプリケーション例]
本実施の形態の路面標示画像処理装置100においては、静止画に写り込んだ路面標示の静止画中の位置及び種別及び掠れ度合いを判定し出力する機能を提供した。上記示した手順を改良することで、路面標示の静止画中の位置だけでなく撮影位置についても出力し、例えばGeographic Information System(GIS)を用いた可視化装置にて結果を地図画面に出力させることも可能である。
【0097】
図16は、路面標示画像処理装置100の出力結果を利用したアプリケーションの画面の例を示す図である。同図に示すアプリケーション画面1600は、静止画領域1601、動画領域1602、地図領域1603、静止画情報領域1604、及び標示種別選択領域1605を備える。
【0098】
静止画領域1601は、検出対象の路面標示が検出された静止画を表示する領域である。静止画に重ねて、路面標示を検出した部分画像1611,1612の位置が示される。
【0099】
動画領域1602は、路面標示の検出に用いた動画を再生できる領域である。
【0100】
地図領域1603は、路面標示を検出した場所の地図を表示する領域である。地図に重ねて、動画撮影時のルート1630、及び路面標示を検出した静止画の撮影位置を示すマーカー1631〜1635が表示される。マーカー1631〜1635は、検出した路面標示の掠れ度合いが分かるように、掠れ度合いに応じた態様で表示される。例えば、掠れ度合いがレベル1は青色、レベル2は黄色、レベル3は赤色で表示する。マーカー1631〜1635のいずれかが選択されると、選択されたマーカー1631〜1635の位置で撮影された静止画が静止画領域1601に表示される。
図16の例では、マーカー1632が選択されている。地図領域1603に表示される地図は、一般的な地図アプリケーションと同様に、拡大縮小、スクロールなどの操作が可能である。
【0101】
静止画情報領域1604には、路面標示を検出した静止画のファイル名が表示される。地図上にマーカー1631〜1635が表示されている静止画のファイル名だけを表示してもよい。ファイル名のいずれかが選択されると、選択されたファイル名の静止画が静止画領域1601に表示される。静止画情報領域1604には、ファイル名に加えて、検出した路面標示の種別、掠れ度合いなどを表示してもよい。
【0102】
標示種別選択領域1605は、地図領域1603および静止画情報領域1604に表示する情報の絞り込みに用いる。標示種別選択領域1605で選択された種別の路面標示が検出された静止画のマーカーおよびファイル名のみを地図領域1603および静止画情報領域1604で表示する。例えば、標示種別選択領域1605で横断歩道予告のチェックボックスのみがチェックされた場合は、横断歩道予告を検出できた静止画の撮影位置を示すマーカーとファイル名のみを表示する。標示種別選択領域1605において掠れ度合いを絞り込めるようにしてもよい。
【0103】
以上説明したように、本実施の形態によれば、形状推定部112が、道路を撮影した撮影画像から路面標示の形状を推定して路面標示の有無及び種別を分類し、濃淡推定部113が、撮影画像から路面標示の濃淡を推定して路面標示の掠れ度合いの段階を分類し、出力部116が、路面標示の掠れ度合いを出力することにより、道路を撮影した撮影画像から路面標示の掠れ度合いを判定できる。路面標示の掠れ度合い、すなわち路面標示の磨耗、剥離、劣化による塗膜の不鮮明さ及び欠損の程度の分類の基準を目視評価ランクに準拠させることで、人間の目視による路面標示の目視評価ランクの分類作業を代替できる。
【0104】
また、人間の目視により路面標示の目視評価ランクを分類する場合、路面標示の数量は膨大であるため、分類は複数人によって実施されることが通常である。複数人による場合、人間の感覚には個人差があるため、分類を行った人によって分類の結果が異なるということが起こり得る。本装置を用いた場合、畳み込みニューラルネットワークのパラメータ122,124が同一であれば入力した静止画像又は動画像に対して常に一意の出力となるため、本装置を複数台用意したとしても目視評価ランクを一意に定めることができる。
【0105】
本発明の装置はコンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。