【文献】
中西 功,“特徴の種類と位置を用いたパターン認識手法の検討”,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,1993年03月18日,Vol.92, No.521,pp.17-24
(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、キャニー法は、線状の対象物の検出には適していないことが知られている。また、線状の対象物として、構造物の画像に含まれるヒビの検出を行うことがあるが、一般的な特徴点の抽出法を用いた場合、ノイズが多い画像から細かなヒビを検出することは困難である場合が多い。これに対し、精度良く線状の対象物を検出する技術が求められている。
【0005】
そこでこの発明は、上述の課題を解決することのできる画像処理システム、評価モデル構築方法、画像処理方法及びプログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
本発明の一態様は、検出対象
である線状の領域が含まれる学習用の画像から、複素モーメントフィルタにより二回対称点を特徴点として抽出する特徴点抽出部と、前記抽出した特徴点を含む画像を二値化することにより
前記検出対象の候補となる領域を抽出する候補領域抽出部と、前記候補となる領域を含んだ画像を複数取得し、
取得した前記画像に基づいて前記候補となる領域の特徴を学習し
、前記画像における前記候補となる領域を含む画素と含まない画素とを分類する評価モデルを構築するモデル構築部と、前記評価モデルに基づいて、評価対象の画像に含まれる
前記線状の領域を特定する特定部と、を備える画像処理システムである。
【0007】
本発明の一態様によれば、前記候補領域抽出部は、前記候補となる領域に対して細線化処理を行う。
【0008】
本発明の一態様によれば、前記画像処理システムは、前記学習用の画像のうち、前記候補となる領域を対象に切り出した画像を生成するパッチ画像切出部、をさらに備え、前記モデル構築部は、前記切り出された
画素を学習して、前記候補となる領域を含む画像と、前記候補となる領域を含まない
画素とを分類する評価モデルを構築する。
【0009】
本発明の一態様によれば、前記パッチ画像切出部は、1つながりの
前記線状の領域について、その一部のみを対象とする前記画像を生成する。
【0010】
本発明の一態様によれば、前記モデル構築部は、ニューラルネットワークにより前記評価モデルを構築する。
【0011】
本発明の一態様によれば、前記画像処理システムは、前記特定部が特定した前記線状の領域について、その領域の面積が所定の閾値以下の前記線状の領域を除去するノイズ除去部、をさらに備える。
【0012】
本発明の一態様によれば、前記特徴点抽出部は、前記学習用の画像に含まれる複数の色チャンネル画像それぞれについて、前記特徴点の抽出を行い、前記候補領域抽出部は、前記特徴点抽出部が複数の前記色チャンネル画像から前記特徴点を抽出して生成した画像を合成して得られる画像から、前記候補となる領域を抽出する。
【0013】
本発明の一態様は、検出対象
である線状の領域が含まれる学習用の画像から、複素モーメントフィルタにより二回対称点を特徴点として抽出するステップと、前記抽出した特徴点を含む画像を二値化することにより
前記検出対象の候補となる領域を抽出するステップと、前記候補となる領域を含んだ画像を複数取得し、
取得した前記画像に基づいて前記候補となる領域の特徴を学習し
、前記画像における前記候補となる領域を含む画素と含まない画素とを分類する評価モデルを構築するステップと、を有する評価モデル構築方法である。
【0014】
本発明の一態様は、検出対象
である線状の領域が含まれる学習用の画像から、複素モーメントフィルタにより二回対称点を特徴点として抽出するステップと、前記抽出した特徴点を含む画像を二値化することにより
前記検出対象の候補となる領域を抽出するステップと、前記候補となる領域を含んだ画像を複数取得し、
取得した前記画像に基づいて前記候補となる領域の特徴を学習し
、前記画像における前記候補となる領域を含む画素と含まない画素とを分類する評価モデルを構築するステップと、前記評価モデルに基づいて、評価対象の画像に含まれる
前記線状の領域を特定するステップと、を有する画像処理方法である。
【0015】
本発明の一態様は、コンピュータを、検出対象
である線状の領域が含まれる学習用の画像から、複素モーメントフィルタにより二回対称点を特徴点として抽出する手段、前記抽出した特徴点を含む画像を二値化することにより
前記検出対象の候補となる領域を抽出する手段、前記候補となる領域を含んだ画像を複数取得し、
取得した前記画像に基づいて前記候補となる領域の特徴を学習し
、前記画像における前記候補となる領域を含む画素と含まない画素とを分類する評価モデルを構築する手段、前記評価モデルに基づいて、評価対象の画像に含まれる
前記線状の領域を特定する手段、として機能させるためのプログラムである。
【発明の効果】
【0016】
本発明によれば、画像に含まれる線状の対象物を精度良く検出することができる。
【発明を実施するための形態】
【0018】
<実施形態>
以下、本発明の一実施形態による画像処理システムを
図1〜
図10を参照して説明する。本実施形態による画像処理システムは、1台または複数台のPC(personal computer)やサーバ端末などのコンピュータに実装される。画像処理システムは、直線状の部材、構造物に生じたヒビや亀裂等、画像に含まれる線状の対象物を検出する。以下の説明では、1台のコンピュータに実装された画像処理システム(画像処理装置10)によって、コンクリート構造物の画像からヒビを検出する処理を例に説明を行う。
【0019】
図1は、本発明の一実施形態による画像処理装置の機能ブロック図である。
図1に示す画像処理装置10は、制御部11と、入力部12と、出力部13と、記憶部14と、を備えている。
制御部11は、画像に含まれる線状の対象物を検出する処理を行う。制御部11は、対象物が含まれる学習用の画像(学習用画像)から対象物を検出するための評価モデルを構築する機能と、構築した評価モデルに基づいて、評価対象の画像(評価用画像)に写っている対象物を検出する機能を有している。制御部11の機能については後述する。
入力部12は、データの入力を行うインタフェースである。例えば、入力部12は、キーボード、マウス等の入力装置である。
出力部13は、データの出力を行うインタフェースである。例えば、出力部13は、対象物の検出処理の結果を他のコンピュータ装置、表示装置、プリンタ等に出力する。
記憶部14は、例えば、ROM(Read Only Memory)、フラッシュメモリ、HDD(Hard Disk Drive)等の不揮発性の記憶媒体と、RAM(Random Access Memory)、レジスタ等の揮発性の記憶媒体とを含む。記憶部14は、諸々のデータを記憶する。
【0020】
制御部11は、色変換部111と、特徴点抽出部112と、候補領域抽出部113と、パッチ画像切出部114と、モデル構築部115と、評価部116と、後処理部117と、評価結果表示部118と、合成部119と、を備える。
色変換部111は、カラー画像をグレースケール画像に変換する。また、色変換部111は、RGB色空間の入力画像をCIE−Lab色空間の画像に変換する機能を有している。
特徴点抽出部112は、複素モーメントフィルタ(CMF−2RS)を用いて、入力画像または入力画像に対して色情報の変更を行った画像に含まれる二回対称点を特徴点として抽出する。つまり、特徴点抽出部112は、入力画像を180°回転させても変わらない点の集合を検出する。特徴点抽出部112は、検出した特徴点を抽出したPb(probability)画像を生成する。
候補領域抽出部113は、特徴点抽出部112によって抽出された特徴点に基づいて、Pb画像から候補領域を抽出する。ここで候補領域とは、線状の領域のことである。候補領域抽出部113は、しきい値による二値化処理および細線化処理を行って候補領域の抽出を行う。
パッチ画像切出部114は、学習用画像と評価用画像から矩形の小領域を切り出したパッチ画像を生成する。
モデル構築部115は、学習用画像から切り出された対象物が写ったパッチ画像を学習して、対象物を検出するための評価モデルを構築する。評価モデルの構築には、例えば畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)等の深層学習を用いる。
評価部116は、評価用画像から切り出されたパッチ画像に線状の対象物が含まれているかどうかを、評価モデルに基づいて評価する。
後処理部117は、評価部116による評価結果が示す線状の領域について、ノイズを除去する後処理を行う。
評価結果表示部118は、評価用画像に含まれる線状の対象物に対する検出結果を表示する。例えば、評価結果表示部118は、評価用画像中における線状の対象物が写った領域に印を付す等した画像を生成して、その画像を出力する。
合成部119は、特徴点抽出部112がカラー画像に含まれる複数の色空間画像(色チャンネル画像)の各々について、特徴点の抽出処理を行った場合、その結果の各特徴点抽出画像を合成し、1つのPb画像を生成する。
【0021】
なお、制御部11は、画像処理装置10の備えるCPU(Central Processing Unit)が記憶部14からプログラムを読み出し実行することで備わる機能である。
【0022】
画像処理装置10は、学習用画像を取得し、特徴点の抽出、候補領域の抽出、パッチ画像の切り出しの各工程を経て、パッチ画像に含まれる線状の対象物の特徴をCNNにより学習して評価モデルを構築する。評価モデルを構築した後は、画像処理装置10は、評価用画像を取得し、評価用画像からパッチ画像を切り出し、先に構築した評価モデルに基づいてパッチ画像に線状の対象物が含まれているかどうかを評価する。以下、各工程の処理について
図2〜
図8を用いて説明する。
【0023】
図2は、本発明の一実施形態による特徴点の抽出処理を説明する第1の図である。
図3は、本発明の一実施形態による特徴点の抽出処理を説明する第2の図である。
まず、ユーザが画像処理装置10に学習用画像を入力する。ここで、学習用画像は、RGB色空間の画像である。画像処理装置10では、入力部12が、学習用画像を取得し、記憶部14に記録する。制御部11は、学習用画像を記憶部14から読み出して、色変換部111が学習用画像をRGB色空間のカラー画像からグレースケール画像へ変換する。
次に特徴点抽出部112が、グレースケール画像から特徴点(二回対称点)を検出する処理を行う。特徴点抽出部112は、複素モーメントフィルタ(CMF―2RS)によって、特徴点の検出を行う。本実施形態で使用する複素モーメントフィルタについては、非特許文献2に開示がある。非特許文献2には、円対称点・非円対称点、エッジ、コーナー抽出のアルゴリズムが記載されている(「3.5特徴抽出のアルゴリズム」)。本実施形態で用いる複素モーメントフィルタ(CMF―2RS)の抽出アルゴリズムの概要を
図3に示す。ここで、学習用画像は連続画像ではなく、これをサンプリングした離散画像である。特徴点抽出部112は、この離散画像における局所画像の複素モーメントを計算するためにまず、オペレータh
1、h
2、・・・、h
n、・・・、h
Nを算出する。Nは、複素モーメントの最大次数である。次に特徴点抽出部112は、各オペレータh
1、h
2、・・・、h
Nから複素モーメントc
1、c
2、・・・、c
n、・・・、c
Nを算出する。オペレータや複素モーメントの算出式は、非特許文献2に記載がある。N個の異なる次数の複素モーメントc
1、c
2、・・・、c
Nを算出すると、特徴点抽出部112は、下記の式(1)から特徴量S
symを求める。式(1)に示すように「2の倍数の次数の複素モーメントの和」と「2の倍数以外の次数の複素モーメントの和」の差が二回対称点の特徴量である。
【0025】
特徴点抽出部112は、特徴量S
symと所定の閾値を比較し、閾値より大きい局所画像を二回対称点として抽出する。
図2の右図に、CMF−2RSによって特徴点抽出部112が抽出した特徴点を強調したPb画像の例を示す。
【0026】
なお、入力画像にノイズが多く含まれている場合など、特徴点の抽出処理の前に平滑化処理を行ってもよい。
【0027】
また、入力画像がカラー画像の場合、グレースケール化するよりも色情報を保持した画像(例えば各色チャンネル画像)に対して、複素モーメントフィルタによる特徴点の抽出を行った方が、色情報に検出対象の二回対称点の特徴が多く含まれている等の理由により、抽出精度が向上する可能性がある。その場合、特徴点抽出部112は、各色チャンネル画像(例えば、Rチャンネル画像、Gチャンネル画像、Bチャンネル画像)について特徴点の抽出を行って特徴点抽出画像を生成し、合成部119が、それらの画像を合成(例えば、1:1:1の比で合成)してPb画像を生成しても良い。また、入力画像がRGB色空間の画像であって、CIE−Lab色空間の画像に変換した方が、特徴点の抽出精度が向上する可能性がある。このような場合、色変換部111は、入力画像をRGB色空間の画像からCIE−Lab色空間の画像へ変換する。例えば、色変換部111は、入力画像(学習用画像)からCIE−Lab色空間の各チャンネルL*、a*、b*に対応するL*画像、a*画像、b*画像を生成する。そして、特徴点抽出部112が、L*画像、a*画像、b*画像のそれぞれから二回対称点を抽出する処理を行う。また、合成部119は、L*画像から生成した特徴点抽出画像、a*画像からから生成した特徴点抽出画像、b*画像からから生成した特徴点抽出画像を、2:1:1の比で合成してPb画像を生成してもよい。なお、2:1:1の割合で合成するのは、L*は明度、a*、b*は色度を表しており、明度からの情報と色度からの情報を1:1にするため、このような比率とする。
【0028】
特徴点の抽出処理を行うと、次に候補領域抽出部113が、Pb画像中の検出対象の候補となる領域(線状の領域)を抽出する処理を行う。
図4は、本発明の一実施形態による候補領域の抽出処理を説明する図である。
候補領域の抽出処理では、しきい値処理と細線化処理を行う。まず、候補領域抽出部113は、Pb画像を入力し、所定のしきい値により、Pb画像から二値画像を生成するしきい値処理を行う。実験では、正規化していないPb画像に対してしきい値「0」を設定し、画素値が0以上の領域をヒビとして抽出することで安定した検出が可能であることが確認された。
図4の左図にPb画像を、中図にPb画像から生成された二値画像を示す。
【0029】
次に候補領域抽出部113は、二値画像に対して細線化処理を行う。細線化処理とは、二値画像においてある太さ以上の領域を軸だけにする処理である。細線化処理には、SkeltoningやThiningと呼ばれる処理方法が存在する。候補領域が少ない方が、評価モデルで線状の対象物を含むかどうかを分類する際の計算時間を短縮することができるため、細線化処理を行う。また、ヒビ(線状領域)が存在する位置を検出するのが目的であるため、細線化処理を行っても検出精度が低下することがない。
図4の右図に二値画像に対して細線化処理を行った結果の画像(候補領域抽出画像)を示す。
【0030】
次に候補領域抽出画像に基づいて、学習用画像から候補領域を含んだパッチ画像を生成する。
図5は、本発明の一実施形態によるパッチ画像の切り出し処理を説明する図である。
候補領域抽出画像が生成されると、パッチ画像切出部114が、学習用画像(最初に入力した学習用画像)から候補領域を含んだパッチ画像を切り出す。具体的には、パッチ画像切出部114は、候補領域抽出画像に含まれる各候補領域の重心の座標情報を計算する。パッチ画像切出部114は、計算した重心の座標を中心とする候補領域を含む矩形領域の画像を、学習用画像から切り出す(パッチ画像)。パッチ画像切出部114は、各候補領域(線状の領域)についてパッチ画像を生成する。このとき、パッチ画像切出部114は、候補領域の全領域を対象としてパッチ画像を生成する。これらのパッチ画像は、CNNによる評価モデルを学習する際に教師データとして用いられる。
【0031】
次に評価用画像からパッチ画像を生成する処理について
図5を用いて説明する。評価用画像についても、これまで説明したものと同様の処理(特徴点の抽出、候補領域の抽出)を行って候補領域抽出画像を生成する。評価用画像の場合、パッチ画像切出部114は、パッチ画像を生成する前に候補領域抽出画像に対してラベリングを行ってラベル画像を生成する。ここで、ラべリングとは、1つながりの候補領域のそれぞれを区別するために、候補領域ごとに通し番号などの識別情報を付す処理のことをいう。パッチ画像切出部114は、評価用画像とラべル画像を読み込んで、異なるラベルが付された線状領域のそれぞれについて、評価用画像の対応する領域から複数の小領域を切り出してパッチ画像を生成する。
【0032】
評価用画像からパッチ画像を生成する場合、パッチ画像切出部114は、ひとつながりの線状形状(1つのラベルが付された候補領域)の全領域を対象として、全領域から省略なく矩形の小領域を切り出してパッチ画像を生成する必要はない。例えば、線状形状の一部のみを対象として、その一部を含む画像だけから複数のパッチ画像を生成してもよい。これは、対象物が線状形状の場合、その一部だけが検出できれば残りの領域についても把握することができるためである。評価対象となるパッチ画像の数を少なくすることで、CNNによる評価処理を高速化することができる。
【0033】
次に対象候補領域を含んだ複数のパッチ画像を用いて線状の対象物の特徴を学習した評価モデルを構築する。
図6は、本発明の一実施形態によるCNNモデルのネットワーク構成の一例を示す図である。
評価モデルの構築には、CNN(Convolutional Neural Network)を用いることができる。CNNとは、ニューラルネットワークの一種で画像処理の分野で広く用いられている。CNNのモデルは、畳み込み層(Convolutional Layer)、プーリング層(Pooling Layer)、局所応答正規化層(LRN層)を備えており、一般的なニューラルネットワークよりも複雑で膨大な教師データに対応することができる。また、ニューラルネットワークを用いると、SVM(support vector machine)等の機械学習と比較して分類器の構築だけではなく、同時に特徴量を抽出するフィルタの構築も行うことができる。本実施形態では、CNNを用いて検出対象と検出対象以外を分類する評価モデル(CNNモデル)を構築する。
図6に本実施形態における評価モデルの構造の一例を示す。CNNモデルのネットワーク構造は、(1)入力画像は例えば、20×20ピクセルのパッチ画像をRGBの3チャンネルに分けて得られる画像、32個の5×5の2次元フィルタから成る1つ目の畳み込み層(2)、1つ目のプーリング層及びLRN層(3)、64個の5×5の2次元フィルタから成る2つ目の畳み込み層(4)、2つ目のプーリング層及びLRN層(5)、1600次元の特徴量空間を1024次元に分類する全結合層(6)、1024次元の特徴量空間を2次元(true、false)に分類する全結合層(7)、から構成される。適切なCNNモデルのネットワーク構造は教師データの数や、画像の解像度などに応じて異なる。ただし、同程度の解像度や教師画像の数の場合、CNNモデルのネットワーク構造を調整することなく評価モデルを構築することができる。
【0034】
モデル構築部115は、パッチ画像のうち候補領域を含む画素に対し、例えば「1」のラベルを付し、候補領域を含まない画素に対しては、例えば「0」のラベルを付した教師データをCNNモデルに投入し、CNNによる学習を行って学習済みのモデル(評価モデル)を構築する。
評価部116は、評価用画像から生成されたパッチ画像を評価モデルに入力し、各パッチ画像に検出対象の線状の対象物が含まれているかどうかを示す予測ラベルを得る。例えば、予測ラベル「1」が出力された場合、パッチ画像(評価用)の当該画素には線状の対象物が含まれている可能性が高いことを示す。予測ラベル「0」が出力された場合、パッチ画像(評価用)の当該画素には線状の対象物が含まれていない可能性が高いことを示す。評価部116は、
図5で説明した異なるラベルを付した線状領域ごとに切り出されたパッチ画像の全てについて予測ラベルに基づく評価を行い、線状領域ごとにその領域がヒビかどうかを判定する。その際、評価部116は、異なるラベルが付された線状領域ごとに抽出されたパッチ画像の各々についてCNNを用いてヒビである確率を算出する。例えば、評価部116は、パッチ画像から予測ラベル「1」が出力された画素数が1つのパッチ画像を形成する全画素数に占める割合に応じた確率を算出する。評価部116は、1つのラベルに対応する線状領域から生成された各パッチ画像について算出した確率の平均値を算出し、その平均値を当該ラベルが付された線状領域が検出対象(ヒビ)である確率とする。評価部116は、この確率が所定の閾値を超えていれば、当該ラベルが付された線状領域は、検出対象であると評価する。
【0035】
全てのパッチ画像について、評価部116による評価が完了すると、評価用画像は線状領域が含まれる部分と、それ以外の部分に分類される。ここで、検出の対象とするのは、ある程度の長さを有した線状の領域であり、例えば数ピクセル程度の領域であればノイズとみなせることから、そのようなノイズを除去するために後処理を行う。具体的には、後処理部117は、評価部116が検出対象と評価した全ての線状領域について、その面積(ピクセル数)をカウントする。そして、後処理部117は、ピクセル数が所定の閾値以下の領域については、ノイズとみなして除去する処理を行う。
図7に後処理の様子を示す。
【0036】
図7は、本発明の一実施形態による後処理を説明する図である。
図7の左図は、評価用画像に対する評価モデルによる評価結果から得られる線状領域を示している。図の白い領域が線状領域である。この図は、例えば、評価用画像に対して、特徴点の抽出処理、候補領域の抽出処理、パッチ画像の切り出し、CNNによる分類を行い、その分類結果を、候補領域の抽出処理で得られた候補領域抽出画像に対して適用したものである。後処理部117は、
図7の左図に例示する画像を読み込んで、ひとつながりの白い領域ごとにピクセル数を合計する。後処理部117は、合計したピクセル数が所定の閾値以下の線状領域(例えば、左図の丸で囲った2つの線状領域)についてはこれを除去し、
図7の右図に例示する画像を生成する。
図7の右図は、評価用画像に含まれる線状領域を示す最終的な画像である。
【0037】
次に評価結果表示部118は、後処理後の画像に基づいて、線状の対象物を表示する。
図8は、本発明の一実施形態による対象物の検出処理結果を示す図である。
図8の左図は、評価対象となるコンクリート構造物の画像である。右図は、評価結果を示す表示を追加したコンクリート構造物の画像である。検出対象の線状の対象物は、ヒビである。評価結果表示部118は、評価部116によって、線状の対象物が含まれている可能性が高いと評価された領域を強調する表示を行ってヒビの検出結果を表示する。
【0038】
最後に画像処理装置10による線状の対象物の検出処理の流れを説明する。
図9は、本発明の一実施形態による画像処理装置による対象物検出処理の一例を示すフローチャートである。
まず、ユーザが、学習用画像を画像処理装置10に入力し、評価モデルの構築を指示する。入力部12は、学習用画像を取得し(ステップS1)、記憶部14に記録する。また、制御部11は、評価モデルの構築処理を開始する。まず、色変換部111は、記憶部14から学習用画像を読み出して、学習用画像をカラー画像(RGB画像)からグレースケール画像に変換する(ステップS2)。
【0039】
次に特徴点抽出部112が、複素モーメントフィルタ(CMF−2RS)によって特徴点を抽出する(ステップS3)。具体的には、特徴点抽出部112は、グレースケール画像から二回対称点の抽出を行ったPb画像を生成する。
【0040】
次に候補領域抽出部113が、ステップS3で生成されたPb画像についてしきい値処理を行って二値画像を生成する(ステップS4)。次に候補領域抽出部113は、生成した二値画像の線状領域に対して、細線化処理を行う(ステップS5)。この細線化処理により、候補領域抽出画像が生成される。
【0041】
次にパッチ画像切出部114が、候補領域抽出画像に基づいて、学習用画像から所定のサイズの矩形のパッチ画像(学習用)を複数切り出す(ステップS6)。例えば、パッチ画像切出部114は、候補領域(線状領域)が含まれる部分については、その候補領域に係る全ての画素が何れかのパッチ画像に含まれるように矩形領域を切り出す。パッチ画像切出部114は、ユーザの指示により、生成したパッチ画像(学習用)の各画素に対し、候補領域を含むか否かのラベルを付す。例えば、線状領域を含む画素にはラベル「1」を付し、線状領域を含まない画素にはラベル「0」を付す。ラベルが付された各パッチ画像(学習用)は、評価モデル構築の教師データとして用いられる。
【0042】
次にモデル構築部115が、CNNにより学習済みモデル(評価モデル)を構築する(ステップS7)。モデル構築部115は、構築した評価モデルを記憶部14に記録する。
以上で、評価モデルの構築処理が完了する。
【0043】
次に評価モデルに基づいて、評価用画像から対象物を検出する処理を行う。まず、ユーザが、評価用画像を画像処理装置10に入力し、対象物の検出を指示する。入力部12は、評価用画像を取得し(ステップS8)、記憶部14に記録する。また、制御部11が、線状の対象物を検出する処理を開始する。まず、パッチ画像切出部114が、パッチ画像(評価用)を切り出す(ステップS9)。例えば、制御部11の各機能部が学習用画像と同様にステップS2〜ステップS5と同様の処理を評価用画像について行って生成した候補領域抽出画像(評価用)の候補領域を含む部分について、パッチ画像切出部114は、例えば所定のサイズごとに矩形画像を切り出して複数のパッチ画像(評価用)を生成する。この際、パッチ画像切出部114は、処理の高速化のため、一つの線状領域(ラベル)から生成するパッチ画像の数を削減しても良い。
【0044】
次に評価部116は、評価用画像から切り出した全てのパッチ画像(評価用)を学習済みモデル(評価モデル)に入力して各パッチ画像の各画素に対する予測ラベルを得る。これにより、評価部116は、パッチ画像(評価用)に含まれる候補領域を検出する(ステップS10)。例えば、入力したパッチ画像(評価用)のうち線状の対象物が含まれる可能性が高い画素については、評価モデルは、予測ラベル「1」を出力し、候補領域を含まない画素については、評価モデルは、予測ラベル「0」を出力する。評価部116は、予測ラベルの値に基づいて各パッチ画像に検出対象が含まれている確率を算出し、ラベルを付した一つの線状領域から抽出した全パッチ画像の各々について算出した確率の平均値を算出し、この平均値に基づいて、当該線状領域が検出対象かどうかを評価する。次に後処理部117が、評価部116が検出対象であると判定した線状領域のうち面積が所定の閾値より小さい領域を除去する後処理を行う(ステップS11)。
【0045】
次に評価結果表示部118は、後処理を行って得られた線状領域を示す最終的な画像(
図7の右図)に基づいて、評価用画像のうち線状領域と特定された箇所を強調(例えば、
図8の右図)した画像を生成する。最後に出力部13が、評価結果表示部118が生成した画像を表示装置に出力し、検出処理の結果を表示する(ステップS12)。ユーザは、この表示結果を参照し、評価用画像のどの部分が検出対象の線状領域かを把握することができる。
【0046】
なお、ステップS2では、グレースケール画像に変換することとしたが、この変換を行わずに、特徴点抽出部112は、RGB色空間画像の各色チャンネル画像について特徴点抽出を行ってもよい。あるいは、色変換部111がRGB色空間画像をCIE−Lab色空間画像に変換し、特徴点抽出部112が、CIE−Lab色空間画像の各色チャンネル画像について特徴点抽出を行ってもよい。これらの場合、合成部119が、各色チャンネル画像から特徴点抽出を行って得られる特徴点抽出画像に対して所定の重み付けを行って合成しPb画像を生成する。また、入力画像やPb画像に対して、ノイズの除去(平滑化処理)を行ってもよい。
【0047】
本実施形態の画像処理装置10によれば、複素モーメントフィルタを用いて特徴点の抽出を行うので、一般的な特徴点の抽出法に比べて、画像毎のパラメータ調整の負担を低減することができる。また、一般的な特徴点の抽出法を用いた場合、ノイズが多い画像から細かなヒビを検出することは困難であるが、複素モーメントフィルタを用いることで、ノイズ存在下でも安定して特徴点(二回対称点)の抽出を行うことができる。従って、特徴点の抽出処理に続く、候補領域の抽出処理によって精度良く線状の候補領域を抽出することができる。また、候補領域の抽出処理において細線化処理を行って候補領域を減らすことにより、検出精度を低下させることなく処理の高速化を図ることができる。
また、評価モデルの構築にはCNNを用いるので、検出対象が画像に含まれるかどうかを分類する分類器に加え、検出対象を分類するための特徴量を抽出するフィルタを学習して構築することができる。これにより、精度の高い評価モデルを構築することができる。
また、評価用画像について評価モデルによる線状の対象物の分類を行った後にノイズの除去(後処理)を行うことにより、検出精度を高めることができる。
これら適切な各処理方法を組み合わせることにより、効率的かつ精度良く線状の対象物の検出処理を行うことができる。
【0048】
なお、上記の説明では、コンクリートの構造物に生じたヒビを検出する場合を例に説明を行ったが、検出対象はこの例に限定されない。例えば、生体画像(例えば、網膜画像)における毛細血管の検出などに適用することができる。
【0049】
図10は、本発明の一実施形態による画像処理装置のハードウェア構成の一例を示す図である。
コンピュータ900は、CPU901、主記憶装置902、補助記憶装置903、入出力インタフェース904、通信インタフェース905を備える。
上述の画像処理装置10は、コンピュータ900に実装される。そして、上述した各処理部の動作は、プログラムの形式で補助記憶装置903に記憶されている。CPU901は、プログラムを補助記憶装置903から読み出して主記憶装置902に展開し、当該プログラムに従って上記処理を実行する。また、CPU901は、プログラムに従って、記憶部14に対応する記憶領域を主記憶装置902に確保する。また、CPU901は、プログラムに従って、処理中のデータを記憶する記憶領域を補助記憶装置903に確保する。
【0050】
なお、画像処理装置10の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより制御部11による処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、CD、DVD、USB等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また、このプログラムが通信回線によってコンピュータ900に配信される場合、配信を受けたコンピュータ900が当該プログラムを主記憶装置902に展開し、上記処理を実行しても良い。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。なお、画像処理装置10は、複数のコンピュータ900によって構成されていても良い。
【0051】
その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。なお、後処理部117はノイズ除去部の一例である。評価部116は特定部の一例である。画像処理装置10は画像処理システムの一例である。