(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-01
(45)【発行日】2022-12-09
(54)【発明の名称】錆検出プログラム、錆検出システム及び錆検出方法
(51)【国際特許分類】
G01N 21/88 20060101AFI20221202BHJP
G06T 5/50 20060101ALI20221202BHJP
G06T 1/00 20060101ALI20221202BHJP
G06T 7/00 20170101ALI20221202BHJP
【FI】
G01N21/88 J
G06T5/50
G06T1/00 300
G06T7/00 350C
G06T7/00 610B
(21)【出願番号】P 2018146736
(22)【出願日】2018-08-03
【審査請求日】2021-06-03
(73)【特許権者】
【識別番号】510277752
【氏名又は名称】Automagi株式会社
(74)【代理人】
【識別番号】100114306
【氏名又は名称】中辻 史郎
(72)【発明者】
【氏名】西山 真
(72)【発明者】
【氏名】櫻井 将彦
【審査官】古川 直樹
(56)【参考文献】
【文献】特開2017-083990(JP,A)
【文献】米国特許出願公開第2017/0193680(US,A1)
【文献】米国特許出願公開第2017/0200260(US,A1)
【文献】特開2016-040650(JP,A)
【文献】特開2009-103508(JP,A)
【文献】特開平05-101164(JP,A)
【文献】河村 圭 他,画像処理とニューラルネットワークを利用した耐候性鋼材のさび外観評価,ファジィシステムシンポジウム講演論文集,日本知能情報ファジィ学会,2008年,Vol.24,p.472-477
(58)【調査した分野】(Int.Cl.,DB名)
G01N21/84-G01N21/958
G06T1/00-G06T1/60
G06T7/00-G06T7/90
G06N3/00-G06N3/12
G06N7/08-G06N99/00
(57)【特許請求の範囲】
【請求項1】
点状分布に対して高い表現力を持つ高再現率の深層学習モデルである第1の学習モデルに対象物を撮像した画像を入力し、該第1の学習モデルから出力された情報に基づいて、前記対象物における
第1の錆候補領域を検出する第1の
錆候補領域検出手順と、
線状の連結性に対して高い表現力を持つ高適合率の深層学習モデルである第2の学習モデルに前記画像を入力し、該第2の学習モデルから出力された情報に基づいて、前記対象物における
第2の錆候補領域を検出する第2の
錆候補領域検出手順と、
前記第1の
錆候補領域検出手順によ
り検出された前記第1の錆候補領域と、前記第2の
錆候補領域検出手順によ
り検出された前記第2の錆候補領域とに基づいて、前記対象物における錆の発生領域を判定する判定手順と
をコンピュータに実行させることを特徴とする錆検出プログラム。
【請求項2】
前記第1の学習モデルは、エンコードとデコードを行う多層ニューラルネットワークであり、
前記第2の学習モデルは、畳み込みによる集約を行う多層ニューラルネットワークである
ことを特徴とする請求項1に記載の錆検出プログラム。
【請求項3】
前記第1の学習モデル及び前記第2の学習モデルは、前記画像の画素毎に錆を形成する画素である確率を出力し、
前記第1の錆
候補領域検出手順は、前記第1の学習モデルから出力される画素毎の確率が第1の閾値を超える画素を
、前記第1の錆候補領域を形成する画素として検出し、
前記第2の
錆候補領域検出手順は、前記第2の学習モデルから出力される画素毎の確率が前記第1の閾値と異なる第2の閾値を超える画素を
、前記第2の錆候補領域を形成する画素として検出する
ことを特徴とする請求項1又は2に記載の錆検出プログラム。
【請求項4】
前記判定手順は、
前記第1の
錆候補領域検出手順に検出され
た前記第1の錆候補領域の一部をなし、かつ、前記第2の
錆候補領域検出手順にて検出された
前記第2の錆候補領域の一部をなす画素を、前記錆の発生領域を形成する画素であると判定することを特徴とする請求項1乃至3のいずれか一つに記載の錆検出プログラム。
【請求項5】
前記第1の学習モデルと前記第2の学習モデルは、同一の学習用データによる教師有り学習が行われたことを特徴とする請求項1乃至4のいずれか一つに記載の錆検出プログラム。
【請求項6】
前記判定手順による判定結果に基づいて、前記対象物における錆の発生
領域を表示制御する表示制御手順をさらにコンピュータに実行させることを特徴とする請求項1乃至5のいずれか一つに記載の錆検出プログラム。
【請求項7】
前記判定手順による判定結果に基づいて、前記対象物の老朽化の度合いを示す数値を算定する数値化手順をさらにコンピュータに実行させることを特徴とする請求項1乃至6のいずれか一つに記載の錆検出プログラム。
【請求項8】
点状分布に対して高い表現力を持つ高再現率の深層学習モデルである第1の学習モデルに対象物を撮像した画像を入力し、該第1の学習モデルから出力された情報に基づいて、前記対象物における
第1の錆候補領域を検出する第1の
錆候補領域検出部と、
線状の連結性に対して高い表現力を持つ高適合率の深層学習モデルである第2の学習モデルに前記画像を入力し、該第2の学習モデルから出力された情報に基づいて、前記対象物における
第2の錆候補領域を検出する第2の
錆候補領域検出部と、
前記第1の
錆候補領域検出部によ
り検出された前記第1の錆候補領域と、前記第2の
錆候補領域検出部によ
り検出された前記第2の錆候補領域とに基づいて、前記対象物における錆の発生領域を判定する判定部と
を備えたことを特徴とする錆検出システム。
【請求項9】
点状分布に対して高い表現力を持つ高再現率の深層学習モデルである第1の学習モデルに対象物を撮像した画像を入力し、該第1の学習モデルから出力された情報に基づいて、前記対象物における
第1の錆候補領域を検出する第1の
錆候補領域検出工程と、
線状の連結性に対して高い表現力を持つ高適合率の深層学習モデルである第2の学習モデルに前記画像を入力し、該第2の学習モデルから出力された情報に基づいて、前記対象物における
第2の錆候補領域を検出する第2の
錆候補領域検出工程と、
前記第1の
錆候補領域検出工程によ
り検出された前記第1の錆候補領域と、前記第2の
錆候補領域検出工程によ
り検出された前記第2の錆候補領域とに基づいて、前記対象物における錆の発生領域を判定する判定工程と
を含んだことを特徴とする錆検出方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、錆の存在を検出する錆検出プログラム、錆検出システム及び錆検出方法に関する。
【背景技術】
【0002】
従来、橋梁や鉄塔などのインフラ設備の老朽化を定期的に監視することが行われている。
【0003】
例えば、特許文献1には、社会インフラを撮影した画像を格納する撮影写真DBと、社会インフラ位置情報及び社会インフラの損傷状況と社会インフラ名を含む点検情報を格納する点検情報DBと、タブレット端末のカメラアプリ画面に既撮影画像を透かしの撮影構図画像として重複表示させる機能と、撮影した撮影画像と既撮影画像とを比較して相違があるときに撮影画像を既撮影画像の構図に合わせてマッチング補正を行う機能と、該マッチング補正した撮影画像と既撮影画像とを比較して破損及び錆色濃度変化による損傷程度を判別する機能とを有する管理サーバを備えた損傷状況判定システムが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、このようなインフラ設備の状態の判定、特に錆の検出について効率化が要望されている。
【0006】
本発明は、上記従来技術の課題を解決するためになされたものであって、錆の検出を効率化することができる錆検出プログラム、錆検出システム及び錆検出方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決するため、本発明は、点状分布に対して高い表現力を持つ高再現率の深層学習モデルである第1の学習モデルに対象物を撮像した画像を入力し、該第1の学習モデルから出力された情報に基づいて、前記対象物における第1の錆候補領域を検出する第1の錆候補領域検出手順と、線状の連結性に対して高い表現力を持つ高適合率の深層学習モデルである第2の学習モデルに前記画像を入力し、該第2の学習モデルから出力された情報に基づいて、前記対象物における第2の錆候補領域を検出する第2の錆候補領域検出手順と、前記第1の錆候補領域検出手順により検出された前記第1の錆候補領域と、前記第2の錆候補領域検出手順により検出された前記第2の錆候補領域とに基づいて、前記対象物における錆の発生領域を判定する判定手順とをコンピュータに実行させることを特徴とする。
【0008】
また、本発明は、点状分布に対して高い表現力を持つ高再現率の深層学習モデルである第1の学習モデルに対象物を撮像した画像を入力し、該第1の学習モデルから出力された情報に基づいて、前記対象物における第1の錆候補領域を検出する第1の錆候補領域検出部と、線状の連結性に対して高い表現力を持つ高適合率の深層学習モデルである第2の学習モデルに前記画像を入力し、該第2の学習モデルから出力された情報に基づいて、前記対象物における第2の錆候補領域を検出する第2の錆候補領域検出部と、前記第1の錆候補領域検出部により検出された前記第1の錆候補領域と、前記第2の錆候補領域検出部により検出された前記第2の錆候補領域とに基づいて、前記対象物における錆の発生領域を判定する判定部とを備えたことを特徴とする。
【0009】
また、本発明は、点状分布に対して高い表現力を持つ高再現率の深層学習モデルである第1の学習モデルに対象物を撮像した画像を入力し、該第1の学習モデルから出力された情報に基づいて、前記対象物における第1の錆候補領域を検出する第1の錆候補領域検出工程と、線状の連結性に対して高い表現力を持つ高適合率の深層学習モデルである第2の学習モデルに前記画像を入力し、該第2の学習モデルから出力された情報に基づいて、前記対象物における第2の錆候補領域を検出する第2の錆候補領域検出工程と、前記第1の錆候補領域検出工程により検出された前記第1の錆候補領域と、前記第2の錆候補領域検出工程により検出された前記第2の錆候補領域とに基づいて、前記対象物における錆の発生領域を判定する判定工程とを含んだことを特徴とする。
【発明の効果】
【0010】
本発明によれば、錆の検出を効率化することができる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、本実施の形態に係る錆検出プログラムについての説明図である。
【
図2】
図2は、錆検出の具体例についての説明図である。
【
図3】
図3は、錆検出システムのシステム構成を示すシステム構成図である。
【
図4】
図4は、錆検出装置の表示例についての説明図である。
【
図5】
図5は、錆検出装置の処理手順を示すフローチャートである。
【
図6】
図6は、高再現率モデルの具体例についての説明図である。
【
図7】
図7は、高適合率モデルの畳み込みにおける変換カーネルの説明図である。
【
図8】
図8は、ハードウエア構成の一例を示す図である。
【発明を実施するための形態】
【0012】
以下、添付図面を参照して、本発明の実施形態に係る錆検出プログラム、錆検出システム及び錆検出方法の実施形態を説明する。
【0013】
本実施の形態では、対象物を撮像した画像を取り込み、第1及び第2の2つの学習モデルに画像を入力し、それぞれの学習モデルで錆の存在を検出し、2つの検出結果を用いて対象物における錆の発生領域を判定する。
【0014】
図1は、本実施の形態に係る錆検出プログラムについての説明図である。錆検出プログラムは、対象物を撮像した画像を取り込むと、取り込んだ画像に対して前加工を行い、2つの学習モデルにそれぞれ入力する。
【0015】
2つの学習モデルは、それぞれ深層学習による学習済みのモデルであり、一方は高再現率モデル、他方は高適合率モデルである。高再現率モデル及び高適合率モデルは、画像の入力を受け付けると、各画素について錆領域である可能性を求めて出力する。なお、学習モデルが高再現率であるか又は高適合率であるかは、利用する学習モデルの特性を比較して相対的に定められる。つまり、ある学習モデルが本発明に用いられる別の学習モデルより再現率が高い場合には、当該学習モデルを第1の学習モデルとして用いることができ、適合率が高い場合には、第2の学習モデルとして用いることができる。なお、第1の学習モデルの再現率は、例えば95パーセント程度であることが好ましく、第2の学習モデルとの再現率の差は10パーセント以下であることが好ましい。第2の学習モデルの適合率は、例えば90パーセント程度であることが好ましく、第1の学習モデルとの適合率の差は10パーセント以下であることが好ましい。
【0016】
ここで、高再現率モデルは点状分布に対して高い表現力を持ち、非錆領域を誤検出することがあるが、錆領域のとりこぼしが少ない検出性能の高いモデルである。一方、高適合率モデルは、線状の連結性に対して高い表現力を持ち、誤検出が少ない汎化性能の高いモデルである。
【0017】
従って、同一の前加工が施された画像を高再現率モデル及び高適合率モデルに入力したとしても、各画素について高再現率モデルと高適合率モデルとがそれぞれ求めた「錆領域である可能性」は同一となるとは限らず、通常は異なる値となる。
【0018】
錆検出プログラムは、それぞれのモデルが出力した各画素の「錆領域である可能性」と閾値とを比較し、「錆領域である可能性」が閾値を超える画素を錆候補領域の画素として検出する。
【0019】
錆候補領域の検出に使用する閾値は、適宜定めることができ、例えば高再現率モデルと高適合率モデルとで異ならせることができる。すなわち、高再現率モデルの出力は高適合率モデル用の閾値と比較され、高適合率モデルの出力は高適合率モデル用の閾値と比較されてもよい。
【0020】
錆検出プログラムは、入力した各画素について第1の学習モデルによる錆候補領域の検出結果と第2の学習モデルによる錆候補領域の検出結果とが得られたならば、2つの検出結果を合成し、錆領域の判定結果とする。この合成では、第1及び第2の学習モデルの双方で錆候補領域として検出された画素が錆領域の画素と判定される。また、後述するように、錆領域の判定においては、各画素についての判定の確かさ、すなわち、錆領域であるかどうかの推定の確信度を求めることができる。
【0021】
各画素の確信度は、例えば第1の学習モデルと第2の学習モデルの出力に重みを付して合計することで求めればよい。また、この錆領域であるかどうかの推定の確信度は、対象物の老朽化の度合いを示す数値として用いることもできる。
【0022】
このように、錆検出プログラムは、対象物を撮像した画像を異なる2つの学習モデルに入力し、それぞれの学習モデルで錆の存在を検出し、2つの学習モデルによる検出結果を合成して対象物における錆の領域を判定するので、錆の検出を効率化することができる。また、錆検出プログラムによる錆の領域の判定結果は、老朽化の診断システムなど、各種業務システムに連携させることができる。
【0023】
図2は、錆検出の具体例についての説明図である。
図2では、対象物として橋梁を撮像した画像を取り込んでいる。取り込んだ画像に高再現率モデルによる錆検出を行うと、画像における錆候補領域の位置を示す第1の錆候補領域マップが検出結果として出力される。
図2に示した検出結果では、錆の可能性が閾値を超えた画素を白色、錆の可能性が閾値以下の画素を黒色としている。
【0024】
同様に、取り込んだ画像に高適合率モデルによる錆検出を行うと、画像における錆候補領域の位置を示す第2の錆候補領域マップが検出結果として出力される。
図2に示した検出結果では、錆の可能性が閾値を超えた画素を白色、錆の可能性が閾値以下の画素を黒色としている。
【0025】
高再現率モデルによる第1の錆候補領域マップと、高適合率モデルによる第2の錆候補領域マップとを比較すると、錆候補領域として検出される画素に差が生じている。これは、高適合率モデルは誤検出が少なく、高再現率モデルは取りこぼしが少ないというモデルの特性の違いによるものである。
【0026】
錆検出プログラムは、高再現率の第1の学習モデル及び高適合率の第2の学習モデルが出力した2種の錆候補領域検出結果を結合することで、適切に錆領域の判定を行うことができる。
【0027】
2種の錆候補領域検出結果の合成は、例えば、それぞれの錆候補領域と判定した画素の値を「1」、錆候補領域ではないと判定した画素の値を「0」とし、各画素の値について論理積を取ることで行えばよい。
【0028】
次に、錆検出システムのシステム構成について説明する。
図3は、錆検出システムのシステム構成を示すシステム構成図である。
図3では、対象物である橋梁をカメラ22や小型無人航空機21に設けた撮像部で撮像し、橋梁の画像をネットワーク経由で錆検出装置10に送信している。
【0029】
錆検出装置10は、通信部11、入力部12、表示部13、記憶部14及び制御部15を有する。通信部11は、カメラ22や小型無人航空機21から対象物の画像を受信する通信インタフェースである。入力部12は、キーボードやマウス等の入力デバイスである。表示部13は、液晶ディスプレイ装置等の表示デバイスである。
【0030】
記憶部14は、ハードディスク装置や不揮発性メモリ等の記憶デバイスであり、第2の学習モデル(以下、高適合率モデルデータ14aともいう)、第1の学習モデル(以下、高再現率モデルデータ14bともいう)、学習パターンデータ14c、錆領域データ14d及び老朽化評価データ14eを記憶する。
【0031】
高適合率モデルデータ14aは、高適合率モデルにおける多層ニューラルネットワークの構造と、層間パラメータとを特定するデータである。同様に、高再現率モデルデータ14bは、高再現率モデルにおける多層ニューラルネットワークの構造と、層間パラメータとを特定するデータである。
【0032】
学習パターンデータ14cは、学習用の入力データと正解の出力データがセットとなったサンプルデータである。学習パターンデータ14cは、高適合率モデルデータ14a及び高再現率モデルデータ14bの学習、すなわち、層間パラメータの最適化に用いられる。なお、学習の終了後、学習パターンデータ14cは削除しても良い。もしくは、既に学習済みの高適合率モデルデータ14a及び高再現率モデルデータ14bを用いる場合には、学習パターンデータ14cは不要である。
【0033】
錆領域データ14dは、入力された画像に対する錆領域の判定結果を示すデータである。老朽化評価データ14eは、対象物の老朽化の度合いの評価結果を示すデータである。
【0034】
制御部15は、錆検出装置10の全体を制御する制御部であり、画像取込部15a、前加工部15b、第1錆検出部15c、第2錆検出部15d、錆領域判定部15e及び老朽化度算定部15fを有する。実際には、これらの機能部に対応するプログラムを図示しないROMや不揮発性メモリに記憶しておき、これらのプログラムをCPU(Central Processing Unit)にロードして実行することにより、画像取込部15a、前加工部15b、第1錆検出部15c、第2錆検出部15d、錆領域判定部15e及び老朽化度算定部15fにそれぞれ対応するプロセスを実行させることになる。
【0035】
画像取込部15aは、対象物の像を含む画像を取得する処理部である。具体的には、画像取込部15aは、通信部11がカメラ22や小型無人航空機21から受信した画像を対象物の像を含む画像として取り込む。
【0036】
前加工部15bは、画像取込部15aが取り込んだ画像に対して前加工を行う処理部である。前加工としては、色調補正やエッジ強調など任意の画像処理を用いることができる。
【0037】
第1錆検出部15cは、前加工部15bによる前加工が行われた画像を第1の学習モデルに入力し、該第1の学習モデルから出力された情報に基づいて、対象物における錆の存在を検出する処理部である。
【0038】
第2錆検出部15dは、前加工部15bによる前加工が行われた画像を、第1の学習モデルとは構造が異なる第2の学習モデルに入力し、該第2の学習モデルから出力された情報に基づいて、対象物における錆の存在を検出する処理部である。
【0039】
具体的には、第1錆検出部15cは、高再現率モデルデータ14bを読み出して、画像を入力し、高再現率モデルから出力される画素毎の確率と第1の閾値とを比較し、第1の閾値を超える画素を第1の錆候補領域の画素として検出する。
【0040】
そして、第2錆検出部15dは、高適合率モデルデータ14aを読み出して、画像を入力し、高適合率モデルから出力される画素毎の確率と第2の閾値とを比較し、第2の閾値を超える画素を第2の錆候補領域の画素として検出する。
【0041】
錆領域判定部15eは、第1錆検出部15cによる検出結果と第2錆検出部15dによる検出結果とに基づいて、対象物における錆の発生領域を判定する処理部である。具体的には、錆領域判定部15eは、第1錆検出部15cにより錆候補領域として検出され、かつ、第2錆検出部15dにより錆候補領域として検出された画素が錆を形成する画素であると判定する。
【0042】
錆領域判定部15eは、判定結果を錆領域データ14dとして記憶部14に格納する。また、錆領域判定部15eは、錆領域データ14d、すなわち、対象物における錆の発生状況を表示部13に表示制御することができる。
【0043】
老朽化度算定部15fは、錆領域判定部15eによる判定結果に基づいて、対象物の老朽化の度合いを示す数値を算定する処理部である。例えば、高適合率モデルと高再現率モデルの出力に重みを付して合計することで錆領域であるとの推定の確信度を求め、この確信度を老朽化の度合いを示す数値として用いればよい。
【0044】
老朽化度算定部15fは、算定した画素毎の老朽化度を老朽化評価データ14eとして記憶部14に格納する。また、老朽化度算定部15fは、老朽化評価データ14eを表示部13に表示制御することができる。
【0045】
図4は、錆検出装置の表示例についての説明図である。
図4(a)に示すように、対象物の像を含む画像を取込んで錆領域の判定を行うと、
図4(b)に示す錆領域データを得ることができる。この錆領域データは、錆領域と判定した画素を特定の色に置き換えた画像データである。
【0046】
また、
図4(c)は、老朽化評価データの表示例である。
図4(c)では、老朽化の度合いを色に対応させたヒートマップを表示している。このように、老朽化の度合いの高低を画素の表示色を異ならせて表示することで、視覚的にわかりやすく表現することができる。
図4(c)の例においては、老朽化の度合いが低いほど画素の色を暗くし、老朽化の度合いが高いほど画素の色を明るくした画像データを表示している。具体的には、錆領域であるとの推定の確信度を、パーセンテージで算出し、当該パーセンテージと画素の色合いを対応付けて表示する。具体的には、当該領域が錆領域である確信度が100%である場合、当該領域をR=255,G=255,B=255に近い色で表示し、0%である場合には、R=0,G=0,B=0に近い色で表示し、これらの中間の確信度である場合には、確信度の高低によって選択される中間の色で表示することができる。この他、一定の老朽化度を超えた領域にハイライト等を付すなどして明確化して表示することもできる。これにより、老朽化が進行した部分を視覚的に把握しやすくできる。
【0047】
次に、錆検出装置10の処理手順について説明する。
図5は、錆検出装置10の処理手順を示すフローチャートである。まず、画像取込部15aは、通信部11がカメラ22や小型無人航空機21から受信した画像を対象物の像を含む画像として取得し(ステップS101)、前加工部15bは、画像取込部15aが取り込んだ画像に対して前加工を行う(ステップS102)。
【0048】
第1錆検出部15cは、前加工部15bによる前加工が行われた画像を第1の学習モデルに入力し(ステップS103)、画素毎の出力を第1の閾値とそれぞれ比較し、第1の閾値を超える画素により構成される領域を第1の錆候補領域として検出する(ステップS104)。
【0049】
第2錆検出部15dは、前加工部15bによる前加工が行われた画像を第2の学習モデルに入力し(ステップS105)、画素毎の出力を第2の閾値とそれぞれ比較し、第2の閾値を超える画素により構成される領域を第2の錆候補領域として検出する(ステップS106)。
【0050】
錆領域判定部15eは、第1の錆候補領域と第2の錆候補領域から錆領域を判定する(ステップS107)。また、老朽化度算定部15fは、錆領域の老朽化の度合いを示す老朽化度を算定する(ステップS108)。そして、判定した錆領域と、老朽化度とを表示部13などに適宜出力し(ステップS109)、処理を終了する。
【0051】
第1及び第2の学習モデルとしては、検出結果が互いに異なる学習モデルを用いることができる。特に、互いに異なる構造を有するモデルを用いることが好ましい。異なる構造を有する学習モデルが検出した錆候補領域を組み合わせることにより、より適切に錆領域を判定することができる。また、特に、以下に詳述するように、第1の学習モデルである高再現率モデルと第2の学習モデルである高適合率モデルを用いることが好ましい。なお、第1及び第2の学習モデルとしては、深層学習モデルを用いることが好ましい。これにより、画像の解析を精度よく行うことができ、錆領域の判定を効率よく行うことができる。
【0052】
次に、第1の学習モデルである高再現率モデルと第2の学習モデルである高適合率モデルの具体例について説明する。
図6は、高再現率モデルの具体的な一例についての説明図である。
図6に示した高再現率モデルは、プーリング層を用いたエンコードとデコードを行う多層ニューラルネットワークである。
【0053】
高再現率モデルに使用されているエンコードは、空間的な次元を徐々に減少させる処理である。その後、デコードにより、オブジェクトの詳細と空間的な次元を徐々に復元することになる。また、デコードにおける復元を補助するため、エンコード前の層から対応する次元の層へのコピー(ショートカット)を行っている。
【0054】
一方、高適合率モデルとしては、プーリング層を有さず畳み込みによる集約を行う多層ニューラルネットワークを用いることができる。プーリングは、分類ネットワークにおいて受容野が増える点において有効であるが、解像度の低下が分類において不利益となる場合がある。
【0055】
そこで、高適合率モデルでは、
図7に示すようなDilated畳み込み層を用いることができる。Dilated畳み込み層は、Atrous畳み込みとも呼ばれる。Dilated畳み込み層を用いることで、空間的な次元を減らすことなく、視野を指数関数的に増大することができる。
【0056】
図7は、高適合率モデルの畳み込みにおける変換カーネルの説明図である。
図7に示すように、3×3の変換カーネルのrateを1に設定すると、3×3の視野でオブジェクトの特徴を取得することになり、3×3の変換カーネルのrateを6に設定すると、13×13の視野でオブジェクトの特徴を取得することになる。そして、3×3の変換カーネルのrateを24に設定すると、47×47の視野でオブジェクトの特徴を取得することになる。このように、変換カーネルのrateを変更して特徴を取得し、合成すれば、オブジェクトの次元を維持しつつ、特徴の集約が可能である。
【0057】
次に、実施の形態に係る錆検出装置10と、コンピュータの主たるハードウエア構成の対応関係について説明する。
図8は、ハードウエア構成の一例を示す図である。
【0058】
一般的なコンピュータは、CPU31、ROM32、RAM33及び不揮発性メモリ34などがバス35により接続された構成となる。不揮発性メモリ34の代わりにハードディスク装置が設けられていても良い。説明の便宜上、基本的なハードウエア構成のみを示している。
【0059】
ここで、ROM32又は不揮発性メモリ34には、オペレーティングシステム(以下、単に「OS」と言う)の起動に必要となるプログラム等が記憶されており、CPU31は、電源投入時にROM32又は不揮発性メモリ34からOSのプログラムをリードして実行する。
【0060】
一方、OS上で実行される各種のアプリケーションプログラムは、不揮発性メモリ34に記憶されており、CPU31がRAM33を主メモリとして利用しつつアプリケーションプログラムを実行することにより、アプリケーションに対応するプロセスが実行される。
【0061】
そして、実施の形態に係る錆検出装置10の錆検出プログラムについても、他のアプリケーションプログラムと同様に不揮発性メモリ34等に記憶され、CPU31が、かかる錆検出プログラムをロードして実行することになる。実施の形態に係る錆検出装置10の場合には、
図3に示した画像取込部15a、前加工部15b、第1錆検出部15c、第2錆検出部15d、錆領域判定部15e及び老朽化度算定部15fに対応するルーチンを含む錆検出プログラムが不揮発性メモリ34等に記憶される。そして、CPU31により錆検出プログラムがロード実行されることにより、画像取込部15a、前加工部15b、第1錆検出部15c、第2錆検出部15d、錆領域判定部15e及び老朽化度算定部15fに対応するプロセスが生成される。
【0062】
上述してきたように、本実施の形態に係る錆検出プログラムは、対象物を撮像した画像を第1の学習モデルに入力し、該第1の学習モデルから出力された情報に基づいて、対象物における錆の存在を検出する第1の錆検出手順と、第1の学習モデルとは構造が異なる第2の学習モデルに画像を入力し、該第2の学習モデルから出力された情報に基づいて、対象物における錆の存在を検出する第2の錆検出手順と、第1の錆検出手順による検出結果と、第2の錆検出手順による検出結果とに基づいて、対象物における錆の発生領域を判定する判定手順とをコンピュータに実行させることで、錆の検出を効率化することができる。
【0063】
また、本実施の形態に係る錆検出プログラムは、第1の学習モデルとして点状分布に対して高い表現力を持つ高再現率の深層学習モデルを用い、第2の学習モデルとして線状の連結性に対して高い表現力を持つ高適合率の深層学習モデルを用いることができる。
【0064】
また、本実施の形態に係る錆検出プログラムは、第1の学習モデルとしてエンコードとデコードを行う多層ニューラルネットワークを用い、第2の学習モデルとして畳み込みによる集約を行う多層ニューラルネットワークを用いることができる。
【0065】
また、本実施の形態に係る錆検出プログラムでは、第1の学習モデル及び第2の学習モデルは、画像の画素毎に錆を形成する画素である確率を出力し、第1の錆検出手順は、第1の学習モデルから出力される画素毎の確率が第1の閾値を超える画素を検出し、第2の錆検出手順は、第2の学習モデルから出力される画素毎の確率が第1の閾値と異なる第2の閾値を超える画素を検出するよう構成することが望ましい。
【0066】
また、本実施の形態に係る錆検出プログラムは、第1の錆検出手順に検出され、かつ、第2の錆検出手順にて検出された画素が錆を形成する画素であると判定することで、錆を形成する画素を効率的に検出することができる。
【0067】
また、第本実施の形態に係る錆検出プログラムでは、1の学習モデルと第2の学習モデルとは、同一の学習用データによる教師有り学習が行われていることが望ましい。
【0068】
また、本実施の形態に係る錆検出プログラムは、判定手順による判定結果に基づいて、対象物における錆の発生状況を表示制御することが可能である。
【0069】
また、本実施の形態に係る錆検出プログラムは、判定手順による判定結果に基づいて、対象物の老朽化の度合いを示す数値を算定することができる。
【0070】
なお、本実施の形態では橋梁を対象物とする場合を例に説明を行ったが、本発明はこれに限定されるものではなく、鉄塔、プラントの構造体など、任意の対象物についての錆検出に適用する事ができる。
【0071】
また、本実施の形態では、錆検出プログラムを中心に説明を行ったが、錆検出システム、錆検出方法、錆検出装置など、任意の形態で実施することが可能である。また、錆検出装置として実施する場合には、コンピュータが錆検出プログラムを実行して錆検出装置としての動作を行なう構成であっても良いし、ハードウェア(ASIC、FPGAなど)で機能部を実現した構成であってもよい。
【0072】
また、上記の実施の形態で図示した各構成は機能概略的なものであり、必ずしも物理的に図示の構成をされていることを要しない。すなわち、各装置の分散・統合の形態は図示のものに限られず、その全部又は一部を各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、学習モデルは2つ以上が用いられても良い。
【符号の説明】
【0073】
10 錆検出装置
11 通信部
12 入力部
13 表示部
14 記憶部
14a 高適合率モデルデータ
14b 高再現率モデルデータ
14c 学習パターンデータ
14d 錆領域データ
14e 老朽化評価データ
15 制御部
15a 画像取込部
15b 前加工部
15c 第1錆検出部
15d 第2錆検出部
15e 錆領域判定部
15f 老朽化度算定部
21 小型無人航空機
22 カメラ
31 CPU
32 ROM
33 RAM
34 不揮発メモリ
35 バス