(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-30
(45)【発行日】2022-10-11
(54)【発明の名称】構造物劣化検出システム
(51)【国際特許分類】
G06T 7/00 20170101AFI20221003BHJP
G06V 10/82 20220101ALI20221003BHJP
G01N 21/88 20060101ALI20221003BHJP
【FI】
G06T7/00 350C
G06T7/00 610
G06V10/82
G01N21/88 J
(21)【出願番号】P 2018093639
(22)【出願日】2018-05-15
【審査請求日】2021-04-30
(73)【特許権者】
【識別番号】000233491
【氏名又は名称】株式会社日立システムズ
(74)【代理人】
【識別番号】110002066
【氏名又は名称】弁理士法人筒井国際特許事務所
(72)【発明者】
【氏名】井上 祐貴
(72)【発明者】
【氏名】永吉 洋登
(72)【発明者】
【氏名】大田 俊介
(72)【発明者】
【氏名】大西 健太郎
(72)【発明者】
【氏名】成田 賀仁
(72)【発明者】
【氏名】野口 孝史
(72)【発明者】
【氏名】植田 良一
(72)【発明者】
【氏名】仲村柄 真人
(72)【発明者】
【氏名】勝又 大介
【審査官】新井 則和
(56)【参考文献】
【文献】Mohammad Azam Khan et al.,Intelligent Fault Detection via Dilated Convolutional Neural Networks,2018 IEEE International Conference on Big Data and Smart Computing (BigComp),IEEE,2018年01月17日,729-731,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8367217
【文献】畳み込みニューラルネットワークを用いた地下鉄トンネルにおける変状検出に関する検討,映像情報メディア学会技術報告 Vol.41 No.5,映像情報メディア学会,2017年02月13日,81-86,マルチメディアストレージ (MMS2017-13) コンシューマエレクトロニクス (CE2017-13) ヒューマンインフォメーション (HI2017-13) メディア工学 (ME2017-37) 映像表現&コンピュータグラフィックス (AIT2017-13)
【文献】Lei Zhang et al.,Road crack detection using deep convolutional neural network,2016 IEEE International Conference on Image Processing (ICIP),IEEE,2016年08月19日,3708-3712,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7533052
【文献】Zhun Fan et al.,Automatic Pavement Crack Detection Based on Structured Prediction with the Convolutional Neural Network,Computer Vision and Pattern Recognition (cs.CV) arXiv:1802.02208, [online],2018年02月01日,[令和4年4月21日検索],インターネット <URL:https://arxiv.org/pdf/1802.02208.pdf>,https://arxiv.org/pdf/1802.02208.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
G06T 10/00-10/98
G01N 21/88
(57)【特許請求の範囲】
【請求項1】
計算機システム上に構成され、構造物の表面のひび割れを含む劣化を検出する構造物劣化検出システムであって、
前記計算機システムは、
前記構造物の表面が撮像された第1画像を入力として、深層学習を用いて、前記劣化の診断結果を表す情報を含む第2画像を出力する第1処理と、
前記第1画像および前記第2画像を含む情報を可視化して画面に表示し、ユーザによる入力操作を受け付ける第2処理と、
を行い、
前記深層学習のモデルを構成する畳み込みニューラルネットワークは、拡幅畳み込みフィルタを演算する拡幅畳み込み層を含み、
前記第1処理は、
訓練時に、訓練用画像データに基づいて、所定の第1入力サイズの第1画像パッチを前記モデルに入力して、第1出力サイズの第1診断結果画像を得る訓練処理と、
前記構造物の対象画像の診断時に、可変サイズとして前記第1入力サイズ以上である前記対象画像から、第2入力サイズの第2画像パッチを切り出し、各々の第2画像パッチを前記モデルに入力して、第2出力サイズの各々の第2診断結果画像を得る診断処理と、
を含
み、
前記モデルの前記拡幅畳み込みフィルタは、stride数が1であり、dilate数が2以上であり、
前記第2出力サイズは、縦横の画素数が複数であり、
前記第2画像は、画素毎に劣化推定確率値を持つ、
構造物劣化検出システム。
【請求項2】
請求項1記載の構造物劣化検出システムにおいて、
前記第2画像は、画素毎に劣化推定確率値を持ち、
前記第2処理は、前記画面の前記第2画像に対する前記ユーザの操作に基づいて、前記画素毎に前記診断結果が正解か否かを表す正解付け情報が入力された第3画像を作成する処理を含み、
前記第1処理は、前記第3画像を前記訓練処理に用いる、
構造物劣化検出システム。
【請求項3】
請求項1記載の構造物劣化検出システムにおいて、
前記第1処理は、前記訓練用画像データを作成するデータ拡張処理を含み、
前記データ拡張処理は、画像に対するシフト処理を伴わない反転処理およびノイズ付加処理を含む、
構造物劣化検出システム。
【請求項4】
請求項1記載の構造物劣化検出システムにおいて、
前記第1処理は、前記モデルによる診断結果またはユーザによる設定に基づいて、前記訓練用画像データとして前記モデルの誤検出の弱点を学習させるための弱点強調データを用いて前記訓練処理を行う処理を含む、
構造物劣化検出システム。
【請求項5】
請求項
4記載の構造物劣化検出システムにおいて、
前記弱点強調データは、植物画像または直線群画像を含む、
構造物劣化検出システム。
【請求項6】
請求項1記載の構造物劣化検出システムにおいて、
前記第1処理は、回転処理を含み、
前記回転処理は、前記第1画像パッチを回転させることで複数の画像を生成し、前記複数の画像の各々の画像を前記モデルに入力して、各々の診断結果画像から、画素毎に劣化推定確率値が最大の部分を抽出して、1つの診断結果画像に統合する処理を含む、
構造物劣化検出システム。
【請求項7】
請求項
6記載の構造物劣化検出システムにおいて、
前記回転処理は、前記第1画像パッチを回転させる際、180度範囲内で、所定の回転角度θで等分割に回転させることで前記複数の画像を生成する処理を含む、
構造物劣化検出システム。
【請求項8】
請求項1記載の構造物劣化検出システムにおいて、
前記計算機システムは、対象の前記構造物に関する、前記第1画像における複数の画像を、解像度が一定になるようにサイズを補正し、前記解像度が一定の前記複数の画像のサイズから、前記第1入力サイズを決定して設定する、
構造物劣化検出システム。
【請求項9】
請求項1記載の構造物劣化検出システムにおいて、
前記第2処理は、
前記画面に、前記第2画像として前記第1診断結果画像または前記第2診断結果画像の画素毎に劣化推定確率値を多階調で表した多階調画像を表示する処理と、
前記画面に、前記劣化推定確率値に関する二値化のための第1閾値を可変に設定するための第1部品を表示し、前記ユーザの前記第1部品の操作に基づいて前記第1閾値を変更する処理と、
前記変更された前記第1閾値に応じて、前記第2画像の前記劣化推定確率値を二値化した二値化画像を生成して、前記画面に表示する処理と、
を含む、構造物劣化検出システム。
【請求項10】
請求項
9記載の構造物劣化検出システムにおいて、
前記第2処理は、
前記画面に、前記劣化と推定された画素が隣接する劣化領域のサイズに関する第2閾値を可変に設定するための第2部品を表示し、前記ユーザの前記第2部品の操作に基づいて前記第2閾値を変更する処理と、
前記変更された前記第2閾値に応じて、前記第2画像の前記二値化画像における前記劣化領域のうちサイズが小さい劣化領域を除去した画像を生成して、前記画面に表示する処理と、
を含む、構造物劣化検出システム。
【請求項11】
請求項
9記載の構造物劣化検出システムにおいて、
前記第2処理は、
前記画面に、前記劣化と推定された画素が隣接する劣化領域のうち直線形状領域の除去に関する第3部品を表示し、前記ユーザの前記第3部品の操作に基づいて前記直線形状領域の除去を受け付ける処理と、
前記直線形状領域の除去の受け付けに応じて、前記第2画像の前記二値化画像における前記劣化領域のうち前記直線形状領域を抽出して除去した画像を生成して、前記画面に表示する処理と、
を含む、構造物劣化検出システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、構造物の劣化等の状態を検出するための情報処理システム等の技術に関する。特に、機械学習を用いて劣化等の状態を学習および診断する技術に関する。
【背景技術】
【0002】
各種の建築物やインフラ設備等の構造物(例えば家、ビル、道路、鉄道、橋、トンネル、電気設備、水道設備、通信設備等を含む)は、経年老朽化や災害等に伴い、ひび割れ、さび・腐食、剥離、異物付着等の劣化や損傷等の状態(「劣化」と総称して記載する場合がある)が発生する。そのため、維持管理のために点検補修等の対策作業が必要である。しかし、その作業のための人員不足や高コスト等の社会的課題がある。それに対し、計算機を用いて構造物の劣化等の状態を診断、検出するシステム(構造物劣化検出システムと記載する場合がある)が開発され、有効性が期待されている。
【0003】
構造物劣化検出に係わる従来技術例では、カメラを用いて対象構造物の表面が撮像され、その撮像された画像を人(作業者)が目視で劣化を診断し検出する作業が行われる。あるいは、計算機に画像が入力され画像処理等によって劣化箇所を推定し検出する処理が行われる。あるいは、特に、計算機で機械学習を用いて画像から特徴を学習(訓練とも呼ばれる)し診断するシステムが開発されている。
【0004】
上記機械学習を用いた構造物劣化検出に係わる先行技術例として、特許第6294529号公報(特許文献1)が挙げられる。特許文献1では、「ひび割れ検出処理装置」等として、機械学習を用いて、路面画像からひび割れを検出する旨、路面画像を分割したブロック画像を処理する旨等が記載されている。
【0005】
機械学習の1つとして深層学習(ディープラーニング)がある。近年では、深層学習において畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)等を用いて画像の学習および診断を行う技術が開発されている。非特許文献1には、CNNの手法の一例として、訓練を画像パッチ単位で行い、診断(推論)を可変サイズ入力画像単位で行う旨が記載されている。
【先行技術文献】
【特許文献】
【0006】
【非特許文献】
【0007】
【文献】P. Sermanet, D. Eigen, X. Zhang, M. Mathieu, R. Fergus, and Y. LeCun, “OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks”, arXiv:1312.6229 [cs], Dec. 2013. <URL:https://arxiv.org/pdf/1312.6229.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0008】
従来技術例の構造物劣化検出システムでは、計算機において教師情報入力を含む機械学習を用いて、入力画像から劣化等の特徴を学習および診断して検出する。その際、特に深層学習を用いる場合、計算機性能にも依るが、CNNのモデル(ネットワークとも呼ばれる)の計算に関する計算時間が長くかかる。多数の画像を処理する必要があり、何回もモデル計算を行う必要があること等から、計算時間が長くかかる。また、そのシステムでは、その計算時間と、ユーザ(作業者)による作業時間とを含め、全体的に時間が長くかかる。
【0009】
また、そのシステムでは、ユーザによる作業の手間も大きい。例えば、ユーザは、計算機の機械学習による診断結果画像を画面で見て、画素毎に劣化推定結果が正解か否かを入力する正解付け作業を行う。正解付け情報を教師情報としてモデルに反映することで、診断の精度を高めることができる。しかし、ユーザによる正解付け作業の手間が大きい。ユーザの作業負担の低減も求められている。
【0010】
本発明の目的は、構造物劣化検出システム技術に関して、劣化検出の精度を確保しつつ、計算機での学習および診断に要する計算時間およびユーザの作業時間を含む時間を短縮でき、ユーザの作業負担を低減できる技術を提供することである。
【課題を解決するための手段】
【0011】
本発明のうち代表的な実施の形態は、構造物劣化検出システムであって、以下に示す構成を有することを特徴とする。一実施の形態の構造物劣化検出システムは、計算機システム上に構成され、構造物の表面のひび割れを含む劣化を検出する構造物劣化検出システムであって、前記計算機システムは、前記構造物の表面が撮像された第1画像を入力として、深層学習を用いて、前記劣化の診断結果を表す情報を含む第2画像を出力する第1処理と、前記第1画像および前記第2画像を含む情報を可視化して画面に表示し、ユーザによる入力操作を受け付ける第2処理と、を行い、前記深層学習のモデルを構成する畳み込みニューラルネットワークは、拡幅畳み込みフィルタを演算する拡幅畳み込み層を含み、前記第1処理は、訓練時に、訓練用画像データに基づいて、所定の第1入力サイズの第1画像パッチを前記モデルに入力して、第1出力サイズの第1診断結果画像を得る訓練処理と、前記構造物の対象画像の診断時に、可変サイズとして前記第1入力サイズ以上である前記対象画像から、第2入力サイズの第2画像パッチを切り出し、各々の第2画像パッチを前記モデルに入力して、第2出力サイズの各々の第2診断結果画像を得る診断処理と、を有する。
【発明の効果】
【0012】
本発明のうち代表的な実施の形態によれば、構造物劣化検出システム技術に関して、劣化検出の精度を確保しつつ、計算機での学習および診断に要する計算時間およびユーザの作業時間を含む時間を短縮でき、ユーザの作業負担を低減できる技術を提供することである。
【図面の簡単な説明】
【0013】
【
図1】本発明の実施の形態1の構造物劣化検出システムの構成を示す図である。
【
図2】実施の形態1で、構造物劣化検出ソフトウェアの構成を示す図である。
【
図3】実施の形態1で、画像パッチおよびDL-CNNモデル等を示す図である。
【
図4】実施の形態1で、拡幅畳み込みフィルタの例を示す図である。
【
図5】実施の形態1で、拡幅畳み込み処理を示す図である。
【
図6】実施の形態1で、CNNモデルおよび計算を示す図である。
【
図7】実施の形態1で、画像サイズ関係等を示す図である。
【
図8】実施の形態1で、訓練時の処理フローを示す図である。
【
図9】実施の形態1で、弱点画像等について示す図である。
【
図10】実施の形態1で、弱点画像の例を示す図である。
【
図11】実施の形態1で、MIL回転処理を示す図である。
【
図12】実施の形態1で、診断時の第1処理の処理フローを示す図である。
【
図13】実施の形態1で、可視化画面表示時の第2処理の処理フローを示す図である。
【
図14】実施の形態1で、可視化画面の表示例を示す図である。
【
図15】実施の形態1で、各種画像の例を示す図である。
【
図16】実施の形態1で、二値化画像等の例を示す図である。
【
図17】実施の形態1で、モデル入力サイズ設定について示す図である。
【
図18】比較例の構造物劣化検出システムで、DL-CNNのモデル等を示す図である。
【
図19】比較例の構造物劣化検出システムで、モデルおよび計算を示す図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において同一部には原則として同一符号を付し、その繰り返しの説明は省略する。
【0015】
[課題等]
前提技術や課題等について以下に補足説明する。
【0016】
(1)従来技術例の構造物劣化検出システムとして、深層学習等の機械学習を用いずに、人が画像から劣化を診断するシステムの場合における、作業者等のユーザの点検業務のフローは以下である。(1-1)ユーザは、現地で点検対象のインフラ設備等の構造物をカメラで撮影する。例えば、ある対象構造物について、カメラ撮影画像枚数が1000枚となる。(1-2)ユーザは、撮影した全画像の各画像に対し、ひび割れ等の劣化箇所があるかどうかを目視で確認、診断する。例えば、カメラ撮影画像1000枚が目視対象画像となり、目視対象画像1000枚のうち、劣化箇所を含む画像として80枚が抽出される。上記従来技術例の場合、ユーザの診断作業等の手間や負担が大きく、長い時間がかかる。
【0017】
(2)従来技術例の構造物劣化検出システムとして、機械学習を用いて、計算機が画像から劣化を学習および診断するシステムの場合における、ユーザの点検業務のフローは以下である。(2-1)同様に、対象構造物をカメラで撮影した画像、例えば1000枚が用意される。それらの画像データが計算機に入力される。(2-2)計算機は、全画像の各画像に対し、機械学習による劣化診断を実行する。画像毎にモデル計算が適用され、診断結果情報として、劣化推定箇所を含む画像(診断結果画像)、例えば100枚が得られる。画像数に応じてモデル計算の繰り返しが必要であり、長い計算時間がかかる。(2-3)ユーザは、画面で、各診断結果画像内の劣化推定箇所を目視で確認し、その劣化推定箇所が実際に劣化であるかどうか、最終判定を行う。また、ユーザは、画面で、画像内の劣化推定結果が正解か否かを確認して正解付け情報を入力し、モデルに反映する。上記従来技術例の場合、計算機の計算時間とユーザの作業時間とを含め、長い時間がかかる。
【0018】
(実施の形態1)
図1~
図19を用いて、本発明の実施の形態1の構造物劣化検出システムについて説明する。実施の形態1の構造物劣化検出システムは、計算機システム上に構成され、構造物の表面のひび割れを含む劣化を検出するシステムである。計算機システムは、構造物の表面が撮像された第1画像(画像群)を入力として、深層学習(DLと略す場合がある)を用いて、劣化の診断結果を表す情報を含む第2画像を出力する第1処理(劣化診断処理)を行う。また、計算機システムは、第1画像および第2画像を含む情報を可視化して画面に表示し、ユーザによる入力操作を受け付ける第2処理(可視化処理)を行う。深層学習のモデルを構成するCNNは、拡幅畳み込みフィルタを演算する拡幅畳み込み層を含む。第1処理は、訓練時に、訓練用画像データに基づいて、所定の第1入力サイズの第1画像パッチをモデルに入力して、第1出力サイズの第1診断結果画像を得る訓練処理を含む。また、第1処理は、対象構造物の対象画像の診断時に、可変サイズとして第1入力サイズ以上である対象画像から、第2入力サイズの第2画像パッチを切り出し、各々の第2画像パッチをモデルに入力して、第2出力サイズの各々の第2診断結果画像を得る診断処理を含む。
【0019】
実施の形態1の構造物劣化検出システムの場合における、ユーザの点検業務のフローは以下である。(3-1)同様に、対象構造物をカメラで撮影した画像、例えば1000枚が用意される。それらの画像データが計算機に入力される。(3-2)本システムは、全画像の各画像に対し、深層学習による劣化診断を実行する。診断結果画像として、劣化推定箇所を含む画像、例えば100枚が得られる。1回のモデル計算では、第2出力サイズ(縦横の画素数が複数)の診断結果情報が得られる。CNNの所定の層においてstride数を2以上に設定する従来技術例では、出力サイズは、入力サイズよりも倍数的に小さくなり、出力が疎になってしまう。したがって、非特許文献1のように数十回モデルを使用するか、従来技術例のように画素毎にモデルを使用することにより、出力を密にする処理を行う必要がある。一方、実施の形態1のシステムでは、CNNのすべての層においてstride数を1に設定することにより、1回のモデルの使用で密な出力を作成することができ、1枚の画像に要する計算時間が短く抑制されている。上記劣化診断のモデル計算は、画像毎に、訓練または作業時の実診断として行われ、その度にモデルが学習(更新)される。
【0020】
(3-3)本システムは、計算機のアプリ上で、画面に診断結果画像を表示する。診断結果画像に対応する目視対象画像が例えば100枚である。ユーザは、画面で各画像を目視で確認し、劣化推定箇所が実際に劣化であるか否か、最終判定を行う。ユーザの最終判定結果の劣化箇所を含む画像として例えば80枚が抽出される。また、ユーザは、画面で訓練用画像の診断結果画像に対し、劣化推定結果が正解か否かの正解付け作業を行い、正解付け画像がモデルに反映される。これにより、診断の精度が高められる。
【0021】
上記のように、本システムでは、深層学習を用いた劣化診断によって、ユーザの目視対象画像を絞り込むことができる。上記例では1000枚から100枚に低減されている。これにより、ユーザの点検作業に係わる工数、時間やコスト等を削減できる。上記のように、本システムでは、劣化診断を完全に自動化するのではなく、深層学習を用いて劣化診断の一部を自動化する。本システムでは、アプリ上で画面に診断結果画像を可視化し、ユーザの目視確認での最終判定や正解付けを含む作業を効率化するように支援する。これにより、正確性を確保しつつ、劣化検出に係わる時間を短縮する。
【0022】
[構造物劣化検出システム]
図1は、実施の形態1の構造物劣化検出システムを含む全体の構成を示す。
図1の全体は、計算機システム1、構造物5、カメラ4を有する。構造物5は、劣化診断対象であり、各種の建築物やインフラ設備等が該当する。カメラ4は、ユーザ(作業者)の操作に基づいて、構造物5の表面を撮像し、画像41(静止画または動画)を含む画像データを得る。画像41には劣化42の箇所が含まれている場合がある。実施の形態1では、劣化42として少なくともひび割れを含む。
【0023】
実施の形態1の構造物劣化検出システムは、主に計算機システム1によって構成されている。計算機システム1は、任意の計算機を含むシステムであり、例えば、PCである計算機2と、サーバである計算機3とが、通信網6を介して接続されるシステムである。計算機システム1は、複数の計算機で構成されてもよい。計算機2は、例えば、構造物5の管理者や点検を請負った事業者等の任意の組織における、構造物劣化検出に係わる作業を行うユーザ(作業者)が使用する、クライアント端末装置となるPCである。ユーザとして複数の人がいてもよい。計算機3は、例えば、事業者によるクラウドコンピューティングシステムやデータセンタ等のシステム上に設けられたサーバ装置である。計算機2や計算機3には、GPU(Graphics Processing Unit)を備えてもよい。
【0024】
計算機2および計算機3には、構造物劣化検出ソフトウェア10(アプリともいう)が設けられている。計算機2には、構造物劣化検出ソフトウェア10のクライアントプログラム20がインストールされている。計算機3には、構造物劣化検出ソフトウェア10のサーバプログラム30がインストールされている。計算機2のクライアントプログラム20は、クライアント機能を実現し、計算機3のサーバプログラム30は、サーバ機能を実現する。クライアントプログラム20とサーバプログラム30とは、通信網6を介して相互にクライアントサーバ通信で連携する。
【0025】
構造物劣化検出ソフトウェア10は、CPU等によるプログラム処理に基づいて、劣化検出機能や可視化機能を実現する。劣化検出機能は、CNNを含む深層学習のモデル(DL-CNN)31を用いて、画像内のひび割れ等の劣化を学習および診断する処理を行う。劣化検出機能の処理は、正解付け処理を含む。劣化検出機能では、CNNのモデル31に対する訓練時の画像パッチの入力サイズを一定の第1入力サイズとし、対象画像の診断時の画像パッチの入力サイズを、可変サイズの画像に基づいた第2入力サイズ(第1入力サイズ以上)とする。可視化機能は、対象画像や劣化診断結果画像を含む情報を可視化してGUI画面21に表示し、ユーザによる入力操作を受け付ける可視化処理を行う。
【0026】
計算機2のクライアントプログラム20は、サーバプログラム30のサービスとの通信に基づいて、グラフィカル・ユーザ・インタフェース(GUI)となるGUI画面(可視化画面)21をユーザに対して提供する。計算機2のクライアントプログラム20は、ユーザ操作入力やGUI画面21の表示処理を担当する。計算機2にタッチパネル表示装置を備える場合、GUI画面21はタッチ操作可能な画面としてもよい。
【0027】
計算機2のクライアントプログラム20は、構造物5に関してカメラ4によって撮像された画像の画像データを入力し、計算機2側の記憶装置または計算機3側のDB32等に保存する。記憶装置やDB32としては、CPUまたはGPU等が扱う画像メモリ、保存用の不揮発性メモリ、各種のストレージ装置やDBサーバ等が適用可能である。計算機2に入力される画像データには、属性情報等の画像情報を伴う。画像データの画像情報は、ID(識別情報)や撮影日時等の他に、カメラ4の画素数、画角(または画角を計算可能である焦点距離およびセンササイズ等)等の情報を含む。画像情報は、対象物距離情報(カメラ4と構造物5の表面との距離)を含んでもよい。あるいは、計算機2は、ユーザの操作に基づいて、画像データに、カメラ画素数等の画像情報を設定してもよい。計算機2は、画像の処理によって対象物距離等を計算してもよい。カメラ4とは別の距離センサ等を用いて対象物距離等を計測して、画像データと共に入力してもよい。
【0028】
計算機3のサーバプログラム30は、CNNを含む深層学習のモデル(DL-CNN)31を構成し、モデル31を用いた計算によって、劣化の学習および診断等の処理を行う。計算機3のサーバプログラム30は、一般的に計算負荷が高い、深層学習のモデル31を用いた計算処理を担当する。また、サーバプログラム30は、GUI画面21のための画面データを計算機2へ送信する。サーバプログラム30は、DB(データベース)32に、モデル31を含む各種のデータや情報を格納して管理する。
【0029】
DB32のデータや情報として、画像データ、構造物データ、診断データ等がある。画像データは、カメラ4で撮像された画像群や、訓練用の画像群や、診断結果画像群等のデータである。構造物データは、構造物5に関する管理情報や3次元オブジェクトデータ等である。診断データは、実施の形態1の構造物劣化検出システムおよびユーザによって構造物5の劣化を診断した結果を含む、点検作業の結果をまとめたデータである。
【0030】
PCである計算機2は、例えば、CPU、ROM、RAM、不揮発性メモリ、マウスやキーボード等の入力機器、液晶表示装置等の出力機器、入出力インタフェース装置、通信インタフェース装置、等の公知の要素を備える。サーバである計算機3は、例えば、CPU、ROM、RAM、不揮発性メモリ、入力機器、出力機器、入出力インタフェース装置、通信インタフェース装置、等の公知の要素を備える。
【0031】
なお、
図1の計算機システム1の構成例に限らず可能である。例えば、計算機2の処理と計算機3の処理とを1台の計算機に統合した形態でもよい。ユーザが所持するカメラ機能付き携帯情報端末装置で主な処理を行う形態でもよい。構造物5の画像群を取得するための技術的手段に関しては、人手によるカメラ4での撮影に限定されず、各種の手段が適用可能である。
【0032】
[構造物劣化検出ソフトウェア]
図2は、構造物劣化検出ソフトウェア(アプリ)10に関する構成を示す。アプリ10は、データセット101、ネットワーク構成102(モデル31に対応する)、GUI画面103(GUI画面21に対応する)を有する。アプリ10は、第1処理機能11(訓練・診断機能)、第2処理機能12(可視化機能)、カメラ画像入力機能13、MIL回転機能14、モデル入力サイズ設定機能15、評価・絞り込み機能16等を有する。
【0033】
データセット101は、画像データとして、オリジナル画像群211、弱点画像群212を含む。オリジナル画像群211は、カメラ4で対象物5の表面を撮像した画像群である。オリジナル画像群211は、実際のひび割れを含む画像や、実際のひび割れを含まない画像を有する。弱点画像群212は、後述するが、モデル31の弱点を学習するための画像群である。データセット101の画像データは、カメラ4の画像に基づいた、訓練用画像、正解付け画像、診断対象画像、診断結果画像、等を含む。訓練用画像は、点検作業時の診断よりも前に、モデル31を学習させるための画像である。正解付け画像は、診断結果画像に対してユーザが正解付け入力した画像である。診断対象画像は、点検作業時に実診断する対象画像であり、一定サイズに限定されない可変サイズである。診断結果画像は、モデル31から計算の結果として出力される画像である。
【0034】
カメラ画像入力機能13は、カメラ4からの画像データおよび画像情報を入力し、データセット101の一部として管理する。アプリ10は、画像情報を含む管理情報213を作成し管理する。
【0035】
第1処理機能11(訓練・診断機能)は、訓練および診断に用いるネットワーク構成102(モデル31)を管理する。ネットワーク構成102は、MIL回転221、拡幅畳み込み222を有する。モデル31の入力の第1画像として、訓練時には所定の第1入力サイズの画像パッチを有する。第1入力サイズは、モデル入力サイズ設定機能15に基づいて、モデル31のパラメータ(各層のフィルタのサイズ等)に応じて変更されるサイズとして設定され、最初にモデル31のパラメータが設定された後には、それに応じた所定の固定サイズとして設定される。モデル31の出力の第2画像として、診断結果画像(劣化診断結果情報)を有する。1枚の診断結果画像は、1枚の画像パッチの第1入力サイズに対応した、所定の第1出力サイズを有する。診断結果画像における各画素は、劣化の可能性を確率で表す確率値を持つ。
【0036】
第1処理機能11は、MIL回転機能14を含む。MIL回転機能14は、MIL回転221の処理を行う。MILは、Multiple Instance Learningであり、複数のインスタンスをモデルに入力して学習する概念を示す。MIL回転221は、実施の形態1で特有の、劣化の特性を考慮した処理であり、劣化の方向に対応できるように、元画像を回転させることで複数の画像を生成する処理を含む。MIL回転221は、ユーザの操作および設定に応じて、機能をオン/オフすることができ、オン状態の場合に行われ、オフ状態の場合には省略される。
【0037】
拡幅畳み込み222(Dilated Convolution)は、畳み込み処理の1種として、拡幅畳み込みフィルタを用いた演算処理である。拡幅畳み込み222のフィルタは、stride数が1、dilate数が2以上と規定される。なお、モデル31は、一部の層に、拡幅ではない畳み込み処理(フィルタのdilate数が1)を含んでもよい。
【0038】
拡幅畳み込み222は、全結合畳み込み層(Fully Convolutional Networks)を含み、この全結合畳み込み層は、拡幅畳み込み層として実装されている。全結合畳み込み層は、拡幅畳み込み層を通じて抽出された特徴情報(特徴量)を分類して取り出すための層である。
【0039】
GUI画面103は、対象画像231や訓練用画像、診断結果画像232を表示し、また、小領域除去画像233、直線除去画像234、正解付け画像(第3画像)235等を表示する。診断結果画像232は、多階調画像や二値化画像がある。GUI画面103でユーザが閾値を変更操作することで、その閾値に応じた二値化画像が表示される。また、GUI画面103でユーザが操作することで、小領域除去画像233や直線除去画像234が表示される。また、GUI画面103でユーザが操作して正解付け入力することで、正解付け画像235が表示される。ユーザは、診断結果画像の画素毎に、モデル31による劣化推定結果が正解か否かを表す情報を正解付け情報として入力する。この正解付け情報を含む正解付け画像が、教師情報としてモデル31に反映される。
【0040】
評価・絞り込み機能16は、診断結果画像を評価して、複数枚の診断結果画像から、DLによって劣化の可能性が高いと推定された劣化箇所を含む診断結果画像を絞り込む。その際、評価・絞り込み機能16は、劣化推定確率の閾値を用いて、画素毎の確率値を二値化し、閾値以上の箇所を劣化箇所として抽出してもよい。また、評価・絞り込み機能16は、例えば画像内の劣化箇所(閾値以上)の画素数が、所定の閾値以上である場合に、劣化面積が大きいまたは劣化度合いが大きいと判断して、画像を絞り込んでもよい。絞り込みによって、例えば1000枚の診断結果画像から100枚が抽出される。ユーザは、絞り込まれた画像を優先して目視確認して最終判定を行うことができる。ユーザは、絞り込まれなかった他の画像についても、任意に指定して確認できる。
【0041】
[深層学習]
公知の深層学習およびCNNについて以下に補足説明する。CNNは、入力に対し、行列積および活性化関数の演算を行うことが基本である。しかし、画像入力の場合、[画像入力の次元数]=[画素数]×3となり(なお3はR,G,Bの色画素に対応する)、ネットワークの入力ノード数がとても大きい(後述の
図18)。画像の性質上、意味のある情報は、隣接する画素に凝縮されている。よって、CNNでは、隣接する画素間での行列積を求めるようにする。CNNでは、画像入力次元と同じ大きさのパラメータ(例えば縦画素数×横画素数)で行列積を求めるのではなく、3×3、5×5等の小さなパラメータ(対応するフィルタ)を使用して、モデルの総パラメータ数を抑えるようにする。サイズの合わない行列は積を求められないので、CNNでは、普通の行列積ではなく、畳み込み(convolution)処理を用いる。CNNでは、入力に対し、畳み込みフィルタを用いて畳み込み処理を何度も行うこと(複数の層で行うこと)で、より高次元の特徴が特徴マップとして抽出される。フィルタの数、サイズ、層の深さ等は、すべて、ハイパーパラメータと呼ばれ、人が設計または設定する必要がある。
【0042】
また、従来の深層学習では、精度を高めるためには、ユーザによる正解付け作業に基づいて、教師情報をモデルに反映することが有効である。実施の形態1の構造物劣化検出システムでも、正解付け作業に基づいた教師情報(正解付け画像)をモデル31に反映することで、診断の精度を高める。
【0043】
[比較例:DL-CNNのモデル]
図18は、実施の形態1に対する比較例の構造物劣化検出システムにおける、画像パッチおよびDL-CNNのモデル等を示す。(A)は、診断対象画像181を示す。診断対象画像181は、例えば、縦方向(y)の縦画素数がm、横方向(x)の横画素数がm、総画素数がm×m=Mの正方形画像とする。(B)は、DL-CNNのモデル183に入力するための所定のサイズの画像パッチ182を示す。画像パッチ182の縦画素数がn、横画素数がn、総画素数がn×n=Nの正方形画像とする。(A)の診断対象画像181のサイズは、画像パッチ182のサイズよりも大きい。診断対象画像181のサイズは様々であり、モデル183の入力サイズとは異なる場合が多い。画素は、R,G,Bの色画素で構成される。診断対象画像181から、画素毎に、画像パッチ182が切り出される。すなわち、診断対象画像181のM個の画素から、M個の画像パッチ182が切り出される。画像パッチ182の中心画素は、モデル183によって劣化確率が計算される画素である。
【0044】
(C)のモデル183は、公知のネットワーク構成として、入力層、複数の隠れ層、全結合層、出力層等で構成される。隠れ層は、畳み込み層やプーリング層を含む。入力層の複数の各々のノードには、入力画像(画像パッチ182)の各々の画素の画素値が入力される。入力ノード数として、n×n×3である。入力層の各ノードと隠れ層の各ノードとの間では、畳み込みフィルタを用いた畳み込み演算処理等が行われる。従来例の畳み込みフィルタ184は、例えば、縦横で3×3の大きさであり、拡幅は無い。畳み込みフィルタ184は、画像パッチ183よりも小さいサイズであり、画像パッチ183の画素群に対して、所定のストライド(stride)で適用される。従来例の畳み込みフィルタ184のstride数は2以上である。stride数は、フィルタ処理を繰り返す際の中心画素間の移動量に対応する。モデル183の全結合層、出力層を通じて、画像パッチ183の中心画素に関する劣化推定確率値が出力される。
【0045】
上記のように、比較例の場合、診断対象画像181の全体を診断するためには、モデル183の計算を、M個の画素、M個の画像パッチ183に対応してM回同様に繰り返し行う必要がある。そのため、数Mに対応して計算時間が長くかかる。
【0046】
[DL-CNNのモデル]
図3は、実施の形態1の構造物劣化検出システムにおける、画像パッチ、DL-CNNのモデル31等を示す。(A)は、対象画像(第1画像)301を示す。対象画像301は、例えば、縦方向(y)の縦画素数がc1、横方向(x)の横画素数がc2、総画素数がc1×c2の長方形画像とする。(B)は、モデル31に入力するための所定の入力サイズの画像パッチ302を示す。画像パッチ302の縦画素数がn、横画素数がn、総画素数がn×n=Nの正方形画像とする。対象画像301のサイズは、画像パッチ302のサイズよりも大きい。対象画像301のサイズは可変サイズであり、モデル31の入力サイズ以上のサイズである。対象画像301から必要に応じて複数の画像パッチ302が切り出される。切り出しの詳細は後述する。
【0047】
(C)のモデル31は、ネットワーク構成として、入力層、複数の隠れ層、全結合畳み込み層、出力層等で構成される。隠れ層は、拡幅畳み込み層を含む。入力層の複数の各々のノードには、入力画像である画像パッチ302の入力サイズ(n×n)に応じた各々の画素の画素値が入力される。入力ノード数として、n×n×3である。入力層の各ノードと隠れ層の各ノードとの間では、拡幅畳み込みフィルタを用いた拡幅畳み込み演算処理等が行われる。CNNのモデル31の複数の層のうち、例えば最初のいくつかの層で、非拡幅の畳み込みフィルタを適用してもよい。拡幅畳み込みフィルタ304は、例えば、縦横の計算対象画素(斜線パターン部分)で3×3、全体で5×5の大きさであり、dilate数が2である。dilate数は、計算対象画素間の拡幅された数に対応する。拡幅畳み込みフィルタ304は、画像パッチ302よりも小さいサイズであり、画像パッチ302の画素群に対して、stride数=1のストライドで適用される。モデル31の全結合畳み込み層、出力層を通じて、画像パッチ302の画素に関する劣化推定確率値が出力される。さらに、実施の形態1では、モデル31から、縦横の複数の画素から成る診断結果画像(画像パッチ303)が出力され、各画素に劣化推定確率値を持つ。
※段落番号は振り直し
実施の形態1では、モデル31の出力が、画像パッチ303として構成されている。画像パッチ303は、出力サイズがq×qとする。出力サイズは、入力サイズに比例する。出力サイズは、入力サイズに対し、固定値(Eとする)を引いたサイズである。固定値Eは、1画素に対する劣化推定計算の際に必要となる矩形のサイズであり、最低入力サイズでもある。固定値Eは、モデル31のパラメータ(各層のフィルタのサイズ等)に依存する。訓練時には、例えば固定値Eの最低入力サイズの画像パッチ(第1入力サイズの画像パッチ302)を使用する。そのため、訓練時の第1出力サイズは、q×q=1×1となる。診断時には、訓練時の第1入力サイズ以上の大きさの第2入力サイズの画像パッチ302を使用する。そのため、診断時の第2出力サイズは、q×q=2×2以上のサイズとなる。例えば、最低入力サイズ(固定値E)が75×75である場合、訓練時には、75×75の画像パッチ302を使用し、画像パッチ303の出力サイズは1×1となる。診断時には、より大きいサイズ、例えば100×100の画像パッチ302を使用する場合、画像パッチ303の出力サイズは26×26となる。
【0048】
また、
図3では、診断時に対象画像301から画像パッチ302を切り出しているが、これは計算機システム1での計算(GPUのメモリ等)の効率や制限を考慮しており、理論上は必須ではない。訓練時の第1入力サイズと診断時の第2入力サイズとが独立しており、第1入力サイズに依らずに第2入力サイズを選択できる。第1入力サイズに対する第2入力サイズの自由度が大きい。
【0049】
上記のように、実施の形態1の場合、対象画像301の全体を診断するためには、モデル31の計算を、M個の画素に対応してM回同様に繰り返し行う必要は無く、
図18の比較例よりも少ない回数で計算できる。そのため、計算時間が短くなる。
【0050】
[拡幅畳み込みフィルタ]
図4は、実施の形態1で用いる、拡幅畳み込みフィルタ(dilated convolution filter)の例を示す。(A)の拡幅畳み込みフィルタ401は、
図3の拡幅畳み込みフィルタ304と同様の構成であり、dilate数=2である。このフィルタのサイズは、計算対象画素に関して3×3のサイズであり、拡幅を含む全体では5×5のサイズである。中心画素とその周りの8個の画素の各画素値(対応するノード値)からの所定の演算によって、次の層の画素値(ノード値)が得られる。(B)の拡幅畳み込みフィルタ402は、dilate数=4の場合である。このフィルタのサイズは、計算対象画素に関して3×3であり、拡幅を含む全体では9×9のサイズである。他の拡幅畳み込みフィルタを適用してもよい。
【0051】
[拡幅畳み込み演算処理]
図5は、実施の形態1での拡幅畳み込み演算処理の例を示す。
図4の拡幅畳み込みフィルタ402を用いる例で示す。第1画像500の各画素を四角で示す。第1画像500の例えば左上の画素501から開始して、x方向に順に、stride数=1で1画素ずつ着目してゆき、1行目の処理が終わるとy方向に順に移動して同様に処理を繰り返す。1個目の画素501(x1,y1)を中心画素として、拡幅畳み込みフィルタ402であるフィルタ511が適用される。次に、隣の2個目の画素502(x2,y1)を中心画素として、同様に拡幅畳み込みフィルタ402であるフィルタ512が適用される。図示するように、最後のM個目の画素まで同様に拡幅畳み込みフィルタ402が適用される。なお、フィルタを適用する際に、元の第1画像500の領域外になる画素については、例えばパディングとして適当な値を使用すればよい。このような拡幅畳み込み演算の繰り返しによって、次の層の画像の各画素値(ノード値)が得られる。
【0052】
[比較例:モデル計算]
図19は、
図18の比較例における、DL-CNNのモデル183および計算の内容を模式的に示す。ここでは、モデル183は、k個の層から成るものとし、第1層L1、第2層L2、第(k-1)層Lk-1、第k層Lkを示す。第1層L1は、画像パッチ183の入力に対応し、縦横の画素のサイズをa1×a1=n×nとする。奥行きのサイズを3とする(R,G,Bの色画素に対応する)。そのサイズ(n×n×3)の領域を長方体で図示している。a1=nは例えば232である。
【0053】
第1層L1の画像の各画素に対し、前述のように、畳み込みフィルタによる畳み込み処理が適用される。第1層L1の画像から第2層L2の画像を得る際の畳み込み処理CNV1において、畳み込みフィルタG1を用いる。畳み込みフィルタG1は、例えば、
図18と同様に、拡幅は無く、3×3のサイズで、フィルタ種類数g2として例えば24を用い、stride数は2以上である。第1層L1のある1画素に対し畳み込みフィルタG1の処理を適用することで、次の第2層L2のある画素値が得られる様子を破線で模式的に示している。
【0054】
第2層L2の画像は、畳み込み処理CNV1の結果、サイズが縮小されている。この画像のサイズをa2×a2×g2で示す。a2は例えば116となる。第3層以降についても同様に、畳み込み処理等が適用され、特徴量が抽出され、サイズが縮減されてゆく。例えば、第(k-1)層Lk-1では、画像のサイズが、3×3×gk-1となる。フィルタ種類数gk-1として例えば45である。その画像に対し、全結合畳み込み処理FCCNV1が適用される。その際のフィルタは、サイズが1×1で、2種である。その結果、第k層Lkでは、サイズが3×3×2の画像情報となり、画素毎に劣化推定確率値を持つ。その画像情報が出力される。
【0055】
[モデル計算]
図6は、実施の形態1におけるDL-CNNのモデル31および計算の内容を模式的に示す。ここでは、モデル31は、j個の層から成るものとし、第1層L1、第2層L2、第(j-1)層Lj-1、第j層Ljを示す。第1層L1は、画像パッチ302の入力に対応し、縦横の画素のサイズをb1×b1=n×nとする。奥行きのサイズを3とする。入力の画像パッチ302のサイズ(入力サイズ)(n×n×3)の領域を長方体で図示している。b1=nは例えば232であり、比較例のa1=n=232と同じ場合とする。
【0056】
第1層L1の画像の各画素に対し、前述のように、拡幅畳み込みフィルタによる拡幅畳み込み処理が適用される。第1層L1の画像から第2層L2の画像を得る際の拡幅畳み込み処理DCNV1において、拡幅畳み込みフィルタF1を用いる。拡幅畳み込みフィルタF1は、例えば、
図4の拡幅畳み込みフィルタ402と同様に、3×3のサイズで、24種を用い、dilate数=4、stride数=1である。第2層L2のフィルタ種類数f2として24の例である。
【0057】
第1層L1のある1画素に対し拡幅畳み込みフィルタF1の処理を適用することで、次の第2層L2のある画素値が得られる様子を模式的に示している。第2層L2の画像は、拡幅畳み込み処理DCNV1の結果、サイズが縮小されている。この画像のサイズをb2×b2×f2で示す。b2は例えば224、f2は例えば24となる。第3層以降についても同様に、拡幅畳み込み処理または非拡幅の畳み込み処理等が適用され、特徴量が抽出され、サイズが縮減されてゆく。例えば、第(j-1)層Lj-1では、画像のサイズが、bj-1×bj-1×fj-1となる。第(j-1)層Lj-1のフィルタ種類数fj-1として45の例である。その画像に対し、全結合畳み込み処理FCCNV1が適用される。その際のフィルタは、サイズが1×1で、2種である。その結果、第j層Ljでは、サイズがbj×bj×2の画像(画像パッチ303に対応する診断結果画像)となり、画素毎に劣化推定確率値を持つ。その画像が出力される。サイズbjは例えば142となる。このサイズbjは、比較例のサイズ=3よりも大きい。
【0058】
上記のように、実施の形態1では、1回のモデル31の計算の結果、第j層の画像のようにbj×bjの出力サイズの診断結果画像が得られる。そのため、診断対象画像に対し、M回よりも少ない回数の計算で、診断結果画像が得られる。
【0059】
[画像サイズ関係]
図7は、実施の形態1で、訓練時および診断時の画像のサイズ等の関係について示す。(A)は、訓練時の画像のサイズ等を示す。入力される第1画像である第1画像パッチは、
図6と同様に、第1入力サイズとして、b1×b1を有し、例えば91×91である。出力される第2画像である第1診断結果画像は、第1出力サイズとして、bj×bjを有し、例えば1×1である。モデル31に入力される第1画像パッチは、第1入力サイズに固定される。
【0060】
(B)は、診断時の画像のサイズ等を示す。第1画像である対象画像701(実線の長方形で示す)は、第1入力サイズ以上の可変入力サイズであり、縦×横の画素数として、c1×c2とする。対象画像701は非正方形も許容される。c1,c2≧b1である。
【0061】
第1処理機能11は、対象画像701から、第2入力サイズ(b1×b1)で、複数の画像を切り出す。この診断の際の第2入力サイズ(b1×b1)は、訓練時の第1入力サイズ(b1×b1)と異なっていてもよい。第1処理機能11は、第2入力サイズとして、例えば、GPUのメモリのサイズに合わせて、メモリ使用率の最大値未満でなるべく大きいサイズとなるように、第2入力サイズを決定してもよい。これにより、計算機性能を最大に活用して短時間で計算可能である。第1処理機能11は、対象画像701のc1×c2の領域を、第2入力サイズ(b1×b1)に対応する第2出力サイズ(bj×bj)で区分する。これは、入力サイズに対し出力サイズが小さくことを考慮している。第2入力サイズ(b1×b1)および第2出力サイズ(bj×bj)の正方形の領域(特に6個の領域(1)~(6))を示す。第2出力サイズの領域を破線で示す。
【0062】
第1処理機能11は、区分した各第2出力サイズ(bj×bj)に対応する各第2入力サイズ(b1×b1)の領域毎に切り出す。切り出す第2入力サイズの領域は、隣接する領域同士で一部が重なっている。第1処理機能11は、対象画像701の全画素をカバーするように、複数の画像を切り出す。本例では、6枚の画像の切り出しによってカバーできる場合を示す。また、切り出しの際、対象画像701の外側の余り分については、例えばパディングによって適当な画素値とする。
【0063】
切り出された複数の画像(切り出し画像)、例えば画像711~画像716を有する。各切り出し画像を第2画像パッチとする。第1処理機能11は、複数の各々の第2画像パッチを、モデル31に入力して計算を適用する。本例では6回の計算である。この結果、複数の各々の診断結果画像(第2診断結果画像)、例えば画像721~画像726が得られる。第1処理機能11は、得られた複数の第2診断結果画像を連結して、1枚の第2診断結果画像702を得る。
【0064】
[訓練時処理]
図8は、計算機システム1のアプリ10(特に第1処理機能11)における訓練時の処理フローを示す。この訓練処理は、訓練用画像データ作成処理を含む。
図8は、ステップS1~S9を有する。以下、ステップの順に説明する。
【0065】
(S1) S1で、計算機システム1(特にカメラ画像入力機能13)は、
図2のオリジナル画像群211を入力する。オリジナル画像群211は、構造物5を撮影した複数の画像を含み、特に実際のひび割れ等の劣化を含む訓練用画像データを含む。例えば、計算機2は、カメラ4の画像データを入力し、DB32に格納させる。計算機3は、DB32に格納されている画像群から順に画像を画像メモリへ読み出す。
【0066】
(S2) S2で、計算機システム1は、可視化画面(GUI画面21)で、オリジナル画像をモデル31に入力して計算した結果の診断結果画像を表示し、ユーザの手動操作に基づいて、その画像に対する正解付け作業が行われる。例えば、診断結果画像の画素のうち、劣化と推定された画素が実際には劣化ではない場合や、非劣化と推定された画素が実際には劣化である場合には、不正解を表す値が入力される。計算機システム1は、正解付け情報が入力された正解付け画像(第3画像)を、訓練用画像の一部として保存する。
【0067】
(S3) S3で、計算機システム1は、
図2の弱点画像群212を入力する。弱点画像群212は、モデル31の計算の結果として誤検出をもたらす画像であり、例えば構造物5の壁面の直線群や周囲の植物等を含む画像である。
【0068】
(S4) S4で、計算機システム1は、弱点画像群212に対し、エッジ検出処理等を施して、自動的な正解付け処理を行い、その結果、正解付けされた弱点画像を、訓練用画像の一部(ネガティブサンプル画像)として保存する。自動的な正解付け処理は、例えば画像内の直線群や植物に対応する画素に、非劣化を表す値を設定する処理である。
【0069】
(S5) S5で、計算機システム1は、S2やS4に基づいた各々の訓練用画像データの画像に対し、訓練用の第1入力サイズ(n×n)の第1画像パッチを必要な数で切り出す(
図7)。
【0070】
(S6) S6で、計算機システム1は、訓練用画像を増やすために、S5の第1画像パッチに対し、データ拡張処理を施して、複数の各々の訓練用画像(バリエーション)を生成する。データ拡張処理は、ひび割れ等の劣化の種類や特性に応じた処理であり、ノイズ付加や反転等の公知の処理を含み、シフト処理(画素領域を平行移動させる処理)を含まない。
【0071】
(S7) S7で、計算機システム1は、ユーザ設定でMIL回転機能14がオン状態である場合に、MIL回転処理を行う(
図11)。MIL回転処理では、所定の回転角度θを用いて、例えば180度範囲内で、等分割するように、元画像を回転させて、複数の各々の回転後画像を生成する。
【0072】
(S8) S8で、計算機システム1のMIL回転機能14は、上記生成した複数の各々の第1画像パッチ毎に、モデル31に入力して計算を適用し、すなわち訓練用の診断を実行し、複数の各々の診断結果画像を得る。そして、MIL回転機能14は、複数の診断結果画像を1つに統合した画像を取得し、結果を保存する。
【0073】
(S9) S9で、計算機システム1(特に評価・絞り込み機能16)は、診断結果画像について、評価処理を行い、ユーザによる最終判定を行う。ユーザは、GUI画面21で診断結果画像を見て、モデル31による劣化推定結果が正解か否かを確認して正解付け情報を入力する。計算機システム1は、正解付け画像を保存する。
【0074】
また、S9の評価処理は、構造物5(構造物IDで識別される)に応じた特定の回転方向についての評価および決定を含む。計算機システム1は、S8のMIL回転処理の結果の画像(
図11の画像g40)に基づいて、特定の回転方向(対応する回転角度θ)を決定し、その情報を保存する。評価処理の例としては、予め、ユーザが、複数枚の画像について各画像における劣化に該当する画素をタグ付けし、評価用データとして保存する。そして、その評価用データに対し、モデル31の良し悪しを計算することが挙げられる。
【0075】
[弱点画像]
図9は、弱点画像の設定や正解付け画像について示す。
図9中、オリジナル画像群211、弱点画像群212、モデル31、診断結果画像(第2画像)等を示す。アプリ10は、オリジナル画像や弱点画像をモデル31に入力して訓練を行う。
【0076】
画像をモデル31に入力して劣化を診断、検出する際に、ひび割れ等の劣化箇所ではなく、他の箇所(非劣化箇所)を劣化状態として誤検出することが生じる。誤検出の例として、構造物5の壁面等に元々デザインとして設けられている直線群や、周囲の植物等が挙げられる。一般的な機械学習の場合、このような誤検出については、通常、学習データ数を増やして精度を上げることで対応可能である。しかしながら、実施の形態1のシステムでは、計算時間を短縮したいので、単純に学習データ数(画像数)を増やすのではなく、対策する仕組みを設けている。
【0077】
実施の形態1のシステムでは、訓練用画像データ数が限られていても、誤検出を減らして効率的に学習できるようにする機能を有する。本システムでは、DL-CNNのモデル31の誤検出の弱点を、弱点画像として抽出して設定し、その弱点を克服するように、弱点画像をモデル31に入力して訓練を行わせる。データセット101は、弱点画像群212を用いるように拡張される。
【0078】
弱点画像は、
図10の例のように、直線群を含む画像や、植物を含む画像である。アプリ10は、オリジナル画像に基づいてモデル31に入力した結果の診断結果画像から、評価に基づいて、誤検出が多い箇所を抽出して、弱点画像として設定する。弱点画像は、言い換えると、劣化を含まない事例を表すネガティブサンプル画像である。あるいは、アプリ10では、ユーザが任意に指定した画像を、弱点画像として設定することができる。正規のオリジナル画像群211のデータセット101に、設定された弱点画像群212が弱点強調データセットとして追加されて、新しいデータセット101として拡張される。
【0079】
弱点画像は、オリジナル画像の診断結果画像から自動的に抽出したものでもよいし、構造物5とは全く関係無い画像をユーザが任意に指定するものでもよい。例えば、複数の診断結果画像のうち、誤検出箇所を含む診断結果画像901が抽出され、その診断結果画像901内の誤検出箇所(例えば直線群、植物)の領域が抽出され、その領域を加工して弱点画像が作成される。弱点画像は、ユーザが新たに手動で作成した画像や正解付けした画像とする必要は無いので、弱点画像に係わる作業の手間は抑制されている。
【0080】
図9中、訓練結果の複数の診断結果画像のうち、劣化推定箇所を含む診断結果画像902に対し、ユーザは画面で、その劣化推定箇所の画素が正解か否(不正解)かを入力する正解付け作業を行う。これにより正解付け情報が入力された正解付け画像が作成され、データセット101の一部となる。
【0081】
図10は、弱点画像の一例を示す。(A)は、直線群を含む画像であり、(B)は、植物を含む画像である。これらの画像は、ひび割れ等の劣化を含んでいない。これらの画像がモデル31に入力された場合に、直線群や植物の箇所が過敏に反応して、ひび割れ等の劣化(劣化推定箇所)として誤診断、誤検出される。そのため、このような画像を弱点画像として用いて、モデル31を学習させる。弱点画像を入力して学習した後のモデル31では、実際の対象画像の診断を行った場合に、壁面の直線群や周囲の植物等が劣化として誤検出されることが低減される。
【0082】
弱点画像の作成や設定の仕方の例としては、
図8のS4のように、入力された画像(例えば
図10の(A)の画像)に対し、計算機システム1で公知のエッジ検出処理を適用して、直線群の領域を抽出し、その直線群の領域を所定のサイズになるように加工し、その結果を弱点画像として設定してもよい。
【0083】
[MIL回転機能]
DL-CNNに関して、画像内の一般的な物体(例えば人)の診断の場合には、重力方向(大抵は画像内の下方向)があるので、画像内の物体の向きが、ある程度限定的に判断可能である。一方、画像内での劣化箇所の主な方向は基本的に不明である。例えば、ひび割れは、画像面内の360度の角度範囲内で、いずれの角度方向に主な方向が沿って延びて生じているか、基本的には不明である。通常、360度の任意の角度で劣化の検出ができるように、画像面内の方向に依らずに全角度方向に対応できるモデル(第1モデルとする)が作成される。
【0084】
ここで、仮に、各画像内の劣化の主な角度方向が同じ特定の角度方向(例えば面内垂直方向)に揃えられる場合、第1モデルのように全角度方向に対応する必要が無く、特定の角度方向に対応したモデル(第2モデルとする)で対応することができる。すなわち、第2モデルを用いる場合、第1モデルよりも少ないパラメータ数で、同程度の性能を出すことができる。ただし、ユーザが手動で画像内の劣化の角度方向を揃える作業をしてしまうと、手間や時間がかかり、主旨を取り違えたものとなるため、自動的に対応できるようにする。
【0085】
第2モデルは、例えば面内垂直方向に生じている劣化に対応するモデルとする場合、入力画像内の劣化箇所が主に面内垂直方向に沿って生じている場合、その劣化を高い確率で検出できる(言い換えると、劣化推定確率として高い確率値が出力される)。その第2モデルは、入力画像内の劣化箇所が、面内垂直方向からずれた角度方向で生じている場合、その劣化を低い確率でしか検出できない(言い換えると、劣化推定確率として低い確率値が出力される)。
【0086】
そこで、実施の形態1のシステムでは、上記第1モデル、第2モデルのいずれにも対応できる機能を有し、特に、上記第2モデルに対応した学習を行うためのMIL回転機能14を有する。このMIL回転機能14を用いる場合、訓練対象画像を、
図11の例のように、所定の回転角度θで回転させることで、複数の画像(例えば画像g1~g3)を生成し、各画像をモデル31に入力して試しに診断を行わせる。評価・絞り込み機能16は、複数の画像の診断結果画像の各劣化推定確率から、確率値が一番高いものに対応する画像の角度方向を、特定の角度方向として選択する。そして、実施の形態1のシステムは、診断時には、対象画像を、その特定の角度方向に対応した第2モデルを用いて診断する。これにより、ユーザの作業を少なくしたまま、ひび割れ等の劣化を高精度に検出することができる。
【0087】
[MIL回転処理]
図11は、実施の形態1で、訓練時のMIL回転機能14によるMIL回転処理の例を示す。画像g0を入力画像例とする。画像g0は、文字「あ」が正常な方向で写っている画像とする。MIL回転処理に伴う回転角度をθとする。アプリ10では、回転角度θの値が予め設定されている。MIL回転機能14は、画像g0を、回転角度θを用いて、複数の各方向に回転させる回転処理801を行う。本例では、回転角度θとして、0度、θa度、θb度の3種を示すが、これに限らず可能である。画像g0を、0度回転した画像g1、θa度回転した画像g2、θb度回転した画像g3等が得られる。画像g1は、0度なので非回転である。画像g2は、θa度の回転によって辺が斜めになった領域を包含する正方形とされている。
【0088】
MIL回転機能14は、回転後の各画像(画像g1~g3)を、DL-CNNのモデル31に入力して計算を適用する診断処理(DNN802)を行う。DNN802の結果、各回転方向に応じた画像、例えば画像g11,g12,g13が得られる。これらの画像は、回転後の辺が斜めになった領域を含む。複数の画像の結果を統合する必要があるので、各画像に対し、逆回転等が必要である。逆回転の角度は、回転角度θのマイナス角度である。MIL回転機能14は、各画像に対し、回転角度θに関する逆回転処理803を施す。すなわち、回転角度として、0度、-θa度、-θb度とした回転処理が行われる。この結果、各画像、例えば画像g21,g22,g23が得られる。例えば画像g22は、-θa度の回転によって辺が斜めになった領域を包含する正方形とされている。
【0089】
MIL回転機能14は、逆回転後の各画像(画像g21~g23)から、元の画像のサイズに対応する領域を切り抜く切抜き処理804を行う。この結果、特徴マップに対応する画像として、例えば画像g31,g32,g33が得られる。例えば画像g22から切り抜かれた画像g32を有する。画像g31をf(x,y,0)で表す。画像g32をf(x,y,a)で表す。画像g33をf(x,y,b)で表す。切り抜き後の各画像は、画素毎に劣化推定確率値を持つ。
【0090】
MIL回転機能14は、すべての回転角度θの画像(画像g31~g33)に対し、マックスプーリング(max pooling)処理805を施す。このマックスプーリング処理805は、画像内の対応する位置の画素毎に、劣化の確率が高い方に対応する最大値をとる処理である。この処理の結果、出力として、1つの画像g40が得られる。画像g40を、max(f(x,y,i))で表す。上記のように、元画像を回転させた各画像をモデル31に入力すると、回転した診断結果情報が出力されるので、複数の診断結果情報を統合するために、逆回転や切り抜き処理が行われる。
【0091】
MIL回転処理の回転角度θについて詳しくは以下である。回転角度θは、基本的には任意の角度が可能である。回転角度θは、画像面内の360度範囲のうちの等分割の角度が好ましいが、特に制限は無い。ひび割れは、概ね線状のパターンであるため、そのひび割れを含む画像を180度回転させた場合でも、ひび割れの方向は同じといえる。よって、実施の形態1で、実装例として、MIL回転機能14では、180度範囲内で、所定の回転角度θ毎に等分割で回転させて複数の画像を生成する。実験によれば、180度範囲内で、回転角度θ=90度として2分割する場合(0度、90度の2種の画像)から、回転角度θ=45度として4分割する場合(0度、45度、90度、135度の4種の画像)まで、所定の回転角度θで等分割することで、精度および処理速度のバランスがとれた結果が得られた。
【0092】
[診断時処理]
図12は、点検作業時等の対象画像の診断(実診断)時の処理フローを示す。この診断処理は、計算機システム1で事前に行われる診断処理を含む。ユーザは画面で診断処理を指定し、計算終了まで待つ。
図12は、ステップS21~S27を有する。以下、ステップの順に説明する。
【0093】
(S21) 計算機システム1は、診断対象の構造物5(構造物IDで識別される)の対象画像を入力する。例えば、計算機3は、DB32から対象画像を読み出して画像メモリに展開する等の準備処理を行う。
【0094】
(S22) 計算機システム1(特にMIL回転機能14)は、前述の特定の回転方向について学習したモデルBを用いて診断を行う場合、診断対象画像を、前述の特定の回転方向(回転角度θ)に回転させて、回転後の領域を包含する正方形をとる。計算機システム1は、その回転後画像を、モデル31(モデルB)に入力するための画像とする。
【0095】
(S23) 計算機システム1(特に第1処理機能11)は、対象画像の第2入力サイズ(
図7、可変入力サイズ、c1×c2)から、例えばGPUのメモリおよび処理のサイズに対応させた第2入力サイズで、対象画像を切り分けて、複数の画像(第2画像パッチ)を得る。
【0096】
(S24) 計算機システム1は、複数の第2画像パッチを、順にDL-CNNのモデル31に入力して計算を適用し、すなわち診断処理を実行する。この結果、順に複数の各々の第2診断結果画像が得られる。
【0097】
(S25) 計算機システム1は、複数のすべての第2画像パッチのモデル計算(診断処理)が終了したかを確認しながら、同様にS24の処理を繰り返し、すべて終了したらS26へ進む。
【0098】
(S26) 計算機システム1は、複数の各々の第2診断結果画像について、前述の特定の回転方向に対応させて逆回転し、逆回転後の画像の中から、元のサイズ(第2出力サイズ)に対応する画像領域を切り抜いて、複数の各々の第2診断結果画像(劣化確率画像)とする。
【0099】
(S27) 計算機システム1は、複数の第2診断結果画像(劣化確率画像)について、S22の切り分けに対応させて並べ直して連結して、1枚の画像(第2診断結果画像)を得て、保存する。
【0100】
[可視化画面表示処理]
図13は、計算機システム1の第2処理機能12による可視化画面表示の処理フローを示す。この処理は、可視化画面でのユーザ操作に応じたリアルタイムの処理である。
図2の計算機2のGUI画面21に対してユーザが入力操作し、要求等が計算機3に送られる。計算機3が要求等を処理して、画面データを生成して、計算機2へ応答する。そして、計算機2が画面データに基づいて可視化画面を表示する。
図13は、ステップS31~S38を有する。以下、ステップの順に説明する。
【0101】
(S31) 計算機システム1は、ユーザの操作に基づいて指定された診断結果画像を入力する。例えば、計算機3は、DB32から読み出した診断結果画像の画像データを画像メモリに展開する。
【0102】
(S32) 計算機システム1(特に第2処理機能12)は、可視化画面における所定の領域に、ユーザの操作に基づいて指定された種類の診断結果画像を表示する。また、計算機システム1は、画面内に、操作用の閾値(劣化確率閾値、領域サイズ閾値)の部品やコマンドボタン等の部品を表示し、対象の構造物5や対象画像のID等の情報を表示する。可視化画面の表示例は
図14で示される。計算機システム1は、画面内の閾値のGUI部品がユーザによって操作された場合、閾値を変更する。
【0103】
(S33) 計算機システム1は、劣化確率閾値(二値化閾値)に応じて、診断結果画像内の画素毎の確率値を多階調から二値化した二値化画像を生成し、診断結果画像とする。
【0104】
(S34) また、計算機システム1は、領域サイズ閾値に応じて、診断結果画像の二値化画像内における劣化を表す隣接する領域の面積(画素数)が領域サイズ閾値以下となる小領域を抽出し、その小領域を除去した小領域除去画像を生成し、診断結果画像とする。
【0105】
(S35) また、計算機システム1は、ユーザ操作による直線除去の指定(例えば直線除去ボタンのオン設定、あるいは直線除去コマンドの設定に対応した所定キー入力等)に応じて、診断結果画像の二値化画像内における直線状領域を抽出し、その直線状領域を除去した直線除去画像を生成し、診断結果画像とする。
【0106】
(S36) 計算機システム1は、S33~S35の処理を反映した診断結果画像を、画面内の所定の領域に表示する。ユーザは、可視化画面の診断結果画像を見て、適宜に閾値を変更しながら、劣化の有無や箇所を確認でき、最終判定を行うことができる。
【0107】
(S37) また、計算機システム1は、診断結果画像に対する、ユーザ操作による正解付け作業を受け付ける。ユーザは、診断結果画像における画素毎に、劣化推定結果が正解か否かを指定して入力することができる。計算機システム1は、入力された正解付け情報を含む正解付け画像(第3画像)を、データセット101の一部として保存する。
【0108】
(S38) 計算機システム1は、画面でのユーザによる終了操作等に応じて、画面の表示を終了し、終了操作ではない場合には、S31から同様に処理を繰り返す。
【0109】
[可視化画面(GUI画面)]
図14は、第2処理機能12により提供される可視化画面(GUI画面21)の表示例を示す。ユーザは、可視化画面で劣化診断結果の画像を目視確認して、劣化検出の最終判定や正解付け作業を行う。第2処理機能12は、可視化画面内の所定の画像領域、例えば画像第1領域141、画像第2領域142に、モデル31の出力の診断結果画像(劣化確率画像)を表示する。
【0110】
診断結果画像データでは、画素毎に、劣化推定結果の確率値(0~1の値)を階調値(例えば0~255の値)として持つ。この画像では、その画素毎の確率値を、そのまま画素の多階調の色として表示することもできる。また、この画像では、二値化閾値を用いて、その画素の確率値を二値化し、すなわち劣化か否かを表す二値にして表示することもできる。本例では、画像第1領域141には、診断結果多階調画像(
図15の(B)と対応する)が表示されており、画像第2領域142には、元画像の上に診断結果二値化画像を重畳した画像(
図15の(D)と対応する)が表示されている。
【0111】
画像第1領域141や画像第2領域142には、
図15のような他の種類の画像を選択して表示することもできる。1つの可視化画面内で、1つの画像領域に1つの画像を表示してもよいし、
図14の例のように2つ以上の画像領域に並列で2つ以上の画像を表示してもよい。1つの画像領域に2つ以上の画像を交互に切り替えながら表示してもよい。また、画像領域の画像に対し、拡大/縮小表示やシフト表示等のユーザ操作も可能である。
【0112】
また、可視化画面内には、構造物5や画像のID等の情報や、コマンドボタン等の情報を表示する領域も設けられている。この領域では、例えば、構造物ID、画像ID等が表示され、ユーザの操作で選択可能となっている。また、この領域では、アプリ10の機能の選択や設定のための操作が可能となっている。例えば、画像領域に表示する画像の種類等が選択可能である。また、この領域では、例えば直線除去ボタン147が設けられている。直線除去ボタン147がオン状態にされた場合、画像領域に直線除去画像234(
図13のS35)が表示される。
【0113】
また、可視化画面内には、GUI部品として、劣化確率閾値スライダー144や、領域サイズ閾値スライダー145が設けられている。劣化確率閾値スライダー144では、ユーザが劣化確率閾値(二値化閾値)を所定の範囲内で可変操作できる。劣化確率閾値スライダー144の操作に伴い、劣化確率閾値が変更され、画面内の二値化画像の表示内容がリアルタイムで更新される(
図13のS33)。
【0114】
なお、予め、計算機システム1が各二値化閾値に応じた画像を生成して画像メモリに保持しておき、ユーザの操作に応じて対応する画像を画面に表示するようにしてもよい。また、画面内に、異なる各二値化閾値に応じた各画像を並列で表示してもよい。
【0115】
領域サイズ閾値スライダー145では、ユーザが領域サイズ閾値を所定の範囲内で可変操作できる。領域サイズ閾値スライダー145の操作に伴い、領域サイズ閾値が変更され、小領域除去画像233を用いて、画面内の二値化画像の表示内容がリアルタイムで更新される(
図13のS34)。
【0116】
[画像例]
図15は、各種の画像の例を示す。
図15の(A)~(D)の各画像は対応関係を持つ。(A)は、診断対象元画像を示し、構造物5の壁面においてひび割れの劣化(破線枠内)を含む画像151の例である。(B)は、診断結果多階調画像を示し、この画像152では、画素毎に劣化推定確率値が多階調で表現されている。例えば、低階調が青で、高階調が赤で表現され、ヒートマップのような画像である。(C)は、絞り込みされた、診断結果二値化画像を示す。この画像153では、(B)の多階調の画像152と、劣化確率閾値とに基づいて、画素値が二値化されている。例えば、元の多階調の画素値が劣化確率閾値未満の場合には値0として黒色で表現され、元の多階調の画素値が劣化確率閾値以上である場合には値1として赤色で表現される。なお表示色はユーザ設定可能である。(D)は、(A)の画像151の上に(C)の二値化画像のうちの劣化箇所を重畳した画像を示す。本例では、画像内で、ひび割れの劣化が、概略的に縦方向(y)に沿って生じている。また、正解付け作業の際に、劣化領域を透明にして輪郭線を表示するようにしてもよい。
【0117】
図16は、診断結果二値化画像における劣化等の例を示す。(A)の画像161は、元画像の上に診断結果二値化画像を重畳表示した例である。この画像161内には、劣化と推定される劣化箇所だけでなく、一部、破線枠で示すように、直線状領域163のような誤検出箇所も含まれている。また、画像161内には、領域サイズ閾値に応じて、劣化箇所の小領域(小領域群)164も含まれている。(B)は、(A)の画像161に対し、直線領域除去および小領域除去を施した後の画像162の例である。この画像162では、直線状領域や小領域が除去されており、劣化箇所の確認や最終判定がしやすくなっている。例えば、一点鎖線枠で示すように、ひび割れの劣化箇所165が確認できる。劣化箇所165は、概略的にある方向に沿って生じていることがわかる。
【0118】
[小領域除去]
ひび割れ等の劣化は、ある程度以上連続的につながった画素領域として検出されるはずと考えられる。そこで、診断結果画像の劣化箇所から、面積が小さい領域(小領域)を除去することで、ユーザによる劣化検出の最終判定を行いやすくする。計算機システム1(特に第2処理機能12)は、診断結果画像、特に二値化画像における、劣化(値1)の画素が隣接している劣化領域の面積(サイズ)を画素数等で判断する。その劣化領域の面積が、領域サイズ閾値以下である場合、その領域(小領域)を、劣化箇所とはせずに除去し、小領域除去画像233として、
図16の例のように表示する。
【0119】
[直線領域除去]
診断結果画像のうち、劣化箇所と推定された領域が、直線形状に近い場合、ひび割れ等の劣化ではない可能性が高いと考えられる。例えば壁面に元々デザインとして形成されている直線状の溝やフレーム等の可能性が挙げられる。そこで、診断結果画像内の劣化箇所から、直線状領域を除去することで、ユーザによる劣化検出の最終判定を行いやすくする。計算機システム1(特に第2処理機能12)は、診断結果画像の特に二値化画像に対し、公知の直線検出アルゴリズム処理、例えば確率的ハフ変換処理を適用する。これにより、診断結果画像から、直線状領域が抽出される。計算機システム1は、抽出された直線状領域を除去して、直線除去画像234として、
図16の例のように表示する。
【0120】
[モデル入力サイズ設定]
図17は、実施の形態1で、モデル入力サイズ設定機能15によるモデル入力サイズ設定について示す。この設定処理は、
図3等のモデル31に対する第1画像パッチの好適な第1入力サイズを決定し設定する処理である。(A)は、カメラ4の画像に対応する第1画像における複数の画像を示す。ある構造物5(例えば構造物ID=STR1)に関する第1画像として、例えば、画像P#1,P#2,P#3等を有する。これらの複数の画像は、サイズや解像度が異なっている場合がある。画像に伴う画像情報として、サイズ(SZ)、カメラ画素数(PN)、カメラ画角(AN)、対象物距離(DS)、解像度(DF)を示す。画像情報は、例えば、画像データの属性情報として付属されるか、あるいは、計算機システム1で作成または設定される。アプリ10は、カメラ4から取得した画像データの画像情報を用いて設定処理を行う。なお、例えば同じ1mmの大きさのひび割れの劣化の場合でも、その劣化(対象物)からの距離が異なる各カメラ画像の場合、その劣化箇所に占める画素数が異なるものとなる。そのため、対象物距離(DS)の情報についても保存している。
【0121】
(B)は、(A)の第1画像に関する補正処理を示す。(A)の複数の画像は、解像度が一定になるように、サイズが補正される。例えば、一定の解像度を解像度DFCとする。例えば、画像P#3は、解像度DF3が解像度DFCになるように、サイズSZ3がサイズSZ3Cに補正されている。補正後の複数の画像C#1,C#2,C#3は、同じ解像度DFCにされている。カメラ画像入力機能15は、このような補正処理を行う機能を含む。
【0122】
(C)は、DL-CNNのモデル31の第1入力サイズの設定について示す。(B)の補正後の複数の画像の各サイズ(SZ1C,SZ2C,SZ3C)から、例えば最小サイズの正方形が選択される。その正方形のサイズが、モデル31に入力する第1画像パッチの第1入力サイズ(b1×b1)として決定され、情報が設定される。このモデル31は、対象の構造物5(構造物ID=STR1)の診断に好適なモデル31となる。上記のように、モデル入力サイズ設定機能15を用いることで、好適な入力サイズを設定でき、より高精度の診断が可能である。また、ユーザが、可視化画面のモデル設定項目(非図示)で、任意に好適な入力サイズおよび出力サイズを指定して設定することも可能である。
【0123】
[効果等]
上記のように、実施の形態1の構造物劣化検出システムによれば、劣化検出の精度を確保しつつ、計算機での学習および診断に要する計算時間およびユーザの作業時間を含む時間を短縮でき、ユーザの作業負担を低減できる。構造物の管理者等は、効率的に点検補修業務を行うことができる。計算機性能が限られるシステムの場合でも、深層学習を用いた劣化診断を可能とする。本システムによれば、構造物の画像群のサイズや解像度等が多様な場合にも対応できるので、画像群の取得作業を含め、訓練および診断の作業を効率的に実現できる。また、ひび割れ等の劣化の特性を考慮して学習するので、診断の精度が確保できる。また、好適な画像入力サイズを選択できるので、計算機システム1の性能(GPU等)に合わせて最大限効率的な計算が可能である。
【0124】
他の実施の形態として以下も可能である。可視化画面内に、構造物5の3次元オブジェクトモデルに基づいた画像を表示し、その画像の3次元オブジェクトの面に、位置や方向を対応付けながら、二値化画像等を貼り付けて表示してもよい。また、構造物5上の位置毎に、時系列上の診断日時毎の画像を関係付けて、劣化の進行度合い等を画面で確認可能としてもよい。
【0125】
以上、本発明を実施の形態に基づき具体的に説明したが、本発明は前述の実施の形態に限定されず、その要旨を逸脱しない範囲で種々変更可能である。
【符号の説明】
【0126】
1…計算機システム、2…計算機、3…計算機、4…カメラ、5…構造物、6…通信網、10…構造物劣化検出ソフトウェア(アプリ)、20…クライアントプログラム、21…GUI画面、30…サーバプログラム、31…DL-CNN(モデル)、32…DB、41…画像、42…劣化。