(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024119255
(43)【公開日】2024-09-03
(54)【発明の名称】学習データ生成装置、及び学習データ生成方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20240827BHJP
G06N 20/00 20190101ALI20240827BHJP
G01N 21/88 20060101ALN20240827BHJP
【FI】
G06T7/00 350B
G06N20/00
G06T7/00 U
G01N21/88 J
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2023026024
(22)【出願日】2023-02-22
(71)【出願人】
【識別番号】000000549
【氏名又は名称】株式会社大林組
(71)【出願人】
【識別番号】519137888
【氏名又は名称】株式会社Lightblue
(74)【代理人】
【識別番号】110000176
【氏名又は名称】弁理士法人一色国際特許事務所
(72)【発明者】
【氏名】野島 省吾
(72)【発明者】
【氏名】林 かほり
(72)【発明者】
【氏名】松本 憲典
(72)【発明者】
【氏名】佐藤 あい
【テーマコード(参考)】
2G051
5L096
【Fターム(参考)】
2G051AA90
2G051AB02
2G051AB03
2G051CA04
2G051EA12
2G051EA14
5L096BA03
5L096BA18
5L096CA02
5L096CA22
5L096KA04
(57)【要約】
【課題】事象の発生原因を特定する機械学習モデルの学習に用いる学習データを効率よく生成する。
【解決手段】事象の発生原因の候補の夫々の該当確率と選択肢の夫々の重みとに基づき、選択肢の夫々が選択された場合における発生原因の候補の夫々の該当確率をベイズの定理により事後確率として求め、質問データから質問を順次選択してユーザに提示し、質問の夫々について選択肢の選択をユーザから受け付け、質問の夫々に対する回答を受け付ける度に、受け付けた選択肢について求めた事後確率により発生原因の候補の夫々の該当確率を更新し、該当確率を更新する度に、発生原因の候補を夫々の該当確率の降順に提示し直し、提示した発生原因の候補の中から、画像データに写っている事象の発生原因の指定をユーザから受け付け、画像データとユーザが指定した発生原因とを対応づけた情報を学習データとして生成する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
プロセッサ及び記憶装置を有する情報処理装置を用いて構成され、
事象が生じている対象物を撮影した画像である撮影画像の画像データを入力することにより前記事象の発生原因を示す情報を出力する機械学習モデルの学習に用いる学習データを生成する学習データ生成装置であって、
学習データの生成に用いる撮影画像の画像データと、
前記撮影画像に写っている事象の発生原因の特定に際してユーザに提示する複数の質問を含む質問データと、
前記事象についての複数の発生原因の候補と、
前記撮影画像に写っている事象の複数の発生原因の候補の夫々に該当する確率である該当確率と、
前記質問の夫々についての回答の選択肢と、
前記選択肢の夫々について、夫々が選択された場合に前記複数の発生原因の候補の夫々の前記該当確率に与える影響の大きさを示す値である重みを示す情報である選択肢毎重み管理情報と、
を記憶し、
前記発生原因の候補の夫々の前記該当確率と前記選択肢の夫々の前記重みとに基づき、前記選択肢の夫々が選択された場合における前記発生原因の候補の夫々の前記該当確率をベイズの定理により事後確率として求め、
前記質問データから前記質問を順次選択してユーザに提示し、前記質問の夫々について前記選択肢の選択をユーザから受け付け、
前記質問の夫々に対する回答を受け付ける度に、受け付けた前記選択肢について求めた前記事後確率により前記発生原因の候補の夫々の前記該当確率を更新し、
前記該当確率を更新する度に、前記発生原因の候補を夫々の前記該当確率の降順に提示し直し、
提示した前記発生原因の候補の中から、前記画像データに写っている事象の発生原因の指定をユーザから受け付け、
前記画像データとユーザが指定した前記発生原因とを対応づけた情報を前記学習データとして生成する、
学習データ生成装置。
【請求項2】
請求項1に記載の学習データ生成装置であって、
前記質問データから前記質問を順次選択してユーザに提示し、前記質問の夫々について前記選択肢の選択をユーザから受け付けていく過程において、前記質問データに含まれている前記質問のうち未選択の前記質問の夫々について、夫々を選択してユーザから回答を受け付けることにより得られる情報量の期待値を求め、前記期待値が最小の質問を次に提示する質問として選択する、
学習データ生成装置。
【請求項3】
請求項2に記載の学習データ生成装置であって、
前記情報量の期待値を、前記選択肢の夫々が選択された場合における前記発生原因の候補の夫々の前記該当確率に基づき求める、
学習データ生成装置。
【請求項4】
請求項3に記載の学習データ生成装置であって、
前記選択肢の夫々が選択された場合における前記発生原因の候補の夫々の前記該当確率に基づき、前記未選択の質問の夫々の前記選択肢の平均情報量を求め、
前記未選択の質問の夫々の前記選択肢の前記平均情報量の最小値又は平均値を求め、
前記未選択の質問のうち、前記最小値が最小の質問、又は前記平均値が最小の質問を次に提示する質問として選択する、
学習データ生成装置。
【請求項5】
請求項1に記載の学習データ生成装置であって、
複数の前記撮影画像の画像データの夫々について提示した前記質問の夫々について、ユーザが選択した前記選択肢を記憶し、
同じ前記質問に対してユーザが選択した前記選択肢の傾向が類似する前記撮影画像の組合せを示す情報を提示する、
学習データ生成装置。
【請求項6】
請求項1に記載の学習データ生成装置であって、
前記撮影画像について提示した前記発生原因の候補の中からユーザが指定した前記発生原因と、
前記撮影画像に写っている事象の発生原因について前記ユーザ以外の他の主体により特定された前記発生原因と、
を記憶し、
前記ユーザから受け付けた前記発生原因と前記他の主体により特定された前記発生原因とを比較可能な状態で提示する、
学習データ生成装置。
【請求項7】
請求項1に記載の学習データ生成装置であって、
前記質問の夫々についてユーザが選択した前記選択肢の履歴を記憶し、
前記選択肢の夫々が選択された回数を示す情報を提示する、
学習データ生成装置。
【請求項8】
請求項1に記載の学習データ生成装置であって、
前記撮影画像の夫々を、夫々に写っている事象の発生原因を指定したユーザと対応づけて記憶し、
前記ユーザの指定を受け付け、
指定された前記ユーザに対応づけられている前記撮影画像の一覧を提示する、
学習データ生成装置。
【請求項9】
請求項1に記載の学習データ生成装置であって、
前記撮影画像の夫々を、前記発生原因の候補の中からユーザが指定した前記発生原因と対応づけて記憶し、
前記発生原因の指定を受け付け、
指定された前記発生原因に対応づけられている前記撮影画像の一覧を提示する、
学習データ生成装置。
【請求項10】
請求項1に記載の学習データ生成装置であって、
前記選択肢毎重み管理情報を、表計算ソフトウェアが取り扱い可能な表形式のデータとして管理し、前記データの編集環境を提供する、
学習データ生成装置。
【請求項11】
請求項1乃至10のいずれか一項に記載の学習データ生成装置であって、
前記対象物は、コンクリート構造物であり、
前記事象は、前記コンクリート構造物に生じたひび割れである、
学習データ生成装置。
【請求項12】
プロセッサ及び記憶装置を有する情報処理装置を用いて構成され、事象が生じている対象物を撮影した画像である撮影画像の画像データを入力することにより前記事象の発生原因を示す情報を出力する機械学習モデルの学習に用いる学習データを生成する学習データ生成装置が、
学習データの生成に用いる撮影画像の画像データと、
前記撮影画像に写っている事象の発生原因の特定に際してユーザに提示する複数の質問を含む質問データと、
前記事象についての複数の発生原因の候補と、
前記撮影画像に写っている事象の複数の発生原因の候補の夫々に該当する確率である該当確率と、
前記質問の夫々についての回答の選択肢と、
前記選択肢の夫々について、夫々が選択された場合に前記複数の発生原因の候補の夫々の前記該当確率に与える影響の大きさを示す値である重みを示す情報である選択肢毎重み管理情報と、
を記憶するステップ、
前記発生原因の候補の夫々の前記該当確率と前記選択肢の夫々の前記重みとに基づき、前記選択肢の夫々が選択された場合における前記発生原因の候補の夫々の前記該当確率をベイズの定理により事後確率として求めるステップ、
前記質問データから前記質問を順次選択してユーザに提示し、前記質問の夫々について前記選択肢の選択をユーザから受け付けるステップ、
前記質問の夫々に対する回答を受け付ける度に、受け付けた前記選択肢について求めた前記事後確率により前記発生原因の候補の夫々の前記該当確率を更新するステップ、
前記該当確率を更新する度に、前記発生原因の候補を夫々の前記該当確率の降順に提示し直すステップ、
提示した前記発生原因の候補の中から、前記画像データに写っている事象の発生原因の指定をユーザから受け付けるステップ、
前記画像データとユーザが指定した前記発生原因とを対応づけた情報を前記学習データとして生成するステップ、
を実行する、学習データ生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習データ生成装置、及び学習データ生成方法に関し、とくに事象の発生原因の診断に用いる機械学習モデルの学習に用いる学習データを生成する技術に関する。
【背景技術】
【0002】
近年、構造物の表面等を撮影した画像を機械学習モデルに入力してコンクリートの劣化の診断やひび割れの検出を行う仕組みの開発や研究が行われている。
【0003】
例えば、特許文献1には、コンクリートの劣化の診断又は予測をすることができる予測モデルの作成方法において、学習用サンプルとしてコンクリート試験体を作製し、試験体の表面の初期画像を取得し、表面ひずみが顕在化した試験体の表面の表面ひずみ画像を取得し、デジタル画像相関法を用いて、初期画像及び表面ひずみ画像から、試験体表面のひずみ分布のデータを作成し、ひずみ分布のデータを含む学習用入力データとコンクリートの劣化に関するデータを含む学習用出力データの組合せである学習データを用いた機械学習により、コンクリートの劣化を予測するための予測モデルを作成することが記載されている。
【0004】
また、例えば、特許文献2には、コンクリート表面におけるひび割れの特徴をコンピュータに学習させた学習情報に基づき、入力画像からひび割れと想定される想定ひび割れを抽出するように構成されたひび割れ検出装置について記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2021-018233号公報
【特許文献2】特開2022-168436号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
橋梁、ダム、高層建築物等のコンクリート構造物のひび割れが検出された場合に適切な措置や対策を講じるためには、ひび割れの発生原因を正しく特定することが重要である。現状ではひび割れが検出された場合、技術者が現場に赴き目視により所定の点検項目を確認していくことにより発生原因の特定を行っており、多大な労力と時間を要している。
【0007】
ひび割れのように対象物に生じた事象の発生原因を効率よく高い精度で行う仕組みとして、事象が生じている対象物を撮影した画像(以下、「撮影画像」と称する。)に基づき事象の発生原因を特定する機械学習モデルを用いることが考えられる。但しそのような機械学習モデルの性能を実用的なレベルとするためには、機械学習モデルの性能の向上に有効に寄与する質の良い学習データを大量に用意する必要がある。また、コンクリート構造物に生じるひび割れのように事象の態様(種類、バリエーション)が多岐に亘る場合には、態様毎に膨大な数の学習データを用意しなければならない。
【0008】
上記の特許文献1に記載された技術は、コンクリートの劣化の診断もしくは予測することを目的とするものであり、事象の発生原因を特定する機械学習モデルの学習データの生成を効率よく行う観点に基づく構成については触れていない。また、特許文献2に記載の技術は、入力画像からひび割れと想定される想定ひび割れを抽出することを目的とするものに過ぎず、学習データの生成を効率よく行う観点に基づく仕組みは開示されていない。
【0009】
本発明はこのような背景に鑑みてなされたものであり、事象の発生原因を特定する機械学習モデルの学習に用いる学習データを効率よく生成することが可能な、学習データ生成装置、及び学習データ生成方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記目的を達成するための本発明の一つは、プロセッサ及び記憶装置を有する情報処理装置を用いて構成され、事象が生じている対象物を撮影した画像である撮影画像の画像データを入力することにより前記事象の発生原因を示す情報を出力する機械学習モデルの学習に用いる学習データを生成する学習データ生成装置であって、学習データの生成に用いる撮影画像の画像データと、前記撮影画像に写っている事象の発生原因の特定に際してユーザに提示する複数の質問を含む質問データと、前記事象についての複数の発生原因の候補と、前記撮影画像に写っている事象の複数の発生原因の候補の夫々に該当する確率である該当確率と、前記質問の夫々についての回答の選択肢と、前記選択肢の夫々について、夫々が選択された場合に前記複数の発生原因の候補の夫々の前記該当確率に与える影響の大きさを示す値である重みを示す情報である選択肢毎重み管理情報と、を記憶し、前記発生原因の候補の夫々の前記該当確率と前記選択肢の夫々の前記重みとに基づき、前記選択肢の夫々が選択された場合における前記発生原因の候補の夫々の前記該当確率をベイズの定理により事後確率として求め、前記質問データから前記質問を順次選択してユーザに提示し、前記質問の夫々について前記選択肢の選択をユーザから受け付け、前記質問の夫々に対する回答を受け付ける度に、受け付けた前記選択肢について求めた前記事後確率により前記発生原因の候補の夫々の前記該当確率を更新し、前記該当確率を更新する度に、前記発生原因の候補を夫々の前記該当確率の降順に提示し直し、提示した前記発生原因の候補の中から、前記画像データに写っている事象の発生原因の指定をユーザから受け付け、前記画像データとユーザが指定した前記発生原因とを対応づけた情報を前記学習データとして生成することを特徴とする。
【0011】
その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄、及び図面により明らかにされる。
【発明の効果】
【0012】
本発明によれば、事象の発生原因を特定する機械学習モデルの学習に用いる学習データを効率よく生成することができる。
【図面の簡単な説明】
【0013】
【
図1】診断システムの概略的な構成を示す図である。
【
図3】学習データ生成装置が備える主な機能を示す図である。
【
図6C】ユーザが凡例/投稿画像又は他ユーザ登録画像を表示させている様子を示す図である。
【
図7B】発生原因別撮影画像提示画面の一例である。
【
図7D】診断主体毎診断結果提示画面の一例である。
【
図8B】質問/選択肢アップロード画面の一例である。
【
図8C】ユーザ/管理者情報管理画面の一例である。
【
図9】質問提示/回答受付処理を説明するフローチャートである。
【
図10A】発生原因候補毎の該当確率の初期値、質問データ、及び選択肢毎重み管理情報の一例を示す図である。
【
図10B】発生原因候補毎の該当確率の初期値を求めた結果を示す図である。
【
図10C】各選択肢の発生原因候補毎の重みの調整毎の値を示す図である。
【
図10D】各質問の各選択肢が選択された場合における各発生原因候補の該当確率をベイズの定理の事後確率として求めた結果を示す図である。
【
図10E】各選択肢が選択された場合の平均情報量を求めた結果を示す図である。
【
図10F】各質問について回答が得られた場合の平均情報量の最小値と平均値を算出した結果を示す図である。
【
図10G】情報量の期待値が最小(平均情報量の最小値又は平均値が最小)の質問を次の質問として選択した結果を示す図である。
【
図10H】選択した質問に対してユーザが選択した選択肢を示す図である。
【
図10I】選択した質問に対してユーザが選択肢を選択した後の発生原因候補毎の該当確率を示す図である。
【
図10J】各選択肢の発生原因候補毎の重みの調整毎の値を示す図である(
図10Cと同一)。
【
図10K】各質問の各選択肢が選択された場合における各発生原因候補の該当確率をベイズの定理の事後確率として求めた結果を示す図である。
【
図10L】各選択肢が選択された場合の平均情報量を求めた結果を示す図である。
【
図10M】各質問について回答が得られた場合の平均情報量の最小値と平均値を算出した結果を示す図である。
【
図10N】情報量の期待値が最小(平均情報量の最小値又は平均値が最小)の質問を次の質問として選択した結果を示す図である。
【
図10O】選択した質問に対してユーザが選択した選択肢を示す図である。
【
図11】診断システムの構成に用いる情報処理装置(コンピュータ)の一例である。
【発明を実施するための形態】
【0014】
以下、図面を参照しつつ本発明の実施形態について説明する。尚、以下の記載及び図面は、本発明を説明するための例示に過ぎず、説明の明確化のため、適宜、省略及び簡略化がなされている。以下の説明において、符号の前に付した「S」の文字は処理ステップの意味である。
【0015】
図1に、本発明の一実施形態にかかる情報処理システムであるひび割れ発生原因診断システム(以下、「診断システム1」と称する。)の概略的な構成を示している。同図に示すうように、診断システム1は、ひび割れ発生原因診断装置(以下、「診断装置3」と称する。)、学習データ生成装置100、診断モデル学習装置6、ユーザ装置2、及び管理装置4を含む。各装置はいずれも情報処理装置(コンピュータ)を用いて構成されており、互いに双方向通信が可能な状態で接続されている。各装置の数(台数)は必ずしも限定されない。通信ネットワーク5は、無線方式又は有線方式の通信基盤(Communication Infrastructure)であり、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、公衆用通信網、専用線等である。尚、学習データ生成装置100、診断モデル学習装置6、一つ以上のユーザ装置2、及び管理装置4のうち少なくとも2つ以上は、共通の情報処理装置を基盤として実現されていてもよい。
【0016】
ユーザ装置2は、主として診断システム1が提供する機能を利用する者(以下、「ユーザ」と称する。)によって操作される。一方、管理装置4は、主として診断システム1の管理者によって操作される。
【0017】
診断装置3、学習データ生成装置100、及び診断モデル学習装置6は、ユーザ装置2や管理装置4を介して行われるユーザや管理者との対話処理により各種情報の取得や各種情報の提供を行う。上記の対話処理を行うためのユーザインタフェース(情報を記載した画面の生成や提示、ユーザや管理者からの情報の取得等を行う機能や環境)は、ユーザ装置2や管理装置4が提供してもよいし、診断装置3、学習データ生成装置100、診断モデル学習装置6のうちの少なくともいずれかが通信ネットワーク5を介して提供してもよい。
【0018】
診断装置3は、ユーザから、撮影装置(例えば、スマートフォンやタブレット、デジタルスチールカメラ)によりコンクリート構造物に生じているひび割れを撮影した画像(以下、「撮影画像」と称する。)のデータ(以下、「画像データ」と称する。)の登録(入力)を受け付ける。診断装置3は、受け付けた撮影画像の画像データを機械学習モデル(以下、「診断モデル31」と称する。)に入力し、診断モデル31が出力する情報(撮影画像に写っているひび割れの発生原因の候補(以下、「発生原因候補」とも称する。)や発生原因候補の夫々に該当する確率(以下、「該当確率」と称する。)等を示す情報を診断結果としてユーザ装置2に提供(送信)する。
【0019】
図2は、ユーザが診断装置3の機能を利用する際に診断装置3がユーザに提示する画面(以下、「診断機能利用画面200」と称する。)の一例である。例示する診断機能利用画面200は、画像入力欄211、画像表示欄212、アップロード指示ボタン213、及び診断結果表示欄214を有する。
【0020】
ユーザが、診断の対象となる撮影画像を画像入力欄211に指定する操作を行うとともに、アップロード指示ボタン213を操作すると、ユーザ装置2は、入力された撮影画像を画像表示欄212に表示し、撮影画像の画像データを診断装置3に送信する。診断装置3は、画像データを受信すると、受信した画像データを診断モデル31に入力し、診断モデル31が出力する診断結果をユーザ装置2に送信する。ユーザ装置2は、診断結果を受信すると、受信した診断結果を同図の診断結果表示欄214に表示する。
【0021】
図1に戻り、学習データ生成装置100は、診断モデル31の学習に用いる学習データ(教師データ)の生成に用いる撮影画像(以下、「対象画像」と称する。)について、ユーザと対話処理を行うことにより対象画像に写っているひび割れの発生原因を特定し、画像データに特定した発生原因をラベルとして対応づけることにより学習データを生成する。学習データ生成装置100は、生成した学習データを診断モデル学習装置6に送信する。ユーザは、例えば、現場でひび割れに関する作業(発見、補修、修繕等)を行っている技術者である。このように知識や経験を有する現場の技術者が対象画像に写っているひび割れの発生原因を特定する(ラベル付けを行う)ことにより良質の学習データを生成することができる。また、技術者は、自身の業務を遂行しつつ、学習データの生成に貢献できる。また、学習データの生成に現場の個々の技術者が貢献することで、例えば、大規模な組織においては学習データの作成にかかる作業負荷が分散され、大量の学習データを効率よく生成することができる。
【0022】
同図に示す診断モデル学習装置6は、学習データ生成装置100から受信した学習データを用いて診断モデル31の学習を行う。
【0023】
同図に示す管理装置4は、診断システム1が備える各種機能の設定や診断システム1において管理される各種情報(データ)の設定、ユーザや管理者の管理(登録、編集、削除、権限設定等)を行う。
【0024】
<学習データ生成装置>
図3に、学習データ生成装置100が備える主な機能を示している。同図に示すように、学習データ生成装置100は、記憶部110、画像登録受付管理部125、画像毎発生原因登録部130、学習データ生成送信部140、支援情報提供部150、及び情報管理部160の各機能を備える。
【0025】
上記機能のうち、記憶部110は、画像データ情報111、質問データ情報112、選択肢毎重み管理情報113、画像毎回答結果情報114、画像毎発生原因登録情報115、学習データ情報116、及びユーザ/管理者情報117の各情報(データ)を記憶する。
【0026】
上記情報のうち、画像データ情報111は、ユーザや管理者が登録した多数の画像データを含む。画像データ情報111は、学習データの生成に用いる撮影画像の画像データの他、サンプルやテストに用いる画像データ、画像データのデータ管理上の整合性を保つためのダミーの画像データ等を含む。
【0027】
図4Aに、画像データ情報111の一例を示す。画像データ情報111の一つのレコードは一つの撮影画像に対応している。例示する画像データ情報111は、符号1111で示す画像データ(本例では画像データの所在としている。)と、符号1112で示す、当該画像データを登録したユーザの識別子(以下、「ユーザID」と称する。)又は管理者の識別子(以下、「管理者ID」と称する。)とを対応づけた情報(以下、「ユーザ/管理者ID」と称する。)を含む。
【0028】
図3に戻り、質問データ情報112は、学習データを生成する際の対話処理でユーザに提示する一つ以上の質問の内容である一つ以上の質問データを含む。質問データ情報112は、例えば、版(バージョン)が異なる複数の質問データを含んでいてもよい。個々の質問データは、例えば、ファイルシステムにより独立したファイルとして管理される。尚、診断システム1は、コンクリートのひび割れ以外の事象の発生原因の特定にも広く適用することが可能であり、質問データ情報112は、他の事象の診断に用いる質問データを含んでいてもよい。
【0029】
図4Bに、質問データ情報112として管理される質問データの一例を示す。例示する質問データ1120は、質問毎に付与される識別子(以下、「質問ID」と称する。)である質問ID1121と、質問の内容である質問内容1122とを対応づけた一つ以上のレコードを含む。学習データ生成装置100は、質問データ1120から質問を順次選択してユーザに提示する。
【0030】
図3に戻り、選択肢毎重み管理情報113は、質問データの各質問について予め用意された回答の選択肢の内容を含む。また、選択肢毎重み管理情報113は、各選択肢の夫々が選択された場合に発生原因候補の夫々の該当確率に与える影響の大きさ得を示す値(以下、「重み」と称する。)を含む。また、選択肢毎重み管理情報113は、各質問の回答難易度(本例では数値が大きい程、回答が難しいことを示す。)を示す情報を含む。
【0031】
図4Cに、選択肢毎重み管理情報113の一例を示す。例示する選択肢毎重み管理情報113は、選択肢の識別子(以下、「選択肢ID」と称する。)である選択肢ID1131、選択肢の内容1132、回答難易度1133、及び質問ID1134の組合せ毎に、発生原因候補1135の夫々について設定された重み1136を対応づけた内容を含む。
【0032】
図3に戻り、画像毎回答結果情報114は、撮影画像毎に、ユーザに提示した各質問についてユーザから受け付けた回答(ユーザが選択した選択肢)を示す情報(以下、「画像毎回答結果」と称する。)を含む。
【0033】
図4Dに、画像毎回答結果情報114の一例を示す。画像毎回答結果情報114の一つのレコードは一つの画像毎回答結果に対応している。画像毎回答結果情報114は、撮影画像ID1141、発生原因候補1142、質問ID1143、及び選択肢ID1144の各項目を対応づけて構成される一つ以上のレコードを含む。
【0034】
上記項目のうち、撮影画像ID1141には、撮影画像の識別子(以下、「撮影画像ID」と称する。)が格納される。発生原因候補1142には、当該撮影画像について推定されるひび割れの発生原因を示す情報が該当確率の最も高い順に格納される。質問ID1143には、当該撮影画像について学習データ生成装置100が対話処理でユーザに提示した質問の質問IDが質問を提示した順に格納される。選択肢ID1144には、提示された質問の夫々についてユーザが選択した選択肢の選択肢IDが、質問が提示された順に格納される。
【0035】
図3に戻り、画像毎発生原因登録情報115には、撮影画像についてユーザ又は管理者が登録した発生原因(以下、「画像毎発生原因」と称する。)が管理される。
【0036】
図4Eに、画像毎発生原因登録情報115の一例を示す。例示する画像毎発生原因登録情報115の一つのレコードは一つの画像毎発生原因に対応している。例示する画像毎発生原因登録情報115は、符号1151で示す画像データ(本例では画像データの所在としている。)と、符号1152で示す、当該画像データの撮影画像について登録されたひび割れの発生原因と、符号1153で示す、当該発生原因の登録を行ったユーザのユーザIDと、を対応づけた情報を含む。
【0037】
図3に戻り、学習データ情報116は、学習データ生成装置100が生成した一つ以上の学習データを含む。
【0038】
図4Fに、学習データ情報116の一例を示す。例示する学習データ情報116の一つのレコードは一つの学習データに対応している。同図に示すように、学習データは、符号1161で示す撮影画像(本例では画像データの所在としている。)と、符号1162で示す、当該撮影画像について登録された発生原因とを対応づけた情報を含む。
【0039】
図3に戻り、ユーザ/管理者情報117は、ユーザや管理者に関する情報を含む。
【0040】
図4Gに、ユーザ/管理者情報117の一例を示す。例示するユーザ/管理者情報117の一つのレコードは1人のユーザ又は管理者に対応している。例示するユーザ/管理者情報117は、ユーザ/管理者ID1171、登録/更新日時1172、権限1173、ステータス1174等の各項目を有する複数のレコードを有する。
【0041】
上記項目のうち、ユーザ/管理者ID1171には、ユーザID又は管理者IDが格納される。登録/更新日時1172には、当該レコードが登録又は直近に更新された日時を示す情報が格納される。権限1173には、当該ユーザ又は当該管理者に付与されている権限を示す情報が格納される。ステータス1174には、当該ユーザ又は当該管理者が現在、診断システム1を利用中(ログイン中)であるか否かを示す情報が格納される。
【0042】
図3に戻り、同図に示す画像登録受付管理部125は、ユーザ装置2や管理装置4を介して撮影画像の登録を受け付け、受け付けた撮影画像の画像データを記憶部110に画像データ情報111の要素として管理する。
【0043】
図5に、画像登録受付管理部125が、撮影画像の登録を受け付ける際にユーザに提示する画面(以下、「撮影画像登録受付画面500」と称する。)の一例を示す。例示する撮影画像登録受付画面500は、画像入力欄511、登録画像表示欄512、アップロード指示ボタン513、及び試用ボタン514を有する。
【0044】
ユーザが画像入力欄511に撮影画像を指定する操作を行いアップロード指示ボタン513を操作すると、ユーザ装置2は、指定された撮影画像の画像データを学習データ生成装置100に送信し、指定された画像データを登録画像表示欄512に表示する。学習データ生成装置100は、上記画像データを受信すると、受信した画像データを画像データ情報111の要素として登録する。
【0045】
試用ボタン514は、例えば、撮影画像を登録せずに前述した対話処理を試用する場合にユーザが操作する。試用ボタン514が選択された場合、予め画像データ情報111に格納されている撮影画像がサンプル画像やテスト画像が自動的に選択されて対象画像とされる。
【0046】
図3に戻り、同図に示す画像毎発生原因登録部130は、ユーザと対話処理を行うことにより、ユーザから対象画像に写っているひび割れの発生原因の指定を受け付ける。
【0047】
具体的には、画像毎発生原因登録部130は、対象画像ついて、質問データの質問を選択するとともに選択した質問の選択肢を選択肢毎重み管理情報113から取得する。そして、画像毎発生原因登録部130は、選択した質問と取得した選択肢とをユーザに提示し、受け付けた各質問の回答(選択肢の選択)を画像毎回答結果として画像毎回答結果情報114として管理する。
【0048】
画像毎発生原因登録部130は、以上の動作をユーザが対象画像に対応づける発生原因を確定し、確定した発生原因の画像毎発生原因登録情報115への登録操作を行うまで、質問データの質問を順次選択して繰り返す。また、画像毎発生原因登録部130は、画像毎回答結果の発生原因候補の中から、対象画像に対応づける発生原因の指定をユーザから受け付け、指定された発生原因を対象画像に対応づけて画像毎発生原因登録情報115に登録する。
【0049】
同図に示すように、画像毎発生原因登録部130は、質問提示部131、回答受付部132、質問選択部133、凡例/投稿画像提示部134、発生原因毎該当確率算出部135、発生原因候補提示部136、及び画像毎発生原因登録部137の各機能を有する。
【0050】
このうち質問提示部131は、対象画像について、質問データ情報112から選択される質問データから一つずつ質問を選択するとともに、選択した質問の選択肢を選択肢毎重み管理情報113から取得する。そして、質問提示部131は、選択した質問と取得した選択肢とをユーザに提示し、提示した質問についての回答(選択肢の選択)を受け付ける。質問提示部131は、例えば、ユーザが対象画像について発生原因の登録操作を行った場合に当該対象画像についての次の質問の提示を終了する。
【0051】
回答受付部132は、提示した質問に対する回答(選択肢の選択)をユーザから受け付け、受け付けた選択肢を、当該質問及び対象画像と対応づけて画像毎回答結果情報114に格納する。
【0052】
質問選択部133は、質問データの質問のうち現時点までに未選択の質問の中から、次にユーザに提示する質問(以下、「次の質問」と称する。)を選択する。質問選択部133は、例えば、上記未選択の質問のうち、ユーザから回答を受け付けることにより得られる情報量の期待値である平均情報量(情報エントロピー(シャノンエントロピー))が最小の(平均情報量の減少量の期待値が最大の)質問を次の質問として選択する。尚、上記期待値に基づき次の質問を選択するための仕組みの詳細については後述する。質問選択部133が、例えば、最初に必ず確認しておきたい質問(構造物のカテゴリや構造物が存在する地域等)や回答難易度が低い(ユーザが回答しやすい)質問を優先して表示するようにしてもよい。また、提示する質問の優先順位を予め管理者が設定できるようにしてもよい。また、質問の選択方法(例えば、優先順位に基づき次の質問を選択するか、上記期待値に基づき次の質問を選択するか)を管理者が設定できるようにしてもよい。
【0053】
凡例/投稿画像提示部134は、発生原因候補提示部136がユーザに提示している発生原因候補について、凡例として画像データ情報111に登録されている撮影画像や、当該発生原因候補を原因候補として他のユーザが登録した撮影画像をユーザに提示する。凡例/投稿画像提示部134は、対象画像について提示した発生原因候補の一つをユーザが指定すると、指定された発生原因候補に対応づけられている撮影画像を画像毎発生原因登録情報115から特定し、特定した撮影画像の画像データを画像データ情報111から取得してユーザに提示する。
【0054】
発生原因毎該当確率算出部135は、選択肢毎重み管理情報113と、対象画像について質問の提示を開始してから現時点までに提示した各質問に対するユーザの回答(選択肢の選択)の履歴とに基づき、当該対象画像についての発生原因候補の夫々の該当確率をベイズの定理により事後確率として求める。尚、該当確率の詳細については後述する。
【0055】
発生原因候補提示部136は、発生原因毎該当確率算出部135が求めた発生原因候補を該当確率の降順に並べてユーザに提示する。
【0056】
画像毎発生原因登録部137は、発生原因候補提示部136が提示した発生原因候補の中から対象画像に対応づける発生原因の指定をユーザから受け付け、受け付けた発生原因を対象画像に対応づけた情報を画像毎発生原因登録情報115として登録する。
【0057】
図3に示す学習データ生成送信部140は、画像毎発生原因登録情報115に基づき、ユーザが特定した発生原因をラベルとして対象画像に対応づけた情報を学習データとして生成し、生成した学習データを診断モデル学習装置6に送信する。
【0058】
図6A及び
図6Bは、画像毎発生原因登録部130が、前述した対話処理(質問の提示、回答の受け付け、対象画像に対応づける原因候補の指定の受け付け等)に際してユーザに提示する画面(以下、「質問提示/回答受付画面600」と称する。)の一例である。尚、
図6Aに示す画面は、最初の質問を提示する際に表示され、また、
図6Bに示す画面は、2回目以降の質問を提示する際に表示される。
【0059】
図6A及び
図6Bに示すように、例示する質問提示/回答受付画面600は、質問データの表示欄611、質問IDの表示欄612、質問数の表示欄613、質問提示/選択肢受付欄614、戻るボタン615、及び発生原因候補表示欄616を有する。
【0060】
このうち質問データの表示欄611には、現在選択中の質問データを示す情報(本例では質問データのファイル名としている。)が表示される。尚、管理者は、例えば、ユーザに提示する質問の抽出元とする質問データを予め学習データ生成装置100に設定しておく。
【0061】
質問IDの表示欄612には、現在表示中の質問の質問IDが表示される。
【0062】
質問数の表示欄613には、対象画像について現時点までにユーザに提示した質問の総数が表示される。同図の例では、分子に上記の総数を、分母に現在選択中の質問データに格納されている質問の総数を、夫々表示している。
【0063】
質問提示/選択肢受付欄614には、質問と当該質問の選択肢が表示される。ユーザは、表示されている選択肢の一つを指定する操作を行うことで、現在選択中の質問に対して回答することができる。同図に示すように、ユーザは提示された質問に対して「わからない」という選択をすることも可能である。このため、ユーザは、例えば、回答することができないか、もしくは回答することが難しい質問については「わからない」を選択することで、当該質問に対する回答をスキップして次の質問に進むことができる。
【0064】
図6Bに示すように、戻るボタン615は、2つめ以降の質問をユーザに提示する際に質問提示/回答受付画面600に表示される。ユーザは、戻るボタン615を操作することで一つ前の質問の画面に戻ることができる。
【0065】
同図に示す発生原因候補表示欄616には、発生原因毎該当確率算出部135が求めた一つ以上の原因候補が、発生原因候補提示部136により該当確率の降順に夫々の該当確率とともに表示される。同図に示すように、発生原因候補表示欄616には、表示している原因候補毎に凡例確認ボタン6161と登録ボタン6162が設けられている。
【0066】
このうち凡例確認ボタン6161をユーザが操作すると、凡例/投稿画像提示部134が、対応する原因候補の凡例として画像データ情報111に登録されている撮影画像(以下、「凡例/投稿画像」と称する。)や他のユーザが当該原因候補について登録した撮影画像(以下、「他ユーザ登録画像」と称する。)を表示する。
【0067】
図6Cに、ユーザが凡例確認ボタン6161を操作して凡例/投稿画像又は他ユーザ登録画像を表示させている様子を示す。同図に示すように、ユーザは、画像選択ボタン61611を操作して、凡例/投稿画像又は他ユーザ登録画像のいずれを表示させるかを切り換えることができる。
【0068】
ユーザが、登録ボタン6162を操作すると、画像毎発生原因登録部137は、ユーザが対応する原因候補を対象画像に写っているひび割れの原因候補として登録する画面(以下、「画像毎発生原因登録画面650」と称する。)を表示して対象画像に対する原因候補の登録を受け付ける。
【0069】
図6Dに、画像毎発生原因登録画面650の一例を示す。同図に示すように、例示する画像毎発生原因登録画面650は、発生原因候補の表示欄651、該当確率の表示欄652、対象画像の表示欄653、登録ボタン654、及びキャンセルボタン655を有する。
【0070】
このうち発生原因候補の表示欄651には、質問提示/回答受付画面600の発生原因候補表示欄616でユーザが操作した登録ボタン6162に対応する発生原因候補が表示される。該当確率の表示欄652には、当該発生原因候補の該当確率が表示される。括弧内の数字は、対象画像について一つ前までに提示した質問までの回答履歴に基づく該当確率である。ユーザは括弧内の数値を確認することで、現在提示されている質問に対して行った回答が該当確率に与える影響を確認することができる。対象画像の表示欄653には、対象画像が表示される。ユーザが登録ボタン654を操作すると、画像毎発生原因登録部137が、当該対象画像と当該発生原因候補を対応づけた情報を画像毎発生原因登録情報115に登録する。ユーザがキャンセルボタン655を操作すると質問提示/回答受付画面600にカーソルが戻る。
【0071】
図3に戻り、同図に示す支援情報提供部150は、対象画像に写っているひび割れの原因候補の特定や、記憶部110に管理されている情報の分析を支援するための情報を管理者に提供する。
【0072】
同図に示すように、支援情報提供部150は、登録者別撮影画像提示部151、発生原因別撮影画像提示部152、回答類似撮影画像提示部153、診断主体毎特定結果提示部154、及び回答傾向情報提示部155の各機能を有する。
【0073】
上記機能のうち登録者別撮影画像提示部151は、画像データ情報111の画像データの撮影画像を、夫々の登録者別に管理者に提示する。例えば、登録者別撮影画像提示部151は、あるユーザ又は管理者の指定(ユーザID又は管理者IDの指定)を受け付けると、受け付けたユーザID又は管理者IDに対応づけられている画像データを画像データ情報111から取得し、取得した画像データに基づく撮影画像の一覧を記載した画面(以下、「登録者別撮影画像提示画面710」と称する。)を管理者に提示する。
【0074】
図7Aに、登録者別撮影画像提示画面710の一例を示す。この例では、管理者がユーザIDが「△△社 □□様」のユーザを指定したため、登録者別撮影画像提示部151は、登録者別撮影画像提示画面710に当該ユーザが登録した撮影画像の一覧を表示している。
【0075】
図3に戻り、発生原因別撮影画像提示部152は、画像データ情報111の画像データの撮影画像を、登録されている発生原因別に管理者に提示する。発生原因別撮影画像提示部152は、例えば、管理者から発生原因の指定を受け付けると、受け付けた発生原因に対応づけられている撮影画像の画像データを画像データ情報111から取得し、取得した画像データに基づく撮影画像の一覧を記載した画面(以下、「発生原因別撮影画像提示画面720」と称する。)を管理者に提示する。
【0076】
図7Bに、発生原因別撮影画像提示画面720の一例を示す。この例では、管理者が発生原因「セメントの水和熱」を指定したため、発生原因別撮影画像提示部152は、発生原因別撮影画像提示画面720に当該発生原因が対応づけられている撮影画像の一覧を表示している。
【0077】
図3に戻り、回答類似撮影画像提示部153は、同じ質問群についてユーザから受け付けた回答の履歴が類似している撮影画像(画像データ)の組合せを画像毎回答結果情報114から取得し、取得した組合せを示す画面(以下、「回答類似撮影画像提示画面730」と称する。)を管理者に提示する。尚、上記の類似度は、例えば、回答(ユーザが選択した選択肢)が一致している質問の数とする。例えば、回答が一致する質問の数が多い程、類似度は高くなる値とし、回答類似撮影画像提示部153は、例えば、類似度が予め設定された閾値を超える組合せを画像毎回答結果情報114から取得して管理者に提示する。管理者は、提示された組合せから発生原因の異なる撮影画像の組合せを特定することができる。そのような組合せを特定した場合、例えば、管理者は、組合せの夫々の撮影画像に写っているひび割れの発生原因が正しく区別されるように質問を調整(新たな質問を追加する等)することを検討する。
【0078】
図7Cに、回答類似撮影画像提示画面730の一例を示す。この例では、回答類似撮影画像提示部153は、回答類似撮影画像提示画面730に、回答の履歴が類似している撮影画像として「撮影画像A」及び「撮影画像B」の画像とともに各撮影画像の回答結果(回答の履歴)を表示している。
【0079】
図3に戻り、診断主体毎特定結果提示部154は、診断主体(ユーザ、診断モデル31、及び管理者(技術部門の担当者等))の夫々が同じ撮影画像について特定した発生原因を比較可能な状態で記載した画面(以下、「診断主体毎診断結果提示画面740」と称する。)を管理者に提示する。尚、診断主体毎特定結果提示部154は、例えば、診断装置3に撮影画像の画像データを送信し、診断装置3が受信した画像データを既存の診断モデル31に入力することにより出力される発生原因を診断モデル31により特定された発生原因として取得する。また、診断主体毎特定結果提示部154は、例えば、管理者により特定された発生原因を管理装置4から取得する。
【0080】
このように、診断主体毎特定結果提示部154は、同じ撮影画像についての診断主体毎の診断結果(発生原因)を比較可能な状態で管理者(例えば、技術部門の担当者)に提示する。このため、例えば、管理者は、ユーザが診断を誤りやすい撮影画像を特定することができる。そのような撮影画像を特定した場合、管理者は、例えば、当該撮影画像についてユーザが正しく発生原因を診断できるような質問を追加することを検討する。
【0081】
図7Dに、診断主体毎診断結果提示画面740の一例を示す。この例では、診断主体毎特定結果提示部154は、診断主体毎診断結果提示画面740に、撮影画像とともに、診断主体(ユーザ、診断モデル31、及び管理者(技術部門の担当者等))の夫々が同じ撮影画像について診断した発生原因を比較可能な状態で表示している。
【0082】
図3に戻り、回答傾向情報提示部156は、画像毎回答結果情報114に基づく、質問データの質問毎のユーザの回答の傾向を示す情報(以下、「回答傾向情報」と称する。)を記載した画面(以下、「回答傾向情報提示画面750」と称する。)生成し、生成した情報を管理者に提示する。管理者は、回答傾向情報に基づき、例えば、多くのユーザが「わからない」を選択している質問、即ち、回答しにくい可能性の高い質問を特定し、そのような質問について改善を検討する。
【0083】
図7Eに、回答傾向情報提示画面750の一例を示す。この例では、回答傾向情報提示部156は、回答傾向情報提示画面750に、「1012質問表.csv」というファイル名の質問データの質問について、ユーザに提示された回数やユーザが「わからない」と回答した回数を示す情報を表示している。
【0084】
図3に戻り、同図に示す情報管理部160は、管理者が、記憶部110が記憶している各種情報を管理するための環境を提供する。同図に示すように、情報管理部160は、質問データ管理部161、選択肢毎重み管理情報管理部162、及びユーザ/管理者情報管理部163を有する。
【0085】
このうち質問データ管理部161は、質問データ情報112に管理される質問データの編集環境(質問データの登録、編集、削除、検索等)を管理装置4を介して管理者に提供する。尚、診断システム1は、コンクリートのひび割れ以外の事象の発生原因の特定にも適用することが可能であり、質問データ管理部161は、事象毎に質問データを管理する環境を管理者に提供する。また、質問データ管理部161は、同じ事象について複数の質問データ(例えば、版(バージョン)の異なる複数の質問データ112)を管理するための環境を提供する。
【0086】
図8Aに、質問データ管理部161が、質問データを編集するための画面(以下、「質問データ管理画面810」と称する。)を表示している様子を示す。同図に示すように、例示する質問データ管理画面810には、質問データが一覧表示されている。また、質問データ管理画面810には、質問データを指定して当該質問データの内容を編集する画面を表示させる編集ボタン811、質問データの夫々の有効/無効を指定する有効/無効ボタン812、及び質問データの夫々の削除を指示する削除ボタン813が設けられている。
【0087】
図3に戻り、選択肢毎重み管理情報管理部162は、選択肢毎重み管理情報113の編集環境(選択肢毎重み管理情報113の登録、編集、削除、検索等)を管理装置4を介して管理者に提供する。選択肢毎重み管理情報113は、例えば、表計算ソフトウェアが取り扱い可能な表形式データとして管理され、その場合、選択肢毎重み管理情報管理部162は、表形式データの編集環境を管理者に提供する。
【0088】
また、選択肢毎重み管理情報管理部162は、選択肢毎重み管理情報113に基づき、発生原因毎の選択肢の重みの類似度(選択肢毎重み管理情報113の各列の類似度)を提示する機能を有する。上記類似度が高い発生原因の組合せは、現状の質問では必ずしも区別しきれないことを意味する。管理者は、類似度の高い発生原因の組合せが存在することを確認した場合、両者が区別できるような質問を追加することを検討する。
【0089】
尚、質問データ管理部161や選択肢毎重み管理情報管理部162は、例えば、表計算ソフトウェアを用いて編集された質問データ1120や選択肢毎重み管理情報113のアップロードを受け付ける機能を有する。
【0090】
図8Bに、質問データ管理部161や選択肢毎重み管理情報管理部162が、表計算ソフトウェア等を用いて編集された質問データ1120や選択肢毎重み管理情報113のアップロードを受け付ける画面(以下、「質問/選択肢アップロード画面820」と称する。)を表示している様子を示す。
【0091】
図3に戻り、ユーザ/管理者情報管理部163は、管理装置4を介して、ユーザ/管理者情報117を編集(登録、編集、削除、検索等)する環境を管理者に提供する。
【0092】
図8Cに、ユーザ/管理者情報管理部163が、ユーザ/管理者情報117を管理する際に提示する画面(以下、「ユーザ/管理者情報管理画面830」と称する。)の一例を示す。
【0093】
<質問提示/回答受付処理>
図9は、
図6A及び
図6Bに示す画面の表示や遷移に際して画像毎発生原因登録部130が行う処理(以下、「質問提示/回答受付処理S900」と称する。)を説明するフローチャートである。以下、同図とともに質問提示/回答受付処理S900について説明する。尚、質問提示/回答受付処理S900の開始時点において、選択肢毎重み管理情報113には、予め発生原因候補毎の該当確率の初期値が設定されているものとする。上記の初期値は、例えば、管理者が管理装置4を介して予め画像毎回答結果情報114に格納しておく。尚、例えば、管理者が、過去に発生したひび割れの発生原因の統計的な情報(確率分布等)に基づき上記の初期値を設定しておくことで、対象画像についての発生原因の効率的かつ正確な特定に繋がる良質の質問が提示されるようになることが期待できる。
【0094】
同図に示すように、まず、発生原因毎該当確率算出部135が、選択肢毎重み管理情報113と、対象画像について質問の提示を開始してから現時点までに提示した各質問に対するユーザの回答(選択肢の選択)の履歴とに基づき、当該対象画像についての発生原因候補の夫々の該当確率をベイズの定理により事後確率として求める(S911)。
【0095】
続いて、質問選択部133が、質問データの現時点までに未選択の各質問について、ユーザから回答を受け付けることにより得られる情報量の期待値である平均情報量(情報エントロピー(シャノンエントロピー))を求める(S912)。
【0096】
続いて、質問選択部133は、求めた情報量の期待値が最小の質問(平均情報量が最小の質問)を次の質問として選択する(S913)。
【0097】
続いて、質問提示部131が、選択した質問の選択肢を選択肢毎重み管理情報113から取得し、選択した質問と取得した選択肢とをユーザに提示する(S914)。
【0098】
尚、以上の処理は、対象画像の発生原因候補が画像毎発生原因登録情報115に登録されるまで、即ち、
図6Cに示した質問提示/回答受付画面600の発生原因候補表示欄616の登録ボタン6162を操作して対象画像に対する原因候補の登録を行うまで繰り返し行われる(S915)。
【0099】
【0100】
図10Aは、以下の説明で用いる、発生原因候補の夫々の該当確率を求めるための初期値、質問データ、及び選択肢毎の重み(選択肢毎重み管理情報113の内容の一部)の一例である。
【0101】
図10Bは、
図10Aに示した発生原因候補の夫々の該当確率を求めるための初期値に基づき、発生原因候補毎の該当確率の初期値(発生原因候補の夫々の該当確率(発生原因候補の確率分布)を求めた結果である。この例では、発生原因候補毎の該当確率を、
図10Aの該当確率を求めるための初期値の総和を分母とし、同図の発生原因候補の夫々の該当確率を求めるための初期値を分子として求めた値としている。
【0102】
図10Cは、各選択肢の発生原因候補毎の重みを調整(「0」除算を防ぐための調整)した後の値である。
【0103】
図10Dは、
図10Bの発生原因候補の夫々の該当確率の初期値と、
図10Cの各選択肢の発生原因候補毎の重みの調整後の値とに基づき、各質問の選択肢の夫々が選択された場合における発生原因候補の夫々の該当確率をベイズの定理により事後確率として求めた結果である(
図9のS911の処理に相当)。
【0104】
図10Eは、選択肢の夫々が選択された場合における発生原因候補の夫々の該当確率に基づき、各選択肢が選択された場合の情報量の期待値である平均情報量(情報エントロピー(シャノンエントロピー))を求めた結果を示す図である(
図9のS912の処理に相当)。
【0105】
図10Fは、
図10Dに基づき、各質問について回答が得られた場合の平均情報量の最小値と平均値を求めた結果である(
図9のS913の処理に相当)。
【0106】
図10Gは、
図10Fに基づき、情報量の期待値が最小(平均情報量の最小値が最小、又は平均情報量の平均値が最小)の質問を次の質問(現時点では最初に提示する質問)として選択した結果を示す図である(
図9のS913の処理に相当)。本例では、
図10Fにおいて平均情報量が最小の質問IDが「1」の質問を選択している。尚、平均情報量の最小値が同値である場合は、例えば、それらの中から回答難易度が最小の質問を選択する。また、回答難易度も同値である場合は、例えば、それらの中からランダムに質問を選択する。
【0107】
図10Hは、
図10Gの選択された質問に対してユーザが選択した選択肢を示している。本例では、ユーザは、提示された質問IDが「1」の質問に対して選択肢IDが「2」の選択肢を選択している。
【0108】
図10Iは、
図10Gで選択した質問に対してユーザが選択肢を選択した後の発生原因候補毎の該当確率(本例では
図10Dの選択肢IDが「2」の選択肢の該当確率)を示す図である(
図9のS911の処理に相当)。
【0109】
図10Jは、調整後の各選択肢の発生原因候補毎の重み(
図10Cの再掲)を示す図である
【0110】
図10Kは、
図10Iの発生原因候補の夫々の該当確率の値と
図10Jの各選択肢の発生原因候補毎の重みの調整後の値とに基づき、未選択の各質問(「わからない」が選択された質問を含む。本例では質問IDが「1」の質問以外の各質問)について、各質問の各選択肢が選択された場合における発生原因候補の夫々の該当確率をベイズの定理により事後確率として求めた結果を示す図である(
図9のS911の処理に相当)。
【0111】
図10Lは、
図10Kの質問の夫々の選択肢の夫々が選択された場合における発生原因候補の夫々の該当確率に基づき、各選択肢が選択された場合の情報量の期待値である平均情報量を求めた結果を示す図である(
図9のS912の処理に相当)。
【0112】
図10Mは、
図10Lに基づき、各質問について回答が得られた場合の平均情報量の最小値と平均値を算出した結果を示す図である(
図9のS913の処理に相当)。
【0113】
図10Nは、
図10Mに基づき、情報量の期待値が最小(平均情報量の最小値が最小、又は平均情報量の平均値が最小)の質問を次の質問として選択した結果を示す図である(
図9のS913の処理に相当)。本例では、
図10Mにおいて平均情報量が最小の質問IDが「6」の質問を選択している。尚、平均情報量の最小値が同値の場合は、例えば、それらの中から回答難易度が最小の質問を選択する。また、回答難易度も同値の場合は、例えば、それらの中からランダムに質問を選択する。
【0114】
図10Oは、
図10Nの選択された質問に対してユーザが選択した選択肢を示している。本例では、ユーザは、提示された質問IDが「6」の質問に対して選択肢IDが「19」の選択肢を選択している。
【0115】
以下、
図10H~
図10Mと同様の処理が、ユーザが登録ボタン6162を操作して対象画像に対する原因候補の登録を行うまで繰り返し行われる。
【0116】
以上詳細に説明したように、本実施形態の診断システム1によれば、ユーザは、学習データ生成装置100が順次提示する質問に回答していくことにより、学習データの生成に用いる対象画像についてラベルとして用いる情報である発生原因を精度よく特定することができる。このため、ユーザは、ひび割れ等の事象の発生原因を特定する機械学習モデルの学習に用いる学習データを効率よく生成することができる。また、質の良い学習データを効率よく生成することができることで、診断モデル31の性能を高めることができる。
【0117】
また、本実施形態の学習データ生成装置100は、事象の発生原因の夫々の現時点における該当確率と選択肢の夫々の重みとに基づき、選択肢の夫々が選択された場合における発生原因の候補の夫々の該当確率をベイズの定理により事後確率として求め、発生原因の候補を夫々の該当確率が大きいものを優先して提示するので、機械学習モデルの学習データを生成する際に行われる、撮影画像に写っている事象の発生原因を特定する作業を支援することができる。
【0118】
また、学習データ生成装置100は、未選択の質問について、夫々を選択してユーザから回答を受け付けることにより得られる情報量の期待値が最小の質問を次に提示する質問として選択するので、撮影画像に写っている発生原因を効率よく特定するために有効な質問を優先してユーザに提示することができる。
【0119】
また、管理者は、選択肢毎重み管理情報113における各選択肢の重みを経験や知識に基づき適切に調節することで、撮影画像(画像データ)に対応づけるラベルとして適切な発生原因を優先的にユーザに提示することができ、機械学習モデルの性能向上に有効に作用する学習データを効率よく生成することができる。
【0120】
また、学習データ生成装置100は、同じ質問に対してユーザが選択した選択肢の傾向が類似する撮影画像の組合せを示す情報を提示するので、管理者は、現状の質問データの質問では発生原因が異なる事象が写っている撮影画像を必ずしも区別できない場合があることを認識することができ、質問の調整(質問の追加等)を管理者に促すことができる。
【0121】
また、学習データ生成装置100は、ユーザから受け付けた発生原因と他の主体(例えば、事象の発生原因の特定に熟練した者)により特定された発生原因とを比較可能な状態で提示するので、例えば、管理者は、ユーザが事象の発生原因の特定を誤りやすい撮影画像を認識することができる。また、提示された情報はユーザの教育等に役立てることができる。
【0122】
また、学習データ生成装置100は、例えば、「わからない」が選択された回数等、選択肢の夫々が選択された回数を示す情報を提示するので、例えば、管理者に質問の調整(「わからない」が選択されにくい質問の追加等)を行う契機を与えることができる。
【0123】
また、学習データ生成装置100は、指定されたユーザに対応づけられている撮影画像の一覧を提示するので、例えば、管理者は、ユーザの夫々がどのような撮影画像(画像データ)を登録しているかを容易に把握することができる。
【0124】
また、学習データ生成装置100は、指定された発生原因に対応づけられている撮影画像を提示するので、例えば、管理者は、発生原因と撮影画像(画像データ)との関係を容易に把握することができ、事象の発生原因の特定に役立てることができる。
【0125】
また、学習データ生成装置100は、選択肢毎重み管理情報113を、例えば、表計算ソフトウェアが取り扱い可能な表形式のデータとして管理するので、管理者は、選択肢毎重み管理情報113を容易に取り扱うことができる。尚、例えば、選択肢毎重み管理情報113を、例えば、決定木等の木構造の情報として管理した場合には、「わからない」という選択肢が選択された場合に先の質問に進むことができなくなってしまうが、このように選択肢を表形式のデータとして管理することで、「わからない」という選択肢が選択された場合でも次の質問に進む(次の質問を選択)ことができるように容易にアルゴリズムを作成することができる。
【0126】
また、本実施形態の診断システム1によれば、質問データ情報112や選択肢毎重み管理情報113を適切に編集することで、診断モデル31の性能の向上に有効に作用する学習データが効率よく生成されるように調整(チューニング)することができる。
【0127】
また、本実施形態の診断システム1によれば、発生原因を特定しようとする事象の種類に応じた質問データ情報112や選択肢毎重み管理情報113を用意することで、コンクリート構造物のひび割れの発生原因以外の様々についての事象の発生原因の特定にも容易に拡張適用(転用)することができる。
【0128】
<情報処理装置の例>
図5は、診断システム1を構成する各装置(診断装置3、学習データ生成装置100、診断モデル学習装置6、ユーザ装置2、管理装置4)の実現に用いる情報処理装置(コンピュータ)のハードウェア構成の一例である。例示する情報処理装置10は、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15、及び通信装置16を備える。情報処理装置10の具体例として、例えば、パーソナルコンピュータ、タブレット、スマートフォン、オフィスコンピュータ、各種サーバ装置、汎用機等がある。情報処理装置10は、その全部又は一部が、例えば、クラウドシステムによって提供される仮想サーバのように、仮想化技術を用いて提供される仮想的な情報処理資源を用いて実現されるものであってもよい。各装置は、通信可能に接続された複数の情報処理装置10を用いて実現してもよい。
【0129】
同図において、プロセッサ11は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)、AI(Artificial Intelligence)チップ等を用いて構成されている。
【0130】
主記憶装置12は、プログラムやデータを記憶する装置であり、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。
【0131】
補助記憶装置13は、例えば、SSD(Solid State Drive)、ハードディスクドライブ、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、クラウドサーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介してプログラムやデータを読み込むことができる。補助記憶装置13に格納(記憶)されているプログラムやデータは主記憶装置12に随時読み込まれる。
【0132】
入力装置14は、外部からの入力を受け付けるインタフェースであり、例えば、キーボード、マウス、タッチパネル、カードリーダ、ペン入力方式のタブレット、音声入力装置等である。
【0133】
出力装置15は、処理経過や処理結果等の各種情報を出力するインタフェースである。出力装置15は、例えば、上記の各種情報を可視化する表示装置(LCD(Liquid Crystal Display)、グラフィックカード等)、上記の各種情報を音声化する装置(音声出力装置(スピーカ等))、上記の各種情報を文字化する装置(印字装置等)である。尚、例えば、情報処理装置10が通信装置16を介して他の装置との間で情報の入力や出力を行う構成としてもよい。
【0134】
入力装置14及び出力装置15は、ユーザとの間で情報の受け付けや情報の提示を行うユーザインタフェースを構成する。
【0135】
通信装置16は、通信ネットワーク5等の通信基盤を介した他の装置との間での通信(有線通信又は無線通信)を実現する装置であり、例えば、NIC(Network Interface Card)、無線通信モジュール、USBモジュール等を用いて構成される。
【0136】
情報処理装置10には、例えば、オペレーティングシステム、ファイルシステム、DBMS(DataBase Management System)(リレーショナルデータベース、NoSQL等)、KVS(Key-Value Store)等が導入されていてもよい。
【0137】
診断システム1を構成する各装置が備える機能は、情報処理装置10のプロセッサ11が、主記憶装置12に格納されているプログラムを読み出して実行することにより、もしくは、診断システム1を構成する情報処理装置のハードウェア(FPGA、ASIC、AIチップ等)自体の機能によって実現される。各装置は、各種の情報(データ)を、例えば、データベースのテーブルやファイルシステムが管理するファイルとして記憶する。
【0138】
以上、実施形態について説明したが、本発明は上記の実施形態に限定されるものではなく、様々な変形例が含まれ、必ずしも説明した全ての構成を備えるものに限定されるものではない。
【符号の説明】
【0139】
1 診断システム
2 ユーザ装置
3 診断装置
4 管理装置
5 通信ネットワーク
6 診断モデル学習装置
100 学習データ生成装置
110 記憶部
111 画像データ情報
112 質問データ情報
113 選択肢毎重み管理情報
114 画像毎回答結果情報
115 画像毎発生原因登録情報
116 学習データ情報
117 ユーザ/管理者情報
125 画像登録受付管理部
130 画像毎発生原因登録部
131 質問提示部
132 回答受付部
133 質問選択部
134 凡例/投稿画像提示部
135 発生原因毎該当確率算出部
136 発生原因候補提示部
137 画像毎発生原因登録部
140 学習データ生成送信部
150 支援情報提供部
151 登録者別撮影画像提示部
152 発生原因別撮影画像提示部
153 回答類似撮影画像提示部
154 診断主体毎特定結果提示部
155 回答傾向情報提示部
160 情報管理部
161 質問データ管理部
162 選択肢毎重み管理情報管理部
163 ユーザ/管理者情報管理部