(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-25
(45)【発行日】2025-01-09
(54)【発明の名称】学習装置、学習方法および判定装置
(51)【国際特許分類】
G06T 7/00 20170101AFI20241226BHJP
G06Q 50/08 20120101ALI20241226BHJP
E02F 9/20 20060101ALI20241226BHJP
E02F 9/26 20060101ALI20241226BHJP
【FI】
G06T7/00 350B
G06Q50/08
E02F9/20 Q
E02F9/26 A
(21)【出願番号】P 2020172207
(22)【出願日】2020-10-12
【審査請求日】2023-07-21
【新規性喪失の例外の表示】特許法第30条第2項適用 (1)2019年12月1日に大成建設株式会社技術センターから発行された「大成建設技術センター報2019年 第52号」において発表 (2)2020年2月3日に大成建設株式会社のウェブサイトにおいて発表
(73)【特許権者】
【識別番号】000206211
【氏名又は名称】大成建設株式会社
(73)【特許権者】
【識別番号】517120013
【氏名又は名称】パナソニックアドバンストテクノロジー株式会社
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】青木 浩章
(72)【発明者】
【氏名】田村 創
(72)【発明者】
【氏名】大橋 智仁
【審査官】秦野 孝一郎
(56)【参考文献】
【文献】特開2020-095415(JP,A)
【文献】特開2019-185121(JP,A)
【文献】特開2020-149504(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06Q 50/00-50/20
E02F 9/00-9/18
E02F 9/20-9/22
E02F 9/24-9/28
(57)【特許請求の範囲】
【請求項1】
作業員の有無が示されると共に
、姿勢に関する属性および建設現場に関連する属性が少なくとも付与された画像データを記憶する記憶部と、
少なくとも一つの前記属性について、当該属性に関する項目の構成比率または数量の指定を受け付け、指定された構成比率または数量に応じた画像データ群を前記記憶部から取得する学習データ取得部と、
学習器を有しており、画像データを入力することで作業員の有無を出力するように前記画像データ群によって前記学習器を機械学習させる学習処理部と、を備え、
建設現場に関連する前記属性は、建設工事に関する工事属性および作業員の装着物に関する装着物属性の何れかである、
ことを特徴とする学習装置。
【請求項2】
前記工事属性は、建設工事の工種、建設工事の工程、作業内容および工事現場の明るさの程度のうちの何れか一つを含み、
前記装着物属性は、装着物の種類、有無、形状および色のうちの何れか一つを含む、
ことを特徴とする請求項1に記載の学習装置。
【請求項3】
作業員の有無が示されると共に
、姿勢に関する属性および建設現場に関連する属性が少なくとも付与された画像データを用いて機械学習する学習方法であって、
少なくとも一つの前記属性について、当該属性に関する項目の構成比率または数量の指定を受け付け、指定された構成比率または数量に応じた画像データ群を取得する学習データ取得工程と、
画像データを学習器に入力することで作業員の有無を出力するように前記画像データ群によって前記学習器を機械学習させる学習処理工程と、を有し、
建設現場に関連する前記属性は、建設工事に関する工事属性および作業員の装着物に関する装着物属性の何れかである、
ことを特徴とする学習方法。
【請求項4】
請求項3に記載の学習方法によって学習した学習済みの学習器を備え、画像データを前記学習済みの学習器に入力することによって作業員の有無を出力する、
ことを特徴とする判定装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習方法および判定装置に関する。
【背景技術】
【0002】
建設工事の安全性を確保するために、従来から様々な技術が開発されている。例えば、赤外線センサ等によって作業員を検知し、検知した作業員に対して危険を知らせるシステムが存在する。しかし、赤外線センサ等のセンサ類は、人でもモノでも検知してしまうことが弱点であり、実際の建設現場で活用しようとすると反応し過ぎてしまう(つまり、人だけを検知したいのにモノも検知してしまう)という問題がある。なお、モノを検知し難くするためにセンサが検知する範囲を狭くすることもできるが、狭くした分だけ人を検知する範囲も狭くなってしまう。
【0003】
また、シールド工事で使用する軌道動力車(「バッテリーロコ」とも呼ばれる)において、軌道上の人を検知するためのシステムが存在している。軌道上においては人もモノも両方を検知したいので、赤外線センサを用いても前述した問題は発生しないが、曲線部やレール分岐部においては赤外線センサのレーザの方向が一時的に軌道の外を照射することになり、軌道外にあるモノに反応してしまうという問題がある。軌道外にあるモノは、例えば安全通路の手すりや壁などであり、この問題は狭小な断面の坑内で発生しやすい。なお、この誤検知を防止するために、曲線部やレール分岐部手前にRFID等のタグを設置して、タグに反応した場合に軌道動力車を減速すると共に照射距離を一時的に小さくするといった制御が実施されてもいる。しかし、タグの設置・維持管理に多くの手間がかかるのであまり歓迎されていない。
【0004】
また、検知される側の人にRFID(Radio Frequency IDentification)等を持たせて機械側との距離が近くなったことを検知して通知するシステムが存在する(例えば、特許文献1参照)。しかし、検知される側の人全員にRFIDを所持させて維持管理する手間が発生するため、これも歓迎されているシステムではない。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
ここまで述べたように、赤外線センサやRFID等を用いた従来のシステムは、誤検知が多かったり、維持管理が大変だったりと建設現場の要望に応えるものではなかった。その為、従来よりも利便性の高い人体検知システムの開発が望まれていた。
【0007】
このような観点から、本発明は、画像認識技術を用いて建設現場の作業員を検知するものであり、従来よりも利便性の高い人体検知システムを構築できる学習装置、学習方法および判定装置を提供する。
【課題を解決するための手段】
【0008】
昨今の人工知能技術の発展により、カメラ画像を解析して人やモノをリアルタイムに判別するシステムが開発されている。先行例としては自動車の人体検知システムや、監視カメラにおける人体検知システムがある。このシステムによれば、例えばカメラ画像を解析して人やモノをバウンディングボックスで囲うことができる。しかしながら、建設現場における人体の検知では、ヘルメットや反射帯などの保護具を身に着けると共に機械・工具などを手にして作業を行っている者も検知の対象となり、単純な人体検知とは異なる。つまり、建設現場の人を判別するには、汎用的な人体検知システムでは十分ではなく、実際の建設現場のデータを分析して構築したシステムである方が、建設現場の人を検知できる可能性が高くなる。
【0009】
本発明の発明者は、実際の建設現場の撮像を行い、撮像した建設現場の画像を用いて建設現場の「人」を定義すると共に人工知能技術を用いて定義した「人」を機械学習させる試みを行ってきた。その中で、学習させる素材となる「人」の定義を行うときに、画像全部を大量に学習させるのではなく写った人のみを確実に切り取って学習させることに加えて、建設現場に関連する「属性」を付加させることが重要であるという考えに至った。つまり、バウンディングボックスを付与しただけのデータでは、評価プロセスにおいてどのような特徴の人物に検知が強いかまたは弱いかがわからない。その為、検知精度(再現率)を向上させるには、人物の特徴となる属性を付与しておき、その属性に対する分析をすることが重要である。
【0010】
自動車や監視カメラで使用される属性(「特記情報」とも呼ばれる)は、例えば姿勢、年齢、性別、帽子の種類・・・などであるが、発明者は、建設工事に関する「工事属性」、作業員の装着物に関する「装着物属性」が建設現場向けの新しい属性になり、これらの情報を可視化して機械学習を行うことが建設現場における人の検知精度(再現率)の向上に有効であると考えた。工事属性は、例えば建設工事の工種、建設工事の工程、作業内容および工事現場の明るさの程度などである。装着物属性は、装着物の種類、有無、形状および色などである。
【0011】
図1を参照して、装着物属性を用いた分析例を説明する。
図1は、ある建設現場において人体検知を行ったときの結果および装着物属性を用いた分析例を示す図であり、(a)は姿勢属性ごとの再現率(検知精度)を示し、(b)は学習用の画像データの姿勢属性に関する項目(立位状態、かがみ状態、座位状態)の構成比率を示し、(c)は学習用の画像データの装着物属性(ヘルメットの色)に関する項目(白系、青系、黄系、その他)の構成比率を示す。
【0012】
図1(a)に示すように、立位状態の人物の人体検知に比べてかがみ状態および座位状態の人物の人体検知の再現率が低く、姿勢属性ごとに再現率の強弱があることが分かる。また、
図1(b)に示すように、姿勢属性ごとのデータ量を分析すると、再現率が高い順にデータ量も多いことが分かる。その為、立位状態以外の姿勢の精度を向上させるにはこれらの状態のデータを増やす必要があるが、単純に学習データ数だけを増やせば良いのではなく、学習データを様々な属性によって可視化し、特定の属性の学習データを十分な量にすることが必要になる。つまり、再現率に姿勢だけが影響しているとは限らないので、他の属性(特に、建設現場に関連する属性)などと複合的に判断することが重要である。この場合だと、座位の再現率が低いのでこの状態の学習データを増加した方が良いが、
図1(c)に示すように、ヘルメットの色が白以外の学習データが少ないので、増加させるべき学習データは例えば「座位・ヘルメット色青」、「座位・ヘルメット色黄」などになる。
【0013】
本発明に係る学習装置は、記憶部と、学習データ取得部と、学習処理部とを備える。
前記記憶部は、作業員の有無が示されると共に、姿勢に関する属性および建設現場に関連する属性が少なくとも付与された画像データを記憶する。
前記学習データ取得部は、少なくとも一つの前記属性について、当該属性に関する項目の構成比率または数量の指定を受け付け、指定された構成比率または数量に応じた画像データ群を前記記憶部から取得する。
前記学習処理部は、学習器を有しており、画像データを入力することで作業員の有無を出力するように前記画像データ群によって前記学習器を機械学習させる。
建設現場に関連する前記属性は、建設工事に関する工事属性および作業員の装着物に関する装着物属性の何れかである。
【0014】
前記工事属性は、建設工事の工種、建設工事の工程、作業内容および工事現場の明るさの程度のうちの何れか一つを含むのがよい。また、前記装着物属性は、装着物の種類、有無、形状および色のうちの何れか一つを含むのがよい。
【0015】
本発明に係る学習装置においては、学習データに工事属性または装着物属性が付与されているので、学習データ群の属性に関する項目の構成比率を可視化して適切に調整することができる。その為、構成比率を変更後の学習データ群を用いて学習を行った学習器は、建設現場における作業員を検知する精度(再現率)が高い。したがって、建設現場を撮影するカメラ以外にセンサ類を基本的に使用しなくてよく、従来よりも利便性の高い人体検知システムを構築できる。
【0016】
本発明に係る学習方法は、作業員の有無が示されると共に、姿勢に関する属性および建設現場に関連する属性が少なくとも付与された画像データを用いて機械学習する学習方法である。この学習方法は、学習データ取得工程と、学習処理工程とを有する。
前記学習データ取得工程では、少なくとも一つの前記属性について、当該属性に関する項目の構成比率または数量の指定を受け付け、指定された構成比率または数量に応じた画像データ群を取得する。
前記学習処理工程では、画像データを学習器に入力することで作業員の有無を出力するように前記画像データ群によって前記学習器を機械学習させる。
建設現場に関連する前記属性は、建設工事に関する工事属性および作業員の装着物に関する装着物属性の何れかである。
【0017】
本発明に係る学習方法においては、学習データに工事属性または装着物属性が付与されているので、学習データ群の属性に関する項目の構成比率を可視化して適切に調整することができる。その為、構成比率を変更後の学習データ群を用いて学習を行った学習器は、建設現場における作業員を検知する精度(再現率)が高い。したがって、建設現場を撮影するカメラ以外にセンサ類を基本的に使用しなくてよく、従来よりも利便性の高い人体検知システムを構築できる。
【0018】
本発明に係る判定装置は、上記記載の学習方法によって学習した学習済みの学習器を備え、画像データを前記学習済みの学習器に入力することによって作業員の有無を出力するものである。
【0019】
本発明に係る判定装置を用いることにより、建設現場を撮影するカメラ以外にセンサ類を基本的に使用しなくてよく、従来よりも利便性の高い人体検知システムを構築できる。
【発明の効果】
【0020】
本発明によれば、従来よりも利便性の高い人体検知システムを構築できる。
【図面の簡単な説明】
【0021】
【
図1】ある建設現場において人体検知を行ったときの結果および装着物属性を用いた分析例を示す図であり、(a)は姿勢属性ごとの再現率(検知精度)を示し、(b)は学習用の画像データの姿勢属性に関する項目(立位状態、かがみ状態、座位状態)の構成比率を示し、(c)は学習用の画像データの装着物属性(ヘルメットの色)に関する項目(白系、青系、黄系、その他)の構成比率を示す。
【
図2】本発明の実施形態に係る学習装置および判定装置の機能構成図である。
【
図3】本発明の実施形態に係る学習方法を説明するための図である。
【
図4】学習の精度(再現率)の例示であり、(a)は学習データ群の構成比率を変更する前の精度(再現率)であり、(b)は学習データ群の構成比率を変更した後の精度(再現率)である。
【
図5】学習データ群の構成比率の例示であり、(a)は変更前の構成比率であり、(b)は変更後の構成比率である。
【
図6】作業員の検知を行っている実際の建設現場で撮影した画像を含めた学習を説明するための図である。
【
図7】本発明の実施形態に係る判定装置を備えた作業員検知システムの構成図である。
【発明を実施するための形態】
【0022】
以下、本発明の実施をするための形態を、適宜図面を参照しながら詳細に説明する。各図は、本発明を十分に理解できる程度に、概略的に示してあるに過ぎない。よって、本発明は、図示例のみに限定されるものではない。なお、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。
【0023】
<実施形態に係る学習装置および判定装置の構成について>
図2を参照して、実施形態に係る学習装置10および判定装置20について説明する。
図2は、実施形態に係る学習装置10および判定装置20の機能構成図である。なお、学習装置10および判定装置20を一つの装置として構成することもできる。
【0024】
(学習装置の構成)
学習装置10は、画像に作業員が写っているか否かを学習する装置である。学習装置10は、画像データベース11と、学習データ取得部12と、学習処理部13とを備える。画像データベース11は、記憶部に記憶されている。記憶部は、例えばRAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等の記憶媒体から構成される。学習データ取得部12および学習処理部13は、CPU(Central Processing Unit)によるプログラム実行処理や、専用回路等により実現される。これらの機能がプログラム実行処理により実現する場合、記憶部には、当該機能を実現するためのプログラムが格納される。
【0025】
画像データベース11には、例えば建設現場で撮像した多数の画像データが格納されている。画像データベース11に格納される画像データには、作業員の有無が示されると共に一つ以上の属性が付与されている。画像データベース11に格納される画像データは、例えばバウンディングボックス(BBoX)によって作業員が写る部分(領域)を囲うことによって作業員の有無が示されている。属性は、例えば建設工事に関する工事属性、作業員の装着物に関する装着物属性などである。工事属性は、例えば建設工事の工種、建設工事の工程、作業内容および工事現場の明るさの程度などである。装着物属性は、装着物の種類、有無、形状および色などである。なお、工事属性および装着物属性以外の属性が画像データに付与されていてもよい。工事属性および装着物属性以外の属性は、例えば作業員の姿勢、年齢、性別などである。
【0026】
学習データ取得部12は、ユーザから属性に関する項目の構成比率または数量の指定を受け付け、指定された構成比率または数量に応じた画像データのまとまり(「画像データ群」と呼ぶ)を取得する。学習データ取得部12は、例えば図示しない表示部に属性を指定する画面(属性指定画面)を表示し、ユーザから属性に関するこれらの指定を受け付ける。詳細は後記する。
【0027】
学習処理部13は、学習器を有しており、学習データ取得部12で取得した画像データ群を用いて学習器を機械学習させる。学習器は、機械学習における学習システムであり、与えられたデータを基に分類・予測・判定した結果と正答となる実際の結果とを比較し、各種パラメータを調整することで良い結果を導くことが可能になる。学習器は、例えばニューラルネットワークであり、本実施形態でもニューラルネットワークを想定して説明する。なお、学習器は、「学習モデル」などとも呼ばれる。
【0028】
ニューラルネットワークは、周知のように人間の脳の動きをコンピュータに模倣させる目的で生まれた情報処理手法である。ニューラルネットワークは、複雑な非線形処理を得意とし、学習機能を用いることで説明変数と目的変数の関係を定式化する必要がないという特徴を持つ。ニューラルネットワークは、一般的に入力層、中間層、出力層で構成される。入力層には説明変数が入力され、出力層からは目的変数が出力される。中間層は、両者を関係づける役割を担っている。中間層の層数および各中間層のニューロン数には制約が無く、任意に設定することができる。
【0029】
学習器を学習させる方法は特に限定されず、例えば誤差逆伝播法によって学習器を学習させる。具体的には、学習データである画像データの各画素値が入力層に入力され、出力層から出力される結果と学習データに付与された作業員の有無の情報との誤差に基づいて中間層を調整する。つまり、学習処理部13は、画像データを入力することで作業員の有無を出力するように画像データ群によって学習器を機械学習させる。学習させる学習データの数は特に限定されず、例えば期待する精度(再現率)に到達することで学習を終了する。なお、学習を行った結果として想定される精度(再現率)が得られない場合には、属性に関する項目の構成比率または数量の指定を変更し、再学習および再評価を繰り返し実行するのがよい。
【0030】
(判定装置の構成)
判定装置20は、画像に作業員が写っているか否かを判定する装置である。判定装置20は、作業員の有無以外に他の判定を行ってもよい。判定装置20は、判定データ取得部22と、判定処理部23とを備える。判定データ取得部22および判定処理部23は、CPU(Central Processing Unit)によるプログラム実行処理や、専用回路等により実現される。これらの機能がプログラム実行処理により実現する場合、記憶部には、当該機能を実現するためのプログラムが格納される。
【0031】
判定データ取得部22は、作業員の有無の判定を行う基になる画像データ(「判定データ」と呼ぶ場合がある)を取得する。判定データは、例えば施工中の建設現場で撮影されたものであり、判定データ取得部22は、例えば建設現場に設けられたカメラ30からリアルタイムで画像データ(映像の一部であってもよい)を取得する。判定データは、学習データと似たような条件で撮影したものであることが望ましい。
【0032】
判定処理部23は、学習済みの学習器を有している。学習済みの学習器は、学習装置10によって学習器を機械学習させたものである。つまり、学習済みの学習器は、画像データを入力することによって作業員の有無を出力するように学習されたものである。判定処理部23は、判定データ取得部22で取得した判定データを学習済みの学習器に入力することによって、判定データにおける作業員の有無を判定する。判定処理部23は、判定結果(判定データにおける作業員の有無)出力する。
【0033】
<実施形態に係る学習方法について>
図3を参照して(適宜、
図2を参照)、実施形態に係る学習方法について説明する。
図3は、実施形態に係る学習方法を説明するための図である。
図3に示すように、学習方法は、主に「アノテーション工程(S10)」と、「学習工程(S20)」とを有する。
【0034】
(アノテーション工程)
図3に示すアノテーション工程(S10)は、バウンディングボックス(BBoX)の付与工程(S11)と、属性付与工程(S12)とを有する。なお、ここで説明するアノテーション工程(S10)はあくまで例示であり、他の方法を採用することも可能である。
【0035】
(BBox付与工程(S11))
BBox付与工程(S11)では、バウンディングボックス(人を囲む枠線)を撮影画像に付与する。ここで、バウンディングボックスは、画像中の「人」を機械学習するために定義するものであるため品質が求められる。この場合の品質とは、画像中に写る人を正確に囲むことであり、例えば設定枠の余剰等がないことが望ましい。また、建設現場の撮影画像は、カメラの手前の物体等で人物がオクルージョン(隠蔽)されている場合や、資材や工具等の手持ち品やリュック等の装着物がある場合が多い。オクルージョンがある場合は、例えば人の足元を推定して設定する必要がある。手持ち品がある場合は、手持ち品が出来るだけ枠外になるようにバウンディングボックスを設定するのがよい。リュック等の装着物がある場合は、ヘルメットや反射帯と同類とみなして枠内に収まるようにバウンディングボックスを設定するのがよい。
【0036】
(属性付与工程(S12))
属性付与工程(S12)では、属性を撮影画像に付与する。属性は、例えば建設工事に関する工事属性、作業員の装着物に関する装着物属性などである。工事属性は、例えば建設工事の工種、建設工事の工程、作業内容および工事現場の明るさの程度などである。装着物属性は、装着物の種類、有無、形状および色などである。なお、工事属性および装着物属性以外の属性を画像データに付与してもよい。工事属性および装着物属性以外の属性は、例えば作業員の姿勢、年齢、性別などである。
【0037】
工事属性としての建設工事の工種に関する項目は、例えば以下に示すものである。
・トンネル工事(NATM、シールド、供用中)、開削工事、路上都市土木工事、橋梁工事、重機土工工事、ダム工事、空港工事、河川水路工事、工場施設工事
【0038】
装着物属性としての装着物の種類に関する項目は、例えば以下に示すものである。また、装着物属性としての装着物の有無、形状および色に関する項目は、例えばかっこ書きで示すものである。
・ヘルメット(色)、保護眼鏡(有、無)、防塵マスク(有、無)、反射帯(有、無)、バックプロテクター(有、無)、ハーネス(有、無)、安全靴の種類(長靴、短靴、その他)
【0039】
バウンディングボックスおよび属性が付与された画像データは、画像データベース11に格納される。画像データベース11には、例えば色々な建設現場で撮影されたものが格納されるのがよい。
【0040】
(学習工程)
図3に示す学習工程(ステップS20)は、属性割合調整工程(S21)と、学習処理工程(S22)とを有する。なお、属性割合調整工程(S21)は、特許請求の範囲の「学習データ取得工程」の一例である。
【0041】
(属性割合調整工程(S21))
属性割合調整工程(S21)では、画像データベース11に格納されている画像データの一部を取得し、取得した画像データを学習画像データベース11aに格納する。学習画像データベース11aは、学習を行う学習データが格納される。属性割合調整工程(S21)では、ユーザが属性に基づく指定をすることが可能であり、意図する画像データ群を作成することができる。この画像データ群は、学習に使用されるまとまりでもあるので、「学習データ群」と呼ぶ場合がある。本実施形態では、属性に関する項目の割合を指定することを想定している。属性割合調整工程(S21)では、例えば属性に関する項目の構成比率または数量の指定を受け付け、学習データ取得部12が指定された属性に関する項目の学習データを取得する。例えばユーザによって属性「工種」に関する項目の構成比率として「トンネル工事」が「60%」および「明かり工事」が「40%」が指定された場合に、学習データ取得部12は、指定された構成比率で画像データベース11から画像データを取得する。
【0042】
(学習処理工程(S22))
学習処理工程(S22)では、学習画像データベース11aに格納された学習データを用いて学習器を機械学習させる。学習処理部13(
図2参照)は、画像データを入力することで作業員の有無を出力するように画像データ群によって学習器を機械学習させる。学習を行った結果として想定される精度(再現率)が得られない場合に、ユーザは、属性割合調整工程(S21)を再び実施し、学習データ群の構成比率(割合)を変更する。そして、構成比率を変更後の学習データを用いて再学習を行い、再学習を行った学習器の再評価を行う。つまり、属性に関する項目の構成比率または数量の指定を変更し、再学習および再評価を繰り返し実行する。期待する精度(再現率)に到達することで学習を終了する。
【0043】
図4および
図5を参照して、学習データ群の属性に基づく構成比率の調整について説明する。
図4は、学習の精度(再現率)の例示であり、(a)は学習データ群の構成比率を変更する前の精度(再現率)であり、(b)は学習データ群の構成比率を変更した後の精度(再現率)である。
図5は、学習データ群の構成比率の例示であり、(a)は変更前の構成比率であり、(b)は変更後の構成比率である。
ここでは、任意の構成比率の学習データ群を用いてベースとなる学習器を作成し、その学習器の評価を行う(この学習を「一次学習」と呼び、一次学習での評価を「一次評価」と呼ぶ)。そして、一次評価を分析し、学習データ群の構成比率を変更し、変更後の学習データ群を用いて再学習を行い、再学習後の学習器の評価を行う(この学習を「二次学習」と呼び、二次学習での評価を「二次評価」と呼ぶ)。
【0044】
図4(a)に示すように、一次評価の結果では、黒系作業着を着た作業員を検知する精度(再現率)は「90%」程度であり、白系作業着を着た作業員を検知する精度(再現率)は「50%」程度であった。つまり、黒系作業着を着た作業員の検知精度に比べて、白系作業着を着た作業員を検知精度が著しく低いという結果であった。一次学習で用いた学習データにおける黒系作業着と白系作業着の割合を分析した結果、
図5(a)に示すように、黒系作業着に比べて白系作業着の割合が著しく低かった。この分析により、白系作業着の割合を増やした方が良いことが分かり、
図5(b)に示すように、白系作業着を着た作業員の画像データを増やして割合を高くし、白作作業着の割合を高くした学習データ群を用いて二次学習を行う。その結果、
図4(b)に示すように、例えば黒系作業着を着た作業員を検知する精度(再現率)は「90%」程度であり、白系作業着を着た作業員を検知する精度(再現率)は「80%」程度になる。
【0045】
なお、色による作業着の割合を調整したとしても、
図6に示すように作業員の未検知がある場合に、未検知であった画像(つまり、作業員を検知できなかった画像データ)を学習画像データベース11aに含めて、当該画像データを含めた学習データ群を用いて再学習を行うのがよい。
図6は、作業員の検知を行っている実際の建設現場で撮影した画像を含めた学習を説明するための図である。つまり、作業員の検知を行っている施工中の建設現場で撮影した画像であって未検知であったものを学習データ群に混ぜて再学習を行うのがよい。これにより、実際の建設現場の状況を考慮した学習を行うことが可能となり、未検知を減らすことができる。
【0046】
<実施形態に係る作業員検知システムの構成について>
図7を参照して、学習済みの学習器を備えた判定装置20(
図2参照)の利用の一態様について説明する。
図7は、実施形態に係る判定装置20を備えた作業員検知システム100の構成図である。
図7に示す作業員検知システム100は、判定装置20と、カメラ30と、モニター40と、警告灯50と、電源60とを備える。作業員検知システム100は、建設機械200に搭載することも可能であり、本実施形態でも建設機械200に搭載したシステムを想定する。
【0047】
判定装置20は、学習装置10(
図2参照)によって学習した学習済みの学習器を備えている。判定装置20は、例えば演算装置であるPC(Personal Computer)に学習済みの学習器をインストールしたものである。
図2に示すように、判定装置20は、判定データ取得部22と、判定処理部23とを備える。
カメラ30は、作業員の検知に必要な解像度を有している。カメラ30は、建設機械200の周囲(特に建設機械200の移動方向)を撮影するように設置される。カメラ30は、例えばデジタルビデオカメラであり、1秒間に数十枚の画像(「フレーム」とも呼ばれる)を撮影する。カメラ30で撮影した画像は、判定装置20に渡され、作業員の検知に使用される。建設機械200が大型機械や編成数の長い軌道動力車などの場合には、複数のカメラ30を設置してもよい。また、判定装置20とカメラ30とを無線で接続することも可能である。
【0048】
モニター40には、判定装置20による作業員の検知結果が表示される。モニター40に表示される検知結果画面は、例えばカメラ30で撮影した画像に写る作業員を何らかの手段で強調して表示したものである。
警告灯50は、判定装置20による作業員の検知結果を光と音で知らせる装置である。警告灯50は、例えば複数の色の光を出射することが可能であり、作業員までの距離に基づいて異なる色の光を出射するのがよい。作業員までの距離は、例えば画像に写る作業員の見かけのサイズから推定する。
【0049】
図8を参照して、人体検知結果の出力方法の一例を説明する。
図8は、人体検知のイメージ図である。
図8では、作業員の距離に応じて異なる情報を出力している。
例えば、
図8の符号81で示すように作業員が非常に遠くにいる場合、人体検知しているものの危険性はないので警告灯50を点灯させない。
また、
図8の符号82で示すように作業員が遠距離にいる場合、危険性は低いので警告灯50を「青色」に点灯させる。
また、
図8の符号83で示すように作業員が中距離にいる場合、危険性があるので警告灯50を「黄色」に点灯させる。さらに、作業員側に設けたセンサ等を反応させて、作業員に危険を知らせるのがよい。
また、
図8の符号84で示すように作業員が近距離にいる場合、危険性が高いので警告灯50を「赤色」に点灯させる。さらに、建設機械200を緊急停止させてもよい。
【0050】
このように、判定装置20にモニター40や警告灯50を組み合わせたシステムを構築すると、建設現場の作業員にも使いやすいシステムになる。また、
図8に示したように、作業員までの距離に応じて三種類程度の発信があると、建設現場の作業員がより使いやすいシステムになる。
【0051】
以上のように、本実施形態に係る学習装置10では、学習データに工事属性または装着物属性が付与されているので、学習データ群の属性に関する項目の構成比率を可視化して適切に調整することができる。その為、構成比率を変更後の学習データ群を用いて学習を行った学習器は、建設現場における作業員を検知する精度(再現率)が高い。したがって、建設現場を撮影するカメラ以外にセンサ類を基本的に使用しなくてよく、従来よりも利便性の高い人体検知システムを構築できる。
【0052】
また、本実施形態によれば、学習データを工事属性や装着物属性別に「辞書化」とすることが可能となる。例えば、トンネル工事で人体検知を行う場合には「トンネル辞書」を学習させて現場適用すると、全工種を学習させたものよりも誤検知を抑えられることも判明している。また、重機土工工事を伴うダム工事のように複数の辞書を選択すればよい場合もあれば、夜勤を伴う明かり工事では明かり工事辞書にトンネル(NATM)を加えるなどのコントロールが可能になる。
【0053】
以上、本発明の実施形態について説明したが、本発明はこれに限定されるものではなく、特許請求の範囲の趣旨を変えない範囲で実施することができる。
【0054】
例えば、本実施形態に係る判定装置20の応用として、検知した人の情報を記録しておき、顔や背格好などから特定の人物を割り出すことも可能である。そして、実施形態で説明した作業員検知システム100で頻繁に検知される人を「不安全行動常習者」であると特定し、注意勧告などを与えれば災害の予防に貢献できる。また、このようなシステムを構築していることを作業員に周知すれば、不安全行動の抑制に繋がると考えられる。
【0055】
また、本実施形態に係る判定装置20の応用として、作業員の検知に留まらず、作業員が装着している装着物をさらに検知することも可能である。例えば、
図9に示すように、作業前の作業員をカメラ30で撮影し、作業に合った服装をしているかなどの安全点検を画像認識技術によって行うこともできる。
【符号の説明】
【0056】
10 学習装置
11 画像データベース(記憶部)
11a 学習画像データベース
12 学習データ取得部
13 学習処理部
20 判定装置
22 判定データ取得部
23 判定処理部
30 カメラ
40 モニター
50 警告灯
60 電源
100 作業員検知システム
200 建設機械