(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-11
(45)【発行日】2024-03-19
(54)【発明の名称】情報処理装置、学習装置、領域設定方法、および学習方法
(51)【国際特許分類】
G06T 7/73 20170101AFI20240312BHJP
B66C 13/00 20060101ALI20240312BHJP
B66C 15/00 20060101ALI20240312BHJP
B66C 23/88 20060101ALI20240312BHJP
【FI】
G06T7/73
B66C13/00 D
B66C15/00 E
B66C23/88 D
(21)【出願番号】P 2020105425
(22)【出願日】2020-06-18
【審査請求日】2022-12-27
(73)【特許権者】
【識別番号】000005119
【氏名又は名称】日立造船株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】三木 裕介
(72)【発明者】
【氏名】和田 貴裕
(72)【発明者】
【氏名】八坂 祥太
【審査官】新井 則和
(56)【参考文献】
【文献】特開2018-080054(JP,A)
【文献】特許第6551639(JP,B1)
【文献】特開2008-312004(JP,A)
【文献】国際公開第2019/163875(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/73
B66C 13/00
B66C 15/00
B66C 23/88
(57)【特許請求の範囲】
【請求項1】
クレーンのブームの傾斜角度を特定する傾斜角度特定部と、
上記傾斜角度特定部が特定した傾斜角度に応じた縮尺を適用して、上記ブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域を設定する領域設定部と
、
上記ブームをそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出された、傾斜角度と上記領域の上記撮影画像におけるピクセル数を当該領域の実寸法で除した値である縮尺との相関を示す相関情報を用いて、傾斜角度に応じた縮尺を特定する縮尺特定部と、を備え、
上記領域設定部は、上記縮尺特定部が特定した縮尺を適用して上記領域を設定する、情報処理装置。
【請求項2】
クレーンのブームの傾斜角度を特定する傾斜角度特定部と、
上記傾斜角度特定部が特定した傾斜角度に応じた縮尺を適用して、上記ブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域を設定する領域設定部と、
上記領域内の検出対象を検出する対象検出部と、
上記領域内に検出対象が検出された場合に警報を行う警報部と、を備え、
上記領域設定部は、上記撮影画像から検出された上記クレーンのフックの位置を基準として上記領域を設定し、
上記領域内に検出対象が侵入した回数をカウントする侵入回数カウント部を備え、
上記侵入回数カウント部は、時系列で撮影された複数の上記撮影画像の1つにおける上記領域内に検出対象が検出された場合、当該撮影画像の直前に撮影された所定数の撮影画像で当該領域内に当該検出対象が検出されていないことを条件として、侵入回数を1回増加させる
、情報処理装置。
【請求項3】
クレーンのブームの傾斜角度を特定する傾斜角度特定部と、
上記傾斜角度特定部が特定した傾斜角度に応じた縮尺を適用して、上記ブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域を設定する領域設定部と、
上記領域内の検出対象を検出する対象検出部と、
上記領域内に検出対象が検出された場合に警報を行う警報部と、を備え、
上記領域設定部は、上記撮影画像から検出された上記クレーンのフックの位置を基準として上記領域を設定し、
上記クレーンのフックの下方側を側方から撮影する第2の撮影装置で撮影された側方画像の画像領域中に第2の領域を設定する側方画像領域設定部と、
上記第2の領域内の検出対象を検出する側方画像対象検出部と、を備え、
上記側方画像領域設定部は、上記側方画像の画像領域の中で、上記フックが検出された位置の下方であって、上記傾斜角度特定部が特定した傾斜角度から求めた、上記第2の撮影装置から上記フックまでの水平方向の距離に対応する位置に上記第2の領域を設定する
、情報処理装置。
【請求項4】
クレーンのブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像の撮影時における上記ブームの傾斜角度を特定する傾斜角度特定部と、
上記傾斜角度特定部が特定した傾斜角度に応じた縮尺を適用して、上記撮影画像中に、実寸法で所定のサイズとなる学習対象領域を設定する学習対象領域設定部と、
上記学習対象領域の画像を所定サイズに調整した調整画像を用いて、上記学習対象領域に写る所定の検出対象を検出するための検出モデルの機械学習を行う学習部と、
上記ブームをそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出された、傾斜角度と上記学習対象領域の上記撮影画像におけるピクセル数を当該学習対象領域の実寸法で除した値である縮尺との相関を示す相関情報を用いて、上記傾斜角度特定部が特定した傾斜角度に応じた縮尺を特定する縮尺特定部と、を備え
、
上記学習対象領域設定部は、上記縮尺特定部が特定した縮尺を適用して上記学習対象領域を設定する、
学習装置。
【請求項5】
上記検出モデルの機械学習に用いる教師データを生成する教師データ生成部を備え、
上記撮影装置で当該撮影装置の下方側を撮影した撮影画像から機械学習用の教師データを生成する
場合に、
上記傾斜角度特定部は、上記ブームの傾斜角度の時系列の測定結果から、上記撮影画像の撮影時刻における上記ブームの傾斜角度を特定
し、
上記教師データ生成部は、上記傾斜角度特定部が特定した傾斜角度と、上記撮影画像と、上記撮影画像において
上記所定の検出対象が写る位置および範囲を示す検出対象情報とを対応付けて
上記教師データを生成する
、請求項4に記載の学習装置。
【請求項6】
情報処理装置により実行される領域設定方法であって、
クレーンのブームの傾斜角度を特定する傾斜角度特定ステップと、
上記傾斜角度特定ステップで特定された傾斜角度に応じた縮尺を適用して、上記ブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域を設定する領域設定ステップと、
を含むと共に、
上記ブームをそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出された、傾斜角度と上記領域の上記撮影画像におけるピクセル数を当該領域の実寸法で除した値である縮尺との相関を示す相関情報を用いて、上記傾斜角度特定ステップで特定された傾斜角度に応じた縮尺を特定する縮尺特定ステップをさらに含み、
上記領域設定ステップでは、上記縮尺特定ステップで特定された縮尺を適用して上記領域を設定する、領域設定方法。
【請求項7】
学習装置により実行される学習方法であって、
クレーンのブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像の撮影時における上記ブームの傾斜角度を特定する傾斜角度特定ステップと、
上記傾斜角度特定ステップで特定された傾斜角度に応じた縮尺を適用して、上記撮影画像中に、実寸法で所定のサイズとなる学習対象領域を設定する学習対象領域設定ステップと、
上記学習対象領域の画像を所定サイズに調整した調整画像を用いて、上記学習対象領域に写る所定の検出対象を検出するための検出モデルの機械学習を行う学習ステップと、を含む
と共に、
上記ブームをそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出された、傾斜角度と上記学習対象領域の上記撮影画像におけるピクセル数を当該学習対象領域の実寸法で除した値である縮尺との相関を示す相関情報を用いて、傾斜角度に応じた縮尺を特定する縮尺特定ステップをさらに含み、
上記学習対象領域設定ステップでは、上記縮尺特定ステップで特定された縮尺を適用して上記学習対象領域を設定する、学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クレーンの周囲を撮影した画像中に実寸法で所定のサイズとなる領域を設定する情報処理装置等に関する。
【背景技術】
【0002】
クレーンを使用して作業を行う工事等では、吊荷の落下事故などから地上の作業員の安全を確保するために、クレーンオペレータが目視で確認等を行っている。しかし、作業員がクレーンオペレータの死角に入ることもあり、また、クレーンオペレータが見落とすことも想定される。このため、目視確認のみに頼った安全管理には改善の余地がある。
【0003】
ここで、クレーンの作業の安全管理のための従来技術として、例えば下記の特許文献1の技術が挙げられる。特許文献1には、クレーンのブームの先端部に取り付けたカメラで撮影した画像上に、作業員の安全性判定のための範囲を設定し、その範囲内における人員の有無を検出する作業支援装置が開示されている。
【0004】
また、特許文献1には、実寸法で所定のサイズとなるように上記範囲を設定するために、上記範囲を設定する基準面からカメラまでの高さに応じて、監視画像における上記範囲の大きさを調整することも記載されている。具体的には、特許文献1には、カメラに写る三角コーンやバリケード等のサイズが既知の物体の像を、監視画像内の背景部分の尺度を示す指標として利用することにより、上記範囲の大きさを調整することが記載されている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記従来技術では、画像に写り込んだ既知の寸法の物体を基準として、設定する範囲のサイズを調整しているため、調整を行う前提として、既知の寸法の物体が画像に写り込んでいることを要する。このため、クレーンの本体やブームが動いて、既知の寸法の物体が撮影範囲外となってしまうと範囲のサイズを調整することができなくなる。
【0007】
本発明の一態様は、撮影画像に既知の寸法の対象物が写り込んでいなくとも、実寸法で所定のサイズとなる領域を設定することができる情報処理装置等を実現することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するために、本発明の一態様に係る情報処理装置は、クレーンのブームの傾斜角度を特定する傾斜角度特定部と、上記傾斜角度特定部が特定した傾斜角度に応じた縮尺を適用して、上記ブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域を設定する領域設定部と、を備える。
【0009】
また、上記の課題を解決するために、本発明の一態様に係る領域設定方法は、情報処理装置により実行される領域設定方法であって、クレーンのブームの傾斜角度を特定する傾斜角度特定ステップと、上記傾斜角度特定ステップで特定された傾斜角度に応じた縮尺を適用して、上記ブームに取り付けられた撮影装置で当該撮影装置の下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域を設定する領域設定ステップと、を含む。
【発明の効果】
【0010】
本発明の一態様によれば、撮影画像に既知の寸法の対象物が写り込んでいなくとも、実寸法で所定のサイズとなる領域を設定することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施形態に係る情報処理装置の要部構成の一例を示すブロック図である。
【
図2】本発明の実施形態に係る学習装置の要部構成の一例を示すブロック図である。
【
図3】上記情報処理装置と上記学習装置を含むクレーンシステムの構成例を示す図である。
【
図5】検出モデルの生成に用いる教師データの生成方法の例を示す図である。
【
図6】教師データ生成処理の例を示すフローチャートである。
【
図7】検出モデルの学習処理の例を示すフローチャートである。
【
図8】危険領域の監視処理の例を示すフローチャートである。
【
図9】上記監視処理により警報を行った例を示す図である。
【
図10】高度判定部の判定結果に応じた領域設定の例を示す図である。
【
図11】側方画像における危険領域の設定方法を説明する図である。
【発明を実施するための形態】
【0012】
〔実施形態1〕
(システム構成)
本発明の一実施形態に係るクレーンシステム100の構成を
図3に基づいて説明する。
図3は、クレーンシステム100の構成例を示す図である。クレーンシステム100には、図示のように、クレーンCR、情報処理装置1、学習装置3、撮影装置5、および傾斜計7が含まれている。
【0013】
クレーンCRは、重量物を吊り上げて移動させる機械である。クレーンCRには、台車部CR1、基部CR2、ブームCR3、ケーブルCR4、フックCR5、およびクレーン室CR6が含まれている。
【0014】
台車部CR1は、レールに沿って
図3の奥行き方向に移動可能に構成されている。また、台車部CR1は、基部CR2を載置している。これにより、クレーンCRの全体がレールに沿って
図3の奥行き方向に移動可能となっている。なお、クレーンCRは、移動式のものに限られず、固定式のものであってもよい。
【0015】
基部CR2は、ブームCR3等を支持する構造体である。基部CR2と台車部CR1は、台車部CR1上で基部CR2が回動できるように接続されている。これにより、クレーンCRは、その周囲360度に位置する荷を運搬することが可能になっている。なお、回動範囲は360度未満であってもよい。また、クレーンCRは、水平面内の回動ができないものであってもよい。
【0016】
ブームCR3は、ジブとも呼ばれる長尺の構造体である。クレーンCRは、ブームCR3を備えているのでジブクレーンである。ブームCR3の一端は基部CR2に回動可能に接続されている。
図3に破線で示すように、ブームCR3は基部CR2との接続部を支点として回動し、その傾斜角度が変更できるように構成されている。また、ブームCR3の他端には図示しない滑車が設けられており、この滑車からケーブルCR4が下垂する構成となっている。
【0017】
ケーブルCR4は、荷を吊り上げるための索であり、その先端に荷を引っ掛けるためのフックCR5が取り付けられている。荷をクレーンCRで移動させる際には、その荷をフックCR5に玉掛けして吊り上げる。
【0018】
クレーン室CR6は、クレーンCRを操作するための各種装置を収容した空間となっており、クレーンCRのオペレータ(以下、単にオペレータと呼ぶ)はクレーン室CR6からクレーンCRの操作を行う。例えば、オペレータは、ブームCR3の傾斜角度の調整、ケーブルCR4の巻き上げ/巻き下ろしによるフックCR5(吊荷)の昇降、基部CR2およびその上部の構造体の回動などの操作を行うことができる。
【0019】
また、クレーンCRのブームCR3には、当該ブームCR3の傾斜角度を計測する傾斜計7が取り付けられている。そして、ブームCR3の先端部付近には、撮影装置5が取り付けられている。
【0020】
撮影装置5は、クレーンCRの吊荷の下方の実寸法で所定サイズの領域(以下、危険領域と呼ぶ)への人の立ち入りを監視するためのものであり、鉛直下方を向くように取り付けられている。これにより、撮影装置5の鉛直下方側に位置するフックCR5と、フックCR5の下方の危険領域が撮影装置5により撮影される。
【0021】
ここで、ブームCR3の傾斜角度を変えた場合、撮影装置5で撮影された撮影画像に写る各種対象(例えば作業者)のサイズも変わり、撮影画像に占める危険領域の割合も変わる。具体的には、ブームCRの傾斜角度を大きくするほど、撮影装置5から危険領域までの距離は遠くなるので、撮影画像に写る各種対象のサイズは小さくなり、撮影画像に占める危険領域の割合も小さくなる。一方、ブームCRの傾斜角度を小さくするほど、撮影装置5から危険領域までの距離は近くなるので、撮影画像に写る各種対象のサイズは大きくなり、撮影画像に占める危険領域の割合も大きくなる。
【0022】
このため、ブームCR3の傾斜角度を考慮することなく、撮影装置5で撮影された撮影画像から人の検出を行った場合、検出精度が低くなってしまうおそれがある。そこで、情報処理装置1は、傾斜計7で計測された傾斜角度に応じた縮尺を適用して、上記撮影画像中に実寸法で所定のサイズとなる危険領域を設定し、その危険領域内の各種対象を検出する。
【0023】
撮影装置5が撮影した撮影画像は例えば携帯型の記録媒体に記憶させてもよく、この場合、情報処理装置1は記録媒体から撮影画像を読み出せばよい。ただし、情報処理装置1は、危険領域に人が立ち入った場合に、そのことを迅速に検出する必要があるから、情報処理装置1は、記録媒体経由ではなく、撮影装置5から撮影画像を直接受信することが好ましい。傾斜計7の計測結果も同様である。
【0024】
なお、情報処理装置1は、クレーンCRが設置された現場に設置してもよいし、例えば遠隔のコントロールセンター等に設置してもよい。学習装置3も同様である。遠隔地に接地する場合、情報処理装置1は、撮影画像や傾斜計7の計測結果を、ネットワークを介した通信により取得すればよい。
【0025】
また、情報処理装置1が行う処理の一部を他のコンピュータ・システムで行う構成としてもよい。例えば、各種対象の検出には後述する検出モデルを用いた演算を行うが、この演算を他のコンピュータ・システムで行う構成としてもよい。この場合、情報処理装置1は、演算に必要な情報を、ネットワークを介した通信により他のコンピュータ・システムに送信する。そして、情報処理装置1は、上記他のコンピュータ・システムから送信される演算結果を受信する。
【0026】
学習装置3は、撮影装置5が撮影した撮影画像から所定の検出対象を検出するための検出モデルの機械学習を行う。検出モデルは教師ありの機械学習により生成されるものであってもよい。例えば、学習装置3は、畳み込みニューラルネットワーク等の検出モデルを生成してもよい。また、検出モデルは教師なし学習により生成されるものであってもよい。
【0027】
学習装置3が機械学習により生成した検出モデルは情報処理装置1による各種対象の検出に用いられる。学習装置3の設置場所は情報処理装置1と同じであってもよいし、異なっていてもよい。また、学習装置3の機能を情報処理装置1に持たせてもよく、この場合、クレーンシステム100の構成要素から学習装置3が省略される。
【0028】
(情報処理装置の構成)
図1は、情報処理装置1の要部構成の一例を示すブロック図である。図示のように、情報処理装置1は、プロセッサ10、メモリ11、および大容量記憶装置12を備えている。情報処理装置1は、一例として、パーソナルコンピュータ、サーバー、またはワークステーションであってもよい。プロセッサ10は、大容量記憶装置12に記憶されている情報処理プログラムをメモリ11にロードして実行することにより、後述する画像取得部101から側方画像対象検出部112までの各部として機能する。
【0029】
また、情報処理装置1は、外部の機器とのインターフェース(IF)として、撮影装置IF13、傾斜計IF14、表示装置IF15、音出力装置IF16、およびネットワークIF17を備えている。これらのインターフェースは任意のものを適用可能であり、例えば、USB(Universal Serial Bus)、HDMI(登録商標)(High-Definition Multimedia Interface)等を適用してもよい。
【0030】
撮影装置IF13は、撮影装置5から上述の撮影画像を取得するためのインターフェースである。また、傾斜計IF14は、傾斜計7から傾斜角度の計測値を取得するためのインターフェースである。なお、上記撮影画像および上記計測値は何れもアナログデータである。アナログデータをデジタルデータに変換する処理は、情報処理装置1への入力前に行ってもよいし、情報処理装置1が行ってもよい。また、撮影画像および傾斜角度の計測値は、情報処理装置1の外部の記憶装置等を介して取得する構成としてもよい。
【0031】
表示装置IF15は、情報処理装置1が図示しない表示装置に画像を表示させる際に使用するインターフェースである。例えば、情報処理装置1は、表示装置IF15を介して、撮影装置5が撮影した撮影画像や、傾斜計7の計測値等を表示装置に表示させることもできる。
【0032】
音出力装置IF16は、情報処理装置1が図示しない音出力装置に音声を出力させる際に使用するインターフェースである。音出力装置は例えばスピーカである。情報処理装置1は、例えば危険領域への人の立ち入りを検出したときに、音出力装置IF16を介して、音出力装置に警告メッセージや警告音を出力させることもできる。
【0033】
ネットワークIF17は、情報処理装置1が例えばインターネット等のネットワーク上の各種機器と通信するためのインターフェースである。なお、情報処理装置1は、上述したインターフェース以外にも例えば外付けの記憶装置(例えばハードディスク)にアクセスするためのインターフェース等を備えていてもよい。
【0034】
プロセッサ10は、上述のように画像取得部101から側方画像対象検出部112までの各部として機能する。以下、画像取得部101から警報部109までの各部について説明する。なお、側方画像取得部110から側方画像対象検出部112までの各部については実施形態2で説明する。
【0035】
画像取得部101は、クレーンCRのブームCR3に取り付けられた撮影装置5で下方側を撮影した撮影画像を取得する。撮影画像の取得方法は特に限定されず、例えば、画像取得部101は、撮影装置IF13を介して撮影装置5から撮影画像を取得してもよい。
【0036】
傾斜角度特定部102は、クレーンCRのブームCR3の傾斜角度を特定する。傾斜角度の特定方法は特に限定されず、例えば、傾斜角度特定部102は、傾斜計IF14を介して傾斜計7の計測値を取得してもよい。
【0037】
縮尺特定部103は、傾斜角度特定部102が特定した傾斜角度に応じた縮尺を特定する。具体的には、縮尺特定部103は、ブームCRをそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出された相関情報を用いて縮尺を特定する。相関情報は、傾斜角度と縮尺との相関を示す情報である。なお、相関情報とそれを用いた縮尺の特定についての詳細は後述する。
【0038】
高度判定部104は、危険領域に対応する位置の高度を判定する。高度の判定が行われた場合、領域設定部105は、高度判定部が判定した高度と、傾斜角度特定部102が特定した傾斜角度とに応じた縮尺を適用して、撮影画像中に危険領域を設定する。これらの処理の詳細は
図10に基づいて後述する。
【0039】
領域設定部105は、傾斜角度特定部102が特定した傾斜角度に応じた縮尺を適用して、撮影装置5で下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域(危険領域)を設定する。なお、縮尺は上述のように縮尺特定部103が特定する。領域設定方法の詳細は後述する。
【0040】
入力データ生成部106は、対象検出部107が対称の検出に用いる検出モデルに入力する入力データを生成する。より詳細には、入力データ生成部106は、領域設定部105が設定した危険領域を上記撮影画像から切り出して所定サイズに調整し、調整画像を生成する。この調整画像が検出モデルへの入力データとなる。詳細は後述するが、この検出モデルは学習装置3によって生成される。
【0041】
対象検出部107は、撮影画像に写る所定の検出対象を検出する。本実施形態では、当該対象が人とフックである例、すなわち対象検出部107が、撮影画像に写る危険領域内において、人とフックCR5を検出する例を説明する。これらの検出は、上述した検出モデルの出力値に基づいて行われる。
【0042】
なお、検出対象はこれらの例に限られない。例えば、対象検出部107は、人の代わりに人の装着している物品(ヘルメット等)を検出してもよいし、フックCR5の代わりに吊荷等を検出してもよい。また、対象検出部107は、複数の対象を検出する場合、当該複数の対象を検出可能な1つの検出モデルの出力値から各対象を検出してもよいし、対象ごとに用意された検出モデルの出力値から各対象を検出してもよい。
【0043】
侵入回数カウント部108は、領域設定部105が設定した領域すなわち危険領域に対象検出部107の検出対象(典型的には人)が侵入した回数をカウントする。侵入回数のカウント方法の詳細は後述する。
【0044】
警報部109は、危険領域内に対象検出部107の検出対象(典型的には人)が検出された場合に警報を行う。警報は、検出対象が検出されたことを所定の対象者に認識させることができるものであればよく、音、画像、およびそれらの組み合わせ等、任意の方法で行うものであってよい。警報の対象者は、クレーンCRの周囲で作業する作業員であってもよい。ただし、作業員は、例えば吊荷をフックCR5に玉掛けする際などに危険領域に立ち入るが、このような立ち入り時には警報は不要である。そこで、警報の対象者は、例えば、工事現場の監視員や監督者、情報処理装置1のオペレータ等としてもよい。これらの場合、警報の対象者が必要と判断したときに、警報部109または他の手段により作業員への警報を行えばよい。
【0045】
以上のように、情報処理装置1は、クレーンCRのブームCR3の傾斜角度を特定する傾斜角度特定部102を備えている。また、情報処理装置1は、傾斜角度特定部102が特定した傾斜角度に応じた縮尺を適用して、ブームCR3に取り付けられた撮影装置5で撮影した撮影画像中に、実寸法で所定のサイズとなる領域を設定する領域設定部105を備えている。
【0046】
上記の構成によれば、ブームCR3の傾斜角度を特定し、その傾斜角度に応じた縮尺を適用して領域を設定するので、撮影画像に既知の寸法の対象物が写り込んでいなくとも、実寸法で所定のサイズとなる領域を設定することができる。そして、対象検出部107は、設定された領域(危険領域)から所定の検出対象を検出するので、撮影画像全体から検出を行う場合と比べて、少ない演算量で高精度な検出を行うことが可能になる。
【0047】
(学習装置の構成)
図2は、学習装置3の要部構成の一例を示すブロック図である。図示のように、学習装置3は、プロセッサ30、メモリ31、および大容量記憶装置32を備えている。学習装置3は、情報処理装置1と同様に、パーソナルコンピュータ、サーバー、またはワークステーションであってもよい。プロセッサ30は、大容量記憶装置32に記憶されている学習プログラムをメモリ31にロードして実行することにより、後述する画像取得部301から学習部310までの各部として機能する。
【0048】
また、学習装置3は、外部の機器とのインターフェース(IF)として、撮影装置IF33、傾斜計IF34、表示装置IF35、入力装置IF36、およびネットワークIF37を備えている。入力装置IF36は、キーボードやマウスなどの入力装置からの入力信号を受け付けるためのインターフェースである。入力装置IF36は、例えばUSB等のインターフェースであってもよい。学習装置3が備えるインターフェースのうち、
図1の情報処理装置1が備えるものと同名のインターフェースは機能も同様であるから説明を繰り返さない。
【0049】
画像取得部301は、クレーンCRのブームCR3に取り付けられた撮影装置5で下方側を撮影した撮影画像を取得する。撮影画像の取得方法は特に限定されず、例えば、画像取得部301は、撮影装置IF33を介して撮影装置5から上述の撮影画像を取得してもよい。また、例えば、画像取得部301は、情報処理装置1の大容量記憶装置12に保存されている撮影画像を情報処理装置1と通信することにより取得してもよい。さらに、例えば、撮影画像が情報処理装置1の外部の記憶装置に記憶されている場合には、画像取得部301はその記憶装置にアクセスして撮影画像を取得してもよい。
【0050】
撮影時刻特定部302は、画像取得部301が取得した撮影画像の撮影時刻を特定する。撮影時刻の特定方法の詳細は後述する。
【0051】
傾斜角度特定部303は、クレーンCRのブームCR3の傾斜角度を特定する。具体的には、傾斜角度特定部303は、ブームCR3の傾斜角度の時系列の測定結果から、撮影画像の撮影時刻におけるブームCR3の傾斜角度を特定する。なお、傾斜角度の特定方法の詳細は後述する。
【0052】
検出対象情報生成部304は、撮影画像において、検出モデルの検出対象が写る位置および範囲を示す検出対象情報を生成する。検出対象が写る位置および範囲は、学習装置3のユーザが設定してもよい。この場合、検出対象情報生成部304は、入力装置IF36を介してユーザの設定を取得し、取得した設定内容を示す検出対象情報を生成すればよい。
【0053】
教師データ生成部305は、撮影装置5で撮影する撮影画像から所定の検出対象を検出するための検出モデルの機械学習に用いる教師データを生成する。詳細は後述するが、この教師データでは、撮影画像に対して、傾斜角度特定部303が特定した傾斜角度と、検出対象情報生成部304が生成した検出対象情報とが対応付けられている。
【0054】
縮尺特定部306は、傾斜角度特定部303が特定した傾斜角度に応じた縮尺を特定する。具体的には、縮尺特定部306は、ブームCRをそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出された相関情報を用いて縮尺を特定する。縮尺特定部306が用いる相関情報は、情報処理装置1の縮尺特定部103が用いる相関情報と同じ情報である。
【0055】
学習対象領域設定部307は、傾斜角度特定部303が特定した傾斜角度に応じた縮尺を適用して、ブームCR3に取り付けられた撮影装置5で下方側を撮影した撮影画像中に、実寸法で所定のサイズとなる領域(学習対象領域)を設定する。なお、縮尺は上述のように縮尺特定部306が特定する。
【0056】
学習対象領域を実寸法でどの程度のサイズの領域とするかは任意である。また、学習対象領域は、危険領域と同じ位置およびサイズの領域としてもよいし、位置およびサイズの少なくとも何れかが危険領域とは異なる領域としてもよい。後者の場合、学習対象領域を危険領域よりも広く設定してもよい。
【0057】
入力データ生成部308は、学習部310が検出モデルの機械学習時に当該検出モデルに入力する入力データを生成する。なお、検出モデルは、情報処理装置1の対象検出部107が対象の検出に用いるモデルである。具体的には、入力データ生成部308は、学習対象領域設定部307が設定した学習対象領域を上記撮影画像から切り出して所定サイズに調整し、調整画像を生成する。この調整画像が機械学習時における検出モデルへの入力データとなる。
【0058】
回転画像生成部309は、入力データ生成部308が生成した調整画像を回転させて回転画像を生成する。回転画像生成部309が生成する回転画像は、上記調整画像と共に上記生成モデルの生成に用いられる。
【0059】
学習部310は、機械学習により上記検出モデルを生成する。検出モデルの生成には、上述のとおり、入力データ生成部308が生成する入力データ(具体的には調整画像)が用いられると共に、回転画像生成部309が生成する回転画像も用いられる。機械学習の詳細については後述する。
【0060】
以上のように、学習装置3は、クレーンCRのブームCR3の傾斜角度を特定する傾斜角度特定部303を備えている。また、学習装置3は、傾斜角度特定部303が特定した傾斜角度に応じた縮尺を適用して、ブームCR3に取り付けられた撮影装置5で撮影した撮影画像中に、実寸法で所定のサイズとなる領域(学習対象領域)を設定する学習対象領域設定部307を備えている。
【0061】
上記の構成によれば、ブームCR3の傾斜角度を特定し、その傾斜角度に応じた縮尺を適用して領域を設定するので、撮影画像に既知の寸法の対象物が写り込んでいなくとも、実寸法で所定のサイズとなる領域を設定することができる。そして、学習部310は、撮影画像の画像領域のうち、設定された上記領域(学習対象領域)のみを学習の対象とするので、撮影画像全体を学習対象とする場合と比べて、少ない演算量で高精度な検出が可能な検出モデルを生成することが可能になる。
【0062】
また、学習装置3は、以上のように、ブームCR3に取り付けられた撮影装置5で下方側を撮影した撮影画像の撮影時におけるブームCR3の傾斜角度を特定する傾斜角度特定部303を備えている。また、学習装置3は、傾斜角度特定部303が特定した傾斜角度に応じた縮尺を適用して、撮影画像中に実寸法で所定のサイズとなる学習対象領域を設定する学習対象領域設定部307を備えている。さらに、学習装置3は、学習対象領域の画像を所定サイズに調整した調整画像を用いて、学習対象領域に写る所定の検出対象を検出するための検出モデルの機械学習を行う学習部310を備える。
【0063】
上記の構成によれば、ブームの傾斜角度を特定し、その傾斜角度に応じた縮尺を適用して、実寸法で所定のサイズとなる学習対象領域を設定する。すなわち、上記の構成によれば、撮影画像に既知の寸法の対象物が写り込んでいなくとも、実寸法で所定のサイズとなる学習対象領域を設定することができる。
【0064】
また、上記の構成によれば、学習対象領域の画像を所定サイズに調整した調整画像を用いて機械学習を行う。これにより、ブームCR3の傾斜角度に応じて撮影画像における学習対象領域の範囲が変わり、学習対象領域に写る検出対象のサイズが変わっても、常に実寸法で所定のサイズとなる学習対象領域を学習対象とすることができる。また、設定された学習対象領域に対応する実寸法のサイズは常に所定サイズであるから、学習対象領域に写る検出対象のサイズも略一定の範囲に収まる。よって、このような調整画像を用いない場合と比べて効率的な学習を行うことができる。
【0065】
また、学習装置3は、以上のように、ブームCR3の傾斜角度の時系列の測定結果から、画像取得部301が取得した撮影画像の撮影時刻におけるブームCR3の傾斜角度を特定する傾斜角度特定部303を備えている。さらに、学習装置3は、傾斜角度特定部303が特定した傾斜角度と、画像取得部301が取得した撮影画像と、検出対象情報生成部304が生成した検出対象情報とを対応付けて教師データを生成する教師データ生成部305を備えている。この教師データは、上述の検出モデルの機械学習に用いられる教師データである。
【0066】
つまり、学習装置3は、ブームCR3に取り付けられた撮影装置5で下方側を撮影した撮影画像から機械学習用の教師データを生成する教師データ生成装置としての機能も有している。無論、学習装置3とは別体の教師データ生成装置に傾斜角度特定部303および教師データ生成部305等を実装してもよい。
【0067】
上記の構成によれば、ブームCR3の傾斜角度の時系列の測定結果から、撮影画像の撮影時刻におけるブームCR3の傾斜角度を特定し、特定した傾斜角度と撮影画像と検出対象情報とを対応付けて教師データを生成する。この教師データには、ブームCR3の傾斜角度が含まれているので、この傾斜角度に応じた縮尺を適用することにより、当該教師データに含まれる撮影画像中に実寸法で所定のサイズとなる学習対象領域を設定することができる。したがって、学習部310は、上記のようにして生成される教師データを用いることにより、効率的な学習を行うことができる。
【0068】
(アンカーボックスについて)
検出モデルを用いた物体検出では、アンカーボックスを用いることが好ましい。アンカーボックスを用いることにより、例えばスライディングウィンドウ等による物体検出と比べて処理を簡略化し、効率的に検出を行うことができる。
【0069】
アンカーボックスを用いた物体検出を行う検出モデルを生成する場合、使用するアンカーボックスの高さと幅を事前に定義しておく。アンカーボックスは、複数定義することができる。ただし、使用するアンカーボックスの数が増える程、学習においても学習済みの検出モデルによる物体検出においても演算量が増えてしまう。
【0070】
この点、学習部310は、撮影画像全体を学習対象とするのではなく、学習対象領域設定部307が設定した学習対象領域のみを学習対象としているので、アンカーボックスの数を抑えつつ、十分な検出精度の検出モデルを生成可能である。同様に、情報処理装置1の対象検出部107は、撮影画像全体を検出対象とするのではなく、領域設定部105が設定した領域(危険領域)を検出対象としているので、アンカーボックスの数を抑えつつ、十分な精度での検出を実現可能である。
【0071】
(危険領域の設定例)
図4は、危険領域の設定例を示す図である。より詳細には、
図4には、ブームCR3の傾斜角度が急峻なときの危険領域の設定例を示すとともに、ブームCR3の傾斜角度を緩やかにしたときの危険領域の設定例を示している。なお、
図4では急峻な傾斜角度のブームCR3を破線で示している。
【0072】
図4では、フックCR5の直下の位置を中心とする実寸法で一辺の長さがaの正方形の領域を危険領域に設定する例を説明する。ブームCRの傾斜角度によらず、危険領域のサイズは不変であるが、ブームCRの傾斜角度によって撮影装置5の撮影範囲は変化する。
【0073】
図4の例では、ブームCRの傾斜角度が急峻であるときには、撮影装置5の撮影範囲AR1の幅はA
1である。この状態で撮影した画像が撮影画像IMG1である。一方、ブームCRの傾斜角度を緩やかにすると、撮影装置5がより低い位置になり、撮影範囲AR2の幅はA
2になる(A
1>A
2)。この状態で撮影した画像が撮影画像IMG2である。撮影画像IMG1とIMG2は、何れも同じ撮影設定で撮影されたものであり、画像サイズおよび解像度が同一である。これらの撮影画像の幅は何れもB(ピクセル)である。
【0074】
領域設定部105は、このようにして撮影された各撮影画像について、実寸法で一辺の長さがaとなる危険領域を設定する。
図4の例では、撮影画像IMG1については一辺の長さがb
1(ピクセル)である危険領域が設定されており、撮影画像IMG2については一辺の長さがb
2(ピクセル)である危険領域が設定されている。
【0075】
図4から看取できるように、b
1<b
2である。これは、ブームCR3の傾斜角度の違いに起因する、撮影装置5から危険領域までの距離の違いを反映したものである。つまり、撮影画像IMG1およびIMG2では、ブームCR3の傾斜角度が大きいほど撮影装置5から危険領域までの距離が遠くなり、撮影画像に写る危険領域のサイズは小さくなることを反映したサイズの危険領域が設定されている。
【0076】
撮影画像IMG1およびIMG2における危険領域のサイズは、縮尺特定部103が特定した縮尺に基づいて決定される。上述のように、縮尺は、ブームCR3をそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出される。
【0077】
例えば、ブームCR3の傾斜角度を最大にして、撮影装置5の直下に所定の長さの基準物を配置し、それを撮影する。なお、基準物は長さが既知のものであればよく、例えば地表面に描いた線分などであってもよい。そして、撮影された画像(基準画像)に写る基準物の長さ(例えばピクセル数)を計測する。これにより、ブームCR3の傾斜角度が最大であるときの実寸法と基準画像上におけるサイズとの対応関係を特定することができる。
【0078】
同様に、ブームCR3の傾斜角度を最小にして、撮影装置5の直下に所定の長さの基準物を配置し、それを撮影する。そして、撮影された画像(基準画像)に写る基準物の長さ(例えばピクセル数)を計測する。これにより、ブームCR3の傾斜角度が最小であるときの実寸法と基準画像上におけるサイズとの対応関係を特定することができる。
【0079】
そして、ブームCR3の傾斜角度が最大であるときの実寸法と基準画像上のサイズとの対応関係と、ブームCR3の傾斜角度が最小であるときの実寸法と基準画像上のサイズとの対応関係から、他の傾斜角度のときの対応関係も導出される。つまり、ブームCR3の傾斜角度から縮尺を算出する関数を導出することができる。この関数を相関情報として大容量記憶装置12等に格納しておけば、縮尺特定部103はこの関数を用いて縮尺を特定することができる。
【0080】
このような関数を相関情報として大容量記憶装置12等に格納しておけば、縮尺特定部103はこの関数を用いて縮尺を特定することができる。そして、領域設定部105は、このようにして特定された縮尺を用いることにより、撮影画像IMG1およびIMG2のそれぞれについて、実寸法で所定サイズとなる危険領域を設定することができる。
【0081】
例えば、
図4の例において、ブームCR3の傾斜角度が急峻であるときの縮尺(撮影画像におけるピクセル数/実寸法)がX1と特定され、ブームCR3の傾斜角度が緩やかであるときの縮尺がX2と特定されたとする。この場合、領域設定部105は、危険領域の実寸法幅であるaに縮尺X1を乗じて、IMG1における危険領域の幅b
1を算出する(a×X1=b
1)。また、領域設定部105は、危険領域の実寸法幅であるaに縮尺X2を乗じて、IMG2における危険領域の幅b
2を算出する(a×X2=b
2)。
【0082】
以上のように、縮尺特定部103は、ブームCR3をそれぞれ異なる傾斜角度として寸法が既知の基準物を撮影した基準画像のそれぞれにおける当該基準物のサイズを用いて導出された相関情報を用いて傾斜角度に応じた縮尺を特定してもよい。そして、領域設定部105は、縮尺特定部103が特定した縮尺を適用して危険領域を設定してもよい。この構成によれば、寸法が既知の基準物を実際に撮影した基準画像を用いて導出された相関情報を用いるので、適切な縮尺を特定することが可能になる。
【0083】
以上のようにして撮影画像IMG1において危険領域を設定した後、その危険領域からの人の検出が行われる。上述のように、人の検出には検出モデルを用いるので、入力データ生成部106はこの検出モデルへの入力データを生成する。
【0084】
具体的には、
図4に示すように、入力データ生成部106は、撮影画像IMG1から領域設定部105が設定した危険領域を切り出して画像IMG1aを生成する。そして、生成した画像IMG1aを所定のサイズ(
図4の例では一辺の長さがCピクセルの正方形)に調整して調整画像IMG1bを生成する。この調整画像IMG1bが検出モデルへの入力データとなる。
【0085】
なお、入力データ生成部106は、領域設定部105が設定した危険領域よりも広い領域を切り出してもよい。これにより、危険領域に近付いた作業員を検出することが可能になり、また、フックCR5が揺れる等によって危険領域を設定する撮影画像IMG2中の基準位置がずれた場合にも、実際の危険領域をカバーした範囲で人の検出を行うことができる。
【0086】
撮影画像IMG2からの入力データの生成方法も同様である。すなわち、入力データ生成部106は、撮影画像IMG2から領域設定部105が設定した危険領域を切り出して画像IMG2aを生成する。そして、生成した画像IMG2aを所定のサイズ(
図4の例では一辺の長さがCピクセルの正方形)に調整して調整画像IMG2bを生成する。この調整画像IMG2bが検出モデルへの入力データとなる。
【0087】
また、学習装置3において行われる調整画像の生成も上記と同様である。すなわち、学習装置3においては、入力データ生成部308が、撮影画像から学習対象領域設定部307が設定した学習対象領域を切り出し、切り出した画像を所定のサイズに調整して調整画像を生成する。この調整画像のサイズは、入力データ生成部106が生成する調整画像と同じサイズである。
【0088】
(教師データの生成)
図5は、検出モデルの生成に用いる教師データの生成方法の例を示す図である。図示のように、ここでは傾斜情報が常時記録されているとする。傾斜情報は、傾斜計7の計測結果すなわち傾斜角度と、その計測が行われた時刻を示す時刻情報とが対応付けられた情報である。
【0089】
また、撮影装置5により動画像が撮影されて動画像ファイルが記録されているとする。なお、動画像の撮影は断続的に行われ、各撮影で得られた動画像が個別の動画像ファイルとして記録されている。例えば、クレーンCRを用いて作業が行われたある一日において、作業時間中継続して撮影を行い、その一日の動画像ファイルとして記録してもよい。
【0090】
また、各動画像ファイルのファイル名にはその動画像ファイルの撮影開始時刻を示す情報を含めておいてもよい。これにより、撮影開始時刻を簡単に記録しておくことができる。例えば、年月日を示す情報(YYYYMMDD)と時分秒を示す情報(HHMMSS)とを組み合わせたファイル名としてもよい。
【0091】
画像取得部301は、上述の動画像ファイルから、当該動画像ファイルを構成するフレーム画像を取得する。この際、画像取得部301は、取得したフレーム画像のファイル名に画像番号を付与しておく。例えば、画像取得部301は、動画像ファイルを構成する最初のフレーム画像の画像番号を0とし、2番目以降のフレーム画像について画像番号をインクリメントさせながら付与してもよい。
【0092】
撮影時刻特定部302は、動画像ファイルのファイル名に含まれる、動画像の撮影開始時刻に基づいて、画像取得部301が取得したフレーム画像の撮影時刻を特定する。例えば、上記動画像ファイルのフレームレートが1秒間に29.97フレームである場合には、100フレーム目のフレーム画像の撮影時刻は(100×1/29.97)秒と特定される。
【0093】
傾斜角度特定部303は、上述の傾斜情報を参照して、撮影時刻特定部302が特定した撮影時刻におけるブームCR3の傾斜角度を特定する。これにより、フレーム画像と傾斜角度とが対応付けられる。傾斜角度特定部303は、特定した傾斜角度をフレーム画像の画像番号と同じ番号の角度ファイルに保存することにより、この対応付けの結果を記録してもよい。
【0094】
なお、撮影時刻特定部302が特定した撮影時刻と一致する時刻情報が対応付けられた傾斜角度が存在しなければ、最も近い時刻情報が対応付けられた傾斜角度を特定すればよい。
【0095】
以上の処理により、フレーム画像が画像番号を付された状態で保存されると共に、傾斜角度も同様に番号を付された状態で保存される。なお、対応付けられたフレーム画像と傾斜角度には同じ番号が付与されている。
【0096】
このように、画像取得部301が撮影装置5で撮影した動画像ファイルを構成するフレーム画像を取得する場合、撮影時刻特定部302は、動画像ファイルのファイル名に含まれる、動画像の撮影開始時刻に基づいてその撮影時刻を特定してもよい。そして、傾斜角度特定部303は、撮影時刻特定部302が特定した撮影時刻におけるブームCR3の傾斜角度を特定してもよい。この構成によれば、予め動画像ファイルのファイル名に動画像の開始時刻を含めておくだけで、その動画像ファイルを構成するフレーム画像から、傾斜角度を含む教師データを自動で生成することが可能になる。
【0097】
次に、縮尺の特定と学習対象領域の設定とが行われる。具体的には、まず、画像取得部301が取得したフレーム画像について、縮尺特定部306が、傾斜角度特定部303が特定した傾斜角度に応じた縮尺を特定する。縮尺の特定には、
図4の説明時に述べたように、傾斜角度から縮尺を算出する関数を相関情報として用いればよい。
【0098】
次に、学習対象領域設定部307が、画像取得部301が取得した上記フレーム画像に学習対象領域を設定する。学習対象領域の実寸法のサイズは危険領域と同じまたは同程度としてもよいし、危険領域よりも広く設定してもよい。学習対象領域は、例えばフレーム画像における中心位置に設定すればよい。そして、入力データ生成部308が、上記フレーム画像から上記学習対象領域を切り出して所定サイズに調整し、調整画像を生成する。これらの処理を各フレーム画像について行うことにより、各フレーム画像に対応する調整画像が生成される。
【0099】
この後、各調整画像について、検出対象情報生成部304が、検出対象の位置および範囲を示す検出対象情報を保存する。例えば、検出対象情報生成部304は、表示装置IF35を介して調整画像を表示装置に表示させ、入力装置IF36を介して検出対象の位置および範囲の入力を受け付けてもよい。例えば、人の検出モデルを生成する場合、学習装置3のユーザは、調整画像に写る人を囲む矩形を入力すればよい。この場合、検出対象情報生成部304は、入力された矩形の位置(例えば代表座標)、幅、および高さを検出対象情報として保存すればよい。
【0100】
また、回転画像生成部309は、調整画像を回転させて回転画像を生成する。また、回転画像生成部309は、回転画像を生成した場合、その回転角度に応じて上述の検出対象情報も修正する。
【0101】
これにより、学習部310は、調整画像に加えて回転画像も用いて機械学習を行うことになる。この構成によれば、調整画像を回転させて生成した回転画像についても機械学習に用いるので、機械学習する画像のバリエーションを増やし、この機械学習によって生成される検出モデルの検出精度を高めることができる。
【0102】
例えば、回転画像生成部309は、調整画像をランダムな回転角度で回転させることにより回転画像を生成してもよい。また、回転画像生成部309は、1つの調整画像から回転角度が異なる複数の回転画像を生成してもよい。
【0103】
(教師データ生成処理の流れ)
教師データ生成処理の流れを
図6に基づいて説明する。
図6は、教師データ生成処理(教師データ生成方法)の例を示すフローチャートである。
【0104】
S1では、画像取得部301が撮影画像を取得し、S2では撮影時刻特定部302がその撮影時刻を特定する。例えば、
図5の例のように、画像取得部301が動画像ファイルのフレーム画像をS1で取得した場合には、S2では撮影時刻特定部302がそのフレーム番号と動画像ファイルの撮影開始時刻とから撮影時刻を特定する。
【0105】
S3(傾斜角度特定ステップ)では、傾斜角度特定部303が、S2で特定された時刻におけるブームCR3の傾斜角度を特定する。例えば、
図5の例のように、時刻情報を含む傾斜情報が記録されている場合、傾斜角度特定部303はS2で特定された時刻と一致するか、またはその時刻に最も近い時刻を示す時刻情報が対応付けられた傾斜角度を特定する。
【0106】
S4(教師データ生成ステップ)では、教師データ生成部305がS1で取得された撮影画像とS3で取得された傾斜情報とを対応付けて教師データとし、これを保存する。そして、S5(教師データ生成ステップ)では、教師データ生成部305は、S4で保存した教師データに、検出対象情報生成部304が生成した検出対象情報をさらに対応付けて保存し、これにより教師データ生成処理は終了する。
【0107】
(学習処理の流れ)
検出モデルを生成するための学習処理の流れを
図7に基づいて説明する。
図7は、検出モデルの学習処理(学習方法)の例を示すフローチャートである。
【0108】
S11では、入力データ生成部308が、教師データを取得する。この教師データは、
図6に示す教師データ生成処理により生成されて、大容量記憶装置32などに保存されたものであり、撮影画像、傾斜角度、および検出対象情報を含む。
【0109】
S12(傾斜角度特定ステップ)では、傾斜角度特定部303が、S11で取得された教師データに含まれる傾斜角度を、当該教師データに含まれる撮影画像の撮影時におけるブームCR3の傾斜角度であると特定する。なお、教師データに傾斜角度を示す情報が含まれていなければ、傾斜角度特定部303は上述した
図6のS3と同様の処理により傾斜角度を特定する。
【0110】
S13では、縮尺特定部306が、S12で特定された傾斜角度から、S11で取得された教師データに含まれる撮影画像の縮尺を特定する。傾斜角度から縮尺を特定する方法は上述した通りであるから、ここでは説明を繰り返さない。
【0111】
S14(学習対象領域設定ステップ)では、学習対象領域設定部307が、S11で取得された教師データに含まれる撮影画像に学習対象領域を設定する。より詳細には、学習対象領域設定部307は、設定すべき学習対象領域の実寸法に、S13で特定された縮尺を乗じて、撮影画像中における学習対象領域のサイズを特定する。そして、学習対象領域設定部307は、撮影画像における所定位置(例えば中央部)に、特定した上記サイズの学習対象領域を設定する。
【0112】
S15では、入力データ生成部308が、教師データに含まれる撮影画像から学習対象領域を切り出し、サイズ調整して調整画像を生成する。また、入力データ生成部308は、上記のサイズ調整に伴う検出対象情報の修正も行う。例えば、サイズ調整により学習対象領域のサイズが1/2になった場合には、検出対象情報に含まれる検出対象の幅および高さも1/2にする。また、入力データ生成部308は、検出対象情報に含まれる検出対象の位置についても、学習対象領域を切り出した位置に応じて修正する。
【0113】
なお、入力データ生成部308は、学習対象領域の切り出しの際に、切り出す領域の位置、サイズ、または形状等を変えて複数パターンの画像を切り出してもよい。この場合、例えば学習対象領域設定部307が設定した学習対象領域を基準として切り出し範囲を設定しておいてもよい。そして、入力データ生成部308は、例えば乱数を用いて、切り出す領域の位置、幅、高さなどを切り出し範囲内で決定してもよい。
【0114】
また、入力データ生成部308は、撮影画像から切り出した1つの画像から、形状やサイズが異なる複数の調整画像を生成してもよい。この場合、入力データ生成部308は、予め設定された調整画像の上限幅~下限幅の範囲内で例えば乱数を用いて調整画像の幅を決定してもよい。同様に、入力データ生成部308は、予め設定された調整画像の上限高さ~下限高さの範囲内で例えば乱数を用いて調整画像の高さを決定してもよい。
【0115】
この他にも、入力データ生成部308は、例えば、解像度がそれぞれ異なる複数の調整画像を生成してもよい。この場合、解像度は、所定の上限~下限の範囲内において、例えば乱数を用いて決定してもよい。これらの各構成によれば、教師データのバリエーションを増やして、学習精度を向上させることができる。
【0116】
S16では、回転画像生成部309が、S15で生成された調整画像を回転させて回転画像を生成する。また、回転画像生成部309は、回転前の調整画像の検出対象情報を、回転画像の生成時の回転角度に応じた内容に修正して、回転画像の検出対象情報とする。
【0117】
S17(学習ステップ)では、学習部310が、S15で生成された調整画像と、S16で生成された回転画像とを用いて機械学習を実行して検出モデルを生成し、これにより学習処理は終了する。
【0118】
(監視処理の流れ)
情報処理装置1による危険領域の監視処理の流れを
図8に基づいて説明する。
図8は、情報処理装置1による危険領域の監視処理の例を示すフローチャートである。この監視処理には、情報処理装置1による領域設定方法が含まれている。
【0119】
S21では、画像取得部101が、撮影装置5が撮影した撮影画像を取得する。また、S22(傾斜角度特定ステップ)では、傾斜角度特定部102が、傾斜計7で計測されたブームCR3の傾斜角度を特定する。
【0120】
S23では、縮尺特定部103が、S21で取得された撮影画像について、S22で特定された傾斜角度に応じた縮尺を特定する。傾斜角度から縮尺を特定する方法は上述した通りであるから、ここでは説明を繰り返さない。
【0121】
S24では、対象検出部107が、S21で取得された撮影画像からフックCR5を検出する。フックCR5の検出には、学習装置3が機械学習により生成した検出モデルを用いればよい。また、この検出モデルはフックCR5のみを検出するものであってもよいし、フックCR5と人を検出するものであってもよい。なお、S24の処理は、S22~S23の処理よりも先に行ってもよいし、それらの処理と並行して行ってもよい。
【0122】
S25(領域設定ステップ)では、領域設定部105が、S23で特定された縮尺を適用して、S21で取得された撮影画像中に、実寸法で所定のサイズとなる危険領域を設定する。なお、S25では、S24で検出されたフックCR5の位置を基準として危険領域が設定される。S25では、例えば、領域設定部105は、フックCR5の位置を中心とする、一辺が実寸法で5メートルの正方形の危険領域を設定してもよい。
【0123】
S26では、入力データ生成部106が、S21で取得された撮影画像から、S25で特定された危険領域を切り出し、サイズ調整して調整画像を生成する。そして、S27では、対象検出部107が、人の検出モデルにS26で生成された調整画像を入力する。
【0124】
S28では、対象検出部107は、学習済みモデルすなわち学習装置3が生成した人の検出モデルの出力値に基づいて、危険領域から人が検出されたか否かを判定する。例えば、対象検出部107は、人の検出モデルの出力値が閾値以上であれば人が検出されたと判定し、閾値未満であれば人が検出されていないと判定すればよい。S28で人が検出されたと判定した場合(S28でYES)にはS28の処理に進み、検出されていないと判定した場合(S28でNO)にはS21の処理に戻る。
【0125】
S29では、対象検出部107は、S28で人を検出したと判定した撮影画像の直前に撮影された所定数の撮影画像において、危険領域内に人が検出されていないか判定する。ここで検出されていないと判定した場合(S29でYES)にはS30の処理に進み、検出されていると判定した場合(S29でNO)にはS21の処理に戻る。
【0126】
S30では、警報部109が警報を行う。また、S31では、侵入回数カウント部108が、危険領域への人の侵入回数を1加算する。この後、処理はS21に戻る。なお、S30およびS31の処理は並行して行ってもよいし、S31の処理を先に行ってもよい。
【0127】
以上のように、情報処理装置1は、危険領域内の検出対象(上記の例では人)を検出する対象検出部107と、危険領域内に検出対象が検出された場合に警報を行う警報部109と、を備えている。そして、領域設定部105は、撮影画像から検出されたフックCR5の位置を基準として危険領域を設定する。
【0128】
情報処理装置1を用いてクレーンCRの吊荷の落下事故を未然に防ぐための監視・警報を行う場合、必要性が高い領域を重点的に監視することが好ましい。そこで、上記の構成によれば、撮影画像から検出されたフックCR5の位置を基準として危険領域を設定する。これにより、フックCR5が揺れてその位置が変わった場合や、撮影装置5の撮影方向がずれてしまった場合等にも、警報を適切に行うことができる。また、上記の構成によれば、検出対象を検出する範囲を危険領域内に限定できるから、撮影画像全体の中から検出対象を検出する場合と比べて、効率よくかつ正確に検出対象を検出することが可能になる。
【0129】
また、以上のように、情報処理装置1は、危険領域内に検出対象(上記の例では人)が侵入した回数をカウントする侵入回数カウント部を備えている。そして、侵入回数カウント部108は、時系列で撮影された複数の撮影画像の1つにおける危険領域内に検出対象が検出された場合、当該撮影画像の直前に撮影された所定数の撮影画像で当該危険領域内にその検出対象が検出されていないことを条件として、侵入回数を1回増加させる。詳細は
図9に基づいて説明するが、この構成によれば危険領域への侵入回数を正しくカウントすることができる。
【0130】
なお、S30では、吊荷がないかあるいは落下事故の危険性の低い軽量の吊荷の場合には警報を行わないようにしてもよい。吊荷の有無や吊荷の重量の検出方法は特に限定されない。例えば、クレーンCRに吊荷の重さを測定する荷重計(ロードセル)が設置されている場合、この荷重計の計測値を情報処理装置1に入力してもよい。そして、警報部109は、入力された計測値が閾値(例えば1t)以上である場合にのみ警報を行ってもよい。
【0131】
(警報の例)
図9は、
図8の処理により警報を行った例を示す図である。この例では、同図に円で示す危険領域を検出対象である人が通過している。この例のように危険領域の形状は円形であってもよい。無論、危険領域の形状は任意に設定すればよく、例えば、矩形としてもよいし、多角形としてもよいし、楕円としてもよい。
【0132】
図9の例において、人は位置P1からP9まで移動しており、各位置にてこの人が撮影されている。ただし、全ての位置で撮影された撮影画像からこの人の検出に成功した訳ではなく、同図に破線の枠囲みで示す位置のみで検出に成功したとする。また、
図8のS29における「所定数」が3であるとする。
【0133】
この場合、人の位置がP3となったときに、
図8のS28で人が検出された(YES)と判定される。そして、位置P1~P2では人が検出されたと判定されていないため、続くS29でもYESと判定される。その結果、人の位置がP3となったときにS30の処理が行われて警報が開始されると共に、S31の処理により危険領域への侵入回数が1加算される。
【0134】
次に、人の位置がP5となったときにも、S28で人が検出された(YES)と判定されるが、2つ前の撮影画像(人が位置P3に居るときの撮影画像)から人が検出されているため、S29ではNOと判定される。その結果、侵入回数は加算されないことになる。
【0135】
同様に、人の位置がP8となったときにも、S28で人が検出された(YES)と判定されるが、3つ前の撮影画像(人が位置P5に居るときの撮影画像)から人が検出されているため、S29ではNOと判定される。その結果、ここでも侵入回数は加算されないことになる。このように、
図8の処理によれば、危険領域への侵入回数を正しくカウントすることができる。
【0136】
なお、警報の終了条件は特に限定されない。例えば、危険領域よりも一回り広い領域から人を検出する構成とし、危険領域の外で人が検出されたときに警報を終了してもよい。これにより、人の位置が
図9のP9となったタイミングで警報を終了することができる。この他にも、例えば、所定回数続けてS28の判定結果がNOであった場合に警報を終了してもよいし、警報開始後、所定時間が経過した時に警報を終了してもよい。
【0137】
また、侵入回数カウント部108は、カウントした侵入回数を集計して出力する機能をさらに備えていてもよい。同様に、警報部109は、警報回数を集計して出力する機能をさらに備えていてもよい。
【0138】
これらの構成によれば、危険領域への侵入回数や警報回数を、クレーンCRを用いた作業の監督者や作業者等に認識させて、監督者に事故防止のための対策を促したり、危険領域に対する作業者の意識を高めたりすることができる。出力態様は特に限定されず、例えば所定期間毎の侵入回数や警告回数をグラフ化して出力してもよい。
【0139】
(高度判定部の判定結果に応じた領域設定)
図10は、高度判定部104の判定結果に応じた領域設定の例を示す図である。
図10の例では、クレーンCRが設置されている平面である上段面から一段下がった平面である下段面もクレーンCRの作業領域となっている。
【0140】
この場合、ブームCR3の傾斜角度が同じであっても、フックCR5の真下が上段面であるか下段面であるかによって、撮影装置5から危険領域を設定する位置までの距離が変わる。このため、
図10に示すように、ブームCR3の傾斜角度が同じであっても、フックCR5の真下が下段面であるときの撮影範囲AR4は、フックCR5の真下が上段面であるときの撮影範囲AR3よりも広くなる。そして、撮影装置5の撮影設定を変更しなければ、撮影範囲がAR4のときの撮影画像に写る危険領域ar4は、撮影範囲がAR3のときの撮影画像に写る危険領域ar3よりも小さくなる。
【0141】
そこで、危険領域を設定する位置の高さとブームCR3の傾斜角度とに応じた縮尺を求めるための相関情報を予め作成しておく。相関情報は、例えば、危険領域を設定する位置の高さおよびブームCR3の傾斜角度と、縮尺との対応関係を示す関数である。
【0142】
これにより、縮尺特定部103は、高度判定部104が判定した高度と、傾斜角度特定部102が特定した傾斜角度とに応じた縮尺を特定することができる。そして、領域設定部105は、高度と傾斜角度とに応じた上記縮尺を適用して危険領域を設定する。この構成によれば、クレーンCRの作業現場に高低差があっても、実寸法で所定のサイズとなる危険領域を常に適切に設定することが可能になる。
【0143】
なお、高度の判定方法は特に限定されない。例えば、
図10の例のように、ブームCR3の向きに応じてフックCR5の真下が上段面か下段面の何れかとなる場合、高度判定部104は、ブームCR3の向きから高度を判定してもよい。また、例えば、撮影装置5から地表面までの距離を計測する距離計を設けておけば、高度判定部104は、距離計の計測値を取得することにより高度を判定することができる。
【0144】
また、検出モデルの機械学習の際に高さを考慮してもよい。この場合、
図6の教師データ生成処理において、撮影画像を撮影したときの、撮影装置5から危険領域を設定する位置までの距離を示す高さ情報を、当該撮影画像と共に保存しておく。なお、高さ情報は自動で生成してもよいし、ユーザが入力してもよい。これにより、
図7の学習処理におけるS13では上記高さ情報に応じた縮尺を特定することができる。
【0145】
〔実施形態2〕
本発明の他の実施形態について以下説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
【0146】
本実施形態では、クレーンCRのフックCR5の下方側を側方から撮影した画像(以下、側方画像と呼ぶ)に危険領域(第2の領域)を設定すると共に、設定した危険領域に立ち入った検出対象(以下の例では人)を検出する例を説明する。詳細は以下説明するが、これらの処理は、
図1に示した側方画像取得部110~側方画像対象検出部112により実行される。
【0147】
図11は、側方画像における危険領域の設定方法を説明する図である。
図11に示すクレーンCRには、そのブームCR3の先端部に撮影装置5が取り付けられていると共に、基部CR2にも撮影装置(第2の撮影装置)9が取り付けられている。撮影装置9は、側方画像を撮影できるように斜め下方に向けて取り付けられている。撮影装置9は、クレーンCRが回動してもフックCR5の下方を撮影し続けられるように、クレーンCRと共に回動することが好ましい。
【0148】
撮影装置5の撮影画像を用いた監視では、実施形態1と同様にしてフックCR5の下方に危険領域を設定する。
図11の例ではフックCR5の真下の位置を中心とした円形の危険領域ar5が設定されている。
【0149】
ここで、
図11の例では、フックCR5に荷が取り付けられている。吊荷の真下に人が居る場合、その人の全体または一部が撮影装置5の死角に入るため、情報処理装置1による検出が困難となる。無論、死角に入る前の段階で検出できれば問題はないが、大型の製品や建造物の製造現場などでは、地面付近に開口部などが設けられている場合があり、そのような開口部が撮影装置5の死角に入る可能性もある。このような場合、開口部から出てきた人を検出することは困難である。
【0150】
このため、本実施形態の情報処理装置1は、側方画像に危険領域を設定すると共に、設定した危険領域に立ち入った人を検出する。これにより、撮影装置5の死角を補って、安全管理をより万全にすることができる。
【0151】
図11には、撮影装置9で撮影した側方画像IMG3についても示している。側方画像IMG3には、フックCR5と吊荷が写っており、危険領域ar6が設定されている。この側方画像IMG3の画像領域に、左右方向をx方向、上下方向をy方向とする座標軸を設定すると、危険領域ar6の中心位置の座標は(x
1,y
1)と表される。以下説明するように、危険領域ar6を設定する際には、まず座標(x
1,y
1)を求め、この座標を基準として、危険領域ar6を設定する。
【0152】
具体的には、まず、側方画像取得部110が、撮影装置9で撮影された側方画像を取得する。そして、側方画像領域設定部111が、側方画像取得部110が取得した側方画像の画像領域中に危険領域ar6を設定する。
【0153】
より詳細には、側方画像領域設定部111は、側方画像の画像領域の中で、フックCR5が検出された位置のx座標を特定する。このx座標の値が上記中心位置の座標のx1である。なお、フックCR5の検出方法は任意であり、例えば機械学習により生成した検出モデルなどを用いて検出してもよい。
【0154】
次に、側方画像領域設定部111は、上記中心位置座標のy
1を算出する。中心位置座標のy
1を算出するにあたり、まず、側方画像領域設定部111は、傾斜角度特定部102が特定した傾斜角度から、撮影装置9からフックCR5までの水平方向の距離d
2を算出する。例えば、
図11のように、ブームCR3の傾斜角度をθ、ブームCR3の長さをLとすれば、d
2=L・cosθと算出される。
【0155】
次に、側方画像領域設定部111は、側方画像IMG3において、撮影装置9からの水平方向の距離がd2=L・cosθの地点が写る位置を特定する。この位置は、撮影装置9から水平方向に所定距離だけ離れた地点が、側方画像IMG3の何れの位置に写るかを示す関数で表せばよい。
【0156】
例えば、
図11の側方画像IMG3には、撮影装置9からの距離がd
1~d
4の地点が写る位置をそれぞれ破線で示している。このように、撮影装置9から水平方向に所定距離だけ離れた地点が、側方画像IMG3の何れの位置に写るかは一意に定まるため、撮影装置9からの水平方向の距離がd
2=L・cosθの地点が写る位置を示す関数を特定することができる。
【0157】
図11の例では、側方画像領域設定部111は、d
2の破線を示す関数を特定すればよい。そして、側方画像領域設定部111は、この関数にx
1を代入することにより算出した値をy
1とする。
【0158】
以上の処理により、危険領域ar6の中心位置座標(x
1,y
1)が求まるので、側方画像領域設定部111は、この座標を基準として危険領域ar6を設定する。例えば、
図11の例では、側方画像領域設定部111は、座標(x
1,y
1)を中心とする破線d
1とd
3で挟まれた危険領域ar6を設定している。
【0159】
そして、危険領域ar6が設定された後、側方画像対象検出部112が、その危険領域ar6内の人を検出する。検出方法は、撮影装置5の撮影画像からの人の検出の際と同様の方法を適用することができる。
【0160】
例えば、入力データ生成部106が、側方画像から危険領域ar6の部分を切り出し、サイズ調整して調整画像を生成してもよい。そして、側方画像対象検出部112が、人の検出モデルに上記調整画像を入力し、その出力値に基づいて人を検出したか否かを判定してもよい。なお、側方画像からの人の検出モデルは、側方画像を教師データとした機械学習で予め生成しておけばよい。
【0161】
以上のように、本実施形態の情報処理装置1は、側方画像の画像領域中に危険領域を設定する側方画像領域設定部111と、設定された上記危険領域内の検出対象(典型的には人)を検出する側方画像対象検出部112と、を備えている。そして、側方画像領域設定部111は、側方画像の画像領域の中で、フックCR5が検出された位置の下方であって、傾斜角度特定部102が特定した傾斜角度から求めた、撮影装置9からフックCR5までの水平方向の距離に対応する位置に危険領域を設定する。
【0162】
この構成によれば、フックCR5の下方側を側方から撮影する撮影装置9で撮影された側方画像の画像領域中に危険領域を設定して、その危険領域内の検出対象を検出する。これにより、撮影装置5で撮影した撮影画像からはフックCR5や吊荷の死角となって状況を把握できないような位置に検出対象が侵入した場合であっても、側方画像からその検出対象を検出することができる。
【0163】
また、上記の構成によれば、側方画像の画像領域の中で、フックCR5が検出された位置の下方であって、傾斜角度特定部102が特定した傾斜角度から求めた、撮影装置9からフックCR5までの水平方向の距離に対応する位置に危険領域を設定する。これにより、側方画像の画像領域のうち、撮影装置5の死角となる位置に対応する領域に危険領域を設定することができる。
【0164】
なお、フックCR5が高い位置にある場合、側方画像にフックCR5が写らないことも想定される。このような場合、撮影装置5の撮影画像からフックCR5を検出し、その撮影画像中におけるフックCR5の位置から、側方画像におけるx1の値を求めてもよい。この場合、撮影装置5の撮影画像におけるフックCR5の位置と、x1の値との対応関係を予め定式化しておけばよい。
【0165】
〔変形例〕
情報処理装置1および学習装置3の制御ブロック(特に、
図1に示す画像取得部101~側方画像対象検出部112、および
図2に示す画像取得部301~学習部310)は、上述したようにソフトウェアによって実現してもよい。また、これらの制御ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現することもできる。
【0166】
情報処理装置1の機能をソフトウェアによって実現する場合、情報処理装置1の各制御ブロックとしてコンピュータを機能させるための情報処理プログラムを用いればよい。この情報処理プログラムをコンピュータに実行させることにより、当該コンピュータを情報処理装置として機能させることができる。
【0167】
同様に、学習装置3の機能をソフトウェアによって実現する場合、学習装置3の各制御ブロックとしてコンピュータを機能させるための学習プログラムを用いればよい。この学習プログラムをコンピュータに実行させることにより、当該コンピュータを学習装置として機能させることができる。
【0168】
また、学習装置3の制御ブロックのうち、傾斜角度特定部303と教師データ生成部305としてコンピュータを機能させるための教師データ生成プログラムを用いてもよい。この教師データ生成プログラムをコンピュータに実行させることにより、当該コンピュータを教師データ生成装置として機能させることができる。
【0169】
ソフトウェアによる実装で使用するプロセッサ(プロセッサ10、30)としては、例えばCPU(Central Processing Unit)を適用することができる。また、プロセッサと共に使用するメモリ(メモリ11、31)は、「一時的でない有形の媒体」であればよい。例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを上記メモリとして用いることができる。また、情報処理装置1および学習装置3は、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して情報処理装置1および学習装置3に供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0170】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0171】
1 情報処理装置
102 傾斜角度特定部
103 縮尺特定部
104 高度判定部
105 領域設定部
107 対象検出部
108 侵入回数カウント部
109 警報部
111 側方画像領域設定部
112 側方画像対象検出部
3 学習装置(情報処理装置、学習装置、教師データ生成装置)
301 画像取得部
302 撮影時刻特定部
303 傾斜角度特定部
307 学習対象領域設定部(領域設定部)
309 回転画像生成部
305 教師データ生成部
310 学習部