(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024082912
(43)【公開日】2024-06-20
(54)【発明の名称】監視システム及び監視方法
(51)【国際特許分類】
H04N 7/18 20060101AFI20240613BHJP
G06T 7/00 20170101ALI20240613BHJP
G01V 8/10 20060101ALI20240613BHJP
【FI】
H04N7/18 K
G06T7/00 610
G01V8/10 S
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022197114
(22)【出願日】2022-12-09
(71)【出願人】
【識別番号】000006655
【氏名又は名称】日本製鉄株式会社
(71)【出願人】
【識別番号】591063202
【氏名又は名称】産業振興株式会社
(74)【代理人】
【識別番号】110002044
【氏名又は名称】弁理士法人ブライタス
(72)【発明者】
【氏名】平野 弘二
(72)【発明者】
【氏名】立溝 信之
(72)【発明者】
【氏名】河村 圭造
(72)【発明者】
【氏名】池田 健児
(72)【発明者】
【氏名】神田 和俊
【テーマコード(参考)】
2G105
5C054
5L096
【Fターム(参考)】
2G105AA01
2G105BB17
2G105EE06
2G105HH05
5C054CA04
5C054CC02
5C054EA05
5C054EA07
5C054FC12
5C054FC14
5C054FE09
5C054FE13
5C054FE16
5C054FE28
5C054GB02
5C054GB04
5C054HA01
5C054HA05
5L096BA02
5L096CA04
5L096DA02
5L096GA08
5L096KA04
(57)【要約】
【課題】撮影された鉄スクラップの画像を用いて禁忌物の有無を判定する処理において、判定精度を向上させることを可能にすること。
【解決手段】監視システムは、運搬装置を用いて鉄スクラップを第1の場所から第2の場所へ移す際に鉄スクラップを撮影する撮影部と、撮影により得られた画像と推定モデルとを用いて、鉄スクラップにおいて除去する対象となる禁忌物が含まれるか否かを示す情報を特定する禁忌物特定部と、禁忌物特定部において禁忌物が含まれると特定された場合に、特定された禁忌物を示す情報を出力する出力部と、を備える。
【選択図】
図4
【特許請求の範囲】
【請求項1】
運搬装置を用いて鉄スクラップを第1の場所から第2の場所へ移す際に前記鉄スクラップを撮影する撮影部と、
撮影により得られた画像と推定モデルとを用いて、前記鉄スクラップにおいて除去する対象となる禁忌物が含まれるか否かを示す情報を特定する禁忌物特定部と、
前記禁忌物特定部において禁忌物が含まれると特定された場合に、特定された前記禁忌物を示す情報を出力する出力部と、
を備える、監視システム。
【請求項2】
前記撮影部は、
前記第1の場所から前記第2の場所までの前記鉄スクラップの運搬中、
前記第2の場所で前記鉄スクラップの荷下ろし中、
前記第2の場所に前記鉄スクラップが荷下ろしされた直後、
前記第1の場所で前記鉄スクラップの荷上げ中、及び、
前記第1の場所から前記鉄スクラップを荷上げした直後、のうち少なくともいずれかの期間に撮影する、請求項1に記載の監視システム。
【請求項3】
前記第1の場所には、鉄スクラップヤード内の所定位置に停車したトラックの荷台上が含まれ、
前記第2の場所には、鉄スクラップ積載場が含まれる、請求項1または2に記載の監視システム。
【請求項4】
前記第1の場所には、鉄スクラップ積載場が含まれ、
前記第2の場所には、鉄スクラップヤード内の所定位置に停車したトラックの荷台上が含まれる、請求項1または2に記載の監視システム。
【請求項5】
前記撮影部の撮影により得られた画像から未検出の禁忌物が含まれている可能性のある領域を限定する抽出を行う領域抽出部をさらに備え、
前記領域抽出部は、前記撮影部で異なるタイミングに撮影された2枚の画像間の差分を取ることで前記領域を限定する、請求項1または2に記載の監視システム。
【請求項6】
前記領域抽出部は、前記2枚の画像の撮影タイミングを、前記運搬装置の動作状態により決定する、請求項5に記載の監視システム。
【請求項7】
運搬装置を用いて鉄スクラップを第1の場所から第2の場所へ移す際に前記鉄スクラップを撮影する撮影ステップと、
撮影により得られた画像と推定モデルとを用いて、前記鉄スクラップにおいて除去する対象となる禁忌物が含まれるか否かを示す情報を特定する禁忌物特定ステップと、
前記禁忌物特定ステップにおいて禁忌物が含まれると特定された場合に、特定された前記禁忌物を示す情報を出力する出力ステップと、
を含む、監視方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、鉄スクラップの監視システム及び監視方法に関する。
【背景技術】
【0002】
近年、地球温暖化問題を背景としてCO2排出量を削減する必要性から、鉄鋼業においては現在主要な製法である高炉法に代わり、電炉法が注目されている。電炉法の主原料は鉄スクラップであるが、銅などのトランプエレメントが混入すると自動車向け鋼板などの高級鋼製造時に割れ等の不良品を発生させる要因になる。またガスボンベなどの密閉物が混入していると電炉内で爆発を引き起こす危険性がある。そのため、鉄スクラップからトランプエレメント含有物や密閉物などを除去する技術が重要である。
【0003】
例えば、特許文献1には、破砕後の鉄スクラップ群をカラーテレビカメラで撮影し、彩度値と色相角値をもとに銅を含有した破砕片を自動識別する技術が開示されている。しかしながら、特許文献1に記載の技術は、検知可能な対象物が銅に限定されている。加えて、モーターのように銅線が内包され外から見えない対象物は検知できない。
【0004】
特許文献2には、トラックの荷台に積載されたスクラップ群をカメラで撮影し、人工知能により撮影データに禁忌物(除去すべき対象物)が映っているか否かを判断し、禁忌物が映っているならば作業者にその旨を知らせ除去させる方法が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平7-253400号公報
【特許文献2】特開2020-176909号公報
【非特許文献】
【0006】
【非特許文献1】Joseph Redmon、他3名、“You Only Look Once: Unified, Real-Time Object Detection”[令和3年5月18日検索]、インターネット〈https://arxiv.org/abs/1506.02640〉
【非特許文献2】Olaf Ronneberger、他2名、“U-Net:Convolutional Networks for Biomedical Image Segmentation”[令和3年5月18日検索]、インターネット〈URL:https://arxiv.org/abs/1505.04597〉
【非特許文献3】Samet Akcay、他2名、“GANomaly:Semi-Supervised Anomaly Detection via Adversarial Training”[令和3年5月18日検索]、インターネット〈https://arxiv.org/abs/1805.06725〉
【非特許文献4】Paul Bergmann、他3名、“Improving Unsupervised Defect Segmentation by Applying Structural Similarity to Autoencoders”、[令和3年5月18日検索]、インターネット〈https://arxiv.org/abs/1807.02011〉
【非特許文献5】Paolo Napoletano、他2名、“Anomaly Detection in Nanofibrous Materials by CNN-Based Self-Similarity”、[令和3年5月18日検索]、インターネット〈https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5795842/〉
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、特許文献2に記載の技術は、トラックの荷台上にある鉄スクラップ群が静止した状態での撮影を前提としている。そのため、鉄スクラップ群を撮影するカメラの画角内に、撮影の邪魔となるリフトマグネットが映っていないタイミングで、静止した状態の鉄スクラップ群を撮影する。リフトマグネットがカメラの画角から外れていることの確認は、位置センサ、作業者、もしくは人工知能により行う。この確認ステップを経て、カメラによる撮影、人工知能による禁忌物有無の判定処理、判定結果の作業者への表示が行われる。
【0008】
このような特許文献2の方法では荷台上のスクラップ群の表面から少し奥に入った物体などは画像に映りにくく、たとえ映ったとしても認識し難いため、禁忌物を見逃す場合がある。そのため、禁忌物の有無の判定処理の精度が低下してしまうおそれがあった。
【0009】
本発明は、上記事情に鑑みてなされたものである。すなわち、撮影されたスクラップ群の画像を用いて禁忌物の有無を判定する処理において、判定精度を向上させることが可能となる技術を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記課題を解決するために、本発明のある観点によれば、運搬装置を用いて鉄スクラップを第1の場所から第2の場所へ移す際に鉄スクラップを撮影する撮影部と、撮影により得られた画像と推定モデルとを用いて、鉄スクラップにおいて除去する対象となる禁忌物が含まれるか否かを示す情報を特定する禁忌物特定部と、禁忌物特定部において禁忌物が含まれると特定された場合に、特定された禁忌物を示す情報を出力する出力部と、を備える監視システムが提供される。
【0011】
また、本発明の別の観点によれば、運搬装置を用いて鉄スクラップを第1の場所から第2の場所へ移す際に鉄スクラップを撮影する撮影ステップと、撮影により得られた画像と推定モデルとを用いて、鉄スクラップにおいて除去する対象となる禁忌物が含まれるか否かを示す情報を特定する禁忌物特定ステップと、禁忌物特定ステップにおいて禁忌物が含まれると特定された場合に、特定された禁忌物を示す情報を出力する出力ステップと、を含む、監視方法が提供される。
【発明の効果】
【0012】
本発明によれば、第1の場所(トラックの荷台等)に静止した状態で置かれた鉄スクラップ群が、第2の場所(鉄スクラップ積載場等)へ移される際(例えば、リフトマグネットによる運搬中、荷上げもしくは荷下ろし中、床やスクラップの山の上等に荷下ろしされた直後、等)に、鉄スクラップ群を撮影する。そのため、第1の場所でしか撮影できない方法と比べて禁忌物を見逃しにくく、撮影されたスクラップ群の画像を用いて禁忌物の有無を判定する処理において、判定精度を向上させることが可能となる。
【図面の簡単な説明】
【0013】
【
図1】本実施形態に係る監視システムの適用例を示す図である。
【
図3】撮影装置が4つのカメラにより構成されている例を示す図である。
【
図4】禁忌物検出装置の機能構成例を示すブロック図である。
【
図5】禁忌物検出対象領域を抽出するための方法を示す図である。
【
図6】禁忌物検出対象領域を抽出するための別の方法を示す図である。
【
図8】学習済モデルの生成に用いられる学習データの一例を示す図である。
【
図9】本実施形態に係る学習済モデル生成処理を説明するためのフローチャートである。
【
図10】本実施形態に係る禁忌物検出処理を説明するためのフローチャートである。
【
図11】運搬中の鉄スクラップを追従した撮影を行う場合の構成例を示す図である。
【
図12B】禁忌物検出対象領域を矩形で示した図である。
【
図13】本実施形態及び変形例における禁忌物検出装置のハードウェア構成の一例を示すブロック図である。
【発明を実施するための形態】
【0014】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0015】
[1.概要]
まず、
図1を参照して、本発明の一実施形態の概要を説明する。
図1は、本実施形態に係る監視システム1の適用例を示す図である。
図1に示すように、監視システム1は、鉄スクラップを監視するシステムであって、例えば、鉄スクラップヤードで用いられる。処理の対象となる鉄スクラップには、主に鉄が多く含まれるものの、鉄以外の物質(例えば銅などの鉄以外の金属)を多く含む物体も含まれる。これらの物質が禁忌物の具体例となる。工場、市中などで発生した鉄スクラップは、トラック2によって鉄スクラップヤードに搬入されると、リフトマグネットなどの運搬装置10を用いて鉄スクラップ積載場3まで運搬された後、鉄スクラップ積載場3に荷下ろしされる。
【0016】
監視システム1において監視の対象となる鉄スクラップは、例えば市中スクラップであってもよいし、自家発生スクラップであってもよい。市中スクラップは、製鉄施設以外の場所で発生した鉄スクラップである。市中スクラップの具体例として、橋、ビル、自動車等の物が解体されることによって生じる鉄スクラップがある。市中スクラップには、例えば自動車工場や船工場等の生産工場において生じる鉄スクラップが含まれてもよい。市中スクラップは、所定の回収者によってトラック2等の移動体を用いて回収され、監視システム1が設置された鉄スクラップヤードに搬入される。同様に、自家発生スクラップも、トラック2等の移動体を用いて回収され、監視システム1が設置された鉄スクラップヤードに搬入される。
【0017】
通常、トラック2の荷台からの鉄スクラップの搬出は、運搬装置10を用いて複数回に分けて行われる。例えば、運搬装置10は、リフトマグネット11を用いて荷台中の鉄スクラップの一部を持ち上げ、鉄スクラップ積載場3まで運搬し、鉄スクラップ積載場3に荷下ろしした後、荷台中の残りの鉄スクラップを搬出するために、荷物の無い状態でリフトマグネット11を鉄スクラップ積載場3からトラック2の位置まで戻す。このような一連の動作を複数回繰り返す。以降、この一連の動作を1サイクルと呼ぶ。
【0018】
トラック2によって搬入されたばかりの鉄スクラップには、製鉄メーカーによって受け入れ禁止となっている禁忌物が混入している可能性がある。このため、鉄の製造等に再利用する前に搬入された鉄スクラップを検品し、禁忌物が混ざっていれば当該鉄スクラップから除去する必要がある。ここで、禁忌物には、銅などの非鉄成分を含むモーター、溶鋼に投入すると爆発の恐れがあるガスボンベなどが含まれる。
【0019】
そこで、本実施形態に係る監視システム1は、第1の場所(
図1に示す例ではトラック2の荷台)に静止した状態で置かれた鉄スクラップ群(以下、単に「鉄スクラップ4」とも言う)が、第2の場所(
図1に示す例では鉄スクラップ積載場3)へ移される際に、鉄スクラップ4を撮影し、撮影された画像を用いて検品を行う。第1の場所としてはトラック2の荷台以外にも、船や貨車の荷台などがありうる。また第2の場所としては鉄スクラップ積載場3以外にも、ギロチン等スクラップ加工装置の入側置場、ベルトコンベア等の運搬装置、スクラップの仮置き場などがありうる。
【0020】
具体的には、本実施形態に係る監視システム1は、(1)リフトマグネット11によってトラック2の荷台から鉄スクラップ4を持ち上げて鉄スクラップ積載場3までの運搬中(持ち上げ中を含む)、(2)鉄スクラップ積載場3で鉄スクラップ4の荷上げもしくは荷下ろし中、及び(3)鉄スクラップ積載場3の床やスクラップの山の上等に鉄スクラップ4が荷下ろしされた直後、のうち少なくともいずれかの期間に鉄スクラップ4を撮影して検品を行う。なお、機械学習や深層学習などの学習処理の技術を用いて、鉄スクラップ中に含まれる禁忌物を検出できる学習済モデルをあらかじめ作成しておく。学習済モデルは、禁忌物の有無に関する値を出力する。学習済モデルは、禁忌物の種類、禁忌物の位置、検出された物が禁忌物である確率を出力してもよい。このような学習済モデルに、上記(1)、(2)、及び(3)のうち少なくともいずれかの期間に新たに撮影された画像を逐次入力して、その都度、禁忌物を検出する。禁忌物が検出された場合には、オペレータにその旨を通知して、禁忌物の除去を促す。
【0021】
例えば、特許文献2の方法ではトラック2の荷台上でしか撮影できないため、荷台上のスクラップ群の表面から少し奥に入った物体などは画像に映りにくく、禁忌物を見逃す場合があった。一方、本実施形態に係る監視システム1は、上述したとおり、トラック2の荷台に置かれた鉄スクラップ4が、運搬装置10によって鉄スクラップ積載場3まで移される際(上記(1)、(2)、及び(3)のうち少なくともいずれかの期間)に鉄スクラップ4を撮影するため、禁忌物が荷台上では鉄スクラップ4の中に埋もれてカメラに映らない位置(例えば、鉄スクラップ4の表面から少し奥)に入っていたとしても、禁忌物を発見できる確率を上げることができる。
【0022】
なお、以上の説明では、トラック2の荷台から鉄スクラップ積載場3へ鉄スクラップ4が移される(搬出される)際に禁忌物が含まれないかを監視する場合について述べたが、本実施形態はかかる例に限られない。例えば、逆に、第1の場所を鉄スクラップ積載場3とし、第2の場所をトラック2の荷台として、鉄スクラップ積載場3からトラック2の荷台へ鉄スクラップ4を移す(搬入、積載)場合にも適用できる。この場合、鉄スクラップ4は、リフトマグネット11により、鉄スクラップ積載場3から荷上げされ、トラック2の荷台まで運搬された後、トラック2の荷台に荷下ろし(搬入)される。本実施形態に係る監視システム1は、この場合、鉄スクラップ積載場3から荷上げ中の鉄スクラップ4(及び/または、荷上げされた直後)、運搬装置10により運搬中の鉄スクラップ4、及びトラック2の荷台に荷下ろし中(及び/または、荷下ろしされた直後)の鉄スクラップ4、のうち少なくともいずれかを撮影する。トラック1台の荷台に搬入される鉄スクラップ4を、少しずつ、複数回に分けて運搬するのはトラック2の荷台から鉄スクラップ積載場3へ鉄スクラップ4を搬出する場合と同様である。
【0023】
以上のように、本実施形態では、鉄スクラップ積載場3からトラック2の荷台へ鉄スクラップ4を移す場合にも適用可能であるが、以下の説明では、特に断らない限り、トラック2の荷台から鉄スクラップ積載場3へ鉄スクラップ3が移される際に、鉄スクラップ4を撮影する場合に限定して記述する。
【0024】
以下、本実施形態に係る監視システム1について詳細に説明する。
【0025】
[2.監視システム1全体の構成]
図1に示すとおり、本実施形態に係る監視システム1は、運搬装置10と、撮影装置20a、20bと、禁忌物検出装置30と、を備える。
【0026】
(運搬装置10)
運搬装置10は、鉄スクラップヤード内の所定位置に停車したトラック2の荷台から荷台中の鉄スクラップの一部を持ち上げ、鉄スクラップ積載場3まで運搬し、鉄スクラップ積載場3に荷下ろす動作を、トラック2の荷台から鉄スクラップが無くなるまで繰り返す。
図1に示す例では、運搬装置10は、リフトマグネット11と、クレーン12と、クレーンレール13と、運搬制御部14と、操作部15と、を備え、磁力によって鉄スクラップ4を吊り上げて運搬可能である。ただし、本発明はかかる例に限定されず、運搬装置10は、例えばベルトコンベア、アーム、重機のような機械装置であってもよく、鉄スクラップ4をトラック2の荷台から鉄スクラップ積載場3まで運搬できるのであればどのような形態でもよい。
【0027】
リフトマグネット11は、筐体内部に磁力を発生する装置を備え、その磁力の強弱を制御することにより、磁性を有する鉄スクラップ4の吸着と吸着解除を行う。クレーン12は、リフトマグネット11をワイヤー等により吊下げ可能な構造を有しており、リフトマグネット11を昇降させる。クレーンレール13は、
図1の紙面奥行方向と左右方向にクレーン12を移動させることが可能なレールを有している。そのため、クレーン12は、クレーンレール13に沿って移動し、鉄スクラップヤードの特定の範囲内であれば位置を自由に変更できる。運搬制御部14は、操作部15からの指示に基づき、リフトマグネット11の磁力の強弱と、クレーン12の昇降及び位置とを制御する。操作部15は、オペレータによる操作を受け付ける操作機構(例えば、操作パネル)を有しており、オペレータの操作に基づきリフトマグネット11とクレーン12を制御するための指示(信号)を運搬制御部14に送信する。
【0028】
(撮影装置20)
撮影装置(撮影部)20は、運搬装置10により運搬中(トラック2の荷台からの持ち上げ中を含む)の鉄スクラップ4を撮影する第1カメラ20aと、鉄スクラップ積載場3へ荷下ろし中もしくは荷下ろしされた直後の鉄スクラップ4を撮影する第2カメラ20bと、から構成される。第1カメラ20a及び第2カメラ20bは、1サイクルあたり少なくとも1回以上、鉄スクラップ4がカメラの視野に入っているタイミングで鉄スクラップ4の撮影を行う。1回の撮影により1枚の静止画が作成される。撮影方法は、1回の撮影に限らず、例えば、連続的に撮影することで動画を作成してもよいし、1サイクルあたり2回以上、異なるタイミングで複数の静止画を作成してもよい。このように作成された静止画または動画は禁忌物検出装置30に出力される。
【0029】
第1カメラ20a及び第2カメラ20bは、いずれか一方を省略することができる。運搬装置10により運搬中の鉄スクラップ4、または鉄スクラップ積載場3へ荷下ろし中(及び/または、荷下ろされた直後)の鉄スクラップ4、のうちいずれかを撮影するだけで、禁忌物が荷台上のスクラップ群の表面から少し奥に入った場合に起こる禁忌物の見逃しを防ぐ効果が得られるためである。
【0030】
ただし、第1カメラ20aと第2カメラ20bとを両方備え、運搬装置10により運搬中の鉄スクラップ4、及び鉄スクラップ積載場3へ荷下ろし中(及び/または、荷下ろされた直後)の鉄スクラップ4、の両方を撮影することがより好ましい。ここで、
図2に、リフトマグネット11の拡大図を示す。
図2に示すように、鉄スクラップ4は、リフトマグネット面11sの中心11cに集中して付着する。したがって、リフトマグネット面11sの中心11cかつリフトマグネット面11sに近い側に付着した鉄スクラップ4は、運搬中は、共にリフトマグネット11に付着して運搬される他の鉄スクラップ4に覆われるため見えにくくなる。一方で、リフトマグネット面11sの中心かつリフトマグネット面11sに近い側に付着した鉄スクラップ4は、鉄スクラップ積載場3へ荷下ろしされる際には一番上に露出するため、見えやすくなる。
【0031】
このように禁忌物検出においては、運搬装置10により運搬中の鉄スクラップ4を視野にとらえる第1カメラ20aと、鉄スクラップ積載場3へ荷下ろし中(及び/または、荷下ろされた直後)の鉄スクラップ4を視野にとらえる第2カメラ20bとが、お互いに補完し、禁忌物の検出確率を高める効果を奏する。なお、上記の説明では、運搬装置10としてリフトマグネット11を例として説明したが、鉄スクラップ4を把持可能な他の運搬装置10でも同様の補完効果が得られる。
【0032】
図3は、撮影装置20が4つのカメラにより構成されている例を示す図である。
図3の上図は、鉄スクラップヤードを側面から見た図であり、
図3の下図は鉄スクラップヤードを上から見た図である。
図3に示す通り、撮影装置20は、リフトマグネット11の下方から鉄スクラップ4を別視点で撮影可能な位置に設けられた第1カメラ20c、第2カメラ20dと、鉄スクラップ積載場3へ荷下ろし中の鉄スクラップ4を撮影可能な第3カメラ20eと、トラック2の荷台の上方に設けられた第4カメラ20fと、により構成されてもよい。撮影装置20が4つのカメラにより構成される場合であっても、それぞれのカメラが静止画または動画を作成する点は、撮影装置20が2つのカメラにより構成されている場合と同様である。
【0033】
(禁忌物検出装置30)
図1に戻り、禁忌物検出装置30は、撮影装置20から得られた画像(静止画、動画を含む)に含まれている禁忌物を学習済モデルによって検出し、その検出結果をオペレータに通知する。
【0034】
以上のような構成により、本実施形態に係る監視システム1は、(1)リフトマグネット11によって第1の場所から鉄スクラップ4を持ち上げて第2の場所までの運搬中(持ち上げ中を含む)、(2)第2の場所で鉄スクラップ4の荷上げもしくは荷下ろし中、(3)第2の場所の床やスクラップの山の上等に鉄スクラップ4が荷下ろしされた直後、(4)第1の場所で鉄スクラップ4の荷上げ中、及び(5)第1の場所から鉄スクラップ4を荷上げした直後、のうち少なくともいずれかの期間に鉄スクラップ4を撮影し、撮影して得られた画像(静止画、動画を含む)を用いて、鉄スクラップ4に含まれる禁忌物を検出し、検出された場合には除去を行う。なお、本願において、荷上げまたは荷下ろしした直後とは、あるサイクルにおいて荷上げまたは荷下ろしに伴って時々刻々動いている鉄スクラップ4の動作が終わり、次のサイクルで次の荷上げまたは荷下ろしが行われるまでの期間を言う。
【0035】
[3.禁忌物検出装置30の機能構成]
次に、禁忌物検出装置30の機能構成について説明する。
図4は、禁忌物検出装置30の一機能構成例を示すブロック図である。
【0036】
図4に示すように、禁忌物検出装置30は、検出制御部31と、出力部32と、モデル生成部33と、モデル出力部34と、データ記憶部35と、を備えている。
【0037】
[検出制御部31]
検出制御部31は、撮影装置20を制御して、画像(静止画、動画を含む)を取得する。検出制御部31は、取得した画像(静止画、動画を含む)を学習済モデル(機械学習により学習済みの学習モデル)に入力して、禁忌物の有無に関する値を取得(特定)する。例えば、禁忌物の種類、位置、及び禁忌物である確率を逐次取得(特定)してもよい。そして、検出制御部31は、取得した禁忌物の有無に関する値(情報)を出力部32に送信する。また、検出制御部31は、取得した禁忌物である確率が所定の閾値を超えたときに、その禁忌物の種類、位置、及び禁忌物である確率を、それぞれ出力部32に送信してもよい。
【0038】
学習済モデルは、例えば、ニューラルネットワーク等のディープラーニング(深層学習)によって生成された学習済モデルである。ディープラーニングの手法としては、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)などの多層のニューラルネットワークを適用することができるが、これに限定されるものではない。
【0039】
検出制御部31は、上記機能を実現するために、より具体的には、画像取得部310と、領域抽出部311、禁忌物特定部312と、判定部313と、を有する。
【0040】
(画像取得部310)
画像取得部310は、撮影装置20を制御して、画像(静止画、動画を含む)を取得する。画像取得部310は、撮影装置20より取得した画像を適切な所定サイズに変換し、領域抽出部311または禁忌物特定部312へ出力する。撮影装置20より取得した画像が適切なサイズとなっている場合は、このサイズ変換処理は省略することができる。なお、画像取得部310は、撮影装置20より取得した画像をデータ記憶部35に保存してもよい。
【0041】
(領域抽出部311)
領域抽出部311は、撮影装置20の撮影により得られた画像(所定サイズに変換された画像)から、それまでに未検出の禁忌物が含まれている可能性のある領域(以後、禁忌物検知対象領域ともいう。)を限定する抽出を行う。禁忌物検知対象領域は、具体的には、運搬装置10で運搬中の鉄スクラップ4が存在する領域や、鉄スクラップ積載場3へ荷下ろされて形成された鉄スクラップ4の山の表面付近の領域のことである。
【0042】
まず、この禁忌物検知対象領域を抽出する理由について説明する。スクラップヤードでは運搬装置10は比較的広い範囲を動き回り、また鉄スクラップ4が積載される場所も比較的広がりを持つ場合が多い。従って、撮影装置20(各カメラ)の視野を広くせざるを得ず、結果として、撮影装置20で取得された画像中おいて鉄スクラップ4や鉄スクラップ4に混入した禁忌物が存在する領域は相対的に小さくなる。このような小さい領域にしか存在しない禁忌物であっても精度よく検出するためには、撮影装置20の視野全体の画像サイズを大きく(解像度を高く)しておく必要がある。画像サイズが大きくなると、後述する禁忌物特定部312で学習済モデルを用いて禁忌物を検出処理する際に、計算量が大きくなる。計算量が大きくなると、高価な計算機が必要になったり、複数の静止画の中から禁忌物を逐次検出するような場合には単位時間あたりの検出処理枚数が低下してしまったりするという問題がある。そこで、撮影装置20の視野の中で、その時点で注目すべき(禁忌物の検出処理をなすべき)領域を限定することが望ましい。
【0043】
次に、禁忌物検知対象領域を抽出する方法について説明する。この領域抽出は、撮影装置20で異なるタイミングに撮影された2枚の画像間の差分を取ることで行うことができる。
図5に、(a)運搬装置10により運搬中の鉄スクラップ4、(b)鉄スクラップ積載場3へ荷下ろし中(もしくは荷下ろされた直後)の鉄スクラップ4、(c)鉄スクラップ積載場3から荷上げ中(もしくは荷上げされた直後)の鉄スクラップ4、それぞれについて画像間の差分の計算例を示す。
【0044】
(a)は
図1の第1カメラ20aで撮影した画像、(b)及び(c)は
図1の第2カメラ20bで撮影した画像である。監視システム全体におけるそれぞれのカメラの視野を、
図1では長方形の点線枠で示している。
図5(a)~(c)のいずれも、左側には、時刻t=Tの画像(実線領域と灰色で塗りつぶされた領域)に、時刻t=T-ΔTにおける運搬装置10(リフトマグネット11とクレーン12)及び搬送中の鉄スクラップ4の輪郭を点線で重畳させて示している。右側は、時刻t=Tの画像と時刻t=T-ΔTの画像で各画素間の輝度を引き算した結果、所定の閾値以上の差分が残った領域を黒の塗りつぶしにより示している。なお、ΔTとしては、所定の時間(例えば、1秒)を設定すればよい。また画像間の差分を取る方法や差分が残った領域の定義方法(例えば、上記閾値の設定の仕方)は、ここで述べた方法に限られない。
【0045】
また、禁忌物検知対象領域を抽出する別の実施形態として、領域抽出部311は、2枚の画像間の差分を取る際に、2枚の画像の撮影タイミングを運搬装置10(具体的にはクレーン12)の動作状態(例えば位置)により決定してもよい。これは、ΔTを運搬装置10の動作状態により決定すると言い換えることもできる。以下、
図6を用いながら具体的に説明する。
図6では上述の
図5と同じ(a)~(c)の各ケースに対して、左から順に、撮影タイミング周辺の運搬装置10の動きを示すタイムチャート、差分処理で引く側の基準画像(取得時刻t=Tb)、差分処理で引かれる側の画像(取得時刻t=Ta)、両画像の差分処理後に残差が残った領域(黒の塗りつぶし領域)、を示している。(a)と(b)では、荷台から鉄スクラップ積載場3への鉄スクラップ4の搬出が複数回(複数サイクル)繰り返されている。(c)では、鉄スクラップ積載場3から荷台への鉄スクラップ4の搬入が複数回(複数サイクル)繰り返されている。
【0046】
まず、鉄スクラップ4の運搬中に禁忌物検出対象領域を抽出する場合について述べる(
図6(a))。基準画像の取得時刻(t=Tb)は、例えば、運搬装置10が荷台から鉄スクラップ4を持上げているときの時刻に決められる。具体的には、リフトマグネット11が第1カメラ20aの視野に入っていなかった時刻を基準画像の取得時刻(t=Tb)として決定できる。すなわち、
図6(a)にTbとして示す時間幅の中のある時刻を基準画像の取得時刻(t=Tb)として決定できる。Tbの時間幅の始まりは、鉄スクラップ積載場3にN回目の荷下ろしを終え荷台に戻る過程で第1カメラ20aの視野からリフトマグネット11が消える瞬間とすればよい。Tbの時間幅の終わりは、荷台から(N+1)回目の持上げを終え鉄スクラップ積載場3へ向かって動くリフトマグネット11が第1カメラ20aの視野に入る瞬間とすればよい。
【0047】
また、基準画像から差し引く画像の取得時刻(t=Ta)は、例えば、運搬装置10が鉄スクラップ4を運搬している最中の時刻に決められる。具体的には、リフトマグネット11が第1カメラ20aの視野の中央に到達した時刻を、基準画像から差し引く画像の取得時刻(t=Ta)として決定できる。
図6(a)の一番右側には、t=TaとTbの両画像間で各画素間の輝度を引き算した結果、所定の閾値以上の差分が残った領域(破線内の黒塗り部分)を示している。
【0048】
次に、鉄スクラップ4を鉄スクラップ積載場3へ荷下ろし中(もしくは荷下ろされた直後)に禁忌物検出対象領域を抽出する場合について述べる(
図6(b))。基準画像の取得時刻(t=Tb)は、例えば、前回(
図6では(N+1)回目)運搬装置10が荷台から鉄スクラップ4を持上げるために動作していたときの時刻に決められる。具体的には、リフトマグネット11が第2カメラ20bの視野に入っていなかった時刻を基準画像の取得時刻(t=Tb)として決定できる。すなわち、
図6(b)にTbとして示す時間幅の中のある時刻を基準画像の取得時刻(t=Tb)として決定できる。Tbの時間幅の始まりは、鉄スクラップ積載場3にN回目の荷下ろしを終え荷台に戻る過程で第2カメラ20bの視野からリフトマグネット11が消える瞬間とすればよい。Tbの時間幅の終わりは、荷台から(N+1)回目の持上げを終え鉄スクラップ積載場3へ向かって動くリフトマグネット11が第2カメラ20bの視野に入る瞬間とすればよい。
【0049】
また、基準画像から差し引く画像の取得時刻(t=Ta)は、例えば、今回(
図6では(N+2)回目)運搬装置10が荷台から鉄スクラップ4を持上げるために動作していたときの時刻に決められる。具体的には、リフトマグネット11が第2カメラ20bの視野に入っていない時刻を基準画像から差し引く画像の取得時刻(t=Ta)として決定できる。すなわち、
図6(b)にTaとして示す時間幅の中のある時刻を基準画像から差し引く画像の取得時刻(t=Ta)として決定できる。Taの時間幅の始まりは、鉄スクラップ積載場3に(N+1)回目の荷下ろしを終え荷台に戻る過程で第2カメラ20bの視野からリフトマグネット11が消える瞬間とすればよい。Taの時間幅の終わりは、荷台から(N+2)回目の持上げを終え鉄スクラップ積載場3へ向かって動くリフトマグネット11が第2カメラ20bの視野に入る瞬間とすればよい。
図6(b)の一番右側には、両画像で各画素間の輝度を引き算した結果、所定の閾値以上の差分が残った領域(黒塗り部分)を示している。
【0050】
最後に、鉄スクラップ4を鉄スクラップ積載場3から荷上げ中に禁忌物検出対象領域を抽出する場合について述べる(
図6(c))。基準画像の取得時刻(t=Tb)は、例えば、前回(
図6ではN回目)運搬装置10がトラック2の荷台へ鉄スクラップ4を荷下ろしするために動作していたときの時刻に決められる。具体的には、リフトマグネット11が第2カメラ20bの視野に入っていなかった時刻を基準画像の取得時刻(t=Tb)として決定できる。すなわち、
図6(c)にTbとして示す時間幅の中のある時刻を基準画像の取得時刻(t=Tb)として決定できる。Tbの時間幅の始まりは、鉄スクラップ積載場3でN回目の荷上げを終え荷台へ向かって鉄スクラップ4を運搬する過程で第2カメラ20bの視野からリフトマグネット11が消える瞬間とすればよい。Tbの時間幅の終わりは、荷台でN回目の荷下ろしを終え鉄スクラップ積載場3に戻る過程でリフトマグネット11が第2カメラ20bの視野に入る瞬間とすればよい。
【0051】
また、基準画像から差し引く画像の取得時刻(t=Ta)は、例えば、今回(
図6では(N+1)回目)運搬装置10がトラック2の荷台へ鉄スクラップ4を荷下ろしするために動作する時刻に決められる。具体的には、リフトマグネット11が第2カメラ20bの視野に入っていない時刻を基準画像から差し引く画像の取得時刻(t=Ta)として決定できる。すなわち、
図6(c)にTaとして示す時間幅の中のある時刻を基準画像の取得時刻(t=Ta)として決定できる。Taの時間幅の始まりは、鉄スクラップ積載場3で(N+1)回目の荷上げを終え荷台へ向かって鉄スクラップ4を運搬する過程で第2カメラ20bの視野からリフトマグネット11が消える瞬間とすればよい。Taの時間幅の終わりは、荷台で(N+1)回目の荷下ろしを終え鉄スクラップ積載場3に戻る過程でリフトマグネット11が第2カメラ20bの視野に入る瞬間とすればよい。
図6(c)の一番右側には、両画像で各画素間の輝度を引き算した結果、所定の閾値以上の差分が残った領域(黒塗り部分)を示している。
【0052】
(a)~(c)のいずれの場合においても、上述したTaやTbのタイミングで撮影した画像の取得が必要になる。このタイミング合わせについては、上述の例では、リフトマグネット11が第1カメラ20aまたは第2カメラ20bの視野に入るかどうかがポイントとなる。そこで、例えば、リフトマグネット11の位置情報を、クレーン運転中の座標情報をもとに計算することで、TaやTbの設定に活用することができる。また、例えば
図6(b)や(c)において、リフトマグネット11の磁力をOFFまたはONするタイミングも、リフトマグネット11の操作情報から取得することができるため、これらの操作情報をTaやTbの設定に活用することができる。また別の手法として、例えば、リフトマグネット11を検知する学習済モデルやパターンマッチング等の画像処理技術を用いれば、リフトマグネット11が撮影装置20の視野に出入りしたタイミングを特定できる。
【0053】
なお、禁忌物検知対象領域を抽出する実施形態として、
図6(a)~(c)を用いながら、2枚の画像間の差分を取る際に、2枚の画像の撮影タイミング(t=Taやt=Tb)を、運搬装置10の動作状態(例えば位置)により決定する方法の一例について述べてきたが、運搬装置の動作状態から2枚の画像の撮影タイミングを選択する方法はかかる例に限定されるものではない。
【0054】
以上のようにして禁忌物検知対象領域を求めた後、領域抽出部311は、元画像から禁忌物検知対象領域に対応する部分(
図5や
図6の一番右の列の黒塗り部分)を切取り(抽出し)、その抽出画像を禁忌物特定部312に出力する。ここで元画像とは、
図5の例であれば時刻t=Tの画像、
図6の例であれば時刻t=Taの画像である。禁忌物検知対象領域の形状が複雑な場合、抽出画像の形状も複雑になり、禁忌物特定部312で行われる学習済モデルを用いた禁忌物検出処理がやりにくくなる場合もある。このため、領域抽出部311は、禁忌物検知対象領域の外接長方形を、新たに禁忌物検知対象領域と定義し、それをもとに画像を抽出し、禁忌物特定部312に出力してもよい。このように抽出された禁忌物検知対象領域の一例を、
図5(a)の禁忌物検知対象領域(
図5(a)の一番右)に、灰色の破線で示す。
【0055】
なお、画像間で各画素間の輝度の差分を取り、所定の閾値以上の差分が残った領域を抽出すると、細かなノイズが残ることもあるが、膨張/収縮処理など公知のノイズ除去するための画像処理手法を適用してノイズを除去してもよい。
【0056】
また、抽出画像のうち運搬装置(搬送器具)10の部分には禁忌物が含まれる可能性はない。そこで、領域抽出部311は、別の画像処理(予め取得された運搬装置10の画像パターンとのマッチング等)により運搬装置10の部分を特定し、この部分を除いた上で禁忌物特定部312に出力してもよい。このように抽出された禁忌物検知対象領域の一例を、
図6(a)の禁忌物検知対象領域(
図6(a)の一番右)に、灰色の破線で示す。
【0057】
なお、領域抽出部311で禁忌物検知対象領域の抽出に供される画像は、画像間の差分を適切に計算できる範囲内で、元画像や元画像と差分を取る画像を低解像度化してもよい。
【0058】
また、領域抽出部311は、機械学習や深層学習などの技術を用いて元画像から禁忌物検知対象領域に対応する部分を抽出してもよいし、画像中の所定の位置、所定のサイズの領域を鉄スクラップの存在領域として設定してもよい。また、領域抽出部311を設けず、画像取得部310で取得された画像をそのまま禁忌物特定部312に出力してもよい。
【0059】
(禁忌物特定部312)
図4に戻り、禁忌物特定部312は、画像取得部310により取得された画像(所定サイズに変換された画像、もしくは領域抽出部311により抽出された領域の画像)を、学習済モデル(機械学習により学習済みの学習モデル)に入力して、禁忌物の有無に関する値を出力(特定)する。例えば、禁忌物特定部312は、禁忌物の種類、位置、及び禁忌物である確率をそれぞれ出力(特定)してもよい。また、禁忌物を検出した時に禁忌物の位置を特定することで、オペレータが当該画像内における禁忌物の場所を目視で即座に確認することが出来る。これにより、オペレータは画像上で禁忌物の位置を短時間で判別でき、監視方法、監視システムの精度をより高めることが出来る。
【0060】
(判定部313)
判定部313は、禁忌物特定部312により特定された禁忌物である確率が所定の閾値を超えているか否かを判定する。そして、判定部313は、禁忌物である確率が所定の閾値を超えたときに、その禁忌物の種類、位置、及び禁忌物である確率を、それぞれ出力部32に送信する。
【0061】
[出力部32]
出力部32は、検出制御部31(判定部132)から送信された情報を出力する。すなわち、出力部32は、禁忌物特定部312により特定された禁忌物である確率が所定の閾値を超えたときに、特定された禁忌物を示す情報として、その禁忌物の種類及び位置をそれぞれ出力する。出力部32は、
図7(i)に示すような禁忌物が検出されたタイミングの画像を出力してもよい。また、
図7(i)や(iii)に示すように、検出された禁忌物の位置を矩形やマーキングで重畳させて出力してもよい。また、出力部32は、
図7(ii)に示すように、学習済モデルにより特定された禁忌物である種類や確率を合わせて出力してもよい。
【0062】
このような出力部32は、文字列、画像等を表示するディスプレイであってもよいし、音声を出力するスピーカであってもよい。なお、出力部32は、禁忌物検出装置30と一体的に設けられてもよいし、禁忌物検出装置30とは離れた位置に独立して設けてもよい。これにより、出力部32の出力を受けたオペレータは、鉄スクラップ4に禁忌物が混入しているおそれがあることを容易かつ正確に知ることができ、適宜、禁忌物を鉄スクラップ4から除去できる。
【0063】
なお、本実施形態において、出力部32は、禁忌物である確率が所定の閾値を超えたときに、特定された禁忌物を示す情報として、その禁忌物の種類、位置、及び禁忌物である確率などを出力する場合について説明したが、本発明はかかる例に限定されない。検出制御部31による禁忌物検出処理にかかる画像が静止画で、例えば1サイクルあたり1回というように禁忌物検出処理頻度が小さい場合は、禁忌物である確率の大小に依らず、禁忌物検出処理を行う全ての画像について禁忌物検出結果を出力し、オペレータに通知してもよい。一方で、検出制御部31による禁忌物検出処理にかかる画像が動画であり、禁忌物検出処理が連続して行われる場合に、その全ての処理結果を出力する際には、その頻度が高いため、運搬装置10(クレーン等)を動かしながら荷台からの搬出操作にあたるオペレータの注意をそらさないような工夫が求められる。
【0064】
なお、本実施形態において、出力部32のディスプレイ等には、運搬装置10により運搬中の鉄スクラップ4が映し出されており、運搬中の鉄スクラップ4に対して禁忌物の位置、確率、種類をさらに表示させてもよい。そのため、オペレータはどのような種類の禁忌物がどの位置に存在しているのか、容易かつ正確に把握することができる。
【0065】
ここで、禁忌物の位置を表示するとは、例えば禁忌物が存在する領域を枠で囲むこととしてもよい。また、禁忌物の種類を表示するとは、例えば、予め設定された禁忌物の種類ごとに枠の色や形状等を変更したり、テキストで禁忌物の種類を表示したりしてもよい。また、禁忌物の確率を表示するとは、例えば、枠で囲まれた領域に禁忌物が存在する確率を数値でディスプレイに表示することとしてもよい。なお、運搬中の鉄スクラップ4をディスプレイに表示させるため、撮影装置20が取得した鉄スクラップ4の画像を随時ディスプレイに表示させることとしてもよい。なお、本実施形態において、禁忌物の位置及び種類に加えて、禁忌物の確率を出力してもよいし、禁忌物の位置及び種類のみを出力することとしてもよい。また、撮影装置20が取得した元の画像だけを出力することとしてもよい。
【0066】
禁忌物の種類の設定の仕方としては、例えば、モーター、ガスボンベ、というように禁忌物が利用される際の機能に応じた設定とすることができるが、かかる例に限定されるものではない。例えば、モーター、ガスボンベ、その他の禁忌物を全てまとめて1種類として扱ってもよい。この場合、禁忌物の種類としては1つになる(例えば「禁忌物」との1種類)。モーター、ガスボンベなど種類を細分化する場合と比較して、得られる情報は少なくなるが、除去すべき禁忌物が存在するとの最低限出力すべき情報は出力することができる。また、禁忌物の種類の設定の仕方は組合せも考えられる。例えば、禁忌物特定部312における学習済モデルの出力では、モーター、ガスボンベなど種類を細分化しておくが、出力部32における出力では、全ての禁忌物を1種類にまとめた形で出力することもできる。全ての禁忌物を1種類にまとめる場合はもちろん、学習済モデルの出力を1クラス(例えば「禁忌物」との1種類)にすることができる。
【0067】
[モデル生成部33]
モデル生成部33は、撮影装置20で撮影された鉄スクラップ4の画像から禁忌物の種類、位置、及び禁忌物である確率を特定する単数あるいは複数の学習モデルを生成する。
【0068】
モデル生成部33は、撮影装置20により撮影された過去の鉄スクラップ4の画像と、その画像に含まれていた禁忌物の種類及び位置を表す情報とが関連付けられた複数のデータを学習データとして、機械学習により、画像中の禁忌物の種類、位置、及び禁忌物である確率を特定するモデルを生成する。
【0069】
図8は、学習モデルの生成に用いられる学習データ(教師データ)の一例を示す図である。モデル生成部33は、撮影装置20により撮影された過去の鉄スクラップ4の画像(
図8の上図に示す元画像)と、その元画像中において禁忌物が存在している正解の領域を特定し得るラベルデータ(
図8の中図、下図に示す画像)とを、学習データのセットとして用いる。例えば、
図8の中図に示すように、予め、元画像に対して人が禁忌物の存在している領域を判定して、禁忌物全体にラベル付け(マーキング)した画像を学習データのセットとして用いる。なお、学習時には人がつけた正解のラベルデータに対して禁忌物である確率が所定の基準値以上(例えば、100%)となるように最適化の目的関数を設定して学習する。
【0070】
なお、ここで用いるラベルデータとしては、元画像データ(
図8の上図)中における禁忌物の位置をマーキングしたマーキング画像データ(
図8の中図)であってもよい。このとき、マーキングした禁忌物の種類を表す情報として、あらかじめ禁忌物ごとに振り分けた輝度値を用いることができる。例えば、0~255段階の輝度値で表されるグレースケール画像をマーキング画像として用いる場合、モーターを輝度50、ガスボンベを輝度100でマーキングするなどして、禁忌物の種類を各画素の輝度値で区別できるようにしてもよい。もちろん、禁忌物の位置を表す情報としては、禁忌物として振り分けた輝度値を有する画素の座標を用いればよい。
【0071】
また、ラベルデータとして、
図8の下図のように画像中の禁忌物の周囲を囲うように作成した矩形情報などを含むテキストデータとしてもよい。例えば、このテキストデータには、禁忌物の位置として矩形の座標データを用い、禁忌物の種類としてその矩形内の禁忌物を識別可能な情報を用いればよい。
【0072】
上記で用いる元画像データには、例えば、jpg、bmp、png等の形式が用いられ、テキストデータには、txt、json、xmlなどの形式が用いられる。
【0073】
なお、
図4に示すように、モデル生成部33は、後述するデータ記憶部35から、学習データを取得する。モデル生成部33によるモデル生成処理の詳細については後述する。
【0074】
[モデル出力部34]
モデル出力部34は、モデル生成部33により生成された学習モデルを出力する。例えば、モデル出力部34は、モデル生成部33により生成された学習モデルを、禁忌物特定部312において禁忌物の種類、位置、及び禁忌物である確率を特定するときに用いることが可能なように、禁忌物特定部312へ出力する。
【0075】
[データ記憶部35]
データ記憶部35は、モデル生成部33が学習モデルを生成する際に用いる学習データを記憶する記憶装置である。データ記憶部35は、撮影装置20により撮影して得られた全ての画像または動画を記憶しておいてもよいし、学習データとして用いる予定の画像または動画のみを記憶しておいてもよい。
【0076】
以上、本実施形態に係る監視システム1の構成について説明した。なお、
図1、
図3、
図4に示す監視システム1の各装置の構成は一例であり、複数の装置の機能を1つの装置が備えてもよく、1つの装置に含まれる複数の機能を異なる装置で実施するように構成することも可能である。例えば、モデル生成部33、モデル出力部34、データ記憶部35などの機能は、それぞれ別の情報処理装置(クラウドサーバ等)に実施させてもよい。
【0077】
[4.学習済モデル生成処理]
以下、本実施形態に係る監視システム1の動作について説明する。最初に、監視システム1において実施される学習済モデル生成処理について説明する。
図9は、本実施形態に係る学習済モデル生成処理を説明するためのフローチャートである。
【0078】
モデル生成部33は、監視システム1を用いて鉄の製造等に再利用する鉄スクラップの中に存在する禁忌物の検出を実施する前に、あらかじめユーザからの指示に基づき学習済モデル生成処理を開始する。もしくは、モデル生成部33は、定期的に学習済モデル生成処理を実行してもよい。
【0079】
(S110:学習データ取得)
本実施形態の学習モデルの学習条件は、モデル条件、データセット条件及び学習設定条件を含む。モデル条件は、ニューラルネットワークの構造に関する条件である。データセット条件は、学習中にニューラルネットワークに入力する学習データの選択条件、それらのデータの前処理や画像の拡張方法の条件等を含む。学習設定条件は、重みやバイアスといったニューラルネットワークのパラメータの初期化条件や最適化方法の条件、損失関数の条件等を含む。ここで、損失関数の条件には正則化関数の条件も含まれる。
【0080】
図9に示すように、学習済モデル生成処理を開始すると、まず、モデル生成部33は、撮影装置20により撮影された画像から鉄スクラップ中に含まれている禁忌物を検出することが可能な学習済モデルの生成に必要な学習データを、データ記憶部35から取得する(S110)。例えば、モデル生成部33は、撮影装置20により撮影された過去の鉄スクラップ4の元画像と、その元画像中に含まれていた禁忌物の種類及び位置を表す情報とが関連付けられた複数のデータを、学習データとして取得する。
【0081】
ここで、禁忌物の位置及び種類を表す情報としては、禁忌物全体にラベル付け(マーキング)したマーキング画像(
図8の中図)であってもよいし、禁忌物を含む矩形領域にラベル付け(矩形生成)した矩形生成画像(
図8の下図)であってもよい。なお、ステップS110において取得する学習データは、禁忌物特定部312で禁忌物の検出に用いる画像と同一の撮影装置20により撮影された画像であることが望ましいが、異なる撮影装置20により撮影された画像であってもよい。また、学習データに用いる画像としては、鉄スクラップ4に紛れている実際の禁忌物を撮影して得た画像が望ましいが、インターネットなどで取得可能な禁忌物の画像(モーターのカタログ画像など)であってもよい。
【0082】
(S120:モデル生成)
次いで、モデル生成部33は、ステップS110により取得した学習データを用いて、機械学習によって、禁忌物を検出可能な学習済モデルを生成する(S120)。
【0083】
モデル生成部33で生成される学習済モデルの形式は、特に限定されるものではないが、例えば、禁忌物が含まれている画像(
図8の上図の元画像)と、その画像中において禁忌物が存在している正解の領域を特定し得るデータ(
図8の中図、下図に示す画像)とが関連付けられた複数のデータを学習データとして、画像中の禁忌物の特徴を学習し、検出時に禁忌物の種類、位置、及び禁忌物である確率を算出するモデルを用いることができる。
【0084】
この形式の学習済モデルを生成する場合は、モデル生成部33は、データ記憶部35から取得した禁忌物が含まれている画像(
図8の上図の元画像)を学習モデル(学習途中の学習モデル)に入力し、その学習モデルが出力する禁忌物の位置(領域)が、禁忌物が存在している正解の位置(
図8の中図、下図に示す画像の禁忌物の位置)に近づくように、また禁忌物の種類とその禁忌物である確率が所定の基準値以上(例えば、100%)となるように、学習モデルを最適化する。これにより学習済モデルが生成される。この形式の学習済モデルを禁忌物の検出に用いる場合、禁忌物の種類、禁忌物の位置(領域)を示す座標データ、確信度を示す確率の値が学習済モデルから出力される(例えば非特許文献1)。
【0085】
モデル生成部33は、機械学習により学習済モデルを生成すると、その学習済モデルをモデル出力部34へ出力する。
【0086】
(S130:モデル出力)
モデル出力部34は、ステップS120にて生成された学習済モデルを、禁忌物特定部312へ出力する(S130)。
【0087】
その後、モデル出力部34は、学習済モデル生成処理を終了する。禁忌物検出装置30は、上記のような学習済モデル生成処理を実行することにより、鉄スクラップに含まれる禁忌物を高い精度で検出判定できる学習済モデルを生成できる。
【0088】
なお、上記の実施形態では、禁忌物検出装置30が学習済モデル生成処理を実行するものとして説明しているが、本発明はかかる例に限定されない。禁忌物検出装置30とは別の独立した装置が、モデル生成部33、モデル出力部34、及びデータ記憶部35の一部または全てを有し、学習済モデル生成処理を実行してもよい。この場合、禁忌物検出装置30は、学習済モデルをその別の独立した装置から取得し、後述する禁忌物検出処理を実行すればよい。
【0089】
[5.禁忌物検出処理]
次に、監視システム1において実施される禁忌物検出処理について説明する。
図10は、本実施形態に係る禁忌物検出処理を説明するためのフローチャートである。
【0090】
検出制御部31は、鉄スクラップヤード内の所定位置にトラック2が停車した後、ユーザからの指示に基づき禁忌物検出処理を開始する。
【0091】
(S210:画像取得)
図10に示すように、禁忌物検出処理を開始すると、まず、画像取得部310は、撮影装置20を制御して、画像(静止画、動画を含む)を取得する(S210)。なお、鉄スクラップ4の撮影は、(1)リフトマグネット11によって第1の場所(トラック2の荷台)から鉄スクラップ4を持ち上げて第2の場所(鉄スクラップ積載場3)までの運搬中(持ち上げ中を含む)、(2)第2の場所で鉄スクラップ4の荷上げもしくは荷下ろし中、(3)第2の場所の床やスクラップの山の上等に鉄スクラップ4が荷下ろしされた直後、(4)第1の場所で鉄スクラップ4の荷上げ中、及び(5)第1の場所から鉄スクラップ4を荷上げした直後、の少なくともいずれかの期間に行われる。画像取得部310は、撮影装置20より取得した画像を適切な所定サイズに変換し、逐次、領域抽出部311へ出力する。撮影装置20より取得した画像が適切なサイズとなっている場合は、このサイズ変換処理は省略することができる。
【0092】
(S220:領域抽出)
ここで、ステップS210で取得した画像は、鉄スクラップ4を含む検品作業現場全体が視野に入るような広い範囲が映る画像であることが多い。そこで、領域抽出部311は、それまでに未検出の禁忌物が含まれている可能性のある領域(禁忌物検知対象領域)を限定する抽出を行う(S220)。禁忌物検知対象領域は、具体的には、運搬装置10で運搬中の鉄スクラップ4が存在する領域や、鉄スクラップ積載場3へ荷下ろされ、鉄スクラップ4の山の表面付近の領域である。例えば、領域抽出部311は、上述した手法により禁忌物検知対象領域を特定し、撮影装置20から取得した画像のうち、特定した禁忌物検知対象領域のみを抽出してから、禁忌物特定部312へ出力する。ここで、禁忌物検知対象領域は、ピクセル毎に定められた領域としてもよいし、単純な矩形により定められた領域としてもよい。なお、ステップS220の処理は省略可能であり、その場合は、画像取得部310が、取得した画像を直接禁忌物特定部312へ出力すればよい。
【0093】
(S230:禁忌物特定)
次いで、禁忌物特定部312は、領域抽出部311から出力された複数の画像を、上述した学習済モデル生成処理でモデル生成部33が生成した学習済モデルに入力して、禁忌物の種類、位置、及び禁忌物である確率をそれぞれ特定する(S230)。このとき、禁忌物特定部312は、画像から1つでも禁忌物を特定できた場合には(S230:YES)、学習済モデルから出力された禁忌物の種類、位置、及び禁忌物である確率を判定部313に出力して、処理をステップS240に進める。一方で、禁忌物特定部312は、画像から1つも禁忌物を特定できなかった場合には(S230:NO)、処理をステップS270に進める。
【0094】
(S240:判定)
判定部313は、禁忌物特定部312より禁忌物の種類、位置、禁忌物である確率などの情報を受け取ると、禁忌物である確率が所定の閾値(例:80%)を超えているか否か判定する(S240)。このとき、判定部313は、禁忌物である確率が所定の閾値を超えている場合には(S240:YES)、その禁忌物の種類、位置、及び禁忌物である確率を、それぞれ出力部32に送信して、処理をステップS250に進める。一方で、判定部313は、禁忌物である確率が所定の閾値以下である場合には(S240:NO)、処理をステップS270に進める。
【0095】
(S250:判定結果出力)
出力部32は、判定部313から出力された出力結果を受け取ると、オペレータ(検品作業者)に対し、その出力結果を出力する(S250)。このように、出力部32は、禁忌物である確率が所定の閾値を超えたときに、その禁忌物の種類、位置、及び禁忌物である確率をそれぞれ出力しているため、必要なときに限って禁忌物の除去をオペレータに促している。また、出力部32は、禁忌物である確率が所定の閾値を超えたときに、その禁忌物の種類、及び位置をそれぞれ出力するものとし、禁忌物である確率を出力しなくてもよい。また、ステップS250では、出力部32は、禁忌物の検出の際に学習済モデルに入力された画像(
図7(i))だけを出力してもよい。また、その画像に禁忌物の位置を重畳する形で、
図7(ii)に示すマーキング画像や
図7(iii)に示す矩形生成画像を出力してもよい。
【0096】
なお、本実施形態において、出力部32は、禁忌物である確率が所定の閾値を超えたときに、その禁忌物の種類、位置、及び禁忌物である確率などを出力する場合について説明したが、本発明はかかる例に限定されない。禁忌物検出処理にかかる画像が静止画で、例えば1サイクルあたり1回というように禁忌物検出処理頻度が小さい場合は、禁忌物である確率の大小に依らず、禁忌物検出処理を行う全ての画像について禁忌物検出結果を出力し、オペレータに通知してもよい。一方で、禁忌物検出処理にかかる画像が動画であり、禁忌物検出処理が連続して行われる場合に、その全ての処理結果を出力する際には、その頻度が高いため、運搬装置10(クレーン等)を動かしながら荷台からの搬出操作にあたるオペレータの注意をそらさないような工夫が求められる。
【0097】
(S260:禁忌物除去)
出力部32の出力を受けたオペレータは、鉄スクラップ4に禁忌物が混入しているおそれがあることを知ると、鉄スクラップ4に含まれている禁忌物の除去を行う(S260)。これにより、未検品の鉄スクラップ4から禁忌物が除去された検品済の鉄スクラップ4が生成される。ここでの除去の作業は、一度地面に禁忌物を含む鉄スクラップ群を広げ、人手、重機、ロボットなどを用いて除去される。除去後、オペレータの操作に従って、除去作業の終了を検出制御部31へ通知し、検出制御部31は、処理をステップS270に進める。
【0098】
(S270:運搬作業)
処理がステップS270に進むと、例えば、出力部32は、オペレータに運搬作業の開始、継続、もしくは再開を促す通知を行う。運搬制御部14は、操作部15からの指示に基づき、リフトマグネット11とクレーン12を制御して、鉄スクラップ4の運搬を開始、継続、もしくは再開する。禁忌物を特定できなかった場合(S230:NO)や、特定できたとしても禁忌物である確率が所定の閾値を超えなかった場合(S240:NO)は、オペレータへ何の通知も表示もなすことなく、運搬作業を継続することが可能である。この場合は禁忌物特定ステップを終えた鉄スクラップ4がそのまま(禁忌物が除去されずに)検品済の鉄スクラップ4となる。
【0099】
(S280:終了判定)
上記のステップS210からS270までのステップは、トラック2の荷台から、鉄スクラップ4がなくなるまで繰り返される(S280:YES)。
【0100】
トラック2の荷台から鉄スクラップ4がなくなると(S280:NO)、検出制御部31は、禁忌物検出処理を終了する。
【0101】
以上で述べた、本実施形態に係る禁忌物検出処理フローによると、(1)リフトマグネット11によってトラック2の荷台から鉄スクラップ4を持ち上げて鉄スクラップ積載場3までの運搬中(持ち上げ中を含む)、(2)鉄スクラップ積載場3で鉄スクラップ4の荷上げもしくは荷下ろし中、(3)鉄スクラップ積載場3の床やスクラップの山の上等に鉄スクラップ4が荷下ろしされた直後、(4)鉄スクラップ積載場3で鉄スクラップ4の荷上げ中、及び(5)鉄スクラップ積載場3から鉄スクラップ4を荷上げした直後、の少なくともいずれかの期間に鉄スクラップ4を撮影するため、トラック2の荷台上では禁忌物がスクラップ群の表面から少し奥に入っていた場合であっても、禁忌物を発見できる確率を上げることができる。
【0102】
[6.変形例]
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0103】
[6-1.撮影装置及び撮影される画像の変形例]
例えば、上記実施形態では、撮影装置20の撮影方向と撮影倍率は固定として撮影しているが、本発明はかかる例に限定されない。例えば、撮影装置20は、運搬装置10により運搬中の鉄スクラップ4の位置及び運搬装置10の操作に関する少なくともいずれかの情報に基づいて撮影方向(アングル)及び撮影倍率(ズーム倍率)を逐次調整して、運搬中の鉄スクラップ4を追従した撮影を行えるようにしてもよい。特に、撮影倍率を調整した場合には、画角中に占める鉄スクラップ4の存在領域の割合を高くできるため、画像から禁忌物検出対象領域を抽出するステップを省略でき、従って処理時間を短縮することができる。
【0104】
図11は、運搬中の鉄スクラップ4を追従した撮影を行う場合の構成例を示す図である。例えば、
図11に示すように、リフトマグネット11に現在位置を特定可能なセンサ(GPSなど)11aが取り付けられる。そして、禁忌物検出装置30の検出制御部31は、センサ11aの最新の情報(リフトマグネット11の現在位置)を用いて、鉄スクラップ4の位置を特定する。これに応じて、撮影装置20は、撮影方向(アングル)及び撮影倍率(ズーム)を逐次調整してもよい。
【0105】
また、検出制御部31は、リフトマグネット11とクレーン12を制御するために操作部15に入力された指示情報及びリフトマグネット11の特徴を学習させた学習済モデルから得られる画像中のリフトマグネット11の位置情報などを取得し、これらの情報のうちいずれかまたは複数の組み合わせを利用することにしてもよい。
【0106】
[6-2.禁忌物検出対象領域の抽出に関わる変形例]
禁忌物検出対象領域の抽出として、公知の物体検出モデル(例えば、非特許文献2)を使用して、リフトマグネット11と鉄スクラップ4の領域を特定し、抽出された禁忌物検出対象領域の画像を上述の学習済モデルに入力してもよい。また、リフトマグネット11等の座標をオペレータの操作情報から取得し、予めどの座標であれば画像中のどこの位置にリフトマグネット11や鉄スクラップ4が存在するかの対応付け情報を準備しておき、その対応付け情報に基づき、禁忌物検出対象領域を抽出してもよい。また、時系列的に連続する複数の画像の情報から禁忌物検出対象領域を検出してもよい。
【0107】
図12Aは、禁忌物検出対象領域を示した図である。
図12Aに示すように、禁忌物検出対象領域は、ピクセル毎に定められた領域とすることができる。なお領域抽出部311で禁忌物検出対象領域を抽出する学習済モデルに入力される画像は、禁忌物特定部312で用いる学習済モデルに入力される画像と比べて低解像度でよく、従って処理時間も短くなる。よって、領域抽出部311が無い場合と比較した際に、領域抽出部311を追加することで全体の処理時間が長くなることはない。
【0108】
また、
図12Bは、禁忌物検出対象領域を矩形で示した図である。
図12Bに示すように、領域抽出部311は、禁忌物検出対象領域を矩形で表現した矩形情報(例えば、矩形の位置を示す座標データ)を出力する学習済モデルを用いて、禁忌物検出対象領域を特定し、禁忌物特定部312に出力してもよい。このとき、領域抽出部311から禁忌物特定部312へは、元画像と禁忌物検出対象領域に対応する矩形情報をセットとして出力してもよいし、矩形情報をもとに禁忌物検出対象領域を元画像から切り取った画像のみ出力してもよい。
【0109】
[6-3.学習済モデルの変形例]
上記では、
図8の中段及び下段に示すような学習データを用いて学習済モデルを生成する場合について説明した。したがって、学習済モデルは、
図8の中段または下段に示すように禁忌物の種類や位置情報を出力する。
図8中段のように画素単位で禁忌物の有無や種類を出力するモデルはセグメンテーションモデルと呼ばれる(例えば、非特許文献2)。また、
図8下段のように、ある禁忌物が存在する場合にその位置を矩形で出力するモデルは物体検出モデルと呼ばれる(例えば、非特許文献1)。しかし、本発明に係る学習済モデルの種類はこれらに限定されず、例えば以下に示すようなモデルであってもよい。
【0110】
[6-3-1.異常検知モデル]
例えば、学習済モデルは、非特許文献3~5のように、正常時の画像(以下、「正常画像」ともいう。)を学習し正常からのズレを異常として検知する異常検知モデルであってもよい。この場合、学習データの収集では、禁忌物の映っていない正常画像と禁忌物が映っている異常時の画像(以下、「異常画像」ともいう。)とを振り分けるだけでよく、矩形やマーキングのような禁忌物の種類及び位置を示すラベルデータを画像に関連付ける必要はない。異常検知モデルの出力は各画像の異常度や異常と判定された画像中の部位となる。異常度の算出には、例えばリカレントニューラルネットワーク(RNN)等のような、画像の時系列性をも考慮するアルゴリズムを用いてもよい。例えば、過去の判定結果等を現在の入力に加えることで、現在判定したい画像の出力精度を向上させることができる。異常検知モデルを用いた場合には、一定の異常度を上回った際の画像が、オペレータ(作業者)へ出力される。当該画像と合わせて、異常度も出力してもよい。例えば、異常度の値が0.0~1.0の範囲に入るように規格化し、その異常度を禁忌物である確率と見做してもよい。
【0111】
[6-3-2.2クラス分類モデル(正常、異常での分類)]
また、学習済モデルは、画像を、禁忌物の映っていない正常画像と禁忌物が映っている異常画像との2クラスに分類する2クラス分類モデルであってもよい。上記異常検知モデルと異なり、禁忌物の映っていない正常画像を用いて正常のスクラップを正常として分類するようにモデルを生成するだけでなく、禁忌物が映っている異常画像を明示的に異常として分類するようにモデルを生成することで、画像を正常画像と異常画像との2クラスに分類する。当該2クラス分類モデルの出力には、画像の時系列性をも考慮するアルゴリズムを用いてもよい。オペレータ(作業者)へは、異常画像に分類された画像が出力される。当該画像と合わせて、正常画像である確率や異常画像である確率のうち少なくともいずれか一方を出力してもよい。
【0112】
[6-3-3.多クラス分類モデル(異物を含む画像を禁忌物の種類で分類)]
あるいは、学習済モデルは、画像を、禁忌物の種類で分類する多クラス分類モデルであってもよい。多クラス分類モデルは、画像内の位置情報まで出力はしない点が、セグメンテーションモデルや物体検出モデルとは異なる。
【0113】
禁忌物の種類がN個ある場合、多クラス分類モデルは、禁忌物が全くない状況に対応する1クラスを加えた、(N+1)クラスへ画像を分類する。多クラス分類モデルは、(N+1)クラスの画像を用意し、ニューラルネットワークによる学習を行うことにより生成し得る。多クラス分類モデルの出力には、画像の時系列性をも考慮するアルゴリズムを用いてもよい。オペレータ(作業者)へは、N個の禁忌物に対応するクラスである確率(確信度)のうち少なくともいずれか1つが所定の値を上回った際の画像が出力される。当該画像と合わせて、所定の値を超えた確信度を出力してもよい。
【0114】
[6-4.判定部の変形例]
判定部313の変形例として、例えば、第1カメラ(20a、20c)、第2カメラ(20b、20d)、第3カメラ20e、第4カメラ20fごとに得られる画像を別個に扱ってもよい。例えば、単一のカメラが連続的に異なるタイミングで複数回撮影を実施し学習済モデルを用いて処理することで、それぞれのカメラ、タイミングに対し禁忌物の種類、位置、及び禁忌物である確率が出力されてもよい。
【0115】
ここで、現在時刻での禁忌物である確率は、現在時刻での禁忌物である確率、及び現在時刻より過去の複数タイミングでの禁忌物である確率の関数として算出した後、この算出値を禁忌物か否かを判断するための所定の閾値と比較してもよい。例えば、現在時刻からの隔たりが所定の時間範囲に入る複数タイミングでの禁忌物である複数の確率の平均(後方移動平均)、あるいは最大値や最小値などを、現在時刻での禁忌物である確率として算出してもよい。後方移動平均を取ると過検知を抑制することができる。すなわち、あるタイミングで禁忌物以外の物体に対し学習済モデルがたまたま禁忌物である確率が高いと誤って判断を下した場合であっても、過去の複数タイミングで禁忌物である確率が低いと正しく出力していたならば後方移動平均値は低く抑えられることができる。これにより、禁忌物をより正確に特定することが可能となる。
【0116】
また、判定部313の別の変形例として、例えば、第1カメラ(20a、20c)、第2カメラ(20b、20d)、第3カメラ20e、第4カメラ20fごとに得られる画像を組み合わせて扱ってもよい。例えば、現在時刻での禁忌物である確率は、現在時刻に得られた複数のカメラ画像を学習済モデルに同時に入力して得られた結果の値とし、この値を禁忌物か否かを判断するための所定の閾値と比較してもよい。また、現在時刻に得られた複数のカメラ画像を、それぞれ別個に学習済モデルに入力し、その結果得られたそれぞれの禁忌物である確率を合計して、この合計値を禁忌物か否かを判断するための所定の閾値と比較してもよい。
【0117】
このように複数カメラの画像を組み合わせて扱えば、未検知を抑制できる。すなわち、鉄スクラップ4の搬送過程においては、あるカメラの画像には禁忌物の一部しか映らず、それとは別のカメラの画像でも禁忌物の一部しか映らない状況が起こりえる。このような場合に、カメラ毎に算出した禁忌物である確率それぞれの値から禁忌物の有無を判断しても、それぞれの禁忌物である確率は低くなり、禁忌物か否かを判断するための所定の閾値を超えずに未検知となる。一方で、上述のように、各カメラに対する当該禁忌物である確率を組み合わせれば、所定の閾値を上回り、禁忌物を検知可能となる。
【0118】
なお、禁忌物である確率の組み合わせ方については、単純な和を取るのみではなく、各カメラに重み係数を与え、重み付き和を取ってもよい。各カメラ画像から得られる禁忌物である確率は、カメラと鉄スクラップ4との距離等に影響を受け、各カメラ間で信頼度に差が生じるが、この補正を狙うものである。一例として、この信頼度の差をカメラと鉄スクラップとの距離等で指標化し、それらを係数にした重み付き和を取ってもよい。
【0119】
また、禁忌物である確率の算出については、それぞれ上述した、時間方向の複数タイミングにおける確率の処理と、複数カメラに対する確率の処理とを組み合わせてもよい。例えば上述した2つ以上のカメラに禁忌物の一部ずつが映るという現象は、あるカメラに禁忌物の一部が映った後で、別のカメラに禁忌物の一部が映るという時差が生じることがある。この場合、各々の1タイミングで複数カメラに対する禁忌物である確率を組み合わせる(例えば和算)だけでは、全てのタイミングにおいて禁忌物か否かを判断するための所定の閾値を超えずに未検知となってしまう。一方、時間方向の複数タイミングにおける確率の処理まで組み合わせれば、たとえ上述の時差があったとしてもその影響を吸収し、検知することができる。
【0120】
また、上記実施形態では、禁忌物の判定に学習済モデルを用いたが、必ずしも機械学習や深層学習の学習済モデルを使用しなくともよい。例えば、統計処理を行うことによって得られる推定モデルを用いて禁忌物の判定を行ってもよい。例えば、禁忌物を示すパターンを用いたパターンマッチング等の画像処理を行うことによって禁忌物の判定を行ってもよい。この場合、使用されるパターンが推定モデルの一具体例となる。このような推定モデルの一つの具体例が、上述した学習済モデルである。
【0121】
[7.ハードウェア構成]
図13は、上記実施形態及び変形例における禁忌物検出装置30のハードウェア構成の一例を示すブロック図である。
【0122】
禁忌物検出装置30は、1または複数のハードウェアプロセッサ(
図13ではCPU901)と、ROM903、RAM905等の1または複数のメモリとを含む。また、禁忌物検出装置30は、バス907と、入力I/F909と、出力I/F911と、ストレージ装置913と、ドライブ915と、接続ポート917と、通信装置919とを含む。
【0123】
CPU901は、演算処理装置及び制御装置として機能する。CPU901は、ROM903、RAM905、ストレージ装置913、またはリムーバブル記録媒体925に記録された各種プログラムに従って、禁忌物検出装置30内の動作全般またはその一部を制御する。ROM903は、CPU901が使用するプログラムあるいは演算パラメータ等を記憶する。RAM905は、CPU901が使用するプログラム、あるいは、プログラムの実行において適宜変化するパラメータ等を一次記憶する。これらはCPUバス等の内部バスにより構成されるバス907により相互に接続されている。
【0124】
バス907は、ブリッジを介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バスに接続されている。
【0125】
入力I/F909は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ及びレバー等の、ユーザが操作する操作手段である入力装置921からの入力を受け付けるインタフェースである。入力I/F909は、例えば、ユーザが入力装置921を用いて入力した情報に基づいて入力信号を生成し、CPU901に出力する入力制御回路等として構成されている。入力装置921は、例えば、赤外線あるいはその他の電波を利用したリモートコントロール装置、あるいは、禁忌物検出装置30の操作に対応したPDA等の外部機器927であってもよい。禁忌物検出装置30のユーザは、入力装置921を操作し、禁忌物検出装置30に対して各種のデータを入力したり処理動作を指示したりすることができる。
【0126】
出力I/F911は、入力された情報を、ユーザに対して視覚的または聴覚的に通知可能な出力装置923へ出力するインタフェースである。出力装置923は、例えば、CRTディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ELディスプレイ装置及びランプ等の表示装置であってもよい。あるいは、出力装置923は、スピーカ及びヘッドホン等の音声出力装置や、プリンター、移動通信端末、ファクシミリ等であってもよい。出力I/F911は、出力装置923に対して、例えば、禁忌物検出装置30により実行された各種処理にて得られた処理結果を出力するよう指示する。具体的には、出力I/F911は、表示装置に対して禁忌物検出装置30による処理結果を、テキストまたはイメージで表示するよう指示する。また、出力I/F911は、音声出力装置に対し、再生指示を受けた音声データ等のオーディオ信号をアナログ信号に変換して出力するよう指示する。
【0127】
ストレージ装置913は、禁忌物検出装置30の記憶部の1つであり、データ格納用の装置である。ストレージ装置913は、例えば、HDD(Hard Disk Drive)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイスまたは光磁気記憶デバイス等により構成される。ストレージ装置913は、CPU901が実行するプログラム、プログラムの実行により生成された各種データ、及び、外部から取得した各種データ等を格納する。
【0128】
ドライブ915は、記録媒体用リーダライタであり、禁忌物検出装置30に内蔵あるいは外付けされる。ドライブ915は、装着されているリムーバブル記録媒体925に記録されている情報を読み出し、RAM905に出力する。また、ドライブ915は、装着されているリムーバブル記録媒体925に情報を書き込むことも可能である。リムーバブル記録媒体925は、例えば、磁気ディスク、光ディスク、光磁気ディスクまたは半導体メモリ等である。具体的には、リムーバブル記録媒体925は、CDメディア、DVDメディア、Blu-ray(登録商標)メディア、コンパクトフラッシュ(登録商標)(CompactFlash:CF)、フラッシュメモリ、SDメモリカード(Secure Digital memory card)等であってもよい。また、リムーバブル記録媒体925は、例えば、非接触型ICチップを搭載したICカード(Integrated Circuit card)または電子機器等であってもよい。
【0129】
接続ポート917は、機器を禁忌物検出装置30に直接接続するためのポートである。接続ポート917は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)ポート、RS-232Cポート等である。情報処理装置900は、接続ポート917に接続された外部機器927から、直接各種データを取得したり外部機器927に各種データを提供したりすることができる。
【0130】
通信装置919は、例えば、通信網929に接続するための通信デバイス等で構成された通信インタフェースである。通信装置919は、例えば、有線または無線LAN(Local Area Network)、Bluetooth(登録商標)またはWUSB(Wireless USB)用の通信カード等である。また、通信装置919は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、または、各種通信用のモデム等であってもよい。通信装置919は、例えば、インターネットや他の通信機器との間で、例えばTCP/IP等の所定のプロトコルに則して信号等を送受信することができる。また、通信装置919に接続される通信網929は、有線または無線によって接続されたネットワーク等により構成されている。例えば、通信網929は、インターネット、家庭内LAN、赤外線通信、ラジオ波通信または衛星通信等である。
【0131】
以上、禁忌物検出装置30のハードウェア構成の一例を示した。上述の各構成要素は、汎用的な部材を用いて構成されてもよく、各構成要素の機能に特化したハードウェアにより構成されてもよい。禁忌物検出装置30のハードウェア構成は、本実施形態を実施する時々の技術レベルに応じて適宜変更可能である。また、本実施形態は、上記のコンピュータプログラムが記憶されたコンピュータ読み取り可能な記録媒体を備えてもよい。このような禁忌物検出装置30は、例えば複数の情報処理装置を用いて構築されてもよいし、単体の情報処理装置を用いて構築されてもよい。複数の情報処理装置が用いられる場合には、各情報処理装置がネットワークを経由して通信を行うことによって離れた位置に設置されていてもよい。また、禁忌物検出装置30は、鉄スクラップヤードから離れた場所に設置された情報処理装置を用いて構成されてもよい。この場合、撮影装置20と禁忌物検出装置30とはネットワークを介して通信可能に接続されてもよい。
【0132】
[8.実施例]
上記実施形態に係る手法の効果を検証すべく、
図3、
図4に示した監視システム1を用いて、禁忌物を検出するための学習済モデルを生成し、鉄スクラップ中の禁忌物の検出、除去を実施して、その検出率を算出した。本実施例では、禁忌物として最も混入頻度が高いモーターに限定した。モーターを623個用意し、そのうち523個をモデル学習用、100個をスクラップヤードでの禁忌物検出性能の検証用として振り分けた。
【0133】
まず、523個の学習用のモーターについて、モーター1個に対して角度、背景などを変えて2回撮影し合計1046枚の学習用画像を取得した。このときの撮影環境として、モーターを地面に置いて撮影したほか、鉄スクラップ4に意図的に混ぜるなどし、実際の検品時に近い画像を取得した。撮影機材は、禁忌物検出時に用いる監視システム1の撮影装置20と同じ撮影機材を用いて撮影した。この合計1046枚の画像に対し、
図8の下図に示すような画像中の禁忌物の位置、種類及びその確率を示す情報を含むテキストデータ(ラベルデータ)を作成し、元画像とラベルデータを学習用データセットとした。
【0134】
学習済モデルには、深層学習モデルとして周知のYOLOv3(非特許文献1)を用いた。このモデルは、
図7(ii)に示すような、画像とその画像中の禁忌物の周囲を囲うように作成した矩形の情報を学習することで、未知の画像を入力したときにその画像中に含まれる禁忌物の位置を示す矩形の情報を出力するモデルである。つまり本実施例では、モーターが含まれる画像を、すでにモーターを学習済みのモデルに入力することで、画像中の禁忌物の種類(モーター)、その位置を示す矩形の情報、モーターである確率を出力させた。
【0135】
図3に示すように、本実施例では、4台のカメラを用いており、荷台表面に1台、運搬中に2台、スクラップ積載場3での荷下ろし過程に1台、のカメラがそれぞれ設けられている。本実験では、モデルの学習では使用していないテスト用のモーター100個を、正常な鉄スクラップ中に意図的に混ぜた上で、トラック2の荷台からスクラップ積載場3へ荷下ろしを行い、荷台表面、運搬中、スクラップ積載場3での荷下ろし過程のそれぞれで検出できたモーターの個数を調査した。尚、100個のモーターは10個ずつ、10グループに分け、トラック2の荷台にほぼ満載した正常な鉄スクラップ中に1グループ(10個)ずつ混ぜる実験を10回繰り返し、検出できたモーターの個数を10回分積算した。
【0136】
表1に、運搬中及びスクラップ積載場3での荷下ろし過程のそれぞれの監視により検出できたモーターの個数を示す。運搬中については2台の検出結果を合わせる形で示している。100個のモーターそれぞれについて、運搬中を監視する少なくとも一方のカメラが検出できたか否か、スクラップ積載場3での荷下ろし過程を監視するカメラが検出できたか否か、の計4通りのいずれかの結果が得られるので、それら4通りのそれぞれに該当する個数の積算値を示している。
【0137】
【0138】
表1によると、運搬中の検出個数は74個、スクラップ積載場での荷下ろし過程では68個であり、ほぼ7割の検出率であり、それぞれの単独の場所でも一定の検出性能が得られていることが分かる。
【0139】
注目すべきは、いずれかの場所のみで検出できた個数が34個(=14+20)あり、2つの場所での検出が相補的に働くことが分かる。結果として、2つの場所の検出結果を合わせることで検知できた個数は88個となり、ほぼ9割の検出率になる。上述した通り、運搬装置10により運搬中の鉄スクラップ4を視野にとらえる第1カメラ20c、20dと、鉄スクラップ積載場3へ荷下ろし中の鉄スクラップ4を視野にとらえる第3カメラ20eとが、お互いに補完し、禁忌物の検出確率を高める効果が実証された。
【0140】
運搬中、スクラップ積載場3での荷下ろし過程のいずれでも検出できなかった残り12個については、うち6個が荷台を監視するカメラで検出できることが分かり、3か所(荷台、運搬中、スクラップ積載場での荷下ろし過程)の全てで監視することがさらに効果的であることが分かった。
【符号の説明】
【0141】
1 監視システム
2 トラック
3 鉄スクラップ積載場
4 鉄スクラップ
5 鉄スクラップ
10 運搬装置
11 リフトマグネット
12 クレーン
13 クレーンレール
14 運搬制御部
15 操作部
20 撮影装置
20a~20f カメラ
30 禁忌物検出装置
31 検出制御部
32 出力部
33 モデル生成部
34 モデル出力部
35 データ記憶部
310 画像取得部
311 領域抽出部
312 禁忌物特定部
313 判定部
901 CPU
903 ROM
905 RAM
907 バス
909 入力I/F
911 出力I/F
913 ストレージ装置
915 ドライブ
917 接続ポート
919 通信装置
921 入力装置
923 出力装置
925 リムーバブル記録媒体
927 外部機器
929 通信網