(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023181006
(43)【公開日】2023-12-21
(54)【発明の名称】推定装置、学習装置、推定方法、学習方法、推定プログラム及び学習プログラム
(51)【国際特許分類】
G06T 7/11 20170101AFI20231214BHJP
G06T 7/00 20170101ALI20231214BHJP
【FI】
G06T7/11
G06T7/00 350B
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022094730
(22)【出願日】2022-06-10
(71)【出願人】
【識別番号】000006655
【氏名又は名称】日本製鉄株式会社
(71)【出願人】
【識別番号】000191076
【氏名又は名称】日鉄ソリューションズ株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100140774
【弁理士】
【氏名又は名称】大浪 一徳
(74)【代理人】
【識別番号】100134359
【弁理士】
【氏名又は名称】勝俣 智夫
(74)【代理人】
【識別番号】100188592
【弁理士】
【氏名又は名称】山口 洋
(74)【代理人】
【識別番号】100217249
【弁理士】
【氏名又は名称】堀田 耕一郎
(74)【代理人】
【識別番号】100221279
【弁理士】
【氏名又は名称】山口 健吾
(74)【代理人】
【識別番号】100207686
【弁理士】
【氏名又は名称】飯田 恭宏
(74)【代理人】
【識別番号】100224812
【弁理士】
【氏名又は名称】井口 翔太
(72)【発明者】
【氏名】品川 和之
(72)【発明者】
【氏名】淵上 知幸
(72)【発明者】
【氏名】酒井 厚彦
(72)【発明者】
【氏名】後藤 孝一
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096FA06
5L096HA11
5L096KA04
(57)【要約】
【課題】搬送設備から落下した原料の堆積山の高さの推定精度を更に向上させることが可能である推定装置、学習装置、推定方法、学習方法、推定プログラム及び学習プログラムを提供する。
【解決手段】推定装置は、石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数とし、学習用画像における原料の堆積山の領域又は輪郭を目的変数として機械学習された学習済モデルと、範囲が撮像された推定用画像とに基づいて、推定用画像における堆積山の領域又は輪郭を推定する領域推定部と、堆積山の領域又は輪郭に基づいて堆積山の高さを推定する高さ推定部とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数とし、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として機械学習された学習済モデルと、前記範囲が撮像された推定用画像とに基づいて、前記推定用画像における前記堆積山の領域又は輪郭を推定する領域推定部と、
前記堆積山の領域又は輪郭に基づいて前記堆積山の高さを推定する高さ推定部と
を備える推定装置。
【請求項2】
前記領域推定部は、前記堆積山の領域又は輪郭の形状を推定する、請求項1に記載の推定装置。
【請求項3】
石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数として、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成する学習処理部
を備える学習装置。
【請求項4】
前記学習用画像は、前記範囲における水溜まりの画像と、前記範囲における所定輝度以上の明部の画像と、前記範囲における構造物の影部の画像とのうちの少なくとも一つを含む、請求項3に記載の学習装置。
【請求項5】
推定装置が実行する推定方法であって、
石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数とし、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として機械学習された学習済モデルと、前記範囲が撮像された推定用画像とに基づいて、前記推定用画像における前記堆積山の領域又は輪郭を推定するステップと、
前記堆積山の領域又は輪郭に基づいて前記堆積山の高さを推定するステップと
を含む推定方法。
【請求項6】
学習装置が実行する学習方法であって、
石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数として、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成するステップ
を含む学習方法。
【請求項7】
前記学習用画像は、前記範囲における水溜まりの画像と、前記範囲における所定輝度以上の明部の画像と、前記範囲における構造物の影部の画像とのうちの少なくとも一つを含む、請求項6に記載の学習方法。
【請求項8】
コンピュータに、
石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数とし、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として機械学習された学習済モデルと、前記範囲が撮像された推定用画像とに基づいて、前記推定用画像における前記堆積山の領域又は輪郭を推定する手順と、
前記堆積山の領域又は輪郭に基づいて前記堆積山の高さを推定する手順と
を実行させるための推定プログラム。
【請求項9】
コンピュータに、
石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数として、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成する手順
を実行させるための学習プログラム。
【請求項10】
前記学習用画像は、前記範囲における水溜まりの画像と、前記範囲における所定輝度以上の明部の画像と、前記範囲における構造物の影部の画像とのうちの少なくとも一つを含む、請求項9に記載の学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推定装置、学習装置、推定方法、学習方法、推定プログラム及び学習プログラムに関する。
【背景技術】
【0002】
製鉄プロセス(特に、製銑プロセス)では、石炭、コークス又は鉱石等が、原料として使用される。鉱石としては、使用量の概ね8割以上を占める鉄鉱石以外に、石灰石、橄欖(かんらん)岩、硅石、ドロマイト鉱石、等がある。製鉄プロセスでは、このような原料を、搬送設備が処理設備の間で搬送する。処理設備の間の累計距離は長距離である。このため、複数のベルトコンベアと複数の乗り継ぎ設備とを有する搬送設備を用いて、原料が搬送される。
【0003】
ベルトコンベアを有する搬送設備のリターンベルトに付着した原料粉が、リターンベルトから剥離し、搬送設備から落下することがある。剥離落下には様々な原因がある。例えば、原料の剥離落下は、リターンベルトを下支えするロールとリターンベルトとの接触によって発生することがある。また、リターンベルトの振動等によって剥離落下が発生する場合には、リターンベルトに付着した原料の乾燥度に応じて、剥離落下が発生する。このため、原料が落下する位置(堆積山が形成される位置)は不定である。
【0004】
また、搬送設備から床面に原料が落下し、高さが一定以上になった堆積山の頂点が搬送設備の下部に接触することがある。原料の堆積山が搬送設備に接触することは、搬送作業の支障となる。このため、原料の堆積山は定期的に除去される必要がある。
【0005】
点検者は、搬送設備に沿って長距離を定期的に歩行しながら、原料の堆積山の高さを確認する。ここで、堆積山が形成される位置は不定であり、搬送距離も長距離であることから、点検の負荷は多大となっている。そこで、搬送設備の全体をカバーするように1台以上のカメラが搬送設備を撮像し、各カメラによって撮像された画像に基づいて堆積山の高さを判定する技術が検討されている。
【0006】
特許文献1には、原料の堆積をベルトコンベアの不良と見做し、画像による不良監視を行うことが記載されている。また、可視画像を用いて、コンベアベルトの下端から堆積山までの距離を算出することが、特許文献1に記載されている。さらに、カメラの取り付け位置の工夫によって堆積山の上端の位置を検出することが、特許文献1に記載されている。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
搬送設備から落下した原料(石炭、コークス又は鉱石)は、粉状であることが多い。このため、原料の堆積山の形状は不定である。また、堆積山の高さが増す速度は一定でない。
【0009】
仮に、堆積山が撮像された画像に基づいて人が堆積山の高さを推定する場合でも、その推定には特有の技量が必要である。例えば、原料の色は黒色又は灰色であることが多く、且つ、堆積山が形成される位置は搬送設備の影部となることが多いので、黒色又は灰色の原料と影部とが見分けづらく、堆積山の高さの推定には特有の技量が必要である。また、堆積山が形成される位置が照らされても新たな影部が生じるので、黒色又は灰色の原料と新たな影部とが見分けづらく、堆積山の高さを推定することは困難である。
【0010】
特許文献1の方法でも、堆積山の上端の位置が精度よく特定できるとは限らないので、堆積山の高さを精度よく算出できるとは限らない。また、機械学習(教師あり学習)された学習済モデルを単に用いて画像認識が実行され、画像認識の結果に基づいて堆積山の高さが推定される場合も同様である。
【0011】
画像認識用の画像を生成するために設置されたカメラは、堆積山が形成される位置を含む所定の撮像範囲を、動画(時系列の静止画)で撮像する。1台のカメラの撮像範囲は、搬送設備の側面の一部と、搬送設備の背面(上部)の一部と、搬送設備の下部の一部と、搬送設備が設置された床面の一部とを含む。
【0012】
教師データは、学習データと正解ラベルとの組み合わせである。学習データは、堆積山が形成される位置を含む所定の撮像範囲が撮像された静止画である。また、正解ラベルは、堆積山の高さである。正解ラベルにおける堆積山の高さは、堆積山の高さの実測値でもよいし、堆積山の画像に基づいて人が算出した高さでもよい。
【0013】
しかしながら、このような教師データを用いて学習された学習済モデルでは、堆積山の高さの推定精度を向上させることができない。なぜなら、堆積山の頂点以外の位置が堆積物の頂点の位置として、学習済モデルによって誤認識されることがあるからである。このような誤認識の検証実験の一例として、計10箇所の各堆積山が撮影され、堆積山ごとに50~150枚の静止画(計1000枚の静止画)が用意された。また、教師データを用いて機械学習(ディープラーニング)された学習済モデルが、堆積山の画像に基づいて堆積山の高さを推定する画像認識モデルとして生成された。このような検証実験では、高さの推定誤差が3割以内となる確率(正答率)は、一例として、わずか2割以下であった。このように、搬送設備から落下した原料の堆積山の高さの推定精度を向上させることができないという問題がある。
【0014】
上記事情に鑑み、本発明は、搬送設備から落下した原料の堆積山の高さの推定精度を向上させることが可能である推定装置、学習装置、推定方法、学習方法、推定プログラム及び学習プログラムを提供することを目的としている。
【課題を解決するための手段】
【0015】
本発明の一態様は、石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数とし、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として機械学習された学習済モデルと、前記範囲が撮像された推定用画像とに基づいて、前記推定用画像における前記堆積山の領域又は輪郭を推定する領域推定部と、前記堆積山の領域又は輪郭に基づいて前記堆積山の高さを推定する高さ推定部とを備える推定装置である。
【0016】
本発明の一態様は、上記の推定装置であって、前記領域推定部は、前記堆積山の領域又は輪郭の形状を推定する。
【0017】
本発明の一態様は、石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数として、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成する学習処理部を備える学習装置である。
【0018】
本発明の一態様は、上記の推定装置が実行する推定方法であって、石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数とし、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として機械学習された学習済モデルと、前記範囲が撮像された推定用画像とに基づいて、前記推定用画像における前記堆積山の領域又は輪郭を推定するステップと、前記堆積山の領域又は輪郭に基づいて前記堆積山の高さを推定するステップとを含む推定方法である。
【0019】
本発明の一態様は、上記の学習装置が実行する学習方法であって、石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数として、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成するステップを含む学習方法である。
【0020】
本発明の一態様は、コンピュータに、石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数とし、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として機械学習された学習済モデルと、前記範囲が撮像された推定用画像とに基づいて、前記推定用画像における前記堆積山の領域又は輪郭を推定する手順と、前記堆積山の領域又は輪郭に基づいて前記堆積山の高さを推定する手順とを実行させるための推定プログラムである。
【0021】
本発明の一態様は、コンピュータに、石炭、コークス又は鉱石である原料の搬送設備の側面の少なくとも一部を含む範囲が撮像された学習用画像を説明変数として、前記学習用画像における前記原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成する手順を実行させるための学習プログラムである。
【発明の効果】
【0022】
本発明により、搬送設備から落下した原料の堆積山の高さの推定精度を向上させることが可能である。
【図面の簡単な説明】
【0023】
【
図1】第1実施形態における、推定システムの構成例を示す図である。
【
図2】第1実施形態における、撮像範囲の例を示す図である。
【
図3】第1実施形態における、学習用画像の例を示す図である。
【
図4】第1実施形態における、正解ラベルの例を示す図である。
【
図5】第1実施形態における、推定用画像の例を示す図である。
【
図6】第1実施形態における、出力画像の例を示す図である。
【
図7】第1実施形態における、学習装置の動作例を示すフローチャートである。
【
図8】第1実施形態における、推定装置の動作例を示すフローチャートである。
【
図9】第2実施形態における、学習用画像の例を示す図である。
【発明を実施するための形態】
【0024】
本発明の実施形態について、図面を参照して詳細に説明する。
(概要)
教師データでは、学習データ(学習用画像)と正解ラベルとが対応付けられている。以下では、正解ラベルは、学習用画像における堆積山(堆積山画像)の領域の形状を表すラベル情報である。正解ラベルは、学習用画像における堆積山の領域の形状及び位置(分布)を表すラベル情報でもよい。正解ラベルは、学習用画像における堆積山の領域の面積を表すラベル情報でもよい。堆積山の領域の面積と、堆積山の領域の高さとには、ある程度の相関があるからである。すなわち、領域の面積が大きいほどその領域の高さが高くなるという相関がある。また、堆積山の高さは、学習用画像における堆積山の領域の形状に基づいて、算術的な手法(例えば、画像における長さと実測された高さとの比例計算)で導出される。
【0025】
更に、正解ラベルは、堆積山の高さを表すラベル情報を含んでもよい。この場合、堆積山の高さは、学習用画像における堆積山の領域の形状に基づいて、機械学習された学習済モデルの出力として導出されてもよい。
【0026】
(第1実施形態)
図1は、実施形態における、推定システム1の構成例を示す図である。推定システム1は、原料の堆積山が撮像された画像を用いて堆積山の高さを推定するシステムである。原料は、例えば、石炭、コークス又は鉱石である。鉱石としては、鉄鉱石、石灰石、橄欖(かんらん)岩、硅石、ドロマイト鉱石、等が例示される。
【0027】
推定システム1は、N台(Nは、1以上の整数)のカメラ2と、通信回線3と、学習装置4と、推定装置5と、通知用装置6とを備える。学習装置4は、学習用通信部40と、学習用記憶装置41と、学習用記憶部42と、学習処理部43とを備える。推定装置5は、推定用通信部50と、推定用記憶装置51と、推定用記憶部52と、推定処理部53とを備える。推定処理部53は、領域推定部530と、高さ推定部531と、通知部532とを備える。
【0028】
通信回線3は、LAN(Local Area Network)又はWAN(Wide Area Network)等の回線である。
【0029】
学習装置4、推定装置5及び通知用装置6の各装置のうちの一部又は全部は、CPU(Central Processing Unit)等のプロセッサが、不揮発性の記録媒体(非一時的な記録媒体)である記憶装置から記憶部に展開されたプログラムを実行することにより、ソフトウェアとして実現される。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置などの非一時的な記録媒体である。
【0030】
学習装置4、推定装置5及び通知用装置6の各装置のうちの一部又は全部は、例えば、LSI(Large Scale Integration circuit)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)又はFPGA(Field Programmable Gate Array)等を用いた電子回路(electronic circuit又はcircuitry)を含むハードウェアを用いて実現されてもよい。
【0031】
カメラ2は、搬送設備10の側面方向に所定距離だけ離れた位置において、搬送設備10に向けて設置される。カメラ2は、所定の撮像範囲を、例えば動画で撮像する。動画は、時系列の静止画(フレーム)を含む。撮像範囲は、例えば、搬送設備10の側面の少なくとも一部を含む範囲である。カメラ2は、撮像範囲を定期的に静止画で撮像してもよい。カメラ2は、可視光領域について撮像範囲を撮像してもよいし、赤外線領域について撮像範囲を撮像してもよい。カメラ2は、通信回線3を介して、撮像範囲の画像を推定装置5に送信する。
【0032】
学習段階において、撮像範囲の画像は、学習装置4によって学習用画像として用いられる。カメラ2は、通信回線3を介して、撮像範囲の画像を学習装置4に送信する。また、学習段階後の推定段階において、撮像範囲の画像は、推定装置5によって推定用画像として用いられる。
【0033】
図2は、第1実施形態における、撮像範囲100の例を示す図である。搬送設備10は、ベルトコンベアを備える。ベルトコンベアの全長は、例えば50mである。搬送設備10は、ベルト11と、キャリアローラ12と、ヘッドプーリ13と、ベルトクリーナ14と、テンションプーリ15と、リターンローラ16と、テールプーリ17とを備える。夜間において、撮像範囲100は、照明装置(不図示)によって照明されてもよい。
【0034】
搬送設備10は、石炭、コークス又は鉱石等の原料を、ベルト11に載せて搬送する。ここで、原料の一部がベルト11から落下する場合がある。落下した原料は、搬送設備10が設置されている床面に堆積する。これによって、床面の一部には原料の堆積山が形成される。堆積山が形成される位置は不定である。また、堆積山の形状も不定である。
【0035】
図2では、一例として、堆積山101と堆積山102とが、床面の一部に形成される。
図2では、撮像範囲100は、搬送設備10の側面の少なくとも一部を含む範囲である。カメラごとの撮像範囲100は、搬送設備10の側面の一部と、搬送設備10の背面(上部)の一部と、搬送設備10の下部の一部と、搬送設備10が設置された床面の一部とを含む。
図2では、撮像範囲100-1は、カメラ2-1によって撮像される範囲である。撮像範囲100-Nは、カメラ2-Nによって撮像される範囲である。
【0036】
例えば堆積山101の高さが閾値(例えば、2m)を超えた場合、堆積山101の頂点が例えばベルト11の下部に接触することがある。高さが閾値を超えた堆積山101の頂点がベルト11の下部に接触する前に、堆積山101は作業者(不図示)によって除去される必要がある。
【0037】
そこで、推定装置5は、各撮像範囲100における堆積山の高さを推定する。例えば、推定装置5は、堆積山101の高さ(推定値)が閾値以上である場合、所定の情報を通知用装置6に通知する。所定の情報とは、例えば、堆積山101の高さが閾値以上であることを表す警報情報である。作業者(不図示)は、通知用装置6に通知された警報情報を確認することによって、撮像範囲100-1における堆積山101が除去される必要があることを認識する。
【0038】
<学習段階>
カメラ2-n(nは、1からNまでのいずれかの整数)は、搬送設備10の側面の少なくとも一部を含む撮像範囲100-nを撮像する。カメラ2-nは、撮像範囲100-nの画像を、学習用通信部40に送信する。学習用通信部40は、撮像範囲100-nの画像を学習用画像として、カメラ2-nから取得する。
【0039】
図1に示された学習用記憶装置41は、機械学習(教師あり学習)に用いられる教師データを記憶する。教師データは、複数の学習用画像(説明変数)と、複数の正解ラベル(目的変数)とを含む。教師データでは、学習用画像(学習データ)と、正解ラベルとが対応付けられている。教師データは、例えば作成者(不図示)によって予め作成される。学習用記憶装置41は、学習処理部43によって実行される学習プログラムを記憶する。学習用記憶装置41に記憶された学習プログラムは、学習装置4の起動時に、学習用記憶部42に展開される。学習処理部43は、複数の学習用画像と複数の正解ラベルとを含む教師データを、学習用記憶装置41から取得する。
【0040】
図3は、第1実施形態における、学習用画像110の例を示す図である。カメラ2-1は、学習用画像110を生成する。学習用画像110は、撮像範囲100における搬送設備10の側面の画像と、撮像範囲100-1における堆積山101(堆積山画像103)とを含む。
【0041】
図4は、第1実施形態における、正解ラベル111の例を示す図である。正解ラベル111は、学習用画像110における堆積山101(堆積山画像103)の領域の形状及び位置を表すラベル情報である。正解ラベル111は、領域画像200を含む。ここで、堆積山101の領域の形状と、領域画像200の形状とが一致するように、領域画像200の形状は予め定められる。また、学習用画像110における堆積山101の領域の位置と、正解ラベル111における領域画像200の位置とが一致するように、正解ラベル111における領域画像200の位置は予め定められる。
【0042】
正解ラベル111は、学習用画像110における堆積山101(堆積山画像103)の輪郭(輪郭線)を表すラベル情報でもよい。ここで、堆積山画像103の輪郭の形状と領域画像200の輪郭の形状とが一致するように、領域画像200の輪郭の形状は予め定められる。
【0043】
なお、正解ラベル111は、堆積山101の高さ情報を含んでもよい。これによって、学習済モデル(画像認識モデル)の出力として、堆積山の高さの推定結果を得ることが可能である。また、正解ラベル111は、正解ラベル111における領域画像200の頂点201(上端)及び下端の位置情報(座標)を含んでもよい。
【0044】
図1に示された学習処理部43は、学習用画像(説明変数)及び正解ラベル(目的変数)を教師データとして用いる機械学習(教師あり学習)によって、学習済モデルを画像認識モデルとして生成する。機械学習の手法として、例えば、深層学習(ディープラーニング)が用いられる。学習処理部43は、学習モデルのニューラルネットワークのパラメータを例えば誤差逆伝播法で更新することによって、学習済モデルを生成する。例えば、学習用画像110における堆積山101(堆積山画像103)の領域の形状及び位置の推定結果が、正解ラベル111における領域画像200の領域の形状及び位置に対して誤差を有する場合、学習処理部43は、その誤差が少なくなるように、学習モデルのニューラルネットワークのパラメータを更新する。ニューラルネットワークは、例えば、畳み込みニューラルネットワークである。
【0045】
機械学習は、1台のカメラ2(撮像範囲100)ごとに実行されてもよいし、複数のカメラ2(複数の撮像範囲100)ごとに実行されてもよい。学習処理部43は、学習用通信部40を介して、学習済モデルを推定装置5に送信する。
【0046】
<推定段階>
カメラ2-nは、搬送設備10の側面の少なくとも一部を含む撮像範囲100-nを撮像する。カメラ2-nは、撮像範囲100-nの画像を、推定用通信部50に送信する。推定用通信部50は、撮像範囲100-nの画像を推定用画像として、カメラ2-nから取得する。
【0047】
推定用画像は、推定用画像における堆積山の領域又は輪郭の推定に用いられる。堆積山の領域又は輪郭の推定結果は、実空間における堆積山の高さの推定に用いられる。実空間における堆積山の高さの推定には、算術的な手法が用いられてもよいし、機械学習の手法が用いられてもよい。
【0048】
なお、推定用画像には、堆積山の画像が含まれていてもよいし、堆積山の画像が含まれていなくてもよい。推定用画像に堆積山の画像が含まれていない場合、その推定用画像に対応付けられた撮像範囲には堆積山が形成されていないので、堆積山の高さの推定値は零である。
【0049】
推定用記憶装置51は、推定処理部53によって実行される推定プログラムと、学習済モデルとを記憶する。推定用記憶装置51に記憶された推定プログラム及び学習済モデルは、推定装置5の起動時に、推定用記憶部52に展開される。
【0050】
図5は、第1実施形態における、推定用画像120の例を示す図である。カメラ2-1は、推定用画像120を生成する。推定用画像120の撮影時刻は、学習用画像110の撮影時刻よりも後である。推定用画像120は、撮像範囲100-1における搬送設備10の側面の画像と、撮像範囲100-1における堆積山(堆積山画像104)とを含む。
【0051】
領域推定部530は、撮像範囲100が撮像された推定用画像120を、推定用記憶装置51から取得する。領域推定部530は、学習済モデル及び推定用画像120に基づいて、推定用画像120における堆積山(堆積山画像104)の領域又は輪郭を推定する。ここで、領域推定部530は、学習済モデルに推定用画像120を入力する。領域推定部530は、堆積山の領域又は輪郭の推定結果である出力画像を、学習済モデルから取得する。
【0052】
図6は、第1実施形態における、出力画像130の例を示す図である。出力画像130は、領域画像202を含む。領域画像202の形状は、堆積山(堆積山画像104)の領域の形状の推定結果である。出力画像130における領域画像202の位置は、推定用画像120における堆積山の領域の位置の推定結果である。推定用画像120における堆積山の領域の形状及び位置と、出力画像130における領域画像202の形状及び位置とは、機械学習の成果として一致している。
【0053】
高さ推定部531は、出力画像130における領域画像202の高さに基づいて、堆積山の高さを推定する。高さ推定部531は、例えば、領域画像202に対する算術的な手法を用いて堆積山の高さを推定する。算術的な手法とは、例えば、比例計算である。出力画像130における頂点203(上端)から下端までの長さは、実空間における堆積山の高さに比例する。
【0054】
なお、正解ラベルが堆積山の高さ情報を含んでいる場合、高さ推定部531は、推定用画像を入力として高さを出力する学習済モデルを用いて、堆積山の高さを推定してもよい。
【0055】
通知部532は、堆積山の高さが閾値以上であるか否かを判定する。通知部532は、堆積山の高さが閾値以上である場合、所定の情報を通知用装置6に通知する。通知部532は、例えば、堆積山の高さが閾値以上であることを表す警報情報を、所定の情報として通知用装置6に通知する。
【0056】
次に、推定システム1の動作例を説明する。
図7は、第1実施形態における、学習装置4の動作例を示すフローチャートである。学習段階において、学習処理部43は、学習用画像を説明変数として、学習用記憶装置41から取得する(ステップS101)。学習処理部43は、原料の堆積山の領域又は輪郭を目的変数として、学習用記憶装置41から取得する(ステップS102)。
【0057】
学習処理部43は、学習用画像を説明変数とし、学習用画像における原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成する(ステップS103)。学習処理部43は、学習用通信部40を介して、学習済モデルを推定装置5に出力する(ステップS104)。
【0058】
図8は、第1実施形態における、推定装置5の動作例を示すフローチャートである。推定段階において、領域推定部530は、学習済モデルを推定用記憶装置51から取得する(ステップS201)。領域推定部530は、撮像範囲100が撮像された推定用画像を、推定用記憶装置51から取得する(ステップS202)。
【0059】
領域推定部530は、学習済モデルに推定用画像120を入力する(ステップS203)。領域推定部530は、学習済モデルの出力画像130の領域画像202に基づいて、推定用画像120における堆積山(堆積山画像104)の領域を推定する。領域推定部530は、学習済モデルの出力画像130の領域画像202の輪郭に基づいて、推定用画像120における堆積山の領域の輪郭を推定してもよい(ステップS204)。高さ推定部531は、堆積山の領域又は輪郭の推定結果に基づいて、堆積山の高さを推定する(ステップS205)。
【0060】
通知部532は、堆積山の高さが閾値以上であるか否かを判定する(ステップS206)。堆積山の高さが閾値未満であると判定された場合(ステップS206:NO)、推定処理部53は、ステップS202に処理を戻す。堆積山の高さが閾値以上であると判定された場合(ステップS206:YES)、通知部532は、所定の情報を通知用装置6に通知する(ステップS207)。
【0061】
以上のように、学習処理部43は、原料の搬送設備10の側面の少なくとも一部を含む範囲が撮像された学習用画像(例えば、学習用画像110等の複数の画像)を説明変数として、学習用画像における原料の堆積山の領域又は輪郭を目的変数として用いる機械学習によって、学習済モデルを生成する。領域推定部530は、このような学習済モデルを取得する。領域推定部530は、搬送設備10の側面の少なくとも一部を含む範囲が撮像された推定用画像(例えば、推定用画像120)と学習済モデルとに基づいて、推定用画像における堆積山の領域又は輪郭を推定する。高さ推定部531は、堆積山の領域又は輪郭に基づいて堆積山の高さを推定する。
【0062】
これによって、搬送設備から落下した原料の堆積山の高さの推定精度を向上させることが可能である。例えば、高さの推定誤差が3割以内となる確率(正答率)を、一例として8割以上に向上させることが可能である。清掃が必要になった場合に堆積物を除去することが可能であることから、清掃の監視負荷及び頻度を低減することが可能である。
【0063】
(第2実施形態)
第2実施形態では、教師データにおける複数の学習用画像のうちの1枚以上の学習用画像に所定の外乱因子が撮像されている点が、第1実施形態との相違点である。第2実施形態では、第1実施形態との相違点を中心に説明する。
【0064】
図9は、第2実施形態における、学習用画像112の例を示す図である。学習用画像112は、堆積山の高さの推定に関する外乱因子を含む。例えば、風で原料が舞い上がることを防止する目的で、搬送設備10が設置されている床面に大量の水がまかれることがある。外乱因子は、例えば、撮像範囲100における水溜まりの画像である。水溜まり(水面)に反射された画像には、明部と構造物の暗部と映り込むことがある。構造物の暗部と原料の堆積山の色とがいずれも黒色系であることから、構造物の暗部と原料の堆積山の黒色との識別は困難である。また、時間の経過とともに水溜まりが床面に吸収され、水溜まりの形状が縮小することから、水溜まりは堆積山の領域の形状の推定における外乱因子となる。
【0065】
外乱因子は、撮像範囲100における所定輝度以上の明部の画像でもよい。明部は、日照による明部でもよいし、昼間又は夜間の照明による明部でもよいし、撮像時のフラッシュ光源による明部でもよい。外乱因子は、撮像範囲100における構造物の影部の画像でもよい。
【0066】
以上のように、学習用画像112は、撮像範囲100における水溜まりの画像と、撮像範囲100における所定輝度以上の明部の画像と、撮像範囲100における構造物の影部の画像とのうちの少なくとも一つを含む。
【0067】
これによって、学習済モデルが外乱因子に対する耐性を獲得するので、搬送設備から落下した原料の堆積山の高さの推定精度を更に向上させることが可能である。
【0068】
例えば、教師データにおける複数(計1000枚)の学習用画像のうちの100枚の学習用画像は、床面における明部(日照部)と、その明部に隣接する影部(ケーブルの影部)とが撮像されている画像でもよい。また、教師データにおける複数(計1000枚)の学習用画像のうちの他の100枚の学習用画像は、水溜まりが撮像されている画像でもよい。このような教師データを用いて機械学習された学習済モデルでは、正答率は、一例として9割を超える。
【0069】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0070】
1…推定システム、2…カメラ、3…通信回線、4…学習装置、5…推定装置、6…通知用装置、10…搬送設備、11…ベルト、12…キャリアローラ、13…ヘッドプーリ、14…ベルトクリーナ、15…テンションプーリ、16…リターンローラ、17…テールプーリ、40…学習用通信部、41…学習用記憶装置、42…学習用記憶部、43…学習処理部、50…推定用通信部、51…推定用記憶装置、52…推定用記憶部、53…推定処理部、100…撮像範囲、101…堆積山、102…堆積山、103…堆積山画像、104…堆積山画像、110…学習用画像、111…正解ラベル、112…学習用画像、120…推定用画像、130…出力画像、200…領域画像、201…頂点、202…領域画像、203…頂点、300…水溜まり画像、530…領域推定部、531…高さ推定部、532…通知部