(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133879
(43)【公開日】2024-10-03
(54)【発明の名称】教師データ判定装置、教師データ判定方法及び教師データ判定プログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240926BHJP
G06V 10/764 20220101ALI20240926BHJP
G06T 7/70 20170101ALI20240926BHJP
【FI】
G06T7/00 350B
G06V10/764
G06T7/70 A
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023043880
(22)【出願日】2023-03-20
(71)【出願人】
【識別番号】000136136
【氏名又は名称】株式会社PFU
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】朝井 雄大
(72)【発明者】
【氏名】李 健
(72)【発明者】
【氏名】谷崎 裕紀
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096AA06
5L096BA03
5L096CA04
5L096FA06
5L096FA16
5L096FA32
5L096FA33
5L096FA35
5L096FA59
5L096FA60
5L096FA69
5L096JA11
5L096KA04
(57)【要約】
【課題】機械学習に有用な教師データを自動的に収集すること。
【解決手段】教師データ判定装置100において、画像認識部11は、学習済モデルを用いて物体の画像を認識し、認識した画像に対して画像の属性を示す情報である属性情報を付与し、ばらつき算出部13は、画像認識部11による画像に対する複数の認識結果であって、各々が物体の画像と属性情報とを含む複数の認識結果の間でのばらつきを算出し、認識結果判定部14は、複数の認識結果において、ばらつきに基づいて、機械学習の教師データとして採用する認識結果を判定する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
学習済モデルを用いて物体の画像を認識し、認識した前記画像に対して前記画像の属性を示す情報である属性情報を付与する認識部と、
前記認識部による前記画像に対する複数の認識結果であって、各々が前記画像と前記属性情報とを含む前記複数の認識結果の間でのばらつきを算出する算出部と、
前記複数の認識結果において、前記ばらつきに基づいて、機械学習の教師データとして採用する認識結果を判定する判定部と、
を具備する教師データ判定装置。
【請求項2】
前記属性情報は、前記物体の画像の輪郭によって囲まれた領域の面積、前記物体の種類、前記学習済モデルから出力される信頼スコア、前記領域の重心位置の予測誤差、及び、前記物体の画像の色の統計量の少なくとも一つである、
請求項1に記載の教師データ判定装置。
【請求項3】
前記認識部は、時間の経過とともに搬送路を搬送される同一物体の画像であって、撮影時刻が互いに異なる複数の画像のそれぞれに対する前記複数の認識結果を取得し、
前記算出部は、撮影時刻が互いに異なる前記同一物体の前記複数の画像のそれぞれに対する前記複数の認識結果の間での前記ばらつきを算出する、
請求項1に記載の教師データ判定装置。
【請求項4】
前記認識部は、単一の前記物体の画像に対して互いに異なる複数の学習済モデルの各々を用いて単一の前記物体の画像に対する前記複数の認識結果を取得し、
前記算出部は、前記複数の認識結果の間での前記ばらつきを算出する、
請求項1に記載の教師データ判定装置。
【請求項5】
前記認識部は、単一の前記物体の画像を加工することにより複数の加工済画像を生成し、前記複数の加工済画像のそれぞれに対して同一の学習済モデルを用いて、前記複数の加工済画像のそれぞれに対する複数の認識結果を取得し、
前記算出部は、前記複数の認識結果の間での前記ばらつきを算出する、
請求項1に記載の教師データ判定装置。
【請求項6】
学習済モデルを用いて物体の画像を認識し、
認識した前記画像に対して前記画像の属性を示す情報である属性情報を付与し、
前記画像に対する複数の認識結果であって、各々が前記画像と前記属性情報とを含む前記複数の認識結果の間でのばらつきを算出し、
前記複数の認識結果において、前記ばらつきに基づいて、機械学習の教師データとして採用する認識結果を判定する、
教師データ判定方法。
【請求項7】
学習済モデルを用いて物体の画像を認識し、
認識した前記画像に対して前記画像の属性を示す情報である属性情報を付与し、
前記画像に対する複数の認識結果であって、各々が前記画像と前記属性情報とを含む前記複数の認識結果の間でのばらつきを算出し、
前記複数の認識結果において、前記ばらつきに基づいて、機械学習の教師データとして採用する認識結果を判定する、
処理をプロセッサに実行させるための教師データ判定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、教師データ判定装置、教師データ判定方法及び教師データ判定プログラムに関する。
【背景技術】
【0002】
廃棄物処理場では日々大量の廃棄物がベルトコンベア上を流れ、処理されている。廃棄物が処理される現場では人の手によって廃棄物の選別作業が行われている。廃棄物の選別作業は単純作業である一方で、廃棄物の選別を行う作業者(以下では「選別作業者」と呼ぶことがある)の負担が大きいことから、廃棄物の選別を自動的に行う装置(以下では「廃棄物選別装置」と呼ぶことがある)が開発されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
選別作業者が行っていた作業を選別作業者に代わって廃棄物選別装置にやらせる場合、廃棄物選別装置が、ベルトコンベア上を流れる各々の廃棄物を認識し、認識結果に基づいてロボットハンドや吸引パッドを用いて、ベルトコンベア上を流れる廃棄物群から所望の廃棄物(以下では「所望廃棄物」と呼ぶことがある)を抽出することが考えられる。そこで、ベルトコンベア上を複数種類の廃棄物が混在して流れてくる場合には、廃棄物選別装置が廃棄物の種類を識別することが必要になる。廃棄物選別装置が様々な種類の廃棄物を認識するにあたっては、機械学習によって生成された学習済モデルを用いた画像認識が有効である。
【0005】
しかし、機械学習によって精度の良い学習済モデルを生成するには数多くの有用な教師データが必要とされる。
【0006】
そこで、本開示では、機械学習に有用な教師データを自動的に収集できる技術を提案する。
【課題を解決するための手段】
【0007】
本開示の教師データ判定装置は、認識部と、算出部と、判定部とを有する。前記認識部は、学習済モデルを用いて物体の画像を認識し、認識した前記画像に対して前記画像の属性を示す情報である属性情報を付与する。前記算出部は、前記認識部による前記画像に対する複数の認識結果であって、各々が前記画像と前記属性情報とを含む前記複数の認識結果の間でのばらつきを算出する。前記判定部は、前記複数の認識結果において、前記ばらつきに基づいて、機械学習の教師データとして採用する認識結果を判定する。
【発明の効果】
【0008】
本開示によれば、機械学習に有用な教師データを自動的に収集できる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、本開示の実施例1に係る物体選別システムの構成例を示す図である。
【
図2】
図2は、本開示の実施例1に係る制御装置の構成例を示す図である。
【
図3】
図3は、本開示の実施例1に係る属性情報の一例を示す図である。
【
図4】
図4は、本開示の実施例1に係る重心座標のトレース例を示す図である。
【
図5】
図5は、本開示の実施例1に係る重心座標のトレース例を示す図である。
【
図6】
図6は、本開示の実施例1に係る重心座標のトレース例を示す図である。
【
図7】
図7は、本開示の実施例1に係る重心座標のトレース例を示す図である。
【
図8】
図8は、本開示の実施例1に係る所望廃棄物の抽出例を示す図である。
【
図9】
図9は、本開示の実施例1に係る画像認識結果の一例を示す図である。
【
図10】
図10は、本開示の実施例1に係る教師データ判定装置の動作例1-1を示す図である。
【
図11】
図11は、本開示の実施例1に係る教師データ判定装置の動作例1-2を示す図である。
【
図12】
図12は、本開示の実施例1に係る教師データ判定装置の動作例1-3を示す図である。
【
図13】
図13は、本開示の実施例2に係る教師データ判定装置の動作例2を示す図である。
【
図14】
図14は、本開示の実施例3に係る教師データ判定装置の動作例3を示す図である。
【
図15】
図15は、本開示の実施例4に係る認識結果ばらつきの算出例を示す図である。
【
図16】
図16は、本開示の実施例4に係る認識結果ばらつきの算出例を示す図である。
【
図17】
図17は、本開示の実施例4に係る認識結果ばらつきの算出例を示す図である。
【
図18】
図18は、本開示の実施例4に係る認識結果ばらつきの算出例を示す図である。
【
図19】
図19は、本開示の実施例4に係る認識結果ばらつきの算出例を示す図である。
【
図20】
図20は、本開示の実施例4に係る認識結果ばらつきの算出例を示す図である。
【
図21】
図21は、本開示の実施例4に係る教師データ判定装置の動作例4を示す図である。
【発明を実施するための形態】
【0010】
以下、本開示の実施例を図面に基づいて説明する。以下の実施例において同一の構成には同一の符号を付す。
【0011】
[実施例1]
<物体選別システムの構成>
図1は、本開示の実施例1に係る物体選別システムの構成例を示す図である。
【0012】
図1において、物体選別システム1は、制御装置10と、カメラ20と、物体選別装置30と、ベルトコンベア40とを有する。制御装置10と、カメラ20と、物体選別装置30とは、ネットワークを介して互いに接続される。
【0013】
以下では、
図1に示す物体選別システム1が、ベルトコンベア40上を廃棄物群が流れる廃棄物処理場に設置される場合を一例に挙げて説明する。つまり、以下では、物体選別システム1の選別対象の物体が廃棄物である場合を一例に挙げて説明する。しかし、物体選別システム1は、ベルトコンベア上を部品群が流れる組立工場等に設置されても良い。つまり、物体選別システム1の選別対象の物体は廃棄物に限定されず、物体選別システム1は様々な物体に対して使用可能である。
【0014】
ベルトコンベア40は、ベルトコンベア40上に載せられた廃棄物群を搬送方向CDへ搬送する。つまり、ベルトコンベア40は、搬送方向CDへ廃棄物群が搬送される搬送路を形成する。
【0015】
カメラ20は、廃棄物群が搬送されるベルトコンベア40の上方に配置され、所定の画角を有し、ベルトコンベア40の上方からベルトコンベア40の上面における所定の領域を一定のフレームレートで連続して撮影する。よって、カメラ20によって撮影された画像(以下では「撮影画像」と呼ぶことがある)は、廃棄物群の画像となる。撮影画像は、カメラ20から制御装置10へ送信される。
【0016】
<制御装置の構成>
図2は、本開示の実施例1に係る制御装置の構成例を示す図である。
図2において、制御装置10は、教師データ判定装置100と、教師データ記憶部15と、機械学習部16と、学習済モデル記憶部17とを有する。教師データ判定装置100は、画像認識部11と、認識結果記憶部12と、ばらつき算出部13と、認識結果判定部14とを有する。
【0017】
画像認識部11は、学習済モデル記憶部17に記憶されている学習済モデルを用いて、撮影画像の中に存在する各廃棄物の画像(以下では「廃棄物画像」と呼ぶことがある)を認識し、認識した各廃棄物画像に対して、各廃棄物画像の属性を示す情報(以下では「属性情報」と呼ぶことがある)を付与する。画像認識部11は、学習済モデルを用いた画像認識の信頼スコアが閾値以上となる廃棄物画像に属性情報を付与する。信頼スコアは、学習済モデル記憶部17に記憶されている学習済モデルから廃棄物画像毎に出力される。画像認識部11は、例えば、撮影画像に対してインスタンスセグメンテーションを行うことにより廃棄物画像を認識する。画像認識部11は、廃棄物画像と、廃棄物画像に付与済みの属性情報とを互いに対応付け、各廃棄物画像に対して属性情報が付与された認識結果(以下では「画像認識結果」と呼ぶことがある)を生成し、生成した画像認識結果を認識結果記憶部12及び物体選別装置30へ出力する。
【0018】
認識結果記憶部12は、画像認識部11から順次出力される画像認識結果を時系列に記憶する。つまり、認識結果記憶部12は、画像認識部11による廃棄物画像に対する複数の画像認識結果であって、各々が廃棄物画像と属性情報とを含む複数の画像認識結果を記憶する。
【0019】
物体選別装置30は、画像認識部11から出力される画像認識結果(つまり、廃棄物画像及び属性情報)に基づいて、ベルトコンベア40を搬送される廃棄物群の中から所望廃棄物を抽出することにより選別する。物体選別装置30は、例えば、ロボットハンドや吸引パッド等を用いて所望廃棄物を抽出する。
【0020】
ばらつき算出部13は、認識結果記憶部12に記憶されている複数の画像認識結果の間でのばらつき(以下では「認識結果ばらつき」と呼ぶことがある)を算出し、算出した認識結果ばらつきを認識結果判定部14へ出力する。
【0021】
認識結果判定部14は、認識結果ばらつきに基づいて、認識結果記憶部12に記憶されている複数の画像認識結果において、機械学習の教師データとして採用する画像認識結果(以下では「採用認識結果」と呼ぶことがある)を判定する。そして、認識結果判定部14は、認識結果記憶部12に記憶されている複数の画像認識結果の中から採用認識結果抽出し、抽出した採用認識結果を教師データ記憶部15へ出力する。
【0022】
教師データ記憶部15には、属性情報が付与された多くの廃棄物画像が教師データとして予め記憶されている。また、教師データ記憶部15は、認識結果判定部14から出力される採用認識結果を追加の教師データとして新たに記憶する。
【0023】
機械学習部16は、一定時間毎に、教師データ記憶部15に記憶されている教師データを用いて機械学習を行い、機械学習後の学習済モデルによって、学習済モデル記憶部17に記憶されている学習済モデルを更新する。よって、画像認識部11での廃棄物画像の認識は、採用認識結果を用いて機械学習部16によって行われる追加の機械学習により更新された後の学習済モデルを用いて行われることになる。
【0024】
<属性情報>
図3は、本開示の実施例1に係る属性情報の一例を示す図である。以下では、廃棄物として空きビンを想定し、物体選別装置30では、ベルトコンベア40上を流れる各々の空きビンが、茶色の空きビン(以下では「茶色ビン」と呼ぶことがある)と、無色透明の空きビン(以下では「透明ビン」と呼ぶことがある)と、茶色以外の色(以下では「他色」と呼ぶことがある)を有する空きビン(以下では「他色ビン」と呼ぶことがある)との三種類の空きビンに選別される場合を想定する。また以下では、所望廃棄物が茶色ビンであり、茶色ビン用の教師データが教師データ記憶部15に記憶される場合を想定する。
【0025】
図3に示すように、撮影画像に廃棄物画像として空きビンの画像(以下では「空きビン画像」と呼ぶことがある)BIが含まれる場合、画像認識部11は、学習済モデル記憶部17に記憶されている学習済モデルを用いて、撮影画像の中に存在する空きビン画像BIを認識し、認識した空きビン画像BIに対して、撮影時刻と、個体IDと、ラベル情報LAと、輪郭情報COと、重心座標DGと、輪郭領域面積と、信頼スコアと、重心予測誤差と、色統計量とを含む属性情報を付与する。
【0026】
撮影時刻は、空きビン画像BIを含む撮影画像がカメラ20によって取得された時刻である。
【0027】
個体IDは、複数の空きビン画像において互いに同一の空きビンを一意に特定するためのIDである。画像認識部11は、それぞれの空きビン画像BIに個体IDを付与する。
【0028】
ラベル情報LAは、空きビンの種類を示す情報である。画像認識部11は、空きビン画像BIが茶色ビンの画像(以下では「茶色ビン画像」と呼ぶことがある)である場合には“茶色ビン”というラベル情報LAを空きビン画像BIに付与し、空きビン画像BIが透明ビンの画像(以下では「透明ビン画像」と呼ぶことがある)である場合には“透明ビン”というラベル情報LAを空きビン画像BIに付与し、空きビン画像BIが他色ビンの画像(以下では「他色ビン画像」と呼ぶことがある)である場合には“他色ビン”というラベル情報LAを空きビン画像BIに付与する。
【0029】
また、画像認識部11は、空きビン画像BIの輪郭を示す輪郭情報COを空きビン画像BIに付与する。矩形の撮影画像の長辺をX軸、短辺をY軸として、輪郭情報COは、複数の座標点(x0,y0),(x1,y1),…,(xn,yn)で形成される。
【0030】
また、画像認識部11は、輪郭情報COに基づいて空きビン画像BIの面積重心を算出し、算出した面積重心の位置を示す重心座標DGを空きビン画像BIに付与する。重心座標DGは、単一の座標点(X,Y)で形成される。
【0031】
ここで、輪郭情報COを形成する複数の座標点(x0,y0),(x1,y1),…,(xn,yn)、及び、重心座標を形成する単一の座標点(X,Y)は、撮影画像の座標系、つまり、カメラ20の座標系(以下では「カメラ座標系」と呼ぶことがある)における座標点である。
【0032】
また、画像認識部11は、輪郭情報COを形成する複数の座標点(x0,y0),(x1,y1),…,(xn,yn)によって囲まれた領域(以下では「輪郭領域」と呼ぶことがある)の面積(つまり、輪郭領域面積)を算出し、算出した輪郭領域面積を空きビン画像BIに付与する。画像認識部11は、輪郭領域内の画素の総数を輪郭領域面積として算出する。
【0033】
また、画像認識部11は、画像認識部11が学習済モデルを用いて空きビン画像BIを認識する際に学習済モデルから出力される信頼スコアを空きビン画像BIに付与する。信頼スコアは、空きビン画像BIの画像認識結果の確度を示す。
【0034】
また、画像認識部11は、後述する重心予測誤差[mm]を空きビン画像BIに付与する。
【0035】
また、画像認識部11は、空きビン画像BIの色統計量を空きビン画像BIに付与する。画像認識部11は、輪郭領域内の各画素の色情報に基づいて、輪郭領域内の全画素におけるR成分(Red成分)の統計量(以下では「R成分量」と呼ぶことがある)と、輪郭領域内の全画素におけるG成分(Green成分)の統計量(以下では「G成分量」と呼ぶことがある)と、輪郭領域内の全画素におけるB成分(Blue成分)の統計量(以下では「B成分量」と呼ぶことがある)とを色統計量として空きビン画像BIに付与する。R成分量、G成分量及びB成分量は、例えば、加算平均によって算出され、0~255の階調値を用いて表される。
【0036】
<重心座標のトレース>
図4、
図5、
図6及び
図7は、本開示の実施例1に係る重心座標のトレース例を示す図である。
【0037】
まず、
図4に示すように、画像認識部11は、時刻t11において取得された撮影画像において茶色ビン画像BOを認識し、時刻t11における茶色ビン画像BOに個体IDを付与するとともに、時刻t11における茶色ビン画像BOの重心座標DG1を算出する。
【0038】
次いで、
図5に示すように、画像認識部11は、カメラ20のフレームレートFR[frame/sec]と、ベルトコンベア40の搬送速度CS[mm/sec]とに基づいて、時刻t11で取得された撮影画像の次に時刻t12で取得されるであろう撮影画像における茶色ビン画像BOの重心座標EG2を予測する。時刻t12における重心座標EG2は、時刻t11における重心座標DG1に対して、1フレーム当たり、ベルトコンベア40の搬送方向CD(つまり、
図1におけるX方向)にCS/FRだけ移動すると予測される。また、画像認識部11は、予測した重心座標EG2を中心とする円形の所定の大きさの許容範囲TRを設定する。
【0039】
次いで、
図6に示すように、画像認識部11は、時刻t12において取得された撮影画像において茶色ビン画像BOを認識し、時刻t12における茶色ビン画像BOの重心座標DG2を算出する。また、画像認識部11は、重心座標DG2が許容範囲TR内にあるか否かを判定する。また、画像認識部11は、重心座標EG2と重心座標DG2との間の距離を、重心位置の予測誤差である重心予測誤差PEとして算出する。
【0040】
重心座標DG2が許容範囲TR内にあるときは、画像認識部11は、時刻t11及び時刻t12における双方の茶色ビン画像BOの被写体が同一の茶色ビンであると判定し、時刻t12における茶色ビン画像BOに対し、時刻t11における茶色ビン画像BOに付与した個体IDと同一の個体IDを付与するとともに、
図7に示すように、重心座標DG1から重心座標DG2へと繋がる直線のトレース線TLを設定する。一方で、重心座標DG2が許容範囲TR内にないときは、画像認識部11は、重心座標のトレースを中止する。
【0041】
画像認識部11は、フレームレートFRで順次取得される撮影画像に対して、上記のような重心座標のトレースを順次実行する。
【0042】
<所望廃棄物の抽出>
図8は、本開示の実施例1に係る所望廃棄物の抽出例を示す図である。
図8では、カメラ20のフレームレートFRは、例えば、ベルトコンベア40の搬送速度CSとカメラ20の画角とに基づいて、搬送方向CDに搬送される同一の空きビンを最大で3回撮影可能なフレームレートに設定されている。また、物体選別装置30は、吸引パッド31を用いて空きビン群から所望廃棄物である茶色ビンを抽出する。
【0043】
図8において、画像認識部11は、時刻t11において取得された撮影画像において茶色ビン画像BOを認識し、時刻t11における茶色ビン画像BOの重心座標DG1(X1,Y1)を算出する。
【0044】
次いで、画像認識部11は、時刻t12において取得された撮影画像において茶色ビン画像BOを認識し、時刻t12における茶色ビン画像BOの重心座標DG2(X2,Y2)を算出する。
【0045】
次いで、画像認識部11は、時刻t11及び時刻t12における双方の茶色ビン画像BOの被写体が同一の茶色ビンであると判定し、重心座標DG1(X1,Y1)から重心座標DG2(X2,Y2)へと繋がる直線のトレース線TLを設定する。
【0046】
次いで、画像認識部11は、時刻t13において取得された撮影画像において茶色ビン画像BOを認識し、時刻t13における茶色ビン画像BOの重心座標DG3(X3,Y3)を算出する。
【0047】
次いで、画像認識部11は、時刻t12及び時刻t13における双方の茶色ビン画像BOの被写体が同一の茶色ビンであると判定し、重心座標DG1(X1,Y1)から重心座標DG3(X3,Y3)へと繋がる直線のトレース線TLを設定する。
【0048】
次いで、画像認識部11は、重心座標DG1(X1,Y1)から重心座標DG3(X3,Y3)へと繋がるトレース線TLをX方向における吸引パッド31の設置位置まで直線近似により延長し、かつ、カメラ座標系を物体選別装置30の座標系に変換することにより、茶色ビンの抽出目標座標TC(X,Y)を算出する。また、画像認識部11は、搬送速度CSに基づいて、時刻t11,t12,t13で認識した茶色ビン画像BOの被写体である茶色ビンが抽出目標座標TC(X,Y)に到達する時刻(以下では「抽出目標時刻」と呼ぶことがある)tHを算出する。画像認識部11は、算出した抽出目標座標TC(X,Y)及び抽出目標時刻tHを含む制御信号を物体選別装置30へ送信する。
【0049】
物体選別装置30では、画像認識部11から受信された抽出目標座標TC(X,Y)及び抽出目標時刻tHに従って、吸引パッド31が、抽出目標座標TC(X,Y)に移動し、抽出目標時刻tHで抽出目標座標TC(X,Y)に位置する空きビンを空きビン群から抽出する。これにより、物体選別装置30では、時刻t11,t12,t13で画像認識部11によって認識された茶色ビン画像BOの被写体である茶色ビンが空きビン群から抽出される。
【0050】
<画像認識結果>
図9は、本開示の実施例1に係る画像認識結果の一例を示す図である。
図9には、一例として、時刻t12で取得された撮影画像に含まれる空きビン画像に対する画像認識結果を示す。
【0051】
図9に示すように、画像認識結果には、撮影時刻と、空きビン画像と、個体IDと、輪郭領域面積と、重心予測誤差と、R成分量と、G成分量と、B成分量と、信頼スコアと、ラベル情報LAにより示される空きビンの種類とが含まれる。
【0052】
<教師データ判定装置の動作>
図10、
図11及び
図12は、本開示の実施例1に係る教師データ判定装置の動作例1-1,1-2,1-3を示す図である。
【0053】
以下では、一例として、輪郭領域面積のばらつき(以下では「面積ばらつき」と呼ぶことがある)に対する閾値を“5”、重心予測誤差のばらつき(以下では「誤差ばらつき」と呼ぶことがある)に対する閾値を“3”、R成分量のばらつき(以下では「R成分ばらつき」と呼ぶことがある)に対する閾値を“5”、G成分量のばらつき(以下では「G成分ばらつき」と呼ぶことがある)に対する閾値を“5”、B成分量のばらつき(以下では「B成分ばらつき」と呼ぶことがある)に対する閾値を“5”、信頼スコアのばらつき(以下では「信頼スコアばらつき」と呼ぶことがある)に対する閾値を“3”、空きビンの種類のばらつき(以下では「種類ばらつき」と呼ぶことがある)に対する閾値を“0.3”として説明する。
【0054】
ばらつき算出部13は、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、及び、信頼スコアばらつきの各々のばらつきを、標準偏差を用いて算出する。また、ばらつき算出部13は、シンプソンの多様度指数を用いて種類ばらつきを算出する。面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつきの各々のばらつきが、認識結果ばらつきに該当する。
【0055】
認識結果判定部14は、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつきの少なくとも一つが閾値以上となる画像認識結果を採用認識結果と判定する。
【0056】
<動作例1-1(
図10)>
認識結果判定部14は、
図10に示すように、時刻t11,t12,t13の各時刻において画像認識部11によって時系列に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果の間において、面積ばらつき及び誤差ばらつきが閾値以上になるときは、ばらつきの発生要因が画像認識部11の認識精度の不足にあると判定し、これらの3個の画像認識結果を採用認識結果と判定する。一方で、画像認識部11は、同一の個体IDを付与する複数の空きビン画像の被写体は同一の空きビンであると判定する。同一の個体IDを有する時系列に取得された3個の画像認識結果の間において面積ばらつき及び誤差ばらつきが閾値以上になる場合として、例えば、時刻t12における空きビン画像の一部が欠落した場合が想定される。
【0057】
<動作例1-2(
図11)>
認識結果判定部14は、
図11に示すように、時刻t11,t12,t13の各時刻において画像認識部11によって時系列に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果の間において、B成分ばらつき及び種類ばらつきが閾値以上となるときは、ばらつきの発生要因が画像認識部11の認識精度の不足にあると判定し、これらの3個の画像認識結果を採用認識結果と判定する。
【0058】
<動作例1-3(
図12)>
認識結果判定部14は、
図12に示すように、時刻t11,t12,t13の各時刻において画像認識部11によって時系列に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果の間において、誤差ばらつきが閾値以上になる一方で面積ばらつきが閾値未満になるときは、ばらつきが画像認識部11の認識精度の不足によって発生したものではないと判定し、これらの3個の画像認識結果を機械学習の教師データとして採用せずに認識結果記憶部12から抽出しない。同一の個体IDを有する時系列に取得された3個の画像認識結果の間において、誤差ばらつきが閾値以上になる一方で面積ばらつきが閾値未満になる場合として、例えば、同一の空きビンが、ベルトコンベア40での搬送中にベルトコンベア40上で転がってしまった場合が想定される。
【0059】
以上、実施例1について説明した。
【0060】
[実施例2]
<教師データ判定装置の動作>
画像認識部11は、単一の空きビン画像に対して互いに異なる複数の学習済モデルの各々を用いて、単一の空きビン画像に対する複数の画像認識結果を取得する。互いに異なる複数の学習済モデルは、学習済モデル記憶部17に予め記憶されている。
【0061】
ばらつき算出部13は、単一の空きビン画像に対する複数の画像認識結果の間において、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつきの各々のばらつきを算出する。
【0062】
<動作例2(
図13)>
図13は、本開示の実施例2に係る教師データ判定装置の動作例2を示す図である。以下では、一例として、画像認識部11が、単一の空きビン画像に対して互いに異なる第一学習済モデル、第二学習済モデル及び第三学習済モデルの3個の学習済モデルの各々を用いて、単一の空きビン画像に対する3個の画像認識結果を取得する場合について説明する。
図13において、一行目の画像認識結果は第一学習済モデルを用いて取得されたものであり、二行目の画像認識結果は第二学習済モデルを用いて取得されたものであり、三行目の画像認識結果は第三学習済モデルを用いて取得されたものである。
【0063】
認識結果判定部14は、
図13に示すように、第一学習済モデル、第二学習済モデル及び第三学習済モデルの各々の学習済モデルを用いて画像認識部11によって同一時刻t12に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果の間において、信頼スコアばらつきが閾値以上になるときは、ばらつきの発生要因が画像認識部11の認識精度の不足にあると判定し、これらの3個の画像認識結果を採用認識結果と判定する。
【0064】
以上、実施例2について説明した。
【0065】
[実施例3]
<教師データ判定装置の動作>
画像認識部11は、単一の空きビン画像を加工することにより複数の加工済画像を生成する。また、画像認識部11は、複数の加工済画像のそれぞれに対して同一の学習済モデルを用いて、複数の加工済画像のそれぞれに対する複数の画像認識結果を、単一の空きビン画像に対する複数の画像認識結果として取得する。
【0066】
ばらつき算出部13は、複数の加工済画像のそれぞれに対する複数の画像認識結果の間において、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつきの各々のばらつきを算出する。
【0067】
<動作例3(
図14)>
図14は、本開示の実施例3に係る教師データ判定装置の動作例3を示す図である。以下では、一例として、画像認識部11が、単一の空きビン画像を加工することにより、第一加工済画像、第二加工済画像及び第三加工済画像の3個の加工済画像を生成する場合について説明する。
図14において、一行目の画像認識結果は第一加工済画像に対する画像認識結果であり、二行目の画像認識結果は第二加工済画像に対する画像認識結果であり、三行目の画像認識結果は第三加工済画像に対する画像認識結果である。
【0068】
認識結果判定部14は、
図14に示すように、同一の学習済モデルを用いて画像認識部11によって同一時刻t12に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果の間において、種類ばらつきが閾値以上になるときは、ばらつきの発生要因が画像認識部11の認識精度の不足にあると判定し、これらの3個の画像認識結果を採用認識結果と判定する。
【0069】
以上、実施例3について説明した。
【0070】
[実施例4]
<認識結果ばらつきの算出>
実施例1~3では、輪郭領域面積、重心予測誤差、R成分量、G成分量、B成分量、及び、信頼スコアが連続値をとり、ばらつき算出部13が、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、及び、信頼スコアばらつきを、標準偏差を用いて算出する場合について説明した。これに対し、実施例4では、ばらつき算出部13は、輪郭領域面積、重心予測誤差、R成分量、G成分量、B成分量、及び、信頼スコアをヒストグラムによって離散値にし、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、及び、信頼スコアばらつきを、シンプソンの多様度指数を用いて算出する。
【0071】
図15~20は、本開示の実施例4に係る認識結果ばらつきの算出例を示す図である。例えば、輪郭領域面積が
図15に示すようなヒストグラムになる場合、ばらつき算出部13は、多様度指数として示される面積ばらつきを0.00と算出する。また例えば、重心予測誤差が
図16に示すようなヒストグラムになる場合、ばらつき算出部13は、多様度指数として示される誤差ばらつきを0.00と算出する。また例えば、R成分量が
図17に示すようなヒストグラムになる場合、ばらつき算出部13は、多様度指数として示されるR成分ばらつきを0.00と算出する。また例えば、G成分量が
図18に示すようなヒストグラムになる場合、ばらつき算出部13は、多様度指数として示されるG成分ばらつきを0.00と算出する。また例えば、B成分量が
図19に示すようなヒストグラムになる場合、ばらつき算出部13は、多様度指数として示されるB成分ばらつきを0.44と算出する。また例えば、信頼スコアが
図20に示すようなヒストグラムになる場合、ばらつき算出部13は、多様度指数として示される信頼スコアばらつきを0.00と算出する。
【0072】
<教師データ判定装置の動作>
<動作例4(
図21)>
図21は、本開示の実施例4に係る教師データ判定装置の動作例4を示す図である。
【0073】
ばらつき算出部13は、上記の
図15~20に示したように、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、及び、信頼スコアばらつきを多様度指数の0.00と算出する一方で、B成分ばらつきを多様度指数の0.44と算出する(
図21)。また例えば、
図21に示すように、ばらつき算出部13は、実施例1と同様にして、種類ばらつきを多様度指数の0.44と算出する。
【0074】
また、
図21に示すように、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつきの各々のばらつきに対して、重みが設定されている。そこで、例えば、ばらつき算出部13は、各々の認識結果ばらつきと、各々の重みとの乗算結果の総和(以下では「重み付き和」と呼ぶことがある)を算出する。そして、認識結果判定部14は、重み付き和が閾値以上となるときに、ばらつきの発生要因が画像認識部11の認識精度の不足にあると判定し、時刻t11,t12,t13の各時刻において画像認識部11によって時系列に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果を採用認識結果と判定する。
図21に示す例では、重み付き和は、(0.44×1)+(0.44)×2=1.32と算出され、重み付き和に対する閾値は1.0に設定される。
【0075】
また例えば、認識結果判定部14は、
図21に示す各々の認識結果ばらつきの中での最大値が閾値以上となるときに、ばらつきの発生要因が画像認識部11の認識精度の不足にあると判定し、時刻t11,t12,t13の各時刻において画像認識部11によって時系列に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果を採用認識結果と判定しても良い。
図21に示す例では、認識結果ばらつきの最大値(以下では「ばらつき最大値」と呼ぶことがある)は0.44であり、ばらつき最大値に対する閾値は0.3に設定される。
【0076】
また例えば、ばらつき算出部13は、各々の認識結果ばらつきの平均値(以下では「平均ばらつき」と呼ぶことがある)を算出する。そして、認識結果判定部14は、平均ばらつきが閾値以上となるときに、ばらつきの発生要因が画像認識部11の認識精度の不足にあると判定し、時刻t11,t12,t13の各時刻において画像認識部11によって時系列に取得された3個の画像認識結果であって、同一の個体IDを有する3個の画像認識結果を採用認識結果と判定しても良い。
図21に示す例では、平均ばらつきは、(0.44+0.44)÷7=0.13(小数点第三位四捨五入)と算出され、平均ばらつきに対する閾値は0.2に設定される。
【0077】
以上、実施例4について説明した。
【0078】
[実施例5]
上記の実施例1~4では、認識結果判定部14は、認識結果ばらつきが閾値以上となる画像認識結果のすべてを採用認識結果と判定した。しかし、認識結果ばらつきが閾値以上となる全N個の画像認識結果のうち、例えば、ばらつきの大きさが上位のM個(M<N)の画像認識結果だけ、または、ランダムなM個の画像認識結果だけを採用認識結果と判定しても良い。
【0079】
[実施例6]
認識結果記憶部12、教師データ記憶部15、及び、学習済モデル記憶部17は、ハードウェアとして、例えば、メモリまたはストレージにより実現される。画像認識部11、ばらつき算出部13、認識結果判定部14、及び、機械学習部16は、ハードウェアとして、例えば、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)等のプロセッサにより実現される。
【0080】
また、制御装置10での上記説明における各処理の全部または一部は、各処理に対応するプログラムを制御装置10が有するプロセッサに実行させることによって実現しても良い。例えば、上記説明における各処理に対応するプログラムが制御装置10が有するメモリまたはストレージに記憶され、プログラムがプロセッサによってメモリまたはストレージから読み出されて実行されても良い。また、プログラムは、任意のネットワークを介して制御装置10に接続されたプログラムサーバに記憶され、そのプログラムサーバから制御装置10にダウンロードされて実行されたり、制御装置10が読み取り可能な記録媒体に記憶され、その記録媒体から読み出されて実行されても良い。制御装置10が読み取り可能な記録媒体には、例えば、メモリカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、CD-ROM、及び、DVD等の可搬の記憶媒体が含まれる。
【0081】
以上、実施例6について説明した。
【0082】
上記の実施例1~5では、認識結果ばらつきとして、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつきのすべてを用いる場合を一例に挙げた。しかし、本開示の技術は、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつきの少なくとも一つを用いる場合に適用可能である。つまり、本開示の技術は、輪郭領域面積、重心予測誤差と、色統計量、信頼スコア、及び、ラベル情報LAの少なくとも一つが属性情報に含まれている場合に適用可能である。また、認識結果ばらつきとして、面積ばらつき、誤差ばらつき、R成分ばらつき、G成分ばらつき、B成分ばらつき、信頼スコアばらつき、及び、種類ばらつき以外のばらつきが用いられる場合にも、本開示の技術を適用可能である。
【0083】
以上のように、本開示の教師データ判定装置(実施例の教師データ判定装置100)は、認識部(実施例の画像認識部11)と、算出部(実施例のばらつき算出部13)と、判定部(実施例の認識結果判定部14)とを有する。認識部は、学習済モデルを用いて物体の画像を認識し、認識した画像に対して画像の属性を示す情報である属性情報を付与する。算出部は、認識部による画像に対する複数の認識結果であって、各々が物体の画像と属性情報とを含む複数の認識結果の間でのばらつきを算出する。判定部は、複数の認識結果において、ばらつきに基づいて、機械学習の教師データとして採用する認識結果を判定する。
【0084】
こうすることで、認識結果の確度が低いと想定される認識結果を機械学習の教師データとして採用することが可能になるため、機械学習に有用な教師データを自動的に収集できる。
【0085】
例えば、認識部は、時間の経過とともに搬送路を搬送される同一物体の画像であって、撮影時刻が互いに異なる複数の画像のそれぞれに対する複数の認識結果を取得する。算出部は、撮影時刻が互いに異なる同一物体の複数の画像のそれぞれに対する複数の認識結果の間でのばらつきを算出する。
【0086】
また例えば、認識部は、単一の物体の画像に対して互いに異なる複数の学習済モデルの各々を用いて単一の物体の画像に対する複数の認識結果を取得し、算出部は、それらの複数の認識結果の間でのばらつきを算出する。
【0087】
また例えば、認識部は、単一の物体の画像を加工することにより複数の加工済画像を生成し、複数の加工済画像のそれぞれに対して同一の学習済モデルを用いて、複数の加工済画像のそれぞれに対する複数の認識結果を取得し、算出部は、それらの複数の認識結果の間でのばらつきを算出する。
【符号の説明】
【0088】
1 物体選別システム
10 制御装置
20 カメラ
30 物体選別装置
100 教師データ判定装置
11 画像認識部
12 認識結果記憶部
13 ばらつき算出部
14 認識結果判定部
15 教師データ記憶部
16 機械学習部
17 学習済モデル記憶部