(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-05-23
(54)【発明の名称】マテリアルストリームのコンポーネントを分類するための機械学習モデルをトレーニングする方法およびシステム
(51)【国際特許分類】
G06N 20/00 20190101AFI20230516BHJP
G01N 21/73 20060101ALI20230516BHJP
G01N 21/74 20060101ALI20230516BHJP
G06T 7/00 20170101ALI20230516BHJP
【FI】
G06N20/00
G01N21/73
G01N21/74
G06T7/00 350B
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022562597
(86)(22)【出願日】2021-04-16
(85)【翻訳文提出日】2022-12-09
(86)【国際出願番号】 EP2021059942
(87)【国際公開番号】W WO2021209614
(87)【国際公開日】2021-10-21
(32)【優先日】2020-04-16
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】511051982
【氏名又は名称】ヴィト ナムローゼ フェンノートシャップ
【氏名又は名称原語表記】VITO NV
【住所又は居所原語表記】Boerentang 200,B-2400 Mol,Belgium
(74)【代理人】
【識別番号】100126572
【氏名又は名称】村越 智史
(72)【発明者】
【氏名】グルツ, ルーラント
【テーマコード(参考)】
2G043
5L096
【Fターム(参考)】
2G043AA04
2G043CA05
2G043EA08
2G043GA25
2G043GB28
2G043NA01
5L096AA01
5L096AA06
5L096BA05
5L096FA33
5L096FA64
5L096FA66
5L096FA69
5L096GA30
5L096GA34
5L096HA11
5L096KA04
5L096MA07
(57)【要約】
複数の未知のコンポーネントを含むマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングするための方法およびシステムである。マテリアルストリームに含まれる複数の未知のコンポーネントのうちの未知のコンポーネントそれぞれに関連付けられるトレーニング報酬を決定し、これに基づいて少なくとも一つの未知のコンポーネントを分離装置ユニットによりマテリアルストリームから物理的に分離する。分離ユニットは、選択された少なくとも一つの未知のコンポーネントを、アクセス可能な別の区画に移動させるように構成される。分離された少なくとも一つの未知のコンポーネントは、そのグランドトゥルースラベルを決定するために分析され、決定されたグランドトゥルースは機械学習モデルのインクリメントバージョンのトレーニングに使用される。
【特許請求の範囲】
【請求項1】
複数の未知のコンポーネントを含むマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングする方法であって、
前記複数の未知のコンポーネントを含む前記マテリアルストリームの画像化を行うように構成されたセンサシステムによって、前記マテリアルストリームを走査する工程と、
前記マテリアルストリームの前記画像および/または前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上の特徴を入力として受け取るように構成された機械学習モデルによって、前記マテリアルストリーム中の前記複数の未知のコンポーネントのそれぞれについて、一つ以上の予測ラベルおよび関連するラベル予測確率を予測する工程と、
前記マテリアルストリーム中の前記複数の未知のコンポーネント内の未知のコンポーネントそれぞれに関連付けられるトレーニング報酬を決定する工程と、
前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に少なくとも部分的に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程と、を備え、
選択された前記少なくとも一つの未知のコンポーネントは、分離ユニットによって前記マテリアルストリームから物理的に分離され、前記分離ユニットは、前記選択された少なくとも一つの未知のコンポーネントを、アクセス可能な別の区画に移動させるように構成され、
前記方法は更に、
分離された前記少なくとも一つの未知のコンポーネントのグランドトゥルースラベルを決定するために当該少なくとも一つの未知のコンポーネントを分析する工程と、
前記物理的に分離された少なくとも一つの未知のコンポーネントの決定された前記グランドトゥルースラベルを使用して、前記機械学習モデルのインクリメントバージョンをトレーニングする工程と、を備え、
前記分離された少なくとも一つの未知のコンポーネントの前記決定されたグランドトゥルースラベルはトレーニングデータベースに追加される、方法。
【請求項2】
前記機械学習モデルは、前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上のユーザ定義の特徴を入力として受け取るように構成される、請求項1に記載の方法。
【請求項3】
前記少なくとも一つの未知のコンポーネントを選択する工程における選択について、ユーザが作成した選択基準を採用する、請求項1または2に記載の方法。
【請求項4】
前記分離ユニットは、異なる複数の分離技術を採用する複数のサブユニットを含む、請求項1から3の何れか一項に記載の方法。
【請求項5】
前記分離ユニットは、少なくとも第1のサブユニットと第2のサブユニットとを有し、前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの前記一つ以上の特徴に基づいて、前記選択された少なくとも一つの未知のコンポーネントの物理的分離のために、前記第1のサブユニットおよび前記第2のサブユニットのうちの一方が選択される、請求項1から4の何れか一項に記載の方法。
【請求項6】
前記第1のサブユニットは、前記マテリアルストリーム中のより小さいおよび/またはより軽いコンポーネントの物理的分離に使用され、前記第2のサブユニットは、前記マテリアルストリーム中のより大きいおよび/またはより重いコンポーネントの物理的分離に使用される、請求項1から5の何れか一項に記載の方法。
【請求項7】
前記第1のサブユニットは、前記選択された少なくとも一つの未知のコンポーネントを前記アクセス可能な別の区画へと吹き飛ばすために、前記コンポーネントに向かって流体ジェットを向けて前記コンポーネントを分離するように構成され、
前記第2のサブユニットは、機械的マニピュレーションデバイスを使用して前記選択された少なくとも一つの未知のコンポーネントを分離するように構成される、請求項1から6の何れか一項に記載の方法。
【請求項8】
前記第2のサブユニットの前記機械的マニピュレーションデバイスは、少なくとも一つのロボットアームを有する、請求項7に記載の方法。
【請求項9】
前記マテリアルストリーム中の前記複数の未知のコンポーネントそれぞれについて、質量を示すデータを算出する、請求項1から8の何れか一項に記載の方法。
【請求項10】
前記流体ジェットによって発生する力は、前記選択された少なくとも一つの未知のコンポーネントの前記質量に基づいて調整される、請求項9に記載の方法。
【請求項11】
前記分離ユニットによって前記マテリアルストリームから前記未知のコンポーネントを物理的に分離することの難易度を示す値が決定され、前記複数の未知のコンポーネントそれぞれに前記難易度を示す値が関連付けられ、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程は、前記難易度を示す値に基づいて行われる、請求項1から10の何れか一項に記載の方法。
【請求項12】
前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから、複数の上位の未知のコンポーネントが選択され、
前記分離ユニットによる物理的分離の実行の前記難易度を示す値に基づいて、前記複数の上位の未知のコンポーネントのサブセットが物理的分離のために選択される、請求項11に記載の方法。
【請求項13】
前記機械学習モデルのインクリメントバージョンは、前記分離された少なくとも一つの未知のコンポーネントの前記グランドトゥルースラベルの前記分析から定期的に得られるデータを用いて定期的にトレーニングされる、請求項1から12の何れか一項に記載の方法。
【請求項14】
前記複数の未知のコンポーネントを一つ以上のクラスタに分け、当該クラスタのそれぞれが類似の特徴および/または特性を有するコンポーネントを含み、特定された未知のコンポーネントには、前記一つ以上のクラスタからの距離に少なくとも部分的に基づいて前記トレーニング報酬が割り当てられる、請求項1から13の何れか一項に記載の方法。
【請求項15】
前記トレーニング報酬は、少なくとも部分的に信頼度スコアに基づく、請求項1から14の何れか一項に記載の方法。
【請求項16】
前記アクセス可能な別の区画は、前記分離された未知のコンポーネントの手動除去を可能にし、
前記アクセス可能な別の区画内に位置する前記分離された未知のコンポーネントについて前記機械学習モデルの内部参照の表示が提供され、
前記少なくとも一つの選択された未知のコンポーネントの前記分析は、少なくとも部分的に人間によるアノテーションによって実行される、請求項1から15の何れか一項に記載の方法。
【請求項17】
前記分離された未知のコンポーネントが分析装置で分析される、請求項1から16の何れか一項に記載の方法。
【請求項18】
特徴付けに基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは、前記アクセス可能な別の区画内の前記分離された未知のコンポーネントの前記特徴付けを自動的に実行するように配置される、請求項17に記載の方法。
【請求項19】
前記分離されたコンポーネントの化学分析に少なくとも部分的に基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは前記分離されたコンポーネントの前記化学分析を実行するように構成される、請求項1から18の何れか一項に記載の方法。
【請求項20】
前記分離されたコンポーネントの破壊測定に少なくとも部分的に基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは前記分離されたコンポーネントの前記破壊測定を実行するように構成される、請求項1から19の何れか一項に記載の方法。
【請求項21】
前記分析ユニットは、エネルギー型または波長分散型蛍光X線分光法、試金法、誘導結合プラズマ発光分光法、誘導結合プラズマ原子発光分光法、誘導結合プラズマ質量分析法、レーザ誘起破壊分光法、赤外線分光法、ハイパースペクトル分光法、X線回折分析法、走査電子顕微鏡法、核磁気共鳴法およびラマン分光法のうちの少なくとも一つを実行するように構成される、請求項1から20の何れか一項に記載の方法。
【請求項22】
前記分離された未知のコンポーネントそれぞれについて前記グランドトゥルースラベルを決定する前に、前記分析ユニットの異なる複数のサブシステムからのデータがアライメントされる、請求項1から21の何れか一項に記載の方法。
【請求項23】
前記一つ以上の特徴は、体積、寸法、直径、形状、質感、色および偏心のうちの少なくとも一つに関するものである、請求項1から22の何れか一項に記載の方法。
【請求項24】
前記マテリアルストリームはコンベアで搬送され、前記マテリアルストリームは前記センサシステムによって走査される、請求項1から23の何れか一項に記載の方法。
【請求項25】
前記マテリアルストリームは不均質ストリームであり、好ましくは、前記マテリアルストリームは、固体廃棄物、生産物、農産物および電池のうちの少なくとも一つを含む、請求項1から23の何れか一項に記載の方法。
【請求項26】
複数の未知のコンポーネントを含むマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングするシステムであって、
前記システムは、プロセッサ、コンピュータ可読記憶媒体、センサシステムおよび分離ユニットを備え、
前記コンピュータ可読記憶媒体は命令を格納しており、前記命令は前記プロセッサによって実行されると、前記プロセッサに、
前記複数の未知のコンポーネントを含む前記マテリアルストリームの撮像を行うべく、前記マテリアルストリームを走査するように前記センサシステムを動作させる工程と、
前記マテリアルストリームの前記画像および/または前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上の特徴を入力として受け取るように構成された機械学習モデルによって、前記マテリアルストリーム中の前記複数の未知のコンポーネントのそれぞれについて、一つ以上のラベルおよび関連するラベル確率を予測する工程と、
前記マテリアルストリーム中の前記複数の未知のコンポーネント内の未知のコンポーネントそれぞれに関連付けられるトレーニング報酬を決定する工程と、
前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に少なくとも部分的に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程と、
選択された前記少なくとも一つの未知のコンポーネントを前記マテリアルストリームから物理的に分離するために前記分離ユニットを動作させる工程であって、前記分離ユニットは前記選択された未知のコンポーネントをアクセス可能な別の区画へと移動させる、前記分離ユニットを動作させる工程と、
前記分離された少なくとも一つの未知のコンポーネントについて、分析を行うことにより前記決定されたグランドトゥルースラベルを受け取る工程であって、前記分離された少なくとも一つの未知のコンポーネントについて前記決定されたグランドトゥルースラベルをトレーニングデータベースに追加する、前記受け取る工程と、
前記物理的に分離された少なくとも一つの未知のコンポーネントの決定された前記グランドトゥルースラベルを使用して、前記機械学習モデルのインクリメントバージョンをトレーニングする工程と、を実行させる、システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の未知のコンポーネントを含むマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングするための方法およびシステムに関する。本発明はさらに、コンピュータプログラム製品に関する。
【背景技術】
【0002】
効果的にデータ分類を行うことは、多くの用途において重要な役割を果たすようになっている。例えば、コンピュータビジョンアプリケーションでは、コンポーネントまたは対象物を認識するために、撮像した画像およびビデオストリームに分類器および統計モデル(例えば、機械学習モデル、回帰モデル)を適用してもよい。分類器の信頼性を保証するべく、分類器をラベル付けされた複数の例を使用してトレーニングする必要がある。このようなシステムは、データを手動でラベル付けしていることが多く、人間の労働力に依存している。
【0003】
マテリアルストリーム内の一つまたは複数のコンポーネントに対して特徴付けを行う重要な用途としては、例えば、リサイクルプロセス、農業プロセス、食品生産プロセス等が挙げられる。例えば、品質管理、価値評価、ならびに、プロセスエンジニアリングおよびプロセス制御において、特徴付けを利用できる。例えば、廃棄物処理では、特徴データが不足しているために、従来より多くの廃棄物ストリームが次善の方法でリサイクルされている。改善するには、異種の物質からなるマテリアルストリーム(例えば、大量の固形廃棄物の流れ)の適切な特徴付け技術が必要である。
【0004】
通常、マテリアルストリームの特徴付けには、人によって、例えば、特別な施設で働く工場職員によって、対象物の手動検査が行われる。この方法は、時間がかかり、主観的であり、費用もかかり、最終的には、マテリアルストリーム内の粒子(particle)に関する情報がほとんど提供されない。別の従来の方法では、サンプルが採取され、例えば、実験室で試験/分析される。このプロセスには時間がかかり(化学分析には数日、数週間~数か月かかる)、コストが増加する場合がある。さらに、マテリアルストリーム内のコンポーネント/物質/対象物の総量のごく一部のみに対して特徴付けが行われる。典型的には、物質の品質を測定するのが難しいため、多くのマテリアルストリームは最適に識別されているとは言えない。より詳細なレベルでデータを提供する、高速で客観的かつ/または自動化された方法が必要である。マテリアルストリームの特徴付けの一例として、廃棄物の特徴付けが挙げられる。
【0005】
機械学習モデルは、人間および/または実験によってラベル付け可能な大量のデータを使用してトレーニングできる統計的分類器である。このようなラベル付けは、労働集約的および/または費用のかかるプロセスになる場合がある。正確な統計システムを構築する際のボトルネックの1つは、高品質のラベル付きデータを取得するために、(手動で)ラベル付けに長い時間を費やさなくてはいけないことである。通常、ラベル付けされるサンプル(新しいデータポイントを参照)は、トレーニングデータがテストセットと一致するようにランダムに選択される。
【0006】
このように、機械学習モデルのトレーニングにおいてグラウンドトゥルース(ground truth:正解)を決定することは、様々なケースおよび用途において労力と時間がかかることから、必要な労力やコストを削減しつつ、十分にトレーニングされた予測モデルを効果的に取得することが強く求められている。このような予測モデルをより効率的に取得することが望まれている。
【発明の概要】
【0007】
本発明の目的は、上述の欠点の少なくとも一つを回避する方法およびシステムを提供することである。
【0008】
これに加えてまたは代えて、本発明の目的は、複数の未知のコンポーネントを含むマテリアルストリーム中のコンポーネントの特徴付けを改善することである。
【0009】
これに加えてまたは代えて、本発明の目的は、コンポーネントラベル予測モデル等の機械学習モデルのトレーニング効率を改善することである。
【0010】
これに加えてまたは代えて、本発明の目的は、改善された廃棄物処理を提供することである。
【0011】
本発明は、複数の未知のコンポーネントを含むマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングする方法を提供する。方法は、前記複数の未知のコンポーネントを含む前記マテリアルストリームの画像化を行うように構成されたセンサシステムによって、前記マテリアルストリームを走査する工程と、前記マテリアルストリームの前記画像および/または前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上の特徴を入力として受け取るように構成された機械学習モデルによって、前記マテリアルストリーム中の前記複数の未知のコンポーネントのそれぞれについて、一つ以上の予測ラベルおよび関連するラベル予測確率を予測する工程と、前記マテリアルストリーム中の前記複数の未知のコンポーネントの未知のコンポーネントそれぞれに関連付けられるトレーニング報酬を決定する工程と、前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に少なくとも部分的に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程であって、選択された前記少なくとも一つの未知のコンポーネントは、分離ユニットによって前記マテリアルストリームから物理的に分離され、前記分離ユニットは、選択された前記少なくとも一つの未知のコンポーネントを、アクセス可能な別の区画に移動させるように構成される、前記選択する工程と、分離された前記少なくとも一つの未知のコンポーネントのグランドトゥルースラベルを決定するために当該少なくとも一つの未知のコンポーネントを分析する工程であって、前記分離された少なくとも一つの未知のコンポーネントの決定された前記グランドトゥルースラベルはトレーニングデータベースに追加される、前記分析する工程と、前記物理的に分離された少なくとも一つの未知のコンポーネントの決定された前記グランドトゥルースラベルを使用して、前記機械学習モデルのインクリメントバージョンをトレーニングする工程と、を備える。
【0012】
トレーニング報酬は、マテリアルストリームの複数のコンポーネントに結び付けられた一つ以上のグランドトゥルースラベルをデータベースに追加することによる、(機械学習)モデル/分類器の性能の向上の予測であってもよい。トレーニング報酬は、性能指標によって示される機械学習モデルの性能の上昇の予測であってもよい。例えば、アプリケーションに応じて、異なる性能指標を用いることができる。例えば、性能指標は、精度、純度、歩留まり等とすることができる。多くの異なる性能指標やスコアを使用することができる。
【0013】
選択されたコンポーネントをマテリアルストリームから分離することにより、グランドトゥルースラベルを決定するための分析を実行することができる。得られた情報は、トレーニングプロセス中に機械学習モデルにフィードバックすることができる。このようにして、漸進的にトレーニングされた機械学習モデルの精度を高めることができる。グランドトゥルース決定のためにラベル付けされた場合、機械学習モデルによる分類(ラベル付けの予測を参照)の性能および/または精度を最大限に改善するであろう、マテリアルストリーム中のコンポーネントを1つまたは複数選択してもよい。システムは、マテリアルストリーム中の他のコンポーネントよりもモデルの学習改善をもたらすであろうコンポーネントを選択し、物理的に分離してもよい。
【0014】
機械学習モデルを学習するための手動の/実験の労力は、能動学習、半教師付き学習、教師なし学習の技術を組み合わせることで効果的に削減することができる。本システムは、更なる分析のために1つ以上の未知のコンポーネントを物理的に分離するための分離吸値ユニットを備える。1つ以上の未知のコンポーネントの選択は、信頼度スコア、予測確率、エントロピー、特徴空間における密度等を用いて実施してもよい。
【0015】
機械学習モデルは、トレーニングのために能動学習を採用してもよい。機械学習モデルは、学習データを能動的に選択することができる学習器と見なすことができる。物理的な能動学習は、選択された学習データを提供するために、分析されるべきマテリアルストリーム中の選択されたコンポーネントを物理的に分離するための手段を含んでもよい。能動学習では、実験、結果の学習、次の実験のコンポーネントの選択というサイクルが繰り返されるため、実験の総量を減らすことが可能である。結果の学習および次の実験のコンポーネントの選択は、コンピュータが行う。このシステムには、選択されたコンポーネントをマテリアルストリームから物理的に分離するための分離装置ユニットを備える。少ない実験回数または実験量で、多くの結果を得ることができる。この物理的能動学習は、コスト、労力、時間のかかるコンポーネントを分析するための実験を適切に設計するための実験設計に利用することができる。
【0016】
前記機械学習モデルは、前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上のユーザ定義の特徴を入力として受け取るように構成されてもよい。
【0017】
前記少なくとも一つの未知のコンポーネントを選択する工程における選択について、ユーザが作成した選択基準を採用してもよい。
【0018】
前記分離ユニットは、異なる複数の分離技術を採用する複数のサブユニットを含んでもよい。
【0019】
前記分離ユニットは、少なくとも第1のサブユニットと第2のサブユニットとを有し、前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの前記一つ以上の特徴に基づいて、前記選択された少なくとも一つの未知のコンポーネントの物理的分離のために、前記第1のサブユニットおよび前記第2のサブユニットのうちの一方が選択されてもよい。
【0020】
複数の未知のコンポーネントのある特性に応じて、分離ユニットの適切なサブユニットを使用して、マテリアルストリームから未知のコンポーネントを分離することができる。例えば、未知のコンポーネントの質量や大きさ等に応じて、異なる分離技術が必要になる場合がある。例えば、紙は流体吹き付け手段を用いて分離した方がよく、金属の塊は機械的手段を用いて分離した方がよい。未知のコンポーネントの1つ以上の特徴がマテリアルストリームの画像から抽出されるため、このデータを取得可能であり、適切なサブユニットを選択するために有利に使用することができる。
【0021】
前記第1のサブユニットは、前記マテリアルストリーム中のより小さいおよび/またはより軽いコンポーネントの物理的分離に使用され、前記第2のサブユニットは、前記マテリアルストリーム中のより大きいおよび/またはより重いコンポーネントの物理的分離に使用されてもよい。
【0022】
いくつかの例では、機械学習モデルは更に、マテリアルストリームから選択された未知のコンポーネントを物理的に分離するのにどの分離技術が最も適切であるかを制御することが可能である。
【0023】
前記第1のサブユニットは、コンポーネントを前記アクセス可能な別の区画へと吹き飛ばすために、前記コンポーネントに向かって流体ジェットを向けて前記コンポーネントを分離するように構成され、前記第2のサブユニットは、機械的マニピュレーションデバイスを使用してコンポーネントを分離するように構成されてもよい。
【0024】
前記第2のサブユニットの前記機械的マニピュレーションデバイスは、少なくとも一つのロボットアームを含んでもよい。
【0025】
前記マテリアルストリーム中の前記複数の未知のコンポーネントそれぞれについて、質量を示すデータを算出してもよい。
【0026】
必要に応じて、少なくとも低エネルギーX線画像と高エネルギーX線画像とを得るためのマルチエネルギーイメージングを行うように構成されたX線センサを含むセンサシステムにより、マテリアルストリーム中のコンポーネントの走査が行われてもよい。センサシステムによって得られた画像は、画像中の区別可能な一つ以上の対象物を分離するために分割されてもよく、セグメント化された対象物の面積を示すデータが決定される。分割された対象物のそれぞれについて、面積密度を示すデータおよび原子番号を示すデータが、低エネルギーX線画像および高エネルギーX線画像の解析によって決定されてもよい。面積密度および原子番号が既知の異なる複数のマテリアルを使用してマルチエネルギーX線イメージングを行うことにより校正されるモデルによって、面積密度および原子番号を示すデータが決定される。面積密度を示すデータおよび面積を示すデータに基づいて、セグメント化された対象物のそれぞれについて質量を示すデータが計算されてもよい。
【0027】
前記流体ジェットによって発生する力は、前記選択された少なくとも一つの未知のコンポーネントの前記質量に基づいて調整されてもよい。
【0028】
前記分離ユニットによって前記マテリアルストリームから前記未知のコンポーネントを物理的に分離することの難易度を示す値が決定され、前記複数の未知のコンポーネントそれぞれに前記難易度を示す値が関連付けられてもよい。前記マテリアルストリームから前記未知のコンポーネントを物理的に分離することの困難さを示す値に基づいて、前記マテリアルストリーム中の複数の未知のコンポーネントから前記少なくとも一つの未知のコンポーネントを選択されてもよい。
【0029】
分離の難易度をランク付けすることで、機械モデルの学習効率を大幅に向上させることができる場合がある。マテリアルストリームからの分離が困難なコンポーネントを分離することは、グランドトゥルース分析に失敗する可能性がある。このような場合、その他の未知のコンポーネント候補を選択すること可能であったにもかかわらず選択しなかった結果として、学習性能が低下してしまうことがある。本発明では、分離の難しさも考慮することにより、このような事態を効果的に防止することができる。例えば、未知のコンポーネントを物理的に分離することが困難な場合、どの程度未知のコンポーネントが遮られているか(例えば、周りにあるものによって)が重要な役割を果たす場合がある。また、その他のコンポーネントが付着している可能性もあるため、解析に影響を与える可能性もある。いくつかの例では、分離精度および/または分離純度の予測または推定が、どの少なくとも一つの未知のコンポーネントが物理的分離のためにマテリアルストリーム中の複数の未知のコンポーネントから選択されるかに基づいて決定される。
【0030】
前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから、複数の上位の未知のコンポーネントが選択され、前記分離ユニットによる物理的分離の実行の前記難易度を示す値に基づいて、前記複数の上位の未知のコンポーネントのサブセットが物理的分離のために選択されてもよい。
【0031】
必要に応じて、トレーニング報酬は、1つ以上の報酬指標に基づいて計算されてもよい。トレーニング報酬は、ユーザによって提供されることも想定される(例えば、専門家の知識に基づく推定)。
【0032】
機械学習モデルまたは学習機械は、明示的にプログラムされていないタスクを実行するために、1つ以上の機械学習アルゴリズムに依存する計算上の実体として理解され得る。特に、機械学習モデルは、その挙動を環境に適応させることができる。マテリアルストリーム中のコンポーネントの特徴付けおよび検出のコンテキストにおいて、マテリアルストリームはしばしば変化する条件と要件に直面するため、この適応能力は非常に重要である。システムは、リアルタイムで動作すべく、新しい受信データを取り込むように構成されてもよい。新しいデータポイントを追加することにより、どの時点においても機械学習モデルの知識を増やすことができる。バッチモードでは、大規模なデータセットを収集し、データセット全体を一度に処理することができる。インクリメントモードでは、機械学習モデルを随時新しいデータで増強することができる(軽量で適応性が高い)。
【0033】
前記機械学習モデルのインクリメントバージョンは、前記分離された少なくとも一つの未知のコンポーネントの前記グランドトゥルースラベルの前記分析から定期的に得られるデータを用いて定期的にトレーニングされてもよい。
【0034】
本発明によれば、能動学習を採用することにより、ラベル付けするトレーニング例の数を大幅に減らすことができる。したがって、ラベル付けされていない例を調査し人間(例えば、少なくとも部分的に手動)および/または機械がラベル付けするために、与えられたコスト関数に関連して最も有益な例が選択的にサンプルされる。有利には、能動学習アルゴリズムは、最大の性能向上をもたらす(物理的)ラベル付けのための例を効果的に選択する方法を提供し得る。
【0035】
いくつかの例では、次に分析されるべきコンポーネントは、特徴空間におけるその他のコンポーネントからの(クラスタの)距離に基づいて選択される。しかしながら、その他の技術も使用できる。例えば、統計的手法を採用することができ、この手法では、将来の機械学習モデルの少なくとも一つの統計的特性(例えば、学習器分散)が最適化されるように、コンポーネントが分析のために選択され分離される。いくつかの例では、コンポーネントの選択は、分類器のアンサンブルの不一致量のレベルに基づいて実行される。マテリアルストリームにおいて特定されたコンポーネントのそれぞれに結び付けられたトレーニング報酬を決定するために、その他の手法も想定されることは理解されよう。
【0036】
前記複数の未知のコンポーネントを一つ以上のクラスタに分け、当該クラスタのそれぞれが類似の特徴および/または特性を有するコンポーネントを含み、特定された未知のコンポーネントには、前記一つ以上のクラスタからの距離に少なくとも部分的に基づいて前記トレーニング報酬が割り当てられてもよい。
【0037】
本発明は、例えばニューラルネットワークの実装を有する機械学習モデルにおける確実性予測によってトレーニング報酬の制御を可能にする。しかしながら、機械学習モデルによる予測ラベルの予測の不確実性/信頼性に基づいてトレーニング報酬を決定してもよいことが理解されよう。また、その他の実装も想定される。場合によっては、機械学習モデルによって以前に処理されたことのないマテリアルストリームのコンポーネントが観察されることがある。このような場合、モデルは、それがある分類(予測ラベル)に属するとかなり高い確実性で判定可能であるが、実際には、そのコンポーネントは、モデルがまだ観察していない分類に属する。これは、コンポーネントの不確実性ではなく、特徴空間におけるクラスタを分析することで克服できるかもしれない。コンポーネントが特徴空間において現在観測されている全てのクラスタから遠い場合、コンポーネントの位置またはクラスタまでの距離に基づいて選択を行うことができる。これは、異常や外れ値の検出とみなすことができる。
【0038】
有利には、機械学習モデルのトレーニングにおいて多様性が効果的に考慮され得る。例えば、物理的な能動的機械学習システムは、観測された全ての未知のコンポーネント(すなわち、ラベル付けされていない観測値)にわたる多様な新しい未知のコンポーネント(すなわち、ラベル付けされていない観測値)を選択してもよい。このようにして、(物理的な)能動的機械学習システムは、より質の高いトレーニングセットを組み立てることができる。
【0039】
クラスタ化アルゴリズムを使用して、異なる複数のクラスタを区別し、クラスタが互いに本質的に異なるかどうかを確認してもよい。クラスタの深部に位置していると特定されたコンポーネントは低い不確実性を有し、一方、コアから遠く離れた粒子またはいくつかのクラスタの間にある粒子は高い不確実性を有し得る。1つ以上の次元でクラスタおよびその境界をより正確に決定するように、トレーニング報酬をクラスタに結び付けることができる。
【0040】
前記トレーニング報酬は、少なくとも部分的に信頼度スコアに基づいてもよい。
【0041】
マテリアルストリーム中の特定されたコンポーネントに結び付けられたラベルなしデータポイントそれぞれの不確実性と多様性とに基づいて、トレーニングスコアを決定することができる。いくつかの例では、上位n個のスコアを有するデータポイントがバッチで選択され、ここでnはバッチサイズに対応する。バッチサイズは、ラベル付けされていないマテリアルストリームから選択されるデータポイント(成分を参照)の数として理解できる。手動および/または実験的アノテーションのために、選択されたコンポーネントをマテリアルストリーム内のその他のラベル付されていないコンポーネントから分離してもよい。
【0042】
物理的能動学習を使用して、機械学習モデルをより効率的にトレーニングすることが可能である。モデルは、手動/人間によるラベル付けデータではなく、実験的にラベル付けされたデータ(例えば、手動判定、自動化判定)を用いて、マテリアルストリーム中の複数の未知のコンポーネントから選択されたセットでトレーニングさせることができる。
【0043】
能動学習プロセスにおいて、機械学習モデルは最初に、グランドトゥルースデータの第1のセットを使用してトレーニングされてもよい。この第1のセットは、例えば、手動で生成されるまたはモデルによって自動的に生成される小さなセットであってよい。センサシステムを用いて、複数の未知のコンポーネントから1つ以上の未知のコンポーネントを、トレーニングデータを提供するための候補として認識してもよい。例えば、機械学習モデルによって現在誤って認識されている候補を予測するために、トレーニング報酬(例えば、信頼度尺度)が採用されてもよい。例えば、選択された1つ以上の未知のコンポーネントは、使用された(トレーニングされた)機械学習モデルによって認識誤りを有する可能性が高いケースに対応してもよい。その後、1つ以上の未知のコンポーネントは、分離ユニット(例えば、分離タスクを実行するための1つ以上のセンサを有するロボット構成)により物理的に分離され、グランドトゥルースを決定するための更なる分析を可能にする。例えば、人間は、分離された選択された一つ以上の未知のコンポーネントを手動で確認してもよい。これに加えてまたは代えて、分離された選択された一つ以上の未知のコンポーネントを実験的に決定するために機械および/またはその他のセンサ装置を使用することができる。
【0044】
必要に応じて、複数のコンポーネントを同時に選択し、一度に一つのインスタンスで分離してもよい。これは、特徴空間とターゲット(ラベル/従属変数)空間との間に弱い相関がある場合に相当する。必要に応じて、分離のために複数のコンポーネントを選択することは、機械学習モデルによって予測されたラベルに基づいてもよい。
【0045】
必要に応じて、複数の特定された未知のコンポーネントは、選択的にサンプリングされた順序を導出するために、選択のための候補としてトレーニング報酬に基づいて順序付けられてもよい。選択的にサンプリングされた順序に従う上位の識別された未知のコンポーネントは、そのグランドトゥルースラベルを決定するために分離および分析される。機械学習モデルのインクリメントバージョンは、グランドトゥルースラベルに基づいてトレーニングされてもよい。
【0046】
必要に応じて、機械学習モデルは、プールベースの能動学習を採用するように構成されてもよい。機械学習モデルが、マテリアルストリーム中の特定されたコンポーネントに結び付けられたラベル付けされていないデータポイントのプールにさらされる。機械学習モデルは、グランドトゥルースを決定するための少なくとも部分的に手動および/または少なくとも部分的に自動(例えば、測定装置を用いて)のアノテーションのために、マテリアルストリーム中の複数のコンポーネントのうちの一以上のコンポーネントを反復して選択するように構成されてもよい。
【0047】
前記アクセス可能な別の区画は、前記分離された未知のコンポーネントの手動除去を可能にし、前記アクセス可能な別の区画内に位置する前記分離された未知のコンポーネントについて前記機械学習モデルの内部参照の表示が提供され、前記少なくとも一つの選択された未知のコンポーネントの前記分析は、少なくとも部分的に人間によるアノテーションによって実行されてもよい。
【0048】
必要に応じて、機械学習モデルは順次クエリベースであってもよく、一度に一つのコンポーネントが選択され、更なる分析のために分離される。
【0049】
必要に応じて、機械学習モデルはバッチモードベースであってもよく、機械学習モデルを更新する前に、(例えば同時)分析のためにコンポーネントのバッチが選択され分離される。
【0050】
前記分離された未知のコンポーネントが分析装置で分析されてもよい。
【0051】
特徴付けに基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは、前記アクセス可能な別の区画内の前記分離された未知のコンポーネントの前記特徴付けを自動的に実行するように配置されてもよい。いくつかの例では、分離された未知のコンポーネントは、分析ユニットによって自動的に分析されてもよい。
【0052】
前記分離されたコンポーネントの化学分析に少なくとも部分的に基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは前記分離されたコンポーネントの前記化学分析を実行するように構成されてもよい。
【0053】
前記分離されたコンポーネントの破壊測定に少なくとも部分的に基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは前記分離されたコンポーネントの前記破壊測定を実行するように構成されてもよい。
【0054】
前記分析ユニットは、エネルギー型または波長分散型蛍光X線分光(XRF)法、試金法、誘導結合プラズマ発光分光(ICP-OES)法、誘導結合プラズマ原子発光分光(ICP-AES)法、誘導結合プラズマ質量分析(ICP-MS)法、レーザ誘起破壊分光(LIBS)法、(近)赤外線(NIR)分光法、ハイパースペクトル分光法、X線回折分析(XRD)法、走査電子顕微鏡(SEM)法、核磁気共鳴(NMR)法およびラマン分光法のうちの少なくとも一つを実行するように構成されてもよい。また、グランドトゥルースを決定するために、測定技術を組み合わせてもよい。
【0055】
前記分析ユニットは、センサシステムに関してオフラインモードで測定を実行するように構成されてもよい。また、前記分析ユニットは、分離された対象物のグランドトゥルースラベルを決定するためにバッチ処理モードで動作するように構成されてもよい。いくつかの例では、前記分析ユニットは、ある時間遅延(例えば、数分)を伴って、ほぼリアルタイムで測定を実行するように構成される。いくつかの例において、前記分析ユニットはまた、比較的速いフィードバックを提供するように構成されてもよく、例えば、リアルタイムまたは準リアルタイムで動作する(例えば、オンライン測定)ことが理解されよう。
【0056】
いくつかの例では、前記分析ユニットは、遅延測定(例えば、非リアルタイム)を実行するように構成されてもよい。
【0057】
必要に応じて、前記分析ユニットは、選択された対象物のグランドトゥルースを決定するための不連続的、周期的および/または間欠的な測定を実行するように構成される。前記分析ユニットによって実行される測定技術は、延長された、継続的なまたは比較的長期の測定プロセスを必要とする場合がある。
【0058】
前記分析ユニットによって採用される一つ以上の測定技術は、時間がかかるおよび/または少なくとも部分的に破壊的であり得る準備段階を必要とする場合がある。いくつかの例では、一つ以上の測定技術は、リアルタイムで実行されない。採用される測定技術は、比較的高価であってもよいおよび/または人手を必要とする。
【0059】
必要に応じて、前記分析ユニットは、非画像化測定を実行する。いくつかの例では、前記分析ユニットは、例えば、画像を生成しない等、(光学)画像化技術を実行しない。例えば、分析ユニットは、化学分析に基づく測定を実行するように構成されてもよい。
【0060】
必要に応じて、センサシステムは、少なくとも低エネルギーX線画像と高エネルギーX線画像とを得るためのマルチエネルギーイメージングを行うように構成されたX線センサを含んでもよい。前記センサシステムによって得られた画像は、当該画像中の1つまたは複数の異なる未知のコンポーネントを分離するために分割される。分割された前記対象物の面積を示すデータが決定される。分割された未知のコンポーネントそれぞれについて、面積密度を示すデータ並びに原子番号および/または化学成分を示すデータが、低エネルギーX線画像および高エネルギーX線画像の解析によって決定されてもよい。面積密度および原子番号が既知の異なる複数のマテリアルを使用してマルチエネルギーX線イメージングを行うことにより校正されるモデルによって、面積密度および原子番号を示すデータが決定される。分割された対象物の面積密度を示すデータおよび面積を示すデータに基づいて、分割された未知のコンポーネントそれぞれについて質量を示すデータが計算されてもよい。
【0061】
前記X線センサは、デュアルエネルギーX線センサであってもよい。
【0062】
前記センサシステムは、分割されたオブジェクトの体積を示すデータを決定するための深度画像化ユニットをさらに含む。
【0063】
前記深度画像化ユニットは、3次元レーザ三角測量ユニットまたは3次元カメラのうちの少なくとも一方を含む。
【0064】
前記センサシステムは、分割された対象物のカラー画像を撮影するように構成されたカラー画像処理ユニットをさらに含んでもよい。
【0065】
1つ以上の分割された対象物のそれぞれについて特徴を決定する前に、前記センサシステムの異なるサブシステムからのデータはアライメントされてもよい。
【0066】
1つ以上の分割された対象物のそれぞれについて、体積、寸法、直径、形状、テクスチャ、色または偏心の少なくとも1つに関する特徴量をさらに決定してもよい。
【0067】
マテリアルストリームはコンベアで搬送され、前記マテリアルストリーム中の対象物を特徴付けるために、当該マテリアルストリームがセンサシステムによって走査される。
【0068】
デジタルツインモデルを構築するために、1つ以上の分割された対象物の特徴を保存してもよい。
【0069】
第1のデジタル識別マーカを決定するためにマテリアルストリームが搬送前に特徴付けられた後、離れた場所へ搬送され、第2のデジタル識別マーカを決定するために前記マテリアルストリームが特徴付けられ、輸送中のコンテンツの変化を決定するために前記第1および第2のデジタル識別マーカを互いに対して比較する。
【0070】
前記マテリアルストリームは、不均質であってもよい。
【0071】
マテリアルストリームは、固形廃棄物、生産物、農産物または電池からなる群から選択されてもよい。
【0072】
一般的に、マテリアルストリームにおける対象物/コンポーネントの特徴づけに対する従来のアプローチは、人が手作業で対象物を検査することである。これは、廃棄物の流れの中で行われることが多い。さらにこの作業は、小さすぎる、つまり代表的でないサンプルの表面的な目視検査によって行われることがよくある。この作業は面倒で時間がかかるだけでなく、その主観的な性質から、結果として得られる結論が必ずしも信頼できるとは限らない。品質管理はマテリアルストリーム(例えば、廃棄物の流れ)のコンポーネントの特徴づけの重要な目的であり、中古品の品質が変動すると市場の関心が低下してしまうので、このような作業は循環経済への移行を阻害するものである。本発明は、より詳細なレベルのデータを利用した、高速で客観的かつ正確な自動化手法を提供するものである。自動検査は人工知能(AI)によって行われ、マテリアルストリームのコンポーネント特徴付けを、データ駆動型かつ自動化されたアプローチへと移行させる。
【0073】
前記機械学習モデルは、オンライン学習モデルまたは連続学習モデルであってもよく、選択された分離された未知のコンポーネント(サンプルを参照)の新規分析の各々で更新されるように構成される。分析は、例えば、ユーザによる分類(例えば、少なくとも部分的に手動)または分析ユニット(例えば、実験的決定)を用いた完全自動化で実行されてもよい。グランドトゥルースラベルを決定するための自動解析と手動解析との組み合わせも想定される。
【0074】
必要に応じて、深層学習機械学習モデルが採用される。深層学習とは表現学習方法を採用した機械学習技術のクラスであり、機械に生データを与えてデータ分類に必要な表現を決定することを可能にしている。深層学習は、深層学習機械モデルの内部パラメータ(例えば、ノード重み)を変更するのに使用される逆伝播アルゴリズムを用いて、データセットにおける構造を確認することができる。深層学習機械は、様々な多層アーキテクチャおよびアルゴリズムを利用してもよい。
【0075】
ニューラルネットワーク環境での深層学習は、ニューロンと呼ばれる多数の相互接続されたノードを含み得る。外部から活性化された入力ニューロンは、ニューラルネットワークのパラメータによって支配されるその他のニューロンへの接続に基づいて、その他のニューロンを活性化する。ニューラルネットワークは、それ自身のパラメータに基づいてある種の振る舞いをすることができる。深層学習モデルをトレーニングすることで、ニューラルネットワークが望ましい振る舞いをするように、ネットワーク内のニューロン間の接続を表すモデルパラメータを改良する(例えば、マテリアルストリーム中のコンポーネントを分類する等、意図するタスクでより良い振る舞いをするようにする)。
【0076】
深層学習は、多くのデータセットが、低レベルの特徴(例えば、エッジ)から高レベルの特徴(例えば、パターン、オブジェクト等)までの特徴の階層を含んでいるという理解に基づいて動作する。例えば、画像を調べている時に、対象物を探すのではなく、モデルは探している対象物を形成するモチーフを形成するエッジを探すようになる。学習した観測可能な特徴とは、機械学習モデルが学習したオブジェクトおよび定量的な規則性等である。機械学習モデルは、良好に分類された大量のデータを与えられると、新しいデータをうまく分類するのに必要な特徴を区別して抽出することができるようになる。
【0077】
前記機械学習モデルは、畳み込みニューラルネットワーク(CNN)を利用してもよい。いくつかの例では、深層学習は、データ内の学習された観察可能な特徴を見つけ出し識別するために、畳み込みニューラルネットワークのセグメント化を利用できる。CNNアーキテクチャの各フィルタまたは層は、入力データを変換して、データの(特徴)選択性および頑健性を向上させることができる。このようにデータを抽象化することで、機械は分類しようとしているデータ中の特徴に集中し、無関係な背景情報を無視することができる。畳み込みニューラルネットワーク(CNN)を用いた深層学習機械モデルは、画像解析に利用することができる。
【0078】
本発明の別の側面によれば、複数の未知のコンポーネントを含むマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングするシステムを提供する。前記システムは、プロセッサ、コンピュータ可読記憶媒体、センサシステムおよび分離ユニットを備え、前記コンピュータ可読記憶媒体は命令を格納しており、前記命令は前記プロセッサによって実行されると、前記プロセッサに、前記複数の未知のコンポーネントを含む前記マテリアルストリームの撮像を行うべく、前記マテリアルストリームを走査するように前記センサシステムを動作させる工程と、前記マテリアルストリームの前記画像および/または前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの1つ以上の特徴を入力として受け取るように構成された機械学習モデルによって、前記マテリアルストリーム中の前記複数の未知のコンポーネントのそれぞれについて、一つ以上のラベルおよび関連するラベル確率を予測する工程と、前記マテリアルストリーム中の前記複数の未知のコンポーネント内の未知のコンポーネントそれぞれに関連付けられるトレーニング報酬を決定する工程と、前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に少なくとも部分的に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程と、選択された前記少なくとも一つの未知のコンポーネントを前記マテリアルストリームから物理的に分離するために前記分離ユニットを動作させる工程であって、前記分離ユニットは前記選択された未知のコンポーネントをアクセス可能な別の区画へと移動させる、前記分離ユニットを動作させる工程と、前記分離された少なくとも一つの未知のコンポーネントについて、分析を行うことにより前記決定されたグランドトゥルースラベルを受け取る工程であって、前記分離された少なくとも一つの未知のコンポーネントについて前記決定されたグランドトゥルースラベルをトレーニングデータベースに追加する、前記受け取る工程と、物理的に分離された少なくとも一つの未知のコンポーネントについて決定されたグランドトゥルースラベルを使用して、機械学習モデルのインクリメントバージョンをトレーニングする工程と、を実行させる命令が含まれる。
【0079】
トレーニングセットに含めるべきマテリアルストリームの特定のコンポーネントを選択する方法は、特定された各コンポーネントをトレーニングセットに含めることによって得られる「報酬」の推定値(性能上昇の推定値)に基づいてもよい。そして、機械学習モデルをさらにトレーニングするために、マテリアルストリームの選択された特定のコンポーネントを分離して分析してもよい。報酬は、マテリアルストリームのラベル付けされていないコンポーネントに関連する不確実性に基づいてもよい。しかしながら、トレーニング報酬は、特徴空間におけるコンポーネントの特定されたクラスタリングに基づいてもよい。
【0080】
能動学習は、アルゴリズムが新しいデータポイントについて所望の出力(例えば、マテリアル特性、マテリアルの種類、マテリアルの特徴、化学分析、色、形状特性、質量、密度等の少なくとも1つ)を得るために情報源に対話的に問い合わせることができる機械学習の特定の分野である。本発明によって提供される物理的能動学習では、分離装置ユニットが、1つ以上の新しいデータポイントを提供する更なる分析のために、マテリアルストリーム中の1つ以上の選択された未知のコンポーネントを物理的に分離するために使用される。物理的能動学習モデルは、入力データポイントの「最適性」を示すトレーニング報酬(例えば、加重スコア)に従って、行うべき測定を決定することが可能である。いくつかの例では、このトレーニング報酬は、入力データ情報のみを用いて決定および/または計算されてもよい。
【0081】
ユーザ(例えば、専門家またはオペレータ)は、分離および解析のために、コンポーネントの選択に追加の基準を課してもよい。いくつかの例では、トレーニング報酬は常に計算されるわけではないが、ユーザによって仮定されてもよい。所定の(例えば、経験/知識ベースの)仮定に基づいて機械学習モデルをトレーニングするためのグランドトゥルースを決定するために、コンポーネントが選択され分離および分析されてもよい。マテリアルストリーム中のコンポーネントの物理的分離は、例えば、コンポーネントの特性(例えば、形状、密度、...)に少なくとも部分的に基づいて実行することができる。
【0082】
いくつかの例では、センサシステムは、2D-カメラ、3D-カメラ、X線撮像システム等の1つ以上の撮像装置を含む。また、コンピュータ断層撮影(CT)システム、磁気共鳴画像(MRI)システム等のその他の撮像装置を使用することも可能である。また、複数の撮像装置を組み合わせて使用することも可能である。例えば、3DカメラシステムとX線システムとの組み合わせも可能である。
【0083】
一態様によれば、本発明は、グランドトゥルースラベルを決定するべくさらなる分析のために、マテリアルストリーム中の1つ以上のコンポーネントを選択的に分離する手段を有するシステムおよび方法を提供する。1つ以上のコンポーネントはその特定の特徴に基づいて選択され、グランドトゥルースラベルは、マテリアルストリーム中のコンポーネントそれぞれについて予測ラベルを得るために使用する機械学習モデルの能動学習トレーニングに使用される。いくつかの例では、グラウンドトゥルース決定のための分離および更なる分析のために1つ以上のコンポーネントを選択することは、例えば、ユーザによって提供される選択基準(例えば、高密度のコンポーネント、色等のいくつかの視覚特性を有するコンポーネント、特定の形状を有するコンポーネント等の選択)に基づいてもよい。例えば、専門家は、選択されたコンポーネントについてグランドトゥルースを決定することが、モデルに大きなトレーニング報酬を与えるか否かを推定することができる。有利には、機械学習モデルのトレーニングに使用される選択されたコンポーネントの物理的分離を提供するセンサを備えた分離装置を得てもよい。
【0084】
機械学習モデルは、ランダムに選ばれた複数の例から学習する(受動学習)のではなく、ラベル付けされる例に動作するようにすることができ、これは能動学習と見なすことができる。能動学習を用いると、トレーニングデータのサブセットを用いて、より良い性能を得ることができる。本発明は、マテリアルストリームからコンポーネントを物理的に分離するように配置された分離装置ユニットが提供される物理的能動学習を採用する。
【0085】
機械学習モデルは、コンピュータの処理能力を使用してアルゴリズムを実行し、データの挙動または特性の予測因子を学習してもよいことが理解されよう。機械学習技術は、特定の特性/特徴を示すことが知られているコンポーネントのセット等、既知の分類またはラベルを有するトレーニングサンプルのセット(トレーニングセット)に対してアルゴリズムを実行し、未知のコンポーネントが特定の分類またはグループに属するかどうか等、未知のものの動作または特徴を予測する特徴を学習してもよい。
【0086】
ラベル付けは、様々な方法で様々なエンティティによって実行され得ることが理解されよう。例えば、ラベル付けは、機械学習モデルによって実行され得る(すなわち、予測ラベルを提供する)。一方で、ラベル付けは、グランドトゥルースラベルを決定するために実行することもできる(例えば、分析者、人間の注釈者、実験セットアップ等によって実施される)。
【0087】
トレーニング報酬は、トレーニング報酬または能動的報酬と見なすことができることが理解されるであろう。グランドトゥルースでラベル付けされ機械学習モデルのトレーニングに使用された場合に、その性能がどの程度向上するかについての予測および/または示唆として理解することができる。トレーニング報酬は、マテリアルストリームの選択されたコンポーネントに関連する決定されたグランドトゥルースラベルを使用してトレーニングすることによる機械学習モデルの改善を示してもよい。トレーニング報酬は、機械学習プロセスにおける学習報酬として理解することができる。
【0088】
様々な能動学習技術を実装できることが理解されよう。能動学習技法は、トレーニングセットを選択する際に、知識または「ノウハウ」の最大利得を提供するアクションを選択するように構成されてもよい。能動学習技術は、「知識」および知識の利得が定量化される方法に関して様々であってもよい。また、どのアクションが最大の知識獲得につながりやすいかを決定する方法も様々であってもよい。様々な実装が可能である。
【0089】
方法の観点で説明された態様、特徴およびオプションは何れも、本発明のシステムおよび説明されたリサイクル装置に等しく適用されることが理解されるであろう。上記の態様、特徴、およびオプションの何れか一つ以上の組み合わせが可能であることも明らかとなるであろう。
【図面の簡単な説明】
【0090】
本発明を、図面に示される例示的な各実施形態に基づいて更に説明する。例示的な各実施形態は、非限定的な例示として与えられる。各図面は本発明の実施形態を模式的に示したものに過ぎず、非限定的な例として与えられることに留意すべきである。
【0091】
【
図5】複数の異なるコンポーネント種類の特徴の分布を示す。
【発明を実施するための形態】
【0092】
教師あり機械学習では、オブジェクト各々にラベルが付された(大きな)マテリアルストリームでモデルのトレーニングを行う。ラベルは、マテリアルストリーム中で識別されたコンポーネント/対象物それぞれの材質の種類(金属、木材、ガラス、セラミック等)を示してもよく、マテリアルストリーム内のコンポーネント/対象物をどのように正しく分類すべきか機械学習モデルが学習するために使用できる。複数の異種の物質からなるストリームから何千ものコンポーネントまたは粒子を丹念に選択することは時間とコストのかかる作業であるため、ラベル付きデータの決定および/または準備が、トレーニングプロセスのボトルネックとなることが多い。マテリアルストリーム中には、ラベルの付いていないデータが豊富にあり容易に取得できるが、ラベルの付いたデータは少なく取得が困難な場合がある。さらに、新しいマテリアルストリームを考えるたびに、ラベル付けプロセス全体を最初から最後まで繰り返さなければならない場合がある。本発明は、トレーニングデータセット全体を使用する教師ありモデルと同等の精度を実質的に確保しながら、ラベル付コストを大幅に削減できる、マテリアルストリーム中のコンポーネントのデータ主導型の特徴付けを採用するものである。能動学習を採用することにより、機械学習モデル自身が、マテリアルストリーム中のラベル付けが必要なコンポーネント(物体、粒子等)の最適な小さな部分集合(サブセット)を選択することができるようになる。このラベル付けされた小さな部分集合のみを使って機械学習モデルをトレーニングさせると、マテリアルストリーム中のコンポーネント全てを使ってトレーニングした場合に匹敵する性能を持つモデルが得られる。
【0093】
図1は、未知のコンポーネント3iを含むマテリアルストリーム3中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングするためのシステム1の実施形態の概略図である。システム1は、プロセッサ、コンピュータ可読記憶媒体、センサシステム5および分離装置ユニット100を含む。コンピュータ可読記憶媒体には、プロセッサによって実行されるとプロセッサに以下に記す工程を行わせる命令が格納されている。複数の未知のコンポーネント3iを有するマテリアルストリーム3の撮像を行うべく、マテリアルストリーム3を走査するようにセンサシステム5を動作させる工程と;マテリアルストリーム3の画像および/またはマテリアルストリーム3の画像から抽出された未知のコンポーネントの一つ以上の特徴を入力として受け取るように構成された機械学習モデルによって、マテリアルストリーム3中の未知のコンポーネント3iそれぞれについて、一つ以上のラベルおよび関連するラベル確率を予測する工程と;マテリアルストリーム3中の複数の未知のコンポーネント3iのコンポーネント3i各々に関連するトレーニング報酬を決定する工程と;未知のコンポーネント3iに関連付けられたトレーニング報酬に少なくとも部分的に基づいて、マテリアルストリーム3中の複数の未知のコンポーネント3iから少なくとも一つの未知のコンポーネントを選択する工程と;選択された少なくとも一つの未知のコンポーネントをマテリアルストリーム3から物理的に分離するために分離装置ユニット100を動作させる工程であって、分離装置ユニット100は、選択された未知のコンポーネントをアクセス可能な別の区画101に移動させる工程と;分析を行うことにより、分離された少なくとも一つの未知のコンポーネントについて決定されたグランドトゥルースラベルを受け取る工程であって、分離された少なくとも一つの未知のコンポーネントについて決定されたグランドトゥルースラベルをトレーニングデータベースに追加する、工程と;物理的に分離された少なくとも一つの未知のコンポーネントについて決定されたグランドトゥルースラベルを使用して、機械学習モデルのインクリメントバージョンをトレーニングする工程と、を実行させる命令が含まれる。
【0094】
この実施形態の一例では、分離装置ユニットは、選択されたコンポーネントを自動的に区画101内へと分離するロボットアームを備える。グランドトゥルース決定に関してさらに分析するために、選択されたコンポーネントをマテリアルストリーム3から区画101へと選択的に移動させるには、他の手段も採用され得ることが理解されよう。これは、例えば、物理的に分離を行うロボット手段を含む、様々な方法で実行することができる。様々な他の技術も採用することができる。例えば、マテリアルストリームから選択されたコンポーネントの放出は、エアジェット(例えば、エアノズルを使用)により達成してもよい。また、(例えば、マテリアルストリームから分離/隔離する部品の大きさに応じて)複数の技術を組み合わせて使用してもよい。例えば、大きな部品はロボットアームを用いて物理的に分離することができ、小さな部品は流体ノズルを用いた流体ジェットによって分離することができる。
【0095】
マテリアルストリーム3には大量のコンポーネントが含まれるため、人間がコンポーネントそれぞれを手作業でラベル付けする(大規模データセット)ことは現実的でないと思われる。データ分類器のトレーニングに伴うラベル付作業を最適化するために、手動でラベル付けするために有望かつ模範的なコンポーネントのみを選択する能動学習法が採用される。マテリアルストリーム中の選択されたコンポーネントは、分離装置ユニット100によって自動的に物理的に分離される。本実施例では、ロボットアームが配置される。しかし、上述したように、一つ以上のその他の手段も採用することができる。
【0096】
機械学習モデルは、ラベル付けのために、コンポーネントを物理的に分離するべく選択関数を適用する能動学習器であってもよい。選択に基づいて、グランドトゥルースを決定するための手動および/または実験的ラベル付けのために、マテリアルストリーム3から構成要素をアクセス可能な別の区画101内へと分離してもよい。新たにラベル付けされたデータを用いて機械学習モデル(分類器を参照)を再トレーニングすることができ、このプロセスは、例えば、予め定義された停止基準が満たされるまで継続してもよい。機械学習モデルをトレーニングするためにラベル付けされるコンポーネントは、トレーニング報酬に基づいて選択され分離されるので、新しいデータポイントに基づいて分類器を再トレーニングする時間のかかるプロセスを回避することができる。そのため、機械学習モデルをより効率的に学習することができる。
【0097】
図2は、
図1に示す実施形態と同様なシステム1の実施形態を示す模式図である。本実施形態において、分離装置ユニット100は、マテリアルストリーム3の経路に配置された操作可能な蓋103を備える。例えば、マテリアルストリームは、操作可能な蓋103が配置されたコンベアベルトによって搬送されてもよい。システムは、マテリアルストリーム3中の一つ以上のコンポーネントを分離するために、蓋103を選択的に開くように構成されてもよい。マテリアルストリーム3から一つ以上のコンポーネントを分離するべく、蓋103がいつ開かれるかを検出するために、必要に応じて光学ユニット105(例えばカメラ)を使用してもよい。例えば、光学ユニット105を使用しない等、その他の変形例も可能であることが理解されよう。光学ユニット105は必要に応じて設けられてもよく、例えば、いくつかの例示的な実施形態では、センサシステム5からのデータは、マテリアルストリーム3から一つ以上のコンポーネントを分離するべく蓋103がいつ開けられるかを検出するために使用されてもよい。いくつかの例では、必要に応じて設けられる光学ユニット105はまた、蓋103が開かれる時の反応時間長くするために上流に配置されてもよい。
【0098】
マテリアルストリーム中の複数の特定されたコンポーネントと結び付けられた最も適切なデータポイントを選択して、当該コンポーネントの分離、手動および/または実験的なラベル付けを行い、グランドトゥルースを決定することができる。得られたグランドトゥルースは、その後、機械学習モデルのさらなる訓練に使用することができる。選択はトレーニング報酬に基づいて行われるため、最小限の人間によるラベル付け作業で、機械学習モデルの最大限の汎化能力を獲得することができる。
【0099】
図3は、方法20の一実施形態の模式図である。本方法は、外部エンティティによって選択されたサンプルを受動的に受け取るのではなく、トレーニングデータを受け取ることが望まれるマテリアルストリーム3のサンプルのセットが選択されるような能動的な機械学習を採用する。例えば、機械学習モデルが学習する際に、外部の人間の専門家または外部システムのみに依存してサンプルを特定および提供するのではなく、機械学習モデルが学習に最も役立つ(トレーニングに関連している)と判定したサンプルを選択することを可能にしている。
【0100】
プールベースの能動学習サイクルが
図3に示されている。ラベル付けされたトレーニングセット21を使用して、機械学習モデル23をトレーニングしてもよい。機械学習モデルには、ラベルの付いていないプール25が提示されてもよい。機械学習モデルは、マテリアルストリーム中のコンポーネントに関連付けられるラベルおよびトレーニング報酬を予測してもよい。次に、分析27(人間によるアノテーションおよび/または実験)のために、クエリを選択してもよい。選択は、トレーニング報酬に基づいてもよい。選択されたコンポーネントを、ラベル付けのために物理的に分離してもよい。分析/ラベル付けの結果は、機械学習モデルのさらなるトレーニングセット(ラベル付きトレーニングセット21を参照)として使用することができる。
【0101】
能動学習やクエリ学習は、人間の注釈者および/または自動分析器等のオラクルによってラベル付けされる予定の未ラベル事例をクエリとすることで、トレーニング過程におけるラベル付けのボトルネックを克服することが可能である。このように、能動学習器はできるだけ少ないラベル付きインスタンスを使って高い精度を達成することを目指し、それによってラベル付きデータを得るためのコストを最小化する。多くのクエリ戦略が存在する。例えば、いわゆるプールベースの能動学習が採用され、トレーニングデータは、一方では(小さな)ラベル付きデータセットに、他方ではラベル無しインスタンスの大きなプールに分けられる。能動学習器は貪欲に動作してもよい。ラベルなしプールにおける全てのインスタンスを同時に評価することによって、アノテータに問い合わせるサンプルを選択してもよい。ある基準を最大化するコンポーネント(サンプル)は、アノテーションのためにオラクルに送られ、ラベル付きトレーニングセットに追加される。モデルから送られる更新された結果により、人間のアノテータのために、能動学習器がクエリの新しい選択をすることが可能になる。
【0102】
能動学習器は、アノテーションのために分離および分析する新たなコンポーネントを選択するために、一つまたは複数の基準を採用することができる。これには、様々なアプローチが存在する。いくつかの有利な実施形態において採用されるクエリ戦略は、不確実性サンプリングに基づくものである。能動学習器は、ラベル付けする方法が最も不確実であって未だラベル付けされていないプールのインスタンスを問い合わせる。以下の式において、xを、マテリアルストリームのコンポーネントのラベル付けされていないプール中に存在する、ある一つのコンポーネントを記述する特徴ベクトルとする。モデルθの下では、そのマテリアル分類、すなわち、粒子のラベルを、全てのクラスyの中で最も事後確率の高いクラスとして予測することができる。
【数1】
【0103】
クエリ戦略の一例としては、ラベル付けされていないプールにおける全てのコンポーネントについて上記の式(1)を計算し、式(2)に従ってコンポーネント一つを選択することにより、最も予測信頼性の低いコンポーネントを選択することである。
【数2】
【0104】
この基準は、機械学習モデルがxに誤ったラベルを付ける可能性が最も高いサンプルを選択することと等価である。すなわち、最もラベル付される可能性の高いサンプルが、クエリに利用できるラベル付けされていない複数のコンポーネントの中で最も可能性の低いサンプルであるということである。欠点は、機械学習モデルが最も可能性の高いラベルに関する情報のみを考慮するため、事後分布の残りの部分に関する情報を捨ててしまうことである。
【0105】
上記の欠点を解決する代替的なサンプリング戦略として、シャノンエントロピーを不確実性指標とするものがある。
【数3】
ここで、y=(y1,...,y6)
Tは、
図1の例に示すように、6つのクラス全てのラベルを含むベクトルである。当然、その他のクラス(種類、種別)も使用することができる。エントロピーは変数の平均的な情報量の尺度であるため、機械学習における不確実性または不純物の尺度として一般的に使用される。
【0106】
図4は、特徴空間の一例を示している。本発明は、マテリアルストリーム中のコンポーネント/対象物に結び付けられたラベルを予測するのに使用された機械学習モデルの更なるトレーニングのために、次いで用いられるグランドトゥルースラベルを決定するために、マテリアルストリーム中のこれらのコンポーネント/対象物のみが選択され分離される物理的能動学習を採用する。このようにして、特定の選択され分離されたコンポーネント/対象物の自動分析を用いて、より効果的に機械学習モデル(例えば、分類モデル)をトレーニングすることができる。
【0107】
その後に、コンポーネント一つ一つのグランドトゥルースラベルを個別に決定するのは、あまりにも労力がかかりすぎる場合がある。有利なことに、現在では、より少ないデータでモデルを非常によくトレーニングすることができる。システムは、グランドトゥルースラベルを決定するために、マテリアルストリーム中のコンポーネントを自動的に選択して分離し、さらに分析を行うことができる。これは、例えば、一つ以上の廃棄物のストリームを伴う廃棄物処理に非常に有効である。例えば、システムは、廃棄物の特徴付けを行うように構成されてもよく、システムは、採用された機械学習モデルの効率的な更なるトレーニングを可能にする。さらに、いくつかの例では、システムは、廃棄物の特徴付けに基づくマテリアルの選別を実行するように構成されてもよい。本発明は、その他のマテリアルストリームの特徴付けるように他の用途でも使用可能であることが理解されよう。
【0108】
グランドトゥルースの決定は、例えば、部分的に手動ラベル付け(例えば、少なくとも部分的に人間によって分析が行われる)を含む、様々な方法で確立されてもよい。また、例えば、化学実験を行う等、自動的に決定してもよい。複数の手法の組み合わせを採用することも可能であり、例えば、グランドトゥルースラベルを導出するために異なる複数の特性を決定する場合等の異なる複数の技術を必要とする場合に、手法を組み合わせてもよい。グランドトゥルースを決定するために、異なる複数の特性パラメータを決定してもよい(例えば、質量、化学反応、重量、幾何学的特性、等)。
【0109】
マテリアルストリームは、異種の物質またはコンポーネントの流れであってもよい。どの粒子が機械学習モデルのトレーニングに最も貢献するかを決定するために、様々なアルゴリズムと技術を使用することができる。この目的のために、様々な能動学習法を適用することができる。
【0110】
グランドトゥルースラベル付けを行うために、次の点を選択するべく、(例えば、分析によって)異なる戦略を採用することができる。
図4に示す例では、システムは、分離装置ユニット100をクラスタまでの距離に基づいて動作させて、グランドトゥルースラベル付けのために選択される一つ以上のコンポーネントを分離する(サンプリングを参照)ように構成されている。例えば、以下のような様々な手法を用いることができる。
-全てのクラスタ中心から最も遠くに位置するサンプルを選択する。これにより、潜在的な新しい(サブ)クラスを検出することができる。
-クラスタ間に位置するサンプルを選択する(例えば、2つのクラスタに対して等距離に位置するサンプル)。これにより、クラス間の決定を洗練させることができる。
大多数のサンプル/クラスタから最も離れた場所に位置するサンプルを選択する(すなわち、孤立したサンプル)。これにより、新しい(サブ)クラスを表す可能性のある外れ値/異常値を識別することができます。
【0111】
上記の技術の組み合わせも使用可能である。その他の選択戦略を採用してもよいことが理解されよう。
【0112】
図5は、異なる複数のコンポーネントクラスに対する特徴の分布を示す。マテリアルストリーム3中のコンポーネント3iは、例えば、紙、木材、ガラス、石、鉄金属(ferro)、非鉄金属(non-ferro)といった、異なる複数のクラス(種類)に分類することができる。例示的なクラスが
図5に示されている。機械学習モデルは、これらの異なる複数のクラスを区別するように学習した分類モデルであってもよい。
図5に示すグラフは、4つの特徴量の一変量分布と二変量分布を表している。期待されるように、ある特徴量はその他の特徴量よりも、ある材料を識別するのに適している。例えば、原子番号は紙と非鉄金属を良好に識別できるが、石とガラスを区別することはできない。しかしながら、平均密度の場合は逆である。本例では、全部で31個の特徴量を組み合わせて分類器をトレーニングすることで、学習能力を最大化している。
【0113】
斜めに配置されているグラフは、データセットから得られた4つの特徴量の分布についてのカーネル密度推定値を表している。それ以外のグラフは、特徴量それぞれの散布図であり、平均原子番号<Z>、平均密度<ρ>の対数、高さの標準偏差<σ>の対数、および、コンポーネントの周囲長の対数である。
【0114】
グランドトゥルースラベル分析のための、マテリアルストリーム中のコンポーネントの選択および分離は、マテリアルストリーム中のラベルの付いていない特定されたコンポーネントついての現在の機械学習モデル(分類器参照)の信頼度に基づいて行うことができる。
【0115】
図6は、学習プロセスの指標を様々なグラフで示したものである。
図6の上段には、アノテーションのために分離および分析されるべき新たなコンポーネントを選択するために、異なる基準を採用する複数の例示的モデル(ランダムサンプリング、ならびに、最小信頼度およびエントロピー基準に基づく不確実性サンプリング、それぞれ式(2)および(3)を参照)の学習曲線が示されている。これらの曲線は、各モデルのテスト性能が、マテリアルストリーム3中のクエリされた(分類のために選択、分離、分析された)コンポーネントの数の関数として、または、ラベル付きトレーニングセットのサイズの関数として、どのように変化するかを示している。本例では、サンプルサイズを1ずつインクリメントさせ、分類器として、径方向ベースのカーネルを持つサポートベクターマシン(SVM)を使用した。
【0116】
式(2)の信頼性基準に基づく不確実性サンプリングと、式(3)のエントロピー基準に基づくランダムサンプリングとを比較する。後者の場合、マテリアルストリームのコンポーネントは、ある不確かさ基準に基づいて問い合わせを行うのではなく、完全にランダムに問い合わせる。
【0117】
一般に、ラベル付けされたデータが多いほど情報量が多いので、サンプルサイズが大きくなるほどモデルの性能は上がると考えられている。しかし、これは全てのモデルで同じスピードで起こるわけではない。グラフは、エントロピーおよび信頼性に基づくサンプリング技術の結果は同等であるが、ランダムサンプリングはマテリアルストリームのコンポーネントの分類において明らかに劣ることを示している。サンプルサイズの大きい極限では、全てのモデル性能は、学習データセット全体を使用するモデルの「最適」な値に収束する。この性能は、能動学習モデルが競うべきものであり、
図6ではベースライン精度0.988として示されている。
図6から明らかなように、能動学習器の性能がベースライン精度に近づくにつれ、小さな絶対的ゲインを得るにはより多くのサンプルが必要となる。例えば、不確実性サンプリングでは、ベースライン精度の99%に達するには77個のラベル付きインスタンスが必要であり、ベースライン精度の99.9%に達するには195個のラベル付きサンプルが必要である。つまり、わずか0.9%ポイントの精度向上のために、ラベル付きサンプルの数を2倍以上にする必要がある。このことは、ラベル付けにかかるコストと分類誤りを犯す可能性のあるコストとのトレードオフという、実用上の重要な問題を提起している。
【0118】
グラフの曲線は、250種類のランダムな初期条件の平均結果を示し、斜線領域の境界は10%および90%の分位点で定義されている。さらに、学習プロセスの3つの異なる段階における平均原子番号Zおよび密度ρによって画定される特徴空間の断面図が示されている。1列目は、その時点までどのサンプルが照会されたかを示す。2列目と3列目は、この特徴空間の2次元断面における最小信頼度とエントロピー測定の振る舞いを示している。残りのラベル付けされていないサンプルも示されており、最も不確実性の高いものが十字で示されている。これは、(例えば、人間のアノテータや実験によって)分離して分析されるべき次のコンポーネントである。
【0119】
図6のその他のグラフでは、更に検討された学習曲線上に3つの位置が示されている。これらは、平均原子番号Zと密度ρの対数とで表される31次元の特徴空間の断面を示している。1列目は、学習プロセスの3つの段階ごとに、どのサンプルがその時点までにラベル付けされたかが示されている。能動学習の開始時点では、空間内でサンプルがほぼ均等に描かれており、この時点でランダムモデルとの差がそれほど大きくならない理由である。
【0120】
しかし、より多くのデータが利用可能になると、能動学習器は異なるマテリアルクラス間の境界領域を認識し始め、これらのクラス境界のすぐ近くにあるサンプルを主に問い合わせる。この現象は
図6の2列目と3列目から観察することができ、それぞれ2次元モデルに対する信頼度およびエントロピーサンプリング基準の挙動を表している。ラベル付けされたトレーニングデータが増えるにつれて、異なるマテリアルクラスを分ける境界は、より高い不確実性を持つ領域として顕著になる。クラス境界は信頼度基準よりもエントロピー基準の方が滑らかに見えるが、共に形状はほぼ同じである。このことは、なぜ類似のサンプルが照会され、両者の性能がほぼ同じであるかを説明している。
【0121】
一般的に、不確実性指標の最適な選択は、手元のデータセットに強く依存する。しかし、分類が単純に多数決によって実行される場合、信頼基準がおそらく適切であると言える。コンポーネントは、最も高い事後確率を持つクラスに割り当てられる。しかし、より複雑なルールが使用される場合(例えば、不均衡なデータセットの場合)、間違いなくエントロピーがより明白な選択となる。
【0122】
図7は、システム1の一実施形態の模式図を示す。この例では、必要に応じて設けられる(カラー)カメラ7および必要に応じて設けられる3Dレーザ三角測量ユニット9のうちの少なくとも一つが、区画に分けられたオブジェクトのそれぞれに睦びつけられる追加の特性を決定できるように配置されている。したがって、いくつかの例では、材料の種類、質量等に関する特徴/特性に次いで、サイズ、形状、色、テクスチャ、視覚的洞察等の少なくとも一つに基づいて特定されたおよび/またはセグメント化されたオブジェクトを区別することも可能である。また、このような情報により、仮想的な実験が可能となり得る。本例では、センサユニット5は、デュアルエネルギーX線撮像を行うための2つのX線サブユニット11a、11bを有するX線センサ11を含む。さらに、カメラ7および3Dレーザ三角測量ユニット9は、センサユニット5と一体化されている。このようにして、センサユニット5は、例えば、コンピュータユニット13によって位置合わせおよび/または合成可能な複数の画像を提供する。異なる複数のカメラ/検出器から得られた画像データの位置合わせおよび/または合成により、セグメント化されたオブジェクトの特徴/特性をより良く決定することを可能にする。1つ以上のマテリアルがセグメント化されており、その関連する特徴/特性を決定するために、セグメント化された個々のオブジェクト3iの分析が行われる。本例では、密度、材料、形状、サイズおよび質量といった特徴量15が、セグメント化されたオブジェクトそれぞれについて決定される。その他の特徴量セットも可能であることは理解されよう。データから、セグメント化されたオブジェクトそれぞれの相対的な重量パーセントを導出することも可能である。
【0123】
本発明によるシステムは、人間による(労働集約的な)入力が少なくて済む一方で、一つまたは複数のマテリアルの特徴づけをより速く、より自律的に行うことができる。このシステムは、廃棄物の特徴づけの用途において重要な利点を提供できる。
【0124】
廃棄物の画像を認識し、異なる複数のカテゴリへと分類するモデルを開発するためには、機械学習モデルに多数の画像を見せ、それぞれの画像に何が写っているかを示すラベルを付けることでトレーニングさせることができる。このように、全てのデータに予めラベルを付けておく従来の手法を教師あり学習という。ラベル付けされたデータは、機械学習アルゴリズムの燃料となる。廃棄物の特徴付け技術では、ラベル付けされたデータは典型的には、物理的な「純粋な」単一物質ストリームを走査することで生成できる。このストリームは、同質でない廃棄物ストリームから何千もの個々の粒子を丹念に選択して手動で準備されることが多い。
【0125】
リサイクル産業において、廃棄物の特徴付けにはいくつかの重要な用途があります。それは、価値評価に利用可能である。完全なマテリアルストリームを迅速かつ確実に特徴付けすることにより、商品株式市場の変動にさらされるリスクを減らすことができる。さらに、品質管理にも利用できる。循環型経済では、リサイクル製品の品質が保証されることが望ましい。特徴付け技術は、市場の信頼を確立するのに役立つ。さらに、プロセスエンジニアリングにも利用できる。廃棄物リサイクルプロセスの技術的、経済的実現可能性や、仮想実験による新しいプロセス設計を評価することができる。さらに、オンラインによるプロセスの最適化にも利用できる。選別工程をその場で測定し、制御し、最適化することができる。
【0126】
いくつかの例では、マテリアルを定性的に(マテリアルの種類、化学、純度等)、定量的に(質量バランス、物理特性等)を評価する、直接的なインライン特徴付け技術を提供することができる。このようなインライン特徴付けシステムは、不均質で複雑なマテリアルストリームを完全に評価するように構成することができ、サブサンプリングの必要性を排除することができる。さらに、物質収支はオンザフライで作成することができる。実際、マテリアルオブジェクトのそれぞれについて、デジタルツインを作成し、仮想的に評価することができる。
【0127】
本発明は、トレーニングデータを収集する際のラベル付けの労力を大幅に低減することができる物理的能動学習を用いたデータ駆動型のマテリアル特徴付けを提供することができる。従来の機械学習アルゴリズムは、トレーニングのために、完全にラベル付けされた大量のデータセットを必要とするが、良好な予測を行うためには、このデータのほんの一部しか必要ないことが分かっている。能動学習では、アルゴリズムが選択した小さな部分集合でモデルをトレーニングすることができ、完全なデータセットでモデルをトレーニングさせた場合と同等の精度を得ることが可能である。いくつかの例では、能動学習により、全てラベル付けされたデータセットで学習した場合の99%の精度を維持しながら、ラベル付けコストを70%削減することができる。
【0128】
本発明によるシステムおよび方法は、様々なマテリアルストリームに使用できることは理解されよう。いくつかの例では、マテリアルストリームは、建築廃棄物および解体廃棄物を含む。しかしながら、その他の廃棄物の流れにも使用することができる。
【0129】
図8は、方法30の模式図である。第1のステップ31において、一つまたは複数のマテリアルの対象物またはコンポーネントが特定され、セグメント化される。これは、オブジェクト検出アルゴリズムおよび/またはセグメント化アルゴリズムによって実行することができる。画像は、センサユニット5を使用して取得される。また、セグメント化される画像は、例えば、センサユニット5の異なるセンサまたはサブユニットから提供される異なる複数の画像のアライメントおよび/または合成を実行した後に、取得されてもよい。本例では、セグメント化された対象物3iの周囲にボックス20が配置される。第2のステップ33では、セグメント化された対象物3iのそれぞれについて、特性/特徴量15が決定される。この例では、質量、体積、原子番号が決定される。第3のステップでは、機械学習モデルによってラベルを予測してもよい。ステップ37に示すように、これは、出力として(予測された)ラベル17を得るようにトレーニングされたニューラルネットワーク25に、入力としてデータを提供することによって行うことができる。この例では、トレーニングされたニューラルネットワークは、深層学習モデルである。しかしながら、例えば、サポートベクターマシン(SVM)、決定木ベースの学習システム、ランダムフォレスト、回帰モデル、オートエンコーダクラスタリング、最近傍(例えばkNN)機械学習アルゴリズム等の、その他の機械学習モデルも使用することが可能である。いくつかの例では、人工ニューラルネットワークの代わりに、代替の回帰モデルが使用される。
【0130】
本発明は、使用される機械学習モデル(例えば、ディープニューラルネットワーク)のより効率的なトレーニングを提供する。能動学習によって、(マテリアルストリーム中の)ラベル付けされていないデータのサブセットを選択的にサンプリングすることにより、(手動で)ラベル付けされるべきトレーニングサンプルの数を減らすことが可能である。これは、人間によるラベル付けおよび/または実験的ラベル付けのために、ラベル付けされていないサンプルを検査し、所定のコスト関数に関して最も情報量の多いものを選択することによって減らすことができる。能動学習機械学習モデルは、性能の最も大きな改善をもたらすことができるサンプルを選択することができ、それによって、人間によるラベル付けおよび/または実験的ラベル付けの労力を低減できる。マテリアルストリーム中の複数のコンポーネントから選択的にコンポーネントをサンプリングすることは、複数のコンポーネントのうちラベル付けするコンポーネント候補のプールが存在することを想定している。マテリアルストリーム中には、新しい比較的ユニークなコンポーネントの定常的なストリームが存在し得ることから、ストリームは機械学習モデルの性能を継続的かつ効果的に向上させるためのソースを提供している。有利なことに、選択されたコンポーネントは、分離ユニットを使用したシステムによって自動的に分離されてもよい。能動学習機械モデルは、人間によるラベル付けおよび/または実験的ラベル付けのために、マテリアルストリームから収集された全コンポーネントのうちの小さなサブセットを導出してもよい。
【0131】
例えば、人間のアノテーションによって得られた分類済データセットを用いて、最初の深層学習ニューラルネットワークをトレーニングすることができる。このデータセットによって、ニューラルネットワークの最初のパラメータが構築され、これが教師あり学習の段階となる。教師あり学習の段階で、所望の動作が達成されたかどうかのニューラルネットワークのテストを行ってもよい。所望のニューラルネットワークの動作が達成されると(例えば、機械学習モデルが指定された閾値に従って動作するようにトレーニングされると)、実際の使用のために機械学習モデルを配備することができる(例えば、「実際の」データでマシンをテストする)。ニューラルネットワークの動作を改善し続けるために、動作中、(例えば、専門家ユーザ、専門家システム、参照データベース等により)ニューラルネットワークが行う分類を確認または否定することができる。その後、ニューラルネットワークの振る舞いを決定する分類についてのパラメータが、進行中のインタラクションに基づいて更新されるため、本例のニューラルネットワークは転送学習の状態にあると言える。いくつかの例では、機械学習モデルのニューラルネットワークは、別のプロセスに直接フィードバックを提供することができ、例えば、廃棄物リサイクルプロセスの制御パラメータを変更することができる。いくつかの例では、ニューラルネットワークは、(例えば、クラウドなどを介して)バッファリングされ検証されたデータを別のプロセスに提供する前に出力する。
【0132】
データ取得は、様々な方法で行うことができる。センサシステムは、様々なセンサを含んでもよい。一例として、マテリアルストリーム(例えば、廃棄物ストリーム)中の粒子のマテリアル特性に関するデータは、マルチセンサ特徴づけ装置により収集される。まず、デュアルエネルギーX線透過法(DE-XRT)により、マテリアルを「透視」し、平均原子番号や密度等の、特定のマテリアル特性を判定してもよい。これの利点は、部品の表面だけでなく、体積全体を検査できることである(例えば、廃棄物は汚れていることが多く、表面特性は必ずしもマテリアルの大部分を代表するものではない)。次に、これに加えてまたは代えて、3Dレーザ三角測量ユニットを利用して、対象物の形状を高解像度(例えば、サブミリ精度)で測定してもよい。これにより、DE-XRTから収集した情報を補完する、3次元形状および体積等の追加情報を得ることができる。次いで、これに加えてまたは代えて、RGB検出器を使用してもよく、これによりマテリアルストリームに含まれるコンポーネントを色および形に関して区別することができる。いくつかの例では、上述した複数のセンサを一緒に使用する。必要に応じて、画像を個々の成分にセグメント化するために画像処理を使用してもよい。これらのセグメント化された画像から、対象物の形状を記述する様々な特徴を計算してもよい。例えば、コンポーネントの面積、偏心、周囲長等である。いくつかの例では、これは、全てのセンサから得られた全ての画像に対して行ってもよい。
【0133】
様々なニューラルネットワークモデルおよび/またはニューラルネットワークアーキテクチャを使用することができる。ニューラルネットワークは、センサデータおよび/または前処理されたデータ(例えば、セグメント化された対象物について決定された特徴の特性)を処理する、例えば、分類する能力を有する。ニューラルネットワークは、コンピュータ化されたシステムに実装されてもよい。ニューラルネットワークは、複雑なデータ入力を処理するための様々な機械学習アルゴリズムのフレームワークとして機能してもよい。このようなニューラルネットワークシステムは、一般に、タスクに特化した規則でプログラムされるのではなく、複数の例を考慮することによってタスクを実行するように「学習」することができる。ニューラルネットワークは、ニューロンと呼ばれる接続されたユニットまたはノードの集合体をベースとしている。各接続は、ニューラルネットワーク内の一つのニューロンから別のニューロンへと信号を伝達可能である。信号を受け取ったニューロンはその信号を処理し、そのニューロンに接続された更なるニューロンへと信号を送ることができる(アクティベーションを参照)。ニューロンそれぞれの出力は通常、入力の和の非線形関数によって計算される。複数の接続はそれぞれの重みを持つことができ、重みは学習が進むにつれて調整される。また、バイアスのようなその他のパラメータが存在する場合もある。一般に、ニューロンはレイヤへと集約される。異なるレイヤはその入力に対して異なる種類の変換を行い、ディープニューラルネットワークを形成することができる。
【0134】
深層学習ニューラルネットワークは、複数のレベルの表現を持つ表現学習法とみなすことができる。この表現学習法は、生の入力から始まるあるレベルの表現を、より高い、やや抽象的なレベルの表現にそれぞれ変換する、単純だが非線形なモジュールを構成することによって得られる。ニューラルネットワークは、従来の手法では困難なパターンを識別することができる。したがって、ある印刷条件で構造体を印刷するという問題に特化したカスタムコードを書く代わりに、例えば、分類アルゴリズムを使用して、異なるおよび/または変化する構造体の印刷条件を処理できるようにネットワークをトレーニングすることができる。印刷プロセスを効率的に制御するための分類ロジックを決定できるように、ニューラルネットワークにトレーニングデータを供給してもよい。
【0135】
方法の一の工程が別の工程の後に実施されると説明された場合、そうでないと明記されない限り、それは別の工程の後に一の工程が直接続くまたは一の工程を実行する前に一つまたは複数の中間工程を実行してもよいことを意味する。同様に、ニューラルネットワークのニューロン等のコンポーネント間の接続が記述されている場合、この接続は、特に指定されない限りまたは文脈によって除外されない限り、直接的にまたはその他のニューロンや論理演算等の中間コンポーネントを介して確立されてもよいことが理解されるであろう。
【0136】
「ラベル」という用語は、カテゴリ変数(例えば、ニューラルネットワークを使用)および連続変数(例えば、回帰モデルを使用)の両方として理解され得ることは明らかである。例えば、連続変数は、不確実性を有する場合がある(例えば、化学分析変数)。
【0137】
本方法は、コンピュータで実装される工程を含み得ることが理解されるであろう。上述したすべての工程は、コンピュータで実装される工程とすることができる。実施形態は、プロセスを実行するコンピュータ装置を含んでもよい。また、本発明は、本発明を実施するために適合化されたコンピュータプログラム、特にキャリア上またはキャリア内のコンピュータプログラムにも及ぶ。プログラムは、ソースコードまたはオブジェクトコードの形態であっても、あるいは本発明によるプロセスの実装に使用するのに適した他の形態であってもよい。キャリアは、プログラムを運搬することができる任意の実体または装置であってよい。例えば、キャリアは例えば半導体ROMなどのROMまたはハードディスクのような記憶媒体であってもよい。さらに、キャリアは電気信号や光信号などの伝送可能なキャリアであってもよく、電気ケーブルや光ケーブル、無線などの手段、例えばインターネットやクラウドを介して伝達されてもよい。
【0138】
いくつかの実施形態は、例えば、命令または命令セットを格納することができる機械または有形コンピュータ可読媒体または要素を用いて実装されてもよく、これらの命令または命令セットは、機械によって実行された場合に、当該機械に実施形態に従った方法および/または動作を実行させることができる。
様々な実施形態は、ハードウェア要素、ソフトウェア要素、またはその両方の組み合わせを用いて実装することができる。ハードウェア要素の例としては、プロセッサ、マイクロプロセッサ、回路、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、論理ゲート、レジスタ、半導体デバイス、マイクロチップ、チップセットなどがある。ソフトウェアの例としては、ソフトウェアコンポーネント、プログラム、アプリケーション、コンピュータプログラム、アプリケーションプログラム、システムプログラム、マシンプログラム、オペレーティングシステムソフトウェア、モバイルアプリ、ミドルウェア、ファームウェア、ソフトウェアモジュール、ルーチン、サブルーチン、関数、コンピュータで実装された方法、プロシージャ、ソフトウェアインターフェース、アプリケーションプログラムインターフェース(API)、メソッド、命令セット、コンピューティングコード、コンピュータコード等を挙げることができる。
【0139】
本明細書では、本発明の各実施形態の具体的な例を参照して本発明が説明されている。ただし、本発明において、本発明の本質から逸脱することなく、様々な変更、変形、代替、および改変を行うことができることは明白であろう。明確化および簡潔な説明のために、本明細書では同じまたは別々の実施形態の一部として特徴が説明されているが、これらの別々の実施形態において説明される特徴の全てまたは一部の組み合わせを有する代替的な実施形態も、特許請求の範囲によって概説される本発明の枠組み内にあると想定および理解される。従って、各仕様、図面、および例は、制限的な意味ではなく、例示的な意味で解釈されるべきである。本発明は、添付の特許請求の範囲内にある全ての代替、変更、および変形を包含することを意図している。また、説明される要素の多くは、個別の、もしくは分散された構成要素として、または他の構成要素と併用して、任意の好適な組み合わせおよび位置で実装され得る機能的エンティティである。
【0140】
特許請求の範囲において、括弧内のいかなる参照符号も、請求項を限定するものとは解釈されないものとする。「含む(comprising)」という単語は、請求項に列挙されたもの以外の特徴または工程の存在を排除するものではない。また、単語「a」および「an」は、「一つだけ」に限定されると解釈されるべきではなく、「少なくとも一つ」を意味するために用いられ、複数を排除しない。単に特定の複数の手段が相互に異なる請求項に記載されているという事実は、これらの手段の組み合わせが有利に使用できないことを示すものではない。
【手続補正書】
【提出日】2022-12-14
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の未知のコンポーネントを含む
不均質なマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングする方法であって、
前記複数の未知のコンポーネントを含む前記マテリアルストリームの画像化を行うように構成されたセンサシステムによって、前記マテリアルストリームを走査する工程と、
前記マテリアルストリームの前記画像および/または前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上の特徴を入力として受け取るように構成された機械学習モデルによって、前記マテリアルストリーム中の前記複数の未知のコンポーネントのそれぞれについて、一つ以上の予測ラベルおよび関連するラベル予測確率を予測する工程と、
前記マテリアルストリーム中の前記複数の未知のコンポーネント内の未知のコンポーネントそれぞれに関連付けられるトレーニング報酬を決定する工程と、
前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に少なくとも部分的に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程と、を備え、
前記少なくとも一つの未知のコンポーネントのグランドトゥルースを決定するには、物理的分離における分析を必要とし、選択された前記少なくとも一つの未知のコンポーネントは、分離ユニットによって前記マテリアルストリームから物理的に分離され、前記分離ユニットは、前記選択された少なくとも一つの未知のコンポーネントを、アクセス可能な別の区画に移動させるように構成され、
前記方法は更に、
分離された前記少なくとも一つの未知のコンポーネントのグランドトゥルースラベルを決定するために当該少なくとも一つの未知のコンポーネントを分析する工程と、
前記物理的に分離された少なくとも一つの未知のコンポーネントの決定された前記グランドトゥルースラベルを使用して、前記機械学習モデルのインクリメントバージョンをトレーニングする工程と、を備え、
化学分析に少なくとも部分的に基づいて前記グランドトゥルースラベルを決定するために、前記マテリアルストリームから分離された前記少なくとも一つの未知のコンポーネントの前記化学分析が行われる、方法。
【請求項2】
前記機械学習モデルは、前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上のユーザ定義の特徴を入力として受け取るように構成され、
前記少なくとも一つの未知のコンポーネントを選択する工程における選択について、ユーザが作成した選択基準を採用する、請求項1に記載の方法。
【請求項3】
前記分離ユニットは、異なる複数の分離技術を採用する複数のサブユニットを含み、
前記分離ユニットは、少なくとも第1のサブユニットと第2のサブユニットとを有し、前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの前記一つ以上の特徴に基づいて、前記選択された少なくとも一つの未知のコンポーネントの物理的分離のために、前記第1のサブユニットおよび前記第2のサブユニットのうちの一方が選択される、請求項
1に記載の方法。
【請求項4】
前記第1のサブユニットは、前記マテリアルストリーム中のより小さいおよび/またはより軽いコンポーネントの物理的分離に使用され、前記第2のサブユニットは、前記マテリアルストリーム中のより大きいおよび/またはより重いコンポーネントの物理的分離に使用される、請求項1に記載の方法。
【請求項5】
前記第1のサブユニットは、コンポーネントを前記アクセス可能な別の区画へと吹き飛ばすために、前記コンポーネントに向かって流体ジェットを向けて前記コンポーネントを分離するように構成され、前記第2のサブユニットは、機械的マニピュレーションデバイスを使用してコンポーネントを分離するように構成される、請求項1に記載の方法。
【請求項6】
前記マテリアルストリーム中の前記複数の未知のコンポーネントそれぞれについて、質量を示すデータを算出する、請求項
1に記載の方法。
【請求項7】
前記流体ジェットによって発生する力は、前記選択された少なくとも一つの未知のコンポーネントの前記質量に基づいて調整される、請求項
6に記載の方法。
【請求項8】
前記分離ユニットによって前記マテリアルストリームから前記未知のコンポーネントを物理的に分離することの難易度を示す値が決定され、前記複数の未知のコンポーネントそれぞれに前記難易度を示す値が関連付けられ、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程は、前記難易度を示す値に基づいて行われる、請求項
1に記載の方法。
【請求項9】
前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから、複数の上位の未知のコンポーネントが選択され、前記分離ユニットによる物理的分離の実行の前記難易度を示す値に基づいて、前記複数の上位の未知のコンポーネントのサブセットが物理的分離のために選択される、請求項
8に記載の方法。
【請求項10】
前記アクセス可能な別の区画は、前記分離された未知のコンポーネントの手動除去を可能にし、
前記アクセス可能な別の区画内に位置する前記分離された未知のコンポーネントについて前記機械学習モデルの内部参照の表示が提供され、
前記少なくとも一つの選択された未知のコンポーネントの前記分析は、少なくとも部分的に人間によるアノテーションによって実行される、請求項
1に記載の方法。
【請求項11】
前記分離された未知のコンポーネントが分析装置で分析され、
特徴付けに基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは、前記アクセス可能な別の区画内の前記分離された未知のコンポーネントの前記特徴付けを自動的に実行するように配置される、請求項
1に記載の方法。
【請求項12】
前記分離されたコンポーネントの破壊測定に少なくとも部分的に基づいて前記グランドトゥルースラベルを決定するために、前記分析ユニットは前記分離されたコンポーネントの前記破壊測定を実行するように構成される、請求項
1に記載の方法。
【請求項13】
前記分析ユニットは、エネルギー型または波長分散型蛍光X線分光法、試金法、誘導結合プラズマ発光分光法、誘導結合プラズマ原子発光分光法、誘導結合プラズマ質量分析法、レーザ誘起破壊分光法、赤外線分光法、ハイパースペクトル分光法、X線回折分析法、走査電子顕微鏡法、核磁気共鳴法およびラマン分光法のうちの少なくとも一つを実行するように構成される、請求項
1に記載の方法。
【請求項14】
前記一つ以上の特徴は、体積、寸法、直径、形状、質感、色および偏心のうちの少なくとも一つに関するものである、請求項
1に記載の方法。
【請求項15】
複数の未知のコンポーネントを含む
不均質なマテリアルストリーム中のコンポーネントの特徴付けを行うように構成された機械学習モデルをトレーニングするシステムであって、
前記システムは、プロセッサ、コンピュータ可読記憶媒体、センサシステムおよび分離ユニットを備え、前記コンピュータ可読記憶媒体は命令を格納しており、
前記命令は前記プロセッサによって実行されると、前記プロセッサに、
前記複数の未知のコンポーネントを含む前記マテリアルストリームの撮像を行うべく、前記マテリアルストリームを走査するように前記センサシステムを動作させる工程と、
前記マテリアルストリームの前記画像および/または前記マテリアルストリームの前記画像から抽出された前記複数の未知のコンポーネントの一つ以上の特徴を入力として受け取るように構成された機械学習モデルによって、前記マテリアルストリーム中の前記複数の未知のコンポーネントのそれぞれについて、一つ以上のラベルおよび関連するラベル確率を予測する工程と、
前記マテリアルストリーム中の前記複数の未知のコンポーネント内の未知のコンポーネントそれぞれに関連付けられるトレーニング報酬を決定する工程と、
前記複数の未知のコンポーネントに関連付けられた前記トレーニング報酬に少なくとも部分的に基づいて、前記マテリアルストリーム中の前記複数の未知のコンポーネントから少なくとも一つの未知のコンポーネントを選択する工程
であって、前記少なくとも一つの未知のコンポーネントのグランドトゥルースを決定するには物理的分離における分析を必要とする、前記選択する工程と、
選択された前記少なくとも一つの未知のコンポーネントを前記マテリアルストリームから物理的に分離するために前記分離ユニットを動作させる工程であって、前記分離ユニットは前記選択された未知のコンポーネントをアクセス可能な別の区画へと移動させる、前記分離ユニットを動作させる工程と、
分析を行うことにより、分離された少なくとも一つの未知のコンポーネントについて決定されたグランドトゥルースラベルを受け取る工程であって、分離された少なくとも一つの未知のコンポーネントについて決定されたグランドトゥルースラベルをトレーニングデータベースに追加する、工程と、
前記物理的に分離された少なくとも一つの未知のコンポーネントの決定された前記グランドトゥルースラベルを使用して、前記機械学習モデルのインクリメントバージョンをトレーニングする工程と、を実行させる命令が含まれ、
化学分析に少なくとも部分的に基づいて前記グランドトゥルースラベルを決定するために、前記マテリアルストリームから分離された前記少なくとも一つの未知のコンポーネントの前記化学分析が行われるように構成されるシステム。
【国際調査報告】