特表2024-504734 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ムサシエーアイノースアメリカインコーポレイテッドの特許一覧

特表2024-504734マルチモデルアーキテクチャを使用する人工知能ビジュアル検査のためのシステム、方法、およびコンピュータデバイス

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-02-01

(54)【発明の名称】マルチモデルアーキテクチャを使用する人工知能ビジュアル検査のためのシステム、方法、およびコンピュータデバイス

(51)【国際特許分類】

G06N 20/00 20190101AFI20240125BHJP

【ＦＩ】

G06N20/00 130

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023545244

(86)(22)【出願日】2022-01-25

(85)【翻訳文提出日】2023-08-07

(86)【国際出願番号】 CA2022050101

(87)【国際公開番号】W WO2022160041

(87)【国際公開日】2022-08-04

(31)【優先権主張番号】63/141,734

(32)【優先日】2021-01-26

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】522492244

【氏名又は名称】ムサシエーアイノースアメリカインコーポレイテッド

(74)【代理人】

【識別番号】100105924

【弁理士】

【氏名又は名称】森下賢樹

(72)【発明者】

【氏名】ブフィ、マーティン

(57)【要約】

【解決手段】マルチモデルアーキテクチャを使用する自動化された人工知能ビジュアル検査のためのシステム、方法、およびコンピュータデバイスが提供される。コンピュータデバイスは、イメージデータを受け取るための通信インターフェースと、イメージデータ、第１ニューラルネットワークモデル、第２ニューラルネットワークモデル、および第２ニューラルネットワークモデルトリガ条件を保存するためのメモリと、メモリと通信しているプロセッサと、を含む。プロセッサは、第１ニューラルネットワークモデルを使用して、イメージデータについて第１オブジェクト検出タスクを実行することと、第１ニューラルネットワークモデル出力データをメモリに保存することと、第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たすか否かを判定することと、第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たす場合、第２ニューラルネットワークモデルを使用して、イメージデータについて第２オブジェクト検出タスクを実行することと、を実行するように構成される。
【選択図】図３

【特許請求の範囲】

【請求項1】

マルチモデルアーキテクチャを使用する自動化された人工知能（AI）ビジュアル検査のためのシステムであって、
検査されているターゲットオブジェクトの検査イメージデータを取得するためのカメラデバイスと、
第２ニューラルネットワークモデルの使用をトリガするための第２モデルトリガ条件を保存するメモリと、
前記検査イメージにおける第１オブジェクトクラスを検出し、検出されたオブジェクトの第１リストを含む第１ニューラルネットワークモデル出力データを生成するように構成される第１ニューラルネットワークモデルを実行することと、
前記第１ニューラルネットワークモデル出力データが前記第２モデルトリガ条件を満たすか否かを判定するように構成されるモデルトリガ判定モジュールを実行することと、
前記第２モデルトリガ条件が満たされると、前記検査イメージにおける第２オブジェクトクラスを検出し、検出されたオブジェクトの第２リストを含む第２ニューラルネットワークモデル出力データを生成するように構成される前記第２ニューラルネットワークモデルを実行することと、
通信インターフェースを介して、前記第１ニューラルネットワークモデル出力データおよび生成される場合は前記第２ニューラルネットワークモデル出力データを含むニューラルネットワークモデル出力データをオペレータデバイスに送ることと、
を実行するように構成される、前記メモリと通信しているプロセッサと、
を備えるＡＩビジュアル検査デバイスと、
を備え、
前記オペレータデバイスは、前記受け取られたニューラルネットワークモデル出力データを表示するように構成されるシステム。

【請求項2】

マルチモデルアーキテクチャを使用する自動化された人工知能（AI）ビジュアル検査のためのシステムであって、
検査されているターゲットオブジェクトの検査イメージデータを取得するためのカメラデバイスと、
前記カメラデバイスから前記検査イメージデータを受け取るための通信インターフェースと、
前記検査イメージデータにおける第１オブジェクトクラスを検出するように構成される第１ニューラルネットワークモデル、前記検査イメージデータにおける第２オブジェクトクラスを検出するように構成される第２ニューラルネットワークモデル、および前記第２ニューラルネットワークモデルの使用をトリガするための第２モデルトリガ条件を保存するメモリと、
前記第１オブジェクト検出モデルへの入力として、前記検査イメージデータを提供することと、
前記第１ニューラルネットワークモデルを使用して、第１ニューラルネットワークモデル出力データを生成することを含む第１オブジェクト検出タスクを実行することと、
前記第１ニューラルネットワークモデル出力データを、検査イメージアノテーションデータとして前記メモリに保存することと、
前記第１ニューラルネットワークモデル出力データが前記第２モデルトリガ条件を満たすか否かを判定することと、
前記第１ニューラルネットワークモデル出力データが前記第２モデルトリガ条件を満たす場合、
前記第２ニューラルネットワークモデルへの入力として、前記検査イメージデータを提供することと、
前記第２ニューラルネットワークモデルを使用して、第２ニューラルネットワーク出力データを生成することを含む第２オブジェクト検出タスクを実行することと、
前記第２ニューラルネットワークモデル出力データを、前記検査イメージアノテーションデータのサブセットとして前記メモリに保存することと、
を実行するように構成される、前記メモリと通信しているプロセッサと、
を備えるＡＩビジュアル検査デバイスと、
を備え、
前記通信インターフェースは、前記検査イメージデータおよび前記検査イメージアノテーションデータを、表示のためにオペレータデバイスに送るように構成され、
前記オペレータデバイスは、前記検査イメージデータおよび検査イメージアノテーションデータを、アノテーションされた検査イメージとして表示するシステム。

【請求項3】

前記検査イメージアノテーションデータは、前記検査イメージデータのメタデータとして保存される、請求項２に記載のシステム。

【請求項4】

前記オペレータデバイスは、前記検査イメージアノテーションデータのいずれを表示すべきかを示すユーザからの入力データを受け取り、前記示された検査イメージアノテーションデータのみを前記アノテーションされた検査イメージにおいて表示するように構成される、請求項２に記載のシステム。

【請求項5】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクトクラスラベルを含み、前記第２モデルトリガ条件は、要求されたオブジェクトクラスラベルを含み、前記プロセッサは、前記検出されたオブジェクトの前記オブジェクトクラスラベルが、前記要求されたオブジェクトクラスラベルにマッチングするか否かを判定する、請求項２に記載のシステム。

【請求項6】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクト位置データを含み、前記第２モデルトリガ条件は、オブジェクト位置要求を含み、前記プロセッサは、前記検出されたオブジェクトの前記オブジェクト位置データが、前記オブジェクト位置要求を満たすか否かを判定する、請求項２に記載のシステム。

【請求項7】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの信頼レベルを含み、前記第２モデルトリガ条件は、最低信頼レベルを満たすことを含み、前記プロセッサは、前記検出されたオブジェクトの前記信頼レベルが、前記最低信頼レベルを満たすか否かを判定する、請求項２に記載のシステム。

【請求項8】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクトサイズデータを含み、前記第２モデルトリガ条件は、最小オブジェクトサイズを満たすことを含み、前記プロセッサは、前記オブジェクトサイズデータが、前記最小オブジェクトサイズを満たすか否かを判定する、請求項２に記載のシステム。

【請求項9】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの少なくとも二つの属性を記述するオブジェクト属性データを含む、請求項２に記載のシステム。

【請求項10】

前記少なくとも二つの属性は、オブジェクト位置、オブジェクトクラスラベル、オブジェクト信頼レベル、およびオブジェクトサイズの任意の二つ以上を含む、請求項９に記載のシステム。

【請求項11】

前記第２モデルトリガ条件は、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を含み、前記プロセッサは、前記オブジェクト属性データが、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を満たすか否かを判定するように更に構成される、請求項９に記載のシステム。

【請求項12】

前記第１ニューラルネットワーク出力データは、前記第２モデルトリガ条件が前記プロセッサによって使用されることを識別する識別子を含む、請求項２に記載のシステム。

【請求項13】

前記プロセッサは、前記識別子に基づいて、前記第２モデルトリガ条件が使用されることを判定する、請求項１２に記載のシステム。

【請求項14】

前記第２モデルトリガ条件が使用されることを判定する際、前記プロセッサは、前記第１ニューラルネットワークモデル出力データが、前記第２モデルトリガ条件を満たすか否かを判定するために、前記識別子を使用して前記メモリから前記第２モデルトリガ条件を取り出す、請求項１３に記載のシステム。

【請求項15】

前記識別子は、前記第１ニューラルネットワークモデルを識別するモデル識別データを備える、請求項１２に記載のシステム。

【請求項16】

前記第２ニューラルネットワークモデルに提供される前記検査イメージデータは、前記第１ニューラルネットワークモデル出力データから判定される前記検査イメージデータのサブセットを備え、前記第２オブジェクト検出タスクは、前記検査イメージデータの前記サブセットを使用して実行される、請求項２に記載のシステム。

【請求項17】

前記プロセッサは、前記第２モデルトリガ条件が満たされると判定する時に、前記第１ニューラルネットワークモデル出力データに基づいて、前記第２ニューラルネットワークモデルを含む、前記プロセッサによって実行されるニューラルネットワークモデルのリストを生成するように更に構成される、請求項２に記載のシステム。

【請求項18】

前記プロセッサは、前記リストにおける前記ニューラルネットワークモデルのそれぞれを連続的に実行し、前記ニューラルネットワークモデルのそれぞれの実行は、少なくとも前記検査イメージデータのサブセットを、前記ニューラルネットワークモデルのそれぞれに提供することと、前記ニューラルネットワークモデルのそれぞれを使用してニューラルネットワークモデル出力データを生成することと、を含む、請求項１７に記載のシステム。

【請求項19】

前記プロセッサは、前記メモリに保存された追加的なニューラルネットワークモデルのモデルトリガ条件を満たす、先に実行されたニューラルネットワークモデルによって生成されたニューラルネットワーク出力データに基づいて、前記プロセッサによって判定される、実行される前記追加的なニューラルネットワークモデルが含まれるように、前記リストを動的に更新するように更に構成される、請求項１７に記載のシステム。

【請求項20】

実行される前記ニューラルネットワークモデルのリストは、それぞれが単一のニューラルネットワークモデルに対応する、実行される複数の別のニューラルネットワークモデルのリストを備える、請求項１７に記載のシステム。

【請求項21】

前記オペレータデバイスは、前記第２モデルトリガ条件を設定する入力データを受け取るためのユーザインターフェースを生成するように構成され、前記第２モデルトリガ条件は、前記オペレータデバイスまたは前記ＡＩビジュアル検査デバイスによって前記入力データに応じて生成される、請求項２に記載のシステム。

【請求項22】

マルチモデルアーキテクチャを使用する自動化された人工知能（AI）ビジュアル検査のコンピュータ利用方法であって、
検査イメージデータにおける第１オブジェクトクラスを検出するように構成される第１ニューラルネットワークモデルへの入力として、前記検査イメージデータを提供することと、
前記第１ニューラルネットワークモデルを使用して、第１ニューラルネットワークモデル出力データを生成することを含む第１オブジェクト検出タスクを実行することと、
前記第１ニューラルネットワークモデル出力データを、検査イメージアノテーションデータとしてメモリに保存することと、
前記第１ニューラルネットワークモデル出力データが、前記メモリに保存される第２モデルトリガ条件を満たすか否かを判定することと、
前記第１ニューラルネットワークモデル出力データが前記第２モデルトリガ条件を満たす場合、
前記検査イメージデータにおける第２オブジェクトクラスを検出するように構成される第２ニューラルネットワークモデルへの入力として、前記検査イメージデータを提供することと、
前記第２ニューラルネットワークモデルを使用して、第２ニューラルネットワーク出力データを生成することを含む第２オブジェクト検出タスクを実行することと、
前記第２ニューラルネットワーク出力データを、前記検査イメージアノテーションデータのサブセットとして前記メモリに保存することと、
を実行する方法。

【請求項23】

前記検査イメージデータおよび前記検査イメージアノテーションデータを使用して、アノテーションされた検査イメージを生成することを更に実行する、請求項２２に記載の方法。

【請求項24】

前記アノテーションされた検査イメージをユーザインターフェースにおいて表示することを更に実行する、請求項２３に記載の方法。

【請求項25】

マルチモデルアーキテクチャを使用して、オブジェクト検出を実行するためのコンピュータデバイスであって、
イメージデータを受け取るための通信インターフェースと、
前記イメージデータ、前記イメージデータにおける第１オブジェクトクラスを検出するように構成される第１ニューラルネットワークモデル、前記イメージデータにおける第２オブジェクトクラスを検出するように構成される第２ニューラルネットワークモデル、および第２ニューラルネットワークモデルトリガ条件を保存するためのメモリと、
第１ニューラルネットワークモデル出力データを生成するための前記第１ニューラルネットワークモデルを使用して、前記イメージデータについて第１オブジェクト検出タスクを実行することと、
前記第１ニューラルネットワークモデル出力データを、前記メモリに保存することと、
前記第１ニューラルネットワークモデル出力データが前記第２モデルトリガ条件を満たすか否かを判定することと、
前記第１ニューラルネットワークモデル出力データが前記第２モデルトリガ条件を満たす場合、
第２ニューラルネットワーク出力データを生成するための前記第２ニューラルネットワークモデルを使用して、前記イメージデータについて第２オブジェクト検出タスクを実行することと、
前記第２ニューラルネットワークモデル出力データを、前記メモリに保存することと、
を実行するように構成される、前記メモリと通信しているプロセッサと、
を備えるデバイス。

【請求項26】

【請求項27】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクト位置データを含み、前記第２モデルトリガ条件は、オブジェクト位置要求を含み、前記プロセッサは、前記検出されたオブジェクトの前記オブジェクト位置データが、前記オブジェクト位置要求を満たすか否かを判定する、請求項１に記載のシステム。

【請求項28】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの信頼レベルを含み、前記第２モデルトリガ条件は、最低信頼レベルを満たすことを含み、前記プロセッサは、前記検出されたオブジェクトの前記信頼レベルが、前記最低信頼レベルを満たすか否かを判定する、請求項１に記載のシステム。

【請求項29】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクトサイズデータを含み、前記第２モデルトリガ条件は、最小オブジェクトサイズを満たすことを含み、前記プロセッサは、前記オブジェクトサイズデータが、前記最小オブジェクトサイズを満たすか否かを判定する、請求項１に記載のシステム。

【請求項30】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの少なくとも二つの属性を記述するオブジェクト属性データを含む、請求項１に記載のシステム。

【請求項31】

前記少なくとも二つの属性は、オブジェクト位置、オブジェクトクラスラベル、オブジェクト信頼レベル、およびオブジェクトサイズの任意の二つ以上を含む、請求項３０に記載のシステム。

【請求項32】

前記第２モデルトリガ条件は、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を含み、前記プロセッサは、前記オブジェクト属性データが、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を満たすか否かを判定するように更に構成される、請求項３０に記載のシステム。

【請求項33】

前記第１ニューラルネットワーク出力データは、前記第２モデルトリガ条件が前記プロセッサによって使用されることを識別する識別子を含む、請求項１に記載のシステム。

【請求項34】

前記プロセッサは、前記識別子に基づいて、前記第２モデルトリガ条件が使用されることを判定する、請求項３３に記載のシステム。

【請求項35】

前記第２モデルトリガ条件が使用されることを判定する際、前記プロセッサは、前記第１ニューラルネットワークモデル出力データが、前記第２モデルトリガ条件を満たすか否かを判定するために、前記識別子を使用して前記メモリから前記第２モデルトリガ条件を取り出す、請求項３４に記載のシステム。

【請求項36】

前記識別子は、前記第１ニューラルネットワークモデルを識別するモデル識別データを備える、請求項３３に記載のシステム。

【請求項37】

前記第２ニューラルネットワークモデルに提供される前記検査イメージは、前記第１ニューラルネットワークモデル出力データから判定される前記検査イメージのサブセットを備え、前記第２オブジェクト検出タスクは、前記検査イメージの前記サブセットを使用して実行される、請求項１に記載のシステム。

【請求項38】

前記プロセッサは、前記第２モデルトリガ条件が満たされると判定する時に、前記第１ニューラルネットワークモデル出力データに基づいて、前記第２ニューラルネットワークモデルを含む、前記プロセッサによって実行されるニューラルネットワークモデルのリストを生成するように更に構成される、請求項１に記載のシステム。

【請求項39】

前記プロセッサは、前記リストにおける前記ニューラルネットワークモデルのそれぞれを連続的に実行し、前記ニューラルネットワークモデルのそれぞれの実行は、少なくとも前記検査イメージのサブセットを、前記ニューラルネットワークモデルのそれぞれに提供することと、前記ニューラルネットワークモデルのそれぞれを使用してニューラルネットワークモデル出力データを生成することと、を含む、請求項３８に記載のシステム。

【請求項40】

【請求項41】

実行される前記ニューラルネットワークモデルのリストは、それぞれが単一のニューラルネットワークモデルに対応する、実行される複数の別のニューラルネットワークモデルのリストを備える、請求項３８に記載のシステム。

【請求項42】

前記オペレータデバイスは、前記第２モデルトリガ条件を設定する入力データを受け取るためのユーザインターフェースを生成するように構成され、前記第２モデルトリガ条件は、前記オペレータデバイスまたは前記ＡＩビジュアル検査デバイスによって前記入力データに応じて生成される、請求項１に記載のシステム。

【請求項43】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクトクラスラベルを含み、前記第２ニューラルネットワークモデルトリガ条件は、要求されたオブジェクトクラスラベルを含み、前記プロセッサは、前記検出されたオブジェクトの前記オブジェクトクラスラベルが、前記要求されたオブジェクトクラスラベルにマッチングするか否かを判定する、請求項２５に記載のコンピュータデバイス。

【請求項44】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクト位置データを含み、前記第２ニューラルネットワークモデルトリガ条件は、オブジェクト位置要求を含み、前記プロセッサは、前記検出されたオブジェクトの前記オブジェクト位置データが、前記オブジェクト位置要求を満たすか否かを判定する、請求項２５に記載のシステム。

【請求項45】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの信頼レベルを含み、前記第２ニューラルネットワークモデルトリガ条件は、最低信頼レベルを満たすことを含み、前記プロセッサは、前記検出されたオブジェクトの前記信頼レベルが、前記最低信頼レベルを満たすか否かを判定する、請求項２５に記載のシステム。

【請求項46】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクトサイズデータを含み、前記第２ニューラルネットワークモデルトリガ条件は、最小オブジェクトサイズを満たすことを含み、前記プロセッサは、前記オブジェクトサイズデータが、前記最小オブジェクトサイズを満たすか否かを判定する、請求項２５に記載のシステム。

【請求項47】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの少なくとも二つの属性を記述するオブジェクト属性データを含む、請求項２５に記載のシステム。

【請求項48】

前記少なくとも二つの属性は、オブジェクト位置、オブジェクトクラスラベル、オブジェクト信頼レベル、およびオブジェクトサイズの任意の二つ以上を含む、請求項４７に記載のシステム。

【請求項49】

前記第２ニューラルネットワークモデルトリガ条件は、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を含み、前記プロセッサは、前記オブジェクト属性データが、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を満たすか否かを判定するように更に構成される、請求項４７に記載のシステム。

【請求項50】

前記第１ニューラルネットワーク出力データは、前記第２ニューラルネットワークモデルトリガ条件が前記プロセッサによって使用されることを識別する識別子を含む、請求項２５に記載のシステム。

【請求項51】

前記プロセッサは、前記識別子に基づいて、前記第２ニューラルネットワークモデルトリガ条件が使用されることを判定する、請求項５０に記載のシステム。

【請求項52】

前記第２ニューラルネットワークモデルトリガ条件が使用されることを判定する際、前記プロセッサは、前記第１ニューラルネットワークモデル出力データが、前記第２ニューラルネットワークモデルトリガ条件を満たすか否かを判定するために、前記識別子を使用して前記メモリから前記第２ニューラルネットワークモデルトリガ条件を取り出す、請求項５１に記載のシステム。

【請求項53】

前記識別子は、前記第１ニューラルネットワークモデルを識別するモデル識別データを備える、請求項５０に記載のシステム。

【請求項54】

前記第２ニューラルネットワークモデルに提供される前記イメージデータは、前記第１ニューラルネットワークモデル出力データから判定される前記イメージデータのサブセットを備え、前記第２オブジェクト検出タスクは、前記イメージデータの前記サブセットを使用して実行される、請求項２５に記載のシステム。

【請求項55】

前記プロセッサは、前記第２ニューラルネットワークモデルトリガ条件が満たされると判定する時に、前記第１ニューラルネットワークモデル出力データに基づいて、前記第２ニューラルネットワークモデルを含む、前記プロセッサによって実行されるニューラルネットワークモデルのリストを生成するように更に構成される、請求項２５に記載のシステム。

【請求項56】

前記プロセッサは、前記リストにおける前記ニューラルネットワークモデルのそれぞれを連続的に実行し、前記ニューラルネットワークモデルのそれぞれの実行は、少なくとも前記イメージデータのサブセットを、前記ニューラルネットワークモデルのそれぞれに提供することと、前記ニューラルネットワークモデルのそれぞれを使用してニューラルネットワークモデル出力データを生成することと、を含む、請求項５５に記載のシステム。

【請求項57】

前記プロセッサは、前記メモリに保存された追加的なニューラルネットワークモデルのニューラルネットワークモデルトリガ条件を満たす、先に実行されたニューラルネットワークモデルによって生成されたニューラルネットワーク出力データに基づいて、前記プロセッサによって判定される、実行される前記追加的なニューラルネットワークモデルが含まれるように、前記リストを動的に更新するように更に構成される、請求項５５に記載のシステム。

【請求項58】

実行される前記ニューラルネットワークモデルのリストは、それぞれが単一のニューラルネットワークモデルに対応する、実行される複数の別のニューラルネットワークモデルのリストを備える、請求項５５に記載のシステム。

【請求項59】

前記第１ニューラルネットワークモデルおよび前記第２ニューラルネットワークモデルの少なくとも一つは、イメージセグメンテーションニューラルネットワークモデルである、請求項１に記載のシステム。

【請求項60】

前記イメージセグメンテーションニューラルネットワークモデルは、インスタンスセグメンテーションニューラルネットワークモデルである、請求項５９に記載のシステム。

【請求項61】

前記第１ニューラルネットワークモデルおよび前記第２ニューラルネットワークモデルの少なくとも一つは、イメージセグメンテーションニューラルネットワークモデルである、請求項２に記載のシステム。

【請求項62】

前記イメージセグメンテーションニューラルネットワークモデルは、インスタンスセグメンテーションニューラルネットワークモデルである、請求項６１に記載のシステム。

【請求項63】

前記第１ニューラルネットワークモデルおよび前記第２ニューラルネットワークモデルの少なくとも一つは、イメージセグメンテーションニューラルネットワークモデルである、請求項２２に記載の方法。

【請求項64】

前記イメージセグメンテーションニューラルネットワークモデルは、インスタンスセグメンテーションニューラルネットワークモデルである、請求項６３に記載の方法。

【請求項65】

前記第１ニューラルネットワークモデルおよび前記第２ニューラルネットワークモデルの少なくとも一つは、イメージセグメンテーションニューラルネットワークモデルである、請求項２５に記載のデバイス。

【請求項66】

前記イメージセグメンテーションニューラルネットワークモデルは、インスタンスセグメンテーションニューラルネットワークモデルである、請求項６５に記載のデバイス。

【請求項67】

コンピュータプロセッサによって実行可能な命令であって、マルチモデルアーキテクチャを使用する自動化された人工知能（AI）ビジュアル検査のための方法を、実行時に前記コンピュータプロセッサに実行させる命令を備える非一時的なコンピュータ読取可能媒体であって、
前記方法は、
検査イメージデータにおける第１オブジェクトクラスを検出するように構成される第１ニューラルネットワークモデルへの入力として、前記検査イメージデータを提供することと、
前記第１ニューラルネットワークモデルを使用して、第１ニューラルネットワークモデル出力データを生成することを含む第１オブジェクト検出タスクを実行することと、
前記第１ニューラルネットワークモデル出力データを、検査イメージアノテーションデータとしてメモリに保存することと、
前記第１ニューラルネットワークモデル出力データが、前記メモリに保存される第２モデルトリガ条件を満たすか否かを判定することと、
前記第１ニューラルネットワークモデル出力データが前記第２モデルトリガ条件を満たす場合、
前記検査イメージデータにおける第２オブジェクトクラスを検出するように構成される第２ニューラルネットワークモデルへの入力として、前記検査イメージデータを提供することと、
前記第２ニューラルネットワークモデルを使用して、第２ニューラルネットワーク出力データを生成することを含む第２オブジェクト検出タスクを実行することと、
前記第２ニューラルネットワーク出力データを、前記検査イメージアノテーションデータのサブセットとして前記メモリに保存することと、
を実行する。

【発明の詳細な説明】

【技術分野】

【0001】

以下は、製造品質コントロールのための自動化されたビジュアル検査に関し、より具体的には、人工知能（AI）を使用する自動化されたビジュアル検査のためのシステムおよび方法に関する。

【背景技術】

【0002】

製造品質コントロールのための自動化されたビジュアル検査への従来のアプローチは、特定のオブジェクトが分析されるオブジェクトのクラスであるか否かを認識することから、特定のオブジェクトにおける欠陥または異常を検出することまで及ぶ、各種の異なるオブジェクト検出タスクを実行するための単一のモデルのトレーニングにフォーカスしていた。このようなアプローチは非常にチャレンジングであり、新しいトレーニングデータおよび機能を単一のモデルに組み込むことで、パフォーマンスが低下するリスクがある。このようなパフォーマンスの低下は、より新しい機能の方にモデルがドリフトするために起こり、より新しいデータが提供される際に、一つのタスクについてのパフォーマンスの向上がもたらされる一方で、他のタスクについての優位性が失われてしまう。

【発明の概要】

【発明が解決しようとする課題】

【0003】

このように、複数の異なる目的のために大きいAIモデルをトレーニングして、複数の異なるタスクを実行することは、例えば、重み共有、ネットワークの頭、およびリソースの競合に関して、しばしばますます劣ったパフォーマンスをもたらす。

【0004】

従って、現状のシステムおよび方法の欠点の少なくともいくつかを克服する、自動化されたビジュアル検査タスクのための改良されたシステム、方法、およびデバイスが必要とされている。このような改良されたシステム、方法、およびデバイスは、有利なことに、オブジェクト検出に関する自動化されたビジュアル検査タスクを実行してもよい。

【課題を解決するための手段】

【0005】

マルチモデルアーキテクチャを使用する自動化された人工知能（AI）ビジュアル検査のためのシステムが提供される。システムは、検査されているターゲットオブジェクトの検査イメージデータを取得するためのカメラデバイスと、ＡＩビジュアル検査デバイスと、を含む。ＡＩビジュアル検査デバイスは、第２ニューラルネットワークモデルの使用をトリガするための第２モデルトリガ条件を保存するメモリと、メモリと通信しているプロセッサと、を含む。プロセッサは、検査イメージにおける第１オブジェクトクラスを検出し、検出されたオブジェクトの第１リストを含む第１ニューラルネットワークモデル出力データを生成するように構成される第１ニューラルネットワークモデルを実行することと、第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たすか否かを判定するように構成されるモデルトリガ判定モジュールを実行することと、第２モデルトリガ条件が満たされると、検査イメージにおける第２オブジェクトクラスを検出し、検出されたオブジェクトの第２リストを含む第２ニューラルネットワークモデル出力データを生成するように構成される第２ニューラルネットワークモデルを実行することと、通信インターフェースを介して、第１ニューラルネットワークモデル出力データおよび生成される場合は第２ニューラルネットワークモデル出力データを含むニューラルネットワークモデル出力データをオペレータデバイスに送ることと、を実行するように構成される。オペレータデバイスは、受け取られたニューラルネットワークモデル出力データを表示するように構成される。

【0006】

いくつかの実施形態では、第１ニューラルネットワークモデルおよび第２ニューラルネットワークモデルの少なくとも一つが、イメージセグメンテーションニューラルネットワークモデルである。いくつかの実施形態では、イメージセグメンテーションニューラルネットワークモデルが、インスタンスセグメンテーションニューラルネットワークモデルである。

【0007】

マルチモデルアーキテクチャを使用する自動化された人工知能（AI）ビジュアル検査のためのシステムが提供される。システムは、検査されているターゲットオブジェクトの検査イメージデータを取得するためのカメラデバイスと、ＡＩビジュアル検査デバイスと、を含む。ＡＩビジュアル検査デバイスは、カメラデバイスから検査イメージデータを受け取るための通信インターフェースと、検査イメージデータにおける第１オブジェクトクラスを検出するように構成される第１ニューラルネットワークモデル、検査イメージデータにおける第２オブジェクトクラスを検出するように構成される第２ニューラルネットワークモデル、および第２ニューラルネットワークモデルの使用をトリガするための第２モデルトリガ条件を保存するメモリと、メモリと通信しているプロセッサと、を含む。プロセッサは、第１オブジェクト検出モデルへの入力として、検査イメージデータを提供することと、第１ニューラルネットワークモデルを使用して、第１ニューラルネットワークモデル出力データを生成することを含む第１オブジェクト検出タスクを実行することと、第１ニューラルネットワークモデル出力データを、検査イメージアノテーションデータとしてメモリに保存することと、第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たすか否かを判定することと、を実行するように構成される。第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たす場合、プロセッサは、第２ニューラルネットワークモデルへの入力として、検査イメージデータを提供することと、第２ニューラルネットワークモデルを使用して、第２ニューラルネットワーク出力データを生成することを含む第２オブジェクト検出タスクを実行することと、第２ニューラルネットワークモデル出力データを、検査イメージアノテーションデータのサブセットとしてメモリに保存することと、を実行するように更に構成される。通信インターフェースは、検査イメージデータおよび検査イメージアノテーションデータを、表示のためにオペレータデバイスに送るように構成される。システムは、検査イメージデータおよび検査イメージアノテーションデータを、アノテーションされた検査イメージとして表示するためのオペレータデバイスを更に含む。

【0008】

検査イメージアノテーションデータは、検査イメージデータのメタデータとして保存されてもよい。

【0009】

オペレータデバイスは、検査イメージアノテーションデータのいずれを表示すべきかを示すユーザからの入力データを受け取り、示された検査イメージアノテーションデータのみをアノテーションされた検査イメージにおいて表示するように構成されてもよい。

【0010】

第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクトクラスラベルを含んでもよく、第２モデルトリガ条件は、要求されたオブジェクトクラスラベルを含んでもよく、プロセッサは、検出されたオブジェクトのオブジェクトクラスラベルが、要求されたオブジェクトクラスラベルにマッチングするか否かを判定してもよい。

【0011】

第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクト位置データを含んでもよく、第２モデルトリガ条件は、オブジェクト位置要求を含んでもよく、プロセッサは、検出されたオブジェクトのオブジェクト位置データが、オブジェクト位置要求を満たすか否かを判定してもよい。

【0012】

第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの信頼レベルを含んでもよく、第２モデルトリガ条件は、最低信頼レベルを満たすことを含んでもよく、プロセッサは、検出されたオブジェクトの信頼レベルが、最低信頼レベルを満たすか否かを判定してもよい。

【0013】

第１ニューラルネットワークモデル出力データは、検出されたオブジェクトのオブジェクトサイズデータを含んでもよく、第２モデルトリガ条件は、最小オブジェクトサイズを満たすことを含んでもよく、プロセッサは、オブジェクトサイズデータが、最小オブジェクトサイズを満たすか否かを判定してもよい。

【0014】

第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの少なくとも二つの属性を記述するオブジェクト属性データを含んでもよい。

【0015】

少なくとも二つの属性は、オブジェクト位置、オブジェクトクラスラベル、オブジェクト信頼レベル、およびオブジェクトサイズの任意の二つ以上を含んでもよい。

【0016】

第２モデルトリガ条件は、検出されたオブジェクトの少なくとも二つの属性のそれぞれについての要求を含んでもよいく、プロセッサは、オブジェクト属性データが、検出されたオブジェクトの少なくとも二つの属性のそれぞれについての要求を満たすか否かを判定するように更に構成されてもよい。

【0017】

第１ニューラルネットワーク出力データは、第２モデルトリガ条件がプロセッサによって使用されることを識別する識別子を含んでもよい。

【0018】

プロセッサは、識別子に基づいて、第２モデルトリガ条件が使用されることを判定してもよい。

【0019】

第２モデルトリガ条件が使用されることを判定する際、プロセッサは、第１ニューラルネットワークモデル出力データが、第２モデルトリガ条件を満たすか否かを判定するために、識別子を使用してメモリから第２モデルトリガ条件を取り出してもよい。

【0020】

識別子は、第１ニューラルネットワークモデルを識別するモデル識別データを備えてもよい。

【0021】

第２ニューラルネットワークモデルに提供される検査イメージデータは、第１ニューラルネットワークモデル出力データから判定されてもよい検査イメージデータのサブセットを備えてもよく、第２オブジェクト検出タスクは、検査イメージデータのサブセットを使用して実行されてもよい。

【0022】

プロセッサは、第２モデルトリガ条件が満たされると判定する時に、第１ニューラルネットワークモデル出力データに基づいて、第２ニューラルネットワークモデルを含む、プロセッサによって実行されるニューラルネットワークモデルのリストを生成するように更に構成されてもよい。

【0023】

プロセッサは、リストにおけるニューラルネットワークモデルのそれぞれを連続的に実行してもよく、ニューラルネットワークモデルのそれぞれの実行は、少なくとも検査イメージデータのサブセットを、ニューラルネットワークモデルのそれぞれに提供することと、ニューラルネットワークモデルのそれぞれを使用してニューラルネットワークモデル出力データを生成することと、を含む。

【0024】

プロセッサは、実行される追加的なニューラルネットワークモデルが含まれるように、リストを動的に更新するように更に構成されてもよい。実行される追加的なニューラルネットワークモデルは、メモリに保存された追加的なニューラルネットワークモデルのモデルトリガ条件を満たす、先に実行されたニューラルネットワークモデルによって生成されたニューラルネットワーク出力データに基づいて、プロセッサによって判定されてもよい。

【0025】

実行されるニューラルネットワークモデルのリストは、それぞれが単一のニューラルネットワークモデルに対応する、実行される複数の別のニューラルネットワークモデルのリストを備えてもよい。

【0026】

オペレータデバイスは、第２モデルトリガ条件を設定する入力データを受け取るためのユーザインターフェースを生成するように構成されてもよく、第２モデルトリガ条件は、オペレータデバイスまたはＡＩビジュアル検査デバイスによって入力データに応じて生成されてもよい。

【0027】

【0028】

マルチモデルアーキテクチャを使用する自動化された人工知能（AI）ビジュアル検査のコンピュータ利用方法が提供される方法は、検査イメージデータにおける第１オブジェクトクラスを検出するように構成される第１ニューラルネットワークモデルへの入力として、検査イメージデータを提供することと、第１ニューラルネットワークモデルを使用して、第１ニューラルネットワークモデル出力データを生成することを含む第１オブジェクト検出タスクを実行することと、第１ニューラルネットワークモデル出力データを、検査イメージアノテーションデータとしてメモリに保存することと、第１ニューラルネットワークモデル出力データが、メモリに保存される第２モデルトリガ条件を満たすか否かを判定することと、第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たす場合、検査イメージデータにおける第２オブジェクトクラスを検出するように構成される第２ニューラルネットワークモデルへの入力として、検査イメージデータを提供することと、第２ニューラルネットワークモデルを使用して、第２ニューラルネットワーク出力データを生成することを含む第２オブジェクト検出タスクを実行することと、第２ニューラルネットワーク出力データを、検査イメージアノテーションデータのサブセットとしてメモリに保存することと、を含む。

【0029】

方法は、検査イメージデータおよび検査イメージアノテーションデータを使用して、アノテーションされた検査イメージを生成することを更に含んでもよい。

【0030】

方法は、アノテーションされた検査イメージをユーザインターフェースにおいて表示することを更に含んでもよい。

【0031】

【0032】

マルチモデルアーキテクチャを使用するオブジェクト検出を実行するためのコンピュータデバイスも提供される。デバイスは、イメージデータを受け取るための通信インターフェースと、イメージデータ、イメージデータにおける第１オブジェクトクラスを検出するように構成される第１ニューラルネットワークモデル、イメージデータにおける第２オブジェクトクラスを検出するように構成される第２ニューラルネットワークモデル、および第２ニューラルネットワークモデルトリガ条件を保存するためのメモリと、メモリと通信しているプロセッサと、を含む。プロセッサは、第１ニューラルネットワークモデル出力データを生成するための第１ニューラルネットワークモデルを使用して、イメージデータについて第１オブジェクト検出タスクを実行することと、第１ニューラルネットワークモデル出力データを、メモリに保存することと、第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たすか否かを判定することと、第１ニューラルネットワークモデル出力データが第２モデルトリガ条件を満たす場合、第２ニューラルネットワーク出力データを生成するための第２ニューラルネットワークモデルを使用して、イメージデータについて第２オブジェクト検出タスクを実行することと、第２ニューラルネットワークモデル出力データを、メモリに保存することと、を実行するように構成される。

【0033】

【0034】

他の側面および特徴は、いくつかの例示的な実施形態の以下の記述をレビューした当業者にとって明らかになる。

【図面の簡単な説明】

【0035】

ここに含まれる以下の図面は、本明細書の物品、方法、および装置の様々な例を示すためのものである。

【0036】

図１は、一実施形態に係る自動化されたビジュアル検査のためのシステムの模式図である。

【0037】

図２は、一実施形態に係る本開示のコンピューティングデバイスのブロック図である。

【0038】

図３は、一実施形態に係る自動化されたビジュアル検査のためのコンピュータシステムのブロック図である。

【0039】

図４は、一実施形態に係る図３のマルチモデルビジュアル検査モジュールのブロック図である。

【0040】

図５は、一実施形態に係る図３のマルチモデルビジュアル検査モジュールを使用する自動化されたビジュアル検査の方法のフロー図である。

【0041】

図６は、一実施形態に係る自動化されたビジュアル検査システムのブロック図である。

【0042】

図７は、一実施形態に係る図４の自動化されたビジュアル検査システムを使用する自動化されたビジュアル検査の方法のフロー図である。

【0043】

図８は、単一のオブジェクト検出器を使用する自動化されたビジュアル検査のためのシステムに／によってそれぞれ提供される、カムシャフトの入力イメージおよび出力イメージの表示例を示す。

【0044】

図９は、本開示のシステムおよび方法によって生成および使用されてもよい、カムシャフトの第１および第２出力イメージと、組み合わされたアノテーションされたカムシャフトの出力イメージの表示例を示す。ここで、組み合わされたアノテーションされた出力イメージは、一実施形態に係るマルチモデルビジュアル検査システムの異なる自動化されたビジュアル検査モデルを使用して生成される、カムシャフトの第１および第２出力イメージを使用して生成される。

【発明を実施するための形態】

【0045】

以下では、請求項に係る各実施形態の一例を提供するために、様々な装置またはプロセスが記述される。以下で記述されるいずれの実施形態も、請求項に係るいずれの実施形態を限定するものではなく、請求項に係るいずれの実施形態も、以下で記述されるものと異なるプロセスまたは装置をカバーしてもよい。請求項に係る実施形態は、以下で記述される任意の一つの装置またはプロセスの特徴の全てを有する装置またはプロセスや、以下で記述される複数または全ての装置に共通の特徴に限定されない。

【0046】

ここで記述される一または複数のシステムは、それぞれ、少なくとも一つのプロセッサ、データストレージシステム（揮発性および不揮発性メモリおよび／またはストレージ要素を含む）、少なくとも一つの入力デバイス、および少なくとも一つの出力デバイスを備えるプログラマブルコンピュータ上で実行されるコンピュータプログラムにおいて実装されてもよい。非限定的な例として、プログラマブルコンピュータは、プログラマブルロジックユニット、メインフレームコンピュータ、サーバ、およびパーソナルコンピュータ、クラウドベースプログラムまたはシステム、ラップトップ、パーソナルデータアシスタンス、携帯電話、スマートフォン、またはタブレットデバイスでもよい。

【0047】

各プログラムは、好ましくは、コンピュータシステムと通信するための高レベルの手続型またはオブジェクト指向プログラミングおよび／またはスクリプト言語において実装される。但し、プログラムは、必要に応じて、アセンブリまたは機械言語において実装されうる。言語は、コンパイルまたは解釈された言語でもよい。このような各コンピュータプログラムは、好ましくは、ストレージメディアや、汎用または専用のプログラマブルコンピュータによって読取可能なデバイス上に保存され、ここで記述される手続を実行するために、ストレージメディアまたはデバイスがコンピュータによって読み取られる時に、コンピュータを構成して動作させる。

【0048】

互いに通信しているいくつかのコンポーネントを有する一実施形態の記述は、このような全てのコンポーネントが要求されることを意味するものではない。逆に、本発明の可能な実施形態の広い適用範囲を例示するために、様々なオプションのコンポーネントが記述される。

【0049】

更に、処理のステップ、方法のステップ、アルゴリズム等は、順番に記述されてもよいが（開示および／または請求項において）、このようなプロセス、方法およびアルゴリズムは、異なる順序で働くように構成されてもよい。換言すれば、記述されてもよいステップのいずれのシーケンスまたはいずれの順序も、ステップがその順序で実行されることを必ずしも要求するものではない。ここで記述されるプロセスのステップは、任意の現実的な順序で実行されてもよい。更に、いくつかのステップは、同時に実行されてもよい。

【0050】

単一のデバイスまたは物品がここで記述される場合、複数のデバイス／物品（それらが協働するか否かに関わらず）が、単一のデバイス／物品の代わりに使用されてもよいことは明らかである。同様に、複数のデバイスまたは物品がここで記述される場合（それらが協働するか否かに関わらず）、単一のデバイス／物品が、複数のデバイスまたは物品の代わりに使用されてもよいことは明らかである。

【0051】

以下は、製造品質コントロールのための自動化されたビジュアル検査に関し、より具体的には、人工知能（AI）を使用する自動化されたビジュアル検査のためのシステムおよび方法に関する。本開示は、人工知能に基づくイメージ分析およびマルチモデルアーキテクチャを使用するビジュアル検査のためのシステム、方法、およびデバイスを提供する。マルチモデルアーキテクチャは、ニューラルネットワーク等の複数の機械学習モデルを含む。一実施形態では、ニューラルネットワークがオブジェクト検出モデルである。概して、各ニューラルネットワークは、特定のタスクを実行するためにトレーニングされている。モデルトリガ条件は、マルチモデルアーキテクチャにおける一または複数のニューラルネットワークによって生成されるニューラルネットワーク出力に基づいて、マルチモデルアーキテクチャにおける他のニューラルネットワークの使用をトリガするか否かを自動的に判定するために使用される。ニューラルネットワークの使用をトリガすることは、分析されているイメージ（または、その部分）をデータストレージから取り出すことと、トリガされるニューラルネットワークが入力データを処理してニューラルネットワーク出力を生成するように、トリガされるニューラルネットワークの入力レイヤに対してイメージを提供することと、を含んでもよい。本開示のシステムおよび方法によって実装されるマルチモデルアーキテクチャは、モデルのアーキテクチャおよび何のモデルが何のモデル出力によってトリガされるかを判定するモデル間の特定のロジックを含む、ニューラルネットワークを有する決定木の一タイプとして機能してもよい。

【0052】

ここで使用されるように、用語「オブジェクト検出」は、概して、デジタルイメージにおいてオブジェクトが検出または識別されるコンピュータビジョン技術を表す趣旨である。本開示において使用される用語「オブジェクト検出」は、既知のオブジェクトクラスの全てのインスタンスがデジタルイメージにおいて局所化および分類される「オブジェクト検出」の特定のコンピュータビジョン技術を含むが、これに限定されるものではない。例えば、ここで使用される用語「オブジェクト検出」は、デジタルイメージにおけるオブジェクトの存在が、イメージにおける各オブジェクトのためのピクセルマスクを使用してマークされる、イメージセグメンテーション技術を含む趣旨である。イメージセグメンテーションの一つの具体例は、デジタルイメージにおけるオブジェクトが、特定のオブジェクトの局所化およびそれらに属するピクセルの関連付けを介して検出および分割される、インスタンスセグメンテーションである。インスタンスセグメンテーションは、デジタルイメージ内の全ての既知のオブジェクトについての各オブジェクトインスタンスを識別することを含み、デジタルイメージの各ピクセルにラベルを付与することを含む。このように、「モデル」、「オブジェクト検出モデル」、「ニューラルネットワーク」、「オブジェクト検出ニューラルネットワーク」等への参照は、インスタンスセグメンテーションモデルまたはニューラルネットワークが使用される実施形態および「オブジェクト検出」モデルまたはニューラルネットワークが使用される実施形態を含む趣旨である。

【0053】

産業および／または商業の状況では、顧客への配送または顧客による使用の前に、機械的な適合のために様々な部品が分析される必要がある。同様に、様々な部品のそれぞれは、欠陥または異常の多くの異なるクラスの影響を受けうる。製造者は、顧客ロイヤルティを保持および／または適用される法律および／または規制に準拠しながら、このような欠陥部品を売ることができないかもしれない。このような異常は、それほどの欠陥部品をもたらさないかもしれない。それにも関わらず、何の欠陥および／または異常がどの部品で発生したかを認識することは、製造者にとって有益でありうる。このような知識は、製造者が、問題を、特定の装置、プロセス、サプライ、または前兆まで辿ることを可能にする。このような知識は、更に、製造者が、分析の下で明かされた欠陥または異常を補正および防止することを可能にする。

【0054】

様々な部品のそれぞれの詳細な分析は、時間の関数としてコストがかかる。人間の労働者は、一般的に、短期では細部に付随するロスを伴わず、長期では仕事に対する満足度の低下を伴わずに、長時間に亘る緻密な暗記タスクを実行するコンピュータまたは装置ほど有能ではない。このように、製造者にとっては、部品を分析して欠陥および／または異常を検出するために、自動化されたビジュアル検査のためのシステムを使用することが極めて有利である。

【0055】

ここで、様々なオブジェクト検出タスクのそれぞれを実行するための単一の「大きい」モデルをトレーニングすることも可能だが、このアプローチは、モデルまたはシステムの開発者および使用者の両方にとって、欠点がある上にチャレンジングである。製造者がモデルを再トレーニングおよび更新するために新しいデータを供給できる場合であっても、このような再トレーニングおよび更新は、更に、モデルを特定のタスクの方にドリフトさせてしまう恐れがある。すなわち、新しいタスクについて向上がもたらされる一方で、他のタスクに関する悪化がもたらされてしまう。単一の「大きい」モデルに関する更なる懸念は、重み共有およびネットワークの頭の懸念を含む。複数のタスクについて単一の大きいネットワークをトレーニングする場合、キャパシティについての「タスク」競合に関する問題が発生しうる。これは、モデルが、全体的なロスを最適化しながら、特定のタスクの単一の精度に悪影響を及ぼすことがあるためである。この問題を解決するために、ロスが各タスクに接続され、それらの全てを同時に最適化することをモデルが試みる。これは、未だソリューションがない活発な研究のエリアである。テスト時間（エッジでの推論を実行する）中の演算バジェットがある場合、各タスクについてのより小さい単数のモデルを使用すれば、大幅に高い精度が得られる傾向がある。単一の「大きい」モデルの更なる欠点として、回帰テストが難しいという点がある。新しいデータおよび新しいタスクが、それらの全てが重みおよび勾配を共有している場合に、どのように先のタスクに影響するかを知ることは難しい。このように、大きいマルチヘッドモデルにおける矛盾をもたらしているものを特定することは難しい。

【0056】

自動化されたビジュアル検査のためのシステムが実行しなければならない様々なタスク（例えば、オブジェクト特定、欠陥検出、欠陥局所化）のために、他のタスクについてのパフォーマンスのための余地を残すために、一つのタスクについてのパフォーマンスが悪化しないシステムがあれば有利である。このように、それぞれが自身の指定されたタスク（それぞれの結果は単一の出力としてシステムによって統合されてもよい）を実行する、いくつかの「より小さい」モデルから構成されるシステムを有することは、製造者にとって極めて有利である。

【0057】

本開示は、オブジェクトの欠陥検出およびビジュアル検査（製造品質コントロールおよびビジュアル検査を含む）の文脈において発明を記述するが、ここで提供されるシステム、方法、およびデバイスは、オブジェクトの欠陥検出およびビジュアル検査の文脈であるか否か（例えば、自動運転車両、医療イメージ分析、マニピュレーションを使用するロボティクス等の他のコンピュータビジョンアプリケーション）に関わらず、ここで記述されるものを超える更なるアプリケーションおよび異なる用途を有してもよい。ここで記述されるモデルやオブジェクト検出モデルと呼ばれる機械学習モデルは、他の実施形態では、オブジェクト検出と異なる機械学習タスクを実行するように構成される機械学習モデルの他の形態でもよい。例えば、マルチモデルアーキテクチャは、オブジェクト検出または他のイメージ処理タスクを実行するように構成される複数のニューラルネットワークを含んでもよい。このような場合の入力データは出力データと同様に変動しうるが、複数のモデルおよびトリガ条件等の本開示の要素は、ここで開示されるプロセスの終了時のデータアグリゲーションも含めて、同様に働きうる。

【0058】

ここで記述されるように、本開示は、入力データを受け取って少なくとも一つの出力を生成するように構成される複数のニューラルネットワークを含むマルチモデルアーキテクチャを提供する。ニューラルネットワークは、フィードフォワードニューラルネットワークでもよい。ニューラルネットワークは、複数の処理ノードを有してもよい。処理ノードは、複数の入力ノードを有する多変数の入力レイヤ、少なくとも一つのノードの隠れたレイヤ、および少なくとも一つの出力ノードを有する出力レイヤを含んでもよい。ニューラルネットワークのオペレーションの間、隠れたレイヤにおけるノードのそれぞれは、当該ノードに（入力レイヤまたは隠れたレイヤの他のレイヤから）到達する任意の入力に対して、活性化／伝達関数および重みを適用する。ノードは、（後続の隠れたレイヤまたは出力レイヤの）他のノードに対して出力を提供してもよい。ニューラルネットワークは、連続的な出力を提供する回帰分析またはデータを分類するための分類分析を実行するように構成されてもよい。ニューラルネットワークは、以下で記述されるように、教師ありまたは教師なし学習技術を使用してトレーニングされてもよい。教師あり学習技術によれば、出力レイヤでの既知の出力値のセットと共に、トレーニングデータセットが入力レイヤで提供される。トレーニングステージの間、ニューラルネットワークは、トレーニングデータセットを処理しうる。ニューラルネットワークが、トレーニングステージにおいてトレーニングデータから学習した情報を一般化することによって、新しい入力データについて出力を提供する方法を学習することが意図されている。トレーニングは、エラーを最小化するために隠れたレイヤのノードの重みを決定するように、バックプロパゲーションエラーによって影響されてもよい。一旦トレーニングされると（または、オプションでトレーニング中に）、出力を提供するためのテストまたは検証データが、ニューラルネットワークに対して提供されうる。そして、ニューラルネットワークは、出力レイヤで少なくとも一つの出力を提供するために、入力レイヤに対して提供された入力を相互相関させてもよい。各実施形態においてニューラルネットワークによって提供される出力は、ニューラルネットワークが入力データを満足に処理できるように、与えられた入力についての所望の出力に近いことが好ましい。

【0059】

図１を参照して、一実施形態に係る、自動化されたビジュアル検査システム１０が示されている。システム１０は、ネットワーク２０を介して、カメラデバイス１４、オペレータデバイス１６、およびプログラマブルロジックコントローラ（PLC）デバイス１８と通信するＡＩビジュアル検査デバイス１２を含む。

【0060】

ＡＩビジュアル検査デバイス１２は、オブジェクト検出タスクを実行するように構成されてもよい。ＡＩビジュアル検査デバイス１２は、複数のオブジェクト検出モデルを含んでもよい。各オブジェクト検出モデルは、特定のオブジェクト検出タスクを実行するようにトレーニングされたモデルでもよい。オブジェクト検出は、ＡＩビジュアル検査デバイス１２に対して提示された入力データ等の入力データ内の特定のクラスに属する特定のオブジェクトのインスタンスを検出することを含む。オブジェクト検出モデルは、ニューラルネットワーク（例えば、畳み込みニューラルネットワークまたはCNN）等の深層学習技術および機械学習アプローチを含んでもよい。機械学習オブジェクト検出アプローチでは、対象オブジェクトの関連する特徴が予め定義される一方で、このような定義はニューラルネットワークにおいては要求されない。

【0061】

ＡＩビジュアル検査デバイス１２は、オブジェクト検出の文脈外のタスクを実行するように構成されてもよい。このようなタスクは、他の形態の機械学習（ML）または人工知能タスクまたは非MLタスクを含んでもよい。

【0062】

デバイス１２、１４、１６、１８は、サーバコンピュータ、ノードコンピューティングデバイス（例えば、JETSONコンピューティングデバイス）、組み込みデバイス、デスクトップコンピュータ、ノートブックコンピュータ、タブレット、PDA、スマートフォン、または他のコンピューティングデバイスでもよい。デバイス１２、１４、１６、１８は、インターネットへの有線または無線接続等のネットワーク２０との接続を含んでもよい。いくつかの場合では、ネットワーク２０が、他のタイプのコンピュータまたは通信ネットワークを含んでもよい。デバイス１２、１４、１６、１８は、メモリ、副ストレージデバイス、プロセッサ、入力デバイス、ディスプレイデバイス、および出力デバイスの一または複数を含んでもよい。メモリは、ランダムアクセスメモリ（RAM）または同様のタイプのメモリを含んでもよい。また、メモリは、プロセッサによって実行されるための一または複数のアプリケーションを保存してもよい。アプリケーションは、以下で記述される機能のための処理を実行するためのコンピュータ実行可能命令を備えるソフトウェアモジュールと対応してもよい。副ストレージデバイスは、ハードディスクドライブ、フロッピーディスクドライブ、CDドライブ、DVDドライブ、ブルーレイドライブ、または他のタイプの不揮発性データストレージを含んでもよい。プロセッサは、アプリケーション、コンピュータ読取可能命令またはプログラムを実行してもよい。アプリケーション、コンピュータ読取可能命令またはプログラムは、メモリまたは副ストレージに保存されてもよいし、インターネットまたは他のネットワーク２０から受け取られてもよい。

【0063】

入力デバイスは、デバイス１２、１４、１６、１８に情報を入力するための任意のデバイスを含んでもよい。例えば、入力デバイスは、キーボード、キーパッド、カーソル制御デバイス、タッチスクリーン、カメラ、またはマイクロフォンでもよい。ディスプレイデバイスは、視覚情報を提示するための任意のタイプのデバイスを含んでもよい。例えば、ディスプレイデバイスは、コンピュータモニタ、フラットスクリーンディスプレイ、プロジェクタ、またはディスプレイパネルでもよい。出力デバイスは、情報のハードコピーを提示するための任意のタイプのデバイス（例えば、プリンタ）を含んでもよい。出力デバイスは、スピーカ等の他のタイプの出力デバイスを含んでもよい。いくつかの場合では、デバイス１２、１４、１６、１８が、プロセッサ、アプリケーション、ソフトウェアモジュール、第２ストレージデバイス、ネットワーク接続、入力デバイス、出力デバイス、およびディスプレイデバイスのうち任意のものを複数含んでもよい。

【0064】

デバイス１２、１４、１６、１８は様々なコンポーネントと共に記述されるが、いくつかの場合では、デバイス１２、１４、１６、１８がより少ない、追加的なまたは異なるコンポーネントを含んでもよいと当業者は理解する。加えて、メモリに保存されるものとしてデバイス１２、１４、１６、１８の実装の側面が記述されうるが、これらの側面は、他のタイプのコンピュータプログラム製品または副ストレージデバイス等のコンピュータ読取可能メディア（ハードディスク、フロッピーディスク、CD、またはDVD、インターネットまたは他のネットワークからの搬送波、または他の形態のRAMまたはROMを含む）上に保存されうる／から読み出されうると当業者は理解する。コンピュータ読取可能メディアは、デバイス１２、１４、１６、１８を制御するための命令および／または特定の方法を実行するためのプロセッサを含んでもよい。

【0065】

デバイス１２、１４、１６、１８は、特定の行為を実行するものとして記述されうる。これらのデバイスの少なくともいずれかは、自動的にまたは当該デバイスのユーザによる相互作用に応じて、行為を実行してもよいと理解される。すなわち、デバイスのユーザは、一または複数の入力デバイス（例えば、タッチスクリーン、マウス、またはボタン）を操作して、デバイスに記述される行為を実行させてもよい。多くの場合、この側面は以下では記述されないが、暗黙的に理解される。

【0066】

一例として、デバイス１２、１４、１６、１８は、一または複数の他のデバイス１２、１４、１６、１８に対して情報を送ってもよいと以下で記述される。例えば、オペレータデバイス１６を使用するユーザは、一または複数の入力（例えば、マウスおよびキーボード）を操作して、デバイス１６のディスプレイ上に表示されるユーザインターフェースと相互作用してもよい。一般的に、デバイスは、ユーザインターフェースを、ネットワーク２０から受け取ってもよい（例えば、ウェブページの形態で）。あるいは、または加えて、ユーザインターフェースは、デバイスにローカル保存されてもよい（例えば、ウェブページのキャッシュまたはモバイルアプリケーション）。

【0067】

デバイス１２、１４、１６、１８は、複数のデバイス１２、１４、１６、１８の少なくともいずれかから、複数の情報を受け取るように構成されてもよい。

【0068】

情報を受け取った各デバイス１２、１４、１６、１８は、当該情報をストレージデータベースに保存してもよい。ストレージは、一または複数の他のデバイス１２、１４、１６、１８の副ストレージに対応してもよい。一般的に、ストレージデータベースは、ハードディスクドライブ、固体状態ドライブ、メモリカード、またはディスク（例えば、CD、DVD、またはブルーレイ）等の任意の適切なストレージデバイスでもよい。また、ストレージデータベースは、デバイス１２、１４、１６、１８とローカル接続されていてもよい。いくつかの場合では、ストレージデータベースは、デバイス１２、１４、１６、１８から離れて設置され、ネットワーク等を通じてデバイス１２、１４、１６、１８にアクセス可能でもよい。いくつかの場合では、ストレージデータベースが、ネットワーククラウドストレージプロバイダに設置されている一または複数のストレージデバイスを備えてもよい。

【0069】

ＡＩビジュアル検査デバイス１２は、オブジェクト（例えば、欠陥）検出タスク、オブジェクト（例えば、欠陥）分類タスク、ゴールデンサンプル分析タスク、オブジェクト（例えば、欠陥）トラッキングタスク、および他の関連するデータ処理タスクを、カメラデバイス１４によって取得される検査イメージを使用して実行するために特別にデザインされた専用装置でもよい。

【0070】

カメラデバイス１４は、イメージデータを取得する。イメージデータは、単一のイメージまたは複数のイメージを含んでもよい。複数のイメージ（フレーム）が、カメラ１４によってビデオとして取得されてもよい。検査されるオブジェクトのエリア（「検査オブジェクト」または「ターゲットオブジェクト」と表されてもよい）を撮像するために、カメラ１４および検査オブジェクトが互いに相対移動してもよい。例えば、複数のアングルからの適切な検査を提供するために、オブジェクトが回転されてカメラ１４によって複数のイメージが異なる位置で取得されてもよい。カメラ１４は、それぞれの位置（例えば、オブジェクトがカメラ１４に対して回転する場合）で撮られる、複数のフレームを取得するように構成されてもよい。

【0071】

検査オブジェクト（不図示）は、システム１０のユーザがビジュアル検査を実行したい任意の物理的な物品でもよい。検査オブジェクトは、製造またはマシニングプロセス中に発達する欠陥の影響を受けやすいものでもよい。欠陥は、「完璧な」または「良好な」物品からの許容不能な偏差として特徴付けられてもよい。欠陥を有する検査オブジェクトは、欠陥あり、許容不能、または「不良」（NG）と解釈される。システム１０は、オブジェクトを検査し、オブジェクトが欠陥を有するか否かを判定する。オブジェクトは、システム１０によって、欠陥ありまたは欠陥なしと分類されてもよい。オブジェクトに欠陥ありまたは欠陥なしと識別することによって、検査オブジェクトはビジュアル検査の結果に基づいて異なる扱いを受けうる。欠陥ありオブジェクトは、廃棄されてもよいし、更なる処理から除去されてもよい。欠陥なしオブジェクトは、更なる処理に進んでもよい。

【0072】

概して、検査オブジェクトは、欠陥が望ましくないオブジェクトでもよい。検査オブジェクトにおける欠陥は、オブジェクトまたは検査オブジェクトをコンポーネントとして含むより大きいオブジェクト（例えば、システムまたは装置）の機能的なパフォーマンスの低下に繋がりうる。検査オブジェクトにおける欠陥は、物品のビジュアルアピールを低減しうる。欠陥あり製品を発見することは、ビジネスが、欠陥あり物品の販売および使用を防止し、欠陥に関する根本原因を判定して、このような原因を解消するための重要なステップでありうる。

【0073】

検査オブジェクトは、組立物品でもよい。検査オブジェクトは、製造プロセス中に発達する欠陥が生じやすい製造物品でもよい。オブジェクトは、外観から何らかの価値が得られる物品であって、特定の欠陥が外観に悪影響を及ぼしうる物品でもよい。検査オブジェクトにおける欠陥は、オブジェクト自体の製造またはいくつかの他のプロセス（例えば、転送、テスト）中に発達しうる。

【0074】

検査オブジェクトは、金属、鉄、プラスチック、コンポジット、木、ガラス等の一または複数の材料から構成されてもよい。

【0075】

検査オブジェクトは、サイズおよび形において一様または非一様でもよい。オブジェクトは、曲がった外表面を有してもよい。

【0076】

検査オブジェクトは、複数のセクションを含んでもよい。オブジェクトセクションは、オブジェクトサブセクションに更に分割されてもよい。オブジェクトセクション（または、サブセクション）は、オブジェクトの見た目または機能に基づいて決定されてもよい。オブジェクトセクションは、オブジェクトのより良いビジュアル検査を可能にし、許容不能な欠陥ありオブジェクトをより良く識別するように決定されてもよい。

【0077】

オブジェクトセクションは、異なる機能を有するオブジェクトの異なる部品に対応してもよい。異なるセクションは、同様のまたは異なる寸法を有してもよい。いくつかの場合では、オブジェクトは、それぞれが検査オブジェクトにおいて一回または複数回に亘って現れる、複数の異なるセクションタイプを含んでもよい。セクションは、規則的または不規則的な形でもよい。異なるセクションは、異なる欠陥仕様（すなわち、特定の欠陥についての許容範囲）を有してもよい。

【0078】

検査オブジェクトは、システム１０を使用して検出可能な欠陥の複数のタイプまたはクラスが生じやすくてもよい。欠陥タイプの例は、ペイント、多孔性、凹み、スクラッチ、スラッジ等を含んでもよい。欠陥タイプは、オブジェクトに応じて変動しうる。例えば、欠陥タイプは、オブジェクトの製造プロセスまたは材料組成に基づいて、オブジェクトに特有のものでもよい。オブジェクトにおける欠陥は、それ自体の製造中に取得されてもよいし、オブジェクトの後続の処理を通じて取得されてもよい。

【0079】

オペレータデバイス１６は、ユーザインターフェースコンポーネント（または、モジュール）（例えば、ヒューマン／マシンインターフェース）を含む。オペレータデバイス１６は、ＡＩビジュアル検査デバイス１２からネットワーク２０を介してデータを受け取る。受け取られるデータは、カメラ１４からの出力データを含んでもよい。例えば、出力データは、アーティファクトデータを含むアノテーションされた出力イメージデータを含んでもよい。アーティファクトデータは、ＡＩビジュアル検査デバイス１２によって識別された検査イメージにおけるアーティファクト（例えば、欠陥、異常）が、表示されるイメージにおいて視覚的に識別されうるように、位置情報（例えば、座標、バウンディングボックス、インスタンスセグメンテーションにおけるようなオブジェクトの特定のインスタンスの境界、重心）およびラベル情報を含んでもよい。概して、ここで使用される「位置情報」または「位置データ」は、イメージにおけるオブジェクトのインスタンスの位置を指定するまたは局所化するために使用される任意の情報またはデータを含んでもよく、イメージにおけるオブジェクトを検出するためのモデル（例えば、オブジェクト検出、インスタンスセグメンテーション）によって使用される技術に応じて変動しうる。オペレータデバイス１６は、ＡＩビジュアル検査デバイス１２によって生成されるデータを備えるメタデータを、デジタル検査イメージに対して自動的に付与するための自動イメージアノテーションソフトウェアを含んでもよい。オペレータデバイス１６は、アノテーションされた出力イメージデータを表示するユーザインターフェーススクリーンを生成するユーザインターフェースコンポーネントに対して、ＡＩビジュアル検査デバイス１２からの出力データを提供する。例えば、検査イメージは、欠陥位置情報（例えば、バウンディングボックス座標、重心座標）、欠陥サイズデータ、および欠陥クラス情報等のコンポーネントによって生成される欠陥データを備えるメタデータと共にアノテーションされてもよい。このようなアノテーションされた出力イメージの例は、以下で記述される図８および９に示される。

【0080】

オペレータデバイス１６のユーザインターフェースコンポーネントは、オペレータからの入力を受け取るための一または複数のユーザインターフェース要素を描写してもよい。例えば、ユーザインターフェースコンポーネントは、オプションの選択を示すユーザ入力データを受け取るための「yes/no」または同様のバイナリオプションを提供してもよい。特定の場合、ユーザインターフェースは、アノテーションされた出力イメージデータにおいてＡＩビジュアル検査デバイス１２によって検出された特定のオブジェクトを提示および強調してもよく、オブジェクトが異常であるか否かを尋ねてもよい（および、ユーザからの対応する入力を受け取ってもよい）。

【0081】

ユーザから受け取られる入力データに応じて、アノテーションされた出力イメージデータ（または、その部分）は、システム１０において異なるルートが設定されてもよい。例えば、オペレータデバイス１６のユーザインターフェースコンポーネントが、特定の入力データ（例えば、「no」のラベルが付されたユーザインターフェース要素のクリック等による、与えられたアーティファクトが異常であるか否かの質問に対する「no」との回答）を受け取った場合、オペレータデバイス１６またはＡＩビジュアル検査デバイス１２は、当該新しいデータをその機械学習モデルに組み込むように構成されてもよい。このように組み込まれたデータは、ＡＩビジュアル検査デバイス１２の一または複数の人工知能コンポーネントを更にトレーニングするために使用されうる更なるトレーニングデータセットのためのトレーニングサンプルとして記録されうる。例えば、ユーザインターフェースを介して提供される入力データは、オペレータデバイス１６またはＡＩビジュアル検査デバイス１２によって使用されてもよく、当該オペレータデバイス１６または当該ＡＩビジュアル検査デバイス１２に、システム１０によって生成される特定のイメージが、ＡＩビジュアル検査デバイス１２によって実装されるマルチモデルアーキテクチャの部分またはシステム１０内の他の場所でもよい、特定のオブジェクト検出モデルにとってのトレーニングサンプルである旨をタグ付けさせるまたは示させる（例えば、メタデータを関連付けることによって）。マルチモデルアーキテクチャにおける各モデルは、適用可能なモデルの再トレーニングにおける将来の使用のために、トレーニングイメージが適切にタグ付けされうるように、この目的のために使用されうるモデル識別子（例えば、モデル番号、名称）を有してもよい。

【0082】

ＰＬＣデバイス１８は、検査オブジェクトの操作および物理的な処理を制御するように構成される。これは、ネットワーク２０を介して、物品操作ユニット（不図示）との間で制御命令を送受信することによって行われてもよい。このような操作および物理的な処理は、撮像や検査エリアにおけるオブジェクトの設置および除去のために、検査オブジェクトを回転させるまたは他の態様で駆動することを含んでもよい。ネットワーク２０を介してＰＬＣデバイス１８によって送られる命令の一例は、「オブジェクトを「n」度だけ回転させる」ことでもよい。いくつかの場合では、このような命令の送信が、ＡＩビジュアル検査デバイス１２から受け取られる情報に依存してもよい。他の場合では、制御命令が、カメラ１４、コンベアベルト、ロボットアーム、モバイルロボット等のシステム１０の他のコンポーネントの、ＰＬＣ１８と通信している駆動コンポーネントを介した駆動又は移動を指示してもよい。

【0083】

ＰＬＣデバイス１８は、オブジェクト検出許容範囲データを保存してもよい。一例として、オブジェクト検出許容範囲データは、欠陥許容範囲データ（例えば、システム１０が欠陥を検出する範囲）でもよい。欠陥許容範囲データは、特定の欠陥クラスに固有の欠陥クラス識別子および欠陥クラス識別子にリンクされる一または複数の許容範囲値を含んでもよい。他の実施形態では、欠陥許容範囲データが、ＡＩビジュアル検査デバイス１２等の他のデバイス上に保存されてもよい。欠陥許容範囲データは、欠陥許容範囲データベースに保存されてもよい。欠陥許容範囲データベースにおける欠陥許容範囲データは、ＡＩビジュアル検査デバイス１２によって生成されるデータとの比較のための許容範囲データ値の取り出しを容易にするために、欠陥クラス識別子を使用して参照されてもよい。更に、ＰＬＣデバイス１８は、検査オブジェクトの操作を制御するように構成されてもよい。検査オブジェクトにおける欠陥がＡＩビジュアル検査デバイス１２によって検出される場合、ＰＬＣデバイス１８は、その部品が欠陥ありか否かを判定する（例えば、欠陥許容範囲データで見つかった欠陥と比較することによって）ために、検出された欠陥（欠陥の属性に関連するデータまたは欠陥の属性を記述するデータ）を、ＰＬＣデバイス１８または他の場所に保存されている欠陥許容範囲データと比較してもよい。

【0084】

例えば、一実施形態では、ＰＬＣデバイス１８が、欠陥検出プロセスの結果を示すデータを、ネットワーク２０を介してＡＩビジュアル検査デバイス１２から受け取るように構成される。例えば、ＡＩビジュアル検査デバイス１２によって欠陥が検出された場合、欠陥データはＰＬＣデバイス１８に対して送られてもよい。欠陥データは、検出された欠陥の属性を記述し、サイズデータ、位置データ、クラスラベルデータ、信頼レベルデータ等を含んでもよい。ＰＬＣデバイス１８は、欠陥許容範囲データを保存する。ＰＬＣデバイス１８は、許容範囲データに照らして欠陥データを分析し、検査オブジェクトが欠陥あり（例えば、「NG」）か、許容範囲内（例えば、「OK」）かを判定する。ＰＬＣデバイス１８は、許容範囲分析の結果を示す信号を、ＡＩビジュアル検査デバイス１２に対して送ってもよい。ＰＬＣデバイス１８によって欠陥データが許容範囲外であると判定される場合、ＰＬＣデバイス１８は、検査オブジェクトの検査を停止してもよく、欠陥ありオブジェクトの除去および新しいオブジェクトの設置のための処理を開始してもよい。ＰＬＣデバイス１８は、検査オブジェクトの検査を停止するための制御信号を生成してもよく、検査オブジェクトの操作を担うアクチュエータまたは他の駆動コンポーネントに対して制御信号を送信してもよい。

【0085】

システム１０が検査イメージにおいて欠陥を検出しなかった場合、ＡＩビジュアル検査デバイス１２は、イメージにおいて欠陥が見つからなかった（すなわち「OK」）ことを示すオブジェクト検出プロセスの結果を示す信号を、（例えば、ネットワーク２０を介して）ＰＬＣデバイス１８に対して送る。「OK」メッセージを受け取ると、ＰＬＣデバイス１８は、検査オブジェクトの（または、検査オブジェクトにおける）アクチュエータまたはマニピュレータに対して制御信号を送り、検査オブジェクトの現在の検査位置を調整する（例えば、検査オブジェクトを「X」度だけ回転させる）。他の場合では、受け取られた制御信号に応じて一または複数のコンポーネントを駆動するように構成される他の駆動コンポーネント（例えば、カメラアクチュエータ）に対して、制御命令が送られてもよい。

【0086】

他の実施形態では、欠陥許容範囲データがＡＩビジュアル検査デバイス１２で保存されてもよく、許容範囲分析がＡＩビジュアル検査デバイス１２によって実行される。そして、ＡＩビジュアル検査デバイス１２は、オブジェクトが欠陥ありか否かを示す信号を、ＰＬＣデバイス１８に対して送ってもよい。そして、ＰＬＣデバイス１８は、ＡＩビジュアル検査デバイス１２から受け取られた信号に応じて、制御信号を生成してもよい。

【0087】

図２を参照して、一実施形態に係る、図１のシステム１０のコンピューティングデバイス１０００のブロック図が示されている。コンピューティングデバイス１００は、例えば、図１のデバイス１２、１４、１６、１８のいずれであってもよい。

【0088】

コンピューティングデバイス１０００は、コンピューティングデバイス１０００のオペレーションを制御するプロセッサ１０２０等の複数のコンポーネントを含む。データ通信、音声通信、または両方を含む通信機能は、通信サブシステム１０４０を通じて実現されてもよい。コンピューティングデバイス１０００によって受け取られるデータは、デコーダ１０６０によって解凍および復号化されてもよい。通信サブシステム１０４０は、無線ネットワーク１５００からメッセージを受け取ってもよいし、無線ネットワーク１５００に対してメッセージを送ってもよい。

【0089】

無線ネットワーク１５００は、データ中心の無線ネットワーク、音声中心の無線ネットワーク、および音声およびデータの通信の両方をサポートするデュアルモードネットワークを含むが、これらに限られない任意のタイプの無線ネットワークでもよい。

【0090】

コンピューティングデバイス１０００は、バッテリ駆動のデバイスでもよく、図示されるように、一または複数の充電可能バッテリ１４４０を受けるためのバッテリインターフェース１４２０を含んでもよい。

【0091】

プロセッサ１０２０は、ランダムアクセスメモリ（RAM）１０８０、フラッシュメモリ１１１０、ディスプレイ１１２０（例えば、共に接触感知ディスプレイ１１８０を構成する電子コントローラ１１６０に接続される接触感知オーバーレイ１１４０を有するもの）、アクチュエータアセンブリ１２００、一または複数のオプションの力センサ１２２０、予備入力／出力（I/O）サブシステム１２４０、データポート１２６０、スピーカ１２８０、マイクロフォン１３００、近距離通信システム１３２０および他のデバイスサブシステム１３４０等の追加的なサブシステムとも相互作用する。

【0092】

いくつかの実施形態では、グラフィカルユーザインターフェースとのユーザ相互作用が、接触感知オーバーレイ１１４０を通じて実行されてもよい。プロセッサ１０２０は、電子コントローラ１１６０を介して、接触感知オーバーレイ１１４０と相互作用してもよい。プロセッサ１０２０によって生成されてコンピューティングデバイス上で表示または描写されてもよいテキスト、文字、シンボル、イメージ、アイコン、および他のアイテム等の情報は、接触感知ディスプレイ１１８０上に表示されてもよい。

【0093】

プロセッサ１０２０は、加速度計１３６０と相互作用してもよい。加速度計１３６０は、重力または重力に由来する反力の方向を検出するために利用されてもよい。

【0094】

本実施形態に従ってネットワークアクセスの加入者を識別するために、コンピューティングデバイス１０００は、ネットワーク（例えば、無線ネットワーク１５００）との通信のために、SIM/RUIMインターフェース１４００内に挿入される、加入者特定モジュールまたは除去可能ユーザ特定モジュール（SIM/RUIM）カード１３８０を使用してもよい。あるいは、ユーザ特定情報は、フラッシュメモリ１１１０にプログラミングされてもよいし、他の技術を使用して実行されてもよい。

【0095】

コンピューティングデバイス１０００は、オペレーティングシステム１４６０と、フラッシュメモリ１１１０等の持続性データストレージデバイスに保存されてもよい、プロセッサ１０２０によって実行されるソフトウェアコンポーネント１４８０も含む。追加的なアプリケーションは、無線ネットワーク１５００、予備I/Oサブシステム１２４０、データポート１２６０、近距離通信サブシステム１３２０、または任意の他の適切なデバイスサブシステム１３４０を通じて、コンピューティングデバイス１０００上にロードされてもよい。

【0096】

使用時に、テキストメッセージ、ｅメールメッセージ、ウェブページダウンロード、または他のデータ等の受け取られた信号は、通信サブシステム１０４０によって処理されてプロセッサ１０２０に対して入力されてもよい。そして、ディスプレイ１１２０あるいは予備I/Oサブシステム１２４０への出力のために、プロセッサ１０２０は受け取られた信号を処理する。加入者は、例えば、通信サブシステム１０４０を通じて無線ネットワーク１５００上で送信されてもよいｅメールメッセージ等のデータアイテムを作成してもよい。

【0097】

音声通信については、コンピューティングデバイス１０００の全体オペレーションが同様でもよい。スピーカ１２８０は、電気信号から変換されたオーディオ情報を出力してもよく、マイクロフォン１３００は、オーディオ情報を処理のために電気信号に変換してもよい。

【0098】

図３を参照して、一実施形態に係る、自動化されたビジュアル検査のためのコンピューティングシステム３００のブロック図が示されている。コンピュータシステム３００は、図１の自動化されたビジュアル検査システム１０の一または複数のデバイスで実装されてもよい。例えば、コンピュータシステム３００のコンポーネントは、図１のＡＩビジュアル検査デバイス１２、オペレータデバイス１６、およびＰＬＣデバイス１８の少なくともいずれかによって実装されてもよい。

【0099】

システム３００は、ソフトウェアモデルおよびモジュールを実行するためのプロセッサ３０２を含む。

【0100】

システム３００は、プロセッサ３０２からの出力データを含むデータを保存するためのメモリ３０４を更に含む。

【0101】

システム３００は、例えば、ネットワーク接続（例えば、図１のネットワーク２０）を介してデータを送受信することを通じて、他のデバイスと通信するための通信インターフェース３０６を更に含む。

【0102】

システム３００は、コンピュータシステム３００によって生成される様々なデータを人が読取可能なフォーマットで表示するためのディスプレイ３０８を更に含む。例えば、ディスプレイは、検査オブジェクトの検査の結果を表示するように構成されてもよい。

【0103】

プロセッサ３０２は、マルチモデルビジュアル検査モジュール３１０を含む。マルチモデルビジュアル検査モジュール３１０は、オブジェクト検出タスクを実行するように構成される複数の機械学習モデルを含む。複数の機械学習モデルは、第１オブジェクト検出モデル３１２ａ、第２オブジェクト検出モデル３１２ｂ、および第３オブジェクト検出モデル３１２ｃを含む。前述されたように、他の実施形態（例えば、ビジュアル検査と異なるタスクに向けられた実施形態）では、モデル３１２がオブジェクト検出と異なるタスクを実行するように構成される機械学習モデルでもよい。

【0104】

マルチモデルビジュアル検査モジュール３１０は、第１モデル３１２ａ、第２モデル３１２ｂ、第３モデル３１２ｃ等を通じて入力モジュール３０６から受け取られた検査オブジェクトのイメージを処理する。マルチモデルビジュアル検査モジュール３１０が、検査オブジェクトのイメージのビジュアル検査のための更なるモデルを含んでもよいと、当業者にとって理解される。マルチモデルビジュアル検査モジュール３１０内に含まれるモデルの一部または全部は、任意の与えられた時間でイメージを検査可能でもよい。マルチモデルビジュアル検査モジュール３１０内に含まれるモデルのそれぞれは、当該モデルに固有の特定のオブジェクト検出タスクを実行するためにトレーニングされる。

【0105】

メモリ３０４は、検査イメージデータ３２０を保存する。コンピュータシステム３００は、通信インターフェース３０６を介して検査イメージデータ３２０を受け取る。検査イメージデータ３２０は、カメラデバイス（例えば、図１のカメラ１４）または遠隔コンピューティングデバイスまたはストレージデバイス等の他のデバイスによって、コンピュータシステム３００に対して提供されてもよい。

【0106】

この入力は、例えば、図１のカメラ１４から、入力モジュール３０６で受け取られてもよい。

【0107】

メモリ３０４およびプロセッサ３０２の間の通信を通じて、検査イメージデータ３２０が第１モデル３１２ａに対して提供される。一例として、第１モデル３１２ａは、検査イメージデータ３２０に示されるオブジェクトのクラスまたは特定のオブジェクト（もしあれば）を判定するように構成されてもよい。他の例として、第１モデル３１２ａが欠陥の存在を検出するように構成されてもよい。

【0108】

第１モデル３１２ａによる検査イメージデータ３２０の分析の結果は、第１モデル出力データ３２２ａとしてメモリ３０４に保存される。第１モデル出力データ３２２ａは、オブジェクトまたは欠陥が認識された領域を囲む幾何学形状や、オブジェクトまたは欠陥を識別する更なるラベル等のアノテーションを有する検査イメージデータ３２０を備えてもよい。他の場合では、第１モデル出力データ３２２ａが、欠陥データ（つまり、モデルによって識別される任意のオブジェクトを記述するデータ）のみを含んでもよい。

【0109】

モデル出力３２２は、イメージまたはイメージデータでもよい。モデル出力３２２は、部品またはそこの欠陥に関する位置情報（例えば、座標、重心／中心位置）と共にアノテーションされてもよい。更に、モデル出力３２２は、欠陥およびクラス割当（例えば、欠陥は「スクラッチ」と分類されてもよい）に関するラベルと共にアノテーションされてもよい。モデル出力３２２は、部品およびアセンブリの評価（例えば、部品上のシールが適切に配置されていると識別されてもよい）に関するラベルと共にアノテーションされてもよい。

【0110】

プロセッサ３０２は、モデルトリガ判定モジュール３１６を含む。モデルトリガ判定モジュール３１６は、マルチモデルビジュアル検査モジュール３１０内に配置されてもよい。第１モデル出力データ３２２ａは、プロセッサ３０２でモデルトリガ判定モジュール３１６に対して提供される。モデルトリガ判定モジュール３１６は、プロセッサ３０２の他のどのモデル（もしあれば）に検査イメージデータ３２０が提供されるべきかを判定するための入力として第１モデル出力データ３２２ａを使用する。モデルトリガ判定モジュール３１６は、この判定および他の判定を行うために、人工知能および／または機械学習を使用してもよい。

【0111】

例えば、第１モデル３１２ａによって、検査イメージデータ３２０が特定の機械部品を示すと判定された（例えば、部品に対応するクラスラベルおよび部品についての位置情報を判定するためのオブジェクト検出を実行することによって）場合、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０（または、そのサブセット）が第２モデル３１２ｂに対して提供されるべきであると判定してもよい。対照的に、第１モデル３１２ａによって、判定が決定的でないために、または、検査イメージデータが不明瞭であるために、検査イメージデータ３２０が特定の機械部品を示さないと判定された場合、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０が代わりに第３モデル３１２ｃに更なる処理のために送られるべきと判定してもよい。あるいは、検査イメージデータ３２０が第２の特定の機械部品を示す場合、検査イメージデータ３２０は更なる処理のために第３モデル３１２ｃに対して提供される。

【0112】

更なる例として、第１モデル３１２ａは、特定の部品、エリア、またはオブジェクトまたは物品上の領域を検出するように構成されてもよい。検出される部品、エリア、または領域は、特定のタイプの欠陥が発達しやすいものでもよい。従って、このような部品、エリア、またはオブジェクトまたは物品上の領域がいつ存在するかを判定する（すなわち、イメージデータにおける部品、エリア、または領域の存在を検出するように構成されるオブジェクト検出モデルによって検出される）ことや、当該特定の部品、エリア、または領域をターゲットとする欠陥検出を実行することは有利である。部品、エリア、または領域が第１モデル３１２ａによって検出された場合、検査イメージデータ３２０は、当該部品、エリア、または領域における欠陥を検出するように構成されてもよい第２モデル３１２ｂに対して提供されてもよい。第２モデル３１２ｂが検出するように構成される欠陥は、第１モデル３１２ａによって先に検出された部品、エリア、または領域に特有の欠陥でもよい（すなわち、検出された部品、領域、またはエリアにおける当該特有の欠陥についてのみ欠陥検出を実行するのが合理的でありうる）。第１モデル３１２ａの出力に基づく第２モデル３１２ｂを使用するか否かの判定は、メモリ３０４に保存されているモデルトリガ条件３２６に従って実行される。

【0113】

更なる例として、第１モデル３１２ａは、欠陥の存在を検出するように構成されてもよい。第１モデル３１２ａが検査オブジェクトにおける欠陥を検出した場合、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０が、欠陥を更に局所化するために第２モデル３１２ｂに送られるべきと判定してもよい、および／または、欠陥を更に分類するために第３モデル３１２ｃに送られるべきと判定してもよい。

【0114】

更なる例として、第１モデル３１２ａが、検査イメージデータ３２０における特定の部品の存在を検出するように構成されてもよい。当該部品が存在する場合、モデルトリガ判定モジュール３１６は、部品のアセンブリが正しいか否かを判定するために、検査イメージデータ３２０が第２モデル３１２ｂに送られるべきと判定してもよい。例えば、部品がシールリングアセンブリである場合、第２モデル３１２ｂは、シールの配置を検証してもよい。そして、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０における欠陥の存在を検出するために、検査イメージデータ３２０が第３モデル３１２ｃに更に送られるべきと判定してもよい。ここで記述されるアセンブリ検出および欠陥検出は、異なるモデル３１２で同時にまたは順番に実行されてもよい。

【0115】

第２モデル３１２ｂに対して検査イメージデータ３２０を提供することに関して、上記のステップが繰り返されてもよい。第２モデル出力データ３２２ｂはメモリ３０４に保存され、プロセッサ３０２におけるモデルトリガ判定モジュール３１６に対しても提供される。第２モデル出力データ３２２ｂに関するモデルトリガ判定モジュール３１６の判定に応じて、検査イメージデータ３２０は第３モデル３１２ｃまたは更なるモデルに対して提供されてもよい。

【0116】

あるいは、モデル３１２による分析の完了後、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０を複数の他のモデル３１２に対して同時にまたは順番に送ってもよい。例えば、第１モデル３１２ａによる分析の完了後、モデルトリガ判定モジュールは、検査イメージデータ３２０を第２モデル３１２ｂおよび第３モデル３１２ｃの両方に送ってもよいし、最初に第２モデル３１２ｂに送って次に第３モデル３１２ｃに送ってもよい。第３モデル３１２ｃへの検査イメージデータ３２０の送付は、モデルトリガ判定モジュール３１６によって判定された検査イメージデータ３２０の更なる送付に加えて行われてもよい。複数のモデル３１２への検査イメージデータ３２０の送付は、深さ優先アプローチ、幅優先アプローチ、または任意の他のアプローチに従って行われてもよい。

【0117】

モデルトリガ判定モジュール３１６によってなされた判定は、メモリ３０４に保存されているプリセットモデルトリガ条件３２６によって報知される。このようなモデルトリガ条件３２６は、ユーザ入力に基づいて設定または修正されてもよい。例えば、モデルトリガ条件３２６は、検査イメージデータ３２０が、第１モデル３１２ａによって判定された特定の機械部品を示す場合、検査イメージデータ３２０は、第２モデル３１２ｂおよび／または第３モデル３１２ｃに対して提供されるべきである、という条件を含んでもよい。モデルトリガ条件３２６は、第２モデルトリガ条件および第３モデルトリガ条件を含んでもよい。モデルトリガ条件３２６は、どのモデルまたはモデル３１２を検査イメージデータ３２０の後続の分析のためにトリガすべきかを判定するために、モデルトリガ判定モジュール３１６によって使用されるモデル３１２からの出力に対応する。モデルトリガ判定モジュール３１６は、順番にトリガされるモデル３１２のリストを生成してもよい。このように、与えられたモデル出力データ３２２は、後続の与えられたモデル３１２の使用をトリガしてもよい。

【0118】

このように、モデルトリガ条件３２６に従って検査イメージデータ３２０を分析する機会を得るべきモデル３１２のそれぞれが、そのような機会を実際に得る。このアプローチは、有利なことに、更なるタスクに対応することによる当該機能からの「ドリフト」を伴わずに、モデル３１２のそれぞれが専用の分析を実行できることを担保する。更に、マルチモデルアプローチは、有利なことに、状況がそれらの使用を許可する（すなわち、システム３００が、他のモデル３１２の出力に基づいて、特定のモデルまたはモデル３１２が使用されるべきと判定する）場合に限って、使用のためにモデル３１２がトリガされるため、演算時間およびリソースに関する効率の向上をもたらしうる。

【0119】

モデル３１２による分析が完了すると、モデル出力データ３２２（例えば、第１モデル出力データ３２２ａ、第２モデル出力データ３２２ｂ、第３モデル出力データ３２２ｃ）、またはそのサブセットまたはその部品が、出力イメージアノテータモジュール３１４によって組み合わされる。

【0120】

出力イメージアノテータモジュール３１４によって生成されるモデル出力データ３２２の組合せは、アノテーションされた出力イメージデータ３２４としてメモリ３０４に保存される。アノテーションされた出力イメージデータ３２４は、欠陥または部品等の検出されたオブジェクトの座標（例えば、バウンディングボックスを定義するもの）、および／または、検出されたオブジェクトクラスラベル（例えば、欠陥タイプ／クラス、部品タイプ／クラス、部品アセンブリステータス）等のアノテーションを有する検査イメージデータ３２０を備えてもよい。

【0121】

いくつかの場合では、出力イメージアノテータモジュール３１４が、メモリ３０４に保存されるアノテーションされた出力イメージデータ３２４を生成するために、モデル出力データ３２２を使用してもよい。

【0122】

アノテーションされた出力イメージデータ３２４は、ディスプレイ３０８でユーザに対して表示されるモデル出力モジュール３１８によって提供される。

【0123】

図４および５を参照して、一実施形態に係る、自動化されたビジュアル検査のためのマルチモデルビジュアル検査モジュール３１０と、マルチモデルビジュアル検査モジュール３１０を使用するビジュアル検査を実行するための方法５００と、が示されている。

【0124】

マルチモデルビジュアル検査モジュール３１０では、第１モデル３１２ａが検査イメージデータ３２０を受け取り、第１モデル出力データ３２２ａを生成する。第１モデル出力データ３２２ａは、モデルトリガ条件３２６に照らした分析のために、モデルトリガ判定モジュール３１６に対して提供される。第１モデル出力データ３２２ａに応じて、モデルトリガ判定モジュール３１６は、続いて検査イメージデータ３２０が第２モデル３１２ｂに対して提供されるべきと判定してもよい。第２モデル出力データ３２２ｂに応じて、モデルトリガ判定モジュール３１６は、続いて検査イメージデータ３２０が第３モデル３１２ｃに対して提供されるべきと判定してもよい。あるいは、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０が、第１モデル３１２ａの直後に第３モデル３１２ｃに対して提供されるべきと判定してもよい。このような判定は、メモリ３０４に保存されている第２モデルトリガ条件および第３モデルトリガ条件を含むモデルトリガ条件３２６に従ってなされる。第２モデル３１２ｂおよび第３モデル３１２ｃは、第１モデル出力データ３２２ａの分析に基づいて、第２モデルトリガ条件および第３モデルトリガ条件が満たされるとそれぞれトリガされる。モデルをトリガすることは、例えば、検査イメージデータまたはそのサブセットを、トリガされたモデルの入力レイヤに対して出力を生成するために提供することを含んでもよい。

【0125】

モデルトリガ判定モジュール３１６が第３モデル３１２ｃに進むと判定すると、第４モデル３１２ｄまたは第５モデル３１２ｅ（または、両方）に進むことに関する同様の判定が、第３モデル出力データ３２２ｃに基づいてモデルトリガ判定モジュール３１６によってなされてもよい。

【0126】

モデルトリガ判定モジュール３１６は、例えば、条件が満たされるか否かを判定するために各条件を巡回することによって、受け取られたモデル出力データ３２２に照らして全てのモデルトリガ条件を評価するように構成されてもよい。他の場合では、モデルトリガ判定モジュール３１６が、受け取られたモデル出力データ３２２を分析するように構成されてもよく、この分析から、モデルトリガ条件３２６のどのサブセットが、特定のモデル出力データ３２２によって評価されるべきかを判定してもよい（例えば、受け取られた出力が特定のモデルの出力であると、出力から判定することによって）。この技術は、与えられたモデル出力データ３２２について、モデル３１２の特定のサブセットのみがトリガされてもよい（または、されない）場合に適用されてもよく、これらの潜在的にトリガされるモデルについてのモデルトリガ条件のみが評価されるべきである。例えば、第２モデル３１２ｂが、第１モデル３１２ａの出力データ３２２ａによってトリガされうる（または、トリガされえない）唯一のモデルである場合、モデルトリガ判定モジュール３１６は、受け取られた出力が第１モデル３１２ａからの出力データ３２２ａであると判定すると、第２モデルトリガ条件のみを使用して出力データ３２２ａを評価するように構成されてもよい（および、わざわざ不必要かつ非効率的な第３モデルトリガ条件を使用して評価しない）。

【0127】

モデルトリガ判定モジュール３１６は、モデルトリガ判定モジュール３１６によって実行される分析に基づいて、どのモデル３１２がトリガされるべきかを示すリストまたは他のデータ構造を維持するように構成されてもよい。トリガされるモデル３１２のリスト（システム３００がＮ個のモデルを有する場合、０個とＮ個の間のモデルを含んでもよい）は、それぞれの分析を実行するためのモデル３１２を順番にトリガするために使用されてもよい。

【0128】

一実施形態では、マルチモデルビジュアル検査モジュール３１０が、一または複数のモデル３１２のそれぞれと通信している単一のモデルトリガ判定モジュール３１６を含んでもよい。各モデル３１２の出力データは、単一のモデルトリガ判定モジュール３１６によって分析されるために提供される。

【0129】

他の実施形態では、モデルトリガ判定モジュール３１６が、複数のモデルトリガ判定モジュールを含んでもよい。ここで、モデルトリガ判定モジュールは、検査イメージデータ３２０が更に送られる場所で局所的に制御するために、モデルのペア（不図示）内（例えば、第１モデル３１２ａおよび第２モデル３１２ｂの間や、第１モデル３１２ａおよび第３モデル３１２ｃの間）に挿入されてもよい。このようなモデルトリガ判定モジュールは、先のモデル３１２（例えば、３１２ａ）および後続のモデル３１２（例えば、３１２ｂまたは３１２ｃ）の間に挿入される代わりに、後続の各モデル３１２（例えば、３１２ｂおよび３１２ｃ）と関連付けられてもよい。

【0130】

他の実施形態では、各モデル３１２が、検査イメージデータ３２０の更なる送付に関する同じ判定を行うモデルトリガ判定モジュール内部に含んでもよい（不図示）。このような一実施形態では、モデルトリガ判定モジュールが、当該モデル自身の出力データの分析に基づいて、モデルトリガ条件３２６の充足を判定するように構成される。

【0131】

他の実施形態では、各モデルトリガ判定モジュールが、上記の実施形態のいずれかに従って設けられてもよい。すなわち、このようないずれのステータスも全てのモデルトリガ判定モジュールを記述しないように、いくつかはモデルのペア内に挿入されてもよいし、いくつかは後続のモデルに関連付けられてもよいし、およびいくつかはモデルの内部に含まれてもよい。

【0132】

モデルトリガ判定モジュール３１６の上記の構成のそれぞれにおいても、マルチモデルビジュアル検査モジュール３１０において、前述されたようなモデル３１２のそれぞれの内部または間に仮想的に表される、単一のモデルトリガ判定モジュール３１６のみが存在してもよい。

【0133】

モデル３１２による分析の完了後、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０を、複数の他のモデル３１２に対して同時にまたは順番に送ってもよい。例えば、第１モデル３１２ａによる分析が完了して第１モデル出力データ３２２ａが生成された後、モデルトリガ判定モジュールは、検査イメージデータ３２０を、第２モデル３１２ｂおよび第３モデル３１２ｃの両方に送ってもよいし、最初に第２モデル３１２ｂに送って次に第３モデル３１２ｃに送ってもよい。第３モデル３１２ｃへの検査イメージデータ３２０の送付は、モデルトリガ判定モジュール３１６によって判定された検査イメージデータ３２０の更なる送付に加えて行われてもよい。複数のモデル３１２への検査イメージデータ３２０の送付は、深さ優先アプローチ、幅優先アプローチ、または任意の他のアプローチに従って行われてもよい。

【0134】

いくつかの場合では、モデルトリガ判定モジュール３１６が、異なるモデル出力データ３２２に基づく複数の判定に亘って起こりうるモデル３１２のオペレーションのシーケンスを調整するように構成される。例えば、モデルトリガ判定モジュール３１６は、検査イメージデータ３２０（または、そのサブセット）の各モデル３１２への提供を開始すること等によって、トリガされるモデル３１２を示すリストまたは他のデータ構造を維持してもよい。このようなトリガされるモデル（または、より正確には、トリガされるべきモデル）３１２のリストは、モデル３１２による分析が続けられながら動的に更新されてもよい。例えば、第１モデル出力データ３２２ａの分析に基づいて、モデルトリガ判定モジュール３１６は、モデル３１２の第１リストが出力に基づいてトリガされるべきと判定してもよい。この第１リストは、複数のモデル３１２を含んでもよい。モデルトリガ判定モジュール３１６は、検査イメージデータ３２０（または、そのサブセット）の、モデル３１２の第１リストにおける第１リストモデルへの提供を開始する。第１リストモデル３１２は、入力された検査イメージデータを分析し、モデルトリガ判定モジュール３１６に対して提供される、それ自身の出力データ３２２を生成する。そして、モデルトリガ判定モジュール３１６は、モデル３１２の第１リストにおける第１リストモデル３１２の出力３２２に基づいて、トリガされるべきモデル３１２の第２リストを生成してもよい。そして、モデルトリガ判定モジュール３１６は、トリガされるべきモデル３１２のリストを、モデル３１２の第２リストも含むように（先に判定されたモデル３１２の第１リストに加えて）動的に更新してもよい。このように、モデル３１２がトリガされて分析されるべき新しいモデル出力データ３２２を生成するのに合わせて、モデルトリガ判定モジュール３１６は新しいモデルトリガ判定を管理できる。

【0135】

図４を特に参照して、図３のマルチモデルビジュアル検査モジュールのブロック図が示されている。一実施形態では、マルチモデルビジュアル検査モジュール３１０は、第１モデル３１２ａが第１モデル出力データ３２２ａを出力した後に、第２モデル３１２ｂおよび／または第３モデル３１２ｃに対して検査イメージデータ３２０を送らせてもよい。同様に、マルチモデルビジュアル検査モジュール３１０は、第３モデル３１２ｃが第３モデル出力データ３２２ｃを出力した後に、第４モデル３１２ｄおよび／または第５モデル３１２ｅに対して検査イメージデータ３２０を送らせてもよい。マルチモデルビジュアル検査モジュール３１０による判定は、メモリ３０４に保存されているモデルトリガ条件３２６が満たされるか否かに応じて行われる。

【0136】

図５を特に参照して、一実施形態に係る、自動化されたビジュアル検査を実行する方法５００が示されている。方法５００は、図３のコンピュータシステム３００によって実施されてもよい。方法５００は、オブジェクト検出のためのオブジェクトの自動化されたビジュアル検査に向けられてもよいし、他の文脈における更なる使用に向けられてもよい。

【0137】

５０２では、図３のシステム３００が、図１のカメラ１４等から検査イメージデータ３２０を受け取る。

【0138】

５０４では、マルチモデルビジュアル検査モジュール３１０が、第１モデル３１２ａ等のモデル３１２に対して、検査イメージデータ３２０を送る。

【0139】

５０６では、マルチモデルビジュアル検査モジュール３１０が、オブジェクト検出モデル３１２によって生成されたモデル出力データ３２２（例えば、第１モデル３１２ａによって生成された第１モデル出力データ３２２ａ）を保存する。モデル出力データ３２２は、メモリ３０４に保存される。

【0140】

５０８では、モデルトリガ判定モジュール３１６が、第２モデル３１２ｂ等の後続のモデル３１２に対して検査イメージデータ３２０を送るか否か（すなわち、一または複数の他のモデル３１２がトリガされるべきか否か）を判定する。この判定は、５０６からのモデル出力データ３２２（例えば、第１モデル出力データ３２２ａ）に基づいて、モデルトリガ条件３２６に従って行われる。

【0141】

モデルトリガ判定モジュール３１６が５０８で「yes」と判定した場合、第２モデル３１２ｂ等の後続のモデル３１２についてステップ５０４～５０６が繰り返される。

【0142】

モデルトリガ判定モジュール３１６が５０８で「no」と判定した場合、方法５００は代わりに５１０に進む。

【0143】

５１０では、全てのモデル出力データ３２２（例えば、第１モデル出力データ３２２ａおよび第２モデル出力データ３２２ｂ）が、出力イメージアノテータモジュール３１４によって、メモリ３０４に保存される単一のアノテーションされた出力イメージデータ３２４として統合される。

【0144】

５１２では、モデル出力モジュール３１８が、アノテーションされた出力イメージデータ３２４を、ユーザに対して表示されるためにディスプレイ３０８に送る。これは、グラフィカルユーザインターフェースにおいてアノテーションされた出力イメージを描写することを含んでもよい。いくつかの場合では、ユーザインターフェースが、図１のオペレータデバイス１６等のユーザデバイスで実装されてもよく、アノテーションされた出力イメージが、ネットワーク接続（例えば、図１のネットワーク２０）等を通じてユーザデバイスに対して送られてもよい。

【0145】

図６および７を参照して、自動化されたビジュアル検査のためのマルチモデルビジュアル検査モジュール３１０の一実施形態６００と、図６のマルチモデルビジュアル検査モジュール６００を使用するビジュアル検査を実行する方法７００と、が示されている。

【0146】

モジュール６００は、第１オブジェクト検出モデル６０２、第２オブジェクト検出モデル６０４、および第３オブジェクト検出モデル６０６を備える。モデル６０２、６０４、６０６は、特定の順番またはシーケンスを有するものとして記述されるが、モデルが提示される（および、トリガされる）順番は、他の実施形態では変えられてもよいと理解される。

【0147】

モジュール６００は、第１検出モデル６０２を含む。第１検出モデル６０２は、入力イメージにおいて複数の欠陥のクラスを検出するように構成される欠陥検出モデルである。欠陥クラスは、スクラッチ、多孔性、および凹みを含む。他の実施形態では、第１検出モデル６０２が、より少ないまたは追加的な欠陥クラスを含んでもよい。

【0148】

７０２では、第１検出モデル６０２が、前述されたように、検査イメージデータ３２０における欠陥の検出を実行する。第１モデル出力データ３２２ａ等の第１検出モデル６０２の出力は、メモリ３０４に保存される。第１検出モデル６０２の出力は、欠陥が認識された領域を囲む幾何学形状や、欠陥タイプ／クラスを識別するラベル等のアノテーションを有する検査イメージデータ３２０を備えてもよい。他の場合では、第１検出モデル６０２の出力が、欠陥データ（つまり、モデルによって識別される任意の欠陥を記述するデータ）のみを含んでもよい。

【0149】

モジュール６００は、第２検出モデル６０４を含む。第２検出モデル６０４は、入力イメージにおける部品セクションの複数のクラスを検出するように構成される部品セクション（または、「セクション」）モデルである。部品セクションクラスは、VTCクラス、ジャーナルクラス、ローブクラス、およびセンサリングクラスを含む。第２検出モデル６０４は、部品セクションを囲むバウンディングボックスおよび部品セクションクラスラベルを生成すること等によって、入力イメージにおける部品セクションを検出および局所化する。検出対象の部品セクションは、「興味領域」（および、単数形での「興味領域」または「ROI」）と解釈されてもよい。第２検出モデル６０４は、入力イメージ（イメージのシーケンスの場合は、現在のイメージである）において存在する部品セクションを識別する。

【0150】

７０４では、第２検出モデル６０４が、前述されたように、検査イメージデータ３２０における個々の部品および部品セクションの検出を実行する。第２モデル出力データ３２２ｂ等の第２検出モデル６０４の出力は、メモリ３０４に保存される。第２検出モデル６０４の出力は、部品または部品セクションが認識された領域を囲む幾何学形状や、部品または部品セクション（オブジェクトクラス）を識別するラベル等のアノテーションを有する検査イメージデータ３２０を備えてもよい。他の場合では、第２検出モデル６０４の出力が、部品および／または部品セクションデータ（つまり、モデルによって識別される任意の部品および／または部品セクションを記述するデータ）のみを含んでもよい。

【0151】

モジュール６００は、第３検出モデル６０６を含む。第３検出モデル６０６は、入力イメージにおけるアセンブリ特徴の複数のクラスを検出するように構成されるアセンブリ検出モデルである。アセンブリクラスは、シールリングクラスおよびオイルホールクラスを含む。このように、第３検出モデル６０６は、アセンブリ特徴を囲むバウンディングボックス、アセンブリ特徴クラスラベル、および他の検出されたオブジェクトデータを生成すること等によって、入力イメージにおけるアセンブリ特徴を検出および局所化する。要するに、第３検出モデル６０６は、アセンブリ特徴クラスに対応する与えられたアセンブリ特徴が、イメージにおいて存在するか否かを判定する。

【0152】

７０６では、第３検出モデル６０６が、前述されたように、検査イメージデータ３２０における適切なアセンブリの検出を実行する。第３モデル出力データ３２２ｃ等の第３検出モデル６０６の出力は、メモリ３０４に保存される。第３検出モデル６０６の出力は、アセンブリが認識された領域を囲む幾何学形状や、アセンブリ（オブジェクトクラス）を識別するラベル等のアノテーションを有する検査イメージデータ３２０を備えてもよい。他の場合では、第３検出モデル６０６の出力が、アセンブリデータ（つまり、モデルによって識別される任意のアセンブリを記述するデータ）のみを含んでもよい。

【0153】

以下では、モジュール６００および方法７００の使用の一例が記述される。概して、第１モデル６０２は、カムシャフトの検査イメージにおける異なるタイプの欠陥を探す。欠陥が見つかった場合、部品セクションを検出するための第２検出モデル６０４にイメージが渡される。第２検出モデルにイメージを渡す決定は、第１モデル出力データによって第２モデルトリガ条件が満たされたことに基づく。第２検出モデル６０４は、イメージ上のカムシャフトにおけるキーセクションを特定および識別する。モジュール６００は、検出された部品セクション内に欠陥があるか否かをチェックする。これは、検出されたオブジェクト（欠陥、ROIセクション）についてのオブジェクト位置データの比較を含む。更に、イメージ（すなわち、出力データ）において特定のクラスの部品セクションが検出された場合、特定のアセンブリ特徴が当該検出された部品セクション内にあることを判定（確認）するために、第３検出モデル６０６にイメージが渡される。第３検出モデルにイメージを渡す決定は、第２モデル出力データによって第３モデルトリガ条件が満たされたことに基づく。

【0154】

検査イメージデータ３２０がモジュール６００のモデル６０２、６０４、および６０６のそれぞれに送られる前に、モデルトリガ判定モジュール３１６が、検査イメージデータ３２０および検査イメージデータ３２０を既に分析したモデルによって提供された任意の利用可能な出力データ３２２に照らして、特定のモデル６０２、６０４、６０６による分析が適切であるか否かを判定してもよいと理解される。このような判定は、モデルトリガ条件３２６に従ってなされる。更に、いくつかの場合では、モデルによって生成される出力データ３２２が保存され、異なるモデルからの出力データ３２２を使用する分析（例えば、二つの出力データを比較するもの）のために使用されてもよい。例えば、第１モデル６０２によって検出された欠陥のバウンディングボックス座標および欠陥クラスラベル等のオブジェクトデータが保存され、第２モデル６０４によって検出された部品セクションのオブジェクトデータと、モジュール６００によって後に比較されてもよい。バウンディングボックス座標を比較することによって、特定のクラスの欠陥が特定のクラスの部品セクション内に存在すると判定された場合、モジュール６００は、欠陥を許容不能と判断し、対応する下流プロセスを開始してもよい。欠陥が許容可能なクラスである場合、または、欠陥が部品セクション外にある場合、モジュール６００は、欠陥を許容可能とタグ付けしてもよい、および／または、欠陥を無視してもよい。このようなアプローチは、異なる部品セクションまたは興味領域が、異なる欠陥許容範囲を有する場合（例えば、特定のタイプの欠陥が特定の興味領域において許容可能／許容不能、閾値サイズ以下の欠陥は許容可能）に特に有利である。以上の概念は、ビジュアル検査システムに対して向上した機能を提供するために、異なるモデルを使用して検出される「オブジェクト」の間の他の関係を取得するために適用されうると理解される。換言すれば、異なるモデルからの出力データ３２２は、他のモデルをトリガすることを含んでもよい後続のアクションを決定するために、モジュール６００によって分析または比較されてもよい。このような比較は、トリガされるモデルのモデルトリガ条件において具体化されてもよい。例えば、第１モデル６０２および第２モデル６０４の出力データ３２２が、第３モデル６０６がトリガされるべきか否かを判定する際に使用されてもよい。

【0155】

モデル６０２、６０４、および６０６のそれぞれが、更なる分析またはサブ分析を実行する更なるモデルを含んでもよいと更に理解される。例えば、第１検出モデル６０２は、いくつかの「より小さい」モデル（それぞれが、第１検出モデル６０２によって送信される特定の分析またはサブ分析を実行するために、検査イメージデータ３２０を受け取ってもよい）を含んでもよい。

【0156】

モデル６０２、６０４、６０６の、どの「より小さい」モデル（もしあれば）に検査イメージデータ３２０が送られるべきかの判定は、モデルトリガ判定モジュール３１６が、モデルトリガ条件３２６に従って行う。前述されたように、各モデル６０２、６０４、６０６、または任意のサブモデルは、その内部またはその間に追加的なモデルトリガ判定モジュールを含んでもよい。このような追加的なモデルトリガ判定モジュールが内部または間に存在する場合、このような追加的なモデルトリガ判定モジュールは、モジュール６００における単一のモデルトリガ判定モジュール３１６を表す仮想モジュールでもよい。

【0157】

図８を参照して、複数のオブジェクト検出タスクを実行する単一のオブジェクト検出器を有することによって、オブジェクト検出に対して従来のアプローチを採用するビジュアル検査システムによって、使用または生成されるカムシャフトのイメージ８００の表示例が示されている。イメージ８００は、カムシャフトの入力検査イメージ８０２と、単一のオブジェクト検出器を使用したビジュアル検査後のカムシャフトのアノテーションされた出力イメージ８０４と、を含む。

【0158】

イメージ８０２は、カムシャフトの検査イメージである。検査イメージ８０２は、欠陥検出、部品セクション検出、およびアセンブリ特徴検出を実行するように構成される単一のオブジェクト検出器への入力として提供される。単一のオブジェクト検出器は、アノテーションされた出力イメージ８０４を生成する。アノテーションされた出力イメージ８０４は、検査イメージ８０２と、欠陥、部品セクション、およびアセンブリ特徴に関する、単一のオブジェクト検出器によって検出された、検査イメージにオーバーレイされた様々な情報と、を含む。特に、イメージ８０４は、検出されたオブジェクトを識別するバウンディングボックス８０６ａ～８０６ｇを含む。ボックス８０６ａは、VTCについてのROIを示すセクション検出からの出力である。ボックス８０６ｂは、スラストセクションを見つけるセクション検出からの出力である。ボックス８０６ｃは、識別された欠陥を示す欠陥検出からの出力である。ボックス８０６ｄ～８０６ｇは、欠陥およびオブジェクトがフィルタリングされた場所の視覚的表現である（例えば、特定のエリアの外にあるものは無視される）。

【0159】

図９を参照して、一実施形態に係る、本開示のビジュアル検査システムによって生成される、カムシャフトのアノテーションされた出力イメージ９００の表示例が示されている。イメージ９００を生成するために使用されるシステムは、図８のイメージ８０２で使用される単一の検出器システムからの改良を提供してもよい。

【0160】

イメージ９００は、図３のコンピュータシステム３００または図１のＡＩビジュアル検査デバイス１２によって生成されてもよい。イメージ９００は、第１アノテーションされた出力イメージ９０２、第２アノテーションされた出力イメージ９０４、および組み合わされたアノテーションされた出力イメージ９０８を含む。

【0161】

イメージ９０２は、図６の部品セクション検出モデル６０４等の部品セクション検出モデルを使用して生成されたイメージの一例である。イメージ９０２は、モデル出力３２２の一実施形態である。イメージ９０２は、部品セクションの特定のクラスが検出されたイメージ９０２における位置を示すバウンディングボックスおよび部品セクションのクラスに対応するラベルを含むアノテーション９０６ａを含む。

【0162】

イメージ９０４は、図６の欠陥検出モデル６０２等の欠陥検出モデルを使用して生成されたイメージの一例である。イメージ９０４は、モデル出力３２２の一実施形態である。イメージ９０４は、特定の欠陥が見つかったイメージ９０４における位置を示すバウンディングボックスおよび検出された欠陥のクラスを示すラベルを含む更なるアノテーション９０６ｂ～９０６ｆを含む。

【0163】

イメージ９０２および９０４は、出力イメージアノテータモジュール３１４で組み合わされ、アノテーションされた出力イメージデータ３２４を生成する。

【0164】

イメージ９０８は、アノテーションされた出力イメージデータ３２４の一実施形態である。イメージは、部品セクションおよび欠陥検出モデルから生成されたアノテーション（および、これらのモデルの出力イメージ９０２、９０４において存在する）を含む。イメージ９０８は、部品セクションおよび欠陥検出モデルによって検出されたオブジェクトに対応するアノテーション９０６ａ～９０６ｆ（および、イメージ９０２、９０４において存在する）を含む。アノテーションは、検出された特定のオブジェクトが特定されたイメージ９０８における位置を示すバウンディングボックスおよびオブジェクトのクラスを示すラベルを含む。

【0165】

他の実施形態では、イメージ９０８が、アノテーションのサブセットのみを含んでもよい。アノテーションのどのサブセットが使用または表示されるかは、システムによって自動的に判定されてもよいし（例えば、イメージアノテータモジュール３１４または他のソフトウェアロジックによって）、ユーザデバイスにおいてユーザによって提供される入力に基づいてもよい。例えば、どのオブジェクトが保持または表示されるかは、信頼閾値を満たすこと、特定の興味領域（ROI）フィルタを満たすこと、特定のオブジェクトクラスを有すること（例えば、見つかった不必要なクラス／オブジェクトの除去）等の少なくともいずれかに基づいて判定されてもよい。

【0166】

以上で言及された特徴は、検査オブジェクト上または検査オブジェクト内の特定の部品またはセクションの欠陥、アセンブリ、および存在または不存在のいずれかを含んでもよい。

【0167】

組み合わされたアノテーションされた出力イメージ９０８は、モデル出力モジュール３１８によって、ユーザに対する表示のためにディスプレイ３０８に送られてもよい。。組み合わされたアノテーションされた出力イメージ９０８は、メモリ３０４に保存されてもよい。いくつかの場合では、組み合わされたアノテーションされた出力イメージ９０８が、クラウドデバイスにおけるクラウドストレージ等のストレージおよび／または分析のために（例えば、分析サーバに）、他のデバイス（不図示）に送られてもよい。

【0168】

検査イメージデータ３２０が複数のモデル３１２に対して送られる場合に、各モデル３１２が検査イメージデータ３２０を順番に受け取るように発明の実施形態が記述されたが、関連するシステム、方法、およびデバイスは、モデル３１２が、実質的におよび／または完全に並列的に／並行的に／同時に、検査イメージデータ３２０を受け取るように構成されてもよい。

【0169】

以上の記述は、一または複数の装置、方法、またはシステムの例を提供したが、他の装置、方法、またはシステムが、当業者によって解釈される請求項の範囲内でもよいと理解される。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【手続補正書】

【提出日】2023-09-29

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

【請求項2】

【請求項3】

【請求項4】

【請求項5】

【請求項6】

前記第１ニューラルネットワークモデル出力データは、検出されたオブジェクトの少なくとも二つの属性を記述するオブジェクト属性データを含み、
前記少なくとも二つの属性は、オブジェクト位置、オブジェクトクラスラベル、オブジェクト信頼レベル、およびオブジェクトサイズの任意の二つ以上を含む、
請求項１に記載のシステム。

【請求項7】

前記第２モデルトリガ条件は、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を含み、前記プロセッサは、前記オブジェクト属性データが、前記検出されたオブジェクトの前記少なくとも二つの属性のそれぞれについての要求を満たすか否かを判定するように更に構成される、請求項６に記載のシステム。

【請求項8】

前記第１ニューラルネットワークモデル出力データは、前記第２モデルトリガ条件が前記プロセッサによって使用されることを識別する識別子を含み、
前記識別子は、前記第１ニューラルネットワークモデルを識別するモデル識別データを備え、
前記プロセッサは、前記識別子に基づいて、前記第２モデルトリガ条件が使用されることを判定する、
請求項１に記載のシステム。

【請求項9】

前記第２モデルトリガ条件が使用されることを判定する際、前記プロセッサは、前記第１ニューラルネットワークモデル出力データが、前記第２モデルトリガ条件を満たすか否かを判定するために、前記識別子を使用して前記メモリから前記第２モデルトリガ条件を取り出す、請求項８に記載のシステム。

【請求項10】

前記第２ニューラルネットワークモデルに提供される前記検査イメージは、前記第１ニューラルネットワークモデル出力データから判定される前記検査イメージのサブセットを備え、第２オブジェクト検出タスクは、前記検査イメージの前記サブセットを使用して実行される、請求項１に記載のシステム。

【請求項11】

【請求項12】

【請求項13】

【請求項14】

実行される前記ニューラルネットワークモデルのリストは、それぞれが単一のニューラルネットワークモデルに対応する、実行される複数の別のニューラルネットワークモデルのリストを備える、請求項１１に記載のシステム。

【請求項15】

【請求項16】

【請求項17】

前記イメージセグメンテーションニューラルネットワークモデルは、インスタンスセグメンテーションニューラルネットワークモデルである、請求項１６に記載のシステム。

【請求項18】

【請求項19】

前記検査イメージデータおよび前記検査イメージアノテーションデータを使用して、アノテーションされた検査イメージを生成ことと、
前記アノテーションされた検査イメージをユーザインターフェースにおいて表示することと、
を更に実行する、請求項１８に記載の方法。

【請求項20】

前記第１ニューラルネットワークモデルおよび前記第２ニューラルネットワークモデルの少なくとも一つは、インスタンスセグメンテーションニューラルネットワークモデルである、請求項１８に記載の方法。

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版