(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-22
(45)【発行日】2024-12-02
(54)【発明の名称】機械学習を用いて塗装不良の検出を行うためのシステムおよび方法
(51)【国際特許分類】
G01N 21/88 20060101AFI20241125BHJP
B05C 11/00 20060101ALI20241125BHJP
G06T 7/00 20170101ALI20241125BHJP
G06V 10/00 20220101ALI20241125BHJP
【FI】
G01N21/88 J
B05C11/00
G06T7/00 350C
G06V10/00
(21)【出願番号】P 2023544738
(86)(22)【出願日】2021-01-26
(86)【国際出願番号】 IB2021050595
(87)【国際公開番号】W WO2022162417
(87)【国際公開日】2022-08-04
【審査請求日】2023-10-04
(73)【特許権者】
【識別番号】505056845
【氏名又は名称】アーベーベー・シュバイツ・アーゲー
【氏名又は名称原語表記】ABB Schweiz AG
【住所又は居所原語表記】Bruggerstrasse 66, 5400 Baden, Switzerland
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】セン、ネブロス
(72)【発明者】
【氏名】リー、ウェンロン
(72)【発明者】
【氏名】ジュー、アンバー-フェンチン
(72)【発明者】
【氏名】チャン、クン
【審査官】齋藤 卓司
(56)【参考文献】
【文献】特開2019-082333(JP,A)
【文献】特開2017-101977(JP,A)
【文献】特許第5182833(JP,B1)
【文献】米国特許出願公開第2020/0269439(US,A1)
【文献】特開2016-156654(JP,A)
【文献】特開2006-267022(JP,A)
【文献】特表2020-526821(JP,A)
【文献】特表2020-524349(JP,A)
【文献】国際公開第2019/194255(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 21/88
B05C 11/00
G06T 7/00
G06V 10/00
(57)【特許請求の範囲】
【請求項1】
物体上の塗装不良を検出するための方法であって、
物体の表面に異なる複数のパターン特性で複数のパターンを投影することと、
前記複数のパターンを投影することに基づき、前記物体の複数の画像を取り込むことと、
前記物体の表面が1つ又は複数の塗装不良を含むかどうかを決定するために、前記物体の前記複数の画像を機械学習モデルに入力することと、
前記複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、前記塗装不良を有する前記画像を表示させることと、を備え、
前記複数のパターンを投影することは、
第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを前記物体上に投影することと、
第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを前記物体上に投影することと、を備え、ここで、前記第1のパターン特性は、前記第2のパターン特性とは異なり、
前記複数の画像を取り込むことは、
前記第1の時間インスタンスに、前記第1のパターンを投影することに基づき、1つ又は複数の第1の画像を取り込むことと、
前記第2の時間インスタンスに、前記第2のパターンを投影することに基づき、1つ又は複数の第2の画像を取り込むことと、を備え、ここで、前記複数の画像を前記機械学習モデルに入力することは、前記1つ又は複数の第1の画像と、前記1つ又は複数の第2の画像を前記機械学習モデルに入力することを備える、方法。
【請求項2】
異なる前記複数のパターン特性は、ユーザフィードバックインターフェースを介して提供されるユーザ入力に基づく、請求項
1に記載の方法。
【請求項3】
前記第1のパターンは、第1の周波数値に関連付けられ、前記第2のパターンは、前記第1の周波数値とは異なる第2の周波数値に関連付けられる、請求項
1に記載の方法。
【請求項4】
バックエンドサーバから前記機械学習モデルを受け取ることをさらに備え、前記バックエンドサーバは、1つ又は複数の車両の表面の塗装不良の取り込まれた画像に基づき、前記機械学習モデルを訓練する、請求項1に記載の方法。
【請求項5】
バックエンドサーバから
、物体検出機械学習モデルを受け取ることと、
塗装不良の取り込まれた画像に基づき、前記機械学習モデルを生成するために、前
記物体検出機械学習モデルを訓練することと、をさらに備える、請求項1に記載の方法。
【請求項6】
前記機械学習モデルは、Mask領域ベース畳み込みニューラルネットワーク(Mask-RCNN)を備える、請求項1に記載の方法。
【請求項7】
前記機械学習モデルは、残差ニューラルネットワーク(ResNet)を備え、前記物体の表面が前記1つ又は複数の塗装不良を含むかどうか決定するために前記物体の前記複数の画像を前記機械学習モデルに入力することは、
前記複数の画像から複数の特徴を抽出するために、前記複数の画像を前記ResNetに入力することと、
前記複数の特徴が、前記物体の表面の前記1つ又は複数の塗装不良を示すかどうか決定することと、を備える、請求項1に記載の方法。
【請求項8】
前記機械学習モデルは、特徴ピラミッドネットワーク(FPN)と領域提案ネットワーク(RPN)とをさらに備え、前記複数の特徴が、前記物体の前記表面の前記1つ又は複数の塗装不良を示すかどうかを決定することは、
前記複数の特徴に対して2つの出力を生成するために、前記FPNとRPNとを用いることを備え、前記2つの出力のうちの第1の出力は、前記複数の特徴からのある特徴が塗装不良であるかどうかを示し、前記2つの出力のうちの第2の出力は、前記特徴に対する位置識別子である、請求項
7に記載の方法。
【請求項9】
物体上の塗装不良を検出するためのシステムであって、
物体の表面に異なる複数のパターン特性で複数のパターンを投影するように構成されたパターン投影デバイスと、
前記複数のパターンを投影することに基づき、前記物体の複数の画像を取り込むように構成された画像取込みデバイスと、
制御システムであって、
前記物体の前記表面が1つ又は複数の塗装不良を含むかどうかを決定するために、前記物体の前記複数の画像を機械学習モデルに入力することと、
前記複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、前記塗装不良を有する画像を表示することと、を行うように構成された制御システムと、を備え、
前記パターン投影デバイスは、
第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを前記物体上に投影すること、及び第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを前記物体上に投影することにより、前記複数のパターンを投影するように構成され、ここで、前記第1のパターン特性は、前記第2のパターン特性とは異なり、
前記画像取込みデバイスは、
前記第1の時間インスタンスに、前記第1のパターンを投影することに基づき、1つ又は複数の第1の画像を取り込むこと、及び前記第2の時間インスタンスに、前記第2のパターンを投影することに基づき、1つ又は複数の第2の画像を取り込むこと、により前記複数の画像を取り込むように構成され、ここで、前記制御システムは、前記1つ又は複数の第1の画像と、前記1つ又は複数の第2の画像を前記機械学習モデルに入力することにより、前記複数の画像を前記機械学習モデルに入力する、システム。
【請求項10】
異なる前記複数のパターン特性は、ユーザフィードバックインターフェースを介して提供されるユーザ入力に基づく、請求項
9に記載のシステム。
【請求項11】
前記第1のパターンは、第1の周波数値に関連付けられ、前記第2のパターンは、前記第1の周波数値とは異なる第2の周波数値に関連付けられている、請求項
9に記載のシステム。
【請求項12】
前記制御システムは、バックエンドサーバから前記機械学習モデルを受け取るようにさらに構成され、前記バックエンドサーバは、1つ又は複数の車両の表面の塗装不良の取り込まれた画像に基づき、前記機械学習モデルを訓練する、請求項
9に記載のシステム。
【請求項13】
前記制御システムは、
バックエンドサーバから
、物体検出機械学習モデルを受け取ることと、
塗装不良の取り込まれた画像に基づき、前記機械学習モデルを生成するために、前
記物体検出機械学習モデルを訓練することと、を行うようにさらに構成され
ている、請求項
9に記載のシステム。
【請求項14】
前記機械学習モデルは、Mask領域ベース畳み込みニューラルネットワーク(Mask-RCNN)を備える、請求項
9に記載のシステム。
【請求項15】
記憶されたプロセッサ実行可能命令を有する非一時的なコンピュータ可読媒体であって、1つ又は複数のコントローラにより実行されたとき、前記プロセッサ実行可能命令が、
物体の表面に複数の異なるパターン特性で複数のパターンを投影することと、
前記複数のパターンを投影することに基づき、前記物体の複数の画像を取り込むことと、
前記物体の前記表面が、1つ又は複数の塗装不良を含むかどうかを決定するために、前記物体の前記複数の画像を機械学習モデルに入力することと、
前記複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、前記塗装不良を有する前記画像を表示させることと、を促進し、
前記複数のパターンを投影することは、
第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを前記物体上に投影することと、
第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを前記物体上に投影することと、を備え、ここで、前記第1のパターン特性は、前記第2のパターン特性とは異なり、
前記複数の画像を取り込むことは、
前記第1の時間インスタンスに、前記第1のパターンを投影することに基づき、1つ又は複数の第1の画像を取り込むことと、
前記第2の時間インスタンスに、前記第2のパターンを投影することに基づき、1つ又は複数の第2の画像を取り込むことと、を備え、ここで、前記複数の画像を前記機械学習モデルに入力することは、前記1つ又は複数の第1の画像と、前記1つ又は複数の第2の画像を前記機械学習モデルに入力することを備える、非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
[0001]本開示は、機械学習/人工知能アルゴリズムを用いる物体検出に関し、より詳細には、深層学習を用いて、塗装不良を検出するためのシステムおよび方法に関する。
【背景技術】
【0002】
[0002]従来、塗装の仕事の品質は、熟練者によって評価され、それは、労働集約型のプロセスであり、高い生産量を得るには、複数の検査ラインを必要とする。例えば、車両の製造工程は、塗装工程を含むことができる。しかし、この工程中に導入される、または生ずる可能性のある欠陥があり得る。例えば、非常に小さなゴミおよび/または他の粒子が車両の表面に存在する可能性があり、塗装されたとき、これらの粒子が、視認できる欠陥を生ずるおそれがある。さらに、塗料が塗布された後、引っかき傷が、車両の表面に生ずる可能性がある。したがって、車両がこれらの欠陥を有するかどうかを評価するために、熟練者が使用され得る。しかし、これは、時間のかかる工程であるだけではなく、熟練者により行われる判断は、主観的なものであり、片寄りを含む可能性がある(例えば、一人の熟練者は、欠陥があると決定し得るが、別の人は欠陥がないと決定し得る)。したがって、分類結果に一貫性がない可能性がある。したがって、車両の表面の欠陥を検出するための自動化されたプロセスを提供する技術的必要性がある。
【発明の概要】
【0003】
[0003]本開示の第1の態様は、物体上の塗装不良を検出する方法を開示する。方法は、物体の表面に複数の異なるパターン特性で複数のパターンを投影することと、複数のパターンを投影することに基づき、物体の複数の画像を取り込むことと、物体の表面が1つまたは複数の塗装不良を含むかどうかを決定するために、物体の複数の画像を機械学習モデルに入力することと、複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、塗装不良を有する画像を表示させることとを備える。
【0004】
[0004]第1の態様の実施形態によれば、複数のパターンを投影することは、第1の時間インスタンスに、第1のパターン特性を有する第1のパターを物体上に投影することと、第2の時間インスタンスに、第2のパターン特性を有する第2のパターを物体上に投影することとを備え、ここにおいて、第1のパターン特性は、第2のパターン特性とは異なる。
【0005】
[0005]第1の態様の実施形態によれば、複数の画像を取り込むことは、第1の時間インスタンスに、第1のパターンを投影することに基づき、1つまたは複数の第1の画像を取り込むことと、第2の時間インスタンスに、第2のパターンを投影することに基づき、1つまたは複数の第2の画像を取り込むこととを備え、ここにおいて、複数の画像を機械学習モデルに入力することは、1つまたは複数の第1の画像と、1つまたは複数の第2の画像とを機械学習モデルに入力することを備える。
【0006】
[0006]第1の態様の実施形態によれば、第1のパターンは水平パターンであり、第2のパターンは垂直パターンである。
【0007】
[0007]第1の態様の実施形態によれば、第1のパターンは、第1の周波数値に関連付けられ、第2のパターンは、第1の周波数値とは異なる第2の周波数値に関連付けられる。
【0008】
[0008]第1の態様に実施形態によれば、方法は、バックエンドサーバから、機械学習モデルを受け取ることをさらに備え、ここにおいて、バックエンドサーバは、1つまたは複数の車両の表面の塗装不良の取り込まれた画像に基づき、機械学習モデルを訓練する。
【0009】
[0009]第1の態様の実施形態によれば、方法は、バックエンドサーバから一般的な物体検出機械学習モデルを受け取ることと、塗装不良の取り込まれた画像に基づき、機械学習モデルを生成するために、一般的な物体検出機械学習モデルを訓練することとをさらに備える。
【0010】
[0010]第1の態様の実施形態によれば、機械学習モデルは、Mask領域ベース畳み込みニューラルネットワーク(Mask-RCNN)を備える。
【0011】
[0011]第1の態様の実施形態によれば、機械学習モデルは、残差ニューラルネットワーク(ResNet)を備える。さらに、物体の表面が、1つまたは複数の塗装不良を含むかどうかを決定するために、物体の複数の画像を機械学習モデルに入力することは、複数の特徴を複数の画像から抽出するために、複数の画像をResNetに入力することと、複数の特徴が、物体の表面の1つまたは複数の塗装不良を示すかどうかを決定することとを備える。
【0012】
[0012]第1の態様の実施形態によれば、機械学習モデルは、特徴ピラミッドネットワーク(FPN)と領域提案ネットワーク(RPN)とをさらに備える。複数の特徴が、物体の表面の1つまたは複数の塗装不良を示すかどうか決定することは、複数の特徴に対して2つの出力を生成するために、FPNとRPNとを用いることを備え、ここにおいて、2つの出力のうちの第1の出力は、複数の特徴からのある特徴が塗装不良であるかどうかを示し、またここにおいて、2つの出力のうちの第2の出力は、特徴に対する位置識別子である。
【0013】
[0013]本開示の第2の態様は、物体上の塗装不良を検出するためのシステムを提供する。システムは、物体の表面に複数の異なるパターン特性で複数のパターンを投影するように構成されたパターン投影デバイスと、複数のパターンを投影することに基づき、物体の複数の画像を取り込むように構成された画像取込みデバイスと、物体の表面が1つまたは複数の塗装不良を含むかどうかを決定するために、物体の複数の画像を機械学習モデルに入力することと、複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、塗装不良を有する画像を表示することとを行うように構成された制御システムとを備える。
【0014】
[0014]第2の態様の実施形態によれば、パターン投影デバイスは、第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを物体上に投影することと、第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを物体上に投影することとにより、複数のパターンを投影するように構成され、ここにおいて、第1のパターン特性は、第2のパターン特性とは異なる。
【0015】
[0015]第2の態様の実施形態によれば、画像取込みデバイスは、第1の時間インスタンスに、第1のパターンを投影することに基づき、1つまたは複数の第1の画像を取り込むことと、第2の時間インスタンスに、第2のパターンを投影することに基づき、1つまたは複数の第2の画像を取り込むこととにより、複数の画像を取り込むように構成され、ここにおいて、制御システムは、1つまたは複数の第1の画像と1つまたは複数の第2の画像とを機械学習モデルに入力することにより、複数の画像を機械学習モデルに入力する。
【0016】
[0016]第2の態様の実施形態によれば、第1のパターンは水平パターンであり、また第2のパターンは垂直パターンである。
【0017】
[0017]第2の態様の実施形態によれば、第1のパターンは、第1の周波数値に関連付けられ、第2のパターンは、第1の周波数値とは異なる第2の周波数値に関連付けられる。
【0018】
[0018]第2の態様の実施形態によれば、制御システムは、バックエンドサーバから機械学習モデルを受け取るようにさらに構成され、ここにおいて、バックエンドサーバは、1つまたは複数の車両の表面上の塗装不良の取り込まれた画像に基づき、機械学習モデルを訓練する。
【0019】
[0019]第2の態様の実施形態によれば、制御システムは、バックエンドサーバから、一般的な物体検出機械学習モデルを受け取ることと、塗装不良の取り込まれた画像に基づき、機械学習モデルを生成するために、一般的な物体検出機械学習モデルを訓練することとを行うようにさらに構成される。
【0020】
[0020]第2の態様の実施形態によれば、機械学習モデルは、Mask領域ベース畳み込みニューラルネットワーク(Mask-RCNN)を備える。
【0021】
[0021]本開示の第3の態様は、記憶されたプロセッサ実行可能命令を有する非一時的なコンピュータ可読媒体を提供する。プロセッサ実行可能命令は、1つまたは複数のコントローラにより実行されたとき、物体の表面に複数の異なるパターン特性で複数のパターンを投影することと、複数のパターンを投影することに基づき、物体の複数の画像を取り込むことと、物体の表面が、1つまたは複数の塗装不良を含むかどうかを決定するために、物体の複数の画像を機械学習モデルに入力することと、複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、塗装不良を有する画像を表示させることとを促進する。
【0022】
[0022]第3の態様の実施形態によれば、複数のパターンを投影することは、第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを物体上に投影することと、第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを物体上に投影することとを備え、ここにおいて、第1のパターン特性は、第2のパターン特性とは異なる。
【0023】
[0023]本開示の実施形態は、例示的な図に基づいて以下でさらに詳細に述べられよう。本開示は、例示的な実施形態に限定されない。本明細書で述べられる、および/または示されるすべての特徴は、本開示の実施形態において、単独で、または異なる組合せで組み合わされて使用され得る。本開示の様々な実施形態の特徴および利点は、以下で示される添付図面を参照し、以下の詳細な記述を読むことにより明らかになるであろう。
【図面の簡単な説明】
【0024】
【
図1】[0024]本開示の1つまたは複数の実施形態による、塗装不良を検出するために機械学習を使用する環境を示す簡単化されたブロック図。
【
図2A】[0025]本開示の1つまたは複数の実施形態による、塗装不良を検出するための投影デバイスおよび画像取込みデバイスを用いることを示す図。
【
図2B】本開示の1つまたは複数の実施形態による、塗装不良を検出するための投影デバイスおよび画像取込みデバイスを用いることを示す図。
【
図2C】本開示の1つまたは複数の実施形態による、取得デバイスのモデルを用いることを示す図。
【
図3】[0026]本開示の1つまたは複数の実施形態による、例示的な制御システムの概略図。
【
図4】[0027]本開示の1つまたは複数の実施形態による、塗装不良を検出するために機械学習を使用するプロセスを示す図。
【
図5A】[0028]本開示の1つまたは複数の実施形態による、物体の表面に投影された例示的なパターンの図。
【
図5B】本開示の1つまたは複数の実施形態による、物体の表面に投影された例示的なパターンの図。
【
図6A】[0029]本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6B】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6C】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6D】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6E】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6F】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6G】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6H】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6I】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6J】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6K】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【
図6L】本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する、例示的に取り込まれた画像を示す図。
【発明を実施するための形態】
【0025】
[0030]最近、車両の塗装品質検査に対して、自動化された欠陥検出システムを開発することに対して大きな関心が持たれている。しかし、とりわけ、自動化されたシステムの1つの基本的な困難さは、適切な品質の画像を取得することであり、それは、通常、従来の方法によって達成され得ない(例えば、車/試験表面の高い反射係数のため、適切な照明条件を作ることは困難なプロセスである)。したがって、画像の取得および解析システムにおいて、異なる原理が展開され得る。PMD法(PMD:Phase Measuring Deflectometry)は、このような原理の中のものであり、それは、鏡面の地形的な情報が、構造化された光源の反射を解析することによって得られる。これは、試験表面から一定の距離に位置する液晶ディスプレイ(LCD)画面上に、正弦波の干渉縞パターンをまず表示し、次いで、カメラの支援により反射されたパターンを取り込むことによって行われる。しかし、PMDだけを使用する自動化システムは、産業用の環境において、塗装不良を検出するには、なお十分ではない可能性がある。例えば、物体に対して1つのパターンを投影することは、いくつかのタイプの欠陥を示すことができるが、多くの他のタイプの欠陥を見落とすおそれがある。これらの不正確さは、物体検出の機械学習アルゴリズムが使用される場合、さらに悪化され得る。
【0026】
[0031]別の言い方をすると、自動車の塗装工程の自動化された品質検査は、最近大幅に関心がもたれ、このようなシステムが製品化されており、市場で見ることができる。欠陥識別のための現在の手法は、データセットと、適用される対応方法とに基づいて大まかに分類され得る。より明確には、画像は、標準のカメラを用いて、または構造化光源、もしくは干渉縞パターンを用いるなど、異なる原理を用いて取得される。物体上に1つのパターンを投影することは、塗装不良の多くを見逃すおそれがあるので、製造環境において従来手法で標準カメラを用いる画像取得が実行できないことは、すでに知られている。
【0027】
[0032]したがって、機械学習ベースの物体検出モデルは、用途が限られることが分かってきた。しかし、本開示は、物体の表面からの干渉縞パターンの反射で取得される画像を用いて述べるものであり、それは、様々な条件下で、表面を観察する可能性を提供する。したがって、これらの様々な干渉縞パターンの下で訓練された機械学習アルゴリズムは、様々な欠陥を識別し、位置を特定する優れた性能を有することができる。
【0028】
[0033]言い換えると、本開示は、広く使用されている従来のアルゴリズムとは大幅に異なる機械学習ベースの手法を提供する。例えば、従来のアルゴリズムは、例えば、位相マップの導関数における不連続性を考慮し、その後に、誤った警報を除くために、サイズ/ノイズフィルタ、表面曲率フィルタ、およびエッジフィルタなどのいくつかのフィルタを適用することにより不規則性を計算することを目的として、いくつかの位相シフトされた生成パターンを用いることに依存する。これらの従来のアルゴリズムは、欠陥をさらに分類するためのさらなるアルゴリズムがなお必要となり、さらに、これらの方法を実施するために、通常、あらゆる走査表面からの多数のサンプルを必要とする。
【0029】
[0034]しかし、本開示においては、欠陥を識別するための深層学習ベースの物体識別法およびシステムが述べられ、それは、画像取得に対して、位相シフトパターンを使用する。言い換えると、本明細書で述べられるように、取得された画像の品質を向上させるための方法およびシステムは、(例えば、異なるパターンおよび/または取得方法を用いることにより)構造化された光源を使用し、次いで、機械学習ベースの物体検出モデルを改良された取得画像に適用して、車両塗装工程における塗装不良を検出する。別の言い方をすると、本開示は、車両本体の塗装された表面からの反射光により取り込まれた取得画像上の塗装不良を識別し、位置を特定し、分類する。これは、一定の速度で、コストを向上させて達成され得る。コストは、学習モデルを構築するのに必要なデータ量に、または画像取得設定に関連付けられ得る。画像は、構造化された光源を用いて取得され得る。
【0030】
[0035]本開示による、機械学習を用いる塗装不良を検出する例示的な態様は、図で示された例示的な実施形態に関連して以下でさらに明らかにされる。例示的な実施形態は、本開示のいくつかの実施形態を示すが、本開示の範囲を限定することを意図するものではない。
【0031】
[0036]図面全体を通して、同一の参照番号は、必ずしも同一ではないが、同様の要素を指定する。図は、必ずしも尺度通りではなく、いくつかの部分のサイズは、示された例をより明確に示すために誇張されることもあり得る。さらに、図面は、記述と一致する例および/または実施形態を提供するが、本記述は、図面に提供される例および/または実施形態に限定されない。
【0032】
[0037]可能な場合、明示的にその他の形で述べられない限り、本明細書において単数形で述べられるいずれの用語も、逆も同様であるが、複数形も含むことが意味される。また本明細書で使用される場合、「1つの(a)」および/または「1つの(an)」という用語は、本明細書で「1つまたは複数の」という句も使用されるが、「1つまたは複数の」を意味するものとする。さらに、あるものが、他のものに「基づく」と本明細書で言われる場合、同様に、1つまたは複数の他のものに基づくことができる。言い換えると、明示的に他の形が示されない限り、本明細書で使用される「に基づく」は、「に少なくとも一部基づく」、または「に少なくとも部分的に基づく」を意味する。
【0033】
[0038]
図1は、本開示の1つまたは複数の実施形態による、塗装不良を検出するために機械学習を使用する環境100を示す簡単化されたブロック図を示す。
【0034】
[0039]
図1を参照すると、環境100は、機械学習(ML)/人工知能(AI)102と、企業コンピューティングシステム104と、ネットワーク106とを使用する塗装不良検出システムを含む。環境100内のエンティティは、単数のエンティティとして以下で述べられ、および/または図で示され得るが、本明細書で論じられるエンティティおよび機能性は、1つまたは複数のエンティティにより実施され得る、および/または含まれ得ることを理解されたい。
【0035】
[0040]塗装不良検出システム102および企業コンピューティングシステム104などの、環境100内のエンティティは、ネットワーク106を介して、環境100内の他のシステムと通信することができる。ネットワーク106は、インターネット、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)などのグローバルエリアネットワーク(GAN)、または任意の他のタイプのネットワークもしくはネットワークの組合せであり得る。ネットワーク106は、環境100内のエンティティ間で、有線、ワイヤレス、または有線およびワイヤレス通信の組合せを提供することができる。さらに、および/または代替的に、塗装不良検出システム102および企業コンピューティングシステム104は、ネットワーク106を用いることなく、互いに通信することができる。例えば、塗装不良検出システム102は、企業コンピューティングシステム104と直接通信するために、WiFiまたはBLUETOOTH(登録商標)などの1つまたは複数の通信プロトコルを使用することができる。
【0036】
[0041]企業コンピューティングシステム104は、企業組織に関連付けられたコンピューティングシステムである。いくつかの例では、企業コンピューティングシステム104は、企業組織のためのバックエンドサーバである。企業組織は、商品を売ることによる、および/またはサービスを提供することによるなど、起業家的努力を追求するために形成された任意のタイプの法人、会社、組織、施設、または同様のものであり得る。
【0037】
[0042]企業コンピューティングシステム104は、企業組織に対するタスク、機能、および/または他のアクションを実施できる1つまたは複数のコンピューティングデバイス、コンピューティングプラットフォーム、システム、サーバ、および/または他の装置を含む。例えば、示されるように、企業コンピューティングシステム104は、塗装不良ML/AI訓練システム108を含む。訓練システム108は、物体上の塗装不良を検出するために、MLおよび/またはAIモデル、データセット、および/またはアルゴリズムを訓練する。例えば、訓練システム108は、一般的な物体検出ML/AIモデルもしくはデータセット(例えば、深層学習モデルもしくはデータセット)を取得し、取り込まれた画像における塗装不良を検出するために、このモデルもしくはデータセットを訓練することができる。塗装不良は、塗装された物体の表面に生ずる、または形成し得る任意の種類の欠陥であり得る。例えば、塗装不良は、粒子不良、色の悪い不良、および/または引っかき傷不良であり得る。引っかき傷不良は、塗料が物体に塗布された後に生ずる可能性のある塗装における引っかき傷であり得る。粒子不良は、塗料が物体に塗布されたとき、物体の表面にあるゴミ粒子などの粒子であり得、それは、塗料が、物体の表面にわたって不均一に塗布されるおそれがある。いくつかの例では、訓練システム108は、MF/AIモデルもしくはデータセットを訓練するために、車両上の塗装不良の取り込まれた画像を使用することができる。言い換えると、ML/AIモデルもしくはデータセットは、車両における塗装不良を検出するために訓練され得る。MF/AIモデルもしくはデータセットを訓練した後、企業コンピューティングシステムは、訓練されたMF/AIモデルもしくはデータセットを塗装不良検出システム102に提供する。
【0038】
[0043]いくつかの変形形態では、企業コンピューティングシステム104は、1つまたは複数のコンピューティングプラットフォーム、デバイス、サービス、および/または装置を用いて実施され得る。他の変形形態では、企業コンピューティングシステム104は、エンジン、ソフトウェア機能、および/またはアプリケーションとして実施され得る。言い換えると、企業コンピューティングシステム104の機能性は、記憶装置(例えば、メモリ)に記憶され、1つまたは複数のプロセッサによって実行されるソフトウェア命令として実施され得る。
【0039】
[0044]塗装不良検出システム102は、制御システム110と、パターン投影デバイス114と、画像取込みデバイス118と、塗装された表面を有する物体116とを含む。制御システム110は、塗装不良を検出するための記憶されたML/AIデータセット112(例えば、深層学習データセット)と、表示デバイス122とを含む。例えば、訓練されたML/AIモデルもしくはデータセットを、企業コンピューティングシステム104から受け取った後、制御システム110は、メモリに、塗装不良を検出するための訓練されたML/AIデータセット(例えば、深層学習データセット112など)を記憶することができる。
【0040】
[0045]制御システム110は、物体116上の塗装不良を検出するために、パターン投影デバイス114および画像取込みデバイス118と通信する。物体116は、任意のタイプの物体であり得、塗料が、物体116の表面に塗布され得る。いくつかの例では、物体116は車両であり、システム102は、車両製造システムである。例えば、製作工程中、車両は、一定の色で塗布され得る。制御システム110は、車両の塗布された表面上に欠陥があるかどうかを検出することができる。
【0041】
[0046]パターン投影デバイス114は、制御システム110が、物体116上に1つまたは複数の塗装不良があるかどうかを検出するために、物体116の表面に、複数のパターンを投影する。パターン投影デバイス114は、物体116上に、干渉縞パターンなどのパターンを生成する、または投影することのできる任意のタイプの投影、またはプロジェクタデバイスであり得る。
図5Aおよび
図5Bは、本開示の1つまたは複数の実施形態による、物体116の表面に投影される例示的なパターンを示す。干渉縞パターン502~508は、異なるパターン特性を有する。例えば、
図5Aを参照すると、パターン投影デバイス114により物体116上に投影されたパターン502および504は、垂直な干渉縞パターンである。投影されたパターン502は、パターン504とは異なる周波数を有する。
図5Bを参照すると、パターン506および508は、異なる周波数を有する水平パターンである。言い換えると、物体116上に投影されたパターンのそれぞれは、異なるパターン特性を有することができる(例えば、パターン502~508)。パターン特性は、これだけに限らないが、垂直パターン、水平パターン、対角線パターンであること、パターンに関連付けられた周波数を有すること、パターンに関連付けられた位相シフトを有すること、連続する投影パターン(マルチショット)であること、連続的に変化するパターン(シングルショット)であること、パターンに対してストライプの割出しを含むこと(シングルショット)、パターンに対して格子の割出しを含むこと(シングルショット)、上記で述べられた混成もしくは組合せ法、および/またはさらなるタイプの投影特性を含む。
【0042】
[0047]
図1を参照すると、画像取込みデバイス(例えば、カメラ)118は、投影されたパターンの画像を取り込むことができる。画像取込みデバイスは、画像を取り込むことができる、および/またはビデオを録画できる任意のタイプのデバイスであり得る。例えば、パターン投影デバイス114は、投影されるパターン120(例えば、点線)を、物体116の表面に投影する。投影されたパターン120は、物体116の表面により反射され、画像取込みデバイス118の方向に送られる。画像取込みデバイス118は、投影されたパターン120の1つまたは複数の画像を取り込む。パターン投影デバイス114は、異なるパターン特性を有する複数のパターンを物体116上に投影することができ、画像取込みデバイス118は、その異なる特性を有する投影されたパターンの画像を取り込むことができる。画像取込みデバイス118は、取り込まれた画像を制御システム110に提供する。
図2Aおよび
図2Bは、より詳細にこれを述べる。
【0043】
[0048]特に、
図2Aおよび
図2Bは、本開示の1つまたは複数の実施形態による塗装不良を検出するための投影デバイス、画像取込みデバイス、および制御システムを用いて示されている。
図2Aを参照すると、制御システム110は、パターン投影デバイス114と、画像取込みデバイス118と通信状態にある。制御システム110からの1つまたは複数の命令に基づき、パターン投影デバイス114は、物体116の表面にパターン120を投影する。複数の線は、このパターンが干渉縞パターン(例えば、一定の周波数に設定された交互に明暗セクションを有するパターンなど)であることを示す。物体116の表面は塗装されており、パターン120は、表面から画像取込みデバイス118に反射される。画像取込みデバイス118は、物体116上のこのパターン120の画像を取り込み、その画像を制御システム110に送り返す。取り込まれた画像は、交互の明暗セクションを含む204として示されている。制御システム110は、物体116が塗装不良を有するかどうかを決定するために、ML/AIデータセットを使用することができる。
図2Aでは、物体116上に塗装不良は存在しない。
【0044】
[0049]
図2Bを参照すると、画像を取り込むために
図2Aと同じプロセスが使用される。しかし
図2Bでは、制御システム110は、物体116が塗装不良214を有することを検出する。したがって、取り込まれた画像212は、この塗装不良214を示す。これは、以下でさらに詳細に説明される。
【0045】
[0050]さらに前述のように、単に1つのパターンを物体116に投影することは、いくつかのタイプの欠陥を示すことができるが、いくつかの例では、多くの他のタイプの欠陥を逃すおそれがある。したがって、
図2Aおよび
図2Bを参照すると、第1のパターン120を投影し、第1の取り込まれた画像204および212を取得した後、パターン投影デバイス114は、第1のパターンとは異なる第2のパターンを物体116上に投影する。この第2のパターンは、前に述べたように、第1のパターンとは異なるパターン特性を有することができる。例えば、第1のパターンは、水平パターンとして示され、第2のパターンは、垂直パターンであり得る。制御システム110は、物体116が塗装不良(例えば、欠陥214など)を有するかどうかを決定するために、第1および第2のパターンの画像を、ML/AIデータセットに入力することができる。
【0046】
[0051]
図2Cは、本開示の1つまたは複数の実施形態による取得デバイス220のモデルを示す。取得デバイス220は、パターン投影デバイス114、画像取込みデバイス118、および/またはさらなるデバイス(例えば、パターンを生成し、および/または画像を取り込むために使用されるパターン生成プロセッサ/メモリ)を含むことができる。例えば、
図2Cで示される取得デバイス220は、パターンが表示され得る液晶ディスプレイ(LCD)画面222を含む。図示のように、画面222に表示されたパターンは、垂直パターンである。これらのパターンは、次いで、塗装不良が検査されるように、表面(例えば、物体116の表面)に反射される。取得デバイス220は、反射されたパターンを異なる角度で取り込むために使用され得る2つのカメラ224をさらに含む。取得デバイス220は、ロボットアーム226に接続され得るが、それは、物体116の表面の異なる部分を検査するために動き回る。言い換えると、ロボットアーム226は、物体116の様々な領域またはその部分の画像を取り込み、物体116の様々な領域が塗装不良を有するかどうかを決定するために、様々な位置に操作され得る。
【0047】
[0052]
図1に戻ると、制御システム110は、物体116が、1つまたは複数の塗装不良(例えば、欠陥214)を有するかどうかを決定するために、取り込まれた画像を記憶されたML/AIデータセット112に入力する。次いで、制御システム110は、塗装不良を有する画像を含む画像を表示させる。例えば、ML/AIデータセット112を用いて、制御システム110は、物体116が塗装不良を有することを識別し、画像内の塗装不良の位置、および物体116上の塗装不良の位置を特定することができる。次いで、制御システム110は、物体116が塗装不良を有することを示す通知を提供することができる。例えば、制御システム110は、表示デバイス122を用いて、塗装不良を有する取り込まれた画像を表示することができる。
【0048】
[0053]いくつかの例では、制御システム110は、異なるパターン特性を用いてパターンを投影するために、1つまたは複数の命令をパターン投影デバイス114に提供することができる。例えば、制御システム110は、1つまたは複数のパターン特性(例えば、パターンに対する特定周波数など)を示すユーザ入力を受け取ることができる。制御システム110は、パターン投影デバイス114に、ユーザ入力に基づいてパターンを投影するように指示する命令を提供することができる。さらに、および/または代替的に、制御システム110は、物体116上に投影されたパターンの画像を取り込む命令を、画像取込みデバイス118に提供することができる。
【0049】
[0054]
図1で示された例示的な環境は単なる例であること、および本明細書で論じられる原理はまた、例えば、施設、組織、デバイス、システム、およびネットワーク構成の他のタイプを含む、他の状況にも適用可能であることが理解されよう。
【0050】
[0055]
図3は、本開示の1つまたは複数の実施形態による例示的な制御システム110の概略図である。
図3で示される制御システムは、単なる例であり、環境100からの制御システム110のさらなる/代替的な実施形態も本開示の範囲に含めて企図されることが理解されよう。
【0051】
[0056]制御システム110は、コントローラ302を含む。コントローラ302は、いずれかの特定のハードウェアに制約されず、コントローラの構成は、任意の種類のプログラミング(例えば、組み込まれたLinux(登録商標))もしくはハードウェア設計により、またはその両方の組合せにより実装され得る。例えば、コントローラ302は、述べられた制御動作を実施する対応するソフトウェアを備えた汎用プロセッサなど、単一のプロセッサにより形成され得る。他方で、コントローラ302は、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)、DSP(デジタル信号プロセッサ)、または同様のものなど、専用ハードウェアにより実施され得る。
【0052】
[0057]コントローラ302は、メモリ312と電気的な通信状態にある。メモリ312は、これだけに限らないが、電子的、磁気的、光学的、電磁気的、赤外線、または半導体のコンピュータ可読媒体など、コンピュータで使用可能またはコンピュータ可読媒体であり得る、および/または含み得る。コンピュータ可読媒体のより具体的な例(例えば、非網羅的なリスト)は、以下のものを含むことができ、すなわち、1つまたは複数のワイヤを有する電気接続、可搬型のコンピュータディスケット、ハードディスク、時間依存のアクセスメモリ(RAM)、ROM、消去可能プログラム可能リードオンリーメモリ(EPROMもしくはフラッシュメモリ)、コンパクトディスクリードオンリーメモリ(CD-ROM)などの有形な媒体、または他の有形な光学的もしくは磁気的な記憶デバイスである。メモリ312は、コンピュータ可読命令316(コード、スクリプトなど)などの対応するソフトウェアを記憶することができる。コンピュータ命令316は、コントローラ302により実行されたとき、コントローラ302に、本明細書で述べられるように物体上の塗装不良を検出するように制御システム110を制御させる。メモリ312は、物体が1つまたは複数の塗装不良を有するかどうかを検出するために使用される記憶されたML/AIデータセット112をさらに含むことができる。
【0053】
[0058]制御システム110は、様々な入力および出力を受信するおよび/または提供するための入力/出力(I/O)デバイス310を含むことができる。例えば、制御システム110は、I/Oデバイス310を介して、ユーザから外部通信を受信でき、また外部通信をユーザに送ることができる。I/Oデバイス310は、表示デバイス122をさらに含むことができる。表示デバイス122は、物体116の取り込まれた画像を表示することができる。さらに、I/Oデバイス310は、ユーザからの情報を提供する、および/または受信するために使用され得るユーザフィードバックインターフェースを含むことができる。例えば、ユーザは、ユーザフィードバックインターフェースを用いて、投影されたパターンに対する特定のパターン特性などのフィードバックを提供することができる。
【0054】
[0059]コントローラ302は、通信インターフェース314を用いて環境100内の他のデバイスと通信することができる。例えば、コントローラ302は、企業コンピューティングシステム104から、訓練されたML/AIデータセット112を受け取り、このデータセット112をメモリ312に記憶することができる。さらに、通信インターフェース314は、パターン投影デバイス114および/または画像取込みデバイス118と通信するために使用され得る。例えば、コントローラ302は、通信インターフェース314を介して、物体116の取り込まれた画像を受け取ることができる。
【0055】
[0060]言い換えると、いくつかの例では、画像取込みデバイス118および/またはパターン投影デバイス114は、ネットワーク106を介することを含めて、制御システム110および/またはコントローラ302とワイヤレス通信することができる。しかし、他の例では、画像取込みデバイス118および/またはパターン投影デバイス114は、制御システム110および/またはコントローラ302に(例えば、有線接続により)直接接続され得る。したがって、コントローラ302は、画像取込みデバイス118および/またはパターン投影デバイス114と通信するために通信インターフェース314を必要としない可能性もある。
【0056】
[0061]いくつかの例では、画像取込みデバイス118および/またはパターン投影デバイス114は、制御システム110内に含まれ得る。しかし、
図1で示され、上記で述べられるように、それらはまた、制御システム110から分離することもできる。
【0057】
[0062]
図4は、本開示の1つまたは複数の実施形態による、塗装不良を検出するために、機械学習を用いるプロセス400を示す。プロセス400は、塗装不良検出システム102、制御システム110、および/または
図3で示されるコントローラ302により実施され得る。しかし、以下のブロックのいずれも、任意の適切な順序で実施され得ること、およびプロセス400は、任意の適切な環境において、また任意の適切なコントローラもしくはプロセッサにより実施され得ることが認識されよう。
【0058】
[0063]ブロック402において、塗装不良検出システム102(例えば、パターン投影デバイス114)は、複数の異なるパターン特性で、複数のパターンを物体(例えば、物体116)の表面に投影する。例えば、塗料が、物体116(例えば、車両)に塗布された後、塗装不良検出システム102は、物体116の表面に1つまたは複数の塗装不良(例えば、引っかき傷および/または粒子欠陥など)が存在するかどうかを決定することができる。これを行うために、パターン投影デバイス114は、異なるパターン特性を有する複数の異なるパターン(例えば、異なる周波数および/または垂直/水平パターンを有するパターン502~508)を物体116に投影することができる。
【0059】
[0064]いくつかの例では、制御システム110は、パターン投影デバイス114がパターンを物体116上に投影するように、パターン投影デバイス114に命令を与えることができる。さらに、および/または代替的に、物体116上に投影されるパターンは、事前設定される、および/またはユーザ定義され得る。例えば、いくつかの変形形態では、制御システム110は、物体116に投影するべき特定パターンを示すユーザ入力(例えば、パターンは、様々な異なる周波数の複数の垂直パターンにすべきであると指示するユーザ入力)を受け取り、ユーザ入力を示す命令をパターン投影デバイス114に与えることができる。パターン投影デバイス114は、パターン(例えば、干渉縞パターン)を物体116上に投影することができる。
【0060】
[0065]ブロック404において、塗装不良検出システム102(例えば、画像取込みデバイス118)は、複数のパターンの投影に基づき、物体116の複数の画像を取り込む。例えば、画像取込みデバイス118は、物体116の表面に投影されたパターンの画像を取り込むことができる。取り込まれた画像は、物体116が塗装不良を有するかどうかを決定するために使用され得る。
【0061】
[0066]いくつかの例では、制御システム110は、画像取込みデバイス118が、物体116上に投影されたパターンの画像を取り込むように、画像取込みデバイス118に命令を与えることができる。例えば、命令は、画像取込みデバイス118が、投影されたパターンのそれぞれに対していくつかの画像(例えば、1つの画像または複数の画像)を取り込むように指示することができる。
【0062】
[0067]ブロック406において、塗装不良検出システム102(例えば、制御システム110および/またはコントローラ302)は、物体116の表面が1つまたは複数の塗装不良を含むかどうかを決定するために、物体116の複数の画像を機械学習データセットに入力する。例えば、画像取込みデバイス118から、取り込まれた画像を受け取った後、コントローラ302は、メモリ312から記憶されたML/AIデータセット112を取り出すことができる。次いで、コントローラ302は、取り込まれた画像をML/AIデータセット112に入力して生成し、および/または物体116が塗装不良を含むかどうかを決定することができる。例えば、ML/AIデータセット112の出力は、物体116上の塗装不良の指示であり得る、および/またはそれを含み得る。指示は、物体116上の、および/または取り込まれた画像上の塗装不良の位置を含むことができる。いくつかの例では、指示はまた、塗装不良に関連付けられた精度または信頼値(例えば、ML/AIデータセット112により検出された塗装不良が実際に塗装不良である可能性など)を示すことができる。
図6Aから
図6Lは、これをより詳細に述べる。
【0063】
[0068]
図6Aから
図6Lは、本開示の1つまたは複数の実施形態による、機械学習を用いて検出された塗装不良を有する例示的な取込み画像602~624を示す。例えば、画像602~624のそれぞれは、パターン120がパターン投影デバイス114により投影された後、画像取込みデバイス118により取り込まれ得る。これらの画像602~624のそれぞれは、白い囲みおよび参照番号626により示された塗装不良も含む。これらの画像はまた「particle(粒子)」という文字と、数字とを示す。数字は、検出された塗装不良626に関連付けられた信頼値または確率値を指す。例えば、
図6Fは、物体上に投影された(
図5Aからのパターン502に類似した)パターンを示す。このパターンにおける歪みは、物体116の輪郭/エッジによって生じたものであり得る。例えば、物体116は、車両であり得、取り込まれた画像は、車両のドアのものであり得る。このドアのフレームは、パターン内で示された歪を生ずる可能性がある。さらに、
図6Fは、画像内に塗装不良626を示しており、それはまた、塗装不良626の位置を示す。塗装不良626の隣に、数字「1.000」を有する「particle」の文字がある。数字「1.000」は、検出された塗装不良626が実際に塗装不良である確率値(例えば、塗装不良626が実際に塗装不良である、コントローラ302により決定された100%の確率)を示す。
図6Bでは、数字は「0.999」であり、それは、
図6Bで検出された塗装不良626の確率値が、実際には99.9%の塗装不良であることを示す。さらにコントローラ302は、ML/AIデータセット112および/または位置特定を用いて、画像内の塗装不良626の位置に基づき、塗装不良626が位置する実際の物体の位置を決定することができる。言い換えると、コントローラ302は、ML/AIデータセット112を用いて、画像内に塗装不良(例えば、欠陥626)が存在するかどうか、検出された欠陥が実際に欠陥である確率、ならびに画像内の、および物体116それ自体上の塗装不良の位置を決定することができる。
【0064】
[0069]塗装不良を検出するために、塗装不良検出システム102によって使用されるML/AIデータセット112は、教師あり学習データセット、教師なし学習データセット、および/または深層学習データセットなど、任意のタイプの物体検出MLまたはAIデータセット(例えば、ML/AIアルゴリズム、および/またはモデル)であり得る。例えば、いくつかの変形形態では、ML/AIデータセット112は、層のそれぞれが、生物学的な脳におけるニューロンを概略的にモデル化する複数のノードを含む、複数の層を含む深層学習データセット(例えば、1つまたは複数のニューラルネットワーク)であり得る。ノードのそれぞれは、エッジなどのコネクタを介して、後続する層におけるノードに接続される。エッジは、通常、接続の強度、または新しいノードへのノード遷移の可能性を示すウェイトに関連付けられる。例えば、使用され得る簡単なニューラルネットワークにおいて、第1の層(例えば、ボトム層)は、3つのノードを含む。これらのノードのそれぞれは、5個のエッジを有し、これらのエッジのそれぞれは、第1の層からのノードを第2の層(例えば、ボトム層からの第2のもの)の異なるノードに接続する。これらの5個のエッジのそれぞれは、第1の層からのノードと、第2の層からのノードとの間の接続の強度を示すウェイト値に関連付けられる。ML/AIデータセット112は、上記で述べたように、簡単なニューラルネットワークを含み/であり得る、またはそれは、異なってリンクされる複数のニューラルネットワークを備えるデータセット112を含むより複雑なニューラルネットワークであり得る。塗装不良を検出するために、複数のニューラルネットワーク(例えば、Mask領域ベース畳み込みニューラルネットワーク)を用いる例示的なML/AIデータセット112を使用することは、以下で述べられる。
【0065】
[0070]最初に、ML/AIデータセット112は、一般的な物体検出ML/AIデータセット(例えば、一般的な、および/または未訓練のウェイト値を有するデータセット)であり得る。企業コンピューティングシステム104の塗装不良ML/AI訓練システム108は、訓練データを用いて、一般的な物体ML/AIデータセットを訓練することができる。例えば、訓練データは、塗装不良を含む画像を含むことができる。いくつかの例では、これらの画像は、塗装不良を有する車両のものであり得る。訓練システム108は、訓練データ(例えば、画像)をML/AIデータセットに送り込み、それに従って、画像が塗装不良を有する場合、ML/AIデータセットが正確に決定するかどうか、および/または画像内もしくは物体上の塗装不良の位置を正確に決定するかどうかに基づいて、ウェイト値を調整することができる。いくつかの例では、訓練システム108は、ML/AIデータセットを訓練するために1つまたは複数の損失関数を使用することができる。訓練の完了後(例えば、精度閾値に達するML/AIデータセットに基づいて)、企業ネットワーク104は、ネットワークを介して訓練されたML/AIデータセット112を塗装不良検出システム102に提供することができる。次いで前に説明したように、塗装不良検出システム102は、訓練されたML/AIデータセット112を使用して、物体116が1つまたは複数の塗装不良を有するかどうかを検出することができる。
【0066】
[0071]いくつかの例では、訓練システム108は、ML/AIデータセット112を訓練するために転移学習を使用することができる。いくつかの例では、塗装不良検出システム102は、ML/AIデータセット112の訓練のいくつか、またはすべてを実施することができる。例えば、企業コンピューティングシステム104は、一般的なML/AIデータセットを、塗装不良検出システム102に転移することができ、塗装不良検出システム102は、訓練データを用いてML/AIデータセットを訓練することができる。いくつかの変形形態では、企業コンピューティングシステム104は、ML/AIデータセットを訓練し、訓練されたML/AIデータセットを塗装不良検出システム102に送る。塗装不良検出システム102は、画像取込みデバイス118からの新しく取り込まれた画像を用いて、受け取られたML/AIデータセットを連続的に訓練し、更新することができる。言い換えると、ML/AIデータセットが訓練システム108によって訓練された後であっても、塗装不良検出システム102はなお、新しく取り込まれた画像を用いてML/AIデータセット112を訓練し、更新し続けることができる(例えば、ML/AIデータセット112のウェイトを更新する)。
【0067】
[0072]ブロック408において、塗装不良検出システム102(例えば、コントローラ302)は、複数の画像のうちのある画像が塗装不良を含むと決定したことに基づいて、塗装不良を有する画像を表示させる。例えば、物体116の1つまたは複数の取り込まれた画像が塗装不良を有すると決定した後、コントローラ302は、その画像を表示デバイス122および/または別の表示デバイスに表示させる。表示された画像は、
図6Aから
図6Lの画像602~624と同様のものであり得る。例えば、表示される画像は、識別された塗装不良(例えば、欠陥626)を含むことができる。
【0068】
[0073]以下では、ブロック406を含むプロセス400と、塗装不良を検出するために使用される特定の例示的なML/AIデータセット112を含むML/AIデータセット112との例示的な実施形態をより詳細に述べる。特に、欠陥検出のための既存のソリューションは、通常、考慮下の特定の用途に対して、画像から事前定義の特徴を抽出し、その後にテンプレートマッチングプロセスを行うなど、調整されたソリューションを使用する。しかしこれは、視覚システムに対して、特に物体検出およびセグメント化問題に対して、機械学習アルゴリズムを使用することを考慮すると、必ずしも必要ではない可能性がある。とりわけ、ML/AIデータセット112は、Faster領域ベース畳み込みニューラルネットワーク(Faster-RCNN)と、Mask領域ベース畳み込みニューラルネットワーク(Mask-RCNN)と、You Only Look Once(YOLO)(一度見るだけでよい)ネットワークと、シングルショット検出器(SSD)ネットワークとであってもよい、および/またはそれらを含んでもよい。Mask-RCNNは、塗装不良を検出するために使用される特定のML/AIデータセット112として、以下でさらに詳細に述べられる。しかし、大量のデータセットに対して事前に訓練されたネットワークを使用する能力に、したがって、豊富に学習した特徴セットの可用性に起因して、特化された欠陥検出問題に対するこれらのネットワークの訓練は、適切な量の精度を達成するために、大幅な量のサンプルを必要としないことが強調される。
【0069】
[0074]自動化された塗装不良検査のソリューションは、欠陥を検出するのに非常に高い精度(例えば、99%以上)を達成することが必要とされ、したがって、深層学習ベースの塗装不良検出/セグメント化アルゴリズムを使用することができ、その標準の評価基準における性能は、とりわけ比較可能であり、良好である。
【0070】
[0075]製造ライン(例えば、車両製作/生産ライン)に統合され得るターンキーソリューションを証するために、マニピュレータおよびコントローラ、カメラおよび照明装置、ならびに欠陥検査を実施するためのソフトウェアも提供することが必要になり得る。マニピュレータおよびコントローラ以外に、有効な画像取得のためのいくつかの課題(カメラ、照明、拡大/縮小すること、および同様のもの)と、機械学習アルゴリズムの性能とは、大きな相互関係があり、それは上記で述べられている(例えば、これを解決するために、塗装不良検出システム102は、複数のパターンを物体116上に投影することができる)。いくつかの例では、不十分な照明または複雑な背景の場合、非常に光源に依存する従来の視覚的な検出方法と機械学習ベースモデルとは共に、検出精度について悩まされる可能性がある。
【0071】
[0076]Mask-RCNNアルゴリズムを用いることに関して、このネットワークは、高精度検出に加えて、セグメント化機能も提供するFaster-RCNNの一般化であり得る(例えば、識別された塗装不良に対してマスクを生成する)。他のRCNN(領域畳み込みニューラルネットワーク)ベースの塗装不良検出アルゴリズムと同様に、Mask-RCNNは、2つのステップを含むことができる。最初のステップでは、いずれが塗装不良を含む可能性のあるエリアであるかについてのいくつかの提案/決定が生成され、それに、分類と、マスクと、バウンディングマスク生成とが加えられる。
【0072】
[0077]Mask-RCNNネットワークは、いくつかの層からなり、基本的な低レベルの特徴抽出領域は、残差ニューラルネットワーク(ResNet)アーキテクチャに基づく。特徴抽出層は、訓練データからの1組の連続するフィルタを学習することから想起され得るが、それは、画像に適用されたとき、豊富な組の情報を生成することができる。言い換えると、ResNetアーキテクチャは、複数の取り込まれた画像から、複数の特徴(例えば、物体の表面からのエッジ、欠陥、および/または画像からの他の識別可能な特徴)を抽出するために、コントローラ302により使用される。
【0073】
[0078]特徴抽出層は、特徴ピラミッドネットワーク(FPN)と呼ばれる層からさらに改良される。候補となる関心領域は、領域提案ネットワーク(RPN)と呼ばれる層によって次に決定され、それは、本質的に、塗装不良を含む可能性のあるエリアに対して画像を走査する。これらのエリアは、アンカーと呼ばれ、そのサイズは、訓練中に設定され、またそれらは、前のステップにより抽出された特徴に対して生成される。RPNの本質的な特徴は、元の画像に代えてバックボーン特徴マップを走査することであり、それは冗長なステップを低減する。
【0074】
[0079]あらゆるアンカーに対して、RPNは2つの出力、すなわち、アンカークラスとバウンディングボックス改良とを生成し、それは、第1に、塗装不良がボックス内に存在するかどうかを表し、第2に、塗装不良の位置の改良推定を提供する。多くのアンカーが生成されるので、RPN予測は、考慮すべきアンカーの数を低減することに役立つ。この設定は、関心領域(ROI)と呼ばれ、それは、次のステップに提供されて、各ROIに対して2つの出力を、すなわち、ボックスに対するクラス予測と別の回帰とを生成する。ROI上で動作されるこのステップにおいて、2つのさらなる予測が生成され、すなわち、ROIにおける特徴のクラス(例えば、そのクラスは、特徴が塗装不良であることを示すことができる)、および塗装不良の位置を決定するために使用されるボックス(例えば、4つの座標)である。
【0075】
[0080]言い換えると、FPNおよびRPNは、ResNetアーキテクチャの出力から識別された特徴のいずれかが塗装不良であるかどうかを決定するために、コントローラ302により使用される。さらにFPNとRPNとを使用することにより、コントローラ302は、塗装不良の場所または位置識別子(例えば、4つの座標を有するボックス)を出力することができる。
【0076】
[0081]塗装不良のクラスおよび位置が決定されると、最終ステップは、セグメント化マスクであり、それは、単に、ROI分類器により選択された領域に働くさらなる畳み込みニューラルネットワークである。ネットワークは、ROIにおける各塗装不良に対してマスクを生成する。言い換えると、コントローラ302は、画像内のボックス/塗装不良のピクセルごとの位置を決定するために、セグメント化マスクを使用する。
【0077】
[0082]アンカースケールおよび入力画像寸法から、ネットワークのより微妙なパラメータ(層サイズなど)にわたるいくつかのパラメータが、上記のアルゴリズムにおいて、および先立って選択された最適化アルゴリズムにおいて存在することが明らかになるはずである。
【0078】
[0083]セグメント化タスクは、クラス値を予測することと、ボックスを物体の周囲で回帰させることと、最後に物体の周囲にピクセルごとのマスクを適合させることとを含む。したがって、最小化すべき損失関数(Llot)は、
【0079】
【0080】
として定義されるマルチタスク損失である。
【0081】
[0084]分類およびバウンディングボックス回帰損失は、単に、Faster-RCNNアルゴリズムに従う、すなわち、
【0082】
【0083】
である。
【0084】
[0085]式(2)において、iは、ミニバッチにおけるアンカーのインデックスを示しており、またpiは、アンカーiが塗装不良である予測される確率であり、
【0085】
【0086】
は、正解レベルを示し、アンカーが正(塗装不良を含む)の場合1の値、そうではない場合0の値を取る。分類損失(lcls)は、2つのクラスにわたる2値の交差エントロピー損失(塗装不良に対する非塗装不良)として定義され、一方、回帰損失は、
【0087】
【0088】
として定義され、ここで、Rはロバストな損失関数である。この関数において、tiは、予測されるバウンディングボックスの4つのパラメータ化された座標を表すベクトルであり、
【0089】
【0090】
は、正のアンカーに関連付けられた正解である。分類および回帰損失は、2つのパラメータNclsとNregにより正規化され、最終コストは、バランスパラメータλによって重み付けられる。これらのパラメータは、最小バッチのサイズと、アンカーの数と、それらの比とに依存する。最後に、マスク損失Lmaskを定義するために、まず、各RoIに対して、Mask-RCNNのマスクブランチは、km
2の次元出力を有し、ここでkは、クラスの数であり、またmは、2値マスク(m×m)の解像度であることに留意されたい。この出力に対して、シグモイド関数(f(x)=1/(1+e-x))がピクセルごとに適用される。Lmask対する最終的なコストは、次いで、平均的な2値交差エントロピー損失として定義される。最後に、正解クラスkに関連付けられたRoIに対して、Lmaskが、k番目のマスクに定義される(他のマスク出力は、損失に寄与しない)。
【0091】
[0086]物体検出アルゴリズムに対する最も典型的な性能メトリックは、様々なユニオン交差(IoU)閾値を有するいわゆる平均した平均適合率(mAP)である。IoUは、この文脈では、正解バウンディングボックスと予測されたバウンディングボックスとの間の重複を測定することを指す、2つのバウンディングボックスの間の重複を測定する。BgおよびBpをこのような2つのボックスとする。IoU測定は、
【0092】
【0093】
により計算することができる。IOUを用いると、検出が真陽性(TP)、または偽陽性(FP)であるかを伝えることが可能である。より明示的には、TPは、IoU≧閾値により、その他の場合はFPであると定義され、閾値は、メトリックに応じて設定される。mAPメトリックは、最終的に、適合率-再現率グラフ下でエリアを検討することにより計算される。
【0094】
[0087]上記で説明されたように、自動化された欠陥検出に対する基本的な問題は、様々な環境条件下における画像の良好な品質の可用性である。実際に、欠陥分類に対する上記のアルゴリズムの性能は、取得された画像の品質に依存し得る。この困難さを克服するために、上記では、パターン化された光源を使用することを述べており、検査される表面は、反射されたパターンに基づいて解析される。これらのパターンは、異なる周波数を有する正弦波信号であり得、それは、垂直と水平の両方で生成される。これは、
図5Aおよび
図5Bで示され、上記で述べられている。
【0095】
[0088]走査された表面からのいくつかの反射サンプルが蓄積されると、上記で述べられた塗装不良検出アルゴリズムは、欠陥識別のためにこれらのサンプルを解析する。その欠陥は、これらのサンプル(例えば、取り込まれた画像)のすべてにおいて見ることはできないが、それらは、その少なくともいくつかで視認できる可能性がある。
【0096】
[0089]前述のように、物体検出アルゴリズムの性能に対する標準の測定基準は、mAPスコアである。この性能は、疑陽性の検出能力および最小化に対してさらに焦点が当てられている。いくつかの結果は以下のようになり、すなわち、
図6Aから
図6Lで提示された結果は、ML/AIデータセット112を訓練することによって得られており、2つのタイプの欠陥(粒子および引っかき傷)の検出において、高レベルの精度を達成することができた。
【0097】
[0090]本発明の実施形態は、諸図面および前の記述において詳細に示され、述べられてきたが、このような例および記述は、説明的または例示的なものであり、限定するものと考えるべきではない。変更および修正は、添付の特許請求の範囲内で、当業者により行えることが理解されよう。特に本発明は、上記で、また以下で述べられる異なる実施形態からの特徴の任意の組合せを用いたさらなる実施形態を含む。例えば、運動学的、制御的、電気的、取付け、およびユーザインターフェースサブシステムの様々な実施形態が、本発明の範囲から逸脱することなく、相互に交換可能に使用され得る。加えて、本明細書で行われる本発明を特徴付ける記述は、本発明の実施形態に言及し、必ずしもすべての実施形態に言及するものではない。
【0098】
[0091]特許請求の範囲で使用される用語は、前の記述と一致する最も広い合理的な説明を有すると解釈されるべきである。例えば、要素の導入において、「1つの(a)」または「その(the)」という冠詞を使用することは、複数の要素を除外するものと解釈されるべきではない。同様に、「または」を記載することは、包含的なものであると解釈されるべきであり、したがって、「AまたはB」の記載は、AおよびBの一方だけが意図されていることが、文脈または前の記述から明らかでない限り、「AおよびB」を除外しない。さらに、「A、B、およびCのうちの少なくとも1つ」の記載は、A、B、およびCからなる1群の要素の1つまたは複数のものとして解釈されるべきであり、A、B、およびCがカテゴリとして、またはその他の形で関連するかどうかにかかわらず、列挙された要素A、B、およびCのそれぞれのうちの少なくとも1つを必要とすると解釈されるべきではない。さらに、「A、B、および/またはC」、または「A、B、またはCのうちの少なくとも1つ」の記載は、例えば、Aの、列挙された要素からの任意の単数エンティティを、例えば、AおよびBの、列挙された要素からの任意のサブセットを、または要素A、B、およびCの全体リストを含むものとして解釈されるべきである。
以下に、出願当初の特許請求の範囲に記載の事項を、そのまま、付記しておく。
[1] 物体上の塗装不良を検出するための方法であって、
物体の表面に異なる複数のパターン特性で複数のパターンを投影することと、
前記複数のパターンを投影することに基づき、前記物体の複数の画像を取り込むことと、
前記物体の表面が1つまたは複数の塗装不良を含むかどうかを決定するために、前記物体の前記複数の画像を機械学習モデルに入力することと、
前記複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、前記塗装不良を有する前記画像を表示させることと
を備える方法。
[2] 前記複数のパターンを投影することは、
第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを前記物体上に投影することと、
第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを前記物体上に投影することとを備え、
ここにおいて、前記第1のパターン特性は、前記第2のパターン特性とは異なる、[1]に記載の方法。
[3] 前記複数の画像を取り込むことは、
前記第1の時間インスタンスに、前記第1のパターンを投影することに基づき、1つまたは複数の第1の画像を取り込むことと、
前記第2の時間インスタンスに、前記第2のパターンを投影することに基づき、1つまたは複数の第2の画像を取り込むこととを備え、
ここにおいて、前記複数の画像を前記機械学習モデルに入力することは、前記1つまたは複数の第1の画像と、前記1つまたは複数の第2の画像とを前記機械学習モデルに入力することを備える、[2]に記載の方法。
[4] 前記第1のパターンは水平パターンであり、前記第2のパターンは垂直パターンである、[2]に記載の方法。
[5] 前記第1のパターンは、第1の周波数値に関連付けられ、前記第2のパターンは、前記第1の周波数値とは異なる第2の周波数値に関連付けられる、[2]に記載の方法。
[6] バックエンドサーバから前記機械学習モデルを受け取ることをさらに備え、ここにおいて、前記バックエンドサーバは、1つまたは複数の車両の表面の塗装不良の取り込まれた画像に基づき、前記機械学習モデルを訓練する、[1]に記載の方法。
[7] バックエンドサーバから、一般的な物体検出機械学習モデルを受け取ることと、
塗装不良の取り込まれた画像に基づき、前記機械学習モデルを生成するために、前記一般的な物体検出機械学習モデルを訓練することと
をさらに備える、[1]に記載の方法。
[8] 前記機械学習モデルは、Mask領域ベース畳み込みニューラルネットワーク(Mask-RCNN)を備える、[1]に記載の方法。
[9] 前記機械学習モデルは、残差ニューラルネットワーク(ResNet)を備え、ここにおいて、前記物体の表面が前記1つまたは複数の塗装不良を含むかどうか決定するために前記物体の前記複数の画像を前記機械学習モデルに入力することは、
前記複数の画像から複数の特徴を抽出するために、前記複数の画像を前記ResNetに入力することと、
前記複数の特徴が、前記物体の表面の前記1つまたは複数の塗装不良を示すかどうか決定することと
を備える、[1]に記載の方法。
[10] 前記機械学習モデルは、特徴ピラミッドネットワーク(FPN)と領域提案ネットワーク(RPN)とをさらに備え、ここにおいて、前記複数の特徴が、前記物体の前記表面の前記1つまたは複数の塗装不良を示すかどうかを決定することは、
前記複数の特徴に対して2つの出力を生成するために、前記FPNとRPNとを用いることを備え、ここにおいて、前記2つの出力のうちの第1の出力は、前記複数の特徴からのある特徴が塗装不良であるかどうかを示し、またここにおいて、前記2つの出力のうちの第2の出力は、前記特徴に対する位置識別子である、[9]に記載の方法。
[11] 物体上の塗装不良を検出するためのシステムであって、
物体の表面に異なる複数のパターン特性で複数のパターンを投影するように構成されたパターン投影デバイスと、
前記複数のパターンを投影することに基づき、前記物体の複数の画像を取り込むように構成された画像取込みデバイスと、
制御システムであって、
前記物体の前記表面が1つまたは複数の塗装不良を含むかどうかを決定するために、前記物体の前記複数の画像を機械学習モデルに入力することと、
前記複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、前記塗装不良を有する画像を表示することと
を行うように構成された制御システムと
を備えるシステム。
[12] 前記パターン投影デバイスは、
第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを前記物体上に投影することと、
第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを前記物体上に投影することとにより、前記複数のパターンを投影するように構成され、
ここにおいて、前記第1のパターン特性は、前記第2のパターン特性とは異なる、[11]に記載のシステム。
[13] 前記画像取込みデバイスは、
前記第1の時間インスタンスに、前記第1のパターンを投影することに基づき、1つまたは複数の第1の画像を取り込むことと、
前記第2の時間インスタンスに、前記第2のパターンを投影することに基づき、1つまたは複数の第2の画像を取り込むこととにより、前記複数の画像を取り込むように構成され、
ここにおいて、前記制御システムは、前記1つまたは複数の第1の画像と前記1つまたは複数の第2の画像とを前記機械学習モデルに入力することにより、前記複数の画像を前記機械学習モデルに入力する、[12]に記載のシステム。
[14] 前記第1のパターンは水平パターンであり、前記第2のパターンは垂直パターンである、[12]に記載のシステム。
[15] 前記第1のパターンは、第1の周波数値に関連付けられ、前記第2のパターンは、前記第1の周波数値とは異なる第2の周波数値に関連付けられる、[12]に記載のシステム。
[16] 前記制御システムは、
バックエンドサーバから前記機械学習モデルを受け取るようにさらに構成され、
ここにおいて、前記バックエンドサーバは、1つまたは複数の車両の表面の塗装不良の取り込まれた画像に基づき、前記機械学習モデルを訓練する、[11]に記載のシステム。
[17] 前記制御システムは、
バックエンドサーバから、一般的な物体検出機械学習モデルを受け取ることと、
塗装不良の取り込まれた画像に基づき、前記機械学習モデルを生成するために、前記一般的な物体検出機械学習モデルを訓練することと
を行うようにさらに構成される、[11]に記載のシステム。
[18] 前記機械学習モデルは、Mask領域ベース畳み込みニューラルネットワーク(Mask-RCNN)を備える、[11]に記載のシステム。
[19] 記憶されたプロセッサ実行可能命令を有する非一時的なコンピュータ可読媒体であって、1つまたは複数のコントローラにより実行されたとき、前記プロセッサ実行可能命令が、
物体の表面に複数の異なるパターン特性で複数のパターンを投影することと、
前記複数のパターンを投影することに基づき、前記物体の複数の画像を取り込むことと、
前記物体の前記表面が、1つまたは複数の塗装不良を含むかどうかを決定するために、前記物体の前記複数の画像を機械学習モデルに入力することと、
前記複数の画像のうちのある画像が塗装不良を含むと決定したことに基づき、前記塗装不良を有する前記画像を表示させることと
を促進する、非一時的なコンピュータ可読媒体。
[20] 前記複数のパターンを投影することは、
第1の時間インスタンスに、第1のパターン特性を有する第1のパターンを前記物体上に投影することと、
第2の時間インスタンスに、第2のパターン特性を有する第2のパターンを前記物体上に投影することとを備え、
ここにおいて、前記第1のパターン特性は、前記第2のパターン特性とは異なる、[19]に記載の非一時的なコンピュータ可読媒体。