特許第6967060号(P6967060)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コグネックス・コーポレイションの特許一覧

特許6967060複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法
<>
  • 特許6967060-複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法 図000002
  • 特許6967060-複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法 図000003
  • 特許6967060-複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法 図000004
  • 特許6967060-複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法 図000005
  • 特許6967060-複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法 図000006
  • 特許6967060-複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6967060
(24)【登録日】2021年10月26日
(45)【発行日】2021年11月17日
(54)【発明の名称】複数のパターン認識及び登録ツールモデルをトレーニングするための半教師付き方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20211108BHJP
【FI】
   G06T7/00 300
   G06T7/00 350B
【請求項の数】8
【外国語出願】
【全頁数】12
(21)【出願番号】特願2019-222530(P2019-222530)
(22)【出願日】2019年12月9日
(62)【分割の表示】特願2016-110432(P2016-110432)の分割
【原出願日】2014年5月28日
(65)【公開番号】特開2020-53084(P2020-53084A)
(43)【公開日】2020年4月2日
【審査請求日】2020年1月7日
(31)【優先権主張番号】61/841,142
(32)【優先日】2013年6月28日
(33)【優先権主張国】US
(31)【優先権主張番号】13/955,120
(32)【優先日】2013年7月31日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】504382671
【氏名又は名称】コグネックス・コーポレイション
(74)【代理人】
【識別番号】100119378
【弁理士】
【氏名又は名称】栗原 弘幸
(72)【発明者】
【氏名】サイモン バーカー
(72)【発明者】
【氏名】デイヴィッド ジェイ.マイケル
【審査官】 千葉 久博
(56)【参考文献】
【文献】 特開2010−205007(JP,A)
【文献】 特開2002−269560(JP,A)
【文献】 特開平6−95685(JP,A)
【文献】 特開平6−76068(JP,A)
【文献】 特開平4−67277(JP,A)
【文献】 特表2010−511938(JP,A)
【文献】 米国特許出願公開第2009/0290788(US,A1)
【文献】 大澤翔吾, 外1名,“クラウドソーシングによる食事画像認識モデルの自動構築”,第5回データ工学と情報マネジメントに関するフォーラム (第11回日本データベース学会年次大会),日本,2013年05月31日
【文献】 Luosi WEI, 外1名,"Visual Location System for Placement Machine Based on Machine Vision",2008 Fifth IEEE International Symposium on Embedded Computing,2008年10月06日,p.141-146
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
出力されるマルチモデルのトレーニング方法であって、
トレーニングされるべきパターンを規定する領域を有する複数のトレーニング画像を提供するステップであって、前記複数の画像は前記複数のトレーニング画像を含むデータベースから提供される前記提供するステップと、
前記複数のトレーニング画像と前記領域を用いて第1のパターン合成モデルをトレーニングし、このトレーニングされた第1のパターン合成モデルを出力されるマルチモデルに追加するステップと、
残りのトレーニング画像の各々をベースライン画像として用いること及び前記残りのトレーニング画像の各々についてのスコアを保存することによって前記残りのトレーニング画像にわたって反復するステップであって、このステップによって前記トレーニング画像について
(i) 候補パターンモデルがトレーニングされ、
(ii) 前記第1のパターン合成モデルと前記候補パターンモデルとの結合が前記データベース内の前記残りのトレーニング画像にわたって採点される、前記反復するステップと、
高得点の1以上の前記候補パターンモデルを出力されるマルチモデルに追加するステップと、
を含む、上記方法。
【請求項2】
前記第1のパターン合成モデルのトレーニングは、第1セットのパターン認識及び登録トレーニングパラメータに従って実行され、前記候補パターンモデルのトレーニングは第2セットのパターン認識及び登録トレーニングパラメータに従って実行される、請求項1に記載の方法。
【請求項3】
前記候補パターンモデルは、トレーニングすべき前記第1のモデルを用いて候補領域を生成する際に自由度を緩和し、次いで前記候補パターンモデルが実行される際にメトリックが改善されたか否か判定するために自由度を強化することによってトレーニングされる、請求項1に記載の方法。
【請求項4】
前記第1のパターン合成モデルのトレーニングはパターンの原点に基づいている、請求項1に記載の方法。
【請求項5】
前記高得点の候補パターンモデルは、前記出力されるマルチモデルに可能な追加が行われる前に、最初にユーザに提示されて容認又は否される、請求項1に記載の方法。
【請求項6】
ユーザが、追加のパターンの原点を前記出力されるマルチモデルに追加する前に修正してもよい、請求項1に記載の方法。
【請求項7】
前記(i)のトレーニング及び(ii)の採点は繰り返し反復的であり、それによって前記出力されるマルチモデルが複数の合成モデルを含むことを可能にする、請求項1に記載の方法。
【請求項8】
パターン認識及び登録モデルを生成するためのシステムであって、前記システムはコンピュータ実行可能な命令が格納されたメモリを備え、前記メモリには複数のトレーニング画像を含むデータベースが含まれ前記トレーニング画像のうちの少なくとも1個の画像はトレーニングされるべきパターンを規定する領域を有し、
前記システムは1以上のプロセッサを備え、前記命令が実行されるとき前記プロセッサは:
前記複数のトレーニング画像にわたって初期パターン認識及び登録モデルを反復し、得点、姿勢及びトレーニングされたモデルを提供すべきマッチング領域データを保存することによって前記初期パターン認識及び登録モデルをトレーニングし;かつ
トレーニングされたモデルの性能を前記複数のトレーニング画像にわたって測定する;
ように構成されている、上記システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連する出願
本出願は、2013年6月28日に出願された米国仮出願第61/841142号、名称「複数のPATMAXモデルをトレーニングするための半教師付き方法」の優先権を主張するものであり、その全体は参照により本明細書に編入される。
【0002】
本発明は、カメラ又はその他の撮像装置を用いて対象物の画像が取得され、画像内のターゲットパターンの位置特定が撮像されている対象物上のパターンの位置特定に対応しているマシンビジョンに関する。
【背景技術】
【0003】
マシンビジョンシステムの課題は、これらをユーザにとって使いやすく、より広範な潜在的ユーザに近づきやすいものにすることである。ユーザが明確に理解している側面は確かにある(例えばトレーニング画像のセットをどのように生成するか、及び状況のグラウンドトゥルースとは何か)。しかしながらそれ以上にマシンビジョンシステムのトレーニングと実行時動作の多くの側面は、適用するのがより困難である。
【0004】
カメラ又はその他の撮像装置を用いて対象物の画像が取得され、コンピュータ又はその他の計算装置で実行される方法を用いて撮像されている対象物上のパターン位置が特定されるマシンビジョンにおいて。ターゲットパターンの少なくとも1つのインスタンスを含む画像のセットが与えられ、しかも当該ターゲットパターンの外観が変動することがある場合は、当該画像セット内のすべての画像に適用可能なパターン認識及び登録モデルの最小限のセットを特定してトレーニングすることが課題となり得る。パターン認識及び登録手順は米国特許第6,408,109号;6,658,145号;及び7,016,539号により詳細に説明されており、その開示内容は有用な背景情報として参照により本明細書に編入される。パターンが認識されたら、パターン認識及び登録手順(又は「ツール」)は、見られているパターンが、実際に、ツールがサーチしてその位置、向き、スケール、スキュー及びアスペクトを固定するパターンであることを確認する。このようなサーチツールの一例は、米国マサチューセッツ州ネイティック市のコグネックス株式会社から出ている製品PatMax(R)である。パターン認識及び登録手順は、ジオメトリックパターン検出の方法である。本明細書で記述する方法は、概してジオメトリックパターン検出に適用する。
【0005】
例えば、パターンは円と線を含む要素から成っていてもよい。図1を参照すると、パターン110は円112と2本の交差する線114、116を含み、パターン120は円122と1対の線124、126を含み、パターン130は円132と1対の線134、136を含んでいる。トレーニングされた画像の画像セットにわたって、円は半径が変動し、線は太さ又は数が変動することがある。これは特に基体上に複数の層が積層される半導体又はその他の材料の分野で見られ、各層における特徴の歪みを招く可能性がある。パターンの極性も画像セットを通して変化することがある(パターン120とパターン130の差異として示されている)。画像は高いノイズを含むこともある。
【0006】
この問題は少なくとも2つの構成要素を有する。第1に、トレーニング画像セットはノイズの多い画像から成るので単一の画像からクリーンなモデルをトレーニングすることは難しい。第2に、パターンはトレーニングセットにおいて異なる外観を持ち、そのことが単一モデルのトレーニングを困難にすると共に実行時にエラーが起こりやすくする。
【発明の概要】
【0007】
先行技術の短所を克服するために、本明細書に記載のシステム及び方法はパターン認識及び登録モデルを用いてトレーニングを行う。例示的に、パターン検出モデルは、複数のトレーニング画像からトレーニングされた単一のモデルである。幾つかの実施形態において、合成モデルを使用してロバスト性を標準パターン認識及び登録モデルに比べて改善し、及び/又はターゲット領域の外観における小さい差異をモデル化する。ロバスト性を改善するために、合成モデルは単一の基本的パターンのインスタンスを示すノイズの多い(または別様に歪んだ)トレーニング画像からデータを結合して単一のロバストなモデルを形成する。これを達成するために、パターン認識及び登録モデルを用いるトレーニングエレメントは、入力された画像と既知の相対的位置又は姿勢(これは人が特定するかコンピュータが判定する)を使用する。
【0008】
ターゲット領域の外観における小さい差異を把握するために、トレーニングセット内のターゲットパターンの外観の全範囲(又は少なくとも全範囲の大部分)に及ぶパターン認識及び登録モデルのセットをトレーニングするトレーニング方法が採用される。パターン認識及び登録モデルのセットは、パターンモデルの別個のインスタンスとして、又はパターンマルチモデルとして出現し得る。パターンマルチモデルはパターン認識及び登録モデルオン集合である。基礎モデルは、標準パターン認識及び登録モデル、又は合成パターンモデル、又は両者の結合であってもよい。パターンマルチモデルは、外観が顕著に変動するターゲットのモデル化で使用するためのものである。マルチモデルは、実際にあり得そうな時系列モデルの外観の予備知識を利用するために種々のモードで実行することができる。複数のパターンモデルをパターンマルチモデルフレームワークに組み入れることによりフロントエンド処理の量を減らすことができ、それによって、別個のパターンモデルインスタンスを実行することに比べて増分性能利得が可能になる。パターンマルチモデルはそのコンポーネントモデルからの結果を検査してオーバーラップについてフィルターをかけることができ、例えば2個のモデルからの結果がユーザの指定する閾値より多くオーバーラップしていないか検査し、次にパターンマルチモデルはより良好なマッチ(又はより高い得点)結果のみをユーザに戻すことができる。
【0009】
以下に、本発明を添付の図面を参照して説明する。
【図面の簡単な説明】
【0010】
図1図1は、既に述べたように、それぞれパターン認識及び登録手順に従い1つのパターンを含む3個の模範的な画像を示す。
【0011】
図2図2は、例示的な実施形態により本発明の原理を実施するための模範的なマシンビジョンシステムの概略的なブロック図である。
【0012】
図3図3は、例示的な実施形態により単一のパターン認識及び登録モデルをトレーニングするための手順のフローチャートである。
【0013】
図4図4は、例示的な実施形態によりパターンマルチモデルをトレーニングし、現在トレーニングされて出力されるモデルの性能を測定するための手順のフローチャートである。
【0014】
図5図5は、例示的な実施形態により出力されるモデル集合に追加するための候補の提案及びランク付けの手順のフローチャートである。
【0015】
図6図6は、例示的な実施形態により最高得点の候補をユーザに提案し、パターンマルチモデルを出力する手順のフローチャートである。
【発明を実施するための形態】
【0016】
図2は、例示的な実施形態により本発明の原理を実施するために用いられ得るマシンビジョンシステム200の概略的なブロック図である。マシンビジョンシステム200は、1以上の特徴215を有する対象物210の画像を生成する撮像装置205を含んでいる。撮像装置205は慣用的なビデオカメラ又はスキャナを備えていてもよい。そのようなビデオカメラは電荷結合素子(CCD)、又は適当な画像情報を取得するためのその他のシステム、例えばよく知られたCMOSセンサであってもよい。撮像装置205によって生成される画像データ(又はピクセル)は、画像強度、例えばシーン内の各点色又は輝度を撮像装置205の解像度の範囲内で表す。撮像装置205は通信パス220を介してデジタル画像データを画像分析システム225に伝送する。画像分析システム225は、慣用的なデジタルデータプロセッサ、例えばコグネックス社から市販されているタイプの視覚処理システムを備えていてもよい。画像分析システム225は、慣用的なマイクロコンピュータ又はその他の例示的な計算装置を備えていてもよい。例えばパーソナルデジタルアシスタント(PDA)等を含む他の形態のインタフェースを利用することができる。代替的な実施形態において、撮像装置は分析システムの機能を実行するための処理能力を含んでいてもよい。そのような実施形態では別個の画像分析システムの必要はない。更に代替的な実施形態において、撮像装置はトレーニング目的のために画像分析システムと相互に動作接続されてもよい。トレーニングが行われたら、1以上の適当なモデルは実行時に使用するために撮像装置に保存できる。
【0017】
画像分析システム225は、本発明の教示に従い、複数の画像間に類似の特徴を検出してマシンビジョンシステムをトレーニングするための適当な認識及び登録情報を生成するようにプログラムされ得る。画像分析システム225は1以上の中央処理ユニット(プロセッサ)230、主メモリ235、入力/出力システム245、及び1以上のディスクドライブ、又は他の形態の大容量記憶装置240を有していてもよい。例示的に、入力/出力システム245は通信パス220によって撮像装置205と画像分析システム225とを相互接続する。システム225は、本発明の教示に従いプログラミング命令によって本発明の新規のマルチ画像トレーニングされたパターン認識及び登録を実行するように設定できる。当業者によって理解されるように、本発明の原理を実装するために代替的なハードウェア及び/又はソフトウェア設定を利用することができる。具体的には、本発明の教示はソフトウェア、ハードウェア、ファームウェア及び/又はそれらの組み合わせにおいて実装され得る。更に、トレーニング時とは対照的に、実行時にはマシンビジョンシステム200に追加のコンポーネントを含めることができる。例えば、対象物215はコンベヤベルト又はその他の組立ライン機器等によって搬送されてもよい。
【0018】
本発明の例示的な実施形態により、マシンビジョンシステム200を利用して実行時マシンビジョンシステムのためのトレーニングモデルを生成できる。従って、マシンビジョンシステム200を利用して、類似のコンポーネントを用いる複数のマシンビジョンシステムで使用可能なトレーニングモデルを生成できる。
【0019】
更に、本明細書で図示及び説明されるパターンエレメント(又はパターン認識及び登録要素)、並びにそれらと関連するモデルは、概して画像分析システム225の内部にあることに留意すべきである。しかしながら、エレメント及びモデルの配置と保存は、通常技術の範囲内で大いに変更させ得る。
【0020】
本発明はマシンビジョンシステム200の観点から説明されているが、本発明の原理は種々異なる実施形態で利用できることに留意すべきである。例えばマシンビジョンシステムという用語は、代替的なシステムを含むものとして受け取られるべきである。より一般的に、本発明の原理は画像中のサブパターンを登録する任意のシステムに実装させることができる。例えば1実施形態では、画像等を処理するようにプログラムされたスタンドアロン型コンピュータと相互に動作接続されたスタンドアロン型カメラから成る慣用的なマシンビジョンシステムを含んでいてもよい。しかしながら、本発明の原理は画像中のサブパターンを登録するその他の装置及び/又はシステムで利用できる。例えば、コグネックス社から発売されている製品チェッカ等のビジョンセンサ、又は画像取得能力及び/又は処理能力を有するその他の装置である。そのようなビジョンセンサは、コグネックス社製ビジョンビュー等の別個のモジュールを介してトレーニングされ、及び/又は、設定され得る。そのような実施形態において、ユーザは単一の部分の代わりに複数の部分を用いてビジョンセンサをトレーニングできる。ユーザは第1の部分を選択して、それをセンサの前に置き、トレーニング部分が位置決めされたことをシステムに示す。第2(第3等々)の部分も同様にトレーニングできる。ユーザは、例えばグラフィカルユーザインタフェース(GUI)及び/又はボタン、あるいは、トレーニングモジュール及び/又はビジョンセンサ自体に配置されたその他のコントロールサーフェスを用いてトレーニングステップを制御できる。更に、本発明の機能性は手持ち装置や、互換性のあるワイヤレス装置等に組み入れることができる。そのようなものとしてマシンビジョンシステムという用語は広く解釈して、本発明の1以上の教示を利用するシステム及び装置を包含すべきである。
【0021】
単一のパターン認識及び登録モデルのトレーニング
【0022】
例示的な実施形態により、パターン認識及び登録モデルは複数の画像からトレーニングされる。単一のパターン認識及び登録モデルのトレーニングのより詳細な説明は、例えば米国特許第8,315,457号を参照することとし、その開示内容は有用な背景情報として参照により本明細書に編入される。合成モデルは、ロバスト性を標準パターンモデルに比べて改善するために、又はターゲット領域の外観における小さい差異をモデル化するために使用できる。本明細書で実装されるトレーニングエレメントは、1組のトレーニング画像におけるターゲットパターンの外観の全範囲に及ぶ、パターン認識及び登録モデルのセットをトレーニングする。このモデルのセットは、単一のパターン認識及び登録モデル、又は本明細書でパターン「マルチモデル」エレメントと呼ばれるモデルの集合であってもよい。マルチモデルエレメントは、外観が顕著に変動するターゲットのモデル化で使用するためのものである。マルチモデルは、実際にあり得そうな時系列モデルの外観の予備知識を利用するために種々のモードで実行することができる。
【0023】
本明細書で用いられる「トレーニングエレメント」(又はトレーニングモジュール)という用語は、トレーニングモデルの生成において実行されるステップの非一時的な実施形態を表す。トレーニングエレメントは、特定のタスクのみ実行するように設計された1つの(又は幾つかの)ルーチン又は機能を含む非一時的なコンピュータプログラムの部分である。本明細書で図示及び説明される各エレメント(又はモジュール)は、マシンビジョンシステム内部で単独で又は他のモジュールと組み合わせて使用できる。トレーニングエレメントは、データベースに保存されているトレーニング画像の全範囲に及ぶ1組のモデルをトレーニングすることによってトレーニングモデルを作成する。加えて、本明細書で用いられる「パターン認識及び登録モデル」又は「パターンモデル」という用語は、別途注記しない限り、概して米国特許第8,315,457号で開示されているパターンモデルを表す。
【0024】
ここで図3を参照すると、例示的な実施形態により単一のパターン認識及び登録モデルをトレーニングするためのトレーニングエレメントによって実行される手順300のフローチャートが示されている。ステップ310では、アルゴリズム(ユーザ又はコンピュータにより提供されてもよい)に対する初期入力は、初期トレーニング画像とトレーニングされるべきパターンを規定する領域(「関心のある領域」)であり、これもユーザ又はコンピュータにより提供されてもよい。手順300はこの入力を受け取り、ステップ320で325でのトレーニングパラメータを用いて第1の(初期)パターン認識及び登録(「PatMax」)モデル(P)をトレーニングする。次にステップ330で、システムが画像セット(少なくとも残りのトレーニング画像の一部又はサブセット)にわたってパターンモデルPの実行を反復する。この画像セットはユーザ又はコンピュータにより提供され、以前にデータベースに保存されたものである。システムは残りの全トレーニング画像セット又は残りの画像セットの一部でモデルを反復でき、結果得点、姿勢及びマッチング領域データを保存する。ステップ340で、結果は得点順(グラウンドトゥルースデータが利用できる場合は精度順)にソートされる。グラウンドトゥルースはユーザにより供給されてもよいし、あるいは、コンピュータにより生成されてもよい。ステップ350で、手順はトップ画像(N−1)(Nは、合成モデルトレーニングに入力される画像数を規定するパラメータ)を入力し、ステップ360で、以前にPの実行において生成された結果からの姿勢及び領域情報を用いて合成モデルをトレーニングする。
【0025】
参照することにより本明細書に有用な背景情報として編入される米国特許第8,315,457号により詳細に説明されているように、パターン認識及び登録のためにマルチ画像トレーニングが実行される。マシンビジョンシステムは複数(「N」)のトレーニング画像を取得する。1個の画像が選択されると、その他の(N−1)画像は実質的にこの選択された画像に登録される。この選択と登録が反復されて、N個の画像の各々はベースライン画像として利用される。ベースライン画像としてN個の画像の各々について反復することにより、この手順は対応付けられた特徴のデータベースを構築するが、これは画像間で安定している特徴のモデルを形成する際に利用することができる。次に1組の対応する画像特徴を表す特徴がモデルに追加される。対応付けられた特徴のデータベースを形成するために、各々の特徴は境界検査ツール又はマシンビジョンシステム内の輪郭と対応させる他の慣用的な技術を用いて対応付けることができる。例示的に、モデルのために選択される特徴は、特徴が現れる各々の画像で対応する特徴間の最大距離を最小化するものである。モデルに追加される特徴は、特徴が現れる各々の画像からの特徴の平均を含んでいてもよい。プロセスは、閾値要件を満たすすべての特徴が把握されるまで継続する。このプロセスの結果生じるモデルは、少なくとも閾値であるN個のトレーニング画像で検出される安定した特徴を表す。このプロセス(米国特許第8,315,457号で開示)は、それらが安定した特徴であるというトレーニング画像の証拠によって充分支持される特徴を特定する。次にモデルは、アラインメント、サーチ又は検査ツールを特徴のセットでトレーニングするために使用できる。
【0026】
再び図3を参照すると、ユーザは追加の合成モデルトレーニングパラメータ355を供給できるが、これはNトレーニング画像のどの分画が出力モデルに含まれるべき当該画像に特有の特徴を備えなければならないかを規定する。例示的に、この分画は80%〜90%等のパーセンテージであってもよいが、具体的な応用に応じて通常技術の範囲内で大いに変わり得る。ユーザはまたマッチとみなされるべき異なるトレーニング画像からの特徴に対して近接閾値も規定できる。
【0027】
パターン認識及び登録マルチモデルのトレーニング
【0028】
ここで図4を参照すると、例示的な実施形態によりパターン認識及び登録マルチモデルをトレーニングし、現在トレーニングされて出力されるモデルの性能を測定するための手順400のフローチャートが示されている。ステップ410で、この手順に対する初期入力(通常はユーザから提供されるが、コンピュータにより提供されてもよい)は、トレーニング画像(I)、R画像I内のパターンの範囲を規定する領域、トレーニング画像I内のパターン(O)の原点、及び関心のあるパターンの外観の範囲を示す1組のトレーニング画像{I,I,…,I}である。
【0029】
この手順はステップ420でこれらの入力を使用して、上に図3で単一のパターン認識及び登録モデルのトレーニングについて説明した手順を用いて合成モデルパラメータ422に従い第1の「PatMax」パターン合成モデル(PCMOUT)をトレーニングする。トレーニングパラメータ424は出力されるモデル(TPOUT)のトレーニングで使用され、トレーニングされたモデルがトレーニング画像の全セットにわたる探索で高得点の誤った検出を生じないことを保証するために充分制限的である。パターン認識及び登録マルチモデルフレームワークを用いる場合、PCMOUTは出力されるマルチモデルPMMOUTに追加される。マルチモデルフレームワークを用いなければ、PCMOUTは出力されるセットの第1のパターン認識及び登録モデル(これは既述目的のためにPMMOUTとも呼ばれる)として保存される。
【0030】
次に、ステップ430ではこの手順は、同じ(410からの)入力を使用して異なる(第2の)パターン認識及び登録モデルPCMCANDを、図3で単一のパターン認識及び登録モデルについて示した上述のアルゴリズムを用いてトレーニングする。このプロセスで用いられるパターントレーニングパラメータTPCAND434は、専ら更に出力される合成モデルのトレーニング用の候補の検出に使用されるモデルをトレーニングするためのパラメータである。これらのトレーニングパラメータ434は、出力されるモデルを生み出すのに使用されるパラメータよりも緩やかでなければならない。ここで前提とされねばならないのは、PCMCANDはより制限的にトレーニングされたPCMOUTを用いた場合に可能なものよりも多様なトレーニング候補の範囲を提案できるが、誤った検出はユーザによって拒否され、又は自動的に既知のグラウンドトゥルースに準拠され得ることである。出力されるモデルに関しては、PCMCANDはパターン認識マルチモデルPMMCANDに追加されてもよいし、他のタイプのモデル集合に保存されてもよい。
【0031】
性能測定
【0032】
ステップ440で、パターン候補を検出して、「最良」(最高得点又はマッチ)とみなされる候補をトレーニングするプロセスを開始する前に、システムは最初に現在トレーニングされて出力されるモデル、即ちPMMOUTの性能を測定しなければならない。性能を測定するために、この手順は画像の全テストセットにわたってモデルを実行し、0に初期化された複合得点を計算する。PMMOUTがユーザの定義する信頼度閾値より大きい得点を有する画像(得点範囲は0〜1)中にパターンを検出したら、当該得点は複合得点に加算される。しかしながらPMMOUTがユーザの定義する信頼度閾値より大きい得点を有する画像中にパターンを検出できなければ、複合得点から1が減算される。その他の類似の採点機能も当業者によって実装されることができ、グラウンドトゥルースデータが利用できる場合はアラインメント精度の測定を組み入れてもよい。
【0033】
性能測定の後、手順の残りのステップは繰り返し反復されてよく、その場合は変数「t」で表される。ここで、例示的な実施形態により候補モデルを提案するための手順のフローチャートを示す図5及び図6を参照する。図5を参照すると、手順500は出力されるモデル集合PMMOUT(t)に追加するための候補を提案及びランク付けするためのものである。510で、反復(t)に対する入力は候補PMMCAND(t)及び出力マルチモデルPMMOUT(t)を含み、ここで、
PMMCAND(t)は、{PCMCAND(0)、PCMCAND(1)、
…、PCMCAND(t)}を含み、
PMMOUT(t)は、{PCMOUT(0)、PCMOUT(1)、…
、PCMOUT(t)}を含む。
【0034】
この手順のステップ520で、候補マルチモデルPMMCANDは出力されるモデル集合PMMOUT(t)に追加するための候補を提案及びランク付けする。これを達成するために、候補パターンマルチモードPMMCAND(t)が各トレーニング画像Iで実行される。容認可能な結果が戻されたら(即ちモデル得点がユーザの定義する容認閾値より高い位置が検出されたら)、ステップ520でマッチング領域R及び/又は原点Oを使用して候補パターン合成モデルPCMOUT(i)(上でPMMOUT(t)に対する単一のモデルのトレーニングについて説明されたように)をトレーニングする。それゆえ候補合成モデルは、画像Iの候補領域Rと、当該候補画像領域(画像IのR)の最良マッチングN−1画像の対応する領域からトレーニングされる。
【0035】
ステップ530で、この手順は候補パターン合成モデルのセットを通して反復し、各々について最初に出力される集合に追加してPMMOUT(t)→PMMOUT(t)’となり、次いでその性能を上で性能測定について説明したのと同じ仕方で測定する。得点を獲得して出力されるマルチモデルPMMOUT(t)’に拡張することが提案された後、PCMOUT(i)が取り除かれてPMMOUT(t)’→PMMOUT(t)となる。ステップ534で、これらの得点に従って、候補がソートされる(即ちPCMOUT(i))。
【0036】
手順500の最後に、ステップ540でシステムは、PMMCAND(t)が容認可能な結果を検出し得る場合にはすべてのトレーニング画像をカバーする候補パターン合成モデルの集合を持つ。この手順はこれらのモデルを、それぞれ出力されるパターンモデル集合(又はマルチモデル)PMMOUT(t)にどの程度のカバレッジの改善を提供するかに応じてランク付けする。ユーザの定義する量より多く得点を改善する候補が検出されなければ、停止基準が満たされたとみなされ得る。
【0037】
ここで例示的な実施形態により候補モデルを提案し、パターンマルチモデルを出力するための手順600を示す図6を参照する。ステップ620で、この手順はユーザに最高得点候補を(例えば候補画像I内の候補の関心のある領域を表示することによって)提案する。ステップ622で、ユーザは候補を容認又は拒否でき、又は等価的にコンピュータに最高得点候補が提示されてよく、コンピュータは既知のグラウンドトゥルースに基づいて候補を容認又は拒否する。候補が容認されたら、ステップ630で、PMMCAND(t)の出力に僅かなアラインメント誤差がある場合に、ユーザは新しいモデルの原点を調整する機会が与えられ得る。ステップ624で候補が拒否されたら、トップ候補PCMOUT(top)は捨てられ、システムは順序付きリストにおける次の候補を提案する。
【0038】
候補が容認されたら、ステップ640で容認された候補モデルPCMOUT(accepted)が現在の出力モデル集合に追加されてPMMOUT(T)→PMMOUT(t+1)となる。このとき候補検出モデル集合(又はマルチモデル)は好ましくは類似のモデルで更新されるべきである。ステップ650で、候補モデルPCMCAND(accepted)は、トレーニングパラメータTPCANDを用いて画像I(accepted)の領域Racceptedからトレーニングされる。次にステップ660でPCMCAND(accepted)が追加されてPMMCAND(t)→PMMCAND(t+1)となる。ステップ670で反復(t)に出力されるのは、候補マルチモデルPMMCAND(t+1)及び出力マルチモデルPMMOUT(t+1)である。
【0039】
種々の例示的な実施形態は、複数のトレーニング画像の各トレーニング画像にわたって反復されるパターン認識及び登録モデルン生成を提供して、トレーニング画像の全データベースに及ぶ(即ち有効な)モデルを提供する。これは実行時システムのロバスト性及び効率を改善する。
【0040】
以上にて、本発明の例示的な実施形態を詳細に説明した。本発明の精神と範囲から逸脱することなく種々の修正及び追加を行うことができる。上述した種々の実施形態の各々の特徴は、関連する新しい実施形態において複数の特徴の組合せを提供するために、必要に応じて説明された他の実施形態の特徴と組み合わすことができる。更に、以上では本発明の装置及び方法の幾つかの別個の実施形態が記述されているが、本明細書で記述されているものは本発明の原理の応用の例示に過ぎない。例えば本明細書で用いられる「プロセス」及び/又は「プロセッサ」という用語は、機能及びコンポーネントに基づき多様な電子的ハードウェア及び/又はソフトウェアを含むために広く理解されるべきである。本明細書で使用される様々な方向および/または向きを表わす用語、例えば、「垂直」、「水平」、「上」、「下」、「底部」、「頂部」、「側部」、「前部」、「後部」、「左」、「右」およびこれに類するものは、相対的な表現法として用いられているに過ぎず、重力等の固定した座標系を基準とした絶対的な向きを表わすものではない。更に、表現されたプロセス又はプロセッサは他のプロセス及び/又はプロセッサと組み合わされ、又は種々のサブプロセス又はプロセッサに分割されてもよい。そのようなサブプロセス及び/又はサブプロセッサは本明細書に記載された実施形態に従って種々に組み合わせることができる。同様に、本明細書に記載された機能、プロセス及び/又はプロセッサは、プログラム命令の非一時的コンピュータ可読媒体から成る電子的ハードウェア及びソフトウェア、又はハードウェアとソフトウェアの組み合わせを用いて実装され得ることが明確に考えられている。更に、タスクを処理する一部又はすべてのビジョンシステムは、有線又は無線通信(ネットワーク)リンクを介してメインモジュールとインタフェースモジュールを通して作動的に結合されているメインモジュール又は遠隔プロセッサ(例えばサーバ又はPC)において実行され得ると考えられている。従って、以上の説明は単なる例示として受け取られるべきであり、本発明の範囲を別途制限するものではない。
図1
図2
図3
図4
図5
図6