(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024070210
(43)【公開日】2024-05-22
(54)【発明の名称】イメージのオブジェクトを分類する分類方法及び分類装置
(51)【国際特許分類】
G06T 7/00 20170101AFI20240515BHJP
【FI】
G06T7/00 350B
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2023111916
(22)【出願日】2023-07-07
(31)【優先権主張番号】10-2022-0149282
(32)【優先日】2022-11-10
(33)【優先権主張国・地域又は機関】KR
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
(71)【出願人】
【識別番号】390019839
【氏名又は名称】三星電子株式会社
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
【住所又は居所原語表記】129,Samsung-ro,Yeongtong-gu,Suwon-si,Gyeonggi-do,Republic of Korea
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】金 基京
(72)【発明者】
【氏名】白 智原
(72)【発明者】
【氏名】安 燦鎬
(72)【発明者】
【氏名】韓 承周
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA03
5L096DA02
5L096HA09
5L096HA11
5L096KA04
5L096KA15
5L096MA07
(57)【要約】
【課題】イメージのオブジェクトを分類する分類方法及びそれを行う分類装置が開示される。
【解決手段】分類方法は、入力イメージを受信する動作、入力イメージが入力された分類モデルから入力イメージ内のオブジェクトに対するクラス予測値を取得する動作、クラス予測値に基づいて予測一貫性値を決定する動作、決定された予測一貫性値に基づいてオブジェクトに対応するクラスタイプを決定する動作、及び決定されたクラスタイプに対応するクラス予測モデルを用いてオブジェクトのクラスを決定する動作を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
イメージのオブジェクトを分類する分類方法であって、
入力イメージを受信する動作と、
前記入力イメージが入力された分類モデルから前記入力イメージ内のオブジェクトに対するクラス予測値を取得する動作と、
前記クラス予測値に基づいて予測一貫性値を決定する動作と、
前記予測一貫性値に基づいて前記オブジェクトに対応するクラスタイプを決定する動作と、
前記決定されたクラスタイプに基づいて前記オブジェクトのクラスを決定する動作と、
を含み、
前記オブジェクトのクラスを決定する動作は、
前記オブジェクトのクラスタイプが多数派クラスに対応する場合、多数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作と、
前記オブジェクトのクラスタイプが少数派クラスに対応する場合、少数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作と、
を含む、分類方法。
【請求項2】
前記予測一貫性値を決定する動作は、
前記分類モデルから取得された前記クラス予測値のうち最も頻度数の多いモードクラス予測値を決定する動作と、
前記クラス予測値と前記モードクラス予測値との間のマッチング頻度に基づいて前記予測一貫性値を決定する動作と、
を含む、請求項1に記載の分類方法。
【請求項3】
前記予測一貫性値を決定する動作は、前記クラス予測値と前記モードクラス予測値との間のマッチング頻度を前記クラス予測値の全体個数で割ることによって前記予測一貫性値を決定する動作を含む、請求項2に記載の分類方法。
【請求項4】
前記クラスタイプを決定する動作は、前記予測一貫性値及び閾値に基づいて前記オブジェクトに対応するクラスタイプを前記多数派クラス又は前記少数派クラスとして決定する動作を含む、請求項1に記載の分類方法。
【請求項5】
前記クラスタイプを決定する動作は、
前記予測一貫性値が前記閾値よりも大きいことに応答して、前記オブジェクトに対応するクラスタイプを前記多数派クラスとして決定する動作と、
前記予測一貫性値が前記閾値よりも大きくないことに応答して、前記オブジェクトに対応するクラスタイプを前記少数派クラスとして決定する動作と、
を含む、請求項4に記載の分類方法。
【請求項6】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトが前記多数派クラスに対応する場合、前記分類モデルのアンサンブルモデルを前記多数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する動作を含む、請求項1に記載の分類方法。
【請求項7】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトが前記多数派クラスに対応する場合、前記分類モデルの中から選択されたターゲット分類モデルを前記多数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する動作を含む、請求項1に記載の分類方法。
【請求項8】
前記オブジェクトのクラスを決定する動作は、前記分類モデルの学習過程で前記多数派クラスに対して最も優れた分類性能を示した分類モデルを前記ターゲット分類モデルとして選択する動作を含む、請求項7に記載の分類方法。
【請求項9】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトが前記少数派クラスに対応する場合、前記分類モデルの中から選択されたターゲット分類モデルを前記少数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する動作を含む、請求項1に記載の分類方法。
【請求項10】
前記オブジェクトのクラスを決定する動作は、前記分類モデルの学習過程で前記少数派クラスに対して最も優れた分類性能を示した分類モデルを前記ターゲット分類モデルとして選択する動作を含む、請求項9に記載の分類方法。
【請求項11】
前記分類モデルは、同じ学習データセットに対して互いに異なる学習回数で学習された分類モデルである、請求項1に記載の分類方法。
【請求項12】
イメージのオブジェクトを分類する分類方法であって、
入力イメージを受信する動作と、
前記入力イメージが入力された分類モデルから前記入力イメージ内のオブジェクトに対するクラス予測値を取得する動作と、
前記クラス予測値に基づいて予測一貫性値を決定する動作と、
前記予測一貫性値に基づいて前記オブジェクトに対応するクラスタイプを決定する動作と、
前記決定されたクラスタイプに対応するクラス予測モデルを用いて前記オブジェクトのクラスを決定する動作と、
を含む、分類方法。
【請求項13】
前記オブジェクトのクラスを決定する動作は、
前記オブジェクトのクラスタイプが第1クラスタイプに対応する場合、第1クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作と、
前記オブジェクトのクラスタイプが前記第1クラスタイプと異なる第2クラスタイプに対応する場合、前記第1クラス予測モデルと異なる第2クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作と、
を含む、請求項12に記載の分類方法。
【請求項14】
前記予測一貫性値を決定する動作は、
前記分類モデルから取得された前記クラス予測値のうち最も頻度数の多いモードクラス予測値を決定する動作と、
前記クラス予測値と前記モードクラス予測値との間のマッチング頻度に基づいて前記予測一貫性値を決定する動作と、
を含む、請求項12に記載の分類方法。
【請求項15】
請求項1ないし14のうち何れか一項に記載の分類方法をコンピュータに実行させるコンピュータ・プログラム。
【請求項16】
イメージのオブジェクトを分類する分類装置であって、
プロセッサと、
前記プロセッサによって実行可能な命令を格納するメモリを含み、
前記メモリに格納された命令が前記プロセッサによって実行されるとき、前記プロセッサは、
入力イメージを受信し、
前記入力イメージが入力された分類モデルから前記入力イメージ内のオブジェクトに対するクラス予測値を取得し、
前記クラス予測値に基づいて予測一貫性値を決定し、
前記予測一貫性値に基づいて前記オブジェクトに対応するクラスタイプを決定し、
前記オブジェクトのクラスタイプが多数派クラスに対応する場合、多数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定し、
前記オブジェクトのクラスタイプが少数派クラスに対応する場合、少数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する、
分類装置。
【請求項17】
前記プロセッサは、
前記分類モデルから取得された前記クラス予測値のうち最も頻度数の多いモードクラス予測値を決定し、
前記クラス予測値と前記モードクラス予測値との間のマッチング頻度に基づいて前記予測一貫性値を決定する、請求項16に記載の分類装置。
【請求項18】
前記プロセッサは、
前記予測一貫性値が閾値よりも大きいことに応答して、前記オブジェクトに対応するクラスタイプを前記多数派クラスとして決定し、
前記予測一貫性値が前記閾値よりも大きくないことに応答して、前記オブジェクトに対応するクラスタイプを前記少数派クラスとして決定する、請求項16に記載の分類装置。
【請求項19】
前記プロセッサは、前記オブジェクトが前記多数派クラスに対応する場合、前記分類モデルのアンサンブルモデルを前記多数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する、請求項16に記載の分類装置。
【請求項20】
前記プロセッサは、前記オブジェクトが前記少数派クラスに対応する場合、前記分類モデルの中から選択されたターゲット分類モデルを前記少数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する、請求項16ないし19のうち何れか一項に記載の分類装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、イメージのオブジェクトを分類する分類方法及び分類装置等に関する。
【背景技術】
【0002】
人工知能(Artificial Intelligence、AI)システムは、ヒトのレベルの知能を実現するコンピュータシステムであり、既存のRule基盤スマートシステムとは異なって、機械が自ら学習して判断し、賢くなるシステムである。人工知能システムを使用するほど認識率が向上し、ユーザの好みをより正確に理解可能になることで、既存のRule基盤スマートシステムは次第にディープラーニング基盤人工知能システムに代替されている。
【0003】
人工知能技術は、機械学習(ディープラーニング)及び機械学習を活用した要素技術から構成されている。機械学習は、入力データの特徴を自ら分類/学習するアルゴリズム技術であり、要素技術は、ディープラーニングなどの機械学習アルゴリズムを活用してヒトの頭脳の認知、判断などの機能を模写する技術として、言語的理解、視覚的理解、推論/予測、知識表現、動作制御などの技術分野から構成されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、イメージのオブジェクトを分類する分類方法及びそれを行う分類装置を提供することにある。
【課題を解決するための手段】
【0005】
一実施形態に係るイメージのオブジェクトを分類する分類方法は、入力イメージを受信する動作と、前記入力イメージが入力された分類モデルから前記入力イメージ内のオブジェクトに対するクラス予測値を取得する動作と、前記クラス予測値に基づいて予測一貫性値を決定する動作と、前記予測一貫性値に基づいて前記オブジェクトに対応するクラスタイプを決定する動作と、前記決定されたクラスタイプに基づいて前記オブジェクトのクラスを決定する動作とを含ことができる。
【0006】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトのクラスタイプが多数派クラスに対応する場合、多数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作と、前記オブジェクトのクラスタイプが少数派クラスに対応する場合、少数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作とを含むことができる。
【0007】
前記予測一貫性値を決定する動作は、前記分類モデルから取得された前記クラス予測値のうち最も頻度数の多いモードクラス予測値(mode class prediction value)を決定する動作と、前記クラス予測値と前記モードクラス予測値との間のマッチング頻度に基づいて前記予測一貫性値を決定する動作とを含むことができる。
【0008】
前記予測一貫性値を決定する動作は、前記クラス予測値と前記モードクラス予測値との間のマッチング頻度を前記クラス予測値の全体個数で割ることによって前記予測一貫性値を決定する動作を含むことができる。
【0009】
前記クラスタイプを決定する動作は、前記予測一貫性値及び閾値に基づいて前記オブジェクトに対応するクラスタイプを前記多数派クラス又は前記少数派クラスとして決定する動作を含むことができる。
【0010】
前記クラスタイプを決定する動作は、前記予測一貫性値が前記閾値よりも大きいことに応答して、前記オブジェクトに対応するクラスタイプを前記多数派クラスとして決定する動作と、前記予測一貫性値が前記閾値よりも大きくないことに応答して、前記オブジェクトに対応するクラスタイプを前記少数派クラスとして決定する動作とを含むことができる。
【0011】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトが前記多数派クラスに対応する場合、前記分類モデルのアンサンブルモデルを前記多数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する動作を含むことができる。
【0012】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトが前記多数派クラスに対応する場合、前記分類モデルの中から選択されたターゲット分類モデルを前記多数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する動作を含むことができる。
【0013】
前記オブジェクトのクラスを決定する動作は、前記分類モデルの学習過程で前記多数派クラスに対して最も優れた分類性能を示した分類モデルを前記ターゲット分類モデルとして選択する動作を含むことができる。
【0014】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトが前記少数派クラスに対応する場合、前記分類モデルの中から選択されたターゲット分類モデルを前記少数派クラス予測モデルとして用いて前記オブジェクトのクラスを決定する動作を含むことができる。
【0015】
前記オブジェクトのクラスを決定する動作は、前記分類モデルの学習過程で前記少数派クラスに対して最も優れた分類性能を示した分類モデルを前記ターゲット分類モデルとして選択する動作を含むことができる。
【0016】
前記分類モデルは、同じ学習データセットに対して互いに異なる学習回数で学習された分類モデルであってもよい。
【0017】
一実施形態に係るイメージのオブジェクトを分類する分類方法は、入力イメージを受信する動作と、前記入力イメージが入力された分類モデルから前記入力イメージ内のオブジェクトに対するクラス予測値を取得する動作と、前記クラス予測値に基づいて予測一貫性値を決定する動作と、前記予測一貫性値に基づいて前記オブジェクトに対応するクラスタイプを決定する動作と、前記決定されたクラスタイプに対応するクラス予測モデルを用いて前記オブジェクトのクラスを決定する動作とを含むことができる。
【0018】
前記オブジェクトのクラスを決定する動作は、前記オブジェクトのクラスタイプが第1クラスタイプに対応する場合、第1クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作と、前記オブジェクトのクラスタイプが前記第1クラスタイプと異なる第2クラスタイプに対応する場合、前記第1クラス予測モデルと異なる第2クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定する動作とを含むことができる。
【0019】
一実施形態に係るイメージのオブジェクトを分類する分類装置は、プロセッサと、前記プロセッサによって実行可能な命令を格納するメモリを含み、前記メモリに格納された命令が前記プロセッサによって実行されるとき、前記プロセッサは、入力イメージを受信し、前記入力イメージが入力された分類モデルから前記入力イメージ内のオブジェクトに対するクラス予測値を取得し、前記クラス予測値に基づいて予測一貫性値を決定し、前記予測一貫性値に基づいて前記オブジェクトに対応するクラスタイプを決定し、前記オブジェクトのクラスタイプが多数派クラスに対応する場合、多数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定し、前記オブジェクトのクラスタイプが少数派クラスに対応する場合、少数派クラス予測モデルが前記オブジェクトに対して出力したクラス予測値に基づいて前記オブジェクトのクラスを決定することができる。
【発明の効果】
【0020】
本発明によると、イメージのオブジェクトを分類する分類方法及びそれを行う分類装置を提供することができる。
【図面の簡単な説明】
【0021】
【
図1】一実施形態に係るイメージのオブジェクトを分類する分類装置の概要を説明するための図である。
【
図2】一実施形態に係るイメージのオブジェクトを分類する分類方法の動作を説明するためのフローチャートである。
【
図3】一実施形態に係るイメージのオブジェクトを分類する分類方法の動作を説明するためのフローチャートである。
【
図4】実施形態に係るイメージオブジェクトを分類する分類装置の動作を説明するための図である。
【
図5】一実施形態に係る多数派クラス予測器の様々な変形例を説明するための図である。
【
図6】一実施形態に係る少数派クラス予測器の様々な変形例を説明するための図である。
【
図7】他の実施形態に係るイメージオブジェクトを分類する分類装置の動作を説明するための図である。
【
図8】一実施形態に係る予測一貫性値に基づいて分類モデルを学習させることを説明するための図である。
【
図9】他の実施形態に係る予測一貫性値に基づいて分類モデルを学習させることを説明するための図である。
【
図10】一実施形態に係る半導体製造工程でイメージオブジェクト分類を介してウェハーの不良を鑑別する実施形態を説明するための図である。
【
図11】一実施形態に係るイメージのオブジェクトを分類する分類装置の構成を示すブロック図である。
【発明を実施するための形態】
【0022】
実施形態に対する特定な構造的又は機能的な説明は単なる例示のための目的として開示されたものであって、様々な形態に変更されることができる。したがって、実施形態は特定な開示形態に限定されるものではなく、本明細書の範囲は技術的な思想に含まれる変更、均等物ないし代替物を含む。
【0023】
第1又は第2などの用語を複数の構成要素を説明するために用いることがあるが、このような用語は1つの構成要素を他の構成要素から区別する目的としてのみ解釈されなければならない。例えば、第1構成要素は第2構成要素と命名することができ、同様に、第2構成要素は第1構成要素にも命名することができる。
【0024】
いずれかの構成要素が他の構成要素に「連結」されているか「接続」されていると言及されたときには、その他の構成要素に直接的に連結されているか又は接続されているが、中間に他の構成要素が存在し得るものと理解されなければならない。
【0025】
単数の表現は、文脈上、明白に異なる意味をもたない限り複数の表現を含む。本明細書において、「含む」又は「有する」等の用語は、明細書上に記載した特徴、数字、ステップ、動作、構成要素、部品又はこれらを組み合わせたものが存在することを示すものであって、1つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、又はこれを組み合わせたものなどの存在又は付加の可能性を予め排除しないものとして理解しなければならない。
【0026】
本文書の多様な実施形態で使用された用語「モジュール」は、ハードウェア、ソフトウェア又はファームウェアで具現されたユニットを含み、例えば、ロジック、論理ブロック、部品、又は回路などの用語と相互互換的に使用することができる。モジュールは、一体に構成された部品又は1つ以上の機能を行う部品の最小単位、又は、その一部からなる。モジュールは、ASIC(application-specific integrated circuit)の形に具現されてもよい。
【0027】
異なるように定義さがれない限り、技術的又は科学的な用語を含んで、ここで用いる全ての用語は、本実施形態が属する技術分野で通常の知識を有する者によって一般的に理解されるものと同じ意味を有する。一般的に用いられる予め定義された用語は、関連技術の文脈上で有する意味と一致する意味を有するものと解釈されなければならず、本明細書で明白に定義しない限り、理想的又は過度に形式的な意味として解釈されることはない。
【0028】
以下、添付する図面を参照しながら実施形態を詳細に説明する。図面を参照して説明する際に、図面符号に拘わらず同じ構成要素は同じ参照符号を付与し、これに対する重複する説明は省略する。
【0029】
図1は、一実施形態に係るイメージのオブジェクトを分類する分類装置の概要を説明するための図である。
【0030】
図1を参照すると、イメージのオブジェクトを分類する分類装置100は、分類装置100に入力された入力イメージ110に含まれたオブジェクトを分類する装置である。分類装置100は、入力イメージ110に含まれたオブジェクトに対応するクラスを決定することにオブジェクト分類を行うことができる。クラスは、分類対象である入力イメージ110に示されているオブジェクトのタイプや種類を示すもので、範疇により様々なクラスが存在し得る。例えば、0、1、2、3、4、などの数字の種類がそれぞれのクラスになってもよく、正常、不良1、不良2などの状態の種類がそれぞれのクラスになってもよい。また、異なる例として、犬、猫など動物の種類がクラスになってもよく、ヒト、携帯電話、自動車など物体の種類がクラスになってもよい。本明細書において「入力イメージ」の用語は「入力データ」又は「入力画像」に代替されてもよい。
【0031】
イメージのオブジェクト分類においてクラスにおける不均衡の問題が発生し得る。一般に、多くのイメージのオブジェクト分類のための学習データセットは、イメージのオブジェクトを分類する分類モデルが各クラスごとに学習するために十分な量の学習データを含むように構成されている。しかし、現実的に、全体クラスそれぞれに十分な量の学習データを構成することは容易ではない。クラスごとに学習データ量の差が発生すれば、クラスにおける不均衡の問題が発生し得る。クラス不均衡の問題は、クラスごとに学習データ量の偏差が大きい場合、このような偏差が分類モデルの学習及び推論に影響を与え、結果的に、分類モデルの分類性能が低下するという問題がある。特に、クラス不均衡の問題は、学習データ量が充分でないクラスに対する分類モデルの分類性能が低くなる問題を抱えている。
【0032】
分類装置100は、予測一貫性値(prediction consistency value)を使用することで、上記で説明したクラス不均衡の問題を解決することができる。一実施形態において、分類装置100は、予測一貫性値に基づいて入力イメージ110のオブジェクトのクラスタイプを多数派クラス及び少数派クラスのいずれか1つに区分し、区分結果に応じてオブジェクトのクラスに対応するクラス予測器を用いてもよい。分類装置100は、予測一貫性値に基づいて、クラス予測器のうち入力イメージ110のオブジェクトのクラス分類に応じて適切なクラス予測器を選択し、クラス分類を行うことでクラス分類の正確度を向上させることができる。
【0033】
一実施形態において、分類装置100は、予測一貫性値決定器120、クラス分類器130、多数派クラス予測器140、及び少数派クラス予測器150を含む。予測一貫性値決定器120、クラス分類器130、多数派クラス予測器140、及び少数派クラス予測器150のそれぞれは、予測一貫性値のそれぞれの1つ以上の動作を構成する命令を格納するメモリ及び1つ以上のプロセッサを用いて実行されてもよい。予測一貫性値決定器120、クラス分類器130、多数派クラス予測器140、及び少数派クラス予測器150それぞれの動作は、メモリに格納された命令がプロセッサによって実行されるものと実現されることができる。
【0034】
分類装置100に入力された入力イメージ110は、予測一貫性値決定器120に伝達される。一実施形態において、入力イメージ110が予測一貫性値決定器120に伝達される前に、分類装置100は入力イメージ110にイメージ前処理を行い、イメージ前処理が実行された入力イメージ110を予測一貫性値決定器120に伝達してもよい。イメージ前処理は、例えば、イメージの回転、拡大、縮小、投影、2進化、カラー調整、明暗調整、ヒストグラムの均等化、トリミング(cropping)、関心領域(region of interest;ROI)の抽出、及び背景領域の除去などを含んでもよい。
【0035】
予測一貫性値決定器120は、複数の分類モデルを用いて入力イメージ110内のオブジェクトに対するクラス予測値を取得することができる。分類モデルそれぞれは、入力イメージ110を入力にし、入力イメージ110に含まれたオブジェクトに対するクラス予測値を出力するモデルであってもよい。一実施形態において、分類モデルは、同じ学習データセットに対して互いに異なる学習回数又は互いに異なる回数のエポック(epoch)で学習されたモデルであってもよい。分類モデルは、例えば、ニューラルネットワーク(例えば、畳み込みニューラルネットワーク)であってもよい。ニューラルネットワークは、シナプスの結合でネットワークを形成している人工ニューロン(又は、ノード)が学習又は機械学習を介してシナプスの結合強度を変化させて問題解決能力を有するモデルの全般を意味する。ニューラルネットワークの人工ニューロンは、加重値及び/又はバイアスの組み合わせを含んでもよく、ニューラルネットワークは、複数の人工ニューロンで構成されたレイヤを含んでもよい。
【0036】
予測一貫性値決定器120は、分類モデルが出力したクラス予測値に基づいて予測一貫性値を決定することができる。予測一貫性値は、分類モデルが入力イメージ110に含まれたオブジェクトに対するクラスをどれ程一貫して予測したかを示す。分類モデルが出力したクラス予測値の分布において、同じクラス予測値が多いほど予測一貫性値は大きくなり、同じクラス予測値が少ないほど予測一貫性値は小さくなる。したがって、大きい予測一貫性値は分類モデルがオブジェクトのクラスを一貫して予測したことを意味し、小さい予測一貫性値は、分類モデルがオブジェクトのクラスを一貫して予測できず、予測結果の偏差が大きいことを意味する。
【0037】
クラス分類器130は、予測一貫性値に基づいてオブジェクトに対応するクラスタイプを決定することができる。一実施形態において、クラス分類器130は、予測一貫性値と閾値を比較して、比較結果に応じてオブジェクトのクラスタイプを多数派クラス(majority class)又は少数派クラス(minority class)に分類してもよい。予測一貫性値が閾値よりも大きい場合、クラス分類器130は、オブジェクトのクラスタイプを多数派クラスに分類し、予測一貫性値が閾値よりも大きくない場合(又は、閾値以下である場合)、クラス分類器130はオブジェクトのクラスを少数派クラスに分類してもよい。
【0038】
多数派クラスは、分類モデルの学習過程において学習データ量が十分であるため、高い分類正確度を有するように学習されたクラスを意味し、少数派クラスは、分類モデルの学習過程で相対的に学習データ量が十分でないため、比較的に低い分類正確度を有するよう学習されたクラスを意味する。オブジェクトの多数派クラスであれば、分類モデルがオブジェクトのクラスを代替的に円満に予測できることから大きな予測一貫性値を示し、オブジェクトのクラスが少数派クラスであれば、分類モデルがオブジェクトのクラスをそれほど予測できないため小さな予測一貫性値を示す。多数派クラスは、学習過程の初期(例えば、エポック数が低い時期)から高い分類正確度(例えば、分類モデルのクラス予測値の偏差が小さい)に分類され、少数派クラスは、学習過程が進行されても比較的に低い分類正確度(例えば、分類モデルのクラス予測値の偏差が大きい)に分類される。分類装置100は、このような多数派クラスと少数派クラスの差異に基づいた予測一貫性値を決定し、予測一貫性値に基づいてオブジェクトのクラス推論を行うことができる。
【0039】
クラス分類器130によってオブジェクトのクラスタイプが多数派クラスに分類された場合、多数派クラス予測器140によりオブジェクトのクラスが決定されてもよい。多数派クラス予測器140は、多数派クラスのクラス予測のためのモデルである多数派クラス予測モデルが、オブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定してもよい。多数派クラス予測モデルとして、例えば、クラス予測値を提供する分類モデルのアンサンブルモデルが使用されてもよいが、これに限定されることはない。多数派クラス予測モデルは様々に変形され、これについては
図5を参照してより詳しく説明する。
【0040】
クラス分類器130によってオブジェクトのクラスタイプが少数派クラスに分類された場合、少数派クラス予測器150によりオブジェクトのクラスが決定されてもよい。少数派クラス予測器150は、少数派クラスのクラス予測のためのモデルである少数派クラス予測モデルが、オブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定してもよい。少数派クラス予測モデルとして、例えば、クラス予測値を提供する分類モデルのうち少数派クラスに対して最も高い分類正確度を示した分類モデルが使用されるが、これに限定されることはない。少数派クラス予測モデルは様々に変形され、これについては、
図6を参照してより詳しく説明する。
【0041】
上記のように、分類装置100は、入力イメージ110のオブジェクトのクラスタイプを多数派クラス又は少数派クラスに区分し、それぞれのクラスタイプによる適切なクラス予測モデルを適用してオブジェクトのクラス分類の正確度を改善させることができる。分類装置100は、上記で説明された処理過程を介してクラス不均衡に強靭にクラス分類を行ってクラス分類の正確度を改善させることができる。特に、分類装置100は、学習し難い少数派クラスを推論過程として区別し、少数派クラスの推論に適切な少数派クラス予測モデルを用いてオブジェクトのクラスを決定することで、クラス不均衡の原因となる少数派クラスに対する予測正確度を向上させることができる。分類装置100は、また、オブジェクトのクラスを推論するステップでクラス不均衡の問題を解決し、追加的な学習が必要でないという長所を提供する。
【0042】
図2及び
図3は、一実施形態に係るイメージのオブジェクトを分類する分類方法の動作を説明するためのフローチャートである。
【0043】
一実施形態において、
図2及び
図3の動作のうち一部の動作は、他の動作と同時又は並列に行ってもよく、動作間の順序を変更してもよい。また、動作の一部は省略されてもよく、他の動作が追加的に行われてもよい。イメージのオブジェクトを分類する分類方法は、本文書の実施形態で説明されている分類装置(例えば、
図1に示す分類装置100、
図7に示す分類装置700、
図11に示す分類装置1100)によって行われてもよい。
【0044】
図2を参照すると、動作210において、分類装置は入力イメージを受信する。入力イメージは、クラス分類の対象であるオブジェクトを含んでいる。分類装置は、入力イメージにイメージ前処理を行う。
【0045】
動作220において、分類装置は、入力イメージが入力された分類モデルから入力イメージ内のオブジェクトに対するクラス予測値を取得する。分類モデルそれぞれには入力イメージが入力され、分類モデルそれぞれは入力イメージに対応するクラス予測値を出力することができる。
【0046】
分類モデルは、同じ学習データセットに対して互いに異なる学習回数で学習された分類モデルであってもよい。例えば、分類モデルは、学習されていない初期分類モデルが全体学習データセットに対して一回の学習過程が完了した第1分類モデル(学習回数:1回)、第1分類モデルが再び全体学習データセットに対して一回の学習過程を追加的に完了した第2分類モデル(学習回数:2回)及び第2分類モデルに再び全体学習データセットに対して一回の学習過程を追加的に完了した第3分類モデル(学習回数:3回)のように、互いに異なる学習回数で学習された分類モデルを含んでもよい。一回の学習過程は一回のエポックに対応し、一回のエポックは、学習データセットの全体に対して逆伝播アルゴリズム(backpropagation algorithm)の順方向パス(forward pass)及び逆方向パス(backward pass)の過程を経たものを示す。
【0047】
動作230において、分類装置は、クラス予測値に基づいて予測一貫性値を決定する。分類装置は、分類モデルから取得したクラス予測値のうち最も頻度数の多いモードクラス予測値(mode class prediction value)を決定し、クラス予測値とモードクラス予測値とのマッチング頻度に基づいて予測一貫性値を決定することができる。該当のマッチング頻度は、複数のクラス予測値のうちモードクラス予測値と同じクラス予測値がどれほど多いかを示す。分類装置は、クラス予測値とモードクラス予測値との間のマッチング頻度をクラス予測値の全体の個数で除算することによって予測一貫性値を決定できる。クラス予測値の全個数は、分類モデルの全個数に対応する。
【0048】
動作240において、分類装置は、予測一貫性値に基づいてオブジェクトに対応するクラスタイプを決定する。分類装置は、予測一貫性値が定義された基準を満足するか否かに応じてオブジェクトのクラスタイプを分類してもよい。例えば、分類装置は、予測一貫性値と閾値との間の比較結果に基づいて、オブジェクトのクラスタイプを多数派クラス又は少数派クラスに分類される。但し、クラスタイプは多数派クラス及び少数派クラスに限定されず、クラスタイプは様々である。
【0049】
動作250において、分類装置は、決定されたオブジェクトのクラスタイプに対応するクラス予測モデルを用いてオブジェクトのクラスを決定する。一実施形態において、オブジェクトのクラスタイプが第1クラスタイプに対応する場合、分類装置は、第1クラス予測モデルがオブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定し得る。第1クラス予測モデルは、第1クラスタイプを専用に分類する分類モデルであってもよい。オブジェクトのクラスタイプが第1クラスタイプとは異なる第2クラスタイプに対応する場合、分類装置は、第1クラス予測モデルと異なる第2クラス予測モデルがオブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定してもよい。第2クラス予測モデルは、第2クラスタイプを専用に分類する分類モデルであってもよい。クラスタイプは、第1クラスタイプ及び第2クラスタイプ以外にさらに追加的に存在し、それによりクラス予測モデルもさらに存在し得る。
【0050】
図3を参照すると、動作240に分類装置は、予測一貫性値に基づいてオブジェクトに対応するクラスタイプを多数派クラス及び少数派クラスのいずれか1つに分類することができる。分類装置は、予測一貫性値及び閾値に基づいてオブジェクトに対応するクラスタイプを多数派クラス又は少数派クラスとして決定し得る。予測一貫性値が閾値よりも大きいことに応答して、分類装置は、オブジェクトに対応するクラスタイプを多数派クラスとして決定してもよい。予測一貫性値が閾値よりも大きくない(又は、閾値以下)ことに応答して、分類装置はオブジェクトに対応するクラスタイプを少数派クラスとして決定してもよい。
【0051】
動作310において、分類装置は、オブジェクトに対応するクラスタイプが多数派クラスに対応するか否かを決定する。オブジェクトのクラスタイプが多数派クラスに対応する場合(動作310において「はい」の場合)、動作320において、分類装置は、多数派クラス予測モデルを用いてオブジェクトのクラスを決定する。分類装置は、多数派クラス予測モデルがオブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定することができる。分類装置は、分類モデルのアンサンブルモデルを多数派クラス予測モデルとして利用したり、又は、分類モデルから選択されたターゲット分類モデルを多数派クラス予測モデルとして用いてオブジェクトのクラスを決定してもよい。分類装置は、例えば、分類モデルの学習過程で多数派クラスに対して最も優れた分類性能を示した分類モデル、又は、学習初期に導き出された分類モデル(例えば、学習回数が少ない分類モデル)をターゲット分類モデルとして選択してもよい。分類装置は、多数派クラス予測モデルが出力したクラス予測値に基づいてオブジェクトの最終クラスを決定できる。
【0052】
オブジェクトのクラスタイプが少数派クラスに対応する場合(動作310で「いいえ」の場合)、動作330において、分類装置は、少数派クラス予測モデルを用いてオブジェクトのクラスを決定する。分類装置は、少数派クラス予測モデルがオブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定し得る。分類装置は、学習後期に導き出された分類モデル(例えば、学習回数が多い分類モデル)のアンサンブルモデルを少数派クラス予測モデルとして利用したり、又は、分類モデルから選択されたターゲット分類モデルを少数派クラス予測モデルとして用いてオブジェクトのクラスを決定することができる。分類装置は、例えば、分類モデルの学習過程で少数派クラスに対して最も優れた分類性能を示した分類モデルをターゲット分類モデルとして選択してもよい。分類装置は、少数派クラス予測モデルが出力したクラス予測値に基づいてオブジェクトの最終クラスを決定することができる。
【0053】
図4は、一実施形態に係るイメージオブジェクトを分類する分類装置の動作を説明するための図である。
【0054】
図4を参照すると、分類装置100は、予測一貫性値決定器120、クラス分類器130、多数派クラス予測器140、及び少数派クラス予測器150を含む。
【0055】
予測一貫性値決定器120は、互いに異なる学習回数で学習された複数の分類モデル122,124,126及び予測一貫性値算出器128を含む。予測一貫性値決定器120は、分類モデル122,124,126を用いて入力イメージ110内のオブジェクトに対するクラス予測値を取得する。予測一貫性値決定器120は、学習過程でエポックごとに生成された分類モデル122,124,126を格納している。分類モデル122,124,126の個数は2つ以上であってもよく、その数には制限がない。
【0056】
一実施形態において、第1分類モデル122は、学習されていない初期分類モデルが全体学習データセットに対して1回学習が行われた分類モデルであってもよく、第2分類モデル124は、初期分類モデルが全体学習データセットに対して2回学習が実行された分類モデルであってもよい。第n分類モデル126は、全体学習データセットに対してn回学習が実行された分類モデルとして、学習が最終完了した分類モデルに対応する。第1分類モデル122、第2分類モデル124、...、及び第n分類モデル126は、エポック(epoch)ごとに学習された分類モデルであってもよい。第1分類モデル122、第2分類モデル124、...、及び第n分類モデル126のそれぞれは、入力イメージ110を入力にしてオブジェクトに対するクラス予測値を出力してもよい。分類モデル122,124,126は、第1分類モデル122から最後の第n分類モデル126までの全体分類モデルを含むことを指す。
【0057】
予測一貫性値算出器128は、分類モデル122,124,126が出力したクラス予測値に基づいて予測一貫性値を決定する。予測一貫性値算出器128は、分類モデル122,124,126から取得されたクラス予測値のうち最も頻度数の多いモードクラス予測値を決定する。予測一貫性値算出器128は、クラス予測値とモードクラス予測値との間のマッチング頻度をクラス予測値の全体個数で割ることによって予測一貫性値を決定し得る。予測一貫性値算出器128は、例えば、次の数式(1)により予測一貫性値を決定することができる。
【0058】
【0059】
ここで、zは予測一貫性値を示し、nはクラス予測値の全体個数を示す。fi(x)は第i分類モデル(iは、1からnまでの自然数)から出力されたクラス予測値を示し、cmostはクラス予測値のうち最も多く予測されたモードクラス予測値を示す。数式(1)によれば、予測一貫性値は、分類モデル122,124,126のそれぞれが出力したクラス予測値がクラス予測値のうち、最も多く示されたモードクラス予測値cmostとどれ程多くマッチングされるかを示す値として定義され、0と1との間の値を有してもよい。第i分類モデルのクラス予測値fi(x)とモードクラス予測値cmostが同一であれば(又は、マッチングすれば)1にカウントされ、それぞれ異なると0にカウントされる。全体分類モデルそれぞれのクラス予測値とモードクラス予測値cmostと間のマッチングの有無によるカウント値の全体合計をクラス予測値の全体個数nで割った値が予測一貫性値zである。
【0060】
予測一貫性値決定器120は、予測一貫性値と入力イメージ110をクラス分類器130に伝達する。クラス分類器130は、予測一貫性値算出器128によって決定された予測一貫性値に基づいてオブジェクトのクラスタイプを分類してもよい。クラス分類器130は、予測一貫性値が高いものは多数派クラスに分類し、予測一貫性が低いものは少数派クラスに分類してもよい。クラス分類器130は比較器132を含んでもよい。比較器132は、予測一貫性値とクラスタイプの分類のための基準値を示す閾値を比較する。比較器132は、予測一貫性値が閾値よりも大きいか否かを決定する。クラス比較器130は、予測一貫性値が閾値よりも大きい場合にはオブジェクトのクラスタイプを多数派クラスとして決定し、予測一貫性値が閾値よりも大きくない場合には、オブジェクトのクラスタイプを少数派クラスとして決定してもよい。
【0061】
オブジェクトのクラスタイプが多数派クラスとして決定された場合、多数派クラス予測器140は、多数派クラスに対するクラス予測のためのモデルである多数派クラス予測モデル145を用いてオブジェクトのクラスを決定することができる。多数派クラス予測モデル145は、例えば、分類モデル122,124,126のアンサンブルモデル(ensemble model)や分類モデル122,124,126から選択された分類モデルであってもよい。多数派クラス予測モデル145がアンサンブルモデルである場合、多数派クラス予測器140は、アンサンブルモデルが出力された出力値(例えば、特徴ベクトル)に基づいてオブジェクトのクラスを決定することができる。多数派クラス予測モデル145として分類モデル122,124,126のいずれか1つが選択される場合、多数派クラス予測器140は、該当選択された分類モデルが出力したクラス予測値(例えば、特徴ベクトル)に基づいてオブジェクトのクラスを決定してもよい。但し、多数派クラス予測モデル145の形態がこれに限定されず、多数派クラス予測モデル145は様々に変形可能である。
【0062】
オブジェクトのクラスタイプが少数派クラスとして決定された場合、少数派クラス予測器150は、少数派クラスに対するクラス予測のためのモデルである少数派クラス予測モデル155を用いてオブジェクトのクラスを決定することができる。少数派クラス予測モデル155として分類モデル122,124,126のいずれか1つの分類モデルが選択される場合、少数派クラス予測器150は、該当選択された分類モデルが出力したクラス予測値(例えば、特徴ベクトル)に基づいてオブジェクトのクラスを決定してもよい。分類モデル122,124,126のうち、例えば、学習過程で少数派クラスに対して最も優れた分類性能を示した分類モデルが少数派クラス予測モデル155として選択されてもよい。但し、少数派クラス予測モデル155の形態はこれに限定されず、少数派クラス予測モデル155は様々に変形可能である。
【0063】
上記のように、分類装置100は、オブジェクトのクラスタイプを多数派クラスと学習し難い少数派クラスとを区別し、各クラスタイプに最適化したクラス予測モデルを用いてオブジェクトのクラス分類を行うことで、クラス分類の正確度を向上させることができる。
【0064】
図5は、一実施形態に係る多数派クラス予測器の様々な変形例を説明するための図である。
【0065】
図5を参照すると、多数派クラス予測器140及び多数派クラス予測モデル145は、様々な形態に変形されてもよい。例えば、入力イメージのオブジェクトに対してクラス予測値を出力する全体分類モデル122,124,126のアンサンブルモデル510、全体分類モデル122,124,126のうち一部の分類モデル(例えば、第1分類モデル122、第2分類モデル124、第k分類モデル125)のアンサンブルモデル520、又は、全体分類モデル122,124,126のうち特定のいずれか1つの分類モデル(例えば、第m分類モデル)530が多数派クラス予測モデル145として用いられてもよい。アンサンブルモデル510は、様々な環境で安定的な性能を提供することができる。アンサンブルモデル520は、例えば、学習回数が少ない分類モデル(例えば、エポック回数が5回以下である分類モデル)のアンサンブルモデルであってもよい。分類モデル530は、学習回数が少ない分類モデル(例えば、エポック回数が5回以下である分類モデルのいずれか1つの分類モデル)、又は、学習過程で多数派クラスに対して最も優れた分類性能を示した分類モデルに対応する。
【0066】
一実施形態において、多数派クラス予測器140は、全体分類モデル122,124,126のうち特定の分類モデルを多数派クラス予測モデル145として選択する分類モデル選択器545を含む多数派クラス予測器540に変形されてもよい。分類モデル選択器545は、全体分類モデル122,124,126のうちオブジェクトのクラスタイプに対して、最も優れた分類性能を提供する分類モデルを多数派クラス予測モデル145として選択することができる。
【0067】
図6は、一実施形態に係る少数派クラス予測器の様々な変形例を説明するための図である。
【0068】
図6を参照すると、少数派クラス予測器150及び少数派クラス予測モデル155は、様々な形態に変形されてもよい。例えば、入力イメージのオブジェクトに対してクラス予測値を出力する全体分類モデル122,124,126のうち一部の分類モデル(例えば、第h分類モデル612、第i分類モデル614、第j分類モデル616)のアンサンブルモデル610又は全体分類モデル122,124,126のうち特定のいずれか1つの分類モデル(例えば、第d分類モデル)620が少数派クラス予測モデル155として用いられてもよい。アンサンブルモデル610は、例えば、学習回数が多い分類モデルのアンサンブルモデルであってもよい。アンサンブルモデル610は、様々な環境で安定的な性能を提供することができる。分類モデル620は、学習過程で少数派クラスに対して最も優れた分類性能を示した分類モデルに対応する。
【0069】
一実施形態において、少数派クラス予測器150は、全体分類モデル122,124,126のうち特定の分類モデルを少数派クラス予測モデル155として選択する分類モデル選択器635を含む少数派クラス予測器630に変形されてもよい。分類モデル選択器635は、全体分類モデル122,124,126のうちオブジェクトのクラスタイプに対して最も優れた分類性能を提供する分類モデルを少数派クラス予測モデル155として選択することができる。
【0070】
図7は、他の実施形態に係るイメージオブジェクトを分類する分類装置の動作を説明するための図である。
【0071】
図7を参照すると、分類装置700は、予測一貫性値決定器120、クラス分類器710、及び多数派クラス予測器720,730,740を含む。予測一貫性値決定器120、クラス分類器710及び多数派クラス予測器720,730,740のそれぞれは、予測一貫性値決定器120、クラス分類器710のそれぞれの1つ以上の動作を構成している命令を格納する1つ以上のメモリ及びプロセッサを用いて実行されてもよい。予測一貫性値決定器120、クラス分類器710及び多数派クラス予測器720,730,740それぞれの動作は、メモリに格納された命令がプロセッサによって実行されるものに実現されてもよい。
【0072】
予測一貫性値決定器120は、分類モデル122,124,126と予測一貫性値算出器128を含む。予測一貫性値算出器128は、分類モデル122,124,126が入力イメージ110に対して出力したクラス予測値に基づいて予測一貫性値を算出することができる。予測一貫性値決定器120の動作に対して前述した説明がそのまま適用することができ、重複する内容は省略する。
【0073】
クラス分類器710は、予測一貫性値に基づいてオブジェクトのクラスタイプを分類することができる。クラス分類器710は、オブジェクトのクラスタイプを区分するために予測一貫性値と閾値とを比較する比較器712を含んでいる。クラス分類器710は、比較器712の比較結果に基づいてオブジェクトのクラスタイプを様々なクラスタイプのいずれか1つに分類してもよい。例えば、クラス分類器710は、予測一貫性値が第1閾値(例えば、0.725)よりも大きい場合、オブジェクトのクラスタイプを第1クラスタイプ(例えば、多数派クラス)に分類してもよい。クラス分類器710は、予測一貫性値が第2閾値(例えば、0.5)よりも小さい場合、オブジェクトのクラスタイプを第3クラスタイプ(例えば、背景クラス又はノーマルクラス(normal class))に分類してもよい。第2閾値は、第1閾値よりも小さい値であってもよい。クラス分類器710は、予測一貫性値が第2閾値と第1閾値との間である場合、オブジェクトのクラスタイプを第2クラスタイプ(例えば、中間クラス又はバランスクラス)として分類してもよい。クラス分類器710が分類できるクラスタイプの個数には制限がなく、クラス分類器710は、オブジェクトのクラスタイプをn(nは、3以上の自然数)個までのクラスタイプのいずれか1つに分類してもよい。
【0074】
オブジェクトのクラスタイプが第1クラスタイプとして決定された場合、第1クラス予測器720は、第1クラス予測モデル725を用いてオブジェクトのクラスを決定することができる。第1クラス予測モデル725として、例えば、分類モデル122,124,126のうち学習過程で第1クラスタイプに対して最も優れた分類性能を有する分類モデルが用いられる。
【0075】
オブジェクトのクラスタイプが第2クラスタイプとして決定された場合、第2クラス予測器730は、第2クラス予測モデル735を用いてオブジェクトのクラスを決定することができる。第2クラス予測モデル735として、例えば、分類モデル122,124,126のアンサンブルモデルが利用されてもよい。
【0076】
オブジェクトのクラスタイプが第nクラスタイプとして決定された場合、第nクラス予測器740は、第nクラス予測モデル745を用いてオブジェクトのクラスを決定することができる。第nクラス予測モデル745として、例えば、分類モデル122,124,126のうち学習過程で第nクラスタイプに対して最も優れた分類性能を有する分類モデルが利用されてもよい
。
【0077】
図8は、一実施形態に係る予測一貫性値に基づいて分類モデルを学習させることを説明するための図である。
【0078】
図8を参照すると、学習装置800は、予測一貫性値決定器820、学習データ区別器830及び学習実行器840を含む。
【0079】
予測一貫性値決定器820は、与えられた学習データ810に対して予測一貫性値を決定することができる。学習データ810は、例えば、オブジェクトが示されたイメージであってもよい。予測一貫性値決定器820は、複数の分類モデル822,824,826及び予測一貫性値算出器828を含む。分類モデル822,824,826は、互いに異なる学習回数又は互いに異なる回数のエポックで学習されたモデルであってもよい。予測一貫性値算出器828は、学習データ810に対して分類モデル822,824,826が出力したクラス予測値に基づいて予測一貫性値を算出することができる。
【0080】
学習データ区別器830は、予測一貫性値に基づいて学習データ810のオブジェクトに対応するクラスタイプを決定することができる。一実施形態において、学習データ区別器830は、予測一貫性値と閾値とを比較し、比較結果に応じてオブジェクトのクラスタイプを多数派クラス又は少数派クラスに分類する。予測一貫性値が閾値よりも大きい場合はオブジェクトのクラスタイプが多数派クラスに分類され、予測一貫性値が閾値よりも大きくない場合は、オブジェクトのクラスが少数派クラスに分類されてもよい。
【0081】
学習実行器840は、オブジェクトのクラスタイプに基づいて多数派クラス予測モデル852及び少数派クラス予測モデル854を学習させることができる。学習データ区別器830によってオブジェクトのクラスタイプが多数派クラスであるものと分類された場合、学習実行器840は、学習データ810に基づいて多数派クラス予測モデル852を学習させ得る。学習過程は、多数派クラス予測モデル852が学習データ810に対して出力したクラス予測値と学習データ810に定義されたクラス値との差を損失として定義し、当該損失が減少するように多数派クラス予測モデル852のパラメータ(例えば、連結加重値、バイアス)を調整する過程を含んでもよい
【0082】
オブジェクトのクラスタイプが少数派クラスであると分類された場合、学習実行器840は、学習データ810に基づいて少数派クラス予測モデル854を学習させることができる。学習過程は、少数派クラス予測モデル854が学習データ810に対して出力したクラス予測値と学習データ810に定義されたクラス値との間の差を損失として定義し、該当損失が減少するように少数派クラス予測モデル854のパラメータ(例えば、接続加重値、バイアス)を調整する過程を含んでもよい。
【0083】
学習装置800は、複数の学習データに対して上記のような過程を繰り返し行って多数派クラス予測モデル852及び少数派クラス予測モデル854のパラメータを最適化することができる。一実施形態において、学習が完了した多数派クラス予測モデル852は、
図4に示す多数派クラス予測モデル145として利用され、学習が完了した少数派クラス予測モデル854は、
図4に示す少数派クラス予測モデル155として利用されてもよい。
【0084】
図9は、他の実施形態に係る予測一貫性値に基づいて分類モデルを学習させることを説明するための図である。
【0085】
図9を参照すると、学習装置900は、予測一貫性値決定器820、学習データ区別器910及び学習実行器920を含む。予測一貫性値決定器820、学習データ区別器910、及び学習実行器920のそれぞれは、予測一貫性値決定器820、学習データ区別器910のそれぞれの1つ以上の動作を構成する命令語を格納するメモリ及び1つ以上のプロセッサを用いて実行されてもよい。予測一貫性値決定器820、学習データ区別器910及び学習実行器920それぞれは、予測一貫性値決定器820、学習データ区別器910のそれぞれの1つ以上の動作は、メモリに格納された命令がプロセッサによって実行されるものとして実現されてもよい。学習装置900は、予測一貫性値決定器820によって決定された予測一貫性値に基づいて能動的学習(active learning)を行ってもよい。学習装置900は、予測一貫性値に基づいて学習に使用する学習データを選別し学習を行うことができる。
【0086】
予測一貫性値決定器820は、与えられた学習データ810に対して予測一貫性値を決定することができる。これについては、
図8を参照した説明がそのまま適用され、重複する説明は省略する。
【0087】
学習データ区別器910は、予測一貫性値に基づいて学習データ810が分類し難いサンプルであるか否かを区別する。例えば、学習データ区別器910は、学習データ810に対する予測一貫性値が閾値よりも大きくなければ、学習データ810を難しいサンプルであると分類してもよい。予測一貫性値が閾値よりも大きい場合、学習データ810は分類モデル925の学習に利用されない。
【0088】
学習実行器920は、学習データ区別器910の学習データ810に対する分類結果に基づいて分類モデル925を学習させることができる。学習実行器920は、学習データ区別器910によって難しいサンプルであると分類された学習データのみを用いて分類モデル925を学習させることができる。学習過程は、分類モデル925が学習データ810に対して出力したクラス予測値と学習データ810に定義されたクラス値との間の差を損失として定義し、該当損失が減少するように分類モデル925のパラメータ(例えば、接続加重値、バイアス)を調整する過程を含んでもよい。このように、クラス分類の難しい学習データが選別されて学習され、学習の実行結果、分類モデル925は、クラス分類の難しいオブジェクトに強靭な分類性能を有することになる。
【0089】
図10は、一実施形態に係る半導体製造工程でイメージオブジェクト分類を介してウェハーの不良を鑑別する実施形態を説明するための図である。
【0090】
本明細書で説明された実施形態は、半導体製造工程でイメージオブジェクト分類を介してウェハーの不良を鑑別することに適用されてもよい。半導体製造工程においてウェハーには不良(例えば、スクラッチ、浮遊物、ピンホール、欠損、過剰なエッチング、消失など)が発生することがあり、不良が発生したウェハーを検出するためにウェハーの表面を撮影したウェハーイメージ1012,1014,1016が分類装置1000に入力されてもよい。例えば、正常状態のウェハーイメージ1012、不良1015が示されているウェハーイメージ1014及び不良1017が示されているウェハーイメージ1016が分類装置1000に入力されてもよい。
【0091】
分類装置1000は、予測一貫性値決定器1020、クラス分類器1030及び多数派クラス予測器1042、1044、…、1046を含んでいる。クラス予測器の個数は2つ以上であってもよい。予測一貫性値決定器1020、クラス分類器1030、及び多数派クラス予測器1042、1044、…、1046のそれぞれは、予測一貫性値決定器1020、クラス分類器1030のそれぞれの1つ以上の動作を構成する命令を格納するメモリ及び1つ以上のプロセッサを用いて実行されてもよい。予測一貫性値決定器1020、クラス分類器1030、及び多数派クラス予測器1042、1044、…、1046それぞれの動作は、メモリに格納された命令がプロセッサにより実行されるものとして実現されることができる。
【0092】
ウェハーイメージ1012が分類装置1000に入力される場合、ウェハーイメージ1012は、予測一貫性値決定器1020に含まれた互いに異なる学習回数で学習された分類モデルに入力され、分類モデルはウェハーイメージ1012に対するクラス予測値を出力することができる。予測一貫性値決定器1020はクラス予測値に基づいて予測一貫性値を決定し、クラス分類器1030は、予測一貫性値に基づいてウェハーイメージ1012に示されているウェハーの状態に対するクラスタイプを決定してもよい。ウェハーイメージ1012のクラスタイプが正常状態であると決定された場合、第1クラス予測器1042は、第1クラス予測モデルを用いてウェハーイメージ1012の最終クラスを決定することができる。
【0093】
ウェハーイメージ1014が分類装置1000に入力される場合、ウェハーイメージ1014は、予測一貫性値決定器1020に含まれた互いに異なる学習回数で学習された分類モデルに入力され、分類モデルは、ウェハーイメージ1014に対するクラス予測値を出力することができる。予測一貫性値決定器1020はクラス予測値に基づいて予測一貫性値を決定し、クラス分類器1030は、予測一貫性値に基づいてウェハーイメージ1014に示されたウェハーの状態に対するクラスタイプを決定してもよい。ウェハーイメージ1014のクラスタイプが第1不良状態であると決定された場合、第2クラス予測器1044は、第1不良状態に対して最も優れた分類性能を有する第2クラス予測モデルを用いて、ウェハーイメージ1014の最終クラスを決定することができる。
【0094】
分類装置1000にウェハーイメージ1014が入力されると、ウェハーイメージ1014は、予測一貫性値決定器1020に含まれた互いに異なる学習回数によって学習された分類モデルに入力され、分類モデルはウェハーイメージ1014に応答してクラス予測値を出力することができる。予測一貫性値決定器1020は、クラス予測値に基づいて予測一貫性値を決定し、クラス分類器1030は、ウェハーの状態に対応するクラスタイプを決定してもよい。ウェハーイメージ1014のクラスタイプが第1欠陥状態に該当すると判断されると、第2クラス予測器1044は、第1欠陥状態に対する分類性能に最も優れた第2クラス予測モデルを用いてウェハーイメージ1014の最終クラスを決定することができる。
【0095】
ウェハーイメージ1016が分類装置1000に入力される場合、ウェハーイメージ1016は、予測一貫性値決定器1020に含まれた互いに異なる学習回数で学習された分類モデルに入力され、分類モデルはウェハーイメージ1016に対するクラス予測値を出力できる。予測一貫性値決定器1020はクラス予測値に基づいて予測一貫性値を決定し、クラス分類器1030は、予測一貫性値に基づいてウェハーイメージ1016に示されたウェハーの状態に対するクラスタイプを決定してもよい。ウェハーイメージ1016のクラスタイプが第2不良状態であると決定された場合、第3クラス予測器は、第2不良状態に対して最も優れた分類性能を有する第3クラス予測モデルを用いて、ウェハーイメージ1016の最終クラスを決定することができる。不良状態に対するクラスタイプは数個存在し得る。
【0096】
分類装置1000は、ウェハーイメージ1012に対しては正常なものとして決定し、ウェハーイメージ1014及びウェハーイメージ1016に対しては不良が含まれていると決定してもよい。分類装置1000は、ウェハーイメージに基づいて不良が含まれているウェハーが探知されると、探知事実を外部に伝達することができる。
【0097】
図11は、一実施形態に係るイメージのオブジェクトを分類する分類装置の構成を示すブロック図である。
【0098】
図11を参照すると、分類装置1100は、入力イメージのオブジェクトを分類してオブジェクトのクラスを決定する装置である。分類装置1100は、
図1に示す分類装置100、
図7に示す分類装置700、及び
図10の分類装置1000に対応する。分類装置1100は、プロセッサ1110、メモリ1120、通信モジュール1130、入力モジュール1140、出力モジュール1150、及びイメージングセンサ1160を含む。分類装置1100の各構成要素は通信バス1170を介して通信してもよい。一実施形態において、分類装置1100にはこれらの構成要素の一部(例えば、入力モジュール1140、出力モジュール1150)が省略されたり、他の構成要素(例えば、イメージ取得モジュール)が追加されてもよい。本明細書において、「分類装置」とは「電子装置」に称されてもよい。
【0099】
プロセッサ1110は、分類装置1100の他の構成要素(例えば、ハードウェア又はソフトウェア構成要素)を制御し、様々なデータ処理又は演算を行うことができる。一実施形態によれば、データ処理又は演算の少なくとも一部として、プロセッサ1110は、他の構成要素(例えば、通信モジュール1130)から受信された命令又はデータをメモリ1120に格納し、メモリ1120に格納された命令又はデータを処理し、結果データをメモリ1120に格納することができる。
【0100】
一実施形態において、プロセッサ1110は、メインプロセッサ(例えば、中央処理装置又はアプリケーションプロセッサ)又はこれとは独立的又は共に運営可能な補助プロセッサ(例えば、グラフィック処理装置、神経網処理装置(NPU)、イメージ信号処理部、センサハブプロセッサ、又は、コミュニケーションプロセッサ)を含んでもよい。
【0101】
メモリ1120は、分類装置1100の構成要素(例えば、プロセッサ1110又は通信モジュール1130)によって用いられる様々なデータを格納する。データは、例えば、プログラム(例えば、アプリケーション)、これに関する命令に対する入力データ又は出力データ、及び分類モデルに対するデータを含んでもよい。メモリ1120は、プロセッサ1110によって実行可能な命令を格納してもよい。メモリ1120は、揮発性メモリ又は不揮発性メモリを含んでもよい。
【0102】
通信モジュール1130は、分類装置1100と他の装置間の直接(例えば、有線)通信チャネル又は無線通信チャンネルの樹立、及び樹立された通信チャンネルを通じた通信実行を支援することができる。通信モジュール1130は、通信機能を実行するための通信回路を含んでもよい。通信モジュール1130は、プロセッサ1110から独立的に運営され、直接(例えば、有線)通信又は無線通信をサポートするコミュニケーションプロセッサを含んでもよい。通信モジュール1130は、無線通信を行う無線通信モジュール(例えば、Bluetooth通信モジュール、セルラー通信モジュール、Wi-Fi通信モジュール、又はGNSS通信モジュール)又は有線通信モジュール(例えば、LAN通信モジュール、又は電力線通信モジュール)を含んでもよい。
【0103】
入力モジュール1140は、分類装置1100の構成要素(例えば、プロセッサ1110)に使用される命令語又はデータを分類装置1100の外部(例えば、ユーザ)から受信してもよい。入力モジュール1140は入力構成要素回路を含んでもよく、ユーザ入力を受信してもよい。入力モジュール1140は、例えば、キー(例えば、ボタン)及び/又はスクリーン上のタッチを認識するためのタッチ認識回路を含んでもよい。
【0104】
出力モジュール1150は、分類装置1100の外部に視覚的、聴覚的、又は触覚的フィードバックを提供する。出力モジュール1150は、例えば、LCDディスプレイ、OLEDディスプレイ、ホログラム装置、及びプロジェクター装置のようなディスプレイモジュール及び音響信号を分類装置1100の外部に出力する音響出力モジュールを含んでもよい。ディスプレイモジュールは、ディスプレイ駆動を制御するための制御回路をさらに含んでもよい。音響出力モジュールは、オブジェクトのクラス分類結果による音響信号、ガイド音声又は通知音を再生するスピーカを含んでもよい。
【0105】
イメージングセンサ1160、例えば、非制限的な例として電荷結合素子(charge-coupled device、CCD)又はCMOS(complementary metal-oxide-semiconductor)はイメージをキャプチャーしてもよい。イメージは、例えば、ウェハーイメージ(例えば、上記で説明したウェハーイメージ1012,1014,1016)であってもよい。
【0106】
メモリ1120に格納された命令がプロセッサ1110により実行されるとき、プロセッサ1110は、入力イメージ又はイメージングセンサ1160によってキャプチャーされたイメージ内のオブジェクトに対するクラス分類を行ってもよい。プロセッサ1110は入力イメージを受信し、入力イメージが入力された分類モデルから入力イメージ内のオブジェクトに対するクラス予測値を取得する。プロセッサ1110は、クラス予測値に基づいて予測一貫性値を決定してもよい。プロセッサ1110は、分類モデルから取得されたクラス予測値のうち最も頻度数の多いモードクラス予測値を決定し、クラス予測値とモードクラス予測値との間のマッチング頻度に基づいて予測一貫性値を決定してもよい。プロセッサ1110は、予測一貫性値に基づいてオブジェクトに対応するクラスタイプを決定してもよい。例えば、プロセッサ1110は、予測一貫性値と閾値を比較し、その比較結果に応じてオブジェクトに対応するクラスタイプを決定することができる。予測一貫性値が閾値よりも大きいことに応答して、プロセッサ1110は、オブジェクトに対応するクラスタイプを多数派クラスとして決定することができる。予測一貫性値が閾値よりも大きくないことに応答して、プロセッサ1110は、オブジェクトに対応するクラスタイプを少数派クラスとして決定してもよい。オブジェクトのクラスタイプが多数派クラスに対応する場合、プロセッサ1110は、多数派クラス予測モデルがオブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定してもよい。例えば、プロセッサ1110は、分類モデルのアンサンブルモデルを多数派クラス予測モデルとして用いてオブジェクトのクラスを決定してもよい。オブジェクトのクラスタイプが少数派クラスに対応する場合、プロセッサ1110は、少数派クラス予測モデルがオブジェクトに対して出力したクラス予測値に基づいてオブジェクトのクラスを決定してもよい。プロセッサ1110は、分類モデルから選択されたターゲット分類モデルを少数派クラス予測モデルとして用いてオブジェクトのクラスを決定してもよい。例えば、分類モデルの学習過程で少数派クラスに対して最も優れた分類性能を示した分類モデルがターゲット分類モデルに選択されてもよい。
【0107】
以上で説明された実施形態は、ハードウェア構成要素、ソフトウェア構成要素、又はハードウェア構成要素及びソフトウェア構成要素の組み合せで具現される。例えば、本実施形態で説明した装置及び構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ(digital signal processor)、マイクロコンピュータ、FPA(field programmable array)、PLU(programmable logic unit)、マイクロプロセッサー、又は命令(instruction)を実行して応答する異なる装置のように、1つ以上の汎用コンピュータ又は特殊目的コンピュータを用いて具現される。処理装置は、オペレーティングシステム(OS)及びオペレーティングシステム上で実行される1つ以上のソフトウェアアプリケーションを実行する。また、処理装置は、ソフトウェアの実行に応答してデータをアクセス、格納、操作、処理、及び生成する。理解の便宜のために、処理装置は1つが使用されるものとして説明する場合もあるが、当技術分野で通常の知識を有する者は、処理装置が複数の処理要素(processing element)及び/又は複数類型の処理要素を含むことが把握する。例えば、処理装置は、複数のプロセッサ又は1つのプロセッサ及び1つのコントローラを含む。また、並列プロセッサ(parallel processor)のような、他の処理構成も可能である。
【0108】
ソフトウェアは、コンピュータプログラム、コード、命令、又はそのうちの一つ以上の組合せを含み、希望の通りに動作するよう処理装置を構成したり、独立的又は結合的に処理装置を命令することができる。ソフトウェア及び/又はデータは、処理装置によって解釈されたり処理装置に命令又はデータを提供するために、いずれかの類型の機械、構成要素、物理的装置、仮想装置、コンピュータ格納媒体又は装置、又は送信される信号波に永久的又は一時的に具体化することができる。ソフトウェアはネットワークに連結されたコンピュータシステム上に分散され、分散した方法で格納されたり実行され得る。ソフトウェア及びデータは一つ以上のコンピュータで読出し可能な記録媒体に格納され得る。
【0109】
本実施形態による方法は、様々なコンピュータ手段を介して実施されるプログラム命令の形態で具現され、コンピュータ読み取り可能な記録媒体に記録される。記録媒体は、プログラム命令、データファイル、データ構造などを単独又は組み合せて含む。記録媒体及びプログラム命令は、本発明の目的のために特別に設計して構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり使用可能なものであってもよい。コンピュータ読み取り可能な記録媒体の例として、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD-ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気-光媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置を含む。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。
【0110】
上記で説明したハードウェア装置は、本発明に示す動作を実行するために1つ以上のソフトウェアモジュールとして作動するように構成してもよく、その逆も同様である。
【0111】
上述したように実施形態をたとえ限定された図面によって説明したが、当技術分野で通常の知識を有する者であれば、上記の説明に基づいて様々な技術的な修正及び変形を適用することができる。例えば、説明された技術が説明された方法と異なる順に実行され、及び/又は説明されたシステム、構造、装置、回路などの構成要素が説明された方法とは異なる形態に結合又は組み合わせられてもよく、他の構成要素又は均等物によって置き換え又は置換されたとしても適切な結果を達成することができる。
【0112】
したがって、他の具現、他の実施形態および特許請求の範囲と均等なものも後述する特許請求範囲の範囲に属する。