IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東レ株式会社の特許一覧

特許7609061データ分類装置、データ分類方法およびデータ分類プログラム
<>
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図1
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図2
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図3
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図4
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図5
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図6
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図7
  • 特許-データ分類装置、データ分類方法およびデータ分類プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-23
(45)【発行日】2025-01-07
(54)【発明の名称】データ分類装置、データ分類方法およびデータ分類プログラム
(51)【国際特許分類】
   G06N 3/02 20060101AFI20241224BHJP
   G06N 20/00 20190101ALI20241224BHJP
   G06F 16/906 20190101ALI20241224BHJP
【FI】
G06N3/02
G06N20/00
G06F16/906
【請求項の数】 8
(21)【出願番号】P 2021512280
(86)(22)【出願日】2021-02-10
(86)【国際出願番号】 JP2021005080
(87)【国際公開番号】W WO2021199706
(87)【国際公開日】2021-10-07
【審査請求日】2024-01-30
(31)【優先権主張番号】P 2020062979
(32)【優先日】2020-03-31
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000003159
【氏名又は名称】東レ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】水田 慎吾
(72)【発明者】
【氏名】池田 慶太
【審査官】真木 健彦
(56)【参考文献】
【文献】特開2000-207377(JP,A)
【文献】特開2001-142868(JP,A)
【文献】特開平10-074188(JP,A)
【文献】島 圭介, 外5名,未学習クラス推定ニューラルネットの提案と筋電義手制御への応用,日本ロボット学会誌,日本,2015年06月15日,Vol. 33, No. 4,pp.275-284,<URL: https://www.jstage.jst.go.jp/article/jrsj/33/4/33_33_275/_article/-char/ja/>
【文献】浦川 侑之介, 外2名,ペイロードの特徴量に注目した未知のネットワーク異常検出,CSS2018 コンピュータセキュリティシンポジウム2018論文集 [USB],日本,一般社団法人情報処理学会,2018年11月16日,Vol. 2018, No. 2,pp.1038-1045
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00 - 99/00
G06F 16/55
G06F 16/906
(57)【特許請求の範囲】
【請求項1】
分類対象のデータを取得するデータ取得部と、
ニューラルネットワークを用いて学習した学習済みモデルを用いて前記データを複数のクラスのいずれかに分類する分類部と、
前記データと前記学習済みモデルを生成する際に用いた学習済みデータとの類似度を算出する類似度算出部と、
前記類似度に基づいて前記データの前記複数のクラスへの属否を判定し、前記データが前記複数のクラスのいずれにも属さない場合、前記データは未知のクラスに属すると判定する判定部と、
を備え
前記学習済みモデルは、前記データを入力パラメータ、分類結果および前記データの特徴量を出力パラメータとし、
前記類似度算出部は、前記データおよび前記学習済みデータの特徴量を用いて類似度を算出する、
データ分類装置。
【請求項2】
記判定部は、
前記類似度が基準を満たす場合、前記分類部の分類結果にしたがって前記データが属するクラスを判定し、
前記類似度が前記基準を満たさない場合、前記データが未知のクラスであると判定する請求項に記載のデータ分類装置。
【請求項3】
前記判定部による判定結果とともに、少なくとも前記データに最も類似したデータを表示装置に表示させる制御部を備える請求項1または2に記載のデータ分類装置。
【請求項4】
前記判定部による判定回数が基準回数に達した場合、前記基準回数行った判定のうち前記データが前記複数のクラスのいずれかに属すると判定した割合である判定評価値を算出する評価値算出部と、
前記判定評価値が閾値より小さいとき、評価結果および前記学習済みモデルの再構築を促す情報の少なくともいずれか一方を出力する制御部と、
を備える請求項1~のいずれか一項に記載のデータ分類装置。
【請求項5】
前記類似度算出部は、
前記データの特徴量と前記学習済みデータの特徴量との特徴空間におけるユークリッド距離の各クラスにおける最小値を各クラスとの類似度として算出する請求項1~のいずれか一項に記載のデータ分類装置。
【請求項6】
前記類似度算出部は、
前記データの特徴量と前記複数のクラスをそれぞれ代表する前記学習済みデータとの特徴空間における所定の距離を各クラスとの類似度として算出する請求項1~のいずれか一項に記載のデータ分類装置。
【請求項7】
分類対象のデータを取得するデータ取得ステップと、
ニューラルネットワークを用いて学習した学習済みモデルを記憶部から読み出し、前記学習済みモデルを用いて前記データを複数のクラスのいずれかに分類する分類ステップと、
前記データと前記学習済みモデルを生成する際に用いた学習済みデータとの類似度を算出する類似度算出ステップと、
前記類似度に基づいて前記データの前記複数のクラスへの属否を判定し、前記データが前記複数のクラスのいずれにも属さない場合、前記データは未知のクラスに属すると判定する判定ステップと、
を含み、
前記学習済みモデルは、前記データを入力パラメータ、分類結果および前記データの特徴量を出力パラメータとし、
前記類似度算出ステップは、前記データおよび前記学習済みデータの特徴量を用いて類似度を算出する、
データ分類方法。
【請求項8】
分類対象のデータを取得するデータ取得ステップと、
ニューラルネットワークを用いて学習した学習済みモデルを用いて前記データを複数のクラスのいずれかに分類する分類ステップと、
前記データと前記学習済みモデルを生成する際に用いた学習済みデータとの類似度を算出する類似度算出ステップと、
前記類似度に基づいて前記データの前記複数のクラスへの属否を判定し、前記データが前記複数のクラスのいずれにも属さない場合、前記データは未知のクラスに属すると判定する判定ステップと、
をコンピュータに実行させ
前記学習済みモデルは、前記データを入力パラメータ、分類結果および前記データの特徴量を出力パラメータとし、
前記類似度算出ステップは、前記データおよび前記学習済みデータの特徴量を用いて類似度を算出する、
データ分類プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ分類装置、データ分類方法およびデータ分類プログラムに関する。
【背景技術】
【0002】
畳み込みニューラルネットワークを用いた学習によって構成された分類器にデータを分類させる技術が知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-96313号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述した分類器は、本来は分類できない未知のクラスのデータであっても、学習済みの既知のクラスのいずれかに分類してしまう。このため、データの中に未知のクラスが発生し得る場合には、分類の精度が低下するおそれがあった。そこで、未知のクラスのデータを既知のクラスに分類するのを抑制することができる技術が求められていた。
【0005】
本発明は、上記に鑑みてなされたものであって、未知のクラスのデータを既知のクラスに分類するのを抑制することができるデータ分類装置、データ分類方法およびデータ分類プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本発明に係るデータ分類装置は、分類対象のデータを取得するデータ取得部と、ニューラルネットワークを用いて学習した学習済みモデルを用いて前記データを複数のクラスのいずれかに分類する分類部と、前記データと前記学習済みモデルを生成する際に用いた学習済みデータとの類似度を算出する類似度算出部と、前記類似度に基づいて前記データの前記複数のクラスへの属否を判定し、前記データが前記複数のクラスのいずれにも属さない場合、前記データは未知のクラスに属すると判定する判定部と、を備える。
【0007】
本発明の好ましい態様に係るデータ分類装置は、上記発明において、前記学習済みモデルは、前記データを入力パラメータとし、分類結果および前記データの特徴量を出力パラメータとする。
【0008】
本発明の好ましい態様に係るデータ分類装置は、上記発明において、前記類似度算出部は、前記データおよび前記学習済みデータの特徴量を用いて類似度を算出し、前記判定部は、前記類似度が基準を満たす場合、前記分類部の分類結果にしたがって前記データが属するクラスを判定し、前記類似度が前記基準を満たさない場合、前記データが未知のクラスであると判定する。
【0009】
本発明の好ましい態様に係るデータ分類装置は、上記発明において、前記判定部による判定結果とともに、少なくとも前記データに最も類似したデータを表示装置に表示させる制御部を備える。
【0010】
本発明の好ましい態様に係るデータ分類装置は、上記発明において、前記判定部による判定回数が基準回数に達した場合、前記基準回数行った判定のうち前記データが前記複数のクラスのいずれかに属すると判定した割合である判定評価値を算出する評価値算出部と、前記判定評価値が閾値より小さいとき、評価結果および前記学習済みモデルの再構築を促す情報の少なくともいずれか一方を出力する制御部と、を備える。
【0011】
本発明の好ましい態様に係るデータ分類装置は、上記発明において、前記類似度算出部は、前記データの特徴量と前記学習済みデータの特徴量との特徴空間におけるユークリッド距離の各クラスにおける最小値を各クラスとの類似度として算出する。
【0012】
本発明の好ましい態様に係るデータ分類装置は、上記発明において、前記類似度算出部は、前記データの特徴量と前記複数のクラスをそれぞれ代表する前記学習済みデータとの特徴空間における所定の距離を各クラスとの類似度として算出する。
【0013】
本発明に係るデータ分類方法は、分類対象のデータを取得するデータ取得ステップと、ニューラルネットワークを用いて学習した学習済みモデルを記憶部から読み出し、前記学習済みモデルを用いて前記データを複数のクラスのいずれかに分類する分類ステップと、前記データと前記学習済みモデルを生成する際に用いた学習済みデータとの類似度を算出する類似度算出ステップと、前記類似度に基づいて前記データの前記複数のクラスへの属否を判定し、前記データが前記複数のクラスのいずれにも属さない場合、前記データは未知のクラスに属すると判定する判定ステップと、を含む。
【0014】
本発明に係るデータ分類プログラムは、分類対象のデータを取得するデータ取得ステップと、ニューラルネットワークを用いて学習した学習済みモデルを用いて前記データを複数のクラスのいずれかに分類する分類ステップと、前記データと前記学習済みモデルを生成する際に用いた学習済みデータとの類似度を算出する類似度算出ステップと、前記類似度に基づいて前記データの前記複数のクラスへの属否を判定し、前記データが前記複数のクラスのいずれにも属さない場合、前記データは未知のクラスに属すると判定する判定ステップと、をコンピュータに実行させる。
【発明の効果】
【0015】
本発明によれば、未知のクラスのデータを既知のクラスに分類するのを抑制することができる。
【図面の簡単な説明】
【0016】
図1図1は、本発明の一実施の形態に係るデータ分類装置の機能構成を示すブロック図である。
図2図2は、学習済みデータ記憶部92が記憶する欠点画像データの例を示す図である。
図3図3は、本発明の一実施の形態に係るデータ分類装置が行う処理の概要を示すフローチャートである。
図4図4は、判定結果の表示例(その1)を示す図である。
図5図5は、判定結果の表示例(その2)を示す図である。
図6図6は、本発明の一実施の形態の効果を説明する図である。
図7図7は、図6に示す例で既知のクラスと未知のクラスを弁別する閾値を変更した場合の未知のクラスの検出率と既知のクラスの誤検出率との変動を示す図である。
図8図8は、本発明の一実施の形態にて、既知のクラスと未知のクラスとを弁別するための境界を与える閾値の別の決め方を説明する図である。
【発明を実施するための形態】
【0017】
以下、添付図面を参照して、本発明を実施するための形態(以下、「実施の形態」という)を説明する。なお、以下に説明する実施の形態によって本発明が限定されるものではない。
【0018】
図1は、本発明の一実施の形態に係るデータ分類装置の機能構成を示すブロック図である。同図に示すデータ分類装置100は、ポリマーを用いたフィルムの製造プロセスにおいて発生する欠点を撮像した欠点画像のデータを、欠点種に応じて異なる複数のクラスのいずれかに分類する装置である。分類対象の欠点は、フィルムの製造プロセスで溶融した原料が製造装置の内部で滞留し、過剰な温度、熱、時間等に起因して変性したものや製造工程で混入した異物、製造装置に起因する傷などである。
【0019】
以下、データ分類装置100の機能構成を説明する。データ分類装置100は、入力部1、データ取得部2、画像処理部3、分類部4、類似度算出部5、判定部6、評価値算出部7、制御部8、および記憶部9を備える。
【0020】
入力部1は、各種情報の入力を受け付ける。入力部1は、キーボード、マウス、マイクロフォン等のユーザインタフェースを用いて構成される。
【0021】
データ取得部2は、フィルムの表面を撮像して欠点を抽出してその欠点を含む欠点画像のデータを生成する欠点検査機から送られてくる欠点画像のデータを取得し、記憶部9に出力して記憶させる。
【0022】
画像処理部3は、欠点画像のデータに対して公知の画像処理を行うとともに、欠点画像のデータの欠点以外の部分を共通の背景とし、その背景に欠点部分を重畳する画像処理を行う。背景は、例えばグレーの単色からなる。
【0023】
分類部4は、ニューラルネットワークを用いて学習した学習済みモデルに対して、画像処理部3が処理を施した欠点画像のデータを入力することにより、欠点画像のデータを複数のクラスのいずれかに分類する。学習済みモデルは、入力層、中間層および出力層からなり、各層が一または複数のノードを有するニューラルネットワークである。学習済みモデルは、ニューラルネットワークのネットワークパラメータを最適化する学習を行うことによって生成されたものである。ネットワークパラメータには、ニューラルネットワークの層間の重みやバイアスに関する情報が含まれる。学習済みモデルの入力パラメータは欠点画像のデータであり、出力パラメータは複数のクラスの各々に属する確率と、欠点画像のデータにおける所定の特徴量である。このニューラルネットワークは、Softmax損失関数、より好ましくはSoftmax損失関数にL2ノルムの制約を加えたL2 Softmax損失関数、を導入した畳み込みニューラルネットワーク(CNN)である(L2 Softmax損失関数については、例えばR. Ranjan et al., “L2-contsrained Softmax Loss for Discriminative Face Verification”, preprint, arXiv:1703.09507 [cs.CV] (https://arxiv.org/pdf/1703.09507.pdf)を参照)。特徴量は、一般に画像データの特徴を与える複数の成分からなる多次元のベクトルとして定義される。
【0024】
類似度算出部5は、欠点画像のデータと学習済みモデルを生成する際に用いた学習済みの欠点画像のデータ(以下、学習済みデータともいう)との類似度を算出する。類似度算出部5は、欠点画像のデータの特徴量と学習済みデータの特徴量を用いて類似度を算出する。類似度としては、例えばユークリッド距離、マハラノビス距離、コサイン類似度等のいずれかを適用することができる。
【0025】
判定部6は、類似度に基づいて欠点画像のデータの複数のクラスへの属否を判定し、そのデータが複数のクラスのいずれにも属さない場合には未知のクラスに属すると判定する。判定部6は、類似度が所定の基準を満たす場合、分類部4の分類結果にしたがって欠点画像のデータが属するクラスを判定する一方、類似度が基準を満たさない場合、欠点画像のデータが未知のクラスであると判定する。
【0026】
評価値算出部7は、判定部6による判定回数が所定の基準回数に達した場合、基準回数分の判定のうち欠点画像のデータが複数のクラスのいずれかに属すると判定した割合である判定評価値を算出する。
【0027】
制御部8は、データ分類装置100の動作を統括して制御する。制御部8は、判定部6の判定結果を表示装置に表示させる表示制御部81を有する。表示制御部81は、判定部6による判定結果とともに、欠点画像のデータに最も類似した欠点画像のデータを表示装置に出力して表示させる。また、制御部8は、判定評価値が閾値より小さいとき、評価結果および学習済みモデルの再構築を促す情報の少なくともいずれか一方を出力する。制御部8は、表示装置にその情報を出力して表示させてもよいし、音声出力装置にその情報を出力して音声出力させてもよい。
【0028】
記憶部9は、学習済みモデル記憶部91と、学習済みデータ記憶部92とを備える。学習済みモデル記憶部91は、上述した学習済みモデルを記憶する。学習済みデータ記憶部92は、学習済みモデルを学習する際に用いた欠点画像データ(以下、学習済みデータという)、その学習済みデータの特徴量および属するクラスを記憶する。図2は、学習済みデータ記憶部92が記憶する学習済みデータの例を示す図である。図2では、欠点種のクラスが4つある場合(欠点種1~欠点種4)を例示している。
【0029】
記憶部9は、判定部6による判定回数を記憶する。この判定回数は、所定の基準回数に達すると、制御部8の制御のもとでリセットされる。また、記憶部9は、データ分類装置100を動作させるための各種プログラム、およびデータ分類装置100の動作に必要な各種パラメータ等を含むデータを記憶する。各種プログラムには、本実施の形態に係るデータ分類プログラムも含まれる。記憶部9は、各種プログラム等があらかじめインストールしたROM(Read Only Memory)、および各処理の演算パラメータやデータ等を記憶するRAM(Random Access Memory)等を用いて構成される。
【0030】
各種プログラムは、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ、CD-ROM、DVD-ROM、Blu-ray(登録商標)等のコンピュータ読み取り可能な記録媒体に記録してもよいし、通信ネットワークを介してダウンロード可能としてもよい。ここでいう通信ネットワークは、例えば既存の公衆回線網、LAN(Local Area Network)、およびWAN(Wide Area Network)等の少なくともいずれかを用いて構成されるものであり、有線、無線を問わない。
【0031】
以上の機能構成を有するデータ分類装置100は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の1または複数のハードウェアを用いて構成されるコンピュータである。
【0032】
図3は、データ分類装置100が行う処理の概要を示すフローチャートである。まず、データ取得部2が欠点検査機から欠点画像のデータを取得する(ステップS1)。
【0033】
続いて、画像処理部3は画像処理を行う(ステップS2)。この際、画像処理部3は、ルールベースの画像処理を実施する。ここでの目的は画像中の欠点部位以外の不要な領域を除去することや、欠点が撮像されていないことが明らかな画像を排除すること等である。ステップS3以降の分類処理は、すべての画像を使用してもよいし、ステップS2の画像処理で分類対象の画像の選別を実施してもよい。ここでは、欠点部分を中心に特定のサイズで切り出す処理や、欠点以外の背景部分をグレー等の単色の背景にする処理を行い、この背景に欠点部分を重畳する。
【0034】
この後、分類部4は、学習済みモデル記憶部91が記憶する学習済みモデルを用いて分類を行う(ステップS3)。具体的には、分類部4は、画像処理部3が処理を施した欠点画像のデータを学習済みモデルに入力し、複数のクラスの各々に属する確率と、入力した欠点画像のデータの特徴量を出力パラメータとして取得する。
【0035】
続いて、類似度算出部5は、学習済みデータ記憶部92を参照してステップS1で取得した欠点画像のデータと学習済みデータとの類似度を算出する(ステップS4)。例えば、類似度算出部5は、欠点画像のデータの特徴量と学習済みデータの特徴量とのユークリッド距離を算出し、クラスごとのユークリッド距離の最小値を類似度として算出する。
【0036】
この後、判定部6は、まず類似度が所定の基準を満足しているか否かを判定する(ステップS5)。ステップS5において類似度が基準を満足している場合(ステップS5:Yes)、データ分類装置100はステップS6へ移行する。ここでの基準は、例えば欠点画像のデータの特徴量と各クラスの学習済みデータの特徴量とのユークリッド距離の最小値を類似度とする場合、その最小値の取る値の範囲として定義される。
【0037】
ステップS6において、判定部6は、分類部4による分類結果にしたがって判定を行う(ステップS6)。具体的には、判定部6は、ステップS3で取得した確率が最大であるクラスを、欠点画像のデータが属するクラスと判定する。
【0038】
ステップS5において、類似度が基準を満足していない場合(ステップS5:No)、判定部6は、欠点画像のデータが未知のクラスであると判定する(ステップS7)。
【0039】
ステップS6またはS7の後、制御部8は、記憶部9が記憶する判定回数を1増加させる(ステップS8)。
【0040】
続いて、表示制御部81は表示装置に判定結果を出力して表示させる(ステップS9)。図4および図5は、判定部6による判定結果の表示装置における表示例を示す図である。具体的には、図4は欠点画像のデータが既知のクラスである場合を示し、図5は欠点画像のデータが未知のクラスである場合を示している。
【0041】
図4に示す画面201では、欠点画像のデータ(画像名「Sample1.png」)が欠点種1に分類されたことを示す情報と、ユークリッド距離が近い順に4つの画像とユークリッド距離を表示している。この4つの画像はすべて欠点種1の画像である。
【0042】
図5に示す画面202では、欠点画像のデータ(画像名「Sample3.png」)が未知のクラスであることを示す情報と、ユークリッド距離が近い順に4つの画像を示している。この4つの画像は互いに欠点種が異なっている。
【0043】
これらの表示例によれば、判定結果とともに分類対象の画像と類似している画像を表示するため、判定の結果だけでなくその判定の根拠となる情報を提示して、ユーザに判定結果を視覚的に納得させることができる。なお、類似する画像とユークリッド距離の少なくとも一方のみを表示してもよい。また、表示する画像は4つに限られず、1つ以上であれば任意に設定してもよい。
【0044】
ステップS9の後、評価値算出部7は、記憶部9を参照して、判定部6による判定回数と所定の基準回数とを比較する(ステップS10)。判定部6による判定回数が基準回数未満の場合(ステップ10:No)は、ステップS1のデータ取得処理に戻って処理を繰り返し実行する。判定部6による判定回数が基準回数に達した場合(ステップS10:Yes)、評価値算出部7は、基準回数行った判定のうち欠点画像のデータが複数のクラスのいずれかに属すると判定した割合である判定評価値を算出する(ステップS11)。
【0045】
算出された判定評価値が所定の閾値よりも小さい場合(ステップS12:Yes)、表示制御部81は判定評価結果の情報を表示装置に出力して表示させることにより、判定評価結果をユーザに報知する(ステップS13)。なお、表示制御部81は、判定評価結果の代わりに、学習済みモデルの再構築を促す情報を表示装置に表示させてもよいし、判定評価結果および学習済みモデルの再構築を促す情報を表示装置に表示させてもよい。これにより、ユーザは学習済みモデルの精度が適切でないと認識することができる。
【0046】
続いて、制御部8は、記憶部9が記憶する判定回数をリセットさせて0とする(ステップS14)。この後、データ分類装置100は一連の処理を終了する。
【0047】
ステップS12において、算出された判定評価値が所定の閾値以上の場合は(ステップS12:No)、データ分類装置100はステップS14へ移行し、判定回数をリセットして一連の処理を終了する。
【0048】
図6は、以上説明した実施の形態の効果を説明する図である。具体的には、図6は、(a)既知のクラスのサンプルと学習済みデータの各クラスとのユークリッド距離の最小値を算出した結果、(b)未知のクラスのサンプルと学習済みデータの各クラスとのユークリッド距離の最小値を算出した結果、をそれぞれ示すヒストグラムである。ここでは、サンプルが属するクラスを予め判別済みであるとしてヒストグラムを作成している。図6においては、既知のクラスと未知のクラスとを弁別するための境界を与える閾値として、2通りの閾値Th1、Th2を設定した場合を示している。
【0049】
まず、閾値をTh1とした場合、すなわち閾値Th1以下のサンプルが既知のクラスと定義した場合を説明する。この場合、(a)によれば既知のクラスのサンプルの一部は未知のクラスに含まれる一方、(b)によれば未知のクラスのサンプルは既知のクラスに含まれることはない。
【0050】
次に、閾値をTh2とした場合、すなわち閾値Th2以下のサンプルが既知のクラスと定義した場合を説明する。この場合、(a)によれば既知のクラスのサンプルが全て閾値以下に含まれる一方、(b)によれば未知のクラスの多くが既知のクラスに含まれる。
【0051】
図7は、図6に示す例で閾値を変更した場合の未知のクラスの検出率と既知のクラスの誤検出率との変動を示す図である。図7に示す曲線301は、受信者応答曲線(ROC:Receiver Operating Characteristic)と呼ばれる曲線であり、曲線上の点Pおよび点Qが、閾値Th1およびTh2にそれぞれ対応している。閾値Th1の場合、検出率は100%である一方、誤検出率は10%未満である。これに対して、閾値Th2の場合、検出率は15%程度である一方、誤検出率は0%である。この曲線301と横軸との間の面積であるAUC(Area Under ROC Curve)は0.9899であり、完全に分離可能な場合(AUC=1.00)にかなり近い値であることが分かった。すなわち、本実施の形態によれば、既知クラスと未知クラスを高精度で分離できることが明らかになった。
【0052】
図8は、以上説明した実施形態にて、既知のクラスと未知のクラスとを弁別するための境界を与える閾値の別の決め方を説明する図である。図8の(a)は、既知のクラスのサンプルと学習済みデータの各クラスとのユークリッド距離の最小値を算出した結果を示すヒストグラムと、その正規分布曲線Cとを示す図である。この正規分布曲線Cは、ヒストグラムが正規分布していると仮定して引いた線である。図8の(b)は、未知のクラスのサンプルと学習済みデータの各クラスとのユークリッド距離の最小値を算出した結果を示すヒストグラムである。図8では、図6と同じく、サンプルが属するクラスを予め判別済みであるとしてヒストグラムを作成している。図8においては、既知のクラスと未知のクラスとを弁別するための境界を与える閾値として、閾値Th3、あるいはTh4を設定した場合を示している。
【0053】
既知のクラスと未知のクラスとを弁別するための境界を与える閾値を設定するにあたり、未知のクラスのサンプルを予め用意することが難しい場合がある。そのような場合、閾値は既知のクラスのサンプルと学習済みのデータの各クラスとのユークリッド距離の最小値から設定することになる。
【0054】
まず、既知のクラスのサンプルと学習済みデータの各クラスとのユークリッド距離の最小値を算出した結果を示すヒストグラムに正規分布を仮定する。次に、その正規分布の平均μと標準偏差σとから算出される信頼区間から閾値を決定する。なお、求める分布は、正規分布に限らず、半正規分布、ポアソン分布を用いることや、多峰性を考慮した混合分布などを確率分布として仮定してもよい。
【0055】
ここで、閾値をTh3(正規分布の66%信頼区間:平均μ+1σ)とした場合、すなわち閾値Th3以下のサンプルが既知のクラスと定義した場合を説明する。この場合、図8の(a)に示すように、既知のクラスのサンプルの一部は未知のクラスに含まれる一方、(b)に示すように、未知のクラスのサンプルは既知のクラスに含まれることがない。
【0056】
また、閾値をTh4(正規分布の99.9997信頼区間:平均μ+6σ)とした場合、すなわち閾値Th4以下のサンプルが既知のクラスと定義した場合を説明する。この場合、図8の(a)に示すように、既知のクラスのサンプルが全て閾値以下に含まれる一方、(b)に示すように、未知のクラスの多くが既知のクラスに含まれる。
【0057】
以上より、未知のクラスのサンプルを予め用意することが難しい場合は、既知のクラスのサンプルのみから運用用途に応じた閾値を設定すればよい。例えば既知のクラスのサンプルを未知のクラスのサンプルであると誤って判別することを避けたい場合は、閾値Th4のように設定すればよい。逆に未知のクラスのサンプルを既知のクラスのサンプルであると誤って判別することを避けたい場合は閾値Th3のように設定すればよい。閾値の設定は上記に限られるものではなく、運用目的に応じて閾値を設定することが好ましい。
【0058】
以上説明した本発明の一実施の形態によれば、取得した欠点画像のデータと学習済みモデルを生成する際に用いた学習済みデータとの類似度を算出し、算出した類似度に基づいて欠点画像のデータの複数のクラスへの属否を判定し、そのデータが複数のクラスのいずれにも属さない場合には未知のクラスに属すると判定するため、未知のクラスのデータを既知のクラスに分類するのを抑制することができる。
【0059】
また、本実施の形態によれば、判定結果とともに、少なくとも欠点画像のデータに最も類似した欠点画像のデータを表示装置に表示させるため、ユーザは欠点画像のデータが既知のクラスと未知のクラスとのどちらに属しているのかに加えて、その判定の根拠を視覚的に把握することができる。
【0060】
また、本実施の形態によれば、判定回数が基準回数に達した場合、基準回数行った判定のうち欠点画像のデータが複数のクラスのいずれかに属すると判定した割合である判定評価値を算出し、算出結果が閾値より小さいとき、評価結果または学習済みモデルの再構築を促す情報を出力するため、使用している学習済みモデルが有効でない場合には速やかにその旨を報知することができる。この点に関して、従来のフィルムの製造プロセスでは、欠点検査機の光学系を変えたり、製品の製造条件を変更したりすると、それまで使用していた学習済みモデルでは適切に分類することができなくなるおそれがあった。加えて、運用中に分類自体を評価すること自体が難しかった。これに対して、本実施の形態では、所定の間隔で分類自体を評価するため、製造プロセスに変更があった場合には、学習済みモデルの不適合を的確にユーザに報知することができる。また、ステップS2で画像への前処理を実施しているが、ここに誤りがある可能性を考慮し、あらかじめ準備したステップS2の画像処理を実施しない画像で分類することや、あらかじめ準備した閾値、フィルタ等を変更した条件の別の画像処理方法を実施、再度ステップS3以降の分類を試すことなども可能である。
【0061】
ここまで、本発明を実施するための形態を説明してきたが、本発明は、上述した一実施の形態によってのみ限定されるべきものではない。例えば、類似度算出部5は、欠点画像のデータの特徴量と、各クラスの代表画像のデータの特徴量との間の類似度を算出してもよい。代表画像は、各クラスの特徴量の特徴空間における重心に最も近い特徴量を有する画像でもよいし、各クラスの特徴量の平均に最も近い特徴量を有する画像でもよい。
【0062】
また、本発明は、フィルム製造時の欠点判定以外にも、時系列データの異常検知(例えば人の心拍データの不整脈検知)などにも適用することができる。
【産業上の利用可能性】
【0063】
本発明のデータ分類装置、データ分類方法およびデータ分類プログラムは、未知のクラスのデータを既知のクラスに分類するのを抑制するのに好ましく適用できるが、適用範囲はこれに限られない。
【符号の説明】
【0064】
1 入力部
2 データ取得部
3 画像処理部
4 分類部
5 類似度判定部
6 判定部
7 評価値算出部
8 制御部
9 記憶部
81 表示制御部
91 学習済みモデル記憶部
92 学習済みデータ記憶部
100 データ分類装置
201、202 画面
301 曲線
図1
図2
図3
図4
図5
図6
図7
図8