IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社テクムズの特許一覧

特開2022-21858教師データの修正方法、その装置及びそのコンピュータプログラム
<>
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図1
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図2
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図3
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図4
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図5
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図6
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図7
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図8
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図9
  • 特開-教師データの修正方法、その装置及びそのコンピュータプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022021858
(43)【公開日】2022-02-03
(54)【発明の名称】教師データの修正方法、その装置及びそのコンピュータプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20220127BHJP
【FI】
G06T7/00 350B
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2020125717
(22)【出願日】2020-07-22
(71)【出願人】
【識別番号】519117709
【氏名又は名称】株式会社テクムズ
(74)【代理人】
【識別番号】100095577
【弁理士】
【氏名又は名称】小西 富雅
(74)【代理人】
【識別番号】100100424
【弁理士】
【氏名又は名称】中村 知公
(72)【発明者】
【氏名】鈴木 孝昌
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA03
5L096CA02
5L096DA02
5L096EA39
5L096FA35
5L096GA30
5L096HA08
5L096JA03
5L096JA11
5L096KA04
(57)【要約】
【課題】機械学習型の判別装置に用いる教師データを修正する。これにより、判別装置の判別精度を向上させる。
【解決手段】教師データのセットで学習させた判別装置に判別対象として各教師データを構成する一次データを入力し、その判別結果と一次データに付されていた教師データのラベルとを比較することにより、不正確なラベルの付された、即ち信用のおけない教師データ(不信教師データ)を抽出できる。このように抽出された不信教師データを修正作業の対象とする。
【選択図】 図4
【特許請求の範囲】
【請求項1】
第1ラベル又は第2ラベルが付された一次データを教師データとして準備する第1教師データ準備ステップと、
学習機能を備えた判別装置へ前記教師データのセットを入力して学習させる第1学習ステップと、
学習済の前記判別装置へ前記教師データのセットの各前記一次データを入力して、該各一次データの判別結果を出力させる第1出力ステップと、
前記教師データでは前記第1ラベルが付されていた前記一次データであって前記第1出力ステップでは前記第2ラベル側に判別されたもの、及び/又は、前記教師データでは前記第2ラベルが付されていた前記一次データであって前記第1出力ステップでは前記第1ラベル側に判別されたもの、を所定のルールに基づき抽出する、第1データ抽出ステップと、
該第1データ抽出ステップで抽出された一次データのラベルを再評価する第1教師データ再評価ステップと、を実行する教師データの修正方法。
【請求項2】
前記第1教師データ再評価ステップで再評価されたラベルが付された教師データを用いて、請求項1で規定する前記第1出力ステップ、前記第1データ抽出ステップ及び第1教師データ再評価ステップを実行する、請求項1に記載の教師データの修正方法。
【請求項3】
前記第1教師データ再評価ステップにおいて、前記第1データ抽出ステップにて抽出された一次データに付されたラベルを再評価したとき、その再評価結果のラベルが教師データに予め付されたラベルと異なるラベルとなった一次データを特定し、
該特定された一次データについて教師データとして付されるラベルを変更するとともに、該変更されるラベルを変調してこれが学習されるときに重み付けされるようにする請求項1又は2に記載の教師データの修正方法。
【請求項4】
前記第1データ抽出ステップで抽出された一次データを前記出力ステップの判別結果と併せてモニタに表示する表示ステップが、更に実行される請求項1~3の何れかに記載の教師データの修正方法。
【請求項5】
前記一次データに付されたラベルの変更を許容する入力エリアが前記モニタに表示される、請求項5に記載の教師データの修正方法。
【請求項6】
前記一次データは画像データであり、
前記表示ステップでは、前記一次データとしての画像を表示するとともに、前記判別結果を導き出した画像の領域を拡大表示する、請求項4又は5に記載の教師データの修正方法。
【請求項7】
請求項1~6のいずれかに記載の教師データの修正方法により修正された教師データを用いて、学習機能を備えた判別装置に学習させる、判別装置の学習方法。
【請求項8】
請求項7に記載の学習済の前記判別装置に検査対象の一次データを入力して、該入力された一次データの判別結果を出力する、一次データの判別方法。
【請求項9】
第1ラベル又は第2ラベルが付された一次データを教師データとして保存する教師データ保存部と、
学習機能を備え、前記教師データのセットが入力された学習済の判別装置であって、前記一次データが入力されて、該一次データの判別結果を出力する判別装置と、
前記教師データでは前記第1ラベルが付されていた前記一次データであって前記判別装置では前記第2ラベル側に判別されたもの、及び/又は前記教師データでは前記第2ラベルが付されていた前記一次データであって前記判別装置では前記第1ラベル側に判別されたもの、を所定のルールに基づき抽出する、データ抽出部と、を備える教師データの修正装置。
【請求項10】
請求項10に記載の修正装置において、前記データ抽出部が抽出した一次データを前記教師データから削除する教師データ削除部が更に備えられる、請求項10に記載の教師データ修正装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は教師データの修正方法、その装置及びその装置に適用されるコンピュータプログラムの改良に関する。
【背景技術】
【0002】
工業用の精密部品の表面に小さな傷、凹凸その他の変形(以下、欠陥と総称する)があるとその性能が著しく低下する。
そこで従来では、精密部品を出荷する前に、画像処理技術を利用してその欠陥の有無を判別していた。画像処理の一例として、ニューラルネットワーク等を利用した所謂AI技術である機械学習型判別装置を用いることが提案されている。
かかる学習型判別装置に用いられる教師データは、撮影した画像と該画像を目視等で評価して得た欠陥の有無のラベル(OKラベル、NGラベル)との組合せからなる。判別装置の判別精度には、判別装置が備えるAIソフトばかりでなく、教師データ自体の正確さも関係している。
学習型判別装置を製造若しくは使用するユーザからみて、AIソフト自体に修正を加えることは極めて困難である。そこで一般的に判別精度を向上するため、教師データを追加することが行われている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2019-212073号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、教師データの追加には手間がかかる。
そこで、既存の教師データのみを使って判別精度を向上することが求められている。
しかしながら、一般的に多数の教師データの一つ一つの正確さ、即ち画像データに正確にOKラベルや、NGラベルが付されているか否かを再評価することは現実的ではない。
仮に、当該再評価を実行したとしても、人が行う評価に一定の誤差が含まれることは避けられない。
【課題を解決するための手段】
【0005】
本発明者は、かかる課題を解決すべく鋭意検討を重ねてきた結果、教師データのセットで学習させた判別装置に判別対象として各教師データを構成する画像データを入力し、その判別結果と画像データに付されていた教師データのラベルとを比較することにより、不正確なラベルの付された、即ち信用のおけない教師データ(不信教師データ)を抽出できることに気が付いた。
抽出された不信教師データに再評価作業を集中することでその修正作業の工数を軽減できる。
以上、画像データの判別について論を進めてきたが、教師データとして画像データ以外のデータ、例えば波形データやテキストデータを対象とすることもできる。
【0006】
以上より、この発明の第1の局面は次のように規定される。
第1ラベル(以下「OKラベル」で代表させることあり)又は第2ラベル(以下「NGラベル」で代表させることあり)が付された一次データ(以下「画像データ」で代表させることあり)を教師データとして準備する第1教師データ準備ステップと、
学習機能を備えた判別装置(以下「判別装置」で代表させることあり)として前記教師データのセットを入力して学習させる第1学習ステップと、
学習済の前記判別装置へ教師データのセットの各前記一次データ(画像データ)を入力して、該各一次データ(画像データ)の判別結果を出力させる第1出力ステップと、
前記教師データでは前記第1ラベル(OKラベル)が付されていた前記一次データ(画像データ)であって前記第1出力ステップでは前記第2ラベル(NGラベル)側に判別されたもの、及び/又は、前記教師データでは前記第2ラベル(NGラベル)が付されていた前記一次データ(画像データ)であって前記第1出力ステップでは前記第1ラベル(OKデータ)側に判別されたもの、を所定のルールに基づき抽出する、第1データ抽出ステップと、
該第1データ抽出ステップで抽出された一次データ(画像データ)のラベルを再評価する第1教師データ再評価ステップと、を実行する教師データの修正方法。
【0007】
このように規定される第1の局面の教師データの修正方法によれば、予め取得した教師データのセットを用いて判別装置を学習させる。教師データは一次データと該一次データに付されたラベルとからなる。この教師データのセットは、例えば数千~数万個に及ぶ。全教師データ若しくは大多数の教師データについて、その一次データを学習済の判別装置に入力して、各一次データを判別させる。判別結果として、例えばラベルに属する指標が出力される。
例えば、精密部品の判別装置の場合、OKラベルに判別される指標(スカラ)が1~3、NGラベルに判別される指標が5以上として表されることがある。この場合、教師データとしてOKラベルが付されていた画像データであっても、学習済の判別装置から5以上の指標が出力されることがある。即ち、予め教師データに付されたラベルと判別装置の出力とが一致しないことがある。この明細書では、かかる教師データを不信教師データと名付ける。
【0008】
不信教師データはそのラベル付けが不正確である可能性があるので、当該教師データのラベルについて再評価を行う。再評価の結果を教師データに反映させることで、即ち教師データがより正しいもの、即ち正確なラベル付けのなされたものに修正される。また、かかる不信教師データを削除し、正確な可能性の高い教師データのみからなる教師データのセットを判別装置に再学習させることで、判別装置の判別精度が向上する。ここに、正確な可能性が高い教師データは予め教師データに付されたラベルと学習済判別装置の判別結果とが一致するものである。
【0009】
この発明の第2の局面は次のように規定される。即ち、第1の局面に規定の修正方法において、前記第1教師データ再評価ステップで再評価されたラベルを付された教師データのセットを用いて、前記第1出力ステップ、前記第1データ抽出ステップ及び第1教師データ再評価ステップをそれぞれ第2出力ステップ、第2データ抽出ステップ及び第2教師データ再評価ステップとして実行する。
このように規定される第2の局面の修正方法によれば、修正した教師データのセットを用いて、第1の局面の各ステップを再度実行して、更に教師データの修正を繰り返す。これにより、教師データの修正がより徹底される。よって、教師データの全体の精度が向上し、もって、判別の精度が向上する。
【0010】
この発明の第3の局面は次のように規定される。即ち、第1又は第2の局面に規定される教師データの修正方法において、
前記第1教師データ再評価ステップにおいて、前記第1データ抽出ステップにて抽出された一次データに付されたラベルを再評価したとき、その再評価結果のラベルが教師データに予め付されたラベルと異なるラベルとなった一次データを特定し、
該特定された一次データについて教師データとして付されるラベルを変更するとともに、該変更されるラベルを変調してこれが学習されるときに重み付けされるようにする。
【0011】
第1データ抽出ステップにて抽出される一次データは、教師データとして予め付されたラベルと学習済判別装置の判別結果が示すラベルとが異なるものである。このような一次データであっても、再度詳細に評価した結果、教師データとして予め付されたラベルが正しいとされることがある。その一方で、判別装置の判別結果が正しいとされる場合もある。
再評価の結果は尊重されて、再評価された結果をもって教師データを修正すべきである。
例えば、画像データの僅かな欠陥を評価する場合、かかる画像データは一見すると(最初の教師データの準備において)NGラベルと付されたものの、学習済判別装置にかけたところ、その判別結果はOKラベルを示すことがある。ここに食い違いが生じるので、当該画像データを、例えばオペレータが、再度目視で評価したところ、判別結果であるOKラベルが正しいとされた場合である。かかる画像データについては、教師データに付されていたNGラベルが間違いであったので、そのラベルをOKラベルに変更する。このとき、OKラベルを変調してこれに重み付けをしてこれの学習結果に対する影響力を大きくする。
【0012】
かかる画像データは、オペレータによるラベル付けに間違いが生じやすい。換言すれば、かかる画像データと類似した他の教師データにも間違ったラベルが付されているおそれがある。このように間違ったラベルの付された画像データについてそのラベル間違いが学習済判別装置で完璧に指摘される保証はない。そこで、かかる画像データへ再定義されたラベルを付与しつつ、これに重み付けをすることにより、オペレータによるラベル付け間違いが生じやすい画像データを含む教師データの影響を小さくする。
このようにして修正した教師データのセットを判別装置へ入力して学習させる。
【0013】
この発明の第4の局面は次のように規定される。即ち、第1~3の何れか局面に規定の教師データの修正方法において、前記第1データ抽出ステップで抽出された一次データを前記出力ステップの判別結果と併せてモニタに表示する表示ステップが、更に実行される。
第1データ抽出ステップで抽出された一次データに付されたラベルは不正確な可能性が高い、そこで、該第1データ抽出ステップで抽出された一次データをモニタに表示するとともに、第1出力ステップの判別結果を当該モニタに表示する。
【0014】
例えば、抽出された一次データが画像データの場合、当該画像データから構成される画像をモニタの比較的大きなウインドウに表示するとともに、学習済判別装置の判別結果を他の比較的小さなウインドウに出力する。なお、この判別結果は、抽出された画像データに教師データとして予め付されたラベルと異なるものを示しているので、オペレータは注意をもって、一次データのラベルを再評価できる。
このとき、比較的大きなウインドウに表示した画像において、学習済判別装置の判別結果を導きだした領域を、強調表示することが好ましい。更には、当該領域を他のウインドウに拡大表示することもできる。オペレータによる再評価をサポートするためである。
更には、該当する教師データのラベルの変更を許容する入力エリアを設けることができる。オペレータによる再評価作業を効率化するためである。
【図面の簡単な説明】
【0015】
図1図1はコンピュータ装置をこの発明の実施形態の教師データ修正装置(学習モード)として機能させたときのブロック図である。
図2図2は検査対象となる精密部品の平面図である。
図3図3は教師データ修正装置の動作を示すフローチャートである。
図4図4はコンピュータ装置をこの発明の実施形態の教師データ修正装置(運用モード)として機能させたときのブロック図である。
図5図5は未修正の教師データの各画像データを学習済判別装置に入力してそのラベルの判別させた結果を示すヒストグラムである。
図6図6は修正した教師データの各画像データを学習済判別装置に入力してそのラベルの判別させた結果を示すヒストグラムである。
図7図7は二度修正した教師データの各画像データを学習済判別装置に入力してそのラベルの判別させた結果を示すヒストグラムである。
図8図8はコンピュータ装置をこの発明の他の実施形態の教師データ修正装置(運用モード)として機能させたときのブロック図である。
図9図9はラベル修正部の動作を示すフローチャートである。
図10図10は実施の形態の教師データ修正装置のハード構成を示すブロック図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施例を説明する。
図1図4はコンピュータ装置1をこの発明の実施形態の教師データ修正装置(学習モード)として機能させたときのブロック図である。このコンピュータ装置1は、図1に示すようにメモリ部2、データ処理部5及びディスプレイ7を少なくとも備える。勿論、必要な動作コマンドやパラメータ等を入力するためのキーボードやマウスなどの入力装置、コンピュータ装置全体を制御する制御プログラムを保存するROM等のメモリ、及びその他通信用のインターフェースを備えることはいうまでもない。
【0017】
メモリ部2には教師データ保存領域3が備えられる。教師データは画像データと当該画像データに付された2種類のラベル(OKラベル、NGラベル)との組合せからなるので、教師データ保存領域3にはそれらに応じて画像データ保存領域3Aとラベル保存領域3Bとが備えられる。メモリ部2にはフラグ保存領域4も備えられる。このフラグ保存領域には、学習時に取り込まれるべきか除外されるべきかを定義する、有効/無効フラグや、画像データの種類(処理対象である精密部品の画像であるか、他の物の画像であるか)を識別する画像フラグが保存される。
【0018】
本実施形態では、精密部品の画像データ(図2参照)を処理対象としており、教師データ保存領域3にはOKラベルの付された正常品の画像50000枚、NGラベルの付された異常品の画像3000枚、同じくNGラベルの付された精密部品以外の物の画像3000枚が保存されている。
予め正常/異常が判別されている数百個の精密部品を図示しないカメラで撮影して、正常品の教師データ及び異常品の教師データを得る。さらにこれらをいわゆる水増し処理して、AI処理に適したそれぞれ50000枚及び3000枚とする。
【0019】
データ処理部5の機械学習を行うAIプログラムとしてメトリックラーニングを用いることが好ましい。中でも、トリプレットロス法を用いることが好ましい。正常品の画像データと異常品の画像データとの違いを表す距離(指標)を顕著に表現できるからである。
もちろん、他のAIプログラムも利用可能である。
【0020】
ディスプレイ7には3つのウインドウ7A,7B及び7Cが備えられる。第1ウインドウ7Aには、画像データが画像化されて表示され、第2ウインドウ7Bには判別結果を導きだした画像データの注目領域が拡大して表示される。なお、この注目領域は第1ウインドウ7Aにおいて強調表示されている。強調表示の例としてこの強調領域を破線枠で囲むことが挙げられる。第3ウインドウ7Cにはウインドウ7Aに表紙される画像データが属する教師データのIDとそのラベル等が表示される。第3ウインドウ7Cにおいて当該教師データの修正を可能とする。
ディスプレイ7には、学習済の判別装置で教師データのセットの各画像データを処理したときの出力結果のヒストグラムを表示させることもできる。
【0021】
以下、図3のフローチャートに従いながら、判別装置1の動作を説明し、もって、この発明の教師データ修正装置の機能を明らかにする。
ステップS1において教師データが準備される。教師データの生成方法は既述の通りである。その結果下記表1に示す教師データのセットが生成される。表1のデータはメモリ部2に保存される。
【表1】
【0022】
表1において、学習モードにおいて有効に利用される教師データには「1」を、無視される教師データには「0」のフラグを付すものとする。最初の、即ち修正前の教師データはその全部が学習モードにおいて利用されるので、全てに「1」のフラグが付されている。勿論、所定のルールに従って、「0」フラグを付すこともできる。
データNo.1及びNo.cの教師データには画像フラグとして「1」が付されている。これらの画像データは精密部品以外の物の画像データである。画像フラグ「1」は、教師データの有効/無効フラグの固定を意味する。精密部品以外の物の画像データを修正した教師データにおいてもそのまま利用できるようにする。
【0023】
ステップ2では、メモリ部3に保存されている教師データ(画像データとそのラベル)のセットをデータ処理部5へ入力して学習させる(図1参照)。
このデータ処理部5として次のスペックのものを利用する。
PC:ドスパラ社製BTOパソコン(Core-i9-9940X,メモリ64GB,GPU:Nvidia社製 GeForce RTX 2080Ti)
AIソフト:テクムズ社 DEEPS AI Inspection
上記AIソフトはトリプレットロスの技法を利用するものである。
これにより、判別装置1の学習モードは終了する。
【0024】
このようにして機械学習の終了したデータ処理部5は、運用モードにおいて、図4に示すコンピュータ装置10に組み込まれる。
ここに、学習モードで用いたコンピュータ装置のデータ処理部5をそのまま運用モードにおいても用いることができるし、機械学習の終了したデータ処理部5のプログラム内容をコピーして、物理的に他のコンピュータ装置のデータ処理装置にインストールして、かかるコンピュータ装置を運用モードの判別装置として用いることもできる。
ステップ3では、このように準備されたメモリ部2の画像データ保存領域3Aに保存されている画像データを学習済のデータ処理部5へ入力してラベルの判別をさせる。
データ処理部5の出力結果において、3.0以下のスカラを示すものはOKラベルを示し、5.0以上のスカラを示すものはNGラベルを示すものとする。
判別結果は判別結果保存部13に保存される。
【0025】
判別結果を表2に示す。
【表2】
【0026】
mage eとimage gでは、教師データに付されたラベルと判別結果の示すラベルとが同じであった。image i,k,m,sについては、教師データに付されたラベルと判別結果の示すラベルとが異なっている。
データ処理装置5は、判別結果保存部13に保存された各教師データの判別結果を読み出し、これを処理して図5のヒストグラムを作成し、ディスプレイ7に表示する。図5において、横軸は出力結果のスカラ(指標)を示し、縦軸は教師データ数を示す。曲線はそれぞれOKラベル、NGラベルの付された教師データを示している。
【0027】
ステップ3では、教師データに付されたラベルと判別結果とを比較して、両者が異なる教師データを抽出する。表2の例では、Nos.i,k,m,sが抽出される。図5のヒストグラムではハッチされた部分が該当する。
かかる教師データのラベルは信用度が低い。判定結果と異なるからである。このようにして抽出された教師データを不信教師データと名付ける。
この例では、教師データに付されたラベルと判別結果とが異なる場合を全て不信教師データとしたが、不信教師データの定義はこれに限定されない。
たとえば、教師データに付されたラベルと判別結果とが異なる場合であって、さらに、図5のグラフの下端から所定の範囲(例えば3σ)に含まれるものに限定することができる。更には、教師データに付されたラベルと判別結果との比較を行わずに、単に、図5のグラフの下端から所定の範囲(例えば3σ)に含まれるものを不信教師データとすることもできる。
【0028】
ステップ7では、かかる不信教師データの割合を検定する。不信教師データの数の割合が全体数の0.01%以下であれば、教師データ保存領域3に保存されている教師データは信頼にたるものとして、その変更は行わない(ステップ7:Y)。
他方、不信教師データの数の割合が全体数の0.01%を超えるときは、ステップ9に進む。
【0029】
ステップ9では、ステップ5で抽出された不信教師データについて再評価を行う。
この例では、不信教師データについては自動的に削除することとした。そのため、ラベル書換部15は、ステップ10において、表3に示すように、不信教師データについて教師データの有効/無効フラグを書き換える。例えば、教師データにはNGラベルが付されていた教師データNo.iの判定結果はOKラベルとなったので、当該教師データNo.iの有効/無効フラグは1から0に変更される。
その結果、表3に示される修正された教師データにおいて、Nos.i,k,m,sは教師データとして学習モードに供されなくなる。
【表3】
【0030】
このようにして修正された教師データは、学習モードにあるコンピュータ装置のメモリ部2の教師データ保存領域3に書き込まれる。以後、ステップ2~ステップ10を繰り返す。この動作は自動的に行われる。
修正された教師データを使って学習モードを実行する場合、未学習のデータ処理部5を用いることが好ましい。学習済のデータ処理部5へ更に修正された教師データを読み込ませて学習を行わせることもできる。
【0031】
修正済の教師データを用いて学習を行わせた結果を図6に示す。
図6ではハッチの部分、即ち不信教師データの存在がみられるので(ステップ7N)、修正された教師データを、前記と同様に更に修正して、ステップ2~ステップ5を実行する。
その結果を図7に示す。図7において、ハッチの部分の面積が全体の0.1%以下になったので、処理が終了する(ステップ7:Y)。
部品検査の現場では、この状態の学習済データ処理部5が用いられる。
【0032】
本発明者らの検討によれば、上記のアルゴリズムを実行したとき、教師データを3回修正することにより、不信教師データ数が全数の0.1%以下となった。
【0033】
学習済のデータ処理部5は、運用モードにおいて、図8に示すようにコンピュータ装置20へ組み込むこともできる。
図8において図4と同様な機能を奏する要素には同一の符号を付してその説明を省略できる。
図8のコンピュータ装置20では、ラベル修正部21に再評価入力部22と再評価結果保存部23とが備えられる。
再評価入力部22を使ってオペレータは再評価の結果を入力する。入力された再評価の結果は再評価結果保存部23に保存される。
【0034】
図9のフローチャート用いて、この再評価入力部22の動作の説明をする。
ステップ31において、不信教師データの中から、NGレベルが付されていた教師データであって出力結果がOKレベルになったものを抽出する。
ステップ35において、抽出された教師データをディスプレイ7に表示する。具体的には、画像データから再生される画像を第1ディスプレイAに表示する。第1ディスプレイAにおいて要注意領域を破線で囲む。第2ディスプレイBには破線で囲まれた領域を拡大表示する。破線で囲まれた領域に欠陥が生じている。換言すれば、判別時に注目された領域が破線でかこまれているので、当該領域を拡大表示することでオペレータによる再評価作業をアシストする。
【0035】
第3ディスプレイCには判別結果が表示される。オペレータによる教師データ変更入力はこの第3ディスプレイCを介して許容される。
即ち、ステップ37において、ディスプレイに表示された不信教師データ(判別結果はOKレベル)が、例えば、スコアの小さいものから順に表示される。表示された不信教師データの画像をオペレータが目視で再評価した結果、判別結果(OKレベル)を維持する場合は再評価フラグを1とする。同様に、判別結果(OKレベル)を否定して予め付されていたNGレベルと評価したときは再評価フラグを2とする。ディスプレイ上の情報だけではOKレベルかNGレベルかの判断が困難なときには再評価フラグを3とする。
【0036】
次に、ステップ39において、不信教師データの中から、OKレベルが付されていた教師データであって出力結果がNGレベルになったものを抽出する。
ステップ41において、ステップ35と同様に、抽出された教師データをディスプレイ7に表示する。
【0037】
ステップ43において、ディスプレイに表示された不信教師データ(判別結果はNGレベル)が、例えば、スコアの小さいものから順に表示される。表示された不信教師データの画像をオペレータが目視で再評価した結果、判別結果(NGレベル)を維持する場合は再評価フラグを1とする。同様に、出力結果(NGレベル)を否定して予め付されていたOKレベルと評価したときは再評価フラグを2とする。ディスプレイ上の情報だけではOKレベルかNGレベルかの判断が困難なときには再評価フラグを3とする。
ステップ37及びステップ43の結果は表4のようにまとめられて、再評価結果保存部23に保存される。
【表4】
【0038】
ラベル書換部35は、表5に示すように、再評価結果保存部23に保存された再評価結果が反映されるように教師データを修正する。ここに、再評価の結果、再評価フラグ1の付されたもの、即ち学習済みの判別装置の出力が正しかったとき(判別結果と再評価結果が等しいとき)、教師データのラベルを再評価結果のものに修正するともに、その評価結果(ラベル)を変調してこれに重み付けをする。表5では有効フラグを1→10とした。このように修正された教師データは学習モードで他の教師データより学習結果に大きな影響を与える。例えば、有効フラグ10のものについては、教師データのコピーを10個作成し、このコピーされた教師データも学習モードにおいて利用されるようにする。
【0039】
再評価の結果、再評価フラグ2の付されたもの。即ち、学習済みの判別装置の出力が誤りであったとき(判別結果と再評価結果が異なったとき)、教師データのレベルとして再評価結果を採用する。表5では有効フラグは有効1のままで、ラベルは維持される。
ラベルの再評価が困難のもの(フラグ3)については、学習モードにおいて入力されないように、無効フラグを立てる(1→0)。
【表5】
【0040】
再評価を反映して、上記のように修正された教師データを用いて学習をさせた結果、一度の再評価により、ステップ5で抽出される不信教師データは0.1%以下となった。
【0041】
図10に教師データ修正装置のハード構成を示す。
演算部300はCPU301、ROM303及びRAM305を備え、システム全体の制御をつかさどる。それとともに、データ処理部5、ラベル書換部15、25及びディスプレイ7のドライバとして機能する。ROM303は、演算部300を制御する制御プログラム等が格納された図示しない不揮発性メモリを含む。RAM305は、キーボード等の入力装置330を介して利用者により予め設定された各種設定値を読み出し可能に格納したり、CPU301に対してワーキングエリアを提供したりする。演算部300を制御する制御プログラムはROM303に限らずRAM305や第1記憶装置311及び第2記憶装置313に格納されていてもよい。
CPU301はAI処理に用いるニュートラルネットワーク処理に適したものが好ましく、ROM303若しくは第1及び第2記憶装置311,313はディープラーニング時に用いる大量のデータを保存できる容量を持つものとする。
【0042】
第1記憶装置311は教師データ保存領域3、フラグ保存領域4として機能する。第2記憶装置313は判別結果保存部11及び再評価結果保存部21として機能する。
これら第1及び第2の記憶装置311,313はハードメモリやフラッシュメモリなど、サーバシステムのメモリ装置の一部の領域を利用することが好ましい。
なお、データを一時的に保存する、いわゆるバッファメモリには、演算部のRAMの一部領域を利用できる。
出力装置320はディスプレイ7や音声出力装置であり、入力装置330は音声入力部や、ディスプレイに重ねて配置されるタッチパネル式のキーボートやマウスなどが該当する。また、入力装置330はAI処理のための教師データ(画像データ)を入力できるものとする。
コンピュータを構成する各装置はシステムバス340で連結されている。
【0043】
上記においては、2つのラベルを持つ教師データに基づき発明の説明をしてきた。3つ以上のラベルについても、同様にその修正をすることができる。
上記の例では、学習済の判別装置へ教師データの各一次データを入力して得られた判別結果につき、第1ラベルと第2ラベルのそれぞれについて再評価し、もって教師データを修正していたが、いずれか一方のラベルについてのみ再評価してその結果を教師データの修正に反映させてもよい。
この発明は、上記発明の実施形態の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
【符号の説明】
【0044】
1 学習モードの判別装置(判別装置)
2 メモリ部
3 教師データ保存領域
5 データ処理部
7 ディスプレイ
10、20 運用モードの判別装置(判別装置)
11、21 ラベル修正部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10