特開2024-2431 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社　東京ウエルズの特許一覧

特開2024-2431学習装置、学習方法及び学習プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024002431

(43)【公開日】2024-01-11

(54)【発明の名称】学習装置、学習方法及び学習プログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20231228BHJP

【ＦＩ】

G06N20/00 160

【審査請求】有

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2022101590

(22)【出願日】2022-06-24

(71)【出願人】

【識別番号】591009705

【氏名又は名称】株式会社東京ウエルズ

(74)【代理人】

【識別番号】110002181

【氏名又は名称】弁理士法人ＩＰ－ＦＯＣＵＳ

(74)【代理人】

【識別番号】100208959

【弁理士】

【氏名又は名称】島田敏史

(72)【発明者】

【氏名】出野弘揮

(72)【発明者】

【氏名】高橋龍一

(72)【発明者】

【氏名】加藤嗣

(57)【要約】

【課題】モデルの学習を適切に行う学習装置、学習方法及び学習プログラムを提供する。
【解決手段】学習装置１は、対象データについて評価値を算出し、良品（第１ラベル）か不良品（第２ラベル）か判定する機械学習のモデルＭについて、適切な判定を行えるように学習させる装置である。学習装置１は、データ取得部２、増加処理部３、制御部４、抽出部５、学習部６、表示部７及びラベル変更部８を備える。取り扱うデータは、第１ラベル又は第２ラベルが付与された教師データ１１、教師データ１１の候補となる教師候補データ１２、増加処理部３によって増加処理がなされた変更教師候補データ１３である。データ取得部２で母集団１４となるデータを取得し、増加処理部３によりデータを増加させ、抽出部５によって抽出データ１５を抽出する。抽出部５による抽出処理の前に増加処理部３によりデータを増加させることにより、学習を可能とする。
【選択図】図１

【特許請求の範囲】

【請求項1】

対象データについて評価値を算出し、前記評価値と所定の閾値を比較して少なくとも第１ラベル又は第２ラベルの何れかのラベルに分類するように教師データを用いて学習するモデルに、学習を行わせる学習装置であって、
少なくとも前記第１ラベル又は前記第２ラベルの何れかに分類された教師候補データを取得するデータ取得部と、
前記教師候補データの内容の一部を変更して一又は複数の変更教師候補データを生成する増加処理部と、
前記教師候補データ及び前記変更教師候補データを母集団として、前記母集団について前記モデルを用いて評価値を算出し、前記評価値が前記閾値を含む所定の抽出範囲にあるデータを抽出する抽出処理を行う抽出部と、
所定の学習率で前記モデルに学習処理を行わせる学習部と、
前記抽出部及び前記学習部を制御する制御部を備え、
前記制御部は、
前記抽出部により前記抽出処理を行った結果抽出された抽出データの数が所定の停止数を超えるときは、前記抽出データを前記教師データに追加して前記学習処理を行うと共に、前記抽出処理を行い、新たな抽出データの数が前記停止数となるまで前記学習処理と前記抽出処理を実行することを特徴とする学習装置。

【請求項2】

請求項１に記載の学習装置であって、
前記制御部は、学習済みのモデルを用いて抽出処理を行う際に、前記母集団から前記抽出データを除いた新たな母集団を作成し、前記新たな母集団に対して前記抽出部によって前記抽出処理を行うことを特徴とする学習装置。

【請求項3】

請求項１に記載の学習装置であって、
前記抽出処理において、変更の基礎となった前記教師候補データが共通する前記変更教師候補データが複数あるときは、一度の前記抽出処理において所定の限度抽出数のみの前記教師候補データ又は前記変更教師候補データを抽出する限定処理を行うことを特徴とする学習装置。

【請求項4】

請求項１に記載の学習装置であって、
前記抽出データを表示させる表示部と、前記表示部に表示された前記抽出データについて前記ラベルの変更が可能なラベル変更部をさらに備え、
前記抽出データを前記教師データに追加する前に、前記ラベル変更部により前記ラベルの変更を可能とする学習装置。

【請求項5】

請求項４に記載の学習装置であって、
前記制御部は、前記抽出データの数が前記停止数を超え、所定の基準データ数未満の場合、前記抽出範囲の幅を広げる拡張処理を行って前記抽出処理を行い、
前記抽出データの数が前記基準データ数以上となったときに前記学習処理を行う学習装置。

【請求項6】

請求項５に記載の学習装置であって、
前記制御部は、前記拡張処理として前記抽出範囲の幅を広げると共に前記学習率を低下させる学習装置。

【請求項7】

対象データについて評価値を算出し、前記評価値と所定の閾値を比較して少なくとも第１ラベル又は第２ラベルの何れかのラベルに分類するように教師データを用いて学習するモデルに、学習を行わせる学習装置であって、
少なくとも前記第１ラベル又は前記第２ラベルの何れかに分類された教師候補データを取得するデータ取得部と、
前記教師候補データを母集団として、前記母集団について前記モデルを用いて評価値を算出し、前記評価値が前記閾値を含む所定の抽出範囲にあるデータを抽出する抽出処理を行う抽出部と、
所定の学習率で前記モデルに学習処理を行わせる学習部と、
前記抽出部及び前記学習部を制御する制御部を備え、
前記制御部は、
前記抽出部により抽出された抽出データの数が所定の停止数を超え、所定の基準データ数未満の場合、前記抽出範囲の幅を広げる拡張処理を行って前記抽出処理を行い、
前記抽出データの数が前記基準データ数以上となったときに、前記抽出データを前記教師データに追加して前記学習処理を行うと共に、前記抽出処理を行い、新たな抽出データの数が前記停止数となるまで前記学習処理と前記抽出処理を実行することを特徴とする学習装置。

【請求項8】

対象データについて評価値を算出し、前記評価値と所定の閾値を比較して少なくとも第１ラベル又は第２ラベルの何れかのラベルに分類するように教師データを用いて学習するモデルに、学習を行わせる学習方法であって、
少なくとも前記第１ラベル又は前記第２ラベルの何れかに分類された教師候補データを取得するデータ取得工程と、
前記教師候補データの内容の一部を変更して一又は複数の変更教師候補データを生成する増加処理工程と、
前記教師候補データ及び前記変更教師候補データを母集団として、前記母集団について前記モデルを用いて所定の学習率で評価値を算出し、前記評価値が前記閾値を含む所定の抽出範囲にあるデータを抽出する抽出工程と、前記モデルに学習を行わせる学習工程とを含み、
前記抽出工程により抽出された抽出データの数が所定の停止数を超えるときは、前記抽出データを前記教師データに追加して前記学習工程を実行すると共に、前記母集団から前記抽出データを除いた新たな母集団を作成し、前記新たな母集団に対して前記抽出工程を実行し、新たな抽出データの数が前記停止数となるまで前記学習工程と前記抽出工程を実行することを特徴とする学習方法。

【請求項9】

コンピュータを請求項１～７の何れか１項に記載の学習装置として機能させるための学習プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習装置、学習方法及び学習プログラムに関する。

【背景技術】

【0002】

従来から、画像処理の技術を用いて製品の良否の判定等を行うために、ニューラルネットワークを用いたディープラーニングによる学習結果を利用することが行われている。また、ディープラーニングによる学習を効率化するために、特許文献１において、モデルの学習を適切に行うための学習支援装置、及び学習装置等が提案されている。

【0003】

特許文献１の学習支援装置は、対象データを第１ラベル及び第２ラベルの何れかに分類するように教師データを用いて学習されたモデルと、第１ラベルが付与された第１データ及び第２ラベルが付与された第２データを有する教師データとに基づいて、教師データの特徴量を教師データごとに導出している。

【0004】

また、同装置では、第１ラベル及び第２ラベルの何れかがそれぞれに付与された少なくとも１つの教師候補データとモデルとに基づいて教師候補データの特徴量を教師候補データごとに導出する導出部と、教師候補データと第１データとの距離、及び、教師候補データと第２データとの距離の少なくとも一方を教師候補データごとに算出する算出部と、距離に基づいて教師候補データの中から教師データとして追加するデータを選択する選択部と、を備える。

【0005】

特許文献１の学習支援装置では、第１ラベルに分類された複数の教師候補データの中から、前記距離が第２ラベルの教師データに近いものを選択し、第２ラベルに分類された複数の教師候補データの中から、前記距離が第１ラベルの教師データに近いものを選択する。

【0006】

当該処理によって、第１ラベルである教師候補データのうち第２ラベルに近いもの、即ち、第１ラベルか第２ラベルかの識別が困難な教師候補データを選択することになる。第２ラベルの教師候補データについても同様である。特許文献１の学習支援装置では、このような識別が困難な教師候補データを教師データとすることにより、教師データの質を向上させ、モデルを効率的に学習させることが可能となった。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開２０２１－１０３３４４号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

特許文献１に記載の学習支援装置によって、効率のよい学習を行うことができるようになった。ところで、一般的な学習方法においては、教師データを所定の手法によって増加させる増加処理を行うと、学習効果を高められることが一般に知られている。このため、特許文献１に記載の学習支援装置においても、教師データを増加させることにより、学習効果が高まることが期待される。

【0009】

しかしながら、特許文献１に記載の学習支援装置において、選択された教師データに対して増加処理を行ったところ、最大エポック数に達しても学習の終了条件を満たすことができないケースや、学習時間が過大となるケースが発生することが判明した。

【0010】

本発明は、上記課題に鑑み、モデルの学習を適切に行うことができる学習装置、学習方法及び学習プログラムを提供することを目的とする。

【課題を解決するための手段】

【0011】

上記目的を達成するために、本発明の学習装置は、対象データについて評価値を算出し、前記評価値と所定の閾値を比較して少なくとも第１ラベル又は第２ラベルの何れかのラベルに分類するように教師データを用いて学習するモデルに、学習を行わせる学習装置であって、少なくとも前記第１ラベル又は前記第２ラベルの何れかに分類された教師候補データを取得するデータ取得部と、前記教師候補データの内容の一部を変更して一又は複数の変更教師候補データを生成する増加処理部と、前記教師候補データ及び前記変更教師候補データを母集団として、前記母集団について前記モデルを用いて評価値を算出し、前記評価値が前記閾値を含む所定の抽出範囲にあるデータを抽出する抽出処理を行う抽出部と、所定の学習率で前記モデルに学習処理を行わせる学習部と、前記抽出部及び前記学習部を制御する制御部を備え、前記制御部は、前記抽出部により前記抽出処理を行った結果抽出された抽出データの数が所定の停止数を超えるときは、前記抽出データを前記教師データに追加して前記学習処理を行うと共に、前記抽出処理を行い、新たな抽出データの数が前記停止数となるまで前記学習処理と前記抽出処理を実行することを特徴とする。

【0012】

本発明の学習装置は、教師候補データの内容の一部を変更して一又は複数の変更教師候補データを生成する増加処理部を備えており、教師候補データのみならず変更教師候補データを含めて教師候補データを抽出するための母集団としている。この増加処理部によるデータの増加は、学習処理と抽出処理を行う前に行っているため、学習処理と抽出処理を繰り返すことにより最終的には抽出データの数が所定の停止数となり、学習が終了する。従って、本発明の学習装置は、従来の学習装置と比べて、モデルに対して多くの母集団を用いて効率よく学習させることができる。

【0013】

本発明の学習装置において、前記制御部は、学習済みのモデルを用いて抽出処理を行う際に、前記母集団から前記抽出データを除いた新たな母集団を作成し、前記新たな母集団に対して前記抽出部によって前記抽出処理を行うようにしてもよい。当該構成によれば、学習処理と抽出処理を繰り返す度に母集団のデータ数が減少していくので、制御部における処理の負担を軽減することができる。

【0014】

本発明の学習装置は、前記抽出処理において、変更の基礎となった前記教師候補データが共通する前記変更教師候補データが複数あるときは、一度の前記抽出処理において所定の限度抽出数のみの前記教師候補データ又は前記変更教師候補データを抽出する限定処理を行うようにしてもよい。当該構成によれば、学習処理を行う際の教師候補データ又は変更教師候補データの数が抑えられるので、学習処理を迅速に行うことができる。

【0015】

また、本発明の学習装置において、前記抽出データを表示させる表示部と、前記表示部に表示された前記抽出データについて前記ラベルの変更が可能なラベル変更部をさらに備え、前記抽出データを前記教師データに追加する前に、前記ラベル変更部により前記ラベルの変更を可能としてもよい。当該構成によれば、ユーザはラベル変更部と入力部により、抽出部におけるラベルの判定結果を確認でき、判定結果に誤りがあるときはラベル変更部により変更ができるので、抽出部における判定の精度を向上させることができる。

【0016】

また、本発明の学習装置において、前記制御部が、前記抽出データの数が前記停止数を超え、所定の基準データ数未満の場合、前記抽出範囲の幅を広げる拡張処理を行って前記抽出処理を行い、前記抽出データの数が前記基準データ数以上となったときに前記学習処理を行うようにしてもよい。

【0017】

抽出データが基準データ数より少ない状態で、ユーザがラベル変更部によりラベルの変更を行うと、ラベルの変更の頻度が多くなりユーザに負担が生じる。本発明では、抽出データの数が基準データ数以上となってから学習処理及び抽出処理を行うので、ユーザが選択部によりラベルの選択を行う頻度を減少させることができる。

【0018】

また、本発明の学習装置において、前記制御部が、前記拡張処理として前記抽出範囲の幅を広げると共に前記学習率を低下させるようにしてもよい。このように、抽出範囲を広げることで、抽出データの数を増加させることができる。また、学習率は、1回の学習でニューラルネットワーク内の重みやバイアスを更新する量の調整値である。本発明では、拡張処理において、抽出範囲を広げた際に学習率を低下させることで、抽出データの数の微調整が行われる。

【0019】

また、本発明の学習装置は、対象データについて評価値を算出し、前記評価値と所定の閾値を比較して少なくとも第１ラベル又は第２ラベルの何れかのラベルに分類するように教師データを用いて学習するモデルに、学習を行わせる学習装置であって、少なくとも前記第１ラベル又は前記第２ラベルの何れかに分類された教師候補データを取得するデータ取得部と、前記教師候補データを母集団として、前記母集団について前記モデルを用いて評価値を算出し、前記評価値が前記閾値を含む所定の抽出範囲にあるデータを抽出する抽出処理を行う抽出部と、所定の学習率で前記モデルに学習処理を行わせる学習部と、前記抽出部及び前記学習部を制御する制御部を備え、前記制御部は、前記抽出部により抽出された抽出データの数が所定の停止数を超え、所定の基準データ数未満の場合、前記抽出範囲の幅を広げる拡張処理を行って前記抽出処理を行い、前記抽出データの数が前記基準データ数以上となったときに、前記抽出データを前記教師データに追加して前記学習処理を行うと共に、前記抽出処理を行い、新たな抽出データの数が前記停止数となるまで前記学習処理と前記抽出処理を実行することを特徴とする。

【0020】

上記構成の学習装置によれば、抽出手段による抽出数が所定の基準データ数より少ない場合は、抽出数が多くなるように抽出範囲の幅を広げるため、抽出数が多くなるので、効率よく学習処理を行うことができる。

【0021】

本発明の学習方法は、対象データについて評価値を算出し、前記評価値と所定の閾値を比較して少なくとも第１ラベル又は第２ラベルの何れかのラベルに分類するように教師データを用いて学習するモデルに、学習を行わせる学習方法であって、少なくとも前記第１ラベル又は前記第２ラベルの何れかに分類された教師候補データを取得するデータ取得工程と、前記教師候補データの内容の一部を変更して一又は複数の変更教師候補データを生成する増加処理工程と、前記教師候補データ及び前記変更教師候補データを母集団として、前記母集団について前記モデルを用いて評価値を算出し、前記評価値が前記閾値を含む所定の抽出範囲にあるデータを抽出する抽出工程と、所定の学習率で前記モデルに学習を行わせる学習工程とを含み、前記抽出工程により抽出された抽出データの数が所定の停止数を超えるときは、前記抽出データを前記教師データに追加して前記学習工程を実行すると共に、前記母集団から前記抽出データを除いた新たな母集団を作成し、前記新たな母集団に対して前記抽出工程を実行し、新たな抽出データの数が前記停止数となるまで前記学習工程と前記抽出工程を実行することを特徴とする。

【0022】

本発明の学習プログラムは、コンピュータを上記各学習装置として機能させるためのプログラムである。

【図面の簡単な説明】

【0023】

【図1】本発明の実施形態の一例である学習装置の機能的構成を示す説明図。

【図2】本実施形態の学習装置における学習方法を示すフローチャート。

【図3】本実施形態の学習装置の抽出部による抽出処理のイメージを示す説明図。

【図4】本実施形態の学習装置の表示部によって表示された表示画面を示す説明図であり、（Ａ）は良品の場合、（Ｂ）は不良品の場合を示す。

【図5】本実施形態の学習装置の増加処理部による増加処理を示す説明図であり、（Ａ）はフリップ処理、（Ｂ）はシフト処理、（Ｃ）は微小回転処理、（Ｄ）はフィルタ処理を示す。

【図6】本実施形態の学習装置の学習時間とデータ数との関係を示すグラフ。

【発明を実施するための形態】

【0024】

次に、図１～図６を参照して、本発明の実施形態である学習装置、学習方法及び学習プログラムについて説明する。図１は、本実施形態の学習装置１の機能的構成を示す説明図である。

【0025】

本実施形態の学習装置１は、対象データについて評価値を算出して、少なくとも第１ラベルか第２ラベルかを判定して分類するモデルＭについて、モデルＭが適切な判定を行うことができるように学習をさせる装置である。ここで、モデルとは、コンピュータが判別可能な何らかの入力値を受け取り、何らかの評価・判定をして出力値を出す仕組みをいう。

【0026】

モデルＭは、ニューラルネットワークとパラメータとを含む構造を有する。ニューラルネットワークは、複数のニューロンを結合させた構造を有する。一例として、ニューラルネットワークは、複数のニューロンがグループ化された層を連ねた階層型の多層ニューラルネットワークとすることができる。

【0027】

ニューラルネットワークは、ニューロンの個数及び結合関係で定義される。ニューロン間又は層間の結合強度は、パラメータ（重み係数など）を用いて定義される。ニューラルネットワークでは、対象データが入力され、複数のニューロンの演算結果及びパラメータに基づいて、対象データの評価及びラベルの付与が行われる。

【0028】

モデルＭは、対象データの内容を認識し、少なくとも第１ラベルか第２ラベルかの判定を行う。例えば、対象データが画像データである場合、ラベルとしては、被写体の種類（人物、乗り物、動物等）、又は被写体の品質（良品、不良品等）とすることができる。このラベルは、対象データに紐付けて記憶される。なお、モデルＭの構成は、特許文献１と同様であるので、詳細な説明は省略する。

【0029】

次に、図１を参照して、本実施形態の学習装置１の機能的構成について説明する。本実施形態の学習装置１は、機能的構成として、データ取得部２、増加処理部３、制御部４、抽出部５、学習部６、表示部７及びラベル変更部８を備えている。

【0030】

本実施形態の学習装置１で取り扱う対象データは、第１ラベル又は第２ラベルの何れかが付与された教師データ１１と、教師データ１１の候補となる教師候補データ１２と、増加処理部３によって増加処理がなされた変更教師候補データ１３である。教師候補データ１２及び変更教師候補データ１３についても、教師データ１１と同様に、第１ラベル又は第２ラベルの何れかが付与されている。

【0031】

ここで、教師データとは、モデルＭに与えられる例題と解答を示すデータをいう。また、教師候補データとは、モデルＭに与える新たな教師データの候補となりうるデータをいう。

【0032】

データ取得部２は、学習装置１によってモデルＭの学習を行うために、教師候補データ１２を取得するデータ取得工程を行う機能部である。

【0033】

増加処理部３は、教師候補データ１２の内容の一部を変更して一又は複数の変更教師候補データ１３を生成する機能部である。増加処理としては、例えば、教師候補データ１２が画像データの場合、以下のような処理を挙げることができる。

【0034】

例えば、元画像データを左右反転したデータ、上下反転したデータ、及び１８０°回転したデータを作成するフリップ処理、元画像データをＸ－Ｙ方向に少しずつ座標をずらしたデータを作成するシフト処理、元画像データを右方向及び左方向に微小角度回転させたデータを作成する微小回転処理、元画像データに中央値フィルタやガウシアンフィルタ等のフィルタをかけるフィルタ処理等である。

【0035】

制御部４は、抽出部５と学習部６を制御してモデルＭに効果的な学習処理を行わせる機能部である。抽出部５は、教師候補データ１２及び変更教師候補データ１３を母集団１４として、この母集団１４についてモデルＭを用いて評価値を算出し、評価値が第１ラベルと第２ラベルとの閾値を含む所定の抽出範囲にあるデータを抽出する抽出処理を行う機能部である。学習部６は、所定の学習率でモデルＭに学習処理を行わせる機能部である。学習処理とは、モデルＭのパラメータを最適値に近づけるように調整する処理である。

【0036】

表示部７は、対象データの判定を行うユーザが、抽出部５によって抽出された抽出データ１５を確認できるように、ディスプレイ等の表示機器にデータを表示させる機能部である。ラベル変更部８は、抽出データ１５に付与された第１ラベル又は第２ラベルのラベルについて、ユーザが確認してラベルを変更する必要がある場合に、抽出データ１５に付されたラベルを変更することができる機能部である。

【0037】

本実施形態の学習装置１は、主要なハードウェアとしてコンピュータ（図示省略）を備えている。コンピュータは、ＣＰＵ、ＧＰＵ等のプロセッサ、ＲＡＭ、ＲＯＭ、ハードディスク又はＳＳＤ（ソリッドステートドライブ）等の記憶装置、インターネット等のネットワークへの接続を行う通信部等を備えている。また、コンピュータの記憶装置には、コンピュータを本実施形態の学習装置１として作動させるための学習プログラムが記憶されている。なお、コンピュータには、クラウドコンピューティングシステムが含まれる。前記各機能部は、ハードウェアとしてコンピュータと、ソフトウェアである学習プログラムによって実現される。

【0038】

次に、図２を参照して、本実施形態の学習装置１の作動である学習方法について、対象データが画像である場合を例にして説明する。まず、データ取得部２が教師候補データ１２を取得する取得工程を行う（ＳＴＥＰ１）。この教師候補データ１２は、予め、第１ラベル又は第２ラベルの何れかのラベルが付されている。教師候補データ１２の数は、モデルＭの学習に必要な数を予め準備しておく。

【0039】

次に、増加処理部３が、教師候補データ１２に対して増加処理を行って変更教師候補データ１３を生成する増加処理工程を行う（ＳＴＥＰ２）。増加処理としては、前述のフリップ処理、シフト処理、微小回転処理及びフィルタ処理の何れか、又はこれらの処理の組み合わせることにより行う。いずれの処理を行うかは、対象データの性質、モデルＭの学習の目的、或いはモデルＭによる判定の内容によって適宜選択することができる。

【0040】

次に、制御部４が、初回の処理か否かの確認を行う（ＳＴＥＰ３）。初回の処理の場合は（ＳＴＥＰ３でＹＥＳ）、学習済みで初期状態のモデルＭについて、学習率を初期値に設定する（ＳＴＥＰ５）。この学習率の初期値は、例えば０．００１に設定することができる。また、抽出部５における抽出範囲を初期値に設定する（ＳＴＥＰ５）。この抽出範囲の初期値は、例えば３に設定することができる。なお、抽出範囲の内容については後述する。

【0041】

次に、抽出部５により抽出処理（抽出工程）を行う（ＳＴＥＰ６）。抽出処理においては、教師候補データ１２と変更教師候補データ１３を母集団１４として、この母集団１４のデータをモデルＭに入力し、モデルＭにおいて評価値を算出し、この評価値が抽出範囲内であれば抽出データ１５として抽出を行い、評価値が抽出範囲外であれば抽出を行わない。

【0042】

図３は、本実施形態の学習装置１における抽出処理をイメージ的に表現したものである。この抽出部５における抽出処理では、母集団１４の各データについて、モデルＭを用いて評価値を算出する。図３においては、評価値は図の右側に行くほど高く、左側に行くほど低くなる。本実施形態においては、評価が高い方が第１ラベルとなり、評価が低い方が第２ラベルとなる。

【0043】

図３においては、第１ラベルと第２ラベルとの境界線Ｂが両ラベルを分ける閾値であり、この閾値を含む所定の範囲を抽出範囲としている。ここで、図３に示すように、評価値が閾値に近い領域にあるものは、第１ラベルであっても第２ラベルに近いものとなり、良品と不良品の差が少ないものとなる。本実施形態においては、図３における抽出範囲の値は３に設定されているが、１～２０の値で設定することができる。この値は、抽出の条件や学習の対象に応じて適宜変更が可能である。

【0044】

このように、第１ラベルと第２ラベルの所定の領域にあるデータを用いてモデルＭの学習を行えば、第１ラベルか第２ラベルかについて見分けが付きにくいデータで学習を行うことができる。このようなデータで学習を行ったモデルＭは、些細な差異についての判断を正確に行うことができるようになる。即ち、このようなデータは、効率よくモデルＭの学習を行うことができる良質なデータとなる。

【0045】

抽出部５における抽出処理の内容は、特許文献１に記載された処理と同様である。具体的には、教師候補データ１２と変更教師候補データ１３をモデルＭに入力し、モデルＭと教師データ１１に基づいて、予め定められた次元の特徴空間で表現される特徴量（ベクトル）をデータごとに算出する。また、特徴空間における教師データ１１と教師候補データ１２及び変更教師候補データ１３との距離をそれぞれ算出する。この距離が抽出範囲内にあればそのデータは抽出され、抽出範囲外であれば当該データは抽出しないという処理を行う。なお、特徴空間における距離の算出の手法については、特許文献１と同様であるので、詳細な説明は省略する。

【0046】

本実施形態の学習装置１においては、抽出部５による抽出処理を行う際に、母集団１４において、変更教師候補データ１３の変更の基礎となった教師候補データ１２が共通するデータが複数あるときは、一度の抽出処理において所定の限度抽出数のデータのみを抽出する限定処理を行っている（ＳＴＥＰ６）。

【0047】

この限定処理を行うことにより、後述するＳＴＥＰ５において新たな教師データ１１によりモデルＭを学習させる際に、急激に教師データ１１が増加することがないので、学習処理を迅速に行うことができる。本実施形態では、限度抽出数を１としている。このため、本実施形態では、同じ教師候補データ１２から複数の変更教師候補データ１３が生成されている場合であっても、１回の抽出処理において１個の教師候補データ１２又は変更教師候補データ１３のみが抽出される。この限度抽出数は、モデルＭの状態やハードウェア等の状態により適宜変更することができる。

【0048】

次に、制御部４が、抽出部５により抽出された抽出データ１５の数を確認する（ＳＴＥＰ７）。具体的には、（１）として、抽出データ１５の数ｘが、所定の停止数を超えているか、及び所定の基準データ数以上であるか、或いは抽出範囲が拡張範囲であるか否かの確認を行う（図２のＳＴＥＰ７においては、「基準データ数」を「基準数」と表記している）。又は、ＳＴＥＰ７では、（２）として、抽出データ１５が停止数を超えているが、基準データ数未満であるか否かの確認を行う。

【0049】

ここで、停止数は、学習装置１による学習を停止させるか否かの基準となる数字であり、例えば０とすることができる。この場合、抽出部５により抽出されるデータが０になった場合に学習を停止させることになる。

【0050】

また、基準データ数は、後述するユーザの確認作業（ＳＴＥＰ８～９）の頻度を低減させるための数字であり、例えば第１ラベルが２０、第２ラベルが２０とすることができる。この基準データ数は、データの種類や学習環境等の要因により適宜変更することが可能である。

【0051】

この場合、抽出部５により抽出される抽出データ１５の数が、第１ラベルが２０未満、又は第２ラベルが２０未満の場合、ユーザの確認作業を行わずに、再度抽出処理を行って、抽出データ１５の数が４０以上となった場合にユーザの確認作業を行う。当該処理により、ユーザの確認作業の頻度が減少するので、ユーザの負担軽減を行うことができる。

【0052】

抽出データ１５の数が、停止数を超えると共に、基準データ数以上である場合は（ＳＴＥＰ７で１）、表示部７に抽出データ１５を表示させる（ＳＴＥＰ８）。図４は、表示部７に抽出データ１５が表示された状態である。表示画面１６には、ラベル変更部８によって抽出データ１５に付されたラベル１７が適切か否かを確認し、ラベル１７の変更を行うための変更表示１８が表示される。

【0053】

図４（Ａ）において、表示画面１６の上方には、「これは本当に良品ですか？」との記載が表示され、表示画面１６の中央には抽出された抽出データ１５が表示され、抽出データ１５の左側にはラベル１７が「良品」として表示され、表示画面１６の下方には変更表示１８として「はい」「いいえ」「わからない」の３個のボタンが表示される。ユーザがこの変更表示１８のボタンをタップする等の操作を行うことにより、抽出データに付されたラベル１７（この場合は「良品」）が適切であるか否かを確認し、適切でない場合はラベル１７を変更することが可能となる。

【0054】

図４（Ｂ）の場合は、ラベル１７が「不良品」であり、抽出データ１５には不良品と判定された画像が表示される。なお、変更表示１８においてユーザが「わからない」を選択した際は、ユーザによる判定を保留して、事後的に判定を行うことができるようになっている。

【0055】

ユーザによる抽出データ１５の確認が行われた後、制御部４は、当該抽出データ１５を教師データ１１として格納し、新たな教師データ１１が次回のラベル１７の学習に用いられる。また、制御部４は、母集団１４から抽出データ１５を取り除き、新たな母集団１４を作成する（ＳＴＥＰ１０）。

【0056】

次に、再度初回の処理か否かが確認されるが（ＳＴＥＰ３）、この場合は既に初回の処理が終了して２回目以降の処理となるため（ＳＴＥＰ３でＮＯ）、制御部４は、新たな教師データ１１を加えたモデルＭを用いて、学習処理（学習工程）を行う（ＳＴＥＰ４）。新たに加えられた教師データ１１は、抽出部５によって抽出された学習効果の高い抽出データ１５であるので、モデルＭによる評価の精度が向上する。その後、学習率を初期値に設定すると共に、抽出部５における抽出範囲を初期値に設定する（ＳＴＥＰ５）。

【0057】

制御部４は、以上の抽出処理と学習処理を抽出データ１５の数が停止数である０になるまで繰り返す。抽出データ１５が停止数である０になったときは（ＳＴＥＰ７で３）、処理が終了となる。

【0058】

一方で、抽出データ１５が停止数を超えているが、基準データ数未満である場合は（ＳＴＥＰ７で２）、抽出範囲の幅を広げて拡張範囲（例えば３．７）とすると共に、学習率を低下（例えば０．０００２）させる拡張処理を行う（ＳＴＥＰ１１）。この状態で抽出処理を行うと（ＳＴＥＰ６）、抽出範囲の幅が広がっており、抽出部５によって抽出されるデータ数が増加する。また、この抽出処理により、学習率の微調整が行われる。

【0059】

次に、制御部４は、抽出データ数を確認するが（ＳＴＥＰ７）、この場合はＳＴＥＰ１１によって抽出範囲が拡張範囲となっているため（ＳＴＥＰ７で１）、抽出処理によって抽出された抽出データの表示及び確認を行う（ＳＴＥＰ８～９）。抽出範囲が拡張範囲である場合は、ＳＴＥＰ１１の拡張処理がなされている状態であり、仮に抽出データ１５の数が基準データ数未満であっても、当該基準データ数に近い数のデータが存在することが予想されるためである。

【0060】

次に、図５を参照して、増加処理部３によって行われる増加処理の具体例について説明する。図５（Ａ）は、フリップ処理を行った状態を示す説明図であり、オリジナル画像である教師候補データ１２から、フリップ処理により、上下反転した画像データ、左右反転した画像データ、及び１８０°回転させた画像データが生成される。このフリップ処理を行うことで、教師候補データ１２に加えて、３個の変更教師候補データ１３を得ることができる。

【0061】

図５（Ｂ）は、シフト処理を行った状態を示す説明図であり、元画像データである教師候補データ１２と、フリップ処理で生成された３個の変更教師候補データ１３の合計４個のデータについて、Ｘ－Ｙ方向にそれぞれ（－１，－１）、（－１，１）・・・という形で画像を微小移動させる。このシフト処理により、３２個の画像データを得ることができる。このシフトの単位は、画像であれば画素（ピクセル）としてもよく、ｍｍ、或いはμｍとしてもよい。また、シフトの範囲は学習の目的等によって適宜変更することができる。

【0062】

図５（Ｃ）は、微小回転処理を行った状態を示す説明図であり、回転無しの画像データに対して、左に１°回転した画像データと、右に１°回転した画像データを生成する。この微小回転の角度は、学習の目的等によって適宜変更することができる。

【0063】

図５（Ｄ）は、フィルタ処理を行った状態を示す説明図であり、フィルタ無しの画像データに対して、中央値フィルタを施したデータと、ガウシアンフィルタを施したデータを生成する。中央値フィルタは、メディアンフィルタとも呼ばれており、画像のノイズを除去する際に用いられるフィルタである。ガウシアンフィルタは、平滑化フィルタの一種であり、ガウス分布に従って画像をぼかしてなめらかにするフィルタである。なお、フィルタ処理として、公知の他のフィルタを用いてもよい。

【0064】

増加処理部３において行われる増加処理は、図５（Ａ）のフリップ処理のみであれば、データ数は４倍となる。さらに、図５（Ｂ）のシフト処理を行うと３２倍のデータとなり、シフト処理をしない４個のデータを加えると３６倍のデータとなる。さらに、図５（Ｃ）の微小回転処理を行えば、シフト処理を行った３２倍のデータがさらに３倍されて９６個のデータとなり、最初の４個のデータを加えると１００倍のデータとなる。さらに、図５（Ｄ）のフィルタ処理を行えば、１００倍のデータが３倍の３００倍となる。

【0065】

このように、本実施形態の学習装置１では、増加処理によって教師候補データ１２に近似する変更教師候補データ１３を多数生成することができるので、抽出処理によって学習効果の高いデータを多数抽出することができる。

【0066】

次に、本実施形態の学習装置１の作用効果について、図６を参照して説明する。図６は、対象データ数と学習時間との関係を示すグラフである。グラフにおいて実線で示すデータは本実施形態の学習装置１であり、点線で示すデータは従来の学習装置（比較例）を示している。図６のグラフに示すように、本実施形態の学習装置１は、対象データ数が３００倍である場合も、学習を終了させることができた。一方で、比較例においては、対象データ数の増加倍数が８倍を超えると、学習を終了させることができなかった。

【0067】

以上の通り、本実施形態の学習装置１は、従来の学習装置に比べて対象データを増加させることにより、学習の質を向上させることができると共に、対象データが増加された場合であっても学習を終了させることができる。

【0068】

なお、上記実施形態においては、抽出データ１５の数が、停止数を超えると共に、基準データ数以上である場合は（ＳＴＥＰ７で１）、抽出データ１５を表示部７に表示させてユーザによる確認作業を行っているが、表示部７にデータを表示させずに、抽出データ１５を教師データ１１に加えるようにしてもよい。例えば、増加処理において、すでに教師候補データ１２をもとに作成された変更教師候補データ１３が表示されて確認作業を受けていれば、表示部７での表示を省略することができる。

【0069】

また、上記実施形態においては、対象データが画像データである場合について説明したが、対象データは、音声データ、グラフデータ、又は動画データ等のデータであってもよい。また、上記実施形態では、ＳＴＥＰ７において確認する停止数を０に設定しているが、これに限らず、他の数字（例えば１或いは１０等の整数）としてもよい。

【0070】

また、上記実施形態においては、モデルＭは、被写体の良品又は不良品を判定するために、第１ラベル又は第２ラベルの判定を行う例について説明しているが、被写体の種類（人物、乗り物、動物等）の判定を行うモデルＭについても、上記実施形態と同様に適用が可能である。

【0071】

例えば、被写体の種類をラベルＡ，ラベルＢ及びラベルＣに分類するモデルの場合、ＳＴＥＰ７において、ラベルＡ，ラベルＢ及びラベルＣについて、それぞれラベルについての抽出数が全て基準データ数を超えた場合にＳＴＥＰ８～ＳＴＥＰ１０の処理を行い、それぞれラベルについての抽出数が停止数を超え、且つ基準データ数未満の場合にＳＴＥＰ１１の処理を行うようにすればよい。

【0072】

また、上記実施形態においては、増加処理として、フリップ処理、シフト処理、微小回転処理及びフィルタ処理を例にしているが、これに限らず、インパルズノイズの付加、コントラスト調整、明度調整、拡大・縮小、部分マスク、トリミング、変形、或いは変色等の各処理を行ってもよい。従って、増加するデータの数は上記実施形態の３００倍に限られず、適宜変更することができる。

【0073】

また、上記実施形態においては、学習済みのモデルＭを用いた学習の例を示したが、これに限らず、未学習のモデルＭを用いて上記処理を行ってもよい。その際、図２のＳＴＥＰ１の前処理として、未学習のモデルＭに学習用の教師データを用いて学習を行い、その後にＳＴＥＰ１以降の処理を行えばよい。

【0074】

また、上記実施形態においては、ＳＴＥＰ７のにおいて、抽出範囲が拡張範囲である場合に、（１）側に移動して、抽出処理によって抽出された抽出データの表示及び確認を行っているが（ＳＴＥＰ８～９）、これに限らず、（２）側に移動して再度抽出範囲を拡張範囲として（ＳＴＥＰ１１）、抽出処理（ＳＴＥＰ６）を行ってもよい。その際、拡張範囲の値を変更してもよく、抽出処理（ＳＴＥＰ６）の回数を制限してもよい。

【符号の説明】

【0075】

Ｍ…モデル
１…学習装置
２…データ取得部
３…増加処理部
４…制御部
５…抽出部
６…学習部
７…表示部
８…ラベル変更部
１１…教師データ
１２…教師候補データ
１３…変更教師候補データ
１４…母集団
１５…抽出データ
１６…表示画面
１７…ラベル
１８…変更表示

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版