(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-24
(45)【発行日】2024-10-02
(54)【発明の名称】学習装置、その制御方法、及び、制御プログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240925BHJP
【FI】
G06T7/00 350B
(21)【出願番号】P 2022039112
(22)【出願日】2022-03-14
【審査請求日】2023-11-29
(73)【特許権者】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】谷重 崇未
(72)【発明者】
【氏名】落合 亮吉
【審査官】吉川 康男
(56)【参考文献】
【文献】特開2016-099668(JP,A)
【文献】特開2021-051589(JP,A)
【文献】中国特許出願公開第114005149(CN,A)
【文献】特開2016-143354(JP,A)
【文献】特開2019-101496(JP,A)
【文献】特開2004-077165(JP,A)
【文献】Abnormal Detection based on User Feedback for Abstracted Pedestrian Video,,2019 International Conference on Information and Communication Technology Convergence,2019年10月16日,https://ieeexplore.ieee.org/document/8939600
【文献】人体姿勢推定における効率的な学習のための学習サンプル選択,電子情報通信学会技術研究報告,2014年01月16日
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
複数の種類の認識対象から第1種類の認識対象である第1認識対象を認識するように第1認識器に学習させる学習装置であって、
前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である第1誤認識対象を抽出する抽出部と、
前記第1認識対象と前記第1誤認識対象とが共に映った画像を含む第1学習データを生成する学習データ生成部と、
前記第1学習データを用いて、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させる学習制御部と、
を備えた、学習装置。
【請求項2】
前記学習制御部は、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率未満になった場合には、前記第1学習データを用いた学習を停止させる、
請求項1に記載の学習装置。
【請求項3】
評価部をさらに備え、
前記学習データ生成部は、前記複数の種類の認識対象のそれぞれが個別に映った複数の画像を含む基準学習データをさらに生成し、
前記学習制御部は、前記基準学習データを用いて、前記第1認識器に対して、前記第1認識対象を正しく前記第1認識対象と認識するように、且つ、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないように、予め学習させ、
前記評価部は、前記第1認識器が、前記第1認識対象を正しく前記第1認識対象と認識するか、及び、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないか、を評価し、
前記抽出部は、前記評価部による評価結果から前記第1誤認識対象を抽出する、
請求項1又は2に記載の学習装置。
【請求項4】
前記学習データ生成部は、前記第1認識対象と前記第1誤認識対象とが共に映った複数の画像を含む前記第1学習データを生成し、
前記学習制御部は、前記第1学習データを用いて、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率未満になるまで、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させる、
請求項1~3の何れか一項に記載の学習装置。
【請求項5】
前記学習データ生成部は、前記抽出部から前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である複数の前記第1誤認識対象が抽出された場合、前記第1認識対象と、複数の前記第1誤認識対象の各々と、が共に映った複数の画像を含む前記第1学習データを生成し、
前記学習制御部は、前記第1学習データを用いて、前記第1認識器において複数の前記第1誤認識対象のそれぞれが前記第1認識対象と誤認識される確率が前記所定率未満になるまで、前記第1認識器に対して、複数の前記第1誤認識対象が何れも前記第1認識対象とは異なる種類のものであることを学習させる、
請求項1~3の何れか一項に記載の学習装置。
【請求項6】
前記複数の種類の認識対象から第2種類の認識対象である第2認識対象を認識するように第2認識器にさらに学習させる学習装置であって、
前記抽出部は、前記複数の種類の認識対象のうち、前記第2認識器において前記第2認識対象と誤認識される確率が所定率以上の認識対象である第2誤認識対象をさらに抽出し、
前記学習データ生成部は、前記第2認識対象と前記第2誤認識対象とが共に映った画像を含む第2学習データをさらに生成し、
前記学習制御部は、さらに、前記第2学習データを用いて、前記第2認識器に対して、前記第2誤認識対象が前記第2認識対象とは異なる種類のものであることを学習させる、
請求項1又は2に記載の学習装置。
【請求項7】
前記学習制御部は、前記第2認識器において前記第2誤認識対象が前記第2認識対象と誤認識される確率が前記所定率未満になった場合には、前記第2学習データを用いた学習を停止させる、
請求項6に記載の学習装置。
【請求項8】
評価部をさらに備え、
前記学習データ生成部は、前記複数の種類の認識対象のそれぞれが個別に映った複数の画像を含む基準学習データをさらに生成し、
前記学習制御部は、前記基準学習データを用いて、前記第1認識器に対して、前記第1認識対象を正しく前記第1認識対象と認識するように、且つ、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないように、予め学習させるとともに、前記第2認識器に対して、前記第2認識対象を正しく前記第2認識対象と認識するように、且つ、前記第2認識対象以外の認識対象を誤って前記第2認識対象と認識しないように、予め学習させ、
前記評価部は、前記第1認識器が、前記第1認識対象を正しく前記第1認識対象と認識するか、及び、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないか、を評価するとともに、前記第2認識器が、前記第2認識対象を正しく前記第2認識対象と認識するか、及び、前記第2認識対象以外の認識対象を誤って前記第2認識対象と認識しないか、を評価し、
前記抽出部は、前記評価部による評価結果から前記第1誤認識対象及び前記第2誤認識対象を抽出する、
請求項6又は7に記載の学習装置。
【請求項9】
前記複数の種類の認識対象に新たな第3種類の認識対象である第3認識対象が追加された場合、前記評価部は、前記第1認識器によって前記第3認識対象が前記第1認識対象ではないことについての学習が行われる前に、前記第1認識器が、前記第3認識対象を誤って前記第1認識対象と認識しないか、をさらに評価するように構成され、
前記抽出部は、前記評価部による評価結果から、前記第3認識対象を含む前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象を抽出するように構成されている、
請求項3に記載の学習装置。
【請求項10】
前記複数の種類の認識対象に新たな第3種類の認識対象である第3認識対象が追加された場合、前記評価部は、前記第1認識器によって前記第3認識対象が第1認識対象ではないことについての学習が行われる前に、前記第1認識器が、前記第3認識対象を誤って前記第1認識対象と認識しないか、及び、前記第2認識器によって前記第3認識対象が第2認識対象ではないことについての学習が行われる前に、前記第2認識器が、前記第3認識対象を誤って前記第2認識対象と認識しないか、をさらに評価するように構成され、
前記抽出部は、前記評価部による評価結果から、前記第3認識対象を含む前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象と、前記第2認識器において前記第2認識対象と誤認識される確率が所定率以上の前記第2誤認識対象と、を抽出するように構成されている、
請求項8に記載の学習装置。
【請求項11】
前記学習データ生成部は、前記複数の種類の認識対象のうち前記第3認識対象が単独で映った画像をさらに含むように前記基準学習データを更新し、
前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習が行われたにも関わらず、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率以上に維持される場合には、前記第1認識器による学習内容を初期化したうえで、前記第1認識器に対して、少なくとも更新された前記基準学習データを用いて学習させる、
請求項9に記載の学習装置。
【請求項12】
前記学習データ生成部は、前記複数の種類の認識対象のうち前記第3認識対象が単独で映った画像をさらに含むように前記基準学習データを更新し、
前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習が行われたにも関わらず、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率以上に維持される場合には、前記第1認識器による学習内容を初期化したうえで、前記第1認識器に対して、少なくとも更新された前記基準学習データを用いて学習させ、且つ、前記第2認識器による前記第2学習データを用いた学習が行われたにも関わらず、前記第2認識器において前記第2誤認識対象が前記第2認識対象と誤認識される確率が前記所定率以上に維持される場合には、前記第2認識器による学習内容を初期化したうえで、前記第2認識器に対して、少なくとも更新された前記基準学習データを用いて学習させる、
請求項10に記載の学習装置。
【請求項13】
前記複数の種類の認識対象から前記第3認識対象を認識するように第3認識器にさらに学習させる学習装置であって、
前記抽出部は、前記複数の種類の認識対象のうち、前記第3認識器において前記第3認識対象と誤認識される確率が所定率以上の認識対象である第3誤認識対象をさらに抽出し、
前記学習データ生成部は、前記第3認識対象と前記第3誤認識対象とが共に映った画像を含む第3学習データをさらに生成し、
前記学習制御部は、さらに、前記第3学習データを用いて、前記第3認識器に対して、前記第3誤認識対象が前記第3認識対象とは異なる種類のものであることを学習させる、
請求項9~12の何れか一項に記載の学習装置。
【請求項14】
前記複数の種類の認識対象から第4種類の認識対象である第4認識対象が除外された場合、前記抽出部は、前記学習制御部によって前記第1認識器による前記第1学習データを用いた学習内容が初期化された状態で、前記複数の種類の認識対象のうち前記第4認識対象を除く認識対象から、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象を新たに抽出し、
前記学習データ生成部は、前記第1認識対象と、新たに抽出された前記第1誤認識対象と、が共に映った画像を含む前記第1学習データを新たに生成し、
前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習内容を初期化することに加えて、前記第1認識器に対して、新たに生成された前記第1学習データを用いて学習させる、
請求項1~3の何れか一項に記載の学習装置。
【請求項15】
前記複数の種類の認識対象から第4種類の認識対象である第4認識対象が除外された場合、前記抽出部は、前記学習制御部によって前記第1認識器による前記第1学習データを用いた学習内容が初期化された状態、且つ、前記学習制御部によって前記第2認識器による前記第2学習データを用いた学習内容が初期化された状態で、前記複数の種類の認識対象のうち前記第4認識対象を除く認識対象から、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象、及び、前記第2認識器において前記第2認識対象と誤認識される確率が所定率以上の前記第2誤認識対象を新たに抽出し、
前記学習データ生成部は、前記第1認識対象と、新たに抽出された前記第1誤認識対象と、が共に映った画像を含む前記第1学習データ、及び、前記第2認識対象と、新たに抽出された前記第2誤認識対象と、が共に映った画像を含む前記第2学習データを新たに生成し、
前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習内容を初期化することに加えて、前記第1認識器に対して、新たに生成された前記第1学習データを用いて学習させ、且つ、前記第2認識器による前記第2学習データを用いた学習内容を初期化することに加えて、前記第2認識器に対して、新たに生成された前記第2学習データを用いて学習させる、
請求項6~8の何れか一項に記載の学習装置。
【請求項16】
複数の種類の認識対象から第1種類の認識対象である第1認識対象を認識するように第1認識器に学習させる学習装置の制御方法であって、
前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である第1誤認識対象を抽出し、
前記第1認識対象と前記第1誤認識対象とが共に映った画像を含む第1学習データを生成し、
前記第1学習データを用いて、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させる、
学習装置の制御方法。
【請求項17】
複数の種類の認識対象から第1種類の認識対象である第1認識対象を認識するように第1認識器に学習させる学習装置の制御プログラムであって、
前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である第1誤認識対象を抽出する処理と、
前記第1認識対象と前記第1誤認識対象とが共に映った画像を含む第1学習データを生成する処理と、
前記第1学習データを用いて、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させる処理と、
をコンピュータに実行させる制御プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、その制御方法、及び、制御プログラムに関する。
【背景技術】
【0002】
近年では、例えばコンビニエンスストア等の商店において販売されている複数の種類の商品(認識対象)のそれぞれを個別に認識するように複数の認識器に学習させる学習装置の開発が進んでいる。
【0003】
認識器による学習に関する技術は、例えば特許文献1に開示されている。特許文献1には、入力パターンを認識辞書と照合して入力パターンを認識し、認識結果に基づいて入力パターンにおける真のカテゴリと誤認識結果として求められたカテゴリとを特定し、各カテゴリに基づいて、誤認識を引き起こした真のカテゴリを含むパターンと、誤認識結果として求められたカテゴリを含むパターンと、を学習用のパターンとして入力し、各パターンを用いて認識辞書の学習及び更新を行う、パターン認識装置が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1には、複数の種類の認識対象のそれぞれを個別に認識するように複数の認識器に学習させる場合において、複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることについて開示も示唆もされていない。そのため、特許文献1の構成では、複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができない、という課題があった。
【0006】
本発明は、以上の背景に鑑みなされたものであり、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることが可能な、学習装置、その制御方法、及び、制御プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一実施態様に係る学習装置は、複数の種類の認識対象から第1種類の認識対象である第1認識対象を認識するように第1認識器に学習させる学習装置であって、前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である第1誤認識対象を抽出する抽出部と、前記第1認識対象と前記第1誤認識対象とが共に映った画像を含む第1学習データを生成する学習データ生成部と、前記第1学習データを用いて、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させる学習制御部と、を備える。この学習装置は、所定の種類の第1認識対象を認識するための第1認識器の学習において、第1認識対象と誤認識される確率が所定率以上の、第1認識対象とは別の種類の認識対象(誤認識対象)、が存在する場合にのみ、当該誤認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる。それにより、この学習装置は、第1認識対象以外の全ての認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる場合よりも、効率よく学習させることができる。その結果、この学習装置は、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができる。
【0008】
前記学習制御部は、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率未満になった場合には、前記第1学習データを用いた学習を停止させてもよい。
【0009】
評価部をさらに備え、前記学習データ生成部は、前記複数の種類の認識対象のそれぞれが個別に映った複数の画像を含む基準学習データをさらに生成し、前記学習制御部は、前記基準学習データを用いて、前記第1認識器に対して、前記第1認識対象を正しく前記第1認識対象と認識するように、且つ、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないように、予め学習させ、前記評価部は、前記第1認識器が、前記第1認識対象を正しく前記第1認識対象と認識するか、及び、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないか、を評価し、前記抽出部は、前記評価部による評価結果から前記第1誤認識対象を抽出してもよい。
【0010】
前記学習データ生成部は、前記第1認識対象と前記第1誤認識対象とが共に映った複数の画像を含む前記第1学習データを生成し、前記学習制御部は、前記第1学習データを用いて、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率未満になるまで、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させてもよい。
【0011】
前記学習データ生成部は、前記抽出部から前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である複数の前記第1誤認識対象が抽出された場合、前記第1認識対象と、複数の前記第1誤認識対象の各々と、が共に映った複数の画像を含む前記第1学習データを生成し、前記学習制御部は、前記第1学習データを用いて、前記第1認識器において複数の前記第1誤認識対象のそれぞれが前記第1認識対象と誤認識される確率が前記所定率未満になるまで、前記第1認識器に対して、複数の前記第1誤認識対象が何れも前記第1認識対象とは異なる種類のものであることを学習させてもよい。
【0012】
前記複数の種類の認識対象から第2種類の認識対象である第2認識対象を認識するように第2認識器にさらに学習させる学習装置であって、前記抽出部は、前記複数の種類の認識対象のうち、前記第2認識器において前記第2認識対象と誤認識される確率が所定率以上の認識対象である第2誤認識対象をさらに抽出し、前記学習データ生成部は、前記第2認識対象と前記第2誤認識対象とが共に映った画像を含む第2学習データをさらに生成し、前記学習制御部は、さらに、前記第2学習データを用いて、前記第2認識器に対して、前記第2誤認識対象が前記第2認識対象とは異なる種類のものであることを学習させてもよい。
【0013】
前記学習制御部は、前記第2認識器において前記第2誤認識対象が前記第2認識対象と誤認識される確率が前記所定率未満になった場合には、前記第2学習データを用いた学習を停止させてもよい。
【0014】
評価部をさらに備え、前記学習データ生成部は、前記複数の種類の認識対象のそれぞれが個別に映った複数の画像を含む基準学習データをさらに生成し、前記学習制御部は、前記基準学習データを用いて、前記第1認識器に対して、前記第1認識対象を正しく前記第1認識対象と認識するように、且つ、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないように、予め学習させるとともに、前記第2認識器に対して、前記第2認識対象を正しく前記第2認識対象と認識するように、且つ、前記第2認識対象以外の認識対象を誤って前記第2認識対象と認識しないように、予め学習させ、前記評価部は、前記第1認識器が、前記第1認識対象を正しく前記第1認識対象と認識するか、及び、前記第1認識対象以外の認識対象を誤って前記第1認識対象と認識しないか、を評価するとともに、前記第2認識器が、前記第2認識対象を正しく前記第2認識対象と認識するか、及び、前記第2認識対象以外の認識対象を誤って前記第2認識対象と認識しないか、を評価し、前記抽出部は、前記評価部による評価結果から前記第1誤認識対象及び前記第2誤認識対象を抽出してもよい。
【0015】
前記複数の種類の認識対象に新たな第3種類の認識対象である第3認識対象が追加された場合、前記評価部は、前記第1認識器によって前記第3認識対象が前記第1認識対象ではないことについての学習が行われる前に、前記第1認識器が、前記第3認識対象を誤って前記第1認識対象と認識しないか、をさらに評価するように構成され、前記抽出部は、前記評価部による評価結果から、前記第3認識対象を含む前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象を抽出するように構成されていてもよい。
【0016】
前記複数の種類の認識対象に新たな第3種類の認識対象である第3認識対象が追加された場合、前記評価部は、前記第1認識器によって前記第3認識対象が第1認識対象ではないことについての学習が行われる前に、前記第1認識器が、前記第3認識対象を誤って前記第1認識対象と認識しないか、及び、前記第2認識器によって前記第3認識対象が第2認識対象ではないことについての学習が行われる前に、前記第2認識器が、前記第3認識対象を誤って前記第2認識対象と認識しないか、をさらに評価するように構成され、前記抽出部は、前記評価部による評価結果から、前記第3認識対象を含む前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象と、前記第2認識器において前記第2認識対象と誤認識される確率が所定率以上の前記第2誤認識対象と、を抽出するように構成されていてもよい。
【0017】
前記学習データ生成部は、前記複数の種類の認識対象のうち前記第3認識対象が単独で映った画像をさらに含むように前記基準学習データを更新し、前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習が行われたにも関わらず、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率以上に維持される場合には、前記第1認識器による学習内容を初期化したうえで、前記第1認識器に対して、少なくとも更新された前記基準学習データを用いて学習させてもよい。
【0018】
前記学習データ生成部は、前記複数の種類の認識対象のうち前記第3認識対象が単独で映った画像をさらに含むように前記基準学習データを更新し、前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習が行われたにも関わらず、前記第1認識器において前記第1誤認識対象が前記第1認識対象と誤認識される確率が前記所定率以上に維持される場合には、前記第1認識器による学習内容を初期化したうえで、前記第1認識器に対して、少なくとも更新された前記基準学習データを用いて学習させ、且つ、前記第2認識器による前記第2学習データを用いた学習が行われたにも関わらず、前記第2認識器において前記第2誤認識対象が前記第2認識対象と誤認識される確率が前記所定率以上に維持される場合には、前記第2認識器による学習内容を初期化したうえで、前記第2認識器に対して、少なくとも更新された前記基準学習データを用いて学習させてもよい。
【0019】
前記複数の種類の認識対象から前記第3認識対象を認識するように第3認識器にさらに学習させる学習装置であって、前記抽出部は、前記複数の種類の認識対象のうち、前記第3認識器において前記第3認識対象と誤認識される確率が所定率以上の認識対象である第3誤認識対象をさらに抽出し、前記学習データ生成部は、前記第3認識対象と前記第3誤認識対象とが共に映った画像を含む第3学習データをさらに生成し、前記学習制御部は、さらに、前記第3学習データを用いて、前記第3認識器に対して、前記第3誤認識対象が前記第3認識対象とは異なる種類のものであることを学習させてもよい。
【0020】
前記複数の種類の認識対象から第4種類の認識対象である第4認識対象が除外された場合、前記抽出部は、前記学習制御部によって前記第1認識器による前記第1学習データを用いた学習内容が初期化された状態で、前記複数の種類の認識対象のうち前記第4認識対象を除く認識対象から、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象を新たに抽出し、前記学習データ生成部は、前記第1認識対象と、新たに抽出された前記第1誤認識対象と、が共に映った画像を含む前記第1学習データを新たに生成し、前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習内容を初期化することに加えて、前記第1認識器に対して、新たに生成された前記第1学習データを用いて学習させてもよい。
【0021】
前記複数の種類の認識対象から第4種類の認識対象である第4認識対象が除外された場合、前記抽出部は、前記学習制御部によって前記第1認識器による前記第1学習データを用いた学習内容が初期化された状態、且つ、前記学習制御部によって前記第2認識器による前記第2学習データを用いた学習内容が初期化された状態で、前記複数の種類の認識対象のうち前記第4認識対象を除く認識対象から、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の前記第1誤認識対象、及び、前記第2認識器において前記第2認識対象と誤認識される確率が所定率以上の前記第2誤認識対象を新たに抽出し、前記学習データ生成部は、前記第1認識対象と、新たに抽出された前記第1誤認識対象と、が共に映った画像を含む前記第1学習データ、及び、前記第2認識対象と、新たに抽出された前記第2誤認識対象と、が共に映った画像を含む前記第2学習データを新たに生成し、前記学習制御部は、前記第1認識器による前記第1学習データを用いた学習内容を初期化することに加えて、前記第1認識器に対して、新たに生成された前記第1学習データを用いて学習させ、且つ、前記第2認識器による前記第2学習データを用いた学習内容を初期化することに加えて、前記第2認識器に対して、新たに生成された前記第2学習データを用いて学習させてもよい。
【0022】
本発明の一実施態様に係る学習装置の制御方法は、複数の種類の認識対象から第1種類の認識対象である第1認識対象を認識するように第1認識器を少なくとも学習させる学習装置の制御方法であって、前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である第1誤認識対象を抽出し、前記第1認識対象と前記第1誤認識対象とが共に映った画像を含む第1学習データを生成し、前記第1学習データを用いて、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させる。この学習装置の制御方法は、所定の種類の第1認識対象を認識するための第1認識器の学習において、第1認識対象と誤認識される確率が所定率以上の、第1認識対象とは別の種類の認識対象(誤認識対象)、が存在する場合にのみ、当該誤認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる。それにより、この学習装置の制御方法は、第1認識対象以外の全ての認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる場合よりも、効率よく学習させることができる。その結果、この学習装置の制御方法は、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができる。
【0023】
本発明の一実施態様に係る学習装置の制御プログラムは、複数の種類の認識対象から第1種類の認識対象である第1認識対象を認識するように第1認識器を少なくとも学習させる学習装置の制御プログラムであって、前記複数の種類の認識対象のうち、前記第1認識器において前記第1認識対象と誤認識される確率が所定率以上の認識対象である第1誤認識対象を抽出する処理と、前記第1認識対象と前記第1誤認識対象とが共に映った画像を含む第1学習データを生成する処理と、前記第1学習データを用いて、前記第1認識器に対して、前記第1誤認識対象が前記第1認識対象とは異なる種類のものであることを学習させる処理と、をコンピュータに実行させる。この制御プログラムは、所定の種類の第1認識対象を認識するための第1認識器の学習において、第1認識対象と誤認識される確率が所定率以上の、第1認識対象とは別の種類の認識対象(誤認識対象)、が存在する場合にのみ、当該誤認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる。それにより、この制御プログラムは、第1認識対象以外の全ての認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる場合よりも、効率よく学習させることができる。その結果、この制御プログラムは、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができる。
【発明の効果】
【0024】
本発明によれば、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることが可能な、学習装置、その制御方法、及び、制御プログラムを提供することができる。
【図面の簡単な説明】
【0025】
【
図1】
図1は、実施の形態1に係る学習システムの構成例を示すブロック図である。
【
図2】
図2は、実施の形態1に係る学習装置の構成例を示すブロック図である。
【
図3】
図3は、
図2に示す学習装置の動作を示すフローチャートである。
【
図4】
図4は、基準学習データに含まれる画像の一例を示す図である。
【
図5】
図5は、追加学習データに含まれる画像の一例を示す図である。
【
図6】
図6は、実施の形態2に係る学習装置の動作を示すフローチャートである。
【
図7】
図7は、基準学習データに含まれる画像の一例を示す図である。
【
図8】
図8は、追加学習データに含まれる画像の一例を示す図である。
【
図9】
図9は、実施の形態3に係る学習装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0026】
以下、発明の実施の形態を通じて本発明を説明するが、特許請求の範囲に係る発明を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。説明の明確化のため、以下の記載及び図面は、適宜、省略、及び簡略化がなされている。各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略されている。
【0027】
<実施の形態1>
図1は、実施の形態1に係る学習システム1の構成例を示すブロック図である。学習システム1は、学習装置11を用いて、複数の種類の認識対象のそれぞれを個別に認識するように複数の認識器に学習させるシステムである。ここで、学習システム1に設けられた学習装置11は、所定の種類の第1認識対象を認識するための第1認識器の学習において、第1認識対象と誤認識される確率が所定率以上の、第1認識対象とは別の種類の認識対象(誤認識対象)、が存在する場合にのみ、当該誤認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる。それにより、学習装置11は、第1認識対象以外の全ての認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる場合よりも、効率よく学習させることができる。その結果、学習装置11は、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができる。以下、具体的に説明する。
【0028】
図1に示すように、学習システム1は、学習装置11と、n(nは2以上の整数)個の認識器12_1~12_nと、を備える。
【0029】
n個の認識器12_1~12_nは、n個の種類の認識対象TG1~TGnのそれぞれを個別に認識するための装置である。n個の種類の認識対象TG1~TGnは、例えばコンビニエンスストア等の商店で販売されているn個の種類の商品等である。
【0030】
例えば、認識器(第1認識器)12_1は、n個の種類の認識対象から第1種類の認識対象(第1認識対象)TG1を認識するための装置である。また、認識器(第2認識器)12_2は、n個の種類の認識対象TG1~TGnから第2種類の認識対象(第2認識対象)TG2を認識するための装置である。同様にして、認識器12_i(iは1~nの何れかの整数)は、n個の種類の認識対象TG1~TGnから、第i種類の認識対象TGiを認識するための装置である。
【0031】
学習装置11は、認識器12_1~12_nに対して、認識対象TG1~TGnのそれぞれを個別に認識するように学習させる。換言すると、学習装置11は、認識対象TG1~TGnのそれぞれを個別に認識するように認識器12_1~12_nを訓練する。
【0032】
例えば、学習装置11は、認識器12_1に対して、認識対象TG1~TGnから第1種類の認識対象TG1を認識するように学習させる。また、学習装置11は、認識器12_2に対して、認識対象TG1~TGnから第2種類の認識対象TG2を認識するように学習させる。同様にして、学習装置11は、認識器12_iに対して、認識対象TG1~TGnから第i種類の認識対象TGiを認識するように学習させる。
【0033】
図2は、学習装置11の構成例を示すブロック図である。
図2に示すように、学習装置11は、学習データ生成部111と、学習制御部112と、評価部113と、抽出部114と、を少なくとも備える。
【0034】
学習データ生成部111は、認識器12_1~12_nによる学習の際に用いられる学習データを生成する。
【0035】
具体的には、学習データ生成部111は、認識対象TG1~TGnのそれぞれが個別に映った複数の画像を含む基準学習データを生成する。換言すると、学習データ生成部111は、認識対象TG1~TGnのそれぞれが単独で映った複数の画像を含む基準学習データを生成する。また、学習データ生成部111は、追加学習データを生成する。学習データ生成部111による追加学習データの生成については後述する。
【0036】
学習制御部112は、学習データ生成部111によって生成された学習データを用いて、認識器12_1~12_nに学習させる。
【0037】
例えば、学習制御部112は、基準学習データを用いて、認識器12_1に対して、認識対象TG1を正しく認識対象TG1と認識するように、且つ、認識対象TG1以外の認識対象を誤って認識対象TG1と認識しないように、学習させる。また、学習制御部112は、基準学習データを用いて、認識器12_2に対して、認識対象TG2を正しく認識対象TG2と認識するように、且つ、認識対象TG2以外の認識対象を誤って認識対象TG2と認識しないように、学習させる。同様にして、学習制御部112は、基準学習データを用いて、認識器12_iに対して、認識対象TGiを正しく認識対象TGiと認識するように、且つ、認識対象TGi以外の認識対象を誤って認識対象TGiと認識しないように、学習させる。また、学習制御部112は、追加学習データを用いて、認識器12_1~12_nに追加学習させる。学習制御部112による追加学習データを用いた学習制御については後述する。
【0038】
評価部113は、各認識器12_1~12_nが、指定された認識対象を正しく認識するか否か、を評価する。なお、評価部113による認識器12_1~12_nの評価では、実物の認識対象が用いられてもよいし、認識対象が映った画像が用いられてもよい。
【0039】
例えば、評価部113は、認識器12_1が、認識対象TG1を正しく認識対象TG1と認識するか、及び、認識対象TG1以外の認識対象を誤って認識対象TG1と認識しないか、を評価する。また、評価部113は、認識器12_2が、認識対象TG2を正しく認識対象TG2と認識するか、及び、認識対象TG2以外の認識対象を誤って認識対象TG2と認識しないか、を評価する。同様にして、評価部113は、認識器12_iが、認識対象TGiを正しく認識対象TGiと認識するか、及び、認識対象TGi以外の認識対象を誤って認識対象TGiと認識しないか、を評価する。
【0040】
抽出部114は、各認識器12_1~12_nにおいて、指定された認識対象と誤認識される確率が所定率以上の認識対象である誤認識対象、を抽出する。
【0041】
例えば、抽出部114は、認識対象TG1~TGnのうち、認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象(第1誤認識対象)FTG1を抽出する。また、抽出部114は、認識対象TG1~TGnのうち、認識器12_2において認識対象TG2と誤認識される確率が所定率以上の認識対象である誤認識対象(第2誤認識対象)FTG2を抽出する。同様にして、抽出部114は、認識対象TG1~TGnのうち、認識器12_iにおいて認識対象TGiと誤認識される確率が所定率以上の認識対象である誤認識対象FTGiを抽出する。
【0042】
ここで、学習データ生成部111は、認識対象TG1~TGnのそれぞれが個別に映った複数の画像を含む基準学習データだけでなく、抽出部114によって抽出された誤認識対象と、認識対象と、が共に映った画像を含む追加学習データをさらに生成する。
【0043】
例えば、学習データ生成部111は、認識対象TG1~TGnのうち、例えば認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象FTG1と、認識対象TG1と、が共に映った画像を含む追加学習データ(第1学習データ)を生成する。また、学習データ生成部111は、認識対象TG1~TGnのうち、例えば認識器12_2において認識対象TG2と誤認識される確率が所定率以上の認識対象である誤認識対象FTG2と、認識対象TG2と、が共に映った画像を含む追加学習データ(第2学習データ)を生成する。同様にして、学習データ生成部111は、認識対象TG1~TGnのうち、例えば認識器12_iにおいて認識対象TGiと誤認識される確率が所定率以上の認識対象である誤認識対象FTGiと、認識対象TGiと、が共に映った画像を含む追加学習データを生成する。
【0044】
そして、学習制御部112は、学習データ生成部111によって生成された追加学習データを用いて、認識器12_1~12_nに追加学習させる。
【0045】
例えば、学習制御部112は、誤認識対象FTG1と認識対象TG1とが共に映った画像を含む追加学習データを用いて、認識器12_1に対して、誤認識対象FTG1が認識対象TG1とは異なる種類のものであることを学習させる。また、学習制御部112は、誤認識対象FTG2と認識対象TG2とが共に映った画像を含む追加学習データを用いて、認識器12_2に対して、誤認識対象FTG2が認識対象TG2とは異なる種類のものであることを学習させる。同様にして、学習制御部112は、誤認識対象FTGiと認識対象TGiとが共に映った画像を含む追加学習データを用いて、認識器12_iに対して、誤認識対象FTGiが認識対象TGiとは異なる種類のものであることを学習させる。
【0046】
なお、学習制御部112は、誤認識対象FTG1~FTGnが無くなった場合には、認識器12_1~12_nによる学習を停止させる。
【0047】
(学習装置11の動作)
続いて、
図3~
図5を用いて、学習装置11の動作について説明する。
図3は、学習装置11の動作を示すフローチャートである。
図4は、基準学習データに含まれる画像の一例を示す図である。
図5は、追加学習データに含まれる画像の一例を示す図である。
【0048】
なお、以下では、学習装置11が、3種類の認識対象TG1~TG3から、第1種類の認識対象(第1認識対象)TG1を認識するように、認識器(第1認識器)12_1に学習させる場合を例に説明する。具体的には、学習装置11が、3種類の認識対象TG1~TG3である3種類の商品“ABC茶”、“DEF茶”、“GHI茶”から、第1種類の認識対象TG1である商品“ABC茶”を認識するように、認識器12_1に学習させる場合を例に説明する。
【0049】
まず、学習データ生成部111は、認識対象TG1~TG3のそれぞれが個別に映った複数の画像を含む基準学習データを生成する(ステップS101)。
【0050】
具体的には、学習データ生成部111は、
図4の例に示すように、認識対象TG1である商品“ABC茶”が単独で映った画像、認識対象TG2である商品“DEF茶”が単独で映った画像、及び、認識対象TG3である商品“GHI茶”が単独で映った画像、を含む基準学習データを生成する。
【0051】
その後、学習制御部112は、基準学習データを用いて認識器12_1の訓練を実施する(ステップS102)。即ち、学習制御部112は、基準学習データを用いて認識器12_1に学習させる。
【0052】
具体的には、学習制御部112は、基準学習データを用いて、認識器12_1に対して、認識対象TG1を正しく認識対象TG1と認識するように、且つ、認識対象TG2,TG3を誤って認識対象TG1と認識しないように、学習させる。本例では、学習制御部112は、認識器12_1に対して、認識対象TG1である商品“ABC茶”を正しく商品“ABC茶”と認識するように、且つ、認識対象TG2,TG3である商品“DEF茶”及び商品“GHI茶”を誤って商品“ABC茶”と認識しないように、学習させる。
【0053】
その後、評価部113は、認識器12_1の評価を行う(ステップS103)。具体的には、評価部113は、認識器12_1が、認識対象TG1を正しく認識対象TG1と認識するか、及び、認識対象TG2,TG3を誤って認識対象TG1と認識しないか、を評価する。本例では、評価部113は、認識器12_1が、認識対象TG1である商品“ABC茶”を正しく商品“ABC茶”と認識するか、及び、認識対象TG2,TG3である商品“DEF茶”及び商品“GHI茶”を誤って商品“ABC茶”と認識しないか、を評価する。
【0054】
この評価部113による評価結果から、認識対象TG1~TG3のうち、認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象(第1誤認識対象)FTG1の存在の有無が明らかになる(ステップS104)。
【0055】
ここで、誤認識対象FTG1が存在しない場合(ステップS104のNO)、認識器12_1の認識性能が十分な能力に達したと判断され、抽出部114による抽出が行われることなく、認識器12_1による学習は終了する。
【0056】
それに対し、誤認識対象FTG1が存在する場合(ステップS104のYES)、認識器12_1の認識性能が十分な能力に達していないと判断され、認識器12_1による学習は続行される。
【0057】
具体的には、まず、抽出部114は、誤認識対象FTG1を抽出する(ステップS105のNO→ステップS106)。その後、学習データ生成部111は、抽出部114によって抽出された誤認識対象FTG1と、認識対象TG1と、が共に映った画像を含む追加学習データ(第1学習データ)を生成する(ステップS107)。
【0058】
例えば、抽出部114は、誤認識対象FTG1として、認識対象TG3である商品“GHI茶”を抽出する。その場合、学習データ生成部111は、
図5の例に示すように、認識対象TG1である商品“ABC茶”と、誤認識対象FTG1として抽出された商品“GHI茶”と、が共に映った画像が含まれる追加学習データを生成する。
【0059】
その後、学習制御部112は、追加学習データを用いて認識器12_1の追加の訓練を実施する(ステップS102)。即ち、学習制御部112は、追加学習データを用いて認識器12_1に追加学習させる。
【0060】
具体的には、学習制御部112は、追加学習データを用いて、認識器12_1に対して、誤認識対象FTG1が認識対象TG1とは異なる種類のものであることを学習させる。本例では、学習制御部112は、追加学習データを用いて、認識器12_1に対して、誤認識対象FTG1として抽出された商品“GHI茶”が認識対象TG1である商品“ABC茶”とは異なる種類のものであることを学習させる。
【0061】
その後、評価部113は、再び認識器12_1の評価を行う(ステップS103)。具体的には、評価部113は、認識器12_1が、認識対象TG1を正しく認識対象TG1と認識するか、及び、認識対象TG2,TG3を誤って認識対象TG1と認識しないか、を評価する。本例では、評価部113は、認識器12_1が、認識対象TG1である商品“ABC茶”を正しく商品“ABC茶”と認識するか、及び、認識対象TG2,TG3である商品“DEF茶”及び商品“GHI茶”を誤って商品“ABC茶”と認識しないか、を評価する。
【0062】
この評価部113による評価結果から、認識対象TG1~TG3のうち、認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象FTG1の存在の有無が明らかになる(ステップS104)。
【0063】
ここで、誤認識対象FTG1が存在しない場合(ステップS104のNO)、認識器12_1の認識性能が十分な能力に達したと判断され、抽出部114による抽出が行われることなく、認識器12_1による学習は終了する。
【0064】
それに対し、誤認識対象FTG1が存在する場合(ステップS104のYES)、認識器12_1の認識性能が十分な能力に達していないと判断され、認識器12_1による学習は続行される。
【0065】
その後は、誤認識対象FTG1の抽出(ステップS105のNO→ステップS106)、追加学習データの生成(ステップS107)、追加学習データを用いた認識器12_1の訓練(ステップS102)、及び、認識器12_1の評価(ステップS103)が、誤認識対象FTG1が無くなるまで繰り返される。但し、誤認識対象FTG1が無くなる前に、追加学習データを用いた訓練の回数が所定回数に到達した場合(ステップS104のYES→ステップS105のYES)、誤認識対象FTG1が無くなる見込みがないものと判断され、その旨が例えば本システムのユーザに通知される(ステップS108)。通知を受けたユーザは、例えば、学習の手法を変更する等の対策をとることができる。
【0066】
なお、上記の動作の説明では、学習装置11が、認識器12_1の訓練を実施する場合について説明したが、これに限られない。学習装置11は、認識器12_1に対する処理と同様の処理を行うことにより、認識器12_1以外の認識器12_2,12_3の訓練も実施することができる。
【0067】
また、上記の動作の説明では、学習装置11が、認識器12_1の訓練を実施する過程において、認識対象TG3である商品“GHI茶”を誤認識対象FTG1として抽出した場合を例に説明したが、これに限られない。学習装置11は、認識対象TG2である商品“DEF茶”を誤認識対象FTG1として抽出することもあれば、認識対象TG2,TG3を何れも誤認識対象FTG1として抽出することもあり得る。
【0068】
このように、本実施の形態にかかる学習装置11は、所定の種類の第1認識対象を認識するための第1認識器の学習において、第1認識対象と誤認識される確率が所定率以上の、第1認識対象とは別の種類の認識対象(誤認識対象)、が存在する場合にのみ、当該誤認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる。それにより、学習装置11は、第1認識対象以外の全ての認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる場合よりも、効率よく学習させることができる。その結果、学習装置11は、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができる。
【0069】
<実施の形態2>
本実施の形態では、
図6~
図8を用いて、新たな種類の認識対象が追加された場合の学習装置11の動作について説明する。
図6は、実施の形態2に係る学習装置11の動作を示すフローチャートである。
図7は、基準学習データに含まれる画像の一例を示す図である。
図8は、追加学習データに含まれる画像の一例を示す図である。
【0070】
なお、以下では、学習装置11が、例えば
図3に示すような処理を経て、3種類の認識対象TG1~TG3から第1種類の認識対象(第1認識対象)TG1を認識するように認識器(第1認識器)12_1に学習させた後に、新たな種類の認識対象TG4が追加されたことに伴って、認識器12_1に再学習させる場合について説明する。
【0071】
まず、認識対象TG4が追加される(ステップS201)。このとき、学習データ生成部111は、認識対象TG4が単独で映った画像を生成して基準学習データに含める。即ち、学習データ生成部111は、基準学習データを、認識対象TG1~TG3のそれぞれが個別に映った複数の画像に加えて、認識対象TG4が単独で映った画像もさらに含んだ基準学習データに更新する(ステップS202)。
【0072】
具体的には、学習データ生成部111は、
図7の例に示すように、認識対象TG1である商品“ABC茶”が単独で映った画像、認識対象TG2である商品“DEF茶”が単独で映った画像、及び、認識対象TG3である商品“GHI茶”が単独で映った画像に加えて、認識対象TG4である商品“JKL茶”が単独で映った画像もさらに含むように、基準学習データを更新する。
【0073】
なお、説明を省略するが、認識対象TG4を認識するための認識器12_4の訓練は、例えば
図3に示すような処理によって認識器12_1の訓練とは別に行われる。
【0074】
その後、評価部113は、更新された基準学習データを用いて認識器12_1の訓練が行われる前に、認識器12_1の評価を行う(ステップS203)。具体的には、評価部113は、認識器12_1が、認識対象TG1を正しく認識対象TG1と認識するか、及び、認識対象TG2,TG3,TG4を誤って認識対象TG1と認識しないか、を評価する。本例では、評価部113は、認識器12_1が、認識対象TG1である商品“ABC茶”を正しく商品“ABC茶”と認識するか、及び、認識対象TG2,TG3,TG4である商品“DEF茶”、商品“GHI茶”及び商品“JKL茶”を誤って商品“ABC茶”と認識しないか、を評価する。
【0075】
この評価部113による評価結果から、認識対象TG1~TG3のうち、認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象(第1誤認識対象)FTG1の存在の有無が明らかになる(ステップS204)。
【0076】
ここで、誤認識対象FTG1が存在しない場合(ステップS204のNO)、認識器12_1の認識性能が十分な能力に達したと判断され、抽出部114による抽出が行われることなく、認識器12_1による学習は終了する。
【0077】
それに対し、誤認識対象FTG1が存在する場合(ステップS204のYES)、認識器12_1の認識性能が十分な能力に達していないと判断され、認識器12_1による学習は続行される。
【0078】
具体的には、まず、抽出部114は、誤認識対象FTG1を抽出する(ステップS205のNO→ステップS206)。その後、学習データ生成部111は、抽出部114によって抽出された誤認識対象FTG1と、認識対象TG1と、が共に映った画像を含む追加学習データ(第1学習データ)を生成する(ステップS207)。
【0079】
例えば、抽出部114は、誤認識対象FTG1として、認識対象TG4である商品“JKL茶”を抽出する。その場合、学習データ生成部111は、
図8の例に示すように、認識対象TG1である商品“ABC茶”と、誤認識対象FTG1として抽出された商品“JKL茶”と、が共に映った画像が含まれる追加学習データを生成する。
【0080】
その後、学習制御部112は、追加学習データを用いて認識器12_1の追加の訓練を実施する(ステップS208)。即ち、学習制御部112は、追加学習データを用いて認識器12_1に追加学習させる。
【0081】
具体的には、学習制御部112は、追加学習データを用いて、認識器12_1に対して、誤認識対象FTG1が認識対象TG1とは異なる種類のものであることを学習させる。本例では、学習制御部112は、追加学習データを用いて、認識器12_1に対して、誤認識対象FTG1として抽出された商品“JKL茶”が認識対象TG1である商品“ABC茶”とは異なる種類のものであることを学習させる。
【0082】
その後、評価部113は、再び認識器12_1の評価を行う(ステップS203)。具体的には、評価部113は、認識器12_1が、認識対象TG1を正しく認識対象TG1と認識するか、及び、認識対象TG2,TG3,TG4を誤って認識対象TG1と認識しないか、を評価する。本例では、評価部113は、認識器12_1が、認識対象TG1である商品“ABC茶”を正しく商品“ABC茶”と認識するか、及び、認識対象TG2,TG3,TG4である商品“DEF茶”、商品“GHI茶”及び商品“JKL茶”を誤って商品“ABC茶”と認識しないか、を評価する。
【0083】
この評価部113による評価結果から、認識対象TG1~TG3のうち、認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象FTG1の存在の有無が明らかになる(ステップS204)。
【0084】
ここで、誤認識対象FTG1が存在しない場合(ステップS204のNO)、認識器12_1の認識性能が十分な能力に達したと判断され、抽出部114による抽出が行われることなく、認識器12_1による学習は終了する。
【0085】
それに対し、誤認識対象FTG1が存在する場合(ステップS204のYES)、認識器12_1の認識性能が十分な能力に達していないと判断され、認識器12_1による学習は続行される。
【0086】
その後は、誤認識対象FTG1の抽出(ステップS205のNO→ステップS206)、追加学習データの生成(ステップS207)、追加学習データを用いた認識器12_1の訓練(ステップS208)、及び、認識器12_1の評価(ステップS203)が、誤認識対象FTG1が無くなるまで繰り返される。
【0087】
但し、誤認識対象FTG1が無くなる前に、追加学習データを用いた訓練の回数が所定回数に到達した場合(ステップS204のYES→ステップS205のYES)、一回に限り、認識器12_1の学習内容が全て初期化される(ステップS209のYES→ステップS210)。
【0088】
初期化後、学習制御部112は、更新された基準学習データを用いて認識器12_1の訓練を実施する(ステップS208)。つまり、学習制御部112は、認識対象TG1~TG4のそれぞれが個別に映った複数の画像を含む更新後の基準学習データを用いて、認識器12_1の訓練をやり直す。
【0089】
その後、評価部113は、認識器12_1の評価を行う(ステップS203)。この評価部113による評価結果から、誤認識対象FTG1の存在の有無が明らかになる(ステップS204)。
【0090】
ここで、誤認識対象FTG1が存在しない場合(ステップS204のNO)、認識器12_1の認識性能が十分な能力に達したと判断され、抽出部114による抽出が行われることなく、認識器12_1による学習は終了する。
【0091】
それに対し、誤認識対象FTG1が存在する場合(ステップS204のYES)、認識器12_1の認識性能が十分な能力に達していないと判断され、認識器12_1による学習は続行される。
【0092】
その後は、誤認識対象FTG1の抽出(ステップS205のNO→ステップS206)、追加学習データの生成(ステップS207)、追加学習データを用いた認識器12_1の訓練(ステップS208)、及び、認識器12_1の評価(ステップS203)が、誤認識対象FTG1が無くなるまで繰り返される。
【0093】
但し、誤認識対象FTG1が無くなる前に、追加学習データを用いた訓練の回数が再び所定回数に到達した場合(ステップS204のYES→ステップS205のYES→ステップS209のNO)、誤認識対象FTG1が無くなる見込みがないものと判断され、その旨が例えば本システムのユーザに通知される(ステップS211)。通知を受けたユーザは、例えば、学習の手法を変更する等の対策をとることができる。
【0094】
このように、本実施の形態にかかる学習装置11は、所定の種類の第1認識対象を認識するための第1認識器の学習において、第1認識対象と誤認識される確率が所定率以上の、第1認識対象とは別の種類の認識対象(誤認識対象)、が存在する場合にのみ、当該誤認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる。それにより、学習装置11は、第1認識対象以外の全ての認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる場合よりも、効率よく学習させることができる。その結果、学習装置11は、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができる。
【0095】
また、本実施の形態にかかる学習装置11は、第1認識器による学習後に新たな種類の認識対象が追加された場合でも、第1認識器に再学習させる前に当該第1認識器の評価を行って、必要な場合にのみ第1認識器に再学習させている。それにより、学習装置11は、第1認識器に不要に再学習させるのを防ぐことができる。そして、学習装置11は、第1認識器に再学習させる場合でも、既に学習させた内容を残した状態で第1認識器に再学習させている。それにより、学習装置11は、第1認識器に効率よく再学習させることができる。
【0096】
<実施の形態3>
本実施の形態では、
図9を用いて、複数の認識対象の何れかが除外された場合の学習装置11の動作について説明する。
図9は、実施の形態3に係る学習装置11の動作を示すフローチャートである。
【0097】
なお、以下では、学習装置11が、例えば
図3に示すような処理を経て、3種類の認識対象TG1~TG3から第1種類の認識対象(第1認識対象)TG1を認識するように認識器(第1認識器)12_1に学習させた後に、例えば認識対象TG2が除外されたことに伴って、認識器12_1に再学習させる場合について説明する。
【0098】
まず、認識対象TG2が除外される(ステップS301)。このとき、学習データ生成部111は、基準学習データに含まれる複数の画像から、認識対象TG2が単独で映った画像を削除してもよい。即ち、学習データ生成部111は、基準学習データを、認識対象TG2が単独で映った画像が削除された基準学習データに更新してもよい。
【0099】
その後、追加学習データを用いた学習内容が認識器12_1から初期化される(ステップS302)。それにより、認識対象TG1であるか否かを判断する必要の無い認識対象TG2についての学習内容が消去されるため、認識器12_1の性能向上が見込まれる。なお、このとき、追加学習データを用いた学習内容だけでなく、基準学習データを用いた学習内容が認識器12_1から初期化されてもよい。即ち、認識器12_1から全ての学習内容が初期化されてもよい。
【0100】
その後、評価部113は、認識器12_1の訓練が行われる前に、認識器12_1の評価を行う(ステップS303)。具体的には、評価部113は、認識器12_1が、認識対象TG1を正しく認識対象TG1と認識するか、及び、認識対象TG3を誤って認識対象TG1と認識しないか、を評価する。
【0101】
この評価部113による評価結果から、認識対象TG1,TG3のうち、認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象(第1誤認識対象)FTG1の存在の有無が明らかになる(ステップS304)。
【0102】
ここで、誤認識対象FTG1が存在しない場合(ステップS304のNO)、認識器12_1の認識性能が十分な能力に達したと判断され、抽出部114による抽出が行われることなく、認識器12_1による学習は終了する。
【0103】
それに対し、誤認識対象FTG1が存在する場合(ステップS304のYES)、認識器12_1の認識性能が十分な能力に達していないと判断され、認識器12_1による学習は続行される。
【0104】
具体的には、まず、抽出部114は、誤認識対象FTG1を抽出する(ステップS305のNO→ステップS306)。その後、学習データ生成部111は、抽出部114によって抽出された誤認識対象FTG1と、認識対象TG1と、が共に映った画像を含む追加学習データ(第1学習データ)を生成する(ステップS307)。
【0105】
その後、学習制御部112は、追加学習データを用いて認識器12_1の追加の訓練を実施する(ステップS308)。即ち、学習制御部112は、追加学習データを用いて認識器12_1に追加学習させる。具体的には、学習制御部112は、追加学習データを用いて、認識器12_1に対して、誤認識対象FTG1が認識対象TG1とは異なる種類のものであることを学習させる。
【0106】
その後、評価部113は、再び認識器12_1の評価を行う(ステップS303)。具体的には、評価部113は、認識器12_1が、認識対象TG1を正しく認識対象TG1と認識するか、及び、認識対象TG3を誤って認識対象TG1と認識しないか、を評価する。
【0107】
この評価部113による評価結果から、認識対象TG1,TG3のうち、認識器12_1において認識対象TG1と誤認識される確率が所定率以上の認識対象である誤認識対象FTG1の存在の有無が明らかになる(ステップS304)。
【0108】
ここで、誤認識対象FTG1が存在しない場合(ステップS304のNO)、認識器12_1の認識性能が十分な能力に達したと判断され、抽出部114による抽出が行われることなく、認識器12_1による学習は終了する。
【0109】
それに対し、誤認識対象FTG1が存在する場合(ステップS304のYES)、認識器12_1の認識性能が十分な能力に達していないと判断され、認識器12_1による学習は続行される。
【0110】
その後は、誤認識対象FTG1の抽出(ステップS305のNO→ステップS306)、追加学習データの生成(ステップS307)、追加学習データを用いた認識器12_1の訓練(ステップS308)、及び、認識器12_1の評価(ステップS303)が、誤認識対象FTG1が無くなるまで繰り返される。
【0111】
但し、誤認識対象FTG1が無くなる前に、追加学習データを用いた訓練の回数が所定回数に到達した場合(ステップS304のYES→ステップS305のYES)、誤認識対象FTG1が無くなる見込みがないものと判断され、その旨が例えば本システムのユーザに通知される(ステップS309)。通知を受けたユーザは、例えば、学習の手法を変更する等の対策をとることができる。
【0112】
このように、本実施の形態にかかる学習装置11は、所定の種類の第1認識対象を認識するための第1認識器の学習において、第1認識対象と誤認識される確率が所定率以上の、第1認識対象とは別の種類の認識対象(誤認識対象)、が存在する場合にのみ、当該誤認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる。それにより、学習装置11は、第1認識対象以外の全ての認識対象が第1認識対象とは異なる種類のものであることを第1認識器に学習させる場合よりも、効率よく学習させることができる。その結果、学習装置11は、複数の種類の認識対象のそれぞれを個別に認識する複数の認識器の各々に対して、複数の種類の認識対象間での誤認識が発生しないように効率よく学習させることができる。
【0113】
また、本実施の形態にかかる学習装置11は、第1認識器による学習後に、第1認識対象とは別の学習済みの認識対象が除外された場合、除外された認識対象についての学習内容を第1認識器から初期化することにより、第1認識対象であるか否かを判断する必要の無い認識対象についての学習内容が消去されるため、第1認識器の性能を向上させることができる。
【0114】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
【0115】
さらに、本開示は、搬送システムにおける制御処理の一部又は全部を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することが可能である。
【0116】
上述したプログラムは、コンピュータに読み込まれた場合に、実施形態で説明された1又はそれ以上の機能をコンピュータに行わせるための命令群(又はソフトウェアコード)を含む。プログラムは、非一時的なコンピュータ可読媒体又は実体のある記憶媒体に格納されてもよい。限定ではなく例として、コンピュータ可読媒体又は実体のある記憶媒体は、random-access memory(RAM)、read-only memory(ROM)、フラッシュメモリ、solid-state drive(SSD)又はその他のメモリ技術、CD-ROM、digital versatile disc(DVD)、Blu-ray(登録商標)ディスク又はその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ又はその他の磁気ストレージデバイスを含む。プログラムは、一時的なコンピュータ可読媒体又は通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体又は通信媒体は、電気的、光学的、音響的、またはその他の形式の伝搬信号を含む。
【符号の説明】
【0117】
1 学習システム
11 学習装置
12_1~12_n 認識器
111 学習データ生成部
112 学習制御部
113 評価部
114 抽出部