(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024168365
(43)【公開日】2024-12-05
(54)【発明の名称】情報処理システム
(51)【国際特許分類】
G06T 7/00 20170101AFI20241128BHJP
【FI】
G06T7/00 350B
【審査請求】有
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023084948
(22)【出願日】2023-05-23
(11)【特許番号】
(45)【特許公報発行日】2024-08-21
(71)【出願人】
【識別番号】516278171
【氏名又は名称】株式会社マーケットヴィジョン
(74)【代理人】
【識別番号】100205084
【弁理士】
【氏名又は名称】吉浦 洋一
(72)【発明者】
【氏名】谷井 成吉
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA08
5L096DA02
5L096GA51
5L096HA09
5L096HA11
5L096JA03
5L096KA04
5L096KA15
(57)【要約】
【課題】
本発明は、機械学習における学習モデル(ネットワーク)の生成に関する情報処理システムを提供することを目的とする。
【解決手段】
機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、複数の対象物の画像情報を分類する分類処理部と、分類したグループと仮識別情報とを対応づける仮識別情報処理部と、グループに含まれる対象物の画像情報と仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部と、入力を受け付けた標本情報を学習モデルに入力することで仮識別情報を出力させる認識処理部、出力した仮識別情報と標本情報に対応する対象物識別情報とを対応づける出力処理部と、を有する情報処理システムである。
【選択図】
図1
【特許請求の範囲】
【請求項1】
機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、
複数の対象物の画像情報を分類する分類処理部と、
前記分類したグループと仮識別情報とを対応づける仮識別情報処理部と、
前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部と、
入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部、
前記出力した仮識別情報と前記標本情報に対応する対象物識別情報とを対応づける出力処理部と、
を有することを特徴とする情報処理システム。
【請求項2】
前記情報処理システムは、
前記同定処理の対象とする画像情報を前記学習モデルに入力することで、前記学習モデルが出力する仮識別情報に対応する対象物識別情報を出力値として出力させる、
ことを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記情報処理システムは、
前記分類したグループに含まれる対象物の画像情報のうち、誤りが含まれている可能性がある対象物画像情報を除外するクレンジング処理を実行するクレンジング処理部、
を有することを特徴とする請求項1に記載の情報処理システム。
【請求項4】
前記クレンジング処理部は、
前記グループに含まれる対象物の画像情報の指標値を用いて算出した基準値からの情報距離を用いて、除外する対象物の画像情報を判定する、
ことを特徴とする請求項3に記載の情報処理システム。
【請求項5】
前記クレンジング処理部は、
前記グループに含まれる対象物の画像情報の指標値を用いて基準値を算出し、
前記基準値と、前記対象物の画像情報の指標値とを用いて情報距離を算出し、
前記情報距離が所定の閾値以上または所定の比率以上の乖離がある場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、
ことを特徴とする請求項4に記載の情報処理システム。
【請求項6】
前記クレンジング処理部は、
前記グループに含まれる対象物の画像情報の類似度を用いて、除外する対象物の画像情報を判定する、
ことを特徴とする請求項3に記載の情報処理システム。
【請求項7】
前記クレンジング処理部は、
前記グループに含まれる対象物の画像情報と、そのグループに含まれる他の対象物の画像情報との類似度を算出し、
その類似度を用いたあらかじめ定められた条件を充足した場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、
ことを特徴とする請求項6に記載の情報処理システム。
【請求項8】
前記対象物は陳列棚に陳列している商品であり、
前記分類処理部は、
陳列棚の画像情報から陳列している商品の画像情報を切り出して対象物画像情報として抽出し、
前記隣接している商品の対象物画像情報の類似度を比較し、
前記類似度が一定の条件を充足している場合には、隣接している商品の対象物画像情報を同一のグループに分類する、
ことを特徴とする請求項1に記載の情報処理システム。
【請求項9】
前記対象物は陳列棚に陳列している商品であり、
前記認識処理部は、
入力を受け付けた売上高に応じた商品の標本情報を前記学習モデルに入力し、前記学習モデルで受け付けた前記標本情報に対応する仮識別情報を出力する、
ことを特徴とする請求項1に記載の情報処理システム。
【請求項10】
前記対象物は陳列棚に陳列している商品であり、
前記認識処理部は、
入力を受け付けた組織体ごとの商品の標本情報を前記学習モデルに入力し、前記学習モデルで受け付けた前記標本情報に対応する仮識別情報を出力する、
ことを特徴とする請求項1に記載の情報処理システム。
【請求項11】
コンピュータを、
複数の対象物の画像情報を分類する分類処理部、
前記分類したグループと仮識別情報とを対応づける仮識別情報処理部、
前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部、
入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部、
前記出力した仮識別情報と前記標本情報に対応する対象物識別情報とを対応づける出力処理部、
として機能させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習における学習モデル(ネットワーク)の生成に関する情報処理システムに関する。
【背景技術】
【0002】
近年、コンピュータを用いた画像解析処理として、機械学習が広く用いられるようになってきている。機械学習では、あらかじめ学習用のデータセット(学習用データ)を作成し、それをコンピュータに読み込ませて所定の学習処理を実行させている。
【0003】
しかし学習用データをあらかじめ準備すること自体が作業負担が大きい。そこで、下記特許文献1、特許文献2に示すようなシステムが開示されている。
【0004】
特許文献1の発明では、商品画像を撮影し、その商品に付されているコードを読み取ることで、商品画像とそのラベル付けを行うことで、学習用データを生成している。
【0005】
また、特許文献2の発明では、あらかじめ分類に関する情報がラベル付けされた物体を含む画像データが格納された画像データベースから、当該画像データに含まれる物体の分類を選択し、その物体を画像データから抽出してテンプレート画像を生成することで、テンプレート画像とラベル付けとをした学習用データを生成している。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2020-095537号公報
【特許文献2】特開2022-076296号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1の発明の場合、商品を準備して撮影を行うとともに、その商品に付されたコードをコードリーダで読み取ることで学習用データを生成するものであり、作業者の作業負担が大きい。学習用データとして読み取るべき商品が多くなると、膨大な作業量となる。
【0008】
特許文献2の発明の場合、あらかじめ分類に関する情報がラベル付けされた物体を含む画像データが格納された画像データベースが準備されていなければその処理を行うことができない。
【0009】
小売店などにおいて、陳列棚に陳列されている商品を認識し、その陳列状況などを把握することは企業のマーケティング戦略として非常に重要である。そのため、自社の商品、あるいは競合会社の商品が小売店の陳列棚に陳列されている状況を把握したい要望がある。
【0010】
そこで、小売店の陳列棚を撮影して陳列棚に陳列している商品を同定するシステムがあるが、この商品の同定では機械学習を用いることが行われている。この機械学習においても、上述と同様に、学習用データを用いて学習処理が実行されているが、陳列棚に陳列される商品は多岐にわたる。この場合においても、従来は、陳列している商品とその識別情報をラベルとして対応づけた学習用データを用いて学習モデルを生成していた。
【0011】
しかしこの場合においても、学習用データの準備の負担が大きく、学習モデルの生成に要する負担が大きかった。
【課題を解決するための手段】
【0012】
本発明者は上記課題に鑑み、機械学習で用いる学習モデルを効率よく生成する情報処理システムを発明した。
【0013】
第1の発明は、機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、複数の対象物の画像情報を分類する分類処理部と、前記分類したグループと仮識別情報とを対応づける仮識別情報処理部と、前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部と、入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部、前記出力した仮識別情報と前記標本情報に対応する対象物識別情報とを対応づける出力処理部と、を有する情報処理システムである。
【0014】
本発明のように構成することで、機械学習で用いる学習モデルを効率よく生成することができる。
【0015】
上述の発明において、前記情報処理システムは、前記同定処理の対象とする画像情報を前記学習モデルに入力することで、前記学習モデルが出力する仮識別情報に対応する対象物識別情報を出力値として出力させる、情報処理システムのように構成することができる。
【0016】
本発明のように構成することで、学習モデルに同定対象の画像情報を入力すると、対象物識別情報を出力することができる。
【0017】
上述の発明において、前記情報処理システムは、前記分類したグループに含まれる対象物の画像情報のうち、誤りが含まれている可能性がある対象物画像情報を除外するクレンジング処理を実行するクレンジング処理部、を有する情報処理システムのように構成することができる。
【0018】
本発明のようにクレンジング処理を実行することで、グループに含まれている対象物画像情報のうち、誤りが含まれている可能性がある対象物画像情報を除外することができ、画像分類の精度を向上させることができる。
【0019】
上述の発明において、前記クレンジング処理部は、前記グループに含まれる対象物の画像情報の指標値を用いて算出した基準値からの情報距離を用いて、除外する対象物の画像情報を判定する、情報処理システムのように構成することができる。
【0020】
上述の発明において、前記クレンジング処理部は、前記グループに含まれる対象物の画像情報の指標値を用いて基準値を算出し、前記基準値と、前記対象物の画像情報の指標値とを用いて情報距離を算出し、前記情報距離が所定の閾値以上または所定の比率以上の乖離がある場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、情報処理システムのように構成することができる。
【0021】
上述の発明において、前記クレンジング処理部は、前記グループに含まれる対象物の画像情報の類似度を用いて、除外する対象物の画像情報を判定する、情報処理システムのように構成することができる。
【0022】
上述の発明において、前記クレンジング処理部は、前記グループに含まれる対象物の画像情報と、そのグループに含まれる他の対象物の画像情報との類似度を算出し、その類似度を用いたあらかじめ定められた条件を充足した場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、情報処理システムのように構成することができる。
【0023】
クレンジング処理としてはこれらの発明のように実行することができる。
【0024】
上述の発明において、前記対象物は陳列棚に陳列している商品であり、前記分類処理部は、陳列棚の画像情報から陳列している商品の画像情報を切り出して対象物画像情報として抽出し、前記隣接している商品の対象物画像情報の類似度を比較し、前記類似度が一定の条件を充足している場合には、隣接している商品の対象物画像情報を同一のグループに分類する、情報処理システムのように構成することができる。
【0025】
陳列棚には同一種別の商品は隣接して陳列されることが多い。そのため、対象物が陳列棚に陳列している商品の場合、隣接する商品の対象物画像情報は同一種別、すなわち同一のグループに分類できる可能性がある。そこで、隣接している商品の対象物画像情報の類似度を比較し、それが条件を充足している場合には、同一のグループに分類することが好ましい。
【0026】
上述の発明において、前記対象物は陳列棚に陳列している商品であり、前記認識処理部は、入力を受け付けた売上高に応じた商品の標本情報を前記学習モデルに入力し、前記学習モデルで受け付けた前記標本情報に対応する仮識別情報を出力する、情報処理システムのように構成することができる。
【0027】
陳列棚に陳列している商品を同定する学習モデルの場合、商品数が数千から数万単位になる可能性がある。その場合、すべての商品の標本情報を入力するのは負担が大きい。
【0028】
一般的に、売上げの多くを占めるのは少数の売れ筋の商品である。そして陳列棚には売れ筋商品が陳列されている可能性が高い。そこで、商品の同定対象となる可能性の高い売れ筋の商品を標本情報として入力をしておけば、陳列棚に陳列しているすべての商品の同定ができなくても、売上高ベースで多くの商品の認識を行うことができ、実務的には十分なシステムを構築することができる。
【0029】
上述の発明において、前記対象物は陳列棚に陳列している商品であり、前記認識処理部は、入力を受け付けた組織体ごとの商品の標本情報を前記学習モデルに入力し、前記学習モデルで受け付けた前記標本情報に対応する仮識別情報を出力する、情報処理システムのように構成することができる。
【0030】
本発明をマーケティングに用いる場合、ある特定の会社などの特定の組織体から、自社または競合他社の商品の陳列状況を把握したい場合がある。そこで、本発明のように、組織体ごとの商品の標本情報を入力しておけば、陳列棚に陳列しているすべての商品の同定ができなくても、その組織体にとっては重要なマーケティング情報を得ることができ、実務的には十分なシステムを構築ることができる。
【0031】
第1の発明は、本発明のプログラムをコンピュータに読み込ませて実行することで、実現することができる。すなわち、コンピュータを、複数の対象物の画像情報を分類する分類処理部、前記分類したグループと仮識別情報とを対応づける仮識別情報処理部、前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部、入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部、前記出力した仮識別情報と前記標本情報に対応する対象物識別情報とを対応づける出力処理部、として機能させる情報処理プログラムである。
【発明の効果】
【0032】
本発明の情報処理システムを用いることで、機械学習で用いる学習モデルを効率よく生成することができる。
【図面の簡単な説明】
【0033】
【
図1】本発明の情報処理システムの処理の概念図の一例を示す図である。
【
図2】本発明の情報処理システムの処理の概念図の一例を示す図である。
【
図3】本発明の情報処理システムの構成の一例を模式的に示すブロック図である。
【
図4】本発明の情報処理システムで用いるコンピュータのハードウェア構成の一例を模式的に示すブロック図である。
【
図5】本発明の情報処理システムにおける全体の処理プロセスの一例を示すフローチャートである。
【
図6】陳列棚を撮影した画像情報の一例を示す図である。
【
図7】陳列棚を撮影した画像情報から対象物画像情報を抽出した状態の一例を示す図である。
【
図8】画像分類処理部において対象物画像情報を分類した状態の一例を示す図である。
【
図9】仮識別情報処理部において仮識別情報を対応づけた状態の一例を示す図である。
【
図10】学習モデルに標本情報を入力して、仮識別情報を出力値として出力した状態の一例を示す図である。
【
図11】仮識別情報と対象物識別情報とを紐付ける状態の一例を示す図である。
【
図12】実施例2における情報処理システムの構成の一例を模式的に示す図である。
【発明を実施するための形態】
【0034】
本発明の情報処理システム1の処理の概念図の一例を
図1および
図2に示す。また、本発明の情報処理システム1の処理機能の一例をブロック図で
図3に示す。情報処理システム1では、陳列棚に陳列されている商品などの対象物を、機械学習のモデルを用いて画像情報から認識するモデルを生成するシステムである。対象物としては、陳列棚に陳列されている商品の場合を用いて説明するが、それに限られるものではない。
【0035】
情報処理システム1における管理端末2は、コンピュータを用いて実現される。
図4にコンピュータのハードウェア構成の一例を模式的に示す。コンピュータは、プログラムの演算処理を実行するCPUなどのと、情報を記憶するRAMやハードディスクなどの記憶装置71と、情報を表示するディスプレイなどの表示装置72と、情報の入力が可能なキーボードやマウスなどの入力装置73と、演算装置70の処理結果や記憶装置71に記憶する情報をインターネットやLANなどのネットワークを介して送受信する通信装置74とを有している。
【0036】
コンピュータがタッチパネルディスプレイを備えている場合には、表示装置72と入力装置73とが一体的に構成されていてもよい。タッチパネルディスプレイは、たとえばタブレット型コンピュータやスマートフォンなどの可搬型通信端末などで利用されることが多いが、それに限定するものではない。
【0037】
タッチパネルディスプレイは、そのディスプレイ上で、直接、所定の入力デバイス(タッチパネル用のペンなど)や指などによって入力を行える点で、表示装置72と入力装置73の機能が一体化した装置である。
【0038】
本発明における各手段は、その機能が論理的に区別されているのみであって、物理上あるいは事実上は同一の領域を為していても良い。本発明の各手段における処理は、その処理順序を適宜変更することもできる。また、処理の一部を省略してもよい。
【0039】
管理端末2は、分類処理部20と仮識別情報処理部21とモデル生成処理部22と標本情報受付処理部23と認識処理部24と出力処理部25とを有する。
【0040】
分類処理部20は、たとえば陳列棚を撮影した画像情報などに写っている対象物の画像情報(対象物画像情報)から、クラスタリング処理などによって対象物画像情報を分類する。対象物画像情報としては、対象物が陳列棚に陳列されている商品の場合には、その商品の画像情報であればよく、たとえば陳列棚を写した画像情報から、対象物となる、陳列してある商品を含む領域を切り出した画像情報であればよい。このときに矩形で切り出していてもよいし、商品の外形に応じた任意の形状で切り出した画像情報であってもよい。
【0041】
対象物画像情報に写っている対象物の識別情報(対象物識別情報)、たとえば対象物が商品であればその商品名やJANコードなどのコードは判明していなくてもよい。
【0042】
分類処理部20が、複数の対象物画像情報を公知の手法でクラスタリング処理を実行し、画像情報を複数のグループに分類をする。
【0043】
なお、分類処理部20はクラスタリング処理を用いて対象物画像情報を分類する場合を説明しているが、クラスタリング処理以外の手法によって対象物画像情報を分類してもよい。
【0044】
仮識別情報処理部21は、画像分類処理部20で分類した各グループに仮の識別情報(仮識別情報)を対応づける。仮識別情報は、自動的に生成した仮識別情報を対応づけてもよいし、入力を受け付けた仮識別情報を所定の操作で対応づけてもよい。そして、各グループに分類された対象物画像情報に対応づけた仮識別情報を、ラベルとして対応づけてデータセットとし、学習用データとする。
【0045】
モデル生成処理部22は、学習用データを用いて公知の手法により機械学習を行い、学習モデルを生成する。すなわち、対象物画像情報には分類されたグループごとに仮識別情報が対応づけられているので、対象物画像情報とそのラベルを仮識別情報としたデータセットを用いた学習用データを用いて、学習モデルを生成する。
【0046】
標本情報受付処理部23は、モデル生成処理部22に入力させる画像情報の入力を受け付ける。ここで入力を受け付ける画像情報は、対象物を識別する対象物識別情報が判明している対象物画像情報である。たとえば、陳列棚に陳列される可能性のある商品の画像情報であり、それに対応する商品の商品名、JANコードなどのコードなどの商品識別情報(対象物識別情報)とが判明している画像情報である。ここで入力する画像情報は、標本情報とよぶこととする。
【0047】
認識処理部24は、標本情報受付処理部23で入力を受け付けた画像情報(標本情報)を、モデル生成処理部22で生成した学習モデルに入力し、仮識別情報を出力する。この場合、中間層が多数の層からなるニューラルネットワークの各層のニューロン間の重み付け係数が最適化された学習モデルに対して、標本情報を入力すると、出力値として仮識別情報が出力される。複数の出力値がその確度とともに出力される場合には、もっとも確度が高い出力値を採用する。
【0048】
出力処理部25は、認識処理部24で出力した出力値となる仮識別情報と、その入力に用いた標本情報の対象物識別情報とを紐付ける。そして、出力処理部25は、認識処理部24で出力した仮識別情報に紐付けた対象物識別情報を、認識処理部24の認識結果として出力をする。
【0049】
なお、出力処理部25は、認識処理部24が出力する仮識別情報に紐付けた対象物識別情報を出力するのではなく、画像分類処理部20で出力したグループに対応づけた仮識別情報を対象物識別情報に代えて、再度、モデル生成処理部22で機械学習の学習処理を実行させてもよい。
【0050】
また、認識処理部24が出力した仮識別情報の確度が所定の閾値以下の場合には、出力処理部25の処理を実行しなくてもよい。
【0051】
以上のような処理を実行することで、機械学習で用いる学習モデルを効率よく生成することができる。
【実施例0052】
つぎに本発明の情報処理システム1の処理の一例を
図5のフローチャートを説明する。なお、以下の説明では、陳列棚を撮影した画像情報から陳列している商品を同定する場合を説明する。この場合、対象物としては陳列棚に陳列する商品、対象物識別情報としては商品識別情報となる。
【0053】
まず店舗などで商品を陳列している陳列棚を撮影した画像情報に対して、商品を正対した位置となるように補正処理を行う。この場合の補正処理としては各種の公知の方法を用いることができ、たとえば台形補正処理などを用いることができる。なお、陳列棚を撮影した画像情報が正対した位置から撮影した画像情報であれば補正処理は行わなくてもよい。この際に、陳列棚全体を写した画像情報であってもよいし、陳列棚の一部、たとえば一段または二段以上の棚段の領域を写した画像情報であってもよい。
図6に正対した位置に補正した陳列棚の棚段領域の画像情報の一例を示す。
【0054】
そして補正をした画像情報または陳列棚を撮影した画像情報(処理対象とする画像情報)から、公知の手法により、陳列している商品の領域を切り出し、対象物画像情報として抽出をする。たとえば、補正をした画像情報または陳列棚を撮影した画像情報から、商品と商品との間に生じる細く狭い陰影を特定する、画像の繰り返しパターンを特定する、パッケージの上辺の段差を特定する、商品幅が同一であるなどの制約に基づいて区切り位置を特定するなどによって、商品の領域を特定する。また別の方法としては、深層学習(ディープラーニング)などの機械学習を用いて、商品の領域を特定してもよい。この場合、中間層が多数の層からなるニューラルネットワークの各層のニューロン間の重み付け係数が最適化された学習モデルに対して、処理対象とする領域、たとえば陳列棚または棚段領域の画像情報を入力し、その出力値に基づいて、商品の領域を特定してもよい。また学習モデルとしては、さまざまな処理対象とする領域、たとえば陳列棚や棚段領域の画像情報に商品の領域を正解データとして与えたものを用いることができる。
【0055】
図6の陳列棚の棚段領域の画像情報から、対象物画像情報を抽出した画像情報の一例を
図7に示す。この時点では、陳列棚を写した画像情報から対象物画像情報を抽出しただけなので、対象物画像情報に写っている対象物である商品の商品識別情報は判明していなくてもよい。
【0056】
そして、画像分類処理部20は、対象物画像情報を用いて、公知のクラスタリング処理などを実行することで、類似する画像情報同士をグループ化し、複数のグループに分類を行う(S100)。この状態を模式的に示すのが
図8である。
【0057】
仮識別情報処理部21は、分類処理部20で分類したグループごとに、仮識別情報を対応づける(S110)。たとえば「a123」、「b456」、「c789」、「d012」など、それぞれのグループごとに任意の仮識別情報を対応づける。この状態を模式的に示すのが
図9である。これによって、それぞれのグループの対象物画像情報について、仮識別情報をラベルとして対応づける。そしてこれらの対象物画像情報と仮識別情報のラベルとを用いたデータセットを学習用データとする。
【0058】
分類処理部20で分類したグループごとに仮識別情報を対応づけると、モデル生成処理部22は、学習用データとして、公知の手法により機械学習を行い(S120)、学習モデルを生成する(S130)。
【0059】
つぎに、標本情報受付処理部23は、対象物識別情報が判明している画像情報である標本情報の入力を受け付け、入力を受け付けた標本情報をS130で生成した学習モデルに入力する(S140)。認識処理部24は、標本情報の入力を受け付け、学習モデルを用いた機械学習による出力結果を出力する。この出力結果としては、仮識別情報が出力される(S150)。これを模式的に示すのが
図10である。
【0060】
標本情報は、あらかじめ商品識別情報などの対象物識別情報が判明している画像情報である。そのため、認識処理部24で出力した仮識別情報は、学習モデルに入力した標本情報の対象識別情報に対応すると考えられる。そのため、出力処理部25は、出力した仮識別情報と、入力した標本情報の対象物識別情報とを紐付けする(S160)。たとえば
図11に示すように、
【0061】
この紐付けによって、仮識別情報と対象物識別情報との対応付けができるので、その対応付けを記憶しておくことで、認識処理部24が出力した仮識別情報を、対応する対象物識別情報で置き換えて出力すれば、同定処理を行う画像情報を学習モデルに入力した場合、学習モデルの出力値として、対象物識別情報の出力を行うことができる。
すなわち、画像分類処理部20でグループごとに対象物画像情報を分類すると、そのグループにおける画像情報の特徴を示す特徴量などの指標値を算出する。そして、そのグループにおいて、対象物画像情報ごとの指標値の中央値や平均値などの基準値からの情報距離(基準値から画像情報ごとの指標値までの乖離を所定の算出式で算出した値)を算出し、一定値または一定の比率以上、情報距離が乖離している対象物画像情報は、当該グループから除外してもよい。
またクレンジング処理として情報距離を用いるほか、画像情報の類似度を用いてもよい。この場合、グループにおける画像情報同士の類似度を数値化し、一定以上の類似度が算出された画像情報の枚数が所定の値以上であれば、対象物画像情報として残し、所定の値未満であれば対象物画像情報から除外する。
たとえばあるグループに5枚の対象画像情報(画像情報1から画像情報5)があった場合、その5枚の画像情報について、それぞれ他の画像情報との類似度を算出する。すなわち、画像情報1は画像情報2から画像情報5、画像情報2は画像情報3から画像情報5、画像情報3は画像情報4から画像情報5、画像情報4は画像情報5との類似度を算出する。これによって、各画像情報同士の類似度が算出できる。
画像情報1について、画像情報2との類似度が0.9、画像情報3との類似度が0.95、画像情報4との類似度が0.3、画像情報5との類似度が0.8であり、画像情報2について画像情報3との類似度が0.8、画像情報4との類似度が0.2、画像情報5との類似度が0.6、画像情報3について画像情報4との類似度が0.4、画像情報5との類似度が0.9、画像情報4について画像情報5との類似度が0.5であったとする。
ここで、基準とする画像情報の類似度を0.75、基準度を下回る画像情報の枚数を3枚としたときに、画像情報1は基準とする類似度を下回るのは画像情報4の1枚、画像情報2は基準とする類似度を下回るのは画像情報4と画像情報5の2枚、画像情報3は基準とする類似度を下回るのは画像情報4の1枚、画像情報4は基準とする類似度を下回るのは画像情報1、画像情報2、画像情報3、画像情報5の4枚、画像情報5は基準とする類似度を下回るのは、画像情報2と画像情報4の2枚となる。
したがって、クレンジング処理部26は、基準とする類似度を下回る画像情報が3枚以上であった画像情報4を当該グループから除外し、当該グループの対象物画像情報としては、画像情報1、画像情報2、画像情報3、画像情報5の4枚として、仮識別情報処理部21の処理を実行させる。
本実施例のようにグループ化した対象物画像情報のうち、乖離した画像情報を除外することで、グループ化した対象物画像情報を絞ることができ、精度向上につなげることができる。