IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社マーケットヴィジョンの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-22
(45)【発行日】2024-12-02
(54)【発明の名称】情報処理システム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20241125BHJP
   G06V 10/82 20220101ALI20241125BHJP
   G06Q 50/12 20120101ALI20241125BHJP
【FI】
G06T7/00 350C
G06V10/82
G06Q50/12
【請求項の数】 18
(21)【出願番号】P 2023150004
(22)【出願日】2023-09-15
【審査請求日】2023-09-15
(73)【特許権者】
【識別番号】516278171
【氏名又は名称】株式会社マーケットヴィジョン
(74)【代理人】
【識別番号】100205084
【弁理士】
【氏名又は名称】吉浦 洋一
(72)【発明者】
【氏名】谷井 成吉
【審査官】橘 高志
(56)【参考文献】
【文献】特開2020-095537(JP,A)
【文献】特開2021-163078(JP,A)
【文献】特表2020-522055(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06V 10/82
G06Q 50/12
(57)【特許請求の範囲】
【請求項1】
機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、
画像情報から所定の対象物を検出する検出処理部と、
前記検出した対象物を用いて機械学習用の学習モデルを生成するモデル処理部と、を有しており、
前記検出処理部は、
前記画像情報に写っている物体を検出する物体検出処理部と、
前記検出した物体の種別を判別する個別判別処理部と、を有し、
前記個別判別処理部は、
前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、
ことを特徴とする情報処理システム。
【請求項2】
前記モデル処理部は、
前記検出した対象物の画像情報を分類する分類処理部と、
分類したグループと仮識別情報を対応づける仮識別情報処理部と、
前記分類したグループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部と、
を有することを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記モデル処理部は、
入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部と、
前記出力した仮識別情報と前記入力した標本情報の対象物識別情報とを対応づける出力処理部と、
を有することを特徴とする請求項2に記載の情報処理システム。
【請求項4】
前記モデル処理部は、
同定処理の対象とする画像情報を前記学習モデルに入力することで、前記学習モデルが出力する仮識別情報に対応する対象物識別情報を出力値として出力させる、
ことを特徴とする請求項3に記載の情報処理システム。
【請求項5】
前記モデル処理部は、
前記分類したグループに含まれる対象物の画像情報のうち、誤りが含まれている可能性がある対象物画像情報を除外するクレンジング処理を実行するクレンジング処理部、
を有することを特徴とする請求項2に記載の情報処理システム。
【請求項6】
前記クレンジング処理部は、
前記分類したグループに含まれる対象物の画像情報の指標値を用いて算出した基準値からの情報距離を用いて、除外する対象物の画像情報を判定する、
ことを特徴とする請求項5に記載の情報処理システム。
【請求項7】
前記クレンジング処理部は、
前記分類したグループに含まれる対象物の画像情報の指標値を用いて基準値を算出し、
前記基準値と、前記対象物の画像情報の指標値とを用いて情報距離を算出し、
前記情報距離が所定の閾値以上または所定の比率以上の乖離がある場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、
ことを特徴とする請求項6に記載の情報処理システム。
【請求項8】
前記クレンジング処理部は、
前記分類したグループに含まれる対象物の画像情報の類似度を用いて、除外する対象物の画像情報を判定する、
ことを特徴とする請求項5に記載の情報処理システム。
【請求項9】
前記クレンジング処理部は、
前記分類したグループに含まれる対象物の画像情報と、そのグループに含まれる他の対象物の画像情報との類似度を算出し、
その類似度を用いたあらかじめ定められた条件を充足した場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、
ことを特徴とする請求項8に記載の情報処理システム。
【請求項10】
前記個別判別処理部は、
前記検出した物体の種別が商品類、商品タグ類、棚部材以外の種別である場合には、その種別がPOPまたはPOPの候補であると判別をする、
ことを特徴とする請求項1に記載の情報処理システム。
【請求項11】
前記情報処理システムは、
前記画像情報の領域を検出する領域検出処理部、を有しており、
前記個別判別処理部は、
前記検出した領域と前記検出した物体の種別とを用いて、前記検出した物体の種別を判別する、
ことを特徴とする請求項1に記載の情報処理システム。
【請求項12】
画像情報に写っている物体を検出する物体検出処理部と、
検出した物体の種別を判別する個別判別処理部と、を有しており、
前記個別判別処理部は、
前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物の候補であると判別をする、
ことを特徴とする情報処理システム。
【請求項13】
前記個別判別処理部は、
前記検出した物体の種別が対象物の候補であると判別をした場合には、その物体が対象物であるかの入力を受け付け、
対象物であるとの入力を受け付けた場合には、その対象物の候補を対象物の種別であるとする、
ことを特徴とする請求項1、請求項10または請求項12に記載の情報処理システム。
【請求項14】
機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、
画像情報に写っている物体を検出する物体検出処理部と、
前記検出した物体の種別または種別の候補を判別する個別判別処理部と、
前記物体の種別のうち、前記学習モデルを生成する対象物の種別の画像情報についてグループごとに分類する分類処理部と、
前記分類したグループと仮識別情報を対応づける仮識別情報処理部と、
前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して前記学習モデルを生成するモデル生成処理部と、を有しており、
前記個別判別処理部は、
前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、
ことを特徴とする情報処理システム。
【請求項15】
前記情報処理システムは、
入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部と、
前記出力した仮識別情報と前記入力した標本情報の対象物識別情報とを対応づける出力処理部と、
を有することを特徴とする請求項14に記載の情報処理システム。
【請求項16】
コンピュータを、
画像情報から所定の対象物を検出する検出処理部、
前記検出した対象物を用いて機械学習用の学習モデルを生成するモデル処理部、として機能させる情報処理プログラムであって、
前記検出処理部は、
前記画像情報に写っている物体を検出する物体検出処理部と、
前記検出した物体の種別を判別する個別判別処理部と、を有し、
前記個別判別処理部は、
前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、
ことを特徴とする情報処理プログラム。
【請求項17】
コンピュータを、
画像情報に写っている物体を検出する物体検出処理部、
検出した物体の種別を判別する個別判別処理部、として機能させる情報処理プログラムであって、
前記個別判別処理部は、
前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物の候補であると判別をする、
ことを特徴とする情報処理プログラム。
【請求項18】
コンピュータを、
画像情報に写っている物体を検出する物体検出処理部、
前記検出した物体の種別または種別の候補を判別する個別判別処理部、
前記物体の種別のうち、機械学習用の学習モデルを生成する対象物の種別の画像情報についてグループごとに分類する分類処理部、
前記分類したグループと仮識別情報を対応づける仮識別情報処理部、
前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して前記学習モデルを生成するモデル生成処理部、として機能させる情報処理プログラムであって、
前記個別判別処理部は、
前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、
ことを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習における学習モデル(ネットワーク)の生成で用いる情報処理システムに関する。
【背景技術】
【0002】
小売店などの店舗では、商品を陳列する陳列棚に、商品の販売促進用のPOPを設置する場合がある。POPは、陳列棚に陳列する商品、商品タグ(プライスカード)、棚段、棚段の上方あるいは側方などに貼付、取付、設置等される。
【0003】
POPは商品を製造等するメーカーがPOPを作成して小売店に設置を依頼するメーカーPOPと、小売店が自ら作成して設置をする小売りPOP(流通POP)がある。メーカーPOPは、メーカーが小売店に設置を依頼しているので、その依頼どおりに設置されているか、メーカーとしては確認をしたい要望がある。
【0004】
このような場合、従来は、メーカーの担当者が各店舗を実際に回ることで確認をしていたが、負担が大きいものであった。そこで、自動的な処理を行うことが考えられる。
【0005】
自動的な処理としては、たとえば、コンピュータを用いた画像解析処理の方法としての機械学習がある。機械学習では、あらかじめ学習用のデータセット(学習用データ)を作成し、それをコンピュータに読み込ませて所定の学習処理を実行させる必要がある。
【0006】
しかし学習用データをあらかじめ準備すること自体が作業負担が大きい。そこで、下記特許文献1、特許文献2に示すようなシステムが開示されている。
【0007】
特許文献1の発明では、商品画像を撮影し、その商品に付されているコードを読み取ることで、商品画像とそのラベル付けを行うことで、学習用データを生成している。
【0008】
また、特許文献2の発明では、あらかじめ分類に関する情報がラベル付けされた物体を含む画像データが格納された画像データベースから、当該画像データに含まれる物体の分類を選択し、その物体を画像データから抽出してテンプレート画像を生成することで、テンプレート画像とラベル付けとをした学習用データを生成している。
【先行技術文献】
【特許文献】
【0009】
【文献】特開2020-095537号公報
【文献】特開2022-076296号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
特許文献1の発明の場合、商品を準備して撮影を行うとともに、その商品に付されたコードをコードリーダで読み取ることで学習用データを生成するものであり、作業者の作業負担が大きい。学習用データとして読み取るべき商品が多くなると、膨大な作業量となる。また、商品にはコードが付されているが、POPにはコードが付されていないので、POPの学習用データを生成する場合には、特許文献1の発明を用いることはできない。
【0011】
特許文献2の発明の場合、あらかじめ分類に関する情報がラベル付けされた物体を含む画像データが格納された画像データベースが準備されていなければその処理を行うことができない。POPは多種多様であって、POPごとにラベル付けをした画像データを画像データベースとして準備しておくことは現実的ではない。
【課題を解決するための手段】
【0012】
本発明者は上記課題に鑑み、機械学習で用いる学習モデルを効率よく生成する情報処理システムを発明した。とくに、本発明の情報処理システムを、店舗の陳列棚に設置されるPOPの学習モデルの生成で用いると効果が高い。
【0013】
第1の発明は、機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、画像情報から所定の対象物を検出する検出処理部と、前記検出した対象物を用いて機械学習用の学習モデルを生成するモデル処理部と、を有しており、前記検出処理部は、前記画像情報に写っている物体を検出する物体検出処理部と、前記検出した物体の種別を判別する個別判別処理部と、を有し、前記個別判別処理部は、前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、情報処理システムである。
【0014】
本発明を用いることで、機械学習で用いる学習モデルを効率よく生成することができる。とくに、学習用データとして用いる画像情報とそのラベル(種別)とを画像情報から検出してデータセットとして用いることができるので、その作業負担などを減らすことができる。
本発明のように構成することで、画像情報に写っている物体の種別が対象物または対象物の候補であると判別をすることができる。
【0015】
上述の発明において、前記モデル処理部は、前記検出した対象物の画像情報を分類する分類処理部と、分類したグループと仮識別情報を対応づける仮識別情報処理部と、前記分類したグループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部と、を有する情報処理システムのように構成することができる。
【0016】
上述の発明において、前記モデル処理部は、入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部と、前記出力した仮識別情報と前記入力した標本情報の対象物識別情報とを対応づける出力処理部と、を有する情報処理システムのように構成することができる。
【0017】
機械学習用の学習モデルは、これらの発明の処理を実行して生成するとよい。
【0018】
上述の発明において、前記モデル処理部は、同定処理の対象とする画像情報を前記学習モデルに入力することで、前記学習モデルが出力する仮識別情報に対応する対象物識別情報を出力値として出力させる、情報処理システムのように構成することができる。
【0019】
本発明のように構成することで、学習モデルに同定対象の画像情報を入力すると、対象物識別情報を出力することができる。
【0020】
上述の発明において、前記モデル処理部は、前記分類したグループに含まれる対象物の画像情報のうち、誤りが含まれている可能性がある対象物画像情報を除外するクレンジング処理を実行するクレンジング処理部、を有する情報処理システムのように構成することができる。
【0021】
本発明のようにクレンジング処理を実行することで、グループに含まれる対象物画像情報のうち、誤りが含まれている可能性がある対象物画像情報を除外することができ、分類の精度を向上させることができる。
【0022】
上述の発明において、前記クレンジング処理部は、前記分類したグループに含まれる対象物の画像情報の指標値を用いて算出した基準値からの情報距離を用いて、除外する対象物の画像情報を判定する、情報処理システムのように構成することができる。
【0023】
上述の発明において、前記クレンジング処理部は、前記分類したグループに含まれる対象物の画像情報の指標値を用いて基準値を算出し、前記基準値と、前記対象物の画像情報の指標値とを用いて情報距離を算出し、前記情報距離が所定の閾値以上または所定の比率以上の乖離がある場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、情報処理システムのように構成することができる。
【0024】
上述の発明において、前記クレンジング処理部は、前記分類したグループに含まれる対象物の画像情報の類似度を用いて、除外する対象物の画像情報を判定する、情報処理システムのように構成することができる。
【0025】
上述の発明において、前記クレンジング処理部は、前記分類したグループに含まれる対象物の画像情報と、そのグループに含まれる他の対象物の画像情報との類似度を算出し、その類似度を用いたあらかじめ定められた条件を充足した場合には、その対象物の画像情報を除外する対象物の画像情報として判定する、情報処理システムのように構成することができる。
【0026】
クレンジング処理としてはこれらの発明のように実行することができる。
【0030】
上述の発明において、前記個別判別処理部は、前記検出した物体の種別が商品類、商品タグ類、棚部材以外の種別である場合には、その種別がPOPまたはPOPの候補であると判別をする、情報処理システムのように構成することができる。
【0031】
一般的な陳列棚には、陳列される商品などの商品類、商品タグなどの商品タグ類、棚部材、POPが設けられることに本願発明者は着目した。すなわち、POP自体の形状、デザインは多種多様であるのでそれ自体の判別は容易ではないが、商品類、商品タグ類、棚部材については、判別をしやすい。そこで、画像データから検出した物体が商品類、商品タグ類、棚部材の各種別ではない場合にはPOPと判別することで、画像データにあるPOPを判別することができる。
【0032】
上述の発明において、前記情報処理システムは、前記画像情報の領域を検出する領域検出処理部、を有しており、前記個別判別処理部は、前記検出した領域と前記検出した物体の種別とを用いて、前記検出した物体の種別を判別する、情報処理システムのように構成することができる。
【0033】
物体の種別は、物体が所在する領域によっても判別することができる。そこで、本発明のように構成することで、物体の種別を判別してもよい。
【0034】
12の発明は、画像情報に写っている物体を検出する物体検出処理部と、検出した物体の種別を判別する個別判別処理部と、を有しており、前記個別判別処理部は、前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物の候補であると判別をする、情報処理システムである。
【0035】
これらの発明のように構成することで、画像情報に写っている物体の種別が対象物の候補であると判別をすることができる。
【0036】
上述の発明において、前記個別判別処理部は、前記検出した物体の種別が対象物の候補であると判別をした場合には、その物体が対象物であるかの入力を受け付け、対象物であるとの入力を受け付けた場合には、その対象物の候補を対象物の種別であるとする、情報処理システムのように構成することができる。
【0037】
本発明のように構成することで、対象物の候補であると判別した物体について、対象物であるかを判別することができる。
【0038】
14の発明は、機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、画像情報に写っている物体を検出する物体検出処理部と、前記検出した物体の種別または種別の候補を判別する個別判別処理部と、前記物体の種別のうち、前記学習モデルを生成する対象物の種別の画像情報についてグループごとに分類する分類処理部と、前記分類したグループと仮識別情報を対応づける仮識別情報処理部と、前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して前記学習モデルを生成するモデル生成処理部と、を有しており、前記個別判別処理部は、前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、情報処理システムである。
【0039】
上述の発明において、前記情報処理システムは、入力を受け付けた標本情報を前記学習モデルに入力することで仮識別情報を出力させる認識処理部と、前記出力した仮識別情報と前記入力した標本情報の対象物識別情報とを対応づける出力処理部と、を有する情報処理システムのように構成することができる。
【0040】
これらの発明を用いることで、機械学習で用いる学習モデルを効率よく生成することができる。とくに、学習用データとして用いる画像情報とそのラベル(種別)とを画像情報から検出してデータセットとして用いることができるので、その作業負担などを減らすことができる。
【0041】
第1の発明は、本発明の情報処理プログラムをコンピュータに読み込ませて実行することで実現することができる。すなわち、コンピュータを、画像情報から所定の対象物を検出する検出処理部、前記検出した対象物を用いて機械学習用の学習モデルを生成するモデル処理部、として機能させる情報処理プログラムであって、前記検出処理部は、前記画像情報に写っている物体を検出する物体検出処理部と、前記検出した物体の種別を判別する個別判別処理部と、を有し、前記個別判別処理部は、前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、情報処理プログラムである。
【0042】
12の発明は、本発明の情報処理プログラムをコンピュータに読み込ませて実行することで実現することができる。すなわち、コンピュータを、画像情報に写っている物体を検出する物体検出処理部、検出した物体の種別を判別する個別判別処理部、として機能させる情報処理プログラムであって、前記個別判別処理部は、前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物の候補であると判別をする、情報処理プログラムである。
【0043】
14の発明は、本発明の情報処理プログラムをコンピュータに読み込ませて実行することで実現することができる。すなわち、コンピュータを、画像情報に写っている物体を検出する物体検出処理部、前記検出した物体の種別または種別の候補を判別する個別判別処理部、前記物体の種別のうち、機械学習用の学習モデルを生成する対象物の種別の画像情報についてグループごとに分類する分類処理部、前記分類したグループと仮識別情報を対応づける仮識別情報処理部、前記グループに含まれる対象物の画像情報と前記仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して前記学習モデルを生成するモデル生成処理部、として機能させる情報処理プログラムであって、前記個別判別処理部は、前記検出した物体の種別があらかじめ定めた種別以外の種別である場合には、前記検出した物体の種別が対象物または対象物の候補であると判別をする、情報処理プログラムである。
【発明の効果】
【0044】
本発明の情報処理システムを用いることで、機械学習で用いる学習モデルを効率よく生成することができる。
【図面の簡単な説明】
【0045】
図1】本発明の情報処理システムの処理機能の一例を模式的に示すブロック図である。
図2】本発明の情報処理システムの検出処理部の処理機能の一例を模式的に示すブロック図である。
図3】本発明の情報処理システムのモデル処理部の処理機能の一例を模式的に示すブロック図である。
図4】本発明の情報処理システムで用いるコンピュータのハードウェア構成の一例を模式的に示すブロック図である。
図5】本発明の情報処理システムの検出処理部の概念図の一例を示す図である。
図6】本発明の情報処理システムの処理の概念図の一例を示す図である。
図7】本発明の情報処理システムの処理の概念図の一例を示す図である。
図8】撮影画像情報の一例を示す図である。
図9】本発明の情報処理システムにおける全体の処理プロセスの一例を示すフローチャートである。
図10】本発明の情報処理システムにおける検出処理部の処理プロセスの一例を示すフローチャートである。
図11】本発明の情報処理システムにおけるモデル処理部の処理プロセスの一例を示すフローチャートである。
図12】画像情報から物体検出処理を実行した結果の一例を示す図である。
図13】画像情報から検出した物体の領域に対して所定条件を充足するかを判別して対象物の領域を判別する処理の一例を示す図である。
図14図12の物体検出の結果に対して、所定条件を充足した領域を対象物の領域として判別した後の各領域の一例を示す図である。
図15】画像情報から対象物画像情報を抽出した状態の一例を示す図である。
図16】分類処理部において対象物画像情報を分類した状態の一例を示す図である。
図17】仮識別情報処理部において仮識別情報を対応づけた状態の一例を示す図である。
図18】学習用データセットを用いて学習用モデルを生成する状態の一例を示す図である。
図19】学習モデルに標本情報を入力して、仮識別情報を出力値として出力した状態の一例を示す図である。
図20】仮識別情報と対象物識別情報とを紐付ける状態の一例を示す図である。
図21】実施例2における検出処理部の構成の一例を模式的に示すブロック図である。
図22】実施例2における検出処理部の処理プロセスの一例を示すフローチャートである。
図23】実施例2における処理の概要の一例を示す図である。
図24】実施例2における個別判別処理の一例を示す図である。
図25】画像情報に対して、商品陳列領域と商品タグ領域と棚上部領域の指定の入力を受け付けた状態を模式的に示す図である。
図26】実施例3における検出処理部の処理プロセスの一例を示すフローチャートである。
図27】実施例4におけるモデル処理部の構成の一例を模式的に示すブロック図である。
【発明を実施するための形態】
【0046】
本発明の情報処理システム1の処理機能の一例をブロック図で図1から図3に示す。図1は情報処理システム1の全体の処理機能の一例をブロック図で示したものであり、図2は検出処理部20の処理機能の一例をブロック図で示したものであり、図3はモデル処理部21の処理機能の一例をブロック図で示したものである。
【0047】
情報処理システム1では、所定の画像情報に写っている対象物を検出し、検出した各種の対象物の画像情報を用いて、機械学習で用いる学習モデルを生成するシステムである。
【0048】
たとえば対象物が陳列棚に陳列されている商品、商品タグ(プライスカード)、棚段、棚段の上方あるいは側方などに貼付、取付、設置等されるPOPである場合、POPを含む陳列棚の画像情報から、その画像情報に写っているPOPを検出し、そのPOPを用いて、機械学習で用いる学習モデルを生成するシステムである。なお、対象物としては、陳列棚に陳列されている商品、商品タグ(プライスカード)、棚段、棚段の上方あるいは側方などに貼付、取付、設置等されるPOPの場合を用いて説明するが、それに限られるものではない。
【0049】
情報処理システム1における管理端末2、画像情報入力端末3は、コンピュータを用いて実現される。図4にコンピュータのハードウェア構成の一例を模式的に示す。コンピュータは、プログラムの演算処理を実行するCPUなどの演算装置70と、情報を記憶するRAMやハードディスクなどの記憶装置71と、情報を表示するディスプレイなどの表示装置72と、情報の入力が可能なキーボードやマウスなどの入力装置73と、演算装置70の処理結果や記憶装置71に記憶する情報をインターネットやLANなどのネットワークを介して送受信する通信装置74とを有している。
【0050】
コンピュータがタッチパネルディスプレイを備えている場合には、表示装置72と入力装置73とが一体的に構成されていてもよい。タッチパネルディスプレイは、たとえばタブレット型コンピュータやスマートフォンなどの可搬型通信端末などで利用されることが多いが、それに限定するものではない。
【0051】
タッチパネルディスプレイは、そのディスプレイ上で、直接、所定の入力デバイス(タッチパネル用のペンなど)や指などによって入力を行える点で、表示装置72と入力装置73の機能が一体化した装置である。
【0052】
画像情報入力端末3は、上記の各装置のほか、カメラなどの撮影装置を備えていてもよい。画像情報入力端末3として、携帯電話、スマートフォン、タブレット型コンピュータなどの可搬型通信端末を用いることもできる。画像情報入力端末3は、所定の対象物が写った画像情報(撮影画像情報)を撮影し、管理端末2に入力する。たとえば、店舗の陳列棚を撮影し、その画像情報を管理端末2に入力する。この場合、陳列棚には商品が陳列されており、陳列棚または商品にはPOPが取り付けられている。そのため、撮影画像情報には、陳列棚に陳列する商品などの陳列商品、商品タグ、棚部材、POPなどが写っている。好ましくは、人などの不要なものが写り込んでいないことが好ましい。
【0053】
本発明における各手段は、その機能が論理的に区別されているのみであって、物理上あるいは事実上は同一の領域を為していても良い。本発明の各手段における処理は、その処理順序を適宜変更することもできる。また、処理の一部を省略してもよい。
【0054】
管理端末2は、検出処理部20とモデル処理部21とを有する。
【0055】
検出処理部20は、撮影画像情報から対象物の写っている領域の画像情報(対象物画像情報)を検出する。たとえば陳列棚を撮影した画像情報などから、対象物画像情報としてPOPが写っている領域の画像情報(POP画像情報)を検出する。図5は検出処理部20における処理の概念図の一例である。図5(a)は対象物が写っている撮影画像情報の一例であり、図5(b)は撮影画像情報から対象物を検出した状態の一例である。図5(a)の撮影画像情報は、店舗の陳列棚を撮影した場合を模式的に示した図である。図5(b)は、対象物としてPOPを検出した場合を模式的に示した図である。図5(b)の網掛け部分が検出したPOPの領域の画像情報である。
【0056】
モデル処理部21は、検出処理部20で検出した対象物画像情報について、機械学習で用いる学習モデルを生成する。モデル処理部21における処理の概念図の一例を図6および図7に示す。図6は、検出処理部20で検出した対象物画像情報を用いて学習モデルを生成する処理を模式的に示す図である。図7は、分類した対象物画像情報ごとのグループに対応づけた仮識別情報と、対象物の識別情報(対象物識別情報)とを紐付ける処理を模式的に示す図である。
【0057】
検出処理部20は、画像情報入力受付処理部200と画像情報記憶部201と画像情報正置化処理部202と物体検出処理部203と個別判別処理部204とを有する。
【0058】
画像情報入力受付処理部200は、画像情報入力端末3で撮影した、対象物が写っている撮影画像情報の入力を受け付け、後述する画像情報記憶部201に記憶させる。たとえば、店舗の陳列棚を撮影した画像情報の入力を受け付けて、画像情報記憶部201に記憶させる。画像情報入力端末3からは、撮影画像情報のほか、撮影日時、店舗名などの店舗識別情報、陳列棚を識別する陳列棚識別情報、画像情報を識別する画像情報識別情報などの付随情報をあわせて入力を受け付けてもよい。図8に撮影画像情報として陳列棚を撮影した画像情報の一例を示す。なお、図8では撮影画像情報に一つの陳列棚が写っている場合を示しているが、陳列棚が複数写っていてもよいし、あるいは陳列棚の一部が写っている場合であってもよい。また、本発明においては特にその処理は明記しないが、陳列棚や棚段は横方向に長いこともある。そのため、その処理においては、一定の幅で区切り、区切った範囲で書く処理の処理対象としてもよい。
【0059】
画像情報記憶部201は、画像情報入力端末3から受け付けた撮影画像情報と、撮影日時、店舗識別情報、陳列棚識別情報、画像情報識別情報などの付随情報を対応づけて記憶する。撮影画像情報とは、本発明の処理対象となる画像情報であればよい。一つの陳列棚を複数枚で撮影した場合に、それが一つの画像情報として合成された画像情報も含まれる。後述する画像情報正置化処理部202における処理を実行した正置画像情報、歪み補正処理が実行された後の画像情報も撮影画像情報に含まれる。
【0060】
画像情報正置化処理部202は、画像情報記憶部201に記憶した撮影画像情報に対して、被写体を正対した状態に補正する補正処理(正置化処理)を実行し、撮影画像情報を正置化した画像情報(正置画像情報)を生成する。正置化処理としては、撮影装置のレンズの光軸を撮影対象である平面の垂線方向に沿って、十分に遠方から撮影した場合と同じになるように画像情報を変形させる処理であり、たとえば台形補正処理がある。台形補正処理は、撮影画像情報に写っている物、たとえば陳列棚の棚段が水平に、そこに陳列されている商品やその商品に対する商品タグ(たとえば値札)が垂直になるように行う補正処理である。
【0061】
画像情報正置化処理部202は、撮影画像情報において4頂点の指定の入力を受け付け、その各頂点を用いて台形補正処理を実行する。指定を受け付ける4頂点として、撮影画像情報における任意の4点、たとえば被写体が陳列棚であれば、陳列棚の棚段の4頂点であってもよいし、陳列棚の棚位置の4頂点であってもよい。また、2段、3段の棚段のまとまりの4頂点であってもよい。4頂点としては任意の4点を指定できる。画像情報正置化処理部202は、各種の公知の処理方法を用いることができる。
【0062】
物体検出処理部203は、画像情報記憶部201に記憶する撮影画像情報(正置化した撮影画像情報も含む。以下、本明細書において同様)に対して、その画像情報に写っている物体を検出する処理を実行する。物体検出処理としては、いわゆる深層学習(ディープラーニング)を用いて検出することが好ましい。この場合、中間層が多数の層からなるニューラルネットワークの各層のニューロン間の重み付け係数が最適化された学習モデルに対して、上記撮影画像情報を入力し、入力した撮影画像情報に写っている物体の領域(またはその画像情報)と、その物体の種別(クラス)を出力値として出力する。
【0063】
学習モデルとしては、撮影画像情報に写る可能性のある所定の物体などをアノテーションデータとし、そのアノテーションデータを用いて所定の学習処理を実行することで上述の学習モデルを学習する。たとえば、陳列棚を写した撮影画像情報に写る可能性のある物体、一例としては商品、商品タグ(値札)、棚部材などをアノテーションデータとし、そのアノテーションデータを用いて所定の学習処理を実行することで上述の学習モデルを学習する。たとえば商品の画像情報と商品であることまたは商品名若しくは商品コード(JANコードなど)とを対応づけたデータをアノテーションデータとして、学習モデルのための学習処理を実行させる。商品の画像情報がアノテーションデータにおける画像情報であり、商品であること、または商品であることと商品名若しくは商品コードなどの商品識別情報が「商品類」であることを示すクラスとなる。同様に商品タグの画像情報がアノテーションデータにおける画像情報であり、商品タグであること、または商品タグであることとその商品名若しくは商品識別情報が「商品タグ類」であることを示すクラスとなる。さらに棚部材の画像情報がアノテーションデータにおける画像情報であり、棚部材であることまたは棚部材の部品名などが「棚部材」であることを示すクラスとなる。なお、物体検出処理部203でアノテーションデータとして用いる物体(オブジェクト)の種別(クラス)としては、一般的に陳列棚に陳列されることがある物、たとえば商品などの商品類、商品タグなどの商品タグ類、棚部材があるが、これらに限定するものではなく、任意の物体を検出するように学習させてもよい。
【0064】
個別判別処理部204は、物体検出処理部203において、撮影画像情報から検出した物体の種別(クラス)のうち、所定のクラス以外の種別として検出した物体の種別は、所定の対象物または所定の対象物の候補であると判別をする。たとえば、商品類、商品タグ類、棚部材以外の種別として検出した物体の種別は、POPまたはPOPの候補であると判別をする。また、商品類、商品タグ類、棚部材の種別(クラス)として検出した物体について、あらかじめ定めた条件を充足している場合には、その物体の種別(クラス)をPOPまたはPOPの候補として判別をする。
【0065】
たとえば種別を商品類として検出した物体については、その領域に対して商品密着型の広告(POP)がついているかを判別し、POPがあると判別した場合にはその領域の物体の種別をPOPまたはPOPの候補として判別する。この場合、種別を商品類として検出した物体の領域から陳列商品に付けられたPOPまたはPOPの候補を検出する方法と、種別を商品類として検出した物体の領域の画像情報とPOPのない商品の画像情報との比較により、POPまたはPOPの候補を検出する方法がある。
【0066】
前者の方法の場合、まず陳列商品に付けられたPOP部分を含む画像情報をあらかじめ多数収集し、POP部分を含む各画像情報について、POP部分をアノテーションしておく。そして、POPがない状態の通常の陳列商品の画像情報をアノテーションデータとしてあらかじめ学習した学習モデルについて、上記POP部分をアノテーションした画像情報を用いて追加学習させて、新たな学習モデルを生成しておく。この生成した新たな学習モデルに対して、種別を商品類として検出した物体の領域の画像情報を入力し、商品認識処理などの際に、商品識別情報を出力させるほか、当該画像情報における陳列商品にPOPが付されているか否かを追加的に出力させることができる。
【0067】
後者の方法の場合、商品類として検出した物体の領域の画像情報に対して商品認識処理を行った後で、認識した商品のPOPのない標準的な画像情報(たとえば標本情報)と物体の領域の画像情報とを比較し、その類似度を比較する。そしてその類似度が所定の値以上であれば商品類として検出した物体にはPOPがないと判別し、類似度が所定の値未満であれば商品類として検出した物体にはPOPまたはPOPの候補があると判別する。
【0068】
上述の方法において、商品類として検出した物体の領域の画像情報と、商品認識処理で認識した商品のPOPのない標準的な画像情報との比較において、相違している領域の位置によってPOPであるか否かを判別すると、より精度よく判別することができる。たとえば、2つの画像情報で相違している領域が特定の位置、一例として、商品の上部や肩部、尾部付近に局在していると判定した場合にはPOPまたはPOPの候補であると判別するとよい。
【0069】
商品認識処理としては、各種の公知の処理方法を用いることができる。たとえば、当該物体の領域の画像情報に対して深層学習(ディープラーニング)を用いて商品識別情報を同定する処理を実行することができる。この場合、中間層が多数の層からなるニューラルネットワークの各層のニューロン間の重み付け係数が最適化された学習モデルに対して、当該物体の領域の画像情報を入力し、その出力値に基づいて、商品識別情報を同定してもよい。学習モデルとしては、商品が写っているさまざまな画像情報に商品識別情報を正解データとして与えたものを用いることができる。これ以外にも、商品の標本情報(商品を一または複数の方向から写した画像情報またはそれに基づく特徴量などの情報)と、当該物体の領域の画像情報とを比較し、その類似度を用いて商品識別情報を同定することができる。商品認識処理としてはこれらに限られるものでない。
【0070】
また、種別を商品タグ類として検出した物体については、その物体の領域の画像情報が商品タグ類の要件を満たすか否かを判別する。たとえば種別を商品タグ類として検出した物体の領域に対してOCR認識処理を行い、商品タグとして通常含まれている文字、たとえば価格、商品名が含まれていれば商品タグ類として判別し、そうではない場合にはPOPまたはPOPの候補であると判別する。あるいは、OCR認識処理の結果、所定の単語、たとえば「会員割引」、「テスター」、「見本」、「サンプル」など、POPで通常使用される単語が含まれていれば、POPまたはPOPの候補と判別してもよい。また、文字として手書きが含まれている場合にはPOPまたはPOPの候補であると判別をしてもよい。
【0071】
また、種別を棚部材として検出した物体については、その物体の領域の画像情報が棚部材の要件を満たすか否かを判別する。たとえば種別を棚部材として検出した物体の領域に対してOCR認識処理を行い、所定の単語、たとえば会員割引など、POPで通常使用される単語が含まれていればPOPまたはPOPの候補と判別し、そうではない場合には棚部材として判別する。
【0072】
個別判別処理部204が、物体の領域の画像情報の種別(クラス)として所定の対象物の候補と判別している場合には、当該物体の領域の画像情報を管理端末2の表示装置72などに表示し、対象物であるか否かの入力を受け付けて、その入力が対象物であれば当該物体の領域の画像情報の種別(クラス)を対象物としてもよい。たとえば、個別判別処理部204が、物体の領域の画像情報の種別(クラス)としてPOPの候補と判別している場合には、当該物体の領域の画像情報を管理端末2の表示装置72などに表示し、POPであるか否かの入力を受け付けて、その入力がPOPであれば当該物体の領域の画像情報の種別(クラス)をPOPとしてもよい。
【0073】
モデル処理部21は、分類処理部210と仮識別情報処理部211とモデル生成処理部212と標本情報受付処理部213と認識処理部214と出力処理部215とを有する。モデル処理部21の処理の概念図の一例を図7および図8に示す。
【0074】
分類処理部210は、検出処理部20で特定した対象物の対象物画像情報から、クラスタリング処理などによって対象物画像情報を分類する。たとえば陳列棚を撮影した画像情報などに写っている、POPとして判別した物体の領域の画像情報(POP画像情報)を、クラスタリング処理などによって分類する。陳列棚に陳列する商品、商品タグ(プライスカード)、棚段、棚段の上方あるいは側方などに貼付、取付、設置等されているPOPが対象物の場合、対象物画像情報としては、そのPOP画像情報となる。このときにPOPの領域を含む矩形で切り出していてもよいし、POPの外形に応じた任意の形状で切り出した画像情報であってもよい。また、画像情報を切り出すとは、物理的に切り出してもよいし、その領域の座標情報を特定し、範囲を特定するのであってもよい。
【0075】
対象物画像情報に写っている対象物の識別情報(対象物識別情報)、たとえば対象物がPOPであればそのPOPを識別する情報(POP識別情報)などのコードは判明していなくてもよい。
【0076】
分類処理部210が、複数の対象物画像情報を公知の手法でクラスタリング処理を実行し、画像情報を複数のグループに分類をする。たとえば対象物がPOPであれば、複数のPOP画像情報を公知の手法でクラスタリング処理を実行し、POP画像情報を複数のグループに分類をする。
【0077】
なお、分類処理部210はクラスタリング処理を用いて対象物画像情報を分類する場合を説明しているが、クラスタリング処理以外の手法によって対象物画像情報を分類してもよい。
【0078】
仮識別情報処理部211は、分類処理部210で分類した対象物画像情報の各グループに仮の識別情報(仮識別情報)を対応づける。対象物がPOPの場合、分類処理部210で分類したPOP画像情報の各グループに仮の識別情報(仮識別情報)を対応づける。仮識別情報は、自動的に生成した仮識別情報を対応づけてもよいし、入力を受け付けた仮識別情報を所定の操作で対応づけてもよい。そして、各グループに分類された対象物画像情報に対応づけた仮識別情報を、ラベルとして対応づけてデータセットとし、学習用データとする。
【0079】
モデル生成処理部212は、学習用データを用いて公知の手法により機械学習を行い、学習モデルを生成する。すなわち、対象物画像情報には分類されたグループごとに仮識別情報が対応づけられているので、対象物画像情報とそのラベルを仮識別情報としたデータセットを用いた学習用データを用いて、学習モデルを生成する。対象物がPOPの場合、分類されたPOP画像情報のグループごとに仮識別情報が対応づけられているので、POP画像情報とそのラベルを仮識別情報としたデータセットを用いた学習用データを用いて、学習モデルを生成する。
【0080】
標本情報受付処理部213は、モデル生成処理部212に入力させる画像情報の入力を受け付ける。ここで入力を受け付ける画像情報は、対象物を識別する対象物識別情報が判明している対象物画像情報である。たとえば、陳列棚に貼付等される可能性のあるPOP画像情報であり、それに対応するPOPの識別情報(POP識別情報)が判明している画像情報である。ここで入力する画像情報は、標本情報とよぶこととする。
【0081】
認識処理部214は、標本情報受付処理部213で入力を受け付けた画像情報(標本情報)を、モデル生成処理部212で生成した学習モデルに入力し、仮識別情報を出力する。この場合、中間層が多数の層からなるニューラルネットワークの各層のニューロン間の重み付け係数が最適化された学習モデルに対して、標本情報を入力すると、出力値として仮識別情報が出力される。複数の出力値がその確度とともに出力される場合には、もっとも確度が高い出力値を採用する。
【0082】
出力処理部215は、認識処理部214で出力した出力値となる仮識別情報と、その入力に用いた標本情報の対象物識別情報とを紐付ける。そして、出力処理部215は、認識処理部214で出力した仮識別情報に紐付けた対象物識別情報を、認識処理部214の認識結果として出力をする。
【0083】
なお、出力処理部215は、認識処理部214が出力する仮識別情報に紐付けた対象物識別情報を出力するのではなく、分類処理部210で出力したグループに対応づけた仮識別情報を対象物識別情報に代えて、再度、モデル生成処理部212で機械学習の学習処理を実行させてもよい。
【0084】
また、認識処理部214が出力した仮識別情報の確度が所定の閾値以下の場合には、出力処理部215の処理を実行しなくてもよい。
【0085】
以上のような処理を実行することで、機械学習で用いる学習モデルを効率よく生成することができる。
【実施例1】
【0086】
つぎに本発明の情報処理システム1を用いた処理プロセスの一例を図9乃至図11のフローチャートを用いて説明する。なお、以下の説明では、店舗の陳列棚を撮影した撮影画像情報を画像情報入力端末3から入力し、撮影画像情報から対象物としてPOPの領域を検出し、検出したPOPの領域の画像情報を用いて、POPを識別するための機械学習の学習モデルを生成する場合を説明する。
【0087】
まず検出処理部20における検出処理を説明する(S100)。
【0088】
店舗の陳列棚が撮影された撮影画像情報は、画像情報入力端末3から入力され、管理端末2の画像情報入力受付処理部200でその入力を受け付ける(S110)。入力した撮影画像情報の一例が図5(a)である。また、撮影日時、店舗識別情報、陳列棚識別情報、撮影画像情報の画像情報識別情報の入力を受け付ける。そして、画像情報入力受付処理部200は、入力を受け付けた撮影画像情報、撮影日時、店舗識別情報、店舗識別情報、撮影画像情報の画像情報識別情報を対応づけて画像情報記憶部201に記憶させる。
【0089】
管理端末2において所定の操作入力を受け付けると、画像情報正置化処理部202は、画像情報記憶部201に記憶する撮影画像情報を抽出し、台形補正処理などの正置化処理を行うための4点、たとえば陳列棚の四隅の入力を受け付け、正置化処理を実行する(S120)。
【0090】
そして管理端末2において所定の操作入力を受け付けることで、物体検出処理部203は、正置化した正置画像情報に対して物体検出処理を実行して(S130)、当該正置画像情報に写っている物体の種別を分類する(S140)。
【0091】
正置画像情報から物体検出処理を実行した結果の一例を模式的に図12に示す。図12において、「a」は商品類、「b」は商品タグ類、「c」は棚部材、「d」は「a」から「c」以外としてそれぞれ検出した物体の種別を意味している。なお、画像情報から検出した物体の種別は、それぞれの領域に対応づけられていればよく、それぞれの画像上に書き込まれなくてもよい。また検出した物体の領域は、正置画像情報から切り出されていてもよいが、その領域の画像情報が処理可能な状態であれば実際に切り出されていなくてもよい。なお、領域の画像情報を切り出すとは、実際に正置画像情報から当該領域の画像情報を切り出すほか、当該領域の画像情報を切り出さずに処理可能な状態として、座標情報などにより領域を特定する場合も含む。
【0092】
個別判別処理部204は、物体検出処理部203で検出した物体の領域について、商品類、商品タグ類、棚部材以外の種別の物体の領域(「d」の物体の領域)をPOPの領域として判別して切り出す(S150、S160)。
【0093】
また、個別判別処理部204は、物体検出処理部203で検出した物体の領域のうち(S150)、種別を商品類として検出した領域について所定条件を充足するかを判別して、POPの領域であるかを判別する(S170)。
【0094】
たとえば種別を商品類として検出した物体の領域について、その領域に対して商品密着型の広告(POP)がついているかを判別し、POPがあると判別した場合にはその領域の種別をPOPとして判別する。種別を商品類として検出した物体の領域について、陳列商品に付されたPOPを検出する処理を実行する、あるいは商品類として検出した物体の領域の画像情報と、POPのない商品の画像情報(商品の標本画像情報)とを比較することで、POPを検出する。
【0095】
同様に、種別を商品タグ類として検出した物体の領域については、その物体の領域の画像情報が商品タグ類の要件を満たすか否かを判別する。また、棚部材として検出した物体については、その物体の領域の画像情報が棚部材の要件を満たすか否かを判別する。
【0096】
以上のように、種別を商品類、商品タグ類、棚部材のいずれかとして検出した物体の領域について(S150)、それぞれの物体ごとの所定の条件を充足するかを判別し(S170)、その条件を充足する場合には、その領域の全部または一部の領域をPOPとして判別する(S180)。この処理の一例を図13に示す。また、図12の物体検出の結果に対して、種別を商品類、商品タグ類、棚部材のいずれかとして検出した物体の領域において所定条件を充足した領域をPOPの領域として判別した後の各領域の一例を図14に示す。
【0097】
以上のような処理を検出処理部20で実行することで、画像情報におけるPOPの領域を検出することができる。これによって、各種の陳列棚を撮影した撮影画像情報からさまざまな種類のPOPの領域の画像情報を検出でき、後述するモデル処理部21における学習モデルの生成に用いる画像情報を取得できる。
【0098】
つぎに検出処理部20で検出したPOPの画像情報を用いて、モデル処理部21で学習モデルの生成処理を行う処理を説明する(S200)。
【0099】
検出処理部20において検出したPOP画像情報の一例を図15に示す。この時点では撮影画像情報から対象物の画像情報であるPOP画像情報を検出しただけなので、対象物であるPOPを識別するためのPOP識別情報(対象物識別情報)は判明していなくてもよい。
【0100】
そして、分類処理部210は、対象物画像情報となるPOP画像情報を用いて、公知のクラスタリング処理などを実行することで、類似する画像情報同士をグループ化し、複数のグループに分類を行う(S210)。この状態を模式的に示すのが図16である。
【0101】
仮識別情報処理部211は、分類処理部210で分類したグループごとに、仮識別情報を対応づける(S220)。たとえば「a123」、「b456」、「c789」、「d012」、「e345」など、それぞれのグループごとに任意の仮識別情報を対応づける。この状態を模式的に示すのが図17である。これによって、それぞれのグループの対象物画像情報について、仮識別情報をラベルとして対応づける。そしてこれらの対象物画像情報となるPOP画像情報と仮識別情報のラベルとを用いたデータセットを学習用データとする。
【0102】
分類処理部210で分類したグループごとに仮識別情報を対応づけると、モデル生成処理部212は、学習用データとして、公知の手法により機械学習を行い(S230)、学習モデルを生成する(S240)。これを模式的に示すのが図18である。なお、図18ではそれぞれのグループで一つのPOP画像情報と仮識別情報とを学習用データセットとしている場合を示しているが、実際には、各グループにおける各POP画像情報と仮識別情報とを対応づけて学習用データセットとして機械学習を行うことが好ましい。同一のグループにおいても完全に一致する画像情報だけではなく、多少なりとも相違があり、それらもそのグループにおける仮識別情報に対応づけて機械学習させることで精度向上につなげられる可能性があるからである。
【0103】
つぎに、標本情報受付処理部213は、対象物識別情報となるPOP識別情報が判明している画像情報である標本情報の入力を受け付け、入力を受け付けた標本情報をS240で生成した学習モデルに入力する(S250)。認識処理部214は、標本情報の入力を受け付け、学習モデルを用いた機械学習による出力結果を出力する。この出力結果としては、仮識別情報が出力される(S260)。これを模式的に示すのが図19である。
【0104】
標本情報は、あらかじめPOP識別情報などの対象物識別情報が判明している。そのため、認識処理部214で出力した仮識別情報は、学習モデルに入力した標本情報の対象識別情報に対応すると考えられる。そのため、出力処理部215は、出力した仮識別情報と、入力した標本情報の対象物識別情報とを紐付けする(S270)。これを模式的に示すのが図20である。
【0105】
この紐付けによって、仮識別情報と、対象物識別情報であるPOP識別情報との対応付けができるので、その対応付けを記憶しておくことで、認識処理部214が出力した仮識別情報を、対応する対象物識別情報で置き換えて出力すれば、同定処理を行う画像情報を学習モデルに入力した場合、学習モデルの出力値として、対象物識別情報の出力を行うことができる。
【0106】
以上のようなモデル処理によって、対象物の機械学習用の学習モデルを生成することができる。たとえば陳列棚を撮影した画像情報からPOPを検出し、その検出したPOPを用いて、入力した画像情報からPOPを検出するための機械学習用の学習モデルを生成することができる。
【実施例2】
【0107】
検出処理部20における検出処理の別の実施例を説明する。本実施例の検出処理部20では、さらに領域検出処理部205を有している。本実施例における検出処理部20の構成の一例を図21に、検出処理部20の処理プロセスの一例を図22のフローチャートに示す。また、処理の概要の一例を図23に、個別判別処理の一例を図24に示す。
【0108】
領域検出処理部205は、画像情報記憶部201に記憶する画像情報(正置化した画像情報も含む)から、商品を陳列する領域である商品陳列領域、商品タグが配置される領域である商品タグ領域、棚の上部の領域である棚上部領域を検出する。商品陳列領域、商品タグ領域、棚上部領域の検出としては、管理端末2の操作者が手動で商品陳列領域、商品タグ領域、棚上部領域を指定し、それを領域検出処理部205が受け付けてもよいし、初回に手動で入力を受け付けた商品陳列領域、商品タグ領域、棚上部領域の情報に基づいて、二回目以降は自動で商品陳列領域、商品タグ領域、棚上部領域を検出してもよい。また、領域検出処理部205は、これら以外の領域を検出して処理対象としてもよい。
【0109】
図25に、商品が陳列されている陳列棚を撮影した画像情報を正置化した画像情報に対して、商品陳列領域と商品タグ領域と棚上部領域の指定の入力を受け付けた状態を模式的に示す。
【0110】
なお、領域検出処理部205は、商品陳列領域、商品タグ領域、棚上部領域を検出する際に、深層学習(ディープラーニング)を用いて商品陳列領域、商品タグ領域、棚上部領域を特定してもよい。この場合、中間層が多数の層からなるニューラルネットワークの各層のニューロン間の重み付け係数が最適化された学習モデルに対して、上記正置化した画像情報を入力し、その出力値に基づいて、商品陳列領域、商品タグ領域、棚上部領域を検出してもよい。また学習モデルとしては、さまざまな画像情報に商品陳列領域、商品タグ領域、棚上部領域を正解データとして与えたものを用いることができる。
【0111】
領域検出処理部205は、上述のように深層学習を用いるほか、各種の公知の方法を用いて領域を検出してもよい。
【0112】
領域検出処理部205は、検出した領域について、実際に画像情報として切り出してもよいし、実際には画像情報としては切り出さずに,領域の範囲を特定するなどによって、仮想的に切り出すのでもよい。この場合、領域の範囲は座標によって特定できる。
【0113】
本実施例における物体検出処理部203は、実施例1の検出処理部20のように、正置画像情報の範囲から物体検出処理を行ってもよいし、領域検出処理部205で検出した各領域ごとに行ってもよい。
【0114】
本実施例における個別判別処理部204は、物体検出処理部203で検出した各物体について、その物体の種別(クラス)と、その物体がある領域とを用いて、当該物体の種別を判別する。たとえば図23および図24に示す判別表など、あらかじめ定めた個別判別の条件に従って判別をする。
【0115】
図23における「a1」から「a4」、「b1」から「b10」、「d1」から「d5」は、図24における「a1」から「a4」、「b1」から「b10」、「d1」から「d5」に対応している。
【0116】
つぎに本実施例における検出処理部20の処理プロセスの一例を図22のフローチャートを用いて説明をする。
【0117】
店舗の陳列棚が撮影された撮影画像情報は、画像情報入力端末3から入力され、管理端末2の画像情報入力受付処理部200でその入力を受け付ける(S300)。また、撮影日時、店舗識別情報、陳列棚識別情報、撮影画像情報の画像情報識別情報の入力を受け付ける。そして、画像情報入力受付処理部200は、入力を受け付けた画像情報、撮影日時、店舗識別情報、陳列棚識別情報、撮影画像情報の画像情報識別情報を対応づけて画像情報記憶部201に記憶させる。
【0118】
管理端末2において所定の操作入力を受け付けると、画像情報正置化処理部202は、画像情報記憶部201に記憶する撮影画像情報を抽出し、台形補正処理などの正置化処理を行うための頂点である任意の4点の、たとえば陳列棚の四隅の入力を受け付け、正置化処理を実行する(S310)。
【0119】
そして管理端末2において所定の操作入力を受け付けることで、領域検出処理部205は、正置化した画像情報に対して領域検出処理を行い、商品陳列領域、商品タグ領域、棚上部領域を検出し(S320)、各領域の範囲を判定する。
【0120】
また、管理端末2において所定の操作入力を受け付けることで、物体検出処理部203は、正置化した画像情報に対して物体検出処理を実行して(S330)、当該画像情報に写っている物体の種別を分類する(S340)。画像情報から物体検出処理を実行した結果の一例は、実施例1と同様に図12のように分類される。
【0121】
そして、個別判別処理部204は、物体検出処理部203で検出した画像情報の各物体について、その物体の種別と、当該物体がある領域(S320で判定した領域)とを用いて、あらかじめ定めた判定条件に従い、検出した物体の分類を行う。
【0122】
また、個別判別処理部204は、物体検出処理部203で検出した画像情報の物体の種別と、その物体のある領域とを用いて、所定条件を充足するかを判定し(S350)、その物体の種別がPOPであるか、POP以外(商品類、商品タグ類、棚部材など)であるかを判定する(S360、S370)。なお、各物体がどの領域にあるかは、たとえば、その物体の領域の重心が、商品類、商品タグ類、棚上部のどの領域に含まれているかなど、適宜の方法で判定すればよい。
【0123】
たとえば商品陳列領域にある物体であって、その物体の種別が商品類の場合には、個別判別処理部204は、当該物体の領域に対して、商品密着型のPOPがあるかを判定する。たとえば、実施例1と同様に、種別を商品類として検出した物体の領域から陳列商品に付けられたPOPを検出する方法と、種別を商品類として検出した物体の領域の画像情報とPOPのない商品の画像情報との比較によりPOPを検出する方法により判別をする。もし商品密着型POPが検出できた場合には、その領域をPOPとして判別をし(a2)、それ以外の領域を商品類として判別をする(a1)。また、商品密着型POPが検出できなかった場合には、その領域についてOCR認識処理を実行し、「テスター」、「見本」、「サンプル」などPOPで用いられる所定の単語が含まれているかを判別し、含まれていない場合には当該領域の物体は商品類であると判別する(a1)。含まれている場合には、その領域の物体はテスターや見本などのPOPであると判別する(a3)。
【0124】
また、商品陳列領域にある物体であって、その物体の種別が商品タグ類の場合には、個別判別処理部204は、その領域にある物体はPOPであると判別をする(d1)。
【0125】
また、商品陳列領域にある物体であって、その物体の種別が棚部材の場合には、個別判別処理部204は、その領域にある物体は棚部材であると判別をする(c)。
【0126】
また、商品陳列領域にある物体であって、その物体の種別が商品類、商品タグ類、棚部材以外である場合には、POPであると判別をする(d2)。
【0127】
商品タグ領域にある物体であって、その物体の種別が商品類の場合には、個別判別処理部204は、テスターや見本などのPOPであると判別をする(d4)。
【0128】
また商品タグ領域にある物体であって、その物体の種別が商品タグ類の場合には、その物体の領域に対してOCR認識処理を行い、その領域に手書きがあると判定した場合には、店舗(小売り)が作成したPOP(小売りPOP)であると判別をする(b4)。当該物体の領域に対してOCR認識処理の結果、その領域に手書きがないと判定した場合であって、価格および商品名の表示が含まれていると判定した場合であり、かつ「会員」などの条件を示す単語が含まれている場合には、その物体の種別はセット商品表示を示す商品タグであると判別する(b2)。一方、価格および商品名の表示が含まれていると判定した場合であって、「会員」などの条件を示す単語が含まれていない場合には、その物体の種別は商品タグであると判別をする(b1)。上記の価格および商品名の表示が含まれていないと判定した場合であり、かつポイントの表示がある場合にはその物体の種別は「ポイント表示」のPOPであると判別をする(b3)。さらに、上記においてポイントの表示がない場合には、商品のメーカーが作成したPOP(メーカーPOP)であると判別をする(b9)。なお、ここではメーカーPOPと小売りPOPとを区別して判別する場合を示したが、単にPOPとして判別をしてもよい。
【0129】
また商品タグ領域にある物体であって、その物体の種別が棚部材の場合には、個別判別処理部204は、その領域にある物体は棚部材であると判別をする(c)。
【0130】
また商品タグ領域にある物体であって、その物体の種別が商品類、商品タグ類、棚部材以外である場合には、その領域についてOCR認識処理を実行する。そして、「テスター」、「見本」、「サンプル」などPOPで用いられる所定の単語が含まれているかを判別し、含まれている場合にはテスターや見本などのPOPであると判別をする(d4)。一方、「テスター」、「見本」、「サンプル」などPOPで用いられる所定の単語が含まれていない場合には、宣伝グッズなどのPOPであると判別をする(d3)。
【0131】
棚上部領域にある物体であって、その物体の種別が商品類の場合には、個別判別処理部204は、ストック商品であると判別をする(a4)。
【0132】
また棚上部領域にある物体であって、その物体の種別が商品タグ類の場合には、その物体の領域に対してOCR認識処理を行い、その領域に手書きがあると判定した場合には、小売りPOPであると判別をする(b8)。当該物体の領域に対してOCR認識処理の結果、その領域に手書きがないと判定した場合であって、価格および商品名の表示が含まれていると判定した場合であり、かつ「会員」などの条件を示す単語が含まれている場合には、その物体の種別はセット商品表示を示す商品タグであると判別する(b6)。一方、価格および商品名の表示が含まれていると判定した場合であって、「会員」などの条件を示す単語が含まれていない場合には、その物体の種別は商品タグであると判別をする(b5)。上記の価格および商品名の表示が含まれていないと判定した場合であり、かつポイントの表示がある場合にはその物体の種別は「ポイント表示」のPOPであると判別をする(b7)。さらに、上記においてポイントの表示がない場合には、メーカーPOPであると判別をする(b10)。
【0133】
また棚上部領域にある物体であって、その物体の種別が棚部材の場合には、個別判別処理部204は、その領域にある物体は棚部材であると判別をする(c)。
【0134】
また棚上部領域にある物体であって、その物体の種別が商品類、商品タグ類、棚部材以外である場合には、大型の宣伝グッズなどのPOPであると判別をする(d5)。
【0135】
以上のように、個別判別処理部204は、領域検出処理部205で検出した領域と、物体検出処理部203で検出した物体の種別とを用いて、当該物体をPOPであるか、POPではないかを判別し、画像情報におけるPOPの領域を検出することができる。
【実施例3】
【0136】
実施例1および実施例2の処理の変形例として、図26のフローチャートに示す処理を行ってもよい。この場合、個別判別処理部204は、物体検出処理部203で検出した物体の種別が商品類、商品タグ類、棚部材以外である場合には、その物体はPOPであると判別をする(S460)。そして、それ以外の物体について、図22のS350乃至S370の処理と同様の処理を実行すればよい。すなわち、物体検出処理部203で検出した画像情報の物体の種別と、その物体のある領域とを用いて、所定条件を充足するかを判定し(S470)、その物体がPOPであるか、POP以外(商品類、商品タグ類、棚部材など)であるかを判定する(S480、S490)。なお、S400からS440までの処理は、S300からS340までの処理と同様の処理でよい。
【実施例4】
【0137】
実施例1乃至実施例3の検出処理部20の処理に加え、モデル処理部21における変形例を説明する。分類処理部210で行う分類処理は、人間が行う分類処理よりも精度が劣る場合もある。そのため、誤りの混入が発生することがある。そこで、分類処理部210により分類した各グループの画像情報(対象画像情報)に対してクレンジング処理を行い、グループに分類された画像情報のうち、誤りが含まれている可能性がある対象物画像情報を除外して、モデル生成処理部212の学習用データとして用いる対象物画像情報を減らす処理を行うクレンジング処理部216を備えていてもよい。この場合のモデル処理部21の構成の一例を図27に示す。
【0138】
すなわち、分類処理部210でグループごとに対象物画像情報を分類すると、そのグループにおける画像情報の特徴を示す特徴量などの指標値を算出する。そして、そのグループにおいて、対象物画像情報ごとの指標値の中央値や平均値などの基準値からの情報距離(基準値から画像情報ごとの指標値までの乖離を所定の算出式で算出した値)を算出し、一定値または一定の比率以上、情報距離が乖離している対象物画像情報は、当該グループから除外してもよい。
【0139】
またクレンジング処理として情報距離を用いるほか、画像情報の類似度を用いてもよい。この場合、グループにおける画像情報同士の類似度を数値化し、一定以上の類似度が算出された画像情報の枚数が所定の値以上であれば、対象物画像情報として残し、所定の値未満であれば対象物画像情報から除外する。
【0140】
たとえばあるグループに5枚の対象画像情報(画像情報1から画像情報5)があった場合、その5枚の画像情報について、それぞれ他の画像情報との類似度を算出する。すなわち、画像情報1は画像情報2から画像情報5、画像情報2は画像情報3から画像情報5、画像情報3は画像情報4から画像情報5、画像情報4は画像情報5との類似度を算出する。これによって、各画像情報同士の類似度が算出できる。
【0141】
画像情報1について、画像情報2との類似度が0.9、画像情報3との類似度が0.95、画像情報4との類似度が0.3、画像情報5との類似度が0.8であり、画像情報2について画像情報3との類似度が0.8、画像情報4との類似度が0.2、画像情報5との類似度が0.6、画像情報3について画像情報4との類似度が0.4、画像情報5との類似度が0.9、画像情報4について画像情報5との類似度が0.5であったとする。
【0142】
ここで、基準とする画像情報の類似度を0.75、基準度を下回る画像情報の枚数を3枚としたときに、画像情報1は基準とする類似度を下回るのは画像情報4の1枚、画像情報2は基準とする類似度を下回るのは画像情報4と画像情報5の2枚、画像情報3は基準とする類似度を下回るのは画像情報4の1枚、画像情報4は基準とする類似度を下回るのは画像情報1、画像情報2、画像情報3、画像情報5の4枚、画像情報5は基準とする類似度を下回るのは、画像情報2と画像情報4の2枚となる。
【0143】
したがって、クレンジング処理部216は、基準とする類似度を下回る画像情報が3枚以上であった画像情報4を当該グループから除外し、当該グループの対象物画像情報としては、画像情報1、画像情報2、画像情報3、画像情報5の4枚として、仮識別情報処理部211の処理を実行させる。
【0144】
本実施例のようにグループ化した対象物画像情報のうち、乖離した画像情報を除外することで、グループ化した対象物画像情報を絞ることができ、精度向上につなげることができる。
【実施例5】
【0145】
陳列棚に設置等されているPOPを切り出して対象物画像情報としてのPOP画像情報を抽出する場合、顧客の注目を集めるため、同じようなPOPを上下左右のいずれかの方向に複数、隣接して設置することがある。
【0146】
そこで、陳列棚を撮影した画像情報から対象物画像情報としてのPOP画像情報を抽出した後、分類処理部210は、隣接している対象物画像情報としてのPOP画像情報の類似度を比較して、それが一定の条件を充足する場合、たとえば類似度が所定の閾値以上であれば、同一種別の対象物であると判定し、隣接していたPOPの対象物画像情報としてのPOP画像情報を同一のグループに分類するようにしてもよい。
【実施例6】
【0147】
陳列棚に陳列している商品のPOPを対象物とする場合、あらかじめ陳列される可能性のあるPOPの学習モデルを生成しておくことが好ましい。しかし、その場合、対象となるPOPは数百から数千、場合によっては数万単位になる可能性がある。この場合、数千から数万単位の学習モデルを認識可能な学習モデルとすると、標本情報受付処理部213で入力させる標本情報が数千から数万単位となり、従来の学習モデルよりも作業量は減るが、それでも作業負担は大きい。
【0148】
一方、一般的に10%程度の商品の種類で、その分類の9割程度の売上げを占める傾向があることがマーケティングとして知られている。そのため、標本情報受付処理部213に入力させる標本情報として、売上高が多い商品のPOPを用いてもよい。この場合、マーケティング会社などにより提供されている商品のPOPなどを用いてもよい。
【0149】
これによって、売上高ベースであれば9割程度の商品のPOPの認識ができることとなり、実務的には十分に対象物識別情報の出力としては耐えうるものとなる。なお、あまり売上げができていない商品のPOPが学習モデルに入力された場合には、対象物識別情報と仮識別情報との紐付けがなされていないので、出力処理部215はそのまま仮識別情報を出力することとなる。出力処理部215が、仮識別情報と対象物識別情報との対応付けがない仮識別情報を出力する場合には、対応情報なし、などの所定の表示を行ってもよい。
【0150】
また、ある特定の会社などの組織体の商品のPOPのみの認識ができればよいのであれば、その会社の商品の画像情報を標本情報として標本情報受付処理部213に入力させてもよい。これによって、ある会社の商品のPOPについては、対象物識別情報を出力することができる。一方、ある会社以外の会社の商品のPOPが入力された場合には、上述の場合と同様、対象物識別情報と仮識別情報との紐付けがなされていないので、出力処理部215はそのまま仮識別情報を出力することとなる。出力処理部215が、仮識別情報と対象物識別情報との対応付けがない仮識別情報を出力する場合には、対応情報なし、などの所定の表示を行ってもよい。
【実施例7】
【0151】
実施例1乃至実施例6のように生成した学習モデルに対しては、精度向上を目的として、再度、学習モデルを再構築してもよい。この場合、新たな標本情報を入力して、対象物識別情報が紐付けられていない仮識別情報に、あらたに対象物識別情報を紐付くように構成してもよいし、あるいは、新たな対象物が認識可能なように、新たな対象物の対象物画像情報を用いて分類処理部210における分類処理を実行させてもよい。
【実施例8】
【0152】
上述の実施例1乃至実施例7では、陳列棚を撮影した画像情報から、その陳列棚に陳列されたPOPを同定する場合の学習モデルを生成する場合を説明したが、それ以外の場合にも適用できる。とくに本発明は、画像情報から多種類の対象物を同定する場合に自動化する場合に有用である。
【0153】
一例として、対象物として動物の場合がある。たとえば人が近づかないような場所にアシカやオットセイのような複数種類の動物が大量に生息をしており、その種類と生息数を効率的に把握するような場合に適用できる。この場合、ドローンなどでその生息地を上空から撮影し、個体ごとに対象物画像情報を切り出し、個体ごとの対象物画像情報を分類処理部210で画像分類処理を実行し、グループ化する。そして、仮識別情報処理部211がグループごとに仮識別情報を対応づけて生成した学習用データを用いて、モデル生成処理部212で機械学習を行い、学習モデルを生成する。そして標本情報受付処理部213で、種類別の標本情報の入力を受け付けて、認識処理部214で入力を受け付けた標本情報を入力値として学習モデルに入力し、仮識別情報を出力させる。これによって仮識別情報と、入力した標本情報の対応する対象物識別情報(動物の学名など)を紐付けて、出力処理部215が対象物識別情報を出力可能とする。
【0154】
上記と同様に、対象物として鳥類、植物としてもよい。鳥類、植物の場合であっても、上述の動物と同様に処理が行え、「動物」を「鳥類」、「植物」と読み替えて処理が実行できる。
【産業上の利用可能性】
【0155】
本発明の情報処理システム1を用いることで、機械学習で用いる学習モデルを効率よく生成することができる。
【符号の説明】
【0156】
1:情報処理システム
2:管理端末
3:画像情報入力端末
20:検出処理部
21:モデル処理部
70:演算装置
71:記憶装置
72:表示装置
73:入力装置
74:通信装置
200:画像情報入力受付処理部
201:画像情報記憶部
202:画像情報正置化処理部
203:物体検出処理部
204:個別判別処理部
205:領域検出処理部
210:分類処理部
211:仮識別情報処理部
212:モデル生成処理部
213:標本情報受付処理部
214:認識処理部
215:出力処理部
216:クレンジング処理部
【要約】
【課題】
本発明は、機械学習における学習モデルの生成に関する情報処理システムを提供することを目的とする。
【解決手段】
機械学習で用いる学習モデルに関する処理を実行する情報処理システムであって、画像情報に写っている物体を検出する物体検出処理部と、検出した物体の種別または種別の候補を判別する個別判別処理部と、物体の種別のうち、学習モデルを生成する対象物の種別の画像情報についてグループごとに分類する分類処理部と、分類したグループと仮識別情報を対応づける仮識別情報処理部と、グループに含まれる対象物の画像情報と仮識別情報とを含む学習用データを用いて、機械学習の学習処理を実行して学習モデルを生成するモデル生成処理部と、を有する情報処理システムである。
【選択図】 図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27