IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

<>
  • 特許-処理システム、処理方法及びプログラム 図1
  • 特許-処理システム、処理方法及びプログラム 図2
  • 特許-処理システム、処理方法及びプログラム 図3
  • 特許-処理システム、処理方法及びプログラム 図4
  • 特許-処理システム、処理方法及びプログラム 図5
  • 特許-処理システム、処理方法及びプログラム 図6
  • 特許-処理システム、処理方法及びプログラム 図7
  • 特許-処理システム、処理方法及びプログラム 図8
  • 特許-処理システム、処理方法及びプログラム 図9
  • 特許-処理システム、処理方法及びプログラム 図10
  • 特許-処理システム、処理方法及びプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-28
(45)【発行日】2024-11-06
(54)【発明の名称】処理システム、処理方法及びプログラム
(51)【国際特許分類】
   G07G 1/00 20060101AFI20241029BHJP
   G06T 7/00 20170101ALI20241029BHJP
   G07G 1/12 20060101ALI20241029BHJP
【FI】
G07G1/00 311D
G06T7/00 350C
G07G1/12 331H
G07G1/12 301Z
【請求項の数】 10
(21)【出願番号】P 2024017648
(22)【出願日】2024-02-08
(62)【分割の表示】P 2022524744の分割
【原出願日】2020-05-20
(65)【公開番号】P2024040322
(43)【公開日】2024-03-25
【審査請求日】2024-02-08
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100110928
【弁理士】
【氏名又は名称】速水 進治
(72)【発明者】
【氏名】鍋藤 悠
(72)【発明者】
【氏名】白石 壮馬
(72)【発明者】
【氏名】佐藤 貴美
(72)【発明者】
【氏名】菊池 克
【審査官】山本 裕太
(56)【参考文献】
【文献】特開2020-061044(JP,A)
【文献】特開2016-143354(JP,A)
【文献】特開2015-187870(JP,A)
【文献】国際公開第2019/167272(WO,A1)
【文献】特開2019-200533(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G07G 1/00
G06T 7/00
G07G 1/12
(57)【特許請求の範囲】
【請求項1】
物体を含む認識処理画像を取得する画像取得手段と、
機械学習で生成された推定モデルに基づき前記認識処理画像内の物体を認識する認識手段と、
前記認識の結果を訂正する入力を受付ける訂正受付手段と、
訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させる訂正手段と、
前記訂正情報として記憶された前記認識処理画像の数を物体毎にカウントし、前記数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する学習手段と、
を有する処理システム。
【請求項2】
前記認識の結果を認識情報に登録する登録手段と、
前記認識の結果を出力する出力手段と、
を有し、
前記訂正手段は、前記認識情報に登録されている前記認識の結果を訂正後の前記認識の結果に変更する請求項1に記載の処理システム。
【請求項3】
前記出力手段は、前記認識情報に登録されている複数の前記認識の結果を一覧表示し、
前記訂正受付手段は、一覧表示された複数の前記認識の結果の中から1つを指定する入力、及び、指定した前記認識の結果を訂正する入力を受付ける請求項2に記載の処理システム。
【請求項4】
前記訂正受付手段は、前記認識の結果を訂正する入力として、正しい物体識別情報の入力を受付ける請求項1から3のいずれか1項に記載の処理システム。
【請求項5】
前記訂正受付手段は、コードリーダを介して、正しい物体識別情報の入力を受付ける請求項4に記載の処理システム。
【請求項6】
前記訂正受付手段は、前記認識の結果を訂正する入力として、コードリーダを介した正しい物体識別情報の入力を受付け、
前記画像取得手段は、物体に付された物体識別情報を前記コードリーダに読み取らせる作業の様子を示す訂正画像をさらに取得し、
前記訂正手段は、前記訂正画像に基づき、前記認識情報に登録されている前記認識の結果の中の訂正対象を特定する請求項3に記載の処理システム。
【請求項7】
前記認識手段は、前記推定モデルに基づき前記訂正画像内の物体を認識し、
前記訂正手段は、前記認識情報に登録されている前記認識の結果の中の、前記訂正画像の認識の結果と一致するものを、訂正対象として特定する請求項6に記載の処理システム。
【請求項8】
前記訂正手段は、前記訂正画像内の物体の外観の特徴量と、前記認識処理画像内の物体の外観の特徴量との類似度に基づき訂正対象を特定する請求項6に記載の処理システム。
【請求項9】
コンピュータが、
物体を含む認識処理画像を取得し、
機械学習で生成された推定モデルに基づき前記認識処理画像内の物体を認識し、
前記認識の結果を訂正する入力を受付け、
訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させ、
前記訂正情報として記憶された前記認識処理画像の数を物体毎にカウントし、前記数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する処理方法。
【請求項10】
コンピュータを、
物体を含む認識処理画像を取得する画像取得手段、
機械学習で生成された推定モデルに基づき前記認識処理画像内の物体を認識する認識手段、
前記認識の結果を訂正する入力を受付ける訂正受付手段、
訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させる訂正手段、
前記訂正情報として記憶された前記認識処理画像の数を物体毎にカウントし、前記数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する学習手段、
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、処理システム、処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1は、商品を撮影した画像に基づきその商品を認識する技術を開示している。非特許文献1は、特徴点マッチングによる商品認識と、ディープラーニングを適用した商品認識とを組み合わせた多種物体認識技術を開示している。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2016-062545号公報
【非特許文献】
【0004】
【文献】"あらゆる小売商品を認識可能にする多種物体認識技術"、[online]、[2020年4月27日検索]、インターネット<URL: https://jpn.nec.com/techrep/journal/g19/n01/190118.html>
【発明の概要】
【発明が解決しようとする課題】
【0005】
画像に基づく商品認識の精度を向上させることが期待されている。そこで、発明者らは、店舗等での実際の運用時に解析対象の画像(認識したい商品を含む画像)として推定モデルに入力された画像を教師データとして蓄積し、当該教師データを用いて再学習して推定モデルを更新する技術を検討した。
【0006】
解析対象の画像内の商品の状態(商品の向き、陰影、形状、大きさ等)は、撮影環境などにより変化する。上記技術の場合、店舗等での実際の運用時に実際に解析対象の画像となった画像を教師データとすることができるので、上記再学習により、その店舗等での実際の運用に適した推定モデルが生成され、その店舗等での実際の運用時における商品認識の精度が向上する。また、店舗等での実際の運用時に推定モデルに入力された画像を教師データとして蓄積できるので、教師データを収集する手間が省かれる。
【0007】
しかし、店舗等での実際の運用時に解析対象の画像(認識したい商品を含む画像)として推定モデルに入力される画像は1日だけでも膨大な量となる。さらに、店舗等での実際の運用が長期間継続する場合、蓄積される画像はさらに膨れ上がる。これらのすべてを教師データとして利用すると、コンピュータの処理負担が大きくなる。また、当然、再学習の頻度が上がるほど、コンピュータの処理負担は大きくなる。
【0008】
本発明は、推定モデルを生成するコンピュータの処理負担を軽減しつつ、画像に基づく商品認識の精度を高めることを課題とする。
【課題を解決するための手段】
【0009】
本発明によれば、
認識対象の商品を含む認識処理画像を取得する画像取得手段と、
機械学習で生成された推定モデルに基づき前記認識処理画像内の商品を認識する認識手段と、
前記認識の結果を認識商品情報に登録する登録手段と、
前記認識の結果を出力する出力手段と、
前記認識の結果を訂正する入力を受付ける訂正受付手段と、
前記認識商品情報に登録されている前記認識の結果を訂正後の前記認識の結果に変更するとともに、訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させる訂正手段と、
前記訂正情報として記憶された前記認識処理画像の数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する学習手段と、
を有する処理システムが提供される。
【0010】
また、本発明によれば、
コンピュータが、
認識対象の商品を含む認識処理画像を取得し、
機械学習で生成された推定モデルに基づき前記認識処理画像内の商品を認識し、
前記認識の結果を認識商品情報に登録し、
前記認識の結果を出力し、
前記認識の結果を訂正する入力を受付け、
前記認識商品情報に登録されている前記認識の結果を訂正後の前記認識の結果に変更するとともに、訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させ、
前記訂正情報として記憶された前記認識処理画像の数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する処理方法が提供される。
【0011】
また、本発明によれば、
コンピュータを、
認識対象の商品を含む認識処理画像を取得する画像取得手段、
機械学習で生成された推定モデルに基づき前記認識処理画像内の商品を認識する認識手段、
前記認識の結果を認識商品情報に登録する登録手段、
前記認識の結果を出力する出力手段、
前記認識の結果を訂正する入力を受付ける訂正受付手段、
前記認識商品情報に登録されている前記認識の結果を訂正後の前記認識の結果に変更するとともに、訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させる訂正手段、
前記訂正情報として記憶された前記認識処理画像の数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する学習手段、
として機能させるプログラムが提供される。
【発明の効果】
【0012】
本発明によれば、推定モデルを生成するコンピュータの処理負担を軽減しつつ、画像に基づく商品認識の精度を高めることができる。
【図面の簡単な説明】
【0013】
図1】本実施形態の処理システムのハードウエア構成の一例を示す図である。
図2】本実施形態の処理システムの機能ブロック図の一例である。
図3】本実施形態の処理システムが有する会計装置の実装例である。
図4】本実施形態の処理システムの機能ブロック図の一例である。
図5】本実施形態の処理システムが処理する情報の一例を示す図である。
図6】本実施形態の処理システムが出力する画面の一例を示す図である。
図7】本実施形態の処理システムが処理する情報の一例を示す図である。
図8】本実施形態の処理システムの処理の流れの一例を示すフローチャートである。
図9】本実施形態の処理システムの機能ブロック図の一例である。
図10】本実施形態のカメラの設置例を説明するための図である。
図11】本実施形態のカメラの設置例を説明するための図である。
【発明を実施するための形態】
【0014】
<第1の実施形態>
「概要」
本実施形態の処理システムは、店舗等での実際の運用時に解析対象の画像(認識したい商品を含む画像)として推定モデルに入力された画像の中の「認識の結果が誤っていた画像」のみを、教師データとして蓄積する。そして、このような条件で蓄積した教師データの数が所定値を超えると、処理システムは、それまでに蓄積された教師データに基づき再学習して推定モデルを更新する。以下、詳細に説明する。
【0015】
「ハードウエア構成」
次に、処理システムのハードウエア構成の一例を説明する。
【0016】
処理システムの各機能部は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット(あらかじめ装置を出荷する段階から格納されているプログラムのほか、CD(Compact Disc)等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる)、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
【0017】
図1は、処理システムのハードウエア構成を例示するブロック図である。図1に示すように、処理システムは、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、バス5Aを有する。周辺回路4Aには、様々なモジュールが含まれる。処理システムは周辺回路4Aを有さなくてもよい。なお、処理システムは物理的及び/又は論理的に分かれた複数の装置で構成されてもよいし、物理的及び/又は論理的に一体となった1つの装置で構成されてもよい。処理システムが物理的及び/又は論理的に分かれた複数の装置で構成される場合、複数の装置各々が上記ハードウエア構成を備えることができる。
【0018】
バス5Aは、プロセッサ1A、メモリ2A、周辺回路4A及び入出力インターフェイス3Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU、GPU(Graphics Processing Unit)などの演算処理システムである。メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。入出力インターフェイス3Aは、入力装置、外部装置、外部サーバ、外部センサー、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
【0019】
「機能構成」
本実施形態の処理システム10は、図2に示すように会計システムである。会計システムは、オペレータが操作する会計装置と、複数の会計装置と通信するサーバとを有する。すなわち、処理システム10は、会計装置とサーバとを有する。
【0020】
会計装置は、店舗での会計時に利用される装置であり、会計対象の商品を登録する登録処理を実行する。なお、会計装置は、会計金額を精算する精算処理をさらに実行してもよい。会計装置は、店員が操作することを前提とした装置であってもよいし、顧客が操作することを前提とした装置であってもよい。
【0021】
登録処理では、会計装置は、会計対象の商品の商品識別情報を取得する。その後、会計装置は、取得した商品識別情報に紐付けられた商品情報(商品名、単価等)を店舗サーバ等から取得し、会計情報として自装置の記憶装置に記憶させる。
【0022】
商品識別情報の取得は、画像に基づく商品認識で実現される。すなわち、会計装置は、商品を含む画像を取得すると、その画像に含まれる商品を認識し、認識した商品の商品識別情報を取得する。商品を含む画像の撮影は、オペレータ(店員又は顧客)による操作で実現される。
【0023】
会計装置は、その他、コードリーダ、タッチパネル、物理ボタン、マイク、キーボード、マウス等の入力装置を介した周知の技術で、商品識別情報の入力を受け付けてもよい。
【0024】
精算処理では、会計装置は、会計金額を精算する処理を実行する。会計装置は、クレジットカード決済、現金決済、ポイント決済、コード決済などのあらゆる決済手段を採用することができる。なお、会計装置が精算処理を実行しない場合、会計装置は、登録された会計情報(会計対象の商品の情報、会計金額等)を、精算処理を実行する精算装置に送信することができる。
【0025】
図3に、会計装置の実装例を示す。なお、図示する実装例はあくまで一例であり、これに限定されない。会計装置は、台101と、商品載置エリア102と、支柱103と、カメラ104と、コンピュータ105と、タッチパネルディスプレイ106と、コードリーダ107とを有する。
【0026】
オペレータは、会計対象の1つ又は複数の商品を商品載置エリア102に載置する。複数の商品を一度に商品載置エリア102の上に載置することができる。カメラ104は、商品載置エリア102を撮影する位置及び向きで、支柱103に取り付けられている。このようなカメラ104により、商品載置エリア102の上に載置された1つ又は複数の商品がまとめて撮影される。
【0027】
カメラ104とコンピュータ105とは、任意の手段で互いに通信可能になっている。そして、カメラ104が生成した画像は、リアルタイム処理でコンピュータ105に入力される。また、コードリーダ107とコンピュータ105とは、任意の手段で互いに通信可能になっている。そして、コードリーダ107が取得した情報は、リアルタイム処理でコンピュータ105に入力される。また、タッチパネルディスプレイ106とコンピュータ105とは、任意の手段で互いに通信可能になっている。そして、タッチパネルディスプレイ106が取得した情報は、リアルタイム処理でコンピュータ105に入力される。図示しないが、会計装置は、マイク、物理ボダン、キーボード、マウス等のその他の入力装置を備えてもよい。これら入力装置とコンピュータ105とは、任意の手段で互いに通信可能になっている。そして、これら入力装置が取得した情報は、リアルタイム処理でコンピュータ105に入力される。
【0028】
コンピュータ105は取得した情報に基づき、各種処理を実行する。そして、コンピュータは、処理の結果をタッチパネルディスプレイ106に表示させることができる。
【0029】
なお、この実装例の会計装置は、複数の商品をまとめて撮影するように構成しているが、変形例として、会計装置は、オペレータが商品を1つずつカメラの前に位置させると、1つずつ商品を撮影するように構成してもよい。
【0030】
図4に、会計装置とサーバとを含む処理システム10の機能ブロック図の一例を示す。図示するように、処理システム10は、画像取得部11と、認識部12と、登録部13と、出力部14と、記憶部15と、訂正受付部16と、訂正部17と、学習部18とを有する。例えば、会計装置が、画像取得部11と、認識部12と、登録部13と、出力部14と、記憶部15と、訂正受付部16と、訂正部17とを有する。そして、サーバが学習部18を有する。
【0031】
画像取得部11は、認識対象の商品を含む画像である認識処理画像を取得する。画像取得部11は、例えば図3のカメラ104が生成した画像を取得する。
【0032】
認識部12は、機械学習で生成された推定モデルに基づき認識処理画像内の商品を認識し、認識した商品の商品識別情報(商品コード等)を出力する。
【0033】
推定モデルは、例えばディープラーニングを適用したクラス分類器である。より具体的には、推定モデルは、非特許文献1に開示されている多種物体認識技術を適用したモデルであってもよい。認識部12は、推定モデルに認識処理画像を入力することで、認識処理画像内の商品を認識する。推定モデルに入力される認識処理画像は、認識処理画像の全部を含む画像であってもよいし、認識処理画像内の物体が検出された一部領域を切り出した画像であってもよい。例えば、図3で示す構成の場合、1つの認識処理画像内に複数の商品が含まれ得る。この場合、例えば、認識部12は、認識処理画像に対して物体認識処理を実行した後、認識処理画像内の検出した物体領域各々を切り出した複数の画像を生成する。そして、認識部12は、切り出した複数の画像各々を推定モデルに入力して、認識処理画像内の複数の商品各々を認識する。
【0034】
推定モデルからは、例えば入力された画像が複数のクラス各々の商品を含む信頼度が出力される。認識部12は、複数のクラス各々の信頼度に基づき1つのクラスを特定し、特定したクラスの商品識別情報を認識の結果として出力する。例えば、認識部12は、「信頼度が最も高いクラス」を特定してもよいし、「信頼度が最も高く、かつ、信頼度が基準値以上であるクラス」を特定してもよいし、信頼度とその他のパラメータを組み合わせて1つのクラスを特定してもよいし、その他の手法で1つのクラスを特定してもよい。
【0035】
図2に戻り、登録部13は、認識部12が出力した認識の結果(商品識別情報)を認識商品情報に登録する。本実施形態の認識商品情報は、会計対象として登録された商品を示す会計情報である。
【0036】
図5に、認識商品情報の一例を模式的に示す。例えば、記憶部15が認識商品情報を記憶する。
【0037】
図示する例では、登録されている商品を互いに識別するための通番と、登録された商品の商品識別情報である商品コードや商品名と、登録された商品の単価と、登録された商品を含む認識処理画像の画像ファイル名とが互いに紐付けられている。
【0038】
登録部13は、認識部12が出力した商品識別情報を取得すると、取得した商品識別情報に紐付けられた商品情報(商品名、単価等)を店舗サーバ等から取得し、図5に示すように認識商品情報に登録する。店舗サーバは、予め商品マスタを記憶している。
【0039】
また、登録部13は、認識商品情報に登録された認識の結果各々に紐づけて、各認識の結果の基となった認識処理画像を記憶部15に記憶させる。各認識の結果の基となった認識処理画像は、推定モデルに入力された画像であり、認識処理画像の全部を含む画像、又は、認識処理画像内の物体が検出された一部領域を切り出した画像である。
【0040】
図2に戻り、出力部14は、認識の結果をオペレータに向けて出力する。出力部14は、認識商品情報(図5参照)に登録されている複数の認識の結果を一覧表示することができる。
【0041】
図6に、出力部14が出力する画面の一例を模式的に示す。例えば、図6に示す画面が図3のタッチパネルディスプレイ106に表示される。なお、出力部14は、その他、投影装置を介して、図6に示すような画面を任意の位置に投影してもよい。投影する位置は、処理システム10を操作しているオペレータが閲覧可能な場所であればよい。
【0042】
図2に戻り、訂正受付部16は、認識の結果を訂正する入力を受付ける。訂正受付部16は、図6に示すように一覧表示された複数の認識の結果の中から1つを指定する入力、及び、指定した認識の結果を訂正する入力を受付ける。指定した認識の結果を訂正する入力は、正しい商品識別情報(商品コードや商品名等)の入力である。これらの入力を実現する手段としては、タッチパネル、マイク、マウス、キーボード、物理ボタン、コードリーダ等のあらゆる入力装置を採用できる。
【0043】
例えば、オペレータは、図6に示すような画面を閲覧し、誤った認識結果がないか確認する。そして、誤った認識結果が存在する場合、その誤った認識結果を指定する入力、及び、正しい商品識別情報の入力を行う。コードリーダを介して正しい商品識別情報を入力できるように構成することで、入力内容の誤りを回避できる。
【0044】
図2に戻り、訂正部17は、認識商品情報に登録されている認識の結果を、訂正後の認識の結果に変更する。すなわち、訂正部17は、認識商品情報に登録されている認識の結果のうち、訂正受付部16が受付けた入力で指定された認識の結果を、訂正受付部16が受付けた入力で示される正しい商品識別情報に変更する。
【0045】
また、訂正部17は、訂正後の認識の結果(訂正受付部16が受付けた入力で示される正しい商品識別情報)と、訂正前の誤った認識の結果の基となった認識処理画像とを紐付けた訂正情報を記憶部15に記憶させる。訂正前の誤った認識の結果の基となった認識処理画像は、推定モデルに入力された画像であり、認識処理画像の全部を含む画像、又は、認識処理画像内の物体が検出された一部領域を切り出した画像である。
【0046】
図7に訂正情報の一例を示す。図示する訂正情報は、訂正後の認識の結果である商品コード各々に紐付けて、訂正前の誤った認識の結果の基となった認識処理画像を蓄積している。
【0047】
図2に戻り、学習部18は、訂正情報として記憶された認識処理画像の数が予め定められた所定値(設計的事項)を超えると、訂正情報として記憶された認識処理画像を用いて再学習して推定モデルを更新する。訂正情報として記憶された認識処理画像の数は、商品毎(図7の例の場合、商品コード毎)にカウントされるのが好ましいが、同種の商品をまとめた商品群毎にカウントしてもよいし、全ての商品をまとめてカウントしてもよい。
【0048】
次に、図8のフローチャートを用いて、処理システム10が行う処理の流れの一例を説明する。上述の通り、処理システム10は会計装置とサーバとを有するが、図8のフローチャートは、会計装置が行う処理の流れの一例を示す。
【0049】
まず、画像取得部11は、認識対象の商品を含む認識処理画像を取得する(S10)。例えば、オペレータは、会計対象の商品を、図3の商品載置エリア102の上に載置する。そして、画像取得部11は、カメラ104が生成した商品載置エリア102の上に載置された商品を含む認識処理画像を取得する。
【0050】
次に、認識部12は、機械学習で生成された推定モデルに基づき、S10で取得された認識処理画像内の商品を認識する(S11)。そして、認識部12は、認識の結果として、認識処理画像内に含まれると推定した商品の商品識別情報を出力する。
【0051】
次に、登録部13は、認識部12が出力した認識の結果(商品識別情報)を認識商品情報(図5参照)に登録する(S12)。本実施形態の認識商品情報は、会計対象として登録された商品を示す会計情報である。また、登録部13は、取得した商品識別情報に紐付けられた商品情報(商品名、単価等)を店舗サーバ等から取得し、認識商品情報に登録する。また、登録部13は、認識商品情報に登録された認識の結果各々に紐づけて、各認識の結果の基となった認識処理画像を記憶部15に記憶させる。
【0052】
次いで、出力部14は、認識の結果をオペレータに向けて出力する(S13)。例えば、出力部14は、認識商品情報(図5参照)に登録されている複数の認識の結果を一覧表示した図6に示すような画面を、図3のタッチパネルディスプレイ106に表示する。
【0053】
認識の結果をオペレータに向けて出力した後、訂正受付部16は、認識の結果を訂正する入力を受付可能になる。訂正受付部16は、図6に示すように一覧表示された複数の認識の結果の中から1つを指定する入力、及び、指定した認識の結果を訂正する入力を受付ける。例えば、訂正受付部16は、図6に示すような画面を表示した図3のタッチパネルディスプレイ106を介して、訂正対象の1つの認識の結果を指定する入力を受付ける。また、例えば、訂正受付部16は、図3のコードリーダ107を介して、正しい商品識別情報の入力を受付ける。
【0054】
そして、訂正受付部16が認識の結果を訂正する入力を受付けると(S14のYes)、訂正部17は、認識商品情報に登録されている認識の結果を、訂正後の認識の結果に変更する(S15)。すなわち、訂正部17は、認識商品情報に登録されている認識の結果のうち、訂正受付部16が受付けた入力で指定された訂正対象の認識の結果を、訂正受付部16が受付けた入力で示される正しい商品識別情報に変更する。
【0055】
また、訂正部17は、訂正後の認識の結果(訂正受付部16が受付けた入力で示される正しい商品識別情報)と、訂正前の誤った認識の結果の基となった認識処理画像とを紐付けた訂正情報を記憶部15に記憶させる(S16)。なお、S15とS16の処理順は、図示するものに限定されない。
【0056】
図8のフローチャートでは示さないが、処理システム10は、その後の任意のタイミングで、精算処理を実行する指示入力を受付けることができる。例えば、処理システム10は、図6に示すような画面で「会計(精算)」ボタンをタッチする操作を受付けることで、精算処理を実行する指示入力を受付ける。処理システム10は、当該指示入力に応じて、精算処理を実行したり、登録された会計情報(会計対象の商品の情報、会計金額等)を、精算処理を実行する精算装置に送信したりする。
【0057】
また、図示しないが、処理システム10のサーバは、予め定められた所定のタイミングになると、訂正情報として記憶された認識処理画像の数が所定値を超えているか判断する。そして、超えていると判断した場合、処理システム10は、訂正情報として記憶された認識処理画像を用いて再学習して推定モデルを更新する。一方、超えていないと判断した場合、処理システム10は、そのタイミングでは再学習を実行しない。所定のタイミングは、予め定められた時刻になったタイミングであってもよいし、オペレータが判断の実行指示を入力したタイミングであってもよいし、その他であってもよい。
【0058】
「作用効果」
本実施形態の処理システム10は、店舗等での実際の運用時に解析対象の画像(認識したい商品を含む画像)として推定モデルに入力された画像の中の「認識の結果が誤っていた画像」のみを、教師データとして蓄積する。そして、このような条件で蓄積した教師データの数が所定値を超えると、処理システム10は、それまでに蓄積された教師データに基づき再学習して推定モデルを更新する。
【0059】
このような処理システム10によれば、店舗等での実際の運用時に解析対象の画像(認識したい商品を含む画像)として推定モデルに入力された画像のすべてでなく、その中から適切に絞り込んだ画像を教師データとすることができるので、推定モデルの更新に要するコンピュータの処理負担が軽減する。
【0060】
また、本実施形態の処理システム10によれば、「認識の結果が誤っていた画像」を再学習のための教師データとすることができるので、再学習によりその誤りが生じにくくなる。すなわち、再学習の効果を高めることができる。
【0061】
また、処理システム10は、蓄積した教師データの数が所定値を超えたタイミングで再学習するので、蓄積した教師データの数が少なく、再学習の効果が十分に得られない不要なタイミングでの再学習を回避することができる。結果、推定モデルの更新に要するコンピュータの処理負担が軽減する。
【0062】
<第2の実施形態>
本実施形態の処理システム10は、一覧表示された認識の結果の中の訂正対象を、画像解析で特定する機能を有する。これにより、訂正対象を指定するオペレータの作業を省くことができる。以下、詳細に説明する。
【0063】
訂正受付部16は、認識の結果を訂正する入力として、コードリーダを介した正しい商品識別情報の入力を受付ける。例えば、図6に示すような認識の結果を一覧表示する画面を確認し、誤った認識結果を見つけたオペレータは、会計対象の中の正しく登録されていない商品(認識結果が誤っている商品)を特定する。その後、オペレータは、コードリーダ(図3のコードリーダ107等)を介して特定した商品の正しい商品識別情報を入力する。
【0064】
本実施形態では、商品に付されたコードをコードリーダに読み取らせる作業の様子を撮影する位置及び向きでカメラが設置されている。当該カメラは、会計対象の商品を撮影するカメラ(図3のカメラ104等)と同じカメラであってもよいし、異なるカメラであってもよい。
【0065】
画像取得部11は、商品に付されたコードをコードリーダに読み取らせる作業の様子を撮影するカメラが生成した画像である訂正画像を取得する。
【0066】
訂正部17は、訂正画像に基づき、認識商品情報に登録されている認識の結果の中の訂正対象を特定する。例えば、認識部12は、認識処理画像内の商品を認識するために利用する推定モデルと同じ推定モデルに基づき、訂正画像に含まれる商品を認識する。そして、訂正部17は、認識商品情報に登録されている認識の結果の中の、訂正画像の認識の結果と一致するものを、訂正対象として特定することができる。
【0067】
他の例として、訂正部17は、認識処理画像内の商品の外観の特徴量と、訂正画像内の商品の外観の特徴との類似度に基づき、訂正対象を特定してもよい。この例の場合、認識商品情報に登録されている認識の結果の中の、訂正画像内の商品の外観の特徴との類似度が最も高い認識処理画像の認識の結果が、訂正対象として特定される。
【0068】
本実施形態の処理システム10のその他の構成は、第1の実施形態と同様である。
【0069】
本実施形態の処理システム10によれば、第1の実施形態の処理システム10と同様の作用効果が実現される。また、本実施形態の処理システム10によれば、画像解析で自動的に訂正対象を特定できるので、訂正対象を指定するオペレータの作業を省くことができる。このように、ユーザフレンドリーな構成が実現される。
【0070】
本実施形態の変形例として、処理システム10は、訂正画像を教師データとしてもよい。訂正画像は、認識の結果が誤っていた商品を含む。このような訂正画像を教師データとすることで、認識の結果が誤った商品の教師データを効率的に増やすことができる。
【0071】
<第3の実施形態>
第1及び第2の実施形態では、処理システム10は、図2に示すように会計装置とサーバとを有する会計システムであった。本実施形態の処理システム10は、第1及び第2の実施形態と異なり、図9に示すように顧客が操作する端末装置20と通信するサーバを有する。処理システム10は、端末装置20を介して、認識の結果を出力したり、認識の結果の訂正の入力を受付けたりする。端末装置20は、スマートフォン、タブレット端末、スマートウォッチ、携帯電話、PC(personal computer)等の顧客の端末であってもよいし、店舗に設置された専用端末であってもよいし、その他であってもよい。
【0072】
本実施形態の処理システム10の機能ブロック図の一例は、第1及び第2の実施形態同様、図4で示される。
【0073】
本実施形態では、店舗内に、顧客が商品棚から商品を取り出す様子を撮影する位置及び向きでカメラが設置される。カメラは、商品棚に設置されてもよいし、天井に設置されてもよいし、床に設置されてもよいし、壁面に設置されてもよいし、その他の場所に設置されてもよい。
【0074】
また、一の商品棚から顧客が商品を取り出す様子を撮影するカメラは1台であってもよいし、複数台であってもよい。一の商品棚から顧客が商品を取り出す様子を複数台のカメラで撮影する場合、複数台のカメラは互いに異なる位置及び方向から顧客がその商品棚から商品を取り出す様子を撮影するように設置されるのが好ましい。
【0075】
また、商品棚毎にカメラが設置されてもよいし、複数の商品棚毎にカメラが設置されてもよいし、商品棚の段毎にカメラが設置されてもよいし、商品棚の複数の段毎にカメラが設置されてもよい。
【0076】
カメラは動画像を常時(例えば、営業時間中)撮影してもよいし、動画像のフレーム間隔よりも大きい時間間隔で静止画像を継続的に撮影してもよいし、人感センサー等で所定位置(商品棚の前等)に存在する人を検出している間のみこれらの撮影を実行してもよい。
【0077】
ここで、カメラ設置の一例を示す。なお、ここで説明するカメラ設置例はあくまで一例であり、これに限定されない。図10に示す例では、商品棚1毎に2つのカメラ2が設置されている。図11は、図10の枠4を抽出した図である。枠4を構成する2つの部品各々には、カメラ2と照明(不図示)とが設けられる。
【0078】
照明の光放射面は一方向に延在しており、発光部及び発光部を覆うカバーを有している。照明は、主に、光放射面の延在方向に直交する方向に光を放射する。発光部は、LEDなどの発光素子を有しており、カバーによって覆われていない方向に光を放射する。なお、発光素子がLEDの場合、照明が延在する方向(図において上下方向)に、複数のLEDが並んでいる。
【0079】
そしてカメラ2は、直線状に延伸する枠4の部品の一端側に設けられており、照明の光が放射される方向を撮影範囲としている。例えば図11の左側の枠4の部品において、カメラ2は下方及び右斜め下を撮影範囲としている。また、図11の右側の枠4の部品において、カメラ2は上方及び左斜め上を撮影範囲としている。
【0080】
図10に示すように、枠4は、商品載置スペースを構成する商品棚1の前面フレーム(又は両側の側壁の前面)に取り付けられる。枠4の部品の一方は、一方の前面フレームに、カメラ2が下方に位置する向きに取り付けられる。枠4の部品の他方は、他方の前面フレームに、カメラ2が上方に位置する向きに取り付けられる。そして、枠4の部品の一方に取り付けられたカメラ2は、商品棚1の開口部を撮影範囲に含むように、上方及び斜め上方を撮影する。一方、枠4の部品の他方に取り付けられたカメラ2は、商品棚1の開口部を撮影範囲に含むように、下方及び斜め下方を撮影する。このように構成することで、2つのカメラ2で商品棚1の開口部の全範囲を撮影することができる。
【0081】
図4に示す画像取得部11は、このようなカメラが生成した認識処理画像を取得する。認識処理画像は、リアルタイム処理で処理システム10に入力されてもよいし、バッチ処理で処理システム10に入力されてもよい。いずれの処理とするかは、例えば認識の結果の利用内容に応じて決定することができる。
【0082】
認識部12及び登録部13の構成は、第1の実施形態と同様である。なお、登録部13は、少なくとも認識の結果と、その認識の結果の基となった認識処理画像とを紐付けて登録すればよく、店舗サーバから取得される商品名や単価等の情報の登録は必ずしも必須ではない。認識の結果の利用内容に応じて、店舗サーバから取得される情報を登録するか否かを選択できる。
【0083】
出力部14は、端末装置20を介して、認識の結果を顧客に向けて出力する。例えば、出力部14は、第1及び第2の実施形態と同様に、図6に示すような認識の結果を一覧表示する画面を端末装置20に表示させる。そして、訂正受付部16は、端末装置20を介して、認識の結果を訂正する入力を受付ける。以下、具体例を説明する。
【0084】
「具体例1」
処理システム10は、上記構成により顧客が手に取った商品を認識するとともに、任意の手段で商品を手に取った顧客を識別する。そして、処理システム10は、その顧客の顧客識別情報に紐付けて、図5に示すような認識商品情報(認識の結果)を登録する。顧客を識別する手段は、例えば店内に設置されたカメラで撮影した顧客の顔画像に基づく顔認識処理で実現されてもよいし、その他の手段で実現されてもよい。
【0085】
そして、出力部14は、各顧客の端末装置20を介して、認識の結果を出力する。また、訂正受付部16は、各顧客の端末装置20を介して、認識の結果を訂正する入力を受付ける。例えば、各顧客は、端末装置20にインストールされた所定のアプリケーションを介して処理システム10にアクセスし、自身の顧客識別情報を用いてログインする。そして、処理システム10は、ログイン情報に基づき各顧客の端末装置20を特定し、特定した各顧客の端末装置20を介して、各顧客に紐付く認識の結果を出力したり、認識の結果を訂正する入力を受付けたりする。
【0086】
「具体例2」
処理システム10は、上記構成により顧客が手に取った商品を認識するとともに、任意の手段で商品を手に取った顧客を識別する。そして、処理システム10は、その顧客の顧客識別情報に紐付けて、図5に示すような認識商品情報(認識の結果)を登録する。顧客を識別する手段は、例えば店内に設置されたカメラで撮影した顧客の顔画像に基づく顔認識処理で実現されてもよいし、その他の手段で実現されてもよい。
【0087】
そして、出力部14は、店舗に設置された端末装置20を介して、認識の結果を出力する。また、訂正受付部16は、店舗に設置された端末装置20を介して、認識の結果を訂正する入力を受付ける。店舗に設置された端末装置20は、POS(point of sale)レジスター等の会計装置であってもよいし、その他であってもよい。
【0088】
顧客は、例えば会計処理を行う際に、店舗に設置された端末装置20に自身の顧客識別情報を入力する。例えば、顧客は自身の顔を撮影させることで当該入力を実現してもよい。この場合、撮影された顧客の顔画像に基づく顔認識処理で顧客識別情報が特定される。その他、顧客は近距離無線通信するリーダと、顧客識別情報を記憶するデバイス(スマートフォン、スマートウォッチ、タブレット端末、携帯電話、ICカード等)とを通信可能な状態にすることで当該入力を実現してもよい。その他、顧客は、タッチパネル、マイク、キーボード、マウス等の入力装置を介して顧客識別情報を入力してもよい。
【0089】
処理システム10は、店舗に設置された端末装置20から顧客識別情報を取得すると、その顧客識別情報に紐付く認識の結果をその端末装置20に送信し、表示させる。また処理システム10は、その端末装置20を介してその顧客識別情報に紐付く認識の結果を訂正する入力を受付ける。
【0090】
「具体例3」
処理システム10は、上記構成により顧客が手に取った商品を認識すると、商品を手に取った顧客の顔画像及び/又はその顔画像から抽出された特徴量に紐付けて、図5に示すような認識商品情報(認識の結果)を登録する。
【0091】
そして、出力部14は、店舗に設置された端末装置20を介して、認識の結果を出力する。また、訂正受付部16は、店舗に設置された端末装置20を介して、認識の結果を訂正する入力を受付ける。店舗に設置された端末装置20は、POSレジスター等の会計装置であってもよいし、その他であってもよい。
【0092】
顧客は、例えば会計処理を行う際に、店舗に設置された端末装置20に自身の顔を撮影させる。処理システム10は、店舗に設置された端末装置20から顧客の顔画像を取得すると、取得した顔画像またはその顔画像から抽出された特徴量に紐付く認識の結果をその端末装置20に送信し、表示させる。また処理システム10は、その端末装置20を介してその顧客識別情報に紐付く認識の結果を訂正する入力を受付ける。
【0093】
図4に戻り、記憶部15、訂正部17及び学習部18の構成は、第1及び第2の実施形態と同様である。
【0094】
本実施形態の処理システム10によれば、第1及び第2の実施形態と同様の作用効果が実現される。また、本実施形態の処理システム10によれば、第1及び第2の実施形態と異なる手法で、認識処理画像の生成、認識の結果の出力及び認識の結果を訂正する入力を実現することができる。結果、処理システム10の利用場面が広がり好ましい。
【0095】
なお、本明細書において、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置が他の装置や記憶媒体に格納されているデータを取りに行くこと(能動的な取得)」、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等、および、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置に他の装置から出力されるデータを入力すること(受動的な取得)」、たとえば、配信(または、送信、プッシュ通知等)されるデータを受信すること、また、受信したデータまたは情報の中から選択して取得すること、及び、「データを編集(テキスト化、データの並び替え、一部データの抽出、ファイル形式の変更等)などして新たなデータを生成し、当該新たなデータを取得すること」の少なくともいずれか一方を含む。
【0096】
以上、実施形態(及び実施例)を参照して本願発明を説明したが、本願発明は上記実施形態(及び実施例)に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【0097】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限定されない。
1. 認識対象の商品を含む認識処理画像を取得する画像取得手段と、
機械学習で生成された推定モデルに基づき前記認識処理画像内の商品を認識する認識手段と、
前記認識の結果を認識商品情報に登録する登録手段と、
前記認識の結果を出力する出力手段と、
前記認識の結果を訂正する入力を受付ける訂正受付手段と、
前記認識商品情報に登録されている前記認識の結果を訂正後の前記認識の結果に変更するとともに、訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させる訂正手段と、
前記訂正情報として記憶された前記認識処理画像の数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する学習手段と、
を有する処理システム。
2. 前記出力手段は、前記認識商品情報に登録されている複数の前記認識の結果を一覧表示し、
前記訂正受付手段は、一覧表示された複数の前記認識の結果の中から1つを指定する入力、及び、指定した前記認識の結果を訂正する入力を受付ける1に記載の処理システム。
3. 前記訂正受付手段は、前記認識の結果を訂正する入力として、正しい商品識別情報の入力を受付ける1又は2に記載の処理システム。
4. 前記訂正受付手段は、コードリーダを介して、正しい商品識別情報の入力を受付ける3に記載の処理システム。
5. 前記訂正受付手段は、前記認識の結果を訂正する入力として、コードリーダを介した正しい商品識別情報の入力を受付け、
前記画像取得手段は、商品に付された商品識別情報を前記コードリーダに読み取らせる作業の様子を示す訂正画像をさらに取得し、
前記訂正手段は、前記訂正画像に基づき、前記認識商品情報に登録されている前記認識の結果の中の訂正対象を特定する2に記載の処理システム。
6. 前記認識手段は、前記推定モデルに基づき前記訂正画像内の商品を認識し、
前記訂正手段は、前記認識商品情報に登録されている前記認識の結果の中の、前記訂正画像の認識の結果と一致するものを、訂正対象として特定する5に記載の処理システム。
7. 前記訂正手段は、前記訂正画像内の商品の外観の特徴量と、前記認識処理画像内の商品の外観の特徴量との類似度に基づき訂正対象を特定する5に記載の処理システム。
8. コンピュータが、
認識対象の商品を含む認識処理画像を取得し、
機械学習で生成された推定モデルに基づき前記認識処理画像内の商品を認識し、
前記認識の結果を認識商品情報に登録し、
前記認識の結果を出力し、
前記認識の結果を訂正する入力を受付け、
前記認識商品情報に登録されている前記認識の結果を訂正後の前記認識の結果に変更するとともに、訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させ、
前記訂正情報として記憶された前記認識処理画像の数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する処理方法。
9. コンピュータを、
認識対象の商品を含む認識処理画像を取得する画像取得手段、
機械学習で生成された推定モデルに基づき前記認識処理画像内の商品を認識する認識手段、
前記認識の結果を認識商品情報に登録する登録手段、
前記認識の結果を出力する出力手段、
前記認識の結果を訂正する入力を受付ける訂正受付手段、
前記認識商品情報に登録されている前記認識の結果を訂正後の前記認識の結果に変更するとともに、訂正後の前記認識の結果と前記認識処理画像とを紐付けた訂正情報を記憶手段に記憶させる訂正手段、
前記訂正情報として記憶された前記認識処理画像の数が所定値を超えると、前記訂正情報として記憶された前記認識処理画像を用いて再学習して前記推定モデルを更新する学習手段、
として機能させるプログラム。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11