(58)【調査した分野】(Int.Cl.,DB名)
前記手画像群データのオプティカルフローに基づいて、上下方向に移動する上下移動領域を抽出するとともに、前記上下移動領域のうち、前記手以外の領域を前記商品に相当する商品領域として抽出する商品領域抽出部を有する、請求項1に記載の商品管理サーバ。
前記商品領域抽出部は、前記上下移動領域のうち、前記手の形状に類似する形状を有する領域および/または前記手の色情報に類似する色情報を有する領域を除外することにより、前記商品領域を抽出する、請求項2に記載の商品管理サーバ。
請求項1から請求項6のいずれかに記載の商品管理サーバと、前記手位置検出手段および前記撮像手段が設けられた買物カートと、前記買物カゴデータ記憶部に登録された前記商品を精算するレジ装置とを有する、自動レジシステム。
【発明を実施するための形態】
【0018】
以下、本発明に係る商品管理サーバ、自動レジシステム、商品管理プログラムおよび商品管理方法の一実施形態について、図面を用いて説明する。
【0019】
本実施形態の自動レジシステム100は、買物カゴ10に入れられた商品を自動的に精算するものであり、
図1に示すように、買物カゴ10を移動させる買物カート11と、買物カゴ10に対して出し入れされる商品を管理する商品管理サーバ1と、買物カゴ10内の商品を精算するレジ装置12とによって構成されている。以下、各構成について詳細に説明する。
【0020】
レジ装置12は、POS(Point Of Sale)レジによって構成されており、買物カゴ10に入れられた商品を精算するものである。本実施形態において、レジ装置12は、商品の商品名・価格・数量等を商品管理サーバ1から受信する通信機能や、購入した商品の合計金額を集計し精算する精算機能、および商品名や合計金額等を表示する表示機能等を有している。
【0021】
買物カート11は、買物カゴ10を載置して移動させるものである。本実施形態において、買物カート11は、
図1に示すように、無線LAN等を介して商品管理サーバ1と通信するための通信ユニット13と、買物カゴ10の開口部近傍に設けられた手位置検出手段14および撮像手段15とを有している。なお、本実施形態では、買物カート11と買物カゴ10とが別体に構成されているが、この構成に限定されるものではなく、買物カート11の一部を買物カゴ10としてもよい。
【0022】
手位置検出手段14は、買物カゴ10の開口部近傍における手の位置を検出するものである。本実施形態において、手位置検出手段14は、
図2(a)に示すように、買物カゴ10の開口部近傍に上下二段に設けられており、通光状態または遮光状態を検出する上段検出面14aと下段検出面14bとから構成されている。
【0023】
上段検出面14aおよび下段検出面14bのそれぞれは、
図2(b)に示すように、発光素子と受光素子とが一体化されたビームセンサ141と、発光素子から出力された赤外光を発光素子へ反射させる反射板142とから構成されている。そして、買物カート11の上端縁における一辺に沿ってビームセンサ141が上下二列に並列されているとともに、各ビームセンサ141と対向する位置には買物カート11の上端縁に沿って複数の反射板142が設けられている。なお、
図2(b)では、見易くするために一列のみ図示している。
【0024】
これにより、赤外光が買物カゴ10の開口部を覆うように平面状に往復された状態となるため、上段検出面14aおよび下段検出面14bとして機能する。すなわち、上段検出面14aおよび下段検出面14bは、買物カゴ10の開口部に何もなければ、通光状態を検出する一方、買物カゴ10の開口部を物体が通過したとき、遮光状態を検出する。そして、通光状態または遮光状態という情報が、手の位置を示す手位置データとして、後述する手位置データ取得部41によって取得される。
【0025】
なお、本実施形態において、手位置検出手段14は、ビームセンサ141と反射板142とからなる上段検出面14aおよび下段検出面14bによって構成されているが、手の位置を検出できるものであれば、この構成に限定されるものではない。例えば、手のジェスチャーによってコンピュータを操作するLeap Motion(登録商標)等のように、二基の赤外線カメラと赤外線LEDとからなる入力デバイスを手位置検出手段14としてもよい。
【0026】
撮像手段15は、手や商品を撮像するものである。本実施形態において、撮像手段15は、
図1に示すように、ビデオカメラ15aとストロボ光源15bとから構成されており、買物カゴ10の開口部近傍における動画像を略水平方向から撮像するように設置されている。そして、手が買物カゴ10の開口部を上下に通過するたびに、後述する手画像群データ取得部43が短い動画像を切り出すとともに、当該動画像からストロボ光源15bが発光された瞬間の静止画を複数抽出し、手の画像群からなる手画像群データとして取得するようになっている。
【0027】
なお、本実施形態において、撮像手段15は、ビデオカメラ15aとストロボ光源15bとによって構成されているが、この構成に限定されるものではない。すなわち、手の動作を画像群として取得できるものであれば、高速度で連写可能な高感度カメラ等でもよい。この場合、手を高速度で連写して得られた一連の静止画像群が、手画像群データとして取得される。
【0028】
商品管理サーバ1は、購入する商品を自動的に管理するものである。本実施形態において、商品管理サーバ1は、サーバ等のコンピュータによって構成されており、
図1に示すように、主として、買物カート11やレジ装置12との間で通信を行う通信手段2と、本実施形態の商品管理プログラム1aや各種データを記憶するとともに、演算処理手段4が各種の演算処理を行う際のワーキングエリアとして機能する記憶手段3と、記憶手段3にインストールされた商品管理プログラム1aを実行することにより、各種の演算処理を実行する演算処理手段4とから構成されている。以下、各構成手段について詳細に説明する。
【0029】
通信手段2は、無線通信モジュール等から構成されており、商品管理サーバ1に通信機能を実装するためのものである。本実施形態において、通信手段2は、無線LANやBluetooth(登録商標)等の無線通信によって、上述した手位置データや手画像群データを買物カート11から受信したり、購入した商品に関する各種のデータをレジ装置12へ送信するようになっている。
【0030】
記憶手段3は、ハードディスク、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等で構成されており、各種データを記憶するとともに、演算処理手段4が各種処理を行う際のワーキングエリアとして機能するものである。本実施形態において、記憶手段3は、
図1に示すように、プログラム記憶部31と、商品データ記憶部32と、買物カゴデータ記憶部33と、商品判別式記憶部34とを有している。
【0031】
プログラム記憶部31には、本実施形態の商品管理サーバ1を制御するための商品管理プログラム1aがインストールされている。そして、演算処理手段4が、当該商品管理プログラム1aを実行することにより、商品管理サーバ1としてのコンピュータを後述する各構成部として機能させるようになっている。
【0032】
なお、商品管理プログラム1aの利用形態は、上記構成に限られるものではない。例えば、CD−ROMやUSBメモリ等のように、コンピュータで読み取り可能な非一時的な記録媒体に商品管理プログラム1aを記憶させておき、当該記録媒体から直接読み出して実行してもよい。また、外部サーバ等からクラウドコンピューティング方式やASP(Application Service Provider)方式等で利用してもよい。
【0033】
商品データ記憶部32は、店舗で取り扱っている全ての商品に関する各種のデータである商品データを記憶するものである。本実施形態において、商品データとしては、
図3に示すように、各商品を識別する商品IDに対応付けて、商品名、価格および商品基準値が記憶されている。なお、商品基準値は、後述する深層学習モードにおいて、商品を識別する際に使用するものであり、各商品が最低限満たすべき閾値である。
【0034】
買物カゴデータ記憶部33は、買物カゴ10に入れられた商品に関する各種のデータである買物カゴデータを記憶するものである。本実施形態において、買物カゴデータとしては、
図4に示すように、買物カゴ10に入れられた商品のそれぞれについて、商品名、価格および数量が記憶されるようになっている。
【0035】
商品判別式記憶部34は、画像処理によって商品を識別する際に用いる商品判別式を記憶するものである。本実施形態において、商品判別式記憶部34には、店舗で取り扱っている全ての商品について、深層学習(Deep Learning)によって得られた、商品ごとの商品判別式が記憶されている。そして、後述する深層学習モードにおいて、商品を識別する際に使用されるようになっている。
【0036】
つぎに、演算処理手段4は、CPU(Central Processing Unit)等によって構成されており、記憶手段3にインストールされた商品管理プログラム1aを実行することにより、
図1に示すように、手位置データ取得部41と、手動作判定部42と、手画像群データ取得部43と、商品領域抽出部44と、商品識別部45と、購入商品管理部46と、購入商品送信部47として機能するようになっている。以下、各構成部についてより詳細に説明する。
【0037】
手位置データ取得部41は、手の位置を示す手位置データを取得するものである。本実施形態において、手位置データ取得部41は、買物カート11に設けられた手位置検出手段14としての上段検出面14aおよび下段検出面14bのそれぞれから、通光状態であるか遮光状態であるかを手位置データとして取得し、手動作判定部42に順次提供するようになっている。
【0038】
手動作判定部42は、手位置データに基づいて、手が買物カゴ10の外部から内部へ移動したか否か、または内部から外部へ移動したか否かを判定するものである。本実施形態において、手動作判定部42は、手位置データ取得部41によって取得された上段検出面14aおよび下段検出面14bの各手位置データを常時監視する。そして、通光状態または遮光状態に変化があった場合、当該変化に基づいて手の動作を判定する。
【0039】
具体的には、手動作判定部42は、
図5(a)に示すように、上段検出面14aが通光状態から遮光状態に変化した後、下段検出面14bが通光状態から遮光状態に変化した場合、手が買物カゴ10の外部から内部へ移動したと判定する。これにより、買物カゴ10に商品を入れる場合の動作や、商品を戻すために買物カゴ10に手を入れる場合の動作が検出される。
【0040】
一方、手動作判定部42は、
図5(b)に示すように、下段検出面14bが遮光状態から通光状態に変化した後、上段検出面14aが遮光状態から通光状態に変化した場合、手が買物カゴ10の内部から外部へ移動したと判定する。これにより、買物カゴ10に商品を入れた後に手を出す場合の動作や、買物カゴ10から商品を取り出す場合の動作が検出される。
【0041】
また、本実施形態において、手動作判定部42は、手が買物カゴ10の外部から内部へ移動したときの下方移動速度と、手が買物カゴ10の内部から外部へ移動したときの上方移動速度とを算出するようになっている。
【0042】
具体的には、手動作判定部42は、以下の4つの時刻t1,t2,t3,t4を記録する。
上段検出面14aが通光状態から遮光状態に変化した時刻(t1)
下段検出面14bが通光状態から遮光状態に変化した時刻(t2)
下段検出面14bが遮光状態から通光状態に変化した時刻(t3)
上段検出面14aが遮光状態から通光状態に変化した時刻(t4)
【0043】
そして、手動作判定部42は、上段検出面14aと下段検出面14bとの間の距離Sと、上段検出面14aが通光状態から遮光状態に変化した後に、下段検出面14bが通光状態から遮光状態に変化するまでの時間(t2−t1)とに基づいて、下記式(1)を用いて下方移動速度Vdを算出するようになっている。
Vd=S/(t2−t1) ・・・式(1)
【0044】
また、手動作判定部42は、上段検出面14aと下段検出面14bとの間の距離Sと、下段検出面14bが遮光状態から通光状態に変化した後に、上段検出面14aが遮光状態から通光状態に変化するまでの時間(t4−t3)とに基づいて、下記式(2)を用いて上方移動速度Vuを算出するようになっている。
Vu=S/(t4−t3) ・・・式(2)
【0045】
なお、本実施形態において、手動作判定部42は、上段検出面14aが通光状態であって、下段検出面14bが遮光状態である場合、買物カゴ10内の商品が下段検出面14bを遮光したままとなっているか、誤った手位置データが出力されている可能性があるため、エラー信号を出力するようになっている。
【0046】
手画像群データ取得部43は、手の画像群からなる手画像群データを取得するものである。本実施形態において、手画像群データ取得部43は、手が買物カゴ10の開口部を通過するたびに、短時間の動画像を撮像手段15から取得し、当該動画像から手画像群データを抽出する。具体的には、手が買物カゴ10の外部から内部へ移動した場合、上記時刻t2から数秒程度の動画像を切り出し、手が買物カゴ10の内部から外部へ移動した場合には、上記時刻t4から数秒程度の動画像を切り出すようになっている。
【0047】
なお、本実施形態において、手画像群データ取得部43が切り出す動画像の長さは、手動作判定部42によって算出された手の移動速度に応じて決定される。すなわち、上方移動速度または下方移動速度が大きい場合、動画像の切り出し時間を短くし、上方移動速度または下方移動速度が小さい場合、動画像の切り出し時間を長くするようになっている。これにより、いずれの動画像からも、ほぼ同じ枚数の静止画像が手画像群データとして抽出されるため、後述のオプティカルフローが適切に算出される。
【0048】
商品領域抽出部44は、手画像群データから商品に相当する商品領域を抽出するものである。本実施形態において、商品領域抽出部44は、まず、
図6に示すように、連続する手画像群データの中で対応する各点の動きをベクトルで表してなるオプティカルフローを算出する。なお、
図6は、買物カゴ10の開口部の直上近傍におけるオプティカルフローを水平方向の視線方向で算出したイメージ図であり、矢印の位置における方向と大きさが各点における移動方向と移動速度を示している。
【0049】
つぎに、商品領域抽出部44は、手画像群データのオプティカルフローに基づいて、上下方向に移動する上下移動領域を抽出する。具体的には、商品領域抽出部44は、手画像群データの各点におけるオプティカルフローを参照し、移動方向の主成分が上方向または下方向である領域を上下移動領域として抽出する。このとき、商品領域抽出部44は、オプティカルフローの移動方向と移動速度が、手動作判定部42によって算出された方向と速度(上方移動速度または下方移動速度)と略同一の場合のみ、上下移動領域として抽出する。これにより、上下動する手に対応する領域が高精度に抽出される。
【0050】
つづいて、商品領域抽出部44は、抽出した上下移動領域のうち、手以外の領域を商品領域として抽出する。具体的には、商品領域抽出部44は、
図7に示すように、上下移動領域のうち、手の形状に類似する形状を有し、かつ、手の色情報に類似する色情報を有する領域を手領域として特定し、当該手領域を上下移動領域から除外する。そして、手領域以外の領域が残っていれば、当該領域を商品領域として抽出するようになっている。
【0051】
なお、手の形状に類似する形状を有する領域を特定する方法としては、例えば、買物カゴ10に出し入れされる手の形状として、商品を把持した状態や、開いた状態等の数パターンを予め基準データとして記憶させておく。そして、当該基準データと上下移動領域とを比較し、類似度が所定の閾値より高い領域を手に相当する手領域として特定すればよい。
【0052】
また、本実施形態では、手の形状に類似する形状を有し、かつ、手の色情報に類似する色情報を有する領域を手に相当する手領域と推定しているが、この構成に限定されるものではなく、手の形状に類似する形状を有する領域、または手の色情報に類似する色情報を有する領域を手領域として推定してもよい。この場合、例えば、形状による推定の確信度と、色情報による推定の確信度とを算出し、当該確信度の高い方を手領域としてもよい。
【0053】
商品識別部45は、商品領域に基づいて商品を識別するものである。本実施形態において、商品識別部45は、下記(a),(b)の双方のモードを使い分けながら商品を識別するようになっている。
(a)識別コードモード:商品領域に含まれる識別コードに基づいて、商品を識別するモード
(b)深層学習モード:深層学習によって得られた、商品のカテゴリーごとの商品判別式のそれぞれに、商品領域に係る数値データを入力したときの出力値に基づいて、商品を識別するモード
【0054】
具体的には、商品識別部45は、商品領域からバーコード等の識別コードが検出された場合には、識別コードモードで商品を識別し、商品領域からバーコード等の識別コードが検出されなければ、深層学習モードで商品を識別するようになっている。
【0055】
識別コードモードにおいて、商品識別部45は、商品領域から識別コードを読み取ることによって商品IDを特定する。そして、当該商品IDを商品データ記憶部32に登録されている商品データに照会することにより、商品を識別するようになっている。
【0056】
なお、識別コードとしては、JANコード等の視認可能なバーコードに限定されるものではなく、商品を識別しうるコードであればよい。例えば、ブラックライト(紫外線)に反応する特殊なインクで印刷された、いわゆる目に見えないバーコードや、電子透かし方式のバーコード等を用いてもよい。このようなバーコードであれば、商品の全表面に渡って多数印刷することができ、識別コードの検出率が向上する。
【0057】
一方、深層学習モードにおいて、商品識別部45は、多層のニューラルネットワークを用いて商品を識別する。本実施形態において、ニューラルネットワークは、畳み込み層やプーリング層を含み、ライブラリを用いて構築された多段の畳み込みニューラルネットワークであり、どの商品に分類されるかが予め分かっている画像データを教師データとして深層学習させたものである。
【0058】
具体的には、まず、商品ごとに切り出した画像を多数準備し、全ての画像において画素数を統一化する。そして、各画素における濃淡値の平均値が0、標準偏差が1となるように正規化し、当該正規化した画像における各画素の正規化した数値データ群を学習に使用し、商品判別式を特定する。
【0059】
なお、商品判別式に用いられる線形近似式としては、例えば、下記式(3)によって表されるような、多変量解析で使用される線形判別関数がある。
z
1=a
11x
1+a
12x
2+a
13x
3+a
14x
4+b
1 ・・・式(3)
ただし、各符号は以下を表す。
z
1:出力変数
x
1,x
2,x
3,x
4:入力変数
a
11,a
12,a
13,a
14:重み
b
1:任意の変数
【0060】
上記式(3)において、2×2画素の画像を入力する場合、画素数が4つであるため、各画素の濃淡値を入力値としたときの出力値が、当該画像の商品を表す商品値となるように、各重みを修正する作業が「学習」にあたる。なお、各重みは、一般的な画像処理で用いられるデータセットを用いて、識別精度を向上させた後、実際の商品画像から教師データと試験用データを作成し、学習・試験実験を繰り返すことにより導出される。
【0061】
また、ニューラルネットワークは、多くのユニットが網目状に接続された構造であり、各ユニットの中には非線形の活性化関数等があるため、全体像は極めて複雑となる。しかしながら、一つのユニットを単純な線形近似式で表現すれば、上記式(3)を商品判別式として多数個並べて一つの段を構成し、任意の段における各ユニットからの出力値を次の段の入力値として網目状に接続することにより、最終段では多くの出力値が得られる。そして、当該出力値が最大となる商品判別式の商品が識別結果として得られる。
【0062】
以上より、深層学習モードにおいて、商品識別部45は、まず、商品判別式記憶部34に記憶されている商品ごとの商品判別式のそれぞれに、商品領域に係る数値データ群(各画素の濃度値等)を入力し出力値を算出する。そして、当該出力値が最大となる商品を商品領域に含まれる商品として特定する。
【0063】
また、本実施形態では、商品を誤認識してしまうのを防止するため、商品ごとに最低限満たすべき出力値の閾値が商品基準値として商品データ記憶部32に設定されている。これにより、商品識別部45は、出力値が最大となる商品であっても、当該出力値が商品基準値未満である場合は、該当する商品が存在しないものと判定し、後述するエラー処理を実行させるようになっている。
【0064】
なお、エラー処理としては、例えば、手画像群データ取得部43によって切り出された動画像の前後の時間帯における動画像を余分に記録しておき、当該動画像について上述した処理を繰り返して商品を識別してもよい。あるいは、買物カート11に取り付けられているスピーカーやディスプレイ(図示せず)から、商品の識別に失敗した旨を警告し、識別処理を再実行したり、ユーザに商品の情報を手入力させてもよい。
【0065】
購入商品管理部46は、購入しようとする商品を管理するものである。本実施形態において、購入商品管理部46は、手画像群データに基づいて、買物カゴ10の外部から内部へ移動した手に商品が把持されている場合、当該商品が買物カゴ10に入れられたものと判定し、当該商品を買物カゴデータ記憶部33に登録する。一方、購入商品管理部46は、手画像群データに基づいて、買物カゴ10の内部から外部へ移動した手に商品が把持されている場合、当該商品が買物カゴ10から取り出されたものと判定し、買物カゴデータ記憶部33に登録されている当該商品を削除する。
【0066】
具体的には、購入商品管理部46は、商品識別部45によって商品が識別された場合、手動作判定部42による判定結果を参照し、手の移動方向が内方向であれば、識別された商品の商品名および価格を商品データ記憶部32から読み出し、その数量とともに買物カゴデータ記憶部33に登録する。一方、手の移動方向が外方向であれば、識別された商品に関するデータを買物カゴデータ記憶部33から削除する。これにより、買物カゴ10に入れられている商品と買物カゴデータとが常に対応するように更新される。
【0067】
購入商品送信部47は、購入しようとする商品のデータをレジ装置12へ送信するものである。本実施形態において、購入商品送信部47は、買物カゴデータ記憶部33に記憶されている全ての商品について、商品名、価格および数量を通信手段2を介してレジ装置12へ送信するようになっている。
【0068】
つぎに、本実施形態の商品管理サーバ1、自動レジシステム100、商品管理プログラム1aおよび商品管理方法の作用について、
図8を参照しつつ説明する。
【0069】
本実施形態の自動レジシステム100を用いて商品を自動精算する場合、買物カート11に載置された買物カゴ10に対して商品を出し入れする。このとき、手位置データ取得部41が、手位置検出手段14から手位置データを取得すると(ステップS1)、当該手位置データに基づいて、手動作判定部42が手の動作を判定する(ステップS2)。以下、ステップS2に係る手動作判定処理について、
図9を参照しつつ説明する。
【0070】
まず、手が買物カゴ10から離れた状態では、上段検出面14aおよび下段検出面14bが通光状態にあるため、手動作判定部42は、上段検出面14aが通光状態から遮光状態に変化したか否かを判定する(ステップS21)。当該判定の結果、上段検出面14aが通光状態から遮光状態に変化した場合(ステップS21:YES)、手動作判定部42は、当該変化した時刻(t1)を記録する(ステップS22)。
【0071】
つづいて、手動作判定部42は、さらに下段検出面14bが通光状態から遮光状態に変化したか否かを判定する(ステップS23)。当該判定の結果、下段検出面14bも通光状態から遮光状態に変化した場合(ステップS23:YES)、手動作判定部42は、当該変化した時刻(t2)を記録するとともに(ステップS24)、手が買物カゴ10の外部から内部へ移動したと判定する(ステップS25)。その後、手動作判定部42は、上記式(1)を用いて手の下方移動速度を算出した後(ステップS26)、本処理を終了する。
【0072】
一方、上記ステップS21における判定の結果、上段検出面14aが通光状態から遮光状態に変化しない場合(ステップS21:NO)、あるいは上記ステップS23における判定の結果、下段検出面14bが通光状態から遮光状態に変化しない場合(ステップS23:NO)、手が買物カゴ10の内部にあり、上段検出面14aおよび下段検出面14bが遮光状態の可能性がある。
【0073】
そこで、手動作判定部42は、下段検出面14bが遮光状態から通光状態に変化したか否かを判定する(ステップS27)。当該判定の結果、下段検出面14bが遮光状態から通光状態に変化した場合(ステップS27:YES)、手動作判定部42は、当該変化した時刻(t3)を記録する(ステップS28)。
【0074】
つづいて、手動作判定部42は、さらに上段検出面14aが遮光状態から通光状態に変化したか否かを判定する(ステップS29)。当該判定の結果、上段検出面14aも遮光状態から通光状態に変化した場合(ステップS29:YES)、手動作判定部42は、当該変化した時刻(t4)を記録するとともに(ステップS30)、手が買物カゴ10の内部から外部へ移動したと判定する(ステップS31)。その後、手動作判定部42は、上記式(2)を用いて手の上方移動速度を算出した後(ステップS32)、本処理を終了する。
【0075】
一方、上記ステップS27における判定の結果、下段検出面14bが遮光状態から通光状態に変化しない場合(ステップS27:NO)、あるいは上記ステップS29における判定の結果、上段検出面14aが遮光状態から通光状態に変化しない場合(ステップS29:NO)、手の動作がなかったものとして、本処理を終了する。以上のような手動作判定処理によって、買い物客の手が、買物カゴ10の外部から内部へ移動したのか、買物カゴ10の内部から外部へ移動したのかが自動的かつ高精度に判定される。
【0076】
図8へと戻り、手動作判定部42によって、手が買物カゴ10の外部から内部へ移動したと判定された場合、または手が買物カゴ10の内部から外部へ移動したと判定された場合(ステップS3:YES)、手画像群データ取得部43が、撮像手段15から動画像を切り出し、手画像群データを取得する(ステップS4)。これにより、買物カゴ10に手を出し入れするときの手画像群データが確実に取得される。また、手が映り込んでいない無駄な画像データは取得されないため、データ通信量および演算処理量が抑制される。
【0077】
また、本実施形態において、手画像群データ取得部43は、手動作判定部42によって算出された上方移動速度または下方移動速度に応じた長さで動画像を切り出す。このため、いずれの動画像からも、ほぼ同じ枚数の手画像群データが抽出されるため、オプティカルフローが適切に算出される。
【0078】
一方、ステップS3における判定の結果、手が買物カゴ10に対して内外に移動していなければ(ステップS3:NO)、精算の指示がない限り(ステップS12:NO)、ステップS1の処理に戻る。これにより、買物カゴ10に対する手の動作が常に監視される。
【0079】
つぎに、商品領域抽出部44が、ステップS4で取得された手画像群データのオプティカルフローに基づいて、上下方向に移動する上下移動領域を抽出する(ステップS5)。これにより、買物カゴ10に対して上方または下方へ移動する手の領域が抽出される。また、本実施形態において、商品領域抽出部44は、オプティカルフローの移動方向および移動速度が、手動作判定部42によって算出された方向および速度と略同一の場合のみ、上下移動領域として抽出する。これにより、上下動する手に対応する領域が高精度に抽出される。
【0080】
つづいて、商品領域抽出部44は、ステップS5で抽出した上下移動領域から手領域を除外し、手以外の領域があるか否かを判定する(ステップS6)。このとき、本実施形態では、上下移動領域のうち、手の形状に類似する形状を有し、かつ、手の色情報に類似する色情報を有する領域を手領域として特定するため、手以外の領域が正確に特定される。
【0081】
ステップS6における判定の結果、手以外の領域があれば(ステップS6:YES)、商品領域抽出部44が当該領域を商品領域として抽出する(ステップS7)。これにより、商品に相当する商品領域のみが高精度に抽出されるため、商品の誤認率が低減する。一方、手以外の領域がなければ(ステップS6:NO)、精算の指示がない限り(ステップS12:NO)、ステップS1の処理に戻る。これにより、商品を把持していない手画像群データについては、商品の識別処理が実行されないため、演算処理量が低減する。
【0082】
つづいて、商品識別部45が、ステップS7で抽出された商品領域に基づいて商品を識別する(ステップS8)。このとき、本実施形態において、商品識別部45は、商品領域から識別コードが検出されれば、識別コードモードで商品を識別し、商品領域から識別コードが検出されなければ、深層学習モードで商品を識別するため、商品の識別率が向上する。
【0083】
つぎに、購入商品管理部46が、手動作判定部42によって判定された手の移動方向に基づき、外部から内部への移動であれば(ステップS9:内方向)、商品識別部45によって識別された商品を買物カゴデータ記憶部33に登録する(ステップS10)。一方、手の移動方向が内部から外部への移動であれば(ステップS9:外方向)、購入商品管理部46が、商品識別部45によって識別された商品を買物カゴデータ記憶部33から削除する(ステップS11)。これにより、買物カゴ10に出し入れされた商品が、ほぼリアルタイムで買物カゴデータ記憶部33内の買物カゴデータに反映され、購入しようとする商品が自動的に管理される。
【0084】
一方、ステップS8における識別処理の結果、商品を識別できなかった場合(ステップS8:NO)、各種のエラー処理が実行される(ステップS12)。これにより、全ての商品について、正確な買物カゴデータが登録されるため、正確に精算することが可能となる。
【0085】
その後、精算の指示がない限り(ステップS13:NO)、上述したステップS1からステップS12までの処理が繰り返される。一方、精算が指示されると、購入商品送信部47が、買物カゴデータ記憶部33に記憶されている全ての商品について、商品名、価格および数量をレジ装置12へ送信する。これにより、レジ装置12では、買物カゴ10に入れられた商品を一つ一つ確認することなく全商品の合計額を算出し、自動的かつ正確に精算することが可能になる。
【0086】
以上のような本実施形態の商品管理サーバ1、自動レジシステム100、商品管理プログラム1aおよび商品管理方法によれば、以下のような効果を奏する。
1.データ通信量および演算処理量を抑制しつつ、買物カゴ10に対して出し入れされる商品の識別率を向上し、自動的に管理することができる。
2.商品に相当する商品領域のみを高精度に抽出し、商品の誤認率を低減することができる。
3.上下移動領域のうち、手以外の領域を正確に特定し、商品領域を高精度に抽出することができる。
4.商品を識別するためのモードを複数使い分けることで、商品の識別率をさらに向上することができる。
5.買い物客の手が、買物カゴ10の外部から内部へ移動したのか、内部から外部へ移動したのかを自動的かつ高精度に判定することができる。
6.手の上方移動速度または下方移動速度を用いることにより、動画像からほぼ同じ枚数の手画像群データを取得するとともに、上下動する手に対応する領域を高精度に抽出することができる。
7.データ通信量および演算処理量を抑制しつつ、買物カゴ10に対して出し入れされる商品の識別率を向上し、自動的に精算することができる。
【0087】
なお、本発明に係る商品管理サーバ1、自動レジシステム100、商品管理プログラム1aおよび商品管理方法は、上述した実施形態に限定されるものではなく、適宜変更することができる。
【0088】
例えば、上述した本実施形態において、手位置検出手段14は、ビームセンサ141と反射板142とからなる上段検出面14aおよび下段検出面14bによって構成されているが、上述したとおり、二基の赤外線カメラと赤外線LEDとからなる入力デバイスを手位置検出手段14としてもよい。この場合、赤外線LEDによって照らされた手が二基の赤外線カメラで撮影され、画像解析して得られた手の三次元位置が手位置データとして出力される。そして、当該三次元位置の時系列データを用いることにより、手の移動方向や移動速度が特定される。
【0089】
また、上記構成の場合、動画像を切り出す基準時刻(上述の時刻t2,t4)としては、買物カゴ10の開口部を被覆するような仮想平面を三次元的に設定し、当該仮想平面よりも下側に手先の位置が到達したときの時刻を上記時刻t2とし、仮想平面よりも上側に手先の位置が到達したときの時刻を上記時刻t4としてもよい。
【0090】
さらに、上記構成の場合、手位置検出手段14を構成する赤外線カメラを撮像手段15として兼用してもよい。この場合、手画像群データ取得部43は、赤外線カメラからの赤外画像データを手画像群データとして取得することとなる。
【課題】 データ通信量および演算処理量を抑制しつつ、買物カゴに対して出し入れされる商品の識別率を向上し、自動的に管理・精算を可能とする商品管理サーバ、自動レジシステム、商品管理プログラムおよび商品管理方法を提供する。
【解決手段】 買物カゴに対して出し入れされる商品を管理する商品管理サーバ1であって、手位置検出手段から手位置データを取得する手位置データ取得部41と、手が買物カゴの外部から内部へ、または内部から外部へ移動したかを判定する手動作判定部42と、手が買物カゴの内外へ移動した場合、手画像群データを取得する手画像群データ取得部43と、内部へ移動した手に商品が把持されている場合、商品を買物カゴデータ記憶部33に登録し、外部に移動した手に商品が把持されている場合、登録されている商品を削除する購入商品管理部46とを有する。