IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌ・シー・アール・コーポレイションの特許一覧

<>
  • 特開-精算のための複数商品の製品認識 図1
  • 特開-精算のための複数商品の製品認識 図2
  • 特開-精算のための複数商品の製品認識 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023114434
(43)【公開日】2023-08-17
(54)【発明の名称】精算のための複数商品の製品認識
(51)【国際特許分類】
   G06T 7/00 20170101AFI20230809BHJP
   G07G 1/00 20060101ALI20230809BHJP
   G07G 1/12 20060101ALI20230809BHJP
   G06T 7/60 20170101ALI20230809BHJP
   G06Q 30/06 20230101ALI20230809BHJP
【FI】
G06T7/00 C
G07G1/00 311D
G07G1/12 321Z
G06T7/60 110
G06T7/00 350B
G06Q30/06
【審査請求】有
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022211155
(22)【出願日】2022-12-28
(31)【優先権主張番号】17/665,145
(32)【優先日】2022-02-04
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】391007161
【氏名又は名称】エヌ・シー・アール・コーポレイション
【氏名又は名称原語表記】NCR CORPORATION
(74)【代理人】
【識別番号】100098589
【弁理士】
【氏名又は名称】西山 善章
(74)【代理人】
【識別番号】100098062
【弁理士】
【氏名又は名称】梅田 明彦
(74)【代理人】
【識別番号】100147599
【弁理士】
【氏名又は名称】丹羽 匡孝
(72)【発明者】
【氏名】ステファン ブジェルセヴィック ロスウェル
(72)【発明者】
【氏名】クリスチャン リー マクダニエル
(72)【発明者】
【氏名】ブレント ヴァンス ズッカー
【テーマコード(参考)】
3E142
5L049
5L096
【Fターム(参考)】
3E142AA01
3E142AA03
3E142CA20
3E142EA02
3E142EA04
3E142GA22
3E142GA41
3E142JA01
3E142KA01
5L049BB72
5L096AA02
5L096AA09
5L096CA04
5L096DA01
5L096FA18
5L096FA53
5L096FA66
5L096FA67
5L096GA40
5L096HA09
5L096KA04
5L096KA15
5L096MA07
(57)【要約】
【課題】小売店におけるセルフスキャニング等による清算処理を適正化する。
【解決手段】指定された領域の複数の画像が撮影される。指定された領域は、画像から識別される複数の商品を含む。各画像からの奥行き情報及び赤、緑、青(RGB)データが処理され、指定された領域の各画像に対して点群が作成される。点群は、一緒にパッチされ、又は指定された領域に対して単一の点群に同期化される。各画像の背景に関連付けられた既知の背景ピクセルは、単一の点群から除去される。単一の点群の奥行き情報とRGBデータは、一緒にクラスタ化され、バウンディングボックスは、単一の点群内の各商品の周りに配置される。少なくとも、各バウンディングボックスのRGBデータは、機械学習モデル(MLM)に提供され、MLMは、対応する商品の商品コードを返す。商品コードは、顧客に関連付けられた取引の取引マネージャに供給される。
【選択図】図1
【特許請求の範囲】
【請求項1】
方法であって、
指定された領域に対して、シーンの複数の異なる画像を取得することと、
前記画像の各々から、奥行き情報及び赤色、緑色、青色(RGB)データを抽出することと、
前記奥行き情報及び前記RGBデータを使用して、前記画像の各々に対して点群をアセンブルすることと、
前記画像の各々に対する前記点群を単一の点群に同期化することと、
前記単一の点群から既知の背景ピクセルを除去して、変更された単一の点群を作成することと、
前記変更された単一の点群における前記奥行き情報及び前記RGBデータを前記シーンに存在する商品にクラスタ化して、クラスタ化された単一の点群を作成することであって、各クラスタが、前記シーンに存在する固有の商品に関連付けられている、作成することと、
前記クラスタ化された単一の点群からの各クラスタを使用して、前記クラスタ化された単一の点群から前記対応する商品についての少なくとも前記RGBデータを処理することによって、前記画像から画像パッチを関連付け、前記画像の対応する1つが可視の所定の商品の一部を有するときに、少なくとも前記RGBデータから、関連する画像パッチの各群に対する前記商品コードを識別することによって、各商品の商品コードを識別することと、
顧客に関連付けられた取引に前記商品コードを提供することと、を含む、方法。
【請求項2】
取得することが、器具に取り付けられたカメラから前記画像を取得することを更に含み、前記器具がカート又はバスケットである、請求項1に記載の方法。
【請求項3】
取得することが、カメラから前記画像を取得することを更に含み、前記カメラが、静止しており、かつ取引端末と関連付けられた取引領域に隣接している、請求項1に記載の方法。
【請求項4】
取得することが、奥行きカメラから前記画像を取得することを更に含み、前記奥行きカメラが、静止しているか、器具に取り付けられているか、又は静止していることと前記器具に取り付けられていることとの組み合わせである、請求項1に記載の方法。
【請求項5】
抽出することが、前記画像に関連付けられたメタデータから、前記奥行き情報及び前記RGBデータを取得することを更に含む、請求項4に記載の方法。
【請求項6】
アセンブルすることが、各点群を、異なる角度で異なる視点から撮影された前記指定された領域の異なる三次元ビューとして識別することを更に含む、請求項5に記載の方法。
【請求項7】
同期化することが、前記対応する異なる角度及び前記対応する異なる視点を使用することによって識別される前記指定された領域内の位置に基づいて、各異なる三次元ビューについての前記奥行き情報及び前記RGBデータを前記単一の点群にパッチングすることを更に含む、請求項6に記載の方法。
【請求項8】
除去することが、前記商品のいずれも存在しないときに、前記奥行きカメラの各々によって前記指定された領域から撮影されたモデル背景画像を使用することと、前記モデル背景画像を前記単一の点群から減算して、前記変更された単一の点群を取得することと、を更に含む、請求項7に記載の方法。
【請求項9】
クラスタ化することが、各クラスタの周りに三次元バウンディングボックスを配置して、前記指定された領域内の各商品を識別することを更に含む、請求項8に記載の方法。
【請求項10】
クラスタ化することが、前記変更された単一の点群内の各バウンディングボックスをカウントして、前記指定された領域内に存在する合計商品数を取得することを更に含む、請求項9に記載の方法。
【請求項11】
提供することが、前記取引について、前記商品に関連付けられた前記商品コードとともに前記合計商品数を提供することを更に含む、請求項10に記載の方法。
【請求項12】
方法であって、
監視されるゾーン内の異なる位置に位置し、前記監視されるゾーン内の異なる角度で配向された奥行きカメラから、前記監視されるゾーン内の商品の画像を取得することと、
前記画像に対して点群を生成することであって、各点群が、前記監視されるゾーンの前記商品に対する、及び背景物体に対する前記対応する画像において提供される、奥行き情報及び赤色、緑色、青色(RGB)データを含む、生成することと、
前記監視されるゾーンの各画像に関連付けられた前記異なる位置及び前記異なる角度を使用して、前記対応する奥行き情報及び前記RGBデータを前記単一の点群にパッチング及びマッピングすることによって、前記点群を単一の点群に同期化することと、
前記単一の点群から、前記背景物体に対応する前記奥行き情報及び前記RGBデータを除去することと、
残りの奥行き情報及びRGBデータをクラスタにクラスタ化することであって、各クラスタが、特定の商品に関連付けられている、クラスタ化することと、
各クラスタの周りにバウンディングボックスを配置することと、
前記単一の点群内の前記クラスタをカウントすることによって、合計商品数を取得することと、
各クラスタに対する前記対応するRGBデータを訓練された機械学習モジュール(MLM)に渡すことによって、各商品に対する商品コードを識別することであって、前記各クラスタに対する前記対応する及び関連RGBデータを前記画像から前記訓練されたMLMに渡し、前記訓練されたMLMから前記対応する商品コードに対する信頼値とともに各商品コードを受信することによって、各商品に対する商品コードを識別することと、
顧客と関連付けられる取引について、前記商品コード及び前記合計商品数を取引マネージャに提供することと、を含む、方法。
【請求項13】
識別することが、各クラスタに対する前記対応する奥行き情報を前記訓練されたMLMに渡すことを更に含む、請求項12に記載の方法。
【請求項14】
前記対応する奥行き情報を渡すことが、前記訓練されたMLMから少なくとも1つの商品コードのサイズを受信することを更に含む、請求項13に記載の方法。
【請求項15】
識別することが、各信頼値を閾値と比較することを更に含む、請求項12に記載の方法。
【請求項16】
提供することが、前記閾値を下回る対応する信頼値を有する任意の商品コードについて、前記取引マネージャに通知を提供することを更に含む、請求項15に記載の方法。
【請求項17】
提供することが、前記閾値を下回る前記対応する信頼値を有する前記商品コードの各々について、前記取引マネージャに対応するクラスタに関連する画像の一部分を提供することを更に含む、請求項16に記載の方法。
【請求項18】
提供することが、前記商品コードの第2の閾値超が、前記閾値を下回る前記対応する信頼値と関連付けられるときに、前記取引マネージャに、前記取引に監査のフラグを付けるように要求することを更に含む、請求項16に記載の方法。
【請求項19】
システムであって、
複数の奥行きカメラと、
少なくとも1つのプロセッサ及び非一時的コンピュータ可読記憶媒体を備える、サーバと、を備え、
前記非一時的コンピュータ可読記憶媒体が、実行可能な命令を含み、
前記非一時的コンピュータ可読記憶媒体からの前記実行可能な命令が、前記少なくとも1つのプロセッサによって実行されたときに、前記少なくとも1つのプロセッサに、
指定された領域の前記奥行きカメラによって捕捉された画像を取得することであって、前記指定された領域が、顧客の取引における商品を含む、取得することと、
各画像の奥行き情報及び赤、緑、青(RGB)データを点群にマッピングすることと、
各点群を、前記指定された領域の前記画像からの単一の三次元画像を表す単一の点群にパッチングすることと、
前記単一の三次元画像に関連付けられた背景ピクセルデータを除去することと、
前記単一の三次元画像に対応する前記奥行き情報及び前記RGBデータを、除去された前記背景ピクセルデータとともにクラスタにクラスタ化することであって、各クラスタが前記商品のうちの単一の1つを表す、クラスタ化することと、
前記単一の三次元画像内の前記クラスタをカウントすることによって、合計商品数を取得することと、
各クラスタの周りに三次元バウンディングボックスを配置することと、
前記単一の三次元画像を、前記三次元バウンディングボックスが識別された状態で、訓練された機械学習モデル(MLM)に渡すことと、
前記バウンディングボックスの各々に対して、信頼値とともに、前記訓練されたMLMから出力として商品コードを受信することと、
前記顧客のために前記取引を処理している取引マネージャに、閾値を満たすか又はそれを超える、対応する信頼値に関連付けられた前記商品コードを提供することと、
前記閾値を下回る対応する信頼値を有する、少なくとも1つの商品コードに関連付けられた前記画像から少なくとも1つの画像をトリミングすること、及び前記顧客が、前記指定された領域における前記商品をスキャンすること、又は再構成することによって、前記商品が、前記指定された領域の新しい画像を撮影するために前記奥行きカメラのための前記画像の取得に逆戻りする前記指定された領域に再構成されるときに、前記顧客が、前記対応する商品コードを識別するべきであることを示す警告を前記取引マネージャに送信することと、を含む動作を実行させる、システム。
【請求項20】
前記奥行きカメラが、バスケット、又は前記顧客によって運ばれるカートに取り付けられているか、又は前記奥行きカメラが、前記顧客が前記取引を行っている取引端末に関連付けられた取引領域に取り付けられているか、若しくはそれを取り囲み、前記取引領域の一部が、前記指定された領域を含む、請求項19に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、小売店等におけるPOSシステムによる購入商品の識別と清算処理に関する。
【背景技術】
【0002】
商品の画像数が少なく、画像のいくつかが商品を遮蔽する場合、商品の認識自体が困難な作業である。画像内に存在する商品のより多くの遮蔽(商品は互いに前に配置することができる)など、多くの理由から、複数商品の認識は更に困難である。実際には、一度に多くの商品を1つの領域に配置することは、必然的に一部の商品が他の商品の表示を妨害することにつながる。たとえ画像に商品が部分的に見えても、その商品を識別するキーが見えなくなったりブロックされたりする場合がある。
【0003】
多くの小売業者は、顧客に様々な形式の精算を提供している。例えば、レジ係が補助する精算では、顧客がコンベヤーベルトに商品を載置することができ、レジ係は各商品をスキャン又は入力し、販売時点(POS)端末を操作しながら精算のために顧客から支払いを受ける。セルフサービス端末(SST)では、顧客が自分の商品のバーコードをスキャン又は入力し、セルフ精算の支払いを行うことができる。いくつかの小売業者では、顧客が商品のバーコードをスキャン又は入力する際に、顧客が携帯アプリケーションを使用して買い物をし、精算のために携帯アプリケーションを介してのSST、POS端末のいずれかで支払うことを可能にする。
【0004】
業界の目標は、カメラとセンサが顧客を店内のアカウントと関連付け、顧客がピックアップした商品を監視し、カメラの画像から商品を認識し、顧客が店を去るときに顧客の取引に対する支払いを請求し、フリクションレス精算を可能にすることである。
【0005】
フリクションレスショッピングはまた、顧客の手又は他の商品が商品を遮蔽し、商品が顧客のバッグ又はバスケット内の他の商品に積み重ねられて、商品の良い画像が商品を識別するために取得できない場合があるため、遮蔽問題も発生する。
【0006】
コンビニエンスストアは、通常、小さなバスケットを有し、精算は、店員によって操作される販売時点(POS)端末で、買い物客が商品コード(UPC)を入力又はスキャンするのを支援するのを可能とする店員を必要とする。残念なことに、コンビニエンスストアには、買い物客が自分の商品を、セルフ精算を行うことができる、セルフサービス端末(SST)を設置するための物理的なスペースがない。
【0007】
その結果、コンビニエンスストアは、1つ又は2つの列に並んでいる買い物客と、店員とが、精算に非常に忙しい状態になる可能性がある。あまり必要のない商品をいくつか購入している一部の買い物客は、購入せずに商品を置き、店を出ることを選択する可能性がある。これらの状況は、各取引の平均購入商品数が少ない、大量の取引に依存する、小さなコミュニティベースのコンビニエンスストアにとって問題となり得る。
【発明の概要】
【0008】
様々な実施形態において、精算中の複数商品の製品認識のためのシステム及び方法を提示する。
【0009】
一実施形態によれば、精算中の複数商品の製品認識のための方法が提供される。シーンの複数の異なる画像が、指定された領域に対して取得される。奥行き情報及び赤、緑、青(RGB)データは、各画像から抽出される。点群は、奥行き情報及びRGBデータを使用して、各画像に対してアセンブルされる。各画像の点群は、単一の点群にアセンブルされ、既知の背景ピクセルは、単一の点群から除去され、変更された単一の点群を作成する。変更された単一の点群の奥行き情報及びRGBデータは、シーン内に存在する商品にクラスタ化され、クラスタ化された単一の点群を作成するが、各クラスタは、シーン内に存在する固有の商品に関連付けられている。商品コードは、クラスタ化された単一の点群の各クラスタからの対応する商品に関連付けられた少なくともRGBデータを処理することによって、各商品に対して識別される。商品コードは、顧客に関連付けられた取引に対して、提供される。
【図面の簡単な説明】
【0010】
図1】例示的な実施形態による、精算中の複数商品の製品認識のためのシステムの図である。
図2】例示的な実施形態による、精算中の複数商品の製品認識のための方法の図である。
図3】例示的な実施形態による、精算中の複数商品の製品認識のための別の方法の図である。
【発明を実施するための形態】
【0011】
図1は、例示的な実施形態による、精算中の複数商品の製品認識のためのシステム100の図である。構成要素が、例示される実施形態の理解に関連する構成要素のみを有して大幅に単純化された形態で概略的に示されていることに留意されたい。
【0012】
更に、(システム/プラットフォーム100で識別される)様々な構成要素を例示し、構成要素の配置は例示のみを目的として提示する。本明細書中、以下に示す、精算のための複数商品の製品認識の技術から逸脱することなく、より多くの、又はより少ない構成要素の他の配置が可能であることに留意するべきである。
【0013】
本明細書で使用される場合、「シーン」は、顧客のセット又は複数商品が、複数の異なる角度で撮影された複数の画像を通して監視されている、定義された領域を指す。複数商品は、静止されていてもよく、又はバスケット、カート、手と腕、若しくは袋の中で顧客とともに移動していてもよい。領域は、任意の所定の形状、所定のサイズ、及び所定の寸法とすることができる。
【0014】
システム100は、シーン内の同じタイプの複数の異なるタイプのカメラ120又はカメラ130によって、異なる角度で捕捉された商品(製品)の複数の画像を可能にする、様々な構成要素を示す。商品は、バスケットの中に一緒に配置され、カートの中にあり、顧客によって保持され、及び/又はシーンの画像が捕捉されて、クラウド/サーバ110に提供されるときにカウンタトップ上に配置されてもよい。カメラ120及び/又は130によって返された奥行き情報、及びカメラ120及び/又は130によって返された赤色、緑色、青色(RGB)色データは、各カメラ120又は130によって捕捉されたシーンを表す点群を生成するために使用される。
【0015】
次に、点群を整列させ、同期化して、シーンの単一の点群を作成するのは、各別個のカメラ120又は130が、シーンに予めマッピングされた視野を有し、各カメラ120又は130のレンズは、シーンから予め設定された角度及び距離にあるためである。これにより、シーン内の各商品の奥行き情報とRGBデータを、シーン内の所定の位置に関連付けることができ、また、単一の点群内に統合された各商品の奥行き情報とRGBデータを関連付けることができる。シーンに関連付けられた既知の背景ピクセルは、単一の点群に残る全てがシーン内の商品についての奥行き情報とRGBデータになるように除去される。
【0016】
奥行き情報とRGBデータは、シーン内の近さ(他の奥行き情報とRGBデータとの間の近さ/距離)に基づいて、一緒にクラスタ化される。シーン内の商品の合計数は、奥行き情報とRGBデータに関連付けられたクラスタの数に基づいてカウントされる。三次元(3D)バウンディングボックスが、個々の商品(クラスタ)の周りに配置される。各3Dバウンディングボックス内の各クラスタは、シーン内の各画像の3D画像を縫合することを表す。ピクセルデータ(奥行き情報におけるRGBデータ及び/又はグレースケールの奥行きピクセルデータであることができる)は、各クラスタ(点群内の各一意な商品)に関連付けられ、かつ小売業者の製品カタログからの特定の商品コードに所与の商品が関連付けられているパーセンテージとして信頼レベルを出力する、訓練された機械学習モデルへの入力として提供される。点群内の点のクラスタの各々の位置を取得し、対応する2D RGB画像と関連付けることができるため、各商品を全ての画像又はカメラビューにわたって関連付けることができる。そのため、点群内の任意の所与のクラスタに対する商品コードを判定する際に、単一の商品の複数のビューが考慮される。
【0017】
本質的に、オペレーションのパイプラインは、シーンの複数の画像上で行われ、シーンは、シーン内に配置された複数の商品を含む。複数の商品に対する合計商品数の精度と、複数の商品のそれぞれに対する商品認識は、オペレーションのパイプラインを処理することによって改善される。
【0018】
ここで、様々な実施形態が、図1を参照して非常に詳細に論じられる。
【0019】
システム100は、クラウド/サーバ110、店舗内カメラ120、器具取り付けカメラ130、1つ以上の小売サーバ140、取引端末150、及びユーザが操作するデバイス160を含む。
【0020】
クラウド/サーバ110は、プロセッサ111、及び非一時的コンピュータ可読記憶媒体112を備える。媒体112は、奥行き/RGBマネージャ113、画像点群マネージャ114、点群シンクロナイザ115、背景マネージャ116、バウンディングボックスマネージャ117、機械学習(ML)モデル(MLM)、118、及び複数商品管理119に対する実行可能な命令を含む。実行可能な命令は、媒体112からのプロセッサ111によって提供又は取得されたとき、プロセッサ111に、113~119に関して本明細書で論じる動作を実行させる。
【0021】
店舗内カメラ120は、端末150の取引領域の頭上に位置する、及び/又は端末150に関連付けられたサイドカウンタトップに沿って位置する頭上カメラなど、店舗全体に配置された静止カメラであってもよい。
【0022】
器具取り付けカメラ130は、バスケット及びカートの側面に取り付けられてもよい。カート又はバスケット用の1つのカメラ130は、カート又はバスケットの上部縁に沿って配置され、バスケット又はカートの中に下向きに向けられてもよい。カート又はバスケット用の他のカメラ130は、カート又はバスケットの中に焦点を置いたカート又はバスケットの2つ以上の側部に取り付けられ得る。
【0023】
一実施形態では、以下に論じる実施形態に、器具取り付けカメラ130のみが使用される。
【0024】
一実施形態では、以下に論じる実施形態に、店舗内カメラ120のみが使用される。
【0025】
一実施形態では、以下に論じる実施形態に、店舗内カメラと器具取り付けカメラ130との組み合わせが使用される。
【0026】
一実施形態では、以下に論じる実施形態に、3台のカメラ120及び/又は130が使用される。
【0027】
一実施形態では、以下に論じる実施形態に、4台のカメラ120及び/又は130が使用される。
【0028】
一実施形態では、以下に論じる実施形態に、5台以上のカメラ120及び/又は130が使用される。
【0029】
一実施形態では、カメラ120及び/又は130のうちの1つ又は全てが、奥行きカメラである。
【0030】
各小売サーバ140は、少なくとも1つのプロセッサ141と非一時的コンピュータ可読記憶媒体142とを備える。媒体142は、取引マネージャ143に対する実行可能な命令を含む。実行可能な命令は、媒体142からプロセッサ141によって提供又は取得されたとき、プロセッサ141に、143に関して本明細書で論じる動作を実行させる。
【0031】
各小売サーバ150は、少なくとも1つのプロセッサ151と非一時的コンピュータ可読記憶媒体152とを備える。媒体152は、取引マネージャ153に対する実行可能な命令を含む。実行可能な命令は、媒体152からプロセッサ151によって提供又は取得されたとき、プロセッサ151に、153に関して本明細書で論じる動作を実行させる。
【0032】
各ユーザ操作デバイス160は、少なくとも1つのプロセッサ161と非一時的コンピュータ可読記憶媒体162とを備える。媒体162は、小売アプリケーション(app)163に対する実行可能な命令を含む。実行可能な命令は、媒体162からプロセッサ161によって提供又は取得されたとき、プロセッサ161に、163に関して本明細書で論じる動作を実行させる。
【0033】
複数の商品又は製品が、カメラ120及び130が焦点を当てて、指定された領域からの商品のシーンを捕捉するために、指定された領域に配置される。指定された領域は、端末150に関連付けられた取引領域のカウンタトップなど、静止であってもよく、又は指定された領域は、器具取り付けカメラ130を装備しているカート(1つのタイプの器具)又はバスケット(別のタイプの器具)に配置されている商品を有する顧客とともに移動してもよい。
【0034】
画像は、カメラ120及び/又は130から複数商品マネージャ119に直接ストリーミングされ、カメラ120及び/又は130によって、複数商品マネージャ119が監視するネットワークアクセス可能なファイル位置のストレージに直接ストリーミングされる。シーンの画像は、多商品マネージャ119から奥行き/RGBマネージャ113によって提供され、各商品の奥行き情報及び各商品のRGBデータを抽出する。商品のシーンの奥行き情報及び商品のシーンのRGBデータは、画像点群マネージャ114に直接パイプされる。
【0035】
画像点群マネージャ114は、各画像の抽出された奥行き情報及びRGBデータを含む、各カメラ120及び/又は130によって撮影された各画像についての点群を作成する。商品の単一のシーンの点群は、点群シンクロナイザ115に直接パイプされる。
【0036】
点群シンクロナイザ115は、各カメラ120及び/又は130に関連付けられた既知の情報(カメラ角度、シーンの指定された領域の表面へのカメラ距離、カメラ品質(インチ当たりのピクセルの密度)など)を使用して、個々の奥行き情報と、単一の点群にパッチされてアセンブルされた各画像のRGBデータを含む、シーンの同期化又はマッピングされた単一の点群を生成する。シンクロナイザ115は、全てのカメラ120及び130の点群からの全ての奥行き情報とRGBデータを単一のパッチ付き点群に統合する。単一の点群は、その後、背景マネージャ116にパイプされる。
【0037】
一実施形態では、全てのカメラ120及び/130の画像を単一のパッチ付き点群にリンクするために、点群シンクロナイザ115は、所与のカメラの座標を、シーンの指定された領域に関連付けられた現実世界の座標に整列させる変換行列を利用する。
【0038】
背景マネージャ116は、各カメラ120及び130によって捕捉される画像データについて訓練され、例えば、カート又はバスケットに関連付けられたワイヤ又はプラスチック、フロアに関連付けられたフロアリング、背景であることが知られているカウンタトップの表面に関連付けられたカウンタトップ、背景であることが知られている棚の表面に関連付けられた棚など、シーンの既知の背景について、既知の背景ピクセルデータを識別及び除去する。除去された背景ピクセルを有する単一の点群は、その後、背景マネージャ117にパイプされる。
【0039】
バウンディングボックスマネージャ117は、単一の点群のシーンの残りの奥行き情報とRGBデータに対してクラスタ化アルゴリズムを実行する。これにより、各個々のカメラ120及び/又は130が寄与したコンポーネント点群が関連付けられる。バウンディングボックスマネージャ117は、各クラスタの周りにバウンディングボックスを作成し、指定された領域のシーンにおいて商品ごとに単一のバウンディングボックスをもたらす。各商品の3Dバウンディングボックスを使用して、各商品が可視である各2D RGB画像に2Dバウンディングボックスを作成できる。
【0040】
複数商品マネージャ119は、単一の点群内のバウンディングボックスの数をカウントする。カウントは、シーン内に存在する商品の数と等しく、対応するバウンディングボックス内のRGBデータは、シーン内に存在する各商品の商品認識のために、訓練されたMLM118に個別に供給される。
【0041】
一実施形態では、単一の点群から供給されるRGBデータは、MLM118に供給される。単一の点群は、元の2D RGB画像の中の各商品がどこにあるかを識別するために処理される。元の画像の各々に対して2Dバウンディングボックスが作成され、画像の各々がMLM118に供給される。各画像パッチ(元の画像における2Dバウンディングボックスによって識別される)は、MLM118から独自の商品コード割り当て及び信頼値を受け取る。各商品の各パッチ(候補商品コード)の出力は、「投票」とみなされる。画像の所与の1つにおける所与の商品パスが、異なる商品コードを受信するか、又は全体的な平均信頼度が閾値を下回る場合、元のRGB画像におけるその2Dバウンディングボックスに関連付けられた対応するパッチは、決定的ではないとみなされる。投票からの平均信頼度値が閾値を超えると、元のRGB画像に表示されるパッチに対応する商品コードが割り当てられる。
【0042】
MLM118は、MLM118の信頼性が商品予測においてどのくらいかを識別する、各バウンディングボックスに対する信頼係数を返す。商品予測は、サーバ140に関連付けられた小売業者のカタログ内の所定の商品に関連付けられた商品コードである。信頼係数が所定のパーセンテージを超えると、複数商品マネージャ119は、対応する商品コードを、シーンの単一の点群の対応するバウンディングボックスに割り当てる。
【0043】
複数商品マネージャ118は、アプリケーションプログラミングインターフェース(API)を使用して、シーン内の各商品の各商品コードを取引マネージャ143及び/又は取引マネージャ153に提供する。取引マネージャ143及び/又は153は、取引の詳細を識別し、顧客からの支払いを要求し、及び/又はセキュリティのために、複数商品マネージャ118によって提供された商品コードが、顧客取引のセキュリティアラート又は監査を提起する目的で、入力又はスキャンされた商品コードと一致することを確認するなど、顧客の精算中の様々な目的のために商品コードを使用し得る。
【0044】
顧客が小売アプリ163を使用して店舗のセルフショッピング及び精算を行っている場合、小売アプリは取引マネージャ143とやりとりし、取引マネージャ143は、マネージャ118によって提供された商品コードを記録し、商品価格及び商品説明を取得し、顧客が、顧客のカート又はバスケットに現在あるものを、顧客がいつでも精算できるオプションとともに、選択することができるアプリ163内のオプションを維持する。
【0045】
一実施形態では、システム100は、レジ係によって操作されるPOS端末である端末150での精算中の商品バーコードのスキャンを排除することを可能にし、顧客が操作するSSTである端末150でのセルフ精算中の商品バーコードのスキャンを排除することを可能にする。更に、システム100は、顧客が小売アプリ163を使用している場合に、商品バーコードの顧客が自己スキャンを排除することを可能にし、むしろ、顧客は、その取引のために目的の商品をカート又はバスケットに入れるだけで、商品コードは、上述した方式で、システム100によって自動的に解決される。
【0046】
一実施形態では、MLM118はまた、RGBデータとともに、各バウンデット商品の奥行き情報について訓練される。このようにして、MLM118は、12又は16オンスのCoke(登録商標)から8オンスのCoke(登録商標)のボトルを区別するなど、同じタイプの異なるサイズの商品を識別できる。
【0047】
実施形態では、シーン内の所与の商品に対してMLM118によって返された所与の商品信頼値が、所定の閾値を下回ると、複数商品マネージャ119は、1つの商品がカウントされておらず、識別できないことを示すメッセージを取引マネージャ143又は取引マネージャ153に送信する。低信頼値に関連付けられた商品コードは、識別されなかった商品についてレジ係又は顧客に提示するための提案として、メッセージ内にも提供され得る。取引マネージャ143又は153は、商品を識別し適切に記録できるように、警告を使用して、取引が係員によって監査されるようにすることができる。バウンディングボックスによって判定される商品に関連付けられた元の画像も、顧客が商品を識別するか、又はシステム100が問題となっている商品を再試行して識別するためのシーンの指定された領域上の商品を再配置する要求とともに、メッセージで提供され得る。
【0048】
一実施形態では、シーンの指定された領域は、12インチ×16インチであるか、又はコンビニエンスストアでのカート、食品トレー、バスケット、若しくはカウンタトップのサイズにほぼ対応する。
【0049】
一実施形態では、背景ピクセル減算を使用する代わりに、背景マネージャ116は、処理されてシーン内の商品がある場所の「マスク」を作成し、商品がない場所のピクセルを除去する、RGBセグメンテーションモデルを使用する。
【0050】
一実施形態では、MLM118は、クラスタ化されたバウンディングボックスを有する単一の点群がMLM118に提供されるように、3D画像パッチを標識するための深層畳み込みニューラルネットワーク(CNN)であり、MLM118は、各バウンディングボックスを商品コード及びパーセンテージ又は信頼値(MLM118によって対応する商品コードに対して判定された最大値)で標識する。このようにして、各バウンディングボックスの各個々のRGBデータは、個別にMLM118に渡す必要はない。
【0051】
ここで図2~3を参照しながら、これらの実施形態及びその他の実施形態を検討する。
【0052】
図2は、例示的な実施形態による、精算中の複数商品の製品認識のための方法200の図である。方法200を実装するソフトウエアモジュールを「シーン商品識別部」と称する。シーン商品識別部は、プログラムされた実行可能な命令として実装され、メモリ及び/又は非一時的コンピュータ可読(プロセッサ可読)記憶媒体の内部に常駐し、デバイスの1つ以上のプロセッサにより実行される。シーン商品識別部を実行するデバイスのプロセッサは、シーン商品識別部を処理するように具体的に構成され、かつプログラムされる。シーン商品識別部は、その処理中に1つ以上のネットワーク接続にアクセスできる。ネットワーク接続は、有線であっても、無線であっても、有線と無線の組み合わせであってもよい。
【0053】
一実施形態では、シーン商品識別部は、クラウド110上で実行される。一実施形態では、シーン商品識別部は、サーバ110上で実行される。
【0054】
一実施形態では、シーン商品識別部は、113、114、115、116、117、118、及び119の全て又は一部の組み合わせである。
【0055】
210で、シーン商品識別部は、指定された領域に対するシーンの複数の異なる画像を取得する。
【0056】
一実施形態では、211で、シーン商品識別部は、器具に取り付けられたカメラ130から画像を取得する。器具は、カート又はバスケットである。
【0057】
一実施形態では、212で、シーン商品識別部は、カメラ120から、取引端末150に関連付けられた取引領域に隣接して静止している画像を取得する。
【0058】
一実施形態では、213で、シーン商品識別部は、器具に取り付けられた奥行きカメラ130、取引領域に隣接する奥行きカメラ120、又は器具に取り付けられた奥行きカメラ130、及び取引領域に隣接する奥行きカメラ120の組み合わせから画像を取得する。
【0059】
220で、シーン商品識別部は、画像の各々から奥行き情報及びRGBデータを抽出する。
【0060】
213及び220の実施形態では、221で、シーン商品識別部は、画像に関連付けられたメタデータから奥行き情報及びRGBデータを取得する。
【0061】
230で、シーン商品識別部は、奥行き情報及びRGBデータを使用して、各画像の点群をアセンブルする。
【0062】
221及び230の実施形態では、231で、シーン商品識別部は、各点群を、異なる角度で、及び奥行きカメラ120及び/又は130のそれぞれによって異なる視点から撮影された、指定された領域の異なる3Dビューとして識別する。
【0063】
240で、シーン商品識別部は、画像の各々に対する点群を単一の点群に同期化する。
【0064】
231及び240の実施形態では、241で、シーン商品識別部は、対応する異なる角度及び対応する奥行きカメラ120及び/又は130の対応する異なる視点を使用することによって識別される、指定された領域内の位置に基づいて、それぞれの異なる3Dビューの奥行き情報とRGBデータを、単一の点群にパッチする。
【0065】
250で、シーン商品識別部は、既知の背景ピクセルを単一の点群から除去し、変更された単一の点群を作成する。
【0066】
241及び250の実施形態では、251で、シーン商品識別部は、商品のいずれも存在しないときに、奥行きカメラ120及び/又は130の各々によって指定された領域の採られたモデル背景画像を使用する。シーン商品識別部は、背景画像を単一の点群から減算して、変更された単一の点群を取得する。
【0067】
260で、シーン商品識別部は、変更された単一の点群内の奥行き情報とRGBデータを、シーン内に存在する商品にクラスタ化し、クラスタ化された単一の点群を作成する。固有の商品に関連付けられた各クラスタは、指定された領域のシーンに存在する。
【0068】
251及び260の実施形態では、261で、シーン商品識別部は、各クラスタの周りに3Dバウンディングボックスを配置して、指定された領域内の各商品を識別する。
【0069】
261及び262の実施形態では、シーン商品識別部は、クラスタ化された単一の点群内の各バウンディングボックスをカウントして、指定された領域内に存在する合計商品数を取得する。
【0070】
270で、シーン商品識別部は、クラスタ化された単一の点群からの対応する商品のRGBデータを除いて処理することによって、各商品の商品コードを識別する。これは、クラスタ化された単一の点群からの各クラスタを使用して、画像から画像パッチを関連付け、画像の対応する1つが、所与の商品の部分が見えたときに、少なくともRGBデータから、関連する画像パッチの各グループに対する商品コードを特定することによって、クラウドが達成される。別の言い方をすると、クラスタ化した単一の点群は、一緒にクラスタ化し、一緒にパッチを適用して、所与の商品のマルチビューを作成する各商品のRGBデータを含み、単一の点群の中の1つのクラスタの全ての画像パッチは、所与の商品について利用可能な全てのRGBデータを表し、このRGBデータは、元の撮影された画像の周りに2Dバウンディングボックスを作成するために使用され、各画像は、訓練されたMLM118に送られ、その後、各バウンディングボックスを潜在的な商品コード及び値で標識化する。投票アプローチ又は平均信頼値アプローチを使用して、候補商品コードを使用するか否かを判定する。
【0071】
280で、シーン商品識別部は、顧客に関連付けられた取引の商品コードを提供する。
【0072】
262及び280の実施形態では、281で、シーン商品識別部は、取引について、商品に関連付けられた商品コードとともに合計商品数を提供する。
【0073】
図3は、例示的な実施形態による、精算中の複数商品の製品認識のための別の方法300の図である。方法200を実施するソフトウエアモジュールを、「複数商品認識部」と称する。複数商品認識部は、プログラムされた実行可能な命令として実装され、メモリ及び/又は非一時的コンピュータ可読(プロセッサ可読)記憶媒体の内部に常駐し、デバイスの1つ以上のプロセッサにより実行される。複数商品認識部を実行するデバイスのプロセッサは、複数商品認識部を処理するように具体的に構成され、プログラムされる。複数商品認識部は、その処理中に1つ以上のネットワーク接続にアクセスできる。ネットワーク接続は、有線であっても、無線であっても、有線と無線の組み合わせであってもよい。
【0074】
一実施形態では、複数商品認識部を実行するデバイスは、クラウド110である。一実施形態では、複数商品認識部を実行する装置は、サーバ110である。
【0075】
一実施形態では、複数商品認識部は、113、114、115、116、117、118、119、及び/又は方法200の全て又は一部の組み合わせである。
【0076】
310で、複数商品認識部は、監視対象ゾーン内の異なる位置に位置し、監視対象ゾーン内の異なる角度で配向された、奥行きカメラ120及び/又は130から、監視対象ゾーン内の商品の画像を取得する。
【0077】
320で、複数商品認識部は、画像に対して点群を生成するが、各点群は、奥行き情報、及び商品及び監視されるゾーンの背景物体に対して対応する画像に提供されるRGBデータを含む。
【0078】
330で、複数商品認識部は、監視されるゾーンの各画像に関連付けられた異なる位置及び異なる角度を使用して、対応する奥行き情報及びRGBデータをパッチングすること及びマッピングすることによって、点群を単一の点群に同期化する。
【0079】
340で、奥行き情報及び背景物体に対応するRGBデータを単一の点群から除去する。
【0080】
350で、複数商品認識部は、残りの奥行き情報及びRGBデータをクラスタの中にクラスタ化するが、各クラスタは特定の商品に関連付けられている。
【0081】
360で、複数商品認識部は、各クラスタの周りにバウンディングボックスを配置する。
【0082】
370で、複数商品認識部は、単一の点群内のクラスタをカウントすることによって、合計商品数を取得する。
【0083】
380で、複数商品認識部は、各クラスタの対応するRGBデータを訓練されたMLM118に渡し、対応する商品コードに対する信頼値とともに訓練されたMLM118から各商品コードを受信することによって、各商品の商品コードを識別する。
【0084】
一実施形態では、381で、複数の商品認識部は、各クラスタについての対応する奥行き情報を、訓練されたMLM118に渡す。
【0085】
381及び382の実施形態では、複数の商品認識部は、対応する奥行き情報に応答して、訓練されたMLM118から少なくとも1つの商品コードのサイズを受け取る。
【0086】
一実施形態では、383で、複数商品認識部は、各信頼値を閾値と比較する。
【0087】
390で、複数の商品認識部は、商品コード及び合計商品数を、顧客に関連付けられた取引について取引マネージャ143又は153に提供する。
【0088】
383及び390の実施形態では、391で、複数の商品認識部は、閾値を下回る対応する信頼値を有する任意の商品コードについて、取引マネージャ143/153に通知を提供する。
【0089】
391及び392の実施形態では、複数商品認識部は、閾値を下回る対応する信頼値を有する商品コードの各々に対して、対応するクラスタに関連付けられた画像の一部分を取引マネージャ143/153に提供する。
【0090】
391及び392の実施形態では、複数商品認識部は、商品コードの第2の閾値を超えると、閾値を下回る対応する信頼値と関連付けられるときに、取引マネージャ143/153に、監査のための取引にフラグを付けるように要求する。
【0091】
ソフトウエアが特定の形態(構成要素又はモジュールなど)で説明されている場合、それは単に理解を助けるためであり、それらの機能を実施するソフトウエアがどのように設計されるか、あるいはどのような構造であるかを限定するものではないことが理解される。例えば、モジュールは別個のモジュールとして説明されているが、同種のコードとして、個別の構成要素として実施されてもよく、またこうしたモジュールの全体でなく一部を組み合わせてもよく、その他の任意の都合の良い方法で構造化されたソフトウエア内で機能が実施されてもよい。
【0092】
更に、ソフトウエアモジュールは、1つのハードウエア上で実行されるものとして説明されているが、ソフトウエアは、複数のプロセッサにまたがる、又はその他の任意の都合の良い方法で分布されてもよい。
【0093】
上述の説明は、例証的なものであって制限的なものではない。当業者には、上述の説明を検討することにより、その他の数多くの実施形態が明らかとなるであろう。したがって、実施形態の範囲は、これらの請求項が権利を持つ均等物の完全な範囲とともに、添付の請求項を参照して、決定されるべきである。
【0094】
実施形態についての上述の説明では、開示を合理化する目的で様々な特徴が単一の実施形態でひとまとめにされている。この開示方法は、請求された実施形態が、各請求項で明示的に詳述されるものよりも多くの特徴を有することを反映するとは解釈されない。むしろ、下記の請求項で反映されるとおり、発明の主題は、単一の開示された実施形態の全ての特徴よりも少ない。したがって、これによって、以下の特許請求の範囲は、実施形態の説明に組み込まれ、各特許請求の範囲は、それ自体を別個の例示的な実施形態として主張する。
図1
図2
図3