特表2024-536091 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ メープルベアインコーポレイテッドの特許一覧

特表2024-536091アイテム認識のためのシステム及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-10-04

(54)【発明の名称】アイテム認識のためのシステム及び方法

(51)【国際特許分類】

G06Q 30/06 20230101AFI20240927BHJP

G06T 7/70 20170101ALI20240927BHJP

G06V 10/82 20220101ALI20240927BHJP

G06T 7/00 20170101ALI20240927BHJP

G06V 10/764 20220101ALI20240927BHJP

G06V 20/60 20220101ALI20240927BHJP

G07G 1/00 20060101ALI20240927BHJP

【ＦＩ】

G06Q30/06

G06T7/70 Z

G06V10/82

G06T7/00 350C

G06V10/764

G06T7/00 300F

G06V20/60

G07G1/00 331C

G07G1/00 311D

G07G1/00 311E

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024518782

(86)(22)【出願日】2022-09-22

(85)【翻訳文提出日】2024-03-25

(86)【国際出願番号】 US2022044340

(87)【国際公開番号】W WO2023049239

(87)【国際公開日】2023-03-30

(31)【優先権主張番号】202111110492.6

(32)【優先日】2021-09-23

(33)【優先権主張国・地域又は機関】CN

(81)【指定国・地域】

(71)【出願人】

【識別番号】524113231

【氏名又は名称】メープルベアインコーポレイテッド

(74)【代理人】

【識別番号】110001243

【氏名又は名称】弁理士法人谷・阿部特許事務所

(72)【発明者】

【氏名】シーユエンヤン

(72)【発明者】

【氏名】リンガオ

(72)【発明者】

【氏名】ユーフォンホー

(72)【発明者】

【氏名】シアオジョウ

(72)【発明者】

【氏名】イーリンホアン

(72)【発明者】

【氏名】グリフィンケリー

(72)【発明者】

【氏名】イサベルサイ

(72)【発明者】

【氏名】アフマドベシュリー

【テーマコード（参考）】

3E142

5L030

5L096

【Ｆターム（参考）】

3E142AA01

3E142BA01

3E142EA04

3E142FA41

3E142GA02

3E142GA22

3E142GA32

3E142GA41

3E142JA01

5L030BB21

5L096AA06

5L096BA17

5L096CA02

5L096DA01

5L096EA03

5L096EA05

5L096EA39

5L096FA16

5L096FA67

5L096FA69

5L096GA10

5L096GA30

5L096GA51

5L096HA11

5L096JA03

5L096JA11

5L096KA04

(57)【要約】

カメラ、重量センサ、及びプロセッサを有するセルフチェックアウト車両を備えるセルフチェックアウト車両システム及び方法は、（ｉ）コンピュータビジョンを介して、買い物客が選択した商品アイテムを、選択されたアイテムに付加された識別子に基づいて識別し、（ｉｉ）選択されたアイテムの識別子及び重量に基づいて商品アイテムの価格を計算するように構成される。買い物客によって選択された商品を識別するコンピュータビジョンシステム及び方法は、（ｉ）選択された商品に付けられた識別子及び選択された商品のアイテムカテゴリを識別し、（ｉｉ）その識別子とそれぞれの画像内で識別されたアイテムカテゴリを比較して、商品の最も可能性の高い識別情報を決定するように構成される。

【特許請求の範囲】

【請求項1】

セルフチェックアウト車両を操作する買い物客によって選択された商品アイテムの１つまたは複数の画像をキャプチャするように構成された１つまたは複数のカメラと、
前記セルフチェックアウト車両に取り付けられ、前記セルフチェックアウト車両に置かれたときに前記選択された商品アイテムの重量を測定するように構成された少なくとも１つの重量センサと、
を有するセルフチェックアウト車両と、
少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサに、コンピュータビジョン技術を使用して前記画像から、前記選択された商品アイテムに付加された識別子に基づいて前記選択された商品アイテムを識別させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するように構成された少なくとも１つのプロセッサと、
を備えたセルフチェックアウト車両システム。

【請求項2】

前記識別子は、グローバルトレードアイテム番号（ＧＴＩＮ）、価格検索（ＰＬＵ）コード、及びバーコードのうちの少なくとも１つを含む、請求項１に記載のセルフチェックアウト車両システム。

【請求項3】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、前記選択された商品アイテムの前記識別子及び前記測定された重量に基づいて、前記商品アイテムの価格を算出させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項１に記載のセルフチェックアウト車両システム。

【請求項4】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、前記選択された商品アイテム及びその価格を前記買い物客によって購入される商品アイテムの実行リストに追加させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項３に記載のセルフチェックアウト車両システム。

【請求項5】

前記カメラの少なくとも１つは、その視野が、前記選択された商品が置かれる前記セルフチェックアウト車両の領域を含むように配置され、配向される、請求項１に記載のセルフチェックアウト車両システム。

【請求項6】

前記視野は、前記重量センサの少なくとも１つをさらに含む、請求項５に記載のセルフチェックアウト車両システム。

【請求項7】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、前記重量センサによって提供される重量測定値を監視させ、商品アイテムが前記セルフチェックアウト車両から取り出されたことを示す測定重量の減少を検出させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項１に記載のセルフチェックアウト車両システム。

【請求項8】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、商品アイテムが前記セルフチェックアウト車両から取り出されたことを示す商品アイテムの移動を検出させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項１に記載のセルフチェックアウト車両システム。

【請求項9】

前記商品アイテムが前記セルフチェックアウト車両から取り出されたことを示す商品アイテムの移動を検出することは、
予め定められたしきい値距離を超えた前記商品アイテムの垂直方向の動きを検出することと、
前記１つまたは複数のカメラによってキャプチャされた画像に前記商品アイテムが存在しないことを検出することであって、前記商品アイテムは、前記１つまたは複数のカメラによって以前にキャプチャされた画像に存在していた、ことと、
の少なくとも１つを含む、請求項８に記載のセルフチェックアウト車両システム。

【請求項10】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、前記商品アイテムの不在を検出する前にキャプチャされた第１の重量測定値と、前記商品アイテムの不在を検出する際に、または検出後にキャプチャされた第２の重量測定値とを比較させ、前記第１の重量測定値と前記第２の重量測定値の差が、最初にセルフチェックアウト車両に置かれたときの前記選択された商品アイテムの測定重量に一致する場合、前記商品アイテムが取り出されたと判定させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項９に記載のセルフチェックアウト車両システム。

【請求項11】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、コンピュータビジョンを使用して前記カメラによってキャプチャされた１つまたは複数の画像から、前記商品アイテムが前記セルフチェックアウト車両から取り出されることを識別させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項７または請求項８に記載のセルフチェックアウト車両システム。

【請求項12】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、前記買い物客が購入する商品アイテムの実行リストから、前記セルフチェックアウト車両から取り出される前記商品アイテムを削除させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項１１に記載のセルフチェックアウト車両システム。

【請求項13】

前記プロセッサは、少なくとも１つのプロセッサによって実行されると、前記プロセッサに、
前記識別子の確率的方向を識別することと、
前記確率的方向に基づいて、前記識別子を所定の方向に向けるために前記識別子を回転させる程度を決定することと、
前記識別子を前記決定された程度まで回転することと、
を実行させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、請求項１に記載のセルフチェックアウト車両システム。

【請求項14】

前記決定された程度まで前記識別子を回転させることにより、前記識別子を任意の向きにして前記選択された商品を前記セルフチェックアウト車両に置くことを可能にする、請求項１３に記載のセルフチェックアウト車両システム。

【請求項15】

商品を識別するコンピュータビジョンシステムであって、
少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサに、
買い物客によって選択された商品の１つまたは複数の画像内で、前記選択された商品に付加された識別子を識別することと、
前記画像のうちの少なくとも１つに基づいて、前記選択された商品のアイテムカテゴリを識別することと、
それぞれの画像内で識別された識別子とアイテムカテゴリを比較して、前記商品の最も可能性の高い識別情報を決定することと、
を実行させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するようにさらに構成される、コンピュータビジョンシステム。

【請求項16】

前記識別子は、グローバルトレードアイテム番号（ＧＴＩＮ）、価格検索（ＰＬＵ）コード、及びバーコードのうちの少なくとも１つを含む、請求項１５に記載のコンピュータビジョンシステム。

【請求項17】

それぞれの画像内で前記識別子を識別することは、
前記識別子を含む前記画像の部分をローカライズすることと、
前記識別子におけるテキストを識別するために、前記識別子を含む前記画像のローカライズされた部分に光学式文字認識（ＯＣＲ）技術またはバーコード認識技術のいずれかを適用することと、
を含む、請求項１５に記載のコンピュータビジョンシステム。

【請求項18】

前記識別子を含む前記それぞれの画像の部分をローカライズすることは、
前記画像における前記識別子の位置を検出することと、
前記検出された位置にて、前記識別子を含む画像のピクセルを、前記選択された商品を含む画像のピクセルから区別することと、
前記識別子を含む画像のピクセルを所定の向きに回転することと、
を含む、請求項１７に記載のコンピュータビジョンシステム。

【請求項19】

前記画像における前記識別子の位置を検出することは、
前記それぞれの画像において、前記識別子が含まれる確率的領域を識別することと、
前記確率的領域を取り囲むバウンディングボックスを生成することと、
を含む、請求項１８に記載のコンピュータビジョンシステム。

【請求項20】

前記識別子を含む画像のピクセルを、前記選択された商品を含む画像のピクセルから区別することは、
前記選択された商品のナイーブアイテムカテゴリを生成することと、
前記位置にある画像のピクセルを前記ナイーブアイテムカテゴリに関連付けられたピクセルと比較することと、
前記ピクセルの比較から、前記ナイーブアイテムカテゴリに関連付けられたピクセルとは異なるピクセルを識別することと、
前記異なるピクセルを前記識別子を含むピクセルとして識別することと、
を含む、請求項１８に記載のコンピュータビジョンシステム。

【請求項21】

前記識別子を含む画像のピクセルを所定の向きに回転することは、
前記画像における前記識別子の確率的方向を識別することと、
前記確率的方向に基づいて、前記識別子を所定の方向に向けるために前記識別子を回転させる度合いを決定することと、
前記識別子を決定された度合いで回転させることと、
を含む、請求項１８に記載のコンピュータビジョンシステム。

【請求項22】

前記識別子におけるテキストを識別するために、前記識別子を含む前記画像のローカライズされた部分に光学式文字認識（ＯＣＲ）技術を適用することは、
テキスト検出器を使用して、前記識別子を含む前記画像のローカライズされた部分のテキストをローカライズすることと、
前記ローカライズされたテキストを所定の向きに回転させることと、
畳み込みニューラルネットワーク（ＣＮＮ）を使用して前記テキストの１つまたは複数の特徴を抽出することと、
コネクショニスト時系列分類（ＣＴＣ）を使用して、全ての可能なテキスト出力にわたる出力分布を生成することと、
を含む、請求項１７に記載のコンピュータビジョンシステム。

【請求項23】

前記出力分布から、可能性の高い出力を推測することと、
可能性の高い出力では任意の繰り返しを折りたたみ、可能性の高い出力では任意のブランクシンボルを除去することによって、前記識別子におけるテキストを識別することと、
をさらに含む、請求項２２に記載のコンピュータビジョンシステム。

【請求項24】

前記出力分布から、所与の出力の確率を評価することと、
最も高い確率を有する出力から前記識別子におけるテキストを識別することと、
をさらに含む、請求項２２に記載のコンピュータビジョンシステム。

【請求項25】

前記識別子におけるテキストを識別するために、前記識別子を含む前記画像のローカライズされた部分に光学式文字認識（ＯＣＲ）技術を適用することは、
テキスト検出器を使用して、前記識別子を含む前記画像のローカライズされた部分のテキストをローカライズすることと、
前記ローカライズされたテキストを所定の向きに回転させることと、
画像二値化及び輪郭検出技術を使用してテキスト内の文字を分割することと、
各文字を認識するためにディープラーニング分類器または機械学習分類器のいずれかを使用して文字のバッチを評価することと、
認識された文字をシーケンスすることと、
を含む、請求項１７に記載のコンピュータビジョンシステム。

【請求項26】

前記選択された商品のアイテムカテゴリを識別することは、
前記選択された商品を含む前記画像の部分をローカライズすることと、
前記画像のローカライズされた部分に示された前記選択された商品の特徴表現を生成することと、
前記選択された商品の特徴表現を、データセット内の複数の利用可能な商品の特徴表現と比較して、選択された商品の特徴表現に最も類似した特徴表現を有する利用可能な商品を識別することと、
を含む、請求項１５に記載のコンピュータビジョンシステム。

【請求項27】

前記画像のローカライズされた部分に示された前記選択された商品の特徴表現を生成することは、前記選択された商品のローカライズされた部分から識別された前記選択された商品の特徴の多次元ベクトルマップを生成することを含み、
前記選択された商品の特徴表現を、データセット内の複数の利用可能な商品の特徴表現と比較して、選択された商品の特徴表現に最も類似した特徴表現を有する利用可能な商品を識別することは、
前記選択された商品の特徴ベクトルと複数の利用可能な商品の特徴ベクトルとの間の距離を計算することと、
その特徴ベクトルと前記選択された商品の特徴ベクトルとの間の最小距離を有する利用可能な商品を識別することと、
を含む、
請求項２６に記載のコンピュータビジョンシステム。

【請求項28】

それぞれの画像内で識別された識別子とアイテムカテゴリを比較して、前記商品の最も可能性の高い識別情報を決定することは、
前記選択された商品アイテムの２つ以上の画像において識別された各識別子に関連付けられるアイテムカテゴリを識別することと、
関連するアイテムカテゴリ及びそれぞれの画像で直接識別されたアイテムカテゴリの中から、最も頻繁に識別されたアイテムカテゴリを選択することと、
他のものよりも頻繁に現れるアイテムカテゴリに基づいて前記商品を識別することと、
を含む、請求項１５に記載のコンピュータビジョンシステム。

【請求項29】

それぞれの画像内で識別された識別子とアイテムカテゴリを比較して、前記商品の最も可能性の高い識別情報を決定することは、
前記選択された商品アイテムの２つ以上の画像において識別された各識別子に関連付けられるアイテムカテゴリを識別することと、
それぞれの関連する商品カテゴリ及び各画像内で直接識別される各商品カテゴリに重み係数を適用することと、
前記適用された重み係数を考慮して、他のものよりも頻繁に現れるアイテムカテゴリに基づいて前記商品を識別することと、
を含む、請求項１５に記載のコンピュータビジョンシステム。

【請求項30】

セルフチェックアウト車両に取り付けられ、選択された商品アイテムが前記セルフチェックアウト車両に置かれたときに前記セルフチェックアウト車両を操作する買い物客によって選択された商品アイテムの重量を測定するように構成された少なくとも１つの重量センサと、
その視野が前記重量センサの少なくとも１つを含むように前記セルフチェックアウト車両に配置され、配向される１つまたは複数のカメラであって、前記１つまたは複数のカメは、少なくとも１つの重量センサ上の前記選択された商品アイテムの１つまたは複数の画像をキャプチャするように構成されている、１つまたは複数のカメラと、
を有するセルフチェックアウト車両と、
少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサに、コンピュータビジョン技術を使用して前記画像から、前記選択された商品アイテムに付加された識別子に基づいて前記選択された商品アイテムを識別させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するように構成された少なくとも１つのプロセッサと、
を備えたセルフチェックアウト車両システム。

【発明の詳細な説明】

【技術分野】

【0001】

本出願は、２０２１年９月２３日に出願された中国特許出願第２０２１１１１１０４９２．６号に対する米国特許法第１１９条に基づく優先権を主張し、その開示は、その全体が参照により本明細書に組み込まれる。

【背景技術】

【0002】

ショッピングは、面倒で、ストレスの多い体験になることもあり得る。現在、商品を購入するには、顧客またはレジ係がショッピングカートから各商品を取り出し、商品のバーコードを見つけて商品をスキャンし、カートに戻す必要がある。レジ係や顧客がバーコードを検索してスキャンする必要があるため、チェックアウトカウンターで長い行列ができる。買い物客は、農産物の価格検索（ＰＬＵ）コードステッカーを見つけるだけでなく、番号を読み取れるように商品を回転させ、販売時点管理（ＰＯＳ）端末にその番号を手動で入力できるようにする必要があるため、このプロセスは、農産物の場合によくあるように、コードを手動で入力する必要がある場合にさらに時間がかかる。また、正しい価格を決定するために農産物の重量を量る必要があり、プロセスがさらに複雑になる。

【0003】

ショッピング体験を向上させるために、いくつかの企業が「スマート」ショッピングカートの導入を開始している。例えば、いくつかの企業は、カートに取り付けられたバーコードスキャナ及び販売時点管理（ＰＯＳ）端末を有し、買い物客がレジ待ち行列で待つことなく自分の商品をスキャンして支払うことを可能にする。さらに、農産物を計量するための内蔵スケールを備えているものもある。それでも、多くのそのようなシステムは、買い物客に、任意の所与の買い物中に上記の幾分厄介で時間のかかるプロセスを何度も通過することを要求する。

【0004】

従って、買い物客によって選択された商品アイテムの価格を自動的に識別、計量、及び計算することができるセルフチェックアウト車両システムが必要である。商品アイテムに付加された識別子の種類（例えば、グローバル取引識別番号（ＧＴＩＮ）、ＰＬＵコード、バーコードなど）に関係なく商品の識別を可能にするセルフチェックアウト車両と組み合わせて使用することができるコンピュータビジョンシステムのさらなる必要性がある。

【発明の概要】

【0005】

一態様では、本開示は、商品アイテムの価格を自動的に識別し、計量し、計算するためのセルフチェックアウト車両システムを対象とする。セルフチェックアウト車両システムは、セルフチェックアウト車両を操作する買い物客によって選択された商品アイテムの１つ以上の画像をキャプチャするように構成された１つ以上のカメラを備え得る、ショッピングカート及び／または搬送ステーションなどのセルフチェックアウト車両を含み得る。様々な実施形態によれば、セルフチェックアウト車両システムは、セルフチェックアウト車両に取り付けられ、セルフチェックアウト車両に置かれたときに選択された商品アイテムの重量を測定するように構成された少なくとも１つの重量センサを含み得る。セルフチェックアウト車両システムは、追加的または代替的に、非一時的媒体に格納されたコンピュータ実行可能命令を取得するように構成された少なくとも１つのプロセッサを含んでもよく、この命令は、少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサに、選択された商品の識別、計量、及び価格の計算のための１つ以上のコンピュータ実行ステップを行わせる。様々な実施形態では、１つ以上のコンピュータ実行ステップ（本明細書では単に「ステップ」とも言う）は、コンピュータビジョン技術を使用して画像から、選択された商品アイテムに付加された識別子に基づいて選択された商品アイテムを識別するステップだけでなく、選択された商品アイテムの識別子及び測定された重量に基づいて、商品アイテムの価格を計算するステップを含む。

【0006】

様々な実施形態によれば、セルフチェックアウト車両システムの少なくとも１つのカメラは、その視野が、選択された商品が置かれるセルフチェックアウト車両の領域を含むように配置され、配向され得る。いくつかの実施形態では、アイテムは、識別され、計量されるために２つの別々の位置に置かれる必要がないように、視野は、重量センサの少なくとも１つを含む。そのステップは、プロセッサに、識別子の確率的方向を識別することと、確率的方向に基づいて、識別子を所定の方向（例えば、表を上にする）に向けるために識別子の画像を回転させる程度を決定することと、識別子の画像を決定された程度まで回転することをさらに実行させる命令を含む。決定された程度まで識別子を回転させることにより、識別子を任意の向きにして選択された商品をセルフチェックアウト車両に置くことを可能にする。様々な実施形態によれば、識別子は、グローバルトレードアイテム番号（ＧＴＩＮ）、価格検索（ＰＬＵ）コード、及びバーコードの少なくとも１つを含む。

【0007】

様々な実施形態では、セルフチェックアウト車両システムは、重量センサによって提供される重量測定値を監視し、商品アイテムがセルフチェックアウト車両から取り出されたことを示す測定重量の減少を検出するようにさらに構成され得る。追加的または代替的に、システムは、商品アイテムがセルフチェックアウト車両から取り出されていることを示す商品アイテムの動きを検出するように構成され得る。例えば、商品アイテムがセルフチェックアウト車両から取り出されたことを示す商品アイテムの動きを検出することは、予め定められたしきい値距離を超えた商品アイテムの垂直方向の動きを検出することと、１つ以上のカメラによってキャプチャされた画像に商品アイテムが存在しないことを検出することであって、当該商品アイテムは、１つ以上のカメラによって以前にキャプチャされた画像に存在していた、ことのうちの少なくとも１つを含み得る。一実施形態では、システムは、商品アイテムの不在を検出する前にキャプチャされた第１の重量測定値と、商品アイテムの不在を検出する際に、または検出後にキャプチャされた第２の重量測定値とを比較し、第１の重量測定値と第２の重量測定値の差が、最初にセルフチェックアウト車両に置かれたときの選択された商品アイテムの測定重量に一致する場合、商品アイテムが取り出されたと判定するように構成され得る。様々な実施形態では、システムは、コンピュータビジョンを使用してカメラによってキャプチャされた１つ以上の画像から、商品アイテムがセルフチェックアウト車両から取り出されたことを識別するように構成され得る。

【0008】

別の態様では、本開示は、商品を識別するコンピュータビジョンシステムを対象とする。コンピュータビジョンシステムは、セルフチェックアウト車両と、非一時的記憶媒体に格納されたコンピュータ実行可能命令を取得するように構成された少なくとも１つのプロセッサとを含み、及び／または共有することができ、命令は、少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサに、（ｉ）買い物客によって選択された商品の１つ以上の画像に、選択された商品に付加された識別子を識別することと、（ｉｉ）少なくとも１つの画像に基づいて、選択された商品のアイテムカテゴリを識別することに向けさせることと、（ｉｉｉ）それぞれの画像において識別された識別子及びアイテムカテゴリを比較して商品の最も可能性の高い識別情報を決定することと、を実行させる。

【0009】

様々な実施形態では、コンピュータビジョンシステムは、識別子を含む画像の部分をローカライズし、及び識別子を定義するテキストを識別するために識別子を含む画像のローカライズされた部分に光学式文字認識（ＯＣＲ）技術を適用することを含み得る。様々な実施形態によれば、命令は、プロセッサに、検出された位置にて識別子を含む画像のピクセルを選択された商品を含む画像のピクセルとは区別すること、及び識別子を含む画像のピクセルを所定の方向に回転させること、のうちの１つ以上を実行させることができる。いくつかの実施形態では、画像における識別子の位置を検出することは、プロセッサが、それぞれの画像において、識別子が含まれる確率的領域を識別し、及び／または確率的領域を取り囲むバウンディングボックスを生成する、ための命令を実行することを備える。

【0010】

識別子を含む画像のピクセルを、選択された商品を含む画像のピクセルから区別することは、様々な実施形態において、プロセッサが、選択された商品のナイーブアイテムカテゴリを生成することと、その位置にある画像のピクセルをナイーブアイテムカテゴリに関連付けられたピクセルと比較することと、ピクセルの比較から、ナイーブアイテムカテゴリに関連付けられたピクセルとは異なるピクセルを識別することと、異なるピクセルを識別子を含むピクセルとして識別することと、のうちの１つまたは複数のステップを実行することを備え得る。いくつかの実施形態では、識別子を含む画像のピクセルを所定の向きに回転することは、プロセッサが、画像における識別子の確率的方向を識別することと、確率的方向に基づいて、識別子を所定の方向に向けるために識別子を回転させる度合いを決定することと、識別子を決定された度合いで回転させることと、のうちの１つ以上のステップを実行することを含む。

【0011】

いくつかの実施形態によれば、識別子を定義するテキストを識別するために、識別子を含む画像のローカライズされた部分に光学式文字認識（ＯＣＲ）技術を適用することは、プロセッサが、テキスト検出器を使用して、識別子を含む画像のローカライズされた部分のテキストをローカライズすることと、ローカライズされたテキストを所定の向きに回転させることと、畳み込みニューラルネットワーク（ＣＮＮ）を使用してテキストの１つまたは複数の特徴を抽出することと、コネクショニスト時系列分類（ＣＴＣ）を使用して、全ての可能なテキスト出力にわたる出力分布を生成することと、のうちの１つまたは複数のステップを実行することを含む。いくつかの実施形態では、コンピュータビジョンシステムは、出力分布から、可能性の高い出力を推測し、及び可能性の高い出力では任意の繰り返しを折りたたみ、可能性の高い出力では任意のブランクシンボルを除去することのうちの１つまたは複数によって、識別子を定義するテキストを識別するコンピュータ実行可能命令を含むことができる。様々な実施形態では、命令は、出力分布から、所与の出力の確率を評価することと、最も高い確率を有する出力から識別子を定義するテキストを識別することと、のうちの１つまたは複数を含むことができる。

【0012】

いくつかの実施形態では、識別子を定義するテキストを識別するために、識別子を含む画像のローカライズされた部分に光学式文字認識（ＯＣＲ）技術を適用することは、プロセッサが、テキスト検出器を使用して、識別子を含む画像のローカライズされた部分のテキストをローカライズすることと、ローカライズされたテキストを所定の向きに回転させることと、画像二値化及び輪郭検出技術を使用してテキスト内の文字を分割することと、各文字を認識するためにディープラーニング分類器または機械学習分類器のいずれかを使用して文字のバッチを評価することと、認識された文字をシーケンスすることと、のうちの１つまたは複数のステップを実行することを含むことができる。選択された商品のアイテムカテゴリを識別することは、プロセッサが、選択された商品を含む画像の部分をローカライズすることと、画像のローカライズされた部分に示された選択された商品の特徴表現を生成することと、選択された商品の特徴表現を、データセット内の複数の利用可能な商品の特徴表現と比較して、選択された商品の特徴表現に最も類似した特徴表現を有する利用可能な商品を識別することと、を含む１つまたは複数のステップを実行することを含むことができる。

【0013】

様々な実施形態において、画像のローカライズされた部分に示された選択された商品の特徴表現を生成することは、プロセッサが、選択された商品のローカライズされた部分から識別された選択された商品の特徴の多次元ベクトルマップを生成することを含む。いくつかの実施形態では、選択された商品の特徴表現を、データセット内の複数の利用可能な商品の特徴表現と比較して、選択された商品の特徴表現に最も類似した特徴表現を有する利用可能な商品を識別することは、プロセッサが、選択された商品の特徴ベクトルと複数の利用可能な商品の特徴ベクトルとの間の距離を計算し、及びその特徴ベクトルと選択された商品の特徴ベクトルとの間の最小距離を有する利用可能な商品を識別するための１つまたは複数の命令を実行することを含む。

【図面の簡単な説明】

【0014】

実例となる非限定的な例示的な実施形態は、添付図面と併せて行われる以下の詳細な説明からより明確に理解されるであろう。

【0015】

【図1】図１は、本開示の様々な実施形態によるセルフチェックアウト車両システムを示す。

【図2】図２は、本開示の様々な実施形態によるセルフチェックアウト車両を示す。

【図3】図３は、本開示の様々な実施形態による、セルフチェックアウト車両システムの様々なソフトウェアモジュール及び関連するアーキテクチャを示す。

【図4】図４は、本開示の様々な実施形態による、コンピュータビジョンシステムの様々なソフトウェアモジュール及び関連するアーキテクチャを示す。

【図5】図５は、本開示の一実施形態による、コンピュータビジョンモジュールにおける主な推論データフローを示す。

【図6】図６は、本開示のいくつかの実施形態による識別子ローカリゼーションモジュールの構成要素を示す。

【図7】図７は、いくつかの実施形態による、識別子ローカリゼーションモジュールの推論パイプラインを示す。

【図8】図８は、本開示のいくつかの実施形態による、識別子ローカリゼーションモジュール内のクラス、ｂｂｏｘｈｅａｄを示す。

【図9】図９は、本開示のいくつかの実施形態による、識別子ローカリゼーションモジュール内のセグメンテーションヘッドを示す。

【図10】図１０は、本開示のいくつかの実施形態による識別子ローカリゼーションモジュール内の回転ヘッドを示す。

【図11】図１１は、本開示の一実施形態による中心周りの回転角の予測を示す。

【図12】図１２は、いくつかの実施形態による、識別子ＯＣＲモジュールの概略を示す。

【図13】図１３は、いくつかの実施形態による、識別子ＯＣＲモジュール内のエンドツーエンドＯＣＲデータフローを示す。

【図14】図１４は、いくつかの実施形態による、テキスト画像特徴を抽出するためにシステムによって使用されるＣＮＮバックボーンを示す。

【図15】図１５は、いくつかの実施形態によるシステムによるＣＴＣの実装を示す。

【図16】図１６は、いくつかの実施形態による推論におけるＣＴＣを示す。

【図17】図１７は、いくつかの実施形態によるＣＴＣ復号の例を示す。

【図18】図１８は、本開示の様々な実施形態によるトレーニング中のＣＴＣを示す。

【図19】図１９は、いくつかの実施形態による、識別子ＯＣＲモジュールにおける従来のＣＶ＋ＭＬのＯＣＲデータフローを示す。

【図20】図２０は、本開示の様々な実施形態によるアイテム埋め込みモジュールのトレーニングフローを示す。

【図21】図２１は、いくつかの実施形態によるアイテム埋め込みモジュールの推論フローを示す。

【図22】図２２は、いくつかの実施形態による結果融合モジュールを示す。

【図23】図２３は、いくつかの実施形態による投票プロセスを示す。

【図24】図２４は、いくつかの実施形態による重み付け投票を示す。

【図25】図２５は、いくつかの実施形態による、投票のための学習重みを示す。

【図26】図２６は、システムのいくつかの実施形態による、システム及び方法を可能にする、またはそれを含むコンピュータシステムを示す。

【発明を実施するための形態】

【0016】

本開示は、買い物客によって選択された商品アイテムの価格を自動的に識別、計量、及び計算するように構成されたセルフチェックアウト車両システムを対象とする。構成されるように、セルフチェックアウト車両システムの実施形態は、多くの方法でショッピング体験を改善することができる。例えば、商品アイテムがショッピングカートに置かれたときに商品アイテムの価格を自動的に識別、計量、及び計算することによって、セルフチェックアウトシステムの実施形態は、買い物客が商品アイテムを単に棚から取り出し、ショッピングカートに置くことを可能にし、商品アイテムをチェックアウトするために１つまたは複数の固定端末（例えば、店舗出口の近くに位置する販売時点管理（ＰＯＳ）端末、及び／または商品を識別及び計量し、ＰＯＳ端末でスキャンされるステッカーを印刷するために使用される端末）に別々に持ち込む必要はない。例えば、様々な実施形態では、セルフチェックアウト車両システムは、買い物客が（ａ）商品アイテムを識別するためのコードを入力する必要がなく、（ｂ）ショッピングカートに入れる前にスケール上で商品アイテムを計量する必要がなく、（ｃ）任意選択で、固定ＰＯＳ端末でスキャンされる商品アイテムの識別子及び重量を記載するラベルを印刷する必要がなく、（ｄ）行列に並んで固定ＰＯＳ端末で支払う必要がないように構成され得る。後でより詳細に説明されるように、これは、より速く、よりスムーズで、より便利なショッピング体験を提供し得る。

【0017】

本開示は、商品アイテムに付加された識別子に基づいて買い物客によって選択された商品アイテムを識別するコンピュータビジョンシステムをさらに対象とする。コンピュータビジョンシステムのいくつかの実施形態は、しばしば、グローバルトレードアイテム番号（ＧＴＩＮ）、製品検索（ＰＬＵ）コード、バーコード、または購入手続きのために農産物アイテムを識別する買い物客またはチェックアウトクラークによって通常スキャンまたは手動で固定端末に入力される商品アイテムを識別する他の手段のうちの１つまたは組み合わせを特徴とするステッカーまたは他のラベルを有する農産物アイテムとの使用に特に適している。本開示のコンピュータビジョンシステムは、革新的なアーキテクチャ及び技術を利用して、ショッピングカートに置かれている間に商品アイテムに貼付されたそのような識別子を見つけて読み取り、それによって、買い物客が買い物を継続したり店を出たりする前に、誰か（例えば、買い物客またはチェックアウトクラーク）がチェックアウトプロセスの一部として識別子を別々にスキャンまたは入力する必要性を回避する。さらに、様々な実施形態では、本コンピュータビジョンシステムは、コンピュータビジョンシステムによってキャプチャされた、またはそうでなければコンピュータビジョンシステムに提供される画像内のその向きにかかわらず識別子を検索して読み取るように構成されることができ、それによって、買い物客が、識別子が読み取られるために特定の向きで提示されるように、商品アイテムを操作して保持することなく、商品アイテムをよりカジュアルにショッピングカートに入れることを可能にする。別の言い方をすれば、様々な実施形態では、コンピュータビジョンシステムは、商品アイテムがカメラの前に保持されていなくても、後でより詳細に説明されるように、識別子を右側上向きに提示する方法で識別子を検索して読み取るように構成され得る。

【0018】

説明を容易にするために、本開示のシステム及び方法は、ショッピングカートを使用してＰＬＵコードでラベル付けされた農産物アイテムの買い物の文脈で説明され得るが、本開示は、そのように限定されることを意図するものではない。代わりに、本システム及び方法は、識別子（すなわち、単なるＰＬＵコードではない）を特徴とする任意の商品アイテム（すなわち、単なる農産物ではない）、並びに選択された商品（すなわち、単なるショッピングカートではない）を運ぶために買い物客によって使用される任意の輸送手段と共に使用され得ることを認識されたい。さらに、本明細書に開示されるシステム及び方法は、価格が重量の関数である商品アイテム（例えば、ポンド当たりの価格を有する商品アイテム）と共に使用するために説明され得るが、いくつかの実施形態では、セルフチェックアウト車両システム及びコンピュータビジョンシステムは、重量を量る必要のない商品アイテム（例えば、アイテム当たりの固定価格を有する商品アイテム）と共に使用され得、そのような場合には、ロードレシーバ／スケール／重量センサ及び関連する計量機能は、任意選択で含まれないことを認識されたい。

【0019】

セルフチェックアウト車両システム１００
図１は、本開示の様々な実施形態によるセルフチェックアウト車両システム１００を示す。一般的に言えば、セルフチェックアウト車両システム１００は、買い物客によって選択された商品アイテムを収集する際に使用するセルフチェックアウト車両１１０（例えば、ショッピングカート）と、セルフチェックアウト車両１１０に取り付けられたカメラ１１４（後で図２に示される）によってキャプチャされた画像から選択された商品アイテム１０を識別するように構成された１つまたは複数のプロセッサ１２０とを含み得る。プロセッサ１２０は、一実施形態では、オンボードセルフチェックアウト車両１１０（図示せず）に配置されてもよく、一方、他の実施形態では、プロセッサ１２０（または複数のプロセッサ１２０のうちの１つまたは複数）は、セルフチェックアウト車両１１０から離れて配置されてもよく、ネットワーク１３０（図示）を介してそれに接続されてもよい。先に図３を参照すると、代表的な実施形態では、特定の商品アイテム認識機能は、リモートプロセッサ１２０ａ上でリモートで実行されてもよく、他の機能は、後でより詳細に説明されるように、オンボードプロセッサ１２０ｂ上でローカルに実行されてもよい。

【0020】

図２は、セルフチェックアウト車両１１０の代表的な実施形態を示す。一般的に言えば、セルフチェックアウト車両１１０は、ショッピングカートまたは他の搬送手段１１２と、買い物客によってカート１１２に配置された商品アイテム１０の画像をキャプチャする１つまたは複数のカメラ１１４と、カート１１２内の商品アイテム１０を計量するための重量センサ１１６（例えば、ロードレシーバ）と、セルフチェックアウト車両１１０を使用して買い物客にショッピング関連情報を表示するユーザ端末１１８とを含み得る。様々な実施形態では、カメラ１１４は、カート１１２の貨物エリアに向かって内側に向けられてもよく、カメラの少なくとも１つが、商品アイテム１０をカート１１２に入れるときに商品アイテム１０の識別子１２の画像をキャプチャするように配置されてもよい。構成されているように、買い物客は、カメラの前で商品アイテム１０をぎこちなく保持する必要がなく、またはそうでなければ、例えば、唯一のカメラが配置されているカート１１２の他の端部／側面まで歩き回る必要がなく、商品アイテム１０をカート１１２にカジュアルに置くことができる。いくつかの実施形態では、カメラ１１４は、重量センサ１６が、後述するように、それぞれの機能を別々に収容するためにアイテム１２を移動させることなく、両方の機能を実行することができるため、アイテム１２の計量及び識別のプロセスをさらに合理化することができるカメラ１１４の少なくともオンの視野内にあるように配置及び配向され得る。様々な実施形態では、セルフチェックアウト車両１１０は、商品アイテム１０がカート１１２に入れられているか、またはカート１１２から取り出されているかを検出するために、１つまたは複数のモーションセンサ１１７をさらに含み得る。セルフチェックアウト車両１１０及びその特定のコンポーネントのさらなる代表的な実施形態は、２０１８年４月１８日に出願された「セルフチェックアウト盗難防止車両システム及び方法」と題された米国特許出願公開第２０１９／００３４８９７号、２０２０年８月１８日に発行された「移動可能なデバイスで操作可能な正確な重量測定システム及び方法」と題された米国特許第１０，７４５，０３９号、及び２０２０年１月１０日に出願された「オブジェクト識別及びセルフチェックアウト盗難防止のためのデータ生成を訓練するためのシステム及び方法」と題された米国特許出願公開第２０２０／０１５１６９２号に示され、説明されており、これらのそれぞれは、全ての目的のためにその全体が参照により本明細書に組み込まれる。

【0021】

様々な実施形態では、システム１００は、セルフチェックアウト車両に取り付けられ、選択された商品アイテムがセルフチェックアウト車両に置かれたときにセルフチェックアウト車両を操作する買い物客によって選択された商品アイテムの重量を測定するように構成された少なくとも１つのロードレシーバを有するセルフチェックアウト車両と、その視野がロードレシーバのうちの少なくとも１つを含むようにセルフチェックアウト車両に配置及び配向された１つ以上のカメラとを含むことができ、１つ以上のカメラは、少なくとも１つのロードレシーバ上の選択された商品アイテムの１つ以上の画像をキャプチャするように構成される。構成されているように、プロセッサは、少なくとも１つのプロセッサによって実行されると、コンピュータビジョン技術を使用して画像から、カート１１０内の別の場所または他の場所でアイテム１０を別個に計量する必要なく、選択された商品アイテムに付加された識別子に基づいて選択された商品アイテムをプロセッサに識別させる、非一時的媒体に格納されたコンピュータ実行可能命令を取得するように構成され得る。

【0022】

図３は、本開示の様々な実施形態による、セルフチェックアウト車両システム１００の様々なソフトウェアモジュール及び関連するアーキテクチャを示す。一般的に言えば、セルフチェックアウト車両システム１００は、商品アイテム１０を識別するためのコンピュータビジョンモジュール１３０と、商品アイテム１０の重量を量り、コストを決定することに関連付けられた様々な機能を実行するためのイベントモジュール１４０と、ディスプレイ端末１１８上で買い物客にショッピング関連情報を提示するためのユーザエクスペリエンスモジュール１５０とを備えて構成されたプロセッサ１２０を含み得る。

【0023】

コンピュータビジョンモジュール１３０
様々な実施形態では、コンピュータビジョンモジュール１３０は、カメラ１１４によってキャプチャされた画像内の商品アイテム１０を識別するのに適した任意のコンピュータモジュールを含み得る。様々な実施形態では、コンピュータビジョンモジュール１３０は、選択された商品アイテム１０に付加された商品アイテム識別子１２を少なくとも部分的に検索して読み取ることによって商品アイテム１０を識別するように構成され得る。例えば、一実施形態では、コンピュータビジョンモジュール１３０は、識別子１２を含む画像の一部をローカライズし、識別子１２を含む画像のローカライズされた部分に光学式文字認識（ＯＣＲ）技術を適用して、識別子１２の全部または一部に含まれる、またはそうでなければ定義するテキストを識別するように構成され得る。識別子１２が右側に向いていない場合、またはＯＣＲ技術を実行するのに適した別の方向に向いていない場合、様々な実施形態では、コンピュータビジョンモジュール１３０は、（ａ）識別子１２の確率的方向を識別し、（ｂ）確率的方向に基づいて、識別子１２を所定の方向に向けるために識別子１２を回転させる程度を決定し、（ｃ）識別子１２の画像を決定された程度まで回転させるように構成され得る。決定された程度で識別子１２を回転させることで、一実施形態では、選択された商品アイテム１０を識別子１２を任意の方向にしてセルフチェックアウト車両１１０に置くことができるようになる。追加的または代替的に、コンピュータビジョンモジュール１３０は、選択された商品アイテム１０の商品カテゴリ（例えば、生産物、またはより詳細に言えば、トマトなどの一般的な種類の生産物）を決定し、いくつかの実施形態では、識別子１２と各それぞれの画像で識別された商品カテゴリとを比較して、商品アイテム１０の最も可能性の高い識別子を決定することができる。

【0024】

追加的または代替的に、いくつかの実施形態では、コンピュータビジョンモジュール１３０は、後でより詳細に説明されるように、本開示のコンピュータビジョンシステム２００の１つまたは複数の態様を含み得る。

【0025】

イベントモジュール１４０
イベントモジュール１４０は、様々な実施形態では、関心のあるイベントがいつ発生しているかを判定し、イベントに関連付けられた様々な機能を実行するのに適した任意のコンピュータモジュールを含み得る。代表的なイベントは、限定されないが、買い物客が商品アイテム１０をセルフチェックアウト車両１１０に入れているか、またはセルフチェックアウト車両１１０から取り出していることを検出することを含み得る。イベントモジュール１４０は、様々な実施形態では、セルフチェックアウト車両が建物内のどこに配置されているかを検出するように構成された位置モジュールを含み得る。セルフチェックアウト車両の位置（例えば、現在のショッピングセクション及び／または通路）を知ることによって、システムは、認識された商品の位置を建物内のその割り当てられた位置と比較することができ、本明細書でより詳細に説明されるように、マッチ（match）は、認識された商品の信頼レベルをさらに改善する。

【0026】

いくつかの実施形態では、イベントモジュール１４０は、商品アイテム１０が様々な方法でいつセルフチェックアウト車両１１０に置かれるか、またはセルフチェックアウト車両１１０から取り出されるかを検出するように構成され得る。一例では、モーションセンサ１１７は、商品アイテムが置かれるか、または取り出されることを示す、セルフチェックアウト車両１１０内の動きを検出し得る。一実施形態では、垂直面に配置された複数のセンサ１１７は、様々なモーションセンサ１１７が動きを検出する順序を監視することによって、アイテムがセルフチェックアウト車両１１０内に置かれる状況とセルフチェックアウト車両１１０から取り出される状況とを区別するように構成され得る。例えば、動きが最初にセルフチェックアウト車両１１０の上部の近くに位置するモーションセンサ１１７によって検出され、続いて、セルフチェックアウト車両１１０の中央または下部の近くに位置するモーションセンサ１１７によって検出される場合、イベントモジュール１４０は、商品アイテム１０がセルフチェックアウト車両１１０に置かれていることを推測し得、逆の場合もまた同様に推測し得る。イベントモジュールは、様々な実施形態では、セルフチェックアウト車両１１０の位置を位置モジュールから受信し、検出された商品アイテム１０の予想される位置をスキャンされた位置と比較し得る。位置が一致する場合、イベントモジュールは、以前に検出され、セルフチェックアウト車両１１０に存在する他の商品アイテムのリストに商品アイテム１０を追加することを含む追加イベントを実行し得る。位置が一致しない場合、いくつかの実施形態によれば、システムは、ユーザに確認を促し、確認が受信されると商品アイテム１０をリストに追加し、またはシステムが商品アイテムを誤って識別した場合、アイテムをメモリから削除することができる。同様のプロセスがカメラ１１４を使用して実行され得ることを理解されたい。すなわち、イベントモジュール１４０は、アイテムが連続して高くなっている、カメラ１１４によってキャプチャされた一連の画像（またはビデオ）を処理することによって、セルフチェックアウト車両１１０内の商品アイテム１０の垂直移動を検出するように構成され得る。一実施形態では、イベントモジュール１４０は、アイテム１０が所定の位置閾値（例えば、カート１１０の底部の上の特定の距離）に達したときにそのような決定を行うように構成され得る。さらに別の実施形態では、イベントモジュール１４０は、カメラ１１４によってキャプチャされた一連の画像（またはビデオ）を処理して、商品アイテム１０が１つまたは複数のカメラ１１４によって以前にキャプチャされた画像に以前に存在していた場合、１つまたは複数のカメラ１１４によってキャプチャされた画像内のその商品アイテム１０の不在を検出することによって、セルフチェックアウト車両１１０内の商品アイテム１０の垂直移動を検出するように構成されてもよい。そのような実施形態では、イベントモジュール１４０は、商品アイテム１０の不在を検出する前にキャプチャされた第１の重量測定値を、商品アイテム１０の不在を検出したときまたは検出した後にキャプチャされた第２の重量測定値とさらに比較し、第１の重量測定値と第２の重量測定値の差が、セルフチェックアウト車両１１０に最初に置かれたときの選択された商品アイテム１０の測定された重量に対応する場合、商品アイテム１０が取り出されたと決定することができる。言い換えれば、イベントモジュール１４０は、後述するように、カート１１０内の重量を使用して、どのカメラ１１４が商品アイテム１０の取り出しの可能性を考慮したかを検証することができる。前述の実施形態のそれぞれにおいて、アイテム認識モジュールは、取り出されているときにアイテム１０自体を識別することによって、または特定のアイテム１０の不在を検出する前に、アイテム１０がカート１１０内に置かれているときにアイテム１０の以前にキャプチャされた画像に基づいてアイテム１０を識別することによって、その取り出しが検出された商品アイテム１０を識別するために利用され得る。

【0027】

追加的または代替的に、イベントモジュール１４０は、商品アイテムがセルフチェックアウト車両１１０に置かれるか、またはセルフチェックアウト車両１１０から取り出されることを示し得る重量の変化のために、重量センサ１１６によって提供される重量測定値を監視し得る。例えば、重量の増加が検出された場合、イベントモジュール１４０は、商品アイテム１０がセルフチェックアウト車両１１０に置かれたことを推測することができ、逆の場合もまた同様に推測することができる。一実施形態では、イベントモジュール１４０は、商品アイテムがセルフチェックアウト車両１１０に追加されたか、またはセルフチェックアウト車両１１０から取り出されたかを決定する際に、重量センサ１１６及びモーションセンサ１１７の両方からのそのような入力を考慮し得る。例えば、イベントモジュール１４０は、モーションセンサ１１６を介して動きを検出すると重量測定値を監視し、重量に対応する変化がある場合、商品アイテムが追加または削除されたことを決定するように構成され得る。最初に動きを監視することによって、これは、セルフチェックアウト車両１１０内で回転するアイテムに起因して重量測定値が変化したものなどの誤ったイベント検出を回避するのに役立ち得る。追加的または代替的に、イベントモジュール１４０は、商品アイテム１０がセルフチェックアウト車両１１０に追加されたか、またはセルフチェックアウト車両１１０から削除されたかを決定する際に、コンピュータビジョンモジュール１３０からの入力を考慮するように構成され得る。例えば、一実施形態では、イベントモジュール１４０は、商品アイテム１０がコンピュータビジョンモジュール１３０によって検出されたかどうか、そのような商品アイテム１０が完全に識別されたかどうか、または商品カテゴリのみが決定されたかどうかを単に考慮し得る。商品アイテムが実際にセルフチェックアウト車両１１０の下部にて他のアイテムの上に存在したことを視覚的に確認することによって、イベントモジュール１４０は、商品アイテム１０が追加または削除されたことを推測し得る。この考慮事項は、商品アイテム１０がセルフチェックアウト車両１１０に追加または取り出されたかどうかを識別する際に前述の考慮事項（例えば、動き検出、重量変化）の１つまたは複数と同様の方法で組み合わせられ得る。

【0028】

位置モジュールは、いくつかの実施形態では、モーションセンサ１１７を含む１つまたは複数のセンサを使用して、セルフチェックアウト車両１１０が店舗内のどこにあるかを判定するように構成される。位置モジュールは、セルフチェックアウト車両１１０の位置及び／または座標をイベント決定モジュールに提供する。イベント決定モジュールが検出された商品アイテム１０の位置を受信すると、イベント決定モジュールは、（１）認識結果を検証するために位置に従って全ての可能な商品を把握するステップと、（２）（ａ）認識された結果がその場所であると仮定される場合、成功した追加イベントを、または（ｂ）ユーザに結果の正確性を確認することを要求する保留中の追加イベントをユーザインターフェース上に表示するステップのうちの１つまたは複数を実行する。

【0029】

様々な実施形態では、イベントモジュール１４０は、さらに、コンピュータビジョンモジュール１３０から商品アイテム１０のアイデンティティに関する情報を受信し、受信したアイデンティティ及び（任意選択で）重量センサ１１６によって測定される商品アイテム１０の重量に基づいて商品アイテム１０のコストを決定するように構成され得る。例えば、イベントモジュール１４０は、コンピュータビジョンモジュール１３０によって提供される識別子に基づいて、商品アイテム１０の価格（そのような価格がオンボードメモリにローカルに格納されるか、またはリモートメモリにリモートに格納されるか）を調べ、価格が重量の関数として提供される場合、コストに測定された重量を掛けることによって価格を計算することができる。価格が固定価格（すなわち、重量とは無関係）として提供される場合、イベントモジュール１４０は、商品アイテム１０の価格を検索価格として単純に識別し得る。追加的または代替的に、価格がアイテムごとに固定価格である実施形態では、コンピュータビジョンモジュール１３０は、複数の商品アイテム１０が同時に追加されるとき（例えば、一度に１つではなく３つの桃が追加される）を識別するように構成されることができ、その場合、イベント決定モジュール１４０は、一単位当たりのコストに、追加されたとコンピュータビジョンモジュール１４０によって識別された商品アイテム１０の数を掛けることによって、追加された商品アイテムのコストを計算することができる。もちろん、同様のアプローチは、商品アイテム１０が代わりにセルフチェックアウト車両１１０から取り出されるときのコスト減少を決定するために使用され得る。

【0030】

ユーザエクスペリエンスモジュール１５０
様々な実施形態では、ユーザエクスペリエンスモジュール１５０は、ショッピング関連情報をディスプレイ端末１１８上で買い物客に提示するように構成され得る。例えば、一実施形態では、ユーザエクスペリエンスモジュール１５０は、セルフチェックアウト車両１１０内にあると判定された商品アイテム１０の実行タブを処理することができる。商品アイテム１０がセルフチェックアウト車両１１０に追加または削除されたかどうかに関する情報をイベント判定モジュール１４０から受信すると、ユーザエクスペリエンスモジュール１５０は、ディスプレイ端末１１８に、検出されたセルフチェックアウト車両１１０からの商品アイテム１０の追加または削除を買い物客に通知し、一実施形態では、実行タブに追加または実行タブから削除された対応する料金を表示し得る。追加的または代替的に、ユーザエクスペリエンスモジュール１５０は、セルフチェックアウト車両１１０に追加された商品アイテム１０に基づいて、買い物客にレコメンデーション、クーポン、または他の提案を提供するように構成され得る。例えば、ユーザエクスペリエンスモジュール１５０は、商品アイテムのデータベースから、他の買い物客が選択された商品アイテム１０と共に過去に購入したものに基づいて、買い物客が関心を持ち得る１つまたは複数の追加の商品アイテムを識別するように、つまり、例えば、買い物客がセルフチェックアウト車両１１０にパンケーキミックスを追加するときに、買い物客がシロップを購入することを推奨するように構成され得る。一実施形態では、ユーザエクスペリエンスモジュール１５０は、推奨されるアイテムが店舗内のどこに配置されているかをさらに識別し、そのような場所にナビゲートするための命令を買い物客に提供し得る。いくつかの実施形態では、ディスプレイ１１８は、買い物客がユーザエクスペリエンスモジュール１５０によって提供される特徴と対話することができるように、ユーザインターフェース（例えば、タッチスクリーン）を含み得る。さらに別の実施形態では、ディスプレイ端末１１８は、代わりに、買い物客によって提供される電子デバイス（例えば、タブレットまたはスマートフォン）であってよく、イベントモジュール１５０は、買い物客が衛生的な理由で以前の買い物客によって使用されたディスプレイに触れる必要がないように（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）を介して）ペアリングする。

【0031】

コンピュータビジョンシステム２００
図４は、本開示の様々な実施形態による、コンピュータビジョンシステム２００の様々なソフトウェアモジュール及び関連するアーキテクチャを示す。一般的に言えば、コンピュータビジョンシステム２００は、商品アイテム１０を識別するためのコンピュータビジョンモジュール２３０と、商品アイテム１０の重量を量り、コストを決定することに関連付けられた様々な機能を実行するためのイベントモジュール２４０と、ディスプレイ端末１１８上で買い物客にショッピング関連情報を提示するためのユーザエクスペリエンスモジュール２５０とを備えて構成されたプロセッサ２２０を含み得る。様々な実施形態では、イベントモジュール２４０及びユーザエクスペリエンスモジュール２５０は、イベントモジュール１４０及びユーザエクスペリエンスモジュール１５０と実質的に同様であり得、いくつかの実施形態では、コンピュータビジョンモジュール２３０は、本開示のコンピュータビジョンモジュール１３０の１つまたは複数の態様を含み得る。それにもかかわらず、本開示のコンピュータビジョンシステム２００は、（ａ）選択された商品アイテム１０に貼付された識別子を見つけて読み取り、（ｂ）選択された商品アイテム１０の商品カテゴリ（例えば、生産物）を決定し、正確でフラストレーションのないショッピング体験を提供するために本明細書にさらに記載される様々な方法に従って（ａ）及び（ｂ）を融合することに基づいて、選択された商品アイテム１０をより正確に識別するためのワークフローで構成され得る。

【0032】

非限定的な例示的なワークフローは、コンピュータビジョンシステム２００が、コンピュータビジョンモジュール２３０、イベントモジュール２４０、及びユーザエクスペリエンスモジュール２５０を含むプロセッサ２２０を起動すること、並びにカメラ１１４、重量センサ１１６、モーションセンサ１１７、及びイメージ署名プロセッサ（ＩＳＰ）などの１つまたは複数の電子デバイスを起動することから始まる。様々な実施形態では、ＩＳＰは、ノイズ除去、オートホワイトバランス、並びに署名イメージ処理に関連付けられた任意の従来の動作を含む単純な画像処理を実行するように構成される。カメラ１１４は、データ転送コストを低減するために、ノイズ除去、サイズ変更、及びトリミングによってＩＳＰによって処理される商品アイテム１０の画像ストリームを生成する。コンピュータビジョンモジュールは、ＩＳＰによって処理された商品データをフェッチし、商品データを２つのアルゴリズムパイプライン、すなわち、識別子認識モジュールと商品認識モジュールにフィードする。アイテム認識モジュールは、商品アイテム１０の１つまたは複数の画像を使用することによってアイテムカテゴリを識別するように構成される。商品アイテム１０が検出された後、特徴抽出ネットワークモジュールは、色、形状、テクスチャ、及び／または画像によって決定され得る任意の他の物理的属性のうちの１つ以上などの情報を含む特徴表現を抽出するように実装される。次に、特徴マッチング機構モジュールを実装して、抽出された特徴表現間の距離を計算し、それらをギャラリーデータベース内の特徴と比較する。アイテムカテゴリは、最小距離で定義される。選択された商品アイテム１０のアイテムカテゴリを識別するシステムによって実装される１つまたは複数のステップは、プロセッサが、選択された商品アイテム１０を含む画像の一部をローカライズすることと、画像のローカライズされた部分に示される選択された商品アイテム１０の特徴表現を生成することと、選択された商品アイテム１０の特徴表現をデータセット内の複数の利用可能な商品の特徴表現と比較して、選択された商品アイテム１０の特徴表現に最も類似した特徴表現を有する利用可能な商品を識別することと、を実行することを含む。

【0033】

識別子認識モジュールは、商品アイテム１０上の１つ以上の識別子１２を認識することによって、商品アイテム１０を識別する。識別子認識モジュールは、最初に入力フレーム内の１つ以上の識別子１２をローカライズし、ＯＣＲ技術を検出された領域に適用する。いくつかの実施形態では、従来のコンピュータビジョン（ＣＶ）及びディープラーニング（ＤＬ）のうちの１つ以上が、高速推論及び正確なテキスト認識結果を提供するために用いられる。テキストが認識された後、関連するアイテムカテゴリを取得するために識別子１２データベースにクエリされる。識別子結果融合モジュールは、識別子ＯＣＲモジュール及びアイテム認識モジュールの両方からの１つ以上の履歴フレーム結果を入力として受け取り、ルールを使用して最も可能性の高い結果を取得する。１つまたは複数の重量センサ１１６は、セルフチェックアウト車両１１０内の全ての商品アイテム１０のリアルタイムの重量デルタを与える。商品アイテム１０の価格は、重量デルタによって計算され得る。イベント決定モジュールは、コンピュータビジョン結果、重量変化、及びモーションデータのうちの１つまたは複数を組み合わせて、顧客が商品アイテム１０を入れることを意図するか、または商品アイテム１０を取り除くことを意図するかを決定する。１つ以上のイベントが決定されると、システムは、イベント通知をユーザインターフェースに表示するように構成される。

【0034】

様々な非限定的な実施形態では、システムは、買い物客によって選択された商品アイテム１０の１つまたは複数の画像において、選択された商品アイテム１０に付加された識別子１２を識別することと、画像のうちの少なくとも１つに基づいて、選択された商品アイテム１０のアイテムカテゴリを識別することと、識別子１２及びそれぞれの画像で識別されたアイテムカテゴリを比較して、商品アイテム１０の最も可能性の高い識別を決定することと、のうちの１つまたは複数を実装し得る。識別子１２は、いくつかの非限定的な実施形態による、価格検索（ＰＬＵ）コード、数値コードのうちの少なくとも１つを含み得る。

【0035】

推論データフロー（Inference Dataflow）
図５は、本開示の一実施形態による、コンピュータビジョンモジュールにおける主な推論データフローを示す。推論データフローには２つのストリームがあり、それぞれ識別子１２認識のためのストリーム及びアイテム認識のためのストリームである。識別子認識ストリームは、識別子１２のラベルをローカライズし、ＯＣＲを用いて識別子１２のラベル内の任意のテキスト（数字を含む）を認識する。識別子１２がいくつかの実施形態に従って認識されると、商品アイテムカテゴリ（例えば、農産物）は、キー値データベースを使用して識別される。商品認識ストリームは、商品アイテム１０がカメラ１１４から遠すぎる場合、商品アイテム１０を検出する。アイテム画像は、キャプチャされた商品アイテム１０の特徴表現を生成するために埋め込みネットワークに供給される。いくつかの実施形態では、特徴表現は、フロートまたは整数の多次元ベクトルであり、特徴データセット及び／またはギャラリーと呼ばれる各特徴ベクトルへの最小距離を選択することによってカテゴリを識別するために使用することができる。両方のストリームの出力カテゴリは、結果を融合することを担当する識別子結果融合アルゴリズムに流れ込み、経験に基づいてより信頼性が高く正確な予測を提供する。様々な非限定的な実施形態では、システムプロセッサは、識別子１２を含む画像の一部をローカライズすることと、識別子１２を含む画像のローカライズされた部分に光学式文字認識技術を適用して識別子１２を定義するテキストを識別することと、の１つまたは複数のステップを実装し得る。システムはまた、画像内の識別子１２の位置を検出することと、検出された位置で、識別子１２を含む画像のそれらのピクセルを選択された商品を含む画像のそれらのピクセルから区別することと、識別子１２を含む画像のそれらのピクセルを所定の向きに回転させることと、を含む１つまたは複数のステップを実装するように構成され得る。いくつかの実施形態では、システムは、識別子１２が含まれる確率的領域を識別し、確率的領域を取り囲む境界ボックスを生成する。

【0036】

非バーコード識別子ローカリゼーションモジュール（Non Barcode Identifier Localization Module）
図６は、本開示のいくつかの実施形態による識別子ローカリゼーションモジュールの構成要素を示す。識別子ローカリゼーションモジュールは、検出、セグメンテーション、回転の３つの主な目標を持つ強力な検出器である。検出は、商品アイテム１０及びナイーブな商品アイテムカテゴリの周りの境界ボックスを出力する。セグメンテーションは、０と１からなるマスクを出力することによって、フレーム内の正確な商品アイテムピクセルを予測する。値１は商品アイテムのピクセルを表し、値０は背景を表す。回転出力は、商品アイテム１０の角度を－１８０度から１８０度の間で回転させる。商品アイテム１０をセルフチェックアウト車両１１０に入れる挙動は予測不可能であり、識別子１２がフレーム内で回転される可能性が最も高いため、回転較正はローカリゼーションモジュールで実行される。

【0037】

システムは、回転を決定及び／または実装するときに、識別子１２の確率的方向を識別することと、確率的方向に基づいて、識別子１２を所定の方向に向けるために識別子１２を回転させる度合いを決定することと、識別子１２を決定された度合いで回転させることと、のうちの１つまたは複数を実装し得る。決定された度合いだけ識別子１２を自動的に回転させるシステムは、選択された商品が識別子１２を任意の向きでセルフチェックアウト車両に置かれることを可能にする。

【0038】

識別子１２を含む画像のそれらのピクセルを選択された商品を含む画像のそれらのピクセルから区別することは、１つ以上のプロセッサによって実行されるステップ、すなわち、選択された商品のナイーブアイテムカテゴリを生成するステップと、位置にある画像のピクセルをナイーブアイテムカテゴリに関連付けられたピクセルと比較するステップと、ピクセルの比較から、ナイーブアイテムカテゴリに関連付けられたピクセルとは異なるそれらのピクセルを識別するステップと、識別子１２を含むそれらのピクセルとして異なるピクセルを識別するステップとを含む。

【0039】

図７は、いくつかの実施形態による、識別子ローカリゼーションモジュールの推論パイプラインを示す。識別子ローカリゼーションモジュールでの推論の間、各フレームは、ニューラルネットワークのバックボーンに供給される。いくつかの実施形態では、領域提案ネットワーク（ＲＰＮ）中間層は、バックボーン出力を入力として受け取り、確率的領域提案を生成する。いくつかの実施形態では、ＲＰＮは、非限定的な例として、ＣｅｎｔｅｒＮｅｔ２に提示される確率的２段階検出器を含む１つ以上の修正を含む。追加の畳み込みは、提案された領域に接続され、より高いセマンティック特徴を抽出し、これらは、３つの予測ヘッド、すなわち、検出、セグメンテーション及び／または回転に供給される。予測された境界ボックス、マスク、及び回転角度を元のフレームに適用して、識別子１２のトリミングされ、セグメント化され、較正された画像を出力する。

【0040】

図８は、本開示のいくつかの実施形態による、識別子ローカリゼーションモジュール内のクラス、ｂｂｏｘｈｅａｄを示す。クラス、ｂｂｏｘｈｅａｄの目的は、識別子ローカリゼーションモジュールで検出を実行することである。いくつかの実施形態では、クラス、ｂｂｏｘｈｅａｄは、予測されたクラス及びバウンディングボックスの両方を含むベクトルを出力するように構成される。ニューラルネットワーク（ＮＮ）層のスタック（例えば、畳み込み層及び／または完全に接続された層）が実行された後、カテゴリ予測及びＢボックス予測である２つの予測が生成される。いくつかの実施形態では、ナイーブなカテゴリ予測は、所与のアイテムが商品アイテム１０（例えば、農産物）のタイプまたは背景である確率を提供する。いくつかの実施形態では、フロート閾値はまた、フロート閾値よりも小さい値を有する商品確率を排除することによって商品カテゴリを決定するために使用される。いくつかの実施形態では、システムは、［ｘ１、ｙ１、ｘ２、ｙ２］などのその周囲の長方形座標によって商品アイテム１０の予測された位置を与える回帰タスクである境界ボックス予測を実装する。

【0041】

トレーニングの間、クラス、ｂｂｏｘｈｅａｄ自体がマルチタスク学習アルゴリズムである。いくつかの実施形態では、ヘッドは、カテゴリ予測からのクロスエントロピー損失及びｂボックス予測からのユニオン上の交差（ＩｏＵ）損失の変動から同時に学習するように構成され、定数はそれぞれ損失に異なる重みを与える。

【0042】

【数1】

【0043】

いくつかの実施形態では、推論の間、クラス、ｂｂｏｘｈｅａｄは、ベクトルを予測、Ｎ×（４＋１）×Ｃとして出力する。ここで、Ｎは提案の数を表し、４は説明された長方形座標であり、１はカテゴリ確率であり、Ｃは背景を含むカテゴリの数である。

【0044】

図９は、本開示のいくつかの実施形態による、識別子ローカリゼーションモジュール内のセグメンテーションヘッドを示す。セグメンテーションヘッドは、［Ｎ、ｈ、ｗ、Ｃ］の形状を持つマスクであるマスク予測のみを提供する。ここで、Ｎは提案の数を表し、ｈ及びｗはいくつかの畳み込み層の後の提案の高さ及び幅であり、Ｃは背景を含むカテゴリの数である。マスク予測の各ピクセルは０または１で表され、０が背景として、１がカテゴリとして表される。いくつかの実施形態では、トレーニングの間、マスク予測の各ピクセルは、グラウンドトゥルースピクセルと比較され、ネットワーク全体にバックプロパゲートする（back propagate）マスク損失を与える。推論の間、いくつかの実施形態に従って、クラス、ｂｂｏｘｈｅａｄ内の予測されたカテゴリのみが選択される。

【0045】

図１０は、本開示のいくつかの実施形態による識別子ローカリゼーションモジュール内の回転ヘッドを示す。回転ヘッドは、中心の周りの度数での回転角度である角度予測を提供する。図１１に示されるように、識別子１２ラベルの中心点は、［ｘ＿ｃ、ｙ＿ｃ］によって表され、オレンジ線と黒線との間の角度は、いくつかの実施形態による角度予測である。トレーニングの間、いくつかの実施形態では、角度予測は、ＭＳＥ、ＳｍｏｏｔｈＬ１などの回帰損失を使用して調整されることができる。推論の間、いくつかの実施形態に従って、全てのフォアグラウンドカテゴリは、この角度予測を使用して回転されなければならない。

【0046】

識別子ＯＣＲモジュール（Identifier OCR Module）
識別子ＯＣＲモジュールは、トリミングされた識別子画像のバッチである識別子ローカリゼーションモジュールから出力を取り出す。有能な（competent）ＯＣＲアルゴリズムパイプラインは、入力画像を出力カテゴリに直接変換することができる。図１２は、いくつかの実施形態による、識別子ＯＣＲモジュールの概略を示す。基本的に、エンドツーエンドのＯＣＲアプローチと従来のコンピュータビジョン（ＣＶ）＋機械学習（ＭＬ）アプローチという、同様のＯＣＲ結果を生成することができる２つのアプローチがある。エンドツーエンドのＯＣＲアプローチは、パイプライン全体でディープラーニングを採用している。エンドツーエンドのＯＣＲデータフローは、従来のＣＶ＋ＭＬアプローチと比較して拡張性が高いという利点がある。

【0047】

エンドツーエンドＯＣＲデータフロー（End to End OCR Dataflow）
エンドツーエンドＯＣＲデータフローでは、識別子画像は、識別子画像内のテキストをローカライズするためにテキスト検出器に供給される。いくつかの実施形態では、テキスト検出器は、テキスト境界ボックスを検出するだけでなく、検出された境界ボックスの方向を合わせる。検出されたテキスト境界ボックスは、いくつかの実施形態に従って、畳み込みニューラルネットワーク（ＣＮＮ）に供給され、続いて、コネクショニスト時系列分類（ＣＴＣ）デコーダに供給される。テキストが復号された後、それらは識別子１２データベースにクエリされ、商品アイテム１０の正しいカテゴリを決定する。図１３は、いくつかの実施形態による、識別子ＯＣＲモジュール内のエンドツーエンドＯＣＲデータフローを示す。いくつかの実施形態では、システムは、テキスト検出器を使用して、識別子１２を含む画像のローカライズされた部分内のテキストをローカライズすることと、ローカライズされたテキストを所定の向きに回転させることと、畳み込みニューラルネットワーク（ＣＮＮ）を使用してテキストの１つ以上の特徴を抽出することと、コネクショニスト時系列分類（ＣＴＣ）を使用して、全ての可能なテキスト出力にわたる出力分布を生成することと、を含む１つ以上のステップを実行するように構成される。これらのステップはまた、出力分布から、可能性の高い出力を推測し、可能性の高い出力では任意の繰り返しを折りたたみ、可能性の高い出力では任意のブランクシンボルを除去することによって、識別子１２を定義するテキストを識別することを含み得る。

【0048】

テキスト検出（Text Detection）
検出されたテキスト境界ボックスから、ＣＮＮ＋ＣＴＣデコーダは、正確なテキストコンテンツ（例えば、数字）を予測するように設計される。ビジュアル認識タスクのために、ＣＮＮは、しばしば識別子画像内の場合である歪み及びノイズに対するその良好な耐性のために使用される。図１４は、いくつかの実施形態による、テキスト画像特徴を抽出するためにシステムによって使用されるＣＮＮバックボーンを示す。ＣＮＮはまた、高レベルの特徴を抽出する能力を提供する：それらの境界ボックス化されたテキスト画像は、プーリングパディング及びいくつかのアクティベーションを伴ういくつかの畳み込み層を通過して、形状が［ｂ、ｈ’，ｗ’，ｃ］の最終的に計算された特徴マップを取得する。ここで、ｂは入力のバッチサイズであり、ｈ’、ｗ’は、以前の畳み込みニューラルネットワークにおけるいくつかのストライディング及びプーリング操作の後の高さ及び幅を示し、ｃは出力チャネルの数である。いくつかの実施形態では、ＣＮＮは、画像のバッチを高レベル特徴マップのセットに変える通常のバックボーン（例えば、ｒｅｓｎｅｔ５０、ｓｈｕｆｆｌｅｎｅｔｖ２、ｍｏｂｉｌｅｎｅｔｖ３）である。いくつかの実施形態では、抽出された特徴マップは、さらなる予測のために高レベルの意味的特徴としてＣＴＣデコーダに送信される。

【0049】

画像内のテキスト領域サイズが変化し、識別子テキスト長が変化するため、システムは、いくつかの実施形態では、画像及びテキストコンテンツの正確な整列を欠くという問題を回避するために、コネクショニスト時系列分類（ＣＴＣ）デコーダを実装するように構成される。図１５は、いくつかの実施形態によるシステムによるＣＴＣの実装を示す。所与の境界ボックス化されたテキスト画像について、従来のデコーダは固定長の出力しか予測できないため、ＣＴＣアルゴリズムは、数値を直接予測する代わりに、全ての可能なテキスト出力に対する出力分布を与える。いくつかの実施形態では、システムは、この分布を使用して、可能性の高い出力を推測するか、または所与の出力の確率を評価するように構成される。図１６は、いくつかの実施形態による推論におけるＣＴＣを示す。前の畳み込みニューラルネットワークによって生成された特徴マップは、再形成され、高密度層に供給される。高密度層の出力は、［ｂ，ｔ，ｃ］に再形成される。ここで、ｂは入力のバッチサイズであり、ｔは事前定義されたＣＴＣタイムスタンプ（例えば、図１６の８）であり、ｃはカテゴリの数（可能な桁及び空白記号、例えば、図１６の１１）である。各ＣＴＣタイムスタンプにおける各文字の確率的分布を与える高密度層出力は、ＣＴＣデコーダによって復号される。

【0050】

推論の間、ＣＴＣデコーダは、折り畳みリピートを伴うＣＴＣ予測分布から最も可能性の高い出力を取り、空白記号を除去することによってテキスト予測を与え、テキスト予測は、最終的に識別子１２データベースに送信され、出力カテゴリに変換される。

【0051】

ＣＴＣデコーダは、様々な実施形態に従って、２つの機能、すなわち、（１）各タイムスタンプで全てまたはいくつかの可能な形態にわたって分布（スコア）を計算すること、（２）異なる形態（例えば、４６６ε８ε８８及び４４６８８ε８８の両方の出力４６８８）で同じシーケンスをマージすること、を実行する。様々な実施形態では、システムは、出力分布から所与の出力の確率を評価し、最も高い確率を有する出力から識別子１２を定義するテキストを識別するように構成される。

【0052】

様々な実施形態によれば、ＣＴＣデコーダの異なる実装がある：（１）ＣＴＣビームデコーダは、各タイムスタンプでのプルーニングサーチを行い、ビーム候補としてＢの可能な形状を最上位にする、（２）ＣＴＣグリーディデコーダは、各タイムスタンプで最大確率分布をとり、繰り返しを折りたたみ、ブランクを除去する。ＣＴＣ復号後、最高スコアを有するシーケンスが選択される（例えば、図１６の４６８８）。図１７は、いくつかの実施形態によるＣＴＣ復号の例を示す。３つのカテゴリ（０、１及び空白記号ε）及び２つのタイムスタンプを有することによって、（１）可能なテキスト出力の全てまたはいくつかがスコアとともに導出され、（２）同じシーケンスがマージされ、テキスト出力の繰り返しを折りたたみ、空白を除去した後にスコアが合計され（ε０、０ε及び００は全て０に変換され得る）、並びに（３）最高スコアを有するシーケンスが選択される。図１８は、トレーニング中のＣＴＣを示す。トレーニングの間、システムは、正式にはｐ（Ｙ｜Ｘ）を示す、正しい回答に入力が割り当てられる可能性を最大化する必要がある。ここで、Ｘは入力画像を表し、Ｙはグラウンドトゥルースを表す。トレーニングセットＤの場合、モデルのパラメータは、負の対数尤度を最小限に抑えるように調整される。

【0053】

【数2】

【0054】

従来のＣＶ＋ＭＬのＯＣＲデータフロー（Traditional CV+ML OCR Dataflow）
従来のＣＶ＋ＭＬのＯＣＲアプローチは、従来のＣＶ技術を使用してテキストを文字に分割し、機械学習分類器を使用して各文字を認識する。図１９は、いくつかの実施形態による、識別子ＯＣＲモジュール内の従来のＣＶ＋ＭＬのＯＣＲデータフローを示す。従来のＣＶ＋ＭＬのＯＣＲデータフローでは、識別子画像は、最初にテキスト検出器に供給され、識別子画像内のテキストをローカライズする。テキスト検出器は、テキスト境界ボックスを検出するだけでなく、検出された境界ボックスの方向を合わせる。従来のコンピュータビジョンテキストスプリッタは、画像の二値化と輪郭検出を使用して、テキスト内の文字を分割する。全ての単一の文字がバッチとして形成され、文字（ｃｈａｒ）認識器に入力される。文字認識器は、ディープラーニング（ＤＬ）分類器またはサポートベクトルマシン（ＳＶＭ）、ランダムフォレスト、ＫＮＮ（Ｋ近傍）などのＭＬ分類器のいずれかであり得る。認識された文字は、識別子テキストを形成するための入力として配列される。テキストが復号された後、それらは識別子データベースにクエリされ、商品アイテム１０の正しいカテゴリを決定する。従来のＣＶ＋ＭＬのＯＣＲデータフローの利点は、エンドツーエンドのディープラーニングアプローチよりも高速なことである。様々な実施形態によれば、システムは、テキスト検出器を使用して、識別子１２を含む画像のローカライズされた部分内のテキストをローカライズすることと、ローカライズされたテキストを所定の向きに回転させることと、画像二値化及び輪郭検出技術を使用してテキスト内の文字を分割することと、各文字を認識するためにディープラーニング分類器または機械学習分類器のいずれかを使用して文字のバッチを評価することと、認識された文字をシーケンスすることと、を含む１つまたは複数のステップを実装するように構成される。

【0055】

アイテム埋め込みモジュール（Item Embedding Module）
アイテム埋め込みモジュールは、各商品アイテム１０に従って識別的な特徴表現を提供することを目的とする。図２０は、本開示の様々な実施形態によるアイテム埋め込みモジュールのトレーニングフローを示す。特徴表現をより識別的にするために、トレーニングフローではシャムネットワーク（siamese network）が使用される。シャムネットワークは、一対の画像を入力として受け取り、それぞれの特徴表現を抽出する。システムによって使用される各特徴表現は、多次元特徴ベクトルである。両方の特徴ベクトルは、対照的損失を計算するために使用される。損失は、共有された重みを持つ両方のネットワークで逆伝播される。

【0056】

アイテム埋め込みモジュールの推論はより簡単である。ネットワークは、アイテム画像を入力として受け取り、それに応じて特徴表現を出力する。予測された特徴ベクトルは、カテゴリ特徴ベクトルからなる特徴ギャラリーにクエリされ、距離最小で正しいカテゴリを取得する。図２１は、いくつかの実施形態によるアイテム埋め込みモジュールの推論フローを示す。

【0057】

非バーコード識別子結果融合モジュール（Non Barcode Identifier Result Fusion Module）
結果融合モジュールは、識別子認識モジュール及びアイテム認識モジュールの両方からだけでなく、履歴結果からもカテゴリを受け入れる。結果を融合することによって、識別子結果融合モジュールは、はるかに信頼性が高く、堅牢な予測を提供することができる。図２２は、いくつかの実施形態による結果融合モジュールを示す。結果融合モジュールのコア機能は、異なるモデルの予測を比較して精度を高めることである。いくつかの実施形態では、非限定的な例として、袋詰め（bagging）、ブースト、スタッキングなどのいくつかの関連する研究がある。いくつかの実施形態では、結果融合モジュールは、識別子認識モジュール及びアイテム認識モジュールからの結果を組み立てるように構成される。一度に１つの商品アイテムタイプ（例えば、１つのタイプの農産物）のみがシステム２００に提示されるという事実などの履歴情報が考慮される。いくつかの実施形態では、履歴期間は、商品アイテム１０をカメラ１１４から配置する時間よりも短い。システムは、モジュールの精度とタイムスタンプに応じて各予測に異なる重みを与えるように構成される。重み付けは、機械学習の方法で学習することができる。

【0058】

重み付け投票（Weighted Voting）
投票は、全ての分類器の大多数の予測によって融合予測を決定するアンサンブルメカニズムである。図２３は、いくつかの実施形態による投票プロセスを示す。非限定的な例で投票プロセスを説明するために、４つの予測があるとする。それらは、ＲｅｄＳｗｅｅｔＢｅｌｌＰｅｐｐｅｒに２つ、ＯｒａｎｇｅＳｗｅｅｔＢｅｌｌＰｅｐｐｅｒに１つ、ＹｅｌｌｏｗＳｗｅｅｔＢｅｌｌＰｅｐｐｅｒに１つある。投票結果は多数決なので、ＲｅｄＳｗｅｅｔＢｅｌｌＰｅｐｐｅｒである。重み付けされた投票は、各投票の重み付けにより、より良いモデルで結果をもたらす。図２４は、いくつかの実施形態による重み付け投票を示す。

【0059】

いくつかの実施形態では、システムは、重み付け投票を実装し、現在のタイムスタンプまたは履歴タイムスタンプのいずれかからの全ての予測を投票として取得するが、それらは異なる重みを有するように構成される。

【0060】

投票するカテゴリｊ及びｃの基礎分類器の数を考慮すると、各サンプルの重み付け投票の予測カテゴリＦは、以下の通りとなる。

【0061】

【数3】

【0062】

ここで、予測はバイナリである。ｉ番目の基底分類器がｐサンプルをｊ番目のカテゴリに分類する場合、ｐ_ｊｉ＝１であり、それ以外の場合、ｐ_ｊｉ＝０である。ここで、ｗ_ｉはｉ番目の基底分類器の重みである。重みは、現在のタイムスタンプに近いほど重みが大きくなり、モデルが優れているほど重みが大きくなるなど、何らかの戦略に従って事前に定義された定数にすることができる。しかしながら、重み付けは、機械学習によっても学習することができる。図２５は、いくつかの実施形態による投票のための学習重みを示す。

【0063】

図２６は、システムのいくつかの実施形態による、システム及び方法を可能にする、またはそれを含むコンピュータシステム４１０を示す。いくつかの実施形態では、コンピュータシステム４１０は、前述のシステム及び方法の１つ以上のソフトウェアモジュールのコンピュータ実行可能コードを操作及び／または処理することができる。さらに、いくつかの実施形態では、コンピュータシステム４１０は、システムと統合された、またはシステムに結合された１つまたは複数のグラフィカルユーザインタフェース（例えば、ＨＭＩ）内で情報を操作及び／または表示することができる。

【0064】

いくつかの実施形態では、コンピュータシステム４１０は、少なくとも１つのプロセッサ４３２を含むことができる。いくつかの実施形態では、少なくとも１つのプロセッサ４３２は、１つ以上の従来のサーバプラットフォーム（図示せず）に常駐し、または結合することができる。いくつかの実施形態では、コンピュータシステム４１０は、ネットワークインターフェース４３５ａ及び少なくとも１つのオペレーティングシステム４３４を処理することができる少なくとも１つのプロセッサ４３２に結合されたアプリケーションインターフェース４３５ｂを含むことができる。さらに、いくつかの実施形態では、少なくとも１つのプロセッサ４３２に結合されたインターフェース４３５ａ、４３５ｂは、ソフトウェアモジュール（例えば、エンタープライズアプリケーション４３８など）のうちの１つ以上を処理するように構成され得る。いくつかの実施形態では、ソフトウェアアプリケーションモジュール４３８は、サーバベースのソフトウェアを含むことができ、少なくとも１つのユーザアカウント及び／または少なくとも１つのクライアントアカウントをホストするように動作することができ、少なくとも１つのプロセッサ４３２を使用してこれらのアカウントのうちの１つ以上の間でデータを転送するように動作することができる。

【0065】

上記の実施形態を念頭に置くと、システムは、コンピュータシステムに格納されたデータを含む様々なコンピュータ実装動作を用いることができることが理解される。さらに、本開示を通して説明される上述のデータベース及びモデルは、様々な実施形態による、コンピュータシステム４１０内のコンピュータ可読記憶媒体及びコンピュータシステム４１０に結合されたコンピュータ可読記憶媒体に、分析モデル及び他のデータを記憶することができる。加えて、いくつかの実施形態では、システムの上述のアプリケーションは、コンピュータシステム４１０内のコンピュータ可読記憶媒体及びコンピュータシステム４１０に結合されたコンピュータ可読記憶媒体に記憶され得る。いくつかの実施形態では、これらの動作は、物理量の物理的操作を必要とする。通常、必ずしもそうではないが、いくつかの実施形態では、これらの量は、記憶され、転送され、結合され、比較され、さもなければ操作されることができる電気的、電磁的、磁気的、光学的、または磁気光学的信号のうちの１つ以上の形態をとる。いくつかの実施形態では、コンピュータシステム４１０は、少なくとも１つのデータソース４３７ａ、少なくとも１つのデータストレージ４３７ｂ、及び／または少なくとも１つの入力／出力４３７ｃのうちの少なくとも１つに結合された少なくとも１つのコンピュータ可読媒体４３６を含むことができる。いくつかの実施形態では、コンピュータシステム４１０は、コンピュータ可読媒体４３６上のコンピュータ可読コードとして具現化され得る。いくつかの実施形態では、コンピュータ可読媒体４３６は、データを格納することができ、その後、コンピュータ（コンピュータ４４０など）によって読み取ることができる任意のデータストレージであり得る。いくつかの実施形態では、コンピュータ可読媒体４３６は、所望の情報またはデータまたは命令を有形的に記憶するために使用することができ、コンピュータ４４０またはプロセッサ４３２によってアクセスすることができる任意の物理媒体または材料媒体であり得る。いくつかの実施形態では、コンピュータ可読媒体４３６は、ハードドライブ、ネットワークアタッチトストレージ（ＮＡＳ）、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュベースメモリ、ＣＤ－ＲＯＭ、ＣＤ－Ｒ、ＣＤ－ＲＷ、ＤＶＤ、磁気テープ、他の光学及び非光学データストレージを含むことができる。いくつかの実施形態では、様々な他の形態のコンピュータ可読媒体４３６は、ルータ、プライベートネットワークもしくはパブリックネットワーク、または有線及び無線の両方の他の伝送もしくはチャネルを含む、リモートコンピュータ４４０及び／または少なくとも１つのユーザ４３１に命令を伝送または搬送することができる。いくつかの実施形態では、ソフトウェアアプリケーションモジュール４３８は、データベース（例えば、データベースを含むことができるデータソース４３７ａ及びデータストレージ４３７ｂを含むコンピュータ可読媒体４３６から）からデータを送受信するように構成され得、データは、ソフトウェアアプリケーションモジュール４３８によって少なくとも１つの他のソースから受信され得る。いくつかの実施形態では、ソフトウェアアプリケーションモジュール４３８のうちの少なくとも１つは、少なくとも１つのデジタルディスプレイ上にレンダリングされた少なくとも１つのグラフィカルユーザインタフェースを介して少なくとも１つのユーザ４３１にデータを出力するようにコンピュータシステム４１０内に構成され得る。

【0066】

いくつかの実施形態では、コンピュータ可読媒体４３６は、ネットワークインターフェース４３５ａを介して従来のコンピュータネットワークを通して分散されることができ、コンピュータ可読コードによって具現化されたシステムは、分散された方法で格納され、実行され得る。例えば、いくつかの実施形態では、コンピュータシステム４１０の１つまたは複数の構成要素は、ローカルエリアネットワーク（ＬＡＮ）４３９ａ及び／またはインターネット結合ネットワーク４３９ｂ（例えば、無線インターネットなど）を介してデータを送信及び／または受信するように結合され得る。いくつかの実施形態では、ネットワーク４３９ａ、４３９ｂは、ワイドエリアネットワーク（ＷＡＮ）、直接接続（例えば、ユニバーサルシリアルバスポートを介して）、または他の形態のコンピュータ可読媒体４３６、またはそれらの任意の組み合わせを含むことができる。

【0067】

いくつかの実施形態では、ネットワーク４３９ａ、４３９ｂの構成要素は、例えば、デスクトップコンピュータ、及び／またはラップトップコンピュータ、またはＬＡＮ４３９ａを介して結合された任意の固定された、一般的に非モバイルインターネット機器を含む任意の数のパーソナルコンピュータ４４０を含むことができる。例えば、いくつかの実施形態は、管理者を含む任意のタイプのユーザのために構成することができるＬＡＮ４３９ａを介して結合されたパーソナルコンピュータ４４０、データベース４４１、及び／またはサーバ４４２のうちの１つ以上を含む。いくつかの実施形態は、ネットワーク４３９ｂを介して結合された１つ以上のパーソナルコンピュータ４４０を含むことができる。いくつかの実施形態では、コンピュータシステム４１０の１つまたは複数の構成要素は、インターネットネットワーク（例えば、ネットワーク４３９ｂなど）を介してデータを送信または受信するように結合され得る。例えば、いくつかの実施形態は、少なくとも１つのユーザ４３１ａ、４３１ｂを含み、無線で結合され、入力及び出力（「Ｉ／Ｏ」）４３７ｃを介して少なくとも１つのエンタープライズアプリケーション４３８を含むシステムの１つ以上のソフトウェアモジュールにアクセスする。いくつかの実施形態では、コンピュータシステム４１０は、少なくとも１つのユーザ４３１ａ、４３１ｂが、ＬＡＮ４３９ａを介してＩ／Ｏ４３７ｃを介してエンタープライズアプリケーション４３８にアクセスするように結合されることを可能にする。いくつかの実施形態では、ユーザ４３１は、デスクトップコンピュータ、及び／またはラップトップコンピュータ、またはインターネット４３９ｂを介して結合された任意の固定された、一般的に非モバイルインターネット機器を使用してコンピュータシステム４１０に結合されたユーザ４３１ａを含むことができる。いくつかの実施形態では、ユーザは、コンピュータシステム４１０に結合されたモバイルユーザ４３１ｂを含むことができる。いくつかの実施形態では、ユーザ４３１ｂは、任意のモバイルコンピューティング４３１ｃを使用して、１つ以上のパーソナルデジタルアシスタント、少なくとも１つのセルラー電話、少なくとも１つのモバイル電話、少なくとも１つのスマートフォン、少なくとも１つのページャ、少なくとも１つのデジタルタブレット、及び／または少なくとも１つの固定またはモバイルインターネットアプライアンスを含むが、これらに限定されない、コンピュータシステム４１０に結合された無線に接続することができる。

【0068】

本明細書に記載の主題は、新規の人工知能学習技術の使用による人工知能によるアイテム認識の分野への技術的改善を対象とする。本開示は、１つ以上のプロセッサ及び１つ以上の非一時的コンピュータを含む１つ以上のコンピュータを含むマシンが、先行技術に対するシステム及びその改善をどのように実装するかの詳細を説明する。機械によって実行される命令は、人間の心で実行されたり、ピンと紙を使用して人間によって導き出されたりすることはできず、機械はプロセス入力データを有用な出力データに変換する必要がある。さらに、本明細書に提示される特許請求の範囲は、汎用コンピュータによって実装される既知の従来のステップと司法例外を結びつけることを試みるものではなく、単にそれを技術分野にリンクすることによって司法例外を結びつけることを試みるものでもない。実際、本明細書に記載のシステム及び方法は、出願時点で未知であり、及び／またはパブリックドメインに存在せず、従来技術では知られていなかった技術的改善の利点を提供する。さらに、システムは、特許請求の範囲を有用なアプリケーションに限定する非従来型のステップを含む。

【0069】

システムは、その適用において、前述の説明に記載された、または図面に示された構成の詳細及び構成要素の配置に限定されないことが理解される。本明細書に開示されるシステム及び方法は、多数の実施形態の範囲内にある。前述の説明は、当業者がシステムの実施形態を作成及び使用することを可能にするために提示される。いくつかの実施形態に含まれる構造及び／または原理の任意の部分は、いずれか及び／または全ての実施形態に適用することができる：本明細書に提示されるいくつかの実施形態からの特徴は、いくつかの他の実施形態による他の特徴と組み合わせられることが理解される。従って、システムのいくつかの実施形態は、図示されるものに限定されることを意図するものではなく、本明細書に開示される全ての原理及び特徴と一致する最も広範囲を付与されるべきである。

【0070】

システムのいくつかの実施形態は、特定の値及び／または設定値で提示される。これらの値及び設定値は、限定することを意図するものではなく、より低い構成と比較してより高い構成の単なる例であり、システムを作成及び使用する当業者のための補助として意図されている。

【0071】

さらに、出願人自身の辞書編纂者として、出願人は、特許請求の範囲の明示的な意味及び／または否認を以下の用語に付与する。

【0072】

出願人は、例えば、「Ａ及び／またはＢ」、または「Ａ及び／またはＢの少なくとも１つ」などの「及び／または」の任意の使用を、要素Ａ単独、要素Ｂ単独、または要素Ａ及びＢを一緒にを意味するように定義する。加えて、「Ａ、Ｂ、及びＣのうちの少なくとも１つ」の記載、「Ａ、Ｂ、またはＣのうちの少なくとも１つ」の記載、または「Ａ、Ｂ、またはＣのうちの少なくとも１つ、またはそれらの任意の組み合わせ」の記載はそれぞれ、要素Ａ単独、要素Ｂ単独、要素Ｃ単独、または要素Ａ、Ｂ、及びＣの任意の組み合わせ、例えば、ＡＢ、ＡＣ、ＢＣ、またはＡＢＣを意味するように定義される。

【0073】

値と併せて使用される場合、「実質的に」及び「約」は、測定される同じ単位及び／またはスケールの５％以下の差を包含する。

【0074】

本明細書で使用される「同時に」は、複数のタイプのデータを同時に処理しようとする本明細書に記載のプロセッサ及び／またはネットワークなどの従来の及び／または独自のコンピュータに関連付けられたラグ及び／またはレイテンシ時間を含む。「同時に」は、無線及び／または有線ネットワークを介して、及び／またはプロセッサ回路内で、デジタル信号が１つの物理的な位置から別の物理的な位置に転送されるのにかかる時間も含む。

【0075】

本明細書で使用される場合、「ｃａｎ」または「ｍａｙ」またはそれらの誘導体（例えば、システムディスプレイは、Ｘを示すことができる）は、説明目的にのみ使用され、システムの測定値及び境界を定義するときに、「構成された」（例えば、コンピュータは、命令Ｘを実行するように構成される）と同義及び／または交換可能であると理解される。

【0076】

加えて、「するように構成される」という用語は、明細書及び／または特許請求の範囲に記載された制限が、記載された機能を実行するためにそのような方法で配置されなければならないことを意味する：「するように構成される」は、記載された機能を実行するように修正されることが「可能である」当該技術分野の構造を除外するが、当該技術分野に関連する開示は、そうするための明確な教示を有していない。例えば、「構造Ｘから上部に流体を受け入れ、下部から構造Ｙに流体を送るように構成された容器」の記載は、構造Ｘ、構造Ｙ、及び容器が全て、列挙された機能を実行するように配置されているように開示されているシステムに限定される。記載された文「するように構成された」は、単にそれらの構成によって列挙された機能を実行することが「可能であり得る」要素を除外するが、関連する開示（またはその欠如）は、列挙された全ての構造間の機能的制限を満たすようにそのような修正を行うための教示を提供しない。別の例は、「一連の命令Ｘ、Ｙ、及びＺを実行するように構成された、またはプログラムされたコンピュータシステム」である。この例では、命令は、コンピュータシステムが、列挙された命令を実行するように「構成される」及び／または「プログラムされる」ように非一時的なコンピュータ可読媒体上に存在しなければならない：「構成される」及び／または「プログラムされる」は、列挙された命令がその上に格納されているが、命令Ｘ、Ｙ、及びＺの教示がプログラムされて格納されていない非一時的なコンピュータ可読媒体を有するコンピュータシステムを示唆する技術を除外する。記載された文「するように構成される」はまた、物理的構造と併せて使用される場合、動作可能に接続されたものと同義であると解釈され得る。

【0077】

本明細書にて使用される表現及び用語は、説明を目的とするものであり、限定するものとみなすべきではないことが理解されよう。本明細書における「含む（ｉｎｃｌｕｄｉｎｇ）」、「備える（ｃｏｍｐｒｉｓｉｎｇ）」、または「有する（ｈａｖｉｎｇ）」及びこれらの変形の使用は、それ以降に掲載されるアイテム及びその同等物並びに付加的なアイテムを包含することが意味される。特に指示又は限定がない限り、「搭載（ｍｏｕｎｔｅｄ）」、「接続（ｃｏｎｎｅｃｔｅｄ）」、「サポート（ｓｕｐｐｏｒｔｅｄ）」及び「結合（ｃｏｕｐｌｅｄ）」という用語及びこれらの変形は広義に使用されるものであり、直接的及び間接的な搭載、接続、サポート及び結合を包含する。更に、「接続」及び「結合」は、物理的又は機械的な接続又は結合に制限されるものでない。

【0078】

前述の詳細な説明は、図面を参照して読まれるべきであり、異なる図面の同様の要素は、同様の参照番号を有する。必ずしも一定のスケールではない図面は、いくつかの実施形態を示し、システムの実施形態の範囲を限定することを意図していない。

【0079】

本発明の一部を形成する本明細書に記載の動作のいずれかは、有用な機械動作である。本発明はまた、これらの動作を実行するためのデバイスまたは装置に関する。装置は、専用コンピュータなど、必要な目的のために特別に構築することができる。専用コンピュータとして定義される場合、コンピュータはまた、特殊目的の一部ではない他の処理、プログラム実行、またはルーチンを実行することができ、同時に特殊目的のために動作することができる。あるいは、動作は、コンピュータメモリに格納された、キャッシュに格納された、またはネットワークを介して取得された１つまたは複数のコンピュータプログラムによって選択的にアクティブ化または構成された汎用コンピュータによって処理され得る。データがネットワークを介して取得されるとき、データは、ネットワーク上の他のコンピュータ、例えば、コンピューティングリソースのクラウドによって処理され得る。

【0080】

本発明の実施形態はまた、ある状態から別の状態にデータを変換する機械として定義することができる。データは、電子信号として表され、データを電子的に操作することができる物品を表すことができる。変換されたデータは、場合によっては、ディスプレイ上に視覚的に描写され、データの変換から生じる物理的オブジェクトを表し得る。変換されたデータは、一般的に、または物理的及び有形のオブジェクトの構築または描写を可能にする特定のフォーマットでストレージに保存することができる。いくつかの実施形態では、操作は、プロセッサによって実行することができる。このような例では、プロセッサは、データをあるものから別のものに変換する。さらに、いくつかの実施形態は、ネットワークを介して接続することができる１つまたは複数のマシンまたはプロセッサによって処理され得る方法を含む。各マシンは、ある状態または事物から別の状態または事物にデータを変換することができ、また、データを処理すること、データをストレージに保存すること、ネットワークを介してデータを送信すること、結果を表示すること、または結果を別のマシンに通信することもできる。本明細書で使用されるコンピュータ可読記憶媒体は、（信号とは対照的に）物理的または有形の記憶装置を指し、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報の有形記憶のための任意の方法または技術で実装される揮発性及び不揮発性、リムーバブル及びリムーバブルな記憶媒体を含むが、これらに限定されない。

【0081】

いくつかの実施形態によれば、方法動作は特定の順序で提示されるが、それらのステップの実行は、明示的に指定されない限り、必ずしもリストされた順序で発生するわけではない。他のハウスキーピング動作は、動作の間に実行することができ、動作は、それらがわずかに異なる時間に発生するように調整することができ、及び／または動作は、オーバーレイ動作の処理が所望の方法で実行され、所望のシステム出力をもたらす限り、処理に関連付けられた様々な間隔で処理動作の発生を可能にするシステムに分散することができる。

【0082】

本開示及びその利点は詳細に説明されているが、添付の特許請求の範囲によって定義される本開示の精神及び範囲から逸脱することなく、本明細書で様々な変更、置換及び代替を代替を行えることを理解されたい。さらに、本出願の範囲は、本明細書に記載のプロセス、機械、製造、物質の組成、手段、方法及びステップの特定の実施形態に限定されることを意図するものではない。当業者が本開示から容易に理解するように、本明細書に記載の対応する実施形態と実質的に同じ機能を実行する、または実質的に同じ結果を達成する、現在存在する、または後で開発されるプロセス、機械、製造、物質の組成物、手段、方法、またはステップは、本開示に従って利用され得る。従って、添付の特許請求の範囲は、それらの範囲内に、そのようなプロセス、機械、製造、物質の組成物、手段、方法またはステップを含むことを意図している。

【図1】