(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024060664
(43)【公開日】2024-05-07
(54)【発明の名称】無人店舗行動通知システムおよびその方法
(51)【国際特許分類】
G08B 25/04 20060101AFI20240425BHJP
G08B 25/00 20060101ALI20240425BHJP
【FI】
G08B25/04 E
G08B25/00 510M
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2022168069
(22)【出願日】2022-10-20
(71)【出願人】
【識別番号】518054858
【氏名又は名称】NSENSE株式会社
(74)【代理人】
【識別番号】100083138
【弁理士】
【氏名又は名称】相田 伸二
(74)【代理人】
【識別番号】100189625
【弁理士】
【氏名又は名称】鄭 元基
(74)【代理人】
【識別番号】100196139
【弁理士】
【氏名又は名称】相田 京子
(74)【代理人】
【識別番号】100199004
【弁理士】
【氏名又は名称】服部 洋
(72)【発明者】
【氏名】ハン サンジョン
(72)【発明者】
【氏名】ミン ギョンファン
【テーマコード(参考)】
5C087
【Fターム(参考)】
5C087AA10
5C087AA19
5C087DD05
5C087EE18
5C087FF01
5C087FF02
5C087FF04
5C087GG02
5C087GG06
5C087GG08
5C087GG10
5C087GG22
5C087GG66
5C087GG70
(57)【要約】 (修正有)
【課題】無人店舗から顧客の特定の行動に対して端末に通知を受ける無人店舗行動通知システム及び無人店舗の行動通知方法を提供する。
【解決手段】映像処理端末100と、サービス提供サーバー200と、ユーザ端末300を含むシステムにおいて、無人店舗で人を検出し、人の行動を推定して通知する無人店舗の行動通知方法方法であって、無人店舗で映像を取得する段階と、取得した映像から特定人を検出する段階と、特定人が検出された映像データが特定の個数になるまで蓄積する段階と、記蓄積された映像データが特定の個数を越えると、蓄積された映像データをもって特定人の行動を判別する段階と判別した行動を予め定められた端末に通知する段階と、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
映像を取得する映像取得部と、前記映像からディープラーニング方法によって人を抽出する客体抽出部と検出された客体が既存の人であるか新規の人であるかを判別する客体判別部と、映像の客体の動きを追跡する客体追跡部と前記客体の映像を取りまとめる客体取りまとめ部と、前記取りまとめられた客体の行動を判定する行動判定部を有する映像処理端末と;
前記判定された行動に対するデータを保存する行動履歴DBと、店舗情報と通知する行動パターン情報および連絡先情報を有するユーザ情報DBと、前記行動履歴DBとユーザ情報DBの情報により端末に特定の行動を通知する特定行動通知部と、前記判定された行動に対するデータを行動履歴DBに保存させ、前記特定行動通知部を制御する行動履歴保存部を有するサービス提供サーバーと;
前記サービス提供サーバーと特定行動通知部から通知を受信する通知受信部と、前記受信された特定の行動を表示する特定行動履歴表示部を有する端末を含む、無人店舗行動通知システム。
【請求項2】
無人店舗で映像を取得する段階と;
前記取得した映像から特定人を検出する段階と;
前記特定人が検出された映像データが特定の個数になるまで蓄積する段階と;
前記蓄積された映像データが特定の個数を越えると前記蓄積された映像データをもって前記特定人の行動を判別する段階と;
前記判別された行動を予め定められた端末に通知する段階を含む、無人店舗の行動通知方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は無人店舗で人を検出し、人の行動を推定できるシステムに関するもので、ディープラーニングを利用している。
【背景技術】
【0002】
従来無人店舗に関する発明は決済を如何にすべきかに主にフォーカスが合わせられており、無人店舗に入ってきた顧客の行動を正しく分析できるシステムは開示されていなかった。
【0003】
例えば、日本特許公開第2019-121012は無人店舗の決済と販売に集中している。
【0004】
日本特許公開第2021-012518の場合も販売管理に重点を置いている。
本発明の目的は、無人システムで人を検出し、人の行動を推定してそれを特定の端末に通知するシステムを提供することである。
【発明の概要】
【課題を解決するための手段】
【0005】
前記目的を達成するために、本発明は無人店舗に設置される映像処理端末と、クラウドサーバーであるサービス提供サーバーとユーザ端末機からなる無人店舗顧客行動通知方法およびシステムを提供する。
【0006】
前記映像処理端末はカメラである映像取得部と、前記映像から客体を抽出する客体抽出部と、抽出された客体を判別する客体判別部と、判別された客体を追跡する客体追跡部、追跡された客体の映像を取りまとめる客体取りまとめ部と客体取りまとめ部の情報に基づいて客体の行動を判定する行動判定部を有している。
【0007】
前記行動判定部の結果はサービス提供サーバーの行動履歴保存部に送信される。
サービス提供サーバーは前記行動履歴保存部と、行動履歴が蓄積された行動履歴DBと、ユーザ情報を蓄積したユーザ情報DBとユーザ情報DBからユーザの情報と行動履歴DBからの行動情報を通知する特定行動通知部を有している。
【0008】
前記ユーザ情報と行動情報はユーザ端末機の通知受信部に送られて、ユーザ端末に特定行動履歴表示部によって表示されることになる。
【0009】
一方、本発明に係る無人店舗顧客行動検出方法は、カメラで映像を取得する段階と;取得された映像データから人を検出する段階と;前記検出された人データを一時記憶させる段階と;前記記憶された人データのイメージ数が定められた範囲を越える場合には、その人データの行動を推定する段階と;前記推定された行動が信頼可能である場合、ユーザ端末機に送信する段階を含む。
【発明の効果】
【0010】
本システムおよび方法によって、無人店舗から顧客の特定の行動に対して端末に通知を受けることができるようになるので、店舗管理が便利となる。
【図面の簡単な説明】
【0011】
【
図1】本発明に係る無人店舗顧客行動通知システムのブロック図である。
【
図2】本発明に係る無人店舗顧客行動通知方法を図示したフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明に係る好ましい実施例を添付された図面を参照して詳しく説明する。
図1は、本発明に係る無人店舗顧客行動検出システムのブロック図である。
図示された通り、本発明に係るシステムは映像処理端末100と、サービス提供サーバー200と、ユーザ端末300を含んでおり、映像処理端末100は店舗内に設置される映像分析用PCである。
【0013】
無人店舗の必要な地点、例えば、カウントやテーブル座席や、商品が陳列されたところなど、必要な数だけのカメラ101が設置され、このカメラ101から映像を取得(101)する。
【0014】
次いで、取得された映像データは客体抽出部104に行き、人であるかを検出する。この時、ディープラーニングを使い、すでに知られている畳み込みニューラルネットワークを使う。すなわち、映像データが一定以上の臨界値を越えた場合に人と判定することになる。
【0015】
人と判定した場合には、このデータを関心領域に指定する。関心領域は4個の座標で指定することになるが、位置と大きさすなわち、四角型の位置データとなるのである。この位置データをPOI(Point Of Interest、関心領域または関心地点)として登録するが、このPOIは客体判別部106で映像データで把握される客体が新しい人であるか既存の人であるかを判別する役割をすることになる。例えば、他の映像データが取得される場合、既存POIと比較して定めておいた値以上に重なると既存客体と見なし、その値以下であれば新しい客体と見なして新しくPOIを登録する。このような方式をIOUという。IOUの任意の臨界値を基準として判断する。既存客体と見なす場合にもPOI値は変わるので新しい値に更新することになる。
【0016】
一方、もし客体判別部108で複数の客体が判別される場合には、それぞれに対してPOIを分析することになる。
【0017】
同一人物のPOIデータは客体追跡部110によって持続的にアップデートされ、客体追跡プログラムを使用するが、例えばテンプレートマッチング方法を使うことができる。この時、客体取りまとめ部110は一定時点までのPOI情報を取りまとめることになり、例えば1秒に15フレームを取りまとめるとすると、本発明では2秒に該当する30フレームに決めることができる。この取りまとめられた情報に基づいて行動判定部112では行動を判定する。この時もディープラーニングを使う。行動は多様に区分しておくことができ、例えば、倒れる行動、物を持ち上げる行動、店員を呼ぶ行動、暴力的な行動などがあり得る。取りまとめられた特定人のデータをディープラーニングによって特定の行動と判定することになる。この時、コンフィデンス値がこの場合に定められた一定の臨界値を越えるとその行動として把握することになるのである。もちろん、じっとして立っている場合もある。このような場合には、本発明の関心行動ではないのでunknownとして判定してもよく、立っているとしてもよい。
【0018】
判定された行動データはサービス提供サーバー200の行動履歴保存部202に送られ、行動履歴保存部202はプロセッサとして判定された行動を行動履歴DB204に保存させ、また、特定行動通知部208に命令を出す。
【0019】
特定行動通知部208はユーザ情報DB206と行動履歴DB204を見て判断するが、ユーザ情報DB206には店舗名、通知すべき特定行動パターン、通知すべき対象などが記録されている。例えば、A店舗に倒れた人がいる場合にはa氏に連絡するという情報が保存されている。
【0020】
この時、すべての行動データを通知してもよく、特に関心を置くべき行動に対してのみ通知をするようにすることができる。例えば、店員の案内が必要な場合に通知してほしいという店舗がある反面、店員の案内を通知すれば過度に通知が多く来るので、物を盗む行動に対してのみ通知を受けたいという店舗もあり得る。
【0021】
ユーザ端末300の通知受信部302はサービス提供サーバー200から特定の行動の通知を受信し、特定行動履歴表示部304でこれをディスプレーすることになる。ディスプレイする方式は、端末であるスマートフォンの画面に表示するか、関連アプリケーションを通じて表示するようにすることができ、文字方式であってもよく、これは特別な技術を要する分野ではなく、通常の方法を利用すればよいので詳しい説明を省略する。
【0022】
以下では、
図2のフローチャートを参照しながら、本発明のシステムを利用した、無人店舗顧客検出方法について説明する。
まず、カメラなどで映像データを取得する。(S10)
【0023】
最初の場合、POI登録されたものがないので検出領域のPOIが0以上とならないため(S20)、人検出(S50)に行く。この時、人検出はディープラーニングを通じて推論して例えば、Pという人であることを確定する。
【0024】
比較するPOIがない新規検出(S60)であるので検出領域のPOIを登録し(S80)、POIが0以上であるのでPに該当する検出領域を切り取り(S100)、メモリに検出対象領域を一時記憶させる(S110)。この時、検出対象数が30に達するかを検討して、もし30に達していなければ30に達するまで再び最初の映像取得に戻る。すなわち、本実施例では1秒に15フレームの映像データを取得するので、30個のフレームとは2秒を意味する。2秒にならないと人の行動を推論できないという経験則に則り、本実施例は30個のフレームを基準とする。
【0025】
再び最初に戻って、人Pが少し動いた場合の2番目のフレームを例にしてみよう。すでにPを登録したのでS20段階でPOIは1であるので、下に降りてきて変わったPOIを追跡する(S30)。追跡は直前のフレーム(n-1フレームすなわち、一番目のフレーム)で登録したPOIをテンプレートマッチング方法などを利用して対象を追跡する(S30)。そして、新しいPOIは更新して登録する(S40)。
【0026】
人検出(S50)に行くとPという人が検出され、新規検出(S60)ではないので検出領域POIを更新する(S70)。前で追跡(S20)後に検出領域POIを更新する段階(S40)があるが、ディープラーニング段階で検索されたPOIがより正確であるので、ここでもう一度POI情報を更新することになる(S70)。
まだPに対するフレームが2枚しかないので、30フレームになるまで継続してPに対するPOIを臨時記憶させることになる(S110)。
【0027】
次いで、例えば3番目のフレームに人Pが新しい人Qとともに登場した場合の例をあげて説明する。
検出領域にすでに登録した人Pがいて1であるので(S20)、人Pに対しては検出領域追跡(S30)に入り、人Pと人Qが検出され、Pは既存の人なので検出領域POIを更新し(S40)、人Qは新規検出(S60)となる。この時、既存POIとの面積を比較し、畳み込みニューラルネットワークでのIoUが臨界値以上であるかどうかによってその人が新規検出された人であるか否かを判定する。人Qに対する検出領域POIを登録し(S80)、続けて進行される。
【0028】
検出対象者Pが30フレームになった時(S120)、行動推定(S130)をディープラーニングを通じてすることになり、この時、ディープラーニングは判断した行動とその判断のコンフィデンス(confidence)を提示することになる。コンフィデンス値は0-1であってもよく、0-100であってもよく、設定する次第である。高いほどディープラーニングの判断に対する信頼性が高い。
【0029】
人が倒れる行動と判断したのが60のコンフィデンス値を有し、座ろうとする行動は50のコンフィデンス値などでディープラーニングの結果が出ることになるが、最も高いコンフィデンスを倒れる行動としよう。ところで、この場合のコンフィデンス値が60であるが。信頼できる臨界値を60とするとこれは臨界値以上であるので信頼性があることになる。ところが臨界値を70と設定すると、この30フレームで信頼できる行動はなくなるのである。信頼可能であれば(S140)、サーバーに行動判定に対する値を送って、最終的にユーザ端末に通知することになる(S150)。
【0030】
行動判断をディープラーニングによる推論段階とともに、信頼性まで判断する2段階に亘ってすることによって、行動判断に対してより信頼性を高めることができる。
一方、30フレームを超えると再び新しく30フレームを集めることになり、30フレーム前に特定人がなくなるとその人に対しては判断ができなくなる。再び現れるのであれば以前のデータと足してもよく、そうでなければ新しく30個をカウントしてもよい。
【手続補正書】
【提出日】2024-01-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
映像を取得する映像取得部と、前記映像からディープラーニング方法によって人を抽出する客体抽出部と検出された客体が既存の人であるか新規の人であるかを判別する客体判別部と、映像の客体の動きを追跡する客体追跡部と前記客体の映像を取りまとめる客体取りまとめ部と、前記取りまとめられた客体の行動を判定する行動判定部を有する映像処理端末と;
前記判定された行動に対するデータを保存する行動履歴DBと、店舗情報と通知する行動パターン情報および連絡先情報を有するユーザ情報DBと、前記行動履歴DBとユーザ情報DBの情報により端末に特定の行動を通知する特定行動通知部と、前記判定された行動に対するデータを行動履歴DBに保存させ、前記特定行動通知部を制御する行動履歴保存部を有するサービス提供サーバーと;
前記サービス提供サーバーの特定行動通知部から通知を受信する通知受信部と、前記受信された特定の行動を表示する特定行動履歴表示部を有する端末を含む、無人店舗行動通知システム。