▶ 富士通株式会社の特許一覧
特開2024-82953情報処理プログラム、情報処理方法および情報処理装置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024082953
(43)【公開日】2024-06-20
(54)【発明の名称】情報処理プログラム、情報処理方法および情報処理装置
(51)【国際特許分類】
G06Q 30/0203 20230101AFI20240613BHJP
G06Q 30/0601 20230101ALI20240613BHJP
【FI】
G06Q30/0203
G06Q30/0601
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022197189
(22)【出願日】2022-12-09
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】周田 ありす
(72)【発明者】
【氏名】外川 太郎
(72)【発明者】
【氏名】木幡 駿
【テーマコード(参考)】
5L030
5L049
【Fターム(参考)】
5L030BB02
5L030BB72
5L049BB02
5L049BB72
(57)【要約】
【課題】商品に対する顧客の評価を特定すること。
【解決手段】情報処理装置は、店内を撮影した映像を取得する。情報処理装置は、取得した映像を分析することで、映像の中の店内に配置された商品を含む第一の領域と、映像の中の店内で商品を購入する対象の人物を含む第二の領域と、第一の領域および第二の領域の相互作用を識別した関係性とを特定する。情報処理装置は、特定された関係性と、第一の領域に含まれる商品とを対応付ける。
【選択図】
図2
【特許請求の範囲】
【請求項1】
店内を撮影した映像を取得し、
取得した前記映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定し、
特定された前記関係性と、前記第一の領域に含まれる商品とを対応付ける
処理をコンピュータに実行させることを特徴とする情報処理プログラム。
【請求項2】
前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、特定された前記関係性の種類毎の数を計数し、
商品毎に、前記関係性の種類毎の数と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力される
処理を更にコンピュータに実行させることを特徴とする請求項1に記載の情報処理プログラム。
【請求項3】
前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、複数の関係性のうち、ある関係性となる時間を計数し、
商品毎に、前記ある関係性となる時間と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力させる
処理を更にコンピュータに実行させることを特徴とする請求項1に記載の情報処理プログラム。
【請求項4】
特定された前記関係性と、予め設定されたルールとに基づいて、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記第一の領域に含まれる商品とを対応付けた情報を記憶部に登録し、
前記記憶部に登録された情報を基にして、商品毎に、前記注目部分と、前記注目部分に注目した人物の人数とを対応付けた商品情報を生成し、
生成した商品情報を表示装置に出力させる
処理を更にコンピュータに実行させることを特徴とする請求項1に記載の情報処理プログラム。
【請求項5】
前記第二の領域の画像を分析することで、前記人物の骨格情報を生成し、
生成された前記骨格情報を基にして、前記第二の領域の人物による、前記第一の領域に含まれる商品の把持の仕方を特定し、
特定された前記把持の仕方に基づいて、前記人物が前記商品のデザインを注目する行動を行ったか、または、前記商品の材料を注目する行動を行ったのかを識別し、
識別された行動を基にして、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記商品とを対応付けた情報を記憶部に登録する
処理を更にコンピュータに実行させることを特徴とする請求項1に記載の情報処理プログラム。
【請求項6】
前記特定する処理は、前記映像を機械学習モデルに入力することで、前記第一の領域と、前記第二の領域と、前記関係性とを特定し、
前記機械学習モデルは、商品を購入する人物を示す第一クラスおよび前記人物が出現する領域を示す第一領域情報と、商品を含む物体を示す第二クラスおよび前記物体が出現する領域を示す第二領域情報と、前記第一クラスおよび前記第二クラスの相互作用とを識別するように機械学習が実行されたHOID(Human Object Interaction Detection)用のモデルであることを特徴とする請求項1に記載の情報処理プログラム。
【請求項7】
店内を撮影した映像を取得し、
取得した前記映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定し、
特定された前記関係性と、前記第一の領域に含まれる商品とを対応付ける
処理をコンピュータが実行することを特徴とする情報処理方法。
【請求項8】
店内を撮影した映像を取得し、
取得した前記映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定し、
特定された前記関係性と、前記第一の領域に含まれる商品とを対応付ける
処理を実行する制御部を有することを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理プログラム等に関する。
【背景技術】
【0002】
メーカーが新たな商品を開発した場合、かかる商品が顧客からどのような評価を得ているのかを把握することが重要である。このため、たとえば、メーカーは、商品を本格的に市場に投入する前に、実販売テスト、アンケート調査等のテストマーケティングを実行し、顧客の評価を得ている。
【0003】
メーカーは、テストマーケティングによって、商品に対して顧客からの良い反応を確認することができれば、商品を大々的に販売することができる。一方、商品に対して、顧客からの反応が悪い場合には、商品に改良を加えて再テストしたり、商品の販売を中止したりする対応を行うことができる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した従来技術では、商品に対する顧客の評価を特定することが難しい問題があった。
【0006】
たとえば、顧客が商品に対して興味を持ったとしても、商品の購入に至らないケースがあり得る。また、実際に商品を見かけて初めて、興味を持つ場合もある。従来技術では、このように顧客の興味の対象となった商品を適切に評価することができていない。
【0007】
1つの側面では、本発明は、商品に対する顧客の評価を特定することができる情報処理プログラム、情報処理方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
第1の案では、コンピュータに次の処理を実行させる。コンピュータは、店内を撮影した映像を取得する。コンピュータは、取得した映像を分析することで、映像の中の店内に配置された商品を含む第一の領域と、映像の中の店内で商品を購入する対象の人物を含む第二の領域と、第一の領域および第二の領域の相互作用を識別した関係性とを特定する。コンピュータは、特定された関係性と、第一の領域に含まれる商品とを対応付ける。
【発明の効果】
【0009】
商品に対する顧客の評価を特定することができる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、本実施例1に係るシステムの一例を示す図である。
【
図2】
図2は、本実施例1に係る情報処理装置の処理を説明するための図である。
【
図3】
図3は、HOIDの機械学習を説明する図である。
【
図4】
図4は、本実施例1に係る情報処理装置の構成を示す機能ブロック図である。
【
図5】
図5は、本実施例1に係る商品情報テーブルのデータ構造の一例を示す図である。
【
図6】
図6は、本実施例1に係る情報処理装置の処理手順を示すフローチャートである。
【
図7】
図7は、本実施例2に係る情報処理装置の構成を示す機能ブロック図である。
【
図8】
図8は、本実施例2に係る商品情報テーブルのデータ構造の一例を示す図である。
【
図9】
図9は、ルール情報のデータ構造の一例を示す図である。
【
図10】
図10は、本実施例2に係る情報処理装置の処理手順を示すフローチャートである。
【
図11】
図11は、人体モデルの一例について説明する図である。
【
図13】
図13は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0011】
以下に、本願の開示する情報処理プログラム、情報処理方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
【実施例0012】
図1は、本実施例1に係るシステムの一例を示す図である。
図1に示すように、このシステムは、カメラ10a,10b,10cと、情報処理装置100とを有する。カメラ10a~10cと、情報処理装置100とは、ネットワークを介して相互に接続される。
図1では説明の便宜上、カメラ10a~10cのみを示すが、本実施例1に係るシステムは、他のカメラを有していてもよい。
【0013】
カメラ10a~10cは、店内の所定の位置に設置される。店内には、複数の商品が配置される。カメラ10a~10cが設置される位置(座標)を、それぞれ異なる位置とする。以下の説明では、カメラ10a~10cを特に区別しない場合「カメラ10」と表記する。
【0014】
カメラ10は、店内の映像を撮影し、撮影した映像のデータを、情報処理装置100に送信する。以下の説明では、カメラ10が情報処理装置100に送信する映像のデータを、「映像データ」と表記する。
【0015】
映像データには、時系列の複数の画像フレームが含まれる。各画像フレームには、時系列の昇順に、フレーム番号が付与される。1つの画像フレームは、カメラ10があるタイミングで撮影した静止画像である。各画像フレームには、時刻のデータが付与されていてもよい。映像データには、映像データを撮影したカメラ10を識別するカメラ識別情報が設定される。
【0016】
情報処理装置100は、店内の映像データを取得し、取得した映像データを分析することで、店内に配置された商品を含む第一の領域と、商品を購入する対象の顧客を含む第二の領域と、第一の領域および第二の領域の相互作用を識別した関係性を特定する。情報処理装置100は、特定した関係性と、第一の領域に含まれる商品とを対応付ける。これによって、商品の評価に有効な情報となる、商品と関係性との対応関係の情報を生成することができる。
【0017】
図2は、本実施例1に係る情報処理装置の処理を説明するための図である。たとえば、情報処理装置100は、カメラ10が撮影した映像データ20を分析することで、商品を含む第一の領域20aと、商品を購入する対象の顧客を含む第二の領域20bと、第一の領域20aおよび第二の領域20bの関係性を特定する。
図2に示す例では、第一の領域20aと、第二の領域20bとの関係性を「把持している」とする。この場合、情報処理装置100は、特定した関係性「把持している」と、第一の領域20aに含まれる商品とを対応付ける。たとえば、情報処理装置100が、上記の処理を繰り返し実行し、第一の領域20aに含まれる商品に対し、複数の顧客による関係性「把持している」が対応付けられる場合には、かかる商品を、顧客の興味を引く商品として評価することができる。
【0018】
図2で説明した例では、第一の領域と、第二の領域との関係性を「把持している」として説明したが、関係性には「見ている」、「触っている」、「座る」等の他の関係性も含まれる。
【0019】
ここで、情報処理装置100は、HOID(Human Object Interaction Detection)を用いて、商品を含む第一の領域と、商品を購入する対象の顧客を含む第二の領域と、第一の領域および第二の領域の関係性を特定する。情報処理装置100が、映像データ(時系列の画像フレーム)をHOIDに入力することで、第一の領域、第二の領域、関係性の情報が出力される。
【0020】
ここで、情報処理装置100が実行するHOIDの学習処理の一例について説明する。情報処理装置100は、複数の訓練データを用いて、人物を示す第1クラスと、物体を示す第2クラスと、第1クラスおよび第2クラスの関係性とを識別するHOIDを訓練する。
【0021】
各訓練データは、入力データとなる画像データ(画像フレーム)と、当該画像データに対して設定された正解情報とを有する。
【0022】
正解情報には、検出対象であるヒトとモノのクラスと、ヒトとモノの相互作用を示すクラスと、各クラスの領域を示すBbox(Bounding Box)とが設定される。たとえば、正解情報として、物体を示すSomethingクラスの領域情報、ユーザを示すヒトのクラスの領域情報、Somethingクラスとヒトのクラスとの相互作用を示す関係性とが設定される。
【0023】
なお、訓練データにも、複数のクラスと複数の相互作用を設定することができ、訓練済みのHOIDも複数のクラスと複数の相互作用とを認識することができる。
【0024】
一般的に、通常の物体認識でSomethingクラスを作ると、すべての背景、服装品、小物などタスクと関係ないものをすべて検出することになる。かつ、それらはすべてSomethingなので、画像データ内に大量のBboxが認識されるだけで何も分からない。HOIDの場合は、ヒトのモノに対する特殊な関係性(把持している、座っている、操作している、など他の関係の場合もある)であることが分かるので、意味のある情報としてタスクに利用することができる。
【0025】
図3は、HOIDの機械学習を説明する図である。
図3に示すように、情報処理装置100は、訓練データの入力データをHOIDに入力し、HOIDの出力結果を取得する。この出力結果には、HOIDが検出したヒトのクラスと、モノのクラスと、ヒトとモノの相互作用などが含まれる。そして、情報処理装置100は、訓練データの正解情報と、HOIDの出力結果との誤差情報を算出し、誤差が小さくなるように、誤差逆伝播によりHOIDの機械学習を実行する。
【0026】
続いて、HOIDを用いた識別処理の一例について説明する。情報処理装置100は、カメラ10が撮影した映像データの各画像フレームを、HOIDに入力し、HOIDの出力結果を取得する。HOIDの出力結果には、ヒトのBbox、モノのBbox、ヒトとモノの相互作用の確率値(各関係性の確率値)およびクラス名などが含まれる。モノのBboxは、上記の第一の領域に対応する。ヒトのBboxは、上記の第二の領域に対応する。情報処理装置100は、HOIDの出力結果に基づき、関係性を特定する。たとえば、情報処理装置100は、確率値が最大となる関係性を、第一の領域と第二の領域との関係性として特定する。
【0027】
上記のように、情報処理装置100は、映像データを、HOIDに入力することで、第一の領域、第二の領域、関係性を特定することができる。なお、情報処理装置100は、機械学習済みのHOIDを予め記憶部に保持しておき、係るHOIDを用いて、第一の領域、第二の領域、関係性を特定してもよい。
【0028】
次に、
図2に示した処理を実行する情報処理装置100の構成例について説明する。
図4は、本実施例1に係る情報処理装置の構成を示す機能ブロック図である。
図4に示すように、この情報処理装置100は、通信部110と、入力部120と、表示部130と、記憶部140と、制御部150とを有する。
【0029】
通信部110は、ネットワークを介して、カメラ10、外部装置等との間でデータ通信を実行する。通信部110は、NIC(Network Interface Card)等である。たとえば、通信部110は、カメラ10から、映像データを受信する。
【0030】
入力部120は、情報処理装置100の制御部150に各種の情報を入力する入力装置である。たとえば、入力部120は、キーボードやマウス、タッチパネル等に対応する。
【0031】
表示部130は、制御部150から出力される情報を表示する表示装置である。たとえば、表示部130は、後述する商品情報を表示する。商品情報は、第一の領域に含まれる商品の情報と、関係性とを対応付けた情報である。
【0032】
記憶部140は、HOID141、映像バッファ142、商品情報テーブル143を有する。記憶部140は、メモリなどの記憶装置である。
【0033】
HOID141は、
図3等で説明したHOIDである。HOID141に、映像データの画像フレームを入力することで、画像フレーム上の第一の領域と、第二の領域と、第一の領域および第二の領域の関係性とが出力される。
【0034】
映像バッファ142は、カメラ10が撮影した映像データを保持する。たとえば、映像バッファ142は、カメラ識別情報に対応付けて、映像データを保持する。
【0035】
商品情報テーブル143は、第一の領域に含まれる商品に関する情報を保持する。
図5は、本実施例1に係る商品情報テーブルのデータ構造の一例を示す図である。
図5に示すように、この商品情報テーブル143は、商品識別情報と、関係性と、回数と、時間とを対応付ける。
【0036】
商品識別情報は、商品を識別する情報である。関係性は、該当する商品を含む第一の領域と、第二の領域との関係性である。回数は、該当する関係性であると判定された回数である。各回数の初期値は「0(回)」である。時間は、該当する関係性となった時間である。各時間の初期値は「0(s)」である。
【0037】
たとえば、
図5の説明では、商品識別情報「品目1-1」に関し、関係性「見ている」の回数は「5」、時間は「15」である。商品識別情報「品目1-1」に関し、関係性「触っている」の回数は「1」、時間は「2」である。商品識別情報「品目1-1」に関し、関係性「把持している」の回数は「6」、時間は「20」である。商品識別情報「品目1-1」に関し、関係性「座っている」の回数は「0」、時間は「0」である。
【0038】
図5に示す例では、関係性として、「見ている」、「触っている」、「把持している」、「座っている」を示すが、その他の関係性も含まれる。
【0039】
図4の説明に戻る。制御部150は、取得部151と、分析部152と、生成部153と、学習部154とを有する。制御部150は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)等である。
【0040】
取得部151は、カメラ10から映像データを取得する。上記のように、映像データには、映像データを撮影したカメラ10のカメラ識別情報が設定されている。取得部151は、カメラ識別情報に対応付けて、映像データを映像バッファ142に格納する。
【0041】
分析部152は、映像バッファ142から映像データを取得し、映像データを分析することで、第一の領域と、第二の領域と、関係性とを特定する。たとえば、分析部152は、映像データに含まれる時系列の画像フレームを、HOID141に入力し、各画像フレーム上の第一の領域、第二の領域、関係性を特定する。
【0042】
分析部152は、第一の領域に含まれる商品、および、第二の領域に含まれる人物を識別する。たとえば、分析部152は、HOID141の出力結果を基にして、第一の領域に含まれる商品を識別する。分析部152は、画像フレームの領域を入力とし、第一の領域内の商品の識別情報(商品識別情報)を出力とする訓練済みの学習モデルを用いて、第一の領域に含まれる商品を識別してもよい。また、分析部152は、第二の領域に含まれる人物に対してユニークな人物識別番号を割り当てる。分析部152は、第二の領域に含まれる人物のトラッキングを行い、同一の人物には、同一の人物識別番号を設定する。人物(顧客)を識別する情報を、「人物識別情報」と表記する。
【0043】
分析部152は、上記処理を繰り返し実行することで、時系列の画像フレーム毎に、第一の領域に含まれる商品の商品識別情報、第二の領域に含まれる人物の人物識別情報、関係性を特定する。分析部152は、特定した結果を基にして、商品情報テーブル143の商品識別情報に対応するレコードを更新する。
【0044】
たとえば、分析部152は、フレーム番号N~フレーム番号N+10の各画像フレームの第一の領域の商品について、商品識別情報「品目1-1」を識別し、関係性が「見ている」であったとする。また、分析部152は、フレーム番号N+11~フレーム番号N+20の各画像フレームの第一の領域の商品について、関係性が「触っている」であったとする。
【0045】
この場合、分析部152は、商品情報テーブル243において、商品識別情報「品目1-1」に対する関係性「見ている」および「触っている」に対応する回数に「1」を加算する。分析部152は、連続する画像フレームにおいて、同一の関係性を特定した場合には、かかる一連の関係性が1回発生したものとして処理を行う。
【0046】
また、分析部152は、同一の商品識別情報と、人物識別情報との組に対応する関係性について、同一の関係性を何度特定しても、かかる関係性を1回として処理してもよい。たとえば、分析部152は、所定の期間内において、第一の領域に含まれる商品Aを、第二の領域に含まれる人物Bさんが、何度、触ったとしても、商品Aに対応する関係性「触っている」の回数に「1」を加算する。分析部152がかかる処理を実行することで、商品情報テーブル143に登録される関係性の回数を、商品に対して該当関係性をもった人物の人数として取り扱うことができる。
【0047】
また、分析部152は、フレーム番号N~フレーム番号N+10に対応する時間を、商品識別情報「品目1-1」に対する関係性「見ている」の時間に加算する。分析部152は、フレーム番号N+11~フレーム番号N+20に対応する時間を、関係性「触っている」の時間に加算する。
【0048】
生成部153は、商品情報テーブル143を基にして、商品識別情報毎に、関係性の種別と、回数と、時間とを対応付けた商品情報を生成する。生成部153は、生成した商品情報を、表示部130に出力して表示させる。
【0049】
なお、生成部153は、商品情報テーブル143を基にして、商品識別情報毎に、関係性の種別および回数を対応付けた商品情報と、関係の種別および時間を対応付けた商品情報とを別々に生成し、表示部130に出力して表示させてもよい。
【0050】
学習部154は、複数の訓練データを基にして、HOID141の機械学習を実行する。学習部154は、複数の訓練データを予め取得しておく。学習部154は、訓練データをHOID141に入力し、訓練データの正解情報と、HOID141の出力結果との誤差情報を算出し、誤差が小さくなるように、誤差逆伝播によりHOID141の機械学習を実行する。その他の機械学習に関する説明は、
図3で説明した内容と同様である。
【0051】
次に、本実施例1に係る情報処理装置100の処理手順の一例について説明する。
図6は、本実施例1に係る情報処理装置の処理手順を示すフローチャートである。
図6に示すように、情報処理装置100の取得部151は、カメラ10から映像データを取得し、映像バッファ142に格納する(ステップS101)。
【0052】
情報処理装置100の分析部152は、映像データの各画像フレームをHOID141に入力し、画像フレーム毎に、第一の領域と、第二の領域と、第一の領域および第二の領域の関係性と特定する(ステップS102)。
【0053】
分析部152は、映像データの各画像フレームに関し、第一の領域の商品の商品識別情報、第二の領域の人物の人物識別情報を識別する(ステップS103)。分析部152は、各画像フレームから特定した商品識別情報と関係性との対応関係を基にして、商品情報テーブル143を更新する(ステップS104)。
【0054】
生成部153は、商品情報テーブル143を基にして、商品識別情報と、関係性と、回数と、時間とを対応付けた商品情報を生成する(ステップS105)。生成部153は、商品情報を表示部130に出力して表示させる(ステップS106)。
【0055】
次に、本実施例1に係る情報処理装置100の効果について説明する。情報処理装置100は、店内の映像データを取得し、取得した映像データを分析することで、店内に配置された商品を含む第一の領域と、商品を購入する対象の顧客を含む第二の領域と、第一の領域および第二の領域の相互作用を識別した関係性を特定する。情報処理装置100は、特定した関係性と、第一の領域に含まれる商品とを対応付ける。これによって、商品の評価に有効な情報となる、商品と関係性との対応関係の情報を生成するができる。
【0056】
情報処理装置100は、映像データを分析することで、人物(顧客)を識別し、第一の領域、第二の領域、関係性を特定する処理を繰り返し実行する。情報処理装置100は、関係性の種別毎に、関係性の数を計数し、関係性の種別毎の数と、第一の領域の商品の情報とを対応付けた商品情報を生成し、表示部130に表示させる。これによって、商品に対してどのような関係性が、どの程度の顧客との間で持たれたのかを定量的に評価することができる。
【0057】
情報処理装置100は、映像データを分析することで、人物(顧客)を識別し、第一の領域、第二の領域、関係性を特定する処理を繰り返し実行する。情報処理装置100は、商品毎に、各関係性と、各関係性に対する時間とを対応付けた商品情報を生成し、表示部130に表示させる。これによって、商品に対して、どのような関係性がどの程度の時間発生したのかを定量的に評価することができる。
【0058】
情報処理装置100は、映像データを分析する場合に、機械学習済みのHOID141を利用することで、商品を含む第一の領域、人物を含む第二の領域、第一の領域および第二の領域との関係性を適切に特定することができる。
【実施例0059】
次に、本実施例2に係る情報処理装置について説明する。本実施例2のシステムの構成は、実施例1のシステムの構成と同様であるため、説明を省略する。本実施例2に係る情報処理装置を、「情報処理装置200」と表記する。情報処理装置200は、カメラ10に接続される。カメラ10に関する説明は、実施例1で説明したカメラ10の説明と同様である。
【0060】
情報処理装置200は、実施例1の情報処理装置100と同様にして、映像データの各画像フレームを、HOIDに入力することで、第一の領域、第二の領域、関係性を繰り返し特定する。ここで、情報処理装置200は、特定した関係性の遷移と、予め設定されたルール情報とを基にして、人物が注目した商品の部分(以下、注目部分)を特定する。
【0061】
たとえば、関係性が「見ている」→「把持している」の順に遷移し、ルール情報において、関係性の遷移「見ている」→「把持している」に対応する注目部分として「パッケージデザイン」が設定されているものとする。この場合、情報処理装置200は、商品の注目部分に対応する人数に1を加算する。
【0062】
情報処理装置200は、商品毎に、注目部分と、商品の注目部分を注目した人物の人数とを含む商品情報を生成し、表示部に表示させる。これによって、商品のどの部分にどの程度、興味が持たれているのかを評価することができる。
【0063】
次に、本実施例2に係る情報処理装置200の構成例について説明する。
図7は、本実施例2に係る情報処理装置の構成を示す機能ブロック図である。
図7に示すように、この情報処理装置200は、通信部210と、入力部220と、表示部230と、記憶部240と、制御部250とを有する。
【0064】
通信部210、入力部220、表示部230に関する説明は、
図4で説明した通信部110、入力部120、表示部130に関する説明と同様である。
【0065】
記憶部240は、HOID241、映像バッファ242、商品情報テーブル243、ルール情報244を有する。記憶部140は、メモリなどの記憶装置である。
【0066】
HOID241、映像バッファ242に関する説明は、実施例1で説明したHOID141、映像バッファ142に関する説明と同様である。
【0067】
商品情報テーブル243は、第一の領域に含まれる商品に関する情報を保持する。
図8は、本実施例2に係る商品情報テーブルのデータ構造の一例を示す図である。
図8に示すように、この商品情報テーブル243は、商品識別情報と、注目部分と、人数とを対応付ける。
【0068】
商品識別情報は、商品を識別する情報である。注目部分は、ルール情報244に基づき特定される第一の領域に含まれる商品の部分であって、第二の領域に含まれる人物が注目する部分である。人数は、注目部分を注目した人物の数である。
【0069】
たとえば、
図8の説明では、商品識別情報「品目1-1」に関し、注目部分「パッケージデザイン」に対する人数は「5」である。商品識別情報「品目1-1」に関し、注目部分「原材料の表示部分」に対する人数は「2」である。商品識別情報「品目1-1」に関し、注目部分「価格の表示部分」に対する人数は「6」である。
【0070】
図8に示す例では、注目部分として、「パッケージデザイン」、「原材料の表示部分」、「価格の表示部分」を示すが、その他の注目部分も含まれる。
【0071】
ルール情報244は、関係性の遷移と、注目部分との関係を定義する。
図9は、ルール情報のデータ構造の一例を示す図である。
図9に示すように、ルール情報は、項番と、関係性の遷移と、注目部分とを対応付ける。項番は、ルール情報244のレコードを識別する番号である。関係性の遷移、注目部分に関する説明は、上記の説明と同様である。
【0072】
たとえば、ルール情報244において、関係性の遷移が「見ている」→「把持している」である場合には、注目部分が「パッケージデザイン」となる。
【0073】
図7の説明に戻る。制御部250は、取得部251と、分析部252と、生成部253と、学習部254とを有する。制御部250は、CPU、GPU等である。
【0074】
取得部251は、カメラ10から映像データを取得する。上記のように、映像データには、映像データを撮影したカメラ10のカメラ識別情報が設定されている。取得部251は、カメラ識別情報に対応付けて、映像データを映像バッファ242に格納する。
【0075】
分析部252は、映像データに含まれる時系列の画像フレームを、HOID241に入力し、各画像フレーム上の第一の領域、第二の領域、関係性を特定する処理を、各画像フレームに対して実行する。分析部252は、各画像フレームの第一の領域に含まれる商品識別情報を識別する。分析部252は、各画像フレームの第二の領域に含まれる同一の人物に、同一の人物識別情報を設定する。
【0076】
分析部252は、上記処理を繰り返し実行することで、時系列の画像フレーム毎に、第一の領域に含まれる商品の商品識別情報、第二の領域に含まれる人物の人物識別情報、関係性を特定する。分析部252は、関係性の遷移と、ルール情報244とを基にして、人物識別情報に対応する人物の注目部分を特定する。分析部252は、特定した結果を基にして、商品情報テーブル243の商品識別情報に対応するレコードを更新する。
【0077】
たとえば、分析部252は、フレーム番号N~フレーム番号N+10の各画像フレームの第一の領域の商品について、商品識別情報「品目1-1」を識別し、各関係性が「見ている」であったとする。また、分析部252は、フレーム番号N+11~フレーム番号N+20の各画像フレームの第一の領域の商品について、各関係性が「把持している」であったとする。
【0078】
この場合、分析部252は、商品識別情報「品目1-1」に対する関係性の遷移を「見ている」→「把持している」と特定する。分析部252は、連続する画像フレームにおいて、同一の関係性を特定した場合には、関係性の遷移は発生していないものとして処理する。
【0079】
分析部252は、特定した関係性の遷移を「見ている」→「把持している」と、ルール情報244とを基にして、注目部分「パッケージデザイン」を特定する。この場合、分析部252は、商品情報テーブル243において、商品識別情報「品目1-1」に対する注目部分「パッケージデザイン」に対応する人数に「1」を加算する。
【0080】
また、分析部252は、同一の商品識別情報と、人物識別情報との組に対応する注目部分について、同一の注目部分を何度特定しても、かかる注目部分に対する人数を「1」として処理してもよい。
【0081】
生成部253は、商品情報テーブル243を基にして、商品識別情報毎に、注目部分と、注目部分に対応する人数とを対応付けた商品情報を生成する。生成部153は、生成した商品情報を、表示部130に出力して表示させる。
【0082】
学習部254は、複数の訓練データを基にして、HOID241の機械学習を実行する。学習部254は、複数の訓練データを予め取得しておく。学習部254は、訓練データをHOID241に入力し、訓練データの正解情報と、HOID241の出力結果との誤差情報を算出し、誤差が小さくなるように、誤差逆伝播によりHOID241の機械学習を実行する。その他の機械学習に関する説明は、
図3で説明した内容と同様である。
【0083】
次に、本実施例2に係る情報処理装置200の処理手順の一例について説明する。
図10は、本実施例2に係る情報処理装置の処理手順を示すフローチャートである。
図10に示すように、情報処理装置200の取得部251は、カメラ10から映像データを取得し、映像バッファ242に格納する(ステップS201)。
【0084】
情報処理装置200の分析部252は、映像データの各画像フレームをHOID241に入力し、画像フレーム毎に、第一の領域と、第二の領域と、第一の領域および第二の領域の関係性と特定する(ステップS202)。
【0085】
分析部252は、映像データの各画像フレームに関し、第一の領域の商品の商品識別情報、第二の領域の人物の人物識別情報を識別する(ステップS203)。
【0086】
分析部252は、各画像フレームから特定した関係性の遷移と、ルール情報244とを基にして、注目部分を特定する(ステップS204)。分析部252は、商品識別情報と注目部分との関係から、商品情報テーブル243を更新する(ステップS205)。
【0087】
生成部253は、商品情報テーブル243を基にして、商品識別情報と、注目部分と、人数とを対応付けた商品情報を生成する(ステップS206)。生成部253は、商品情報を表示部230に出力して表示させる(ステップS207)。
【0088】
次に、本実施例2に係る情報処理装置200の効果について説明する。情報処理装置200は、映像データを分析することで、人物(顧客)を識別し、第一の領域、第二の領域、関係性を特定する処理を繰り返し実行する。また、情報処理装置100は、関係性の遷移と、ルール情報244とを基にして、商品の注目部分を特定し、商品識別情報毎に、注目部分と、注目部分に注目した人物の人数とを対応付けた商品情報を生成し、表示部230に表示させる。これによって、商品のどの部分が、どの程度の顧客に興味を持たれたのかを評価することができる。
【0089】
ところで、上述した情報処理装置200は、HOID241を基にして関係性の遷移を特定し、関係性の遷移と、ルール情報244とを基にして、第一の領域に含まれる商品の注目部分を特定していたがこれに限定されるものではない。以下では、情報処理装置200が注目部分を特定するその他の処理について説明する。
【0090】
情報処理装置200は、HOID241から出力される第二の領域の画像を分析することで、骨格情報を生成する。たとえば、情報処理装置200は、人物の画像を入力とし、骨格情報を出力とする機械学習モデルを用いて、骨格情報を生成してもよい。かかる機械学習モデルは、NN(Neural Network)等である。情報処理装置200は、時系列の画像フレームに含まれる第二の領域の画像から、時系列の骨格情報を特定する。
【0091】
ここで、骨格情報は、人体モデルで定義された複数の関節に対して、2次元または3次元の座標が設定された情報である。
【0092】
図11は、人体モデルの一例について説明する図である。
図11に示すように、人体モデルは、21個の関節ar0~ar20によって定義される。
【0093】
図11に示す各関節ar0~ar20と、関節名との関係は、
図12に示すものとなる。
図12は、関節名の一例を示す図である。たとえば、関節ar0の関節名は「SPINE_BASE」である。関節ar1~a20の関節名は、
図12に示すとおりであり、説明を省略する。
【0094】
情報処理装置200は、骨格情報を基にして、第一の領域に含まれる商品を、第二の領域に含まれる人物が把持する仕方を識別する把持識別情報を特定する。たとえば、情報処理装置200は、骨格情報と、把持識別情報との関係を定義した「把持識別テーブル」を基にして、把持識別情報を特定する。情報処理装置200は、時系列の骨格情報を基にして、時系列の把持識別情報を特定する。たとえば、把持の仕方には、商品の前面から把持する、商品の後方から把持する、等が含まれる。把持識別情報は、かかる把持の仕方を一意に示す情報となる。把持の仕方は、上記以外の把持の仕方でもよい。
【0095】
情報処理装置200は、時系列の把持識別情報を特定した後に、時系列の把持識別情報を基にして、人物の行動種別を特定する。たとえば、情報処理装置200は、時系列の把持識別情報と、行動種別との関係を定義した「行動種別テーブル」を基にして、行動種別を特定する。たとえば、行動種別には、商品を顔に近づけた、商品の側面を見た、商品の底面を見た、等が含まれる。行動種別は、上記以外の行動種別でもよい。
【0096】
情報処理装置200は、行動種別を特定した後に、行動種別を基にして、注目部分を特定する。たとえば、情報処理装置200は、行動種別と、注目部分との関係を定義した「注目部分テーブル」を基にして、注目部分を特定する。たとえば、注目部分は、「パッケージデザイン」、「原材料の表示部分」、「価格の表示部分」等である。注目部分は、上記以外の注目部分でもよい。
【0097】
情報処理装置200は、上記のように、第二の領域の画像を分析することで、時系列の骨格情報を生成し、時系列の骨格情報を基にして、時系列の把持識別情報を特定する。情報処理装置200は、時系列の把持識別情報を基にして、行動種別を特定し、行動種別に対応する注目部分を特定する。すなわち、骨格情報を基にして、商品の注目部分を特定することができる。情報処理装置200は、注目部分を特定した場合には、実施例2で説明した処理と同様にして、商品情報テーブル243の商品識別情報に対応するレコードを更新する。
【0098】
次に、上述した情報処理装置100,200と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。
図13は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【0099】
図13に示すように、コンピュータ300は、各種演算処理を実行するCPU301と、ユーザからのデータの入力を受け付ける入力装置302と、ディスプレイ303とを有する。また、コンピュータ300は、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行う通信装置304と、インタフェース装置305とを有する。また、コンピュータ300は、各種情報を一時記憶するRAM306と、ハードディスク装置307とを有する。そして、各装置301~307は、バス308に接続される。
【0100】
ハードディスク装置307は、取得プログラム307a、分析プログラム307b、生成プログラム307c、学習プログラム307dを有する。また、CPU301は、各プログラム307a~307dを読み出してRAM306に展開する。
【0101】
取得プログラム307aは、取得プロセス306aとして機能する。分析プログラム307bは、分析プロセス306bとして機能する。生成プログラム307cは、生成プロセス306cとして機能する。学習プログラム307dは、学習プロセス306dとして機能する。
【0102】
取得プロセス306aの処理は、取得部151,251の処理に対応する。分析プロセス306bの処理は、分析部152,252の処理に対応する。生成プロセス306cの処理は、生成部153,253の処理に対応する。学習プロセス306dの処理は、学習部154,254の処理に対応する。
【0103】
なお、各プログラム307a~307dについては、必ずしも最初からハードディスク装置307に記憶させておかなくても良い。例えば、コンピュータ300に挿入されるフレキシブルディスク(FD)、CD-ROM、DVD、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ300が各プログラム307a~307dを読み出して実行するようにしてもよい。
【0104】
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
【0105】
(付記1)店内を撮影した映像を取得し、
取得した前記映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定し、
特定された前記関係性と、前記第一の領域に含まれる商品とを対応付ける
処理をコンピュータに実行させることを特徴とする情報処理プログラム。
【0106】
(付記2)前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、特定された前記関係性の種類毎の数を計数し、
商品毎に、前記関係性の種類毎の数と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力される
処理を更にコンピュータに実行させることを特徴とする付記1に記載の情報処理プログラム。
【0107】
(付記3)前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、複数の関係性のうち、ある関係性となる時間を計数し、
商品毎に、前記ある関係性となる時間と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力させる
処理を更にコンピュータに実行させることを特徴とする付記1に記載の情報処理プログラム。
【0108】
(付記4)特定された前記関係性と、予め設定されたルールとに基づいて、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記第一の領域に含まれる商品とを対応付けた情報を記憶部に登録し、
前記記憶部に登録された情報を基にして、商品毎に、前記注目部分と、前記注目部分に注目した人物の人数とを対応付けた商品情報を生成し、
生成した商品情報を表示装置に出力させる
処理を更にコンピュータに実行させることを特徴とする付記1に記載の情報処理プログラム。
【0109】
(付記5)前記第二の領域の画像を分析することで、前記人物の骨格情報を生成し、
生成された前記骨格情報を基にして、前記第二の領域の人物による、前記第一の領域に含まれる商品の把持の仕方を特定し、
特定された前記把持の仕方に基づいて、前記人物が前記商品のデザインを注目する行動を行ったか、または、前記商品の材料を注目する行動を行ったのかを識別し、
識別された行動を基にして、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記商品とを対応付けた情報を記憶部に登録する
処理を更にコンピュータに実行させることを特徴とする付記1に記載の情報処理プログラム。
【0110】
(付記6)前記特定する処理は、前記映像を機械学習モデルに入力することで、前記第一の領域と、前記第二の領域と、前記関係性とを特定し、
前記機械学習モデルは、商品を購入する人物を示す第一クラスおよび前記人物が出現する領域を示す第一領域情報と、商品を含む物体を示す第二クラスおよび前記物体が出現する領域を示す第二領域情報と、前記第一クラスおよび前記第二クラスの相互作用とを識別するように機械学習が実行されたHOID(Human Object Interaction Detection)用のモデルであることを特徴とする付記1に記載の情報処理プログラム。
【0111】
(付記7)店内を撮影した映像を取得し、
取得した前記映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定し、
特定された前記関係性と、前記第一の領域に含まれる商品とを対応付ける
処理をコンピュータが実行することを特徴とする情報処理方法。
【0112】
(付記8)前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、特定された前記関係性の種類毎の数を計数し、
商品毎に、前記関係性の種類毎の数と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力される
処理を更にコンピュータが実行することを特徴とする付記7に記載の情報処理方法。
【0113】
(付記9)前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、複数の関係性のうち、ある関係性となる時間を計数し、
商品毎に、前記ある関係性となる時間と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力させる
処理を更にコンピュータが実行することを特徴とする付記7に記載の情報処理方法。
【0114】
(付記10)特定された前記関係性と、予め設定されたルールとに基づいて、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記第一の領域に含まれる商品とを対応付けた情報を記憶部に登録し、
前記記憶部に登録された情報を基にして、商品毎に、前記注目部分と、前記注目部分に注目した人物の人数とを対応付けた商品情報を生成し、
生成した商品情報を表示装置に出力させる
処理を更にコンピュータが実行することを特徴とする付記7に記載の情報処理方法。
【0115】
(付記11)前記第二の領域の画像を分析することで、前記人物の骨格情報を生成し、
生成された前記骨格情報を基にして、前記第二の領域の人物による、前記第一の領域に含まれる商品の把持の仕方を特定し、
特定された前記把持の仕方に基づいて、前記人物が前記商品のデザインを注目する行動を行ったか、または、前記商品の材料を注目する行動を行ったのかを識別し、
識別された行動を基にして、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記商品とを対応付けた情報を記憶部に登録する
処理を更にコンピュータが実行することを特徴とする付記7に記載の情報処理方法。
【0116】
(付記12)前記特定する処理は、前記映像を機械学習モデルに入力することで、前記第一の領域と、前記第二の領域と、前記関係性とを特定し、
前記機械学習モデルは、商品を購入する人物を示す第一クラスおよび前記人物が出現する領域を示す第一領域情報と、商品を含む物体を示す第二クラスおよび前記物体が出現する領域を示す第二領域情報と、前記第一クラスおよび前記第二クラスの相互作用とを識別するように機械学習が実行されたHOID(Human Object Interaction Detection)用のモデルであることを特徴とする付記7に記載の情報処理方法。
【0117】
(付記13)店内を撮影した映像を取得し、
取得した前記映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定し、
特定された前記関係性と、前記第一の領域に含まれる商品とを対応付ける
処理を実行する制御部を有することを特徴とする情報処理装置。
【0118】
(付記14)前記制御部は、
前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、特定された前記関係性の種類毎の数を計数し、
商品毎に、前記関係性の種類毎の数と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力される
処理を更に実行することを特徴とする付記13に記載の情報処理装置。
【0119】
(付記15)前記制御部は、
前記映像を分析することで、前記映像に含まれる顧客を識別し、
識別された前記顧客を含む映像を分析することで、前記映像の中の店内に配置された商品を含む第一の領域と、前記映像の中の店内で前記商品を購入する対象の人物を含む第二の領域と、前記第一の領域および前記第二の領域の相互作用を識別した関係性とを特定する処理を繰り返し実行し、
特定された前記関係性に基づいて、複数の関係性のうち、ある関係性となる時間を計数し、
商品毎に、前記ある関係性となる時間と、前記第一の領域に含まれる商品とを対応付けた商品情報を生成し、
生成した前記商品情報を表示装置に出力させる
処理を更に実行させることを特徴とする付記13に記載の情報処理装置。
【0120】
(付記16)前記制御部は、
特定された前記関係性と、予め設定されたルールとに基づいて、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記第一の領域に含まれる商品とを対応付けた情報を記憶部に登録し、
前記記憶部に登録された情報を基にして、商品毎に、前記注目部分と、前記注目部分に注目した人物の人数とを対応付けた商品情報を生成し、
生成した商品情報を表示装置に出力させる
処理を更に実行することを特徴とする付記13に記載の情報処理装置。
【0121】
(付記17)前記制御部は、
前記第二の領域の画像を分析することで、前記人物の骨格情報を生成し、
生成された前記骨格情報を基にして、前記第二の領域の人物による、前記第一の領域に含まれる商品の把持の仕方を特定し、
特定された前記把持の仕方に基づいて、前記人物が前記商品のデザインを注目する行動を行ったか、または、前記商品の材料を注目する行動を行ったのかを識別し、
識別された行動を基にして、前記人物が注目した前記商品の注目部分を特定し、
特定された前記注目部分と、前記商品とを対応付けた情報を記憶部に登録する
処理を更に実行することを特徴とする付記13に記載の情報処理装置。
【0122】
(付記18)前記特定する処理は、前記映像を機械学習モデルに入力することで、前記第一の領域と、前記第二の領域と、前記関係性とを特定し、
前記機械学習モデルは、商品を購入する人物を示す第一クラスおよび前記人物が出現する領域を示す第一領域情報と、商品を含む物体を示す第二クラスおよび前記物体が出現する領域を示す第二領域情報と、前記第一クラスおよび前記第二クラスの相互作用とを識別するように機械学習が実行されたHOID(Human Object Interaction Detection)用のモデルであることを特徴とする付記13に記載の情報処理装置。