(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023176099
(43)【公開日】2023-12-13
(54)【発明の名称】学習用データ生成装置、学習用データ生成方法、及び、記録媒体
(51)【国際特許分類】
G06T 7/00 20170101AFI20231206BHJP
G06Q 30/0601 20230101ALI20231206BHJP
【FI】
G06T7/00 350B
G06Q30/06 338
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022088198
(22)【出願日】2022-05-31
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100107331
【弁理士】
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100104765
【弁理士】
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100131015
【弁理士】
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】金子 智一
(72)【発明者】
【氏名】白石 壮馬
(72)【発明者】
【氏名】坂井 亮介
【テーマコード(参考)】
5L049
5L096
【Fターム(参考)】
5L049BB72
5L096FA18
5L096FA64
5L096GA10
5L096KA04
5L096MA03
(57)【要約】
【課題】商品の棚割の解析に利用される学習モデルの構築を効率的に行うことが可能な学習用データ生成装置等を提供する。
【解決手段】学習用データ生成装置において、取得手段は、所定の配置状態で配置されている物体を撮影することより得られた画像に相当する第1画像と、第1画像における所定の配置状態を示す情報に相当する第1情報と、を取得する。画像変形手段は、所望の物体の画像に相当する第2画像を変形する。画像生成手段は、第1画像、または、所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の第2画像を貼り付けることにより、所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成する。学習用データ生成手段は、第4画像と、第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得する取得手段と、
所望の物体の画像に相当する第2画像を変形する画像変形手段と、
前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成する画像生成手段と、
前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する学習用データ生成手段と、
を有する学習用データ生成装置。
【請求項2】
前記取得手段は、前記第1情報として、前記所定の配置状態で配置されている物体の周囲を囲むような形状を有する1つのまたは複数の矩形領域を示す情報を取得し、
前記画像変形手段は、前記矩形領域を前記第3画像のサイズに適合するように変形した変形後の前記矩形領域内に収まるように前記第2画像を変形し、
前記画像生成手段は、前記第3画像に対して前記変形後の前記第2画像を貼り付けることにより、前記第4画像を生成する請求項1に記載の学習用データ生成装置。
【請求項3】
前記画像変形手段は、前記第2画像のアスペクト比を維持した状態で前記第2画像を変形する請求項2に記載の学習用データ生成装置。
【請求項4】
前記画像変形手段は、前記変形後の前記矩形領域の短辺の長さまたは長辺の長さのいずれかを基準として設定した前記アスペクト比を用いて前記第2画像を変形する請求項3に記載の学習用データ生成装置。
【請求項5】
前記画像変形手段は、前記第2画像を変形する代わりに、前記変形後の前記矩形領域のアスペクト比に一致するまたは類似する一のアスペクト比を有する前記第2画像を取得し、
前記画像生成手段は、前記第3画像に対して前記一のアスペクト比を有する前記第2画像を貼り付けることにより、前記第4画像を生成する請求項2に記載の学習用データ生成装置。
【請求項6】
前記第2画像には、前記第4画像の生成時に既に貼り付けられた前記変形後の前記第2画像に類似する画像である第5画像が含まれ、
前記画像変形手段は、前記変形後の前記矩形領域内に収まるように前記第5画像を変形し、
前記画像生成手段は、前記第4画像の生成時に既に貼り付けられた前記変形後の前記第2画像に隣接する位置に前記変形後の第5画像を貼り付けることにより、前記第4画像を生成する請求項2に記載の学習用データ生成装置。
【請求項7】
前記取得手段は、前記第1情報として、前記所定の配置状態で配置されている物体の周囲を囲むような形状を有する1つのまたは複数の矩形領域を示す情報を取得し、
前記画像生成手段は、前記第1画像における前記矩形領域以外の領域に対して前記変形後の前記第2画像を貼り付けることにより、前記第4画像を生成する請求項1に記載の学習用データ生成装置。
【請求項8】
前記第2画像には、実在の物体の画像と、非実在の物体の画像と、が含まれる請求項1乃至7のいずれか一項に記載の学習用データ生成装置。
【請求項9】
所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得し、
所望の物体の画像に相当する第2画像を変形し、
前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成し、
前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する学習用データ生成方法。
【請求項10】
所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得し、
所望の物体の画像に相当する第2画像を変形し、
前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成し、
前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する処理をコンピュータに実行させるプログラムを記録した記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習用データの生成に利用可能な技術に関する。
【背景技術】
【0002】
店舗内の商品棚を撮影した画像を含む学習用データを用いて学習した学習モデルにより、商品の棚割を解析する手法が従来知られている。また、実際の商品棚の画像に基づいて生成された新たな画像を前述の学習用データとして用いる手法が従来提案されている。
【0003】
具体的には、例えば、特許文献1には、商品(飲料品)が陳列される棚を背景とする背景画像に対して商品(コーヒー)の画像を合成することにより合成画像を生成し、当該合成画像に対応する属性情報(コントラスト、サイズ、回転角度及びノイズ)を調整することにより複数の合成画像を生成する技術が開示されている。また、特許文献1には、前述のように生成された複数の合成画像と、当該複数の合成画像各々に対応する商品情報に含まれる商品名称及び価格と、を含む教師データを学習することにより、学習モデルを生成する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1に開示された手法によれば、例えば、商品棚における商品の陳列状態が実在する商品の陳列状態とは著しく異なるような合成画像が高確率で生成され得るとともに、当該合成画像を含む教師データによる学習が行われることに起因し、商品の棚割の解析に利用される学習モデルの構築を効率的に行うことができない、という課題が生じている。
【0006】
本開示の1つの目的は、商品の棚割の解析に利用される学習モデルの構築を効率的に行うことが可能な学習用データ生成装置を提供することにある。
【課題を解決するための手段】
【0007】
本開示の一つの観点では、学習用データ生成装置は、所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得する取得手段と、所望の物体の画像に相当する第2画像を変形する画像変形手段と、前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成する画像生成手段と、前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する学習用データ生成手段と、を有する。
【0008】
本開示の他の観点では、学習用データ生成方法は、所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得し、所望の物体の画像に相当する第2画像を変形し、前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成し、前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する。
【0009】
本開示のさらに他の観点では、記録媒体は、所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得し、所望の物体の画像に相当する第2画像を変形し、前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成し、前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する処理をコンピュータに実行させるプログラムを記録する。
【発明の効果】
【0010】
本開示によれば、商品の棚割の解析に利用される学習モデルの構築を効率的に行うことが可能となる。
【図面の簡単な説明】
【0011】
【
図1】第1実施形態に係る学習用データ生成装置を含むデータ処理システムの構成の一例を示す図。
【
図2】第1実施形態に係る学習用データ生成装置のハードウェア構成を示すブロック図。
【
図3】第1実施形態に係る学習用データ生成装置の機能構成を示すブロック図。
【
図4A】第1実施形態に係る学習用データ生成装置の処理において用いられる背景画像の一例を示す図。
【
図4B】第1実施形態に係る学習用データ生成装置の処理により生成される背景マスクの一例を示す図。
【
図5A】第1実施形態に係る学習用データ生成装置の処理において用いられる棚割画像の一例を示す図。
【
図5B】第1実施形態に係る学習用データ生成装置の処理において用いられる矩形情報の一例を示す図。
【
図6】第1実施形態に係る学習用データ生成装置の処理により生成される矩形変形情報の一例を示す図。
【
図7A】第1実施形態に係る学習用データ生成装置の処理において用いられる前景画像の一例を示す図。
【
図7B】第1実施形態に係る学習用データ生成装置の処理により生成される前景マスクの一例を示す図。
【
図8A】第1実施形態に係る学習用データ生成装置の処理により特定された矩形領域の位置を示す図。
【
図8B】第1実施形態に係る学習用データ生成装置の処理により生成される合成画像の一例を示す図。
【
図8C】第1実施形態に係る学習用データ生成装置の処理により生成される合成マスクの一例を示す図。
【
図9】第1実施形態に係る学習用データ生成装置の処理により生成される矩形情報の一例を示す図。
【
図10】第1実施形態に係る学習用データ生成装置において行われる処理を説明するためのフローチャート。
【
図11】第1実施形態の変形例に係る学習用データ生成装置の機能構成を示すブロック図。
【
図12】第1実施形態の変形例に係る学習用データ生成装置により行われる処理の一例を示す図。
【
図13A】第1実施形態の変形例に係る学習用データ生成装置の処理により生成される合成画像の一例を示す図。
【
図13B】第1実施形態の変形例に係る学習用データ生成装置の処理により生成される合成マスクの一例を示す図。
【
図14】第1実施形態の変形例に係る学習用データ生成装置の処理により生成される矩形情報の一例を示す図。
【
図15】第2実施形態に係る学習用データ生成装置を含むデータ処理システムの構成の一例を示す図。
【
図16】第2実施形態に係る学習用データ生成装置の機能構成を示すブロック図。
【
図17】第2実施形態に係る学習用データ生成装置の処理により生成される矩形領域情報の一例を示す図。
【
図18A】第2実施形態に係る学習用データ生成装置の処理により生成される合成画像の一例を示す図。
【
図18B】第2実施形態に係る学習用データ生成装置の処理により生成される合成マスクの一例を示す図。
【
図19】第2実施形態に係る学習用データ生成装置の処理により生成される矩形情報の一例を示す図。
【
図20】第2実施形態に係る学習用データ生成装置において行われる処理を説明するためのフローチャート。
【
図21】第3実施形態に係る学習用データ生成装置の機能構成を示すブロック図。
【
図22】第3実施形態に係る学習用データ生成装置において行われる処理を説明するためのフローチャート。
【発明を実施するための形態】
【0012】
以下、図面を参照して、本開示の好適な実施形態について説明する。
【0013】
<第1実施形態>
[システム構成]
図1は、第1実施形態に係る学習用データ生成装置を含むデータ処理システムの構成の一例を示す図である。データ処理システム1は、
図1に示すように、学習用データ生成装置100と、背景画像格納装置200と、前景画像格納装置300と、外部データ格納装置400と、学習用データ格納装置500と、を有している。
【0014】
学習用データ生成装置100は、背景画像格納装置200から取得した背景画像と、前景画像格納装置300から取得した前景画像と、外部データ格納装置400から取得した外部データと、に基づいて学習用データを生成し、当該生成した学習用データを学習用データ格納装置500へ出力する。
【0015】
背景画像格納装置200は、例えば、1つのまたは複数の背景画像が格納されているデータベースとして構成されている。背景画像は、例えば、空の商品棚等のような、一の場所において商品が配置されていない状態を表す画像であればよい。換言すると、背景画像は、所望の商品の配置対象となる場所の画像であればよい。
【0016】
前景画像格納装置300は、例えば、1つのまたは複数の前景画像が格納されているデータベースとして構成されている。前景画像は、例えば、商品棚等の場所に配置される所望の商品の画像であればよい。
【0017】
外部データ格納装置400は、例えば、1つのまたは複数の外部データが格納されているデータベースとして構成されている。外部データには、商品棚等に実際に配置されている1つのまたは複数の商品の陳列状態(配置状態)を撮影することにより得られた画像に相当する棚割画像と、当該棚割画像における商品の配置位置を示す情報に相当する矩形情報と、が含まれている。換言すると、外部データには、所定の配置状態で配置されている物体を撮影することより得られた画像に相当する棚割画像と、当該棚割画像における当該所定の配置状態を示す情報に相当する矩形情報と、が含まれている。また、外部データの矩形情報には、棚割画像における商品の周囲を囲むような形状を有する1つのまたは複数の矩形領域の位置(座標)を示す情報が含まれている。
【0018】
学習用データ格納装置500は、学習用データ生成装置100から出力される学習用データを格納するためのデータベースとして構成されている。学習用データは、商品の棚割の解析に利用可能な学習モデルを構築するための学習に用いられるデータに相当する。具体的には、学習用データには、例えば、背景画像に対して前景画像を貼り付けることにより得られた合成画像と、当該合成画像における1つのまたは複数の商品の配置位置を示す情報に相当する矩形情報と、が含まれている。また、学習用データの矩形情報には、合成画像における商品の周囲を囲むような形状を有する1つのまたは複数の矩形領域の位置(座標)を示す情報が含まれている。なお、合成画像の生成方法の詳細については、後程説明する。
【0019】
[ハードウェア構成]
図2は、第1実施形態に係る学習用データ生成装置のハードウェア構成を示すブロック図である。学習用データ生成装置100は、
図2に示すように、インタフェース(IF)11と、プロセッサ12と、メモリ13と、記録媒体14と、を備える。
【0020】
IF11は、外部装置との間でデータの入出力を行う。具体的には、例えば、背景画像、前景画像及び外部データ等が、IF11を通じて入力される。また、学習用データ等が、IF11を通じて外部装置へ出力される。
【0021】
プロセッサ12は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)などのコンピュータであり、予め用意されたプログラムを実行することにより、学習用データ生成装置100の全体を制御する。
【0022】
メモリ13は、ROM(Read Only Memory)、RAM(Random Access Memory)などにより構成される。メモリ13は、プロセッサ12による各種の処理の実行中に作業メモリとしても使用される。
【0023】
記録媒体14は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、学習用データ生成装置100に対して着脱可能に構成される。記録媒体14は、プロセッサ12が実行する各種のプログラムを記録している。サーバ装置100が各種の処理を実行する際には、記録媒体14に記録されているプログラムがメモリ13にロードされ、プロセッサ12により実行される。
【0024】
[機能構成]
図3は、第1実施形態に係る学習用データ生成装置の機能構成を示すブロック図である。学習用データ生成装置100は、
図3に示すように、背景マスク生成部111と、矩形領域変形部112と、前景マスク生成部113と、前景変形部114と、合成画像生成部115と、矩形情報生成部116と、を有している。
【0025】
背景マスク生成部111は、背景画像格納装置200から背景画像を取得し、当該取得した背景画像に基づいて背景マスクを生成し、当該背景画像及び当該背景マスクを合成画像生成部115へ出力する。背景マスクは、例えば、背景画像全域を黒等の所定の色により塗りつぶした画像として生成される。
【0026】
矩形領域変形部112は、外部データ格納装置400から取得した外部データの棚割画像のサイズに基づき、当該外部データの矩形情報に含まれる矩形領域各々を、背景マスク生成部111により取得されたものと同じ背景画像のサイズに適合するように変形する処理を行う。また、矩形領域変形部112は、前述の処理により得られた変形後の矩形領域各々の位置(座標)を示す情報を含む矩形変形情報を生成し、当該生成した矩形変形情報を前景変形部114及び合成画像生成部115へ出力する。
【0027】
前景マスク生成部113は、前景画像格納装置300から取得した前景画像に基づいて前景マスクを生成し、当該前景画像及び当該前景マスクを前景変形部114へ出力する。前景マスクは、例えば、前景画像に含まれる商品の内側を白等の所定の色で着色し、かつ、当該前景画像に含まれる当該商品の外側を当該所定の色とは異なる色で着色した画像として生成される。なお、前景画像の商品の内側を着色する際に用いられる色は、背景画像全域を塗りつぶす際に用いられる色とは異なる色であればよい。
【0028】
前景変形部114は、前景マスク生成部113から取得した前景画像及び前景マスクを、矩形領域変形部112から取得した矩形変形情報により示される変形後の矩形領域内に収まるように変形する処理を行う。また、前景変形部114は、前述の処理により得られた変形後の前景画像及び変形後の前景マスクを合成画像生成部115へ出力する。
【0029】
なお、以降においては、特に言及のない限り、前景画像に含まれる商品の部分については前景変形部114による変形が行われる一方で、当該前景画像に含まれる当該商品以外の部分については変形時に破棄されるものとする。また、以降においては、特に言及のない限り、前景マスクのうちの所定の色で着色された部分については前景変形部114による変形が行われる一方で、当該前景マスクのうちの当該所定の色とは異なる色で着色された部分については変形時に破棄されるものとする。
【0030】
合成画像生成部115は、矩形領域変形部112から取得した矩形変形情報に基づき、背景マスク生成部111から取得した背景画像における変形後の矩形領域の位置を、変形後の前景画像の貼付位置として特定する処理を行う。また、合成画像生成部115は、前述の処理により背景画像内の位置が特定された変形後の矩形領域に対し、前景変形部114から取得した変形後の前景画像を貼り付けることにより、合成画像を生成する。また、合成画像生成部115は、背景マスク生成部111から取得した背景マスクに対し、前景変形部114から取得した変形後の前景マスクを貼り付けることにより、合成マスクを生成する。なお、背景マスクにおける変形後の前景マスクの貼付位置は、合成画像における変形後の前景画像の貼付位置と同じ位置に設定される。また、合成画像生成部115は、前述のように生成した合成画像及び合成マスクを矩形情報生成部116へ出力する。
【0031】
矩形情報生成部116は、合成画像生成部115から取得した合成マスクに基づき、当該合成マスクと併せて取得した合成画像における1つのまたは複数の商品の配置位置を示す情報に相当する矩形情報を生成する。矩形情報生成部116により生成される矩形情報には、合成画像における商品の周囲を囲むような形状を有する1つのまたは複数の矩形領域の位置(座標)を示す情報が含まれている。換言すると、矩形情報生成部116により生成される矩形情報には、合成画像における商品の配置状態を示す情報が含まれている。また、矩形情報生成部116は、合成画像生成部115から取得した合成画像と、前述のように生成した矩形情報と、を含むデータを学習用データとして生成し、当該生成した学習用データを学習用データ格納装置500へ出力する。
【0032】
[学習用データ生成装置により行われる処理の具体例]
続いて、第1実施形態に係る学習用データ生成装置において行われる処理の具体例について説明する。
【0033】
背景マスク生成部111は、例えば、
図4Aに示すような背景画像GBを背景画像格納装置200から取得し、当該背景画像GBに基づいて
図4Bに示すような背景マスクMBを生成する。また、背景マスク生成部111は、背景画像GB及び背景マスクMBを合成画像生成部115へ出力する。
図4Aは、第1実施形態に係る学習用データ生成装置の処理において用いられる背景画像の一例を示す図である。
図4Bは、第1実施形態に係る学習用データ生成装置の処理により生成される背景マスクの一例を示す図である。
【0034】
図4Aの背景画像GBは、横長の陳列スペースDSA及び陳列スペースDSBを上下方向に備えた空の商品棚SD全体を撮影することにより得られた画像に相当する。また、
図4Bの背景マスクMBは、背景画像GB全域を所定の色により塗りつぶした画像に相当する。なお、
図4B等の一部の図面においては、図示の便宜上、画像内の塗りつぶし部分をハッチングにより表している。
【0035】
矩形領域変形部112は、例えば、
図5Aに示すような棚割画像GTと、
図5Bに示すような矩形情報SKJと、を含む外部データを外部データ格納装置400から取得する。
図5Aは、第1実施形態に係る学習用データ生成装置の処理において用いられる棚割画像の一例を示す図である。
図5Bは、第1実施形態に係る学習用データ生成装置の処理において用いられる矩形情報の一例を示す図である。
【0036】
図5Aの棚割画像GTは、複数の商品が陳列されている横長の陳列スペースDSC及び陳列スペースDSDを上下方向に備えた商品棚の一部を撮影することにより得られた画像に相当する。また、矩形情報SKJには、例えば、
図5Bに示すように、商品各々が棚割画像GT内のどの位置に配置されているかを特定可能な情報である複数の矩形領域RAの位置(座標)を示す情報が含まれている。
【0037】
また、矩形領域変形部112は、棚割画像GTのサイズに基づき、矩形情報SKJに含まれる矩形領域各々を、背景画像GBのサイズに適合するように変形する処理を行う。このような処理によれば、例えば、矩形情報SKJに含まれる矩形領域各々が、一律に拡大または縮小される。また、矩形領域変形部112は、前述の処理により得られた変形後の矩形領域各々の位置(座標)を示す情報を含む矩形変形情報KHJを生成し、当該生成した矩形変形情報KHJを前景変形部114及び合成画像生成部115へ出力する。
【0038】
具体的には、矩形領域変形部112は、例えば、棚割画像GTのサイズが背景画像GBのサイズよりも大きい場合には、複数の矩形領域RAを当該棚割画像GTのサイズに基づいて一律に縮小することにより、
図6に示すような、変形後の複数の矩形領域HAの位置(座標)を示す情報を含む矩形変形情報KHJを生成する。そして、矩形領域変形部112は、
図6に示すような、複数の矩形領域HAの位置(座標)を示す情報を含む矩形変形情報KHJを前景変形部114及び合成画像生成部115へ出力する。
図6は、第1実施形態に係る学習用データ生成装置の処理により生成される矩形変形情報の一例を示す図である。
【0039】
なお、矩形領域変形部112は、外部データ格納装置400に格納されている外部データの中から、背景画像GBのアスペクト比に一致するまたは類似するアスペクト比の棚割画像GTが含まれるデータを選択的に取得するようにしてもよい。また、矩形領域変形部112は、矩形領域RAを矩形領域HAに変形する際に、当該矩形領域RAのアスペクト比を維持した状態で変形してもよく、または、当該矩形領域RAのアスペクト比を無視して変形してもよい。
【0040】
前景マスク生成部113は、例えば、
図7Aに示すような前景画像GFを前景画像格納装置300から取得し、当該前景画像GFに基づいて
図7Bに示すような前景マスクMFを生成する。また、前景マスク生成部113は、前景画像GF及び前景マスクMFを前景変形部114へ出力する。
図7Aは、第1実施形態に係る学習用データ生成装置の処理において用いられる前景画像の一例を示す図である。
図7Bは、第1実施形態に係る学習用データ生成装置の処理により生成される前景マスクの一例を示す図である。
【0041】
図7Aの前景画像GFは、1つの商品SHを含む画像に相当する。また、
図7Bの前景マスクMFは、前景画像GFに含まれる商品SHの内側を白色で着色し、かつ、当該商品SHの外側を白色とは異なる色で着色した画像に相当する。
【0042】
前景変形部114は、前景画像GF及び前景マスクMFを、矩形領域変形部112から取得した矩形変形情報KHJにより示される矩形領域HA内に収まるように変形する処理を行う。また、前景変形部114は、前述の処理により得られた変形後の前景画像GHF及び変形後の前景マスクMHFを合成画像生成部115へ出力する。
【0043】
前景画像GHFは、
図7Aの前景画像GFに含まれる商品SHを変形した画像に相当する。また、前景マスクMHFは、
図7Bの前景マスクMFに含まれる商品SHを表す部分を変形した画像に相当する。
【0044】
なお、前景変形部114は、前景マスクMFを前景マスクMHFに変形する処理として、前景画像GFを前景画像GHFに変形する処理と同様の処理を行えばよい。また、前景変形部114は、前景画像GFを変形する際に、当該前景画像GFのアスペクト比を維持した状態で変形してもよく、または、当該前景画像GFのアスペクト比を無視して変形してもよい。また、前景変形部114は、アスペクト比を維持しつつ前景画像GFを変形する場合に、矩形領域HAの短辺の長さまたは長辺の長さのいずれかを基準として設定したアスペクト比を用いて変形してもよい。また、前景変形部114は、例えば、前景マスク生成部113から取得した複数組の前景画像GF及び前景マスクMFの中から、矩形領域HAのアスペクト比に一致するまたは類似する一のアスペクト比を有する一組の前景画像GAF及び前景マスクMAFを抽出し、当該抽出した前景画像GAF及び前景マスクMAFを合成画像生成部115へ出力するようにしてもよい。また、前景変形部114は、前景マスク生成部113から取得した複数組の前景画像GF及び前景マスクMFにおける矩形領域HAのアスペクト比に近いものの中から、一組の前景画像GAF及び前景マスクMAFをランダムに抽出するようにしてもよい。
【0045】
合成画像生成部115は、矩形領域変形部112から取得した矩形変形情報KHJに基づき、背景マスク生成部111から取得した背景画像GBにおける複数の矩形領域HA各々の位置を、変形後の前景画像の貼付位置として特定する処理を行う。また、合成画像生成部115は、前述の処理により背景画像GB内の位置が特定された複数の矩形領域HA各々に対し、前景変形部114から取得した前景画像GHFを貼り付けることにより、合成画像GCを生成する。また、合成画像生成部115は、背景マスク生成部111から取得した背景マスクMBに対し、前景変形部114から取得した変形後の前景マスクMHFを貼り付けることにより、合成マスクMCを生成する。また、合成画像生成部115は、前述のように生成した合成画像GC及び合成マスクMCを矩形情報生成部116へ出力する。
【0046】
具体的には、合成画像生成部115は、例えば、背景画像GBにおける複数の矩形領域HA各々の位置を、
図8Aに示すような位置として特定する。また、合成画像生成部115は、例えば、
図8Aに示すような位置として特定した複数の矩形領域HA各々に対して前景画像GHFを貼り付けることにより、
図8Bに示すような合成画像GCを生成する。また、合成画像生成部115は、例えば、
図8Bに示すような合成画像GCにおける前景画像GHFの貼付位置に基づき、前景マスクMHFを背景マスクMBに貼り付けることにより、
図8Cに示すような合成マスクMCを生成する。
図8Aは、第1実施形態に係る学習用データ生成装置の処理により特定された矩形領域の位置を示す図である。
図8Bは、第1実施形態に係る学習用データ生成装置の処理により生成される合成画像の一例を示す図である。
図8Cは、第1実施形態に係る学習用データ生成装置の処理により生成される合成マスクの一例を示す図である。
【0047】
図8Bの合成画像GCは、
図5Aの棚割画像GTにおける商品の配置状態に類似する配置状態を有する画像として生成される。すなわち、合成画像生成部115は、矩形変形情報KHJに基づき、背景画像GBに対して変形後の前景画像GHFを貼り付けることにより、矩形情報SKJにより示される配置状態に類似する配置状態を有する合成画像GCを生成することができる。また、合成画像生成部115は、例えば、棚割画像GTに含まれる商品棚と、背景画像GBに含まれる商品棚と、が同一の撮影条件で撮影されているような場合等において、前述の手法と同様の手法を用いることにより、矩形情報SKJにより示される商品の配置状態に一致する配置状態を有する合成画像GCを生成することができる。
【0048】
矩形情報生成部116は、合成画像生成部115から取得した合成マスクMCに基づき、例えば、
図9に示すような、当該合成マスクMCと併せて取得した合成画像GCにおける商品各々の配置位置を示す矩形情報EKJを生成する。また、矩形情報生成部116は、合成画像GCと、矩形情報EKJと、を含むデータを学習用データとして生成し、当該生成した学習用データを学習用データ格納装置500へ出力する。
図9は、第1実施形態に係る学習用データ生成装置の処理により生成される矩形情報の一例を示す図である。
【0049】
矩形情報EKJには、商品各々が合成画像GC内のどの位置に配置されているかを特定可能な情報である複数の矩形領域EAの位置(座標)を示す情報が含まれている。換言すると、矩形情報EKJには、合成画像GCにおける商品の配置状態を示す情報が含まれている。
【0050】
なお、本実施形態によれば、メタデータを付加した背景画像が背景画像格納装置200に格納されていてもよい。
【0051】
具体的には、例えば、背景画像のメタデータとして、商品棚SDの形状に対応する多角形の頂点の位置を示すデータが付加されていてもよい。そして、このようなメタデータが背景画像に付加されている場合には、例えば、商品棚SDの陳列スペースDSA及び陳列スペースDSBの内部に商品が配置されるように変形後の前景画像を貼り付けた合成画像を生成することができる。
【0052】
また、例えば、背景画像のメタデータとして、商品棚SDにおける棚段の位置を示すデータが付加されていてもよい。そして、このようなメタデータが背景画像に付加されている場合には、例えば、商品棚SDにおける棚段に沿って商品が配置されるように変形後の前景画像を貼り付けた合成画像を生成することができる。
【0053】
また、例えば、背景画像のメタデータとして、商品棚SDにおける商品の配置位置を示すデータが付加されていてもよい。そして、このようなメタデータが背景画像に付加されている場合には、例えば、商品棚SDにおける所定の位置に商品が配置されるように変形後の前景画像を貼り付けた合成画像を生成することができる。
【0054】
一方、本実施形態によれば、メタデータを付加した前景画像が前景画像格納装置300に格納されていてもよい。
【0055】
具体的には、例えば、前景画像のメタデータとして、商品の向きを示す回転角を示すデータが付加されていてもよい。そして、このようなメタデータが前景画像に付加されている場合には、例えば、変形後の前景画像が背景画像に貼り付けられる際に、商品の向きが正面方向から離れた画像が貼り付けられる確率を、商品の向きが正面方向の画像が貼り付けられる確率よりも低い確率に設定することができる。
【0056】
[処理フロー]
続いて、第1実施形態に係る学習用データ生成装置において行われる処理の流れについて説明する。
図10は、第1実施形態に係る学習用データ生成装置において行われる処理を説明するためのフローチャートである。
【0057】
まず、背景マスク生成部111は、背景画像格納装置200から取得した背景画像に基づいて背景マスクを生成し(ステップS11)、当該背景画像及び当該背景マスクを合成画像生成部115へ出力する。
【0058】
次に、矩形領域変形部112は、外部データ格納装置400から取得した外部データの棚割画像のサイズに基づき、当該外部データの矩形情報に含まれる矩形領域各々を、ステップS11における背景マスクの生成に用いた背景画像のサイズに適合するように変形する処理を行う(ステップS12)。また、矩形領域変形部112は、ステップS12の処理により得られた変形後の矩形領域各々の位置(座標)を示す情報を含む矩形変形情報を生成し、当該生成した矩形変形情報を前景変形部114及び合成画像生成部115へ出力する。
【0059】
前景マスク生成部113は、前景画像格納装置300から取得した前景画像に基づいて前景マスクを生成し(ステップS13)、当該前景画像及び当該前景マスクを前景変形部114へ出力する。
【0060】
続いて、前景変形部114は、ステップS13により生成された前景マスク、及び、当該前景マスクの生成に用いた前景画像を、矩形変形情報により示される変形後の矩形領域内に収まるように変形する処理を行う(ステップS14)。また、前景変形部114は、変形後の前景画像及び変形後の前景マスクを合成画像生成部115へ出力する。
【0061】
続いて、合成画像生成部115は、背景画像における変形後の矩形領域各々の位置を矩形変形情報に基づいて特定した(ステップS15)後、当該変形後の矩形領域各々に対して変形後の前景画像を貼り付けることにより合成画像を生成する(ステップS16)。また、合成画像生成部115は、合成画像における変形後の前景画像の貼付位置を参照しつつ、背景マスクに対して変形後の前景マスクを貼り付けることにより、合成マスクを生成する(ステップS16)。また、合成画像生成部115は、合成画像及び合成マスクを矩形情報生成部116へ出力する。
【0062】
矩形情報生成部116は、ステップS16により生成された合成マスクに基づき、当該合成マスクの生成に用いた合成画像に対応する矩形情報を生成する(ステップS17)。また、矩形情報生成部116は、ステップS16により生成された合成画像と、ステップS17により生成された矩形情報と、を含むデータを学習用データとして生成し(ステップS18)、当該生成した学習用データを学習用データ格納装置500へ出力する。
【0063】
以上に述べたように、本実施形態によれば、外部データの棚割画像における商品の陳列状態と同様の陳列状態になるように商品が配置された合成画像を生成することができるとともに、当該合成画像を含む学習用データを生成することができる。また、本実施形態によれば、外部データの矩形情報に含まれる矩形領域を変形し、変形後の矩形領域に応じたサイズ及び/またはアスペクト比を有するように前景画像を変形し、変形後の前景画像を用いて合成画像を生成することができる。そのため、本実施形態によれば、商品の棚割の解析に利用される学習モデルの構築を効率的に行うことができる。
【0064】
[変形例]
以下、上記の実施形態に対する変形例を説明する。なお、以降においては、簡単のため、既述の処理等を適用可能な部分に関する具体的な説明を適宜省略するものとする。
【0065】
(変形例1)
前景画像格納装置300に格納される前景画像は、実在の商品の画像に限らず、例えば、学習済の画像生成モデルにより生成された非実在の商品の画像であってもよい。前述の画像生成モデルは、例えば、実在の商品の画像と、非実在の商品の画像と、を交互に入力しつつ真贋判定を行うことにより得られた判定結果に応じた学習を行うことが可能なGAN(Generative Adversarial Network)の一部として構築することができる。また、前述の画像生成モデルは、非実在の商品の画像として、RGB画像と、前景マスクの代わりに利用可能なαチャンネル画像と、を同時に生成するように構築されていてもよい。また、前述の画像生成モデルは、例えば、商品カテゴリのメタ情報を含めた学習を行うことが可能なConditional GANの一部として構築することができる。そして、Conditional GANの一部として構築された学習済の画像生成モデルによれば、例えば、商品棚の種類に応じたカテゴリ等のような、所望のカテゴリに該当する非実在の商品の画像を生成することができる。
【0066】
合成画像生成部115は、背景画像に対して貼り付ける変形後の前景画像として、非実在の商品の画像のみを用いて合成画像を生成するようにしてもよい。また、合成画像生成部115は、背景画像に対して貼り付ける変形後の前景画像として、実在の商品の画像と、非実在の商品の画像と、を選択的に用いつつ合成画像を生成するようにしてもよい。
【0067】
以上に述べたように、本変形例によれば、非実在の商品を含む合成画像を生成することができるとともに、当該合成画像を含む学習用データを生成することができる。そのため、本変形例によれば、例えば、商品の棚割の解析に利用される学習モデルとして、既存の商品と、当該既存の商品のバリエーションとして将来発表され得る未発表の商品と、の両方に対応可能な学習モデルを構築することができる。
【0068】
(変形例2)
図11は、第1実施形態の変形例に係る学習用データ生成装置の機能構成を示すブロック図である。
【0069】
学習用データ生成装置100Pは、学習用データ生成装置100と同様のハードウェア構成を有している。また、学習用データ生成装置100Pは、
図11に示すように、背景マスク生成部111と、矩形領域変形部112と、前景マスク生成部123と、前景変形部124と、合成画像生成部125と、矩形情報生成部116と、隣接矩形設定部118と、類似画像取得部119と、を有している。
【0070】
隣接矩形設定部118は、矩形領域変形部112から取得した矩形変形情報に含まれるいずれか一の変形後の矩形領域を、合成画像生成部125による合成画像の生成時に変形後の前景画像が既に貼り付けられた位置に隣接する位置(変形後の前景画像の次の貼付位置)の矩形領域として設定する。また、隣接矩形設定部118は、前述のように設定した一の変形後の矩形領域を示す情報である矩形設定情報を前景変形部124及び合成画像生成部125へ出力する。なお、隣接矩形設定部118は、変形後の前景画像が最初の貼付位置に貼り付けられる場合には、矩形領域変形部112から取得した矩形変形情報に含まれる当該最初の貼付位置に対応する一の変形後の矩形領域を示す情報を前景変形部124及び合成画像生成部125へ出力する。
【0071】
類似画像取得部119は、合成画像生成部125による合成画像の生成時に既に貼り付けられた変形後の前景画像に類似する前景画像を前景画像格納装置300から取得し、当該取得した前景画像を前景マスク生成部123へ出力する。なお、類似画像取得部119は、変形後の前景画像が最初の貼付位置に貼り付けられる場合には、前景画像格納装置300からの前景画像の取得を行わない。
【0072】
前景マスク生成部123は、前景画像格納装置300から取得した前景画像に基づいて前景マスクを生成し、当該前景画像及び当該前景マスクを前景変形部124へ出力する。また、前景マスク生成部123は、類似画像取得部119から取得した前景画像に基づいて前景マスクを生成し、当該前景画像及び当該前景マスクを前景変形部124へ出力する。
【0073】
前景変形部124は、前景マスク生成部123から取得した前景画像及び前景マスクを、隣接矩形設定部118から取得した矩形設定情報により示される一の変形後の矩形領域内に収まるように変形する処理を行う。前景変形部124による変形対象の画像には、前景画像格納装置300から取得された前景画像と、類似画像取得部119から取得された前景画像と、が含まれている。また、前景変形部124は、前述の処理により得られた変形後の前景画像及び変形後の前景マスクを合成画像生成部125へ出力する。
【0074】
合成画像生成部125は、矩形領域変形部112から取得した矩形変形情報に基づき、背景マスク生成部111から取得した背景画像における変形後の矩形領域の位置を、変形後の前景画像の貼付位置として特定する処理を行う。また、合成画像生成部125は、前述の貼付位置における変形後の矩形領域を、隣接矩形設定部118から取得した矩形設定情報により示される一の変形後の矩形領域に置き換える。なお、最初の貼付位置においては、矩形領域変形部112から取得した矩形変形情報により示される変形後の矩形領域と、隣接矩形設定部118から取得した矩形設定情報により示される変形後の矩形領域と、が同じものとなる。また、合成画像生成部125は、変形後の矩形領域に対し、前景変形部124から取得した変形後の前景画像を貼り付ける処理を行うことにより、合成画像を生成する。また、合成画像生成部125は、背景マスク生成部111から取得した背景マスクに対し、前景変形部124から取得した変形後の前景マスクを貼り付けることにより、合成マスクを生成する。なお、背景マスクにおける変形後の前景マスクの貼付位置は、合成画像における変形後の前景画像の貼付位置と同じ位置に設定される。また、合成画像生成部125は、前述のように生成した合成画像及び合成マスクを矩形情報生成部116へ出力する。
【0075】
続いて、本変形例に係る学習用データ生成装置において行われる処理の具体例について説明する。
【0076】
隣接矩形設定部118は、矩形変形情報KHJに含まれるいずれか一の変形後の矩形領域HAPを、変形後の前景画像の次の貼付位置の矩形領域として設定する。また、隣接矩形設定部118は、前述のように設定した矩形領域HAPを示す矩形設定情報KSJを前景変形部124及び合成画像生成部125へ出力する。なお、隣接矩形設定部118の処理は、例えば、
図10の処理フローにおいて、ステップS12の直後からステップS14の直前までの間に行われればよい。
【0077】
類似画像取得部119は、合成画像生成部125による合成画像の生成時に既に貼り付けられた変形後の前景画像に類似する前景画像GFQを前景画像格納装置300から取得し、当該取得した前景画像GFPを前景マスク生成部123へ出力する。
【0078】
なお、類似画像取得部119は、例えば、前景画像のメタデータとしてJAN(Japanese Article Number)コードが付加されている場合に、当該JANコードと同じコードの画像を前景画像GFQとして前景画像格納装置300から取得してもよい。また、類似画像取得部119は、前景画像のメタデータとしてJANコードが付加されている場合に、当該JANコードを用いてJICFS(JAN Item Code File Service)等のデータベースを検索することにより得られた検索結果に基づき、合成画像生成部125による合成画像の生成時に既に貼り付けられた変形後の前景画像の商品に類似するカテゴリに属する商品の画像を前景画像GFQとして前景画像格納装置300から取得してもよい。また、類似画像取得部119は、例えば、合成画像生成部125による合成画像の生成時に既に貼り付けられた変形後の前景画像の特徴に類似する特徴を有する前景画像GFQを前景画像格納装置300から取得するようにしてもよい。
【0079】
前景マスク生成部123は、前景画像格納装置300から取得した前景画像GFPに基づいて前景マスクMFPを生成し、当該前景画像GFP及び当該前景マスクMFPを前景変形部124へ出力する。また、前景マスク生成部123は、類似画像取得部119から取得した前景画像GFQに基づいて前景マスクMFQを生成し、当該前景画像GFQ及び当該前景マスクMFQを前景変形部124へ出力する。
【0080】
前景変形部124は、前景画像GFP及び前景マスクMFPを、隣接矩形設定部118から取得した矩形設定情報により示される矩形領域内に収まるように変形する処理を行う。また、前景変形部124は、前述の処理により得られた変形後の前景画像GHFP及び変形後の前景マスクMHFPを合成画像生成部125へ出力する。また、前景変形部124は、前景画像GFQ及び前景マスクMFQを、隣接矩形設定部118から取得した矩形設定情報により示される矩形領域内に収まるように変形する処理を行う。また、前景変形部124は、前述の処理により得られた変形後の前景画像GHFQ及び変形後の前景マスクMHFQを合成画像生成部125へ出力する。
【0081】
合成画像生成部125は、矩形領域変形部112から取得した矩形変形情報KHJに基づき、背景マスク生成部111から取得した背景画像GBにおける複数の矩形領域HA各々の位置を、変形後の前景画像の貼付位置として特定する処理を行う。また、合成画像生成部125は、前述の貼付位置における変形後の矩形領域HAを、隣接矩形設定部118から取得した矩形設定情報KSJにより示される変形後の矩形領域HAPに置き換える。なお、最初の貼付位置においては、例えば、矩形変形情報KHJにより示される矩形領域HAと、矩形設定情報KSJにより示される矩形領域HAPと、が一致するような置き換えが行われればよい。そして、このような処理によれば、例えば、
図12に示すように、矩形変形情報KHJに含まれる互いに異なるサイズを有する複数の矩形領域HAを、互いに同じサイズを有する複数の矩形領域HAPに置き換えることができる。
図12は、第1実施形態の変形例に係る学習用データ生成装置により行われる処理の一例を示す図である。また、合成画像生成部125は、矩形領域HAPに対し、前景変形部124から取得した変形後の前景画像GHFP及び前景画像GHFQを選択的に貼り付ける処理を行うことにより、
図13Aに例示するような合成画像GCPを生成する。また、合成画像生成部125は、背景マスクMBに対し、前景変形部124から取得した変形後の前景マスクMHFP及び変形後の前景マスクMHFQを貼り付けることにより、
図13Bに例示するような合成マスクMCPを生成する。また、合成画像生成部125は、前述のように生成した合成画像GCP及び合成マスクMCPを矩形情報生成部116へ出力する。
図13Aは、第1実施形態の変形例に係る学習用データ生成装置の処理により生成される合成画像の一例を示す図である。
図13Bは、第1実施形態の変形例に係る学習用データ生成装置の処理により生成される合成マスクの一例を示す図である。
【0082】
図13Aの合成画像GCPは、
図5Aの棚割画像GTにおける商品の配置状態に類似する配置状態を有する画像として生成される。すなわち、合成画像生成部125は、矩形変形情報KHJ及び矩形設定情報KSJに基づき、背景画像GBに対して変形後の前景画像GHFP及び前景画像GHFQを選択的に貼り付けることにより、矩形情報SKJにより示される配置状態に類似する配置状態を有する合成画像GCPを生成することができる。
【0083】
矩形情報生成部116は、合成画像生成部125から取得した合成マスクMCPに基づき、例えば、
図14に示すような、当該合成マスクMCPと併せて取得した合成画像GCPにおける商品各々の配置位置を示す矩形情報EKJPを生成する。また、矩形情報生成部116は、合成画像GCPと、矩形情報EKJPと、を含むデータを学習用データとして生成し、当該生成した学習用データを学習用データ格納装置500へ出力する。
図14は、第1実施形態の変形例に係る学習用データ生成装置の処理により生成される矩形情報の一例を示す図である。
【0084】
矩形情報EKJPには、商品各々が合成画像GCP内のどの位置に配置されているかを特定可能な情報である複数の矩形領域EAPの位置(座標)を示す情報が含まれている。換言すると、矩形情報EKJPには、合成画像GCPにおける商品の配置状態を示す情報が含まれている。
【0085】
以上に述べたように、本変形例によれば、例えば、互いに類似する商品同士が近い位置に配置されているような、実店舗の陳列状態に近い陳列状態で商品が配置された合成画像を生成することができるとともに、当該合成画像を含む学習用データを生成することができる。そのため、本変形例によれば、商品の棚割の解析に利用される学習モデルの構築を効率的に行うことができる。
【0086】
<第2実施形態>
[システム構成]
図15は、第2実施形態に係る学習用データ生成装置を含むデータ処理システムの構成の一例を示す図である。データ処理システム1Aは、
図15に示すように、学習用データ生成装置100Aと、前景画像格納装置300と、外部データ格納装置400と、学習用データ格納装置500と、を有している。
【0087】
学習用データ生成装置100Aは、背景画像格納装置200から取得した背景画像と、前景画像格納装置300から取得した前景画像と、外部データ格納装置400から取得した外部データと、に基づいて学習用データを生成し、当該生成した学習用データを学習用データ格納装置500へ出力する。
【0088】
[ハードウェア構成]
学習用データ生成装置100Aは、学習用データ生成装置100と同様のハードウェア構成を有している。
【0089】
[機能構成]
図16は、第2実施形態に係る学習用データ生成装置の機能構成を示すブロック図である。
【0090】
学習用データ生成装置100Aは、
図16に示すように、背景マスク生成部131と、矩形領域特定部132と、前景マスク生成部113と、前景変形部134と、合成画像生成部135と、矩形情報生成部136と、を有している。
【0091】
背景マスク生成部131は、外部データ格納装置400から取得した外部データの棚割画像に基づいて背景マスクを生成し、当該棚割画像と、当該外部データの矩形情報と、当該背景マスクと、を矩形領域特定部132へ出力する。背景マスクは、例えば、棚割画像全域を黒等の所定の色により塗りつぶした画像として生成される。
【0092】
矩形領域特定部132は、背景マスク生成部131から取得した背景マスク及び矩形情報に基づき、当該矩形情報に含まれる矩形領域各々が当該背景マスクのどの位置に対応しているかを特定可能な情報である矩形領域情報を生成する。また、矩形領域特定部132は、矩形領域情報を付加した背景マスクと、棚割画像と、を合成画像生成部135へ出力する。
【0093】
前景変形部134は、前景マスク生成部113から取得した前景画像及び前景マスクを変形し、変形後の前景画像と、変形後の前景マスクと、を合成画像生成部135へ出力する。
【0094】
合成画像生成部135は、矩形領域特定部132から取得した背景マスクに付加されている矩形領域情報に基づいて特定した各矩形領域を、棚割画像における変形後の前景画像の貼付候補から除外する除外領域として設定する。また、合成画像生成部135は、矩形領域特定部132から取得した棚割画像のうち、前述のように設定した除外領域以外の領域に対して変形後の前景画像を貼り付けることにより、合成画像を生成する。また、合成画像生成部135は、矩形領域特定部132から取得した背景マスクに対し、前景変形部134から取得した変形後の前景マスクを貼り付けることにより、合成マスクを生成する。なお、背景マスクにおける変形後の前景マスクの貼付位置は、合成画像における変形後の前景画像の貼付位置と同じ位置に設定される。また、合成画像生成部135は、前述のように生成した合成画像と、背景マスクと同様の矩形領域情報が付加された合成マスクと、を矩形情報生成部136へ出力する。
【0095】
矩形情報生成部136は、合成画像生成部135から取得した合成マスクと、当該合成マスクに付加されている矩形領域情報と、に基づき、当該合成マスクと併せて取得した合成画像における1つのまたは複数の商品の配置位置を示す情報に相当する矩形情報を生成する。矩形情報生成部136により生成される矩形情報には、合成画像における商品の周囲を囲むような形状を有する1つのまたは複数の矩形領域の位置(座標)を示す情報が含まれている。すなわち、矩形情報生成部136により生成される矩形情報は、背景マスク生成部131により取得された外部データの矩形情報に対し、合成マスクに基づいて算出された矩形領域を追加した情報に相当する。また、矩形情報生成部136により生成される矩形情報には、合成画像における商品の配置状態を示す情報が含まれている。また、矩形情報生成部136は、合成画像生成部135から取得した合成画像と、前述のように生成した矩形情報と、を含むデータを学習用データとして生成し、当該生成した学習用データを学習用データ格納装置500へ出力する。
【0096】
[学習用データ生成装置により行われる処理の具体例]
続いて、第2実施形態に係る学習用データ生成装置において行われる処理の具体例について説明する。
【0097】
背景マスク生成部131は、例えば、
図5Aに示したような棚割画像GTを外部データ格納装置400から取得した後、当該棚割画像GT全域を所定の色により塗りつぶすことにより、
図4Bの背景マスクMBと同様の背景マスクMBAを生成する。また、背景マスク生成部131は、棚割画像GTと、矩形情報SKJと、背景マスクMBAと、を矩形領域特定部132へ出力する。
【0098】
矩形領域特定部132は、背景マスク生成部131から取得した背景マスクMBA及び矩形情報SKJに基づき、当該矩形情報SKJに含まれる矩形領域各々が当該背景マスクMBAのどの位置に対応しているかを特定可能な情報である矩形領域情報KRJを生成する。また、矩形領域特定部132は、矩形領域情報KRJを付加した背景マスクMBAと、棚割画像GTと、を合成画像生成部135へ出力する。
【0099】
矩形領域情報KRJは、例えば、
図17に示すように、矩形情報SKJに含まれる矩形領域各々の位置を、背景マスクMBAの色とは異なる色で塗りつぶすことにより生成される情報である。
図17は、第2実施形態に係る学習用データ生成装置の処理により生成される矩形領域情報の一例を示す図である。
【0100】
前景変形部134は、前景マスク生成部113から取得した前景画像GF及び前景マスクMFを変形し、変形後の前景画像GHFAと、変形後の前景マスクMHFAと、を合成画像生成部135へ出力する。
【0101】
なお、前景変形部134は、前景マスクMFを前景マスクMHFAに変形する処理として、前景画像GFを前景画像GHFAに変形する処理と同様の処理を行えばよい。また、前景変形部134は、前景画像GFを前景画像GHFAに変形する際の変形方法として、任意の変形方法を用いてもよい。具体的には、前景変形部134は、例えば、変形後の前景画像GHFAの平均サイズが矩形情報SKJに含まれる複数の矩形領域の平均サイズに一致するように前景画像GFを変形してもよい。また、前景変形部134は、例えば、変形後の前景画像GHFAのサイズが矩形情報SKJに含まれる複数の矩形領域における最大サイズ以下になるように前景画像GFを変形してもよい。また、前景変形部134は、例えば、変形後の前景画像GHFAのサイズが矩形情報SKJに含まれる複数の矩形領域における最小サイズ以上になるように前景画像GFを変形してもよい。
【0102】
合成画像生成部135は、背景マスクMBAに付加されている矩形領域情報KRJに基づいて特定した各領域を、棚割画像GTにおける変形後の前景画像GHFAの貼付候補から除外する除外領域として設定する。また、合成画像生成部135は、棚割画像GTのうち、棚割画像GTにおける除外領域以外の領域に対して変形後の前景画像GHFAを貼り付けることにより、合成画像GCAを生成する。また、合成画像生成部135は、矩形領域特定部132から取得した背景マスクMBAに対し、前景変形部134から取得した変形後の前景マスクMHFAを貼り付けることにより、合成マスクMCAを生成する。また、合成画像生成部135は、前述のように生成した合成画像GCAと、背景マスクMBAと同様の矩形領域情報KRJが付加された合成マスクMCAと、を矩形情報生成部136へ出力する。
【0103】
具体的には、合成画像生成部135は、棚割画像GTにおける除外領域以外の領域に対して変形後の前景画像GHFAを貼り付けることにより、
図18Aに示すような合成画像GCAを生成する。また、合成画像生成部135は、例えば、
図18Aに示すような合成画像GCAにおける前景画像GHFAの貼付位置に基づき、前景マスクMHFAを背景マスクMBAに貼り付けることにより、
図18Bに示すような合成マスクMCAを生成する。
図18Aは、第2実施形態に係る学習用データ生成装置の処理により生成される合成画像の一例を示す図である。
図18Bは、第2実施形態に係る学習用データ生成装置の処理により生成される合成マスクの一例を示す図である。
【0104】
図18Aの合成画像GCAは、
図5Aの棚割画像GTにおける商品の配置状態に類似する配置状態を有する画像として生成される。すなわち、合成画像生成部135は、矩形領域情報KRJに基づき、棚割画像GTに対して変形後の前景画像GHFAを貼り付けることにより、矩形情報SKJにより示される配置状態に類似する配置状態を有する合成画像GCAを生成することができる。
【0105】
なお、合成画像生成部135は、矩形領域情報KRJに基づいて特定した全ての矩形領域を除外領域として設定するものに限らず、例えば、当該矩形領域情報KRJに基づいて特定した全ての矩形領域の中から選択した1つのまたは複数の矩形領域を除外領域として設定するようにしてもよい。そして、合成画像生成部135は、矩形領域情報KRJに含まれる全ての矩形領域を除外領域として設定した場合には、棚割画像GTにおける商品の配置位置以外の位置に変形後の前景画像GHFAを貼り付ける。また、合成画像生成部135は、矩形領域情報KRJに含まれる一部の矩形領域を除外領域として設定した場合には、棚割画像GTにおける商品の配置位置に変形後の前景画像GHFAを貼り付けてもよい。
【0106】
矩形情報生成部136は、合成マスクMCAと、当該合成マスクMCAに付加されている矩形領域情報KRJと、に基づき、合成画像GCAにおける1つのまたは複数の商品の配置位置を示す情報に相当する矩形情報EKJAを生成する。また、矩形情報生成部136は、合成画像GCAと、矩形情報EKJAと、を含むデータを学習用データとして生成し、当該生成した学習用データを学習用データ格納装置500へ出力する。
【0107】
矩形情報EKJAには、例えば、
図19に示すように、商品各々が合成画像GCA内のどの位置に配置されているかを特定可能な情報である複数の矩形領域KAの位置(座標)を示す情報が含まれている。換言すると、矩形情報EKJAには、合成画像GCAにおける商品の配置状態を示す情報が含まれている。
図19は、第2実施形態に係る学習用データ生成装置の処理により生成される矩形情報の一例を示す図である。
【0108】
[処理フロー]
続いて、第2実施形態に係る学習用データ生成装置において行われる処理の流れについて説明する。
図20は、第2実施形態に係る学習用データ生成装置において行われる処理を説明するためのフローチャートである。
【0109】
まず、背景マスク生成部131は、外部データ格納装置400から取得した外部データの棚割画像に基づいて背景マスクを生成し(ステップS51)、当該棚割画像と、当該外部データの矩形情報と、当該背景マスクと、を矩形領域特定部132へ出力する。
【0110】
次に、矩形領域特定部132は、背景マスク生成部131から取得した背景マスク及び矩形情報に基づいて矩形領域情報を生成する(ステップS52)。
【0111】
前景マスク生成部113は、前景画像格納装置300から取得した前景画像に基づいて前景マスクを生成し(ステップS53)、当該前景画像及び当該前景マスクを前景変形部134へ出力する。
【0112】
続いて、前景変形部134は、ステップS53により生成された前景マスク、及び、当該前景マスクの生成に用いた前景画像を変形する処理を行う(ステップS54)。また、前景変形部134は、変形後の前景画像及び変形後の前景マスクを合成画像生成部135へ出力する。
【0113】
続いて、合成画像生成部135は、背景マスクMBAに付加されている矩形領域情報KRJに基づいて除外領域を設定した(ステップS55)後、当該除外領域以外の領域に対して変形後の前景画像を貼り付けることにより合成画像を生成する(ステップS56)。また、合成画像生成部135は、合成画像における変形後の前景画像の貼付位置を参照しつつ、背景マスクに対して変形後の前景マスクを貼り付けることにより、合成マスクを生成する(ステップS56)。また、合成画像生成部135は、合成画像及び合成マスクを矩形情報生成部136へ出力する。
【0114】
矩形情報生成部136は、ステップS56により生成された合成マスクと、当該合成マスクに付加されている矩形領域情報と、に基づき、当該合成マスクの生成に用いた合成画像に対応する矩形情報を生成する(ステップS57)。また、矩形情報生成部136は、ステップS56により生成された合成画像と、ステップS57により生成された矩形情報と、を含むデータを学習用データとして生成し、当該生成した学習用データを学習用データ格納装置500へ出力する(ステップS58)。
【0115】
以上に述べたように、本実施形態によれば、棚割画像により示される実際の商品の陳列状態を流用しつつ合成画像を生成することができるとともに、当該合成画像を含む学習用データを生成することができる。また、本実施形態によれば、空の商品棚等を撮影した背景画像を所有していない場合であっても、合成画像を生成することができる。また、本実施形態によれば、例えば、棚割画像に含まれる各商品の中に矩形情報から配置位置を特定できない一の商品があったとしても、当該一の商品の位置に変形後の前景画像を貼り付けた合成画像を生成することができる。換言すると、本実施形態によれば、外部データに含まれるFalse-negativeをTrue-positiveに置き換えた学習用データを生成することができる。そのため、本実施形態によれば、商品の棚割の解析に利用される学習モデルの構築を効率的に行うことができる。
【0116】
[変形例]
前景画像格納装置300に格納される前景画像は、実在の商品の画像に限らず、例えば、学習済の画像生成モデルにより生成された非実在の商品の画像であってもよい。前述の画像生成モデルは、例えば、実在の商品の画像と、非実在の商品の画像と、を交互に入力しつつ真贋判定を行うことにより得られた判定結果に応じた学習を行うことが可能なGANの一部として構築することができる。また、前述の画像生成モデルは、非実在の商品の画像として、RGB画像と、前景マスクの代わりに利用可能なαチャンネル画像と、を同時に生成するように構築されていてもよい。また、前述の画像生成モデルは、例えば、商品カテゴリのメタ情報を含めた学習を行うことが可能なConditional GANの一部として構築することができる。そして、Conditional GANの一部として構築された学習済の画像生成モデルによれば、例えば、商品棚の種類に応じたカテゴリ等のような、所望のカテゴリに該当する非実在の商品の画像を生成することができる。
【0117】
合成画像生成部135は、背景画像に対して貼り付ける変形後の前景画像として、非実在の商品の画像のみを用いて合成画像を生成するようにしてもよい。また、合成画像生成部135は、背景画像に対して貼り付ける変形後の前景画像として、実在の商品の画像と、非実在の商品の画像と、を選択的に用いつつ合成画像を生成するようにしてもよい。
【0118】
以上に述べたように、本変形例によれば、非実在の商品を含む合成画像を生成することができるとともに、当該合成画像を含む学習用データを生成することができる。そのため、本変形例によれば、例えば、商品の棚割の解析に利用される学習モデルとして、既存の商品と、当該既存の商品のバリエーションとして将来発表され得る未発表の商品と、の両方に対応可能な学習モデルを構築することができる。
【0119】
<第3実施形態>
図21は、第3実施形態に係る学習用データ生成装置の機能構成を示すブロック図である。
【0120】
本実施形態に係る学習用データ生成装置100Bは、学習用データ生成装置100と同様のハードウェア構成を有している。また、学習用データ生成装置100Bは、取得手段171と、画像変形手段172と、画像生成手段173と、学習用データ生成手段174と、を有している。
【0121】
図22は、第3実施形態に係る学習用データ生成装置において行われる処理を説明するためのフローチャートである。
【0122】
取得手段171は、所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、当該第1画像における当該所定の配置状態を示す情報に相当する第1情報と、を取得する(ステップS71)。
【0123】
画像変形手段172は、所望の物体の画像に相当する第2画像を変形する(ステップS72)。
【0124】
画像生成手段173は、第1画像、または、所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の第2画像を貼り付けることにより、第1情報により示される所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成する(ステップS73)。
【0125】
学習用データ生成手段174は、第4画像と、当該第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する(ステップS74)。
【0126】
本実施形態によれば、商品の棚割の解析に利用される学習モデルの構築を効率的に行うことができる。
【0127】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0128】
(付記1)
所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得する取得手段と、
所望の物体の画像に相当する第2画像を変形する画像変形手段と、
前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成する画像生成手段と、
前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する学習用データ生成手段と、
を有する学習用データ生成装置。
【0129】
(付記2)
前記取得手段は、前記第1情報として、前記所定の配置状態で配置されている物体の周囲を囲むような形状を有する1つのまたは複数の矩形領域を示す情報を取得し、
前記画像変形手段は、前記矩形領域を前記第3画像のサイズに適合するように変形した変形後の前記矩形領域内に収まるように前記第2画像を変形し、
前記画像生成手段は、前記第3画像に対して前記変形後の前記第2画像を貼り付けることにより、前記第4画像を生成する付記1の学習用データ生成装置。
【0130】
(付記3)
前記画像変形手段は、前記第2画像のアスペクト比を維持した状態で前記第2画像を変形する付記2の学習用データ生成装置。
【0131】
(付記4)
前記画像変形手段は、前記変形後の前記矩形領域の短辺の長さまたは長辺の長さのいずれかを基準として設定した前記アスペクト比を用いて前記第2画像を変形する付記3の学習用データ生成装置。
【0132】
(付記5)
前記画像変形手段は、前記第2画像を変形する代わりに、前記変形後の前記矩形領域のアスペクト比に一致するまたは類似する一のアスペクト比を有する前記第2画像を取得し、
前記画像生成手段は、前記第3画像に対して前記一のアスペクト比を有する前記第2画像を貼り付けることにより、前記第4画像を生成する付記2の学習用データ生成装置。
【0133】
(付記6)
前記第2画像には、前記第4画像の生成時に既に貼り付けられた前記変形後の前記第2画像に類似する画像である第5画像が含まれ、
前記画像変形手段は、前記変形後の前記矩形領域内に収まるように前記第5画像を変形し、
前記画像生成手段は、前記第4画像の生成時に既に貼り付けられた前記変形後の前記第2画像に隣接する位置に前記変形後の第5画像を貼り付けることにより、前記第4画像を生成する付記2の学習用データ生成装置。
【0134】
(付記7)
前記取得手段は、前記第1情報として、前記所定の配置状態で配置されている物体の周囲を囲むような形状を有する1つのまたは複数の矩形領域を示す情報を取得し、
前記画像生成手段は、前記第1画像における前記矩形領域以外の領域に対して前記変形後の前記第2画像を貼り付けることにより、前記第4画像を生成する付記1の学習用データ生成装置。
【0135】
(付記8)
前記画像変形手段は、前記変形後の前記第2画像の平均サイズが前記複数の矩形領域の平均サイズに一致するように前記第2画像を変形する付記7の学習用データ生成装置。
【0136】
(付記9)
前記画像変形手段は、前記変形後の前記第2画像のサイズが前記複数の矩形領域における最大サイズ以下になるように前記第2画像を変形する付記7の学習用データ生成装置。
【0137】
(付記10)
前記画像変形手段は、前記変形後の前記第2画像のサイズが前記複数の矩形領域における最小サイズ以上になるように前記第2画像を変形する付記7の学習用データ生成装置。
【0138】
(付記11)
前記第2画像には、実在の物体の画像と、非実在の物体の画像と、が含まれる付記1乃至10のいずれか一の学習用データ生成装置。
【0139】
(付記12)
所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得し、
所望の物体の画像に相当する第2画像を変形し、
前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成し、
前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する学習用データ生成方法。
【0140】
(付記13)
所定の配置状態で配置されている1つのまたは複数の物体を撮影することより得られた画像に相当する第1画像と、前記第1画像における前記所定の配置状態を示す情報に相当する第1情報と、を取得し、
所望の物体の画像に相当する第2画像を変形し、
前記第1画像、または、前記所望の物体の配置対象となる場所の画像に相当する第3画像のいずれかに対して変形後の前記第2画像を貼り付けることにより、前記第1情報により示される前記所定の配置状態に一致するまたは類似する配置状態を有する第4画像を生成し、
前記第4画像と、前記第4画像における物体の配置状態を示す情報に相当する第2情報と、を含むデータを学習用データとして生成する処理をコンピュータに実行させるプログラムを記録した記録媒体。
【0141】
以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。
【符号の説明】
【0142】
100 学習用データ生成装置
111 背景マスク生成部
112 矩形領域変形部
113 前景マスク生成部
114 前景変形部
115 合成画像生成部
116 矩形情報生成部