(58)【調査した分野】(Int.Cl.,DB名)
前記取得部によって取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出する算出部を更に含み、
前記抽出部は、前記算出部によって算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
請求項1に記載の画像処理装置。
前記算出部は、前記取得部によって取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
請求項2に記載の画像処理装置。
前記認識部は、前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
請求項1〜請求項4の何れか1項に記載の画像処理装置。
前記認識部は、前記第2の領域の各々についての文字認識結果を取得し、前記第2の領域の各々についての前記文字認識結果に基づいて、税込み価格を表す前記第2の領域と、税抜き価格を表す前記第2の領域とを認識し、前記税込み価格を表す前記第2の領域と前記税抜き価格を表す前記第2の領域との間の配置関係が予め定められた関係である場合に、前記第1の領域を前記表示カードの領域として認識する、
請求項1〜請求項6の何れか1項に記載の画像処理装置。
【発明を実施するための形態】
【0010】
以下、図面を参照して開示の技術の実施形態の一例を詳細に説明する。
【0011】
図1に示すように、実施形態に係る画像処理システム10は、カメラ12と、画像処理装置14と、出力装置30とを備えている。
【0012】
カメラ12は、処理対象の画像を撮像する。例えば、カメラ12によって、商品が陳列された店内の商品棚の画像が撮像される。
【0013】
例えば、商品棚に設置された表示カードを画像処理によって認識する場合、既存の画像処理方法を用いることが考えられる。この場合には、まず、画像処理によって対象領域を抽出し、対象領域に対して更なる画像処理を実施する。しかし、既存の画像処理を用いる場合には、様々な環境の変化に対応することが難しい。
【0014】
図2に、商品棚の画像の一例を示す。
図2に示されるように、商品棚を表す画像には、様々なものが含まれている。例えば、
図2に示される画像G
1には、表示カードHとは異なる位置に存在する文字M、及び表示カードと混同しやすい領域W等が含まれている。また、
図3に示される画像G
2には、表示カードHと並んで背景の商品Sが更に含まれている。このため、撮像された処理対象の画像から、商品の価格情報を含む表示カードの領域を認識することは難しい。
【0015】
なお、表示カードの領域を認識するモデルを機械学習によって予め生成し、その学習済みモデルを用いて表示カードの認識率を向上させることが考えられる。しかし、学習済みモデルを用いる場合であっても、誤認識が発生する場合がある。
【0016】
そこで、本実施形態では、処理対象の画像から表示枠の領域と数字の領域とを抽出し、表示枠の領域内に数字の領域が含まれている場合に、その領域を表示カードの領域として認識する。更に、本実施形態では、表示カードの領域を認識する際に、各領域であることの度合いを示すスコア、及び表示カードの枠を表す領域と数字を表す領域との間の位置関係を更に考慮する。また、本実施形態では、各領域の縦横比、表示カードの領域を認識する際には、表示カードの枠を表す領域内の数字の領域の個数、数字の領域とその他の領域との間の位置関係等を更に考慮する。以下、具体的に説明する。
【0017】
画像処理装置14は、上記
図1に示されるように、取得部20と、学習済みモデル記憶部21と、算出部22と、フィルタリング部23と、出力部28とを備えている。また、フィルタリング部23は、抽出部24と、認識部26とを備える。
【0018】
取得部20は、カメラ12によって撮像された画像を取得する。
【0019】
学習済みモデル記憶部21には、学習用の画像内における表示枠の領域の正解情報、及び学習用の画像内における数字の領域の正解情報が対応付けられた学習用データから予め生成された学習済みモデルが格納されている。学習済みモデルとしては、例えば、複数の学習用データに基づき、ディープラーニングによって学習されたニューラルネットワークモデル等を用いることができる。
【0020】
図4に、学習用データの一例を示す。
図4に示されるように、学習用データとしては、表示カードの枠の領域Aと数字の領域Bとを含む学習用の画像ILを用いる。なお、学習用画像ILには、商品名の領域Cも含まれている。数字の領域Bは、商品の価格情報に対応する。なお、括弧、円などの特徴点を更に含ませて学習用データとしてもよい。学習用データとしての画像の数は、例えば、300〜1000程度とすることができる。
【0021】
図4に示される学習用データの画像ILには、領域Aが表示カードの領域であることを表す情報、及び領域Bが数字の領域であることを表す情報が予め付与されている。
【0022】
学習済みモデルは学習用データに応じて予め学習されている。具体的には、学習用の画像が入力された際には、その画像内の表示枠の領域に対しては、表示枠の領域である度合いを表すスコアが高く出力されるようにモデルが学習される。また、学習用の画像が入力された際には、その画像内の数字の領域に対しては、数字の領域である度合いを表すスコアが高く出力されるようにモデルが学習される。
【0023】
そのため、学習済みモデルは、処理対象の画像が入力された際に、表示枠の領域である度合いを表すスコア、及び数字の領域である度合いを表すスコアを出力する。
【0024】
算出部22は、取得部20によって取得された画像の各部分領域について、表示枠の領域を表す第1の領域である度合いを表す第1のスコアと、数字の領域を表す第2の領域である度合いを表す第2のスコアとを算出する。具体的には、算出部22は、取得部20によって取得された画像を、学習済みモデル記憶部21に格納された学習済みモデルに入力して、画像の各部分領域についての第1のスコアと第2のスコアとを算出する。
【0025】
抽出部24は、取得部20によって取得された画像から、算出部22によって算出された第1のスコアが予め設定された第1の閾値よりも大きい領域を第1の領域として抽出する。また、抽出部24は、取得部20によって取得された画像から、算出部22によって算出された第2のスコアが予め設定された第2の閾値よりも大きい領域を第2の領域として抽出する。なお、第1の閾値と第2の閾値とは、同一の値であってもよいし異なる値であってもよい。
【0026】
図5に、各領域と各スコアとの関係を説明するための説明図を示す。例えば、予め設定された第1又は第2の閾値が0.8である場合、
図5に示されるように、領域Aのスコアは0.9であるため、領域Aは第1の領域又は第2の領域として抽出される。
【0027】
なお、抽出部24は、各領域を抽出する際には、その領域の位置情報と大きさ情報とを併せて出力する。例えば、抽出部24は、
図5に示されるように、処理対象の画像I1内の領域Aの第1の領域である度合い又は第2の領域である度合いを表すスコア0.9と、領域Aの位置を表す座標(x,y)と、横方向の大きさwと、縦方向の大きさhとを出力する。
【0028】
認識部26は、予め定められた条件に応じて、取得部20によって取得された画像内の表示カードの領域を認識する。
【0029】
具体的には、以下の(1)〜(5)に示す条件に応じて、表示カードの候補に対してフィルタリングを行う。
【0030】
(1)第1の領域内に第2の領域が含まれていること。
(2)第2の領域の個数が所定の範囲内の個数であること。
(3)第1の領域内における第2の領域の位置が予め定められた範囲内の位置であること。具体的には、第1の領域の枠を表す各座標と第2の領域の枠を表す各座標との間の差分が予め定められた範囲内であること。
(4)第1の領域の縦横比の値が予め定められた範囲内であること。
(5)第1の領域内の各第2の領域の位置関係が所定の位置関係であること。
【0031】
まず、認識部26は、上記(1)の条件に基づき、第1の領域内に第2の領域が含まれている第1の領域を、表示カードの候補として特定する。例えば、
図6に示されるように、第1の領域A内に第2の領域B1,B2,B3,B4が含まれている場合には、第1の領域Aと第2の領域B1〜B4とをグルーピングして、第2の領域B1〜B4を含む第1の領域Aを表示カードの候補として特定する。なお、以下の処理では、グルーピングされた表示カードの候補に対して処理が行われる。
【0032】
次に、認識部26は、上記(1)の条件に基づき選択された表示カードの候補の各々から、上記(2)の条件を満たす候補を選択する。具体的には、認識部26は、上記(2)の条件に基づき、第1の領域内の第2の領域の個数が所定の範囲内の個数である表示カードの候補を、表示カードの次の候補として選択する。上記(2)の条件を満たさない表示カードの候補は除外される。
【0033】
例えば、店内に陳列する商品の価格帯が100円〜9,999円の範囲である場合には、表示カード内に含まれる数字の個数が2個以下又は5個以上であるということはない。そのため、この場合には、所定の範囲内の個数として3〜4個が設定される。所定の範囲内の個数として3〜4個が設定された場合には、
図6に示される領域Aは、上記(2)の条件を満たすため、表示カードの候補として選択される。
【0034】
なお、認識部26は、上記(2)の条件を満たす候補を選択する際に、複数の第2の領域を連結して、連結された領域を新たな第2の領域として設定する。例えば、認識部26は、y座標がほぼ同一とみなせる所定範囲内の値で、かつx座標が数字一文字分を基準とした所定の間隔で並ぶ第2の領域を連結する。これにより、第2の領域は、商品の価格の表示領域とみなすことができる。
【0035】
次に、認識部26は、上記(2)の条件に基づき選択された表示カードの候補の各々から、上記(3)の条件を満たす候補を選択する。具体的には、認識部26は、上記(3)の条件に基づき、第1の領域の枠を表す各座標と第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(3)の条件を満たさない表示カードの候補は除外される。
【0036】
例えば、
図7に示されるように、第1の領域Aの所定の位置(例えば、左上角)を表す座標(x1,y1)と、第2の領域B5の所定の位置(例えば、左上角)を表す座標(x2,y2)との間の差分を算出する。この差分が所定範囲である候補が、上記(3)の条件を満たすものとして選択される。例えば、x1とx2との間のピクセル数が所定ピクセル数未満であること等が条件として設定される。
【0037】
次に、認識部26は、上記(3)の条件に基づき選択された表示カードの候補の各々から、上記(4)の条件を満たす候補を選択する。具体的には、認識部26は、上記(4)の条件に基づき、第1の領域の縦横比の値が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(4)の条件を満たさない表示カードの候補は除外される。
【0038】
例えば、縦横比w/hの予め定められた範囲として、1.3〜2が設定された場合を例に考える。この場合、例えば、
図8に示される第1の領域Aは、横方向の大きさwが1000ピクセルであり縦方向の大きさhが600であるため、縦横比w/hは約1.67となる。そのため、
図8に示される第1の領域の縦横比は予め定められた範囲内であるため、表示カードの次の候補として選択される。
【0039】
一方、例えば
図9に示される第1の領域Aは、横方向の大きさwが500ピクセルであり縦方向の大きさhが600であるため、縦横比w/hは約0.87となる。そのため、
図9に示される第1の領域Aの縦横比は予め定められた範囲内ではないため、表示カードの次の候補として選択されずに除外される。
【0040】
次に、認識部26は、上記(4)の条件に基づき選択された表示カードの候補の各々から、上記(5)の条件を満たす候補を選択する。具体的には、認識部26は、上記(5)の条件に基づき、第1の領域内の各第2の領域の位置関係が所定の位置関係である表示カードの候補を、表示カードとして選択する。上記(5)の条件を満たさない表示カードの候補は除外される。
【0041】
具体的には、認識部26は、以下の(5−1)〜(5−3)に示す条件に応じて、表示カードの候補に対してフィルタリングを行う。なお、以下の(5−2)と(5−3)との処理順番は順不同である。
【0042】
(5−1)税込み価格を表す第2の領域と税抜き価格を表す第2の領域との間の配置関係が予め定められた関係であること。
(5−2)第2の領域と商品名を表す領域との間の配置関係が予め定められた関係であること。
(5−3)第2の領域とバーコードを表す領域との間の配置関係が予め定められた関係であること。
【0043】
まず、認識部26は、既存の文字認識手法を用いて、第1の領域内の第2の領域の各々についての文字認識結果を取得する。そして、認識部26は、第2の領域の各々についての文字認識結果に基づいて、税込み価格を表す第2の領域と税抜き価格を表す第2の領域とを認識する。例えば、認識部26は、数字の値が大きい方を税込み価格を表す第2の領域として認識し、数字の値が小さい方を税抜き価格を表す第2の領域として認識する。または、認識部26は、予め定められた領域のサイズの大小関係に基づいて、例えば、大きいサイズの第2の領域を、税抜き価格を表す領域として認識する。
【0044】
そして、認識部26は、上記(5−1)の条件に基づき、税込み価格を表す第2の領域と税抜き価格を表す第2の領域との間の配置関係が予め定められた関係である場合に、第1の領域を表示カードの候補として選択する。
【0045】
例えば、税抜き価格と税込み価格との間の予め定められた関係として、税抜き価格が左側であり、税込み価格が右側であると設定されている場合を考える。この場合には、税抜き価格を表す第2の領域B5と税込み価格を表す第2の領域B6との間の関係が、
図10に示されるような関係であるときには、これらの第2の領域B5,B6を含む第1の領域Aが表示カードの次の候補として選択される。
【0046】
または、例えば、税抜き価格と税込み価格との間の予め定められた関係として、税抜き価格が上側であり、税込み価格が下側であると設定されている場合を考える。この場合には、税抜き価格を表す第2の領域B5と税込み価格を表す第2の領域B6との間の関係が、
図11に示されるような関係であるときには、これらの第2の領域B5,B6を含む第1の領域が表示カードの次の候補として選択される。
【0047】
次に、認識部26は、既存の文字認識手法を用いて、第1の領域のうちの商品名を表す領域を認識する。例えば、認識部26は、予め登録された商品名の情報と、第1の領域のうちの商品名を表す領域とを照合して、第1の領域のうちの商品名を表す領域を認識する。そして、認識部26は、上記(5−2)の条件に基づき、第2の領域と商品名を表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードの候補として選択する。
【0048】
例えば、第2の領域と商品名を表す領域との間の予め定められた配置関係として、商品名を表す領域が上側であり、第2の領域が下側であると設定されている場合を考える。この場合には、商品名を表す領域Cと、税抜き価格を表す第2の領域B5及び税込み価格を表す第2の領域B6との間の関係が、
図12に示されるような関係であるときには、第2の領域B5,B6を含む第1の領域Aが表示カードの次の候補として選択される。
【0049】
次に、認識部26は、既存の画像処理手法を用いて、第1の領域のうちのバーコードを表す領域を認識する。そして、認識部26は、上記(5−3)の条件に基づき、第2の領域とバーコードを表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードとして認識する。
【0050】
例えば、第2の領域とバーコードを表す領域との間の予め定められた配置関係として、バーコードを表す領域Dが左側であり、第2の領域B5,B6が右側であると設定されている場合を考える。この場合には、バーコードを表す領域Dと、税抜き価格を表す第2の領域B5及び税込み価格を表す第2の領域B6との間の関係が、
図13に示されるような関係であるときには、これらの第2の領域B5,B6を含む第1の領域Aが表示カードとして選択される。
【0051】
出力部28は、認識部26によって認識された表示カードの領域を結果として出力する。なお、表示カードの領域から、商品名の領域、税抜き価格の領域、税込価格の領域、及びバーコードの領域のみを抽出して出力するようにしてもよい。出力部28の出力結果は、例えば出力形式はテキストデータ(csv、JSON等)である。
【0052】
出力装置30には、出力部28によって出力された結果が出力される。出力装置30は、例えば、ディスプレイ等によって実現される。なお、出力装置30は、店内の商品を管理するサーバ等であってもよい。
【0053】
画像処理装置14は、例えば、
図14に示すコンピュータ50で実現することができる。コンピュータ50はCPU51、一時記憶領域としてのメモリ52、及び不揮発性の記憶部53を備える。また、コンピュータ50は、カメラ12、出力装置30等の入出力装置が接続される入出力interface(I/F)54、及び記録媒体59に対するデータの読み込み及び書き込みを制御するread/write(R/W)部55を備える。また、コンピュータ50は、インターネット等のネットワークに接続されるネットワークI/F56を備える。CPU51、メモリ52、記憶部53、入出力I/F54、R/W部55、及びネットワークI/F56は、バス57を介して互いに接続される。
【0054】
記憶部53は、Hard Disk Drive(HDD)、Solid State Drive(SSD)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部53には、コンピュータ50を画像処理装置14として機能させるための画像処理プログラム60が記憶されている。画像処理プログラム60は、取得プロセス61と、算出プロセス62と、抽出プロセス63と、認識プロセス64と、出力プロセス65とを有する。学習済みモデル記憶領域66には、学習済みモデル記憶部21を構成する情報が記憶される。
【0055】
CPU51は、画像処理プログラム60を記憶部53から読み出してメモリ52に展開し、画像処理プログラム60が有するプロセスを順次実行する。CPU51は、取得プロセス61を実行することで、
図1に示す取得部20として動作する。また、CPU51は、算出プロセス62を実行することで、
図1に示す算出部22として動作する。また、CPU51は、抽出プロセス63を実行することで、
図1に示す抽出部24として動作する。また、CPU51は、認識プロセス64を実行することで、
図1に示す認識部26として動作する。また、CPU51は、出力プロセス65を実行することで、
図1に示す出力部28として動作する。また、CPU51は、学習済みモデル記憶領域66から情報を読み出して、学習済みモデル記憶部21をメモリ52に展開する。これにより、画像処理プログラム60を実行したコンピュータ50が、画像処理装置14として機能することになる。ソフトウェアである画像処理プログラム60を実行するCPU51はハードウェアである。
【0056】
なお、画像処理プログラム60により実現される機能は、例えば半導体集積回路、より詳しくはApplication Specific Integrated Circuit(ASIC)やGraphics Processing Unit(GPU)等で実現することも可能である。
【0057】
次に、本実施形態に係る画像処理装置14の作用について説明する。画像処理装置14は、カメラ12によって商品棚の画像の取得が開始されると、
図15に示す画像処理ルーチンを実行する。
図15に示す画像処理ルーチンは、商品棚の画像が取得される毎に繰り返し実行される。
【0058】
ステップS100において、取得部20は、カメラ12によって撮像された画像を取得する。
【0059】
ステップS102において、算出部22は、学習済みモデル記憶部21に格納された学習済みモデルを読み込む。
【0060】
ステップS104において、算出部22は、上記ステップS100で取得された画像を、上記ステップS102で読み込まれた学習済みモデルに入力して、画像の各部分領域に対する第1のスコアと第2のスコアとを算出する。
【0061】
ステップS105において、抽出部24は、上記ステップS100で取得された画像から、上記ステップS104で算出された第1のスコアが予め設定された第1の閾値よりも大きい領域を第1の領域として抽出する。また、抽出部24は、上記ステップS100で取得された画像から、上記ステップS104で算出された第2のスコアが予め設定された第2の閾値よりも大きい領域を第2の領域として抽出する。
【0062】
ステップS106において、認識部26は、上記(1)〜(5)に示す条件に応じて、表示カードの候補のフィルタリングを行い、フィルタリングの結果得られた領域の各々を表示カードとして認識する。ステップS106は、
図16に示す認識処理ルーチンによって実現される。
【0063】
ステップS202において、認識部26は、上記(1)の条件に基づき、第1の領域と第2の領域との全ての組み合わせの各々について、第1の領域内に第2の領域が含まれている領域を、表示カードの候補として特定する。
【0064】
ステップS204において、認識部26は、上記(2)の条件に基づき、上記ステップS202で特定された表示カードの候補の各々から、第1の領域内の第2の領域の個数が所定の範囲内の個数である表示カードの候補を、表示カードの次の候補として選択する。上記(2)の条件を満たさない表示カードの候補は除外される。
【0065】
ステップS206において、認識部26は上記(3)の条件に基づき、表示カードの候補の各々から、第1の領域の枠を表す各座標と第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(3)の条件を満たさない表示カードの候補は除外される。
【0066】
ステップS208において、認識部26は、上記(4)の条件に基づき、表示カードの候補の各々から、第1の領域の縦横比の値が予め定められた範囲内である表示カードの候補を、表示カードの次の候補として選択する。上記(4)の条件を満たさない表示カードの候補は除外される。
【0067】
ステップS210において、認識部26は、上記(5−1)の条件に基づき、表示カードの候補の各々から、税込み価格を表す第2の領域と税抜き価格を表す第2の領域との間の配置関係が予め定められた関係である領域を、表示カードの候補として選択する。上記(5−1)の条件を満たさない表示カードの候補は除外される。
【0068】
ステップS212において、認識部26は、上記(5−2)の条件に基づき、表示カードの候補の各々から、第2の領域と商品名を表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードの候補として選択する。
【0069】
ステップS214において、認識部26は、上記(5−3)の条件に基づき、表示カードの候補の各々から、第2の領域とバーコードを表す領域との間の配置関係が予め定められた関係である場合に、これらの領域を含む第1の領域を表示カードとして認識する。
【0070】
ステップS216において、上記ステップS202〜ステップS214の各処理を経て得られた表示カードの候補の各々を、表示カードの領域として出力する。
【0071】
図15に示す画像処理ルーチンに戻り、ステップS108において、上記ステップS106によって取得された表示カードの領域を結果として出力して、画像処理ルーチンを終了する。
【0072】
以上説明したように、実施形態に係る画像処理装置は、画像に対するスコアに応じて、画像から表示枠を表す第1の領域と数字を表す第2の領域とを抽出する。そして、画像処理装置は、上記(1)〜(5)に示される条件を満たす領域を、商品の価格情報を含む表示カードの領域として認識する。これにより、商品の価格情報を含む表示カードの領域を画像から適切に抽出することができる。
【0073】
また、機械学習によって得られた学習済みモデルを用いる際には、例えば、画像認識に失敗した画像を用いて学習済みモデルを再学習することにより対応していたが、この場合であっても認識率には限界があった。そのため、本実施形態の画像処理装置では、表示カードの特徴を表す基本のパターンをパラメータ化することにより、表示カードの領域を精度よく抽出することができる。
【0074】
なお、上記では、各プログラムが記憶部に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、CD−ROM、DVD−ROM、USBメモリ等の記録媒体に記録された形態で提供することも可能である。
【0075】
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
【0077】
上記実施形態では、画像の各部分領域に対して第1のスコア及び第2のスコアを算出して、表示枠の領域を表す第1の領域及び数字の領域を表す第2の領域を特定する場合を例に説明したが、これに限定されるものではない。例えば、パターンマッチングなどの所定の画像処理によって、表示枠の領域を表す第1の領域及び数字の領域を表す第2の領域を抽出するようにしてもよい。
【0078】
また、表示カードの領域を認識する際には、他の条件を更に考慮するようにしてもよい。例えば、認識部26は、第1の領域の面積と第2の領域の面積との面積比に基づいて、第1の領域と第2の領域との面積比が所定の範囲内である場合に、当該第1の領域を表示カードの領域として認識するようにしてもよい。
【0079】
以上の実施形態に関し、更に以下の付記を開示する。
【0080】
(付記1)
画像を取得する取得部と、
前記取得部によって取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出する抽出部と、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する認識部と、
を含む画像処理装置。
【0081】
(付記2)
前記取得部によって取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出する算出部を更に含み、
前記抽出部は、前記算出部によって算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
付記1に記載の画像処理装置。
【0082】
(付記3)
前記算出部は、前記取得部によって取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
付記2に記載の画像処理装置。
【0083】
(付記4)
前記認識部は、前記第1の領域の縦横比の値が予め定められた範囲内である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記2又は付記3に記載の画像処理装置。
【0084】
(付記5)
前記認識部は、前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
付記1〜付記4の何れか1項に記載の画像処理装置。
【0085】
(付記6)
前記認識部は、前記第1の領域内の前記第2の領域の個数が、所定の範囲内の個数である場合に、前記第1の領域を前記表示カードとして認識する、
付記1〜付記5の何れか1項に記載の画像処理装置。
【0086】
(付記7)
前記認識部は、前記第2の領域の各々についての文字認識結果を取得し、前記第2の領域の各々についての前記文字認識結果に基づいて、税込み価格を表す前記第2の領域と、税抜き価格を表す前記第2の領域とを認識し、前記税込み価格を表す前記第2の領域と前記税抜き価格を表す前記第2の領域との間の配置関係が予め定められた関係である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記1〜付記6の何れか1項に記載の画像処理装置。
【0087】
(付記8)
前記認識部は、前記第1の領域の面積と前記第2の領域の面積との面積比が、所定の範囲内である場合に、前記第1の領域を前記表示カードとして認識する、
付記1〜付記7の何れか1項に記載の画像処理装置。
【0088】
(付記9)
画像を取得し、
取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
処理をコンピュータに実行させるための画像処理プログラム。
【0089】
(付記10)
取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出し、
算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
付記9に記載の画像処理プログラム。
【0090】
(付記11)
取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
付記10に記載の画像処理プログラム。
【0091】
(付記12)
前記第1の領域の縦横比の値が予め定められた範囲内である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記10又は付記11に記載の画像処理プログラム。
【0092】
(付記13)
前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
付記9〜付記12の何れか1項に記載の画像処理プログラム。
【0093】
(付記14)
前記第1の領域内の前記第2の領域の個数が、所定の範囲内の個数である場合に、前記第1の領域を前記表示カードとして認識する、
付記9〜付記13の何れか1項に記載の画像処理プログラム。
【0094】
(付記15)
前記第2の領域の各々についての文字認識結果を取得し、前記第2の領域の各々についての前記文字認識結果に基づいて、税込み価格を表す前記第2の領域と、税抜き価格を表す前記第2の領域とを認識し、前記税込み価格を表す前記第2の領域と前記税抜き価格を表す前記第2の領域との間の配置関係が予め定められた関係である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記9〜付記14の何れか1項に記載の画像処理プログラム。
【0095】
(付記16)
画像を取得し、
取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
処理をコンピュータに実行させる画像処理方法。
【0096】
(付記1
7)
取得された前記画像に基づいて、前記画像の各部分領域について、前記第1の領域である度合いを表す第1のスコアと、前記第2の領域である度合いを表す第2のスコアとを算出し、
算出された前記第1のスコアが予め設定された第1の閾値よりも大きい領域を前記第1の領域として抽出し、前記算出部によって算出された前記第2のスコアが予め設定された第2の閾値よりも大きい領域を前記第2の領域として抽出する、
付記1
6に記載の画像処理方法。
【0097】
(付記1
8)
取得された前記画像の各部分領域について、学習用の画像内における前記第1の領域及び学習用の画像内における前記第2の領域が対応付けられた学習用データから予め生成された学習済みモデルに基づいて、前記第1のスコアと前記第2のスコアとを算出する、
付記1
7に記載の画像処理方法。
【0098】
(付記1
9)
前記第1の領域の縦横比の値が予め定められた範囲内である場合に、前記第1の領域を前記表示カードの領域として認識する、
付記1
7又は付記1
8に記載の画像処理方法。
【0099】
(付記
20)
前記第1の領域の枠を表す各座標と前記第2の領域の枠を表す各座標との間の差分が予め定められた範囲内である場合に、該第1の領域を前記表示カードの領域として認識する、
付記1
6〜付記1
9の何れか1項に記載の画像処理方法。
【0100】
(付記2
1)
画像を取得し、
取得された前記画像から、表示枠を表す第1の領域と数字を表す第2の領域とを抽出し、
前記第1の領域内に前記第2の領域が含まれ、かつ前記第1の領域と前記第2の領域とが予め定められた関係である場合に、前記第1の領域を、商品の価格情報を含む表示カードの領域として認識する、
処理をコンピュータに実行させるための画像処理プログラムを記憶した記憶媒体。