IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特許7183753リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム
<>
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図1
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図2
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図3
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図4
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図5
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図6
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図7
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図8
  • 特許-リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-28
(45)【発行日】2022-12-06
(54)【発明の名称】リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム
(51)【国際特許分類】
   G06F 16/55 20190101AFI20221129BHJP
   G06T 7/00 20170101ALI20221129BHJP
   G06V 10/762 20220101ALI20221129BHJP
【FI】
G06F16/55
G06T7/00 350
G06V10/762
【請求項の数】 6
(21)【出願番号】P 2018231867
(22)【出願日】2018-12-11
(65)【公開番号】P2020095408
(43)【公開日】2020-06-18
【審査請求日】2021-03-12
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】細野 峻司
(72)【発明者】
【氏名】渡邉 之人
(72)【発明者】
【氏名】島村 潤
(72)【発明者】
【氏名】嵯峨田 淳
【審査官】早川 学
(56)【参考文献】
【文献】国際公開第2018/016214(WO,A1)
【文献】特開2009-251705(JP,A)
【文献】特開2015-138349(JP,A)
【文献】特開2017-220206(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06T 7/00
G06V 10/762
(57)【特許請求の範囲】
【請求項1】
クエリ画像を入力として、複数の属性のいずれかの被写体を含む画像からなる画像群に基づいて、前記クエリ画像に含まれる被写体を識別する被写体識別部と、
前記クエリ画像は3つ以上の被写体を含み、前記クエリ画像の前記被写体の各々について、前記クエリ画像中の前記被写体の画像上のサイズと前記識別された被写体の現実のサイズとに基づいて実寸比を算出し、算出結果に基づいて、前記クエリ画像に含まれる被写体の実寸比を推定する実寸比推定部と、
前記クエリ画像について実寸比に基づいて前記クエリ画像についての被写体の現実のサイズを推定し、
推定した被写体の現実のサイズと、同一の属性における前記被写体の現実のサイズが異なる画像のリストであって、属性が同一であり、かつ、前記被写体の現実のサイズが異なる前記被写体を含む画像について少なくとも2つの当該画像が分類されたクラスタの各々によるリストに含まれるクラスタのうち前記識別された被写体と同一のクラスタの画像に含まれる被写体の現実のサイズと、に基づいて識別結果を補正し、前記クエリ画像に含まれる被写体を推定する識別結果補正部と、
を含む被写体識別装置。
【請求項2】
前記リストは、画像の各々を同一のクラスタに分類するように、前記画像群に含まれる画像ペアについて、前記画像に撮像された被写体の画像特徴に基づく類似度により同一属性であると識別された画像ペアが、前記被写体の現実のサイズによらず同一のクラスタに分類されるように生成されている請求項1に記載の被写体識別装置。
【請求項3】
前記リストは、前記画像特徴に基づく類似度により同一属性であると識別された画像ペアであって、かつ、及び前記被写体に係る名称を示すラベルに基づく類似度により同一属性であると識別された画像ペアが前記被写体の現実のサイズによらず同一のクラスタに分類されるように生成されている請求項2に記載の被写体識別装置。
【請求項4】
前記リストは、前記クラスタの各々において、前記クラスタに分類された前記画像に含まれる被写体について予め与えられた現実のサイズと、前記画像の識別情報とを関連付けて生成されている請求項1~請求項3の何れか1項に記載の被写体識別装置。
【請求項5】
クエリ画像を入力として、複数の属性のいずれかの被写体を含む画像からなる画像群に基づいて、前記クエリ画像に含まれる被写体を識別し、
前記クエリ画像は3つ以上の被写体を含み、前記クエリ画像の前記被写体の各々について、前記クエリ画像中の前記被写体の画像上のサイズと前記識別された被写体の現実のサイズとに基づいて実寸比を算出し、算出結果に基づいて、前記クエリ画像に含まれる被写体の実寸比を推定し、
前記クエリ画像について実寸比に基づいて前記クエリ画像についての被写体の現実のサイズを推定し、
推定した被写体の現実のサイズと、同一の属性における前記被写体の現実のサイズが異なる画像のリストであって、属性が同一であり、かつ、前記被写体の現実のサイズが異なる前記被写体を含む画像について少なくとも2つの当該画像が分類されたクラスタの各々によるリストに含まれるクラスタのうち前記識別された被写体と同一のクラスタの画像に含まれる被写体の現実のサイズと、に基づいて識別結果を補正し、前記クエリ画像に含まれる被写体を推定する、
処理をコンピュータが実行する被写体識別方法。
【請求項6】
コンピュータを、請求項1~請求項4のいずれか1項に記載の被写体識別装置の各部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、リスト生成装置、被写体識別装置、リスト生成方法、及びプログラムに係り、特に、画像に含まれる被写体を識別するためのリスト生成装置、被写体識別装置、リスト生成方法、及びプログラムに関する。
【背景技術】
【0002】
画像中に映る被写体の種類を特定する被写体識別は、画像による看板や商品の検索等、幅広い産業応用性を持つ。被写体識別の対象となる被写体には、容量のみが異なる同種の飲料等の商品で、ほぼ同一のデザインでサイズが異なるものが存在することがある。サイズによって値段等の関連情報が異なることを考えると、被写体識別によりこれらを正確に区別することは重要である。しかし、そのようなサイズ違いの被写体は画像上での見た目が酷似するため、画像特徴に基づき被写体の種別を判定する一般的な被写体識別(例えば、特許文献1記載の手法)では、サイズ違いの被写体を弁別することは困難である。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2015-201123号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
画像特徴に基づき被写体を識別する手法では、誤認識してしまう場合がある。
【0005】
上記の問題を解決する方法として、クエリ画像中における画素及び被写体の実寸比から求まる被写体の現実のサイズと、被写体DBにおける各識別対象の被写体の現実のサイズとを比較する手法がある。この手法では、クエリ画像中における画素当たりの実寸(現実サイズ)と、どの被写体がサイズ違いの関係にあるのかを示したサイズ違いリストが事前情報として必要である。
【0006】
しかしながら、上記の事前情報の取得は、撮影時の制限や人的コストの観点から困難である場合がある。例えば、クエリ画像中における画素当たりの実寸を取得するためには、深度センサのような特殊なセンサの利用や、大きさの基準とする特定の被写体を画像中に収めるように撮影するといった制約が撮影時に必要となる。また、商品等の人工物の場合、その設計時等のデータを用いて、サイズ情報を被写体DBに付与することは可能な場合が多いが、各物体のサイズ違いまでは管理されていない場合が多く、その情報を人手で付与することは人的コストが高いため困難であると考えられる。
【0007】
本発明は、上記事情を鑑みて成されたものであり、同一属性のサイズ違いの被写体を精度よく識別するためのリストを自動的に生成することを目的とする。
【0008】
また、本発明は、同一属性のサイズ違いの被写体を精度よく識別することができる被写体識別装置、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために、第1の発明に係るリスト生成装置は、複数の属性のいずれかの被写体を含む画像からなる画像群から、属性が同一であり、かつ、前記被写体の現実のサイズが異なる前記被写体を含む画像の各々を同一のクラスタに分類する分類部と、少なくとも2つの前記画像が分類されたクラスタの各々を、同一の属性における前記被写体の現実のサイズが異なる画像のリストとして出力する出力部と、を含んで構成されている。
【0010】
また、第1の発明に係るリスト生成装置において、前記分類部は、前記画像群に含まれる画像毎に、前記画像に撮像された被写体の画像特徴、及び前記被写体に係るテキスト特徴のうち、少なくとも前記画像特徴に基づき、同一属性であると識別された画像が、前記被写体の現実のサイズによらず同一のクラスタに分類されるように前記分類を行ってもよい。
【0011】
また、第1の発明に係るリスト生成装置において、前記出力部は、前記クラスタの各々において、前記クラスタに分類された前記画像に含まれる被写体について予め与えられた現実のサイズと、前記画像の識別情報とを関連付けて、前記リストとして出力するようにしてもよい。
【0012】
第2の発明に係る被写体識別装置は、クエリ画像を入力として、複数の属性のいずれかの被写体を含む画像からなる画像群に基づいて、前記クエリ画像に含まれる被写体を識別する被写体識別部と、前記クエリ画像について推定した被写体の現実のサイズと、第1の発明のリスト生成装置によって出力された前記リストに含まれるクラスタのうち前記識別された被写体と同一のクラスタの画像に含まれる被写体の現実のサイズと、に基づいて識別結果を補正し、前記クエリ画像に含まれる被写体を推定する識別結果補正部と、を含んで構成されている。
【0013】
第2の発明に係る被写体識別装置において、前記クエリ画像は3つ以上の被写体を含み、前記クエリ画像の前記被写体の各々について、前記クエリ画像中の前記被写体の画像上のサイズと前記識別された被写体の現実のサイズとに基づいて実寸比を算出し、算出結果に基づいて、前記クエリ画像に含まれる被写体の実寸比を推定する実寸比推定部を更に含み、前記識別結果補正部は、推定した実寸比に基づいて前記クエリ画像についての被写体の現実のサイズを推定するようにしてもよい。
【0014】
第3の発明に係るリスト生成方法は、分類部が、複数の属性のいずれかの被写体を含む画像からなる画像群から、属性が同一であり、かつ、前記被写体の現実のサイズが異なる前記被写体を含む画像の各々を同一のクラスタに分類するステップと、出力部が、少なくとも2つの前記画像が分類されたクラスタの各々を、同一の属性における前記被写体の現実のサイズが異なる画像のリストとして出力するステップと、を含んで実行することを特徴とする。
【0015】
また、第4の発明に係るプログラムは、コンピュータを、第1の発明に記載のリスト生成装置の各部として機能させるためのプログラムである。
【0016】
また、第5の発明に係るプログラムは、コンピュータを、第2の発明に記載の被写体識別装置の各部として機能させるためのプログラムである。
【発明の効果】
【0017】
本発明のリスト生成装置、方法、及びプログラムによれば、同一属性のサイズ違いの被写体を精度よく識別するためのリストを自動的に生成することができる、という効果が得られる。
また、被写体識別装置、及びプログラムによれば、同一属性のサイズ違いの被写体を精度よく識別することができる、という効果が得られる。
【図面の簡単な説明】
【0018】
図1】被写体の識別結果を補正し、実寸比を推定する場合の一例を示す図である。
図2】本発明の第1の実施の形態に係るリスト生成装置及び被写体識別装置を含む被写体識別システムの構成を示すブロック図である。
図3】各商品と類似度との関係の一例を示す図である。
図4】識別結果の補正の一例を示す図である。
図5】本発明の第1及び第2の実施の形態に係るリスト生成装置の処理ルーチンを示すフローチャートである。
図6】本発明の第1の実施の形態に係る被写体識別装置の処理ルーチンを示すフローチャートである。
図7】本発明の第2の実施の形態に係るリスト生成装置及び被写体識別装置を含む被写体識別システムの構成を示すブロック図である。
図8】実寸比を推定する場合の処理の一例を示す図である。
図9】本発明の第2の実施の形態に係る被写体識別装置の処理ルーチンを示すフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0020】
<本発明の実施の形態に係る概要>
【0021】
まず、本発明の実施の形態における概要を説明する。
【0022】
第1の実施の形態の手法としては、図1に示すように一般的な被写体の識別結果を補正することが考えられる。補正のためにサイズ違いリストを事前情報として活用するが、サイズ違いリストを自動獲得する。サイズ違いリストについては後述する。さらに、入力された画素あたりの実寸である実寸比から得られる被写体の現実のサイズと、識別結果として出力された被写体のサイズ違いリストに含まれる被写体の現実のサイズとを比較する。現実のサイズとは、被写体の実寸を示す。比較結果から尤もらしいサイズとなる被写体を選択することで、正しいサイズの被写体へ識別結果を補正することが可能となる。また、第2の実施の形態の手法としては、クエリ画像中の各被写体の実寸から得られる実寸比を用いて、被写体の実寸比を推定することが考えられる。これにより、クエリ画像中の被写体の現実のサイズと被写体DBに格納された現実のサイズを比較することで、識別結果のサイズの整合性を検証することができる。
【0023】
すなわち、現在用いられている、エッジなどを用いて抽出された画像の特徴量に基づき被写体識別を行う技術では、被写体の現実のサイズが異なっても、同じ属性を持つ場合は同一の被写体として弁別される。本発明の実施の形態では、このような現在用いられている被写体識別技術の性質を利用している。
【0024】
第1の実施の形態の手法は、サイズ違いリストを自動で生成する手段を持つ。サイズ違いの被写体同士は画像上での見た目が似るという特性を活用し、被写体DBに登録された画像同士の類似度が高いものをサイズ違いの被写体としてリストを自動生成する。また、入力された実寸比を用いて得られるクエリ画像中の被写体の現実のサイズを基に、サイズ違いリストから尤もらしいサイズの被写体を選択することにより、被写体識別結果を補正する手段も備える。これにより、サイズ違いリストを準備することなく、サイズ違いの被写体を弁別可能となることが望める。
【0025】
また、第2の実施の形態の手法は、クエリ画像中における実寸比を自動で推定する手段を持つ。本手段では、クエリ画像中に複数の被写体が存在し、かつ複数の被写体に対する識別結果が概ね正しいと仮定し、クエリ画像中の被写体領域と、識別結果の被写体の実寸とを比較することで、実寸比を推定する。これにより、特殊なセンサ等を用いなくとも実寸比を推定可能となることが望める。
【0026】
以上の各実施の形態の手法について、以下、実施の形態の構成及び作用を説明する。なお、実施の形態では、属性の一例として商品名を用いる場合を例に説明する。
【0027】
<本発明の第1の実施の形態に係る被写体識別システムの構成及び作用>
【0028】
次に、本発明の実施の形態に係る被写体識別システムの構成について説明する。図2に示すように、本発明の実施の形態に係る被写体識別システム100は、被写体DB22と、リスト生成装置20と、リストDB28と、被写体識別装置30とを含んで構成されている。リスト生成装置20と、被写体識別装置30とは、それぞれCPUと、RAMと、プログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。
【0029】
被写体DB22には、識別対象となる複数の商品のいずれかの被写体を含む画像からなる画像群であって、サイズ違いの商品それぞれを被写体とする画像を含む画像群、画像に含まれる被写体の商品の商品名(ラベル名)、被写体のラベルID、及び被写体のサイズを格納しておく。被写体のサイズは幅、及び高さとするが、奥行きを加えてもよい。画像の各々は、異なる商品名及び異なるサイズの被写体を含む想定である。リスト生成装置20は、被写体DB22を用いてリストの生成を行う。生成するリストは、画像の画像特徴が類似する場合に、画像の被写体が同一の商品のサイズ違いであると仮定したサイズ違いリストである。また、被写体識別装置30は、被写体DB22及びリストDB28を参照して被写体識別を行う。
【0030】
まずリスト生成装置20について説明する。
【0031】
リスト生成装置20は、分類部24と、出力部26とを含んで構成されている。
【0032】
分類部24は、被写体DB22の画像群から、商品が同一であり、かつ、被写体の現実のサイズが異なる被写体を含む画像の各々を同一のクラスタに分類する。本実施の形態では、被写体DB22の画像群に含まれる画像間で類似度を算出し、類似する画像を、同一のクラスタに分類する。
【0033】
分類部24による分類では、(1)特徴抽出、及び(2)クラスタリング、の処理を行うが、以下、具体的に説明する。
【0034】
分類部24は、まず、被写体DB22の被写体を含む画像の各々について、画像特徴を抽出する。ここで抽出する画像特徴は有為なものを用いることができる。例えば、参考文献1等で用いられているSIFT特徴量等を用いることができる。
【0035】
[参考文献1]D. G. Lowe,”Distinctive Image Features from Scale-Invariant Keypoints,”International Journal of Computer Vision,no. 2004, vol. 60, pp.91-110, 2004.
【0036】
次に、分類部24は、被写体DB22から得られる画像ペアの全組み合わせについて、特徴抽出で得られた画像特徴の類似を算出し、算出した類似度が高い画像同士を同一のクラスタとして被写体識別を行い、画像をクラスタリングする。このとき、類似度の算出には有為な手段を取ることができる。例えば、特許文献1中に示されている、スコアリングにより出力する画像ペア間の類似度を用いてもよい。また、参考文献2で出力される一般物体のクラスを加味した類似度としてもよい。例えば、被写体A-B間の一般物体のクラス(ペットボトル、缶等)が異なる場合には、類似度を0にするといった処理が考えられる。
[参考文献2]J. Redmon, A. Fradai, “YOLO9000: Better, Faster, Stronger,” in CVPR, 2017.
【0037】
そして、分類部24は、画像間の類似度が一定以上となった画像ペアについて、そのペアをサイズ違いとして、サイズ違いリストに登録する。図3に各商品と類似度との関係の一例を示す。例えば、被写体A、B、Cがある場合に、被写体A-B、被写体B-C間の類似度が高くなった場合、被写体A-B-Cを同一のクラスタに分類する。ここで、より誤りの少ないサイズ違いリストを生成するために、被写体A-C間の類似度が低い場合には、統合せずに、被写体A-B、被写体B-Cをそれぞれ同一のクラスタとするといった処理を加えてもよい。
【0038】
また、例えば、被写体が飲料商品の場合、同一メーカの味違い等も同一ロゴを含み画像特徴の類似度が高くなる場合があるため、別商品であっても同一のクラスタに分類されてしまう懸念もある。この場合、画像特徴に加え、商品名(ラベル名)の類似度も考慮してクラスタリングをしてもよい。具体的には、正規化レーベンシュタイン距離等により商品名間での類似度を定義し、画像、商品名双方の類似度が高くなるペアを統合し一つのクラスタに分類するようにし、いずれかの類似度が低くなるペアは別のクラスタとするように処理してもよい。なお、商品名(ラベル名)は被写体DB22からテキストデータとして与えられる。商品名が分かっている場合であっても、テキスト処理のみの場合、例えば、飲料商品であれば、味違いの商品が弁別できない場合も想定されるため、画像特徴及び商品名のテキスト処理を併用する必要がある。また、商品名の表記ゆれ(例えば、「かろわす」、「か・ろ・わ・す」、「かろわす500ML」、「コーラ かろわす」等)により同じ属性であるかどうかを商品名のみでは判断困難な場合がある。
【0039】
出力部26は、少なくとも2つの画像が分類されたクラスタの各々を、同一の商品における被写体の現実のサイズが異なる画像のサイズ違いリストとしてリストDB28に登録する。
【0040】
サイズ違いリストは、具体的には、画像に含まれる被写体に対応付く識別情報であるラベルIDを用いて、クラスタごとのラベルIDを列挙したものとする。例えば、3つのクラスタがある場合、「46077600,46039458,46723984/46059295,46039402,46075392/46094234,46593243(スラッシュがクラスタ)」とクラスタごとラベルIDのリストを持つようにする。また、クラスタのIDを付与してもよい。また、出力部26は、クラスタの各々において、当該クラスタに分類された画像に含まれる被写体について予め与えられた現実のサイズ(幅、及び高さ)と、ラベルIDとを関連付けて、サイズ違いリストとして出力するようにしてもよい。例えば、サイズとして幅及び高さを関連付けるのであれば、「46077600,(7cm:25cm),46039458,(7cm:15cm),...」といったサイズ違いリストにする。
【0041】
次に、被写体識別装置30について説明する。
【0042】
被写体識別装置30は、被写体領域推定部32と、被写体識別部34と、識別結果補正部36とを含んで構成されている。
【0043】
被写体領域推定部32は、入力されたクエリ画像に含まれる被写体領域を推定する。領域推定には、非特許文献1により出力される矩形や、参考文献3により出力される画素毎の領域等、有為なものを用いることができる。
【0044】
[参考文献3]O. Pedro et al., ”Learning to Refine Object Segments,” in ECCV, 2016.
【0045】
なお、被写体領域推定部32で推定される被写体領域は複数の場合もあり、以下では、それぞれの被写体領域について処理を行う。
【0046】
被写体識別部34は、被写体領域推定部32でクエリ画像から推定された被写体領域を入力として、被写体DB22の複数の被写体のいずれかの被写体を含む画像からなる画像群に基づいて、クエリ画像に含まれる被写体を識別する。具体的には、各被写体領域を1枚の画像と見なし被写体識別(例えば参考文献1記載の手法)を行ない、各被写体が被写体DB22に登録されたどの画像の被写体に該当するのか、あるいはどれにも該当しないのかを識別結果として識別結果補正部36に出力する。
【0047】
識別結果補正部36は、被写体識別部34によって識別された被写体について、当該被写体の識別結果の各々について補正する。以下に流れを説明する。
まず、識別結果補正部36は、クエリ画像と共に入力された、画素あたりの実寸である実寸比と、被写体領域のサイズとを用いて、クエリ画像について識別対象の被写体の現実のサイズを推定する。次に、推定したクエリ画像の被写体の現実のサイズと、リストDB28に含まれるクラスタのうち識別された被写体と同一のクラスタの画像に含まれる被写体の現実のサイズと、に基づいて識別結果を補正し、クエリ画像に含まれる被写体を推定する。そして、識別結果補正部36は、推定したクエリ画像に含まれる被写体の位置、ラベル名、及び現実のサイズを最終的な識別結果として出力する。
【0048】
具体的には、識別結果補正部36は、被写体識別部34によって識別された被写体と、その被写体のサイズ違いの被写体について、どの被写体が最もクエリ画像中における被写体領域が示す現実のサイズと近いかを探索することで、被写体識別部34の結果を補正する。下記(1)式により補正後の被写体o'を推定する。
【0049】
【数1】

・・・(1)
【0050】
ここで、oは被写体識別部34により識別された被写体であり、OはリストDB28のサイズ違いリストに存在する、当該被写体のサイズ違いとなる被写体の集合である。また、sはある被写体oに対応する被写体の現実のサイズであり、sはクエリ画像中における被写体の現実のサイズを推定したものである。sは、クエリ画像の画素当たりの実寸である実寸比を元に推定するが推定方法は後述する。
【0051】
識別結果補正部は、上記(1)式によってsとsとの差異が最も小さくなる被写体を識別結果として推定する。図4に識別結果の補正の一例を示す。
【0052】
上記(1)式の関数Dについて説明する。関数Dは現実のサイズの距離を定義する関数であり、例えば下記(2)式により定義する。
【0053】
【数2】

・・・(2)
【0054】
ここで、s は被写体oに対応する被写体の現実の高さ、s は被写体oに対応する被写体の現実の幅である。また、s は、クエリ画像中における被写体の現実の高さ、s は、クエリ画像中における被写体の現実の幅であり、それぞれ現実のサイズとして推定される。s 及びs は、クエリ画像の縦における画素の実寸比r、及びクエリ画像の横における画素の実寸比rと、クエリ画像中の被写体領域の高さb 、クエリ画像中の被写体領域の幅b とを用いて、それぞれ、s =r 、s =r で推定される。r、rは、クエリ画像の事前情報として入力時に与えられているものとする。また、関数Dは上記のほかにも現実のサイズにおける外周(s +s )や、アスペクト比(s /s )等を用いて定義してもよい。アスペクト比を用いる場合には、サイズが異なる要素間で偶然アスペクト比が一致してしまう場合もあるため、精度の点からサイズを併用する必要がある。また、画像から現実のサイズを推定する際、深度を用いることも考えられるが、デプスマップ等の画素以外の情報も被写体DB22に格納しておく必要がある。
【0055】
以上のようにして、識別結果補正部36の処理により、尤もらしいサイズの被写体の識別結果に補正することができる。
【0056】
次に、本発明の実施の形態に係る被写体識別システム100の作用について説明する。
【0057】
まずリスト生成装置20の作用を図5に示すフローチャートを用いて説明する。
【0058】
ステップS100では、分類部24は、被写体DB22の被写体を含む画像の各々について、画像特徴を抽出する。
【0059】
ステップS102では、分類部24は、被写体DB22から得られる画像ペアの全組み合わせについて、特徴抽出で得られた画像特徴の類似を算出し、算出した類似度によって被写体識別を行って、画像をクラスタリングする。このようにして、分類部24は、被写体DB22の画像群から、商品が同一であり、かつ、被写体の現実のサイズが異なる被写体を含む画像の各々を同一のクラスタに分類する。
【0060】
ステップS104では、出力部26は、少なくとも2つの画像が分類されたクラスタの各々を、同一の商品における被写体の現実のサイズが異なる画像のサイズ違いリストとしてリストDB28に登録する。
【0061】
次に被写体識別装置30の作用を図6に示すフローチャートを用いて説明する。
【0062】
ステップS200では、被写体領域推定部32は、入力されたクエリ画像に含まれる被写体領域を推定する。
【0063】
ステップS202では、被写体識別部34は、被写体領域推定部32でクエリ画像から推定された被写体領域を入力として、被写体DB22の複数の商品のいずれかの被写体を含む画像からなる画像群に基づいて、クエリ画像に含まれる被写体を識別する。
【0064】
ステップS204では、識別結果補正部36は、クエリ画像と共に入力された、画素あたりの実寸である実寸比と、被写体領域のサイズとを用いて、クエリ画像について識別対象の被写体の現実のサイズを推定する。被写体のサイズの推定は、クエリ画像の事前情報として与えられた、クエリ画像の縦における画素の実寸比r、及びクエリ画像の横における画素の実寸比rと、クエリ画像中の被写体領域の高さb 、及びクエリ画像中の被写体領域の幅b とに基づいて行う。
【0065】
ステップS206では、識別結果補正部36は、ステップS204で推定したクエリ画像の当該被写体の現実のサイズと、リストDB28のサイズ違いリストに含まれるクラスタのうち識別された被写体と同一のクラスタの画像に含まれる被写体の現実のサイズと、に基づいて上記(1)式に従って識別結果を補正し、クエリ画像に含まれる被写体を推定する。
【0066】
ステップS208では、識別結果補正部36は、ステップS206で推定したクエリ画像中の当該被写体の位置、商品名、及び現実のサイズを最終的な識別結果として出力する。
【0067】
以上、説明したように本発明の第1の実施の形態によれば、商品が同一であり、かつ、被写体の現実のサイズが異なる被写体を含む画像の各々を同一のクラスタに分類し、クラスタの各々を、同一の商品における被写体の現実のサイズが異なる画像のサイズ違いリストとすることで、サイズ違いの商品を精度よく識別するために用いるサイズ違いリストを生成できる。
【0068】
また、クエリ画像の当該被写体のサイズと、サイズ違いリストに含まれるクラスタのうち識別された被写体と同一のクラスタの画像に含まれる被写体の現実のサイズと、に基づいて識別結果を補正し、クエリ画像に含まれる被写体を推定することで、識別結果を補正し、サイズ違いの商品を精度よく識別することができる。
【0069】
<本発明の第2の実施の形態に係る被写体識別システムの構成及び作用>
【0070】
次に、本発明の第2の実施の形態に係る被写体識別システムの構成について説明する。なお第1の実施の形態と同様となる箇所については同一符号を付して説明を省略する。
【0071】
第2の実施の形態は、クエリ画像は3つ以上の被写体を含む場合において、クエリ画像の画素の実寸比(以下、単に実寸比と記載する)を精度よく求める手法であり、クエリ画像の事前情報である実寸比r、rの入力が不要となる。これにより、深度センサの利用や、基準物体の撮影等の条件から、事前に実寸比を入力することなく、様々なクエリ画像でサイズ違いを弁別可能な被写体識別を実施可能となることが望める。
【0072】
図7に示すように、本発明の実施の形態に係る被写体識別システム200は、被写体DB22と、リスト生成装置20と、リストDB28と、被写体識別装置230とを含んで構成されている。
【0073】
被写体識別装置230は、被写体領域推定部32と、被写体識別部34と、実寸比推定部240と、識別結果補正部36とを含んで構成されている。
【0074】
実寸比推定部240は、クエリ画像の被写体の各々について、当該クエリ画像中の被写体の画像上のサイズと被写体識別部34で識別された被写体の現実のサイズとに基づいて実寸比を算出する。そして、各被写体の算出結果に基づいて、クエリ画像に含まれる被写体の実寸比を推定する。
【0075】
実寸比推定部240による処理は、クエリ画像中の各被写体領域について、被写体識別部34の各被写体に対する識別結果がおおよそ正しいものであると仮定し、実寸比を推定する手法である。具体的には、ある被写体領域qの縦における実寸比r を以下(3)式で算出する。
【0076】
【数3】

・・・(3)
【0077】
そして、各被写体領域から算出されたr から最終的な実寸比rを算出する。例えば、被写体識別部34の結果に誤認識が幾らか含まれていることを加味し、中央値を算出し決定する。また、横における実寸比r については上記(3)式のr と同様に算出するか、r の値をそのまま用いてもよい。図8に実寸比を推定する場合の処理の一例を示す。
【0078】
識別結果補正部36は、実寸比推定部240で推定した実寸比に基づいてクエリ画像についての被写体の現実のサイズを推定する。
【0079】
また、第2の実施の形態の被写体識別装置の作用を図9のフローチャートに示す。ステップS202の後にステップS400において、実寸比推定部240は、当該クエリ画像中の被写体の画像上のサイズと被写体識別部34で識別された被写体の現実のサイズとに基づいて実寸比を算出する。そして、各被写体の算出結果に基づいて、クエリ画像に含まれる被写体の実寸比を推定する。
【0080】
ステップS204では、識別結果補正部36は、ステップS400で推定した実寸比に基づいてクエリ画像について識別対象の被写体の現実のサイズを推定する。被写体のサイズの推定は、ステップS400で推定された実寸比r 、r と、クエリ画像中の被写体領域の高さb 、及びクエリ画像中の被写体領域の幅b とに基づいて行う。
【0081】
以上説明したように、本発明の第2の実施の形態によれば、クエリ画像に3つ以上の被写体が含まれる場合に、クエリ画像の実寸比を精度よく求めることができる。
【0082】
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0083】
例えば、上述した実施の形態では、被写体の属性を商品名とする場合を例に説明したが、これに限定されるものではなく、被写体の対象を示す名称等でよい。
【0084】
また、被写体識別システムとしてリスト生成装置と被写体識別装置とを一体として構成する場合を例に説明したが、これに限定されるものではなく、それぞれの装置を分けて構成するようにしてもよい。
【符号の説明】
【0085】
20 リスト生成装置
24 分類部
26 出力部
30 被写体識別装置
32 被写体領域推定部
34 被写体識別部
36 識別結果補正部
100、200 被写体識別システム
230 被写体識別装置
240 実寸比推定部
図1
図2
図3
図4
図5
図6
図7
図8
図9