特許第6768101号(P6768101)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セコム株式会社の特許一覧

特許6768101データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置
<>
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000002
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000003
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000004
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000005
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000006
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000007
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000008
  • 特許6768101-データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6768101
(24)【登録日】2020年9月24日
(45)【発行日】2020年10月14日
(54)【発明の名称】データベース統合装置、データベース統合方法、データベース統合プログラム、及びデータ補完装置
(51)【国際特許分類】
   G06N 20/00 20190101AFI20201005BHJP
   G06T 7/00 20170101ALI20201005BHJP
【FI】
   G06N20/00 130
   G06T7/00 350B
【請求項の数】8
【全頁数】21
(21)【出願番号】特願2019-36101(P2019-36101)
(22)【出願日】2019年2月28日
(65)【公開番号】特開2020-140493(P2020-140493A)
(43)【公開日】2020年9月3日
【審査請求日】2019年7月26日
(73)【特許権者】
【識別番号】000108085
【氏名又は名称】セコム株式会社
(74)【代理人】
【識別番号】110000154
【氏名又は名称】特許業務法人はるか国際特許事務所
(72)【発明者】
【氏名】中村 友彦
【審査官】 塚田 肇
(56)【参考文献】
【文献】 特開2008−234352(JP,A)
【文献】 特開2000−40079(JP,A)
【文献】 特開2019−191974(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納するデータベースに関し、第1部位群についての前記サンプルデータを格納した第1データベースと、前記第1部位群との共通部位と非共通部位との両方からなる第2部位群についての前記サンプルデータを格納した第2データベースとを統合するデータベース統合装置であって、
前記第1データベースの前記サンプルデータに、前記非共通部位について前記位置を不定とした部位データを加え、前記第2部位群を包含する部位群の前記部位データからなる拡張サンプルデータを生成する拡張データ生成手段と、
前記第2データベースの前記サンプルデータから1つ以上の前記非共通部位の前記部位データの前記位置を欠落させて劣化サンプルデータを生成する劣化データ生成手段と、
前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段と、
前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段と、
を備えたことを特徴とするデータベース統合装置。
【請求項2】
所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納する複数のデータベースであり、前記各データベースの前記部位群が少なくとも1つの他の前記データベースとの共通部位を含み、且つ少なくとも1つの前記データベースの前記部位群が少なくとも1つの他の前記データベースとの非共通部位を含む前記複数のデータベースを統合するデータベース統合装置であって、
前記各データベースの前記サンプルデータに、前記複数のデータベースの前記非共通部位の和集合のうち当該データベースの前記部位群以外の前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成手段と、
前記各データベースの前記サンプルデータから、前記和集合に含まれている1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成する劣化データ生成手段と、
前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータから生成された前記拡張サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段と、
前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段と、
を備えたことを特徴とするデータベース統合装置。
【請求項3】
前記劣化データ生成手段は、前記各データベースの前記サンプルデータから、前記和集合以外のものも含めた1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成すること、
を特徴とする請求項2に記載のデータベース統合装置。
【請求項4】
所定の対象物の複数のサンプルについて前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データを含んだサンプルデータを集めたデータ集合であり、前記各サンプルデータの前記部位群が少なくとも1つの他の前記サンプルデータとの共通部位を含み、且つ少なくとも1つの前記サンプルデータの前記部位群が少なくとも1つの他の前記サンプルデータとの非共通部位を含む前記データ集合を用い、前記サンプルデータから当該サンプルデータに含まれている1つ以上の前記非共通部位の前記位置を欠落させた劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって生成された補完器を記憶している補完器記憶手段と、
新たに入力された前記対象物のサンプルデータに、前記非共通部位のうち当該サンプルデータに含まれていない前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成手段と、
前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完し、補完されたサンプルデータを生成する部位補完手段と、
を備えたことを特徴とするデータ補完装置。
【請求項5】
所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納するデータベースに関し、第1部位群についての前記サンプルデータを格納した第1データベースと、前記第1部位群との共通部位と非共通部位との両方からなる第2部位群についての前記サンプルデータを格納した第2データベースとを統合するデータベース統合方法であって、
前記第1データベースの前記サンプルデータに、前記非共通部位について前記位置を不定とした部位データを加え、前記第2部位群を包含する部位群の前記部位データからなる拡張サンプルデータを生成する拡張データ生成ステップと、
前記第2データベースの前記サンプルデータから1つ以上の前記非共通部位の前記部位データの前記位置を欠落させて劣化サンプルデータを生成する劣化データ生成ステップと、
前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって予め生成された補完器を用意するステップと、
前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完ステップと、
を備えたことを特徴とするデータベース統合方法。
【請求項6】
所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納する複数のデータベースであり、前記各データベースの前記部位群が少なくとも1つの他の前記データベースとの共通部位を含み、且つ少なくとも1つの前記データベースの前記部位群が少なくとも1つの他の前記データベースとの非共通部位を含む前記複数のデータベースを統合するデータベース統合方法であって、
前記各データベースの前記サンプルデータに、前記複数のデータベースの前記非共通部位の和集合のうち当該データベースに含まれていない前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成ステップと、
前記各データベースの前記サンプルデータから、前記和集合のうち当該データベースに含まれている1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成する劣化データ生成手段と、
前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータから生成された前記拡張サンプルデータを出力の目標値とする学習によって予め生成された補完器を用意するステップと、
前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完ステップと、
を備えたことを特徴とするデータベース統合方法。
【請求項7】
所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納するデータベースに関し、第1部位群についての前記サンプルデータを格納した第1データベースと、前記第1部位群との共通部位と非共通部位との両方からなる第2部位群についての前記サンプルデータを格納した第2データベースとを統合する処理をコンピュータに行わせるプログラムであって、
当該コンピュータを、
前記第1データベースの前記サンプルデータに、前記非共通部位について前記位置を不定とした部位データを加え、前記第2部位群を包含する部位群の前記部位データからなる拡張サンプルデータを生成する拡張データ生成手段、
前記第2データベースの前記サンプルデータから1つ以上の前記非共通部位の前記部位データの前記位置を欠落させて劣化サンプルデータを生成する劣化データ生成手段、
前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段、及び、
前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段、
として機能させることを特徴とするデータベース統合プログラム。
【請求項8】
所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納する複数のデータベースであり、前記各データベースの前記部位群が少なくとも1つの他の前記データベースとの共通部位を含み、且つ少なくとも1つの前記データベースの前記部位群が少なくとも1つの他の前記データベースとの非共通部位を含む前記複数のデータベースを統合する処理をコンピュータに行わせるプログラムであって、
当該コンピュータを、
前記各データベースの前記サンプルデータに、前記複数のデータベースの前記非共通部位の和集合のうち当該データベースに含まれていない前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成手段、
前記各データベースの前記サンプルデータから、前記和集合のうち当該データベースに含まれている1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成する劣化データ生成手段、
前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータから生成された前記拡張サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段、及び、
前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段、
として機能させることを特徴とするデータベース統合プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定の対象物の部位についての複数のデータベースを統合する技術および所定の対象物の部位についてのデータ群において不足している部位のデータを補完する技術に関する。
【背景技術】
【0002】
撮影画像中に現れている人の姿勢を深層学習に基づいて認識する装置を製作するなど、計測データ中に現れている所定の対象物の複数の部位を学習に基づいて認識する装置を製作する場合、学習用に多数の計測データとそれらに対するアノテーションが必要である。アノテーションは学習用の計測データに対する正解データであり、部位についてのアノテーションは部位の少なくとも種別と位置とを含むデータである。アノテーションは、手作業によって作成され、作成に多大な労力を要する。
【0003】
このような計測データとアノテーションとを含んだデータベースは複数存在し、それぞれのデータベースにおけるアノテーションは一定の共通性を有しながらもそれぞれの基準で作成される。すなわち各データベースは他のデータベースと共通する部位(共通部位)についてのアノテーションを有しつつ、共通しない部位(非共通部位)についてのアノテーションを有する。
【0004】
例えば、非特許文献1によればMPII Human Poseと称される姿勢データベースには、肩、肘、臀部、頭頂、首、胸郭などの部位についての人手によって作成されたアノテーションが含まれている。
【0005】
また、例えば、MS COCOと称されるデータベース群に含まれる姿勢データベース(以下、MS COCOと称する)が非特許文献2に紹介されている。MS COCOにはMPII Human Poseと共通して肩、肘、臀部などについてのアノテーションが含まれているが、MPII Human Poseと共通しない目、鼻、耳などについてのアノテーションも含まれている。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】“2D Human Pose Estimation: New Benchmark and State of the Art Analysis”, M. Andriluka, L. Pishchulin, P. Gehler and B. Schiele (2014 IEEE Conference on Computer Vision and Pattern Recognition, pp.3686-3693)
【非特許文献2】“Microsoft coco: Common objects in context”, T. Y. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Dollar and C. L. Zitnick (2014 European Conference on Computer Vision, pp. 740-755)
【発明の概要】
【発明が解決しようとする課題】
【0007】
このように、それぞれの基準で作成された複数のデータベースを利用して学習用のデータを増やそうとした場合、非共通部位についての新たなアノテーションのために多大な労力を要していた。
【0008】
また、新たな計測データと当該計測データに対するアノテーションが非共通部位を有さないデータベースの基準にて作成され、それを学習用のデータとして追加利用する場合も、非共通部位についての新たなアノテーションのために多大な労力を要していた。
【0009】
また、上記問題は、二次元計測データ(画像)のみならず三次元計測データにおいても生じ、同様に二次元計測データの時系列、三次元計測データの時系列においても生じる。
【0010】
本発明は、上記問題を鑑みてなされたものであり、共通しない部位のデータを含んだ複数のデータベースを容易に統合できるデータベース統合装置、データベース統合方法およびデータベース統合プログラムを提供することを目的とする。
【0011】
また、本発明は、複数のデータベースのいずれかの作成基準にて作成された対象物データに対して当該作成基準にて作成されず他のデータベースの作成基準で作成される部位のデータを容易に補完できるデータ補完装置を提供することを別の目的とする。
【課題を解決するための手段】
【0012】
(1)本発明に係るデータベース統合装置は、所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納するデータベースに関し、第1部位群についての前記サンプルデータを格納した第1データベースと、前記第1部位群との共通部位と非共通部位との両方からなる第2部位群についての前記サンプルデータを格納した第2データベースとを統合する装置であって、前記第1データベースの前記サンプルデータに、前記非共通部位について前記位置を不定とした部位データを加え、前記第2部位群を包含する部位群の前記部位データからなる拡張サンプルデータを生成する拡張データ生成手段と、前記第2データベースの前記サンプルデータから1つ以上の前記非共通部位の前記部位データの前記位置を欠落させて劣化サンプルデータを生成する劣化データ生成手段と、前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段と、前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段と、を備える。
【0013】
(2)他の本発明に係るデータベース統合装置は、所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納する複数のデータベースであり、前記各データベースの前記部位群が少なくとも1つの他の前記データベースとの共通部位を含み、且つ少なくとも1つの前記データベースの前記部位群が少なくとも1つの他の前記データベースとの非共通部位を含む前記複数のデータベースを統合する装置であって、前記各データベースの前記サンプルデータに、前記複数のデータベースの前記非共通部位の和集合のうち当該データベースの前記部位群以外の前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成手段と、前記各データベースの前記サンプルデータから、前記和集合に含まれている1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成する劣化データ生成手段と、前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータから生成された前記拡張サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段と、前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段と、を備える。
【0014】
(3)上記(2)に記載のデータベース統合装置において、前記劣化データ生成手段は、前記各データベースの前記サンプルデータから、前記和集合以外のものも含めた1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成する構成とすることができる。
【0015】
(4)本発明に係るデータ補完装置は、所定の対象物の複数のサンプルについて前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データを含んだサンプルデータを集めたデータ集合であり、前記各サンプルデータの前記部位群が少なくとも1つの他の前記サンプルデータとの共通部位を含み、且つ少なくとも1つの前記サンプルデータの前記部位群が少なくとも1つの他の前記サンプルデータとの非共通部位を含む前記データ集合を用い、前記サンプルデータから当該サンプルデータに含まれている1つ以上の前記非共通部位の前記位置を欠落させた劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって生成された補完器を記憶している補完器記憶手段と、新たに入力された前記対象物のサンプルデータに、前記非共通部位のうち当該サンプルデータに含まれていない前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成手段と、前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完し、補完されたサンプルデータを生成する部位補完手段と、を備える。
【0016】
(5)本発明に係るデータベース統合方法は、所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納するデータベースに関し、第1部位群についての前記サンプルデータを格納した第1データベースと、前記第1部位群との共通部位と非共通部位との両方からなる第2部位群についての前記サンプルデータを格納した第2データベースとを統合する方法であって、前記第1データベースの前記サンプルデータに、前記非共通部位について前記位置を不定とした部位データを加え、前記第2部位群を包含する部位群の前記部位データからなる拡張サンプルデータを生成する拡張データ生成ステップと、前記第2データベースの前記サンプルデータから1つ以上の前記非共通部位の前記部位データの前記位置を欠落させて劣化サンプルデータを生成する劣化データ生成ステップと、前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって予め生成された補完器を用意するステップと、前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完ステップと、を備える。
【0017】
(6)他の本発明に係るデータベース統合方法は、所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納する複数のデータベースであり、前記各データベースの前記部位群が少なくとも1つの他の前記データベースとの共通部位を含み、且つ少なくとも1つの前記データベースの前記部位群が少なくとも1つの他の前記データベースとの非共通部位を含む前記複数のデータベースを統合する方法であって、前記各データベースの前記サンプルデータに、前記複数のデータベースの前記非共通部位の和集合のうち当該データベースに含まれていない前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成ステップと、前記各データベースの前記サンプルデータから、前記和集合のうち当該データベースに含まれている1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成する劣化データ生成手段と、前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータから生成された前記拡張サンプルデータを出力の目標値とする学習によって予め生成された補完器を用意するステップと、前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完ステップと、を備える。
【0018】
(7)本発明に係るデータベース統合プログラムは、所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納するデータベースに関し、第1部位群についての前記サンプルデータを格納した第1データベースと、前記第1部位群との共通部位と非共通部位との両方からなる第2部位群についての前記サンプルデータを格納した第2データベースとを統合する処理をコンピュータに行わせるプログラムであって、当該コンピュータを、前記第1データベースの前記サンプルデータに、前記非共通部位について前記位置を不定とした部位データを加え、前記第2部位群を包含する部位群の前記部位データからなる拡張サンプルデータを生成する拡張データ生成手段、前記第2データベースの前記サンプルデータから1つ以上の前記非共通部位の前記部位データの前記位置を欠落させて劣化サンプルデータを生成する劣化データ生成手段、前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段、及び、前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段、として機能させる。
【0019】
(8)他の本発明に係るデータベース統合プログラムは、所定の対象物の複数のサンプルについて前記サンプルごとに、前記対象物の部位群について部位ごとにその種別と位置とを対応付けて表す部位データからなるサンプルデータを格納する複数のデータベースであり、前記各データベースの前記部位群が少なくとも1つの他の前記データベースとの共通部位を含み、且つ少なくとも1つの前記データベースの前記部位群が少なくとも1つの他の前記データベースとの非共通部位を含む前記複数のデータベースを統合する処理をコンピュータに行わせるプログラムであって、当該コンピュータを、前記各データベースの前記サンプルデータに、前記複数のデータベースの前記非共通部位の和集合のうち当該データベースに含まれていない前記部位について前記位置を不定とした部位データを加え、拡張サンプルデータを生成する拡張データ生成手段、前記各データベースの前記サンプルデータから、前記和集合のうち当該データベースに含まれている1つ以上の前記部位の前記位置を欠落させ、劣化サンプルデータを生成する劣化データ生成手段、前記劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の前記サンプルデータを出力の目標値とする学習によって補完器を生成する補完器学習手段、及び、前記拡張サンプルデータを前記補完器に入力して、当該拡張サンプルデータにおいて不定である前記位置を補完する部位補完手段、として機能させる。
【発明の効果】
【0020】
本発明のデータベース統合装置、データベース統合方法およびデータベース統合プログラムによれば、複数のデータベースの間で共通部位のデータを利用して非共通部位のデータを補完するので、共通しない部位のデータを含んだ複数のデータベースを容易に統合することが可能となる。
【0021】
また、本発明のデータ補完装置によれば、複数のサンプルデータの間で共通部位のデータを利用して非共通部位のデータを補完する補完器を用い、複数のデータベースのいずれかの作成基準にて作成された対象物データに対して当該作成基準にて作成されず他のデータベースの作成基準で作成される部位のデータを容易に補完することが可能となる。
【図面の簡単な説明】
【0022】
図1】本発明の実施形態に係るデータベース統合装置の概略の構成を示すブロック図である。
図2】本発明の実施形態に係るデータベース統合装置の概略の機能ブロック図である。
図3】本発明の実施形態に係るデータベース統合装置の第1DB、第2DBに格納される付与データの例を示す模式図である。
図4図3に示す第1DB、第2DBの例に対し、拡張データ生成手段が生成する第1拡張DB、第2拡張DBの例を示す模式図である。
図5】付与データを構成するキーポイントのトポロジーを図化した模式図である。
図6】本発明の実施形態に係るデータベース統合装置の動作に関する概略のフロー図である。
図7】本発明の実施形態に係るデータ補完装置の構成を示す概略のブロック図である。
図8】本発明の実施形態に係るデータ補完装置の動作に関する概略のフロー図である。
【発明を実施するための形態】
【0023】
[第1の実施形態]
以下、本発明の実施の形態(以下実施形態という)であるデータベース統合装置1について、図面に基づいて説明する。データベース統合装置1として、共通の対象物に関するデータを格納する2つのデータベースを統合するデータベース統合装置の例を説明する。具体的には、データベース統合装置1は、対象物の複数のサンプルについてサンプルごとに部位の種別と位置とを対応付けて表す部位データを格納するデータベースに関し、第1部位群の部位データを格納した第1データベースと、第1部位群との共通部位と非共通部位との両方からなる第2部位群の部位データを格納した第2データベースとを統合する。本実施形態では、対象物は人とし、部位群は頭から手・足までの全身の姿勢を表す。また、各部位の情報はその代表点で表され、代表点をキーポイントと称する。キーポイントの情報は、少なくとも対応する部位の種別と位置の組み合わせで表され、この組み合わせを含むデータを部位データと称する。
【0024】
データベース統合装置1は、統合対象の2つのデータベースそれぞれに格納される部位の種別に差異があっても、それらデータベースを統合できる点に特徴がある。よって、ここでは当該差異があることを前提として説明する。例えば、第1部位群に含まれるが第2部位群に含まれないものを非共通部位群a、第2部位群に含まれるが第1部位群に含まれないものを非共通部位群b、第1部位群と第2部位群に共通するものを共通部位群cとすると、非共通部位群aは0種類以上、共通部位群cは1種類以上、非共通部位群bは1種類以上であるとする。そして、データベース統合装置1は統合処理として、第1データベースのサンプルに対して非共通部位群bの部位データを補完し、第2データベースのサンプルに対して非共通部位群aの部位データを補完して、両データベースに属していたサンプルが部位群a,b,cの部位データを有した統合データベースを生成する。
【0025】
なお、非共通部位群aは第1部位群に含まれるが第2部位群に含まれないものの全てではなく一部であってもよいし、非共通部位群bは第2部位群に含まれるが第1部位群に含まれないものの全てではなく一部であってもよいし、共通部位群cは第1部位群と第2部位群に共通するものの全てではなく一部であってもよい。
【0026】
また、本実施形態では、2つのデータベースの統合の例を説明するが、3つ以上のデータベースの統合も同様に可能である。つまり、複数のデータベースが、各データベースの部位群が少なくとも1つの他のデータベースとの共通部位を含み、且つ少なくとも1つのデータベースの部位群が少なくとも1つの他のデータベースとの非共通部位を含む関係である場合に、本実施形態の統合処理を拡張して適用できる。
【0027】
また、本実施形態では人のキーポイントを対象とする例を説明するが、本発明は車両や椅子などの人以外の物体を対象物体としてもよい。
【0028】
[データベース統合装置1の構成]
図1はデータベース統合装置1の概略の構成を示すブロック図である。データベース統合装置1は通信部2、記憶部3および処理部4からなる。
【0029】
通信部2は通信回路であり、その一端が処理部4に接続され、外部装置と処理部4との間の通信を担う。
【0030】
記憶部3は、ROM(Read Only Memory)、RAM(Random Access Memory)等のメモリ装置であり、各種プログラムや各種データを記憶する。例えば、記憶部は第1データベース(第1DB)11、第2データベース(第2DB)12、第1拡張データベース(第1拡張DB)14,第2拡張データベース(第2拡張DB)15、統合データベース(統合DB)19や、補完器の情報を記憶する。記憶部3は処理部4と接続されて、処理部4との間でこれらの情報等を入出力する。
【0031】
処理部4は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)、GPU(Graphics Processing Unit)等の演算装置で構成される。処理部4は記憶部3からプログラムを読み出して実行することにより各種の処理手段・制御手段として動作し、必要に応じて、各種データを記憶部3から読み出し、生成したデータを記憶部3に記憶させる。例えば、処理部4は学習により補完器を生成する。また、処理部4は、拡張データ生成手段13、補完器学習部16、キーポイント補完手段18として機能する。
【0032】
図2はデータベース統合装置1の概略の機能ブロック図である。データベース統合装置1は、第1DB11、第2DB12、拡張データ生成手段13、第1拡張DB14、第2拡張DB15、補完器学習部16、補完器記憶手段17、キーポイント補完手段18、統合DB19を含んで構成される。
【0033】
第1DB11、第2DB12はそれぞれ統合処理の対象とされるデータベースである。
【0034】
第1DB11、第2DB12に格納されているデータは、対象物についての部位データであり、典型的には、人の姿勢を認識する装置の学習用画像に撮影されている人について予め付与された部位データである。以下、予め付与された部位データを付与データと称する。ちなみに、学習用画像は、カメラで実際に撮影された実画像でなくてもよく、例えば、コンピュータグラフィックス(CG)などで作られた画像であってもよい。付与データは、各サンプルのキーポイントそれぞれについての種別および位置の情報を含む。また、位置が不明なキーポイントについてはその旨を示す情報とすることができる。つまり、付与データにより、各サンプルの複数のキーポイントについてその種別ごとに当該キーポイントの位置が付与されたか否かと付与された位置がわかる。付与データは、人手によって作成されてもよいし、機械が抽出したものを人が確認し必要に応じて修正することによって作成されてもよいし、それらが混在していてもよい。
【0035】
また、対象物の部位群の部位データの1まとまりずつをサンプルデータ、各サンプルデータの対象物をサンプルと称する。別人物は別サンプルであり、同一人物であっても撮影されている学習用画像が異なれば別サンプルである。各サンプルには互いを識別するためのサンプルIDが付与され、第1DB11、第2DB12は、付与データをサンプルIDと対応付けて記憶している。
【0036】
以上のように、第1DB11、第2DB12は、所定の対象物の複数のサンプルについてサンプルごとに部位の種別と位置とを対応付けて表す部位データ(付与データ)からなるサンプルデータを格納したデータベースである。そのうちの第1DB11は、第1部位群についてのサンプルデータを格納したデータベースである。また、第2DB12は、第1部位群との共通部位と非共通部位との両方からなる第2部位群についてのサンプルデータを格納した第2データベースである。
【0037】
図3は、第1DB11、第2DB12に格納される付与データの例を示す模式図であり、図3(a)は第1DB11の例を、また図3(b)は第2DB12の例をそれぞれ示しており、各例では付与データを構成するキーポイントのトポロジー21a,21bを左側に図化して示しており、右側に付与データをテーブル22a,22bの形式で表現している。当該テーブルの各行が1つの付与データのレコードを表す。各レコードにおいては、先頭(左側)にサンプルIDが格納され、続いて、キーポイントの種別ごとに当該キーポイントの情報を表す3つの値の組がキーポイントの種別に対応するインデックスの昇順に格納される。
【0038】
上記3つの値の組は、サンプルIDがnの種別iのキーポイントについて、そのx座標xn,i、y座標yn,i、および当該キーポイントが欠落していないかを表すフラグvn,iである。各組において3つの値はxn,i、yn,i、vn,iの順に格納されている。フラグに1が設定されている付与データが表すキーポイントは欠落しておらずその座標値は有効である。一方、フラグに0が設定されている付与データが表すキーポイントは欠落しており位置が不定である。
【0039】
第1DB11はトポロジー21aに示す16個のキーポイント(a1〜a4,c1〜c12)からなる付与データを格納し、第2DB12はトポロジー21bに示す13個のキーポイント(b1,c1〜c12)からなる付与データを格納する。ここで、キーポイントa1〜a4が上述の非共通部位群a、キーポイントb1が非共通部位群b、キーポイントc1〜c12が共通部位群cである。ちなみに、キーポイントa1〜a4およびb1は頭部および首に位置する。
【0040】
拡張データ生成手段13は、各データベースのサンプルデータに、複数のデータベースの非共通部位の和集合のうち当該サンプルデータに含まれていない部位について位置を不定とした部位データを加え、拡張されたサンプルデータ(拡張サンプルデータ)を生成する。なお、拡張サンプルデータの集合を拡張データ、拡張サンプルデータの集合を格納したものを拡張データベースと呼ぶことにする。ちなみに、非共通部位は或る2つのデータベース間で相違する部位であり、データベースが3つ以上の場合、当該部位は他のデータベースとの間では共通部位となり得る。つまり、非共通部位の和集合は、全データベースで共通する部位群を除いた部位群である。
【0041】
本実施形態では拡張データ生成手段13は、第1DB11、第2DB12の付与データAI,BIを統合後のキーポイント種別のものに変換した拡張データAII,BIIを出力する。本実施形態においては、キーポイントa1〜a4,b1,c1〜c12の17個を1つの部位群に統合することとし、よって、拡張サンプルデータはそれら17個の部位データを含む。
【0042】
第1拡張DB14は、第1DB11から拡張データ生成手段13により生成される拡張データAIIを格納し、同様に、第2拡張DB15は、第2DB12から生成される拡張データBIIを格納する。
【0043】
図4は、図3に示す第1DB11、第2DB12の例に対し、拡張データ生成手段13が生成する第1拡張DB14、第2拡張DB15の例を示す模式図である。図4図3と同様のテーブル形式で各データベースを表現しており、図4(a)は第1拡張DB14の例を、また図4(b)は第2拡張DB15の例を示している。
【0044】
図4に示す例を用いて、拡張データ生成手段13の動作を説明する。第1DB11の付与データAIを拡張データAIIに変換するには、非共通部位群b(キーポイントb1)について位置を不定とした部位データを付加する。具体的には、例えば、各レコードにて、キーポイントa4の後ろにキーポイントb1のフィールドを追加し、座標およびフラグの3つの値に0を格納する。同様に、第2DB12の付与データBIを拡張データBIIに変換するには、部位群a(キーポイントa1〜a4)について位置を不定とした部位データを付加する。具体的には、例えば、各レコードにて、キーポイントb1の前にキーポイントa1〜a4のフィールドを追加し、各フィールドにてフラグ及び座標の3つの値に0を格納する。
【0045】
図5は付与データを構成するキーポイントのトポロジーを図化した模式図であり、キーポイントの位置を表す白丸および黒丸と、キーポイント間の連結関係を表す線分にて人の姿勢が図化されている。図5(a),(b)はそれぞれ第1DB11、第2DB12について拡張データ生成手段13によるキーポイントの付加前と付加後を図示しており、具体的には、既に述べたようにトポロジー21aは第1DB11の付与データAI、トポロジー21bは第2DB12の付与データBIである。また、トポロジー31aは付与データAIに対して拡張データ生成手段13により生成された拡張データAIIであり、黒丸は付加されたキーポイントb1を表している。同様に、トポロジー31bは付与データBIに対する拡張データBIIであり、黒丸は付加されたキーポイントa1〜a4を表している。
【0046】
補完器学習部16は、劣化データ生成手段161および補完器学習手段162を含む。
【0047】
劣化データ生成手段161は複数のデータベースそれぞれのサンプルデータから、当該複数のデータベースの非共通部位の和集合のうち当該サンプルデータに含まれている1つ以上の部位の位置を欠落させ、劣化サンプルデータを生成する。例えば、劣化サンプルデータとして、第1拡張DB14の拡張サンプルデータに含まれる部位データのうちキーポイントa1〜a4の1つ以上を欠落させた劣化サンプルデータ、および第2拡張DB15の拡張サンプルデータに含まれる部位データのうちキーポイントb1を欠落させた劣化サンプルデータが生成される。
【0048】
また、各データベースが自身の付与データにおける欠落(例えば、学習用画像に写っていない部位についての作成されなかった部位データ)を補完するために、劣化データ生成手段161は、各データベースのサンプルデータから、1以上の共通部位の位置を欠落させた劣化サンプルデータをさらに生成してもよい。つまり、第1DB11、第2DB12の付与データからキーポイントc1〜c12の1つ以上を欠落させた劣化サンプルデータを生成することができる。
【0049】
なお、3つ以上のデータベースの統合に適用する場合、この処理は次のようになる。すなわち、劣化データ生成手段161は、複数のデータベースについて、当該データベースのサンプルデータから、上述の非共通部位の和集合以外のものも含めた1つ以上の部位の位置を欠落させ、劣化サンプルデータを生成してもよい。
【0050】
本実施形態では、劣化データ生成手段161は、第1拡張DB14、第2拡張DB15の拡張データを用いて劣化データを生成する。なお、劣化サンプルデータの集合を劣化データと呼ぶことにする。具体的には、第1拡張DB14から読み出した拡張データAIIおよび第2拡張DB15から読み出した拡張データBIIのキーポイントのうち1つまたは複数を欠落させて劣化データを作成する。
【0051】
例えば、劣化データ生成手段161は、欠落させるサンプルおよびキーポイントをランダムに或いは規則的に選択し、選択したサンプルの、選択したキーポイントに対応する部位データのフラグを0に置換し、位置を(0,0)に置換して劣化サンプルデータを作成する。
【0052】
ただし、劣化データ生成手段161は、フラグが1であるキーポイントを予め定めた必須個数以上残す。すなわち、劣化データ生成手段161は、第1拡張DB14および第2拡張DB15から、必須個数を超えるキーポイントの位置を付与された拡張サンプルデータを読み出し、当該拡張サンプルデータから1個以上の位置を欠落させて、必須個数以上の位置を含む劣化サンプルデータを生成する。一方、拡張サンプルデータのうち、フラグが1のキーポイントが必須個数以下であるものは補完器の学習に用いない。本実施形態では必須個数は1個とする。
【0053】
なお、本実施形態では、拡張データに含まれるキーポイントの位置は学習画像上の相対位置で表されているため、劣化データ生成手段161は劣化データを生成する前に拡張データの位置情報に対して正規化を行う。例えば、正規化は、各拡張サンプルデータにおいて、フラグが1であるキーポイントに対して両肩に対応するキーポイントの中心を原点とした座標系に平行移動するといった方法で行うことができる。ちなみに、この場合、右肩および左肩のいずれかのフラグが0であるサンプルについては正規化されないことになるが、このように正規化されない拡張サンプルデータについては補完器学習部16にて学習に用いないこととすればよい。
【0054】
また、本実施形態では、魚眼レンズ画像や全天球画像などに写っている人についても適切に補完できるように、xy座標が(0,0)の点を中心としてランダムな角度で拡張サンプルデータを回転させて拡張サンプルデータおよび劣化サンプルデータを増やし、補完器の学習に用いる。すなわち、劣化データ生成手段161は、正規化後の拡張データに対し回転処理を行ってキーポイントのxy座標を変換してから劣化データを生成する。
【0055】
劣化データ生成手段161は、生成した劣化データを、第1拡張DB14、第2拡張DB15から読み出した拡張データと共に補完器学習手段162へ出力する。なお、回転して生成される劣化データについては、回転後の拡張データが共に補完器学習手段162へ出力される。
【0056】
補完器学習手段162は、劣化データ生成手段161から入力された劣化サンプルデータと拡張サンプルデータとのペアを用いて補完器を学習する。すなわち、補完器学習手段162は、劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元の拡張サンプルデータにおける各キーポイントの位置(ただし、フラグが0のキーポイントを除く)を出力の目標値とする学習によって補完器を生成する。ここでの学習とは、補完器のパラメータを求めることである。
【0057】
本実施形態においては、補完器を変分自己符号化器(variational autoencoder:VAE)でモデル化する。VAEは線形変換処理、活性化関数等から構成され、ここでは、活性化関数としてReLU関数を用いる。本実施形態では、補完器学習手段162はVAEを構成する各要素のパラメータについて誤差関数を最小化する学習を行う。誤差関数として、劣化サンプルデータを補完器に入力して得られたキーポイントの座標と、元の拡張サンプルデータのキーポイントの座標との二乗誤差などを用いる。このとき、拡張サンプルデータにおいてフラグが0であるキーポイントについては誤差関数に含めない。最小化には確率的最急降下法などを用いる。
【0058】
補完器記憶手段17は、補完器学習手段162によって得られた補完器のパラメータを記憶する。また、補完器記憶手段17には補完器として用いるVAEの構造が格納される。
【0059】
キーポイント補完手段18は、補完器記憶手段17に格納されている学習済みの補完器を用いて、第1拡張DB14、第2拡張DB15から入力された拡張データに対して補完を行い、補完済みのデータ(補完済データ)を生成する。つまり、キーポイント補完手段18は、第1DB11、第2DB12それぞれから生成された拡張サンプルデータを第1拡張DB14、第2拡張DB15から入力され、拡張サンプルデータにおける部位データの不定である位置を補完する部位補完手段である。キーポイント補完手段18は、補完で得られたキーポイントの座標に、フラグとして1を付与して補完済データを作成し、サンプルIDと共に補完済データを統合DB19へ出力する。
【0060】
ここで、拡張データをキーポイント補完手段18に入力する前に、キーポイントの位置に関して補完器学習部16への入力時と同様の正規化処理を行う。そして、キーポイント補完手段18での補完処理で得られた位置に対して、補完前に正規化により平行移動した分を元に戻す処理を行って、補完済データのキーポイントの位置とする。なお、上述のように正規化できないサンプルが存在し得るが、当該サンプルについては補完前の拡張サンプルデータを補完済みのデータとしてそのまま出力することにする。
【0061】
なお、入力時に既にフラグが1であるキーポイントについては、本実施形態では補完済データにおける位置として、入力時の値を用いるが、これに代えて補完器の出力の座標を用いてもよい。
【0062】
例えば、図4(a)に示した拡張データAIIをキーポイント補完手段18に入力した場合には、キーポイントb1について座標が補完され、また、図4(b)に示した拡張データBIIをキーポイント補完手段18に入力した場合には、キーポイントa1〜a4について座標が補完される。つまり、図5のトポロジー31a,31bにて黒丸で示したキーポイントについて座標が付与される。
【0063】
また、補完器の学習に共通部位のキーポイントc1〜c12について欠落させた劣化データも用いているので、付与データにてキーポイントc1〜c12が付与されていないサンプルに対しても当該キーポイントの位置を補完することができる。
【0064】
以上のように、補完器の学習を、位置を不定とした非共通部位の部位データが付加された拡張サンプルデータに対して行う。これにより、補完器は非共通部位の位置と共通部位の位置の関係性を学習する。そのため、補完器は、共通部位の位置から非共通部位の位置を補完できるようになる。また、本実施形態では、共通部位だけでなく、共通部位の一部も欠落させて学習するので、共通部位の位置同士の関係性も同時に学習される。そのため、付与データにおいて欠落していた共通部位についても補完ができるようになる。
【0065】
統合DB19はキーポイント補完手段18から入力された補完済データをサンプルIDと共に格納する。
【0066】
このようにしてデータベース統合装置1により、互いに非共通部位のデータを有し得る複数のデータベースを、それぞれに不足している部位のデータを補完して統合することができる。
【0067】
[データベース統合装置1の動作]
図6はデータベース統合装置1の動作に関する概略のフロー図である。
【0068】
統合処理が開始されると、データベース統合装置1は拡張データ生成手段13として動作し、第1DB11、第2DB12に格納されている付与データを読み出し(ステップS100)、当該付与データに不足しているキーポイントの部位データを付加する(ステップS105)。これにより拡張データが生成され、拡張データ生成手段13は、拡張データを第1拡張DB14、第2拡張DB15に格納する。
【0069】
データベース統合装置1は補完器学習部16として機能する。補完器学習部16は劣化データ生成手段161として動作し、第1拡張DB14、第2拡張DB15から読み出した拡張データに対し正規化処理を行い、また、回転処理を施した拡張データを生成する(ステップS110)。そして、劣化データ生成手段161は正規化後、回転処理後の拡張データのキーポイントの一部を欠落させて劣化データを作成する(ステップS115)。
【0070】
補完器学習部16は補完器学習手段162として機能し、劣化データ生成手段161から入力される拡張データおよび劣化データを用いて補完器を学習して(ステップS120)、生成された補完器を補完器記憶手段17に格納する(ステップS125)。
【0071】
データベース統合装置1は補完器を学習した後、キーポイント補完手段18として動作する。キーポイント補完手段18は、第1拡張DB14、第2拡張DB15から拡張データを読み出し、拡張データを補完器に入力してキーポイントを補完し(ステップS130)、生成した補完済データを統合DB19内に格納する(ステップS135)。
【0072】
以上では、2つまたは3つ以上のデータベースから1つの補完器を生成して補完を行うことにより、これらのデータベースを統合する例を示した。別の例として、データベースのペアごとに2つずつの補完器を生成して補完を行うことにより、複数のデータベースを統合できることを以下に示す。
【0073】
例えば、上記第1データベースと上記第2データベースを統合する場合、まず、第1データベースに非共通部位群bの部位データを補完するための補完器h2を第2データベースから生成して補完器h2により第1データベースに対する補完を行う。なお、このときは第2データベースからの拡張サンプルデータ生成を省略してよい。
【0074】
具体的には、拡張データ生成手段13は第1DB11のサンプルデータに、非共通部位群bの部位について位置を不定とした部位データを加え、第2部位群を包含する部位群の部位データからなる拡張サンプルデータを生成して第1拡張DB14に格納する。劣化データ生成手段161は、第2DB12に格納されているサンプルデータから1つ以上の非共通部位群bの部位データの位置を欠落させて劣化サンプルデータを生成する。補完器学習手段162は第1DB11のサンプルデータから生成された劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元のサンプルデータを出力の目標値とする学習によって補完器h2を生成して補完器記憶手段17に記憶させる。キーポイント補完手段18は第1拡張DB14に格納されている拡張サンプルデータを補完器h2に入力して、当該拡張サンプルデータにおいて不定である位置を補完し、統合DB19に格納する。これにより、まず、第1DB11のサンプルデータに非共通部位群bの部位データを補完した補完済データが統合DB19に格納される。
【0075】
続いて、第2データベースに非共通部位群aの部位データを補完するための補完器h1を第1データベースから生成して補完器h1により第2データベースに対する補完を行う。なお、このときは第1データベースからの拡張サンプルデータ生成を省略してよい。
【0076】
具体的には、拡張データ生成手段13は第2DB12のサンプルデータに、非共通部位群aの部位について位置を不定とした部位データを加え、第1部位群を包含する部位群の部位データからなる拡張サンプルデータを生成して第2拡張DB15に格納する。劣化データ生成手段161は、第1DB11に格納されているサンプルデータから1つ以上の非共通部位群aの部位データの位置を欠落させて劣化サンプルデータを生成する。補完器学習手段162は第2DB12のサンプルデータから生成された劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元のサンプルデータを出力の目標値とする学習によって補完器h1を生成して補完器記憶手段17に記憶させる。キーポイント補完手段18は第2拡張DB15に格納されている拡張サンプルデータを補完器h1に入力して、当該拡張サンプルデータにおいて不定である位置を補完し、統合DB19に格納する。これにより、第2DB12のサンプルデータに非共通部位群aの部位データを補完した補完済データが統合DB19に格納され、統合が完了する。
【0077】
また、3つ以上のデータベースを統合する場合、第1、第2データベースを例に説明した処理と同様の処理をデータベースのペアごとに行えばよい。
【0078】
以上に示したように、データベース統合装置1によれば、異なる作成基準で作成された複数のデータベースのそれぞれにおいて他のデータベースと比較して不足している部位のデータを自動で補完することによって、当該複数のデータベースを1つのデータベースに統合することができる。これによって、不足している部位のアノテーションを人手で行う手間をかけずに、利用可能な部位を減らすことなくデータを効率よく増やすことができる。このことは、例えば、大量の部位データを必要とする機械学習を行う場合に極めて有用である。
【0079】
[第2の実施形態]
本発明の第2の実施形態としてデータ補完装置40を説明する。上記第1の実施形態のデータベース統合装置1では、複数のデータベースに格納された付与データ(付与データAI,BI)を用いて補完器を学習し、その学習で得られた補完器を用いて当該データベースの付与データを補完している。この学習済みの補完器に対して、補完器の学習時に用いたデータベース内に存在しない新たなサンプルデータを入力してもよく、当該サンプルデータが付与データAI,BIに関する補完済データからみて部位データが不足した不完全なサンプルデータ(不完全サンプルデータ)である場合には補完器によって不足しているキーポイントが補完される。すなわち、データベース統合装置1の技術を用いて、不完全サンプルデータに対してキーポイントを補完するデータ補完装置を構成することができる。
【0080】
図7はデータ補完装置40の構成を示す概略のブロック図である。データ補完装置40は、不完全データ取得手段41、拡張データ生成手段42、補完器記憶手段43、キーポイント補完手段44および補完結果出力手段45を有する。
【0081】
補完器記憶手段43は、対象物の複数のサンプルについてのサンプルデータを集めたデータ集合を用いて学習された補完器を記憶している。学習に用いるデータ集合は、各サンプルデータにおける部位群が少なくとも1つの他のサンプルデータとの共通部位を含み、且つ少なくとも1つのサンプルデータの部位群が少なくとも1つの他のサンプルデータとの非共通部位を含むデータ集合である。補完器は、サンプルデータから当該サンプルデータに含まれている1つ以上の部位の位置を欠落させた劣化サンプルデータを入力とし、当該劣化サンプルデータに対応する元のサンプルデータを出力の目標値とする学習によって生成される。
【0082】
ここで、対象物は第1の実施形態と同様、人であるとする。例えば、第1の実施形態における第1DB11、第2DB12に格納された付与データを学習に用いるデータ集合として補完器を生成することができ、この場合、補完器記憶手段43として、第1の実施形態の補完器記憶手段17を用いることができる。
【0083】
データ補完装置40は、補完器の生成に用いたデータ集合における共通部位を1以上含み、且つ同集合における非共通部位の1以上が不足している不完全サンプルデータを補完対象とする。例えば、不完全サンプルデータは第1の実施形態における第1データベースまたは第2データベースの作成基準で作成されたデータである。
【0084】
拡張データ生成手段42は、不完全サンプルデータに、補完器の生成に用いたデータ集合における部位群のうち当該不完全サンプルデータに含まれていない部位について位置を不定とした部位データを加え、拡張サンプルデータを生成する。また、キーポイント補完手段44は拡張サンプルデータを補完器に入力して、当該拡張サンプルデータにおいて不定である位置を補完し、補完されたサンプルデータを生成するデータ補完手段である。補完器記憶手段43として第1の実施形態の補完器記憶手段17を用いる場合、拡張データ生成手段42、キーポイント補完手段44としてそれぞれ第1の実施形態の拡張データ生成手段13、キーポイント補完手段18を用いることができる。
【0085】
また図8はデータ補完装置の動作に関する概略のフロー図である。データ補完装置40は、不完全データ取得手段41により不完全サンプルデータを取得すると(ステップS200)、拡張データ生成手段42により不足キーポイントの部位データを付加して拡張サンプルデータを作成する(ステップS205)。そして、当該拡張サンプルデータに対し正規化処理を行う(ステップS210)。その後、学習済みの補完器を補完器記憶手段43から読み出し(ステップS215)、キーポイント補完手段44で補完する(ステップS220)。なお、補完済データに対して、補完前の正規化にて平行移動した分を元に戻す処理が行われる。そして、補完結果出力手段45により補完済データを出力する(ステップS225)。出力先は、当該データを格納するデータベース(例えば第1の実施形態の統合DB19)や、そのデータベースを備えた学習装置や、当該データを基に対象物の姿勢等を認識する対象物認識装置などとすることができる。
【0086】
例えば、出力先がデータベースであれば新たなデータを統一的な基準で容易に追加できる。また、出力先が学習装置であれば新たなデータを用いた追加学習や再学習が容易にできる。また、出力先の対象物認識装置が、画像から写っている人ごとの姿勢(部位群)を推定する姿勢推定器を複数利用しており、それらの出力する姿勢に含まれるキーポイントの種別が互いに異なっている場合でも、データ補完装置40に入力することで、共通のキーポイントの種別をもつ共通化された姿勢へと変換することができる。この変換によって、変換後に配置されるこの姿勢を用いた処理を、姿勢推定器ごとに異なるものとせずとも統一的に扱うことができる。
【0087】
[変形例]
(1)上記各実施形態では、補完器学習部16、キーポイント補完手段18およびキーポイント補完手段44に入力される前に行われるキーポイント位置の正規化処理として、両肩のキーポイントの中点を正規化後の原点に定めるという1通りのキーポイントの組を用いて正規化を行う例を示した。正規化処理の別の例として、他のキーポイントの組を用いた正規化を含めて複数通りの正規化を定義しておき、正規化の対象とする付与データごとに当該付与データにおいて利用可能なキーポイントの組に応じた正規化を選択する手法とすることもできる。このようにすることで、データベースに蓄積された付与データを無駄なく用いた学習を行うことが可能になり、補完器をより高精度化できる。
【0088】
また、上記各実施形態では原点を2つのキーポイントを用いて決める例としたが、原点は1つのキーポイント、または3つ以上のキーポイントを用いて定めてもよい。
【0089】
(2)上記各実施形態では、部位データはキーポイントの位置を座標で表現する形態としたが、画像の形態で表現したものとすることもできる。例えば、キーポイントの座標位置のみ画素値が1となるようなバイナリ画像を各キーポイントに対して作成したものや、そのバイナリ画像に対してガウシアンフィルタを適用したものを用いてもよい。その場合、各キーポイントの座標は当該画像での最大値をとる点に対応する。また、劣化データ生成手段161や補完器の入力と出力とでキーポイントの位置の表現形態を異ならせてもよく、入力では位置を座標で表し出力では画像で表す構成や、逆に入力を画像とし出力を座標で表す構成とすることができる。
【0090】
(3)補完器に入力する部位データは、属性情報などを含むものとしてもよい。例えば、子供か大人であるかを属性情報として入力に与えて補完器の学習を行うことで、子供のような体格、大人のような体格に対応したキーポイントの推定ができるようになる。この場合、第1DB11、第2DB12は姿勢の情報だけでなく、対応する属性情報なども格納する。
【0091】
(4)補完器は、キーポイントの座標の推定値に加えて、推定値の信頼度を出力してもよい。この場合、キーポイント補完手段18,44は、一定以上の信頼度を有するキーポイントのみ、補完済データにおける付与フラグを“1”に設定することができる。例えば、元の付与データにて座標が付与されているキーポイントが少なく座標推定値の信頼度が低くなるキーポイントについては付与フラグを“1”に設定しない。これにより例えば、信頼度が高いキーポイント対しては自動で、信頼度が低いキーポイントに対しては人手でのアノテーションを行うように設計可能であり、人手によるアノテーションを支援する装置にも利用することができる。
【0092】
(5)上記各実施形態では、補完器としてVAEを用いたが、ニューラルネットワークやガウシアンプロセスなど連続値を出力可能な他のモデルを用いてもよい。また、事前にキーポイントの座標を離散化して、キーポイントの位置の推定を各キーポイントが離散化した座標のいずれかに属するクラス分類問題として定式化することにより、補完器として、アダブースト(AdaBoost)などのモデルを用いることもできる。
【0093】
(6)上記各実施形態では、キーポイント補完手段18,44での活性化関数としてReLU関数を用いたが、活性化関数としてtanh関数、シグモイド(Sigmoid)関数などを用いてもよい。また、ResNet(residual network:残差ネットワーク)で用いられるようなショートカット構造を有する構成としてもよい。
【0094】
(7)上記各実施形態では、部位データは二次元画像上のキーポイントである例を示したが、部位データはこの例に限られない。例えば、部位データは三次元空間の計測データにおけるキーポイントであってもよい。三次元計測データの例として、距離画像センサを用いて得られる距離画像や、多視点カメラで撮影した画像から構築した三次元データを挙げることができる。また、部位データは、二次元画像の時系列(二次元計測データの時系列)、三次元計測データの時系列におけるキーポイントとすることもでき、これらの場合には、キーポイントの座標は時刻を含めた三次元、四次元の座標として定義される。
【符号の説明】
【0095】
1 データベース統合装置、11 第1DB、12 第2DB、13,42 拡張データ生成手段、14 第1拡張DB、15 第2拡張DB、16 補完器学習部、17,43 補完器記憶手段、18,44 キーポイント補完手段、19 統合DB、161 劣化データ生成手段、162 補完器学習手段。
図1
図2
図3
図4
図5
図6
図7
図8