IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7193006画像形成装置、判定装置、画像形成方法、及び画像形成プログラム
<>
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図1
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図2
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図3
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図4
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図5
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図6
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図7
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図8
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図9
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図10
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図11
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図12
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図13
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図14
  • 特許-画像形成装置、判定装置、画像形成方法、及び画像形成プログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-12
(45)【発行日】2022-12-20
(54)【発明の名称】画像形成装置、判定装置、画像形成方法、及び画像形成プログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20221213BHJP
   G06T 7/70 20170101ALI20221213BHJP
【FI】
G06T7/00 660B
G06T7/70 Z
【請求項の数】 10
(21)【出願番号】P 2021549130
(86)(22)【出願日】2019-03-01
(65)【公表番号】
(43)【公表日】2022-04-04
(86)【国際出願番号】 JP2019007986
(87)【国際公開番号】W WO2020178876
(87)【国際公開日】2020-09-10
【審査請求日】2021-08-19
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】パン ヤドン
【審査官】合田 幸裕
(56)【参考文献】
【文献】国際公開第2012/046392(WO,A1)
【文献】国際公開第2008/007471(WO,A1)
【文献】国際公開第2010/135455(WO,A1)
【文献】米国特許出願公開第2012/0045132(US,A1)
【文献】中国特許出願公開第102508867(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06T 7/70
IEEE Xplore
JSTPlus(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像を形成する形成手段を具備し、
前記形成手段は、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップを形成する描線手段を含む、
画像形成装置。
【請求項2】
前記形成手段は、前記特徴マップから、前記複数の所定のキーポイントのうちの第1基準ポイントを所定位置に含み且つ所定のサイズルールに応じたサイズの部分画像を切り取るクロップ手段をさらに含む、
請求項1記載の画像形成装置。
【請求項3】
前記形成手段は、前記部分画像において前記複数の直線によって区切られた複数の部分領域にそれぞれ異なる色を付すことによって、前記特徴抽出画像を形成するペイント手段をさらに含む、
請求項2記載の画像形成装置。
【請求項4】
前記判定対象物は、人間であり、
前記複数の所定のキーポイントは、前記人間の頭部に対応する頭部グループ、前記人間の胴体に対応する胴体グループ、及び、前記人間の脚に対応する脚グループのいずれかにそれぞれ分類され、
前記複数の描線グループは、前記頭部グループに含まれる第1キーポイントと前記胴体グループに含まれる前記第1基準ポイントとを含む、第1描線グループを含む、
請求項2又は3に記載の画像形成装置。
【請求項5】
前記頭部グループは、鼻、左耳、及び右耳にそれぞれ対応する複数のキーポイントを含み、
前記胴体グループは、首、左肩、及び右肩にそれぞれ対応する複数のキーポイントを含み、
前記脚グループは、左膝及び右膝にそれぞれ対応する複数のキーポイントを含む、
請求項4記載の画像形成装置。
【請求項6】
前記第1キーポイントは、鼻に対応するキーポイントであり、
前記第1基準ポイントは、首に対応するキーポイントである、
請求項4又は5に記載の画像形成装置。
【請求項7】
前記処理対象画像は、前記判定対象物が写った撮像画像から抽出された正規化画像である、
請求項1から6のいずれか1項に記載の画像形成装置。
【請求項8】
請求項1から7のいずれか1項に記載の画像形成装置と、
ニューラルネットワークを含み、前記特徴抽出画像を用いて前記判定対象物の姿勢を判定する判定手段と、
を具備する判定装置。
【請求項9】
画像形成装置によって実行される画像形成方法であって、
姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像を形成することを含み、
前記特徴抽出画像を形成することは、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップを形成することを含む、
画像形成方法。
【請求項10】
姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像を形成することを画像形成装置に実行させ、
前記特徴抽出画像を形成することは、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップを形成することを含む、
画像形成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像形成装置、判定装置、画像形成方法、及び画像形成プログラムに関する。
【背景技術】
【0002】
ニューラルネットワークを用いて人間の動作を分類(判定)する技術が研究されている(例えば、非特許文献1)。非特許文献1に開示されている技術では、「人型の画像」を形成し、該人型画像の訓練を、カメラからの画像群及び人の動作を分類するためのオプティカルフロー(optical flow)を訓練する畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)に統合している。この非特許文献1の技術で用いられる人型画像は、人間の体の各部が特定の色でペイントされた画像であり、該各部は、人間の体において自由度を有する2つの関節の間の部分、又は、体の末端の部分である。
【先行技術文献】
【非特許文献】
【0003】
【文献】M. Zolfaghari et al., “Chained multi-stream networks exploiting pose, motion, and appearance for action classification and detection”. in 2017 IEEE International Conference on Computer Vision (ICCV), pp. 2923-2932, IEEE.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1の技術で用いられる上記人型画像は、特定のポーズ(姿勢)の特徴ではなく、体の特徴を強調している。このため、非特許文献1に開示されている技術では、人のポーズを精度良く分類(判定)することができない可能性がある。
【0005】
本開示の目的は、判定対象物のポーズの判定精度を向上させることができる、画像形成装置、判定装置、画像形成方法、及び画像形成プログラムを提供することにある。
【課題を解決するための手段】
【0006】
第1の態様にかかる画像形成装置は、姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像(Feature extracted image)を形成する形成手段を具備し、前記形成手段は、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップ(texture map)を形成する描線手段を含む。
【0007】
第2の態様にかかる画像形成方法は、姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像(Feature extracted image)を形成することを含み、前記特徴抽出画像を形成することは、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップ(texture map)を形成することを含む。
【0008】
第3の態様にかかる画像形成プログラムは、姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像(Feature extracted image)を形成することを画像形成装置に実行させ、前記特徴抽出画像を形成することは、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップ(texture map)を形成することを含む。
【発明の効果】
【0009】
本開示により、判定対象物の姿勢の判定精度を向上させることができる、画像形成装置、判定装置、画像形成方法、及び画像形成プログラムを提供することができる。
【図面の簡単な説明】
【0010】
図1】第1実施形態における画像形成装置の一例を示すブロック図である。
図2】オープンポーズで用いられるキーポイント群の説明に供する図である。
図3】第2実施形態における画像形成装置を含む判定装置の一例を示すブロック図である。
図4】撮像画像の一例を示す図である。
図5】正規化画像の説明に供する図である。
図6】特徴マップの形成方法の説明に供する図である。
図7】特徴マップのタイプの説明に供する図である。
図8】部分画像の切り取り方法及び部分画像のペイント方法の説明に供する図である。
図9】ペイントルールテーブルの一例を示す図である。
図10】第2実施形態における画像形成装置の処理動作の一例を示すフローチャートである。
図11】人物画像及び肯定的なラベルの説明に供する図である。
図12】人物画像及び否定的なラベルの説明に供する図である。
図13】肯定的なラベルが付される特徴抽出画像の一例を示す図である。
図14】否定的なラベルが付される特徴抽出画像の一例を示す図である。
図15】画像形成装置のハードウェア構成例を示す図である。
【発明を実施するための形態】
【0011】
以下、図面を参照しつつ、実施形態について説明する。なお、実施形態において、同一又は同等の要素には、同一の符号を付し、重複する説明は省略される。
【0012】
<第1実施形態>
図1は、第1実施形態における画像形成装置の一例を示すブロック図である。図1において画像形成装置10は、特徴抽出画像形成部11を有する。以下では、特徴抽出画像形成部11を、単に「画像形成部11」と呼ぶことがある。
【0013】
画像形成部11は、「処理対象画像」に含まれる、ポーズ(姿勢)についての判定対象物の所定の複数の「キーポイント(部位ポイント)」に基づいて、「特徴抽出画像(Feature extracted image)」を形成する。
【0014】
判定対象物は、例えば、人間である。また、「処理対象画像」は、判定対象物が写っている「第1画像領域」、及び、判定対象物が写っていない、第1画像領域を囲む「第2画像領域」を含んでいる。すなわち、処理対象画像には、判定対象物の画像(第1画像領域)以外に、例えば判定対象物の背景に対応する画像(第2画像領域)が含まれている。また、処理対象画像は、例えば、撮像装置(不図示)によって撮像された、判定対象物が写った撮像画像から、抽出された「正規化画像」である。
【0015】
また、上記所定の複数の「キーポイント」は、判定するポーズに応じた複数のキーポイントである。該複数のキーポイントは、例えば、カーネギーメロン大学(CMU)で開発された「オープンポーズ(OpenPose)」で用いられるキーポイント群のうちの一部であってもよい。
【0016】
図2は、オープンポーズで用いられるキーポイント群の説明に供する図である。図2に示すように、オープンポーズでは、キーポイントk00~k17が用いられる。キーポイントk00は、鼻に対応する。キーポイントk01は、首に対応する。キーポイントk02は、右肩に対応する。キーポイントk03は、右肘に対応する。キーポイントk04は、右手首に対応する。キーポイントk05は、左肩に対応する。キーポイントk06は、左肘に対応する。キーポイントk07は、左手首に対応する。キーポイントk08は、右臀部に対応する。キーポイントk09は、右膝に対応する。キーポイントk10は、右足首に対応する。キーポイントk11は、左臀部に対応する。キーポイントk12は、左膝に対応する。キーポイントk13は、左足首に対応する。キーポイントk14は、右目に対応する。キーポイントk15は、左目に対応する。キーポイントk16は、右耳に対応する。キーポイントk17は、左耳に対応する。
【0017】
図1の説明に戻り、画像形成部11は、描線部11Aを含む。描線部11Aは、処理対象画像を用いて、「特徴マップ(texture map)」を形成する。例えば、描線部11Aは、複数の「描線グループ」のそれぞれについて、各描線グループに含まれるすべてのキーポイント上を通り且つ少なくとも一端が処理対象画像の端まで延びる直線を引くことによって、特徴マップを形成する。各「描線グループ」は、上記の所定の複数のキーポイントに含まれる少なくとも2つのキーポイントを含んでいる。
【0018】
すなわち、このように形成された特徴マップにおいては、各直線の一端が判定対象物のボディ部分からはみ出して処理対象画像の端まで延びる複数の直線が引かれている。これにより、特徴マップは、判定対象物のボディ(本体)の特徴ではなく、判定対象物のポーズの特徴を強調することができている。従って、この特徴マップに基づく特徴抽出画像を用いて判定対象物のポーズを判定することによって、ポーズ判定の精度を向上させることができる。
【0019】
以上のように第1実施形態によれば、画像形成装置10において特徴抽出画像形成部11は、描線部11Aを有する。描線部11Aは、処理対象画像において、複数の「描線グループ」のそれぞれについて、各描線グループに含まれるすべてのキーポイント上を通り且つ少なくとも一端が処理対象画像の端まで延びる直線を引くことによって、特徴マップを形成する。各「描線グループ」は、上記の所定の複数のキーポイントに含まれる少なくとも2つのキーポイントを含んでいる。
【0020】
この画像形成装置10の構成により、判定対象物のボディ(本体)の特徴ではなく、判定対象物のポーズの特徴(つまり、判定対象物の姿勢における空間的特徴(spatial feature))が強調された特徴マップを形成することができる。この特徴マップに基づく特徴抽出画像を用いて判定対象物のポーズを判定することによって、ポーズ判定の精度を向上させることができる。
【0021】
<第2実施形態>
第2実施形態は、より具体的な実施形態に関する。
【0022】
<画像形成装置の構成例>
図3は、第2実施形態における画像形成装置を含む判定装置の一例を示すブロック図である。図3には、第2実施形態における判定装置30の他に、撮像装置20が示されている。
【0023】
撮像装置20は、撮像画像を判定装置30へ出力する。図4は、撮像画像の一例を示す図である。図4の撮像画像PI1には、二人の画像が写っている。すなわち、撮像画像PI1には、判定対象物DT1の画像及び判定対象物DT2の画像が含まれている。
【0024】
判定装置30は、画像形成装置40と、判定処理装置(判定手段)50とを有している。
【0025】
画像形成装置40は、キーポイント検出部41と、グルーピング部42と、正規化画像形成部43と、特徴抽出画像形成部44とを有している。以下では、特徴抽出画像形成部44を、単に「画像形成部44」と呼ぶことがある。
【0026】
キーポイント検出部41は、撮像装置20から受け取る撮像画像において、判定対象物のキーポイント群を検出する。ここでは、該検出されるキーポイント群は、上記オープンポーズで用いられるキーポイント群であるものとする。
【0027】
グルーピング部42は、検出されたキーポイント群から、上記の所定の複数のキーポイントを選択すると共に、選択された複数のキーポイントを上記の複数の描線グループにグルーピングする。
【0028】
ここで、判定対象ポーズを「キョロポーズ(kyoro pose)」とする。本明細書では、日本語によって「キョロキョロ(kyoro-kyoro)」と表される人間の所定動作に含まれる1つのポーズを、「キョロポーズ」と呼んでいる。「キョロキョロ」と表される所定動作は、頭を振って人の前方向ではなく、別の方向を見る動作である。従って、「キョロポーズ」は、人間の頭部の延びる方向が体の伸びる方向と異なるときの瞬間姿勢と定義することができる。例えば不審者は「キョロキョロ」と表される動作を行う傾向にあるので、「キョロポーズ」は、例えば公共スペースにおいて不審者を特定するための特徴として用いることができる。
【0029】
判定対象のポーズが「キョロポーズ」である場合、複数の描線グループは、例えば次のように定義することができる。すなわち、「描線グループ1」は、キーポイントk00及びキーポイントk01を含む。「描線グループ2」は、キーポイントk01、キーポイントk02、及びキーポイントk05を含む。「描線グループ3」は、キーポイントk01及びキーポイントk09を含む。「描線グループ4」は、キーポイントk01及びキーポイントk12を含む。「描線グループ5」は、キーポイントk00、キーポイントk16、及びキーポイントk17を含む。
【0030】
正規化画像形成部43は、キーポイント検出部41及びグルーピング部42による処理によって描線グループが検出されている撮像画像PI1から、「正規化画像」を抽出する。図5は、正規化画像の説明に供する図である。上記の通り、撮像画像PI1には、判定対象物DT1の画像及び判定対象物DT2の画像が含まれているため、撮像画像PI1からは、図5に示すように、2つの正規化画像PT1,PT2が抽出される。正規化画像PT1,PT2は、それぞれ、判定対象物が写っている「第1画像領域」、及び、判定対象物が写っていない、第1画像領域を囲む「第2画像領域」を含んでいる。これらの正規化画像PT1及び正規化画像PT2のそれぞれが、画像形成部44において「処理対象画像」として用いられる。なお、正規化画像PT1及び正規化画像PT2を抽出する際には、オープンポーズで用いられるキーポイント群に基づいて算出可能な「矩形範囲(bounding box)」が用いられてもよい。
【0031】
画像形成部44は、第1実施形態の画像形成部11と同様に、「処理対象画像」に含まれる、ポーズについての判定対象物の所定の複数の「キーポイント」に基づいて、「特徴抽出画像(Feature extracted image)」を形成する。
【0032】
図3に示すように画像形成部44は、描線部44Aと、クロップ(crop)部44Bと、ペイント部44Cとを有している。
【0033】
描線部44Aは、第1実施形態の描線部11Aと同様に、処理対象画像を用いて、「特徴マップ(texture map)」を形成する。この特徴マップの形成方法については、後に詳しく説明する。
【0034】
クロップ部44Bは、描線部44Aにて形成された特徴マップから、所定の複数のキーポイントのうちの「第1基準ポイント」を所定位置に含み且つ「所定のサイズルール」に応じたサイズの「部分画像」を切り取る。この部分画像の切り取り方法については、後に詳しく説明する。
【0035】
ペイント部44Cは、クロップ部44Bにて切り取られた部分画像において、描線部44Aによって引かれた複数の直線によって区切られた複数の部分領域(zone)を複数の色でそれぞれペイントすることによって、「特徴抽出画像」を形成する。各部分領域は、描線部44Aによって引かれた複数の直線との位置関係によって定義され、ペイントされる色が予め定めされている。このペイント方法については、後に詳しく説明する。
【0036】
以上のようにして形成された特徴抽出画像は、判定処理装置50の教師あり学習に用いられてもよいし、学習後の判定処理装置50における判定対象物のポーズの判定に用いられてもよい。
【0037】
判定処理装置50は、例えばニューラルネットワーク(不図示)を含んでいる。判定処理装置50は、画像形成装置40で形成された特徴抽出画像を用いて、ニューラルネットワークに対して教師あり学習を行う。また、判定処理装置50は、学習されたニューラルネットワークに対して、画像形成装置40で形成された特徴抽出画像を入力することにより、判定対象物のポーズを判定(分類)する。
【0038】
〈特徴マップの形成方法〉
まず、描線部44Aが特徴マップを形成するためには、次の条件(条件I)が満たされる必要がある。すなわち、「処理対象画像において、キーポイントk09及びキーポイントk12の両方が利用可能であること」、「キーポイントk01、キーポイントk02、及びキーポイントk05のうちの少なくとも2つが利用可能であること」、及び、「キーポイントk00、キーポイントk16、及びキーポイントk17のうちの少なくとも2つが利用可能であること」が全て満たされる必要がある。すなわち、この条件が満たされずに形成された特徴マップに基づいて形成された特徴抽出画像は、ポーズ判定の精度を高めることができない可能性がある。
【0039】
描線部44Aは、上記の描線グループ1から描線グループ5のそれぞれについて、直線を引くことを試みる。図6は、特徴マップの形成方法の説明に供する図である。図6では、左及び中央の図に処理対象画像が示され、右の図に特徴マップが示されている。
【0040】
すなわち、描線部44Aは、直線I(ラインI)として、キーポイントk01及びキーポイントk00を通る直線を引く。この直線Iの両端は共に処理対象画像の端(エッジ)まで延びている。ここで、処理対象画像においてキーポイントk01が利用可能でない場合、キーポイントk02とキーポイントk05との中点を、キーポイントk01として扱う。
【0041】
また、描線部44Aは、直線IIとして、キーポイントk01及びキーポイントk02を通る直線、キーポイントk01及びキーポイントk05を通る直線、又は、キーポイントk02及びキーポイントk05を通る直線を引く。これらの3つの直線は、キーポイントk01がキーポイントk02とキーポイントk05との中点として定義されるので、等価である。この直線IIの両端は共に処理対象画像の端(エッジ)まで延びている。
【0042】
また、描線部44Aは、直線IIIとして、キーポイントk01及びキーポイントk09を通る直線を引く。ただし、直線IIIは、直線IIよりも下の領域にのみ存在する。すなわち、直線IIIは、一端がキーポイントk01であり、キーポイントk01からキーポイントk09へ延び、他端が処理対象画像の端となっている。
【0043】
また、描線部44Aは、直線IVとして、キーポイントk01及びキーポイントk12を通る直線を引く。ただし、直線IVは、直線IIよりも下の領域にのみ存在する。すなわち、直線IVは、一端がキーポイントk01であり、キーポイントk01からキーポイントk12へ延び、他端が処理対象画像の端となっている。
【0044】
また、描線部44Aは、キーポイントk00、キーポイントk16、及びキーポイントk17のうちの2つのみが利用可能である場合に、直線Vを引く。描線部44Aは、この利用可能な2つのキーポイントを通る直線を、直線Vとして引く。直線Vの両端は共に処理対象画像の端まで延びている。
【0045】
このように4つ又は5つの直線が引かれた特徴マップは、3つの条件(条件II、条件III、条件IV)によって、5つのタイプ(タイプ1A、タイプ1B、タイプ2A、タイプ2B、タイプ3)に分類することができる。図7は、特徴マップのタイプの説明に供する図である。条件IIは、「直線Iが利用可能であること」である。条件IIIは、「直線Vが利用可能であること」である。条件IVは、「直線III及び直線IVが直線Iを基準として同じ側に存在すること」である。図6には、タイプ1Aの例が示されている。タイプ1Aは、「キョロポーズ」に対応する。
【0046】
〈部分画像の切り取り方法〉
図8は、部分画像の切り取り方法及び部分画像のペイント方法の説明に供する図である。図8には、特徴マップの一例と、該特徴マップから切り取られる部分画像と、該部分画像に色が付されたものである特徴抽出画像とが示されている。
【0047】
上記の通り、クロップ部44Bは、描線部44Aにて形成された特徴マップから、所定の複数のキーポイントのうちの「第1基準ポイント」を所定位置に含み且つ「所定のサイズルール」に応じたサイズの「部分画像」を切り取る。
【0048】
例えば、クロップ部44Bは、次のルールに従って、特徴マップから部分画像を切り取る。すなわち、該ルールは、「部分画像において、キーポイントk01を中心にすること」、「部分画像の高さ(つまり、縦の長さ)が、特徴マップの上端からキーポイントk01までの距離の2倍であること」、「部分画像の幅(つまり、横の長さ)に対する高さの割合が、3/2であること」である。このルールは、特定のポーズについての判定精度を高めるために、調整されてもよい。すなわち、該ルールでは、キーポイントk01が上記の「第1基準ポイント」であり、部分画像の中心が上記の「所定位置」である。また、「部分画像の高さ(つまり、縦の長さ)が、特徴マップの上端からキーポイントk01までの距離の2倍であること」、及び、「部分画像の幅(つまり、横の長さ)に対する高さの割合が、3/2であること」が、上記の「所定のサイズルール」に対応している。
【0049】
〈ペイント方法〉
図9は、ペイントルールテーブルの一例を示す図である。図9のペイントルールテーブルでは、部分画像において4つ又は5つの直線によって区切られた複数の領域と、各領域をペイントする色に関する情報とが対応づけられている。
【0050】
図9のペイントルールテーブルに従うと、ペイント部44Cは、直線IIよりも下で且つ直線Iに対して反時計回りに隣接するゾーンを、カラーコード「#101010」の色でペイントする。直線IIよりも下の各ゾーンは、1つのカラーコードと1対1で対応している。また、ペイント部44Cは、直線IIよりも上で、直線Vよりも上で、且つ、直線Iの左側のゾーンを、カラーコード「#202020」、カラーコード「#A0A0A0」を足し合わせた色でペイントする。
【0051】
<画像形成装置の動作例>
以上の構成を有する画像形成装置の処理動作の一例について説明する。図10は、第2実施形態における画像形成装置の処理動作の一例を示すフローチャートである。図10のフローは、画像形成装置40が撮像装置20からの撮像画像を受け取ったときにスタートする。
【0052】
画像形成装置40においてキーポイント検出部41は、撮像画像において、判定対象物のキーポイント群を検出する(ステップS101)。
【0053】
グルーピング部42は、検出されたキーポイント群から、所定の複数のキーポイントを選択すると共に、選択された複数のキーポイントを複数の描線グループにグルーピングする(ステップS102)。
【0054】
正規化画像形成部43は、ステップS101及びステップS102の処理が施された撮像画像から、正規化画像を抽出する(ステップS103)。
【0055】
描線部44Aは、ステップS103で抽出された正規化画像を処理対象画像として、処理対象画像を用いて特徴マップを形成する(ステップS104)。
【0056】
クロップ部44Bは、描線部44Aにて形成された特徴マップから、部分画像を切り取る(ステップS105)。
【0057】
ペイント部44Cは、部分画像において、描線部44Aによって引かれた複数の直線によって区切られた複数の部分領域(zone)を複数の色でそれぞれペイントすることによって、特徴抽出画像を形成する(ステップS106)。
【0058】
このように形成された形成された特徴抽出画像は、上記の通り、判定処理装置50の教師あり学習に用いられてもよいし、学習後の判定処理装置50における判定対象物のポーズの判定に用いられてもよい。
【0059】
〈特徴抽出画像の有用性テスト〉
「キョロポーズ」の判定(認識)を通して、第2実施形態における特徴抽出画像の有用性をテストした。まず、45000個の撮像画像を用意した。これらの撮像画像は、RGBカメラによって撮影されたものであり、各撮像画像には、実際の人物の画像が含まれている。人物の画像において頭部の延びる方向が体の延びる方向と異なる、25000個の撮像画像に対して肯定的なラベルを付し、頭部の延びる方向と体の伸びる方向が略同じである、20000個の撮像画像に否定的なラベルを付した。すなわち、図11に示すような人の画像が撮像画像に含まれていれば、その撮像画像には肯定的なラベルが付される一方、図12に示すような人の画像が撮像画像に含まれていれば、その撮像画像には否定的なラベルが付される。図11は、人物画像及び肯定的なラベルの説明に供する図である。図12は、人物画像及び否定的なラベルの説明に供する図である。
【0060】
そして、このように用意された45000個の撮像画像を用いて、上記の特徴抽出画像を形成した。図11に示すような人の画像が含まれる撮像画像に基づいて形成された特徴抽出画像が、図13に示されている。また、図12に示すような人の画像が含まれる撮像画像に基づいて形成された特徴抽出画像が、図14に示されている。こうして、肯定的なラベルが付された25000個の特徴抽出画像、及び、否定的なラベルが付された20000個の特徴抽出画像の特徴抽出画像セットが得られた。
【0061】
同じ構成の2つのCNNの一方のCNN(第1のCNN)を45000個の撮像画像そのもので学習させ、他方のCNN(第2のCNN)を45000個の特徴抽出画像で学習させた。
【0062】
そして、肯定的なラベルが付された3000個の撮像画像及び否定的なラベルが付された3000個の撮像画像を含む別の6000個の撮像画像、及び、これらから形成された6000個の特徴抽出画像を用意した。
【0063】
そして、上記の別の6000個の撮像画像を上記の学習後の第1のCNNによって判定した。すなわち、学習後の第1のCNNに対して、上記の別の6000個の撮像画像に含まれる人の画像のポーズがキョロポーズであるか否かを判定させた。同様に、上記の6000個の特徴抽出画像を上記の学習後の第2のCNNによって判定した。
【0064】
このようなテストによって、学習後の第1のCNNによる判定の誤り率は、0.29となり、学習後の第2のCNNによる判定の誤り率は、0.21となった。すなわち、上記の特徴抽出画像を用いることにより、ポーズの判定精度を向上することができることを示す結果が得られた。
【0065】
以上のように第2実施形態によれば、画像形成装置40においてクロップ部44Bは、描線部44Aにて形成された特徴マップから、所定の複数のキーポイントのうちの「第1基準ポイント」を所定位置に含み且つ「所定のサイズルール」に応じたサイズの「部分画像」を切り取る。
【0066】
この画像形成装置40の構成により、正規化された部分画像を形成することができる。
【0067】
また、画像形成装置40においてペイント部44Cは、クロップ部44Bにて切り取られた部分画像において、描線部44Aによって引かれた複数の直線によって区切られた複数の部分領域を複数の色でそれぞれペイントすることによって、特徴抽出画像を形成する。
【0068】
この画像形成装置40により、ポーズの判定精度の向上に寄与する特徴抽出画像を形成することができる。なお、ペイントする前の部分画像を特徴抽出画像として用いてもよい。ただし、ペイントすることによって、特徴抽出画像によるポーズの判定精度をペイントしない場合に比べてさらに向上させることができる。
【0069】
<他の実施形態>
図15は、画像形成装置のハードウェア構成例を示す図である。図15において画像形成装置100は、プロセッサ101と、メモリ102とを有している。第1実施形態及び第2実施形態の画像形成装置10,40の画像形成部11,44と、キーポイント検出部41と、グルーピング部42と、正規化画像形成部43とは、プロセッサ101がメモリ102に記憶されたプログラムを読み込んで実行することにより実現されてもよい。プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、画像形成装置10,40に供給することができる。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によって画像形成装置10,40に供給されてもよい。
【0070】
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【0071】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0072】
(付記1)
姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像(Feature extracted image)を形成する形成手段を具備し、
前記形成手段は、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップ(texture map)を形成する描線手段を含む、
画像形成装置。
【0073】
(付記2)
前記形成手段は、前記特徴マップから、前記複数の所定のキーポイントのうちの第1基準ポイントを所定位置に含み且つ所定のサイズルールに応じたサイズの部分画像を切り取るクロップ手段をさらに含む、
付記1記載の画像形成装置。
【0074】
(付記3)
前記形成手段は、前記部分画像において前記複数の直線によって区切られた複数の部分領域にそれぞれ異なる色を付すことによって、前記特徴抽出画像を形成するペイント手段をさらに含む、
付記2記載の画像形成装置。
【0075】
(付記4)
前記判定対象物は、人間であり、
前記複数の所定のキーポイントは、前記人間の頭部に対応する頭部グループ、前記人間の胴体に対応する胴体グループ、及び、前記人間の脚に対応する脚グループのいずれかにそれぞれ分類され、
前記複数の描線グループは、前記頭部グループに含まれる第1キーポイントと前記胴体グループに含まれる前記第1基準ポイントとを含む、第1描線グループを含む、
付記2又は3に記載の画像形成装置。
【0076】
(付記5)
前記頭部グループは、鼻、左耳、及び右耳にそれぞれ対応する複数のキーポイントを含み、
前記胴体グループは、首、左肩、及び右肩にそれぞれ対応する複数のキーポイントを含み、
前記脚グループは、左膝及び右膝にそれぞれ対応する複数のキーポイントを含む、
付記4記載の画像形成装置。
【0077】
(付記6)
前記第1キーポイントは、鼻に対応するキーポイントであり、
前記第1基準ポイントは、首に対応するキーポイントである、
付記4又は5に記載の画像形成装置。
【0078】
(付記7)
前記処理対象画像は、前記判定対象物が写った撮像画像から抽出された正規化画像である、
付記1から6のいずれか1項に記載の画像形成装置。
【0079】
(付記8)
付記1から7のいずれか1項に記載の画像形成装置と、
ニューラルネットワークを含み、前記特徴抽出画像(Feature extracted image)を用いて前記判定対象物の姿勢を判定する判定手段と、
を具備する判定装置。
【0080】
(付記9)
姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像(Feature extracted image)を形成することを含み、
前記特徴抽出画像を形成することは、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップ(texture map)を形成することを含む、
画像形成方法。
【0081】
(付記10)
前記特徴抽出画像を形成することは、前記特徴マップから、前記複数の所定のキーポイントのうちの第1基準ポイントを所定位置に含み且つ所定のサイズルールに応じたサイズの部分画像を切り取ることをさらに含む、
付記9記載の画像形成方法。
【0082】
(付記11)
前記特徴抽出画像を形成することは、前記部分画像において前記複数の直線によって区切られた複数の部分領域を複数の色でそれぞれペイントすることをさらに含む、
付記10記載の画像形成方法。
【0083】
(付記12)
前記判定対象物は、人間であり、
前記複数の所定のキーポイントは、前記人間の頭部に対応する頭部グループ、前記人間の胴体に対応する胴体グループ、及び、前記人間の脚に対応する脚グループのいずれかにそれぞれ分類され、
前記複数の描線グループは、前記頭部グループに含まれる第1キーポイントと前記胴体グループに含まれる前記第1基準ポイントとを含む、第1描線グループを含む、
付記10又は11に記載の画像形成方法。
【0084】
(付記13)
前記頭部グループは、鼻、左耳、及び右耳にそれぞれ対応する複数のキーポイントを含み、
前記胴体グループは、首、左肩、及び右肩にそれぞれ対応する複数のキーポイントを含み、
前記脚グループは、左膝及び右膝にそれぞれ対応する複数のキーポイントを含む、
付記12記載の画像形成方法。
【0085】
(付記14)
前記第1キーポイントは、鼻に対応するキーポイントであり、
前記第1基準ポイントは、首に対応するキーポイントである、
付記12又は13に記載の画像形成方法。
【0086】
(付記15)
前記処理対象画像は、前記判定対象物が写った撮像画像から抽出された正規化画像である、
付記9から14のいずれか1項に記載の画像形成方法。
【0087】
(付記16)
姿勢の判定対象物が写っている第1画像領域と、前記第1画像領域を囲み前記判定対象物が写っていない第2画像領域とを含む処理対象画像に含まれる、前記判定対象物の複数の所定のキーポイントに基づいて、特徴抽出画像(Feature extracted image)を形成することを画像形成装置に実行させ、
前記特徴抽出画像を形成することは、前記処理対象画像において、各描線グループが前記複数の所定のキーポイントに含まれる少なくとも2つのキーポイントを含む、複数の描線グループのそれぞれについて、各描線グループに含まれるキーポイント上を通り且つ少なくとも一端が前記処理対象画像の端まで延びる直線を引くことによって、特徴マップ(texture map)を形成することを含む、
画像形成プログラムが格納された非一時的なコンピュータ可読媒体。
【符号の説明】
【0088】
10 画像形成装置
11 特徴抽出画像形成部
11A 描線部
20 撮像装置
30 判定装置
40 画像形成装置
41 キーポイント検出部
42 グルーピング部
43 正規化画像形成部
44 特徴抽出画像形成部
44A 描線部
44B クロップ部
44C ペイント部
50 判定処理装置(判定手段)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15