IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オムロン株式会社の特許一覧

特許7512844学習方法、学習済みモデル、検出システム、検出方法、及びプログラム
<>
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図1
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図2
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図3
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図4
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図5
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図6
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図7
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図8
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図9A
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図9B
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図10
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図11
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図12
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図13
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図14
  • 特許-学習方法、学習済みモデル、検出システム、検出方法、及びプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-01
(45)【発行日】2024-07-09
(54)【発明の名称】学習方法、学習済みモデル、検出システム、検出方法、及びプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240702BHJP
   G06N 20/00 20190101ALI20240702BHJP
【FI】
G06T7/00 350B
G06N20/00 130
【請求項の数】 10
(21)【出願番号】P 2020181626
(22)【出願日】2020-10-29
(65)【公開番号】P2022072273
(43)【公開日】2022-05-17
【審査請求日】2023-08-08
(73)【特許権者】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】100101454
【弁理士】
【氏名又は名称】山田 卓二
(74)【代理人】
【識別番号】100189555
【弁理士】
【氏名又は名称】徳山 英浩
(74)【代理人】
【識別番号】100091524
【弁理士】
【氏名又は名称】和田 充夫
(74)【代理人】
【識別番号】100161883
【弁理士】
【氏名又は名称】北出 英敏
(74)【代理人】
【識別番号】100221556
【弁理士】
【氏名又は名称】金田 隆章
(72)【発明者】
【氏名】籔内 智浩
【審査官】山田 辰美
(56)【参考文献】
【文献】特開2020-071615(JP,A)
【文献】特開2013-196294(JP,A)
【文献】特開2018-165966(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
原画像を準備する原画像準備処理と、
前記原画像から、特定部分を覆うマスク領域が設定されたマスク画像を準備する学習マスク画像準備処理と、
前記マスク画像を入力情報、前記マスク画像が対象物が存在する対象物領域を含むか否かを示す判定結果を正解情報としてそれぞれ含む教師データを準備する教師データ準備処理と、
前記教師データを用いて、モデルに対する機械学習を実行する学習処理と、
を含み、
前記学習処理は、前記マスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記判定結果との関係を前記モデルに学習させて学習済みモデルを生成することを含む、
学習方法。
【請求項2】
前記学習マスク画像準備処理は、1つの前記原画像から、前記特定部分が異なる複数の前記マスク領域がそれぞれ設定された複数のマスク画像を準備することを含む、請求項1に記載の学習方法。
【請求項3】
前記学習処理は、前記複数のマスク領域毎に前記非マスク情報と前記判定結果との関係を前記モデルに学習させて、前記複数のマスク領域にそれぞれ対応する複数の前記学習済みモデルを生成することを含む、
請求項2に記載の学習方法。
【請求項4】
特定部分を覆うマスク領域が設定された学習用のマスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記学習用のマスク画像が対象物の存在する対象物領域を含むか否かを示す判定結果との関係を学習し、
特定部分を覆うマスク領域が設定されたマスク画像が入力されると、前記マスク画像が前記対象物領域を含むか否かを示す判定結果を出力するよう、演算回路を機能させる、
学習済みモデル。
【請求項5】
原画像を準備する第1処理と、
前記原画像から、特定部分を覆うマスク領域が設定されたマスク画像を準備する第2処理と、
前記マスク画像を入力情報、前記マスク画像が対象物が存在する対象物領域を含むか否かを示す判定結果を正解情報としてそれぞれ含む教師データを生成する第3処理と、
を含む、
教師データ生成方法。
【請求項6】
学習済みモデルを記憶する記憶装置と、
演算回路とを備え、
前記学習済みモデルは、特定部分を覆うマスク領域が設定されたマスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記マスク画像が対象物の存在する対象物領域を含むか否かを示す判定結果との関係を学習し、
前記演算回路は、
検出対象画像を取得する検出対象画像取得処理と、
前記検出対象画像の一部又は全部を注目領域として設定する注目領域設定処理と、
前記注目領域から前記マスク画像を準備する検出マスク画像準備処理と、
前記検出マスク画像準備処理で準備した前記マスク画像を前記学習済みモデルに入力し、前記学習済みモデルから、前記検出マスク画像準備処理で準備した前記マスク画像に対応する前記判定結果を取得する判定結果取得処理と、
前記判定結果取得処理で取得した前記判定結果に基づいて、前記注目領域が前記対象物領域を含むか否かを判定する判定処理と、
を実行する、
検出システム。
【請求項7】
前記記憶装置は、前記特定部分が異なる複数の前記マスク領域にそれぞれ対応する複数の前記学習済みモデルを記憶し、
前記検出マスク画像準備処理は、前記注目領域から、前記複数のマスク領域がそれぞれ設定された複数の前記マスク画像を準備し、
前記判定結果取得処理は、前記複数のマスク領域毎に前記マスク画像を前記学習済みモデルに入力して、前記複数のマスク領域にそれぞれ対応する複数の前記判定結果を取得し、
前記判定処理は、前記複数の判定結果に基づいて前記注目領域が前記対象物領域を含むか否かを判定する、
請求項6に記載の検出システム。
【請求項8】
前記判定処理は、前記注目領域が前記対象物領域を含む場合に、前記複数の判定結果に基づいて、前記注目領域において前記対象物の一部が遮蔽されている遮蔽領域を特定する、請求項7に記載の検出システム。
【請求項9】
学習済みモデルを用いて演算回路によって実行される検出方法であって、
前記学習済みモデルは、特定部分を覆うマスク領域が設定されたマスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記マスク画像が対象物の存在する対象物領域を含むか否かを示す判定結果との関係を学習し、
前記検出方法は、
検出対象画像を取得する検出対象画像取得処理と、
前記検出対象画像の一部又は全部を注目領域として設定する注目領域設定処理と、
前記注目領域から前記マスク画像を準備する検出マスク画像準備処理と、
前記検出マスク画像準備処理で準備した前記マスク画像を前記学習済みモデルに入力し、前記学習済みモデルから、前記検出マスク画像準備処理で準備した前記マスク画像に対応する前記判定結果を取得する判定結果取得処理と、
前記判定結果取得処理で取得した前記判定結果に基づいて、前記注目領域が前記対象物領域を含むか否かを判定する判定処理と、
を含む、
検出方法。
【請求項10】
請求項9に記載の検出方法を演算回路に実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習方法、学習済みモデル、検出システム、検出方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1は、顔等の対象物を検出する画像処理において、対象物が遮蔽物により遮蔽されているか否かの判定の精度を高める技術を開示する。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第6558387号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示された従来技術は、対象物と遮蔽物とが予め定められた位置関係にある限定的な場合に、対象物の検出精度を高めるものである。例えば、従来技術は、遮蔽物であるフェイスマスクにより鼻及び口が遮蔽された顔の検出精度を高める。顔を遮蔽し得る遮蔽物には、自己の腕、他人の身体の一部、髭、サングラス等、鼻及び口以外の部分を遮蔽する物も含まれるが、従来技術は、このような多様な遮蔽態様に対応して精度良く顔を検出することができない。
【0005】
本開示の目的は、一部が遮蔽されている対象物の検出の精度を向上できる、学習方法、学習済みモデル、検出システム、検出方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示の一態様に係る学習方法は、
原画像を準備する原画像準備処理と、
前記原画像から、特定部分を覆うマスク領域が設定されたマスク画像を準備する学習マスク画像準備処理と、
前記マスク画像を入力情報、前記マスク画像が対象物が存在する対象物領域を含むか否かを示す判定結果を正解情報としてそれぞれ含む教師データを準備する教師データ準備処理と、
前記教師データを用いて、モデルに対する機械学習を実行する学習処理と、
を含み、
前記学習処理は、前記マスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記判定結果との関係を前記モデルに学習させて学習済みモデルを生成することを含む。
【0007】
本開示の一態様に係る学習済みモデルは、特定部分を覆うマスク領域が設定されたマスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記マスク画像が対象物の存在する対象物領域を含むか否かを示す判定結果との関係を学習する。
【0008】
本開示の一態様に係る教師データ生成方法は、
原画像を準備する第1処理と、
前記原画像から、特定部分を覆うマスク領域が設定されたマスク画像を準備する第2処理と、
前記マスク画像を入力情報、前記マスク画像が対象物が存在する対象物領域を含むか否かを示す判定結果を正解情報としてそれぞれ含む教師データを生成する第3処理と、を含む。
【0009】
本開示の一態様に係る検出システムは、
学習済みモデルを記憶する記憶装置と、
演算回路とを備え、
前記学習済みモデルは、特定部分を覆うマスク領域が設定されたマスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記マスク画像が対象物の存在する対象物領域を含むか否かを示す判定結果との関係を学習し、
前記演算回路は、
検出対象画像を取得する検出対象画像取得処理と、
前記検出対象画像の一部又は全部を注目領域として設定する注目領域設定処理と、
前記注目領域から前記マスク画像を準備する検出マスク画像準備処理と、
前記検出マスク画像準備処理で準備した前記マスク画像を前記学習済みモデルに入力し、前記学習済みモデルから、前記検出マスク画像準備処理で準備した前記マスク画像に対応する前記判定結果を取得する判定結果取得処理と、
前記判定結果取得処理で取得した前記判定結果に基づいて、前記注目領域が前記対象物領域を含むか否かを判定する判定処理と、
を実行する。
【0010】
本開示の一態様に係る検出方法は、
学習済みモデルを用いて演算回路によって実行される検出方法であって、
前記学習済みモデルは、特定部分を覆うマスク領域が設定されたマスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記マスク画像が対象物の存在する対象物領域を含むか否かを示す判定結果との関係を学習し、
前記検出方法は、
検出対象画像を取得する検出対象画像取得処理と、
前記検出対象画像の一部又は全部を注目領域として設定する注目領域設定処理と、
前記注目領域から前記マスク画像を準備する検出マスク画像準備処理と、
前記検出マスク画像準備処理で準備した前記マスク画像を前記学習済みモデルに入力し、前記学習済みモデルから、前記検出マスク画像準備処理で準備した前記マスク画像に対応する前記判定結果を取得する判定結果取得処理と、
前記判定結果取得処理で取得した前記判定結果に基づいて、前記注目領域が前記対象物領域を含むか否かを判定する判定処理と、
を含む。
【0011】
本開示の一態様に係るプログラムは、上記の検出方法を演算回路に実行させるためのプログラムである。
【発明の効果】
【0012】
本開示の態様によれば、一部が遮蔽されている対象物の検出の精度を向上できる、学習方法、学習済みモデル、検出システム、検出方法、及びプログラムを得る。
【図面の簡単な説明】
【0013】
図1】本開示の実施形態に係る顔検出システムの適用場面の一例である画像解析システムを模式的に例示する模式図である。
図2図1の顔検出システムのハードウェア構成の一例を示すブロック図である。
図3図2の顔検出システムの演算回路によって実行される検出方法の一例を示すフローチャートである。
図4図3に示した顔領域検出処理の一例を示すフローチャートである。
図5図4の処理を説明するための模式図である。
図6図4の処理S22~S24を説明するための模式図である。
図7図2に示した学習済みモデルを生成するための学習システムの一例を示すブロック図である。
図8】学習方法の一例を示すフローチャートである。
図9A図7に示した学習マスク画像の一例を示す模式図である。
図9B図7に示した学習マスク画像の他の例を示す模式図である。
図10】複数の学習マスク画像の一例を示す模式図である。
図11図8の教師データ準備処理で準備される教師データを例示する模式図である。
図12】顔の特徴量の一例を示す模式図である。
図13】複数のモデルに対する機械学習を説明するための模式図である。
図14図7に示した学習マスク画像の変形例を示す模式図である。
図15図7に示した学習マスク画像の他の変形例を示す模式図である。
【発明を実施するための形態】
【0014】
以下、添付の図面を参照して本開示に係る実施の形態を説明する。なお、以下の実施の形態において、同一又は同様の構成要素については同一の符号を付している。
【0015】
1.適用例
まず、図1を用いて、一実施形態に係る顔検出システム100が適用される場面の一例について説明する。図1は、顔検出システム100の適用場面の一例である画像解析システム1を模式的に例示する。顔検出システム100は、本開示の「検出システム」の一例である。
【0016】
画像解析システム1は、顔検出システム100を備える。画像解析システム1は、例えば、カメラ3、目開閉検出システム50、及び顔認識システム60を更に備えてもよい。カメラ3は、一部が遮蔽された人の顔を撮像し、撮像画像のデータを形成する。
【0017】
顔検出システム100は、カメラ3によって撮像された撮像画像Cを取得し、撮像画像C内で人の顔が存在する領域(以下、「顔領域」という。)Rを検出する情報処理装置である。人の顔は、本開示の「対象物」の一例であり、顔領域Rは、撮像画像C内で対象物が存在する領域を示す「対象物領域」の一例である。撮像画像Cは、本開示の「検出対象画像」の一例である。
【0018】
顔領域Rの検出処理は、顔検出システム100の演算回路14によって実行される。演算回路14は、例えば、撮像画像Cを記憶装置15に格納された学習済みモデル151に入力し、顔領域Rを学習済みモデル151に検出させる。学習済みモデル151は、後述のように、撮像画像C内の注目領域の一部を検出マスク領域として設定したマスク画像の入力に対して、注目領域が顔領域を含むか否かを示す判定結果を出力するように学習されたものである。
【0019】
本開示では、「遮蔽された」とは、画像において顔等の対象物が存在する対象物領域の少なくとも一部が、対象物領域であることを判別できない程度に、対象物領域であることを表す特徴を失っていることを含む。以下、対象物領域であることを表す特徴を失った当該一部の領域を「遮蔽領域」という。「遮蔽された」は、画像において対象物領域の少なくとも一部が映っていないことを含む。「遮蔽」は、オクルージョン(Occlusion)を含む。
【0020】
画像において、対象物領域の少なくとも一部が遮蔽物によって覆われて映っていない場合も、「遮蔽された」に含まれる。この遮蔽は、例えば、カメラ3と顔との間に遮蔽物が存在する場合に生じる。例えば、図1では、顔画像Faにおいて、顔領域の下側半分程度の部分は、フェイスマスクに覆われており、顔領域であることを判別できない程度に特徴を失っているといえ、遮蔽されているといえる。フェイスマスクは、本開示の「遮蔽物」の一例である。顔画像Faにおけるフェイスマスクが映った領域は、本開示の「遮蔽領域」の一例である。
【0021】
また、例えば、図1では、顔画像Fbにおいて、紙面に向かって顔領域の右上の部分は、毛髪によって覆われており、顔領域であることを判別できない程度に特徴を失っているといえ、遮蔽されているといえる。顔画像Fでは、毛髪は、本開示の「遮蔽物」の一例である。顔画像Fbにおける毛髪で覆われた領域は、本開示の「遮蔽領域」の一例である。遮蔽物は他にも、手、腕、他人の頭部等の身体の一部、髭、サングラス、マフラー、ベール、服の襟、帽子等の物を含む。
【0022】
「遮蔽された」は、対象物領域の少なくとも一部が遮蔽物によって物理的に覆われて映っていない場合に限定されない。例えば、図1の顔画像Fcに示すように、顔の一部が影となり、顔の特徴が失われている場合も、当該影になった部分は「遮蔽され」ているといえる。影のように対象物領域の一部が暗くなっている場合とは逆に、画像に光源が映っており、光によって対象物領域の一部において輝度が高く、当該部分において対象物領域であることを判別できない程度に、対象物領域であることを表す特徴を失っている場合も、当該部分は「遮蔽され」ているといえる。
【0023】
本開示では、「画像において対象物が存在する対象物領域」は、対象物領域が遮蔽されていない場合における対象物領域を含む。「画像において対象物が存在する対象物領域」は、対象物領域の少なくとも一部が遮蔽されている場合には、遮蔽を除去すると対象物が映ると推認される領域を含む。図1に示した顔領域Rは、このような遮蔽を除去すると顔が映ると推認される領域を含んでいる。
【0024】
以上のような構成により、顔検出システム100は、撮像画像Cにおいて顔の一部が遮蔽領域により遮蔽されている場合であっても、顔領域Rを検出することができる。例えば、顔検出システム100は、撮像画像Cにおいて顔の一部が遮蔽領域により遮蔽されている場合であっても、その遮蔽領域を含む顔を顔と判定することができる。
【0025】
顔検出システム100によって検出された顔領域Rに対して、例えば、後続の目開閉検出システム50、顔認識システム60等による検出処理が実行されてもよい。目開閉検出システム50は、例えば、顔領域Rを画像解析して、目、上眼瞼、下眼瞼等の位置を検出し、その開閉の回数、頻度等を測定する。顔認識システム60は、例えば、顔領域Rを画像解析し、当該顔がデータベースに記憶された顔と同一人物の顔であるか否かを認識(識別)する。
【0026】
2.詳細
2-1.顔検出システム
2-1-1.顔検出システムの構成例
図2は、図1の顔検出システム100のハードウェア構成の一例を示すブロック図である。顔検出システム100は、入力装置11と、出力装置12と、通信インタフェース(I/F)13と、演算回路14と、記憶装置15とを備える。顔検出システム100のこれらの構成要素は、1つの筐体内に収容される必要はなく、複数台のコンピュータシステムで実現されてもよい。
【0027】
入力装置11は、顔検出システム100への情報の入力のために、顔検出システム100とカメラ3等の外部機器とを接続するインタフェース回路である。出力装置12は、顔検出システム100からの情報の出力のために、顔検出システム100と外部機器とを接続するインタフェース回路である。通信インタフェース13は、顔検出システム100と外部機器との通信接続を可能とするためのインタフェース回路を含む。通信インタフェース13は、既存の有線通信規格又は無線通信規格に従って通信を行う。
【0028】
演算回路14は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、情報処理に応じて顔検出システム100の動作を制御する。このような情報処理は、演算回路14がプログラムを実行することにより実現される。演算回路14は、1又は複数の専用のプロセッサにより実現されてもよい。また、演算回路14の構成要素に関して、実施形態に応じて、適宜、機能の省略、置換及び追加が行われてもよい。演算回路14は、CPU、MPU、GPU、マイコン、DSP、FPGA、ASIC等の種々の半導体集積回路で構成されてもよい。
【0029】
記憶装置15は、コンピュータその他の装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。記憶装置15は、例えば、ハードディスクドライブ、ソリッドステートドライブ等の補助記憶装置であり、学習済みモデル151、演算回路14で実行されるプログラム等を記憶する。学習済みモデル151は、図2では記憶装置15に記憶されているが、本開示はこれに限定されない。例えば、学習済みモデル151は、常に記憶装置25に記憶されている必要はなく、演算回路14による処理に必要な時に記憶装置25に格納されていればよい。
【0030】
図示の例では、顔検出システム100の入力装置11には、カメラ3が接続される。カメラ3は、人の顔等の対象物が映る画像のデータを形成する撮像装置の一例である。例えば、演算回路14は、入力装置11を介して、カメラ3から、人の顔が映った画像を取得する。
【0031】
学習済みモデル151は、後述のように、特定部分を覆うマスク領域が設定されたマスク画像のうちマスク領域を除く部分に基づく非マスク情報と、マスク画像が顔領域を含むか否かを示す判定結果との関係をモデルに学習させることにより生成される。ここで、「非マスク情報」は、マスク領域を除く部分から計算される特徴量を示す。このような学習済みモデル151を利用することにより、顔検出システム100は、一部が遮蔽された顔が映った画像において、顔領域を検出することができる。
【0032】
2-1-2.顔検出システムの動作例
図3は、図2の顔検出システム100の演算回路14によって実行される検出方法の一例を示すフローチャートである。以下で説明する処理手順は一例に過ぎず、処理手順及び各処理は可能な限り変更されてよい。
【0033】
(検出対象画像取得処理S1)
まず、演算回路14は、後述の顔領域検出処理S2の対象となる検出対象画像として、撮像画像を取得する(S1)。例えば、演算回路14は、カメラ3によって撮像された撮像画像を入力装置11を介して取得する。あるいは、演算回路14は、記憶装置15、外部サーバ等に格納された撮像画像を取得してもよい。
【0034】
(顔領域検出処理S2)
次に、演算回路14は、検出対象画像取得処理S1で取得された撮像画像を学習済みモデル151に入力し、撮像画像において人の顔が存在する顔領域を学習済みモデル151に検出させる(S2)。この顔領域検出処理S2は、学習済みモデル151が、撮像画像の中に顔領域が存在するか否かを検出する推論処理を含む。
【0035】
(検出結果出力処理S3)
演算回路14は、顔領域検出処理S2の検出結果を出力してもよい(S3)。
【0036】
(注目領域設定処理S21)
図4は、図3に示した顔領域検出処理S2の一例を示すフローチャートである。まず、演算回路14は、図5に示すように、撮像画像C内で、検出処理の対象となる注目領域Dを設定する(S21)。注目領域Dは、撮像画像Cの端から一定間隔で縦方向又は横方向へずれることによって順に選択される。例えば、注目領域Dは、撮像画像C内で、ラスタスキャンの手法によって順次選択される。図4に示した処理は、注目領域Dの選択回数に応じて繰り返し実行される。このようにラスタスキャンの手法を用いて顔を検出する処理の一例は、例えば特開2005-327242号公報に開示されている。一例では、注目領域Dは、撮像画像Cの全部であってもよい。
【0037】
(検出マスク画像準備処理S22)
次に、演算回路14は、注目領域Dの一部をマスクしたマスク画像を準備する(S22)。以下、検出対象のマスク画像を「検出マスク画像」と呼ぶ。図6は、図4の処理S22~S24を説明するための模式図である。検出マスク画像準備処理S22で準備される検出マスク画像153a~153hは、例えば、図6に示すように、注目領域Dの互いに異なる部分が検出マスク領域として設定されたデータである。検出マスク画像153a~153hのそれぞれの検出マスク領域の位置は、後述の学習段階において各モデルが学習する学習マスク画像のマスク領域の位置に対応する。
【0038】
(検出マスク画像入力処理S23)
次に、演算回路14は、検出マスク画像を学習済みモデル151に与える(S23)。図6では、学習済みモデル151が、検出マスク画像153a~153hのそれぞれに対応する第1~第8の学習済みモデル151a~151hで構成される例について説明する。学習済みモデル151a~151hは、後述のモデル251a~251hが学習を行うことによって生成される学習済みモデルにそれぞれ対応する。
【0039】
(判定結果取得処理S24)
次に、演算回路14は、学習済みモデル151a~151hのそれぞれから、出力情報である判定結果を得る(S24)。例えば、学習済みモデル151aは、検出マスク画像153aにおいてマスクされていない非マスク領域(図6の紙面に向かって右下部分)に顔が映っているか否か、すなわち顔領域の右下部分であるか否かを判定する。このように、学習済みモデル151は、選択された注目領域Dを入力として、注目領域Dが顔領域を含むか否かを判定する。
【0040】
(判定処理S25)
次に、演算回路14は、判定結果取得処理S24において学習済みモデル151a~151hのそれぞれから取得した判定結果に基づいて、撮像画像C内で顔領域を検出する(S25)。例えば、学習済みモデル151が、注目領域Dが顔領域を含むと判定した場合、演算回路14は、撮像画像Cにおいて、その注目領域Dの位置に顔領域があると判定する。
【0041】
(遮蔽領域特定処理S26)
次に、演算回路14は、判定結果取得処理S24において学習済みモデル151a~151hのそれぞれから得た判定結果に基づいて、遮蔽領域を特定する(S26)。例えば、演算回路14は、検出した顔領域のうち、下側、上側、左側、右側など、顔領域のうちどの領域が遮蔽されているかを特定する。なお、遮蔽領域を特定することは、検出した顔領域が一切遮蔽されていないことを特定することを含む。
【0042】
例えば、学習済みモデル151aが、注目領域Dの右下部分につき「顔領域である」との判定結果を出力する一方で、他の学習済みモデル151b~151hが、それぞれの担当する非マスク領域につき「顔領域ではない」との判定結果を出力した場合、演算回路14は、注目領域Dに右下部分が遮蔽された顔領域が映っていると判断する。したがって、演算回路14は、注目領域Dの右下部分が遮蔽領域であると特定することができる。
【0043】
また、学習済みモデル151a~151hのすべてが、それぞれの担当する非マスク領域につき「顔領域である」との検出結果を出力した場合、注目領域Dには、検出マスク画像153a~153hのマスク領域のいずれも遮蔽されていない顔が映っているといえる。例えば、注目領域Dには、一切遮蔽されていない顔が映っているといえる。さらに、学習済みモデル151a~151hのすべてが、それぞれの担当する非マスク領域につき「顔領域ではない」との検出結果を出力した場合、注目領域Dには、顔領域が含まれていないと判定することができる。
【0044】
このように、演算回路14は、判定結果取得処理S24において顔領域を検出することに加えて、遮蔽領域特定処理S26において顔領域のうちどの領域が遮蔽されているかを特定することができる。
【0045】
以上のように、顔検出システム100は、学習済みモデル151を記憶する記憶装置15と、演算回路14とを備える。学習済みモデル151は、特定部分を覆うマスク領域が設定されたマスク画像のうち前記マスク領域を除く部分に基づく非マスク情報と、前記マスク画像が顔領域を含むか否かを示す判定結果との関係を学習する。演算回路14は、検出対象画像取得処理S1と、注目領域設定処理S21と、検出マスク画像準備処理S22と、判定結果取得処理S24と、判定処理S25とを実行する。検出対象画像取得処理S1は、検出対象画像を取得する処理である。注目領域設定処理S21は、検出対象画像の一部又は全部を注目領域Dとして設定する処理である。検出マスク画像準備処理S22は、注目領域Dから検出マスク画像を準備する処理である。判定結果取得処理S24は、検出マスク画像準備処理S22で準備した検出マスク画像を学習済みモデルに入力し(S23)、学習済みモデルから、検出マスク画像準備処理で準備した検出マスク画像に対応する前記判定結果を取得する(S24)処理である。判定処理S25は、判定結果取得処理S24で取得した判定結果に基づいて、注目領域Dが顔領域を含むか否かを判定する処理である。このように構成された顔検出システム100は、一部が遮蔽されている顔等の対象物の検出の精度を向上させることができる。
【0046】
また、従来の顔検出システムは、例えばフェイスマスクを装着した人の顔を検出するためには、フェイスマスクを装着した人の顔を示す大量の画像データを学習する必要があった。さらに、従来の顔検出システムは、白色のフェイスマスクを装着した人の顔の画像を用いて学習を行った場合には、白色以外の、例えば黒色のフェイスマスクを装着した人が映った画像について、当該人の顔を検出することができなかった。これに対して、本実施形態に係る顔検出システム100では、学習済みモデル151は、撮像画像C内の注目領域の一部を検出マスク領域として設定した検出マスク画像153a~153hの入力に対して、注目領域が顔領域を示すものであるか否かを示す結果を出力するように学習されたものである。これにより、顔検出システム100は、一部が遮蔽領域により遮蔽された顔について、その遮蔽の態様に関わらず、顔を検出することができる。例えば、遮蔽が、白色のフェイスマスク、黒色のフェイスマスク、マフラー等の遮蔽物によってされていても、顔検出システム100は、当該遮蔽物によって遮蔽された顔を精度良く検出することができる。
【0047】
記憶装置15は、特定部分が異なる複数の検出マスク領域にそれぞれ対応する複数の学習済みモデル151a~151hを記憶してもよい。この場合、検出マスク画像準備処理S22は、注目領域Dから、複数の検出マスク領域がそれぞれ設定された複数の検出マスク画像153a~153hを準備する。判定結果取得処理S24は、複数のマスク領域毎に検出マスク画像153a~153hを学習済みモデル151a~151hに入力して、複数のマスク領域にそれぞれ対応する複数の判定結果を取得する。判定処理S25は、前記複数の判定結果に基づいて注目領域Dが顔領域を含むか否かを判定する。
【0048】
図6に示した例では、第1学習済みモデル151aは、検出マスク画像153aの入力に対して、注目領域Dが顔領域を含むか否かを示す判定結果を出力するように学習される。第2学習済みモデル151bは、検出マスク画像153bの入力に対して、注目領域Dが顔領域か否かを示す判定結果を出力するように学習される。第3~第8の学習済みモデル151c~151hについても同様である。
【0049】
このように学習済みモデル151が複数の学習済みモデル151a~151hを含むように構成された顔検出システム100は、多様な遮蔽の態様に応じて精度良く顔を検出することができる。
【0050】
顔検出システム100は、注目領域Dが顔領域を含む場合に、複数の判定結果に基づいて、注目領域Dにおいて顔の一部が遮蔽されている遮蔽領域を特定してもよい(S26)。このような、顔のどの領域が遮蔽されているかについての特定結果情報は、例えば特定の地域に存在する人についての社会状況の分析、及びこのような分析結果の地域ごとの比較等に利用できる。
【0051】
以上のように、顔検出システム100によって実行される検出方法は、検出対象画像取得処理S1と、注目領域設定処理S21と、検出マスク画像準備処理S22と、判定結果取得処理S24と、判定処理S25とを含む。検出対象画像取得処理S1は、検出対象画像を取得する処理である。注目領域設定処理S21は、検出対象画像の一部又は全部を注目領域Dとして設定する処理である。検出マスク画像準備処理S22は、注目領域Dから検出マスク画像を準備する処理である。判定結果取得処理S24は、検出マスク画像準備処理S22で準備した検出マスク画像を学習済みモデルに入力し(S23)、学習済みモデルから、検出マスク画像準備処理で準備した検出マスク画像に対応する前記判定結果を取得する(S24)処理である。判定処理S25は、判定結果取得処理S24で取得した判定結果に基づいて、注目領域Dが顔領域を含むか否かを判定する処理である。このような検出方法により、一部が遮蔽されている顔等の対象物の検出の精度を向上できる。
【0052】
顔検出システム100が実行する検出方法は、演算回路14がプログラムを実行することにより実現され得る。このプログラムは、演算回路14に、上記の検出方法を実行させるためのコンピュータプログラムである。このようなプログラムによれば、顔検出システム100と同様に、一部が遮蔽されている顔等の対象物の検出の精度を向上できる。
【0053】
2-2.学習システム
2-2-1.学習システムの構成例
図7は、図2に示した学習済みモデル151を生成するための学習システム200の一例を示すブロック図である。学習システム200は、入力装置21と、出力装置22と、通信インタフェース(I/F)23と、演算回路24と、記憶装置25とを備える。学習システム200のこれらの構成要素は、1つの筐体内に収容される必要はなく、複数台のコンピュータシステムで実現されてもよい。
【0054】
入力装置21は、学習システム200への情報の入力のために、学習システム200と外部機器とを接続するインタフェース回路である。出力装置22は、学習システム200からの情報の出力のために、学習システム200と外部機器とを接続するインタフェース回路である。通信インタフェース23は、学習システム200と外部機器との通信接続を可能とするためのインタフェース回路を含む。通信インタフェース23は、既存の有線通信規格又は無線通信規格に従って通信を行う。
【0055】
演算回路24は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、情報処理に応じて学習システム200の動作を制御する。このような情報処理は、演算回路24がプログラムを実行することにより実現される。演算回路24は、1又は複数の専用のプロセッサにより実現されてもよい。また、演算回路24の構成要素に関して、実施形態に応じて、適宜、機能の省略、置換及び追加が行われてもよい。演算回路24は、CPU、MPU、GPU、マイコン、DSP、FPGA、ASIC等の種々の半導体集積回路で構成されてもよい。
【0056】
記憶装置25は、コンピュータその他の装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。記憶装置25は、例えば、ハードディスクドライブ、ソリッドステートドライブ等の補助記憶装置であり、モデル251、原画像252、学習マスク画像253、教師データ254、演算回路24で実行されるプログラム等を記憶する。モデル251、原画像252、学習マスク画像253、及び教師データ254の詳細については後述する。これらのデータは、図7では記憶装置25に記憶されているが、本開示はこれに限定されない。例えば、これらのデータは常に記憶装置25に記憶されている必要はなく、演算回路24による処理に必要な時に記憶装置25に格納されていればよい。
【0057】
2-2-2.学習システムの動作例
次に、学習方法として、学習済みモデル151の生成方法について説明する。図8は、学習方法の一例を示すフローチャートである。学習方法は、例えば、図7に示した学習システム200によって実行される。例えば、学習システム200の演算回路24は、モデル251に学習をさせて学習済みモデル151を生成する。以下で説明する処理手順は一例に過ぎず、処理手順及び各処理は可能な限り変更されてよい。
【0058】
(原画像準備処理S201)
まず、演算回路24は、原画像252を準備する(S201)。例えば、演算回路24は、記憶装置25に記憶された原画像252を取得する。演算回路24は、原画像252として、入力装置21を介して、カメラ等の外部機器から撮像画像を取得してもよい。
【0059】
(学習マスク画像準備処理S202)
次に、演算回路24は、学習用のマスク画像(以下、「学習マスク画像」という。)253を準備する(S202)。図9Aは、学習マスク画像253の一例を示す模式図である。学習マスク画像253は、原画像252の一部がマスク領域Mとして設定されたものである。図9Aに示した例では、原画像252の下側半分がマスク領域Mとして設定されている。このように、マスク領域Mは、原画像252の外縁のうちの1つである下端から、原画像252の中心に向けて、すなわち上方に広がる1つの領域であってもよい。また、マスク領域Mは、原画像252を表す矩形の少なくとも1辺の全部から顔領域の中心に向けて広がる1つの領域であってもよい。図9Aに示した例では、マスク領域Mは、原画像252を表す矩形の下辺の全部から上方に広がる1つの領域である。
【0060】
図9Aに示した例のように、マスク領域Mは、原画像252の約50%を占めてもよい。しかしながら、本開示はこれに限定されず、マスク領域Mは、原画像252の20%~70%の範囲から選択された割合を占めるものであってもよい。また、図9Aに示した例では、マスク領域Mは矩形の領域であるが、これに限定されず、例えば円形、楕円形、多角形等の形状を有する領域であってもよい。
【0061】
原画像252から図9Aの学習マスク画像253を得ることは、演算回路24自身がプログラムを実行することによって実現されてもよい。この場合、演算回路24は、生成した学習マスク画像253を例えば記憶装置25に格納する。あるいは、学習マスク画像253は、学習システム200の外部で作成されてもよい。例えば、原画像252から図9Aの学習マスク画像253を得ることは、外部のプロセッサ等によって実行され、その後、学習マスク画像253は、入力装置21、通信インタフェース23等を介して、記憶装置25に記憶されてもよい。
【0062】
図9Aは、学習マスク画像253において、原画像252が顔領域を示す顔画像である例を示すが、これは一例に過ぎない。図9Bに例示するように、原画像252は、顔が映っていない画像を含む。
【0063】
図10は、特定部分が異なる複数のマスク領域Ma~Mhがそれぞれ設定された複数の学習マスク画像253a~253hの一例を示す模式図である。図7に示した学習マスク画像253は、それぞれ異なる8個の領域がマスク領域として設定された学習マスク画像253a~253hを含む画像データ群であってもよい。
【0064】
マスク領域Maの特定部分は左上半分である。よって、学習マスク画像253aでは、原画像の左上半分がマスク領域Maとして設定されている。マスク領域Mbの特定部分は上半分である。よって、学習マスク画像253bでは、原画像の上半分がマスク領域Mbとして設定されている。マスク領域Mcの特定部分は右上半分である。よって、学習マスク画像253cでは、原画像の右上半分がマスク領域Mcとして設定されている。マスク領域Mdの特定部分は右半分である。よって、学習マスク画像253dでは、原画像の右半分がマスク領域Mdとして設定されている。マスク領域Meの特定部分は右下半分である。よって、学習マスク画像253eでは、原画像の右下半分がマスク領域Meとして設定されている。マスク領域Mfの特定部分は下半分である。よって、学習マスク画像253fでは、図9Aの学習マスク画像253と同様に、原画像の下半分がマスク領域Mfとして設定されている。マスク領域Mgの特定部分は左下半分である。よって、学習マスク画像253gでは、原画像の左下半分がマスク領域Mgとして設定されている。マスク領域Mhの特定部分は左半分である。よって、学習マスク画像253hでは、原画像の左半分がマスク領域Mhとして設定されている。
【0065】
このように、学習マスク画像253a~253hは、原画像の互いに異なる位置にマスク領域を有する。すなわち、学習マスク画像準備処理S202は、原画像252において互いに異なる部分をそれぞれマスク領域Ma~Mhとして設定した複数の学習マスク画像253a~253hを準備することを含む。このように、マスク領域Ma~Mhは、それぞれ、原画像の外縁から、原画像の中心に向けて広がる連続した領域であってもよい。図10に示した例のように、マスク領域Ma~Mhは、それぞれ、原画像の約50%を占めてもよい。しかしながら、本開示はこれに限定されず、マスク領域Ma~Mhは、それぞれ、原画像の20%~70%の範囲から選択された割合を占めるものであってもよい。
【0066】
このように多様な位置にマスク領域を有する複数の学習マスク画像253a~253hを学習した学習済みモデル151を利用することにより、顔検出システム100は、より多様な遮蔽の態様に応じて精度良く顔を検出することができる。
【0067】
(教師データ準備処理S203)
次に、演算回路24は、学習マスク画像253を入力情報、学習マスク画像253が顔領域を含むか否かを示す判定結果を正解情報としてそれぞれ含む教師データ254を準備する(S203)。
【0068】
図11は、教師データ準備処理S203で準備される教師データ254を例示する模式図である。図11の表の第1行には、入力データである学習マスク画像253-1を示している。学習マスク画像253-1では、原画像252-1は、顔領域を示すものである。したがって、学習マスク画像253-1については、「顔領域である」という判定結果が正解情報として設定される。また、図11において、第2行及び第3行では、学習マスク画像253-2の原画像252-2、及び学習マスク画像253-3の原画像252-3は、いずれも顔領域を示すものでない。したがって、学習マスク画像253-2及び学習マスク画像253-3については、「顔領域ではない」という判定結果が正解情報として設定される。
【0069】
(学習処理S204)
図8に戻り、教師データ準備処理S203の後、演算回路24は、教師データ254を用いて、モデル251に対する機械学習を実行する(S204)。この学習処理S204は、学習マスク画像253のうちマスク領域Mを除く部分に基づく非マスク情報と、正解情報との関係をモデル251に学習させて学習済みモデル151(図2参照)を生成することを含む。
【0070】
モデル251は、例えば、分類木を含む決定木の手法により機械学習を行う決定木モデル、サポートベクターマシーン等の学習用モデルである。学習は、AdaBoost等のブースティング学習アルゴリズムによって行われてもよい。
【0071】
図11に示した例では、演算回路24は、学習マスク画像253のうちマスク領域Mを除く上半分の部分における画像の特徴量と、正解情報との関係をモデル251に学習させる。ここで、画像の特徴量の学習は、図12に示すように、学習マスク画像253のうちマスク領域Mを除く部分における第1特徴領域P1の特徴量と、第1特徴領域P1と異なる第2特徴領域P2の特徴量との差分又は比を学習することを含む。特徴領域の特徴量とは、例えば、その特徴領域内の画素値の平均値を示す。特徴量の差は、例えば画素の輝度の差である。例えば、このような特徴量としてHaar-Like特徴量、LBP(Local Binary Pattern)特徴量、HOG(Histogram of Oriented Gradients)特徴量、Sparse特徴量(C. Huang, H. Ai, Y. Li, S. Lao , “Learning Sparse Features in Granular Space for Multi-View Face Detection”, International Conference on Automatic Face and Gesture Recognition, pp. 401-406, 2006)等が用いられ、モデル251は、学習によりカスケード分類器を構成してもよい。このように、特徴領域間の特徴量について差分を算出することにより人物の顔を検出する技術は、参考文献1(Paul Viola,Michael Jones,“Robust Real-time Object Detection”,SECOND INTERNATIONAL WORKSHOP ON STATISTICAL AND COMPUTATIONAL THEORIES OF VISION - MODELING, LEARNING, COMPUTING, AND SAMPLING VANCOUVER CANADA,JULY 13, 2001)、特開2005-327242号公報等に開示されている。
【0072】
また、モデル251は、ニューラルネットワーク、例えば畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)の構造を有する学習用モデルであってもよい。CNNのようなモデルの教師あり学習は、例えば誤差逆伝播法を利用して、演算回路24によって行われる。
【0073】
図10に示したように複数の学習マスク画像253a~253hを利用する例では、学習処理S204は、複数の学習マスク画像253a~253hのうち、それぞれのマスク領域Ma~Mhを除く部分における情報と、正解情報との関係をそれぞれ異なるモデルに学習させて複数の学習済みモデル151a~151h(図6参照)を生成することを含んでもよい。
【0074】
図13は、複数のモデルに対する機械学習を説明するための模式図である。図13は、8個のモデル251a~251hを例示している。
【0075】
例えば、第1モデル251aは、原画像の左上半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254aを用いて、機械学習を行う。第2モデル251bは、原画像の上半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254bを用いて、機械学習を行う。第3モデル251cは、原画像の右上半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254cを用いて、機械学習を行う。第4モデル251dは、原画像の右半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254dを用いて、機械学習を行う。第5モデル251eは、原画像の右下半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254eを用いて、機械学習を行う。第6モデル251fは、原画像の下半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254fを用いて、機械学習を行う。第7モデル251gは、原画像の左下半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254gを用いて、機械学習を行う。第8モデル251hは、原画像の左半分がマスク領域として設定されたマスク画像を入力とし、原画像が顔領域であるか否かを示す結果を正解情報とする教師データ254hを用いて、機械学習を行う。
【0076】
このように、異なる領域をマスク領域として設定したマスク画像を、それぞれの位置のマスク領域を担当する複数のモデル251a~251hに学習させることにより、複数の学習済みモデル151a~151hを得る。このように学習済みモデル151が複数の学習済みモデル151a~151hを含むように構成された顔検出システム100は、多様な遮蔽の態様に応じて精度良く顔を検出することができる。
【0077】
以上のように、学習方法は、原画像準備処理S201と、学習マスク画像準備処理S202と、教師データ準備処理S203と、学習処理S204とを含む。原画像準備処理S201は、原画像を準備する。学習マスク画像準備処理S202は、原画像から、特定部分を覆うマスク領域Mが設定された学習マスク画像253を準備する。教師データ準備処理S203は、学習マスク画像253を入力情報、学習マスク画像253が顔領域を含むか否かを示す判定結果を正解情報としてそれぞれ含む教師データ254を準備する。学習処理S204は、教師データ254を用いて、モデル251に対する機械学習を実行する。学習処理S204は、学習マスク画像253のうちマスク領域Mを除く部分に基づく非マスク情報と、教師データ254に含まれる判定結果との関係をモデル251に学習させて学習済みモデル151を生成することを含む。
【0078】
このような学習方法により、一部が遮蔽されている顔等の対象物の検出の精度を向上できる学習済みモデル151を得ることができる。
【0079】
さらに、このように得られた学習済みモデル151を利用する顔検出システム100は、上記の効果に加えて、顔のどの領域が遮蔽されているかを検出することができる。例えば、学習済みモデル151を利用する顔検出システム100は、例えば従来の遮蔽されていない顔を検出可能な顔検出器を備えることにより、ある画像について、以下のような判断をすることができる。すなわち、学習済みモデル151による検出結果も、従来の顔検出器による検出結果も、「顔である」という結果である場合、顔検出システム100は、画像には遮蔽されていない顔が映っていると判断する。また、学習済みモデル151による検出結果が「顔である」という結果である一方で、従来の顔検出器による検出結果が「顔ではない」という結果である場合、顔検出システム100は、画像にはマスク領域Mに対応する位置が遮蔽された顔が映っていると判断する。このような、顔のどの領域が遮蔽されているかについての検出結果情報は、例えば特定の地域に存在する人についての社会状況の分析、及びこのような分析結果の地域ごとの比較等に利用できる。
【0080】
学習マスク画像準備処理S202は、1つの原画像から、特定部分が異なる複数の学習マスク領域Ma~Mhがそれぞれ設定された複数の学習マスク画像253a~253hを準備することを含んでもよい。学習方法がこのような学習処理S204を含むことにより、学習済みモデル151は、より多様な遮蔽の態様に応じて精度良く顔を検出できる。
【0081】
学習処理S204は、複数のマスク領域Ma~Mh毎に非マスク情報と判定結果との関係をモデル251a~251hに学習させて、複数のマスク領域Ma~Mhにそれぞれ対応する複数の学習済みモデル151a~151hを生成することを含んでもよい。複数の学習済みモデル151a~151hにより、より多様な遮蔽の態様に応じて精度良く顔を検出できる。さらに、複数の学習済みモデル151a~151hを利用する顔検出システム100は、複数の学習済みモデル151a~151hからそれぞれ取得した結果に基づいて、注目領域Dにおける遮蔽領域の位置を検出できる。
【0082】
また、以上のように、本開示の一実施形態は、原画像を準備する原画像準備処理S201と、原画像から、特定部分を覆うマスク領域Mが設定された学習マスク画像253を準備する学習マスク画像準備処理S202と、学習マスク画像253を入力情報、学習マスク画像253が顔領域を含むか否かを示す判定結果を正解情報としてそれぞれ含む教師データを生成する教師データ準備処理S203と、を含む教師データ生成方法を提供する。原画像準備処理S201は、教師データ生成方法の「第1処理」の一例である。学習マスク画像準備処理S202は、教師データ生成方法の「第2処理」の一例である。教師データ準備処理S203は、教師データ生成方法の「第3処理」の一例である。このような教師データ生成方法により、一部が遮蔽されている顔等の対象物の検出の精度を向上できる学習済みモデルを生成ることができる。
【0083】
(変形例)
以上、本開示の実施形態を詳細に説明したが、前述までの説明はあらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良や変形を行うことができる。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略する。以下の変形例は適宜組み合わせることができる。
【0084】
上記の実施形態では、図9A,9B,10に例示したように、学習マスク画像253のマスク領域M,Ma~Mhが、顔領域の外縁から広がる1つの領域である例について説明した。しかしながら、マスク領域の形状はこのような例に限定されない。例えば、図14に示すように、マスク領域Mは、顔領域の外縁から広がる領域ではなく、顔領域の一部を占める1つの連続した領域であってもよい。また、例えば、図15に示すように、マスク領域Mは、顔領域の異なる部分を占める複数の領域M1,M2,M3からなるものであってもよい。このような学習マスク画像253を学習した学習済みモデル151を利用することにより、顔検出システム100は、より多様な遮蔽の態様に応じて精度良く対象物を検出することができる。
【0085】
また、顔検出システム100及び学習システム200は、それぞれ異なるコンピュータシステムで実現されることは必須ではない。顔検出システム100及び学習システム200は、単一のコンピュータシステムで実現されてもよい。
【符号の説明】
【0086】
1 画像解析システム
3 カメラ
11 入力装置
12 出力装置
13 通信インタフェース
14 演算回路
15 記憶装置
21 入力装置
22 出力装置
23 通信インタフェース
24 演算回路
25 記憶装置
50 目開閉検出システム
60 顔認識システム
100 顔検出システム
151 学習済みモデル
153 検出マスク画像
200 学習システム
251 モデル
252 原画像
253 学習マスク画像
254 教師データ
C 撮像画像
D 注目領域
M マスク領域
R 顔領域
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図10
図11
図12
図13
図14
図15