(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-07-03
(45)【発行日】2024-07-11
(54)【発明の名称】情報処理システム、プログラム、及び情報処理方法
(51)【国際特許分類】
G06T 5/00 20240101AFI20240704BHJP
G06T 7/00 20170101ALI20240704BHJP
G06V 40/16 20220101ALI20240704BHJP
G06T 1/00 20060101ALI20240704BHJP
G06T 1/40 20060101ALI20240704BHJP
【FI】
G06T5/00 700
G06T7/00 510F
G06V40/16 A
G06T1/00 340A
G06T1/40
(21)【出願番号】P 2023046170
(22)【出願日】2023-03-23
【審査請求日】2023-03-23
(73)【特許権者】
【識別番号】501440684
【氏名又は名称】ソフトバンク株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】石若 裕子
(72)【発明者】
【氏名】須田 和人
【審査官】淀川 滉也
(56)【参考文献】
【文献】米国特許出願公開第2017/0076474(US,A1)
【文献】中国特許出願公開第111598051(CN,A)
【文献】特開2018-173731(JP,A)
【文献】特開2010-224983(JP,A)
【文献】中国特許出願公開第115131841(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 5/00
G06T 7/00
G06V 40/16
G06T 1/00
G06T 1/40
(57)【特許請求の範囲】
【請求項1】
人の顔を含む対象画像を取得する対象画像取得部と、
人の顔のパーツの指定を予め受け付け、前記対象画像の前記人の顔
のうち、予め指定されたパーツのみについて、施されている化粧
の種類を推定し、推定結果に基づいて、前記人の顔
の前記パーツのみから
化粧を除去した前記人の素顔画像を推定する素顔推定部と、
前記素顔推定部によって推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証部と
を備える情報処理システム。
【請求項2】
人の化粧を施す前の3次元の3D化粧前画像と、当該人が顔のパーツの形状が変化する形状変化有化粧及び顔のパーツの形状が変化しない形状変化無化粧を施した状態の3次元の3D化粧後画像とを含むデータセットを取得するデータ取得部と、
複数の人の前記データセットを用いて、前記形状変化有化粧及び前記形状変化無化粧が施されている人の化粧後画像の当該人の顔から前記形状変化有化粧及び前記形状変化無化粧を除去することによって当該人の化粧除去画像を出力するネットワークを生成するネットワーク生成部と
、
人の顔を含む対象画像を取得する対象画像取得部と、
前記ネットワークを用いて、前記対象画像から、前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定部と、
前記素顔推定部によって推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証部と
を備
える、情報処理システム。
【請求項3】
前記ネットワーク生成部は、前記3D化粧前画像の前記人の目の輪郭と、前記3D化粧後画像の前記人の目の輪郭との差分から、前記形状変化有化粧によって、前記人の目の形状が変化する変化度合を学習し、学習結果が反映された前記ネットワークを生成する、請求項2に記載の情報処理システム。
【請求項4】
前記3D化粧前画像に含まれる前記人の顔に対して、前記形状変化有化粧及び前記形状変化無化粧を疑似的に施して、異なる条件のライティングを施すことによって、複数の前記3D化粧後画像を生成するデータ生成部
を更に備え、
前記データ取得部は、前記3D化粧前画像と、前記3D化粧前画像を元に生成された前記複数の3D化粧後画像とを含む前記データセットを取得する、請求項
2に記載の情報処理システム。
【請求項5】
人の顔を含む対象画像を取得する対象画像取得部と、
前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定部と、
前記素顔推定部によって推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証部と
を備え、
前記素顔推定部は、前記対象画像の人の顔に施されている形状変化無化粧の種類を推定して、推定結果に基づいて、前記対象画像の前記人の顔から形状変化無化粧を除去し、形状変化無化粧を除去した後の前記対象画像の人の顔に施されている形状変化有化粧の種類を推定して、推定結果に基づいて、前記対象画像の人の顔から形状変化有化粧を除去する
、情報処理システム。
【請求項6】
人の形状変化無化粧を施す前の化粧前画像と、当該人が複数種類の形状変化無化粧のそれぞれを施した状態の複数種類の形状変化無化粧画像とを含む形状変化無データセットと、人の素顔画像と、当該人が複数種類の形状変化有化粧のそれぞれを施した状態の複数種類の形状変化有化粧画像とを含む形状変化有データセットとを取得するデータ取得部と、
複数の人の前記形状変化無データセットを用いて、前記形状変化無化粧画像に含まれる人の顔に施されている前記形状変化無化粧の化粧パターンを推定して当該顔から形状変化無化粧を除去することによって人の形状変化無化粧除去画像を出力する形状変化無用ネットワークを生成する第1ネットワーク生成部と、
複数の人の前記形状変化有データセットを用いて、前記形状変化有化粧画像に含まれる人の顔に施されている前記形状変化有化粧の化粧パターンを推定して当該顔から形状変化有化粧を除去することによって当該人の形状変化有化粧除去画像を出力する形状変化有用ネットワークを生成する第2ネットワーク生成部と
、
人の顔を含む対象画像を取得する対象画像取得部と、
前記形状変化無用ネットワーク及び前記形状変化有用ネットワークを用いて、前記対象画像から、前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定部と、
前記素顔推定部によって推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証部と
を備
える、情報処理システム。
【請求項7】
前記素顔推定部は、前記形状変化無用ネットワークを用いて、前記対象画像の人の前記形状変化無化粧を除去した後、前記形状変化有用ネットワークを用いて、前記対象画像の前記人の前記形状変化有化粧を除去することによって、前記対象画像の前記人の前記素顔画像を推定する、請求項
6に記載の情報処理システム。
【請求項8】
前記人の素顔画像に対して、疑似的に複数種類の形状変化有化粧のそれぞれを施した前記複数種類の形状変化有化粧画像を生成し、前記人の形状変化無化粧を施す前の形状変化無化粧前画像に対して、疑似的に複数種類の形状変化無化粧のそれぞれを施した前記複数種類の形状変化無化粧画像を生成するデータ生成部
を更に備え、
前記データ取得部は、前記データ生成部によって生成された前記複数種類の形状変化有化粧画像を含む前記形状変化有データセットと、前記データ生成部によって生成された前記複数種類の形状変化無化粧画像を含む前記形状変化無データセットとを取得する、請求項
6に記載の情報処理システム。
【請求項9】
コンピュータを、請求項1から
8のいずれか一項に記載の情報処理システムとして機能させるためのプログラム。
【請求項10】
コンピュータによって実行される情報処理方法であって、
人の顔を含む対象画像を取得する画像取得段階と、
人の顔のパーツの指定を予め受け付け、前記対象画像の前記人の顔
のうち、予め指定されたパーツのみについて、施されている化粧
の種類を推定し、推定結果に基づいて、前記人の顔
の前記パーツのみから
化粧を除去した前記人の素顔画像を推定する素顔推定段階と、
前記素顔推定段階において推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証段階と
を備える情報処理方法。
【請求項11】
コンピュータによって実行される情報処理方法であって、
人の化粧を施す前の3次元の3D化粧前画像と、当該人が顔のパーツの形状が変化する形状変化有化粧及び顔のパーツの形状が変化しない形状変化無化粧を施した状態の3次元の3D化粧後画像とを含むデータセットを取得するデータ取得段階と、
複数の人の前記データセットを用いて、前記形状変化有化粧及び前記形状変化無化粧が施されている人の化粧後画像の当該人の顔から前記形状変化有化粧及び前記形状変化無化粧を除去することによって当該人の化粧除去画像を出力するネットワークを生成するネットワーク生成段階と、
人の顔を含む対象画像を取得する画像取得段階と、
前記ネットワークを用いて、前記対象画像から、前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定段階と、
前記素顔推定段階において推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証段階と
を備える情報処理方法。
【請求項12】
コンピュータによって実行される情報処理方法であって、
人の顔を含む対象画像を取得する画像取得段階と、
前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定段階と、
前記素顔推定段階において推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証段階と
を備え、
前記素顔推定段階は、前記対象画像の人の顔に施されている形状変化無化粧の種類を推定して、推定結果に基づいて、前記対象画像の前記人の顔から形状変化無化粧を除去し、形状変化無化粧を除去した後の前記対象画像の人の顔に施されている形状変化有化粧の種類を推定して、推定結果に基づいて、前記対象画像の人の顔から形状変化有化粧を除去する、情報処理方法。
【請求項13】
コンピュータによって実行される情報処理方法であって、
人の形状変化無化粧を施す前の化粧前画像と、当該人が複数種類の形状変化無化粧のそれぞれを施した状態の複数種類の形状変化無化粧画像とを含む形状変化無データセットと、人の素顔画像と、当該人が複数種類の形状変化有化粧のそれぞれを施した状態の複数種類の形状変化有化粧画像とを含む形状変化有データセットとを取得するデータ取得段階と、
複数の人の前記形状変化無データセットを用いて、前記形状変化無化粧画像に含まれる人の顔に施されている前記形状変化無化粧の化粧パターンを推定して当該顔から形状変化無化粧を除去することによって人の形状変化無化粧除去画像を出力する形状変化無用ネットワークを生成する第1ネットワーク生成段階と、
複数の人の前記形状変化有データセットを用いて、前記形状変化有化粧画像に含まれる人の顔に施されている前記形状変化有化粧の化粧パターンを推定して当該顔から形状変化有化粧を除去することによって当該人の形状変化有化粧除去画像を出力する形状変化有用ネットワークを生成する第2ネットワーク生成段階と、
人の顔を含む対象画像を取得する画像取得段階と、
前記形状変化無用ネットワーク及び前記形状変化有用ネットワークを用いて、前記対象画像から、前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定段階と、
前記素顔推定段階において推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証段階と
を備える情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、プログラム、及び情報処理方法に関する。
【背景技術】
【0002】
特許文献1には、ユーザの顔画像を取得し、顔画像に含まれる特徴点に関する情報を用いてユーザを認証する技術が記載されている。
[先行技術文献]
[特許文献]
[特許文献1]特開2021-170205号公報
【発明の概要】
【課題を解決するための手段】
【0003】
本発明の一実施態様によれば、情報処理システムが提供される。前記情報処理システムは、人の顔を含む対象画像を取得する対象画像取得部を備えてよい。前記情報処理システムは、前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定部を備えてよい。前記情報処理システムは、前記素顔推定部によって推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証部を備えてよい。
【0004】
前記情報処理システムは、人の化粧を施す前の3次元の3D化粧前画像と、当該人が顔のパーツの形状が変化する形状変化有化粧及び顔のパーツの形状が変化しない形状変化無化粧を施した状態の3次元の3D化粧後画像とを含むデータセットを取得するデータ取得部と、複数の人の前記データセットを用いて、前記形状変化有化粧及び前記形状変化無化粧が施されている人の化粧後画像の当該人の顔から前記形状変化有化粧及び前記形状変化無化粧を除去することによって当該人の化粧除去画像を出力するネットワークを生成するネットワーク生成部とを備えてよく、前記素顔推定部は、前記ネットワークを用いて、前記対象画像から前記素顔画像を推定してよい。前記ネットワーク生成部は、前記3D化粧前画像の前記人の目の輪郭と、前記3D化粧後画像の前記人の目の輪郭との差分から、前記形状変化有化粧によって、前記人の目の形状が変化する変化度合を学習し、学習結果が反映された前記ネットワークを生成してよい。前記情報処理システムは、前記3D化粧前画像に含まれる前記人の顔に対して、前記形状変化有化粧及び前記形状変化無化粧を疑似的に施して、異なる条件のライティングを施すことによって、複数の前記3D化粧後画像を生成するデータ生成部を更に備えてよく、前記データ取得部は、前記3D化粧前画像と、前記3D化粧前画像を元に生成された前記複数の3D化粧後画像とを含む前記データセットを取得してよい。
【0005】
前記情報処理システムにおいて、前記素顔推定部は、前記対象画像の前記人の顔のパーツの形状が変化する形状変化有化粧の種類を推定して、推定結果に基づいて、前記対象画像の前記人の顔から形状変化有化粧を除去してよい。
【0006】
前記いずれかの情報処理システムにおいて、前記素顔推定部は、前記対象画像の前記人の顔のパーツの形状が変化しない形状変化無化粧の種類を推定して、推定結果に基づいて、前記対象画像の前記人の顔から形状変化無化粧を除去してよい。前記素顔推定部は、前記対象画像の人の顔に施されている前記形状変化無化粧の種類を推定して、推定結果に基づいて、前記対象画像の前記人の顔から形状変化無化粧を除去し、形状変化無化粧を除去した後の前記対象画像の人の顔に施されている形状変化有化粧の種類を推定して、推定結果に基づいて、前記対象画像の人の顔から形状変化有化粧を除去してよい。
【0007】
前記いずれかの情報処理システムは、人の形状変化無化粧を施す前の化粧前画像と、当該人が複数種類の形状変化無化粧のそれぞれを施した状態の複数種類の形状変化無化粧画像とを含む形状変化無データセットと、人の素顔画像と、当該人が複数種類の形状変化有化粧のそれぞれを施した状態の複数種類の形状変化有化粧画像とを含む形状変化有データセットとを取得するデータ取得部と、複数の人の前記形状変化無データセットを用いて、前記形状変化無化粧画像に含まれる人の顔に施されている前記形状変化無化粧の化粧パターンを推定して当該顔から形状変化無化粧を除去することによって人の形状変化無化粧除去画像を出力する形状変化無用ネットワークを生成する第1ネットワーク生成部と、複数の人の前記形状変化有データセットを用いて、前記形状変化有化粧画像に含まれる人の顔に施されている前記形状変化有化粧の化粧パターンを推定して当該顔から形状変化有化粧を除去することによって当該人の形状変化有化粧除去画像を出力する形状変化有用ネットワークを生成する第2ネットワーク生成部とを備えてよい。前記素顔推定部は、前記形状変化無用ネットワーク及び前記形状変化有用ネットワークを用いて、前記対象画像から前記素顔画像を推定してよい。前記素顔推定部は、前記形状変化無用ネットワークを用いて、前記対象画像の人の前記形状変化無化粧を除去した後、前記形状変化有用ネットワークを用いて、前記対象画像の前記人の前記形状変化有化粧を除去することによって、前記対象画像の前記人の前記素顔画像を推定してよい。前記第1ネットワーク生成部は、Conditional GANsによって、前記形状変化無用ネットワークを生成してよく、前記第2ネットワーク生成部は、Conditional GANsによって、前記形状変化有用ネットワークを生成してよい。
【0008】
前記いずれかの情報処理システムは、前記人の素顔画像に対して、疑似的に複数種類の形状変化有化粧のそれぞれを施した前記複数種類の形状変化有化粧画像を生成し、前記人の形状変化無化粧を施す前の形状変化無化粧前画像に対して、疑似的に複数種類の形状変化無化粧のそれぞれを施した前記複数種類の形状変化無化粧画像を生成するデータ生成部を更に備えてよい。前記データ取得部は、前記データ生成部によって生成された前記複数種類の形状変化有化粧画像を含む前記形状変化有データセットと、前記データ生成部によって生成された前記複数種類の形状変化無化粧画像を含む前記形状変化無データセットとを取得してよい。
【0009】
前記いずれかの情報処理システムにおいて、前記素顔推定部は、人の顔のパーツの指定を予め受け付け、前記対象画像の前記人の顔の、予め指定されたパーツに施されている化粧の種類を推定し、推定結果に基づいて、前記人の顔の前記パーツから化粧を除去した前記人の素顔画像を推定してよい。
【0010】
本発明の一実施態様によれば、コンピュータを、前記情報処理システムとして機能させるためのプログラムが提供される。
【0011】
本発明の一実施態様によれば、コンピュータによって実行される情報処理方法が提供される。前記情報処理方法は、人の顔を含む対象画像を取得する画像取得段階を備えてよい。前記情報処理方法は、前記対象画像の前記人の顔に施されている化粧を前記人の顔から除去した前記人の素顔画像を推定する素顔推定段階を備えてよい。前記情報処理方法は、前記素顔推定段階において推定された前記素顔画像を用いて、前記人の顔認証を行う顔認証段階を備えてよい。
【0012】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0013】
【
図1】情報処理システム100の一例を概略的に示す。
【
図2】情報処理システム100の機能構成の一例を概略的に示す。
【
図3】情報処理システム100による処理の流れの一例を概略的に示す。
【
図4】3Dデータセットを用いた学習の一例について説明するための説明図である。
【
図5】3Dデータセットを用いた学習の一例について説明するための説明図である。
【
図6】3Dデータセットを用いた学習の一例について説明するための説明図である。
【
図7】3Dデータセットを用いた学習の一例について説明するための説明図である。
【
図8】ネットワーク生成部126による3Dデータセットを用いた学習の処理の流れの一例を概略的に示す。
【
図9】情報処理システム100における学習例を説明するための説明図である。
【
図10】情報処理システム100における学習例を説明するための説明図である。
【
図11】情報処理システム100として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。
【発明を実施するための形態】
【0014】
従来の顔認証システムにおいて、認証精度は、女性の方が男性よりも低い傾向がある。これは、化粧技術の進化によるものと考えられる。化粧スタイルには流行があるため、ある化粧スタイルで認識率をあげても、化粧スタイルが変わると、認識率が下がってしまうと考えられる。本実施形態に係る認証システムでは、化粧顔から素顔を推定して、推定した素顔で顔認証を行うことによって、化粧スタイルに依存しない顔認証アルゴリズムを実現する。
【0015】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0016】
図1は、情報処理システム100の一例を概略的に示す。情報処理システム100は、学習装置102及び認証装置104によって構成されてよい。なお、情報処理システム100が学習装置102及び認証装置104によって構成されるのは一例であって、これに限られない。
【0017】
情報処理システム100は、1つの装置によって構成されてもよい。また、情報処理システム100は、3つ以上の装置によって構成されてもよい。情報処理システム100が、学習装置102及び認証装置104のうち、学習装置102のみを備え、認証装置104は、情報処理システム100の外部の装置であってもよい。情報処理システム100が、学習装置102及び認証装置104のうち、認証装置104のみを備え、学習装置102は、情報処理システム100の外部の装置であってもよい。
【0018】
情報処理システム100は、ネットワーク20を介してカメラ30と通信してよい。ネットワーク20は、インターネットを含んでよい。ネットワーク20は、LAN(Local Area Network)を含んでよい。ネットワーク20は、移動体通信ネットワークを含んでよい。移動体通信ネットワークは、LTE(Long Term Evolution)通信方式、5G(5th Generation)通信方式、3G(3rd Generation)通信方式、及び6G(6th Generation)通信方式以降の通信方式のいずれに準拠していてもよい。
【0019】
情報処理システム100は、ネットワーク20に有線接続されてよい。情報処理システム100は、ネットワーク20に無線接続されてもよい。情報処理システム100は、無線基地局を介してネットワーク20に接続されてよい。情報処理システム100は、Wi-Fi(登録商標)アクセスポイントを介してネットワーク20に接続されてよい。
【0020】
学習装置102は、ネットワーク20に有線接続されてよい。学習装置102は、ネットワーク20に無線接続されてもよい。学習装置102は、無線基地局を介してネットワーク20に接続されてよい。学習装置102は、Wi-Fiアクセスポイントを介してネットワーク20に接続されてよい。
【0021】
認証装置104は、ネットワーク20に有線接続されてよい。認証装置104は、ネットワーク20に無線接続されてもよい。認証装置104は、無線基地局を介してネットワーク20に接続されてよい。認証装置104は、Wi-Fiアクセスポイントを介してネットワーク20に接続されてよい。
【0022】
カメラ30は、人40の認証を要する任意の場所に設置される。カメラ30は、ネットワーク20に有線接続されてよい。カメラ30は、ネットワーク20に無線接続されてよい。カメラ30は、無線基地局を介してネットワーク20に接続されてよい。カメラ30は、Wi-Fiアクセスポイントを介してネットワーク20に接続されてよい。認証装置104とカメラ30とが直接接続されてもよい。認証装置104が、カメラ30を内蔵してもよい。認証装置104がカメラ30を内蔵する場合、認証装置104が、人40の認証を要する任意の場所に設置されてよい。
【0023】
本実施形態に係る情報処理システム100は、認証対象の人40の顔を含む対象画像を取得し、対象画像の人40の顔に施されている化粧を人40の顔から除去した人40の素顔画像を推定する。情報処理システム100は、例えば、対象画像の人40の顔に施されている化粧の種類を推定し、推定結果に基づいて、人40の顔から化粧を除去した人40の素顔画像を推定してよい。情報処理システム100は、推定した素顔画像を用いて、人40の顔認証を行う。
【0024】
例えば、人40の素顔画像のみを予め登録した場合、認証時に、人40の顔に化粧が施されていると、人40の顔に化粧が施されておらず素顔である場合と比較して、認証精度が低下する。例えば、人40の素顔画像と、人40の顔に化粧が施されている状態の化粧画像を予め登録した場合、認証時に、登録された化粧画像における化粧と同じ化粧が施されていれば、認証精度は低下しないことになるが、異なる種類の化粧が施されていた場合、認証精度が低下する。あらゆる種類の化粧のそれぞれを施した複数の化粧後画像を予め登録することによって、認証精度の低下を抑制することはできるが、このような登録を行うことは負荷が非常に高く、現実的ではない。また、登録後に化粧の種類が増加した場合に、認証精度が低下することになってしまい得る。
【0025】
それに対して、本実施形態に係る情報処理システム100では、化粧後の人40の顔から素顔を推定し、素顔による顔認証を実行するので、化粧の種類に依存しない顔認証を実現することができ、高い精度の顔認証技術の実現に貢献することができる。
【0026】
本実施形態に係る情報処理システム100においては、人40の顔のパーツの形状が変化する形状変化有化粧と、人40の顔のパーツの形状が変化しない形状変化無化粧とを区別して、処理を実行してもよい。形状変化有化粧の例として、身体への飾り物の着装、及び美容を目的とした身体への施術が挙げられる。着装の例として、ピアッシング、及びつけ睫毛等が挙げられる。施術の例として、美容整形、プチ美容整形、いわゆるアイプチ、いわゆるクチプチ、及び脱毛等が挙げられる。形状変化無化粧の例として、塗布及び表面加工が挙げられる。塗布とは、顔、身体への化粧料等の塗り付けであってよい。表面加工とは、長期的に保持される身体の一部への加工であってよく、タトゥー、及び瘢痕等がその例として挙げられる。
【0027】
化粧には、形状変化有化粧を施した上で形状変化無化粧を施す場合、形状変化有化粧のみを施す場合、形状変化無化粧のみを施す場合等、バリエーションが存在する。情報処理システム100が、形状変化有化粧と形状変化無化粧とを区別して取り扱うことによって、認証精度の向上に貢献することができる。
【0028】
本実施形態に係る情報処理システム100においては、人40の3次元の3D画像を用いた学習を実行してもよい。情報処理システム100は、実際に人40を撮像することによって生成した人40の3D画像を用いてよい。情報処理システム100は、シンセティックデータを用いてもよい。情報処理システム100は、シンセティックデータに3Dメッシュデータを用いてもよい。人40の3D画像を用いることによって、形状変化有化粧の除去精度を高めることができる。
【0029】
図2は、情報処理システム100の機能構成の一例を概略的に示す。情報処理システム100は、データ記憶部112、データ取得部114、データ生成部116、登録部118、学習実行部120、対象画像取得部130、認証実行部140、及び出力制御部150を備える。なお、情報処理システム100がこれらの全てを備えることは必須とは限らない。
【0030】
データ取得部114は、学習に用いるデータを取得する。データ取得部114は、取得したデータをデータ記憶部112に記憶させる。データ取得部114は、例えば、外部から学習に用いるデータを受信する。
【0031】
データ取得部114は、人の素顔を含む素顔画像と、人が化粧を施した状態の化粧画像とを取得してよい。人が化粧を施した状態の化粧画像とは、人が実際に化粧を施した状態のときに撮像された画像であってよい。人が化粧を施した状態の化粧画像とは、シンセティックデータであってもよい。すなわち、人が化粧を施した状態の化粧画像とは、人の素顔画像から疑似的に生成された画像であってもよい。
【0032】
データ取得部114は、素顔画像と、人が複数種類の化粧のそれぞれを実際に施した状態の複数種類の化粧画像とを含むデータセットを取得してよい。データ取得部114は、複数の人のデータセットを取得してよい。
【0033】
データ取得部114は、人の素顔画像と、人が複数種類の形状変化有化粧のそれぞれを施した複数種類の形状変化有化粧画像とを含む形状変化有データセットを取得してよい。データ取得部114は、複数の人の形状変化有データセットを取得してよい。
【0034】
データ取得部114は、人の形状変化前化粧を施す前の化粧前画像と、人が複数種類の形状変化無化粧のそれぞれを施した複数種類の形状変化無化粧画像とを含む形状変化無化粧データセットを取得してよい。人が形状変化有化粧をせずに形状変化無化粧をした場合、当該化粧前画像は、人の素顔画像と同一であってよい。人が形状変化有化粧をした後に形状変化無化粧をした場合、当該化粧前画像は、人の形状変化有化粧後の画像であってよい。
【0035】
データ生成部116は、シンセティックデータを生成する。データ取得部114は、データ生成部116によって生成されたシンセティックデータを、データ生成部116から取得してもよい。データ生成部116は、例えば、人の素顔画像から、人の化粧画像を生成する。
【0036】
データ生成部116は、人の素顔画像に対して、疑似的に形状変化有化粧を施すことによって、形状変化有化粧画像を生成してよい。データ生成部116は、人の素顔画像に対して、疑似的に複数種類の形状変化有化粧のそれぞれを施した複数種類の形状変化有化粧画像を生成してよい。
【0037】
データ生成部116は、例えば、人の素顔画像に対して、目のサイズを変更したり、一重から二重に変更したり、睫毛を変形したり、眉毛を変形したりすることによって、形状変化有化粧画像を生成する。
【0038】
データ生成部116は、人の形状変化無化粧を施す前の形状変化無化粧前画像に対して、疑似的に形状変化無化粧を施すことによって、形状変化無化粧画像を生成してよい。データ生成部116は、人の形状変化無化粧を施す前の形状変化無化粧前画像に対して、疑似的に複数種類の形状変化無化粧のそれぞれを施した複数種類の形状変化無化粧画像を生成してよい。人の形状変化無化粧前画像は、人の素顔画像であってもよく、人が形状変化有化粧を施した形状変化有化粧画像であってもよい。
【0039】
データ生成部116は、例えば、人の形状変化無化粧前画像に対して、肌の色を変更したり、目の周囲の色を変更したり、唇の色を変更したりすることによって、形状変化無化粧画像を生成する。
【0040】
登録部118は、人の認証用のデータを登録する。登録部118は、登録したデータをデータ記憶部112に記憶させる。例えば、登録部118は、複数の人のそれぞれについて、素顔画像と、少なくとも1つの化粧画像とを登録する。登録部118は、複数の人のそれぞれについて、素顔画像のみを登録してもよい。登録部118は、複数の人のそれぞれについて、少なくとも1つの化粧画像のみを登録してもよい。
【0041】
学習実行部120は、データ取得部114によって取得されたデータを用いた機械学習を実行する。学習実行部120は、人の顔に化粧が施されている化粧画像から、人の素顔画像を推定するニューラルネットワークを生成してよい。学習実行部120は、化粧画像に含まれる人の顔に施されている化粧の種類を推定し、推定結果に基づいて人の顔から化粧を除去した素顔画像を推定するためのニューラルネットワークを生成してよい。
【0042】
学習実行部120は、ネットワーク生成部122及びネットワーク生成部124を備えてよい。
【0043】
ネットワーク生成部122は、複数の人の形状変化無データセットを用いて、形状変化無化粧画像に含まれる人の顔に施されている形状変化無化粧の化粧パターンを推定して、当該顔から形状変化無化粧を除去することによって、当該人の形状変化無化粧除去画像を出力する形状変化無用ネットワークを生成する。ネットワーク生成部122は、生成した形状変化無用ネットワークをデータ記憶部112に記憶させる。ネットワーク生成部122は、Conditional GANsによって、形状変化無用ネットワークを生成してよい。ネットワーク生成部122は、第1ネットワーク生成部の一例であってよい。形状変化無用ネットワークは第1ネットワークの一例であってよい。
【0044】
ネットワーク生成部124は、複数の人の形状変化有データセットを用いて、形状変化有化粧画像に含まれる人の顔に施されている形状変化有化粧の化粧パターンを推定して、当該顔から形状変化有化粧を除去することによって、当該人の形状変化有化粧除去画像を出力する形状変化有用ネットワークを生成する。ネットワーク生成部124は、生成した形状変化有用ネットワークをデータ記憶部112に記憶させる。ネットワーク生成部124は、Conditional GANsによって、形状変化有用ネットワークを生成してよい。ネットワーク生成部124は、第2ネットワーク生成部の一例であってよい。形状変化有用ネットワークは、第2ネットワークの一例であってよい。
【0045】
対象画像取得部130は、認証対象である人40の顔を含む対象画像を取得する。対象画像取得部130は、カメラ30によって撮像された対象画像をカメラ30から受信してよい。
【0046】
認証実行部140は、対象画像取得部130が取得した対象画像に含まれる人40の認証を実行する。認証実行部140は、素顔推定部142及び顔認証部144を備える。
【0047】
素顔推定部142は、対象画像の人40の顔に施されている化粧を人40の顔から除去した人40の素顔画像を推定する。素顔推定部142は、対象画像の人40の顔に施されている化粧の種類を推定し、推定結果に基づいて、人40の顔から化粧を除去した人の素顔画像を推定してよい。
【0048】
例えば、素顔推定部142は、対象画像の人40の形状変化有化粧の種類を推定して、推定結果に基づいて、対象画像の人40の顔から形状変化有化粧を除去する。素顔推定部142は、データ記憶部112に記憶されている形状変化有用ネットワークを用いて、対象画像の人40の形状変化有化粧を除去してよい。
【0049】
例えば、素顔推定部142は、対象画像の人40の形状変化無化粧の種類を推定して、推定結果に基づいて、対象画像の人40の顔から形状変化無化粧を除去する。素顔推定部142は、データ記憶部112に記憶されている形状変化無用ネットワークを用いて、対象画像の人40の形状変化無化粧を除去してよい。
【0050】
例えば、素顔推定部142は、対象画像の人40の顔に施されている形状変化無化粧の種類を推定して、推定結果に基づいて、対象画像の人40の顔から形状変化無化粧を除去し、形状変化無化粧を除去した後の対象画像の人40の顔に施されている形状変化有化粧の種類を推定して、推定結果に基づいて、対象画像の人40の顔から形状変化有化粧を除去する。素顔推定部142は、データ記憶部112に記憶されている形状変化無ネットワーク及び形状変化有用ネットワークを用いて、対象画像から素顔画像を推定してよい。素顔推定部142は、形状変化無用ネットワークを用いて、対象画像の人40の形状変化無化粧を除去した後、形状変化有用ネットワークを用いて、対象画像の人40の形状変化有化粧を除去することによって、対象画像の人40の素顔画像を推定してよい。
【0051】
顔認証部144は、素顔推定部142によって推定された素顔画像を用いて、人40の顔認証を行う。例えば、登録部118によって、複数の人の素顔画像が登録されている場合、顔認証部144は、素顔推定部142によって推定された素顔画像と、登録部118によって登録された複数の人の素顔画像とを比較することによって、顔認証を行う。例えば、登録部118によって、複数の人の素顔画像は登録されずに、化粧画像が登録されている場合、素顔推定部142が、登録されている複数の化粧画像のそれぞれに対応する複数の素顔画像を推定してよく、顔認証部144は、素顔推定部142によって対象画像から推定された素顔画像と、素顔推定部142によって登録されている複数の化粧画像から推定された素顔画像とを比較することによって、顔認証を行う。
【0052】
素顔推定部142は、人の顔のパーツの指定を予め受け付け、対象画像の人40の顔の、予め指定されたパーツに施されている化粧の種類を推定し、推定結果に基づいて、人の顔のパーツから化粧を除去した人の素顔画像を推定してもよい。例えば、素顔推定部142は、対象画像の人40の顔の、予め指定されたパーツに施されている形状変化無化粧の種類を推定し、推定結果に基づいて、人40の顔のパーツから形状変化無化粧を除去し、形状変化無化粧を除去した人40の顔のパーツに施されている形状変化有化粧の種類を推定し、推定結果に基づいて、人40の顔のパーツから形状変化有化粧を除去することによって、人40の素顔画像を推定する。
【0053】
化粧には流行りがあり、例えば、口のみに化粧を施すことが流行る場合もあり得る。このような場合に、顔全体ではなく、口にのみ着目して、対象画像から化粧を除去することによって、例えば、化粧が施されておらず変化させる必要のない目に何らかの変化が加わってしまうことを防ぐことができる。また、処理負荷の低減に貢献し得る。
【0054】
出力制御部150は、認証実行部140による認証結果を出力するよう制御する。例えば、出力制御部150は、認証実行部140による認証結果を、情報処理システム100が備えるディスプレイや、他のディスプレイに表示出力させる。人40がゲートを通過して良いか否かを判定するような場合、出力制御部150は、認証実行部140による判定結果を、当該ゲートに通知してよい。
【0055】
情報処理システム100は、人40の3次元の3D画像を用いた学習を実行してもよい。この場合、データ取得部114は、人40の化粧を施す前の3D化粧前画像と、当該人40が形状変化有化粧及び形状変化無化粧を施した状態の3D化粧画像とを含むデータセット(3Dデータセットと記載する場合がある。)を取得してよい。データ取得部114は、複数の人40の3Dデータセットを取得してよい。データ取得部114は、取得した3Dデータセットをデータ記憶部112に記憶させる。
【0056】
データ取得部114は、例えば、化粧を施す前の人40を撮像することによって生成された3D化粧前画像と、形状変化有化粧及び形状変化無化粧を施した後の人40を撮像することによって生成された3D化粧画像とを含む3Dデータセットを取得する。
【0057】
3D化粧画像は、データ生成部116によって生成されてもよい。例えば、データ生成部116は、化粧を施す前の人40を撮像することによって生成された3D化粧前画像から、3D化粧画像を生成する。データ生成部116は、当該3D化粧前画像を、外部から取得してよい。データ生成部116は、当該3D化粧前画像を、自身で生成してもよい。
【0058】
データ生成部116は、3D化粧前画像に含まれる人40の顔に対して、形状変化有化粧及び形状変化無化粧を疑似的に施すことによって、3D化粧画像を生成してよい。データ生成部116は、例えば、2次元画像をベースとして素顔画像に形状変化有化粧及び形状変化無化粧を施すように学習されたネットワークを、3Dに転移することによって、3D化粧前画像の人40の顔に対して、形状変化有化粧及び形状変化無化粧を疑似的に施してよい。
【0059】
データ生成部116は、3D化粧前画像に含まれる人40の顔に対して、形状変化有化粧及び形状変化無化粧を疑似的に施して、異なる条件のライティングを施すことによって、複数の3D化粧画像を生成してもよい。例えば、データ生成部116は、光源の位置を様々に変化させることによって、異なる条件のライティングを施す。例えば、データ生成部116は、光源の角度を様々に変化させることによって、異なる条件のライティングを施す。例えば、データ生成部116は、光源の色を様々に変化させることによって、異なる条件のライティングを施す。データ生成部116は、光源の位置、光源の角度、及び光源の色のうち複数を様々に変化させることによって、異なる条件のライティングを施してもよい。これらによって、実際に人40を認証するときに、人40に対してどのような光が当たっていても、認証精度を低下させないようにしたり、認証精度の低下を抑制したりすることができる。
【0060】
学習実行部120は、ネットワーク生成部126を備えてよい。ネットワーク生成部126は、複数の人40の3Dデータセットを用いて、形状変化有化粧及び形状変化無化粧が施されている人40の3D化粧画像の当該人40の顔から形状変化有化粧及び形状変化無化粧を除去することによって当該人40の化粧除去画像を出力するネットワークを生成する。素顔推定部142は、当該ネットワークを用いて、対象画像取得部130が取得した対象画像から素顔画像を推定してよい。
【0061】
ネットワーク生成部122及びネットワーク生成部124が、3Dデータセットを用いた学習を実行してもよい。
【0062】
この場合、データ取得部114は、人40の化粧を施す前の3D化粧前画像と、当該人40が形状変化無化粧を施した状態の3D化粧画像とを含むデータセット(3D形状変化無データセットと記載する場合がある。)を取得してよい。データ取得部114は、複数の人40の3D形状変化無データセットを取得してよい。データ取得部114は、取得した3D形状変化無データセットをデータ記憶部112に記憶させる。データ取得部114は、例えば、化粧を施す前の人40を撮像することによって生成された3D化粧前画像と、形状変化無化粧を施した後の人40を撮像することによって生成された3D形状変化無化粧画像とを含む3D形状変化無データセットを取得する。3D形状変化無化粧画像は、データ生成部116によって生成されてもよい。例えば、データ生成部116は、化粧を施す前の人40を撮像することによって生成された3D化粧前画像から、3D形状変化無化粧画像を生成する。データ生成部116は、3D化粧前画像に含まれる人40の顔に対して、形状変化無化粧を疑似的に施すことによって、3D形状変化無化粧画像を生成してよい。データ生成部116は、例えば、2次元画像をベースとして素顔画像に形状変化無化粧を施すように学習されたネットワークを、3Dに転移することによって、3D化粧前画像の人40の顔に対して、形状変化無化粧を疑似的に施してよい。データ生成部116は、3D化粧前画像に含まれる人40の顔に対して、形状変化無化粧を疑似的に施して、異なる条件のライティングを施すことによって、複数の3D形状変化無化粧画像を生成してもよい。ネットワーク生成部122は、複数の人の3D形状変化無データセットを用いて、形状変化無化粧画像に含まれる人の顔に施されている形状変化無化粧の化粧パターンを推定して、当該顔から形状変化無化粧を除去することによって、当該人の形状変化無化粧除去画像を出力する3D形状変化無用ネットワークを生成してよい。
【0063】
データ取得部114は、人40の化粧を施す前の3D化粧前画像と、当該人40が形状変化有化粧を施した状態の3D化粧画像とを含むデータセット(3D形状変化有データセットと記載する場合がある。)を取得してよい。データ取得部114は、複数の人40の3D形状変化有データセットを取得してよい。データ取得部114は、取得した3D形状変化有データセットをデータ記憶部112に記憶させる。データ取得部114は、例えば、化粧を施す前の人40を撮像することによって生成された3D化粧前画像と、形状変化有化粧を施した後の人40を撮像することによって生成された3D形状変化有化粧画像とを含む3D形状変化有データセットを取得する。3D形状変化有化粧画像は、データ生成部116によって生成されてもよい。例えば、データ生成部116は、化粧を施す前の人40を撮像することによって生成された3D化粧前画像から、3D形状変化有化粧画像を生成する。データ生成部116は、3D化粧前画像に含まれる人40の顔に対して、形状変化有化粧を疑似的に施すことによって、3D形状変化有化粧画像を生成してよい。データ生成部116は、例えば、2次元画像をベースとして素顔画像に形状変化有化粧を施すように学習されたネットワークを、3Dに転移することによって、3D化粧前画像の人40の顔に対して、形状変化有化粧を疑似的に施してよい。データ生成部116は、3D化粧前画像に含まれる人40の顔に対して、形状変化有化粧を疑似的に施して、異なる条件のライティングを施すことによって、複数の3D形状変化有化粧画像を生成してもよい。ネットワーク生成部124は、複数の人の3D形状変化有データセットを用いて、形状変化有化粧画像に含まれる人の顔に施されている形状変化有化粧の化粧パターンを推定して、当該顔から形状変化有化粧を除去することによって、当該人の形状変化有化粧除去画像を出力する3D形状変化有用ネットワークを生成してよい。
【0064】
素顔推定部142は、データ記憶部112に3D形状変化有用ネットワークを用いて、対象画像の人40の形状変化有化粧を除去してよい。素顔推定部142は、3D形状変化無用ネットワークを用いて、対象画像の人40の形状変化無化粧を除去してよい。素顔推定部142は、3D形状変化無ネットワーク及び3D形状変化有用ネットワークを用いて、対象画像から素顔画像を推定してよい。素顔推定部142は、3D形状変化無用ネットワークを用いて、対象画像の人40の形状変化無化粧を除去した後、3D形状変化有用ネットワークを用いて、対象画像の人40の形状変化有化粧を除去することによって、対象画像の人40の素顔画像を推定してよい。
【0065】
情報処理システム100が1つの装置によって構成される場合、情報処理システム100は、データ記憶部112、データ取得部114、データ生成部116、学習実行部120、対象画像取得部130、認証実行部140、及び出力制御部150を備えてよい。情報処理システム100が学習装置102及び認証装置104によって構成される場合、学習装置102が、データ記憶部112、データ取得部114、データ生成部116、及び学習実行部120を備えてよく、認証装置104が、対象画像取得部130、認証実行部140、及び出力制御部150を備えてよい。登録部118は、学習装置102及び認証装置104のいずれが備えてもよい。情報処理システム100が3つ以上の装置によって構成される場合、データ記憶部112、データ取得部114、登録部118、学習実行部120、対象画像取得部130、認証実行部140、及び出力制御部150が、3つ以上の装置に対して適切に分散配置されてよい。
【0066】
図3は、情報処理システム100による処理の流れの一例を概略的に示す。ここでは、情報処理システム100が、1人の人40の顔認証を行う流れを示す。
【0067】
ステップ(ステップをSと省略して記載する場合がある。)102では、対象画像取得部130が、対象画像を取得する。S104では、素顔推定部142が、S102において対象画像取得部130が取得した対象画像から、素顔画像を推定する。
【0068】
S106では、顔認証部144が、S104において素顔推定部142が推定した素顔画像を用いて、顔認証を行う。認証OKの場合(S108でYES)、S110に進み、認証NGの場合(S108でNO)、S112に進む。
【0069】
S110では、出力制御部150が、許可を出力する。S112では、出力制御部150が拒否を出力する。そして処理を終了する。
【0070】
図4、
図5、
図6、
図7は、3Dデータセットを用いた学習の一例について説明するための説明図である。ここでは、アイプチによって一重が二重に変化している場合について説明する。変化前の目の輪郭50に対して、変化後の目の輪郭60が大きくなっている。
【0071】
ネットワーク生成部126は、複数の3Dデータセットを用いて、輪郭50及び輪郭60に対して、中央線70からどのくらい離れている形状がどのくらい変化したか、を学習してよい。中央線70は、輪郭の左端と右端の中央を示してよい。ネットワーク生成部126は、このように、中央線70を基準とした、目の形状変化を学習してよい。ネットワーク生成部126は、中央線70に変えて、輪郭50と輪郭60との縦方向の差分が最大となる線を基準とした、目の形状変化を学習してもよい。
【0072】
図5に示すように、ネットワーク生成部126は、複数の3Dデータセットを用いて、変化前の輪郭50の縦と横の長さの比、及び、目の上側の曲線52と、変化後の輪郭60の縦と横の長さの比、及び、目の上側の曲線62とを学習してよい。ネットワーク生成部126が当該学習を実行することによって、このくらいの目のサイズであればアイプチによってここまで変形可能、という理論値を導き出すことができる。
【0073】
図6に示すように、ネットワーク生成部126は、複数の3Dデータセットを用いて、変化前の輪郭50の縦と横の長さの比、目の上側の中央線70によって区切られる左側の曲線54及び右側の曲線56と、変化後の輪郭60の縦と横の長さの比、目の上側の中央線70によって区切られる左側の曲線64及び右側の曲線66とを学習してよい。ネットワーク生成部126が当該学習を実行することによって、
図5に示す例と比較して、目の上側の曲線をより正確に学習することができる。
【0074】
ネットワーク生成部126は、これらの学習を反映したネットワークを生成してよい。これらの学習を反映することができれば、ネットワーク生成部126は、任意の学習アルゴリズムを用いて当該ネットワークを生成してよい。
【0075】
ネットワーク生成部126による当該学習によって、
図7に示すように、素顔の目の輪郭82に対して、アイプチによる最大の目のサイズである理論値の輪郭84を導き出すことができる。輪郭82の目を有する人40が、アイプチをした場合、目のサイズが、輪郭82と輪郭84との間のいずれかのサイズになることになる。輪郭82と輪郭84との間のどのサイズになるかは、化粧スタイルに依存するという推測が成り立つ。
【0076】
ネットワーク生成部126が、人40の3D化粧前画像と、人40の形状変化有化粧及び形状変化無化粧を施した状態の3D化粧画像とを含む3Dデータセットを用いた学習を実行してネットワークを生成することによって、当該ネットワークは、化粧スタイルにも反応するようになるので、対象画像の人40の顔の目が、輪郭82と輪郭84との間のどのサイズに相当するかを特定して、輪郭82のサイズを推定することができる。
【0077】
輪郭82と輪郭84との間のどのサイズになっているかに応じた素顔の目の推定を、ルールベースで実行するようにしてもよい。例えば、素顔推定部142は、形状変化無用ネットワーク及び形状変化有用ネットワークを用いて、対象画像の人40の目に施されている、形状変化無化粧の化粧パターンと、形状変化有化粧の化粧パターンとを推定する。そして、素顔推定部142は、対象画像の人40の目から形状変化無化粧を除去し、推定した形状変化有化粧の化粧パターンによって、輪郭82と輪郭84との間のどのサイズに相当するかを判定して、判定したサイズに応じて、対象画像の人40の目のサイズを、輪郭82に相当するサイズに変更する。
【0078】
図4から
図7では、アイプチによって一重が二重に変化する場合について説明したが、これに限られない。例えば、情報処理システム100は、クチプチのように、化粧前に比べて、化粧後の口のサイズが大きくなるような形状変化有化粧にも対応可能である。
【0079】
また、情報処理システム100は、アイプチ及びクチプチのように、目や口が大きくなる形状変化有化粧の他、目や口を小さくする形状変化有化粧に対応してもよい。情報処理システム100は、化粧前よりも化粧後の方が、目が小さくなっている化粧前画像及び化粧画像を用いた学習を実行することによって、目を小さくする形状変化有化粧このようなケースにも対応可能とすることができる。また、情報処理システム100は、化粧前よりも化粧後の方が、口が小さくなっている化粧前画像及び化粧画像を用いた学習を実行することによって、口を小さくする形状変化有化粧にも対応可能とすることができる。また、情報処理システム100は、化粧前処理も化粧後の方が、眉毛が物理的に細くなっている化粧前画像及び化粧画像を用いた学習を実行することによって、眉毛を補足する形状変化有化粧にも対応可能とすることができる。
【0080】
図8は、ネットワーク生成部126による3Dデータセットを用いた学習の処理の流れの一例を概略的に示す。
【0081】
S202では、ネットワーク生成部126が、3Dデータセットに含まれる3D化粧前画像及び3D化粧画像を取得する。S204では、ネットワーク生成部126が、3D化粧前画像及び3D化粧画像をノーマライズする。
【0082】
S206では、ネットワーク生成部126が、3D化粧前画像内の顔の鼻の位置と、3D化粧画像内の顔の鼻の位置とを揃える。S208では、ネットワーク生成部126が、3D化粧前画像及び3D化粧画像の、各パーツの輪郭、化粧色を重ね合わせる。
【0083】
S210では、ネットワーク生成部126が、S208において重ね合わせた状態で、3D化粧前画像と3D化粧画像の差分をとる。S212では、ネットワーク生成部126が、S210でとった差分が小さくなるように、学習を実行する。これにより、対象画像が入力された場合に、対象画像の顔の形状変化有化粧及び形状変化無化粧を除去するように、ネットワークが更新されていく。
【0084】
図9、
図10は、情報処理システム100における学習例を説明するための説明図である。本例において、情報処理システム100の学習実行部120は、Conditional GANsを用いて、化粧推定から素顔推定するDNN(Deep Neural Network)を生成してよい。
【0085】
学習実行部120は、例えば、データ取得部114によって取得された学習データを用いて、
図9に例示するように、素顔画像をInput310として生成器G320に入力し、生成器G320によって、形状変化有化粧が施された形状変化有化粧画像であるG(z)330を出力し、形状変化有化粧をX340として適用することによって、化粧画像であるOutput350を出力するネットワーク300を生成する。ネットワーク300に多くの外周データを適用することによって、ネットワーク300には、素顔画像から化粧画像を生成する知識が蓄積される。
【0086】
学習実行部120は、ネットワーク300に蓄積された、素顔画像から化粧画像を生成する知識を用いて、化粧画像から素顔画像を推定するネットワーク400を生成する。ネットワーク400は、化粧画像をInput410として生成器G420に入力し、生成器G420によって、化粧画像から形状変化有化粧が除去された画像であるG(z)430を出力し、形状変化有化粧をX440として、G(z)430から除去することによって、素顔画像であるOutput450を出力する。
【0087】
図11は、情報処理システム100、学習装置102、又は認証装置104として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。コンピュータ1200にインストールされたプログラムは、コンピュータ1200を、本実施形態に係る装置の1又は複数の「部」として機能させ、又はコンピュータ1200に、本実施形態に係る装置に関連付けられるオペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ1200に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU1212によって実行されてよい。
【0088】
本実施形態によるコンピュータ1200は、CPU1212、RAM1214、及びグラフィックコントローラ1216を含み、それらはホストコントローラ1210によって相互に接続されている。コンピュータ1200はまた、通信インタフェース1222、記憶装置1224、DVDドライブ、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ1220を介してホストコントローラ1210に接続されている。DVDドライブは、DVD-ROMドライブ及びDVD-RAMドライブ等であってよい。記憶装置1224は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ1200はまた、ROM1230及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ1240を介して入出力コントローラ1220に接続されている。
【0089】
CPU1212は、ROM1230及びRAM1214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ1216は、RAM1214内に提供されるフレームバッファ等又はそれ自体の中に、CPU1212によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス1218上に表示されるようにする。
【0090】
通信インタフェース1222は、ネットワークを介して他の電子デバイスと通信する。記憶装置1224は、コンピュータ1200内のCPU1212によって使用されるプログラム及びデータを格納する。DVDドライブは、プログラム又はデータをDVD-ROM等から読み取り、記憶装置1224に提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
【0091】
ROM1230はその中に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、及び/又はコンピュータ1200のハードウェアに依存するプログラムを格納する。入出力チップ1240はまた、様々な入出力ユニットをUSBポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ1220に接続してよい。
【0092】
プログラムは、DVD-ROM又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置1224、RAM1214、又はROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ1200の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
【0093】
例えば、通信がコンピュータ1200及び外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース1222に対し、通信処理を命令してよい。通信インタフェース1222は、CPU1212の制御の下、RAM1214、記憶装置1224、DVD-ROM、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
【0094】
また、CPU1212は、記憶装置1224、DVDドライブ(DVD-ROM)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックしてよい。
【0095】
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0096】
上で説明したプログラム又はソフトウエアモジュールは、コンピュータ1200上又はコンピュータ1200近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ1200に提供する。
【0097】
本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び/又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び/又はアナログハードウェア回路を含んでよく、集積回路(IC)及び/又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ(FPGA)、及びプログラマブルロジックアレイ(PLA)等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。
【0098】
コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0099】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。
【0100】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0101】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。その様な変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0102】
特許請求の範囲、明細書、及び図面中において示した装置、システム、プログラム、及び方法における動作、手順、ステップ、及び段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、及び図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【0103】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。その様な変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0104】
特許請求の範囲、明細書、及び図面中において示した装置、システム、プログラム、及び方法における動作、手順、ステップ、及び段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、及び図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0105】
20 ネットワーク、30 カメラ、40 人、50 輪郭、52 曲線、54 曲線、56 曲線、60 輪郭、62 曲線、64 曲線、66 曲線、70 中央線、82 輪郭、84 輪郭、100 情報処理システム、102 学習装置、104 認証装置、112 データ記憶部、114 データ取得部、116 データ生成部、118 登録部、120 学習実行部、122 ネットワーク生成部、124 ネットワーク生成部、126 ネットワーク生成部、130 対象画像取得部、140 認証実行部、142 素顔推定部、144 顔認証部、150 出力制御部、300 ネットワーク、310 Input、320 生成器G、330 G(z)、340 X、350 Output、400 ネットワーク、410 Input、420 生成器G、430 G(z)、440 X、450 Output、1200 コンピュータ、1210 ホストコントローラ、1212 CPU、1214 RAM、1216 グラフィックコントローラ、1218 ディスプレイデバイス、1220 入出力コントローラ、1222 通信インタフェース、1224 記憶装置、1230 ROM、1240 入出力チップ
【要約】 (修正有)
【課題】化粧顔から素顔を推定して、推定した素顔で顔認証を行うことによって、化粧スタイルに依存しない顔認証を行う情報処理システム、プログラム及び情報処理方法を提供する。
【解決手段】情報処理システム100は、人の顔を含む対象画像を取得する対象画像取得部130と、対象画像の人の顔に施されている化粧を人の顔から除去した人の素顔画像を推定する素顔推定部142と、素顔推定部142によって推定された素顔画像を用いて、人の顔認証を行う顔認証部144とを備える。
【選択図】
図2