(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-25
(45)【発行日】2024-12-03
(54)【発明の名称】画像生成システム、画像生成方法、及び記録媒体
(51)【国際特許分類】
G06T 11/80 20060101AFI20241126BHJP
【FI】
G06T11/80 A
(21)【出願番号】P 2022551527
(86)(22)【出願日】2020-09-25
(86)【国際出願番号】 JP2020036345
(87)【国際公開番号】W WO2022064644
(87)【国際公開日】2022-03-31
【審査請求日】2023-03-08
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100107331
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100131015
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】橋本 博志
【審査官】橘 高志
(56)【参考文献】
【文献】特開2007-004767(JP,A)
【文献】米国特許出願公開第2017/0330028(US,A1)
【文献】特開2012-173812(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 11/80
(57)【特許請求の範囲】
【請求項1】
画像から顔又は前記顔の特徴点の位置に関する位置情報を検出する検出手段と、
前記位置情報に対して前記位置情報を検出する場合に生ずる誤差
に応じた摂動量を算出する算出手段と、
前記摂動量を前記位置情報に加算することで、摂動位置情報を取得する取得手段と、
前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する生成手段と
を備えることを特徴とする画像生成システム。
【請求項2】
前記生成手段は、前記新たな画像として、前記顔の位置、大きさ及び角度の少なくとも1つを前記摂動位置情報に基づいて調整した正規化画像を生成することを特徴とする請求項1に記載の画像生成システム。
【請求項3】
前記算出手段は、ユーザが指定する前記誤差に応じて前記摂動量を算出することを特徴とする請求項
1に記載の画像生成システム。
【請求項4】
前記位置情報の正解データを有するテスト用画像を用いて、前記誤差を評価する誤差評価手段を更に備え、
前記算出手段は、前記評価した誤差に応じて前記摂動量を算出することを特徴とする請求項
1に記載の画像生成システム。
【請求項5】
前記算出手段は、複数の前記位置情報の確率分布の偏差に応じて前記摂動量を算出することを特徴とする請求項
1に記載の画像生成システム。
【請求項6】
画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、
前記位置情報に対して前記位置情報を検出する場合に生ずる誤差
に応じた摂動量を算出し、
前記摂動量を前記位置情報に加算することで、摂動位置情報を取得し、
前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する
ことを特徴とする画像生成方法。
【請求項7】
画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、
前記位置情報に対して前記位置情報を検出する場合に生ずる誤差
に応じた摂動量を算出し、
前記摂動量を前記位置情報に加算することで、摂動位置情報を取得し、
前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する
画像生成方法をコンピュータに実行させるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、画像を生成する画像生成システム、画像生成方法、及び記録媒体の技術分野に関する。
【背景技術】
【0002】
この種のシステムとして、顔の特徴点に基づいて顔画像を生成するものが知られている。例えば特許文献1では、両目の位置が所定の基準位置に位置するように顔を正規化し、正規化した顔を含む画像を切り出す技術が開示されている。
【0003】
その他の関連する技術として、例えば特許文献2では、学習データから抽出した特徴を敵対的特徴として、ニューラルネットワークの学習を行う技術が開示されている。特許文献3では、登録された顔テンプレートと確率分布サンプルデータとに基づいて、顔画像の人物を特定する技術が開示されている。特許文献4では、顔画像を回転させることで摂動顔画像を生成する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2007-226424号公報
【文献】国際公開第2018/167900号
【文献】特開2005-208850号公報
【文献】特開2017-182459号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
この開示は、上述した関連する技術を改善する。
【課題を解決するための手段】
【0006】
この開示の画像生成システムの一の態様は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出する検出手段と、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得する取得手段と、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する生成手段とを備える。
【0007】
この開示の画像生成方法の一の態様は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する。
【0008】
この開示の記録媒体の一の態様は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する画像生成方法をコンピュータに実行させるコンピュータプログラムが記録されている。
【図面の簡単な説明】
【0009】
【
図1】第1実施形態に係る画像生成システムのハードウェア構成を示すブロック図である。
【
図2】第1実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図3】第1実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図4】第2実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図5】第3実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図6】第3実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図7】第4実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図8】第4実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図9】第5実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図10】第5実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図11】第6実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図12】第6実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図13】第7実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図14】第7実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図15】第7実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。
【
図16】第7実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。
【
図17】第8実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図18】第8実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【
図19】第8実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。
【
図20】第8実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。
【
図21】第9実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【
図22】第9実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、画像生成システム、画像生成方法、及び記録媒体の実施形態について説明する。
【0011】
<第1実施形態>
第1実施形態に係る画像生成システムについて、
図1から
図3を参照して説明する。
【0012】
(ハードウェア構成)
まず、
図1を参照しながら、第1実施形態に係る画像生成システムのハードウェア構成について説明する。
図1は、第1実施形態に係る画像生成システムのハードウェア構成を示すブロック図である。
【0013】
図1に示すように、第1実施形態に係る画像生成システム10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。画像生成システム10は更に、入力装置15と、出力装置16とを備えていてもよい。プロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16とは、データバス17を介して接続されている。
【0014】
プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、画像生成システム10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、入力される画像から新たな画像を生成するための機能ブロックが実現される。また、プロセッサ11として、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)のうち一つを用いてもよいし、複数を並列で用いてもよい。
【0015】
RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic RAM)であってもよい。
【0016】
ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable ROM)であってもよい。
【0017】
記憶装置14は、画像生成システム10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
【0018】
入力装置15は、画像生成システム10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。
【0019】
出力装置16は、画像生成システム10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、画像生成システム10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。
【0020】
(機能的構成)
次に、
図2を参照しながら、第1実施形態に係る画像生成システム10の機能的構成について説明する。
図2は、第1実施形態に係る画像生成システムの機能的構成を示すブロック図である。
【0021】
図2に示すように、第1実施形態に係る画像生成システム10は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部110と、取得部120と、生成部130とを備えている。なお、検出部110、取得部120、生成部130の各々は、例えば上述したプロセッサ11(
図1参照)によって実現されてよい。
【0022】
検出部110は、入力される画像から顔又は顔の特徴点の位置に関する位置情報を検出可能に構成されている。顔の特徴点は、顔の特徴を表す点であり、例えば目、耳、鼻、口等の特定の部位に対応するものとして設定される。どの部位を特徴点とするかについては、例えばシステム管理者等によって適宜設定可能とされてよい。検出部110は、顔の位置に関する位置情報と、顔の特徴点の位置に関する位置情報とを両方検出してもよい。この場合、検出部110は、顔の位置に関する位置情報を検出するものと、顔の特徴点の位置に関する位置情報を検出するものとを、別々に備えるように構成されてもよい(例えば、2つの独立する検出部110として構成されてもよい)。また、検出部110は、まず顔の位置に関する位置情報を検出し、検出した顔の位置に関する位置情報に基づいて、顔の特徴点の位置に関する位置情報を検出するように構成されてもよい。位置情報は、例えば座標情報であってもよいし、ベクトル情報であってもよい。検出部110は、例えばニューラルネットワークとして構成されてもよい。検出部110による位置情報の具体的な検出方法については、既存の技術を適宜採用できるため、ここでの詳しい説明は省略する。検出部110で検出された位置情報は、取得部120に出力される構成となっている。
【0023】
取得部120は、検出部110で検出された位置情報に対して誤差を加味した摂動位置情報を取得可能に構成されている。ここでの「誤差」とは、検出部110で位置情報を検出する場合に生ずる誤差(即ち、検出誤差)である。摂動位置情報は、検出部110で検出された位置情報と比較すると、誤差に応じた摂動を有する情報となっている。なお、複数の特徴点に対して誤差を加味する場合、すべての特徴点に対して誤差を加味してもよいし、一部の特徴点にのみ誤差を加味してもよい。一部の特徴点にのみ誤差を加味する場合、誤差を加味する特徴点は、過去の履歴等から自動的に決定してもよいし、ユーザに指定させてもよい。位置情報に誤差を加味する具体的な手法については、後述する他の実施形態において詳しく説明する。なお、誤差を加味する手法は、すべての特徴点に対して共通であってもよいし、特徴点毎に異なる手法が採用されてもよい。取得部120で取得された摂動位置情報は、生成部130に出力される構成となっている。
【0024】
生成部130は、取得部120で取得された摂動位置情報に基づいて、顔を含む新たな画像を生成可能に構成されている。生成部130で生成される新たな画像は、摂動位置情報に基づいて生成されるため、誤差に応じた摂動を有する画像となる。このため、検出部110に入力される画像と、生成部130で生成される新たな画像との間には、誤差に応じた差異が生ずることになる。なお、位置情報から画像を生成するための具体的な手法については、既存の技術を適宜採用できるため、ここでの詳しい説明は省略する。生成部130は、生成した新たな画像を出力する機能を有している。生成部130は、例えばディスプレイを有する表示部に生成した新たな画像を出力して表示させるように構成されてもよい。
【0025】
(動作の流れ)
次に、
図3を参照しながら、第1実施形態に係る画像生成システム10の動作の流れについて説明する。
図3は、第1実施形態に係る画像生成システムの動作の流れを示すフローチャートである。
【0026】
図3に示すように、第1実施形態に係る画像生成システム10の動作が開始されると、まず検出部110に画像が入力される(ステップS11)。画像が入力されると、検出部110は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS12)。
【0027】
続いて、取得部120が、位置情報に対して誤差を加味した摂動位置情報を取得する(ステップS13)。そして、生成部130が、摂動位置情報に基づいて、顔を含む新たな画像を生成する(ステップS14)。生成部130は、生成した新たな画像を出力する(ステップS15)。
【0028】
(技術的効果)
次に、第1実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0029】
図1から
図3で説明したように、第1実施形態に係る画像生成システム10では、検出する際の誤差を加味した摂動位置情報に基づいて、新たな顔画像が生成される。よって、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を生成することが可能である。
【0030】
<第2実施形態>
第2実施形態に係る画像生成システム10について、
図4を参照して説明する。なお、第2実施形態は、上述した第1実施形態一部の動作が異なるのみであり、システム構成等については第1実施形態と同様であってよい(
図1及び
図2参照)。このため、以下では、第1実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0031】
(動作の流れ)
まず、
図4を参照しながら、第2実施形態に係る画像生成システム10の動作の流れについて説明する。
図4は、第2実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図4では、
図3で示した処理と同様の処理に同一の符号を付している。
【0032】
図4に示すように、第1実施形態に係る画像生成システム10の動作が開始されると、まず検出部110に画像が入力される(ステップS11)。画像が入力されると、検出部110は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS12)。
【0033】
続いて、取得部120が、位置情報に対して誤差を加味した摂動位置情報を取得する(ステップS13)。そして、生成部130が、摂動位置情報に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0034】
(顔正規化)
次に、第2実施形態に係る画像生成システム10で実行される顔正規化の処理について、より具体的に説明する。
【0035】
顔正規化は、顔の位置、大きさ及び角度の少なくとも1つを位置情報に基づいて調整することで実現される。顔正規化は、例えば目、鼻、口等の顔の特徴点の位置が所定の位置となるように、顔の位置や、大きさ、角度を適宜調整することで実現される。顔正規化には、例えば、画像の拡大・縮小、回転、2D/3D変換等の画像処理技術が用いられてよい。顔正規化には、ここで挙げていない既存の技術を適宜採用することもできる。
【0036】
(技術的効果)
次に、第2実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0037】
図4で説明したように、第2実施形態に係る画像生成システム10では、新たな画像として、顔を正規化した顔正規化画像が生成される。ここで本実施形態では特に、顔の正規化が摂動位置情報に基づいて行われる。これにより、誤差に応じた位置変動を含む正規化画像を生成することができる。
【0038】
以降の実施形態では、第2実施形態と同様に、生成部130が顔正規化画像を生成する構成を例にして説明を進める。
【0039】
<第3実施形態>
第3実施形態に係る画像生成システム10について、
図5及び
図6を参照して説明する。なお、第3実施形態は、上述した第1及び第2実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1及び第2実施形態と同様であってよい。このため、以下では、第1及び第2実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0040】
(機能的構成)
まず、
図5を参照しながら、第3実施形態に係る画像生成システム10の機能的構成について説明する。
図5は、第3実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、
図5では、
図2で示した構成要素と同様のものに同一の符号を付している。
【0041】
図5に示すように、第3実施形態に係る画像生成システム10は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部110と、取得部120と、生成部130と、摂動量生成部140とを備えている。即ち、第3実施形態に係る画像生成システム10は、第1実施形態の構成(
図2参照)に加えて、摂動量生成部140を更に備えて構成されている。摂動量生成部140は、上述したプロセッサ11(
図1参照)によって実現されてよい。
【0042】
摂動量生成部140は、誤差パラメータ(即ち、誤差の大きさを示す値)に応じて摂動量を生成可能に構成されている。摂動量生成部140は、例えば誤差パラメータに所定の乱数を乗ずることで摂動量を生成するようにしてもよい。この場合の乱数は、正規分布(例えば、平均0、分散1の正規分布)による乱数生成器等を用いて生成されてよい。また、誤差パラメータは、ユーザが指定する値であってよい。摂動量生成部140で生成された摂動量は、取得部120の摂動加算部121に出力される構成となっている。
【0043】
摂動加算部121は、検出部110で検出された顔又は顔の特徴量の位置を示すパラメータ(即ち、位置情報)に、摂動量を加算する処理を実行可能に構成されている。摂動加算部121は、摂動量をそのまま加算する処理を実行してもよいし、摂動量に所定の係数を乗じてから加算する処理を実行してもよい。取得部120は、摂動加算部121による加算処理の結果を摂動位置情報として取得する。
【0044】
(動作の流れ)
次に、第3実施形態に係る画像生成システム10の動作の流れについて、
図6を参照して説明する。
図6は、第3実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図6では、
図3及び
図4で示した処理と同様の処理に同一の符号を付している。
【0045】
図6に示すように、第3実施形態に係る画像生成システム10の動作が開始されると、まず検出部110に画像が入力される(ステップS11)。画像が入力されると、検出部110は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS12)。
【0046】
続いて、摂動量生成部140が、摂動量を生成するための乱数を生成する(ステップS31)。そして、摂動量生成部140は、生成した乱数と誤差パラメータから摂動量を生成する(ステップS32)。
【0047】
続いて、摂動加算部121が、検出部110で検出された位置情報に摂動量を加算して、摂動位置情報を取得する(ステップS33)。そして、生成部130が、摂動位置情報に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0048】
(技術的効果)
次に、第3実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0049】
図5及び
図6で説明したように、第3実施形態に係る画像生成システム10では、誤差パラメータに基づいて摂動量が生成される。そして、その摂動量が検出された位置情報に加算されることで摂動位置情報が取得される。このようにすれば、誤差を加味した摂動位置情報を適切に取得することができる。従って、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0050】
<第4実施形態>
第4実施形態に係る画像生成システム10について、
図7及び
図8を参照して説明する。なお、第4実施形態は、上述した第1から第3実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第3実施形態と同様であってよい。このため、以下では、第1から第3実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0051】
(機能的構成)
まず、
図7を参照しながら、第4実施形態に係る画像生成システム10の機能的構成について説明する。
図7は、第4実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、
図7では、
図2及び
図5で示した構成要素と同様のものに同一の符号を付している。
【0052】
図7に示すように、第4実施形態に係る画像生成システム10は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部110と、取得部120と、生成部130と、摂動量生成部140と、誤差評価部150とを備えている。即ち、第4実施形態に係る画像生成システム10は、第3実施形態の構成(
図5参照)に加えて、誤差評価部150を更に備えて構成されている。誤差評価部150は、上述したプロセッサ11(
図1参照)によって実現されてよい。
【0053】
誤差評価部150は、誤差評価用のテストデータを用いて誤差を評価する(即ち、位置情報を検出する際に生ずる誤差を見積もる)ことが可能に構成されている。テストデータは、位置情報に関する正解データを有するデータである。誤差評価部150は、テストデータから検出された位置情報と、正解データとの乖離量に基づき、誤差を統計的な手法で評価してよい。具体的な誤差の評価手法については、既存の技術を適宜採用することができるが、その一例として、平均絶対誤差(MAE:Mean Absolute Error)が挙げられる。誤差評価部150の評価結果は、誤差パラメータとして摂動量生成部140に出力される構成となっている。即ち、本実施形態では、誤差評価部150で評価された誤差パラメータに基づいて摂動量が生成されることになる。
【0054】
(動作の流れ)
次に、第4実施形態に係る画像生成システム10の動作の流れについて、
図8を参照して説明する。
図8は、第4実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図8では、
図3、
図4、及び
図6で示した処理と同様の処理に同一の符号を付している。
【0055】
図8に示すように、第4実施形態に係る画像生成システム10の動作が開始されると、まず検出部110に画像が入力される(ステップS11)。画像が入力されると、検出部110は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS12)。
【0056】
続いて、摂動量生成部140が、摂動量を生成するための乱数を生成する(ステップS31)。そして、摂動量生成部140は、生成した乱数と誤差評価部150で評価された誤差パラメータから摂動量を生成する(ステップS41)。なお、誤差評価部150による誤差評価は、
図8に示す一連の処理が開始される前に別途実行されていればよい。ただし、誤差評価部150による誤差評価は、
図8に示す一連の処理が開始された後、ステップS41の処理が実行される前までに実行されるようにしてもよい。
【0057】
続いて、摂動加算部121が、検出部110で検出された位置情報に摂動量を加算して、摂動位置情報を取得する(ステップS33)。そして、生成部130が、摂動位置情報に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0058】
(技術的効果)
次に、第4実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0059】
図7及び
図8で説明したように、第4実施形態に係る画像生成システム10では、テストデータを用いた誤差評価の結果である誤差パラメータに基づいて摂動量が生成される。そして、その摂動量が検出された位置情報に加算されることで摂動位置情報が取得される。このようにすれば、誤差を加味した摂動位置情報を適切に取得することができる。従って、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0060】
なお、上述した第3実施形態及び第4実施形態は、互いに組み合わせることも可能である。例えば、ユーザが指定した誤差パラメータと、誤差評価部150から出力された誤差パラメータとの両方を統合して統合誤差パラメータとし、その統合誤差パラメータから摂動量を生成するようにしてもよい。統合誤差パラメータは、例えば各誤差パラメータの平均値であってよい。また、ユーザが指定した誤差パラメータと、誤差評価部150から出力された誤差パラメータとを選択的に利用するようにしてもよい。即ち、ユーザが指定した誤差パラメータから生成された摂動量と、誤差評価部150から出力された誤差パラメータから生成された摂動量とのうち、選択された一方を加算して摂動位置情報を取得するようにしてもよい。この場合、摂動量の選択はシステムが自動的に行うようにしてもよいし、ユーザに選択させるようにしてもよい。
【0061】
<第5実施形態>
第5実施形態に係る画像生成システム10について、
図9及び
図11を参照して説明する。なお、第5実施形態は、上述した第1から第4実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第4実施形態と同様であってよい。このため、以下では、第1から第4実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0062】
(機能的構成)
まず、
図9を参照しながら、第5実施形態に係る画像生成システム10の機能的構成について説明する。
図9は、第5実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、
図9では、
図5及び
図7で示した構成要素と同様のものに同一の符号を付している。
【0063】
図9に示すように、第5実施形態に係る画像生成システム10は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部110と、取得部120と、生成部130と、摂動量生成部140とを備えている。即ち、第5実施形態に係る画像生成システム10は、第3実施形態の構成(
図5参照)と同様の要素を備えて構成されている。ただし、第5実施形態に係る摂動量生成部140には、確率分布の偏差が入力されるように構成されている。確率分布の偏差は、例えばガウス分布の偏差であってよい。摂動量生成部140は、入力される確率分布の偏差に基づいて摂動量を生成可能に構成されている。例えば、摂動量生成部140は、確率分布の偏差に乱数を乗ずることで、摂動量を生成してもよい。
【0064】
(動作の流れ)
次に、第5実施形態に係る画像生成システム10の動作の流れについて、
図10を参照して説明する。
図10は、第5実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図10では、
図6及び
図8で示した処理と同様の処理に同一の符号を付している。
【0065】
図10に示すように、第5実施形態に係る画像生成システム10の動作が開始されると、まず検出部110に画像が入力される(ステップS11)。画像が入力されると、検出部110は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS12)。
【0066】
続いて、摂動量生成部140が、摂動量を生成するための乱数を生成する(ステップS31)。そして、摂動量生成部140は、生成した乱数と確率分布の偏差から摂動量を生成する(ステップS42)。
【0067】
続いて、摂動加算部121が、検出部110で検出された位置情報に摂動量を加算して(ステップS33)、摂動位置情報を取得する。そして、生成部130が、摂動位置情報に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0068】
(技術的効果)
次に、第5実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0069】
図9及び
図10で説明したように、第5実施形態に係る画像生成システム10では、確率分布の偏差に基づいて摂動量が生成される。そして、検出された位置情報にその摂動量が加算されることで摂動位置情報が取得される。このようにすれば、誤差を加味した摂動位置情報を適切に取得することができる。従って、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である
【0070】
<第6実施形態>
第6実施形態に係る画像生成システム10について、
図11及び
図12を参照して説明する。なお、第6実施形態は、上述した第1から第5実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第5実施形態と同様であってよい。このため、以下では、第1から第5実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0071】
(機能的構成)
まず、
図11を参照しながら、第6実施形態に係る画像生成システム10の機能的構成について説明する。
図11は、第6実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、
図11では、
図2で示した構成要素と同様のものに同一の符号を付している。
【0072】
図11に示すように、第6実施形態に係る画像生成システム10は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部110と、取得部120と、生成部130とを備えている。ただし、第6実施形態の検出部110は、(所定の時間内や、所定の操作が行われているとき、所定の第1の操作が行われてから所定の第2の操作が行われるまで等の)所定の期間においてn回(nは自然数)の検出を行い、n個の位置情報を出力可能に構成されている。n個の位置情報は、順次出力されてもよいし、n個まとめて出力されてもよい。
【0073】
検出部110で検出されたn個の位置情報の各々は、取得部120に出力される構成となっている。ここで特に、第6実施形態に係る取得部120は、選択部122を有するように構成されている。選択部122は、検出部110で検出されたn個の位置情報から、位置情報をランダムに1つ選択するものとして構成されている。n個の位置情報は、それぞれ別々のタイミングで検出されたものであるため、全体で見ると互いに誤差を有する情報となっている。よって、n個の位置情報からランダムに選択した位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部120は、選択部122が選択した位置情報を、摂動位置情報として生成部130に出力するように構成されている。
【0074】
(動作の流れ)
次に、第6実施形態に係る画像生成システム10の動作の流れについて、
図12を参照して説明する。
図12は、第6実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図12では、
図3及び
図4で示した処理と同様の処理に同一の符号を付している。
【0075】
図12に示すように、第6実施形態に係る画像生成システム10の動作が開始されると、まず検出部110に画像が入力される(ステップS11)。画像が入力されると、検出部110が、画像から顔又は顔の特徴点の位置に関する位置情報をn回検出する(ステップS50)。この結果、検出部110からはn個の位置情報が検出される。
【0076】
続いて、選択部122が、n個の位置情報からランダムに1つの位置情報を選択する(ステップS52)。そして、生成部130が、ランダムに選択された位置情報(即ち、摂動位置情報)に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0077】
(技術的効果)
次に、第6実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0078】
図11及び
図12で説明したように、第6実施形態に係る画像生成システム10では、検出部110によってn個の位置情報が検出される。そして、n個の位置情報からランダムに選択した位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、直接的に誤差を算出せずとも(例えば、第3実施形態から第5実施形態のように、摂動量を加算することなく)、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0079】
<第7実施形態>
第7実施形態に係る画像生成システム10について、
図13及び
図14を参照して説明する。なお、第7実施形態は、上述した第1から第6実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第6実施形態と同様であってよい。このため、以下では、第1から第6実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0080】
(機能的構成)
まず、
図13を参照しながら、第7実施形態に係る画像生成システム10の機能的構成について説明する。
図13は、第7実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、
図13では、
図2及び
図11で示した構成要素と同様のものに同一の符号を付している。
【0081】
図13に示すように、第7実施形態に係る画像生成システム10は、その機能を実現するための処理ブロック又は物理的な処理回路として、複数の検出部110と、取得部120と、生成部130とを備えている。即ち、第7実施形態に係る画像生成システム10は、第6実施形態の構成(
図11参照)と比較して、独立した複数の検出部110を備えている点が異なる。なお、
図13では、便宜上3つの検出部110を図示しているが、第7実施形態に係る画像生成システム10は、3つ以上の検出部110を備えていてもよい。以下では、第7実施形態に係る画像生成システム10が、N個(Nは自然数)の検出部110を備えているものとして説明を進める。
【0082】
上述したN個の検出部110で検出された位置情報の各々は、取得部120に出力される構成となっている。ここで特に、第7実施形態に係る取得部120は、選択部122を有するように構成されている。選択部122は、N個の検出部110で検出されたN個の位置情報から、位置情報をランダムに1つ選択するものとして構成されている。なお、N個の検出部110が、上述した第6実施形態のようにn回の検出を行う場合には、N×n個の位置情報から、位置情報をランダムに1つ選択するようにすればよい。N個の位置情報は、それぞれ別々の検出部110で検出されたものであるため、全体で見ると互いに誤差を有する情報となっている。よって、別々の検出部110で検出されたN個の位置情報からランダムに選択した位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部120は、選択部122が選択した位置情報を、摂動位置情報として生成部130に出力するように構成されている。
【0083】
(動作の流れ)
次に、第7実施形態に係る画像生成システム10の動作の流れについて、
図14を参照して説明する。
図14は、第7実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図14では、
図3及び
図4で示した処理と同様の処理に同一の符号を付している。
【0084】
図14に示すように、第7実施形態に係る画像生成システム10の動作が開始されると、まずN個の検出部110の各々に画像が入力される(ステップS11)。画像が入力されると、N個の検出部110の各々が、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS51)。この結果、N個の位置情報が検出される。
【0085】
続いて、選択部122が、N個の位置情報からランダムに1つの位置情報を選択する(ステップS52)。そして、生成部130が、ランダムに選択された位置情報(即ち、摂動位置情報)に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0086】
(技術的効果)
次に、第7実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0087】
図13及び
図14で説明したように、第7実施形態に係る画像生成システム10では、N個の独立した検出部110によってN個の位置情報が検出される。そして、N個の位置情報からランダムに選択した位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、直接的に誤差を算出せずとも(例えば、第3実施形態から第5実施形態のように、摂動量を加算することなく)、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0088】
(第7実施形態の変形例)
次に、第7実施形態の変形例に係る画像生成システム10について、
図15及び
図16を参照して説明する。なお、第7実施形態の変形例に係る画像生成システム10は、上述した第7実施形態と一部の動作が異なるのみであり、その他の動作やシステム構成については、第7実施形態と同様であってよい。このため、以下では、既に説明した第7実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0089】
(機能的構成)
まず、
図15を参照しながら、第7実施形態の変形例に係る画像生成システム10の機能的構成について説明する。
図15は、第5実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。なお、
図15では、
図13で示した構成要素と同様のものに同一の符号を付している。
【0090】
図15に示すように、第7実施形態の変形例に係る画像生成システム10は、その機能を実現するための処理ブロックとして、複数の検出部110と、取得部120と、生成部130と、確率分布推定部160を備えている。即ち、第7実施形態の変形例に係る画像生成システム10は、上述した第7実施形態の構成(
図13参照)に加えて、確率分布推定部160を更に備えて構成されている。確率分布推定部160は、上述したプロセッサ11(
図1参照)によって実現されてよい。
【0091】
確率分布推定部160は、N個の検出部110で検出されたN個の位置情報を所定の確率分布でフィッティングする処理を実行可能に構成されている。確率分布推定部160は、例えばN個の位置情報をガウス分布でフィッティングしてもよい。この場合、位置情報は、ガウスモデル平均+ガウスモデル偏差×乱数の式で表される値であってよい。
【0092】
確率分布推定部160のフィッティング処理の結果は、取得部120に出力される構成となっている。ここで特に、第7実施形態の変形例に係る取得部120は、サンプリング部123を有するように構成されている。サンプリング部123は、確率分布推定部160の処理結果として出力される確率分布から、1つの位置情報をサンプリングするものとして構成されている。このようにしてサンプリングされた位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部120は、サンプリング部123がサンプリングした位置情報を、摂動位置情報として生成部130に出力するように構成されている。
【0093】
(動作の流れ)
次に、第7実施形態の変形例に係る画像生成システム10の動作の流れについて、
図16を参照して説明する。
図16は、第5実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図16では、
図13で示した処理と同様の処理に同一の符号を付している。
【0094】
図16に示すように、第7実施形態の変形例に係る画像生成システム10の動作が開始されると、まずN個の検出部110の各々に画像が入力される(ステップS11)。画像が入力されると、N個の検出部110の各々が、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS51)。この結果、N個の位置情報が検出される。
【0095】
続いて、確率分布推定部160が、N個の位置情報を所定の確率分布でフィッティングする処理を実行する(ステップS55)。そして、サンプリング部123が、確率分布推定部160の処理結果として出力される確率分布から、1つの位置情報をサンプリングする(ステップS56)。
【0096】
続いて、生成部130が、サンプリングされた位置情報(即ち、摂動位置情報)に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0097】
(技術的効果)
次に、第7実施形態の変形例に係る画像生成システム10によって得られる技術的効果について説明する。
【0098】
図15及び
図16で説明したように、第7実施形態の変形例に係る画像生成システム10では、N個の独立した検出部110によってN個の位置情報が検出される。そして、N個の位置情報を確率分布でフィッティングし、その分布からサンプリングされた位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、N個の位置情報から推定される確率分布から、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0099】
<第8実施形態>
第8実施形態に係る画像生成システム10について、
図17及び
図18を参照して説明する。なお、第8実施形態は、上述した第1から第7実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第7実施形態と同様であってよい。このため、以下では、第1から第7実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0100】
(機能的構成)
まず、
図17を参照しながら、第8実施形態に係る画像生成システム10の機能的構成について説明する。
図17は、第8実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、
図17では、
図2及び
図13で示した構成要素と同様のものに同一の符号を付している。
【0101】
図17に示すように、第8実施形態に係る画像生成システム10は、その機能を実現するための処理ブロックとして、検出部110と、取得部120と、生成部130と、摂動画像生成部170とを備えている。即ち、第8実施形態に係る画像生成システム10は、第1実施形態の構成(
図2参照)に加えて、摂動画像生成部170を更に備えて構成されている。摂動画像生成部170は、上述したプロセッサ11(
図1参照)によって実現されてよい。
【0102】
摂動画像生成部170は、入力される画像に対して摂動を与えることにより、複数の摂動画像を生成可能に構成されている。摂動画像生成部170は、例えば画像の切り出し、縮小・拡大、回転、反転、色調変化等の処理によって摂動を与えることが可能に構成されている。摂動画像生成部170で生成される摂動画像の数は、固定であってもよいし、可変であってもよい。以下では、摂動画像生成部170が、M個(Mは自然数)の摂動画像を生成するものとして説明を進める。摂動画像生成部170がM個の摂動画像を生成したとすると、摂動画像生成部170からは、オリジナルの画像1つと摂動画像M枚との合計M+1個の画像が出力されることになる。
【0103】
摂動画像生成部170から出力されるM+1個の画像は、検出部110に出力される構成となっている。このため、第8実施形態に係る検出部110からは、M+1個の位置情報が出力されることになる。
【0104】
検出部110で検出されたM+1個の位置情報の各々は、取得部120に出力される構成となっている。ここで特に、第8実施形態に係る取得部120は、選択部122を有するように構成されている。選択部122は、M+1個の位置情報から、位置情報をランダムに1つ選択するものとして構成されている。M+1個の位置情報は、それぞれ別々の画像(即ち、摂動が付与された複数の画像)から検出されたものであるため、全体で見ると互いに誤差を有する情報となっている。よって、M+1個の位置情報からランダムに選択した位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部120は、選択部122が選択した位置情報を、摂動位置情報として生成部130に出力するように構成されている。
【0105】
(動作の流れ)
次に、第8実施形態に係る画像生成システム10の動作の流れについて、
図18を参照して説明する。
図18は、第8実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図18では、
図3、
図4及び
図14で示した処理と同様の処理に同一の符号を付している。
【0106】
図18に示すように、第8実施形態に係る画像生成システム10の動作が開始されると、まず摂動画像生成部170に画像が入力される(ステップS61)。画像が入力されると、摂動画像生成部170は、画像からM個の摂動画像を生成する(ステップ62)。
【0107】
続いて、検出部110は、M+1個(即ち、オリジナル1個+摂動画像M個)の画像から顔又は顔の特徴点の位置に関する位置情報をそれぞれ検出する(ステップS63)。この結果、M+1個の位置情報が検出される。
【0108】
続いて、選択部122が、M+1個の位置情報からランダムに1つの位置情報を選択する(ステップS64)。そして、生成部130が、ランダムに選択された位置情報(即ち、摂動位置情報)に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0109】
(技術的効果)
次に、第8実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0110】
図17及び
図18で説明したように、第8実施形態に係る画像生成システム10では、入力された画像からM個の摂動画像が生成されるため、M+1個の位置情報が検出される。そして、M+1個の位置情報からランダムに選択した位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、直接的に誤差を算出せずとも(例えば、第3実施形態や第4実施形態のように、摂動量を加算することなく)、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0111】
(第8実施形態の変形例)
次に、第8実施形態の変形例に係る画像生成システム10について、
図19及び
図20を参照して説明する。なお、第8実施形態の変形例に係る画像生成システム10は、上述した第8実施形態と一部の動作が異なるのみであり、その他の動作やシステム構成については、第8実施形態と同様であってよい。このため、以下では、既に説明した第8実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0112】
(機能的構成)
まず、
図19を参照しながら、第8実施形態の変形例に係る画像生成システム10の機能的構成について説明する。
図19は、第8実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。なお、
図19では、
図17で示した構成要素と同様のものに同一の符号を付している。
【0113】
図19に示すように、第8実施形態の変形例に係る画像生成システム10は、その機能を実現するための処理ブロックとして、検出部110と、取得部120と、生成部130と、確率分布推定部160と、摂動画像生成部170とを備えている。即ち、第8実施形態の変形例に係る画像生成システム10は、上述した第8実施形態の構成(
図17参照)に加えて、確率分布推定部160を更に備えて構成されている。確率分布推定部160は、上述したプロセッサ11(
図1参照)によって実現されてよい。
【0114】
確率分布推定部160は、M+1個の画像から検出されたM+1個の位置情報を所定の確率分布でフィッティングする処理を実行可能に構成されている。確率分布推定部160は、例えばN個の位置情報をガウス分布でフィッティングしてもよい。この場合、位置情報は、ガウスモデル平均+ガウスモデル偏差+乱数の式で表される値であってよい。
【0115】
確率分布推定部160のフィッティング処理の結果は、取得部120に出力される構成となっている。ここで特に、第8実施形態の変形例に係る取得部120は、サンプリング部123を有するように構成されている。サンプリング部123は、確率分布推定部160の処理結果として出力される確率分布から、1つの位置情報をサンプリングするものとして構成されている。このようにしてサンプリングされた位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部120は、サンプリング部123がサンプリングした位置情報を、摂動位置情報として生成部130に出力するように構成されている。
【0116】
(動作の流れ)
次に、第8実施形態の変形例に係る画像生成システム10の動作の流れについて、
図20を参照して説明する。
図20は、第8実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図20では、
図18で示した処理と同様の処理に同一の符号を付している。
【0117】
図20に示すように、第8実施形態の変形例に係る画像生成システム10の動作が開始されると、まず摂動画像生成部170に画像が入力される(ステップS61)。画像が入力されると、摂動画像生成部170は、画像からM個の摂動画像を生成する(ステップ62)。
【0118】
続いて、検出部110は、M+1個の画像(即ち、オリジナル1個+摂動画像M個)から顔又は顔の特徴点の位置に関する位置情報をそれぞれ検出する(ステップS63)。この結果、M+1個の位置情報が検出される。
【0119】
続いて、確率分布推定部160が、M+1個の位置情報を所定の確率分布でフィッティングする処理を実行する(ステップS65)。そして、サンプリング部123が、確率分布推定部160の処理結果として出力される確率分布から、1つの位置情報をサンプリングする(ステップS66)。
【0120】
続いて、生成部130が、サンプリングされた位置情報(即ち、摂動位置情報)に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0121】
(技術的効果)
次に、第8実施形態の変形例に係る画像生成システム10によって得られる技術的効果について説明する。
【0122】
図19及び
図20で説明したように、第8実施形態の変形例に係る画像生成システム10では、摂動画像生成部170によってM個の摂動画像が生成されるため、その結果としてM+1個の位置情報が検出される。そして、M+1個の位置情報を確率分布でフィッティングし、その分布からサンプリングされた位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、M+1個の位置情報から推定される確率分布から、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0123】
<第9実施形態>
第9実施形態に係る画像生成システム10について、
図21及び
図22を参照して説明する。なお、第9実施形態は、上述した第1から第8実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1から第8実施形態と同様であってよい。このため、以下では、第1から第8実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0124】
(機能的構成)
まず、
図21を参照しながら、第9実施形態に係る画像生成システム10の機能的構成について説明する。
図21は、第9実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、
図21では、
図2、
図15及び
図19で示した構成要素と同様のものに同一の符号を付している。
【0125】
図21に示すように、第9実施形態に係る画像生成システム10は、その機能を実現するための処理ブロックとして、検出部110と、取得部120と、生成部130とを備えている。ここで特に、第9実施形態に係る検出部110は、確率分布出力部111を有するように構成されている。また、第9実施形態に係る取得部120は、サンプリング部123を有するように構成されている。
【0126】
確率分布出力部111は、検出部110の出力結果を確率分布の形式で出力するものとして構成されている。よって、第9実施形態に係る検出部110は、画像から検出した顔又は顔の特徴点に関する位置情報を、確率分布の形式で出力可能とされている。第9実施形態に係る検出部110は、確率分布の形式で位置推定を行う検出器として構成されてもよい。確率分布の形式で位置推定を行う検出器では、例えば中央値や平均値、最頻値などの予めユーザが決めたルールに従い、決定論的に位置情報を推定すればよい。
【0127】
サンプリング部123は、確率分布出力部111から出力される確率分布から、1つの位置情報をサンプリングするものとして構成されている。このようにしてサンプリングされた位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部120は、サンプリング部123がサンプリングした位置情報を、摂動位置情報として生成部130に出力するように構成されている。
【0128】
(動作の流れ)
次に、第9実施形態に係る画像生成システム10の動作の流れについて、
図22を参照して説明する。
図22は、第9実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、
図22では、
図3及び
図4で示した処理と同様の処理に同一の符号を付している。
【0129】
図22に示すように、第9実施形態に係る画像生成システム10の動作が開始されると、まず検出部110に画像が入力される(ステップS11)。画像が入力されると、検出部110は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する(ステップS12)。
【0130】
続いて、確率分布出力部111は、検出部110の検出結果を確率分布の形式で出力する(ステップS71)。そして、サンプリング部123が、検出部110の検出結果として出力される確率分布から、1つの位置情報をサンプリングする(ステップS72)。
【0131】
続いて、生成部130が、サンプリングされた位置情報(即ち、摂動位置情報)に基づいて、顔を正規化する処理を実行する(ステップS21)。生成部130は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する(ステップS22)。
【0132】
(技術的効果)
次に、第9実施形態に係る画像生成システム10によって得られる技術的効果について説明する。
【0133】
図21及び
図22で説明したように、第9実施形態に係る画像生成システム10では、検出部110の検出結果が確率分布の形式で出力され、その分布からサンプリングされた位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、検出部110の検出結果である確率分布から、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。
【0134】
<第10実施形態>
第10実施形態に係る画像生成システムについて説明する。なお、第10実施形態は、上述した第1から第9実施形態に係る画像生成システムの具体的な適用例を説明するものであり、システム構成や動作の流れについては、第1から第9実施形態と同様であってよい。このため、以下では、上述した第1から第9実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。
【0135】
(訓練データの増強)
第10実施形態に係る画像生成システム10は、機械学習に用いる訓練データの増強に用いられてもよい。本実施形態に係る画像生成システム10によれば、訓練データに含まれる1つの画像から、異なる画像を新たに生成することができるため、訓練データに含まれる画像の数を増加させることが可能である。このようにして訓練データを増強すれば、汎化性及び頑健性を高めることができる。
【0136】
なお、訓練データを増強する手法として、画像切り出しや、縮小・拡大、回転等の処理を採用することも考えられるが、このようにして訓練データを増強したとしても、例えば顔正規化における位置変動の頑健性を高めることは難しい。
【0137】
しかるに本実施形態に係る画像生成システム10では、すでに説明したように、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与されている。よって、顔又は顔の特徴点の位置情報を用いる正規化処理における位置変動の頑健性を高めることが可能である。
【0138】
(敵対的生成ネットワークへの適用)
第10実施形態に係る画像生成システム10は、敵対的学習(Virtual Adversarial Training)に用いられてもよい。具体的には、画像生成システム10は、敵対的学習における敵対的例生成するものとして構成されてもよい。
【0139】
敵対的例を生成する場合は、学習データに対して機械による認識が困難になるように人工的な微小ノイズが付加される。しかしながら、生成されるデータが学習データの分布に沿っているかを考慮しなければ、実際には存在しえないノイジーなデータを生成してしまう場合がある。このようにして生成された敵対的例は、ニューラルネットワークの学習の改善に寄与するとは言えない。
【0140】
しかるに本実施形態に係る画像生成システム10では、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与される。よって、敵対的学習によって得られる特徴点位置に対する敵対的例と、画像生成システム10で取得される摂動位置情報とを組み合わせることで、、敵対的学習による効果を確実に高めることが可能となる。なお、上述した組み合わせの方法は平均や射影等、ベクトル/数列統合の既知の技術を用いてよい。
【0141】
(人物の照合)
第10実施形態に係る画像生成システム10は、人物の照合(いわゆる、顔認証)に適用することも可能である。例えば、本実施形態に係る画像生成システム10で生成される複数の画像(誤差に応じた摂動が与えられた画像)を用いることで、認証精度の低下を抑制することが可能である。
【0142】
人物の照合を行う場合、画像に対する顔の写り込み具合によって、正常な照合が行えないおそれがある。このような場合、例えば通常であれば認証すべき人物が認証されない、逆に認証すべきない人物が認証されてしまう事象が発生し得る。
【0143】
しかるに本実施形態に係る画像システム10では、1つの顔画像から、異なる顔画像を新たに生成することができる。よって、複数の顔画像を用いて(或いは、複数の顔画像から適切な1つの顔画像を選択して)人物の照合を行うことが可能となる。また、本実施形態では特に、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与される。よって、人物の照合に用いる特徴点の位置変動を考慮して、適切な画像を生成することができる。この結果、人物の照合による認証の精度を効果的に高めることが可能である。
【0144】
(照合精度の最大化)
人物の照合においては、特定の環境下で照合を行う際に、最も照合精度が高くなるような摂動量を計算するようにしてもよい。具体的には、誤差パラメータに0~1の係数を乗じて摂動量を算出するような場合に、照合精度を最大化できる係数を求めるようにすればよい。
【0145】
(特徴量の統合)
人物の照合においては、N個の特徴量を統合した統合特徴量を求めるようにしてもよい。具体的には、まず本実施形態に係る画像生成システム10により、N個の摂動位置情報からN個の顔正規化画像を生成する。そして、N個の顔正規化画像の各々に対して顔特徴量抽出を行いN個の特徴量を生成する。最後に、N個の特徴量から任意の特徴量統合手法を用いて、1つの統合特徴量を生成する。なお、特徴量統合手法としては、例えば、平均、ガウス推定等、既存の技術を適宜採用することができる。
【0146】
(照合画像の選択)
人物の照合においては、照合に利用する画像を選択可能にしてもよい。具体的には、生成した複数の顔正規化画像をディスプレイに表示し、それらをユーザ(即ち、認証される人物、或いはシステムの管理者等)に提示する。そして、ユーザに対して、提示された複数の顔正規化画像の中から認証に用いる画像を選択させればよい。この場合、画像に順位付けして、照合に適した画像であるほど上位に表示させるようにしてもよい。また、照合に適した所定数の画像のみを表示するようにしてもよい。なお、画像の表示に加えて、「目の位置がずれていませんか」のような文章表示を行い、ユーザから回答を得るようにしてもよい。
【0147】
(モンタージュ作成)
第10実施形態に係る画像生成システム10は、モンタージュの作成に利用することができる。モンタージュを作成する際には、顔の一部を少しずつ変動させていくことになるが、適切に変動させることができなければ効率的な作成は行えない。例えば、人間の顔としてあり得ないような変動を与えても、適切なモンタージュを生成することはできない。
【0148】
しかるに本実施形態に係る画像生成システム10では、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与される。このため、顔画像に対して、現実的に想定され得る適切な変動を与えることが可能となる。よって、本実施形態に係る画像生成システム10で生成された画像をモンタージュ作成に応用すれば、より効率的にモンタージュを作成することが可能となる。
【0149】
<付記>
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
【0150】
(付記1)
付記1に記載の画像生成システムは、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出する検出手段と、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得する取得手段と、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する生成手段とを備えることを特徴とする画像生成システムである。
【0151】
(付記2)
付記2に記載の画像生成システムは、前記生成手段は、前記新たな画像として、前記顔の位置、大きさ及び角度の少なくとも1つを前記摂動位置情報に基づいて調整した正規化画像を生成することを特徴とする付記1に記載の画像生成システムである。
【0152】
(付記3)
付記3に記載の画像生成システムは、前記誤差に応じた摂動量を算出する算出手段を更に備え、前記取得手段は、前記摂動量を前記位置情報に加算することで、前記摂動位置情報を取得することを特徴とする付記1又は2に記載の画像生成システムである。
【0153】
(付記4)
付記4に記載の画像生成システムは、前記算出手段は、ユーザが指定する前記誤差に応じて前記摂動量を算出することを特徴とする付記3に記載の画像生成システムである。
【0154】
(付記5)
付記5に記載の画像生成システムは、前記位置情報の正解データを有するテスト用画像を用いて、前記誤差を評価する誤差評価手段を更に備え、前記算出手段は、前記評価した誤差に応じて前記摂動量を算出することを特徴とする付記3に記載の画像生成システムである。
【0155】
(付記6)
付記6に記載の画像生成システムは、前記算出手段は、複数の前記位置情報の確率分布の偏差に応じて前記摂動量を算出することを特徴とする付記3に記載の画像生成システムである。
【0156】
(付記7)
付記6に記載の画像生成システムは、前記取得手段は、1つの前記検出手段で検出された複数の前記位置情報に基づいて、前記摂動位置情報を取得することを特徴とする付記1又は2に記載の画像生成システム。
【0157】
(付記8)
付記8に記載の画像生成システムは、前記取得手段は、異なる複数の前記検出手段で検出された複数の前記位置情報に基づいて、前記摂動位置情報を取得することを特徴とする付記7に記載の画像生成システムである。
【0158】
(付記9)
付記9に記載の画像生成システムは、複数の前記位置情報から確率分布を推定する確率分布推定手段を更に備え、前記取得手段は、前記推定された確率分布からのサンプリングにより、前記摂動位置情報を取得することを特徴とする付記7又は8に記載の画像生成システムである。
【0159】
(付記10)
付記10に記載の画像生成システムは、前記画像に摂動を与えて複数の摂動画像を生成する摂動画像生成手段を更に備え、前記取得手段は、前記複数の摂動画像の各々について検出された複数の前記位置情報に基づいて、前記摂動位置情報を取得することを特徴とする付記1又は2に記載の画像生成システムである。
【0160】
(付記11)
付記11に記載の画像生成システムは、前記検出手段は、前記位置情報を確率分布の形式で出力し、前記取得手段は、前記出力された確率分布からのサンプリングにより、前記摂動位置情報を取得することを特徴とする付記1又は2に記載の画像生成システムである。
【0161】
(付記12)
付記12に記載の画像生成方法は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成することを特徴とする画像生成方法である。
【0162】
(付記13)
付記13に記載の記録媒体は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する画像生成方法をコンピュータに実行させるコンピュータプログラムが記録されていることを特徴とする記録媒体である
【0163】
この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う画像生成システム、画像生成方法、及び記録媒体もまたこの開示の技術思想に含まれる。
【符号の説明】
【0164】
10 画像生成システム
11 プロセッサ
110 検出部
111 確率分布出力部
120 取得部
121 摂動加算部
122 選択部
123 サンプリング部
130 生成部
140 摂動量生成部
150 誤差評価部
160 確率分布推定部
170 摂動画像生成部