特許7593407 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7593407画像生成システム、画像生成方法、及び記録媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-11-25

(45)【発行日】2024-12-03

(54)【発明の名称】画像生成システム、画像生成方法、及び記録媒体

(51)【国際特許分類】

G06T 11/80 20060101AFI20241126BHJP

【ＦＩ】

G06T11/80 A

【請求項の数】 7

(21)【出願番号】P 2022551527

(86)(22)【出願日】2020-09-25

(86)【国際出願番号】 JP2020036345

(87)【国際公開番号】W WO2022064644

(87)【国際公開日】2022-03-31

【審査請求日】2023-03-08

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100104765

【弁理士】

【氏名又は名称】江上達夫

(74)【代理人】

【識別番号】100107331

【弁理士】

【氏名又は名称】中村聡延

(74)【代理人】

【識別番号】100131015

【弁理士】

【氏名又は名称】三輪浩誉

(72)【発明者】

【氏名】橋本博志

【審査官】橘高志

(56)【参考文献】

【文献】特開２００７－００４７６７（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１７／０３３００２８（ＵＳ，Ａ１）

【文献】特開２０１２－１７３８１２（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ１１／８０

(57)【特許請求の範囲】

【請求項1】

画像から顔又は前記顔の特徴点の位置に関する位置情報を検出する検出手段と、
前記位置情報に対して前記位置情報を検出する場合に生ずる誤差に応じた摂動量を算出する算出手段と、
前記摂動量を前記位置情報に加算することで、摂動位置情報を取得する取得手段と、
前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する生成手段と
を備えることを特徴とする画像生成システム。

【請求項2】

前記生成手段は、前記新たな画像として、前記顔の位置、大きさ及び角度の少なくとも１つを前記摂動位置情報に基づいて調整した正規化画像を生成することを特徴とする請求項１に記載の画像生成システム。

【請求項3】

前記算出手段は、ユーザが指定する前記誤差に応じて前記摂動量を算出することを特徴とする請求項１に記載の画像生成システム。

【請求項4】

前記位置情報の正解データを有するテスト用画像を用いて、前記誤差を評価する誤差評価手段を更に備え、
前記算出手段は、前記評価した誤差に応じて前記摂動量を算出することを特徴とする請求項１に記載の画像生成システム。

【請求項5】

前記算出手段は、複数の前記位置情報の確率分布の偏差に応じて前記摂動量を算出することを特徴とする請求項１に記載の画像生成システム。

【請求項6】

画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、
前記位置情報に対して前記位置情報を検出する場合に生ずる誤差に応じた摂動量を算出し、
前記摂動量を前記位置情報に加算することで、摂動位置情報を取得し、
前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する
ことを特徴とする画像生成方法。

【請求項7】

画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、
前記位置情報に対して前記位置情報を検出する場合に生ずる誤差に応じた摂動量を算出し、
前記摂動量を前記位置情報に加算することで、摂動位置情報を取得し、
前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する
画像生成方法をコンピュータに実行させるコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

この開示は、画像を生成する画像生成システム、画像生成方法、及び記録媒体の技術分野に関する。

【背景技術】

【0002】

この種のシステムとして、顔の特徴点に基づいて顔画像を生成するものが知られている。例えば特許文献１では、両目の位置が所定の基準位置に位置するように顔を正規化し、正規化した顔を含む画像を切り出す技術が開示されている。

【0003】

その他の関連する技術として、例えば特許文献２では、学習データから抽出した特徴を敵対的特徴として、ニューラルネットワークの学習を行う技術が開示されている。特許文献３では、登録された顔テンプレートと確率分布サンプルデータとに基づいて、顔画像の人物を特定する技術が開示されている。特許文献４では、顔画像を回転させることで摂動顔画像を生成する技術が開示されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２００７－２２６４２４号公報

【文献】国際公開第２０１８／１６７９００号

【文献】特開２００５－２０８８５０号公報

【文献】特開２０１７－１８２４５９号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

この開示は、上述した関連する技術を改善する。

【課題を解決するための手段】

【0006】

この開示の画像生成システムの一の態様は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出する検出手段と、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得する取得手段と、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する生成手段とを備える。

【0007】

この開示の画像生成方法の一の態様は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する。

【0008】

この開示の記録媒体の一の態様は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する画像生成方法をコンピュータに実行させるコンピュータプログラムが記録されている。

【図面の簡単な説明】

【0009】

【図1】第１実施形態に係る画像生成システムのハードウェア構成を示すブロック図である。

【図2】第１実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図3】第１実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図4】第２実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図5】第３実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図6】第３実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図7】第４実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図8】第４実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図9】第５実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図10】第５実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図11】第６実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図12】第６実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図13】第７実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図14】第７実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図15】第７実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。

【図16】第７実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。

【図17】第８実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図18】第８実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【図19】第８実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。

【図20】第８実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。

【図21】第９実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【図22】第９実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【発明を実施するための形態】

【0010】

以下、図面を参照しながら、画像生成システム、画像生成方法、及び記録媒体の実施形態について説明する。

【0011】

＜第１実施形態＞
第１実施形態に係る画像生成システムについて、図１から図３を参照して説明する。

【0012】

（ハードウェア構成）
まず、図１を参照しながら、第１実施形態に係る画像生成システムのハードウェア構成について説明する。図１は、第１実施形態に係る画像生成システムのハードウェア構成を示すブロック図である。

【0013】

図１に示すように、第１実施形態に係る画像生成システム１０は、プロセッサ１１と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１２と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１３と、記憶装置１４とを備えている。画像生成システム１０は更に、入力装置１５と、出力装置１６とを備えていてもよい。プロセッサ１１と、ＲＡＭ１２と、ＲＯＭ１３と、記憶装置１４と、入力装置１５と、出力装置１６とは、データバス１７を介して接続されている。

【0014】

プロセッサ１１は、コンピュータプログラムを読み込む。例えば、プロセッサ１１は、ＲＡＭ１２、ＲＯＭ１３及び記憶装置１４のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ１１は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ１１は、ネットワークインタフェースを介して、画像生成システム１０の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい（つまり、読み込んでもよい）。プロセッサ１１は、読み込んだコンピュータプログラムを実行することで、ＲＡＭ１２、記憶装置１４、入力装置１５及び出力装置１６を制御する。本実施形態では特に、プロセッサ１１が読み込んだコンピュータプログラムを実行すると、プロセッサ１１内には、入力される画像から新たな画像を生成するための機能ブロックが実現される。また、プロセッサ１１として、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＦＰＧＡ（ｆｉｅｌｄ－ｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ）、ＤＳＰ（Ｄｅｍａｎｄ－ＳｉｄｅＰｌａｔｆｏｒｍ）、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）のうち一つを用いてもよいし、複数を並列で用いてもよい。

【0015】

ＲＡＭ１２は、プロセッサ１１が実行するコンピュータプログラムを一時的に記憶する。ＲＡＭ１２は、プロセッサ１１がコンピュータプログラムを実行している際にプロセッサ１１が一時的に使用するデータを一時的に記憶する。ＲＡＭ１２は、例えば、Ｄ－ＲＡＭ（ＤｙｎａｍｉｃＲＡＭ）であってもよい。

【0016】

ＲＯＭ１３は、プロセッサ１１が実行するコンピュータプログラムを記憶する。ＲＯＭ１３は、その他に固定的なデータを記憶していてもよい。ＲＯＭ１３は、例えば、Ｐ－ＲＯＭ（ＰｒｏｇｒａｍｍａｂｌｅＲＯＭ）であってもよい。

【0017】

記憶装置１４は、画像生成システム１０が長期的に保存するデータを記憶する。記憶装置１４は、プロセッサ１１の一時記憶装置として動作してもよい。記憶装置１４は、例えば、ハードディスク装置、光磁気ディスク装置、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。

【0018】

入力装置１５は、画像生成システム１０のユーザからの入力指示を受け取る装置である。入力装置１５は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。

【0019】

出力装置１６は、画像生成システム１０に関する情報を外部に対して出力する装置である。例えば、出力装置１６は、画像生成システム１０に関する情報を表示可能な表示装置（例えば、ディスプレイ）であってもよい。

【0020】

（機能的構成）
次に、図２を参照しながら、第１実施形態に係る画像生成システム１０の機能的構成について説明する。図２は、第１実施形態に係る画像生成システムの機能的構成を示すブロック図である。

【0021】

図２に示すように、第１実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部１１０と、取得部１２０と、生成部１３０とを備えている。なお、検出部１１０、取得部１２０、生成部１３０の各々は、例えば上述したプロセッサ１１（図１参照）によって実現されてよい。

【0022】

検出部１１０は、入力される画像から顔又は顔の特徴点の位置に関する位置情報を検出可能に構成されている。顔の特徴点は、顔の特徴を表す点であり、例えば目、耳、鼻、口等の特定の部位に対応するものとして設定される。どの部位を特徴点とするかについては、例えばシステム管理者等によって適宜設定可能とされてよい。検出部１１０は、顔の位置に関する位置情報と、顔の特徴点の位置に関する位置情報とを両方検出してもよい。この場合、検出部１１０は、顔の位置に関する位置情報を検出するものと、顔の特徴点の位置に関する位置情報を検出するものとを、別々に備えるように構成されてもよい（例えば、２つの独立する検出部１１０として構成されてもよい）。また、検出部１１０は、まず顔の位置に関する位置情報を検出し、検出した顔の位置に関する位置情報に基づいて、顔の特徴点の位置に関する位置情報を検出するように構成されてもよい。位置情報は、例えば座標情報であってもよいし、ベクトル情報であってもよい。検出部１１０は、例えばニューラルネットワークとして構成されてもよい。検出部１１０による位置情報の具体的な検出方法については、既存の技術を適宜採用できるため、ここでの詳しい説明は省略する。検出部１１０で検出された位置情報は、取得部１２０に出力される構成となっている。

【0023】

取得部１２０は、検出部１１０で検出された位置情報に対して誤差を加味した摂動位置情報を取得可能に構成されている。ここでの「誤差」とは、検出部１１０で位置情報を検出する場合に生ずる誤差（即ち、検出誤差）である。摂動位置情報は、検出部１１０で検出された位置情報と比較すると、誤差に応じた摂動を有する情報となっている。なお、複数の特徴点に対して誤差を加味する場合、すべての特徴点に対して誤差を加味してもよいし、一部の特徴点にのみ誤差を加味してもよい。一部の特徴点にのみ誤差を加味する場合、誤差を加味する特徴点は、過去の履歴等から自動的に決定してもよいし、ユーザに指定させてもよい。位置情報に誤差を加味する具体的な手法については、後述する他の実施形態において詳しく説明する。なお、誤差を加味する手法は、すべての特徴点に対して共通であってもよいし、特徴点毎に異なる手法が採用されてもよい。取得部１２０で取得された摂動位置情報は、生成部１３０に出力される構成となっている。

【0024】

生成部１３０は、取得部１２０で取得された摂動位置情報に基づいて、顔を含む新たな画像を生成可能に構成されている。生成部１３０で生成される新たな画像は、摂動位置情報に基づいて生成されるため、誤差に応じた摂動を有する画像となる。このため、検出部１１０に入力される画像と、生成部１３０で生成される新たな画像との間には、誤差に応じた差異が生ずることになる。なお、位置情報から画像を生成するための具体的な手法については、既存の技術を適宜採用できるため、ここでの詳しい説明は省略する。生成部１３０は、生成した新たな画像を出力する機能を有している。生成部１３０は、例えばディスプレイを有する表示部に生成した新たな画像を出力して表示させるように構成されてもよい。

【0025】

（動作の流れ）
次に、図３を参照しながら、第１実施形態に係る画像生成システム１０の動作の流れについて説明する。図３は、第１実施形態に係る画像生成システムの動作の流れを示すフローチャートである。

【0026】

図３に示すように、第１実施形態に係る画像生成システム１０の動作が開始されると、まず検出部１１０に画像が入力される（ステップＳ１１）。画像が入力されると、検出部１１０は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ１２）。

【0027】

続いて、取得部１２０が、位置情報に対して誤差を加味した摂動位置情報を取得する（ステップＳ１３）。そして、生成部１３０が、摂動位置情報に基づいて、顔を含む新たな画像を生成する（ステップＳ１４）。生成部１３０は、生成した新たな画像を出力する（ステップＳ１５）。

【0028】

（技術的効果）
次に、第１実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0029】

図１から図３で説明したように、第１実施形態に係る画像生成システム１０では、検出する際の誤差を加味した摂動位置情報に基づいて、新たな顔画像が生成される。よって、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を生成することが可能である。

【0030】

＜第２実施形態＞
第２実施形態に係る画像生成システム１０について、図４を参照して説明する。なお、第２実施形態は、上述した第１実施形態一部の動作が異なるのみであり、システム構成等については第１実施形態と同様であってよい（図１及び図２参照）。このため、以下では、第１実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0031】

（動作の流れ）
まず、図４を参照しながら、第２実施形態に係る画像生成システム１０の動作の流れについて説明する。図４は、第２実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図４では、図３で示した処理と同様の処理に同一の符号を付している。

【0032】

図４に示すように、第１実施形態に係る画像生成システム１０の動作が開始されると、まず検出部１１０に画像が入力される（ステップＳ１１）。画像が入力されると、検出部１１０は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ１２）。

【0033】

続いて、取得部１２０が、位置情報に対して誤差を加味した摂動位置情報を取得する（ステップＳ１３）。そして、生成部１３０が、摂動位置情報に基づいて、顔を正規化する処理を実行する（ステップＳ２１）。生成部１３０は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する（ステップＳ２２）。

【0034】

（顔正規化）
次に、第２実施形態に係る画像生成システム１０で実行される顔正規化の処理について、より具体的に説明する。

【0035】

顔正規化は、顔の位置、大きさ及び角度の少なくとも１つを位置情報に基づいて調整することで実現される。顔正規化は、例えば目、鼻、口等の顔の特徴点の位置が所定の位置となるように、顔の位置や、大きさ、角度を適宜調整することで実現される。顔正規化には、例えば、画像の拡大・縮小、回転、２Ｄ／３Ｄ変換等の画像処理技術が用いられてよい。顔正規化には、ここで挙げていない既存の技術を適宜採用することもできる。

【0036】

（技術的効果）
次に、第２実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0037】

図４で説明したように、第２実施形態に係る画像生成システム１０では、新たな画像として、顔を正規化した顔正規化画像が生成される。ここで本実施形態では特に、顔の正規化が摂動位置情報に基づいて行われる。これにより、誤差に応じた位置変動を含む正規化画像を生成することができる。

【0038】

以降の実施形態では、第２実施形態と同様に、生成部１３０が顔正規化画像を生成する構成を例にして説明を進める。

【0039】

＜第３実施形態＞
第３実施形態に係る画像生成システム１０について、図５及び図６を参照して説明する。なお、第３実施形態は、上述した第１及び第２実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第１及び第２実施形態と同様であってよい。このため、以下では、第１及び第２実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0040】

（機能的構成）
まず、図５を参照しながら、第３実施形態に係る画像生成システム１０の機能的構成について説明する。図５は、第３実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、図５では、図２で示した構成要素と同様のものに同一の符号を付している。

【0041】

図５に示すように、第３実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部１１０と、取得部１２０と、生成部１３０と、摂動量生成部１４０とを備えている。即ち、第３実施形態に係る画像生成システム１０は、第１実施形態の構成（図２参照）に加えて、摂動量生成部１４０を更に備えて構成されている。摂動量生成部１４０は、上述したプロセッサ１１（図１参照）によって実現されてよい。

【0042】

摂動量生成部１４０は、誤差パラメータ（即ち、誤差の大きさを示す値）に応じて摂動量を生成可能に構成されている。摂動量生成部１４０は、例えば誤差パラメータに所定の乱数を乗ずることで摂動量を生成するようにしてもよい。この場合の乱数は、正規分布（例えば、平均０、分散１の正規分布）による乱数生成器等を用いて生成されてよい。また、誤差パラメータは、ユーザが指定する値であってよい。摂動量生成部１４０で生成された摂動量は、取得部１２０の摂動加算部１２１に出力される構成となっている。

【0043】

摂動加算部１２１は、検出部１１０で検出された顔又は顔の特徴量の位置を示すパラメータ（即ち、位置情報）に、摂動量を加算する処理を実行可能に構成されている。摂動加算部１２１は、摂動量をそのまま加算する処理を実行してもよいし、摂動量に所定の係数を乗じてから加算する処理を実行してもよい。取得部１２０は、摂動加算部１２１による加算処理の結果を摂動位置情報として取得する。

【0044】

（動作の流れ）
次に、第３実施形態に係る画像生成システム１０の動作の流れについて、図６を参照して説明する。図６は、第３実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図６では、図３及び図４で示した処理と同様の処理に同一の符号を付している。

【0045】

図６に示すように、第３実施形態に係る画像生成システム１０の動作が開始されると、まず検出部１１０に画像が入力される（ステップＳ１１）。画像が入力されると、検出部１１０は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ１２）。

【0046】

続いて、摂動量生成部１４０が、摂動量を生成するための乱数を生成する（ステップＳ３１）。そして、摂動量生成部１４０は、生成した乱数と誤差パラメータから摂動量を生成する（ステップＳ３２）。

【0047】

続いて、摂動加算部１２１が、検出部１１０で検出された位置情報に摂動量を加算して、摂動位置情報を取得する（ステップＳ３３）。そして、生成部１３０が、摂動位置情報に基づいて、顔を正規化する処理を実行する（ステップＳ２１）。生成部１３０は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する（ステップＳ２２）。

【0048】

（技術的効果）
次に、第３実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0049】

図５及び図６で説明したように、第３実施形態に係る画像生成システム１０では、誤差パラメータに基づいて摂動量が生成される。そして、その摂動量が検出された位置情報に加算されることで摂動位置情報が取得される。このようにすれば、誤差を加味した摂動位置情報を適切に取得することができる。従って、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0050】

＜第４実施形態＞
第４実施形態に係る画像生成システム１０について、図７及び図８を参照して説明する。なお、第４実施形態は、上述した第１から第３実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第１から第３実施形態と同様であってよい。このため、以下では、第１から第３実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0051】

（機能的構成）
まず、図７を参照しながら、第４実施形態に係る画像生成システム１０の機能的構成について説明する。図７は、第４実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、図７では、図２及び図５で示した構成要素と同様のものに同一の符号を付している。

【0052】

図７に示すように、第４実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部１１０と、取得部１２０と、生成部１３０と、摂動量生成部１４０と、誤差評価部１５０とを備えている。即ち、第４実施形態に係る画像生成システム１０は、第３実施形態の構成（図５参照）に加えて、誤差評価部１５０を更に備えて構成されている。誤差評価部１５０は、上述したプロセッサ１１（図１参照）によって実現されてよい。

【0053】

誤差評価部１５０は、誤差評価用のテストデータを用いて誤差を評価する（即ち、位置情報を検出する際に生ずる誤差を見積もる）ことが可能に構成されている。テストデータは、位置情報に関する正解データを有するデータである。誤差評価部１５０は、テストデータから検出された位置情報と、正解データとの乖離量に基づき、誤差を統計的な手法で評価してよい。具体的な誤差の評価手法については、既存の技術を適宜採用することができるが、その一例として、平均絶対誤差（ＭＡＥ：ＭｅａｎＡｂｓｏｌｕｔｅＥｒｒｏｒ）が挙げられる。誤差評価部１５０の評価結果は、誤差パラメータとして摂動量生成部１４０に出力される構成となっている。即ち、本実施形態では、誤差評価部１５０で評価された誤差パラメータに基づいて摂動量が生成されることになる。

【0054】

（動作の流れ）
次に、第４実施形態に係る画像生成システム１０の動作の流れについて、図８を参照して説明する。図８は、第４実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図８では、図３、図４、及び図６で示した処理と同様の処理に同一の符号を付している。

【0055】

図８に示すように、第４実施形態に係る画像生成システム１０の動作が開始されると、まず検出部１１０に画像が入力される（ステップＳ１１）。画像が入力されると、検出部１１０は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ１２）。

【0056】

続いて、摂動量生成部１４０が、摂動量を生成するための乱数を生成する（ステップＳ３１）。そして、摂動量生成部１４０は、生成した乱数と誤差評価部１５０で評価された誤差パラメータから摂動量を生成する（ステップＳ４１）。なお、誤差評価部１５０による誤差評価は、図８に示す一連の処理が開始される前に別途実行されていればよい。ただし、誤差評価部１５０による誤差評価は、図８に示す一連の処理が開始された後、ステップＳ４１の処理が実行される前までに実行されるようにしてもよい。

【0057】

【0058】

（技術的効果）
次に、第４実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0059】

図７及び図８で説明したように、第４実施形態に係る画像生成システム１０では、テストデータを用いた誤差評価の結果である誤差パラメータに基づいて摂動量が生成される。そして、その摂動量が検出された位置情報に加算されることで摂動位置情報が取得される。このようにすれば、誤差を加味した摂動位置情報を適切に取得することができる。従って、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0060】

なお、上述した第３実施形態及び第４実施形態は、互いに組み合わせることも可能である。例えば、ユーザが指定した誤差パラメータと、誤差評価部１５０から出力された誤差パラメータとの両方を統合して統合誤差パラメータとし、その統合誤差パラメータから摂動量を生成するようにしてもよい。統合誤差パラメータは、例えば各誤差パラメータの平均値であってよい。また、ユーザが指定した誤差パラメータと、誤差評価部１５０から出力された誤差パラメータとを選択的に利用するようにしてもよい。即ち、ユーザが指定した誤差パラメータから生成された摂動量と、誤差評価部１５０から出力された誤差パラメータから生成された摂動量とのうち、選択された一方を加算して摂動位置情報を取得するようにしてもよい。この場合、摂動量の選択はシステムが自動的に行うようにしてもよいし、ユーザに選択させるようにしてもよい。

【0061】

＜第５実施形態＞
第５実施形態に係る画像生成システム１０について、図９及び図１１を参照して説明する。なお、第５実施形態は、上述した第１から第４実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第１から第４実施形態と同様であってよい。このため、以下では、第１から第４実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0062】

（機能的構成）
まず、図９を参照しながら、第５実施形態に係る画像生成システム１０の機能的構成について説明する。図９は、第５実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、図９では、図５及び図７で示した構成要素と同様のものに同一の符号を付している。

【0063】

図９に示すように、第５実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部１１０と、取得部１２０と、生成部１３０と、摂動量生成部１４０とを備えている。即ち、第５実施形態に係る画像生成システム１０は、第３実施形態の構成（図５参照）と同様の要素を備えて構成されている。ただし、第５実施形態に係る摂動量生成部１４０には、確率分布の偏差が入力されるように構成されている。確率分布の偏差は、例えばガウス分布の偏差であってよい。摂動量生成部１４０は、入力される確率分布の偏差に基づいて摂動量を生成可能に構成されている。例えば、摂動量生成部１４０は、確率分布の偏差に乱数を乗ずることで、摂動量を生成してもよい。

【0064】

（動作の流れ）
次に、第５実施形態に係る画像生成システム１０の動作の流れについて、図１０を参照して説明する。図１０は、第５実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図１０では、図６及び図８で示した処理と同様の処理に同一の符号を付している。

【0065】

図１０に示すように、第５実施形態に係る画像生成システム１０の動作が開始されると、まず検出部１１０に画像が入力される（ステップＳ１１）。画像が入力されると、検出部１１０は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ１２）。

【0066】

続いて、摂動量生成部１４０が、摂動量を生成するための乱数を生成する（ステップＳ３１）。そして、摂動量生成部１４０は、生成した乱数と確率分布の偏差から摂動量を生成する（ステップＳ４２）。

【0067】

続いて、摂動加算部１２１が、検出部１１０で検出された位置情報に摂動量を加算して（ステップＳ３３）、摂動位置情報を取得する。そして、生成部１３０が、摂動位置情報に基づいて、顔を正規化する処理を実行する（ステップＳ２１）。生成部１３０は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する（ステップＳ２２）。

【0068】

（技術的効果）
次に、第５実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0069】

図９及び図１０で説明したように、第５実施形態に係る画像生成システム１０では、確率分布の偏差に基づいて摂動量が生成される。そして、検出された位置情報にその摂動量が加算されることで摂動位置情報が取得される。このようにすれば、誤差を加味した摂動位置情報を適切に取得することができる。従って、入力される画像から、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である

【0070】

＜第６実施形態＞
第６実施形態に係る画像生成システム１０について、図１１及び図１２を参照して説明する。なお、第６実施形態は、上述した第１から第５実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第１から第５実施形態と同様であってよい。このため、以下では、第１から第５実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0071】

（機能的構成）
まず、図１１を参照しながら、第６実施形態に係る画像生成システム１０の機能的構成について説明する。図１１は、第６実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、図１１では、図２で示した構成要素と同様のものに同一の符号を付している。

【0072】

図１１に示すように、第６実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロック又は物理的な処理回路として、検出部１１０と、取得部１２０と、生成部１３０とを備えている。ただし、第６実施形態の検出部１１０は、（所定の時間内や、所定の操作が行われているとき、所定の第１の操作が行われてから所定の第２の操作が行われるまで等の）所定の期間においてｎ回（ｎは自然数）の検出を行い、ｎ個の位置情報を出力可能に構成されている。ｎ個の位置情報は、順次出力されてもよいし、ｎ個まとめて出力されてもよい。

【0073】

検出部１１０で検出されたｎ個の位置情報の各々は、取得部１２０に出力される構成となっている。ここで特に、第６実施形態に係る取得部１２０は、選択部１２２を有するように構成されている。選択部１２２は、検出部１１０で検出されたｎ個の位置情報から、位置情報をランダムに１つ選択するものとして構成されている。ｎ個の位置情報は、それぞれ別々のタイミングで検出されたものであるため、全体で見ると互いに誤差を有する情報となっている。よって、ｎ個の位置情報からランダムに選択した位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部１２０は、選択部１２２が選択した位置情報を、摂動位置情報として生成部１３０に出力するように構成されている。

【0074】

（動作の流れ）
次に、第６実施形態に係る画像生成システム１０の動作の流れについて、図１２を参照して説明する。図１２は、第６実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図１２では、図３及び図４で示した処理と同様の処理に同一の符号を付している。

【0075】

図１２に示すように、第６実施形態に係る画像生成システム１０の動作が開始されると、まず検出部１１０に画像が入力される（ステップＳ１１）。画像が入力されると、検出部１１０が、画像から顔又は顔の特徴点の位置に関する位置情報をｎ回検出する（ステップＳ５０）。この結果、検出部１１０からはｎ個の位置情報が検出される。

【0076】

続いて、選択部１２２が、ｎ個の位置情報からランダムに１つの位置情報を選択する（ステップＳ５２）。そして、生成部１３０が、ランダムに選択された位置情報（即ち、摂動位置情報）に基づいて、顔を正規化する処理を実行する（ステップＳ２１）。生成部１３０は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する（ステップＳ２２）。

【0077】

（技術的効果）
次に、第６実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0078】

図１１及び図１２で説明したように、第６実施形態に係る画像生成システム１０では、検出部１１０によってｎ個の位置情報が検出される。そして、ｎ個の位置情報からランダムに選択した位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、直接的に誤差を算出せずとも（例えば、第３実施形態から第５実施形態のように、摂動量を加算することなく）、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0079】

＜第７実施形態＞
第７実施形態に係る画像生成システム１０について、図１３及び図１４を参照して説明する。なお、第７実施形態は、上述した第１から第６実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第１から第６実施形態と同様であってよい。このため、以下では、第１から第６実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0080】

（機能的構成）
まず、図１３を参照しながら、第７実施形態に係る画像生成システム１０の機能的構成について説明する。図１３は、第７実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、図１３では、図２及び図１１で示した構成要素と同様のものに同一の符号を付している。

【0081】

図１３に示すように、第７実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロック又は物理的な処理回路として、複数の検出部１１０と、取得部１２０と、生成部１３０とを備えている。即ち、第７実施形態に係る画像生成システム１０は、第６実施形態の構成（図１１参照）と比較して、独立した複数の検出部１１０を備えている点が異なる。なお、図１３では、便宜上３つの検出部１１０を図示しているが、第７実施形態に係る画像生成システム１０は、３つ以上の検出部１１０を備えていてもよい。以下では、第７実施形態に係る画像生成システム１０が、Ｎ個（Ｎは自然数）の検出部１１０を備えているものとして説明を進める。

【0082】

上述したＮ個の検出部１１０で検出された位置情報の各々は、取得部１２０に出力される構成となっている。ここで特に、第７実施形態に係る取得部１２０は、選択部１２２を有するように構成されている。選択部１２２は、Ｎ個の検出部１１０で検出されたＮ個の位置情報から、位置情報をランダムに１つ選択するものとして構成されている。なお、Ｎ個の検出部１１０が、上述した第６実施形態のようにｎ回の検出を行う場合には、Ｎ×ｎ個の位置情報から、位置情報をランダムに１つ選択するようにすればよい。Ｎ個の位置情報は、それぞれ別々の検出部１１０で検出されたものであるため、全体で見ると互いに誤差を有する情報となっている。よって、別々の検出部１１０で検出されたＮ個の位置情報からランダムに選択した位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部１２０は、選択部１２２が選択した位置情報を、摂動位置情報として生成部１３０に出力するように構成されている。

【0083】

（動作の流れ）
次に、第７実施形態に係る画像生成システム１０の動作の流れについて、図１４を参照して説明する。図１４は、第７実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図１４では、図３及び図４で示した処理と同様の処理に同一の符号を付している。

【0084】

図１４に示すように、第７実施形態に係る画像生成システム１０の動作が開始されると、まずＮ個の検出部１１０の各々に画像が入力される（ステップＳ１１）。画像が入力されると、Ｎ個の検出部１１０の各々が、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ５１）。この結果、Ｎ個の位置情報が検出される。

【0085】

続いて、選択部１２２が、Ｎ個の位置情報からランダムに１つの位置情報を選択する（ステップＳ５２）。そして、生成部１３０が、ランダムに選択された位置情報（即ち、摂動位置情報）に基づいて、顔を正規化する処理を実行する（ステップＳ２１）。生成部１３０は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する（ステップＳ２２）。

【0086】

（技術的効果）
次に、第７実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0087】

図１３及び図１４で説明したように、第７実施形態に係る画像生成システム１０では、Ｎ個の独立した検出部１１０によってＮ個の位置情報が検出される。そして、Ｎ個の位置情報からランダムに選択した位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、直接的に誤差を算出せずとも（例えば、第３実施形態から第５実施形態のように、摂動量を加算することなく）、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0088】

（第７実施形態の変形例）
次に、第７実施形態の変形例に係る画像生成システム１０について、図１５及び図１６を参照して説明する。なお、第７実施形態の変形例に係る画像生成システム１０は、上述した第７実施形態と一部の動作が異なるのみであり、その他の動作やシステム構成については、第７実施形態と同様であってよい。このため、以下では、既に説明した第７実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0089】

（機能的構成）
まず、図１５を参照しながら、第７実施形態の変形例に係る画像生成システム１０の機能的構成について説明する。図１５は、第５実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。なお、図１５では、図１３で示した構成要素と同様のものに同一の符号を付している。

【0090】

図１５に示すように、第７実施形態の変形例に係る画像生成システム１０は、その機能を実現するための処理ブロックとして、複数の検出部１１０と、取得部１２０と、生成部１３０と、確率分布推定部１６０を備えている。即ち、第７実施形態の変形例に係る画像生成システム１０は、上述した第７実施形態の構成（図１３参照）に加えて、確率分布推定部１６０を更に備えて構成されている。確率分布推定部１６０は、上述したプロセッサ１１（図１参照）によって実現されてよい。

【0091】

確率分布推定部１６０は、Ｎ個の検出部１１０で検出されたＮ個の位置情報を所定の確率分布でフィッティングする処理を実行可能に構成されている。確率分布推定部１６０は、例えばＮ個の位置情報をガウス分布でフィッティングしてもよい。この場合、位置情報は、ガウスモデル平均＋ガウスモデル偏差×乱数の式で表される値であってよい。

【0092】

確率分布推定部１６０のフィッティング処理の結果は、取得部１２０に出力される構成となっている。ここで特に、第７実施形態の変形例に係る取得部１２０は、サンプリング部１２３を有するように構成されている。サンプリング部１２３は、確率分布推定部１６０の処理結果として出力される確率分布から、１つの位置情報をサンプリングするものとして構成されている。このようにしてサンプリングされた位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部１２０は、サンプリング部１２３がサンプリングした位置情報を、摂動位置情報として生成部１３０に出力するように構成されている。

【0093】

（動作の流れ）
次に、第７実施形態の変形例に係る画像生成システム１０の動作の流れについて、図１６を参照して説明する。図１６は、第５実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。なお、図１６では、図１３で示した処理と同様の処理に同一の符号を付している。

【0094】

図１６に示すように、第７実施形態の変形例に係る画像生成システム１０の動作が開始されると、まずＮ個の検出部１１０の各々に画像が入力される（ステップＳ１１）。画像が入力されると、Ｎ個の検出部１１０の各々が、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ５１）。この結果、Ｎ個の位置情報が検出される。

【0095】

続いて、確率分布推定部１６０が、Ｎ個の位置情報を所定の確率分布でフィッティングする処理を実行する（ステップＳ５５）。そして、サンプリング部１２３が、確率分布推定部１６０の処理結果として出力される確率分布から、１つの位置情報をサンプリングする（ステップＳ５６）。

【0096】

続いて、生成部１３０が、サンプリングされた位置情報（即ち、摂動位置情報）に基づいて、顔を正規化する処理を実行する（ステップＳ２１）。生成部１３０は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する（ステップＳ２２）。

【0097】

（技術的効果）
次に、第７実施形態の変形例に係る画像生成システム１０によって得られる技術的効果について説明する。

【0098】

図１５及び図１６で説明したように、第７実施形態の変形例に係る画像生成システム１０では、Ｎ個の独立した検出部１１０によってＮ個の位置情報が検出される。そして、Ｎ個の位置情報を確率分布でフィッティングし、その分布からサンプリングされた位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、Ｎ個の位置情報から推定される確率分布から、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0099】

＜第８実施形態＞
第８実施形態に係る画像生成システム１０について、図１７及び図１８を参照して説明する。なお、第８実施形態は、上述した第１から第７実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第１から第７実施形態と同様であってよい。このため、以下では、第１から第７実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0100】

（機能的構成）
まず、図１７を参照しながら、第８実施形態に係る画像生成システム１０の機能的構成について説明する。図１７は、第８実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、図１７では、図２及び図１３で示した構成要素と同様のものに同一の符号を付している。

【0101】

図１７に示すように、第８実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロックとして、検出部１１０と、取得部１２０と、生成部１３０と、摂動画像生成部１７０とを備えている。即ち、第８実施形態に係る画像生成システム１０は、第１実施形態の構成（図２参照）に加えて、摂動画像生成部１７０を更に備えて構成されている。摂動画像生成部１７０は、上述したプロセッサ１１（図１参照）によって実現されてよい。

【0102】

摂動画像生成部１７０は、入力される画像に対して摂動を与えることにより、複数の摂動画像を生成可能に構成されている。摂動画像生成部１７０は、例えば画像の切り出し、縮小・拡大、回転、反転、色調変化等の処理によって摂動を与えることが可能に構成されている。摂動画像生成部１７０で生成される摂動画像の数は、固定であってもよいし、可変であってもよい。以下では、摂動画像生成部１７０が、Ｍ個（Ｍは自然数）の摂動画像を生成するものとして説明を進める。摂動画像生成部１７０がＭ個の摂動画像を生成したとすると、摂動画像生成部１７０からは、オリジナルの画像１つと摂動画像Ｍ枚との合計Ｍ＋１個の画像が出力されることになる。

【0103】

摂動画像生成部１７０から出力されるＭ＋１個の画像は、検出部１１０に出力される構成となっている。このため、第８実施形態に係る検出部１１０からは、Ｍ＋１個の位置情報が出力されることになる。

【0104】

検出部１１０で検出されたＭ＋１個の位置情報の各々は、取得部１２０に出力される構成となっている。ここで特に、第８実施形態に係る取得部１２０は、選択部１２２を有するように構成されている。選択部１２２は、Ｍ＋１個の位置情報から、位置情報をランダムに１つ選択するものとして構成されている。Ｍ＋１個の位置情報は、それぞれ別々の画像（即ち、摂動が付与された複数の画像）から検出されたものであるため、全体で見ると互いに誤差を有する情報となっている。よって、Ｍ＋１個の位置情報からランダムに選択した位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部１２０は、選択部１２２が選択した位置情報を、摂動位置情報として生成部１３０に出力するように構成されている。

【0105】

（動作の流れ）
次に、第８実施形態に係る画像生成システム１０の動作の流れについて、図１８を参照して説明する。図１８は、第８実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図１８では、図３、図４及び図１４で示した処理と同様の処理に同一の符号を付している。

【0106】

図１８に示すように、第８実施形態に係る画像生成システム１０の動作が開始されると、まず摂動画像生成部１７０に画像が入力される（ステップＳ６１）。画像が入力されると、摂動画像生成部１７０は、画像からＭ個の摂動画像を生成する（ステップ６２）。

【0107】

続いて、検出部１１０は、Ｍ＋１個（即ち、オリジナル１個＋摂動画像Ｍ個）の画像から顔又は顔の特徴点の位置に関する位置情報をそれぞれ検出する（ステップＳ６３）。この結果、Ｍ＋１個の位置情報が検出される。

【0108】

続いて、選択部１２２が、Ｍ＋１個の位置情報からランダムに１つの位置情報を選択する（ステップＳ６４）。そして、生成部１３０が、ランダムに選択された位置情報（即ち、摂動位置情報）に基づいて、顔を正規化する処理を実行する（ステップＳ２１）。生成部１３０は、正規化した顔を含む画像である顔正規化画像を新たな画像として出力する（ステップＳ２２）。

【0109】

（技術的効果）
次に、第８実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0110】

図１７及び図１８で説明したように、第８実施形態に係る画像生成システム１０では、入力された画像からＭ個の摂動画像が生成されるため、Ｍ＋１個の位置情報が検出される。そして、Ｍ＋１個の位置情報からランダムに選択した位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、直接的に誤差を算出せずとも（例えば、第３実施形態や第４実施形態のように、摂動量を加算することなく）、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0111】

（第８実施形態の変形例）
次に、第８実施形態の変形例に係る画像生成システム１０について、図１９及び図２０を参照して説明する。なお、第８実施形態の変形例に係る画像生成システム１０は、上述した第８実施形態と一部の動作が異なるのみであり、その他の動作やシステム構成については、第８実施形態と同様であってよい。このため、以下では、既に説明した第８実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0112】

（機能的構成）
まず、図１９を参照しながら、第８実施形態の変形例に係る画像生成システム１０の機能的構成について説明する。図１９は、第８実施形態の変形例に係る画像生成システムの機能的構成を示すブロック図である。なお、図１９では、図１７で示した構成要素と同様のものに同一の符号を付している。

【0113】

図１９に示すように、第８実施形態の変形例に係る画像生成システム１０は、その機能を実現するための処理ブロックとして、検出部１１０と、取得部１２０と、生成部１３０と、確率分布推定部１６０と、摂動画像生成部１７０とを備えている。即ち、第８実施形態の変形例に係る画像生成システム１０は、上述した第８実施形態の構成（図１７参照）に加えて、確率分布推定部１６０を更に備えて構成されている。確率分布推定部１６０は、上述したプロセッサ１１（図１参照）によって実現されてよい。

【0114】

確率分布推定部１６０は、Ｍ＋１個の画像から検出されたＭ＋１個の位置情報を所定の確率分布でフィッティングする処理を実行可能に構成されている。確率分布推定部１６０は、例えばＮ個の位置情報をガウス分布でフィッティングしてもよい。この場合、位置情報は、ガウスモデル平均＋ガウスモデル偏差＋乱数の式で表される値であってよい。

【0115】

確率分布推定部１６０のフィッティング処理の結果は、取得部１２０に出力される構成となっている。ここで特に、第８実施形態の変形例に係る取得部１２０は、サンプリング部１２３を有するように構成されている。サンプリング部１２３は、確率分布推定部１６０の処理結果として出力される確率分布から、１つの位置情報をサンプリングするものとして構成されている。このようにしてサンプリングされた位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部１２０は、サンプリング部１２３がサンプリングした位置情報を、摂動位置情報として生成部１３０に出力するように構成されている。

【0116】

（動作の流れ）
次に、第８実施形態の変形例に係る画像生成システム１０の動作の流れについて、図２０を参照して説明する。図２０は、第８実施形態の変形例に係る画像生成システムの動作の流れを示すフローチャートである。なお、図２０では、図１８で示した処理と同様の処理に同一の符号を付している。

【0117】

図２０に示すように、第８実施形態の変形例に係る画像生成システム１０の動作が開始されると、まず摂動画像生成部１７０に画像が入力される（ステップＳ６１）。画像が入力されると、摂動画像生成部１７０は、画像からＭ個の摂動画像を生成する（ステップ６２）。

【0118】

続いて、検出部１１０は、Ｍ＋１個の画像（即ち、オリジナル１個＋摂動画像Ｍ個）から顔又は顔の特徴点の位置に関する位置情報をそれぞれ検出する（ステップＳ６３）。この結果、Ｍ＋１個の位置情報が検出される。

【0119】

続いて、確率分布推定部１６０が、Ｍ＋１個の位置情報を所定の確率分布でフィッティングする処理を実行する（ステップＳ６５）。そして、サンプリング部１２３が、確率分布推定部１６０の処理結果として出力される確率分布から、１つの位置情報をサンプリングする（ステップＳ６６）。

【0120】

【0121】

（技術的効果）
次に、第８実施形態の変形例に係る画像生成システム１０によって得られる技術的効果について説明する。

【0122】

図１９及び図２０で説明したように、第８実施形態の変形例に係る画像生成システム１０では、摂動画像生成部１７０によってＭ個の摂動画像が生成されるため、その結果としてＭ＋１個の位置情報が検出される。そして、Ｍ＋１個の位置情報を確率分布でフィッティングし、その分布からサンプリングされた位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、Ｍ＋１個の位置情報から推定される確率分布から、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0123】

＜第９実施形態＞
第９実施形態に係る画像生成システム１０について、図２１及び図２２を参照して説明する。なお、第９実施形態は、上述した第１から第８実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第１から第８実施形態と同様であってよい。このため、以下では、第１から第８実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0124】

（機能的構成）
まず、図２１を参照しながら、第９実施形態に係る画像生成システム１０の機能的構成について説明する。図２１は、第９実施形態に係る画像生成システムの機能的構成を示すブロック図である。なお、図２１では、図２、図１５及び図１９で示した構成要素と同様のものに同一の符号を付している。

【0125】

図２１に示すように、第９実施形態に係る画像生成システム１０は、その機能を実現するための処理ブロックとして、検出部１１０と、取得部１２０と、生成部１３０とを備えている。ここで特に、第９実施形態に係る検出部１１０は、確率分布出力部１１１を有するように構成されている。また、第９実施形態に係る取得部１２０は、サンプリング部１２３を有するように構成されている。

【0126】

確率分布出力部１１１は、検出部１１０の出力結果を確率分布の形式で出力するものとして構成されている。よって、第９実施形態に係る検出部１１０は、画像から検出した顔又は顔の特徴点に関する位置情報を、確率分布の形式で出力可能とされている。第９実施形態に係る検出部１１０は、確率分布の形式で位置推定を行う検出器として構成されてもよい。確率分布の形式で位置推定を行う検出器では、例えば中央値や平均値、最頻値などの予めユーザが決めたルールに従い、決定論的に位置情報を推定すればよい。

【0127】

サンプリング部１２３は、確率分布出力部１１１から出力される確率分布から、１つの位置情報をサンプリングするものとして構成されている。このようにしてサンプリングされた位置情報は、誤差を加味した摂動位置情報として用いることができる。取得部１２０は、サンプリング部１２３がサンプリングした位置情報を、摂動位置情報として生成部１３０に出力するように構成されている。

【0128】

（動作の流れ）
次に、第９実施形態に係る画像生成システム１０の動作の流れについて、図２２を参照して説明する。図２２は、第９実施形態に係る画像生成システムの動作の流れを示すフローチャートである。なお、図２２では、図３及び図４で示した処理と同様の処理に同一の符号を付している。

【0129】

図２２に示すように、第９実施形態に係る画像生成システム１０の動作が開始されると、まず検出部１１０に画像が入力される（ステップＳ１１）。画像が入力されると、検出部１１０は、画像から顔又は顔の特徴点の位置に関する位置情報を検出する（ステップＳ１２）。

【0130】

続いて、確率分布出力部１１１は、検出部１１０の検出結果を確率分布の形式で出力する（ステップＳ７１）。そして、サンプリング部１２３が、検出部１１０の検出結果として出力される確率分布から、１つの位置情報をサンプリングする（ステップＳ７２）。

【0131】

【0132】

（技術的効果）
次に、第９実施形態に係る画像生成システム１０によって得られる技術的効果について説明する。

【0133】

図２１及び図２２で説明したように、第９実施形態に係る画像生成システム１０では、検出部１１０の検出結果が確率分布の形式で出力され、その分布からサンプリングされた位置情報が、新たな画像を生成するための摂動位置情報として用いられる。このようにすれば、検出部１１０の検出結果である確率分布から、摂動位置情報を取得することができる。よって、誤差に応じた位置変動を含む新たな顔画像を適切に生成することが可能である。

【0134】

＜第１０実施形態＞
第１０実施形態に係る画像生成システムについて説明する。なお、第１０実施形態は、上述した第１から第９実施形態に係る画像生成システムの具体的な適用例を説明するものであり、システム構成や動作の流れについては、第１から第９実施形態と同様であってよい。このため、以下では、上述した第１から第９実施形態と異なる部分について詳しく説明し、他の重複する部分については適宜説明を省略するものとする。

【0135】

（訓練データの増強）
第１０実施形態に係る画像生成システム１０は、機械学習に用いる訓練データの増強に用いられてもよい。本実施形態に係る画像生成システム１０によれば、訓練データに含まれる１つの画像から、異なる画像を新たに生成することができるため、訓練データに含まれる画像の数を増加させることが可能である。このようにして訓練データを増強すれば、汎化性及び頑健性を高めることができる。

【0136】

なお、訓練データを増強する手法として、画像切り出しや、縮小・拡大、回転等の処理を採用することも考えられるが、このようにして訓練データを増強したとしても、例えば顔正規化における位置変動の頑健性を高めることは難しい。

【0137】

しかるに本実施形態に係る画像生成システム１０では、すでに説明したように、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与されている。よって、顔又は顔の特徴点の位置情報を用いる正規化処理における位置変動の頑健性を高めることが可能である。

【0138】

（敵対的生成ネットワークへの適用）
第１０実施形態に係る画像生成システム１０は、敵対的学習（ＶｉｒｔｕａｌＡｄｖｅｒｓａｒｉａｌＴｒａｉｎｉｎｇ）に用いられてもよい。具体的には、画像生成システム１０は、敵対的学習における敵対的例生成するものとして構成されてもよい。

【0139】

敵対的例を生成する場合は、学習データに対して機械による認識が困難になるように人工的な微小ノイズが付加される。しかしながら、生成されるデータが学習データの分布に沿っているかを考慮しなければ、実際には存在しえないノイジーなデータを生成してしまう場合がある。このようにして生成された敵対的例は、ニューラルネットワークの学習の改善に寄与するとは言えない。

【0140】

しかるに本実施形態に係る画像生成システム１０では、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与される。よって、敵対的学習によって得られる特徴点位置に対する敵対的例と、画像生成システム１０で取得される摂動位置情報とを組み合わせることで、、敵対的学習による効果を確実に高めることが可能となる。なお、上述した組み合わせの方法は平均や射影等、ベクトル／数列統合の既知の技術を用いてよい。

【0141】

（人物の照合）
第１０実施形態に係る画像生成システム１０は、人物の照合（いわゆる、顔認証）に適用することも可能である。例えば、本実施形態に係る画像生成システム１０で生成される複数の画像（誤差に応じた摂動が与えられた画像）を用いることで、認証精度の低下を抑制することが可能である。

【0142】

人物の照合を行う場合、画像に対する顔の写り込み具合によって、正常な照合が行えないおそれがある。このような場合、例えば通常であれば認証すべき人物が認証されない、逆に認証すべきない人物が認証されてしまう事象が発生し得る。

【0143】

しかるに本実施形態に係る画像システム１０では、１つの顔画像から、異なる顔画像を新たに生成することができる。よって、複数の顔画像を用いて（或いは、複数の顔画像から適切な１つの顔画像を選択して）人物の照合を行うことが可能となる。また、本実施形態では特に、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与される。よって、人物の照合に用いる特徴点の位置変動を考慮して、適切な画像を生成することができる。この結果、人物の照合による認証の精度を効果的に高めることが可能である。

【0144】

（照合精度の最大化）
人物の照合においては、特定の環境下で照合を行う際に、最も照合精度が高くなるような摂動量を計算するようにしてもよい。具体的には、誤差パラメータに０～１の係数を乗じて摂動量を算出するような場合に、照合精度を最大化できる係数を求めるようにすればよい。

【0145】

（特徴量の統合）
人物の照合においては、Ｎ個の特徴量を統合した統合特徴量を求めるようにしてもよい。具体的には、まず本実施形態に係る画像生成システム１０により、Ｎ個の摂動位置情報からＮ個の顔正規化画像を生成する。そして、Ｎ個の顔正規化画像の各々に対して顔特徴量抽出を行いＮ個の特徴量を生成する。最後に、Ｎ個の特徴量から任意の特徴量統合手法を用いて、１つの統合特徴量を生成する。なお、特徴量統合手法としては、例えば、平均、ガウス推定等、既存の技術を適宜採用することができる。

【0146】

（照合画像の選択）
人物の照合においては、照合に利用する画像を選択可能にしてもよい。具体的には、生成した複数の顔正規化画像をディスプレイに表示し、それらをユーザ（即ち、認証される人物、或いはシステムの管理者等）に提示する。そして、ユーザに対して、提示された複数の顔正規化画像の中から認証に用いる画像を選択させればよい。この場合、画像に順位付けして、照合に適した画像であるほど上位に表示させるようにしてもよい。また、照合に適した所定数の画像のみを表示するようにしてもよい。なお、画像の表示に加えて、「目の位置がずれていませんか」のような文章表示を行い、ユーザから回答を得るようにしてもよい。

【0147】

（モンタージュ作成）
第１０実施形態に係る画像生成システム１０は、モンタージュの作成に利用することができる。モンタージュを作成する際には、顔の一部を少しずつ変動させていくことになるが、適切に変動させることができなければ効率的な作成は行えない。例えば、人間の顔としてあり得ないような変動を与えても、適切なモンタージュを生成することはできない。

【0148】

しかるに本実施形態に係る画像生成システム１０では、顔又は顔の特徴点の位置情報を検出する際に生ずる誤差に応じた摂動が付与される。このため、顔画像に対して、現実的に想定され得る適切な変動を与えることが可能となる。よって、本実施形態に係る画像生成システム１０で生成された画像をモンタージュ作成に応用すれば、より効率的にモンタージュを作成することが可能となる。

【0149】

＜付記＞
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。

【0150】

（付記１）
付記１に記載の画像生成システムは、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出する検出手段と、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得する取得手段と、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する生成手段とを備えることを特徴とする画像生成システムである。

【0151】

（付記２）
付記２に記載の画像生成システムは、前記生成手段は、前記新たな画像として、前記顔の位置、大きさ及び角度の少なくとも１つを前記摂動位置情報に基づいて調整した正規化画像を生成することを特徴とする付記１に記載の画像生成システムである。

【0152】

（付記３）
付記３に記載の画像生成システムは、前記誤差に応じた摂動量を算出する算出手段を更に備え、前記取得手段は、前記摂動量を前記位置情報に加算することで、前記摂動位置情報を取得することを特徴とする付記１又は２に記載の画像生成システムである。

【0153】

（付記４）
付記４に記載の画像生成システムは、前記算出手段は、ユーザが指定する前記誤差に応じて前記摂動量を算出することを特徴とする付記３に記載の画像生成システムである。

【0154】

（付記５）
付記５に記載の画像生成システムは、前記位置情報の正解データを有するテスト用画像を用いて、前記誤差を評価する誤差評価手段を更に備え、前記算出手段は、前記評価した誤差に応じて前記摂動量を算出することを特徴とする付記３に記載の画像生成システムである。

【0155】

（付記６）
付記６に記載の画像生成システムは、前記算出手段は、複数の前記位置情報の確率分布の偏差に応じて前記摂動量を算出することを特徴とする付記３に記載の画像生成システムである。

【0156】

（付記７）
付記６に記載の画像生成システムは、前記取得手段は、１つの前記検出手段で検出された複数の前記位置情報に基づいて、前記摂動位置情報を取得することを特徴とする付記１又は２に記載の画像生成システム。

【0157】

（付記８）
付記８に記載の画像生成システムは、前記取得手段は、異なる複数の前記検出手段で検出された複数の前記位置情報に基づいて、前記摂動位置情報を取得することを特徴とする付記７に記載の画像生成システムである。

【0158】

（付記９）
付記９に記載の画像生成システムは、複数の前記位置情報から確率分布を推定する確率分布推定手段を更に備え、前記取得手段は、前記推定された確率分布からのサンプリングにより、前記摂動位置情報を取得することを特徴とする付記７又は８に記載の画像生成システムである。

【0159】

（付記１０）
付記１０に記載の画像生成システムは、前記画像に摂動を与えて複数の摂動画像を生成する摂動画像生成手段を更に備え、前記取得手段は、前記複数の摂動画像の各々について検出された複数の前記位置情報に基づいて、前記摂動位置情報を取得することを特徴とする付記１又は２に記載の画像生成システムである。

【0160】

（付記１１）
付記１１に記載の画像生成システムは、前記検出手段は、前記位置情報を確率分布の形式で出力し、前記取得手段は、前記出力された確率分布からのサンプリングにより、前記摂動位置情報を取得することを特徴とする付記１又は２に記載の画像生成システムである。

【0161】

（付記１２）
付記１２に記載の画像生成方法は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成することを特徴とする画像生成方法である。

【0162】

（付記１３）
付記１３に記載の記録媒体は、画像から顔又は前記顔の特徴点の位置に関する位置情報を検出し、前記位置情報に対して前記位置情報を検出する場合に生ずる誤差を加味した摂動位置情報を取得し、前記摂動位置情報に基づいて、前記顔を含む新たな画像を生成する画像生成方法をコンピュータに実行させるコンピュータプログラムが記録されていることを特徴とする記録媒体である

【0163】

この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う画像生成システム、画像生成方法、及び記録媒体もまたこの開示の技術思想に含まれる。

【符号の説明】

【0164】

１０画像生成システム
１１プロセッサ
１１０検出部
１１１確率分布出力部
１２０取得部
１２１摂動加算部
１２２選択部
１２３サンプリング部
１３０生成部
１４０摂動量生成部
１５０誤差評価部
１６０確率分布推定部
１７０摂動画像生成部

【図1】