(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-26
(45)【発行日】2024-12-04
(54)【発明の名称】画像重畳システム及び画像重畳方法
(51)【国際特許分類】
H04N 5/262 20060101AFI20241127BHJP
G06T 7/00 20170101ALI20241127BHJP
【FI】
H04N5/262
G06T7/00 660A
(21)【出願番号】P 2023531173
(86)(22)【出願日】2021-06-28
(86)【国際出願番号】 JP2021024421
(87)【国際公開番号】W WO2023275959
(87)【国際公開日】2023-01-05
【審査請求日】2023-10-06
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100164471
【氏名又は名称】岡野 大和
(74)【代理人】
【識別番号】100176728
【氏名又は名称】北村 慎吾
(72)【発明者】
【氏名】浦田 昌和
(72)【発明者】
【氏名】佐久間 聡
(72)【発明者】
【氏名】千明 裕
(72)【発明者】
【氏名】松井 龍也
(72)【発明者】
【氏名】鈴木 督史
(72)【発明者】
【氏名】岩本 秀明
【審査官】彦田 克文
(56)【参考文献】
【文献】特開2020-16961(JP,A)
【文献】特開2020-113061(JP,A)
【文献】特開2020-75080(JP,A)
【文献】特開2020-17136(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/262
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
第1の段階において撮像装置が利用者を撮像した撮像画像における顔領域をトリミングした顔領域画像を示す顔領域画像情報を生成し、前記第1の段階において前記撮像装置が重畳物を撮像した撮像画像における重畳物領域をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成する制御装置と、
前記顔領域画像に含まれる、前記利用者の顔画像を認識し、該顔画像を示す顔画像情報を生成する顔認識装置と、
前記重畳物領域画像に相当する重畳画像を認識する重畳物認識装置と、
前記第1の段階の後の第2の段階において前記撮像装置が前記利用者を撮像した撮像画像における、前記顔領域及び前記重畳物領域より大きい合成領域の画像である合成領域画像から、前記顔画像情報に基づいて、前記利用者の顔画像を検出し、該顔画像に、前記重畳画像を重畳した合成画像を示す合成画像情報を生成する合成装置と、
を備える画像重畳システム。
【請求項2】
前記制御装置は、前記顔画像に基づいて、前記重畳物領域を決定し、前記撮像画像における該重畳物領域をトリミングした前記重畳物領域画像を示す前記重畳物領域画像情報を生成する、請求項1に記載の画像重畳システム。
【請求項3】
第1の段階において撮像装置が利用者を撮像した撮像画像における顔領域をトリミングした顔領域画像を示す顔領域画像情報を生成するステップと、
前記第1の段階において、前記撮像装置が重畳物を撮像した撮像画像における重畳物領域をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成するステップと、
前記顔領域画像に含まれる、前記利用者の顔画像を認識し、該顔画像を示す顔画像情報を生成するステップと、
前記重畳物領域画像に相当する重畳画像を認識するステップと、
前記第1の段階の後の第2の段階において前記撮像装置が前記利用者を撮像した撮像画像における、前記顔領域及び前記重畳物領域より大きい合成領域の画像である合成領域画像から、前記顔画像情報に基づいて、前記利用者の顔画像を検出するステップと、
該顔画像に、前記重畳画像を重畳した合成画像を示す合成画像情報を生成するステップと、
を含む画像重畳方法。
【請求項4】
前記顔領域画像に含まれる前記顔画像に基づいて、前記重畳物領域を決定するステップをさらに含み、
前記重畳物領域画像情報を生成するステップは、前記撮像画像における該重畳物領域をトリミングした前記重畳物領域画像を示す前記重畳物領域画像情報を生成するステップを含む、請求項3に記載の画像重畳方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像重畳システム及び画像重畳方法に関する。
【背景技術】
【0002】
従来、カメラが被写体を撮像した画像から物体の像(物体が写った前景)を背景から分離する技術が知られている(特許文献1)。
【0003】
また、カメラが被写体を撮像した画像に他の画像を重畳して表示させるAR(Augmented Reality)重畳の技術が知られており、AR重畳の技術を用いた変身歌舞伎というサービスが提案されている(非特許文献1及び2)。
【0004】
変身歌舞伎のサービスで用いられる合成装置は、利用者を撮像した画像から顔画像を取得し、隈取のお面を撮像した画像から隈取の種類を認識する。そして、画像合成装置は、利用者を撮像した画像内の顔画像に、準備段階で認識された隈取による化粧を示す隈取画像を重畳して表示させる。このとき、画像合成装置は、画像内における顔画像の位置の変動に隈取画像を追従(トラッキング)させる。
【0005】
また、画像合成装置は、カメラによって撮像されている人物の表情が変化することによって、顔の像が変化すると、該変化に基づいて、重畳させる隈取画像を変形させることもできる。例えば、合成装置は、人物が口を開けると、口に相当する部分が開くように隈取画像を変形する。また、例えば、合成装置は、人物がカメラに対して正面を向いている状態から左を向く状態に変化して、人物の右頬がカメラの方向を向くと、右頬側から観察された状態での隈取画像を重畳する。
【0006】
このようにして、画像合成装置は、サービスの利用者の顔にあたかも隈取による化粧が施されているかのように、該利用者の顔を表示する。このため、利用者は、実際に自身の顔に隈取を施すことなく、容易に、隈取による化粧を体験することができる。
【先行技術文献】
【特許文献】
【0007】
【非特許文献】
【0008】
【文献】薄井、外3名、「歌舞伎×ICTのコラボレーション」、NTT技術ジャーナル、2018年11月号26頁、[online]、[令和3年6月10日検索]、インターネット<URL:https://journal.ntt.co.jp/article/3992>
【文献】“米国ラスベガスで好評を博したインタラクティブ展示「変身歌舞伎」を日本でも公開~東京江戸ウィークで本邦初公開~|ニュースリリース|NTT”、[online]、[令和3年6月10日検索]、インターネット<URL:https://group.ntt/jp/newsrelease/2016/09/20/160920a.html>
【発明の概要】
【発明が解決しようとする課題】
【0009】
上述した従来技術では、撮像画像において、合成装置が顔画像を認識するために処理を実行する領域と、隈取の種類を認識するために処理を実行する領域と、重畳画像を重畳させるために顔画像を認識する領域とが同じであった。そのため、これらの領域を大きくすると、顔画像及び隈取の種類の認識精度が低下し、これらの領域を小さくすると、利用者が顔の位置を変更したときに顔画像が該領域外に位置し、このため顔画像に重畳画像を重畳することができないという課題があった。
【0010】
かかる事情に鑑みてなされた本開示の目的は、顔画像及び隈取の種類の認識精度を向上させつつ、利用者が顔の位置を変更しても顔画像に重畳画像を重畳させることができる画像重畳システム及び画像重畳方法を提供することにある。
【課題を解決するための手段】
【0011】
上記課題を解決するため、本開示に係る画像重畳システムは、第1の段階において撮像装置が利用者を撮像した撮像画像における顔領域をトリミングした顔領域画像を示す顔領域画像情報を生成し、前記第1の段階において前記撮像装置が重畳物を撮像した撮像画像における重畳物領域をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成する制御装置と、前記顔領域画像に含まれる、前記利用者の顔画像を認識し、該顔画像を示す顔画像情報を生成する顔認識装置と、前記重畳物領域画像に相当する重畳画像を認識する重畳物認識装置と、前記第1の段階の後の第2の段階において前記撮像装置が前記利用者を撮像した撮像画像における、前記顔領域及び前記重畳物領域より大きい合成領域の画像である合成領域画像から、前記顔画像情報に基づいて、前記利用者の顔画像を検出し、該顔画像に、前記重畳画像を重畳した合成画像を示す合成画像情報を生成する合成装置と、を備える。
【0012】
また、上記課題を解決するため、本開示に係る画像重畳方法は、第1の段階において撮像装置が利用者を撮像した撮像画像における顔領域をトリミングした顔領域画像を示す顔領域画像情報を生成するステップと、前記第1の段階において、前記撮像装置が重畳物を撮像した撮像画像における重畳物領域をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成するステップと、前記顔領域画像に含まれる、前記利用者の顔画像を認識し、該顔画像を示す顔画像情報を生成するステップと、前記重畳物領域画像に相当する重畳画像を認識するステップと、前記第1の段階の後の第2の段階において前記撮像装置が前記利用者を撮像した撮像画像における、前記顔領域及び前記重畳物領域より大きい合成領域の画像である合成領域画像から、前記顔画像情報に基づいて、前記利用者の顔画像を検出するステップと、該顔画像に、前記重畳画像を重畳した合成画像を示す合成画像情報を生成するステップと、を含む。
【発明の効果】
【0013】
本開示に係る画像重畳システム及び画像重畳方法によれば、顔画像及び隈取の種類の認識精度を向上させつつ、利用者が顔の位置を変更しても顔画像に重畳画像を重畳させることができる。
【図面の簡単な説明】
【0014】
【
図1】第1の実施形態に係る画像重畳システムの概略図である。
【
図2B】撮像画像における重畳物領域を示す図である。
【
図3B】
図2Bに示すマスクのさらなる他の例を示す図である。
【
図4】
図1に示す領域情報記憶部によって記憶されている情報の一例を示す図である。
【
図6A】
図1に示す画像重畳システムにおける動作の一例の一部を示すシーケンス図である。
【
図6B】
図1に示す画像重畳システムにおける動作の一例の残り一部を示すシーケンス図である。
【
図7】第2の実施形態に係る画像重畳システムの概略図である。
【
図8A】
図7に示す画像重畳システムにおける動作の一例の一部を示すシーケンス図である。
【
図8B】
図7に示す画像重畳システムにおける動作の一例の残り一部を示すシーケンス図である。
【
図9】制御装置及び合成装置のハードウェアブロック図である。
【発明を実施するための形態】
【0015】
<<第1の実施形態>>
図1を参照して第1の実施形態の全体構成について説明する。
図1は、本実施形態に係る画像重畳システム100の概略図である。
【0016】
図1に示すように、第1の実施形態に係る画像重畳システム100は、撮像装置1と、顔認識装置2と、重畳物認識装置3と、制御装置4と、合成装置5と、表示装置6とを備える。制御装置4は、撮像装置1、顔認識装置2、重畳物認識装置3、及び合成装置5それぞれと通信ネットワークを介して通信する。合成装置5は、表示装置6と通信ネットワークを介して通信する。
【0017】
<撮像装置の構成>
撮像装置1は、光学素子、撮像素子、通信インターフェース等を有するカメラによって構成される。通信インターフェースには、例えば、イーサネット(登録商標)、FDDI(Fiber Distributed Data Interface)、Wi-Fi(登録商標)等の規格が用いられてもよい。
【0018】
撮像装置1は、準備段階(第1の段階)において、
図2Aに示すような、画像重畳システム100の利用者を撮像した撮像画像を示す撮像画像情報を生成する。ここでの撮像画像は、静止画像であってよい。このとき、顔画像が、追って詳細に説明する顔領域R1に含まれるように、実空間において利用者の顔の位置を調整する仕組みが設けられていてもよい。具体的には、撮像装置1は、利用者の顔を含む、該利用者の少なくとも一部を撮像する。利用者の少なくとも一部は、利用者の顔を含む、利用者の上半身であってもよい。また、利用者の少なくとも一部は、利用者の顔を含む、利用者の全身であってもよい。
【0019】
また、撮像装置1は、準備段階において、所定の領域内に配置された重畳物を撮像した撮像画像を示す撮像画像情報を生成する。所定の領域は、例えば、顔と撮像装置との間の領域であってよい。また、ここでの撮像画像は、静止画像であってよい。例えば、撮像装置1は、
図2Bに示すように、利用者の顔と撮像装置1との間に重畳物が配置された状態で、利用者とともに重畳物を撮像した撮像画像を示す撮像画像情報を生成してもよい。このとき、重畳物の画像が、追って詳細に説明する重畳物領域R2に含まれるように、実空間において、重畳物の位置を調整するような仕組みが設けられていてもよい。重畳物は、合成装置5が、撮像装置1によって撮像された利用者の顔の像に重畳する画像に対応する、実空間における物体である。
図2Bに示す例では、重畳物は、歌舞伎で用いられる隈取による化粧を施したお面(マスク)MKである。お面MKは、
図2Bに示す例に限られず、
図3A及び
図3Bに示すようなお面MKであってもよいし、その他の任意のお面MKであってよい。
【0020】
また、撮像装置1は、準備段階後のサービス提供段階(第2の段階)において、利用者を撮像した撮像画像を示す撮像画像情報を生成する。ここでの撮像画像は、動画像であってよい。サービス提供段階において、撮像装置1が撮像する利用者は、準備段階において撮像装置1によって撮像された利用者である。
【0021】
さらに、撮像装置1は、通信ネットワークを介して、撮像画像情報を制御装置4に送信する。
【0022】
<顔認識装置の構成>
図1に示す顔認識装置2は、制御部(コントローラ)、通信インターフェース等を有するコンピュータによって構成される。制御部は、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等の専用のハードウェアによって構成されてもよいし、プロセッサによって構成されてもよいし、双方を含んで構成されてもよい。
【0023】
顔認識装置2は、制御装置4から送信された、追って詳細に説明する顔領域画像情報を受信する。そして、顔認識装置2は、顔領域画像情報が示す顔領域画像に含まれる利用者の顔画像を認識し、顔画像を示す顔画像情報を生成する。顔認識装置2が顔画像を認識する手法は、任意の手法であってよい。また、顔認識装置2は、顔画像情報を制御装置4に送信する。
【0024】
<重畳物認識装置の構成>
図1に示すように、重畳物認識装置3は、通信部31と、重畳画像情報記憶部32と、認識部33とを備える。通信部31は、外部と情報を送受信する通信インターフェースによって構成される。重畳画像情報記憶部32は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、EEPROM(Electrically Erasable Programmable Read-Only Memory)、ROM(Read-Only Memory)およびRAM(Random Access Memory)等のメモリによって構成される。認識部33は、制御部を構成する。
【0025】
通信部31は、制御装置4から送信された、追って詳細に説明する重畳物領域画像情報を受信する。また、通信部13は、追って詳細に説明する重畳画像ID(Identification)(重畳画像識別子)を制御装置4に送信する。
【0026】
重畳画像情報記憶部32は、重畳画像と、重畳画像IDとを対応付けて記憶している。重畳画像は、サービス提供段階において、撮像装置1が利用者を撮像した撮像画像に重畳させる画像である。重畳画像IDは、該重畳画像を識別するための識別子である。上述したように、重畳物が歌舞伎で用いられる隈取による化粧を施したお面MKである例において、重畳画像は、隈取による化粧を施したお面MKにおける化粧部分の画像である。
【0027】
認識部33は、重畳物領域画像情報が示す重畳物領域画像に相当する重畳画像を認識する。このとき、認識部33は、重畳画像情報記憶部32に記憶されている重畳画像のなかから、重畳物領域画像情報が示す重畳物領域画像に相当する重畳画像を認識してもよい。そして、認識部33は、認識された重畳画像に対応して、重畳画像情報記憶部32に記憶されている重畳画像IDを抽出する。また、認識部33は、重畳画像IDを制御装置4に送信するよう通信部31を制御する。
【0028】
<制御装置の構成>
制御装置4は、通信部41と、領域情報記憶部42と、重畳画像情報記憶部43と、トリミング部44と、シナリオ制御部45とを備える。通信部41は、通信インターフェースによって構成される。領域情報記憶部42及び重畳画像情報記憶部43は、メモリによって構成される。トリミング部44及びシナリオ制御部45は、制御部を構成する。
【0029】
通信部41は、撮像装置1から、撮像画像情報を受信する。また、通信部41は、顔認識装置2から、顔画像情報を受信する。また、通信部41は、重畳物認識装置3から、重畳画像IDを受信する。また、通信部41は、シナリオ制御部45の制御に基づいて、合成装置5に情報を送信する。
【0030】
領域情報記憶部42には、
図4に示すように、撮像画像内の領域を識別するための領域ID(領域識別子)と、領域の範囲を示す情報とが、対応付けて記憶されている。領域には、顔領域R1、重畳物領域R2、及び合成領域R3が含まれ、各領域は予め定められた領域である。顔領域R1は、
図2Aに示すように、準備段階において利用者が撮像された撮像画像内の領域であって、利用者の顔画像が含まれていると見込まれる領域である。重畳物領域R2は、
図2Bに示すように、準備段階において重畳物が撮像された撮像画像内の領域であって、重畳物の画像が含まれていると見込まれる領域である。合成領域R3は、
図5に示すように、サービス提供段階において利用者が撮像された撮像画像内の領域であって、利用者が顔の位置を変更しても、顔画像が含まれると見込まれる領域である。合成領域R3は、顔領域R1及び重畳物領域R2より大きい。合成領域R3は、例えば、利用者の全身を示す全身画像を含む領域とすることができる。
【0031】
図4に示す例では、領域の範囲を示す情報は、始点座標、並びにXサイズ及びYサイズである。具体的には、顔領域R1は、領域ID「1」によって識別され、始点座標(X1,Y1)から、X軸方向に長さLX1を有し、Y軸方向に長さLY1を有する矩形によって囲まれる領域である。また、重畳物領域R2は、領域ID「2」によって識別され、始点座標(X2,Y2)から、X軸方向に長さLX2を有し、Y軸方向に長さLY2を有する矩形によって囲まれる領域である。重畳領域は、領域ID「3」によって識別され、始点座標(X3,Y3)から、X軸方向に長さLX3を有し、Y軸方向に長さLY3を有する矩形によって囲まれる領域である。
【0032】
重畳画像情報記憶部43は、重畳物認識装置3の重畳画像情報記憶部32と同様に、重畳画像と、重畳画像IDとを対応付けて記憶している。
【0033】
トリミング部44は、準備段階において撮像装置1が利用者を撮像した撮像画像における顔領域R1をトリミングした顔領域画像を示す顔領域画像情報を生成する。具体的には、トリミング部44は、領域情報記憶部42から、撮像画像内における顔領域R1を示す顔領域情報を取得してもよい。
図4に示す例では、トリミング部44は、領域情報記憶部42に記憶されている領域ID「1」に対応する始点座標、並びにXサイズ及びYサイズによって示される顔領域情報を取得する。そして、トリミング部44は、撮像画像における、顔領域情報で示される顔領域R1を抽出し、顔領域R1の画像を示す顔領域画像情報を生成する。
【0034】
また、トリミング部44は、準備段階において撮像装置1が重畳物を撮像した撮像画像における重畳物領域R2をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成する。具体的には、トリミング部44は、領域情報記憶部42から、撮像画像内における重畳物領域R2を示す重畳物領域情報を取得してもよい。
図4に示す例では、トリミング部44は、領域情報記憶部42に記憶されている領域ID「2」に対応する始点座標、並びにXサイズ及びYサイズによって示される重畳物領域情報を取得する。そして、トリミング部44は、撮像画像における、重畳物領域情報で示される重畳物領域R2を抽出し、該重畳物領域の画像を示す重畳物領域画像情報を生成する。
【0035】
トリミング部44は、顔領域画像情報を顔認識装置2に送信するよう通信部41を制御する。また、トリミング部44は、重畳物領域画像情報を重畳物認識装置3に送信するよう通信部41を制御する。
【0036】
シナリオ制御部45は、重畳物認識装置3によって認識された重畳画像IDに対応して、重畳画像情報記憶部43に記憶されている重畳画像情報を抽出する。また、シナリオ制御部45は、領域情報記憶部42に記憶されている領域ID「3」に対応する、合成領域R3を示す合成領域情報を抽出する。
図5に示す例では、合成領域情報は、始点座標(X3,Y3)、並びにXサイズ「LX3」及びYサイズ「LY3」である。
【0037】
そして、シナリオ制御部45は、顔画像情報と、重畳画像情報と、合成領域情報と、サービス提供段階において撮像装置1によって生成された撮像画像情報とを合成装置5に送信するよう通信部41を制御する。
【0038】
<合成装置の構成>
図1に示すように、合成装置5は、通信部51と、顔画像検出部52と、重畳部53とを備える。通信部51は、通信インターフェースによって構成される。顔画像検出部52及び重畳部53は、制御部を構成する。
【0039】
通信部51は、制御装置4から、顔画像情報と、重畳画像情報と、合成領域情報と、サービス提供段階において撮像装置1によって生成された撮像画像情報とを受信する。また、通信部51は、追って詳細に説明する合成画像情報を表示装置6に送信する。
【0040】
顔画像検出部52は、サービス提供段階において撮像装置1が利用者を撮像した撮像画像における、顔領域R1及び重畳物領域R2より大きい合成領域R3の画像である合成領域画像から、顔画像情報に基づいて、利用者の顔画像を検出する。
【0041】
重畳部53は、顔画像に、重畳画像を重畳した合成画像を示す合成画像情報を生成する。具体的には、重畳部53は、撮像画像情報が示す撮像画像における、顔画像検出部52によって検出された顔画像に、重畳画像情報が示す重畳画像を重畳する。そして、重畳部53は、顔画像に重畳画像を重畳した合成画像を示す合成画像情報を生成する。
【0042】
また、重畳部53は、合成領域画像から検出された顔画像から特徴パラメータを抽出してもよい。特徴パラメータは顔画像の特徴を示すパラメータであって、例えば、顔が向いている方向、顔の表情等を示すパラメータである。このような構成において、重畳部53は、特徴パラメータに応じて、重畳画像を重畳した合成画像を示す合成画像情報を生成してもよい。例えば、重畳部53は、特徴パラメータが、顔の左側が撮像装置1の撮像面に対向していることを示す場合、顔の左側に対応する重畳画像を重畳させてもよい。さらに、撮像画像が動画像である構成において、重畳部53は、動画像を構成する複数の静止画像それぞれにおける顔画像の特徴パラメータの変化に応じて、顔画像に重畳させる重畳画像が変化させてもよい。
【0043】
また、重畳部53は、合成画像情報を表示装置6に送信するよう通信部51を制御する。
【0044】
<表示装置の構成>
表示装置6は、表示インターフェース、通信インターフェース等を有する装置によって構成される。表示インターフェースは、有機EL(Electro Luminescence)、液晶パネル等によって構成されてよい。
【0045】
表示装置6は、合成装置5から送信された合成画像情報を受信する。そして、表示装置6は、合成画像情報が示す合成画像を表示する。
【0046】
<画像重畳システムの動作>
ここで、第1の実施形態に係る画像重畳システム100の動作について、
図6A及び
図6Bを参照して説明する。
図6A及び
図6Bは、本実施形態に係る画像重畳システム100の動作の一例を示すシーケンス図である。
図6A及び
図6Bを参照して説明する画像重畳システム100における動作は第1の実施形態に係る画像重畳システム100の画像重畳方法の一例に相当する。
【0047】
図6Aに示すように、まず、画像重畳システム100は、準備段階であるステップS11~S19において、準備処理を実行する。
【0048】
ステップS11において、撮像装置1が、利用者を撮像した撮像画像を示す撮像画像情報を生成する。
【0049】
ステップS12において、撮像装置1が、撮像画像情報を制御装置4に送信する。
【0050】
ステップS13において、制御装置4のトリミング部44は、領域情報記憶部42から、撮像画像内における顔領域R1を示す顔領域情報を取得する。
【0051】
ステップS14において、制御装置4のトリミング部44が、ステップS12で送信された撮像画像情報を用いて、撮像装置1が利用者を撮像した撮像画像における顔領域R1をトリミングした顔領域画像を示す顔領域画像情報を生成する。
【0052】
ステップS15において、制御装置4のトリミング部44が、顔領域画像情報を顔認識装置2に送信するよう通信部41を制御する。これにより、通信部41が、顔領域画像情報を顔認識装置2に送信する。
【0053】
ステップS16において、顔認識装置2が、顔領域画像情報が示す画像に含まれる顔画像を認識し、該顔画像を示す顔画像情報を生成する。
【0054】
ステップS17において、顔認識装置2が、顔画像情報を制御装置4に送信する。
【0055】
ステップS18において、撮像装置1が、重畳物を撮像した撮像画像を示す撮像画像情報を生成する。このとき、撮像装置1が、利用者の顔と撮像装置1との間に重畳物が配置された状態で、利用者とともに重畳物を撮像した撮像画像を示す撮像画像情報を生成してもよい。
【0056】
ステップS19において、撮像装置1が、撮像画像情報を制御装置4に送信する。
【0057】
ステップS20において、制御装置4のトリミング部44が、領域情報記憶部42から、撮像画像内における重畳物領域R2を示す重畳物領域情報を取得する。
【0058】
ステップS21において、制御装置4のトリミング部44が、ステップ19において送信された撮像画像情報を用いて、撮像装置1が重畳物を撮像した撮像画像における重畳物領域R2をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成する。
【0059】
ステップS22において、制御装置4のトリミング部44が、重畳物領域画像情報を重畳物認識装置3に送信するよう通信部41を制御する。これにより、通信部41が、重畳物領域画像情報を重畳物認識装置3に送信する。
【0060】
ステップS23において、重畳物認識装置3の認識部33が、重畳物領域画像情報が示す重畳物領域画像に相当する重畳画像を認識する。認識部33が、重畳画像情報記憶部32に記憶されている重畳画像のなかから、重畳物領域画像情報が示す重畳物領域画像に相当する重畳画像を認識してもよい。
【0061】
ステップS24において、重畳物認識装置3の認識部33が、認識された重畳画像に対応して、重畳画像情報記憶部32に記憶されている重畳画像IDを抽出する。
【0062】
ステップS25において、重畳物認識装置3の認識部33が、重畳画像IDを制御装置4に送信するよう通信部31を制御する。これにより、通信部31は、畳画像IDを制御装置4に送信する。
【0063】
上記のようなステップS11~S25までの準備段階の後に、画像重畳システム100は、サービス提供段階であるステップS26~S31において、サービス提供処理を実行する。
【0064】
ステップS26において、撮像装置1が、利用者を撮像した撮像画像を示す撮像画像情報を生成する。
【0065】
ステップS27において、撮像装置1が、撮像画像情報を制御装置4に送信する。
【0066】
図6Bに示すように、ステップS28において、制御装置4のシナリオ制御部45が、重畳物認識装置3によって認識された重畳画像IDに対応して、重畳画像情報記憶部43に記憶されている重畳画像情報を抽出する。
【0067】
ステップS29において、制御装置4のシナリオ制御部45が、領域情報記憶部42から、撮像画像内における合成領域R3を示す合成領域情報を取得する。
【0068】
ステップS30において、制御装置4のシナリオ制御部45が、顔画像情報と、重畳画像情報と、合成領域情報と、サービス提供段階において撮像装置1によって生成された撮像画像情報とを合成装置5に送信するよう通信部41を制御する。これにより、通信部41は、顔画像情報と、重畳画像情報と、合成領域情報と、サービス提供段階において撮像装置1によって生成された撮像画像情報とを合成装置5に送信する。
【0069】
ステップS31において、合成装置5の顔画像検出部52が、撮像画像情報を用いて、サービス提供段階において撮像装置1が利用者を撮像した撮像画像における、顔領域R1より大きい合成領域R3の画像である合成領域画像から、顔画像情報に基づいて、利用者の顔画像を検出する。
【0070】
ステップS32において、合成装置5の重畳部53が、顔画像に、重畳画像を重畳した画像を示す合成画像情報を生成する。
【0071】
ステップS33において、合成装置5の重畳部53が、合成画像情報を表示装置6に送信するよう通信部51を制御する。これにより、通信部51が、合成画像情報を表示装置6に送信する。
【0072】
ステップS34において、表示装置6が、合成画像情報が示す合成画像を表示する。
【0073】
上述したように、第1の実施形態によれば、画像重畳システム100は、準備段階において、撮像装置1が利用者を撮像した撮像画像における顔領域R1をトリミングした顔領域画像を示す顔領域画像情報を生成し、準備段階において、撮像装置1が重畳物を撮像した撮像画像における重畳物領域R2をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成する。そして、画像重畳システム100は、顔領域画像に含まれる利用者の顔画像を認識し、該顔画像を示す顔画像情報を生成し、重畳物領域画像に相当する重畳画像を認識し、重畳画像を識別するための重畳画像IDを抽出する。さらに、画像重畳システム100は、準備段階の後のサービス提供段階において撮像装置1が利用者を撮像した撮像画像における、顔領域R1及び重畳物領域R2より大きい合成領域R3の画像である合成領域画像から、顔画像情報に基づいて、利用者の顔画像を認識し、該顔画像に、重畳画像IDによって識別される重畳画像を重畳した合成画像を示す合成画像情報を生成する。このため、画像重畳システム100は、顔画像及び隈取の種類の認識精度を向上させつつ、撮像画像内の広い範囲で利用者の顔画像をトラッキングして重畳画像を重畳させることができる。特に、重畳物が歌舞伎における隈取による化粧である場合、
図2B、
図3A、及び
図3Bに一部の例を示したほかに、隈取の種類の数は多く、その差異が微細であるため、認識精度を向上させることは有用である。
【0074】
なお、上述した第1の実施形態において、画像重畳システム100は、撮像装置1を備えるが、この限りではない。例えば、画像重畳システム100は、撮像装置1を備えず、外部の撮像装置から撮像画像を取得してもよい。
【0075】
また、上述した第1の実施形態において、制御装置4の通信部41が重畳画像情報を合成装置5に送信するが、この限りではない。例えば、通信部41は、重畳画像IDを合成装置5に送信し、合成装置5が重畳画像IDに対応した重畳画像を該合成装置5が有する記憶部から抽出してもよい。
【0076】
また、上述した第1の実施形態において、画像重畳システム100は、表示装置6を備えるが、この限りではない。例えば、画像重畳システム100は、表示装置6を備えず、外部の表示装置に撮像画像を送信してもよいし、外部の他の装置に撮像画像を送信してもよい。
【0077】
また、上述した第1の実施形態において、合成装置5の重畳部53が顔画像から特徴パラメータを抽出するが、この限りではない。例えば、顔認識装置2の認識部33が顔画像を認識するとともに、該顔画像から特徴パラメータを抽出してもよい。このような構成において、特徴パラメータは、合成装置5に送信される。
【0078】
また、上述した第1の実施形態において、画像重畳システム100が備えるいずれか2つ以上の装置が一体として構成されてもよい。このような構成において、一体として構成された2つ以上の装置に含まれる機能部間での情報の授受は、通信部を介さずに実行されてもよい。
【0079】
<<第2の実施形態>>
図7を参照して第2の実施形態の全体構成について説明する。
図7は、第2の実施形態に係る画像重畳システム101の概略図である。第2の実施形態において、第1の実施形態と同一の機能部については同じ符号を付し、説明を省略する。
【0080】
図7に示すように、第2の実施形態に係る画像重畳システム101は、撮像装置1と、顔認識装置2と、重畳物認識装置3と、制御装置4-1と、合成装置5と、表示装置6とを備える。制御装置4-1は、撮像装置1、顔認識装置2、重畳物認識装置3、及び合成装置5それぞれと通信ネットワークを介して通信する。
【0081】
<制御装置の構成>
制御装置4-1は、通信部41と、領域情報記憶部42-1と、重畳画像情報記憶部43と、トリミング部44と、シナリオ制御部45と、領域決定部46とを備える。領域情報記憶部42-1は、メモリによって構成される。領域決定部46は、制御部を構成する。
【0082】
領域決定部46は、顔認識装置2によって認識された顔画像の、撮像画像内における位置に基づいて、撮像画像における重畳物領域R2を決定する。例えば、領域決定部46は、顔認識装置2によって認識された顔画像の中心から第1所定長さ以内となる領域を重畳物領域R2と決定してもよい。例えば、領域決定部46は、顔認識装置2によって認識された顔画像の領域に、該顔画像の周辺から第2所定長さ以内となる領域を加えた領域を重畳物領域R2と決定してもよい。また、例えば、領域決定部46は、顔認識装置2によって認識された顔画像の中心を重心とする所定の大きさの矩形内の領域を重畳物領域R2と決定してもよい。
【0083】
領域情報記憶部42-1には、第1の実施形態の領域情報記憶部42と同様に、撮像画像内の領域を識別するための領域IDと、領域の範囲を示す情報とが対応付けて記憶されている。第1の実施形態と同様に、領域には、顔領域R1と、重畳物領域R2と、合成領域R3とが含まれる。第2の実施形態における顔領域R1及び合成領域R3は、それぞれ第1の実施形態における顔領域R1及び合成領域R3と同様に予め定められた領域である。第2の実施形態における重畳物領域R2は、第1の実施形態における重畳物領域R2とは異なり、予め定められた領域ではなく、領域決定部46によって決定された重畳物領域R2である。なお、決定された重畳物領域R2は、第1の実施形態と同様に、開始座標、並びにXサイズ及びYサイズによって示されてもよい。
【0084】
第2の実施形態において、トリミング部44は、第1の実施形態で説明したように、準備段階において撮像装置が重畳物を撮像した撮像画像における重畳物領域R2をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成する。第2の実施形態においては、領域決定部46及び領域情報記憶部42が上述したように構成されていることにより、トリミング部44は、撮像画像における、領域決定部46によって決定された重畳物領域R2をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成することになる。
【0085】
<画像重畳システムの動作>
ここで、第2の実施形態に係る画像重畳システム101の動作について、
図8A及び
図8Bを参照して説明する。
図8A及び
図8Bは、本実施形態に係る画像重畳システム101の動作の一例を示すフローチャートである。
図8A及び
図8Bを参照して説明する画像重畳システム101における動作は第2の実施形態に係る画像重畳システム101の画像重畳方法の一例に相当する。
【0086】
図8Aに示すように、画像重畳システム101は、ステップS41からステップS47までの処理を実行する。ステップS41からステップS47までの処理は、第1の実施形態におけるステップS11からステップS17までの処理と同じである。
【0087】
ステップS48において、領域決定部46は、顔画像に基づいて重畳物領域R2を決定する。
【0088】
ステップS49において、領域情報記憶部42-1は、ステップS48で決定された重畳物領域R2を記憶する。具体的には、領域情報記憶部42-1は、重畳物領域R2を識別するための重畳物IDに対応付けて、ステップS48で決定された、重畳物領域R2を示す、開始座標、並びにXサイズ及びYサイズを記憶する。
【0089】
続いて、
図8A及び
図8Bに示すように、画像重畳システム101は、ステップS50からステップS66までの処理を実行する。ステップS50からステップS66までの処理は、第1の実施形態におけるステップS18からステップS34までの処理と同じである。なお、これにより、ステップS52では、トリミング部44は、撮像画像における、領域決定部46によって決定された重畳物領域R2をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成することになる。
【0090】
上述したように、第2の実施形態によれば、画像重畳システム101は、顔領域画像に含まれる顔画像に基づいて、重畳物領域R2を決定し、撮像画像における該重畳物領域R2をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成する。このため、画像重畳システム101は、撮像画像における重畳物の像が位置している可能性の高い領域を重畳物領域R2と決定することができる。したがって、画像重畳システム101は、重畳画像を適切に認識することができ、これに伴い、顔画像に適切な重畳画像を重畳させることができる。例えば、利用者が、大人、子供、車椅子の利用者等である場合は顔領域R1を広く設定せざるを得ないが、画像重畳システム101は、顔画像の認識結果を利用して重畳物領域R2の位置及びサイズを限定できるため、重畳画像を適切に認識し、顔画像に重畳画像を適切に重畳することができる。
【0091】
<プログラム>
上述した制御装置4、4-1、及び合成装置5はコンピュータ102によって実現することができる。また、制御装置4、4-1、及び合成装置5として機能させるためのプログラムが提供されてもよい。また、該プログラムは、格納媒体に格納されてもよいし、ネットワークを通して提供されてもよい。
図9は、制御装置4、4-1、及び合成装置5としてそれぞれ機能するコンピュータ102の概略構成を示すブロック図である。ここで、コンピュータ102は、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
【0092】
図9に示すように、コンピュータ102は、プロセッサ110と、ROM(Read Only Memory)120と、RAM(Random Access Memory)130と、ストレージ140と、入力部150と、表示部160と、通信インターフェース(I/F)170とを備える。各構成は、バス180を介して相互に通信可能に接続されている。プロセッサ110は、具体的にはCPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種又は異種の複数のプロセッサにより構成されてもよい。
【0093】
プロセッサ110は、各構成の制御、及び各種の演算処理を実行する。すなわち、プロセッサ110は、ROM120又はストレージ140からプログラムを読み出し、RAM130を作業領域としてプログラムを実行する。プロセッサ110は、ROM120又はストレージ140に格納されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ROM120又はストレージ140に、本開示に係るプログラムが格納されている。
【0094】
プログラムは、コンピュータ102が読み取り可能な格納媒体に格納されていてもよい。このような格納媒体を用いれば、プログラムをコンピュータ102にインストールすることが可能である。ここで、プログラムが格納された格納媒体は、非一時的(non-transitory)格納媒体であってもよい。非一時的格納媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0095】
ROM120は、各種プログラム及び各種データを格納する。RAM130は、作業領域として一時的にプログラム又はデータを格納する。ストレージ140は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラム及び各種データを格納する。
【0096】
入力部150は、ユーザの入力操作を受け付けて、ユーザの操作に基づく情報を取得する1つ以上の入力インターフェースを含む。例えば、入力部150は、ポインティングデバイス、キーボード、マウスなどであるが、これらに限定されない。
【0097】
表示部160は、情報を出力する1つ以上の出力インターフェースを含む。例えば、表示部160は、情報を映像で出力するディスプレイ、又は情報を音声で出力するスピーカであるが、これらに限定されない。なお、表示部160は、タッチパネル方式のディスプレイである場合には、入力部150としても機能する。
【0098】
通信インターフェース(I/F)170は、外部の装置と通信するためのインターフェースである。
【0099】
以上の実施形態に関し、更に以下の付記を開示する。
【0100】
(付記項1)
制御部を備え、
前記制御部は、
第1の段階において撮像装置が利用者を撮像した撮像画像における顔領域をトリミングした顔領域画像を示す顔領域画像情報を生成し、前記第1の段階において前記撮像装置が重畳物を撮像した撮像画像における重畳物領域をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成し、
前記顔領域画像に含まれる、前記利用者の顔画像を認識し、該顔画像を示す顔画像情報を生成し、
前記重畳物領域画像に相当する重畳画像を認識し、
前記第1の段階の後の第2の段階において前記撮像装置が前記利用者を撮像した撮像画像における、前記顔領域及び前記重畳物領域より大きい合成領域の画像である合成領域画像から、前記顔画像情報に基づいて、前記利用者の顔画像を認識し、該顔画像に、前記重畳画像識別子によって識別される前記重畳画像を重畳した合成画像を示す合成画像情報を生成する画像重畳システム。
(付記項2)
前記制御部は、前記顔画像に基づいて、前記重畳物領域を決定し、前記撮像画像における該重畳物領域をトリミングした前記重畳物領域画像を示す前記重畳物領域画像情報を生成する、付記項1に記載の画像重畳システム。
(付記項3)
第1の段階において撮像装置が利用者を撮像した撮像画像における顔領域をトリミングした顔領域画像を示す顔領域画像情報を生成するステップと、
前記第1の段階において、前記撮像装置が重畳物を撮像した撮像画像における重畳物領域をトリミングした重畳物領域画像を示す重畳物領域画像情報を生成するステップと、
前記顔領域画像に含まれる、前記利用者の顔画像を認識し、該顔画像を示す顔画像情報を生成するステップと、
前記重畳物領域画像に相当する重畳画像を認識し、前記重畳画像を識別するための重畳画像識別子を抽出するステップと、
前記第1の段階の後の第2の段階において前記撮像装置が前記利用者を撮像した撮像画像における、前記顔領域及び前記重畳物領域より大きい合成領域の画像である合成領域画像から、前記顔画像情報に基づいて、前記利用者の顔画像を認識するステップと、
該顔画像に、前記重畳画像を重畳した合成画像を示す合成画像情報を生成するステップと、
を含む画像重畳方法。
(付記項4)
前記顔領域画像に含まれる前記顔画像に基づいて、前記重畳物領域を決定するステップをさらに含み、
前記重畳物領域画像情報を生成するステップは、前記撮像画像における該重畳物領域をトリミングした前記重畳物領域画像を示す前記重畳物領域画像情報を生成するステップを含む、付記項3に記載の画像重畳方法。
【0101】
本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願、および技術規格が参照により取り込まれることが具体的かつ個々に記載された場合と同程度に、本明細書中に参照により取り込まれる。
【0102】
上述の実施形態は代表的な例として説明したが、本開示の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0103】
1 撮像装置
2 顔認識装置
3 重畳物認識装置
4、4-1 制御装置
5 合成装置
6 表示装置
31 通信部
32 重畳画像情報記憶部
33 認識部
41 通信部
42、42-1 領域情報記憶部
43 重畳画像情報記憶部
44 トリミング部
45 シナリオ制御部
46 領域決定部
51 通信部
52 顔画像検出部
53 重畳部
100、101 画像重畳システム
102 コンピュータ
110 プロセッサ
120 ROM
130 RAM
140 ストレージ
150 入力部
160 出力部
170 通信インターフェース
180 バス