特許7250101 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ レノボ・シンガポール・プライベート・リミテッドの特許一覧

特許7250101画像処理装置、情報処理装置、ビデオ会議サーバ、及びビデオ会議システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2023-03-23

(45)【発行日】2023-03-31

(54)【発明の名称】画像処理装置、情報処理装置、ビデオ会議サーバ、及びビデオ会議システム

(51)【国際特許分類】

H04N 7/15 20060101AFI20230324BHJP

G06T 7/00 20170101ALI20230324BHJP

G06T 7/62 20170101ALI20230324BHJP

G06T 3/40 20060101ALI20230324BHJP

【ＦＩ】

H04N7/15

G06T7/00 660A

G06T7/62

G06T3/40 700

【請求項の数】 15

(21)【出願番号】P 2021196770

(22)【出願日】2021-12-03

【審査請求日】2021-12-03

(73)【特許権者】

【識別番号】505205731

【氏名又は名称】レノボ・シンガポール・プライベート・リミテッド

(74)【代理人】

【識別番号】100112737

【弁理士】

【氏名又は名称】藤田考晴

(74)【代理人】

【識別番号】100136168

【弁理士】

【氏名又は名称】川上美紀

(74)【代理人】

【識別番号】100140914

【弁理士】

【氏名又は名称】三苫貴織

(74)【代理人】

【識別番号】100172524

【弁理士】

【氏名又は名称】長田大輔

(72)【発明者】

【氏名】塚本泰史

(72)【発明者】

【氏名】王梓

【審査官】川中龍太

(56)【参考文献】

【文献】国際公開第２０１０／０７０８２０（ＷＯ，Ａ１）

【文献】特開２００８－００５１２２（ＪＰ，Ａ）

【文献】特開２００５－０９４６９６（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１８／０２８９３３４（ＵＳ，Ａ１）

【文献】特開２００２－２７７９３３（ＪＰ，Ａ）

【文献】特開２０１５－０４６０９０（ＪＰ，Ａ）

【文献】米国特許第１１１６５９９２（ＵＳ，Ｂ１）

【文献】中国特許出願公開第１１３２０６９７１（ＣＮ，Ａ）

【文献】米国特許出願公開第２０１５／００４２７４８（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ７／１４－７／１５

Ｈ０４Ｎ５／９１

Ｇ０６Ｔ７／００

Ｇ０６Ｔ７／６２

Ｇ０６Ｔ３／４０

(57)【特許請求の範囲】

【請求項1】

プロセッサと、
前記プロセッサによって実行されるように構成されたプログラムを記憶するメモリと、
を備え、
前記プログラムは、
画像データを取得し、
前記画像データに含まれる人物の顔領域を特定し、
特定した顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出し、
年齢と顔領域の横幅基準値とが関連付けられた基準情報から前記人物の年齢に対応する横幅基準値を特定し、
特定された前記横幅基準値に前記横幅寸法を近づけるように前記画像データを調整し、
調整後の前記画像データを出力するための命令を含む画像処理装置。

【請求項2】

画像データを取得する画像取得部と、
前記画像データに含まれる人物の顔領域を特定する顔領域特定部と、
特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する寸法検出部と、
年齢と顔領域の横幅基準値とが関連付けられた基準情報から前記人物の年齢に対応する横幅基準値を特定する基準値特定部と、
特定された横幅基準値に前記横幅寸法を近づけるように前記画像データを調整する画像調整部と、
調整後の前記画像データを出力する出力部と
を具備する画像処理装置。

【請求項3】

前記画像調整部は、今回検出された前記横幅寸法及び直近に検出された所定数の前記横幅寸法を統計的に処理することにより代表的な横幅寸法を演算し、前記代表的な横幅寸法が前記横幅基準値となるような調整比率を演算し、演算した調整比率を用いて前記画像データを拡大又は縮小させる請求項２に記載の画像処理装置。

【請求項4】

前記画像データから前記人物の年齢を推定する属性推定部を備え、
前記基準値特定部は、推定された前記年齢に対応する前記横幅基準値を前記基準情報から特定する請求項２又は３に記載の画像処理装置。

【請求項5】

前記基準値特定部は、今回推定された年齢と直近に推定された所定数の年齢を統計的に処理することにより代表的な年齢を演算し、前記代表的な年齢に対応する前記横幅基準値を前記基準情報から特定する請求項４に記載の画像処理装置。

【請求項6】

前記基準情報は、性別に応じてそれぞれ設けられている請求項２又は３に記載の画像処理装置。

【請求項7】

前記画像データから前記人物の年齢及び性別を推定する属性推定部を備え、
前記基準値特定部は、推定された年齢及び性別に対応する前記横幅基準値を前記基準情報から特定する請求項６に記載の画像処理装置。

【請求項8】

前記寸法検出部は、前記画像データにおける人物の高さの寸法を高さ寸法として検出し、
前記基準情報は、年齢と横幅基準値と人物の高さ基準値とが関連付けられており、
前記基準値特定部は、前記基準情報から前記人物の年齢に対応する横幅基準値と高さ基準値とを特定し、
前記画像調整部は、前記高さ寸法が特定された前記高さ基準値に近づくように前記画像データを調整する請求項２から７のいずれかに記載の画像処理装置。

【請求項9】

前記画像調整部は、調整後の前記画像データにおいて、高さ方向に不足する画素が生じた場合には、不足した画素を周囲の画素情報から推測して補充する請求項８に記載の画像処理装置。

【請求項10】

コンピュータを請求項１から９のいずれかに記載の画像処理装置として機能させるためのプログラム。

【請求項11】

請求項１から９のいずれかに記載の画像処理装置を備える情報処理装置。

【請求項12】

画像データを取得する工程と、
前記画像データに含まれる人物の顔領域を特定する工程と、
特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する工程と、
年齢と顔領域の横幅基準値とが関連付けられた基準情報から前記人物の年齢に対応する横幅基準値を特定する工程と、
特定された横幅基準値に前記横幅寸法を近づけるように前記画像データを調整する工程と、
調整後の前記画像データを出力する工程と
をコンピュータが実行する画像処理方法。

【請求項13】

複数の情報処理装置と、
複数の前記情報処理装置から調整後の前記画像データを受信するビデオ会議サーバと
を備え、
各前記情報処理装置は、請求項１から９のいずれかに記載の画像処理装置を備え、
前記ビデオ会議サーバは、各前記情報処理装置から受信した前記画像データを共通の背景下に配置する画像合成部を備えるビデオ会議システム。

【請求項14】

ビデオ会議の複数の参加者の画像データを受信する受信部と、
各前記画像データに含まれる参加者の顔領域を特定する顔領域特定部と、
特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する寸法検出部と、
各前記画像データにおいて検出された複数の横幅寸法を統計的に処理することにより、基準となる横幅基準値を演算し、各前記画像データにおける各前記横幅寸法を前記横幅基準値に近づけるように、各前記画像データを調整する画像調整部と、
各前記画像データを共通のバーチャル背景に配置する画像合成部と
を備えるビデオ会議サーバ。

【請求項15】

各前記画像データの輝度ヒストグラムを演算する輝度演算部と、
複数の前記画像データ間の輝度ヒストグラムのばらつきが小さくなるように、各前記画像データの輝度を調整する輝度調整部と
を備え、
前記画像合成部は、輝度調整後の各前記画像データを前記共通の背景下に配置する請求項１４に記載のビデオ会議サーバ。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像処理装置、情報処理装置、ビデオ会議サーバ、及びビデオ会議システムに関するものである。

【背景技術】

【0002】

近年、ビデオ会議が頻繁に行われるようになり、これに伴いビデオ会議に関する様々なアプリケーションツールが提案されている。その中の一つに、ビデオ会議に参加している参加者を共通の背景下に配置することにより、参加者があたかも共通の空間に集まってミーティングやセミナーの傍聴を行っているような感覚を参加者に与えることのできる技術が提案されている。例えば、ズームビデオコミュニケーションズインコーポレイテッド社が提供する「イマーシブビュー（ｉｍｍｅｒｓｉｖｅｖｉｅｗ）」では、ホストが予め準備された複数の背景の中から好みの背景を選択でき、選択した背景の中に参加者の画像を手動で配置することができる。

【発明の概要】

【発明が解決しようとする課題】

【0003】

しかしながら、ビデオ会議の各参加者から送信される画像内における各参加者の顔を含む体の大きさ、顔の大きさ、顔の高さ位置は、さまざまである。このため、各参加者から受信した画像データをそのまま配置しようとすると、図１４に例示するように、参加者間で顔の位置や高さが不揃いとなり、全体として違和感のある画像となる可能性があった。

【0004】

本発明は、このような事情に鑑みてなされたものであって、共通の背景に配置される参加者の顔の大きさのばらつきを低減することのできる画像処理装置、情報処理装置、ビデオ会議サーバ、及びビデオ会議システムを提供することを目的とする。

【課題を解決するための手段】

【0005】

本発明の第一態様は、プロセッサと、前記プロセッサによって実行されるように構成されたプログラムを記憶するメモリと、を備え、前記プログラムは、画像データを取得し、前記画像データに含まれる人物の顔領域を特定し、特定した顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出し、年齢と顔領域の横幅基準値とが関連付けられた基準情報から前記人物の年齢に対応する横幅基準値を特定し、特定された前記横幅基準値に前記横幅寸法を近づけるように前記画像データを調整し、調整後の前記画像を出力するための命令を含む画像処理装置である。

【0006】

本発明の第二態様は、画像データを取得する画像取得部と、前記画像データに含まれる人物の顔領域を特定する顔領域特定部と、特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する寸法検出部と、年齢と顔領域の横幅基準値とが関連付けられた基準情報から前記人物の年齢に対応する横幅基準値を特定する基準値特定部と、特定された横幅基準値に前記横幅寸法を近づけるように前記画像データを調整する画像調整部と、調整後の前記画像データを出力する出力部とを具備する画像処理装置である。

【0007】

本発明の第三態様は、コンピュータを上記画像処理装置として機能させるためのプログラムである。

【0008】

本発明の第四態様は、上記画像処理装置を備える情報処理装置である。

【0009】

本発明の第五態様は、画像データを取得する工程と、前記画像データに含まれる人物の顔領域を特定する工程と、特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する工程と、年齢と顔領域の横幅基準値とが関連付けられた基準情報から前記人物の年齢に対応する横幅基準値を特定する工程と、特定された横幅基準値に前記横幅寸法を近づけるように前記画像データを調整する工程と、調整後の前記画像データを出力する工程とをコンピュータが実行する画像処理方法である。

【0010】

本発明の第六態様は、複数の情報処理装置と、複数の前記情報処理装置から調整後の前記画像データを受信するビデオ会議サーバとを備え、各前記情報処理装置は、上記記載の画像処理装置を備え、前記ビデオ会議サーバは、各前記情報処理装置から受信した前記画像データを共通の背景下に配置する画像合成部を備えるビデオ会議システムである。

【0011】

本発明の第七態様は、ビデオ会議の複数の参加者の画像データを受信する受信部と、各前記画像データに含まれる参加者の顔領域を特定する顔領域特定部と、特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する寸法検出部と、各前記画像データにおいて検出された複数の横幅寸法を統計的に処理することにより、基準となる横幅基準値を演算し、各前記画像データにおける各前記横幅寸法を前記横幅基準値に近づけるように、各前記画像データを調整する画像調整部と、各前記画像データを共通のバーチャル背景に配置する画像合成部とを備えるビデオ会議サーバである。

【発明の効果】

【0012】

本発明によれば、共通の背景に配置される参加者の顔の大きさのばらつきを低減することができるという効果を奏する。

【図面の簡単な説明】

【0013】

【図1】本発明の第１実施形態に係るビデオ会議システムのシステム構成を概略的に示したシステム構成図である。

【図2】本発明の第１実施形態に係る情報処理装置の一例としての概略外観図である。

【図3】本発明の第１実施形態に係る情報処理装置のハードウェア構成の一例を示した概略構成図である。

【図4】本発明の第１実施形態に係る情報処理装置が備える画像処理機能の一例を示した機能ブロック図である。

【図5】本発明の第１実施形態に係る寸法検出部によって検出される横幅寸法と高さ寸法について説明するための図である。

【図6】身長、腸骨棘高、右足長、頭囲のそれぞれについての１歳から２０歳までの成長曲線を示した図である。

【図7】本発明の第１実施形態に係る画像調整部による調整処理について説明するための図である。

【図8】本発明の第１実施形態に係る画像処理方法の処理手順の一例を示したフローチャートである。

【図9】本発明の第１実施形態に係るビデオ会議サーバのハードウェア構成の一例を示した概略構成図である。

【図10】本発明の第１実施形態に係るビデオ会議サーバが備える機能の一例を示した機能ブロック図である。

【図11】本発明の第１実施形態に係るビデオ会議システムにおいて、各情報処理装置のディスプレイに表示される画像の一例を示した図である。

【図12】本発明の第２実施形態に係るビデオ会議サーバが備える機能の一例を示した機能ブロック図である。

【図13】本発明の第３実施形態に係るビデオ会議サーバが備える機能の一例を示した機能ブロック図である。

【図14】本発明の課題を説明するための図である。

【発明を実施するための形態】

【0014】

〔第１実施形態〕
以下に、本発明に係る画像処理装置、情報処理装置、ビデオ会議サーバ、及びビデオ会議システムの第１実施形態について、図面を参照して説明する。

【0015】

図１は、本発明の第１実施形態に係るビデオ会議システム１のシステム構成を概略的に示したシステム構成図である。図１に示すように、ネットワーク８には、複数の情報処理装置１０及びビデオ会議サーバ５０が接続されている。情報処理装置１０の一例として、ノートＰＣ、タブレット端末、スマートフォンなどが挙げられる。以下説明の便宜上、情報処理装置１０としてノートＰＣを例示して説明する。
なお、図１に示した例では、３台の情報処理装置１０が図示されているが、情報処理装置の接続台数はこれに限られない。

【0016】

図２は、本発明の第１実施形態に係る情報処理装置１０の一例としての概略外観図である。図２に示すように、情報処理装置１０は、いずれも略直方体である本体側筐体２及びディスプレイ側筐体３を備える。本体側筐体２は、入力デバイス４を備える。入力デバイス４は、使用者が入力操作を行うための使用者インターフェースであり、文字、コマンド等を入力する各種キーより構成されるキーボードや、画面上のカーソルを移動させたり、各種メニューを選択するタッチパッド等を備えている。

【0017】

ディスプレイ側筐体３は、画像を表示するディスプレイ５を備える。本実施形態において、ディスプレイ５は、ＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）を例示するが、ＬＣＤに限らず有機ＥＬ（Ｅｌｅｃｔｒｏｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ等の他の表示機器、又はタッチパネルとされてもよい。ＬＣＤは、入力される表示データをビデオ信号に変換し、変換したビデオ信号に応じた各種情報を表示画面に表示する。

【0018】

本体側筐体２及びディスプレイ側筐体３は、それぞれの端部で一対の連結部６によって連結されている。連結部６は、ヒンジであり、本体側筐体２及びディスプレイ側筐体３を開閉可能に支持している。

【0019】

また、ディスプレイ側筐体３は、画像を取得するためのカメラ７を備える。カメラ７は、例えば、ディスプレイ側筐体３に設けられた表示画面の上方（連結部６で連結された側部と反対側の側部）の中央部に配置され、前方の人物（例えば、利用者の顔）を撮像可能とされている。

【0020】

図３は、本実施形態に係る情報処理装置１０のハードウェア構成の一例を示した概略構成図である。図３に示すように、情報処理装置１０は、上述した入力デバイス４、ディスプレイ５、カメラ７に加えて、ＣＰＵ（プロセッサ）１１、メインメモリ１２、記憶部１３、外部インターフェース１４、通信インターフェース１５、スピーカ１６、及びマイク１７などを備えている。これら各部は直接的にまたはバスを介して間接的に相互に接続されており互いに連携して各種処理を実行する。

【0021】

ＣＰＵ１１は、例えば、バスを介して接続された記憶部１３に格納されたＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）により情報処理装置１０全体の制御を行うとともに、記憶部１３に格納された各種プログラムを実行することにより各種処理を実行する。ＣＰＵ１１は、複数設けられており、互いに協働して処理を実現させてもよい。

【0022】

メインメモリ１２は、キャッシュメモリ、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等の書き込み可能なメモリで構成され、ＣＰＵ１１の実行プログラムの読み出し、実行プログラムによる処理データの書き込み等を行う作業領域として利用される。

【0023】

記憶部１３は、非一時的な記録媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒｒｅａｄａｂｌｅｓｔｏｒａｇｅｍｅｄｉｕｍ）である。記憶部１３の一例として、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、フラッシュメモリなどが挙げられる。記憶部１３は、例えば、Ｗｉｎｄｏｗｓ（登録商標）、ｉＯＳ（登録商標）、Ａｎｄｒｏｉｄ（登録商標）等の情報処理装置１０全体の制御を行うためのＯＳ、ＢＩＯＳ（ＢａｓｉｃＩｎｐｕｔ／ＯｕｔｐｕｔＳｙｓｔｅｍ）、周辺機器類をハードウェア操作するための各種デバイスドライバ、各種アプリケーションソフトウェア、及び各種データやファイル等を格納する。また、記憶部１３には、各種処理を実現するためのプログラムや、各種処理を実現するために必要とされる各種データが格納されている。記憶部１３は、複数設けられていてもよく、各記憶部１３に上述したようなデータが分割されて格納されていてもよい。

【0024】

外部インターフェース１４は、外部機器と接続するためのインターフェースである。外部機器の一例として、外部モニタ、ＵＳＢメモリ、外付けＨＤＤ、外付けカメラ等が挙げられる。なお、図１に示した例では、外部インターフェースは、１つしか図示されていないが、複数の外部インターフェースを備えていてもよい。

【0025】

通信インターフェース１５は、ネットワークに接続して他の装置と通信を行い、情報の送受信を行うためのインターフェースとして機能する。例えば、通信インターフェース１５は、有線又は無線により他の装置と通信を行う。無線通信として、Ｂｌｕｅｔｏｏｔｈ（登録商標）、Ｗｉ－Ｆｉ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥ、無線ＬＡＮなどの回線を通じた通信が挙げられる。有線通信の一例として、有線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）などの回線を通じた通信が挙げられる。

【0026】

スピーカ１６及びマイク１７については周知の構成であるため、ここでの詳細な説明は省略する。

【0027】

ビデオ会議サーバ５０は、いわゆるコンピュータであり、上述した情報処理装置１０と同様に、ＣＰＵ、メインメモリ、記憶部、通信インターフェースなどを備えている。なお、ビデオ会議サーバ５０についての詳細は後述する。

【0028】

次に、本実施形態に係る情報処理装置１０が有する機能の一例について図を参照して説明する。図４は、本実施形態に係る情報処理装置１０が備える画像処理機能の一例を示した機能ブロック図である。

【0029】

後述する各種機能を実現するための一連の処理は、一例として、プログラムの形式で各情報処理装置１０が備える記憶部１３などに記憶されており、このプログラムをＣＰＵ（プロセッサ）１１がメインメモリ１２に読み出して、情報の加工・演算処理を実行することにより、各種機能が実現される。なお、プログラムは、記憶部１３に予めインストールされている形態や、他のコンピュータ読み取り可能な記憶媒体に記憶された状態で提供される形態、有線又は無線による通信手段を介して配信される形態等が適用されてもよい。コンピュータ読み取り可能な記憶媒体とは、磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等である。

【0030】

図４に示すように、情報処理装置１０の画像処理部（画像処理装置）２０は、画像取得部２１、顔領域特定部２２、寸法検出部２３、属性推定部２４、パラメータ記憶部２５、基準情報記憶部２６、基準値特定部２７、画像調整部２８、及び出力部２９を備えている。

【0031】

画像取得部２１は、例えば、カメラ７によって撮像された画像データを取得する。具体的には、画像取得部２１は、カメラ７によって所定のフレームレートで撮像された画像データを次々と取得する。

【0032】

顔領域特定部２２は、入力された画像データに含まれる人物（例えば、ビデオ会議の参加者）の顔領域を特定する。人物の顔領域の特定は、公知の技術を適宜採用することにより実現可能である。例えば、画像内における顔の特徴量を抽出することで顔領域を特定する。また、この顔領域特定部２２は、顔領域における眉毛、目、鼻、口などについても特定することができるように構成されていてもよい。

【0033】

寸法検出部２３は、例えば、図５に示すように、顔領域特定部２２によって特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法Ｌ１として検出する。例えば、本実施形態では、図５に示すように、所定高さ位置として、耳の所定の部位（例えば、耳珠（trugs））の位置を採用するが、この例に限定されない。例えば、耳の位置、眉毛、瞳孔の位置などを高さ位置として採用してもよい。

【0034】

また、寸法検出部２３は、図５に示すように、顔領域特定部２２によって特定された顔領域の情報に基づいて、人物の高さの寸法を高さ寸法Ｌ２として検出する。例えば、本実施形態では、所定高さ位置として、耳の所定の部位（例えば、耳珠（trugs））の位置を採用するが、この例に限定されない。例えば、耳の位置、眉毛、瞳孔の位置などを高さ位置として採用してもよい。

【0035】

ここで、顔の横幅や頭囲は、体の他の部位に比べて年齢や性別によるばらつきが小さいことが学術論文などにおいて発表されている。例えば、”Static adult human physical characteristics of the adult head, from pages 72-75 of Poston, Alan. (April 2000) Department of Defense Human Factors Engineering Technical Advisory Group (DOD HFE TAG)” （https://de.wikipedia.org/wiki/Datei:HeadAnthropometry.JPG）には、ある統計の結果、男性の顔の横幅の平均値は１４．５ｃｍ、女性の顔の横幅の平均値は１３．３ｃｍであり、男女比で０．８ｃｍ程度しか変わらないことが開示されている。また、実践女子大学生活科学部生活環境学科の「第２０回こどもの成長と衣服高部恵子」「https://www.jissen.ac.jp/kankyo/lib-lec20.html」に開示されている工技院資料の百分率成長曲線（男、１９７８－８１）には、身長、腸骨棘高、右足長、頭囲のそれぞれについての１歳から２０歳までの成長曲線が開示されている（例えば、図６参照）。

【0036】

上述した統計結果から、顔の横幅や頭囲については年齢及び性別によるばらつきが他の部位に比べて極めて小さいことがわかる。すなわち、図６に示した成長曲線によれば、すでに１歳において成人の頭囲の約８０％に相当する値を示しており、また、１３歳以降は、年齢による値の違いがほとんどないことがわかる。発明者らは、このような新たな知見から、カメラ７から入力された画像データにおいて、顔の横幅を年齢に応じた値に調整すれば、ビデオ会議に参加している参加者間の顔の大きさを自然な大きさに調整できるとの着想を得た。

【0037】

属性推定部２４は、顔領域特定部２２によって特定された顔領域の画像に基づいて人物の年齢及び性別を推定する。人物の年齢及び性別を推定する手法については公知の手法を適宜採用することが可能である。例えば、顔画像の特徴量を抽出し、さらに、予め登録されている年齢（年代）および性別を識別するための特徴量とから類似度を計算し、類似度の値に基づいて、年齢及び性別を推定する。年齢及び性別を推定する手法の一例として、例えば、特許第５２８７３３３号公報に記載されている技術を採用することが可能である。

【0038】

パラメータ記憶部２５は、同じ画像データにおいて検出された横幅寸法及び推定された年齢及び性別を１つのデータセットとして記憶する。例えば、パラメータ記憶部２５は、新しい順に所定数（所定数≧２）のデータセットを格納するバッファメモリである。パラメータ記憶部２５は、一例として、ＦＩＦＯ（ＦｉｒｓｔＩｎＦｉｒｓｔＯｕｔ）メモリによって実現される。これにより、パラメータ記憶部２５には、直近に検出された所定数のデータセットが格納されることとなる。

【0039】

基準情報記憶部２６には、年齢と顔領域の横幅基準値Ｌ１＿ｒｅｆと人物の高さ基準値Ｌ２＿ｒｅｆとが関連付けられた基準情報が格納されている。この基準情報は、性別に応じてそれぞれ設けられている。年齢は、１０代、２０代、３０代などのように年代別に区分されていてもよく、年代毎に横幅基準値及び高さ基準値が関連付けられていてもよい。

【0040】

基準値特定部２７は、パラメータ記憶部２５に格納されている所定数のデータセットから年齢の情報を取得し、これらを統計的に処理することにより、代表的な年齢を特定する。換言すると、基準値特定部２７は、時系列の複数の画像データにおいて推定された複数の年齢を統計的に処理することにより代表的な年齢を演算する。代表的な年齢の一例として、平均年齢、年齢分布のパーセンタイル５０％の年齢などが挙げられる。

【0041】

また、基準値特定部２７は、パラメータ記憶部２５に格納されている所定数のデータセットから性別の情報を取得し、これらを統計的に処理することにより、代表的な性別を特定する。例えば、基準値特定部２７は、パラメータ記憶部２５から読みだした所定数の性別のうち、数の多い性別を代表的な性別として特定する。
基準値特定部２７は、特定した性別に対応する基準情報を用いて、代表的な年齢に対応する横幅基準値Ｌ１＿ｒｅｆ及び高さ基準値Ｌ２＿ｒｅｆを特定する。

【0042】

画像調整部２８は、画像データの横幅寸法Ｌ１が基準値特定部２７によって特定された横幅基準値Ｌ１＿ｒｅｆに近づくように、画像データを調整する。
例えば、画像調整部２８は、パラメータ記憶部２５に格納されている所定数のデータセットから横幅寸法を取得する。換言すると、画像調整部２８は、時系列の複数の画像データにおいて検出された複数の横幅寸法を統計的に処理することにより代表的な横幅寸法を演算する。代表的な横幅寸法の一例として、平均値、横幅寸法のパーセンタイル５０％の値などが挙げられる。そして、画像調整部２８は、代表的な横幅寸法が横幅基準値となるような調整比率（拡大縮小比率）を演算し、演算した調整比率を用いて画像データを縮小又は拡大する。このように、直近に検出された所定数の横幅寸法を用いて調整比率を演算することにより、調整比率の変化を滑らかにすることができる。

【0043】

更に、画像調整部２８は、画像データにおける人物の高さ寸法Ｌ２が基準値特定部２７によって特定された高さ基準値Ｌ２＿ｒｅｆに近づくように、画像データにおける人物の高さ位置を調整する。例えば、画像調整部２８は、画像データにおける人物の高さ寸法Ｌ２が高さ基準値Ｌ２＿ｒｅｆと一致するようにクリッピングする。
これにより、例えば、図５に示した画像データは、図７に示すように、人物の横幅寸法が横幅基準値Ｌ１＿ｒｅｆになるように調整されるとともに、人物の高さ寸法が高さ基準値Ｌ２＿ｒｅｆになるように高さ位置が調整される。

【0044】

また、画像調整部２８は、図７に示すように、人物の高さ位置を調整することにより、調整後の画像データにおいて、高さ方向に不足する画素Ｐｘが生じた場合には、不足した画素Ｐｘを周囲の画素情報から推測して補充する。

【0045】

出力部２９は、画像調整部２８によって調整された画像データを出力する。出力部２９は、例えば、調整後の画像データをネットワーク８を介してビデオ会議サーバ５０に送信する。

【0046】

次に、情報処理装置１０によって実行される画像処理方法について図８を参照して説明する。図８は、画像処理方法の処理手順の一例を示したフローチャートである。以下の一連の処理は、記憶部１３に記憶されているプログラムをＣＰＵ（プロセッサ）１１がメインメモリ１２に読み出して、情報の加工・演算処理を実行することにより実行される。

【0047】

例えば、情報処理装置１０がネットワーク８を介してビデオ会議サーバ５０と接続し、カメラ機能がオンにされると、カメラ７によって画像データが取得され、取得された画像データが随時出力される。
画像処理部（画像処理装置）２０は、カメラ７から出力された画像データを取得すると（ＳＡ１）、取得した画像データに含まれる人物の顔領域を特定する（ＳＡ２）。続いて、特定した顔領域の所定高さ位置、例えば、耳珠（trugs）の位置における横幅の寸法を横幅寸法Ｌ１として検出するとともに、画像データに含まれる人物の高さ寸法Ｌ２を検出する（ＳＡ３）。

【0048】

続いて、画像データの人物の顔領域の特徴量に基づいて人物の年齢（年代）及び性別を推定する（ＳＡ４）。続いて、ステップＳＡ３で検出した横幅寸法Ｌ１及び高さ寸法Ｌ２並びにステップＳＡ４で検出した人物の年齢及び性別を一つのデータセットとして、パラメータ記憶部２５に格納する（ＳＡ５）。これにより、すでにパラメータ記憶部２５に格納されていた一番古いデータセットが消去されるとともに、上述した最新のデータセットがパラメータ記憶部２５に格納されることとなる。

【0049】

次に、パラメータ記憶部２５に格納されている所定数のデータセットから年齢の情報を取得し、これらを統計的に処理することにより、代表的な年齢を特定する。また、同様に、パラメータ記憶部２５に格納されている所定数のデータセットから性別の情報を取得し、これらを統計的に処理することにより、代表的な性別を特定する（ＳＡ６）。

【0050】

続いて、代表的な性別に対応する基準情報を用いて、代表的な年齢に対応する横幅基準値Ｌ１＿ｒｅｆ及び高さ基準値Ｌ２＿ｒｅｆを特定する（ＳＡ７）。

【0051】

次に、パラメータ記憶部２５に格納されている所定数のデータセットから横幅寸法Ｌ１を取得し、これらを統計的に処理することにより代表的な横幅寸法を演算する。同様に、パラメータ記憶部２５に格納されている所定数のデータセットから高さ寸法Ｌ２を取得し、これらを統計的に処理することにより代表的な高さ寸法を演算する（ＳＡ８）。

【0052】

続いて、代表的な横幅寸法が横幅基準値Ｌ１＿ｒｅｆとなるような調整比率（拡大縮小比率）を算出し（ＳＡ９）、算出した調整比率及び高さ基準値Ｌ２＿ｒｅｆに基づいてステップＳＡ１で入力された画像データを調整する（ＳＡ１０）。具体的には、算出した調整比率に基づいて当該画像データを拡大又は縮小するとともに、当該画像データにおける人物の高さが高さ基準値Ｌ２＿ｒｅｆに近づくように、人物の高さ位置を調整する。これにより、例えば、図５に示した画像データは、図７に示すように、人物の顔の横幅寸法Ｌ１が横幅基準値Ｌ１＿ｒｅｆとなるように拡大又は縮小されるとともに、人物の高さ寸法Ｌ２が高さ基準値Ｌ２＿ｒｅｆとなるように高さ位置が調整される。また、図７に示すように、調整後の画像データにおいて、高さ方向に不足する画素Ｐｘが生じた場合には、不足した画素Ｐｘを周囲の画素情報から推測して補充する。

【0053】

このようにして画像の調整が完了すると、調整後の画像データを出力する（ＳＡ１１）。調整後の画像データは、ビデオ会議サーバ５０（図１参照）へ送信される。
そして、上記の如き処理を画像データを取得するたびに行うことにより、人物の大きさ及び高さ位置が調整された画像データが継続的にビデオ会議サーバ５０に送信されることとなる。

【0054】

ビデオ会議サーバ５０（図１参照）は、各情報処理装置１０から画像データを受信すると、受信した画像データを共通のバーチャル背景下に配置する。ここで、各情報処理装置１０から受信する画像データは、それぞれ人物（参加者）の顔の横幅や高さ位置が調整された画像とされているので、共通の背景に配置した際に、統一感が生まれ、違和感のない合成画像を作成することが可能となる。

【0055】

以下、ビデオ会議サーバ５０について図面を参照して説明する。
図９は、本実施形態に係るビデオ会議サーバ５０のハードウェア構成の一例を示した概略構成図である。図９に示すように、ビデオ会議サーバ５０は、コンピュータであり、ＣＰＵ（プロセッサ）５１、メインメモリ５２、記憶部５３、外部インターフェース５４、通信インターフェース５５などを備えている。また、ビデオ会議サーバ５０は、入力デバイス、ディスプレイを備えていてもよい。
上述した各部は直接的にまたはバスを介して間接的に相互に接続されており互いに連携して各種処理を実行する。これら各構成については、上述した情報処理装置１０と同様であるため、ここでの詳細な説明は省略する。

【0056】

図１０は、ビデオ会議サーバ５０が備える機能の一例を示した機能ブロック図である。後述する各種機能を実現するための一連の処理は、一例として、プログラムの形式でビデオ会議サーバ５０が備える記憶部５３などに記憶されており、このプログラムをＣＰＵ（プロセッサ）５１がメインメモリ５２に読み出して、情報の加工・演算処理を実行することにより、各種機能が実現される。なお、プログラムは、記憶部５３に予めインストールされている形態や、他のコンピュータ読み取り可能な記憶媒体に記憶された状態で提供される形態、有線又は無線による通信手段を介して配信される形態等が適用されてもよい。コンピュータ読み取り可能な記憶媒体とは、磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等である。

【0057】

図１０に示すように、ビデオ会議サーバ５０は、受信部６１、輝度演算部６２、輝度調整部６３、画像合成部６４、及び送信部６５を備えている。

【0058】

受信部６１は、各情報処理装置１０から送信された画像データを受信する。
輝度演算部６２は、各情報処理装置１０から受信した各画像データについて輝度ヒストグラムを演算する。
輝度調整部６３は、複数の画像データの輝度ヒストグラムのばらつきが小さくなるように、各画像データの輝度を調整する。例えば、各画像データの輝度ヒストグラムのパーセンタイル５０％の輝度が一致するように、各画像データの輝度を調整する。これにより、画像データ間の輝度のばらつきを軽減することができる。

【0059】

画像合成部６４は、輝度調整後の各画像データを共通のバーチャル背景下に配置し、合成画像を作成する。共通のバーチャル背景に画像データを配置させる処理は、所定のアルゴリズムに従って自動的に行われてもよいし、ビデオ会議のホスト（いずれか１つの情報処理装置１０）からの入力指令に基づいて配置することとしてもよい。
送信部６５は、合成画像を各情報処理装置１０に送信する。

【0060】

次に、本実施形態におけるビデオ会議システム１の動作について簡単に説明する。
例えば、各情報処理装置１０の入力デバイス４を各ユーザ（参加者）が操作することにより、ビデオ会議が開始され、カメラ機能がオンにされると、カメラ７によりユーザの画像データが取得され、画像処理部２０に入力される。画像処理部２０は、カメラ７から入力される画像データに対して上述した画像処理を実行する。これにより、ユーザの年齢に応じて画像データにおける顔の横幅寸法及び高さ寸法が調整され、調整後の画像データがビデオ会議サーバ５０に送信される。

【0061】

ビデオ会議サーバ５０は、各情報処理装置１０から画像データをそれぞれ受信すると、受信したこれら画像データの輝度調整を行い、輝度調整後の画像データを共通のバーチャル背景に配置することにより、合成画像を作成する。そして、作成した合成画像を各情報処理装置１０に送信する。これにより、各情報処理装置１０のディスプレイ５には、例えば、図１１に示すように、共通のバーチャル背景に各参加者が配置された画像が表示されることとなる。このとき、各参加者の顔の大きさは、年齢に応じた横幅に調整され、また、各参加者の画像の輝度は、ばらつきが低減されるように調整されている。これにより、全体として統一感のあるイマーシブビューを各参加者に提供することができる。

【0062】

以上説明してきたように、本実施形態に係る画像処理部（画像処理装置）２０、情報処理装置１０、ビデオ会議サーバ５０、及びビデオ会議システム１によれば、以下の作用効果を奏する。

【0063】

画像処理部２０は、カメラ７によって撮像された画像データに含まれる人物の顔領域を特定し、特定した顔領域の所定高さ位置における横幅寸法Ｌ１及び人物の高さ寸法Ｌ２を検出し、年齢に応じた横幅基準値Ｌ１＿ｒｅｆ及び高さ基準値Ｌ２＿ｒｅｆを取得し、取得した横幅基準値Ｌ１＿ｒｅｆ及び高さ基準値Ｌ２＿ｒｅｆに横幅寸法及び高さ寸法が近づくように画像データを調整する。また、調整後の画像データに不足画素が生じていた場合には、不足した画素を周囲の画素情報から推測して補充する。これにより、顔の大きさや人物の高さが年齢に応じて規格化された画像を出力することができる。

【0064】

また、画像を調整する際には、今回検出された横幅寸法だけでなく、直近に検出された所定数の横幅寸法を統計的に処理することにより、代表的な横幅寸法を演算し、代表的な横幅寸法が横幅基準値になるような調整比率を演算し、演算した調整比率を用いて画像データを拡大又は縮小させる。このように、直近に検出された複数の横幅寸法も加味して調整比率を算出することにより、調整比率の変化を滑らかにすることが可能となり、時間軸上における画像の変化を抑制することが可能となる。上記統計的処理の一例として、平均化処理、正規化処理などが挙げられる。

【0065】

また、人物の年齢を画像データから推定し、推定した年齢に基づいて横幅基準値及び高さ基準値を特定するので、ユーザが年齢を入力する手間を省略することが可能となる。

【0066】

また、今回推定された年齢と直近に推定された所定数の年齢を統計的に処理することにより代表的な年齢を演算し、代表的な年齢に対応する横幅基準値及び高さ基準値を基準情報から特定する。これにより、横幅基準値の変化を滑らかにすることが可能となる。

【0067】

基準情報は、性別に応じてそれぞれ設けられているので、性別も加味した自然な人物の大きさになるように画像データを調整することが可能となる。

【0068】

なお、上述した実施形態では、顔の横幅と人物の高さの両方を調整することとしたがこれに限られない。例えば、顔の横幅のみを調整することとし、人物の高さ位置については調整しないような構成としてもよい。

【0069】

本実施形態では、所定数の横幅寸法Ｌ１を統計的に処理することにより代表的な横幅寸法を演算し、演算した横幅寸法と横幅基準値Ｌ１＿ｒｅｆとを用いて調整比率を算出していたが、この例に限定されない。例えば、パラメータ記憶部２５には、１つのデータセットのみが格納されるような構成とし、最新の横幅寸法Ｌ１と横幅基準値Ｌ１＿ｒｅｆとを用いて調整比率を算出することとしてもよい。

【0070】

人物の高さ寸法Ｌ２についても同様に、最新の高さ寸法Ｌ２と高さ基準値Ｌ２＿ｒｅｆを用いて画像データを調整することとしてもよい。
本実施形態では、所定数の年齢を統計的に処理することにより代表的な年齢を演算し、演算した年齢から横幅基準値及び高さ基準値を特定していたがこの例に限定されない。例えば、最新の年齢に基づいて横幅基準値及び高さ基準値を特定することとしてもよい。

【0071】

本実施形態では、属性推定部２４が画像データから人物の年齢及び性別を推定していたがこの例に限定されない。例えば、年齢及び性別については、画像データから推定するのではなく、情報処理装置１０が備える記憶部１３にユーザ情報として登録されているユーザの年齢情報及び性別情報を取得することとしてもよい。

【0072】

本実施形態では、性別に応じて基準情報を設けていたがこの例に限定されない。例えば、基準情報は性別に応じて設けられておらず、性別にかかわらずに共通の基準情報を用いて横幅基準値などを特定することとしてもよい。

【0073】

本実施形態において、画像処理部２０は、カメラ７と一体化されていてもよく、カメラ７と画像処理部２０とが一体化されたカメラモジュールとして提供されてもよい。この場合、カメラモジュールから出力された画像データは、その画像データに含まれる人物の大きさがすでに規格化されているため、情報処理装置１０は、カメラモジュールから出力される画像データをビデオ会議サーバ５０に送信することとなる。

【0074】

〔第２実施形態〕
次に、本発明の第２実施形態に係る画像処理装置、情報処理装置、ビデオ会議サーバ５０ａ、及びビデオ会議システムについて説明する。
上述した実施形態では、各情報処理装置１０が画像処理部２０を備えていたが、本実施形態では、情報処理装置ではなく、ビデオ会議サーバが画像処理部２０を備えている点が上述した第１実施形態と異なる。以下、上述した第１実施形態と共通する構成については同一の符号を付して説明を省略し、異なる点について主に説明する。

【0075】

図１２は、本実施形態に係るビデオ会議サーバ５０ａが備える機能の一例を示した機能ブロック図である。図１２に示すように、ビデオ会議サーバ５０ａは、受信部６１によって受信された各情報処理装置１０からの画像データにおける人物の大きさ及び位置を調整するための画像処理部２０を備えている。この画像処理部２０の詳細な機能や処理手順の一例は、上述した実施形態で述べた通りである。

【0076】

画像処理部２０による調整後の画像データは、輝度演算部６２に出力され、輝度調整のための処理が更に行われる。ここで、輝度調整とサイズ調整とはどちらを先に行ってもよい。例えば、輝度調整部６３によって輝度が調整された後の各画像データを画像処理部２０に入力することとしてもよい。

【0077】

また、輝度調整は省略することとしてもよい。この場合、図１２において、輝度演算部６２及び輝度調整部６３が省略された構成とされる。これにより、画像処理部２０によって調整された画像データが画像合成部６４に入力されることとなり、入力された画像データが共通の背景に配置されることとなる。

【0078】

〔第３実施形態〕
次に、本発明の第３実施形態に係る画像処理装置、情報処理装置、ビデオ会議サーバ５０ｂ、及びビデオ会議システムについて説明する。
上述した第２実施形態では、ビデオ会議サーバ５０ｂが基準情報を用いて各情報処理装置から受信した画像データの人物の大きさ及び高さ位置を規格化することとしたが、本実施形態に係るビデオ会議サーバ５０ｂは、画像データの調整方法が上述した第２実施形態と異なる。具体的には、本実施形態では、ビデオ会議サーバ５０ｂが各情報処理装置からの画像データを取得することができることを利用し、各情報処理装置から受信した複数の画像データに基づいて横幅基準値を導出する。
以下、上述した第２実施形態と共通する構成については同一の符号を付して説明を省略し、異なる点について主に説明する。

【0079】

図１３は、本実施形態に係るビデオ会議サーバ５０ｂが備える機能の一例を示した機能ブロック図である。図１３に示すように、ビデオ会議サーバ５０ｂは、受信部６１、顔領域特定部７１、寸法検出部７２、画像調整部７３、輝度演算部６２、輝度調整部６３、画像合成部６４、及び送信部６５を備えている。

【0080】

受信部６１は、各情報処理装置１０から送信される画像データを受信する。
顔領域特定部７１は、各画像データに含まれる人物（参加者）の顔領域を特定する。なお、顔領域特定部７１は、上述した顔領域特定部２２と同様の機能であるため、詳細は省略する。
寸法検出部７２は、特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する。これにより、各画像データにおける顔の横幅寸法が検出される。

【0081】

画像調整部７３は、各画像データにおいて検出された複数の横幅寸法を統計的に処理することにより、基準となる横幅基準値を取得する。例えば、画像調整部７３は、横幅寸法の平均値を横幅基準値として取得する。また、画像調整部７３は、横幅寸法の分布（ばらつき）の所定のパーセンタイル（例えば、５０％）の値を横幅基準値として取得してもよいし、横幅寸法の最大値を横幅基準値として取得してもよい。

【0082】

続いて、画像調整部７３は、各画像データにおける各横幅寸法を横幅基準値に近づけるように、各画像データを調整する。すなわち、各画像データにおける人物（参加者）の横幅寸法と横幅基準値とから調整比率を演算し、演算した調整比率に基づいて画像データを拡大縮小させる。これにより、各情報処理装置１０から受信した各画像データにおける人物の顔の大きさのばらつきを低減させることが可能となる。

【0083】

調整後の画像データは、輝度演算部６２及び輝度調整部６３によって輝度調整された後に、画像合成部６４によって共通のバーチャル背景下に配置される。合成画像は、送信部６５によって各情報処理装置１０に送信される。

【0084】

なお、上記説明では、顔の横幅寸法を調整する場合について説明したが、顔の横幅だけでなく、人物の高さ寸法についても同様の手法によって調整することとしてもよい。すなわち、各画像データにおける人物の高さ寸法を検出し、検出した複数の高さ寸法を統計的に処理することにより、基準となる高さ基準値を取得する。例えば、高さ寸法の平均値を高さ基準値として取得する。また、高さ寸法の分布（ばらつき）の所定のパーセンタイル（例えば、５０％）の値を高さ基準値として取得してもよいし、高さ寸法の最大値を高さ基準値として取得してもよい。

【0085】

そして、各画像データにおける各高さ寸法を高さ基準値に近づけるように、各画像データを調整する。具体的には、各画像データにおける人物（参加者）の高さ寸法が高さ基準値と一致するように、画像データにおける人物の高さ位置を調整する。これにより、各情報処理装置１０から受信した各画像データにおける人物の高さ位置のばらつきを低減させることができる。

【0086】

なお、第３実施形態に係るビデオ会議サーバ５０ｂは、上述した第１実施形態に係る情報処理装置１０と組み合わせて利用することが可能である。この場合、各情報処理装置１０からはすでに規格化された画像データを受信することとなる。そして、更にビデオ会議サーバ５０ｂにおいて、上述した画像調整を行うことにより、各画像データにおける人物の横幅や高さ位置を統一させることが可能となる。

【0087】

以上、本発明について実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施形態に多様な変更又は改良を加えることができ、該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。
また、上記実施形態で説明した処理の流れも一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。

【0088】

例えば、上述した各実施形態では、ビデオ会議サーバを設けていたが、ビデオ会議サーバの機能の全部又は一部をビデオ会議のホストとなる情報処理装置１０が備えていてもよい。

【符号の説明】

【0089】

１：ビデオ会議システム
４：入力デバイス
５：ディスプレイ
７：カメラ
８：ネットワーク
１０：情報処理装置
１１：ＣＰＵ
１２：メインメモリ
１３：記憶部
１４：外部インターフェース
１５：通信インターフェース
１６：スピーカ
１７：マイク
２０：画像処理部
２１：画像取得部
２２：顔領域特定部
２３：寸法検出部
２４：属性推定部
２５：パラメータ記憶部
２６：基準情報記憶部
２７：基準値特定部
２８：画像調整部
２９：出力部
５０：ビデオ会議サーバ
５０ａ：ビデオ会議サーバ
５０ｂ：ビデオ会議サーバ
５１：ＣＰＵ
５２：メインメモリ
５３：記憶部
５４：外部インターフェース
５５：通信インターフェース
６１：受信部
６２：輝度演算部
６３：輝度調整部
６４：画像合成部
６５：送信部
７１：顔領域特定部
７２：寸法検出部
７３：画像調整部
Ｌ１：横幅寸法
Ｌ１＿ｒｅｆ：横幅基準値
Ｌ２：高さ寸法
Ｌ２＿ｒｅｆ：高さ基準値

【要約】

【課題】共通の背景に配置される参加者の顔の大きさのばらつきを低減すること。
【解決手段】画像処理部２０は、画像データを取得する画像取得部２１と、画像データに含まれる人物の顔領域を特定する顔領域特定部２２と、特定された顔領域の所定高さ位置における横幅の寸法を横幅寸法として検出する寸法検出部２３と、年齢と顔領域の横幅基準値とが関連付けられた基準情報から人物の年齢に対応する横幅基準値を特定する基準値特定部２７と、特定された横幅基準値に横幅寸法を近づけるように画像データを調整する画像調整部２８と、調整後の画像データを出力する出力部２９とを備える。
【選択図】図４