(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0014】
以下、本発明に係る撮像装置、画像処理装置及び画像処理方法を具体的に開示した実施形態(以下、「本実施形態」という)について、図面を参照して説明する。本実施形態の撮像装置は、例えばDSC(Digital Still Camera)、デジタルカムコーダ、カメラ機能を有するスマートフォンや携帯電話機やタブレット端末、監視カメラである。本実施形態の画像処理装置は、例えばエンコーダのアプリケーションがインストールされた電子機器(例えばデスクトップ型又はラップトップ型のPC)、専用機器としてのエンコーダ機器、レコーダである。
【0015】
以下、本実施形態では、画像処理装置を例示して画像処理装置の動作を説明するが、画像処理装置の説明は、画像処理装置と撮像装置との構成上の相違に基づく説明以外は、撮像装置の説明として共通に適用可能である。本実施形態の画像処理装置は、人物が撮像された画像データを外部(例えば画像処理装置に接続された外部装置)から入力し、入力した画像データの特定色の領域を検出し、入力された画像データのフレームとその入力した時点の前後における各々の画像データのフレームとを用いて、画像データのフレーム内の特定色(例えば肌色)の領域における画素値を平滑化する。平滑化の一例としては、例えば前後のフレームと対応する特定色の領域の画素値を用いた平均化処理を用いるが、詳細については後述する。画像処理装置は、画素値が平滑化された後の出力画像を符号化し、符号化された出力画像を外部(例えばネットワークに接続された外部装置、又はディスプレイ)に出力する。
【0016】
先ず、本実施形態の画像処理装置又は撮像装置における脈拍数の推定原理について、
図1(A)及び(B)を参照して説明する。
図1(A)は、人の心臓の収縮と光の血管における吸収量との関係の一例を模式的に示す図である。
図1(B)は、光の強度の時系列変化の一例を示す図である。
【0017】
図1(A)では、人の心臓の収縮(systole)に同期して血管の容積が変化することが示されている。心臓の収縮に応じて血管の容積が増大すると、光(例えば
図2に示す特定波長域の光)の吸収量が増大するので、光の強度(Light intensity)も減少する(
図1(B)参照)。なお、脈波とは、血液が心臓の収縮により大動脈に押し出された時に発生した血管内の圧力変化が末梢方向に伝わっていく時の波の動きを示す。
【0018】
図1(B)では、横軸は時間を示し、縦軸は光の吸収量の変化によって得られた信号(光電脈波)の強度を示す。つまり、
図1(B)において、ピークが現れている時は光の吸収量が少ないので血管の容積が増大していない状態になっており、極小値が現れている時には光の吸収量が多いので血管の容積が増大している状態となっている。なお、心臓と末梢部分との距離によって完全には同期しておらず多少の遅延は見られるが、心臓の収縮と光電脈波の強度の変化とは基本的に同期して変動している。
【0019】
図2は、ヘモグロビンにおける光の波長毎の吸収率の一例を示す図である。
図2では、例えばヘモグロビン(血液)は400nmの波長(つまり緑色)を吸収し易いことが示されている。以下の本実施形態では、撮像された人物(例えばテレビ番組の出演者)のプライバシーを的確に保護するために、画像処理装置は、撮像により得られた画像データを構成する1枚のフレーム内における特定色(例えば肌色)の領域の画素値を平滑化することを説明する。但し、特定色は肌色に限定されず、例えば画像処理装置は、赤色(
図2に示す1000nmを超える波長)の領域の画素値を平滑化してもよい。
【0020】
先ず、本実施形態の画像処理装置1及び撮像装置1Aの構成について、
図3及び
図4を参照して説明する。
図3は、本実施形態の画像処理装置1の内部構成の一例を示すブロック図である。
図4は、本実施形態の撮像装置1Aの内部構成の一例を示すブロック図である。
図4では、
図3に示す画像処理装置1の各部と同一の構成には同一の符号を付与して説明を簡略化又は省略する。
【0021】
図3に示す画像処理装置1は、画像入力部11と、画像蓄積部13と、肌色領域検出部15と、光電脈波変動除去フィルタ17と、画像符号化部19と、画像出力制御部21と、記録メディア23と、画像出力部25とを含む構成である。
【0022】
図4に示す撮像装置1Aは、撮像部27と、画像蓄積部13Aと、信号処理部29と、肌色領域検出部15と、光電脈波変動除去フィルタ17と、画像符号化部19と、画像出力制御部21と、記録メディア23と、画像出力部25とを含む構成である。
【0023】
画像入力部11は、不図示の外部装置(例えば所定のフレームレートで撮像するカメラ)により人物(例えばテレビ番組の出演者)が撮像された画像データのフレームを外部装置から連続的に入力(取得)して画像蓄積部13に保存する。
【0024】
記憶部の一例としての画像蓄積部13は、例えばDRAM(Dynamic Random Access Memory)等の半導体メモリ又はハードディスクを用いて構成され、画像入力部11が入力した画像データ、光電脈波変動除去フィルタ17の出力画像の画像データを保存する。
【0025】
領域検出部の一例としての肌色領域検出部15は、画像入力部11が画像蓄積部13に保存した画像データを読み出し、画像データのフレーム内の特定色(例えば肌色)の領域(例えば
図5に示す人物HMの顔領域FC,手領域HD)を検出する。肌色領域検出部15は、画像データのフレームの中で検出した特定色の領域に関する情報(例えば座標)を光電脈波変動除去フィルタ17に出力する。なお、肌色領域検出部15における特定色(例えば肌色)の領域の検出方法については、
図5を参照して後述する。
【0026】
フィルタ部の一例としての光電脈波変動除去フィルタ17は、画像入力部11が画像蓄積部13に保存した画像データを部分領域毎に読み出し、画像入力部11が入力した画像データのフレームの該当する部分領域の画素値と画像入力部11への入力前後の各々の画像データのフレームの対応する部分領域の画素値とを用いて、肌色領域検出部15により検出された特定色の領域の画像データの画素値を平滑化する(
図6参照)。画素値は、輝度(Y)と色差(U,V)とにより示される。光電脈波変動除去フィルタ17は、特定色の領域の画像データの画素値を平滑化した後の画像データを画像蓄積部13に保存する。なお、光電脈波変動除去フィルタ17における平滑化方法については、
図6〜
図8を参照して後述する。
【0027】
符号化部の一例としての画像符号化部19は、画像蓄積部13に保存された光電脈波変動除去フィルタ17の出力画像の画像データ(つまり、光電脈波変動除去フィルタ17により平滑化された特定色の領域の画素値を有する画像データ)を用いて、画像データの保存及び送信が可能な所定のデータフォーマットに変換するための符号化データを生成する。画像符号化部19は、画像データの符号化データを画像出力制御部21に出力する。
【0028】
画像出力制御部21は、画像符号化部19により符号化された画像データを記録メディア23に保存し、又は画像出力部25に出力する。
【0029】
記録部の一例としての記録メディア23は、例えばDRAM等の半導体メモリ又はハードディスクを用いて構成され、画像符号化部19により生成された画像データの符号化データを記録する。なお、記録メディア23は、画像処理装置1又は撮像装置1Aに内蔵された半導体メモリ又はハードディスクに限定されず、例えばUSB(Universal Serial Bus)端子を介して接続可能な外部接続媒体(例えばDRAM等の半導体メモリ)でもよい。
【0030】
出力部の一例としての画像出力部25は、画像出力制御部21における指示に応じて、画像符号化部19により生成された画像データの符号化データを用いて、例えば送信先である外部装置(不図示)に送信するためのパケット生成処理を行い、画像データの符号化データのパケットを外部装置に送信する。これにより、画像出力部25は、特定色の領域の画素値が平滑化された画像データ(言い換えると、画像データに現れる人物の脈拍数の解析が困難な画像データ)を外部装置に送信できる。
【0031】
ネットワークは、無線ネットワーク又は有線ネットワークである。無線ネットワークは、例えばNFC(Near Field Communication)、Bluetooth(登録商標)、IrDA、無線LAN(Local Area Network)、3G、LTE(Long Term Evolution)又はWiGigである。有線ネットワークは、例えばイントラネット又はインターネットである。
【0032】
また、画像出力部25は、画像出力制御部21における指示に応じて、画像蓄積部13に保存された光電脈波変動除去フィルタ17の出力画像の画像データ(つまり、光電脈波変動除去フィルタ17により平滑化された特定色の領域の画素値を有する画像データ)を、例えばディスプレイ(不図示)に表示する。
【0033】
一方、
図4に示す撮像装置1Aでは、撮像部27は、被写体としての人物(例えばテレビ番組の出演者)を撮像するためのレンズ及びイメージセンサを少なくとも含む構成である。レンズ(不図示)は、撮像装置1Aの外部から入射する環境光を集光し、イメージセンサ(不図示)の所定の撮像面に結像させる。
【0034】
イメージセンサは、例えばCCD(Charged-Coupled Device)又はCMOS(Complementary Metal Oxide Semiconductor)の固体撮像素子を用いて構成され、撮像面に結像した光学像を電気信号に変換する。イメージセンサの出力は、画像蓄積部13Aに入力されて保存される。
【0035】
記憶部の一例としての画像蓄積部13Aは、例えばDRAM等の半導体メモリ又はハードディスクを用いて構成され、撮像部27のイメージセンサの出力、光電脈波変動除去フィルタ17の出力画像の画像データを保存する。
【0036】
信号処理部29は、画像蓄積部13Aに保存されたイメージセンサの出力を用いて、人が認識可能なRGB(Red Green Blue)形式の画像データ又はYUV(輝度(Y)・色差(U、V))により規定される画像データのフレームを生成し、生成したフレームを画像蓄積部13Aに保存する。
【0037】
次に、肌色領域検出部15が画像データのフレーム内の特定色(例えば肌色)の領域を検出する方法について、
図5を参照して説明する。
図5は、人物の肌色領域の検出に関する説明図である。
図5では、肌色領域検出部15が画像データのフレーム内の特定色(例えば肌色)の領域を検出する方法として例えば2種類の方法を説明する。
【0038】
第1例では、肌色領域検出部15は、画像データのフレーム内の画素値(例えば色差)がHSV色空間において予め指定された範囲(例えば0と60との間の所定範囲)に含まれる色を肌色と判定する。従って、肌色領域検出部15は、
図5の上段に示す人物HMが映っている画像データに対し、顔領域FC及び手領域HDを肌色の領域として検出する。
【0039】
第2例では、肌色領域検出部15は、
図5の下段に示す人物HMが映っている画像データのフレーム内に対して輝度信号を基にした画像処理(例えば顔検出処理)を行うことで人物HMの顔を検出し、検出された顔領域FCと同一又は顔領域FCの色差から所定範囲内の色差を有する領域の色を肌色と判定する。従って、肌色領域検出部15は、
図5の下段に示す人物HMが映っている画像データに対し、顔領域FCと同じ又は顔領域FCに近い(同等の)色差を有する手領域HDを肌色の領域として検出する。
【0040】
次に、光電脈波変動除去フィルタ17が特定色(例えば肌色)の領域の画素値を平滑化する処理について、
図6〜
図8を参照して説明する。
図6は、光電脈波変動除去フィルタ17の動作概要を示す説明図である。
図7は、被写体の人物が静止している場合の光電脈波変動除去フィルタ17の動作例を示す説明図である。
図8は、被写体の人物が移動している場合の光電脈波変動除去フィルタ17の動作例を示す説明図である。
【0041】
図6に示すように、光電脈波変動除去フィルタ17は、肌色領域検出部15により人物の肌色の領域が検出された画像データIM1のフレームに対し、肌色の領域の画素値の微小変動分(
図6に示すグラフGPH1参照)の除去及び平滑化を実行する。画素値は、(1個の画素×1個の画素)、或いは(フレームの横方向32個の画素×同フレームの縦方向32個の画素)から構成可能な1ブロックにおける画素値の平均値でもよい。なお、1ブロックを構成する画素の個数は、(フレームの横方向32個×同フレームの縦方向32個)に限定されない。
【0042】
これにより、グラフGPH1に示される肌色の領域の画素値の時間Tに対する微小変動分が徐々に平滑化されて緩やかになる(グラフGPH2,GPH3参照)。言い換えると、肌色の領域の画素値の元データの推察が困難となり、結果的に脈拍数の推定が困難となるので、画像データIM1のフレームに映っている人物のプライバシーが的確に保護可能となる。
【0043】
ここで、被写体の人物が静止している状態を例示し、光電脈波変動除去フィルタ17の動作例について
図7を参照してより具体的に説明する。
図7では、画像入力部11が入力した画像(入力画像)のフレームPが時刻T毎に連続的に入力される。光電脈波変動除去フィルタ17は、時刻T=tにおいて入力されたフレームP(t)と、その入力前後の時刻T=(t−1),T=(t+1)において入力されたフレームP(t−1),P(t+1)とを用いて、特定色(例えば肌色)の領域TGの画素値P(t,i,j)を平滑化する。
【0044】
具体的には、光電脈波変動除去フィルタ17は、特定色(例えば肌色)の領域TGの画素値P(t,i,j)の時間方向の平滑化として、フレームP(t)における特定色(例えば肌色)の領域TGの画素値P(t,i,j)と、対応するフレームP(t−1),P(t+1)における特定色(例えば肌色)の領域TGの画素値P(t−1,i,j),P(t+1,i,j)との平均値(数式(1)参照)を算出する。なお、光電脈波変動除去フィルタ17は、特定色(例えば肌色)の領域TG以外の画素値については、数式(1)による平滑化は実行しない。
【0045】
数式(1)において、Q(t,i,j)は、光電脈波変動除去フィルタ17におけるフレームP(t)内の特定色(例えば肌色)の領域TGの画素値P(t,i,j)の平滑化出力を示す。また、数式(1)において、P(t,i,j)は、時刻T=tにおいて入力されたフレームP(t)内の座標(i,j)における画素値を示す。
【0047】
なお、光電脈波変動除去フィルタ17は、時刻T=tにおけるフレームP(t)内の特定色の領域の画素値と時刻T=(t−1),(t+1)におけるフレームP(t−1),P(t+1)の対応する特定色の領域の画素値との差分が所定値(例えば4)より大きい場合には、時刻T=tにおけるフレームP(t)内の特定色の領域における画素値の平滑化の実行を省略し、そのまま出力する。これにより、光電脈波変動除去フィルタ17は、画像入力部11が入力した時点のフレームP(t)内に動きが鮮明に現れているので、入力した時点のフレームP(t)とその入力前後の各フレームP(t−1),P(t+1)とを用いた平滑化を行わないことでフレームの画質に対する影響(例えば画質劣化)を低減できる。
【0048】
次に、被写体の人物が移動している状態を例示し、光電脈波変動除去フィルタ17の動作例について
図8を参照してより具体的に説明する。
図8では、
図7と同様に、画像入力部11が入力した画像(入力画像)のフレームPが時刻T毎に連続的に入力される。光電脈波変動除去フィルタ17は、時刻T=tにおいて入力されたフレームP(t)と、その入力前後の時刻T=(t−1),T=(t+1)において入力されたフレームP(t−1),P(t+1)と、隣接する前後のフレーム間で発生した特定色(例えば肌色)の領域の動きベクトルとを用いて、特定色(例えば肌色)の領域TGの画素値P(t,i,j)を平滑化する。
【0049】
具体的には、光電脈波変動除去フィルタ17は、画像データのフレームをブロック単位(例えば4画素×4画素、8画素×8画素、16画素×16画素、…)に分割し、ブロック単位で同一又は類似した画素値を有するブロックが隣接する前後のフレームのどこにあるかをスキャンして探索する。例えば、光電脈波変動除去フィルタ17は、前フレーム(時刻T=(t−1)のフレーム)のブロックB、現フレーム(時刻T=tのフレーム)のブロックNについて、数式(2)に示す画素値の差分絶対値の和を算出する。光電脈波変動除去フィルタ17は、ブロック同士で対応する位置における画素値の差分絶対値の和の最小値が得られるブロックを、隣接する前後のフレームにおいて現フレームの特定色(例えば肌色)の領域と同一又は類似した画素値を有するブロックとして決定する。
【0051】
次に、光電脈波変動除去フィルタ17は、隣接する前後のフレームにおいて同一又は類似した画素値を有するブロックの位置までのベクトル値を動きベクトルとして算出する。
図8では、光電脈波変動除去フィルタ17により算出された前フレーム(つまり、時刻T=(t−1)のフレーム)に対する動きベクトルは(X
(t−1),Y
(t−1))として示され、光電脈波変動除去フィルタ17により算出された後フレーム(つまり、時刻T=(t+1)のフレーム)に対する動きベクトルは(X
(t+1),Y
(t+1))として示される。
【0052】
光電脈波変動除去フィルタ17は、算出した動きベクトルを用いて、時刻T=tのフレームP(t)における特定色(例えば肌色)の領域の画素値P(t,i,j)と、時刻T=tに隣接する前後のフレーム(つまり、時刻T=(t−1),T=(t+1)における各フレーム)において対応する画素値P(t−1,g,h),画素値P(t+1,k,l)との平均値(数式(3)参照)を算出する。なお、光電脈波変動除去フィルタ17は、特定色(例えば肌色)の領域TG以外の画素値については、数式(3)による平滑化は実行しない。
【0054】
なお、数式(3)において、時刻T=(t−1)におけるフレームP(t−1)において、時刻T=tにおけるフレームP(t)の特定色(例えば肌色)の領域の画素値P(t,i,j)に対応する画素値の座標(g,h)は数式(4)により示される。同様に、数式(3)において、時刻T=(t+1)におけるフレームP(t+1)において、時刻T=tにおけるフレームP(t)の特定色(例えば肌色)の領域の画素値P(t,i,j)に対応する画素値の座標(k,l)は数式(5)により示される。
【0057】
次に、本実施形態の画像処理装置1における光電脈波変動を除去するための動作手順について、
図9を参照して説明する。
図9は、本実施形態の画像処理装置1の動作手順の一例を説明するフローチャートである。
【0058】
図9において、画像入力部11は、不図示の外部装置(例えば所定のフレームレートで撮像するカメラ)により人物(例えばテレビ番組の出演者)が撮像された画像データのフレームを外部装置から連続的に入力(取得)して画像蓄積部13に保存する。肌色領域検出部15は、画像入力部11が画像蓄積部13に保存した画像データを読み出し、画像データのフレーム内の特定色(例えば肌色)の領域(例えば
図5に示す人物HMの顔領域FC,手領域HD)を検出する。肌色領域検出部15は、画像データのフレームの中で検出した特定色の領域に関する情報(例えば座標)を光電脈波変動除去フィルタ17に出力する。
【0059】
光電脈波変動除去フィルタ17は、画像入力部11が画像蓄積部13に保存した画像データを部分領域毎に読み出し(S1)、肌色領域検出部15の出力(つまり、画像データのフレームの中で検出した特定色の領域に関する情報(例えば座標))を基に、読み出した部分領域が肌色であるか否かを判断する(S2)。なお、上述したように、画素値は、(1個の画素×1個の画素)、或いは(フレームの横方向32個の画素×同フレームの縦方向32個の画素)から構成可能な1ブロックにおける画素値の平均値でもよい。
【0060】
光電脈波変動除去フィルタ17は、ステップS1にて読み出した部分領域の画素値のデータが予め指定された色(例えば肌色)である場合には(S2、YES)、ステップS1において読み出した部分領域のフレームと画像入力部11への入力前後の各々の画像データのフレームとを用いて、肌色領域検出部15により検出された特定色の領域の画像データの画素値(より具体的には、輝度(Y)と色差(U,V))を平滑化する(S3)。
【0061】
ステップS3における平滑化処理では、例えば画像データに映る人物が静止している場合には、
図7に示す方法で平滑化処理され、一方、画像データに映る人物が移動している場合には、
図8に示す方法で平滑化処理される。光電脈波変動除去フィルタ17は、特定色の領域の画像データの画素値を平滑化した後の部分領域の画像データを画像蓄積部13に保存する。
【0062】
一方、ステップS1にて読み出された部分領域の画素値のデータが予め指定された色(例えば肌色)ではない場合には(S2、NO)、画像処理装置1の処理はステップS4に進む。
【0063】
画像符号化部19は、画像蓄積部13に保存された光電脈波変動除去フィルタ17の出力画像の画像データ(つまり、光電脈波変動除去フィルタ17がステップS1において読み出した部分領域の画素値が平滑化された部分領域の画像データ)を符号化する(S4)。
【0064】
1つのフレーム内の全体が符号化された場合には(S5、YES)、
図9に示す画像処理装置1の動作は終了する。一方、1つのフレーム内の全体が符号化されていない場合には(S5、NO)、1つのフレーム内の全体が符号化されるまで、ステップS1〜ステップS4の各処理が繰り返される。
【0065】
以上により、本実施形態の画像処理装置1は、人物が撮像された画像データを画像入力部11において入力し、入力した画像データの特定色の領域を肌色領域検出部15において抽出し、入力された画像データのフレームとその入力した時点の前後における各々の画像データのフレームとを用いて、特定色(例えば肌色)の領域における画素値を光電脈波変動除去フィルタ17において平滑化する。また、画像処理装置1は、画素値が平滑化された後の光電脈波変動除去フィルタ17の出力画像を符号化し、符号化された出力画像を外部(例えばネットワークに接続された外部装置、又はディスプレイ)に出力する。
【0066】
これにより、画像処理装置1は、画像データのフレーム内の特定色(例えば肌色)の領域における画素値を平滑化するので、画像データにより構成される映像コンテンツの制作者や配信者が意図しない生体情報(例えば脈拍数)の配信を効果的に抑制できるので、映像コンテンツに現れる人物のプライバシーを的確に保護できる。より具体的な例として、画像処理装置1は、テレビ番組にアナウンサーが出演している場合に発言内容を言い間違えたアナウンサーの脈拍数の上昇や、将棋の対局において棋士の脈拍数の上昇などを視聴者に知られることを防ぐことができ、映像コンテンツの制作者、配信者に出演者のプライバシーを的確に保護可能な映像コンテンツを制作させることが可能となる。
【0067】
また、本実施形態の画像処理装置1は、入力した画像データのフレーム内の特定色の領域の画素値と入力した時点の前後における各々の画像データのフレームの対応する特定色の領域の画素値との差分が所定値(例えば4)より大きい場合に、入力した画像データのフレーム内の特定色の領域における画素値の平滑化の実行を省略し、そのまま出力する。
【0068】
これにより、画像処理装置1は、画像入力部11が入力した時点のフレーム内に動きが鮮明に現れているので、入力した時点のフレームとその入力前後の各フレームとを用いた平滑化を行わないことでフレームの画質に対する影響(例えば画質劣化)を低減できる。
【0069】
また、画像処理装置1では、特定色の領域における画素値は、画像入力部11に入力された画像データのフレームの横方向における複数の画素(例えば32個の画素)及び縦方向における複数の画素(例えば32個)のブロックの平均値が用いられる。
【0070】
これにより、画像処理装置1は、特定色の領域における画素値として複数個の画素を有するブロック単位の画素値の平均値を用いるので、単一の画素の画素値を用いる場合に比べて、特定色の領域における画素値の信頼性を向上できる。
【0071】
以上、図面を参照して各種の実施形態について説明したが、本開示はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本開示の技術的範囲に属するものと了解される。