IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7564635画像処理装置、撮像装置、画像処理方法及びプログラム
<>
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図1
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図2
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図3
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図4
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図5
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図6
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図7
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図8
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図9
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図10
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図11
  • 特許-画像処理装置、撮像装置、画像処理方法及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-01
(45)【発行日】2024-10-09
(54)【発明の名称】画像処理装置、撮像装置、画像処理方法及びプログラム
(51)【国際特許分類】
   H04N 23/60 20230101AFI20241002BHJP
   H04N 23/611 20230101ALI20241002BHJP
   G06T 7/11 20170101ALI20241002BHJP
【FI】
H04N23/60 500
H04N23/611
G06T7/11
【請求項の数】 13
(21)【出願番号】P 2020064201
(22)【出願日】2020-03-31
(65)【公開番号】P2021164066
(43)【公開日】2021-10-11
【審査請求日】2023-03-29
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】佐々木 貴志
【審査官】東松 修太郎
(56)【参考文献】
【文献】特開2009-055125(JP,A)
【文献】特開2017-229061(JP,A)
【文献】特開2016-213744(JP,A)
【文献】特開2017-204673(JP,A)
【文献】特開2018-067190(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/222- 5/257
H04N 23/00
H04N 23/40 -23/76
H04N 23/90 -23/959
G06T 7/11
(57)【特許請求の範囲】
【請求項1】
撮像画像について、各画素に係る被写体を分類した分類情報を取得する取得手段と、
前記撮像画像に基準領域を設定する設定手段と、
前記分類情報に基づいて、前記撮像画像中の前記基準領域に係る被写体の像が表れる領域を示す第1の被写体マップを構成する第1の構成手段と、
前記分類情報に基づかずに、前記撮像画像中の前記基準領域に係る被写体の像が表れる領域を示す第2の被写体マップを構成する第2の構成手段と、
前記第1の被写体マップが示す情報に基づき、有効性を評価する評価手段と、
前記評価手段による評価に基づき、前記第1の被写体マップ及び前記第2の被写体マップの少なくともいずれかに基づいて被写体領域を決定する決定手段と、
前記撮像画像の前記被写体領域と該被写体領域以外の領域とに、それぞれ異なる画像処理を実行する実行手段と、
を有し、
前記決定手段は、前記被写体領域の決定に係り、前記第1の被写体マップの寄与率を前記評価手段による評価に基づいて変更することを特徴とする画像処理装置。
【請求項2】
前記分類情報は、前記撮像画像または該撮像画像と対応して撮像された画像を参照することで、各画素に係る被写体を分類した情報であり、
前記評価手段は、前記各画素に係る被写体の分類に参照された画像に基づいて、前記第1の被写体マップの有効性を評価する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記評価手段は、前記各画素に係る被写体の分類に参照された画像の、前記基準領域中に含まれる有効画素の割合に基づいて、前記第1の被写体マップの有効性を評価する請求項に記載の画像処理装置。
【請求項4】
前記評価手段は、前記第1の被写体マップの有効性の評価に際して、前記基準領域に係る被写体の種類に応じて、前記基準領域を拡張する請求項に記載の画像処理装置。
【請求項5】
前記有効画素は、前記各画素に係る被写体の分類に参照された画像のうちの、所定のコントラストを示さない画素及びノイズを示す画素の少なくともいずれかを除外した画素であることを特徴とする請求項またはに記載の画像処理装置。
【請求項6】
前記分類情報は、深度方向の被写体距離の分布を示した距離情報、被写体の像の経時変化に基づく動きベクトルの分布を示した動きベクトル情報、被写体の像の色分布を示した色ラベリング情報、及び機械学習により意味的領域分割された情報のいずれかであることを特徴とする請求項乃至のいずれか1項に記載の画像処理装置。
【請求項7】
前記分類情報には、序列が定められた複数の分類が含まれ、
前記第1の構成手段は、前記分類情報の各分類についての頻度分布のうち、前記基準領域が該当する分類を含み、かつ、所定の閾値を超える頻度を示す連続した分類の範囲に含まれる画素を、前記基準領域に係る被写体の像が表れる領域とするように前記第1の被写体マップを構成することを特徴とする請求項乃至のいずれか1項に記載の画像処理装置。
【請求項8】
前記評価手段は、前記基準領域のサイズが小さいほど、低い有効性を示すよう評価することを特徴とする請求項乃至のいずれか1項に記載の画像処理装置。
【請求項9】
前記第2の構成手段は、前記基準領域に係る被写体の種類について予め定められた形状の領域を、前記基準領域に係る被写体の像が表れる領域とするように前記第2の被写体マップを構成することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
【請求項10】
前記基準領域に係る被写体は、人物であり、
前記設定手段は、前記撮像画像に含まれる人物の顔領域を検出する検出手段を含み、
前記第2の構成手段は、前記基準領域を含む人物外形の形状の領域を、前記基準領域に係る被写体の像が表れる領域とするように前記第2の被写体マップを構成する
ことを特徴とする請求項に記載の画像処理装置。
【請求項11】
前記撮像画像を撮像する撮像手段と、
請求項1乃至10のいずれか1項に記載の画像処理装置と、
を有することを特徴とする撮像装置。
【請求項12】
画像処理装置が撮像画像に対して実行する画像処理方法であって、
前記撮像画像について、各画素に係る被写体を分類した分類情報を取得する取得工程と、
前記撮像画像に含まれる所定の種類の被写体の像の一部が表れる領域を基準領域として設定する設定工程と、
前記分類情報に基づいて、前記撮像画像中の前記基準領域に係る被写体の像が表れる領域を示す第1の被写体マップを構成する第1の構成工程と、
前記分類情報に基づかずに、前記撮像画像中の前記基準領域に係る被写体の像が表れる領域を示す第2の被写体マップを構成する第2の構成工程と、
前記第1の被写体マップが示す情報に基づき、有効性を評価する評価工程と、
前記評価工程における評価に基づき、前記第1の被写体マップ及び前記第2の被写体マップの少なくともいずれかに基づいて被写体領域を決定する決定工程と、
前記撮像画像の前記被写体領域と該被写体領域以外の領域とに、それぞれ異なる画像処理を実行する実行工程と、
を有し、
前記決定工程において、前記被写体領域の決定に係り、前記第1の被写体マップの寄与率を前記評価工程における評価に基づいて変更することを特徴とする画像処理方法。
【請求項13】
コンピュータを、請求項1乃至10のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、撮像装置、画像処理方法及びプログラムに関し、特に撮像により得られた画像に対して、撮像後に所定の効果を付加する画像処理を適用する技術。
【背景技術】
【0002】
撮像して得られた画像について、該画像に表れる被写体像の領域を分類し、特定の領域に、あるいは領域ごとに所定の効果を付加する画像処理を適用することがある。例えば、特許文献1には、撮像画像に含まれる画素群を、該画素の像のデフォーカス量で分類し、特定のデフォーカス範囲に属する画素に対して画像処理を適用することで、異なる被写界深度の表現を示す画像を生成する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2008-015754号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、特許文献1に記載の記述では、デフォーカス量の導出は画像に基づいて行われるため、低コントラスト環境下や高いISO感度設定で撮像を行った場合、撮像画像に生じるノイズによってデフォーカス量の導出精度は低下する。結果、所望の被写体が含まれるデフォーカス範囲を好適に特定することができず、画像処理を適用した場合に、好適な効果が表れた画像を出力できない可能性がある。
【0005】
本発明は、上述の問題点に鑑みてなされたものであり、好適に被写体領域を特定し、例えば該被写体領域への所望の効果付加を実現する画像処理装置、撮像装置、画像処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
前述の目的を達成するために、本発明の画像処理装置は、撮像画像について、各画素に係る被写体を分類した分類情報を取得する取得手段と、撮像画像に基準領域を設定する設定手段と、分類情報に基づいて、撮像画像中の基準領域に係る被写体の像が表れる領域を示す第1の被写体マップを構成する第1の構成手段と、分類情報に基づかずに、撮像画像中の基準領域に係る被写体の像が表れる領域を示す第2の被写体マップを構成する第2の構成手段と、第1の被写体マップが示す情報に基づき、有効性を評価する評価手段と、評価手段による評価に基づき、第1の被写体マップ及び第2の被写体マップの少なくともいずれかに基づいて被写体領域を決定する決定手段と、撮像画像の被写体領域と該被写体領域以外の領域とに、それぞれ異なる画像処理を実行する実行手段と、を有し、決定手段は、被写体領域の決定に係り、第1の被写体マップの寄与率を評価手段による評価に基づいて変更することを特徴とする。
【発明の効果】
【0007】
このような構成により本発明によれば、好適に被写体領域を特定し、例えば該被写体領域への所望の効果付加を実現することが可能となる。
【図面の簡単な説明】
【0008】
図1】本発明の実施形態に係るデジタルカメラ100の機能構成を例示したブロック図
図2】本発明の実施形態に係る撮像部105の詳細構成を説明するための図
図3】本発明の実施形態に係る画像処理部107の機能構成を例示したブロック図
図4】本発明の実施形態に係るデフォーカス量の導出方法を説明するための図
図5】本発明の実施形態に係るデフォーカス量の導出方法を説明するための別の図
図6】本発明の実施形態に係る画像処理部107が実行する画像効果処理を説明するための図
図7】本発明の実施形態に係る画像効果処理で生成されるデフォーカスマップを例示した図
図8】本発明の実施形態に係る画像効果処理で構成されるデフォーカス量のヒストグラムを例示した図
図9】本発明の実施形態に係る画像効果処理で構成される第1の被写体マップを例示した図
図10】本発明の実施形態に係る画像効果処理における第1の被写体マップの有効性と第2の被写体マップの寄与率とを説明するための図
図11】本発明の実施形態に係る画像効果処理における被写体領域の決定の流れを説明するための図
図12】本発明の実施形態に係る画像処理部107が実行する画像効果処理を例示したフローチャート
【発明を実施するための形態】
【0009】
[実施形態]
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0010】
以下に説明する一実施形態は、画像処理装置の一例としての、撮像範囲の被写体の奥行き方向(深度方向)の距離分布と対応する情報(デフォーカスマップ)を取得可能なデジタルカメラに、本発明を適用した例を説明する。しかし、本発明は、撮像画像と、該撮像画像の各画素に係る被写体の像を分類した分類情報を取得することが可能な任意の機器に適用可能である。
【0011】
《デジタルカメラの構成》
図1は、本発明の実施形態に係るデジタルカメラ100の機能構成を示したブロック図である。
【0012】
システム制御部101は、例えばCPU等の、デジタルカメラ100が備える各ブロックを制御する制御装置である。システム制御部101は、デジタルカメラ100が備える各ブロックの動作プログラムをROM102から読み出して、RAM103に展開して実行することによりデジタルカメラ100が備える各ブロックの動作を制御する。
【0013】
ROM102は、例えばフラッシュROM等の書き換え可能な不揮発性メモリである。ROM102は、デジタルカメラ100が備える各ブロックの動作プログラムに加え、各ブロックの動作に必要なパラメータ等を記憶する。一方、RAM103は、書き換え可能な揮発性メモリである。RAM103は、デジタルカメラ100が備える各ブロックの動作プログラムの展開領域としてだけでなく、各ブロックの動作により出力された中間データの一時的な記憶領域としても用いられる。本実施形態では、システム制御部101と後述の画像処理部107が、RAM103をワークメモリとして使用するものとする。
【0014】
光学系104は、被写体像を撮像部105に結像する。光学系104には、例えば、固定レンズ、焦点距離を変更する変倍レンズ、焦点調節を行うフォーカスレンズ等が含まれている。光学系104には絞りも含まれており、絞りにより光学系の開口径を調節することで撮影時の光量調節を行う。
【0015】
撮像部105は、例えばCCDイメージセンサやCMOSイメージセンサ等の撮像素子である。撮像部105は、光学系104により撮像素子の撮像面に結像された光学像を光電変換してアナログ画像信号を得る。撮像部105は、得られたアナログ画像信号をA/D変換部106に出力する。
【0016】
A/D変換部106は、入力されたアナログ画像信号にA/D変換処理を適用することで、デジタル画像データ(以下では簡単に画像データとして言及)を得る。A/D変換部106は、得られた画像データをRAM103に出力して記憶させる。
【0017】
画像処理部107は、RAM103に記憶されている画像データに対して、各種の画像処理を行い、画像処理後の画像データを記録媒体108に記録する。画像処理部107が行う画像処理は、例えば、ホワイトバランス調整、色補間、縮小/拡大に係る処理等を含むものであってよい。また画像処理部107は、画像データに現れる被写体像に対して所定の効果を付加する画像処理(画像効果処理)を適用する。
【0018】
記録媒体108は、例えば、メモリカード等の、デジタルカメラ100に着脱可能に構成されていてよい記録装置である。記録媒体108には、画像処理部107により画像処理が適用された画像データ(撮像画像)やA/D変換部106によりA/D変換された画像信号(RAW画像)等が、記録画像として記録される。
【0019】
表示部109は、例えばLCD等の表示装置であり、デジタルカメラ100における各種の情報提示を行う。表示部109は、撮像部105により撮像が行われている際、A/D変換された画像データを表示(スルー表示)することで、デジタルビューファインダとして機能する。
【0020】
操作入力部110は、例えばレリーズスイッチ、設定ボタン、モード設定ダイアル等のユーザ入力インタフェースを含み、ユーザによりなされた操作入力を検出すると、該操作入力に対応する制御信号をシステム制御部101に出力する。また表示部109がタッチパネルセンサを備えている態様においては、操作入力部110は、表示部109に対してなされたタッチ操作を検出するインタフェースとしても機能する。
【0021】
デジタルカメラ100が備えるこれらの機能ブロックは、基本的にはバス111によって接続され、バス111を介してブロック間の信号のやり取りが可能に構成される。
【0022】
本実施形態ではハードウェアとしてデジタルカメラ100が備える各ブロックに対応した回路やプロセッサにより処理が実現されるものとして説明する。しかしながら、本発明の実施はこれに限られるものではなく、各ブロックの処理が該各ブロックと同様の処理を行うプログラムにより実現されるものであってもよい。
【0023】
《撮像部の構成》
次に、本実施形態の撮像部105が備える撮像素子の詳細構成について、図2を参照して説明する。
【0024】
撮像素子は、図2(a)に示されるように、複数の画素200が2次元に規則的に配列されている。具体的には、複数の画素200は、例えば二次元格子状に配列されている。なお、画素200の配列構成は、格子状の配列構成に限定されるものではなく、他の配列構成が採用されるものであってもよい。
【0025】
撮像面位相差測距方式の測距機能を実現すべく、各画素200は、図2(b)に示されるようにマイクロレンズ201と、一対の光電変換部202a及びb(以下、それぞれ瞳分割画素202a及びbとして言及)を有している。瞳分割画素202a及びbは、撮像面がy軸方向を長手方向とする長方形状を有する、同形同大に構成された光電変換部である。各画素200において、瞳分割画素202a及びbは、マイクロレンズ201のy軸方向に沿った垂直二等分線を対称軸として、線対称に配置されている。なお、瞳分割画素202a及びbの撮像面形状は、これに限定されるものではなく、形状であってもよい。また、瞳分割画素202a及びbの配置態様も、x方向に並列に配置されるものに限られれるものではなく、他の配置態様が採用されるものであってよい。
【0026】
このような構成により、本実施形態の撮像部105は、撮像素子の全ての画素が有する瞳分割画素202aから出力された画像信号に係るA像と、同様に瞳分割画素202bから出力された画像信号に係るB像とを出力する。A像とB像とは、合焦している位置との距離に応じた視差を有する関係にある。
【0027】
より詳しくは、各画素200において、瞳分割画素202aとbは、マイクロレンズ201を介して入光した光束のうちの異なる光束を受光するよう構成されているため、光学系104の射出瞳の異なる領域を通過した光束に係る光学像を光電変換する。即ち、この射出瞳の異なる領域(瞳分割領域)を通過した光束について、A像とB像は生成されるものであるため、被写体を瞳分割領域の重心位置の差の分ずれた撮影位置で撮像された関係になっており、視差が生じることになる。換言すれば、A像とB像とは、異なる視点について撮像範囲を撮像して得られた画像群に相当する。
【0028】
なお、本実施形態では、撮像部105の撮像素子を図2のように構成することで、撮像範囲の被写体の距離分布の導出に用いられるA像とB像とを取得するものとして説明するが、A像とB像の取得方法はこれに限られるものではない。例えば、基線長離間させて設置した複数台の撮像装置により撮像された画像群をA像、B像とするものでもよいし、複数の光学系と撮像部を有する1台の撮像装置(所謂、両眼カメラ等)により取得された画像群をそれぞれA像、B像とするものでもよい。
【0029】
《画像処理部の機能構成》
次に、上述の画像効果処理を実現する画像処理部107の機能構成について、図3を参照して説明する。本実施形態の画像処理部107が行う画像効果処理は、撮像された画像(撮像画像)に含まれる人物の像の領域を被写体領域として特定し、該被写体領域を撮像時とは異なる明るさに変更する効果を付す処理であるものとして説明する。しかしながら、本発明の実施はこのような画像効果処理に限られるものではない。本発明は、所定の種類の被写体を検出し、該検出結果に基づいて被写体領域を特定するものであればよく、該被写体領域及びそれ以外の領域の少なくともいずれかに対して適用される効果はいずれであってもよい。ここで、撮像画像とは、瞳分割画素202aに係り撮像されたA像及び瞳分割画素202bに係り撮像されたB像とを加算することで構成された画像(瞳分割していない状態に対応する画像)であるものとする。
【0030】
生成部300は、撮像により得られたA像及びB像に基づいて、撮像範囲の奥行き方向における被写体の距離分布を示す情報を生成する。本実施形態では生成部300は、被写体の距離分布を示す情報として、撮像画像と対応する画素構造を有し、各画素について撮像画像の同位置に表れる被写体の像のデフォーカス量の情報を格納したデフォーカスマップを生成する。
【0031】
〈デフォーカス量の導出〉
ここで、生成部300によって生成されるデフォーカスマップに係るデフォーカス量の導出について、図を参照して説明する。本実施形態ではデフォーカス量は、撮像により得られた視差を有する画像群(A像及びB像)に基づいて導出されるものとして説明する。
【0032】
デフォーカス量の導出は、例えば図4に示されるように画像(A像とB像)400を、破線で示される微小ブロック401に分割する処理を含む。微小ブロック401は、例えば対象であるA像の各画素を着目画素とした場合に、該画素を中心とする予め定められたサイズの領域に対して設定されるものであってよい。なお、以下の説明では微小ブロック401は、着目画素を中心とするm×m画素の正方領域として設定されるものとして説明するが、微小ブロック401の形状やサイズはいずれであってもよい。また微小ブロック401は着目画素ごとに設定されるものであり、異なる着目画素間で微小ブロック401の重複が生じてもよい。また、生成部300は、位相差を検出するA像とB像に対して、予めバンドパスフィルタをかける処理を適用した後に、デフォーカス量の導出を行うものとしてもよい。
【0033】
例えばA像及びB像の各画素について微小ブロック401が設定されると、両画像間で画素(着目画素)ごとに相関演算処理を行い、該画素に対応する微小ブロック401に含まれる像のずれ量(像ずれ量)を導出する。A像及びB像とで同一位置の着目画素について定められた(一対の)微小ブロック401のデータ数(画素数)がmである場合、該一対の微小ブロック401の画素データをそれぞれE(1)~E(m)、F(1)~F(m)として表現する。この場合、相関演算は、(データの)ずらし量をk(整数)[pixel]とすると、相関量C(k)は
C(k)=Σ|E(n)-F(n+k)|
で導出できる。ここで、Σ演算はnについて行われ、n及びn+kは1~mの範囲に限定されるものとする。また、ずらし量kは、一対の画像データの検出ピッチを単位とした相対的シフト量である。
【0034】
このように、1つの着目画素に係る一対の瞳分割画像(一対の微小ブロック401)について相関量を導出すると、ずらし量kと相関量C(k)は、例えば図5のグラフに離散的に示されるような関係となる。このとき、相関が最も高い像ずれ量において相関量C(k)が最小になるため、下記の3点内挿の手法を用いて、連続的な相関量に対する最小値C(x)を与えるずらし量xを導出する。
x=kj+D/SLOP
C(x)=C(kj)-|D|
D={C(kj-1)-C(kj+1)}/2
SLOP=MAX{C(kj+1)-C(kj),C(kj-1)-C(kj)}
【0035】
ここで、kjは離散的な相関量C(k)が最小となるずらし量kである。このようにして求めたずらし量xが、1つの着目画素における像ずれ量として、距離情報に含められる。なお、像ずれ量xの単位も[pixel]であるものとする。
【0036】
従って、各着目画素におけるデフォーカス量DEFは、像ずれ量xを用いて、
DEF=KX・PY・x
で導出することができる。ここで、PYは、撮像素子の画素ピッチ(撮像素子を構成する画素間距離。単位[mm/pixel])であり、KXは、一対の測距瞳を通過する光束の重心の開き角の大きさによって決まる変換係数である。なお、一対の測距瞳を通過する光束の重心の開き角の大きさは、レンズの絞り開口の大きさ(F値)に応じて変化するため、撮像時の設定の情報に応じて決定されるものとする。
【0037】
このように、生成部300は、着目画素位置を1画素ずつずらしながら繰り返し計算することで、撮像画像の各画素における被写体のデフォーカス量を導出することができる。生成部300は、各画素のデフォーカス量を導出すると、これを画素値とする、撮像画像と同一の構造の2次元情報であるデフォーカスマップを、距離情報として生成する。即ち、デフォーカス量は、撮像画像において合焦している被写体距離からの奥行き方向の位置のずれ量に応じて変化する値であるため、デフォーカスマップは、撮像時の被写体の奥行き方向の距離分布と等価な情報である。
【0038】
検出部301は、撮像画像中に含まれる所定の種類の被写体を検出する。本実施形態では撮像画像中の人物の領域を被写体領域として抽出すべく、検出部301は撮像画像中に含まれる人物の顔領域を検出する。顔領域の検出は、パターンマッチング等、従来の手法で行われるものであってよく、検出部301は、検出された顔領域について、該顔領域の撮像画像中の位置及びサイズの情報を検出結果として出力する。本実施形態の画像処理部107で行われる画像効果処理では、このように検出された顔領域が、被写体領域設定のための基準領域として設定される。
【0039】
構成部302は、生成部300により生成されたデフォーカスマップについて、デフォーカス量の分布を示すヒストグラム(頻度分布)を構成する。上述したように、デフォーカス量は撮像範囲に含まれる被写体の距離に対応しており、構成部302により構成されるヒストグラムは、撮像画像中の各画素の被写体を、その被写体距離で分類した際の各距離の頻度を示す。
【0040】
抽出部303は、構成部302により構成されたヒストグラムに基づいて、被写体領域の候補となる領域の抽出を行う。本実施形態では被写体領域の候補を抽出する1つのアプローチとして、ヒストグラムに基づいて基準領域に含まれる被写体(人物の顔)が属する所定の距離範囲を特定し、該距離範囲の被写体が表れている領域を被写体領域の候補として抽出する。詳細は後述するが、抽出部303は、デフォーカスマップに基づいて基準領域のデフォーカス量の平均値drを導出する。そして抽出部303は、ヒストグラムのうちから該平均値drを含み、かつ、予め定めた閾値を上回る頻度を示すデフォーカス量の範囲(最小(下限)デフォーカス量d1及び最大(上限)デフォーカス量d2)を特定する。さらに抽出部303は、デフォーカスマップのうち、該デフォーカス量の範囲に属するデフォーカス量を示す画素を抽出することで、撮像画像中の人物の像が表れていると想定される被写体領域(候補)を特定する。
【0041】
当該被写体領域の候補は、例えば、デフォーカスマップと同様に撮像画像と対応する画素構造を有し、各画素について該デフォーカス量の範囲に属するか否かの論理型の情報を格納することで構成されるものであってよい。以下、抽出部303により抽出される被写体領域の候補の情報を、第1の被写体マップとして言及する。
【0042】
推定部304は、検出部301による顔検出結果に基づいて、被写体領域の候補となる領域を推定する。本実施形態では検出部301による検出対象が人物の顔領域であり、該顔領域のサイズを考慮することで、人体のその他の部位が撮像画像中にどのように分布しているかを推定することができる。即ち、人物の顔領域に対する、該人物の頭部の他のパーツ及び胴体の配置関係にはある程度の拘束条件が存在するため、顔領域が特定されれば、撮像画像中に人物の像がどのように分布しているかは推定することができる。従って、本実施形態では被写体領域の候補を抽出するもう1つのアプローチとして、検出された顔領域に対して相対的に位置及びサイズが定まる、予め定められた形状(人物外形)の領域を被写体領域の候補として抽出する。換言すれば、推定部304が推定して抽出する被写体領域の候補は、抽出部303と同様に基準領域に基づいて抽出されるものではあるが、被写体距離に基づいて抽出されていない点で異なる。
【0043】
当該被写体領域の候補は、例えば撮像画像と対応する画素構造を有し、各画素について顔領域に基づいて定まる人物外形の領域に属するか否かの論理型の情報を格納することで構成されるものであってよい。以下、推定部304により抽出される被写体領域の候補の情報を、第2の被写体マップとして言及する。
【0044】
評価部305は、被写体の距離分布に基づいて構成された第1の被写体マップについて、その有効性を評価する。本実施形態のデジタルカメラ100では、第1の被写体マップは基準領域のデフォーカス量に基づいて撮像画像の全体から領域抽出を行うため、評価部305は、デフォーカスマップのうちの基準領域に係る情報に基づいて評価を行う。
【0045】
〈第1の被写体マップの有効性〉
以下、本実施形態の画像処理部107において被写体領域の決定に際して行われる第1の被写体マップの有効性の評価方法について、図面を参照してさらに詳細を説明する。当該説明では、撮像範囲における被写体の分布が図6のようである態様を例にしながら説明する。図6では撮像範囲には、本実施形態において主被写体とされるべき人物被写体601、デジタルカメラ100からの距離が該人物被写体601よりも遠い位置に木602、及び人物被写体601よりも手前から木602よりも奥まで延びる地面603が含まれる。
【0046】
このような撮像範囲について、好適な条件で撮像が行われた場合、デフォーカスマップは例えば図7(a)に示されるように得られる。発明の理解を容易にさせるべく、図7(a)に例示されるデフォーカスマップは、画素値であるデフォーカス量をグレースケールに変換して可視化されている。図7(a)の例では、被写体距離が近い画素ほど白に近い色(画素値が高い)を示し、遠離するほど黒に近い色(画素値が低い)に示されているものとする。
【0047】
このときデフォーカス量のヒストグラムは図8(a)のようになり、抽出部303は、基準領域701中のデフォーカス量の平均値drに基づいて、当該平均値drを含み、連続して閾値801を超える頻度を示す値範囲を特定する。即ち、抽出部303は、最小デフォーカス量d1及び最大デフォーカス量d2を、当該ヒストグラムに基づいて図示される値として特定する。そして、抽出部303は、これらの値で示されるデフォーカス量を示す画素を抽出することで、図9(a)のように人物被写体601の像を好適に該当領域とした第1の被写体マップを得ることができる。
【0048】
一方、例えば撮影シーンが夕暮れのような逆光シーンではISO感度を高くして撮像する必要がある等、上記のような好適な条件とは異なる撮像条件で撮像が行われ得る。当該撮像により得られた撮像画像(A像及びB像を含む)では、例えば人物被写体601の頬や額、単色の服や空といった領域において、コントラストの低下が生じ得、結果、被写体像における特徴的な要素が表れにくくなる。また、高感度設定での撮像により、撮像画像にはノイズが含まれ得る。故に、生成部300がこのような撮像画像に基づいてデフォーカス量を導出したとしても、その導出精度は低下し得るため、生成されるデフォーカスマップは、例えば図7(b)に示されるような態様となる。図の例では、低コントラストである(所定のコントラストを示さない)ことに起因した、信頼度の低いデフォーカス量が導出されている画素が斜線を付した画素712で示されている。また低コントラストとは判定されないが、撮像画像に含まれるノイズの影響で周辺画素とは異なるデフォーカス量を示す(そのデフォーカス量差が急峻である)画素が、画素713として示されている。以下の説明では、前者を低信頼画素、後者をエラー画素として言及する。なお、デフォーカスマップの画素が、低信頼画素またはエラー画素であるか否かの情報は、例えば生成部300がデフォーカス量の導出の際に判定され、該デフォーカスマップに関連付けて格納されるものであってよい。
【0049】
従って、このようにして得られたデフォーカスマップについて、基準領域711中のデフォーカス量から導出される平均値drは、低信頼画素やエラー画素のデフォーカス量によって、好適な撮像条件で得られるものとは異なる。またデフォーカス量のヒストグラムも図8(b)のように異なるため、抽出部303により特定される閾値801を超える頻度を示す値範囲も変化する。結果として、図8(b)の最小デフォーカス量d1と最大デフォーカス量d2で規定される値範囲の画素を抽出すると、図9(b)に示されるような第1の被写体マップが得られることになる。図示される第1の被写体マップでは、人物被写体601の像が該当領域として示されておらず、被写体領域の抽出結果は好適でないといえる。
【0050】
このように、デフォーカスマップに基づいて構成された第1の被写体マップは、撮像条件によっては所望の被写体領域を特定できない構成となり得るため、本実施形態では評価部305がその有効性を評価する。有効性は、例えばデフォーカスマップの基準領域中における、信頼に足るデフォーカス量を示す画素(有効画素)が占める割合、即ち、低信頼画素とエラー画素を除外した画素の割合として定量的に示されるものであってよい。図7(b)の例では、基準領域711は横5画素×縦4画素=20画素であり、このうち低信頼画素712の数が10、エラー画素713の数が2であるため、有効画素の数は9となる。従って、有効性は9/20=0.45となる。なお、本実施形態では低信頼画素及びエラー画素を除外した画素を有効画素として扱うものとして説明するが、例えば撮像条件に応じて、このうちの少なくともいずれかを除外して有効画素を設定するものとしてもよい。
【0051】
決定部306は、第1の被写体マップと第2の被写体マップとを合成して構成されたマップに基づいて、画像効果処理の対象とする被写体領域を決定する。本実施形態の画像処理部107では、第1の被写体マップと第2の被写体マップの合成は、第1の被写体マップの有効性に基づいてこれらのマップを重み付け加算することで行われる。当該重みは、例えば図10に示されるようなグラフに基づいて設定されるものであってよい。図の例では、第1の被写体マップの有効性に対する、第2の被写体マップの寄与率を百分率で示している。デフォーカスマップが図7(b)のようになる態様では、第1の被写体マップの有効性は0.45であるため、当該グラフによれば、決定部306は第2の被写体マップのみに基づいて被写体領域を決定する。即ち、第1の被写体マップが図11(a)のような態様で、第2の被写体マップが図11(b)のような態様である場合、被写体マップの合成結果(重みによっては必ずしも合成する必要はない)は図11(c)のようになる。この場合、決定部306は、基準領域の位置及びサイズに基づいて特定される領域を、最終的な被写体領域として決定する。
【0052】
効果処理部307は、処理対象である撮像画像中の決定部306により決定された被写体領域について、明るさを変更する処理を行う。上述したように本実施形態の画像処理部107では、効果処理部307は被写体領域の明るさを変更する処理を行うものとして説明するが、効果処理部307の処理内容はいずれであってもよい。
【0053】
《画像効果処理》
このような構成をもつ本実施形態の画像処理部107の画像効果処理について、図12のフローチャートを用いて具体的な処理を説明する。該フローチャートに対応する処理は、システム制御部101が、例えばROM102に記憶されている対応する処理プログラムを読み出し、RAM103に展開して実行することにより、画像処理部107を動作制御することで実現できる。本画像効果処理は、例えば記録媒体108に格納されている撮像画像に対して、人物被写体の明るさ(照明)状態を変更する指示がなされた際に開始されるものとして説明する。
【0054】
S1201で、生成部300は、対象画像に係るA像及びB像に基づいて、対象画像と対応するデフォーカスマップを生成する。本実施形態では記録媒体108に格納されている撮像画像には、撮像時に取得されたA像及びB像も関連付けて格納されているものとする。生成部300は、生成した生成部300を、例えばRAM103に格納する。またこのとき生成部300は、各画素について導出したデフォーカス量に基づいて、該画素が低信頼画素またはエラー画素に該当するか否かの判定も行う。
【0055】
S1202で、構成部302は、S1202において生成されたデフォーカスマップに基づいてデフォーカス量のヒストグラムを構成する。構成されたヒストグラムは、例えばRAM103に格納されればよい。
【0056】
S1203で、検出部301は、対象の撮像画像(対象画像)について人物の顔領域の検出を行う。より詳しくは検出部301は、対象画像に含まれる顔領域を検出し、検出した顔領域について対象画像中の位置(座標)及びサイズの情報を出力する。また画像処理部107は、検出部301による顔検出結果に基づいて、対象画像についての基準領域を設定し、本画像効果処理の間保持するよう制御する。
【0057】
S1204で、抽出部303は、基準領域の被写体についてデフォーカス量の平均値drを導出する。より詳しくは抽出部303は、デフォーカスマップの基準領域中の画素を参照し、デフォーカス量の平均値drを導出する。また抽出部303は、導出した平均値drとS1203において構成されたヒストグラムとに基づいて抽出するデフォーカス量の値範囲を特定する。そして抽出部303は、特定した値範囲の情報とヒストグラムとに基づいて当該値範囲に含まれる画素の配置を示した第1の被写体マップを構成し、例えばRAM103に格納する。
【0058】
S1205で、評価部305は、S1204において生成された第1の被写体マップの有効性を評価する。より詳しくは、評価部305は、デフォーカスマップの基準領域に含まれる低信頼画素及びエラー画素の数に基づいて有効画素の数を特定し、基準領域における該有効画素の割合を導出し、有効性の情報として例えばRAM103に格納する。
【0059】
S1206で、推定部304は、S1203における顔検出結果に基づいて、対象画像の人物の像が表れるであろう領域を推定する。より詳しくは推定部304は、予め設けられた人物外形の情報を、検出された顔領域のサイズに応じて拡縮し、さらに該顔領域に応じた位置に配置することで、対象画像中のいずれの画素に人物の像が表れるかを推定する。即ち、推定部304は、当該外形に内包される画素群を人物の像が表れるであろう領域として推定する。そして推定部304は、推定した領域の情報に基づいて第2の被写体マップを構成し、例えばRAM103に格納する。
【0060】
S1207で、決定部306は、第1の被写体マップと第2の被写体マップとを、S1205において導出された有効性の情報に基づいて合成し、本画像効果処理の対象とする被写体領域を決定する。より詳しくは決定部306は、図11(a)のグラフに基づいて有効性に対応した第1の被写体マップの合成比率(寄与率)を設定し、第1の被写体マップと第2の被写体マップを合成し、該合成後のマップにより示される情報に基づいて被写体領域を決定する。
【0061】
S1208で、効果処理部307は、S1207において決定された被写体領域に対して、明るさ補正を行う処理を行う。当該明るさ補正は、例えば対象画像の各画素の画素値をX、被写体領域を示す合成後のマップの該画素の画素値をGとすると、補正後の該画素の画素値Yは
Y = X・(1+G/255)
で導出することができる。当該明るさ補正により、主被写体である人物を照明したようなライティング補正効果が付加される効果処理部307は、画像効果処理を適用した画像を記録媒体108に記録させ、本画像効果処理を完了する。
【0062】
以上説明したように、本実施形態の画像処理装置によれば、好適に被写体領域を特定し、例えば該被写体領域への所望の効果付加を実現する。より詳しくは、画像処理装置は、対象画像について人物の顔領域を検出し、デフォーカスマップと該顔領域とに基づいて被写体領域を特定した第1の被写体マップと、被写体が人物であることと該顔領域とに基づいて特定した第2の被写体マップを構成する。そして画像処理装置は、前者のマップの有効性を評価した上で、これらのマップを合成することで被写体の人物の像が表れている被写体領域を決定する。これにより、対象画像が低コントラストであったりノイズを含む状況であったりしても、被写体の像に好適な画像効果を付加することができる。
【0063】
なお、本実施形態では主被写体として人物の顔領域を基準領域として検出するものとして説明したが、本発明の実施はこれに限られるものではない。当該検出は、例えば人物の他の部位を検出するものであってもよいし、乗用車、ペット、植物等他の種類の被写体を、その少なくとも一部の特徴に基づいて主被写体として検出するものであってもよい。また、主被写体とする被写体の選択は、このような画像解析によるものに限られるものではなく、例えばユーザの選択操作に基づくものであってもよい。
【0064】
また本実施形態では第1の被写体マップの構成に際し、デフォーカス量のヒストグラムにおいて所定の閾値801を超える頻度を示す値範囲を抽出対象とする態様について説明したが、当該閾値は固定値である必要はない。例えば、基準領域のデフォーカス量の平均値dr近傍のデフォーカス量のうち、頻度が最大となるデフォーカス量(dmax)を探索し、その頻度のM%(Mは任意の数)を閾値として設定するものであってもよい。このように構成することで、デフォーカス量がdmaxに集中しているような被写体を抽出する際に閾値が相対的に厳しくなるため、他の被写体が混入してしまう可能性を低減させることができる。また、奥行き方向に延びているような被写体が存在する場合はヒストグラムの形状がブロードになるが、閾値は緩くなるので、当該被写体を漏れなく抽出でき、シーンに対する抽出精度のロバスト性を向上させることができる。
【0065】
ここで、dmaxを探索するデフォーカス量の範囲は、基準領域のサイズに応じて定める方法が好適である。即ち、基準領域が大きい場合には、被写体領域のデフォーカス量が広範囲に広がる可能性があるため、dmaxの探索範囲を拡くすればよい。また逆に、基準領域が小さい場合には、異なる被写体の像が表れる領域を混入することを防ぐべく、dmaxを探索する範囲を狭くすればよい。また、dmaxを起点にデフォーカス量の範囲を特定した結果、基準領域のデフォーカス量の平均値drが含まれない場合には、該平均値drを含むように抽出する値範囲を拡げればよい。
【0066】
また本実施形態では第1の被写体マップの構成に際し、基準領域のデフォーカス量の平均値drを基準として、ヒストグラムから所定の閾値を上回る頻度のデフォーカス量の値範囲を抽出するものとして説明したが、本発明の実施はこれに限られるものではない。例えば処理負荷を低減すべく、顔領域と胴体の領域を基準領域として設定し、該基準領域に分布するデフォーカス量に基づいて、その最小デフォーカス量d1と最大デフォーカス量d2を定めるものとしてもよい。
【0067】
また本実施形態では有効性の評価を、基準領域として設定された顔領域の有効画素に基づいて導出するものとして説明したが、本発明の実施はこれに限られるものではない。人物の像は、特に額や首の周辺でコントラストが低くなり低信頼画素となる傾向にあるため、これらの存在を考慮すべく、有効性の評価の際には、対象とする基準領域を顔領域のサイズから縦方向に拡張して行ってもよい。即ち、有効性の判断については、検出された被写体の種類に応じて、基準領域を拡張して行うものとしてもよい。
【0068】
また本実施形態では、人物外形を示す予め定められた形状の情報を、検出された顔領域の位置及びサイズに基づいて調整した上で第2の被写体マップを構成するものとして説明したが、本発明の実施はこれに限られるものではない。例えば、被写体の個体差を吸収すべく、人物被写体601の顔器官位置、関節位置や姿勢情報等を検出して、該人物被写体に合わせた形状に変形させるようにしてもよい。
【0069】
また本実施形態では、主被写体として検出する被写体の種類を人物としていたため、第2の被写体マップは人物の外形の形状に基づいて構成されるものとして説明したが、本発明の実施はこれに限られるものではない。即ち、基準領域用に検出される被写体の種類に応じて、第2の被写体マップを構成するために用いる形状を異ならせるものであってもよいことは言うまでもない。またこの他、機械学習に基づいた意味的領域分割等の手法を採用して、人物、乗用車、ペット、植物等の形状を特定して第2の被写体マップを構成するものとしてもよい。
【0070】
また、本実施形態では第1の被写体マップの有効性を基準として最終的な被写体領域を決定する方式について説明したが、本発明の実施はこれに限られるものではない。例えば、主被写体が画角において占める割合が小さいような撮像条件(主被写体までの距離が遠い、広角レンズを使用している等)、つまり被写界深度が深い撮像条件ではデフォーカスマップの分解能が低減し得る。このような条件では、デフォーカス量に基づく主被写体の像の抽出精度が低下し得る。また、例えば撮像画像における基準領域の画素数が小さい場合、有効性の導出に用いられるサンプル数が少なくなり、結果として、適切な有効性の導出がなされない可能性もある。従って、基準領域のサイズが所定のサイズよりも小さい場合には、被写体領域の決定に係るマップの合成において、第2の被写体マップの重みを高くするよう決定部306を制御してもよい。あるいは、基準領域のサイズが所定のサイズよりも小さい場合には、被写体領域の決定に係るマップの合成において、第1の被写体マップの重みを低くするよう評価部305を制御してもよい。
【0071】
また本実施形態では画像効果処理として、第1の被写体マップと第2の被写体マップとに基づいて決定した被写体領域に対し、明るさ補正を行う画像処理を適用する態様について説明したが、本発明の実施はこれに限られるものではない。本発明の実施において、適用される画像処理の内容はシャープネス調整やコントラスト調整等いずれであってもよく、また画像処理が適用される領域も被写体領域ではなく、被写体領域以外の領域であってもよい。本発明は、被写体領域を特定し、該領域と該領域外とで異なる種類の画像処理を実行する(いずれか一方には画像処理を実行しないことも含む)ものであれば、適用可能である。
【0072】
また、本実施形態ではデジタルカメラ100が撮像面位相差測距方式の測距機能を有する撮像素子を有し、撮像画像とともに視差を有する関係の画像群を取得することで、デフォーカスマップを生成するものとして説明したが、本発明の実施はこれに限られない。撮像範囲に係る距離情報は、撮像画像と同時に取得されるものでなく、予め記録媒体108等に記録されているものであってもよい。
【0073】
また、本実施形態ではデフォーカスマップは視差を有する関係にある画像群に基づいて生成されるものとして説明したが、撮像画像に対応し、撮像範囲における被写体の距離分布を取得可能であれば、この方式に限られるものではない。デフォーカスマップの生成方式は、例えばピントや絞り値が異なる2枚の画像の相関からデフォーカス量を導出するDFD(Depth From Defocus)方式であってもよい。あるいは、被写体の距離分布は、TOF(Time of Flight)方式等の測距センサモジュールから得た距離分布に関連する情報を用いて導出されるものであってもよい。または、コントラスト測距方式によるものでもよい。いずれの方式で得た距離分布であっても、距離分布における注目被写体領域の有効性に応じて、代替シルエットと合成する態様とすることで、同様に本発明を実現することができる。
【0074】
また、本実施形態では第1の被写体マップの構成に係り、撮像範囲に含まれる被写体の距離分布を示したデフォーカスマップを参照する態様について説明したが、本発明の実施はこれに限られるものではない。被写体の距離分布を示す情報は、デフォーカス量ではなく、例えば撮像画像の各画素の像について、デフォーカス量の導出過程で得られたずらし量(像ずれ量)や、デフォーカス量に基づく被写体距離を値を格納して構成された二次元情報であってもよい。前者の場合、撮像素子の画素ピッチPYや一対の測距瞳を通過する光束の重心の開き角で定まる変換係数KXを保持しておく必要がなく、情報量を減らすことができる。また後者の場合は、ユーザが把握しやすい数値となっているため、例えば表示部109を介して処理の過程で提示することで、どのような表現の画像が生成されるかをユーザに提示することができる。この他、デフォーカス量を焦点深度(例えば、1Fδ。Fは絞り値、δは許容錯乱円径)で正規化した値を格納した二次元情報を参照する態様としてもよい。ここで、絞り値Fは像高中央付近の絞り値を代表値として全面固定値としてもよいし、光学系のケラレで周辺像高の絞り値が暗くなるのを加味した絞り値分布を適用するようにしてもよい。
【0075】
また、本実施形態では第1の被写体マップの構成に係りデフォーカスマップを参照する態様について説明したが、本発明の実施はこれに限られるものではない。第1の被写体マップの構成に係り参照される情報は、対象画像の各画素に対応する被写体を、所定の基準で分類した情報(分類情報)であればよく、対象画像または対象画像と対応して撮像された画像(A像及びB像等)に基づいて構成される。分類情報は、好適には撮像画像と同様の画素構造を有する二次元情報であり、対象画像の各画素の被写体についての分類結果を同位置の画素に格納して構成されるものであればよい。ここで、分類は複数存在し、これらの分類について、例えば大きさや画素値等、分類に係る所定の基準に応じて序列が定められているものとする。従って、分類情報は、被写体距離を示す情報に限らず、連続して撮像された撮像画像に基づいて得られた、被写体の像の経時変化に基づく動きベクトルの分布を示した動きベクトル情報(オプティカルフロー)であってもよい。あるいは、分類情報は、対象画像の色情報を基に被写体の像の色をラベリングした色ラベリング情報(色分布、色ラベルマップ)等であってもよい。この他、参照される二次元情報は、機械学習に基づいた意味的領域分割等に基づく被写体マップであってもよい。意味的領域分割を利用する場合は、第2の被写体マップの構成にはそれ以外の方式を用いる必要があるが、人型の固定形状マップを用いる等、シーン変化によりロバストな方式を選択するようにすればよい。
【0076】
また本実施形態では、撮像機能を備えた撮像装置であるデジタルカメラ100に、被写体領域の決定及び画像効果処理を行う機能が実装されている例について説明したが、本発明の実施がこれに限られるものではないことは容易に理解されよう。本発明は、撮像画像と、該撮像画像の各画素に係る被写体の像を分類した分類情報を取得可能に構成された装置であれば実施可能であるし、撮像装置と画像処理装置を有する撮像システムを用いても実施可能である。
【0077】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【0078】
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【符号の説明】
【0079】
100:デジタルカメラ、101:システム制御部、102:ROM、103:RAM、104:光学系、105:撮像部、106:A/D変換部、107:画像処理部、108:記録媒体、109:表示部、110:操作入力部、111:バス、200:画素、201:マイクロレンズ、202:瞳分割画素、300:生成部、301:検出部、302:構成部、303:抽出部、304:推定部、305:評価部、306:決定部、307:効果処理部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12