IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023184093
(43)【公開日】2023-12-28
(54)【発明の名称】画像処理装置および画像処理方法
(51)【国際特許分類】
   G06T 7/90 20170101AFI20231221BHJP
   G06T 7/00 20170101ALI20231221BHJP
   G06V 10/82 20220101ALI20231221BHJP
【FI】
G06T7/90 D
G06T7/00 350C
G06V10/82
【審査請求】未請求
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2022098026
(22)【出願日】2022-06-17
(71)【出願人】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】100121131
【弁理士】
【氏名又は名称】西川 孝
(74)【代理人】
【識別番号】100082131
【弁理士】
【氏名又は名称】稲本 義雄
(74)【代理人】
【識別番号】100168686
【弁理士】
【氏名又は名称】三浦 勇介
(72)【発明者】
【氏名】三原 基
(72)【発明者】
【氏名】森内 優介
(72)【発明者】
【氏名】上森 丈士
(72)【発明者】
【氏名】孫 楽公
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096AA06
5L096CA02
5L096FA15
5L096GA40
5L096HA11
5L096KA04
(57)【要約】
【課題】入力画像を物体色画像と陰影画像に高精度に分離できるようにする。
【解決手段】画像処理装置は、入力画像の特徴量に基づいて、入力画像に含まれる物体の色成分を画素値として持つ物体色画像を推定する物体色推定部と、入力画像の特徴量に基づいて、入力画像の陰影成分を画素値として持つ陰影画像を推定する陰影推定部とを備える。陰影推定部は、入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して陰影画像を推定する。本開示の技術は、例えば、入力画像を物体色画像と陰影画像に分離する画像処理装置等に適用できる。
【選択図】図1
【特許請求の範囲】
【請求項1】
入力画像の特徴量に基づいて、前記入力画像に含まれる物体の色成分を画素値として持つ物体色画像を推定する物体色推定部と、
前記入力画像の特徴量に基づいて、前記入力画像の陰影成分を画素値として持つ陰影画像を推定する陰影推定部と
を備え、
前記陰影推定部は、前記入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して前記陰影画像を推定する
画像処理装置。
【請求項2】
前記所定の色条件としてN個(N>1)の基底色が与えられ、
前記陰影推定部は、前記入力画像の陰影成分が取りうる色空間を、前記N個の基底色で表現される色空間に制限して前記陰影画像を推定する
請求項1に記載の画像処理装置。
【請求項3】
前記陰影推定部は、
所定の基底色に対応する陰影画像を生成するN個の陰影画像生成部と、
前記N個の陰影画像生成部により生成されたN個の基底色の陰影画像を合成する陰影合成部と
を有する
請求項2に記載の画像処理装置。
【請求項4】
前記陰影画像生成部は、
前記入力画像の特徴量に基づいて陰影強度画像を推定する陰影強度画像推定部と、
前記所定の基底色を色パラメータに変換する色パラメータ変換部と
を有する
請求項3に記載の画像処理装置。
【請求項5】
前記基底色は、色温度で与えられる
請求項2に記載の画像処理装置。
【請求項6】
前記基底色は、xy色度図上のxy座標値で与えられる
請求項2に記載の画像処理装置。
【請求項7】
前記基底色は、RGBの色パラメータで与えられる
請求項2に記載の画像処理装置。
【請求項8】
前記所定の色条件で決定される色空間は、CIE昼光モデルに従う空間である
請求項1に記載の画像処理装置。
【請求項9】
前記所定の色条件として、前記CIE昼光モデルの基底関数が与えられる
請求項8に記載の画像処理装置。
【請求項10】
前記陰影推定部は、
前記CIE昼光モデルの第1の基底関数の係数を格納した第1の係数画像を推定する第1の係数画像推定部と、
前記CIE昼光モデルの第2の基底関数の係数を格納した第2の係数画像を推定する第2の係数画像推定部と、
前記CIE昼光モデルの第3の基底関数の係数を格納した第3の係数画像を推定する第3の係数画像推定部と
前記第1の係数画像ないし前記第3の係数画像を合成し、陰影の分光分布画像を生成する合成部と
前記陰影の分光分布画像を、R,G,Bの分光感度関数で畳み込むことにより、前記陰影画像に変換する分光感度適用部と
を有する
請求項9に記載の画像処理装置。
【請求項11】
前記所定の色条件は、前記入力画像の撮影時刻である
請求項1に記載の画像処理装置。
【請求項12】
前記撮影時刻に応じて、直達光に対応する色パラメータと、大域光に対応する色パラメータとに変換され、
前記直達光に対応する色パラメータを用いた第1の色の陰影画像を生成する第1の陰影画像生成部と、
前記大域光に対応する色パラメータを用いた第2の色の陰影画像を生成する第2の陰影画像生成部と、
前記第1の色の陰影画像と前記第2の色の陰影画像を合成する陰影合成部と
を有する
請求項11に記載の画像処理装置。
【請求項13】
前記入力画像の特徴量を抽出する特徴量抽出部をさらに備える
請求項1に記載の画像処理装置。
【請求項14】
前記物体色推定部で推定された前記物体色画像を前記入力画像として前記特徴量抽出部に再度入力する処理が、所定の終了条件を満たすまで繰り返し実行される
請求項13に記載の画像処理装置。
【請求項15】
前記物体色推定部で推定された前記物体色画像と、前記陰影推定部で推定された前記陰影画像とを用いて、陰影強度が調整された陰影処理画像を生成する陰影処理部をさらに備え、
前記陰影処理画像を前記入力画像として前記特徴量抽出部に再度入力する処理が、所定の終了条件を満たすまで繰り返し実行される
請求項13に記載の画像処理装置。
【請求項16】
前記陰影推定部は、
前記所定の色条件に対応する色の陰影画像を生成するN個(N>1)の陰影画像生成部と、
ユーザの選択指示にしたがい、前記N個の陰影画像生成部により生成されたN枚の色の陰影画像の少なくとも1つを選択して合成する陰影合成部と
を有し、
前記陰影合成部により合成された画像と、前記物体色推定部により推定された物体色画像とが合成される
請求項1に記載の画像処理装置。
【請求項17】
前記物体色推定部と前記陰影推定部には、学習処理により求められたパラメータを用いたCNN予測器が用いられる
請求項1に記載の画像処理装置。
【請求項18】
画像処理装置が、
入力画像の特徴量に基づいて、前記入力画像に含まれる物体の色成分を画素値として持つ物体色画像を推定し、
前記入力画像の特徴量に基づいて、前記入力画像の陰影成分を画素値として持つ陰影画像を推定し、
前記陰影画像は、前記入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して推定される
画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像処理装置および画像処理方法に関し、特に、入力画像を物体色画像と陰影画像に高精度に分離できるようにした画像処理装置および画像処理方法に関する。
【背景技術】
【0002】
入力画像を、物体色画像(反射率画像などとも呼ばれる。)と陰影画像に分離する固有画像分解技術がある。例えば非特許文献1には、畳み込みニューラルネットワーク(Convolutional Neural Network、以下、CNNと称する。)を用いて、物体色画像と陰影画像を推定する技術が開示されている。非特許文献2では、陰影画像をグレースケールで推定することで、物体色画像と陰影画像に分離する技術が開示されている。
【0003】
特許文献1には、画像の完全拡散成分を推定し、さらに補正を行うことにより物体色を得た後で、同じく推定した陰影やスペキュラーを、補正した物体色に適用することで、画質の改善を行う方法が開示されている。特許文献1では、完全拡散成分は光源色の成分を含んでいるため、被写体の分光情報をCIE昼光モデルなどに基づき推定した後に、完全拡散成分から光源色の影響を取り除き、物体色が復元されている。また、特許文献2のように、動画のエンコーディングにおいて圧縮率を向上させるための手段として、物体色画像の動画と、陰影画像の動画の分離を行うものもある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許第6004481号公報
【特許文献2】米国特許第10659787号明細書
【非特許文献】
【0005】
【非特許文献1】Narihira et al., Direct Intrinsics: Learning Albedo-Shading Decomposition by Convolutional Regression, CVPR 2015
【非特許文献2】Fan et al., Revisiting Deep Intrinsic Image Decompositions, CVPR 2018
【発明の概要】
【発明が解決しようとする課題】
【0006】
固有画像分解は、本質的に、1枚の入力画像から、物体色と陰影の2変数を求める不良設定問題であり、解は一意に定まらない。そのため、特許文献1では、対象物体が顔であって、対象物体の色が概ね既知であると仮定したり、非特許文献2では、白色光のみを仮定することで陰影画像をグレースケールで推定している。入力画像を物体色画像と陰影画像に分離する技術は、依然として改善の余地があり、物体色画像と陰影画像の分離を高精度に行う技術が期待されている。
【0007】
本開示は、このような状況に鑑みてなされたものであり、入力画像を物体色画像と陰影画像に高精度に分離できるようにするものである。
【課題を解決するための手段】
【0008】
本開示の一側面の画像処理装置は、入力画像の特徴量に基づいて、前記入力画像に含まれる物体の色成分を画素値として持つ物体色画像を推定する物体色推定部と、前記入力画像の特徴量に基づいて、前記入力画像の陰影成分を画素値として持つ陰影画像を推定する陰影推定部とを備え、前記陰影推定部は、前記入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して前記陰影画像を推定する。
【0009】
本開示の一側面の画像処理方法は、画像処理装置が、入力画像の特徴量に基づいて、前記入力画像に含まれる物体の色成分を画素値として持つ物体色画像を推定し、前記入力画像の特徴量に基づいて、前記入力画像の陰影成分を画素値として持つ陰影画像を推定し、前記陰影画像は、前記入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して推定される。
【0010】
本開示の一側面においては、入力画像の特徴量に基づいて、前記入力画像に含まれる物体の色成分を画素値として持つ物体色画像が推定され、前記入力画像の特徴量に基づいて、前記入力画像の陰影成分を画素値として持つ陰影画像が推定される。前記陰影画像は、前記入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して推定される。
【0011】
なお、本開示の一側面の画像処理装置は、コンピュータにプログラムを実行させることにより実現することができる。コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
【0012】
画像処理装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
【図面の簡単な説明】
【0013】
図1】本開示の画像処理装置の第1実施の形態の構成例を示すブロック図である。
図2】xy色度図上で黒体放射軌跡を示す図である。
図3図1の陰影推定部の第1構成例を示すブロック図である。
図4】N=2の場合の第1構成例に係る陰影推定部の構成例を示すブロック図である。
図5】CNN予測器の構成を説明する図である。
図6】N=3の場合の設定例を説明する図である。
図7】第1構成例に係る陰影推定部における基底色の他の指定例を説明する図である。
図8】第1構成例に係る陰影推定部における基底色の他の指定例を説明する図である。
図9】N個の基底の色で表現される色空間の設定方法を説明する図である。
図10】CIE昼光モデルの基底関数を説明する図である。
図11図1の陰影推定部の第2構成例を示すブロック図である。
図12図1の陰影推定部の第3構成例を示すブロック図である。
図13】直達光と大域光のモデルを説明する図である。
図14】教師データの構成例を説明する図である。
図15】第1実施の形態の画像処理装置による物体色陰影分離処理を説明するフローチャートである。
図16】本開示の画像処理装置の第2実施の形態の構成例を示すブロック図である。
図17】第2実施の形態の画像処理装置による物体色陰影分離処理を説明するフローチャートである。
図18】終了条件の例を説明する図である。
図19】本開示の画像処理装置の第3実施の形態の構成例を示すブロック図である。
図20】第3実施の形態の画像処理装置による物体色陰影分離処理を説明するフローチャートである。
図21】カスケード構造とした第3実施の形態に係る画像処理装置の構成例を示すブロック図である。
図22】CNN予測器のパラメータを学習する学習装置の構成例を示すブロック図である。
図23】本開示の画像処理装置の第4実施の形態の構成例を示すブロック図である。
図24図23の陰影推定部の詳細構成例を示すブロック図である。
図25図23の陰影推定部の処理を説明する図である。
図26】本開示の技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【発明を実施するための形態】
【0014】
以下、添付図面を参照しながら、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。説明は以下の順序で行う。
1.画像処理装置の第1実施の形態
2.陰影推定部の第1構成例
3.陰影推定部の第2構成例
4.陰影推定部の第3構成例
5.教師データの構成例
6.第1実施の形態の物体色陰影分離処理
7.画像処理装置の第2実施の形態
8.第2実施の形態の物体色陰影分離処理
9.画像処理装置の第3実施の形態
10.第3実施の形態の物体色陰影分離処理
11.学習装置の構成例
12.画像処理装置の第4実施の形態
13.コンピュータの構成例
【0015】
<1.画像処理装置の第1実施の形態>
図1は、本開示の画像処理装置の第1実施の形態の構成例を示すブロック図である。
【0016】
図1の画像処理装置1は、カラー画像である入力画像を、物体色画像と陰影画像に分離して出力する装置である。物体色画像とは、物体の色成分(反射率成分)を画素値として持つ画像であり、陰影画像は、光源(照明)等による陰影成分を画素値として持つ画像である。
【0017】
画像処理装置1は、特徴量抽出部11、物体色推定部12、陰影推定部13、及び、色条件設定部14を備える。
【0018】
特徴量抽出部11は、入力画像の特徴量を抽出し、物体色推定部12及び陰影推定部13へ供給する。物体色推定部12は、特徴量抽出部11から供給される入力画像の特徴量に基づいて、入力画像に含まれる物体の色成分(反射率成分)を画素値として持つ物体色画像を推定して出力する。陰影推定部13は、特徴量抽出部11から供給される入力画像の特徴量に基づいて、入力画像の陰影成分を画素値として持つ陰影画像を推定して出力する。色条件設定部14は、陰影画像を推定する際の色条件を設定し、陰影推定部13に供給する。色条件の設定は、例えば、ユーザが指定した色条件に従って行われる。
【0019】
画像処理装置1は、陰影推定部13において、陰影成分が取りうる解空間としての色空間を、すべてのRGB空間から、所定の色条件で決定される色空間へと制限して陰影画像を推定する点を特徴としている。例えば、自然界の光源色は黒体放射に従うことが多いため、推定される陰影色が黒体放射色に近くなるような制約が色条件設定部14において色条件として与えられる。
【0020】
図2は、光の色を(x,y)の平面座標で表したxy色度図を示している。
【0021】
黒体放射色は、図2に示されるように、xy色度図上で曲線状の黒体放射軌跡として表される。非特許文献“Design of advanced color: Temperature control system for HDTV applications, Journal of the Korean Physical Society”によれば、黒体放射軌跡は3次スプラインで近似可能である。
【0022】
画像処理装置1は、入力画像において観測されたシーンの照明色が、いくつかの基底となる色(以下、基底色とも称する。)の線形和で表されるものと仮定し、その和を最終的な陰影画像として推定する。複数の基底色で表現される色空間の基底の数(基底数)Nを2とし、色温度T1=3000ケルビンと、T2=8000ケルビンを基底とすると、それぞれの基底色で表される陰影画像を加算して得られる陰影画像が取りうる色空間は、図2に示されるように、色温度T1=3000とT2=8000の2つの基底色を端点とするような線分で表される。すなわち、陰影画像に出現する色は、基底数N=2の場合はxy色度図上で2つの基底色を表す点どうしを結んだ直線状に必ず存在する。基底数N>2の場合は、xy色度図上でN角形の内部に存在することになる。このように、複数の基底色で表現される色空間を、黒体放射色を表す色空間を近似する空間とすることにより、陰影画像の色を安定的に推定することができ、入力画像からの物体色画像と陰影画像の高精度な分離を実現する。
【0023】
<2.陰影推定部の第1構成例>
図3は、陰影推定部13の第1構成例を示すブロック図である。
【0024】
第1構成例に係る陰影推定部13は、第1の陰影画像生成部31-1ないし第Nの陰影画像生成部31-Nと、陰影合成部32とを備える。陰影画像生成部31の個数に対応するNは、1より大きい整数であり、陰影画像の色空間を規定する基底数に対応する。
【0025】
第1の陰影画像生成部31-1ないし第Nの陰影画像生成部31-Nそれぞれは、色条件設定部14から色条件として供給される基底色が異なるが、同一の陰影画像生成部31の構成であり、供給される基底色を用いて同一の処理を行う。陰影画像生成部31の詳細説明は図4を参照して後述するが、陰影画像生成部31は、陰影強度推定部41と、色パラメータ変換部42と、乗算部43とを備え、所定の基底色に対応する陰影画像を生成する。
【0026】
第1の陰影画像生成部31-1は、色条件設定部14から供給される第1の基底の色に対応する第1の陰影画像(第1の色の陰影画像)を生成する。第2の陰影画像生成部31-2(不図示)は、色条件設定部14から供給される第2の基底の色に対応する第2の陰影画像(第2の色の陰影画像)を生成する。以下同様に、第Nの陰影画像生成部31-Nは、色条件設定部14から供給される第Nの基底の色に対応する第Nの陰影画像(第Nの色の陰影画像)を生成する。第1の色の陰影画像ないし第Nの色の陰影画像それぞれは、R,G、及びBの3チャンネルの陰影画像となる。
【0027】
陰影合成部32は、第1の陰影画像生成部31-1ないし第Nの陰影画像生成部31-Nそれぞれから供給される第1の色の陰影画像ないし第Nの色の陰影画像を合成することにより、陰影画像を生成(推定)して出力する。陰影画像の合成は、具体的には、R,G、及びBのチャンネルごとに第1の色の陰影画像ないし第Nの色の陰影画像の対応画素を線形加算することによって行われる。出力となる陰影画像は、R,G、及びBの3チャンネルのカラーで表現される。
【0028】
図4は、基底の選び方として、基底数Nを2(N=2)とし、図2に示したように、第1の基底として色温度T1=3000ケルビン、第2の基底として色温度T2=8000ケルビンが色条件設定部14から供給される場合の第1構成例に係る陰影推定部13の構成例を示している。
【0029】
第1の陰影画像生成部31-1は、第1の陰影強度推定部41-1、第1の色パラメータ変換部42-1、及び、乗算部43-1を有している。第1の陰影強度推定部41-1には、特徴量抽出部11で抽出された入力画像の特徴量が供給される。第1の色パラメータ変換部42-1には、色条件設定部14から、第1の基底として色温度T1=3000ケルビンが色条件として供給される。
【0030】
第1の陰影強度推定部41-1は、特徴量抽出部11で抽出された入力画像の特徴量に基づいて、色条件設定部14から供給される基底色に対応した1チャンネルの陰影成分の強度画像(以下、陰影強度画像と称する。)を推定する。推定された陰影強度画像は、乗算部43-1に供給される。
【0031】
第1の色パラメータ変換部42-1は、色条件設定部14から供給される色温度T1=3000を、第1の色パラメータに変換する。第1の色パラメータは、R(Red),G(Green)、及びB(Blue)の3チャンネルの色パラメータ[gR(T1),gG(T1),gB(T1)]で表現される。変換されることにより生成された3チャンネルの色パラメータ[gR(T1),gG(T1),gB(T1)]は、乗算部43-1に供給される。
【0032】
乗算部43-1は、第1の陰影強度推定部41-1で推定された1チャンネルの陰影強度画像に、R,G、またはBの各チャンネルの色パラメータ[gR(T1),gG(T1),gB(T1)]を乗算することにより、第1の色パラメータで色が表現される第1の色の陰影画像を生成する。乗算部43-1は、生成して得られた第1の色の陰影画像を、陰影合成部32へ供給する。第1の色の陰影画像は、R,G、及びBの3チャンネルの陰影画像となる。
【0033】
第2の陰影画像生成部31-2は、第2の陰影強度推定部41-2、第2の色パラメータ変換部42-2、及び、乗算部43-2を有している。第2の陰影強度推定部41-2には、特徴量抽出部11で抽出された入力画像の特徴量が供給される。第2の色パラメータ変換部42-2には、色条件設定部14から、第2の基底として色温度T2=8000ケルビンが色条件として供給される。
【0034】
第2の陰影強度推定部41-2は、特徴量抽出部11で抽出された入力画像の特徴量に基づいて、色条件設定部14から供給される基底色に対応した1チャンネルの陰影強度画像を推定する。推定された陰影強度画像は、乗算部43-2に供給される。
【0035】
第2の色パラメータ変換部42-2は、色条件設定部14から供給される色温度T=8000を、第2の色パラメータに変換する。第2の色パラメータは、R,G、及びBの3チャンネルの色パラメータ[gR(T2),gG(T2),gB(T2)]で表現される。変換されることにより生成された3チャンネルの色パラメータ[gR(T2),gG(T2),gB(T2)]は、乗算部43-2に供給される。
【0036】
乗算部43-2は、第2の陰影強度推定部41-2で推定された1チャンネルの陰影強度画像に、R,G、またはBの各チャンネルの色パラメータ[gR(T2),gG(T2),gB(T2)]を乗算することにより、第2の色パラメータで色が表現される第2の色の陰影画像を生成する。乗算部43-2は、生成して得られた第2の色の陰影画像を、陰影合成部32へ供給する。第2の色の陰影画像は、R,G、及びBの3チャンネルの陰影画像となる。
【0037】
陰影合成部32は、第1の陰影画像生成部31-1から供給される第1の色の陰影画像と、第2の陰影画像生成部31-2から供給される第2の色の陰影画像とを合成することにより、陰影画像を生成(推定)して出力する。
【0038】
第nの色パラメータ変換部42-n(n=1または2)が行う、色温度Tnから色パラメータ[gR(Tn),gG(Tn),gB(Tn)]への変換について説明する。色パラメータ[gR(Tn),gG(Tn),gB(Tn)]とは、いわゆるRGB値であり、R,G、及びBそれぞれの色の強さの比率を表す。色温度Tnから色パラメータ[gR(Tn),gG(Tn),gB(Tn)]への変換には、例えば、Planckの式やWeinのモデルを利用して求めることができる。以下では、Weinのモデルを利用した変換について説明する。
【0039】
Weinのモデルは、色温度がTnであるとき、波長λにおいて黒体から発せられるエネルギI(λ, Tn)の関係を示したものであり、以下の式(1)で表すことができる。
【0040】
【数1】
【0041】
式(1)において、hはプランク定数を表し、例えばh=6.626×10-34である。kはボルツマン定数であり、例えばk=1.3806×10-23である。cは光速を表す定数であり、例えばc =2.9979×108である。
【0042】
入力画像の取得にRGBの画素を備えるカメラを利用するとき、R,G,Bそれぞれのセンサ分光感度を、各色が近似的に、波長λRGBにのみ狭帯域の波長感度を持つものとし、色温度がTnであるときの波長λRGBでのエネルギは、I(λR, Tn), I(λG, Tn), I(λB, Tn)で得られる。ここで、色パラメータg(Tn)=[gR(Tn),gG(Tn),gB(Tn)]は、gG(Tn)を1とする場合、すなわち、陰影強度推定部41から得られる1チャンネルの陰影強度画像が、R,G,Bの3チャンネルのうちのGチャンネルに相当するものとする場合、gR(Tn) , gB(Tn)は、
【数2】
によって得られる。λRまたはλBのどちらかをλCとすると、色パラメータgC(Tn) ={λCに対応するgR(Tn)またはgB(Tn)}は、式(2)と解くことができる。
【数3】
【0043】
この色パラメータg(Tn)=[gR(Tn),gG(Tn),gB(Tn)]を、陰影強度推定部41で得られた1チャンネルの陰影強度画像と乗算することで、色温度がTnであるときの第nの色の陰影画像を生成することができる。
【0044】
<CNN予測器の構成例>
図5に示されるように、画像処理装置1は、特徴量抽出部11と、物体色推定部12と、陰影推定部13の第1の陰影強度推定部41-1ないし第Nの陰影強度推定部41-Nを、CNNを用いたCNN予測器により実現することができる。CNN予測器は、所定の入力画像が入力された場合に、1枚の物体色画像と、基底数Nに応じたNチャンネルの陰影強度画像を出力するように学習される。CNN予測器により推定されたNチャンネル(N枚)の陰影強度画像は、第1の陰影強度推定部41-1ないし第Nの陰影強度推定部41-Nへ1チャンネルずつ供給される。
【0045】
CNN予測器の学習処理では、物体色推定部12から得られる物体色画像と、陰影推定部13から得られる陰影画像が、それぞれ、教師となる物体色画像と陰影画像に近づくように、CNN予測器のパラメータが最適化される。CNN予測器の後段の第1の色パラメータ変換部42-1ないし第Nの色パラメータ変換部42-N、乗算部43-1ないし43-N、及び、陰影合成部32の演算もすべて微分可能であるため、誤差逆伝搬によるパラメータの最適化が可能である。学習処理により、例えば、第1の陰影強度推定部41-1から出力される1チャンネルの陰影強度画像は、第1の基底色に対応するように学習され、第Nの陰影強度推定部41-Nから出力される1チャンネルの陰影強度画像は、第Nの基底色に対応するように学習される。
【0046】
基底数Nを2(N=2)として、第1の基底を色温度T1=3000ケルビン、第2の基底を色温度T2=8000ケルビンとした場合、陰影画像が取り得る色空間は、図2に示したように、第1の基底である色温度T1=3000ケルビンの点と、第2の基底である色温度T2=8000ケルビンの点どうしを結んだ直線状の色となり、曲線状の黒体放射軌跡を近似した陰影画像となる。
【0047】
例えば、基底数Nを3(N=3)として、第1の基底の色温度T1=3000ケルビンと、第2の基底の色温度T2=8000ケルビンに加え、(x, y) = (0.33, 0.33)で表される無彩色を第3の基底とすると、陰影画像が取り得る色空間は、図6に示されるように、第1の基底ないし第3の基底それぞれを頂点とする三角形の内部の色となり、曲線状の黒体放射軌跡を近似した陰影画像となる。
【0048】
<基底色の他の指定例>
上述した例では、色条件設定部14において、色条件として、色温度Tn(n=1,2,・・・,N)が指定され、第1の陰影画像生成部31-nの第nの色パラメータ変換部42-nに供給される構成とした。
【0049】
しかしながら、色条件の指定の方法は、この例に限定されず、その他の指定方法を採用してもよい。例えば、図7に示されるように、xy色度図上のxy座標値で、基底色を指定するようにしてもよい。あるいはまた、図8に示されるように、上述したR,G、及びBの3チャンネルの色パラメータ[gR(Tn),gG(Tn),gB(Tn)]を直接、基底色として指定してもよい。色パラメータ[gR(Tn),gG(Tn),gB(Tn)]を直接、基底色として指定する場合、第nの色パラメータ変換部42-nは省略される。
【0050】
以上の第1構成例に係る陰影推定部13によれば、陰影画像が取り得る色空間をN個の基底の色で表現される色空間へ制限することで、陰影画像を安定的に推定することができ、入力画像からの物体色画像と陰影画像の高精度な分離を実現する。
【0051】
上述した例では、陰影成分が取りうる解空間(色空間)を、すべてのRGB空間から、N個の基底の色で表現される色空間へと制約を設け、陰影画像を推定したが、この解空間は、実際の画像のxy色度分布から設定してもよい。具体的には、図9に示されるように、陰影のデータセット、光源色のデータセット等の画像データセット61から、xy色度図上における光源色の分布を求め、その分布を取り囲むような凸包が解空間となるようにN個の基底を設定してもよい。
【0052】
<3.陰影推定部の第2構成例>
次に、陰影推定部13の第2構成例について説明する。
【0053】
上述した第1構成例では、陰影成分が取りうる解空間を、xy色度図上におけるN個の基底の色で表現される色空間へと制約を設けたが、第2構成例では、CIE昼光モデルに従うように制約が設けられる。
【0054】
CIE昼光モデルは、非特許文献“Deane B. Judd, David L. Macadam, and Gunter Wyszecki. Spectral distribution of typical daylight as a function of correlated color temperature. J. Opt. Soc. Am, 54(8):1031-1040, 1964.”によれば、波長λの分光分布ICIE(λ)として、以下の式(3)のように表すことができる。
ICIE(λ)=M1I1(λ)+M2I2(λ)+M3I3(λ) ・・・・・・・(3)
【0055】
式(3)において、I1(λ),I2(λ),I3(λ)は、実測に基づく昼光色を表現するための基底関数であり、図10のように表現される。M1,M2,M3は、光源色を指定するための係数(パラメータ)を表す。
【0056】
図11は、陰影推定部13の第2構成例を示すブロック図である。
【0057】
第2構成例に係る陰影推定部13は、第1の陰影画像生成部31-1ないし第3の陰影画像生成部31-3と、陰影合成部32とを備える。第1の陰影画像生成部31-1ないし第3の陰影画像生成部31-3それぞれは、係数画像推定部81を有する同一の構成とされており、色条件設定部14から色条件として供給される基底関数が異なるが、供給される基底関数を用いて同一の処理を行う。第1の陰影画像生成部31-1ないし第3の陰影画像生成部31-3は、それぞれ、基底関数I1(λ),I2(λ),I3(λ)に対応する。陰影合成部32は、スペクトル合成部91と、カメラ分光感度適用部92とを有する。
【0058】
第1の陰影画像生成部31-1は、第1の係数画像推定部81-1を有する。第1の係数画像推定部81-1には、特徴量抽出部11で抽出された入力画像の特徴量と、色条件設定部14から、色条件としての基底関数I1(λ)が供給される。
【0059】
第1の陰影画像生成部31-1は、入力画像の特徴量と基底関数I1(λ)とから、基底関数I1(λ)の係数M1を画素ごとに格納した第1の係数画像を推定し、スペクトル合成部91に供給する。
【0060】
第2の陰影画像生成部31-2は、第2の係数画像推定部81-2を有する。第2の係数画像推定部81-2には、特徴量抽出部11で抽出された入力画像の特徴量と、色条件設定部14から、色条件としての基底関数I2(λ)が供給される。
【0061】
第2の陰影画像生成部31-2は、入力画像の特徴量と基底関数I2(λ)とから、基底関数I2(λ)の係数M2を画素ごとに格納した第2の係数画像を推定し、スペクトル合成部91に供給する。
【0062】
第3の陰影画像生成部31-3は、第3の係数画像推定部81-3を有する。第3の係数画像推定部81-3には、特徴量抽出部11で抽出された入力画像の特徴量と、色条件設定部14から、色条件としての基底関数I3(λ)が供給される。
【0063】
第3の陰影画像生成部31-3は、入力画像の特徴量と基底関数I3(λ)とから、基底関数I3(λ)の係数M3を画素ごとに格納した第3の係数画像を推定し、スペクトル合成部91に供給する。
【0064】
スペクトル合成部91は、第1の係数画像ないし第3の係数画像の画素毎に式(3)の演算を行うことにより、CIE昼光モデルにおける波長λの分光分布ICIE(λ)を画素毎に算出する。スペクトル合成部91は、算出結果として、第1の係数画像ないし第3の係数画像を合成した、陰影の分光分布画像を、カメラ分光感度適用部92へ供給する。
【0065】
カメラ分光感度適用部92は、陰影の分光分布画像を、それぞれ、入力画像を撮影したカメラのR,G,Bの分光感度関数で畳み込むことにより、R,G、及びBの3チャンネルの陰影画像に変換する。
【0066】
カメラ分光感度適用部92は、変換することにより生成されたR,G、及びBの3チャンネルの陰影画像を、陰影合成部32が推定した陰影画像として出力する。
【0067】
以上の第2構成例に係る陰影推定部13によれば、陰影画像がCIE昼光モデルに従うように制約を設けることで、陰影画像を安定的に推定することができ、入力画像からの物体色画像と陰影画像の高精度な分離を実現する。
【0068】
<4.陰影推定部の第3構成例>
次に、陰影推定部13の第3構成例について説明する。
【0069】
上述した第1構成例では、陰影成分が取りうる解空間を、xy色度図上におけるN個の基底色で表現される色空間へと制約を設けた。第3構成例では、入力画像が屋外で撮影された画像である場合を想定し、入力画像が撮影された時刻(撮影時刻)に応じたモデルを設定して陰影成分を推定する構成が採用される。
【0070】
屋外において光源色は、主に太陽光源から物体に直接照明される直達光と、雲や周囲環境での多重反射を経た後に物体に照明される大域光の2つに分けられる。直達光は、主に日なたで観測され、大域光は、主に日陰で観測される。
【0071】
第3構成例では、第1構成例でN個とされていた陰影画像生成部31の個数が、直達光と大域光に対応する2個に限定される。直達光に対応する色パラメータg(T1)=[gR(T1),gG(T1),gB(T1)]を用いた第1の色の陰影画像と、大域光に対応する色パラメータg(T2)=[gR(T2),gG(T2),gB(T2)]を用いた第2の色の陰影画像とが生成され、合成されることにより、R,G、及びBの3チャンネルの陰影画像が生成される。
【0072】
図12は、陰影推定部13の第3構成例を示すブロック図である。
【0073】
第3構成例に係る陰影推定部13は、第1の陰影画像生成部31-1及び第2の陰影画像生成部31-2と、陰影合成部32とを備える。第1の陰影画像生成部31-1は、第1の陰影強度推定部41-1、第1の色パラメータ変換部101-1、及び、乗算部43-1を有している。第2の陰影画像生成部31-2は、第2の陰影強度推定部41-2、第2の色パラメータ変換部101-2、及び、乗算部43-2を有している。
【0074】
第3構成例に係る陰影推定部13は、図3に示した第1構成例と比較して、陰影画像生成部31の個数が2個に限定されている点、色パラメータ変換部42が色パラメータ変換部101に変更されている点が異なり、それ以外の構成は共通する。
【0075】
第1の陰影画像生成部31-1は、直達光に対応する第1の色の陰影画像を生成し、陰影合成部32へ供給する。第2の陰影画像生成部31-2は、大域光に対応する第2の色の陰影画像を生成し、陰影合成部32へ供給する。
【0076】
第1の色パラメータ変換部101-1及び第2の色パラメータ変換部101-2には、色条件として、撮影時刻が、色条件設定部14から供給される。
【0077】
第1の色パラメータ変換部101-1は、供給される撮影時刻を、直達光に対応する色パラメータg(T1)=[gR(T1),gG(T1),gB(T1)]に変換する。第2の色パラメータ変換部101-2は、供給される撮影時刻を、大域光に対応する色パラメータg(T2)=[gR(T2),gG(T2),gB(T2)]に変換する。
【0078】
例えば、“Seo et al., Real-time adaptable and coherent rendering for outdoor augmented reality, EURASIP Journal on Image and Video Processing, 2018.”に開示されているように、太陽光からなる直達光の分光分布は時刻によって変化するが、その軌跡は、単峰性の関数で近似できることが知られている。そこで、利用を想定するシーンで事前に直達光と大域光の時刻ごとの光源色を計測した学習データを作成し、学習データに基づいて、図13に示されるように、直達光と大域光のそれぞれについて、撮影時刻と色温度の関係を記述した正規分布や2次以上の関数を生成し、生成された関数が第1の色パラメータ変換部101-1及び第2の色パラメータ変換部101-2に格納される。正規分布や2次以上の関数で記述された撮影時刻と色温度の関係は、微分可能な関数であるため、CNNに組み込んで学習することができる。
【0079】
例えば午前9時から午後5時までの範囲をM等分し、時刻x∈[0,M]での直達光の色温度Tdが、式(4)の正規分布Td (x; Ad, μd, σd 2 )でモデル化される。
【数4】
【0080】
時刻xで計測した光源色の系列が{Tx}であるとき、Td (x; Ad, μd, σd 2 )におけるパラメータAd, μd, σd 2 は、対数空間上で、式(5)で表される、{Tx}とTd (x; Ad, μd, σd 2 )との二乗誤差 Jを最小化するようなAd_min, μd_min, σd 2_minとして得ることができる。
【数5】
【0081】
以上より、撮影時刻が供給されると、直達光の色温度Tdを確定することができるので、第1構成例と同様に、色温度Tdに対応した色パラメータg(T1)=[gR(T1),gG(T1),gB(T1)]を生成することができる。大域光についても同様に、大域光の色温度Tiが、正規分布Ti (x; Ai, μi, σi 2 )でモデル化され、撮影時刻の大域光の色温度Tiに対応した色パラメータg(T2)=[gR(T2),gG(T2),gB(T2)]を生成することができる。
【0082】
以上の第3構成例に係る陰影推定部13によれば、陰影画像が直達光のモデルと、大域光のモデルに従うように制約を設けることで、陰影画像を安定的に推定することができ、入力画像からの物体色画像と陰影画像の高精度な分離を実現する。
【0083】
<5.教師データの構成例>
上述した第1構成例ないし第3構成例において、CNN予測器の学習処理では、陰影推定部13が最終的に出力する陰影画像を教師画像と比較して、損失関数を最小化するようなCNN予測器のパラメータを学習することとしたが、図14に示されるように、陰影合成部32が合成する前の第1の色の陰影画像ないし第Nの色の陰影画像を、教師画像と比較して、損失関数を最小化するCNN予測器のパラメータを学習してもよい。第1の色の陰影画像ないし第Nの色の陰影画像の教師画像は、例えば、CG(Computer Graphics)などで生成することができる。
【0084】
<6.第1実施の形態の物体色陰影分離処理>
次に、図15のフローチャートを参照して、第1実施の形態の画像処理装置1による物体色陰影分離処理について説明する。図15では、陰影推定部13が図3に示した第1構成例である場合の物体色陰影分離処理について説明する。この物体色陰影分離処理は、例えば画像処理装置1に入力画像が供給されたとき開始される。
【0085】
初めに、ステップS1において、特徴量抽出部11は、入力画像の特徴量を抽出し、物体色推定部12及び陰影推定部13へ供給する。
【0086】
ステップS2において、物体色推定部12は、特徴量抽出部11から供給された入力画像の特徴量に基づいて、入力画像に含まれる物体の色成分(反射率成分)を画素値として持つ物体色画像を推定して出力する。
【0087】
ステップS3において、第nの陰影強度推定部41-n(n=1,2,3,・・・,N)は、特徴量抽出部11で抽出された入力画像の特徴量に基づいて、色条件設定部14から供給された第nの基底色に対応した1チャンネルの陰影強度画像を推定し、乗算部43-nに出力する。第1の陰影強度推定部41-1ないし第Nの陰影強度推定部41-Nは、1チャンネルの陰影強度画像を推定する処理を並行して同時に実行することができる。
【0088】
ステップS4において、第nの色パラメータ変換部42-nは、色条件設定部14から供給された色温度Tnを、第nの色パラメータに変換する。第nの色パラメータは、R,G、及びBの3チャンネルの色パラメータg(Tn)=[gR(Tn),gG(Tn),gB(Tn)]で表現される。変換されることにより生成された3チャンネルの色パラメータ[gR(Tn),gG(Tn),gB(Tn)]は、乗算部43-nに供給される。第1の色パラメータ変換部42-1ないし第Nの色パラメータ変換部42-Nは、色パラメータg(Tn)の変換処理を並行して同時に実行することができる。
【0089】
ステップS5において、乗算部43-nは、第nの陰影強度推定部41-nで推定された1チャンネルの陰影強度画像に、R,G、またはBの各チャンネルの色パラメータ[gR(Tn),gG(Tn),gB(Tn)]を乗算することにより、第nの色パラメータで色が表現される第nの色の陰影画像を生成する。乗算部43-1ないし乗算部43-Nは、乗算により第1の色の陰影画像ないし第Nの色の陰影画像を生成する処理を並行して同時に実行することができる。生成された第1の色の陰影画像ないし第Nの色の陰影画像は、陰影合成部32へ供給される。
【0090】
ステップS6において、陰影合成部32は、第1の色の陰影画像ないし第Nの色の陰影画像を合成することにより、陰影画像を生成して出力する。
【0091】
物体色画像を推定して出力するステップS2の処理と、陰影画像を生成して出力するステップS3ないしS6の処理は、並行して同時に実行することができる。
【0092】
物体色画像と陰影画像が生成して、画像処理装置1から出力されると、図15の物体色陰影分離処理は終了する。
【0093】
陰影推定部13が図3に示した第1構成例である場合の物体色陰影分離処理は、以上のように実行される。陰影推定部13が図11に示した第2構成例である場合、ステップS3ないしS5の処理が、第1の係数画像推定部81-1ないし第3の係数画像推定部81-3の処理に置き換えられ、ステップS6の処理が、スペクトル合成部91とカメラ分光感度適用部92の処理に置き換えられる。陰影推定部13が図12に示した第3構成例である場合、ステップS4の処理が、第1の色パラメータ変換部101-1及び第2の色パラメータ変換部101-2の処理に置き換えられる。
【0094】
第1実施の形態に係る画像処理装置1によれば、陰影成分が取りうる解空間を、すべてのRGB空間から、所定のモデルの色空間へ制限することにより、陰影画像を安定的に推定することができる。これにより、物体色画像と陰影画像の分離をより高精度に実現し、より良い分離がなされた物体色画像と陰影画像を出力することができる。
【0095】
<7.画像処理装置の第2実施の形態>
図16は、本開示の画像処理装置の第2実施の形態の構成例を示すブロック図である。
【0096】
図16の第2実施の形態は、物体色推定部12が出力する物体色画像が、特徴量抽出部11の入力へ戻されるように構成されている点で、上述した第1実施の形態と相違し、その他の構成は共通する。
【0097】
上述した第1実施の形態においても、1枚の入力画像から、物体色と陰影の2変数を求める不良設定問題であることには変わりがないため、物体色と陰影の分離が不十分である場合があり得る。
【0098】
第2実施の形態に係る画像処理装置1では、物体色推定部12が出力する物体色画像が、予め決定した所定の終了条件を満たしているか否かが判定される。所定の終了条件を満たしていない場合には、物体色推定部12が推定した物体色画像は、物体色画像と陰影画像の分離が不十分で、物体色画像に陰影が残存している画像であるとして、再度、特徴量抽出部11へ入力される。そして、所定の終了条件を満たしていると判定された場合の物体色画像と陰影画像が、最終的な物体色画像と陰影画像として画像処理装置1から出力される。所定の終了条件を満たすまで物体色画像と陰影画像の分離を繰り返し実行することで、物体色画像と陰影画像の分離をより高精度に実行することができ、より良い分離がなされた物体色画像と陰影画像を出力することができる。
【0099】
所定の終了条件としては、例えば、繰り返し回数を予め設定しておき、繰り返し回数が、設定した回数に到達した場合、所定の終了条件を満たしていると判定することができる。
【0100】
<8.第2実施の形態の物体色陰影分離処理>
図17のフローチャートを参照して、第2実施の形態の画像処理装置1による物体色陰影分離処理について説明する。この物体色陰影分離処理は、例えば画像処理装置1に入力画像が供給されたとき開始される。
【0101】
初めに、ステップS51において、特徴量抽出部11、物体色推定部12、及び、陰影推定部13は、入力画像を、物体色画像と陰影画像に分離する処理を実行する。このステップS51の具体的処理は、物体色画像と陰影画像に分離する1回の分離処理に相当し、第1実施の形態における図15の物体色陰影分離処理と同じである。
【0102】
ステップS52において、物体色推定部12は、予め設定された終了条件を満たしているかを判定する。ステップS52で、予め設定された終了条件を満たしていないと判定された場合、処理はステップS53へ進み、物体色推定部12は、推定した物体色画像を、入力画像として特徴量抽出部11へ入力する。ステップS53の後、処理はステップS51へ戻る。
【0103】
一方、ステップS52で、予め設定された終了条件を満たしていると判定された場合、処理はステップS54へ進み、物体色推定部12は、推定した物体色画像を出力する。また、ステップS54において、陰影推定部13は、推定した陰影画像を出力する。
【0104】
物体色画像と陰影画像が画像処理装置1から出力されると、図17の物体色陰影分離処理は終了する。
【0105】
図18は、終了条件のその他の例を説明する図である。
【0106】
例えば、図18のAに示されるように、特徴量抽出部11へ入力した入力画像と、物体色推定部12が推定した物体色画像との二乗平均平方根誤差(RMSE)等で算出される画像誤差が、予め決定した設定値よりも小さいことを、終了条件とすることができる。画像誤差が予め決定した設定値よりも小さくなった場合に、終了条件を満たしていると判定され、物体色推定部12は、推定した物体色画像を出力し、陰影推定部13は、推定した陰影画像を出力する。
【0107】
あるいはまた、図18のBに示されるように、物体色推定部12が、物体色画像を推定する処理をQ回(Q>1)実行したとして、(Q-1)回目の入力画像と物体色推定部12が出力した物体色画像との画像誤差と、Q回目の入力画像と物体色推定部12が出力した物体色画像との画像誤差との差分が、予め決定した設定値よりも小さいことを、終了条件とすることができる。画像誤差の差分が予め決定した設定値よりも小さくなった場合に、終了条件を満たしていると判定され、物体色推定部12は、推定した物体色画像を出力し、陰影推定部13は、推定した陰影画像を出力する。
【0108】
<9.画像処理装置の第3実施の形態>
図19は、本開示の画像処理装置の第3実施の形態の構成例を示すブロック図である。
【0109】
図19に示される第3実施の形態に係る画像処理装置1は、陰影処理部171が新たに追加されている点で、上述した第1実施の形態と相違し、その他の構成は共通する。陰影処理部171は、陰影強度調整部181と、画像合成部182とを有する。
【0110】
陰影強度調整部181には、陰影推定部13により推定された陰影画像が供給される。陰影強度調整部181は、陰影画像の陰影強度を調整する陰影強度調整処理を行う。具体的には、陰影強度調整部181は、供給される陰影画像の輝度値に対してべき乗変換を行うことにより、陰影のコントラストを低下させる低コントラスト処理を行う。例えば、陰影強度調整部181は、低コントラスト処理後の輝度値を、指数p=0.9などとして[輝度値]により求め、低コントラスト陰影画像を生成する。陰影強度調整部181は、生成した低コントラスト陰影画像を、画像合成部182へ供給する。
【0111】
画像合成部182には、陰影強度調整部181から、低コントラスト陰影画像が供給されるとともに、物体色推定部12で推定された物体色画像が供給される。画像合成部182は、低コントラスト陰影画像と物体色画像の対応画素を乗算することにより、入力画像と比べて陰影の効果が弱まった画像(以下、陰影処理画像と称する。)を生成する。生成された陰影処理画像は、再度、入力画像として、特徴量抽出部11へ入力される。第2実施の形態と同様に、陰影強度が調整された陰影処理画像を、入力画像として特徴量抽出部11へ入力する処理が、所定の終了条件を満たしていると判定されるまで繰り返し実行される。
【0112】
第3実施の形態に係る画像処理装置1によれば、入力画像と物体色画像との間の変化量が小さくなるため、再帰的な処理を行う上述の第2実施の形態と同様の効果が期待できる。すなわち、物体色画像と陰影画像の分離をより高精度に実行することができ、より良い分離がなされた物体色画像と陰影画像を出力することができる。
【0113】
<10.第3実施の形態の物体色陰影分離処理>
図20のフローチャートを参照して、第3実施の形態の画像処理装置1による物体色陰影分離処理について説明する。この物体色陰影分離処理は、例えば画像処理装置1に入力画像が供給されたとき開始される。
【0114】
初めに、ステップS71において、特徴量抽出部11、物体色推定部12、及び、陰影推定部13は、入力画像を、物体色画像と陰影画像に分離する処理を実行する。このステップS71の具体的処理は、物体色画像と陰影画像に分離する1回の分離処理に相当し、第1実施の形態における図15の物体色陰影分離処理と同じである。ただし、陰影推定部13により推定された陰影画像は陰影強度調整部181に供給され、物体色推定部12で推定された物体色画像は画像合成部182に供給される点が異なる。
【0115】
ステップS72において、物体色推定部12は、予め設定された終了条件を満たしているかを判定する。ステップS72で、予め設定された終了条件を満たしていないと判定された場合、処理はステップS73へ進む。
【0116】
ステップS73において、陰影処理部171は、推定された物体色画像と陰影画像から、入力画像と比べて陰影の効果が弱まった陰影処理画像を生成し、入力画像として特徴量抽出部11へ入力する。より具体的には、陰影強度調整部181が、陰影推定部13により推定された陰影画像に対して陰影強度調整処理を行うことで低コントラスト陰影画像を生成し、画像合成部182へ供給する。画像合成部182が、低コントラスト陰影画像と物体色画像の対応画素を乗算することにより陰影処理画像を生成する。画像合成部182により生成された陰影処理画像が、入力画像として特徴量抽出部11へ入力され、処理はステップS71へ戻る。
【0117】
一方、ステップS72で、予め設定された終了条件を満たしていると判定された場合、処理はステップS74へ進み、物体色推定部12は、推定した物体色画像を出力する。また、ステップS74において、陰影推定部13は、推定した陰影画像を出力する。
【0118】
物体色画像と陰影画像が画像処理装置1から出力されると、図20の物体色陰影分離処理は終了する。
【0119】
<カスケード構造の構成例>
図19に示した第3実施の形態に係る画像処理装置1は、特徴量抽出部11、物体色推定部12、及び、陰影推定部13を1つずつ備え、物体色推定部12と陰影推定部13で推定された物体色画像と陰影画像を、同一の特徴量抽出部11に再度入力させ、再帰的に処理する構成である。
【0120】
しかしながら、図21に示されるように、特徴量抽出部11、物体色推定部12、及び、陰影推定部13を2段備え、前段の特徴量抽出部11A、物体色推定部12A、及び、陰影推定部13Aによる推定結果を、後段の特徴量抽出部11B、物体色推定部12B、及び、陰影推定部13Bに入力させて物体色陰影分離処理を繰り返し実行する構成としてもよい。図21の画像処理装置1は、前段の特徴量抽出部11A、物体色推定部12A、及び、陰影推定部13Aと、後段の特徴量抽出部11B、物体色推定部12B、及び、陰影推定部13Bとの間に、陰影処理部171を設けた構成とされている。この画像処理装置1は2段のカスケード構造とした例であるが、3段以上のカスケード構造としても勿論よい。
【0121】
<11.学習装置の構成例>
図22は、CNN予測器のパラメータを学習する学習装置の構成例を示すブロック図である。
【0122】
図22に示される学習装置190は、特徴量抽出部191、物体色推定部192、陰影推定部193、及び、色条件設定部194を備える。特徴量抽出部191、物体色推定部192、陰影推定部193、及び、色条件設定部194の詳細構成は、それぞれ、特徴量抽出部11、物体色推定部12、陰影推定部13、及び、色条件設定部14と同様であるので、詳細説明は省略する。
【0123】
学習装置190による学習処理では、学習データとして、入力画像と、その入力画像に対応する教師画像としての物体色画像と陰影画像が多数用意され、誤差逆伝搬により、CNN予測器のパラメータが算出される。
【0124】
図16に示した第2実施の形態に係る画像処理装置1と、図19に示した第3実施の形態に係る画像処理装置1のような、再帰による高精度な物体色画像と陰影画像の分離を行う場合には、上述した陰影処理部171を学習時にも利用して、予め用意した入力画像に対して陰影を薄く処理した入力画像と、反射率を下げた物体色画像、陰影を薄くした陰影画像とのセットを学習データとしてさらに追加することで、物体色画像と陰影画像の分離をより高精度に行うパラメータを算出することができる。
【0125】
<12.画像処理装置の第4実施の形態>
図23は、本開示の画像処理装置の第4実施の形態の構成例を示すブロック図である。
【0126】
図23に示される第4実施の形態に係る画像処理装置1は、特徴量抽出部11、物体色推定部12、陰影推定部201、ユーザ設定部202、及び、画像合成部203を備える。
【0127】
上述した第1実施の形態と比較すると、第4実施の形態に係る画像処理装置1は、第1実施の形態の陰影推定部13と色条件設定部14が、陰影推定部201とユーザ設定部202に置き換えられるとともに、画像合成部203が新たに追加されている。
【0128】
陰影推定部201は、第1実施の形態の陰影推定部13と同様に、ユーザ設定部202から色条件として供給される第1ないし第Nの基底色に対応する、第1ないし第Nの色の陰影画像を、中間生成物として生成する。第1実施の形態の陰影推定部13は、中間生成物として生成された第1ないし第Nの色の陰影画像の全てを合成して、陰影画像を生成するが、陰影推定部201は、ユーザ設定部202からの選択指示に従い、第1ないし第Nの色の陰影画像の少なくとも1つを選択する。陰影推定部201は、中間生成物として生成された第1ないし第Nの色の陰影画像のうち、選択された画像のみを用いて、ユーザの意図が反映された陰影画像を生成し、画像合成部203に供給する。
【0129】
ユーザ設定部202は、第1実施の形態と同様に、陰影推定部201に対して色条件を設定する。また、ユーザ設定部202は、陰影推定部201において中間生成物として生成された第1ないし第Nの色の陰影画像の一部を選択するユーザの選択指示を受け付け、陰影推定部201に供給する。
【0130】
画像合成部203は、物体色推定部12から供給される物体色画像と、陰影推定部201から供給される、ユーザの意図が反映された陰影画像の対応画素とを乗算することにより、光源が編集された画像を生成する。生成された画像は、画像処理装置1の外部へ出力される。
【0131】
図24は、図23の陰影推定部201の詳細構成例を示すブロック図である。ただし、図24の陰影推定部201は、簡単のため、基底数Nを2(N=2)とした構成例とされている。
【0132】
陰影推定部201は、第1実施の形態において基底数Nを2とした図4の陰影推定部13と比べて、陰影合成部32に代えて、陰影合成部232とされている点を除いて、図4の陰影推定部13と共通する。
【0133】
陰影合成部232には、ユーザ設定部202から、第1の陰影画像生成部31-1から供給される第1の色の陰影画像と、第2の陰影画像生成部31-2から供給される第2の色の陰影画像のどちらを選択するかを示す選択指示が供給される。
【0134】
陰影合成部232は、ユーザ設定部202からの選択指示に従い、第1の色の陰影画像と第2の色の陰影画像の一方を選択し、画像合成部203(図23)へ供給する。
【0135】
図25は、陰影推定部201の処理を説明する図である。
【0136】
入力画像には、光源1と光源2による陰影が含まれている。第1の陰影画像生成部31-1は、入力画像から得られた特徴量に基づいて、光源1による陰影を含む画像である第1の色の陰影画像を生成する。第2の陰影画像生成部31-2は、入力画像から得られた特徴量に基づいて、光源2による陰影を含む画像である第2の色の陰影画像を生成する。
【0137】
ユーザが、光源2の影響を排除した画像を生成したい場合、ユーザ設定部202において、第1の色の陰影画像を選択し、第2の色の陰影画像を削除する選択指示を行う。この操作により、陰影合成部232は、ユーザの意図が反映された陰影画像として、第1の色の陰影画像のみを選択して出力する。
【0138】
なお、図24及び図25は、基底数Nを2とした例であるため、第1の色の陰影画像と第2の色の陰影画像の一方を選択し、他方を非選択として、選択した一方を出力するのみであるが、基底数Nが3以上であり、複数の色の陰影画像が選択された場合には、陰影合成部232は、第1実施の形態の陰影合成部32のように、選択された複数の色の陰影画像を合成して出力する。
【0139】
図23の画像合成部203では、物体色推定部12から供給される物体色画像と、光源2の影響を排除した陰影画像とを合成するので、画像処理装置1から出力される画像は、光源2の影響を排除した、第1の基底色のみで照明された画像となる。
【0140】
第4実施の形態に係る画像処理装置1によれば、上述した第1実施の形態において中間生成物とされていた第1ないし第Nの色の陰影画像を取捨選択できるようにしたことで、ユーザが光源分離や光源の編集を行うことが可能となる。
【0141】
<13.コンピュータの構成例>
上述した画像処理装置1および学習装置190が行う一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているマイクロコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
【0142】
図26は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0143】
コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
【0144】
バス504には、さらに、入出力インタフェース505が接続されている。入出力インタフェース505には、入力部506、出力部507、記憶部508、通信部509、及びドライブ510が接続されている。
【0145】
入力部506は、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部507は、ディスプレイ、スピーカ、出力端子などよりなる。記憶部508は、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部509は、ネットワークインタフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体511を駆動する。
【0146】
以上のように構成されるコンピュータでは、CPU501が、例えば、記憶部508に記憶されているプログラムを、入出力インタフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0147】
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
【0148】
コンピュータでは、プログラムは、リムーバブル記録媒体511をドライブ510に装着することにより、入出力インタフェース505を介して、記憶部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記憶部508にインストールすることができる。その他、プログラムは、ROM502や記憶部508に、あらかじめインストールしておくことができる。
【0149】
なお、本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。
【0150】
本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0151】
例えば、上述した複数の実施の形態の全てまたは一部を組み合わせた形態を採用することができる。
【0152】
例えば、本開示の技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
【0153】
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0154】
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
【0155】
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。
【0156】
なお、本開示の技術は、以下の構成を取ることができる。
(1)
入力画像の特徴量に基づいて、前記入力画像に含まれる物体の色成分を画素値として持つ物体色画像を推定する物体色推定部と、
前記入力画像の特徴量に基づいて、前記入力画像の陰影成分を画素値として持つ陰影画像を推定する陰影推定部と
を備え、
前記陰影推定部は、前記入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して前記陰影画像を推定する
画像処理装置。
(2)
前記所定の色条件としてN個(N>1)の基底色が与えられ、
前記陰影推定部は、前記入力画像の陰影成分が取りうる色空間を、前記N個の基底色で表現される色空間に制限して前記陰影画像を推定する
前記(1)に記載の画像処理装置。
(3)
前記陰影推定部は、
所定の基底色に対応する陰影画像を生成するN個の陰影画像生成部と、
前記N個の陰影画像生成部により生成されたN個の基底色の陰影画像を合成する陰影合成部と
を有する
前記(2)に記載の画像処理装置。
(4)
前記陰影画像生成部は、
前記入力画像の特徴量に基づいて陰影強度画像を推定する陰影強度画像推定部と、
前記所定の基底色を色パラメータに変換する色パラメータ変換部と
を有する
前記(3)に記載の画像処理装置。
(5)
前記基底色は、色温度で与えられる
前記(2)ないし(4)のいずれかに記載の画像処理装置。
(6)
前記基底色は、xy色度図上のxy座標値で与えられる
前記(2)ないし(4)のいずれかに記載の画像処理装置。
(7)
前記基底色は、RGBの色パラメータで与えられる
前記(2)ないし(4)のいずれかに記載の画像処理装置。
(8)
前記所定の色条件で決定される色空間は、CIE昼光モデルに従う空間である
前記(1)に記載の画像処理装置。
(9)
前記所定の色条件として、前記CIE昼光モデルの基底関数が与えられる
前記(8)に記載の画像処理装置。
(10)
前記陰影推定部は、
前記CIE昼光モデルの第1の基底関数の係数を格納した第1の係数画像を推定する第1の係数画像推定部と、
前記CIE昼光モデルの第2の基底関数の係数を格納した第2の係数画像を推定する第2の係数画像推定部と、
前記CIE昼光モデルの第3の基底関数の係数を格納した第3の係数画像を推定する第3の係数画像推定部と
前記第1の係数画像ないし前記第3の係数画像を合成し、陰影の分光分布画像を生成する合成部と
前記陰影の分光分布画像を、R,G,Bの分光感度関数で畳み込むことにより、前記陰影画像に変換する分光感度適用部と
を有する
前記(9)に記載の画像処理装置。
(11)
前記所定の色条件は、前記入力画像の撮影時刻である
前記(1)に記載の画像処理装置。
(12)
前記撮影時刻に応じて、直達光に対応する色パラメータと、大域光に対応する色パラメータとに変換され、
前記直達光に対応する色パラメータを用いた第1の色の陰影画像を生成する第1の陰影画像生成部と、
前記大域光に対応する色パラメータを用いた第2の色の陰影画像を生成する第2の陰影画像生成部と、
前記第1の色の陰影画像と前記第2の色の陰影画像を合成する陰影合成部と
を有する
前記(11)に記載の画像処理装置。
(13)
前記入力画像の特徴量を抽出する特徴量抽出部をさらに備える
前記(1)ないし(12)のいずれかに記載の画像処理装置。
(14)
前記物体色推定部で推定された前記物体色画像を前記入力画像として前記特徴量抽出部に再度入力する処理が、所定の終了条件を満たすまで繰り返し実行される
前記(13)に記載の画像処理装置。
(15)
前記物体色推定部で推定された前記物体色画像と、前記陰影推定部で推定された前記陰影画像とを用いて、陰影強度が調整された陰影処理画像を生成する陰影処理部をさらに備え、
前記陰影処理画像を前記入力画像として前記特徴量抽出部に再度入力する処理が、所定の終了条件を満たすまで繰り返し実行される
前記(13)に記載の画像処理装置。
(16)
前記陰影推定部は、
前記所定の色条件に対応する色の陰影画像を生成するN個(N>1)の陰影画像生成部と、
ユーザの選択指示にしたがい、前記N個の陰影画像生成部により生成されたN枚の色の陰影画像の少なくとも1つを選択して合成する陰影合成部と
を有し、
前記陰影合成部により合成された画像と、前記物体色推定部により推定された物体色画像とが合成される
前記(1)に記載の画像処理装置。
(17)
前記物体色推定部と前記陰影推定部には、学習処理により求められたパラメータを用いたCNN予測器が用いられる
前記(1)ないし(16)のいずれかに記載の画像処理装置。
(18)
画像処理装置が、
入力画像の特徴量に基づいて、前記入力画像に含まれる物体の色成分を画素値として持つ物体色画像を推定し、
前記入力画像の特徴量に基づいて、前記入力画像の陰影成分を画素値として持つ陰影画像を推定し、
前記陰影画像は、前記入力画像の陰影成分が取りうる色空間を、所定の色条件で決定される色空間に制限して推定される
画像処理方法。
【符号の説明】
【0157】
1 画像処理装置, 11 特徴量抽出部, 12 物体色推定部, 13 陰影推定部, 14 色条件設定部, 31 陰影画像生成部, 31-1ないし31-N 第1ないし第Nの陰影画像生成部, 32 陰影合成部, 41-1ないし41-N 第1ないし第Nの陰影強度推定部, 42-1ないし42-N 第1ないし第Nの色パラメータ変換部, 43-1ないし43-N 乗算部, 61 画像データセット, 81-1ないし81-3 第1ないし第3の係数画像推定部, 91 スペクトル合成部, 92 カメラ分光感度適用部, 101 色パラメータ変換部, 101-1 第1の色パラメータ変換部, 101-2 第2の色パラメータ変換部, 171 陰影処理部, 181 陰影強度調整部, 182 画像合成部, 190 学習装置, 191 特徴量抽出部, 192 物体色推定部, 193 陰影推定部, 194 色条件設定部, 201 陰影推定部, 202 ユーザ設定部, 203 画像合成部, 232 陰影合成部, 501 CPU, 502 ROM, 503 RAM, 506 入力部, 507 出力部, 508 記憶部, 509 通信部, 510 ドライブ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26