(58)【調査した分野】(Int.Cl.,DB名)
【背景技術】
【0002】
従来より、撮像機器として分類されるデジタルカメラ、デジタルビデオカメラ、カメラ付き通信端末(携帯電話、スマートフォン、タブレット等)等においては、撮影された画像に対して色再現補正処理が施されている。
即ち、一般的には、CMOSイメージセンサ等の撮像素子で得られた画像データに、イメージシグナルプロセッサー(ISP)を含んだシステムオンチップ(SoC)等の半導体を用いて、自動露出補正、自動ホワイトバランス、自動フォーカス、シェーディング補正等の画像処理が行われる。
【0003】
ここで、イメージシグナルプロセッサーを含むシステムオンチップでは
、画像データに対して、色再現性を向上させるための色調整処理等の各種画像処理が行われる。このため、
その前段である撮像素子で受光した画像データの補正は、色再現性を大きく左右され、画像処理装置および画像処理方法において重要な役割を果たすことになる。
【0004】
また、撮像素子が受ける光は様々な外的要因を受けて決定される。例えば、建物の外で撮影されるシーンでは、天候や時間、建物の影のような暗い状態等の様々な外的要因に影響される。また、例えば、建物の中で撮影されるシーンにおいては、照明器具の種類や明るさ等の様々な外的要因に影響される。そのため、CCDセンサやCMOSイメージセンサ
等の撮像素子で得られた画像データから、撮影されているシーンにおいて、影響している外的要因の種類(例えば、環境光の種類)を特定し、特定された夫々の外的要因(例えば、環境光が太陽光か、蛍光灯か等)に対応した色補正を施すことが必要となる。
【0005】
この点、機械学習
等を用いて、撮影されているシーンにおける、環境光の種類を特定するための技術が提案されている(例えば、特許文献1、特許文献2参照)。
【発明を実施するための形態】
【0012】
以下、本発明の一実施形態について、図面を参照して説明する。
【0013】
図1は、本発明の一実施形態に係る画像処理装置の構成を示すブロック図である。
画像処理装置1は、センサベイヤデータ取得部2と、イメージパイプ3と、出力画像データ出力部4とを備えている。
【0014】
センサベイヤデータ取得部2は、図示せぬ撮像装置により撮像された動画像を構成する各フレームのデータの夫々を、センサベイヤデータの形態で順次取得して、イメージパイプ3に出力する。
【0015】
イメージパイプ3は、各フレームのデータに対して各種画像処理を施すべく、シェーディング補正処理部5と、ホワイトバランス処理部6と、色補間処理部7と、色再現ゲイン処理部8と、ガンマ処理部9と、色空間変換処理部10とを備えている。
【0016】
シェーディング補正処理部5は、センサベイヤデータ取得部2から供給されたフレームのデータ(センサベイヤデータ)に対して、シェーディング補正処理を施す。シェーディング補正処理が施されたフレームのデータは、ホワイトバランス処理部6に供給される。
【0017】
ホワイトバランス処理部6は、シェーディング補正処理部5から供給されたフレームのデータに対して、ホワイトバランス処理を施す。ホワイトバランス処理が施されたフレームのデータは、色補間処理部7に供給される。
【0018】
色補間処理部7は、ホワイトバランス処理部6から供給されたフレームのデータに対して、色補間処理を施す。色補間処理が施されたフレームのデータは、色再現ゲイン処理部8に供給される。
【0019】
色再現ゲイン処理部8は、色補間処理部7から供給されたフレームのデータに対して、色再現ゲイン処理を施す。色再現ゲイン処理が施されたフレームのデータは、ガンマ処理部9に供給される。
【0020】
ガンマ処理部9は、色再現ゲイン処理部8から供給されたフレームのデータに対して、ガンマ処理を施す。ガンマ処理が施されたフレームのデータは、色空間変換処理部10に供給される。
【0021】
色空間変換処理部10は、ガンマ処理部9から供給されたフレームのデータに対して、色空間変換処理を施す。色空間変換処理が施されたフレームのデータは、出力画像データ出力部4に供給される。
【0022】
出力画像データ出力部4は、イメージパイプ3から順次出力される各フレームのデータの夫々を、出力画像のデータとして、後述する図示せぬ回路に出力する。
【0023】
図2は、
図1の画像処理装置1のうち、主にホワイトバランス処理部6の機能的構成の詳細を示す機能ブロック図である。
【0024】
ホワイトバランス処理部6においては、RGB算出部61と、初期推定部62と、特徴空間写像部63と、光源判定部64と、ホワイトバランス補正部65と、補正データ出力部66とが機能する。
RGB算出部61乃至補正データ出力部66の各機能等の詳細については、
図3以降のフローチャート等を参照して画像処理装置1の処理を説明する際に合わせて説明する。
【0025】
光源判定部64においては、教示データ記憶部641と、機械学習部642と、関連パラメータ記憶部643と、光源識別部644とが機能する。
教示データ記憶部641は、複数の画像データと当該各画像の夫々を撮影したシーンの光源のカテゴリ番号とからなる教示データを記憶している。
機械学習部642は、教示データ記憶部641に記憶された教示データに基づいて、各画像データから抽出した特徴ベクトルから光源のカテゴリを判定するための基準を機械学習し、学習した判定基準(分類器)を関連パラメータ記憶部643に記憶する。なお、機械学習の方法としては、例えば、SVM(サポート・ベクター・マシーン)等を採用することができる。
光源識別部644は、後述のフレームのデータから特徴空間写像部63によって特徴空間上に写像され光源判定部64に供給された初期推定ベクトルを、関連パラメータ記憶部643に記憶された分類器を用いてカテゴリ分類し、当該フレームを撮影したシーンの一つ以上の光源のカテゴリ、及び当該一つ以上の光源のカテゴリと前記初期推定ベクトルとの特徴空間上での距離等のデータをホワイトバランス補正部65に出力する。
【0026】
次に、
図3を参照して、画像処理装置1のホワイトバランス処理部6が実行するホワイトバランス処理について説明する。
ここで、「ホワイトバランス処理」とは、各フレームが撮影されたシーンの光源を判定して、各フレームのデータに対してホワイトバランス補正を施していく一連の処理をいう。
【0027】
図3は、画像処理装置1のホワイトバランス処理部6により実行されるホワイトバランス処理を説明するフローチャートである。
【0028】
ホワイトバランス処理は、シェーディング補正処理部5からホワイトバランス処理部6にシェーディング補正処理済のフレームの画素群のデータ(以下、「フレームのデータ」と呼ぶ)が供給される毎にその都度実行される。なお、Statisticsデータとは、フレームのデータと同一のデータである。
【0029】
ステップS11において、RGB算出部61は、フレームのデータにおける(R値,G値,B値)を三つのチャンネルとして算出し、初期推定部62に供給する。
【0030】
ステップS12において、初期推定部62は、ステップS11で算出された(R値,G値,B値)の夫々について最大値を抽出する。なお、この(R値,G値,B値)の夫々の最大値は、光源色の初期推定値(Rmax値,Gmax値,Bmax値)として特徴空間写像部63に供給される。
【0031】
ステップS13において、特徴空間写像部63は、ステップS12で抽出された光源色の初期推定値(Rmax値,Gmax値,Bmax値)を特徴空間に写像して、得られた特徴ベクトルを光源判定部64に供給する。なお、本実施形態では、特徴空間は(R/G,B/G)の二次元空間として説明を行う。
前記特徴空間上の特徴ベクトル(R/G,B/G)とは、即ち、Gで正規化された光源色の値であるが、この逆数が所定光源の最適ホワイトバランスゲインとして用いられる場合には、以下では「最適WBGain」と省略表記する。また、ステップS12で抽出された初期推定値(Rmax,Gmax,Bmax)を特徴空間に写像した特徴ベクトル(Rmax/Gmax,Bmax/Gmax)を、以下では「初期推定ベクトル」と呼ぶ。
【0032】
ステップS14において、光源判定部64は、ステップS13で特徴空間に写像された初期推定ベクトルの分類される光源の種類を判定する。
即ち、ステップS14において、光源判定部64は、初期推定ベクトルが分類される一つ以上の光源カテゴリを、分類器に基づいて判定する。なお、この分類器は、予め機械学習した関連パラメータが格納された各種関連パラメータと共に、関連パラメータ記憶部643に格納されている。
【0033】
ステップS15において、ステップS15において、ホワイトバランス補正部65はステップS14で光源判定部64により判定された光源のカテゴリに基づいて、各光源のホワイトバランス補正のために予め準備された図示せぬLUT(LookUp Table)を用いて、フレームのデータに対して最適なホワイトバランス補正を行う。なお、複数の光源カテゴリに近いと判定された場合のホワイトバランス補正については、
図10を参照して後述する。
【0034】
ステップS16において、補正データ出力部66は、ステップS15で導出されたホワイトバランス補正された画像データを、画像処理装置1における後続段である色補間処理部7に供給する。
【0035】
図4は、所定の光源から取得された複数の教示データから特徴空間上に写像して得られた初期推定ベクトルの分布イメージを示す図である。
【0036】
図4において、A〜Eの記号は、複数の教示データから得られた初期推定ベクトルが分類されるカテゴリの番号を示している。
即ち、任意に選択したカテゴリの光源のもとで撮像した教示データが、夫々のカテゴリに分類されて、クラスタ化されているのである。
図4の例では、カテゴリAに分類される光源(以下、「A光源」と呼ぶ)は、太陽光であるとする。つまり、A光源に分類されるクラスタとは、太陽光のもとで撮像された教示データが分類されて、クラスタ化されたものである。
ここで、同様にカテゴリB〜Eに分類される光源については、A光源と同様に、B光源〜E光源と呼ぶ。
このようにして算出された分類器の出力イメージについて、引き続き、
図5を用いて説明を行う。なお、本実施形態において撮像されたシーンの各フレームのデータは、上記A〜Eの単独あるいは複数の光源が含まれる可能性がある。
【0037】
図5は、本実施形態に係る特徴空間において、複数の教示データの機械学習によって得られた分類器の出力イメージを示す図である。
なお、A〜Eの記号は、
図4と同様に、複数の教示データから得られた初期推定ベクトルが分類されるカテゴリの番号を示している。
【0038】
図5の例では、教示データの機械学習によって、A〜Eの光源を表す各クラスタの境界が画定されている。
即ち、前述の機械学習によって、A〜Eの光源を表す各クラスタの境界を確定することができ、各クラスタの分類を容易に実現することができる。
本実施形態における、分類器とは、このように機械学習によって、各種光源(A〜E)の光源を表す各クラスタの境界を確定する機能を有している。この分類器を用いることで、後述するように、容易に最適WBGainを算出することができるのである。
次に、このようにして算出された分類器を用いて、実際に入力された所定のフレームデータから算出された初期推定光源のWBGainの取得方法について、以降の図面を用いて説明していく。
【0039】
図6は、本実施形態に係る特徴空間において、所定のフレームのデータから算出された初期推定ベクトルを示す図である。
【0040】
図6の例では、当該フレームのデータから算出された初期推定ベクトルHがA光源のカテゴリ範囲内に存在している。
この新たに算出された初期推定ベクトルHのWBGainの取得方法について、引き続き、
図7を用いて説明していく。
【0041】
即ち、
図7は、本実施形態に係る特徴空間において、A〜Eの各カテゴリに分類された光源の最適WBGainを説明するためのイメージ図である。
【0042】
図7の例では、A光源に分類された初期推定ベクトルHについて、最適WBGainを設定する場合の例を示している。
ここで、分類器によって分けられた各カテゴリに区分された空間に分布する初期推定ベクトルは、前述の通り、様々な要因で各カテゴリの最適WBGainから外れている可能性がある。そのため、初期推定ベクトルHをそのまま用いてホワイトバランス補正を行うことは望ましくない。
したがって、
図7の例では初期推定ベクトルHは、A光源に分類される特徴空間内に存在しているため、当該初期推定ベクトルの代わりに、前述の機械学習により設定されたA光源の最適WBGainを設定する。
【0043】
図8は、本実施形態に係る特徴空間において、特殊カテゴリが存在するイメージ図である。
【0044】
図8の例では、C光源のカテゴリの空間内に、新しく一定の分布を持つ特殊カテゴリが存在している場合が示されている。
即ち、複数のフレームのデータが入力されていくと、上述のA〜Eの何れのカテゴリにも分類が困難な特徴空間内の所定の領域に新たなクラスタを作る場合がある。
このような場合に、フレームのデータが蓄積された結果として生成された新たなクラスタを特殊カテゴリとして呼び、別の光源として識別することができる。そこで、初期推定ベクトルが、この特殊カテゴリに分類される場合について、
図9を用いて、引き続き説明を行う。
【0045】
図9は、本実施形態に係る特徴空間において、特殊カテゴリに対応した最適WBGainを説明するためのイメージ図である。
【0046】
図9を見ると、初期推定ベクトルは、
図8で新しく設定された特殊カテゴリに分類されている。このような特殊カテゴリが設定された場合、その特殊カテゴリに対して、前述の機械学習によって再び新たな分類器が算出される。そして、その特殊カテゴリに対応した最適WBGainが別途設定される。
即ち、
図9の例では、初期推定ベクトルは、ここで別途設定された特殊カテゴリに対応した最適WBGainが、初期推定ベクトルの最適WBGainとして設定される。
【0047】
図10は、本実施形態に係る特徴空間において、初期推定ベクトルがB光源とC光源の重複分布範囲内にある場合を説明するためのイメージ図である。
【0048】
図10を見ると、例えば、初期推定ベクトルは、B光源とC光源の重複分布範囲内に存在している。
このような場合、まず、光源識別部644は、初期推定ベクトルと各光源の最適WBGainとをアルゴリズムから類似度を算出する。そして、その類似度に基づいて、初期推定ベクトルがB光源に分類されるのか、あるいはC光源に分類されるのか、が選択される。
図10の例では、光源識別部644は、類似度の算出結果として、初期推定ベクトルをC光源の最適WBGainとして選択している。
【0049】
以上本発明の画像処理装置の一実施形態について説明したが、本発明は上述した本実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果の列挙に過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
【0050】
例えば、上述の本実施形態では、機械学習の方法としては、SVMを用いると説明を行ったが、機械学習の方法は、これに特に限定されない。
さらに、例えば、この機械学習は、ホワイトバランス処理の実行前に完了することを前提として説明を行ったが、これに特に限定されない。即ち、ホワイトバランス処理を実行する際に、並列して機械学習を行うことも可能である。
【0051】
例えば、上述の本実施形態では、初期推定部62が(R,G,B)の各チャンネルの最大値(Rmax値,Gmax値,Bmax値)を抽出すると記述したが、これに特に制限されない。
例えば、(R値,G値,B値)を(Y値,U値,V値)に変換して、その最大値を抽出してもよい。
さらに例えば、(Rmax値,Gmax値,Bmax値)を抽出せず、各チャンネルの平均値(Rave値,Gave値,Bave値)を抽出してもよい。
【0052】
例えば、上述の本実施形態では、特徴空間写像部63が(R/G,B/G)二次元空間を特徴空間として写像すると記述したが、これに特に制限されない。例えば、さらに多くの特徴量を追加して、多次元の特徴空間として写像してもよい。
【0053】
例えば、
図10の例では、光源識別部644は、類似度の概念を用いて、初期推定ベクトルの分類を選択するものとして説明を行ったが、類似度の概念をどのように定義するか、また、どのように初期推定ベクトルの分類を選択するのかは、自由に決定することができる。
例えば、算出した類似度によって重み付けしたB光源とC光源の最適WBGainの平均値を用いて、初期推定ベクトルの最適WBGainを選択してもよい。
【0054】
また、
図1に示すハードウェア構成は、本発明の目的を達成するための例示に過ぎず、特に限定されない。
【0055】
また、
図2に示すブロック図は、例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能がホワイトバランス処理部6に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは、特に
図2の例に限定されない。
さらに、機能ブロックの存在場所も、
図2に限定されず、任意でよい。
そして、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェアとの組み合わせで構成してもよい。
【0056】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
【0057】
以上まとめると、本発明が適用される画像処理装置は、次のような構成を取れば足り、各種各様な実施形態を取ることができる。
即ち、本発明が適用される画像処理装置(例えば
図1の画像処理装置1)は、
所定の画像データから所定のパラメータを取得し、前記パラメータに基づく値を、所定の特徴空間上に写像することで、前記特徴空間上の所定の光源推定ベクトルを取得する取得手段(例えば
図2の初期推定部62や特徴空間写像部63)と、
前記第1取得手段で取得された光源推定ベクトルを、予め機械学習された分類器によって、前記光源推定ベクトルの前記特徴空間上のカテゴリを分類する分類手段(例えば
図2の光源識別部644)と、
前記光源推定ベクトルと前記分類手段により分類されたカテゴリに基づいて、前記画像データのうちの所定のフレームのデータから最適WBGainを取得し、WB補正を行う補正手段(例えば
図2のホワイトバランス補正部65)と、
を備えていれば足りる。
【0058】
これにより、撮影されたシーンの中に複数の光源が環境光として存在していた場合でも、予め機械学習して得られた分類器を用いて、フレームのデータから取得された特徴ベクトルをカテゴリ分類して光源を特定することで、より容易に最適WBGainを取得することができる。
そのため、フレームのデータから推定された光源色に基づいて、(直接)ホワイトバランス補正を行う従来の技術と比較して、より容易に最適ホワイトバランス補正を行うことが可能となる。