(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022156631
(43)【公開日】2022-10-14
(54)【発明の名称】画像補正モデル生成方法、画像補正モデル生成プログラム及び画像補正モデル生成装置
(51)【国際特許分類】
H04N 1/60 20060101AFI20221006BHJP
G06T 1/00 20060101ALI20221006BHJP
【FI】
H04N1/60 770
G06T1/00 510
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021060429
(22)【出願日】2021-03-31
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】清水 雅芳
【テーマコード(参考)】
5B057
5C079
【Fターム(参考)】
5B057CA01
5B057CA08
5B057CA12
5B057CA16
5B057CB01
5B057CB08
5B057CB12
5B057CB16
5B057CC01
5B057CE17
5B057CH08
5B057DA17
5B057DB02
5B057DB06
5B057DB09
5B057DC25
5B057DC40
5C079HB01
5C079LA02
5C079LA23
5C079MA13
5C079NA03
(57)【要約】
【課題】画像補正モデルの訓練に用いる訓練データを削減すること。
【解決手段】画像補正モデル生成方法では、訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まるハイライト色を用いて訓練画像に色彩補正が行われた色彩補正画像と訓練画像の正解ラベルとを照合し、照合する処理による照合結果に基づいて画像補正モデルのパラメータを更新する、処理をコンピュータが実行する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まる前記ハイライト色を用いて前記訓練画像に色彩補正が行われた色彩補正画像と前記訓練画像の正解ラベルとを照合し、
前記照合する処理による照合結果に基づいて前記画像補正モデルのパラメータを更新する、
処理をコンピュータが実行することを特徴とする画像補正モデル生成方法。
【請求項2】
前記訓練画像からハイライト色の候補となる画素を抽出する処理を前記コンピュータがさらに実行し、
前記画像補正モデルは、前記訓練画像および前記ハイライト色の候補となる画素が入力されることを特徴とする請求項1に記載の画像補正モデル生成方法。
【請求項3】
前記抽出する処理は、前記訓練画像に含まれる画素ごとに前記画素の明度または彩度に基づいて前記ハイライト色の候補となる画素を抽出する処理を含む、
ことを特徴とする請求項2に記載の画像補正モデル生成方法。
【請求項4】
前記画像補正モデルは、前記ハイライト色または前記座標値と、中間色の補正強度とを出力することを特徴とする請求項1、2または3に記載の画像補正モデル生成方法。
【請求項5】
前記色彩補正画像は、前記ハイライト色または前記座標値から求まる前記ハイライト色と、前記中間色の補正強度とを用いて、前記訓練画像に色彩補正が行われることにより生成されることを特徴とする請求項4に記載の画像補正モデル生成方法。
【請求項6】
訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まる前記ハイライト色を用いて前記訓練画像に色彩補正が行われた色彩補正画像と前記訓練画像の正解ラベルとを照合し、
前記照合する処理による照合結果に基づいて前記画像補正モデルのパラメータを更新する、
処理をコンピュータに実行させることを特徴とする画像補正モデル生成プログラム。
【請求項7】
訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まる前記ハイライト色を用いて前記訓練画像に色彩補正が行われた色彩補正画像と前記訓練画像の正解ラベルとを照合し、
前記照合する処理による照合結果に基づいて前記画像補正モデルのパラメータを更新する、
処理を実行する制御部を含む画像補正モデル生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像補正モデル生成技術に関する。
【背景技術】
【0002】
人物探索や追跡などの画像認識における認識性能の低下を抑制する側面から、異なる照明光の下で撮影される画像の色のずれ、いわゆる色かぶりを補正する画像補正技術が提案されている。
【0003】
このような画像補正技術の例として、画像を入力として色かぶり補正後の画像を出力する機械学習モデルを画像補正モデルとして用いる機械学習技術と、人や物体などのオブジェクトの画像照合技術とを組み合わせるものがある。
【0004】
例えば、画像補正モデルの訓練には、画像照合用の正解データ、すなわち同一のオブジェクトが含まれる2つの画像を訓練データとして含むデータセットが用いられる。この場合、2つの画像のうち一方の画像を訓練画像とし、他方の画像を正解ラベルとして用いることができる。このようなデータセットの下、訓練画像が入力された画像補正モデルの出力と正解ラベルとの照合結果、例えば類似度や距離から求まる損失に基づいて画像補正モデルのパラメータを更新することにより、画像補正モデルが訓練される。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記の機械学習技術および上記の画像照合技術の組合せでは、画像補正モデルの訓練時に画像補正モデルのパラメータを収束させるまでに大量の訓練データが必要となる一面がある。
【0007】
1つの側面では、本発明は、画像補正モデルの訓練に用いる訓練データの削減を実現できる画像補正モデル生成方法、画像補正モデル生成プログラム及び画像補正モデル生成装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
一態様にかかる画像補正モデル生成方法では、訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まる前記ハイライト色を用いて前記訓練画像に色彩補正が行われた色彩補正画像と前記訓練画像の正解ラベルとを照合し、前記照合する処理による照合結果に基づいて前記画像補正モデルのパラメータを更新する、処理をコンピュータが実行する。
【発明の効果】
【0009】
画像補正モデルの訓練に用いる訓練データの削減を実現できる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、画像補正モデル生成装置の機能構成例を示すブロック図である。
【
図3】
図3は、撮像時の階調補正の逆関数の一例を示す図である。
【
図5】
図5は、階調補正の再実行の一例を示す図である。
【
図7】
図7は、画像補正モデル生成処理の手順を示すフローチャートである。
【
図8】
図8は、応用例に係る画像補正モデル生成装置の機能構成例を示すブロック図である。
【
図9】
図9は、ハードウェア構成例を示す図である。
【発明を実施するための形態】
【0011】
以下、添付図面を参照して本願に係る画像補正モデル生成方法、画像補正モデル生成プログラム及び画像補正モデル生成装置の実施例について説明する。各実施例には、あくまで1つの例や側面を示すに過ぎず、このような例示により数値や機能の範囲、利用シーンなどは限定されない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【実施例0012】
図1は、画像補正モデル生成装置の機能構成例を示すブロック図である。
図1に示す画像補正モデル生成装置10は、画像を入力としてハイライト色を出力する画像補正モデルを生成する画像補正モデル生成機能を提供するものである。
【0013】
このような画像補正モデル生成機能の説明に先立って、参考技術1~参考技術3について説明する。
【0014】
<参考技術1>
参考技術1として、一般的な色かぶり、すなわち照明光の影響で色がずれた画像を画像編集ソフトを用いて補正する技術を挙げる。参考技術1では、画像の階調分布、いわゆるヒストグラムのピーク値を最大値、例えばビットマップ方式の8Bit画像であれば255に選択するマニュアル操作を受け付ける。例えば、赤、緑および青のヒストグラムごとに当該ヒストグラムのピーク値を最大値として選択する操作が受けけられる。このようにマニュアル操作で選択されたヒストグラムのピーク値を最大値とするときの傾きから定まるゲインに従ってピーク値以下の画素値が線形に補正される。
【0015】
また、参考技術1では、ヒストグラムのピーク値を選択させる代わりに、画像の白と思われる場所を選択するマニュアル操作をハイライト色として受け付けることもできる。この場合もヒストグラムのピーク値を選択させる場合と同様に、ハイライト色を最大値とするときの傾きから定まるゲインに従ってピーク値以下の画素値が線形に補正される。
【0016】
<参考技術2>
参考技術2として、「ニューラルネットワークを用いた照明推定による色補正手法に関する研究」を挙げる。参考技術2では、異なる複数の照明条件の下で24bitのRGB値を50程度ずつ変えて色の割合が同程度になるように割り当てられた77色のカラーテーブルが撮影される。例えば、蛍光灯+ハロゲンランプ、蛍光灯+自然光、自然光+ハロゲンランプといった照明条件が挙げられる。
【0017】
このように照明条件ごとにカラーテーブルが撮影された入力画像のうち対象画素のRGB値と、基準とする照明条件における基準白色および入力画像における白色の間の基準白色誤差とがニューラルネット(NN)へ入力される。そして、NNが出力する補正後のRGB値と、基準とする照明条件でカラーテーブルが撮影されたときの対象画素のRGB値との二乗平均誤差が閾値以下になるまでNNのパラメータが訓練される。
【0018】
このような参考技術2によれば、画像の中の最も明るい部分が基準白色として用いられるので、基本的には、中間調の補正を自動化する技術と言える側面がある。
【0019】
<参考技術3>
参考技術3として、画像を入力として色かぶり補正後の画像を出力する機械学習モデルを画像補正モデルとして用いる機械学習技術と、人や物体などのオブジェクトの画像照合技術とを組み合わせる画像補正技術を挙げる。
【0020】
このような画像補正モデルの訓練には、画像照合用の正解データ、すなわち同一のオブジェクトが含まれる2つの画像を訓練データとして含むデータセットが用いられる。この場合、2つの画像のうち一方の画像を訓練画像とし、他方の画像を正解ラベルとして用いることができる。このようなデータセットの下、訓練画像が入力された画像補正モデルの出力と正解ラベルとの照合結果、例えば類似度や距離から求まる損失に基づいて画像補正モデルのパラメータを更新することにより、画像補正モデルが訓練される。
【0021】
<参考技術1の課題の一側面>
上記の参考技術1では、下記に挙げる2つの側面から、十分な補正結果が得られない場合がある。
【0022】
例えば、参考技術1におけるマニュアル操作には、ヒストグラムのピークの選択や明るい部分の選択など、画像のハイライト色に関わる選択の難しさがある。当然のことながら、上記のマニュアル操作で選択されるハイライト色に照明光の影響が含まれない場合、十分な補正結果は得られない。そして、照明光の影響で色がずれる箇所やそれに対応する画素値は、撮影される画像によって異なるので、マニュアル操作のスキルを持つ者が限られる。このようなスキルは、経験に基づくノウハウであるので、アルゴリズムとして実装することが困難である。
【0023】
また、参考技術1では、明るい色以外の、中間調の補正が不十分になる場合がある。すなわち、参考技術1では、ハイライト色のみの設定による補正で不十分な場合には、中間調の補正も必要であるが、これにも経験に基づく手作業が必要である。
【0024】
このことから、参考技術1では、マニュアル操作で適切なハイライト色を選択することができるのであれば十分な補正結果を得ることができる可能性は高まるが、マニュアル操作には経験者のスキルが必要である。それ故、ハイライト色の選択を自動化しようとしても、ヒストグラムのピーク値を選択したり、画素値が最大である部分を選択したりといったシンプルな処理しかアルゴリズム化できない。
【0025】
<参考技術2の課題の一側面>
上記の参考技術2では、ニューラルネットの訓練に用いるデータセットの準備に膨大な手間、すなわち時間や労力がかかる側面がある。例えば、参考技術2では、カラーテーブルを用意する手間や事前に照明条件を定義して照明条件ごとにカラーテーブルを撮影する手間が生じる。
【0026】
この他にも、参考技術2では、屋外における同一人物の追跡といった用途から、様々な環境に対応する訓練を実施するにはかなりの工数を必要とし、様々な環境で画像を取得している権利保持者の承諾を得る必要がある、といった側面もある。
【0027】
さらに、参考技術2は、限られたデータを用いた訓練でモデルが作成されているが、補正結果は、まだ誤差が多く精度が十分とは言えない側面もある。例えば、補正前のRGB値(R234,G79,B49)から補正後のRGB値(R192,G91,B45)へ補正されることが成功例として挙げられている。そして、成功例の補正後のRGB値(R192,G91,B45)は、基準画像のRGB値(R157,G76,B41)に近づいているとの分析がなされている。ところが、補正の前後で基準画像のRGB値との差は、Rでは80の差が40に減っているが、Gでは15程度増加している。
【0028】
加えて、参考技術2は、ハイライトの選択方法に関しては、上記の参考技術1と同様、画像の明るいところという簡易な選択方式であり、複雑なシーンでは十分に機能しない場合がある。
【0029】
<参考技術3の課題の一側面>
上記の参考技術3では、画像補正モデルの訓練時に画像補正モデルのパラメータを収束させるまでに大量の訓練データが必要となる側面がある。
【0030】
例えば、参考技術3では、照合結果に応じて画像補正モデルへのフィードバックを行うので、照合対象以外の領域に関しては、正常な補正が行われていなくても、正しい結果が得られたとしてフィードバックされる。したがって、画像全体として補正が正しくなくても正しいものとしてフィードバックされることがあるため、収束しにくい。このため、照合対象の領域に限定して(トリミングして)処理することも可能であるが、画像の一部のみでは入力情報が減るため、正しい補正をすることが困難になる。
【0031】
<課題解決アプローチの一側面>
そこで、本実施例に係る画像補正モデル生成機能では、参考技術3(補正処理のための学習データは不要という利点アリ)に、参考技術1の知見(物理的な制約などを取り込める)を導入するアプローチにより課題を解決する。
【0032】
このようなアプローチは、次のような根拠に基づいて成立する。すなわち、参考技術3の課題は、訓練の過程で生成されるパラメータでの補正処理が、「照合対象(の画像領域)は正常に補正できている」が「照合対象以外(の画像領域)は正常に補正できていない」という状況が発生することにより生じる、ととらえる。
【0033】
照明による色のずれは、物理現象(照明光の反射)や、カメラでのデジタル信号の生成課程により発生する。このため、物理現象やデジタル信号生成課程に即した画像処理を行えば「照合対象は正常に補正できている」ならば、「照合対象以外は正常に補正できている」となるとみなす。
【0034】
参考技術1は、印刷業界やカメラ業界などの知見に基づくものであり、物理現象やデジタル信号生成課程に即したものである。
【0035】
このことから、本実施例では、参考技術1を(a)ルール化や定式化が可能な部分と、(b)経験に基づく判断で定める部分とに分解した上で、(a)を参考技術3に付加すると共に、(b)を機械学習によりモデル化することにより、上記アプローチを実現する。
【0036】
具体的には、本実施例に係る画像補正モデル生成機能では、訓練画像を入力としてハイライト色を出力する画像補正モデルと、ハイライト色に基づく色彩補正処理とにより画像補正処理を実現する。このうち、色彩補正処理は、現状の画像編集ソフト等でもハイライト色さえ与えられれば実現可能な処理であり、参考技術1の(a)ルール化や定式化が可能な部分に対応する。一方、画像補正モデルは、参考技術1の(b)経験に基づく判断で定める部分に対応し、この部分に絞って機械学習により訓練する。照合処理を活用して画像補正モデルのパラメータを更新する機械学習には、参考技術3と同様のロジックを採用できる。
【0037】
このように、参考技術1の(a)ルール化や定式化が可能な部分を参考技術3に付加することで、画像補正モデルの出力を色かぶりの補正後の画像からハイライト色へアレンジできる。このため、画像照合の正解ラベルがあれば色かぶり補正用の画像が不要であるといった参考技術3の利点を享受すると共に、大量の訓練データが必要となるといった参考技術3の弱点を克服できる。さらに、参考技術1の(b)経験に基づく判断で定める部分を参考技術3の機械学習によりモデル化することで、ハイライト色の選択というルール化や定式化が困難な部分を機械学習モデルにより実現できる。このため、参考技術1の弱点を参考技術3で克服することができる。
【0038】
したがって、本実施例に係る画像補正モデル生成機能によれば、参考技術1および参考技術3の弱点を克服しつつ、画像補正モデルの訓練に用いる訓練データを削減できる。
【0039】
<画像補正モデル生成装置の構成>
図1には、上記の画像補正モデル生成機能に関連するブロックが模式化されている。
図1に示すように、画像補正モデル生成装置10は、候補抽出部12と、モデル実行部13と、色補正部14と、照合部15と、パラメータ更新部16とを有する。
【0040】
これら候補抽出部12、モデル実行部13、色補正部14、照合部15及びパラメータ更新部16などの機能部は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)などのハードウェアプロセッサにより仮想的に実現される。なお、
図1には、上記の画像補正モデル生成機能に関連する機能部が抜粋して示されているに過ぎず、既存のコンピュータがデフォルトまたはオプションで装備する機能が備わることを妨げない。
【0041】
ここで、上記の画像補正モデル13Mの訓練には、画像照合用の正解データ、すなわち同一のオブジェクトが含まれる2つの画像を訓練データとして含むデータセットが用いられる。この場合、2つの画像のうち一方の画像を画像補正モデル13Mへ入力する訓練画像11Aとし、他方の画像を正解ラベル11Bとして用いることができる。
【0042】
候補抽出部12は、訓練画像11Aからハイライト候補を抽出する処理部である。ここで、参考技術1でも説明した通り、画像の明るい部位が、ハイライト色として色かぶりの補正処理に用いられることは、従来から知られていることである。したがって、画像の明度値の高い部位がハイライト候補の可能性が高い部位であるみなし、下記(イ)~下記(ル)のルールに従ってハイライト候補画像12Aが生成される。なお、12Aの生成には、下記(イ)~下記(ル)の全てが必ずしも用いられずともよく、少なくとも1つが用いられればよい。
(イ)画像の明度に対して高いほど可能性が高い
(ロ)単なる明度との線形な関係より、高明度の可能性を高いとする
(ハ)一定明度以下は、可能性なしとする
(ニ)上記(イ)~上記(ハ)は画像の中の最大明度との相対関係で定める
(ホ)表現可能な最大値、例えば8bitであれば255の画素は情報が失われている可能性があり、利用しない、あるいは可能性「低」とみなす
(ヘ)最大値だけでなく、それに近い値の画素も可能性低とする
(ト)空間的に近傍の画素も可能性低とする
(チ)ハイライトは白色物体が前提なので、彩度が低い画素ほど可能性「高」みなす
(リ)絶対的な彩度を用いる
(ヌ)Gray World仮説(画像全体を平均化すればグレーになる)に基づき、画像全体の彩度平均を基準とした彩度を用いる
(ル)上記(ヌ)の補間値を用いる
【0043】
あくまで一例として、候補抽出部12は、上記(イ)~上記(ル)に従って訓練画像の画素ごとに当該画素の明度、彩度またはこれらの組合せに基づいてハイライト色である尤もらしさ、いわゆる尤度を算出する。これにより、訓練画像11Aからハイライト候補画像12Aが生成される。
【0044】
モデル実行部13は、画像補正モデル13Mを実行する処理部である。あくまで一例として、モデル実行部13は、訓練画像11Aおよびハイライト候補画像12Aを入力としてハイライト色13Aおよび中間色補正強度13Bを出力する画像補正モデル13Mを実行する。以下では、あくまで一例として、訓練画像11Aおよびハイライト候補画像12Aが入力される画像補正モデル13Mを例示するが、ハイライト候補画像12Aは必ずしも入力されずともよい。また、あくまで一例として、ハイライト色13Aおよび中間色補正強度13Bを出力する画像補正モデル13Mを例示するが、中間色補正強度13Bは必ずしも出力されずともよい。
【0045】
色補正部14は、色彩補正処理を実行する処理部である。1つの側面として、色補正部14は、訓練画像11Aにハイライト色13Aに基づく色彩補正処理を実行する。
【0046】
3原色を例に挙げれば、カメラに入力する光(Ri,Gi,Bi)は、シーンの対象物の反射率(Rr,Gr,Br)×照明光(Rl,Gl,Bl)の分布で近似される。デジタル化された信号(R,G,B)は、一般的には、下記の式(1.1)~下記の式(1.3)の通り、(Ri,Gi,Bi)の指数変換で表される。
R=(Ri=Rr×Rl)γ=Rrγ×Rlγ・・・(1.1)
G=(Gi=Gr×Gl)γ=Grγ×Glγ・・・(1.2)
B=(Bi=Br×Bl)γ=Brγ×Blγ・・・(1.3)
【0047】
デジタル信号から、照明光の影響を取り除くことは、(R,G,B)を白色照明下(Rl,Gl,Bl)=(1,1,1)で撮影した場合の信号(Rc,Gc,Bc)に変換することと等価であるので、下記の式(2.1)~下記の式(2.3)にしたがって演算できる。
Rc=R/Rlγ・・・(2.1)
Gc=G/Glγ・・・(2.2)
Bc=B/Blγ・・・(2.3)
【0048】
一般には、(Rlγ,Glγ,Blγ)は未知であるが、ここで、撮影シーンに白色の対象物(Rr,Gr,Br)=(1,1,1)があるとすると、その時の画像信号(Rw,Gw,Bw)は、下記の式(3.1)~下記の式(3.3)となる。
Rw=Rlγ・・・(3.1)
Gw=Glγ・・・(3.2)
Bw=Blγ・・・(3.3)
【0049】
したがって、下記の式(4.1)~下記の式(4.3)にしたがって、訓練画像11Aのハイライト色13Aを白色物体と仮定して、(Rw,Gw,Bw)の除算での補正が可能となる。
Rc=R/Rw・・・(4.1)
Gc=G/Gw・・・(4.2)
Bc=B/Bw・・・(4.3)
【0050】
図2は、ゲインの一例を示す図である。
図2には、ハイライト色13Aに基づいて実行される色彩補正のゲインが示されている。
図2に示すグラフの横軸は、入力画素値Rを指し、グラフの縦軸は、補正後画素値Rcを指す。
図2では、入力画素値Rおよび補正後画素値Rcが0~1の値に正規化されて示されている。
図2に示すように、入力画素値Rがハイライト色Rwである場合、補正後画素値Rcとして「1」が出力される。ここで、入力画素値Rがハイライト色Rwよりも大きい場合、上記の式(4.1)では1を超える補正後画素値Rcが算出されるが、1にクリップされる。一方、入力画素値Rがハイライト色Rwよりも小さい場合、上記の式(4.1)にしたがってR/Rwが補正後画素値Rcとして出力される。このように、ハイライト色13Aを最大値とするときの傾きから定まるゲインに従って入力画素値Rが線形に補正される。
【0051】
他の側面として、色補正部14は、ハイライト色13Aおよび中間色補正強度13Bに基づく色彩補正処理を実行することもできる。
【0052】
上記の式(4.1)~上記の式(4.3)は、カメラ側の信号処理が指数変換に基づいて行われる場合に成り立つ数式であり、カメラの種類によっては、さらなる階調補正処理は付加される場合がある。このような階調補正処理のうち一般的な階調補正処理の例として、RGBの各信号に対して共通の階調補正処理f()を施すものが挙げられる。f(1)=1としたとき、上記の式(1.1)~上記の式(1.3)から上記の式(4.1)~上記の式(4.3)までの各式は、下記の式(5.1)~下記の式(5.3)から下記の式(8.1)~下記の式(8.3)までの各式で表される。
R=(f(Ri=Rr×Rl)γ)=f(Rrγ×Rlγ)・・・(5.1)
G=(f(Gi=Gr×Gl)γ)=f(Grγ×Glγ)・・・(5.2)
B=(f(Bi=Br×Bl)γ)=f(Brγ×Blγ)・・・(5.3)
Rc=f(f-1(R)/Rlγ)・・・(6.1)
Gc=f(f-1(G)/Glγ)・・・(6.2)
Bc=f(f-1(B)/Blγ)・・・(6.3)
Rw=f(Rlγ)・・・(7.1)
Gw=f(Glγ)・・・(7.2)
Bw=f(Blγ)・・・(7.3)
Rc=f(f-1(R)/f-1(Rw))・・・(8.1)
Gc=f(f-1(G)/f-1(Gw))・・・(8.2)
Bc=f(f-1(B)/f-1(Bw))・・・(8.3)
【0053】
ここで、上記の式(4.1)~上記の式(4.3)と、上記の式(8.1)~上記の式(8.3)とを比較する。これら両者の違いは、f()の逆関数を施した上で除算をし、f()を改めて施すことである。
【0054】
図3は、撮像時の階調補正の逆関数の一例を示す図である。
図3には、カメラ側で撮像時に実行される階調補正の一例として、S字補正が行われる例が示されている。
図3に示すグラフの縦軸は、S字補正後の画素値f(x)を指し、グラフの横軸は、S字補正前の画素値、すなわち撮像時の画素値xを指す。
図3に示すように、S字補正後の画素値Rを逆関数へ代入することによりS字補正前の画素値をf
-1(R)と算出できる。また、S字補正後のハイライト色13Aの画素値Rwも逆関数へ代入することによりS字補正前のハイライト色13Aの画素値をf
-1(Rw)と算出できる。
【0055】
図4は、色彩補正の一例を示す図である。
図4には、色彩処理の一例として、ハイライト色13Aのみを用いる色彩補正が行われる例が示されている。
図4に示すグラフの横軸は、色彩補正に入力される入力画素値Rを指し、グラフの縦軸は、補正後画素値R/f
-1(Rw)を指す。
図4に示すように、入力画素値Rがハイライト色f
-1(Rw)である場合、補正後画素値R/f
-1(Rw)として「1」が出力される。ここで、入力画素値Rがハイライト色f
-1(Rw)よりも大きい場合、上記の式(8.1)では1を超える補正後画素値R/f
-1(Rw)が算出されるが、1にクリップされる。一方、入力画素値Rがハイライト色f
-1(Rw)よりも小さい場合、上記の式(8.1)にしたがってf
-1(R)/f
-1(Rw)が補正後画素値Rcとして出力される。このように、ハイライト色13Aを最大値とするときの傾きから定まるゲインに従って入力画素値Rが線形に補正される。
【0056】
図5は、階調補正の再実行の一例を示す図である。
図5に示すグラフの横軸は、補正後画素値Rを指し、グラフの縦軸は、S字補正再実行後の画素値f(R)を指す。
図5に示すように、補正後画素値Rがf
-1(R)/f
-1(Rw)である場合、S字補正f()が再実行されることによりf(f
-1(R)/f
-1(Rw))がS字補正再実行後の画素値として得られる。
【0057】
このように、カメラ側で撮像時にS字補正などの階調補正が実行される場合、上記の式(8.1)~上記の式(8.3)にしたがって、
図3~
図5に示された通りにf()の逆関数を施した上で除算をし、f()を改めて施される。
【0058】
ここで、ハイライト色13Aが0.5を下回る事態は起こりにくいので無視できることとする。この場合、Rw、GwおよびBwの値が0.5に近づくほど、上記の式(4.1)~上記の式(4.3)に対して上記の式(8.1)~上記の式(8.3)の変化量が大きくなる。つまり、S字補正が施されたカメラにおいては、(Rw,Gw,Bw)での除算では補正が不足し、値が0.5に近い成分ほど、強めの補正が必要となる。
【0059】
このことから、中間色補正強度kを用いて、上記の式(8.1)~上記の式(8.3)を修正できる。すなわち、Rw、GwまたはBwが小さいほど補正を強くするため、下記の式(9.1)~下記の式(9.3)の指数関数に代表される上に凸の関数、すなわちRw、GwまたはBwが小さいほど大きく凸にすることで、ハイライト基準のみの補正を修正できる。
Rc=(R/Rw)(1*(1-k)+Rw*k)・・・(9.1)
Gc=(G/Gw)(1*(1-k)+Gw*k)・・・(9.2)
Bc=(B/Bw)(1*(1-k)+Bw*k)・・・(9.3)
【0060】
図6は、ゲインの一例を示す図である。
図6には、ハイライト色13Aおよび中間色補正強度13Bに基づいて実行される色彩補正のゲインが示されている。
図6に示すグラフの横軸は、入力画素値Rを指し、グラフの縦軸は、補正後画素値Rcを指す。
図6では、入力画素値Rおよび補正後画素値Rcが0~1の値に正規化されて示されている。
図6に示すように、入力画素値Rがハイライト色Rwである場合、補正後画素値Rcとして「1」が出力される。ここで、入力画素値Rがハイライト色Rwよりも大きい場合、上記の式(9.1)では1を超える補正後画素値Rcが算出されるが、1にクリップされる。一方、入力画素値Rがハイライト色Rwよりも小さい場合、上記の式(9.1)にしたがってRwが小さいほど大きく凸になる(R/Rw)
(1*(1-k)+Rw*k)が補正後画素値Rcとして出力される。
【0061】
以上のように、訓練画像11Aに含まれる画素ごとに
図2に示されたゲインまたは
図5に示されたゲインを乗算する色彩補正処理を実行することにより色彩補正画像14Aが得られる。
【0062】
照合部15は、画像補正モデル13Mの出力と正解ラベルとを照合する処理部である。あくまで一例として、照合部15は、画像補正モデル13Mが出力する色彩補正画像14Aおよび正解ラベル11Bに任意の画像照合技術を適用することにより両者の類似度、あるいは距離を算出することができる。例えば、パターンマッチングやテンプレートマッチングを始め、CNN(Convolutional Neural Network)系の機械学習モデルを用いるなど、任意の画像照合技術を適用できる。
【0063】
パラメータ更新部16は、画像補正モデル13Mのパラメータを更新する処理部である。あくまで一例として、パラメータ更新部16は、照合部15による照合結果、例えば類似度や距離から求まる損失に基づいて画像補正モデル13Mのパラメータを更新することにより、画像補正モデルが訓練される。
【0064】
<処理の流れ>
図7は、画像補正モデル生成処理の手順を示すフローチャートである。この処理は、画像補正モデルの生成リクエストが受け付けられた場合に実行される。
図7に示すように、画像補正モデル生成装置10は、データセットに含まれる訓練データの数Kに対応する回数の分、下記のステップS101から下記のステップS105までの処理を繰り返す。
【0065】
すなわち、候補抽出部12は、データセットの中から訓練画像11Aを1つ取得する(ステップS101)。続いて、候補抽出部12は、ステップS101で取得された訓練画像11Aの画素ごとに当該画素の明度、彩度またはこれらの組合せに基づいてハイライト色である尤もらしさ、いわゆる尤度を算出する(ステップS102)。これにより、訓練画像11Aからハイライト候補画像12Aが生成される。
【0066】
そして、モデル実行部13は、ステップS101で取得された訓練画像11AおよびステップS102で算出されたハイライト候補画像12Aを画像補正モデル13Mへ入力する(ステップS103)。これにより、画像補正モデル13Mによりハイライト色13Aおよび中間色補正強度13Bが出力される。
【0067】
続いて、色補正部14は、ステップS101で訓練画像11Aに画像補正モデル13Mが出力するハイライト色13Aおよび中間色補正強度13Bに基づく色彩補正処理を実行する(ステップS104)。
【0068】
そして、照合部15は、画像補正モデル13Mが出力する色彩補正画像14Aおよび正解ラベル11Bに任意の画像照合技術を適用する(ステップS105)ことにより、両者の類似度、あるいは距離を算出する。
【0069】
その後、パラメータ更新部16は、ステップS105による照合結果、例えば類似度や距離から求まる損失に基づいて画像補正モデル13Mのパラメータを更新する(ステップS106)。
【0070】
このようなループ処理1が繰り返されることにより、訓練済みの画像補正モデル13Mを得ることができる。
【0071】
上述してきたように、本実施例に係る画像補正モデル生成装置10は、訓練画像11Aが入力された画像補正モデル13Mが出力するハイライト色13Aを用いて色彩補正が行われた色彩補正画像14Aと正解ラベル11Bとに基づいて画像補正モデル13Mのパラメータを更新する。このため、画像補正モデル13Mの出力を画像からハイライト色へ次元圧縮できる。したがって、本実施例に係る画像補正モデル生成装置10によれば、画像補正モデルの訓練に用いる訓練データの削減を実現することが可能である。
さて、これまで開示の装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。
モデル実行部21は、訓練画像11Aおよびハイライト候補画像12Aを入力として訓練画像の座標値13Pおよび中間色補正強度13Bを出力する画像補正モデル13mを実行する。このように、画像補正モデル13mは、ハイライト色13Aの代わりに訓練画像の座標値13Pを出力する点が異なる。
変換部22は、訓練画像の座標値13Pをハイライト色13Aへ変換する処理部である。あくまで一例として、変換部22は、訓練画像11Aに含まれる画素のうち座標値13Pに対応する画素値をハイライト色13Aとして出力することができる。このとき、変換部22は、画像の中の明るい場所が飛ぶ現象、いわゆる白飛びを抑制する側面から、階調の最大値から閾値以内の画素値を持つ画素、さらにはその周辺画素を除外してハイライト色13Aを出力することもできる。
応用例に係る画像補正モデル生成装置20においても、上記の実施例1と同様、画像補正モデル13Mの出力を画像からハイライト色へ次元圧縮できる。したがって、応用例に係る画像補正モデル生成装置20によれば、画像補正モデルの訓練に用いる訓練データの削減を実現することが可能である。
また、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されておらずともよい。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、候補抽出部12、モデル実行部13、色補正部14、照合部15またはパラメータ更新部16を画像補正モデル生成装置10の外部装置としてネットワーク経由で接続するようにしてもよい。また、候補抽出部12、モデル実行部21、変換部22、色補正部14、照合部15またはパラメータ更新部16を画像補正モデル生成装置20の外部装置としてネットワーク経由で接続するようにしてもよい。また、候補抽出部12、モデル実行部13、色補正部14、照合部15またはパラメータ更新部16を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の画像補正モデル生成装置10の機能を実現するようにしてもよい。また、候補抽出部12、モデル実行部21、変換部22、色補正部14、照合部15またはパラメータ更新部16を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の画像補正モデル生成装置20の機能を実現するようにしてもよい。
なお、上記の画像補正モデル生成プログラム170aは、必ずしも最初からHDD170やROM160に記憶されておらずともかまわない。例えば、コンピュータ100に挿入されるフレキシブルディスク、いわゆるFD、CD-ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に画像補正モデル生成プログラム170aを記憶させる。そして、コンピュータ100がこれらの可搬用の物理媒体から画像補正モデル生成プログラム170aを取得して実行するようにしてもよい。また、公衆回線、インターネット、LAN、WANなどを介してコンピュータ100に接続される他のコンピュータまたはサーバ装置などに画像補正モデル生成プログラム170aを記憶させておく。このように記憶された画像補正モデル生成プログラム170aをコンピュータ100にダウンロードさせた上で実行させるようにしてもよい。
(付記1)訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まる前記ハイライト色を用いて前記訓練画像に色彩補正が行われた色彩補正画像と前記訓練画像の正解ラベルとを照合し、
前記照合する処理による照合結果に基づいて前記画像補正モデルのパラメータを更新する、
処理をコンピュータが実行することを特徴とする画像補正モデル生成方法。
(付記5)前記色彩補正画像は、前記ハイライト色または前記座標値から求まる前記ハイライト色と、前記中間色の補正強度とを用いて、前記訓練画像に色彩補正が行われることにより生成されることを特徴とする付記4に記載の画像補正モデル生成方法。
(付記6)訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まる前記ハイライト色を用いて前記訓練画像に色彩補正が行われた色彩補正画像と前記訓練画像の正解ラベルとを照合し、
前記照合する処理による照合結果に基づいて前記画像補正モデルのパラメータを更新する、
処理をコンピュータに実行させることを特徴とする画像補正モデル生成プログラム。
(付記10)前記色彩補正画像は、前記ハイライト色または前記座標値から求まる前記ハイライト色と、前記中間色の補正強度とを用いて、前記訓練画像に色彩補正が行われることにより生成されることを特徴とする付記9に記載の画像補正モデル生成プログラム。
(付記11)訓練画像が入力された画像補正モデルにより出力されるハイライト色、あるいは訓練画像の座標値から求まる前記ハイライト色を用いて前記訓練画像に色彩補正が行われた色彩補正画像と前記訓練画像の正解ラベルとを照合し、
前記照合する処理による照合結果に基づいて前記画像補正モデルのパラメータを更新する、
処理を実行する制御部を含む画像補正モデル生成装置。
(付記15)前記色彩補正画像は、前記ハイライト色または前記座標値から求まる前記ハイライト色と、前記中間色の補正強度とを用いて、前記訓練画像に色彩補正が行われることにより生成されることを特徴とする付記14に記載の画像補正モデル生成装置。