(58)【調査した分野】(Int.Cl.,DB名)
第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、
前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した画像特徴量のいずれか一方である低解像度の画像特徴量から高解像度の画像特徴量を生成するサイズ拡大手段と、
前記第1解像度のモノクロ情報または当該第1解像度のモノクロ情報から抽出した高解像度の画像特徴量と、前記サイズ拡大手段により生成された高解像度の画像特徴量とを合成する合成手段と、
前記合成手段により合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する高解像度カラー情報推定手段と、を備えるカラー情報拡大器。
第1解像度のモノクロ画像の画像特徴量であるモノクロ情報と、前記第1解像度のモノクロ情報から推定された前記第1解像度よりも低い第2解像度の画像特徴量であるカラー情報と、を入力されて、所定の演算処理により前記カラー情報の画像サイズを拡大して高解像度カラー情報として出力するカラー情報拡大器であって、
前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出する特徴抽出手段と、
前記第2解像度のカラー情報または当該第2解像度のカラー情報から抽出した低解像度の画像特徴量と、前記特徴抽出手段により抽出された低解像度の画像特徴量と、を合成する合成手段と、
前記合成手段により合成された低解像度の画像特徴量から高解像度の画像特徴量を生成するサイズ拡大手段と、
前記サイズ拡大手段により生成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出することにより前記高解像度カラー情報を推定する高解像度カラー情報推定手段と、を備えるカラー情報拡大器。
前記第1解像度のモノクロ情報から、推定を行うための学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を前記合成手段に出力する第1の特徴抽出手段と、
前記第2解像度のカラー情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を前記サイズ拡大手段に出力する第2の特徴抽出手段と、
のうちの少なくとも1つの特徴抽出手段を備える請求項1に記載のカラー情報拡大器。
前記第2解像度のカラー情報から、推定を行うための学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を前記合成手段に出力する第2の特徴抽出手段を備える請求項2に記載のカラー情報拡大器。
前記第1解像度のモノクロ情報を、所定の縮小率で縮小する処理を再帰的に行うことにより前記第1解像度よりも小さく前記第2解像度よりも大きな解像度を持った複数レベルの解像度のモノクロ情報を生成するサイズ縮小手段を備え、
前記第2解像度のカラー情報と、生成される最小レベルの解像度のモノクロ情報とを初期値として、推定されたカラー情報および当該カラー情報よりも大きな解像度を持ったモノクロ情報から当該モノクロ情報と同じ解像度を持ったカラー情報を推定する処理を再帰的に行うことにより前記第1解像度を持った前記高解像度カラー情報を推定する処理を行う請求項1から請求項5のいずれか一項に記載のカラー情報拡大器。
【発明を実施するための形態】
【0020】
以下、本発明の実施形態に係るカラー情報拡大器およびカラー情報推定器について、図面を参照しながら説明する。
【0021】
[自動色付け装置]
図1は、本発明の第1実施形態に係るカラー情報推定器を含む自動色付け装置の構成を模式的に示すブロック図である。
自動色付け装置1は、モノクロ画像からカラー情報を推定することにより、モノクロ画像へ自動的に色付けするものであり、
図1に示すように、主として、カラー情報推定器3と、情報合成器9と、を備えている。
この自動色付け装置1は、例えば一般的なコンピュータで構成され、GPU(Graphics Processing Units)等の演算装置と、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)や一般的な画像メモリと、入出力インタフェースと、を備えている。
【0022】
カラー情報推定器3は、入力される高解像度モノクロ画像101から、低解像度モノクロ画像103および低解像度カラー情報105を生成して、これらの情報を用いて高解像度カラー情報107を推定するものである。
高解像度モノクロ画像101は、第1解像度のモノクロ画像である。この高解像度モノクロ画像101は、例えば、過去の白黒フィルムや写真からスキャンによりデジタル化したモノクロ画像である。
低解像度モノクロ画像103は、前記第1解像度よりも低い第2解像度のモノクロ画像である。
低解像度カラー情報105は、前記第2解像度のカラー情報である。
高解像度カラー情報107は、前記第1解像度のカラー情報である。
【0023】
ここで、モノクロ画像とは、具体的には色空間における輝度チャンネル(HSV色空間におけるVチャンネルや、Lab色空間におけるLチャンネルなど)のみから成る画像である。なお、画素の情報が輝度である場合、画素値(輝度値)は、8ビットの情報で表すとき、0〜255の値を有する。モノクロ画像の画像特徴量であるモノクロ情報は、例えば輝度分布で表される。本明細書では、このモノクロ情報をモノクロ画像と同じ意味で用いている。
また、カラー情報とは、例えば、輝度チャンネル以外の2チャンネルについての画像特徴量とすることができる。ここで、画像特徴量とは、例えば、輝度、色度、彩度等の色空間を表す量である。また、画像特徴量は、例えば、色空間を表す量から抽出された平均値、分散、畳み込み積分値等であってもよい。また、画素ごとの画像特徴量の集合は、例えばモノクロ画像(モノクロ情報)やカラー情報である。また、画像特徴量は、高さ方向および幅方向(縦横)に要素が並べられた行列で取り扱ってもよいし、1次元の多変数ベクトルで取り扱ってもよい。
【0024】
第1解像度の値(高解像度の値)は、第2解像度の値(低解像度の値)に比較して大きければ特に限定されない。例えば、第2解像度の画像の大きさを256×256ピクセル、第1解像度の画像の大きさを512×512ピクセルとしてもよい。また、例えば、第2解像度の画像の大きさを480×270ピクセル、第1解像度の画像の大きさを4K(3840×2160)としてもよい。さらには、第1解像度の画像の大きさを8K(7680×4320)としても構わない。
【0025】
(カラー情報推定器の第1実施形態)
第1実施形態のカラー情報推定器3は、
図1に示すように、縮小器5と、低解像度カラー情報推定器7と、カラー情報拡大器10と、を備えている。
カラー情報拡大器10は、低解像度カラー情報105または低解像度カラー情報105から抽出した画像特徴量のいずれかである低解像度の画像特徴量から高解像度の画像特徴量を生成し、高解像度モノクロ画像101または高解像度モノクロ画像101から抽出した高解像度の画像特徴量と、サイズ拡大手段2により生成された高解像度の画像特徴量とを合成し、合成された高解像度の画像特徴量から、色空間のチャンネルごとに、推定を行うための学習により予め決定されたパラメータ群を用いて画像特徴量を抽出する。
これにより、高解像度カラー情報107を推定する。
【0026】
縮小器5は、入力される高解像度モノクロ画像101を縮小する処理を行って低解像度モノクロ画像103を生成するものである。ここで、縮小とは解像度を低減、つまり画素数を減少させることをいう。縮小における縮小率が例えば0.5である場合、縮小画像の水平方向、垂直方向の画素数は、原画像の水平方向、垂直方向の画素数のそれぞれ1/2となる。縮小器5は、生成した低解像度モノクロ画像103を低解像度カラー情報推定器7に出力する。
【0027】
低解像度カラー情報推定器7は、推定を行うための学習により予め決定されたパラメータ群を用いて、縮小器5により生成された低解像度モノクロ画像103から、低解像度のカラー情報(画像特徴量)を抽出する。これにより、低解像度カラー情報推定器7は、低解像度カラー情報105を推定する。なお、低解像度カラー情報推定器7を作成するための学習の流れは、従来技術と同様であるが、簡単な説明を後記する。また、カラー情報の推定手法には、例えば非特許文献1に記載された従来公知の手法を用いることができる。この低解像度カラー情報推定器7は、従来公知のカラー情報推定器と同様に、輝度チャンネルを入力とし、2チャンネルの推定カラー情報を出力する。そして、低解像度カラー情報推定器7は、推定した低解像度カラー情報105をカラー情報拡大器10に出力する。
【0028】
カラー情報拡大器10は、低解像度カラー情報推定器7により推定された低解像度カラー情報105と、縮小器5をバイパスして入力される高解像度モノクロ画像101と、を入力として、画像サイズが拡大されたカラー情報(高解像度カラー情報107)を推定する処理を行うものである。カラー情報拡大器10は、低解像度カラー情報105を拡大する際に、高解像度モノクロ画像101(モノクロ情報)を用いて拡大する。そして、カラー情報拡大器10は、推定した高解像度カラー情報107を情報合成器9に出力する。
【0029】
情報合成器9は、カラー情報推定器3で推定された高解像度カラー情報107と、高解像度モノクロ画像101とを合成し、高解像度カラー画像109を作成する。情報合成器9は、1チャンネル(以下、1chと表記する場合もある)のモノクロ情報と、2チャンネル(2ch)のカラー情報とを単純に合成してカラー画像を生成する。
【0030】
(カラー情報拡大器の詳細)
図2は、本発明の第1実施形態に係るカラー情報拡大器の構成を模式的に示すブロック図である。カラー情報拡大器10は、
図2に示すように、サイズ拡大手段21と、合成手段22aと、高解像度カラー情報推定手段23と、を備えている。なお、
図2のカラー情報拡大器10は、特徴抽出手段31,32,33を備える形態で図示したが、例えば、すべての特徴抽出手段を省略した構成とすることもできる。なお、以下では、特徴抽出手段について、便宜的に第1の特徴抽出手段31、第2の特徴抽出手段32、および第3の特徴抽出手段33のように呼称する場合もある。
【0031】
カラー情報拡大器10は、例えばニューラルネットワークにより構成できる。また、ニューラルネットワークは、例えばCNN(Convolutional Neural Network)であってもよい。CNNでは、隠れ層(hidden layer)に、Convolution層(畳み込み層)や、Deconvolution層(逆畳み込み層、または、Transposed Convolution 層)を用いる。よって、CNNを採用した場合、カラー情報拡大器10は、各構成要素を、Convolution層またはDeconvolution層を用いて実装可能であり、GPUを用いて高速に計算できる。
【0032】
サイズ拡大手段21は、入力される低解像度の画像特徴量を拡大する処理を行って高解像度の画像特徴量を生成するものである。ここで、低解像度の画像特徴量とは、例えば、低解像度カラー情報105のことをいう。なお、
図2に示すように、カラー情報拡大器10が第2の特徴抽出手段32を備える場合には、第2の特徴抽出手段32が低解像度カラー情報105から抽出した画像特徴量が低解像度の画像特徴量となる。サイズ拡大手段21は、生成した高解像度の画像特徴量を合成手段22aに出力する。
【0033】
サイズ拡大手段21には、例えば、Deconvolution層(ニューラルネットワークを用いた画像拡大層)を用いてもよい。また、一般的な画像拡大アルゴリズムで用いられるパラメータを固定的に用いてもよい。なお、一般的な画像拡大アルゴリズムとしては、例えば、最近傍補間法やBilinear補間法などを用いてもよい。
【0034】
合成手段22aは、例えば、入力される高解像度モノクロ画像101と、サイズ拡大手段21によって生成された高解像度の画像特徴量とを合成するものである。なお、
図2に示すように、カラー情報拡大器10が第1の特徴抽出手段31を備える場合には、合成手段22aは、高解像度モノクロ画像101から抽出された画像特徴量と、サイズ拡大手段21によって生成された高解像度の画像特徴量とを合成する。合成手段22aは、合成した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力する。
合成手段22aは、1chのモノクロ情報と、このモノクロ情報と同じ大きさの2chのカラー情報とを単純に合成し、高解像度の画像特徴量を生成する。合成手段22aには、例えば、ニューラルネットワークのConvolution層を用いてもよい。
【0035】
高解像度カラー情報推定手段23は、合成手段22aにより合成された高解像度の画像特徴量から、高解像度カラー情報を推定するための学習により、予め決定されたパラメータ群を用いて画像特徴量を抽出し、高解像度カラー情報107を推定するものである。
ここで、学習とは、カラー情報拡大器10を作成するための学習をいう。具体的には、高解像度カラー情報推定手段23を含むカラー情報拡大器10を作成するための学習により高解像度カラー情報推定手段23等の内部パラメータ(パラメータ群)を適切に設定することにより、精度の良い推定器として、高解像度カラー情報推定手段23を作成できる。なお、カラー情報拡大器10を作成するための学習の流れについては後記する。
【0036】
高解像度カラー情報107は、低解像度カラー情報105が拡大されたカラー情報に相当し、高解像度モノクロ画像101に対応した解像度を有する。この高解像度カラー情報107とは、色空間のチャンネルごとのカラー情報であって、例えば、輝度チャンネル以外の2チャンネルについての画像特徴量をいう。
【0037】
高解像度カラー情報推定手段23は、その前段からの複数(3以上)の出力(Output)に対応した複数(3以上)のアウトプットチャンネルについての画像特徴量を、色空間における2チャンネルについての画像特徴量に変換し、カラー情報を推定する。
高解像度カラー情報推定手段23には、例えば、ニューラルネットワークのConvolution層を用いてもよい。また、Convolution層(隠れ層)が複数あってもよい。つまり、Convolutionを連続的に繰り返し行ってもよい。
高解像度カラー情報推定手段23の前段からのアウトプットチャンネル数は所望の値に設定できる。例えば合成手段22aからのアウトプットチャンネル数は3chやそれ以上であってもよい。
【0038】
カラー情報拡大器10は、
図2に示すように、第1の特徴抽出手段31、第2の特徴抽出手段32、および第3の特徴抽出手段33のうちの少なくとも1つの特徴抽出手段を備えてもよい。
【0039】
第1の特徴抽出手段31は、高解像度モノクロ画像101から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を合成手段22aに出力するものである。なお、学習とは、カラー情報拡大器10を作成するための学習をいう。第1の特徴抽出手段31は、第1の特徴抽出手段31に入力される1chのモノクロ情報を、第1の特徴抽出手段31のアウトプットチャンネルごとに高解像度の画像特徴量にそれぞれ変換する。
【0040】
第2の特徴抽出手段32は、低解像度カラー情報105から、学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量をサイズ拡大手段21に出力するものである。第2の特徴抽出手段32は、第2の特徴抽出手段32に入力される2chのカラー情報を、第2の特徴抽出手段32のアウトプットチャンネルごとに低解像度の画像特徴量にそれぞれ変換する。
【0041】
第3の特徴抽出手段33は、合成手段22aで生成された高解像度の画像特徴量から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力するものである。第3の特徴抽出手段33は、合成手段22aからの複数の出力に対応した複数のアウトプットチャンネル(例えば3ch)についての画像特徴量を、第3の特徴抽出手段33のアウトプットチャンネルごとに高解像度の画像特徴量にそれぞれ変換する。なお、第3の特徴抽出手段33のアウトプットチャンネル数は、例えば64ch、128ch、256ch等に設定される。
【0042】
各特徴抽出手段31〜33には、例えば、ニューラルネットワークのConvolution層を用いてもよい。また、Convolution層(隠れ層)が複数あってもよい。各特徴抽出手段からのアウトプットチャンネル数は所望の値に設定できる。なお、本明細書では、特徴抽出手段等に入力した画像特徴量をアウトプットチャンネルごとにコンボリューションにかけて得られた画像特徴量のことを、入力から得た特徴という。また、本明細書では、特徴抽出手段等への複数チャンネルからなる入力情報をコンボリューションにかけて、入力した画像特徴量を変換することを、特徴を抽出するという。
【0043】
図2では、高解像度カラー情報推定手段23とは別に第3の特徴抽出手段33を図示したが、高解像度カラー情報推定手段23が内部に第3の特徴抽出手段33を備えることとしてもよい。第3の特徴抽出手段33は、高解像度カラー情報推定手段23が色空間のチャンネルごとの画像特徴量を抽出する前に、色空間の2チャンネルについての画像特徴量を出力するためのパラメータ群とは異なるパラメータ群を用いて、サイズ拡大手段21および合成手段22aの処理により生成された高解像度の画像特徴量から、複数チャンネル(例えば64ch)について高解像度の画像特徴量をそれぞれ生成する。
【0044】
(低解像度カラー情報推定器の学習の流れ)
次に、低解像度カラー情報推定器7の学習の流れについて
図3を参照して説明する。低解像度カラー情報推定器7の学習の流れは、従来のカラー情報推定器の学習の流れと同様なので簡単に説明する。
低解像度カラー情報推定器7は、以下の手順により、予め用意した学習器から生成する。この学習器は、モノクロ画像を入力し、所定の計算処理を行うことによりカラー情報を推定して出力する。この学習器(
図3では、学習が終わった状態の低解像度カラー情報推定器7として表記している)は、内部パラメータ(パラメータ群)を備え、このパラメータを変更することにより、学習器からの出力を調整する。そして、大量の学習用のカラー画像を用意し、以下のステップS1〜ステップS4を十分な回数繰り返す。この学習器がこのパラメータを学習し、適切にパラメータを設定することにより精度の良いカラー情報推定器を作成できる。
【0045】
(ステップS1)
学習用のカラー画像として低解像度カラー画像202を用意し、それを低解像度モノクロ画像203と真のカラー情報204とに分離する。
ここで、低解像度モノクロ画像203は、低解像度の学習用モノクロ画像である。
また、真のカラー情報204は、低解像度の学習用モノクロ画像と同じサイズの正解カラー情報であって、推定されるカラー情報との誤差計算に用いる。
【0046】
(ステップS2)
次に、学習器(低解像度カラー情報推定器7)は、低解像度モノクロ画像203を入力し、現在のパラメータを用いた推定結果のカラー情報として、低解像度カラー情報205を出力する。
【0047】
(ステップS3)
次に、誤差計算器40は、低解像度カラー情報205(推定カラー情報)と真のカラー情報204との誤差を計算する。この誤差としては、各画素値の平均二乗誤差などが用いられる。
【0048】
(ステップS4)
また、誤差計算器40は、計算して得られた誤差から、SGDなどの誤差勾配に基づく最適化手法を用いて、誤差が小さくなるように、学習器(低解像度カラー情報推定器7)のパラメータを調整し、調整されたパラメータを学習器に出力する。なお、SGDについては、次の参考文献に記載されているので説明を省略する。
(参考文献)L. Bottou., ”Stochastic Gradient Descent Tricks.,”Neural Networks: Tricks of the Trade: Springer, 2012.
【0049】
上記学習により適切に設定されるパラメータとは、
図1に示す低解像度カラー情報推定器7が、低解像度モノクロ画像103から画像特徴量を抽出し、低解像度カラー情報105を推定する際に用いるパラメータ群のことをいう。つまり、低解像度カラー情報105を推定する際に用いるパラメータ群は、学習器に入力される低解像度の学習用モノクロ画像から所定演算により推定される低解像度のカラー情報と、学習用モノクロ画像と同じサイズの正解カラー情報と、の対応付けを学習することにより決定する。
【0050】
(カラー情報拡大器の学習の流れ)
次に、カラー情報拡大器10の学習の流れについて
図4を参照して説明する。
カラー情報拡大器10は、以下の手順により、予め用意した学習器から生成する。この学習器は、高解像度モノクロ画像301および低解像度カラー情報305を入力し、所定の計算処理を行うことにより高解像度カラー情報307を推定して出力する。この学習器(
図4では、学習が終わった状態のカラー情報拡大器10として表記している)は、内部パラメータ(パラメータ群)を備え、このパラメータを変更することにより、学習器からの出力を調整する。そして、大量の学習用のカラー画像を用意し、以下のステップS10〜ステップS14を十分な回数繰り返す。この学習器がこのパラメータを学習し、適切にパラメータを設定することにより精度の良いカラー情報拡大器を作成できる。
【0051】
(ステップS10)
学習用のカラー画像として高解像度カラー画像309を用意し、それを縮小器5によって単純に縮小して低解像度カラー情報305とする。
ここで、高解像度カラー画像309としては、古い白黒フィルムをカラー化したものも使用する。この場合、例えば、過去の白黒フィルムや写真からスキャンによりデジタル化したモノクロ画像に対して、人手で色付けしたデジタルデータとする。また、学習用の高解像度カラー画像309を大量に準備するために、古い白黒フィルム以外に、カラー撮影された新しい4K等のカラー画像を用いてもよい。
【0052】
(ステップS11)
次に、高解像度カラー画像309を、高解像度モノクロ画像301と高解像度カラー情報(真のカラー情報)304とに分離する。
ここで、高解像度モノクロ画像301は、高解像度の学習用モノクロ画像である。
また、高解像度カラー情報304は、高解像度の学習用モノクロ画像と同じサイズの正解カラー情報であって、推定される高解像度カラー情報との誤差計算に用いる。
【0053】
(ステップS12)
次に、学習器(カラー情報拡大器10)は、高解像度モノクロ画像301を入力し、現在のパラメータを用いた推定結果のカラー情報として、高解像度カラー情報307を出力する。
【0054】
(ステップS13)
次に、誤差計算器40は、高解像度カラー情報307(推定カラー情報)と高解像度カラー情報(真のカラー情報)304との誤差を計算する。この誤差としては、前記した手法と同様の各画素値の平均二乗誤差や交差エントロピーなどを用いる。
【0055】
(ステップS14)
また、誤差計算器40は、計算して得られた誤差から、SGDなどの誤差勾配に基づく最適化手法を用いて、誤差が小さくなるように、学習器(カラー情報拡大器10)のパラメータを調整し、調整されたパラメータを学習器に出力する。なお、誤差計算器40は、学習のときに付加されるが、学習後には接続を解除する。
【0056】
上記学習により適切に設定されるパラメータは、
図2に示すカラー情報拡大器10が高解像度カラー情報107を推定する際に用いるパラメータ群のことをいう。例えば、高解像度カラー情報推定手段23が、合成手段22aで生成された高解像度の画像特徴量から、色空間のチャンネルごとの画像特徴量を抽出する際にも用いる。
なお、合成手段22aで生成された高解像度の画像特徴量には、高解像度モノクロ画像101の情報(モノクロ情報)と低解像度カラー情報105とに起因した情報を含む。
つまり、高解像度カラー情報107を推定する際に用いるパラメータ群は、学習器にそれぞれ入力される低解像度の学習用カラー情報および高解像度の学習用モノクロ画像から所定演算により推定される拡大された高解像度のカラー情報と、学習用モノクロ画像と同じサイズの正解カラー情報と、の対応付けを学習することにより決定される。
【0057】
なお、カラー情報拡大器を学習により作るとき、例えば
図2の構成のカラー情報拡大器10を作製したいのならば、
図2と同じ構成のカラー情報拡大器10を学習に用いる。また、カラー情報拡大器を学習により作るとき、少なくとも1つの特徴抽出手段を省略したカラー情報拡大器を作製したいのならば、特徴抽出手段を省略したカラー情報拡大器を学習に用いればよい。
【0058】
本実施形態に係るカラー情報拡大器10によれば、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。このカラー情報拡大器10は、例えば4Kまたは8K等の高解像度モノクロ画像101への自動色付けをする際に用いるカラー情報を推定するカラー情報推定器3に組み込むことができる。また、本実施形態に係るカラー情報推定器3は、高解像度モノクロ画像101への自動色付けをする際に用いるカラー情報を推定する精度を向上させることができる。
【0059】
また、高解像度のモノクロ画像のデジタルデータは、例えば物理的フィルムからスキャンすることにより得られるが、従来の色付け技術では、このような高解像度のモノクロ画像に直接色づけすることはできなかった。これに対して、カラー情報推定器3を備える自動色付け装置1は、4K等の高解像度のモノクロ画像に対する自然な色付けを可能とすることができる。
【0060】
また、例えば、写真や物理的フィルムからスキャンしたモノクロ画像のデータは存在するが、写真や物理的フィルムが消失してデータしか残っていない状況においても、カラー情報推定器3を備える自動色付け装置1は、当時の色情報を推定して、モノクロ画像に色付けすることができる。
【0061】
さらに、例えば、低解像度カラー情報105が由来するところのカラー撮影された画像では、モノクロ情報チャンネル(色空間における輝度チャンネル)上で境界がはっきりしている領域は、カラー情報チャンネル(例えば、輝度チャンネル以外の2チャンネル)上でも境界がはっきりしているケースが多い。ここで、境界とは、例えばオブジェクトの輪郭線(オブジェクトとその背景との境目)等の線で表される部分である。
そのため、カラー情報拡大器10のように、高解像度モノクロ画像101を用いて、低解像度カラー情報105を拡大すると、特に、高解像度モノクロ情報チャンネル(高解像度モノクロ画像101)上で境界がはっきりしている領域におけるカラー情報のぼけが低減される効果を奏する。
【0062】
(カラー情報拡大器の第2実施形態)
次に、カラー情報拡大器の第2実施形態について
図5を参照(適宜
図2参照)して説明する。
図5に示すカラー情報拡大器10Aは、サイズ拡大手段21の前段に合成手段22bを備えている点が、
図2に示すカラー情報拡大器10と相違している。なお、カラー情報拡大器10Aにおいて、
図2に示すカラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
【0063】
カラー情報拡大器10Aは、特徴抽出手段34と、合成手段22bと、サイズ拡大手段21と、高解像度カラー情報推定手段23と、を備えている。なお、
図5のカラー情報拡大器10Aは、特徴抽出手段35,36を備える形態で図示したが、例えば、特徴抽出手段35,36を省略した構成とすることもできる。以下では、便宜的に、特徴抽出手段について、第2の特徴抽出手段35および第3の特徴抽出手段36のように呼称する場合もある。このカラー情報拡大器10Aは、例えばニューラルネットワークで構成できる。
【0064】
特徴抽出手段34は、推定を行うための学習により予め決定されたパラメータ群を用いて、高解像度モノクロ画像101から低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を合成手段22bに出力するものである。
【0065】
合成手段22bは、例えば、低解像度カラー情報105と、特徴抽出手段34により抽出された低解像度の画像特徴量と、を合成し、低解像度の画像特徴量を生成するものである。なお、
図5に示すように、カラー情報拡大器10Aが第2の特徴抽出手段35を備える場合には、合成手段22bは、低解像度カラー情報105から抽出された低解像度の画像特徴量と、特徴抽出手段34により抽出された低解像度の画像特徴量とを合成する。合成手段22bは、合成した低解像度の画像特徴量をサイズ拡大手段21に出力する。
合成手段22bは、2chの低解像度のカラー情報と、この低解像度のカラー情報と同じ大きさの1chのモノクロ情報と、を単純に合成し、低解像度の画像特徴量を生成する。合成手段22bには、例えば、ニューラルネットワークのConvolution層を用いてもよい。
【0066】
本実施形態では、サイズ拡大手段21は、当該サイズ拡大手段21により生成した高解像度の画像特徴量を、例えば高解像度カラー情報推定手段23に出力する。
本実施形態では、高解像度カラー情報推定手段23は、サイズ拡大手段21で生成された高解像度の画像特徴量から高解像度カラー情報107を推定する。
【0067】
カラー情報拡大器10Aは、
図5に示すように、特徴抽出手段34以外に、第2の特徴抽出手段35と、第3の特徴抽出手段36と、のうちの少なくとも1つの特徴抽出手段をさらに備えてもよい。
【0068】
第2の特徴抽出手段35は、低解像度カラー情報105から、学習により予め決定されたパラメータ群を用いて低解像度の画像特徴量を抽出し、抽出した低解像度の画像特徴量を合成手段22bに出力するものである。なお、この第2の特徴抽出手段35は、抽出された低解像度の画像特徴量の出力先以外は、
図2に示す第2の特徴抽出手段32と同じである。
【0069】
第3の特徴抽出手段36は、サイズ拡大手段21により生成された高解像度の画像特徴量から、学習により予め決定されたパラメータ群を用いて高解像度の画像特徴量を抽出し、抽出した高解像度の画像特徴量を高解像度カラー情報推定手段23に出力するものである。なお、この第3の特徴抽出手段36は、高解像度の画像特徴量を受け取るための入力先以外は、
図2に示す第3の特徴抽出手段33と同じである。
【0070】
図5では、高解像度カラー情報推定手段23とは別に第3の特徴抽出手段36を図示したが、高解像度カラー情報推定手段23が内部に第3の特徴抽出手段36を備えることとしてもよい。例えば、各特徴抽出手段34〜36には、ニューラルネットワークのConvolution層を用いるようにしてもよい。
【0071】
カラー情報拡大器10Aの学習の流れは、カラー情報拡大器10の学習の流れと同様なので説明を省略する。なお、カラー情報拡大器を学習により作るとき、
図5の構成のカラー情報拡大器10Aを作製したいのならば、
図5の構成のカラー情報拡大器10Aを学習に用いればよい。また、カラー情報拡大器を学習により作るとき、少なくとも1つの特徴抽出手段を省略したカラー情報拡大器を作製したいのならば、特徴抽出手段を省略したカラー情報拡大器を学習に用いればよい。
【0072】
第2実施形態に係るカラー情報拡大器10Aによれば、第1実施形態に係るカラー情報拡大器10と同様に、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。
【0073】
(カラー情報拡大器の第3実施形態)
次に、カラー情報拡大器の第3実施形態について
図6を参照(適宜
図2および
図5参照)して説明する。なお、カラー情報拡大器10Bにおいて、カラー情報拡大器10,10Aと同じ構成には同じ符号を付して説明を省略する。
【0074】
カラー情報拡大器10Bは、特徴抽出手段34と、合成手段22bと、サイズ拡大手段21と、合成手段22aと、高解像度カラー情報推定手段23と、を備えている。なお、
図6のカラー情報拡大器10Bは、第1の特徴抽出手段31と、第2の特徴抽出手段35と、第3の特徴抽出手段33と、を備える形態で図示したが、例えば、特徴抽出手段31,35,33を省略した構成とすることもできる。このカラー情報拡大器10Bは、例えばニューラルネットワークで構成できる。
【0075】
図6に示すカラー情報拡大器10Bは、カラー情報拡大器10,10Aを混合して、サイズ拡大手段21の前後に合成手段22b,22aを備えるようにしたものなので、これ以上の説明については省略する。なお、カラー情報拡大器10Bの学習の流れも、カラー情報拡大器10の学習の流れと同様なので説明を省略する。
【0076】
第3実施形態に係るカラー情報拡大器10Bによれば、第1実施形態に係るカラー情報拡大器10と同様に、高解像度モノクロ画像101(モノクロ情報)を明示的に用いているので、推定されるカラー情報のぼけを低減し、低解像度カラー情報105を精度よく拡大できる。
【0077】
(カラー情報拡大器の第4実施形態)
次に、カラー情報拡大器の第4実施形態について
図7を参照(適宜
図1および
図2参照)して説明する。なお、カラー情報拡大器10Cにおいて、カラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
ここでは、第1解像度の画像の大きさをN(=3840×2160ピクセル)とすると共に、第2解像度の画像の大きさをN/8(=480×270ピクセル)として説明する。つまり、カラー情報拡大器10Cに入力する高解像度モノクロ画像101は、解像度=Nのモノクロ画像であるものとする。また、カラー情報拡大器10Cに入力する低解像度カラー情報105は、解像度=N/8のカラー情報であるものとする。
【0078】
カラー情報拡大器10Cは、カラー情報拡大器10を再帰的に連結する構造を用いた再帰的カラー情報拡大器である。ここでは、カラー情報拡大器10は、拡大率が2であるものとし、3つのカラー情報拡大器10を再帰的に連結する。
【0079】
カラー情報拡大器10Cは、サイズ縮小手段50を備えている。
サイズ縮小手段50は、高解像度モノクロ画像101を、所定の縮小率で縮小する処理を再帰的に行うことにより第1解像度よりも小さく第2解像度よりも大きな解像度を持った複数レベルの解像度のモノクロ画像を生成する。
【0080】
サイズ縮小手段50は、高解像度モノクロ画像101(解像度=Nのモノクロ画像)を縮小してモノクロ画像111を生成する。このモノクロ画像111は、解像度=N/2のモノクロ画像である。
さらに、サイズ縮小手段50は、モノクロ画像111(解像度=N/2のモノクロ画像)を縮小してモノクロ画像121を生成する。このモノクロ画像121は、解像度=N/4のモノクロ画像である。また、モノクロ画像121は、この場合にサイズ縮小手段50で生成される最小レベルの解像度のモノクロ画像である。
【0081】
カラー情報拡大器10Cに入力される低解像度カラー情報105と、サイズ縮小手段50で生成される最小レベルの解像度のモノクロ画像121と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、低解像度カラー情報105が拡大されたカラー情報127を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、このカラー情報127は、解像度=N/4のカラー情報となる。
【0082】
このカラー情報127と、サイズ縮小手段50で生成されたモノクロ画像111と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、カラー情報127が拡大されたカラー情報117を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、このカラー情報117は、解像度=N/2のカラー情報となる。
【0083】
このカラー情報117と、カラー情報拡大器10Cに入力される高解像度モノクロ画像101と、を入力とするカラー情報拡大器10は、最終的に、色空間のチャンネルごとの推定カラー情報として、カラー情報117が拡大された高解像度カラー情報107を出力する。ここでは、カラー情報拡大器10は拡大率が2であるので、この高解像度カラー情報107は、解像度=Nのカラー情報となる。こうして、カラー情報拡大器10Cに入力される低解像度カラー情報105は、2
3倍(=8倍)に拡大されて、高解像度カラー情報107として出力されることになる。
【0084】
前記したように、カラー情報拡大器10Cは、低解像度カラー情報105と、生成される最小レベルの解像度のモノクロ画像121とを初期値として、推定されたカラー情報および当該カラー情報よりも大きな解像度を持ったモノクロ画像から当該モノクロ画像と同じ解像度を持ったカラー情報を推定する処理を再帰的に行うことにより第1解像度を持った高解像度カラー情報107を推定する処理を行う。
【0085】
カラー情報拡大器10Cは、カラー情報拡大器10を再帰的に連結する構造を用いた再帰的カラー情報拡大器であるので、拡大率がM(例えばM=2)であるカラー情報拡大器10を1つ作るだけで、Mの累乗数倍の拡大器を作成できる。
例えば最終的な拡大率を2
3倍(=8倍)とするカラー情報拡大器10Cを学習により作るときには、拡大率を2倍とするカラー情報拡大器10を学習に用いればよい。これは、再帰的カラー情報拡大器としないで8倍の拡大を実現しようとするときに決定すべきパラメータ数を約1/3に低減させる効果を奏することができる。
よって、カラー情報拡大器10Cによれば、予め推定した低解像度カラー情報105の解像度がN/8(480×270ピクセル)である場合に、解像度がN(=3840×2160ピクセル)に拡大された高解像度カラー情報107を容易に取得することが可能となる。
【0086】
なお、カラー情報拡大器10Cは、カラー情報拡大器10の代わりに、カラー情報拡大器10A,10Bを再帰的に連結するようにしてもよい。また、カラー情報拡大器10Cによる最終的な拡大率は、8倍に限らず、4倍や16倍等であってもよい。
【0087】
また、カラー情報拡大器10Cにおいて、例えば3つのカラー情報拡大器10を連結する代わりに、1つのカラー情報拡大器10を異なるタイミングで作動させることにより、3つのカラー情報拡大器10の働きをさせるようにしてもよい。
同様に、カラー情報拡大器10Cにおいて、例えば2つのサイズ縮小手段50を連結する代わりに、1つのサイズ縮小手段50を異なるタイミングで作動させることにより、2つのサイズ縮小手段50の働きをさせるようにしてもよい。
【0088】
[カラー情報推定器の第2実施形態]
次に、本発明の第2実施形態に係るカラー情報推定器について
図8を参照(適宜
図1参照)して説明する。カラー情報推定器3Bは、
図8に示すように、低解像度カラー情報推定器7Bと、カラー情報拡大器10Dと、を備えている。
【0089】
低解像度カラー情報推定器7Bは、
図1に示す低解像度カラー情報推定器7と同様に低解像度カラー情報105を推定するものである。低解像度カラー情報推定器7Bは、推定した低解像度カラー情報105をカラー情報拡大器10Dに出力する。この低解像度カラー情報推定器7Bは、高解像度モノクロ画像101を入力として用いる点が
図1に示す低解像度カラー情報推定器7と異なっているが、従来公知のカラー情報推定器であるので、これ以上の説明を省略する。
【0090】
カラー情報拡大器10Dは、低解像度カラー情報推定器7Bにより推定された低解像度カラー情報105と、低解像度カラー情報推定器7Bをバイパスして入力される高解像度モノクロ画像101と、を用いて、高解像度カラー情報107を推定する処理を行うものである。カラー情報拡大器10Dは、
図8に示すように、サイズ拡大手段21と、合成手段22aと、第3の特徴抽出手段33と、高解像度カラー情報推定手段23と、を備えている。なお、カラー情報拡大器10Dにおいて、
図2に示すカラー情報拡大器10と同じ構成には同じ符号を付して説明を省略する。
【0091】
合成手段22aは、低解像度カラー情報推定器7Bに入力される高解像度モノクロ画像101と同じモノクロ画像と、サイズ拡大手段21により生成された高解像度の画像特徴量とを合成する。ここで、低解像度カラー情報推定器7Bに入力される高解像度モノクロ画像101と同じモノクロ画像は、バイパス経路401を介して、カラー情報拡大器10Dの合成手段22aに入力される。これにより、カラー情報拡大器10Dは、低解像度カラー情報105から高解像度カラー情報107を作成する際に、高解像度モノクロ画像101(モノクロ情報)を直接使用できる。
【0092】
なお、仮にバイパス経路401からの高解像度モノクロ画像101の入力がない比較例のカラー情報推定器を想定した場合、このような比較例であっても、カラー情報の拡大機能を持たせることは可能と考えられる。その理由は、高解像度モノクロ画像101の持つ情報は、低解像度カラー情報推定器7Bを通過する過程で変形しているが、理論的には、バイパスがなくてもカラー情報拡大器10Dに伝わっているからである。
これに対して、第2実施形態に係るカラー情報推定器3Bは、バイパス経路401からの高解像度モノクロ画像101の入力が存在することにより、カラー情報拡大器10Dに相当する箇所の学習をする際に、高解像モノクロ情報が、このような比較例よりも強い影響を持つ。そのため、カラー情報推定器3Bは、高解像モノクロ情報チャンネル(色空間における輝度チャンネルの高解像の情報)上で境界がはっきりしている領域では、ぼけがないようなカラー情報の拡大をする学習が、上述した比較例よりも促進されることが実験的にも分かっている。
【0093】
[カラー情報推定器の第3実施形態]
次に、本発明の第3実施形態に係るカラー情報推定器について
図9を参照(適宜
図7および
図8参照)して説明する。カラー情報推定器3Cは、
図9に示すように、低解像度カラー情報推定器7Bと、カラー情報拡大器10Eと、サイズ縮小手段50と、を備えている。ここでは、カラー情報推定器3Cに入力する高解像度モノクロ画像101は、解像度=N(=3840×2160ピクセル)のモノクロ画像であるものとする。また、低解像度カラー情報推定器7Bが出力するカラー情報は、解像度=N/8のカラー情報であるものとする。
【0094】
カラー情報推定器3Cにおいて、
図7のカラー情報拡大器10Cと同じ構成には同じ符号を付して説明を省略する。サイズ縮小手段50は、
図7のカラー情報拡大器10Cにおけるサイズ縮小手段50と同様に、モノクロ画像111と、このモノクロ画像121とを生成する。
【0095】
カラー情報拡大器10Eは、
図9に示すように、サイズ拡大手段21,21b,21cと、合成手段22a,22b,22cと、第3の特徴抽出手段33と、高解像度カラー情報推定手段23と、を備えている。なお、カラー情報拡大器10Eにおいて、
図8に示すカラー情報拡大器10Dと同じ構成には同じ符号を付して説明を省略する。
【0096】
各サイズ拡大手段21,21b,21cは、同じ機能を有し、ここでは、入力される低解像度の画像特徴量を、一般的な画像拡大アルゴリズムで例えば2倍に拡大する処理を行うことにより高解像度の画像特徴量を生成する。
各合成手段22a,22b,22cは、同じ機能を有し、ここでは、別々の経路から入力される各画像特徴量を単純に合成し、アウトプットチャンネル数を増加させた画像特徴量を生成する。
【0097】
このような構成のカラー情報推定器3Cは、サイズ縮小手段50を備えることにより、推定された低解像度のカラー情報を拡大する拡大率を、比較的大きな値にすることができる。
具体的は、カラー情報推定器3Cにおいて、サイズ拡大手段21cは、低解像度カラー情報推定器7Bが出力する2chのカラー情報(解像度=N/8)を拡大することにより、2chのカラー情報(解像度=N/4)を生成する。
そして、合成手段22cは、モノクロ画像121(解像度=N/4)と、サイズ拡大手段21cによって生成されたカラー情報(解像度=N/4)と、を合成することにより、3chの画像特徴量(解像度=N/4)を生成する。ここで、合成手段22cは、モノクロ画像121(解像度=N/4)を、バイパス経路403を介して、合成手段22cに入力する。
【0098】
そして、サイズ拡大手段21bは、合成手段22cが生成した3chの画像特徴量(解像度=N/4)を拡大し、3chの画像特徴量(解像度=N/2)を生成する。そして、合成手段22bは、モノクロ画像111(解像度=N/2)と、サイズ拡大手段21bが生成した3chの画像特徴量(解像度=N/2)とを合成することにより、4chの画像特徴量(解像度=N/2)を生成する。ここで、サイズ拡大手段21bは、モノクロ画像111(解像度=N/2)を、バイパス経路402を介して、合成手段22bに入力する。
【0099】
そして、サイズ拡大手段21は、合成手段22bが生成した4chの画像特徴量(解像度=N/2)を拡大し、4chの画像特徴量(解像度=N)を生成する。
そして、合成手段22aは、高解像度モノクロ画像101(解像度=N)と、サイズ拡大手段21が生成した4chの画像特徴量(解像度=N)とを合成し、5chの画像特徴量(解像度=N)を生成する。ここで、サイズ拡大手段21は、高解像度モノクロ画像101(解像度=N)を、バイパス経路401を介して、合成手段22aに入力する。
【0100】
そして、第3の特徴抽出手段33は、合成手段22aが生成した5chの画像特徴量(解像度=N)を、例えば64chの画像特徴量(解像度=N)に変換する。
最後に、高解像度カラー情報推定手段23は、例えば64chの画像特徴量(解像度=N)を、色空間における2チャンネルのカラー情報(解像度=N)に変換する。これにより、高解像度カラー情報107が生成される。
【0101】
以上、本発明の各実施形態について説明したが、本発明はこれらに限定されず、その趣旨を変えない範囲で実施することができる。例えば、本発明におけるカラー情報は、色空間における輝度チャンネル以外の2チャンネルとしたが、それ以外であっても取り扱うことが可能である。一例としては、RGB色空間における3チャンネルすべてをカラー情報として用いてもよい。
【0102】
また、カラー情報拡大器やカラー情報推定器に対して入力されるカラー情報の形式と、出力するカラー情報の形式とは一致していなくても構わない。一例としては、カラー情報拡大器10に、高解像度モノクロ画像101としてLab色空間におけるLチャンネルを入力すると共に、低解像度カラー情報105としてLab色空間におけるabチャンネルを入力した場合、高解像度カラー情報107としてRGB色空間におけるRGBチャンネルを出力することもできる。
【0103】
また、カラー情報拡大器10のすべての構成要素をニューラルネットワークで構成する代わりに、サイズ拡大手段21にBilinear補間法など一般的な画像拡大アルゴリズムで用いられるパラメータを固定的に用いると共に、その他の構成要素をニューラルネットワークで構成するようにしてもよい。この場合、カラー情報拡大器10のすべての構成要素をニューラルネットワークで構成した場合と比べると、良好となることが、実験的に分かっている。
また、カラー情報拡大器10は、ニューラルネットワークによる学習に限らず、他の機械学習技術を用いて構成することもできる。
【0104】
また、前記各実施形態では、カラー情報拡大器10,10A〜10Dとして説明したが、各装置の構成の処理を可能にするように、汎用または特殊なコンピュータ言語で記述したカラー情報拡大プログラムとみなすことも可能である。
また、前記各実施形態では、カラー情報推定器3,3Bとして説明したが、各装置の構成の処理を可能にするように、汎用または特殊なコンピュータ言語で記述したカラー情報推定プログラムとみなすことも可能である。
【実施例】
【0105】
実施形態に係るカラー情報拡大器の性能を確かめるために、実験を行った。
図10は、実験に用いたカラー情報拡大器を模式的に示す説明図である。
図10に示すように、実験に用いたカラー情報拡大器は、
図8に示すカラー情報拡大器10Dと同じ構成である。
【0106】
高解像度モノクロ画像101は、Lab色空間におけるLチャンネルに相当する1chのモノクロ情報(画像特徴量)である。
図10では、1枚の画像として模式的に示した。
また、実験では、高解像度モノクロ画像101が960×540ピクセルの画像であるものとした。なお、高解像度モノクロ画像101における画素値をベクトルで表現すると、一般には次の式(1)で示される。式(1)で示すベクトルx
1は、高解像度モノクロ画像101の画素数と同様に518400個の成分を持つ。
【0107】
【数1】
【0108】
低解像度カラー情報105は、Lab色空間におけるabチャンネルに相当する2chのカラー情報(画像特徴量)である。
図10では、2枚の小さな画像として模式的に示した。
また、実験では、低解像度カラー情報105の解像度が480×270ピクセルであるものとした。そして、実験では、サイズ拡大手段21による拡大率を2(垂直方向2倍×水平方向2倍)とした。
図10では、2枚の拡大された画像として模式的に示した。
【0109】
これら拡大された2chのカラー情報における画素値をそれぞれベクトルで表現すると、一般には次の式(2)および式(3)で示される。それぞれのベクトルx
2,x
3は、前記した式(1)で示されるベクトルx
1と同数個の成分を持っている。
【0110】
【数2】
【0111】
【数3】
【0112】
合成手段22aは、各ベクトルx
1、x
2、x
3を入力として、それらのベクトル成分を各画素に対応させて並べて、3chの情報とする。
図10では、3枚の画像として模式的に示した。なお、この時点では、例えば3×960×540個の画素ごとの特徴量に対応したメモリが必要である。
【0113】
第3の特徴抽出手段33は、コンボリューションを行うニューラルネットワークで構成されている。本実験では、20層のConvolution層を構築した。
また、各Convolution層では、出力としてN個の特徴を抽出するものとした。つまり、アウトプットチャンネル数はNである。この実験ではNch=64chとした。
なお、
図10では、3層のConvolution層だけを示し、他は省略した。また、64chのうち12のチャンネルだけをNchとして図示し、他は省略した。
【0114】
Convolution層の1層目(1回目)は、入力チャンネルが3ch(色空間における3チャンネル)であり、この1層目についての64のアウトプットチャンネルごとに、次の式(4)で表されるコンボリューションを行った。
【0115】
【数4】
【0116】
式(4)において、ω
iは重みベクトルである。重みベクトルω
iは、このカラー情報拡大器における学習の際に誤差を使ってω
iを更新する、という誤差計算で決定する学習パラメータである。重みベクトルω
iは、1次元の多数変数のベクトルであって、入力される高解像度モノクロ画像101の画素数と同数の成分を持つ。bはバイアスである。なお、i=1,2,3に対応したx
1、x
2、x
3は式(1)〜式(3)で定義されている。
なお、この時点では、例えば64×960×540個の画素ごとの特徴量に対応したメモリが必要である。
【0117】
Convolution層の2層目(2回目)は、入力チャンネルが64ch(前段の1層目についてのアウトプットにおける64チャンネル)であり、2層目についての64のアウトプットチャンネルごとに、次の式(5)で表されるコンボリューションを行った。
【0118】
【数5】
【0119】
式(5)は式(4)と同様の形式で表されている。なお、i=1〜64に対応したx
1〜x
64は、前段の1層目についてのアウトプットにおける64チャンネルのそれぞれの情報を示しており、式(1)〜式(3)と同様に定義できるので、その詳細は省略する。
【0120】
Convolution層の3〜19層目(3〜19回目)は、同様に、入力チャンネルが64ch(前の層についてのアウトプットにおける64チャンネル)であり、それぞれ、64のアウトプットチャンネルごとに、前記した式(5)で表されるコンボリューションを行った。なお、3〜19層目においても、i=1〜64に対応したx
1〜x
64は、同様に、それらの前の層についてのアウトプットにおける64チャンネルについての画像特徴量を示している。
【0121】
高解像度カラー情報推定手段23もConvolution層で構成されている。この高解像度カラー情報推定手段23は、出力として、色空間における2つのチャンネルに対応させた特徴をそれぞれ抽出した。つまり、アウトプットチャンネルは2chである。
このConvolution層(高解像度カラー情報推定手段23)は、入力チャンネルが64ch(前の層についてのアウトプットにおける64チャンネル)であり、色空間における2つのチャンネルごとに、前記した式(5)で表されるコンボリューションを行った。
【0122】
前記した式(4)におけるω
iと式(5)におけるω
iとはそれぞれ異なっている。また、アウトプットチャンネルごとにω
iはそれぞれ異なっている。さらに、前記した20層のConvolution層には、それぞれ異なる重みベクトルω
iを用いた。
【0123】
また、実験では、1282回(=64+64×19+2)のコンボリューションのすべてを、一例として、以下の同じ条件で、重みベクトルω
iを変えながら行った。
カーネル(kernel):3
パディング(padding):1
ストライド(stride):1
【0124】
よって、実験で用いた重みベクトルの各成分の個数を総計した個数は、次の式(6)を演算した結果の個数となる。
3×3×(3×64+64×64×19+64×2) ・・・ 式(6)
また、バイアス項の個数の総計はコンボリューションの個数と同じく、1282個である。これらの合計が全パラメータ数である。
つまり、実験に用いたカラー情報拡大器において、学習によって予め決定されたパラメータ群の個数は、703296+1282=704578個となる。
【0125】
以上の処理により得られた高解像度カラー情報107を、
図1に示すように、元画像である高解像度モノクロ画像101と合成して、高解像度カラー画像109を作成した(以下、実施例1)。
また、従来技術の方法で拡大したカラー情報を、元画像である高解像度モノクロ画像101と合成して、高解像度カラー画像を作成した(以下、比較例1)。
実施例1は、比較例1と比べて色のぼけが低減されたことを目視で確認できた。
また、ランダムに選んだ画像110枚に適用した場合に、PSNR(Peak Signal-to-Noise Ratio)という、元画像に対する劣化具合を表す尺度の平均値において、37.66(比較例)から41.35(実施例)に改善したことを確認できた。
【0126】
なお、高解像度モノクロ画像101として、より大きな4K画像を用いて同じ実験を行う場合には、特徴量の個数が飛躍的に増大するので、より多くのメモリ領域を持ったハードウェア資源が必要である。
さらに、
図10において破線で示す第1の特徴抽出手段31や第2の特徴抽出手段32を追加して
図2のカラー情報拡大器10と同様の構成とする場合、さらに多くのパラメータを決定する必要がある。