(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-08
(45)【発行日】2022-01-12
(54)【発明の名称】カラー情報推定モデル生成装置、動画像カラー化装置およびそれらのプログラム
(51)【国際特許分類】
G06T 7/90 20170101AFI20220104BHJP
G06T 7/00 20170101ALI20220104BHJP
H04N 9/64 20060101ALI20220104BHJP
【FI】
G06T7/90 A
G06T7/00 350C
H04N9/64 Z
(21)【出願番号】P 2017251873
(22)【出願日】2017-12-27
【審査請求日】2020-10-26
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】特許業務法人磯野国際特許商標事務所
(72)【発明者】
【氏名】遠藤 伶
(72)【発明者】
【氏名】河合 吉彦
【審査官】豊田 好一
(56)【参考文献】
【文献】特開2004-334814(JP,A)
【文献】特開2014-044595(JP,A)
【文献】Satoshi Iizuka, Edgar Simo-Serra, and Hiroshi Ishikawa ,Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification,ACM Transaction on Graphics (Proc. Of SIGGRAPH),2016年,35(4),110
【文献】森田 千晶、増永 良文,モノクロ画像のカラリゼーションのための色彩傾向を考慮したウェブ画像検索システム,電子情報通信学会第17回データ工学ワークショップ(DEWS2006),日本,2006年03月,5B-i9
【文献】R. Irony, D. Cohen-Or, D. Lischinski,Colorization by Example,Eurgraphics Symposium on Rendering ,2005年
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/90
G06T 7/00
H04N 9/64
(57)【特許請求の範囲】
【請求項1】
被写体が共通する
カラー動画像のフレームである基準カラー画像と複数の参照カラー画像とを対とした複数のカラー画像を用いて、
前記基準カラー画像の明度成分であるモノクロ画像に対するカラー情報を推定するためのカラー情報推定モデルを生成するカラー情報推定モデル生成装置であって、
前記基準カラー画像を明度成分であるカラー化対象の対象モノクロ画像と明度成分以外の色成分である正解データになる正解カラー情報とに分離する基準画像分離手段と、
前記参照カラー画像を参照モノクロ画像と参照カラー情報とに分離する参照画像分離手段と、
前記カラー情報推定モデルをニューラルネットワークにより学習するモデル学習手段と、を備え、
前記モデル学習手段は、
前記対象モノクロ画像、前記参照モノクロ画像および前記参照カラー情報を入力して特徴量である参照画像特徴を出力する参照画像特徴抽出器と、
前記複数の参照カラー画像に対応して前記参照画像特徴抽出器から出力される複数の参照画像特徴を合成して合成特徴を生成する特徴合成器と、
前記対象モノクロ画像を入力して特徴量であるモノクロ画像特徴を出力するモノクロ画像特徴抽出器と、
前記合成特徴および前記モノクロ画像特徴を連結した特徴量を入力して推定カラー情報を出力するカラー情報推定器と、
で構成された前記カラー情報推定モデルを、前記推定カラー情報が前記正解カラー情報となるように学習することを特徴とするカラー情報推定モデル生成装置。
【請求項2】
被写体が共通する
カラー動画像のフレームである基準カラー画像と複数の参照カラー画像とを対とした複数のカラー画像を用いて、
前記基準カラー画像の明度成分であるモノクロ画像に対するカラー情報を推定するためのカラー情報推定モデルを生成するカラー情報推定モデル生成装置であって、
前記基準カラー画像を明度成分であるカラー化対象の対象モノクロ画像と明度成分以外の色成分である正解データになる正解カラー情報とに分離する基準画像分離手段と、
前記カラー情報推定モデルをニューラルネットワークにより学習するモデル学習手段と、を備え、
前記モデル学習手段は、
前記対象モノクロ画像および前記参照カラー画像を入力して特徴量である参照画像特徴を出力する参照画像特徴抽出器と、
前記複数の参照カラー画像に対応して前記参照画像特徴抽出器から出力される複数の参照画像特徴を合成して合成特徴を生成する特徴合成器と、
前記対象モノクロ画像を入力して特徴量であるモノクロ画像特徴を出力するモノクロ画像特徴抽出器と、
前記合成特徴および前記モノクロ画像特徴を連結した特徴量を入力して推定カラー情報を出力するカラー情報推定器と、
で構成された前記カラー情報推定モデルを、前記推定カラー情報が前記正解カラー情報となるように学習することを特徴とするカラー情報推定モデル生成装置。
【請求項3】
前記特徴合成器は、前記参照画像特徴抽出器で抽出された複数の参照画像特徴において、データ配列の同一の要素ごとに最大値を選択、最小値を選択、または、加算することで前記合成特徴を生成することを特徴とする請求項1または請求項2に記載のカラー情報推定モデル生成装置。
【請求項4】
請求項1に記載のカラー情報推定モデル生成装置で生成されたカラー情報推定モデルを用いて、モノクロ動画像と複数の参照カラー画像とからカラー動画像を生成する動画像カラー化装置であって、
前記複数の参照カラー画像を複数の参照モノクロ画像と複数の参照カラー情報とに分離する参照画像分離手段と、
前記モノクロ動画像をフレームごとにカラー化対象の対象モノクロ画像として入力する動画像入力手段と、
前記カラー情報推定モデルの参照画像特徴抽出器により、前記参照モノクロ画像および前記参照カラー情報ごとに、前記対象モノクロ画像との間の参照画像特徴を複数抽出する参照画像特徴抽出手段と、
前記参照画像特徴抽出手段で抽出された複数の参照画像特徴を、前記カラー情報推定モデルの特徴合成器と同じ合成手法で合成して合成特徴を生成する参照画像特徴合成手段と、
前記カラー情報推定モデルのモノクロ画像特徴抽出器により、前記対象モノクロ画像からモノクロ画像特徴を抽出するモノクロ画像特徴抽出手段と、
前記カラー情報推定モデルのカラー情報推定器により、前記参照画像特徴合成手段で生成された複数の参照画像特徴の合成特徴と前記モノクロ画像特徴を連結した特徴量からカラー情報を推定するカラー情報推定手段と、
前記カラー情報推定手段で推定されたカラー情報と前記対象モノクロ画像とをフレーム単位で合成することで、前記カラー動画像を生成するカラー情報合成手段と、
を備えることを特徴とする動画像カラー化装置。
【請求項5】
請求項2に記載のカラー情報推定モデル生成装置で生成されたカラー情報推定モデルを用いて、モノクロ動画像と複数の参照カラー画像とからカラー動画像を生成する動画像カラー化装置であって、
前記モノクロ動画像をフレームごとにカラー化対象の対象モノクロ画像として入力する動画像入力手段と、
前記カラー情報推定モデルの参照画像特徴抽出器により、前記参照カラー画像ごとに、前記対象モノクロ画像との間の参照画像特徴を複数抽出する参照画像特徴抽出手段と、
前記参照画像特徴抽出手段で抽出された複数の参照画像特徴を、前記カラー情報推定モデルの特徴合成器と同じ合成手法で合成して合成特徴を生成する参照画像特徴合成手段と、
前記カラー情報推定モデルのモノクロ画像特徴抽出器により、前記対象モノクロ画像からモノクロ画像特徴を抽出するモノクロ画像特徴抽出手段と、
前記カラー情報推定モデルのカラー情報推定器により、前記参照画像特徴合成手段で生成された複数の参照画像特徴の合成特徴と前記モノクロ画像特徴を連結した特徴量からカラー情報を推定するカラー情報推定手段と、
前記カラー情報推定手段で推定されたカラー情報と前記対象モノクロ画像とをフレーム単位で合成することで、前記カラー動画像を生成するカラー情報合成手段と、
を備えることを特徴とする動画像カラー化装置。
【請求項6】
コンピュータを、請求項1から請求項3のいずれか一項に記載のカラー情報推定モデル生成装置として機能させるためのカラー情報推定モデル生成プログラム。
【請求項7】
コンピュータを、請求項4または請求項5に記載の動画像カラー化装置として機能させるための動画像カラー化プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、モノクロ動画像をカラー化するためのカラー情報推定モデル生成装置、動画像カラー化装置およびそれらのプログラムに関する。
【背景技術】
【0002】
近年、いわゆる機械学習技術を用いることにより、モノクロ画像(白黒画像)におけるカラー情報を推定する方法が提案されている(非特許文献1、非特許文献2参照)。このような機械学習技術を用いたカラー情報の推定方法は、多様な物体が写った膨大な量のカラー画像を用意することを前提としている。
【0003】
このカラー情報の推定方法は、カラー情報を推定するためのカラー推定モデルを学習する際に、例えば、ニューラルネットワーク等で構成されたモデルに、膨大なカラー画像を入力する。そして、この推定方法は、モノクロ画像とこのモノクロ画像に対応するカラー情報との対応関係を機械学習技術によりカラー推定モデルのパラメータとして学習する。次に、この推定方法は、学習したカラー推定モデルを用いて、モノクロ画像とカラー情報との対応関係から、入力として与えられるモノクロ画像に対して、カラー情報を推定し、カラー画像を生成する。
この従来の推定方法を用いて、モノクロ動画像(白黒動画像)から静止画フレームを抽出し、フレーム単位のモノクロ画像ごとにカラー化を行い、動画像のフレームとすることで、カラー動画像を生成することができる。
【先行技術文献】
【非特許文献】
【0004】
【文献】Satoshi Iizuka, Edgar Simo-Serra, and Hiroshi Ishikawa., “Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification,”ACM Transaction on Graphics (Proc. Of SIGGRAPH), 35(4):110, 2016.
【文献】Richard Zhang, Phillip Isola, and Alexei A. Efros. “Colorful Image Colorization.” In ECCV 2016.
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来の推定方法を用いて、フレーム単位でカラー化を行うことでカラー動画を生成する手法には、以下のような問題がある。
従来の手法は、フレームごとに個別にカラー化を行うため、同一被写体であっても、被写体の形状、配置等の変化に伴い、カラー推定モデルの入出力が変化し、前フレームと次フレームとの間で色ぶれが発生してしまう。
そのため、従来の手法によりモノクロ動画像をカラー化した場合、不自然なカラー動画像となってしまうという問題がある。
また、このように生成された色の不自然なカラー動画像は人手により修正が必要となるが、すべてのフレームに対して修正を行うことは多大な時間と労力を要するという問題がある。
【0006】
本発明は、以上のような問題に鑑みてなされたものであり、被写体が共通するカラー動画像のフレームである基準カラー画像と複数の参照カラー画像とから、基準カラー画像の明度成分であるモノクロ画像に対するカラー情報を推定することが可能なカラー情報推定モデル生成装置、カラー情報推定モデル生成装置で生成されたカラー情報推定モデルを用いて、フレーム間の色ぶれを抑え、モノクロ動画像をカラー化することが可能な動画像カラー化装置およびそれらのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0007】
前記課題を解決するため、本発明に係るカラー情報推定モデル生成装置は、被写体が共通するカラー動画像のフレームである基準カラー画像と複数の参照カラー画像とを対とした複数のカラー画像を用いて、基準カラー画像の明度成分であるモノクロ画像に対するカラー情報を推定するためのカラー情報推定モデルを生成するカラー情報推定モデル生成装置であって、基準画像分離手段と、参照画像分離手段と、モデル学習手段と、を備える構成とした。
【0008】
かかる構成において、カラー情報推定モデル生成装置は、基準画像分離手段によって、基準カラー画像を明度成分であるモノクロ画像と明度成分以外の色成分であるカラー情報とに分離する。これによって、基準画像分離手段は、カラー情報推定モデルにおけるカラー化対象の学習データとなる対象モノクロ画像と、正解データとなる正解カラー情報とを生成する。
また、カラー情報推定モデル生成装置は、参照画像分離手段によって、参照カラー画像を参照モノクロ画像と参照カラー情報とに分離する。これによって、参照画像分離手段は、対象モノクロ画像との相関を学習するための学習データとなる参照モノクロ画像と参照カラー情報とを生成する。
【0009】
そして、カラー情報推定モデル生成装置は、モデル学習手段によって、参照画像特徴抽出器、特徴合成器、モノクロ画像特徴抽出器およびカラー情報推定器で構成されたカラー情報推定モデルをニューラルネットワークにより学習する。
ここで、参照画像特徴抽出器は、対象モノクロ画像、参照モノクロ画像および参照カラー情報を入力して特徴量である参照画像特徴を出力するニューラルネットワークのモデルである。また、特徴合成器は、複数の参照カラー画像に対応して参照画像特徴抽出器から出力される複数の参照画像特徴を合成して合成特徴を生成する合成手段である。また、モノクロ画像特徴抽出器は、対象モノクロ画像を入力して特徴量であるモノクロ画像特徴を出力するニューラルネットワークのモデルである。また、カラー情報推定器は、合成特徴およびモノクロ画像特徴を連結した特徴量を入力して推定カラー情報を出力するニューラルネットワークのモデルである。これによって、モデル学習手段は、カラー化対象の対象モノクロ画像、参照モノクロ画像および参照カラー情報を入力して、対象モノクロ画像に対応する推定カラー情報が正解カラー情報となるようにカラー情報推定モデルを学習する。
【0010】
また、前記課題を解決するため、本発明に係る動画像カラー化装置は、カラー情報推定モデル生成装置で生成されたカラー情報推定モデルを用いて、モノクロ動画像と複数の参照カラー画像とからカラー動画像を生成する動画像カラー化装置であって、参照画像分離手段と、動画像入力手段と、参照画像特徴抽出手段と、参照画像特徴合成手段と、モノクロ画像特徴抽出手段と、カラー情報推定手段と、カラー情報合成手段と、を備える構成とした。
【0011】
かかる構成において、動画像カラー化装置は、参照画像分離手段によって、複数の参照カラー画像を複数の参照モノクロ画像と複数の参照カラー情報とに分離する。これによって、参照画像分離手段は、カラー情報推定モデルへの入力となる複数の参照モノクロ画像と、複数の参照カラー情報とを生成する。
そして、動画像カラー化装置は、動画像入力手段によって、モノクロ動画像をフレームごとにカラー化対象の対象モノクロ画像として入力する。この対象モノクロ画像は、カラー情報推定モデルへの入力となる。
【0012】
そして、動画像カラー化装置は、参照画像特徴抽出手段によって、カラー情報推定モデルの参照画像特徴抽出器により、一対の参照モノクロ画像および参照カラー情報ごとに、対象モノクロ画像との間の参照画像特徴を複数抽出する。
さらに、動画像カラー化装置は、参照画像特徴合成手段によって、参照画像特徴抽出手段で抽出された複数の参照画像特徴を、カラー情報推定モデルの特徴合成器と同じ合成手法で合成して合成特徴を生成する。これによって、参照画像特徴合成手段は、複数の参照画像特徴を、固定長のデータ量に変換する。
また、動画像カラー化装置は、モノクロ画像特徴抽出手段によって、カラー情報推定モデルのモノクロ画像特徴抽出器により、対象モノクロ画像からモノクロ画像特徴を抽出する。
【0013】
そして、動画像カラー化装置は、カラー情報推定手段によって、カラー情報推定モデルのカラー情報推定器により、参照画像特徴合成手段で生成された複数の参照画像特徴の合成特徴とモノクロ画像特徴を連結した特徴量からカラー情報を推定する。
そして、動画像カラー化装置は、カラー情報合成手段によって、カラー情報推定手段で推定されたカラー情報と対象モノクロ画像とをフレーム単位で合成することで、カラー動画像を生成する。
【0014】
また、本発明は、コンピュータを、前記カラー情報推定モデル生成装置として機能させるためのカラー情報推定モデル生成プログラムで実現することもできる。
また、本発明は、コンピュータを、前記動画像カラー化装置として機能させるための動画像カラー化プログラムで実現することもできる。
【発明の効果】
【0015】
本発明は、以下に示す優れた効果を奏するものである。
本発明に係るカラー情報推定モデル生成装置によれば、被写体が共通する基準カラー画像と複数の参照カラー画像とを対として、基準カラー画像の明度成分であるモノクロ画像と参照カラー画像とから、モノクロ画像のカラー情報を推定するカラー情報推定モデルを生成することができる。
また、本発明に係る動画像カラー化装置によれば、モノクロ動画像の各フレームをカラー化する際に、カラー情報推定モデルを用いて、参照カラー画像を参照して、近接する色のフレーム間特徴を保持するようにカラー化を行うため、フレーム間の色ぶれを抑えたカラー動画像を生成することができる。
【図面の簡単な説明】
【0016】
【
図1】本発明におけるカラー情報推定モデルを生成する概要を説明するための概要図である。
【
図2】本発明におけるカラー情報推定モデルを用いてモノクロ動画像からカラー動画像を生成する概要を説明するための概要図である。
【
図3】本発明の実施形態に係るカラー情報推定モデル生成装置の構成を示すブロック図である。
【
図4】本発明の実施形態に係るカラー情報推定モデル生成装置が生成するカラー情報推定モデルの一例を示す構造図である。
【
図5】本発明の実施形態に係るカラー情報推定モデル生成装置の動作を示すフローチャートである。
【
図6】本発明の実施形態に係る動画像カラー化装置の構成を示すブロック図である。
【
図7】本発明の実施形態に係る動画像カラー化装置の動作を示すフローチャートである。
【
図8】カラー情報推定モデルの参照画像特徴抽出器の変形例を示す構造図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について図面を参照して説明する。
<本発明の概要>
まず、
図1,
図2を参照して、本発明の概要について説明する。
本発明は、同一被写体が映った参照カラー画像Rから、カラー情報推定モデルMを学習により生成する。
図1に示すように、カラー情報推定モデルMは、ある基準カラー画像Bの明度成分であるモノクロ画像(モノクロ情報)と、複数の参照カラー画像Rの色成分であるカラー情報とから、基準カラー画像Bのカラー情報を推定するニューラルネットの学習モデルである。
例えば、本発明は、被写体(ここでは、車)が同じシーンのカラー動画像Vcから選択した任意の基準カラー画像B(ここでは、時刻T=t+1のフレーム画像F
t+1)と、近接する参照カラー画像R(ここでは、時刻T=2,t-1のフレーム画像F
2,F
t-1)から、カラー情報推定モデルMを学習により生成する。
【0018】
また、本発明は、カラー情報推定モデルMを用いて、複数の参照カラー画像からモノクロ動画像のカラー推定を行い、カラー動画像を生成する。
図2に示すよう、本発明は、カラー化対象であるモノクロ動画像Vmの一部のフレーム画像を予めカラー化し、参照カラー画像R
1,R
2,…として準備する。
そして、本発明は、カラー化対象のモノクロ動画像Vmを構成するフレーム(モノクロ画像)ごとに、モノクロ画像と複数の参照カラー画像Rの色成分であるカラー情報とから、モノクロ画像のカラー情報を推定し、カラー動画像Vcを生成する。
【0019】
このように、本発明は、複数の参照カラー画像Rを参照して、モノクロ動画像Vmに対するカラー情報を推定するため、参照カラー画像を仲介して、カラー情報をフレーム間で伝播させることが可能になる。そのため、本発明は、フレーム間で色ぶれの少ないカラー動画像Vcを生成することができる。
なお、参照カラー画像を1枚しか選べないモデルであれば、参照カラー画像を切り替えるタイミングで色ぶれが発生することがある。これを解決するためには、従来の手法は、人手により非常に短い間隔で厳密に参照カラー画像を選択しなければならない。
しかし、本発明は、複数の参照カラー画像を参照可能としたことで、厳密に参照カラー画像を選択する必要がなく、参照カラー画像を選択する手間や時間を削減することができる。
以下、本発明に係るカラー情報推定モデル生成装置および動画像カラー化装置について、より詳細に説明する。
【0020】
<カラー情報推定モデル生成装置:構成>
まず、
図3を参照して、カラー情報推定モデル生成装置1の構成について説明する。
図3に示すように、カラー情報推定モデル生成装置1は、基準画像分離手段10と、参照画像分離手段11と、モデル学習手段12と、モデル記憶手段13と、を備える。
【0021】
カラー情報推定モデル生成装置1は、基準カラー画像Bと複数の参照カラー画像R(R
1,…,R
N1)とを対とした学習データから、カラー情報推定モデルMを生成するものである。学習データは、予め大量(例えば、200万画像対以上)に準備しておく。
基準カラー画像Bは、例えば、予めカラー動画像Vc(
図1参照)から任意に選択した画像である。参照カラー画像R(R
1,…,R
N1)は、例えば、カラー動画像Vcにおいて基準カラー画像Bと近接する画像である。同一の基準カラー画像Bに対する参照カラー画像Rの数は特に制限するものではないが、例えば、1~5の間のランダムな数で学習する。
【0022】
なお、基準カラー画像Bおよび参照カラー画像Rを選択するカラー動画像Vcは、フレーム間で連続性があることが好ましく、例えば、同じ被写体を撮影したシーンの動画像である。また、基準カラー画像Bおよび参照カラー画像Rは、同じ被写体が映った異なるシーンの画像であっても構わない。
また、基準カラー画像Bおよび参照カラー画像Rは、Lab色空間で表されたフレームで構成されたものとする。
【0023】
基準画像分離手段10は、入力した基準カラー画像を、カラー化対象のモノクロ画像(対象モノクロ画像)と正解データとなるカラー情報(正解カラー情報)とに分離するものである。
具体的には、基準画像分離手段10は、Lab色空間の3チャンネルで構成された基準カラー画像を、Lチャンネル(明度成分)の対象モノクロ画像と、a,bチャンネル(明度成分以外の色成分)の正解カラー情報とに分離する。
基準画像分離手段10は、分離した対象モノクロ画像(Lチャンネル)および正解カラー情報(a,bチャンネル)を、モデル学習手段12に出力する。
【0024】
参照画像分離手段11は、入力した複数(N1枚)の参照カラー画像を、基準画像分離手段10と同様に、Lチャンネルのモノクロ画像(参照モノクロ画像)と、a,bチャンネルのカラー情報(参照カラー情報)とに分離するものである。
参照画像分離手段11は、分離した参照モノクロ画像(Lチャンネル)および参照カラー情報(a,bチャンネル)を、モデル学習手段12に出力する。
【0025】
モデル学習手段12は、カラー情報を推定するカラー情報推定モデルを学習するものである。このモデル学習手段12は、基準画像分離手段10で分離された1チャンネルの対象モノクロ画像(Lチャンネル)と、参照画像分離手段11で分離された複数(N1枚)の1チャンネルの参照モノクロ画像(Lチャンネル)および2チャンネルの参照カラー情報(a,bチャンネル)とを学習データとして入力する。
そして、モデル学習手段12は、基準画像分離手段10で分離された2チャンネルの正解カラー情報(a,bチャンネル)を正解データとして、カラー情報推定モデルMの出力との誤差をなくす方向(誤差が予め定めた値以下になるよう)に、誤差逆伝播法を用いてカラー情報推定モデルM(具体的にはそのモデルパラメータ)を学習する。
モデル学習手段12は、学習したカラー情報推定モデルMをモデル記憶手段13に書き込み記憶する。
【0026】
ここで、
図4を参照して、モデル学習手段12が学習するカラー情報推定モデルMの構成例について説明する。
図4に示すように、カラー情報推定モデルMは、畳み込み層を含んだニューラルネットワークで構成することができる。なお、
図4に示すカラー情報推定モデルMは、カラー情報推定モデル生成装置1の学習対象であって装置構成ではないため、カラー情報推定モデルMの各構成には、M
RF,M
BW,M
CL等の記号を付している。
カラー情報推定モデルMは、入力層Iとして、複数の参照カラー画像Rの2チャンネルの参照カラー情報(a,bチャンネル)および1チャンネルの参照モノクロ画像(Lチャンネル)と、カラー化対象の1チャンネルの対象モノクロ画像P(Lチャンネル)と、を入力する。なお、対象モノクロ画像Pの入力層Iへの入力は2系統とする。
【0027】
また、カラー情報推定モデルMは、隠れ層(中間層)Hとして、ニューラルネットワークで構成された複数のモデル(参照画像特徴抽出器MRF,特徴合成器C,モノクロ画像特徴抽出器MBW,カラー情報推定器MCL)を備える。
参照画像特徴抽出器MRFは、参照カラー画像Rと対象モノクロ画像Pとから、対象モノクロ画像Pに対応した参照カラー画像Rの画像特徴を抽出するモデルである。
なお、複数の参照画像特徴抽出器MRFは、入力する参照カラー画像の数に応じて、逐次、参照カラー画像の数だけ学習対象となる。ただし、モデル学習手段12は、学習したそれぞれの参照画像特徴抽出器MRFのパラメータの値を加算あるいは平均化することで、複数の参照画像特徴抽出器MRFであっても、同じ参照画像特徴抽出器MRFとして学習する。
【0028】
この参照画像特徴抽出器MRFは、複数のコンボリューション層C1~C3と、加算器Sと、畳み込みニューラルネットワーク(CNN)NT1とで構成することができる。
コンボリューション層C1は、複数のカーネル(畳み込みフィルタ)により、参照カラー画像Rの2チャンネルの参照カラー情報(a,bチャンネル)を、予め定めたチャンネル数J(例えば、J=64)のデータに畳み込む。
コンボリューション層C2は、複数のカーネルにより、参照カラー画像Rの1チャンネルの参照モノクロ画像(Lチャンネル)を、コンボリューション層C1と同じチャンネル数Jのデータに畳み込む。
コンボリューション層C3は、複数のカーネルにより、1チャンネルの対象モノクロ画像P(Lチャンネル)を、コンボリューション層C1と同じチャンネル数Jのデータに畳み込む。
【0029】
加算器Sは、コンボリューション層C1~C3で畳み込まれたJチャンネル(Jch)のデータを要素ごとに加算する。なお、加算器Sを用いずに、コンボリューション層C1~C3の出力を連結し、3×Jチャンネルの情報としてもよい。
畳み込みニューラルネットワークNT1は、加算器Sで加算されたデータを、カーネルによる畳み込み処理、サンプリング処理等を行うことで、参照画像特徴RFFを生成する。この畳み込みニューラルネットワークNT1には、一般的な畳み込みニューラルネットワークの構造を用いればよく、例えば、VGG、ResNet等を用いることができる。
このように、参照画像特徴抽出器MRFは、参照カラー画像Rと対象モノクロ画像Pとから特徴を抽出するため、それぞれの関連性を含んだ参照画像特徴RFFを生成することができる。
【0030】
なお、参照画像特徴抽出器MRFのニューラルネットワークの構造は、この実施形態に限定されるものではない。例えば、コンボリューション層の数とパラメータ数(カーネルサイズ、チャンネル数)を変更してもよいし、コンボリューション層以外の層(例えば、全結合層、ノーマライゼーション層)を追加してもよい。
【0031】
特徴合成器Cは、複数の参照画像特徴抽出器MRFの出力である複数の参照画像特徴RFFを合成して合成特徴MXFを生成する。具体的には、特徴合成器Cは、複数の参照画像特徴RFFに対して、データ配列の同一の要素ごとに最大値を選択する、最小値を選択する、あるいは、要素ごとの値を加算するの何れかを行うことで、合成特徴MXFを生成する。これによって、特徴合成器Cは、参照カラー画像の枚数によらずに、固定長のデータ量の合成特徴MXFを生成することができる。
【0032】
複数の参照画像特徴RFFは、それぞれ同じ対象モノクロ画像に対する異なる参照カラー画像の特徴である。例えば、複数の参照画像特徴RFFのデータ配列の同一要素の最大値のみを選択、あるいは加算することにより、カラー推定を行うネットワークに伝播して学習を行うことで、参照画像特徴抽出器MRFは、対象モノクロ画像と参照カラー画像との間で相関の強い要素はより大きな値として出力するよう学習される。
【0033】
このように学習された参照画像特徴抽出器MRFを用いると、対象モノクロ画像とまったく無関係な参照カラー画像を入力したとしても、その参照画像特徴RFFは小さい値となりカラー推定を行うネットワークにはまったく伝播されないため、出力される推定カラーに悪影響を与えない。そのため、ユーザが参照カラー画像を選択する際の自由度が上がることになる。
なお、合成としてデータ配列の同一要素ごとに最小値を選択する手法は、データ配列の同一要素ごとに最大値を選択する手法と論理が逆になるだけで、参照画像特徴RFFとして大きな値がカラー推定を行うネットワークにまったく伝播されないように学習され、最大値を選択する場合と効果は同じである。
【0034】
モノクロ画像特徴抽出器MBWは、対象モノクロ画像Pの画像特徴を抽出するモデルである。このモノクロ画像特徴抽出器MBWは、畳み込みニューラルネットワーク(CNN)NT2で構成することができる。
畳み込みニューラルネットワークNT2は、1チャンネルの対象モノクロ画像P(Lチャンネル)から、カーネルによる畳み込み処理、サンプリング処理等を行うことで、モノクロ画像特徴BWFを生成する。なお、畳み込みニューラルネットワークNT2も、VGG、ResNet等の一般的な畳み込みニューラルネットワークの構造を用いればよい。
【0035】
カラー情報推定器MCLは、特徴合成器Cで合成された合成特徴MXFとモノクロ画像特徴抽出器MBWで抽出されたモノクロ画像特徴BWFとを連結したデータ(連結特徴CTF)から、2チャンネルのカラー情報(a,bチャンネル)を推定するモデルである。このカラー情報推定器MCLは、畳み込みニューラルネットワーク(CNN)NT3で構成することができる。
このカラー情報推定器MCLは、非特許文献1、非特許文献2等で用いられるCNNの後半部分であるデコンボリューション層、アップサンプリング層を用いて構成することができる。
カラー情報推定器MCLは、出力層Oから、推定したカラー情報(推定カラー情報:a,bチャンネル)を出力する。
なお、モデル学習手段12は、複数のモデル(MRF,MBW,MCL)のカーネル、重み等をモデルパラメータとして学習する。特徴合成器Cは、固定の演算を行うもので、学習対象ではない。
【0036】
図3に戻って、カラー情報推定モデル生成装置1の構成について説明を続ける。
モデル記憶手段13は、モデル学習手段12で学習するカラー情報推定モデルMを記憶するものである。このモデル記憶手段13は、半導体メモリ等の一般的な記憶媒体で構成することができる。学習後のカラー情報推定モデルMは、動画像カラー化装置2(
図6参照)で用いられる。
なお、カラー情報推定モデル生成装置1は、コンピュータを、前記した各手段として機能させるためのカラー情報推定モデル生成プログラムで動作させることができる。
【0037】
<カラー情報推定モデル生成装置:動作>
次に、
図5を参照(構成については、適宜
図3参照)して、カラー情報推定モデル生成装置1の動作について説明する。
ステップS1において、基準画像分離手段10は、入力したLab色空間の基準カラー画像Bを、a,bチャンネルの正解カラー情報と、Lチャンネルの対象モノクロ画像とに分離する。
ステップS2において、参照画像分離手段11は、入力したLab色空間の複数の参照カラー画像Rを、それぞれ、a,bチャンネルの参照カラー情報と、Lチャンネルの参照モノクロ画像とに分離する。
【0038】
ステップS3において、モデル学習手段12は、ステップS1で分離した対象モノクロ画像と、ステップS2で分離した複数の参照カラー情報および参照モノクロ画像とを入力し、ステップS1で分離した正解カラー情報a,bを出力するようにニューラルネットワークのカラー情報推定モデルMを学習する。
このステップS3では、カラー情報推定モデルMを構成する複数のモデル(参照画像特徴抽出器MRF,モノクロ画像特徴抽出器MBW,カラー情報推定器MCL)が学習される。
【0039】
ステップS4において、モデル学習手段12は、予め定めた学習データ(基準カラー画像B、参照カラー画像R)の入力が終了した、あるいは、学習による推定誤差の変化量が閾値以下となったかにより、学習の終了を判定する。
ここで、学習が終了していなければ(ステップS4でNo)、カラー情報推定モデル生成装置1は、ステップS1に戻って、他の基準カラー画像Bおよび他の複数の参照カラー画像Rを入力し、学習を継続する。
一方、学習が終了した場合(ステップS4でYes)、ステップS5において、モデル学習手段12は、学習したカラー情報推定モデルMをモデル記憶手段13に書き込み記憶する。
【0040】
以上の動作によって、カラー情報推定モデル生成装置1は、対象モノクロ画像のカラー情報を参照カラー画像から推定するカラー情報推定モデルMを学習により生成することができる。
【0041】
<動画像カラー化装置:構成>
次に、
図6を参照して、動画像カラー化装置2の構成について説明する。
図6に示すように、動画像カラー化装置2は、参照画像分離手段20と、動画像入力手段21と、モデル記憶手段22と、フレーム別カラー情報推定手段23と、カラー情報合成手段24と、を備える。
【0042】
なお、カラー化対象のモノクロ動画像Vmに対して、予め複数の参照カラー画像Rを準備しておく。参照カラー画像Rは、カラー化対象のモノクロ動画像Vmの一部のフレーム(モノクロ画像)に対してカラー化を行った画像とする。参照カラー画像Rの数N2は、特に限定するものではない。この参照カラー画像Rは、異なる被写体が出現するたびに、新たな参照カラー画像を準備することが望ましい。例えば、カメラと被写体が動かない動画像であれば、参照カラー画像Rは1枚でよい。また、カメラが動き、1秒ごとに新たな被写体が写り込む場合は、1秒あたりに参照カラー画像Rを1枚準備することが望ましい。
【0043】
参照カラー画像Rを予めモノクロ動画像Vmから生成するには、例えば、図示を省略した従来の画像カラー化装置を用いて、モノクロ動画像Vmのカラー情報をフレーム単位で推定して生成したカラー動画像の中から、操作者が正しい色に近いと判断した画像を参照カラー画像Rとして選択すればよい。この従来の画像カラー化装置には、非特許文献1、非特許文献2等のフレーム単位でカラー情報を推定するものを用いることができる。
もちろん、参照カラー画像Rは、図示を省略した画像エディタ装置によって、モノクロ動画像Vmの中から選択したフレームを人手により個別に着色したものであっても構わない。
【0044】
参照画像分離手段20は、予め準備したN2(N2は2以上)枚の参照カラー画像を順次入力し、モノクロ画像(参照モノクロ画像)とカラー情報(参照カラー情報)とに分離するものである。
具体的には、参照画像分離手段20は、Lab色空間の3チャンネルで構成された参照カラー画像Rを、Lチャンネル(明度成分)の参照モノクロ画像と、a,bチャンネル(明度成分以外の色成分)の参照カラー情報とに分離する。
参照画像分離手段20は、分離した参照モノクロ画像(Lチャンネル)および参照カラー情報(a,bチャンネル)を、図示を省略したメモリ(記憶手段)に記憶し、後記するフレーム別カラー情報推定手段23が参照する。
【0045】
動画像入力手段21は、カラー化を行う対象のモノクロ動画像Vmを入力するものである。動画像入力手段21は、入力したモノクロ動画像Vmをフレームごとにカラー化対象のモノクロ画像(対象モノクロ画像)として、フレーム別カラー情報推定手段23およびカラー情報合成手段24に出力する。なお、モノクロ動画像Vmをフレームは、Lab空間のLチャンネル(1チャンネル)に相当する。
【0046】
モデル記憶手段22は、
図3で説明したカラー情報推定モデル生成装置1で生成されたカラー情報推定モデルMを記憶するものである。このモデル記憶手段22は、半導体メモリ等の一般的な記憶媒体で構成することができる。
カラー情報推定モデルMは、フレーム別カラー情報推定手段23によって参照される。
【0047】
フレーム別カラー情報推定手段23は、カラー情報推定モデルMを参照し、動画像入力手段21から入力されるフレームごとの対象モノクロ画像に対して、カラー情報を推定するものである。
フレーム別カラー情報推定手段23は、モノクロ画像特徴抽出手段230と、参照画像特徴抽出手段231と、参照画像特徴合成手段232と、カラー情報推定手段233と、を備える。
【0048】
モノクロ画像特徴抽出手段230は、動画像入力手段21から入力される対象モノクロ画像の画像特徴を抽出するものである。このモノクロ画像特徴抽出手段230は、カラー情報推定モデルMのモノクロ画像特徴抽出器M
BWを参照し、
図4に示すように、対象モノクロ画像に対して、畳み込みニューラルネットワークNT
2による演算を行うことで、モノクロ画像特徴BWFを生成する。
モノクロ画像特徴抽出手段230は、生成したモノクロ画像特徴BWFをカラー情報推定手段233に出力する。
【0049】
参照画像特徴抽出手段231は、参照画像分離手段20から入力される参照カラー画像RのN2枚分の参照カラー情報(a,bチャンネル)および参照モノクロ画像(Lチャンネル)と、動画像入力手段21から入力される対象モノクロ画像とから、対象モノクロ画像に対応した参照カラー画像Rの画像特徴を抽出するものである。
この参照画像特徴抽出手段231は、カラー情報推定モデルMの参照画像特徴抽出器M
RFを参照し、
図4に示すように、対象モノクロ画像と参照カラー画像Rの参照カラー情報(a,bチャンネル)および参照モノクロ画像(Lチャンネル)をそれぞれコンボリューション層(C
1~C
3)で予め定めたチャンネル数のデータに畳み込み加算する。そして、参照画像特徴抽出手段231は、加算したデータに対して、畳み込みニューラルネットワークNT
1による演算を行うことで、参照画像特徴RFFを生成する。
なお、参照画像特徴抽出手段231は、1つの対象モノクロ画像に対して、参照カラー画像RのN2枚分の参照画像特徴RFFを生成する。
参照画像特徴抽出手段231は、生成した参照カラー画像RのN2枚分の参照画像特徴RFFを参照画像特徴合成手段232に出力する。
【0050】
参照画像特徴合成手段232は、参照画像特徴抽出手段231で抽出される参照カラー画像Rの枚数分(N2枚)の参照画像特徴RFFを合成するものである。
この参照画像特徴合成手段232は、
図4で説明した特徴合成器Cで説明した合成手法と同じ合成手法により、複数の参照画像特徴RFFに対して、データ配列の同一の要素ごとに最大値を選択する、最小値を選択する、あるいは要素ごとの値を加算することで、合成特徴MXFを生成する。これによって、参照画像特徴合成手段232は、参照カラー画像Rの枚数によらずに、固定長のデータ量の合成特徴MXFを生成することができる。
参照画像特徴合成手段232は、生成した合成特徴MXFをカラー情報推定手段233に出力する。
【0051】
カラー情報推定手段233は、モノクロ画像特徴抽出手段230で抽出されたモノクロ画像特徴BWFと、参照画像特徴合成手段232で合成された合成特徴MXFとを連結したデータ(連結特徴CTF)から、2チャンネルのカラー情報(a,bチャンネル)を推定するものである。このカラー情報推定手段233は、カラー情報推定モデルMのカラー情報推定器M
CLを参照し、
図4に示すように、連結特徴CTFに対して、畳み込みニューラルネットワークNT
3による演算を行うことで、カラー情報(a,bチャンネル)を生成する。
カラー情報推定手段233は、生成したカラー情報(a,bチャンネル)をカラー情報合成手段24に出力する。
以上説明したように、フレーム別カラー情報推定手段23は、カラー情報推定モデルMを参照して、対象モノクロ画像のカラー情報を推定する。
【0052】
カラー情報合成手段24は、動画像入力手段21から入力した対象モノクロ画像をLab色空間のLチャンネルとし、フレーム別カラー情報推定手段23が推定したカラー情報(a,bチャンネル)を合成するものである。
カラー情報合成手段24は、Lチャンネル、aチャンネルおよびbチャンネルの3チャンネルのデータを、順次、3チャンネルのデータ構造を有するLab色空間のカラー画像のフレームとすることで、カラー動画像Vcとして出力する。
なお、動画像カラー化装置2は、コンピュータを、前記した各手段として機能させるための動画像カラー化プログラムで動作させることができる。
【0053】
以上説明したように動画像カラー化装置2を構成することで、動画像カラー化装置2は、参照カラー画像を参照してモノクロ動画像をカラー化し、カラー動画像を生成することができる。
【0054】
<動画像カラー化装置:動作>
次に、
図7を参照(構成については、適宜
図6参照)して、動画像カラー化装置2の動作について説明する。なお、モノクロ動画像Vmの一部を予めカラー化した参照カラー画像がN2枚準備されているものとする。
【0055】
ステップS10において、参照画像分離手段20は、複数(N2枚)のLab色空間の参照カラー画像Rを入力し、a,bチャンネルの参照カラー情報と、Lチャンネルの参照モノクロ画像とに分離する。参照画像分離手段20は、複数(N2枚)の参照カラー画像Rの参照カラー情報および参照モノクロ画像は図示を省略したメモリに記憶する(ステップとして図示せず)。
ステップS11において、動画像入力手段21は、モノクロ動画像Vmをフレーム(対象モノクロ画像)単位で入力する。対象モノクロ画像は、Lab色空間のモノクロ情報(Lチャンネル)に相当する。
【0056】
ステップS12において、フレーム別カラー情報推定手段23のモノクロ画像特徴抽出手段230は、ステップS11で入力した対象モノクロ画像に対して、モノクロ画像特徴抽出器MBWによる演算を行う。これによって、モノクロ画像特徴抽出手段230は、対象モノクロ画像からモノクロ画像特徴BWFを抽出する。
【0057】
ステップS13において、フレーム別カラー情報推定手段23の参照画像特徴抽出手段231は、ステップS10で分離した複数の参照カラー情報(a,b)および参照モノクロ画像(L)と、ステップS11で入力した対象モノクロ画像とに対して、参照画像特徴抽出器MRFによる演算を行う。これによって、参照画像特徴抽出手段231は、対象モノクロ画像に対応した複数の参照カラー画像の参照画像特徴RFFを抽出する。
【0058】
ステップS14において、参照画像特徴抽出手段231は、参照カラー画像の枚数(N2枚)すべてにおいて、参照画像特徴RFFを抽出したか否かを判定する。ここで、画像特徴が参照カラー画像の枚数(N)分未満の場合(ステップS14でNo)、動画像カラー化装置2は、ステップS12に戻って、次の参照カラー画像の参照画像特徴RFFを抽出する。
一方、参照画像特徴RFFが参照カラー画像の数(N2枚)に達した場合(ステップS14でYes)、ステップS15において、フレーム別カラー情報推定手段23の参照画像特徴合成手段232は、参照カラー画像の枚数(N2枚)分の参照画像特徴RFFを合成し、合成特徴MXFを生成する。この合成は、カラー情報推定モデルMの特徴合成器C(
図4参照)と同じ合成手法で、例えば、複数の参照画像特徴RFFに対して、データ配列の同一の要素ごとに最大値を選択する。
これによって、参照カラー画像の数によらずに、固定長のデータ量の合成特徴MXFが生成される。
【0059】
ステップS16において、フレーム別カラー情報推定手段23のカラー情報推定手段233は、ステップS11で入力した対象モノクロ画像と、ステップS15で生成された合成特徴とを連結したデータ(連結特徴)に対して、カラー情報推定器MCLによる演算を行う。これによって、カラー情報推定手段233は、モノクロ画像に対応した2チャンネルのカラー情報(a,bチャンネル)を推定する。
【0060】
ステップS17において、カラー情報合成手段24は、ステップS11で入力した対象モノクロ画像をLab色空間のLチャンネルとし、ステップS16で推定したカラー情報(a,bチャンネル)を合成することで、カラー画像を生成する。
ステップS18において、動画像入力手段21は、モノクロ動画像Vmの入力が終了したか否かを判定する。ここで、モノクロ動画像Vmの入力が終了していない場合(ステップS18でNo)、動画像カラー化装置2は、ステップS11に戻って、次フレーム(対象モノクロ画像)のカラー化を行う。
一方、モノクロ動画像Vmの入力が終了した場合(ステップS18でYes)、動画像カラー化装置2は、動作を終了する。
【0061】
以上の動作によって、動画像カラー化装置2は、カラー情報推定モデル生成装置1で生成したカラー情報推定モデルを用いて、モノクロ動画像からフレーム間で色ぶれの少ないカラー動画像を生成することができる。
【0062】
<変形例>
以上、本発明の実施形態について説明したが、本発明はこの実施形態に限定されるものではない。
(変形例1)
ここでは、
図4に示すように、カラー情報推定モデルMにおける参照画像特徴抽出器M
RFの入力を、参照カラー画像Rの2チャンネルの参照カラー情報(a,bチャンネル)および1チャンネルの参照モノクロ画像(Lチャンネル)と、カラー化対象の1チャンネルの対象モノクロ画像P(Lチャンネル)との3入力とした。
【0063】
しかし、参照画像特徴抽出器M
RFは、参照カラー画像Rと対象モノクロ画像Pとから、対象モノクロ画像Pに対応した参照カラー画像Rの画像特徴を抽出するモデルである。そのため、参照画像特徴抽出器M
RFは、
図8に示すように、3チャンネル(Lab)の参照カラー画像Rと、1チャンネル(L)の対象モノクロ画像Pとの2入力から、参照画像特徴RFFを抽出するモデル(参照画像特徴抽出器M
RF2)としてもよい。
この場合、
図3に示したカラー情報推定モデル生成装置1において、参照画像分離手段11を省略すればよい。また、
図6に示した動画像カラー化装置2において、参照画像分離手段20を省略すればよい。
【0064】
また、参照画像特徴抽出器MRFは、2チャンネルの参照カラー情報(a,bチャンネル)および1チャンネルの参照モノクロ画像(Lチャンネル)と、カラー化対象の1チャンネルの対象モノクロ画像P(Lチャンネル)との3入力を連結し、5チャンネルのデータに対して畳み込みを行ってもよい。その場合、参照画像特徴抽出器MRFは、個別の畳み込みと加算を行う必要はない。
また、参照画像特徴抽出器MRFは、参照モノクロ画像(Lチャンネル)と、対象モノクロ画像P(Lチャンネル)とを連結して畳み込んでもよい。
このように、参照画像特徴抽出器MRFは、入力データを任意の組み合わせで連結し、畳み込みを行ってもよい。
【0065】
(変形例2)
また、ここでは、カラー画像をLab色空間の画像とした。しかし、カラー画像は、Lab色空間の画像に限定するものではなく、他の色空間(例えば、RGB色空間)の画像であっても構わない。
【0066】
例えば、
図2に示したカラー情報推定モデル生成装置1において、RGB色空間のカラー画像(基準カラー画像、参照カラー画像)を学習データとして、カラー情報推定モデルMを生成する場合、基準画像分離手段10および参照画像分離手段11のそれぞれの前段に、色空間変換手段を備えればよい。そして、色空間変換手段が、RGB色空間のカラー画像をLab色空間のカラー画像に変換すればよい。
また、
図6に示した動画像カラー化装置2において、参照画像分離手段20の前段にRGB色空間のカラー画像をLab色空間のカラー画像に変換する色空間変換手段を備えればよい。また、カラー情報合成手段24の後段に、Lab色空間のカラー画像をRGB色空間のカラー画像に変換する色空間変換手段を備えればよい。
【符号の説明】
【0067】
1 カラー情報推定モデル生成装置
10 基準画像分離手段
11 参照画像分離手段
12 モデル学習手段
13 モデル記憶手段
20 動画像入力手段
21 参照画像分離手段
22 モデル記憶手段
23 フレーム別カラー情報推定手段
230 モノクロ画像特徴抽出手段
231 参照画像特徴抽出手段
232 参照画像特徴合成手段
233 カラー情報推定手段
24 カラー情報合成手段
M カラー情報推定モデル
MBW モノクロ画像特徴抽出器
MRF 参照画像特徴抽出器
MCL カラー情報推定器
C 特徴合成器