(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-09
(45)【発行日】2022-11-17
(54)【発明の名称】超解像装置およびそのプログラム
(51)【国際特許分類】
G06T 3/40 20060101AFI20221110BHJP
【FI】
G06T3/40 730
G06T3/40 725
(21)【出願番号】P 2018153358
(22)【出願日】2018-08-17
【審査請求日】2021-07-13
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】三須 俊枝
(72)【発明者】
【氏名】市ヶ谷 敦郎
【審査官】松永 隆志
(56)【参考文献】
【文献】国際公開第2018/048507(WO,A1)
【文献】国際公開第2017/150204(WO,A1)
【文献】菅原 佑介 ほか2名,畳み込みニューラルネットワークを用いた超解像の並列計算法,電子情報通信学会技術研究報告,2017年02月13日,Vol.116 No.463,p.13~18
【文献】仁井田 輝 ほか1名,SRCNNによるMRI画像の高解像度化とその工学的評価,電子情報通信学会技術研究報告 ,2018年03月12日,Vol.117 No.518,p.1~4
【文献】Chao Dong, et al,Image Super-Resoluion using deep convolutional networks,IEEE transactions on pattern analysis and machine intelligence,2016年02月,vol.38, No.2,p.295-307
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00-19/20
(57)【特許請求の範囲】
【請求項1】
予め設定された超解像の拡大率で入力信号を高解像度化する超解像装置であって、
学習用の入力信号を前記拡大率の逆数倍でダウンサンプリングして低解像信号を生成するダウンサンプリング手段と、
パラメータに応じて前記低解像信号をアップサンプリングし、前記学習用の入力信号を模擬した復元模擬信号を生成するアップサンプリング手段と、
前記
学習用の入力信号と前記復元模擬信号との誤差が小さくなるように前記パラメータを更新するパラメータ更新手段と、
前記パラメータを学習する学習モードと超解像信号を生成する実行モードとで、出力先を切り替える第1切替手段と第2切替手段と、を備え、
前記アップサンプリング手段は、前記パラメータ更新手段における前記パラメータの更新中に、新たなパラメータで前記低解像信号をアップサンプリングし、前記パラメータの更新後に、更新後のパラメータで超解像対象の入力信号をアップサンプリングすることにより
前記超解像信号を生成
し、
前記第1切替手段は、前記学習モードにおいて、前記学習用の入力信号を前記ダウンサンプリング手段および前記パラメータ更新手段に出力し、前記実行モードにおいて、前記超解像対象の入力信号を前記アップサンプリング手段に出力し、
前記第2切替手段は、前記学習モードにおいて、前記アップサンプリング手段で生成される前記復元模擬信号を前記パラメータ更新手段に出力し、前記実行モードにおいて、前記アップサンプリング手段で生成される前記超解像信号を外部に出力することを特徴とする超解像装置。
【請求項2】
請求項
1に記載の超解像装置において、
前記アップサンプリング手段は、畳み込み手段を備えたニューラルネットワークで構成され、
前記パラメータ更新手段は、前記パラメータを誤差逆伝播法により更新することを特徴とする超解像装置。
【請求項3】
請求項
1に記載の超解像装置において、
前記アップサンプリング手段は、タップ係数列による畳み込みを行う畳み込み手段を備え、
前記パラメータ更新手段は、前記タップ係数列を前記パラメータとして更新することを特徴とする超解像装置。
【請求項4】
請求項
2または請求項
3に記載の超解像装置において、
前記アップサンプリング手段は、前記畳み込み手段の前段に、当該アップサンプリング手段に入力される信号に対して前記拡大率で内挿を行う内挿手段を備えることを特徴とする超解像装置。
【請求項5】
コンピュータを、請求項1から請求項
4のいずれか一項に記載の超解像装置として機能させるための超解像プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号を高解像度化させる超解像装置およびそのプログラムに関する。
【背景技術】
【0002】
従来、画像の解像度を向上させる手法として、入力画像に対して、ウェーブレット変換等の直交変換を行った後、高解像度化した画像の空間高周波スペクトルを推定し、入力画像に逆直交変換を行うことで、入力画像を高解像度化する手法が開示されている(特許文献1参照)。
【0003】
この手法は、入力画像と高解像度化後の画像との間には自己相似性が存在すると仮定して、入力画像を直交変換した空間高周波スペクトルから、高解像度化後の帯域の空間高周波スペクトルを補間生成する。
そして、この手法は、入力画像が予め原画像を低解像度化した画像であって、原画像をオクターブ分解した帯域別のスペクトルパワー代表値を既知の情報として外部から入力する。あるいは、この手法は、自己相似性を前提として、入力画像をオクターブ分解した帯域別のスペクトルパワー代表値を、そのまま、水平・垂直方向に2倍した帯域のスペクトルパワー代表値とする。
さらに、この手法は、入力画像のスペクトルと空間高周波スペクトルとを、外部から入力したスペクトルパワー代表値、あるいは、帯域別に入力画像から求めたスペクトルパワー代表値となるように補正する。
そして、この手法は、補正した入力画像のスペクトルと空間高周波スペクトルとに対して、逆直交変換を行うことで、高解像度化した画像を生成する。
【0004】
また、画像の解像度を向上させる他の手法として、入力画像の拡大で生じる劣化成分を、入力画像のブロック単位の局所的な相似性から推定し、拡大画像に合成することで、入力画像を高解像度化する手法が開示されている(特許文献2参照)。
【0005】
この手法は、入力画像を予め定めた大きさの処理ブロックを順次切り出し、水平・垂直方向に2倍した拡大ブロックを生成する。
また、この手法は、拡大ブロックと同じ大きさの参照ブロックを入力画像から順次切り出し、縮小劣化させて複数の劣化ブロックを生成する。そして、この手法は、劣化ブロックを水平・垂直方向に2倍し、処理ブロックとの間の損失成分を生成する。
そして、この手法は、処理ブロックを水平・垂直方向に2倍し、拡大後の処理ブロックに、拡大前の処理ブロックと劣化ブロックとの類似度に応じて損失成分を合成することで、超解像ブロックを生成する。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2012-59138号公報
【文献】特開2012-113513号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
前記した特許文献1に記載された手法(以下、従来手法1)は、空間高周波スペクトルを推定するために、入力画像を生成した原画像をオクターブ分解した帯域別のスペクトルパワー代表値を既知の情報として用い、空間高周波スペクトルを推定する。
しかし、このような原画像に対する情報は、必ずしも得られるわけではない。そのため、従来手法1では、元となる原画像がない画像からは、高解像度の画像を生成することができないという問題がある。
【0008】
また、従来手法1は、別の手法として、自己相似性を前提として、入力画像をオクターブ分解した帯域別のスペクトルパワー代表値を用いて、空間高周波スペクトルを推定する。
しかし、この別の手法は、スペクトルパワーの調整のみでしか、空間高周波スペクトルを推定することができない。このように、スペクトルパワー代表値を用いたスペクトルパワーの調整のみでは、細かい空間周波数単位でのスペクトルの調整には限界がある。そのため、従来の手法に対して、さらなる高画質化の要望があった。
【0009】
また、前記した特許文献2に記載された手法(以下、従来手法2)は、ブロック単位の局所的な相似性を利用するため、画像内に、被写体像の形状やパターンとしての自己相似性の存在が必要となる。そのため、従来手法2は、局所的に相似する画像がない、あるいは、少ないブロックについては、高画質な超解像ブロックを生成することが困難であり、さらなる高画質化の要望があった。
【0010】
本発明は、このような問題や要望に鑑みてなされたものであり、自己相似性の存在を仮定した(すなわち、水平X/R垂直Y/Sの解像度から水平X垂直Yの解像度への超解像のパラメータを以て、水平X垂直Yの解像度から水平RX垂直SYへの超解像度をも実行できると仮定できる)超解像のパラメータを予め学習することで、入力信号を高品質に超解像化することが可能な超解像装置およびそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0011】
前記課題を解決するため、本発明に係る超解像装置は、入力信号を予め設定された超解像の拡大率で高解像度化する超解像装置であって、ダウンサンプリング手段と、アップサンプリング手段と、パラメータ更新手段と、第1切替手段と、第2切替手段と、を備える構成とした。
【0012】
かかる構成において、超解像装置は、ダウンサンプリング手段によって、予め設定された超解像の拡大率の逆数倍で学習用の入力信号をダウンサンプリングして低解像信号を生成する。
また、超解像装置は、アップサンプリング手段によって、パラメータに応じて低解像信号をアップサンプリングし、学習用の入力信号を模擬した復元模擬信号を生成する。この復元模擬信号と学習用の入力信号との誤差が小さければ、パラメータは、超解像のパラメータとして適していることになる。
そして、超解像装置は、パラメータ更新手段によって、入力信号と復元模擬信号との誤差が小さくなるようにパラメータを更新する。
【0013】
そして、超解像装置は、パラメータ更新手段におけるパラメータの更新中に、アップサンプリング手段によって、新たなパラメータで低解像信号をアップサンプリングする。これによって、パラメータ更新手段は、順次、入力信号と復元模擬信号との誤差を小さくして、新たなパラメータとして更新する。
このように、低解像信号から入力信号と近似する相似的な復元模擬信号を生成するようにパラメータを学習することで、当該パラメータは、自己相似性を仮定したパラメータとなる。
【0014】
そして、超解像装置は、パラメータ更新手段におけるパラメータの更新後に、アップサンプリング手段によって、更新後のパラメータで超解像対象の入力信号をアップサンプリングすることにより超解像信号を生成する。
このとき、第1切替手段は、学習モードにおいて、学習用の入力信号をダウンサンプリング手段およびパラメータ更新手段に出力し、実行モードにおいて、超解像対象の入力信号をアップサンプリング手段に出力する。また、第2切替手段は、学習モードにおいて、アップサンプリング手段で生成される復元模擬信号をパラメータ更新手段に出力し、実行モードにおいて、アップサンプリング手段で生成される超解像信号を外部に出力する。
なお、超解像装置は、コンピュータを、前記した各手段として機能させるための超解像プログラムで動作させることができる。
【発明の効果】
【0015】
本発明は、以下に示す優れた効果を奏するものである。
本発明によれば、入力信号と、ダウンサンプリングおよびアップサンプリングを行った復元模擬信号との誤差を小さくする方向にパラメータを学習するため、自己相似性に基づいた超解像を実現するパラメータを学習することができる。これによって、本発明は、学習したパラメータを用いて、入力信号から高品質な超解像信号を生成することができる。
【図面の簡単な説明】
【0016】
【
図1】本発明の実施形態に係る超解像装置の構成を示すブロック構成図である。
【
図2】本発明の実施形態に係る超解像装置のアップサンプリング手段の構成を示すブロック構成図である。
【
図3】本発明の実施形態に係る超解像装置の学習モードの動作を示すフローチャートである。
【
図4】本発明の実施形態に係る超解像装置の実行モードの動作を示すフローチャートである。
【
図5】本発明の実施形態に係る超解像装置のアップサンプリング手段の他の構成を示すブロック構成図である。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について図面を参照して説明する。
<超解像装置の構成>
まず、
図1を参照して、本発明の実施形態に係る超解像装置1の構成について説明する。
【0018】
超解像装置1は、予め設定された超解像の拡大率で入力信号を高解像度化して超解像信号を生成するものである。超解像の拡大率とは、入力信号の標本化方向の倍率である。本実施形態では、入力信号および超解像信号として、2次元の画像(入力画像、超解像画像)を例として説明する。
なお、入力画像は、画像全体であってもよいし、所定区間(ブロック等、画像の一部分)であっても構わない。
【0019】
ここでは、入力画像の画像座標(x,y)における画素値をI(x,y)とする。また、入力画像の解像度を幅X画素、高さY画素とする。
また、超解像画像の画像座標(x,y)における画素値をJ(x,y)とする。また、超解像画像の解像度を幅R×X画素、高さS×Y画素とする。ここで、実数Rは水平方向の倍率、実数Sは垂直方向の倍率(以下、RおよびSを総称して超解像の拡大率と称する)である。RおよびSの少なくとも一方は、1よりも大きい値とする。例えば、R=S=2とする。
【0020】
超解像装置1は、学習モードおよび実行モードの2つの動作モードで動作する。
学習モードは、学習用の入力画像の解像度を向上させる変換処理(アップサンプリング)のパラメータを学習するモードである。
実行モードは、学習モードで学習したパラメータを用いて変換処理を行い、超解像対象の入力画像Iを超解像画像Jに変換するモードである。
なお、学習モードで入力する学習用の画像は任意の画像でよいが、実行モードで実際に超解像を行う超解像対象の画像を入力画像としてもよい。
【0021】
図1に示すように、超解像装置1は、切替手段(第1切替手段)10と、ダウンサンプリング手段11と、パラメータ記憶手段12と、アップサンプリング手段13と、パラメータ更新手段14と、切替手段(第2切替手段)15と、を備える。
【0022】
切替手段10は、動作モードによって、入力画像Iの出力先を切り替えるものである。切替手段10は、パラメータ更新手段14から動作モードとしてモード切替信号を入力されることで、入力画像Iの出力先を切り替える。
モード切替信号mが学習モードを示す(例えば、m=0)場合、切替手段10は、入力画像Iを、ダウンサンプリング手段11およびパラメータ更新手段14に出力する。一方、モード切替信号mが実行モードを示す(例えば、m=1)場合、切替手段10は、入力画像Iを、アップサンプリング手段13に出力する。
【0023】
ダウンサンプリング手段11は、入力画像Iを標本化方向に解像度を減少させて、低解像画像(低解像信号)Dを生成するものである。なお、入力画像Iに対する低解像画像Dの解像度の比率は、入力画像Iの標本化方向である水平方向(x軸方向)および垂直方向(y軸方向)について、それぞれ、予め設定された超解像の拡大率の逆数倍とする。
【0024】
例えば、ダウンサンプリング手段11は、標本(画素)の間引きによって、入力画像Iの解像度を減少させることができる。
具体的には、ダウンサンプリング手段11は、以下の式(1)によって、入力画像Iを低解像画像Dに変換する。
【0025】
【0026】
ここで、round(z)は、実数zを整数に端数処理する関数である。なお、端数処理としては、例えば、四捨五入、五捨六入、切り捨て、切り上げ、床関数、天井関数、偶数への丸め、奇数への丸め、ゼロ方向への丸め等を用いることができる。
【0027】
また、ダウンサンプリング手段11は、間引きフィルタを用いた畳み込み処理によって、入力画像Iの解像度を減少させてもよい。
例えば、ダウンサンプリング手段11は、以下の式(2)によって、間引きフィルタhと標本の間引きとにより、入力画像Iを低解像画像Dに変換する。
【0028】
【0029】
なお、間引きフィルタhは、特に限定するものではないが、例えば、平均平滑化、双一次補間、双三次補間、Lanczos-3関数、打ち切りSinc関数等を用いることができる。
例えば、平均平滑化による間引きフィルタhは、以下の式(3)となる。
【0030】
【0031】
また、例えば、双一次補間による間引きフィルタhは、以下の式(4)となる。
【0032】
【0033】
さらに、例えば、Lanczos-3関数による間引きフィルタhは、以下の式(5)となる。
【0034】
【0035】
具体的には、R=S=2の場合において、前記式(3)の平均平滑化による間引きフィルタhを用いた場合、ダウンサンプリング手段11は、以下の式(6)により、入力画像Iを低解像画像Dに変換する。
【0036】
【0037】
ダウンサンプリング手段11は、変換後の低解像画像Dをアップサンプリング手段13に出力する。
【0038】
パラメータ記憶手段12は、アップサンプリング手段13で行う変換処理(アップサンプリング)のパラメータを記憶するものである。このパラメータ記憶手段12は、半導体メモリ等の一般的な記憶媒体で構成することができる。
なお、パラメータは、後記するアップサンプリング手段13を、ニューラルネットワークで構成する場合、ニューラルネットワークの結合重み係数、バイアス値等である。また、このパラメータは、後記するアップサンプリング手段13を、デジタルフィルタを用いた畳み込み手段で構成した場合、そのデジタルフィルタに設定されるタップ係数列である。
【0039】
パラメータの初期値は、学習前のパラメータの値であって、特に限定するものではないが、例えば、予め定めた固定値(数値または数値列)であってもよいし、予め乱数によって生成された乱数値(数値または数値列)であってもよい。
このパラメータは、アップサンプリング手段13およびパラメータ更新手段14によって参照され、パラメータ更新手段14によって更新される。
【0040】
アップサンプリング手段13は、切替手段10から入力される入力画像Iまたはダウンサンプリング手段11でダウンサンプリングされた低解像画像Dを、アップサンプリングするものである。
このアップサンプリング手段13は、学習モードにおいて、パラメータ記憶手段12に記憶されているパラメータを用いて、ダウンサンプリング手段11でダウンサンプリングされた低解像画像Dをアップサンプリングする。なお、学習モードにおいて、アップサンプリング手段13は、パラメータ更新手段14から、新たなパラメータを用いて、アップサンプリングを行う旨の指示を通知されるたびに、低解像画像Dをアップサンプリングする。
また、アップサンプリング手段13は、実行モードにおいて、パラメータ記憶手段12に記憶されているパラメータを用いて、切替手段10から入力される入力画像Iをアップサンプリングする。
【0041】
ここで、
図2を参照して、アップサンプリング手段13の構成例について説明する。
図2に示したアップサンプリング手段13は、ニューラルネットワークの一形態である深層残差学習(Deep Residual Network〔ResNet〕)により構成した例である。
図2に示すように、アップサンプリング手段13は、内挿手段20と、畳み込み手段21(21
1~21
8)と、活性化関数適用手段22(22
1~22
8)と、加算手段23(23
1~23
3)と、を備える。
【0042】
内挿手段20は、低解像画像Dまたは入力画像I(以下、代表して処理前画像Lと記す)を入力し、内挿処理を行うものである。
この内挿手段20は、処理前画像Lの標本化の密度を、超解像の拡大率である水平方向にR倍、垂直方向にS倍にすることで、補間画像(補間信号)Mを生成する。
この内挿手段20における内挿処理は、例えば、0次補間、双一次補間、双三次補間、Lanczos-3補間等、一般的な手法を用いることができる。
【0043】
例えば、内挿手段20は、内挿処理として0次補間により内挿を行うものとした場合、以下の式(7)により、処理前画像L(低解像画像Dまたは入力画像I)から、補間画像Mを生成する。
【0044】
【0045】
内挿手段20は内挿処理後の画像を畳み込み手段211に出力する。
なお、内挿手段20は、必須の構成ではない。しかし、拡大率に応じて処理前画像Lの標本化の密度を拡大することで、学習モード時におけるパラメータの収束時間を早めることができる効果があり、内挿手段20を備えることが好ましい。
【0046】
畳み込み手段21
k(
図2では、kは1以上8以下の整数;21
1~21
8)は、パラメータ記憶手段12に記憶されているパラメータpを用いて入力されたデータに対して畳み込み演算を行うものである。
ここで、畳み込み手段21
kが行う畳み込み演算を、4階テンソルAと3階テンソルXとに対する演算として、以下の式(8)により定義する。なお、P,Q,N,W,H,D,Nは、畳み込み手段21
kごとに、予めニューラルネットワークのモデルとして定めた定数である。
【0047】
【0048】
ただし、[xp,q,d]において、定義されていない範囲の添字p,qが参照された場合、当該成分の値を零とみなし、ゼロパディングを行う。
【0049】
畳み込み手段21kは、入力された3階テンソルXkと、結合重み係数(4階テンソルAk)およびバイアス(1階テンソルBk)とにより、以下の式(9)により畳み込み演算を行うことで、3階テンソルYkを生成する。なお、1階テンソルBkの次元数は、4階テンソルAkの定数N(Nk)と同じ次元とする。
【0050】
【0051】
畳み込み手段21kは、畳み込み演算により生成した3階テンソルYkを、予め定めたモデルに応じて、後段の活性化関数適用手段22に出力する。
【0052】
活性化関数適用手段22
k(
図2では、kは1以上8以下の整数;22
1~22
8)は、畳み込み手段21
kの出力(3階テンソルY
k)に対して、活性化関数を用いた演算を行うものである。
活性化関数適用手段22
kは、以下の式(10)に示すように、入力された3階テンソルY
kの各成分に対して、活性化関数φを適用し、3階テンソルZ
kを生成する。
【0053】
【0054】
なお、活性化関数適用手段22k(221~228)は、一部または全部を省略してもよい。その場合、省略された活性化関数適用手段22kへの入力と省略された活性化関数適用手段22kからの出力とをテンソルの成分ごとに直結すればよい。例えば、活性化関数適用手段22kを省略する場合、以下の式(11)としたことと動作は等価である。
【0055】
【0056】
活性化関数φは、非線形関数であっても、線形関数であっても、恒等関数であっても構わない。
例えば、活性化関数φを非線形関数とする場合、活性化関数φとして、以下の式(12)に示すReLU(Rectified Linear Unit)を用いることができる。
【0057】
【0058】
あるいは、活性化関数φとして、以下の式(13)に示すシグモイド(sigmoid)関数を用いることができる。
【0059】
【0060】
あるいは、活性化関数φとして、以下の式(14)に示す双曲線正接関数を用いることができる。
【0061】
【0062】
加算手段23(23
1~23
3)は、直前の畳み込み処理後の出力に、それよりも前の畳み込み処理後の出力をテンソルの成分ごとに加算するものである。
例えば、加算手段23
1は、直前の活性化関数適用手段22
3の出力に活性化関数適用手段22
1の出力を加算して、畳み込み手段21
4に出力する。また、例えば、加算手段23
2は、直前の活性化関数適用手段22
5の出力に加算手段23
1の出力を加算して、畳み込み手段21
6に出力する。
なお、加算手段23(23
1~23
3)は、必須の構成ではない。しかし、加算手段23を用いて、畳み込み処理をショートカットさせることで、少ない畳み込み処理の階層でも、その階層の深度を深めることで、より推定精度の高いニューラルネットワークを構成することができる。
図1に戻って、超解像装置1の構成について説明を続ける。
【0063】
アップサンプリング手段13は、低解像画像Dまたは入力画像Iをアップサンプリングして、切替手段15に出力する。
このとき、アップサンプリング手段13において、低解像画像Dをアップサンプリングした画像は、入力画像Iを模擬して復元した画像(復元模擬画像I^〔Iハット〕)となる。
また、アップサンプリング手段13において、入力画像Iをアップサンプリングした画像は、入力画像Iを超解像した画像(超解像画像J)となる。
【0064】
パラメータ更新手段14は、アップサンプリング手段13で行う変換処理(アップサンプリング)のパラメータを更新するものである。
パラメータ更新手段14は、切替手段10から入力される入力画像Iと、入力画像Iをダウンサンプリングおよびアップサンプリングすることで生成された切替手段15から入力される復元模擬画像I^との誤差をより小さくするようにパラメータを更新する。
【0065】
例えば、パラメータ更新手段14は、アップサンプリング手段13で使用するパラメータpの変化が出力値(復元模擬画像I^)に及ぼす変化(勾配)を考慮して、勾配降下法によって、新たなパラメータp′を算出する。なお、パラメータ更新手段14は、勾配降下法によってパラメータp′を算出する1つの方法として、アップサンプリング手段13のニューラルネットワークにおいて、誤差逆伝播法を適用してパラメータp′を算出してもよい。
【0066】
パラメータ更新手段14は、更新したパラメータp′をパラメータ記憶手段12に記憶する。このとき、パラメータ更新手段14は、アップサンプリング手段13に、新たなパラメータでアップサンプリングを行う旨を指示する。
さらに、パラメータ更新手段14は、初期状態または最初の入力画像Iが入力された直後において、動作モードとして学習モードを示すモード切替信号(例えば、m=0)を、切替手段10,15に出力する。
【0067】
このパラメータ更新手段14は、更新動作の回数が所定回数(例えば、100万回)に達した場合、入力画像Iと復元模擬画像I^との誤差が所定の基準に達した場合(所定値以下あるいは所定値未満となった場合)、更新動作回数に対する誤差の変化量が所定の基準に達した場合(所定値以下あるいは所定値未満となった場合)、あるいは、それらの組み合わせの基準に達した場合に、動作モードとして実行モードを示すモード切替信号(例えば、m=1)を、切替手段10,15に出力する。これによって、パラメータ更新手段14は、動作モードを学習モードから実行モードに切り替える。
【0068】
切替手段15は、動作モードによって、アップサンプリング手段13でアップサンプリングされた画像の出力先を切り替えるものである。
切替手段15は、パラメータ更新手段14から動作モードとしてモード切替信号を入力されることで画像の出力先を切り替える。
モード切替信号mが学習モードを示す(例えば、m=0)場合、切替手段15は、アップサンプリング後の画像(復元模擬画像I^)を、パラメータ更新手段14に出力する。一方、モード切替信号mが実行モードを示す(例えば、m=1)場合、切替手段15は、アップサンプリング後の画像(超解像画像J)を、超解像装置1の出力結果として外部に出力する。
【0069】
以上説明したように超解像装置1を構成することで、超解像装置1は、学習モードと実行モードとを順に動作させることで、入力画像の解像度に対してスケールが1階層異なる自己相似型の超解像を実現することができる。
これによって、超解像装置1は、入力画像を高品質に高解像度化することができる。
なお、超解像装置1は、コンピュータを、前記した各手段として機能させるためのプログラム(超解像プログラム)により動作させることができる。
【0070】
<超解像装置の動作>
次に、
図3,
図4を参照して、本発明の実施形態に係る超解像装置1の動作について説明する。
図3は、超解像装置1の学習モードの動作を示すフローチャートである。
図4は、超解像装置1の実行モードの動作を示すフローチャートである。
以下、超解像装置1における学習モードの動作と実行モードの動作とを順に説明する。
【0071】
(学習モードの動作)
まず、
図3を参照(構成については、適宜
図1,
図2参照)して、超解像装置1の学習モードの動作について説明する。なお、パラメータ記憶手段12には、予めパラメータの初期値が記憶されているものとする。
【0072】
ステップS1において、切替手段10および切替手段15は、初期動作として、パラメータ更新手段14からのモード切替信号により、動作モードを学習モードに設定する。これによって、切替手段10は、入力画像Iの出力先を、ダウンサンプリング手段11およびパラメータ更新手段14に切り替える。また、切替手段15は、アップサンプリング手段13の出力先をパラメータ更新手段14に切り替える。
ステップS2において、ダウンサンプリング手段11は、予め設定された超解像の拡大率の逆数倍で入力画像Iをダウンサンプリングし、低解像画像Dを生成する。
【0073】
ステップS3において、アップサンプリング手段13は、ステップS2で生成された低解像画像Dを、パラメータ記憶手段12に記憶されているパラメータを用いて、予め設定された超解像の拡大率でアップサンプリングし、復元模擬画像I^を生成する。
このステップS3では、アップサンプリング手段13は、内挿手段20によって、低解像画像Dに対して超解像の拡大率に応じた内挿処理を行うことで、補間画像を生成する。
そして、アップサンプリング手段13は、畳み込み手段21と、活性化関数適用手段22と、加算手段23とで構成されるニューラルネットワークにより、補間画像から復元模擬画像I^を生成する。
【0074】
ステップS4において、パラメータ更新手段14は、入力画像IとステップS3で生成した復元模擬画像I^との誤差をより小さくするようにパラメータを更新し、パラメータ記憶手段12に記憶する。ここでは、パラメータ更新手段14は、例えば、誤差逆伝播法を用いてパラメータを更新する。
【0075】
ステップS5において、パラメータ更新手段14は、更新動作の回数が所定回数に達した等の予め定めた基準でパラメータの学習の終了を判定する。
ここで、パラメータの学習が終了したと判定されなかった場合(ステップS5でNo)、超解像装置1は、ステップS3に戻って、更新後のパラメータを用いてアップサンプリングを行い、順次、パラメータの更新を行う処理を行う。
一方、パラメータの学習が終了したと判定された場合(ステップS5でYes)、超解像装置1は、学習モードでの動作を終了し、後記する
図4で説明する実行モードの動作に移行する。
以上の動作によって、超解像装置1は、入力画像を超解像するための自己相似性を仮定したパラメータを学習することができる。
【0076】
(実行モードの動作)
次に、
図4を参照(構成については、適宜
図1,
図2参照)して、超解像装置1の実行モードの動作について説明する。
【0077】
ステップS10において、パラメータ更新手段14は、モード切替信号により、切替手段10および切替手段15に対して、動作モードを実行モードに設定する。これによって、切替手段10は、入力画像Iの出力先を、アップサンプリング手段13に切り替える。また、切替手段15は、アップサンプリング手段13の出力先を外部に切り替える。
【0078】
ステップS11において、アップサンプリング手段13は、入力画像Iを、パラメータ記憶手段12に記憶されているパラメータを用いて、予め設定された超解像の拡大率でアップサンプリングし、超解像画像Jを生成する。
このステップS11では、アップサンプリング手段13は、内挿手段20によって、入力画像Iに対して超解像の拡大率に応じた内挿処理を行うことで、補間画像を生成する。
そして、アップサンプリング手段13は、畳み込み手段21と、活性化関数適用手段22と、加算手段23とで構成されるニューラルネットワークにより、補間画像から超解像画像Jを生成する。
【0079】
以上の動作によって、超解像装置1は、自己相似性を仮定したパラメータを用いて、入力画像から高精細な超解像画像を生成することができる。
また、超解像装置1は、自己相似性を仮定したパラメータを用いるため、入力画像が自己相似性を有する画像の場合、例えば、画像中に直線等の同様の幾何学的パターンや、植物の葉、海岸線等の同様の形状のパターンが含まれている場合、さらに、高精細に画像を超解像化することができる。
【0080】
以上、本発明の実施形態に係る超解像装置1の構成および動作について説明したが、本発明は、この実施形態に限定されるものではない。
ここでは、アップサンプリング手段13をニューラルネットワークで構成したが、デジタルフィルタを用いて実現してもよい。
その場合、アップサンプリング手段13は、
図5に示すように、内挿手段20と、複数の畳み込み手段21(21
1~21
8)で構成したアップサンプリング手段13Bとすればよい。
内挿手段20および畳み込み手段21は、
図2で説明したものと同じ構成であるため説明を省略する。この内挿手段20は省略しても構わない。
なお、畳み込み手段21において、前記式(8)で説明した4階テンソルAおよび1階テンソルBが、デジタルフィルタのタップ係数列で、パラメータpに相当する。
【0081】
この場合、パラメータ更新手段14は、前の動作時点と現在の動作時点とにおける入力画像Iと復元模擬画像I^との誤差が小さくなったか否かに応じてパラメータpを更新する。例えば、パラメータ更新手段14は、誤差が小さくなった場合、前の動作時点と同様の更新の方向性、例えば、パラメータの成分ごとの値の変化における符号(増減)やその変化量を、前の動作時点で行った更新と同様にして、パラメータpを更新する。また、パラメータ更新手段14は、誤差が小さくならなかった場合、前の動作時点とは異なる更新の方向性、例えば、パラメータの成分ごとの値の変化の符号を反転、あるいは、変化量の絶対値を小さくして、パラメータpを更新する。
【0082】
また、ここでは、超解像装置1への入力信号を、2次元の画像として説明した。
しかし、入力信号は、2次元の画像に限定されるものではない。
例えば、入力信号は、2次元の画像をフレームとして構成する映像であっても構わない。また、例えば、入力信号は、標本化方向が3次元である立体画像や立体映像であっても構わない。また、例えば、入力信号は、標本化方向が1次元である音声信号であっても構わない。なお、これらの信号は、標本化方向であるダウンサンプリングやアップサンプリングの標本化対象が増減するだけで、処理内容は、入力信号を2次元の画像とした場合と同様である。例えば、3次元の立体画像を入力信号とする場合、前記式(8),式(9)において、p,qおよびw,hにそれぞれさらに1次元の変数を追加すればよい。
これによって、超解像装置1は、2次元画像だけでなく、映像、立体画像、立体映像、音声についても超解像化することができる。
【符号の説明】
【0083】
1 超解像装置
10 切替手段(第1切替手段)
11 ダウンサンプリング手段
12 パラメータ記憶手段
13,13B アップサンプリング手段
14 パラメータ更新手段
15 切替手段(第2切替手段)
20 内挿手段
211,…,218 畳み込み手段
221,…,228 活性化関数適用手段
231,…,238 加算手段