【文献】
松尾康孝、三須俊枝、岩村俊輔、境田慎一,パラメータ最適化を伴う階調削減と階調復元を用いた超高精細映像符号化の検討,画像符号化シンポジウム 第27回シンポジウム資料,2012年10月24日,第7〜8頁
(58)【調査した分野】(Int.Cl.,DB名)
前記空間拡大部は、ウェーブレット変換を用いて前記局部復号画像を水平方向及び垂直方向に各2倍の超解像処理を再帰的に行うことにより前記l種類の解像度に空間拡大処理することを特徴とする、請求項3に記載の符号化装置。
前記階調補間部は、前記空間拡大画像の階調数を前記原画像の階調数に拡大し、m種類の縮小劣化過程を模擬したフィルタを用いて畳み込むことにより中間階調を補間し、その後、解像度が前記原画像の解像度となるように縮小処理することを特徴とする、請求項4に記載の符号化装置。
前記最適化部は、前記j×k×l×m枚の空間・階調復元画像と前記原画像とのPSNR値又はSSIM値を算出し、該PSNR値又はSSIM値が最小となる空間・階調復元画像を前記最も劣化の少ない空間・階調復元画像として決定することを特徴とする、請求項1から5のいずれか一項に記載の符号化装置。
【発明を実施するための形態】
【0022】
まず、本発明の概要について説明する。以下の説明において、画像の階調数を削減(階調削減処理)し、且つ解像度(標本化周波数)を縮小(空間縮小処理)することを「空間・階調削減処理」といい、空間・階調削減処理された画像のことを「空間・階調削減画像」という。また、画像の解像度を拡大(空間拡大処理)し、且つ画像の階調数を拡大(階調補間処理)することを「空間・階調復元処理」といい、空間・階調復元処理された画像のことを「空間・階調復元画像」という。
【0023】
図1は、本発明に係る符号化装置の処理の概要を説明する図である。
図1に示す例では、「8K×4K解像度、10bit階調」の原画像から「4K×2K解像度、8bit階調」の空間・階調削減画像を生成し、この空間・階調削減画像の最適な符号化信号を生成する際の処理概要を示している。本発明に係る符号化装置は、原画像をまず空間・階調削減処理して「4K×2K解像度、8bit階調」の複数の空間・階調削減画像を生成し、この複数の階調削減画像を符号化して符号化信号を作成する。
【0024】
次に、最適な符号化信号を決定するために、符号化信号を局部復号して「4K×2K解像度、8bit階調」の局部復号画像を生成する。さらに、局部復号画像を空間・階調復元処理して「8K×4K解像度、10bit階調」の空間・階調復元画像を複数生成する。そして、原画像を基準として、空間・階調削減処理及び空間・階調復元処理に用いたパラメータを一元的に最適化し、最適なパラメータを最適補助情報として選択する。最後に、最適補助情報、及び該最適補助情報に対応する符号化信号を復号側へ出力する。
【0025】
以下、本発明の実施形態について、詳細に説明する。
【0026】
(第1の実施形態)
図2は、本発明の第1の実施形態に係る符号化装置の構成例を示すブロック図である。
図2に示す例では、符号化装置1は、空間・階調削減部10と、符号化部20と、局部復号部30と、空間・階調復元部40と、最適化部50とを備える。
【0027】
空間・階調削減部10は、原画像を階調削減処理して階調を削減するとともに、空間縮小処理して解像度を縮小し、1以上の空間・階調削減画像を生成し、符号化部20に出力する。空間・階調削減部10は、空間・階調削減画像を1以上生成するために、j個(j≧1)のパラメータを用いて階調削減処理するとともに、k個(k≧1)のパラメータを用いて空間縮小処理し、その結果j×k枚の空間・階調削減画像を生成する。空間・階調削減部10は、階調削減部11と、空間縮小部12とを備える。
【0028】
階調削減部11は、原画像をj個のパラメータを用いて階調削減処理して、j枚の階調削減画像を生成し、空間縮小部12に出力する。階調削減処理は、既知の手法である階調数の単純削減やLloyd-Max法などにより行う。
【0029】
例えばn種類のルックアップテーブルを参照することにより階調削減処理を行う場合には、j=nとなる。階調削減部11は、階調削減処理に用いたパラメータに関する情報を補助情報として最適化部50に出力する。
【0030】
空間縮小部12は、階調削減部11により生成されたj枚の階調削減画像を、それぞれk個のパラメータを用いて空間縮小処理して、j×k枚の空間・階調削減画像を生成する。空間縮小処理は、既知の手法である画素の単純間引きやウェーブレット分解などにより行う。
【0031】
また、空間縮小部12は、階調削減部11により生成されたj枚の階調削減画像をそれぞれ平滑化処理した後、画素を単純間引きしてもよい。平滑化は、解像度の縮小劣化過程(ぼやけ)を模擬したフィルタを用いて階調拡大画像を畳み込むことで処理する。解像度の縮小劣化過程を模擬したフィルタとして、例えば、点拡がり関数(PSF:Point spread function)又はガウシアン関数を用いることができる。
【0032】
例えばn種類のフィルタを用いて空間縮小処理を行う場合には、k=nとなる。空間縮小部12は、階調削減処理に用いたパラメータに関する情報を補助情報として最適化部50に出力する。平滑化処理を行う場合には、用いた関数のタップ数、分散値、及びゲイン情報を補助情報とする。
【0033】
符号化部20は、空間・階調削減部10により生成された1以上(j×k)の空間・階調削減画像をそれぞれ符号化して1以上の符号化信号を生成し、局部復号部30に出力する。符号化は、AVC/H.264やHEVC/H.265などの既知の方式により行われる。
【0034】
局部復号部30は、符号化部20により生成された1以上(j×k)の符号化信号をそれぞれ局部復号して1以上の局部復号画像を生成し、空間・階調復元部40に出力する。局部復号は、符号化と同じAVC/H.264やHEVC/H.265などの既知の方式により行われる。
【0035】
空間・階調復元部40は、局部復号部30により生成された1以上(j×k)の局部復号画像をそれぞれ空間拡大処理及び階調補間処理し、原画像と同じ解像度及び階調数を有する空間・階調復元画像を複数枚生成し、最適化部50に出力する。空間・階調復元部40は、j×k枚の局部復号画像に対し、l個(l≧1)のパラメータを用いて空間拡大処理するとともに、m個(m≧1)のパラメータを用いて階調補間処理し、その結果j×k×l×m(但し、j×k×l×m≧2)枚の空間・階調復元画像を生成する。空間・階調復元部40は、空間拡大部41と、階調補間部42とを備える。
【0036】
空間拡大部41は、局部復号部30により生成されたj×k枚の局部復号画像を、それぞれl個のパラメータを用いて原画像の解像度まで空間拡大処理してj×k×l枚の空間拡大画像を生成し、階調補間部42に出力する。空間拡大処理は、既知の手法であるbi-cubic、Lanczos-3などの線形フィルタやウェーブレットフィルタを用いて行われる。
【0037】
例えばn種類のフィルタを用いて空間拡大処理を行う場合には、l=nとなる。空間拡大部41は、空間拡大処理に用いたパラメータに関する情報を補助情報として最適化部50に出力する。
【0038】
階調補間部42は、空間拡大部41により生成されたj×k×l枚の空間拡大画像を、それぞれm個のパラメータを用いて原画像の階調数まで階調補間処理してj×k×l×m枚の空間・階調復元画像を生成する。階調補間処理は、既知の手法である階調数の単純拡大により行われる。
【0039】
例えばn種類のルックアップテーブルを参照することにより階調補間処理を行う場合には、m=nとなる。階調補間部42は、階調補間処理に用いたパラメータに関する情報を補助情報として最適化部50に出力する。
【0040】
最適化部50は、空間・階調復元部40により生成された複数の空間・階調復元画像から、原画像と比較して最も劣化の少ない(最も差分の少ない)空間・階調復元画像を決定し、該空間・階調復元画像に対応する符号化信号を出力する。
【0041】
例えば、原画像と空間階調復元画像との差分は、原画像を基準としたPSNR(Peak Signal to Noise Ratio)値で計算することができる。PSNRは、画像の最大階調数をMAX(例えば8bit深度画像の場合は256)とすると、式(1)により算出される。式(1)における平均二乗誤差MSEは、水平m画素、垂直nラインの基準画像Iと評価画像Kにおいて、式(2)により求まる。
【0043】
また、最適化部50は、PSNRによる評価の他に、視覚特性を考慮してPSNRよりも人間の主観画質評価結果に近いといわれるSSIM(Structural Similarity)値で計算してもよい。SSIMは、基準画像及び評価画像の平均μ
1,μ
2、分散σ
x2,σ
y2、共分散2σ
xyを用いて、式(3)により算出される。式(3)におけるC
1,C
2は式(4)により算出される。ここで、K
1,K
2は定数であり、通常0.01,0.03が使われる。また、Lは画像のダイナミックレンジであり、通常8bit深度画像では255が使われる。
【0045】
また、最適化部50は、空間・階調削減部10及び空間・階調復元部40により生成された補助情報を入力し、決定した局部復号画像に対応する補助情報を、最適補助情報として出力する。最適補助情報を出力することにより、該最適補助情報及び符号化信号を用いて、原画像を復元することができるようになる。なお、符号化部20により生成された複数の符号化信号と、空間・階調削減部10及び空間・階調復元部40により生成された補助情報を最適化部50に直接入力させるのではなく、いったん記憶部(図示せず)に記憶し、決定した局部復号画像に対応する符号化信号及び補助情報を記憶部から取得するようにしてもよい。
【0046】
以上説明したように、符号化装置1は、階調削減部11により原画像をj個のパラメータを用いて階調削減処理してj枚の階調削減画像を生成するとともに、空間縮小部12により階調削減画像をk個のパラメータを用いて空間縮小処理してj×k枚の空間・階調削減画像を生成する。そして、符号化部20によりj×k枚の空間・階調削減画像を符号化してj×k種類の符号化信号を生成し、局部復号部30によりj×k種類の符号化信号を局部復号してj×k枚の局部復号画像を生成する。続いて、空間拡大部41によりj×k枚の局部復号画像をそれぞれl個のパラメータを用いて空間拡大処理してj×k×l枚の空間拡大画像を生成するとともに、階調補間部42によりj×k×l枚の空間拡大画像をそれぞれm個のパラメータを用いて階調補間処理してj×k×l×m枚の空間・階調復元画像を生成する。最後に、最適化部50によりj×k×l×m枚の空間・階調復元画像を前記原画像と比較して、最も劣化の少ない空間・階調復元画像を決定し、j×k種類の符号化信号のうち該最も劣化の少ない空間・階調復元画像に対応する符号化信号を出力する。このため、符号化装置1によれば、空間縮小処理、階調削減処理、空間拡大処理、及び階調補間処理を一元的に最適化することができ、高画質を維持しつつ、符号化信号のビットレートを大幅に低減することができるようになる。
【0047】
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第2の実施形態では、第1の実施形態と異なる手法により階調削減処理を行う。階調削減処理は、階調数の単純削減では画像劣化が大きい。また、Lloyd-Max法では度数が高い階調値に多くの階調を割り当てて階調削減を行うため、原画像と階調削減画像との誤差を最小化するという観点からは最適な階調削減方法といえるが、視覚的かつ信号処理の観点からは最適な階調削減とはいえない。なぜなら、Lloyd-Max法では例えば雑音が支配的な階調値においても、その度数が高ければ多くの階調を割り当てて階調削減を行ってしまうからである。そこで、第2の実施形態では、雑音、グラデーション、又は双方を考慮して階調削減処理を行う。
【0048】
第2の実施形態に係る符号化装置2の概略構成は
図2に示したとおりであり、階調削減処理のみ異なる。そこで、以下は、符号化装置2における階調削減部11の処理内容についてのみ説明する。
【0049】
図3は、符号化装置2における階調削減部11の構成例を示すブロック図である。
図3に示す例では、階調削減部11は、周波数分解部111と、雑音閾値決定部112と、雑音除去画像生成部113と、グラデーション閾値決定部114と、グラデーション画像生成部115と、階調削減初期情報生成部116と、階調決定部117とを備える。ここでは、雑音及びグラデーションの双方を考慮する場合について説明するが、雑音閾値決定部112及び雑音除去画像生成部113を備えないで原画像のグラデーションのみを考慮するようにしてもよく、また、グラデーション閾値決定部114及びグラデーション画像生成部115を備えないで原画像の雑音のみを考慮するようにしてもよい。
【0050】
周波数分解部111は、原画像を周波数分解(例えば、ウェーブレットパケット分解)して、複数の周波数帯域成分を生成し、雑音閾値決定部112及び雑音除去画像生成部113に出力する。周波数帯域成分を解析することにより、後述するように雑音閾値及びグラデーション閾値を決定する。以下では、説明の便宜上、周波数分解成分のように周波数帯域毎に分解された画像を構成する最小単位を「要素」と称し、原画像のように周波数分解されていない画像を構成する最小単位を「画素」と称して、両者を区別することとする。
【0051】
図4は、周波数分解部111による空間方向の周波数分解処理を説明する図である。
図4では、原画像を空間方向に2階ウェーブレットパケット分解した場合の分解図を示しており、太線は1階ウェーブレットパケット分解の各周波数帯域を示している。
図4に示すウェーブレットパケット分解の例では、低周波側、高周波側を空間方向に均等に周波数分解している。この分解図では空間周波数成分を、水平方向においては右側ほど高周波成分とし、垂直方向においては下側ほど高周波成分としている。よって、
図4に示すように、左上は空間最低周波数帯域成分(周波数分解部111により生成された複数の周波数分解成分のうち最も周波数が低い帯域成分)となり、右下は空間最高周波数帯域成分(周波数分解部111により生成された複数の周波数分解成分のうち最も周波数が高い帯域成分)となる。なお、空間方向に加えて時間方向に周波数分解を行ってもよい。
【0052】
図4では説明の便宜上、デシメーション有りでウェーブレットパケット分解を行った場合の分解図を示しているが、後述する孤立点検出部1131にて原画像の画素単位で孤立点(雑音)を除去することができるようにするために、周波数分解部111はデシメーション無し(すなわち、周波数帯域成分の画像サイズの縮小無し)で周波数分解を行い、生成される各周波数帯域成分の画像サイズを同一としてもよい。
【0053】
雑音閾値決定部112は、周波数分解部111により生成された周波数分解成分の全帯域成分に対する空間最高周波数帯域成分のパワーの割合(以下、「空間最高周波数帯域成分の割合」という)を、各要素位置について算出する。そして、雑音閾値決定部112は、空間最高周波数帯域成分の割合の平均値を基準として、複数の空間最高周波数帯域成分の割合を雑音閾値として決定し、雑音除去画像生成部113に出力する。例えば、0%から、空間最高周波数帯域成分の割合の平均値までをa等分した複数の値を雑音閾値として決定する。この場合、空間最高周波数帯域成分の割合の平均値が10%、a=5とすると、2%、4%、6%、8%、10%が雑音閾値となる。雑音閾値決定部112により決定された雑音閾値は、補助情報(パラメータ情報)として最適化部50に出力される。
【0054】
雑音除去画像生成部113は、周波数分解部111により生成された周波数帯域成分、及び雑音閾値決定部112により決定された雑音閾値を用いて原画像の孤立点を検出し、該孤立点を雑音とみなす。そして、原画像から雑音が除去された雑音除去画像を生成し、階調削減初期情報生成部116に出力する。
【0055】
図5は、雑音除去画像生成部113の構成例を示すブロック図である。
図5に示すように、雑音除去画像生成部113は、孤立点検出部1131と、再構成部1132とを備える。
【0056】
孤立点検出部1131は、周波数分解部111により生成された周波数帯域成分を解析して原画像の孤立点を検出する。具体的には、孤立点検出部1131は、空間最高周波数帯域成分の割合を各要素位置について算出する。そして、孤立点検出部1131は、雑音閾値決定部112により決定された複数の雑音閾値のうちの1つを選択し、算出した空間最高周波数帯域成分の割合が選択した雑音閾値Th
1を超える要素の値を1とし、雑音閾値Th
1以下の要素の値を0とする2値化画像Bを生成する。
【0057】
孤立点検出部1131は、2値化画像Bの要素値が1である要素について、該要素を中心とする所定の判定領域内の要素値の合計値と、所定の閾値Th
2とを比較する。2値化画像Bの判定領域内の要素値の合計値が閾値Th
2を超える場合には、当該要素は孤立点要素ではないと判定し、2値化画像Bの判定領域内の要素値の合計値が閾値Th
2以下である場合には、当該要素を孤立点要素と判定し、孤立点要素に対応する原画像の画素を孤立点と判定する。
【0058】
図6は、孤立点検出部1131による孤立点判定処理を説明する図である。
図6に示す例では、判定領域は3×3要素である。閾値Th
2を1とすると、2値化画像Bの要素値が1となる要素素の周囲の8要素の要素値が0であるときのみ、2値化画像Bの要素値が1である要素を孤立要素とみなす。よって、閾値Th
2=1の場合、図中の要素P1は孤立点要素であると判定され、要素P2と要素P3は孤立点要素と判定されない。
【0059】
そして、孤立点検出部1131は、各周波数帯域成分について、孤立点要素であると判定した要素位置の要素値を0とし、再構成部1132に出力する。ただし、直流成分に雑音が含まれる場合には孤立点要素として検出されないおそれがあるため、直流成分を有する空間最低周波数帯域成分については階調値を変更しないようにするのが好適である。
【0060】
再構成部1132は、孤立点検出部1131から入力される孤立点検出後の周波数帯域成分を用いて再構成処理を行い、雑音除去画像を生成し、階調削減初期情報生成部116に出力する。例えば、周波数分解部111においてn階ウェーブレットパケット分解を行って周波数帯域成分を生成していた場合には、孤立点検出後の周波数帯域成分をn階ウェーブレットパケット再構成する。
【0061】
グラデーション閾値決定部114は、周波数分解部111により生成された周波数分解成分の全帯域成分に対する空間最低周波数帯域成分のパワーの割合(以下、「空間最低周波数帯域成分の割合」という)を、各要素位置について算出する。そして、グラデーション閾値決定部114は、空間最低周波数帯域成分の割合の平均値を基準として、複数の空間最低周波数帯域成分の割合をグラデーション閾値として決定し、グラデーション画像生成部115に出力する。例えば、空間最低周波数帯域成分の割合の平均値から100%までをb等分した複数の値をグラデーション閾値として決定する。この場合、空間最低周波数帯域成分の割合平均値が90%、b=5とすると、90%、92%、94%、96%、98%がグラデーション閾値となる。グラデーション閾値決定部114により決定されたグラデーション閾値は、補助情報として最適化部50に出力される。
【0062】
グラデーション画像生成部115は、周波数分解部111により生成された周波数帯域成分、及びグラデーション閾値決定部114により決定されたグラデーション閾値を用いて原画像のグラデーション領域を検出し、該グラデーション領域のみからなるグラデーション画像を生成する。そして、グラデーション画像を階調削減初期情報生成部116に出力する。
【0063】
図7は、グラデーション画像生成部115の構成例を示すブロック図である。
図7に示すように、グラデーション画像生成部115は、グラデーション領域検出部1151と、再構成部1152とを備える。
【0064】
グラデーション領域検出部1151は、周波数分解部111により生成された周波数帯域成分を解析して原画像のグラデーション領域を検出する。具体的には、グラデーション領域検出部1151は、空間最低周波数帯域成分の割合を各要素位置について算出する。そして、グラデーション領域検出部1151は、グラデーション閾値決定部114により決定された複数のグラデーション閾値のうちの1つを選択し、算出した空間最低周波数帯域成分の割合が選択したグラデーション閾値を超える領域をグラデーション領域と決定する。そして、グラデーション領域のみからなる画像を、再構成部1152に出力する。
【0065】
再構成部1152は、グラデーション領域検出部1151から入力されるグラデーション領域検出後の周波数帯域成分を用いて再構成処理を行い、グラデーション画像を生成し、階調削減初期情報生成部116に出力する。例えば、周波数分解部111においてn階ウェーブレットパケット分解を行って周波数帯域成分を生成していた場合には、グラデーション領域検出後の周波数帯域成分をn階ウェーブレット再構成する。
【0066】
階調削減初期情報生成部116は、雑音除去画像生成部113により生成された雑音除去画像、及びグラデーション画像生成部115により生成されたグラデーション画像に基づいて訓練データを生成するとともに、階調削減率(階調削減ビット数)に基づく階調変換テーブルを生成する。そして、訓練データ及び階調変換テーブルを階調決定部117に出力する。
【0067】
図8は、階調削減初期情報生成部116の構成例を示すブロック図である。
図8に示すように、階調削減初期情報生成部116は、ヒストグラム生成部1161と、重み付け部1162と、階調変換テーブル生成部1163とを備える。
【0068】
ヒストグラム生成部1161は、雑音除去画像生成部113により生成された雑音除去画像について階調値ごとの度数を示すヒストグラムを訓練データとして生成し、階調決定部117に出力する。
【0069】
重み付け部1162は、グラデーション画像生成部115により生成されたグラデーション画像の階調値を検出し、ヒストグラム生成部1161により生成された雑音除去画像のヒストグラムに対して、グラデーション画像の階調値の度数が高くなるように重み付けする。そして、重み付けしたヒストグラムを訓練データとして階調決定部117に出力する。例えば、グラデーション画像の階調値の度数を、所定の1を超える値(例えば、1.2)を乗じた値に変更する。なお、度数の高いグラデーション画像の階調値ほど重みを大きくするようにしてもよい。重み付けしたヒストグラムを訓練データとすることにより、階調決定部117にて階調削減を行う際に、グラデーション領域に、より多くの階調を割り当てることができる。
【0070】
階調変換テーブル生成部1163は、階調削減率に応じて階調変換テーブルを生成し、階調決定部117に出力する。階調変換テーブルは、原画像の色深度がnビット(階調数2
n)、階調削減ビット数がmビットの場合、nビットを(n−m)ビットに線形変換する階調変換テーブルである。
【0071】
図9は、階調削減部10がグラデーション閾値決定部114及びグラデーション画像生成部115を備えない場合の階調削減初期情報生成部116の構成例を示すブロック図である。この場合、ヒストグラム生成部1161は、雑音除去画像生成部113により生成された雑音除去画像について階調値ごとの度数を示すヒストグラムを訓練データとして生成する。階調変換テーブル生成部1163は、階調削減率に応じて階調変換テーブルを生成する。
【0072】
図10は、階調削減部10が雑音閾値決定部112及び雑音除去画像生成部113を備えない場合の階調削減初期情報生成部116の構成例を示すブロック図である。この場合、ヒストグラム生成部1161は、原画像について階調値ごとの度数を示すヒストグラムを生成し、重み付け部1162に出力する。重み付け部1162は、グラデーション画像生成部115により生成されたグラデーション画像の階調値を検出し、ヒストグラム生成部1161により生成された原画像のヒストグラムに対して、グラデーション画像の度数が高くなるように重み付けし、重み付けしたヒストグラムを訓練データとする。階調変換テーブル生成部1163は、階調削減率に応じて階調変換テーブルを生成する。
【0073】
階調決定部117は、階調削減初期情報生成部116により生成された訓練データ及び階調変換テーブルを初期値として用いるLloyd-Max法により、原画像の階調を削減した階調削減画像を生成する。階調決定部117は、訓練データの度数に応じて各階調の量子化ステップを決定して階調削減画像を生成した後、階調削減画像を逆階調変換して原画像と同じ階調数の画像を生成する。そして、原画像と逆階調変換した画像との差分値が所定の閾値以下となるまで、訓練データ、及び階調変換テーブルを更新し、階調削減処理を繰り返し行う。Lloyd-Max法によれば、度数の高い階調ほど量子化ステップを小さくするため、原画像と階調削減画像との誤差を小さくすることができる。
【0074】
また、階調決定部117は、生成した階調削減部を元の階調数に復元するための逆量子化テーブルを生成し、補助情報として最適化部50に出力する。ここで、逆量子化テーブルとは、階調削減画像を生成した際の階調変換テーブルの入力値を出力値とし、階調変換テーブルの出力値を入力値としたテーブルである。
【0075】
雑音除去画像生成部113は、雑音閾値決定部112により決定された雑音閾値ごとに雑音除去画像を生成する。また、グラデーション画像生成部115は、グラデーション閾値決定部114により決定されたグラデーション閾値ごとにグラデーション画像を生成する。よって、雑音閾値決定部112により決定された雑音閾値がa個、グラデーション閾値決定部114により決定されたグラデーション閾値がb個の場合には、階調削減初期情報生成部116によりa×b種類の訓練データが生成され、階調決定部117によりa×b種類の階調削減画像(階調削減画像群)が生成される。
【0076】
以上説明したように、符号化装置2においては、前記階調削減部10は、j個の雑音閾値を用いて、原画像から孤立点を除去したj枚の雑音除去画像を生成するか、又はj個のグラデーション閾値を用いて、原画像のグラデーション領域のみからなるj枚のグラデーション画像を生成する画像生成部(雑音除去画像生成部113又はグラデーション画像生成部115)と、雑音除去画像又は原画像のヒストグラムに対して、グラデーション画像の階調値の度数が高くなるように重み付けしたヒストグラムを訓練データとして用いるLloyd-Max法により、原画像の階調を削減したj枚の階調削減画像を生成する階調決定部117と、を備える。このように、雑音又はグラデーションを考慮して階調変換することにより、視覚的かつ信号処理的に優れ、画像ごとに最適化された階調削減を行うことができ、実施例1の符号化装置1に比べて更に高精度な符号化信号を生成することができる。また、空間縮小前に階調削減を行うことで、不要な雑音成分が折り返し成分として空間削減画像に含まれるのを防止することができる。
【0077】
なお、雑音及びグラデーションの双方を考慮する場合には、雑音除去画像生成部113によりa個の雑音閾値を用いて、原画像から孤立点を除去したa枚の雑音除去画像を生成し、b個のグラデーション閾値を用いて、原画像のグラデーション領域のみからなるb枚のグラデーション画像を生成し、階調決定部117によりj=a×b枚の階調削減画像を生成する。
【0078】
(第3の実施形態)
次に、第2の実施形態の階調削減処理の変形例について、第3の実施形態として説明する。第2の実施形態では原画像を解析して閾値を決定したが、第3の実施形態では空間縮小率及び/又は階調削減率から閾値を決定する。第3の実施形態に係る符号化装置3の概略構成は
図2に示したとおりであり、階調削減処理のみ異なる。そこで、以下は、符号化装置3における階調削減部11の処理内容についてのみ説明する。
【0079】
図11は、本発明の第3の実施形態に係る符号化装置3における階調削減部の構成を示すブロック図である。
図11に示す例では、階調削減部11は、階調削減閾値決定部118と、周波数分解部111と、雑音除去画像生成部113と、グラデーション画像生成部115と、階調削減初期情報生成部116と、階調決定部117とを備える。ここでは、雑音及びグラデーションの双方を考慮する場合について説明するが、雑音閾値決定部112及び雑音除去画像生成部113を備えないで原画像のグラデーションのみを考慮するようにしてもよく、また、グラデーション閾値決定部114及びグラデーション画像生成部115を備えないで原画像の雑音のみを考慮するようにしてもよい。
【0080】
階調削減閾値決定部118は、空間縮小率及び/又は階調削減率に基づいて、雑音閾値及び/又はグラデーション閾値を決定する。ここでは、空間縮小率及び階調削減率に基づいて、雑音閾値及びグラデーション閾値を決定する場合について説明する。階調削減閾値決定部118は、決定した雑音閾値を雑音除去画像生成部113に出力し、決定したグラデーション閾値をグラデーション画像生成部115に出力する。
【0081】
階調削減閾値決定部118は、空間縮小率及び階調削減率と、雑音閾値及びグラデーション閾値とを対応付けた対応表を予め有する。対応表の例を表1に示す。空間縮小率と、雑音閾値及びグラデーション閾値との関係については、空間縮小率が高くなるほど、雑音閾値及びグラデーション閾値を小さくする。空間縮小率が高い場合は、雑音成分の折り返しによる影響は少なく、またグラデーション領域検出を高い精度で行う必要はないためである。また、階調削減率と、雑音閾値及びグラデーション閾値との関係については、階調削減率が高くなるほど、雑音閾値及びグラデーション閾値を大きくするのが好適である。階調削減率が高い場合は、雑音に階調を割り当てないように雑音除去閾値を高く設定する必要があり、また疑似輪郭防止のためにグラデーション領域検出閾値を高く設定する必要があるからである。つまり、表1では、N
1<N
2<N
3<N
4、G
1<G
2<G
3<G
4とする。
【0083】
表1の対応表を用いて雑音閾値及びグラデーション閾値を決定する場合、空間縮小処理に対する重みα、及び階調削減処理に対する重みβを用いるのが好適である。例えば、空間縮小率が1/2、階調削減率が1/8の場合に表1を用いて雑音閾値N及びグラデーション閾値Gを求めると、N=(αN
4+βN
3)/2、G=(αG
4+βG
3)/2となる。空間縮小処理の精度を重視する場合はαに大きな重みを与え、階調削減処理の精度を重視する場合はβに大きな重みを与える。なお、雑音閾値及びグラデーション閾値の組を複数組選択するようにしてもよい。
【0084】
雑音除去画像生成部113は、周波数分解部111により生成された周波数帯域成分、及び階調削減閾値決定部118により決定された雑音閾値を用いて原画像の孤立点を検出し、該孤立点を雑音とみなす。そして、原画像から雑音が除去された雑音除去画像を生成し、階調削減初期情報生成部116に出力する。
【0085】
グラデーション画像生成部115は、周波数分解部111により生成された周波数帯域成分、及び階調削減閾値決定部118により決定されたグラデーション閾値を用いて原画像のグラデーション領域を検出し、該グラデーション領域のみからなるグラデーション画像を生成する。そして、グラデーション画像を階調削減初期情報生成部116に出力する。
【0086】
階調削減初期情報生成部116は、雑音除去画像生成部113により生成された雑音除去画像、及びグラデーション画像生成部115により生成されたグラデーション画像に基づいて訓練データを生成するとともに、階調削減率に基づく階調変換テーブルを生成する。そして、訓練データ及び階調変換テーブルを階調決定部117に出力する。
【0087】
階調決定部117は、階調削減初期情報生成部116により生成された訓練データ及び階調変換テーブルを初期値として用いるLloyd-Max法により、原画像の階調を削減した階調削減画像を生成する。
【0088】
以上説明したように、符号化装置3は、雑音閾値又は前記グラデーション閾値を、該閾値と、空間縮小率又は階調削減率とを対応付けた対応表に基づいて決定する。このため、符号化装置3によれば、第2の実施形態の符号化装置2と同様の効果に加え、雑音閾値又は前記グラデーション閾値を迅速に決定して処理時間を短縮することができるようになる。
【0089】
(第4の実施形態)
次に、第4の実施形態について説明する。第4の実施形態では、第1の実施形態と異なる手法により空間・階調復元処理を行う。第4の実施形態に係る符号化装置4の概略構成は
図2に示したとおりである。そこで、以下は、符号化装置4における空間・階調復元部40の処理内容についてのみ説明する。
【0090】
局所復号画像を無限に高い解像度(標本化周波数)まで空間超解像(オーバーサンプリング)処理を行い、これを原画像の解像度まで縮小する時に階値補間処理を行えば、理想的な空間・階調復元処理となる。しかしこれは不可能なため、第4の実施形態では原画像の解像度以上の解像度まで局所復号画像を空間超解像処理して、これを原画像の解像度まで縮小する際に階調補間処理を行う。
【0091】
符号化装置4における空間拡大部41は、局部復号部30により生成されたj×k枚の局部復号画像を、それぞれ原画像の解像度以上のl種類の解像度まで空間超解像処理(空間オーバーサンプリング処理)して、原画像の解像度以上の解像度を有するj×k×l枚の空間拡大画像を生成し、階調補間部42に出力する。
【0092】
図12は、第4の実施形態に係る符号化装置4における空間拡大部41の構成例を示すブロック図である。
図12に示す例では、空間拡大部41は、オーバーサンプリング値決定部411と、オーバーサンプリング部412とを備える。
【0093】
オーバーサンプリング値決定部411は、空間拡大画像の解像度を示す空間オーバーサンプリング値を決定し、オーバーサンプリング部412に出力する。空間オーバーサンプリング値は、例えば、階調補間部42で階調数を△bit増加させる場合、水平方向及び垂直方向ともに原画像の解像度の2
(△+1)倍までの解像度とする。例えば局部復号画像の解像度及び階調数を「4K×2K、8bit」とし、原画像の解像度及び階調数を「8K×4K、10bit」とすると、階調数を2bit増加させるため、空間オーバーサンプリング値は水平方向及び垂直方向ともに原画像の解像度の2倍、4倍、8倍となる。
【0094】
なお、空間オーバーサンプリング値の最大値は原画像の解像度の2
(△+1)倍に限定されるものではない。また、空間オーバーサンプリング値が示す解像度が原画像の解像度と同一であってもよく、その場合には、後述する空間縮小処理は行わないこととなる。また、オーバーサンプリング値決定部411を設けずに、ユーザが空間オーバーサンプリング値を直接設定するようにしてもよい。
【0095】
オーバーサンプリング部412は、局部復号部30により生成された局部復号画像を、空間オーバーサンプリング値によって指定されたl種類の解像度まで空間オーバーサンプリング処理し、空間拡大画像を生成する。空間オーバーサンプリング処理を行う際には、局部復号画像を一気に高解像度にするのではなく、例えばウェーブレット変換を用いて水平方向・垂直方向各2倍の超解像処理を再帰的に行うことにより、空間拡大画像を生成するのが好適である。これにより原画像の折り返し成分を利用した高精度なオーバーサンプリングを行えるとともに、エッジのギザギザ感を抑制することができる。なお、ウェーブレット超解像処理については、例えば特開2011−234116号公報を参照されたい。
【0096】
符号化装置4における階調補間部42は、空間拡大部41により生成された空間拡大画像を階調数が原画像の階調数となるように階調補間処理を行うともに、原画像の解像度まで空間縮小処理を行って空間・階調復元画像を出力する。
【0097】
図13は、第4の実施形態に係る符号化装置4における階調補間部42の構成例を示すブロック図である。
図13に示す例では、階調補間部42は、空間拡大画像階調補間部421と、空間縮小部422とを備える。
【0098】
空間拡大画像階調補間部421は、空間拡大画像の階調数を原画像の階調数まで△bit増加させる場合、まず、単純に全画素の階調値を2
△倍に線形拡大した階調拡大画像を生成する。例えば△=2の場合、空間拡大画像内の各画素の階調値xを4xとする。
【0099】
次に、空間拡大画像階調補間部421は、階調拡大画像を平滑化処理して階調復元画像を生成し、空間縮小部422に出力する。具体的には、空間拡大画像階調補間部421は、解像度の縮小劣化過程(ぼやけ)を模擬したm種類のフィルタを用いて階調拡大画像を畳み込むことにより平滑化処理し、中間階調値を補間する。解像度の縮小劣化過程を模擬した関数として、例えば、点拡がり関数(PSF)又はガウシアン関数を用いることができる。また、空間拡大画像階調補間部421は、平滑化処理の代わりに、バイキュービック法、バイリニア法などにより階調拡大画像の中間階調値を補間してもよい。
【0100】
空間縮小部422は、空間拡大画像階調補間部421により生成された階調復元画像を原画像の解像度になるように空間縮小処理することで空間・階調復元画像を生成し、最適化部50に出力する。空間縮小処理は、単純間引きにより行ってもよいし、空間拡大画像階調補間部421により生成された階調超解像画像を原画像の解像度になるようウェーブレット分解し、その空間低周波数成分を空間・階調復元画像としてもよい。
【0101】
以上説明したように、符号化装置4は、空間拡大部41により、局部復号画像を原画像の解像度以上のl種類の解像度に空間拡大処理した後、階調補間部42により、空間拡大画像を、階調数が原画像の階調数となるように階調補間処理するとともに、解像度が原画像の解像度となるように空間縮小処理する。このため、符号化装置4によれば、実施例1の符号化装置1に比べて更に高精度な空間・階調復元画像を生成することができる。
【0102】
また、空間拡大部41は、ウェーブレット変換を用いて局部復号画像を水平方向及び垂直方向に各2倍の超解像処理を再帰的に行うことにより生成するのが好適である。これにより、折り返し成分を利用した高精度なオーバーサンプリングを行えるとともに、エッジのギザギザ感を抑制することができる。
【0103】
また、階調補間部42は、空間拡大画像の階調を原画像の階調数に拡大し、m種類の縮小劣化過程を模擬したフィルタを用いて畳み込むことにより中間階調を補間し、その後、解像度が前記原画像の解像度となるように縮小処理するのが好適である。これにより、高精度に中間階調値を補間することができる。
【0104】
なお、上述した符号化装置1,2,3,4として機能させるためにコンピュータを用いることができ、そのようなコンピュータは、符号化装置1,2,3,4の各機能を実現する処理内容を記述したプログラムを当該コンピュータの記憶部に格納しておき、当該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録することができる。
【0105】
上述の実施形態は、代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。