IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧 ▶ 一般財団法人NHKエンジニアリングシステムの特許一覧

<>
  • 特開-縮小装置及びプログラム 図1
  • 特開-縮小装置及びプログラム 図2
  • 特開-縮小装置及びプログラム 図3
  • 特開-縮小装置及びプログラム 図4
  • 特開-縮小装置及びプログラム 図5
  • 特開-縮小装置及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023122317
(43)【公開日】2023-09-01
(54)【発明の名称】縮小装置及びプログラム
(51)【国際特許分類】
   H04N 19/132 20140101AFI20230825BHJP
   H04N 7/01 20060101ALI20230825BHJP
   H04N 19/63 20140101ALI20230825BHJP
   H04N 19/154 20140101ALI20230825BHJP
   H04N 19/169 20140101ALI20230825BHJP
   H04N 1/387 20060101ALI20230825BHJP
   G06T 3/40 20060101ALI20230825BHJP
【FI】
H04N19/132
H04N7/01 170
H04N19/63
H04N19/154
H04N19/169 300
H04N1/387 101
G06T3/40 750
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022025960
(22)【出願日】2022-02-22
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(71)【出願人】
【識別番号】591053926
【氏名又は名称】一般財団法人NHKエンジニアリングシステム
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(72)【発明者】
【氏名】松尾 康孝
【テーマコード(参考)】
5B057
5C063
5C076
5C159
【Fターム(参考)】
5B057CA08
5B057CB08
5B057CC01
5B057CD05
5B057CG09
5C063AA10
5C063CA05
5C076AA22
5C076BA06
5C076BB40
5C159MA41
5C159MC00
5C159MC11
5C159TA41
5C159TB15
5C159TC28
5C159TD12
5C159UA02
(57)【要約】
【課題】高品質な縮小画像を生成する。
【解決手段】縮小装置1は、原画像に対して各周波数帯域が縮小画像の空間解像度以下となるまで空間方向の周波数帯域分解を行い、周波数帯域成分を生成する周波数分解部10と、縮小画像に対して符号化処理を行い、符号化情報を抽出する符号化情報抽出部13と、周波数帯域成分に対して符号化情報を用いて縮退処理を行い、縮退周波数帯域成分を生成する縮退処理部14と、縮退周波数帯域成分に対して周波数再構成を行い、原画像と同じサイズの縮退画像を生成する周波数再構成部15と、縮退画像の縮小画像を生成する空間解像度縮小部16とを備え、縮退処理部14は、最低周波数帯域を超え且つ縮小画像の空間解像度以下の周波数帯域においては、量子化パラメータが閾値以上となる符号化ブロック位置の縮退率を、量子化パラメータが閾値未満となる符号化ブロック位置の縮退率よりも高くする。
【選択図】図1
【特許請求の範囲】
【請求項1】
原画像の縮小画像を生成する縮小装置であって、
前記原画像に対して位相情報を保持しながら、各周波数帯域が前記縮小画像の空間解像度以下となるまで空間方向の周波数帯域分解を行い、周波数帯域成分を生成する周波数分解部と、
前記縮小画像に対して符号化処理を行い、符号化ブロック毎に、符号化に用いられた量子化パラメータを含む符号化情報を抽出する符号化情報抽出部と、
前記周波数帯域成分に対して、前記符号化情報を用いて縮退処理を行い、成分が縮退された縮退周波数帯域成分を生成する縮退処理部と、
前記縮退周波数帯域成分に対して、周波数再構成を行い、原画像と同じサイズの縮退画像を生成する周波数再構成部と、
前記縮退画像の空間解像度を縮小した縮小画像を生成する空間解像度縮小部と、
を備え、
前記縮退処理部は、最低周波数帯域においては縮退処理を行わず、前記最低周波数帯域を超え且つ前記縮小画像の空間解像度以下の周波数帯域においては、前記量子化パラメータが第1閾値以上となる符号化ブロック位置の縮退率を、前記量子化パラメータが前記第1閾値未満となる符号化ブロック位置の縮退率よりも高くする縮小装置。
【請求項2】
前記縮退処理部は、前記周波数帯域成分のうち、前記縮小画像の空間解像度を超える周波数帯域の縮退率を最も高くする、請求項1に記載の縮小装置。
【請求項3】
前記符号化情報抽出部、前記縮退処理部、前記周波数再構成部、及び前記空間解像度縮小部による処理は、前記量子化パラメータが第2閾値よりも小さくなるまで繰り返し行われる、請求項1又は2に記載の縮小装置。
【請求項4】
前記周波数帯域成分のうち、対角方向の最高周波数帯域成分を用いて雑音レベルを算出する雑音レベル設定部を更に備え、
前記縮退処理部は、前記雑音レベル以下の前記周波数帯域成分の縮退率を、前記雑音レベルを超える前記周波数帯域成分の縮退率よりも高くする、請求項1から3のいずれか一項に記載の縮小装置。
【請求項5】
前記縮退処理部は、絶対値が上位から所定の順位に含まれる時空間周波数帯域成分の縮退率を、絶対値が前記所定の順位に含まれない時空間周波数帯域成分の縮退率よりも高くする、請求項1から4のいずれか一項に記載の縮小装置。
【請求項6】
前記周波数分解部は、前記原画像に対して、時間方向にも周波数帯域分解を行い、前記周波数帯域成分を生成する、請求項1から5のいずれか一項に記載の縮小装置。
【請求項7】
前記縮退処理部は、前記最低周波数帯域を超え且つ前記縮小画像の空間解像度以下の周波数帯域において、時間方向の周波帯域成分が第3閾値を超える場合に縮退処理を行う、請求項6に記載の縮小装置。
【請求項8】
コンピュータを、請求項1から7のいずれか一項に記載の縮小装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、縮小装置及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、復号画像の超解像処理を行う際に復号画像自体が劣化している場合は、超解像パラメータによっては劣化成分自体が大きく強調されてしまう可能性があるため、所定の終了条件を満たすまで超解像処理と縮小復元処理を繰り返し行うことで、最適な超解像パラメータを得る技術が開示されている。
【0003】
また、特許文献2には、入力画像を一旦縮小して中間解像度に変換し、これに既存の符号化・復号を行った後で元の解像度に戻す方式において、符号化器に応じた符号量とその符号量に対する最適な解像度縮小率を予め蓄積しておき、最適な中間解像度を選択する技術が開示されている。
【0004】
一方、H.265/HEVC(High Efficiency Video Coding)、H.266/VVC(Versatile Video Coding)などの符号化方式では、DCT(Discrete Cosine Transform)などの直交変換や動きベクトルを用いた動き補償が行われる。H.265/HEVCの技術の詳細については、例えば非特許文献1に詳細に記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第5262879号公報
【特許文献2】特開2000-134618号公報
【非特許文献】
【0006】
【非特許文献1】大久保榮監修、「インプレス標準教科書シリーズ H.265/HEVC教科書」、株式会社インプレスジャパン、2013年10月21日
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1、2に開示された従来技術では、縮小画像を生成した際に、符号化が困難な画像において、ブロック歪などのアーティファクトが発生し、画質が劣化するという課題があった。一般に、符号化が困難な画像において十分な符号量が確保できない場合は、符号化アーティファクトによる画質破綻が発生しやすくなる。
【0008】
かかる事情に鑑みてなされた本発明の目的は、高品質な縮小画像を生成することが可能な縮小装置及びプログラムを提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するため、一実施形態に係る縮小装置は、原画像の縮小画像を生成する縮小装置であって、前記原画像に対して位相情報を保持しながら、各周波数帯域が前記縮小画像の空間解像度以下となるまで空間方向の周波数帯域分解を行い、周波数帯域成分を生成する周波数分解部と、前記縮小画像に対して符号化処理を行い、符号化ブロック毎に、符号化に用いられた量子化パラメータを含む符号化情報を抽出する符号化情報抽出部と、前記周波数帯域成分に対して、前記符号化情報を用いて縮退処理を行い、成分が縮退された縮退周波数帯域成分を生成する縮退処理部と、前記縮退周波数帯域成分に対して、周波数再構成を行い、原画像と同じサイズの縮退画像を生成する周波数再構成部と、前記縮退画像の空間解像度を縮小した縮小画像を生成する空間解像度縮小部と、を備え、前記縮退処理部は、最低周波数帯域においては縮退処理を行わず、前記最低周波数帯域を超え且つ前記縮小画像の空間解像度以下の周波数帯域においては、前記量子化パラメータが第1閾値以上となる符号化ブロック位置の縮退率を、前記量子化パラメータが前記第1閾値未満となる符号化ブロック位置の縮退率よりも高くする。
【0010】
さらに、一実施形態に係る縮小装置において、前記縮退処理部は、前記周波数帯域成分のうち、前記縮小画像の空間解像度を超える周波数帯域の縮退率を最も高くしてもよい。
【0011】
さらに、一実施形態に係る縮小装置において、前記符号化情報抽出部、前記縮退処理部、前記周波数再構成部、及び前記空間解像度縮小部による処理は、前記量子化パラメータの値が第2閾値よりも小さくなるまで繰り返し行われてもよい。
【0012】
さらに、一実施形態に係る縮小装置において、前記周波数帯域成分のうち、対角方向の最高周波数帯域成分を用いて雑音レベルを算出する雑音レベル設定部を更に備え、前記縮退処理部は、前記雑音レベル以下の前記周波数帯域成分の縮退率を、前記雑音レベルを超える前記周波数帯域成分の縮退率よりも高くしてもよい。
【0013】
さらに、一実施形態に係る縮小装置において、前記縮退処理部は、絶対値が上位から所定の順位に含まれる時空間周波数帯域成分の縮退率を、絶対値が前記所定の順位に含まれない時空間周波数帯域成分の縮退率よりも高くしてもよい。
【0014】
さらに、一実施形態に係る縮小装置において、前記周波数分解部は、前記原画像に対して、時間方向にも周波数帯域分解を行い、前記周波数帯域成分を生成してもよい。
【0015】
さらに、一実施形態に係る縮小装置において、前記縮退処理部は、前記最低周波数帯域を超え且つ前記縮小画像の空間解像度以下の周波数帯域において、時間方向の周波帯域成分が第3閾値を超える場合に縮退処理を行ってもよい。
【0016】
また、一実施形態係るプログラムは、コンピュータを、上記縮小装置として機能させる。
【発明の効果】
【0017】
本発明によれば、高品質な縮小画像を生成することができる。
【図面の簡単な説明】
【0018】
図1】第1の実施形態に係る縮小装置の構成例を示すブロック図である。
図2】8K解像度の原画像を空間方向に4階ウェーブレットパケット分解した様子を示す図である。
図3】8K解像度の原画像を空間方向に4階ウェーブレットパケット分解し、時間方向に1階ウェーブレットパケット分解した様子を示す図である。
図4】第2の実施形態に係る縮小装置の構成例を示すブロック図である。
図5】第2の実施形態に係る縮小装置で使用される基本縮退関数の一例を示す図である。
図6】第3の実施形態に係る縮小装置の構成例を示すブロック図である。
【発明を実施するための形態】
【0019】
以下、本発明の実施形態について、図面を参照して詳細に説明する。
【0020】
(第1の実施形態)
図1は、本発明の第1の実施形態に係る縮小装置1の構成例を示すブロック図である。図1に示す縮小装置1は、周波数分解部10と、符号化情報抽出部13と、縮退処理部14と、周波数再構成部15と、空間解像度縮小部16と、を備える。
【0021】
縮小装置1は、原画像を入力し、原画像(入力画像)の空間解像度を縮小した縮小画像を生成して出力する。縮小装置1は、例えば8K解像度で撮影された原画像を4K解像度に縮小して放送する場合などに、画像符号化のプリ処理として用いることができる。
【0022】
周波数分解部10は、空間周波数帯域分解部11と、時間周波数帯域分解部12と、を備える。本実施形態では、周波数分解部10が時間周波数帯域分解部12を備えるものとして説明するが、時間周波数帯域分解部12を備えない構成であってもよい。
【0023】
空間周波数帯域分解部11は、原画像に対して位相情報を保持しながら(すなわち、デシメーション無しで)、各周波数帯域が縮小装置1の出力する縮小画像の空間解像度以下となるまで空間方向の周波数帯域分解を行い、空間周波数帯域毎の成分(以下、「空間周波数帯域成分」という。)を生成する。各成分はパワースペクトルを示す。そして、空間周波数帯域分解部11は、空間周波数帯域成分を時間周波数帯域分解部12に出力する。本実施形態では、周波数帯域分解としてウェーブレットパケット分解を行う。なお、ウェーブレットフィルタ及び空間分解階層数は、ユーザが任意に設定可能である。
【0024】
図2は、8K解像度の原画像を空間方向に4階ウェーブレットパケット分解して、1K×0.5K毎の空間周波数帯域に分解した様子を示す図である。原画像の多重解像度分解を高精度に行うためには、線形位相性を有し、比較的タップ長が長く遮断特性が急峻なウェーブレットフィルタ(例えば、CDF(Cohen-Daubechies-Feauveau)9/7、Biorthogonal(6,8)など)を用いることが望ましい。また、各帯域間のパワーは、パーセバルの等式を満たすものとする。
【0025】
また、空間周波数帯域分解部11は、本実施形態ではデシメーション無しのウェーブレットパケット分解を用いて空間周波数帯域分解を行う。そのため、各周波数帯域内の空間方向の要素数は8K×4K個である。なお、図2において、XXで示す周波数帯域は、それぞれLL,LH,HL,HHの4つの周波数帯域により構成される。
【0026】
時間周波数帯域分解部12は、空間周波数帯域分解部11により生成された空間周波数帯域成分に対して時間方向の周波数帯域分解を行い、時空間周波数帯域毎のパワースペクトル要素成分(以下、「時空間周波数帯域成分」という。)を生成する。そして、時間周波数帯域分解部12は、時空間周波数帯域成分を縮退処理部14に出力する。本実施形態では、周波数帯域分解としてウェーブレット分解を行う。なお、ウェーブレットフィルタ及び時間分解階層数は、ユーザが任意に設定可能である。
【0027】
図3は、8K解像度の原画像を空間方向に4階ウェーブレットパケット分解し、時間方向に1階ウェーブレットパケット分解した様子を示す図である。60フレーム/秒の空間周波数帯域成分を1階ウェーブレットパケット分解すると、1から30フレーム/秒と31から60フレーム/秒の時間周波数帯域に分解される。ここで、ウェーブレットフィルタは空間周波数帯域分解部11と同じとする。また、デシメーション無しのウェーブレットパケット分解を行った場合、各周波数帯域内の時間方向の要素数は60個である。各周波数帯域内の時空間方向の要素数は8K×4K×60個である。
【0028】
符号化情報抽出部13は、後述する空間解像度縮小部16により生成された縮小画像に対して符号化処理を行い、符号化ブロック毎に、符号化に用いられた符号化情報を抽出する。そして、符号化情報抽出部13は、符号化情報を縮退処理部14に出力する。ここでは例として符号化処理をVVC/H.266を用いて行い、符号化情報として、符号化ブロック(すなわち、符号化ユニットCU(Coding Unit))の分割情報と、CU毎の量子化パラメータQP(Quantization Parameter)及び動きベクトルの情報と、を抽出する。CUの分割情報とは、CUのサイズ情報及び位置情報である。
【0029】
縮退処理部14は、外部から縮退設定情報を取得する。縮退設定情報とは、縮小空間解像度情報、帯域制限周波数情報、及び縮退係数情報を含む情報である。まず、これらの情報について説明した後、縮退処理について説明する。
【0030】
縮小空間解像度情報とは、生成する縮小画像の空間解像度を指定する情報であり、ユーザにより設定される。水平方向の縮小空間解像度をHとし、垂直方向の縮小空間解像度をVとすると、例えば、縮小空間解像度{H,V}は以下の8種類から選択される。
{H,V}={1K,0.5K},{2K,1K},{3K,1.5K},{4K,2K},{5K,2.5K},{6K,3K},{7K,3.5K},{8K,4K}(8種類)
【0031】
帯域制限周波数情報とは、帯域制限される下限の周波数を指定する情報であり、ユーザにより設定される。水平方向の帯域制限下限周波数をHとし、垂直方向の帯域制限下限周波数をVとし、時間方向の帯域制限下限周波数をTとすると、例えば、帯域制限下限周波数{H,V,T}は以下の組み合わせとする。
水平方向H=1K,2K,3K,4K,5K,6K,7K,8K(8種類)
垂直方向V=0.5K,1K,1.5K,2K,2.5K,3K,3.5K,4K(8種類)
時間方向T=30,60(2種類)
【0032】
なお、縮小装置1が時間周波数帯域分解部12を備えない場合には、帯域制限下限周波数は{H,V}である。また、帯域制限下限周波数は、設定でオン/オフを指定してもよい。オフの場合には、{H,V}={H,V}となり、縮小装置1が時間周波数帯域分解部12を備える場合はT=60となる。
【0033】
縮退係数情報とは、0以上1以下の縮退係数を示す情報であり、ユーザにより設定される。縮退係数は複数あってもよい。本実施形態では、縮退係数として、縮退率が最も低い第1縮退係数m、縮退率が次に低い第2縮退係数m、及び縮退率が最も高い第3縮退係数mを用いるものとする。例えば初期値は、m=0.5(3dB減衰)、m=0.1(10dB減衰)、m=0.001(30dB減衰)とする。
【0034】
縮退処理部14は、時間周波数帯域分解部12から取得した時空間周波数帯域成分に対して、符号化情報抽出部13から取得した符号化情報、及び外部から取得した縮退設定情報を用いて、成分が縮退された時空間周波数帯域成分(以下、「縮退周波数帯域成分」という。)を生成する。この縮退処理により周波数帯域が制限される。そして、縮退処理部14は、縮退周波数帯域成分を周波数再構成部15に出力する。
【0035】
縮退係数の適用例について説明する。縮退処理を行わない周波数帯域と、第3縮退係数mを適用する周波数帯域は、例えば以下のようにすることができる。
縮退処理なし:直流成分を含む最も低い時空間周波数帯域(最低周波数帯域LL)においては縮退処理を行わない(すなわち、成分を変更しない)。
第3縮退係数m:縮小空間解像度{H,V}を超える周波数帯域において適用する。
【0036】
また、最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域には、CU位置毎の空間周波数パワー割合、及び符号化情報(量子化パラメータQP、動きベクトルの大きさ等)に応じて、CU位置又は要素位置毎に第1縮退係数mと第2縮退係数mに切り替えて適用する。縮退係数の切り替えとしては、例えば以下の基準で行う。
第2縮退係数m:最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、量子化パラメータQPが閾値Tq(第1閾値)以上となるCU位置に適用する。
第1縮退係数m:最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、量子化パラメータQPが閾値Tq未満となるCU位置に適用する。
【0037】
また、縮退処理部14は、時間方向の周波帯域成分が時間周波数閾値(第3閾値)を超える場合にも縮退処理を行ってもよい。例えば、第1縮退係数mの適用基準に以下を追加してもよい。
第1縮退係数m:最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、帯域制限下限周波数{H,V,T}を超える時空間高周波数帯域に適用する。
【0038】
なお、縮退係数m,m,m、及び各縮退係数を適用する条件は、ユーザが任意に設定可能であり、上記の例に限られるものではない。例えば、第1縮退係数mを適用する基準を、「最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、量子化パラメータQPが閾値Tq未満となるCU位置のうち、空間高周波パワーの割合が閾値Tp以上となる要素位置、又は動きベクトルの大きさが閾値Tm以上となるCU位置」としてもよい。また、第1縮退係数m、第2縮退係数m、第3縮退係数mの全てではなく、いずれか1つ以上を適用してもよい。
【0039】
周波数再構成部15は、縮退処理部14により生成された縮退周波数帯域成分に対して、周波数再構成(例えば、ウェーブレットパケット逆分解)を行い、原画像と同じサイズの縮退画像を生成する。周波数再構成は、周波数分解部10が時間周波数帯域分解部12を備える場合には時間方向及び空間方向に対して行い、周波数分解部10が時間周波数帯域分解部12を備えない場合には空間方向に対して行う。そして、周波数再構成部15は、縮退画像を空間解像度縮小部16に出力する。
【0040】
空間解像度縮小部16は、周波数再構成部15により生成された縮退画像の空間解像度を縮小した縮小画像を生成する。空間解像度縮小部16は、例えば縮退画像の画素を間引いて、空間解像度{H,V}の縮小画像を生成する。なお、縮小率は、ユーザが任意に設定可能である。縮小率が整数分の1倍ではない場合の補間内挿フィルタはNearest neighbor,Bicubic,Lanczos-3など、ユーザが指定することができる。そして、空間解像度縮小部16は、縮小画像を縮小装置1の外部及び縮退処理部14に出力する。
【0041】
縮小装置1が最初に縮小画像を生成する際には符号化情報抽出部13により符号化情報が抽出されないため、符号化情報として初期値を用いる。縮小装置1は、符号化情報抽出部13、縮退処理部14、周波数再構成部15、及び空間解像度縮小部16による処理を、符号化情報抽出部13により抽出される量子化パラメータQPがQP閾値(第2閾値)よりも小さくなるまで繰り返し行う。この処理を繰り返す際には、符号化情報及び縮退設定情報のうち、任意のパラメータが変更することができる。また、縮小装置1は、周波数分解部10による処理も含めて量子化パラメータQPの値がQP閾値よりも小さくなるまで繰り返し行い、繰り返す際に、周波数分解に用いられるフィルタを変更してもよい。
【0042】
以上説明したように、縮小装置1は原画像を周波数帯域成分に分解し、帯域制限を行う。そのため、高品質な縮小画像を生成することが可能となる。例えば、8K解像度で撮影された原画像を4K解像度に縮小して放送する場合などに、縮小装置1により画像を縮小することで、符号化が困難な画像で発生しやすい符号化アーティファクトによる画質破綻を抑制することができ、縮小画像の符号化を高品質に行うことが可能となる。
【0043】
(第2の実施形態)
次に、第2の実施形態に係る縮小装置について説明する。図4は、第2の実施形態に係る縮小装置2の構成例を示すブロック図である。図4に示す縮小装置2は、周波数分解部10と、符号化情報抽出部13と、縮退処理部14aと、周波数再構成部15と、空間解像度縮小部16と、雑音レベル設定部17と、を備える。第2の実施形態に係る縮小装置2は第1の実施形態に係る縮小装置1と比較して、縮退処理部14に代えて縮退処理部14aを備える点と、雑音レベル設定部17を更に備える点が相違する。その他の構成については第1の実施形態と同一であるため、同一の参照番号を付して説明を省略する。
【0044】
雑音レベル設定部17は、周波数分解部10から時空間周波数帯域成分を入力し、雑音除去を行うためのパラメータとして雑音レベルを設定する。そして、雑音レベル設定部17は、雑音レベルを縮退処理部14aに出力する。ユーザにより雑音レベル設定を自動で行う自動設定モードと、雑音レベル設定を手動で行う手動設定モードとを指定できてもよい。手動設定モードでは、ユーザが任意の雑音レベルを設定可能である。なお、雑音レベルを設定するか否かをユーザにより指定できてもよい。
【0045】
雑音レベル設定部17は、自動設定モードの場合には、時空間周波数帯域成分のうち、対角方向の最高周波数帯域成分を用いて雑音レベルを算出する。雑音レベルは複数あってもよい。例えば雑音レベル設定部17は、下記式(1)~(3)により2つの雑音レベル{L,L}を算出する。対角方向の最高周波数帯域(以下、「対角最高周波数帯域」という。)は、図2に示す例では、時間ウェーブレットパケット分解無しの場合は周波数帯域XX64であり、時間ウェーブレットパケット分解有りの場合は周波数帯域XX64の時間高周波帯域である。また、XX64のうちLL64,HH64などいずれかの周波数帯域であってもよい。下記式において、pは対角最高周波数帯域の全要素数であり、xは対角最高周波数帯域の各成分値であり、μは対角最高周波数帯域の成分値の算術平均値である。実際は、式(1)の平方根内は定数になるため、Lの計算は、(対角最高周波数帯域の成分値の標準偏差)×(定数)となる。また、Lにおいては外れ値を除くため、上位γ%(例えば、γ=95)の値を最大値とみなしてもよい。
【0046】
【数1】
【0047】
雑音レベル設定部17は、雑音レベル{L,L}ついて、さらに図2で示す周波数帯域識別子n=1~64の周波数帯域毎にオフセットを乗じてもよい。オフセットの適用の有無、及びオフセット値は周波数帯域毎に設定可能である。周波数帯域毎のオフセットは、例えば下記表1とする。この例では、n=1~4の周波数帯域については、時間低周波帯域については雑音レベル{L,L}を1.4倍し、時間高周波帯域については雑音レベル{L,L}を1.2倍する。他の周波数帯域についても同様に、表1に示すオフセットが適用される。なお、周波数分解部10が時間周波数帯域分解部12を備えない場合には、時間低周波帯域のオフセットのみ使用される。
【0048】
【表1】
【0049】
縮退処理部14aは、雑音レベル設定部17により設定された雑音レベル以下の時空間周波数帯域成分の縮退率を、雑音レベルを超える時空間周波数帯域成分の縮退率よりも高くする。例えば、縮退処理部14aは、雑音レベル設定部17により設定された雑音レベル{L,L}(オフセットの適用有りの設定時にはオフセット後のL,L)から縮退関数を生成し、縮退関数に基づいて、時間周波数帯域分解部12から取得した時空間周波数帯域成分に対して、雑音除去及び縮退処理を行い、縮退周波数帯域成分を生成する。縮退関数を適用する要素位置における成分値xは、縮退関数y=f(x)に従ってyに変換される。縮退関数は複数種類あってもよい。本実施形態では、縮退関数として、基本縮退関数、第1縮退関数、第2縮退関数、及び第3縮退関数を用いる。
【0050】
図5は、基本縮退関数f(x)の一例を示す図である。図5に示すように、基本縮退関数f(x)は、xの絶対値である|x|が0以上且つL未満の区間ではy=0とする。|x|がL以上且つL未満の区間では、xが正であればy=(x-L)L/(L-L)とし、xが負であればy=(x+L)L/(L-L)とする。|x|がL以上の区間では、y=xとする。なお、雑音除去設定がオフの場合は、L=0,L=1とし、この場合は、y=xとなり縮退は行われない。
【0051】
縮退処理部14aは、縮退係数情報が示す縮退係数を用いて基本縮退関数の傾きを変更した縮退関数を生成する。上述したように縮退係数として、縮退率が最も低い第1縮退係数m、縮退率が次に低い第2縮退係数m、及び縮退率が最も高い第3縮退係数mを用いる場合、縮退率が最も低い第1縮退関数f(x)、縮退率が次に低い第2縮退関数f(x)、及び縮退率が最も高い第3縮退関数f(x)を生成する。
【0052】
第1縮退関数f(x)は、|x|が0以上且つL未満の区間ではy=0とする。|x|がL以上且つL未満の区間では、xが正であればy=m(x-L)L/(L-L)とし、xが負であればy=m(x+L)L/(L-L)とする。|x|がL以上の区間では、y=mxとする。なお、雑音除去設定がオフの場合は、L=0,L=1とし、この場合は、y=mxとなる。
【0053】
第2縮退関数f(x)は、|x|が0以上且つL未満の区間ではy=0とする。|x|がL以上且つL未満の区間では、xが正であればy=m(x-L)L/(L-L)とし、xが負であればy=m(x+L)L/(L-L)とする。|x|がL以上の区間では、y=mxとする。なお、雑音除去設定がオフの場合は、L=0,L=1とし、この場合は、y=mxとなる。
【0054】
第3縮退関数f(x)は、|x|が0以上且つL未満の区間ではy=0とする。|x|がL以上且つL未満の区間では、xが正であればy=m(x-L)L/(L-L)とし、xが負であればy=m(x+L)L/(L-L)とする。|x|がL以上の区間では、y=mxとする。なお、雑音除去設定がオフの場合は、L=0,L=1とし、この場合は、y=mxとなる。
【0055】
縮退処理部14aは、時間周波数帯域分解部12から取得した時空間周波数帯域成分に対して、符号化情報抽出部13から取得した符号化情報、外部から取得した縮退設定情報、及び縮退関数を用いて縮退周波数帯域成分を生成し、周波数再構成部15に出力する。
【0056】
縮退関数の適用例については、第1の実施形態と同様であり、縮退係数の代わりに縮退関数を用いる。縮退処理を行わない周波数帯域と、第3縮退関数f(x)を適用する周波数帯域は、例えば以下のようにすることができる。
縮退処理なし:直流成分を含む最も低い時空間周波数帯域(最低周波数帯域LL)には縮退処理を行わない(すなわち、成分を変更しない)。
第3縮退関数f(x):縮小空間解像度{H,V}を超える周波数帯域に適用する。
【0057】
また、最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域には、CU位置毎の空間周波数パワー割合、及び符号化情報(量子化パラメータQP、動きベクトルの大きさ等)に応じてCU位置又は要素位置毎に第1縮退関数f(x)と第2縮退関数f(x)に切り替えて適用する。縮退関数の切り替えとしては、例えば以下の基準で行う。
第2縮退関数f(x):最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、量子化パラメータQPが閾値Tq以上となるCU位置に適用する。
第1縮退関数f(x):最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、量子化パラメータQPが閾値Tq未満となるCU位置、及び帯域制限下限周波数{H,V,T}を超える時空間高周波数帯域に適用する。
基本縮退関数f(x):残りの周波数帯域に適用する。
【0058】
なお、縮退関数f(x),f(x),f(x),f(x)、及び各縮退関数を適用する条件は、ユーザが任意に設定可能であり、上記の例に限られるものではない。例えば、第1縮退関数f(x)を適用する基準を、「最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、量子化パラメータQPが閾値Tq未満となるCU位置のうち、空間高周波パワーの割合が閾値Tp以上となる要素位置、又は動きベクトルの大きさが閾値Tm以上となるCU位置」としてもよい。また、基本縮退関数f(x)、第1縮退関数f(x)、第2縮退関数f(x)、第3縮退関数f(x)の全てではなく、いずれか1つ以上を適用してもよい。
【0059】
このように、本実施形態では、対角方向の最高周波数帯域成分を用いて雑音レベルを算出し、雑音レベル以下の周波数帯域成分の縮退率を、雑音レベルを超える周波数帯域成分の縮退率よりも高くする。そのため、縮退処理において同時に雑音除去を行い、画質を向上させることが可能となる。
【0060】
(第3の実施形態)
次に、第3の実施形態に係る縮小装置について説明する。図6は、本発明の第3の実施形態に係る縮小装置3の構成例を示すブロック図である。図6に示す縮小装置3は、周波数分解部10と、符号化情報抽出部13と、縮退処理部14bと、周波数再構成部15と、空間解像度縮小部16と、雑音レベル設定部17と、要素削減閾値設定部18と、を備える。第3の実施形態に係る縮小装置3は第2の実施形態に係る縮小装置2と比較して、縮退処理部14aに代えて縮退処理部14bを備える点と、要素削減閾値設定部18を更に備える点が相違する。その他の構成については第2の実施形態と同一であるため、同一の参照番号を付して説明を省略する。
【0061】
要素削減閾値設定部18は、周波数分解部10から時空間周波数帯域成分を入力し、要素削減閾値αを設定する。そして、要素削減閾値設定部18は、要素削減閾値αを縮退処理部14bに出力する。ユーザにより要素削減閾値設定を自動で行う自動設定モードと、要素削減閾値設定を手動で行う手動設定モードとを指定できてもよい。手動設定モードでは、ユーザが任意の要素削減閾値αを設定可能である。なお、要素削減閾値を設定するか否かをユーザにより指定できてもよい。
【0062】
要素削減閾値設定部18は、自動設定モードの場合には、時空間周波数帯域成分を絶対値の大きい方から順に並べ、上位j%番目の成分値を要素削減閾値αとして求める。
【0063】
縮退処理部14bは、第2の実施形態と同様に、雑音レベル設定部17により設定された雑音レベル{L,L}(オフセットの適用有りの設定時にはオフセット後のL,L)から縮退関数を生成する。そして、縮退処理部14aは、時間周波数帯域分解部12から取得した時空間周波数帯域成分に対して、符号化情報抽出部13から取得した符号化情報、外部から取得した縮退設定情報、縮退関数、及び要素削減閾値設定部18から取得した要素削減閾値αを用いて縮退周波数帯域成分を生成し、周波数再構成部15に出力する。
【0064】
縮退処理部14bは、要素削減閾値αを用いて、絶対値が上位j%(上位から所定の順位)に含まれる時空間周波数帯域成分の縮退率を、絶対値が上位j%に含まれない時空間周波数帯域成分の縮退率よりも高くする。
例えば、下記のように、第1縮退関数f(x)及び第2縮退関数f(x)の適用の際に要素削減閾値αを用いることができる。その他は第2の実施形態と同様であるため、説明を省略する。
第2縮退関数f(x):最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、(1)量子化パラメータQPが閾値Tq以上となるCU位置、及び(2)帯域制限下限周波数{H,V,T}を超える時空間高周波数帯域において要素削減閾値αを超える絶対値を有する成分に適用する。
第1縮退関数f(x):最低周波数帯域を超え且つ縮小空間解像度{H,V}以下の周波数帯域において、(1)量子化パラメータQPが閾値Tq未満となるCU位置、及び(2)帯域制限下限周波数{H,V,T}を超える時空間高周波数帯域において要素削減閾値α以下の絶対値を有する成分に適用する。
【0065】
このように、本実施形態では、絶対値が上位から所定の順位に含まれる時空間周波数帯域成分の縮退率を、絶対値が所定の順位に含まれない時空間周波数帯域成分の縮退率よりも高くする。そのため、強いエッジやテクスチャ成分の縮退率を高くし、符号化効率を向上させることが可能となる。
【0066】
(プログラム)
上述した縮小装置1,2,3として機能させるために、それぞれプログラム命令を実行可能なコンピュータを用いることも可能である。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
【0067】
コンピュータは、プロセッサと、記憶部と、入力部と、出力部と、通信インターフェースとを備える。プロセッサは、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種又は異種の複数のプロセッサにより構成されてもよい。プロセッサは、記憶部からプログラムを読み出して実行することで、上記各構成の制御及び各種の演算処理を行う。なお、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。入力部は、ユーザの入力操作を受け付けてユーザの操作に基づく情報を取得する入力インターフェースであり、ポインティングデバイス、キーボード、マウスなどである。出力部は、情報を出力する出力インターフェースであり、ディスプレイ、スピーカなどである。通信インターフェースは、外部の装置と通信するためのインターフェースであり、例えばLAN(Local Area Network)インターフェースである。
【0068】
プログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性(non-transitory)の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0069】
例えば、縮小装置1として機能させるためのプログラムは原画像に対して位相情報を保持しながら、各周波数帯域が前記縮小画像の空間解像度以下となるまで空間方向の周波数帯域分解を行い、周波数帯域成分を生成するステップと、縮小画像に対して符号化処理を行い、符号化ブロック毎に、符号化に用いられた量子化パラメータを含む符号化情報を抽出するステップと、周波数帯域成分に対して、符号化情報を用いて縮退処理を行い、成分が縮退された縮退周波数帯域成分を生成するステップと、縮退周波数帯域成分に対して、周波数再構成を行い、原画像と同じサイズの縮退画像を生成するステップと、縮退画像の空間解像度を縮小した縮小画像を生成するステップと、をコンピュータに実行させる。
【0070】
また、縮小装置1,2,3は、1つ又は複数の半導体チップにより構成されてもよく、該半導体チップは、縮小装置1,2,3の各機能を実現する処理内容を記述したプログラムを実行するCPUを搭載してもよい。
【0071】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを統合したり、1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0072】
1,2,3 縮小装置
10 周波数分解部
11 空間周波数帯域分解部
12 時間周波数帯域分解部
13 符号化情報抽出部
14,14a,14b 縮退処理部
15 周波数再構成部
16 空間解像度縮小部
17 雑音レベル設定部
18 要素削減閾値設定部
図1
図2
図3
図4
図5
図6