(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-26
(45)【発行日】2024-12-04
(54)【発明の名称】符号化装置、復号装置、及びプログラム
(51)【国際特許分類】
H04N 19/593 20140101AFI20241127BHJP
【FI】
H04N19/593
(21)【出願番号】P 2020012909
(22)【出願日】2020-01-29
【審査請求日】2023-01-04
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【氏名又は名称】福尾 誠
(74)【代理人】
【識別番号】100185225
【氏名又は名称】齋藤 恭一
(72)【発明者】
【氏名】松尾 康孝
【審査官】坂東 大五郎
(56)【参考文献】
【文献】特開2008-245088(JP,A)
【文献】Jaeil Kim et al.,Improved Extrapolation for Intra Prediction Coding,Joint Collaborative Team on Video Coding (JCT-VC),2011年11月22日,[JCTVC-G594] (version 2)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
画像の画面内予測を行う符号化装置において、
画面内予測部は、
被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、
未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、
補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部と
を備え、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正する
、符号化装置
であって、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、
前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、
補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする、符号化装置。
【請求項2】
請求項
1に記載の符号化装置において、
前記補正先周波数パワー値を前記補正元周波数パワー値で置き換えること、前記補正先周波数パワー値と前記補正元周波数パワー値との平均をとること、周波数ごとに所定比率で前記補正先周波数パワー値と前記補正元周波数パワー値をマージすること、のいずれかにより、前記補正先周波数パワー値の補正を行うことを特徴とする、符号化装置。
【請求項3】
画像の画面内予測を行う復号装置において、
画面内予測部は、
被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、
未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、
補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部と
を備え、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正する
、復号装置
であって、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、
前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、
補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする、復号装置。
【請求項4】
コンピュータを、請求項1
又は2に記載の符号化装置として機能させる、プログラム。
【請求項5】
コンピュータを、請求項
3に記載の復号装置として機能させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化装置、復号装置、及びプログラムに関し、特に、画像情報の画面内予測を行う符号化装置、復号装置、及びプログラムに関する。
【背景技術】
【0002】
近年の画像(動画像を含む)の高精細化に伴い、より符号化効率を向上させた符号化方式が求められている。例えば、動画像の予測符号化方式であるMPEG(Moving Picture Experts Group)-2、H.264/AVC(Advanced Video Coding)、H.265/HEVC(High Efficiency Video Coding)等では、動画像の各フレームをブロックに分割し、それぞれのブロックを基本処理単位として予測画像を生成し、原画像と予測画像の差分(残差信号)を符号化して出力する。
【0003】
予測画像の生成には画面内予測(イントラ予測)と動き補償予測(インター予測)の2種類の生成手法がある。画面内予測は予測対象であるブロックを、その周辺画素を参照画素として内挿又は外挿予測する(非特許文献1)。また、動き補償予測は前後フレームからフレームを内挿予測する。このうち、画面内予測で生成される予測画像(Iフレーム(Intra-coded Frame))は、画面間予測の基礎となる画像(フレーム)であるため、画面内予測には、より精度が高く、予測効率の良い予測符号化方法が求められている。
【0004】
例えば、画面内予測において、大きなサイズの予測ブロックの方向性予測を行った場合に参照画素からの距離が離れるにしたがって予測が当たりづらくなるという課題に対して、参照画素と予測画素の距離に応じて利用する参照画素の数を変えるなどの処理を行うことが提案されている(特許文献1)。
【先行技術文献】
【特許文献】
【0005】
【非特許文献】
【0006】
【文献】大久保榮(監修)、他、「インプレス標準教科書シリーズH.265/HEVC教科書」、(2013年)、pp.115~124
【発明の概要】
【発明が解決しようとする課題】
【0007】
代表的な動画像の予測符号化方式であるHEVCの画面内予測では、予測する変換ユニット(TU:Transform Unit)の左側と上側の隣接画素を参照画素として、参照画素を用いた内挿又は外挿処理により予測画素を生成する。
【0008】
図7は、一辺のサイズがN(図ではN=4)の被予測TU(被予測変換ユニット)1と、その予測に用いる参照画素の位置関係を示す図である。被予測TU1の左上の画素(ピクセル)位置を原点(0,0)とし、図示のようにx,y軸を設定すると、被予測TU1の左側のx=-1でy=-1~2N-1の座標にある画素と被予測TU1の上側のy=-1でx=-1~2N-1の座標にある画素の計4N+1個の画素を参照画素として準備する。
【0009】
ここで参照画素位置の画素が未復号である場合(未復号のTUに属している場合)、未復号の参照画素位置では、復号済の近傍参照画素の画素値を代入して用いる。しかし同一画素が連続して用いられることが多いため、これら未復号の位置の参照画素は低周波成分になりやすく、予測するTU内に高周波成分が含まれる場合には予測効率が低下しやすいという課題がある。
【0010】
従って、上記のような問題点に鑑みてなされた本発明の目的は、画面内予測において、参照画素位置の画素が未復号である場合でも、高周波成分が含まれるTUを精度良く予測し、予測効率を向上させることができる符号化装置、復号装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0011】
上記課題を解決するために本発明に係る符号化装置は、画像の画面内予測を行う符号化装置において、画面内予測部は、被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部とを備え、前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正し、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする。
【0013】
また、前記符号化装置は、前記補正先周波数パワー値を前記補正元周波数パワー値で置き換えること、前記補正先周波数パワー値と前記補正元周波数パワー値との平均をとること、周波数ごとに所定比率で前記補正先周波数パワー値と前記補正元周波数パワー値をマージすること、のいずれかにより、前記補正先周波数パワー値の補正を行うことが望ましい。
【0015】
上記課題を解決するために本発明に係る復号装置は、画像の画面内予測を行う復号装置において、画面内予測部は、被予測変換ユニット(TU)に対して、参照画素を準備し、未復号の参照画素位置に復号済の近傍参照画素と等しい参照画素を準備する、参照画素準備部と、未復号の参照画素位置に準備した前記参照画素の周波数成分を補正する、参照画素補正部と、補正された前記参照画素に基づいて、前記被予測変換ユニットの予測処理を行う、予測処理部とを備え、前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素の周波数パワー値を用いて、未復号の参照画素位置に準備した前記参照画素の周波数パワー値を補正し、
前記参照画素補正部は、未復号の参照画素位置で用いる復号済の近傍参照画素が属する変換ユニット内の参照画素についてDCT(離散コサイン変換)を行うことにより各周波数に含まれる補正元周波数パワー値を求めるとともに、未復号の参照画素位置に準備した前記参照画素についてDCTを行うことにより各周波数に含まれる補正先周波数パワー値を求め、前記補正元周波数パワー値で前記補正先周波数パワー値を補正し、補正された前記補正先周波数パワー値をIDCT(逆離散コサイン変換)することにより未復号の参照画素位置の前記参照画素を設定し、
前記参照画素補正部はさらに、未復号の参照画素位置に準備した前記参照画素の前記補正先周波数パワー値を前記補正元周波数パワー値で補正し、IDCTすることにより、未復号の参照画素位置に準備した前記参照画素の画素値に加えられた補正量に対し、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みを乗じ、前記補正量を調整することを特徴とする。
【0016】
上記課題を解決するために本発明に係るプログラムは、コンピュータを、前記符号化装置として機能させることを特徴とする。
【0017】
上記課題を解決するために本発明に係るプログラムは、コンピュータを、前記復号装置として機能させることを特徴とする。
【発明の効果】
【0018】
本発明における符号化装置、復号装置、及びプログラムによれば、画面内予測において、参照画素位置の画素が未復号である場合でも、高周波成分が含まれるTUを精度良く予測し、予測効率を向上させることができる。
【図面の簡単な説明】
【0019】
【
図1】本発明に用いられる画面内予測部の一例のブロック図である。
【
図2】本発明の符号化装置の一例のブロック図である。
【
図3】被予測TUの参照画素を準備する例を示す図である。
【
図4】未復号の参照画素位置の画素値を補正する例を示す図である。
【
図5】画面内予測部の動作の例を示すフローチャートである。
【
図6】本発明の復号装置の一例のブロック図である。
【
図7】被予測TUと、その予測に用いる参照画素の位置関係を示す図である。
【発明を実施するための形態】
【0020】
以下、本発明の実施の形態について、図を参照して説明する。
【0021】
(実施の形態1)
図1は、本発明の符号化装置(及び復号装置)の一部を構成する、画面内予測部の一例のブロック図である。画面内予測部10は、被予測画像が入力され、被予測TUごとに復号済TUを用いた予測処理を行い、予測画像を出力する。
【0022】
画面内予測部10は、被予測TUごとに参照画素を準備する参照画素準備部11と、参照画素の補正を行う参照画素補正部12と、補正された参照画素に基づいて被予測TUの予測処理を行う予測処理部13とを備えている。このうち、参照画素準備部11と予測処理部13は、従来の画面内予測で行われていた処理を行うものであり、参照画素補正部12が、従来の画面内予測では行っていない新しい処理を行う。本発明は、参照画素補正部12で、未復号の参照画素位置において用いる復号済の近傍参照画素値を補正することにより、予測精度を向上させる。なお、画面内予測部10は、明確にこのようなブロック構成を有する必要はなく、後述する参照画素準備部11、参照画素補正部12、及び予測処理部13の各部の処理を行う機能を備えていればよい。
【0023】
まず、本発明の実施の形態1としての符号化装置について説明する。
図2は、本発明の符号化装置の一例のブロック図であり、符号化方式として代表的なH.265/HEVCによる符号化を行う符号化装置100である。なお、本発明の符号化装置100はHEVCの符号化を行う装置に限られず、H.264/AVCの符号化を行う装置等、内部に画面内予測部を含む符号化装置であればよい。
【0024】
符号化装置100は、分割部101、減算処理部102、変換部103、量子化部104、エントロピー符号化部105、逆量子化部106、逆変換部107、加算処理部108、ブロックメモリ109、画面内予測部(イントラ予測部)110、ループフィルタ111、フレームメモリ112、動き補償予測部(インター予測部)113、及び切り換え制御部114を備えている。このうち、画面内予測部110として、
図1の画面内予測部10を利用する。符号化装置100は、コンピュータとプログラムによって実現することができる。
【0025】
分割部101は、入力された画像を、所定サイズのブロックに分割する。分割されたそれぞれのブロック(ブロック画像)は、予測・符号化のための基本処理単位となる。ブロックのサイズは、最大64×64画素(ピクセル)であり、更に、予測のユニットとして、4×4、8×8、16×16、又は32×32画素等に分割される。ブロック化された画像は、減算処理部102に出力され、画像ブロック毎にその後の処理が行われる。
【0026】
減算処理部102は、分割部101から入力されるブロック化された画像から、画面内予測部110又は動き補償予測部113からの予測画像の減算処理を行い、両画像の差分を求めて、残差信号(差分画像)を変換部103に出力する。
【0027】
変換部103は、減算処理部102から入力された残差信号に対して、H.265/HEVC等で規定されている変換符号化処理(離散コサイン変換(DCT:Discrete Cosine Transform)又は離散サイン変換(DST:Discrete Sine Transform)等)を行い、得られた変換係数を量子化部104へ出力する。以下では、DCTを処理に用いるものとして説明する。
【0028】
量子化部104は、変換部103から入力された変換係数を、所定の量子化パラメータに基づいて量子化処理を行う。そして、その結果(量子化済み変換係数)をエントロピー符号化部105及び逆量子化部106に出力する。
【0029】
エントロピー符号化部105は、量子化部104から入力された量子化済み変換係数(画像の符号化データ)とともに、画像の復号に必要なデータをエントロピー符号化して、ビットストリームを作成する。このビットストリームが符号化装置100の出力信号となる。
【0030】
逆量子化部106は、量子化部104から入力された量子化済み変換係数を逆量子化し、変換係数に戻して逆変換部107に出力する。
【0031】
逆変換部107は、逆量子化されたデータ(変換係数)に対して逆変換(離散コサイン逆変換(IDCT:Inverse Discrete Cosine Transform)等)をする。すなわち、逆量子化部106と逆変換部107により、変換部103及び量子化部104で行われた符号化処理と反対の復号処理を行い、その結果を加算処理部108に出力する。
【0032】
加算処理部108は、逆量子化部106と逆変換部107で逆量子化及び逆変換されたデータ、すなわち、残差信号の復号処理されたデータと、後述の画面内予測部110又は動き補償予測部113で処理された予測画像データとを加算し、その合成画像データ(再構成されたブロック画像)をブロックメモリ109とループフィルタ111に出力する。
【0033】
ブロックメモリ109は、加算処理部108から入力される再構成されたブロック画像を蓄積する記憶部である。画面内予測のための被予測画像を格納し、画面内予測部110に出力する。
【0034】
画面内予測部110は、ブロックメモリ109に格納された被予測画像のデータに基づいて、被予測TUの画面内予測(イントラ予測)による予測画像を生成する。本発明では、画面内予測部110を
図1に示す画面内予測部10の構成とし、参照画素の補正を行う予測画像生成を行う。その処理については後述する。画面内予測部110は、画面内予測画像を切り換え制御部114に出力する。
【0035】
ループフィルタ111は、例えば、ブロック歪みを低減するデブロッキング・フィルタと、リンギング歪みを低減するサンプル・アダプティブ・オフセット等によって構成される。加算処理部108で合成された画像データに対して、フィルタ処理を行うことにより、符号化ループ内の量子化処理によって発生する符号化歪みを低減する。ループフィルタ111はフィルタ処理した画像データをフレームメモリ112に出力する。
【0036】
フレームメモリ112は、ループフィルタ111で処理された画像データを蓄積する。フレームメモリ112は、動き補償予測(インター予測)に用いられる参照ピクチャを格納する記憶部として機能する。
【0037】
動き補償予測部113は、フレームメモリ112に蓄積された画像と、図示しない動き検出部で求めた画像の動きの情報に基づいて、動き補償予測処理(動きベクトルに基づくフレーム間予測)を行い、動き予測画像を切り換え制御部114に出力する。
【0038】
切り換え制御部114は、減算処理部102に、画面内予測部110からの画面内予測画像と、動き補償予測部113からの動き予測画像とのいずれかを、選択して出力する。
【0039】
本発明の符号化装置100は、画面内予測部110において参照画素の補正を行うことにより、画面内予測の予測効率を向上させることができる。
【0040】
次に、画面内予測部110(10)の動作について詳述する。
図1の参照画素準備部11は、被予測画像が入力され、被予測TUの予測処理に用いる参照画素を準備して出力する。
図3に、被予測TU1の参照画素を準備する例を示す。
【0041】
TUの一辺のサイズをNとする。そして
図3に示すように、予測するTU1に隣接する4N+1個の画素を参照画素p[x][y]として準備する。被予測TU1に対する4N+1個の参照画素の配置関係は、
図7と同じである。
図3では、被予測TU1(N=4)の左上の画素(ピクセル)位置を座標(12,12)とし、被予測TU1の左側のx=11でy=11~19の座標にある画素と被予測TU1の上側のy=11でx=11~19の座標にある画素の計17個の画素を参照画素として準備することとする。
【0042】
参照画素の準備手順は次のとおりである。
(1)参照画素が全て復号済の場合、それらをそのままp[x][y]の値とする。
【0043】
(2)復号済み画素が1つもない場合、p[x][y]=1<<(BitDepth-1)とする(BitDepthはビット深度)。
【0044】
(3)それ以外の場合(一部のみ復号済みの場合)、
(3-1)
図3の左下端(11,19)から参照画素を右上端(19,11)に向かって順に走査し、最初に存在する復号済み画素値(ここでは、p[11][15])を左下端(p[11][19])の値とする。
(3-2)
図3の左下端の1つ上(11,18)から(11,11)まで順に走査し、当該画素が復号されていなければそのすぐ下の画素値を当該画素の値とする。すなわち、p[11][y+1]をp[11][y]の値とする。
(3-3)同様に、
図3の(12,11)から右上端(19,11)まで順に走査し、当該画素が復号されていなければそのすぐ左側の画素値を当該画素の値とする。すなわち、p[x-1][11]をp[x][11]の値とする。
【0045】
上記の(3-1)、(3-2)の手順により、未復号の参照画素の値p[11][19]~p[11][16]は、これらと隣接する復号済みの近傍参照画素p[11][15]と等しくなる。以上の手順により、4N+1個の参照画素の全てに値が設定され、p[x][y]として準備される。
【0046】
次に、参照画素補正部12の処理について説明する。参照画素補正部12は、参照画素準備部11で準備された参照画素の内、未復号の参照画素位置の画素値の補正を行う。
図4に、未復号の参照画素位置の画素値を補正する例を示す。参照画素補正部12には、例えば、未復号の参照画素位置で用いる復号済の近傍参照画素、被予測画像、及びTU情報(TU分割情報)が入力され、補正された参照画素が出力される。
【0047】
参照画素補正部12は、まず、未復号の参照画素位置に用いる復号済み近傍参照画素を有する復号済TU(隣接する複合済TU5)の参照画素の周波数パワーを解析する。今、参照画素準備部11の処理により、参照画素値p[11][19]~p[11][16]は復号済み近傍参照画素p[11][15]の値となっている。復号済の近傍参照画素p[11][15]が元々属するTU(復号済TU5)内の参照画素の周波数パワーを周波数成分解析(例えば、DCT解析)して、その結果を周波数パワー解析情報として出力する。
【0048】
すなわち、復号済TU5の参照画素p[11][15]~p[11][12]に含まれる周波数パワーをDCT解析によって求める。以下にDCTの計算式を示す。
【0049】
【0050】
図4における補正元の参照画素p[11][15]を含む、復号済TU5のp[11][15]~p[11][12]のDCTにおいてはN=4であるため、p[11][15]~p[11][12]に対応する周波数パワー解析結果として、k番目の周波数のパワー係数:X
k(補正元), (k = 0, 1, 2, 3)が出力される。なお、この係数を「周波数パワー値」ということがある。
【0051】
次に、未復号の参照画素位置で用いる画素値を補正する。まず、未復号の参照画素位置における画素(今は復号済の近傍参照画素と等しい)の周波数パワーを周波数成分解析(例えば、DCT解析)する。すなわち、補正先であるp[11][19]~p[11][16]をDCT解析して、k番目の周波数のパワー係数:Xk(補正先), (k = 0, 1, 2, 3)を得る。なお、未復号の参照画素位置で用いる画素値が全て等しい場合は、パワー係数は直流(DC)成分のみとなり、他の周波数成分は0となる。
【0052】
そして、得られた周波数パワー値:Xk(補正先)を、前述の周波数パワー値:Xk(補正元)を用いて補正する。補正においては、例えば、Xk(補正先)をXk(補正元)で置き換える、Xk(補正先)とXk(補正元)の各要素で平均をとる、或いは、Xk(補正先)とXk(補正元)を要素ごと(周波数ごと)に所定比率でマージする等を行うことができる。所定比率は周波数ごとに変えてもよい。どのような手法で補正するかは、画像の特徴等に基づいて最適なものを選択してもよい。
【0053】
未復号の参照画素位置が属するTU内の参照画素数と、復号済の近傍参照画素が属するTU内の参照画素数が異なる場合は、画素数に対応させてXkをマッピングすることができる。例えばXk(補正元)がN=4、Xk(補正先)がN=2の場合は、X0(補正元)とX1(補正元)の平均をX0(補正先)、X2(補正元)とX3(補正元)の平均をX1(補正先)として用いることができる。
【0054】
以上のように、未復号の参照画素位置の周波数パワー値を補正した後、IDCTすることで、未復号の参照画素位置で用いる補正された画素値が得られる。よって、未復号の参照画素位置の画素値について、周波数成分(周波数パワー)の補正を行うことができる。すなわち、未復号の参照画素位置の参照画素に対し、近傍の復号済の変換ユニットの周波数成分を加える補正を行うことができる。
【0055】
更に、前記の補正を行った後で、未復号の参照画素位置と、その位置で用いる復号済の近傍参照画素との間の距離に応じて重みαを乗じることができる。例えばp[11][16]はp[11][15]から近いので大きな重み(α=1.0)、p[11][19]はp[11][15]から遠いので小さな重み(α=0.7)という具合で距離に応じた重みを画素値の補正量に乗じ、未復号の参照画素位置における補正量を調整することができる。なお、IDCTをする前に、距離に応じた重みをDCT成分に対して乗じ、補正量を調整してもよい。
【0056】
本実施形態では、参照画素準備部11はHEVCを前提としており、未復号の参照画素位置p[11][19]~p[11][16]の画素値を全て復号済み近傍参照画素p[11][15]の値と等しくする処理により準備された未復号TUの参照画素に対して補正を行ったが、参照画素補正部12による補正は、未復号の参照画素位置の画素に対し、近接する復号済TUの周波数成分を加えるよう補正するものであるから、参照画素の準備処理はこれに限られない。他の処理により準備された未復号の参照画素位置の画素に対しても、同様に補正することにより、予測効率を高める効果を得ることができる。
【0057】
次に、予測処理部13の処理について説明する。予測処理部13の処理は、従来の符号化方式で行われた面内の予測処理を用いることができる。例えば、符号化方式がHEVCであれば、(1)プレーナ(Planar)予測、(2)直流(DC)予測、(3)方向性予測のいずれかを行う。予測処理は、参照画素補正部12から出力された、補正済みの参照画素値を用いて行う。
【0058】
ここで、(1)プレーナ(Planar)予測は、被予測TUの周囲の4個の参照画素値に基づいて、各予測画素値を滑らかに生成する手法であり、(2)直流(DC)予測は、被予測TUのすぐ左側及び上側の2N個の参照画素の平均値でTU内を埋める処理である。また、(3)方向性予測は、33通りの参照方向のいずれかに基づいて、参照方向にある参照画素値(又は内分値)を予測値とするものであり、これらの予測方法から予測効率の良い方法を選択して予測することができる。
【0059】
次に、画面内予測部10の処理について、より一般化して説明する。
図5は、画面内予測部10の動作の例を示すフローチャートである。以下、各ステップについて説明する。
【0060】
ステップS11:被予測TU(一辺のサイズをN)に対して、隣接する4N+1個の画素(
図7参照)を参照画素p[x][y]として準備する。なお、参照画素が全て復号済みの場合、それらをそのままp[x][y]の値とし、復号済み画素が1つもない場合、p[x][y]=1<<(BitDepth-1)とする。それ以外の場合、左下端(-1, 2N-1)から右上端(2N-1, -1)に向かって参照画素を順に走査し、最初に存在する復号済み画素値をp[-1][2N-1]の値とする。次に、左下端の1つ上(-1, 2N-2)から(-1, -1)まで順に走査し、(-1, y)が復号されていなければp[-1][y+1]をp[-1][y]の値とする。さらに、(0, -1)から右上端(2N-1, -1)まで順に走査し、(x, -1)が復号されていなければp[x-1][-1]をp[x][-1]の値とする。
【0061】
ステップS12:未復号の参照画素位置で用いる復号済みの近傍参照画素が元々属するTU(未復号TU6に隣接する復号済TU5)内の参照画素の周波数パワーをDCT解析して、その結果を周波数パワー解析情報(補正元の周波数別のパワー係数)として出力する(
図4参照)。
【0062】
ステップS13:補正対象である未復号の参照画素位置の画素値についてDCT解析を行い、得られた周波数パワー解析情報(補正先の周波数別のパワー係数)を、ステップS12で得られた復号済TUの参照画素の周波数パワー解析情報に基づいて、補正する(
図4参照)。補正においては、例えば補正先の係数列(周波数パワー値)を補正元の係数列(周波数パワー値)で置き換える、補正先周波数パワー値と補正元周波数パワー値の平均をとる、補正先と補正元の各周波数のパワー値を所定比率でマージする等の処理を行うことができる。その後、補正された補正先周波数パワー値をIDCTすることで、未復号の参照画素位置で用いる補正された参照画素値が得られる。なお、補正先と補正元の画素間の距離に基づいて、補正量の重み付け処理を行ってもよい。
【0063】
ステップS14:参照画素(補正された参照画素を含む)に対し、線形フィルタ又は平滑化フィルタ等のフィルタ処理を、必要に応じて行う。なお、このフィルタ処理は、歪や雑音を低減するための処理であり、HEVC等で行われる通常の処理である。
【0064】
ステップS15:ステップS11~S14で得られた参照画素にもとづいて、被予測TUの予測処理を行う。例えば、HEVCでは、33通りの参照方向を有する方向性予測、及び非方向性予測として、プレーナ(Planar)予測又は直流(DC)予測が用意されており、これらの予測処理により、画面内予測を行う。
【0065】
なお、本実施形態では、周波数成分解析として、DCT解析を行ったが、これに限られず、DST解析等、周波数パワー係数を求める他の手法を用いてもよい。
【0066】
(実施の形態2)
実施の形態2として、復号装置について説明する。画面内予測部10は、符号化装置における局部復号処理のみならず、復号装置の復号処理においても同様に使用される。
【0067】
図6は、本発明の復号装置の一例のブロック図であり、符号化方式として代表的なH.265/HEVCによる復号を行う復号装置200である。なお、本発明の復号装置200はHEVCによる復号を行う装置に限られず、H.264/AVCによる復号を行う装置等、内部に画面内予測部を含む復号装置であればよい。復号装置200は、符号化データであるビットストリームを入力し、復号処理を行い、復元した画像を出力する。
【0068】
復号装置200は、エントロピー復号部201、逆量子化部202、逆変換部203、加算処理部204、ループフィルタ205、ブロックメモリ206、画面内予測部207、フレームメモリ208、動き補償予測部209、及び切り換え制御部210を備えている。このうち、画面内予測部207として、
図1の画面内予測部10を利用する。復号装置200は、コンピュータとプログラムによって実現することができる。
【0069】
エントロピー復号部201は、入力されたビットストリームをエントロピー復号し、伝送された画像の符号化データとともに、画像の復号に必要なデータを復号する。画像の符号化データは、ブロック単位で逆量子化部202に出力される。
【0070】
逆量子化部202は、エントロピー復号部201から入力された画像の符号化データ(量子化係数)を逆量子化する。この逆量子化により、符号化側の変換符号化処理(離散コサイン変換等)で生成された変換係数が得られる。そして、逆量子化されたデータを、逆変換部203に出力する。
【0071】
逆変換部203は、逆量子化されたデータ(変換係数)を逆変換(離散コサイン逆変換等)する。すなわち、逆量子化部202と逆変換部203は、符号化装置100で行われた変換部103及び量子化部104の処理と反対の復号処理を行い、その結果を加算処理部204に出力する。
【0072】
加算処理部204は、逆量子化部202及び逆変換部203で逆量子化及び逆変換されたデータ(これは、差分画像のデータに相当する)と、後述の画面内予測部207(又は動き補償予測部209)で処理された予測画像データとを加算し、その合成画像データ(再構成されたブロック画像)をループフィルタ205とブロックメモリ206に出力する。
【0073】
ループフィルタ205は、加算処理部204から入力された画像データに対して、サンプル・アダプティブ・オフセットの処理、或いは、デブロッキング・フィルタの処理等を行う。ループフィルタ205は、フィルタ処理した画像データをフレームメモリ208に出力するとともに、復号装置200の出力画像(復元画像)として出力する。
【0074】
ブロックメモリ206は、加算処理部204で生成された合成画像データ(再構成ブロック画像)を順次蓄積する記憶部である。画面内予測のための被予測画像を格納し、画面内予測部207に出力する。
【0075】
画面内予測部207は、ブロックメモリ206に格納された被予測画像のデータに基づいて、被予測TUの画面内予測(イントラ予測)による予測画像を生成する。本発明では、画面内予測部207を
図1に示す画面内予測部10の構成とし、参照画素の補正を行って予測画像生成を行う。その処理については前述したとおりである。なお、復号側では、符号化側でどのような予測処理をしたかの情報が送られてくるため、それに基づく予測を行う。画面内予測部207は、画面内予測画像を切り換え制御部210に出力する。
【0076】
フレームメモリ208は、ループフィルタ205で処理された画像データを蓄積する。フレームメモリ208は、動き補償予測(インター予測)に用いられる参照ピクチャを格納する記憶部として機能する。
【0077】
動き補償予測部209は、フレームメモリ208に蓄積された画像と、図示しない動き検出部で求めた画像の動きの情報に基づいて、動き補償予測処理を行い、動き予測画像を切り換え制御部210に出力する。
【0078】
切り換え制御部210は、加算処理部204に、画面内予測部207からの画面内予測画像と、動き補償予測部209からの動き予測画像とのいずれかを、選択して出力する。
【0079】
本発明の復号装置200は、画面内予測部207において参照画素の補正を行うことにより、画面内予測の予測効率を向上させることができる。
【0080】
上記の実施の形態では、符号化装置100及び復号装置200の構成と動作について説明したが、本発明はこれに限らず、画面内予測において参照画素の補正を行う符号化方法、又は復号方法として構成されてもよい。或いは、
図5のフローチャートに基づいて、画像の画面内予測方法としても良い。
【0081】
なお、上述した符号化装置100又は復号装置200として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、符号化装置100又は復号装置200の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
【0082】
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0083】
1 被予測TU
2~5 復号済TU
6 未復号TU
10 画面内予測部
11 参照画素準備部
12 参照画素補正部
13 予測処理部
100 符号化装置
101 分割部
102 減算処理部
103 変換部
104 量子化部
105 エントロピー符号化部
106 逆量子化部
107 逆変換部
108 加算処理部
109 ブロックメモリ
110 画面内予測部(イントラ予測部)
111 ループフィルタ
112 フレームメモリ
113 動き補償予測部(インター予測部)
114 切り換え制御部
200 復号装置
201 エントロピー復号部
202 逆量子化部
203 逆変換部
204 加算処理部
205 ループフィルタ
206 ブロックメモリ
207 画面内予測部
208 フレームメモリ
209 動き補償予測部
210 切り換え制御部