IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

<>
  • 特許-符号化装置、復号装置、及びプログラム 図1
  • 特許-符号化装置、復号装置、及びプログラム 図2
  • 特許-符号化装置、復号装置、及びプログラム 図3
  • 特許-符号化装置、復号装置、及びプログラム 図4
  • 特許-符号化装置、復号装置、及びプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-07
(45)【発行日】2022-06-15
(54)【発明の名称】符号化装置、復号装置、及びプログラム
(51)【国際特許分類】
   H04N 19/11 20140101AFI20220608BHJP
   H04N 19/134 20140101ALI20220608BHJP
   H04N 19/157 20140101ALI20220608BHJP
   H04N 19/176 20140101ALI20220608BHJP
   H04N 19/46 20140101ALI20220608BHJP
【FI】
H04N19/11
H04N19/134
H04N19/157
H04N19/176
H04N19/46
【請求項の数】 10
(21)【出願番号】P 2018132649
(22)【出願日】2018-07-12
(65)【公開番号】P2020010303
(43)【公開日】2020-01-16
【審査請求日】2021-06-11
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100161148
【弁理士】
【氏名又は名称】福尾 誠
(74)【代理人】
【識別番号】100185225
【弁理士】
【氏名又は名称】齋藤 恭一
(72)【発明者】
【氏名】千田 和博
(72)【発明者】
【氏名】井口 和久
(72)【発明者】
【氏名】神田 菊文
【審査官】清山 昂平
(56)【参考文献】
【文献】特表2018-530968(JP,A)
【文献】特開2012-209873(JP,A)
【文献】特開2017-204842(JP,A)
【文献】特開2018-050195(JP,A)
【文献】特開2004-015382(JP,A)
【文献】国際公開第2017/134992(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00-19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
ブロック化された画像の画面内予測を行い、予測画像を生成する予測画像生成部を備えた、符号化装置において、
前記予測画像生成部は、参照画素を元に生成した仮予測画像と、既に予測符号化されたブロックにおける予測残差信号又は事前に設定した固定的なパターン画像であるテンプレート画像とに基づいて、前記予測画像を生成することを特徴とする、符号化装置。
【請求項2】
請求項1に記載の符号化装置において、
前記予測画像生成部は、テンプレート画像生成部と、テンプレート画像蓄積部と、テンプレート画像選択部と、前記仮予測画像と前記テンプレート画像を合成する画像合成部とを備え、
前記仮予測画像と前記テンプレート画像とを合成した合成予測画像と、前記仮予測画像のいずれかを、前記予測画像として出力する選択部を備えており、前記予測画像として前記合成予測画像と前記仮予測画像のいずれを選択したかを示す、テンプレート使用フラグを出力することを特徴とする、符号化装置。
【請求項3】
請求項1または2に記載の符号化装置において、
前記予測画像生成部は、テンプレート画像を複数有しており、選択したテンプレート画像を示す使用テンプレート番号を出力することを特徴とする、符号化装置。
【請求項4】
請求項1乃至3のいずれか一項に記載の符号化装置において、
前記予測画像生成部は、前記仮予測画像と前記テンプレート画像を合成するにあたり、係数値を乗算してテンプレート画像を補正することを特徴とする、符号化装置。
【請求項5】
ブロック化された画像の画面内予測を行い、予測画像を生成する予測画像生成部を備えた、復号装置において、
前記予測画像生成部は、参照画素を元に生成した仮予測画像と、復号済みブロックにおける残差信号又は事前に設定した固定的なパターン画像であるテンプレート画像とに基づいて、前記予測画像を生成することを特徴とする、復号装置。
【請求項6】
請求項5に記載の復号装置において、
前記予測画像生成部は、テンプレート画像生成部と、テンプレート画像蓄積部と、テンプレート画像選択部と、前記仮予測画像と前記テンプレート画像を合成する画像合成部とを備え、
テンプレート使用フラグに基づいて、前記仮予測画像と前記テンプレート画像とを合成した合成予測画像と、前記仮予測画像のいずれを前記予測画像として出力するかを選択することを特徴とする、復号装置。
【請求項7】
請求項5または6に記載の復号装置において、
前記予測画像生成部は、テンプレート画像を複数有しており、使用テンプレート番号に基づいて、テンプレート画像を選択することを特徴とする、復号装置。
【請求項8】
請求項5乃至7のいずれか一項に記載の復号装置において、
前記予測画像生成部は、係数値フラグに基づいて選択された係数値を乗算してテンプレート画像を補正することを特徴とする、復号装置。
【請求項9】
コンピュータを、請求項1乃至4のいずれか一項に記載の符号化装置として機能させるためのプログラム。
【請求項10】
コンピュータを、請求項5乃至8のいずれか一項に記載の復号装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化装置、復号装置、及びプログラムに関し、特に、画像の画面内予測を行う符号化装置、復号装置、及びプログラムに関する。
【背景技術】
【0002】
動画像の予測符号化方式であるMPEG(Moving Picture Experts Group)-2やH.264/AVC(Advanced Video Coding)、H.265/HEVC(High Efficiency Video Coding)では、動画像の各フレームをブロックに分割し、それぞれのブロックを基本処理単位として予測画像を生成し、原画像と予測画像の差分(残差信号)を符号化して出力する。
【0003】
予測画像の生成には画面内予測(イントラ予測)と画面間予測(インター予測、動き補償予測)の2種類の生成手法がある。画面内予測は予測対象であるブロックの周辺画素を参照画素として外挿予測し、画面間予測は前後フレームから内挿予測する。このうち、画面内予測で生成される予測画像(Iフレーム(Intra-coded Frame))は、画面間予測の基礎となる画像(フレーム)であるため、画面内予測には、より精度が高く、予測効率の良い予測符号化方法が求められており、様々な方式が提案されている(特許文献1~3)。
【0004】
最新の動画像の予測符号化方式であるH.265/HEVCでは、画面内予測にDC予測、Planar予測、方向性予測の3種類の予測手法を持つ(非特許文献1)。ここで、DC予測は、参照画素の平均値をブロックの予測値とする手法であり、Planar予測は、予測画素値を4個の参照画素値からの線形補間によって生成する手法である。また、方向性予測は、33通りの方向のいずれかを選択し、選択された方向にある参照画素の画素値を予測画素値とする手法である。
【0005】
送信側は、この3種類(35通り)の予測手法のうち、どれを用いたかを示す予測モード番号と残差画像を伝送することで、受信側は、伝送された情報から映像を復号することが可能となる。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2013-17128号公報
【文献】特開2015-46723号公報
【文献】特開2017-5506号公報
【非特許文献】
【0007】
【文献】大久保榮(監修)、他、「インプレス標準教科書シリーズH.265/HEVC教科書」、(2013年)、pp.115~124
【発明の概要】
【発明が解決しようとする課題】
【0008】
画面内予測手法は様々なものが開発されており、例えばH.265/HEVCでは、上述のようにDC予測、Planar予測、方向性予測の3つの予測手法が用いられている。しかし、いずれも参照画素からの外挿予測であり、参照画素からの距離が遠くなると予測効率が劣化し、符号化効率も劣化するという課題がある。
【0009】
従って、上記のような問題点に鑑みてなされた本発明の目的は、画像の画面内予測において、参照画素からの予測距離に依存せずに、精度の高い予測画像が生成可能となり、符号化効率が向上した符号化装置、復号装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0010】
上記の課題を解決するために、本発明では、画面内予測における予測画像生成において、テンプレート画像を用いた予測画像生成手法を導入する。本予測画像生成手法では、既存の画面内予測による予測手法で生成した仮予測画像に、テンプレート画像を加算した合成予測画像を用いて、画面内予測を行う。
【0011】
上記課題を解決するために本発明に係る符号化装置は、ブロック化された画像の画面内予測を行い、予測画像を生成する予測画像生成部を備えた、符号化装置において、前記予測画像生成部は、参照画素を元に生成した仮予測画像と、既に予測符号化されたブロックにおける予測残差信号又は事前に設定した固定的なパターン画像であるテンプレート画像とに基づいて、前記予測画像を生成することを特徴とする。
【0012】
また、前記符号化装置は、前記予測画像生成部が、テンプレート画像生成部と、テンプレート画像蓄積部と、テンプレート画像選択部と、前記仮予測画像と前記テンプレート画像を合成する画像合成部とを備え、前記仮予測画像と前記テンプレート画像とを合成した合成予測画像と、前記仮予測画像のいずれかを、前記予測画像として出力する選択部を備えており、前記予測画像として前記合成予測画像と前記仮予測画像のいずれを選択したかを示す、テンプレート使用フラグを出力することが望ましい。
【0013】
また、前記符号化装置は、前記予測画像生成部が、テンプレート画像を複数有しており、選択したテンプレート画像を示す使用テンプレート番号を出力することが望ましい。
【0014】
また、前記符号化装置は、前記予測画像生成部が、前記仮予測画像と前記テンプレート画像を合成するにあたり、係数値を乗算してテンプレート画像を補正することが望ましい。
【0015】
また、上記課題を解決するために本発明に係る復号装置は、ブロック化された画像の画面内予測を行い、予測画像を生成する予測画像生成部を備えた、復号装置において、前記予測画像生成部は、参照画素を元に生成した仮予測画像と、復号済みブロックにおける残差信号又は事前に設定した固定的なパターン画像であるテンプレート画像とに基づいて、前記予測画像を生成することを特徴とする。
【0016】
また、前記復号装置は、前記予測画像生成部が、テンプレート画像生成部と、テンプレート画像蓄積部と、テンプレート画像選択部と、前記仮予測画像と前記テンプレート画像を合成する画像合成部とを備え、テンプレート使用フラグに基づいて、前記仮予測画像と前記テンプレート画像とを合成した合成予測画像と、前記仮予測画像のいずれを前記予測画像として出力するかを選択することが望ましい。
【0017】
また、前記復号装置は、前記予測画像生成部が、テンプレート画像を複数有しており、使用テンプレート番号に基づいて、テンプレート画像を選択することが望ましい。
【0018】
また、前記復号装置は、前記予測画像生成部が、係数値フラグに基づいて選択された係数値を乗算してテンプレート画像を補正することが望ましい。
【0019】
上記課題を解決するために本発明に係るプログラムは、コンピュータを、上記の符号化装置として機能させるためのプログラムであることを特徴とする。
【0020】
上記課題を解決するために本発明に係るプログラムは、コンピュータを、上記の復号装置として機能させるためのプログラムであることを特徴とする。
【発明の効果】
【0021】
本発明における符号化装置、復号装置、及びプログラムによれば、画面内予測において、従来の外挿予測のみではなく、参照画素からの予測距離に依存しない予測画像が生成可能となる。これにより参照画素からの距離が遠い画素位置での予測効率の劣化を抑制し、符号化効率を向上させることができる。また、本発明は、動画像のみならず、静止画像の符号化においても適用でき、より精度の高い予測画像が生成可能となる。
【図面の簡単な説明】
【0022】
図1】本発明の符号化装置の一例のブロック図である。
図2】本発明の符号化装置の予測画像生成部のより詳細なブロック図である。
図3】本発明の復号装置の一例のブロック図である。
図4】本発明の復号装置の予測画像生成部のより詳細なブロック図である。
図5】本発明の符号化装置の別の例のブロック図である。
【発明を実施するための形態】
【0023】
以下、本発明の実施の形態について、図面を参照して説明する。
【0024】
(実施の形態1)
図1は、改良された画面内予測画像生成手法に基づく、本発明の符号化装置の一例のブロック図である。
【0025】
符号化装置10は、入力画像が入力されると、これを圧縮符号化し、出力信号(出力ビットストリーム)を出力する。ここで入力画像とは、動画像の各フレーム又は静止画像である。符号化装置10は、一例として、ブロック分割部11、予測画像生成部12、減算処理部13、変換・量子化部14、及びエントロピー符号化部15を備える。また、予測画像生成部12は、その内部に、仮予測画像生成部100、テンプレート画像生成部110、テンプレート画像蓄積部120、テンプレート画像選択部130、及び画像合成部140を備える。
【0026】
ブロック分割部11は、入力された画像をブロックに分割する。分割されたそれぞれのブロック(ブロック画像)は、予測・符号化のための基本処理単位となる。ブロックのサイズは、例えば、4×4、8×8、16×16、又は64×64画素(ピクセル)である。ブロック化された画像は、予測画像生成部12及び減算処理部13に出力される。
【0027】
予測画像生成部12は、入力されたブロック画像(予測対象ブロック)について、参照画素の画素値とテンプレート画像を元に予測画像を生成する。ここで、テンプレート画像とは、予測符号化を行うフレーム内で既に予測符号化されたブロックにおける予測残差信号(残差信号であって、予測符号化の内部処理に用いられる信号を「予測残差信号」と言うこととする。)又は事前に設定した固定的なパターン画像であり、残差信号を減少させるために利用する画像のことをいう。生成された予測画像は、減算処理部13に出力する。また、予測処理に用いた予測処理情報(例えば、予測モード番号等)を、エントロピー符号化部15に出力する。
【0028】
予測画像生成部12の内部構成について、説明する。仮予測画像生成部100は、既存の画面内予測手法によって仮予測画像を生成する。既存の画面内予測手法とは、例えば、H.265/HEVCを利用するのであれば、DC予測、Planar予測、又は方向性予測を利用することができる。これら既存の画面内予測手法のいずれかで作成した画像を、仮予測画像として画像合成部140に出力する。
【0029】
テンプレート画像生成部110は、テンプレート画像の生成を行う。テンプレート画像は、上述のとおり、当該予測対象ブロックよりも以前に画面内予測によって予測符号化されたブロックにおける予測残差信号、又は固定パターン画像であるが、ここでは固定パターン画像の生成を主に行う。予測残差信号の生成は、このテンプレート画像生成部110で行ってもよいが、後述の減算処理部13の処理で代替することもできる。固定パターン画像は、予測画像生成の初期状態において、予めテンプレート画像蓄積部に蓄積しておく初期設定パターンである。固定パターン画像はブロック内を一定値の画素値とするもの、ブロック内で画素値に傾斜を設けるもの、縦方向のラインを有するもの、横方向のラインを有するもの等、任意のパターンであってよい。固定パターン画像は、後に残差信号で置き換えてもよい。テンプレート画像生成部110は、生成されたテンプレート画像をテンプレート画像蓄積部120に出力する。
【0030】
テンプレート画像蓄積部120は、生成されたテンプレート画像を蓄積する。符号化済みブロックの予測残差信号をテンプレート画像とする場合、予測残差信号のブロックサイズの情報および適用されていた画面内予測の予測モード番号を合わせて蓄積することとしてもよい。テンプレート画像の蓄積数は限定されず、装置のハードウェア(メモリ容量)に応じて、任意の数のテンプレート画像を蓄積してよい。また、すべてのテンプレート画像を均等に蓄積しておく必要はなく、例えばブロックサイズに応じて、蓄積する数を設定してもよいし、画面内予測の予測モード番号に応じて(例えば、35種類の予測手法ごとに)蓄積する数を設定してもよい。蓄積数を限定した場合は、テンプレート画像を順次更新することが望ましい。更新手段としては、例えばテンプレート画像の蓄積領域に番号を付与しておき、新しいテンプレート画像(予測残差信号)が生じると、蓄積領域の先頭(最も若いテンプレート番号の領域)に格納するとともに、過去分のテンプレート画像の領域を順次ずらして格納する。テンプレート画像が所定の蓄積個数より多くなった場合は、古いものから削除する。これにより、常に最新の予測残差信号が所定数の蓄積領域に保持されることとなる。テンプレート画像蓄積部120に蓄積されたテンプレート画像は、テンプレート画像選択部130からの指示により、最適なテンプレート画像が読みだされる。
【0031】
テンプレート画像選択部130は、テンプレート画像蓄積部120に蓄積されたテンプレート画像から、どのテンプレートを適用するかを選択し、選択したテンプレート画像を画像合成部140に渡す。選択にあたっては、仮予測画像を生成する際に使用した画面内予測手法、ブロックサイズが一致する中で、一番空間的距離が近いものを選択することを基本的な選択ルールとする。この選択ルールは、符号化装置と復号装置で共通化する。ただし複数蓄積されたテンプレート画像の中から、使用テンプレート番号等を用いて明示的に選択してもよい。
【0032】
画像合成部140は、仮予測画像生成部100から入力された仮予測画像と、テンプレート画像選択部130で選択されたテンプレート画像とを加算し、その合成画像を予測画像生成部12の出力(すなわち、当該予測対象ブロックの予測画像)として出力する。なお、後述のように、このときテンプレート画像と仮予測画像それぞれに対して係数値を乗算することで、予測画像を補正することとしてもよい。
【0033】
次に、減算処理部13は、ブロック分割部11からのブロック画像(原画像)と、予測画像生成部12からの予測画像とを入力とし、ブロック画像から予測画像の減算処理を行い、残差信号を生成する。減算処理部13は、生成した残差信号を変換・量子化部14へ出力する。
【0034】
変換・量子化部14は、残差信号(差分画像)を符号化するために必要な変換処理及び量子化を行う。例えば、入力された残差信号について、画像変換で一般に利用される離散コサイン変換等の変換処理を行い、その結果に対して、所定の量子化パラメータに基づいて量子化処理を行う。変換・量子化部14は、変換処理及び量子化の結果を、エントロピー符号化部15に出力する。
【0035】
エントロピー符号化部15は、変換・量子化部14から入力された画像の符号化データとともに、予測処理情報等の画像の復号に必要なデータをエントロピー符号化(シンボル毎の出現確率に基づき異なる長さの符号語長を用いる符号化)をして、出力信号(ビットストリーム)を作成する。その後、出力信号は、必要に応じて変調処理等がなされ、伝送路への出力、又は記録媒体への記録等が行われる。
【0036】
図2は、符号化装置10の予測画像生成部12の一例のより詳細なブロック図である。
【0037】
予測画像生成部12の仮予測画像生成部100では、既存の符号化方法、例えば、H.265/HEVCの画面内予測処理を行う。ここでは、予測対象ブロックとその周辺画素である参照画素に基づいて予測符号化をする際、まずPlanar予測101、DC予測102、方向性予測103から、どの予測モードを選択するかを決定し、その予測モード番号を伝送する。予測モードの選択にあたっては、例えばRD(Rate-Distortion)最適化等の手法を用いる。予測モードを選択した後、それぞれの予測モード番号に応じた計算式によって、仮予測画像を生成する。このときの計算式は、H.265/HEVCや既存の符号化方式に準ずる。
【0038】
テンプレート画像生成部110、テンプレート画像蓄積部120、及びテンプレート画像選択部130の構成・機能は、図1において説明したとおりである。テンプレート画像生成部110は、テンプレート画像の生成を行い、生成されたテンプレート画像をテンプレート画像蓄積部120に出力する。なお、ここでは固定パターン画像の生成のみを行っており、予測残差信号の生成は減算処理部13で行っている。
【0039】
テンプレート画像蓄積部120は、生成されたテンプレート画像を蓄積する。ここでは、テンプレート画像生成部110で生成された固定パターン画像と、減算処理部13で算出された残差信号(予測残差信号)を蓄積しており、テンプレート画像選択部130により、最適なテンプレート画像が読みだされる。
【0040】
テンプレート画像選択部130は、テンプレート画像蓄積部120に蓄積されたテンプレート画像から、どのテンプレートを適用するかを選択し、選択したテンプレート画像を画像合成部140に渡す。複数蓄積されたテンプレート画像から、使用するテンプレート画像を選択する場合、どのテンプレート画像を用いたかを示す使用テンプレート番号を、予測処理情報の一つとして伝送してもよい。なお、テンプレート画像の選択ルールが符号化装置と復号装置で共通であれば、使用テンプレート番号の伝送を省略できる。
【0041】
画像合成部140は、仮予測画像生成部100から入力された仮予測画像と、テンプレート画像選択部130で選択されたテンプレート画像とに基づいて、合成予測画像を出力する。画像合成部140は、係数処理部141と加算処理部142とを備えている。この係数処理部141は、事前に設定した複数の係数値を備えており、適切な係数値を選択してテンプレート画像に選択した係数値を乗じることにより、テンプレート画像を補正することができる。この係数値は、例えば、0.3、0.5、1、2等であって、予測対象ブロックや予測手法に応じて適切なものが選択される。例えば、画像全体にグラデーションがあり、予測対象ブロックが濃から淡に移るときは、係数値として0.5等の1より小さい係数を選択することにより、テンプレート画像の作用・効果がより適切に生じる。テンプレート画像に係数値を乗じることでテンプレート画像の補正を行った場合は、その係数値を示す係数値フラグを伝送する。なお、係数処理は仮予測画像に対して行うこともできる。加算処理部142は、係数処理されたテンプレート画像と仮予測画像を加算して、合成予測画像として出力する。
【0042】
次に、選択部150は、仮予測画像と画像合成部140の出力画像(合成予測画像)のどちらの予測画像を用いるか選択して出力するとともに、合成予測画像を用いる場合には、Trueとして、仮予測画像を使用する場合には、Falseとしてテンプレート使用フラグ(例えば1ビット)を伝送する。この選択には、例えば、RD最適化等の手法を用いてもよいし、単に予測残差信号をより小さくする予測画像を選択してもよい。
【0043】
この後、減算処理部13にて、予測対象ブロックから生成した予測画像を減算することで得られる残差信号を算出し、これを出力する。さらに残差信号はテンプレート画像蓄積部120で蓄積し、次の予測対象ブロックの符号化の際に、テンプレート画像として用いる。
【0044】
このように、既存の画面内予測による予測手法で生成した仮予測画像(すなわち、参照画素を元に生成した仮予測画像)に、テンプレート画像を加算するかどうかは、符号化側で判定し、判定結果をテンプレート使用フラグとして復号側に伝える。また、複数のテンプレート画像からどのテンプレートを選択するかを符号化側で判定し、その結果である使用テンプレート番号を復号側に伝えることもできる。したがって、予測画像生成部12は、画面内予測による予測画像を出力するとともに、モード予測番号、テンプレート使用フラグ、使用テンプレート番号、係数値フラグ等を、予測処理情報として出力する。
【0045】
本発明の符号化装置によれば、テンプレート画像を利用することにより、残差信号を減少させ、画面内予測の符号化効率を向上させることができる。なお、テンプレート画像の利用は、特にDC予測及びPlanar予測で効果が高いことが確認されている。本発明の符号化装置は、静止画像の符号化にも用いることができる。
【0046】
なお、上述した符号化装置10として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、符号化装置10の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
【0047】
(実施の形態2)
図3は、改良された画面内予測画像生成手法に基づく、本発明の復号装置の一例のブロック図である。
【0048】
復号装置20は、入力信号(符号化データ)が入力されると、これを復号処理し、出力画像(復号画像)を出力する。ここで出力画像は、動画像の各フレーム又は静止画像である。復号装置20は、一例として、エントロピー復号部21、予測画像生成部22、逆量子化・逆変換部23、加算処理部24、及びブロック統合部25を備える。
【0049】
エントロピー復号部21は、符号化側で行ったエントロピー符号化の逆変換に相当する。エントロピー符号化された信号を復号し、画像用データ(残差信号に関する情報)を逆量子化・逆変換部23に出力し、予測処理情報を予測画像生成部22に出力する。
【0050】
予測画像生成部22は、予測処理情報(モード予測番号、使用テンプレート番号等)の入力に基づいて画面内予測を行い、予測画像を生成し、加算処理部24に出力する。予測画像生成部22の構成は、基本的には符号化側の予測画像生成部12の構成と同様であり、詳細は後述する。
【0051】
逆量子化・逆変換部23は、エントロピー復号部21から入力された画像用データ(残差信号に関する情報)を、逆量子化及び逆変換(離散コサイン逆変換等)し、残差信号を生成する。すなわち、符号化装置10の変換・量子化部14で行われた処理と反対の復号処理を行い、その結果を加算処理部24に出力する。
【0052】
加算処理部24は、逆量子化・逆変換部23で生成された残差信号の画像と、予測画像生成部22で生成された予測画像とを加算し、その合成画像を復号画像(復号ブロック画像)としてブロック統合部25に出力する。
【0053】
ブロック統合部25は、加算処理部24から入力される復号ブロック画像をブロック統合し、元の画像を復元して出力画像とする。その後、出力画像は、必要に応じて表示装置等へ出力される。
【0054】
図4は、復号装置20の予測画像生成部22の一例のより詳細なブロック図である。予測画像生成部22は、予測処理情報(モード予測番号、使用テンプレート番号等)の入力に基づいて、予測画像を生成する。
【0055】
予測画像生成部22の仮予測画像生成部200は、予測モード番号と参照画素の画素値が与えられる。参照画素は、既に復号済みのブロック画像の画素が選択される。この与えられた情報を元に、Planar予測201、DC予測202、方向性予測203のどの予測が用いられたかを決定し、それぞれの計算式によって、仮予測画像を生成する。この計算式は符号化装置側と同一とする。
【0056】
テンプレート画像生成部210、テンプレート画像蓄積部220、及びテンプレート画像選択部230の構成・機能は、図2の予測画像生成部12における説明と基本的に同様である。テンプレート画像生成部210は、テンプレート画像の生成を行い、生成されたテンプレート画像をテンプレート画像蓄積部220に出力する。復号装置20のテンプレート画像生成部210は、事前に設定した固定的なパターン画像の生成のみを行っており、予測残差信号は符号化装置10から伝送されるものを用いる。なお、生成される固定パターン画像は、符号化装置10の固定パターン画像と同じであり、予測画像生成の初期状態において、予めテンプレート画像蓄積部220に蓄積しておく初期設定パターンが、符号化装置10と同じであるようにする。
【0057】
テンプレート画像蓄積部220は、テンプレート画像として、テンプレート画像生成部210で生成された固定パターン画像と、符号化装置10から伝送された残差信号(予測残差信号)を蓄積する。すなわち、テンプレート画像として使用されるのは、当該予測対象ブロック(復号対象ブロック)より以前に復号された、復号済みブロックにおける残差信号である。なお、テンプレート画像の蓄積領域に番号を付与しておき、新しいテンプレート画像(予測残差信号)が生じると、蓄積領域の先頭(最も若いテンプレート番号の領域)に格納するとともに、過去分のテンプレート画像の領域を順次ずらして格納するという更新手段は、送信側と同じである。これにより、送信側のテンプレート画像蓄積部120と受信側のテンプレート画像蓄積部220は、同じテンプレート番号の蓄積領域に、同じテンプレート画像が格納されることとなる。蓄積されたテンプレート画像は、テンプレート画像選択部230により読みだされる。
【0058】
テンプレート画像選択部230は、符号化装置10からどのテンプレート画像を用いたかを示す使用テンプレート番号が伝送されてきた場合は、使用テンプレート番号に基づいて、テンプレート画像蓄積部220からテンプレート画像を選択し、選択したテンプレート画像を画像合成部240に渡す。なお、前述のとおり、テンプレート画像の選択ルールが符号化装置と復号装置で共通であれば、使用テンプレート番号の伝送を省略できる。
【0059】
画像合成部240は、仮予測画像生成部200から入力された仮予測画像と、テンプレート画像選択部230で選択されたテンプレート画像に基づいて、合成予測画像を出力する。画像合成部240は、係数処理部241と加算処理部242とを備えている。この係数処理部241は、符号化装置10と同一の事前に設定した複数の係数値を備えており、符号化装置10から伝送された係数値を示す係数値フラグを受信する。係数値フラグが伝送されてきた場合は、受信した係数値フラグに基づいて係数値を選択し、テンプレート画像に選択した係数値を乗じることにより、テンプレート画像を補正する。加算処理部142は、係数処理されたテンプレート画像と仮予測画像を加算して、合成予測画像として出力する。
【0060】
選択部251,252は、仮予測画像生成部200から入力された仮予測画像と、画像合成部240の出力画像(合成予測画像)のどちらを予測画像とするか、選択して出力する。復号側の選択部では、伝えられたテンプレート使用フラグを元に、予測画像生成時にテンプレート画像を加算するかどうかを決定する。すなわち、テンプレート使用フラグがTrueであった場合には、画像合成部240において、テンプレート画像と仮予測画像を加算し、合成予測画像を予測画像生成部22の予測画像として出力する。テンプレート使用フラグがFalseであった場合には、仮予測画像をそのまま予測画像として出力する。
【0061】
最後に、予測画像と、伝送されてきた残差信号を加算処理部24で加算し、復号画像(復号ブロック画像)を得る。
【0062】
本発明の復号装置によれば、テンプレート画像を利用することにより、より精度の高い予測画像を生成することが可能となる。本発明の復号装置は、静止画像の復号にも用いることができる。
【0063】
なお、上述した復号装置20として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、復号装置20の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
【0064】
(実施の形態3)
図5は、本発明の符号化装置の別の例のブロック図であり、これまで説明した予測画像生成部を、H.265/HEVCの符号化装置に適用した例を示す。
【0065】
符号化装置30は、ブロック分割部300、減算処理部301、変換・量子化部302、エントロピー符号化部303、逆量子化・逆変換部304、合成部305、イントラ予測部306、ループフィルタ307、フレームメモリ308、動き補償予測部309、及び切換え器310を備えている。このうち、イントラ予測部306として、図2の予測画像生成部12を利用する。
【0066】
ブロック分割部300は、入力画像を、所定のサイズのブロックに分割する。分割された画像は減算処理部301に出力され、画像ブロック毎にその後の処理が行われる。
【0067】
減算処理部301は、ブロック分割部300から入力されるブロック化された画像から、イントラ予測部306又は動き補償予測部309から入力される予測画像の減算処理を行い、両画像の差分を求めて、残差信号(差分画像)を変換・量子化部302に出力する。
【0068】
変換・量子化部302は、変換部302aと量子化部302bを備えている。変換部302aは、減算処理部301から入力された残差信号に対して、H.265/HEVCで規定されている変換符号化処理(離散コサイン変換等)を行う。また、量子化部302bは、所定の量子化パラメータに基づいて量子化処理を行い、その結果をエントロピー符号化部303及び逆量子化・逆変換部304に出力する。
【0069】
エントロピー符号化部303は、変換・量子化部302から入力された画像の符号化データとともに、画像の復号に必要なデータをエントロピー符号化して、出力信号(ビットストリーム)を作成し、その後、必要に応じて変調処理等を行い、伝送路への出力等を行う。
【0070】
逆量子化・逆変換部304は、逆量子化部304aと逆変換部304bを備えている。逆量子化部304aは、変換・量子化部302から入力された符号化されたデータを逆量子化し、逆変換部304bは、逆量子化されたデータに対して逆変換(離散コサイン逆変換等)をする。すなわち、変換・量子化部302で行われた処理と反対の復号処理を行い、その結果を合成部305に出力する。
【0071】
合成部305は、逆量子化・逆変換部304で逆量子化及び逆変換されたデータ、すなわち、残差信号の復号処理されたデータと、後述のイントラ予測部306又は動き補償予測部309で処理された予測画像データとを加算し、その合成画像データをイントラ予測部306とループフィルタ307に出力する。
【0072】
イントラ予測部306は、入力された合成画像データに基づいて、イントラ予測、すなわち、画面内予測による予測画面生成を行う。本発明では、テンプレート画像を利用した予測画像生成手法を用いる。具体的には、イントラ予測部306を図2に示す予測画像生成部12の構成とする。ここでは予測画像生成部12の説明は省略する。イントラ予測部306は、画面内予測画像を切換え器310に出力する。
【0073】
ループフィルタ307は、例えば、ブロック歪みを低減するデブロッキング・フィルタと、リンギング歪みを低減するサンプル・アダプティブ・オフセットによって構成される。合成された画像データに対して、フィルタ処理を行うことにより、符号化ループ内の量子化処理によって発生する符号化歪み(ブロック歪み,リンギング歪みなど)を低減する。ループフィルタ307はフィルタ処理した画像データをフレームメモリ308に出力する。
【0074】
フレームメモリ308は、ループフィルタ307で処理された画像データを蓄積する。
【0075】
動き補償予測部309は、フレームメモリ308に蓄積された画像と、図示しない動き検出部で求めた画像の動きの情報に基づいて、動き補償予測処理を行い、動き予測画像を切換え器310に出力する。
【0076】
切換え器310は、減算処理部301に、イントラ予測部306からの画面内予測画像を出力するか、動き補償予測部309からの動き予測画像を出力するかを、選択する。
【0077】
このように、H.265/HEVCの符号化処理を行う符号化装置30において、テンプレート画像を利用した画面内予測を用いることができる。同様に、画面内予測を行う次世代HEVCの符号化装置及び復号装置においても、本発明を採用することができる。
【0078】
上記の実施の形態では、符号化装置及び復号装置の構成と動作について説明したが、本発明はこれに限らず、画面内予測を行う符号化方法及び復号方法として構成されてもよい。
【0079】
上述の実施の形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
【符号の説明】
【0080】
10 符号化装置
11 ブロック分割部
12 予測画像生成部
13 減算処理部
14 変換・量子化部
15 エントロピー符号化部
20 復号装置
21 エントロピー復号部
22 予測画像生成部
23 逆量子化・逆変換部
24 加算処理部
25 ブロック統合部
30 符号化装置
100 仮予測画像生成部
101 Planar予測
102 DC予測
103 方向性予測
110 テンプレート画像生成部
120 テンプレート画像蓄積部
130 テンプレート画像選択部
140 画像合成部
141 係数処理部
142 加算処理部
150 選択部
200 仮予測画像生成部
201 Planar予測
202 DC予測
203 方向性予測
210 テンプレート画像生成部
220 テンプレート画像蓄積部
230 テンプレート画像選択部
240 画像合成部
241 係数処理部
242 加算処理部
251,252 選択部
300 ブロック分割部
301 減算処理部
302 変換・量子化部
303 エントロピー符号化部
304 逆量子化・逆変換部
305 合成部
306 イントラ予測部
307 ループフィルタ
308 フレームメモリ
309 動き補償予測部
310 切換え器
図1
図2
図3
図4
図5