IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特許7100194画像符号化装置、画像復号装置、及びプログラム
<>
  • 特許-画像符号化装置、画像復号装置、及びプログラム 図1
  • 特許-画像符号化装置、画像復号装置、及びプログラム 図2
  • 特許-画像符号化装置、画像復号装置、及びプログラム 図3
  • 特許-画像符号化装置、画像復号装置、及びプログラム 図4
  • 特許-画像符号化装置、画像復号装置、及びプログラム 図5
  • 特許-画像符号化装置、画像復号装置、及びプログラム 図6
  • 特許-画像符号化装置、画像復号装置、及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-04
(45)【発行日】2022-07-12
(54)【発明の名称】画像符号化装置、画像復号装置、及びプログラム
(51)【国際特許分類】
   H04N 19/105 20140101AFI20220705BHJP
   H04N 19/157 20140101ALI20220705BHJP
   H04N 19/167 20140101ALI20220705BHJP
   H04N 19/182 20140101ALI20220705BHJP
   H04N 19/593 20140101ALI20220705BHJP
   H04N 19/61 20140101ALI20220705BHJP
【FI】
H04N19/105
H04N19/157
H04N19/167
H04N19/182
H04N19/593
H04N19/61
【請求項の数】 6
(21)【出願番号】P 2021505085
(86)(22)【出願日】2020-03-10
(86)【国際出願番号】 JP2020010326
(87)【国際公開番号】W WO2020184566
(87)【国際公開日】2020-09-17
【審査請求日】2021-09-08
(31)【優先権主張番号】P 2019043965
(32)【優先日】2019-03-11
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001106
【氏名又は名称】キュリーズ特許業務法人
(72)【発明者】
【氏名】岩村 俊輔
(72)【発明者】
【氏名】市ヶ谷 敦郎
(72)【発明者】
【氏名】根本 慎平
【審査官】坂東 大五郎
(56)【参考文献】
【文献】国際公開第2018/231488(WO,A1)
【文献】国際公開第2017/165509(WO,A1)
【文献】国際公開第2017/165395(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
画像を分割して得た符号化対象ブロックを符号化する画像符号化装置であって、
前記符号化対象ブロックをイントラ予測により予測して予測ブロックを生成するイントラ予測部と、
前記符号化対象ブロックに対する前記予測ブロックの誤差を表す予測残差に対する変換処理を制御する変換制御部と、
前記変換制御部の制御に基づいて、前記予測残差に対する変換処理を行う変換部と、を備え、
前記イントラ予測部は、
前記予測ブロック内の予測画素の位置に依存した重み付け合成処理を制御する合成処理制御部と、
前記符号化対象ブロックに隣接する参照画素と前記予測画素とに対して前記重み付け合成処理を行うようにして前記予測画素を補正する補正部と、を有し、
前記重み付け合成処理は、前記予測ブロック内の予測画素に対して、前記予測ブロックの上側の参照画素、左側の参照画素、左上の参照画素を、当該予測画素の座標に応じて特定の割合で重みづけにより補正する処理であり、
前記変換部の前記変換処理は、
水平方向に変換を行う水平変換処理と、垂直方向に変換を行う垂直変換処理と、を含み、
前記合成処理制御部は、
前記水平変換処理に適用する変換の種別が、インパルス応答が単調減少となる基底を含む第1種別である場合、当該種別が前記第1種別でない場合に比べて、前記符号化対象ブロックに水平方向に隣接する水平参照画素に対する重みを小さくし、
前記垂直変換処理に適用する変換の種別が前記第1種別である場合、当該種別が前記第1種別でない場合に比べて、前記符号化対象ブロックに垂直方向に隣接する垂直参照画素に対する重みを小さくすることを特徴とする画像符号化装置。
【請求項2】
画像を分割して得た符号化対象ブロックを符号化する画像符号化装置であって、
前記符号化対象ブロックをイントラ予測により予測して予測ブロックを生成するイントラ予測部と、
前記符号化対象ブロックに対する前記予測ブロックの誤差を表す予測残差に対する変換処理を制御する変換制御部と、
前記変換制御部の制御に基づいて、前記予測残差に対する変換処理を行う変換部と、を備え、
前記イントラ予測部は、
前記予測ブロック内の予測画素の位置に依存した重み付け合成処理を制御する合成処理制御部と、
前記符号化対象ブロックに隣接する参照画素と前記予測画素とに対して前記重み付け合成処理を行うようにして前記予測画素を補正する補正部と、を有し、
前記重み付け合成処理は、前記予測ブロック内の予測画素に対して、前記予測ブロックの上側の参照画素、左側の参照画素、左上の参照画素を、当該予測画素の座標に応じて特定の割合で重みづけにより補正する処理であり、
前記変換部の前記変換処理は、
水平方向に変換を行う水平変換処理と、垂直方向に変換を行う垂直変換処理と、を含み、
前記合成処理制御部は、
前記水平変換処理に適用する変換の種別が、インパルス応答が単調増加となる基底を含む第2種別である場合、当該種別が前記第2種別でない場合に比べて、前記符号化対象ブロックに水平方向に隣接する水平参照画素に対する重みを大きくし、
前記垂直変換処理に適用する変換の種別が前記第2種別である場合、当該種別が前記第2種別でない場合に比べて、前記符号化対象ブロックに垂直方向に隣接する垂直参照画素に対する重みを大きくすることを特徴とする画像符号化装置。
【請求項3】
画像を分割及び符号化して得た復号対象ブロックを復号する画像復号装置であって、
符号化側で複数の変換処理の中から選択された変換処理を示す制御情報としてエントロピー符号化された制御フラグを復号するエントロピー復号部と、
前記制御フラグに基づいて、前記復号対象ブロックに対応する変換係数に対する逆変換処理を制御する逆変換制御部と、
前記逆変換制御部の制御に基づいて、前記復号対象ブロックに対応する変換係数に対する逆変換処理を行う逆変換部と、
前記復号対象ブロックをイントラ予測により予測して予測ブロックを生成するイントラ予測部と、を備え、
前記イントラ予測部は、
前記制御フラグに基づいて、前記予測ブロック内の予測画素の位置に依存した重み付け合成処理を制御する合成処理制御部と、
前記復号対象ブロックに隣接する参照画素と前記予測画素とに対して前記重み付け合成処理を行うようにして前記予測画素を補正する補正部と、を有し、
前記重み付け合成処理は、前記予測ブロック内の予測画素に対して、前記予測ブロックの上側の参照画素、左側の参照画素、左上の参照画素を、当該予測画素の座標に応じて特定の割合で重みづけにより補正する処理であり、
前記変換部の前記逆変換処理は、
水平方向に変換を行う水平変換処理と、垂直方向に変換を行う垂直変換処理と、を含み、
前記合成処理制御部は、
前記水平変換処理に適用する変換の種別が、インパルス応答が単調減少となる基底を含む第1種別である場合、当該種別が前記第1種別でない場合に比べて、前記復号対象ブロックに水平方向に隣接する水平参照画素に対する重みを小さくし、
前記垂直変換処理に適用する変換の種別が前記第1種別である場合、当該種別が前記第1種別でない場合に比べて、前記復号対象ブロックに垂直方向に隣接する垂直参照画素に対する重みを小さくすることを特徴とする画像復号装置。
【請求項4】
画像を分割及び符号化して得た復号対象ブロックを復号する画像復号装置であって、
符号化側で複数の変換処理の中から選択された変換処理を示す制御情報としてエントロピー符号化された制御フラグを復号するエントロピー復号部と、
前記制御フラグに基づいて、前記復号対象ブロックに対応する変換係数に対する逆変換処理を制御する逆変換制御部と、
前記逆変換制御部の制御に基づいて、前記復号対象ブロックに対応する変換係数に対する逆変換処理を行う逆変換部と、
前記復号対象ブロックをイントラ予測により予測して予測ブロックを生成するイントラ予測部と、を備え、
前記イントラ予測部は、
前記制御フラグに基づいて、前記予測ブロック内の予測画素の位置に依存した重み付け合成処理を制御する合成処理制御部と、
前記復号対象ブロックに隣接する参照画素と前記予測画素とに対して前記重み付け合成処理を行うようにして前記予測画素を補正する補正部と、を有し、
前記重み付け合成処理は、前記予測ブロック内の予測画素に対して、前記予測ブロックの上側の参照画素、左側の参照画素、左上の参照画素を、当該予測画素の座標に応じて特定の割合で重みづけにより補正する処理であり、
前記変換部の前記逆変換処理は、
水平方向に変換を行う水平変換処理と、垂直方向に変換を行う垂直変換処理と、を含み、
前記合成処理制御部は、
前記水平変換処理に適用する変換の種別が、インパルス応答が単調増加となる基底を含む第2種別である場合、当該種別が前記第2種別でない場合に比べて、前記復号対象ブロックに水平方向に隣接する水平参照画素に対する重みを大きくし、
前記垂直変換処理に適用する変換の種別が前記第2種別である場合、当該種別が前記第2種別でない場合に比べて、前記復号対象ブロックに垂直方向に隣接する垂直参照画素に対する重みを大きくすることを特徴とする画像復号装置。
【請求項5】
コンピュータを請求項1又は2に記載の画像符号化装置として機能させることを特徴とするプログラム。
【請求項6】
コンピュータを請求項3又は4に記載の画像復号装置として機能させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像符号化装置、画像復号装置、及びプログラムに関する。
【背景技術】
【0002】
画像符号化技術において、フレーム内の空間的な相関を利用したイントラ予測が広く用いられている。イントラ予測では、符号化対象ブロックに隣接する復号済みブロックである参照ブロック内の画素(以下、「参照画素」と呼ぶ)を参照して当該ブロック内の各画素を予測して予測ブロックを生成する。
【0003】
画像符号化装置は、符号化対象ブロックに対する予測ブロックの誤差を表す予測残差に対して直交変換処理を行うことにより変換係数を生成し、変換係数を量子化及びエントロピー符号化して符号化データを出力する。
【0004】
近年、MPEG(Moving Picture Experts Group)及びITU(International Telecommunication Union)は、次世代映像符号化方式であるVVC(Versatile Video Coding)の標準化作業を進めている(例えば、非特許文献1参照)。
【0005】
VVCの規格案では、直交変換処理において、符号化対象ブロックごとに、DCT(Discrete Cosine Transform)2、DST(Discrete Sine Transform)7、DCT8の合計3つの種別の直交変換を選択的に適用することで、予測残差の特性により適した変換を行うことを可能としている。
【0006】
また、VVCの規格案では、イントラ予測により生成される予測ブロックを補正する手法として、PDPC(Position Dependent intra Prediction Combination)と呼ばれる手法が採用されている。
【0007】
PDPCでは、予測ブロック内の予測画素と参照ブロック内の参照画素とに対して、予測画素の位置に依存した重み付け合成処理を行うようにして予測画素を補正する。これにより、予測ブロック内において参照ブロックの近くの領域の予測精度が向上し、予測残差のうち参照ブロックの近くの領域のエネルギーを低減することができる。
【先行技術文献】
【非特許文献】
【0008】
【文献】JVET-L1001 "Versatile Video Coding (Draft 3)"
【発明の概要】
【0009】
第1の特徴に係る画像符号化装置は、画像を分割して得た符号化対象ブロックを符号化する装置である。前記画像符号化装置は、前記符号化対象ブロックをイントラ予測により予測して予測ブロックを生成するイントラ予測部と、前記符号化対象ブロックに対する前記予測ブロックの誤差を表す予測残差に対する変換処理を制御する変換制御部と、前記変換制御部の制御に基づいて、前記予測残差に対する変換処理を行う変換部と、前記変換制御部による変換処理の制御情報を制御フラグとしてエントロピー符号化するエントロピー符号化部とを備える。前記イントラ予測部は、前記制御フラグに基づいて、前記予測ブロック内の予測画素の位置に依存した重み付け合成処理を制御する合成処理制御部と、前記符号化対象ブロックに隣接する参照画素と前記予測画素とに対して前記重み付け合成処理を行うようにして前記予測画素を補正する補正部とを有する。
【0010】
第2の特徴に係る画像復号装置は、画像を分割及び符号化して得た復号対象ブロックを復号する装置である。前記画像復号装置は、符号化側で変換処理の制御情報としてエントロピー符号化された制御フラグを復号するエントロピー復号部と、前記制御フラグに基づいて、前記復号対象ブロックに対応する変換係数に対する逆変換処理を制御する逆変換制御部と、前記逆変換制御部の制御に基づいて、前記復号対象ブロックに対応する変換係数に対する逆変換処理を行う逆変換部と、前記復号対象ブロックをイントラ予測により予測して予測ブロックを生成するイントラ予測部とを備える。前記イントラ予測部は、前記制御フラグに基づいて、前記予測ブロック内の予測画素の位置に依存した重み付け合成処理を制御する合成処理制御部と、前記復号対象ブロックに隣接する参照画素と前記予測画素とに対して前記重み付け合成処理を行うようにして前記予測画素を補正する補正部とを有する。
【0011】
第3の特徴に係るプログラムは、コンピュータを第1の特徴に係る画像符号化装置として機能させることを要旨とする。
【0012】
第4の特徴に係るプログラムは、コンピュータを第2の特徴に係る画像復号装置として機能させることを要旨とする。
【図面の簡単な説明】
【0013】
図1】実施形態に係る画像符号化装置の構成を示す図である。
図2】DCT2(DCT-II)、DCT8(DCT-VIII)、DST7(DST-VII)の合計3つの変換種別の基底(Basis function)を示す図である。
図3】実施形態に係る変換決定部が出力する制御フラグを示す図である。
図4】実施形態に係るイントラ予測部におけるイントラ予測モードを示す図である。
図5】実施形態に係る重み付け合成処理(PDPC)を示す図である。
図6】実施形態に係る画像復号装置の構成を示す図である。
図7】実施形態に係るイントラ予測部の動作フロー例を示す図である。
【発明を実施するための形態】
【0014】
DST7は、インパルス応答が単調増加となる基底を含む変換である。このため、参照ブロックの近くの領域のエネルギーが小さく、参照ブロックの遠くの領域のエネルギーが大きいような予測残差に対してDST7を適用して直交変換処理を行う場合、変換係数を低域に集中させる効果が大きい。
【0015】
一方、DCT8は、インパルス応答が単調減少となる基底を含む変換である。このため、参照ブロックの近くの領域のエネルギーが大きく、参照ブロックの遠くの領域のエネルギーが小さいような予測残差に対してDCT8を適用して直交変換処理を行う場合、変換係数を低域に集中させる効果が大きい。
【0016】
しかしながら、直交変換処理においてDCT8を適用する場合、PDPCにより参照ブロックの近くの領域のエネルギーを小さくするように補正すると、DCT8の効果が損なわれ、符号化効率が低下しうるという問題がある。
【0017】
そこで、本開示は、符号化効率を改善することを目的とする。
【0018】
図面を参照して、実施形態に係る画像符号化装置及び画像復号装置について説明する。実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号をそれぞれ行う。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
【0019】
<画像符号化装置の構成>
まず、本実施形態に係る画像符号化装置について説明する。図1は、本実施形態に係る画像符号化装置1の構成を示す図である。
【0020】
図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部110と、変換・量子化部120と、エントロピー符号化部130と、逆量子化・逆変換部140と、合成部150と、メモリ160と、予測部170と、変換決定部180とを有する。本実施形態において、変換決定部180は、変換制御部に相当する。
【0021】
ブロック分割部100は、動画像を構成するフレーム(或いはピクチャ)単位の入力画像である原画像を複数の画像ブロックに分割し、分割により得た画像ブロックを減算部110に出力する。画像ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。画像ブロックの形状は正方形に限らず長方形(矩形)であってもよい。
【0022】
画像ブロックは、画像符号化装置1が符号化を行う単位(符号化対象ブロック)であり、且つ画像復号装置が復号を行う単位(復号対象ブロック)である。このような画像ブロックはCU(Coding Unit)と呼ばれることがある。
【0023】
減算部110は、ブロック分割部100から入力される符号化対象ブロックと、符号化対象ブロックを予測部170が予測して得た予測ブロックとの差分(誤差)を表す予測残差を算出する。具体的には、減算部110は、符号化対象ブロックの各画素値から予測ブロックの各画素値を減算することにより予測残差を算出し、算出した予測残差を変換・量子化部120に出力する。
【0024】
変換・量子化部120は、符号化対象ブロック単位で直交変換処理及び量子化処理を行う。変換・量子化部120は、変換部121と、量子化部122とを有する。
【0025】
変換部121は、減算部110から入力される予測残差に対して直交変換処理を行って変換係数を算出し、算出した変換係数を量子化部122に出力する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT:Karhunen-Loeve Transform)等をいう。
【0026】
直交変換処理は、水平方向に直交変換を行う水平変換処理と、垂直方向に直交変換を行う垂直変換処理とを含む。
【0027】
変換決定部180は、水平変換処理及び垂直変換処理のそれぞれに適用する変換の種別を決定し、決定した変換種別を示す制御フラグを変換部121、逆変換部142、及びエントロピー符号化部130に出力する。
【0028】
変換部121は、変換決定部180から符号化対象ブロックごとに入力される制御フラグに応じて水平変換処理及び垂直変換処理を行う。すなわち、変換部121は、複数種別の直交変換を切り替えて適用する。
【0029】
本実施形態において、変換決定部180は、水平変換処理及び垂直変換処理のそれぞれについて、DCT2、DCT8、及びDST7の合計3つの種別の直交変換の中から1つの変換種別を決定する。
【0030】
図2は、DCT2(DCT-II)、DCT8(DCT-VIII)、DST7(DST-VII)の合計3つの変換種別の基底(Basis function)を示す図である。図2において、Nは符号化対象ブロックのサイズを表す。
【0031】
DCT8は、インパルス応答が単調減少となる基底を含む第1種別の変換に相当する。具体的には、DCT8は、最も低域のフィルタのインパルス応答T0(j)が単調減少となる変換である(但し、j=0,…,N-1)。DCT8は、変換基底波形の一端が大きい値を持ち開放となる。このような基底の特徴を持つ変換は、「一方の端点が開いた変換」と呼ばれることがある。
【0032】
DST7は、インパルス応答が単調増加となる基底を含む第2種別の直交変換に相当する。具体的には、DST7は、最も低域のフィルタのインパルス応答T0(j)が単調増加となる変換である(但し、j=0,…,N-1)。DST7は、変換基底波形の一端が閉じている。このような基底の特徴を持つ変換は、「一方の端点が閉じた変換」と呼ばれることがある。
【0033】
本実施形態では、予測残差に適用する複数種別の直交変換としてDCT2、DCT8、DST7の3つを例に説明するが、複数の変換処理を選択的に切り替えて適用するものであればよい。当該複数の変換処理は、上述したような変換処理(例えば、単調増加や単調減少の特徴を持つ基底を含む変換)を含む。そのため、予測残差に適用する複数種別の直交変換は、これら3つの変換種別に限定されない。例えば、DCT1やDCT5などの他のDCT・DSTを用いてもよいし、HEVCやVVC規格案で採用されている変換処理を行わない変換スキップを用いてもよいし、離散ウェーブレット変換などの変換を用いてもよい。
【0034】
図3は、本実施形態に係る変換決定部180が出力する制御フラグを示す図である。
【0035】
図3に示すように、変換決定部180は、MTS_CU_flag、MTS_Hor_flag、及びMTS_Ver_flagの合計3つの制御フラグを出力する。
【0036】
変換決定部180は、水平変換処理及び垂直変換処理の両方にDCT2を適用する場合、MTS_CU_flag=0とする。
【0037】
一方、変換決定部180は、水平変換処理及び垂直変換処理の少なくともいずれか一方にDCT8もしくはDST7を適用する場合がある。この場合、変換決定部180は、水平変換処理及び垂直変換処理に適用する変換種別の組み合わせに応じてMTS_Hor_flag及びMTS_Ver_flagを設定する。
【0038】
これらの3つの制御フラグは、後述のエントロピー符号化部130によりエントロピー符号化処理を施されてストリーム出力される。但し、MTS_CU_flag=0である場合、MTS_Hor_flag及びMTS_Ver_flagはストリーム出力しなくてもよい。
【0039】
図1に戻り、量子化部122は、変換部121から入力される変換係数を量子化パラメータ及び量子化行列を用いて量子化し、量子化した変換係数である量子化変換係数をエントロピー符号化部130及び逆量子化・逆変換部140に出力する。
【0040】
エントロピー符号化部130は、量子化部122から入力される量子化変換係数に対してエントロピー符号化を行い、データ圧縮を行って符号化データ(ビットストリーム)を生成し、符号化データを画像符号化装置1の外部に出力する。ここで、エントロピー符号化には、ハフマン符号やCABAC(Context-based Adaptive Binary Arithmetic Coding;コンテキスト適応型2値算術符号)等を用いることができる。
【0041】
なお、エントロピー符号化部130は、予測部170から予測に関するシンタックス等の情報が入力され、入力される情報のエントロピー符号化も行う。また、エントロピー符号化部130は、上述した制御フラグのエントロピー符号化も行う。
【0042】
逆量子化・逆変換部140は、符号化対象ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部140は、逆量子化部141と、逆変換部142とを有する。
【0043】
逆量子化部141は、量子化部122が行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部141は、量子化部122から入力される変換係数を、量子化パラメータ及び量子化行列を用いて逆量子化することにより変換係数を復元し、復元した変換係数である復元変換係数を逆変換部142に出力する。
【0044】
逆変換部142は、変換部121が行う直交変換処理に対応する逆直交変換処理を行う。例えば、変換部121がDCTを行った場合には、逆変換部142は逆DCTを行う。逆変換部142は、逆量子化部141から入力される復元変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部150に出力する。
【0045】
合成部150は、逆変換部142から入力される復元予測残差を、予測部170から入力される予測ブロックと画素単位で合成する。合成部150は、復元予測残差の各画素値と予測ブロックの各画素値を加算して符号化対象ブロックを再構成(復号)し、復号したブロック単位の復号画像をメモリ160に出力する。このような復号画像は、再構成画像(再構成ブロック)と呼ばれることがある。
【0046】
メモリ160は、合成部150から入力される復号画像を記憶する。メモリ160は、復号画像をフレーム単位で記憶する。メモリ160は、記憶している復号画像を予測部170に出力する。なお、合成部150とメモリ160との間にループフィルタが設けられてもよい。
【0047】
予測部170は、符号化対象ブロック単位で予測を行う。予測部170は、インター予測部171と、イントラ予測部172と、切替部173とを有する。
【0048】
インター予測部171は、メモリ160に記憶された復号画像を参照画像として用いて、ブロックマッチングなどの手法により動きベクトルを算出する。さらに、インター予測部171は、符号化対象ブロックを予測してインター予測ブロックを生成し、生成したインター予測ブロックを切替部173に出力する。
【0049】
インター予測部171は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。インター予測部171は、インター予測に関する情報(動きベクトル等)をエントロピー符号化部130に出力する。
【0050】
イントラ予測部172は、メモリ160に記憶された復号画像のうち、符号化対象ブロックの周辺にある復号済みの参照画素を参照してイントラ予測ブロックを生成し、生成したイントラ予測ブロックを切替部173に出力する。また、イントラ予測部172は、選択した予測モードに関するシンタックスをエントロピー符号化部130に出力する。
【0051】
イントラ予測部172は、複数の予測モードの中から、符号化対象ブロックに適用する最適な予測モードを選択し、選択した予測モードを用いて符号化対象ブロックを予測する。
【0052】
図4は、本実施形態に係るイントラ予測部172におけるイントラ予測モードを示す図である。図4に示すように、0から66までの67通りの予測モードがある。予測モードのモード「0」はPlanar予測であり、予測モードのモード「1」はDC予測であり、予測モードのモード「2」乃至「66」は方向性予測である。方向性予測において、矢印の方向は予測方向を示し、矢印の起点は予測対象の画素の位置を示し、矢印の終点はこの予測対象の画素の予測に用いる参照画素の位置を示す。モード「2」~「33」は、イントラ予測の対象ブロックの左側の参照画素を主として参照する予測モードである。一方で、モード「35」~「66」は、イントラ予測の対象ブロックの上側の参照画素を主として参照する予測モードである。
【0053】
切替部173は、インター予測部171から入力されるインター予測ブロックとイントラ予測部172から入力されるイントラ予測ブロックとを切り替えて、いずれかの予測ブロックを減算部110及び合成部150に出力する。
【0054】
本実施形態において、イントラ予測部172は、予測画素生成部172aと、補正部172bと、重み制御部172cとを有する。重み制御部172cは、合成処理制御部に相当する。
【0055】
予測画素生成部172aは、上述したイントラ予測モードのいずれかを用いて、符号化対象ブロック内の各画素値をイントラ予測により予測し、予測画素からなる予測ブロックを生成し、生成した予測ブロックを補正部172bに出力する。
【0056】
補正部172bは、予測画素生成部172aから入力される予測ブロック内の予測画素と符号化対象ブロックに隣接する参照画素とに対して、予測画素の位置に依存した重み付け合成処理を行うことで予測画素を補正する。補正部172bは、補正後の予測画素からなる補正後の予測ブロック(イントラ予測ブロック)を切替部173に出力する。
【0057】
本実施形態において、補正部172bは、PDPCにより予測ブロック内の予測画素を補正する。PDPCは、重み付け合成処理の一例である。
【0058】
図5は、本実施形態に係るPDPCを示す図である。図5に示すように、PDPCは、生成した予測ブロック内の予測画素pred(x,y)に対して、上側の参照画素(Rx,-1)、左側の参照画素(R-1,y)、左上の参照画素(R-1,-1)を、予測画素の座標(x,y)に応じて特定の割合で重みづけにより補正する。そして、PDPCは、補正した予測画素pred'(x,y)を得る。
【0059】
本実施形態において、上側の参照画素(Rx,-1)は、符号化対象ブロックに垂直方向に隣接する垂直参照画素に相当する。左側の参照画素(R-1,y)は、符号化対象ブロックに水平方向に隣接する水平参照画素に相当する。
【0060】
なお、一般的なPDPCでは、参照画素から近い予測画素には重みを大きくし、遠い予測画素には重みを小さくする又は参照画素の重みを0(すなわち予測画素のみ)にする。
【0061】
補正部172bは、例えば下記の式(1)により予測画素pred(x,y)を補正する。
【0062】
pred'(x,y) = (wL・R-1,y+wT・Rx,-1-wTL・R-1,-1+wP・pred(x,y)+32) >> 6
・・・(1)
【0063】
但し、x=0,…,M-1であり、y=0,…,N-1であり、Mはブロック幅(width)、Nはブロック高さ(height)である。
【0064】
また、wLは左側の参照画素に対する重みであり、wTは上側の参照画素に対する重みであり、wTLは左上の参照画素に対する重みであり、wPは補正前の予測画素に対する重みである。
【0065】
重み制御部172cは、直交変換処理に適用する変換の種別に基づいて、補正部172bにおける重み付け合成処理(本実施形態では、PDPC)を制御する。
【0066】
例えば、重み制御部172cは、水平変換処理に適用する変換の種別に基づいて、左側の参照画素(R-1,y)に対する重みwLを制御する。また、重み制御部172cは、垂直変換処理に適用する変換の種別に基づいて、上側の参照画素(Rx,-1)に対する重みwTを制御する。
【0067】
具体的には、重み制御部172cは、水平変換処理に適用する変換の種別が、インパルス応答T0(j)が単調減少となる基底を含む第1種別(本実施形態では、DCT8)である場合(但し、j=0,…,N-1)が想定される。この場合、重み制御部172cは、左側の参照画素(R-1,y)に対する重みwLを小さくする。また、重み制御部172cは、垂直変換処理に適用する変換の種別が第1種別である場合、上側の参照画素(Rx,-1)に対する重みwTを小さくする。なお、「重みを小さくする」とは、重みをゼロにすることであってもよい。すなわち、制御フラグに基づいて重み付け合成処理を制御することは、重み付け合成処理を少なくとも部分的に実行しないことを含む。
【0068】
一方、重み制御部172cは、水平変換処理に適用する変換の種別が、インパルス応答T0(j)が単調増加となる基底を含む第2種別(本実施形態では、DST7)である場合(但し、j=0,…,N-1)、左側の参照画素(R-1,y)に対する重みwLを大きくする。また、重み制御部172cは、垂直変換処理に適用する変換の種別が第2種別である場合、上側の参照画素(Rx,-1)に対する重みwTを大きくする。
【0069】
ここで、重み制御部172cの動作の具体例について説明する。重み制御部172cは、上述した重みwL、wT、wTL、wPを、変換決定部180により決定される変換種別(制御フラグ)と、予測ブロックの左上の画素位置を基準とした予測画素の相対的な位置(x,y)とに応じて決定する。
【0070】
第1に、重み制御部172cは、変換決定部180により決定される変換種別(制御フラグ)に応じて、下記の式(2)によりk(x)を決定する。
【0071】
【数1】
・・・(2)
【0072】
但し、aは任意の正の整数であり、システムにより予め決定した固定値であってもよいし、エントロピー符号化部130がストリーム出力する可変値であってもよい。
【0073】
第2に、重み制御部172cは、式(2)により決定したk(x)に応じて、下記の式(3)により重みwL、wT、wTL、wPを決定する。
【0074】
【数2】
・・・(3)
【0075】
但し、width及びheightは符号化対象ブロックの幅及び高さをそれぞれ表し、x及びyは符号化対象ブロックの左上座標からの相対的な画素位置を表す。
【0076】
式(3)に示すように、水平方向にDST7が適用される場合、wLの値が大きくなり、水平方向に隣接する参照画素による補正の影響を強める。このため、水平方向のブロック境界付近の予測残差のエネルギーが小さくなり、DST7を適用することによるエントロピー低減の効果が大きくなる。
【0077】
同様に、垂直方向にDST7が適用される場合、wTの値が大きくなり、垂直方向に隣接する参照画素による補正の影響を強める。このため、垂直方向のブロック境界付近の予測残差のエネルギーが小さくなり、DST7を適用することによるエントロピー低減の効果が大きくなる。
【0078】
一方、水平方向にDCT8が適用される場合、wLの値が小さくなり、水平方向に隣接する参照画素による補正の影響を弱める。このため、PDPCをDCT8と併用した際のエントロピー増大を抑制できる。
【0079】
同様に、垂直方向にDCT8が適用される場合、wTの値が小さくなり、垂直方向に隣接する参照画素による補正の影響を弱める。このため、PDPCをDCT8と併用した際のエントロピー増大を抑制できる。
【0080】
<画像復号装置の構成>
次に、本実施形態に係る画像復号装置について説明する。図6は、本実施形態に係る画像復号装置2の構成を示す図である。
【0081】
図6に示すように、画像復号装置2は、エントロピー復号部200と、逆量子化・逆変換部210と、合成部220と、メモリ230と、予測部240とを有する。
【0082】
エントロピー復号部200は、画像符号化装置1により生成された符号化データを復号し、量子化変換係数を逆量子化・逆変換部210に出力する。また、エントロピー復号部200は、予測(イントラ予測及びインター予測)に関するシンタックスを取得し、取得したシンタックスを予測部240に出力する。
【0083】
さらに、エントロピー復号部200は、上述した制御フラグを取得し、取得した制御フラグを逆変換部212及び重み制御部242cに出力する。すなわち、エントロピー復号部200は、符号化側で変換処理の制御情報としてエントロピー符号化された制御フラグを復号する。
【0084】
逆量子化・逆変換部210は、復号対象ブロック単位で逆量子化処理及び逆直交変換処理を行う。逆量子化・逆変換部210は、逆量子化部211と、逆変換部212とを有する。
【0085】
逆量子化部211は、画像符号化装置1の量子化部122が行う量子化処理に対応する逆量子化処理を行う。逆量子化部211は、エントロピー復号部200から入力される量子化変換係数を、量子化パラメータ及び量子化行列を用いて逆量子化することにより、復号対象ブロックの変換係数を復元し、復元した変換係数である復元変換係数を逆変換部212に出力する。
【0086】
逆変換部212は、エントロピー復号部200から入力される制御フラグに基づいて、画像符号化装置1の変換部121が行う直交変換処理に対応する逆直交変換処理を行う。具体的には、逆変換部212は、水平方向の逆直交変換処理である水平変換処理と、垂直方向の逆直交変換処理である垂直変換処理とを行う。逆変換部212は、制御フラグに基づいて、復号対象ブロックに対応する変換係数に対する逆変換処理を制御する逆変換制御部としても機能する。
【0087】
逆変換部212は、逆量子化部211から入力される復元変換係数に対して逆直交変換処理を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部220に出力する。
【0088】
合成部220は、逆変換部212から入力される復元予測残差と、予測部240から入力される予測ブロックとを画素単位で合成することにより、元のブロックを再構成(復号)し、ブロック単位の復号画像(再構成ブロック)をメモリ230に出力する。
【0089】
メモリ230は、合成部220から入力される復号画像を記憶する。メモリ230は、復号画像をフレーム単位で記憶する。メモリ230は、フレーム単位の復号画像を画像復号装置2の外部に出力する。なお、合成部220とメモリ230との間にループフィルタが設けられてもよい。
【0090】
予測部240は、復号対象ブロック単位で予測を行う。予測部240は、インター予測部241と、イントラ予測部242と、切替部243とを有する。
【0091】
インター予測部241は、メモリ230に記憶された復号画像を参照画像として用いて、復号対象ブロックをインター予測により予測する。インター予測部241は、エントロピー復号部200から入力されるシンタックス及び動きベクトル等に従ってインター予測を行うことによりインター予測ブロックを生成し、生成したインター予測ブロックを切替部243に出力する。
【0092】
イントラ予測部242は、メモリ230に記憶された復号画像を参照し、エントロピー復号部200から入力されるシンタックスに基づいて、復号対象ブロックをイントラ予測により予測する。これにより、イントラ予測部242は、イントラ予測ブロックを生成し、生成したイントラ予測ブロックを切替部243に出力する。
【0093】
切替部243は、インター予測部241から入力されるインター予測ブロックとイントラ予測部242から入力されるイントラ予測ブロックとを切り替えて、いずれかの予測ブロックを合成部220に出力する。
【0094】
本実施形態において、イントラ予測部242は、予測画素生成部242aと、補正部242bと、重み制御部242cとを有する。予測画素生成部242a、補正部242b、及び重み制御部242cは、画像符号化装置1の予測画素生成部172a、補正部172b、及び重み制御部172cと同様に動作する。
【0095】
具体的には、予測画素生成部242aは、エントロピー復号部200から入力されるシンタックスが示すイントラ予測モードにより、復号対象ブロック内の各画素値をイントラ予測により予測する。そして、予測画素生成部242aは、予測画素からなる予測ブロックを生成し、生成した予測ブロックを補正部242bに出力する。
【0096】
補正部242bは、予測画素生成部242aから入力される予測ブロック内の予測画素と復号対象ブロックに隣接する参照画素とに対して、予測画素の位置に依存した重み付け合成処理を行うことで予測画素を補正する。補正部242bは、補正後の予測画素からなる補正後の予測ブロック(イントラ予測ブロック)を切替部173に出力する。本実施形態において、補正部242bは、上述した式(1)に示すPDPCにより予測ブロック内の予測画素を補正する。
【0097】
重み制御部242cは、直交変換処理に適用する変換の種別に基づいて、補正部242bにおける重み付け合成処理(本実施形態では、PDPC)を制御する。
【0098】
例えば、重み制御部242cは、水平変換処理に適用する変換の種別に基づいて、左側の参照画素(R-1,y)に対する重みwLを制御する。また、重み制御部242cは、垂直変換処理に適用する変換の種別に基づいて、上側の参照画素(Rx,-1)に対する重みwTを制御する。重み制御部242cの具体的な動作については、上述した画像符号化装置1の重み制御部172cの動作と同様である。
【0099】
<イントラ予測の動作フロー>
次に、本実施形態に係るイントラ予測の動作フロー例について説明する。画像符号化装置1及び画像復号装置2でイントラ予測の動作は同様であるが、ここでは画像符号化装置1におけるイントラ予測(イントラ予測部172)の動作を例に挙げて説明する。図7は、本実施形態に係るイントラ予測部172の動作フロー例を示す図である。
【0100】
図7に示すように、ステップS1において、予測画素生成部172aは、上述したイントラ予測モードのいずれかを用いて、符号化対象ブロック内の各画素値をイントラ予測により予測する。そして、予測画素生成部172aは、予測画素からなる予測ブロックを生成し、生成した予測ブロックを補正部172bに出力する。
【0101】
ステップS2において、重み制御部172cは、直交変換処理に適用する変換の種別(制御フラグ)と、予測ブロックの左上の画素位置を基準とした予測画素の相対的な位置(x,y)とに応じて、補正部172bにおける重み付け合成処理(本実施形態では、PDPC)に用いる重みwL、wT、wTL、wPを、上述した式(2)及び式(3)により決定する。なお、ステップS1及びステップS2の順序は逆であってもよい。
【0102】
ステップS3において、補正部172bは、重み制御部172cが決定した重みwL、wT、wTL、wPを用いて、上述した式(1)により、予測画素pred(x,y)を重み付け合成処理により補正し、補正した予測画素pred'(x,y)を得る。
【0103】
このように、本実施形態に係る画像符号化装置1において、イントラ予測部172は、直交変換処理に適用する変換の種別に基づいて、補正部172bにおける重み付け合成処理を制御する重み制御部172cを有する。
【0104】
また、本実施形態に係る画像復号装置2において、イントラ予測部242は、逆直交変換処理に適用する変換の種別に基づいて、補正部242bにおける重み付け合成処理を制御する重み制御部242cを有する。
【0105】
よって、変換の種別を考慮して、イントラ予測により予測される予測ブロックを適切に補正することができるため、符号化効率を改善できる。
【0106】
<重み制御部の動作の変更例1>
次に、重み制御部172c及び242cの動作の変更例1について説明する。重み制御部172c及び242cの動作は同様であるため、ここでは重み制御部172cの動作を例に挙げて説明する。
【0107】
本変更例において、重み制御部172cは、水平方向及び垂直方向にDST7を適用する場合(すなわち、MTS_Hor_flag及びMTS_Ver_flagがともに0である場合)、重みwL、wT、wTL、wPを下記の式(4)により決定する。
【0108】
【数3】
・・・(4)
【0109】
但し、width及びheightは符号化対象ブロックの幅及び高さをそれぞれ表し、x及びyは符号化対象ブロックの左上座標からの相対的な画素位置を表す。
【0110】
重み制御部172cは、水平方向にDST7、垂直方向にDCT8を適用する場合(すなわち、MTS_Hor_flag=1、MTS_Ver_flag=0の場合)、重みwL、wT、wTL、wPを下記の式(5)により決定する。
【0111】
【数4】
・・・(5)
【0112】
重み制御部172cは、水平方向にDCT8、垂直方向にDST7を適用する場合(すなわち、MTS_Hor_flag=0、MTS_Ver_flag=1)、重みwL、wT、wTL、wPを下記の式(6)により決定する。
【0113】
【数5】
・・・(6)
【0114】
重み制御部172cは、水平方向及び垂直方向にDCT8を適用する場合(すなわち、MTS_Hor_flag=1及びMTS_Ver_flag=1がともに1である場合)、重みwL、wT、wTL、wPを下記の式(7)により決定する。これにより、重み制御部172cは、補正を行わないようにする。
【0115】
【数6】
・・・(7)
【0116】
<重み制御部の動作の変更例2>
次に、重み制御部172c及び242cの動作の変更例2について説明する。重み制御部172c及び242cの動作は同様であるため、ここでは重み制御部172cの動作を例に挙げて説明する。
【0117】
本変更例において、重み制御部172cは、直交変換処理に適用する変換の種別と、符号化対象ブロックのサイズとに基づいて重み付け合成処理(PDPC)を制御する。
【0118】
ブロックサイズが大きい場合、重み付け合成処理(PDPC)による予測残差のエネルギー分布への影響は大きくなく、DCT8を適用する場合であってもPDPCによるエントロピー増大の問題は生じにくい。
【0119】
このため、直交変換処理に適用する変換の種別に応じた重みの制御を、ブロックサイズが閾値未満である場合に限り行うとしてもよい。例えば、重み制御部172cは、上述した式(1)を変形した下記の式(8)を用いる。
【0120】
【数7】
・・・(8)
【0121】
但し、width及びheightは符号化対象ブロックの幅及び高さをそれぞれ表し、Trは閾値を表す。
【0122】
<その他の実施形態>
上述した実施形態及びその変更例において、水平及び垂直に直交変換を適用する一例について説明した。しかしながら、水平もしくは垂直の片方のみに直交変換を適用する場合においても、当該片方に適用する直交変換が上述したような単調増加や単調減少の特徴を持つ基底を含む変換であれば、適用可能である。
【0123】
また、上述した実施形態及びその変更例において、イントラ予測の際に参照する復号対象ブロック(参照ブロック)の位置が符号化対象ブロックの上側及び左側である一例について説明した。しかしながら、イントラ予測の際に参照する復号対象ブロックの位置は、符号化対象ブロックの上側に限らず、符号化対象ブロックの下側であってもよい。また、イントラ予測の際に参照する復号対象ブロックの位置は、符号化対象ブロックの左側に限らず、符号化対象ブロックの右側であってもよい。
【0124】
画像符号化装置1が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。画像復号装置2が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
【0125】
画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路(チップセット、SoC)により構成してもよい。画像復号装置2が行う各処理を実行する回路を集積化し、画像復号装置2を半導体集積回路(チップセット、SoC)により構成してもよい。
【0126】
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【0127】
本願は、日本国特許出願第2019-043965号(2019年3月11日出願)の優先権を主張し、その内容の全てが本願明細書に組み込まれている。
図1
図2
図3
図4
図5
図6
図7