(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022111285
(43)【公開日】2022-07-29
(54)【発明の名称】画像符号化装置、画像復号装置、及びプログラム
(51)【国際特許分類】
H04N 19/13 20140101AFI20220722BHJP
H04N 19/176 20140101ALI20220722BHJP
H04N 19/136 20140101ALI20220722BHJP
H04N 19/593 20140101ALI20220722BHJP
【FI】
H04N19/13
H04N19/176
H04N19/136
H04N19/593
【審査請求】有
【請求項の数】2
【出願形態】OL
(21)【出願番号】P 2022093176
(22)【出願日】2022-06-08
(62)【分割の表示】P 2020509372の分割
【原出願日】2019-03-29
(31)【優先権主張番号】P 2018066711
(32)【優先日】2018-03-30
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001106
【氏名又は名称】キュリーズ特許業務法人
(72)【発明者】
【氏名】根本 慎平
(72)【発明者】
【氏名】岩村 俊輔
(72)【発明者】
【氏名】市ヶ谷 敦郎
(57)【要約】
【課題】イントラ予測モードの識別情報の符号量を効率的に削減可能とする。
【解決手段】画像符号化装置(1)は、動画像を構成するフレーム単位の原画像を分割して得られた各ブロックを符号化する。画像符号化装置(1)は、予め規定された複数のイントラ予測モードのそれぞれに符号量を割り当てる符号量割当部(180)と、複数のイントラ予測モードの中からイントラ予測の対象ブロックに適用するイントラ予測モードを選択するモード選択部(171)と、選択されたイントラ予測モードを示す識別情報を、割り当てられた符号量に従って符号化する符号化部(130)と、を備える。符号量割当部(180)は、対象ブロックに隣接する複数の参照画素の特徴量を算出し、算出された特徴量に基づいて、複数のイントラ予測モードに対する符号量の割当方法を変更する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
動画像を構成するフレーム単位の画像を分割して得られた各ブロックを復号する画像復号装置であって、
画像符号化装置により生成された符号化データを復号することにより、イントラ予測モードの識別情報を取得する復号部と、
イントラ予測の対象ブロックの周辺のブロックに適用されたイントラ予測モードに対応する複数の第1予測モードを生成する第1生成部と、
前記対象ブロックに隣接し且つ特徴量の算出単位としてグループ分けされた複数の参照画素グループのそれぞれの前記特徴量を算出し、前記複数の参照画素グループのそれぞれは連続する複数の参照画素を含み、前記複数の参照画素グループのそれぞれの前記特徴量は、前記対象ブロックに対して選択される可能性が高いイントラ予測モードを推定するために用いられる、特徴量算出部と、
前記複数の参照画素グループのそれぞれの前記特徴量に基づく比較により、前記対象ブロックに対して選択される可能性が高いと推定されたイントラ予測モードに対して少ない符号量が割り当てられるように、前記複数の第1予測モードを含むMPMを構成することにより、前記複数の第1予測モードに対する符号量の割当方法を変更する割当変更部と、
前記識別情報と割り当てられた符号量とに基づいて、前記対象ブロックに適用するイントラ予測モードを特定するモード特定部と、を備える、
画像復号装置。
【請求項2】
コンピュータを請求項1に記載の画像復号装置として機能させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像符号化装置、画像復号装置、及びプログラムに関する。
【背景技術】
【0002】
近年、映像符号化技術では8K-SHVに代表されるような超高解像度映像の普及が進んでおり、膨大なデータ量の動画像を伝送するための手法としてAVC/H.264やHEVC/H.265などの符号化方式が知られている。
【0003】
かかる符号化方式ではフレーム内の空間的な相関を利用したイントラ予測が利用されている(例えば、非特許文献1)。イントラ予測では、予測対象のブロック(以下、「対象ブロック」という)に隣接する復号済みの参照画素を用いて予測画像を生成する。非特許文献1に記載のHEVCでは、Planar予測、DC予測、及び複数の方向性予測を含む計35通りのイントラ予測モードから画像符号化装置側で最適なモードを選択し、そのモードを示す識別情報を画像復号装置側へ伝送する。
【0004】
また、HEVCでは、対象ブロックの周辺のブロックに適用されたイントラ予測モードから3つの最確モード(MPM:Most Probable Mode)を生成する。対象ブロックに適用するイントラ予測モードが3つの最確モードのいずれかである場合、その最確モードを示す識別情報を符号化することにより、イントラ予測モードの識別情報の符号量を削減している。
【0005】
さらに、次世代の画像符号化方式の性能評価用ソフトウェア(JEM)では、HEVCの拡張として67通りのイントラ予測モードを導入しており、より精密なイントラ予測を可能としている。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Recommendation ITU-T H.265,(12/2016), “High efficiency video coding”, International Telecommunication Union
【発明の開示】
【0007】
ところで、対象ブロックに適用するイントラ予測モードを選択する際には、予め規定された複数のイントラ予測モードのそれぞれについて、参照画素を用いて予測画像を生成して評価し、最も良好な予測画像が得られるイントラ予測モードを選択することが一般的である。よって、選択されるイントラ予測モードは、予測画像を生成する際に用いる参照画素と相関関係を有する。
【0008】
しかしながら、非特許文献1に記載の方法は、イントラ予測モードの識別情報の符号量を削減するにあたり、対象ブロックの周辺のブロックに適用されたイントラ予測モードを考慮するものの、予測画像を生成する際に用いる参照画素を考慮していないため、イントラ予測モードの識別情報の符号量を効率的に削減する点において改善の余地があった。
【0009】
特に、次世代の画像符号化方式では、イントラ予測モードが67通りに拡張されるため、イントラ予測モードの識別情報の符号量を効率的に削減することが望まれる。
【0010】
そこで、本発明は、イントラ予測モードの識別情報の符号量を効率的に削減可能な画像符号化装置、画像復号装置、及びプログラムを提供することを目的とする。
【0011】
第1の特徴に係る画像符号化装置は、動画像を構成するフレーム単位の原画像を分割して得られた各ブロックを符号化する。前記画像符号化装置は、予め規定された複数のイントラ予測モードのそれぞれに符号量を割り当てる符号量割当部と、前記複数のイントラ予測モードの中からイントラ予測の対象ブロックに適用するイントラ予測モードを選択するモード選択部と、前記選択されたイントラ予測モードを示す識別情報を、前記割り当てられた符号量に従って符号化する符号化部と、を備える。前記符号量割当部は、前記対象ブロックに隣接する複数の参照画素の特徴量を算出する特徴量算出部と、前記算出された特徴量に基づいて、前記複数のイントラ予測モードに対する符号量の割当方法を変更する割当変更部と、を備える。
【0012】
第2の特徴に係る画像復号装置は、動画像を構成するフレーム単位の画像を分割して得られた各ブロックを復号する。前記画像復号装置は、画像符号化装置により生成された符号化データを復号することにより、イントラ予測モードの識別情報を取得する復号部と、予め規定された複数のイントラ予測モードのそれぞれに符号量を割り当てる符号量割当部と、前記復号された識別情報と前記割り当てられた符号量とに基づいて、イントラ予測の対象ブロックに適用するイントラ予測モードを特定するモード特定部と、を備える。前記符号量割当部は、前記対象ブロックに隣接する複数の参照画素の特徴量を算出する特徴量算出部と、前記算出された特徴量に基づいて、前記複数のイントラ予測モードに対する符号量の割当方法を変更する割当変更部と、を備える。
【0013】
第3の特徴に係るプログラムは、コンピュータを第1の特徴に係る画像符号化装置として機能させる。
【0014】
第4の特徴に係るプログラムは、コンピュータを第2の特徴に係る画像復号装置として機能させる。
【0015】
本発明によれば、イントラ予測モードの識別情報の符号量を効率的に削減可能な画像符号化装置、画像復号装置、及びプログラムを提供できる。
【図面の簡単な説明】
【0016】
【
図1】実施形態に係る画像符号化装置の構成を示す図である。
【
図2】実施形態に係るイントラ予測モードを示す図である。
【
図3】実施形態に係る画像復号装置の構成を示す図である。
【
図4】実施形態に係る符号量割当部の構成を示す図である。
【
図5】実施形態に係る符号量割当部の動作例を示す図である。
【
図6】実施形態に係る特徴量の算出に用いる参照画素を示す図である。
【発明を実施するための形態】
【0017】
図面を参照して、実施形態に係る画像符号化装置及び画像復号装置について説明する。実施形態に係る画像符号化装置及び画像復号装置は、MPEGに代表される動画の符号化及び復号を行う。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。
【0018】
(1.画像符号化装置の構成)
図1は、本実施形態に係る画像符号化装置1の構成を示す図である。
図1に示すように、画像符号化装置1は、ブロック分割部100と、減算部110と、変換部121と、量子化部122と、エントロピー符号化部(符号化部)130と、逆量子化部141と、逆変換部142と、合成部150と、メモリ161と、インター予測部162と、イントラ予測部170と、切替部163と、符号量割当部180とを備える。
【0019】
ブロック分割部100は、動画像を構成するフレーム(或いはピクチャ)単位の入力画像をブロック状の小領域に分割し、分割により得たブロックを減算部110に出力する。ブロックのサイズは、例えば32×32画素、16×16画素、8×8画素、又は4×4画素等である。ブロックの形状は正方形に限らず、長方形であってもよい。ブロックは、画像符号化装置1が符号化を行う単位及び画像復号装置2が復号を行う単位であり、符号化ユニット(CU)と称されることもある。
【0020】
減算部110は、ブロック分割部100から入力されたブロックとこのブロックに対応する予測画像(予測ブロック)との間の画素単位での差分を示す予測残差を算出する。具体的には、減算部110は、ブロックの各画素値から予測画像の各画素値を減算することにより予測残差を算出し、算出した予測残差を変換部121に出力する。予測画像は、後述する切替部163から減算部110に入力される。
【0021】
変換部121及び量子化部122は、ブロック単位で直交変換処理及び量子化処理を行う変換・量子化部120を構成する。
【0022】
変換部121は、減算部110から入力された予測残差に対して直交変換を行って変換係数を算出し、算出した変換係数を量子化部122に出力する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT: Karhunen-Loeve Transform)等をいう。
【0023】
量子化部122は、変換部121から入力された変換係数を量子化パラメータ(Qp)及び量子化行列を用いて量子化し、量子化変換係数を生成する。量子化パラメータ(Qp)は、ブロック内の各変換係数に対して共通して適用されるパラメータであって、量子化の粗さを定めるパラメータである。量子化行列は、各変換係数を量子化する際の量子化値を要素として有する行列である。量子化部122は、量子化制御情報、生成した量子化変換係数情報などをエントロピー符号化部130及び逆量子化部141に出力する。
【0024】
エントロピー符号化部130は、量子化部122から入力された量子化変換係数に対してエントロピー符号化を行い、データ圧縮を行って符号化データ(ビットストリーム)を生成し、符号化データを画像符号化装置1の外部に出力する。エントロピー符号化には、ハフマン符号やCABAC(Context-based Adaptive Binary Arithmetic Coding;コンテキスト適応型2値算術符号)等を用いることができる。なお、エントロピー符号化部130には、イントラ予測部170及びインター予測部162から予測に関する情報が入力される。エントロピー符号化部130は、これらの情報のエントロピー符号化も行う。
【0025】
逆量子化部141及び逆変換部142は、ブロック単位で逆量子化処理及び逆直交変換処理を行う逆量子化・逆変換部140を構成する。
【0026】
逆量子化部141は、量子化部122が行う量子化処理に対応する逆量子化処理を行う。具体的には、逆量子化部141は、量子化部122から入力された量子化変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、変換係数を復元し、復元した変換係数を逆変換部142に出力する。
【0027】
逆変換部142は、変換部121が行う直交変換処理に対応する逆直交変換処理を行う。例えば、変換部121が離散コサイン変換を行った場合には、逆変換部142は逆離散コサイン変換を行う。逆変換部142は、逆量子化部141から入力された変換係数に対して逆直交変換を行って予測残差を復元し、復元した予測残差である復元予測残差を合成部150に出力する。
【0028】
合成部150は、逆変換部142から入力された復元予測残差を、切替部163から入力された予測画像と画素単位で合成する。合成部150は、復元予測残差の各画素値と予測画像の各画素値を加算してブロックを再構成(復号)し、再構成したブロックである再構成ブロックをメモリ161に出力する。かかる再構成ブロックは、復号済みブロックと称されることがある。
【0029】
メモリ161は、合成部150から入力された再構成ブロックを記憶する。メモリ161は、再構成ブロックをフレーム単位で記憶する。
【0030】
インター予測部162は、メモリ161に記憶されたフレーム単位の再構成画像(復号画像)を参照画像として用いて予測対象のブロックを予測するインター予測を行う。具体的には、インター予測部162は、ブロックマッチングなどの手法により動きベクトルを算出し、動きベクトルに基づいてインター予測画像を生成する。インター予測部162は、複数の参照画像を用いるインター予測(典型的には、双予測)や、1つの参照画像を用いるインター予測(片方向予測)の中から最適なインター予測方法を選択し、選択したインター予測方法を用いてインター予測を行う。インター予測部162は、生成したインター予測画像を切替部163に出力するとともに、選択したインター予測方法及び動きベクトルに関する情報をエントロピー符号化部130に出力する。
【0031】
イントラ予測部170は、メモリ161に記憶された再構成ブロック(復号済みブロック)のうち、予測対象のブロックに隣接する復号済み参照画素を参照してイントラ予測画像を生成する。また、イントラ予測部170は、予め規定された複数のイントラ予測モードの中から、対象ブロックに適用する最適なイントラ予測モードを選択するモード選択部171を含み、選択したイントラ予測モードを用いてイントラ予測を行う。
【0032】
モード選択部171は、予め規定された複数のイントラ予測モードのそれぞれについて、参照画素を用いて対象ブロックの予測画像を生成して評価し、最も良好な予測画像が得られるイントラ予測モードを選択する。例えば、モード選択部171は、RD(Rate Distortion)コストに基づいて最適なイントラ予測モードを選択する。イントラ予測部170は、イントラ予測画像を切替部163に出力するとともに、選択したイントラ予測モードのモード番号をエントロピー符号化部130に出力する。なお、モード選択部171により選択されたイントラ予測モードのモード番号が画像復号装置2にそのまま伝送されるのではなく、モード番号に対応する識別情報がエントロピー符号化部130において符号化され、符号化された識別情報が画像復号装置2に伝送される。
【0033】
図2は、本実施形態に係る複数のイントラ予測モードを示す図である。
図2に示すように、0から66までの67通りのイントラ予測モードが規定されている。イントラ予測モードのモード番号「0」はPlanar予測であり、イントラ予測モードのモード番号「1」はDC予測であり、イントラ予測モードのモード番号「2」~「66」は方向性予測である。イントラ予測モードのモード番号は、イントラ予測モードに固有の番号であって、予め規定された固定の番号である。方向性予測において、矢印の方向は予測方向を示し、矢印の起点は予測対象の画素の位置を示し、矢印の終点はこの予測対象画素の予測に用いる参照画素の位置を示す。モード番号「2」~「33」は、イントラ予測の対象ブロックの左側の参照画素を主として参照するイントラ予測モードである。一方で、モード番号「35」~「66」は、イントラ予測の対象ブロックの上側の参照画素を主として参照するイントラ予測モードである。
【0034】
切替部163は、イントラ予測部170から入力されるイントラ予測画像とインター予測部162から入力されるインター予測画像とを切り替えて、いずれかの予測画像を減算部110及び合成部150に出力する。
【0035】
符号量割当部180は、予め規定された複数のイントラ予測モードのそれぞれに符号量を割り当てる。また、符号量割当部180は、イントラ予測の対象ブロックに隣接する複数の参照画素の特徴量を算出し、算出した特徴量に基づいて、予め規定された複数のイントラ予測モードに対する符号量の割当方法を変更する。なお、参照画素は、復号済ブロックの一部であるため、画像符号化装置1側及び画像復号装置2側で一致する情報である。符号量割当部180の詳細については後述する。
【0036】
エントロピー符号化部130は、イントラ予測部170(モード選択部171)により選択されたイントラ予測モードを示す識別情報を、符号量割当部180により割り当てられた符号量に従って符号化する。具体的には、エントロピー符号化部130は、モード選択部171により選択されたイントラ予測モードのモード番号に対応する識別情報を符号化し、符号化した識別情報を符号化データに含める。
【0037】
(2.画像復号装置の構成)
図3は、本実施形態に係る画像復号装置2の構成を示す図である。
図3に示すように、画像復号装置2は、エントロピー符号復号部(復号部)200と、逆量子化部211と、逆変換部212と、合成部220と、メモリ231と、インター予測部232と、イントラ予測部240と、切替部233と、符号量割当部250とを備える。
【0038】
エントロピー符号復号部200は、画像符号化装置1により生成された符号化データを復号し、量子化変換係数を逆量子化部211に出力する。また、エントロピー符号復号部200は、符号化データを復号し、予測(イントラ予測及びインター予測)に関する情報を取得し、予測に関する情報をイントラ予測部240及びインター予測部232に出力する。具体的には、エントロピー符号復号部200は、イントラ予測モードの識別情報をイントラ予測部240に出力し、インター予測方法及び動きベクトルに関する情報をインター予測部232に出力する。
【0039】
逆量子化部211及び逆変換部212は、ブロック単位で逆量子化処理及び逆直交変換処理を行う逆量子化・逆変換部210を構成する。
【0040】
逆量子化部211は、画像符号化装置1の量子化部122が行う量子化処理に対応する逆量子化処理を行う。逆量子化部211は、エントロピー符号復号部200から入力された量子化変換係数を、量子化パラメータ(Qp)及び量子化行列を用いて逆量子化することにより、変換係数を復元し、復元した変換係数を逆変換部212に出力する。
【0041】
逆変換部212は、画像符号化装置1の変換部121が行う直交変換処理に対応する逆直交変換処理を行う。逆変換部212は、逆量子化部211から入力された変換係数に対して逆直交変換を行って予測残差を復元し、復元した予測残差(復元予測残差)を合成部220に出力する。
【0042】
合成部220は、逆変換部212から入力された予測残差と、切替部233から入力された予測画像とを画素単位で合成することにより、元のブロックを再構成(復号)し、再構成ブロックをメモリ231に出力する。
【0043】
メモリ231は、合成部220から入力された再構成ブロックを記憶する。メモリ231は、再構成ブロックをフレーム単位で記憶する。メモリ231は、フレーム単位の再構成画像(復号画像)を画像復号装置2の外部に出力する。
【0044】
インター予測部232は、メモリ161に記憶されたフレーム単位の再構成画像(復号画像)を参照画像として用いて予測対象のブロックを予測するインター予測を行う。インター予測部232は、エントロピー符号復号部200から入力されたインター予測情報(動きベクトル情報等)に従ってインター予測を行うことによりインター予測画像を生成し、インター予測画像を切替部233に出力する。
【0045】
イントラ予測部240は、メモリ231に記憶された再構成ブロックを参照し、エントロピー符号復号部200から入力されたイントラ予測情報(イントラ予測モードの識別情報)に従ってイントラ予測を行うことによりイントラ予測画像を生成する。イントラ予測部240は、エントロピー符号復号部200から入力された識別情報に基づいて、対象ブロックに適用するイントラ予測モードを特定するモード特定部241を含む。イントラ予測部240は、メモリ231に記憶された再構成ブロック(復号済みブロック)のうち、モード特定部241により特定されたイントラ予測モードに応じて定められる隣接参照画素を参照してイントラ予測画像を生成する。イントラ予測部240は、イントラ予測画像を切替部233に出力する。
【0046】
切替部233は、イントラ予測部240から入力されるイントラ予測画像とインター予測部232から入力されるインター予測画像とを切り替えて、いずれかの予測画像を合成部220に出力する。
【0047】
符号量割当部250は、予め規定された複数のイントラ予測モードのそれぞれに符号量を割り当てる。また、符号量割当部250は、イントラ予測の対象ブロックに隣接する複数の参照画素の特徴量を算出し、算出した特徴量に基づいて、予め規定された複数のイントラ予測モードに対する符号量の割当方法を変更する。なお、参照画素は、復号済ブロックの一部であるため、画像符号化装置1側及び画像復号装置2側で一致する情報である。符号量割当部250の詳細については後述する。
【0048】
モード特定部241は、エントロピー符号復号部200から入力されたイントラ予測情報(イントラ予測モードの識別情報)と、符号量割当部250により割り当てられた符号量とに基づいて、対象ブロックに適用するイントラ予測モードを特定する。
【0049】
(3.符号量割当部の構成)
図4は、本実施形態に係る画像符号化装置1の符号量割当部180の構成を示す図である。なお、画像復号装置2の符号量割当部250は、画像符号化装置1の符号量割当部180と同様の構成を有する。
【0050】
図4に示すように、符号量割当部180は、特徴量算出部181と、MPM生成部(第1生成部)182aと、選択モード生成部(第2生成部)182bと、非選択モード生成部(第3生成部)182cと、割当変更部183とを備える。
【0051】
特徴量算出部181には、イントラ予測部240から、イントラ予測の対象ブロックに隣接する複数の参照画素の画素値が入力される。特徴量算出部181は、複数の参照画素の画素値の分散値又は平均値を特徴量として算出する。本実施形態において、複数の参照画素が複数の参照画素グループを含み、特徴量算出部181は、複数の参照画素グループのそれぞれの特徴量を算出する。複数の参照画素グループは、対象ブロックの左側の参照画素からなる左側参照画素のグループと、対象ブロックの上側の参照画素からなる上側参照画素のグループとを含む。左側参照画素をさらに複数のグループに分割してもよいし、上側参照画素をさらに複数のグループに分割してもよい。以下において、一例として、複数の参照画素グループが左側参照画素のグループ及び上側参照画素のグループの2つのグループに分割する場合について説明する。特徴量算出部181は、参照画素グループごとに算出した特徴量を割当変更部183に出力する。
【0052】
MPM生成部182aは、イントラ予測の対象ブロックの周辺のブロックに適用されたイントラ予測モードに対応する複数のMPM(複数の第1予測モード)を生成する。本実施形態において、MPM生成部182aは、MPM0~MPM5の計6通りのMPMを生成する。具体的には、MPM生成部182aは、イントラ予測の対象ブロックの周辺のブロック及びそれに適用されたイントラ予測モードについて優先順位付けをして、最も優先順位が高いイントラ予測モード(或いは周辺ブロック)をMPM0とし、最も優先順位が低いイントラ予測モード(或いは周辺ブロック)をMPM5とし、優先順位が高い順にMPMを生成する。MPM生成部182aは、生成したMPMを選択モード生成部182b、非選択モード生成部182c、及び割当変更部183に出力する。
【0053】
選択モード生成部182bは、MPMに含まれないイントラ予測モードのうち一部のイントラ予測モードからなる複数の選択モード(第2予測モード)を生成する。本実施形態において、選択モード生成部182bは、選択モード0~選択モード15の計16通りの選択モードを生成する。選択モード生成部182bは、MPMに含まれないイントラ予測モードの中からモード番号の昇順(小さい方から大きい方への順序)又は降順(大きい方から小さい方への順序)に所定間隔で選択したイントラ予測モードを選択モードとして生成する。以下において、選択モード生成部182bが、MPMに含まれないイントラ予測モードの中からモード番号の昇順に「4」間隔で選択したイントラ予測モードを選択モードとして生成する一例について説明する。選択モード生成部182bは、生成した選択モードを非選択モード生成部182c及び割当変更部183に出力する。
【0054】
非選択モード生成部182cは、MPM及び選択モードのいずれにも含まれないイントラ予測モードの中からモード番号の昇順又は降順に選択したイントラ予測モードを複数の非選択モード(第3予測モード)として生成する。本実施形態において、非選択モード生成部182cは、非選択モード0~非選択モード44の計45通りの非選択モードを生成する。非選択モードは、前半のグループと後半のグループとに分けられ、前半のグループよりも後半のグループの方が割り当てられるビット長(符号量)が多い。以下において、非選択モード生成部182cが、MPM及び選択モードのいずれにも含まれないイントラ予測モードの中からモード番号の昇順に選択したイントラ予測モードを非選択モードとして生成する一例について説明する。よって、モード番号が小さい方のグループに属するイントラ予測モード(すなわち、左側参照画素を主に参照するイントラ予測モード)に割り当てられる符号量は、モード番号が大きい方のグループに属するイントラ予測モード(すなわち、上側参照画素を主に参照するイントラ予測モード)に割り当てられる符号量よりも少ない。非選択モード生成部182cは、生成した非選択モードを割当変更部183に出力する。
【0055】
ここで、MPM、選択モード、及び非選択モードに割り当てられる符号量の一例を表1に示す。
【0056】
【0057】
表1に示すように、各イントラ予測モードは、MPMフラグ、選択モードフラグ、及び識別情報の組み合わせにより表現される。MPMフラグは、対応するイントラ予測モードがMPMに属するか否かを示すフラグである。選択モードフラグは、対応するイントラ予測モードが選択モードに属するか否かを示すフラグである。なお、MPMにおいて選択フラグが「N/A」である場合、MPMフラグの次に識別情報の先頭ビットが続く。
【0058】
MPMに割り当てられる識別情報の符号量は、1ビット~5ビットの範囲内である。MPMの番号が小さいほど、割り当てられる識別情報の符号量が少ない。選択モードに割り当てられる識別情報の符号量は、4ビットである。非選択モードの前半部分に割り当てられる識別情報の符号量は5ビットであり、非選択モードの後半部分に割り当てられる識別情報の符号量は6ビットである。
【0059】
上述のように、MPM生成部182a、選択モード生成部182b、及び非選択モード生成部182cのそれぞれが予め規定された選択規則に従ってイントラ予測モードを選択することにより、各イントラ予測モードに対して割り当てられる符号量が決定される。しかしながら、モード選択部171により選択される可能性が高いイントラ予測モードに対して多くの符号量が割り当てられている場合、発生する符号量が多くなり得るため、符号化効率の低下を引き起こす。
【0060】
そこで、本実施形態において、割当変更部183は、イントラ予測に用いる参照画素の特徴量に基づいて、モード選択部171により選択される可能性が高いと推定されるイントラ予測モードに対して少ない符号量を割り当てるように、各イントラ予測モードに対する符号量の割当方法を変更する。これにより、発生する符号量を削減して符号化効率を改善可能になる。
【0061】
割当変更部183は、特徴量算出部181から入力された各参照画素グループの特徴量に基づいて、イントラ予測モードに対する符号量の割当方法を変更する。割当変更部183は、閾値比較部183aと、MPM変更部(第1変更部)183bと、選択モード変更部(第2変更部)183cと、非選択モード変更部(第3変更部)183dとを備える。
【0062】
閾値比較部183aは、各参照画素グループの特徴量を1又は複数の閾値と比較する。また、閾値比較部183aは、各参照画素グループの特徴量と1又は複数の閾値との比較結果に応じて、各イントラ予測モードに対する符号量の割当方法を変更するか否か、及び、各イントラ予測モードに対する符号量の割当方法をどのように変更するかを決定する。以下において、閾値比較部183aが、各参照画素グループ(左側参照画素、上側参照画素)の特徴量を2つの閾値Tmin、TMaxと比較する一例について説明する。なお、閾値は、定数であってもよいし、該当グループの参照画素の数、ブロックサイズ、ブロック形状の少なくともいずれか1つの要素に依存する値であってもよい。
【0063】
MPM変更部183bは、MPM生成部182aから入力されたMPMに対する符号量の割当方法を変更する。本実施形態において、MPM変更部183bは、MPM生成部182aから入力されたMPMの順番を並び替えることにより、MPMに対する符号量の割当方法を変更し、順番の並び替え後のMPMをエントロピー符号化部130に出力する。但し、符号量の割当方法を変更しない場合には、MPM変更部183bは、MPM生成部182aから入力されたMPMをそのまま出力する。
【0064】
選択モード変更部183cは、選択モードに対する符号量の割当方法を変更する。選択モード変更部183cは、MPMに含まれないイントラ予測モードの中から選択モードに含めるイントラ予測モードの間隔(所定間隔)、及び選択モードとして選択され得るモード番号の範囲の少なくとも一方を変更することによって、符号量の割り当て方法を変更し、変更後の選択モードを非選択モード変更部183d及びエントロピー符号化部130に出力する。但し、符号量の割当方法を変更しない場合には、選択モード変更部183cは、選択モード生成部182bから入力された選択モードをそのまま出力する。
【0065】
非選択モード変更部183dは、非選択モードに対する符号量の割当方法を変更する。非選択モード変更部183dは、非選択モードとして選択するイントラ予測モードのモード番号の順序を、昇順から降順に変更する、又は降順から昇順に変更することによって、符号量の割り当て方法を変更し、変更後の非選択モードをエントロピー符号化部130に出力する。
【0066】
(4.符号量割当部の動作例)
図5は、本実施形態に係る画像符号化装置1の符号量割当部180の動作例を示す図である。なお、画像復号装置2の符号量割当部250は、画像符号化装置1の符号量割当部180と同様の動作を行う。
【0067】
図5に示すように、ステップS1において、特徴量算出部181は、イントラ予測の対象ブロックの左側参照画素の特徴量P
L及び対象ブロックの上側参照画素の特徴量P
Aを算出する。本動作例においては、特徴量が分散値である一例について説明する。特徴量算出部181は、左側参照画素の分散値P
L及び上側参照画素の分散値P
Aを下記の式によりそれぞれ算出する。
【0068】
【0069】
図6は、特徴量の算出に用いる参照画素を示す図である。
図6において、対象ブロックのブロックサイズは4×4である。
図6に示すように、左側参照画素は{L1,L2,L3,L4}の4つの復号済み画素からなり、上側参照画素は{A1,A2,A3,A4}の4つの復号済み画素からなる。なお、L5~L8の画素やA5~A8の画素は、イントラ予測の際に参照され得るが、イントラ予測の際に復号済みではないことがある。かかる場合、L4の画素値をL5~L8の画素にコピーしたり、A4の画素値をA5~A8の画素にコピーしたりすることで、イントラ予測の際に参照可能としている。よって、特徴量の算出にはL5~L8の画素やA5~A8の画素を用いない。
【0070】
ステップS2において、閾値比較部183aは、左側参照画素の分散値PL及び上側参照画素の分散値PAを閾値Tmin、TMaxと比較する。
【0071】
分散値PL及び分散値PAのいずれも閾値TMaxを上回る場合(ステップS3:YES)、ステップS4において、MPM変更部183bは、DCモードの符号量を相対的に多くするようにMPMの順番を並び替える。具体的には、分散値PL及び分散値PAのいずれも閾値TMaxを上回る場合、DCモードが選択される可能性が低いと推定されるため、DCモードの符号量を多くしつつ、他のイントラ予測モードの符号量を少なくするように変更する。
【0072】
分散値PLが閾値TMaxを上回り、且つ、分散値PAが閾値Tminを下回る場合(ステップS5:YES)、ステップS6において、MPM変更部183bは、DCモードの符号量を多くするように、MPM生成部182aから入力されたMPMの順番を並び替える。また、選択モード変更部183c及び非選択モード変更部183dは、左側参照画素を主に用いる方向性予測の符号量を少なくするように、符号量の割当方法を変更する。具体的には、左側参照画素を主に用いる方向性予測が選択される可能性が高いと推定されるため、左側参照画素を主に用いる方向性予測の符号量を少なくしつつ、上側参照画素を主に用いる方向性予測の符号量を多くするように変更する。
【0073】
分散値PLが閾値Tminを下回り、且つ、分散値PAが閾値TMaxを上回る場合(ステップS7:YES)、ステップS8において、MPM変更部183bは、DCモードの符号量を多くするようにMPMの順番を並び替える。また、選択モード変更部183c及び非選択モード変更部183dは、上側参照画素を主に用いる方向性予測の符号量を少なくするように、符号量の割当方法を変更する。具体的には、上側参照画素を主に用いる方向性予測が選択される可能性が高いと推定されるため、上側参照画素を主に用いる方向性予測の符号量を少なくしつつ、左側参照画素を主に用いる方向性予測の符号量を多くするように変更する。
【0074】
ステップS3、ステップS5、及びステップS7の何れもNOである場合、ステップS9において、閾値比較部183aは、符号量の割当方法を変更しないと判定する。
【0075】
(5.具体例)
図5に示す動作について具体例を挙げて説明する。
【0076】
(5.1.具体例1)
具体例1は、分散値PL及び分散値PAのいずれも閾値TMaxを上回る場合(ステップS3:YES)の例であって、左側参照画素及び上側参照画素の画素値が次の値である。
【0077】
左側参照画素{L1,L2,L3,L4}={200,700,800,100}
上側参照画素{A1,A2,A3,A4}={800,100,200,700}
また、閾値{Tmin,TMax}={100,10000}である。
【0078】
このとき、
PL=PA=92500
であるため、
PL=PA>TMax
という結果を閾値比較部183aが出力する。
【0079】
かかる場合、MPM変更部183bは、DCモードの符号量を相対的に多くするようにMPMの順番を並び替える。ここで、MPMには、デフォルトの固定値であるMPM初期値と、周辺ブロックに適用されたイントラ予測モードに基づき可変なMPMとがある。
【0080】
MPM変更部183bは、MPM初期値を次のように変更する。
【0081】
(変更前){Planarモード,DCモード,VERモード,HORモード,2,34}
(変更後){Planarモード,VERモード,HORモード,2,34,DCモード}
【0082】
このように、変更前においてDCモードはMPM 1であるが、変更後におけるDCモードはMPM 5に繰り下がっており、DCモードに割り当てられる符号量が増加している。代わりに、VERモード,HORモード,2,34は、MPM番号が1つ繰り上がっており、割り当てられる符号量が減少している。
【0083】
MPM変更部183bは、初期値以外のMPMを次のように変更する。
【0084】
(変更前){左ブロック,上ブロック,Planarモード,DCモード,左下ブロック,右上ブロック,左上ブロック}
(変更後){左ブロック,上ブロック,Planarモード,左下ブロック,右上ブロック,左上ブロック,DCモード}
【0085】
このように、変更前においてDCモードはMPM 3であるが、変更後におけるDCモードはMPM 5に繰り下がっている。代わりに、左下ブロック,右上ブロック,左上ブロックは、MPM番号が1つ繰り上がっている。
【0086】
(5.2.具体例2)
具体例2は、分散値PLが閾値Tminを下回り、且つ、分散値PAが閾値TMaxを上回る場合(ステップS7:YES)の例であって、左側参照画素及び上側参照画素の画素値が次の値である。
【0087】
{L1,L2,L3,L4}={510,500,490,500}
{A1,A2,A3,A4}={500,350,300,150}
また、閾値{Tmin,TMax}={100,10000}である。
【0088】
このとき、
PL=50,PA=15625
であるため、
PL<Tmin,PA>TMax
という結果を閾値比較部183aが出力する。
【0089】
かかる場合、MPM変更部183bは、具体例1と同様にして、DCモードの符号量を多くするようにMPMの順番を並び替える。
【0090】
また、選択モード変更部183cは、上側参照画素を主に用いる方向性予測の符号量を少なくするように、符号量の割当方法を次のように変更する。
【0091】
(変更前){2,6,10,14,…}:モード番号の昇順、間隔4
(変更後){66,64,62,60,…}:モード番号の降順、間隔2
【0092】
このように、変更前における選択モードにはモード番号の昇順に間隔4で選択されたイントラ予測モードが含まれているが、変更後における選択モードにはモード番号の降順に間隔2で選択されたイントラ予測モードが含まれている。
【0093】
かかる変更により間隔が半分になっているため、上側参照画素を主に用いる方向性予測であるモード番号「35」~「66」の範囲内のイントラ予測モードは選択モードに含まれ得るが、左側参照画素を主に用いる方向性予測であるモード番号「2」~「33」の範囲内のイントラ予測モードは選択モードに含まれないことになる。その結果、モード番号「2」~「33」の範囲内のイントラ予測モードは、より符号量の多い非選択モードに含まれることになる。
【0094】
さらに、非選択モード変更部183dは、上側参照画素を主に用いる方向性予測の符号量を少なくするように、符号量の割当方法を次のように変更する。
【0095】
(変更前)5ビット{3,4,5,7,…}、6ビット{…,62,63,64,65}:モード番号の昇順
(変更後)5ビット{65,63,61,59,…}、6ビット{…,7,5,4,3}:モード番号の降順
【0096】
このように、変更前における非選択モードにはモード番号の昇順に選択されたイントラ予測モードが含まれているが、変更後における選択モードにはモード番号の降順に選択されたイントラ予測モードが含まれている。上側参照画素を主に用いる方向性予測であるモード番号「35」~「66」の範囲内のイントラ予測モードには、変更前において6ビットの符号量が割り当てられているが、変更後においては5ビットの符号量が割り当てられており、1ビット少なくなっている。
【0097】
(6.その他の実施形態)
上述の実施形態において、選択モード生成部182bが、MPMに含まれないイントラ予測モードの中からモード番号の昇順に所定間隔で選択したイントラ予測モードを選択モードとして生成する一例について説明した。しかしながら、選択モード生成部182bは、選択モードに含めるイントラ予測モードを他の選択基準により選択してもよい。例えば、選択モード生成部182bは、選択モードに含めるイントラ予測モードを、MPMに含まれるイントラ予測モードのモード番号に依存して決定してもよい。例えば、選択モード生成部182bは、選択モードに含めるイントラ予測モードを、MPMに含まれるイントラ予測モードのモード番号を所定値だけずらしたものとすることができる。かかる場合において、選択モード変更部183cは、上述の実施形態と同様な動作により、符号量の割当方法を変更可能である。
【0098】
画像符号化装置1が行う各処理をコンピュータに実行させるプログラム及び画像復号装置2が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。また、画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路(チップセット、SoC)として構成してもよい。同様に、画像復号装置2が行う各処理を実行する回路を集積化し、画像復号装置2を半導体集積回路(チップセット、SoC)として構成してもよい。
【0099】
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【0100】
なお、日本国特許出願第2018-066711号(2018年3月30日出願)の全内容が、参照により、本願明細書に組み込まれている。