IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特許7033946画像符号化装置及び画像符号化プログラム
<>
  • 特許-画像符号化装置及び画像符号化プログラム 図1
  • 特許-画像符号化装置及び画像符号化プログラム 図2
  • 特許-画像符号化装置及び画像符号化プログラム 図3
  • 特許-画像符号化装置及び画像符号化プログラム 図4
  • 特許-画像符号化装置及び画像符号化プログラム 図5
  • 特許-画像符号化装置及び画像符号化プログラム 図6
  • 特許-画像符号化装置及び画像符号化プログラム 図7
  • 特許-画像符号化装置及び画像符号化プログラム 図8
  • 特許-画像符号化装置及び画像符号化プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-03
(45)【発行日】2022-03-11
(54)【発明の名称】画像符号化装置及び画像符号化プログラム
(51)【国際特許分類】
   H04N 19/119 20140101AFI20220304BHJP
   H04N 19/14 20140101ALI20220304BHJP
   H04N 19/176 20140101ALI20220304BHJP
【FI】
H04N19/119
H04N19/14
H04N19/176
【請求項の数】 7
(21)【出願番号】P 2018022410
(22)【出願日】2018-02-09
(65)【公開番号】P2019087985
(43)【公開日】2019-06-06
【審査請求日】2021-01-08
(31)【優先権主張番号】P 2017211651
(32)【優先日】2017-11-01
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001106
【氏名又は名称】キュリーズ特許業務法人
(72)【発明者】
【氏名】市ヶ谷 敦郎
(72)【発明者】
【氏名】岩村 俊輔
(72)【発明者】
【氏名】根本 慎平
【審査官】坂東 大五郎
(56)【参考文献】
【文献】特開2006-295503(JP,A)
【文献】特開2010-278519(JP,A)
【文献】国際公開第2016/083840(WO,A1)
【文献】特開2008-017305(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
入力画像である現フレームを分割して得たブロックを、再度入力画像として再帰的に分割することによって複数の符号化ブロックを生成するブロック分割部と、
前記ブロック分割部が生成した符号化ブロック単位で符号化処理を行う符号化処理部とを備え、
前記ブロック分割部は、
分割対象ブロックを水平及び垂直に分割する4分割によって得られる4つの要素ブロックのそれぞれの画像特徴量を計算する特徴量計算部と、
前記特徴量計算部が計算した前記画像特徴量に基づいて、前記分割対象ブロックを2分割する際の分割方向を水平とするか又は垂直とするかを決定する2分割処理部とを有し、
前記2分割処理部は、前記決定した分割方向に従って前記分割対象ブロックを2分割することによって2つの分割ブロックを生成
前記2分割処理部は、
前記分割対象ブロックを水平に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第1の評価値を計算する処理と、
前記分割対象ブロックを垂直に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第2の評価値を計算する処理と、
前記第1の評価値と前記第2の評価値とを比較する処理と、
前記比較する処理の結果に基づいて、前記分割方向を水平とするか又は垂直とするかを決定する処理とを実行する、画像符号化装置。
【請求項2】
前記2分割処理部は、前記2つの分割ブロックのそれぞれが、前記画像特徴量が同一又は類似の2つの要素ブロックによって構成されるように、前記分割方向を決定する、請求項1に記載の画像符号化装置。
【請求項3】
入力画像である現フレームを分割して得たブロックを、再度入力画像として再帰的に分割することによって複数の符号化ブロックを生成するブロック分割部と、
前記ブロック分割部が生成した符号化ブロック単位で符号化処理を行う符号化処理部とを備え、
前記ブロック分割部は、
分割対象ブロックを予測して得た予測画像ブロックと前記分割対象ブロックとの差分を示す差分画像ブロックを取得する取得部と、
前記差分画像ブロックを水平及び垂直に分割する4分割によって得られる4つの要素ブロックのそれぞれの画像特徴量を計算する特徴量計算部と、
前記特徴量計算部が計算した前記画像特徴量に基づいて、前記分割対象ブロックを2分割する際の分割方向を水平とするか又は垂直とするかを決定する2分割処理部とを有し、
前記2分割処理部は、前記決定した分割方向に従って前記分割対象ブロックを2分割することによって2つの分割ブロックを生成
前記2分割処理部は、
前記差分画像ブロックを水平に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第1の評価値を計算する処理と、
前記差分画像ブロックを垂直に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第2の評価値を計算する処理と、
前記第1の評価値と前記第2の評価値とを比較する処理と、
前記比較する処理の結果に基づいて、前記分割方向を水平とするか又は垂直とするかを決定する処理とを実行する、画像符号化装置。
【請求項4】
前記2分割処理部は、前記2つの分割ブロックのそれぞれが、前記画像特徴量が同一又は類似の2つの要素ブロックによって構成されるように、前記分割方向を決定する、請求項に記載の画像符号化装置。
【請求項5】
前記特徴量計算部は、前記要素ブロックを構成する各画素の信号値の重心又は分散を前記画像特徴量として計算する、請求項1~のいずれか一項に記載の画像符号化装置。
【請求項6】
前記符号化処理部は、
前記符号化ブロック単位で直交変換を行う変換部と、
前記符号化ブロック単位でイントラ予測及びインター予測を行う予測部とを有する、請求項1~のいずれか一項に記載の画像符号化装置。
【請求項7】
コンピュータを請求項1~のいずれか一項に記載の画像符号化装置として機能させる、画像符号化プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像符号化装置及び画像符号化プログラムに関する。
【背景技術】
【0002】
従来、リアルタイム処理の容易さから、MPEG(Moving Picture Experts Group)に代表される符号化方式では、フレームあるいはピクチャと呼ばれる1枚の画像をブロック状の小領域に分割し、ブロック単位で直交変換や予測などをブロック単位で行うことにより、効率的に符号化することでデータ量の圧縮を実現している。かかる符号化方式では、隣接するブロック間や異なるフレーム間の画像信号の類似性を利用することでインターまたはイントラ予測により信号予測を行い、予測信号と実際の信号との差分を直交変換する。そして、必要に応じて量子化処理により情報を削減し、残った信号のみをエントロピー符号化によって符号化することにより効率的な画像符号化を実現している。
【0003】
上述したような従来の符号化方式では、符号化ブロックと呼ばれるブロック単位での符号化処理は正方形のブロックを構成して処理を行っていた。符号化ブロックは予測を行う単位である予測ブロックや変換を適用する変換ブロックなどによって構成されるブロックである。符号化ブロックを構成する予測ブロックはブロック内の信号の構成要素に応じて予測ブロックを長方形に構成することがある。
【0004】
例えば、広く用いられているMPEG-2やAVC/H.264では、マクロブロックと呼ばれる正方形の符号化ブロック単位で符号化処理を行い、最新の符号化方式であるHEVC(High Efficiency Video Coding)方式でも正方形のCU(Coding Unit)と呼ばれる符号化ブロック単位で符号化処理を行う(特許文献1参照)。
【0005】
最新の符号化技術の研究では、符号化ブロックを正方形の形状に限定せず、長方形の形状を選択可能とする拡張が検討されている。このような長方形を選択する場合には正方形の矩形領域を水平又は垂直に2分割し、この分割の方向の決定を木構造で行う。具体的には、HEVCで用いられた再帰的に正方ブロックを四分割により木構造を構成する方式であるQT(Quad Tree)に対し、この分割木構造をBT(Binary Tree)とよび、四分木と二分木を組み合わせたQTBT(Quad Tree/Binary Tree)と呼ばれる符号化ブロック構成手法が検討されている。かかる拡張によって符号化ブロックの形状を柔軟に決定可能になり、符号化ブロックを、予測を行うブロック単位及び変換を行うブロック単位と共通化することで、予測ブロック及び変換ブロックに関する制御情報を伝送する必要がなくなるため、高い符号化効率を実現することが報告されている。
【先行技術文献】
【非特許文献】
【0006】
【文献】Recommendation ITU-T H.265,(12/2016), “High efficiency video coding”, International Telecommunication Union
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述したQTBTにおいては、分割対象ブロックを2分割する際の分割方向の決定にお
いて、入力した画像の分割対象ブロックを水平に分割した場合の分割ブロック及び垂直に分割した場合の分割ブロックのそれぞれに対して、直交変換、及びインター又はイントラ予測などの符号化処理をシミュレーションする。そして、その結果から符号量及び符号化による画質の劣化量等を求めて符号化効率を評価し、この評価の結果を比較することによって符号化効率の良好な分割方向を決定していた。
【0008】
しかしながら、かかる方法では、符号化処理負荷が大きく、画像符号化装置の回路規模や消費電力の増大を引き起こすという問題があった。また、このような複雑な処理を回避するために決め打ちで分割方法を決定する方法もあるが、選択の最適化が十分に行われないため十分な性能を発揮することができないという問題があった。
【0009】
そこで、本発明は、回路規模や消費電力の増大を抑制しつつ、分割対象ブロックを2分割する際の分割方向を高速かつ適切に決定することを可能とする画像符号化装置及び画像符号化プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
第1の特徴に係る画像符号化装置は、入力画像である現フレームを分割して得たブロックを、再度入力画像として再帰的に分割することによって複数の符号化ブロックを生成するブロック分割部と、前記ブロック分割部が生成した符号化ブロック単位で符号化処理を行う符号化処理部とを備える。前記ブロック分割部は、分割対象ブロックを水平及び垂直に分割する4分割によって得られる4つの要素ブロックのそれぞれの画像特徴量を計算する特徴量計算部と、前記特徴量計算部が計算した前記画像特徴量に基づいて、前記分割対象ブロックを2分割する際の分割方向を水平とするか又は垂直とするかを決定する2分割処理部とを有する。前記2分割処理部は、前記決定した分割方向に従って前記分割対象ブロックを2分割することによって2つの分割ブロックを生成する。
【0011】
第2の特徴に係る画像符号化装置は、入力画像である現フレームを分割して得たブロックを、再度入力画像として再帰的に分割することによって複数の符号化ブロックを生成するブロック分割部と、前記ブロック分割部が生成した符号化ブロック単位で符号化処理を行う符号化処理部とを備える。前記ブロック分割部は、分割対象ブロックを予測して得た予測画像ブロックと前記分割対象ブロックとの差分を示す差分画像ブロックを取得する取得部と、前記差分画像ブロックを水平及び垂直に分割する4分割によって得られる4つの要素ブロックのそれぞれの画像特徴量を計算する特徴量計算部と、前記特徴量計算部が計算した前記画像特徴量に基づいて、前記分割対象ブロックを2分割する際の分割方向を水平とするか又は垂直とするかを決定する2分割処理部とを有する。前記2分割処理部は、前記決定した分割方向に従って前記分割対象ブロックを2分割することによって2つの分割ブロックを生成する。
【0012】
第3の特徴に係る画像符号化プログラムは、コンピュータを、第1又は第2の特徴に係る画像符号化装置として機能させる。
【発明の効果】
【0013】
本発明によれば回路規模や消費電力の増大を抑制しつつ、分割対象ブロックを2分割する際の分割方向を高速かつ適切に決定することを可能とする画像符号化装置及び画像符号化プログラムを提供できる。
【図面の簡単な説明】
【0014】
図1】第1実施形態に係る画像符号化装置を示す図である。
図2】第1及び第2実施形態に係るQTBTを用いるブロック分割の一例を示す図である。
図3】第1実施形態に係るブロック分割部を示す図である。
図4】第1実施形態に係るBT分割処理部によるBT分割の一例を示す図である。
図5】第1実施形態に係るBT分割方向決定処理の一例を示す図である。
図6】第1実施形態に係るブロック分割フローの一例を示す図である。
図7】第2実施形態に係る画像符号化装置を示す図である。
図8】第2実施形態に係るブロック分割部を示す図である。
図9】第2実施形態に係るブロック分割フローの一例を示す図である。
【発明を実施するための形態】
【0015】
<1.第1実施形態>
第1実施形態に係る画像符号化装置について説明する。
【0016】
第1実施形態に係る画像符号化装置は、入力画像である現フレームを分割して得たブロックを、再度入力画像として再帰的に分割することによって複数の符号化ブロックを生成するブロック分割部と、前記ブロック分割部が生成した符号化ブロック単位で符号化処理を行う符号化処理部とを備える。前記ブロック分割部は、分割対象ブロックを水平及び垂直に分割する4分割によって得られる4つの要素ブロックのそれぞれの画像特徴量を計算する特徴量計算部と、前記特徴量計算部が計算した前記画像特徴量に基づいて、前記分割対象ブロックを2分割する際の分割方向を水平とするか又は垂直とするかを決定する2分割処理部(BT分割処理部)とを有する。前記2分割処理部は、前記決定した分割方向に従って前記分割対象ブロックを2分割することによって2つの分割ブロックを生成する。
【0017】
かかる構成によれば、変換及び予測を含む符号化処理のシミュレーションに基づく評価を用いた複雑な処理に代えて、要素ブロックの画像特徴量を用いたシンプルな処理によって分割方向(水平分割又は垂直分割)を決定できる。
【0018】
<1.1.画像符号化装置>
図1は、第1実施形態に係る画像符号化装置1を示す図である。図1に示すように、画像符号化装置1は、ブロック分割部100と符号化処理部200とを備える。符号化処理部200は、減算部201と、変換部202と、量子化部203と、エントロピー符号化部204と、逆量子化部205と、逆変換部206と、加算部207と、ループフィルタ208と、予測部209とを備える。予測部209は、イントラ予測部210と、動き補償予測部211と、切替部212とを備える。
【0019】
ブロック分割部100は、入力画像を再帰的に分割することによって複数の符号化ブロックを生成する。入力画像は、イントラフレームであってもよいし、インターフレームであってもよい。イントラフレームとは、フレーム内予測(イントラ予測)を行って符号化される画像フレームをいう。インターフレームとは、フレーム間予測(インター予測)を行って符号化される画像フレームをいう。ブロック分割部100は、生成した符号化ブロックを符号化処理部200の減算部201に出力する。ブロック分割部100の詳細については後述する。
【0020】
符号化処理部200は、ブロック分割部100が生成した符号化ブロック単位で符号化処理を行う。符号化処理部200は、隣接するブロック間や異なるフレーム間の信号の類似性を利用して予測を行い、予測信号と実際の信号との差分情報を直交変換により変換し、必要に応じて量子化処理により情報を削減し、残った信号のみをエントロピー符号化によって符号化する。
【0021】
減算部201は、ブロック分割部100が出力する符号化ブロック信号を構成する各画素の信号値から、予測部209が出力する予測画像ブロック信号を構成する各画素の信号
値を減算し、符号化ブロック信号と予測画像ブロック信号との差分を示す差分画像ブロック信号を生成する。予測画像ブロック信号は、後述するイントラ予測部210又は動き補償予測部211から切替部212を介して減算部201に入力される。減算部201は、生成した差分画像ブロック信号を変換部202に出力する。
【0022】
変換部202は、符号化ブロック単位で直交変換を行う。具体的には、変換部202は、符号化ブロックごとの差分画像ブロック信号を分割して変換ブロックを生成することなく、差分画像ブロック信号に対する直交変換を行い、符号化ブロックごとの変換係数信号を生成する。直交変換とは、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)や離散サイン変換(DST:Discrete Sine Transform)、カルーネンレーブ変換(KLT: Karhunen-Loeve Transform)等をいう。変換部202は、生成した変換係数信号を量子化部203に出力する。
【0023】
量子化部203は、変換部202が出力する変換係数信号を構成する各変換係数を量子化パラメータ及び量子化行列を用いて量子化し、量子化変換係数信号を生成する。量子化パラメータは、ブロック内のデータに対して共通して適用されるパラメータである。量子化行列は、各変換係数を量子化する際の量子化幅を示す量子化値を要素として有する行列である。量子化部203は、生成した量子化変換係数信号をエントロピー符号化部204及び逆量子化部205に出力する。
【0024】
エントロピー符号化部204は、量子化部203が出力する量子化変換係数信号をエントロピー符号化によって符号化(圧縮)し、ビットストリームを生成する。エントロピー符号化としては、例えばハフマン符号やCABAC(Context-based Adaptive Binary Arithmetic Coding)等の方式を用いることができる。
【0025】
逆量子化部205は、量子化部203が出力する量子化変換係数信号を、量子化部203が用いた量子化行列及び量子化パラメータと同じ量子化行列及び量子化パラメータを用いて逆量子化し、復元変換係数信号を生成し、生成した復元変換係数信号を逆変換部206に出力する。
【0026】
逆変換部206は、逆量子化部205が出力する復元変換係数信号に対する逆直交変換を行い、復元差分画像ブロック信号を生成する。逆変換部206が用いる逆直交変換は、変換部202が行う直交変換の逆演算である。逆変換部206は、生成した復元差分画像ブロック信号を加算部207に出力する。
【0027】
加算部207は、逆変換部206が出力する復元差分画像ブロック信号と、予測部209が出力する予測画像ブロック信号とを加算(合成)し、復元画像ブロック信号を生成する。ここで、加算部207は、復元差分画像ブロック信号を構成する各画素の信号値と予測画像ブロック信号を構成する各画素の信号値とを加算する。加算部207は、生成した復元画像ブロック信号をループフィルタ208に出力する。
【0028】
ループフィルタ208は、加算部207が出力する復元画像ブロック信号に対するフィルタリング処理を行い、ブロック歪の成分を除去する。また、鮮鋭度向上のためのフィルタ処理(例えばサンプル適応フィルタ:SAO)などを伴ってもよい。ループフィルタ208は、これらの歪の成分が除去された復元画像ブロック信号を予測部209に出力する。
【0029】
予測部209は、符号化ブロック単位でイントラ予測及びインター予測を行う。具体的
には、予測部209は、符号化ブロックごとの復元画像ブロック信号を分割して予測ブロックを生成することなく、復元画像ブロック信号に対する予測処理を行い、予測画像ブロック信号を生成する。
【0030】
イントラ予測部210は、現フレームがイントラフレームである場合に、現フレームに係る参照画像信号を用いてイントラ予測を行って現ブロックに係る予測画像ブロック信号を生成する。なお、参照画像信号は、図示を省略する参照メモリに記憶されている。イントラ予測部210は、イントラ予測のモードに関する制御情報をエントロピー符号化部204に出力する。
【0031】
動き補償予測部211は、現フレームがインターフレームである場合に、現フレームとは異なるフレームに係る参照画像信号を用いてインター予測を行い、現ブロックに係る予測画像ブロック信号を生成する。ここで、動き補償予測部211は、参照画像信号から現ブロックを基準として導出された動きベクトルで指定される位置のブロックを予測画像ブロック信号として抽出する。動き補償予測部211は、動きベクトルに関する制御情報をエントロピー符号化部204に出力する。
【0032】
切替部212は、イントラ予測部210が出力する予測画像ブロック信号(イントラ予測画像)と、動き補償予測部211が出力する予測画像ブロック信号(動き補償予測画像)とを切替えて、いずれか一方を減算部201及び加算部207に出力する。
【0033】
なお、エントロピー符号化部204は、量子化部203が出力する量子化変換係数信号を符号化するだけではなく、符号化ブロックの分割情報(ブロックサイズ等)や、イントラ予測部210及び動き補償予測部211が出力する制御情報等も符号化する。しかしながら、符号化ブロックを変換ブロック及び予測ブロックと共通化しているため、変換ブロックの分割情報及び予測ブロックの分割情報を符号化する必要はない。
【0034】
かかる画像符号化装置1は、符号化ブロック単位で直交変換を行い、符号化ブロック単位でイントラ予測及びインター予測を行う。すなわち、符号化ブロックを変換ブロック及び予測ブロックと共通化しているため、符号化ブロックを変換ブロック及び予測ブロックに分割する処理が不要である。また、変換ブロック及び予測ブロックのそれぞれの分割に関する制御情報(ブロックサイズ等)を画像復号装置側に伝達する必要がないため、符号化効率を改善できる。
【0035】
<1.2.QTBTの動作>
次に、QTBTの動作について説明する。ブロック分割部100は、QTBTを用いてブロック分割を行い、符号化ブロックを生成する。例えば、ブロック分割部100は、QTをベースにブロック分割(すなわち、4分割)を行い、BTが選択された以降は、QTを選択不可としてBTでのみ分割する。具体的には、ブロック分割部100は、分割対象ブロックを水平又は垂直に二分割し、分割ブロックを生成する。ブロック分割部100は、かかる分割方向の決定を木構造で行う。
【0036】
図2は、QTBTを用いるブロック分割の一例を示す図である。図2に示す例において、ブロック分割部100は、入力画像である現フレームを分割して得た正方形のブロックを、再度入力画像として再帰的に分割し、符号化ブロックを生成する。図2(a)はブロック分割の流れを示し、図2(b)は図2(a)のブロック分割の流れを木構造で示す。図2(b)において、「0」は水平2分割を表し、「1」は垂直2分割を表す。
【0037】
図2に示すように、1回目の分割(S1)において、ブロック分割部100は、正方形のブロックを分割対象ブロックとしてQTによる4分割を行い、正方形の4つの分割ブロックA~Dを生成する。
【0038】
2回目の分割(S2)において、ブロック分割部100は、正方形の分割ブロックAを分割対象ブロックとしてBTによる垂直2分割を行い、長方形の2つの分割ブロックA1,A2を生成する。これ以降、ブロック分割部100は、分割ブロックAについてQTを選択しない。3回目の分割(S3)において、ブロック分割部100は、長方形の分割ブロックA1を分割対象ブロックとしてBTによる垂直2分割を行い、長方形の2つの分割ブロックA11,A12を生成する。ここで、ブロック分割部100は、分割ブロックAについて収束条件が満たされたと判断して再帰的な分割を終了し、3つの符号化ブロックA11,A12,A2を決定する。
【0039】
4回目の分割(S4)において、ブロック分割部100は、正方形の分割ブロックBを分割対象ブロックとしてBTによる水平2分割を行い、長方形の2つの分割ブロックB1,B2を生成する。ここで、ブロック分割部100は、分割ブロックBについて収束条件が満たされたと判断して再帰的な分割を終了し、2つの符号化ブロックB1,B2を決定する。
【0040】
5回目の分割(S5)において、ブロック分割部100は、正方形の分割ブロックCを分割対象ブロックとしてQTによる4分割を行い、正方形の4つの分割ブロックC1,C2,C3,C4を生成する。6回目の分割(S6)において、ブロック分割部100は、正方形の分割ブロックC1を分割対象ブロックとしてBTによる垂直2分割を行い、長方形の2つの分割ブロックC11,C12を生成する。7回目の分割(S7)において、ブロック分割部100は、長方形の分割ブロックC12を分割対象ブロックとしてBTによる水平2分割を行い、正方形の2つの分割ブロックC121,C122を生成する。8回目の分割(S8)において、ブロック分割部100は、長方形の分割ブロックC4を分割対象ブロックとしてBTによる水平2分割を行い、長方形の2つの分割ブロックC41,C42を生成する。ここで、ブロック分割部100は、分割ブロックCについて収束条件が満たされたと判断して再帰的な分割を終了し、7つの符号化ブロックC11,C121,C122,C2,C3,C41,C42を決定する。
【0041】
なお、ブロック分割部100は、正方形の分割ブロックDについては収束条件が満たされていると判断して再帰的な分割を行わない。
【0042】
ブロック分割部100は、最終的に、様々な形状を有する合計13個の符号化ブロックA11,A12,A2,B1,B2,C11,C121,C122,C2,C3,C41,C42,Dを決定する。このように、QTBTによれば、符号化ブロックの形状を柔軟に決定できるため、符号化効率の高い符号化ブロックを生成できる。しかしながら、二分割されるブロックについては水平分割及び垂直分割が選択可能であるため、水平分割及び垂直分割のいずれを選択するかを決定する処理が重要になる。
【0043】
<1.3.ブロック分割部>
次に、ブロック分割部100について説明する。図3は、ブロック分割部100を示す図である。図3に示すように、ブロック分割部100は、QT分割処理部101と、特徴量計算部102と、BT分割処理部103と、収束条件評価部104とを備える。
【0044】
QT分割処理部101は、分割対象ブロックについて、QT分割における符号化コスト及びBT分割による符号化コストを例えばRD(Rate-Distortion)コスト評価によって計算し、符号化効率がより良好な方を選択する。例えば、QT分割処理部101は、QT分割及びBT分割のそれぞれについて、差分画像ブロック信号に対する復元差分画像ブロック信号の近似の度合いを示すRDコスト値を算出し、算出したコスト値に基づいてQT分割及びBT分割のうち符号化効率がより良好な方を選択する。コスト値
(指標値)としては、RD値に限らず、SAD(Sum of Absolute Differences)又はSSD(Sum of Squared Differences)等であってもよい。
【0045】
QT分割処理部101は、QT分割を選択した場合に、分割対象ブロックに対してQT分割(4分割)を行い、生成された各分割対象ブロックに対してQT分割及びBT分割のいずれを選択するかの評価を行う。QT分割処理部101は、QT分割によって収束条件が満たされたと収束条件評価部104が判断した場合には、その分割対象ブロックに対する再帰的な分割を終了し、その分割対象ブロックを符号化ブロックとして出力してもよい。一方、QT分割処理部101は、BT分割を選択した場合には、その分割対象ブロックについて以降はBT分割しか選択しないため、以降の処浬においてQT分割の評価は行わない。
【0046】
特徴量計算部102は、QT分割処理部101がBT分割を選択した場合に、その分割対象ブロックを水平及び垂直に分割する4分割によって4つの要素ブロックを得て、4つの要素ブロックのそれぞれの画像特徴量を計算する。例えば、特徴量計算部102は、4つの要素ブロックのそれぞれについて各画素の信号値の重心(平均)又は分散を画像特徴量として計算する。重心又は分散は計算が容易であるため、画像符号化装置1は、画像特徴量を低負荷かつ高速に計算できる。但し、画像特徴量として重心又は分散を用いる場合に限らず、要素ブロックの特徴を表すことが可能な他の指標値(統計値等)を画像特徴量として用いてもよい。
【0047】
BT分割処理部103は、特徴量計算部102が計算した画像特徴量に基づいて、分割対象ブロックを2分割(BT分割)する際の分割方向を水平とするか又は垂直とするかを決定する。BT分割処理部103は、決定した分割方向に従って分割対象ブロックを2分割することによって2つの分割ブロックを生成する。
【0048】
BT分割処理部103は、2つの分割ブロックのそれぞれが、画像特徴量が同一又は類似の2つの要素ブロックによって構成されるように、BT分割の分割方向を決定する。これにより、一方の分割ブロックと他方の分割ブロックとで特徴が異なるように分割対象ブロックを2分割できるため、符号化処理においてイントラ予測及びインター予測等の予測がし易い分割ブロック(符号化ブロック)を生成できる。BT分割においては、分割された領域(分割ブロック)がそれぞれ強い特徴を示すように分割することによって、予測効率を高めることができる。図4は、BT分割処理部103によるBT分割の一例を示す図である。図4に示すように、サッカーボールの画像について、BT分割処理部103は、サッカーボールを含む領域と含まない領域とに分割する。これにより、予測部209は、サッカーボールと背景とを個別に予測すればよいため、高い予測効率を実現できる。
【0049】
例えば、BT分割処理部103は、分割対象ブロックを水平に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第1の評価値を計算する。また、BT分割処理部103は、分割対象ブロックを垂直に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第2の評価値を計算する。さらに、BT分割処理部103は、第1の評価値と第2の評価値とを比較する処理を行い、この比較する処理の結果に基づいて、分割方向を水平とするか又は垂直とするかを決定する。このようにして、BT分割処理部103は、画像特徴量が近しい要素ブロック同士を結合するように分割方向を決定する。
【0050】
BT分割処理部103は、収束条件が満たされるまでBT分割を再帰的に行う。具体的には、BT分割処理部103は、収束条件が満たされるまで、分割対象ブロックを2分割して生成した分割ブロックを新たな分割対象ブロックとして更に2分割する処理を繰り返
す。その都度、特徴量計算部102は、分割対象ブロックを構成する要素ブロックの画像特徴量を計算し、BT分割処理部103はそれを分割方向の決定に用いる。
【0051】
収束条件評価部104は、分割対象ブロックについて更なる分割が必要かどうか収束条件を評価し、収束条件が満たされていない場合には、分割対象ブロックについて再帰的な分割処理を行うと判断する。収束条件は、例えば、再帰的な分割を行った場合のRDコストが再帰的な分割を行わなかった場合のRDコストよりも悪化するという条件である。この場合、収束条件評価部104は、それまでに行われた分割によって生成された分割ブロックを最適な符号化ブロックとして出力する。或いは、収束条件は、システムが要求する再帰的な分割の回数が上限回数に達したという条件であってもよい。この場合、収束条件評価部104は、再帰的な分割の回数が上限回数に達した時点での分割ブロックを最適な符号化ブロックとして出力する。
【0052】
<1.4.BT分割方向決定処理の一例>
次に、BT分割方向決定処理の一例について説明する。図5は、BT分割方向決定処理の一例を示す図である。
【0053】
図5に示すように、特徴量計算部102は、分割対象ブロックBL1を水平に2等分するとともに垂直に2等分することによって、サイズの等しい4つの要素ブロック“1”~“4”を得る。分割対象ブロックBL1はQT分割によって生成された分割ブロックであって、BT分割の対象となる最初の分割対象ブロックである。このため、分割対象ブロックBL1は正方形の形状を有する。
【0054】
特徴量計算部102は、4つの要素ブロック“1”~“4”のそれぞれの画像特徴量を計算する。特徴量計算部102は、例えば、計算負荷の少ない要素ブロックの各画素の信号値の重心を画像特徴量として計算する。信号値として、3原色の信号値を用いる場合と、簡易な手法として3原色のうち一部の信号値を用いる手法とがある。3原色信号を用いる場合、重心として、3原色信号の要素ブロック内のそれぞれの平均値で構成されるベクトルを用いる。1信号を用いる場合、重心として、要素ブロックの1信号成分の平均値を用いる。このようにして求められた要素ブロックの重心をgn(n:1~4)とする。特徴量計算部102は、計算した画像特徴量(各要素ブロックの重心g)をBT分割処理部103に出力する。
【0055】
なお、重心に限らず分散値などを併用又は単独で画像特徴量として用いてもよく、要求性能に応じてより複雑な画像特徴量を用いてもよいが、以下においては重心を画像特徴量として用いる一例を説明する。
【0056】
BT分割処理部103は、各要素ブロックの重心gに基づいて、BTの分割方向を高速に決定する。分割対象ブロックBL1を2分割する場合に取り得る要素ブロックの組み合わせは、水平分割であれば「1-2」、「3-4」であり、垂直分割であれば、「1-3」、「2-4」である。いずれの場合であっても要素ブロック“1”と“4”が結合されることはないため、BT分割処理部103は、1あるいは4を2あるいは3のいずれと結合すべきかを判断すればよい。
【0057】
要素ブロックの結合のためには隣接する要素ブロックとの画像特徴量が近いことが必要である。BT分割処理部103は、要素ブロック“1”の重心g1と要素ブロック“2”の重心g2との間の距離|g1-g2|と、要素ブロック“1”の重心g1と要素ブロック“3”の重心g3との間の距離|g1-g3|と、要素ブロック“2”の重心g2と要素ブロック“4”の重心g4との間の距離|g2-g4|と、要素ブロック“3”の重心g3と要素ブロック“4”の重心g4との間の距離|g3-g4|とを計算する。
【0058】
ここで、距離|g1-g2|及び距離|g3-g4|のそれぞれは、分割対象ブロックBL1を水平に2分割した場合の分割ブロックを構成する要素ブロック間の画像特徴量の類似度を示す第1の評価値に相当する。また、距離|g1-g3|及び距離|g2-g4|のそれぞれは、分割対象ブロックBL1を垂直に2分割した場合の分割ブロックを構成する要素ブロック間の画像特徴量の類似度を示す第2の評価値に相当する。
【0059】
BT分割処理部103は、計算した距離を比較することによって分割対象ブロックBL1の分割方向を決定する。具体的な例を以下に示す。
1. |g1-g2|<|g1-g3| かつ |g2-g4|<|g3-g4| の場合:
(A) |g1-g2|>|g2-g4| の場合:
垂直分割
(B) |g1-g2|<|g2-g4| の場合:
水平分割
2. |g1-g2|>|g1-g3| かつ |g2-g4|<|g3-g4| の場合:
垂直分割
3. |g1-g2|<|g1-g3| かつ|g2-g4|>|g3-g4| の場合:
水平分割
4. |g1-g2|>|g1-g3| かつ |g2-g4|>|g3-g4| の場合:
(A) |g1-g3|>|g3-g4| の場合:
水平分割
(B) |g1-g3|<|g3-g4| の場合:
垂直分割
なお、かかる決定方法は一例であり、かかる決定方法を一部修正して用いてもよい。例えば、BT分割処理部103は、垂直分割と水平分割との切り替えを示す制御信号によるコストを加味した判定を行ってもよいし、イントラ予測及びインター予測のいずれの予測における分割方向の決定であるかによって閾値を設けてもよい。
【0060】
BT分割処理部103は、決定した分割方向に従って分割対象ブロックBL1を2分割する。ここでは、BT分割処理部103が垂直分割を決定したと仮定して説明を進める。BT分割処理部103は、BT分割における第1階層ブロックとして、長方形(具体的には、縦長形状)の2つの分割ブロックBL11及びBL12を生成する。
【0061】
収束条件評価部104は、分割ブロックBL11及びBL12について更なるBT分割が必要かどうか収束条件を評価し、収束条件が満たされていない場合には、分割ブロックBL11及びBL12について再帰的なBT分割を行うと判断する。例えば、分割ブロックBL11について収束条件が満たされていない場合、収束条件評価部104は、分割ブロックBL11を新たな分割対象ブロックとして要素ブロック“1”~“4”のそれぞれの画像特徴量を特徴量計算部102に計算させる。
【0062】
特徴量計算部102は、分割ブロックBL11(新たな分割対象ブロック)を構成する要素ブロック“1”~“4”のそれぞれの画像特徴量を計算し、計算した画像特徴量をBT分割処理部103に出力する。BT分割処理部103は、上述した決定方法によって分割ブロックBL11(新たな分割対象ブロック)の分割方向を決定する。その後、収束条件の評価によりすべてのブロックが条件を満たすまで再帰処理が行われ、順次ブロック形状が決定する。
【0063】
<1.5.ブロック分割フローの一例>
次に、第1実施形態に係るブロック分割フローの一例について説明する。図6は、第1実施形態に係るブロック分割フローの一例を示す図である。
【0064】
図6に示すように、ステップS101において、入力画像である現フレームを例えば固定ブロックサイズのCTU(Coding Tree Unit)に分割した後、QT分割処理部101は、必要に応じてCTUをQT分割により少なくとも1回分割し、BT分割の対象となるブロック(以下、「BT分割対象ブロック」という)を得る。なお、QT分割処理部101は、必ずしもQT分割を行わなくてもよい。QT分割を行わない場合には、CTUがBT分割対象ブロックになり、CTUが直接BT分割されることになる。
【0065】
ステップS102において、特徴量計算部102は、ステップS101で得られたBT分割対象ブロックを水平及び垂直に分割する4分割によって4つの要素ブロックを得る。
【0066】
ステップS103において、特徴量計算部102は、ステップS102で得られた4つの要素ブロックのそれぞれの画像特徴量を計算する。
【0067】
ステップS104において、BT分割処理部103は、ステップS103で特徴量計算部102が計算した画像特徴量に基づいて、BT分割対象ブロックを分割する際の分割方向を水平とするか又は垂直とするかを決定する。BT分割処理部103は、画像特徴量が同一又は類似の隣接要素ブロック同士を結合するように、BT分割の分割方向(水平又は垂直)を決定する。
【0068】
ステップS105において、BT分割処理部103は、ステップS104で決定したBT分割の分割方向に従ってBT分割対象ブロックを分割し、2つの分割ブロックを得る。
【0069】
ステップS106において、収束条件評価部104は、収束条件を評価し、収束条件が満たされたか否かを判定する。収束条件が満たされた場合(ステップS106:YES)、この時点での分割ブロックを最適な符号化ブロックとして出力する。
【0070】
一方、収束条件が満たされていない場合(ステップS106:NO)、ステップS107において、収束条件評価部104は、ステップS105で得られた分割ブロックを新たなBT分割対象ブロックとする。その後、ステップS102に処理を戻し、新たなBT分割対象ブロックについてステップS102~S106の処理を行う。
【0071】
<1.6.第1実施形態のまとめ>
以上説明したように、第1実施形態に係る画像符号化装置1は、変換及び予測を含む符号化処理のシミュレーションに基づく評価を用いた複雑な処理に代えて、要素ブロックの画像特徴量を用いたシンプルな処理によってBT分割の分割方向(水平分割又は垂直分割)を決定できる。よって、画像符号化装置1の回路規模や消費電力の増大を抑制しつつ、分割方向を高速かつ適切に決定できる。
【0072】
<2.第2実施形態>
第2実施形態について、第1実施形態との相違点を主として説明する。
【0073】
第2実施形態に係る画像符号化装置は、入力画像である現フレームを分割して得たブロックを、再度入力画像として再帰的に分割することによって複数の符号化ブロックを生成するブロック分割部と、前記ブロック分割部が生成した符号化ブロック単位で符号化処理を行う符号化処理部とを備える。前記ブロック分割部は、分割対象ブロックを予測して得
た予測画像ブロックと前記分割対象ブロックとの差分を示す差分画像ブロックを取得する取得部と、前記差分画像ブロックを水平及び垂直に分割する4分割によって得られる4つの要素ブロックのそれぞれの画像特徴量を計算する特徴量計算部と、前記特徴量計算部が計算した前記画像特徴量に基づいて、前記分割対象ブロックを2分割する際の分割方向を水平とするか又は垂直とするかを決定する2分割処理部とを有する。前記2分割処理部は、前記決定した分割方向に従って前記分割対象ブロックを2分割することによって2つの分割ブロックを生成する。
【0074】
かかる構成によれば、変換及び予測を含む符号化処理のシミュレーションに基づく評価を用いた複雑な処理に代えて、要素ブロックの画像特徴量を用いたシンプルな処理によって分割方向(水平分割又は垂直分割)を決定できる。また、入力画像を用いて分割方向を決定する第1実施形態とは異なり、第2実施形態では、実際の符号化対象である差分信号(差分画像ブロック)を用いて分割方向を決定するため、第1実施形態に比べて性能を向上させることができる。
【0075】
<2.1.画像符号化装置>
図7は、第2実施形態に係る画像符号化装置1を示す図である。図7に示すように、画像符号化装置1において、ブロック分割部100Aは、BT分割対象ブロックを分割する前に、BT分割対象ブロックを減算部201及び予測部209(イントラ予測部210又は動き補償予測部211)に出力する。予測部209は、BT分割対象ブロックを予測(イントラ予測及びインター予測)し、BT分割対象ブロックに対応する予測画像ブロックを生成し、予測画像ブロックを減算部201に出力する。
【0076】
減算部201は、ブロック分割部100Aが出力するBT分割対象ブロックを構成する各画素の信号値から、予測部209が出力する予測画像ブロックを構成する各画素の信号値を減算し、BT分割対象ブロックと予測画像ブロックとの差分を示す差分画像ブロックを生成し、生成した差分画像ブロックをブロック分割部100Aに出力する。ブロック分割部100Aは、減算部201から入力された差分画像ブロックに基づいて、BT分割対象ブロックを2分割する際の分割方向を決定する。その他の構成については、第1実施形態と同様である。
【0077】
<2.2.ブロック分割部>
図8は、第2実施形態に係るブロック分割部100Aを示す図である。図8に示すように、第2実施形態に係るブロック分割部100Aは、減算部201から入力された差分画像ブロックを取得する取得部105を備える。取得部105は、取得した差分画像ブロックを特徴量計算部102に出力する。
【0078】
特徴量計算部102は、取得部105から入力された差分画像ブロックを水平及び垂直に分割する4分割によって4つの要素ブロックを得る。特徴量計算部102は、4つの要素ブロックのそれぞれの画像特徴量を計算し、計算した画像特徴量をBT分割処理部103に出力する。画像特徴量を計算する方法については、第1実施形態と同様である。
【0079】
BT分割処理部103は、特徴量計算部102から入力された各要素ブロックの画像特徴量に基づいて、BT分割対象ブロックを2分割する際の分割方向を水平とするか又は垂直とするかを決定する。BT分割処理部103は、2分割された各分割ブロックが、画像特徴量が同一又は類似の2つの要素ブロックによって構成されるように、BT分割対象ブロックの分割方向を決定する。すなわち、BT分割処理部103は、画像特徴量が同一又は類似の隣接要素ブロック同士を結合するように分割方向(水平又は垂直)を決定する。
【0080】
画像特徴量に基づいて分割方向を決定する方法の詳細については、第1実施形態と同様
である。具体的には、BT分割処理部103は、差分画像ブロックを水平に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第1の評価値を計算する処理と、差分画像ブロックを垂直に2分割した場合の分割ブロックを構成する2つの要素ブロック間の画像特徴量の類似度を示す第2の評価値を計算する処理と、第1の評価値と第2の評価値とを比較する処理と、比較する処理の結果に基づいて、BT分割の分割方向を水平とするか又は垂直とするかを決定する処理とを実行する。
【0081】
BT分割処理部103は、決定したBT分割の分割方向に従ってBT分割対象ブロックを分割し、2つの分割ブロックを得る。そして、かかるBT分割処理を収束条件が満たされるまで再帰的に行う。
【0082】
ブロック分割部100Aのその他の構成については、第1実施形態と同様である。
【0083】
<2.3.ブロック分割フローの一例>
次に、第2実施形態に係るブロック分割フローの一例について説明する。図9は、第2実施形態に係るブロック分割フローの一例を示す図である。
【0084】
図9に示すように、ステップS201において、入力画像である現フレームを例えば固定ブロックサイズのCTUに分割した後、QT分割処理部101は、必要に応じてCTUをQT分割により少なくとも1回分割し、BT分割の対象となるBT分割対象ブロックを得る。なお、QT分割処理部101は、必ずしもQT分割を行わなくてもよい。QT分割を行わない場合には、CTUがBT分割対象ブロックになり、CTUが直接BT分割されることになる。
【0085】
ステップS202において、予測部209は、BT分割対象ブロックを予測(イントラ予測及びインター予測)し、BT分割対象ブロックに対応する予測画像ブロックを生成する。
【0086】
ステップS203において、減算部201は、BT分割対象ブロックと予測画像ブロックとの画素単位での差分を示す差分画像ブロックを生成し、生成した差分画像ブロックをブロック分割部100Aに出力する。
【0087】
ステップS204において、取得部105は、減算部201から差分画像ブロックを取得する。特徴量計算部102は、取得部105が取得した差分画像ブロックを水平及び垂直に分割する4分割によって4つの要素ブロックを得る。
【0088】
ステップS205において、特徴量計算部102は、ステップS204で得られた4つの要素ブロックのそれぞれの画像特徴量を計算する。
【0089】
ステップS206において、BT分割処理部103は、ステップS205で特徴量計算部102が計算した画像特徴量に基づいて、BT分割対象ブロックを分割する際の分割方向を水平とするか又は垂直とするかを決定する。BT分割処理部103は、画像特徴量が同一又は類似の隣接要素ブロック同士を結合するように、BT分割の分割方向(水平又は垂直)を決定する。
【0090】
ステップS207において、BT分割処理部103は、ステップS206で決定したBT分割の分割方向に従ってBT分割対象ブロックを分割し、2つの分割ブロックを得る。
【0091】
ステップS208において、収束条件評価部104は、収束条件を評価し、収束条件が満たされたか否かを判定する。収束条件が満たされた場合(ステップS208:YES)
、この時点での分割ブロックを最適な符号化ブロックとして出力する。
【0092】
一方、収束条件が満たされていない場合(ステップS208:NO)、ステップS209において、収束条件評価部104は、ステップS207で得られた分割ブロックを新たなBT分割対象ブロックとする。その後、ステップS202に処理を戻し、新たなBT分割対象ブロックについてステップS202~S208の処理を行う。
【0093】
<2.4.第2実施形態のまとめ>
以上説明したように、第2実施形態に係る画像符号化装置1は、変換及び予測を含む符号化処理のシミュレーションに基づく評価を用いた複雑な処理に代えて、要素ブロックの画像特徴量を用いたシンプルな処理によって分割方向(水平分割又は垂直分割)を決定できる。また、実際の符号化対象である差分信号(差分画像ブロック)を用いて分割方向を決定するため、第1実施形態に比べて性能を向上させることができる。
【0094】
<3.その他の実施形態>
第1実施形態に係るブロック分割フローと第2実施形態に係るブロック分割フローとを条件に応じて使い分けてもよい。画像符号化装置1は、ある条件下では第1実施形態に係るブロック分割フローによりブロック分割形状を決定し、他の条件下では第2実施形態に係るブロック分割フローによりブロック分割形状を決定してもよい。
【0095】
画像符号化装置1が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
【0096】
画像符号化装置1が行う各処理を実行する回路を集積化し、画像符号化装置1を半導体集積回路として構成してもよい。画像符号化装置1をチップセットとして構成してもよい。チップセットは、画像符号化装置1が行う各処理を実行するためのプログラムを記憶するメモリ及びメモリに記憶されたプログラムを実行するプロセッサを有する。
【0097】
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0098】
1・・・画像符号化装置、100,100A・・・ブロック分割部、101・・・QT分割処理部、102・・・特徴量計算部、103・・・BT分割処理部、104・・・収束条件評価部、105・・・取得部、200・・・符号化処理部、201・・・減算部、202・・・変換部、203・・・量子化部、204・・・エントロピー符号化部、205・・・逆量子化部、206・・・逆変換部、207・・・加算部、208・・・ループフィルタ、209・・・予測部、210・・・イントラ予測部、211・・・動き補償予測部、212・・・切替部
図1
図2
図3
図4
図5
図6
図7
図8
図9