IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 大学共同利用機関法人情報・システム研究機構の特許一覧

特許7154507画像パディング方法、画像パディング装置、及びプログラム
<>
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図1
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図2
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図3
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図4
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図5
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図6
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図7
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図8
  • 特許-画像パディング方法、画像パディング装置、及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-07
(45)【発行日】2022-10-18
(54)【発明の名称】画像パディング方法、画像パディング装置、及びプログラム
(51)【国際特許分類】
   H04N 19/85 20140101AFI20221011BHJP
   H04N 19/593 20140101ALI20221011BHJP
【FI】
H04N19/85
H04N19/593
【請求項の数】 3
(21)【出願番号】P 2019047129
(22)【出願日】2019-03-14
(65)【公開番号】P2020150441
(43)【公開日】2020-09-17
【審査請求日】2021-07-02
【新規性喪失の例外の表示】特許法第30条第2項適用 平成30年11月19日に、http://www.pcsj-imps.org/archive/2018.htmlのアドレスのウェブサイトにて発表
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(73)【特許権者】
【識別番号】504202472
【氏名又は名称】大学共同利用機関法人情報・システム研究機構
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】高村 誠之
(72)【発明者】
【氏名】チョン ジーン
(72)【発明者】
【氏名】ヤン チェン
【審査官】坂東 大五郎
(56)【参考文献】
【文献】特開2002-199395(JP,A)
【文献】高木幸一、外2名,ビットレート-ひずみ特性を考慮した任意形状符号化のためのパディング法,電子情報通信学会論文誌,Vol.J84-D-II,No.2,2001年02月01日,第238~247頁
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
パディングにより任意形状画像を矩形画像に変換し、前記矩形画像を示す画像信号を画像符号化装置へ出力する画像パディング方法であって、
前記任意形状画像が分割された画像ブロックごとに、前記任意形状画像の形状を示す形状情報と、前記画像符号化装置から出力された符号化対象の前記画像ブロックの位置及び大きさを示す符号化対象ブロック情報と、に基づいてパディングを行う必要があるか否かを判定するパディング要否判定ステップと、
前記画像ブロック内に存在する画素の画素位置を示す疎行列と、前記画像ブロックに対して疎行列を乗じて得られた領域内画素情報と、前記画像符号化装置から出力された画面内予測値と、に基づいてパディング済み画像ブロックを導出し、以下の数式によって表される最小化目的関数及び制約において、1uの値を最小化する前記パディング済み画像ブロックを示すxの値を導出する求解ステップと、
前記パディングを行う必要がないと判定された場合、前記画像ブロックを示す画像信号を前記画像符号化装置へ出力し、前記パディングを行う必要があると判定された場合、前記パディング済み画像ブロックを示す画像信号を前記画像符号化装置へ出力する画像信号出力ステップと、
を有する画像パディング方法。
【数1】
ここで、uはn次元のベクトル、nは前記画像ブロックの画素数、zは前記画面内予測値、Dは前記疎行列、yは前記領域内画素情報、Φは画面内予測残差(x-z)の変換係数、及び1uはuの全要素の和を示す。
【請求項2】
パディングにより任意形状画像を矩形画像に変換し、前記矩形画像を示す画像信号を画像符号化装置へ出力する画像パディング装置であって、
前記任意形状画像が分割された画像ブロックごとに、前記任意形状画像の形状を示す形状情報と、前記画像符号化装置から出力された符号化対象の前記画像ブロックの位置及び大きさを示す符号化対象ブロック情報と、に基づいてパディングを行う必要があるか否かを判定するパディング要否判定部と、
前記画像ブロック内に存在する画素の画素位置を示す疎行列と、前記画像ブロックに対して疎行列を乗じて得られた領域内画素情報と、前記画像符号化装置から出力された画面内予測値と、に基づいてパディング済み画像ブロックを導出する求解部と、
前記画像信号を前記画像符号化装置へ出力する画像信号出力部と、
を備え、
前記求解部は、
以下の数式によって表される最小化目的関数及び制約において、1uの値を最小化する前記パディング済み画像ブロックを示すxの値を導出し、
前記画像信号出力部は、
前記パディングを行う必要がないと判定された場合、前記画像ブロックを示す画像信号を出力し、
前記パディングを行う必要があると判定された場合、前記パディング済み画像ブロックを示す画像信号を出力する
画像パディング装置。
【数2】
ここで、uはn次元のベクトル、nは前記画像ブロックの画素数、zは前記画面内予測値、Dは前記疎行列、yは前記領域内画素情報、Φは画面内予測残差(x-z)の変換係数、及び1uはuの全要素の和を示す。
【請求項3】
請求項2に記載の画像パディング装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像パディング方法、画像パディング装置、及びプログラムに関する。
【背景技術】
【0002】
従来、長方形ではない任意の形状の画像(以下、「任意形状画像」という。)を符号化する方法として、ISO/IEC(国際標準化機構及び国際電気標準会議)によって規定された映像符号化国際規格であるMPEG-4(ISO/IEC 14496-2)のSA-DCT(Shape-Adaptive Discrete Cosine Transform:形状適応離散コサイン変換)を用いた符号化方法がある。また、例えば図7に示すような任意形状画像を取り囲むように画素を外挿すること(以下、「パディング」という。)によって、当該任意形状画像を例えば図8に示すような長方形の画像(以下、「矩形画像」という。)に変換して、矩形画像を符号化することができる一般的な符号化方法を用いて符号化を行う方法がある。この方法によれば、任意形状画像を直接符号化することができないJPEG(ISO/IEC JTC 1/SC 29/WG 1、Joint Photographic Experts Group)方式等の符号化方法を用いることができる。
【0003】
最も単純なパディング方法としては、例えば符号化対象の画像が8ビットのモノクロ画像である場合、所定の画素値(例えば128)の画素によってパディングを行うことが考えられる。しかしながら、この場合、任意形状画像の境界領域(例えば、図9に示す、領域内部と外挿領域(パディング対象領域)との境の領域)において、領域内部の画素の画素値と外挿領域の画素の画素値との間に大きなギャップが生じることがある。ことにより、符号化効率(データ圧縮率)が低下する場合がある。このような符号化効率の低下を改善するため、上述したMPEG-4では、LPE(Low Pass Extrapolation)と呼ばれるパディング方法を用いることができる。LPEは、領域内部の画素の画素値を用いて、外挿領域を一種のLPF(Low Pass filter;低域通過濾波器)によってパディングする方法である。
【0004】
その他のパディング方法として、非特許文献1及び非特許文献2に記載の方法がある。これらのパディング方法は、非可逆画像符号化において大抵用いられる変換処理の後の高周波係数が0となるようなパディング信号を生成する方法である。
【先行技術文献】
【非特許文献】
【0005】
【文献】黒木祥光、上繁 義史、「任意形状DCT符号化における新たなパディング法」、2002年画像符号化シンポジウム(PCSJ2002)、P-2.12、p.31-32、2002年11月11日~13日
【文献】黒木祥光、他3名、「H.264/AVCの直交変換におけるパディング法」、社団法人 情報処理学会 研究報告、2005-AVM-50 (4)、p.17-22、2005年10月7日
【文献】N.Parikh and S.Boyd, "Proximal Algorithms," [online], the essence of knowledge, Foundations and Trends in Optimization, Vol.1, No.3, 2013, p.123-231, 2013, [平成31年3月11日検索]、インターネット<URL:http://web.stanford.edu/~boyd/papers/pdf/prox_algs.pdf>
【文献】S.Boyd and L.Vandenberghe, "Convex Optimization," Cambridge University Press, 2004. [平成31年3月11日検索]、インターネット<URL:https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0006】
非特許文献1及び非特許文献2に記載のパディング方法では、パディングを行うための計算量は、符号化対象の画像ブロックの画素数をn個とした場合、最大で、nC(n/2)に比例する計算量になる。例えば、JPEG等において用いられる8画素×8画素の画像ブロック(すなわち、n=64)の場合、パディングを行うための計算量は、最大で、64C32≒1.83×1018であり、膨大な計算量になる。さらに、例えば、H.265/HEVCで用いられる符号化単位である32画素×32画素(すなわち、n=1024)の画像ブロックでは、計算量は最大で、4.48×10306となる。そのため、符号化対象の画像ブロックが、例えばH.264/AVCで用られる最小の符号化単位である4画素×4画素(すなわち、n=16)程度の大きさでなければ、実用的な時間内でのパディング処理が困難である(なお、この場合の計算量は最大12,870となる)。このように、従来のパディング方法では、符号化対象の画像ブロックの画素数が多くなると、符号化効率が低下する、あるいは実用的な時間内でのパディング処理が困難になるという課題があった。
【0007】
本発明は、上記のような技術的背景に鑑みてなされたものであり、任意形状画像に対し、符号量の増大を抑えつつ、より高速にパディング処理を行うことができる技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一態様は、パディングにより任意形状画像を矩形画像に変換し、前記矩形画像を示す画像信号を画像符号化装置へ出力する画像パディング方法であって、前記任意形状画像が分割された画像ブロックごとに、前記任意形状画像の形状を示す形状情報と、前記画像符号化装置から出力された符号化対象の前記画像ブロックの位置及び大きさ示す符号化対象ブロック情報と、に基づいてパディングを行う必要があるか否かを判定するパディング要否判定ステップと、記画像ブロック内に存在する画素の画素位置を示す疎行列と、前記画像ブロックに対して疎行列を乗じて得られた領域内画素情報と、前記画像符号化装置から出力された画面内予測値と、に基づいてパディング済み画像ブロックを導出する求解ステップと、前記パディングを行う必要がないと判定された場合、前記画像ブロックを示す画像信号を前記画像符号化装置へ出力し、前記パディングを行う必要があると判定された場合、前記パディング済み画像ブロックを示す画像信号を前記画像符号化装置へ出力する画像信号出力ステップと、を有する画像パディング方法である。
【0009】
また、本発明の一態様は、パディングにより任意形状画像を矩形画像に変換し、当該矩形画像を示す画像信号を画像符号化装置へ出力する画像パディング装置であって、前記任意形状画像が分割された画像ブロックごとに、前記任意形状画像の形状を示す形状情報と、前記画像符号化装置から出力された符号化対象の前記画像ブロックの位置及び大きさ示す符号化対象ブロック情報と、に基づいてパディングを行う必要があるか否かを判定するパディング要否判定部と、前記画像ブロック内に存在する画素の画素位置を示す疎行列と、前記画像ブロックに対して疎行列を乗じて得られた領域内画素情報と、前記画像符号化装置から出力された画面内予測値と、に基づいてパディング済み画像ブロックを導出する求解部と、前記画像信号を前記画像符号化装置へ出力する画像信号出力部と、を備え、前記画像信号出力部は、前記パディングを行う必要がないと判定された場合、前記画像ブロックを示す画像信号を出力し、前記パディングを行う必要があると判定された場合、前記パディング済み画像ブロックを示す画像信号を出力する画像パディング装置である。
【0010】
また、本発明の一態様は、上記の画像パディング装置であって、前記パディングを行う必要があると判定された場合、前記画面内予測値に基づいて、前記画像ブロック内の全ての画素がパディング対象領域を示す画素であるか否かを判定する領域外判定部、をさらに備え、前記画像信号出力部は、前記画像ブロック内の全ての画素がパディング対象領域を示す画素であると判定された場合、前記画面内予測値に基づく画像信号を出力する。
【0011】
また、本発明の一態様は、上記の画像パディング装置であって、前記求解部は、以下の数式によって表される最小化目的関数及び制約において、1uの値を最小化する前記パディング済み画像ブロックを示すxの値を導出する。
【0012】
【数1】
【0013】
ここで、uはn次元のベクトル、nは前記画像ブロックの画素数、zは前記画面内予測値、Dは前記疎行列、yは前記領域内画素情報、Φは画面内予測残差(x-z)の変換係数、及び1uは前記画像ブロック内の全ての画素の画素値の和を示す。
【0014】
また、本発明の一態様は、上記の画像パディング装置としてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0015】
本発明により、任意形状画像に対し、符号量の増大を抑えつつ、より高速にパディング処理を行うことができる。
【図面の簡単な説明】
【0016】
図1】一般的な画像符号化装置10の機能構成を示すブロック図である。
図2】一般的な画面内予測処理の概要の一例を示す模式図である。
図3】一般的な画像符号化装置10の動作を示すフローチャートである。
図4】本発明の一実施形態に係る画像符号化システム1の全体構成図である。
図5】本発明の一実施形態に係る画像パディング装置20の機能構成を示すブロック図である。
図6】本発明の一実施形態に係る画像パディング装置20の動作を示すフローチャートである。
図7】任意形状画像の一例を示す図である。
図8】任意形状画像に対してパディングがなされた画像の一例を示す図である。
図9】領域内部と外挿領域との間の境界領域を説明するための図である。
【発明を実施するための形態】
【0017】
以下、本発明の一実施形態について、図面を参照しながら説明する。
【0018】
以下に説明する画像符号化システム1は、矩形画像である画像ブロックの単位で符号化を行うシステムである。画像符号化システム1は、符号化対象の任意形状画像を、画像ブロックに分割し、当該画像ブロックごとにパディングを行う。そして、画像符号化システム1は、パディングがなされた画像ブロックごとに符号化する。なお、パディングの方法としては任意の方法を用いることができる。
【0019】
以下、画像ブロックの画素数はn個であるものとする。また、パディングがなされた画像ブロック内の全ての画素の画素値を一次元に並べたベクトルをxとする。したがって、xはn次元ベクトルである。また、画像ブロック内における、任意形状画像の領域内部の画素数はm個(すなわち、m<n)であるものとする。また、領域内部の全ての画素の画素値を一次元に並べたベクトルをyとする。したがって、yはm次元ベクトルである。
【0020】
ここで、m×nの行列を行列Dとし、Dx=y、という制約を考える。また、行列Dは、各行に1つだけ1の値が存在し、その他の値が全て0であるような疎行列であるものとする。画像ブロック内の全ての画素の画素値からなるxに対して行列Dを乗じることによって、任意形状画像の領域内部の全ての画素値からなるyが生成される。すなわち、この制約は、外挿領域(パディング対象領域)がいかなる画素値の画素によってパディングされたとしても、領域内部の画素値は不変であることを意味する。
【0021】
ところで、H.264/AVC及びH.265/HEVCでは、符号化効率を高めるため、符号化しようとする画像ブロックの周辺の復号済みの画素の画素値から、当該画像ブロック内の画素の画素値を予測する「画面内予測」という処理が行われる。
【0022】
以下、画面内予測がなされた画像ブロック内の全ての画素の画素値を一次元に並べたベクトルをzとする。また、画像ブロックに対して変換処理を施すオペレータをΦとする。なお、ここでいう変換処理とは、上述したように非可逆画像符号化において大抵用いられる変換処理である。そして、パディング済みの画像ブロックの導出(すなわち、xの値の導出)を、下記の(1)式に示すように、Dx=yの制約の下でL0ノルムを最小化するxの値を求める最適化問題として定式化する。
【0023】
【数2】
【0024】
なお、目的関数である上記の||Φ(x-z)||の項は、画面内予測残差(x-z)の変換係数の非零係数の個数を表しており、これは一般に、実際に発生する符号量を精度よく近似するものとされている。すなわち、上記(1)式を満たすxの値を求めることによって、符号量の増大を抑えつつパディング処理を行うことができる。
【0025】
しかしながら、L0ノルムは、非凸であるという数学的性質を有しているため、一般に、計算量の観点から最小化問題を解くことが困難であるとされている。そのため、L0ノルムに代えてL1ノルムで近似し、当該L1ノルムを最小化することが考えられる。すなわち、以下の(2)式に示すように、Dx=yの制約の下でL1ノルムを最小化するxの値を求める最適化問題として定式化することが考えられる。
【0026】
【数3】
【0027】
なお、上記(2)式によって定式化された最適化問題を解く方法としては、一般に、例えば、非特許文献3に記載された近接勾配法(Proximal Gradient Method)、及びADMM法(Alternating Direction Method of Multipliers Method;交互方向乗数法)等の方法がある。このような方法によっても(2)式に示す最適化問題の解を求めることは可能ではあるが、本実施形態においては、より高速に解が求められるように、最小化目的関数と制約とを、それぞれ以下の(3)式のように定式化する。
【0028】
【数4】
【0029】
ここで、uはn次元ベクトルである。また、(3)式に示すように、Φ(x-z)(すなわち、画像ブロックの予測残差の変換係数を並べたn次元ベクトル)の各要素の絶対値はu以下であるという制約、及び、uの要素は非零であるという制約がある。ここで、1uは、uの全要素の和を表し、上記(3)式は、uを最小化するようなxの値を求めることを意味する。この最適化問題は、線形計画問題と呼ばれる問題に属しており、多くの解法が知られている。例えば、この最適化問題は、非特許文献4に記載の単体法(Simplex method)等によって効率的に解くことができる。
【0030】
以下、本実施形態に係る画像符号化システム1の構成について説明するが、説明を分かり易くするため、一般的な画像符号化装置の機能構成についてまず説明する。
【0031】
[画像符号化装置の機能構成]
図1は、一般的な画像符号化装置10の機能構成を示すブロック図である。なお、本実施形態に係る画像符号化システム1が符号化の対象とする画像は、動画像ではなく静止画像である。そのため、図1においては、静止画像の符号化では用いられない画面間予測及び歪除去に係る機能部等の記載は省略している。
【0032】
図1に示すように、画像符号化装置10は、画像信号入力部101と、減算部102と、変換部103と、量子化部104と、エントロピー符号化部105と、符号化データ出力部106と、逆量子化部107と、逆変換部108と、加算部109と、フレームメモリ110と、画面内予測部111と、を含んで構成される。
【0033】
画像信号入力部101は、符号化対象の画像信号の入力を受け付ける。画像信号入力部101は、入力された画像信号を分割し、所定の画像ブロック単位で画像信号を減算部102へ出力する。なお、所定の画像ブロック単位とは、例えばH.265/HEVCの場合、予測単位(Prediction Unit)と呼ばれる処理単位である。
【0034】
減算部102は、画像信号入力部101から出力された画像信号を取得する。また、減算部102は、画面内予測部111から出力された、別途生成される予測信号を取得する。なお、予測信号とは、予測された、後の画像ブロックを示す画像信号である。減算部102は、取得した画像信号から予測信号を減算することにより、予測残差信号を得る。減算部102は、予測残差信号を変換部103へ出力する。
【0035】
変換部103は、減算部102から出力された予測残差信号を取得する。変換部103は、取得した予測残差信号に対して離散コサイン変換(DCT)処理を行う。変換部103は、離散コサイン変換された予測残差信号を量子化部104へ出力する。
【0036】
量子化部104は、変換部103から出力された予測残差信号を取得する。量子化部104は、取得した予測残差信号に対して量子化を行う。量子化部104は、量子化された予測残差信号をエントロピー符号化部105及び逆量子化部107へそれぞれ出力する。
【0037】
エントロピー符号化部105は、量子化部104から出力された予測残差信号を取得する。エントロピー符号化部105は、取得した予測残差信号に対してエントロピー符号化を行うことにより符号化データを得る。エントロピー符号化部105は、符号化データを符号化データ出力部106へ出力する。
【0038】
符号化データ出力部106は、エントロピー符号化部105から出力された符号化データを取得する。符号化データ出力部106は、取得した符号化データを出力する。
【0039】
逆量子化部107は、量子化部104から出力された予測残差信号を取得する。逆量子化部107は、取得した予測残差信号に対して逆量子化を行う。逆量子化部107は、逆量子化された予測残差信号を逆変換部108へ出力する。
【0040】
逆変換部108は、逆量子化部107から出力された予測残差信号を取得する。逆変換部108は、取得した予測残差信号に対して逆離散コサイン変換(逆DCT)処理を行う。逆変換部108は、逆離散コサイン変換がなされた予測残差信号を加算部109へ出力する。
【0041】
加算部109は、逆変換部108から出力された予測残差信号を取得する。また、加算部109は、画面内予測部111から出力された、別途生成される予測信号を取得する。加算部109は、取得した予測残差信号に対して予測信号を加算することにより復号画像を示す画像信号(以下、「復号画像信号」という。)を得る。加算部109は、復号画像信号をフレームメモリ110に記憶させる。なお、フレームメモリ110に記憶される復号画像信号は、画像符号化装置10に対応する復号装置において復元される復号画像信号と同一の信号となる。
【0042】
フレームメモリ110は、加算部109から出力された復号画像信号を記憶する。フレームメモリ110は、例えば、RAM(Random Access Memory;読み書き可能なメモリ)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、及びHDD(Hard Disk Drive)等の記憶媒体、又はこれらの記憶媒体の任意の組み合わせによって構成される。
【0043】
画面内予測部111は、フレームメモリ110に記憶された復号画像信号を用いて画面内予測処理を行い、予測信号を生成する。上述したように、予測信号とは、予測された、後の画像ブロックを示す画像信号である。画面内予測部111は、生成された予測信号を、減算部102及び加算部109へそれぞれ出力する。
【0044】
なお、動き補償予測が行われず、フレーム内の全ての予測単位が画面内予測されて符号化されるフレームを、Iフレーム(Intra-coded Frame)という。
【0045】
[画面内予測処理]
以下、画面内予測部111によって行われる画面内予測処理の一例について説明する。図2は、一般的な画面内予測処理の概要の一例を示す模式図である。図2において、網掛けされた丸は、画面内において既に復号されている画素(以下、「参照画素」という。)である。また、網掛けされていない丸は、これから画面内予測及び符号化が行われる画素(以下、「予測画素」という。)であり、画像ブロックごとに纏まって存在している。図2に示す例の場合、予測画素は、4画素×4画素(すなわち、n=16)の画像ブロックごとに纏まって存在している。
【0046】
画面内予測処理とは、参照画素の情報を用いて、予測画素に対して何らかの値を対応付ける処理である。例えば、図2に示す例の場合、左上方向にある参照画素の画素値を、右下方向にある予測画素に対応付ける(コピーする)。なお、図2に示すコピーの方法は一例であり、その他の方法が用いられてもよい。例えばH.265/HEVCでは、上記のような左下方向から右上方向へのコピーの方法を含む、33通りの方向へのコピーの方法が用意されている。また、H.265/HEVCでは、参照画素の画素値の平均値を予測画素の画素値とする方法等も用いることができる。
【0047】
[画像符号化装置の動作]
以下、画像符号化装置10の動作の一例について説明する。図3は、一般的な画像符号化装置10の動作を示すフローチャートである。本フローチャートは、画像信号入力部101が、符号化対象の画像信号の入力を受け付け、入力された画像信号を所定の画像ブロック単位で減算部102へ出力した時点で開始される。
【0048】
減算部102は、画像信号入力部101から出力された画像信号を取得する。また、減算部102は、画面内予測部111から出力された予測信号を取得する。減算部102は、取得した画像信号から予測信号を減算することにより、予測残差信号を生成する(ステップS001)。減算部102は、予測残差信号を変換部103へ出力する。
【0049】
変換部103は、取得した予測残差信号に対して離散コサイン変換(DCT)を行う。変換部103は、離散コサイン変換がなされた予測残差信号を量子化部104へ出力する。量子化部104は、取得した予測残差信号に対して量子化を行う(ステップS002)。量子化部104は、量子化された予測残差信号をエントロピー符号化部105及び逆量子化部107へそれぞれ出力する。
【0050】
エントロピー符号化部105は、取得した予測残差信号に対してエントロピー符号化を行うことにより符号化データをを得る(ステップS003)。エントロピー符号化部105は、符号化データを符号化データ出力部106へ出力する。符号化データ出力部106は、取得した符号化データを出力する。
【0051】
逆量子化部107は、取得した予測残差信号に対して逆量子化する。逆量子化部107は、逆量子化された予測残差信号を逆変換部108へ出力する。逆変換部108は、取得した予測残差信号に対して逆離散コサイン変換(逆DCT)を行う。逆変換部108は、逆離散コサイン変換がなされた予測残差信号を加算部109へ出力する(ステップS004)。
【0052】
加算部109は、取得した予測残差信号に対して予測信号を加算することにより復号画像信号を生成する(ステップS005)。加算部109は、復号画像信号をフレームメモリ110に記憶させる(ステップS006)。
【0053】
画面内予測部111は、フレームメモリ110に記憶された復号画像信号を用いて画面内予測処理を行い、後の画像ブロックを示す予測信号を生成する(ステップS007)。画面内予測部111は、生成された予測信号を、減算部102及び加算部109へそれぞれ出力する。以上で、図3のフローチャートが示す画像符号化装置10の動作が終了する。
【0054】
[画像符号化システムの全体構成]
以下、画像符号化システム1の全体構成について説明する。図4は、本発明の一実施形態に係る画像符号化システム1の全体構成図である。図4に示すように、画像符号化システム1は、画像符号化装置10と、画像パディング装置20と、を含んで構成される。なお、図4に示す画像符号化装置10の機能構成は、上述した一般的な画像符号化装置10の機能構成と同一である。
【0055】
まず、画像パディング装置20は、外部の装置から、符号化対象の任意形状画像を示す画像信号を取得する。また、画像パディング装置20は、外部の装置から、符号化対象の任意形状画像の形状を示す情報(以下、「形状情報」という。)を取得する。また、画像パディング装置20は、画像符号化装置10から、画面内予測処理の結果を示す画面内予測値、及び符号化対象ブロック情報を取得する。符号化対象ブロック情報とは、符号化対象の画像ブロックの位置及び大きさ示す情報を含む情報である。
【0056】
画像パディング装置20は、取得した上記の情報に基づいて、符号化対象の画像ブロックが、パディングを行う必要がある画像ブロックであるか否かを判定する。パディングを行う必要がないと判定された場合、画像パディング装置20は、当該画像ブロックを示す画像信号をそのまま画像符号化装置10へ出力する。一方、パディングを行う必要がないと判定された場合、画像パディング装置20は、符号化対象の画像ブロックに対してパディングを行い、パディングがなされた画像ブロックを示す画像信号を画像符号化装置10へ出力する。
【0057】
[画像パディング装置の機能構成]
以下、画像パディング装置20の機能構成について説明する。図5は、本発明の一実施形態に係る画像パディング装置20の機能構成を示すブロック図である。図5に示すように、画像パディング装置20は、画像信号入力部201と、形状情報入力部202と、符号化対象ブロック情報入力部203と、画面内予測値入力部204と、パディング要否判定部205と、領域外判定部206と、領域内画素取得部207と、線形問題求解部208と、画像信号出力部209と、を含んで構成される。
【0058】
画像信号入力部201は、符号化対象の任意形状画像を示す画像信号の入力を受け付ける。画像信号入力部201は、入力された画像信号を分割し、所定の画像ブロック単位でパディング要否判定部205へ出力する。
【0059】
形状情報入力部202は、形状情報の入力を受け付ける。形状情報入力部202は、入力された形状情報をパディング要否判定部205へ出力する。
【0060】
符号化対象ブロック情報入力部203は、画像符号化装置10から符号化対象ブロック情報を取得する。符号化対象ブロック情報入力部203は、取得した符号化対象ブロック情報をパディング要否判定部205へ出力する。
【0061】
画面内予測値入力部204は、画像符号化装置10から画面内予測値を取得する。画面内予測値入力部204は、取得した画面内予測値を領域外判定部206へ出力する。
【0062】
パディング要否判定部205は、画像信号入力部201から出力された画像信号を取得する。また、パディング要否判定部205は、形状情報入力部202から出力された形状情報を取得する。また、パディング要否判定部205は、符号化対象ブロック情報入力部203から出力された符号化対象ブロック情報を取得する。パディング要否判定部205は、形状情報と符号化対象ブロック情報とに基づいて、画像信号に対してパディングを行う必要があるか否かを判定する。具体的には、パディング要否判定部205は、画像信号に基づく画像ブロック内の全ての画素が任意形状画像の領域内部を示す画素であるか否か(すなわち、m=nであるか否か)を判定することにより、画像信号に対してパディングを行う必要があるか否かを判定する。
【0063】
パディングを行う必要がないと判定された場合(すなわち、m=nであり、画像ブロック内の全ての画素が領域内部に存在している場合)、パディング要否判定部205は、取得した画像信号を画像信号出力部209へ出力する。一方、パディングを行う必要があると判定された場合(すなわち、m<nであり、画像ブロック内の画素のうち少なくとも1つが外挿領域を示す画素である場合)、パディング要否判定部205は、取得した画像信号を領域外判定部206へ出力する。
【0064】
領域外判定部206は、パディング要否判定部205から出力された画像信号を取得する。また、領域外判定部206は、画面内予測値入力部204から出力された画面内予測値(すなわち、上述したzの値。以下、「画面内予測値z」という。)を取得する。領域外判定部206は、取得した画面内予測値zに基づいて、画像信号に基づく画像ブロック内の全ての画素が外挿領域を示す画素であるか否か(すなわち、m=0であるか否か)を判定する。
【0065】
画像ブロック内の全ての画素が外挿領域を示す画素であると判定された場合(すなわち、m=0である場合)、領域外判定部206は、画面内予測値zを画像信号出力部209へ出力する。なお、この場合、画面内予測残差(x-z)が全て0となる。一方、画像ブロック内の画素のうち少なくとも1つの画素が任意形状画像の領域内部を示す画素であると判定された場合(すなわち、m>0である場合)、領域外判定部206は、画像信号及び画面内予測値zを領域内画素取得部207へ出力する。
【0066】
領域内画素取得部207は、領域外判定部206から出力された画像信号及び画面内予測値zを取得する。また、領域内画素取得部207は、画像ブロック内に存在する画素の画素位置を示す、上述した疎行列Dを生成する。領域内画素取得部207は、取得した画像信号に対して疎行列Dを乗じることによって、領域内画素情報(すなわち、上述したyの値。以下、「領域内画素y」という)を得る。領域内画素取得部207は、疎行列D、領域内画素y)、及び画面内予測値zを、線形問題求解部208へ出力する。
【0067】
線形問題求解部208は、領域内画素取得部207から出力された、疎行列D、領域内画素y、及び画面内予測値zを取得する。線形問題求解部208は、取得した疎行列D、領域内画素y、及び画面内予測値zに基づいて、上述した(3)式を満たすxの値を導出する。例えば、線形問題求解部208は、Simplex法等によってxの値を導出する。線形問題求解部208は、xの値を画像信号出力部209へ出力する。
【0068】
画像信号出力部209は、パディング要否判定部205から出力された画像信号を取得した場合、当該画像信号を画像符号化装置10へ出力する。また、画像信号出力部209は、領域外判定部206から出力された画面内予測値zを取得した場合、当該画面内予測値zを画像符号化装置10へ出力する。また、画像信号出力部209は、線形問題求解部208から出力されたxの値を取得した場合、当該xの値を画像符号化装置10へ出力する。
【0069】
[画像パディング装置の動作]
以下、画像パディング装置20の動作の一例について説明する。図6は、本発明の一実施形態に係る画像パディング装置20の動作を示すフローチャートである。本フローチャートは、画像パディング装置20に対して画像信号が入力される時点で開始される。
【0070】
画像信号入力部201は、符号化対象の画像信号の入力を受け付ける(ステップS101)。画像信号入力部201は、入力された画像信号を所定の画像ブロック単位でパディング要否判定部205へ出力する。
【0071】
パディング要否判定部205は、形状情報入力部202から取得した形状情報と、画像符号化装置10から符号化対象ブロック情報入力部203を介して取得した符号化対象ブロック情報と、に基づいて、画像信号に対してパディングを行う必要があるか否かを判定する(ステップS102)。
【0072】
パディングを行う必要がないと判例された場合(ステップS102・No)、パディング要否判定部205は、取得した画像信号を画像信号出力部209を介して画像符号化装置10へ出力する(ステップS103)。
【0073】
一方、パディングを行う必要があると判定された場合(ステップS102・Yes)、パディング要否判定部205は、取得した画像信号を領域外判定部206へ出力する。領域外判定部206は、画面内予測値入力部204から出力された画面内予測値zを取得する(ステップS104)。領域外判定部206は、取得した画面内予測値zに基づいて、画像信号に基づく画像ブロック内の全ての画素が外挿領域を示す画素であるか否かを判定する(ステップS105)。
【0074】
画像ブロック内の全ての画素が外挿領域を示す画素であると判定された存在する場合(ステップS105・Yes)、領域外判定部206は、画面内予測値zを画像信号出力部209を介して画像符号化装置10へ出力する(ステップS106)。
【0075】
一方、画像ブロック内の画素のうち少なくとも1つの任意形状画像の領域内部に存在する画素であると判定された場合(ステップS105・No)、領域外判定部206は、画像信号及び画面内予測値zを領域内画素取得部207へ出力する。次に、領域内画素取得部207は、画像ブロック内に存在する画素の画素位置を示す疎行列Dを生成する(ステップS107)。領域内画素取得部207は、取得した画像信号に対して疎行列Dを乗じることにより、領域内画素yを得る。領域内画素取得部207は、疎行列D、領域内画素y、及び画面内予測値zを、線形問題求解部208へ出力する。
【0076】
線形問題求解部208は、取得した疎行列D、領域内画素y、及び画面内予測値zに基づいて、上述した(3)式を満たすxの値を導出することにより線形計画問題の解を求める(ステップS108)。線形問題求解部208は、xの値を画像信号出力部209を介して画像符号化装置10へ出力する(ステップS109)。以上で、図6のフローチャートが示す画像パディング装置20の動作が終了する。
【0077】
以上説明したように、上述した本発明の一実施形態に係る画像パディング装置20は、パディングにより任意形状画像を矩形画像に変換し、前記矩形画像を示す画像信号を画像符号化装置10へ出力する。画像パディング装置20は、パディング要否判定部205と、線形問題求解部208(求解部)と、画像信号出力部209と、を含む。パディング要否判定部205は、前記任意形状画像が分割された画像ブロックごとに、前記任意形状画像の形状を示す形状情報と、前記画像符号化装置10から出力された符号化対象の前記画像ブロックの位置及び大きさ示す符号化対象ブロック情報と、に基づいてパディングを行う必要があるか否かを判定する。線形問題求解部208は、前記画像ブロック内に存在する画素の画素位置を示す疎行列Dと、前記画像ブロックに対して疎行列Dを乗じて得られた領域内画素yと、前記画像符号化装置10から出力された画面内予測値zと、に基づいてパディング済み画像ブロックを示すxの値を導出する。前記画像信号出力部209は、前記パディングを行う必要がないと判定された場合、前記画像ブロックを示す画像信号を出力し、前記パディングを行う必要があると判定された場合、前記xの値を出力する。
【0078】
上記のような構成を有することにより、本発明の一実施形態に係る画像パディング装置20は、発生符号量を抑えつつ、効率的に任意形状画像に対するパディング処理を行うことができる。
【0079】
上述したように、従来のパディング方法では、符号化効率(データ圧縮率)が良くない、あるいは画像符号化に多くの時間を要するという課題がある。これに対し、本発明の一実施形態に係る画像パディング装置20は、例えば上記(3)式に示したような目的関数及び制約を設けることで、パディング処理を線形計画問題に帰着させる。これにより、画像パディング装置20は、符号化効率の低下を抑えする、より高速にパディングされた画像を生成することができる。
【0080】
また、本発明の一実施形態に係る画像パディング装置20は、任意形状画像に対してパディングを行うことにより当該任意形状画像を矩形化するため、矩形画像のみを符号化対象とするような一般的な画像符号化方式を用いて任意形状画像を符号化させることを可能にする。また、画像パディング装置20は、符号量の増加を抑えることができ、より少ない符号量でより高い品質の復号画像を得ることができ、従来の符号化方式よりも効率的に画像を圧縮することができる。
【0081】
このように、本発明の一実施形態に係る画像パディング装置20は、画像符号化におけるデータ圧縮率を高めることを目的として、任意形状画像の符号化及び復号を行う場合に対して広く適用可能である。
【0082】
なお、上述した実施形態では、画像符号化装置10と画像パディング装置20とが別々の装置であるものとしたが、これに限られるものではない。1つの情報処理装置(例えば汎用コンピュータ等)が、上述した画像符号化装置10の機能部と画像パディング装置の機能部とを備える構成であってもよい。
【0083】
上述した実施形態における画像符号化システム1の一部または全部を、コンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、上述した機能の一部を実現するためのものであっても良く、さらに上述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
【0084】
以上、図面を参照して本発明の実施形態を説明してきたが、上記実施形態は本発明の例示に過ぎず、本発明が上記実施形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び要旨を逸脱しない範囲で構成要素の追加、省略、置換、及びその他の変更を行ってもよい。
【符号の説明】
【0085】
1…画像符号化システム、10…画像符号化装置、20…画像パディング装置、101…画像信号入力部、102…減算部、103…変換部、104…量子化部、105…エントロピー符号化部、106…符号化データ出力部、107…逆量子化部、108…逆変換部、109…加算部、110…フレームメモリ、111…画面内予測部、201…画像信号入力部、202…形状情報入力部、203…符号化対象ブロック情報入力部、204…画面内予測値入力部、205…パディング要否判定部、206…領域外判定部、207…領域内画素取得部、208…線形問題求解部、209…画像信号出力部
図1
図2
図3
図4
図5
図6
図7
図8
図9