(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6348742
(24)【登録日】2018年6月8日
(45)【発行日】2018年6月27日
(54)【発明の名称】画像間予測方法およびデバイス並びに対応する符号化方法および装置
(51)【国際特許分類】
H04N 19/109 20140101AFI20180618BHJP
H04N 19/136 20140101ALI20180618BHJP
H04N 19/176 20140101ALI20180618BHJP
H04N 19/189 20140101ALI20180618BHJP
【FI】
H04N19/109
H04N19/136
H04N19/176
H04N19/189
【請求項の数】10
【外国語出願】
【全頁数】16
(21)【出願番号】特願2014-56511(P2014-56511)
(22)【出願日】2014年3月19日
(65)【公開番号】特開2014-183595(P2014-183595A)
(43)【公開日】2014年9月29日
【審査請求日】2017年3月16日
(31)【優先権主張番号】1352412
(32)【優先日】2013年3月19日
(33)【優先権主張国】FR
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】サファ シュルギー
(72)【発明者】
【氏名】アラン マーティン
(72)【発明者】
【氏名】ドミニク ソロー
(72)【発明者】
【氏名】フィリップ ギヨテル
(72)【発明者】
【氏名】クリスティーヌ ギルモ
【審査官】
堀井 啓明
(56)【参考文献】
【文献】
特開2009−267710(JP,A)
【文献】
特表2011−517227(JP,A)
【文献】
国際公開第2009/131075(WO,A1)
【文献】
T. Guionnet (INRIA) INRIA Rennes Bretagne Atlantique Campus de Beaulieu 35042 Rennes Cedex France,Intra prediction based on weighted template matching predictors (WTM)[online], JCTVC-G JCTVC-G598,インターネット<URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/7_Geneva/wg11/JCTVC-G598-v4.zip>
【文献】
小林 充 Mitsuru Kobayashi,画像符号化シンポジウム 第20回シンポジウム資料 The Proceedings of the 20th Picture Coding Symposium of Japan
(58)【調査した分野】(Int.Cl.,DB名)
H04N19/00−19/98
(57)【特許請求の範囲】
【請求項1】
候補パッチのセットからの辞書のパッチに属するピクセルブロックの重み付き和を使用して、画像のピクセルブロックを予測する方法であって、それぞれのパッチが画像のピクセルブロックと、このピクセルブロックの因果的近傍とで形成される、方法において、
候補パッチのサブセットが、前記候補パッチのセットから得られ、前記辞書が、第1のパッチと呼ばれる、前記候補パッチのサブセットに属するパッチと、第2のパッチと呼ばれる、前記候補パッチのセットに属する少なくとも1つの他のパッチとで形成される、前記方法。
【請求項2】
前記第1のパッチが、その近傍と、予想しようとするブロックを含むパッチの近傍との間で計算される距離を最小化するパッチである、請求項1に記載の方法。
【請求項3】
前記辞書のそれぞれの第2のパッチは、該辞書の、前記第2のパッチと前記第1のパッチとの間で計算される距離を最小化するパッチである、請求項1または2に記載の方法。
【請求項4】
前記サブセットのそれぞれの候補パッチは、その近傍と、予測しようとするブロックを含むパッチの近傍との間で計算される距離を最小化する、請求項1から3の一項に記載の方法。
【請求項5】
予測しようとするブロックの因果的近傍の予測が、前記辞書のパッチの近傍の重み付き線形結合を使用して求められ、前記予測を最適化する重み付けパラメータが選択され、
画像のピクセルブロックが、辞書のブロックのピクセルの重み付き線形結合を使用して予測され、前記線形結合の重み付けパラメータは、予測しようとするブロックの因果的近
傍の予測中に選択されるものである、請求項1から4の一項に記載の方法。
【請求項6】
辞書の第1のパッチの画像における位置が、予測しようとするブロックとその因果的近傍とで形成されるパッチから定義される変位情報のアイテムによって与えられる、請求項1から5の一項に記載の方法。
【請求項7】
画像シーケンス中に予測ブロックが画像ピクセルブロックから計算される、画像シーケンスを符号化および/または復号する方法であって、
前記予測ブロックが、請求項1から6の一項に記載の方法によって計算される、前記方法。
【請求項8】
候補パッチのセットからの辞書のパッチに属するピクセルブロックの重み付き和を使用して、前記ブロックを予測するように構成された画像のピクセルブロックを予測するデバイスであって、それぞれのパッチが画像のピクセルブロックと、このピクセルブロックの因果的近傍とで形成される、デバイスにおいて、さらに、
前記候補パッチのセットから候補パッチのサブセットを得る手段と、
前記候補パッチのサブセットのパッチと、前記候補パッチのセットの少なくとも1つの他のパッチとから、少なくとも1つの辞書を形成する手段と、
請求項1から6の一項に記載の方法を実現するように構成された手段と
を含む、前記デバイス。
【請求項9】
予測しようとするピクセルブロックの予測がそこから始まる、前記辞書の第1のパッチの位置を識別する情報のアイテムを送信および/または受信する手段も備える、請求項8に記載のデバイス。
【請求項10】
画像シーケンスを符号化および/または復号する装置であって、請求項8または9に記載のデバイスと、請求項7に記載の方法を実現するように構成された手段とを備える、前記装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像符号化の一般的分野に関し、より具体的には、画像間予測の一般的分野に関する。
【背景技術】
【0002】
画像間予測は、ビデオの高い圧縮率を得るために、そのビデオの連続する画像間に存在する時間的冗長性を利用することにある。
【0003】
画像間予測の原理は、現在画像を、ブロックまたはマクロブロックに分割することにある。次いで、符号器が、ビデオの別の(以前または将来の)画像内に類似のブロックを発見する。この別の画像は、通常、参照画像と呼ばれる。次いで、符号器は、予測しようとするブロックから、参照画像(複数を含む)において発見されたブロックの位置を定義する動きベクトルを符号化する。次いで、符号器は、これらの2つのブロック間の差を計算し、予測誤差を符号化する。次いで、この動きベクトルおよび予測誤差が復号器に伝送され、これによって復号器はブロックを再構築することができる。
【0004】
この種の方法を使用する多数のビデオ符号化/復号方式が知られている。例えば、MPEG−2(例えば、非特許文献1参照),MPEG−4/AVC(例えば、非特許文献2参照)またはHEVC(例えば、非特許文献3参照)規格。
【0005】
ブロックを予測することに対してブロック(または、より一般的にはゾーン)の定義は、符号化の有効さに対して決定的である。実際に、現在ブロックと予測ブロックとのコンテンツが非常に異なる場合には、予測誤差が大きくなり、このことは、この予測誤差を符号化するためにかなり多数のビットを要することになる。
【0006】
したがって、予測しようとするブロックから、コンテンツの点において、遠く離れた予測ゾーンを選択するリスクを最小化することが必要である。
【0007】
さらに、送信機と受信機との間の伝送のコンテキストでは、予測された画像を再構築するリモート復号器によって必要とされるシンタックス要素を符号化するコストは相対的に高い。例えば、MPEG−4/AVC規格の場合に、参照画像は2つのリストにまとめてグループ化される。すなわち、予測しようとするブロックがそれに属する画像に対して時間的に前の(復号または再構築された)画像をまとめてグループ化するもの、および時間的に後の(復号または再構築された)画像をまとめてグループ化するものである。以下では、時間的に前、および/または後の画像が言及されるときには、これらの画像は復号、および再構築されていることを意味している。すなわち、参照画像のブロックを表わすために、画像の2つのリストのうちの一方を表わす情報のアイテム、このリストにおける(参照)画像のインデックスを示す情報のアイテム、および参照画像におけるブロックの座標を示す情報の最後のアイテムを、復号器に伝送する必要がある。
【0008】
時間的予測を使用する符号化方法の場合に、復号器に伝送される情報を符号化するコストを最小化するために、本発明者らは、それぞれのパッチが画像のピクセルブロックとこのピクセルブロックの因果的近傍(causal neighbourhood)とで形成されている、候補パッチのセットからの辞書のパッチに属するピクセルブロックの重み付き和(weighted sum)を使用して、画像のピクセルブロックを予測することを提案している(例えば、非特許文献4参照)。
【0009】
より具体的には、この方法は、コンテンツの点において、予測しようとするピクセルブロックと、このブロックの因果的近傍とで形成されたパッチに近い、第1のパッチと呼ばれる、候補パッチと、コンテンツの点において、第1のパッチと近い、第2のパッチと呼ばれる、少なくとも1つの他のパッチとから辞書を定義することにある。次いで、予測しようとするピクセルブロックの因果的近傍の予測が、この辞書のパッチの近傍の重み付き線形結合(weighted linear combination)を使用して求められ、次いで、この予測を最適化する重み付けパラメータが選択され、次いで、画像のピクセルブロックが、辞書のブロックのピクセルの重み付き線形結合を使用して予測され、前記線形結合の重み付けパラメータは、近傍予測の間に求められた最適なものである。
【0010】
この方法は、重み付けパラメータが、このブロックに対する予測エラーに直接ではなく、予測しようとするブロックのまわりに位置するゾーン(近傍)に対する予測誤差を最小化し、したがって画像のコンテンツの連続性に有利となるように定義されているので、ブロックに対する予測誤差が低減されるので有利である。
【0011】
さらに、復号器に伝送される情報は、復号器によって知られると、第1のパッチを一義的に定義する情報のアイテムに制限され、したがって、復号器は、この辞書(パッチ)はすべて、画像の再構築された部分に属するので、符号器のそれと同一の方法で、辞書を定義することができる。したがって、復号器は、符号器側でブロックの予測のために使用される重み付けパラメータを計算して、したがって符号器によって得られるのと類似の方法で、予測ブロックを得ることができる。
【0012】
理解できるように、この方法は、MPEG−4/AVCなどの規格のものに対して、これらの規格では復号器に伝送する必要のあるシンタックス要素を伝送する必要がなくなるので、符号化のコストを減少させる。
【0013】
予測しようとするピクセルブロックで形成されたパッチに対して、第1のパッチを一義的に定義する情報のアイテム、およびこのブロックの因果要因である近傍だけを、伝送しなくてはならない。この情報のアイテムは、通常、動きベクトルであり、この動きベクトルは、サーチウィンドウに属する候補パッチのすべてをまとめてグループ化するテーブルのインデックスによって表わされる。候補パッチのコンテンツの変化を最大化するためにサーチウィンドウのサイズは大きくなくてはならないので、このインデックスのダイナミックレンジは、候補パッチの数が大きいので、比較的大きな数の符号化ビットを必要とする。
【先行技術文献】
【非特許文献】
【0014】
【非特許文献1】ISO/IEC JTC1/SC29/WG11 MPEG00/October 2000,Coding of moving pictures and audio
【非特許文献2】T.Wiegand,G.J.Sullivan,G.Bjontegaard,and A.Luthra,“Overview of the H.264/AVC”,Circuits and Systems for Video Technology,lEEE Transactions,Vo13,7,560−576,July 2003
【非特許文献3】ITU−T Q.6/SG and ISO/IEC Moving Picture Experts Group(ISO/IEC JTC 1/SC 29/WG 11)
【非特許文献4】S.Cherigui,C Guillemot,D.Thoreau,P.Guillotel,“Map−Aided Locally Linear Embedding methods for image prediction” proceeding p2909−2012,IEEE International Conference on Image Processing(ICIP),2012
【発明の概要】
【0015】
本発明の目的は、従来技術の短所の少なくとも1つを克服するとともに、導入部に記述したような時間的予測方法において使用される辞書の第1のパッチを定義する情報を符号化するコストを顕著に最小化することである。
【0016】
このため、本発明は、候補パッチのセットから、辞書のパッチに属するピクセルブロックの重み付き和を使用する、画像のピクセルブロックを予測する方法に関し、それぞれのパッチが画像のピクセルブロックと、このピクセルブロックの因果的近傍とから形成される。この方法は、候補パッチのサブセットが、候補パッチのセットから得られ、辞書が、第1のパッチと呼ばれる、候補パッチのサブセットのパッチと、第2のパッチと呼ばれる、前記候補パッチのセットの少なくとも1つの他のパッチと形成されることを特徴とする。
【0017】
この辞書の他のパッチを選択するのに使用される候補パッチのセットの数と比較して、低減された数の候補パッチの中から辞書の第1のパッチを選択することにより、この第1のパッチが候補パッチのセットの中から選択されるときの標準的な方法において得られる符号化コストと比較して、低減された符号化コストを得ることが可能になる。
【0018】
本方法の変形形態によれば、第1のパッチは、その近傍が、コンテンツの点において、予測しようとするブロックを含むパッチの近傍に近いパッチであり、好ましくは先述のものと組み合わされる、別の変形形態によれば、辞書のそれぞれの第2のパッチは、コンテンツの点において、この辞書の第1のパッチに近い。
【0019】
実施形態によれば、前記サブセットのそれぞれの候補パッチの近傍は、コンテンツの点において、予測しようとするブロックを含むパッチの近傍に近い。
【0020】
実施形態によれば、1または複数の画像に対して定義されたサーチウィンドウに属するパッチだけが、候補パッチとして考慮される。
【0021】
本発明の別の態様によれば、本発明は、予測ブロックがその間に画像ピクセルブロックから計算される、画像シーケンスを符号化および/または復号する方法に関する。この符号化および/または復号する方法は、予測ブロックが上記方法によって計算されることを特徴とする。
【0022】
本発明の別の態様によれば、本発明は、候補パッチのセットからの辞書のパッチに属するピクセルブロックの重み付き和を使用して、前記ブロックを予測するように構成された、画像のピクセルブロックを予測するデバイスに関する。それぞれのパッチは、画像のピクセルブロックと、このピクセルブロックの因果的近傍とで形成され、デバイスはまた、
−前記候補パッチのセットから候補パッチのサブセットを得る手段と、
−前記候補パッチのサブセットのパッチと、前記候補パッチのセットの少なくとも1つの他のパッチとから、少なくとも1つの辞書を形成する手段と、
−上記の方法のうちの1つを実現するように構成された手段と
を含むことを特徴とする。
【0023】
本発明の別の態様によれば、本発明は、上記のデバイスによって伝送または受信されることを意図した信号のフレームに関する。このフレームは、それが、予測しようとするピクセルブロックの予測がそこから始まる、辞書の第1のパッチの位置を識別する、情報のアイテムを搬送することを特徴とする。
【0024】
デバイスの実施形態によれば、本発明は、信号のフレームが上述のものである信号を送信および/または受信する手段も備えることを特徴とする、上記のデバイスに関する。
【0025】
本発明の別の態様によれば、本発明は、上記のデバイスを備えることを特徴とする、画像シーケンスを符号化および/または復号する装置に関する。
【図面の簡単な説明】
【0026】
本発明は、添付の図面を参照して、非限定の実施形態および有利な実現形態を用いることによって、より正確に理解され、かつ説明される。
【
図1】
図1は、因果的近傍を定義する例を示す図である。
【
図2】本発明による、画像のピクセルブロックを予測する方法のステップを示す図である。
【
図3】辞書のパッチが同じ画像に属する場合を示す図である。
【
図4】辞書のパッチがすべて同じ画像に属するとは限らない場合を示す図である。
【
図5】辞書が第1のパッチから定義される場合を示す図である。
【
図6】辞書のパッチがすべて同じ画像に属するとは限らない場合を示す図である。
【
図7】本発明を実現するデバイスのアーキテクチャの例を概略的に示す図である。
【発明を実施するための形態】
【0027】
以下では、X
kで示される、パッチという用語を用いて、ブロックB
kのピクセルおよびこのブロックB
kの近傍V
kのピクセルのグループ化を表わす。近傍V
kは、このブロックB
kの因果要因であり、予測しようとするピクセルブロックBの回りに位置する近傍Vのそれと同一の形態を有する。ピクセルブロックに対する近傍の因果性(causality)は、このブロックの予測の前に、ピクセル値が既知であることを示す。以下では、予測しようとするピクセルブロックBのピクセルと、近傍Vのピクセルとのグループ化を表わすのに、パッチXも使用される。
【0028】
図1は、因果的近傍を定義する例を示す。この例によれば、例えば、予測しようとするピクセルブロックBの左および上に位置する3つのブロックにより近傍Vが形成される。近傍は、N値のベクトルであり、各値は、この近傍に属するピクセルの値に対応する。本発明は、この近傍の定義に決して制限はされることはなく、そうではなく、因果的近傍の任意の定義、いわば、予測しようとする現在ブロックを復号する以前の復号器において入手可能な任意の近傍に拡張される。
【0029】
図2は、画像シーケンスの画像のピクセルブロックを予測する方法のステップの図を示す。
【0030】
この方法によれば、現在画像I
CのピクセルブロックBは、候補パッチのセットPSから、辞書のパッチに属するピクセルブロックの重み付き和を用いて予測される。
【0031】
この方法によれば、候補パッチのセットPSは、1または複数の画像にわたり定義されるサーチウィンドウSWに属する少なくとも1つの候補パッチX
kで形成される(ステップ1)。このサーチウィンドウSWは、空間領域の形態における単一の画像上で定義することができるが、いわば、時間的に連続するか、またはそうではない画像シーケンスのいくつかの画像にわたって定義することができる時間的特性を有することもできる。
【0032】
例えば、このサーチウィンドウSWは、
図1において、一方では、(予想しようとするピクセルブロックがそれに属する)画像I
cに対して時間的に前の画像I
c−1のゾーンにより、パッチX(その共通に配置されたパッチが、この画像において破線で示される)を中心とするゾーンによって、他方では、画像I
cより時間的に後の、別の画像I
c+1のゾーンによって、定義される。この例によって、サーチウィンドウSWは、1または複数のゾーンで構成することができ、各ゾーンを、このパッチXの共通に配置されたパッチの周りで、場合によってはそれを中心として、定義することができること、およびこれらのゾーンは、予測しようとするブロックがそれに属する画像の前および/または後の、異なる画像内に位置することができることが理解できる。
【0033】
この方法によれば、候補パッチのサブセットSPSが、候補パッチのセットPSから取得される(ステップ2)。
【0034】
実施形態によれば、候補パッチのサブセットSPSのパッチX
kは、候補パッチのセットPSの候補パッチの中から無作為に選択される。
【0035】
別の実施形態によれば、候補パッチのサブセットSPSの各パッチX
kは、その近傍V
kが、コンテンツの点において、パッチXの近傍Vに近いように選択される。
【0036】
数学用語では、候補パッチのサブセットSPSのパッチX
kは、式(1):
【0039】
すなわち、候補パッチのサブセットSPSは、式(1)によって与えられるユークリッドノルム(Euclidean norm)を最小化する、N個の候補パッチをまとめてグループ化する。ユークリッドノルム以外の距離を、本発明の範囲から出ることなく、使用することができる。
【0040】
数字Nは、サーチウィンドウSWの候補パッチの合計数よりもずっと小さい整数である。しかしながら、これらのN個のパッチの1つを参照するインデックスのダイナミックレンジが、過剰な符号化コストにつながるほど大きすぎないことを確実にしながら、良好な予測を得るために、候補パッチのコンテンツにおける十分な変化を有するのに十分に大きくなくてはならない、この数字Nを求めるために、妥協が行われる。
【0041】
この方法によれば、少なくとも1つの辞書D
l(l≧1)が、候補パッチのサブセットSPSの、第1のパッチと呼ばれる、パッチX
0、および候補パッチのセットPSの、第2のパッチと呼ばれる、少なくとも1つの他のパッチX
k(1≦k<K)から形成される。
【0042】
一変形形態によれば、それぞれの辞書D
lは、候補パッチのサブセットSPSのものの中から無作為に選択されたパッチと、候補パッチのセットPSのものの中から無作為に選択された少なくとも1つのパッチとをまとめてグループ化する。
【0043】
一変形形態によれば、辞書D
lの、第1のパッチと呼ばれる、第1のパッチX
0は、候補パッチのサブセットSPSのものの中から選択され、つまり、この第1のパッチは、その近傍が、コンテンツの点において、近傍Vに近くなるように、選択される。
【0044】
一変形形態によれば、好ましくは先行のものと組み合わされ、辞書D
lのそれぞれの第2のパッチX
kが、候補パッチのセットPSのものの中から選択され、それによって、それは、コンテンツの点において、この辞書D
lの第1のパッチX
0に近い。
【0045】
近傍間またはパッチ間のコンテンツの近接度(proximity)は、それが、予測しようとするブロックの予測から生じる残留誤差のブロックのダイナミックレンジを制限するので、符号化の点において有利である。このコンテンツの近接度は、これらの近傍またはこれらのパッチのピクセルの値の間で計算された距離によって定量化される。この距離は、例えば、これらの2つの近傍またはパッチのピクセル間の絶対距離の和である。しかしながら、本発明は、特定の距離の使用に制限されない。
【0046】
辞書の数Lおよび辞書当たりのパッチの数は、アプリオリにわかっている値である。
【0047】
一変形形態によれば、各辞書におけるパッチの数Kは、すべての辞書に対して共通である。
【0048】
一変形形態によれば、数Kは、予測しようとするブロックに応じて可変である。
【0049】
この場合に、この数Kは、それぞれの予測しようとするブロックに対して最適化することができる。したがって、送信機/受信機の間での伝送のコンテキストで、それぞれの予測しようとするブロックに対して、この数を受信機に伝送することが必要である。
【0050】
この方法によれば、ブロックBは、辞書D
lのパッチに属するピクセルブロックの重み付き和を使用して、予測される(ステップ3)。
【0051】
この目的では、それぞれの辞書D
lに対して、予測しようとするブロックBの因果的近傍Vの予測は、この辞書のパッチX
kの近傍V
kの重み付き線形結合を使用して求められ、予測を最適化する重み付けパラメータが選択される。
【0052】
数学用語では、辞書D
lのパッチX
k(0≦k<K)の近傍V
kの重み付き線形結合を使用する、予測しようとするブロックBの因果的近傍Vの予測は、重み付けパラメータW
m、但しm∈{0;K−1}、を求めることにあり、このパラメータは、この辞書D
lのパッチの近傍V
kのピクセルの重み付き値と、近傍Vのピクセルの値の間の距離を最小化する。
【0053】
実施形態によれば、この距離は、ユークリッド空間において最小化によって表わされ、最小二乗の意味で、拘束条件
【0057】
で表わされ、ここでA
lは、辞書D
lのパッチのK個の近傍V
kのピクセルの値をまとめてグループ化する、次元MxKのマトリックスであり、各近傍のM個のピクセル値は、まとめてグループ化されて、このマトリックスの列を形成する。
【0058】
K個の重み付けパラメータは、このように、実際には式(3):
【0060】
によって最適化され、ここでCO
lは、マトリックスA
lのピクセルの値の(近傍Vを参照する)局所共分散マトリックスであり、Iは単位列ベクトルである。
【0061】
したがって、K個の最適重み付けパラメータ
【0063】
が、辞書D
lのK個の近傍V
kの線形結合を使用して、近傍Vを予測するために、取得される。
【0064】
実施形態によれば、L個の辞書D
l、但しl∈{0;L−1}、が考慮されて、重み付けパラメータ
【0066】
がこれらの辞書のそれぞれに対して求められて、ブロックBを予測するのに使用される重み付けパラメータWは、基準に従って、予測しようとするピクセルブロックに、最も近い予測を提供するものである。
【0067】
実施形態によれば、この基準は、(符号化および復号の後に)再構築された予測ブロックと、予測しようとするブロックの間の二乗誤差である。
【0068】
数学用語では、したがって、最適重み付けパラメータWは、式(4):
【0073】
別の実施形態によれば、使用される基準は、特にビデオ圧縮のコンテキストに適する、レート歪基準(rate−distortion criterion)である。
【0074】
数学用語では、最適重み付けパラメータWは、式(5):
【0076】
によって与えられるものであり、ここでSSE
lは、最小二乗の意味において、予測しようとするピクセルブロックと再構築された予測ブロック(復号ブロック)の間の再構築誤差の尺度であり、R
lはブロック(予測誤差およびその他のシンタックス要素)を符号化するコストであり、λはラグランジアンである。
【0077】
単一の辞書が使用される場合の方法によれば、ブロックBは、辞書D
lのパッチX
kのブロックB
kのピクセルの重み付き線形結合を使用して予測され、重み付けパラメータ
【0079】
は、式(3)において先に求められたものである。
【0080】
いくつかの辞書が使用される場合には、ブロックBは、パッチX
kのブロックB
kのピクセルの重み付き線形結合を使用して予測される。予測しようとするブロックを予測するのに使用される重み付けパラメータは、式(4)によって与えられるパラメータWであり、ブロックBの予測をそこから開始する辞書は、したがって、使用されたこれらの重み付けパラメータに対応するものである。
【0085】
によって与えられ、ここでAは、K個のブロックB
kのピクセルP個の値をまとめてグループ化する、次元P×Kのマトリックスであり、Wは選択された重み付けパラメータである。
【0086】
送信機と受信機器の間の伝送のコンテキストにおいて、使用されるパラメータの数が復号器に先にわかっている場合には、および単一の辞書が、近傍に基づいてのみ構築されている場合には、ブロックBを予測するために、受信機(復号器)に伝送される特定の情報はない。実際に、一方では、予測によって使用される近傍が因果要因であり、このことにより受信機がマトリックスAを再構築するパッチのブロックを発見することが可能となるので、また他方で、近傍Vの予測を実現することによって、予測方法は、特定の情報なしに受信機によって実現することが可能であり、この場合に得られるK個の重み付けパラメータは、この場合には送信機(符号器)によって実現される近傍を予測するサブステップ中に得られるもの(W)と同一である。
【0087】
このように、この予測方法を実現する符号化方法は、例えば、H.264/AVCに使用されるものなどの、画像間符号化の従来の技法と比較して、大幅な符号化ゲインをもたらすことを理解することができる。
【0088】
いくつかの辞書が使用される場合には、符号器によって選択された辞書の第1のパッチを識別する情報の特定のアイテムは、予測しようとするブロックを再構築するために、復号器に対して既知でなければならない。このために、信号が伝送されて、予測しようとするピクセルブロックの予測をそこから開始する、辞書の第1のパッチの位置を識別する情報の特定のアイテムを搬送する。
【0089】
実施形態によれば、辞書D
lの第1のパッチX
0の画像の位置は、パッチXから定義される変位情報
【0094】
のアイテムは、実施形態によれば、既知のブロックマッチング方法によって得ることができ、この方法は、このブロックマッチング方法において、パッチをブロックとして考慮することによって、パッチXに対して第1のパッチの変位を求めることを可能にする。
【0095】
変位情報のアイテムは、この復号器が、どれが使用された第1のパッチかを判定することができるように、復号器に伝送されなくてはならない。復号器は、上述したものに類似する動作を実現することによって、辞書のその他のパッチを判定することができるので、それらを判定するためにその他の情報を伝送する必要はない。
【0096】
したがって、いくつかの辞書を使用して、この予測方法を実現する符号化方法はまた、例えばH.264/AVCにおいて使用されるもののような画像間符号化の従来の技法と比較して、大幅な符号化ゲインをもたらすことが理解できる。
【0097】
図3で示される、実施形態によれば、k∈{0;K−1}の場合に、辞書D
lのK個のパッチX
kは、現在画像I
c以外の同一画像I
f内にすべて位置している。画像I
fは、これらの2つの画像が同一画像シーケンスに属するときには、画像I
cに対して時間的に前または後にすることができる。
【0098】
図4で示される、実施形態によれば、k∈{0;K−1}の場合に、辞書D
lのK個のパッチX
kは、異なる画像内に位置する。
図4の例によれば、辞書D
lは、現在画像I
cより時間的に前の画像I
c−1内に(K−1)個のパッチX
1、...、X
K−1、および現在画像I
cの時間的に後の画像I
c+1内にパッチX
0を含む。
【0099】
この実施形態は、したがって異なる画像に属することができる、同一辞書内にあるパッチの可能性を増大させることができるので、有利である。これによって、この方法は、同じビデオの画像間の時間的冗長性の恩恵を受けるので、予測しようとするブロックに対する予測誤差をさらに低減することが可能になる。
【0100】
図3および4に示される、これら2つの実施形態は、辞書の定義を決して制限するものではない。それらは、予測しようとするブロックがそれに属するもの以外の、1または複数の画像に位置するパッチによって辞書を形成することができることを示すために与えられている。
【0101】
図5は、それぞれ第1のパッチから、L個の辞書が定義されている場合を示す。このように、L個の第1のパッチ
【0103】
但し、l∈{0;L−1}、がパッチXの変位から(またはより正確には、実質的に画像I
fにおけるそれと同位置に配置されたパッチX
lから)得られることがわかる。
【0107】
図6は、辞書パッチのすべてが、同じ画像I
fに属するとは限らない場合を示す。画像I
c+1は、この現在画像の復号中に現在画像I
cに時間的に先行しないことを注記することができる。この例によれば、辞書D
0は、画像I
c+1に属する第1のパッチ
【0109】
と画像I
c+1にすべて属するとは限らないパッチとで形成される。例えば、パッチ
【0111】
は、画像I
cー2に属する。同様に、辞書D
L−1は、画像I
c−2に属する第1のパッチ
【0113】
および画像I
c−2にすべて属するとは限らないパッチとで形成される。例えば、パッチ
【0116】
これらの例を介して、2つのパッチのコンテンツの近接度を定量化する距離は、必ずしも同じ画像に属するとは限らないパッチ間の類似性を定量化するように定義できるので、それは最も広い意味で理解すべきであることが理解できる。
【0117】
図7は、
図1から6に関して記述された本発明を実現するように構成された手段を含む、デバイスのアーキテクチャの例を示す。
【0118】
デバイス700は、ディジタルアドレスおよびデータバス701によって相互接続された、以下の要素を備える:
−計算ユニット703(中央処理ユニットとも呼ばれる);
−メモリ705;
−デバイス700と、接続702を介して接続されたその他のリモートデバイスとの相互接続のための、ネットワークインターフェイス704。
【0119】
計算ユニット703は、(場合によっては専用の)マイクロプロセッサ、(場合よってはやはり専用の)マイクロコントローラ、などによって実現することができる。メモリ705は、揮発性および/または不揮発性形態、例えばRAM(ランダムアクセスメモリ)、ハードディスク、EPROM(消去可能プログラマブルROM)、その他として実現することができる。
【0120】
手段703、705、および場合によっては704は、互いに協働して、それぞれのパッチが画像のピクセルブロックとこのピクセルブロックの因果的近傍とで形成されている、候補パッチのセットからの辞書のパッチに属するピクセルブロックの重み付き和を使用して、ピクセルブロックを予測する。
【0121】
手段703、705および場合によっては704はまた、互いに協働して、候補パッチのセットから候補パッチのサブセットを取得し、候補パッチのサブセットのパッチ、および候補パッチのセットの少なくとも1つの他のパッチから、少なくとも1つの辞書を形成する。
【0122】
デバイスの手段は、
図1から6に関係して記述した方法を実現するように構成されている。
【0123】
デバイス700の実施形態によれば、手段704は信号を送信および/または受信し、その信号のフレームが、予測しようとするピクセルブロックの予測がそこから始まる、辞書の第1のパッチの位置を識別する、情報のアイテムを搬送するように構成されている。
【0124】
本発明はまた、予測ブロックが参照画像ブロックからその間に計算される、画像シーケンスを符号化および/または復号する方法にも関する。この方法は、予測ブロックが、
図1から6に関して記述された方法に従って、計算されることを特徴としている。
【0125】
本発明はまた、画像シーケンスを符号化および/または復号する装置であって、
図7に関して記述されたデバイスを含むことを特徴とする装置にも関する。
【0126】
図7において、示されているモジュールは、物理的に区別可能な単位に対応させることができるか、またはできない機能単位である。例えば、これらのモジュールまたはそれらの一部は、単一の構成要素または回路にまとめてグループ化するか、または同一ソフトウェアの機能を構成することができる。反対に、一部のモジュールは、別個の物理的エンティティで構成してもよい。本発明に適合する画像間予測デバイスは、純粋なハードウェア実施形態、例えば、専用構成要素(例えば、ASIC(特定用途集積回路)またはFPGA(フィールドプログラマブルゲートアレイ)またはVLSI(超大規模集積回路))、またはデバイスに統合された、いくつかの電子構成要素の形態、またはハードウェア要素とソフトウェア要素の混合物の形態でも実現される。
[付記1]
候補パッチのセット(PS)からの辞書(Dl)のパッチに属するピクセルブロックの重み付き和を使用して、画像のピクセルブロックを予測する方法であって、それぞれのパッチが画像のピクセルブロックと、このピクセルブロックの因果的近傍とで形成される、方法において、
候補パッチのサブセット(SPS)が、前記候補パッチのセット(PS)から得られ、前記辞書(Dl)が、第1のパッチと呼ばれる、前記候補パッチのサブセット(SPS)に属するパッチと、第2のパッチと呼ばれる、前記候補パッチのセット(PS)に属する少なくとも1つの他のパッチとで形成される、前記方法。
[付記2]
前記第1のパッチが、その近傍と、予想しようとするブロックを含むパッチの近傍との間で計算される距離を最小化するパッチである、付記1に記載の方法。
[付記3]
前記辞書のそれぞれの第2のパッチは、該辞書の、前記第2のパッチと前記第1のパッチとの間で計算される距離を最小化するパッチである、付記1または2に記載の方法。
[付記4]
前記サブセットのそれぞれの候補パッチは、その近傍と、予測しようとするブロックを含むパッチの近傍との間で計算される距離を最小化する、付記1から3の一項に記載の方法。
[付記5]
予測しようとするブロックの因果的近傍の予測が、前記辞書のパッチの近傍の重み付き線形結合を使用して求められ、前記予測を最適化する重み付けパラメータが選択され、
画像のピクセルブロックが、辞書のブロックのピクセルの重み付き線形結合を使用して予測され、前記線形結合の重み付けパラメータは、予測しようとするブロックの因果的近傍の予測中に選択されるものである、付記1から4の一項に記載の方法。
[付記6]
辞書の第1のパッチの画像における位置が、予測しようとするブロックとその因果性近傍とで形成されるパッチから定義される変位情報のアイテムによって与えられる、付記1から5の一項に記載の方法。
[付記7]
画像シーケンス中に予測ブロックが画像ピクセルブロックから計算される、画像シーケンスを符号化および/または復号する方法であって、
前記予測ブロックが、付記1から6の一項に記載の方法によって計算される、前記方法。
[付記8]
候補パッチのセットからの辞書のパッチに属するピクセルブロックの重み付き和を使用して、前記ブロックを予測するように構成された画像のピクセルブロックを予測するデバイスであって、それぞれのパッチが画像のピクセルブロックと、このピクセルブロックの因果的近傍とで形成される、デバイスにおいて、さらに、
前記候補パッチのセットから候補パッチのサブセットを得る手段と、
前記候補パッチのサブセットのパッチと、前記候補パッチのセットの少なくとも1つの他のパッチとから、少なくとも1つの辞書を形成する手段と、
付記1から6の一項に記載の方法を実現するように構成された手段と
を含む、前記デバイス。
[付記9]
付記8に記載のデバイスによって送信または受信されることを意図した信号のフレームであって、
予測しようとするピクセルブロックの予測がそこから始まる、前記辞書の第1のパッチの位置を識別する情報のアイテムを搬送する、前記フレーム。
[付記10]
信号を送信および/または受信する手段も備え、前記信号のフレームが付記9のものと一致する、付記8に記載のデバイス。
[付記11]
画像シーケンスを符号化および/または復号する装置であって、付記8または10に記載のデバイスと、付記7に記載の方法を実現するように構成された手段とを備える、前記装置。