特許第5799080号(P5799080)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ トムソン ライセンシングの特許一覧

特許5799080画像シーケンスのブロックを符号化する方法および再構成する方法
<>
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000016
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000017
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000018
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000019
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000020
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000021
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000022
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000023
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000024
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000025
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000026
  • 特許5799080-画像シーケンスのブロックを符号化する方法および再構成する方法 図000027
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5799080
(24)【登録日】2015年8月28日
(45)【発行日】2015年10月21日
(54)【発明の名称】画像シーケンスのブロックを符号化する方法および再構成する方法
(51)【国際特許分類】
   H04N 19/97 20140101AFI20151001BHJP
   H04N 19/593 20140101ALI20151001BHJP
【FI】
   H04N19/97
   H04N19/593
【請求項の数】14
【全頁数】19
(21)【出願番号】特願2013-501777(P2013-501777)
(86)(22)【出願日】2011年3月28日
(65)【公表番号】特表2013-524597(P2013-524597A)
(43)【公表日】2013年6月17日
(86)【国際出願番号】EP2011054682
(87)【国際公開番号】WO2011120894
(87)【国際公開日】20111006
【審査請求日】2014年3月20日
(31)【優先権主張番号】1052517
(32)【優先日】2010年4月2日
(33)【優先権主張国】FR
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】ソロー,ドミニク
(72)【発明者】
【氏名】マルタン,オレリー
(72)【発明者】
【氏名】シエリギユ,サフア
(72)【発明者】
【氏名】フランソワ,エドウアルド
(72)【発明者】
【氏名】ビエロン,ジエローム
【審査官】 坂東 大五郎
(56)【参考文献】
【文献】 Aurelie Martin, Jean-Jacques Fuchs, Christine Guillemot and Dominique Thoreau,Phase refinement for image prediction based on sparse representation,Proceedings of the SPIE,2010年 1月19日,vol.7543
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00−19/98
(57)【特許請求の範囲】
【請求項1】
画像のシーケンスの現ブロックを符号化する方法であって、前記方法は、
現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解するステップであって、前記第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備える、前記ステップと、
前記分解されたベクトルか前記現ブロックに対応するデータを抽出する第1の抽出のステップであって、前記抽出されたデータは予測ブロックを構成する、前記ステップと、
前記現ブロックから前記予測ブロックを抽出することにより、残差ブロックを決定するステップと、
前記残差ブロックを符号化するステップと、を含み、
前記符号化方法は、各反復において原子に分解する前記ステップが、
原子の前記第1のディクショナリにおける第1の原子を選択する第1の選択のステップと、
前記第1の原子がテクスチャ化された原子である場合、前記第1の原子に関連付けられ、前記第1の原子より大きい、第2のディクショナリのパッチと現残差ベクトルの間の位相相関を適用するステップと、
前記第2のディクショナリの前記パッチから、前記残差ベクトルと最も強い相関関係がある少なくとも部分を抽出する第2の抽出のステップであって、前記抽出された部分は、前記第1の原子と同一サイズの第2の原子を構成する、前記ステップと、
前記第1のディクショナリの前記第1の原子および前記第2の原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択する第2の選択のステップと、
前記選択された原子により、前記残差ベクトルを更新するステップと、を含む、前記方法。
【請求項2】
前記第2のディクショナリのパッチは円対称性である、請求項1に記載の符号化方法。
【請求項3】
前記第2のディクショナリのパッチは、それらのコンテンツに依拠する形状を有している、請求項1または2に記載の符号化方法。
【請求項4】
前記第2のディクショナリは、異なるサイズの少なくとも2つのパッチを備えている、請求項1〜3のいずれかに記載の符号化方法。
【請求項5】
前記第2の抽出のステップは、前記残差ベクトルに最も強い相関関係があるN個の部分の抽出を含み、抽出された各部分は再位相化原子を構成し、
前記第2の選択のステップは、前記第1の原子および前記再位相化原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択することを含む、請求項1〜4のいずれかに記載の符号化方法。
【請求項6】
ストリーム形式により生じる画像のシーケンスの現ブロックを再構成する方法であって、
前記ストリームから前記現ブロックについて残差ブロックを復号するステップと、
前記現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解するステップであって、前記第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備える、前記ステップと、
前記分解されたベクトルから前記現ブロックに対応するデータを抽出する第1の抽出のステップであって、前記抽出されたデータは予測ブロックを構成する、前記ステップと、
前記復号された残差ブロックと前記予測ブロックを結合することにより、前記現ブロックを再構成するステップと、を含み、
前記再構成方法は、各反復において原子に分解する前記ステップが、
原子の前記第1のディクショナリにおける第1の原子を選択する第1の選択のステップと、
前記第1の原子がテクスチャ化された原子である場合、前記第1の原子に関連付けられ、前記第1の原子より大きい、第2のディクショナリのパッチと現残差ベクトルの間の位相相関を適用するステップと、
前記第2のディクショナリの前記パッチから、前記残差ベクトルと最も強い相関関係がある少なくとも部分を抽出する第2の抽出のステップであって、前記抽出された部分は、前記第1の原子と同一サイズの第2の原子を構成する、前記ステップと、
前記第1のディクショナリの前記第1の原子および前記第2の原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択する第2の選択のステップと
前記選択された原子により、前記残差ベクトルを更新するステップと、を含む、前記方法。
【請求項7】
前記第2のディクショナリのパッチは円対称性である、請求項6に記載の再構成方法。
【請求項8】
前記第2のディクショナリのパッチは、それらのコンテンツに依拠する形状を有する、請求項6または7に記載の再構成方法。
【請求項9】
前記第2のディクショナリは、異なるサイズの少なくとも2つのパッチを備える、請求項6〜8のいずれかに記載の再構成方法。
【請求項10】
前記第2の抽出のステップは、前記残差ベクトルに最も強い相関関係があるN個の部分の抽出を含み、抽出された各部分は再位相化原子を構成し、前記第2の選択のステップは、前記第1の原子および前記再位相化原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択することを含む、請求項6〜8のいずれかに記載の再構成方法。
【請求項11】
画像のシーケンスの現ブロックを符号化する装置に関し、前記装置は、
現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解する手段であって、前記第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備える、前記手段と、
記分解されたベクトルか前記現ブロックに対応するデータを抽出する第1の抽出手段であって、前記抽出されたデータは予測ブロックを構成する、前記第1の抽出手段と、
前記現ブロックから前記予測ブロックを抽出することにより、残差ブロックを決定する手段と、
前記残差ブロックを符号化する手段と、を備え、
前記符号化装置は、データのベクトルを反復的に第1のディクショナリの原子に分解する前記手段が、
原子の前記第1のディクショナリにおける第1の原子を選択する第1の選択手段と、
前記第1の原子がテクスチャ化された原子である場合、前記第1の原子に関連付けられ、前記第1の原子より大きい、第2のディクショナリのパッチと現残差ベクトルの間の位相相関を適用する手段と、
前記第2のディクショナリの前記パッチから、前記残差ベクトルと最も強い相関関係がある少なくとも部分を抽出する第2の抽出手段であって、前記抽出された部分は、前記第1の原子と同一サイズの第2の原子を構成する前記第2の抽出手段と、
前記第1のディクショナリの前記第1の原子および前記第2の原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択する第2の選択手段と、
前記選択された原子により、前記残差ベクトルを更新する手段と、を含む、前記装置。
【請求項12】
前記装置は、請求項1〜5のいずれかに記載の符号化方法のステップを実行するように構成された、請求項11に記載の符号化装置。
【請求項13】
ストリーム形式で生じる画像のシーケンスの現ブロックを再構成する復号装置であって、
前記ストリームから前記現ブロックについて残差ブロックを復号する手段と、
前記現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解する手段であって、前記第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備える、前記手段と、
記分解されたベクトルか前記現ブロックに対応するデータを抽出する第1の抽出手段であって、前記抽出されたデータは予測ブロックを構成する、前記第1の抽出手段と、
前記復号された残差ブロックと前記予測ブロックを結合することにより、前記現ブロックを再構成する手段と、を備え、
前記復号装置は、データのベクトルを反復的に第1のディクショナリの原子に分解する前記手段が、
原子の前記第1のディクショナリにおける第1の原子を選択する第1の選択手段と、
前記第1の原子がテクスチャ化された原子である場合、前記第1の原子に関連付けられ、前記第1の原子より大きい、第2のディクショナリのパッチと現残差ベクトルの間の位相相関を適用する手段と、
前記第2のディクショナリの前記パッチから、前記残差ベクトルと最も強い相関関係が少なくともある部分を抽出する第2の抽出手段であって、前記抽出された部分は、前記第1の原子と同一サイズの第2の原子を構成する、前記第2の抽出手段と、
前記第1のディクショナリの前記第1の原子および前記第2の原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択する第2の選択手段と、
前記選択された原子により、前記残差ベクトルを更新する手段と、を備える、前記装置。
【請求項14】
前記装置は、請求項6〜10のいずれかに記載の再構成方法のステップを実行するように構成された、請求項13に記載の復号装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像符号化の一般領域に関する。
【0002】
本発明は、画像のシーケンスのブロックを符号化する方法、およびそれに対応する、当該ブロックを再構成する方法に関する。
【背景技術】
【0003】
図1に関連して、空間的または時間的予測により、複数の画像のシーケンスに属する現画像の画素の現ブロックBcを符号化することは、当該技術分野で知られている。この目的のために、符号化される現ブロックBcについて、空間的予測の場合に事前に再構成された現ブロックに空間的に隣接する画素、または参照画像と呼ばれる、事前に再構成された現画像以外の画像の画素から、予測ブロックBpを決定することは、当該技術分野では知られている。
【0004】
ステップ12では、現ブロックBcから予測ブロックBpを抽出することにより、残差ブロックBrが決定される。
【0005】
ステップ14では、残差ブロックは、ストリームFにおいて符号化される。この符号化のステップは一般に、ストリームFにおける残差ブロックの係数のブロックへの変換、この係数の量子化、係数のエントロピー符号化を含んでいる。
【0006】
予測ブロックBpを決定するために、「マッチング追跡」等の原子分解の反復法を、前記現ブロックに隣接するブロックの少なくとも再構成されたブロックの画像データを有するデータのベクトルに適用することが、当該技術分野において知られている。原子分解は、原子のディクショナリにおける原子を反復手法で選択することを含んでいる。ディクショナリは通常、分析上または理論上の原子と呼ばれる原子、すなわち、離散コサイン変換(DCT:Discrete Cosine Transform)または離散フーリエ変換(DFT:Discrete Fourier Transform)等の変換の基本関数に対応するものである。分析上または理論上の原子は、その数式により完全に記述される。図2においては、これらの分析上の原子は、原子のディクショナリの最初の8つの欄を構成する。予測ブロックの現ブロックに対する関連性、すなわち適合性は、ディクショナリに存在する原子に強く依存する。予測を改善するために、自然テクスチャから、テクスチャ化された原子と呼ばれるテクスチャ・サンプルを追加することにより、ディクショナリのサイズを大きくすることが可能である。図2においては、これらのテクスチャ化された原子は、原子のディクショナリの最後の8つの欄を形成する。これらは例えば、自然または合成画像から抽出される。
【0007】
ディクショナリのサイズの増加は、計算コストの増加を招く。実際、分子分解の過程では、より多くの原子を検証する必要がある。
【発明の概要】
【0008】
本発明の目的は、従来技術の欠点のうち少なくとも一つを克服することである。このために本発明は、画像のシーケンスの現ブロックを符号化する方法に関し、当該方法は、
現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解するステップを含み、第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備え、当該方法は更に、
現ブロックに対応する分解されたベクトルデータから抽出するステップを含み、当該抽出されたデータは予測ブロックを構成し、当該方法は更に、
現ブロックから予測ブロックを抽出することにより、残差ブロックを決定するステップと、
残差ブロックを符号化するステップを含んでいる。
【0009】
各反復において原子に分解するステップは、
原子の第1のディクショナリにおける第1の原子を選択するステップと、
第1の原子がテクスチャ化された原子である場合、第1の原子に関連付けられたパッチと現残差ベクトルの間の位相相関を適用するステップと、
パッチから、残差ベクトルと最も強い相関関係がある部分を少なくとも抽出するステップを含み、当該抽出された部分は第2の原子を構成し、当該ステップは更に、
第1の原子および第2の原子から、現残差ベクトルと最も強い相関関係がある原子を選択するステップと
選択された原子により、残差ベクトルを更新するステップを含んでいる。
【0010】
本発明にかかる符号化方法により、好都合にも、パッチを利用して多数の原子を検証することができる。これらのパッチにより、第1の選択されたテクスチャ化された原子は、特に位相相関のステップにより、当該テクスチャ化された原子に関して、多数の再位相化原子を検証することを可能にする。
【0011】
同じ数の原子を先行技術の方法の一つにより検証するためには、各テクスチャ化された原子についての再位相化原子を挿入する、第1のディクショナリのサイズを増加させることが必要であろう。しかし、かかる拡大されたディクショナリから原子へ分解することは、かなりのコストがかかる。例えば、マッチング追跡型アルゴリズムに基づく分解の場合、このアプローチは、第1のディクショナリの各原子について、少なくとの一つのスカラー乗積が行われることを必要とし、これは、縮小されたサイズの第1のディクショナリについてスカラー乗積を行い、そして本発明の符号化方法で行われる第2のディクショナリを利用した単純な位相相関による複数の再位相化原子を検証することよりもかなりコストがかかる。
【0012】
更に、第2のディクショナリを利用して多数の再位相化原子を検証するという事実により、多数の反復を削減することができる。
【0013】
本発明の特定の特徴により、第2のディクショナリのパッチは円対称性である。
【0014】
本発明の他の特定の特徴により、第2のディクショナリのパッチは、コンテンツにより異なる形態を備えている。
【0015】
他の特定の特徴により、第2のディクショナリは、異なるサイズの少なくとも2つのパッチを備えている。
【0016】
変形実施形態によると、抽出のステップは、残差ベクトルに最も強い相関関係があるN個の部分の抽出を含み、抽出された各部分は再位相化原子を構成し、選択のステップは、第1の原子および再位相化原子から、現残差ベクトルと最も強い相関関係がある原子を選択することを含んでいる。
【0017】
本発明は更に、ストリーム形式による画像のシーケンスの現ブロックを再構成する方法に関し、当該方法は、
ストリームから現ブロックについて残差ブロックを復号化するステップと、
現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解するステップを含み、第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備え、当該方法は更に、
現ブロックに対応する分解されたベクトルデータから抽出するステップを含み、当該抽出されたデータは予測ブロックを構成し、当該方法は更に、
復号化された残差ブロックと予測ブロックを結合することにより、現ブロックを再構成するステップを含んでいる。
【0018】
各反復において原子に分解するステップは、
原子の第1のディクショナリにおける第1の原子を選択するステップと、
第1の原子がテクスチャ化された原子である場合、第1の原子に関連付けられたパッチと現残差ベクトルの間の位相相関を適用するステップと、
パッチから、少なくとも残差ベクトルと最も強い相関関係がある部分を抽出し、当該抽出された部分は第2の原子を構成し、当該ステップは更に、
第1の原子および第2の原子から、現残差ベクトルと最も強い相関関係がある原子を選択するステップと
選択された原子により、現残差ベクトルを更新するステップを含んでいる。
【0019】
符号化方法を参照しつつ記載された利点と同一の利点は、再構成の方法にも適用される。
【0020】
本発明の特定の特徴により、第2のディクショナリのパッチは円対称性である。
【0021】
本発明の他の特定の特徴により、第2のディクショナリのパッチは、そのコンテンツに応じた形態を備えている。
【0022】
特定の特徴により、第2のディクショナリは、異なるサイズの少なくとも2つのパッチを備えている。
【0023】
変形実施形態によると、抽出のステップは、残差ベクトルに最も強い相関関係があるN個の部分の抽出を含み、抽出された各部分は再位相化原子を構成し、選択のステップは、第1の原子および再位相化原子から、現残差ベクトルと最も強い相関関係がある原子の選択することを含んでいる。
【図面の簡単な説明】
【0024】
本発明は、実施形態および効果的な実装を介し、以下の添付図面を参照しつつ、何ら制限することなく、より良く理解され、かつ記述される。
【0025】
図1図1は、先行技術にかかる符号化方法を示している。
図2図2は、分析上およびテクスチャ化された原子を有する原子のディクショナリを示している。
図3図3は、先行技術にかかる原子分解の方法を示している。
図4図4は、一群の画像のブロックを示している。
図5図5は、本発明により絞り込まれた原子分解の方法を示している。
図6図6は、本発明による原子分解の方法の詳細を示している。
図7図7は、本発明にかかる符号化方法を示している。
図8図8は、本発明にかかる符号化方法の特定の構成要件を示している。
図9図9は、本発明にかかる再構成の方法を示している。
図10図10は、本発明にかかる符号化方法を示している。
図11図11は、本発明にかかる復号化方法を示している。
図12図12は、因果的領域の種々の形態を示している。
【発明を実施するための形態】
【0026】
画像は画素または画像点を備え、その各々と画像データの少なくとも一つの項目が関連付けられている。画像データの項目は例えば、輝度データの項目または色データの項目である。
【0027】
「残差」の用語は、他のデータの抽出後に得られたデータを指す。抽出は一般に、ソース画素から予測画素を差し引くことである。しかし抽出はより一般的であり、特に加重減法を含んでいる。
【0028】
「再構成物」の用語は、残差を予測データと結合した後に得られたデータ(例えば、画素、ブロック)を指している。結合は一般に、残差予測画素の和である。しかし結合はより一般的であり、特に加重合計を含む。再構成されたブロックは、再構成された画素のブロックである。
【0029】
画像復号化に関連して、「再構成」および「復号化」の用語は非常に頻繁に同義語として用いられる。よって「再構成されたブロック」は、「復号化されたブロック」の用語に属するものとしても称される。
【0030】
本発明にかかる符号化方法は、原子分解の方法に基づいている。原子分解を信号Yから得ることを可能にする種々の方法が存在する。これらのうち最もよく知られているものの一つは、「マッチング追跡」の用語で特定される。直交マッチング追跡または「グローバル整合フィルタ」等の「マッチング追跡」の変形を使用してもよい。
【0031】
原子分解の一般原則および「マッチング追跡」の一般原則を以下に記載する。Yは、次元Nのソースベクトルと仮定し、Aを次元N×Mであって、M>>Nの行列と仮定する。Aの列aは、ソースベクトルYを表すのに用いられるディクショナリの分析上またはテクスチャ化された原子である。ソース信号Yの原子分解の目的は、Y=AXのように、次元MのベクトルXを決定することである。ベクトルXについては、解の無限性がある。簡約表現の目的は、Y=AXのすべての解のうち、簡約である解、すなわちベクトルXが少ない数の非NULL係数しか有していない解を探索することである。厳密解を探索することは、非常に費用のかかる組み合わせ法が必要になるため、実際上は過度に複雑である。一般に、N(Y−AX)≦ρ(ここでρは、表現の簡約性を調整する許容しきい値であり、N(.)は例えば、自乗ノルムL2である)を実証する簡約表現が代わりに求められる。N(.)は必然的に、ノルムL2以外のノルムであってもよい。
【0032】
マッチング追跡(MP)方法により、反復法を利用して、準最適解、すなわち非厳密解を求めることができる。当該方法により、各々の新しい反復kにおいて(同一の原子が複数の反復の過程で選択される場合を除き)一般に増加する複数の非NULL係数を有する表現X、次元ベクトルMが各反復kにおいて生成される。MP法を図3を参照しつつ詳細に説明する。
【0033】
既知のデータは、ソース信号Y、ディクショナリA、しきい値ρである。反復ステップ20(反復 k=0)において、データXおよびRが初期化され、このときRは、残差誤差または残差ベクトルの初期ベクトルである。たとえば、X=0であって、残差誤差または残差ベクトルRの初期ベクトルが以下のように初期化される。
=Y−AX=Y
【0034】
ステップ22では、k番目の反復に対応して、現残差ベクトルRk−1と最も高い相関関係がある基本関数ajkが選択され、ここで、Rk−1=Y−AXk−1である。
【0035】
【数1】
であり、ここで<.>は、スカラー乗積演算子である。
【0036】
ステップ24では、ベクトルXおよび残差ベクトルRが更新される。
【0037】
ベクトルXの係数xjkは、以下の式により算定される。
【0038】
【数2】
【0039】
残差ベクトルRは以下の式により更新される。
【0040】
【数3】
【0041】
算定された係数xjkは、Xk−1に追加されて新たな表現Xを形成する。
【0042】
ステップ26では、停止基準が充たされているか否かを見極めるための検証がある。
N(Y−AX)≦ρのときは、当該処理は終了し、そうでないときは、ステップ28でkが1つずつ増分され、ステップ22で当該処理は再開する。最終ベクトルAXソース信号Yの近似式であり、ここでKは最終反復の指数である。
【0043】
図4では、サイズn×nの画素のブロックが図示されている。整数nは、例えば4、8、16等、様々な値をとることができる。灰色ブロック(領域P)は、予測される現ブロックを示しており、斜線を付したブロック(領域C)は、因果的領域を示しており、白い領域(領域NC)は、非因果的領域を示している。因果的領域は、現ブロックの符号化に先立ち、符号化され、かつ再構成された画素を有している。因果的領域の画定は、画像中のブロックの符号化順序に左右される。図4では、ブロックは、「ラスタスキャン」として知られた標準的な符号化順序に従って符号化されると仮定する。しかし本発明は、この符号化順序には全く限定されない。本発明にかかる符号化方法は、L=C∪P∪NCによりスキャンされた領域Lの画素から構成された観測ベクトルYの原子分解を含んでいる。そしてベクトルYは、サイズ9nx1のベクトルである。実際には、原子分解は、領域Cの画素に関連付けられた画像データを備えたベクトルYに適用され、例えば予備的予測ステップにより当該領域の画素に関連付けられた画像データに適用される場合もある。実際、領域Lの他の画素の画像データは知られておらず、NULLであると考えられる。
【0044】
図5は、本発明により絞り込まれた原子分解の方法を示している。本発明により絞り込まれた原子分解法は、2つのディクショナリを使用している。第1のディクショナリAは、MP型方法により通常使用される分析上および/またはテクスチャ化された原子を備えている。例えば、分析上の原子は、領域L(3n×3n)と同一のサイズの二次元基本関数であり、信号を基本信号に分解することについて適正な特性を有していると仮定する。例えば、離散コサイン変換(DCT:Discrete Cosine Transform)または離散フーリエ変換(DFT:Discrete Fourier Transform)等、通常の変換の核は、分析上の原子を画定するのに利用される。これら特殊のケースでは、信号の周波数分解が行われる。DFTおよびDCTに関連付けられた基本関数または分析上の原子の式は各々、以下の通りである。
【0045】
【数4】
および
【数5】
【0046】
ディクショナリAは、分析上の原子と同一サイズのテクスチャ化された原子により完成する。ディクショナリAは、領域Lを表すために、最小9nの原子を含んでいる必要がある。各々のサイズが二次元の行列で3n×3nである9nの二次元原子を含むことを可能にするために、原子はベクトル化される。よってディクショナリAは、各々がサイズ9n×1の分析上またはテクスチャ化された原子を表す最小9nの列から構成される。Aは、ディクショナリおよび対応する行列の双方を指している。
【0047】
DCTおよびDFT原子の選択は限定ではない。実際、ディクショナリは、画像のいずれのパターンタイプ(Gabor原子、異方性原子等)を表すこともできるいずれの基本関数によっても質を向上させることができる。行列Aの原子の数、あるいはここでも列の数は、最小値としてベクトル領域Lのサイズ(すなわち9n)を有するが、理論上の最大値は有しない。原子の量が多いほど、信号が再生される可能性は大きくなる。
【0048】
第2のディクショナリは、第1のディクショナリの原子より大きいパッチで構成される。テクスチャ化された原子のようなこれらのパッチは、自然画像から生じる。より詳細には、第1のディクショナリの各テクスチャ化された原子または第1のディクショナリの一部に過ぎない各テクスチャ化された原子と、第2のディクショナリのパッチは関連付けられている。第2のディクショナリのパッチは例えば、自然または合成画像から抽出される。パッチは長方形状であってもよい。変形によると、パッチの形状はコンテンツに左右される。例えば、パッチが実質的に垂直構造を有する場合は、高さが高いというより幅広い長方形であることが好ましいであろう。逆の場合、すなわちパッチが実質的に水平構造を有する場合は、幅広いというより高さが高い長方形であることが好ましいであろう。同様に、パッチは円対称性であってもよい。第1のディクショナリのテクスチャ化された原子は、好都合にも、第2のディクショナリの各パッチからテクスチャ化された原子を抽出することにより得られる。例えば、テクスチャ化された原子はパッチの中央に配置される。第2のディクショナリのパッチのサイズは、パッチによって異なってもよい。しかし、テクスチャ化された原子がパッチの中央に配置されるという事実は、何ら必須の特性を備えていない。同様に、本発明は、テクスチャ化された原子がパッチから生成される方法によっても、パッチが自然画像から決定される方法によっても限定されない。図3を参照して既述したMP法のように、本発明にかかる原子分解の方法は、反復法である。
【0049】
ステップ32では、第1の原子ajkは、例えば、MP法のステップ22による原子の第1のディクショナリにおいて選択される。原子ajkがテクスチャ化された原子であり、第2のディクショナリのパッチがこれと関連付けられると、当該方法はステップ34に続く。原子ajkが、いずれのパッチも対応していない分析上の原子またはテクスチャ化された原子である場合は、当該方法はステップ38に続く。ajkは、現残差ベクトルRK−1と最も強い相関関係がある原子であり、例えば、スカラー乗積|<Rk−1,ajk>|が最も高い原子である。このスカラー乗積は、c_maxとして表記される。
【0050】
ステップ34では、第2の原子pjkが第2のディクショナリから決定される。このステップは図6で詳細に図示される。
【0051】
ステップ340では、ajkを決定するのに利用される残差ベクトルRK−1が、位相相関により、ajkに対応する第2のディクショナリのパッチPjkと相関性を有する。ここで位相相関は、残差RK−1と、パッチPjkのコンテンツの間の変位(dx,dy)をもたらす。この変位により、第1のディクショナリの原子と同じサイズの新たな原子の位置が決定される。
【0052】
ステップ342では、位相相関という点で残差ベクトルRK−1と最も高い相関性を有するパッチの一部が、当該パッチから抽出される。この抽出された部分は、再位相化原子と呼ばれ、Pikと表記される。
【0053】
変形によると、位相相関は、残差RK−1とパッチPjkのコンテンツの間のN個の変位(dx,dy)をもたらす。これらのN個の変位は、位相相関という意味で残差ベクトルRK−1と最も高い相関性を示すパッチのN個の部分の位置を示している。そしてこれらのN個の部分はパッチから抽出され、抽出された各部分は再位相化原子を形成する。
【0054】
パッチが円対称性である場合は、位相相関についての残差は、パッチセット上で輪状に変位してもよい。
【0055】
ステップ36では、RK−1と最も高い相関性を有する原子は、ajkおよびpjkから選択され、ステップ342で複数の再位相化原子が抽出される場合は、ajkおよびN個の再位相化原子から選択され場合もある。例えば、関係式c_max、すなわち、|<Rk−1,ajk>|と、第2の原子と関連付けられた、c_phaseとして表記される関係式、すなわち|<Rk−1,pjk>|が比較される。c_phase>c_maxのとき、第1の原子ajkが選択されない場合は、第2の原子pikが選択される。N個の再位相化原子の場合、選択された原子は、問題となる原子とRk−1のスカラー乗積という意味での最も相関性の高い原子Rk−1である。
【0056】
ステップ38では、ベクトルXと残差ベクトルRは、選択された原子により更新される。ベクトルXの係数Xikは、pikが選択される場合は、以下の式
ik=|<Rk−1,pik>|
により算定され、ajkが選択される場合は、ベクトルXの係数xjkは、以下の式Xjk=|<Rk−1,ajk>|
により算定される。残差Rは、R=Rk−1−xikik
のように更新され、あるいは選択された原子により、R=Rk−1−xjkjk
のように更新される。
【0057】
ステップ40では、停止基準が充たされているか否かを見極めるための検証がある。
N(Y−A’ X)≦ρのときは、当該方法は終了し、そうでないときは、ステップ42でkが1つずつ増分され、ステップ32で当該方法は再開する。A’ は、第1のディクショナリの原子を備え、第2のディクショナリから選択された原子を備える場合もある。最終ベクトルA’ Xソース信号Yの近似式であり、ここでKは最終反復の指数である。
【0058】
図5および6を参照して記載されている絞り込まれた原子分解の方法は、現ブロックを符号化するのに使用される。本発明にかかる符号化方法は、図7を参照しつつ記載されている。
【0059】
ステップ52では、図5を参照しつつ記載されるように、原子分解は、観察領域、すなわち隣接ブロック(図4の領域C)の画素の値をデータとして備えたサイズ4n×1のベクトルYpに適用される。変形によると、原子分解は、観察領域、すなわち隣接ブロック(図3の領域C)の画素、および予測される現ブロック(図4の領域P)のデータを置き換えた最初の予測ブロックBp0の画素の画像データをデータとして備えるサイズ5n×1のベクトルYcpに適用される。事前に再構成されていない現ブロックの他の隣接ブロック(図3の領域NC)のデータはNULLである。最初の予測ブロックは、例えば、標準的なブロックマッチング法にかかる標準的な時間的予測により決定される。本発明は、観察領域の画定によっては何ら限定されない。以下、ベクトルYpの原子分解の場合を、同一の分解がベクトルYcpに適用できることを理解した上で検討する。これは、MP法に有用な予測支援であるこの観察ベクトルYpである。
【0060】
次元4n×1のデータである(Yのデータではない)Ypのデータを表すことができるように、行列Aは、領域C以外にあるすべての画素に対応する走査線を除去することにより改変される。実際、これらすべての画素は知られておらず、ゼロの値を有する。このようにして行列が得られ、Acと表記され、サイズ4n×9nの高さをもつという意味で圧縮されている。そして図5を参照しつつ記載されたステップ32〜40は反復して適用され、観察データとしてベクトルYpとともにXoptを決定する。当該方法は、停止基準N(Y−A’)≦ρが証明されると即、終了し、Xopt=Xであり、Kは最終反復の指数であり、A’は第1のディクショナリの原子を備え、高さという意味で圧縮された第2のディクショナリから選択された原子を備える場合もある。最終ベクトル
は、領域Lに対応するベクトルYの近似式である。
【0061】
ステップ54では、領域Pに対応するサイズnのベクトル
は、図8に図示されるように
から抽出される。抽出されたデータ
は、ブロック形式で再構成される(ベクトル演算に対する逆算)。再構成されたデータは、現ブロックの新たな予測ブロックBpを表している。
【0062】
ステップ56では、残差ブロックBrは、現ブロックBcから予測ブロックBpを抽出することにより決定される。
【0063】
ステップ58では、残差ブロックが符号化される。この符号化のステップは一般に、ストリームFにおける残差ブロックの係数のブロックへの変換、この係数の量子化、その係数のエントロピー符号化を含んでいる。
【0064】
変形によると、この符号化ステップは、ストリームFにおける残差の量子化およびそのエントロピー符号化を含んでいる。
【0065】
変形によると、反復の過程で決定される一連のシーケンスXは、メモリに記憶される。この変形によると、XoptはXに等しくなく、Kは最終反復の指数であるが、Xopt=Xkoptであると共に、
【数6】
であり、このときA’pは、予測される領域Pと関連付けられた行列部分A’であり、Yは、予測される領域Pと関連付けられたサイズn×1のベクトルであり、すなわち領域Pの画素の画像データを備えている。
【0066】
ApおよびYpは図8に図示されている。この変形により、領域Cの最適な表現には必ずしも相当しない領域Pの最適な表現としてXoptを決定することができる。データAXkoptは、ブロック形式で再構成される(ベクトル演算に対する逆算)。再構成されたデータは、現ブロックの新たな予測ブロックBpを表している。この変形によると、係数koptもストリームFで符号化される。実際上、ベクトルYpのデータは復号器にとって未知である。
【0067】
図9は、本発明にかかる現ブロックを再構成する方法を模式的に示している。
【0068】
ステップ60では、残差ブロックBrは現ブロックについて復号化される。例えば、ストリームFの一部は係数に復号化される。当該係数は逆量子化され、必要であれば、ステップ58における符号化方法で使用されるものに逆変換により変換される。残差ブロックはこのように得られる。変形によると、ステップ58で符号器側にいかなる変換ステップも適用されない場合は、逆変換ステップは特に省略される。
【0069】
ステップ62では、原子分解が適用される。このステップは、符号化方法のステップ52と同一である。このステップにより、ベクトルYの近似式が、
であると決定できる。
【0070】
ステップ64では、領域Pに対応するサイズnのベクトル
は、図8に図示された
から抽出される。抽出されたデータ
は、ブロック形式で再構成される(ベクトル演算に対する逆算)。再構成されたデータは、現ブロックの新たな予測ブロックBpを表している。
【0071】
ステップ66では、現ブロックBcは、ステップ64で決定された予測ブロックBpとステップ60で復号化された残差ブロックを結合すること、たとえば画素に対する画素の加算により再構成される。
【0072】
図10は、符号化装置12を図式的に示している。符号化装置12は、(1つまたは複数の)画像を入力時に受け取る。符号化装置12は、図7を参照しつつ記載された本発明にかかる符号化方法を実行できる。各画像は、各々が画像データの少なくとも一つの項目に関連付けられた画素のブロックに分割される。符号化装置12は特に、時間的予測による符号化を実行する。時間的予測による符号化に関する符号化装置12のモジュール、あるいはINTER符号化のみが図10に図示されている。ビデオコーダ(符号化器)の当業者が知る他のモジュールは、図示されていない(例えば、符号化モードの選択、空間的予測)。符号化装置12は特に、残差ブロックBrを生成するために、例えば、画素による画素の減算等、現ブロックBcから予測ブロックBpを抽出することができる算定モジュール1200を備えている。計算モジュール1200は、本発明にかかる符号化方法のステップ56を実行することができる。これは更に、残差ブロックBrを量子化データに変換して量子化することができるモジュール1202を備えている。変換Tは例えば、離散コサイン変換(DCT:Discrete Cosine Transform)である。符号化装置12は更に、量子化データをストリームFに符号化することができるエントロピー符号化モジュール1204を備えている。これは更に、モジュール1202の逆算を行うモジュール1206を備えている。モジュール1206は、逆量子化Q−1およびそれに続く逆変換T−1を行う。モジュール1206は、メモリ1210に記憶される再構成されたブロックを生成するために、例えば、画素に対する画素の加算等、モジュール1206から得られたデータのブロックと予測ブロックBpの結合を行うことができる計算モジュール1208に接続されている。
【0073】
予測モジュール1216は、予測ブロックを決定する。予測モジュール1216は、本発明にかかる符号化方法のステップ52および54を実行することができる。
【0074】
符号化方法のステップ58は、モジュール1202および1204で実行される。
【0075】
図11は、復号化装置13を図式的に示している。復号化装置13は、画像を表すストリームFを入力時に受け取る。ストリームFは例えば、通信路を介して符号化装置12により送信される。復号化装置13は、図9を参照しつつ記載された本発明にかかる復号化方法を実行することができる。復号化装置13は、復号化されたデータを生成することができるエントロピー復号化モジュール1300を備えている。そして復号化されたデータは、逆量子化およびそれに続く逆変換を行うことができるモジュール1302に送信される。モジュール1302は、ストリームFを生成した符号化装置12のモジュールと同一である。モジュール1302は、メモリ1306に記憶される再構成された現ブロックBcを生成するために、例えば、画素に対する画素の加算等、モジュール1302から得られたブロックと予測ブロックBPの結合を行うことができる計算モジュール1304に接続されている。計算モジュール1304は、再構成方法のステップ66を実行することができる。復号化装置13は、予測モジュール1308を備えている。予測モジュール1308は、メモリ1306に記憶された事前に再構成されたデータから予測ブロックBpを決定する。予測モジュール1308は、本発明にかかる再構成方法のステップ62および64を実行することができる。再構成方法のステップ60は、モジュール1300および1302で実行される。
【0076】
本発明が上記した実施形態例に限定されないことは当然である。
【0077】
特に当業者は、いずれの変形も記載された実施形態に適用してこれらを組み合わせ、その種々の効果から利益を享受することができる。実際にMP法以外の方法は、ベクトルXoptを決定するのに利用することができる。同様に、因果的領域の形態は、図12に図示するように変化し得る。この図では、検討した因果的領域には斜線が付されている。本発明は、例示的実施例として示されたに過ぎない因果的領域のこれらの形態には何ら限定されない。この図ではブロックはいかなるサイズでもよい。因果的領域は、本発明にかかる方法が画像のブロックの走査順序とは無関係である、という意味で予測ブロックに対していかなる位置にあってもよい。
【0078】
パッチの形態およびサイズは変化し得る。同様に第2のディクショナリは、第1のディクショナリにあるテクスチャ化された原子より少ない数のパッチを含んでいてもよい。
(付記1)
画像のシーケンスの現ブロックを符号化する方法であって、前記方法は、
現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解するステップ(52)であって、前記第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備える、前記ステップと、
前記現ブロックに対応する前記分解されたベクトルデータから抽出するステップ(54)であって、前記抽出されたデータは予測ブロックを構成する、前記ステップと、
前記現ブロックから前記予測ブロックを抽出することにより、残差ブロックを決定するステップ(56)と、
前記残差ブロックを符号化するステップ(58)と、を含み、
前記符号化方法は、各反復において原子に分解する前記ステップが、
原子の前記第1のディクショナリにおける第1の原子を選択するステップ(32)と、
前記第1の原子がテクスチャ化された原子である場合、前記第1の原子に関連付けられたパッチと現残差ベクトルの間の位相相関を適用するステップ(34、340)と、
前記パッチから、前記残差ベクトルと最も強い相関関係がある部分を少なくとも抽出するステップ(34、342)であって、前記抽出された部分は第2の原子を構成する、前記ステップと、
前記第1の原子および前記第2の原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択するステップ(36)と
前記選択された原子により、前記残差ベクトルを更新するステップ(38)と、を含む、前記方法。
(付記2)
前記第2のディクショナリのパッチは円対称性である、付記1に記載の符号化方法。
(付記3)
前記第2のディクショナリのパッチは、それらのコンテンツに依拠する形態を有している、付記1または2に記載の符号化方法。
(付記4)
前記第2のディクショナリは、異なるサイズの少なくとも2つのパッチを備えている、付記1〜3のいずれかに記載の符号化方法。
(付記5)
前記抽出のステップ(34、342)は、前記残差ベクトルに最も強い相関関係があるN個の部分の抽出を含み、抽出された各部分は再位相化原子を構成し、
前記選択のステップは、前記第1の原子および前記再位相化原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択することを含む、付記1〜4のいずれかに記載の符号化方法。
(付記6)
ストリーム形式により生じる画像のシーケンスの現ブロックを再構成する方法であって、
前記ストリームから前記現ブロックについて残差ブロックを復号するステップ(60)と、
前記現ブロックに因果的に隣接して配置された画素に関連付けられた少なくとも再構成された画像データを備えたデータのベクトルを、第1のディクショナリの原子に反復して分解するステップ(62)であって、前記第1のディクショナリは、分析上の原子およびテクスチャ化された原子を備える、前記ステップと、
前記現ブロックに対応する前記分解されたベクトルデータから抽出するステップ(64)であって、当該抽出されたデータは予測ブロックを構成する、前記ステップと、
前記復号された残差ブロックと前記予測ブロックを結合することにより、前記現ブロックを再構成するステップ(66)と、を含み、
前記再構成方法は、各反復において原子に分解する前記ステップが、
原子の前記第1のディクショナリにおける第1の原子を選択するステップ(32)と、
前記第1の原子がテクスチャ化された原子である場合、前記第1の原子に関連付けられたパッチと現残差ベクトルの間の位相相関を適用するステップ(34、340)と、
前記パッチから、前記残差ベクトルと最も強い相関関係がある部分を少なくとも抽出するステップ(34、342)であって、当該抽出された部分は第2の原子を構成する前記ステップと、
前記第1の原子および前記第2の原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択するステップ(36)と、
前記選択された原子により、前記残差ベクトルを更新するステップ(38)と、を含む、前記方法。
(付記7)
前記第2のディクショナリのパッチは円対称性である、付記6に記載の再構成方法。
(付記8)
前記第2のディクショナリのパッチは、それらのコンテンツに依拠する形態を有する、付記6または7に記載の再構成方法。
(付記9)
前記第2のディクショナリは、異なるサイズの少なくとも2つのパッチを備える、付記6〜8のいずれかに記載の再構成方法。
(付記10)
前記抽出のステップ(34、342)は、前記残差ベクトルに最も強い相関関係があるN個の部分の抽出を含み、抽出された各部分は再位相化原子を構成し、前記選択のステップは、前記第1の原子および前記再位相化原子から、前記現残差ベクトルと最も強い相関関係がある原子を選択することを含む、付記6〜8のいずれかに記載の再構成方法。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12