(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5894184
(24)【登録日】2016年3月4日
(45)【発行日】2016年3月23日
(54)【発明の名称】画像の自己相似テクスチャ領域の再構成方法及び装置
(51)【国際特許分類】
G06T 15/04 20110101AFI20160310BHJP
【FI】
G06T15/04
【請求項の数】5
【全頁数】9
(21)【出願番号】特願2013-541278(P2013-541278)
(86)(22)【出願日】2011年11月10日
(65)【公表番号】特表2014-503885(P2014-503885A)
(43)【公表日】2014年2月13日
(86)【国際出願番号】EP2011069855
(87)【国際公開番号】WO2012072402
(87)【国際公開日】20120607
【審査請求日】2014年11月6日
(31)【優先権主張番号】10306308.7
(32)【優先日】2010年11月29日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】501263810
【氏名又は名称】トムソン ライセンシング
【氏名又は名称原語表記】Thomson Licensing
(74)【代理人】
【識別番号】110001243
【氏名又は名称】特許業務法人 谷・阿部特許事務所
(72)【発明者】
【氏名】ファビエン ラケープ
(72)【発明者】
【氏名】ジェローム ビエロン
(72)【発明者】
【氏名】サイモン ルフォー
(72)【発明者】
【氏名】オリビエ ドフォルジュ
(72)【発明者】
【氏名】マリエ バベル
【審査官】
千葉 久博
(56)【参考文献】
【文献】
特開2004−348741(JP,A)
【文献】
特開平11−112979(JP,A)
【文献】
特開平7−184158(JP,A)
【文献】
特表2004−507177(JP,A)
【文献】
国際公開第2009/091080(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 15/00−15/87
G06T 1/00−1/40,3/00−5/50,
9/00−9/40
G06T 19/00−19/20
(57)【特許請求の範囲】
【請求項1】
画像の自己相似テクスチャ領域を再構成する方法であって、
前記自己相似テクスチャ領域のサンプル部分からサンプル画素を複製することによって前記自己相似テクスチャ領域の一部の画素を決定するステップを含み、
前記サンプル画素は非符号化画素の近傍とサンプル画素の近傍との最大類似度に基づく近傍のマッチングを用いて選択され、
マッチングのために使用される近傍のサイズは、前記サンプル部分の異なるサイズのブロックのDCT変換の係数からディスクリプタを計算し、該ディスクリプタの変化を分析することによって選択される、前記方法。
【請求項2】
前記サンプル部分が符号化されたビットストリームを受信するステップと、
前記サンプル部分を復号化するステップと、を更に含む、請求項1記載の方法。
【請求項3】
マッチングのために使用される前記近傍のサイズは、
前記異なるサイズのブロックの各々についてDCT変換を適用することによって前記係数を決定し、
前記異なるサイズのブロック毎に、ディスクリプタの関連付けられたシーケンスを決定し、
各ディスクリプタはパラレルパスに沿って合計された係数の合計を用いて決定され、
単調減少でない前記シーケンスのうちの最小ブロックサイズと関連付けられた前記シーケンスであるディスクリプタの前記シーケンスを選択し、
選択したシーケンスと関連付けられた前記異なるサイズのブロックのサイズを用いて前記近傍のサイズを決定することによって適応的に選択される請求項1又は2記載の方法。
【請求項4】
画像の自己相似テクスチャ領域を再構成する装置であって、
前記自己相似テクスチャ領域のサンプル部分からサンプル画素を複製することによって前記自己相似テクスチャ領域の一部の画素を決定するように構成された処理装置を備え、
前記サンプル画素は非符号化画素の近傍とサンプル画素の近傍との最大類似度に基づく近傍のマッチングを用いて選択され、
前記処理装置は、前記サンプル部分の異なるサイズのブロックのDCT変換の係数からディスクリプタを計算し、該ディスクリプタの変化を分析することによって、マッチングするために使用される近傍のサイズを選択するように構成されている、前記装置。
【請求項5】
前記サンプル部分が符号化されたビットストリームを受信する受信機と、
前記サンプル部分を復号化するデコーダと、を更に備える、請求項4記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、自己相似テクスチャ画像領域の再構成の分野に関する。
【背景技術】
【0002】
画像内の自己相似テクスチャ領域は、符号化で高いビットレートを生じさせ、特に、高精細の符号化だけでなく、同時に観察者によって限られた関心を高める。観察者の関心は、領域が構造又は輝度の不連続性を示す場合にそのような領域だけに集められる。
【0003】
原則として、テクスチャの自己相似性は、テクスチャ領域のサンプル部分だけの符号化によってビットレートを低減すること、また、サンプル部分の画素をコピーすることによってテクスチャ領域の非符号化部分の画素の再構成を可能にする。また、再構成は合成として知られている。
【0004】
例えば、テクスチャ領域の一部が画素単位選択処理に基づいて再構成される画素ベースの再構成スキームを提案した、リーイー・ウェイ(Li-Yi Wei)とマルク・レボイ(Marc Levoy)の「ツリー構造のベクトル量子化を用いた高速テクスチャ合成(Fast texture synthesis using tree-structured vector quantization)」2000年、コンピュータグラフィックスとインタラクティブテクニック(SIGGRAPH '00)についての第27回年次会議の議事記録479−488頁、ACMプレス/アディソン− ウエズリー(Press/Addison-Wesley)出版社、ニューヨーク、NY、アメリカがある。
【0005】
特定の非符号化の画素の再構成に使用
するためのサンプル画素の選択は、サンプル画素候補のうちのサンプル画素の
近傍と特定の非符号化画素の
近傍の最大類似度に基づくことができる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
サンプル画素の選択は選択のために使用される
近傍のサイズに依存している。異なる
近傍のサイズは同一の非符号化画素の再構成で異なるサンプル画素になることがある。原則としてテクスチャの特徴サイズより大きい
近傍はテクスチャを再生するために適しているが、良好な画質でテクスチャを実際に再生するための大きなサンプル部分を必要とする。テクスチャの特徴サイズより小さい
近傍は質が悪い再生の結果となる。従って、テクスチャの特徴サイズに近い
近傍サイズを適応的に選択する画像の自己相似テクスチャ領域の再構成のための方法及び装置を提供することが望まれている。
【0007】
よって、本発明者は請求項1の方法及び請求項3の装置を提案する。
【課題を解決するための手段】
【0008】
本発明の方法は、自己相似テクスチャ領域のサンプル部分からサンプル画素をコピー(複製)することによって自己相似テクスチャ領域の一部の画素を決定するステップを含み、マッチングのために使用される
近傍のサイズはサンプル部分の異なるサイズのブロックのDCT変換係数から計算されたディスクリプタ(記述子)の分析に基づいて選択される。
【0009】
実施形態では、方法は、自己相似テクスチャ領域のサンプル部分が符号化されるビットストリームを受信するステップと、サンプル部分を復号化するステップとを更に含む。
【0010】
本発明の方法の更なる実施形態では、マッチングのために使用される
近傍のサイズは、異なるサイズのブロックの各々についてDCT変換を適用することによって係数を決定し、異なるサイズのブロック毎に、ディスクリプタの関連付けられたシーケンス(配列)を決定し、単調減少でないシーケンスのうちの最も小さいブロックと関連付けられたシーケンスであるディスクリプタのシーケンスを選択し、決定したシーケンスと関連付けられた異なるサイズのブロックのサイズを用いて上記の
近傍のサイズを決定することによって適応的に選択される。各ディスクリプタはパラレルパス(平行経路)に沿って合計された係数の合計を用いて決定される。
【0011】
本発明の装置は処理装置を備える。処理装置は、自己相似テクスチャ領域のサンプル部分からサンプル画素をコピーすることによって自己相似テクスチャ領域の更なる部分の画素を決定するように構成され、サンプル画素は
近傍のマッチングを用いて選択され、処理装置はサンプル部分の異なるサイズのブロックのDCT変換係数から計算されたディスクリプタのシーケンスの分析を用いてマッチングするために使用される
近傍のサイズを選択するように構成されている。
【0012】
実施形態では、前記装置は、受信機及びデコーダを更に備える。受信機は自己相似テクスチャ領域のサンプル部分が符号化されているビットストリームを受信するように構成され、デコーダはサンプル部分を復号化するように構成されている。
【0013】
また、本発明の概念は、適切なサンプル部分のサイズを決定する及び/又は非符号化部分のサイズ又はその両方を決定する符号化装置に適用され得る。
【0014】
エンコーダ側に適用された場合には、更に、選択された
近傍のサイズをデコーダに送信することができる。
【図面の簡単な説明】
【0015】
本発明の例示的な実施形態は図面に示され、以下の説明においてより詳細に説明される。例示的な実施形態は、本発明を明らかにするためにだけ説明されるが、特許請求の範囲に記載の発明の開示、範囲又は精神に限定されない。
【
図1】
図1は、例示的なパラレルパスのオーバレイを有する8×8ブロックの例示的なDCT変換を示している。
【
図2】
図2は、ウェイとレボイによって提案されたような基本的な従来技術の画素ベースの再構成スキームを示している。
【
図3】
図3は、異なるサイズのブロックの例示的なディスクリプタ曲線を示している。
【
図4】
図4は、異なるサイズのブロックの例示的なディスクリプタ曲線を更に示している。
【
図5】
図5は、例示的なテクスチャ再構成ベースの符号化−復号化ネットワークを示している。
【
図6】
図6は、例示的なパラレルパスを更に示している。
【発明を実施するための形態】
【0016】
定常領域として定義されているテクスチャは、パターンが複数の異なる場所に複製されている(レンガの壁)、規則的又はほぼ規則的なテクスチャから確率的にノイズの多いテクスチャ(砂、草...)へ変えることができる。
【0017】
本発明は、新しい特徴を提案し、それは自動適応アルゴリズムと画像/ビデオ圧縮スキームのためにコンピュータグラフィックスの分野に適用することができる。本発明は、8×8ブロックのために
図1に示されている2次元離散コサイン変換(DCT)係数から計算されたディスクリプタの学習に基づいている。自己相似テクスチャ画像領域のブロックのDCT係数を計算した後、ディスクリプタベクトルの成分は、DC係数を中心としたパラレルパスと交差されたAC係数から計算され、例えば、
図1に例示的に示されたようにDC係数を中心にした円形である。ディスクリプタベクトル成分は、これらのパラレルパスを交差している係数の合計に対応している。その合計は等価パラレルパスに亘って計算することができる。更に、その合計は、合計された係数に対して重み付けファクタを含むことができ、重み付けファクタは、それぞれの係数を横切るパス部分の長さに依存している。そして、ディスクリプタベクトルの変化を学習することによってより良く選択するために少なくとも2つのサイズをテストする必要がある。
【0018】
DCT係数は次式によって計算される。
【0020】
この式で、I(x,y)は、位置(x,y)における輝度値に対応し、Nはサポートブロックのサイズであり、α
kは次の如くである。
【0022】
図1は、DC値が平均輝度不変のために保持されていないので、ディスクリプタベクトルの第1の2つの成分を表す第1の円C1,C2を示している。ディスクリプタは、次のように計算することができる。
【0024】
ここで、Cは、変換ドメイン内の位置(λcosθ,λsinθ)でのDCT係数に対応する。
【0025】
ディスクリプタベクトルの成分は、変換されたブロックのテクスチャの特徴を示している。第1の情報は、テクスチャ領域内のパターンの特徴サイズにある。合成アルゴリズム、特に、画素ベースの技術は、画素グループ間の比較に基づいている。
図2は、ウェイとレボイによって提案されたような基本的な従来技術の画素ベースの再構成スキームを示している。合成する現在の画素の因果
的近傍は、パッチ内の全ての位置で同じ形状の窓と比較され、L2ノルムの比較を最小化するいずれか1つが選択され、パッチから候補サンプル画素が現在の位置にコピーされる。
【0026】
発明者は、蛇皮(スネークスキン)の特徴サイズより大きいサイズが良好な結果を視覚的に生成することができ、小さいサイズではそうではないことを
近傍の異なるサイズで計算されたテクスチャ結果から気付いた。更に、パッチのサイズに応じて画素の候補セットを減少させるので、このサイズも大きくなり過ぎないようにしなければならない。
【0027】
ディスクリプタベクトルの第1の成分は、
図1に示されたように、円C1が交差した係数から計算される。それにより、C1はあらゆる方向におけるブロック上の輝度の1つの変動を表している。C2はブロック上の1つの周期的変動を表し、他の係数はより高い周波数から計算され、より詳細なパターンとなる。第1の成分がディスクリプタベクトルの最大値である場合には、メインパターンはブロック上に主たる均一変動を有している。よって、その特徴サイズは、DCTディスクリプタを計算するためのブロックサイズよりも大きい。
【0028】
よって、第1の成分が最大値を有する場合には、ディスクリプタベクトルは単調で減少し、ブロックサイズはテクスチャ合成アルゴリズムにおいて
近傍として使用されることに十分ではない。逆に、他の成分が優勢(非単調曲線)である場合には、メインパターンは、そのブロックに含まれるように見える。よって、再構成は相応に選択されたサイズを有する
近傍の比較に基づくことができる。
【0029】
図3は、ディスクリプタ曲線学習をより良く理解するために例示的な適切な場合を示している。この例では、12×12画素のサイズ(2つの隣接する図形中心間の距離)のメインパターンから構成されている「マトリックス」からのテクスチャパッチが選択されている。曲線は、左のパッチ
上で異なるサイズの平均ディスクリプタを表している。
【0030】
以前の推論によれば、8×8のサイズは十分ではなく、一方、サイズ16×16では、高い周波数が支配的であり、そのためメインパターンを16×16のブロックに含むことができる。32×32の
近傍を使用することも可能であるが、それは、セグメント化されたテクスチャ領域が十分に大きくない、例えば、ビデオ圧縮ドメインにおいて常に不可能である32×32ブロックの大きなセットをパッチが含むために十分に大きくなければならないことを意味する。
図4は、砂利を有する別の例を示している。実用的な目的のために小さな砂利を8×8の
近傍により合成することができる。
【0031】
テクスチャ合成は、テクスチャ領域の符号化のために効率的な圧縮技術として用いることができる。実際には、詳細なテクスチャ領域では古典的な変換ベースの圧縮スキームを使用して対処することが困難である。
図4は、例示的な合成ベースのフレームワークを示している。テクスチャアナライザによりエンコーダ側でテクスチャをセグメント化した後、大きなテクスチャ領域は送信されたビットストリームから除去され、例えば、除去された領域を取り囲むサンプルテクスチャブロックのセットだけがデコーダ側ではパッチとして使用されるために保持される。デコーダは先ず、エッジブロック及びパッチで画像を構築し、そして、テクスチャシンセサイザは完全な画像を出力するために不足しているテクスチャを埋める。
【0032】
このコンテキストにおいて、DCTディスクリプタは異なる態様に有用であり得る。
【0033】
先ず、エンコーダ側でテクスチャをセグメント化した後、デコーダ側のテクスチャシンセサイザがこの種類のテクスチャを再構成することができるか否かを決定するためにエンコーダ側でディスクリプタを使用することができる。更に、エンコーダは、テクスチャ領域のどれ位を符号化から省略することができるか、また、デコーダではサンプルとしてどれ位が必要であるかを決定することができる。そして、エンコーダは、サイド情報として、このテクスチャ領域についての
近傍サイズを送ることができる。
近傍サイズに関するサイド情報がデコーダによって受信されない場合には、デコーダは、受信されたサンプルからDCTディスクリプタを決定し、再構成プロセスに適した
近傍サイズを決定するためにそれらDCTディスクリプタを使用することができる。
【0034】
ディスクリプタベクトル成分を計算するために様々なパラレルパスを使用することができる。
図6は、左側の4×4のDCTブロックの上にパラレルで等間隔のパスから計算された右側のディスクリプタベクトルの他の例を示している。
【0035】
係数は、例示的なパスを示す破線が交差したDCT係数の合計に対応する。DCが保持されないので、例示的なディスクリプタベクトルは、矢印で示すように、3つの成分を得る。
【0036】
本発明は、合成するテクスチャパターンの種類、形状及び特徴付けたサイズに応じて、テクスチャ合成アルゴリズムをパラメータ化することによりテクスチャ特徴を得ることを可能にする。
本発明は以下の態様を含む。
(付記1)
画像の自己相似テクスチャ領域を再構成する方法であって、
前記自己相似テクスチャ領域のサンプル部分からサンプル画素を複製することによって前記自己相似テクスチャ領域の一部の画素を決定するステップを含み、
前記サンプル画素は近傍のマッチングを用いて選択され、
マッチングのために使用される近傍のサイズは前記サンプル部分の異なるサイズのブロックのDCT変換の係数から計算されたディスクリプタの分析に基づいて選択される、方法。
(付記2)
前記サンプル部分が符号化されるビットストリームを受信するステップと、
前記サンプル部分を復号化するステップと、を更に含む、付記1記載の方法。
(付記3)
前記マッチングのために使用される近傍のサイズは、
前記異なるサイズのブロックの各々についてDCT変換を適用することによって前記係数を決定し、
前記異なるサイズのブロック毎に、ディスクリプタの関連付けられたシーケンスを決定し、
単調減少でないシーケンスのうちの最小ブロックサイズと関連付けられたシーケンスであるディスクリプタのシーケンスを選択し、
選択したシーケンスと関連付けられた前記異なるサイズのブロックのサイズを用いて前記近傍のサイズを決定することに
よって適応的に選択され、
各ディスクリプタはパラレルパスに沿って合計された係数の合計を用いて決定される、付記1又は2記載の方法。
(付記4)
画像の自己相似テクスチャ領域を再構成する装置であって、
前記自己相似テクスチャ領域のサンプル部分からサンプル画素を複製することによって前記自己相似テクスチャ領域の部分の画素を決定するように構成された処理装置を備え、
前記サンプル画素は近傍のマッチングを用いて選択され、
前記処理装置は、前記サンプル部分の異なるサイズのブロックのDCT変換の係数から計算されたディスクリプタのシーケンスの分析を用いてマッチングするために使用される近傍のサイズを選択するように構成されている、装置。
(付記5)
前記サンプル部分が符号化されているビットストリームを受信する受信機と、
前記サンプル部分を復号化するデコーダと、を更に備える、付記4記載の装置。