IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル ヴイシー ホールディングス, インコーポレイテッドの特許一覧

特許7489776適応変換ベースのビデオ圧縮のための最後の係数符号化
<>
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図1
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図2
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図3
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図4
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図5
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図6
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図7
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図8
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図9
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図10
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図11
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図12
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図13
  • 特許-適応変換ベースのビデオ圧縮のための最後の係数符号化 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-16
(45)【発行日】2024-05-24
(54)【発明の名称】適応変換ベースのビデオ圧縮のための最後の係数符号化
(51)【国際特許分類】
   H04N 19/13 20140101AFI20240517BHJP
   H04N 19/136 20140101ALI20240517BHJP
   H04N 19/176 20140101ALI20240517BHJP
【FI】
H04N19/13
H04N19/136
H04N19/176
【請求項の数】 11
(21)【出願番号】P 2019500806
(86)(22)【出願日】2017-07-12
(65)【公表番号】
(43)【公表日】2019-07-18
(86)【国際出願番号】 EP2017067616
(87)【国際公開番号】W WO2018011303
(87)【国際公開日】2018-01-18
【審査請求日】2020-07-09
【審判番号】
【審判請求日】2023-03-07
(31)【優先権主張番号】16305919.9
(32)【優先日】2016-07-15
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ラセール,セバスチャン
(72)【発明者】
【氏名】プリ,サウラブ
(72)【発明者】
【氏名】ル カレ,パトリック
【合議体】
【審判長】畑中 高行
【審判官】川崎 優
【審判官】高橋 宣博
(56)【参考文献】
【文献】米国特許出願公開第2015/264403(US,A1)
【文献】特表2018-533309(JP,A)
【文献】特表2019-525576(JP,A)
【文献】ITU-T TELECOMMUNICATION STANDARDIZATION SECTOR OF ITU SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services-Coding of moving video High efficiency video coding,Recommendation ITU-T H.265,(04/2015),2015年4月,pp.105-106, 200-201
【文献】Osman G. Sezer, et al.,“SPARSE ORTHONORMAL TRANSFORMS FOR IMAGE COMPRESSION”、2008 15th IEEE International Conference on Image Processing、2008年10月15日、pp.149-152
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
変換係数のブロックを符号化する方法であって、
画像値のブロックを第2の数の変換係数のブロックに変換する部分変換を使用して、第1の数の画像値のブロックを変換することであって、前記第2の数は、前記第1の数より少なく、かつ、前記部分変換のサイズに対応し、前記部分変換のサイズ及び前記変換係数のブロックに適用される走査順序は、前記変換係数のブロックの変換係数の位置を示す、ことと、
前記変換係数の前記走査順序によって決定される最後の非ゼロ変換係数の変換係数のブロックにおける位置を定義する2つの座標をエントロピー符号化することと、を含み、
前記2つの座標のうちの第1の座標のエントロピー符号化に用いられる前記2つの座標のうちの第1の座標の二値化に割り当てられるビットの最大数は、前記部分変換のサイズに依存する、方法。
【請求項2】
前記部分変換の前記サイズを示す情報が、ビットストリームでエンコードされる、請求項1に記載の方法。
【請求項3】
オフラインで学習された適応部分変換のセットが、前記画像値のブロックを変換するために使用される、請求項1又は2に記載の方法。
【請求項4】
変換係数のセットを符号化する装置であって、
画像値のブロックを第2の数の変換係数のブロックに変換する部分変換を使用して、第1の数の画像値のブロックに関して動作する変換回路であって、前記第2の数は、前記第1の数より少なく、かつ、前記部分変換のサイズに対応し、前記部分変換のサイズ及び前記変換係数のブロックに適用される走査順序は、前記変換係数のブロックの変換係数の位置を示す、変換回路と、
前記変換係数の前記走査順序によって決定される最後の非ゼロ変換係数の変換係数のブロックにおける位置を定義する2つの座標をエントロピー符号化するエントロピー符号器であって、前記2つの座標のうちの第1の座標のエントロピー符号化に用いられる前記2つの座標のうちの第1の座標の二値化に割り当てられるビットの最大数は、前記部分変換のサイズに依存する、エントロピー符号器と、
を含む装置。
【請求項5】
前記部分変換の前記サイズを示す情報が、ビットストリームでエンコードされる、請求項4に記載の装置。
【請求項6】
変換係数のセットを復号する方法であって、
最後の非ゼロ係数の位置の2つの座標をエントロピー復号することであって、変換係数のセットは、第1の数の画像値の初期ブロックを第2の数の変換係数に変換する部分変換の結果であり、前記第2の数は、前記第1の数より少なく、かつ、前記部分変換のサイズに対応し、前記部分変換のサイズ及び前記変換係数のブロックに適用される走査順序は、前記変換係数のブロックの変換係数の位置を示し、前記2つの座標のうちの第1の座標のエントロピー符号化に用いられる前記2つの座標のうちの第1の座標の二値化に割り当てられるビットの最大数は、前記部分変換のサイズに依存することを特徴とする、ことと、
前記第1の数の画像値の初期ブロックを示す、結果として生じる画像値のブロックを得るために、逆部分変換を使用して前記変換係数のセットを逆変換することと、
を含む、方法。
【請求項7】
前記部分変換の前記サイズを示す情報が、ビットストリームから復号される、請求項6に記載の方法。
【請求項8】
変換係数のセットを復号する装置であって、
前記変換係数からの最後の非ゼロ係数の位置の2つの座標をエントロピー復号するエントロピー復号器であって、変換係数のセットは、第1の数の画像値の初期ブロックを第2の数の変換係数に変換する部分変換の結果であり、前記第2の数は、前記第1の数より少なく、かつ、前記部分変換のサイズに対応し、前記部分変換のサイズ及び前記変換係数のブロックに適用される走査順序は、前記変換係数のブロックの変換係数の位置を示し、前記2つの座標のうちの第1の座標のエントロピー符号化に用いられる前記2つの座標のうちの第1の座標の二値化に割り当てられるビットの最大数は、前記部分変換のサイズに依存することを特徴とする、エントロピー復号器と、
前記第1の数の画像値の初期ブロックを示す、結果として生じる画像値のブロックを得るために、逆部分変換を使用して変換係数に関して動作する逆変換回路と、
を含む、装置。
【請求項9】
前記部分変換の前記サイズを示す情報が、ビットストリームから復号される、請求項8に記載の装置。
【請求項10】
請求項6又は7に記載の方法による変換係数のセットを復号するための命令を保存した、非一時的コンピュータ可読記憶媒体。
【請求項11】
請求項1乃至3のうち何れか1項に記載の変換係数のブロックを符号化するための命令を保存した、非一時的コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本原理は、一般に、ビデオ圧縮及び復元システムに関し、より詳細には、ブロックベースの変換に関する。
【背景技術】
【0002】
変換Tは、n個のピクセルのブロックをn個の変換係数に変換する。このプロセスは、ピクセル値を元に戻すために、変換係数に逆変換T-1を適用することにより、可逆的である。部分変換Pの場合、n個のピクセルは、n個より少ないm個の変換係数に変換され、ここでは、m<nである。すなわち、不足しているn-m個の係数がゼロに設定されると仮定することができる。近似「逆」変換P’を変換係数に適用することにより、初期ピクセル値の近似が得られる。P’は、近似であり、部分変換が可逆的ではないため、正確な数学的逆数ではない。一般的に、係数の部分変換ブロックは、ピクセルブロックの低周波情報を表す。
【0003】
一部のビデオ符号化標準規格では、変換係数は、一般的に高周波から低周波への走査順序が関連付けられる二次元(2D)ブロックに入れられる。係数の量子化の後に、図1に示すように、高周波から低周波へのスキャン順序に関して、最初の非ゼロ量子化係数が、最後の符号化係数と呼ばれる。
【0004】
係数に関連付けられた2Dブロックトポロジーにおいて、最後の符号化係数は、図2に示すように、サイズn=N×Nのブロックに関して2つの座標(x、y)を有する。
定義上、0≦x、y≦N-1である。これらの2つの座標は、復号器側で非ゼロ符号化係数を決定するための情報として、ビットストリームに符号化される。少なくとも、これらの座標は、座標(x、y)の係数がゼロではないことを示し、この係数の後にくる係数は、低から高への走査順序に関して、全てゼロである。
【0005】
残りの係数(図1においてクエスチョンマークで示す)が、ゼロであるか、それともゼロでないかの変換係数の有意性を示す追加の情報が、信号に追加されてもよい。
【0006】
従来、過去数十年に開発された多くのビデオ及び画像コーデックにおいては、例えば離散コサイン変換又は離散サイン変換などの固定変換を各ブロックのピクセルに適用することにより、変換係数が得られる。次いで、これらの係数は、例えばVLC、算術符号器、又はCABAC(コンテキスト適応二値算術符号化)などのエントロピー符号器によってエンコードされる量子化係数を得るために、限定子(quantifier)Qによって量子化される。
【0007】
可能な限り効率的に、最後の符号化係数位置をエンコードすることが望ましい。
【0008】
固定変換の代替手段として、内容適応部分変換を使用することができる。これは、エネルギーのより良い圧縮をもたらし、従って、ビットレートを減少させる。しかし、適応変換が、復号器に送られる必要があり、引き換えにビットレートが増加する。もしそのような変換を送ることに気を付けなければ、より良い圧縮にもかかわらず、全体的なビットレートが増加し、適応変換は、何のメリットもない。
【0009】
HEVC/H.265標準規格は、2つの座標(x、y)を使用することによって、最後の符号化係数位置の符号化を導入した。各座標が、打ち切り単項コードを使用して二値化され、次いで、各ビット又はHEVC用語では「ビン」が、コンテキストに基づいたチャネル適応を用いたCABACを使用してエンコードされる。HEVCでは、2つの座標x及びyが、別々にエンコードされ、及び復号される。
【発明の概要】
【0010】
先行技術の上記及び他の欠点及びデメリットは、部分変換のサイズの知識を使用した、部分変換の使用により得られる、最後の符号化係数を符号化する方法及び装置に向けられる本原理によって対処される。
【0011】
本原理の一局面によれば、変換係数を得るために画像値のブロックを変換するステップと、最後の符号化係数の位置をエントロピー符号化するセットであって、最後の符号化係数の位置が、y座標のエントロピー符号化が係数を得るために使用された部分変換のサイズの知識に依存するような2つの座標によって提供されるセットと、を含む、変換係数のセットを符号化する方法が提供される。
【0012】
本原理の別の局面によれば、変換係数を得るために、画像値のブロックに関して動作する変換回路と、変換係数の最後の符号化係数の位置が、y座標のエントロピー符号化が、係数を得るために使用された部分変換のサイズの知識に依存するような2つの座標によって提供されるエントロピー符号器と、を含む変換係数のセットを符号化する装置が提供される。
【0013】
本原理の別の局面によれば、変換係数のセットを復号する方法が提供される。この方法は、変換係数をエントロピー復号することによって、最後の符号化係数の位置を生成することであって、最後の符号化係数の位置が、y座標の前記エントロピー復号が、係数を得るために使用された部分変換のサイズの知識に依存することを特徴とする2つの座標(x、y)によって提供されることと、画像値のブロックを得るために、変換係数を逆変換するステップと、を含む。
【0014】
本原理の別の局面によれば、変換係数のセットを復号する装置が提供される。この装置は、変換係数からの最後の符号化係数の位置を表すコードに関して動作するエントロピー復号器であって、最後の符号化係数の位置が、y座標のエントロピー符号化が、係数を得るために使用された部分変換のサイズの知識に依存することを特徴とする2つの座標(x、y)によって提供される、エントロピー復号器を含む。この装置は、画像値のブロックを得るために、変換係数に関して動作する逆変換回路をさらに含む。
【0015】
本原理の別の局面によれば、最後の符号化係数の位置が、y座標のエントロピー符号化が、係数を得るために使用された部分変換のサイズの知識に依存することを特徴とする2つの座標(x、y)によって提供されるような変換係数のセットを復号するための命令を保存した非一時的コンピュータ可読記憶媒体が、提供される。
【0016】
本原理の別の局面によれば、最後の符号化係数の位置が、y座標のエントロピー符号化が、係数を得るために使用された部分変換のサイズの知識に依存することを特徴とする2つの座標(x、y)によって提供されるような変換係数のセットを復号するためのビットストリームを保存した非一時的コンピュータ可読記憶媒体が、提供される。
【0017】
本原理の上記及び他の局面、特徴及び利点が、添付の図面と関連して読まれる例示的実施形態の以下の詳細な説明から明白となるだろう。
【図面の簡単な説明】
【0018】
図1】変換ユニットの走査順序を示す。
図2】最後の符号化係数の座標の一例を示す。
図3】12個の係数を有した4×4の変換ユニットにおける符号化の一例を示す。
図4】座標値のサフィックス及びプレフィックスの決定を示す。
図5】オンザフライ学習スキームを示す。
図6】様々な状況に関するBDレート利得対変換ベクトル数を示す。
図7】部分変換を用いた8×8ブロックの符号化を示す。
図8】コンテキスト値の構造を示す。
図9】コンテキスト値の展開を示す。
図10】隣接チャネルに応じたコンテキスト選択の一例を示す。
図11】本原理を使用した変換係数のセットを符号化する方法の一実施形態を示す。
図12】本原理を使用した変換係数のセットを符号化する装置の一実施形態を示す。
図13】本原理を使用した変換係数のセットを復号する方法の一実施形態を示す。
図14】本原理を使用した変換係数のセットを復号する装置の一実施形態を示す。
【発明を実施するための形態】
【0019】
以下の実施形態によって解決される技術的課題は、2D部分変換が適用されたピクセルの変換ブロックにおいて、最後の符号化係数の位置を符号化するコストを削減している。
【0020】
これらの実施形態は、ビデオ符号化標準規格においてよく使用されるエントロピー符号化スキームの改良である。そのようなビデオ符号化標準規格の1つは、HEVC/H.265標準規格であるが、実施形態は、この標準規格に限定されない。
【0021】
本原理の主要な考えは、部分変換がピクセル値のブロックに使用される場合、一部の変換係数が、必然的にゼロであることが分かっており、従って、最後の符号化係数の位置に対して、及び最後の符号化係数の位置を表す座標(x、y)に対して幾つかの制約が課されるということである。記載の実施形態では、部分変換を使用して、係数を変換するためにピクセルのブロックを変換する場合、上記制約を使用して、2つの座標(x、y)を効率的にエンコードすることに重点を置いている。
【0022】
本考えは、(x、y)の符号化がより効率的であるように、m<nの場合は、全ての座標ペア(x、y)が受け入れ可能なわけではないという事実を用いる。これは、圧縮性能の向上をもたらすことができる。
【0023】
具体的には、部分変換を使用する場合、(x、y)の符号化がより効率的であるように、全ての座標ペア(x、y)が受け入れ可能なわけではないという事実を暗に考慮する。部分変換を用いたこの特定の実施形態においては、部分変換を使用して修正HEVC標準規格に対してテストが行われ、(x、y)の符号化の向上が、約-0.5%の圧縮利得をもたらすことが示された。
【0024】
本明細書に提示される考えは、座標ペア(x、y)を符号化するためのHEVCアルゴリズムの主要部分を保持することを提案するが、1つの特徴、すなわち、xが分かれば、yの符号化の可能な範囲を縮小することを加える。
【0025】
例えば、図3に見られるように、m=12の変換係数をもたらす部分変換Pを用いた4×4ブロックを考察する。その結果、0~11の係数は、非ゼロとなり得るが、12~15の係数は、必然的にゼロであることが分かる。
【0026】
最後の符号化係数の座標xは、0(位置0、1、3、6の場合)~3(位置9の場合のみ)の範囲内にある。xが分かれば、yの範囲は、実際にxに依存する。上記の例では、
x=0又はx=1は、[0、3]の範囲内のyをもたらす
x=2は、[0、2]の範囲内のyをもたらす
x=3は、y=0をもたらす;この場合、yは、符号化される必要さえない
【0027】
この符号化のプロセスは、xを復号し、次いで、mが既知であり、且つどこかでエンコードされると仮定して、yの範囲を演繹し、次いでyを復号するので、復号可能であることが容易に理解される。
【0028】
HEVCでは、座標x又はyが、図4に示すように、プレフィックス及びサフィックスに分けられる。
例えば、座標値が14の場合、プレフィックスは、7であり、及びサフィックスは、2ビットに符号化される。サフィックスは、最初の値が座標値から減算された後の余りである(14-12=2)。座標値が3の場合、プレフィックスは3であるが、サフィックスは存在しない。
【0029】
プレフィックスは、打ち切り単項符号化を用いて二値化される。打ち切りは、プレフィックス値の上限を提供するブロックサイズの知識に基づいて行われる。二値化プレフィックスの各ビットが、CABAC及び専用コンテキストを用いてエンコードされる。
【0030】
例えば、4×4のブロックにおいて、可能なプレフィックスは、それぞれ1、01、001、及び000(打ち切り)に二値化される0、1、2、又は3である。別の例では、8×8のブロックにおいて、可能なプレフィックスは、0~5であり、1、01、001、0001、00001、及び00000(打ち切り)に二値化される。
【0031】
サフィックスは、固定長符号化を用いて二値化され、固定長サフィックスは、コンテキストを使用せずにバイパスモードでCABACを使用して、そのままエンコードされる。例えば、16×16のブロックにおいて、座標値が、14の場合、プレフィックスは、7(0000000に二値化される)であり、且つサフィックスは、2(10に二値化され、及び2ビットに符号化される)である。
【0032】
プレフィックス及びサフィックスへの二値化プロセスは、HEVCの場合と同様に、プレフィックスに対してのみコンテキストを使用して維持される。本原理の主な特性は、xの値に応じて、yのコンテキストの範囲を縮小させることができることである。
【0033】
通常、変換Tは、n個のピクセルのブロックを、m=n個の変換係数に変換する。このプロセスは、ピクセル値を元に戻すために、変換係数に逆変換T-1を適用することにより、可逆的である。部分変換Pの場合、n個のピクセルは、より少ないm<n個の変換係数に変換される。つまり、欠けているm-n個の係数がゼロに設定されると仮定することができる。「逆」変換P’(もちろん、部分変換が可逆的ではないため、数学的逆数ではない)を変換係数に適用することにより、初期ピクセル値の近似が得られる。一般的に、部分変換係数は、ピクセルブロックの低周波情報を表す。
【0034】
部分変換が使用される場合、あるm-n個の変換係数が必然的にゼロであることが分かっており、従って、最後の符号化係数の位置に対して、及び座標(x、y)に対して幾つかの制約が課される。この場合、これらの制約を暗に使用することによって、部分変換を使用して、TUピクセルを変換係数に変換する場合、実施形態は、2つの座標(x、y)の効率的なエンコーディングを自動的に処理することが示される。
【0035】
DCT又はDSTなどの系統的変換の代わりに、異なる分類及び変換最適化スキームを使用して、大きな訓練セットに対してオフラインで学習される適応直交変換のセットを代わりに使用することができる。この変換のセットは、コーデックに供給され、セットの中から最良の変換が、レート歪み最適化(RDO)ループにおいて、選択される。より適応的な手法は、あるシーケンスのある特定のイントラフレームに関して、直交変換のセットを学習することである。これは、本明細書の残りの部分で、オンザフライブロックベース変換学習スキームと呼ばれる。このスキームを図5に示す。
【0036】
図5のブロック図は、アルゴリズムが2つの部分、すなわち、ビデオ/画像コーデック内の残差ブロックの分類、及び新しい変換のセットの生成に分けられる一般的なオンザフライスキームを示す。第1のステップは、残差ブロックをK個の異なるクラス(S…S)に分類する。第2のステップにおいて、各クラスに関して、その特定のクラスの再構成誤差の最小化を使用して、新しい変換を得る。一般的に、特異値分解(SVD)及び(カルーネン・レーベ変換)KLTを使用して、直交変換のセットが生成される。これらの2つのステップは、解の収束又は停止基準に達するまで反復される。ブロック図に見られるように、システムへの入力は、ある分離不可能な直交変換の初期セット(T…T)と併せたイントラフレーム又は画像である。システムは、復号器に送られるビットストリームにエンコードされる必要があるシンタックス情報と併せた学習変換のセット(T’…T’)を出力する。一般に、これらの変換基底ベクトルをエンコードするために必要とされるオーバーヘッドビットは、フレームをエンコードするために必要とされるビットと比較してかなり大きい。
【0037】
SVDのエネルギー圧縮特性により、最初の「m」個のベクトルのみが復号器に送信され、残りの(n-m)個の変換ベクトルが、グラム・シュミット法に類似した完了アルゴリズムを用いて生成されるか、あるいはゼロにさせられ、従って、部分変換をもたらす、学習変換の不完全な表現を演繹することによって、オーバーヘッドコストをかなり減らすことができることが観察される。
【0038】
Bjontegaard歪みレート(BDレート)に対する、変換の最後の数個のベクトルを切り捨てる影響を示すために、サイズ64×64の4つの分離不可能な最適化変換を4Kシーケンス「PeopleOnStreet」及び「Traffic」に対して学習させる。最初の「m」個のベクトルが保持され、次いで、完了アルゴリズムを使用して、基底ベクトルの残りが完了されるこれらのシーケンスに対して、エンコーディングテストが行われる。図6は、符号化基底ベクトルの数に対する性能利得の変動を示す。縦軸は、アンカー(HEVCテストソフトウェアHM15.0)に対する、及び変換コストを考慮に入れない利得率である。
【0039】
変換ベクトルの最初の半分(すなわち、m=32)のみを保持することによって、BDレートの観点から、無視できるほどの性能低下があることが、図2において観察される。m=16の場合、すなわち、最初の16個の基底ベクトルのみが符号化される場合、性能は、全ての「n」個の基底ベクトルを符号化することによって得られる全体的なビットレートと比較して、1%低下するが、変換ベクトルのオーバーヘッドコストは、総オーバーヘッドの4分の1にまで減少する。m=8の場合、BDレート性能の観点から、性能のかなりの損失があるが、オーバーヘッドもさらに減少する。一般に、これは、性能損失とオーバーヘッドコストとの間にトレードオフが存在することを示す。
【0040】
最初の「m」個の変換ベクトルのみをエンコードする時のBDレートの観点からの性能低下が、ビデオの内容に依存するので、「m」の最適値を推定するために、内容適応方法が必要である。直感的に、低ビットレートでは、係数のほとんどは、ゼロに量子化され、高ビットレートでは、係数のエネルギーは、高周波においても、かなりのものである。従って、「m」の値は、内容及び量子化パラメータQPに依存する。
【0041】
残差信号エネルギーは、平均して、DC係数が、平均して最大エネルギーを有する最初の数個の係数により集中し、より高周波の係数に向かうにつれて、減少する。従って、高周波係数のほとんどが、ゼロに量子化される。オーバーヘッドとしてフレームと共に符号化される必要がある「m」の最良値を計算するために、単純な閾値ベースの方法を適用することができる。
【0042】
EをDCT係数のエネルギーの和とする。パラメータpとEとの乗算によって、閾値tを定義し、
t=p・E
を得る。
【0043】
「m」の値は、単純に、この閾値より大きい平均エネルギーを持つ係数の数から計算することができる。「p」の値は、実験的に見つけることができる。表1は、エンコードされるベクトルの総数のパーセンテージを単位とした「p」の選択値に関して、この閾値を上回るベクトルの数「m」の変動を示す。高QPにおいて、必要とされる平均ベクトル数は、低QPにおいて必要とされる平均ベクトル数と比較して、かなり少ないことが、表1から観察される。また、ベクトルの数「m」も、内容に応じて変動する。
【0044】
【表1】
【0045】
部分変換を使用して、本原理が適用される場合、yの範囲は、xに依存する。
【0046】
最後の16-12=4が、常にゼロであるような、m=12の部分変換を使用した図3の例を再度考察する。係数位置12に関連付けられた座標(2、2)を最も効率的に符号化するには、どのようにすればよいのだろうか。1つの可能性は、x=2を最初に符号化することである。その二値化は、HEVCの場合と同様に、001である。この場合、yの可能な範囲は、0~2であることが分かっており、従って、HEVCの場合と同様に3までの打ち切り単項符号化の代わりに、2までの打ち切り単項符号化を使用することができる。これは、yに関する二値化00を001の代わりにもたらす。そして、二値化プロセスにおいて1ビットを獲得し、従って、より良好な圧縮性能がもたらされる。
【0047】
図3の例において、この実施形態を用いた二値化の幾つかの追加の例:
(000、0)の代わりに(000、なし)に二値化される(3、0)
HEVCの場合と同様に、(0、0)に二値化される(0、0)
(3、3)は、不可能な座標である
【0048】
部分変換を用いたこの実施形態は、m=57の部分変換を使用した8×8のTUの例に関する図7に見られるように、サフィックスを使用する座標yに簡単に拡張される。最初の57個の変換係数は、非ゼロでもよいが、最後の64-57=7個の係数は、必然的にゼロである。最後の符号化係数位置が55であると想定する。これにより、座標(x、y)=(5、6)が与えられる。yのプレフィックスは、5であり、そのサフィックスは、0である。HEVCにおいては、サフィックスは、1ビットについて符号化されるべきであるが、この想定ケースでは、係数55の直下の係数58が、この場合、必然的にゼロであると分かっているので、サフィックスは、1になることができないことが分かっており、従って、サフィックスは、符号化されず、符号化の1ビットが獲得される。
【0049】
HEVC/H.265標準規格では、バイナリデータを符号化するための新しいツールが、算術符号器、つまりコンテキスト適応二値算術符号化(又はCABAC)において提案されている。0又は1の値をとるバイナリシンボルsが、1となる確率p、及び0となる確率1-pに続いて符号化される。この確率は、コンテキストから演繹され、及び各シンボルの符号化の後に適応される。
【0050】
コンテキスト値は、8ビット値である(図8を参照)。先頭ビットは、最確シンボル(Most Probable Symbol)(又はMPS)を表し、次の7ビットが、そこから確率pが演繹される確率p’(又は状態)を表す。
【0051】
コンテキスト値の更新は、符号化シンボルがMPSに等しいか否かに応じて、図9に記載するプロセスに続いて行われる。
【0052】
2つの表、符号化シンボルがMPSである場合には、transldxMPS、及び符号化シンボルがMPSでない(すなわち、それは、最も確からしくないシンボル(Least Probable Symbol)(LPS)である)場合には、transldxLPSを用いて、展開が行われる。これらの表は、名称がpStateldxであるエントリp’に関する表2において提供される。
【0053】
【表2】
【0054】
MPSとなるシンボルsの確率pMPSは、0~127まで、8ビットについて線形に量子化される。これは、コンテキスト値から、
MPS=(p’+64)/127=(pStateldx+64)/127
によって演繹され、1となるシンボルsの確率pは、MPSの値に応じて、pMPSから明らかに演繹される。
MPS=1の場合、p=pMPSであり、
MPS=0の場合、p=1-pMPSである。
【0055】
コンテキスト適応符号化は、符号化が、シンボルが属するチャネルの統計に動的に従うことを可能にする強力なツールである。また、各チャネルは、統計が混ざること、及びプロセスのメリットを失うことを回避するために、それ自体のコンテキストを持つべきである。これは、多くのチャネルをモデル化するために、数百のコンテキストを使用するHEVC/H.265において、多くのコンテキストの広範な使用をもたらした。例えば、コンテキストを使用する全てのチャネルの中には、
・動きベクトル残差、
・TU符号化フラグ、
・最後の有意係数位置、
・符号化グループ符号化フラグ
・変換係数有意フラグ
・変換係数大きさ(1より大きい、及び2より大きい)フラグ
・SAOデータ
・他のデータ
がある。
【0056】
これらのコンテキスト/チャネルの全ては、主に、カラーチャネル(すなわち、チャネルがルマであるか、あるいはクロマであるか)、変換ユニットサイズ、変換係数の位置、隣接シンボル値、及び他の要因にも依存する。
【0057】
一例として、図10に示すように、符号化グループ(CG)符号化フラグが、現在のCGの下及び右にあるCG符号化フラグが、1であるか否かに応じて選択される。
【0058】
結局、コンテキストの選択は、多くのもの、従って、膨大な数のコンテキストに依存する。もちろん、復号器は、エンコーダとの同期及びストリームのパースを確実にするために、エンコーダ側で行われたものと一致するようにコンテキスト値を更新しなければならない。
【0059】
本明細書に記載の実施形態は、画像ブロック値から係数を得るために使用される部分変換のサイズを考慮することによって、潜在的y座標候補の範囲を縮小することを提案する。
【0060】
記載の原理を実施するために必要とされる関連のシンタックスは、mの値部分変換のサイズのエンコーディングであるべきである。この値は、向上した二値化及び打ち切り単項符号化も復号器で決定できるように、フレーム又はスライスレベルで符号化することができる。
【0061】
復号プロセスに関して、本明細書に記載の原理は、復号器が最後の符号化係数位置を復号できるようにするために復号器に適切に影響を与えなければならない。
【0062】
部分変換を使用した上記実施形態では、yサフィックスの向上した二値化及び打ち切り単項符号化にも影響が与えられる。
【0063】
本原理の上記特徴に加えて、記載の実施形態は、m又はそれから係数のサブセットを決定することができる情報の符号化が、ビットストリーム中にあることを提供する。さらに、最後の符号化係数は、2つの座標(x、y)によって提供され、並びにサブセット及びxの値を使用して、yの範囲が決定される。また、打ち切り符号化は、決定した範囲に基づいて、yのプレフィックス及びサフィックスに使用される。
【0064】
提案した考えは、ビデオストリームのシンタックス内に存在し、適用される復号方法を示唆する点において、規範的である。そのため、この考えは、HEVCの後継などのビデオ標準規格において実施することができる。
【0065】
変換係数のセットを符号化する方法1100の一実施形態を図11に示す。この方法は、開始ブロック1101で始まり、制御は、画像値のブロックを変換して変換係数値を生成するブロック1110に進む。制御は、ブロック1110から、y座標を符号化するために変換のサイズの知識を使用して、最後の符号化係数をエントロピー符号化するブロック1120に進む。
【0066】
変換係数のセットを符号化する装置1200の一実施形態を図12に示す。この装置は、入力ポートで画像値のブロックを受信し、出力ポートで変換係数を生成する変換回路1210を含む。変換回路1210のこの出力ポートは、エントロピー符号器1220への入力と信号接続している。エントロピー符号器1220は、変換のサイズの知識を使用して、最後の符号化係数位置のy座標を符号化することによって、y座標を符号化して最後の符号化係数値を生成する。
【0067】
変換係数のセットを復号する方法1300の一実施形態を図13に示す。この方法は、開始ブロック1301で始まり、制御は、y座標を復号するために変換のサイズの知識を使用して、最後の符号化係数をエントロピー復号するブロック1310に進む。制御は、ブロック1310から、係数の逆変換を行って画像値を生成するブロック1320に進む。
【0068】
変換係数のセットを復号する装置1400の一実施形態を図14に示す。この装置は、最後の符号化係数のコードを包含する変換係数を受信し、y座標を復号するために変換のサイズの知識を使用して最後の符号化係数のy座標を復号する。エントロピー復号器1410の出力は、逆変換回路1420の入力と信号接続している。逆変換回路1420は、入力ポートで変換係数を受信し、それらを逆変換して、出力ポートで画像値のブロックを生成する。
【0069】
前述の実施形態は、セットトップボックス(STB)、モデム、ゲートウェイ、又はビデオエンコーディング又は復号を行う他のデバイスにおいて実施することができる。
【0070】
図示される様々な要素の機能は、専用ハードウェア及び適切なソフトウェアと共同してソフトウェアを実行可能なハードウェアの使用により提供することができる。プロセッサによって提供される場合、これらの機能は、単一の専用プロセッサによって、単一の共有プロセッサによって、又は複数の個々のプロセッサ(これらの一部は共有されてもよい)によって提供されてもよい。また、「プロセッサ」又は「コントローラ」という用語の明確な使用は、ソフトウェアを実行することができるハードウェアのみを指すと解釈されるものではなく、デジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを保存するためのリードオンリーメモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、及び不揮発性記憶装置(これらに限定されない)を暗に包含してもよい。
【0071】
従来型及び/又はカスタムの他のハードウェアも包含されてもよい。同様に、図示されるスイッチは、単に概念的なものである。それらの機能は、プログラム論理の動作により、専用論理により、プログラム制御及び専用論理のインタラクションにより、又は手動で実施されてもよく、特定の技術は、文脈からより具体的に理解されるように、実施者によって選択可能である。
【0072】
本明細書は、本原理を例示する。従って、本明細書に明確に記載又は図示されないが、本原理を具現化し、且つ本原理の精神及び範囲内に包含される様々なアレンジメントを当業者が考案することが可能であることが認識されるだろう。
【0073】
本明細書に列挙した全ての例及び条件付き言語は、本原理及び一人又は複数の本発明者によって当該分野の促進のために寄与される概念を読み手が理解することを助ける教育的目的のためのものであり、上記具体的に列挙された例及び条件に限定されないと解釈されるものである。
【0074】
また、本原理の原理、局面及び実施形態、並びにそれらの具体的な例を列挙した本明細書中の全ての記述は、それらの構造的均等物及び機能的均等物の両方を網羅することが意図される。さらに、そのような均等物は、現在知られている均等物及び将来開発される均等物(すなわち、構造に関係なく、同じ機能を行う開発されるあらゆる要素)の両方を包含することが意図される。
【0075】
従って、例えば、本明細書に提示されるブロック図が、本原理を具現化する例示的回路網の概念図を表すことが、当業者には認識されるだろう。同様に、フローチャート、フロー図、状態遷移図、擬似コードなどが、コンピュータ可読媒体において実質的に表すことができ、従って、コンピュータ又はプロセッサ(そのようなコンピュータ又はプロセッサが明確に示されているか否かにかかわらず)によって実行することができる様々なプロセスを表すことが認識されるだろう。
【0076】
本明細書の特許請求の範囲では、ある特定の機能を行うための手段として表現される要素は、例えば、a)その機能を行う回路要素の組み合わせ、又はb)その機能を行うためのソフトウェアを実行する適切な回路網と組み合わせた、あらゆる形態のソフトウェア(従って、ファームウェア、マイクロコードなどを包含する)を包含する、その機能を行うあらゆるやり方を網羅することが意図される。そのような特許請求の範囲によって定義される本原理は、様々な列挙した手段によって提供される機能性が、特許請求の範囲が求める態様で、組み合わせられ、まとめられるという事実に帰する。従って、これらの機能性を提供することができるあらゆる手段が、本明細書に示されるものと同等であると見なされる。
【0077】
本明細書における本原理の「1つの実施形態(“one embodiment”)」又は「一実施形態(“an embodiment”)」、及びそれらの他のバリエーションに対する言及は、その実施形態に関連して記載された特定の特徴、構造、特性などが、本原理の少なくとも1つの実施形態に包含されることを意味する。従って、「1つの実施形態において」又は「一実施形態において」というフレーズの出現、その上、本明細書全体を通して様々な箇所に出現するその他のバリエーションは、必ずしも、全て同じ実施形態を指すわけではない。
なお、上述の実施形態の一部又は全部は、以下の付記のように記載され得るが、以下には限定されない。
(付記1)
変換係数のブロックを符号化する方法であって、
変換係数のサブセットがゼロであることが知られているように、前記変換係数を得るために部分変換を使用して画像値のブロックを変換することと、
前記変換係数の走査によって決定される最後の非ゼロ変換係数のブロックにおける位置を定義する2つの座標をエントロピー符号化することと、
を含み、
前記2つの座標の一方の座標(y)の前記エントロピー符号化が、前記部分変換のサイズの知識に依存する、方法。
(付記2)
前記部分変換の前記サイズの知識が、ビットストリームでエンコードされる、付記1に記載の方法。
(付記3)
前記2つの座標のそれぞれをプレフィックスとサフィックスとに分けることと、
前記部分変換の前記サイズの知識から、前記y座標の前記プレフィックスの値を推論することと、
をさらに含む、付記1又は2に記載の方法。
(付記4)
オフラインで学習された適応部分変換のセットが、前記画像値のブロックを変換するために使用され得る、付記1~3のいずれか一項に記載の方法。
(付記5)
変換係数のセットを符号化する装置であって、
変換係数を得るために、部分変換を使用して画像値のブロックに関して動作する変換回路と、
前記変換係数の走査によって決定される前記変換係数から最後の符号化係数の位置を表す2つの座標を生成するエントロピー符号器であって、
前記最後の符号化係数の前記位置が、y座標のエントロピー符号化が、前記部分変換のサイズの知識に依存することを特徴とする2つの座標(x、y)によって提供される、エントロピー符号器と、
を含む装置。
(付記6)
前記部分変換の前記サイズの知識が、ビットストリームでエンコードされる、付記5に記載の装置。
(付記7)
前記エントロピー符号器が、前記2つの座標のそれぞれをプレフィックスとサフィックスとに分け、及び前記x座標から、前記y座標の前記プレフィックスの値を推論する、付記5又は6に記載の装置。
(付記8)
変換係数のセットを復号する方法であって、
コードをエントロピー復号することによって、最後の符号化係数の位置を生成することであって、
前記最後の符号化係数の前記位置が、y座標の前記エントロピー復号が、部分変換のサイズの知識に依存することを特徴とする2つの座標(x、y)によって提供されることと、
画像値のブロックを得るために、部分変換を使用して変換係数を逆変換することと、
を含む、方法。
(付記9)
前記部分変換の前記サイズの知識が、ビットストリームから復号される、付記8に記載の方法。
(付記10)
前記2つの座標のそれぞれをプレフィックスとサフィックスとに分けることと、
前記部分変換の前記サイズの知識から、前記y座標の前記プレフィックスの値を推論することと、
をさらに含む、付記8又は9に記載の方法。
(付記11)
変換係数のセットを復号する装置であって、
前記変換係数からの最後の符号化係数の位置を表すコードに関して動作するエントロピー復号器であって、
前記最後の符号化係数の前記位置が2つの座標(x、y)によって提供され、y座標のエントロピー復号が、部分変換のサイズの知識に依存することを特徴とする、エントロピー復号器と、
画像値のブロックを得るために、部分変換を使用して変換係数に関して動作する逆変換回路と、
を含む、装置。
(付記12)
前記部分変換の前記サイズの知識が、ビットストリームから復号される、付記11に記載の装置。
(付記13)
前記エントロピー復号器が、前記2つの座標のそれぞれをプレフィックスとサフィックスとに分け、及び前記部分変換の前記サイズの知識から、前記y座標の前記プレフィックスの値を推論する、付記11又は12に記載の装置。
(付記14)
付記8~10のいずれか一項に記載の方法による変換係数のセットを復号するための、又は付記1~4のいずれか一項に記載の変換係数のブロックを符号化するための命令を保存した、非一時的コンピュータ可読記憶媒体。
(付記15)
付記8~10のいずれか一項に記載の方法によるビットストリームを保存した非一時的コンピュータ可読記憶媒体。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14