特許第6854816号(P6854816)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル ヴイシー ホールディングス, インコーポレイテッドの特許一覧

特許6854816符号化及び復号方法並びに対応するデバイス
<>
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000027
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000028
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000029
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000030
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000031
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000032
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000033
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000034
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000035
  • 特許6854816-符号化及び復号方法並びに対応するデバイス 図000036
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6854816
(24)【登録日】2021年3月18日
(45)【発行日】2021年4月7日
(54)【発明の名称】符号化及び復号方法並びに対応するデバイス
(51)【国際特許分類】
   H04N 19/12 20140101AFI20210329BHJP
   H04N 19/14 20140101ALI20210329BHJP
   H04N 19/176 20140101ALI20210329BHJP
   H04N 19/46 20140101ALI20210329BHJP
   H04N 19/60 20140101ALI20210329BHJP
【FI】
   H04N19/12
   H04N19/14
   H04N19/176
   H04N19/46
   H04N19/60
【請求項の数】28
【全頁数】24
(21)【出願番号】特願2018-522538(P2018-522538)
(86)(22)【出願日】2016年11月2日
(65)【公表番号】特表2018-533309(P2018-533309A)
(43)【公表日】2018年11月8日
(86)【国際出願番号】EP2016076438
(87)【国際公開番号】WO2017080887
(87)【国際公開日】20170518
【審査請求日】2019年10月24日
(31)【優先権主張番号】15306779.8
(32)【優先日】2015年11月9日
(33)【優先権主張国】EP
(73)【特許権者】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】プリ,サラブ
(72)【発明者】
【氏名】ラセール,セバスティアン
(72)【発明者】
【氏名】ル カレ,パトリック
【審査官】 岩井 健二
(56)【参考文献】
【文献】 特開2009−005041(JP,A)
【文献】 特開2001−309380(JP,A)
【文献】 国際公開第2010/087808(WO,A1)
【文献】 N. GARGUIR,Comparative Performance of SVD and Adaptive Cosine Transform in Coding Images,IEEE TRANSACTIONS ON COMMUNICATIONS,IEEE,1979年 8月,VOL.COM-27, NO.8,pp.1230-1234
【文献】 Ivan W. Selesnick and Onur G. Guleryuz,A diagonally-oriented DCT-like 2D block transform,Proc. SPIE 8138,SPIE,2011年,Vol. 8138,pp.1-14
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 − 19/98
(57)【特許請求の範囲】
【請求項1】
方法であって、
ビットストリームから、1つ以上の変換ベクトルによって表現される変換を復号することと、
前記ビットストリームから、前記復号された変換を使用して画像を復号することであって、前記変換を復号することは、変換ベクトルの数を表現する情報を復号することを含み、前記1つ以上の変換ベクトルの少なくとも1つに対して、
前記変換ベクトルの符号化精度を表現する情報を復号することであって、前記符号化精度が前記変換ベクトルの量子化成分を符号化するために使用されるビット数であり、
前記符号化精度に応答して前記変換ベクトルの前記量子化成分を復号することと、
前記変換ベクトルの復号された量子化成分を逆量子化することと、
を含む、方法。
【請求項2】
前記少なくとも1つの符号化精度を表現する前記情報は、ビット数である、請求項1に記載の方法。
【請求項3】
前記少なくとも1つの符号化精度を表現する前記情報は、ビットデクリメントである、請求項1に記載の方法。
【請求項4】
前記少なくとも1つの符号化精度を表現する前記情報は、前記変換の第1の変換ベクトルに対するビット数であり、前記少なくとも1つの符号化精度を表現する前記情報は、前記変換の残りの変換ベクトルに対するビットデクリメントである、請求項1に記載の方法。
【請求項5】
方法であって、
1つ以上の変換ベクトルによって表現される変換にアクセスすることと、
ビットストリームにおいて前記変換を符号化することと、
前記符号化された変換を使用してビットストリームにおいて画像を符号化することであって、前記ビットストリームにおいて前記変換を符号化することは、変換ベクトルの数を表現する情報を符号化することを含み、さらに、前記1つ以上の変換ベクトルの少なくとも1つに対して、
前記変換ベクトルの符号化精度を表現する情報を符号化することであって、前記符号化精度が前記変換ベクトルの量子化成分を符号化するために使用されるビット数であり、
前記変換ベクトルの成分を量子化することと、
前記符号化精度に応答して前記変換ベクトルの前記量子化成分を符号化することと、
を含む、方法。
【請求項6】
前記少なくとも1つの符号化精度を表現する前記情報がビット数である、請求項5に記載の方法。
【請求項7】
前記少なくとも1つの符号化精度を表現する前記情報がビットデクリメントである、請求項5に記載の方法。
【請求項8】
前記少なくとも1つの符号化精度を表現する前記情報は、前記アクセスされる変換の第1の変換ベクトルに対するビット数であり、前記少なくとも1つの符号化精度を表現する前記情報は、前記アクセスされる変換の残りの変換ベクトルに対するビットデクリメントである、請求項5に記載の方法。
【請求項9】
少なくともビットストリームにアクセスするように構成された通信インタフェースと少なくとも1つのプロセッサを含む復号するデバイスであって、
前記少なくとも1つのプロセッサは、
前記アクセスされたビットストリームから、1つ以上の変換ベクトルによって表現される変換を復号することと、
前記ビットストリームから、前記復号された変換を使用して画像を復号することであって、前記変換を復号することは、変換ベクトルの数を表現する情報を復号することを含み、前記少なくとも1つのプロセッサは、さらに、前記1つ以上の変換ベクトルの少なくとも1つに対して、
前記変換ベクトルの符号化精度を表現する情報を復号することであって、前記符号化精度が前記変換ベクトルの量子化成分を符号化するために使用されるビット数であり、
前記符号化精度に応答して前記変換ベクトルの前記量子化成分を復号することと、
前記変換ベクトルの復号された量子化成分を逆量子化することと、
を含む復号するデバイス。
【請求項10】
前記少なくとも1つの符号化精度を表現する前記情報は、ビット数である、請求項9に記載のデバイス。
【請求項11】
前記少なくとも1つの符号化精度を表現する前記情報は、ビットデクリメントである、請求項9に記載のデバイス。
【請求項12】
前記少なくとも1つの符号化精度を表現する前記情報は、前記変換の第1の変換ベクトルに対するビット数であり、前記少なくとも1つの符号化精度を表現する前記情報は、前記変換の残りの変換ベクトルに対するビットデクリメントである、請求項9に記載のデバイス。
【請求項13】
画像にアクセスするように構成された通信インタフェースと少なくとも1つのプロセッサとを含む符号化デバイスであって、
前記少なくとも1つのプロセッサは、
1つ以上の変換ベクトルによって表現される変換にアクセスすることと、
ビットストリームにおいて前記変換を符号化することと、
前記符号化された変換を使用して前記ビットストリームおいて前記アクセスされた画像を符号化することであって、前記ビットストリームにおいて前記変換の符号化することは、変換ベクトルの数を表現する情報を符号化することを含み、前記少なくとも1つのプロセッサは、さらに、前記1つ以上の変換ベクトルの少なくとも1つに対して、
前記変換ベクトルの符号化精度を表現する情報を符号化することであって、前記符号化精度が前記変換ベクトルの量子化成分を符号化するために使用されるビット数であり、
前記変換ベクトルの成分を量子化することと、
前記符号化精度に応答して前記変換ベクトルの前記量子化成分を符号化することと、
を含む符号化デバイス。
【請求項14】
前記少なくとも1つの符号化精度を表現する前記情報は、ビット数である、請求項13に記載のデバイス。
【請求項15】
前記少なくとも1つの符号化精度を表現する前記情報は、ビットデクリメントである、請求項13に記載のデバイス。
【請求項16】
前記少なくとも1つの符号化精度を表現する前記情報は、前記アクセスされる変換の第1の変換ベクトルに対するビット数であり、前記少なくとも1つの符号化精度を表現する前記情報は、前記アクセスされる変換の残りの変換ベクトルに対するビットデクリメントである、請求項13に記載のデバイス。
【請求項17】
ビットストリームを生成する方法をコンピュータに実行させるコンピュータプログラムであって、前記ビットストリームは、
1つ以上の変換ベクトルによって表現される変換を表現する情報と、符号化された変換を使用して符号化された画像を表現する情報であって、前記変換を表現する情報が変換ベクトルの数を表現する情報とを含み、さらに、前記1つ以上の変換ベクトルの少なくとも1つに対して、
前記変換ベクトルに対する符号化精度を表現する情報であって、前記符号化精度は、前記変換ベクトルの量子化成分を符号化するために使用されるビット数であり、
前記符号化精度に応答して取得された前記変換ベクトルの前記量子化成分を表現する情報と、
を含む、コンピュータプログラム。
【請求項18】
前記少なくとも1つの符号化精度を表現する前記情報は、ビット数である、請求項17に記載のコンピュータプログラム
【請求項19】
前記少なくとも1つの符号化精度を表現する前記情報は、ビットデクリメントである、請求項17に記載のコンピュータプログラム
【請求項20】
前記少なくとも1つの符号化精度を表現する前記情報は、アクセスされる変換の第1の変換ベクトルに対するビット数であり、前記少なくとも1つの符号化精度を表現する前記情報は、前記アクセスされる変換の残りの変換ベクトルに対するビットデクリメントである、請求項17に記載のコンピュータプログラム
【請求項21】
実行されたときに方法を実行する機械実行可能命令をその上に記憶した機械読取可能媒体であって、
前記方法は、
ビットストリームから、1つ以上の変換ベクトルによって表現される変換を復号することと、
前記ビットストリームから、前記復号された変換を使用して画像を復号することであって、前記変換を復号することは、変換ベクトルの数を表現する情報を復号することを含み、さらに、前記1つ以上の変換ベクトルの少なくとも1つに対して、
前記変換ベクトルの符号化精度を表現する情報を復号することであって、前記符号化精度が前記変換ベクトルの量子化成分を符号化するために使用されるビット数であり、
前記符号化精度に応答して前記変換ベクトルの前記量子化成分を復号することと、
前記変換ベクトルの復号された量子化成分を逆量子化することと、
を含む、機械読取可能媒体。
【請求項22】
前記少なくとも1つの符号化精度を表現する前記情報は、ビット数である、請求項21に記載の機械読取可能媒体。
【請求項23】
前記少なくとも1つの符号化精度を表現する前記情報は、ビットデクリメントである、請求項21に記載の機械読取可能媒体。
【請求項24】
前記少なくとも1つの符号化精度を表現する前記情報は、前記変換の第1の変換ベクトルに対するビット数であり、前記少なくとも1つの符号化精度を表現する前記情報は、前記変換の残りの変換ベクトルに対するビットデクリメントである、請求項21に記載の機械読取可能媒体。
【請求項25】
実行されたときに方法を実行する機械実行可能命令をその上に記憶した機械読取可能媒体であって、
前記方法は、
1つ以上の変換ベクトルによって表現される変換にアクセスすることと、
ビットストリームにおいて前記変換を符号化することと、
前記符号化された変換を使用して前記ビットストリームおいて画像を符号化することであって、前記ビットストリームにおいて前記変換の符号化することは、変換ベクトルの数を表現する情報を符号化することを含み、さらに、前記1つ以上の変換ベクトルの少なくとも1つに対して、
前記変換ベクトルの符号化精度を表現する情報を符号化することであって、前記符号化精度が前記変換ベクトルの量子化成分を符号化するために使用されるビット数であり、
前記変換ベクトルの成分を量子化することと、
前記符号化精度に応答して前記変換ベクトルの前記量子化成分を符号化することと、
を含む、機械読取可能媒体。
【請求項26】
前記少なくとも1つの符号化精度を表現する前記情報は、ビット数である、請求項25に記載の機械読取可能媒体。
【請求項27】
前記少なくとも1つの符号化精度を表現する前記情報は、ビットデクリメントである、請求項25に記載の機械読取可能媒体。
【請求項28】
前記少なくとも1つの符号化精度を表現する前記情報は、前記アクセスされる変換の第1の変換ベクトルに対するビット数であり、前記少なくとも1つの符号化精度を表現する前記情報は、前記アクセスされる変換の残りの変換ベクトルに対するビットデクリメントである、請求項25に記載の機械読取可能媒体。
【発明の詳細な説明】
【技術分野】
【0001】
以下で画像(picture)を符号化する(encoding)方法とデバイスが、開示される。対応する復号する(decoding)方法及び復号するデバイスがさらに開示される。
【背景技術】
【0002】
従来は、過去10年間に開発された多くのビデオと画像のコーデック(MPEG2、H264/AVC、HEVC、VP8、VP9など)において、固定変換(DCT、DSTなど)が、各ブロックのピクセル(より正確にはそれらのレジデュアル(residual))に適用され、変換された係数(transformed coefficient)、より正確には周波数係数(frequency coefficients)が取得される。これらの周波数係数は、次に、量子化器(quantizer)Qによって量子化され、エントロピー符号器(VLC、算術符号器、CABACなど)によって符号化された量子化係数が取得される。
【0003】
固定変換に対する代替案は、コンテンツ適応変換が、2015年9月3日に公開されたPCT出願、PCT/EP15/053298のPCT出願で開示されているように使用されても良い。そのようなコンテンツ適応変換は、エネルギーのより良いコンパクション(compaction:圧縮)を導き、故に、ビットレートを削減する。しかしながら、適応変換(adaptive transforms)は、代わりに増加するビットレートを復号器に送ることになる。変換を送信する方法に気を使わない場合、グローバルなビットレートのレートは、増加し得る。
【0004】
例えば、サイズ8×8のレジデュアルブロック上で学習された64×64サイズの非分離可能変換(non-separable transform)は、10ビットの精度で符号化されるとき、64×64×10=40Kビットを必要とする。その結果、4つのそのような変換の符号化コストは、およそ160Kビットを必要とする。より一般的に、サイズN×Nのピクセルのブロックに適用される変換は、サイズNのNベクトル(例えば、N成分を持つ)から成る。故に、変換のサイズは、N、すなわち、Nとして急激に増加する。これは、特に低いビットレートにおける、シーケンス自体のビットレートと比較して符号化する情報が著しく多いことによる。
【0005】
故に、小さいビットレートオーバヘッドを持つ、そのようなコンテンツ適応変換を符号化する方法の必要性がある。
【発明の概要】
【0006】
画像を表現するビットストリーム(bitstream representative of a picture)を復号する方法が開示され、方法は、
少なくとも1つの符号化精度を表現する情報を判定することと、
判定した情報に応答して変換を復号することと、
復号された変換を使用して画像を復号することと、
を含む。
【0007】
第1の実施形態において、符号化精度を表現する情報を判定することは、ビットストリームからの符号化精度を復号することを含む。
【0008】
特定の特徴によると、符号化精度を表現する情報は、ビット数である。変形例において、符号化精度を表現する情報は、ビットデクリメント(bit decrement)である。
【0009】
別の実施形態では、方法は、変換ベクトルの数を表現する情報を復号することと、各変換ベクトルに対する符号化精度を表現する情報を復号することを含む少なくとも1つの符号化精度を表現する情報を判定することと、関連する符号化精度に応答して各変換ベクトルの成分を復号することを含む判定された情報に応答して変換を復号することと、をさらに含む。
【0010】
少なくとも1つの符号化精度を表現する情報を判定することと、
判定された情報に応答して変換を符号化することと、
符号化された変換を使用して符号化することと、
を含む、画像を符号化する方法も開示される。
【0011】
少なくとも1つの符号化精度を表現する情報を判定する手段と、
判定した情報に応答して変換を復号する手段と、
復号された変換を使用して画像を復号する手段と、
を含む、復号するデバイスを開示する。
【0012】
少なくとも1つの符号化精度を表現する情報を判定する手段と、
判定した情報に応答して変換を符号化する手段と、
符号化された変換を使用して画像を符号化する手段と、
を含む、符号化するデバイスが開示される。
【0013】
少なくとも1つの符号化精度を表現する情報と、符号化精度に応答して符号化された変換を表現する情報と、符号化された変換を使用して符号化された画像を表現する情報と、を含む、ビットストリームが開示される。
【0014】
少なくとも1つの符号化精度を表現する情報と、符号化精度に応答して符号化された変換を表現する情報と、符号化された変換を使用して符号化された画像を表現する情報とを含むビットストリームを含む、非一時的記憶媒体が開示される。
【図面の簡単な説明】
【0015】
図1A】特定且つ非限定的な実施形態によるビットストリームにおいて変換を符号化する方法のフローチャートを表す。
図1B】特定且つ非限定的な実施形態によるビットストリームにおいて変換を符号化する方法のフローチャートを表す。
図2】例となる目的のみのオンザフライブロックベース変換学習するスキームのフローチャートを表す。
図3】符号化された変換ベクトルの数に関するパフォーマンスゲインの変化を示す。
図4】減少した精度を持つ適応変換を使用する効果を示す。
図5】様々なビットレートでのパフォーマンス上の精度デクリメントの効果を示す。
図6】特定且つ非限定的な実施形態によるビットストリームからの変換を復号するための方法のフローチャートを表す。
図7】特定且つ非限定的な実施形態によるビットストリームからの変換を復号するための方法のフローチャートを表す。
図8】非限定的な実施形態によるビットストリームからの画像を復号するように構成された受信機の例となるアーキテクチャを表す。
図9】非限定的な実施形態のよるビットストリームにおける画像を符号化するように構成された送信機の例となるアーキテクチャを表す。
【発明を実施するための形態】
【0016】
用語、第1の(first)と第2の(second)が、いくつかの色成分を説明するために本明細書中で使用されたとしても、これらの色成分は、これらの用語によって限定されるべきではないことが理解される。これらの用語は、1つの色成分を他から区別するためにのみ使用される。例えば、第1の色成分は、「(1つの)成分(a component)」又は「第2の色成分(a second color component)」と称することができ、同様に、第2の色成分は、本開示の教示を逸脱することなく「他の成分(another component:もう1つの成分)」又は「第1の色成分(a first color component)」と称することができる。
【0017】
本原理による符号化/復号方法は、変換を符号化するとき、オーバーヘッドコスト(overhead cost)を削減することを可能にする。これらの変換は、典型的なブロックベース適応変換学習アルゴリズムを使用して得ることができる。変換Tは、変換ベクトルのセットによって表される。オンザフライ(on-the-fly)で判定されるコンテンツ適応変換
(外1)

は、変換係数のエネルギーを圧縮する(compacting)ためにより効率的である。より正確には、変換される領域におけるエネルギーは、最後の係数の位置と比較して第1の少ない係数の位置よりもより高い。量子化パラメータ(QP:uantization parameter)は、コーデックの品質レベル/ビットレートを定義し、ここで、QPのより高い値は、低ビット・レートを意味し、逆も又同様である。特定の実施形態による符号化方法は、符号化される変換ベクトルの数を判定するために各係数の位置における量子化された係数のエネルギー/大きさの合計を考慮に入れる。
【0018】
変換Tのスカラー量子化は、より低い精度の変換Gを生成する。従来技術と対象的に、ビットの観点から適切な精度値は、符号器における各変換ベクトルに対して決定され、量子化された変換ベクトルに沿ってビットストリーム中に符号化される。復号器側において、第1に、各変換ベクトルに対する精度値が復号される。精度値がゼロより大きい場合、対応する変換ベクトルは、ビットストリームから復号され、精度値による変換ベクトルの各値をスケーリングすることによって再構成される。精度値がゼロの場合、対応する変換ベクトルは、ゼロベクトルとして構成される。
【0019】
符号化方法は、係数を取得するためにピクセルに適用される変換に対して、変換ベクトルの数と精度、例えば、変換ベクトルの各成分を符号化するために使用されるビット数、を符号化することを含む。変換ベクトルの数及び精度を符号化することは、コーデックのオーバーオールなパフォーマンスに影響を与えることなく変換を符号化するために、オーバーヘッドを削減することができる。
【0020】
変換Tは、Vで示されるn変換ベクトルによって表される。各変換ベクトルvは、成分を含む。
【0021】
図1Aは、特定且つ非限定的な実施形態によるビットストリームにおける変換の符号化に関する方法のフローチャートを表す。
【0022】
ステップS10において、k≦nである変換ベクトルの数kが取得され、ここでkは整数である(セクション5.2)。
【0023】
ステップS12において、変換Tのk個の最初の変換ベクトル(the k first transform vectors of the transform T)を符号化するために使用される、符号化精度bが取得される。より正確には、精度は、変換Tの各変換ベクトルに対して決定される。精度bは、データ駆動型統計モデル(data driven statistical model)(セクション5.3)に基づいて決定しても良い。
【0024】
ステップS14において、kを表現する情報と場合によってはbを表す情報が符号化される。変形例において、kを表現する情報のみが符号化される。後者の場合、符号化精度bは、復号器側でシンタックス要素(例えば、QP)から推定される。符号化精度bは、ビット数として直接符号化しても良い。変形例において、精度bは、第1の変換ベクトルのみに対するビット数mとして及び他の変換ベクトルに対するデクリメントとして符号化される。変形例において、mは符号器及び復号器の双方によって知られており、ビットデクリメントは、全ての変換ベクトルに対して符号化される。この場合、符号化ビット精度bが0に等しいとき、数kは決定されるかもしれないので、kの符号化は、避けることができる。
【0025】
精度bを表現する情報は以下であり得る:
a.変換ベクトルの各成分を符号化するために使用されるビット数を直接示す整数値と、
b.ビット数の漸進的変化(evolution)、すなわち、ビットデクリメントを示す情報。例えば、この情報は、1ビットによる精度のデクリメントを信号で伝えるフラグである。フラグが0に等しいとき、次に、精度は、変更されず、フラグが1に等しいとき、次に、精度は、1でデクリメントされる。
【0026】
任意選択で、変換の数Nは、ビットストリーム中にコード化されても良い。ステップS16において、変換T(より正確にはその変換ベクトルV)は、kの値及び精度bの値に応答してビットストリーム中に符号化される。変換Tの符号化は、変換ベクトル成分を量子化することと、ロスレスエントロピーコーダー(lossless entropy coder)を使用して変換ベクトルの量子化された成分をコード化することと、を含む。変形例において、それらのコード化に関連するビットレートを最小化するために、変換ベクトル成分は、エントロピーコーダーを使用して符号化される。符号化された変換は、画像を符号化することに有利に使用される。符号化プロセスにおいて、従来の符号器(例えば、H.264/AVC、H.265/HEVCなど)で使用される固定変換(DCT、DST、アダマール(Hadamard)など)を、それらは置き換える。
【0027】
例となる実施形態が、図1Bに開示される。本方法は、ステップE30において始まる。ステップE32において、符号器は、少なくとも1つの現在の変換にアクセスする。任意選択のステップE34において、変換の数Nを表現する情報がビットストリーム中に符号化される。符号器は、ステップE36でNに亘るループを任意選択で開始する。ステップE38において、変換ベクトルの数Kを表現する情報は、現在の変換に対して符号化される。ステップE40において、kに亘るループが開始される。ステップE42において、現在の変換ベクトルに対する符号化精度bを表現する情報を、符号器が符号化する。ステップE44において、精度bに応答して現在の変換ベクトルの成分を符号化する。ステップE46において、kに亘るループが終了し、ステップE48においてNに亘るループが終了する。本方法は、ステップE50で終了する。
【0028】
5.1 符号化される適応的変換の判定(例示の目的で)
適応的変換の判定は、本原理による符号化方法の一部ではない。実際に、符号化される変換は、オフラインで判定され、記憶媒体上に記憶されても良い。直交変換の適応的なセットは、システマティックな(systematic)固定変換(DCT、DSTなど)の代わりに、又は異なる分類(classification)及び変換最適化スキームを使用して大きなトレーニングセット上でオフラインで学習する変換の代わりに、使用することができる。適応的変換のこのセットは、コーデックに供給され、セットからベストな変換がレート歪最適化(RDO:Rate Distortion Optimization)ループにおいて選択される。より適応的なアプローチは、シーケンスの特定のイントラ画像に対して直交変換のセットを学習することである。このことは、本書類の残りの部分において、変換学習スキームに基づくオンザフライブロックとして参照される。このスキームは、図2で説明される。
【0029】
このブロック図は、典型的なオンザフライスキームを示し、そのアルゴリズムは、2つの部分、すなわち、ビデオ/画像コーデックの内側のレジデュアルブロックの分類と、変換の新しいセットの生成とに分けられる。ステップS20において、レジデュアルブロックは、K個の異なるクラスに分類される(S…S)。ステップS22において、その特定のクラスに対する再構成誤差の最小化を使用して各クラスに対して、新しい変換が取得される。典型的には、特異値分解(SVD:Singular Value Decomposition)やKLTが変換の直交セットを生成するために使用することができる。これらの2つのステップは、解が収束するまで、又は停止条件(stop criteria)(例えば、反復回数)に達するまで、繰り返される。ブロック図から分かるように、システムへの入力は、分離不可能な直交変換(non-separable orthogonal transforms)(T…T)のいくつかの初期セットに沿った、イントラ画像又は画像である。復号器に送信されるビットストリーム中に符号化される必要のあるシンタックス情報と共に、学習された変換(T’…T’)のセットを、システムが出力する。各変換T’は、変換ベクトルのセットによって表現される。一般に、これらの変換ベクトルを符号化するために必要なオーバーヘッドビット(overhead bits)は、画像を符号化するために必要なビットと比較して著しく大きい。
【0030】
5.2 不完全な表現(incomplete representation)を使用した変換ベクトルコード化
非限定的な実施形態によると、ステップS10において変換ベクトルの数kを取得することは、コンテンツとQPから数kを決定することを含む。SVDのエネルギーコンパクション特性に起因して、オーバーヘッドコストは、学習された変換の不完全な表現を推定することによって大幅に削減することができ、ここで、最初の「k」変換ベクトルのみが、復号器に伝送され、残りの(n−k)変換ベクトルは、グラム・シュミット法に類似のコンパクションアルゴリズムを使用して生成されるか、又はゼロにされる。コンプリーション法(completion method)は、符号器及び復号器の両方において実行することができる。そのようなコンプリーション法の例は、SPIEオプティカルエンジニアリングアンドアプリケーション、2011のI.W.セレスニク(Selesnick)、O.G.グレリューズ(Guleryuz)による「対角線方向のdctのような2dブロック変換(A diagonally oriented dct-like 2d block transform)」に開示されている。
【0031】
変換の最後の数個の変換ベクトルを落とすことの効果を説明するために、4つのサイズ64x64の非分離可能な最適化変換が4Kシーケンス「ピープルオンストリート(PeopleOnStreet)」及び「トラフィック(Trafic)」上で学習する。符号化テストは、これらのシーケンス上で実行される。最初の「k」変換ベクトルは、保たれ、残りの変換ベクトルは、コンプリーションアルゴリズムを使用して完成される。図3は、コード化変換ベクトルの数に関するパフォーマンスゲイン(performance gain)の変動を示す。垂直軸は、アンカー(anchor)(HEVCテストソフトウェアHM15.0)に対するパーセンテージゲインであり、変換コストを考慮していない。図3は、変換ベクトルの最初の半分のみ、すなわち、k=32が保持されたとき、レート歪パフォーマンス(又はBDレート)の観点から無視できるパフォーマンスの落ち込み(drop)があり、ここで、アンカーと比較したパーセンテージの増加として表現している。k=16、すなわち、最初の16個の変換ベクトルのみがコード化される場合、全ての「n」ベース変換ベクトルを符号化することによって得られるオーバーオールのビットレートと比較して1%のパフォーマンスが落ち込むが、変換ベクトルのオーバーオールのコストは、トータルのオーバーヘッドの4分の1に削減される。k=8のとき、パフォーマンスのかなりのロスがある(BDレートに関して)。それにもかかわらず、後のケースにおいて、オーバーヘッドは、さらに削減される。一般に、これは、パフォーマスロスとオーバーヘッドコストとの間で、トレードオフが存在することを示す。
【0032】
最初の「k」変換のみを符号化するときのBDレートに関するパフォーマンスの落ち込みは、kの最適値を推定するために使用することができる。直感的に、低ビットレートにおいて、係数のほとんどは、ゼロに量子化され、高ビットレートにおいて、係数エネルギーは、高い周波数であっても重要である。その結果、「k」の値は、コンテンツ及び量子化パラメータQPに依存するかも知れない。レジデュアル信号エネルギーは、最初のわずかな係数にほとんど集中する。このエネルギーは、より高周波数係数に行くに連れて、減少する。その結果、高周波数係数のほとんどは、ゼロに量子化される。画像と共に次にコード化される「k」の値を計算するために、しきい値を適用することができる。そのようなしきい値の例が、以下に開示される。ブロック変換から取得された変換された係数のエネルギー/大きさ(amplitude)の合計が、Eであるとする。しきい値tは、Eにパラメータpを掛けることによって定義される:
【数1】

例として、p=10−2、5*10−3又は10−3とする。「p」の値は、実験的に分かる。「k」の値は、変換される係数の関連するエネルギー/大きさが統計的にこのしきい値より大きいものに対して、変換ベクトルの数から計算され、統計は、変換によって変換される多くのブロックから見つけられる。
【0033】
「p」の選択された値に対する、ベクトルの総数n(=N)によって割られた上述のこのしきい値とベクトルの数「k」の比の変化を、表1は、示す。表1から、符号化される変換ベクトルの数が、低QPよりも高QPにおいてより小さいことに気づく。さらに、変換ベクトル「k」の数は、コンテンツに依存しても変化する。
【表1】
【0034】
5.3 変換ベクトルの精度の決定
非限定的な実施形態によると、ステップ20において精度bを取得することは、後述されるように統計モデルによって発見される精度低下からbを判定することを含む。追加のビットレートセービング(saving:節約)は、変換Tのコード化精度を低下させることによって取得することができる。v(i)は、サイズnの変換ベクトルvの成分であるとする。初期精度(initial precision)は、最初のベクトルを表現するために必要な、「m」ビットの固定数として定義される。ベクトルv(i)は、その精度がb=m−dビット、すなわち、
【数2】

であるように、精度のデクリメントがコード化される。
【0035】
図4は、2つのビデオシーケンスの全体のパーセンテージ上の削減された精度による適応的変換を使用した効果を示す。かさねて、垂直軸は、変換コストを考慮せずに、アンカー(HEVCテストソフトウェアHM15.0)と比較したパフォーマンスゲインのパーセンテージである。
【0036】
図4は、d=1及びd=2による精度の減少が、BDレートパフォーマンス上で無視できるインパクトを持つことを示す。精度がさらに低下(d=3及びd=4)した場合は、多少のロスがある。その結果、精度の減少は、有益であり、それによって、変換ベクトルを記憶して、伝送するために必要なオーバーヘッドのビットレートを削減することができるからである。加えて、BDレート全体での効果は、コンテンツ依存性であることが観察される。図5は、様々なビットレートにおけるパフォーマンス上の精度デクリメントの効果(「Prec2」に対してd=1、「Prec32」に対してd=5)を示す。精度デクリメント(precision decrement)は、低いビットレートにおいてほとんど効果が無いことが分かる。従って、精度デクリメントdは、ビデオコンテンツ及びQPパラメータ、すなわち、次式に依存する。
【数3】

ここでμは、コンテンツに依存するファクターである。モデルは、後述の通り、精度におけるデクリメントに起因するパフォーマンス上のロスを最小化する各変換ベクトルに対して精度デクリメントdの最適値を判定する。
【0037】
このモデルの背景にある基本的な考え方は、変換量子化に起因して誘導される誤差分散(variance of the error)が、ビデオ/画像コーデックに存在するスカラー量子化器に起因して誘導される誤差分散より小さくなるように、変換ベクトルの量子化によって誘導され誤差上の境界を見つけることである。コーデックにおける係数の量子化に起因する誤差分散をD(Δ)で表示し、変換Tの量子化に起因する誤差分散をD(Δ)で表示する。
【0038】
変換の量子化
精度のデクリメントは、変換の量子化として見ることができ、量子化器Δのステップサイズは、以下の通りである。
【数4】

Tは、例えば、上述の学習アルゴリズムによって取得される、非分離可能な整数変換とする。G=g(T)は、Tの量子化の後で取得される変換であり、g(・)は、以下のようにステップΔに依存する量子化関数として定義される、とする。
【数5】

rは、ビデオコーデックによって圧縮されるために変換され、量子化されるレジデュアルブロック(明らかな行列表記法を得るための直接的なベクトル形式で)であるとする。TとGそれぞれによる変換後の関連する変換された係数ブロックcとc’は、
【数6】

【数7】


である。変換された領域における誤算の平均変化は、以下の式で定義される。
【数8】

【数9】


量子化誤差行列Λは、以下の通り定義される。
【数10】

その結果、誤差分散方程式(error variance equation)は、下記の通り書け、
【数11】


ここでM=ΛΛである。上述の方程式の上限は、以下の式から容易に見つけられる。
【数12】

行例Λにおける各値は、ステップサイズΔに比例し、(−Δ/2、+Δ/2)の間にあり、Mにおける絶対値の合計は、以下のようなステップサイズに比例し、
【数13】

ここで、γは、各変換に対して実験的に計算されるパラメータである。
それ結果、変換の量子化に起因する分散の上限は、以下の式で与えられる。
【数14】

【0039】
変換された係数の量子化
レジデュアルブロックの変換の後で取得される係数は、デッドゾーン(dead-zone)で、ユニフォームの(uniform)スカラー量子化器Q(・)を使用して量子化され、デッドゾーンのステップサイズΔは、いわゆる適応的QPを使用してブロックレベルで又は画像レベルで選択される量子化パラメータ(QP)に依存する。
【0040】
係数の量子化に起因する平均二乗誤差(MSE:mean-squared error)は、
【数15】


で、ここで、xは、係数値を表示し、oは、丸めオフセットであり、p(x)は、係数の確率分布を表示する。文献から知られるように、DCTのような整数変換から取得された係数は、多かれ少なかれ、以下の式で定義されるゼロ平均ラプラス分布(zero-mean Laplace distribution)に従う。
【数16】

ここで、λは、
【数17】

による係数の標準偏差σに関連するラプラス分布パラメータである。MSE方程式におけるp(x)の上述の公式を代わりに使うことは、λとΔに関する表現を提供する。このことは、量子化誤差の分散がこれらの2つのパラメータに依存し、その結果、その表現は、単純に以下の通り表現され、
【数18】

ここで、2つのパラメータα、β>0は、コンテンツに順番に依存するλに依存する。この表現は、量子化誤差分散と量子化ステップサイズとの間に指数関数関係があることを示す。
【0041】
変換の量子化に起因する変換された係数値における変化の効果を最小化するために、分散D(Δ)は、ビデオ/画像コーデックに存在するスカラー量子化器に起因して誘導される誤差分散より正確に小さいことを保たなければならない。それ故に、上述のように取得される2つの分散D(Δ)とD(Δq)との間の関係は、以下の通りとなる。
【数19】

上述の表現を置換することによって、関係は、次式で示すことができる。
【数20】

精度デクリメントdと、QPに関連する量子化ステップサイズΔとの間の関係は、それ故に、取得される。パラメータα、βと
(外2)

は、コンテンツ依存であり、パラメータγとNは、変換自身に関連する。それ故に、これらのパラメータは、精度のドロップdの正確な値を判定するために、ここで精度b=m−dで、各コンテンツに対して別々に抽出することができる。有利には、
【数21】

で、dは、次式より小さく最も近い整数であり得る。
【数22】
【0042】
5.4 シンタックス及び復号プロセス
図6は、特定且つ非限定的な実施形態によるビットストリームからの変換Tを復号する方法のフローチャートを表現する。
【0043】
ステップS26において、変換ベクトル「k」の数を表現する情報が復号される。場合により、精度bを表現する情報が、各変換ベクトルに対してさらに復号される。この情報は、変換ベクトルの各成分を符号化するために使用されるビット数であっても良い。変形例においては、精度デクリメントが復号される。後者の場合、ビット数mは、少なくとも最初の変換ベクトルに対して復号しても良い。変形例において、mは、復号器によって知られており、精度デクリメントdは、各変換ベクトルに対して復号される。
【0044】
精度bを表現する情報は、以下のものであり得る:
a.変換ベクトルの各成分を符号化するために使用されるビット数を直接信号伝達する整数、
b.ビット数の漸進的変化(evolution)、すなわち、ビットデクリメントを示す情報。例えば、この情報は、1ビットによって精度のデクリメントを信号伝達するフラグである。フラグが0に等しいとき、次に、精度は変更されず、フラグが1に等しいとき、次に、精度は1つデクリメントされる。この場合、数kが、復号するビット精度bが0に等しいと判定されたとき、kを復号することは避けることができる。
【0045】
任意選択として、適応的な変換「N」の数を表現する情報は、ビットストリームに符号化される。この場合、いくつかの変換が符号化され、次に、情報(kとbに対する)が各変換に対して符号化される。
【0046】
ステップS28において、変換Tの変換ベクトルは、kとbに応答して復号される。より正確には、変換ベクトルの各成分は、ビットストリームから復号され、変換Tを取得するために逆量子化される。非復号変換ベクトル(すなわち、(n−k)変換ベクトル)は、コンプリーション法(completion method)を使用して判定することができる。
【0047】
復号された変換は、次に、画像を復号するために使用することができる。復号するプロセスにおいて、復号された変換は、従来の復号器(H.264/AVC、H.265/HEVCなど)で使用される固定のDCT/アダマール変換を置き換える。
【0048】
例となる実施形態が、図7に開示される。方法は、ステップS30で始まる。ステップS32において、復号器は、ビットストリームにアクセスする。任意選択のステップS34において、変換の数Nを表現する情報は、アクセスされたビットストリームから復号される。復号器は、ステップS36においてNに亘るループを任意選択として開始する。スッテプS38において、変換ベクトルの数kを表現する情報は、現在の変換に対して復号される。ステップS40において、復号器は、kに亘るループを開始する。ステップS42において、復号器は、現在の変換ベクトルに対する符号化精度bを表現する情報を復号する。ステップS44において、復号器は、精度bに応答して現在の変換ベクトルの成分を復号する。ステップS46において、kに亘るループが終了し、ステップS48において、Nに亘るループが終了する。この方法は、ステップS50で終了する。
【0049】
非限定的な実施形態による、ビットストリームからの画像を復号するように構成された受信機110の例となるアーキテクチャを、図8は表現する。
【0050】
受信機110は、内部メモリ1130(例えば、RAM、ROM及び/又はEPROM)と一緒に、例えば、CPU、GPU及び/又はDSP(デジタルシグナルプロセッサの英語の頭辞語)、を含むことができる、1つ以上のプロセッサ1100を備える。各通信インタフェースが、出力情報を表示し及び/又はユーザにコマンドの入力及び/又はデータへのアクセスを可能にする(例えば、キーボード、マウス、タッチパッド、ウェブカムなど)1つ以上の通信インタフェース1110と、受信機110の外部にあり得る電源1120とを、受信機110は備える。受信機110は、1つ以上のネットワークインタフェース(図示せず)も備えても良い。復号器モジュール1140は、復号機能を実行するデバイス中に含まれる得るモジュールを表現する。加えて、復号器モジュール1140は、受信機110の別個の要素として実装されても良く、又は当業者に知られているような、ハードウェアとソフトウェアの組み合わせとしてプロセッサ1100内に統合されても良い。
【0051】
ビットストリームは、ソースから取得することができる。異なる実施形態によると、ソースは、限定なく下記でも良い:
・ローカルメモリ、例えば、ビデオメモリ、RAM、フラッシュメモリ、ハードディスク;
・ストレージインタフェース、例えば、マスストレージ、ROM、光学式ディスク又は磁気サポートに対するインタフェース;
・通信インタフェース、例えば、配線インタフェース(例えば、バスインタフェース、ワイドエリアネットワークインタフェース、ローカルエリアネットワークインタフェース)又はワイヤレスインタフェース(例えば、IEEE802.11インタフェース又はブルートゥース(登録商標)インタフェース);
・画像取得回路(例えば、CDD(又は電荷結合素子)又はCMOS(又は相補型金属酸化膜半導体などのセンサー)。
【0052】
異なる実施形態によると、復号された画像は、送り先、例えば、ディスプレイデバイスに送信することができる。例として、復号された画像は、リモートメモリ又はローカルメモリ、例えば、ビデオメモリ又はRAM、ハードディスクなどに記憶される。変形例において、復号された画像は、ストレージインタフェースに送信され、それは、例えば、マスストレージ、ROM、フラッシュメモリ、光学式ディスク又は磁気サポートであり、及び/又は例えば、ポイントツーポイントリンク、通信バス、ポイントツーマルチポイントリンク又は放送ネットワークなどの通信インタフェースを亘って伝送される。
【0053】
例となる非限定的な実施形態によると、受信機110は、メモリ1130に記憶されるコンピュータプログラムをさらに含む。コンピュータプログラムは、命令を含み、命令は、受信機110、特に、プロセッサ1100によって実行されたときに、図6及び/又は図7を参照して説明された方法を受信機が実行することを可能にする。変形例によると、コンピュータプログラムは、受信機110の外部にある非一時的デジタルデータサポート上に記憶され、それは例えば、HDD、CD−ROM、DVD、リードオンリ及び/又はDVDドライブ及び/又はDVDリード/ライトドライブやこの分野で知られている全てのものなどである。受信機110は、故に、コンピュータプログラムを読み取る機構を備える。さらに、受信機110は、対応するUSBポート(図示せず)を介して、1つ以上のユニバーサルシリアルバス(USB)タイプストレージデバイス(例えば、「メモリスティック」)にアクセスすることができる。
【0054】
例となる非限定的な実施形態によると、受信機110は、限定なく以下であり得る:
・携帯デバイス;
・通信デバイス;
・ゲーム機;
・セットトップボックス;
・プレーヤ、例えば、ブルーレイプレーヤ;
・TVセット;
・タブレット(又はタブレットコンピュータ);
・ラップトップ;
・ディスプレイ;及び
・復号チップ。
【0055】
図9は、非限定的な実施形態によるビットストリーム中の画像を符号化するように構成された送信機100の例となるアーキテクチャを表現する。
【0056】
送信機100は、内部メモリ1030(例えば、RAM、ROM及び/又はEPROM)と共に、例えば、CPU、GPU及び/又はDSP(デジタルシグナルプロセッサの英語の頭辞語)を含むことができる、1つ以上のプロセッサ1000を備える。送信機100は、それぞれが出力情報を表示し及び/又はユーザにコマンドを入力させ及び/又はデータへのアクセスを可能にする(例えば、キーボード、マウス、タッチパッド、ウェブカムなど)ように適合された1つ以上の通信インタフェース1010と、送信機100の外部にあり得る電源1020とを備える。送信機100は、また1つ以上のネットワークインタフェース(図示せず)を備えても良い。符号化モジュール1040は、コード化機能を実行するデバイス中に含まれ得るモジュールを表現する。加えて、符号化モジュール1040は、送信機100の別個の要素として実装されても良く、又は当業者に既知のハードウェアとソフトウェアの組み合わせとしてプロセッサ1000内に統合されても良い。
【0057】
画像は、ソースから取得され得る。異なる実施形態によって、ソースは、限定なく、以下であり得る:
・ローカルメモリ、例えば、ビデオメモリ、RAM、フラッシュメモリ、ハードディスクなど;
・ストレージインタフェース、例えば、マスストレージ、ROM、光学式ディスク又は磁気サポートとのインタフェース;
・通信インタフェース、例えば、配線インタフェース(例えば、バスインタフェース、ワイドエリアネットワークインタフェース、ローカルエリアネットワークインタフェース)又はワイヤレスインタフェース(例えば、IEEE802.11インタフェース又はブルートゥースインタフェース)など;
・画像取得回路(例えば、例えば、CCD(又は電荷結合素子)又はCMOS(又は相補型金属酸化膜半導体)などのセンサー)。
【0058】
異なる実施形態によると、ビットストリームは、宛先に送信され得る。例としては、ビットストリームは、リモートメモリ又はローカルメモリ、例えば、ビデオメモリ又はRAM、ハードディスクに記憶される。変形例において、ビットストリームは、ストレージインタフェース、例えば、マスストレージ、ROM、フラッシュメモリ、光学式ディスク又は磁気サポートなどのストレージインタフェースに送信され、及び/又は例えば、ポイントツーポイントリンク、通信バス、ポイントツーマルチポイントリンク又は放送ネットワークなどの通信インタフェースを亘って伝送される。例となる非限定的な実施形態によると、送信機100は、メモリ1030に記憶されるコンピュータプログラムをさらに含む。コンピュータプログラムは、命令を含み、命令は、送信機100、特にプロセッサ1000によって実行されたときに、送信機100に図1A及び/又は図1Bを参照して説明された方法を実行することを可能にする。
【0059】
変形例によると、コンピュータプログラムは、送信機100の外部で、非一時的デジタルデータサポート、例えば、HDD、CD−ROM、DVD、リードオンリメモリ及び/又はDVDドライブ及び/又はDVDリード/ライトドライブなどこの技術分野で知られている全て上で記憶される。送信機100は、故に、コンピュータプログラムを読み出す機構を備える。さらに、送信機100は、対応するUSBポート(図示せず)を介して、1つ以上のユニバーサルシリアルバス(USB)タイプストレージ装置(例えば、「メモリスティック」)にアクセスできる。
【0060】
例となる非限定的な実施形態によると、送信機100は、限定なく、以下であり得る:
・携帯デバイス;
・通信デバイス;
・ゲーム機;
・タブレット(又はタブレットコンピュータ);
・ラップトップ;
・静止画カメラ;
・ビデオカメラ;
・符号化チップ;
・静止画サーバ;及び
・ビデオサーバ(例えば、放送サーバ、ビデオオンデマンドサーバ又はウェブサーバ)。
【0061】
本明細書で説明した実装は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号中に実装することができる。
【0062】
実装の単一の形式の文脈でのみ検討されたとしても(例えば、方法又はデバイスとしてのみ検討された)、検討された構成要件の実装は、他の形式(例えば、ブログラム)での実装も可能である。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェア中に実装することができる。方法は、例えば、プロセッサなどに例えば、装置中に実装することもでき、プロセッサは、一般にプロセッシングデバイスと言われ、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラム可能ロジックデバイスを含む。プロセッサは、例えば、コンピュータ、携帯電話、ポータブル/パーソナルデジタルアシスタント(「PDA」)、及びエンドユーザ間で情報の通信を容易にする他のデバイスなどの通信デバイスも含む。
【0063】
本明細書で説明された様々なプロセスや特徴を実装することは、様々な異なる機器又はアプリケーション、特に、例えば、機器又はアプリケーション中に具体化することができる。そのような機器の例は、符号器、復号器、復号器からの出力を処理するポストプロセッサ、符号器への入力を提供するプリプロセッサ、ビデオコーダ、ビデオデコーダ、ビデオコーデック、ウェブサーバ、セットトップボックス、ラップトップ、パーソナルコンピュータ、携帯電話、PDF、及び他の通信デバイスを含む。明らかであるように、機器は、モバイルや移動式車両にすらインストールされることもあり得る。
【0064】
加えて、方法は、プロセッサによって実行される命令によって実装することができ、そのような命令(及び/又は実行によって生成されるデータ値)は、プロセッサ読取可能媒体、例えば、集積回路、ソフトウェア担体又は他のストレージデバイス、例えば、ハードディスク、コンパクトディスケット(「CD」)、光学式ディスク(例えば、デジタル多用途ディスク又はデジタルビデオディスクとしばしば参照されるDVD)、ランダムアクセスメモリ(「RAM」)、又はリードオンリメモリ(「ROM」)、上に記憶されても良い。命令は、プロセッサ読取可能媒体上に有形に具体化されたアプリケーションプログラムを形成しても良い。命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、又はそれらの組み合わせの中でも良い。命令は、例えば、オペレーティングシステム、個別のアプリケーション、又はこれら2つの組み合わせにあっても良い。プロセッサは、その結果、例えば、プロセスを実行するように構成されたデバイス及びプロセスを実行するための命令を有するプロセッサ読取可能媒体(例えば、ストレージデバイス)を含むデバイスの両方として特徴付けることができる。さらに、プロセッサ読取可能媒体は、命令に加えて又は命令の代わりに、実装により生成されるデータ値を記憶することもできる。
【0065】
当業者に明らかなように、例えば、記憶される又は伝送される情報を運ぶようにフォーマットされた様々な信号を、実装は生成することができる。情報は、例えば、方法を実行する命令、又は説明した実装の一つによって生成されるデータを含んでも良い。例えば、信号は、説明した実施形態のシンタックスを書き込み又は読み取るための規則をデータとし伝搬されるように、又は説明した実施形態によって書き込まれた実際のシンタックス値をデータとして伝搬するように、フォーマットされ得る。そのような信号は、例えば、電磁波(例えば、スペクトルの無線周波数部分を使用して)又はベースバンド信号として、フォーマットすることができる。フォーマット化は、例えば、データストリームの符号化、符号化されたデータストリームによる搬送波の変調を含んでも良い。信号が伝達する情報は、例えば、アナログ情報又はデジタル情報であり得る。信号は、周知のように、様々な異なる有線の又は無線のリンクを超えて伝送することができる。信号は、プロセッサ読取可能媒体上に記憶することもできる。
【0066】
多くの実装が、説明された。言うまでもなく、様々な変更も可能である点が理解される。例えば、異なる実装の要素は、他の実装を生み出すために、組み合わせられ、補足され、変更され、又は取り除かれても良い。理解し、結果として生じる実装は、開示された実装としての少なくとも実質的に同じ結果を達成するための、少なくとも実質的に同じ方法で、少なくとも実質的に同じ機能を実行する。その結果、これらの及び他の実装は、本明細書によって意図される。
ここで例としていくつかの付記を記載する。
(付記1)
画像を表現するビットストリームを復号する方法であって、
少なくとも1つの符号化精度に応答して少なくとも1つの量子化された変換ベクトルを復号することと、
前記少なくとも1つの量子化された変換ベクトルを逆量子化することと、
前記少なくとも1つの逆量子化された変換ベクトルを使用して前記画像を復号することと、
を含む、方法。
(付記2)
前記ビットストリームからの前記少なくとも1つの符号化精度を表現する情報を復号することと、前記復号された情報から前記少なくとも1つの符号化精度を判定することと、をさらに含む、付記1に記載の方法。
(付記3)
前記少なくとも1つの符号化精度を表現する前記情報は、ビット数である、付記1又は2に記載の方法。
(付記4)
前記少なくとも1つの符号化精度を表現する前記情報は、ビットデクリメントである、付記1又は2に記載の方法。
(付記5)
変換ベクトルの数を表現する情報を復号することを、さらに含み、前記少なくとも1つの符号化精度を表現する情報を復号することが、各変換ベクトルの符号化精度を表現する情報を復号することを含み、前記判定された少なくとも1つの符号化精度に応答して前記少なくとも1つの量子化変換ベクトルを復号することが、前記関連する符号化精度に応答して各量子化された変換ベクトルの成分を復号することを含む、付記2乃至4のいずれか1項記載の方法。
(付記6)
画像を符号化する方法であって、
少なくとも1つの変換ベクトルの形式で適応的変換を取得することと、
前記少なくとも1つの変換ベクトルを量子化することと、
少なくとも1つの符号化精度に応答して前記少なくとも1つの量子化された変換ベクトルを符号化することと、
前記符号化された少なくとも1つの量子化された変換ベクトルを使用して前記画像を符号化することと、
を含む、方法。
(付記7)
前記ビットストリームにおいて前記少なくとも1つの符号化精度を表現する情報を符号化することをさらに含む、付記6に記載の方法。
(付記8)
前記少なくとも1つの符号化精度を表現する前記情報がビット数である、付記6又は7に記載の方法。
(付記9)
前記少なくとも1つの符号化精度を表現する前記情報がビットデクリメントである、付記6又は7に記載の方法。
(付記10)
変換ベクトルの数を表現する情報を符号化することを、さらに含み、前記ビットストリームにおいて前記少なくとも1つの符号化精度を表現する情報を符号化することが、各変換ベクトルに対する符号化精度を表現する情報を符号化することを含み、前記判定された少なくとも1つの符号化精度に応答して前記少なくとも1つの量子化された変換ベクトルを符号化することが、前記関連する符号化精度に応答して各変換ベクトルの成分を符号化することを含む、付記7乃至9のいずれか1項記載の方法。
(付記11)
少なくとも1つの符号化精度に応答して少なくとも1つの量子化された変換ベクトルを復号する手段と、
前記少なくとも1つの量子化された変換ベクトルを逆量子化する手段と、
前記少なくとも1つの逆量子化された変換ベクトルを使用して前記画像を復号する手段と、
を備えた復号するデバイス。
(付記12)
前記復号するデバイスは、付記1乃至5のいずれか1項に記載の前記復号する方法を実行するように構成された、付記11に記載の復号するデバイス。
(付記13)
少なくとも1つの変換ベクトルの形式で適応的変換を取得するための手段と、
前記少なくとも1つの変換ベクトルを量子化するための手段と、
少なくとも1つの符号化精度に応答して前記少なくとも1つの量子化された変換ベクトルを符号化するための手段と、
前記符号化された少なくとも1つの量子化された変換ベクトルを使用して前記画像を符号化する手段と、
を備える符号化デバイス。
(付記14)
前記符号化デバイスが、付記6乃至10のいずれか1項に従う符号化方法を実行するように構成された、付記13に記載の符号化デバイス。
(付記15)
前記少なくとも1つの符号化精度を表現する情報と、前記少なくとも1つの符号化精度に応答して符号化された少なくとも1つの量子化された変換ベクトルを表現する情報と、前記符号化された少なくとも1つの量子化された変換ベクトルを使用して符号化された画像に応答する情報とを含む、ビットストリーム。
図1A
図1B
図2
図3
図4
図5
図6
図7
図8
図9