特表2021-519534(P2021-519534A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル ヴイシー ホールディングス, インコーポレイテッドの特許一覧

特表2021-519534画像を符号化及び復号する方法及び装置
<>
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000006
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000007
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000008
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000009
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000010
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000011
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000012
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000013
  • 特表2021519534-画像を符号化及び復号する方法及び装置 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2021-519534(P2021-519534A)
(43)【公表日】2021年8月10日
(54)【発明の名称】画像を符号化及び復号する方法及び装置
(51)【国際特許分類】
   H04N 19/105 20140101AFI20210712BHJP
   H04N 19/573 20140101ALI20210712BHJP
   H04N 19/176 20140101ALI20210712BHJP
【FI】
   H04N19/105
   H04N19/573
   H04N19/176
【審査請求】未請求
【予備審査請求】未請求
【全頁数】24
(21)【出願番号】特願2020-551820(P2020-551820)
(86)(22)【出願日】2019年3月19日
(85)【翻訳文提出日】2020年11月10日
(86)【国際出願番号】US2019022894
(87)【国際公開番号】WO2019199418
(87)【国際公開日】20191017
(31)【優先権主張番号】18305457.6
(32)【優先日】2018年4月13日
(33)【優先権主張国】EP
(81)【指定国】 AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JO,JP,KE,KG,KH,KN,KP,KR,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
(71)【出願人】
【識別番号】518338149
【氏名又は名称】インターデジタル ヴイシー ホールディングス, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ポワリエ,タンギ
(72)【発明者】
【氏名】ボルデ,フィリップ
(72)【発明者】
【氏名】アーバン,ファブリス
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MA12
5C159MA19
5C159PP16
5C159TA25
5C159TB08
5C159TC03
5C159TC42
5C159TD02
5C159TD05
5C159UA02
5C159UA05
(57)【要約】
画像ブロックを符号化する方法を開示する。第1の基準イメージにおける動き補償された第1の基準ブロックのサンプル値と、第2の基準イメージにおける動き補償された第2の基準ブロックのサンプル値との加重和として、予測子が決定される。次いで、画像ブロック及び予測子から決定される残差ブロックが、ビットストリームにおいて符号化される。有利には、加重和の重みは、画像ブロックに隣接する復元されたサンプルと、第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【選択図】図5
【特許請求の範囲】
【請求項1】
画像ブロックを符合化する方法であって、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定することと、
−前記画像ブロックと前記予測子から決定された残差ブロックを符号化することと
を含み、
前記加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記動き補償された第1及び第2の基準ブロックに隣接する復元されたサンプルとの間の差を最小化することによって単一のステップで決定される、方法。
【請求項2】
画像ブロックを符合化するための符号化装置であって、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定することと、
−前記画像ブロックと前記予測子から決定された残差ブロックを符号化することと
を実行するように構成された、1つ又は複数のプロセッサを備え、
前記加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記動き補償された第1及び第2の基準ブロックに隣接する復元されたサンプルとの間の差を最小化することによって単一のステップで決定される、符号化装置。
【請求項3】
前記画像ブロックに隣接する前記復元されたサンプルがL字形を形成し、前記動き補償された第1の基準ブロックに隣接する前記復元されたサンプルがL字形を形成し、前記動き補償された第2の基準ブロックに隣接する前記復元されたサンプルがL字形を形成する、請求項1に記載の方法又は請求項2に記載の装置。
【請求項4】
前記加重和がさらに右にシフトされ、シフトSは、前記重みが1/(l<<S)に近い精度で整数値となるように決定される、請求項1及び請求項3のいずれか一項に記載の方法、又は請求項2〜3のいずれか一項に記載の装置。
【請求項5】
前記重み及び/又は前記シフトを決定することが、1組の定義された値から前記重み及び前記シフトを選択することを含む、請求項1及び請求項3〜4のいずれか一項に記載の方法、又は請求項2〜4のいずれか一項に記載の装置。
【請求項6】
前記重み及び/又は前記シフトを決定することが、前記差の最小2乗最小化、並びに前記最小2乗最小化によって得られる値から最も近い値の1組の定義された値から前記重み及び前記シフトを選択することを含む、請求項1及び請求項3〜4のいずれか一項に記載の方法、又は請求項2〜4のいずれか一項に記載の装置。
【請求項7】
前記重み及び/又は前記シフトを決定することが、1組の定義された重み及びシフト値を用いて得られる差を計算することと、最も小さい差に対応する前記重み及び前記シフトを選択することとを含む、請求項1及び請求項3〜4のいずれか一項に記載の方法、又は請求項2〜4のいずれか一項に記載の装置。
【請求項8】
画像ブロックを復号する方法であって、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定することと、
−前記予測子及び残差ブロックから前記画像ブロックを復号することと
を含み、
前記加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記動き補償された第1及び第2の基準ブロックに隣接する復元されたサンプルとの間の差を最小化することによって単一のステップで決定される、方法。
【請求項9】
画像ブロックを復号するための復号装置であって、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定することと、
−前記予測子及び残差ブロックから前記画像ブロックを復号することと
を実行するように構成された、1つ又は複数のプロセッサを備え、
前記加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記動き補償された第1及び第2の基準ブロックに隣接する復元されたサンプルとの間の差を最小化することによって単一のステップで決定される、復号装置。
【請求項10】
前記画像ブロックに隣接する前記復元されたサンプルがL字形を形成し、前記動き補償された第1の基準ブロックに隣接する前記復元されたサンプルがL字形を形成し、前記動き補償された第2の基準ブロックに隣接する前記復元されたサンプルがL字形を形成する、請求項8に記載の方法又は請求項9に記載の装置。
【請求項11】
前記加重和がさらに右にシフトされ、シフトSは、前記重みが1/(l<<S)に近い精度で整数値となるように決定される、請求項8及び請求項10のいずれか一項に記載の方法、又は請求項9〜10のいずれか一項に記載の装置。
【請求項12】
前記重み及び/又は前記シフトを決定することが、1組の定義された値から前記重み及び前記シフトを選択することを含む、請求項8及び請求項10〜11のいずれか一項に記載の方法、又は請求項9〜11のいずれか一項に記載の装置。
【請求項13】
前記重み及び/又は前記シフトを決定することが、前記差の最小2乗最小化、並びに前記最小2乗最小化によって得られる値から最も近い値の1組の定義された値から前記重み及び前記シフトを選択することを含む、請求項8及び請求項10〜11のいずれか一項に記載の方法、又は請求項9〜11のいずれか一項に記載の装置。
【請求項14】
前記重み及び/又は前記シフトを決定することが、1組の定義された重み及びシフト値を用いて得られる差を計算することと、最も小さい差に対応する前記重み及び前記シフトを選択することとを含む、請求項8及び請求項10〜11のいずれか一項に記載の方法、又は請求項9〜11のいずれか一項に記載の装置。
【請求項15】
請求項1及び請求項3〜7のいずれか一項に記載の方法、又は請求項2〜7のいずれか一項に記載の装置によって生成される、画像のブロックを表す符号化されたデータを含むようにフォーマットされたビットストリーム。
【発明の詳細な説明】
【技術分野】
【0001】
技術分野
本実施形態は一般に、画像の符号化及び復号のための方法及び装置に関し、より詳細には、照明の補償及び双予測を用いる画像の符号化及び復号のための方法及び装置に関する。
【背景技術】
【0002】
背景技術
高い圧縮効率を実現するために、イメージ符号化及びビデオ符号化の仕組みは通常、予測及び変換を利用して動画コンテンツでの空間冗長性及び時間冗長性を活用する。一般に、イントラ予測又はインター予測を使用して、イントラ・フレーム相関又はインター・フレーム相関を利用し、次いで、しばしば予測誤差、予測残差、又は予測子で表される、元のイメージ・ブロックと予測イメージ・ブロックとの間の差が変換され、量子化され、エントロピー符号化される。符号化中、元のイメージ・ブロックは通常、場合によっては4分木分割を使用してサブブロックに分割/分離される。ビデオを復元するために、圧縮データは、予測、変換、量子化、及びエントロピー符号化に対応する逆プロセスによって復号される。
【発明の概要】
【0003】
概要
画像ブロックを符号化する方法を開示する。この方法は、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定することと、
−画像ブロックと予測子から決定される残差ブロックを符号化することと
を含み、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0004】
機械読取り可能な媒体が開示される。この機械読取り可能な媒体は、実行されると、画像ブロックを符号化する方法を実施する機械実行可能な命令を内部に記憶しており、この方法は、
−第1の基準イメージにおける動き補償された第1の基準ブロックのサンプル値と、第2の基準イメージにおける動き補償された第2の基準ブロックのサンプル値の加重和として予測子を決定することと、
−画像ブロック及び予測子から決定される残差ブロックを符号化することと
を含み、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0005】
画像ブロックを符号化するための符号化装置を開示する。この符号化装置は、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定するための手段と、
−画像ブロックと予測子から決定される残差ブロックを符号化するための手段と
を備え、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0006】
符号化装置を開示する。この符号化装置は、少なくとも画像ブロックにアクセスするように構成された通信インターフェースと、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定し、
−アクセスされた画像ブロックと予測子から決定された残差ブロックを符号化する
ように構成された少なくとも1つのプロセッサとを備え、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0007】
ビットストリームも開示する。このビットストリームは、画像のブロックを示す符号化されたデータを含むようにフォーマットされ、この符号化されたデータは、前述の各実施形態のうちの1つによる符号化方法に従って符号化される。持続的なプロセッサ読取り可能な媒体が、このビットストリームを記憶する。
【0008】
有利には、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接する復元されたサンプルとが、L字形を形成する。
【0009】
一実施形態では、加重和がさらに右にシフトされ、このシフトSは、重みが1/(l<<S)に近い精度で整数値となるように決定される。
【0010】
一実施形態では、重み及び/又はシフトを決定することは、1組の定義された値から重み及びシフトを選択することを含む。
【0011】
一実施形態では、重み及び/又はシフトを決定することは、誤差の最小2乗最小化、並びにこの最小2乗最小化によって得られる値から最も近い値の1組の定義された値から重み及びシフトを選択することを含む。
【0012】
一実施形態では、重み及び/又はシフトを決定することは、1組の定義された重み及びシフトの値で得られる誤差を計算すること、並びに最小誤差に対応する重み及びシフトを選択することを含む。
【0013】
画像ブロックを復号する方法は、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定することと、
−予測子と残差ブロックから画像ブロックを復号することと
を含み、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0014】
機械読取り可能な媒体を開示する。この機械読取り可能な媒体は、実行されると、画像ブロックを復号する方法を実施する機械実行可能命令を記憶しており、この方法は、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定することと、
−予測子と残差ブロックから画像ブロックを復号することと
を含み、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0015】
画像ブロックを復号するための復号装置を開示する。この復号装置は、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定するための手段と、
−予測子と残差ブロックから画像ブロックを復号するための手段と
を備え、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0016】
復号装置も開示する。この復号装置は、少なくともストリームにアクセスするように構成された通信インターフェースと、
−第1の基準イメージにおける動き補償された第1の基準ブロックと、第2の基準イメージにおける動き補償された第2の基準ブロックとのサンプル値の加重和として予測子を決定し、
−予測子及び残差ブロックから画像ブロックを復号し、アクセスされたストリームから前記残差が復号されるように構成された少なくとも1つのプロセッサとを備え、
加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差を最小化することによって決定される。
【0017】
有利には、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接する復元されたサンプルとが、L字形を形成する。
【0018】
一実施形態では、加重和がさらに右にシフトされ、このシフトSは、重みが1/(1<<S)に近い精度で整数値となるように決定される。
【0019】
一実施形態では、重み及び/又はシフトを決定することは、1組の定義された値から重み及びシフトを選択することを含む。
【0020】
一実施形態では、重み及び/又はシフトを決定することは、誤差の最小2乗最小化、並びにこの最小2乗最小化によって得られる値から最も近い値の1組の定義された値から重み及びシフトを選択することを含む。
【0021】
一実施形態では、重み及び/又はシフトを決定することは、1組の定義された重み及びシフトの値で得られる誤差を計算すること、並びに最小誤差に対応する重み及びシフトを選択することを含む。
【図面の簡単な説明】
【0022】
図面の簡単な説明
図1】特定の非限定的な実施形態によってビットストリームでの画像を符号化するように構成された、送信機の例示的なアーキテクチャを示す。
図2図5及び図6を参照して説明する符号化方法を実行するように構成された、例示的なビデオ符号器を示す。
図3】従来技術による双予測及び照明補償を使用して予測子を導出する方法の流れ図を示す。
図4】従来技術による照明補償パラメータを導出するのに使用されるL字形の一例を示す。
図5】特定の非限定的な実施形態によってビットストリームでの画像ブロックを符号化する方法の流れ図を示す。
図6】特定の非限定的な実施形態によって双予測及び照明補償を使用して予測子を導出するための流れ図を示す。
図7】特定の非限定的な実施形態によって、ビットストリームから画像を復号して、復号された画像を得るように構成された受信機の例示的なアーキテクチャを示す。
図8図6及び図9の方法を参照して説明する復号方法を実行するように構成された、例示的なビデオ復号器のブロック図を示す。
図9】特定の非限定的な実施形態によってビットストリームから画像を復号する方法の流れ図を示す。
【発明を実施するための形態】
【0023】
詳細な説明
各図及び各説明は、本発明の実施形態を明確に理解するのに関連した各要素を例示するように簡略化されてきており、明確にするために、典型的な符号化装置及び/又は復号装置に見られる他の多くの要素を排除していることを理解されたい。第1や第2などの用語は、様々な要素を説明するために本明細書で使用される場合があるが、これらの要素は、これらの用語によって限定されるべきではないことを理解されよう。これらの用語はもっぱら、ある要素と別の要素を区別するために使用される。
【0024】
様々な方法が以下に述べられており、こうした方法のそれぞれが、その説明された方法を実現するための、1つ又は複数のステップ又は動作を含む。方法を適切に動作させるために各ステップ又は各動作の特定の順序が必要とされない限り、特定のステップ及び/又は動作の順序及び/又は使用を修正してもよく、又は組み合わせてもよい。
【0025】
本発明の原理の「1つの実施形態」又は「一実施形態」並びに本発明の原理の他の変形形態への言及は、この実施形態に関連して説明される特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、「1つの実施形態において」若しくは「一実施形態において」、又は「1つの実装形態において」若しくは「一実装形態において」、並びに他の任意の変形形態の表現が明細書全体を通して様々な場所に現れても、それは必ずしもすべてが同じ実施形態を指しているのではない。
【0026】
たとえば、「A/B」、「A及び/又はB」、並びに「A及びBのうちの少なくとも1つ」の場合、以下の「/」、「及び/又は」、「のうちの少なくとも1つ」、並びに「A、B、及びCのうちの1つ又は複数」のいずれかを使用することが、リストに記載された第1の選択肢(A)のみの選択、若しくは記載された第2の選択肢(B)のみの選択、又はその両方の選択肢(A及びB)の選択を包含するものであることを理解されたい。さらなる例として、「A、B、及び/又はC」並びに「A、B、及びCのうちの少なくとも1つ」の場合、そうした表現は、リストに記載された第1の選択肢(A)のみの選択、又はリストに記載された第2の選択肢(B)のみの選択、又はリストに記載された第3の選択肢(C)のみの選択、又はリストに記載された第1及び第2の選択肢(A及びB)のみの選択、又はリストに記載された第1及び第3の選択肢(A及びC)のみの選択、又はリストに記載された第2及び第3の選択肢(B及びC)のみの選択、又は3つすべての選択肢(A及びB及びC)の選択を包含するものである。これは、この技術及び関連技術での当業者には容易に明らかとなるように、リストに記載されている項目の数だけ拡張してもよい。
【0027】
画像は、モノクローム・フォーマットでの輝度サンプルの1つの配列、又は輝度サンプルの1つの配列と、4:2:0、4:2:2、及び4:4:4のカラー・フォーマットでの色度サンプルの対応する2つの配列(又は、RGBなどの3色のカラー・サンプルの3つの配列)とである。一般に、「ブロック」は、サンプル配列内の特定の区域(たとえば、輝度Y)を扱い、「ユニット」は、あらゆる色成分(輝度Yと場合によっては色度Cb及び色度Cr)の連結ブロックを含む。スライスは、HEVC符号化ツリー・ユニット又はH.264マクロブロック・ユニットなど、整数の基本符号化ユニットである。スライスは、全体像、並びにその一部分から構成されてもよい。各スライスは、1つ又は複数のスライス・セグメントを含んでもよい。タイルは、スライス又は画像内の正方形又は長方形の領域においてグループ化された、整数の基本符号化ユニットである。
【0028】
以下では、「復元された」及び「復号された」という用語は、区別なく使用することができる。通常、ただし必ずしもそうではないが、符号器側では「復元された」が使用され、復号器側では「復号された」が使用される。「復号された」又は「復元された」という用語は、ビットストリームが部分的に「復号された」又は「復元された」ことを意味してもよく、たとえば、非ブロック化フィルタリングの後、ただしSAOフィルタリングの前に得られる信号、及び復元されたサンプルは、表示用に使用される最終の復号された出力とは異なっていてもよいことに留意されたい。また、「イメージ」、「画像」、及び「フレーム」という用語を区別なく使用してもよい。
【0029】
HEVC規格について様々な実施形態を説明している。しかし、この実施形態は、HEVCに限定されることなく、Format Range(RExt)、Scalability(SHVC)、Multi-View(MV−HEVC)拡張、及び将来のビデオ符号化規格、たとえば、Joint Video Experts Team(JVET)によって開発される規格のような、たとえばHEVC又はHEVC拡張を含む、他の規格、勧告、及びその拡張に適用することができる。画像ブロックの符号化/復号について様々な実施形態を説明する。こうした実施形態は、画像全体又は画像のシーケンス全体を符号化/復号するのに適用されてもよい。
【0030】
図1には、特定の非限定的な実施形態によってビットストリームでの画像を符号化するように構成された、送信機1000の例示的なアーキテクチャが示してある。
【0031】
送信機1000は、内部メモリ1030(たとえば、RAM、ROM、及び/又はEPROM)とともに、たとえば、CPU、GPU、及び/又はDSP(Digital Signal Processorの英語の頭辞語)を備えることもできる、1つ又は複数のプロセッサ1005を備える。送信機1000は、出力情報を表示し、及び/又はユーザがコマンド及び/又はデータを入力できるようにそれぞれが構成された1つ若しくは複数の通信インターフェース1010(たとえば、キーボード、マウス、タッチパッド、ウェブカメラ)と、送信機1000の外部にあってもよい電源1020とを備える。送信機1000はまた、1つ又は複数のネットワーク・インターフェース(図示せず)を備えてもよい。符号器モジュール1040は、符号化機能を実行するために装置に備えてもよいモジュールを表す。さらに、符号器モジュール1040は、送信機1000の別々の要素として実装してもよく、又は当業者に知られているハードウェアとソフトウェアの組合せとしてプロセッサ1005内に組み込んでもよい。
【0032】
画像は、ソースから得ることができる。様々な実施形態によれば、このソースは、以下のようなものとすることができるが、それだけに限定されるものではない。
−ローカル・メモリ、たとえば、ビデオ・メモリ、RAM、フラッシュ・メモリ、ハード・ディスク、
−記憶装置インターフェース、たとえば、大容量記憶装置、ROM、光ディスク、又は磁気支持装置とのインターフェース、
−通信インターフェース、たとえば、有線インターフェース(たとえば、バス・インターフェース、広域ネットワーク・インターフェース、ローカル・エリア・ネットワーク・インターフェース)、又は無線インターフェース(IEEE 802.11インターフェース、若しくはBluetoothインターフェースなど)、及び
−画像キャプチャ回路(たとえば、CCD(すなわち電荷結合デバイス)若しくはCOMS(すなわち相補型金属酸化膜半導体)などのセンサ)。
【0033】
様々な実施形態によれば、ビットストリームが、宛先に送信されてもよい。一例として、ビットストリームは、遠隔メモリ又はローカル・メモリ、たとえば、ビデオ・メモリ若しくはRAM、ハード・ディスク内に記憶される。一変形形態では、このビットストリームは、記憶装置インターフェース、たとえば、大容量記憶装置、ROM、フラッシュ・メモリ、光ディスク、又は磁気支持装置を備えたインターフェースに送信され、及び/又は、通信インターフェース、たとえば、ポイントツーポイント・リンク、コミュニケーション・バス、ポイントツーマルチポイント・リンク、又はブロードキャスト・ネットワークへのインターフェースにわたって伝送される。例示的で非限定的な実施形態によれば、送信機1000はさらに、メモリ1030に記憶されたコンピュータ・プログラムを含む。このコンピュータ・プログラムは、送信機1000によって、具体的にはプロセッサ1005によって実行されると、図5及び図6を参照して説明する符号化方法を送信機1000が実行できるようにする命令を含む。一変形形態によれば、このコンピュータ・プログラムは、送信機1000の外部で、持続的なデジタル・データ支持体、たとえば、HDD、CD−ROM、DVD、リードオンリ及び/又はDVDのドライブ、及び/又はDVD読取り/書込みドライブなどの外部記憶媒体に記憶されており、これらはすべて当技術分野で知られている。したがって、送信機1000は、コンピュータ・プログラムを読み取る機構を備える。さらに、送信機1000は、対応するUSBポート(図示せず)を介して、1つ又は複数のユニバーサル・シリアル・バス(USB)タイプの記憶装置(たとえば、「メモリ・スティック」)にアクセスすることもできる。
【0034】
例示的で非限定的な実施形態によれば、送信機1000は、以下のようなものとすることができるが、それだけに限定されるものではない。
−モバイル装置、
−通信装置、
−ゲーム装置、
−タブレット(又はタブレット・コンピュータ)、
−ラップトップ、
−静止画像カメラ、
−ビデオ・カメラ、
−符号化チップ又は符号化装置/機器、
−静止画像サーバ、及び
−ビデオ・サーバ(たとえば、放送用サーバ、ビデオオンデマンド・サーバ、又はウェブ・サーバ)。
【0035】
図2には、図5及び図6を参照して説明する符号化方法を実行するように構成された、例示的なビデオ符号器100、たとえば、HEVCタイプの符号器が示してある。符号器100は、送信機1000、又はこのような送信機1000の一部分の一例である。
【0036】
符号化するには、画像は通常、基本符号化ユニット、たとえば、HEVCでの符号化ツリー・ユニット(CTU)又はH.264でのマクロブロック・ユニットに分割される。場合によっては連続した1組の基本符号化ユニットが、スライスにグループ化される。基本符号化ユニットは、あらゆる色成分の基本符号化ブロックを含む。HEVCでは、最小の符号化ツリー・ブロック(CTB)のサイズ16×16が、これまでのビデオ符号化規格で使用されているマクロブロックのサイズに対応する。符号化方法/復号方法及び符号化機器/復号機器を説明するために、本明細書においてはCTU及びCTBという用語が使用されるが、こうした方法及び機器は、H.264など他の規格では別の用語(たとえばマクロブロック)で表現されることがある、こうした特定の用語によって限定されるべきでないことが理解されよう。
【0037】
HEVC符号化では、画像は、典型的には64×64、128×128、又は256×256といった構成可能なサイズでの正方形状のCTUに分割される。CTUは、サイズが同じであり、すなわち幅と高さが親ブロックのサイズの半分になる4つの正方形の符号化ユニット(CU)に4分木分割されるルートである。4分木は、親ノードを4つの子ノードに分割することができる木であり、子ノードのそれぞれは、4つの子ノードへの別の分割での親ノードになる場合がある。HEVCでは、符号化ブロック(CB)は、1つ又は複数の予測ブロック(PB)に分割され、変換ブロック(TB)への4分木分割のルートを形成する。符号化ブロック、予測ブロック、及び変換ブロックに対応して、符号化ユニット(CU)は、予測ユニット(PU)及び変換ユニット(TU)のツリー構造セットを含み、PUはすべての色成分についての予測情報を含み、TUは、各色成分についての残差符号化シンタックス構造を含む。輝度成分のCB、PB、及びTBのサイズは、対応するCU、PU、及びTUに当てはまる。
【0038】
さらに最近の符号化システムでは、CTUは、符号化ユニット(CU)への符号化ツリー分割のルートである。符号化ツリーは、親ノード(通常はCUに対応する)を子ノード(たとえば、2つ、3つ、又は4つの子ノード)に分割することができるツリーであり、子ノードのそれぞれは、子ノードへの別の分割での親ノードになる場合がある。4分木分割モードに加えて、実現可能な分割モードの総数を増大させる、新規の分割モード(2分木対称分割モード、2分木非対称分割モード、3分木分割モード)も定義される。符合化ツリーは、固有のルート・ノード、たとえばCTUを有する。符合化ツリーの葉は、ツリーの終端ノードである。符号化ツリーの各ノードは、サブCU又はより一般にはサブブロックとも呼ばれる、より小さいCUにさらに分割されてもよいCUを示す。CTUの各CUへの分割が決定すると、符号化ツリーの各葉に対応するCUが符号化される。CTUのCUへの分割と、各CUを符号化するのに使用される符号化パラメータ(符号化ツリーの葉に対応する)が、速度ひずみ最適化手順を介して、符号器側において決定されてもよい。CBをPB及びTBに分割することはなく、すなわち、CUは単一のPU及び単一のTUから作成される。
【0039】
以下では、「ブロック」又は「画像ブロック」という用語を、CTU、CU、PU、TU、CB、PB、及びTBのいずれか1つを指すのに使用することができる。さらに、「ブロック」又は「画像ブロック」という用語を使用して、H.264/AVC又は他のビデオ符号化規格に指定されているように、マクロブロック、パーティション、及びサブブロックを指すこともでき、より一般には、数多くのサイズの一連のサンプルを指すこともできる。
【0040】
図2に戻ると、例示的な符号器100では、以下に述べるような符号器要素によって画像が符号化される。符号化される画像は、CUのユニットで処理される。各CUは、イントラ・モード又はインター・モードのいずれかを使用して符号化される。CUがイントラ・モードで符号化されるとき、イントラ予測(160)を実行する。インター・モードでは、動きの推定(175)及び補償(170)が実行される。動き情報(すなわち、動きベクトル及び基準インデックス)は、2つの方法、すなわち「高度動きベクトル予測(AMVP)」及び「マージ・モード」で信号伝送することができる。AMVPでは、既に符号化されたブロックから決定される動きベクトルに基づいて、ビデオ符号器又はビデオ復号器が候補リストを組み立てる。次いで、ビデオ符号器は、候補リストにインデックスを信号伝送して、動きベクトル予測子(MVP)を識別し、動きベクトル差分(MVD)を信号伝送する。復号器側では、動きベクトル(MV)が、MVP+MVDとして復元される。
【0041】
マージ・モードでは、ビデオ符号器又はビデオ復号器が、既に符号化されたブロックに基づいて候補リストを組み立て、ビデオ符号器が、この候補リスト内の候補のうちの1つについてのインデックスを信号伝送する。復号器側では、信号伝送された候補に基づいて、動きベクトル及び基準画像インデックスが復元される。
【0042】
符号器は、CUを符号化するのにイントラ・モード又はインター・モードのうちいずれを使用するかを決定し(105)、予測モード・フラグによってイントラ/インターの決定を示す。元の画像ブロックから予測されたブロック(別名は予測子)を減算すること(110)によって、残差が計算される。
【0043】
たとえば、同じスライス内での復元された隣接サンプルから、イントラ・モードでのCUが予測される。基準画像バッファ(180)に記憶された基準画像の復元されたサンプルから、インター・モードでのCUが予測される。インター・モードでは、双予測が、復元された2つの基準ブロックの動き補償(170)を介して得られる2つの予測値pred0及びpred1を組み合わせる。
Bi−pred=w*pred+w*pred (1)
【0044】
さらに、双予測は、ブロックベースの照明補償(IC)と組み合わせてもよい。ICにより、空間的又は時間的な局所的照明変化を考慮することによって、動き補償(MC)を使用して得られるブロック予測サンプルを補正することができる。この場合、現在のブロックについてフラグ(ICフラグ)が符号化されて、IC補正を適用すべきかどうかを示す。このICフラグは、符号化されず、たとえば、現在のブロックが、隣接する1つの復元されたブロックからパラメータを継承する場合には(マージ・モード)、隣接する復元されたブロックから導出されてもよい。
【0045】
残差は、変換され(125)、量子化される(130)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素がエントロピー符号化されて(145)、ビットストリームを出力する。符号器はまた、変換をスキップし、又は変換と量子化の両方を迂回してもよく、すなわち、変換プロセス又は量子化プロセスを適用することなく、残差が直接に符号化される。直接PCM符号化では、予測が適用されず、符号化ユニット・サンプルが、直接ビットストリームに符号化される。
【0046】
符号器は、復号ループを含み、したがって符号化されたブロックを復号して、さらなる予測のための基準を提供する。量子化された変換係数を逆量子化し(140)、逆変換して(150)残差を復号する。画像ブロックは、復号された残差と予測されたブロックを組み合わせること(155)によって復元される。復元された画像にインループ・フィルタ(165)を適用して、符号化アーティファクトを低減するために、たとえば、非ブロック化/SAO(サンプル適応オフセット)フィルタリングを実行する。フィルタリングされた画像は、基準画像バッファ(180)に記憶されてもよく、他の画像用の基準として使用されてもよい。
【0047】
図3には、従来技術による双予測及び照明補償を使用して予測子を導出する方法の流れ図が示してある。
【0048】
照明補償
インター・モードでは、ICにより、空間的又は時間的な局所的照明変化を考慮することによって、MCを使用して得られるブロック予測サンプルを補正することができる。通常、図4に示すように、現在のブロックに対する復元された隣接サンプル(L−shape−cur)の集合Scurと、基準iブロック(i=0又は1)に対応する隣接サンプル(L−shape−ref−i)の集合Sref−iとを比較することによって、ICパラメータが決定される(S306、S308)。復元された隣接サンプル(この文書ではL字形とも呼ばれる)の集合の一例が図4に示してある。この例では、L字形は、上のサンプルの1行と、現在又は基準のブロックに残されたサンプルの1列とで構成される。別の例では、L字形は、上のサンプルの1行のみ、又は残されたサンプルの1列のみ、若しくは残されたサンプルの2列などで構成されてもよい。
【0049】
L−shape−curでのサンプルと、ICパラメータで補正されたL−shape−ref−iのサンプルとの間の差を(たとえば、最小2乗法を使用して)最小化することによって、ステップS306及びS308において、ICパラメータ(a、b)が計算される。通常、ICモデルは線形である。すなわち、IC(x)=a.x+bであり、ここで、xは補償するサンプルの値である。パラメータ(ai、bi)は、L字形での最小2乗最小化を解くことによって決定される。
【数1】
【0050】
最後に、aが整数の重み(a)及びシフト(sh)に変換され、ICパラメータ(S314及びS316)によってpredが補正されて、以下のようにpredIcを得る。
PredIc=(a*x>>sh)+b (3)
ここで、xiは、ステップS310又はS312において決定される動き補償されたブロック(pred)のサンプルであり、「>>」は右シフト演算子である。
【0051】
ICパラメータ(a、b)及び(a、b)は、互いに独立して導出される。(a0、b0)はL−shape−ref0から導出され(S306)、(a1、b1)はL−shape−ref1から導出される(S308)。
【0052】
双予測
次いで、予測子pred0(又は、ICがref0で有効になっている場合はpredIc0)及びpred1(又は、ICがref1で有効になっている場合はpredIc1)が組み合わされて、単一の予測子Bi−predになる(S318)。従来より、この組合せは、重みw0=w1=1/2で2つの予測値を平均化することにある。より一般には、以下のように、2つの予測子pred0とpred1は、単一の予測子に組み合わされる。
Bi−pred=(w*pred+w*pred+off)>>shift (4)
【0053】
一変形形態では、この重みw0とw1は互いに異なる。一例として、w0はwに等しくてもよく、w1は(l−w)に等しくてもよく、既定の重み値wが表1にリスト表示されている。重み値に対応するインデックスは、各ブロックでのビットストリーム内に符号化されてもよい。
【0054】
【表1】
【0055】
この重みはまた、「重み付け予測」(WP)ツールとしても知られる大域照明補償から導出されてもよい。この場合、各重みは符号器によって決定され、スライス全体において一定である。これらは、ビットストリームで伝送されてもよい。しかし、WPツールはICツールと重複しており、したがって、WPとICの両方をアクティブにするのは一般に逆効果である。
【0056】
ビットストリームにおいては、現在のスライス、画像、又はシーケンスにおいてICが有効になっている場合、このブロックにおいてICが有効になっているかどうかを示すために、ブロックごとに1つのICフラグが符号化されてもよい。これはまた、マージ・モードの場合など、復元された隣接ブロックから導出することが可能である。双予測でICが有効になっている場合、それぞれS314及びS316において、各基準0及び1について、2つの式(3)が独立して計算される。その結果は、ステップS318において、次式のように(4)と組み合わされる。
Bi−Pred=(w0*(a0*x0>>sh0+b0)+w1*(a1*x1>>sh1+b1)+off)>>shift (5)
【0057】
いくつかのシフトをカスケードにすると、精度が不足することにつながり、演算の数とメモリ帯域幅の両方が増加する場合がある。一般化された双予測の場合、符号器は、あらゆる重みを検査し、たとえばRDコスト(レート歪みコスト)の判定基準を使用して、最適な重みを選択しなければならない。これにより、符号器が著しく速度低下することがある。
【0058】
図5には、特定の非限定的な実施形態によってビットストリームでの画像ブロックを符号化する方法の流れ図が示してある。
【0059】
この方法は、ステップS500から始まる。ステップS510において、送信機1000、たとえば符号器100などが、画像スライスのブロックにアクセスする。ステップS520において、アクセスされたブロックについて予測子が決定される。第1の基準イメージにおける動き補償された第1の基準ブロック(pred0)と、第2の基準イメージにおける動き補償された第2の基準ブロック(pred1)とのサンプル値の加重和として予測子が決定され、この加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差、すなわち差を最小化することによって決定される。加重和を得ることは、オフセットを追加することを含む場合がある。ステップS520の具体的な実施形態が、図6に詳しく示してある。
【0060】
ステップS530において、アクセスされたブロックを送信機が符号化する。ブロックを符号化することは通常、ただし必ずしもそうではないが、そのブロックから予測子を減算して、残差のブロックを得ることと、残差のブロックを変換係数のブロックに変換することと、係数のブロックを量子化ステップ・サイズQPで量子化して、変換係数の量子化されたブロックを得ることと、変換係数の量子化されたブロックをビットストリームにおいてエントロピー符号化することとを含む。符号器側でのブロックを復元することは通常、ただし必ずしもそうではないが、変換係数の量子化されたブロックを逆量子化し、逆変換して残差のブロックを得ることと、残差のブロックに予測子を加算して、復号されたブロックを得ることとを含む。この方法は、ステップS540で終了する。
【0061】
図6には、特定の非限定的な実施形態によって双予測及び照明補償を使用して予測子を導出するための流れ図が示してある。ステップS600において、動き補償された基準ブロックref0が得られる。これは、pred0と表される。ステップS602において、動き補償された基準ブロックref1が得られる。これは、pred1と表される。ステップS604において、組み合わされたICと双予測の重みA0、A1、B、及びSが決定される。値A’0、A’1、B’、及びSは、現在のブロックのL字形を使用して、符号器(及び復号器)によって直接決定される。一例として、A’0、A’1、B’、及びSは、最小2乗法を使用して決定されて、2次誤差を最小化する(7)。
【数2】
【0062】
、A、Bが所望の精度Pで整数となるように、シフトSの値が調整される。たとえば、P≒1/(1−<<S)の場合(小数部ではSビットでの固定小数点演算と同等である)、
=E(A’*(1<<S))
=E(A’*(1<<S))
B=E(B’*(1<<S))
E(x)は、xの整数部を表す。
【0063】
以下の条件が真であるとき、Sを繰り返し低減することができる。
|A’−(A>>S)|≦P
|A’−(A>>S)|≦P
|B’−(B>>S)|≦P
【0064】
一変形形態では、既定値A、A、B、及びSのみが検査され(たとえば、表1の重み値)、最小の2次誤差(7)に対応するパラメータ(A’、A’、B’、及びS)が保持される。この後者の場合、最小2乗の方法は使用されない。表1の重み値は、ビットストリーム中で(たとえば、SPS中で)伝送されてもよく、又は事前に知られていてもよい。SPSは、シーケンス・パラメータ・セットを表す。
【0065】
別の変形形態では、値A、A、B、及びSが最小2乗法を用いて計算され、次に、それらが1つの既定値(たとえば、表1の1つの重み値)と一致するように調整される。
【0066】
例示的な一実施形態では、図6の方法を用いて現在のブロックが符号化されるか、又は通常の方法を使用して現在のブロックが符号化されるかを示す1つのフラグ(一般化した双予測フラグ)が符号化される(又は復号器側で復号される)。一変形形態では、このフラグとICフラグが、単一のフラグに結合される。一変形形態では、このフラグと一般化した双予測フラグが、単一のフラグに結合される。
【0067】
ステップS606において、加重和を使用してpred0とpred1を組み合わせることによって、最終的な予測子Bi−predが決定される。例示的な一実施形態では、ステップS604で得られる組み合わされた重みA0、A1、B、及びSを使用して、pred0とpred1が組み合わされる。特定の実施形態では、Bはゼロに等しくてもよい。ICパラメータと予測重みが単一のステップにまとめて適用される(図3のステップS314、S316、及びS318が、図6の単一のステップS604へと組み合わされる)。式(5)が次式(6)のように修正される。
Bi−Pred=(A0*x0+A1*x1)+B)>>S (6)
sh0=sh1の場合、A0=w0*a0
A1=w1*a1
B=(w0*b0+w1*b1+off)<<sh0
S=shift+sh0
sh0<sh1の場合、A0=(w0*a0)<<(sh1−sh0)
A1=w1*a1
B=(w0*b0+w1*b1+off)<<sh1
S=shift+sh1
sh0>sh1の場合、A0=w0*a0
A1=(w1*a1)<<(sh0−sh1)
B=(w0*b0+w1*b1+off)<<sh0
S=shift+sh0
【0068】
図7には、特定の非限定的な実施形態によって、ビットストリームから画像を復号して、復号された画像を得るように構成された受信機2000の例示的なアーキテクチャが示してある。
【0069】
受信機2000は、内部メモリ2030(たとえば、RAM、ROM、及び/又はEPROM)とともに、たとえば、CPU、GPU、及び/又はDSP(Digital Signal Processorの英語の頭辞語)を備えることもできる、1つ又は複数のプロセッサ2005を備える。受信機2000は、出力情報を表示し、及び/又はユーザがコマンド及び/又はデータ(たとえば、復号された画像)を入力できるようにそれぞれが構成された1つ若しくは複数の通信インターフェース2010(たとえば、キーボード、マウス、タッチパッド、ウェブカメラ)と、受信機2000の外部にあってもよい電源2020とを備える。受信機2000はまた、1つ又は複数のネットワーク・インターフェース(図示せず)を備えてもよい。復号器モジュール2040は、復号機能を実行するために装置に備えてもよいモジュールを表す。さらに、復号器モジュール2040は、受信機2000の別々の要素として実装してもよく、又は当業者に知られているハードウェアとソフトウェアの組合せとしてプロセッサ2005内に組み込んでもよい。
【0070】
ビットストリームは、ソースから得ることができる。様々な実施形態によれば、このソースは、以下のようなものとすることができるが、それだけに限定されるものではない。
−ローカル・メモリ、たとえば、ビデオ・メモリ、RAM、フラッシュ・メモリ、ハード・ディスク、
−記憶装置インターフェース、たとえば、大容量記憶装置、ROM、光ディスク、又は磁気支持装置とのインターフェース、
−通信インターフェース、たとえば、有線インターフェース(たとえば、バス・インターフェース、広域ネットワーク・インターフェース、ローカル・エリア・ネットワーク・インターフェース)、又は無線インターフェース(IEEE 802.11インターフェース、若しくはBluetoothインターフェース)、及び
−イメージ・キャプチャ回路(たとえば、CCD(すなわち電荷結合デバイス)若しくはCOMS(すなわち相補型金属酸化膜半導体)などのセンサ)。
【0071】
様々な実施形態によれば、復号された画像は、宛先、たとえばディスプレイ装置に送信されてもよい。一例として、復号された画像は、遠隔メモリ又はローカル・メモリ、たとえば、ビデオ・メモリ若しくはRAM、ハード・ディスク内に記憶される。一変形形態では、この復号された画像は、記憶装置インターフェース、たとえば、大容量記憶装置、ROM、フラッシュ・メモリ、光ディスク、又は磁気支持装置を備えたインターフェースに送信され、及び/又は、通信インターフェース、たとえば、ポイントツーポイント・リンク、コミュニケーション・バス、ポイントツーマルチポイント・リンク、又はブロードキャスト・ネットワークへのインターフェースにわたって伝送される。
【0072】
特定の非限定的な実施形態によれば、受信機2000はさらに、メモリ2030に記憶されたコンピュータ・プログラムを含む。このコンピュータ・プログラムは、受信機2000によって、具体的にはプロセッサ2005によって実行されると、図6及び図9を参照して説明する復号方法を受信機が実行できるようにする命令を含む。一変形形態によれば、このコンピュータ・プログラムは、受信機2000の外部で、持続的なデジタル・データ支持体、たとえば、HDD、CD−ROM、DVD、リードオンリ及び/又はDVDのドライブ、及び/又はDVD読取り/書込みドライブなどの外部記憶媒体に記憶されており、これらはすべて当技術分野で知られている。したがって、受信機2000は、コンピュータ・プログラムを読み取る機構を備える。さらに、受信機2000は、対応するUSBポート(図示せず)を介して、1つ又は複数のユニバーサル・シリアル・バス(USB)タイプの記憶装置(たとえば、「メモリ・スティック」)にアクセスすることもできる。
【0073】
例示的且つ非限定的な実施形態によれば、受信機2000は、以下のようなものとすることができるが、それだけに限定されるものではない。
−モバイル装置、
−通信装置、
−ゲーム装置、
−セット・トップ・ボックス、
−テレビ受像機、
−タブレット(すなわちタブレット・コンピュータ)、
−ラップトップ、
−ビデオ・プレーヤ、たとえばブルーレイ・プレーヤ、DVDプレーヤ、
−表示装置、及び、
−復号チップ又は復号装置/機器。
【0074】
図8には、図6及び図9の方法を参照して説明する復号方法を実行するように構成された、たとえばHEVCタイプの例示的なビデオ復号器200のブロック図が示してある。ビデオ復号器200は、受信機2000又はこのような受信機2000の一部分の一例である。以下に述べるように、例示的な復号器200では、復号器要素によってビットストリームが復号される。ビデオ復号器200は一般に、図2に記述されているように、符号化パスとは逆の復号パスを実行し、これが、ビデオ・データを符号化する一環としてビデオ復号を実行する。
【0075】
具体的には、復号器の入力はビデオ・ビットストリームを含み、これをビデオ符号器100によって生成してもよい。このビットストリームを、まずエントロピー復号して(230)、変換係数、動きベクトル、及び他の符号化された情報を得る。変換係数を逆量子化し(240)、逆変換して(250)残差を復号する。次いで、復号された残差を予測されたブロック(別名、予測子)と組み合わせて(255)、復号された/復元された画像ブロックを得る。予測されたブロックは、イントラ予測(260)又は動き補償された予測(すなわち、インター予測)(275)から得てもよい(270)。前述の通り、動き補償中にAMVP及びマージ・モード技法を使用してもよく、この技法は、補間フィルタを使用して、基準ブロックのサブ整数サンプルについて補間値を計算してもよい。インループ・フィルタ(265)が、復元された画像に適用される。インループ・フィルタは、非ブロック化フィルタ及びSAOフィルタを備えてもよい。フィルタリングされた画像は、基準画像バッファ(280)に記憶される。
【0076】
図9には、特定の非限定的な実施形態によってビットストリームから画像を復号する方法の流れ図が示してある。この方法は、ステップS900から始まる。ステップS910において、復号器200などの受信機2000が、ビットストリームにアクセスする。ステップS920において、第1の基準イメージにおける動き補償された第1の基準ブロック(pred0)と、第2の基準イメージにおける動き補償された第2の基準ブロック(pred1)とのサンプル値の加重和として、受信機が予測子を決定し、この加重和の重みが、前記画像ブロックに隣接する復元されたサンプルと、前記第1及び第2の基準ブロックに隣接するサンプルとの間の誤差、すなわち差を最小化することによって決定される。加重和を得ることは、オフセットを追加することを含む場合がある。ステップS920の具体的な実施形態が図6に詳細に述べてあり、符号化方法のS520と同一である。ステップS930において、受信機は、ビットストリームから画像のブロックを復号する。ブロックを復号することは通常、ただし必ずしもそうではないが、このブロックを表すビットストリームの一部分をエントロピー復号して、変換係数のブロックを得ることと、変換係数のブロックを逆量子化し、逆変換して残差のブロックを得ることと、残差のブロックに予測子を加算して、復号されたブロックを得ることとを含む。この方法は、ステップS840で終了する。
【0077】
本明細書に記載の実装形態は、たとえば、方法若しくはプロセス、機器、ソフトウェア・プログラム、データ・ストリーム、又は信号で実装してもよい。もっぱら(たとえば、方法又は装置としてのみ論じた)単一形式の実装形態との関連で論じたとしても、論じた機能の実装形態は、他の形式(たとえばプログラム)で実装してもよい。機器は、たとえば、適切なハードウェア、ソフトウェア、及びファームウェアで実装してもよい。たとえば、各方法は、たとえばコンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスを含む処理装置を一般に指す、たとえばプロセッサなどの機器に実装してもよい。プロセッサはまた、たとえば、コンピュータ、携帯電話、ポータブル/携帯型情報端末(「PDA」)、エンドユーザ間での情報の通信を容易にする他の装置などの通信装置を含む。
【0078】
本明細書に記載の様々なプロセス及び機能の実装形態は、様々な異なる機器又はアプリケーション、具体的には、たとえば機器又はアプリケーションで実施してもよい。こうした機器の例には、符号器、復号器、復号器からの出力を処理するポストプロセッサ、符号器に入力するプリプロセッサ、ビデオ符号器、ビデオ復号器、ビデオ・コーデック、ウェブ・サーバ、セット・トップ・ボックス、ラップトップ、パーソナル・コンピュータ、携帯電話、PDA、及び他の通信装置が含まれる。明らかとなるように、この機器は、移動式でもよく、また、移動車両に設置してもよい。
【0079】
さらに、この方法は、プロセッサが実行する命令によって実施してもよく、こうした命令(及び/又は、実施することによって生成されるデータ値)は、たとえば集積回路、ソフトウェア搬送媒体などのプロセッサ読取り可能な媒体、又は、たとえばハード・ディスク、コンパクト・ディスケット(「CD」)、光ディスク(たとえば、しばしばデジタル多用途ディスク若しくはデジタル・ビデオ・ディスクと呼ばれるDVDなど)、ランダム・アクセス・メモリ(「RAM」)若しくはリードオンリ・メモリ(「ROM」)など他の記憶装置に記憶してもよい。各命令は、プロセッサ読取り可能な媒体に有形に実施されたアプリケーション・プログラムを形成してもよい。たとえば、命令は、ハードウェア、ファームウェア、ソフトウェア、又はその組合せでもよい。命令は、たとえば、オペレーティング・システム、別々のアプリケーション、又はこの2つの組合せに見いだすことができる。したがって、プロセッサは、たとえば、プロセスを実行するように構成された装置と、プロセスを実行するための命令を有するプロセッサ読取り可能な媒体(記憶装置など)を含む装置との両方として特徴付けてもよい。さらに、プロセッサ読取り可能な媒体は、命令に加えて、又は命令の代わりに、一実装形態によって生成されるデータ値を記憶してもよい。
【0080】
当業者には明らかになるように、各実装形態は、たとえば記憶又は伝送してもよい情報を運ぶようにフォーマットされた、様々な信号を生成してもよい。この情報は、たとえば、方法を実行するための命令、又は説明した各実装形態のうちの1つによって生成されるデータを含んでもよい。たとえば、説明した実施形態のシンタックスを読み書きするための規則をデータとして運ぶように、又は説明した実施形態によって書かれた実際のシンタックス値をデータとして運ぶように、信号をフォーマットしてもよい。たとえば、このような信号は、(たとえばスペクトルの無線周波数部分を使用する)電磁波として、又はベースバンド信号としてフォーマットしてもよい。フォーマットすることは、たとえば、データ・ストリームを符号化すること、及び符号化されたデータ・ストリームで搬送波を変調することを含んでもよい。信号が運ぶ情報は、たとえば、アナログ情報又はデジタル情報でもよい。知られているように、信号は、様々な異なる有線リンク又は無線リンクを介して伝送してもよい。信号は、プロセッサ読取り可能な媒体に記憶してもよい。
【0081】
いくつかの実装形態を説明してきた。それにもかかわらず、様々な修正を加えてもよいことが理解されよう。たとえば、他の実装形態を生成するために、様々な実装形態の要素を組み合わせ、追加し、修正し、又は取り除いてもよい。さらに、他の構造及びプロセスを、開示されたものと置き換えてもよく、その結果得られる実装形態が、少なくとも実質的に同じ方式で、少なくとも実質的に同じ機能を実行して、開示された実装形態と少なくとも実質的に同じ結果を実現することが、当業者には理解されよう。したがって、上記その他の実装形態が、本出願によって企図される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【国際調査報告】