IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル シーイー パテント ホールディングスの特許一覧

特表2024-507791ビデオを符号化/復号するための方法及び装置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-21
(54)【発明の名称】ビデオを符号化/復号するための方法及び装置
(51)【国際特許分類】
   H04N 19/117 20140101AFI20240214BHJP
   H04N 19/157 20140101ALI20240214BHJP
   H04N 19/172 20140101ALI20240214BHJP
   H04N 19/176 20140101ALI20240214BHJP
   H04N 19/80 20140101ALI20240214BHJP
   H04N 19/59 20140101ALI20240214BHJP
【FI】
H04N19/117
H04N19/157
H04N19/172
H04N19/176
H04N19/80
H04N19/59
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023548963
(86)(22)【出願日】2022-02-22
(85)【翻訳文提出日】2023-08-28
(86)【国際出願番号】 EP2022054392
(87)【国際公開番号】W WO2022180031
(87)【国際公開日】2022-09-01
(31)【優先権主張番号】21305227.7
(32)【優先日】2021-02-25
(33)【優先権主張国・地域又は機関】EP
(31)【優先権主張番号】21305578.3
(32)【優先日】2021-05-05
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.HDMI
2.BLUETOOTH
(71)【出願人】
【識別番号】518341334
【氏名又は名称】インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ボルデ,フィリップ
(72)【発明者】
【氏名】ギャルピン,フランク
(72)【発明者】
【氏名】ナセル,カラム
(72)【発明者】
【氏名】チェン,ヤ
(72)【発明者】
【氏名】デュマ,ティエリー
(72)【発明者】
【氏名】ロバート,アントワーヌ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LA00
5C159MA05
5C159RC11
5C159TA68
5C159TB04
5C159TB08
5C159TC10
5C159TC31
5C159UA02
5C159UA04
5C159UA33
(57)【要約】
第2のピクチャの少なくとも一部分から、第1のピクチャの少なくとも一部分を再構成するための方法が提供され、当該第1のピクチャ及び当該第2のピクチャは異なるサイズを有する。再構成することは、ビットストリームから当該第2のピクチャを復号することと、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのリサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することと、を含む。第1のピクチャの少なくとも一部分を再構成するための対応する装置が提供される。ビデオを符号化/復号するための方法、及び対応する装置が提供され、これらは、第2のピクチャの少なくとも一部分から、第1のピクチャの少なくとも一部分を再構成することを含み、当該第1のピクチャ及び当該第2のピクチャは異なるサイズを有する。
【選択図】 図6
【特許請求の範囲】
【請求項1】
方法であって、
-第1のピクチャを復号することと、
-少なくとも1つのリサンプリングフィルタを使用して、第2のピクチャの少なくとも一部分を再構成するために前記第1のピクチャの少なくとも一部分をリサンプリングすることと、を含み、前記リサンプリングフィルタは、前記第2のピクチャの前記少なくとも一部分の第1のサンプルの位相に応答して選択され、前記第1のサンプルの前記位相は、前記第1のピクチャの前記少なくとも一部分における前記第1のサンプルのサブピクセル位置である、方法。
【請求項2】
前記第2のピクチャの再構成された前記少なくとも一部分をディスプレイに送信することを更に含む、請求項1に記載の方法。
【請求項3】
前記リサンプリングフィルタが、前記第1のピクチャの分類に基づいて選択される、請求項1又は2に記載の方法。
【請求項4】
-前記第2のピクチャの再構成された前記少なくとも一部分を、参照ピクチャを記憶する復号されたピクチャバッファに記憶することを更に含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
第3のピクチャを符号化することを更に含み、前記符号化することが、
-前記第2のピクチャの再構成された前記少なくとも一部分を使用して、前記第3のピクチャの少なくとも1つのブロックについての予測を判定することと、
-前記予測を使用して、前記第3のピクチャの前記少なくとも1つのブロックをコーディングすることと、を含む、請求項4に記載の方法。
【請求項6】
第3のピクチャを復号することを更に含み、前記復号することが、
-前記第2のピクチャの再構成された前記少なくとも一部分を使用して、前記第3のピクチャの少なくとも1つのブロックについての予測を判定することと、
-前記予測を使用して、前記第3のピクチャの前記少なくとも1つのブロックを復号することと、を含む、請求項4に記載の方法。
【請求項7】
ビットストリームから前記リサンプリングフィルタの係数を復号することを含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記リサンプリングフィルタが、非分離可能なフィルタである、請求項1~7のいずれか一項に記載の方法。
【請求項9】
-復号された前記第1のピクチャの前記少なくとも一部分のサンプルを分類することと、
-復号された前記第1のピクチャの前記少なくとも一部分における少なくとも1つの隣接サンプルに関連付けられた少なくとも1つのクラスインデックスから、前記第2のピクチャの前記少なくとも一部分の少なくとも1つの第1のサンプルについてクラスインデックスを判定することと、
-前記少なくとも1つの第1のサンプルに関連付けられた、判定された前記クラスインデックスに応答して前記リサンプリングフィルタを選択することと、を更に含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
異なるリサンプリングフィルタが各クラスに関連付けられる、請求項9に記載の方法。
【請求項11】
前記リサンプリングフィルタが、前記第2のピクチャの前記少なくとも一部分と、復号された前記第1のピクチャから取得された前記第2のピクチャの再構成された前記少なくとも一部分との間で判定されるレート歪みコストに基づいて判定される、請求項1~10のいずれか一項に記載の方法。
【請求項12】
装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、第2のピクチャの少なくとも一部分から、第1のピクチャの少なくとも一部分を再構成するように構成されており、前記第1のピクチャ及び前記第2のピクチャは異なるサイズを有し、前記再構成することが、
-ビットストリームから前記第2のピクチャを復号することと、
-復号された前記第2のピクチャの前記少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのリサンプリングフィルタを使用して、前記第1のピクチャの前記少なくとも一部分の少なくとも1つの第1のサンプルを判定することと、を含む、装置。
【請求項13】
前記1つ以上のプロセッサが、前記第1のピクチャの再構成された前記少なくとも一部分をディスプレイに送信するように更に構成されている、請求項12に記載の装置。
【請求項14】
装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、ビデオのピクチャを符号化するように構成されており、前記符号化することが、
-ビットストリームにおいて、第2のピクチャであって、前記第2のピクチャが、第1のピクチャからダウンスケールされたピクチャである、第2のピクチャを符号化することと、
-前記ビットストリームにおいて、第3のピクチャであって、前記第3のピクチャが、前記第1のピクチャと同じサイズを有する、第3のピクチャを符号化することと、を含み、前記第3のピクチャを符号化することが、
-前記第1のピクチャの少なくとも一部分を、復号後に前記第2のピクチャの少なくとも一部分をアップサンプリングすることであって、前記アップサンプリングが、復号された前記第2のピクチャの前記少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのリサンプリングフィルタを使用して、前記第1のピクチャの前記少なくとも一部分の少なくとも1つの第1のサンプルを判定することを含む、アップサンプリングすることによって、再構成することと、
-前記第1のピクチャの再構成された前記少なくとも一部分を、前記第3のピクチャをコーディングするための参照ピクチャを記憶する復号されたピクチャバッファに記憶することと、を含む、装置。
【請求項15】
前記第3のピクチャを符号化することが、
-前記第1のピクチャの再構成された前記少なくとも一部分を使用して、前記第3のピクチャの少なくとも1つのブロックについての予測を判定することと、
-前記予測を使用して、前記第3のピクチャの前記少なくとも1つのブロックをコーディングすることと、を更に含む、請求項14に記載の装置。
【請求項16】
装置であって、1つ以上のプロセッサを備え、前記1つ以上のプロセッサが、ビットストリームからのビデオを復号するように構成されており、前記復号することが、
-前記ビットストリームから第2のピクチャであって、前記第2のピクチャが、第1のピクチャからダウンスケールされたピクチャである、第2のピクチャを復号することと、
-前記ビットストリームから第3のピクチャであって、前記第3のピクチャが、前記第1のピクチャと同じサイズを有する、第3のピクチャを復号することと、を含み、前記第3のピクチャを復号することが、
-前記第1のピクチャの少なくとも一部分を、復号された前記第2のピクチャの少なくとも一部分をアップサンプリングすることであって、前記アップサンプリングが、復号された前記第2のピクチャの前記少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのリサンプリングフィルタを使用して、前記第1のピクチャの前記少なくとも一部分の少なくとも1つの第1のサンプルを判定することを含む、アップサンプリングすることによって再構成することと、
-前記第1のピクチャの再構成された前記少なくとも一部分を、前記第3のピクチャを復号するための参照ピクチャを記憶する復号されたピクチャバッファに記憶することと、を含む、装置。
【請求項17】
前記第3のピクチャを復号することが、
-前記第1のピクチャの再構成された前記少なくとも一部分を使用して、前記第3のピクチャの少なくとも1つのブロックについての予測を判定することと、
-前記予測を使用して、前記第3のピクチャの前記少なくとも1つのブロックを復号することと、を更に含む、請求項16に記載の装置。
【請求項18】
前記1つ以上のプロセッサが、前記ビットストリームから前記リサンプリングフィルタの係数を復号するように更に構成されている、請求項12~17のいずれか一項に記載の装置。
【請求項19】
前記リサンプリングフィルタが、非分離可能なフィルタである、請求項12~18のいずれか一項に記載の装置。
【請求項20】
前記1つ以上のプロセッサが、
-復号された前記第2のピクチャの前記少なくとも一部分のサンプルを分類し、
-復号された前記第2のピクチャの前記少なくとも一部分における少なくとも1つの隣接サンプルに関連付けられた少なくとも1つのクラスインデックスから、前記第1のピクチャの前記少なくとも一部分の前記少なくとも1つの第1のサンプルについてクラスインデックスを判定し、
-前記少なくとも1つの第1のサンプルに関連付けられた判定された前記クラスインデックスに応答して前記リサンプリングフィルタを選択するように更に構成されている、請求項12~19のいずれか一項に記載の装置。
【請求項21】
異なるリサンプリングフィルタが、各クラスに関連付けられている、請求項20に記載の装置。
【請求項22】
前記リサンプリングフィルタを選択することが、アップサンプリングする前記第1のピクチャの前記少なくとも一部分の第1のサンプルの位相に応答し、前記第1のサンプルの前記位相が、前記第2のピクチャの前記少なくとも一部分における前記第1のサンプルのサブピクセル位置である、請求項12~21のいずれか一項に記載の装置。
【請求項23】
前記リサンプリングフィルタが、前記第1のピクチャの前記少なくとも一部分と、復号された前記第2のピクチャから取得された前記第1のピクチャの再構成された前記少なくとも一部分との間で判定されるレート歪みコストに基づいて判定される、請求項14若しくは15又は18~22のいずれか一項に記載の装置。
【請求項24】
請求項3又は4、7~12のいずれか一項に記載の方法を実行することによって形成される、ビットストリームを含む、信号。
【請求項25】
請求項24に記載のビットストリームを含むコンピュータ可読媒体。
【請求項26】
1つ以上のプロセッサに、請求項1~12のいずれか一項に記載の方法を実行させるための命令を記憶しているコンピュータ可読記憶媒体。
【請求項27】
命令を含むコンピュータプログラム製品であって、前記命令は、前記プログラムが1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサに、請求項1~12のいずれか一項に記載の方法を行わせる、コンピュータプログラム製品。
【請求項28】
デバイスであって、
-請求項12~23のいずれか一項に記載の装置と、
-(i)ビデオを表すデータを含む信号を受信するように構成されたアンテナ、(ii)受信された前記信号を、ビデオを表す前記データを含む周波数帯域に制限するように構成された帯域制限器、又は(iii)少なくとも1つの第1の画像の少なくとも一部分を表示するように構成されたディスプレイ、のうちの少なくとも1つと、を備える、デバイス。
【請求項29】
TV、携帯電話、タブレット又はセットトップボックスを含む、請求項28に記載のデバイス。
【請求項30】
装置であって、
o請求項24に記載の信号を含むデータにアクセスするように構成されたアクセスユニットと、
oアクセスされた前記データを送信するように構成された送信機と、を備える、装置。
【請求項31】
請求項24に記載の信号を含むデータにアクセスすることと、アクセスされた前記データを送信することと、を含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は、概して、ビデオの符号化又は復号のための方法及び装置に関する。いくつかの実施形態は、元のピクチャ及び再構成されたピクチャが符号化のために動的にリスケーリングされる、ビデオの符号化又は復号のための方法及び装置に関する。
【背景技術】
【0002】
高い圧縮効率を実現するために、画像及びビデオのコーディング方式は、通常、ビデオコンテンツ内の空間冗長性及び時間冗長性を活用するために予測及び変換を採用している。概して、イントラピクチャ又はインターピクチャ相関を利用するために、イントラ予測又はインター予測が使用され、次いで、予測誤差又は予測残差と呼ばれることが多い、原ブロックと予測ブロックとの間の差が、変換、量子化、及びエントロピコーディングされる。ビデオを再構成するには、エントロピコーディング、量子化、変換、及び予測に対応する逆プロセスによって、圧縮データを復号する。
【発明の概要】
【0003】
一実施形態によれば、第2のピクチャの少なくとも一部分から第1のピクチャの少なくとも一部分を再構成する方法であって、当該第1のピクチャ及び当該第2のピクチャが異なるサイズを有し、当該再構成することが、ビットストリームから当該第2のピクチャを復号することと、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのリサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することと、を含む、方法が提供される。
【0004】
別の実施形態によれば、第2のピクチャの少なくとも一部分から第1のピクチャの少なくとも一部分を再構成するための装置であって、1つ以上のプロセッサを備え、1つ以上のプロセッサが、ビットストリームから当該第2のピクチャを復号することと、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのリサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することと、を行うように構成され、当該第1のピクチャ及び当該第2のピクチャが異なるサイズを有する、装置が提供される。
【0005】
別の実施形態によれば、ビデオ符号化の方法が提供され、本方法は、ビットストリームにおいて第2のピクチャであって、当該第2のピクチャが、第1のピクチャからダウンスケーリングされたピクチャである、第2のピクチャを符号化することと、ビットストリームにおいて第3のピクチャであって、第3のピクチャが、第1のピクチャと同じサイズを有する、第3のピクチャを符号化することと、を含み、第3のピクチャを符号化することは、第1のピクチャの少なくとも一部分を、復号後に第2のピクチャの少なくとも一部分をアップサンプリングすることによって再構成することを含み、当該アップサンプリングは、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのアップサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することを含む。
【0006】
別の実施形態によれば、ビデオ符号化のための装置が提供され、本装置は、1つ以上のプロセッサを備え、当該1つ以上のプロセッサは、ビットストリームにおいて第2のピクチャあって、当該第2のピクチャが、第1のピクチャからダウンスケーリングされたピクチャである、第2のピクチャを符号化することと、ビットストリームにおいて第3のピクチャであって、第3のピクチャが、第1のピクチャと同じサイズを有する、第3のピクチャを符号化するように構成されており、第3のピクチャを符号化することは、第1のピクチャの少なくとも一部分を、復号後に第2のピクチャの少なくとも一部分をアップサンプリングすることによって再構成することを含み、当該アップサンプリングは、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのアップサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することを含む。
【0007】
別の実施形態によれば、ビデオ復号の方法が提供され、本方法は、ビットストリームにおいて第2のピクチャであって、当該第2のピクチャが、第1のピクチャからダウンスケーリングされたピクチャである、第2のピクチャを復号することと、ビットストリームにおいて第3のピクチャであって、第3のピクチャが、第1のピクチャと同じサイズを有する、第3のピクチャを復号することと、を含み、第3のピクチャを復号することは、第1のピクチャの少なくとも一部分を、復号後に第2のピクチャの少なくとも一部分をアップサンプリングすることによって再構成することを含み、当該アップサンプリングは、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのアップサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することを含む。
【0008】
別の実施形態によれば、ビデオ復号のための装置が提供され、本装置は、1つ以上のプロセッサを備え、当該1つ以上のプロセッサは、ビットストリームにおいて第2のピクチャであって、当該第2のピクチャが、第1のピクチャからダウンスケーリングされたピクチャである、第2のピクチャを復号することと、ビットストリームにおいて第3のピクチャであって、第3のピクチャが、第1のピクチャと同じサイズを有する、第3のピクチャを復号するように構成されており、第3のピクチャを復号することは、第1のピクチャの少なくとも一部分を、復号後に第2のピクチャの少なくとも一部分をアップサンプリングすることによって再構成することを含み、当該アップサンプリングは、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのアップサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することを含む。
【0009】
一変形形態では、ビデオを符号化/復号するための方法は、第1のピクチャの再構成された当該少なくとも一部分を、第3のピクチャをコーディングするための参照ピクチャを記憶する復号されたピクチャバッファに記憶することを含む。
【0010】
別の態様によれば、ビデオを符号化するための方法であって、ビデオを符号化することが、第1のピクチャのサンプルを分類することと、第1のピクチャの少なくとも一部分について、当該分類に基づいて第1のフィルタであって、当該第1のフィルタが、第1のピクチャの当該少なくとも一部分を使用する第1の符号化動作に使用される、第1のフィルタを判定することと、第1のピクチャの第1の修正部分を提供することと、当該分類に基づいて第2のフィルタあって、当該第2のフィルタが、第1のピクチャの当該第1の修正部分を使用する第2の符号化動作に使用される、第2のフィルタを判定することと、を含む、方法が提供される。
【0011】
ビデオを符号化するための装置が提供される。装置は、1つ以上のプロセッサを備え、当該1つ以上のプロセッサは、第1のピクチャのサンプルを分類することによってビデオを符号化し、第1のピクチャの少なくとも一部分について、当該分類に基づいて第1のフィルタであって、当該第1のフィルタが、第1のピクチャの当該少なくとも一部分を使用する第1の符号化動作に使用される、第1のフィルタを判定し、第1のピクチャの第1の修正部分を提供し、当該分類に基づいて第2のフィルタであって、当該第2のフィルタが、第1のピクチャの当該第1の修正部分を使用する第2の符号化動作に使用される、第2のフィルタを判定するように構成されている。
【0012】
別の態様によれば、ビデオを復号するための方法であって、ビデオを復号することが、第1のピクチャのサンプルを分類することと、第1のピクチャの少なくとも一部分について、当該分類に基づいて第1のフィルタであって、当該第1のフィルタが、第1のピクチャの当該少なくとも一部分を使用する第1の復号動作に使用される、第1のフィルタを判定することと、第1のピクチャの第1の修正部分を提供することと、当該分類に基づいて第2のフィルタあって、当該第2のフィルタが、第1のピクチャの当該第1の修正部分を使用する第2の復号動作に使用される、第2のフィルタを判定することと、を含む、方法が提供される。
【0013】
ビデオを復号するための装置が提供される。装置は、1つ以上のプロセッサを備え、当該1つ以上のプロセッサは、ビデオを復号するように構成されており、ビデオを復号することは、第1のピクチャのサンプルを分類することと、第1のピクチャの少なくとも一部分について、当該分類に基づいて第1のフィルタであって、当該第1のフィルタが、第1のピクチャの当該少なくとも一部分を使用する第1の復号動作に使用される、第1のフィルタを判定することと、第1のピクチャの第1の修正部分を提供することと、当該分類に基づいて第2のフィルタであって、当該第2のフィルタが、第1のピクチャの当該第1の修正部分を使用する第2の復号動作に使用される、第2のフィルタを判定することと、を含む。
【0014】
上記の態様のいずれか1つのある実施形態によれば、分類は、参照ピクチャを記憶する復号されたピクチャバッファに記憶され、すなわち、第1のピクチャの各サンプルに関連付けられたインデックスが復号されたピクチャバッファに記憶される。
【0015】
別の態様によれば、ビデオを符号化するための別の方法であって、ビデオを符号化することが、参照ピクチャのサンプルを分類することと、ビデオの少なくとも1つのブロックについて、少なくとも1つのブロックの少なくとも1つの動きベクトルを使用して、参照ピクチャの少なくとも一部分を判定することと、参照ピクチャの少なくとも一部分について、当該分類に基づいて少なくとも1つの補間フィルタを判定することと、判定された当該少なくとも1つの補間フィルタを使用する参照ピクチャの当該少なくとも一部分のフィルタリングに基づいて、当該ブロックの予測を判定することと、当該予測に基づいて当該ブロックを符号化することと、を含む、方法が提供される。
【0016】
ビデオを符号化するための装置であって、装置が、参照ピクチャのサンプルを分類することによってビデオを符号化することと、ビデオの少なくとも1つのブロックについて、少なくとも1つのブロックの少なくとも1つの動きベクトルを使用して、参照ピクチャの少なくとも一部分を判定することと、参照ピクチャの少なくとも一部分について、当該分類に基づいて少なくとも1つの補間フィルタを判定することと、判定された当該少なくとも1つの補間フィルタを使用する参照ピクチャの当該少なくとも一部分のフィルタリングに基づいて、当該ブロックの予測を判定することと、当該予測に基づいて当該ブロックを符号化することと、を行うように構成された1つ以上のプロセッサを備える、装置が提供される。
【0017】
別の態様によれば、ビデオを復号するための別の方法であって、ビデオを復号することが、参照ピクチャのサンプルを分類することと、ビデオの少なくとも1つのブロックについて、少なくとも1つのブロックの少なくとも1つの動きベクトルを使用して、参照ピクチャの少なくとも一部分を判定することと、参照ピクチャの少なくとも一部分について、当該分類に基づいて少なくとも1つの補間フィルタを判定することと、判定された当該少なくとも1つの補間フィルタを使用する参照ピクチャの当該少なくとも一部分のフィルタリングに基づいて、当該ブロックの予測を判定することと、当該予測に基づいて当該ブロックを復号することと、を含む、方法が提供される。
【0018】
ビデオを復号するための装置であって、装置が、参照ピクチャのサンプルを分類することによってビデオを復号することと、ビデオの少なくとも1つのブロックについて、少なくとも1つのブロックの少なくとも1つの動きベクトルを使用して、参照ピクチャの少なくとも一部分を判定することと、参照ピクチャの少なくとも一部分について、当該分類に基づいて少なくとも1つの補間フィルタを判定することと、判定された当該少なくとも1つの補間フィルタを使用する参照ピクチャの当該少なくとも一部分のフィルタリングに基づいて、当該ブロックの予測を判定することと、当該予測に基づいて当該ブロックを復号することと、を行うように構成された1つ以上のプロセッサを備える、装置が提供される。
【0019】
1つ以上の実施形態によりまた、1つ以上のプロセッサによって実行されるとき、1つ以上のプロセッサに、再構成方法、又は本明細書に記載の実施形態のいずれかによる符号化方法若しくは復号方法を行わせる命令を含む、コンピュータプログラムを提供する。本実施形態のうちの1つ以上はまた、上記の方法に従って、ピクチャの一部分を再構成するか、ビデオデータを符号化するか、又は復号するための命令を記憶したコンピュータ可読記憶媒体を提供する。1つ以上の実施形態はまた、これまで述べた方法により起こされたビットストリームを記憶しているコンピュータ可読記憶媒体を提供する。1つ以上の実施形態によりまた、上で説明された方法に従って生成されたビットストリームを送信又は受信するための方法及び装置を提供する。
【図面の簡単な説明】
【0020】
図1】本実施形態の態様が実装され得るシステムのブロック図を示す。
図2】ビデオエンコーダの一実施形態のブロック図を示す。
図3】ビデオデコーダの一実施形態のブロック図を示す。
図4】一実施形態によるビデオを符号化するための例示的な方法を示す。
図5】一実施形態によるビデオを再構成するための例示的な方法を示す。
図6】一実施形態による、参照ピクチャが現在ピクチャとは異なる解像度を有するときの、参照ピクチャ中の現在ピクチャ中の現在ブロックの動き補償の一例を示す。
図7】一実施形態による、サンプルの位相の関数としてのフィルタ係数値の判定の一例を示す。
図8】一実施形態による、2段階動き補償フィルタリングの一例を示す。
図9】一実施形態による、動き補償フィルタリングの第1の段階における水平フィルタリングの例を示す。
図10】一実施形態による、動き補償フィルタリングの第2の段階における垂直フィルタリングの一例を示す図である。
図11】対称フィルタ及びフィルタ回転の例を示す。
図12】一実施形態によるアップサンプリングフィルタを判定するための方法の一例を示す。
図13】一実施形態によるピクチャを符号化/復号するための方法の一例を示す。
図14A】一実施形態による、水平方向及び垂直方向における2つによるアップサンプリングに対応する異なる位相の一例を示す。
図14B】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図14C】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図14D】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図14E】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図14F】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図14G】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図14H】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図14I】実施形態による、アップサンプリングフィルタの異なる形状の例を示す。
図15】一実施形態によるアップサンプリングフィルタ係数を判定するための方法の一例を示す。
図16】一実施形態によるビデオを符号化するための方法の一例を示す。
図17】一実施形態によるビデオを復号するための方法の一例を示す。
図18】一実施形態によるビデオを符号化/復号するための方法の一例を示す。
図19】別の実施形態によるビデオを符号化/復号するための方法の一例を示す。
図20】別の実施形態によるビデオを符号化/復号するための方法の一例を示す。
図21】別の実施形態によるビデオを復号するための方法の一例を示す。
図22】本原理の例による通信ネットワークを介して通信する2つのリモートデバイスを示す。
図23】本原理の例による信号のシンタックスを示す。
【発明を実施するための形態】
【0021】
本出願では、ツール、特徴、実施形態、モデル、手法などを含む様々な態様について説明している。これらの態様のうちの多くは、具体的に説明され、少なくとも個々の特性を示すために、しばしば限定的に聞こえ得るように説明される。しかしながら、これは、説明を明確にすることを目的としており、それらの態様の適用又は範囲を限定するものではない。実際には、異なる態様の全てを組み合わせ、かつ置き換えて、更なる態様を提供することができる。更に、これらの態様はまた同様に、以前の出願に記載の態様と組み合わせ、かつ置き換えすることができる。
【0022】
本出願において説明され、企図される態様は、多くの異なる形態で実装することができる。以下の図1図2、及び図3は、いくつかの実施形態を提供するが、他の実施形態が意図され、図1図2、及び図3の考察は、実装形態の間口を限定するものではない。態様のうちの少なくとも1つは、概して、ビデオ符号化及び復号に関し、少なくとも1つの他の態様は、概して、生成又は符号化されたビットストリームを送信することに関する。これら及び別の態様は、方法、装置、説明した方法のいずれかに従ってビデオデータを符号化又は復号するための命令を自体に記憶したコンピュータ可読記憶媒体、及び/又は、説明した方法のいずれかに従って生成されたビットストリームを自体に記憶したコンピュータ可読記憶媒体、として実装することができる。
【0023】
本出願では、「再構成された(reconstructed)」及び「復号された(decoded)」という用語は、交換可能に使用され得、「ピクセル(pixel)」及び「サンプル(sample)」という用語は、交換可能に使用され得、「画像(image)」、「ピクチャ(picture)」、及び「フレーム(frame)」という用語は、交換可能に使用され得る。
【0024】
様々な方法が本明細書に説明されており、本方法の各々は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。ステップ又はアクションの特定の順序が方法の適切な動作のために必要とされない限り、特定のステップ及び/又はアクションの順序及び/又は使用は、修正又は組み合わされ得る。加えて、「第1の(first)」、「第2の(second)」などの用語は、様々な実施形態において、例えば、「第1の復号(first decoding)」及び「第2の復号(second decoding)」などの要素、コンポーネント、ステップ、動作などを修正するために使用され得る。かかる用語の使用は、具体的に必要とされない限り、修正された動作に対する順序付けを意味するものではない。そのため、この実施例では、第1の復号は、第2の復号の前に実行される必要はなく、例えば、第2の復号の前、第2の復号の間、又は第2の復号と重複する時間中に発生し得る。
【0025】
本出願に説明されている様々な方法及び他の態様を使用して、図2及び図3に示されるような、ビデオエンコーダ200及びデコーダ300のモジュール、例えば、動き補償モジュール(270、375)を修正することができる。更に、本開示の態様は、VVC又はHEVCに限定されず、例えば、既存のものであれ将来進展するものであれ、他の規格及び勧告、またこのようないかなる規格及び勧告(VVC及びHEVCを含む)の拡張にも適用することができる。特に断りのない限り、又は技術上除外されない限り、本出願に記載の態様は、個々に、又は組み合わせて使用することができる。
【0026】
図1は、様々な態様及び実施形態が実装され得るシステムの一例のブロック図を示す。システム100は、以下に記載の様々なコンポーネントを含むデバイスとして具現化され得、本明細書に記載の態様のうちの1つ以上を実行するように構成されている。かかるデバイスの実施例としては、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電、及びサーバなどの様々な電子デバイスが挙げられる。システム100の要素は、単独で、又は組み合わせて、単一の集積回路、複数のIC、及び/又は個別のコンポーネントで具現化され得る。例えば、少なくとも1つの実施形態では、システム100の処理要素及びエンコーダ要素/デコーダ要素は、複数のIC及び/又は個別のコンポーネントにわたって分散している。様々な実施形態では、システム100は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通じて、他のシステム、又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム100は、本出願に記載された態様のうちの1つ以上を実装するように構成される。
【0027】
システム100は、例えば、本出願に記載された様々な態様を実装するために、内部にロードされた命令を実行するように構成された、少なくとも1つのプロセッサ110を含む。プロセッサ110は、埋め込み型メモリ、入力出力インターフェース、及び当該技術分野で既知であるように様々な他の回路を含み得る。システム100は、少なくとも1つのメモリ120(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム100は、記憶デバイス140を含み、この記憶デバイスは、限定されるものではないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、及び/若しくは光ディスクドライブを含む、不揮発性メモリ並びに/又は揮発性メモリを含み得る。記憶デバイス140は、非限定的な例として、内部記憶デバイス、取り付け型記憶デバイス、及び/又はネットワークアクセス可能な記憶デバイスを含み得る。
【0028】
システム100は、例えば、データを処理して、符号化ビデオ又は復号ビデオを提供するように構成されたエンコーダ/デコーダモジュール130を含み、そのエンコーダ/デコーダモジュール130は、それ自体のプロセッサ及びメモリを含み得る。エンコーダ/デコーダモジュール130は、符号化機能及び/又は復号機能を実行するためにデバイス内に含まれ得るモジュールを表す。既知であるように、デバイスは、符号化及び復号モジュールのうちの一方又は両方を含み得る。加えて、エンコーダ/デコーダモジュール130は、システム100の個別の要素として実装され得るか、又は当業者に知られているように、ハードウェアとソフトウェアの組み合わせとしてプロセッサ110内に組み込まれ得る。
【0029】
本出願に記載の様々な態様を実行するためにプロセッサ110又はエンコーダ/デコーダ130上にロードされるプログラムコードは、記憶デバイス140内に記憶され、その後、プロセッサ110による実行のためにメモリ120上にロードされ得る。様々な実施形態によれば、プロセッサ110、メモリ120、記憶デバイス140、及びエンコーダ/デコーダモジュール130のうちの1つ以上は、本出願に記載されるプロセスの実行中に、様々な項目のうちの1つ以上を記憶し得る。かかる記憶された項目は、限定されるものではないが、入力ビデオ、復号ビデオ、又は復号ビデオの一部分、ビットストリーム、行列、変数、並びに、方程式、式、動作、及び動作論理の処理からの中間結果又は最終結果を含み得る。
【0030】
いくつかの実施形態では、プロセッサ110及び/又はエンコーダ/デコーダモジュール130の内部のメモリは、命令を記憶し、かつ符号化中又は復号中に必要とされる処理のための作業メモリを提供するために使用される。しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ110又はエンコーダ/デコーダモジュール130のいずれかであり得る)の外部のメモリが、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ120及び/又は記憶デバイス140、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施形態では、外部不揮発性フラッシュメモリが、テレビのオペレーティングシステムを記憶するために使用される。少なくとも1つの実施形態では、RAMなどの高速な外部の動的揮発性メモリは、MPEG-2(MPEGはMoving Picture Experts Groupを指し、MPEG-2はまたISO/IEC13818を指し、13818-1はまたH.222として既知であり、13818-2はまたH.262として既知である)、HEVC(HEVCはHigh Efficiency Video Codingを指し、H.265及びMPEG-H Part2はまた既知である)、又はVVC(Joint Video Experts Team(JVET)によって開発中の新しい標準である多用途ビデオコーディング)などのビデオのコーディング動作及び復号動作のための作業メモリとして使用される。
【0031】
システム100の要素への入力は、ブロック105に示されるように、様々な入力デバイスを通して提供され得る。このような入力デバイスには、(i)例えば、放送事業者による放送全体にわたり送信されるRF信号を受信する無線周波数(Radio Frequency、RF)部分、(ii)コンポーネント(Component、COMP)入力端子(又はCOMP入力端子セット)、(iii)ユニバーサルシリアルバス(Universal Serial Bus、USB)入力端子、及び/又は(iv)高精細度マルチメディアインターフェース(High Definition Multimedia Interface、HDMI)入力端子が含まれるが、これらに限定されない。他の実施例には、図1には示されていないが、コンポジットビデオが含まれる。
【0032】
様々な実施形態では、ブロック105の入力デバイスは、当該技術分野で既知であるように、関連するそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択する(信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートする、(iii)特定の実施形態で、(例えば)チャネルと称され得る信号周波数帯域を選択するために、再びより狭い周波数帯域に帯域制限する、(iv)ダウンコンバート及び帯域制限された信号を復調する、(v)誤り訂正を実施する、及び(vi)データパケットの所望のストリームを選択するために多重分離する、ために適切な要素と関連付けられ得る。様々な実施形態のRF部分は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部分は、これらの様々な機能を実行するチューナを含み得、例えば、受信した信号をより低い周波数(例えば、中間周波数、若しくは近接ベースバンド周波数)に、又はベースバンドにダウンコンバートすることが含まれる。セットトップボックスの一実施形態では、RF部とその関連する入力処理要素は、有線(例えば、ケーブル)媒体上で送信されたRF信号を受信し、フィルタ処理し、ダウンコンバートし、また所望の周波数帯域に再びフィルタ処理することによって、周波数選択を行う。様々な実施形態では、上で説明される(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、並びに/又は、類似若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、既存の要素の間に要素を挿入すること、例えば、増幅器及びアナログ-デジタル変換器を挿入することを含み得る。様々な実施形態において、RF部分は、アンテナを含む。
【0033】
加えて、USB及び/又はHDMI端末は、USB及び/又はHDMI接続全体にわたって、システム100を他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リードソロモン誤り訂正は、例えば、必要に応じて、個別の入力処理IC内又はプロセッサ110内に実装され得ることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて、個別のインターフェースIC内又はプロセッサ110内に実装され得る。復調され、エラー訂正され、逆多重化されたストリームは、例えば、プロセッサ110と、出力デバイス上に提示するために必要に応じてデータストリームを処理するためにメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ130とを含む、様々な処理要素に提供される。
【0034】
システム100の様々な要素は、統合されたハウジング内に提供され得、統合されたハウジング内では、様々な要素は、好適な接続構成115、例えば、I2Cバス、配線、及びプリント回路基板を含む、当該技術分野で既知の内部バスを使用して相互に接続され、互いの間でデータを送信し得る。
【0035】
システム100は、通信チャネル190を介して他のデバイスとの通信を可能にする通信インターフェース150を含む。通信インターフェース150は、限定されるものではないが、通信チャネル190を介してデータを送信及び受信するように構成された送受信機を含み得る。通信インターフェース150は、限定されるものではないが、モデム又はネットワークカードを含み得、通信チャネル190は、例えば、有線及び/又は無線媒体内に実装され得る。
【0036】
データは、様々な実施形態では、IEEE802.11(IEEEは、米国電気電子技術者協会(Institute of Electrical and Electronics Engineers)を指す)などのWi-Fiネットワークを使用して、システム100にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合されている通信チャネル190及び通信インターフェース150上で受信される。これらの実施形態の通信チャネル190は、典型的には、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態では、入力ブロック105のHDMI接続を介してデータを配信するセットトップボックスを使用して、システム100にストリーミングデータを提供する。更に他の実施形態では、入力ブロック105のRF接続を使用して、システム100にストリーミングデータを提供する。上で示されるように、様々な実施形態は、データを非ストリーミングの様式で提供する。追加的に、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラネットワーク又はBluetoothネットワークを使用する。
【0037】
システム100は、出力信号を、ディスプレイ165、スピーカ175、及び他の周辺デバイス185を含む、様々な出力デバイスに提供し得る。様々な実施形態のディスプレイ165は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(organic light-emitting diode、OLED)ディスプレイ、湾曲ディスプレイ、及び/又は折り畳み可能なディスプレイのうちの1つ以上を含む。ディスプレイ165は、テレビ、タブレット、ラップトップ、携帯電話(移動電話)、又は他のデバイス用とすることができる。ディスプレイ165はまた、他のコンポーネントと統合され得るか(例えば、スマートフォンのように)、又は別個に(例えば、ラップトップのための外部モニタ)することができる。他の周辺デバイス185としては、実施形態の様々な実施例において、スタンドアロンデジタルビデオディスク(digital video disc)(又はデジタル多用途ディスク(digital versatile disc))(両方の用語に対して、DVR)、ディスクプレーヤ、ステレオシステム、及び/又は照明システム、のうちの1つ以上が挙げられる。様々な実施形態は、システム100の出力に基づいて機能を提供する1つ以上の周辺デバイス185を使用する。例えば、ディスクプレーヤは、システム100の出力を再生する機能を実行する。
【0038】
様々な実施形態では、制御信号は、AV.Link、CEC、又はユーザ介入あり若しくはユーザ介入なしでデバイス間制御を可能にする他の通信プロトコルなどのシグナリングを使用して、システム100とディスプレイ165、スピーカ175、又は他の周辺デバイス185との間で通信される。出力デバイスは、それぞれのインターフェース160、170、及び180を通じた専用接続を介してシステム100に通信可能に結合され得る。代替的に、出力デバイスは、通信インターフェース150を介し、通信チャネル190を使用して、システム100に接続され得る。ディスプレイ165及びスピーカ175は、例えば、テレビなどの電子デバイスにおいて、システム100の他のコンポーネントとともに単一ユニットに統合され得る。様々な実施形態では、ディスプレイインターフェース160は、ディスプレイドライバ、例えば、タイミングコントローラ(timing controller、TCon)チップを含む。
【0039】
ディスプレイ165及びスピーカ175は、代替的に、例えば、入力105のRF部分が個別のセットトップボックスの一部である場合、他のコンポーネントのうちの1つ以上から分離され得る。ディスプレイ165及びスピーカ175が外部コンポーネントである様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む、専用の出力接続を介して提供され得る。
【0040】
実施形態は、プロセッサ110によって、又はハードウェアによって、又はハードウェアとソフトウェアとの組み合わせによって、実装されるコンピュータソフトウェアによって行うことができる。非限定的な例として、1つ以上の集積回路によって実施形態を実装することができる。メモリ120は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、及びリブ-バブルメモリなどの相応しいいかなるデータストレージ技術を使用しても実装することができる。プロセッサ110は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、特殊目的コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含することができる。
【0041】
図2は、エンコーダ200を示す。このエンコーダ200の変形形態も企図されるが、以下では、分かりやすいように、予想される全ての変形形態を説明せずに、エンコーダ200について説明される。
【0042】
いくつかの実施形態では、図2はまた、HEVC規格に改良を加えたエンコーダ、又はJVET(Joint Video Exploration Team)によって開発中のVVC(Versatile Video Coding)エンコーダなど、HEVCに類似する技術を採用したエンコーダを示す。
【0043】
符号化される前に、ビデオシーケンスは、符号化前処理(201)、例えば、カラー変換を入力カラーピクチャに適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、又は圧縮に対してより弾力的な信号分布を得るために入力ピクチャ成分の再マッピングを実行する(例えば、色成分のうちの1つのヒストグラム等化を使用して)ことを経得る。メタデータは、前処理に関連付けられ、ビットストリームに添付され得る。
【0044】
エンコーダ200では、以下に記載のように、ピクチャは、エンコーダ要素によって符号化される。符号化されるピクチャは、例えば、CUという単位に分けられ(202)、処理される。各ユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化される。ユニットがイントラモードで符号化されるとき、そのユニットは、イントラ予測(260)を実行する。インターモードでは、動き推定(275)及び動き補償(270)が実行される。エンコーダは、ユニットを符号化するためにイントラモード又はインターモードのうちのどちらを使用すべきかを決定し(205)、例えば、予測モードフラグによってイントラ/インターの決定を示す。エンコーダはまた、イントラ予測結果とインター予測結果を混合(263)してもよいし、又は異なるイントラ/インター予測方法からの結果を混合してもよい。予測残差は、例えば、元の画像ブロックから予測されたブロックを減算することによって(210)計算される。
【0045】
動き改良モジュール(272)は、元のブロックを参照せずにブロックの動きフィールドを改良するために、既に利用可能な参照ピクチャを使用する。ある領域についての動きフィールドは、その領域を有する全てのピクセルについての動きベクトルの集合とみなすことができる。動きベクトルがサブブロックベースである場合、動きフィールドは、領域内の全てのサブブロック動きベクトルの集合として表すこともできる(サブブロック内の全てのピクセルは同じ動きベクトルを有し、動きベクトルはサブブロックごとに異なり得る)。単一の動きベクトルが領域に対して使用される場合、領域に対する動きフィールドもまた、単一の動きベクトル(領域内の全てのピクセルに対して同じ動きベクトル)によって表すことができる。
【0046】
その予測残差は、次いで、変換され(225)、量子化される(230)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素は、ビットストリームを出力するためにエントロピコーディングされる(245)。エンコーダは、変換をスキップし、量子化を非変換残差信号に直接適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち、残差は、変換プロセス又は量子化プロセスを適用することなく直接コーディングされる。
【0047】
エンコーダは、符号化されたブロックを復号して、更なる予測のための参照を提供する。量子化された変換係数は、予測残差を復号するために逆量子化され(240)、逆変換される(250)。復号された予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構成される。ループ内フィルタ(265)は、例えば、符号化アーチファクトを低減するための非ブロック化/サンプル適応オフセット(Sample Adaptive Offset、SAO)フィルタリングを実行するために、再構成されたピクチャに適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
【0048】
図3は、ビデオデコーダ300のブロック図を示す。デコーダ300では、以下に説明する通り、ビットストリームが、デコーダ要素によって復号される。ビデオデコーダ300は、図2に記載するように、一般に、符号化パスとは逆の復号パスを実行する。エンコーダ200もまた、概して、ビデオデータを符号化することの一部としてビデオ復号を実行する。
【0049】
特に、デコーダの入力は、ビデオビットストリームを含み、これは、ビデオエンコーダ200によって生成され得る。ビットストリームは、まず、変換係数、動きベクトル、及び他のコーディングされた情報を取得するために、エントロピ復号される(330)。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。デコーダは、したがって、復号されたピクチャ分割情報に従ってピクチャを分割し得る(335)。変換係数は、予測残差を復号するために、逆量子化され(340)、逆変換される(350)。復号された予測残差と予測されたブロックとを組み合わせて(355)、画像ブロックが再構成される。
【0050】
イントラ予測(360)又は動き補償予測(すなわち、インター予測)(375)から、予測ブロックを得ることができる(370)。デコーダは、イントラ予測結果とインター予測結果を混合(373)してもよいし、又は複数のイントラ/インター予測方法からの結果を混合してもよい。動き補償の前に、動きフィールドは、既に利用可能な参照ピクチャを使用することによって改良され得る(372)。ループ内フィルタ(365)は、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(380)に記憶される。
【0051】
復号されたピクチャは、復号後処理(385)、例えば、逆カラー変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)、又は符号化前処理(201)において実行された再マッピングプロセスの逆を実行する逆再マッピングを更に経ることができる。復号後処理は、符号化前処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用することができる。
【0052】
参照ピクチャのリサンプリング
低ビットレートで、及び/又はピクチャが高周波数をほとんど有さないとき、より良好なコーディング効率トレードオフのために、典型的には4K又は8Kフレームの場合、フル解像度ではなく、ダウンサイズされたピクチャを符号化することができる。復号されたピクチャを表示前にアップスケールすることをデコーダに担当させる。参照ピクチャリサンプリング(Reference Picture Re-sampling、RPR)の原理は、より良いコーディング効率のトレードオフのために、ピクチャベースでビデオシーケンスの画像を動的にリスケーリングすることである。
【0053】
図4及び図5は、符号化する画像を符号化のためにリスケーリングすることができる一実施形態によるビデオをそれぞれ符号化(400)及び復号(500)する方法の例を示す。例えば、そのようなエンコーダ及びデコーダは、VVC規格に準拠することができる。
【0054】
サイズ(picWidth×picHeight)のピクチャから構成される元のビデオシーケンスが与えられると、エンコーダは、元のピクチャごとに、フレームをコーディングするための解像度(すなわち、ピクチャサイズ)を選択する。異なるPPS(Picture Parameter Set)は、ピクチャのサイズを有するビットストリームにおいてコーディングされ、復号するピクチャのスライス/ピクチャヘッダは、ピクチャを復号するためにデコーダ側でどのPPSを使用するかを示す。
【0055】
前処理又は後処理としてそれぞれ使用されるダウンサンプラ(440)及びアップサンプラ(540)機能は、規格によって指定されていない。
【0056】
各フレームについて、エンコーダは、元の解像度で符号化するか、ダウンサイズされた解像度(例えば、ピクチャの幅/高さを2で割ったもの)で符号化するかを選択する。この選択は、2パス符号化を用いて、又は元のピクチャにおける空間的及び時間的アクティビティを考慮して行うことができる。
【0057】
エンコーダがダウンサイズされた解像度で元のピクチャを符号化することを選択するとき、元のピクチャは、ビットストリームを生成するためにコアエンコーダ(410)に入力される前にダウンスケールされる(440)。次に、ダウンスケールされた解像度で再構成されたピクチャは、後続のピクチャをコーディングするために復号されたピクチャバッファ(decoded picture buffer、DPB)に記憶される(420)。その結果、復号されたピクチャバッファ(DPB)は、現在のピクチャサイズとは異なるサイズのピクチャを含むことができる。
【0058】
デコーダでは、ビットストリームからピクチャが復号され(510)、ダウンスケールされた解像度で再構成されたピクチャが、後続のピクチャを復号するために復号されたピクチャバッファ(DPB)に記憶される(520)。一実施形態によれば、再構成されたピクチャは、その元の解像度にアップサンプリングされ(540)、例えばディスプレイに送信される。
【0059】
一実施形態によれば、符号化される現在のピクチャが、現在のピクチャとは異なるサイズを有するDPBからの参照ピクチャを使用する場合、予測ブロックを構築するための参照ブロックのリスケーリング(430/530)(アップスケール又はダウンスケール)は、分離可能な(水平及び垂直)補間フィルタ及び適切なサンプリングを用いて動き補償プロセス中に(オンザフライで)行われる。図6は、上で考察した符号化方法及び復号方法のリスケーリング(430/530)において実装することができる暗黙的ブロックリサンプリングを伴う動き補償の一例を示す。フィルタ係数の選択は、位相(θ,θ)(参照ピクチャ内の補間すべきサンプルの位置)に依存し、この位相は、この場合(式1)(図6)、動きベクトルと、参照ピクチャ(図6の620)(SXref,SYref)及び現在ピクチャ(図6の610)(SXcur,SYcur)の両方のサイズとの両方に依存する。
【0060】
サイズ(SXcur,SYcur)の現在のブロック予測P(610)を予測するために、Pの各サンプルXcurについて、参照ピクチャ内のその位置(Xref,Yref)が判定される。(Xref,Yref)の値は、現在のブロックの動きベクトル(MVx,MVy)と、現在のブロックサイズと参照ピクチャ内の対応する領域(SXref,SYref)との間のスケーリング比との関数である(620)。
【0061】
図6に示されているように、参照ピクチャ内の動き補償された点(Xref,Yref)の非整数部分である位相を(θx,θy)と表す。位置(Xref,Yref)及び位相(θx,θy)は、以下の式によって与えられる。
Xref=int(SXref×(MV+Xcur)/SXcur)
Yref=int(SYref×(MV+Ycur)/SYcur) (式1)
θ=(SXref×(MV+Xcur)/SXcur)-Xref
θ=(SYref×(MV+Ycur)/SYcur)-Yref
int(x)はxの整数部分を与える。
【0062】
一実施形態では、動き補償(motion compensation、MC)は、計算量を低減するために2つの別個の1Dフィルタを使用する(図7)。MCプロセスは、図8図9、及び図10に示されるように、2段階で実行され、すなわち、第1の水平(820、900)及び次の垂直(840、1000)の動き補償フィルタリングであり、又は一変形形態では、垂直動き補償フィルタリングを最初に実行し、水平動き補償フィルタリングを次に実行することができる。
【0063】
図8は、一実施形態による、2段階動き補償フィルタリングの一例を示す。参照ピクチャ内のブロック位置(Xref,Yref)及び位相(θx,θy)は、現在のピクチャ内のブロック位置(XCur,YCur)及び現在のブロックの動きベクトル(MVx,MVy)から判定される(810)。一実施形態によれば、水平方向に沿ってアップスケーリングされた動き補償サンプルを判定するために、1Dフィルタによる水平フィルタリング(図9に示す)が実行される(820、940)。
【0064】
一実施形態では、動きベクトルがサブペル精度を有するので、サブペル位置(位相)の数と同じ数の1Dフィルタが存在する。図7は、動き補償されたサンプルXcurの位相に依存してフィルタの係数w(i)がどのように判定されるかを示す。再構成されたサンプル「rec」は、1Dフィルタリングを用いて以下のように計算される。
【0065】
【数1】
【0066】
再構成されたサンプルは、同じサイズ(SXcur,SYref)の一時バッファ(図9の930)に記憶される(830)。次いで、垂直方向に沿ってアップスケーリングされた動き補償サンプルを判定するために、入力として一時バッファを使用して、図10に示すように、1Dフィルタを用いて垂直フィルタリングが実行される(840)。
【0067】
最初の垂直フィルタリングと次の水平フィルタリングは別々のフィルタであるので、これらを行うこともできることに留意されたい。
【0068】
得られた予測サンプルは、サイズ(SXcur,SYcur)のブロック(1050)に記憶される(850)。
【0069】
上記の説明では、現在のピクチャ及び参照ピクチャが同じウィンドウに対応することを考察した。これは、動きが0である場合、2つのピクチャの左上及び右下のサンプルが2つの同じシーン点に対応することを意味する。そうでない場合、オフセットウィンドウパラメータを(Xref,Yref)に追加すべきである。
【0070】
上述の暗黙的リサンプリングを伴う動き補償は、古典的動き補償のために設計された補間フィルタ、例えば、VVC規格において使用される補間フィルタを再使用することを可能にする。また、このプロセスは、いくつかの解像度で参照ピクチャを記憶する必要性を回避する。しかしながら、アップサンプリングフィルタの単純さは、エンコーダの圧縮効率を制限する。したがって、改善の必要性がある。
【0071】
一実施形態では、第1のピクチャの少なくとも一部分を第2のピクチャの少なくとも一部分から再構成するための方法であって、第1のピクチャ及び第2のピクチャが異なるサイズを有する、方法が提供される。例えば、第2のピクチャは、第1のピクチャよりも小さい解像度を有する。この実施形態によれば、第1のピクチャの部分を再構成することは、ビットストリームから第2のピクチャを復号することと、復号された第2のピクチャの当該少なくとも一部分の少なくとも1つの第2のサンプルに適用される少なくとも1つのアップサンプリングフィルタを使用して、第1のピクチャの当該少なくとも一部分の少なくとも1つの第1のサンプルを判定することと、を含む。
【0072】
一実施形態では、再構成するための方法は、第1のピクチャの再構成された当該少なくとも一部分をディスプレイに送信することを含む。一実施形態では、以下に提供される再構成方法のステップは、図5を参照して説明される復号のための方法(510、540)において実施することができる。
【0073】
一実施形態によれば、再構成するための方法は、符号化方法又は復号方法において実実施することができる。第1のピクチャの少なくとも一部分は、以下で説明されるように、第2のピクチャを復号し、第2のピクチャの少なくとも一部分をアップサンプリングすることから取得される。第1のピクチャの再構成された少なくとも一部分は、次いで、第1のピクチャと同じサイズ又は異なるサイズの後続のピクチャをコーディング/復号するときに参照ピクチャとして将来使用するために、復号されたピクチャバッファに記憶される。
【0074】
以下では、フィルタパラメータが判定されるいくつかの実施形態が提供される。フィルタパラメータは、アップサンプリングフィルタ係数と、関連するタップ場所(形状)と、場合によってはフィルタを識別するためのインデックスと、を含む。以下に提供される実施形態のうちのいずれか1つは、上記に提供されるピクチャを再構成するための方法、符号化するための方法、及び/又は復号するための方法において、単独で、又は他の実施形態のうちのいずれか1つ以上と組み合わせて実装することができる。
【0075】
一実施形態によれば、アップサンプリングフィルタは分離可能ではない。この実施形態では、アップサンプリングフィルタは、1Dフィルタを用いた2ステップアップサンプリングによって処理することができない。フィルタは線形又は非線形であってもよい。
【0076】
別の実施形態によれば、アップサンプリングフィルタ係数は、ビットストリームにおいてコーディングされる。一変形形態では、アップサンプリングフィルタ係数は、参照ピクチャ及び現在のピクチャが同じサイズを有する場合であってもコーディングすることができる。ビットストリームでは、元のピクチャ(アップサンプリング後)のサイズがコーディングされる。元のピクチャのサイズは、アップサンプリングフィルタに関連付けられたパラメータとすることができる。アップサンプリングフィルタ係数及び/又は元のサイズは、例えば、APS(例えば、Adaptive Loop Filter(適応ループフィルタ)係数を送信するためにVVC規格において使用されるAdaptation Parameter Set(適応パラメータセット))、スライスヘッダ、ピクチャヘッダ、又はPPSにおいてコーディングされ得る。ビットストリームにおいてコーディングされていないアップサンプリングフィルタ係数のデフォルト値が存在し得る。
【0077】
フィルタ係数は、ピクチャごとに、1つのピクチャ内の領域ごとに、いくつかのピクチャのグループごとに、又は異なるピクチャ内のいくつかの領域ごとに導出され得る。
【0078】
図12は、ある実施形態によるアップサンプリングフィルタを判定するための方法1200の一例を示す。いくつかのアップサンプリングフィルタを利用可能とすることができる。使用するアップサンプリングフィルタの選択は、分類プロセスによって制御され得る。
【0079】
一変形形態によれば、アップサンプリングが現在のピクチャを予測するための動き補償のループ内であるとき、現在のピクチャによって使用される参照ピクチャのアップサンプリングは、参照ピクチャの解像度が現在のピクチャよりも小さいという判定(1210)に応答して実行される。
【0080】
分類プロセスは、各参照サンプル又は参照サンプルのグループ(例えば、4×4サンプルのグループ)についてクラスインデックスを判定する(1220)。1つのフィルタは、1つのクラスインデックスに関連付けられる。補間する領域を示す図14Aの例では、黒いサンプルは、クラスインデックスが判定された参照サンプルと、補間するサンプル(1,2,3)の例とを示す。
【0081】
アップサンプリングされたピクチャにおいて補間するごとに、対応する同一場所にある参照サンプルのセットが判定される。例えば、図14Aは、補間するサンプル3に関連付けられた同一場所にある参照サンプル(破線ボックス内の黒色サンプル)の例を示す。補間するサンプルの同一場所にある参照サンプルに関連付けられたクラスインデックスは、補間するサンプルについて1つの単一のクラスインデックス値を導出することを可能にする。例えば、それは、補間する現在のサンプルと最も近い同一場所にある参照サンプルのクラスインデックス値、又はいくつかの同一場所にある参照サンプルのクラスインデックス値の所定の相対位置若しくは平均/中央値とすることができる。
【0082】
補間するサンプルごとに、補間するサンプルについて導出されたクラスインデックスに基づいてアップサンプリングフィルタが選択される(1230)。アップサンプリングする参照ピクチャの参照サンプルに対して、又は表示のためのアップサンプリングの場合には復号されたピクチャの参照サンプルに対して、分類が実行されるので、補間する各サンプルのアップサンプリングフィルタを判定するために使用されるクラスインデックス値は、コーディングされる必要がない。
【0083】
次いで、アップサンプリングフィルタを適用して(1240)、補間するサンプルの値を判定する。
【0084】
実施形態によれば、分類プロセス(1220)は、VVC規格における適応ループフィルタ(Adaptive Loop Filter、ALF)において使用されるものと同様とすることができる。再構成されたサンプル「t(r)」は、K個のクラス(ルーマサンプルの場合はK=25、クロマサンプルの場合はK=8)に分類され、各クラスのサンプルを用いてK個の異なるフィルタが判定される。分類は、局所勾配を用いて導出された方向性(Directionality)値及びアクティビティ(Activity)値を用いて行われる。
【0085】
上記の方法1200は、例えば、ピクチャがダウンスケールされたバージョンで符号化され、ダウンスケールされたバージョンで復号され、出力のために、例えばディスプレイへの送信のためにアップサンプリングされるときに適用することができる。
【0086】
別の実施形態によれば、方法1200は、ピクチャをダウンサンプリングするために使用することができるダウンサンプリングフィルタを判定するために使用することもできる。例えば、ピクチャのダウンサンプリングは、ピクチャがダウンスケールされたバージョンで符号化されるとき、その符号化の前に実行することができる。
【0087】
図13は、一実施形態によるピクチャを符号化/復号するための方法の一例を示す。この実施形態によれば、現在のピクチャを、インター予測を使用してコーディング又は復号するかどうかを判定する(1305)。
【0088】
現在のピクチャを、インター予測を使用してコーディング/復号しない場合、ピクチャを、例えばイントラ予測を使用して符号化/復号する(1340)。
【0089】
現在ピクチャを、インター予測を使用してコーディング/復号する場合、参照ピクチャの解像度が現在ピクチャの解像度より小さいか否かが判定される(1310)。そうでない場合、現在のピクチャを、DPBに記憶された参照ピクチャを使用してコーディング/復号する(1340)。参照ピクチャが現在のピクチャよりもサイズが大きい場合には、現在のピクチャの符号化/復号時に、VVC規格から通常のRPR(Reference Picture Resampling)動き補間プロセスでダウンスケーリングを行う。
【0090】
参照ピクチャが現在のピクチャよりもサイズが小さい場合には(1310)、本明細書で提案される実施形態のいずれか1つに従って判定されたアップサンプリングフィルタでアップスケーリング(1320)を行う。フィルタを用いたアップサンプリングは、現在のピクチャを符号化/復号するとき(1340)、動き補償プロセス内で、オンザフライで行われてもよく、又は、DPBの参照ピクチャが、現在のフレームをコーディング/復号する(1340)前にアップスケーリングされ(1320)、DPBに記憶されてもよい(1330)。
【0091】
この最後の場合、DPBは、異なる解像度の参照ピクチャのいくつかのインスタンスを含むことができ、動き補償は、RPRなしの符号化/復号(1340)と比較して変わらない。
【0092】
一実施形態によれば、アップサンプリングフィルタは、ウィーナーベースの適応フィルタ(Wiener-based adaptive filter、WF)である。例えば、係数は、VVC規格におけるALFの係数と同様の方法で判定される。
【0093】
VVCでは、ループ内ALFフィルタ(適応ループフィルタリング)は線形フィルタであり、その目的は、再構成されたサンプルに対するコーディングアーチファクトを低減することである。係数cは、ウィーナーベースの適応フィルタ技法を使用することによって、元のサンプルs(r)とフィルタリングされたサンプルt(r)との間の平均二乗誤差を最小化するように判定される。
【0094】
【数2】
ここで、
r=(x,y)は、フィルタリングする領域「R」に属するサンプル場所である。
元のサンプル:s(r)
フィルタリングするサンプル:t(r)
N個の係数を有するFIRフィルタ:c=[c,...cN-1
フィルタタップ位置オフセット:{p,p,...pN-1}、ここでpは、n番目のフィルタタップのrに対するサンプル場所オフセットを示す。タップ位置のセットは、フィルタ「形状」と呼ぶこともできる。
フィルタリングされたサンプル:f(r)
【0095】
s(r)とf(r)との間の最小二乗和誤差(sum of squared error、SSE)を求めるために、cに対するSSEの導関数を判定し、その導関数を0に等しくすることができる。次に、係数値「c」は、次式を解くことによって得られる。
[Tc].c=v (式3)
ここで、
【0096】
【数3】
【0097】
VVCにおいて、ALFの係数は、それらがビデオコンテンツに動的に適応することができるように、ビットストリームにおいてコーディングされ得る。いくつかのデフォルト係数もあり、エンコーダは、CTUごとにどの係数のセットを使用するかを示す。
【0098】
VVCでは、図11の上部に示されるように、対称フィルタが使用され、図11の下部に示されるように、いくつかのフィルタは、回転によって他のフィルタから取得され得る。図11の上部に示されるフィルタ内の各係数は、1つ又は2つの位置p(x,y)に関連付けられる。例えば、c9及びc3の位置をp9(0,0)及びp3(0,-1)又はp3(0,1)と表す。対角変換の場合、位置p(x,y)はp(y,x)に移動され、垂直反転変換の場合、位置p(x,y)はp(-x,y)に移動され、回転の場合、位置p(x,y)はp(y,-x)に移動される。
【0099】
一実施形態によれば、ALF係数を判定するための上記の方法は、アップサンプリングフィルタ係数を判定するために使用される。
【0100】
一実施形態によれば、アップサンプリング位相ごとに少なくとも1つのWFを有し得る。補間するサンプルの位相は、使用するアップサンプリングフィルタを判定することを可能にする(1230)。図14Aに示される例は、水平及び垂直方向に2つでアップサンプリングすることに対応する。黒い点は、復号されたピクチャ(表示のためにアップサンプリングするための参照ピクチャ又は復号されたピクチャのいずれか)の再構成されたサンプルt(r)であり、白い点は、補間するサンプルf(r’)(欠落サンプル)に対応する。そして、「r’」は「r」と異なることができる。この例では、3つの位相{0,1,2,3}がある。位相0は、再構成されたサンプル(r’=r)と同じ場所を有する。位相0に対応するWFは省略されてもよい(同一であると推測される)。
【0101】
(式2)は次のように修正される(1240)。
【0102】
【数4】
【0103】
(式3)において、vの式は次のように変形される。
【0104】
【数5】
ここで、r’=(x,y)は、補間する領域「R’」に属するサンプル場所である。
【0105】
変形形態によれば、アップスケールされたピクチャにおける欠落点r(x,y)、すなわち、ダウンスケールされたピクチャにおいて同一場所にない点を有する点のみが補間される。別の変形形態では、全ての位置r(x,y)が補間され、すなわち、欠落点と、ダウンスケールされたピクチャ内の同一場所にある点とが補間される。
【0106】
一変形形態では、位相のいくつかのサブセットに対応するいくつかのサンプルは、WFフィルタのみで補間され、他の位相は、通常の分離可能な1Dフィルタで補間される。例えば、図14Aにおいて、位相0及び1は、第1のステップにおいてWFを用いて補間され、次の位相2,3は、位相0及び1のフィルタリングされたサンプルを使用して水平1Dフィルタを用いて補間される。又は逆に、位相0及び2はWFで補間され、次の位相1,3は1D垂直フィルタで補間される。
【0107】
図14Aでは、サイズ4×4の正方形フィルタ形状が示されているが、異なる形状を有してもよい。図14B図14Eは、位相3のサンプルを補間するために使用することができる異なる形状を示し、フィルタ形状は、位相3のサンプルを補間するために使用する再構成されたサンプルを表す黒いサンプルによって示されている。
【0108】
図14F及び図14Gは、位相2のサンプルを補間するために使用することができる水平フィルタ形状の他の例を示す。図14Hは、位相1のサンプルを補間するために使用することができる垂直フィルタ形状の別の例を示す。図14Iは、位相3のサンプルを補間するために使用することができる中心フィルタ形状の別の例を示す。
【0109】
形状は、クラス及び/又は位相に依存し得る。ALFと同様に、いくつかの形状/クラスの係数は、他のクラス/形状と同一であり得るが、回転によって取得され得、1つの形状の係数は、対称性によって取得され得る。例えば、図14Bの形状の係数は、90°回転後の図14Cの形状と同じであってもよい。
【0110】
一変形形態では、参照サンプルの分類が行われる(1220)。クラスごとに、異なるアップサンプリングWFが使用される。別の変形形態では、分類は、ALFによって使用される分類と同じとすることができる。
【0111】
図15は、一実施形態による、エンコーダ側で使用するアップサンプリングフィルタ係数を判定するための方法1500の一例を示す。
【0112】
元のピクチャは、ダウンスケーリングされ(1510)、符号化される(1520)。コーディングされたピクチャからの再構成されたサンプルは、クラスごとに分類される(1530)。フィルタ係数F0のセットは、再構成されたピクチャの領域Rについて、例えばCTU又はCTUのグループについて、判定される(1540)。フィルタ係数のセットF0は、F0={g00,g01,...,g0M}でクラス及び位相ごとにアップサンプリングフィルタを備え、ここで、Mは、各クラス及び位相ごとに関連付けられた1つのフィルタがある場合、クラス若しくは位相の数、又はクラス及び位相の組み合わせの数である。セットF0のフィルタは、上で説明したように(式3、式5)を用いて判定される。
【0113】
判定されたアップサンプリングフィルタF0は、式4を使用して、再構成されたピクチャの領域Rのアップサンプリングされた領域Rupのサンプルf0(r’)を得るために適用される(1550)。
【0114】
他のアップサンプリングフィルタFiが同様に適用されて、再構成されたピクチャの領域Rのアップサンプリングされた領域Rupのサンプルfi(r’)を判定し(1555)、ここで、Fi={gi0,gi1,...,giM}及びi={1,...L}であり、ここで、Lは、既に送信された、又はデコーダによって知られているクラス及び/又は位相ごとの可能なフィルタの数である。有利には、歪みは、係数の値及び元のサンプルs(r’)から直接的に導出することができる。
【0115】
クラス/位相のために使用するフィルタの選択は、例えば、レート歪みラグランジュコストを使用して、各クラス/位相sについて、新しいアップサンプリングフィルタg0sをコーディングすることと、デフォルト値若しくは以前に送信されたフィルタ値gis,i={1,...L}を再使用することとの間の最良のトレードオフを見つけることによって判定され得る(1560)。歪みは、アップサンプリングされた再構成された領域と元のピクチャ内の対応する領域との間の差(例えば、L1ノルム又はL2ノルム)である。
【0116】
クラス/位相sについて判定されたフィルタg0sのレート歪みコストがフィルタgisのレート歪みコストのいずれか1つよりも低い場合、フィルタg0sの係数がビットストリームにおいてコーディングされる(1570)。
【0117】
各クラス/位相sについて、最低レート歪みコストを提供するフィルタのインデックスI(i=0...L)が、領域Rのビットストリームにおいてコーディングされる(1580)。
【0118】
いくつかの実施形態では、領域Rは、再構成されたピクチャ内の領域、ピクチャ全体、いくつかのピクチャのグループ、又は異なるピクチャ内のいくつかの領域のグループとすることができる。
【0119】
領域Rに使用するフィルタを判定する方法は、クラス、クラス及び/又は位相ごとに1つのフィルタがある場合について上で説明した。同様の方法は、F0及びFiがそれぞれ1つの単一フィルタを含む場合に適用することができる。
【0120】
一変形形態では、フィルタ係数の判定は、反復最適化アルゴリズム(例えば、勾配降下法)を用いた機械学習によって行われ得る。これは、Rが大きいときにTc及びvの数値制限なしに多くのサンプル/画像について学習するという利点を有し得る。
【0121】
一実施形態によれば、図16及び図17に示すように、コーディングされたピクチャがダウンサンプリングされたピクチャに対応する場合であっても、再構成されたアップサンプリングされたピクチャはDPBに記憶される。この実施形態によれば、DPBは、高解像度の参照ピクチャのみを含む。
【0122】
図16及び図17はそれぞれ、一実施形態による、ビデオを符号化するための方法1600、及びビデオを復号するための方法1700を示す。元のピクチャは、低解像度又は高解像度でコーディングすることができる。
【0123】
元の高解像度ピクチャは、コーディング(1610)の前にエンコーダによってダウンサンプリングされる(1660)。アップサンプリングフィルタ係数は、上述のように導出されてもよく(1640)、再構成されたピクチャは、DPB(1620)に記憶される前にアップサンプリングされる(1650)。次いで、通常のRPR動き補償が適用される(参照ピクチャは高解像度であり、現在のピクチャは低解像度である)(1630)。
【0124】
復号段階では、ダウンスケールされたピクチャがビットストリームから復号され(1710)、アップサンプリングフィルタ係数がビットストリームに存在する場合、アップサンプリングフィルタ係数が復号される(1740)。低解像度の復号されたピクチャは、アップサンプリングされ(1750)、DPBに記憶される(1720)。次いで、通常のRPR動き補償が適用される(参照ピクチャは高解像度であり、現在のピクチャは低解像度である)(1730)。一変形形態では、低解像度の復号されたピクチャはDPBに記憶され、アップサンプリングされた復号されたピクチャは表示のみに使用される。
【0125】
元のピクチャが高解像度でコーディングされる場合、ダウンサンプリング(1660)及びアップサンプリング(1650、1750)はバイパスされる。
【0126】
一変形形態では、アップサンプリングフィルタは所定のデフォルト係数を有し、ステップ1640及び1740は存在しない/バイパスされないことに留意されたい。
【0127】
画像復元のためのポストフィルタリング
ビデオ規格(例えば、HEVC、VVC)では、復元フィルタが、コーディングアーチファクトを低減するために、再構成されたピクチャに適用される。例えば、サンプル適応オフセット(Sample Adaptive Offset、SAO)フィルタは、特にブロック境界におけるアーチファクトを低減するデブロッキングフィルタ(De-Blocking Filter、DBF)を補完して、再構成されたピクチャにおけるリンギング(ringing)及びバンディング(banding)アーチファクトを低減するためにHEVCに導入されている。VVCでは、追加の適応ループフィルタ(ALF)が、ウィーナーベースの適応フィルタ係数を使用して、元のサンプルと再構成されたサンプルとの間の平均二乗誤差を最小化しようと試みる。SAO及びALFは、適用するフィルタを選択するために、再構成されたサンプルの分類を採用する。
【0128】
ALF分類
上で考察したように、ALFは、再構成された画像復元のための特定のポストフィルタである。ALFは、サンプルをK個のクラス(一例として、ルーマサンプルの場合はK=25)又はK個の領域(一例として、クロマサンプルの場合はK=8)に分類し、K個の異なるフィルタが、各クラス又は領域のサンプルを用いて判定される。クラスの場合、ルーマサンプルの分類は、局所勾配を用いて導出された方向性値及びアクティビティ値を用いて行われる。
【0129】
VVCにおいて、ALFの係数は、それらがビデオコンテンツに動的に適応することができるように、ビットストリームにおいてコーディングされ得る。これらの係数は、更なるピクチャのために再使用されるように記憶され得る。いくつかのデフォルト係数もあり、エンコーダは、CTUごとにどの係数のセットを使用するかを示す。
【0130】
VVCでは、対称フィルタが使用され(図11の上部に示されるように)、いくつかのフィルタ係数は、回転によって他のフィルタ係数から取得され得る(図11の下部に示されるように)。
【0131】
動き補償フィルタリング及びSIF
ハイブリッドビデオコーディングにおいて、インター予測は、以前に再構成された参照ピクチャから抽出された参照ブロックの動き補償を用いて現在のブロックを予測する。現在のブロックと参照ブロックとの間の位置の差が動きベクトルである。
【0132】
動きベクトルは、サブペル精度を有し得(例えば、VVCにおいて1/16)、動き補償プロセスは、図6に示すように、参照ピクチャ内の対応するサブペル位置(θ,θ)を有する補間フィルタを選択する。伝統的に、実装の複雑さを低減するために、動き補償補間フィルタリングは、分離可能なフィルタ(1つは水平フィルタ、1つは垂直フィルタ)を用いて行われる。
【0133】
コーディング効率を改善するために、いくつかのサブペル位置について、エンコーダは、いくつかのフィルタの中から選択し、それをビットストリーム中でシグナリングし得る。例えば、VVC規格では、1/2サブペル位置について、2つの補間フィルタ(正規フィルタ又はガウスフィルタ)の間で選択してもよい。このようなツールは、スイッチング補間フィルタ(Switching Interpolation Filter、SIFツール)としても知られている。ガウスフィルタは、通常のフィルタと比較して高周波数を平滑化するローパスフィルタである。
【0134】
ALFポストフィルタリングによれば、フィルタリングするサンプル(又はサンプルのグループ)が事前に分類され、その分類が各サンプル(又はサンプルのグループ)について1つの特定のフィルタ係数セットを選択するために使用されるとき、フィルタリングプロセスにおけるより良い効率が得られる。エンコーダ側では、分類は、ウィーナーベースの適応フィルタ技法(例えば、C.Tsai et al.「Adaptive Loop Filtering for Video Coding,」IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING,VOL.7,NO.6,DECEMBER 2013に記載されているような)を使用することによって、元のサンプル「s(r)」とフィルタリングされたサンプル「t(r)」との間の平均二乗誤差を最小にするフィルタの係数を判定するために使用され得る。
【0135】
しかしながら、サンプルの分類は、サンプルごとの演算の数を著しく増加させる。
【0136】
VVCでは、ALFのみが分類を使用する。SIFツールは、動き補償のためにどのフィルタを使用するかをCUごとにシグナリングするが、予測ユニットの全ての予測サンプルを構築するために同じフィルタが使用される。RPRの場合、参照ブロックサイズと現在のブロックサイズとの間の比を用いてピクチャごとに1つの単一セットのリスケーリング補間フィルタが選択され、全てのサンプルがこの単一フィルタを用いてフィルタリングされる。リスケーリングフィルタのセットは、位相ごとに、使用するフィルタの係数を含む。
【0137】
本原理の一態様によれば、ビデオを符号化/復号するための方法であって、参照ピクチャのサンプル分類が、ビデオのピクチャのブロックを予測するときに少なくとも1つの動き補償補間フィルタを選択するために使用される、方法が提供される。
【0138】
一実施形態によれば、補間する必要がある参照ピクチャからの各サンプル又はサンプルの各グループについて、(参照ピクチャに対して実行される分類から)サンプルが属するクラスが判定される。次いで、このクラスに関連付けられた補間フィルタが選択され、サンプルは、選択されたフィルタの係数を使用してフィルタリングされる。
【0139】
本原理の別の態様によれば、ビデオを符号化/復号するための方法であって、再構成されたピクチャのサンプル分類がエンコーダ/デコーダの異なる符号化/復号モジュール間で共有される、方法が提供される。例えば、参照ピクチャが分類され、次いで、その分類は、リサンプリングフィルタリング又は動き補償補間フィルタリングなど、参照ピクチャを使用する新しいピクチャの符号化/復号動作中に使用される少なくとも1つのフィルタを選択するために使用される。
【0140】
別の実施例によれば、再構成されたピクチャが分類され、次いで、その分類は、ポストフィルタリング及び/若しくは表示のためのリサンプリングなどの再構成されたピクチャに対する符号化/復号動作中に、並びに/又はリサンプリングフィルタリング若しくは動き補償補間フィルタリングなどの再構成されたピクチャを参照ピクチャとして使用する新しいピクチャの符号化/復号動作中に、使用される少なくとも1つのフィルタを選択するために使用される。例えば、これは、サンプル(又はサンプルのグループ)ごとに行うことができ、サンプル(又はサンプルのグループ)分類は、このサンプル(又はサンプルのグループ)で使用されるフィルタを選択することを可能にする。
【0141】
従来、フィルタはいくつかの係数を含み、各係数は、フィルタリングされている現在のサンプルの隣接サンプルに適用され、隣接サンプルは、選択されたフィルタ形状に従って判定され、フィルタ形状の例が図11に示されている。
【0142】
一実施形態によれば、任意の符号化/復号モジュール間で分類を共有するために、分類の結果は、参照ピクチャを記憶する復号されたピクチャバッファ(DPB)など、符号化/復号モジュールのうちのいずれか1つによってアクセス可能な共通空間に記憶される。
【0143】
本原理によれば、フィルタ選択のためのサンプル分類の能力は、複雑さを比較的小さく保ちながら、動き補償補間フィルタ及びリサンプリングフィルタに活用される。これは、復元フィルタ(例えば、ALF又はバイラテラルフィルタ)、MCフィルタリング、リサンプリングフィルタといった、いくつかのフィルタリング目的のためにサンプル分類を共有することによって行われる。一実施形態では、分類は、DPBに記憶され得る。
【0144】
エンコーダにおいて、再構成されたサンプルの分類は、サンプルのクラスごとに特化されたフィルタを導出することを可能にする。これは、例えばウィーナーベースの適応フィルタ係数を使用して、元のサンプルと1つのクラスに属する再構成されたサンプルとの間の平均二乗誤差を最小化することによって行うことができる。
【0145】
次に、デコーダ側において、使用するフィルタの選択は、分類プロセスによって制御される。例えば、分類プロセスは、各サンプルについてクラスインデックスを判定し、1つのフィルタが1つのクラスインデックスに関連付けられる。
【0146】
いくつかの変形形態では、分類は、サンプルごとではなくサンプルのグループごとに行われる。例えば、サンプルのグループは2×2領域である。
【0147】
補間フィルタの分類
図18は、一実施形態による、ビデオを符号化又は復号するための方法1800を示す。この実施形態によれば、クラスインデックスごとに補間フィルタを含む補間フィルタのセットが定義される。補間フィルタは、ALFフィルタの場合と同じ方法で判定することができ、新しい補間フィルタの係数は、コンテンツに適応する必要があるときにデコーダに送信することができる。
【0148】
参照ピクチャがプロセスに入力される。参照ピクチャのサンプルが分類される(1810)。次いで、1820において、ブロックの動き補償が、符号化又は復号する現在のブロックに対する予測を判定するために実行される。
【0149】
符号化又は復号するビデオのブロックについて、動きベクトルが取得される。動きベクトルは、ブロックを予測するために参照ピクチャの一部分又はブロックを判定することを可能にする。
【0150】
動きベクトルがサブサンプル場所を指すとき、図6に示すように、参照ピクチャの動き補償された部分のサンプルは、予測のためのブロックサンプルを判定するために補間される必要がある。本原理によれば、各サブサンプルに使用される補間フィルタは、分類に基づいて判定される(1830)。
【0151】
したがって、ブロックの予測は、参照ピクチャの補間されたサンプルとして判定される(1840)。
【0152】
一実施形態によれば、補間フィルタ(1830)を判定するために、参照ピクチャの動き補償された部分の各サンプルについて、クラスインデックスが、例えば、参照ピクチャ内のサンプル場所における1つ以上の隣接サンプルに関連付けられた1つ以上のクラスインデックスから判定される。次いで、サブサンプルごとに補間フィルタが選択され、サブサンプルについて判定されたクラスインデックスを使用して補間される。次いで、参照ピクチャの動き補償された部分の各サブサンプルを、このサブサンプルに対して選択された補間フィルタで補間することによって、ブロックの予測が生成される(1840)。最後に、ブロックは、予測を使用して(方法がエンコーダで実施されるかデコーダで実施されるかに応じて)符号化又は復号される(1850)。符号化時に、元のブロックとその予測との間で残差が判定され、コーディングされる。復号時に、その残差が復号され、ブロックを再構成するために予測に加えられ、ブロックの予測は、エンコーダの場合と同じプロセスで生成される。
【0153】
本原理の別の態様によれば、同じサンプル分類が、エンコーダ又はデコーダの符号化/復号モジュール間で共有される。フィルタのセットは、動き補償補間、リサンプリング、ALFなど、フィルタを使用する符号化又は復号動作の種類ごとに定義される。
【0154】
補間及びリサンプリングフィルタに対する同じ分類
図19は、別の実施形態によるビデオを符号化又は復号するための方法1800の一例を示す。動き補償(MC)補間(1940)フィルタ及びリサンプリング(1930)フィルタの両方に対するフィルタ選択のためのサンプル分類の能力を活用するために、参照ピクチャ(19810)の共通分類を実行及び使用することができる。
【0155】
有利には、分類は、再構築されたピクチャ全体に対して行われ、各サンプルの分類は、動き補償補間フィルタ及びリサンプリングフィルタプロセスによって使用することができるように記憶される(1920)。リサンプリングがMCプロセス(1950)内で暗黙的に行われる場合、分類はMCに直接的に入力される。
【0156】
一実施形態によれば、分類は、他のプロセスによって再使用することができるように、参照ピクチャとともにDPBに記憶される。
【0157】
補間、リサンプリングフィルタ、及びポストフィルタリングに対する同じ分類
図20は、別の実施形態によるビデオを符号化又は復号するための方法2000の一例を示す。この変形形態において、分類(2030)は、復元フィルタ(ポストフィルタ(PF)としても知られる)(例えば、ALF)(2050)を適用する前に、再構成されたピクチャに対して実行される。次いで、分類は、ポストフィルタ(例えば、ALF)のフィルタ係数を導出するためにエンコーダによって使用され得る(2040)。分類は、ポストフィルタリング(2050)によって使用されるフィルタを選択するために使用される。有利には、この分類は、単一の分類段階(2030)のみが行われるように、リサンプリングフィルタリング又は動き補償補間フィルタリングによっても使用される。この変形形態では、他のプロセス(例えば、リサンプリングフィルタリング又は動き補償補間フィルタリング)は、復元フィルタ(ポストフィルタリング)を適用する前に行われる分類を使用するが、他のプロセスは、(ポストフィルタリングを適用した後に)復元されたピクチャサンプルを使用することに留意されたい。
【0158】
実施形態によれば、分類は、他のプロセスによって再利用できるように、DPB(2020)に記憶されてもよい。一変形形態では、DPBへの記憶は、ピクチャが参照としてのみ使用される場合に行われる(2060)。
【0159】
ループ外リサンプリング
RPRの場合、復号されたピクチャのリサンプリングプロセスは、指定されなくてもよい(図5:540)。図21は、別の実施形態によるビデオを復号するための方法2100の一例を示す。ピクチャは復号され(2110)、復号されたピクチャのサンプルは分類される(2130)。分類に基づいてポストフィルタが適用され(2150)、分類は最終的にDPBに記憶され、復号されたピクチャを参照ピクチャとして使用する他のプロセスに利用可能になる。
【0160】
使用するリサンプリングフィルタ(例えば、アップサンプリング)の選択は、分類プロセス(2130)によって制御され得る。分類プロセスは、各サンプル(又はサンプルのグループ)についてクラスインデックスを判定し、1つのフィルタが1つのクラスインデックスに関連付けられる。フィルタインデックスは、リサンプリングフィルタ(2160)を選択することを可能にする。
【0161】
上述した符号化方法及び復号方法は、ビットストリームにおいてビデオを符号化するため、及びビットストリームからビデオを復号するために、図2及び図3に関連して説明したエンコーダ200及びデコーダ300においてそれぞれ実施することができることを理解されたい。
【0162】
図22に示すある実施形態では、通信ネットワークNETを介した2つのリモートデバイスAとBとの間の送信コンテキストにおいて、デバイスAは、図1図21に関して説明した実施形態のいずれか1つに従ってビデオを符号化する方法を実施するように構成されたメモリRAM及びROMに関連するプロセッサを備え、デバイスBは、図1図21に関して説明した実施形態のいずれか1つに従ってビデオを復号する方法を実施するように構成されたメモリRAM及びROMに関連するプロセッサを備える。
【0163】
一実施例によれば、ネットワークは、デバイスAからデバイスBを含む復号デバイスにビデオを表す符号化データをブロードキャスト/送信するように適合されたブロードキャストネットワークである。
【0164】
デバイスAによって送信されることが意図された信号は、ビデオを表すコーディングされたデータを含む少なくとも1つのビットストリームを搬送する。ビットストリームは、本原理の任意の実施形態から生成されてもよい。
【0165】
図23は、パケットベースの伝送プロトコル上で送信されるそのような信号のシンタックスの一例を示す。各送信パケットPは、ヘッダH及びペイロードPAYLOADを含む。いくつかの実施形態では、ペイロードPAYLOADは、上述した実施形態のいずれか1つに従って符号化された、コーディングされたビデオデータを含み得る。いくつかの実施形態では、信号は、上記で判定されたフィルタ(アップサンプリング、補間)係数を含む。
【0166】
様々な実装形態は、復号することを含む。本出願で使用する際、「復号」は、例えば、ディスプレイに好適な最終出力をもたらすために、受信した符号化されたシーケンスに対して行われるプロセスの全て又は一部を包含することができる。様々な実施形態において、このようなプロセスには、例えば、エントロピ復号、逆量子化、逆変換、及び差動復号など、通常、デコーダによって行われるプロセスのうちの1つ以上が含まれる。様々な実施形態では、そのようなプロセスにはまた、又は代替的に、本出願に記載される、例えば、復号されたピクチャをアップサンプリングするアップサンプリングフィルタ係数を復号するための、様々な実装形態のデコーダによって実施されるプロセスも含まれる。
【0167】
更なる例として、一実施形態では、「復号」とは、エントロピ復号のみを指し、別の実施形態では、「復号」とは、差動復号のみを指し、別の実施形態では、「復号」とは、エントロピ復号と差動復号との組み合わせを指す。「符号化プロセス」という句が、具体的に作業部分集合を指すことを目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0168】
様々な実装形態は、符号化を伴う。「復号(decoding)」に関する上記の考察と同様に、本出願で使用される「符号化(encoding)」は、例えば、符号化されたビットストリームを作り出すために入力ビデオシーケンスに対して実行されるプロセスの全て又は一部を包含することができる。様々な実施形態において、このようなプロセスは、例えば、分割、差動符号化、変換、量子化、及びエントロピ符号化など、エンコーダによって典型的に実行されるプロセスのうちの1つ以上を含む。様々な実施形態では、そのようなプロセスにはまた、又は代替的に、本出願に記載される、例えば、復号されたピクチャをアップサンプリングするアップサンプリングフィルタ係数を判定するための、様々な実装形態のエンコーダによって実施されるプロセスも含まれる。
【0169】
更なる例として、一実施形態では、「符号化」とは、エントロピ符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化とエントロピ符号化との組み合わせを指す。「符号化プロセス」という句が、具体的に作業部分集合を指すこと目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0170】
本明細書で使用する際のシンタックス要素が、説明上の用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
【0171】
本開示は、例えば、送信又は記憶することができるシンタックスなどの様々な情報を説明してきた。この情報は、様々な様式でパッケージ化又は配置することができ、例えば、情報をSPS、PPS、NALユニット、ヘッダ(例えば、NALユニットヘッダ、又はスライスヘッダ)、又はSEIメッセージに入れるなど、ビデオ規格において一般的な様式を含む。他の様式も利用可能であり、例えば、情報を以下のうちの1つ以上に入れるなどのシステムレベル又はアプリケーションレベルの規格において一般的な様式を含む。
【0172】
a.SDP(セッション記述プロトコル(session description protocol))、例えば、RFCに説明され、RTP(リアルタイム輸送プロトコル(Real-time Transport Protocol))送信と連動して使用されるような、セッション告知及びセッション招待の目的のためのマルチメディア通信セッションを記述するためのフォーマット。
b.例えば、DASHで使用され、HTTPを介して送信されるような、DASH MPD(メディアプレゼンテーション記述(Media Presentation Description))記述子、記述子は、コンテンツ表現に追加の特性を提供するために、表現又は表現の集合に関連付けられる。
c.例えば、RTPストリーミング中に使用されるような、RTPヘッダ拡張子。
d.例えば、OMAFで使用され、いくつかの仕様では、「atoms」としても既知である一意のタイプ識別子及び長さによって画定されるオブジェクト指向構築ブロックであるボックスを使用するような、ISOベースメディアファイルフォーマット(ISO Base Media File Format)。
e.HTTPを介して送信されるHLS(HTTPライブストリーミング(HTTP Live Streaming))マニフェスト。マニフェストは、例えば、バージョン又はバージョンの集合の特性を提供するために、コンテンツのバージョン又はバージョンの集合に関連付けることができる。
【0173】
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/プロセスのフローチャートも提供するものと理解されたい。
【0174】
様々な実施形態は、レート歪み最適化を指す。具体的には、符号化プロセス中に、レートと歪みとの間のバランス又はトレードオフは、通常、多くの場合、計算複雑性の制約を与えるものと考えられる。レート歪み最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化される。レート歪み最適化問題を解くには、異なるアプローチがある。例えば、これらのアプローチは、全ての考慮されるモード又はコーディングパラメータ値を含む全ての符号化オプションの広範なテストに基づき得、それらの符号化コスト、並びにコーディング及び復号後の再構成された信号の関連する歪みの完全な評価を伴う。符号化複雑性を抑えるために、特に、再構成された信号ではなく、予測又は予測残差信号に基づく近似歪みの計算とともに、より素早い手法を使用することもできる。考えられる符号化選択肢の一部のみに対して近似歪みを使用し、他の符号化選択肢に対しては完全な歪みを使用することなどによって、これらの2つの手法の混合を使用することもできる。他の手法では、考えられる符号化選択肢部分集合のみを評価する。より一般的には、多くのアプローチは、最適化を実行するために様々な技術のいずれかを採用するが、最適化は、必ずしもコーディングコスト及び関連する歪みの両方の完全な評価ではない。
【0175】
本明細書に記載の実装形態及び態様は、例えば、方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装することができる。たとえ単一の形態の実装形態の文脈でのみ考察される場合でも(例えば、方法としてのみ考察される)、考察された特徴の実装形態は、他の形態(例えば、装置又はプログラム)でも実装することができる。例えば、適切なハードウェア、ソフトウェア、及びファームウェアにおいて装置を実装することができる。この方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサで実装され得る。プロセッサには、例えば、エンドユーザ間の情報の通信を容易にする、コンピュータ、携帯電話、ポータブル/携帯情報端末(Personal Digital Assistant、「PDA」)などのデバイスなどの通信デバイスも含まれる。
【0176】
「一実施形態」若しくは「ある実施形態」又は「一実装形態」若しくは「ある実装形態」、またそれらの他の変形形態への言及は、その実施形態に関連して説明する特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体を通して様々な場所に現れる「一実施形態では」若しくは「ある実施形態では」又は「一実装形態では」若しくは「ある実装形態では」、また他の変形形態という句が現れるとき、必ずしも全てが同じ実施形態を指しているのではない。
【0177】
加えて、本出願は、様々な情報を「判定する」ことに言及し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上を含むことができる。
【0178】
更に、本出願は、様々な情報に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、(例えば、メモリから)情報を取得すること、情報を記憶すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上を含むことができる。
【0179】
加えて、本出願は、様々な情報を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は(例えば、メモリから)情報を取得することのうちの1つ以上を含むことができる。更に、「受信すること」は、一般には、例えば、情報を記憶する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を判定する、情報を予測する、又は情報を推定するなどの操作時に、何らかの形で関与する。
【0180】
例えば、「A/B」、「A及び/又はB(A and/or B)」及び「A及びBのうちの少なくとも1つ(at least one of A and B)」の場合、次の「/」、「及び/又は(and/or)」、及び「のうちの少なくとも1つ(at least one of)」のいずれかの使用は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することが意図されていることを理解されるべきである。更なる実施例として、「A、B、及び/又はC(A,B,and/or C)」及び「A、B、及びCのうちの少なくとも1つ(at least one of A,B,and C)」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は第3のリストされた選択肢(C)のみの選択、又は第1及び第2のリストされた選択肢(A及びB)のみの選択、又は第1及び第3のリストされた選択肢(A及びC)のみの選択、又は第2及び第3のリストされた選択肢のみの選択(B及びC)のみ、又は3つ全ての選択肢の選択(A及びB及びC)を包含することが意図される。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
【0181】
また、本明細書で使用されるとき、「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、複数のアップサンプリングフィルタ係数のうちの特定の1つをシグナリングする。このように、ある実施形態では、同じパラメータが、エンコーダ側でもデコーダ側でも使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信することができる(明確なシグナリング)。これに対し、デコーダが既にその特定のパラメータとともに他のパラメータも有する場合は、単にデコーダがその特定のパラメータを知ること、及びそれを選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。いかなる実際の機能の送信も回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成することができることが理解されよう。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上記は、「信号」という語の動詞形に関連し、「信号」という語は、本明細書では名詞としても使用されることがある。
【0182】
当業者には明白であるように、実装形態は、例えば、記憶され得る、又は送信され得る情報を搬送するようにフォーマットされた様々な信号をもたらすことができる。情報は、例えば、方法を実行するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、記載の実施形態のビットストリームを搬送するように、信号をフォーマットすることができる。例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用して)、又はベースバンド信号として、このような信号をフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化することと、符号化されたデータストリームで搬送波を変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログ情報又はデジタル情報とすることができる。既知であるように、様々な異なる有線リンク又は無線リンク上で信号を送信することができる。信号は、プロセッサ可読媒体に記憶することができる。
【0183】
いくつかの実施形態について述べる。これらの実施形態の特徴は、様々な特許請求の範疇及びタイプにわたって単独でも、いかなる組み合わせでも提供され得る。更に、実施形態は、様々な特許請求の範疇及びタイプにわたって、以下の特徴、デバイス、又は態様のうちの1つ以上を、単独で、又は任意の組み合わせにおいて、含むことができる。
・記載の実施形態のいずれかによる、元のピクチャを高分解能又はより低分解能で符号化することができる、ビデオを符号化/復号すること。
・記載の実施形態のいずれかによる、ダウンスケールされた復号されたピクチャからピクチャを再構成すること。
・記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号。
・記載の実施形態のいずれかに従って生成される情報を運ぶシンタックスを含むビットストリーム又は信号。
・記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号を作り出しかつ/又は送信しかつ/又受信しかつ/又は復号すること。
・記載の実施形態のいずれかによる、作り出することかつ/又は送信することかつ/又は受信することかつ/又は復号すること。
・記載の実施形態のいずれかによる、方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、又は信号。
・記載の実施形態のいずれかによるアップサンプリングでのピクチャの再構成を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・記載の実施形態のいずれかによるアップサンプリングでのピクチャの再構成を実行し、結果として生じる画像を(例えば、モニタ、スクリーン、又は他のタイプのディスプレイを使用して)表示する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・符号化された画像を含む信号を受信するためにチャネルを(例えば、チューナを使用して)選択し、記載の実施形態のいずれかによるアップサンプリングでのピクチャの再構成を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・符号化された画像を含む無線上の信号を(例えば、アンテナを使用して)受信し、記載の実施形態のいずれかによるアップサンプリングでのピクチャの再構成を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・記載の実施形態のいずれかによる、ピクチャの同じ分類が符号化又は復号プロセスの間で共有される、ビデオを符号化/復号すること。
・記載の実施形態のいずれかによる、サブサンプルが補間されるときに補間フィルタを選択するために分類が使用される、ビデオを符号化/復号すること。
・記載のシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号。
・記載の実施形態のいずれかに従って生成される情報を運ぶシンタックスを含むビットストリーム又は信号。
・記載のシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号を作り出すことかつ/又は送信することかつ/又は受信することかつ/又は復号すること。
・記載の実施形態のいずれかによる、作り出すことかつ/又は送信することかつ/又は受信することかつ/又は復号すること。
・記載の実施形態のいずれかによる、方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、又は信号。
・記載の実施形態のいずれかによるピクチャの再構成を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・記載される実施形態のいずれかによるピクチャの再構成を実行し、結果として生じる画像を表示する(例えば、モニタ、スクリーン、又は他のタイプのディスプレイを使用して)表示する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・符号化された画像を含む信号を受信するためにチャネルを(例えば、チューナを使用して)選択し、記載の実施形態のいずれかによるピクチャの再構成を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
・符号化された画像を含む無線上の信号を(例えば、アンテナを使用して)受信し、記載の実施形態のうちのいずれかによるピクチャの再構成を実行する、TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14A
図14B
図14C
図14D
図14E
図14F
図14G
図14H
図14I
図15
図16
図17
図18
図19
図20
図21
図22
図23
【国際調査報告】