IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル シーイー パテント ホールディングスの特許一覧

特表2024-504689ビデオを符号化又は復号化するための方法及び装置
<>
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図1
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図2
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図3
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図4
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図5
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図6
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図7
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図8
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図9
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図10
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図11
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図12
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図13
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図14
  • 特表-ビデオを符号化又は復号化するための方法及び装置 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-01
(54)【発明の名称】ビデオを符号化又は復号化するための方法及び装置
(51)【国際特許分類】
   H04N 19/513 20140101AFI20240125BHJP
   H04N 19/46 20140101ALI20240125BHJP
【FI】
H04N19/513
H04N19/46
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023544091
(86)(22)【出願日】2022-01-26
(85)【翻訳文提出日】2023-07-20
(86)【国際出願番号】 EP2022051756
(87)【国際公開番号】W WO2022162004
(87)【国際公開日】2022-08-04
(31)【優先権主張番号】21305135.2
(32)【優先日】2021-02-01
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.HDMI
(71)【出願人】
【識別番号】518341334
【氏名又は名称】インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【弁理士】
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ロバート,アントワーヌ
(72)【発明者】
【氏名】チェン,ヤ
(72)【発明者】
【氏名】ル リアネック,ファブリス
(72)【発明者】
【氏名】ポワリエ,タンギ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MC11
5C159ME01
5C159NN11
5C159PP04
5C159RC11
5C159TA62
5C159TB08
5C159TC12
5C159TC42
5C159UA02
5C159UA05
5C159UA22
(57)【要約】
ブロックを符号化又は復号化するための方法、並びに対応する装置が提供される。ブロックについての予測が決定され、予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承され、決定された予測に基づいてブロックが符号化又は復号化され、ブロックについての予測を決定することは、少なくとも2つの動き候補の対応するインジケータの値に基づいて、予測の訂正を有効化又は無効化するインジケータの値を決定することを含む。
【選択図】 図11
【特許請求の範囲】
【請求項1】
ビデオの少なくとも1つのブロックを符号化することを含む方法であって、前記ブロックを符号化することが、
-前記ブロックについての予測を決定することであって、前記予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承される、ことと、
-前記決定された予測に基づいて前記ブロックを符号化することと、を含み、
前記ブロックについての前記予測を決定することが、前記少なくとも2つの動き候補の対応するインジケータの値に基づいて、前記予測の訂正を有効化又は無効化するインジケータの値を決定することを含む、方法。
【請求項2】
1つ以上のプロセッサを備える装置であって、前記1つ以上のプロセッサは、ビデオの少なくとも1つのブロックを符号化するように構成され、前記ブロックを符号化することが、
-前記ブロックについての予測を決定することであって、前記予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承される、ことと、
-前記決定された予測に基づいて前記ブロックを符号化することと、を含み、
前記ブロックについての前記予測を決定することが、前記少なくとも2つの動き候補の対応するインジケータの値に基づいて、前記予測の訂正を有効化又は無効化するインジケータの値を決定することを含む、装置。
【請求項3】
ビデオの少なくとも1つのブロックを復号化することを含む方法であって、前記ブロックを復号化することが、
-前記ブロックについての予測を決定することであって、前記予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承される、ことと、
-前記決定された予測に基づいて前記ブロックを復号化することと、を含み、
前記ブロックについての前記予測を決定することが、前記少なくとも2つの動き候補の対応するインジケータの値に基づいて、前記予測の訂正を有効化又は無効化するインジケータの値を決定することを含む、方法。
【請求項4】
1つ以上のプロセッサを備える装置であって、前記1つ以上のプロセッサは、ビデオの少なくとも1つのブロックを復号化するように構成され、前記ブロックを復号化することが、
-前記ブロックについての予測を決定することであって、前記予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承される、ことと、
-前記決定された予測に基づいて前記ブロックを復号化することと、を含み、
前記ブロックについての前記予測を決定することが、前記少なくとも2つの動き候補の対応するインジケータの値に基づいて、前記予測の訂正を有効化又は無効化するインジケータの値を決定することを含む、装置。
【請求項5】
前記インジケータの前記値が、前記少なくとも2つの動き候補のうちの少なくとも1つの重要度に基づく、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項6】
前記少なくとも2つの動き候補から継承された動き情報が、前記少なくとも2つの動き候補の動きベクトルから決定された少なくとも1つの動きベクトルと、前記少なくとも2つの動き候補の前記参照フレームリスト中の参照フレームを示す情報から決定された前記参照フレームリスト中の参照フレームを示す少なくとも1つの情報とを含む、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項7】
前記インジケータについて決定された前記値が前記予測の訂正を有効にしたという決定に応答して、前記ブロックについての予測を決定することが、少なくとも1つの訂正パラメータを決定することと、前記予測を訂正するために前記少なくとも1つの訂正パラメータを使用することとを含む、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項8】
前記インジケータの前記値は、前記少なくとも2つの動き候補の前記インジケータの前記値に対して実行されるOR又はAND演算から取得される、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項9】
前記少なくとも2つの動き候補の全てについての前記インジケータの前記値が前記予測の訂正が有効であることを示すという決定に応答して、前記予測について決定された前記インジケータの前記値が、前記予測の訂正が有効であることを示す、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項10】
前記少なくとも2つの動き候補の少なくとも1つについての前記インジケータの前記値が前記予測の訂正が有効であることを示すという決定に応答して、前記予測について決定された前記インジケータの前記値が、前記予測の訂正が有効であることを示す、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項11】
少なくとも2つの動き候補の動き情報から継承された前記動き情報からの動きベクトルが、前記少なくとも2つの他の動き候補の動きベクトルの平均として取得される、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項12】
前記少なくとも2つの他の動き候補のうちの第1の動き候補が双方向候補であるか、又は前記少なくとも2つの他の動き候補が同じ参照フレームリスト上の単方向候補であるという決定に応答して、前記インジケータの前記値が、前記第1の動き候補の前記インジケータの前記値に設定される、請求項11に記載の方法又は請求項11に記載の装置。
【請求項13】
前記少なくとも2つの他の動き候補のうちのただ1つの選択された動き候補が、前記少なくとも2つの他の動き候補の動き情報に基づいて前記予測についての動き情報を継承するときに、1つ以上の参照フレームを決定するために使用されるという決定に応答して、前記予測について決定された前記インジケータの前記値が、前記参照フレームが決定された前記選択された動き候補の前記インジケータの前記値に設定される、請求項11に記載の方法又は請求項11に記載の装置。
【請求項14】
前記決定された予測が、少なくとも2つのパーティションを含み、各パーティションは、前記少なくとも2つの動き候補のうちの1つの動き候補から動き情報を継承する、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項15】
前記予測について決定された前記インジケータの前記値が、前記予測の最大パーティションが動き情報を継承する前記少なくとも2つの動き候補のうちの前記動き候補の前記インジケータの前記値に設定される、請求項14に記載の方法又は請求項14に記載の装置。
【請求項16】
前記予測を訂正するために、少なくとも1つの訂正パラメータが前記ブロックの近傍内のテンプレートに基づいて決定され、前記予測について決定された前記インジケータの前記値が、最大の近傍を前記テンプレートと共有する前記少なくとも2つの動き候補のうちの前記動き候補の前記インジケータの前記値に設定される、請求項14に記載の方法又は請求項14に記載の装置。
【請求項17】
前記決定された予測が、前記ブロックの空間近傍又は時間近傍ブロックから決定される少なくとも2つの動き候補を含むアフィンモデルに基づく、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項18】
前記アフィンモデルが少なくとも3つの動き候補を含む場合、前記少なくとも3つの動き候補の少なくとも2つについての前記インジケータの前記値が前記予測の訂正が有効であることを示すという決定に応答して、前記予測について決定された前記インジケータの前記値が、前記予測の訂正が有効であることを示す、請求項17に記載の方法又は請求項17に記載の装置。
【請求項19】
前記アフィンモデルの前記少なくとも2つの動き候補が左上近傍ブロックを含むという決定に応答して、前記予測について決定された前記インジケータの前記値が、前記左上近傍ブロックの前記インジケータの前記値に設定される、請求項17に記載の方法又は請求項17に記載の装置。
【請求項20】
前記アフィンモデルの前記少なくとも2つの動き候補が左上近傍ブロックを含まないが右上近傍ブロックを含むという決定に応答して、前記予測について決定された前記インジケータの前記値が、前記右上近傍ブロックの前記インジケータの前記値に設定される、請求項19に記載の方法又は請求項19に記載の装置。
【請求項21】
前記ブロックについての前記予測を決定することが、前記ブロックの少なくとも1つの空間的近傍ブロックから動き候補のリストを構築することを含み、前記リスト内の前記動き候補の数がある数未満であるという決定、及び前記リストがゼロ動きベクトル及び前記インジケータの第1の値を有する動き候補を含まないという決定に応答して、ゼロ動きベクトル及び前記インジケータの前記第1の値を有する動き候補を前記リストに追加し、
又は、前記リスト内の前記動き候補の前記数が前記数未満であるという判定と、前記リストがゼロ動きベクトル及び前記インジケータの前記第1の値を有する動き候補を含むという判定とに応答して、ゼロ動きベクトル及び前記インジケータの第2の値を有する動き候補を前記リストに追加し、前記インジケータの前記第2の値が前記インジケータの前記第1の値とは異なる、請求項1若しくは3に記載の方法又は請求項2若しくは4に記載の装置。
【請求項22】
前記予測の訂正が、前記予測の局所照明補償を含む、請求項1、3若しくは5から21のいずれか一項に記載の方法又は請求項2若しくは4から21のいずれか一項に記載の装置。
【請求項23】
1つ以上のプロセッサに、請求項1、3又は5から22のいずれか一項に記載の方法を行わせる、命令を格納しているコンピュータ可読記憶媒体。
【請求項24】
プログラムが1つ以上のプロセッサによって実行されると、前記1つ以上のプロセッサに、請求項1、3又は5から22のいずれか一項に記載の方法を行わせる、命令を含むコンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は、概して、ビデオの符号化又は復号化における動き情報導出のための方法及び装置に関する。
【背景技術】
【0002】
高い圧縮効率を実現するために、画像及びビデオのコーディング方式は、通常、ビデオコンテンツ内の空間冗長性及び時間冗長性を活用するために予測及び変換を採用している。概して、イントラピクチャ又はインターピクチャ相関を利用するために、イントラ予測又はインター予測が使用され、次いで、予測誤差又は予測残差と呼ばれることが多い、原ブロックと予測ブロックとの間の差が、変換、量子化、及びエントロピコード化される。ビデオを再構成するには、エントロピコーディング、量子化、変換、及び予測に対応する逆プロセスによって、圧縮データを復号化する。
【発明の概要】
【0003】
ビデオブロックを符号化するための方法が提供される。ビデオブロックを符号化する方法は、ブロックについての予測を決定することであって、予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承される、ことと、決定された予測に基づいてブロックを符号化することと、を含み、ブロックについての予測を決定することが、少なくとも2つの動き候補の対応するインジケータの値に基づいて、予測の訂正を有効化又は無効化するインジケータの値を決定することを含む。
【0004】
別の実施形態によれば、ビデオブロックを符号化するための装置が提供され、この装置は、ブロックについての予測を決定し、予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承され、決定された予測に基づいてブロックを符号化するように構成された1つ以上のプロセッサを備え、ブロックについての予測を決定することは、少なくとも2つの動き候補の対応するインジケータの値に基づいて、予測の訂正を有効化又は無効化するインジケータの値を決定することを含む。
【0005】
別の実施形態によれば、ビデオブロックを復号化する方法が提供され、この方法は、ブロックについての予測を決定することであって、予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承される、ことと、決定された予測に基づいてブロックを復号化することと、を含み、ブロックについての予測を決定することが、少なくとも2つの動き候補の対応するインジケータの値に基づいて、予測の訂正を有効化又は無効化するインジケータの値を決定することを含む。
【0006】
別の実施形態によれば、ビデオブロックを復号化するための装置が提供され、この装置は、ブロックについての予測を決定し、予測を決定するために使用される動き情報が、少なくとも2つの動き候補の動き情報から継承され、決定された予測に基づいてブロックを復号化するように構成された1つ以上のプロセッサを備え、ブロックについての予測を決定することは、少なくとも2つの動き候補の対応するインジケータの値に基づいて、予測の訂正を有効化又は無効化するインジケータの値を決定することを含む。
【0007】
1つ以上の実施形態によりまた、1つ以上のプロセッサによって実行されるとき、1つ以上のプロセッサに、これまで述べた実施形態のいずれかによる符号化方法又は復号化方法を行わせる命令を含む、コンピュータプログラムを提供する。本実施形態のうちの1つ以上はまた、上で説明された方法に従って、ビデオデータを符号化するか、又は復号化するための命令を記憶したコンピュータ可読記憶媒体を提供する。1つ以上の実施形態はまた、これまで述べた方法により起こされたビットストリームを格納しているコンピュータ可読記憶媒体を提供する。1つ以上の実施形態によりまた、上で説明された方法に従って生成されたビットストリームを送信又は受信するための方法及び装置を提供する。
【図面の簡単な説明】
【0008】
図1】本実施形態の態様が実装され得るシステムのブロック図を示す。
図2】ビデオエンコーダの一実施形態のブロック図を示す。
図3】ビデオデコーダの一実施形態のブロック図を示す。
図4】一実施形態による、LICパラメータ導出のための方法の一例を示す。
図5】一実施形態による、動き候補リストについての動きベクトル予測子を導出するために使用される空間近傍及び時間近傍位置の一例を示す。
図6】一実施形態による、制御点ベースのアフィン動きモデルを示す。
図7】制御点動きベクトル継承の例を示す。
図8】本発明の一実施形態による幾何学的インター予測モードにおける角度の一例を示す。
図9】幾何学的分割記述の例を示す。
図10】角度12及び距離0~3を有する幾何学的パーティションの例を示す。
図11】ある実施形態によるビデオ内のブロックを符号化する方法の一例を示す。
図12】ある実施形態によるビデオ内のブロックを復号化する方法の一例を示す。
図13】ブロックの上部にL字形テンプレートと共有されるエッジを有する幾何学的パーティションの例を示す。
図14】本原理の一例による、通信ネットワークを介して通信する2つの遠隔デバイスを示す。
図15】本原理の例による信号のシンタックスを示す。
【発明を実施するための形態】
【0009】
図1は、様々な態様及び実施形態が実装され得るシステムの一例のブロック図を示す。システム100は、以下に記載の様々なコンポーネントを含むデバイスとして具現化され得、本明細書に記載の態様のうちの1つ以上を実行するように構成されている。かかるデバイスの実施例としては、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電、及びサーバなどの様々な電子デバイスが挙げられる。システム100の要素は、単独で、又は組み合わせて、単一の集積回路、複数のIC、及び/又は個別のコンポーネントで具現化され得る。例えば、少なくとも1つの実施形態では、システム100の処理要素及びエンコーダ要素/デコーダ要素は、複数のIC及び/又は個別のコンポーネントにわたって分散している。様々な実施形態では、システム100は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通じて、他のシステム、又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム100は、本出願に記載された態様のうちの1つ以上を実装するように構成される。
【0010】
システム100は、例えば、本出願に記載された様々な態様を実装するために、内部にロードされた命令を実行するように構成された、少なくとも1つのプロセッサ110を含む。プロセッサ110は、埋め込み型メモリ、入力出力インターフェース、及び当該技術分野で既知であるように様々な他の回路を含み得る。システム100は、少なくとも1つのメモリ120(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム100は、記憶デバイス140を含み、この記憶デバイスは、限定されるものではないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、及び/若しくは光ディスクドライブを含む、不揮発性メモリ並びに/又は揮発性メモリを含み得る。記憶デバイス140は、非限定的な例として、内部記憶デバイス、取り付け型記憶デバイス、及び/又はネットワークアクセス可能な記憶デバイスを含み得る。
【0011】
システム100は、例えば、データを処理して、符号化ビデオ又は復号化ビデオを提供するように構成されたエンコーダ/デコーダモジュール130を含み、そのエンコーダ/デコーダモジュール130は、それ自体のプロセッサ及びメモリを含み得る。エンコーダ/デコーダモジュール130は、符号化機能及び/又は復号化機能を実行するためにデバイス内に含まれ得るモジュールを表す。既知であるように、デバイスは、符号化及び復号化モジュールのうちの一方又は両方を含み得る。加えて、エンコーダ/デコーダモジュール130は、システム100の個別の要素として実装され得るか、又は当業者に知られているように、ハードウェアとソフトウェアの組み合わせとしてプロセッサ110内に組み込まれ得る。
【0012】
本出願に記載の様々な態様を実行するためにプロセッサ110又はエンコーダ/デコーダ130上にロードされるプログラムコードは、記憶デバイス140内に記憶され、その後、プロセッサ110による実行のためにメモリ120上にロードされ得る。様々な実施形態によれば、プロセッサ110、メモリ120、記憶デバイス140、及びエンコーダ/デコーダモジュール130のうちの1つ以上は、本出願に記載されるプロセスの実行中に、様々な項目のうちの1つ以上を記憶し得る。かかる記憶された項目は、限定されるものではないが、入力ビデオ、復号化ビデオ、又は復号化ビデオの一部分、ビットストリーム、行列、変数、並びに、方程式、式、動作、及び動作論理の処理からの中間結果又は最終結果を含み得る。
【0013】
いくつかの実施形態では、プロセッサ110及び/又はエンコーダ/デコーダモジュール130の内部のメモリは、命令を記憶するため、及び符号化又は復号化中に必要とされる処理のためのワーキングメモリを提供するために使用される。しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ110又はエンコーダ/デコーダモジュール130のいずれかであり得る)の外部のメモリが、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ120及び/又は記憶デバイス140、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施形態では、外部不揮発性フラッシュメモリが、テレビのオペレーティングシステムを格納するために使用される。少なくとも一実施形態では、RAMなどの高速外部ダイナミック揮発性メモリが、MPEG-2、HEVC、又はVVCなどのビデオコーディング動作及び復号化動作のためのワーキングメモリとして使用される。
【0014】
システム100の要素への入力は、ブロック105に示されるように、様々な入力デバイスを通して提供され得る。このような入力デバイスとしては、(i)例えば、放送局によって無線で送信されるRF信号を受信するRF部、(ii)コンポジット入力端子、(iii)USB入力端子、及び/又は(iv)HDMI入力端子が挙げられるが、これらに限定されない。
【0015】
様々な実施形態では、ブロック105の入力デバイスは、当技術分野で知られているように、関連するそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択することと(また信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートすることと、(iii)特定の実施形態で、(例えば)チャネルとして称され得る信号周波数帯域を選択するために、再度より狭い周波数帯域に帯域制限することと、(iv)ダウンコンバート及び帯域制限された信号を復調することと、(v)誤り訂正を実行することと、(vi)データパケットの所望のストリームを選択するために多重分離することと、に対して好適な要素に関連付けられ得る。様々な実施形態のRF部分は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部分は、これらの様々な機能を実行するチューナを含み得、例えば、受信した信号をより低い周波数(例えば、中間周波数、若しくは近接ベースバンド周波数)に、又はベースバンドにダウンコンバートすることが含まれる。セットトップボックスの一実施形態では、RF部とその関連する入力処理要素は、有線(例えば、ケーブル)媒体上で送信されたRF信号を受信し、フィルタ処理し、ダウンコンバートし、また所望の周波数帯域に再びフィルタ処理することによって、周波数選択を行う。様々な実施形態では、上で説明される(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、並びに/又は、類似若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、既存の要素の間に要素を挿入すること、例えば、増幅器及びアナログ-デジタル変換器を挿入することを含み得る。様々な実施形態において、RF部分は、アンテナを含む。
【0016】
加えて、USB及び/又はHDMI端末は、USB及び/又はHDMI接続全体にわたって、システム100を他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リードソロモン誤り訂正は、例えば、必要に応じて、個別の入力処理IC内又はプロセッサ110内に実装され得ることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて、個別のインターフェースIC内又はプロセッサ110内に実装され得る。復調され、エラー訂正され、多重分離されたストリームは、例えば、プロセッサ110、及び出力デバイス上に提示するために必要に応じてデータストリームを処理するためにメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ130を含む、様々な処理要素に提供される。
【0017】
システム100の様々な要素は、統合されたハウジング内に提供され得、統合されたハウジング内では、様々な要素は、好適な接続構成115、例えば、I2Cバス、配線、及びプリント回路基板を含む、当該技術分野で既知の内部バスを使用して相互に接続され、互いの間でデータを送信し得る。
【0018】
システム100は、通信チャネル190を介して他のデバイスとの通信を可能にする通信インターフェース150を含む。通信インターフェース150は、限定されるものではないが、通信チャネル190を介してデータを送信及び受信するように構成された送受信機を含み得る。通信インターフェース150は、限定されるものではないが、モデム又はネットワークカードを含み得、通信チャネル190は、例えば、有線及び/又は無線媒体内に実装され得る。
【0019】
データは、様々な実施形態において、IEEE802.11などのWi-Fiネットワークを使用して、システム100にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合されている通信チャネル190及び通信インターフェース150上で受信される。これらの実施形態の通信チャネル190は、一般的には、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態では、入力ブロック105のHDMI接続を介してデータを配信するセットトップボックスを使用して、システム100にストリーミングデータを提供する。更に他の実施形態では、入力ブロック105のRF接続を使用して、システム100にストリーミングデータを提供する。
【0020】
システム100は、出力信号を、ディスプレイ165、スピーカ175、及び他の周辺デバイス185を含む、様々な出力デバイスに提供し得る。他の周辺デバイス185は、実施形態の様々な例において、スタンドアロンDVR、ディスクプレーヤ、ステレオシステム、照明システム、及びシステム100の出力に基づいて機能を提供する他のデバイス、のうちの1つ以上を含む。様々な実施形態では、制御信号は、AV.Link、CEC、又はユーザ介入あり若しくはユーザ介入なしでデバイス間制御を可能にする他の通信プロトコルなどのシグナリングを使用して、システム100とディスプレイ165、スピーカ175、又は他の周辺デバイス185との間で通信される。出力デバイスは、それぞれのインターフェース160、170、及び180を通じた専用接続を介してシステム100に通信可能に結合され得る。代替的に、出力デバイスは、通信インターフェース150を介し、通信チャネル190を使用して、システム100に接続され得る。ディスプレイ165及びスピーカ175は、例えば、テレビなどの電子デバイスにおいて、システム100の他のコンポーネントと共に単一ユニットに統合され得る。様々な実施形態では、ディスプレイインターフェース160は、ディスプレイドライバ、例えば、タイミングコントローラ(TCon)チップを含む。
【0021】
ディスプレイ165及びスピーカ175は、代替的に、例えば、入力105のRF部分が個別のセットトップボックスの一部である場合、他のコンポーネントのうちの1つ以上から分離され得る。ディスプレイ165及びスピーカ175が外部コンポーネントである様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む、専用の出力接続を介して提供され得る。
【0022】
図2は、高効率ビデオコーディング(High Efficiency Video Coding、HEVC)エンコーダなどの例示的なビデオエンコーダ200を示す。図2はまた、HEVC規格に改良を加えたエンコーダ、又はJVET(Joint Video Exploration Team(ジョイントビデオエキスパートチーム)によって開発中のVVC(Versatile Video Coding)(多用途ビデオ符号化)エンコーダ又は任意のビデオエンコーダなど、HEVCに類似する技術を採用したエンコーダを示し得る。
【0023】
本出願では、「再構成された(reconstructed)」及び「復号化された(decoded)」という用語は、交換可能に使用され得、「符号化(encoded)された」及び「コーディング(coded)された」という用語は、交換可能に使用され得、は、「ピクセル(pixel)」又は「サンプル(sample)」という用語は、交換可能に使用され得、「画像(image)」、「ピクチャ(picture)」、及び「フレーム(frame)」という用語は、交換可能に使用され得る。通常、必ずしもそうではないが、「再構成された」という用語は、エンコーダ側で使用され、一方、「復号化された」という用語は、デコーダ側で使用される。
【0024】
符号化される前に、ビデオシーケンスは、符号化前処理(201)、例えば、カラー変換を入力カラーピクチャに適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、又は圧縮に対してより弾力的な信号分布を得るために入力ピクチャ成分の再マッピングを実行する(例えば、色成分のうちの1つのヒストグラム等化を使用して)ことを経得る。メタデータは、前処理に関連付けられ、ビットストリームに添付され得る。
【0025】
エンコーダ200では、以下に記載のように、ピクチャは、エンコーダ要素によって符号化される。符号化されるピクチャは、例えば、CUという単位に分けられ(202)、処理される。一実施形態によれば、ユニットをサブユニットに分割することができる。
【0026】
各ユニット又はサブユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化される。ユニットがイントラモードで符号化されるとき、そのユニットは、イントラ予測(260)を実行する。イントラ予測は、現在のビデオブロックを予測するために、ブロックの同じビデオピクチャ/スライス内の既に符号化された近傍ブロック(参照サンプルと呼ばれる)のピクセルを使用する。空間予測は、ビデオ信号に固有の空間冗長性を低減する。
【0027】
インターモードでは、動き推定(275)及び補償(270)を用いてインター予測が実行される。時間予測とも呼ばれるインター予測は、現在のビデオブロックを予測するために、既に符号化されたビデオピクチャからの再構成されたピクセルを使用する。インター予測は、ビデオ信号に固有の時間的冗長性を低減する。
【0028】
各インター予測CUに対して、動き情報は、現在のブロックに対するインター予測を生成するために使用される。動き情報は、現在のブロックとその参照ブロックとの間の動きの量及び方向を示す1つ以上の動きベクトルと、参照ブロックが由来する参照ピクチャを参照ピクチャリスト内で識別する1つ以上の参照ピクチャインデックスとを備えることができる。動き情報は、LICツールが現在のブロックに対して有効であるか無効であるかを示すLICインジケータなど、エンコーダ/デコーダの特定の符号化機能に必要とされる追加情報を備え得る。
【0029】
以下で更に説明する実施形態に応じて、現在のブロックの予測を生成するために異なるインター予測モードを使用することができる。インター予測モードのいずれも、単独で、又は他のインター予測モードのいずれか1つと組み合わせて実装することができる。インター予測モードは、例えばレート/歪みコストに基づいて、利用可能なインター予測モードの中から選択され、選択されたインター予測モードは、ビットストリームにおいてシグナリングされる。
【0030】
エンコーダは、ユニットを符号化するためにイントラモード又はインターモードのうちのどちらを使用すべきかを決定し(205)、例えば、予測モードフラグによってイントラ/インターの決定を示す。エンコーダはまた、イントラ予測結果とインター予測結果を混合(263)してもよいし、又は異なるイントラ/インター予測方法からの結果を混合してもよい。
【0031】
予測残差は、例えば、元の画像ブロックから予測されたブロックを減算することによって(210)計算される。動き改良モジュール(272)は、元のブロックを参照せずにブロックの動きフィールドを改良するために、既に利用可能な参照ピクチャを使用する。ある領域についての動きフィールドは、その領域を有する全てのピクセルについての動きベクトルの集合とみなすことができる。動きベクトルがサブブロックベースである場合、動きフィールドは、領域内の全てのサブブロック動きベクトルの集合として表すこともできる(サブブロック内の全てのピクセルは同じ動きベクトルを有し、動きベクトルはサブブロックごとに異なり得る)。単一の動きベクトルが領域に対して使用される場合、領域に対する動きフィールドもまた、単一の動きベクトル(領域内の全てのピクセルに対して同じ動きベクトル)によって表すことができる。
【0032】
その予測残差は、次いで、変換され(225)、量子化される(230)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素は、ビットストリームを出力するためにエントロピコード化される(245)。エンコーダは、変換をスキップし、量子化を非変換残差信号に直接適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち、残差は、変換プロセス又は量子化プロセスを適用することなく直接符号化される。
【0033】
エンコーダは、符号化されたブロックを復号化して、更なる予測のための参照を提供する。量子化された変換係数は、予測残差を復号化するために逆量子化され(240)、逆変換される(250)。復号化された予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構成される。ループ内フィルタ(265)は、例えば、符号化アーチファクトを低減するための非ブロック化/サンプル適応オフセット(Sample Adaptive Offset、SAO)フィルタリングを実行するために、再構成されたピクチャに適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
【0034】
図3は、例示的なビデオデコーダ300のブロック図を示す。デコーダ300では、以下に説明する通り、ビットストリームが、デコーダ要素によって復号化される。ビデオデコーダ300は、図2に記載するように、一般に、符号化パスとは逆の復号化パスを実行する。エンコーダ200もまた、概して、ビデオデータを符号化することの一部としてビデオ復号化を実行する。
【0035】
特に、デコーダの入力は、ビデオビットストリームを含み、これは、ビデオエンコーダ200によって生成され得る。ビットストリームは、まず、変換係数、動きベクトル、及び他の符号化情報を取得するために、エントロピ復号化される(330)。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。デコーダは、したがって、復号化されたピクチャ分割情報に従ってピクチャを分割し得る(335)。変換係数は、予測残差を復号化するために、逆量子化され(340)、逆変換される(350)。復号化された予測残差と予測ブロックとを組み合わせて(355)、画像ブロックが再構成される。
【0036】
イントラ予測(360)又は動き補償予測(すなわち、インター予測)(375)から、予測ブロックを得ることができる(370)。デコーダは、イントラ予測結果とインター予測結果を混合(373)してもよいし、又は複数のイントラ/インター予測方法からの結果を混合してもよい。動き補償の前に、動きフィールドは、既に利用可能な参照ピクチャを使用することによって改良され得る(372)。ループ内フィルタ(365)は、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(380)に記憶される。
【0037】
復号化されたピクチャは、復号化後処理(385)、例えば、逆カラー変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)、又は符号化前処理(201)において実行された再マッピングプロセスの逆を実行する逆再マッピングを更に経ることができる。復号化後処理は、符号化前処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用することができる。
【0038】
参照を容易にするために、本文全体を通して「CU」及び「ブロック」という用語を交換可能に使用する。
【0039】
一実施形態によれば、上記で説明したエンコーダ及びデコーダにおいて、インター予測モードについての動き情報は、明示的又は暗黙的な方法でシグナリングされ得る。例えば、マージモードとも呼ばれる符号化モードでは、動き情報は、動き候補、例えば、エンコーダ/デコーダ実装に応じて、空間的及び時間的候補並びに追加の動き候補を含む現在のブロックの既に符号化された近傍CUから継承される。マージモードは、任意のインター予測CUに適用され得る。
【0040】
動き候補は、インター予測モードでブロック又はCUを予測するために使用され得る符号化ブロック又はCUである。
【0041】
一実施形態によれば、マージモードでは、1つ以上の動き候補を含んで動き候補リストが構築される。リスト内の動き候補の動き情報を使用することによってそれぞれ得られた予測が評価され、ブロックに対して最低のレート/歪みコストを提供する動き候補が選択される。次に、選択された動き候補を識別するインデックスが、現在のブロックのビットストリームにおいて符号化される。
【0042】
一実施形態によれば、動き候補リストは、以下のタイプの動き候補のいずれか1つで順番にポピュレートされ得る:
1)空間近傍CUからの空間動きベクトル予測子、
2)コロケートされたCUからの時間動きベクトル予測子、
3)先入れ先出しテーブルからの履歴ベースの動きベクトル予測子、
4)ペアワイズ平均動きベクトル予測子、
5)ゼロ動きベクトル。
【0043】
動き候補は、リストの最大許容サイズに達するまで、順序に従ってリストに含まれる。上記で説明した動き候補リストは一例であり、エンコーダ/デコーダの特定の特徴に従って導出される任意の他の動き候補が、リスト中の任意のロケーションに含まれ得る。また、リストは、上記で説明した動き候補のうちの1つ以上を考慮せずに構築され得る。更に、動き候補を考慮するために上記で与えられた順序は一例であり、任意の他の順序を使用することができる。したがって、動き候補リストは、同じリスト構築プロセスがエンコーダ及びデコーダにおいて使用される限り、動き候補のための任意の導出プロセスを使用してポピュレートされ得ることを理解されたい。
【0044】
図5は、動き候補リストの動きベクトル予測子を導出するために使用される空間近傍位置及び時間近傍位置の一例を示す。4つ未満の空間動き候補がリストに追加された場合、空間近傍は、上CU(B1)と、左CU(A1)と、右上CU(B0)と、左下CU(A0)と、左上CU(B2)とを含むことができる。同じ動き情報を有する候補がリストから除外されることを保証するために、新しい動きベクトル予測子を追加する前に冗長チェックを適用することができる。
【0045】
時間近傍は、コロケートピクチャ中の右下CU(C0)、又はC0が利用可能でない場合は中心CU C1を含むことができる。履歴ベースの動き候補は、符号化/復号化プロセス中に維持される、前に符号化されたブロックの動き情報を記憶するテーブルから取得される。テーブルは、固定数の動き情報を記憶し、先入れ先出しプロセスを使用して管理される。
【0046】
一実施形態によれば、ペアワイズ平均候補は、予め定義された候補のペアを平均することによって生成される。例えば、予め定義された候補のペアは、マージ候補リスト中に含まれる動き候補であり得る。別の変形形態によれば、候補の予め定義されたペアは、任意の他の動き候補とすることができる。したがって、候補の予め定義されたペアの導出は、エンコーダ及びデコーダにおいて同じ方法で実行されなければならない。
【0047】
一例によれば、候補の予め定義されたペアは、{(0、1)、(0、2)、(1、2)、(0、3)、(1、3)、(2、3)}として定義されることができ、ここで、数字は、マージ候補リストへのマージインデックスを示す。平均化された動きベクトルは、各参照リストについて別々に計算される。両方の動きベクトルが1つのリストにおいて利用可能である場合、これらの2つの動きベクトルは、異なる参照ピクチャを指す場合であっても平均化される。1つの動きベクトルのみが利用可能である場合、この動きベクトルはリストに追加される。
【0048】
一実施形態によれば、ペアワイズ平均マージ候補が追加された後にマージ候補リストが完全でないとき、最大マージ候補数に達するまで、ゼロMVP(動きベクトル予測子)が端部において挿入される。
【0049】
一実施形態によれば、動き候補リストは、動き情報が動き候補から導出されなければならない任意の他のインター予測モードのために使用され得る。そのようなモードの例は、動きベクトル差分(MVD)がCUのためのビットストリーム中で符号化されるMVDを有するマージモード、(VVC規格においてCIIPとして知られる)組み合わされたインター及びイントラ予測、幾何学的パーティションモード、又はアフィン動きモデルを使用するアフィンモード、2つの空間的動き候補と1つの時間的候補とを平均化する時空間動きベクトル予測子(STMVP)である。
【0050】
現在のCUをインター予測するためのマージモードに対する代替インター予測モードは、動き情報がCUについてのビットストリーム中で明示的に送信/符号化される符号化モードであり得る。
【0051】
一実施形態によれば、インター予測は、ブロックベースのアフィン変換動き補償予測が適用されるアフィン符号化モードを含むことができる。図6に示されるように、ブロックのアフィン動きフィールドは、2つの制御点動きベクトル(CPMV)(4パラメータ)又は3つの制御点動きベクトル(6パラメータ)の動き情報によって記述され得る。
【0052】
4パラメータアフィン動きモデルの場合、ブロック中のサンプルロケーション(x,y)における動きベクトルは、以下のように導出され得る:
【0053】
【数1】
6パラメータアフィン動きモデルの場合、ブロック中のサンプルロケーション(x,y)における動きベクトルは、以下のように導出され得る:
【0054】
【数2】
式中、(mv0x,mv0y)は、CUに対して決定された左上隅制御点の動きベクトルであり、(mv1x,mv1y)は、CUに対して決定された右上隅制御点の動きベクトルであり、(mv2x,mv2y)は、CUに対して決定された左下隅制御点の動きベクトルである。
【0055】
一実施形態によれば、現在のCUのCPMVは、空間近傍CUの動き情報に基づいて生成することができる。固定数のCPMVP候補が導出され、現在のCUのために使用されるものを示すためにインデックスがシグナリングされる。一例では、最大5つの動き候補を使用することができる。変形形態によれば、以下の3つのタイプのCPVMP候補を使用して、アフィンマージ候補リストを形成することができる:
-空間継承アフィン候補、
-構築されたアフィン候補CPMVP、
-ゼロCPMV。
【0056】
空間継承アフィン候補は、近傍ブロックのアフィン動きモデルから導出することができ、例えば、1つは左の近傍CUから、1つは上の近傍CUから導出することができる。一例を図5に示す。左側予測子の場合、左側予測子を選択するためのスキャン順序は、A1、A0であり、上側予測子の場合、スキャン順序は、B1、B0、B2であり得る。各側から最初に継承された候補のみが選択される。
【0057】
近傍アフィンCUが識別されるとき、その制御点動きベクトルは、現在のCUのアフィンマージリスト中のCPMVP候補を導出するために使用される。図7に示すように、隣接左下ブロックAがアフィンモデルを使用して符号化される場合、ブロックAを含むCUの左上隅、右隅の上、及び左下隅の動きベクトルv、v、及びvが達成される。ブロックAが4パラメータアフィンモデルで符号化される場合、現在のCU(図7のCur)の2つのCPMVは、v及びvに従って計算される。ブロックAが6パラメータアフィンモデルで符号化されるとき、現在のCUの3つのCPMVは、v、v及びvに従って計算される。
【0058】
構築されたアフィン候補は、CUの各制御点の近傍並進動き情報を組み合わせることによって構築される。制御点についての動き情報は、図5に示されるように、指定された空間近傍及び時間近傍から導出され得る。CPMV(k=1,2,3,4)は、k番目の制御点を表す。CPMVの場合、B2->B3->A2ブロックがチェックされ、第1の利用可能なブロックのMVが使用される。CPMVについては、B1->B0ブロックがチェックされ、CPMVについては、A1->A0ブロックがチェックされる。CPMVの場合、時間的動きベクトル予測子(TMVP)C0は、利用可能である場合に使用される。
【0059】
次に、構築されたアフィン動き候補は、4つの上の制御点CPMV(k=1,2,3,4)のMVの動きに基づいて構築される。制御点MVの以下の組み合わせを使用して、特定の順序で構築することができる:
{CPMV、CPMV、CPMV}、{CPMV、CPMV、CPMV}、{CPMV、CPMV、CPMV}、{CPMV、CPMV、CPMV}、{CPMV、CPMV}、{CPMV、CPMV}。
【0060】
3つのCPMVの組み合わせは6パラメータアフィンマージ候補を構築し、2つのCPMVの組み合わせは4パラメータアフィンマージ候補を構築する。動きスケーリングプロセスを回避するために、制御点の参照インデックスが異なる場合、制御点MVの関連する組み合わせを破棄することができる。
【0061】
継承されたアフィンマージ候補及び構築されたアフィンマージ候補がチェックされた後、動き候補リストがまだ満杯でない場合、ゼロCPMVがリストの末尾に挿入され得る。
【0062】
一実施形態によれば、アフィン符号化モードにおける動き情報は、例えばマージモードと同様のプロセスを用いて暗黙的にシグナリングされてもよいし、明示的にシグナリングされてもよい。動き情報が、アフィンマージモードとも呼ばれるアフィン符号化モードにおいて暗黙的にシグナリングされるとき、CPMVの各々の動き情報は、上記で説明したように決定された動き候補から継承される。CUのために使用される動き候補を示すために、インデックスがCUのために符号化される。
【0063】
一実施形態によれば、インター予測は、CUが角度及び距離で定義される分割エッジによって2つのパーティションに分割される、幾何学的パーティションインター予測モードを含むことができる。幾何学的パーティションは、インター予測境界とオブジェクトとのより良好な位置合わせを可能にする。一実施形態によれば、幾何学的インター予測モードは、32個の角度及び5個の距離を有することができる。幾何学的インター予測モードが使用される場合、CUは2つの非矩形パーティションに分割される。CU内の各々のパーティションは、それ自体の動きパラメータを使用してインター予測される。変形例によれば、単方向予測のみが許可される。
【0064】
幾何学的モードの各パーティションについての動き情報は、動き候補リストから導出される。例えば、上述した動き候補リストを用いることができる。各パーティションは、1つの動きベクトル及び1つの参照インデックスを有する。パーティションの各々を予測した後、分割エッジに沿ったサンプル値は、適応重みを用いた混合プロセスを使用して調整され得る。
【0065】
分割境界は、角度φ及び距離オフセットρによって記述され得る。角度φは、11.25度に等しいステップで0度~360度に量子化され得る。図8は、幾何学的インター予測モードにおいて使用され得る32個の角度の例を示す。
【0066】
角度φ及び距離ρ幾何学的分割の記述を図9に示す。距離ρは、ブロックの中心からの距離を示す固定ステップを用いた最大可能距離ρmaxから量子化され得る。変形例によれば、距離ρ=0について、このケースでは分割が対称であるので、角度の最初の半分のみが利用可能である。角度12及び距離0~3を使用した幾何学的パーティションの結果を図10に示す。
【0067】
一実施形態によれば、幾何学的インター予測モードにおける動き情報は、例えばマージモードと同様のプロセスを用いて暗黙的にシグナリングされてもよいし、明示的にシグナリングされてもよい。動き情報が暗黙的にシグナリングされる場合(幾何学的マージモードとも呼ばれる)、各パーティションの動き情報は、動き候補リストの動き候補から継承される。パーティションのために使用される動き候補を示すために、CUのパーティションごとにインデックスが符号化される。
【0068】
時間予測プロセスでは、局所照明補償(LIC)は、時間近傍ピクチャ間に存在し得る局所照明変化の問題に対処するために使用される符号化ツールである。LICツールは線形モデルに基づいており、ここでスケーリング係数α及びオフセットβの少なくとも1つは、現在のブロックの予測サンプルを取得するために参照サンプルに適用される。このようにして、LICパラメータは、現在のブロックについて取得された予測を訂正することを可能にする。具体的には、LICツールは、以下の式によって数学的にモデル化することができる:
P(x,y)=α・P(x+v,y+v)+β
【0069】
P(x,y)は座標(x,y)における現在ブロックの予測信号であり、P(x+v,y+v)は、動きベクトル(v,v)によって指し示される参照ブロックであり、α及びβは、参照ブロックに適用される対応するスケーリング係数及びオフセットである。
【0070】
図4は、一実施形態によるLICパラメータを決定するための方法を示す図である。図4において、LICがブロックに適用される場合、最小平均二乗誤差(LMSE)法を用いて、図4に示すように、現在のブロック(すなわち、図4のテンプレートT)の近傍サンプルと、時間参照ピクチャL0参照ピクチャ及びL1参照ピクチャ内のそれらの対応する参照サンプル(T又はT)との間の差を最小化することによって、LICパラメータ(すなわち、α及びβ)の値を導出する:
【0071】
【数3】
式中、Nは、LICパラメータを導出するために使用されるテンプレートサンプルの数を表し、T(x,y)は、座標(x,y)における現在のブロックのテンプレートサンプルであり、
【0072】
【数4】
は、現在のブロックの動きベクトル
【0073】
【数5】
に基づくテンプレートサンプルの対応する参照サンプルである(L0参照ピクチャのための添字0、L1参照ピクチャのための添字1)。変形例によれば、計算の複雑さを低減するために、テンプレートサンプルと参照テンプレートサンプルの両方をサブサンプリング(2:1サブサンプリング)してLICパラメータを導出する、すなわち、図4のテンプレートの網掛けサンプルのみを使用してα及びβを導出する。
【0074】
更に、LICが双方向ブロックに適用される(すなわち、2つの時間予測ブロックによって予測される)とき、LICパラメータは、各予測方向、すなわち、L0及びL1について別々に導出され、適用される。図4に示すように、2つの動きベクトルMV0及びMV1に基づいて、2つの参照テンプレートT0及びT1を得ることができる。T0とTとの間、及びT1とTとの間の歪みを別々に最小化することによって、2つの方向におけるLICパラメータの対応するペアを、上で与えられた式に従って導出することができる。
【0075】
その後、現在のブロックの最終的な双方向予測信号は、以下のように示されるように、2つのLIC単方向予測ブロックを組み合わせることによって生成される:
【0076】
【数6】
α及びβ並びにα及びβは、現在のブロックの動きベクトルMV0及びMV1にそれぞれ関連付けられたLICパラメータであり
【0077】
【数7】
はそれぞれ、参照ピクチャリストL0及びL1中の参照ピクチャから取得された現在ブロックの対応する時間参照ブロックである。
【0078】
上記で説明したLICツールは、図1図3に関して上記で説明したような符号化/復号化ビデオ方式において使用され得る。
【0079】
CUを予測するための動き情報が動き候補から継承されるとき、動きベクトル及び参照インデックスに加えて、LICインジケータが動き候補から継承された動き情報に含まれる。
【0080】
しかしながら、動き情報が、組み合わされた動き情報に基づいてCUについて決定されるとき、LICインジケータは、CUによって直接継承されることができない。組み合わされた動き情報は、CUが少なくとも2つの動き候補から動き情報を継承するときに生じる。例えば、マージモードでは、ペアワイズ動き候補は、動き情報を導出するために少なくとも2つの動き候補を使用する。別の例では、幾何学的マージモードにおいて、各パーティションは、それ自体の動き候補を有する。更に別の例では、アフィンマージモードにおいて、構築された各CPMVは、それ自体の動き候補を有する。これらの例は限定的ではなく、他のインター予測モードは、CUについての動き情報を継承するために2つ以上の動き候補の使用をもたらし得る。
【0081】
LICツールがCUのために使用されるかどうかを示すLICインジケータは、CUレベルで符号化される。すなわち、複数の動き候補が動き情報継承のために使用されるとき、複数のインジケータがCUによって継承される。継承されたインジケータが異なる値を有するとき、これは、ツールがCUに対して有効化されているか無効化されているかに関する曖昧さをもたらす。したがって、この状況を改善する必要がある。
【0082】
本原理は、ここではLIC特徴の場合について説明されるが、本原理は、CUに対して一度シグナリングされる動き候補から継承され得る任意の特徴に適用され得る。
【0083】
以下では、動き候補に関連付けられたインジケータと呼ぶ。上記で説明したように、インジケータは、LICインジケータ又は動き候補から継承された任意のインジケータであり得る。そのようなインジケータは、ブール値をとることができるフラグであり得る。インジケータはまた、非ブール値であってもよく、例えば、有効化若しくは無効化、又は中間の任意の状態(特定のパラメータ/重みで有効化されるなど)等のツールのステータスとして示すインジケータであってもよい。
【0084】
図11は、ある実施形態によるビデオ内のブロックを符号化する方法1100の一例を示す。一実施形態によれば、方法1100は、図2で説明したエンコーダにおいて実施することができる。
【0085】
110において、ブロックについて予測が決定される。レート/歪みの意味でブロックに対する最良の符号化モードを決定するために、いくつかの符号化モードを評価することができる。これらの符号化モードのうち、少なくとも1つの符号化モードは、少なくとも2つの動き候補の動き情報から継承された動き情報を用いる。
【0086】
そのような符号化モードの場合、111において、動きベクトルと参照フレームインデックスとを含む動き情報が、2つ以上の動き候補からブロックについて決定される。予測、すなわち予測ブロックは、次に、参照ピクチャの動き補償を使用して、導出された動きベクトル及び参照フレームインデックスから計算される。
【0087】
112において、少なくとも2つの動き候補の対応するインジケータの値に基づいて、予測の訂正を有効又は無効にするインジケータの値が決定される。インジケータは、例えば、上述したLICツールのインジケータであってもよい。
【0088】
113において、ブロックに対して112で設定されたインジケータに基づいて、予測の訂正が有効であるか無効であるかが決定される。予測の訂正が有効である場合、訂正パラメータは、例えば、図4に関連して説明したように、符号化するブロックの近傍のテンプレートに対して決定されたレート/歪みコストに基づいて決定される。次に、決定されたパラメータを用いて予測が補正される。
【0089】
114において、ブロックは、決定された予測に基づいて符号化される。レート/歪みコストに応じて、ブロックは、110において予測が決定されたインター予測モードを使用して、又はより低いレート/歪みコストをもたらす別の符号化モードを使用して符号化され得る。
【0090】
図12は、一実施形態による、ビデオ内のブロックを復号化するための方法1200の一例を示す。一実施形態によれば、方法1200は、図3を用いて説明したデコーダにおいて実施することができる。
【0091】
120において、ブロックについて予測が決定される。ブロックの予測を決定するために、符号化モードを表す少なくとも1つの符号化パラメータが、ブロックのビットストリームから復号化される。一実施形態によれば、ブロックを符号化するために使用される符号化モードは、少なくとも2つの動き候補の動き情報を継承する少なくとも1つの動き候補の動き情報を使用する。
【0092】
121において、動きベクトルと参照フレームインデックスとを含む動き情報が、2つ以上の動き候補からブロックについて決定される。予測、すなわち予測ブロックは、次に、参照ピクチャの動き補償を使用して、導出された動きベクトル及び参照フレームインデックスから計算される。
【0093】
122において、少なくとも2つの動き候補の対応するインジケータの値に基づいて、予測の訂正を有効又は無効にするインジケータの値が決定される。インジケータは、例えば、上述したLICツールのインジケータであってもよい。
【0094】
123において、ブロックに対して122で設定されたインジケータに基づいて、予測の訂正が有効であるか無効であるかが決定される。予測の訂正が有効にされる場合、訂正パラメータは、例えば、図4に関連して説明したように、復号化するブロックに近傍するテンプレートに対して決定されるレート/歪みコストに基づいて決定される。次に、決定されたパラメータを用いて予測が補正される。
【0095】
124において、決定された予測に基づいてブロックが復号化され、再構成される。
【0096】
112又は122において、ブロックのためのインジケータの値を決定するために異なる変形が使用され得る。
【0097】
一変形形態によれば、インジケータの値を決定するために、インジケータの値は、少なくとも2つの動き候補のうちの少なくとも1つの重要度に基づく。
【0098】
別の変形形態によれば、インジケータがブール値として表され得るとき、インジケータの値を決定するために、インジケータの値は、少なくとも2つの動き候補のインジケータの値に対して実行されるOR演算又はAND演算から取得される。
【0099】
別の変形形態によれば、少なくとも2つの動き候補全てについてのインジケータの値が、予測の訂正が有効であることを示す場合、インジケータの値は、予測の訂正が有効であることを示す値に設定される。
【0100】
別の変形形態によれば、少なくとも2つの動き候補の少なくとも1つについてのインジケータの値が、予測の訂正が有効であることを示す場合、インジケータの値は、予測の訂正が有効であることを示す値に設定される。
【0101】
ペアワイズ動き候補に対するLICインジケータ継承
一実施形態によれば、少なくとも2つの動き候補の動き情報を使用する符号化モードは、上述したようにマージモードである。この実施形態によれば、動き候補リストはペアワイズ動き候補を含む。ペアワイズ候補は、動き候補リストに既に存在する2つの動き候補の平均として構築される。例えば、VVC規格では、使用される2つの動き候補は最初の2つの動き候補である。各参照フレームリストに対して:
○両方の動き候補が参照フレームに関連付けられた動きベクトルを有する場合
■ペアワイズ動き候補は、第1の動き候補の参照フレームを用いて平均動きベクトルを得る、
○そうでない場合、
■1つの動き候補のみが参照フレームに関連付けられた動きベクトルを有する場合
●ペアワイズ動き候補は、この動き候補の動きベクトル及び参照フレームを得る、
■その他
●ペアワイズ動き候補は、この参照フレームリストについて未定義である。
【0102】
変形例によれば、ペアワイズ動き候補は、これらの動き候補の両方がLICインジケータの同じ値を保持する場合、入力動き候補のLICインジケータを継承することができ、これは、ペアワイズ動き候補がこの共通のLICインジケータを継承することを意味し、そうでない場合、LICインジケータは偽に設定される。この変形は、入力された動き候補のLICインジケータ間の「and」演算として、LICpairwise=LICcand0及びLICcand1として実行することができ、LICpairwise、LICcand0、LICcand1は、それぞれ、ペアワイズ動き候補、第1の動き候補、及び第2の動き候補のLICインジケータを表す。
【0103】
別の変形形態によれば、入力動き候補のうちの1つが真に等しいLIC値を有する場合、ペアワイズ動き候補は、このLIC値から継承することができる。この変形形態は、LICpairwise=LICcand0又はLICcand1として、入力動き候補のLICインジケータ値間の「or」演算として実行され得る。
【0104】
別の変形例では、ペアワイズ構成を見ると、以下の表1に示すように、第1の入力動き候補の参照フレームに向かうバイアスがあることが分かる。LICは、現在のフレームと参照フレームとの間の局所的な照明変化を補償することを目的としており、したがって、このバイアスを考慮することによって、ペアワイズ動き候補についてのLICインジケータ継承を調整することが可能である。
【0105】
【表1】
【0106】
表1は、入力動き候補(入力cand0、入力cand1)からのペアワイズ動き候補の参照フレーム継承の例を示す。セル内の×印は、対応する入力動き候補が対応する参照ピクチャリスト(L0,L1)からの参照ピクチャを使用することを示す。
【0107】
表1に見られるように、第1の入力動き候補が双方向であるとき、又は両方の入力動き候補が同じ参照フレームリストにわたって単方向であるとき(表1において灰色で強調されたケース)、ペアワイズ動き候補は、この第1の動き候補の参照フレームのみを使用する。その場合、ペアワイズ動き候補に対するLICインジケータの値は、この第1の入力動き候補のLICインジケータの値に設定される。
【0108】
他の全てのケースでは、上述した2つの変形のうちの1つを使用して、LICインジケータの値を決定することができる。
【0109】
この実施形態は、以下によって再開することができる:
第1の入力動き候補が双方向であるか、又は両方の入力動き候補が同じ参照フレームリストにわたって単方向である場合、LICpairwise=LICcand0である。
そうでない場合、LICpairwise=LICcand0及び/又はLICcand1である。
【0110】
同じ原理は、別のマージ候補のリスト1部分と組み合わされた1つのマージ候補のリスト0部分を選ぶHEVCのような組み合わされた候補にも適用され得る。同様に、同じ原理は、2つの空間的候補及び1つの時間的候補を平均化するSTMVP(空間-時間動きベクトル予測子)にも適用することができる。
【0111】
ゼロ動き候補のためのLICインジケータ
例えばマージリストのような動き候補リストを構築するとき、リスト内の動き候補の最大許容数よりも少ない場合、リストは、LICインジケータが訂正が無効であることを示す値に設定されるゼロ動きで満たされる。ゼロ動きは、以下のように動き候補リストに追加される:
-各リスト内の可能な参照フレームの最小数に達するまで、各参照フレームリストの各参照フレームに関連付けられたゼロ動き。例えば、リスト0(L0)が4つの参照フレームを含み、リスト1(L1)が3つしか含まない場合、ゼロ動きは以下の通りである:
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-L0の参照ピクチャ1を用いた(0,0)+L1の参照ピクチャ1を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-L0の参照ピクチャ2を用いた(0,0)+L1の参照ピクチャ2を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-次に、動き候補リストが満たされるまで、各リストの第1の参照フレームに関連付けられたゼロ動きが、以下のように追加される:
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-...
【0112】
動き候補リストを満たすそのような方法は、予測の訂正を常に無効にした。これは、符号化効率、訂正ツールの使用、及びその継承メカニズムに影響を与える。
【0113】
一実施形態によれば、ブロックの少なくとも1つの空間的近傍ブロックから動き候補のリストを構築するとき、リスト内の動き候補の数が最大許容数未満であり、リストがゼロ動きベクトル及びインジケータの第1の値を有する動き候補を含まない場合、ゼロ動きベクトル及びインジケータの第1の値を有する動き候補がリストに追加される。
【0114】
変形形態によれば、リスト内の動き候補の数が最大許容数未満であり、リストがゼロ動きベクトル及びインジケータの第1の値を有する動き候補を含む場合、ゼロ動きベクトル及びインジケータの第2の値を有する動き候補がリストに追加され、インジケータの第2の値はインジケータの第1の値とは異なる。
【0115】
これらの変形例のいずれにおいても、最大許容数に達するまでゼロ動きベクトルをリストに追加することができ、追加される各ゼロ動きベクトルはインジケータの異なる値を有するか、又はインジケータがいくつかの値をとることができる場合には、ゼロ動きベクトルに関連付けられたインジケータの値を交互にする。
【0116】
一実施形態によれば、全ての参照フレームにわたるゼロ動きは修正されないが、第1の参照フレームを有するゼロ動きは動き候補リストに既に追加されているので、リスト内の動き候補の多様性を増加させることが望ましい。一実施形態によれば、動きベクトル及び既にリストに存在する参照フレームリストの参照ピクチャを有する動き候補に関連付けられたLICインジケータの値とは異なるLICインジケータの値を有する動き候補リストに、動き候補が追加される。
【0117】
上記で説明した例では、第1の参照フレーム及び無効にされたLICインジケータ値を有するゼロ動きが動き候補リストに既に追加されており、次いで、第1の参照フレームを有するゼロ動きがリストに追加されるが、LICインジケータ値は有効にされる。変形例によれば、いくつかのゼロ動きが追加される場合、LICインジケータ値は、リスト内の多様性を維持するために、追加時に切り替えられる。
【0118】
上記の例におけるゼロ動き候補の追加は、次のようになる:
-各参照フレームリストの各参照フレームに関連付けられたゼロ動き:
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-L0の参照ピクチャ1を用いた(0,0)+L1の参照ピクチャ1を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-L0の参照ピクチャ2を用いた(0,0)+L1の参照ピクチャ2を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-各リストの第1の参照フレームに関連付けられたゼロ動き:
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を有効にするLICインジケータ。
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を有効にするLICインジケータ。
-L0の参照ピクチャ0を用いた(0,0)+L1の参照ピクチャ0を用いた(0,0)、及び訂正を無効にするLICインジケータ。
-...
【0119】
変形形態では、動き候補リストに既に存在する場合、全ての参照フレームにわたるゼロ動きをチェックすることができる。ゼロ動き候補が既に存在する場合、それは反対のLICインジケータ値と共に動き候補リストに追加される。
【0120】
例えば、上記の例では、リストL0及びL1の両方の参照ピクチャ0についてのゼロ動き候補が、以下のようにリストに追加される:
-L0の参照ピクチャ0を有する(0、0)+L1の参照ピクチャ0を有する(0、0)、及びLICインジケータ無効化訂正を有する同じ動き候補がリスト中に既に存在する場合、LICインジケータ値有効化訂正、又は
-L0の参照ピクチャ0を有する(0、0)+L1の参照ピクチャ0を有する(0、0)、及びLICインジケータ有効化訂正を有する同じ動き候補がリスト中に既に存在する場合、LICインジケータ値無効化訂正。
【0121】
変形形態によれば、LICインジケータ値の切り替えプロセスは、各リストの第1の参照フレームにゼロ動きを追加するときにも適用され得る。
【0122】
幾何学的動き候補に対するLICインジケータ継承
上記で提示されたように、幾何学的モードは、2つの非矩形パーティションを組み合わせた。一変形形態によれば、各パーティションは、動き候補リストから選ばれた単方向動き情報を有し得る。
【0123】
ペアワイズ動き候補に関して、一実施形態によれば、幾何学的マージモードにおいて、パーティションについて決定された動き候補から継承されたLICインジケータの値は、入力動き候補LICインジケータ値に「and」又は「or」を適用することによって、LICGEO=LICpart0及びLICpart1,又はLICGEO=LICpart0又はLICpart1,として設定され、ここで、LICGEO、LICpart0、LICpart1は、それぞれ、現在のブロック、第1のパーティション、及び第2のパーティションのLICインジケータ値を表す。
【0124】
一変形形態では、幾何学モードは、他のパーティションよりも大きいパーティションを有することを可能にするので、現在のブロックのLICインジケータ値は、より大きいパーティションのLICインジケータ値に設定される。例えば、パーティションのサイズは、パーティション内のピクセル数として評価することができる。
【0125】
図13は、LICパラメータ決定のために使用され得るブロックの上部のL字形テンプレートと共有されるエッジを有する幾何学的パーティションの例を示す。図13(a)では、パーティションP0は、パーティションP1よりも大きいエッジをテンプレートと共有し、図13(b)では、パーティションP1は、パーティションP0よりも大きいエッジをテンプレートと共有する。一変形形態によれば、現在のブロックのLICインジケータ値は、他のパーティションよりも大きいエッジをテンプレートと共有するパーティションのLICインジケータ値に設定される。この変形例によれば、LICインジケータ値は、テンプレートと最大の近傍を共有するパーティションから継承される。
【0126】
上記の変形形態のいずれか1つと組み合わせることができる変形形態によれば、テンプレートと共有されるパーティションのエッジが同等であるか、又はパーティションのサイズが同等である場合、LICインジケータ値は、両方のパーティションが訂正を可能にするLICインジケータ値を有する動き候補から継承するときに訂正を可能にする値にLICインジケータを設定する変形形態に従って、又はパーティションのうちの少なくとも1つが訂正を可能にするLICインジケータ値を有する動き候補から継承するときに訂正を可能にする値にLICインジケータを設定する変形形態に従って定義することができる。
【0127】
別の変形形態によれば、テンプレートと共有される近傍の量を閾値と比較することができる。例えば、パーティションがその近傍の90%超をL字形境界と共有する場合、ブロックのLICインジケータ値は、このパーティションのLICインジケータ値に設定され、そうでない場合、上述の変形のうちの1つが使用される。
【0128】
構築されたアフィン動き候補に対するLICインジケータ継承
一実施形態によれば、少なくとも2つの動き候補の動き情報を使用する符号化モードは、上述のようにブロックの空間近傍又は時間近傍ブロックから決定された少なくとも2つの動き候補を含むアフィンモデルに基づく。
【0129】
上記で提示した構築されたアフィンモデルは、空間近傍及び時間近傍ブロックから来る動きベクトルに基づく。構築されたモデルが6パラメータモデルである場合、それは3つの異なる空間近傍又は時間近傍から来る3つのCPMVを使用し、4パラメータモデルである場合、それは2つのCPMVのみを使用する。図5に示される、考慮される近傍は、B2、B3、又はA2位置から来る左上(TL)、B1又はB0位置から来る右上(TR)、A1又はA0位置から来る左下(BL)、及び時間的C0位置から来る右下(BR)である。
【0130】
可能なモデルの各々について、TL、TR、及び必要であればBLに対応する3つのCPMV(6パラメータの場合)又は2つのCPMV(4パラメータの場合)が、入力動き候補から導出される。例えば、第3のモデル(TL,BL,BR)から、構築されたモデル(TL,TR,BL)の3CPMVを導出することが可能であり、ここでTRはTL+BR-BLとして定義される。
【0131】
変形形態によれば、ペアワイズ動き候補及び幾何学的モードと同様に、LICインジケータ値は、「and」を適用することによって、関与する各入力動き候補によって保持されるLICインジケータ値に基づいて各モデルについて決定される:LICmodel=LICcand0及びLICcand1及びLICcand2、式中、LICmodel、LICcand0、LICcand1、及びLICcand2は、それぞれ現在のブロック、第1の動き候補、第2の動き候補、及び第3の動き候補のLICインジケータ値を表す。
【0132】
別の変形形態によれば、アフィンモデルが少なくとも3つの動き候補を含む場合、少なくとも3つの動き候補の少なくとも2つについてのインジケータの値が予測の訂正が有効であることを示すという決定に応答して、予測について決定されたインジケータの値が、予測の訂正が有効であることを示す。例えば、3つの入力動き候補を含む6パラメータモデルの場合、LICインジケータは、LICmodel=(LICcand0及びLICcand1)又は(LICcand0及びLICcand2)又は(LICcand1及びLICcand2)として決定することができる。
【0133】
別の変形形態によれば、時間BR候補は、メモリに記憶されたLICインジケータ値を有していなくてもよく、時間BR候補は、テストから除去することができ、テストは、
-構築されたモデルが第2、第3又は第4のモデルに由来する場合、LICmodel=LICcand0及びLICcand1、
-そうでなければ、LICmodel=LICcand0及びLICcand1及びLICcand2
【0134】
別の変形形態では、左上CPMVは動きの並進部分を記述するので最も重要なCPMVであり、他のCPMVはアフィン動きの回転部分及びズーム部分を記述しているので、現在のブロックのLICインジケータ値は左上CPMV動き候補のLICインジケータの値に設定され得る。左上のCPMV動き候補が入力動き候補に存在しない場合(第4のモデル)、LICインジケータの値は、代わりに右上の動き候補から継承され得る:
-TLが入力候補LICmodelである場合=LICTL,
-そうでなければ、LICmodel=LICTR
【0135】
別の変形形態では、第1の動き候補を含む少なくとも2つの入力動き候補が、訂正を可能にするLICインジケータ値を有する場合、構築されたモデルが、LICmodel=(LICcand0及びLICcand1)又は(LICcand0及びLICcand2)として、訂正を可能にするLICインジケータ値から継承するように、上記で提示された変形形態を組み合わせることができる。
【0136】
ゼロアフィン動き候補に対するLICインジケータ継承
マージモードにおける動き候補リスト構築に関して、アフィンマージリストが最後に最大数の許容候補を含まない場合、リストは、第1の参照フレームに関連付けられたゼロモデルで満たされる。
【0137】
一実施形態によれば、上記で提示されたマージモードに関して、ゼロアフィン動き候補が、訂正を有効化及び無効化するLICインジケータ値を有するゼロモデル間の切替えを用いて追加される。各リストの第1の参照フレームに関連付けられたゼロモデルは、以下のように追加される:
○L0の参照ピクチャ0を用いた{(0,0)(0,0)(0,0)} +L1の参照ピクチャ0を用いた{(0,0)(0,0)(0,0)}、及び訂正を無効にするLICインジケータ値、
○L0の参照ピクチャ0を用いた{(0,0)(0,0)(0,0)} +L1の参照ピクチャ0を用いた{(0,0)(0,0)(0,0)}、及び訂正を有効にするLICインジケータ値、
○L0の参照ピクチャ0を用いた{(0,0)(0,0)(0,0)} +L1の参照ピクチャ0を用いた{(0,0)(0,0)(0,0)}、及び訂正を無効にするLICインジケータ値、
○...
【0138】
変形例では、既に存在する値とは反対の値へのLICインジケータ値切り替えを開始するために、ゼロモデルがリスト内に既に存在するかどうかがチェックされる。
【0139】
図14に示される本原理の例によれば、通信ネットワークNETを介した2つの遠隔デバイスAとBとの間の送信コンテキストにおいて、デバイスAは、図1図13に示されるようなビデオを符号化するための方法を実装するように構成されたメモリRAM及びROMに関連するプロセッサを備え、デバイスBは、図1図13に関連して説明されるようなビデオを復号化するための方法を実装するように構成されたメモリRAM及びROMに関連するプロセッサを備える。
【0140】
一例によれば、ネットワークは、デバイスAからデバイスBを含む復号化デバイスにビデオを表す符号化データをブロードキャスト/送信するように適合されたブロードキャストネットワークである。
【0141】
デバイスAによって送信されることが意図された信号は、ビデオを表す符号化データを含む少なくとも1つのビットストリームを搬送する。ビットストリームは、本原理の任意の実施形態から生成されてもよい。
【0142】
図15は、パケットベースの送信プロトコルを介して送信されるそのような信号のシンタックスの一例を示す。各送信パケットPは、ヘッダH及びペイロードPAYLOADを含む。実施形態によれば、ペイロードPAYLOADは、上述した実施形態のいずれか1つに従って符号化された符号化ビデオデータを含むことができる。
【0143】
様々な方法が本明細書に説明されており、本方法の各々は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。ステップ又はアクションの特定の順序が方法の適切な動作のために必要とされない限り、特定のステップ及び/又はアクションの順序及び/又は使用は、修正又は組み合わされ得る。加えて、「第1の(first)」、「第2の(second)」などの用語は、様々な実施形態において、要素、コンポーネント、ステップ、動作など、例えば、「第1の復号化(first decoding)」及び「第2の復号化(second decoding)」を修正するために使用され得る。かかる用語の使用は、具体的に必要とされない限り、修正された動作に対する順序付けを意味するものではない。そのため、この実施例では、第1の復号化は、第2の復号化の前に実行される必要はなく、例えば、第2の復号化の前、第2の復号化の間、又は第2の復号化と重複する時間中に発生し得る。
【0144】
本出願に記載されている様々な方法及び他の態様を使用して、図2及び図3に示されたようなビデオエンコーダ200及びビデオデコーダ300のモジュール、例えば、動き補償、動き推定、動き改良モジュール(270、272、275、375、372)を修正することができる。更に、本態様は、VVC又はHEVCに限定されず、例えば、他の規格及び勧告、並びに任意のそのような規格及び勧告の拡張に適用することができる。特に断りのない限り、又は技術上除外されない限り、本出願に記載の態様は、個々に、又は組み合わせて使用することができる。
【0145】
本出願において、様々な数値が使用されている。具体的な値は、例示目的のためであり、記載の態様は、これらの具体的な値に限定されない。
【0146】
様々な実装形態は、復号化することを含む。本出願で使用される場合、「復号化」は、例えば、ディスプレイに好適な最終出力を生成するために受信された符号化シーケンス上で実行されるプロセスの全て又は一部分を包含し得る。様々な実施形態において、このようなプロセスには、例えば、エントロピ復号化、逆量子化、逆変換、及び差動復号化など、通常、デコーダによって行われるプロセスのうちの1つ以上が含まれる。「符号化プロセス」という句が、具体的に作業部分集合を指すことを目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0147】
様々な実装形態は、符号化を伴う。「復号化(decoding)」に関する上記の考察と同様に、本出願で使用される「符号化(encoding)」は、例えば、符号化されたビットストリームを生成するために入力ビデオシーケンスに対して実行されるプロセスの全て又は一部分を包含し得る。
【0148】
本明細書に記載の実装形態及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装され得る。たとえ単一の形式の実装形態の文脈でのみ考察されている場合でも(例えば、方法としてのみ考察されている)、考察された特徴の実装形態は、他の形式(例えば、装置又はプログラム)でも実装され得る。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実装され得る。本方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路又はプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサなどの装置において実装され得る。プロセッサはまた、例えば、コンピュータ、携帯電話、携帯型/パーソナルデジタルアシスタント(personal digital assistant、「PDA」)及びエンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスを含む。
【0149】
「一実施形態」若しくは「ある実施形態」又は「一実装形態」若しくは「ある実装形態」、またそれらの他の変形形態への言及は、その実施形態に関連して説明する特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体を通して様々な場所に現れる「一実施形態では」若しくは「ある実施形態では」又は「一実装形態では」若しくは「ある実装形態では」、また他の変形形態という句が現れるとき、必ずしも全てが同じ実施形態を指しているのではない。
【0150】
加えて、本出願は、様々な情報を「判定する」ことに言及し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上が含み得る。
【0151】
更に、本出願は、様々な情報に「アクセスすること」に言及する場合がある。情報にアクセスすることには、例えば、情報を受信すること、情報を(例えば、メモリから)取り出すこと、情報を記憶すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上が含まれ得る。
【0152】
加えて、本出願は、様々な情報を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は情報を(例えば、メモリから)取り出すことのうちの1つ以上を含み得る。更に、「受信すること」は、典型的には、動作、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することの間に、何らかの形で関与する。
【0153】
例えば、「A/B」、「A及び/又はB(A and/or B)」及び「A及びBのうちの少なくとも1つ(at least one of A and B)」の場合、次の「/」、「及び/又は(and/or)」、及び「のうちの少なくとも1つ(at least one of)」のいずれかの使用は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することが意図されていることを理解されるべきである。更なる実施例として、「A、B、及び/又はC(A,B,and/or C)」及び「A、B、及びCのうちの少なくとも1つ(at least one of A,B,and C)」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は第3のリストされた選択肢(C)のみの選択、又は第1及び第2のリストされた選択肢(A及びB)のみの選択、又は第1及び第3のリストされた選択肢(A及びC)のみの選択、又は第2及び第3のリストされた選択肢のみの選択(B及びC)のみ、又は3つ全ての選択肢の選択(A及びB及びC)を包含することが意図される。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
【0154】
また、本明細書で使用されるとき、「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、脱量子化のための量子化行列をシグナリングする。このように、ある実施形態では、同じパラメータが、エンコーダ側でもデコーダ側でも使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信することができる(明確なシグナリング)。これに対し、デコーダが既にその特定のパラメータと共に他のパラメータも有する場合は、単にデコーダがその特定のパラメータを知ること、及びそれを選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。いかなる実際の機能の送信も回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成することができることが理解されよう。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上記は、「信号」という語の動詞形に関連し、「信号」という語は、本明細書では名詞としても使用されることがある。
【0155】
当業者には明らかであるように、実装形態は、例えば、記憶又は送信され得る情報を搬送するようにフォーマットされた様々な信号を生成し得る。情報は、例えば、方法を実行するための命令又は記載された実装形態のうちの1つによって生成されたデータを含み得る。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされ得る。かかる信号は、例えば、(例えば、スペクトルの無線周波数部分を使用して)電磁波として、又はベースバンド信号としてフォーマットされ得る。フォーマットすることは、例えば、データストリームを符号化し、符号化されたデータストリームで搬送波を変調することを含み得る。信号が搬送する信号は、例えば、アナログ情報又はデジタル情報であり得る。信号は、知られているように、様々な異なる有線又は無線リンクによって送信され得る。信号は、プロセッサ可読媒体に記憶され得る。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
【国際調査報告】