(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-16
(54)【発明の名称】双予測重み付けを用いたDMVRのための方法及び装置
(51)【国際特許分類】
H04N 19/105 20140101AFI20241008BHJP
H04N 19/136 20140101ALI20241008BHJP
H04N 19/157 20140101ALI20241008BHJP
H04N 19/176 20140101ALI20241008BHJP
【FI】
H04N19/105
H04N19/136
H04N19/157
H04N19/176
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024515855
(86)(22)【出願日】2022-09-23
(85)【翻訳文提出日】2024-04-09
(86)【国際出願番号】 EP2022076564
(87)【国際公開番号】W WO2023046917
(87)【国際公開日】2023-03-30
(32)【優先日】2021-09-24
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2021-12-21
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】518341334
【氏名又は名称】インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100108213
【氏名又は名称】阿部 豊隆
(72)【発明者】
【氏名】ボルド、フィリップ
(72)【発明者】
【氏名】チェン、ヤー
(72)【発明者】
【氏名】ガルピン、フランク
(72)【発明者】
【氏名】ル リアネック、ファブリース
(72)【発明者】
【氏名】ロベール、アントワン
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MC11
5C159ME01
5C159PP04
5C159TA61
5C159TB08
5C159TC26
5C159TC27
5C159TD05
5C159TD06
5C159TD12
5C159UA02
5C159UA05
(57)【要約】
本明細書で開示される実施形態は、概して、ビデオコーディングのための方法及び装置に関する。例えば、ビデオコーディングのための双予測重み付けを用いたデコーダ側動きベクトル補正(DMVR)技法を使用する方法及び装置が提供される。一例では、ビデオコーディングのための方法は、照明変化を伴うモードであると判定することと、ブロックのための少なくとも1つのコーディングツールが有効化されていると判定することと、照明変化を伴うモードであること、及びブロックのための少なくとも1つのコーディングツールが有効化されていることに基づいて、DMVRプロセスを実施することと、を含む。
【特許請求の範囲】
【請求項1】
ビデオコーディングのための方法であって、
照明変化を伴うモードであると判定することと、
ブロックのための少なくとも1つのコーディングツールが有効化されていると判定することと、
i)前記照明変化を伴う前記モードであること、及びii)前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることに基づいて、デコーダ側動きベクトル補正(DMVR)プロセスを実施することと、を含む、方法。
【請求項2】
前記DMVRプロセスが、コーディングユニット(CU)サイズ、及び/又は前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることに基づいて、差分絶対値和(SAD)と平均除去SAD(MRSAD)との間で選択することを含む、請求項1に記載の方法。
【請求項3】
前記DMVRプロセスが、双予測重み(BPW)の重み指数が等しくない重みを示していることに基づいて、平均除去SAD(MRSAD)を使用することを選択することを含む、請求項1又は2に記載の方法。
【請求項4】
前記少なくとも1つのコーディングツールが、双予測重み(BPW)ツール、局所照明補償(LIC)ツール、又は重み付けされた予測(WP)ツールのうちのいずれかを備える、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記少なくとも1つのコーディングツールが、双予測重み(BPW)ツールを備え、前記DMVRプロセスが、前記BPWツールが有効化されていることに基づいて、双予測平均重み付けを使用することを選択することを含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることが、
双予測重み(BPW)の重み指数が等しくない重みを示していること、
局所照明補償(LIC)が有効化されているか若しくはLICフラグが真であること、又は
重み付けされた予測(WP)が前記ブロックのために有効化されていること、のうちのいずれかに基づいて判定される、請求項1~5のいずれか一項に記載の方法。
【請求項7】
参照ピクチャ予測における勾配を抽出することと、
抽出された前記勾配を使用して差分絶対値和(SAD)を計算することと、を更に含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
双方向オプティカルフロー(BDOF)ツールが、前記照明変化を伴う前記モードに基づいて、適用されない、請求項1~7のいずれか一項に記載の方法。
【請求項9】
現在のコーディングユニット(CU)サイズが閾値以下であるという判定に基づいて、DMVR適応を実施することを更に含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
現在のコーディングユニット(CU)サイズが閾値以上であるという判定に基づいて、DMVR適応を実施することを更に含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
補正された動きベクトル(MV)を用いて双予測重み付けを適用することを更に含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記DMVRプロセスを用いて双予測重み付けパラメータを導出することを更に含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
1つ以上のプロセッサを備える、ビデオコーディングのための装置であって、
前記1つ以上のプロセッサが、
照明変化を伴うモードであると判定し、
ブロックのための少なくとも1つのコーディングツールが有効化されていると判定し、かつ
i)前記照明変化を伴う前記モードであること、及びii)前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることに基づいて、デコーダ側動きベクトル補正(DMVR)プロセスを実施する、ように構成されている、装置。
【請求項14】
前記1つ以上のプロセッサが、コーディングユニット(CU)サイズ、及び/又は前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることに基づいて、差分絶対値和(SAD)と平均除去SAD(MRSAD)との間で選択するように更に構成されている、請求項13に記載の装置。
【請求項15】
前記1つ以上のプロセッサが、双予測重み(BPW)の重み指数が等しくない重みを示していることに基づいて、平均除去SAD(MRSAD)を使用することを選択するように更に構成されている、請求項13又は14に記載の装置。
【請求項16】
前記少なくとも1つのコーディングツールが、双予測重み(BPW)ツール、局所照明補償(LIC)ツール、又は重み付けされた予測(WP)ツールのうちのいずれかを備える、請求項13~15のいずれか一項に記載の装置。
【請求項17】
前記少なくとも1つのコーディングツールが双予測重み(BPW)ツールを備え、前記1つ以上のプロセッサが、前記BPWツールが有効化されていることに基づいて、双予測平均重み付けを使用することを選択するように更に構成されている、請求項13~16のいずれか一項に記載の装置。
【請求項18】
前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていると判定するときに、前記1つ以上のプロセッサが、
双予測重み(BPW)の重み指数が等しくない重みを示していること、
局所照明補償(LIC)が有効化されているか若しくはLICフラグが真であること、又は
重み付けされた予測(WP)が前記ブロックのために有効化されていること、を判定するように更に構成されている、請求項13~17のいずれか一項に記載の装置。
【請求項19】
前記1つ以上のプロセッサが、
参照ピクチャ予測における勾配を抽出し、
抽出された前記勾配を使用して差分絶対値和(SAD)を計算する、ように更に構成されている、請求項13~18のいずれか一項に記載の装置。
【請求項20】
双方向オプティカルフロー(BDOF)ツールが、前記照明変化を伴う前記モードに基づいて、適用されない、請求項13~19のいずれか一項に記載の装置。
【請求項21】
前記1つ以上のプロセッサが、
現在のコーディングユニット(CU)サイズが閾値以下であるという判定に基づいて、DMVR適応を実施するように更に構成されている、請求項13~20のいずれか一項に記載の装置。
【請求項22】
前記1つ以上のプロセッサが、現在のコーディングユニット(CU)サイズが閾値以上であるという判定に基づいて、DMVR適応を実施するように更に構成されている、請求項13~21のいずれか一項に記載の装置。
【請求項23】
前記1つ以上のプロセッサが、補正された動きベクトル(MV)を用いて双予測重み付けを適用するように更に構成されている、請求項13~22のいずれか一項に記載の装置。
【請求項24】
前記1つ以上のプロセッサが、前記DMVRプロセスを用いて双予測重み付けパラメータを導出するように更に構成されている、請求項13~23のいずれか一項に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2021年9月24日に欧州特許庁に出願された欧州特許出願第21306317.5号、及び2021年12月21日に欧州特許庁に出願された欧州特許出願第21306874.5号の優先権及び利益を主張するものであり、それらの出願の全内容は、それらの全体が以下に完全に記載されているかのように、かつ全ての適用可能な目的のために参照により本明細書に組み込まれている。
【0002】
(発明の分野)
本明細書で開示される実施形態は、概して、ビデオコーディングのための方法及び装置に関する。例えば、ビデオ(又は画像)コーディングのための双予測重み付けを用いたデコーダ側動きベクトル補正(decoder side motion vector refinement、DMVR)技法を使用する方法及び装置が提供される。
【背景技術】
【0003】
高い圧縮効率を実現するために、画像及びビデオコーディング方式は、通常、ビデオコンテンツ内の空間冗長性及び時間冗長性を活用するために予測及び変換を採用している。概して、イントラピクチャ又はインターピクチャ相関を利用するために、イントラ予測又はインター予測が使用され、次いで、予測誤差又は予測残差と呼ばれることが多い、原ブロックと予測ブロックとの間の差が、変換、量子化、及びエントロピコーディングされる。ビデオを再構成するには、エントロピ符号化、量子化、変換、及び予測に対応する逆プロセスによって、圧縮データを復号する。
【発明の概要】
【0004】
一実施形態によれば、ビデオ復号の方法が提供され、方法は、照明変化を伴うモードであると判定することと、ブロックのための少なくとも1つのコーディングツールが有効化されていると判定することと、照明変化を伴うモードである、かつブロックのための少なくとも1つのコーディングツールが有効化されているという判定に基づいて、デコーダ側動きベクトル補正(DMVR)を実施することと、を含む。
【0005】
一実施形態によれば、ビデオ復号の方法が提供され、方法は、照明変化を伴うモード(ICモード)の勾配又は重み付けモードの勾配に基づく、DMVR動き補正を含む。別の実施形態によれば、補正された動きベクトル(motion vector、MV)を用いて双予測重み付けを適用することを含む、ビデオ復号の方法が提供される。一実施形態によれば、DMVRを用いて双予測重み付けパラメータを導出することを含む、ビデオ復号の方法が提供される。別の実施形態によれば、双予測重み付けパラメータのそれぞれのセットは、DMVRを適用するための候補(例えば、MV候補)のリストの各候補(例えば、MV候補)に関連付けられている。
【0006】
別の実施形態によれば、1つ以上のプロセッサを備えるビデオ復号のための装置が提示され、当該1つ以上のプロセッサは、照明変化を伴うモードであると判定し、現在のブロックのための少なくとも1つのコーディングツールが有効化されていると判定し、照明変化を伴うモードである、かつ現在のブロックのための少なくとも1つのコーディングツールが有効化されているという判定に基づいて、デコーダ側動きベクトル補正(DMVR)を実施する、ように構成されている。
【0007】
別の実施形態によれば、ビデオ復号のための装置が提示され、装置は、照明変化を伴うモードであると判定するための手段と、現在のブロックのための少なくとも1つのコーディングツールが有効化されていると判定するための手段と、照明変化を伴うモードである、かつ現在のブロックのための少なくとも1つのコーディングツールが有効化されているという判定に基づいて、デコーダ側動きベクトル補正(DMVR)を実施するための手段と、を備える。
【0008】
1つ以上の実施形態によりまた、1つ以上のプロセッサによって実行されるとき、1つ以上のプロセッサに、上で説明される実施形態のうちのいずれかによる符号化方法又は復号方法を行わせる命令を含む、コンピュータプログラムを提供する。本実施形態のうちの1つ以上はまた、上で説明された方法に従って、ビデオデータを符号化するか、又は復号するための命令を記憶したコンピュータ可読記憶媒体を提供する。
【0009】
1つ以上の実施形態はまた、これまで述べた方法により起こされたビットストリームを記憶しているコンピュータ可読記憶媒体を提供する。1つ以上の実施形態によりまた、上で説明された方法に従って生成されたビットストリームを送信又は受信するための方法及び装置を提供する。
【図面の簡単な説明】
【0010】
より詳細な理解は、添付の図面と併せて、例示として示される、以下の詳細な説明から得られ得る。そのような図面の図は、詳細な説明と同様、例である。したがって、図及び詳細な説明は限定的であるとみなされるべきではなく、他の同等に効果的な実施例が可能であり、その可能性が高い。更に、図中の同様の参照数字(「参照」)は、同様の要素を示す。
【
図1】本実施形態の態様が実装され得るシステムのブロック図を例解する。
【
図2】ビデオエンコーダの一実施形態のブロック図を例解する。
【
図3】ビデオデコーダの一実施形態のブロック図を例解する。
【
図4】隣接する再構成されたサンプル及びMVで変換された対応する参照サンプルからLICパラメータを導出する一実施形態のブロック図を例解する。
【
図5】双方向オプティカルフロー(bi-directional optical flow、BDOF)を使用する一実施形態のプロセスを例解する。
【
図6】双予測信号を生成するためにデコーダ側動きベクトル補正を使用する一実施形態のプロセスを例解する。
【
図7】双予測信号を生成するためにDMVR及びBDOFを使用する一実施形態のプロセスを例解する。
【発明を実施するための形態】
【0011】
以下の詳細な説明では、本明細書に開示される実施形態及び/又は実施例の完全な理解を提供するために、多数の具体的な詳細が記載されている。しかしながら、このような実施形態及び実施例は、本明細書に記載される具体的な詳細の一部又は全部を伴わずに実践され得ることが理解されるであろう。他の例では、以下の説明を不明瞭にしないように、周知の方法、手順、コンポーネント及び回路は詳細に説明されていない。更に、本明細書に具体的に説明されていない実施形態及び実施例は、本明細書に明示的、暗黙的及び/又は本質的に(集合的に「提供される」)説明、開示又は他の方法で提供される実施形態及び他の実施例の代わりに、又はそれらと組み合わせて実践され得る。本明細書では、装置、システム、デバイスなど及び/又はそれらの任意の要素が、動作、プロセス、アルゴリズム、機能など及び/又はそれらの任意の部分を実行する様々な実施形態が説明及び/又は特許請求されているが、本明細書に説明及び/又は特許請求されている任意の実施形態は、任意の装置、システム、デバイスなど及び/又はそれらの任意の要素が、任意の動作、プロセス、アルゴリズム、機能など及び/又はそれらの任意の部分を実行するように構成されていると仮定することを理解されたい。
【0012】
図1は、様々な態様及び実施形態が実装され得るシステムの一例のブロック図を例解する。システム100は、以下に説明される様々なコンポーネントを含むデバイスとして具現化され得、本明細書に説明される態様のうちの1つ以上を実行するように構成されている。かかるデバイスの実施例としては、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電、及びサーバなどの様々な電子デバイスが挙げられる。システム100の要素は、単独で、又は組み合わせて、単一の集積回路、複数のIC、及び/又は個別のコンポーネントで具現化され得る。例えば、少なくとも1つの実施形態では、システム100の処理要素及びエンコーダ要素/デコーダ要素は、複数のIC及び/又は別個のコンポーネントにわたって分散している。様々な実施形態では、システム100は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通じて、他のシステム、又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム100は、本出願に説明される態様のうちの1つ以上を実装するように構成される。
【0013】
システム100は、例えば、本出願に説明される様々な態様を実装するために、内部にロードされた命令を実行するように構成された、少なくとも1つのプロセッサ110を含む。プロセッサ110は、埋め込み型メモリ、入力出力インターフェース、及び当該技術分野で既知であるように様々な他の回路を含み得る。システム100は、少なくとも1つのメモリ120(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム100は、記憶デバイス140を含み、この記憶デバイスは、限定されるものではないが、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ、磁気ディスクドライブ、及び/若しくは光ディスクドライブを含む、不揮発性メモリ並びに/又は揮発性メモリを含み得る。記憶デバイス140は、非限定的な例として、内部記憶デバイス、取り付け型記憶デバイス、及び/又はネットワークアクセス可能な記憶デバイスを含み得る。
【0014】
システム100は、例えば、データを処理して、符号化ビデオ又は復号ビデオを提供するように構成されたエンコーダ/デコーダモジュール130を含み、そのエンコーダ/デコーダモジュール130は、それ自体のプロセッサ及びメモリを含み得る。エンコーダ/デコーダモジュール130は、符号化機能及び/又は復号機能を実行するためにデバイス内に含まれ得るモジュールを表す。既知であるように、デバイスは、符号化及び復号モジュールのうちの一方又は両方を含み得る。加えて、エンコーダ/デコーダモジュール130は、システム100の別個の要素として実装され得るか、又は当業者に知られているように、ハードウェアとソフトウェアの組み合わせとしてプロセッサ110内に組み込まれ得る。
【0015】
本出願に説明される様々な態様を実行するためにプロセッサ110又はエンコーダ/デコーダ130上にロードされるプログラムコードは、記憶デバイス140内に記憶され、その後、プロセッサ110による実行のためにメモリ120上にロードされ得る。様々な実施形態によれば、プロセッサ110、メモリ120、記憶デバイス140、及びエンコーダ/デコーダモジュール130のうちの1つ以上は、本出願に説明されるプロセスの実行中に、様々な項目のうちの1つ以上を記憶し得る。かかる記憶された項目は、限定されるものではないが、入力ビデオ、復号ビデオ、又は復号ビデオの一部分、ビットストリーム、行列、変数、並びに、方程式、式、動作、及び動作論理の処理からの中間結果又は最終結果を含み得る。
【0016】
いくつかの実施形態では、プロセッサ110及び/又はエンコーダ/デコーダモジュール130の内部のメモリは、命令を記憶するため、及び符号化又は復号中に必要とされる処理のためのワーキングメモリを提供するために使用される。しかしながら、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ110又はエンコーダ/デコーダモジュール130のいずれかであり得る)の外部のメモリが、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ120及び/又は記憶デバイス140、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施形態では、外部不揮発性フラッシュメモリが、テレビのオペレーティングシステムを記憶するために使用される。少なくとも一実施形態では、RAMなどの高速外部ダイナミック揮発性メモリが、MPEG-2、HEVC、又はVVCなどのビデオコーディング動作及び復号動作のためのワーキングメモリとして使用される。
【0017】
システム100の要素への入力は、ブロック105に示されるように、様々な入力デバイスを通して提供され得る。このような入力デバイスとしては、(i)例えば、放送局によって無線で送信されるRF信号を受信するRF部、(ii)コンポジット入力端子、(iii)USB入力端子、及び/又は(iv)HDMI入力端子が挙げられるが、これらに限定されない。
【0018】
様々な実施形態では、ブロック105の入力デバイスは、当該技術分野において知られているように、関連付けられたそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択することと(また信号を選択する、又は信号を周波数帯域に帯域制限するとも称される)、(ii)選択された信号をダウンコンバートすることと、(iii)特定の実施形態で、(例えば)チャネルとして称され得る信号周波数帯域を選択するために、再度より狭い周波数帯域に帯域制限することと、(iv)ダウンコンバート及び帯域制限された信号を復調することと、(v)誤差訂正を実行することと、(vi)データパケットの所望のストリームを選択するために多重分離することと、に対して好適な要素に関連付けられ得る。様々な実施形態のRF部分は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤差訂正器、及びデマルチプレクサを含む。RF部分は、これらの様々な機能を実行するチューナを含み得、例えば、受信した信号をより低い周波数(例えば、中間周波数、若しくは近接ベースバンド周波数)に、又はベースバンドにダウンコンバートすることが含まれる。セットトップボックスの一実施形態では、RF部とその関連する入力処理要素は、有線(例えば、ケーブル)媒体上で送信されたRF信号を受信し、フィルタ処理し、ダウンコンバートし、また所望の周波数帯域に再びフィルタ処理することによって、周波数選択を行う。様々な実施形態では、上で説明される(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、並びに/又は、同様の若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、既存の要素の間に要素を挿入すること、例えば、増幅器及びアナログ-デジタル変換器を挿入することを含み得る。様々な実施形態において、RF部分は、アンテナを含む。
【0019】
加えて、USB及び/又はHDMI端末は、USB及び/又はHDMI接続全体にわたって、システム100を他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含み得る。入力処理の様々な態様、例えば、リードソロモン誤差訂正は、例えば、必要に応じて、別個の入力処理IC内又はプロセッサ110内に実装され得ることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて、別個のインターフェースIC内又はプロセッサ110内に実装され得る。復調され、誤差訂正され、かつ多重分離されたストリームは、例えば、プロセッサ110、及び出力デバイス上に提示するために、必要に応じてデータストリームを処理するメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ130を含む、様々な処理要素に提供される。
【0020】
システム100の様々な要素は、統合されたハウジング内に提供され得、統合されたハウジング内では、様々な要素は、好適な接続構成115、例えば、I2Cバス、配線、及びプリント回路基板を含む、当該技術分野で既知の内部バスを使用して相互に接続され、互いの間でデータを送信し得る。
【0021】
システム100は、通信チャネル190を介して他のデバイスとの通信を可能にする通信インターフェース150を含む。通信インターフェース150は、限定されるものではないが、通信チャネル190を介してデータを送信及び受信するように構成された送受信機を含み得る。通信インターフェース150は、限定されるものではないが、モデム又はネットワークカードを含み得、通信チャネル190は、例えば、有線及び/又は無線媒体内に実装され得る。
【0022】
データは、様々な実施形態において、IEEE802.11などのWi-Fiネットワークを使用して、システム100にストリーミングされる。これらの実施形態のWi-Fi信号は、Wi-Fi通信用に適合された通信チャネル190及び通信インターフェース150によって受信される。これらの実施形態の通信チャネル190は、典型的には、ストリーミングアプリケーション及び他のオーバーザトップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態では、入力ブロック105のHDMI接続によってデータを配信するセットトップボックスを使用して、システム100にストリーミングされたデータを提供する。更に他の実施形態では、入力ブロック105のRF接続を使用して、システム100にストリーミングされたデータを提供する。
【0023】
システム100は、出力信号を、ディスプレイ165、スピーカ175、及び他の周辺デバイス185を含む、様々な出力デバイスに提供し得る。他の周辺デバイス185は、実施形態の様々な例において、スタンドアロンDVR、ディスクプレーヤ、ステレオシステム、照明システム、及びシステム100の出力に基づいて、機能を提供する他のデバイス、のうちの1つ以上を含む。様々な実施形態では、制御信号は、AV.Link、CEC、又はユーザ介入あり若しくはユーザ介入なしでデバイス間制御を可能にする他の通信プロトコルなどのシグナリングを使用して、システム100とディスプレイ165、スピーカ175、又は他の周辺デバイス185との間で通信される。出力デバイスは、それぞれのインターフェース160、170、及び180を通じた専用接続を介してシステム100に通信可能に結合され得る。代替的に、出力デバイスは、通信インターフェース150を介し、通信チャネル190を使用して、システム100に接続され得る。ディスプレイ165及びスピーカ175は、例えば、テレビなどの電子デバイスにおいて、システム100の他のコンポーネントとともに単一ユニットに統合され得る。様々な実施形態では、ディスプレイインターフェース160は、ディスプレイドライバ、例えば、タイミングコントローラ(timing controller、T Con)チップを含む。
【0024】
ディスプレイ165及びスピーカ175は、代替的に、例えば、入力105のRF部分が個別のセットトップボックスの一部である場合、他のコンポーネントのうちの1つ以上から分離され得る。ディスプレイ165及びスピーカ175が外部コンポーネントである様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む、専用の出力接続を介して提供され得る。
【0025】
図2は、高効率ビデオコーディング(High Efficiency Video Coding、HEVC)エンコーダなどの例示的なビデオエンコーダ200を例解する。
図2はまた、HEVC規格に改善を加えたエンコーダ、又はJVET(Joint Video Exploration Team(ジョイントビデオエキスパートチーム)によって開発中のVVC(Versatile Video Coding)(多用途ビデオコーディング)エンコーダなど、HEVCと同様の技術を採用したエンコーダを例解し得る。
【0026】
本出願では、「再構成された(reconstructed)」及び「復号された(decoded)」という用語は、交換可能に使用され得、「符号化(encoded)された」及び「コード化(coded)された」という用語は、交換可能に使用され得、「画像(image)」、「ピクチャ(picture)」、及び「フレーム(frame)」という用語は、交換可能に使用され得る。通常、必ずしもそうではないが、「再構成された」という用語は、エンコーダ側で使用され、一方、「復号された」という用語は、デコーダ側で使用される。
【0027】
符号化される前に、ビデオシーケンスは、符号化前処理(201)、例えば、カラー変換を入力カラーピクチャに適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、又は圧縮に対してより弾力的な信号分布を得るために入力ピクチャコンポーネントの再マッピングを実施する(例えば、色コンポーネントのうちの1つのヒストグラム等化を使用して)ことを経ることができる。メタデータは、前処理に関連付けられ、ビットストリームに添付され得る。
【0028】
エンコーダ200では、以下に説明されるように、ピクチャは、エンコーダ要素によって符号化される。符号化されるピクチャは、例えば、CUという単位に分割され(202)、処理される。各ユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化される。ユニットがイントラモードで符号化されるとき、そのユニットは、隣接する再構成されたサンプルを使用してイントラ予測(260)を実施する。インターモードでは、動き推定(275)及び動き補償(270)が実施される。エンコーダは、ユニットを符号化するためにイントラモード又はインターモードのうちのどちらを使用すべきかを決定し(205)、例えば、予測モードフラグによってイントラ/インターの決定を示す。予測残差は、例えば、原画像ブロックから予測されたブロックを減算することによって(210)計算される。
【0029】
その予測残差は、次いで、変換され(225)、量子化される(230)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素は、ビットストリームを出力するためにエントロピコーディングされる(245)。エンコーダは、変換をスキップし、量子化を非変換残差信号に直接適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち、残差は、変換プロセス又は量子化プロセスを適用することなく直接コーディングされる。
【0030】
エンコーダは、符号化されたブロックを復号して、更なる予測のための参照を提供する。量子化された変換係数は、予測残差を復号するために逆量子化され(240)、逆変換される(250)。復号された予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構成される。ループ内フィルタ(265)は、例えば、符号化アーチファクトを低減するためのデブロッキング/サンプル適応オフセット(Sample Adaptive Offset、SAO)フィルタリングを実施するために、再構成されたピクチャに適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
【0031】
図3は、例示的なビデオデコーダ300のブロック図を例解する。デコーダ300では、以下に説明するように、ビットストリームが、デコーダ要素によって復号される。ビデオデコーダ300は、概して、
図2に説明される符号化パスとは逆の復号パスを実施する。エンコーダ200もまた、概して、ビデオデータを符号化することの一部としてビデオ復号を実施する。
【0032】
特に、デコーダの入力は、ビデオビットストリームを含み、このビデオビットストリームは、ビデオエンコーダ200によって生成され得るものである。ビットストリームは、最初に、変換係数、動きベクトル、及び他のコーディングされた情報を取得するために、エントロピ復号される(330)。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。デコーダは、したがって、復号されたピクチャ分割情報に従ってピクチャを分割し得る(335)。変換係数は、予測残差を復号するために、逆量子化され(340)、逆変換される(350)。復号された予測残差と予測されたブロックとを組み合わせて(355)、画像ブロックが再構成される。イントラ予測(360)又は動き補償予測(すなわち、インター予測)(375)から、予測ブロックを得ることができる(370)。ループ内フィルタ(365)は、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(380)に記憶される。
【0033】
復号されたピクチャは、復号後処理(385)、例えば、逆カラー変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)、又は符号化前処理(201)において実施された再マッピングプロセスの逆を実施する逆再マッピングを更に経ることができる。復号後処理は、符号化前処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用することができる。
【0034】
様々な実施形態では、ビデオコーディングのために、双予測動きベクトルはデコーダ側で補正され、照明は局所的かつ時間的に変化し得る。双予測技法は、ハイブリッドビデオコーディングにおいて使用されている基本的なツールである。双予測技法は、2つの単予測の平均として構築され、より安定した信号予測をもたらし、コーディングアーチファクトを低減し、一貫した時間的照明変化を本質的に補償する。照明変化が生じないとき、デコーダ側動きベクトル補正(DMVR)技法は、例えば、動きを局所的に補正しながらシンタックスの量を低減することによって、通常の双予測技法を改善することを可能にする。しかしながら、DMVRは、一般的に局所的な照明変化と互換性がない。
【0035】
現在の実装形態では、局所照明補償(Local Illumination Compensation、LIC)ツールは、予測信号を重み付けすることによって局所照明補償を実施し、重み付けされた予測(weighted prediction、WP)ツールは、大域照明補償を実施し、双予測重み(bi-prediction weight、BPW)ツールは、等しくない双予測平均重み付けを可能にする。現在の実装形態では、全てのこれらのツール(例えば、LIC、WP、CUレベル重み付き双予測(bi-prediction with CU-level weights、BCW)又はBPW)は、DMVRと互換性がない。
【0036】
照明補償ツール
重み付けされた予測(WP)
いくつかの例では、重み付けされた予測(WP)は、重み及びオフセット(wi;offi)を、CTUのグループ(例えば、スライス及び/又はピクチャ)ごとに明示的に定義することを可能にする。重みは、復号ピクチャバッファ(Decoded Picture Buffer、DPB)に記憶された各リスト(L0及びL1)の各参照ピクチャ「i」の各コンポーネントに関連付けられ、ブロック予測に適用される。
【0037】
重み及びオフセットは、概して、ブロックのグループに共通の高レベルシンタックス(high-level syntax、HLS)でコーディングされる。例えば、重み及びオフセットは、スライスヘッダ又はピクチャヘッダにおいてコーディングされ得、スライスについて固定され得る。WPは、単方向予測(式1)又は双予測(式2)の両方に適用され得る。現在のCUが、リストL0の参照refIdx0を用いて単方向でコーディングされている場合、1は、refIdx0に関連付けられた重み及びオフセット(w0;off0)を示す。
単方向予測:Pred’0=((w0.Pred0[x]+(1<<(シフト-1)))>>シフト)+off0 (式1)
双予測:Pred’01=((w0.Pred0[x]+w1.Pred1[x]+off01)>>(シフト+1) (式2)
式中、off01=(off0+off1+1)<<シフト
【0038】
CUレベル重み付き双予測(BCW又はBPW)
VVCでは、双予測モードは、2つの予測信号の重み付き平均化(例えば、
図7の745)を可能にするために、単純平均化(例えば、
図7の双予測平均740)を超えて拡張される。
P
bi-pred=((8-w)
*P
0+w
*P
1+4)>>3 (式3)
【0039】
重み付き平均双予測では、5つの重み付けw∈{-2、3、4、5、10}が許容され得る。通常の単純平均化は、w=4に対応する。使用される重み付けの数は、それぞれの構成及び/又は条件に依存し得る。例えば、低遅延ピクチャの場合、5つの重み付け全てが使用される。非低遅延ピクチャの場合、3つの重み付け(w∈{3,4,5})が使用される。一例では、BCW重み指数(例えば、どの重みを使用すべきかを示す指数)は、(例えば、非マージモードにおいて)CUごとにコーディングされる。別の例では、BCW重み指数は、(例えば、マージモードにおいて)1つ以上の再構成された隣接CUから導出される。
【0040】
局所照明補償(LIC)
局所照明補償(LIC)は、専用のLICパラメータを用いてブロック予測を補償することを可能にする。LICツールは、HLSにおいて有効化され得、また、ブロックレベルでシグナリングされるか、又はマージモードの場合、再構成された隣接CUから導出される。一例では、LICフラグ(例えば、LICツールが現在のCUに適用されるかどうかを示すフラグ又は指示)がブロックレベルでコーディングされ得る。別の例では、LICフラグ又はLIC指示は、1つ以上の再構成された隣接CUから導出され得る。LICツールが適用される場合、LICパラメータのセットが導出される。
図4を参照すると、例えば、LICが現在のブロックに対してアクティブ化されるとき、デコーダは、1)予測されるべき現在のブロックの左及び/又は上(例えば、L字形)に局所化されたいくつかの再構成されたピクチャサンプルと、2)動き補償されたブロックの左及び/又は上に局所化されたいくつかの参照ピクチャサンプルとに基づいて、いくつかのLICパラメータを計算する。更に
図4を参照すると、共同探索モデル(joint exploration model、JEM)では、LICパラメータは、隣接する再構成されたサンプルと、動きベクトル(MV)で変換された対応する参照サンプルと、から導出される。
【0041】
LICツール又はモデルは、(例えば、式4に示されるように)通常の現在のブロック予測に適用される単純な線形補正に基づき得る。
Ycorr(x)=((a.Ypred(x)+(1<<(シフト-1)))>>シフト)+b (式4)
式中、Ypred(x)は、位置xにある予測サンプル値であり、
Ycorr(x)は、位置xにある補正された予測サンプル値であり、
(a,b)は、LICパラメータである。
【0042】
双予測の場合、LICモデルは3つのパラメータ(a0、a1、b)を含むことができ、LIC補正は、
Ycorr(x)=((a0.Ypred0(x)+a1.Ypred0(x)+(1<<(シフト-1)))>>シフト)+b (式4b)である。
【0043】
最新技術は、例えば、平均二乗最小化法に基づいて、再構成されたサンプル及び参照サンプルからLICパラメータを導出するためのいくつかの方法を含む。
【0044】
いくつかの実装形態(例えば、拡張圧縮モデル(Enhanced Compression Model、ECM))では、LICは双予測のために無効化される。
【0045】
動き補正ツール
双方向オプティカルフロー(BDOF)
多用途ビデオコーディング(Versatile Video Coding、VVC)では、双方向オプティカルフロー(BDOF)ツールがルーマコンポーネントに適用される。BDOFツール又はBDOFモードは、(式5に示されるように)オプティカルフロー方程式の概念に基づいており、オブジェクトの動きが滑らかであり、その輝度が、考慮された時間間隔に沿って一定であると仮定している。いくつかの場合、方程式を簡略化するために、時間変動は、ゼロであると仮定される。
∂I/∂t+VX.∂I/∂x+VY.∂I/∂y=0 (式5)
【0046】
一例では、各4×4サブブロックについて、L0予測サンプルとL1予測サンプルとの間の差を最小化することによって動き補正が計算される。次いで、動き補正を使用して、例えば
図5に示されるように、2つの参照ピクチャ間の線形変位を仮定し、オプティカルフローのエルミート補間に基づいて、4×4サブブロック内の双予測サンプル値を調節する。
【0047】
変形形態では、動き補正は、動き補償後に予測サンプルにオフセット補正を加えること(
図7の730に示される)によって行われ得る。
【0048】
VVC及びECMにおいて、BDOFは、LIC、WP、又はBCWのうちのいずれかが有効化されているときに無効化される。
【0049】
デコーダ側動きベクトル補正(DMVR)
VVCでは、マージモードにおけるMVの精度は、双予測において適用されるバイラテラルマッチング(bilateral-matching、BM)ベースのデコーダ側動きベクトル補正を使用して高められる。参照ピクチャリストL0及び参照ピクチャリストL1内の2つの初期MV(MV0及びMV1)の周りで、補正されたMVが探索される。補正されたMVは、L0及びL1内の2つの参照ブロック間の最小バイラテラルマッチングコストに基づいて、初期MVの周囲で導出される。BMは、ローカルサーチを実施して、予測0及び予測1に対して対称的に整数サンプル精度intDeltaMV補正を導出する。
【0050】
図6を参照すると、初期MVの周りの各MV候補に基づく(ブロック610と620との間の)差分絶対値和(sum of absolute difference、SAD)が計算される。最も低いSADを有するMV候補は、補正されたMVになり、双予測信号を生成するために使用されることになるであろう。ECMでは、SADは、(例えば、式6に示されるように)初期MVの周りの補正(intDeltaMv)を考慮に入れたコスト関数で置き換えられる。
bilCost=mvDistanceCost+sadCost (式6)
【0051】
ECMでは、大きいCU(例えば、64よりも大きいサイズ)の場合、SADは、2つ(又はそれ以上)の参照ブロック間の歪みのDC効果を除去するために使用/適用される平均除去SAD(Mean Removed SAD、MRSAD)で置き換えられる。
【0052】
VVCでは、サブペル補正は、パラメトリック誤差表面ベースのサブピクセルオフセット推定における補間を介して導出され得る。一例では、中心位置コスト及び中心からの4つの隣接位置におけるコストを使用して、二次元(two-dimensional、2D)放物線状誤差表面方程式を当てはめる。
【0053】
VVCでは、DMVRの適用は制限され、以下のモード及び特徴のうちの1つ以上(又は全て)を用いてコーディングされるCUに対してのみ適用される(例えば、
図7の702、DMVR条件を参照)。
・双予測MVを用いたCUレベルマージモード;
・現在のピクチャに対して、1つの参照ピクチャが過去にあり、別の参照ピクチャが将来にある。2つの参照ピクチャから現在のピクチャまでの距離(例えば、POC差分)は同じである;
・両方の参照ピクチャは短期参照ピクチャである;
・CUが、64超のルーマサンプルを含む;
・CUの高さ及びCUの幅の両方が、8個以上のルーマサンプルである;
・BCW重み指数が、等しい重みを示す(又はBCWツールが無効化されている);
・WPが現在のブロックに対して有効化されていない;
・CIIPモードが現在のブロックに対して使用されていない;
【0054】
ECMでは、DMVRは、LICが有効化されているときに無効化される。デコーダ側動きベクトル補正は、3つのステップ(例えば、
図7参照)又はこの3つのステップの任意のサブセット若しくは組み合わせで実行される。第1のパス/ステップでは、上で描示されるように、符号化ブロックにBMを適用することによって、補正されたMVが導出される(710)。第2のパス/ステップでは、BMを16×16グリッドサブブロックに適用することによって、補正されたMVが導出される(715)。第3のステップでは、BDOFを8×8グリッドサブブロックに適用することによって、補正されたMVが導出される。各8×8サブブロックについて、BDOF補正が適用される(740)。一例では、DMVRのためのMV候補のリストは、等しい重み付けに設定された関連するBCW重み付けを有する1つ以上の再構成された隣接ブロックから構築される(又はそれに基づく、又はそれから導出される)。MV候補のリストのどの候補(例えば、MV候補)が使用されるべきかを識別する指数がコーディングされ得る。例えば、(現在のブロックを復号するためにどの候補が使用されるべきかを識別する)指数が、現在のブロックに対してコーディングされる。
【0055】
ECMでは、
図7を参照すると、DMVR及びBDOF要約を使用する全体的なプロセス700が提供される。一実施形態では、プロセス700は、デコーダ側動きベクトル補正を含み、DMVRのいくつかの変形形態は、1つ以上のステップ又は動作、例えば、ステップ/動作715及び/又はステップ/動作730を除去することによって、プロセス700を簡略化することに基づき得る。
【0056】
様々な実施形態では、DMVRツールは、双予測コーディング性能を改善することができる。しかしながら、照明変化のいくつかの場合、例えば、LICツール、BCWツール、又はWPツールのうちのいずれかを用いて実行される照明変化では、DMVR動き補正は、一定照明仮定に基づくため、適用されない場合がある。言い換えれば、現在の実装形態では、DMVRツールが適用される場合、LICツール、BCWツール、又はWPツールのいずれも有効化され得ない。VVC又はECMの現在の実装形態では、DMVRツールは、デフォルトの等しい重み付けに等しくないLIC、WP、又はBCWを用いてコーディングされたCUに対して無効化される。そのため、ビデオコーディングでは、DMVRが、例えばLIC、WP、又はBCWなどの重み付けされた予測ツールに適用され得るように、DMVRを修正することが望まれる。
【0057】
一例では、影響を受けるコーデックモジュールとしては、
図2のコーディングモジュール245、270、275、及び/又は
図3の330、375が挙げられ得る。
【0058】
いくつかの現在のVVC設計及びECM設計では、DMVRアルゴリズムは、シーン内に照明変化がないと仮定する。(局所的な)照明変化に対してよりロバストであり、双予測混合を含む他のツールと互換性があるように、DMVRを適応させることを提案する。
【0059】
ICモード/重み付けモードの勾配に基づくDMVR動き補正
一実施形態では、照明変化に対してよりロバストであるために、DMVRは、照明変化を伴うモード(例えば、ICモード)に適用され得るように適合される。次いで、制限を有効化するDMVRの動作(例えば、
図7のDMVR条件702を参照)は、ツール制限(例えば、LICツール制限)を除去し得る。これらのツール/モード(例えば、LICツール/モード)は、以下のモード(又は条件)、すなわち、1)BCW重み指数が等しくない重みを示している、2)LICが有効化されている(例えば、LICフラグが真である)、かつ/又は3)WPが現在のブロックに対して有効化されている、のうちの少なくとも1つを含み得る。
【0060】
一例では、DMVR適応は、本明細書で考察される1つ以上の動作において実施され得る。照明変化を伴うモードの場合、DMVRのステップ1及びステップ2は、SADよりも照明変化に敏感でない歪みメトリックを使用するように修正され、任意のCUサイズに適用されることができる。一例では、SADはMRSADで置き換えられる。SADとMRSADとの間の選択は、1)CUサイズ、及び/又は2)現在のブロックに対するBCWツール、LICツール、又はWPツールのうちの少なくとも1つの有効化に基づき得る。
【0061】
SAD、MRSAD、及び勾配を用いて計算されたSADに使用される例示的な式が、本明細書において提供される。
【0062】
【0063】
別の例では、L0予測及びL1予測における勾配が抽出され、これらの勾配サンプルを用いてSADが計算される。例えば(式7)。
grad_LX[x,y]=abs(pred_LX[x,y]-pred_LX[x+1,y])+abs(pred_LX[x,y]-pred_LX[x,y+1])(式7)
式中、LX={L0,L1}。
【0064】
一例では、BDOFは、照明変化を伴うモードの場合、又はBCW重みが等しくない(例えば、各それぞれのBCW重みが異なる)場合、適用されない。
【0065】
別の例では、(ICモード/重み付けモードの勾配に基づく)DMVR動き補正は、現在のCUサイズで調整される。一例では、CUサイズ(例えば、現在のCUサイズ)が閾値よりも小さい(又は閾値に等しい)場合、DMVR適応が有効化/実施され、そうでない場合、通常のDMVRが適用される。別の例では、CUサイズ(例えば、現在のCUサイズ)が閾値よりも大きい(又は閾値に等しい)場合、DMVR適応が有効化/実施され、そうでない場合、通常のDMVRが適用される。
【0066】
補正されたMVを用いた双予測重み付けの適用
一実施形態では、MVが補正されると、継承された等しくないBPW(又はBCW)重みを使用する双予測重み付けが適用され得る(例えば、式3)。一例では、継承された等しくないBPW(BCW)重みを使用する双予測重み付けは、補正されたMVの導出のために、(ICモード/重み付けモードの勾配に基づく)DMVR動き補正と組み合わせることができる。一実施形態では、DMVRを適用するためのMV候補のリストを構築(生成又は判定)するとき、関連する継承されたBPW(又はBCW)重みは等しくない場合がある。例えば、それぞれのBPW(又はBCW)の重みのペアの各値は、異なる。この例では、候補のリストのうちの各候補は、1つ以上のMV(例えば、MVのペア)を備え、各候補は、(BPW又はBCW)重みのペア(w0;w1)に関連付けられ、w0は、w1とは異なり得る。
【0067】
LICフラグが真である場合、LICパラメータは(例えば、従来の方法で)導出され得、LIC重み付けが適用される(式4b)。WPが有効化されている場合、最終的な双予測を形成するために、通常のWP重み付けが適用され得る。BPWの場合、BPW重み指数は継承され得る(例えば、マージモード)。
【0068】
一例では、補正されたMVを用いた双予測重み付けは、現在のCUサイズで調整され得る。一例では、CUサイズ(例えば、現在のCUサイズ)が閾値よりも小さい(又は閾値に等しい)場合、(等しくない)重み付けが有効化/実施され、そうでない場合、通常のDMVRが適用される。別の例では、CUサイズ(例えば、現在のCUサイズ)が閾値よりも大きい(又は閾値に等しい)場合、(等しくない)重み付けが有効化/実施され、そうでない場合、通常のDMVRが適用される。
【0069】
DMVRを用いた双予測重み付けパラメータの導出
マージモードでは、BCW重み指数及びLICフラグは、隣接する再構成されたCUから導出される。
【0070】
一実施形態では、LICと同様に、
図4に描示されるように、それぞれ現在のブロック及び参照ブロックの左及び/又は上(L字型)に局所化された再構成されたサンプル及び参照サンプルに基づいて、BCW重み指数を導出することを提案する。この目的のために、ref_L0[]及びref_L1[]は、参照ピクチャL0及びL1のサンプルを指し、rec[]は、現在のピクチャの再構成されたサンプルを指し、(mv0,mv1)は、現在のブロックに関連付けられた動きベクトルを指す。L0及びL1予測サンプルは、P0[x]=ref_L0[x+mv0]及びP1[x]=ref_L1[x+mv1]である。
【0071】
一例では、サブペル動きベクトルの場合、ref_L0[]及びref_L1[]の値は、通常の動き補償フィルタリングプロセスを用いて補間され得る。
【0072】
重みパラメータwに対応するBCW指数が与えられると、双予測Pbiは、式3を用いて計算される。現在のブロックのL字形状に対応するxの値について、wは、rec[]を用いて歪みを最小化する値として導出され得る。例えば、wは以下のように導出され得る。
【0073】
【0074】
一例では、BCW重みの補正は、継承された重み指数の値が等しくない重みに対応する場合にのみ行われる。別の場合では、BCW重みの補正は、LICフラグが真であり、かつ式3(BPW方程式)が従来のLIC方程式の代わりに使用される場合に実行される。
【0075】
別の例では、LICフラグが真である場合、LICパラメータは通常通り導出され、LIC重み付けが適用される(式4bを参照)。
【0076】
一例では、BCW重み又はLICパラメータの導出は、現在のCUサイズで調整される。例えば、CUサイズ(例えば、現在のCUサイズ)が閾値よりも小さい(又は閾値に等しい)場合、BCW重み又はLICパラメータの導出が実施又は使用され、そうでない場合、デフォルトの重みが使用される。別の例では、CUサイズ(例えば、現在のCUサイズ)が閾値よりも大きい(又は閾値に等しい)場合、BCW重み又はLICパラメータの導出が実施又は使用され、そうでない場合、デフォルトの重みが使用される。一例では、CUサイズ(例えば、現在のCUサイズ)が閾値よりも小さい(又は閾値に等しい)場合、BCW重みの継承された値が使用される。別の例では、CUサイズ(例えば、現在のCUサイズ)が閾値よりも大きい(又は閾値に等しい)場合、BCW重みの継承された値が使用される。
【0077】
一例では、マージモードでは、L字形状は、継承されたパラメータの位置の関数として適合される。継承されたパラメータが現在のブロックの上にあるブロックのみから来る場合、L字形は、現在のブロックの上に局所化された再構成されたサンプル及び参照サンプルから作られ、継承されたパラメータが現在のブロックの左にあるブロックのみから来る場合、L字形は、現在のブロックの左に局所化された再構成されたサンプル及び参照サンプルから作られる。
【0078】
ビデオ/画像コーディングのための、デコーダ側動きベクトル補正(DMVR)を使用した代表的な手順
本明細書で開示される様々な実施形態は、ビデオ(又は画像)コーディングのための双予測重み付けを伴うデコーダ側動きベクトル補正(DMVR)技法の使用に関する。一実施形態では、ビデオコーディングのための方法は、照明変化を伴うモードであると判定することと、ブロックのための少なくとも1つのコーディングツールが有効化されていると判定することと、i)照明変化を伴うモードであること、及び/又はii)ブロックのための少なくとも1つのコーディングツールが有効化されていることに基づいて、DMVRプロセスを実施することと、を含む。一例では、DMVRプロセスは、コーディングユニット(coding unit、CU)サイズ、及び/又はブロックのための少なくとも1つのコーディングツールが有効化されていることに基づいて、差分絶対値和(SAD)と平均除去SAD(MRSAD)との間で選択することを含み得る。いくつかの場合、DMVRプロセスは、BPW重み指数が等しくない重みを示していることに基づいて、MRSADを使用することを選択することを含む。一例では、少なくとも1つのコーディングツールは、双予測重み(BPW)ツール、局所照明補償(LIC)ツール、又は重み付けされた予測(WP)ツールのうちのいずれかを備える。
【0079】
いくつかの例では、DMVRプロセスは、コーディングユニット(CU)サイズ、及び/又は有効化されたコーディングツールに基づいて、差分絶対値和(SAD)と、2)平均除去SAD(MRSAD)との間で選択することを含む。例えば、BPW重み指数が等しくない重みを示している場合、DMVRプロセスは、SADを使用する代わりにMRSADを使用することを選択することを含む。別の例では、双予測重み(BPW)ツールが有効化されている場合、DMVRプロセスは、双予測平均を使用する代わりに双予測平均重み付けを使用することを選択することを含む。
【0080】
様々な実施形態では、ブロック(例えば、現在のブロック)のための1つ以上のコーディングツールが有効化されていることは、1)双予測重み(BPW)の重み指数が等しくない重みを示していること、2)局所照明補償(LIC)が有効化されているか若しくはLICフラグが真であること、又は3)重み付けされた予測(WP)がブロックに対して有効化されていること、のうちのいずれかに基づいて判定される。
【0081】
一実施形態では、上で考察されたビデオコーディングのための方法は、参照ピクチャ予測における勾配を抽出することと、抽出された勾配を使用して差分絶対値和(SAD)を計算することと、を含み得る。
【0082】
一実施形態では、上で考察されたビデオコーディングのための方法は、照明変化を伴うモードに基づいて適用されない双方向オプティカルフロー(BDOF)ツールを含み得る。
【0083】
一実施形態では、上で考察されたビデオコーディングのための方法は、現在のコーディングユニット(CU)サイズが閾値以下であるという判定に基づいて、DMVR適応を実施することを含み得る。
【0084】
別の実施形態では、上で考察されたビデオコーディングのための方法は、現在のコーディングユニット(CU)サイズが閾値以上であるという判定に基づいて、DMVR適応を実施することを含み得る。
【0085】
一実施形態では、上で考察されたビデオコーディングのための方法は、補正された動きベクトル(MV)を用いて双予測重み付けを適用することを含み得る。
【0086】
一実施形態では、上で考察されたビデオコーディングのための方法は、DMVRプロセスを用いて双予測重み付けパラメータを導出することを含み得る。
【0087】
一実施形態では、ビデオコーディングのための装置は、エンコーダ及び/又はデコーダを含み得、エンコーダ及び/又はデコーダは1つ以上のプロセッサを含み得、1つ以上のプロセッサは、照明変化を伴うモードであると判定し、ブロックのための少なくとも1つのコーディングツールが有効化されていると判定し、かつ照明変化を伴うモードであること、及びブロックのための少なくとも1つのコーディングツールが有効化されていることに基づいて、DMVRプロセスを実施する、ように構成されている。一例では、1つ以上のプロセッサは、CUサイズ、及び/又はブロックのための少なくとも1つのコーディングツールが有効化されていることに基づいて、SADとMRSADとの間で選択するように構成され得る。一例では、1つ以上のプロセッサは、BPW重み指数が等しくない重みを示していることに基づいて、MRSADを使用することを選択するように構成され得る。いくつかの場合、少なくとも1つのコーディングツールは、双予測重み(BPW)ツール、局所照明補償(LIC)ツール、又は重み付けされた予測(WP)ツールのうちのいずれかを備える。
【0088】
一例では、少なくとも1つのコーディングツールはBPWツールを備え、1つ以上のプロセッサは、BPWツールが有効化されていることに基づいて、双予測平均重み付けを使用することを選択するように構成されている。
【0089】
別の例では、ブロックのための少なくとも1つのコーディングツールが有効化されていると判定するときに、1つ以上のプロセッサは、1)双予測重み(BPW)の重み指数が等しくない重みを示していること、2)局所照明補償(LIC)が有効化されているか若しくはLICフラグが真であること、又は3)重み付けされた予測(WP)がブロックに対して有効化されていること、を判定するように構成されている。
【0090】
様々な実施形態において、DMVR条件は、BPW候補を含むように修正される。一例では、DMVRプロセスは、BPWが有効化されている場合、双予測平均を使用する代わりに双予測平均重み付けの使用を可能にするように修正される。別の例では、BPW重みが等しくない場合、DMVR補正プロセスは、SADの代わりにMRSADを使用するように修正される。
【0091】
様々な方法が本明細書に説明されており、本方法の各々は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。ステップ又はアクションの具体的な順序が方法の適切な動作のために必要とされない限り、具体的なステップ及び/又はアクションの順序及び/又は使用は、修正又は組み合わされ得る。加えて、「第1の(first)」、「第2の(second)」などの用語は、様々な実施形態において、要素、コンポーネント、ステップ、動作など、例えば、「第1の復号(first decoding)」及び「第2の復号(second decoding)」を修正するために使用され得る。かかる用語の使用は、具体的に必要とされない限り、修正された動作に対する順序付けを意味するものではない。そのため、本実施例では、第1の復号は、第2の復号の前に実施される必要はなく、例えば、第2の復号の前、第2の復号中、又は第2の復号と重複する時間中に発生し得る。
【0092】
本出願で説明する様々な方法及び他の態様を使用してモジュールを修正することができ、例えば、影響を受けるコーデックモジュールとして、
図2に示されたようなビデオエンコーダ200のコーディングモジュール245、270、及び/若しくは275、並びに/又は
図3に示されたようなデコーダ300のコーディングモジュール330、375が挙げられ得る。更に、本態様は、VVC又はHEVCに限定されず、例えば、他の規格及び勧告、並びに任意のそのような規格及び勧告の拡張に適用することができる。別途示されない限り、又は技術上除外されない限り、本出願に説明される態様は、個々に、又は組み合わせて使用することができる。
【0093】
本出願において、様々な数値が使用されている。具体的な値は、例示目的のためであり、説明される態様は、これらの具体的な値に限定されない。
【0094】
様々な実装形態は、復号を伴う。本出願で使用される場合、「復号」は、例えば、ディスプレイに好適な最終出力を生成するために受信された符号化シーケンス上で実行されるプロセスの全て又は一部分を包含し得る。様々な実施形態において、このようなプロセスには、例えば、エントロピ復号、逆量子化、逆変換、及び差動復号など、通常、デコーダによって行われるプロセスのうちの1つ以上が含まれる。「復号プロセス」という句が、具体的に作業部分集合を指すことを目的とするものであるか、又は全体としてより広範な復号プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
【0095】
様々な実装形態は、符号化を伴う。「復号(decoding)」に関する上の考察と同様に、本出願で使用される「符号化(encoding)」は、例えば、符号化されたビットストリームを生成するために入力ビデオシーケンスに対して実行されるプロセスの全て又は一部分を包含し得る。
【0096】
本明細書で使用するシンタックス要素は、説明上の用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
【0097】
本開示では、例えば、送信又は記憶することができるシンタックスなどの様々な情報を説明してきた。この情報は、様々な様式でパッケージ化又は配置することができ、例えば、情報をSPS、PPS、NALユニット、ヘッダ(例えば、NALユニットヘッダ、又はスライスヘッダ)、又はSEIメッセージに入れるなど、ビデオ規格において一般的な様式を含む。他の様式も利用可能であり、例えば、情報を以下のうちの1つ以上に入れるなどのシステムレベル又はアプリケーションレベルの規格において一般的な様式を含む。
a.SDP(セッション記述プロトコル(session description protocol))、例えば、RFCに説明され、RTP(リアルタイム輸送プロトコル(Real-time Transport Protocol))送信と連動して使用されるような、セッション告知及びセッション招待の目的のためのマルチメディア通信セッションを記述するためのフォーマット。
b.例えば、DASHに説明され、HTTPを介して送信されるようなDASH MPD(Media Presentation Description)記述子であり、記述子は、コンテンツ表現に追加の特性を提供するために、表現又は表現の集合に関連付けられる。
c.例えば、RTPストリーミング中に使用されるような、RTPヘッダ拡張子。
d.例えば、OMAFで使用され、いくつかの仕様では、「atoms」としても既知である一意のタイプ識別子及び長さによって画定されるオブジェクト指向構築ブロックであるボックスを使用するような、ISOベースメディアファイルフォーマット。
e.HTTPを介して送信されるHLS(HTTPライブストリーミング(HTTP Live Streaming))マニフェスト。マニフェストは、例えば、バージョン又はバージョンの集合の特性を提供するために、コンテンツのバージョン又はバージョンの集合に関連付けることができる。
【0098】
本明細書に説明される実装形態及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装され得る。たとえ単一の形式の実装形態の文脈でのみ考察されている場合でも(例えば、方法としてのみ考察されている)、考察された特徴の実装形態は、他の形式(例えば、装置又はプログラム)でも実装され得る。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実装され得る。本方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路又はプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサなどの装置において実装され得る。プロセッサはまた、例えば、コンピュータ、携帯電話、携帯型/パーソナルデジタルアシスタント(personal digital assistant、「PDA」)及びエンドユーザ間の情報の通信を容易にする他のデバイスなどの通信デバイスを含む。
【0099】
「一実施形態」若しくは「ある実施形態」又は「一実装形態」若しくは「ある実装形態」、並びにそれらの他の変形形態への言及は、その実施形態に関連して説明する特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体を通して様々な場所に現れる「一実施形態では」若しくは「ある実施形態では」又は「一実装形態では」若しくは「ある実装形態では」、並びに他の変形形態という句が現れるとき、必ずしも全てが同じ実施形態を指しているのではない。
【0100】
加えて、本出願は、様々な情報を「判定する」ことに言及し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上が含み得る。
【0101】
更に、本出願は、様々な情報に「アクセスすること」に言及し得る。情報にアクセスすることには、例えば、情報を受信すること、情報を(例えば、メモリから)取り出すこと、情報を記憶すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上が含まれ得る。
【0102】
加えて、本出願は、様々な情報を「受信すること」に言及し得る。受信することは、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は情報を(例えば、メモリから)取り出すことのうちの1つ以上を含み得る。更に、「受信すること」は、典型的には、動作、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することの間に、何らかの形で関与する。
【0103】
例えば、「A/B」、「A及び/又はB」及び「A及びBのうちの少なくとも1つ」の場合、次の「/」、「及び/又は」、及び「のうちの少なくとも1つ」のうちのいずれかの使用は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することが意図されていることが理解されるべきである。更なる実施例として、「A、B、及び/又はC」及び「A、B、及びCのうちの少なくとも1つ」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は第3のリストされた選択肢(C)のみの選択、又は第1及び第2のリストされた選択肢(A及びB)のみの選択、又は第1及び第3のリストされた選択肢(A及びC)のみの選択、又は第2及び第3のリストされた選択肢のみの選択(B及びC)のみ、又は3つ全ての選択肢の選択(A及びB及びC)を包含することが意図される。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
【0104】
また、本明細書で使用されるとき、「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、脱量子化のための量子化行列をシグナリングする。このように、ある実施形態では、同じパラメータが、エンコーダ側でもデコーダ側でも使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信することができる(明示的なシグナリング)。これに対し、デコーダが既にその特定のパラメータとともに他のパラメータも有する場合は、単にデコーダがその特定のパラメータを知ること、及びそれを選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。いかなる実際の機能の送信も回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成することができることが理解されよう。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上記は、「信号」という語の動詞形に関連し、「信号」という語は、本明細書では名詞としても使用することができる。
【0105】
当業者には明らかであるように、実装形態は、例えば、記憶又は送信され得る情報を搬送するようにフォーマットされた様々な信号を生成し得る。情報は、例えば、方法を実行するための命令又は説明された実装形態のうちの1つによって生成されたデータを含み得る。例えば、信号は、説明された実施形態のビットストリームを搬送するようにフォーマットされ得る。かかる信号は、例えば、(例えば、スペクトルの無線周波数部分を使用して)電磁波として、又はベースバンド信号としてフォーマットされ得る。フォーマットすることは、例えば、データストリームを符号化し、符号化されたデータストリームで搬送波を変調することを含み得る。信号が搬送する信号は、例えば、アナログ情報又はデジタル情報であり得る。信号は、知られているように、様々な異なる有線又は無線リンクによって送信され得る。信号は、プロセッサ可読媒体に記憶され得る。
【手続補正書】
【提出日】2024-05-15
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオデータをコーディングするための方法であって、
照明変化を伴うモードであると判定することと、
ブロックのための少なくとも1つのコーディングツールが有効化されていると判定することと、
前記照明変化を伴う前記モードであることに基づいて、及び前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることに基づいて、デコーダ側動きベクトル補正(DMVR)プロセスを実施することと、を含む、方法。
【請求項2】
前記DMVRプロセスが、
コーディングユニット(CU)サイズ、及び前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていること、のうちの1つ以上に基づいて、差分絶対値和(SAD)と平均除去SAD(MRSAD)との間で選択することを含む、請求項1に記載の方法。
【請求項3】
前記DMVRプロセスが、
双予測重み(BPW)の重み指数が等しくない重みを示していることに基づいて、平均除去SAD(MRSAD)を使用することを選択することを含む、請求項1に記載の方法。
【請求項4】
前記少なくとも1つのコーディングツールが、
双予測重み(BPW)ツール、局所照明補償(LIC)ツール、又は重み付けされた予測(WP)ツールのうちのいずれかを備える、請求項1に記載の方法。
【請求項5】
前記少なくとも1つのコーディングツールが、双予測重み(BPW)ツールを備え、前記DMVRプロセスが、前記BPWツールが有効化されていることに基づいて、双予測平均重み付けを使用することを選択することを含む、請求項1に記載の方法。
【請求項6】
前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることが、
双予測重み(BPW)の重み指数が等しくない重みを示していること、
局所照明補償(LIC)が有効化されているか若しくはLICフラグが真であること、又は
重み付けされた予測(WP)が前記ブロックのために有効化されていること、のうちのいずれかに基づいて判定される、請求項1に記載の方法。
【請求項7】
参照ピクチャ予測における勾配を抽出することと、
抽出された前記勾配を使用して差分絶対値和(SAD)を計算することと、を更に含む、請求項1に記載の方法。
【請求項8】
双方向オプティカルフロー(BDOF)ツールが、前記照明変化を伴う前記モードに基づいて、適用されない、請求項1に記載の方法。
【請求項9】
現在のコーディングユニット(CU)サイズが閾値以下であるという判定に基づいて、DMVR適応を実施することを更に含む、請求項1に記載の方法。
【請求項10】
現在のコーディングユニット(CU)サイズが閾値以上であるという判定に基づいて、DMVR適応を実施することを更に含む、請求項1に記載の方法。
【請求項11】
補正された動きベクトル(MV)を用いて双予測重み付けを適用することを更に含む、請求項1に記載の方法。
【請求項12】
前記DMVRプロセスを用いて双予測重み付けパラメータを導出することを更に含む、請求項1に記載の方法。
【請求項13】
ビデオデータをコーディングするための装置であって、
少なくとも1つのプロセッサと、
命令を記憶するメモリと、を備え、前記命令が、前記少なくとも1つのプロセッサによって実行されたときに、前記装置に、
照明変化を伴うモードであると判定させ、
ブロックのための少なくとも1つのコーディングツールが有効化されていると判定させ、かつ
前記照明変化を伴う前記モードであることに基づいて、及び前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていることに基づいて、デコーダ側動きベクトル補正(DMVR)プロセスを実施させる、装置。
【請求項14】
前記命令が更に、前記装置に、
コーディングユニット(CU)サイズ、及び前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていること、のうちの1つ以上に基づいて、差分絶対値和(SAD)と平均除去SAD(MRSAD)との間で選択させる、請求項13に記載の装置。
【請求項15】
前記命令が更に、前記装置に、
双予測重み(BPW)の重み指数が等しくない重みを示していることに基づいて、平均除去SAD(MRSAD)を使用することを選択させる、請求項13に記載の装置。
【請求項16】
前記少なくとも1つのコーディングツールが、
双予測重み(BPW)ツール、局所照明補償(LIC)ツール、又は重み付けされた予測(WP)ツールのうちのいずれかを備える、請求項13に記載の装置。
【請求項17】
前記少なくとも1つのコーディングツールが双予測重み(BPW)ツールを備え、前記命令が更に、前記装置に、
前記BPWツールが有効化されていることに基づいて、双予測平均重み付けを使用することを選択させる、請求項13に記載の装置。
【請求項18】
前記ブロックのための前記少なくとも1つのコーディングツールが有効化されていると判定するときに、前記命令が更に、前記装置に、
双予測重み(BPW)の重み指数が等しくない重みを示していること、
局所照明補償(LIC)が有効化されているか若しくはLICフラグが真であること、又は
重み付けされた予測(WP)が前記ブロックのために有効化されていること、を判定させる、請求項13に記載の装置。
【請求項19】
前記命令が更に、前記装置に、
参照ピクチャ予測における勾配を抽出させ、
抽出された前記勾配を使用して差分絶対値和(SAD)を計算させる、請求項13に記載の装置。
【請求項20】
双方向オプティカルフロー(BDOF)ツールが、前記照明変化を伴う前記モードに基づいて、適用されない、請求項13に記載の装置。
【請求項21】
前記命令が更に、前記装置に、
現在のコーディングユニット(CU)サイズが閾値以下であるという判定に基づいて、DMVR適応を実施させる、請求項13に記載の装置。
【請求項22】
前記命令が更に、前記装置に、
現在のコーディングユニット(CU)サイズが閾値以上であるという判定に基づいて、DMVR適応を実施させる、請求項13に記載の装置。
【請求項23】
前記命令が更に、前記装置に、
補正された動きベクトル(MV)を用いて双予測重み付けを適用させる、請求項13に記載の装置。
【請求項24】
前記命令が更に、前記装置に、
前記DMVRプロセスを用いて双予測重み付けパラメータを導出させる、請求項13に記載の装置。
【国際調査報告】