IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン、ターチア、インターネット、インフォメーション、テクノロジー、カンパニー、リミテッドの特許一覧

特開2024-38439ビデオ符号化方法、プログラム、ビットストリーム、ビットストリーム送信方法およびコンピュータプログラム製品
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024038439
(43)【公開日】2024-03-19
(54)【発明の名称】ビデオ符号化方法、プログラム、ビットストリーム、ビットストリーム送信方法およびコンピュータプログラム製品
(51)【国際特許分類】
   H04N 19/513 20140101AFI20240312BHJP
   H04N 19/70 20140101ALI20240312BHJP
   H04N 19/577 20140101ALI20240312BHJP
【FI】
H04N19/513
H04N19/70
H04N19/577
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2024006272
(22)【出願日】2024-01-18
(62)【分割の表示】P 2022097598の分割
【原出願日】2020-03-12
(31)【優先権主張番号】62/817,503
(32)【優先日】2019-03-12
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】521248394
【氏名又は名称】ベイジン、ターチア、インターネット、インフォメーション、テクノロジー、カンパニー、リミテッド
【氏名又は名称原語表記】BEIJING DAJIA INTERNET INFORMATION TECHNOLOGY CO.,LTD.
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】シウ、シアオユイ
(72)【発明者】
【氏名】チェン、イー-ウェン
(72)【発明者】
【氏名】ワン、シアンリン
(57)【要約】      (修正有)
【課題】CIIP(Combined Inter-and Intra-Prediction)モードの適用の制約及び調整によりビデオ符号化を実行するシステム及び方法を提供する。
【解決手段】本発明のビデオ符号化方法では、現在のブロックに関連する第1リファレンスピクチャ及び第2リファレンスピクチャを取得することを含む。表示順序で、第1リファレンスピクチャは現在のピクチャの前にあり、第2リファレンスピクチャは現在のピクチャの後にある。方法はまた、記現在のブロックのCIIPフラグに基づいてDMVR演算を適用するか否かを決定し、CIIPフラグに基づいてBDOF(bidirectional optical flow)演算を適用するか否かを決定し、第1リファレンスピクチャ、第2リファレンスピクチャ並びにDMVR演算及びBDOF演算を適用するか否かに関する決定に基づいて現在のブロックの予測を計算する。
【選択図】図7
【特許請求の範囲】
【請求項1】
現在のブロックに関連する第1リファレンスピクチャ及び第2リファレンスピクチャを取得し、
表示順序で、前記第1リファレンスピクチャは現在のピクチャの前にあり、前記第2リファレンスピクチャは前記現在のピクチャの後にあり、
前記現在のブロックのCIIP(combined inter and intra prediction)フラグに基づいてDMVR(decoder-side motion vector refinement)演算を適用するか否かを決定し、
前記CIIP(combined inter and intra prediction)フラグに基づいてBDOF(bidirectional optical flow)演算を適用するか否かを決定し、
前記第1リファレンスピクチャ、前記第2リファレンスピクチャ、並びに、前記DMVR演算及びBDOF演算を適用するか否かに関する決定に基づいて前記現在のブロックの予測を計算する、
ビデオ符号化方法。
【請求項2】
前記DMVR演算を適用するか否かを決定することは、CIIPが前記現在のブロックに適用されることを示す前記CIIPフラグに応じて、前記DMVR演算を適用しないことを決定することを含む、請求項1に記載のビデオ符号化方法。
【請求項3】
前記BDOF演算を適用するか否かを決定することは、CIIPが前記現在のブロックに適用されることを示す前記CIIPフラグに応じて、前記BDOF演算を適用しないことを決定することを含む、請求項1に記載のビデオ符号化方法。
【請求項4】
前記現在のブロックの予測を計算することは、
前記DMVR演算及びBDOF演算を適用しないことを決定することに応じて、第1予測L0及び第2予測L1に基づいて前記現在のブロックのバイ予測を計算し、
前記第1予測L0は、前記現在のブロックから、表示順序で前記現在のピクチャの前にある前記第1リファレンスピクチャのリファレンスブロックへの第1動きベクトルMV0に基づいて取得され、
前記第2予測L1は、前記現在のブロックから、表示順序で前記現在のピクチャの後にある前記第2リファレンスピクチャのリファレンスブロックへの第2動きベクトルMV1に基づいて取得される、
請求項1に記載のビデオ符号化方法。
【請求項5】
前記DMVR演算を適用するか否かを決定することは、
CIIPが前記現在のブロックに適用されないことを示す前記CIIPフラグに応じて、前記DMVR演算を適用することを決定することを含む、請求項1に記載のビデオ符号化方法。
【請求項6】
第1更新予測L0’及び第2更新予測L1’を生成するために、第1動きベクトルMV0及び第2動きベクトルMV1を調整し、
前記第1動きベクトルMV0は、前記現在のブロックから、表示順序で前記現在のピクチャの前にある前記第1リファレンスピクチャのリファレンスブロックへのベクトルであり、
前記第2動きベクトルMV1は、前記現在のブロックから、表示順序で前記現在のピクチャの後にある前記第2リファレンスピクチャのリファレンスブロックへのベクトルである、
請求項5に記載のビデオ符号化方法。
【請求項7】
前記BDOF演算を適用するか否かを決定することは、
前記CIIPが前記現在のブロックに適用されないことを示す前記CIIPフラグに応じて、前記BDOF演算を適用することを決定することを含む、請求項6に記載のビデオ符号化方法。
【請求項8】
前記第1更新予測L0’に関連する第1水平・垂直勾配値を計算し、
前記第2更新予測L1’に関連する第2水平・垂直勾配値を計算する、
ことをさらに含む、請求項7に記載のビデオ符号化方法。
【請求項9】
前記現在のブロックの予測を計算することは、
前記第1更新予測L0’、第2更新予測L1’、第1水平・垂直勾配値、及び第2水平・垂直勾配値に基づいて、前記現在のブロックのバイ予測を計算する、
ことを含む、請求項8に記載のビデオ符号化方法。
【請求項10】
1つ以上のプロセッサを有するコンピュータ装置によって実行するためのプログラムであって、
1つ以上の前記プロセッサによって実行されると、前記コンピュータ装置に、請求項1~請求項9の何れか1項に記載のビデオ符号化方法を実行させる、
プログラム。
【請求項11】
請求項1~請求項9の何れか1項に記載のビデオ符号化方法によって生成されたビットストリーム。
【請求項12】
画像符号化装置によって生成されたビットストリームを送信する方法であって、
前記画像符号化装置は、
1つ以上のプロセッサと、
命令を格納したコンピュータ可読媒体と、
を含み、
前記命令が、1つ以上の前記プロセッサによって実行されると、請求項1~請求項9の何れか1項に記載のビデオ符号化方法を前記画像符号化装置が実行する、
ビットストリーム送信方法。
【請求項13】
ビットストリームを格納する命令を含むコンピュータプログラム製品であって、
前記ビットストリームは、請求項1~請求項9の何れか1項に記載のビデオ符号化方法によって生成された符号化データを含む、
コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般に、ビデオ符号化に関する。より詳細には、本開示は、CIIP(Combined Inter- and Intra-Prediction)モードの適用の制約及び調整によりビデオ符号化を実行するシステム及び方法に関する。
【背景技術】
【0002】
このセクションは、本開示に関連する背景情報を提供する。このセクションに含まれる情報は、必ずしも先行技術として解釈されるべきではない。
【0003】
ビデオデータを圧縮するために、様々なビデオ符号化技術のいずれかを使用することができる。ビデオ符号化は、1つ以上のビデオ符号化標準に従って実行することができる。いくつかの例示的なビデオ符号化標準は、VVC(versatile video coding)、JEM(joint exploration test model)符号化、H.265/HEVC(high-efficiency video coding)、H.264/AVC(advanced video coding)、及びMPEG(moving picture experts group)符号化を含む。
【0004】
ビデオ符号化は、一般に、ビデオ画像またはシーケンスに固有の冗長性を利用する予測方法(例えば、インター予測、イントラ予測など)を利用する。ビデオ符号化技法の1つの目標は、ビデオ品質の劣化を回避または最小限に抑えながら、ビデオデータを、より低いビットレートを使用する形式に圧縮することである。
【0005】
ビデオ符号化で利用される予測方法は、一般的には、ビデオデータに固有の冗長性を低減または除去するために、空間(イントラフレーム)予測及び/または時間(インターフレーム)予測を実行することを含み、一般的には、ブロックベースのビデオ符号化に関連付けられる。
【発明の概要】
【課題を解決するための手段】
【0006】
このセクションは、本開示の一般的な概要を提供し、その全範囲またはその特徴のすべての包括的な開示ではない。
【0007】
第1の態様はビデオ復号化方法であり、現在のブロックのCIIP(combined
inter and intra prediction)フラグに基づいてDMVR(decoder-side motion vector refinement)演算を適用するか否かを決定し、前記CIIP(combined inter and intra prediction)フラグに基づいてBDOF(bidirectional optical flow)演算を適用するか否かを決定し、前記DMVR演算及びBDOF演算を適用するか否かに関する決定に基づいて前記現在のブロックの予測を計算する。
【0008】
第2の態様は、第1の態様のビデオ復号化方法であり、前記DMVR演算を適用するか否かを決定することは、CIIPが前記現在のブロックに適用されることを示す前記CIIPフラグに応じて、前記DMVR演算を適用しないことを決定することを含む。
【0009】
第3の態様は、第1の態様のビデオ復号化方法であり、前記BDOF演算を適用するか
否かを決定することは、CIIPが前記現在のブロックに適用されることを示す前記CIIPフラグに応じて、前記BDOF演算を適用しないことを決定することを含む。
【0010】
第4の態様は、第1の態様のビデオ復号化方法であり、前記現在のブロックの予測を計算することは、前記DMVR演算及びBDOF演算を適用しないことを決定することに応じて、第1予測L0及び第2予測L1に基づいて前記現在のブロックのバイ予測を計算し、前記第1予測L0は、前記現在のブロックから、表示順序で現在のピクチャの前にある第1リファレンスピクチャのリファレンスブロックへの第1動きベクトルMV0に基づいて取得され、前記第2予測L1は、前記現在のブロックから、表示順序で前記現在のピクチャの後にある第2リファレンスピクチャのリファレンスブロックへの第2動きベクトルMV1に基づいて取得される。
【0011】
第5の態様は、第1の態様のビデオ復号化方法であり、前記DMVR演算を適用するか否かを決定することは、CIIPが前記現在のブロックに適用されないことを示す前記CIIPフラグに応じて、前記DMVR演算を適用することを決定することを含む。
【0012】
第6の態様は、第1の態様のビデオ復号化方法であり、第1更新予測L0’及び第2更新予測L1’を生成するために、第1動きベクトルMV0及び第2動きベクトルMV1を調整し、前記第1動きベクトルMV0は、前記現在のブロックから、表示順序で現在のピクチャの前にある第1リファレンスピクチャのリファレンスブロックへのベクトルであり、前記第2動きベクトルMV1は、前記現在のブロックから、表示順序で前記現在のピクチャの後にある第2リファレンスピクチャのリファレンスブロックへのベクトルである。
【0013】
第7の態様は、第6の態様のビデオ復号化方法であって、前記BDOF演算を適用するか否かを決定することは、前記CIIPが前記現在のブロックに適用されないことを示す前記CIIPフラグに応じて、前記BDOF演算を適用することを決定することを含む。
【0014】
第8の態様は、第7の態様のビデオ復号化方法であって、前記第1更新予測L0’に関連する第1水平・垂直勾配値を計算し、前記第2更新予測L1’に関連する第2水平・垂直勾配値を計算する、ことをさらに含む。
【0015】
第9の態様は、第8の態様のビデオ復号化方法であって、前記現在のブロックの予測を計算することは、前記第1更新予測L0’、第2更新予測L1’、第1水平・垂直勾配値、及び第2水平・垂直勾配値に基づいて、前記現在のブロックのバイ予測を計算する、ことを含む。
【図面の簡単な説明】
【0016】
図1】多くのビデオ符号化標準と併せて使用することができる、例示的なブロックベースのハイブリッドビデオエンコーダを示すブロック図である。
図2】多くのビデオ符号化標準と共に使用され得る例示的なビデオデコーダを示すブロック図である。
図3A】例示的実施形態による分割タイプの例である4分割を示す。
図3B】例示的実施形態による分割タイプの例である水平2分割を示す。
図3C】例示的実施形態による分割タイプの例である垂直2分割を示す。
図3D】例示的実施形態による分割タイプの例である水平3分割を示す。
図3E】例示的実施形態による分割タイプの例である垂直3分割を示す。
図4A】CIIPモードでインター予測及びイントラ予測を組み合わせる図である。
図4B】CIIPモードでインター予測及びイントラ予測を組み合わせる図である。
図4C】CIIPモードでインター予測及びイントラ予測を組み合わせる図である。
図5A】現在のVVCにおけるMPM候補リストのための例示的な生成プロセスを示す一対のフローチャートを構成する。
図5B】現在のVVCにおけるMPM候補リストのための例示的な生成プロセスを示す一対のフローチャートを構成する。
図6】現在のVVCにおいてBDOF(Bi-Directional Optical Flow)を使用するCIIP設計の例示的なワークフローを示すフローチャートである。
図7】現在の予測ブロックのバイ予測を計算する際にDMVR及びBDOF演算を選択的にバイパスする例示的なワークフローを示すフローチャートである。
図8】本開示において提案されるCIIP設計の例示的なワークフローを示すフローチャートである。
図9】本開示における提案された第2CIIP設計の例示的なワークフローを示すフローチャートである。
図10A】本開示におけるMPM候補リストの生成プロセスにおいてCIIP符号化ブロックを処理する提案された2つの方法の例示的なワークフローを示す一対のフローチャートを構成する。
図10B】本開示におけるMPM候補リストの生成プロセスにおいてCIIP符号化ブロックを処理する提案された2つの方法の例示的なワークフローを示す一対のフローチャートを構成する。
【発明を実施するための形態】
【0017】
以下、本開示の例示的で非限定的な実施形態のセットを、添付の図面と併せて説明する。構造、方法、または機能の変形は、本明細書で提示される例に基づいて、関連技術の当業者によって実装されてもよく、そのような変形はすべて、本開示の範囲内に含まれる。矛盾が存在しない場合には、異なる実施形態の教示は、互いに組み合わせることができるが、必ずしも組み合わせる必要はない。
【0018】
本開示で使用される用語は、本開示を限定するのではなく、特定の例を説明することを対象とする。本開示ならびに添付の特許請求の範囲で使用される「1つの」などの単数形は、他の意味がコンテキストに明確に含まれない限り、複数形も指す。本明細書で使用される用語「及び/または」は、1つ以上の関連する列挙された項目の任意のまたはすべての可能な組合せを指すことを理解されたい。
【0019】
ここでは、「第1」、「第2」、「第3」などの用語を用いて、様々な情報を記述することができるが、これらの用語によって情報が限定されるべきではない。これらの用語は、情報の1つのカテゴリを別のカテゴリと区別するためにのみ用いられる。例えば、本開示の範囲から逸脱することなく、第1情報は第2情報と称されてもよく、同様に、第2情報は、第1情報と称されてもよい。本明細書で使用されるように、「である場合」という用語は、コンテキストに応じて、「のとき」または「の際」または「に応じて」を意味する。
【0020】
本明細書全体を通して、単数または複数の「一実施形態」、「別実施形態」などへの言及は、一実施形態に関連して説明された1つ以上の特定の特徴、構造、または特性が本開示の少なくとも1つの実施形態に含まれることを意味し、したがって、本明細書全体を通して、単数または複数の場所における「一実施形態において」または「別実施形態において」などの語句の出現は、必ずしもすべて同じ実施形態を指すわけではない。さらに、1つ以上の実施形態における特定の特徴、構造、または特性は、任意の適切な方法で組み合わせることができる。
【0021】
概念的には、多くのビデオ符号化標準は、背景のセクションで述べたものを含めて、類似している。例えば、実質的に全てのビデオ符号化標準は、ブロックベースの処理を使用し、ビデオ圧縮を達成するために同様のビデオ符号化ブロックダイアグラムを共有する。
【0022】
ブロックベースのビデオ符号化では、入力ビデオ信号はブロックごとに処理される。各ブロック(符号化単位(CU)とも呼ばれる)に対して、空間予測及び/または時間予測が実行され得る。
【0023】
空間予測(「イントラ予測」とも呼ばれる)は、同じビデオピクチャ/スライス内の既に符号化された隣接ブロック(リファレンスサンプルと呼ばれる)のサンプルからのピクセルを使用して、現在のブロックを予測する。空間予測は、ビデオ信号に固有の空間冗長性を低減する。
【0024】
時間予測(「インター予測」または「動き補償予測」とも呼ばれる)は、既に符号化されたビデオピクチャからの再構成されたピクセルを使用して、現在のブロックを予測する。時間予測は、ビデオ信号に固有の時間冗長性を低減する。所与のCUについての時間予測信号は、通常、現在のCUとその時間リファレンスとの間の動きの量及び方向を示す1つ以上の動きベクトル(MV)によって信号化される。また、複数のリファレンスピクチャがサポートされる場合、1つのリファレンスピクチャインデックスが追加的に送信され、リファレンスピクチャインデックスは、リファレンスピクチャストア内のどのリファレンスピクチャから時間予測信号が到来するかを識別するために使用される。
【0025】
空間及び/または時間予測の後、エンコーダ内のモード決定ブロックは、例えば、レート歪み最適化法に基づいて、最良の予測モードを選択する。次いで、予測ブロックは現在のブロックから減算され、予測残差は変換を用いて非相関化され、量子化される。量子化残差係数は逆量子化され、逆変換されて再構成残差を形成し、それからブロックの再構成信号を形成するために予測ブロックに再加算される。
【0026】
空間及び/または時間予測の後、リファレンスピクチャストアに入れられ、将来のビデオブロックを符号化するために使用される前に、再構成されたCUに、デブロッキングフィルタ、SAO(sample adaptive offset)、及びALF(adaptive in-loop filter)などのさらなるインループフィルタリングが適用され得る。出力ビデオビットストリームを形成するために、符号化モード(インターまたはイントラ)、予測モード情報、動き情報、及び量子化された残差係数はすべて、エントロピー符号化ユニットに送られ、さらに圧縮され、パックされてビットストリームを形成する。
【0027】
復号化の過程で、まず、ビデオビットストリームはエントロピー復号化単位でエントロピー復号化される。符号化モード及び予測情報は、予測ブロックを形成するために、空間予測ユニット(イントラ符号化される場合)または時間予測ユニット(インター符号化される場合)のいずれかに送られる。残差変換係数は逆量子化ユニットと逆変換ユニットに送られ、残差ブロックを再構成する。次に、予測ブロックと残差ブロックとが加算される。再構成されたブロックは、リファレンスピクチャストアに格納される前に、インループフィルタリングをさらに経ることができる。次に、リファレンスピクチャストア内の再構成されたビデオは、ディスプレイデバイスを駆動するために送出され、また、将来のビデオブロックを予測するために使用される。
【0028】
多くのハイブリッドビデオ符号化方式では、各ブロックは、インター予測方法またはイントラ予測方法のいずれかを使用するかもしれないが、両方を使用することはないだろう
。しかし、インター予測ブロックとイントラ予測ブロックとによって生成された残差信号は、互いに、非常に異なる特性を提示する。従って、2種類の予測を効率的な方法で組み合わせることができれば、予測残差のエネルギーを減らし、符号化効率を改善するためのより正確な予測が期待できる。さらに、特定のビデオコンテンツでは、動く物体の動きが複雑になる可能性がある。例えば、古いコンテンツ(例えば、以前に符号化されたピクチャに含まれるオブジェクト)と、新たに出現するコンテンツ(例えば、以前に符号化されたピクチャにおいて除外されるオブジェクト)との両方を含む領域が存在し得る。このようなシナリオでは、インター予測もイントラ予測も現在のブロックの正確な予測を提供できない。
【0029】
予測効率をさらに改善するために、VVCの現在のバージョンは、併合モードによって符号化される1つのCUのイントラ予測とインター予測とを組み合わせる、CIIP(Combined Inter- and Intra-Prediction)モードを導入する。CIIPモードの適用は、一般に、符号化効率を改善する。
【0030】
しかしながら、CIIPモードの適用は、インターモードまたはイントラモードに含まれるよりも多くの演算を含み、計算の複雑さを増加させ、符号化/復号化スループットを低減させる傾向がある。
【0031】
さらに、VVCの現在のバージョンは、それらの隣接ブロックのためのMPM(Most Probable Mode)候補リストを構築するコンテキスト内のイントラモードブロック及びCIIPモードブロックの処理において完全な一貫性がない。
【0032】
図1は、多くのビデオ符号化標準と併せて使用され得る、例示的なブロックベースのハイブリッドビデオエンコーダ100のブロック図を示す。エンコーダ100において、ビデオフレームは、処理のために複数のビデオブロックに分割される。与えられた各ビデオブロックに対して、インター予測アプローチまたはイントラ予測アプローチのいずれかに基づいて予測が形成される。インター予測では、以前に再構成されたフレームからのピクセルに基づいて、動き推定及び動き補償によって、1つ以上の予測子が形成される。イントラ予測では、現在のフレーム内の再構成されたピクセルに基づいて、予測子が形成される。モード決定により、現在のブロックを予測するために最良の予測子を選択することができる。
【0033】
現在のビデオブロックとその予測子との差を表す予測残差が、変換回路102に送られる。次いで、変換係数が、エントロピー低減のために、変換回路102から量子化回路104に送られる。次いで、量子化された係数がエントロピー符号化回路106に供給され、圧縮ビデオビットストリームを生成する。図1に示すように、ビデオブロック分割情報、動きベクトル、リファレンスピクチャインデックス、及びイントラ予測モードなどの、インター予測回路及び/またはイントラ予測回路112からの予測関連情報110も、エントロピー符号化回路106を通して供給され、圧縮ビデオビットストリーム114に含められる。
【0034】
エンコーダ100では、予測の目的でピクセルを再構成するために、デコーダ関連の回路も必要である。まず、予測残差が、逆量子化回路116及び逆変換回路118を通して再構成される。この再構成された予測残差をブロック予測子120と組み合わせて、現在のビデオブロックについてフィルタ処理されていない再構成ピクセルを生成する。
【0035】
符号化効率及び視覚品質を改善するために、インループフィルタが一般に使用される。例えば、デブロッキングフィルタは、AVC、HEVC、並びにVVCの現在のバージョンにおいて利用可能である。HEVCでは、符号化効率をさらに改善するために、SAO
(sample adaptive offset)と呼ばれる追加のインループフィルタが定義される。現在のVVC標準では、ALF(Adaptive Loop Filter)と呼ばれるさらに別のインループフィルタが活発に検討されており、最終標準に含まれる可能性が高い。
【0036】
これらのインループフィルタ動作はオプションである。これらの動作を実行することは、符号化効率及び視覚品質を改善するのに役立つ。それらはまた、エンコーダ100によって実行される決定としてオフにされて、計算の複雑さを低減することができる。
【0037】
イントラ予測は、通常、フィルタリングされていない再構成ピクセルに基づいており、一方、これらのフィルタオプションがエンコーダ100によってオンにされた場合、インター予測は、フィルタリングされた再構成ピクセルに基づいていることに留意されたい。
【0038】
図2は、多くのビデオ符号化標準と共に使用され得る例示的なビデオデコーダ200を示すブロック図である。このデコーダ200は、図1のエンコーダ100内に存在する再構成関連部分に類似している。デコーダ200(図2)において、入力ビデオビットストリーム201は、量子化された係数レベル及び予測関連情報を導出するために、まず、エントロピー復号化202を介して復号化される。次いで、量子化された係数レベルは、逆量子化204及び逆変換206を介して処理され、再構成された予測残差を得る。イントラ/インターモードセレクタ(選択回路)208で実施されるブロック予測メカニズムは、復号された予測情報に基づいて、イントラ予測210または動き補償212のいずれかを実行するように構成される。逆変換206からの再構成予測残差とブロック予測メカニズムにより生成された予測出力とを、加算器214を用いて合計することにより、フィルタ処理されない再構成ピクセルの集合が得られる。インループフィルタがオンにされる状況では、最終的な再構成ビデオを導出するために、これらの再構成ピクセルに対してフィルタリング動作が行われる。次に、リファレンスピクチャストア内の再構成されたビデオは、ディスプレイデバイスを駆動するために送出され、将来のビデオブロックを予測するために使用される。
【0039】
HEVCなどのビデオ符号化標準では、ブロックは、4分木に基づいて分割され得る。現在のVVCなどのより新しいビデオ符号化標準では、より多くの分割方法が使用され、1つの符号化ツリーユニット(CTU)をCUに分割して、4分木、2分木、または3分木に基づいて様々なローカル特性に適応させることができる。CU、予測ユニット(PU)及び変換ユニット(TU)の分離は、現在のVVCにおけるほとんどの符号化モードには存在せず、各CUは、常に、さらなる分割なしで予測及び変換の両方のための基本ユニットとして使用される。しかしながら、イントラサブ分割符号化モードなどのいくつかの特定の符号化モードでは、各CUは依然として複数のTUを含むことができる。マルチタイプツリー構造では、まず、1つのCTUを4分木構造で分割する。次に、各4分木リーフノードは、2分木構造及び3分木構造によってさらに分割することができる。
【0040】
図3A図3Eは、5つの例示的な分割タイプ、即ち、4分割(図3A)、水平2分割(図3B)、垂直2分割(図3C)、水平3分割(図3D)、及び垂直3分割(図3E)を示す。HEVC及び現在のVVCなどのビデオ符号化標準では、各CUは、イントラ予測またはインター予測で予測され得る。
【0041】
現在のVVCはまた、CIIP(Combined Intra- and Inter-Prediction)符号化モードを導入し、このモードの下で、併合モードによって符号化される1つのCUのイントラ予測とインター予測とが組み合わされる。
【0042】
CIIPモードでは、併合CUごとに、CIIPが現在のCUについて有効か否かを示
す1つの追加フラグが通知される。現在のCUの輝度成分について、CIIPは、4つの頻繁に使用されるイントラモード、即ち、平面モード、DCモード、水平モード、及び垂直モードをサポートする。現在のCUの彩度成分については、輝度成分の同じイントラモードが再使用されることを意味するDMモードが、余分な信号化なしに常に適用される。
【0043】
さらに、CIIPモードでは、各併合CUについて、重み付け平均化が適用されて、現在のCUのインター予測サンプルとイントラ予測サンプルとが結合される。詳細には、平面モードまたはDCモードが選択されると、等しい重み(即ち、0.5)が適用される。そうでない場合(即ち、水平モードまたは垂直モードのいずれかが適用される場合)、現在のCUは、まず、水平方向(水平モードの場合)または垂直方向(垂直モードの場合)に、4つの等しいサイズの領域に分割される。(w_intra、w_inter)として示される4つの重み集合は、異なった領域におけるインター予測サンプルとイントラ予測サンプルとを結合するために適用される。ここで、i=0及びi=3は、イントラ予測に使用される再構成された隣接サンプルに最も近い領域と、最も遠い領域とを表す。現在のCIIP設計では、重み集合の値の事前定義集合は、(w_intra、w_inter)=(0.75、0.25)、(w_intra、w_inter)=(0.625、0.375)、(w_intra、w_inter)=(0.375、0.625)及び(w_intra、w_inter)=(0.25、0.75)である。
【0044】
図4A図4Cは、CIIPモードでのインター予測及びイントラ予測の組み合わせを例示する。図4Aでは、水平モードにおけるCU401についての組み合わせ重みの動作が例示されている。現在のCUは、4つの異なるグレースケールシェードによって表される、4つの等しいサイズの領域402、403、404、及び405に水平方向に分割される。各領域について、重みセットが、インター予測サンプルとイントラ予測サンプルとを組み合わせるために適用される。例えば、最も暗いグレースケールシェードで表される左端の領域402について、重みセット(w_intra、w_inter)=(0.75、0.25)が適用される。これは、CIIP予測が、(i)イントラ予測の0.75、即ち3/4倍、及び(ii)インター予測の0.25、即ち1/4倍の合計として得られることを意味する。これは、同じ領域402に矢印で示される式406PCIIP=Pinter/4+3Pintra/4によっても示されている。他の3つの領域403、404、及び405に使用される重みセットも同様に示されている。図4Bでは、垂直モードにおけるCU407についての組み合わせ重みの動作が、図4Aと同様の方法で示されている。図4Cでは、平面モードまたはDCモードにおけるCU408の組合せ重みの動作が示されており、ここでは、1つの重みセット、即ち等しい重みのセットだけが、CU408全体に適用され、これもまた、矢印でCU408全体を示す式409PCIIP=Pinter/2+Pintra/2によって示されている。
【0045】
現在のVVC作業仕様はまた、MPM(most probable mode)メカニズムを介してその隣接するCIIP CUのイントラモードを予測するための予測子として1つのCIIP CUのイントラモードの使用を提供するが、MPMメカニズムを介してその隣接するイントラ符号化CUのイントラモードを予測するための予測子として同じCIIP CUの同じイントラモードの使用を提供しない。
【0046】
詳細には、各CIIP CUについて、その隣接ブロックのいくつかもCIIP CUである場合、それらの隣接ブロックのイントラモードは、まず、平面、DC、水平、及び垂直モード内の最も近いモードに廻され、次いで、現在のCUのMPM候補リストに追加される。即ち、1つのCIIP CUのイントラモードは、その隣接CIIP CUのイントラモードを予測させる。しかしながら、各イントラCUについて、その隣接ブロックのいくつかがCIIPモードによって符号化される場合、これらの隣接ブロックは、利用
不可能であると見なされる。即ち、1つのCIIP CUのイントラモードは、その隣接イントラCUのイントラモードを予測させない。
【0047】
図5A図5Bは、現在のVVCにおけるMPM候補リストのための例示的な生成プロセスを示す一対のフローチャートを構成する。図5Aは、現在のCUがイントラブロックである場合の生成プロセスを例示する。この場合、隣接CUがイントラブロックであるか否かが判定され(501)、イントラブロックである場合にのみ、隣接CUのイントラモードがMPM候補リストに追加される(502)。図5Bは、現在のCUがイントラブロックである場合の生成プロセスを例示する。この場合、隣接CUがイントラブロックであるか否かについて判定が行われ(503)、イントラブロックである場合、隣接CUのイントラモードが廻され(504)、MPM候補リストに追加され(505)、一方、イントラブロックでない場合、隣接CUがCIIPブロックであるか否かについて引き続き判定が行われ(506)、CIIPブロックである場合、隣接CUのイントラモードがMPM候補リストに追加される(507)。
【0048】
図5A図5Bは、現在のVVCにおけるMPF候補リストの生成処理におけるCIIPブロックの使用とイントラブロックの使用との間の不一致を例示する。即ち、MPM候補リストの生成処理における隣接CIIPブロックの使用方法は、現在のブロックがイントラブロックであるかCIIPブロックであるかに依存し、2つの場合が異なることを示す。
【0049】
現在のVVCなどのより新しいビデオ符号化標準では、新しいインターモード符号化ツールが導入されている。新しいインターモード符号化ツールの2つの例は、BDOF(Bi-Directional Optical Flow)及びDMVR(Decoder-side Motion Vector Refinement)である。
【0050】
ビデオ符号化における従来のバイ予測は、既に再構成されたリファレンスピクチャから得られた2つの時間予測ブロックの単純な組み合わせである。しかしながら、ブロックベース動き補償の制限のために、2つの予測ブロックのサンプル間で観測できる残りの小さな動きが存在する可能性があり、従って、動き補償予測の効率を低下させる。この問題を解決するために、BDOFが現在のVVCに適用され、1つのブロック内のすべてのサンプルについてのそのような動きの影響を低減する。
【0051】
BDOFは、バイ予測が使用されるとき、ブロックベースの動き補償予測上で実行されるサンプルワイズ動き精緻化である。各4×4サブブロックの動き精緻化を、BDOFをサブブロックの周りの1つの6×6窓の内部に適用した後、リファレンスピクチャリスト0(L0)とリファレンスピクチャリスト1(L1)予測サンプル間の差を最小化することにより算出される。そのように導出した運き精緻化に基づいて、オプティカルフローモデルに基づいて運き軌道に沿ってL0/L1予測サンプルを補間することにより、CUの最終バイ予測サンプルが算出される。
【0052】
DMVRは、最初に信号化された2つのMVとブロックとを併合するためのバイ予測技法であり、バイラテラルマッチング予測を使用することによってさらに精緻化することができる。バイラテラルマッチングは、2つの異なるリファレンスピクチャにおける現在のCUの動き軌跡に沿った2つのブロック間の最も近いマッチングを見つけることによって、現在のCUの動き情報を導出するために使用される。マッチングプロセスで使用されるコスト関数は、行サブサンプルSAD(sum of absolute difference)である。マッチング処理が行われた後、精緻化されたMVは、予測段階での動き補償、デブロッキングフィルタでの境界強度計算、後続のピクチャについての時間的動きベクトル予測及び後続のCUのためのクロスCTU空間動きベクトル予測のために使用
される。連続的な動き軌跡の仮定の下で、2つのリファレンスブロックを指し示す動きベクトルMV0及びMV1は、現在のピクチャと2つのリファレンスピクチャとの間の時間距離、即ちTD0及びTD1に比例するものとする。特別な場合として、現在のピクチャが時間的に2つのリファレンスピクチャの間にあり、現在のピクチャから2つのリファレンスピクチャまでの時間的距離が同じであるとき、バイラテラルマッチングは、ミラーベースの双方向MVになる。
【0053】
現在のVVCでは、BDOF及びDMVRは、両方ともCIIPモードと併せて使用され得る。
【0054】
図6は、現在のVVCにおいてBDOF(Bi-Directional Optical Flow)を使用するCIIP設計の例示的なワークフローを示すフローチャートである。このワークフローでは、L0及びL1動き補償(601及び602)がBDOF(603)を介して処理され、BDOFからの出力がイントラ予測(604)と一緒に処理されて、CIIPモードで加重平均(605)を形成する。
【0055】
現在のVVCはまた、CIIPモードに関連してDMVRの同様の適用を提供する。
【0056】
現在のVVCでは、CIIPモードは、動き補償予測の効率を高めることができる。しかしながら、本開示は、現在のVVCに含まれる現在のCIIP設計に存在する3つの問題を特定した。
【0057】
第1に、CIIPは、インター予測及びイントラ予測のサンプルを結合するので、各CIIP CUは、予測信号を生成するために、その再構成された隣接サンプルを使用する必要がある。これは、1つのCIIP CUの復号が、その隣接ブロックの完全な再構成に依存することを意味する。このような相互依存性のために、実際のハードウェア実装では、隣接する再構成サンプルがイントラ予測に利用可能になる再構成段階でCIIPを実行する必要がある。再構成ステージにおけるCUの復号は、連続的に(即ち、1つずつ)実行されなければならないので、リアルタイム復号の十分なスループットを保証するために、CIIPプロセスに含まれる計算演算(例えば、乗算、加算、及びビットシフト)の数が多過ぎることは望ましくない。さらに、現在のVVCにおける現在のCIIP設計では、BDOF及びDMVRなどの新しいインターモード符号化ツールも、CIIPモードのためのインター予測サンプルを生成するために含まれる。新しいモード間符号化ツールによって導入される追加の複雑さを考慮すると、このような設計は、CIIPが有効なとき、ハードウェアコーデックの符号化/復号化スループットを著しく低減させる可能性がある。
【0058】
第2に、現在のVVCにおける現在のCIIP設計では、1つのCIIP CUがバイ予測される1つの併合候補を参照するとき、リストL0及びL1における動き補償予測信号の両方が生成される必要がある。1つ以上のMVが整数精度でない場合、分数サンプル位置でサンプルを補間するために、追加の補間プロセスを呼び出さなければならない。このようなプロセスは、計算量を増加させるだけでなく、外部メモリからより多くのリファレンスサンプルにアクセスする必要がある場合にメモリ帯域幅を増加させ、その結果、CIIPが有効な場合にハードウェアコーデックの符号化/復号化スループットを著しく低減させる可能性がある。
【0059】
第3に、現在のVVCにおける現在のCIIP設計では、CIIP CUのイントラモード及びイントラCUのイントラモードは、それらの隣接ブロックのMPMリストを構築するときに異なるように扱われる。詳細には、1つの現在のCUがCIIPモードによって符号化されるとき、その隣接するCIIP CUはイントラとみなされる、即ち、隣接
するCIIP CUのイントラモードをMPM候補リストに追加することができる。しかしながら、現在のCUがイントラモードによって符号化される場合、その隣接するCIP
CUは、インターモードとみなされ、即ち、隣接するCIP CUのイントラモードは、MPM候補リストから除外される。このような非統一設計は、VVC標準の最終版には最適でない場合がある。
【0060】
本開示は、上記の3つの問題に対処するために、CIIPモードの適用の制約及び調整を提案する。
【0061】
本開示によれば、CIIPモードの適用のための候補であるCUを識別した後、CIIPモードの適用のための候補として識別されたCUがバイ予測されるか、または単予測されるかに関して決定が行われ、次いで、その決定に基づいて、CUへのCIIPモードの適用が制約される。
【0062】
本開示の一実施形態によれば、決定に基づいてCUへのCIIPモードの適用を制約することは、CUがバイ予測されるときにCUへのCIIPモードの適用中にインター予測サンプルの生成において1つ以上の予め定義されたインター予測技法の動作を無効にすることを含む。
【0063】
一例では、1つ以上の予め定義されたインター予測技法は、BDOF及びDMVRを含む。
【0064】
図7は、現在の予測ブロックのバイ予測を計算する際にDMVR及びBDOF演算を選択的にバイパスする例示的なワークフローを示すフローチャートである。現在の予測ブロックを処理している間、現在の予測ブロックに関連付けられた第1リファレンスピクチャ及び第2リファレンスピクチャが得られ(702)、表示順序で、第1リファレンスピクチャは現在のピクチャの前にあり、第2リファレンスピクチャは現在のピクチャの後にある。続いて、第1予測L0は、現在の予測ブロックから第1リファレンスピクチャのリファレンスブロックへの第1動きベクトルMV0に基づいて得られ(703)、第2予測L1は、現在の予測ブロックから第2リファレンスピクチャのリファレンスブロックへの第2動きベクトルMV1に基づいて得られる(704)。次に、DMVR演算を適用するか否かの決定が行われる(705)。適用される場合、DMVR演算は、第1予測L0及び第2予測L1に基づいて、第1動きベクトルMV0及び第2動きベクトルMV1を調整し、第1更新予測L0’及び第2更新予測L1’を生成する(706)。次に、BDOF演算を適用するか否かについて第2の判定が行われる(707)。適用される場合、BDOF演算は、第1更新予測L0’に関連付けられた予測サンプルについての第1水平・垂直勾配値、及び第2更新予測L1’に関連付けられた第2水平・垂直勾配値を計算する(708)。最後に、現在の予測ブロックのバイ予測は、第1予測L0、第2予測L1、任意で、第1更新予測L0’、任意で、第2更新予測L1’、任意で、第1水平・垂直勾配値、及び任意で、第2水平・垂直勾配値に基づいて計算される(709)。
【0065】
別の例では、1つ以上の予め定義されたインター予測技法は、BDOFを含む。図8は、本開示のこの例におけるCIIP設計の例示的なワークフローを示すフローチャートである。このワークフローでは、L0及びL1動き補償(801及び802)は、BDOFを介して処理される代わりに平均化され(803)、次いで、得られた平均は、イントラ予測(804)とともに処理されて、CIIPモードで加重平均(805)を形成する。
【0066】
第3の例では、1つ以上の予め定義されたインター予測技法は、DMVRを含む。
【0067】
本開示の別の実施形態によれば、決定に基づくCUへのCIIPモードの適用の制約は
、CUがバイ予測されるときにCUへのCIIPモードの適用中に、CUのためのイントラ予測サンプルと組み合わせて使用される複数の単予測サンプルを、すべての利用可能な単予測サンプルから選択するために、予め定義された基準を使用することを含む。
【0068】
一例では、予め定義された基準は、リファレンスピクチャリスト0(L0)内のピクチャに基づいてすべての単予測サンプルを選択することを含む。
【0069】
別の例では、予め定義された基準は、リファレンスピクチャリスト1(L1)内のピクチャに基づいてすべての単予測サンプルを選択することを含む。
【0070】
第3の例では、予め定義された基準は、CUが位置するピクチャ(「現在のピクチャ」)から最小ピクチャ順序カウント(POC)距離を有する1つのリファレンスピクチャに基づいて、すべての単予測サンプルを選択することを含む。図9は、本開示のこの例における提案されたCIIP設計の例示的なワークフローを示すフローチャートである。このワークフローでは、L0またはL1リファレンスピクチャがPOC距離において現在のピクチャにより近いかどうかに関して判定が行われ(901)、現在のピクチャから最小のPOC距離を有する1つのリファレンスピクチャからの動き補償が選択され(902及び903)、次いで、イントラ予測とともに処理されて(904)、CIIPモードにおいて加重平均を形成する(905)。
【0071】
本開示の別の実施形態によれば、決定に基づいてCUへのCIIPモードの適用を制約することは、CUへのCIIPモードの適用を無効にすることと、CUがバイ予測されるときに、CUのためのCIIPフラグの信号化を無効にすることとを含む。詳細には、オーバヘッドを低減するために、CIIP有効化/無効化フラグの信号化は、現在のCIIP CUの予測方向に依存する。現在のCUが単予測の場合、CIIPフラグはビットストリームで信号化され、CIIPが有効か無効かを示す。そうでなければ(即ち、現在のCUがバイ予測される場合)、CIIPフラグの信号化はスキップされ、常に偽であると推論される、即ち、CIIPは常に無効化される。
【0072】
また、本開示によれば、CU(「現在のCU」)のためのMPM候補リストを形成するときに、現在のCUの隣接するCUの中の各CUがそれぞれCIIP符号化されているか否かに関して判定が行われ、次いで、CIIP符号化されている隣接するCUの間の各隣接するCUについて、現在のCUがイントラ符号化されているかCIIP符号化されているか否かの判定に依存しない統一基準が、現在のCUのためのMPM候補リストの形成において隣接するCUのイントラモードを使用する過程で使用される。
【0073】
本開示のこの態様の一実施形態によれば、統一基準は、隣接CUがCIIP符号化されているときに、隣接CUのイントラモードをMPM候補リストの形成に使用できないものとして扱うことを含む。
【0074】
本開示のこの態様の別の実施形態によれば、統一基準は、隣接CUがCIIP符号化されている場合に、MPM候補リストの形成において、隣接CUのCIIP発明をイントラ発明に等しいものとして扱うことを含む。
【0075】
図10A及び図10Bは、本開示のこの態様の2つの実施形態の例示的なワークフローを示す一対のフローチャートを構成する。図10Aは、本開示のこの態様の第1実施形態のワークフローを示す。このワークフローでは、まず、隣接CUがイントラブロックであるかCIIPブロックであるかに関する決定がなされ(1001)、イントラブロックであるかCIIPブロックである場合のみ、現在のCUがイントラブロックであるかCIIPブロックであるかにかかわらず、そのイントラモードが現在のCUのMPM候補リスト
に追加される(1002)。図10Bは、本開示のこの態様の第2の実施形態のワークフローを示す。このワークフローでは、まず、隣接CUがイントラブロック(1003)であるか否かを判定し、イントラブロックである場合にのみ、現在のCUがイントラブロックであるかCIIPブロックであるかにかかわらず、そのイントラモードを現在のCUのMPM候補リストに追加する(1004)。
【0076】
1つ以上の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実施される場合、機能は、1つ以上の命令またはコードとして、コンピュータ読み取り可能な媒体上に記憶され、またはそれを介して送信され、ハードウェアベースの処理ユニットによって実行されてもよい。コンピュータ可読記憶媒体は、データ記憶媒体のような有形媒体に対応するコンピュータ可読記憶媒体、または、例えば通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読記憶媒体は、一般に、(1)非一時的である有形のコンピュータ可読記憶媒体、または(2)信号または搬送波などの通信媒体に対応することができる。データ記憶媒体は、本出願に記載の実施のための命令、コード及び/またはデータ構造を検索するために、1つ以上のコンピュータまたは1つ以上のプロセッサによってアクセス可能な任意の利用可能な媒体であってもよい。コンピュータプログラム製品は、コンピュータ可読記憶媒体を含み得る。
【0077】
さらに、上記の方法は、ASIC(application specific integrated circuits)、DSP(digital signal processors)、DSPD(digital signal processing
devices)、PLD(programmable logic devices)、FPGA(field programmable gate arrays)、コントローラ、マイクロコントローラ、マイクロプロセッサ、または他の電子構成要素を含む1つ以上の回路を含む装置を使用して実装され得る。装置は、上述の方法を実行するために、他のハードウェアまたはソフトウェアコンポーネントと組み合わせて回路を使用することができる。上記で開示された各モジュール、サブモジュール、ユニット、またはサブユニットは、1つ以上の回路を使用して少なくとも部分的に実装され得る。
【0078】
本発明の他の実施形態は、本明細書を考慮し、本明細書に開示された本発明を実施することにより、当業者には明らかになるであろう。本出願は、本発明の一般的な原理に従い、当該技術分野における既知の又は慣例の実施の範囲内に入るような本開示からの逸脱を含む、本発明の任意の変形、使用、又は適応を包含することが意図される。本明細書及び各実施形態は、単なる例示を意図するものであり、本発明の真の範囲及び趣旨は、特許請求の範囲に記載する。
【0079】
本発明は、上述し、添付図面に示した正確な例に限定されるものではなく、本発明の範囲から逸脱することなく、様々な修正及び変更を行うことができることが理解されるであろう。本発明の範囲は、添付の特許請求の範囲によってのみ限定されることが意図される。
【0080】
〔関連出願の相互参照〕
【0081】
本出願は、2019年3月12日に出願された米国仮特許出願第62/817,503号の利益を主張する。前述の出願の全開示は、その全体が参照により本明細書に組み込まれる。
図1
図2
図3A
図3B
図3C
図3D
図3E
図4A
図4B
図4C
図5A
図5B
図6
図7
図8
図9
図10A
図10B