(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-02-18
(54)【発明の名称】ビデオコーディングの方法、ビデオコーディングデバイス、コンピュータ可読記憶媒体およびコンピュータプログラム
(51)【国際特許分類】
H04N 19/577 20140101AFI20220210BHJP
H04N 19/157 20140101ALI20220210BHJP
H04N 19/176 20140101ALI20220210BHJP
H04N 19/107 20140101ALI20220210BHJP
H04N 19/105 20140101ALI20220210BHJP
【FI】
H04N19/577
H04N19/157
H04N19/176
H04N19/107
H04N19/105
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021540266
(86)(22)【出願日】2020-01-09
(85)【翻訳文提出日】2021-07-09
(86)【国際出願番号】 US2020012826
(87)【国際公開番号】W WO2020146562
(87)【国際公開日】2020-07-16
(32)【優先日】2019-01-09
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521289098
【氏名又は名称】ベイジン ダイジャ インターネット インフォメーション テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】BEIJING DAJIA INTERNET INFORMATION TECHNOLOGY CO.,LTD.
【住所又は居所原語表記】Room 101D1-7,1st Floor,Building 1,Shangdi West Road,Haidian District,Beijing 100085,P.R.China
(74)【代理人】
【識別番号】100112656
【氏名又は名称】宮田 英毅
(74)【代理人】
【識別番号】100089118
【氏名又は名称】酒井 宏明
(72)【発明者】
【氏名】シュウ,シャオユウ
(72)【発明者】
【氏名】チェン,イーウェン
(72)【発明者】
【氏名】ワン,シャンリン
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LC09
5C159MA04
5C159MA05
5C159MA14
5C159MA19
5C159MA21
5C159MC11
5C159PP16
5C159TA23
5C159TA31
5C159TB08
5C159TC27
5C159TC42
5C159TD03
5C159TD05
5C159UA02
5C159UA05
5C159UA16
(57)【要約】
本開示は、ビデオコーディングのための方法に関するものである。この方法は、現在の予測ブロックに関連付けられる第1の参照画像と第2の参照画像とを取得することと、現在の予測ブロックから第1の参照画像内の参照ブロックへの第1の動きベクトルMV0に基づいて、第1の予測L0を生成することと、現在の予測ブロックから第2の参照画像内の参照ブロックへの第2の動きベクトルMV1に基づいて、第2の予測L1を生成することと、双方向オプティカルフロー(BDOF)操作が適用されるかどうかを特定することと、第1の予測L0および第2の予測L1と、第1の勾配値および第2の勾配値とに基づいて、現在の予測ブロックの二重予測を計算することと、を含む。
【特許請求の範囲】
【請求項1】
【請求項2】
前記BDOF動作が適用されないかどうかを特定することは、前記現在の予測ブロックの最終予測を生成するためにCIIPが適用されるという条件で前記BDOF動作が適用されないと特定することをさらに含む、請求項1に記載の方法。
【請求項3】
前記BDOF動作が適用されると特定することは、前記現在の予測ブロックの最終予測を生成するためにCIIPが適用されないときに前記BDOF動作が適用されると特定することをさらに含む、請求項1に記載の方法。
【請求項4】
前記現在のブロックの前記二重予測は、前記第1の予測L0と前記第2の予測L1とを平均することに基づいて計算される、請求項2に記載の方法。
【請求項5】
【請求項6】
現在の予測ブロックに関連付けられる参照画像リスト内の参照画像を取得することと、
現在の画像から第1の参照画像への第1の動きベクトルに基づいて、インター予測を生成することと、
前記現在の予測ブロックに関連付けられるイントラ予測モードを取得することと、
前記イントラ予測に基づいて、前記現在の予測ブロックのイントラ予測を生成することと、
前記インター予測と前記イントラ予測を平均することにより、前記現在の予測ブロックの最終予測を生成することと、
前記現在の予測ブロックが、最も可能性の高いモード(MPM)ベースのイントラモード予測に対して、インターモードまたはイントラモードのどちらとして扱われるかを特定することと、
を妥協するビデオコーディングの方法。
【請求項7】
前記現在の予測ブロックが前記参照画像リストL0内の1つの参照画像から予測されるときに、前記参照画像リストはL0である、請求項6に記載の方法。
【請求項8】
前記現在の予測ブロックが前記参照画像リストL1内の1つの参照画像から予測されるときに、前記参照画像リストはL1である、請求項6に記載の方法。
【請求項9】
前記現在の予測ブロックが、前記参照画像リストL0内の1つの第1の参照画像と前記参照画像リストL1内の1つの第2の参照画像から予測されるときに、前記参照画像リストはL0である、請求項6に記載の方法。
【請求項10】
前記現在の予測ブロックが、前記参照画像リストL0内の1つの第1の参照画像と前記参照画像リストL1内の1つの第2の参照画像から予測されるときに、前記参照画像リストはL1である、請求項6に記載の方法。
【請求項11】
前記参照画像リストは、前記現在の予測ブロックが、前記参照画像リストL0内の1つの第1の参照画像と前記参照画像リストL1内の1つの第2の参照画像から予測されるときに、前記現在の画像までの画像順序カウント(POC)距離がより小さい1つの参照画像に関連付けられるものである、請求項6に記載の方法。
【請求項12】
前記現在の予測ブロックは、インターモードとして扱われ、前記現在の予測ブロックの前記イントラ予測モードは、MPMベースのイントラモード予測に使用されない、請求項6に記載の方法。
【請求項13】
前記現在の予測ブロックは、イントラモードとして扱われ、前記現在の予測ブロックの前記イントラ予測モードは、MPMベースのイントラモード予測に使用される、請求項6に記載の方法。
【請求項14】
【請求項15】
前記BDOF動作が適用されないかどうかを特定することは、前記現在の予測ブロックの最終予測を生成するために複合インターとイントラ予測(CIIP)が適用されるという条件で前記BDOF動作が適用されないと特定することをさらに含む、請求項14に記載の非一時的なコンピュータ可読記憶媒体。
【請求項16】
前記BDOF動作が適用されると特定することは、前記現在の予測ブロックの最終予測を生成するためにCIIPが適用されないときに前記BDOF動作が適用されると特定することをさらに含む、請求項14に記載の非一時的なコンピュータ可読記憶媒体。
【請求項17】
前記現在の予測ブロックの前記二重予測を計算することは、前記第1の予測L0と前記第2の予測L1とに基づいて計算される、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
【請求項18】
【請求項19】
1つまたは複数のプロセッサを有するコンピューティングデバイスによって実行される複数のプログラムを格納する非一時的なコンピュータ可読記憶媒体であって、
前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、
現在の予測ブロックに関連付けられる参照画像リスト内の参照画像を取得することと、
現在の画像から第1の参照画像への第1の動きベクトルに基づいて、インター予測を生成することと、
前記現在の予測ブロックに関連付けられるイントラ予測モードを取得することと、
前記イントラ予測に基づいて、前記現在の予測ブロックのイントラ予測を生成することと、
前記インター予測と前記イントラ予測を平均することにより、前記現在の予測ブロックの最終予測を生成することと、
前記現在の予測ブロックが、最も可能性の高いモード(MPM)ベースのイントラモード予測に対して、インターモードまたはイントラモードのどちらとして扱われるかを特定することと、
を含む動作を、前記コンピューティングデバイスに実行させる、非一時的なコンピュータ可読記憶媒体。
【請求項20】
前記現在の予測ブロックが前記参照画像リストL0内の1つの参照画像から予測されるときに、前記参照画像リストはL0である、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【請求項21】
前記現在の予測ブロックが前記参照画像リストL1内の1つの参照画像から予測されるときに、前記参照画像リストはL1である、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【請求項22】
前記現在の予測ブロックが、前記参照画像リストL0内の1つの第1の参照画像と前記参照画像リストL1内の1つの第2の参照画像から予測されるときに、前記参照画像リストはL0である、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【請求項23】
前記現在の予測ブロックが、前記参照画像リストL0内の1つの第1の参照画像と前記参照画像リストL1内の1つの第2の参照画像から予測されるときに、前記参照画像リストはL1である、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【請求項24】
前記参照画像リストは、前記現在の予測ブロックが、前記参照画像リストL0内の1つの第1の参照画像と前記参照画像リストL1内の1つの第2の参照画像から予測されるときに、前記現在の画像までの画像順序カウント(POC)距離がより小さい1つの参照画像に関連付けられるものである、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【請求項25】
前記現在の予測ブロックは、インターモードとして扱われ、前記現在の予測ブロックの前記イントラ予測モードは、MPMベースのイントラモード予測に使用されない、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【請求項26】
前記現在の予測ブロックは、イントラモードとして扱われ、前記現在の予測ブロックの前記イントラ予測モードは、MPMベースのイントラモード予測に使用される、請求項19に記載の非一時的なコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2019年1月9日に出願された仮出願第62/790,421号に基づき優先権を主張し、その全部の内容をここに援用する。
【0002】
本願は、ビデオコーディングと圧縮に関するものである。より具体的には、本願は、ビデオコーディングのための複合インターとイントラ予測(CIIP)方法に関する方法および装置に関するものである。
【背景技術】
【0003】
ビデオデータを圧縮するために、様々なビデオコーディング技術を使用することができる。ビデオコーディングは、1つまたは複数のビデオコーディング規格に従って実行される。たとえば、ビデオコーディング規格には、多用途ビデオコーディング(VVC)、共同探査テストモデル(JEM)、高効率ビデオコーディング(H.265/HEVC)、高度なビデオコーディング(H.264/AVC)、動画エキスパートグループ(MPEG)コーディングなどが含まれる。ビデオコーディングは、一般に、ビデオ画像またはシーケンスに存在する冗長性を利用する予測方法(例えば、インター予測、イントラ予測など)を利用する。ビデオコーディング技術の重要な目標は、ビデオ品質の低下を回避または最小限に抑えながら、ビデオデータを、より低いビットレートを使用する形式に圧縮することである。
【発明の概要】
【0004】
本開示の例は、マージ関連モードの構文シグナリングの効率を改善するための方法を提供する。
【0005】
【0006】
本開示の第2の態様によれば、現在の予測ブロックに関連付けられる参照画像リスト内の参照画像を取得することと、現在の画像から第1の参照画像への第1の動きベクトルに基づいて、インター予測を生成することと、前記現在の予測ブロックに関連付けられるイントラ予測モードを取得することと、前記イントラ予測に基づいて、前記現在の予測ブロックのイントラ予測を生成することと、前記インター予測と前記イントラ予測を平均することにより、前記現在の予測ブロックの最終予測を生成することと、前記現在の予測ブロックが、最も可能性の高いモード(MPM)ベースのイントラモード予測に対して、インターモードまたはイントラモードのどちらとして扱われるかを特定することと、を妥協するビデオコーディングの方法。
【0007】
【0008】
本開示の第4の態様によれば、インストラクションを記憶する非一時的なコンピュータ可読記憶媒体が提供される。1つまたは複数のプロセッサによって実行されると、現在の予測ブロックに関連付けられる参照画像リスト内の参照画像を取得することと、現在の画像から第1の参照画像への第1の動きベクトルに基づいて、インター予測を生成することと、前記現在の予測ブロックに関連付けられるイントラ予測モードを取得することと、前記イントラ予測に基づいて、前記現在の予測ブロックのイントラ予測を生成することと、前記インター予測と前記イントラ予測を平均することにより、前記現在の予測ブロックの最終予測を生成することと、前記現在の予測ブロックが、最も可能性の高いモード(MPM)ベースのイントラモード予測に対して、インターモードまたはイントラモードのどちらとして扱われるかを特定することと、を含む動作を、コンピューティングデバイスに実行させる。
【0009】
前述の一般的な説明および以下の詳細な説明の両方は単なる例であり、本開示を限定するものではないことを理解されたい。
【図面の簡単な説明】
【0010】
本明細書に組み込まれ、その一部を構成する添付の図面は、本開示と一致する例を示し、説明とともに、本開示の原理を説明するのに役立つ。
【
図1】本開示の一例による、エンコーダのブロック図である。
【
図2】本開示の一例による、デコーダのブロック図である。
【
図3】本開示の一例による、複合インターとイントラ予測(CIIP)を生成するための方法を示すフローチャートである。
【
図4】本開示の一例による、CIIPを生成するための方法を示すフローチャートである。
【
図5A】本開示の一例による、マルチタイプツリー構造におけるブロックパーティションを示す図である。
【
図5B】本開示の一例による、マルチタイプツリー構造におけるブロックパーティションを示す図である。
【
図5C】本開示の一例による、マルチタイプツリー構造におけるブロックパーティションを示す図である。
【
図5D】本開示の一例による、マルチタイプツリー構造におけるブロックパーティションを示す図である。
【
図5E】本開示の一例による、マルチタイプツリー構造におけるブロックパーティションを示す図である。
【
図6A】本開示の一例による、複合インターとイントラ予測(CIIP)を示す図である。
【
図6B】本開示の一例による、複合インターとイントラ予測(CIIP)を示す図である。
【
図6C】本開示の一例による、複合インターとイントラ予測(CIIP)を示す図である。
【
図7A】本開示の一例による、MPM候補リスト生成プロセスのフローチャートである。
【
図7B】本開示の一例による、MPM候補リスト生成プロセスのフローチャートである。
【
図8】本開示の一例による、VVCにおける既存のCIIPデザインのワークフローを示す図である。
【
図9】本開示の一例による、BDOFを除去することによる提案されたCIIP方法のワークフローを示す図である。
【
図10】本開示の一例による、POC距離に基づいて予測リストを選択する、単一予測ベースのCIIPのワークフローを示す図である。
【
図11A】本開示の一例による、MPM候補リスト生成のためにCIIPブロックを有効にするときの方法のフローチャートである。
【
図11B】本開示の一例による、MPM候補リスト生成のためにCIIPブロックを無効にするときの方法のフローチャートである。
【
図12】本開示の一例による、ユーザインターフェースと結合されたコンピューティング環境を示す図である。
【発明を実施するための形態】
【0011】
ここで、本開示の例を詳細に参照し、その例を添付の図面に示す。以下の説明は、別段の記載がない限り、異なる図面における同じ番号が同じまたは類似の要素を表す添付の図面を参照している。本開示の例の以下の説明に記載されている実施の形態は、本開示と一致するすべての実施の形態を表すわけではない。その代わり、それらは、添付の特許請求の範囲に記載されている本開示に関連する態様と一致する装置および方法の単なる例である。
【0012】
本開示で使用される用語は、特定の実施の形態を説明することのみを目的としており、本開示を限定することを意図するものではない。本開示および添付の特許請求の範囲で使用されるように、単数形「a」、「an」、および「the」は、文脈で明確に示されていない限り、複数形も含むことを意図している。ここで使用される「および/または」という用語は、関連するリストされたアイテムの1つまたは複数の任意またはすべての可能な組み合わせを意味し、含むことを意図することも理解されたい。
【0013】
ここで、「第1」、「第2」、「第3」などの用語を使用して様々な情報を説明することができるが、情報はこれらの用語によって限定されるべきではないことを理解されたい。これらの用語は、あるカテゴリの情報を別のカテゴリと区別するためにのみ使用される。例えば、本開示の範囲から逸脱することなく、第1の情報は、第2の情報と呼ばれることができ、同様に、第2の情報は、第1の情報と呼ばれることもできる。ここで使用される場合、「もし」という用語は、文脈に応じて、「ときに」または「に際して」または「判断に応じて」を意味すると理解され得る。
【0014】
HEVC規格の第1のバージョンは、2013年10月に完成し、これは、前世代のビデオコーディング規格H.264/MPEG AVCと比較して、約50%のビットレート節約または同等の知覚品質を提供する。HEVC規格は、その前身よりも大幅なコーディングの改善を提供しているが、HEVCにコーディングツールを追加することで、優れたコーディング効率を達成できるという証拠がある。これに基づいて、VCEGとMPEGの両方が、将来のビデオコーディング標準化のための新しいコーディングテクノロジーの調査作業を開始した。コーディング効率の大幅な向上を可能にする高度なテクノロジーの重要な研究が開始されるために、2015年10月に、ITU-TVECGとISO/IEC MPEGによって1つのJoint Video Exploration Team(JVET)が結成された。共同探査モデル(JEM)と呼ばれる1つの参照ソフトウェアは、HEVCテストモデル(HM)の上にいくつかの追加のコーディングツールを統合することにより、JVETによって維持されていた。
【0015】
2017年10月に、HEVCを超える機能を備えたビデオ圧縮に関する共同提案募集(CfP)が、ITU-TおよびISO/IECによって発行された。2018年4月に、第10回JVET会議で、23のCfP応答が受信され評価され、HEVCよりも約40%の圧縮効率ゲインが実証された。このような評価結果に基づいて、JVETは、Versatile Video Coding(VVC)と呼ばれる新世代のビデオコーディング規格を開発するための新しいプロジェクトを立ち上げた。同じ月に、VVC規格の参照実装を実証するために、VVCテストモデル(VTM)と呼ばれる1つの参照ソフトウェアコードベースが確立された。
【0016】
HEVCと同様に、VVCは、ブロックベースのハイブリッドビデオコーディングフレームワーク上に構成されている。
図1(以下に説明)は、一般的なブロックベースのハイブリッドビデオ符号化システムのブロック図を与える。入力ビデオ信号は、ブロック(コーディングユニット(CU)と呼ばれる。)ごとに処理される。VTM-1.0では、CUは最大128x128ピクセルにすることができる。ただし、クアッドツリーのみに基づいてブロックを区分するHEVCとは異なり、VVCでは、クアッド/二元/ターナリーツリーに基づくさまざまなローカル特性に適応するために、1つのコーディングツリーユニット(CTU)がCUに分割される。さらに、HEVCにおける複数のパーティションユニットタイプの概念が除去され、つまり、CUと予測ユニット(PU)と変換ユニット(TU)の分離がVVCに存在しなくなり、その代わりに、各CUは常に、追加のパーティションなしで予測と変換の両方の基本単位として使用される。マルチタイプツリー構造では、1つのCTUが最初にクアッドツリー構造によって区分される。次に、各クアッドツリーリーフノードが二元およびターナリツリー構造でさらに区分されることができる。図
図5A、
図5B、
図5C、
図5D、
図5D、
図5E(以下で説明する。)に示すように、それぞれ、四元パーティショニング、水平二元パーティショニング、垂直二元パーティショニング、水平三元パーティショニング、および垂直三元パーティショニングの5つの分割タイプがある。
【0017】
図1(以下に説明)では、空間予測および/または時間予測を実行することができる。空間予測(または「イントラ予測」)は、同一のビデオ画像/スライスにおけるすでにコーディングされた隣接ブロックのサンプル(参照サンプルと呼ばれる。)からのピクセルを使用して、現在のビデオブロックを予測する。空間予測は、ビデオ信号に固有の空間的冗長性を低減する。時間予測(「インター予測」または「動き補償予測」とも呼ばれる。)は、すでにコーディングされたビデオ画像からの再構成されたピクセルを使用して、現在のビデオブロックを予測する。時間予測は、ビデオ信号に固有の時間的冗長性を低減する。特定のCUについての時間予測信号は、通常、現在のCUとその時間参照との間の動きの量と方向を示す1つまたは複数の動きベクトル(MV)によってシグナリングされる。また、複数の参照画像がサポートされている場合には、1つの参照画像インデックスが追加で送信される。これは、時間予測信号が参照画像ストアにおけるどの参照画像から来るかを識別するために使用される。空間予測および/または時間予測の後、エンコーダにおけるモード決定ブロックは、例えば、レート歪み最適化方法に基づいて、最適な予測モードを選択する。次に、予測ブロックは、現在のビデオブロックから差し引かれ、予測残差は、変換と量子化を使用して無相関化される。
【0018】
量子化された残差係数は、逆量子化と逆変換されて、再構成された残差を形成し、次に予測ブロックに追加されて、CUの再構成された信号を形成する。デブロッキングフィルター、サンプルアダプティブオフセット(SAO)、アダプティブインループフィルター(ALF)などのさらなるインループフィルタリングは、参照画像ストアに配置され将来のビデオブロックのコーディングに使用される前に、再構成されたCUに適用できる。出力ビデオビットストリームを形成するために、コーディングモード(インターまたはイントラ)、予測モード情報、動き情報、および量子化された残差係数は、すべてエントロピーコーディングユニットに送信され、さらに圧縮およびパックされてビットストリームを形成する。
【0019】
図2(以下に説明)は、ブロックベースのビデオデコーダの一般的なブロック図を示す。ビデオビットストリームは、最初にエントロピーデコードユニットでエントロピーデコードされる。コーディングモードおよび予測情報は、空間予測ユニット(イントラコーディングされている場合)または時間予測ユニット(インターコーディングされている場合)のいずれかに送信されて、予測ブロックを形成する。残差変換係数は、逆量子化ユニットと逆変換ユニットに送信されて、残差ブロックを再構成する。次に、予測ブロックと残差ブロックは、一緒に加算される。再構成されたブロックは、参照画像ストアに格納される前に、インループフィルタリングをさらに通過することができる。次に、参照画像ストアにおける再構成されたビデオは、ディスプレイデバイスを駆動するために送出され、将来のビデオブロックを予測するためにも使用される。
【0020】
図1は、典型的なエンコーダ100を示す。エンコーダ100は、ビデオ入力110、動き補償112、動き推定114、イントラ/インターモード決定116、ブロック予測器140、加算器128、変換130、量子化132、予測関連情報142、イントラ予測118、画像バッファ120、逆量子化134、逆変換136、加算器126、メモリ124、インループフィルタ122、エントロピーコーディング138、およびビットストリーム144を有する。
【0021】
図2は、典型的なデコーダ200のブロック図を示す。デコーダ200は、ビットストリーム210、エントロピーデコード212、逆量子化214、逆変換216、加算器218、イントラ/インターモード選択220、イントラ予測222、メモリ230、インループフィルタ228、動き補償224、画像バッファ226、予測関連情報234、およびビデオ出力232を有する。
【0022】
図3は、本開示による、複合インターとイントラ予測(CIIP)を生成するための例示的な方法300を示す。
【0023】
ステップ310において、現在の予測ブロックに関連付けられる第1の参照画像と第2の参照画像を取得する。ここで、第1の参照画像は表示順で現在の画像の前にあり、第2の参照画像は表示順で現在の画像の後にある。
【0024】
ステップ312において、現在の予測ブロックから第1の参照画像内の参照ブロックへの第1の動きベクトルMV0に基づいて、第1の予測L0を取得する。
【0025】
ステップ314において、現在の予測ブロックから第2の参照画像内の参照ブロックへの第2の動きベクトルMV1に基づいて、第2の予測L1を取得する。
【0026】
【0027】
【0028】
図4は、本開示による、CIIPを生成するための例示的な方法を示す。たとえば、当該方法は、CIIPを生成するために、単一予測ベースのインター予測とMPMベースのイントラ予測が含まれる。
【0029】
ステップ410において、現在の予測ブロックに関連付けられる参照画像リストにおける参照画像を取得する。
【0030】
ステップ412において、現在の画像から第1の参照画像への第1の動きベクトルに基づいて、インター予測を生成する。
【0031】
ステップ414において、現在の予測ブロックに関連付けられるイントラ予測モードを取得する。
【0032】
ステップ416において、イントラ予測に基づいて、現在の予測ブロックのイントラ予測を生成する。
【0033】
ステップ418において、インター予測とイントラ予測を平均することにより、現在の予測ブロックの最終予測を生成する。
【0034】
ステップ420において、現在の予測ブロックが、最も可能性の高いモード(MPM)ベースのイントラモード予測について、インターモードまたはイントラモードのどちらとして扱われるかを特定する。
【0035】
図5Aは、本開示の一例による、マルチタイプツリー構造におけるブロック四元パーティションを示す図を示す。
【0036】
図5Bは、本開示の一例による、マルチタイプツリー構造におけるブロック垂直二元パーティションを示す図を示す。
【0037】
図5Cは、本開示の一例による、マルチタイプツリー構造におけるブロック水平二元パーティションを示す図を示す。
【0038】
図5Dは、本開示の一例による、マルチタイプツリー構造におけるブロック垂直三元パーティションを示す図を示す。
【0039】
図5Eは、本開示の一例による、マルチタイプツリー構造におけるブロック水平三元パーティションを示す図を示す。
【0040】
複合インターとイントラ予測
図1、
図2に示されるように、インターとイントラ予測方法は、ハイブリッドビデオコーディングスキームで使用される。ここで、各PUは、時間域または空間域のいずれかのみで、相関性を利用するために、インター予測またはイントラ予測を選択することが許可され、両方ではできない。ただし、従来の文献で指摘されているように、インター予測ブロックとイントラ予測ブロックによって生成された残差信号は、互いに非常に異なる特性を示す可能性がある。したがって、2種類の予測を効率的に組み合わせることができれば、予測残差のエネルギーを削減してコーディング効率を向上させるために、もう1つの正確な予測が期待できる。さらに、自然なビデオコンテンツでは、動くオブジェクトの動きが複雑になる可能性がある。たとえば、古いコンテンツ(たとえば、以前にコーディングされた画像に含まれるオブジェクト)と新たな新しいコンテンツ(たとえば、以前にコーディングされた画像で除外されるオブジェクト)の両方を含む領域が存在する可能性がある。このようなシナリオでは、インター予測も、イントラ予測も、現在のブロックの1つの正確な予測を提供できない。
【0041】
予測効率をさらに改善するために、VVC規格には、マージモードによってコーディングされた1つのCUのイントラ予測とインター予測を組み合わせる複合インターとイントラ予測(CIIP)が採用されている。具体的には、マージCUごとに、1つの追加フラグは、CIIPが現在のCUに対して有効になっているかどうかを示すために、シグナリングされる。輝度コンポーネントに対して、CIIPは、平面モード、DCモード、水平モード、垂直モードを含む頻繁に使用される4つのイントラモードをサポートする。彩度コンポーネントに対して、DM(つまり、彩度は、輝度コンポーネントの同じイントラモードを再利用する)は、追加のシグナリングなしで常に適用される。さらに、既存のCIIPデザインでは、加重平均が適用され、1つのCIIP CUのインター予測サンプルとイントラ予測サンプルが結合される。具体的には、平面モードまたはDCモードが選択されている場合において、等しい重み(つまり、0.5)が適用される。それ以外の場合(つまり、水平モードまたは垂直モードのいずれかが適用される。)、現在のCUは最初に水平(水平モードの場合)または垂直(垂直モードの場合)に4つの同じサイズの領域に分割される。
【0042】
【0043】
さらに、現在のVVC動作仕様では、1つのCIIP CUのイントラモードが、最も可能性の高いモード(MPM)メカニズムを介して、その隣接するCIIP CUのイントラモードを予測するための予測子として使用されることができる。具体的には、各CIIP CUについて、その隣接するブロックもCIIP CUである場合において、それらの隣接ブロックのイントラモードは、最初に、平面モード、DCモード、水平モード、および垂直モード内の最も近いモードに丸められ、次に、現在のCUのMPM候補リストに追加される。ただし、各イントラCUのMPMリストを構成するときには、その隣接するブロックの1つは、CIIPモードでコーディングされていると、使用不可と見なされる。つまり、1つのCIIP CUのイントラモードは、その隣接するイントラCUのイントラモードを予測することを許可されていない。
図7Aと
図7B(以下で説明する)は、イントラCUとCIIP CUのMPMリスト生成プロセスを比較する。
【0044】
【0045】
【0046】
【0047】
【0048】
ここで、shiftとooffsetは、それぞれ、15-BDと1≪(14-BD)+2・(1≪13)に等しく、二重予測のL0とL1予測信号を組み合わせるために適用される右シフト値とオフセット値である。
【0049】
図6Aは、本開示の一例による、水平モードの複合インターとイントラ予測を示す図を示す。
【0050】
図6Bは、本開示の一例による、垂直モードの複合インターとイントラ予測を示す図を示す。
【0051】
図6Cは、本開示の一例による、平面モードとDCモードの複合インターとイントラ予測を示す図を示す。
【0052】
図7Aは、本開示の一例による、イントラCUSのMPM候補リスト生成プロセスのフローチャートを示す。
【0053】
図7Bは、本開示の一例による、CIIP CUのMPM候補リスト生成プロセスのフローチャートを示す。
【0054】
CIIPに対する改善
CIIPは、従来の動き補償予測の効率を高めることができるが、そのデザインをさらに改善することができる。具体的には、VVCにおける既存のCIIPデザインにおける以下の問題は、本開示で識別されている。
【0055】
まず、「複合インターとイントラ予測」のセクションで説明したように、CIIPは、インターとイントラ予測のサンプルを組み合わせるため、各CIIP CUは、その再構成された隣接サンプルを使用して予測信号を生成する必要がある。これは、1つのCIIP CUのデコードが、その隣接ブロックの完全な再構成に依存していることを意味する。このような相互依存性のため、実際のハードウェア実装では、CIIPは、隣接する再構成されたサンプルがイントラ予測に利用できるようになる再構成段階で実行する必要がある。再構成段階でのCUのデコードは、順次に(つまり、1つずつ)実行しなければならないため、CIIPプロセスに含まれる計算演算(例えば、乗算、加算、ビットシフト)の数は、リアルタイムデコードの十分なスループットを確保するために、高すぎるものとすることができない。
【0056】
「双方向オプティカルフロー」のセクションで述べたように、BDOFは、前方および後方の両方の時間方向からの2つの参照ブロックから、1つのインターコーディングされたCUが予測されるときに、予測品質が向上するように、有効にされる。
図8(以下に説明)に示すように、現在のVVCでは、BDOFも、CIIPモードのインター予測サンプルを生成するために関与している。BDOFによるさらなる複雑性を考えると、このようなデザインは、CIIPが有効にされる場合、ハードウェアコーデックのエンコード/デコードスループットが大幅に低下する可能性がある。
【0057】
次に、現在のCIIPデザインでは、1つのCIIP CUが、二重予測される1つのマージ候補を参照する場合に、リストL0およびL1の両方の動き補償予測信号を生成する必要がある。1つまたは複数のMVが整数精度でない場合においては、部分的なサンプル位置でサンプルを補間するために、追加の補間プロセスを呼び出しなければならない。このようなプロセスは、計算上の複雑さを増すだけでなく、外部メモリからより多くの参照サンプルにアクセスする必要がある場合、メモリ帯域幅も増やす。
【0058】
それから、「複合インターとイントラ予測」のセクションで論じたように、現在のCIIPデザインでは、CIIP CUのイントラモードとイントラCUのイントラモードは、それらの隣接ブロックのMPMリストを構成するときに異なって扱われる。具体的には、1つの現在のCUがCIIPモードでコーディングされている場合には、その隣接するCIIP CUは、イントラと見なされ、つまり、隣接するCIIP CUのイントラモードがMPM候補リストに追加されることができる。ただし、現在のCUがイントラモードでコーディングされている場合には、その隣接するCIIP CUは、インターと見なされ、つまり、隣接するCIIP CUのイントラモードがMPM候補リストから除外されている。このような統一されていないデザインは、VVC規格の最終バージョンに最適でない可能性がある。
【0059】
図8は、本開示の一例による、VVCにおける既存のCIIPデザインのワークフローを示す図を示す。
【0060】
CIIPの単純化
本開示では、ハードウェアコーデック実装を容易にするために既存のCIIPデザインを単純化するための方法が提供される。一般に、本開示で提案される技術の主なアスペクトは、以下のように要約される。
【0061】
まず、CIIPコーディング/デコードスループットを改善するために、CIIPモードでのインター予測サンプルの生成からBDOFを除外することが提案される。
【0062】
次に、計算上の複雑さおよびメモリ帯域幅の消費を低減するためには、1つのCIIP CUが二重予測される(すなわち、L0およびL1 MVの両方を有する)場合においては、インター予測サンプルを生成するために、ブロックを二重予測から単一予測に変換する方法が提案される。
【0063】
それから、2つの方法は、隣接するブロックのMPM候補を形成するときに、イントラCUとCIIPのイントラモードを調和させるために提案される。
【0064】
BDOFのないCIIP
「問題ステートメント」のセクションで指摘されているように、BDOFは、現在のCUが二重予測されるとき、CIIPモードについてのインター予測サンプルを生成するように、常に有効にされている。BDOFのさらなる複雑さのため、既存のCIIPデザインは、エンコード/デコードスループットが大幅に低下する可能性があり、特に、リアルタイムデコードがVVCデコーダーに対して困難になる可能性がある。一方、CIIP CUについては、その最終予測サンプルは、インター予測サンプルとイントラ予測サンプルを平均することによって生成される。言い換えると、BDOFによる改良した予測サンプルは、CIIP CUの予測信号として直接使用されない。したがって、従来の二重予測CU(ここで、BDOFは、予測サンプルを生成するために直接に適用される)と比較すると、BDOFから得られる対応する改善はCIIP CUでは効率が低くなる。したがって、上記の事情に基づいて、CIIPモードのインター予測サンプルを生成するときにBDOFを無効にすることが提案される。
図9(以下に説明)は、BDOFを除去した後の提案されたCIIPプロセスの対応するワークフローを示す。
【0065】
図9は、本開示の一例による、BDOFを除去することによる提案されたCIIP方法のワークフローを示す図を示す。
【0066】
単一予測に基づくCIIP
上記のように、1つのCIIP CUによって参照されるマージ候補が二重予測されるときには、L0およびL1予測信号の両方を生成し、CU内のサンプルを予測する。メモリ帯域幅および補間の複雑さを低減するために、本開示の一実施形態では、(現在のCUが二重予測されている場合でも)単一予測を使用して生成されたインター予測サンプルのみを使用して、CIIPモードにおけるイントラ予測サンプルと結合することになる。具体的には、現在のCIIP CUが単一予測の場合において、インター予測サンプルは、イントラ予測サンプルと直接結合される。それ以外の場合(つまり、現在のCUが二重予測される場合)には、CIIPによって使用されるインター予測サンプルは、1つの予測リスト(L0またはL1)からの単一予測に基づいて生成される。予測リストを選択するには、さまざまな方法が適用できる。第1の方法では、2つの参照画像によって予測される任意のCIIPブロックに対して、第1の予測(つまり、リストL0)を常に選択することが提案されている。
【0067】
第2の方法では、2つの参照画像によって予測される任意のCIIPブロックに対して、第2の予測(すなわち、リストL1)を常に選択することが提案される。第3の方法では、1つの適応方法は、現在の画像からの画像順序カウント(POC)距離が小さい1つの参照画像に関連付けられた予測リストが選択される場合に、適用される。
図10(以下で説明)は、POC距離に基づいて予測リストを選択する、単一予測ベースのCIIPのワークフローを示す。
【0068】
最後に、最後の方法では、現在のCUが単一予測されている場合にのみCIIPモードを有効にすることが提案されている。さらに、オーバーヘッドを削減するために、CIIPの有効化/無効化フラグのシグナリングは、現在のCIIP CUの予測方向に依存する。現在のCUが単一予測される場合においては、CIIPフラグがビットストリームでシグナリングされ、CIIPが有効か無効かが示される。それ以外の場合(つまり、現在のCUが二重に予測される場合)は、CIIPフラグのシグナリングはスキップされ、常にfalseと推測され、つまり、CIIPは常に無効にされる。
【0069】
図10は、本開示の一例による、POC距離に基づいて予測リストを選択する、単一予測ベースのCIIPのワークフローを示す図を示す。
【0070】
MPM候補リスト構成のためのイントラCUとCIIPのイントラモードの調和
上記のように、現在のCIIPデザインは、イントラCUとCIIP CUのイントラモードを使用してそれらの隣接ブロックのMPM候補リストを形成する方法に関して、統一されていない。具体的には、イントラCUとCIIP CUのイントラモードの両方では、CIIPモードでコーディングされた隣接ブロックのイントラモードが予測できる。ただし、イントラCUのイントラモードのみでは、イントラCUのイントラモードが予測できる。もう1つの統一されたデザインを実現するために、2つの方法は、MPMリスト構成のためのイントラCUとCIIPのイントラモードの使用法を調和させて、このセクションで提案される。
【0071】
第1の方法では、CIIPモードをMPMリスト構成のためのインターモードとして扱うことが提案されている。具体的には、1つのCIIP CUまたは1つのイントラCUのいずれかのMPMリストを生成するときには、隣接ブロックがCIIPモードでコーディングされている場合、隣接ブロックのイントラモードは使用不可としてマークされる。このような方法では、CIIPブロックのイントラモードを使用してMPMリストを構成することができない。逆に、第2の方法では、CIIPモードをMPMリスト構成のためのイントラモードとして扱うことが提案されている。具体的には、この方法では、CIIP CUのイントラモードでは、隣接するCIIPブロックとイントラブロックの両方のイントラモードが予測できる。
図11Aと
図11B(以下に説明)は、上記の2つの方法が適用される場合のMPM候補リスト生成プロセスを示す。
【0072】
本開示の他の実施形態は、ここで開示される本開示の仕様および実施を考慮することから当業者には明らかである。本願は、その一般原則に従い、当技術分野で知られているまたは慣習的な慣行の範囲内にある本開示からの逸脱を含む、本開示の任意の変形、使用、または適合をカバーすることを意図している。本開示の真の範囲および精神は以下の特許請求の範囲によって示され、明細書および実施例は単なる例として見なされることが意図されている。
【0073】
本開示は、上記に記載され、添付の図面に示されている具体的な例に限定されず、その範囲から逸脱することなく、様々な修正および変更を行うことができることを理解されたい。本開示の範囲は、添付の特許請求の範囲によってのみ制限されることが意図されている。
【0074】
図11Aは、本開示の一例による、MPM候補リスト生成のためにCIIPブロックを有効にするときの方法のフローチャートを示す。
【0075】
図11Bは、本開示の一例による、MPM候補リスト生成のためにCIIPブロックを無効にするときの方法のフローチャートを示す。
【0076】
図12は、ユーザインターフェース1260と結合されたコンピューティング環境1210を示す。コンピューティング環境1210は、データ処理サーバーの一部であり得る。コンピューティング環境1210は、プロセッサ1220と、メモリ1240と、I/Oインターフェース1250とを含む。
【0077】
プロセッサ1220は、通常、表示、データ取得、データ通信、および画像処理に関連する操作など、コンピューティング環境1210の全体的な操作を制御する。プロセッサ1220は、上記の方法のすべてまたはいくつかのステップを行うための命令を実行する1つまたは複数のプロセッサを含み得る。さらに、プロセッサ1220は、プロセッサ1220と他の構成要素との間の相互作用を容易にする1つまたは複数の回路を含み得る。プロセッサは、中央処理ユニット(CPU)、マイクロプロセッサ、シングルチップマシン、GPUなどであり得る。
【0078】
メモリ1240は、コンピューティング環境1210の動作をサポートするための様々なタイプのデータを格納するように構成される。そのようなデータの例は、コンピューティング環境1210で動作する任意のアプリケーションまたは方法に用いる命令、ビデオデータ、画像データなどを含む。メモリ1240は、任意のタイプの揮発性または非揮発性メモリデバイス、または、それらの組み合わせ、例えば、静的ランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラマブル読み取り専用メモリ(EEPROM)、消去可能プログラマブル読み取り専用メモリ(EPROM)、プログラム可能な読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクを使用して実現できる。
【0079】
I/Oインターフェース1250は、プロセッサ1220と、キーボード、クリックホイール、ボタンなどの周辺インターフェースモジュールとの間のインターフェースを提供する。ボタンには、ホームボタン、スキャン開始ボタン、およびスキャン停止ボタンが含まれるが、これらに限定されていない。I/Oインターフェース1250は、エンコーダおよびデコーダと結合することができる。
【0080】
一実施形態では、上記した方法を実行するために、コンピューティング環境1210内のプロセッサ1220によって実行可能である、メモリ1240に含まれるような複数のプログラムを含む非一時的なコンピュータ可読記憶媒体も提供される。例えば、非一時的なコンピュータ可読記憶媒体は、ROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、光学データ記憶装置などであり得る。
【0081】
非一時的なコンピュータ可読記憶媒体は、1つまたは複数のプロセッサを有するコンピューティングデバイスによって実行するための複数のプログラムをその中に格納しており、複数のプログラムは、1つまたは複数のプロセッサによって実行されると、コンピューティングデバイスが上記した動作予測するための方法を実行するものである。
【0082】
一実施形態では、コンピューティング環境1210は、上述した方法を実行するために、1つまたは複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、グラフィカルプロセッシングユニット(GPU)、コントローラー、マイクロコントローラー、マイクロプロセッサー、またはその他の電子コンポーネントにより実現できる。
【手続補正書】
【提出日】2021-07-09
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
【請求項2】
前記BDOF動作が適用され
るかどうかを特定することは、前記現在の
コーディングブロックの最終予測を生成するために
複合インターとイントラ予測が適用されるという条件で前記BDOF動作が適用されないと特定すること
、をさらに含む、請求項1に記載の方法。
【請求項3】
前記BDOF動作が適用される
かどうかを特定することは、
前記BDOF動作が適用されると特定することが、前記現在の
コーディングブロックの最終予測を生成するために
複合インターとイントラ予測が適用されない
と特定することを
含むこと、をさらに含む、請求項1に記載の方法。
【請求項4】
前記第1の予
測と前記第2の予
測とを平均するこ
とに基づいて、前記現在のコーディングブロックの二重予測を計算すること、を更に含む、請求項2に記載の方法。
【請求項5】
前記現在の
コーディングブロックの前記二重予測を計算することは、
前記第1の水平勾配値と、前記第1の垂直勾配値と、前記第2の水平勾配値と、前記第2の垂直勾配値とに基づいて、BDOF値を計算することと、
前記第1の予測と、前記第2の予測と、前記BDOF値とを基づいて、前記現在のコーディングブロックの前記二重予測を計算することと、
をさらに含む、請求項
1に記載の方法。
【請求項6】
【請求項7】
前記BDOF動作が適用され
るかどうかを特定することは、前記現在の
コーディングブロックの最終予測を生成するために複合インターとイントラ予測(CIIP)が適用されるという条件で前記BDOF動作が適用されないと特定すること、をさらに含む、請求項
6に記載の
ビデオコーディングデバイス。
【請求項8】
前記BDOF動作が適用される
かどうかを特定することは、
前記BDOF動作が適用されると特定することが、前記現在の
コーディングブロックの最終予測を生成するために
複合インターとイントラ予測が適用されな
いと特定することを
含むこと、をさらに含む、請求項
6に記載の
ビデオコーディングデバイス。
【請求項9】
前記動作は、前記第1の予
測と前記第2の予
測とを平均することに基づいて
、前記現在のコーディングブロックの二重予測を計算すること、を更に含む、請求項
7に記載の
ビデオコーディングデバイス。
【請求項10】
前記現在の
コーディングブロックの前記二重予測を計算することは、
前記第1の水平勾配値と、前記第1の垂直勾配値と、前記第2の水平勾配値と、前記第2の垂直勾配値とに基づいて、BDOF値を計算することと、
前記第1の予測と、前記第2の予測と、前記BDOF値とを基づいて、前記現在のコーディングブロックの前記二重予測を計算することと、
をさらに含む、請求項
6に記載の
ビデオコーディングデバイス。
【請求項11】
1つまたは複数のプロセッサを有するコンピューティングデバイスによって実行される複数のプログラムを格納する非一時的なコンピュータ可読記憶媒体であって、
前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、
請求項1~5のいずれかに記載の方法を、前記コンピューティングデバイスに実行させる、非一時的なコンピュータ可読記憶媒体。
【請求項12】
プロセッサによって実行されるときに、請求項1~5のいずれかに記載の方法のステップを実施するインストラクションを含むコンピュータプログラム製品。
【手続補正書】
【提出日】2022-01-17
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
【請求項2】
前記BDOF動作が適用されるかどうかを特定することは、前記現在のコーディングブロックの最終予測を生成するために複合インターとイントラ予測が適用されるという条件で前記BDOF動作が適用されないと特定すること、をさらに含む、請求項1に記載の方法。
【請求項3】
前記BDOF動作が適用されるかどうかを特定することは、前記BDOF動作が適用されると特定することが、前記現在のコーディングブロックの最終予測を生成するために複合インターとイントラ予測が適用されないと特定することを含むこと、をさらに含む、請求項1に記載の方法。
【請求項4】
前記第1の予測と前記第2の予測とを平均することに基づいて、前記現在のコーディングブロックの二重予測を計算すること、を更に含む、請求項2に記載の方法。
【請求項5】
前記現在のコーディングブロックの前記二重予測を計算することは、
前記第1の水平勾配値と、前記第1の垂直勾配値と、前記第2の水平勾配値と、前記第2の垂直勾配値とに基づいて、BDOF値を計算することと、
前記第1の予測と、前記第2の予測と、前記BDOF値
とに基づいて、前記現在のコーディングブロックの前記二重予測を計算することと、
をさらに含む、請求項1に記載の方法。
【請求項6】
【請求項7】
前記BDOF動作が適用されるかどうかを特定することは、前記現在のコーディングブロックの最終予測を生成するために複合インターとイントラ予測(CIIP)が適用されるという条件で前記BDOF動作が適用されないと特定すること、をさらに含む、請求項6に記載のビデオコーディングデバイス。
【請求項8】
前記BDOF動作が適用されるかどうかを特定することは、前記BDOF動作が適用されると特定することが、前記現在のコーディングブロックの最終予測を生成するために複合インターとイントラ予測が適用されないと特定することを含むこと、をさらに含む、請求項6に記載のビデオコーディングデバイス。
【請求項9】
前記動作は、前記第1の予測と前記第2の予測とを平均することに基づいて、前記現在のコーディングブロックの二重予測を計算すること、を更に含む、請求項7に記載のビデオコーディングデバイス。
【請求項10】
前記現在のコーディングブロックの前記二重予測を計算することは、
前記第1の水平勾配値と、前記第1の垂直勾配値と、前記第2の水平勾配値と、前記第2の垂直勾配値とに基づいて、BDOF値を計算することと、
前記第1の予測と、前記第2の予測と、前記BDOF値
とに基づいて、前記現在のコーディングブロックの前記二重予測を計算することと、
をさらに含む、請求項6に記載のビデオコーディングデバイス。
【請求項11】
1つまたは複数のプロセッサを有するコンピューティングデバイスによって実行される複数のプログラムを格納する非一時的なコンピュータ可読記憶媒体であって、
前記複数のプログラムは、前記1つまたは複数のプロセッサによって実行されると、請求項1~5のいずれかに記載の方法を、前記コンピューティングデバイスに実行させる、非一時的なコンピュータ可読記憶媒体。
【請求項12】
プロセッサによって実行されるときに、請求項1~5のいずれかに記載の方法のステップを実施するインストラクションを含むコンピュータプログラ
ム。
【国際調査報告】