(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-16
(45)【発行日】2024-07-24
(54)【発明の名称】複数のイントラ符号化方法の相互作用
(51)【国際特許分類】
H04N 19/70 20140101AFI20240717BHJP
H04N 19/11 20140101ALI20240717BHJP
H04N 19/132 20140101ALI20240717BHJP
H04N 19/12 20140101ALI20240717BHJP
H04N 19/176 20140101ALI20240717BHJP
H04N 19/136 20140101ALI20240717BHJP
H04N 19/593 20140101ALI20240717BHJP
【FI】
H04N19/70
H04N19/11
H04N19/132
H04N19/12
H04N19/176
H04N19/136
H04N19/593
(21)【出願番号】P 2021565705
(86)(22)【出願日】2020-05-11
(86)【国際出願番号】 CN2020089559
(87)【国際公開番号】W WO2020228663
(87)【国際公開日】2020-11-19
【審査請求日】2021-11-02
(31)【優先権主張番号】PCT/CN2019/086489
(32)【優先日】2019-05-11
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】520476341
【氏名又は名称】北京字節跳動網絡技術有限公司
【氏名又は名称原語表記】Beijing Bytedance Network Technology Co., Ltd.
【住所又は居所原語表記】Room B-0035, 2/F, No.3 Building, No.30, Shixing Road, Shijingshan District Beijing 100041 China
(73)【特許権者】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】ジャン リー
(72)【発明者】
【氏名】ジャン カイ
(72)【発明者】
【氏名】リウ ホンビン
(72)【発明者】
【氏名】ワン ユエ
【審査官】間宮 嘉誉
(56)【参考文献】
【文献】KARCZEWICZ, Marta et al.,CE8-related: Quantized Residual BDPCM,JVET-N0413 (version 5),ITU,2019年03月26日,pp.43-46, 87-92, 223-224,[online],[retrieved on 2023-08-04],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/14_Geneva/wg11/JVET-N0413-v5.zip>,JVET-N0413_drafttext_v4.docx
【文献】KARCZEWICZ, Marta et al.,CE8-related: Quantized Residual BDPCM,JVET-N0413 (version 5),ITU,2019年03月26日,pp.1-5,[online],[retrieved on 2023-08-04],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/14_Geneva/wg11/JVET-N0413-v5.zip>,JVET-N0413_r3.docx
【文献】PFAFF, Jonathan et al.,CE3: Affine Linear Weighted Intra Prediction (CE3-4.1, CE3-4.2),JVET-N0217 (version 3),ITU,2019年03月25日,pp.43-46,[online],[retrieved on 2023-08-04],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/14_Geneva/wg11/JVET-N0217-v3.zip>,JVET-M1001-v5_proposal_text_CE3-4.1_v2.docx
【文献】PFAFF, Jonathan et al.,CE3: Affine Linear Weighted Intra Prediction (CE3-4.1, CE3-4.2),JVET-N0217 (version 3),ITU,2019年03月25日,pp.1-17,[online],[retrieved on 2023-08-04],Retrieved from the Internet: <URL: https://jvet-experts.org/doc_end_user/documents/14_Geneva/wg11/JVET-N0217-v3.zip>,JVET-N0217_v1.docx
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00-19/98
(57)【特許請求の範囲】
【請求項1】
映像データ処理方法であって、
映像のブロックと前記映像のビットストリームとの間の変換のために、前記ビットストリームに含まれる第1のコーディングモードに関連する第1の情報及び第2のコーディングモードに関連する第2の情報のうちの1つのみを判定することであって、前記第1のコーディングモード又は前記第2のコーディングモードのうちの1つのみが前記ブロックに適用可能であり、かつ、前記第2の情報が前記ビットストリームに含まれる場合に前記第1の情報が前記ビットストリームから除外され、
前記判定することに基づいて前記変換を実行することと、
を含み、
前記第1のコーディングモードでは、予測サンプルは、行列ベクトル乗算演算の実行に基づいて導出され、
前記第1のコーディングモードにおいて、境界ダウンサンプリング演算は、前記行列ベクトル乗算演算の前のブロックのサイズに基づいて、前記ブロックの近傍のサンプルに適用されるように決定され、アップサンプリング演算は、前記行列ベクトル乗算演算の後に選択的に実行され、
前記第2のコーディングモードでは、前記ブロックのイントラ予測で導出された量子化残差と前記量子化残差の予測子との間の差が、前記ビットストリームに提示される、
方法。
【請求項2】
前記第2のコーディングモードにおいて、変換演算がスキップされる、
請求項1に記載の方法。
【請求項3】
前記第2のコーディングモードにおいて、前記予測サンプルは、水平イントラコーディングモード又は垂直イントラコーディングモードに基づいて導出される、
請求項2に記載の方法。
【請求項4】
前記第2のコーディングモードにおいて、量子化残差と前記量子化残差の予測子との間の差が、パルスコーディング変調表現を使用して前記ビットストリームで表現される、
請求項3に記載の方法。
【請求項5】
前記第1のコーディングモードは、前記第2の情報が前記ビットストリームに含まれる場合には前記ブロックに適用されない、
請求項1に記載の方法。
【請求項6】
前記第1のコーディングモードは、複数のモードを含み、どのモードが前記第1のコーディングモードに使用されるかは、候補リストを構築することなく判定される、
請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記第1の情報をどのようにコーディングするかは、abs(Log2(cbWidth)-Log2(cbHeight))に基づいており、
cbWidthは、前記ブロックの幅を示し、
cbHeightは、前記ブロックの高さを示し、
absは、絶対値のアルゴリズム記号である、
請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記第1の情報をどのようにコーディングするかは、abs(Log2(cbWidth)-Log2(cbHeight))が固定値より大きいかどうかに基づく、
請求項7に記載の方法。
【請求項9】
前記変換は、前記ブロックを前記ビットストリームに符号化することを含む、
請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記変換は、前記ビットストリームから前記ブロックを復号化することを含む、
請求項1~8のいずれか1項に記載の方法。
【請求項11】
処理装置と、命令を有する非一時的メモリと、を含む映像データ処理装置であって、
前記命令は、前記処理装置による実行時に、前記処理装置に、
映像のブロックと前記映像のビットストリームとの間の変換のために、前記ビットストリームに含まれる第1のコーディングモードに関連する第1の情報及び第2のコーディングモードに関連する第2の情報のうちの1つのみを判定することであって、前記第1のコーディングモード又は前記第2のコーディングモードのうちの1つのみが前記ブロックに適用可能であり、かつ、前記第2の情報が前記ビットストリームに含まれる場合に前記第1の情報が前記ビットストリームから除外され、
前記判定することに基づいて前記変換を実行することと、
を実行させ、
前記第1のコーディングモードでは、予測サンプルは、行列ベクトル乗算演算の実行に基づいて導出され、
前記第1のコーディングモードにおいて、境界ダウンサンプリング演算は、前記行列ベクトル乗算演算の前のブロックのサイズに基づいて、前記ブロックの近傍のサンプルに適用されるように決定され、アップサンプリング演算は、前記行列ベクトル乗算演算の後に選択的に実行され、
前記第2のコーディングモードでは、前記ブロックのイントラ予測で導出された量子化残差と前記量子化残差の予測子との間の差が、前記ビットストリームに提示される、
装置。
【請求項12】
命令を格納する非一時的なコンピュータ可読記憶媒体であって、
前記命令は、処理装置に、
映像のブロックと前記映像のビットストリームとの間の変換のために、前記ビットストリームに含まれる第1のコーディングモードに関連する第1の情報及び第2のコーディングモードに関連する第2の情報のうちの1つのみを判定することであって、前記第1のコーディングモード又は前記第2のコーディングモードのうちの1つのみが前記ブロックに適用可能であり、かつ、前記第2の情報が前記ビットストリームに含まれる場合に前記第1の情報が前記ビットストリームから除外され、
前記判定することに基づいて前記変換を実行することと、
を実行させ、
前記第1のコーディングモードでは、予測サンプルは、行列ベクトル乗算演算の実行に基づいて導出され、
前記第1のコーディングモードにおいて、境界ダウンサンプリング演算は、前記行列ベクトル乗算演算の前のブロックのサイズに基づいて、前記ブロックの近傍のサンプルに適用されるように決定され、アップサンプリング演算は、前記行列ベクトル乗算演算の後に選択的に実行され、
前記第2のコーディングモードでは、前記ブロックのイントラ予測で導出された量子化残差と前記量子化残差の予測子との間の差が、前記ビットストリームに提示される、
記憶媒体。
【請求項13】
映像のビットストリームを格納する方法であって、
前記ビットストリームに含まれる第1のコーディングモードに関連する第1の情報及び第2のコーディングモードに関連する第2の情報のうちの1つのみを判定することであって、前記第1のコーディングモード又は前記第2のコーディングモードのうちの1つのみ
がブロックに適用可能であり、かつ、前記第2の情報が前記ビットストリームに含まれる場合に前記第1の情報が前記ビットストリームから除外され、
前記判定することに基づいて前記ビットストリームを生成することと、
前記ビットストリームを非一時的なコンピュータ可読記録媒体に格納することと、
を含み、
前記第1のコーディングモードでは、予測サンプルは、行列ベクトル乗算演算の実行に基づいて導出され、
前記第1のコーディングモードにおいて、境界ダウンサンプリング演算は、前記行列ベクトル乗算演算の前のブロックのサイズに基づいて、前記ブロックの近傍のサンプルに適用されるように決定され、アップサンプリング演算は、前記行列ベクトル乗算演算の後に選択的に実行され、
前記第2のコーディングモードでは、前記ブロックのイントラ予測で導出された量子化残差と前記量子化残差の予測子との間の差が、前記ビットストリームに提示される、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
【0002】
本願は、2020年5月11日出願の国際特許出願PCT/US2020/089559号に基づいており、2019年5月11日出願の国際特許出願PCT/CN2019/086489号の優先権および利益を主張する。上記特許出願の全ては、その全体が参照により取り込まれる。
【0003】
この特許文献は、映像符号化技術、デバイスおよびシステムに関する。
【背景技術】
【0004】
映像圧縮の進歩にもかかわらず、デジタル映像は、依然として、インターネット及び他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像を受信及び表示することが可能である接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けることが予測される。
【発明の概要】
【0005】
本明細書は、映像または画像の復号化または符号化中に二次変換を使用する様々な実施形態および技術を説明する。
【0006】
1つの例示的な態様において、映像処理の方法が開示される。この方法は、映像のブロックと映像のビットストリーム表現との変換のために、ビットストリーム表現において行列ベースイントラ予測(MIP)符号化技術のための情報を符号化する態様を判定することを含む。MIP符号化技術を用いて、映像の予め符号化されたサンプルに対して行列ベクトル乗算演算を行うことに基づいたMIP符号化技術を用いて、ブロックの予測ブロックを判定する。前記方法は、判定に基づいて変換を行うことをも含む。
【0007】
別の例示的な態様において、映像処理の方法が開示される。この方法は、映像のブロックと映像のビットストリーム表現との変換のために、ブロックが特定の符号化技術を用いて符号化されている場合、正確に2つのイントラ予測モードが許容されることを判定することを含む。前記方法は、判定に基づいて変換を行うことをも含む。
【0008】
別の例示的な態様において、映像処理の方法が開示される。この方法は、映像のブロックと映像のビットストリーム表現との変換のために、ブロックのサンプル又はそのブロックの1つ以上の予め符号化されたサブパーティションのサンプルを用いてブロックのサブパーティションの予測を行うために判定することを含む。ブロックは、ブロックを複数のサブパーティションに分割し、予め再構成されたサブパーティションに基づいて、各サブパーティションの予測を判定するイントラサブブロック分割(ISP)符号化技術を用いて符号化される。複数のサブパーティションは、第1のサブパーティションと、1つ以上の内部サブパーティションと、を含む。前記方法は、判定に基づいて変換を行うことをも含む。
【0009】
別の例示的な態様において、映像処理の方法が開示される。この方法は、映像の現在のブロックと映像のビットストリーム表現とを変換するために、最確モード(MPM)候補のリストの構築プロセスにおいて、現在のブロックの第1の近傍のブロックのセットが、予め符号化されたブロックの第2の近傍のブロックのセットと異なることを判定することを含む。現在のブロックは、複数の子ブロックに分割された親ブロックの子ブロックである。前記方法は、判定に基づいて変換を行うことをも含む。
【0010】
別の例示的な態様において、映像処理の方法が開示される。この方法は、映像スライスの映像ブロックと映像のビットストリーム表現との変換のために、この映像ブロックに対して許可されるタイプの分割を、スライスに対してイントラサブブロックパーティションツールが有効化されているかどうかに基づいて判定することを含む。前記方法は、判定に基づいて変換を行うことをも含む。
【0011】
1つの例示的な態様において、映像処理の方法が開示される。この方法は、映像データのブロックを表すビットストリームを生成すること、又は受信することを含む。この映像データのブロックは、アフィン線形重み付きイントラ予測(ALWIP)に基づいて符号化される。ALWIPのサイド情報及び量子化残差ブロック差動パルスコード変調(QR-BDPCM)のサイド情報は、ビットストリームにおいて第1の順序で順次、符号化される。
【0012】
別の例示的な態様において、映像処理の方法が開示される。この方法は、映像データブロックを表すビットストリームを生成すること、又は受信することを含み、映像データのブロックは、2つのイントラ予測モードのみを有するイントラ予測方法を用いて符号化される。
【0013】
別の例示的な態様において、映像処理の方法が開示される。この方法は、現在のブロックの近傍のブロックのセットを確認することで、映像データの複数のブロックにおける現在のブロックのために最確モード(MPM)リストを構築することを含む。映像ユニットを分割パターンを用いて分割することにより複数のブロックを生成し、分割パターンに基づいて近傍のブロックのセットを判定する。この方法は、また、MPMリストからの候補を用いて映像データの現在のブロックを符号化し、映像データの現在のブロックを表すビットストリームを生成することを含む。
【0014】
別の例示的な態様において、映像処理の方法が開示される。この方法は、映像データの複数のブロックを表すビットストリームを受信することを含む。最確モード(MPM)リストの候補を用いて、映像データの現在のブロックをビットストリームに符号化し、現在のブロックの近傍のブロックのセットを確認することで、MPMリストを構築する。複数のブロックは、分割パターンを用いて映像ユニットを分割して生成される。分割パターンに基づいて、近傍のブロックのセットが判定される。この方法は、ビットストリームを用いて映像データの現在のブロックを再構成することも含む。
【0015】
さらに別の例示的な態様において、映像エンコーダが開示される。この映像エンコーダは、上述した方法の1つ以上を実装するように構成された処理装置を備える。
【0016】
さらに別の例示的な態様において、映像デコーダが開示される。この映像デコーダは、上述した方法の1つ以上を実装するように構成された処理装置を備える。
【0017】
さらに別の例示的な態様において、コンピュータ可読媒体が開示される。媒体は、媒体に記憶された上述した方法の1つ以上を実装するためのコードを含む。
【0018】
これらの、および他の態様は、本明細書で説明される。
【図面の簡単な説明】
【0019】
【
図4】4×8および8×4ブロックの分割の例を示す。
【
図5】4×8、8×4、4×4を除くすべてのブロックの分割の例を示す。
【
図6】4×4ブロックのためのアフィン線形重み付きイントラ予測(ALWIP)の例を示す。
【
図7】8×8ブロックのためのALWIPの例を示す。
【
図8】8×4ブロックのためのALWIPの例を示す。
【
図9】16×16ブロックのためのALWIPの例を示す。
【
図11】提案された縮小二次変換(RST)の例を示す。
【
図12】サブブロック変換モードSBT-VおよびSBT-Hを示す。
【
図13】67個のイントラ予測モードの別の例を示す。
【
図15】マルチタイプのツリー分割モードを例示する。
【
図16】ネストされたマルチタイプのツリー符号化ツリー構造を有する4分木における例示的な分割フラグの信号通知を示す。
【
図17】ネストされたマルチタイプのツリー符号化ブロック構造を有する4分木の例を示す。
【
図18】128×128の符号化ブロックのための例示的な分割を示す。
【
図19】本特許明細書に記載される技術を実現するためのハードウェアプラットフォームの一例を示すブロック図
【
図20】本技術の1つ以上の実施例に従った映像処理方法を示すフローチャートである。
【
図21】本技術の1つ以上の実施例に従った映像処理方法を示す別のフローチャートである。
【
図22】1つのブロックの参照サンプルを内部サブパーティションの参照サンプルにコピーすることの例を示す。
【
図23】ブロックの参照サンプルを用いて内部サブパーティションの参照サンプルを予測する例を示す。
【
図24】本技術の1つ以上の実施例に従った映像処理方法を示す別のフローチャートである。
【
図25】本技術の1つ以上の実施例に従った映像処理方法を示す別のフローチャートである。
【
図26】開示された技術を実装することができる例示的な映像処理システムを示すブロック図である。
【
図27】本技術にしたがった映像処理方法を示すフローチャートである。
【
図28】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図29】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図30】本技術にしたがった別の映像処理方法を示すフローチャートである。
【
図31】本技術にしたがったさらに別の映像処理方法を示すフローチャートである。
【発明を実施するための形態】
【0020】
本明細書では、理解を容易にするために章の見出しを使用しており、1つの章に開示された実施形態をその章にのみ限定するものではない。さらに、特定の実施形態は、VVC(Versatile Video Coding)または他の特定の映像コーデックを参照して説明されたが、開示された技術は、他の映像符号化技術にも適用可能である。さらに、いくつかの実施形態は映像符号化ステップを詳細に説明しているが、符号化を復号化する、対応するステップはデコーダによって実行されることが理解されよう。さらに、映像処理という用語は、映像符号化または圧縮、映像の復号化または展開、および映像の画素が表現される映像のコード変換であって、ある圧縮形式から別の圧縮形式へまたは別の圧縮ビットレートへのコード変換、を含む。
【0021】
1.概要
【0022】
本明細書は、映像符号化技術に関する。具体的には、画像/映像符号化におけるイントラ符号化及び変換符号化に関する。本明細書で開示される技術は、HEVC又は規格(汎用映像符号化)のような既存の映像符号化規格に適用され得る。本技術は、将来の映像符号化規格または映像コーデックにも適用可能である。
【0023】
2.初期の協議
【0024】
映像符号化規格は、主に周知のITU-TおよびISO/IEC規格の開発によって発展してきた。ITU-TはH.261とH.263を作り、ISO/IECはMPEG-1とMPEG-4 Visualを作り、両団体はH.262/MPEG-2 VideoとH.264/MPEG-4 AVC(Advanced Video Coding)とH.265/HEVC[1]規格を共同で作った。H.262以来、映像符号化規格は、時間予測と変換符号化が利用されるハイブリッド映像符号化構造に基づく。HEVCを超えた将来の映像符号化技術を探索するため、2015年には、VCEGとMPEGが共同でJVET(Joint Video Exploration Team)を設立した。それ以来、多くの新しい方法がJVETによって採用され、JEM(Joint Exploration Mode)[2]と呼ばれる参照ソフトウェアに組み込まれてきた。2018年4月には、VCEG(Q6/16)とISO/IEC JTC1 SC29/WG11(MPEG)の間にJoint Video Expert Team(JVET)が発足し、HEVCと比較して50%のビットレート削減を目標にVVC規格の策定に取り組んでいる。
【0025】
2.1 典型的な映像コーデックの符号化フロー
【0026】
図1は、3つのインループフィルタリングブロック、すなわち非ブロック化フィルタ(DF)、サンプル適応オフセット(SAO)およびALFを含むVVCのエンコーダブロック図の例を示す。DF(予め定義されたフィルタを使用する)とは異なり、SAOおよびALFは、現在のピクチャのオリジナルサンプルを利用し、それぞれ、オフセットを追加することにより、および、有限インパルス応答(FIR)フィルタを適用することにより、オフセットおよびフィルタ係数を信号通知する符号化側情報を用いて、元のサンプルと再構成サンプルとの間の平均二乗誤差を低減する。ALFは、各ピクチャの最後の処理ステージに位置し、前のステージで生成されたアーチファクトを捕捉し、修正しようとするツールと見なすことができる。
【0027】
2.2 67個のイントラ予測モードを有するイントラモード符号化
【0028】
自然映像に表される任意のエッジ方向をキャプチャするために、指向性イントラモードの数は、HEVCで使用されるように、33から65に拡張される。追加の指向性モードは、
図2において赤い点線の矢印で示され、平面モードとDCモードは同じままである。これらのより密度の高い指向性イントラ予測モードは、すべてのブロックサイズ、および輝度および彩度イントラ予測の両方に適用される。
【0029】
従来の角度のイントラ予測方向は、
図2に示すように、時計回り方向に45度から-135度まで規定される。VTM2において、いくつかの従来の角度のイントラ予測モードは、非正方形のブロックのために、広角イントラ予測モードに適応的に置き換えられる。置換されたモードは、元の方法を使用して信号通知され、構文解析後、広角モードのインデックスに再マッピングされる。イントラ予測モードの総数は変化せず、例えば、67であり、イントラモードの符号化は変化しない。
【0030】
前記HEVCにおいて、すべてのイントラ符号化されたブロックは正方形の形状を有し、その辺の各々の長さは2の累乗である。このように、DCモードを使用してイントラ予測子を生成するのに、除算演算を必要としない。VVV2において、ブロックは長方形であってもよく、一般的な場合、ブロックごとに除算演算を使用することが必要である。DC予測のための除算演算を回避するために、長辺のみを使用して非正方形のブロックの平均を計算する。
【0031】
2.3 多重基準ライン
【0032】
多重基準ライン(MRL)イントラ予測は、より多くの基準ラインをイントラ予測に使用する。
図3に、4つの基準ラインの例が示され、ここで、セグメントA及びFのサンプルは、再構成された近傍のサンプルからフェッチされず、セグメントB及びEからの最も近いサンプルでそれぞれパディングされる。HEVCイントラピクチャ予測は、最も近い基準ライン(例えば、基準ライン0)を使用する。MRLにおいて、2つの追加のライン(基準ライン1及び基準ライン3)が使用される。
【0033】
選択された基準ラインのインデックス(mrl_idx)を信号通知し、これを用いてイントラ予測モジュールを生成する。基準ラインインデックスが、0よりも大きい場合、MPMリストに追加の基準ラインモードのみを含み、残りのモードなしにMPMインデックスのみを信号通知する。イントラ予測モードの前に基準ラインインデックスを信号通知し、非ゼロ基準ラインインデックスを信号通知する場合、平面モード及びDCモードをイントラ予測モードから排除する。
【0034】
MRLは、現在のCTUラインの外側の拡大された参照サンプルの使用を回避するために、CTUの内側の最初のブロックラインに対しては無効化されている。また、追加のラインを使用する場合、PDPCは無効化されている。
【0035】
2.4 イントラサブブロック分割(ISP)
【0036】
いくつかの実施形態において、ISPは、表1に示すように、輝度イントラ予測ブロックを垂直または水平にブロックサイズの寸法により2個または4個のサブパーティションに分割することに使用される。
図4および
図5は二つの可能性の例を示す。
図4は、4×8および8×4のブロックの分割例を示す。
図5は、4×8、8×4、および4×4を除くすべてのブロックの分割例を示す。すべてのサブパーティションは、少なくとも16個のサンプルを有するという条件を満たす。ブロックサイズが4×N又はN×4(N>8)である場合、許容されるなら、1×N又はN×1個のサブパーティションが存在してもよい。
【0037】
【0038】
これらのサブパーティションの各々について、エンコーダが送信した係数をエントロピー復号化し、その後、量子化および反転変換した後、残差信号を生成する。そして、サブパーティションをイントラ予測し、最後に、予測信号に残差信号を加えることで、対応する再構成サンプルを得る。従って、各サブパーティションの再構成値は、次のサブパーティションの予測を生成するために利用可能となり、この処理等を繰り返す。すべてのサブパーティションは、同じイントラモードを共有する。
【0039】
表2は、イントラ予測モードに基づく例示的な変換タイプを示す。
【0040】
【0041】
2.4.1 構文および意味論の例
【0042】
下記の太下線部分が、規格に対する修正案を示す。
【0043】
【0044】
【0045】
intra_subpartitions_mode_flag[x0][y0]=1は、現イントラ符号化ユニットをNumIntraSubPartitions[x0][y0]長方形変換ブロックサブパーティションに分割することを指定するintra_subpartitions_mode_flag[x0][y0]=0は、現在のイントラ符号化ユニットが矩形変換ブロックサブパーティションに分割されていないことを指定する。
intra_subpartitions_mode_flag[x0][y0]が存在しない場合、0に等しいと推測される。
intra_subpartitions_split_flag[x0][y0]サブパーティション内のスプリットタイプが水平面であるか垂直面であるかを指定します。intra_subpartitions_split_flag[x0][y0]が存在しない場合、次のように推測される。
- cbHeightがMaxTbSizeYより大きい場合、intra_subpartitions_split_flag[x0][y0]は0に等しいと推測される。
- そうでない場合(cbWidthがMaxTbSizeYより大きい場合、intra_subpartitions_split_flag[x0][y0]は1に等しいと推測される。
変数IntraSubPartitionsSplitTypeは、現在の輝度符号化ブロックに使用される分割のタイプを指定する。IntraSubPartitionsSplitTypeは、以下のように導出される。
- intra_subpartitions_mode_flag[x0][y0]が0に等しい場合、IntraSubPartitionsSplitTypeは0に等しく設定される。
- そうでない場合、IntraSubPartitionsSplitTypeは、1+intra_subpartitions_split_flag[x0][y0]に等しく設定される。
【0046】
【0047】
変数NumIntraSubPartitionsは、イントラ輝度符号化ブロックが分割される変換ブロックのサブパーティションの数を指定する。NumIntraSubPartitionsは、以下のように導出される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しい場合、NumIntraSubPartitionsは1に設定される。
- あるいは、以下の条件の1つがTRUEである場合、NumIntraSubPartitionsを2に等しく設定する。
- cbWidthは4に等しく、cbHeightは8に等しい。
- cbWidthは8に等しく、cbHeightは4に等しい。
- あるいは、NumIntraSubPartitionsを4に等しく設定する。
【0048】
2.5 アフィン線形重み付きイントラ予測(ALWIP、別名、行列ベースイントラ予測)
【0049】
2.5.1 行列ベクトル乗算による縮小予測信号の生成
【0050】
まず、平均化によって近傍の基準サンプルをダウンサンプリングし、縮小された基準シグナルbdryredを生成する。そして、縮小された予測信号predredは、行列ベクトルの積を計算し、次のようにオフセットを加えることによって計算される。
【0051】
【0052】
ここで、Aは、Wred・Hred行を有し、W=H=4の場合には4列を有し、他のすべての場合には8列を有する行列である。bは、大きさWred・Hredのベクトルである。
【0053】
2.5.2 ALWIP処理全体の説明
【0054】
図6から
図9の異なる形状に対して、平均化、行列ベクトル乗算、線形補間の全体的な処理を示す。なお、残りの形状は、いずれか1つの図示された場合と同様に扱われる。
【0055】
4×4ブロックを仮定すると、
図6に示すように、ALWIPは、境界の各軸に沿って2つの平均をとる。結果として得られる4つの入力サンプルは、行列ベクトル乗算に入る。行列はセットS_0から取り込まれる。オフセットを加算した後、16個の最終予測サンプルが得られる。予測信号を生成するために線形補間は必要でない。このようにして、1つのサンプル当たり、合計(4・16)/(4・4)=4回の乗算を行う。
【0056】
8×8ブロックを仮定すると、
図7に示すように、ALWIPは境界の各軸に沿って4つの平均をとる。結果として得られる8つの入力サンプルは、行列ベクトル乗算に入る。行列はセットS_1から取り込まれる。これにより、予測ブロックの奇数位置に16個のサンプルが得られる。このようにして、1つのサンプル当たり、合計(8・16)/(8・8)=2回の乗算を行う。オフセットを加えた後、これらのサンプルは、縮小された上側境界を使用することによって垂直方向に補間される。元の左側境界を使用して水平補間を行う。
【0057】
8×4ブロックを仮定すると、
図8に示すように、ALWIPは境界の水平軸に沿って4つの平均をとり、左側境界上の4つの元の境界値をとる。結果として得られる8つの入力サンプルは、行列ベクトル乗算に入る。行列はセットS_1から取り込まれる。これにより、予測ブロックの水平方向の奇数位置および垂直方向の各位置に16個のサンプルが得られる。このようにして、1つのサンプル当たり、合計(8・16)/(8・4)=4回の乗算を行う。オフセットを加算した後、元の左側境界を使用してこれらのサンプルを水平方向に補間する。転置された場合はそれに応じて処理される。
【0058】
16×16ブロックを仮定すると、
図9に示すように、ALWIPは境界の各軸に沿って4つの平均をとる。結果として得られる8つの入力サンプルは、行列ベクトル乗算に入る。行列はセットS_2から取り込まれる。これにより、予測ブロックの奇数位置に64個のサンプルが得られる。このようにして、1つのサンプル当たり、合計(8・64)/(16・16)=2回の乗算を行う。オフセットを加算した後、これらのサンプルを、上側境界の8つの平均を使用することによって垂直方向に補間する。元の左側境界を使用して水平補間を行う。この場合、補間プロセスは乗算をまったく加えない。従って、ALWIP予測を計算するためには、1つのサンプルにつき2回の乗算が必要である。
【0059】
より大きい形状の場合、この手順は本質的に同じであり、1つのサンプル当たりの乗算の数が4未満であることをチェックすることは容易である。
【0060】
W>8のW×8ブロックの場合、サンプルは奇数個の水平位置および各垂直位置で得られるので、水平補間のみが必要である。
【0061】
最後に、W>8であるW×4個のブロックに対して、A_kを、ダウンサンプリングされたブロックの横軸に沿った奇数個の入力に対応するすべての行を取り除くことによって生じる行列とする。このように、出力サイズは32であり、再び、水平補間のみを行うものとする。
【0062】
転置された場合はそれに応じて処理される。
【0063】
2.5.3. 従来の輝度および彩度イントラ予測モードのための適応型MPMリスト導出
【0064】
いくつかのALWIPモードは、従来のイントラ予測モードのMPMに基づく符号化と以下のように調和される。従来のイントラ予測モードのための輝度および彩度MPMリスト導出処理は、固定テーブルmap_alwip_to_angularidx、idx∈
{0,1,2}を使用し、所与のPUにおけるALWIPモードpredmodeALWIPを従来のイントラ予測モードpredmodeAngular=map_alwip_to_angularidx(PU)[predmodeALWIP]の1つにマッピングする。
【0065】
輝度MPMリストの導出のために、ALWIPモードpredmodeALWIPを使用する近傍の輝度ブロックに遭遇した場合、このブロックは、従来のイントラ予測モードpredmodeAngularを使用していたものとして扱われる。彩度MPMリスト導出の場合、現在の輝度ブロックがLWIPモードを使用する時はいつでも、同じマッピングを使用してALWIPモードを従来のイントラ予測モードに変換する。
【0066】
2.5.4 構文および意味論の例
【0067】
下記の太下線部分が、規格に対する修正案を示す。
【0068】
【0069】
2.6 量子化残差ブロック差動パルスコード変調(QR-BDPCM)
【0070】
いくつかの実施形態において、量子化された残差ブロック差動パルスコード変調(QR-BDPCM)が、スクリーンコンテンツを効率的に符号化するために用いることができる。
【0071】
QR-BDPCMで使用される予測方向は、垂直予測モードおよび水平予測モードであり得る。イントラ予測は、イントラ予測と同様に、予測方向(水平または垂直予測)にサンプルコピーすることで、ブロック全体で予測する。残差を量子化し、量子化された残差とその予測子(水平または垂直)量子化値との間のデルタを符号化する。これは、以下のように説明することができる。サイズM(行)×N(列)のブロックについて、ri,j,0≦i≦M-1、0≦j≦N-1を、上または左ブロックの境界サンプルからのフィルタリングされていないサンプルを使用して、水平方向(予測ブロックに対して左隣の画素値を1ラインずつコピーする)または垂直方向(予測ブロックにおける各ラインに上隣のラインをコピーする)にイントラ予測を行った後の予測残差とする。Q(ri,j)、0≦i≦M-1、0≦j≦N-1は、残差ri,jの量子化バージョンを表し、この場合、残差は、元のブロックと予測ブロック値との間の差である。次に、ブロックDPCMが量子化された残差サンプルに適用され、その結果、要素r~
i,jを有する修正されたM×N個の配列R~が得られる。垂直BDPCMが信号通知されると、以下のようになる。
【0072】
【0073】
水平予測の場合、類似した規則が適用され、残差量子化サンプルは、以下の式によって得られる。
【0074】
【0075】
残差量子化サンプルr~
i,jはデコーダに送られる。
【0076】
デコーダ側では、上記の計算を逆にして、Q(ri,j)、0≦i≦M-1、0≦j≦N-1を生成する。垂直予測の場合、以下である。
【0077】
【0078】
水平方向の場合、以下である。
【0079】
【0080】
逆量子化された残差Q-1(Q(ri,j))をイントラブロック予測値に加算し、再構成されたサンプル値を生成する。
【0081】
このスキームの主な利点は、逆方向のDPCMを、係数の構文解析中にオンザフライで行うことができ、係数の構文解析中に予測子を追加するだけで済むこと、または、構文解析後に行うことができることである。
【0082】
QR-BDPCMの本文案を以下に示す。
【0083】
【0084】
bdpcm_flag[x0][y0]が1の場合、位置(x0,y0)の輝度符号化ブロックを含む符号化ユニットにbdpcm_dir_flagが存在することを指定する
bdpcm_dir_flag[x0][y0]=0は、bdpcmブロックで使用される予測方向が水平であることを指定し、そうでない場合、垂直である。
【0085】
2.7 複数変換セット(MTS)の例
【0086】
2.7.1 明示的な複数変換セット(MTS)
【0087】
いくつかの実施形態において、サイズが64×64までの大きなブロックサイズの変換が有効化され、これは、主に高解像度映像、例えば、1080pおよび4Kシーケンスに有用である。サイズ(幅または高さ、または幅と高さの両方)が64である変換ブロックに対して、高周波数変換係数をゼロにし、低周波数係数のみを保持する。例えば、M×N変換ブロックの場合、ブロック幅をM、ブロック高さをNとすると、Mが64である場合、左32列の変換係数のみが保持される。同様に、Nが64である場合、変換係数の上位32行のみが保持される。大きなブロックに対して変換スキップモードを使用する場合、値をゼロ化することなくブロック全体を使用する。
【0088】
HEVCで使用されてきたDCT-IIに加え、インター符号化ブロックおよびイントラ符号化ブロックの両方の残差符号化のために、複数の変換選択(MTS)スキームが使用される。これは、DCT8/DST7から選択された複数の変換を使用する。新しく導入された変換行列は、DST-VIIおよびDCT-VIIIである。選択されたDST/DCTの基本関数を以下の表に示す。
【0089】
【0090】
変換行列の直交性を維持するために、変換行列はHEVCにおける変換行列よりも正確に量子化される。変換係数の中間値を16ビットの範囲内に維持するために、水平変換後および垂直変換後、すべての係数は10ビットを有することになる。
【0091】
MTSスキームを制御するために、SPSレベルにおいて、イントラおよびインターに対してそれぞれ別個の有効化フラグを規定する。SPSにおいてMTSが有効化されると、MTSが適用されているかどうかを示すように、CUレベルフラグが信号通知される。ここで、MTSは輝度に対してのみ適用される。MTS CUレベルフラグは、以下の条件が満たされる場合に信号通知される。
【0092】
- 幅および高さが共に32以下、
- CBFフラグが1である。
【0093】
MTS CUフラグがゼロである場合、DCT2が両方向に適用される。しかしながら、MTS CUフラグが1である場合、2つの他のフラグが追加的に信号通知され、それぞれ水平方向および垂直方向の変換タイプを示す。表3に示すように、マッピングテーブルを変換し、信号通知する。行列精度を変換する場合、8ビットの一次変換コアを使用する。そのため、HEVCで使用されるすべての変換コアは、4ポイントDCT-2、DST-7、8ポイント、16ポイント、32ポイントDCT-2など、同じに保たれる。また、64ポイントDCT-2、4ポイントDCT-8、8ポイント、16ポイント、32ポイントDST-7、DCT-8などの他の変換コアは、8ビットの一次変換コアを使用する。
【0094】
【0095】
大きなサイズのDST-7およびDCT-8の複雑性を低減するために、サイズ(幅または高さ、または幅と高さの両方)が32であるDST-7およびDCT-8ブロックに対して、高周波数変換係数をゼロ化する。16×16個の低周波数領域内の係数のみが保持される。
【0096】
異なる変換を適用する場合に加え、VVCは、HEVCにおけるTSの概念に類似した、変換スキップ(TS)と呼ばれるモードもサポートする。TSは、MTSの特殊な場合として扱われる。
【0097】
2.7.1.1 構文および意味論の例
【0098】
MTSインデックスは、ビットストリームにおいて信号通知されてもよく、このような設計は、明示的MTSと呼ばれる。また、暗黙的MTSとして、変換ブロックのサイズに基づいて行列を直接導出する代替方法もサポートされる。
【0099】
明示的MTSの場合、それはすべての符号化モードをサポートする。一方、暗黙的MTSの場合、イントラモードのみがサポートされる。
【0100】
下記の太下線部分が、規格に対する修正案を示す。
【0101】
【0102】
【0103】
transform_skip_flag[x0][y0]は、輝度変換ブロックに対して変換を適用するかどうかを指定する。配列インデックスx0,y0は、ピクチャの左上輝度サンプルに対する、考慮される符号化ブロックの左上輝度サンプルの位置(x0,y0)を指定する。transform_skip_flag[x0][y0]=1は、輝度変換ブロックに変換を適用しないことを指定する。transform_skip_flag[x0][y0]=0は、輝度変換ブロックに変換を適用するかどうかの決定が他の構文要素に依存することを指定する。transform_skip_flag[x0][y0]が存在しない場合、0に等しいと推測される。
tu_mts_idx[x0][y0]は、関連する輝度変換ブロックの水平および垂直方向に沿ってどの変換カーネルを残差サンプルに適用するかを指定する。配列インデックスx0,y0は、ピクチャの左上輝度サンプルに対する、考慮される符号化ブロックの左上輝度サンプルの位置(x0,y0)を指定する。
tu_mts_idx[x0][y0]が存在しない場合、0に等しいと推測される。
CABAC復号化プロセスにおいて、1つのコンテキストはtransform_skip_flagを復号化するために使用され、tu_mts_idxを2値化するためにトランケートユナリーを使用する。tu_mts_idxの各ビンは、コンテキスト符号化され、第1のビンについて、4分木の深さ(例えば、cqtDepth)を用いて1つのコンテキストを選択し、残りのビンについて、1つのコンテキストが使用される。
【0104】
【0105】
2.7.2 暗示的な複数変換セット(MTS)
【0106】
なお、ISP、SBT、及びMTSを有効化するが、暗黙の信号通知においては、全て暗黙のMTSとして扱われる。implicitMtSEnabledは、implicit MTSが有効化されているどうかを定義するために使用される。
【0107】
8.7.4 スケーリングされた変換係数の変換処理
【0108】
8.7.4.1 一般
変数implicitMtSEnabledは、以下のように導出される。
- sps_mts_enabled_flagが1であり、以下の条件の1つが真である場合、implicitMtsEnabledは1に設定される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITではない。
- cu_sbt_flagが1であり、Max(nTbW,nTbH)=32以下である
- sps_explicit_mts_intra_enabled_flag、sps_explicit_mts_inter_enabled_flagは両方とも0であり、CuPredMode[xTbY][yTbY]は、MODE_INTRAである。
- そうでない場合、implicitMtSEnabledは0に設定される。
水平変換カーネルを指定する変数trTypeHorおよび垂直変換カーネルを規定する変数trTypeVerは、以下のように導出される。
- cIdxが0よりも大きい場合、trTypeHorおよびtrTypeVerは、0に設定される。
- そうでない場合、implicitMtSEnabledが1の場合、以下が適用される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITでない場合、trTypeHorおよびtrTypeVerは、intraPredModeに依存して、表8-15に規定される。
- そうでない場合、cu_sbt_flagが1である場合、trTypeHorおよびtrTypeVerは、表8-14において、cu_sbt_horizontal_flagおよびcu_sbt_pos_flagに基づいて指定される。
- そうでない場合、(sps_explicit_mts_intra_enabled_flagとsps_explicit_mts_inter_enabled_flagが0の場合)、trTypeHorとtrTypeVerは以下のように導出される。
trTypeHor=(nTbW>=4&&nTbW<=16&&nTbW<=nTbH)?1:0 (8-1030)
trTypeVer=(nTbH>=4&&nTbH<=16&&nTbH<=nTbW)?1:0 (8-1031)
- そうでない場合、trTypeHorおよびtrTypeVerはtu_mts_idx[xTbY][yTbY]に基づいて、表8-13に指定される。
【0109】
【0110】
【0111】
2.8 縮小二次変換(RST)
【0112】
2.8.1 非可分二次変換(NSST)
【0113】
いくつかの実施形態において、二次変換は、順方向一次変換と量子化(エンコーダにおいて)の間、及び逆量子化と逆方向一次変換(デコーダ側において)の間に適用される。
図10に示すように、ブロックサイズにより4×4(または8×8)個の二次変換を行う。例えば、4×4の二次変換は、小さなブロック(例えば、min(幅、高さ)<8)に適用され、8×8の二次変換は、8×8ブロック当たりより大きなブロック(例えば、min(幅、高さ)>4)に適用される。
【0114】
以下、入力を例として使用して、非可分変換の適用について説明する。非可分変換を適用するために、4×4インプットブロックXを用いる。
【0115】
【0116】
まず、ベクトルX→として表現される。
【0117】
【0118】
非可分変換は、F→=T・X→として計算され、ここで、F→は、変換係数ベクトルを示し、Tは、16×16の変換行列である。その後、そのブロック(水平、垂直、斜め)の走査順を使用して、16×1の係数ベクトルF→=T・X→を4×4のブロックに再編成する。インデックスが小さい係数は、4×4の係数ブロックにおいて、走査インデックスが小さくなるように配置される。全体で35個の変換セットがあり、1つの変換セット当たり3つの非可分変換行列(カーネル)が使用される。イントラ予測モードから変換セットへのマッピングは、予め規定される。各変換セットに対して、選択された非可分二次変換候補は、明示的に信号通知された二次変換インデックスによってさらに規定される。このインデックスは、変換係数の後、イントラCUごとに1回、ビットストリームで信号通知される。
【0119】
2.8.2 縮小二次変換(RST)の例
【0120】
いくつかの実施例において、RSTは、(35個の変換セットの代わりに)4つの変換セットのマッピングを用いる。いくつかの実施形態において、8×8個のブロックおよび4×4個のブロックに対して、それぞれ16×64個(16×48にさらに低減されてもよい)の行列および16×16個の行列が用いることができる。表記の便宜のために、16×64(さらに16×48に低減されてもよい)変換をRST8×8として、16×16変換をRST4×4として、表す。
図11は、提案された縮小二次変換(RST)の例を示す。
【0121】
2.9 サブブロック変換
【0122】
cu_cbfが1に等しいインター予測されたCUの場合、cu_sbt_flagは、残差ブロックの全体が復号化されるのか、残差ブロックのサブ部分が復号化されるのかを示すために信号通知されてもよい。前者の場合、インターMTS情報をさらに構文解析し、CUの変換タイプを判定する。後者の場合、残差ブロックの一部は推測適応変換で符号化され、残差ブロックの他の部分はゼロ化される。前記SBTは、複合インターイントラモードには適用されない。
【0123】
サブブロック変換において、SBT-VおよびSBT-H(常にDCT-2を使用する彩度TB)における輝度変換ブロックに対して位置依存変換が適用される。SBT-HとSBT-Vの2つの位置は、異なるコア変換に関連付けられる。具体的には、SBT位置ごとに横方向及び縦方向の変換は
図12に示される。例えば、SBT-V位置0の水平及び垂直変換は、それぞれDCT-8及びDST-7である。残差TUの片側が32よりも大きい場合、対応する変換をDCT-2と設定する。従って、サブブロック変換は、残差ブロックのTUタイリング、cbf、並びに水平及び垂直変換を一緒に指定し、これは、1つのブロックの主な残差がこのブロックの片側にある場合の構文ショートカットと見なすことができる。
【0124】
2.9.1 構文および意味論の例
【0125】
下記の太下線部分が、規格に対する修正案を示す。
【0126】
【0127】
【0128】
sps_sbt_max_size_64_flag=0は、サブブロック変換を可能にするための最高CU幅及び最高CU高さが32個の輝度サンプルであることを指定する。sps_sbt_max_size_64_flag=1は、サブブロック変換を許可するための最大のCUの幅及び高さが64個の輝度サンプルであることを指定する。
MaxSbtSize=sps_sbt_max_size_64_flag?64:32.
【0129】
2.10 イントラモード符号化のための最確モード(MPM)リスト
【0130】
自然映像に表される任意のエッジ方向をキャプチャするために、VTM4における指向性イントラモードの数は、HEVCで使用されるように、33から65に拡張される。
図13は、67個のイントラ予測モードの別の例を示すHEVCにない新しい指向性モードは、
図13に点線の矢印で示されており、平面モードとDCモードは同じままである。これらのより密度の高い指向性イントラ予測モードは、すべてのブロックサイズ、および輝度および彩度イントラ予測の両方に適用される。
【0131】
MRL符号化ツールおよびISP符号化ツールの適用の有無にかかわらず、イントラブロックに対して統一された6-MPMリストが提案される。
図14は、現在のブロックの左上の近傍の例を示す。MPMリストは、
図14に示すように、VTM4.0などの場合、左上の近傍のブロックのイントラモードに基づいて構成される。
【0132】
ここで、左側のモードをLeftとし、上側のブロックのモードをAboveとすると、統合MPMリストは、以下のステップで順に構成される。
【0133】
- 近傍のブロックのイントラ予測モードが無効である場合、そのイントラモードはデフォルトで平面に設定される。
【0134】
- LeftとAboveが同じかつ両方ともに角度がある場合、
*MPMリスト→{Planar,Left,Left-1,Left+1,DC,Left-2}
- LeftとAboveが異なりかつ両方ともに角度がある場合、
*MaxモードをLeftおよびAboveでより大きいモードに設定する。
*LeftモードとAboveモードとの差が2~62の範囲内にある場合、包括的に、MPMリスト→{Planar,Left,Above,DC,Max-1,Max+1}
そうでない場合、MPMリスト→{Planar,Left,Above,DC,Max-2,Max+2}
- LeftとAboveが異なり、LeftおよびAboveの一方が角度モードであり、他方が非角度モードである場合、
*MaxモードをLeftおよびAboveでより大きいモードに設定する。
*MPMリスト→{Planar,Max,DC,Max-1,Max+1,Max-2}
- モードLeftおよびAboveの両方が非角度モードである場合、
*MPMリスト→{Planar,DC,V,H,V-4,V+4}
【0135】
なお、モードインデックス(例えば、Max+2)が範囲[0,66]を超えた場合、他の有効なモードインデックスに置き換えられてもよい。
【0136】
第1のMPM候補、例えば、平面モードは、残りのMPM候補とは別個に信号通知される。
【0137】
より詳細な構文、意味論、及び復号化処理を以下に説明する。下記の太下線部分が、規格に対する修正案を示す。
【0138】
【0139】
構文要素intra_luma_mpm_flag[x0][y0]、intra_luma_not_planar_flag[x0][y0]、intra_luma_mpm_idx[x0][y0]およびintra_luma_mpm_remainder[x0][y0]は、輝度サンプルのイントラ予測モードを指定する。配列インデックスx0,y0は、ピクチャの左上輝度サンプルに対する、考慮される符号化ブロックの左上輝度サンプルの位置(x0,y0)を指定する。intra_luma_mpm_flag[x0][y0]が1に等しい場合、セクション4.1に記載の8.4.2項に従って、近傍のイントラ予測符号化ユニットからイントラ予測モードを推論する。
intra_luma_mpm_flag[x0][y0]が存在しない(例えば、ISPが有効化されている、又はMRLが有効化されている(参照インデックス>0を有する))場合、それは1に等しいと推論される。
intra_luma_not_planar_flag[x0][y0]が存在しない場合(例えば、MRLが使用可能)、1に等しいと推測される。
intra_luma_not_planar_flagはコンテキスト符号化され、コンテキスト選択は、現在のブロックがISPモードで符号化されているか否かに基づいて行われる(例えば、!intra_subpartitions_mode_flag)。
intra_luma_mpm_idxは、コンテキストなしでバイパス符号化されている。
【0140】
8.4.2 輝度イントラ予測モードのための導出処理
【0141】
この処理への入力は以下の通りである。
- 現在のピクチャの左上の輝度サンプルに対する現在の輝度符号化ブロックの左上のサンプルを規定する輝度位置(xCb,yCb)
-輝度サンプルにおける現在の符号化ブロックの幅を規定する変数cbWidth、
-輝度サンプルにおける現在の符号化ブロックの高さを規定する変数cbHeight。
この処理において、輝度イントラ予測モードIntraPredModeY[xCb][yCb]が導出される。
【0142】
【0143】
注意:イントラ予測モードINTRA_LT_CCLM、INTRA_L_CCLM、INTRA_T_CCLMは、彩度成分にのみ適用可能である。
IntraPredModeY[xCb][yCb]は、以下のように導出される。
【0144】
- intra_luma_not_planar_flag[xCb][yCb]が1に等しい場合、以下のように順序付けられる。
【0145】
1.近傍位置(xNbA、yNbA)および(xNbB、yNbB)は、それぞれ、(xCb-1,yCb+cbHeight-1)および(xCb+cbWidth-1,yCb-1)に等しく設定される。
2.XをAまたはBのいずれかに置き換える場合、変数candIntraPredModeXは、以下のように導出される。
- 6.4.X項[Ed.(BB):近傍ブロックの可用性導出処理tbd]で規定されるブロックの可用性導出処理は、入力として、(xCb,yCb)に等しく設定された位置(xCurr,yCurr)と、(xNbX,yNbX)に等しく設定した近傍位置(xNbY,yNbY)で呼び出され、出力をavailableXに割り当てる。
- 候補イントラ予測モードcandIntraPredModeXは、以下のように導出される。
- 以下の条件の1つ以上が真である場合、candIntraPredModeXをINTRA_PLANARに等しく設定する。
- 変数availableXはFALSEに等しい。
- CuPredMode[xNbX][yNbX]はMODE_INTRAに等しくなく、かつciip_flag[xNbX][yNbX]は1に等しくない。
- pcm_flag[xNbX][yNbX]は1に等しい。
- XがBに等しく、yCb_1が((yCb>>CtbLog2SizeY)<<CtbLog2SizeY)未満である。
- あるいは、candIntraPredModeXをIntraPredModeY[xNbX][yNbX]に等しく設定する。
【0146】
3.x=0..4の場合のcandModeList[x]は、以下のように導出される。
- candIntraPredModeBがcandIntraPredModeAに等しく、candIntraPredModeAがINTRA_DCよりも大きい場合、candModeList[x](x=0..4)は、以下のように導出される。
candModeList[0]=candIntraPredModeA (8-10)
candModeList[1]=2+((candIntraPredModeA+61)%64) (8-12)
candModeList[2]=2+((candIntraPredModeA-1)%64) (8-13)
candModeList[3]=INTRA_DC (8-11)
candModeList[4]=2+((candIntraPredModeA+60)%64) (8-14)
- そうでなく、candIntraPredModeBがcandIntraPredModeAに等しくなく、candIntraPredModeAまたはcandIntraPredModeBがINTRA_DCよりも大きい場合、以下が適用される。
変数minABおよびmaxABは、以下のように導出される。
minAB=Min(candIntraPredModeA,candIntraPredModeB) (8-24)
maxAB=Max(candIntraPredModeA,candIntraPredModeB) (8-25)
- candIntraPredModeA及びcandIntraPredModeBの両方がINTRA_DCよりも大きい場合、x=0..4の場合のcandModeList[x]は、以下のように導出される。
candModeList[]=candIntraPredModeA (8-27)
candModeList[1]=candIntraPredModeB (8-29)
candModeList[2]=INTRA_DC (8-29)
- maxAB-minABが2~62の範囲内にある場合、以下が適用される。
candModeList[3]=2+((maxAB+61)%64) (8-30)
candModeList[4]=2+((maxAB-1)%64) (8-31)
- そうでない場合、以下が適用される。
candModeList[3]=2+((maxAB+60)%64) (8-32)
candModeList[4]=2+((maxAB)%64) (8-33)
- そうでない場合(candIntraPredModeA又はcandIntraPredModeB>INTRA_DC)、x=0..4のcandModeList[x]は、以下のように導出される。
candModeList[]=maxAB (8-65)
candModeList[1]=INTRA_DC (8-66)
candModeList[2]=2+((maxAB+61)%64) (8-66)
candModeList[3]=2+((maxAB-1)%64) (8-67)
candModeList[4]=2+((maxAB+60)%64) (8-68)
- そうでない場合、以下が適用される。
candModeList[0]=INTRA_DC (8-71)
candModeList[1]=INTRA_ANGULAR50 (8-72)
candModeList[2]=INTRA_ANGULAR18 (8-73)
candModeList[3]=INTRA_ANGULAR46 (8-74)
candModeList[4]=INTRA_ANGULAR54 (8-75)
【0147】
4.IntraPredModeY[xCb][yCb]は、以下の手順を適用することによって導出される。
- intra_luma_mpm_flag[xCb][yCb]が1に等しい場合、IntraPredModeY[xCb][yCb]は、candModeList[intra_luma_mpm_idx[xCb][yCb]]と等しく設定される。
- そうでない場合、IntraPredModeY[xCb][yCb]は以下の順のステップを適用することにより、導出される。
1.candModeList[i]がcandModeList[j]よりも大きい(i=0..3、各i,j=(i+1)..4)場合、両方の値は、以下のようにスワップされる。
(candModeList[i],candModeList[j])=Swap(candModeList[i],candModeList[j]) (8-94)
2.IntraPredModeY[xCb][yCb]は以下の順のステップで導出される。
i.IntraPredModeY[xCb][yCb]はintra_luma_mpm_remainder[xCb][yCb]と等しく設定される。
ii.IntraPredModeY[xCb][yCb]の値が1増加する。
iii.i=0~4の場合、IntraPredModeY[xCb][yCb]がcandModeList[i]以上である場合、IntraPredModeY[xCb][yCb]の値が1増加する。
- そうでない場合(intra_luma_not_planar_flag[xCb][yCb]は0と等しい)、IntraPredModeY[xCb][yCb]はINTRA_PLANARと等しく設定される。
【0148】
x=xCb..xCb+cbWidth-1およびy=yCb..yCb+cbHeight-1の場合、変数IntraPredModeY[x][y]は、IntraPredModeY[xCb][yCb]と等しく設定される。
【0149】
2.11 分割ツリー
【0150】
HEVCにおいて、CTUは、様々な局所的特徴に適応するように、符号化ツリーと呼ばれる4分木構造を用いてCUに分割される。インターピクチャ(時間的)予測またはイントラピクチャ(空間的)予測を使用する、ピクチャ領域を符号化するかどうかの決定は、葉CUレベルで行われる。各葉CUは、PU分割タイプに応じて1つ、2つまたは4つのPUに更に分割することができる。1つのPUの内部では、同じ予測処理が適用され、PU単位で関連情報がデコーダに送信される。PU分割タイプに基づく予測処理を適用して残差ブロックを得た後、CUのためのコーディングツリー符号化ツリーに類似した別の4分木構造に基づいて、葉CUを変換ユニット(TU)に分割することができる。HEVC構造の重要な特徴の1つは、CU、PU、TUを含む複数のパーティション概念を有することである。
【0151】
VVCにおいて、2値及び3値分割セグメンテーション構造を使用するネストされたマルチタイプツリーを有する4分木は、複数の区分ユニットタイプの概念に取って代わり、例えば、それは、最大変換長さに対して大き過ぎるサイズを有するCUに必要な場合を除き、CU、PU、及びTU概念の分離を排除し、且つCU区分形状のためのより多くの柔軟性をサポートする。符号化ツリー構造において、CUは正方形または長方形のいずれかを有することができる。まず、符号化ツリーユニット(CTU)を4分木構造で分割する。そして、4分木の葉のノードは、マルチタイプのツリー構造によってさらに区分され得る。
図15に示すとおり、マルチタイプツリー構造の分岐タイプには、垂直二分岐(SPLIT_BT_VER)、水平二分岐(SPLIT_BT_HOR)、垂直三分岐(SPLIT_TT_VER)、水平三分岐(SPLIT_TT_HOR)の4つがある。マルチタイプの木の葉のノードは、符号化ユニット(CU)と呼ばれ、CUが大き過ぎて最大変換長にならない限り、このセグメント化は、それ以上の分割なしに、予測及び変換処理に使用される。これは、ほとんどの場合、CU、PU、及びTUが、ネストされたマルチタイプのツリー符号化ブロック構造を有する4分木において、同じブロックサイズを有することを意味する。サポートされる最大変換長がCUの色成分の幅又は高さよりも小さい場合、この例外が生じる。
【0152】
図16は、ネストされたマルチタイプツリー符号化ツリーを有する4分木における分割情報の信号通知メカニズムを示す。符号化ツリーユニット(CTU)は、4分木の根として取り扱われ、まず1つの4分木構造によって分割される。各4分木葉ノード(十分に大きいため許容される場合)は、次に、マルチタイプツリー構造によってさらに分割される。マルチタイプツリー構造において、第1のフラグ(mtt_split_cu_flag)は、ノードがさらに分割されているかどうかを示すために信号通知され、ノードがさらに分割されている場合、第2のフラグ(mtt_split_cu_vertical_flag)は分割方向を示すために信号通知され、次に第3のフラグ(mtt_split_cu_binary_flag)が、分割が2値分割であるか3値分割であるかを示すために信号通知される。mtt_split_cu_vertical_flag及びmtt_split_cu_binary_flagの値に基づいて、表4に示すように、CUのマルチタイプツリースリットモード(MttSplitMode)が導出される。
【0153】
【0154】
図17は、4分木及びネストされたマルチタイプのツリー符号化ブロックを有する複数のCUに分割されたCTUを示し、太いブロックエッジは4分木分割を表し、残りのエッジはマルチタイプのツリー分割を表す。ネストされたマルチタイプのツリー分割を有する4分木は、CUからなるコンテンツ適応符号化ツリー構造を提供する。CUのサイズは、CTUと同じ大きさであってもよいし、輝度サンプルの単位で4×4と小さくてもよい。4:2:0の彩度フォーマットの場合、最大彩度CBサイズは64×64であり、最小彩度CBサイズは2×2である。
【0155】
VVCにおいて、最大サポート輝度変換サイズは64×64であり、最大サポート色度変換サイズは32×32である。CBの幅又は高さが最大変換幅又は高さよりも大きい場合、CBを水平及び/又は垂直方向に自動的に分割し、その方向の変換サイズ制限を満たす。
【0156】
ネストされたマルチタイプツリー符号化ツリースキームを有する4分木のために、SPS構文要素によって以下のパラメータを定義し、指定する。
【0157】
- CTUのサイズ:4分木のルートノードのサイズ
- MinQTSize:最小許容の4分木の葉ノードサイズ
- MaxBtSize:最大許容の2分木ルートノードサイズ
- MaxTtSize:最大許容の3分木ルートノードサイズ
- MaxMttDepth:4分木の葉からマルチタイプツリーを分割するときに許容される最高の階層深さ
- MinBtSize:最小許容の2分木の葉ノードのサイズ
- MinTtSize:最小許容の3分木の葉ノードのサイズ
【0158】
ネストされたマルチタイプのツリー符号化ツリー構造を有する4分木の例において、CTUのサイズは、4:2:0の彩度サンプルの2つの対応する64×64ブロックを有する128×128の輝度サンプルとして設定し、MinQTSizeを16×16として設定し、MaxBtSizeを128×128として設定し、MaxTtSizeを64×64として設定し、MinBtSizeとMinTtSize(幅と高さの両方)を4×4として設定し、MaxMttDepthを4として設定する。4分木の分割は、まずCTUに適用され、4分木の葉ノードを生成する。4分木の葉ノードは、16×16(例えば、MinQTSize)から128×128(例えば、CTUサイズ)までのサイズを有することが可能である。葉QTノードが128×128である場合、サイズがMaxBtSizeおよびMaxTtSize(例えば、64×64)を超えるため、2分木によってさらに分割されない。そうでない場合、葉qdツリーノード(葉QTノード)は、マルチタイプツリーによってさらに分割されてもよい。よって、4分木の葉ノード(quaternary tree leaf node)は、マルチタイプツリーの根ノードでもあり、マルチタイプツリーの深さ(mttDepth)は0である。マルチタイプツリーの深さがMaxMttDepth(例えば、4)に達した場合、それ以上の分割は考慮されない。マルチタイプツリーノードの巾がMinBtSizeであり、且つ2*MinTtSize以下である場合、それ以上の水平分割は考慮されない。同様に、マルチタイプツリーノードの高さがMinBtSizeに等しく、2*MinTtSize以下の場合、それ以上の垂直分割は考慮されない。
【0159】
VVCハードウェアデコーダにおいて64×64の輝度ブロック及び32×32の彩度パイプライン設計を可能にするため、
図18に示すように、輝度符号化ブロックの幅又は高さのいずれかが64よりも大きい場合、3分木(TT)分割は禁止される。また、彩度符号化ブロックの幅又は高さのいずれかが32よりも大きい場合も、TT分割は禁止される。
【0160】
VTM3において、符号化ツリースキームは、輝度及び彩度が別個のブロックツリー構造を有する機能をサポートする。現在、P及びBスライスの場合、1つのCTUにおける輝度及び彩度CTBは、同じ符号化ツリー構造を共有しなければならない。しかしながら、Iスライスの場合、輝度及び彩度は、別個のブロックツリー構造を有することができる。別個のブロックツリーモードが適用されるとき、1つの符号化ツリー構造によって輝度CTBをCUに分割し、別の符号化ツリー構造によって彩度CTBを彩度CUに分割する。これは、IスライスにおけるCUが輝度成分の1つの符号化ブロック又は2つの彩度成分の符号化ブロックによって構成されてよく、P又はBスライスにおけるCUは、映像がモノクロでない限り、常に3つの色成分すべての符号化ブロックからなることを意味する。
【0161】
3. 問題点の例
【0162】
現在の設計において、以下のような問題がある。
【0163】
1.ISP符号化ブロックは、1つのブロックを同じイントラ予測モードの2つ又は4つのサブパーティションに分割し、一方、1つのブロックを2つ又は4つのパーティションに分割し、それぞれのブロックを同じイントラ予測モードで符号化することができる。そのため、ある程度の冗長性が存在する。
【0164】
2.また、MPMリスト構築プロセスは、分割方向を考慮しない固定近傍ブロック(上側及び左側)を用いる。例えば、水平BTの場合、上記分割がイントラモードで符号化される場合、ボトム側は、通常、異なるイントラ予測モードを使用することが好ましく、上記ブロックのイントラ予測モードはMPMリストに含まれる。
【0165】
3.内部サブパーティションのいくつかの近傍のサンプルは、常に利用不可能である。例えば、垂直(水平)方向に分割されたISPブロックの場合、左下(右上)の近傍のサンプルは利用できない。
【0166】
4.ALWIP符号化ブロックのためのイントラモードの信号通知は、従来の方法、MRL、又はISPを使用する他のイントラ符号化ブロックのための信号通知とは異なる。
【0167】
4.例示的な実施形態及び技術
【0168】
以下に列記される実施形態は、一般的な概念を説明するための例であると考えられるべきである。これらの実施形態は狭い意味で解釈されるべきではない。さらに、これらの実施形態は、任意の方法で組み合わせることができる。
【0169】
ここで、1つのブロックのサイズをW*Hで表し、ここで、Wはブロックの幅であり、Hはブロックの高さである。最大変換ブロックサイズは、MaxTbW*MaxTbHによって表され、ここで、MaxTbW及びMaxTbHは、それぞれ最大変換ブロック幅及び最大変換ブロック高さである。最小変換ブロックサイズは、MinTbW*MinTbHによって表され、ここで、MinTbW及びMinTbHは、それぞれ、最小変換ブロックの幅及び高さである。なお、MRLは、現在のピクチャにおいて非隣接基準ラインを用いて現在のブロックを予測することができる技術を表すことができ、ALWIPは、行列ベースイントラ予測を使用することができる技術を表すことができる。
【0170】
ALWIPおよびQR-BDPCMに関して、以下である。
【0171】
1.ALWIPのサイド情報(例えば、オン/オフ使用フラグ、イントラ予測モード、及び/又は輝度サンプルのための入力ベクトルが転置されるか否か等の入力ベクトルに関する情報)は、QR-BDPCMのサイド情報(例えば、オン/オフ使用フラグ、及び/又は予測方向)の後に符号化されてもよい。
a.一例において、ALWIPおよびQR-BDPCMは、一つのブロックに適用できなかった。
i.ALWIPがブロックに適用される場合、QR-BDPCMは適用されず、そのサイド情報は符号化されない。
ii.QR-BDPCMをブロックに適用する場合、ALWIPは適用されず、そのサイド情報は符号化されない。
iii.あるいは、それらは、1つのブロックに適用されてもよく、ここで、イントラ予測方法はALWIPのような方法を使用し、残差の信号通知は、QR-BDPCMのような方法であり、例えば、変換せず、残差ブロック内の特定の位置のために残差を符号化する。
b.あるいは、ALWIPのサイド情報を信号通知するかどうかは、QR-BDPCMの使用に依存してもよい。
i.1つのブロックにQR-BDPCMを適用する場合、ALWIPのサイド情報の信号通知は省略されてもよい。
ii.1つのブロックにQR-BDPCMを適用しない場合、ALWIPのサイド情報は依然として信号通知されてもよい。
iii.QR-BDPCMを1つのブロックに適用する場合、ALWIPモードの信号通知をスキップしつつ、ALWIPの使用の信号通知をしてもよい。
iv.一例において、QR-BDPCMを1つのブロックに適用する場合、ALWIPの使用の信号通知が、依然として信号通知されてもよい。しかしながら、ALWIPは、適合ビットストリームにおけるブロックに適用されるべきではない。
c.あるいは、ALWIPのサイド情報の後に、QR-BDPCMのサイド情報を符号化してもよい。
i.QR-BDPCMのサイド情報を信号通知するかどうかは、ALWIPの使用に依存してもよい。
ii.1つのブロックにALWIPを適用する場合、QR-BDPCMのサイド情報の信号通知はスキップされる。
iii.1つのブロックにALWIPを適用し、かつ関連するALWIPモードが従来の水平/垂直モードに対応する場合、QR-BDPCMの使用が依然として通知されてもよいが、予測方向(例えば、bdpcm_dir_flag)の信号伝達は省略される。
iv.一例において、ALWIPを1つのブロックに適用する場合、QR-BDPCMの使用は、依然として信号通知されてもよい。しかしながら、QR-BDPCMは、適合ビットストリームにおけるブロックに適用されるべきではない。
【0172】
2.ALWIP符号化ブロックのためのイントラ予測モードの信号通知は、最初ではなく、1つ以上のイントラ関連符号化ツールに関連する情報の後に信号通知されてもよい。
a.一例において、イントラ関連符号化ツールは、QR-BDPCM/PCM/MRL/ISP/広角イントラ予測/従来のイントラ符号化方法を含んでもよい。
【0173】
3.ALWIPは、MPMリストからの候補で符号化されたブロックにのみ適用可能であるか、又はMPMリストに含まれた候補からマッピング又は変換された1つの候補にのみ適用可能であることが提案される。
a.代替的に、さらに、ALWIP符号化ブロックのために、MPMフラグの信号通知及び/又は残りの符号化モードの信号通知を省略してもよい。
【0174】
4.従来のイントラ予測方法/広角イントラ予測/MRL/又はISPを用いて、ALWIP符号化ブロックのイントラ予測モードの信号通知を、他のイントラ符号化ブロックの信号通知に合わせることが提案される。
a.一例において、ALWIP符号化ブロックのためのイントラ予測モードの信号通知は、以下の部分を含んでもよい。
i.MPM候補の1つであるかどうかをまず符号化することができる(構文要素Aで示す)。
ii.それがMPM候補である場合、以下をさらに順に符号化することができる。
1) それがMPMリストにおける第1のMPM候補であるかどうか(構文要素Bによって示される)。
2) 残りのMPMリストにおける1つのMPMインデックス(構文要素Cによって示される)
iii.MPM候補でない場合、残りの許可されたイントラモードにおけるイントラモードインデックス(構文要素Dで表される)をさらに符号化してもよい。
b.あるいは、ALWIP符号化ブロックのためのイントラ予測モードの信号通知は、以下の部分を含んでもよい。
i.MPM候補の1つであるかどうかをまず符号化することができる(構文要素Aによって示される)。
ii.それがMPM候補である場合、以下をさらに順に符号化することができる。
1) それが平面モードでないかどうか(構文要素Bによって示される)
2) 残りのMPMリストにおける1つのMPMインデックス(構文要素Cによって示される)
iii.MPM候補でない場合、残りの許可されたイントラモードにおけるイントラモードインデックス(シンタックス要素Dで表される)をさらに符号化してもよい。
c.特定の構文要素、例えば、上述の構文要素A/B/C/Dの場合、それは条件付きで信号通知されてもよい。
i.1つの例において、ALWIPのためにMPMのみが許容された場合、ALWIPが使用されるとき、構文要素Aの信号通知はスキップされてもよい。
ii.あるいは、構文要素A(例えば、intra_luma_mpm_flag)は、条件付きで信号通知されてもよい。例えば、構文要素A(例えば、intra_luma_mpm_flag)の信号伝達は、intra_luma_ref_idx[x0][y0]==0&&intra_subpartitions_mode_flag[x0][y0]==0&&intra_lwip_flag[x0][y0]==0の条件下としてもよい。
d.上記構文要素の許容される値の範囲は、イントラ符号化方法及び/又はブロック寸法に依存してもよい。
i.一例において、構文要素C(例えば、intra_luma_mpm_idx)は、ALWIPの場合、[0,1]であり、他の場合、[0,4]としてもよい。
ii.一例において、構文要素D(例えば、intra_luma_mpm_remainder)は、非ALWIPブロックの場合、[0,60]の範囲にあり、4×4のALWIPブロックの場合、[0,31]の範囲にあり、W<=8&H<=8のALWIPブロックの場合、[0,15]の範囲にあり、他のALWIPブロックの場合、[0,7]の範囲内であってよく、WとHはそれぞれブロック幅と高さを表している。
e.構文要素A/B/C/Dは、算術符号化においてコンテキスト符号化されてもよいし、バイパス符号化されてもよい。
i.あるいは、コンテキストは、ALWIP/MRL/ISP/広角イントラ予測などのイントラ符号化方法に従って選択されてもよい。
1) 1つの例において、2値化MPMインデックスの第1のビン(例えば、intra_luma_not_planar_flag)を符号化する場合、2つのコンテキストを利用することができ、1つは従来のイントラ及びALWIP用であり、他の1つはISP又はALWIP用であり、他の1つは残りの方法用である。
2) 1つの例において、2値化MPMインデックスの第1のビン(例えば、intra_luma_not_planar_flag)を符号化する場合、3つのコンテキストを利用してよく、1つはALWIPであり、1つはISPであり、そしてもう1つは他のコンテキストである。
【0175】
非ALWIP方法のためのイントラモード符号化に関して、以下のように行われる。
【0176】
5. 従来のイントラ予測方法/広角イントラ予測/MRL/又はISPを使用するような、ALWIP符号化されていないイントラ予測モードを符号化するために使用される構文要素のコンテキスト/許容範囲は、イントラ予測方法に依存し得ることが提案される。
a.一例において、異なるイントラ予測方法は、異なるサイズのMPMリストを有してもよい。
b.一例において、異なるイントラ予測方法は、異なる数の非MPM候補を有してもよい。
【0177】
ISPに関して、以下である。
【0178】
6. ISP符号化ブロックに対して2つのイントラ予測モードのみが許容されることが提案される。
a.一例において、MPMリストにおける最初の2つのモードは許容される。
b.1つの例において、許容される2つのモードの1つは、平面モードであり、他の1つは、MPMリストからのものであり、例えば、1st又は2nd又はMPMリストにおける平面モードでない第1のものである。
c.あるいは、ISP符号化ブロックの場合、MPMインデックス(例えば、intra_luma_mpm_idx)の信号伝達はスキップされる。
d.一例において、上記方法は、他のイントラ符号化方法、例えば、MRL、ALWIPにも適用可能である。
【0179】
7.ISP符号化ブロックの参照サンプル(又は近傍のサンプル)及び/又は予め符号化されたサブパーティションの近傍のサンプルを用いて、このブロックの現在のサブパーティションを予測することが提案されている。
a.1つの例において、ISP符号化ブロックが水平方向に分割される場合、ブロックの右上の参照サンプルを用いて、内部サブパーティションを予測し得る。
b.一例において、ISP符号化ブロックが垂直方向に分割される場合、ブロックの左下の参照サンプルを用いて内部サブパーティションを予測することができる。
c.一例において、ISP符号化ブロックの右上又は/及び左下の参照サンプルは、内側サブパーティションの右上又は/及び左下の参照サンプルとして直接使用されてもよい。一例を
図22に示す。
d.一例において、内側サブパーティションの右上又は/及び左下の参照サンプルは、ISP符号化ブロックの右上又は/及び左下の参照サンプルを用いて予測されてもよい。一例を
図23に示す。
i.一例において、イントラ予測方法は、内側サブパーティションの参照サンプルを予測するために用いられてもよい。
ii.一例において、内側サブパーティションの参照サンプルをブロックの参照サンプルの端数位置に投影する場合、双線形補間を補間に用いてもよい。
iii.一例において、内側サブパーティションの参照サンプルをブロックの参照サンプルの端数位置に投影する場合、この端数位置を整数位置に丸めてもよい。例えば、近接整数位置又は最も近い利用可能な整数位置である。
e.一例において、内側サブパーティションの右上又は/及び左下の参照サンプルは、上述の方法で生成された後、内側サブパーティションを予測するために使用される前に、フィルタリングされてもよい。
【0180】
8.MPMリスト構築プロセスにおいて、どの近傍のブロックを確認するかは、映像ユニット毎に変更されてもよい。例えば、映像ユニットはCUであってもよい。
a.同一の親ノード内の子ノードへのアクセスは、MPMリスト構築プロセスにおいて禁止してもよい。
b.一例において、それは親ノードの分割方向/分割ツリータイプに依存してもよい。
i.一例において、現在のブロック(例えば、子ノードの下側)が水平方向のBT及び/又はTTから分離されたものであり、分離された第1の子ノードでない場合、上記確認対象のブロックは、右上又は異なる親ノードにおける任意のブロックに置き換えられてもよい。
1) あるいは、上記ブロックのイントラ予測モードを変換したものに置き換えてもよい。例えば、X+off又は(X+off)%Tに置き換えられてもよく、ここで、Xは、上記ブロックのイントラ予測モードであり、off及びTは、整数である。
ii.一例において、現在のブロック(例えば、右側の子ノード)が垂直BT及び/又はTTから分離されたものであり、分離された第1の子ノードでない場合、左上のブロック又は異なる親ノードにおける任意のブロックに置き換えられてもよい。
1) あるいは、左ブロックのイントラ予測モードを変換したものに置き換えてもよい。例えば、X+off又は(X+off)%Tに置き換えられてもよく、ここで、Xは、上記ブロックのイントラ予測モードであり、off及びTは、整数である。
c.あるいは、MPMリストを同様に構築してもよいが、同じ親ノードにおける他の子ノードのイントラ予測モードをMPMリストから除外してもよい。
d.あるいは、同じ親ノードにおける他の子ノードのイントラ予測モードを他のモードに置き換えてもよい。イントラ予測モードを信号通知する方法は、分割タイプに依存し得る。
i.一例において、1つの親ノードが水平/垂直BT及び/又はTTに分割され、第1の子ノードが平面モードで符号化され、第2の子ノードがイントラ符号化される場合、第2の子ノードへのintra_luma_not_planar_flag forの通知はスキップされ、1であると推測されてもよい。
【0181】
9.スライスに対してISPが有効化したとき、特定のブロック寸法(例えば、4×8、8×4)のための水平及び/又は垂直BT及び/又はTTを無効とすることが提案されている。
a.スライスに対して特定のブロック寸法(例えば、4×8、8×4)のための水平及び/又は垂直BT及び/又はTTを有効化した場合、ISPを無効とすることが提案されている。
i.ISPが無効にされている場合、ISP側情報の関連する信号通知はスキップされる。
b.あるいは、上記方法は、デュアルツリーが有効化されている場合に適用されてもよい。
c.あるいは、上記方法は、単一のツリーが有効化されている場合に適用されてもよい。
【0182】
4.1 例示的な実施形態
【0183】
変更例を以下に示す。下線を引いた部分且つ太い部分は作業草案への追加を示し、一方、取り消し線部分は削除提案を示す。
【0184】
【0185】
構文要素intra_luma_mpm_flag[x0][y0]、intra_luma_not_planar_flag[x0][y0]、intra_luma_mpm_idx[x0][y0]およびintra_luma_mpm_remainder[x0][y0]は、輝度サンプルのイントラ予測モードを指定する。配列インデックスx0,y0は、ピクチャの左上輝度サンプルに対する、考慮される符号化ブロックの左上輝度サンプルの位置(x0,y0)を指定する。intra_luma_mpm_flag[x0][y0]が1に等しい場合、イントラ予測モードは、intra_lwip_flag[x0][y0]が0である場合の第8.4.2項に従って近傍のイントラ予測符号化ユニットから推論し、またイントラ予測モードは、intra_lwip_flag[x0][y0]が1に等しい場合の第8.4.2項に従って近傍のイントラ予測符号化ユニットから推論する。
intra_luma_mpm_flag[x0][y0]が存在しない場合、1に等しいと推測される。
intra_luma_not_planar_flag[x0][y0]が存在しない場合、1に等しいと推測される。
【0186】
8.4.2 輝度イントラ予測モードのための導出処理
【0187】
この処理への入力は以下の通りである。
- 現在のピクチャの左上の輝度サンプルに対する現在の輝度符号化ブロックの左上のサンプルを規定する輝度位置(xCb,yCb)
- 輝度サンプルにおける現在の符号化ブロックの幅を規定する変数cbWidth、
- 輝度サンプルにおける現在の符号化ブロックの高さを規定する変数cbHeight。
この処理において、輝度イントラ予測モードIntraPredModeY[xCb][yCb]が導出される。
表8-1に、イントラ予測モードIntraPredModeY[xCb][yCb]の値とその関連名称を示す。
【0188】
【0189】
注意:イントラ予測モードINTRA_LT_CCLM、INTRA_L_CCLM、INTRA_T_CCLMは、彩度成分にのみ適用可能である。
IntraPredModeY[xCb][yCb]は、以下のように導出される。
【0190】
- intra_luma_not_planar_flag[xCb][yCb]が1に等しい場合、以下の順序のステップである。
【0191】
1.近傍位置(xNbA、yNbA)および(xNbB、yNbB)は、それぞれ、(xCb-1,yCb+cbHeight-1)および(xCb+cbWidth-1,yCb-1)に等しく設定される。
・・・
そうでない場合(intra_luma_not_planar_flag[xCb][yCb]は0と等しい)、IntraPredModeY[xCb][yCb]はINTRA_PLANAR+と等しく設定される。
x=xCb..xCb+cbWidth-1およびy=yCb..yCb+cbHeight-1の場合、変数IntraPredModeY[x][y]は、IntraPredModeY[xCb][yCb]と等しく設定される。
【0192】
8.4.X アフィン線形重み付きイントラ予測モードの導出方法
【0193】
この処理への入力は以下の通りである。
- 現在のピクチャの左上の輝度サンプルに対する現在の輝度符号化ブロックの左上のサンプルを規定する輝度位置(xCb,yCb)
- 輝度サンプルにおける現在の符号化ブロックの幅を規定する変数cbWidth、
- 輝度サンプルにおける現在の符号化ブロックの高さを規定する変数cbHeight。
この処理において、アフィン線形加重イントラ予測モードIntraPredModeY[xCb][yCb]が導出される。
IntraPredModeY[xCb][yCb]は以下の順のステップで導出される。
【0194】
1.近傍位置(xNbA、yNbA)および(xNbB、yNbB)は、それぞれ、(xCb-1,yCb)および(xCb,yCb-1)に等しく設定される。
2.XをAまたはBのいずれかに置き換える場合、変数candLwipModeXは、以下のように導出される。
-・・・
3.x=0..2の場合のcandLwipModeList[x]は、表8-X2に示されるように、lwipMpmCand[sizeId]を使用し、以下のように導出する。
・・・
4.IntraPredModeY[xCb][yCb]は、以下の手順を適用することによって導出される。
【数8】
- そうでない場合、IntraPredModeY[xCb][yCb]は以下の順のステップを適用することにより、導出される。
1.candLwipModeList[i]がcandLwipModeList[j]よりも大きい(i=0..1、各i,j=(i+1).2)場合、両方の値は、以下のようにスワップされる。
(candLwipModeList[i],candLwipModeList[j])=Swap(candLwipModeList[i],candLwipModeList[j]) (8-X14)
2.IntraPredModeY[xCb][yCb]は以下の順のステップで導出される。
i.IntraPredModeY[xCb][yCb]はintra_lwip_mpm_remainder[xCb][yCb]に等しく設定される。
ii.iが0~2の場合、IntraPredModeY[xCb][yCb]がcandLwipModeList[i]以上である場合、IntraPredModeY[xCb][yCb]の値が1増加する。
x=xCb..xCb+cbWidth-1およびy=yCb..yCb+cbHeight-1の場合、変数IntraPredModeY[x][y]は、IntraPredModeY[xCb][yCb]と等しく設定される。
【0195】
【0196】
図19は、映像処理装置1900のブロック図である。装置1900は、本明細書に記載の方法の1つ以上を実装するために使用してもよい。装置1900は、スマートフォン、タブレット、コンピュータ、モノのインターネット(IoT)受信機等に実施されてもよい装置1900は、1つ以上の処理装置1902と、1つ以上のメモリ1904と、映像処理ハードウェア1606と、を含んでもよい。1つまたは複数のプロセッサ1902は、本明細書に記載される1つ以上の方法を実装するように構成されてもよい。メモリ(複数可)1904は、本明細書で説明される方法および技術を実装するために使用されるデータおよびコードを記憶するために使用してもよい。映像処理ハードウェア1606は、本明細書に記載される技術をハードウェア回路にて実装するために使用してもよい。
【0197】
図20は、本技術の1つ以上の実施例に従った映像処理方法2000を示すフローチャートである。方法2000は、ステップ2002において、映像データのブロックを表すビットストリームを生成するか又は受信することを含む。この映像データのブロックは、アフィン線形重み付きイントラ予測(ALWIP)に基づいて符号化されるALWIPのサイド情報及び量子化残差ブロック差動パルスコード変調(QR-BDPCM)のサイド情報は、ビットストリームにおいて第1の順序で順次、符号化される。
【0198】
図21は、本技術の1つ以上の実施例に従った映像処理方法2100を示すフローチャートである。方法2100は、動作2102において、映像データのブロックを表すビットストリームを生成すること、又は受信することを含み、映像データブロックは、2つのイントラ予測モードのみを有するイントラ予測方法を用いて符号化される。
【0199】
図24は、本技術の1つ以上の実施例に従った映像処理方法2400を示すフローチャートである。方法2400は、ステップ2402において、現在のブロックの近傍のブロックのセットを確認することで、映像データの複数のブロック中の現在のブロックのために最確モード(MPM)リストを構築することを含む。複数のブロックは、分割パターンを用いて映像ユニットを分割して生成される。分割パターンに基づいて、近傍のブロックのセットが判定される。方法2400は、ステップ2404において、MPMリストからの候補を用いて映像データの現在のブロックを符号化することを含む。方法2400は、動作2406において、映像データの現在のブロックを表すビットストリームを生成又は受信することを更に含む。
【0200】
図25は、本技術の1つ以上の実施例に従った映像処理方法2500を示すフローチャートである。方法2500は、ステップ2502において、映像データの複数のブロックを表すビットストリームを受信することを含む。最確モード(MPM)リストの候補を用いて、映像データの現在のブロックをビットストリームに符号化し、現在のブロックの近傍のブロックのセットを確認することで、MPMリストを構築する。分割パターンを用いて映像ユニットを分割することにより複数のブロックを生成し、分割パターンに基づいて近傍のブロックのセットを判定する。方法2500は、ステップ2504において、ビットストリームを用いて映像データの現在のブロックを再構成することを更に含む。
【0201】
追加の実施形態および技術は、以下の実施例に記載される。
【0202】
1.映像処理方法であって、映像データのブロックを表すビットストリームを生成又は受信することであって、映像データの前記ブロックを、アフィン線形重み付きイントラ予測(ALWIP)に基づいて符号化し、ALWIPのサイド情報及び量子化残差ブロック差動パルスコード変調(QR-BDPCM)のサイド情報は、前記ビットストリームにおいて第1の順序で順次、符号化される、方法。
【0203】
2.前記第1の順序は、ALWIPの前記サイド情報がQR-BDPCMの前記サイド情報の後に符号化されることを示す、実施例1に記載の方法。
【0204】
3.ALWIPの前記サイド情報は、映像データの前記ブロックを処理する際のQR-BDPCMの使用に基づいて符号化される、実施例2に記載の方法。
【0205】
4.前記第1の順序は、QR-BDPCMの前記サイド情報がALWIPの前記サイド情報の後に符号化されることを示す、実施例1に記載の方法。
【0206】
5.QR-BDPCMの前記サイド情報は、映像データの前記ブロックを処理する際のALWIPの使用に基づいて符号化される、実施例4に記載の方法。
【0207】
6.QR-BDPCMは、映像データの前記ブロックの残差値を信号通知することに適用される、実施例1~5のいずれかに記載の方法。
【0208】
実施例1~6のさらなる実施形態は、第4章の項目1に記載する。
【0209】
7.前記ビットストリームにおける1つ以上の予測方法に関する情報の後に、映像データの前記ブロックのイントラ予測モードを符号化する、例1~6のいずれかに記載の方法。
【0210】
8.前記1つ以上の符号化方法は、QR-BDPCM、多重基準ライン(MRL)イントラ予測、イントラサブブロック分割(ISP)、又は広角イントラ予測のうち少なくとも1つを含む、実施例7に記載の方法。
【0211】
実施例7~8のさらなる実施形態は、第4章の項目2に記載する。
【0212】
9.映像データの前記ブロックは、最確モード(MPM)リストからの候補に基づいて符号化される、実施例1~8のいずれかに記載の方法。
【0213】
10.前記ビットストリームは、MPMリストからの候補が最初に符号化されたかどうかを示す第1の構文要素と、前記候補が前記MPMリストにおける第1の候補であるかどうか、又は前記候補が平面モードであるかどうかを示す第2の構文要素と、前記MPMリストにおける残りの候補のMPMインデックスを示す第3の構文要素と、許容されるイントラ予測モードのリストにおけるイントラ予測モードインデックスを示す第4の構文要素と、を少なくとも含む、実施例9に記載の方法。
【0214】
11.イントラ予測方法又はブロック寸法に基づいて、第1、第2、第3、又は第4の構文要素の値の範囲を判定する、実施例10に記載の方法。
【0215】
実施例9~11のさらなる実施形態は、第4章の項目3~4に記載する。
【0216】
12.映像処理方法であって、映像データのブロックを表すビットストリームを生成又は受信することであって、映像データの前記ブロックを2つのイントラ予測モードのみを有するイントラ予測方法を用いて符号化する、受信することを含む、映像処理方法。
【0217】
13.前記2つのイントラ予測モードは、第1の2つのモードである最確モード(MPM)リストに基づいて判定される、実施例12に記載の方法
【0218】
14.前記イントラ予測方法は、多重基準ライン(MRL)イントラ予測、アフィン線形重み付けイントラ予測(ALWIP)、イントラサブブロック分割(ISP)、又は広角イントラ予測のうち少なくとも1つを含む、実施例12に記載の方法。
【0219】
実施例12~13のさらなる実施形態は、第4章の項目6に記載する。
【0220】
15.前記イントラ予測方法は、イントラサブブロック分割(ISP)であり、映像データの前記ブロックの参照サンプルを用いて前記ブロックの現在のサブパーティションを予測する、実施例12に記載の方法。
【0221】
16.前記現在のサブパーティションは、前記ブロックを水平方向に分割することによって得られ、前記参照サンプルは、前記ブロックの右上の参照サンプルを含む、実施例15に記載の方法。
【0222】
17.前記現在のサブパーティションは、前記ブロックを垂直方向に分割することによって得られ、前記参照サンプルは、前記ブロックの左下の参照サンプルを含む、実施例15に記載の方法。
【0223】
18.前記ブロックの参照サンプルを前記現在のサブパーティションの参照サンプルとして使用する、実施例15~17のいずれかに記載の方法。
【0224】
19.現在のサブパーティションの参照サンプルは、前記ブロックの参照サンプルの端数位置に基づいて判定される、実施例15~17のいずれかに記載の方法。
【0225】
実施例14~19のさらなる実施形態は、第4章の項目7に記載する。
【0226】
20.映像処理方法であって、映像データの複数のブロック内の現在のブロックに対して、前記現在のブロックの隣接するブロックのセットを確認して最確モード(MPM)リストを構築することであって、前記複数のブロックは分割パターンを用いて映像ユニットを分割することにより生成され、また前記隣接するブロックのセットは前記分割パターンに基づいて判定される、構築することと、前記MPMリストからの候補を用いて映像データの前記現在のブロックを符号化することと、映像データの前記現在のブロックを表すビットストリームを生成することと、を含む、方法。
【0227】
21.映像処理方法であって、映像データの複数のブロックを表すビットストリームを受信することであって、映像データの現在のブロックは最確モード(MPM)リストからの候補を用いて前記ビットストリームにおいて符号化され、前記MPMリストは、前記現在のブロックの近傍のブロックのセットを確認することにより構築され、前記複数のブロックは、分割パターンを用いて映像ユニットを分割することにより生成され、前記近傍のブロックのセットは、前記分割パターンに基づいて判定される、受信することと、前記ビットストリームを用いて映像データの前記現在のブロックを再構成することと、を含む、方法。
【0228】
22.前記近傍のブロックのセットは、前記現在のブロックとは異なる親ブロックを有する、実施例20又は21に記載の方法
【0229】
23.前記分割パターンは、垂直2値分割パターン、水平2値分割パターン、垂直3値分割パターン、又は水平3値分割パターンのうち少なくとも1つを含む、実施例20又は21に記載の方法。
【0230】
実施例20~23のさらなる実施形態は、第4章の項目8に記載する。
【0231】
24.実施例1~23に記載の1つ以上を実装するように構成された処理装置を備える映像処理装置。
【0232】
25.コードが記憶されたコンピュータ読み取り可能な媒体であって、前記コードは、処理装置によって実行されると、処理装置に、実施例1~23のいずれか1つ以上に記載の方法を実装させる、コンピュータ読み取り可能な媒体。
【0233】
図26は、本明細書で開示される様々な技術が実装され得る例示的な映像処理システム2600を示すブロック図である。様々な実装形態は、システム2600のモジュールの一部又は全部を含んでもよい。システム2600は、映像コンテンツを受信するための入力ユニット2602を含んでもよい。映像コンテンツは、未加工又は非圧縮フォーマット、例えば、8又は10ビットのマルチモジュール画素値で受信されてもよく、又は圧縮又は符号化フォーマットで受信されてもよい。入力ユニット1902は、ネットワークインターフェース、周辺バスインターフェース、又は記憶インターフェースを表してもよい。ネットワークインターフェースの例は、イーサネット(登録商標)、パッシブ光ネットワーク(PON)等の有線インターフェース、およびWi-Fi(登録商標)またはセルラーインターフェース等の無線インターフェースを含む。
【0234】
システム2600は、本明細書に記載される様々な符号化又は符号化方法を実装することができる符号化モジュール2604を含んでもよい。符号化モジュール2604は、入力ユニット2602から符号化モジュール2604の出力への映像の平均ビットレートを低減して、映像の符号化表現を生成してもよい。従って、この符号化技術は、映像圧縮または映像コード変換技術と呼ばれることがある。符号化モジュール2604の出力は、モジュール2606によって表されるように、記憶されてもよいし、接続された通信を介して送信されてもよい。入力ユニット2602において受信された、記憶された又は通信された映像のビットストリーム(又は符号化)表現は、モジュール2608によって使用されて、表示インターフェースユニット2610に送信される画素値又は表示可能な映像を生成してもよい。ビットストリーム表現からユーザが見ることができる映像を生成する処理は、映像伸張(映像展開)と呼ばれることがある。さらに、特定の映像処理動作を「符号化」動作又はツールと呼ぶが、符号化ツール又は動作は、エンコーダで使用され、対応する復号化ツール又は動作であり符号化の結果を逆にするものは、デコーダによって行われることが理解されよう。
【0235】
周辺バスインターフェースユニットまたは表示インターフェースユニットの例は、ユニバーサルシリアルバス(USB)または高精細マルチメディアインターフェース(HDMI(登録商標))またはディスプレイポート等を含んでもよい。ストレージインターフェースの例は、シリアルアドバンスドテクノロジーアタッチメント(SATA)、PCI、IDEインターフェース等を含む。本明細書に記載される技術は、携帯電話、ノートパソコン、スマートフォン、又はデジタルデータ処理及び/又は映像表示を実施可能な他のデバイス等の様々な電子デバイスに実施されてもよい
【0236】
図27は、本技術に従った映像処理方法2700を示すフローチャートである。方法2700は、動作2710において、映像のブロックと前記映像のビットストリーム表現との変換のために、行列ベースイントラ予測(MIP)符号化技術のための情報を前記ビットストリーム表現において符号化する態様を判定することを含む。MIP符号化技術を用いて、映像の予め符号化されたサンプルに対して行列ベクトル乗算演算を行うことに基づいたMIP符号化技術を用いて、ブロックの予測ブロックを判定する。方法2700は、動作2720において、前記判定に基づいて前記変換を行うことをさらに含む。
【0237】
いくつかの実施形態において、前記態様は、前記MIP符号化技術のための前記情報が、予測誤差に変換を適用せず、前記ブロックを含むピクチャ内のサンプルを用いて予測を生成する量子化残差ブロック差分パルス符号変調(QR-BDPCM)符号化技術に関して符号化されることを規定する。いくつかの実施形態において、前記MIP符号化技術又は前記QR-BDPCM符号化技術のうち1つのみを前記ブロックに適用することができる。いくつかの実施形態において、前記ブロックに対して前記MIP符号化技術を適用する場合、前記ビットストリーム表現において前記QR-BDPMC符号化技術のサイド情報は省略される。いくつかの実施形態において、前記QR-BDPCM符号化技術が前記ブロックに適用される場合、前記ビットストリーム表現において前記MIP符号化技術のサイド情報は省略される。
【0238】
いくつかの実施形態において、前記MIP符号化技術及び前記QR-BDPCM符号化技術の両方が前記ブロックに適用可能である。いくつかの実施形態において、前記変換は、イントラ予測プロセスにおいて前記MIP符号化技術を用いることを含み、前記ブロックの残差情報は、前記QR-BDPCM符号化技術による前記ビットストリーム表現で符号化される。
【0239】
いくつかの実施形態において、前記態様は、前記QR-BDPCM符号化技術におけるサイド情報の後に、前記MIP符号化技術のためのサイド情報を符号化することを指定している。いくつかの実施形態において、前記MIP符号化技術のためのサイド情報は、前記QR-BDPCM符号化技術の使用に基づいて符号化される。いくつかの実施形態において、前記QR-BDPCM符号化技術を前記ブロックに適用する場合、前記ビットストリーム表現において前記MIP符号化技術のための前記サイド情報は省略される。いくつかの実施形態において、前記QR-BDPCM符号化技術を前記ブロックに適用しない場合、前記MIP符号化技術のための前記サイド情報は前記ビットストリーム表現に存在する。
【0240】
いくつかの実施形態において、前記QR-BDPCM符号化技術を前記ブロックに適用する場合、前記MIP符号化技術のための前記サイド情報の第1の部分は前記ビットストリーム表現において省略され、前記MIP符号化技術のための前記サイド情報の第2の部分は前記ビットストリーム表現において符号化される。いくつかの実施形態において、前記第1部分は前記MIP符号化技術の1つ以上の予測モードを備える。いくつかの実施例において、第2の部分は、前記MIP符号化技術の使用に関する情報を含む。いくつかの実施形態において、前記QR-BDPCM符号化技術を前記ブロックに適用する場合、前記MIP符号化技術の使用に関する情報は前記ビットストリーム表現に含まれ、前記MIP符号化技術は前記ブロックに適用されない。
【0241】
いくつかの実施形態において、前記態様は、前記QR-BDPCM符号化技術における前記サイド情報の前に、前記MIP符号化技術における前記サイド情報を符号化することを規定する。いくつかの実施形態において、前記態様は、前記QR-BDPCM符号化技術における前記サイド情報を前記ブロックに対するMIP符号化技術の使用法に基づいて符号化することを規定する。いくつかの実施形態において、前記ブロックに前記MIP符号化技術を適用する場合、前記ビットストリーム表現において前記QR-BDPCMのための前記サイド情報は省略される。いくつかの実施形態において、前記MIP符号化技術を前記ブロックに適用し、前記MIP符号化技術の予測モードが水平又は垂直モードに対応する場合、前記QR-BDPCM符号化技術のための前記サイド情報の第1の部分は前記ビットストリーム表現において省略され、前記QR-BDPCM符号化技術のための前記サイド情報の第2の部分は前記ビットストリーム表現において符号化される。いくつかの実施形態において、前記QR-BDPCM符号化技術のための前記サイド情報の第1部分は、前記QR-BDPCM符号化技術の予測方向を含む。いくつかの実施形態において、前記QR-BDPCM符号化技術のための前記サイド情報の第2部分は、前記QR-BDPCM符号化技術を用いることを含む。
【0242】
いくつかの実施形態において、前記QR-BDPCM符号化技術の前記サイド情報は、前記QR-BDPCM符号化技術の使用の指示、又は予測方向の少なくとも1つを含む。いくつかの実施形態において、前記MIP符号化技術の前記サイド情報は、前記MIP符号化技術の使用の表示、前記MIP符号化技術のために輝度サンプルの入力ベクトルが転置されるか否かの表示、又は予測モードの表示の少なくとも1つを含む。いくつかの実施形態において、前記ブロックに前記MIP符号化技術を適用する場合、前記ビットストリーム表現に前記QR-BDPCM符号化技術の使用に関する情報が含まれ、前記QR-BDPCM符号化技術は前記ブロックに適用されない。
【0243】
いくつかの実施形態において、前記態様は、前記MIP符号化技術のための前記情報が1つ以上のイントラ符号化技術に関して符号化されることを規定する。いくつかの実施形態において、前記態様は、前記MIP符号化技術を用いて前記ブロックを符号化する場合、前記1つ以上のイントラ符号化技術に関する情報の後に、前記ブロックのイントラ予測モードを符号化することを規定する。いくつかの実施形態において、前記1つ以上のイントラ符号化技術は、少なくともQR-BDPCM符号化技術、パルス符号変調(PCM)符号化技術、多重基準ライン(MRL)符号化技術、イントラサブブロック分割(ISP)符号化技術、広角イントラ予測符号化技術、又は従来のイントラ符号化技術を含む。いくつかの実施形態において、前記態様は、前記ブロックのためのMIP符号化技術のイントラ予測モードの符号化が、前記1つ以上のイントラ符号化技術を用いて符号化される他のブロックのためのイントラ予測モードの符号化と矛盾しないことを規定する。
【0244】
いくつかの実施形態において、前記MIP符号化技術のイントラ予測モードの符号化は、前記イントラ予測モードが最確モード(MPM)候補のリストの1つであるかの判定を含む。いくつかの実施形態において、前記イントラ予測モードが最確モード(MPM)候補の前記リストの1つであるかをビットストリーム表現において第1構文要素として表現されている。いくつかの実施形態において、前記MIP符号化技術の前記イントラ予測モードの前記符号化は、前記イントラ予測モードが最確モード(MPM)候補の前記リストの1つである場合、前記イントラ予測モードがMPM候補の前記リストにおける第1の候補であるかを判定することをさらに含む。いくつかの実施形態において、前記イントラ予測モードがMPM候補の前記リストにおける第1の候補であるかどうかは、前記ビットストリーム表現において第2の構文要素として表現されている。
【0245】
いくつかの実施形態において、前記MIP符号化技術の前記イントラ予測モードの前記符号化は、前記イントラ予測モードがMPM候補の前記リストにおける第1の候補でない場合、前記ビットストリーム表現における第3の構文要素として、前記イントラ予測モードのMPMインデックスを符号化することをさらに含む。いくつかの実施形態において、前記MIP符号化技術の前記イントラ予測モードの前記符号化は、前記イントラ予測モードが最確モード(MPM)候補の前記リストの1つである場合、前記イントラ予測モードが平面モードであるかを判定することをさらに含む。いくつかの実施形態において、前記イントラ予測モードが前記平面モードであるかを前記ビットストリームにおいて第4構文要素として表現する。いくつかの実施形態において、前記MIP符号化技術の前記イントラ予測モードの前記符号化は、前記イントラ予測モードが前記平面モードでない場合、前記ビットストリーム表現における第5の構文要素として、前記イントラ予測モードのMPMインデックスを符号化することをさらに含む。いくつかの実施形態において、前記MIP符号化技術の前記イントラ予測モードの前記符号化は、前記イントラ予測モードが最確モード(MPM)候補のリストの一つでない場合、許容されたイントラモードのセットにおける前記イントラ予測モードのイントラモードインデックスを前記ビットストリーム表現における第6の構文要素として符号化することをさらに含む。
【0246】
いくつかの実施形態において、前記ビットストリーム表現において、第1、第2、第3、第4、第5又は第6の構文要素を条件付きで符号化する。いくつかの実施形態において、前記ブロックに前記MIP符号化技術を適用する場合、前記ビットストリーム表現において前記第1の構文要素を省略する。いくつかの実施形態において、intra_luma_ref_idx[x0][y0]==0の場合、前記第1の構文要素は前記ビットストリーム表現に含まれ、前記ブロックは前記ISP符号化技術又は前記MIP符号化技術を用いて符号化しない。いくつかの実施形態において、第1、第2、第3、第4、第5又は第6の要素の数値は前記ブロックの寸法又は前記ブロックに適用可能な符号化技術に基づく。いくつかの実施形態において、前記MIP符号化技術が前記ブロックに適用される場合、第3または第5の構文要素の前記値は、0または1であり、第3または第5の構文要素の値は、前記ブロックに他の符号化技術が適用される場合、[0,4]の両端を含む範囲内にある。いくつかの実施形態において、第6の構文要素の値は、前記ブロックに対して前記MIP符号化技術が適用されない場合、[0,60]の両端を含む範囲内にあり、第6の構文要素の前記値は、前記ブロックに対して前記MIP符号化技術が適用される場合、[0,31]の両端を含む範囲内にあり、第4の構文要素の前記値は、4×4の寸法を有する前記ブロックであり、第6の構文要素の前記値は、前記ブロックに対して前記MIP符号化技術が適用される場合、[0,15]の両端を含む範囲内にあり、前記ブロックは幅が8以下で高さが8以下であり、第6の構文要素の前記値は、異なる寸法を有する前記ブロックに対して前記MIP符号化技術が適用される場合、[0,8]の両端を含む範囲内にある。
【0247】
いくつかの実施形態において、前記1つ以上のイントラ符号化技術のイントラ符号化技術において用いられる構文要素のコンテキスト又は値は、前記イントラ符号化技術に基づいている。いくつかの実施形態において、異なるイントラ符号化技術は、異なるサイズの複数のMPMリストを用いる。いくつかの実施形態において、異なるイントラ符号化技術は、異なる数のMPM候補を用いる。いくつかの実施形態において、第1、第2、第3、第4、第5又は第6の要素は、前記ビットストリーム表現においてコンテキスト符号化されるか、またはバイパス符号化される。
【0248】
いくつかの実施形態において、1つ以上のコンテキストが、前記1つ以上のイントラ符号化技術に基づいて選択される。いくつかの実施形態において、前記ビットストリーム表現における構文要素を符号化するために2つのコンテキストが用いられる。いくつかの実施形態において、前記従来のイントラ予測符号化技術及び前記MIP符号化技術に第1のコンテキストが用いられ、前記ISP符号化技術に第2のコンテキストが用いられる。いくつかの実施形態において、第1のコンテキストは前記ISP符号化技術及び前記MIP符号化技術に用いられ、第2のコンテキストは1つ以上の他の符号化技術に用いられる。いくつかの実施形態において、前記ビットストリーム表現における構文要素を符号化するために3つのコンテキストが用いられる。いくつかの実施形態において、第1のコンテキストは前記MIP符号化技術に用いられ、第2のコンテキストは前記ISP符号化技術に用いられ、第3のコンテキストは1つ以上の他の符号化技術に用いられる。
【0249】
図28は、本技術に従った映像処理方法2800を示すフローチャートである。方法2800は、動作2810において、映像のブロックと前記映像のビットストリーム表現との変換のために、前記ブロックが特定の符号化技術を用いて符号化されている場合、正確に2つのイントラ予測モードが許容されることを判定することを含む。方法2800は、動作2820において、前記判定に基づいて前記変換を行うことをさらに含む。
【0250】
いくつかの実施形態において、前記特定の符号化技術は、イントラサブブロック分割(ISP)符号化技術、多重基準ライン(MRL)符号化技術、または行列ベースイントラ予測(MIP)符号化技術を含む。いくつかの実施形態において、前記正確に2つのイントラ予測モードは、最確モード(MPM)候補のリストにおける最初の2つのモードを含む。いくつかの実施形態において、前記2つのイントラ予測モードのみの第1モードは平面モードであり、前記2つのイントラ予測モードのみの第2モードは、最確モード(MPM)候補のリストから選択されるモードである。いくつかの実施形態において、第2モードは、前記MPM候補のリストから選択される非平面モードである。いくつかの実施形態において、前記ブロックが前記ISP符号化技術を用いて符号化されている場合、前記ビットストリーム表現において、MPM候補の前記リストにおいて予測モードを示すインデックスは省略されている。
【0251】
図29は、本技術に従った映像処理方法2900を示すフローチャートである。方法2900は、動作2910において、映像のブロックと前記映像のビットストリーム表現との変換のために、前記ブロックのサンプル又は前記ブロックの予め符号化された前記ブロックの1つ以上のサブパーティションのサンプルを用いて、前記ブロックのサブパーティションの予測を行うことを判定することを含む。ブロックは、ブロックを複数のサブパーティションに分割し、予め再構成されたサブパーティションに基づいて、各サブパーティションの予測を判定するイントラサブブロック分割(ISP)符号化技術を用いて符号化される。複数のサブパーティションは、第1のサブパーティションと、1つ以上の内部サブパーティションと、を含む。方法2900は、動作2920において、前記判定に基づいて前記変換を行うことをさらに含む。
【0252】
いくつかの実施形態において、前記ブロックは水平方向に分割され、前記内部サブパーティションの右上に位置するサンプルを利用して前記内部サブパーティションの内部サブパーティションを予測する。いくつかの実施形態において、前記ブロックは垂直方向に分割され、前記内部サブパーティションの左下に位置するサンプルを用いて前記1つ以上の内部サブパーティションの内部サブパーティションを予測する。いくつかの実施形態において、前記ブロックのサンプルは内部サブパーティションのサンプルとして用いられるようにコピーされる。いくつかの実施形態において、内部サブパーティションのサンプルは、前記ブロックのサンプルに基づいて導出される。いくつかの実施形態において、前記内部サブパーティションの前記サンプルはイントラ予測符号化技術を用いて導出される。いくつかの実施形態において、前記内部サブパーティションのサンプルを前記ブロックのサンプルの端数位置に投影する場合、双線形補間を適用する。いくつかの実施形態において、内部サブパーティションのサンプルを前記ブロックのサンプルの端数位置に投影する場合、前記端数位置は、前記端数位置に最も近い利用可能な位置の整数位置に丸められる。いくつかの実施形態において、前記内部サブパーティションの右上又は左下に位置する前記サンプルは、前記内部サブパーティションの予測に用いられる前にフィルタリングされる。
【0253】
図30は、本技術に従った映像処理方法3000を示すフローチャートである。方法3000は、ステップ3010において、映像の現在のブロックと前記映像のビットストリーム表現とを変換するために、最確モード(MPM)候補のリストの構築プロセスにおいて、現在のブロックにおける第1の近傍のブロックのセットが、予め符号化されたブロックの第2の近傍のブロックのセットと異なることを判定することを含む。前記現在のブロックは、複数の子ブロックに分割された親ブロックの子ブロックである。方法3000は、また、動作3020において、その判定に基づいて変換を行うことを含む。
【0254】
いくつかの実施形態において、前記現在のブロックは符号化ユニットを備える。いくつかの実施形態において、近傍のブロックの前記第1のセットは前記親ブロックを分割する態様により判定される。いくつかの実施形態において、前記親ブロックは水平に分割され、前記現在のブロックが前記親ブロックの第1の子ブロックでない場合、他の親ブロックの子ブロックである又は前記現在のブロックの右上に位置する近傍のブロックは、前記構築プロセスにおいて検査される。いくつかの実施形態において、前記親ブロックは水平に分割され、前記現在のブロックが前記親ブロックの第1の子ブロックでない場合、前記現在のブロックの上に位置する近傍のブロックのイントラ予測モードXは、前記ビットストリーム表現において、(X+off)又は(X+off)%Tと表現され、off、Tは整数である。
【0255】
いくつかの実施形態において、前記親ブロックは垂直方向に分割され、前記現在のブロックが親ユニットの第1の子ブロックでない場合、他の親ブロックの子ブロックである又は前記現在のブロックの左下に位置する近傍のブロックは、前記構築プロセスにおいて検査される。いくつかの実施形態において、前記親ブロックは垂直方向に分割され、前記現在のブロックが前記親ブロックの第1の子ブロックでない場合、前記現在のブロックの左側に位置する近傍のブロックのイントラ予測モードXは、前記ビットストリーム表現において、(X+off)又は(X+off)%Tと表現され、off及びTは整数である。
【0256】
いくつかの実施形態において、前記MPM候補の前記リストの構築プロセス中に、前記親ブロックの前記複数の子ブロックにアクセスすることはできない。いくつかの実施形態において、前記親ユニットの前記複数の子ブロックのイントラ予測モードは、MPM候補の前記リストから除外される。いくつかの実施形態において、前記親ブロックの前記複数の子ブロックのイントラ予測モードを異なるモードに置き換えることができる。
【0257】
いくつかの実施形態において、前記親ブロックの前記複数の子ブロックのイントラ予測モードを通知は、前記親ブロックを分割する態様に基づく。いくつかの実施形態において、前記ビットストリーム表現において、イントラ予測符号化技術を用いて符号化された子ブロックの前記イントラ予測モードが省略され、前記子ブロックの前記イントラ予測モードは非平面モードと見なされる。
【0258】
図31は、本技術に従った映像処理の方法3100を示すフローチャートである。方法3100は、動作3110において、映像スライスの映像ブロックと前記映像のビットストリーム表現との変換のために、前記映像ブロックに対して許可される分割タイプを、前記スライスに対してイントラサブブロック分割ツールが有効化されているかどうかに基づいて判定することを含む。方法3100は、また、動作3120において、その判定に基づいて変換を行うことを含む。
【0259】
いくつかの実施形態において、分割タイプはブロックの寸法により決められ、ISP符号化技術が有効化されているとき、分割タイプは無効化されている。いくつかの実施形態において、分割タイプはブロックの寸法に基づいており、分割タイプが有効化されている場合、ISP技術は無効化されている。
【0260】
いくつかの実施形態において、前記ブロックの分割は前記ブロックの水平方向又は垂直方向の分割を含む。いくつかの実施形態において、前記ブロックの分割は前記ブロックの2値又は3値分割を含む。いくつかの実施形態において、前記ブロックの寸法は4×8または8×4である。いくつかの実施形態において、ISP符号化技術が無効化されている場合、前記ビットストリーム表示において前記ISP符号化技術のサイド情報を省略することができる。いくつかの実施形態において、前記ブロックに対してデュアルツリー分割(Dual Tree Partition)が有効化されている。いくつかの実施形態において、単一ツリー分割は前記ブロックに対して有効化されている。
【0261】
いくつかの実施形態において、前記変換を行うことは、映像の前記ブロックに基づいてビットストリーム表現を生成することを含む。いくつかの実施形態において、変換を行うことは、ビットストリーム表現から映像の前記ブロックを生成することを含む。
【0262】
開示される技術のいくつかの実施形態は、映像処理ツールまたはモードを有効化するように決定または判定することを含む。一例において、映像処理ツールまたはモードが有効化される場合、エンコーダは、1つの映像ブロックを処理する際にこのツールまたはモードを使用するまたは実装するが、このツールまたはモードの使用に基づいて、結果として得られるビットストリームを必ずしも修正しなくてもよい。すなわち、映像のブロックから映像のビットストリーム表現への変換は、決定または判定に基づいて映像処理ツールまたはモードが有効化される場合に、この映像処理ツールまたはモードを使用する。別の例において、映像処理ツールまたはモードが有効化される場合、デコーダは、ビットストリームが映像処理ツールまたはモードに基づいて修正されたことを知って、ビットストリームを処理する。すなわち、決定または判定に基づいて有効化された映像処理ツールまたはモードを使用して、映像のビットストリーム表現から映像のブロックへの変換を行う。
【0263】
開示される技術のいくつかの実施形態は、映像処理ツールまたはモードを無効化するように決定または判定することを含む。一例において、映像処理ツールまたはモードが無効にされている場合、エンコーダは、映像のブロックを映像のビットストリーム表現に変換する際に、このツールまたはモードを使用しない。別の例において、映像処理ツールまたはモードが無効にされている場合、デコーダは、決定または判定に基づいて有効化された映像処理ツールまたはモードを使用してビットストリームが修正されていないことを知って、ビットストリームを処理する。
【0264】
本明細書に記載された開示された、およびその他の解決策、実施例、実施形態、モジュール、および機能動作の実装形態は、本明細書に開示された構造およびその構造的等価物を含め、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、またはそれらの1つ以上の組み合わせで実施してもよい。開示された、およびその他の実施形態は、1つ以上のコンピュータプログラム製品、たとえば、データ処理装置によって実装されるため、またはデータ処理装置の動作を制御するために、コンピュータ可読媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実施することができる。このコンピュータ可読媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝播信号をもたらす物質の組成物、またはこれらの1つ以上の組み合わせであってもよい。「データ処理装置」という用語は、例えば、プログラマブル処理装置、コンピュータ、または複数の処理装置、若しくはコンピュータを含む、データを処理するためのすべての装置、デバイス、および機械を含む。この装置は、ハードウェアの他に、当該コンピュータプログラムの実行環境を作るコード、例えば、処理装置ファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはこれらの1つ以上の組み合わせを構成するコードを含むことができる。伝播信号は、人工的に生成した信号、例えば、機械で生成した電気、光、または電磁信号であり、適切な受信装置に送信するための情報を符号化するために生成される。
【0265】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる)は、コンパイルされた言語または解釈された言語を含む任意の形式のプログラミング言語で記述することができ、また、それは、スタンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、成分、サブルーチン、または他のユニットとして含む任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えば、マークアップ言語文書に格納された1つ以上のスクリプト)に記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよいし、複数の調整ファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部を格納するファイル)に記憶されていてもよい。1つのコンピュータプログラムを、1つのサイトに位置する1つのコンピュータ、または複数のサイトに分散され通信ネットワークによって相互接続される複数のコンピュータで実行させるように展開することも可能である。
【0266】
本明細書に記載された処理およびロジックフローは、入力データ上で動作し、出力を生成することによって機能を実行するための1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブル処理装置によって行うことができる。処理およびロジックフローはまた、特定用途のロジック回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって行うことができ、装置はまた、特別目的のロジック回路として実装することができる。
【0267】
コンピュータプログラムの実行に適した処理装置は、例えば、汎用および専用マイクロ処理装置の両方、並びに任意の種類のデジタルコンピュータの任意の1つ以上の処理装置を含む。一般的に、処理装置は、リードオンリーメモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信する。コンピュータの本質的な要素は、命令を実行するための処理装置と、命令およびデータを記憶するための1つ以上のメモリデバイスとである。一般的に、コンピュータは、データを記憶するための1つ以上の大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれらの大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、およびメモリデバイスを含み、例えば、EPROM、EEPROM、フラッシュ記憶装置、磁気ディスク、例えば内部ハードディスクまたはリムーバブルディスク、光磁気ディスク、およびCD-ROMおよびDVD-ROMディスク等の半導体記憶装置を含む。処理装置およびメモリは、特定用途のロジック回路によって補完されてもよく、または特定用途のロジック回路に組み込まれてもよい。
【0268】
本特許明細書は多くの詳細を含むが、これらは、任意の主題の範囲または特許請求の範囲を限定するものと解釈されるべきではなく、むしろ、特定の技術の特定の実施形態に特有であり得る。特徴の説明と解釈されるべきである本特許文献において別個の実施形態のコンテキストで説明されている特定の特徴は、1つの例において組み合わせて実装してもよい。逆に、1つの例のコンテキストで説明された様々な特徴は、複数の実施形態において別個にまたは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが、主張された組み合わせからの1つ以上の特徴は、場合によっては、組み合わせから抜粋されることができ、主張された組み合わせは、サブコンビネーションまたはサブコンビネーションのバリエーションに向けられてもよい。
【0269】
同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成するために、このような動作が示された特定の順番でまたは連続した順番で行われること、または示された全ての動作が行われることを必要とするものと理解されるべきではない。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。
【0270】
いくつかの実装形態および例のみが記載されており、この特許文献に記載され図示されているコンテンツに基づいて、他の実施形態、拡張および変形が可能である。