(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-04
(45)【発行日】2024-03-12
(54)【発明の名称】変換スキップモードのためのコンテキスト符号化
(51)【国際特許分類】
H04N 19/13 20140101AFI20240305BHJP
H04N 19/136 20140101ALI20240305BHJP
H04N 19/176 20140101ALI20240305BHJP
H04N 19/70 20140101ALI20240305BHJP
【FI】
H04N19/13
H04N19/136
H04N19/176
H04N19/70
(21)【出願番号】P 2021561874
(86)(22)【出願日】2020-04-17
(86)【国際出願番号】 US2020028808
(87)【国際公開番号】W WO2020214980
(87)【国際公開日】2020-10-22
【審査請求日】2021-10-15
(31)【優先権主張番号】PCT/CN2019/083366
(32)【優先日】2019-04-19
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】520477474
【氏名又は名称】バイトダンス インコーポレイテッド
【氏名又は名称原語表記】BYTEDANCE INC.
【住所又は居所原語表記】12655 West Jefferson Boulevard, Sixth Floor, Suite No. 137 Los Angeles, California 90066 United States of America
(74)【代理人】
【識別番号】110002000
【氏名又は名称】弁理士法人栄光事務所
(72)【発明者】
【氏名】ジュー ウェイジャ
(72)【発明者】
【氏名】ジャン リー
(72)【発明者】
【氏名】シュー ジジョン
【審査官】岩井 健二
(56)【参考文献】
【文献】国際公開第2020/180102(WO,A1)
【文献】Marta Karczewicz and Muhammed Coban,CE8-related: Sign context modelling and level mapping for TS residual coding,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-N0455,2019年03月21日
【文献】Benjamin Bross, et al.,Versatile Video Coding (Draft 5),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 ,JVET-N1001-v2,2019年04月12日,pp.34-36, 56-57
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
映像データの処理の方法であって、
映像データの映像領域における現在の映像ブロックと、前記映像データのビットストリームとの間の変換のために、前記現在の映像ブロックに対する変換スキップモードを用いるか否かを決定することであって、前記変換スキップモードを用いることに応じて、変換は、前記現在の映像ブロックと参照映像ブロックとの間の予測残差にてスキップされる、ことと、
前記変換スキップモードを用いることに応じて、前記現在の映像ブロックにおける1または複数の近傍の係数の1または複数の符号フラグに従って、前記現在の映像ブロックの現在の係数に対する符号フラグのコンテキス
トを選択することと、
前記現在の映像ブロックが、輝度成分および少なくとも1つの彩度成分が別個の分割ツリー構造を有するデュアルツリー構造にあるか否かに基づいて、前記現在の映像ブロックにおいてクロスコンポーネント線形モデル予測モードを有効にするか、無効にするかを決定することであって、前記現在の映像ブロックに対して前記クロスコンポーネント線形モデル予測モードが有効にされたことに応じて、前記現在の映像ブロックの彩度サンプルは、線形モデルを用いることによって、前記映像領域の再構成された輝度サンプルに基づいて予測される、ことと、
前記選択すること、および複数の前記決定することに基づいて、前記変換を実行することと、
を有する方法。
【請求項2】
前記現在の映像ブロックにおける前記1または複数の近傍の係数は、左の近傍の係数または上の近傍の係数の少なくとも1つを含む、請求項1に記載の方法。
【請求項3】
前記現在の映像ブロックにおける前記1または複数の近傍の係数は、左の近傍の係数および上の近傍の係数を含む、請求項1または2に記載の方法。
【請求項4】
前記現在の係数に対する前記符号フラグの前記コンテキス
トは、以下の規則に従って、前記1または複数の近傍の係数の前記1または複数の符号フラグに基づき、
前記近傍の係数の対の符号フラグが両方とも負である場合、前記規則は、第1のコンテキス
トを選択することを規定する、
請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記現在の係数に対する前記符号フラグの前記コンテキス
トは、以下の規則に従って、前記近傍の係数の前記1または複数の符号フラグに基づき、
前記近傍の係数の対の1つの符号フラグが正である場合、前記規則は、第2のコンテキス
トを選択することを規定する、
請求項1~3のいずれか一項に記載の方法。
【請求項6】
前記現在の係数に対する前記符号フラグの前記コンテキス
トは、以下の規則に従って、前記近傍の係数の前記1または複数の符号フラグに基づき、
前記1または複数の近傍の係数の対のフラグが両方とも正である場合、前記規則は、第3のコンテキス
トを選択することを規定する、
請求項1~3のいずれか一項に記載の方法。
【請求項7】
前記現在の係数の前記符号フラグの前記コンテキス
トと、前記1または複数の近傍の係数の1または複数の符号フラグとの間の関係は、
C=(L+A)
で表され、
Cは、前記現在の係数の前記符号フラグの前記コンテキス
トのコンテキスト識別子であり、
Lは、前記現在の係数の左の近傍の係数の符号フラグであり、
Aは、前記現在の係数の上の近傍の係数の符号フラグである、
請求項1~3のいずれか一項に記載の方法。
【請求項8】
前記現在の係数に対する前記符号フラグの前記コンテキス
トは更に、前記現在の係数の位置に基づく、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記変換スキップモードが前記現在の映像ブロックに適用するか否かを示す第1の構文要素は、前記ビットストリームに条件付きで含まれる、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記第1の構文要素が前記ビットストリームに含まれるか否かは、前記現在の映像ブロックのブロック寸法に基づく、請求項9に記載の方法。
【請求項11】
前記第1の構文要素が前記ビットストリームに含まれるか否かは、前記現在の映像ブロックのコーディングツリー構造に基づく、請求項9に記載の方法。
【請求項12】
前記第1の構文要素は、前記現在の映像ブロックがシングルツリー構造にあることの条件を含む条件下で、前記ビットストリームに含まれる、請求項11に記載の方法。
【請求項13】
前記第1の構文要素は、前記現在の映像ブロックがデュアルツリー構造にあることの条件を含む条件下で、前記ビットストリームに含まれる、請求項11に記載の方法。
【請求項14】
前記第1の構文要素は、前記現在の映像ブロックがデュアルツリー彩度構造にないことの条件を含む条件下で、前記ビットストリームに含まれる、請求項11に記載の方法。
【請求項15】
前記変換スキップモードに対して使用される最大許容ブロックサイズを示す第2の構文要素は、前記ビットストリームに含まれる、請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記変換は、前記現在の映像ブロックを前記ビットストリームに符号化することを含む、請求項1~15のいずれか一項に記載の方法。
【請求項17】
前記変換は、前記現在の映像ブロックを前記ビットストリームに復号化することを含む、請求項1~15のいずれか一項に記載の方法。
【請求項18】
プロセッサと、命令を有する非一時的メモリを有する、映像データの処理のための装置であって、
前記命令が前記プロセッサにより実行されることで、前記プロセッサに、
映像データの映像領域における現在の映像ブロックと、前記映像データのビットストリームとの間の変換のために、前記現在の映像ブロックに対する変換スキップモードを用いるか否かを決定することであって、前記変換スキップモードを用いることに応じて、変換は、前記現在の映像ブロックと参照映像ブロックとの間の予測残差にてスキップされる、ことと、
前記変換スキップモードを用いることに応じて、前記現在の映像ブロックにおける1または複数の近傍の係数の1または複数の符号フラグに従って、前記現在の映像ブロックの現在の係数に対する符号フラグのコンテキス
トを選択することと、
前記現在の映像ブロックが、輝度成分および少なくとも1つの彩度成分が別個の分割ツリー構造を有するデュアルツリー構造にあるか否かに基づいて、前記現在の映像ブロックにおいてクロスコンポーネント線形モデル予測モードを有効にするか、無効にするかを決定することであって、前記現在の映像ブロックに対して前記クロスコンポーネント線形モデル予測モードが有効にされたことに応じて、前記現在の映像ブロックの彩度サンプルは、線形モデルを用いることによって、前記映像領域の再構成された輝度サンプルに基づいて予測される、ことと、
前記選択すること、および複数の前記決定することに基づいて、前記変換を実行することと、
を実行させる装置。
【請求項19】
コンピュータに、
映像データの映像領域における現在の映像ブロックと、前記映像データのビットストリームとの間の変換のために、前記現在の映像ブロックに対する変換スキップモードを用いるか否かを決定することであって、前記変換スキップモードを用いることに応じて、変換は、前記現在の映像ブロックと参照映像ブロックとの間の予測残差にてスキップされる、ことと、
前記変換スキップモードを用いることに応じて、前記現在の映像ブロックにおける1または複数の近傍の係数の1または複数の符号フラグに従って、前記現在の映像ブロックの現在の係数に対する符号フラグのコンテキス
トを選択することと、
前記現在の映像ブロックが、輝度成分および少なくとも1つの彩度成分が別個の分割ツリー構造を有するデュアルツリー構造にあるか否かに基づいて、前記現在の映像ブロックにおいてクロスコンポーネント線形モデル予測モードを有効にするか、無効にするかを決定することであって、前記現在の映像ブロックに対して前記クロスコンポーネント線形モデル予測モードが有効にされたことに応じて、前記現在の映像ブロックの彩度サンプルは、線形モデルを用いることによって、前記映像領域の再構成された輝度サンプルに基づいて予測される、ことと、
前記選択すること、および複数の前記決定することに基づいて、前記変換を実行することと、
を実行させる命令を格納した非一時的コンピュータ可読記憶媒体。
【請求項20】
映像のビットストリームを格納するための方法であって、
映像データの映像領域における現在の映像ブロックに対して変換スキップモードを用いるか否かを決定することであって、前記変換スキップモードを用いることに応じて、変換は、前記現在の映像ブロックと参照映像ブロックとの間の予測残差にてスキップされる、ことと、
前記変換スキップモードを用いることに応じて、前記現在の映像ブロックにおける1または複数の近傍の係数の1または複数の符号フラグに従って、前記現在の映像ブロックの現在の係数に対する符号フラグのコンテキス
トを選択することと、
前記現在の映像ブロックが、輝度成分および少なくとも1つの彩度成分が別個の分割ツリー構造を有するデュアルツリー構造にあるか否かに基づいて、前記現在の映像ブロックにおいてクロスコンポーネント線形モデル予測モードを有効にするか、無効にするかを決定することであって、前記現在の映像ブロックに対して前記クロスコンポーネント線形モデル予測モードが有効にされたことに応じて、前記現在の映像ブロックの彩度サンプルは、線形モデルを用いることによって、前記映像領域の再構成された輝度サンプルに基づいて予測される、ことと、
前記選択すること、および複数の前記決定することに基づいて、前記映像データの前記ビットストリームを生成することと、
前記ビットストリームを、非一時的コンピュータ可読記録媒体に格納することと、
を有する方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2019年4月19日出願の国際特許出願第PCT/CN2019/083366号の優先権および利益を主張する、2020年4月17日出願の国際特許出願第PCT/US2020/028808号の国内段階である。上記出願の開示全体は参照により、本明細書として援用される。
【0002】
本明細書は、映像および画像の符号化および復号化の技術、システム、および装置に関する。
【背景技術】
【0003】
デジタル映像は、インターネットおよび他のデジタル通信ネットワークにおいて最大の帯域幅の使用量を占めている。映像を受信および表示することが可能である接続されたユーザ機器の数が増加するにつれ、デジタル映像の使用に対する帯域幅需要は増大し続けることが予測される。
【発明の概要】
【0004】
デジタル映像符号化、具体的には、映像符号化のための変換スキップモードにおける係数符号化に関するデバイス、システム、および方法について記載する。記載した方法は、既存の映像符号化規格(例えば、HEVC(High Efficiency Video Coding))および将来の映像符号化規格(例えば、VCC(Versatile Video Coding))またはコーデックの両方に適用することができる。
【0005】
1つの例示的な態様において、ビジュアルメディア処理のための方法が開示される。方法は、ビジュアルメディアデータの映像領域内の1または複数の映像ブロックを前記ビジュアルメディアデータのビットストリーム表現に符号化するために、変換を適用することなく、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差がビットストリーム表現で表現されるように、1または複数の映像ブロックの現在の映像ブロックを変換スキップモードを使用して符号化することができる最大許容寸法を判定することと、ビットストリーム表現に最大許容寸法を示す構文要素を含めることと、を有する。
【0006】
別の例示的な態様において、ビジュアルメディア処理方法が開示される。方法は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から、構文要素の構文解析を行うことであって、構文要素は、変換を適用することなく、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差をビットストリーム表現において表現する変換スキップモードを使用して、1または複数の映像ブロックの現在の映像ブロックを符号化することができる最大許容寸法を示す、ことと、最大許容寸法に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成することと、を有する。
【0007】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、変換スキップモードを使用してビジュアルメディアデータの現在の映像ブロックを符号化することを判定することと、決定に基づいて、現在の映像ブロックとビジュアルメディアデータのビットストリーム表現との間の変換を実行することと、を有し、変換の間、現在の映像ブロックは、複数の係数グループに分割され、複数の係数グループのうちの少なくとも1つの係数グループのための符号化ブロックフラグの信号通知がビットストリーム表現において排除され、変換スキップモードにおいて、変換を適用することなく、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、ビットストリーム表現にて表現される。
【0008】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、変換スキップモードを使用してビジュアルメディアデータの現在の映像ブロックを符号化することを判定することと、決定に基づいて、現在の映像ブロックとビジュアルメディアデータのビットストリーム表現との間の変換を行うことと、を有し、変換の間、現在の映像ブロックは複数の係数グループに分割され、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずにビットストリーム表現にて表現され、さらに、変換の間、ビットストリーム表現における指示に、少なくとも部分的に基づいて、複数の係数グループの係数走査順序が判定される。
【0009】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、ビジュアルメディアデータの映像領域内の現在の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、変換を適用せずに、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差がビットストリーム表現で表現される変換スキップモードを用いることと、現在の映像ブロックを複数の係数グループに分割することに基づいて、現在の映像ブロックに関連付けられた係数グループにおける1または複数の近傍の映像ブロックの符号フラグに従って、現在の映像ブロックの符号フラグのコンテキストを選択することと、を有する。
【0010】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、変換を適用せずに、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差がビットストリーム表現で表現される変換スキップモードにおいて使用される符号フラグのコンテキストを識別ために、現在の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現を構文解析することと、符号フラグのコンテキストが、現在の映像ブロックを複数の係数グループに分割することに基づいて、現在の映像ブロックに関連付けられた係数グループにおける1または複数の近傍の映像ブロックの符号フラグに従うように、ビットストリーム表現から復号化された映像領域を生成することと、を有する。
【0011】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、現在の映像ブロックが複数の係数位置に分割される場合、ビジュアルメディアデータの現在の映像ブロックに関連付けられた現在の係数の位置を判定することと、少なくとも1または複数の近傍の係数の符号フラグに基づいて、現在の係数の符号フラグのコンテキストを導出することと、コンテキストに基づいて、現在の係数の符号フラグを生成することであって、現在の係数の符号フラグは、変換を適用せずに現在の映像ブロックを符号化する変換スキップモードにおいて使用される、こととを有する。
【0012】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、ビジュアルメディアデータの映像領域内の1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、現在の映像ブロックに対して彩度変換スキップモードが適用可能である少なくとも1つの規則を満たすことに基づいて判定することであって、彩度変換スキップモードにおいて、前記現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずに前記ビジュアルメディアデータの前記ビットストリーム表現にて表される、ことと、前記ビットストリーム表現に彩度変換スキップモードを示す構文要素を含めることと、を有する。
【0013】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、彩度変換スキップモードの適用に関連づけられた少なくとも1つの規則が満たされる、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から、構文要素を構文解析することであって、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずにビジュアルメディアデータのビットストリーム表現で表わされる、ことと、1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成することと、を有する。
【0014】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するため、条件に基づいて現在の映像ブロックに変換スキップモードの選択的適用に関する決定を行うことと、ビットストリーム表現に、条件を示す構文要素を含めることとを有し、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずにビジュアルメディアデータのビットストリーム表現にて表現される。
【0015】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から、構文要素を構文解析することであって、構文要素は、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずにビットストリーム表現にて表される変換スキップモードの使用に関する条件を示す、ことと、条件に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成することと、を有する。
【0016】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、ビットストリーム表現における変換スキップモードの指示に基づき、QR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)技術の選択的適用に関する決定を行うことであって、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずにビジュアルメディアデータのビットストリーム表現にて表現され、QR-BDPCM技術において、水平方向および/または垂直方向の予測誤差の残差が量子化およびエントロピー符号化される、ことと、QR-BDPCM技術の選択的適用の指示をビットストリーム表現に含めることと、を有する。
【0017】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析することであって、構文要素は、ビットストリーム表現における変換スキップモードの指示に基づいて、QR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)技術の選択的適用を示し、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずにビジュアルメディアデータのビットストリーム表現で表され、QR-BDPCM技術において、水平方向および/または垂直方向の予測誤差の残差が量子化およびエントロピー符号化される、ことと、最大許容寸法に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成することと、を有する。
【0018】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、条件に基づいて別個のまたはデュアルツリーの選択的適用に関する決定を行うことと、ビットストリーム表現に、別個のまたはデュアルツリーの選択的適用を示す構文要素を含めることと、を有する。
【0019】
さらに別の例示的な態様では、ビジュアルメディア処理の方法が開示される。方法は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析することであって、構文要素は、条件に基づくまたは推論される別個のまたはデュアルツリーの選択的適用を示す、ことと、構文要素に従って、1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成することと、を有する。
【0020】
さらに別の例示的な態様において、上述された方法を実装するように構成されたプロセッサを備える映像エンコーダまたはデコーダ装置が開示される。
【0021】
別の例示的な態様において、コンピュータ可読プログラム媒体が開示される。媒体は、開示された方法のうちの1つを実装するためのプロセッサ実行可能命令を実装するコードを記憶する。
【0022】
これらの、および他の態様は、本明細書でさらに説明される。
【図面の簡単な説明】
【0023】
【
図2】パレットモードで符号化されたブロックの例を示す。
【
図3】パレットエントリを信号通知するためにパレット予測子を使用する例を示す。
【
図4】水平方向および垂直方向の横断走査の例を示す。
【
図6】マルチタイプのツリー分割モードの例を示す。
【
図7】CCLM(Cross-Component Linear Model)予測モードにおいてパラメータを導出するために使用されるサンプルの例を示す。
【
図8】彩度スケーリングを用いた輝度マッピングのための例示的なアーキテクチャを示す。
【
図9A】映像処理方法の例を示すフローチャートである。
【
図9B】映像処理方法の例を示すフローチャートである。
【
図9C】映像処理方法の例を示すフローチャートである。
【
図9D】映像処理方法の例を示すフローチャートである。
【
図9E】映像処理方法の例を示すフローチャートである。
【
図10】本特許明細書に記載されるビジュアルメディアの復号化またはビジュアルメディアの符号化技術を実現するためのハードウェアプラットフォームの一例を示すブロック図である。
【
図11】開示された技術を実装することができる例示的な映像処理システムを示すブロック図である。
【
図12】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図13】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図14】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図15】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図16】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図17】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図18】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図19】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図20】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図21】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図22】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図23】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図24】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図25】ビジュアルメディア処理方法の一例を示すフローチャートである。
【
図26】ビジュアルメディア処理方法の一例を示すフローチャートである。
【発明を実施するための形態】
【0024】
本明細書は、伸張または復号化されたデジタル映像または画像の品質を向上させるために、画像または映像ビットストリームのデコーダによって使用できる様々な技術を提供する。簡潔にするために、本明細書では、用語「映像」は、一連のピクチャ(従来から映像と呼ばれる)および個々の画像の両方を含むように使用される。さらに、映像エンコーダは、さらなる符号化に使用される復号化されたフレームを再構成するために、符号化の処理中にこれらの技術を実装してもよい。
【0025】
本明細書では、理解を容易にするために章の見出しを使用しており、1つの章に開示された実施形態をその章にのみ限定するものではない。このように、ある章の実施形態は、他の章の実施形態と組み合わせることができる。
【0026】
1.発明の概要
【0027】
本願は、映像符号化/復号化技術に関する。具体的には、映像符号化における変換スキップモードにおける係数符号化に関する。HEVCのような既存の映像符号化規格に適用してもよいし、規格(Versatile Video Coding)を確定させるために適用してもよい。本発明は、将来の映像符号化規格または映像コーデックにも適用可能であってよい。
【0028】
2.初期の協議
【0029】
映像符号化規格は、主に周知のITU-TおよびISO/IEC規格の開発によって発展してきた。ITU-TはH.261とH.263を作り、ISO/IECはMPEG-1とMPEG-4 Visualを作り、両団体はH.262/MPEG-2 VideoとH.264/MPEG-4 AVC(Advanced Video Coding)とH.265/HEVC規格を共同で作った[1,2]。H.262以来、映像符号化規格は、時間的予測と変換符号化が利用されるハイブリッド映像符号化構造に基づく。HEVCを超えた将来の映像符号化技術を探索するため、2015年には、VCEGとMPEGが共同でJVET(Joint Video Exploration Team)を設立した。それ以来、多くの新しい方法がJVETによって採用され、JEM(Joint Exploration Mode)と呼ばれる参照ソフトウェアに組み込まれてきた。2018年4月には、VCEG(Q6/16)とISO/IEC JTC1 SC29/WG11(MPEG)の間にJVET(Joint Video Expert Team)が発足し、HEVCと比較して50%のビットレート削減を目標にVVC規格の策定に取り組んでいる。
【0030】
VVCドラフトの最新バージョン、即ち、Versatile Video Coding(ドラフト4)は、以下を参照することができる。
【0031】
http://phenix.it-sudparis.eu/jvet/doc_end_user/current_document.php?id=5755
【0032】
VTMと呼ばれるVVCの最新の参照ソフトウェアは、以下で確認することができる。
【0033】
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-4.0
【0034】
イントラブロックコピー
【0035】
IBC(Intra Block Copy)、別名、現在のピクチャの参照(Current Picture Referencing)は、HEVC-SCC(HEVC Screen Coding extensions)と現在のVVCテストモデル(VTM-4.0)に採用されている。IBCは、動き補償の概念をインターフレーム符号化からイントラフレーム符号化に拡張する。
図1に示すように、現在のブロックは、IBCが適用される場合、同じピクチャ内の参照ブロックによって予測される。現在のブロックを符号化または復号化する前に、参照ブロックにおけるサンプルは既に再構成されていなければならない。IBCは、カメラでキャプチャされたほとんどのシーケンスに対してそれほど効率的ではないが、スクリーンコンテンツに対しては、有意な符号化利得を示す。その理由は、スクリーンコンテンツピクチャにおいて、アイコンや文字等の繰り返しパターンが多いためである。IBCは、これらの繰り返しパターン間の冗長性を有効に除去することができる。HEVC-SCCにおいて、インター符号化符号ユニット(CU:Coding Unit)は、現在のピクチャをその参照ピクチャとして選択する場合、IBCを適用することができる。この場合、MVはBV(Block Vector)と改称し、BVは常に整数画素精度を有する。メインプロファイルHEVCに適合するように、現在のピクチャは、DPB(Decoded Picture Buffer)における「長期」参照ピクチャとしてマークされる。なお、同様に、複数のビュー/3D映像符号化規格において、イントラビュー参照ピクチャも「長期」参照ピクチャとしてマークされる。
【0036】
BVがその参照ブロックを見つけた後、参照ブロックをコピーすることで予測を生成することができる。残差は、元の信号から参照画素を減算することによって得ることができる。そして、他の符号化モードと同様に、変換および量子化を適用することができる。
【0037】
しかしながら、参照ブロックがピクチャの外にある場合、または現在のブロックと重複する場合、または再構成された領域の外にある場合、または何らかの制約によって制限された有効領域の外にある場合、画素値の一部または全部は定義されない。基本的に、このような問題に対処するために2つの解決策がある。1つは、このような状況、例えばビットストリーム適合性を許可しないことである。もう1つは、これらの未定義の画素値にパディングを適用することである。以下のサブセッションでは、解決策を詳細に説明する。
【0038】
HEVCスクリーンコンテンツ符号化拡張機能におけるIBC
【0039】
HEVCのスクリーンコンテンツ符号化拡張機能において、ブロックが現在のピクチャを参照として使用する場合、以下の仕様のテキストに示すように、参照ブロック全体が利用可能な再構成された領域内にあることを保証すべきである。
【0040】
変数offsetXおよびoffsetYは、以下のように導出される。
offsetX=(ChromaArrayType==0)?0:(mvCLX[0]&0x7?2:0) (8-106)
offsetY=(ChromaArrayType==0)?0:(mvCLX[1]&0x7?2:0) (8-107)
【0041】
参照ピクチャが現在のピクチャである場合、輝度動きベクトルmvLXは、以下の制約に従うべきであることが、ビットストリーム適合性の要件である。
-6.4.1節で規定されたようにz走査順序ブロックの可用性に対する導出処理は、(xCb,yCb)に等しく設定された(xCurr,yCurr)、および、(xPb+(mvLX[0]>>2)-offsetX,yPb+(mvLX[1]>>2)-offsetY)に等しく設定された近傍の輝度位置(xNbY,yNbY)を入力として呼び出されると、出力は真となる。
-6.4.1項で規定されたようにz走査順序ブロックの可用性に対する導出処理は、(xCb.yCb)に等しく設定された(xCurr,yCurr)、および、(xPb+(mvLX[0]>>2)+nPbW-1+offsetX,yPb+(mvLX[1]>>2)+nPbH-1+offsetY)に等しく設定された近傍の輝度位置(xNbY,yNbY)を入力として呼び出されると、出力は真となる。
-次の条件の一方または両方が真となる。
-(mvLX[0]>>2)+nPbW+xB1+offsetXの値が0以下である。
-(mvLX[1]>>2)+nPbH+yB1+offsetYの値が0以下である。
-次の条件が真となる。
(xPb+(mvL[0]>>2)+nPbSw-1+offsetX)/CtbSizeY-xCurr/CtbSizeY<=yCurr/CtbSizeY-(yPb+(mvLX[1]>>2)+nPbSh-1+offsetY)/CtbSizeY (8-108)
【0042】
このように、参照ブロックが現在のブロックと重複するケース、または参照ブロックがピクチャの外にあるケースは発生しない。参照ブロックまたは予測ブロックを埋める必要がない。
【0043】
VVCテストモデルにおけるIBC
【0044】
現在のVVCテストモデル、すなわち、VTM-4.0設計において、参照ブロック全体は現在のCTU(Coding Tree Unit)を有するべきであり、現在のブロックと重複しない。よって、参照または予測ブロックを埋める必要がない。IBCフラグは、現在のCUの予測モードとして符号化される。このように、各CUに対して、MODE_INTRA、MODE_INTER、およびMODE_IBCという全部で3つの予測モードが存在する。
【0045】
IBCマージモード
【0046】
IBCマージモードにおいて、IBCマージ候補リストにおけるエントリを指すインデックスがビットストリームから構文解析される。IBCマージリストの構築は、以下のステップのシーケンスに従ってまとめることができる。
【0047】
ステップ1:空間的候補の導出
【0048】
ステップ2:HMVP候補の挿入
【0049】
ステップ3:ペアワイズ平均候補の挿入
【0050】
空間的マージ候補の導出において、位置A1、B1、B0、A0およびB2にある候補の中から、最大4つのマージ候補が選択される。導出の順序は、A1、B1、B0、A0、B2である。位置A1、B1、B0、A0のいずれかのPUが利用可能でない場合(例えば、別のスライスまたはタイルに属しているため)、またはIBCモードで符号化されていない場合にのみ、位置B2が考慮される。位置A1の候補を加えた後、残りの候補を挿入した後、符号化効率を向上させるように、同じ動き情報を有する候補を確実にリストから排除する冗長性チェックを行う。
【0051】
空間的候補を挿入した後、IBCマージリストサイズが依然として最大IBCマージリストサイズより小さい場合、HMVPテーブルからのIBC候補を挿入してよい。HMVP候補の挿入の際に、冗長性チェックが行われる。
【0052】
最後に、ペアワイズ平均候補がIBCマージリストに挿入される。
【0053】
マージ候補によって特定される参照ブロックが、ピクチャの外にある場合、または現在のブロックと重複する場合、または再構成された領域の外にある場合、または何らかの制約によって制限された有効領域の外にある場合、マージ候補は無効なマージ候補と呼ばれる。
【0054】
なお、無効なマージ候補はIBCマージリストに挿入されてもよい。
【0055】
IBC AMVPモード
【0056】
IBC AMVPモードにおいて、IBC AMVPリストにおけるエントリを指すAMVPインデックスが、ビットストリームから構文解析される。IBC AMVPリストの構築は、以下のステップのシーケンスに従ってまとめることができる。
【0057】
ステップ1:空間的候補の導出
【0058】
利用可能な候補が見つかるまで、A0,A1をチェックする。
【0059】
利用可能な候補が見つかるまで、B0、B1、B2をチェックする。
【0060】
ステップ2:HMVP候補の挿入
【0061】
ステップ3:ゼロ候補の挿入
【0062】
空間的候補を挿入した後、IBC AMVPリストサイズが依然として最大IBC AMVPリストサイズより小さい場合、HMVPテーブルからのIBC候補が挿入されてよい。
【0063】
最後に、ゼロ候補がIBC AMVPリストに挿入される。
【0064】
AMVR(Adaptive Motion Vector Resoltion)
【0065】
HEVCにおいて、スライスヘッダにおいてuse_integer_mv_flagが0である場合、1/4輝度サンプルの単位で、(動きベクトルとCUの予測動きベクトルとの間の)MVD(Motion Vector Difference)が信号通知される。VVCにおいて、CUレベルのAMVR(Adaptive Motion Vector Resolution)方式が導入される。AMVRは、CUのMVDを異なる精度で符号化することを可能にする。現在のCUに対するモード(通常のAMVPモードまたはアフィンAVMPモード)に基づいて、現在のCUのMVDは、以下のように適応的に選択され得る。
-通常AMVPモード:1/4輝度サンプル、整数輝度サンプル、または4輝度サンプル。
-アフィンAMVPモード:1/4輝度サンプル、整数輝度サンプル、または1/16輝度サンプル。
【0066】
現在のCUが少なくとも1つの非ゼロMVD成分を有する場合、CUレベルMVD解像度指示が条件付きで通知される。すべてのMVD成分(すなわち、参照リストL0および参照リストL1の水平および垂直MVDの両方)がゼロである場合、1/4輝度サンプルMVD解像度が推測される。
【0067】
少なくとも1つの非ゼロMVD成分を有するCUの場合、第1のフラグが、1/4輝度サンプルMV精度がCUに対して使用されるか否かを示すために信号通知される。第1のフラグが0である場合、さらなる信号伝達は必要とされず、現在のCUに対し1/4輝度サンプルMVD精度が使用される。そうでない場合、第2のフラグが、通常のAMVP CUに対して整数輝度サンプルまたは4輝度サンプルのMVD精度が使用されるかどうかを示すために通知される。同じ第2のフラグは、整数輝度サンプルまたは1/16輝度サンプルのMVD精度がアフィンAMVP CUに対して使用されるかどうかを示すために使用される。再構成MVが意図された精度(1/4輝度サンプル、整数輝度サンプル、または4輝度サンプル)を有することを保証するために、CUに対する動きベクトル予測モジュールは、MVDに加算される前に、MVDと同じ精度に丸められる。動きベクトル予測子はゼロに向かって丸める(すなわち、負の動きベクトル予測子は正の無限大に向かって丸められ、正の動きベクトル予測子は負の無限大に向かって丸められる)。
【0068】
エンコーダは、RDチェックを使用して、現在のCUに対する動きベクトルの解像度を決定する。各MVD解像度に対してCUレベルのRDチェックを常に3回実行することを回避するために、VTM4では、1/4輝度サンプル以外のMVD精度のRDチェックは、条件付きでのみ呼び出される。通常のAVMPモードの場合、まず、1/4輝度サンプルMVD精度および整数輝度サンプルMV精度のRDコストが計算される。次に、整数輝度サンプルMVD精度のRDコストと1/4輝度サンプルMVD精度のRDコストが比較され、4輝度サンプルMVD精度のRDコストをさらにチェックする必要があるかどうかが決定される。1/4輝度サンプルMVD精度のRDコストが整数輝度サンプルMVD精度のRDコストよりもずっと小さい場合、4輝度サンプルMVD精度のRDチェックは省略される。アフィンAMVPモードの場合、アフィンマージ/スキップモード、マージ/スキップモード、1/4輝度サンプリングMVD精度通常AMVPモード、1/4輝度サンプリングMVD精度アフィンAMVPモードのレート-歪みコストをチェックした後、アフィンインターモードを選択しなかった場合、1/16輝度サンプリングMV精度、1画素MV精度アフィンインターモードはチェックされない。さらに、1/16輝度サンプルおよび1/4輝度サンプルMV精度アフィンインターモードにおける探索開始点として、1/4輝度サンプルMV精度アフィンインターモードで得られたアフィンパラメータが用いられる。
【0069】
パレットモード
【0070】
パレットモードの背景にある基本的な考えは、CUにおけるサンプルを代表的な色値の小さな集合で表現することである。この集合をパレットと呼ぶ。また、エスケープシンボルの後に(場合によっては量子化された)成分値を信号通知することによって、パレットの外側にあるサンプルを示すこともできる。これを
図2に示す。
【0071】
HEVC-SCC(Screen Content Coding)拡張におけるパレットモード
【0072】
HEVC-SCCにおけるパレットモードでは、パレットおよびインデックスマップを符号化するために予測方式が用いられる。
【0073】
パレットエントリの符号化
【0074】
パレットエントリを符号化するために、パレット予測子が維持される。SPSにおいて、パレットの最大サイズおよびパレット予測子が信号通知される。HEVC-SCCにおいて、palette_predictor_initializer_present_flagがPPSに導入される。このフラグが1である場合、ビットストリームにおいて、パレット予測子を初期化するためのエントリが信号通知される。パレット予測子は、各CTU行、各スライス、および各タイルの始めに初期化される。palette_predictor_initializer_present_flagの値に基づき、palette_predictorを0にリセットするか、またはPPSに信号通知されたパレット予測子の初期化エントリを使用してパレット予測子を初期化する。HEVC-SCCにおいて、PPSレベルでパレット予測子の初期化を明確に無効化するために、サイズ0のパレット予測子の初期化が有効化されている。
【0075】
パレット予測子におけるエントリごとに、それが現在のパレットの一部であるかどうかを示すために、再利用フラグが信号通知される。これを
図3に示す。再利用フラグは、ゼロのランレングス符号化を使用して送信される。この後、新しいパレットエントリの数は、次数0の指数ゴロム符号を使用して信号通知される。最後に、新しいパレットエントリのための成分値が信号通知される。
【0076】
パレットインデックスの符号化
【0077】
パレットインデックスは、
図4に示すように、水平方向および垂直方向の横断走査を使用して符号化される。palette_transpose_flagを使用して、ビットストリームにおける走査順序が明確に信号通知される。以下のサブセクションでは、走査が水平であると仮定する。
【0078】
パレットインデックスは、2つのメインパレットサンプルモード、「INDEX」と「COPY_ABOVE」を使用して符号化される。前述のように、エスケープシンボルも「INDEX」モードとして信号送信され、最大パレットサイズに等しいインデックスが割り当てられる。このモードは、最上行を除くフラグを使用して、または前回のモードが「COPY_ABOVE」であった場合に信号通知される。「COPY_ABOVE」モードにおいて、上の行のサンプルのパレットインデックスがコピーされる。「INDEX」モードにおいて、パレットインデックスは明確に信号通知される。「INDEX」モードと「COPY_ABOVE」モードの両方の場合、同じモードを使用して符号化される後続のサンプルの数を指定する実行値が信号通知される。エスケープシンボルが「INDEX」または「COPY_ABOVE」モードにおける実行の一部である場合、エスケープシンボルごとにエスケープ成分値が信号通知される。パレットインデックスの符号化を
図5に示す。
【0079】
この構文順序は、以下のようにして実行される。まず、CUのためのインデックス値の数が信号通知される。これに続いて、短縮バイナリ符号化(truncated binary coding)を使用して、CU全体の実際のインデックス値が信号通知される。バイパスモードでは、インデックスの数およびインデックス値の両方が符号化される。これにより、インデックス関連バイパスビンがグループ化される。次に、パレットサンプルモード(必要な場合)および実行は、インターリーブ方式で信号通知される。最後に、CU全体のためのエスケープサンプルに対応する成分エスケープ値がグループ化され、バイパスモードで符号化される。
【0080】
インデックス値を信号通知した後、追加の構文要素last_run_type_flagを信号通知する。この構文要素は、インデックスの数と連動して、ブロックにおける最後の実行に対応する実行値を信号通知する必要をなくす。
【0081】
HEVC-SCCにおいて、パレットモードは、4:2:2、4:2:0、およびモノクロの彩度フォーマットに対しても有効にされる。パレットエントリおよびパレットインデックスの信号通知は、すべての彩度フォーマットに対してほぼ同じである。非モノクロフォーマットの場合、各パレットエントリは、3つの成分からなる。モノクロフォーマットの場合、各パレットエントリは単一の成分からなる。サブサンプリングされた彩度方向の場合、彩度サンプルは、2で割り切れる輝度サンプルインデックスに関連付けられる。CUのパレットインデックスを再構成した後、サンプルがそれに関連付けられた単一の成分のみを有する場合、パレットエントリの第1の成分のみが使用される。信号通知における唯一の違いは、エスケープ成分値である。エスケープサンプルごとに、信号通知されるエスケープ成分値の数は、そのサンプルに関連付けられた成分の数によって異なっていてよい。
【0082】
変換スキップモードにおける係数符号化
【0083】
JVET-M0464およびJVET-N0280において、残差符号化を変換スキップレベルの統計および信号特性に適応させるために、TS(Transform Skip)モードにおける係数符号化についていくつかの改良が提案されている。
【0084】
提案された変形例を以下に示す。
【0085】
前回の有意な走査位置なし:残差信号は予測後の空間残差を反映しており、TSに対して変換によるエネルギー圧縮は行われないため、変換ブロックの右下隅に、ゼロまたは有意でないレベルがより高い確率で後続することはもはやなくなる。従って、この場合、最後の重要な走査位置信号送信は省略される。
【0086】
サブブロックCBF:最後の重要な走査位置信号がない場合、TSに対するcoded_sub_block_flagを有するサブブロックCBF信号は、次のように変更されることが必要である。
○量子化に起因して、前述の有意でないシーケンスは、依然として変換ブロック内で局所的に発生してよい。従って、前に説明したように、最後の重要な走査位置が除去され、全てのサブブロックに対してcoded_sub_block_flagが符号化される。
○DC周波数位置をカバーするサブブロック(左上のサブブロック)のcoded_sub_block_flagは、特殊な場合を提示する。VVCドラフト3において、このサブブロックのcoded_sub_block_flagは決して信号通知されず、常に1に等しいと推測される。最後の有意な走査位置が別のサブブロックに位置する場合、それは、DCサブブロックの外側に少なくとも1つの有意なレベルがあることを意味する。その結果、DCサブブロックは、このサブブロックのcoded_subblock_flagが1に等しいと推測されるが、ゼロ/非有意レベルのみを含んでもよい。TSに最後の走査位置情報がない場合、各サブブロックのcoded_sub_block_flagが信号通知される。これは、他の全てのcoded_sub_block_flag構文要素が既に0に等しい場合を除き、DCサブブロックのcoded_sub_block_flagをも含む。この場合、DC coded_sub_block_flagは1に等しいと推測される(inferDcSbCbf=1)。このDCサブブロックには少なくとも1つの有意なレベルがなければならないので、このDCサブブロックにおける他のすべてのsig_coeff_flag構文要素が0に等しい場合、(0,0)における第1の位置のsig_coeff_flag構文要素は信号通知されず、1に等しくなるように導出される(inferSbDcSigCoefflag=1)。
○coded_sub_block_flagのコンテキストモデリングは変更される。コンテキストモデルインデックスは、現在のサブブロックの左側のcoded_sub_block_flagと、上側のcoded_sub_block_flagとの和として、両方の論理和に替えて計算される。
【0087】
sig_coeff_flagコンテキストモデリング:sig_coeff_flagコンテキストモデルにおけるローカルテンプレートは、現在の走査位置の左側の近傍(NB0)および上側の近傍(NB1)のみを含むように修正される。コンテキストモデルオフセットは、重要な近傍の位置sig_coeff_flag[NB0]+sig_coeff_flag[NB1]の数に過ぎない。そこで、現在の変換ブロックにおける対角dに依存する異なるコンテキストセットを選択することを排除する。その結果、sig_coeff_flagを符号化するための3つのコンテキストモデルおよび単一のコンテキストモデルセットが得られる。
【0088】
abs_level_gt1_flagおよびpar_level_flagコンテキストモデリング:abs_level_gt1_flagおよびpar_level_flagには単一のコンテキストモデルが用いられる。
【0089】
abs_remainder符号化:変換スキップ残差絶対レベルの経験的分布は、典型的には、依然としてラプラシアンまたは幾何学的分布に適応するが、変換係数絶対レベルよりも大きい不安定性が存在する。具体的には、残差絶対レベルの場合、連続して実現する窓内の分散が高くなる。これは、abs_remainder構文の二値化およびコンテキストモデリングの以下のような修正の動機となる。
○二値化においてより高いカットオフ値、即ち、sig_coeff_flag、abs_level_gt1_flag、par_level_flag、およびabs_level_gt3をabs_remainderのRice符号へ用いることで、各ビンの位置に対する専用のコンテキストモデルは、より高い圧縮効率が得られる。カットオフを大きくすると、より多くの「Xより大きい」フラグ、例えば、abs_level_gt5_flag、abs_level_gt7_flag等が、カットオフが達するまでもたらされる。カットオフ自体は5に固定される(numGtFlags=5)。
○ライスパラメータ導出のためのテンプレートが修正され、すなわち、現在の走査位置の左側の近傍および上側の近傍のみが、sig_coeff_flagコンテキストモデリングのためのローカルテンプレートに類似していると見なされる。
【0090】
coeff_sign_flagコンテキストモデリング:符号のシーケンス内の不安定性および予測残差がしばしば偏っていることに起因して、全体的な経験的分布がほぼ均一に分布している場合であっても、符号はコンテキストモデルを使用して符号化され得る。符号の符号化には単一の専用コンテキストモデルが使用され、符号はsig_coeff_flagの後に構文解析されて、すべてのコンテキスト符号化ビンが一緒にまとめられる。
【0091】
QR-BDPCM(Quantized Residual Block Differential Pulse Code Modulation)
【0092】
JVET-M0413において、QR-BDPCM(Quantized Residual Block Differential Pulse Code Modulation)が、スクリーンコンテンツを効率的に符号化するために提案されている。
【0093】
QR-BDPCMで使用される予測方向は、垂直予測モードおよび水平予測モードであり得る。イントラ予測は、イントラ予測と同様に、予測方向(水平または垂直予測)にてサンプルコピーすることで、ブロック全体で予測する。残差が量子化され、量子化された残差とその予測子(水平または垂直)の量子化値との間の差分が符号化される。これは、以下のように説明することができる。サイズM(行)×N(列)のブロックについて、ri,j、0≦i≦M-1、0≦j≦N-1を、上または左ブロックの境界サンプルからのフィルタリングされていないサンプルを使用して、水平方向(予測ブロックに対して左隣の画素値を1ラインずつコピーする)または垂直方向(予測ブロックにおける各ラインに上隣のラインをコピーする)にイントラ予測を行った後の予測残差とする。Q(ri,j)、0≦i≦M-1、0≦j≦N-1は、残差ri,jの量子化バージョンを表し、この場合、残差は、元のブロックと予測ブロック値との間の差である。次に、ブロックDPCMが量子化された残差サンプルに適用され、その結果、要素r~
i,jを有する修正されたM×Nの配列R~が得られる。垂直BDPCMが以下のように信号通知される。
【0094】
【0095】
水平予測の場合、類似した規則が適用され、残差量子化サンプルは、以下の式によって得られる。
【0096】
【0097】
残差量子化サンプルr~
i,jはデコーダに送られる。
【0098】
デコーダ側では、上記の計算を逆にして、Q(ri,j)、0≦i≦M-1、0≦j≦N-1を生成する。垂直予測の場合、
【0099】
【0100】
水平方向の場合、
【0101】
【0102】
逆量子化された残差Q-1(Q(ri,j))がイントラブロック予測値に加算され、再構成されたサンプル値を生成する。
【0103】
このスキームの主な利点は、逆方向のDPCMは、係数の構文解析中に予測子を追加するだけで、オンザフライで行うことができる、または、構文解析後に行うことができることである。
【0104】
QR-BDPCMのテキスト変更案を以下に示す。
【0105】
7.3.6.5 符号化ユニット構文
【0106】
【0107】
【0108】
bdpcm_flag[x0][y0]が1の場合は、位置(x0,y0)の輝度符号化ブロックを含む符号化ユニットにbdpcm_dir_flagが存在することを指定する。
bdpcm_dir_flag[x0][y0]が0の場合は、bdpcmブロックで使用される予測方向が水平であることを指定し、そうでない場合、垂直であることを指定する。
【0109】
パーティション構造
【0110】
ツリー構造を用いたCTUの分割
【0111】
HEVCにおいて、CTUは、様々な局所的特徴に適応するように、符号化ツリーと呼ばれる4分木構造を用いてCUに分割される。インターピクチャ(時間的)予測またはイントラピクチャ(空間的)予測を使用して、ピクチャ領域を符号化するかどうかの決定は、葉CUレベルで行われる。各葉CUは、PU分割タイプに応じて1つ、2つまたは4つのPUに更に分割することができる。1つのPUの内部では、同じ予測処理が適用され、PU単位で関連情報がデコーダに送信される。PU分割タイプに基づく予測処理を適用することにより残差ブロックを取得した後、CUのための符号化ツリーに類似した別の4分木構造に従って、葉CUをTU(Transform Unit)に分割することができる。HEVC構造の重要な特徴の1つは、CU、PU、TUを含む複数のパーティション概念を有することである。
【0112】
VVCにおいて、2値および3値分割セグメンテーション構造を使用するネストされたマルチタイプツリーを有する四分木は、複数の区分ユニットタイプの概念に取って代わる。即ち、それは、最大変換長に対して大き過ぎるサイズを有するCUに必要な場合を除き、CU、PU、およびTU概念の分離を排除し、且つCU区分形状のためのより多くの柔軟性をサポートする。符号化ツリー構造において、CUは正方形または長方形のいずれかを有することができる。まず、CTU(Coding Tree Unit)を4分木構造で分割する。そして、四分木の葉のノードは、マルチタイプのツリー構造によってさらに区分され得る。
図6に示すとおり、マルチタイプツリー構造の分割タイプには、垂直二値分割(SPLIT_BT_VER)、水平二値分割(SPLIT_BT_HOR)、垂直三値分割(SPLIT_TT_VER)、水平三値分割(SPLIT_TT_HOR)の4つがある。マルチタイプの木の葉のノードは、CU(Coding Unit)と呼ばれ、CUが大き過ぎて最大変換長にならない限り、このセグメント化は、それ以上の分割なしに、予測および変換処理に使用される。これは、ほとんどの場合、CU、PU、およびTUが、ネストされたマルチタイプのツリー符号化ブロック構造を有する四分木において、同じブロックサイズを有することを意味する。サポートされる最大変換長がCUの色成分の幅または高さよりも小さい場合、この例外が生じる。また、輝度および彩度成分は、Iタイル上に別個の区分構造を有する。
【0113】
クロスコンポーネント線形モデル予測
【0114】
クロスコンポーネントの冗長性を低減するために、VTM4においてCCLM(Cross-Component Linear Model)予測モードが使用され、この場合、以下のような線形モデルを使用することによって、同じCUの再構成された輝度サンプルに基づいて、彩度サンプルが予測される。
【0115】
【0116】
ここで、predC(i,j)は、CUにおける予測彩度サンプルを表し、recL(i,j)は、同じCUのダウンサンプリングされた再構成された輝度サンプルを表す。線形モデルパラメータαおよびβは、ダウンサンプリングされた近傍の輝度サンプルのセットの中で、最小のサンプル値を有する輝度サンプルと、最大のサンプル値を有する輝度サンプルである2つのサンプルと、それらに対応する彩度サンプルから、輝度値と彩度値の間の関係から導出される。線形モデルパラメータαおよびβは、以下の式に従って求められる。
【0117】
【0118】
ここで、Y
aおよびX
aは、最大の輝度サンプル値を有する輝度サンプルの輝度値および彩度値を表す。そして、X
bおよびY
bは、それぞれ、最小の輝度サンプルを有する輝度サンプルの輝度値および彩度値を表す。
図7は、左および上のサンプルおよびCCLMモードに関する現在のブロックのサンプルの位置の例を示す。
【0119】
LMCS(Luma Mapping with Chroma Scaling)
【0120】
VTM4において、LMCS(Luma Mapping with Chroma Scaling)と呼ばれる符号化ツールが、ループフィルタの前に新たな処理ブロックとして追加される。LMCSは、2つの主な成分を有する。1)適応区分線形モデルに基づく輝度成分のインループマッピング、および、2)彩度成分のために、輝度依存彩度残差スケーリングが適用される。
図8は、デコーダの観点から見たLMCSアーキテクチャを示す。
図8中の影が付けられたブロックは、マッピングされたドメインにおいて処理が適用される場所を示し、これらは、逆量子化、逆変換、輝度イントラ予測、および輝度予測と輝度残差との加算を含む。
図8中の影が付けられていないブロックは、元の(即ち、マッピングされていない)領域において処理が適用される場所を示し、これらは、非ブロック化、ALF、SAO等のループフィルタ、動き補償予測、彩度イントラ予測、彩度予測と彩度残差との加算、参照ピクチャとして復号化されたピクチャの記憶を含む。
図8における淡黄色の陰影付きブロックは、輝度信号の前方および逆のマッピング並びに輝度依存性彩度スケーリング処理を含む、新しいLMCS機能ブロックである。VVCにおける他のほとんどのツールと同様に、LMCSは、SPSフラグを使用して、シーケンスレベルで有効/無効にすることができる。
【0121】
3. 実施形態が解決しようとする課題の例
【0122】
JVET-N0280における係数符号化は、スクリーンコンテンツ符号化において符号化の利点を実現することができるが、係数符号化および変換スキップ(TS)モードは、依然としていくつかの欠点を有する可能性がある。
(1)TSモードにおいて最大許容の幅または高さは、柔軟性を制限され得る、PPSにおける1つの共通の値によって制御される。
(2)すべての符号化グループ(CG)は、オーバーヘッドコストを増大させ得る、TSモードのためのcbfフラグを信号通知する必要がある。
(3)係数走査順序は、イントラ予測モードを考慮していない。
(4)符号フラグ符号化は、1つのコンテキストのみを使用する。
(5)彩度成分における変換スキップはサポートされていない。
(6)変換スキップフラグは、オーバーヘッドコストおよび符号化の複雑さを増大させる全ての予測モードに適用される。
【0123】
4. 実施形態の例
【0124】
以下の詳細な発明は、一般的な概念を説明するための例であると考えられるべきである。これらの発明は狭い意味で解釈されるべきではない。さらに、これらの発明は、任意の方法で組み合わせることができる。
【0125】
1.変換スキップのための最大許容幅および最大許容高さの指示の両方は、SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループにおいて、信号通知されてよい。
a.一例において、変換スキップのための最大許容幅および最大許容高さは、SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループにおいて信号通知される異なるメッセージにより、示されてもよい。
b.一例において、最大許容幅および/または最大許容高さは、まずSPS/PPSにおいて信号通知され、次にピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループにおいて更新されてもよい。
【0126】
2.TS符号化ブロックは複数の係数グループ(CG)に分割され、少なくとも1つのCGの符号化ブロックフラグ(Cbf)フラグの信号通知は省略されてもよい。
a.一例において、例えば、TS符号化ブロックのために、すべてのCGのCbfフラグの信号通知が省略されてもよい。
b.一例において、TSモードのために、CGの省略されたcbfフラグは1と推測されてよい。
c.一例において、CGのCbfフラグの一部または全部を省略するかは、符号化モードに依存してよい。
i.一例において、TS符号化イントラブロックの場合、CGのすべてのCbfフラグの信号通知は省略される。
d.一例において、CGの省略されたCbfフラグは、以下に基づいて推測されてもよい。
i.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CUにおいて信号通知されたメッセージ
ii.CGの位置
iii.現在のブロックおよび/またはその近傍のブロックのブロック寸法
iv.現在のブロックおよび/またはその近傍のブロックのブロック形状
v.現在のブロックおよび/またはその近傍のブロックの最確モード
vi.現在のブロックの近傍のブロックの予測モード(イントラ/インター)
vii.現在のブロックの近傍のブロックのイントラ予測モード
viii.現在のブロックの近傍のブロックの動きベクトル
ix.現在のブロックの近傍のブロックのQR-BDPCMモードの指示
x.現在のブロックおよび/またはその近傍のブロックの現在の量子化パラメータ
xi.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
xii.シングル/デュアル符号化ツリー構造
xiii.スライス/タイルグループのタイプおよび/またはピクチャのタイプ
【0127】
3.TS符号化ブロックにおける係数走査順序は、SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CUにおいて信号通知されたメッセージに依存してよい。
a.代替的に、TSが使用される場合、CGおよび/または係数走査順序は、イントラ予測モードに依存してよい。
i.一例において、イントラ予測モードが水平方向に優勢である場合、走査順序は垂直であってよい。
1.一例において、イントラ予測モードインデックスが2~34の範囲にある場合、走査順序は垂直であってよい。
2.一例において、イントラ予測モードインデックスが2~33の範囲にある場合、走査順序は垂直であってよい。
ii.一例において、イントラ予測モードが垂直方向に優勢である場合、走査順序は垂直であってよい。
1.一例において、イントラ予測モードインデックスが34~66の範囲にある場合、走査順序は垂直であってよい。
2.一例において、イントラ予測モードインデックスが35~66の範囲にある場合、走査順序は垂直であってよい。
iii.一例において、イントラ予測モードが垂直方向に優勢である場合、走査順序は水平であってよい。
1.一例において、イントラ予測モードインデックスが34~66の範囲にある場合、走査順序は垂直であってよい。
2.一例において、イントラ予測モードインデックスが35~66の範囲にある場合、走査順序は垂直であってよい。
iv.一例において、イントラ予測モードが水平方向に優勢である場合、走査順序は水平であってよい。
1.一例において、イントラ予測モードインデックスが2~34の範囲にある場合、走査順序は垂直であってよい。
2.一例において、イントラ予測モードインデックスが2~33の範囲にある場合、走査順序は垂直であってよい。
【0128】
4.符号フラグ符号化のコンテキストは、TSモードのための係数ブロックにおける近傍の情報に依存してよいことが提案される。
a.一例において、現在の符号フラグを符号化するコンテキストは、TSモードのための近傍の符号フラグの値に依存してよい。
i.一例において、現在の符号フラグを符号化するコンテキストは、左および/または上の近傍の符号フラグの値に依存してよい。
1.一例において、現在の符号フラグのコンテキストは、C=(L+A)として導出されてよく、ここで、Cはコンテキストidであり、Lはその左の近傍の符号フラグであり、Aはその上の近傍の符号フラグである。
2.一例において、現在の符号フラグのコンテキストは、C=(L+A*2)として導出されてよく、ここで、Cはコンテキストidであり、Lはその左の近傍の符号フラグであり、Aはその上の近傍の符号フラグである。
3.一例において、現在の符号フラグのコンテキストは、C=(L*2+A)として導出されもよく、ここで、Cはコンテキストidであり、Lはその左の近傍の符号フラグであり、Aはその上の近傍の符号フラグである。
ii.一例において、現在の符号フラグを符号化するコンテキストは、左の近傍、上の近傍、および左上の近傍の符号フラグの値に依存してよい。
iii.一例において、現在の符号フラグを符号化するコンテキストは、左の近傍、上の近傍、左上の近傍、右上の近傍の符号フラグの値に依存してよい。
b.一例において、現在の符号フラグを符号化するコンテキストは、係数の位置に依存してよい。
i.一例において、符号フラグのコンテキストは、異なる位置で異なってよい。
ii.一例において、符号フラグのコンテキストは、x+yに依存してよく、ここで、xおよびyは、位置の水平および垂直位置である。
iii.一例において、符号フラグのコンテキストは、min(x,y)に依存してよく、ここで、xおよびyは、位置の水平および垂直位置である。
iv.一例において、符号フラグのコンテキストは、max(x,y)に依存してよく、ここで、xおよびyは、位置の水平および垂直位置である。
【0129】
5.彩度変換スキップモードがサポートされてよいことが提案される。
a.一例において、彩度変換スキップモードの使用は、SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージに基づいてよい。
b.代替的に、彩度変換スキップモードの使用は、同じ色成分または他の色成分における1または複数の代表的な以前に符号化されたブロックの復号化された情報に基づいてもよい。
i.一例において、代表的なブロックのTSフラグの指示が偽である場合、彩度TSフラグの指示は偽であると推測されてよい。代替的に、代表ブロックのTSフラグの表示が真である場合、彩度TSフラグの表示が真であると推測されてよい。
ii.一例において、代表ブロックは、輝度ブロックまたは彩度ブロックであってよい。
iii.一例において、代表ブロックは、配列された輝度ブロック内の任意のブロックであってよい。
iv.一例において、代表ブロックは、現在の彩度ブロックの近接の彩度ブロックの1つであってよい。
v.一例において、代表ブロックは、現在の彩度ブロック内の中心彩度サンプルの対応する輝度サンプルをカバーしているブロックであってよい。
vi.一例において、代表ブロックは、現在の彩度ブロック内の右下の彩度サンプルの対応する輝度サンプルをカバーしているブロックであってよい。
【0130】
6.変換スキップモードを適用するかどうかおよび/またはどのように適用するかは、SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージに依存してよい。
a.一例において、変換スキップモードをいつおよび/またはどのように適用するかの指示は、以下に依存してよい。
i.現在のブロックおよび/またはその近傍のブロックのブロック寸法
ii.現在のブロックおよび/またはその近傍のブロックのブロック形状
iii.現在のブロックおよび/またはその近傍のブロックの最確モード。
iv.現在のブロックの近傍のブロックの予測モード(イントラ/インター)
v.現在のブロックの近傍のブロックのイントラ予測モード
vi.現在のブロックの近傍のブロックの動きベクトル
vii.現在のブロックの近傍のブロックのQR-BDPCMモードの指示
viii.現在のブロックおよび/またはその近傍のブロックの現在の量子化パラメータ
ix.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
x.シングル/デュアル符号化ツリー構造
xi.スライス/タイルグループタイプおよび/またはピクチャタイプ
xii.時間層ID
b.一例において、変換スキップモードは、予測モードがIBCモードであり、ブロック幅および/またはブロック高さが閾値よりも小さい/大きい/等しい場合に、適用されてよい。
i.一例において、閾値は、4、8、16または32が設定されてよい。
ii.一例において、閾値は、ビットストリームにて信号通知されてよい。
iii.一例において、閾値は、次に基づいてよい。
1.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CUにおいて信号通知されたメッセージ
2.現在のブロックおよび/またはその近傍のブロックのブロック寸法
3.現在のブロックおよび/またはその近傍のブロックのブロック形状
4.現在のブロックおよび/またはその近傍のブロックの最確モード
5.現在のブロックの近傍のブロックの予測モード(イントラ/インター)
6.現在のブロックの近傍のブロックのイントラ予測モード
7.現在のブロックの近傍のブロックの動きベクトル
8.現在のブロックの近傍のブロックのQR-BDPCMモードの指示
9.現在のブロックおよび/またはその近傍のブロックの現在の量子化パラメータ
10.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
11.シングル/デュアル符号化ツリー構造
12.スライス/タイルグループのタイプおよび/またはピクチャタイプ
13.時間層ID
【0131】
7.TSモードの指示を信号通知するかどうかは、復号化された/導出されたイントラ予測モードに依存してよい。
a.代替的に、さらに、QR-BDPCM符号化ブロックにおいて使用される許可されたイントラ予測モード/方向と、QR-BDPCMの使用とに依存してよい。
b.復号された、または導出されたイントラ予測モードの場合、それがQR-BDPCM符号化ブロックで使用されるイントラ予測モード/方向の許可されたセットの一部である場合、TSフラグの信号通知は省略されてよい。
i.一例において、QR-BDPCMが1つのスライス/ピクチャ/タイル/ブリックを符号化することを許可される場合、QR-BDPCMプロセスにおいて、垂直および水平モードは2つの許可されたモードであり、復号化された/導出されたイントラモードは垂直または水平モードであり、TSモードの指示は通知されない。
c.一例において、QR-BDPCMモードの指示(例えば、bdpcm_flag)が1である場合、変換スキップモードは有効であると推測されてよい。
d.上記方法は、以下に基づいて適用されてよい。
i.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CUにおいて信号通知されたメッセージ
ii.現在のブロックおよび/またはその近傍のブロックのブロック寸法
iii.現在のブロックおよび/またはその近傍のブロックのブロック形状
iv.現在のブロックおよび/またはその近傍のブロックの最確モード
v.現在のブロックの近傍のブロックの予測モード(イントラ/インター)
vi.現在のブロックの近傍のブロックのイントラ予測モード
vii.現在のブロックの近傍のブロックの動きベクトル
viii.現在のブロックの近傍のブロックのQR-BDPCMモードの指示
ix.現在のブロックおよび/またはその近傍のブロックの現在の量子化パラメータ
x.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
xi.シングル/デュアル符号化ツリー構造
xii.スライス/タイルグループタイプおよび/またはピクチャタイプ
xiii.時間層ID
【0132】
8.QR-BDPCMを適用するかどうか、および/または、どのように適用するかは、TSモードの表示に依存してよい。
a.一例において、QR-BDPCMを適用するかどうかの指示は、CUにおいて信号通知される代わりに、変換ユニット(TU)レベルで信号通知されてもよい。
i.一例において、QR-BDPCMを適用するかどうかの指示は、TSモードの表示がTUに適用された後に信号通知されてもよい。
b.一例において、QR-BDPCMは、TSモードの特殊な場合として扱われる。
i.1つのブロックがTSモードで符号化される場合、QR-BDPCMモードまたは従来のTSモードが適用されるかを示すために、別のフラグがさらに信号通知されてもよい。それがQR-BDPCMで符号化される場合、QR-BDPCMにおいて使用される予測方向がさらに信号通知されてよい。
ii.代替的に、1つのブロックがTSモードで符号化される場合、どの種類のQR-BDPCM(例えば、水平/垂直予測方向に基づくQR-BDPCM)または従来のTSモードが適用されるかを示すために、別のフラグがさらに信号通知されてよい。
c.一例において、TSモードの指示に基づいて、QR-BDPCMを適用するかどうかの指示が推測されてよい。
i.一例において、輝度ブロックおよび/または彩度ブロックに対してQR-BDPCMを適用するかどうかの指示は、同じブロックに対して変換スキップフラグを適用するかどうかの指示が真である場合に、真であると推測されてよい。代替的に、輝度ブロックおよび/または彩度ブロックに対して変換スキップフラグを適用するかどうかの指示が真である場合、同じブロックに対してQR-BDPCMを適用するかどうかの指示は、真であると推測されてよい。
ii.一例において、輝度ブロックおよび/または彩度ブロックに対してQR-BDPCMを適用するかどうかの指示は、同じブロックに対して変換スキップフラグを適用するかどうかの指示が偽である場合に、偽であると推測されてもよい。代替的に、輝度ブロックおよび/または彩度ブロックに対して変換スキップフラグを適用するかどうかの指示が偽である場合、同じブロックに対してQR-BDPCMを適用するかどうかの指示は、偽であると推測されてよい。
【0133】
9.シングル/デュアルツリーを適用するかどうかおよび/またはどのように適用するかは、SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージに依存してよい。
a.一例において、1つのシングル/デュアルツリーを適用するかどうかの指示は、現在のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットがスクリーンコンテンツとして判定されるかどうかに依存してよい。
i.更に、一例において、スライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットがスクリーンコンテンツとして判定されるかどうかは、次に依存してよい。
1.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットに信号通知されたメッセージ/フラグ
2.現在のCTUおよび/またはその近傍のCTUのブロック寸法
3.現在のCTUおよび/またはその近傍のCTUのブロック形状
4.現在のCTUの現在の量子化パラメータおよび/またはその近傍のCTUの現在の量子化パラメータ
5.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
6.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの、シングル/デュアル符号化ツリー構造タイプ
7.スライス/タイルグループタイプおよび/またはピクチャタイプ
8.時間層ID
b.一例において、シングル/デュアルツリーを適用するかどうかの指示は推測されてよく、それは以下に依存してよい。
i.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
ii.以前の符号化された、画像/タイル/スライス/再構成領域における、IBC/インターモードのハッシュヒット率
iii.現在のCTUおよび/またはその近傍のCTUのブロック寸法
iv.現在のCTUおよび/またはその近傍のCTUのブロック形状
v.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
vi.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
vii.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットのシングル/デュアル符号化ツリー構造タイプ
viii.スライス/タイルグループタイプおよび/またはピクチャタイプ
ix.時間層ID
c.一例において、CCLMおよび/またはLMCSを適用するかどうかの指示は、単一/二重符号化ツリー構造のタイプに依存してよい。
i.一例において、シングル/デュアルツリーが使用される場合、CCLMおよび/またはLMCSの指示は、偽であると推測されてよい。
d.一例において、シングル/デュアルツリーを適用するかどうかの指示(即ち、シングルツリーまたはデュアルツリーのCTUレベルの適応)は、デュアルツリーを有効化する指示(例えば、qtbtt_dual_tree_intra_flag)が真であるかどうかに依存してよい。
i.代替的に、更に、シーケンス/スライス/タイル/ブリックに対するデュアルツリーが有効でない(例えば、qtbtt_dual_tree_intra_flagが偽)場合、下位レベル(例えば、CTU)でシングル/デュアルツリーを適用するかどうかの指示は偽と推測されてよい。
1.代替的に、デュアルツリーが有効である場合(例えば、qtbtt_dual_tree_intra_flagが真)、シーケンス/スライス/タイル/ブリックより小さい映像ユニットに対してシングル/デュアルツリーを適用するかどうかの指示が通知されてよい。
e.一例において、シングル/デュアルツリーを適用するかどうか(即ち、シングルツリーまたはデュアルツリーのCTUレベルの適応)の指示は、CTUレベルよりも高いレベルのフラグ(例えば、sps_asdt_flagおよび/またはslice_asdt_flag)が真であるかどうかに依存してよい。
i.代替的に、更に、CTUレベルよりも高いレベルのフラグ(例えば、sps_asdt_flagおよび/またはslice_asdt_flag)が偽である場合、シングル/デュアルツリーを適用するかどうかの指示(即ち、シングルツリーまたはデュアルツリーのCTUレベルの適応)が偽であると推測されてよい。
f.上記方法は、シングルツリー分割の場合にも適用可能であり、またはシングル/デュアル符号化ツリー構造のタイプにも適用可能である。
【0134】
10.IBCを有効化するかどうかは、符号化ツリー構造のタイプに依存してよい。
a.一例において、所与の符号化ツリー構造タイプ(例えば、デュアルツリー)の場合、IBCモードの指示および/またはIBCモードで使用されるブロックベクトルの信号通知は、省略され、推測されてよい。
b.一例において、IBCモードの指示は、デュアル符号化ツリー構造タイプが適用される場合、偽であると推測されてよい。
c.一例において、デュアル符号化ツリー構造タイプが適用される場合、輝度ブロックのIBCモードの指示は偽であると推測されてよい。
d.一例において、デュアル符号化ツリー構造タイプが適用される場合、彩度ブロックのIBCモードの指示は偽であると推測されてよい。
e.一例において、IBCモードの表示は、以下に基づいて推測されてよい。
i.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
ii.以前の符号化された画像/タイル/スライス/再構成領域におけるIBC/インターモードのハッシュヒット率
iii.現在のCTUおよび/またはその近傍のCTUのブロック寸法
iv.現在のCTUおよび/またはその近傍のCTUのブロック形状
v.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
vi.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
vii.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの符号化ツリー構造タイプ
viii.スライス/タイルグループタイプおよび/またはピクチャタイプ
ix.時間層ID
【0135】
11.CCLMを有効化するかどうかは、符号化ツリー構造のタイプに依存してよい。
a.一例において、所与の符号化ツリー構造タイプ(例えば、デュアルツリー)の場合、CCLMモードの指示の信号通知、および/またはCCLMモードに関連する他の構文は、省略され、推測されてよい。
b.一例において、デュアル符号化ツリー構造タイプが適用される場合、CCLMモードの指示は偽であると推測されてよい。
c.一例において、デュアル符号化ツリー構造タイプが適用される場合、CCLMモードの指示は、以下に基づいて推測されてよい。
i.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
ii.以前の符号化された画像/タイル/スライス/再構成領域におけるIBC/インターモードのハッシュヒット率
iii.現在のCTUおよび/またはその近傍のCTUのブロック寸法
iv.現在のCTUおよび/またはその近傍のCTUのブロック形状
v.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
vi.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
vii.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの、符号化ツリー構造タイプ
viii.スライス/タイルグループタイプおよび/またはピクチャタイプ
ix.時間層ID
【0136】
12.彩度成分のためにLMCSを有効化するかどうかは、符号化ツリー構造のタイプに依存してよい。
a.一例において、所与の符号化ツリー構造タイプ(例えば、デュアルツリー)の場合、彩度成分のためのLMCSの指示の信号通知、および/またはLMCSモードに関連する他の構文は、省略され、推測されてよい。
b.一例において、デュアル符号化ツリー構造タイプが適用される場合、彩度成分のためのLMCSの指示は偽であると推測されてよい。
c.一例において、彩度成分のためのLMCSの指示は、デュアル符号化ツリー構造タイプが適用される場合、以下に基づいて推測されてよい。
i.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
ii.以前の符号化された画像/タイル/スライス/再構成領域におけるIBC/インターモードのハッシュヒット率
iii.現在のCTUおよび/またはその近傍のCTUのブロック寸法
iv.現在のCTUおよび/またはその近傍のCTUのブロック形状
v.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
vi.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
vii.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの、符号化ツリー構造タイプ
viii.スライス/タイルグループタイプおよび/またはピクチャタイプ
ix.時間層ID
【0137】
13.符号化ツリーの構造は、IBCが使用されるか否かに依存してよい。
a.一例において、デュアルツリー構造およびIBC方法は、シーケンス/ピクチャ/タイル/ブリック/CTU/VPDU/32×32ブロック/64×32ブロック/32×64ブロックのレベルで同時に有効化されなくてよい。
b.代替的に、更に、一例において、IBC方法が有効である場合、デュアルツリー構造は、シーケンス/ピクチャ/タイル/ブリック/CTU/VPDU/32×32ブロック/64×32ブロック/32×64ブロックのレベルで無効化されてよい。
c.一例において、領域においてIBCが使用される場合、彩度符号化ツリー構造は、輝度符号化ツリー構造に整列されてよい。
i.一例において、領域は、シーケンス/ピクチャ/タイル/ブリック/CTU/VPDU/32×32ブロック/64×32ブロック/32×64ブロックであってよい。
ii.一例において、配列された輝度ブロックをサブブロックに分割する場合、彩度ブロックは、分割が許可されている場合、サブブロックに分割されてもよい。
iii.一例において、彩度ブロックが分割されるかどうか、およびどのように分割されるかは、その配列された輝度ブロックの符号化構造から推測されてよい。
iv.一例において、輝度符号化ツリー構造から彩度符号化ツリー構造を推測する場合、彩度符号化ツリー構造を符号化するための信号は省略されてよい。
v.一例において、フラグは、輝度符号化構造から彩度符号化構造を推測することができるかどうかを示すために使用されてよい。フラグの信号通知は以下に依存してよい。
1.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
2.以前の符号化された画像/タイル/スライス/再構成領域におけるIBC/インターモードのハッシュヒット率
3.現在のCTUおよび/またはその近傍のCTUのブロック寸法
4.現在のCTUおよび/またはその近傍のCTUのブロック形状
5.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
6.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
7.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの符号化ツリー構造タイプ
8.スライス/タイルグループタイプおよび/またはピクチャタイプ
9.時間層ID
【0138】
14.パレット符号化モードを有効化するかどうかは、符号化ツリー構造タイプに依存してよい。
a.一例において、所与の符号化ツリー構造タイプ(例えば、デュアルツリー)の場合、パレット符号化モードの指示の信号通知は、省略され、推測されてよい。
b.一例において、デュアル符号化ツリー構造タイプが適用される場合、パレット符号化モードの指示は偽であると推測されてよい。
c.一例において、デュアル符号化ツリー構造タイプが適用される場合、輝度ブロックのパレット符号化モードの指示は偽であると推測されてよい。
d.一例において、デュアル符号化ツリー構造タイプが適用される場合、彩度ブロックのパレット符号化モードの指示は偽であると推測されてよい。
e.一例において、パレット符号化モードの指示は、以下に基づいて推測されてよい。
i.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
ii.以前の符号化された画像/タイル/スライス/再構成領域におけるIBC/インターモードのハッシュヒット率
iii.現在のCTUおよび/またはその近傍のCTUのブロック寸法
iv.現在のCTUおよび/またはその近傍のCTUのブロック形状
v.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
vi.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
vii.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの符号化ツリー構造タイプ
viii.スライス/タイルグループタイプおよび/またはピクチャタイプ
ix.時間層ID
【0139】
15.符号化ツリーの構造は、パレット符号化モードを使用するか否かに依存してよい。
a.一例において、領域においてパレット符号化モードが使用される場合、彩度符号化ツリー構造は、輝度符号化ツリー構造に整列されてよい。
i.一例において、領域は、シーケンス/ピクチャ/タイル/ブリック/CTU/VPDU/32×32ブロック/64×32ブロックであってよい。
ii.一例において、配列された輝度ブロックをサブブロックに分割する場合、彩度ブロックは、分割が許可されている場合、サブブロックに分割されてよい。
iii.一例において、彩度ブロックが分割されるかどうか、およびどのように分割されるかは、その配列された輝度ブロックの符号化構造から推測されてよい。
iv.一例において、輝度符号化ツリー構造から彩度符号化ツリー構造を推測する場合、彩度符号化ツリー構造を符号化する信号は省略されてよい。
v.一例において、フラグは、輝度符号化構造から彩度符号化構造を推測することができるかどうかを示すために使用されてよい。フラグの信号通知は以下に依存してよい。
1.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
2.以前の符号化された画像/タイル/スライス/再構成領域におけるIBC/インターモードのハッシュヒット率
3.現在のCTUおよび/またはその近傍のCTUのブロック寸法
4.現在のCTUおよび/またはその近傍のCTUのブロック形状
5.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
6.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
7.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの符号化ツリー構造タイプ
8.スライス/タイルグループのタイプおよび/またはピクチャのタイプ
9.時間層ID
【0140】
16.彩度IBC符号化ブロックにおけるサブブロック/サンプルの動き/ブロックベクトルは、配列された輝度ブロック内の第1の利用可能なIBC符号化サブ領域から導出されてよい。
a.一例において、配列された輝度ブロック内のサブ領域の走査順序、例えばラスタ走査順序を規定してよい。
b.一例において、サブ領域は、最小符号化ユニット/最小変換ユニットとして定義されてよい。
c.一例において、彩度IBCモードにおける全サンプルの動き/ブロックベクトルは、配列された輝度ブロックにおいてIBCまたはインターモードで符号化された最も左上のサンプルの動きベクトルに基づいて導出されてよい。
【0141】
17.彩度IBCモードにおいて、動き/ブロックベクトルが信号通知されてよい。
a.一例において、動きベクトルと動きベクトル予測子との間の差が信号通知されてよい。
i.一例において、動きベクトル予測子は、配列された輝度ブロック、配列された輝度ブロックの近傍の輝度ブロック、現在の彩度ブロックの近傍の彩度ブロックの動きベクトルに基づいて導出されてよい。
1.一例において、動き/ブロックベクトル予測子は、配列された輝度ブロックにおける左上のサンプルの動きベクトルに基づいて導出されてよい。
2.一例において、動き/ブロックベクトル予測子は、配列された輝度ブロックにおける中心位置を有するサンプルの動きベクトルに基づいて導出されてよい。
3.一例において、動き/ブロックベクトル予測子は、配列された輝度ブロックにおけるIBCまたはインターモードで符号化された最も左上のサンプルの動きベクトルに基づいて導出されてよい。
ii.一例において、輝度成分の1つのサブ領域に関連付けられた動きベクトル予測子は、予測子として使用される前にスケーリングされてよい。
iii.一例において、ブロックベクトルは、近傍の(隣接または非隣接の)彩度ブロックの動きベクトル/ブロックベクトルから導出されてよい。
b.一例において、ブロックベクトル候補リストが構築され、このリストへのインデックスが信号通知されてよい。
i.一例において、候補リストは、配列された輝度ブロック、配列された輝度ブロックの近傍の輝度ブロック、および近傍の彩度ブロックからの動きベクトル/ブロックベクトルを含んでよい。
c.一例において、AMVRフラグの指示は、推測されてよい。
i.一例において、AMVRフラグの指示は、彩度IBCモードで符号化されたブロックにおいて、偽(0)であると推測されてよい。
ii.一例において、動きベクトル差分の指示は、彩度IBCモードで符号化されたブロックにおいて、整数精度で推測されてよい。
d.一例において、彩度IBCモードでは、別個のHMVPテーブルが使用されてよい。
i.一例において、彩度HMVPテーブルおよび輝度HMVPテーブルのサイズは異なっていてよい。
e.一例において、彩度IBCモードにおいてブロック/動きベクトルを信号通知するかどうかは、以下に基づいていてよい。
i.配列された輝度ブロック内のすべてのサブ領域がIBCモードで符号化されるかどうか。
1.そうである場合、彩度ブロックのブロックベクトルは信号通知する必要がない。そうでない場合、彩度ブロックのブロックベクトルは信号通知されてよい。
ii.配列された輝度ブロック内のすべてのサブ領域がIBCモードで符号化され、関連付けられたブロックベクトルがすべて有効であるかどうか。
1.そうである場合、彩度ブロックのブロックベクトルは信号通知する必要がない。そうでない場合、彩度ブロックのブロックベクトルは信号通知されてよい。
iii.SPS/VPS/PPS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/LCU行/LCUのグループ/LCU/CU/映像データユニットにおいて信号通知されたメッセージ
iv.以前の符号化された画像/タイル/スライス/再構成領域におけるIBC/インターモードのハッシュヒット率
v.現在のCTUおよび/またはその近傍のCTUのブロック寸法
vi.現在のCTUおよび/またはその近傍のCTUのブロック形状
vii.現在のCTUおよび/またはその近傍のCTUの現在の量子化パラメータ
viii.カラーフォーマットの指示(例えば、4:2:0、4:4:4)
ix.以前のスライス/タイル/LCU/LCU行/LCUのグループ/映像データユニットの符号化ツリー構造タイプ
x.スライス/タイルグループタイプおよび/またはピクチャタイプ
xi.時間層ID
【0142】
18.シングルツリーおよび分離/デュアルツリー選択/信号通知は、CTU/CTBより下のレベルにあってよい。
a.一例において、シングルツリーおよび分離/デュアルツリー選択/信号通知は、VPDUレベルにあってよい。
b.一例において、シングルツリーおよび分離/デュアルツリー選択/信号通知は、明示的な分割ツリー信号通知が開始するレベルにあってもよい。
【0143】
上述した例は、以下に説明する方法、例えば、方法900、910、920、930、940に含まれてよく、これらの方法は、映像デコーダまたは映像エンコーダにおいて実施されてよい。
【0144】
映像処理のための例示的な方法は、現在の映像ブロックと、現在の映像ブロックを有する映像のビットストリーム表現との間で変換を実行することを含み、変換はビットストリーム表現に含まれる指標に基づいて、変換のための変換スキップモードを選択的に使用し、変換スキップモードを使用して、変換を適用せずに現在の映像ブロックの予測誤差の残差はビットストリーム表現にて表現される。
【0145】
いくつかの実施形態において、指標は、変換スキップモードにおける最大許容幅および最大許容高さである。
【0146】
いくつかの実施形態において、最大許容幅および最大許容高さは、SPS(Sequence Patameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルヘッダ、LCU(Largest Coding Unit)行またはLCUのグループにおいて信号通知される。
【0147】
いくつかの実施形態において、最大許容幅および最大許容高さは異なるメッセージで信号通知される。
【0148】
いくつかの実施形態において、最大許容幅および高さは、SPS(Sequence Paramter Set)またはPPS(Picture Parameter Set)において信号通知され、最大許容幅および高さの更新値は、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)行またはLCUのグループにおいて信号通知される。
【0149】
図9Aは、例示的な映像処理の方法の別のフローチャートを示す。方法900は、ステップ902において、変換スキップモードを用いて現在の映像ブロックを符号化するかを判定することを含む。
【0150】
方法900は、ステップ904において、判定に基づいて、現在の映像ブロックと、現在の映像ブロックを有する映像のビットストリーム表現との間の変換を実行することを含む。
【0151】
いくつかの実施形態において、現在の映像ブロックは複数の係数グループに分割され、ビットストリーム表現は複数の係数グループのうち少なくとも1つの係数グループに対する符号化ブロックフラグの信号通知を省略する。一例において、ビットストリーム表現は、複数の係数グループのそれぞれについての符号化ブロックフラグの信号通知を省略する。
【0152】
いくつかの実施形態において、ビットストリーム表現における信号通知において省略された符号化ブロックフラグは、次の1または複数に基づいて推測される。(1)SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループまたはCU(Coding Unit)にて信号通知されたメッセージ、(2)複数の係数グループのうちの少なくとも1つの係数グループの位置、(3)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍のブロックのブロック寸法、(4)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、(5)現在の映像ブロックまたは少なくとも一つの近傍のブロックの最確モード(6)少なくとも1つの近傍のブロックの予測モード、(7)少なくとも1つの近傍のブロックのイントラ予測モード、(8)少なくとも1つの近傍のブロックの1または複数の動きベクトル、(9)少なくとも1つの近傍のブロックのQR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)モードの指示、(10)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在の量子化パラメータ(QP:Quantization Parameter)、(11)現在の映像ブロックのカラーフォーマットの指示、または(12)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、または(13)現在の映像ブロックの、スライスタイプ、タイルグループタイプ、またはピクチャタイプ。
【0153】
いくつかの実施形態において、現在の映像ブロックは複数の係数グループに分割され、方法900は更に、複数の係数グループの係数走査順序を判定することを含む。一例において、係数走査順序は、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、またはCU(Coding Unit)において信号通知されるメッセージに基づく。
【0154】
いくつかの実施形態において、複数の係数グループまたは係数走査順序は現在の映像ブロックのイントラ予測モードに基づく。一例において、係数走査順は垂直であり、イントラ予測モードは水平方向に支配的である。別の例において、係数走査順は水平であり、イントラ予測モードは水平方向に支配的である。例えば、イントラ予測モードのインデックスは、2~33、または、2~34の範囲である。
【0155】
いくつかの実施形態において、複数の係数グループまたは係数走査順序は、現在の映像ブロックのイントラ予測モードに基づく。一例において、係数走査順は垂直であり、イントラ予測モードは垂直に支配的である。別の例において、係数走査順は水平であり、イントラ予測モードは垂直方向に支配的である。例えば、イントラ予測モードのインデックスは、34~66、または、35~66の範囲である。
【0156】
いくつかの実施形態において、符号フラグのコンテキストは、現在の映像ブロックに関連付けられた係数ブロックにおける近傍の情報に基づく。一例において、符号フラグのコンテキストは更に、係数ブロックの係数の位置に基づく。別の例において、符号フラグのコンキテストは、(x+y)、min(x,y)、またはmax(x,y)に基づき、xおよびyは、それぞれ、係数の位置の水平方向の値および垂直方向の値である。
【0157】
図9Bは、例示的な映像処理の方法のさらに別のフローチャートを示す。方法910は、ステップ912において、現在の映像ブロックに対して、彩度変換スキップモードが適用可能であることを判定することを含む。
【0158】
方法910は、ステップ914において、判定に基づいて、現在の映像ブロックと、現在の映像ブロックを有する映像のビットストリーム表現との間の変換を実行することを含む。
【0159】
いくつかの実施形態において、判定は、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、CU(Coding Unit)、または映像データユニットにおいて信号通知されるメッセージに基づく。
【0160】
いくつかの実施形態において、判定は変換を実行する前に復号された1または複数の代表映像ブロックからの復号化された情報に基づき、1または複数の代表映像ブロックおよび現在の映像ブロックのそれぞれにおけるサンプルは、共通の色情報に基づく。一例において、1または複数の代表映像ブロックは、輝度ブロックまたは彩度ブロックを有する。別の例において、1または複数の代表映像ブロックは、配列された輝度ブロック内の1つのブロックを有する。
【0161】
図9Cは、例示的な映像処理の方法のさらに別のフローチャートを示す。方法920は、ステップ922において、現在の映像ブロックと、現在の映像ブロックを有する映像のビットストリーム表現とを変換する間、条件に基づいて、現在の映像ブロックに変換スキップモードの選択的適用に関する決定を行うことを含む。
【0162】
方法920は、ステップ924において、決定に基づいて変換を行うことを含む。
【0163】
いくつかの実施形態において、条件は、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、CU(Coding Unit)、または映像データユニットにおいて信号通知されたメッセージに基づく。
【0164】
いくつかの実施形態において、条件は次のうち1または複数に基づく。(1)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍のブロックのブロック寸法、(2)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、(3)現在の映像ブロックまたは少なくとも1つの近傍ブロックの最確モード、(4)少なくとも1つの近傍のブロックの予測モード、(5)少なくとも1つの隣接ブロックのイントラ予測モード、(6)少なくとも1つの近傍のブロックの1または複数の動きベクトルの指示、(7)少なくとも1つの近傍のブロックのQR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)モードの指示、(8)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在のQP(Quanntization Parameter)、(9)現在の映像ブロックのカラーフォーマットの指示、(10)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、(11)現在の映像ブロックの、スライスタイプ、タイルグループ、またはピクチャタイプ、または(12)時間層識別(ID)。
【0165】
いくつかの実施形態において、変換スキップモードの適用が実行され、現在の映像ブロックの予測モードがIBC(Inter Block Copy)モードであり、現在の映像ブロックの幅または高さが閾値と比較される。一例において、閾値は、ビットストリーム表現で信号通知される。別の一例において、閾値は、4、8、16、または32に設定される
【0166】
さらに別の例において、閾値は、以下のうちの1または複数に基づく。(1)SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、またはCU(Coding Unit)に通知されたメッセージ、(2)時間層識別(ID)、(3)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍のブロックのブロック寸法、(4)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、(5)現在の映像ブロックまたは少なくとも1つの近傍のブロックの最確モード、(6)少なくとも1つの近傍のブロックの予測モード、(7)少なくとも1つの近傍のブロックのイントラ予測モード、(8)少なくとも1つの近傍のブロックの1または複数の動きベクトル、(9)少なくとも1つの近傍のブロックのQR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)モードの指示、(10)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在のQP(Quantization Parameter)、(11)現在の映像ブロックのカラーフォーマットの指示、(12)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、または(13)現在の映像ブロックの、スライスタイプ、タイルグループタイプ、またはピクチャタイプ。
【0167】
図9Dは、例示的な映像処理の方法のさらに別のフローチャートを示す。方法930は、ステップ932において、現在の映像ブロックと現在の映像ブロックを有する映像のビットストリーム表現との間の変換の間、ビットストリーム表現における変換スキップモードの指示に基づいて、QR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)の選択的適用に関する決定を行うことを含む。
【0168】
方法930は、ステップ934において、決定に基づいて、変換を実行することを含む。
【0169】
いくつかの実施形態において、変換スキップモードの指示は、TU(Transform Unit)レベルで信号通知される。
【0170】
図9Eは、例示的な映像処理の方法のさらに別のフローチャートを示す。方法940は、ステップ942において、現在の映像ブロックと、現在の映像ブロックを有する映像のビットストリーム表現との変換の間、条件に基づいて別個の、またはデュアルツリーの選択的適用に関する決定を行うことを含む。
【0171】
方法940は、ステップ944において、決定に基づいて、変換を実行することを含む。
【0172】
いくつかの実施形態において、条件は、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Parameter Set)、LCU行、LCUのグループ、CU(Coding Unit)、または映像データユニットにおいて信号通知されたメッセージに基づく。
【0173】
いくつかの実施形態において、条件は、現在の映像ブロックを有するスライス、タイル、LCU(Largest Coding Unit)、LCU行、LCUのグループ、または映像データユニットがスクリーンコンテンツであるかを判定することに基づく。一例において、判定は、以下のうちの1または複数に基づく。(1)SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU、LCU行、LCUのグループ、CU(Coding Unit)、または映像データユニットに信号通知されたメッセージ、(2)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍のブロックのブロック寸法、(3)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、(4)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在のQP(Quantization Parameter)、(5)現在の映像ブロックのカラーフォーマットの指示、(6)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、(7)現在の映像ブロックの、スライスタイプ、タイルグループタイプ、またはピクチャタイプ、または(8)時間層識別(ID)。
【0174】
図10は、映像処理装置1000のブロック図である。装置1000は、本明細書に記載の方法の1または複数を実装するために使用してもよい。装置1000は、スマートフォン、タブレット、コンピュータ、IoT(Internet of Things)受信機等により実施されてもよい。装置1000は、1または複数のプロセッサ1002、1または複数メモリ1004、および映像処理ハードウェア1006、を含んでよい。1または複数のプロセッサ1002は、本明細書に記載される1または複数の方法(方法900、910、920、930、および940を含むが、これに限定されない)を実装するように構成されてよい。1または複数のメモリ1004は、本明細書で説明される方法および技術を実装するために使用されるデータおよびコードを記憶するために使用されてよい。映像処理ハードウェア1006は、本明細書に記載される技術をハードウェア回路にて実装するために使用してもよい。
【0175】
いくつかの実施形態において、映像符号化方法は、
図10を参照して説明したように、ハードウェアプラットフォームに実装される装置を使用して実施されてよい。
【0176】
いくつかの実施態様において、例えば、上記の項目5および10以降に記載されるように、映像処理の方法は、現在の映像ブロックに対応する符号化ツリー構造のタイプに基づいて、映像の現在の映像ブロックとビットストリーム表現との間の変換のために、イントラブロックコピーモードが適用可能であるかどうかを判定することと、判定に基づいて変換を実行することを含む。
【0177】
上記方法において、ビットストリーム表現は、イントラブロックコピーモードの指示を排除する。言い換えれば、ビットストリームは、IBCモードの明確な信号通知を搬送しない。
【0178】
上記方法において、符号化ツリー構造のタイプはデュアル符号化ツリー構造であり、イントラブロックコピーモードが適用可能でないと判定される。
【0179】
図11は、本明細書で開示される様々な技術が実装されてよい例示的な映像処理システム1100を示すブロック図である。様々な実装形態は、システム1100の構成要素の一部または全部を含んでもよい。システム1100は、映像コンテンツを受信するための入力ユニット1102を含んでもよい。映像コンテンツは、未加工または非圧縮フォーマット、例えば、8または10ビットのマルチコンポーネント画素値で受信されてもよく、または、圧縮または符号化フォーマットで受信されてもよい。入力1102は、ネットワークインターフェース、周辺バスインターフェース、または記憶インターフェースを表してもよい。ネットワークインターフェースの例は、イーサネット(登録商標)、PON(Passive Optical Network)等の有線インターフェース、およびWi-Fi(登録商標)またはセルラーインターフェース等の無線インターフェースを含む。
【0180】
システム1100は、本明細書に記載される様々な符号化または符号化方法を実装してよい符号化コンポーネント1104を含んでよい。符号化コンポーネント1104は、入力1102からの映像の平均ビットレートを符号化コンポーネント1104の出力に低減し、映像の符号化表現を生成してよい。従って、この符号化技術は、映像圧縮または映像コード変換技術と呼ばれる。符号化コンポーネント1104の出力は、コンポーネント1106によって表されるように、記憶されてもよいし、接続された通信を介して送信されてもよい。入力1102において受信された映像の、記憶されたまたは通信されたビットストリーム(または符号化)表現は、表示インターフェース1110に送信される画素値または表示可能な映像を生成するためのコンポーネント1108によって使用されてよい。ビットストリーム表現からユーザが閲覧可能な映像を生成する処理は、映像伸張と呼ばれることがある。さらに、特定の映像処理動作を「符号化」動作またはツールと呼ぶが、符号化ツールまたは動作はエンコーダにて用いられ、それに対応する、符号化の結果を逆にする復号化ツールまたは動作が、デコーダによって行われることが理解されよう。
【0181】
周辺バスインターフェースユニットまたは表示インターフェースユニットの例は、USB(Universal Serial Bus)またはHDMI(High Definition Multimedia Interface)(登録商標)またはディスプレイポート等を含んでもよい。ストレージインターフェースの例は、SATA(Serial Advanced Technology Attachment)、PCI、IDEインターフェース等を含む。本明細書に記載される技術は、携帯電話、ノートパソコン、スマートフォン、またはデジタルデータ処理および/または映像表示を実施可能な他のデバイス等の様々な電子デバイスにて実施されてもよい。
【0182】
図12は、ビジュアルメディア符号化の処理の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4で述べられた例示的な実施形態1に関連して説明する。ステップ1202において、処理は、ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差がビットストリーム表現において変換を適用せずに表されるように、変換スキップモードを使用して、1または複数の映像ブロックのうちの現在の映像ブロックを符号化することができる最大許容寸法を判定する。ステップ1204において、処理は、ビットストリーム表現に、最大許容寸法を示す構文要素を含める。
【0183】
図13は、ビジュアルメディア復号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4で述べられた例示的な実施形態1に関連して説明する。ステップ1302において、処理は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から、構文要素を構文解析し、構文要素は、変換を適用せずに現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差をビットストリーム表現にて表現する変換スキップモードを使用して、映像領域の1または複数のブロックの現在の映像ブロックを符号化することができる最大許容寸法を示す。ステップ1304において、処理は、最大許容寸法に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成する。
【0184】
図14は、ビジュアルメディア処理の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4で述べられた例示的な実施形態2に関連して説明する。ステップ1402において、処理は、変換スキップモードを利用して、ビジュアルメディアデータの現在の映像ブロックを符号化するかを判定する。ステップ1404において、処理は、判定に基づいて、ビジュアルメディアデータの現在の映像ブロックとビットストリーム表現との間の変換を実行し、変換中に、現在の映像ブロックは、複数の係数グループに分割され、複数の係数グループのうちの少なくとも1つのための符号化ブロックフラグの信号通知がビットストリーム表現から排除され、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差を、変換を適用せずにビットストリーム表現にて表現する。
【0185】
図15は、ビジュアルメディア処理の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態3に関連して説明する。ステップ1502において、処理は、変換スキップモードを利用してビジュアルメディアデータの現在の映像ブロックを符号化するかを判定する。ステップ1504において、処理は、判定に基づいて、ビジュアルメディアデータの現在の映像ブロックとビットストリーム表現との間の変換を実行し、変換中、現在の映像ブロックは複数の係数グループに分割され、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビットストリーム表現にて表現され、さらに、変換中、少なくとも部分的に、ビットストリーム表現中の表示に基づいて複数の係数グループの係数走査順序が判定される。
【0186】
図16は、ビジュアルメディア処理の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態4に関連して説明する。ステップ1602において、処理は、ビジュアルメディアデータの映像領域における現在の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差を、変換を適用せずに、ビットストリーム表現にて表現する変換スキップモードを使用する。ステップ1604において、処理は、現在の映像ブロックを複数の係数グループに分割することに基づいて、現在の映像ブロックに関連付けられた係数グループにおける1または複数の近傍の映像ブロックの符号フラグに従って、現在の映像ブロックの符号フラグのコンテキストを選択する。
【0187】
図17は、ビジュアルメディア処理の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態4に関連して説明する。ステップ1702において、処理は、現在の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現を構文解析し、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差を、変換を適用せずに、ビットストリーム表現にて表現する変換スキップモードで使用される符号フラグのコンテキストを識別する。ステップ1704において、処理は、符号フラグのコンテキストが、現在の映像ブロックを複数の係数グループに分割することに基づいて、現在の映像ブロックに関連付けられた係数グループにおける1または複数の近傍の映像ブロックの符号フラグに従うように、ビットストリーム表現から復号化された映像領域を生成する。
【0188】
図18は、ビジュアルメディア処理の方法の一例を示すフローチャートである。ステップ1802において、処理は、現在の映像ブロックが複数の係数位置に分割される場合、ビジュアルメディアデータの現在の映像ブロックに関連づけられた現在の係数の位置を判定する。ステップ1804において、処理は、1または複数の近傍の係数の符号フラグに基づいて、現在の係数の符号フラグのコンテキストを導出する。ステップ1806において、処理は、コンテキストに基づいて、現在の係数の符号フラグを生成し、現在の係数の符号フラグは、現在の映像ブロックが変換を適用せずに符号化される変換スキップモードにおいて、使用される。
【0189】
図19は、ビジュアルメディア符号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態5に関連して説明する。ステップ1902において、処理は、ビジュアルメディアデータの映像領域内の1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、現在の映像ブロックに対して彩度変換スキップモードが適用可能である少なくとも1つの規則を満たすことに基づいて判定し、彩度変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現される。ステップ1904において、処理は、ビットストリーム表現における彩度変換スキップモードを示す構文要素を含む。
【0190】
図20は、ビジュアルメディア復号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態5に関連して説明する。ステップ2002において、処理は、彩度変換スキップモードの適用に関連付けられた少なくとも1つの規則が満たされる1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析し、彩度変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差を、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現する。ステップ2004において、処理は、1または複数の映像ブロックを復号することにより、ビットストリーム表現から復号された映像領域を生成する。
【0191】
図21は、ビジュアルメディア符号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態6に関連して説明する。ステップ2102において、処理は、ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、条件に基づいて現在の映像ブロックに変換スキップモードの選択的適用に関する決定を行う。ステップ2104において、処理は、ビットストリーム表現に、条件を示す構文要素を含め、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現される。
【0192】
図22は、ビジュアルメディア符号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態6に関連して説明する。ステップ2202において、処理は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から、構文要素を構文解析し、構文要素は、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差を、変換を適用せずに、ビットストリーム表現にて表現する変換スキップモードの使用に関する条件を示す。ステップ2204において、処理は、条件に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成する。
【0193】
図23は、ビジュアルメディア符号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態8に関連して説明する。ステップ2302において、処理は、ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、ビットストリーム表現における変換スキップモードの指示に基づいて、QR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)技術の選択的適用に関する決定を行い、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現され、QR-BDPCM技術において、水平方向および/または垂直方向の予測誤差の残差が量子化され、エントロピー符号化される。ステップ2304において、処理は、ビットストリーム表現において、QR-BDPCM技術の選択的適用の指示を含む。
【0194】
図24は、ビジュアルメディア復号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態8に関連して説明する。ステップ2402において、処理は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析し、構文要素は、ビットストリーム表現における変換スキップモードの指示に基づいて、QR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)技術の選択的適用を示し、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現され、QR-BDPCM技術において、水平方向および/または垂直方向の予測誤差の残差は量子化され、エントロピー符号される。ステップ2404において、処理は、最大許容寸法に従って、1または複数の映像ブロックを復号することにより、ビットストリーム表現から復号された映像領域を生成する。
【0195】
図25は、ビジュアルメディア符号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4にて述べられた例示的な実施形態9に関連して説明する。ステップ2502において、処理は、ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、条件に基づいて別個の、またはデュアルツリーの選択的適用に関する決定を行う。ステップ2504において、処理は、ビットストリーム表現に、個別の、またはデュアルツリーの選択的適用を示す構文要素を含める。
【0196】
図26は、ビジュアルメディア復号化の方法の一例を示すフローチャートである。このフローチャートのステップは、本明細書のセクション4の例示的な実施形態9に関連して説明する。ステップ2602において、処理は、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から、構文要素を構文解析し、構文要素は、条件に基づいて、または推測された別個の、またはデュアルツリーの選択的適用を示す。ステップ2604において、処理は、構文要素に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成する。
【0197】
本明細書のいくつかの実施形態は、項目に基づく形式で提示される。
【0198】
A1.ビジュアルメディア符号化の方法であって、以下を有する。
【0199】
ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずに、ビットストリーム表現にて表されるように、変換スキップモードを使用して、1または複数の映像ブロックの現在の映像ブロックを符号化することができる最大許容寸法を判定することと、
【0200】
ビットストリーム表現に最大許容寸法を示す構文要素を含めること。
【0201】
A2.ビジュアルメディア復号化の方法であって、以下を有する。
【0202】
1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析することであって、構文要素は、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずに、ビットストリーム表現にて表される変換スキップモードを使用して、映像領域の1または複数のブロックのうちの現在の映像ブロックを符号化することができる最大許容寸法を示す、ことと、
【0203】
最大許容寸法に従って、1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成すること。
【0204】
A3.最大許容寸法は、変換スキップモードに関連付けられた最大許容幅および最大許容高さを含む、項目A1~A2のいずれかに記載の方法。
【0205】
A4.最大許容幅および高さは、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)行、またはLCUのグループにて信号通知される、項目A3に記載の方法。
【0206】
A5.最大許容幅および最大許容高さは、ビットストリーム表現における異なるメッセージで信号通知される、項目A1~A3のいずれかに記載の方法。
【0207】
A6.最大許容幅および最大許容高さの初期値は、SPS(Sequence Parameter Set)またはPPS(Picture Parameter Set)で信号通知され、さらに、最大許容幅および最大許容高さの更新値は、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)行またはLCUのグループで信号通知される、項目A1~A2のいずれかに記載の方法。
【0208】
A7.復号化された映像領域を生成することは、変換スキップモードを使用せずに、1または複数の映像ブロックを復号化することを有する、項目A2~A6のいずれかに記載の方法。
【0209】
A8.復号化された映像領域を生成することは、変換スキップモードの使用に基づいて1または複数の映像ブロックを復号化することを有する、項目A2~A6のいずれかに記載の方法。
【0210】
A9.ビジュアルメディア処理の方法であって、以下を有する。
【0211】
ビジュアルメディアデータの現在の映像ブロックが、変換スキップモードを使用して符号化されることを判定することと、
【0212】
判定に基づいて、ビジュアルメディアデータの現在の映像ブロックとビットストリーム表現との間の変換を実行することであって、変換の間、現在の映像ブロックは複数の係数グループに分割され、複数の係数グループのうちの少なくとも1つに対する符号化ブロックフラグを信号通知することはビットストリーム表現において排除され、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずにビットストリーム表現において表される、こと。
【0213】
A10.複数の係数グループのそれぞれに対する符号化ブロックフラグを信号通知することは、ビットストリーム表現にて排除される、項目A9に記載の方法。
【0214】
A11.ビットストリーム表現にて除外された複数の係数グループに対する符号化ブロックフラグは、固定値として推測される、項目A9~A10のいずれかに記載の方法。
【0215】
A12.固定値は1である、項目A11に記載の方法。
【0216】
A13.項目A9~A12のいずれかに記載の方法であって、さらに以下を有する。
【0217】
現在の映像ブロックの予測モードに基づいて、複数の係数グループに対する符号化ブロックフラグを信号通知することを選択的に有効または無効にする判定を行うこと。
【0218】
A14.予測モードがイントラ予測モードである場合、複数の係数グループに対する符号化ブロックフラグを信号通知することは、ビットストリーム表現から排除される、項目A13に記載の方法。
【0219】
A15.ビットストリーム表現における信号通知することから排除される符号化ブロックフラグは、以下の1または複数に基づいて推測される、項目A9~A14のいずれかに記載の方法。
【0220】
(1)SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、またはCU(Coding Unit)において信号通知されたメッセージ、
【0221】
(2)複数の係数グループのうちの少なくとも1つの位置、
【0222】
(3)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍のブロックのブロック寸法、
【0223】
(4)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、
【0224】
(5)現在の映像ブロックまたは少なくとも1つの近傍のブロックの最確モード、
【0225】
(6)少なくとも1つの近傍のブロックの予測モード、
【0226】
(7)少なくとも1つの近傍のブロックのイントラ予測モード、
【0227】
(8)少なくとも1つの近傍のブロックの1または複数の動きベクトル、
【0228】
(9)少なくとも1つの近傍のブロックのQR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)モードの指示、
【0229】
(10)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在のQP(Quantization Parameter)、
【0230】
(11)現在の映像ブロックのカラーフォーマットの指示、
【0231】
(12)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、
【0232】
(13)現在の映像ブロックの、スライスタイプ、タイルグループタイプ、またはピクチャタイプ。
【0233】
A16.ビジュアルメディア処理の方法であって、さらに、以下を有する。
【0234】
ビジュアルメディアデータの現在の映像ブロックが、変換スキップモードを使用して符号化することを判定することと、
【0235】
判定に基づいて、ビジュアルメディアデータの現在の映像ブロックとビットストリーム表現との間の変換を実行することであって、変換の間、現在の映像ブロックは複数の係数グループに分割され、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビットストリーム表現にて表現され、さらに、変換の間、複数の係数グループの係数走査順序は、ビットストリーム表現における指示に少なくとも部分的に基づいて判定される、こと。
【0236】
A17.係数走査順序は、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCULargest Coding Unit)、LCU行、LCUのグループ、または、CU(Coding Unit)において信号通知されるメッセージに基づく、項目A16に記載の方法。
【0237】
A18.変換スキップモードにおいて、複数の係数グループまたは係数走査順序は、現在の映像ブロックのイントラ予測モードに基づく、項目A17に記載の方法。
【0238】
A19.係数走査順序は垂直であり、イントラ予測モードは水平方向に支配される、項目A18に記載の方法。
【0239】
A20.係数走査順序は水平であり、イントラ予測モードは水平方向に支配される、項目A18に記載の方法。
【0240】
A21.イントラ予測モードのインデックスは、2~33または2~34の範囲にある、項目A19~A20のいずれか1つ以上に記載の方法。
【0241】
A22.係数走査順序は垂直であり、イントラ予測モードは垂直方向に支配される、項目A18に記載の方法。
【0242】
A23.係数走査順序は水平であり、イントラ予測モードは垂直方向に支配される、項目A18に記載の方法。
【0243】
A24.イントラ予測モードのインデックスは、34~66または35~66の範囲にある、項目A22~A23のいずれかに記載の方法。
【0244】
A25.変換は、現在の映像ブロックからビットストリーム表現を生成することを含む、項目A9~A24のいずれかに記載の方法。
【0245】
A65.変換は、ビットストリーム表現から現在の映像ブロックの画素値を生成することを含む、項目A9~A24のいずれか1つ以上に記載の方法。
【0246】
C1.ビジュアルメディア符号化の方法であって、以下を有する。
【0247】
ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、現在の映像ブロックに対して彩度変換スキップモードが適用可能である少なくとも1つの規則を満たすことに基づいて判定することであって、彩度変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現される、ことと、
【0248】
彩度変換スキップモードを示す構文要素をビットストリーム表現に含めること。
【0249】
C2.ビジュアルメディア復号化の方法であって、以下を有する。
【0250】
彩度変換スキップモードの適用に関連づけられた少なくとも1つの規則を満たす、1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析することであって、彩度変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現される、ことと、
【0251】
1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成すること。
【0252】
C3.判定は、ビジュアルメディアデータのビットストリーム表現に関連付けられた、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、CU(Coding Unit)、または映像データユニットにおいて信号通知されるメッセージに基づく、項目C1~C2のいずれかに記載の方法。
【0253】
C4.判定は、変換前に復号された1または複数の代表映像ブロックからの復号化された情報に基づき、1または複数の代表映像ブロックおよび現在の映像ブロックのそれぞれにおけるサンプルは、共通の色成分に基づく、項目C2~C3のいずれかに記載の方法。
【0254】
C5.1または複数の代表映像ブロックは、輝度ブロックまたは彩度ブロックを有する、項目C4に記載の方法。
【0255】
C6.1または複数の代表映像ブロックは、配列された輝度ブロック内のブロックを有する、項目C4に記載の方法。
【0256】
C7.現在の映像ブロックは現在の彩度ブロックであり、1または複数の代表映像ブロックは、現在の彩度ブロックの近傍の彩度ブロックを有する、項目C4に記載の方法。
【0257】
C8.現在の映像ブロックは現在の彩度ブロックであり、1または複数の代表映像ブロックは、現在の彩度ブロック内の中心彩度サンプルの対応する輝度サンプルをカバーするブロックを有する、項目C4に記載の方法。
【0258】
C9.現在の映像ブロックは現在の彩度ブロックであり、1または複数の代表映像ブロックは、現在の彩度ブロック内の右下の彩度サンプルの対応する輝度サンプルをカバーするブロックを有する、項目C4に記載の方法。
【0259】
D1.ビジュアルメディア符号化の方法であって、以下を有する。
【0260】
ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、条件に基づいて変換スキップモードの現在の映像ブロックへの選択的適用に関する決定を行うことと、
【0261】
ビットストリーム表現に条件を示す構文要素を含めることであって、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現される、こと。
【0262】
D2.ビジュアルメディア復号化の方法であって、以下を有する。
【0263】
1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析することであって、構文要素は、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差を、変換を適用せずに、ビットストリーム表現にて表す変換スキップモードの使用に関する条件を示す、ことと、
【0264】
条件に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成すること。
【0265】
D3.構文要素は、SPS(Sequence Paramter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、CU(Coding Unit)、または映像データユニットで信号通知される、項目D1に記載の方法。
【0266】
D4.条件は、以下の1または複数に基づく、項目D1~D3のいずれかに記載の方法。
【0267】
(1)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍のブロックのブロック寸法、
【0268】
(2)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、
【0269】
(3)現在の映像ブロックまたは少なくとも1つの近傍のブロックの最確モード、
【0270】
(4)少なくとも1つの近傍のブロックの予測モード、
【0271】
(5)少なくとも1つの近傍のブロックのイントラ予測モード、
【0272】
(6) 少なくとも1つの近傍のブロックの1または複数の動きベクトル、
【0273】
(7)少なくとも1つの近傍のブロックのQR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)モードの指示、
【0274】
(8)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在のQP(Quantization Parameter)、
【0275】
(9)現在の映像ブロックのカラーフォーマットの指示、
【0276】
(10)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、
【0277】
(11)現在の映像ブロックの、スライスタイプ、タイルグループタイプ、またはピクチャタイプ、
【0278】
(12)時間層識別(ID)。
【0279】
D5.現在の映像ブロックの予測モードがIBC(Inter Block Copy)モードである場合、変換スキップモードが適用され、さらに、現在の映像ブロックの幅または高さが閾値を満たす、項目D4に記載の方法。
【0280】
D6.閾値は、ビットストリーム表現にて信号通知される、項目D5に記載の方法。
【0281】
D7.閾値の値は、4、8、16、または32である、項目D6に記載の方法。
【0282】
D8.閾値は、以下の1または複数に基づく、項目D5~D7のいずれかに記載の方法。
【0283】
(1)SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、またはCU(Coding Unit)において信号通知されたメッセージ、
【0284】
(2)時間層識別(ID)、
【0285】
(3)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍のブロックのブロック寸法、
【0286】
(4)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、
【0287】
(5)現在の映像ブロックまたは少なくとも1つの近傍のブロックの最確モード、
【0288】
(6)少なくとも1つの近傍のブロックの予測モード、
【0289】
(7)少なくとも1つの近傍のブロックのイントラ予測モード、
【0290】
(8)少なくとも1つの近傍のブロックの1または複数の動きベクトル、
【0291】
(9)少なくとも1つの近傍のブロックのQR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)モードの指示、
【0292】
(10)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在のQP(Quantization Parameter)、
【0293】
(11)現在の映像ブロックのカラーフォーマットの指示、
【0294】
(12)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、
【0295】
(13)現在の映像ブロックの、スライスタイプ、タイルグループタイプ、またはピクチャタイプ。
【0296】
E1.ビジュアルメディア符号化の方法であって、以下を有する。
【0297】
ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、ビットストリーム表現における変換スキップモードの指示に基づいて、QR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)技術の選択的適用に関する決定を行うことであって、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、ビジュアルメディアデータのビットストリーム表現にて表現され、QR-BDPCM技術において、水平方向および/または垂直方向の予測誤差の残差は量子化され、エントロピー符号化される、ことと、
【0298】
ビットストリーム表現に、QR-BDPCM技術の選択的適用の指示を含めること。
【0299】
E2.ビジュアルメディアを復号化する方法であって、以下を有する。
【0300】
1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析することであって、構文要素は、ビットストリーム表現における変換スキップモードの指示に基づいて、QR-BDPCM(Quantized Residual Block Differential Pulse-Code Modulation)技術の選択的適用を表し、変換スキップモードにおいて、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差は、変換を適用せずに、視覚メディアデータのビットストリーム表現にて表現され、QR-BDPCM技術において、水平方向および/または垂直方向の予測誤差の残差は量子化され、エントロピー符号化される、ことと、
【0301】
最大許容寸法に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成すること。
【0302】
E3.変換スキップモードの指示は、現在の映像ブロックに関連付けられたTU(Transform Unit)レベルで信号通知される、項目E1~E2のいずれかに記載の方法。
【0303】
E4.ビットストリーム表現において、現在の映像ブロックに対してQR-BDPCM技術を適用することを示す構文要素は、変換スキップモードの指示の後に含まれる、項目E1~E3のいずれかに記載の方法。
【0304】
E5.ビットストリーム表現における第1のフラグは変換スキップモードを示すために用いられ、ビットストリーム表現における第2のフラグはQR-BDPCM技術の選択的適用を示すために用いられる、項目E4に記載の方法。
【0305】
E6.第3のフラグは、水平予測方向に基づくタイプのQR-BDPCM技術の適用を示すために用いられ、第4のフラグは、垂直予測方向に基づくタイプのQR-BDPCM技術の適用を示すために用いられる、項目E5に記載の方法。
【0306】
E7.第2のフラグの値は、第1のフラグの値から推測される、項目E5に記載の方法。
【0307】
E8.第1のフラグの値は、信号通知されず、第2のフラグの値から推測される、項目E5に記載の方法。
【0308】
E9.第2のフラグの値が真である場合、第1のフラグの値は、信号通知されず、真であると推測される、項目E8に記載の方法。
【0309】
E10.第1のフラグおよび第2のフラグがブール値をとる、項目E7に記載の方法であって、さらに、以下を有する。
【0310】
第1のフラグの値がブール値で真であると判定されると、第2のフラグの値をブール値で真として推論する。
【0311】
E11.第1のフラグおよび第2のフラグがブール値をとる、項目E7に記載の方法であって、さらに、以下を有する。
【0312】
第1のフラグの値がブール値で偽であると判定されると、第2のフラグの値をブール値で偽として推測すること。
【0313】
F1.ビジュアルメディア符号化の方法であって、以下を有する。
【0314】
ビジュアルメディアデータの映像領域における1または複数の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、条件に基づいて別個の、またはデュアルツリーの選択的適用に関する決定を行うことと、
【0315】
ビットストリーム表現に、別個の、またはデュアルツリーの選択的適用を示す構文要素を含める。
【0316】
F2.ビジュアルメディア復号化の方法であって、以下を有する。
【0317】
1または複数の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現から構文要素を構文解析することであって、構文要素は、条件に基づいて、または条件から推測された、別個の、またはデュアルツリーの選択的適用を示す、ことと、
【0318】
構文要素に従って1または複数の映像ブロックを復号化することにより、ビットストリーム表現から復号化された映像領域を生成すること。
【0319】
F3.条件は、SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU(Largest Coding Unit)、LCU行、LCUのグループ、CU(Coding Unit)または映像データユニットにおいて信号通知されるメッセージに基づく、項目F1~F2のいずれかに記載の方法。
【0320】
F4.条件は、現在の映像ブロックを有するスライス、タイル、LCU(Largest Coding Unit)、LCU行、LCUのグループ、または映像データユニットがスクリーンコンテンツであるかどうかの判定に基づく、項目F1~F2のいずれかに記載の方法。
【0321】
F5.条件は、以下のうちの1または複数を含む、項目F3に記載の方法。
【0322】
(1)SPS(Sequence Parameter Set)、VPS(Video Parameter Set)、PPS(Picture Parameter Set)、ピクチャヘッダ、スライスヘッダ、タイルグループヘッダ、LCU、LCU行、LCUのグループ、CU(Coding Unit)、または映像データユニットにおいて信号通知されるメッセージ、
【0323】
(2)現在の映像ブロックまたは現在の映像ブロックの少なくとも1つの近傍ブロックのブロック寸法、
【0324】
(3)現在の映像ブロックまたは少なくとも1つの近傍のブロックのブロック形状、
【0325】
(4)現在の映像ブロックまたは少なくとも1つの近傍のブロックの現在のQP(Quantization Parameter)、
【0326】
(5)現在の映像ブロックのカラーフォーマットの指示、
【0327】
(6)現在の映像ブロックに関連付けられた別個の、またはデュアル符号化ツリー構造、
【0328】
(7)現在の映像ブロックの、スライスタイプ、タイルグループタイプ、またはピクチャタイプ、
【0329】
(8)時間層識別(ID)。
【0330】
F6.項目A1~F5のいずれかに記載の方法を実施するように構成されたプロセッサを有する映像エンコーダ装置。
【0331】
F7.項目A1~F5のいずれかに記載の方法を実施するように構成されたプロセッサを有する映像デコーダ装置。
【0332】
F8.コードが記憶されたコンピュータ可読媒体であって、コードは項目A1~F5のいずれかに記載の方法を実施するためのプロセッサ実行可能命令を具現化する、コンピュータ可読媒体。
【0333】
B1.ビジュアルメディア符号化の方法であって、以下を有する。
【0334】
ビジュアルメディアデータの映像領域における現在の映像ブロックをビジュアルメディアデータのビットストリーム表現に符号化するために、現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差が、変換を適用せずに、ビットストリーム表現にて表現される変換スキップモードを使用することと、
【0335】
現在の映像ブロックを複数の係数グループに分割することに基づいて、現在の映像ブロックに関連付けられた係数グループにおける1または複数の近傍の映像ブロックの符号フラグに従って、現在の映像ブロックの符号フラグのコンテキストを選択すること。
【0336】
B2.ビジュアルメディア復号化の方法であって、以下を有する。
【0337】
現在の映像ブロックと参照映像ブロックとの間の予測誤差の残差を、変換を適用せずに、ビットストリーム表現にて表す変換スキップモードで使用される符号フラグのコンテキストを識別するために、現在の映像ブロックを有する映像領域を有するビジュアルメディアデータのビットストリーム表現を構文解析することと、
【0338】
現在の映像ブロックを複数の係数グループに分割することに基づいて、符号フラグのコンテキストが、現在の映像ブロックに関連付けられた係数グループにおける1または複数の近傍の映像ブロックの符号フラグに従うように、ビットストリーム表現から復号化された映像領域を生成すること。
【0339】
B3.現在の映像ブロックの1または複数の近傍の映像ブロックは、左の近傍、および/または、上の近傍、および/または左上の近傍、および/または、右上の近傍を含む、項目B1~B2のいずれかに記載の方法。
【0340】
B4.現在の映像ブロックの符号フラグのコンテキストと、1または複数の近傍の映像ブロックの符号フラグとの間の関係が、以下のように表される、項目B1~B3のいずれかに記載の方法。
【0341】
C=(L+A)、ここで、Cは現在の映像ブロックの符号フラグのコンテキストのコンテキストidであり、Lは現在の映像ブロックの左の近傍の符号フラグであり、Aは現在の映像ブロックの上の近傍の符号フラグである。
【0342】
B5.現在の映像ブロックの符号フラグのコンテキストと、1または複数の近傍の映像ブロックの符号フラグとの間の関係が、以下のように表される、項目B1~B3のいずれかに記載の方法。
【0343】
C=(L+A*2)、ここで、Cは現在の映像ブロックの符号フラグのコンテキストのコンテキストidであり、Lは現在の映像ブロックの左の近傍の符号フラグであり、Aは現在の映像ブロックの上の近傍の符号フラグである。
【0344】
B6.現在の映像ブロックの符号フラグのコンテキストと、1または複数の近傍の映像ブロックの符号フラグとの間の関係が、以下のように表される、項目B1~B3のいずれかに記載の方法。
【0345】
C=(L*2+A)、ここで、Cは現在の映像ブロックの符号フラグのコンテキストのコンテキストidであり、Lは現在の映像ブロックの左の近傍の符号フラグであり、Aは現在の映像ブロックの上の近傍の符号フラグである。
【0346】
B7.現在の映像ブロックの符号フラグのコンテキストは、以下の規則に従って、1または複数の近傍の映像ブロックの符号フラグに基づく、項目B1~B3のいずれかに記載の方法。
【0347】
1対の近傍の映像ブロックの符号フラグが両方とも負である場合、規則は、符号フラグの第1のコンテキストを選択することを指定する。
【0348】
B8.ビジュアルメディア処理方法であって、以下を有する。
【0349】
現在の映像ブロックが複数の係数位置に分割される場合、ビジュアルメディアデータの現在の映像ブロックに関連付けられる現在の係数の位置を判定することと、
【0350】
1または複数の近傍の係数の符号フラグに少なくとも基づいて、現在の係数の符号フラグのコンテキストを導出することと、
【0351】
コンテキストに基づいて、現在の係数の符号フラグを生成することであって、符号フラグは、変換を適用せずに、現在の映像ブロックが符号化される変換スキップモードにおいて使用される、こと。
【0352】
B9.現在の映像ブロックの1または複数の近傍の係数は、左の近傍、および/または、上の近傍を含む、項目B8に記載の方法。
【0353】
B10.現在の係数の符号フラグのコンテキストは、現在の係数の位置にさらに基づく、項目B8に記載の方法。
【0354】
B11.ビジュアルメディア処理は、ビットストリーム表現から現在の映像ブロックを復号化することを有する、項目B8に記載の方法。
【0355】
B12.ビジュアルメディア処理は、現在の映像ブロックをビットストリーム表現に符号化することを有する、項目B8に記載の方法。
【0356】
B13.現在の映像ブロックの符号フラグのコンテキストは、以下の規則に従って、1または複数の近傍の映像ブロックの符号フラグに基づく、項目B1~B3またはB8~B12のいずれかに記載の方法。
【0357】
1対の近傍の映像ブロックのうちの1つの符号フラグのみが負である場合、規則は、符号フラグの第2のコンテキストを選択することを指定する。
【0358】
B14.現在の映像ブロックの符号フラグのコンテキストは、以下の規則に従って、1または複数の近傍の映像ブロックの符号フラグに基づく、項目B1~B3またはB8~B12のいずれかに記載の方法。
【0359】
1対の近傍の映像ブロックの符号フラグが共に正である場合、規則は、符号フラグの第3のコンテキストを選択することを指定する。
【0360】
B15.現在の映像ブロックの符号フラグのコンテキストは、さらに、複数の係数グループにおける係数グループの位置に基づく、項目B1~B3またはB8~B12のいずれかに記載の方法。
【0361】
B16.符号フラグのコンテキストは、(x+y)、min(x,y)、またはmax(x,y)のうち少なくとも1つに基づき、ここで、xおよびyは、それぞれ、係数グループの位置の水平方向の値および垂直方向の値である、項目B10に記載の方法。
【0362】
B17.項目B1~B16のいずれかに記載の方法を実施するように構成された処理装置を備える映像エンコーダ装置。
【0363】
B18. 項目B1~B16のいずれか1つ以上に記載の方法を実施するように構成されたプロセッサを有する映像デコーダ装置。
【0364】
B19.コードが記憶されたコンピュータ可読媒体であって、コードは項目B1~B19のいずれかに記載の方法を実施するためのプロセッサ実行可能命令を具現化するコンピュータ可読媒体。
【0365】
本明細書では、「映像処理」または「ビジュアルメディア処理」という用語は、映像符号化、映像復号化、映像圧縮、または映像展開を指してよい。例えば、映像圧縮アルゴリズムは、映像の画素表現から対応するビットストリーム表現への変換、またはその逆の変換中に適用されてもよい。現在の映像ブロックのビットストリーム表現は、例えば、構文によって定義されるように、ビットストリーム内の同じ場所または異なる場所に拡散されるビットに対応していてもよい。例えば、マクロブロックは、変換および符号化された誤り残差値の観点から、且つビットストリームにおけるヘッダおよび他のフィールドにおけるビットを使用して符号化されてもよい。
【0366】
以上、説明の目的で本開示の技術の特定の実施形態を説明したが、本発明の範囲から逸脱することなく様々な修正が可能であることは、理解されるであろう。従って、本開示の技術は、添付の特許請求の範囲による場合を除き、限定されない。
【0367】
本特許明細書に記載された主題および機能操作の実装形態は、本明細書に開示された構造およびその構造的等価物を含め、様々なシステム、デジタル電子回路、またはコンピュータソフトウェア、ファームウェア、若しくはハードウェアで実施されてもよく、またはそれらの1または複数の組み合わせで実施してもよい。本明細書に記載された主題の実装形態は、1または複数のコンピュータプログラムプロダクト、すなわち、データ処理装置によって実行されるため、またはデータ処理装置の操作を制御するために、有形で非可搬性のコンピュータ可読媒体上に符号化されたコンピュータプログラム命令の1または複数のモジュールとして実装することができる。このコンピュータ可読媒体は、機械可読記憶装置、機械可読記憶基板、メモリデバイス、機械可読伝播信号をもたらす物質の組成物、またはこれらの1つ以上の組み合わせであってもよい。「データ処理ユニット」または「データ処理装置」という用語は、例えば、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサまたはコンピュータを含め、データを処理するためのすべての装置、デバイス、および機械を含む。装置は、ハードウェアの他に、コンピュータプログラムの実行環境を作るコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはこれらの1または複数の組み合わせを構成するコードを含むことができる。
【0368】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとも呼ばれる)は、コンパイルされた言語または解釈された言語を含む任意の形式のプログラミング言語で記述することができ、また、それは、スタンドアロンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、コンポーネント、サブルーチン、または他のユニットとして含む任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えば、マークアップ言語ドキュメントに格納された1または複数のスクリプト)に記録されていてもよいし、当該プログラム専用の単一のファイルに記憶されていてもよいし、複数の連携ファイル(例えば、1または複数のモジュール、サブプログラム、またはコードの一部を格納するファイル)に記憶されていてもよい。コンピュータプログラムは、1つのサイトに位置する1つのコンピュータ、または複数のサイトに分散され通信ネットワークによって相互接続される複数のコンピュータで実行させるように展開することも可能である。
【0369】
本明細書に記載された処理およびロジックフローは、入力データを用いて動作し、出力を生成することによって機能を実行するための1または複数のコンピュータプログラムを実行する1または複数のプログラマブルプロセッサによって実行することができる。処理およびロジックフローはまた、特定用途のロジック回路、例えば、FPGA(Field Programmable Gate Array)またはASIC(Application Specific Integrated Circuit)によって行うことができ、装置はまた、特別目的のロジック回路として実装することができる。
【0370】
コンピュータプログラムの実行に適したプロセッサは、例えば、汎用および専用マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の1または複数のプロセッサを含む。一般的に、プロセッサは、読み出し専用メモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信する。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令およびデータを記憶するための1または複数の記憶装置とである。一般的に、コンピュータは、データを記憶するための1または複数の大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含んでもよく、またはこれらの大容量記憶デバイスからデータを受信するか、またはこれらにデータを転送するように動作可能に結合されてもよい。しかしながら、コンピュータは、このようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに適したコンピュータ可読媒体は、あらゆる形式の不揮発性メモリ、媒体、およびメモリデバイスを含み、例えば、EPROM、EEPROM、フラッシュメモリデバイス等の半導体メモリデバイスを含む。プロセッサおよびメモリは、特定用途のロジック回路によって補完されてもよく、または特定用途のロジック回路に組み込まれてもよい。
【0371】
本明細書は、図面とともに、例示のみを目的とするものであり、例示的とは例を意味することが意図される。本明細書で使用される場合、単数形「a」、「an」および「the」は、文脈からそうでないことが明確に示されていない限り、複数形も含むことが意図される。さらに、文脈からそうでないことが明確に示されていない限り、「または」の使用は、「および/または」を含むことが意図される。
【0372】
本特許明細書は多くの詳細を含むが、これらは、任意の発明の範囲または特許請求の範囲を限定するものと解釈されるべきではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明と解釈されるべきである。本特許明細書において別個の実施形態の文脈で説明されている特定の特徴は、1つの例において組み合わせて実装してもよい。逆に、1つの例のコンテキストで説明された様々な特徴は、複数の実施形態において別個にまたは任意の適切なサブコンビネーションで実装してもよい。さらに、特徴は、特定の組み合わせで作用するものとして上記に記載され、最初にそのように主張されていてもよいが、主張された組み合わせからの1または複数の特徴は、場合によっては、組み合わせから抜粋されることができ、主張された組み合わせは、サブコンビネーションまたはサブコンビネーションのバリエーションに向けられてもよい。
【0373】
同様に、動作は図面において特定の順番で示されているが、これは、所望の結果を達成するために、このような動作が示された特定の順番でまたは連続した順番で行われること、または示された全ての動作が行われることを必要とするものと理解されるべきではない。また、本特許明細書に記載されている例における様々なシステムの構成要素の分離は、全ての実施形態においてこのような分離を必要とするものと理解されるべきではない。
【0374】
いくつかの実装形態および例のみが記載されており、この特許明細書に記載され図示されている内容に基づいて、他の実施形態、拡張および変形が可能である。
【0375】
5. 開示される技術の追加の実施形態
【0376】
5.1 デュアルツリー関連の実施形態
【0377】
JVET-N1001-v7に提供されたドラフトの最大の変更は、太字、下線、イタリック体のテキストで強調されている。本明細書の以下および他の箇所に現れる大文字の太字のフォントは、VVC規格から削除される可能性があるテキストを示す。
【0378】
5.1.1 実施形態#1
【0379】
【0380】
5.1.2 実施形態♯2
【0381】
7.3.2.3 シーケンスパラメータセットRBSP構文
【0382】
【0383】
5.1.3 実施形態#3
【0384】
7.3.5 スライスヘッダ構文
7.3.5.1 一般スライスセグメントヘッダ構文
【0385】
【0386】
sps_asdt_flag=1は、現在のシーケンスにおいて、提案された方法を有効にできることを指定する。これが0に等しい場合、現在のシーケンスにおいて、提案された方法を有効にできないことを指定する。sps_ASDT_flagが存在しない場合、0に等しいと推測される。
slice_asdt_flag=1は、現在のスライスにおいて、提案された方法を有効にできることを指定する。これが0に等しい場合、現在のスライスにおいて、提案された方法を有効にできないことを指定する。slice_ASDT_flagが存在しない場合、これは0に等しいと推測される。
【0387】
7.3.7.2 符号化ツリーユニット構文
【0388】
【0389】
ctu_dual_tree_intra_flag=1は、現在のCTUがデュアルツリー符号化構造を採用していることを指定する。これが0に等しい場合、現在のCTUがシングルツリー符号化構造を採用していることを指定する。ctu_dual_tree_intra_flagが存在しない場合、0に等しいと推測される。
【0390】
5.1.4 実施形態#4
【0391】
7.3.5 スライスヘッダ構文
7.3.5.1 一般スライスセグメントヘッダ構文
【0392】
【0393】
sps_asdt_flag=1は、現在のシーケンスにおいて、提案された方法を有効にできることを指定する。これが0に等しい場合、現在のシーケンスにおいて、提案された方法を有効にできないことを指定する。sps_ASDT_flagが存在しない場合、0に等しいと推測される。
slice_asdt_flag=1は、現在のスライスにおいて、提案された方法を有効できることを指定する。これが0に等しい場合、現在のスライスにおいて提案された方法を有効にできないことを指定する。slice_ASDT_flagが存在しない場合、これは0に等しいと推測される。
【0394】
7.3.7.2 符号化ツリーユニット構文
【0395】
【0396】
ctu_dual_tree_intra_flag=1は、現在のCTUがデュアルツリー符号化構造を採用していることを指定する。これが0に等しい場合、現在のCTUが単一のツリー符号化構造を採用していることを指定する。ctu_dual_tree_intra_flagが存在しない場合、0に等しいと推測される。
【0397】
5.2 IBC関連実施形態
【0398】
7.3.7.5 符号化ユニット構文
【0399】
【0400】
8.6 IBC予測モードで符号化されたユニットを符号化するための復号化処理
8.6.1 IBC予測モードで符号化されたユニットを符号化するための一般的な復号化処理
【0401】
この処理への入力は以下の通りである。
-現在のピクチャの左上の輝度サンプルに対する現在の符号化ブロックの左上のサンプルを規定する輝度位置(xCb,yCb)、
-輝度サンプルにおける現在の符号化ブロックの幅を規定する変数cbWidth、
-輝度サンプルにおける現在の符号化ブロックの高さを規定する変数cbHeight、
-シングルツリーまたはデュアルツリーのいずれを使用するかを指定する変数treeType、および、デュアルツリーが使用される場合、現在のツリーが輝度成分または彩度成分のいずれに対応するかを指定する。
【0402】
この処理の出力は、インループ・フィルタリングの前の修正された再構成ピクチャである。
【0403】
8.7.1節に規定される量子化パラメータに対する導出処理は、輝度位置(xCb,yCb)、輝度サンプルcbWidthにおける現在の符号化ブロックの幅、輝度サンプルcbHeightにおける現在の符号化ブロックの高さ、および変数treeTypwを入力として呼び出される。
【0404】
ibc予測モードで符号化されたユニットを符号化するための復号化プロセスは、以下の順序付けられたステップからなる。
【0405】
1.現在の符号化ユニットの動きベクトル成分は、以下のように導出される。
1.TREETYPEがSINGLE_TREEまたはDUAL_TREE_LUMAに等しい場合、以下が適用される。
-8.6.2.1節にて規定された動きベクトル成分に対する導出処理は、輝度符号化位置(xCb,yCb)、輝度符号化ブロック幅cbWidth、および輝度符号化ブロック高さcbHeightを入力とし、輝度動きベクトルmvL[0][0]を出力として呼び出される。
-TreeTypeがSINGLE_TREEに等しい場合、8.6.2.5節における彩度動きベクトルの導出処理は、輝度動きベクトルmvL[0][0]を入力とし、彩度動きベクトルmvC[0][0]出力として呼び出される。
-水平方向numSbXおよび垂直方向numSbYにおける輝度符号化サブブロックの数は、いずれも1に設定される。
1.あるいは、TREETYPEがDUAL_TREE_CHROMAに等しい場合、以下が適用される。
-水平方向NUMSBXおよび垂直方向NUMSBYにおける輝度符号化サブブロックの数は、次のように導出される。
NUMSBX=(CBWIDTH>>2) (8-871)
NUMSBY=(CBHEIGHT>>2) (8-872)
-彩度動きベクトルMVC[XSBIDX][YSBIDX]は、XSBIDX=0..NUMSBX-1,YSBIDX=0..NUMSBY-1の場合、次のように導出される。
-輝度動きベクトルMVL[XSBIDX][YSBIDX]は、以下のように導出される。
-配列された輝度符号化ユニットの位置(XCUY,YCUY)は、次のように導出される。
XCUY=XCB+XSBIDX*4 (8-873)
YCUY=YCB+YSBIDX*4 (8-874)
-CUPREDMODE[XCUY][YCUY]がMODE_INTRAに等しい場合、以下が適用される。
MVL[XSBIDX][YSBIDX][0]=0 (8-875)
MVL[XSBIDX][YSBIDX][1]=0 (8-876)
PREDFLAGL0[XSBIDX][YSBIDX]=0 (8-877)
PREDFLAGL1[XSBIDX][YSBIDX]=0 (8-878)
-その他の場合(CUPREDMODE[XCUY][YCUY]がMODE_IBCに等しい)、以下が適用される。
MVL[XSBIDX][YSBIDX][0]=MVL0[XCUY][YCUY][0] (8-879)
MVL[XSBIDX][YSBIDX][1]=MVL0[XCUY][YCUY][1]
(8-880)
PREDFLAGL0[XSBIDX][YSBIDX]=1 (8-881)
PREDFLAGL1[XSBIDX][YSBIDX]=0 (8-882)
-8.6.2.5節における彩度動きベクトルの導出処理は、MVL[XSBIDX][YSBIDX]を入力とし、MVC[XSBIDX][YSBIDX]を出力として呼び出される。
-彩度動きベクトルMVC[XSBIDX][YSBIDX]が以下の制約に従うことは、ビットストリーム適合性の要件である。
-6.4.X節で規定されているブロック利用可能性の導出プロセス[ED.(BB):近傍のブロック利用可能性チェックプロセスTBD]が、現在の彩度位置(XCURR,YCURR)を(XCB/SUBWIDTHC,YCB/SUBHEIGHTC)に等しく設定され、近傍の彩度位置(XCB/SUBWIDTHC+(MVC[XSBIDX][YSBIDX][0]>>5),YCB/SUBHEIGHTC+(MVC[XSBIDX][YSBIDX][1]>>5))を入力として呼び出されると、出力は真となる。
-6.4.X節で規定されているブロック利用可能性の導出プロセス[ED.(BB):近傍のブロック利用可能性チェックプロセスTBD]が、現在の彩度位置(XCURR,YCURR)を(XCB/SUBWIDTHC,YCB/SUBHEIGHTC)に等しく設定され、近傍の彩度位置(XCB/SUBWIDTHC+(MVC[XSBIDX][YSBIDX][0]>>5)+CBWIDTH/SUBWIDTHC-1,YCB/SUBHEIGHTC+(MVC[XSBIDX][YSBIDX][1]>>5)+CBHEIGHT/SUBHEIGHTC-1)を入力として呼び出されると、出力は真となる。
-以下の条件の一方または両方が真であること。
-(MVC[XSBIDX][YSBIDX][0]>>5)+XSBIDX*2+2が0以下である。
-(MVC[XSBIDX][YSBIDX][0]>>5)+XSBIDX*2+2が0以下である。
【0406】
2.現在の符号化ユニットの予測サンプルは、以下のように導出される。
-TREETYPEがSINGLE_TREEまたはDUAL_TREE_LUMAに等しい場合、現在の符号化ユニットの予測サンプルは以下のように導出される。
●8.6.3.1節に規定されるibcブロックに対する復号化処理は、輝度符号化ブロックの位置(xCb,yCb)、輝度符号化ブロックの幅cbWidth、輝度符号化ブロックの高さcbHeight、水平方向numSbX、垂直方向numSbYにおける輝度符号化サブブロックの数、および、xSbIdx=0..numSbX-1、SbIdx=0..numSbY-1、および0に等しく設定された変数cIdxである輝度動きベクトルmvL[xSbIdx][ySbIdx]を入力とし、予測輝度サンプルの(cbWidth)×(cbHeight)の配列predSamplesLであるibc予測サンプル(predSamples)を出力として呼び出される。
-あるいは、treeTypeがSINGLE_TREEまたはDUAL_TREE_CHROMAに等しい場合、現在の符号化ユニットの予測サンプルは、以下のように導出される。
●8.6.3.1節に規定されるibcブロックに対する復号化処理は、輝度符号化ブロックの位置(xCb,yCb)、輝度符号化ブロックの幅cbWidth、輝度符号化ブロックの高さcbHeight、水平方向numSbX、垂直方向numSbYにおける輝度符号化サブブロックの数、および、xSbIdx=0..numSbX-1、ySbIdx=0..numSbY-1、および1に等しく設定された変数cIdxである彩度動きベクトルmvC[xSbIdx][ySbIdx]を入力とし、彩度成分Cbに対する予測彩度サンプルの(cbWidth/2)×(cbHeight/2)の配列predSamplesCbであるibc予測サンプル(predSamples)を出力として呼び出される。
●8.6.3.1節に規定されるibcブロックに対する復号化処理は、輝度符号化ブロックの位置(xCb,yCb)、輝度符号化ブロックの幅cbWidth、輝度符号化ブロックの高さcbHeight、水平方向numSbX、垂直方向numSbYにおける輝度符号化サブブロックの数、xSbIdx=0..numSbX-1、ySbIdx=0..numSbY-1、および2に等しく設定された変数cIdxである彩度動きベクトルmvC[xSbIdx][ySbIdx]を入力とし、彩度成分Crに対する予測彩度サンプルの(cbWidth/2)×(cbHeight/2)の配列predSamplesCrであるibc予測サンプル(predSamples)を出力として呼び出される。
【0407】
3.変数NumSbX[xCb][yCb]およびNumSbY[xCb][yCb]は、それぞれnumSbXおよびnumSbYに等しく設定される。
【0408】
4.現在の符号化ユニットの残差サンプルは、以下のように導出される。
-TREETYPEがSINGLE_TREEに等しい場合またはTREETYPEがDUAL_TREE_LUMAに等しい場合、8.5.8節に規定されるインター予測モードで符号化された符号化ブロックの残差信号に対する復号化処理は、輝度位置(xCb,yCb)に等しく設定された位置(xTb0,yTb0)、輝度符号化ブロック幅cbWidthに等しく設定された幅nTbW、輝度符号化ブロック高さcbHeightに等しく設定された高さnTbH、および0に等しく設定された変数cldxsetを入力とし、配列resSamplesLを出力として呼び出される。
-treeTypeがSINGLE_TREEに等しい場合またはTREETYPEがDUAL_TREE_CHROMAに等しい場合、8.5.8節に規定されるインター予測モードで符号化された符号化ブロックの残差信号に対する復号化処理は、彩度位置(xCb/2,yCb/2)に等しく設定された位置(xTb0,yTb0)、彩度符号化ブロック幅cbWidth/2に等しく設定された幅nTbW、彩度符号化ブロック高さcbHeight/2に等しく設定された高さnTbH、および1に等しく設定された変数cldxsetを入力とし、配列resSamplesCbを出力として呼び出される。
-treeTypeがSINGLE_TREEに等しい場合またはTREETYPEがDUAL_TREE_CHROMAに等しい場合、8.5.8節に規定されるインター予測モードで符号化された符号化ブロックの残差信号に対する復号化処理は、彩度位置(xCb/2,yCb/2)に等しく設定された位置(xTb0,yTb0)、彩度符号化ブロック幅cbWidth/2に等しく設定された幅nTbW、彩度符号化ブロック高さcbHeight/2に等しく設定された高さnTbH、および2に等しく設定された変数cldxsetを入力とし、配列resSamplesCrを出力として呼び出される。
【0409】
5.現在の符号化ユニットの再構成されたサンプルは、以下のように導出される。
-treeTypeが、SINGLE_TREEに等しい場合またはTREETYPEがDUAL_TREE_LUMAに等しい場合、8.7.5節で規定されているカラーコンポーネントに対するピクチャ再構成処理は、(xCb,yCb)に等しく設定されているブロック位置(xB,yB)、cbWidthに等しく設定されたブロック幅bWidth、cbHeightに等しく設定されたブロック高さbHeight、0に等しく設定された変数cIdx、predSamplesLに等しく設定された(cbWidth)×(cbHeight)の配列predSamplesを、およびresSamplesLに等しく設定された(cbWidth)×(cbHeight)の配列resSamplesを入力として呼び出され、出力はインループフィルタリングの前の修正された再構成ピクチャである。
-treeTypeがSINGLE_TREEに等しい場合またはTREETYPEがDUAL_TREE_CHROMAに等しい場合、8.7.5節で規定されているカラーコンポーネントに対するピクチャ再構成処理は、(xCb/2,yCb/2)に等しく設定されたブロック位置(xB,yB)、cbWidth/2に等しく設定されたブロック幅bWidth、cbHeight/2に等しく設定されたブロック高さbHeight、1に等しく設定された変数cIdx、predSamplesCbに等しく設定された(cbWidth/2)×(cbHeight/2)の配列predSamples、およびresSamplesCbに等しく設定された(cbWidth/2)×(cbHeight/2)配列resSamplesを入力として呼び出され、出力はインループフィルタリングの前の修正された再構成ピクチャである。
-treeTypeがSINGLE_TREEに等しい場合またはTREETYPEがDUAL_TREE_CHROMAに等しい場合、8.7.5節で規定されているカラーコンポーネントに対するピクチャ再構成処理は、(xCb/2,yCb/2)に等しく設定されたブロック位置(xB,yB)、cbWidth/2と等しく設定されたブロック幅bWidth、cbHeight/2に等しく設定されたブロック高さbHeight、2に等しく設定された変数cIdx、predSamplesCrに等しく設定された(cbWidth/2)×(cbHeight/2)の配列predSamples、およびresSamplesCrに等しく設定された(cbWidth/2)×(cbHeight/2)配列resSamplesを入力として呼び出され、出力はインループフィルタリングの前の修正された再構成ピクチャである。